2025년에 ICLR에 제출된 'Datagen: Unified synthetic dataset generation via large language models' 논문을 바탕으로 작성된 리뷰입니다. (Huang Y. et al.) IntroductionLarge Language Model (LLM)이 다양한 전문 영역에서 보여준 뛰어난 생성 능력을 바탕으로, 모델들을 synthetic data 생성에 효과적으로 활용할 방법을 탐색하고 있다. 주요 목표는 고품질이며 cost-effective한 데이터셋을 생성함으로써 상대적으로 고비용인 사람의 synthetic data 생성 작업에 대한 의존을 줄이는 것이다. 또한, LLM이 생성한 synthetic data는 data augmentation, dynami..
Model Context Protocol(MCP) MCP is an open, standard protocol for two‑way communication between an LLM (client) and external systems like tools (servers). (started at Anthropic) - AI 모델들이 외부 tools, 자원, 환경과 상호작용하는 방식(Agent-to-tool interaction)을 표준화한 interface/framework- USB-C port처럼 AI 시스템들과의 연결 과정에서 universal connector로써 기능 - MCP Github: https://github.com/modelcontextprotocol/servers- awesome-m..
AI(LLM) Agent의 구성 요소 Model: AI Agent의 두뇌에 해당하는 요소로, reasoning & decision-making을 담당하는 핵심 요소. 입력을 이해하고, 추론과 계획 및 생성 작업을 수행.Memory: 주로 단기 기억/장기 기억으로 구분.Planning: 하위 목표를 설정하거나, 피드백 수집 및 개선을 위한 요소.Tools: 외부 세계와 상호작용하기 위해 사용하는 도구. (ex. Web 검색, 메일 API, 스프레드시트, 계산/코딩 인터페이스)Orchestration layer: 전체 흐름을 제어하고 관리하는 핵심 요소. Agent Framework(LangChain, AutoGPT 등)에 해당.Instruction: AI Agent가 어떤 행동을 해야하는지에 대한 지침이나..
AI(LLM) Agent의 개념AI Agent란?주어진 목표를 달성하기 위해 자율적으로 환경을 인식(perceive)하고, 계획을 세우고(plan), 도구 활용(tool use) 및 행동(action)하는 시스템- 목표를 이해하고, 필요에 따라 스스로 여러 도구들을 활용해서 복잡한 문제를 해결하는 AI 주체- 환경과의 상호작용을 통해 어떤 행동을 수행하거나, 관찰을 수집해서 반영 Agentic Systems = Workflows + AgentsWorkflows: ‘미리 정의된’ 코드 경로를 통해 LLM, tool이 운영되는 시스템 (ex. prompt chaining, routing, parallelization)Agents: LLM이 자신의 프로세스와 tool 사용을 동적으로 지시하고 컨트롤하는 시스템..
2024년에 NeurIPS에 제출된 'MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making' 논문을 바탕으로 작성된 리뷰입니다. (Kim, Y. et al.) Introduction의료 의사결정은 임상의들이 다양한 정보원을 바탕으로 협력하여, 정밀하고 구체적인 결론에 도달하는 복합적 과정임.의료 영상, 전자의무기록(EHR), 생리학적 신호, 유전 정보 등 복잡하고 다중 모달 데이터를 해석하는 동시에, 최신 의학 연구 결과를 임상 실무에 신속하게 반영해야 함.Multi-agent LLM을 포함한 의사결정 도구들이 비의료 분야에서는 가능성을 보여왔지만, 의료 분야에서의 평가와 적용은 아직 제한적임.의료 의사결정은 상황에 따라 유연하게..
2024년에 arXiv에 제출된 'The landscape of emerging AI agent architectures for reasoning, planning, and tool calling: a survey' 논문을 바탕으로 작성된 리뷰입니다. (Masterman, T., Besen, S., Sawtell, M., & Chao, A.) AI Agent ArchitectureSingle Agent ArchitectureMulti Agent Architecture최근 실제 문제를 해결하는 Agent에 대해 많은 연구들이 이루어지고 있다.ex) SWE-Agent, AutoCodeRover, Octopus-v2 + Agent를 위한 프레임워크(Tiger, NPi, CopilotKit)Survey의 목적..