Intelligent agent
에이전트(agent)는 복잡한 동적인 환경에서 목표를 달성하려고 시도하는 시스템이다. 에이전트는 외부 환경과 센서와 행위자를 사용하여 상호작용한다. 가상공간 환경에 위치하여 특별한 응용 프로그램을 다루는 사용자를 도울 목적으로 반복적인 작업들을 자동화시켜 주는 컴퓨터 프로그램을 소프트웨어 에이전트(software agent) 또는 지능형 에이전트(intelligent agent)라 부른다.
인터넷상에서, 지능형 에이전트(또는 "에이전트")라고 부르는 것은 사용자의 개입 없이 주기적으로 정보를 모으거나 또는 일부 다른 서비스를 수행하는 프로그램이다.
Categories
- Agent Client Protocol (ACP)
- Manus - 사고와 행동을 연결하는 범용 AI 에이전트
- Opsy - AI로 동작하는 SRE 동료
- 스몰빌 (Smallville) - AI 에이전트가 살아가는 가상 마을
- Lightpanda - AI와 자동화를 위한 헤드리스 브라우저
- Composio - AI 에이전트를 위한 통합 프레임워크
- Microsoft AutoGen - 차세대 LLM 어플리케이션을 위한 프레임워크
- BeeAI Framework - 멀티 에이전트 개발용 프레임워크
- Cua - AI 에이전트를 위한 오픈소스 도커 컨테이너
- Sim Studio - 에이전트 워크플로우 구축용 오픈소스 플랫폼
- Oxy - SQL 에이전트 및 데이터 자동화 구축을 위한 오픈소스 프레임워크
- Darwin Gödel Machine - 스스로 코드를 수정하며 진화하는 AI
- Agno - 멀티 에이전트 시스템 개발을 위한 고성능 프레임워크
- Nxtscape - 오픈소스 에이전트 브라우저
- OpenCode - 터미널을 위한 AI 코딩 에이전트
- Crush - 터미널을 위한 화려한 AI 코딩 에이전트
- AGENTS.md - AI 코딩 에이전트를 위한 오픈 포맷
- Shadow - 실시간 웹 인터페이스를 갖춘 백그라운드 코딩 에이전트
AI 에이전트 - 기회의 영역
다양한 스타트업이 AI 에이전트를 활용한 혁신적인 제품 개발 중
애플리케이션 예시
- 의료: OpenClinic – 의사를 지원하는 시스템
- 로봇 교육: innate – 로봇 훈련 플랫폼
- 개인 도우미: Khoj – 사용자의 두 번째 두뇌 역할
- 실내 디자인: Rastro – 개인 맞춤형 인테리어 디자이너 역할
- 성공 사례: HappyRobot
- 물류 회사에서 전화 통화 및 커뮤니케이션 자동화
- 고객 50+이상을 보유하고 이미 가시적인 혜택을 받고 있음. 평균 통화 시간 50% 단축, 운영 비용 1/3 절감
툴링 사례
- 노코드 에이전트 빌드: Gumloop – 코드 작성 없이 AI 에이전트를 빌드
- 전화 결제 시스템: Protegee – 에이전트를 통한 안전한 전화 결제 지원
- 보안 테스트: "레드팀" AI 에이전트를 활용하여 시스템의 보안성과 정렬성을 자동으로 스트레스 테스트
AI 에이전트 시장 지도
AI 에이전트 관련 138개의 기업을 Agent Orchestration 과 Application 으로 크게 분류하고 서브 카테고리에 배치
개발 플랫폼
- No/Low-Code 플랫폼
- AutoComputer, Autotab, Basepilot, Brainbase, Epsilla, Extend, Gumloop, Manaflow, Paradigm, Skyvern, Sola, Strada, Tasker ai
- SciPhi
- Blast, Coval, Fix AI, fixa, Foundry, Hamming AI, Laminar, MAIHEM, Relari, Synth, Vectorview
런타임 서비스 (Runtime Services)
- 인증 및 보안 (Authentication & Security)
- Keet, HumanLayer, Abundant
- Elevate, Protegee
- Kura AI, reworks, Scrapybara, SID
데이터 및 운영 (Data & Operations)
- 기억 및 지식 관리
- Zep AI
- FiddleCube
- Vocera
비즈니스 기능 (Business Functions)
- 고객 지원 및 성공 (Customer Support & Success)
- AgentsForce, Andoria, Cekura, RowBoat Labs, Marr Labs, Struct, Retell AI, Phonely, Markprompt, Duckie, Giga ML, Parahelp, PathPilot
- Concourse, Dimely, Fazeshift, Lighthouz, TaxGPT
- Greenlite, Sei, Sphinx
- AnswerGrid, Brewit, camelAI, MinusX, Reprompt, Reworkd, Simplifine, Undermind
- Apten, Coldreach, Fiber AI, Inventive AI, Kiosk, Mica AI, OpenFunnel, Origami Agents, Persana AI, Rankai, raycaster, revi, Seals AI, Summed AI, telli, Topo
- Codebuff, CodeStory, CodeViz, Decipher AI, Ellipsis, Gecko Security, MagiCode, OneGrep, Random Labs, Reflex, Speck, SRE.ai, Srcbook, Storia AI, Tempo Labs, vespper
산업별 솔루션 (Industry Solutions)
- 교육 및 훈련
- Khoj
- Arva AI, Cascading AI, CollectWise, Decisional AI, Finic, Kastle, Powder, Rulebase
- Astrix Health, Helpcare AI, Kairo Health, OpenClinic, Sample, Scritch, Shasta Health, ShowAndTell, Simbie AI, Substrate
- Dime, Entangl, Forerunner AI, Innate, PraxisAI, Tiny
- Pearson Labs
- Gander
- Dexter, HappyRobot, Linc., Mandel AI, Pulse AI
- Ego
- AI Sell, Anglera, pap!, PurplePages, Rastro, Toma, Yuma AI
오픈소스 AI 에이전트 프레임워크
LangGraph, OpenAI Agents SDK, Smolagents, CrewAI, AutoGen, Semantic Kernel, LlamaIndex Agents 등 다양한 오픈 소스 AI 에이전트 프레임워크를 비교한 글.
- AI 에이전트 개발은 과거에는 스크립트와 프롬프트 엔지니어링, 시행착오의 조합이었으나, 이제 오픈소스 프레임워크가 증가
- 각각의 프레임워크는 에이전트의 자율성과 안정성 사이에서 고유한 아키텍처 철학을 가지고 있음
- Langfuse 같은 관측 도구와 통합하여 프롬프트, 응답, API 호출 과정을 시각화하고 디버깅 가능
솔루션 비교
- LangGraph – 그래프 기반 워크플로우
- LangChain 기반의 그래프 아키텍처 프레임워크
- 각 노드는 프롬프트나 작업 단위를 처리하고, 엣지(edge)는 데이터 흐름과 분기 제어
- 복잡한 멀티스텝 작업, 병렬 처리, 오류 처리 로직 삽입에 유리
- 시각화와 디버깅에 강하며, 상태 기반 에이전트 설계에 적합
- OpenAI에서 제공하는 공식 SDK
- GPT-4o, GPT-o3 등 모델과 자연스럽게 통합
- 역할(role), 도구(tools), 트리거(trigger)를 설정하여 멀티스텝 작업 수행 가능
- OpenAI 생태계에 익숙한 사용자에게 적합
- Hugging Face의 미니멀한 코드 중심 에이전트 프레임워크
- 간단한 루프 안에서 AI가 파이썬 코드 생성 및 실행
- 복잡한 오케스트레이션 없이 빠른 프로토타이핑에 적합
- 내부적으로 ReAct 스타일 프롬프트 활용
- 각 에이전트에 고유한 역할을 부여하여 협업 가능
- "Crew"라는 컨테이너 개념을 통해 워크플로우 자동 조정
- 기획자(Planner) - 조사자(Researcher) - 작성자(Writer) 같은 시나리오 구현에 용이
- 메모리 기능과 오류 처리 로직 포함
- Microsoft Research에서 개발한 비동기 대화 기반 에이전트 프레임워크
- 각 에이전트가 대화 메시지를 주고받으며 비동기로 동작
- 멀티턴 대화, 역할 전환, 실시간 도구 호출이 중요한 경우 유리
- 이벤트 기반 구조로 동시성 높은 작업에 적합
- Microsoft의 .NET 중심 프레임워크
- AI 스킬과 코드 기반 스킬을 혼합하여 계획 기반 워크플로우 구성
- 보안, 규정 준수, Azure 통합 등 기업용 요구사항에 최적화
- Python, C#, Java 등 다양한 언어 지원
- LlamaIndex는 RAG 기반 프레임워크로 시작해 에이전트 기능 확장
- 로컬/외부 데이터 소스를 검색하고 결과를 응답 또는 작업으로 연결
- 문서 기반 Q&A, 요약, 맞춤형 검색 에이전트에 적합
- 기존에 LlamaIndex를 활용한 경험이 있다면 진입장벽 낮음
언제 어떤 프레임워크를 사용할까?
- 작업 복잡도: 작업이 간단한지 복잡한지에 따라 적합한 프레임워크를 선택해야 함
- 복잡한 멀티스텝 흐름: LangGraph, Semantic Kernel
- 단순한 코드 기반 실행: Smolagents
- 역할 기반 에이전트: CrewAI
- 대화형 비동기 에이전트: AutoGen
- OpenAI 중심 서비스: OpenAI Agents SDK
- 기존 비즈니스 로직과 연동 필요: Semantic Kernel
- 고동시성 처리 필요: AutoGen
- 관측 도구(Langfuse 등)와 통합해 디버깅과 추적 가능
AI MVP를 넘어서: 실제로 필요한 것
대부분의 팀이 빠지는 AI MVP의 함정:
- 1단계. 기만적인 MVP: 단 며칠 만에 완성된 것처럼 보이는 데모가 나옴. 그러나 곧 기본적인 실수를 하게됨
- 2단계. ±0: 이를 개선하려고 노력하지만, 점점 복잡해지기만 하며 예측이 불가능해짐. 90%의 대부분의 회사가 이 단계에 있음
- 3단계. 과학: 이 시점에서 평가용 테스트, 옵저버빌리티 도구 등이 필요함을 깨닫고 만들기 시작함
- 4단계. 실제로 동작함: 마침내 지속적인 모니터링, 포괄적인 평가용 테스트 세트, 신속한 분석 도구를 갖춤
OpenAI의 에이전트 구축을 위한 실용 가이드
OpenAI#OpenAI의 에이전트 구축을 위한 실용 가이드 항목 참조.
AI 시대의 새로운 개발자 패턴들
AI를 단순한 도구가 아닌 기반 기술로 다루는 개발 문화가 형성되고 있음.
- 기존의 버전 관리, 대시보드, 템플릿, 문서화, 시크릿 관리 방식등이 AI 시대에 맞춰 변화 중
- Git은 더 이상 코드의 라인별 변경보다는 프롬프트와 테스트 결과 중심의 상태 관리 방식으로 재해석되고 있음
- 에이전트는 코드 작성자이자 소비자가 되어, 도구 자체를 다시 설계해야 할 필요성이 커짐
- 대시보드와 UI는 자연어 기반 인터페이스로 전환되며, 사람과 AI 에이전트가 함께 사용하는 형태로 발전 중
- 문서화는 사람과 AI 모두를 위한 지식 베이스로 변화, 에이전트가 이해할 수 있는 형식으로 재구성됨
다음 9가지 패턴은 단순히 기존 개발 방식에 AI를 얹는 것이 아니라, 에이전트·맥락·의도 중심으로 소프트웨어 제작 방식 자체가 재정의되고 있음을 보여줌
- AI-Native Git: AI 에이전트를 위한 버전 관리의 재정의
- Dashboards → Synthesis: 동적 AI 기반 인터페이스로의 진화
- 문서는 도구, 인덱스, 인터랙티브 지식 베이스의 결합체로 진화 중
- 템플릿에서 생성으로: create-react-app을 대체하는 바이브 코딩
- .env를 넘어서: 에이전트 중심 환경에서의 시크릿 관리
- 접근성을 보편적 인터페이스로: LLM의 시각에서 본 앱
- 비동기 에이전트 작업의 부상
- MCP: 범용 표준에 한 걸음 더 가까워진 Model Context Protocol
- 추상화된 프리미티브: 모든 AI 에이전트가 필요로 하는 인증, 결제, 저장소
코딩 에이전트를 while 루프에 넣었더니 하룻밤 만에 6개 저장소가 완성됨
헤드리스 방식으로 Claude Code를 무한 루프에 넣어 반복 실행.
- 이 방식으로 assistant-ui React 프로젝트를 Vue로, Python 프로젝트를 TypeScript로 자동 변환하는 등 다양한 포팅 성공 경험을 얻음
- 프롬프트를 단순하게 유지할수록 성능이 향상되고, 복잡하게 만들면 비효율이 커짐을 확인함
- 완벽하지는 않지만, 소스/타깃 저장소 동기화에 유용한 RepoMirror 도구까지 함께 개발함
- AI 에이전트의 자기중단, 과제 추가 등 예기치 못한 행동과 학습도 관찰하여, 앞으로의 자동화 가능성과 한계를 동시에 체감함
무한 루프 방식 에이전트 운용
- Geoff Huntley가 권장한, 코딩 에이전트 프롬프트를 쉘에서 연속적으로 실행하는 형태
- 예시:
while :; do cat prompt.md | claude -p --dangerously-skip-permissions; done
- 예시:
- 두드러진 문제: 종종 완전 작동하지 않는 포팅 코드 배출 (일부 브라우저 데모 미완 등)
- 프롬프트 보정 및 인터랙티브 수정 필요
See also
Favorite site
- Intelligent agent - Wikipedia
- Agents에 대한 모든 기초 설명 - YouTube
- AI 에이전트란 무엇인가요? - 인공 지능의 에이전트 설명 - AWS
- Agents에 대한 모든 기초 설명 - YouTube - 10X AI Club
- a16z: AI Voice Agent의 현재 - 2025 | GeekNews
- LLM 기반 시스템을 만드는 대부분의 팀 모두가 에이전트(Agent)부터 만들려고 하지만, 대부분은 복잡성, 조정 불가, 디버깅 난이도로 인해 쉽게 무너짐
- 기억, RAG, 도구 사용, 워크플로 제어가 모두 필요한 진짜 에이전트 패턴은 실제론 드물고, 대부분의 문제는 단순 워크플로우(체이닝, 병렬화, 라우팅 등) 로 더 효과적으로 해결 가능
- 현실에서 유용한 5가지 LLM 워크플로 패턴을 먼저 적용할 것을 권장하며, 에이전트는 정말 필요할 때만 신중하게 사용할 것
- 프롬프트 체이닝, 병렬화, 라우팅, 오케스트레이터-워커, 평가자-최적화
- 에이전트가 필요한 경우도 결국 사람의 관여와 명확한 제어, 관측 가능성(Observability) 이 핵심임
- 에이전트 대신 써야 할, 실전에서 유용한 LLM 워크플로 패턴
- 프롬프트 체이닝(Prompt Chaining) - 여러 작업을 일련의 단계(체인)로 분할하여, 각 단계를 순차적으로 LLM이 처리하도록 설계함
- 병렬화(Parallelization) - 여러 독립적인 작업을 동시에 실행하여 전체 프로세스의 속도를 높임
- 라우팅(Routing) - 입력 데이터를 LLM이 분류(classification)해서 각각에 맞는 워크플로로 자동 분기
- 오케스트레이터-워커(Orchestrator-Worker) - 오케스트레이터 역할의 LLM이 작업을 분해/판단해 워커(실행 LLM)에게 세부 작업을 위임, 전체 흐름과 순서를 직접 제어함
- 평가자-최적화(Evaluator-Optimizer) - LLM이 결과물을 평가하고(스코어/피드백), 기준에 미달하면 반복적으로 수정/개선하는 구조
- [원문] how to build a coding agent: free workshop
- Geoffrey Huntley가 진행한 무료 워크숍으로, 코딩 에이전트를 직접 만드는 방법과 원리를 실습 중심으로 안내
References
-
:File:AIAgentsMarketMap.png - 썸네일 오류가 있어서 원본 파일로만 보자 ↩