OpenAI
OpenAI is an AI research and deployment company based in San Francisco, California. Our mission is to ensure that artificial general intelligence benefits all of humanity. The OpenAI Charter describes the principles that guide us as we execute on our mission.
Categories
- GPT-3
- Image GPT
- DALL-E
- Whisper - OpenAI가 오픈소스로 공개한 다국어 음성 인식 시스템(ASR)
- Point-E - 3D 모델을 생성하는 AI
- Shap-E - 텍스트/이미지를 통한 3D 객체 생성
- LocalAI - 셀프호스트 가능한 OpenAI 호환 API
- Sora - Creating video from text
- openai-python
- Q-Star
- Q-learning
- A-Start
AI Agent Tools
- OpenAI, AI 에이전트 개발을 위한 개발자 도구들 공개 | GeekNews
- Web Search - 웹에서 최신정보 검색 및 인용 URL 리턴
- File Search - 업로드된 파일 목록에서 시맨틱/키워드 검색
- Computer Use - 컴퓨터를 제어하고 작업을 수행
- Responses API - 고급 통합 답변 인터페이스. 텍스트/이미지 입력 가능하며 웹/파일 검색 및 CUA 기능을 모두 이용
- Agents SDK - 에이전트 개발을 위한 오케스트레이션 프레임워크
OpenAI의 에이전트 구축을 위한 실용 가이드
에이전트란 무엇인가
- 에이전트는 사용자를 대신해 작업을 수행하는 시스템임
- 단순 챗봇이나 감정 분석기처럼 한 번만 응답하는 모델은 에이전트에 해당하지 않음
- 에이전트는 다음 두 가지 핵심 기능을 가짐
- 워크플로우 실행 관리 및 의사 결정: 완료 여부 판단, 오류 수정 및 실패 시 사용자에게 제어권 반환
- 도구(tool) 사용: 외부 시스템과 상호작용하여 데이터를 수집하거나 조치를 취함
에이전트를 언제 구축해야 하는가
- 전통적 자동화 방식이 실패하거나 유지보수가 어려운 영역에 적합함
- 적합한 사례
- 복잡한 의사결정: 고객 환불 승인처럼 섬세한 판단이 필요한 경우
- 유지보수가 어려운 규칙 기반 시스템: 보안 심사 자동화처럼 규칙이 복잡한 경우
- 비정형 데이터 처리: 문서 분석, 자연어 이해가 필요한 경우
에이전트 설계의 기본 요소
- 모델(Model): 추론과 결정을 담당하는 LLM
- 도구(Tools): 외부 시스템과 상호작용하는 API 함수들
- 지침(Instructions): 에이전트 행동을 정의하는 명확한 지시사항
모델 선택 가이드라인
- 가장 성능 좋은 모델로 프로토타입 개발 → 이후 비용·지연시간을 고려하여 작은 모델로 교체 시도
- 평가 기준(evals) 을 설정하고 정확도를 검증한 후 최적화
도구 정의 방법
- 표준화된 방식으로 도구를 설계해 재사용성을 높임
- 도구 유형
- 데이터 조회: DB 검색, 문서 읽기, 웹 검색
- 행동 수행: 이메일 발송, CRM 업데이트
- 오케스트레이션: 다른 에이전트를 호출하여 작업 분담
지침 작성 베스트 프랙티스
- 기존 운영 문서나 정책 문서를 활용하여 명확한 단계별 지시사항 작성
- 작업을 세분화하여 구체적인 행동(action) 단위로 명시
- 에러나 예외 상황 처리 방법(엣지 케이스)을 반드시 포함
오케스트레이션 패턴
단일 에이전트 시스템
- 하나의 에이전트가 반복 루프(run loop)를 통해 다수 작업을 처리
- 프롬프트 템플릿을 사용하여 다양한 상황에 대응
- 복잡도가 관리 가능할 때까지 단일 에이전트로 유지 권장
다중 에이전트 시스템
- 매니저 패턴 (Manager Pattern):
- 중앙 매니저 에이전트가 여러 전문 에이전트를 도구(tool) 처럼 호출하여 워크플로우를 조율
- 사용자와의 인터페이스를 일관성 있게 유지
- 에이전트들이 서로 핸드오프(handoff) 하며 제어권을 넘겨줌
- 특정 전문 분야를 가진 에이전트가 필요한 순간 제어권을 가짐
- 초기에 단순한 업무 트리아지(triage)에 적합
가드레일(Guardrails)
목적:
- 데이터 프라이버시 보호 및 시스템 악용 방지
- 브랜드 일관성 유지 및 부적절한 응답 차단
주요 유형:
- 관련성 필터링: 주제와 무관한 입력 차단
- 안전성 필터링: 시스템 탈출(jailbreak) 시도 감지
- 개인정보 보호(PII) 필터: 민감 정보 노출 차단
- 모더레이션(Moderation): 폭력, 혐오 발언 차단
- 도구 리스크 관리: 고위험 도구 호출 시 추가 검증
구축 전략:
- 데이터 프라이버시와 콘텐츠 안전성을 최우선으로 고려
- 실사용 중 발견된 신규 위험에 맞춰 지속적으로 추가
- 보안과 사용자 경험 균형 맞추기
사람 개입(Human-in-the-loop):
- 에이전트가 실패했을 때나 고위험 작업을 처리할 때 인간에게 제어권 넘기기
- 대표적 트리거
- 실패 임계치 초과
- 민감도 높은 작업 요청(환불, 결제 등)
결론
- 에이전트는 복잡하고 불확실한 상황에서 워크플로우를 자동화할 수 있는 혁신적 시스템임
- 강력한 모델-도구-지침 체계를 갖추고 점진적으로 오케스트레이션 확장
- 가드레일과 사람 개입 체계를 필수로 구축해야 안전성과 신뢰성을 확보할 수 있음
- 작게 시작하여 빠르게 검증하고 점진적으로 기능을 확장하는 것이 성공적인 배포의 핵심임
See also
- Deep learning
- AI Agent
- TokenDagger – OpenAI의 Tiktoken보다 더 빠른 토크나이저
Favorite site
- OpenAI web site
- OpenAI Code Execution에서 C 와 JavaScript를 실행하게 만들기 | GeekNews
- OpenAI: PostgreSQL의 확장 한계를 넘어서기 | GeekNews (OpenAI, PostgreSQL)
- [원문] OpenAI: Scaling PostgreSQL to the Next Level | PixelsTech
- OpenAI는 PostgreSQL을 샤딩 없이 사용하면서도 수억 명의 사용자 트래픽을 효과적으로 처리하는 방법을 PGConf.dev 2025에서 공유함
- 쓰기 병목 문제를 해결하기 위해 쓰기 분산, 쿼리 최적화, 스키마 관리 등 다양한 접근 방식을 도입함
- 주요 이슈로 MVCC 디자인의 테이블/인덱스 팽창, WAL로 인한 복제 지연 등 PostgreSQL 구조상의 한계와 운영 난점을 언급
- 읽기 부하 분산과 긴 트랜잭션 제한, ORM 최소화 등의 쿼리 최적화 전략이 핵심
- OpenAI는 지리적으로 분산된 40개 이상의 복제본을 통해 100만 QPS를 달성하고, 장애 발생 시에도 높은 가용성을 보장함
References
-
A-practical-guide-to-building-agents.pdf ↩