Skip to content

Tongyi DeepResearch

OpenAI DeepResearch에 필적하는 오픈소스 30B MoE 모델

About

  • Tongyi DeepResearch는 OpenAI DeepResearch와 동등한 성능을 보이는 최초의 완전 오픈소스 웹 에이전트로, 복잡한 정보 탐색 벤치마크에서 최고 수준의 결과를 기록
    • Tongyi Lab은 알리바바 그룹의 AI 연구·개발 부문 중 하나로, 대형 언어모델(LLM) 및 멀티모달 모델, 에이전트(Agent) 기술 등에 집중하며 QWEN 모델을 만든 곳
  • Agentic Continual Pre-training(CPT) , Supervised Fine-Tuning(SFT) , Reinforcement Learning(RL) 을 통합한 엔드투엔드 학습 파이프라인을 구축
  • 완전 합성 데이터 기반의 대규모 QA 생성과 IterResearch 패러다임을 통해 장기적 추론과 계획 능력을 강화
  • ReAct 모드와 Heavy 모드를 지원해 단순 추론부터 복잡한 다단계 연구까지 대응하며, GRPO 알고리듬 기반의 강화학습으로 안정적 성능 확보
  • 실제로 Gaode Mate와 Tongyi FaRui 등 알리바바 내외부 서비스에 적용되어, 오픈소스 AI 연구 에이전트의 실용성과 확장 가능성을 입증

See also

Favorite site