Tongyi DeepResearch

OpenAI DeepResearch에 필적하는 오픈소스 30B MoE 모델

About

Tongyi DeepResearch는 OpenAI DeepResearch와 동등한 성능을 보이는 최초의 완전 오픈소스 웹 에이전트로, 복잡한 정보 탐색 벤치마크에서 최고 수준의 결과를 기록
- Tongyi Lab은 알리바바 그룹의 AI 연구·개발 부문 중 하나로, 대형 언어모델(LLM) 및 멀티모달 모델, 에이전트(Agent) 기술 등에 집중하며 QWEN 모델을 만든 곳
Agentic Continual Pre-training(CPT) , Supervised Fine-Tuning(SFT) , Reinforcement Learning(RL) 을 통합한 엔드투엔드 학습 파이프라인을 구축
완전 합성 데이터 기반의 대규모 QA 생성과 IterResearch 패러다임을 통해 장기적 추론과 계획 능력을 강화
ReAct 모드와 Heavy 모드를 지원해 단순 추론부터 복잡한 다단계 연구까지 대응하며, GRPO 알고리듬 기반의 강화학습으로 안정적 성능 확보
실제로 Gaode Mate와 Tongyi FaRui 등 알리바바 내외부 서비스에 적용되어, 오픈소스 AI 연구 에이전트의 실용성과 확장 가능성을 입증