Olmo 3
오픈소스 AI를 선도하기 위한 모델 플로우의 새로운 경로
About
- Olmo 3는 모델의 최종 결과뿐 아니라 전체 개발 과정(model flow) 을 공개해, 데이터·코드·체크포인트까지 완전한 추적 가능성을 제공
- 7B와 32B 파라미터 규모의 Base, Think, Instruct, RL Zero 네 가지 모델로 구성되어, 추론·대화·강화학습 등 다양한 연구 목적에 맞게 활용 가능
- Dolma 3와 Dolci 데이터셋을 기반으로, 웹·코드·수학·과학 등 약 9.3조 토큰 규모의 투명한 학습 데이터 공개
- OlmoTrace 도구를 통해 모델의 출력이 어떤 학습 데이터에서 비롯되었는지 실시간으로 추적 가능, 투명성과 신뢰성 강화
- 완전한 오픈소스 공개로 누구나 모델의 특정 단계에서 개입·수정·재학습이 가능하며, 검증 가능한 AI 연구 생태계 구축