DeepSeekMath
DeepSeekMath-V2
대형 언어 모델의 수학적 추론 능력 향상을 목표로, 단순한 정답 정확도를 넘어 추론 과정의 검증 가능성을 강화한 모델 기존 강화학습 기반 접근이 최종 답 보상 중심으로 한계를 보인 점을 개선해, 자기 검증(self-verification) 메커니즘을 도입 정리 증명(theorem proving) 과 같은 단계별 논리 전개가 필요한 문제에서, 생성 모델이 스스로 오류를 찾아 수정하도록 설계 검증기(verifier)를 보상 모델로 활용하고, 검증 계산량을 확장해 어려운 증명 데이터를 자동 라벨링함으로써 지속적 성능 향상 IMO 2025, CMO 2024, Putnam 2024 등에서 최고 수준의 점수를 기록하며, 자기 검증형 수학 AI의 실현 가능성을 입증 See also