Skip to content

Devstral

Mistral 의 오픈소스 코딩 모델

Devstral 2 개요

  • Devstral 2는 123B 파라미터의 밀집 트랜스포머 모델로, 256K 컨텍스트 윈도우를 지원
    • SWE-bench Verified에서 72.2% 성능을 달성하며, 오픈 가중치 모델 중 상위권 성능을 보유
    • 수정된 MIT 라이선스로 공개되어 오픈소스 코드 에이전트의 새로운 기준 제시
  • Devstral Small 2는 68.0% SWE-bench Verified 성능을 기록하며, 최대 5배 큰 모델들과 유사한 수준 유지
    • 소비자용 하드웨어에서 로컬 실행 가능, 빠른 추론과 개인화된 피드백 루프 제공
    • 이미지 입력을 지원하며 멀티모달 에이전트 구동 가능
  • Devstral 2(123B)와 Small 2(24B)는 각각 DeepSeek V3.2보다 5배, 28배 작고 Kimi K2보다 8배, 41배 작음
    • 소형화된 모델 구조로 제한된 하드웨어에서도 배포 용이

See also

Favorite site