Skip to content

Mercury

Diffusion 기반 초고속 언어 모델

Features

머큐리는 확산(Diffusion) 방식을 활용한 새로운 상용 대규모 언어 모델(LLM)
이 모델은 Transformer 구조에 기반하여 여러 토큰을 병렬로 예측하는 특징이 있음
머큐리 코더는 첫 확산 LLM 세트로, 코드 작성용으로 개발되고, Mini와 Small 두 가지 크기로 제공됨
NVIDIA H100 GPU에서 1109(미니), 737(스몰) 토큰/초의 처리량을 기록하며, 동일 품질에서 기존 속도 중심 모델 대비 최대 10배 빠른 성능을 나타냄
실 사용 벤치마크 및 Copilot Arena 등 개발자 평가에서도 2위 품질 및 최고 속도를 기록하고, 공개 API 와 플레이그라운드도 제공함

Documentation

[2506.17298] Mercury - Ultra-Fast Language Models Based on Diffusion: https://arxiv.org/abs/2506.17298

See also

Diffusion

Favorite site

Mercury - Diffusion 기반 초고속 언어 모델 | GeekNews