Skip to content

MUVERA

멀티 벡터 검색을 단일 벡터 수준으로 빠르게

About

  • 단일 벡터 임베딩 기반 검색은 빠르고 효율적이지만, 최근 ColBERT 등 멀티 벡터 모델은 각 토큰별 다수 벡터로 더 풍부한 의미와 정확도를 제공함
  • 멀티 벡터 방식은 Chamfer similarity 등 복잡한 유사도 계산으로 인해 연산량·검색 비용이 크게 증가, 대규모 실시간 검색에 장애로 작용함
  • 구글 연구팀이 제안한 MUVERA는 멀티 벡터 정보를 고정 길이 벡터(FDE, Fixed Dimensional Encoding)로 압축해, 단일 벡터 기반 MIPS(내적 최대 검색)로 초고속 검색 후 재정렬함
  • 이 방식은 데이터에 독립적이며 이론적 근거(Chamfer similarity 근사 오차 보장) 를 제공, 기존 PLAID 대비 90% 이상 지연 감소와 10% 이상 recall 향상 달성
  • FDE는 압축까지 지원(32배 메모리 절감), 오픈소스 구현체와 논문도 공개되어 검색·추천·NLP 실서비스 도입에 적합함

See also

Favorite site