Morphik
오픈소스 AI 네이티브 지식 베이스
WARNING |
생각보다 gpu 자원이 많이 필요, 속도도 많이 떨어진다는 의견 있음 |
About
- 이미지, PDF, 영상 등 멀티모달 데이터를 통합 검색 및 관리할 수 있게 해주는 오픈소스 도구
- 기존 RAG 방식보다 기술적이고 시각적인 문서 처리에 최적화
주요 개념 과 기능 소개
- 멀티모달 검색 (ColPali)
- 각 PDF 페이지를 이미지로 처리, 하나의 텍스트 토큰 단위가 아닌 페이지 단위 멀티벡터 표현 생성
- 이미지, PDF, 동영상 및 시각적 구조(표, 도식, 서식 등)도 의미를 파악하고 검색 가능
- 단일 엔드포인트를 통한 통합 멀티모달 질의 지원
- 한 줄의 코드로 도메인 특화 지식 그래프 생성 가능
- 사전 구성된 프롬프트 사용 가능하거나, 사용자 정의 가능
- 문서 내의 bounding box, 라벨, 분류 정보 등 자동 추출
- 대용량 문서도 빠르고 안정적으로 처리
- Google Workspace, Slack, Confluence 등과의 직접 통합 지원
- 문서별로 KV 캐시를 생성해 생성 속도 향상
- 반복 질의가 많은 환경에서 유용