Skip to content

Feast

Feast( Feature Store )는 팀이 프로덕션 AI/ML을 위한 기능을 정의, 관리, 검증 및 제공할 수 있도록 지원하여 대규모 프로덕션 ML 시스템을 운영할 수 있도록 돕는 오픈 소스 기능 저장소입니다.

구성 요소

Feast의 기능 저장소는 두 가지 기본 구성 요소로 이루어져 있습니다.

  1. 모델 훈련에 사용되는 과거 기능 추출을 위한 오프라인 저장소.
  2. 프로덕션 시스템 및 애플리케이션에서 지연 시간이 짧은 기능을 제공하기 위한 온라인 저장소.

Feast는 기존 인프라를 재사용하여 머신러닝 기능을 관리하고 실시간 모델에 제공하는 구성 가능한 운영 데이터 시스템입니다.

Features

구체적으로 Feast는 다음과 같은 것을 제공합니다.

  • 기능, 엔티티, 소스 및 (선택적으로) 변환을 프로그래밍 방식으로 정의하기 위한 Python SDK입니다.
  • 구성된 오프라인 및 온라인 데이터 저장소에서 읽기 및 쓰기 기능을 제공하는 Python SDK입니다.
  • 피처 읽기 및 쓰기를 위한 선택적 피처 서버 (파이썬 이외의 언어에 유용)
  • 프로젝트에 정의된 기능에 대한 정보를 보고 탐색하기 위한 사용자 인터페이스 (UI) 입니다.
  • 기능 정보를 보고 업데이트하는 데 사용할 수 있는 CLI 도구 입니다.

수행 가능 작업 목록

Feast를 통해 ML 플랫폼 팀은 다음과 같은 작업을 수행할 수 있습니다.

  • 학습 및 저지연 서비스에 필요한 특징을 지속적으로 사용할 수 있도록 합니다. 관리 가능 항목은:
    • 오프라인 저장소 (배치 스코어링 또는 모델 학습을 위한 과거 데이터 처리용)
    • 저지연 온라인 저장소 (실시간 예측 지원용)
    • 그리고 검증된 특징 서버 (사전 계산된 특징을 온라인으로 제공)
  • 데이터 유출을 방지하려면 특정 시점의 정확한 특징 집합을 생성하여 데이터 과학자가 오류 발생 가능성이 높은 데이터셋 결합 로직을 디버깅하는 대신 특징 엔지니어링에 집중할 수 있도록 해야 합니다.
    • 이를 통해 향후 특징 값이 학습 중에 모델로 유출되는 것을 방지할 수 있습니다.
  • 단일 데이터 액세스 계층을 제공하여 특징 저장과 특징 검색을 추상화함으로써 머신러닝을 데이터 인프라로부터 분리합니다.
    • 이를 통해 학습 모델에서 서비스 모델로, 배치 모델에서 실시간 모델로, 그리고 하나의 데이터 인프라 시스템에서 다른 시스템으로 이동할 때 모델의 이식성을 보장합니다.

See also

Favorite site