Skip to content

HipKittens

빠르고 강력한 AMD 커널

About

  • HipKittens는 AMD GPU용 고성능 커널과 C++ 기반 프로그래밍 프리미티브를 제공해 AI 연산 효율을 높이는 프로젝트
  • 기존 AMD 생태계의 AITER, PyTorch, Triton, TileLang, Composable Kernel 등이 성능 불안정과 미성숙한 지원으로 한계 노출
  • HipKittens는 타일 기반 추상화(tile abstraction) 를 중심으로, NVIDIA와 AMD 간 공통 인터페이스를 유지하면서 하드웨어별 구현을 분리
  • 약 500줄 이하의 코드로 작성된 커널이 기존 AMD의 수작업 어셈블리 커널보다 빠른 성능을 달성
  • AI 연산을 다중 실리콘 환경으로 확장하기 위한 실질적 기반을 제시하며, 개방형 하드웨어 생태계로의 전환 가능성 제시

See also

Favorite site