Skip to content

ACE-Step-1.5

The most powerful local music generation model that outperforms most commercial alternatives, supporting Mac, AMD, Intel, and CUDA devices.

유료 서비스를 능가하는 로컬 음악 생성 모델

About

  • Suno 같은 상용 수준의 음악 생성 품질을 일반 소비자 하드웨어에서도 구현한 오픈소스 음악 생성 모델
  • 10초 이내(RTX 3090) 로 전체 곡 고속 생성
  • 4GB VRAM 이하 환경에서도 로컬 실행 가능하며, LoRA 기반 개인화 학습으로 사용자의 음악 스타일 반영 지원
  • 커버 생성, 리페인트(부분 재생성) , 보컬→BGM 변환, 트랙 분리 및 멀티트랙 합성 지원
  • 50개 이상 언어의 가사 프롬프트로 구조·스타일 제어 가능
  • 성능 및 품질 특징
    • 상용 모델(Suno v4.5~v5 수준) 이상의 음질과 스타일 다양성 제공
    • 1000개 이상 악기·장르 지원, 세밀한 음색 제어 가능
    • 최대 10분(600초) 길이의 오디오 생성 및 8곡 동시 배치 생성 지원
  • LoRA 학습 기능 내장
    • Gradio UI에서 원클릭 주석·학습 가능
    • RTX 3090(12GB) 기준 8곡·1시간 내 학습 완료
    • Side-Step 모듈을 통한 고급 LoRA/LoKR 미세조정 및 VRAM 최적화 지원
  • 멀티플랫폼 호환성 : Mac(MLX) , AMD ROCm, Intel XPU, CUDA GPU, CPU 모두 지원하며 자동 환경 감지 및 설정 스크립트 제공
  • 다양한 인터페이스 제공
    • Gradio Web UI: 직관적 웹 기반 음악 생성 인터페이스
    • Studio UI: DAW 유사한 고급 편집 환경
    • Python API / REST API / CLI: 서비스 통합 및 자동화 지원
  • 영어·중국어·일본어·한국어로 제공되는 다국어 문서 세트 제공
  • MIT License : 창작·교육·엔터테인먼트 목적의 사용을 권장, 저작권 및 문화적 민감성 준수

Documentations

https://arxiv.org/abs/2602.00744
[2602.00744] ACE-Step 1.5 - Pushing the Boundaries of Open-Source Music Generation

See also

  • Suno
  • NotaGen - 클래식 음악을 작곡하는 심볼릭 음악 생성 모델
  • Music

Favorite site