ACE-Step-1.5
The most powerful local music generation model that outperforms most commercial alternatives, supporting Mac, AMD, Intel, and CUDA devices.
유료 서비스를 능가하는 로컬 음악 생성 모델
About
- Suno 같은 상용 수준의 음악 생성 품질을 일반 소비자 하드웨어에서도 구현한 오픈소스 음악 생성 모델
- 10초 이내(RTX 3090) 로 전체 곡 고속 생성
- 4GB VRAM 이하 환경에서도 로컬 실행 가능하며, LoRA 기반 개인화 학습으로 사용자의 음악 스타일 반영 지원
- 커버 생성, 리페인트(부분 재생성) , 보컬→BGM 변환, 트랙 분리 및 멀티트랙 합성 지원
- 50개 이상 언어의 가사 프롬프트로 구조·스타일 제어 가능
- 성능 및 품질 특징
- 상용 모델(Suno v4.5~v5 수준) 이상의 음질과 스타일 다양성 제공
- 1000개 이상 악기·장르 지원, 세밀한 음색 제어 가능
- 최대 10분(600초) 길이의 오디오 생성 및 8곡 동시 배치 생성 지원
- Gradio UI에서 원클릭 주석·학습 가능
- RTX 3090(12GB) 기준 8곡·1시간 내 학습 완료
- Side-Step 모듈을 통한 고급 LoRA/LoKR 미세조정 및 VRAM 최적화 지원
- Gradio Web UI: 직관적 웹 기반 음악 생성 인터페이스
- Studio UI: DAW 유사한 고급 편집 환경
- Python API / REST API / CLI: 서비스 통합 및 자동화 지원
Documentations
- https://arxiv.org/abs/2602.00744
- [2602.00744] ACE-Step 1.5 - Pushing the Boundaries of Open-Source Music Generation