스태빌리티 AI, 휴대폰용 온디바이스 '음악 샘플 생성' 모델 출시
카테고리
프로젝트/소프트웨어 개발
서브카테고리
인공지능, 머신러닝, 데이터 분석
대상자
음악 제작자, 사운드 디자이너, AI 개발자 및 모바일 앱 개발자
- 초보자 및 중급 수준의 AI/ML 개발자 및 음향 관련 전문가에게 유용*
핵심 요약
- 스테이블 오디오 오픈 스몰(Stable Audio Open Small) 모델은 모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI로, 3억 4100만 매개변수의 소형 모델이다.
- Arm CPU에 최적화되어 있으며, 8초 이내의 오디오 클립 생성 가능.
- 저작권 문제 해결된 데이터셋으로 학습되어, 수노, 유디오와의 차별화를 꾀했다.
섹션별 세부 요약
1. 모델 출시 및 목적
- 스태빌리티 AI가 모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI 모델을 출시.
- 음악 제작, 사운드 디자인을 위한 드럼 비트, 악기 리프, 주변 소리 등 10초 미만의 오디오 샘플 생성에 적합.
- 소비자용 음악 생성보다 샘플 생성에 초점을 맞추고 있음.
2. 모델 구조 및 특징
- Arm과 협업하여 3억 4100만 매개변수의 소형 모델로, Arm CPU 최적화됨.
- 스테레오 오디오 클립 생성 가능, 8초 이내의 결과 출력.
- 저작권 문제가 해결된 공개 음원 데이터셋으로 학습됨.
3. 제약 사항
- 완성된 노래 및 멜로디 생성에는 적합하지 않음.
- 보컬 생성 지원 없음, 영어 프롬프트만 지원.
- 서구 음악에 편향되어 특정 장르에 취약.
4. 라이선스 및 활용
- 오픈 소스 모델이지만, 연간 매출 100만 달러 이상 기업은 엔터프라이즈 라이선스 구매 필요.
- 허깅페이스에서 가중치 다운로드, 깃허브에서 코드 액세스, Arm 러닝 패스에서 배포 방법 제공.
결론
- 모바일 환경에서의 빠른 음악 샘플 생성이 필요한 경우, 스테이블 오디오 오픈 스몰 모델이 유용하며, Arm CPU 최적화를 통해 휴대폰에서도 빠른 성능을 기대할 수 있음.