개발 인공지능, 머신러닝, 데이터 분석

A

aitimes

2025. 05. 17

Stability AI On-Device Mobile Music Sample Model

스태빌리티 AI, 휴대폰용 온디바이스 '음악 샘플 생성' 모델 출시

카테고리

프로젝트/소프트웨어 개발

서브카테고리

인공지능, 머신러닝, 데이터 분석

대상자

음악 제작자, 사운드 디자이너, AI 개발자 및 모바일 앱 개발자

초보자 및 중급 수준의 AI/ML 개발자 및 음향 관련 전문가에게 유용*

핵심 요약

스테이블 오디오 오픈 스몰(Stable Audio Open Small) 모델은 모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI로, 3억 4100만 매개변수의 소형 모델이다.
Arm CPU에 최적화되어 있으며, 8초 이내의 오디오 클립 생성 가능.
저작권 문제 해결된 데이터셋으로 학습되어, 수노, 유디오와의 차별화를 꾀했다.

섹션별 세부 요약

1. 모델 출시 및 목적

스태빌리티 AI가 모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI 모델을 출시.
음악 제작, 사운드 디자인을 위한 드럼 비트, 악기 리프, 주변 소리 등 10초 미만의 오디오 샘플 생성에 적합.
소비자용 음악 생성보다 샘플 생성에 초점을 맞추고 있음.

2. 모델 구조 및 특징

Arm과 협업하여 3억 4100만 매개변수의 소형 모델로, Arm CPU 최적화됨.
스테레오 오디오 클립 생성 가능, 8초 이내의 결과 출력.
저작권 문제가 해결된 공개 음원 데이터셋으로 학습됨.

3. 제약 사항

완성된 노래 및 멜로디 생성에는 적합하지 않음.
보컬 생성 지원 없음, 영어 프롬프트만 지원.
서구 음악에 편향되어 특정 장르에 취약.

4. 라이선스 및 활용

오픈 소스 모델이지만, 연간 매출 100만 달러 이상 기업은 엔터프라이즈 라이선스 구매 필요.
허깅페이스에서 가중치 다운로드, 깃허브에서 코드 액세스, Arm 러닝 패스에서 배포 방법 제공.

결론

모바일 환경에서의 빠른 음악 샘플 생성이 필요한 경우, 스테이블 오디오 오픈 스몰 모델이 유용하며, Arm CPU 최적화를 통해 휴대폰에서도 빠른 성능을 기대할 수 있음.

AI 음악 생성 온디바이스 모바일 Stable Audio Open Small Arm 오픈 소스

목록으로 원문 보기