Stability AI On-Device Mobile Music Sample Model

스태빌리티 AI, 휴대폰용 온디바이스 '음악 샘플 생성' 모델 출시

카테고리

프로젝트/소프트웨어 개발

서브카테고리

인공지능, 머신러닝, 데이터 분석

대상자

음악 제작자, 사운드 디자이너, AI 개발자 및 모바일 앱 개발자

  • 초보자 및 중급 수준의 AI/ML 개발자 및 음향 관련 전문가에게 유용*

핵심 요약

  • 스테이블 오디오 오픈 스몰(Stable Audio Open Small) 모델은 모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI로, 3억 4100만 매개변수의 소형 모델이다.
  • Arm CPU에 최적화되어 있으며, 8초 이내의 오디오 클립 생성 가능.
  • 저작권 문제 해결된 데이터셋으로 학습되어, 수노, 유디오와의 차별화를 꾀했다.

섹션별 세부 요약

1. 모델 출시 및 목적

  • 스태빌리티 AI모바일 환경에서도 실행 가능한 초경량 음악 샘플 생성 AI 모델을 출시.
  • 음악 제작, 사운드 디자인을 위한 드럼 비트, 악기 리프, 주변 소리10초 미만의 오디오 샘플 생성에 적합.
  • 소비자용 음악 생성보다 샘플 생성에 초점을 맞추고 있음.

2. 모델 구조 및 특징

  • Arm과 협업하여 3억 4100만 매개변수소형 모델로, Arm CPU 최적화됨.
  • 스테레오 오디오 클립 생성 가능, 8초 이내의 결과 출력.
  • 저작권 문제가 해결된 공개 음원 데이터셋으로 학습됨.

3. 제약 사항

  • 완성된 노래 및 멜로디 생성에는 적합하지 않음.
  • 보컬 생성 지원 없음, 영어 프롬프트만 지원.
  • 서구 음악에 편향되어 특정 장르에 취약.

4. 라이선스 및 활용

  • 오픈 소스 모델이지만, 연간 매출 100만 달러 이상 기업엔터프라이즈 라이선스 구매 필요.
  • 허깅페이스에서 가중치 다운로드, 깃허브에서 코드 액세스, Arm 러닝 패스에서 배포 방법 제공.

결론

  • 모바일 환경에서의 빠른 음악 샘플 생성이 필요한 경우, 스테이블 오디오 오픈 스몰 모델이 유용하며, Arm CPU 최적화를 통해 휴대폰에서도 빠른 성능을 기대할 수 있음.