스태빌리티 AI, 모바일용 초경량 오디오 생성 AI 'Stable Audio Open Small' 출시
🤖 AI 추천
음악 생성 AI 모델의 경량화 및 모바일 환경 적용에 관심 있는 개발자 및 AI 연구자
🔖 주요 키워드

핵심 기술: 스태빌리티 AI가 Arm과의 협력을 통해 모바일 환경에서도 실행 가능한 초경량 오디오 생성 AI 모델 'Stable Audio Open Small'을 오픈 소스로 출시했습니다. 이 모델은 3억 4100만 개의 매개변수를 가지며, 텍스트 입력으로 최대 11초 길이의 스테레오 오디오 클립을 생성할 수 있습니다.
기술적 세부사항:
* 모델 크기: 3억 4100만 매개변수 (기존 'Stable Audio Open'의 11억 개 대비 소형화)
* 최적화: Arm CPU에 최적화되어 모바일 칩셋에서도 효율적인 실행 가능
* 출력 길이: 최대 11초 (휴대폰에서는 8초 미만 소요)
* 기능: 드럼 비트, 악기 리프, 주변 소리, 오디오 샘플 등 10초 미만의 짧은 오디오 클립 생성
* 데이터셋: 저작권 문제가 해결된 공개 음원 데이터셋으로 학습
* 제약 사항: 완성된 노래나 멜로디 생성 부적합, 보컬 미지원, 영어 프롬프트만 지원, 서구 음악 편향성
* 라이선스: 연 매출 100만 달러 이상 기업은 별도 엔터프라이즈 라이선스 필요
* 접근성: 모델 가중치는 허깅페이스, 코드는 깃허브에서 다운로드 가능
개발 임팩트: 저사양 모바일 기기에서도 AI 기반 오디오 샘플 생성이 가능해져, 모바일 앱 개발 시 사운드 디자인이나 효과음 생성에 활용도가 높아질 것으로 기대됩니다. 또한, 오픈 소스 모델로서 커뮤니티의 기여를 통해 발전 가능성이 있습니다.
커뮤니티 반응: (원문에서 직접적인 커뮤니티 반응 언급 없음)
톤앤매너: 기술적 전문성을 바탕으로 모델의 특징, 장단점, 활용 방안을 명확하게 전달합니다.