라이트릭스, 소비자용 GPU로 비디오 생성 30배 가속화한 오픈소스 AI 모델 발표
핵심 요약
- LTXV-13B 모델: 130억개의 파라미터를 갖춘 AI 비디오 생성 모델
- 멀티스케일 렌더링 기술: 세부 정보를 타일 단위로 점진적으로 생성해 VRAM 사용량 최적화
- 소비자 GPU 호환성: RTX 3090/4090(24GB VRAM) 및 5090(32GB VRAM)에서 작동 가능
- 오픈소스 전략: R&D 비용 절감과 개발자 협업을 통한 기술 진보 유도
---
상세 요약
1. 모델 개요 및 성능
- 성능 차이: 동일 하드웨어에서 타사 모델 대비 40배 빠른 37.59초 비디오 생성
- VRAM 효율성: 타일 크기로 VRAM 사용량 결정, 최종 해상도보다 훨씬 낮은 용량 사용 가능
- 압축 기술: 비디오 압축률 향상으로 VRAM 사용량 감소
2. 기술적 혁신
- 멀티스케일 렌더링:
- AI가 격자에서 시작해 장면과 움직임을 대략적으로 파악 후 타일 단위로 세부 정보 추가
- 예술가의 스케치 → 디테일 추가 방식과 유사
- 하드웨어 최적화:
- 엔터프라이즈급 GPU 대신 소비자 GPU(최대 24~32GB VRAM)로 작동 가능
- 클라우드 기반 대신 로컬 실행 가능
3. 오픈소스 전략 및 파트너십
- 라이선스 해결: 게티 이미지, 셔터스톡과의 협업으로 훈련 데이터 라이선스 문제 해결
- 상업적 활용: 연 매출 1000만 달러 기준으로 라이선스 계약 논의 예정
- R&D 비용 절감: 개발자 커뮤니티 협업을 통한 기술 개선 유도
4. 애플리케이션 및 제한
- 애니메이션 분야 활용: 핵심 프레임 생성 비용 절감 가능성
- 한계: 할리우드 수준의 비디오 생성 기술은 아직 미달
- 체험 플랫폼: 스토리텔링 플랫폼 LTX 스튜디오에서 사용 가능
---
결론 및 팁
- VRAM 최적화: 타일 크기 조절로 VRAM 사용량 감소 가능
- 실무 활용: 소비자 하드웨어로 빠른 프로토타이핑 및 테스트 가능
- 라이선스 주의: 상업적 사용 시 1000만 달러 매출 기준을 준수해야 함
- 향후 전망: 애니메이션, 콘텐츠 제작 분야에서 AI 기술의 확산 가능성 높음
---
- 참고: 사진 출처: 라이트릭스*