Sora의 Relaxed Mode란 무엇인가? 알아야 할 모든 것

프로그래밍/소프트웨어 개발

서브카테고리: 인공지능, 머신러닝

대상자: AI 개발자, 콘텐츠 제작자, SaaS 플랫폼 운영자

핵심 요약

  • Relaxed Mode는 Sora에서 제공하는 무제한의 비디오 생성 기능으로, 크레딧 제한 없이 비디오를 생성할 수 있다.
  • 비디오 품질은 Priority Mode와 동일하며, 1080p까지 지원한다.
  • 대기 시간은 변동 가능하지만, 대규모 작업에 유리한 처리 방식을 제공한다.

섹션별 세부 요약

1. Relaxed Mode의 도입 배경

  • Sora는 ChatGPT Plus 사용자가 기본 크레딧을 소진한 후에도 무료로 비디오를 생성할 수 있도록 Relaxed Mode를 도입했다.
  • 사용자들은 Reddit에서 크레딧 소진 후에도 비디오 생성이 가능하다는 점을 발견했다.
  • 이 기능은 초기에는 한시적인 연말 프로모션으로 제공되었으나, 이후 무한 기간으로 확대되었다.

2. Relaxed Mode의 주요 특징

  • 비우선 처리 대기열로, 전체 플랫폼 수요에 따라 변동적인 대기 시간이 발생할 수 있다.
  • 무제한의 비디오 생성이 가능하며, Priority Mode와 동일한 품질을 보장한다.
  • Pro 사용자는 최대 5개의 동시 작업을 처리할 수 있으며, 1080p 해상도와 20초 길이의 비디오 생성이 가능하다.

3. Priority Mode와 Relaxed Mode의 차이

  • Priority Mode는 고정 크레딧을 소비하며, 즉시 처리가 이루어져 1~2분 이내에 결과를 얻을 수 있다.
  • Relaxed Mode는 비우선 대기열에 진입해 대기 시간이 길 수 있지만, 무제한 생성이 가능하다.
  • Pro 사용자는 Relaxed Mode에서 5개의 동시 작업을 수행할 수 있다.

4. Relaxed Mode의 사용 제한

  • ChatGPT Plus 사용자는 월 50개의 Priority 크레딧 소진 후에 Relaxed Mode에 접근 가능하다.
  • ChatGPT Pro 사용자는 월 500개의 Priority 크레딧 소진 후에 Relaxed Mode에 접근 가능하다.
  • 무료 계정 사용자는 Sora에 접근할 수 없으며, Plus 또는 Pro 구독이 필수이다.

5. Relaxed Mode의 장점

  • 대규모 작업에 유리동시 작업 처리 기능 제공.
  • 대기 시간이 길어도 작업 성공률은 거의 100%에 달한다.
  • 무제한 생성을 통해 비디오 생성 비용을 절감할 수 있다.

6. Relaxed Mode의 단점 및 대응 방안

  • 고수요 시 대기 시간이 길어질 수 있음 (수십 분까지)
  • 대응 방안으로, Sora의 상태 대시보드를 모니터링하고, 오프피크 시간대에 작업을 예약하는 것이 권장된다.

7. Sora의 기술적 배경

  • Sora는 Diffusion Process와 Transformer 모델을 기반으로 동작하며, DALL·E 3의 recaptioning 기법과 유사하다.
  • 프레임 예측을 통해 시공간 연속성을 유지하며, 다중 프레임 생성이 가능하다.
  • 대기열 관리는 GPU 사용량에 따라 조절되며, 비우선 작업은 일시적으로 지연될 수 있다.

8. API 사용 가이드

  • Sora API 호출 시 queue 파라미터를 "relaxed"로 설정하여 Relaxed Mode를 명시적으로 사용할 수 있다.
  • 지수적 백오프 방식의 polling을 통해 작업 완료를 확인하며, 비동기 콜백을 사용해 결과를 수신할 수 있다.
  • CometAPI를 통해 여러 AI 모델을 하나의 REST 인터페이스로 통합 관리할 수 있다.

결론

  • Sora Relaxed Mode는 비용 효율적인 비디오 생성을 가능하게 하며, 대규모 작업에 적합하다.
  • 대기 시간을 최소화하기 위해 오프피크 시간대에 작업을 예약하는 것이 중요하다.
  • API를 통해 Relaxed Mode를 명시적으로 사용하고, 비동기 콜백 기능을 활용해 효율적인 작업 흐름을 구축할 수 있다.