애플, 확산 모델 대체할 AI 이미지 생성 모델 '스타플로우' 공개: 정규화 흐름과 트랜스포머 결합

🤖 AI 추천

AI 연구원, 머신러닝 엔지니어, 컴퓨터 비전 전문가, 고해상도 이미지 생성 기술에 관심 있는 개발자

🔖 주요 키워드

애플, 확산 모델 대체할 AI 이미지 생성 모델 '스타플로우' 공개: 정규화 흐름과 트랜스포머 결합

핵심 기술

애플이 확산 모델(Diffusion Model)의 대안으로 제시한 새로운 AI 이미지 생성 모델 '스타플로우(STARFlow)'는 정규화 흐름(Normalizing Flows) 방식과 트랜스포머(Transformer) 구조를 결합한 '타플로우(TARFlow)' 기술을 기반으로 합니다. 이는 고해상도 이미지 생성의 성능 및 효율성 한계를 극복하는 것을 목표로 합니다.

기술적 세부사항

  • 타플로우(TARFlow) 아키텍처: 이미지를 조각내어 트랜스포머 블록으로 순차 처리하며, 각 층에서 처리 순서를 변경하는 방식으로 학습합니다.
  • 픽셀 단위 예측: 이미지의 픽셀 하나하나를 직접 예측하고 생성하는 능력을 갖추고 있습니다.
  • 딥-셸로우(Deep-Shallow) 구조: 복잡한 패턴 학습을 위한 깊은 트랜스포머 블록과 효율적인 연산을 위한 얕은 블록을 결합하여 모델의 효율성과 표현력을 동시에 향상시킵니다.
  • 잠재 공간(Latent Space) 학습: 이미지 픽셀 직접 처리 대신, 사전 학습된 오토인코더의 잠재 공간에서 학습을 진행하여 데이터 구조 단순화 및 학습 속도/안정성 증대를 도모합니다.
  • 정규화 흐름 기반 최대 가능도 학습: 연속적인 데이터 공간에서 정확한 최대 가능도(likelihood) 학습을 수행합니다.
  • 새로운 가이던스 알고리즘: 생성 이미지의 품질 향상을 위해 정밀하고 높은 품질의 출력을 유도하는 알고리즘을 도입했습니다.

개발 임팩트

  • 성능 및 효율성 향상: 기존 정규화 흐름 모델의 고해상도 이미지 생성 제약을 극복하고, 확산 모델과 경쟁력 있는 성능을 제공합니다.
  • 정밀한 제어 가능성: 특정 이미지 유형이나 텍스트 설명에 따른 조건부 이미지 생성 및 콘텐츠 정밀 제어가 가능해집니다.
  • 온디바이스 AI 강화: 애플의 온디바이스 AI 전략과 결합하여 하드웨어 및 소프트웨어 통합 역량을 강화하는 핵심 요소가 될 잠재력을 지닙니다.
  • 새로운 생성 모델 패러다임: 대규모 및 고해상도 환경에서 정규화 흐름 기반 방식의 새로운 가능성을 제시합니다.

커뮤니티 반응

(해당 정보 없음)

📚 관련 자료