AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

애플, '확산' 방식 대체할 첨단 이미지 모델 공개

카테고리

데이터 과학/AI

서브카테고리

인공지능

대상자 대상자_정보 출력

  • AI 연구자 및 이미지 생성 분야 개발자
  • 고해상도 이미지 생성 기술에 관심 있는 중급~고급 수준 개발자

핵심 요약

  • STARFlow정규화 흐름(Normalizing Flows)트랜스포머(Transformer)를 결합한 TARFlow 기술을 기반으로 고해상도 이미지 생성에 강점을 가진 모델
  • Deep-Shallow 구조를 통해 연산 효율성과 표현력 균형 달성
  • 잠재 공간(latent space) 기반 학습으로 학습 속도 및 안정성 향상

섹션별 세부 요약

1. STARFlow 개요

  • TARFlow는 이미지를 조각으로 나누어 순서별 처리 후 연속적인 데이터 공간에서 최대 가능도 학습 수행
  • 확산 모델(Diffusion Model) 대비 수학적 정규화 흐름 특성 유지
  • 사전 학습된 오토인코더를 활용한 잠재 공간 학습으로 데이터 구조 단순화

2. Deep-Shallow 구조

  • 깊은 트랜스포머 블록얕은 블록의 혼합으로 복잡한 패턴 학습과 연산 효율성 동시 달성
  • 고해상도 이미지 생성 시 연산 자원 최적화

3. 정규화 흐름 vs 확산 모델

  • 확산 모델: 노이즈 제거 과정을 통해 이미지 생성
  • STARFlow: 연속적인 수학적 최대 가능도 학습으로 결과 예측 가능성 증대

4. 새로운 가이던스 알고리즘

  • 생성 과정에서의 정밀도 향상을 위한 알고리즘 도입
  • 조건 생성 작업(예: 텍스트 설명 기반 이미지 생성)에서 경쟁력 있는 성능 보여주기

5. 활용 가능성

  • 콘텐츠 제어가 필요한 애플리케이션(예: 디자인 툴, 의료 영상 분석)에 적합
  • 온디바이스 AI 기술과 결합하드웨어-소프트웨어 통합 역량 강화

결론

  • STARFlowDeep-Shallow 구조잠재 공간 학습을 통해 확산 모델의 한계 극복
  • 의사결정 시스템 및 고해상도 이미지 생성 분야에서 실용적 적용 가능성 높음
  • 온디바이스 AI 기술과의 통합모바일 기기의 AI 성능 향상에 기여할 것으로 기대