개발 인공지능

D

dev_to

2025. 06. 15

SwarmUI로 AI 영상 생성 초보자 가이드

초보자를 위한 SwarmUI를 사용한 AI 영상 생성 가이드

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

AI 영상 생성 초보자, SwarmUI 사용자
난이도: 중간 (기본 설정부터 고급 조정까지 설명)

핵심 요약

SwarmUI에서 AI 영상 생성을 시작할 때는 기본 모델(Wan 2.1) 사용이 권장 (Wan 2.1 Text2Video 14B fp8_scaled 등)
CFG Scale, Frame 수, 해상도 조정 (CFG Scale: 6, Frame: 49, Resolution: 640x640)
Text-to-Video는 간단하지만 Image-to-Video가 보다 세밀한 제어 가능 (예: Flux Dev로 이미지 생성 후 Wan 14B로 영상화)

섹션별 세부 요약

1. 모델 설치 및 설정

Wan 2.1 모델 설치: diffusion_models 폴더에 저장, 서브폴더 구조 권장 (SwarmUI/Models/diffusion_models/Wan/)
모델 메타데이터 설정: "Edit Metadata"를 통해 모델 설명, 아이콘 추가 가능
모델 지원 문서 참고: Video Model Support 문서에서 모델별 사용법, 해상도 범위 확인

2. Text-to-Video 생성

기본 설정: Quick Tools > Reset Params to Default로 초기화
Parameter 조정 예시:
CFG Scale: 6 (기본값 8)
Text2Video Frames: 49 (Wan 기본값 81, 생성 속도 개선)
Resolution: 640x640 (Wan 14B 지원)
Format: gif-hd (GitHub 내장 지원)
프롬프트 예시: real video of a cat walking through a dimly lit rainbow forest, beneath a neon sign that reads "Swarm UI", shot on Sony a6100

3. Image-to-Video 생성

이미지 생성 후 변환: Flux Dev 모델로 이미지 생성 (CFG=1, Resolution: 1024x1024)
Image-to-Video 설정:
Video Resolution: 자동으로 이미지 해상도 조정 (예: 640x640)
Video CFG: 기본값 6 사용, 수동 설정 필요 없음
결과 예시: 생성된 이미지를 첫 프레임으로 사용, 나머지 프레임은 움직임을 생성

결론

초보자는 기본 모델과 파라미터 사용을 추천 (예: Wan 2.1, CFG Scale: 6)
Image-to-Video를 사용해 세밀한 제어 가능 (이미지 생성 후 변환)
모델 지원 문서(Video Model Support) 및 Discord 커뮤니티를 통해 최신 정보 확인
영상 생성 실패 시 Interrupt 버튼으로 중단 후 재시도

SwarmUI AI 영상 생성 video generation text2video image2video Wan 2.1 ComfyUI

목록으로 원문 보기