초보자를 위한 SwarmUI를 사용한 AI 영상 생성 가이드
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
- AI 영상 생성 초보자, SwarmUI 사용자
- 난이도: 중간 (기본 설정부터 고급 조정까지 설명)
핵심 요약
- SwarmUI에서 AI 영상 생성을 시작할 때는 기본 모델(Wan 2.1) 사용이 권장 (
Wan 2.1 Text2Video 14B fp8_scaled
등) - CFG Scale, Frame 수, 해상도 조정 (
CFG Scale: 6
,Frame: 49
,Resolution: 640x640
) - Text-to-Video는 간단하지만 Image-to-Video가 보다 세밀한 제어 가능 (예:
Flux Dev
로 이미지 생성 후Wan 14B
로 영상화)
섹션별 세부 요약
1. 모델 설치 및 설정
- Wan 2.1 모델 설치:
diffusion_models
폴더에 저장, 서브폴더 구조 권장 (SwarmUI/Models/diffusion_models/Wan/
) - 모델 메타데이터 설정:
"Edit Metadata"
를 통해 모델 설명, 아이콘 추가 가능 - 모델 지원 문서 참고:
Video Model Support
문서에서 모델별 사용법, 해상도 범위 확인
2. Text-to-Video 생성
- 기본 설정:
Quick Tools
>Reset Params to Default
로 초기화 - Parameter 조정 예시:
CFG Scale
: 6 (기본값 8)Text2Video Frames
: 49 (Wan 기본값 81, 생성 속도 개선)Resolution
: 640x640 (Wan 14B 지원)Format
:gif-hd
(GitHub 내장 지원)- 프롬프트 예시:
real video of a cat walking through a dimly lit rainbow forest, beneath a neon sign that reads "Swarm UI", shot on Sony a6100
3. Image-to-Video 생성
- 이미지 생성 후 변환:
Flux Dev
모델로 이미지 생성 (CFG=1
,Resolution: 1024x1024
) - Image-to-Video 설정:
Video Resolution
: 자동으로 이미지 해상도 조정 (예: 640x640)Video CFG
: 기본값 6 사용, 수동 설정 필요 없음- 결과 예시: 생성된 이미지를 첫 프레임으로 사용, 나머지 프레임은 움직임을 생성
결론
- 초보자는 기본 모델과 파라미터 사용을 추천 (예:
Wan 2.1
,CFG Scale: 6
) - Image-to-Video를 사용해 세밀한 제어 가능 (이미지 생성 후 변환)
- 모델 지원 문서(
Video Model Support
) 및 Discord 커뮤니티를 통해 최신 정보 확인 - 영상 생성 실패 시
Interrupt
버튼으로 중단 후 재시도