阿里 Wan 2.2 本地部署教程,支持文字生成视频和图片生成视频,Alibaba wan 2.2 comfyui 免费开源

免费开源AI视频模型:Wan2.2。这是由阿里巴巴通义万相团队开发的视频生成模型,支持中英文文本生成视频和图片生成视频,对显卡的要求较低,适合大多数用户本地部署使用。在Wan2.2中,基础视频模型的重大升级,专注于融入以下创新:1、高效的 MoE 架构,2、电影级美学,3、复杂运动生成,4、高效高清混合 TI2V。详细介绍>>

Wan 2.2 本地部署

准备工作:
1、安装git,点击下载>>

2、安装ComfyUI,点击下载>>
*如果下载速度慢,建议先开启代理,代理软件下载>>

3、下载 文本编码器和 VAE
下载 umt5_xxl_fp8_e4m3fn_scaled.safetensors 放入:ComfyUI/models/text_encoders/
下载 wan_2.1_vae.safetensors 放入:ComfyUI/models/vae/
下载 wan2.2_vae.safetensors 放入:ComfyUI/models/vae/

4、下载 视频生成模式,点击下载>> ,放入:ComfyUI/models/diffusion_models/

注意:fp16 版本它们会产生更好的结果,但需要更高的电脑配置。
质量等级(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn
建议使用 fp16 文件,但如果显存不足,则可以使用 fp8 文件。

工作流程示例
Wan2.2 有3种不同型号的模型,一种是 5B 型号可以同时进行文本和图像到视频的转换,还有两种 14B 型号,一种用于文本到视频,另一种用于图像到视频。

5B 模型
此工作流程需要 wan2.2_ti2v_5B_fp16.safetensors 文件
(将其放入:ComfyUI/models/diffusion_models/)
文字转视频工作流>>
图像转视频工作流>>

14B 模型
1、文字转视频
此工作流程需要 wan2.2_t2v_high_noise_14B_fp8_scaled.safetensorswan2.2_t2v_low_noise_14B_fp8_scaled.safetensors 文件
(将其放入:ComfyUI/models/diffusion_models/)
文字转视频工作流>>

2、图像转视频
此工作流程需要 wan2.2_i2v_high_noise_14B_fp8_scaled.safetensorswan2.2_i2v_low_noise_14B_fp8_scaled.safetensors 文件
(将其放入:ComfyUI/models/diffusion_models/)。
图像转视频工作流>>


文字生成视频(提示词):
a fox moving quickly in a beautiful winter scenery nature trees mountains daytime tracking camera


示例:

文生视频:


图生视频: