摘要: 2025年8月阿里开源的Qwen-Image模型,在多语言文本渲染(尤其擅长中文)和图像编辑一致性上表现突出,ComfyUI上线的蒸馏模型支持消费级显卡运行。需下载主模型(官方bf16/fp8版或蒸馏版)及配套的text_encoders、VAE模型,按指定路径安装。工作流类似flux.1,官方测试的三种模型组合中,原版配8步LoRA生成最快,蒸馏版次之,三者显存占用均为86%。本节内容就模型下载与工作流应用方式进行讲解。

    2025年8月阿里通义千文团队发布了首个开源图像生成基础模型Qwen-Image2025年8月5日,阿里通义千问团队宣布开源 Qwen-Image2025年8月15日ComfyUI上线Qwen-Image distilled模型,实现支持消费级显卡运行快速生成

    Qwen-Image模型在文本渲染方面表现卓越,尤其是在中文文本渲染方面大幅领先其它现有模型,可以直接生成中文文字及排版效果。Qwen-Image模型在复杂文本渲染精确图像编辑方面取得了显著进展,无论是英语还是中文等多种语言都能实现高保真输出且该模型具备一致性的图像编辑能力,在生图过程中能保持内容的一致性。

注:本节内容所涉及的模型可以在文末网盘链接下载。

使用前注意将comfyui内核更新至最新版本。

1 模型下载

1.1 Qwen-Image_ComfyUI模型下载

1.1.1 官方模型

    模型下载地址:

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/diffusion_models

    共两个版本,根据电脑显存大小选择bf16版本或fp8版本下载。

模型安装地址:../ComfyUI/models/diffusion_models

1.1.2 蒸馏版模型(非官方)

    根据comfy org测试说明,Qwen-Image蒸馏版模型的大小及显存占用虽未明显降低,但是生成时间上有明显减少建议在 15 步 cfg 1.0的参数下即可获得较好的出图效果)

(1)bf16蒸馏版

qwen_image_distill_full_bf16.safetensors(点击即可下载,需科学上网)

(2)fp8蒸馏版

qwen_image_distill_full_fp8_e4m3fn.safetensors(点击即可下载,需科学上网)

1.2 配套模型

1.2.1 text_encoders模型

下载链接:

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

共两个版本,根据电脑显存大小选择原版或fp8版本下载。

模型安装地址:ComfyUI/models/text_encoders

    经过测试目前至少支持:英语、中文、韩语、日语、意大利语等,即可以直接输入中文提示词,无需将提示词翻译成英文。

1.2.2 VAE模型

下载链接:

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/vae

模型安装地址:../ComfyUI/models/vae/

2 工作流

2.1 基础工作流搭建

    Qwen-Image_ComfyUI的基础工作流搭建逻辑与flux.1模型的基础工作流类似,主要是将模型加载区的模型替换为Qwen-Image模型及其配套的clip和VAE模型。

    “模型采样算法AuraFlow”节点:如果得到太多模糊/暗/差的图片,请增加位移。如果想要尝试增加细节,请减少位移。

2.2 comfyu org原生工作流示例

    下面的工作流是comfyu org官方原生工作流示例,官方示例工作流中共测试使用了三种不同模型,分别为:

  1. Qwen-Image原版模型 fp8_e4m3fn版本;
  2. 原版模型(fp8版本)+8步加速版loRA:原版模型fp8_e4m3fn版本+“lightx2v8步加速LoRA
  3. 蒸馏版Qwen-Image模型蒸馏版模型 fp8_e4m3fn

comfy-org对各版本模型及loRA组合下的步数及cfg值设置推荐如下:

2.2.1 加速lora下载

    lora模型下载地址:Qwen-Image-Lightning-8steps-V1.0.safetensors

    安装目录:../ComfyUI/models/loras/

    启用该lora时,步数设置为8,cfg设置为2.5

注:蒸馏版模型与“lightx2v8步 LoRA不兼容,故无对应工作流应用

2.2.2 蒸馏版本模型参数设置

    原始作者建议蒸馏版本模型生图步数设置为15 步cfg值为1.0。经测试该蒸馏版本在10步cfg值为1.0下表现良好,根据你想要的图像类型选择 euler 或 res_multistep等采样方法。

2.2.3 原生工作流

comfy org官方原生工作流示例如下:

根据官方测试数据,上述三种模型/模型组合的显存占用和生图速度对比如下:

使用模型

VRAM Usage

首次生成

第二次生成

fp8_e4m3fn

86%

≈ 94s

≈ 71s

fp8_e4m3fn 使用 lightx2v 8步 LoRA

86%

≈ 55s

≈ 34s

蒸馏版 fp8_e4m3fn

86%

≈ 69s

≈ 36s

    可以看到原版模型的fp8_e4m3fn 使用“lightx2v”8步LoRA后,生成速度有了明显提升。蒸馏版本的fp8_e4m3fn模型,虽未使用加速lora,但是第二次生图速度也已接近原版模型与“lightx2v”加速lora的加速效果。

附件:

本节内容所涉及模型均打包在网盘,链接:https://pan.quark.cn/s/09cb7e2f9f56

    模型文件已进行整理,适合不方便科学上网的的小伙伴下载使用。模型文件数量较多且尺寸较大,为避免下载中断等问题,可以先转存再下载。如需本节内容工作流文件,请加V获取huaqs123(请备注csdn及所需的具体工作流)

     欢迎正在学习comfyui等ai技术的伙伴V加 huaqs123 进入学习小组。在这里大家共同学习comfyui的基础知识、最新模型与工作流、行业前沿信息等,也可以讨论comfyui商业落地的思路与方向。 欢迎感兴趣的小伙伴,群共享资料会分享博主自用的comfyui整合包(已安装超全节点与必备模型)、基础学习资料、高级工作流等资源……

    致敬每一位在路上的学习者,你我共勉!Ai技术发展迅速,学习comfyUI是紧跟时代的第一步,促进商业落地并创造价值才是学习的实际目标。

——画青山Ai学习专栏———————————————————————————————

零基础学Webui:

https://blog.csdn.net/vip_zgx888/category_13020854.html

Comfyui基础学习与实操:

https://blog.csdn.net/vip_zgx888/category_13006170.html

comfyui功能精进与探索:

https://blog.csdn.net/vip_zgx888/category_13005478.html

系列专栏持续更新中,欢迎订阅关注,共同学习,共同进步!

—————————————————————————————————————————

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐