千问qwen-image中文字体直出!最强中文文本渲染模型阿里通义千问Qwen-Image模型简介与应用
2025年8月阿里通义千文团队发布了首个开源图像生成基础模型Qwen-Image,2025年8月5日,阿里通义千问团队宣布开源 Qwen-Image,2025年8月15日ComfyUI上线Qwen-Image distilled模型,实现支持消费级显卡运行及快速生成。
Qwen-Image模型在文本渲染方面表现卓越,尤其是在中文文本渲染方面大幅领先其它现有大模型,可以直接生成中文文字及排版效果。Qwen-Image模型在复杂文本渲染和精确图像编辑方面取得了显著进展,无论是英语还是中文等多种语言都能实现高保真输出,且该模型具备一致性的图像编辑能力,在生图过程中能保持内容的一致性。
注:本节内容所涉及的模型可以在文末网盘链接下载。
使用前注意将comfyui内核更新至最新版本。
1 模型下载
1.1 Qwen-Image_ComfyUI模型下载
1.1.1 官方模型
模型下载地址:
https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/diffusion_models
共两个版本,根据电脑显存大小选择bf16版本或fp8版本下载。

模型安装地址:../ComfyUI/models/diffusion_models
1.1.2 蒸馏版模型(非官方)
根据comfy org的测试说明,Qwen-Image蒸馏版模型的大小及显存占用虽未明显降低,但是生成时间上有明显减少(建议在 15 步, cfg 1.0的参数下即可获得较好的出图效果)。
(1)bf16蒸馏版
qwen_image_distill_full_bf16.safetensors(点击即可下载,需科学上网)
(2)fp8蒸馏版
qwen_image_distill_full_fp8_e4m3fn.safetensors(点击即可下载,需科学上网)
1.2 配套模型
1.2.1 text_encoders模型
下载链接:
https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders
共两个版本,根据电脑显存大小选择原版或fp8版本下载。
模型安装地址:ComfyUI/models/text_encoders
经过测试目前至少支持:英语、中文、韩语、日语、意大利语等,即可以直接输入中文提示词,无需将提示词翻译成英文。
1.2.2 VAE模型
下载链接:
https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/vae

模型安装地址:../ComfyUI/models/vae/
2 工作流
2.1 基础工作流搭建
Qwen-Image_ComfyUI的基础工作流搭建逻辑与flux.1模型的基础工作流类似,主要是将模型加载区的模型替换为Qwen-Image模型及其配套的clip和VAE模型。


“模型采样算法AuraFlow”节点:如果得到太多模糊/暗/差的图片,请增加位移。如果想要尝试增加细节,请减少位移。
2.2 comfyu org原生工作流示例
下面的工作流是comfyu org官方原生工作流示例,官方示例工作流中共测试使用了三种不同模型,分别为:
- Qwen-Image原版模型的 fp8_e4m3fn版本;
- 原版模型(fp8版本)+8步加速版loRA:原版模型fp8_e4m3fn版本+“lightx2v”8步加速LoRA;
- 蒸馏版Qwen-Image模型:蒸馏版模型 fp8_e4m3fn
comfy-org对各版本模型及loRA组合下的步数及cfg值设置推荐如下:

2.2.1 加速lora下载
lora模型下载地址:Qwen-Image-Lightning-8steps-V1.0.safetensors
安装目录:../ComfyUI/models/loras/
启用该lora时,步数设置为8,cfg设置为2.5
注:蒸馏版模型与“lightx2v”8步 LoRA不兼容,故无对应工作流应用;
2.2.2 蒸馏版本模型参数设置
原始作者建议蒸馏版本模型生图步数设置为15 步,cfg值为1.0。经测试该蒸馏版本在10步、cfg值为1.0下表现良好,根据你想要的图像类型选择 euler 或 res_multistep等采样方法。
2.2.3 原生工作流
comfy org官方原生工作流示例如下:

根据官方测试数据,上述三种模型/模型组合的显存占用和生图速度对比如下:
|
使用模型 |
VRAM Usage |
首次生成 |
第二次生成 |
|
fp8_e4m3fn |
86% |
≈ 94s |
≈ 71s |
|
fp8_e4m3fn 使用 lightx2v 8步 LoRA |
86% |
≈ 55s |
≈ 34s |
|
蒸馏版 fp8_e4m3fn |
86% |
≈ 69s |
≈ 36s |
可以看到原版模型的fp8_e4m3fn 使用“lightx2v”8步LoRA后,生成速度有了明显提升。蒸馏版本的fp8_e4m3fn模型,虽未使用加速lora,但是第二次生图速度也已接近原版模型与“lightx2v”加速lora的加速效果。
附件:
本节内容所涉及模型均打包在网盘,链接:https://pan.quark.cn/s/09cb7e2f9f56
模型文件已进行整理,适合不方便科学上网的的小伙伴下载使用。模型文件数量较多且尺寸较大,为避免下载中断等问题,可以先转存再下载。如需本节内容工作流文件,请加V获取huaqs123(请备注csdn及所需的具体工作流)
欢迎正在学习comfyui等ai技术的伙伴V加 huaqs123 进入学习小组。在这里大家共同学习comfyui的基础知识、最新模型与工作流、行业前沿信息等,也可以讨论comfyui商业落地的思路与方向。 欢迎感兴趣的小伙伴,群共享资料会分享博主自用的comfyui整合包(已安装超全节点与必备模型)、基础学习资料、高级工作流等资源……
致敬每一位在路上的学习者,你我共勉!Ai技术发展迅速,学习comfyUI是紧跟时代的第一步,促进商业落地并创造价值才是学习的实际目标。

——画青山Ai学习专栏———————————————————————————————
零基础学Webui:
https://blog.csdn.net/vip_zgx888/category_13020854.html
Comfyui基础学习与实操:
https://blog.csdn.net/vip_zgx888/category_13006170.html
comfyui功能精进与探索:
https://blog.csdn.net/vip_zgx888/category_13005478.html
系列专栏持续更新中,欢迎订阅关注,共同学习,共同进步!
—————————————————————————————————————————
更多推荐



所有评论(0)