千问qwen-image中文字体直出！最强中文文本渲染模型阿里通义千问Qwen-Image模型简介与应用

VIP_ZGX888

3544人浏览 · 2025-09-01 09:42:04

VIP_ZGX888 · 2025-09-01 09:42:04 发布

摘要： 2025年8月阿里开源的Qwen-Image模型，在多语言文本渲染（尤其擅长中文）和图像编辑一致性上表现突出，ComfyUI上线的蒸馏模型支持消费级显卡运行。需下载主模型（官方bf16/fp8版或蒸馏版）及配套的text_encoders、VAE模型，按指定路径安装。工作流类似flux.1，官方测试的三种模型组合中，原版配8步LoRA生成最快，蒸馏版次之，三者显存占用均为86%。本节内容就模型下载与工作流应用方式进行讲解。

2025年8月阿里通义千文团队发布了首个开源图像生成基础模型Qwen-Image，2025年8月5日，阿里通义千问团队宣布开源 Qwen-Image，2025年8月15日ComfyUI上线Qwen-Image distilled模型，实现支持消费级显卡运行及快速生成。

Qwen-Image模型在文本渲染方面表现卓越，尤其是在中文文本渲染方面大幅领先其它现有大模型，可以直接生成中文文字及排版效果。Qwen-Image模型在复杂文本渲染和精确图像编辑方面取得了显著进展，无论是英语还是中文等多种语言都能实现高保真输出，且该模型具备一致性的图像编辑能力，在生图过程中能保持内容的一致性。

注：本节内容所涉及的模型可以在文末网盘链接下载。

使用前注意将comfyui内核更新至最新版本。

1 模型下载

1.1 Qwen-Image_ComfyUI模型下载

1.1.1 官方模型

模型下载地址：

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/diffusion_models

共两个版本，根据电脑显存大小选择bf16版本或fp8版本下载。

模型安装地址：../ComfyUI/models/diffusion_models

1.1.2 蒸馏版模型（非官方）

根据comfy org的测试说明，Qwen-Image蒸馏版模型的大小及显存占用虽未明显降低，但是生成时间上有明显减少（建议在 15 步， cfg 1.0的参数下即可获得较好的出图效果）。

（1）bf16蒸馏版

qwen_image_distill_full_bf16.safetensors（点击即可下载，需科学上网）

（2）fp8蒸馏版

qwen_image_distill_full_fp8_e4m3fn.safetensors（点击即可下载，需科学上网）

1.2 配套模型

1.2.1 text_encoders模型

下载链接：

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

共两个版本，根据电脑显存大小选择原版或fp8版本下载。

模型安装地址：ComfyUI/models/text_encoders

经过测试目前至少支持：英语、中文、韩语、日语、意大利语等，即可以直接输入中文提示词，无需将提示词翻译成英文。

1.2.2 VAE模型

下载链接：

https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/vae

模型安装地址：../ComfyUI/models/vae/

2 工作流

2.1 基础工作流搭建

Qwen-Image_ComfyUI的基础工作流搭建逻辑与flux.1模型的基础工作流类似，主要是将模型加载区的模型替换为Qwen-Image模型及其配套的clip和VAE模型。

“模型采样算法AuraFlow”节点：如果得到太多模糊/暗/差的图片，请增加位移。如果想要尝试增加细节，请减少位移。

2.2 comfyu org原生工作流示例

下面的工作流是comfyu org官方原生工作流示例，官方示例工作流中共测试使用了三种不同模型，分别为：

Qwen-Image原版模型的 fp8_e4m3fn版本；
原版模型（fp8版本）+8步加速版loRA：原版模型fp8_e4m3fn版本+“lightx2v”8步加速LoRA；
蒸馏版Qwen-Image模型：蒸馏版模型 fp8_e4m3fn

comfy-org对各版本模型及loRA组合下的步数及cfg值设置推荐如下：

2.2.1 加速lora下载

lora模型下载地址：Qwen-Image-Lightning-8steps-V1.0.safetensors

安装目录：../ComfyUI/models/loras/

启用该lora时，步数设置为8，cfg设置为2.5

注：蒸馏版模型与“lightx2v”8步 LoRA不兼容，故无对应工作流应用；

2.2.2 蒸馏版本模型参数设置

原始作者建议蒸馏版本模型生图步数设置为15 步，cfg值为1.0。经测试该蒸馏版本在10步、cfg值为1.0下表现良好，根据你想要的图像类型选择 euler 或 res_multistep等采样方法。

2.2.3 原生工作流

comfy org官方原生工作流示例如下：

根据官方测试数据，上述三种模型/模型组合的显存占用和生图速度对比如下：

使用模型	VRAM Usage	首次生成	第二次生成
fp8_e4m3fn	86%	≈ 94s	≈ 71s
fp8_e4m3fn 使用 lightx2v 8步 LoRA	86%	≈ 55s	≈ 34s
蒸馏版 fp8_e4m3fn	86%	≈ 69s	≈ 36s

可以看到原版模型的fp8_e4m3fn 使用“lightx2v”8步LoRA后，生成速度有了明显提升。蒸馏版本的fp8_e4m3fn模型，虽未使用加速lora，但是第二次生图速度也已接近原版模型与“lightx2v”加速lora的加速效果。

附件：

本节内容所涉及模型均打包在网盘，链接：https://pan.quark.cn/s/09cb7e2f9f56

模型文件已进行整理，适合不方便科学上网的的小伙伴下载使用。模型文件数量较多且尺寸较大，为避免下载中断等问题，可以先转存再下载。如需本节内容工作流文件，请加V获取huaqs123(请备注csdn及所需的具体工作流)

欢迎正在学习comfyui等ai技术的伙伴V加 huaqs123 进入学习小组。在这里大家共同学习comfyui的基础知识、最新模型与工作流、行业前沿信息等，也可以讨论comfyui商业落地的思路与方向。欢迎感兴趣的小伙伴，群共享资料会分享博主自用的comfyui整合包（已安装超全节点与必备模型）、基础学习资料、高级工作流等资源……

致敬每一位在路上的学习者，你我共勉！Ai技术发展迅速，学习comfyUI是紧跟时代的第一步，促进商业落地并创造价值才是学习的实际目标。