智谱CogView4绘画大模型开源，更稳定以及风格化的汉字生成，更强的中文提示词理解！

前言最近国内是不是商量好的，阿里刚开源了 AI 视频大模型 Wan2.1，腾讯混元也马上要开源他们的图生视频大模型了，这边智谱提前混元一步开源了文生图大模型 CogView4，虽然不是视频大模型，但是也是一个大模型呐。CogView4 主打的一个双语理解，尤其是对中文提示词的理解，还有图像中汉字的生成。虽然这些都不是 CogView4 首发，毕竟之前开源的可图绘画大模型就已经支持双语提示词以及汉

程序员筱筱

996人浏览 · 2025-03-05 15:30:00

程序员筱筱 · 2025-03-05 15:30:00 发布

前言

最近国内是不是商量好的，阿里刚开源了 AI 视频大模型 Wan2.1，腾讯混元也马上要开源他们的图生视频大模型了，这边智谱提前混元一步开源了文生图大模型 CogView4，虽然不是视频大模型，但是也是一个大模型呐。

CogView4 主打的一个双语理解，尤其是对中文提示词的理解，还有图像中汉字的生成。虽然这些都不是 CogView4 首发，毕竟之前开源的可图绘画大模型就已经支持双语提示词以及汉字生成了。

但是对于整个国内的开源生态来讲，一家独大不是春百花争鸣春满园嘛，对吧！优秀的模型越来越多，整个生态才会更快更好的发展！

不过在中文提示词理解以及汉字的稳定生成以及个性化生成上，听雨体验下来，CogView4 的确比可图更优秀。

好了，话不多说，我们直接开整！

ComfyUI 社区有大佬对 CogView4 进行了适配，所以我们现在可以直接部署本地进行体验了！

插件地址：

https://github.com/chflame163/ComfyUI_CogView4_Wrapper

既然这里也说到可图了，并且两个模型还都支持中英文双语以及汉字生成，那我们就直接来对比下这两个模型吧！

提示词：阳光明媚的午后教室，一块深墨绿色的磨砂黑板占据画面中心，用粉笔写出的‘太酷啦’三个字以立体卡通字体呈现，笔触边缘撒落彩色粉笔屑。黑板右上角挂着圆形时钟显示下午3点，左侧窗台透进暖金色光线，在黑板边缘投射出窗格阴影，空气中漂浮着微小的尘埃颗粒。背景虚化的课桌上散落着翻开的笔记本与一支钢笔，整体画面呈现温暖的手绘插画风格，色调以米白、墨绿和琥珀色为主

左边是 CogView4 生成的图片，右边是可图生成的图片，文字基本上都对了，CogView4 的太字多了一点，不过问题不大，听雨只是随机生成了一次。

关于提示词的理解上，CogView4 在这幅画上稍微占一些优势，立体卡通字体 CogView4 表现的很完美，可图就没有理解到意思，包括笔触边缘的彩色粉笔屑，还有翻开的笔记本与一支钢笔。

不过空气中漂浮着微小的尘埃颗粒，可图体现出来了，CogView4 没有。

CogView4 只能说稍胜一筹。

提示词：暮色时分的大学图书馆，一面胡桃木边框的玻璃白板斜靠复古砖墙，荧光笔书写的行楷‘知行合一’折射出琥珀色光晕，笔画间流淌着墨水渗入玻璃的细微纹路。背景虚化的红木书架上堆满中文古籍，窗外晚霞透过百叶窗在白板表面切割出平行的暖橘色条纹，整体画面融合新中式与低多边形风格，色调采用黛蓝/赭石/琉璃黄

这里就差了一些意思，试了几次都没有把完成的‘知行合一’画出来，不过试了几次 CogView4 基本生成的汉字基本还算完成，汉字生成的稳定性上来讲的确是比可图要好。

而且从字体的风格化表现上来讲，CogView4 的确是完胜可图，可图反正我只要把字写出来就行，你还想玩花样啊！

提示词：古典美人高清面部特写，羊脂玉般肌肤透着薄胭脂红晕，柳叶眉下丹凤眼含秋水，瞳孔纹路如工笔勾勒的墨色涟漪。右耳垂悬一枚银丝镶嵌翡翠耳坠，耳坠阴刻“如意”两个篆书金字，反光在脸颊投下细碎光斑。鼻尖凝着半透高光，朱唇微启露贝齿，唇角自然上扬，鬓角碎发丝根根分明垂落，背景纯黑突显面部鎏金工笔画质感

虽然这个耳环上的“如意”二字是抽了卡的，但是 CogView4 的确可以抽出来，可图抽了好多次都抽不出来。

中文提示词的理解上，也的确是 CogView4 更优秀，“眼含秋水”明显可图就理解错了。还有细碎光斑，CogView4 变现的也很好，整体来说，CogView4 更符合听雨想要的画面。

我们今天主要就是来对比下汉字的生成效果，其他的方面小伙伴们就自行体验吧！

主要现在模型用的是官方原生的模型，不是量化模型，模型本身比较大，总共有五十多 G 的模型，显存占用 16G，生成速度也比较慢，一张图要一分多钟。

插件还没有收录到 ComfyUI 管理器，暂时需要我们手动下载，插件地址开头给了。模型第一次运行工作流的时候会自动下载，也可以直接从文末的网盘里下载。

工作流很简单，以下的参数我们应该都了解，这里就不介绍了。工作流听雨也会放在文末的网盘里。

总体来说，CogView4 的中文提示词的理解能力以及汉字的生成能力相比可图是有突破的，而且生成图像的质量也不差。

等后续社区优化显存占用以及出图速度以后，还是很值得体验以及使用的。

不想本地部署的小伙伴也可以直接在线体验：

https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

好了，今天的分享就到这里了，感兴趣的小伙伴快去试试吧！

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。

二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，comfyui工作流，整合包，视频学习教程。带你从零基础系统性的学好AI绘画！

需要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述
为了帮助大家更好地掌握 ComfyUI，我花了几个月的时间，撰写并录制了一套ComfyUI的基础教程，共六篇。这套教程详细介绍了选择ComfyUI的理由、其优缺点、下载安装方法、模型与插件的安装、工作流节点和底层逻辑详解、遮罩修改重绘/Inpenting模块以及SDXL工作流手把手搭建。