阿里深夜力作：Qwen2.5-VL新版本开源，视觉推理惊艳，32B智慧超越72B！

就在 DeepSeek V3「小版本更新」后的几个小时，阿里通义千问团队也开源了新模型。择日不如撞日，就这么来了。对于所有用户来说，在 Qwen Chat 上直接选中 Qwen2.5-VL-32B，即可体验：https://chat.qwen.ai/32B 版本的出现，解决了「72B 对 VLM 来说太大」和「7B 不够强大」的问题。

LLand520

719人浏览 · 2025-03-26 16:25:34

LLand520 · 2025-03-26 16:25:34 发布

就在 DeepSeek V3「小版本更新」后的几个小时，阿里通义千问团队也开源了新模型。

择日不如撞日，Qwen2.5-VL-32B-Instruct 就这么来了。

截屏2025-03-25 09.36.25.png

相比此前的 Qwen2.5-VL 系列模型，32B 模型有如下改进：

回复更符合人类主观偏好：调整了输出风格，使回答更加详细、格式更规范，并更符合人类偏好。
数学推理能力：复杂数学问题求解的准确性显著提升。
图像细粒度理解与推理：在图像解析、内容识别以及视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。

对于所有用户来说，在 Qwen Chat 上直接选中 Qwen2.5-VL-32B，即可体验：https://chat.qwen.ai/

截屏2025-03-25 10.02.24.png

32B 版本的出现，解决了「72B 对 VLM 来说太大」和「7B 不够强大」的问题。如这位网友所说，32B 可能是多模态 AI Agent 部署实践中的最佳选择：

截屏2025-03-25 09.56.44.png

不过团队也介绍了，Qwen2.5-VL-32B 在强化学习框架下优化了主观体验和数学推理能力，但主要还是基于「快速思考」模式。

下一步，通义千问团队将聚焦于长且有效的推理过程，以突破视觉模型在处理高度复杂、多步骤视觉推理任务中的边界。

32B 可以比 72B 更聪明

先来看看性能测试结果。

与近期的 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型相比，Qwen2.5-VL-32B-Instruct 展现出了明显的优势，甚至超越了更大规模的 72B 模型。

如上图所示，在 MMMU、MMMU-Pro 和 MathVista 等多模态任务中，Qwen2.5-VL-32B-Instruct 均表现突出。

特别是在注重主观用户体验评估的 MM-MT-Bench 基准测试中，32B 模型相较于前代 Qwen2-VL-72B-Instruct 实现了显著进步。

视觉能力的进步，已经让用户们感受到了震撼：

截屏2025-03-25 10.11.30.png

除了在视觉能力上优秀，Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。

实例展示

或许很多人还好奇，32B 版本的升级怎么体现呢？

关于「回复更符合人类主观偏好」、「数学推理能力」、「图像细粒度理解与推理」这三个维度，我们通过几个官方 Demo 来体会一番。

第一个问题，是关于「细粒度图像理解与推理」：我开着一辆卡车在这条路上行驶，现在是 12 点，我能在 13 点之前到达 110 公里外的地方吗？

截屏2025-03-25 10.23.33.png

显然，从人类的角度去快速判断，在限速 100 的前提下，卡车无法在 1 小时内抵达 110 公里之外的地方。

Qwen2.5-VL-32B-Instruct 给出的答案也是「否」，但分析过程更加严谨，叙述方式也是娓娓道来，我们可以做个参考：

截屏2025-03-25 10.24.19.png

第二个问题是「数学推理」：如图，直线 AB、CD 交于点 O，OD 平分∠AOE，∠BOC=50.0，则∠EOB=（）

截屏2025-03-25 10.28.44.png

答案是「80」：

截屏2025-03-25 10.32.48.png

截屏2025-03-25 10.32.59.png

第三个题目的数学推理显然更上难度了：

截屏2025-03-25 10.35.35.png

模型给出的答案特别清晰，解题思路拆解得很详细：

截屏2025-03-25 10.36.14.png

截屏2025-03-25 10.36.33.png

截屏2025-03-25 10.36.42.png

在下面这个图片内容识别任务中，模型的分析过程也非常细致严谨：

截屏2025-03-25 10.18.56.png

截屏2025-03-25 10.19.14.png

截屏2025-03-25 10.19.31.png

关于 Qwen2.5-VL-32B-Instruct 的更多信息，可参考官方博客。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。