阿里千问重磅更新！Qwen3.7-plus升级，多模态AI实用性大幅拉满

多米哇卡

269人浏览 · 2026-06-02 15:02:48

多米哇卡 · 2026-06-02 15:02:48 发布

阿里千问更新了旗下的Qwen3.7-plus多模态智能体模型，这是Qwen3.7系列的一次常规版本升级。这次更新主要针对平时使用AI时遇到的各种小问题，重点优化了图片视频识别、文字解读等基础功能，弥补了旧版本在图文搭配使用、实景智能操作上的不足，让这个模型可以更好用在办公、代码开发、日常聊天互动等场景中。

一、Qwen3.7-plus升级更新重点：注重实用，没有多余功能

这次版本更新没有添加花里胡哨的无用功能，所有优化内容都是围绕大家平时经常用到的场景来调整的。新版本保留了旧版原本的文字编辑、代码编写、工具调用等基础功能，主要对图文解读、视频画面识别、智能自主操作这几个方面做了改进。目前很多AI大模型的各项功能都是分开的，使用起来很不方便，贴合不了实际使用需求。Qwen3.7-plus把画面识别、内容解读、任务操作等功能串联在了一起，形成了完整的使用流程，更适合普通用户和行业工作人员日常使用。

传统AI和Qwen3.7-plus对比图

二、视觉功能升级：识图更精准，支持视频解析

在图片识别这块，这次的版本升级提升还是很明显的。对于办公常用的各类图片、文档、复杂表格和设计素材，模型的识别准确度变高了。就算是排版杂乱的文件、数据繁多的表格，或是画面有轻微遮挡的素材，模型都可以正常识别，提取出有用的信息，足够满足大家平时整理资料、统计数据、梳理内容的办公需求。

除此之外，模型处理视频动态画面的能力也有所提升。可以识别长短视频的画面变化、场景内容，以及不同画面之间的关联，能够看懂日常出行、办公操作、生活场景等各类真实动态画面。经过多次简单测试，新版模型在设备屏幕识别、场景适配的稳定性上，比旧版更好，能够适配各类设备的画面识别和智能交互操作。

三、文字能力提升：结合画面做出更全面判断

原本文字有小幅提升写这些基础操作给出相对靠谱的结果，能够和使用依托成熟的基础文本处理架构，Qwen3.7-plus模型的语义理解与逻辑分析能力得到小幅优化。该模型除支持日常对话、文案撰写、多语言翻译等基础功能外，还可完成专业内容解读、复杂问题梳理、多层级逻辑分析等复杂任务，输出结果具备稳定性与专业性，可适配日常学习、办公工作、基础专业研究等多元应用场景。

现在市面上大部分同类AI模型，只能简单识别图片和视频的表面内容，功能比较单一，实用性不高。这次更新最大的变化，就是让模型可以把画面内容和文字信息结合起来分析。不再只是单纯辨认画面里的东西，还能结合相关数据和信息读懂画面背后的内容和使用需求，解决了传统AI只能简单识图、无法深度解读内容的问题。

四、智能功能优化，实际使用场景更广泛

很多旧版AI模型只会单纯分析内容，没办法落地实际操作。Qwen3.7-plus针对性优化了这个问题，完善了整套智能处理流程。模型可以自主识别设备画面、梳理用户的使用需求，支持普通界面操作和代码操作两种模式，既适合普通人日常使用，也能满足技术人员的专业调试需求。

经过实际使用测试，这款模型可以独立完成简单项目的完整开发工作，从梳理需求、编写代码、测试优化到整理文档都能自主完成。同时它还能把设计图、实拍画面转换成可使用的代码，适用于网页制作、简易程序开发等场景，也能兼容市面上主流的智能工具框架。

在实际应用层面，该模型可以用于办公自动化、简易软件开发、智能设备运维、智能问答服务等多个领域。目前，这款Qwen3.7-plus模型已经正式上线阿里云开发平台，平台支持图片、视频、文本等多种内容输入方式，可为企业及开发者提供二次开发和场景落地的技术支撑，为简易智能应用的的搭建提供基础支持保障。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐