阿里千问更新了旗下的Qwen3.7-plus多模态智能体模型,这是Qwen3.7系列的一次常规版本升级。这次更新主要针对平时使用AI时遇到的各种小问题,重点优化了图片视频识别、文字解读等基础功能,弥补了旧版本在图文搭配使用、实景智能操作上的不足,让这个模型可以更好用在办公、代码开发、日常聊天互动等场景中。

一、Qwen3.7-plus升级更新重点:注重实用,没有多余功能

这次版本更新没有添加花里胡哨的无用功能,所有优化内容都是围绕大家平时经常用到的场景来调整的。新版本保留了旧版原本的文字编辑、代码编写、工具调用等基础功能,主要对图文解读、视频画面识别、智能自主操作这几个方面做了改进。目前很多AI大模型的各项功能都是分开的,使用起来很不方便,贴合不了实际使用需求。Qwen3.7-plus把画面识别、内容解读、任务操作等功能串联在了一起,形成了完整的使用流程,更适合普通用户和行业工作人员日常使用。

传统AI和Qwen3.7-plus对比图

二、视觉功能升级:识图更精准,支持视频解析

在图片识别这块,这次的版本升级提升还是很明显的。对于办公常用的各类图片、文档、复杂表格和设计素材,模型的识别准确度变高了。就算是排版杂乱的文件、数据繁多的表格,或是画面有轻微遮挡的素材,模型都可以正常识别,提取出有用的信息,足够满足大家平时整理资料、统计数据、梳理内容的办公需求。

除此之外,模型处理视频动态画面的能力也有所提升。可以识别长短视频的画面变化、场景内容,以及不同画面之间的关联,能够看懂日常出行、办公操作、生活场景等各类真实动态画面。经过多次简单测试,新版模型在设备屏幕识别、场景适配的稳定性上,比旧版更好,能够适配各类设备的画面识别和智能交互操作。

三、文字能力提升:结合画面做出更全面判断

原本文字有小幅提升写这些基础操作给出相对靠谱的结果,能够和使用依托成熟的基础文本处理架构,Qwen3.7-plus模型的语义理解与逻辑分析能力得到小幅优化。该模型除支持日常对话、文案撰写、多语言翻译等基础功能外,还可完成专业内容解读、复杂问题梳理、多层级逻辑分析等复杂任务,输出结果具备稳定性与专业性,可适配日常学习、办公工作、基础专业研究等多元应用场景。

现在市面上大部分同类AI模型,只能简单识别图片和视频的表面内容,功能比较单一,实用性不高。这次更新最大的变化,就是让模型可以把画面内容和文字信息结合起来分析。不再只是单纯辨认画面里的东西,还能结合相关数据和信息读懂画面背后的内容和使用需求,解决了传统AI只能简单识图、无法深度解读内容的问题。

四、智能功能优化,实际使用场景更广泛

很多旧版AI模型只会单纯分析内容,没办法落地实际操作。Qwen3.7-plus针对性优化了这个问题,完善了整套智能处理流程。模型可以自主识别设备画面、梳理用户的使用需求,支持普通界面操作和代码操作两种模式,既适合普通人日常使用,也能满足技术人员的专业调试需求。

经过实际使用测试,这款模型可以独立完成简单项目的完整开发工作,从梳理需求、编写代码、测试优化到整理文档都能自主完成。同时它还能把设计图、实拍画面转换成可使用的代码,适用于网页制作、简易程序开发等场景,也能兼容市面上主流的智能工具框架。

在实际应用层面,该模型可以用于办公自动化、简易软件开发、智能设备运维、智能问答服务等多个领域。目前,这款Qwen3.7-plus模型已经正式上线阿里云开发平台,平台支持图片、视频、文本等多种内容输入方式,可为企业及开发者提供二次开发和场景落地的技术支撑,为简易智能应用的的搭建提供基础支持保障。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐