国产AI卷疯了!Manus横空出世,阿里开源QwQ-32B!
AI 界永不停歇,闹钟没把我吵醒,但各种AI产品把我从床上炸了起来……:一个号称全球首个通用 AI Agent 的产品 Manus 横空出世,主打自主执行复杂任务,整理数据、规划行程等能力。它的出现,是否意味着 AI 助手真正向智能代理迈进?:阿里开源的 32B 参数模型,在多个基准测试上媲美 DeepSeek-R1,但参数量仅为其 1/20。更小的模型,如何实现更高的推理能力?让我们来看看到底发
AI 界永不停歇,闹钟没把我吵醒,但各种AI产品把我从床上炸了起来……
昨晚,两个重要的 AI 进展引发了广泛关注:
-
Manus:一个号称全球首个通用 AI Agent 的产品 Manus 横空出世,主打自主执行复杂任务,整理数据、规划行程等能力。它的出现,是否意味着 AI 助手真正向智能代理迈进?
-
QwQ-32B:阿里开源的 32B 参数模型,在多个基准测试上媲美 DeepSeek-R1,但参数量仅为其 1/20。更小的模型,如何实现更高的推理能力?
让我们来看看到底发生了什么。
一、Manus
北京时间 3 月 6 日凌晨,AI 界迎来一位狠角色:Manus!
Manus 到底是什么?
简单来说,以前的 AI 只会聊天,Manus 直接帮你把事做了。
-
AI 助手(ChatGPT / Claude): 你问它问题,它给你答案。
-
AI Agent(Manus): 你给它一个任务,它独立思考、规划、执行,最后把完整结果交到你手上。
朋友都调侃到,它不只是 AI 助手,而是AI 实习生。大家都在想,会不会被它取代了。
Manus 的硬核案例
1、可以快速市场调研
让它调研一下AI眼镜。它快速的逐一搜索网络上的信息。
最后生成一个清晰的表格,在短短的几分钟之内干了,别人可能几小时的活:
用户的问题,它不是直接给个答案,而是像人一样做调研,产出报告,比如介绍下小米:
它会像人一样工作,搜索素材,整理材料,最后产出一个报告,给你一个压缩包。
打开一看,好家伙 PPT 这样就有了。
2、制作个性化的课程
我想让它帮我制作一个交互式的关于Transformers的课程。
它通过一系列搜索,加上编写代码,最后它生成了一个网站可供我进行交互式的学习。
没错,这个网站不是它从网上找的,而是根据我的需求,直接帮我生成一个交互式学习 Transformers 的网站…
除了这些,Manus 还能做旅行规划、保险对比、供应商采购、财报分析等等。
Manus 官网 & 如何体验?目前仍需邀请码
说了这么多,肯定已经心动了。可惜的是,Manus目前还是邀请制,想用还得排队。
官网地址
https://manus.im/
想尝鲜的朋友,建议尽早去申请 waitlist。
但是让我们再客观的思考一下 Manus 真的有那么神吗?
Manus 背后的公司—— Monica.im,其实是一个“缝合怪”高手。
Manus 的核心能力 = Compute Use + 虚拟机 + Artifacts + 内置多个 Agent,更像是一个高度整合的 AI 工作流工具,而非真正的通用 AI Agent。
它可能会像 AI 搜索一样,探索新的通用模式,但门槛更高,不一定能快速成为大众可用的产品。
如果 AI 继续进化,很多通用 Agent 的能力未来可能会被更强的大模型吞并,而 AI 领域的其他公司(如 Coze、Dify)也可能会推出类似产品,竞争将更加激烈。
Manus 的确是 AI Agent 方向的重要探索,但它距离真正的「万能 AI 助手」还有很长的路要走。
二、阿里 QwQ-32B 发布
阿里 Qwen 团队也憋了个大招:QwQ-32B 大模型正式开源!
这个(QwQ)听起来像个表情包,但实力炸裂。
QwQ-32B 参数量仅 320 亿,但在多个测试基准上,直接媲美 6710 亿参数的 DeepSeek-R1 甚至部分任务还略胜一筹。
其中的秘密武器就是强化学习(Reinforcement Learning)!
从下面图表中我们可以清晰地看到,在 AIME24 和 IFEval 等关键基准测试中,QwQ-32B 的表现相当或者略微超过了参数量巨大的 DeepSeek-R1! 而在其他基准测试中,也基本与 DeepSeek-R1 持平,远超其他对比模型。
QwQ-32B 的黑科技:
-
冷启动 + RL 训练:从预训练模型出发,用 RL 提高推理能力
-
结果导向奖励机制:不依赖传统的奖励模型,而是直接根据任务结果(数学、代码推理直接用“正确率”评分)
-
比传统预训练方法更高效、更精准!
如何体验 QwQ-32B?
开源地址(免费体验)
- Hugging Face:
https://huggingface.co/Qwen/QwQ-32B
- ModelScope:
https://modelscope.cn/models/Qwen/QwQ-32B
- Qwen Chat:
https://chat.qwen.ai
甚至,ollama 也已经集成了 QwQ-32B,直接运行:
ollama pull qwq
我先尝尝鲜了,有什么好玩的地方,再给大家分享。
意义在哪?
-
以前,想跑个大模型,少说得几块 A100 显卡。
-
现在,32B 模型用 24G 显存 + 16 核 CPU + 64G 内存就能跑!
-
本地推理模型的时代,真的来了!
2025 年,AI 正在加速改变世界,甚至改变我们的日常工作方式。
你觉得未来 AI Agent 会让哪些工作消失?你最期待 AI 帮你做什么?
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!
更多推荐
所有评论(0)