Anthropic突袭!Claude Opus 4.7今日发布——编程提升13%、视觉暴涨3倍,但它不是最强的那个
Amazon Bedrock 的官方描述是:Opus 4.7 能"在更长的任务跨度上保持方向感",面对模糊指令时更能自行推进,在多步骤问题中需要更少的人工干预。更强的代码、更清晰的视觉、更长的自主任务能力。这正是 Claude Code 用户最想要的能力——更长的自主任务链,更少的中途卡死,更少的"让我重新理解一下你的需求"。Snowflake 的测试描述则是:"更像真正的智能体——更好的指令遵循

【导读】 Anthropic没有选择蛰伏——Claude Opus 4.7今日正式上线。更强的代码、更清晰的视觉、更长的自主任务能力。但有一件事你需要知道:这还不是Anthropic手里最厉害的牌。
2026年4月16日,Anthropic 正式发布 Claude Opus 4.7,这是迄今为止对外公开的最强 Opus 模型。它已全面上线 claude.ai、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Foundry。
没有拖延,没有预热,就是这么干脆。
核心数据一览
|
指标 |
Opus 4.7 |
Opus 4.6 |
提升幅度 |
|
CursorBench编程 |
70% |
58% |
+12点 |
|
93任务编程基准 |
— |
— |
+13% |
|
生产任务解决率 |
— |
— |
3倍 |
|
图像最高分辨率 |
3.75MP |
1.15MP |
3.3倍 |
|
视觉导航(无工具) |
79.5% |
57.7% |
+21.8点 |
|
API定价(输入/输出) |
25
per M tokens |
相同 |
不变 |
数字背后有一个隐藏陷阱,后文细说。
三大核心升级:哪里真的变强了
第一:编程,这是这次的主菜。
Anthropic 用"advanced software engineering"来定位 Opus 4.7,称其在"最难的任务上有特别明显的提升"。CursorBench 从 58% 跳到 70%,93个真实编程任务的通过率提升13%,生产环境任务解决率更是达到前代的3倍。
官方给出的承诺简洁而有力:你可以把最难的代码工作交给它,不需要一直盯着它。
这正是 Claude Code 用户最想要的能力——更长的自主任务链,更少的中途卡死,更少的"让我重新理解一下你的需求"。
第二:视觉,从瘸腿到正常人。
这是 Opus 4.7 变化最大的地方,也是最被低估的地方。
过去,Claude 的图像处理能力长期是块短板——最高支持 1.15 兆像素,碰上密集图表、高清截图、UI设计稿,经常看不清细节。
Opus 4.7 把这个上限拉到了 3.75 兆像素,视觉分辨率提升超过3倍。视觉导航准确率从 57.7% 跳到 79.5%。
实际意义:财务报告截图、产品UI分析、密集表格识别、电脑操控任务,Opus 4.7 终于能看清楚了。
第三:长任务,更稳、更持久。
Amazon Bedrock 的官方描述是:Opus 4.7 能"在更长的任务跨度上保持方向感",面对模糊指令时更能自行推进,在多步骤问题中需要更少的人工干预。
Snowflake 的测试描述则是:"更像真正的智能体——更好的指令遵循,更少监督下完成多步问题的能力。"
四个新功能,开发者需要知道
xhigh 努力级别: 新增最高档推理模式,针对最复杂的任务场景释放更深的思考资源。
/ultrareview(Claude Code): 新命令,触发超深度代码审查模式,专为高风险代码变更设计。
Auto 模式(Max用户): 系统自动根据任务复杂度调配算力,不再需要手动切换模型。
任务预算(公测): 允许用户为智能体任务设定资源上限,控制单次任务的token消耗边界——对企业级生产部署尤为关键。
那个价格的隐藏陷阱
Anthropic 对外宣称"价格与 Opus 4.6 完全一致":输入 25/M tokens。
听起来很好。但有一个细节被埋在了技术文档里:Opus 4.7 换用了新的分词器,相同内容可能产生多出 1.0 到 1.35 倍的 token 数量。
换算一下:你的每次请求账单可能在"价格不变"的情况下,实际花费悄悄涨了 10%~35%。
对个人用户几乎无感。但对于大规模调用 API 的企业和开发团队,这是需要重新跑一遍成本模型的信号。
它不是最强的——Mythos才是
这里有一个故事,需要单独说清楚。
Opus 4.7 是目前 对外公开可用 的最强 Claude 模型。但 Anthropic 手里还藏着一张牌,叫 Claude Mythos Preview——CNBC 报道称,Opus 4.7 明确"不如 Mythos 全面强大"。
Mythos 目前仅向 Project Glasswing 的合作伙伴开放。这个项目是 Anthropic 在今年4月初因 Mythos 展示出破解 OpenBSD 等高安全系统的能力后,紧急成立的漏洞协调响应机制。参与方包括 Amazon、Apple、Broadcom、Cisco、CrowdStrike、Microsoft 等。
换句话说:Opus 4.7 是你现在能用到的最好的 Claude,但 Anthropic 已经有了远比这更强的东西,只是还没准备好给所有人。
Opus 4.7 没有试图成为"全方位最强",而是在 Anthropic 的核心战场——代码、智能体、复杂任务——扎实地向前推进了一步。视觉能力的飞跃则是意外之喜,补上了长期以来的一块明显短板。
但真正值得关注的信号,不是 Opus 4.7 本身,而是它背后那个叫 Mythos 的影子。当 Anthropic 把最强模型先用来和全球顶级安全公司协调漏洞修复,而不是直接拿去刷榜,你就知道:这场游戏,Anthropic 已经在玩一个更大的局了。
#Claude #Anthropic #Opus4.7 #大模型 #AI编程 #Claude Code #AI安全
— 关注AI前沿,洞察未来 —
更多推荐



所有评论(0)