北京时间 2026 年 4 月 17 日凌晨,Anthropic 正式推出 Claude Opus 4.7。距离 Opus 4.6 发布仅两个月,延续了 Anthropic 每两个月一次的稳定迭代节奏。

这一次没有发布会、没有预热,但更新内容足够硬核:编程能力史诗级增强、金融分析登顶、视觉分辨率翻三倍、新增自我验证机制——而且价格不变

核心升级一览

  • SWE-bench Pro: 53.4% → 64.3% (+10.9%)
  • 金融分析:公开模型第一
  • 图像分辨率:~800px → 2576px (3x)
  • 自我验证:新增支持
  • 定价:$5/$25,不变

编程能力:从"需要监督"到"放手让它干"

Opus 4.7 最核心的升级在软件工程领域。在权威编程基准 SWE-bench Pro 上,得分从 53.4% 飙升至 64.3%,直接刷新公开模型纪录。

这意味着:

  • 复杂系统开发:能独立完成复杂系统架构设计
  • Rust 项目构建:处理高难度编码任务所需的人工监督大幅减少
  • 长任务稳定性:严谨、稳定地处理耗时较长的复杂任务
  • 自我验证:输出结果前会自行设计验证机制,降低翻车率

早期用户评价:"感觉像一个更好的同事"——它甚至能反驳用户的错误指令,不再盲从。

📌 Anthropic 官方:这是首个能自主通过"隐含需求测试"的 Claude 模型——模型需自行推断所需工具或行动,而非被明确告知。

金融分析:公开模型第一名

除了编程,Opus 4.7 在金融分析代理专项测试中取得了全球公开大模型最高分。

多模态能力:图像分辨率翻三倍

视觉方面,Opus 4.7 支持边长最大 2576 像素的图像识别,是之前的三倍多。

一个隐藏的"神话":Mythos 模型

Anthropic 还透露了一个信息:Mythos 模型。这是一个能力远超 Opus 4.7 的"神话"级模型,但目前仅向少数顶级机构开放(包括苹果)。

定价与可用性

价格维持不变:输入 $5/百万token,输出 $25/百万token

Opus 4.7 已在 Claude.ai 和 API 上线。

对开发者的意义

  1. 更少人工介入:复杂任务可以放心交给 AI
  2. 更高可靠性:自我验证机制让输出质量更稳定
  3. 更广应用场景:金融分析能力让它不止于写代码

从"问答式 AI"到"协作式 AI",Opus 4.7 又往前迈了一大步。


本文由「维基框架」出品 | 官网:framewiki.com

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐