Claude Opus 4.7 突袭发布:编程能力史诗级增强,SWE-bench Pro 达 64.3%
Claude Opus 4.7突袭发布:编程能力SWE-bench Pro达64.3%(+10.9%),金融分析登顶公开模型,视觉分辨率3x提升,新增自我验证机制,价格维持$5/$25不变。
·
北京时间 2026 年 4 月 17 日凌晨,Anthropic 正式推出 Claude Opus 4.7。距离 Opus 4.6 发布仅两个月,延续了 Anthropic 每两个月一次的稳定迭代节奏。
这一次没有发布会、没有预热,但更新内容足够硬核:编程能力史诗级增强、金融分析登顶、视觉分辨率翻三倍、新增自我验证机制——而且价格不变。
核心升级一览
- SWE-bench Pro: 53.4% → 64.3% (+10.9%)
- 金融分析:公开模型第一
- 图像分辨率:~800px → 2576px (3x)
- 自我验证:新增支持
- 定价:$5/$25,不变
编程能力:从"需要监督"到"放手让它干"
Opus 4.7 最核心的升级在软件工程领域。在权威编程基准 SWE-bench Pro 上,得分从 53.4% 飙升至 64.3%,直接刷新公开模型纪录。
这意味着:
- 复杂系统开发:能独立完成复杂系统架构设计
- Rust 项目构建:处理高难度编码任务所需的人工监督大幅减少
- 长任务稳定性:严谨、稳定地处理耗时较长的复杂任务
- 自我验证:输出结果前会自行设计验证机制,降低翻车率
早期用户评价:"感觉像一个更好的同事"——它甚至能反驳用户的错误指令,不再盲从。
📌 Anthropic 官方:这是首个能自主通过"隐含需求测试"的 Claude 模型——模型需自行推断所需工具或行动,而非被明确告知。
金融分析:公开模型第一名
除了编程,Opus 4.7 在金融分析代理专项测试中取得了全球公开大模型最高分。
多模态能力:图像分辨率翻三倍
视觉方面,Opus 4.7 支持边长最大 2576 像素的图像识别,是之前的三倍多。
一个隐藏的"神话":Mythos 模型
Anthropic 还透露了一个信息:Mythos 模型。这是一个能力远超 Opus 4.7 的"神话"级模型,但目前仅向少数顶级机构开放(包括苹果)。
定价与可用性
价格维持不变:输入 $5/百万token,输出 $25/百万token
Opus 4.7 已在 Claude.ai 和 API 上线。
对开发者的意义
- 更少人工介入:复杂任务可以放心交给 AI
- 更高可靠性:自我验证机制让输出质量更稳定
- 更广应用场景:金融分析能力让它不止于写代码
从"问答式 AI"到"协作式 AI",Opus 4.7 又往前迈了一大步。
本文由「维基框架」出品 | 官网:framewiki.com
更多推荐



所有评论(0)