Claude Opus 4.7 突袭发布：编程能力史诗级增强，SWE-bench Pro 达 64.3%

JPST228

446人浏览 · 2026-04-17 11:07:55

JPST228 · 2026-04-17 11:07:55 发布

北京时间 2026 年 4 月 17 日凌晨，Anthropic 正式推出 Claude Opus 4.7。距离 Opus 4.6 发布仅两个月，延续了 Anthropic 每两个月一次的稳定迭代节奏。

这一次没有发布会、没有预热，但更新内容足够硬核：编程能力史诗级增强、金融分析登顶、视觉分辨率翻三倍、新增自我验证机制——而且价格不变。

核心升级一览

SWE-bench Pro: 53.4% → 64.3% (+10.9%)
金融分析：公开模型第一
图像分辨率：~800px → 2576px (3x)
自我验证：新增支持
定价：$5/$25，不变

编程能力：从"需要监督"到"放手让它干"

Opus 4.7 最核心的升级在软件工程领域。在权威编程基准 SWE-bench Pro 上，得分从 53.4% 飙升至 64.3%，直接刷新公开模型纪录。

这意味着：

复杂系统开发：能独立完成复杂系统架构设计
Rust 项目构建：处理高难度编码任务所需的人工监督大幅减少
长任务稳定性：严谨、稳定地处理耗时较长的复杂任务
自我验证：输出结果前会自行设计验证机制，降低翻车率

早期用户评价："感觉像一个更好的同事"——它甚至能反驳用户的错误指令，不再盲从。

📌 Anthropic 官方：这是首个能自主通过"隐含需求测试"的 Claude 模型——模型需自行推断所需工具或行动，而非被明确告知。

金融分析：公开模型第一名

除了编程，Opus 4.7 在金融分析代理专项测试中取得了全球公开大模型最高分。

多模态能力：图像分辨率翻三倍

视觉方面，Opus 4.7 支持边长最大 2576 像素的图像识别，是之前的三倍多。

一个隐藏的"神话"：Mythos 模型

Anthropic 还透露了一个信息：Mythos 模型。这是一个能力远超 Opus 4.7 的"神话"级模型，但目前仅向少数顶级机构开放（包括苹果）。

定价与可用性

价格维持不变：输入 $5/百万token，输出 $25/百万token

Opus 4.7 已在 Claude.ai 和 API 上线。

对开发者的意义

更少人工介入：复杂任务可以放心交给 AI
更高可靠性：自我验证机制让输出质量更稳定
更广应用场景：金融分析能力让它不止于写代码

从"问答式 AI"到"协作式 AI"，Opus 4.7 又往前迈了一大步。

本文由「维基框架」出品 | 官网：framewiki.com

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

一起动手学LangChain吧-从零创建一个agent

DeepSeek技术社区

从 0 吃透 Transformer：大模型背后的核心结构，一篇讲清

DeepSeek技术社区

从 PHP 到 AI + Golang，程序员自救转型手记（二十一）：网络请求封装优化

DeepSeek技术社区

所有评论(0)

查看更多评论

JPST228

@JPST228

已为社区贡献5条内容

Claude Opus 4.7 突袭发布：编程能力史诗级增强，SWE-bench Pro 达 64.3%

JPST228

核心升级一览

编程能力：从"需要监督"到"放手让它干"

金融分析：公开模型第一名

多模态能力：图像分辨率翻三倍

一个隐藏的"神话"：Mythos 模型

定价与可用性

对开发者的意义

所有评论(0)

温馨提示：您尚未绑定手机号

JPST228