构建 AI Agent 工作流的软件团队,正全力推动前沿模型向更长时间的无监督任务演进。Anthropic 今日正式推出 Claude Opus 4.7,专为软件工程、多模态处理以及模型自主执行多步骤复杂任务而优化,在指令遵循精度上实现突破性提升。

Anthropic has unveiled its new Claude Opus 4.5 model

Anthropic has unveiled its new Claude Opus 4.5 model

Claude Opus 4.7 全面可用 新版本已覆盖所有 Claude 产品线及 API 接口,支持 Amazon BedrockGoogle Cloud Vertex AI 和 Microsoft Foundry 等主流平台。定价策略与 Opus 4.6 完全一致:输入每百万 token 5 美元,输出每百万 token 25 美元。

版本升级亮点 相比 Opus 4.6,Opus 4.7 在高级软件工程领域取得显著突破,尤其擅长处理高难度、长周期任务。它能够严谨、一致地执行复杂指令,并在输出结果前自主设计验证机制,确保任务可靠完成。

以下是典型的 AI Agent 多步骤工作流示意图,Opus 4.7 正以此类自主执行能力为核心优化方向:

What is Agent Engineering: How Modern AI Agents Are Built

What is Agent Engineering: How Modern AI Agents Are Built

视觉处理能力重大升级 Opus 4.7 支持长边最高 2,576 像素(约 375 万像素)的图像输入,处理能力较前代提升三倍以上。这一突破让模型能轻松应对计算机操作 Agent 读取密集屏幕截图、从复杂图表提取数据,以及需要像素级精度的参考作业等高难度场景。

分辨率提升是模型层面的原生改进,通过 API 传输的图像将自动获得更高保真度处理若无需极致细节,用户可在传输前对图像进行降采样,以有效控制 token 消耗。

以下为复杂图表数据提取的典型可视化示例,直观展示新分辨率带来的能力飞跃:

How Reducto is building SOTA chart extractions | Reducto

指令遵循机制优化 值得现有部署团队特别关注的是:Opus 4.7 将严格按照字面指令执行,而前代模型可能出现宽松解释或部分忽略的情况。因此,建议团队及时调整提示词设计和控制逻辑,以充分发挥新模型的优势。

文件系统记忆功能大幅增强 模型现可在跨会话的长期工作中保留关键记录,并利用这些信息驱动后续任务,显著降低前置上下文需求,提升 Agent 持久化工作效率。

以下为 AI 长时序记忆工作流示意图,清晰展现 Opus 4.7 在持久化记忆方面的优化:

Decoding Memory layers from Scratch in AI Agents | by Vamshi nagireddy |  Medium

Decoding Memory layers from Scratch in AI Agents | by Vamshi nagireddy | Medium

网络安全控制与验证计划 本次发布充分体现 Anthropic 在 AI 安全风险研究上的前瞻布局。Opus 4.7 是首个在较低性能模型上测试新型网络安全防护机制的版本,为后续 Mythos 级模型全面发布积累宝贵经验。

模型虽未达到 Mythos Preview 的安全水准,但已在训练中通过差异化降级技术进行针对性处理。内置防护机制可自动检测并拦截涉及禁用或高风险网络安全用途的请求。这些实际部署数据将直接指导未来 Mythos 模型的发布策略。

从事漏洞研究渗透测试和红队演练等合法网络安全工作的专业人士,可申请加入 Anthropic 新推出的网络安全验证计划。

以下为 AI 网络安全防护的直观示意图:

Download Ai Generated, Cybersecurity, Digital Shield. Royalty-Free Stock  Illustration Image - Pixabay

Download Ai Generated, Cybersecurity, Digital Shield. Royalty-Free Stock Illustration Image - Pixabay

安全性能评估 Opus 4.7 在欺骗行为、阿谀倾向和滥用协助等方面的风险率与 Opus 4.6 持平。在诚实度与抗恶意提示注入攻击指标上有所提升,但在管制物质危害规避建议的详细程度方面略有退步。

Anthropic 校准评估认为:“该模型总体表现可靠且值得信赖,但行为模式尚未达到完全理想状态。”内部评测显示,Mythos Preview 仍是当前对齐度最高的模型。完整安全评估详见《Claude Opus 4.7 系统说明文档》。

迁移注意事项 从 Opus 4.6 升级时需注意 token 消耗变化:新版采用改进的分词器相同输入内容的 token 数量约为原版的 1.0-1.35 倍(视内容类型而定)。在 Agent 场景中,模型会投入更多计算资源进行深度思考,虽显著提升复杂问题解决可靠性,但会相应增加输出 token 数量。

Anthropic 内部编码测试证实,在所有运算层级上token 使用效率均实现正向优化。

总结 Claude Opus 4.7 的发布,为 AI Agent 工作流团队带来了更强大、更可靠、更安全的长时序自主执行能力。无论是视觉多模态处理、严格指令遵循,还是持久化记忆与安全防护,都已全面就绪,助力开发者构建下一代智能系统。建议立即体验并优化现有部署方案,迎接 AI 工程新时代!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐