Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5——首个正式开放(GA)的 Mythos 级模型,输入 $10/百万 token、输出 $50/百万 token,价格正好是 Claude Opus 4.8 的 2 倍。本文基于 Anthropic 官方公告、API 文档、定价页、迁移指南以及 AWS 发布博客整理,数据核验时间 2026 年 6 月 10 日。

先给结论:Fable 5 是给"Opus 4.8 做不动的那 10-20% 高难任务"准备的专用顶配,不是全量替换。 按解题成本算,常规任务上 Opus 4.8 更便宜,前沿难度任务上 Fable 5 反而是最便宜的。

一、这次发布的是"一个模型、两个名字"

Fable 5 和 Mythos 5 是同一个底层模型,唯一区别是安全分类器:

模型 API ID 谁能用 区别
Claude Fable 5 claude-fable-5 所有人,GA 分类器开启;高风险请求回落到 Opus 4.8 回答
Claude Mythos 5 claude-mythos-5 仅 Project Glasswing 认证伙伴 同一模型,网络安全限制解除,价格同为 $10/$50
Claude Mythos Preview claude-mythos-preview 2026 年 4 月起邀请制 研究预览版,即将退役;官方称 Fable 5 价格"不到它的一半"

一个数字解释这个双模型策略:ExploitBench(漏洞利用开发基准)上 Mythos 5 拿 78%,Opus 4.8 只有 40%。公开版主动路由掉的能力,正是认证版专门提供给防御方的能力。

二、定价:每一项费率都是 Opus 4.8 的 2.0 倍

缓存和批量费率首日同步公布,没有出现很多团队预期的"首日费率缺口":

费率项 Fable 5 Opus 4.8 倍数
基础输入 $10.00 $5.00 2.0×
5 分钟缓存写入 $12.50 $6.25 2.0×
1 小时缓存写入 $20.00 $10.00 2.0×
缓存读取 $1.00 $0.50 2.0×
输出 $50.00 $25.00 2.0×
批量输入(5 折) $5.00 $2.50 2.0×
批量输出(5 折) $25.00 $12.50 2.0×
最小可缓存 prompt 512 token 1,024 token Fable 可缓存更短的 prompt

三个会影响实际账单的细节:

  1. 无长上下文加价。 官方定价文档原话:"900k token 请求与 9k token 请求按相同单价计费。" 对比 Gemini 3.1 Pro 超过 200K 后输入价直接翻倍($2→$4),Fable 5 在长上下文场景悄悄缩小了差距。

  2. 分词器是 Opus 4.7 那一代。 同样文本比 4.7 之前的 Claude 模型多产出约 30%(最高 35%)token。跟 Opus 4.8 对比是同口径,跟你历史 Opus 4.5 时代的账单对比不是。

  3. 没有 fast mode。 而 Opus 4.8 的 fast mode 定价恰好也是 $10/$50——同样的钱,买速度还是买智力,二选一。

三、Benchmark:任务越难,差距越大

全部为 Anthropic 官方发布的 launch eval,独立复测还没出来,建议把"差值"当信号、别把绝对分数当真理:

基准 Fable 5 Opus 4.8 GPT-5.5 Gemini 3.1 Pro
SWE-Bench Pro 80.3% 69.2% 58.6% 54.2%
FrontierCode 29.3% 13.4% 5.7% 未公布

SWE-Bench Pro 上领先 11.1 个百分点,有意义但属于渐进式;FrontierCode(生产级长任务)上 29.3% vs 13.4%,完成任务数翻倍还多,这才是卖点。

客户侧数据同方向:Stripe 报告用 Fable 5 一天完成 5000 万行 Ruby 代码库迁移(人工估算约两个月);Davis Polk 律师盲评中每次都选 Fable 的合同修订版本;Anaconda 报告每个 effort 档位都赢 Opus 4.8 且快 25-30%。共 14 家具名客户,全部是厂商口径,未经审计。

四、API 三个破坏性变更(迁移必看)

  1. 自适应思考永远开启。 thinking: {"type": "disabled"} 直接报错。替代杠杆是 effort 参数:low / medium / high / xhigh / max 五档,默认 high。官方迁移指南明确说:就算你在 Opus 4.8 上跑的是 xhigh,迁过来也先从 high 起步。注意 max_tokens 现在同时封顶"思考+回复"总量,原来按裸回复设的输出预算会被截断。

  2. 拒答返回 HTTP 200。 拒答不是错误码,而是正常响应里带 stop_reason: "refusal"stop_details.category 标注触发的分类器:"cyber""bio""reasoning_extraction" 或 null。按 HTTP 状态码写的错误处理拦不住它,必须显式检查 stop_reason。计费规则:没产出就拒答 = $0;流式中途触发 = 输入 + 已流出的部分照常计费。

  3. 回落机制有独立账单逻辑。 被分类器标记的请求由 Opus 4.8 回答,按 Opus 价格($5/$25)计费;对话中途触发则前段按 Fable 价、后段按 Opus 价。beta 的 fallbacks 参数只在 Claude API 和 Claude Platform on AWS 上做服务端自动重试,Batch API、Bedrock、Vertex、Foundry 上要靠 SDK 中间件(TS/Python/Go/Java/C#)在客户端处理。

原始思维链永远不返回(thinking.display 默认 omitted,可设 summarized);prefill、手动思考预算、采样参数依旧 400,和 4.7/4.8 一致。Claude Code 里有 /claude-api migrate 命令可以自动完成整个代码库的模型替换和参数改造。

五、安全机制与合规代价

官方数据:触发安全分类器的会话不足 5%。但要注意几个实际影响:

  • 误伤已经出现。 Hacker News 发布帖里有开发者报告 MRI 脑分割代码、蚊媒疟疾研究都被当成生物风险标记。官方文档对生物领域研究者的措辞很直接:预计几乎所有请求都会回落,后续会开 Biology Trusted Access Program。

  • 工作区上下文也能触发。 Claude Code 文档确认:会话第一条请求就可能触发回落,因为它携带 CLAUDE.md、目录名、git status 等上下文——安全工具仓库或生物材料仓库光靠上下文就能踩线。claude --safe-mode 可以剥离自定义内容做诊断。

  • 强制 30 天数据保留。 Fable 5 / Mythos 5 被指定为 Covered Model,输入输出强制保留 30 天,零保留(ZDR)协议不适用,没有任何变通。合规上要求 ZDR 的业务(法务、医疗、受监管金融),这个模型直接出局,比价格更硬。

  • 越狱测试。 外部漏洞赏金累计 1000+ 小时没产出通用越狱,但官方公告自己承认英国 AI 安全研究所在初测中"取得了接近通用越狱的进展"。

独立批评里最尖锐的来自 Interconnects 的 Nathan Lambert:蒸馏分类器部分通过"prompt 修改、转向向量或参数高效微调"这类不可见手段干预,而非可见拒答。他的原话:"一个会自动变笨且不通知我的 AI 模型,是范畴意义上的未对齐 AI。"

六、值不值 2 倍价:按解题成本算

代表性 agentic 任务(输入 100K + 输出 20K token)单次成本:Fable $2.00、Opus $1.00、GPT-5.5 $1.10。除以各自基准通过率后:

难度档 Fable 5 Opus 4.8 GPT-5.5 结论
SWE-Bench Pro 档(常规偏难) $2.49 $1.45 $1.88 Opus 4.8 每解最便宜
FrontierCode 档(前沿难度) $6.83 $7.46 $19.30 Fable 5 每解最便宜

交叉点就是全部决策:常规任务 Opus 解题率够高,2 倍价差守得住;前沿任务 Opus 失败太频繁,重试吃掉省下的钱。按任务难度路由,不要按价格忠诚度路由。

车队规模粗算:每月 5000 万输入 + 1000 万输出 token,Fable 5 月账单 $1,000 vs Opus 4.8 的 $500。一年 $6,000 差价,只有当更高完成率每周帮你省下约一小时工程师复核时间时才回本。

社区实测两边都有:有人报告 Fable 用更少轮次完成任务、diff "更克制更外科手术",甚至有人称 token 用量约一半(如属实,实际成本接近 Opus 持平);也有 Max 订阅用户单日跑出 $82.92 等效 API 用量。方差本身就是结论:先用一周做计量,再决定迁移车队流量。

七、可用性速查

  • Claude API:claude-fable-5,6 月 9 日 GA

  • Amazon Bedrock:anthropic.claude-fable-5(全球端点加 global. 前缀),美东 + 斯德哥尔摩;缓存最小值保持 1,024 token

  • Vertex AI / Microsoft Foundry:claude-fable-5,GA

  • GitHub Copilot:同日 GA

  • Claude Code:/model fable,要求 v2.1.170+,任何套餐都不是默认模型;ZDR 账户下直接隐藏

  • OpenRouter:anthropic/claude-fable-5,透传 $10/$50

  • Claude.ai 订阅侧:Pro/Max/Team/按席 Enterprise 6 月 9-22 日免费含用,6 月 23 日起改为消耗用量额度

最终建议

把 Fable 5 用在 Opus 4.8 失败率高到让你付重试和复核成本的那 10-20% 前沿难度任务上;其余流量留在 Opus 4.8 和 Sonnet 4.6;ZDR 约束的流量完全别碰它。缓存和批量折扣按精确 2 倍 Opus 费率平移,缓存重的工作负载迁移不会有费率惊喜。官方 benchmark 等独立复测,但解题成本的方向性结论对误差不敏感。


完整英文版(含全部 16 个来源链接、FAQ、可用性矩阵):Claude Fable 5 Review 2026: Pricing, Benchmarks, vs Opus 4.8 - TokenMix Blog

数据来源:Anthropic 官方公告与 API 文档(定价页、迁移指南、模型总览)、AWS News Blog、TechCrunch、The Decoder、CNBC、GitHub Changelog、OpenRouter、Hacker News 发布帖、Interconnects。竞品价格与 OpenAI、Google 官方公示价交叉核对,核验时间 2026-06-10。作者:TokenMix Research Lab(探针),追踪 300+ 大模型定价与 API 可用性。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐