Claude Fable 5 深度解读：$10/$50 定价、SWE-Bench Pro 80.3%、与 Opus 4.8 的成本对比

qq_42720852

483人浏览 · 2026-06-10 11:50:21

qq_42720852 · 2026-06-10 11:50:21 发布

Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5——首个正式开放（GA）的 Mythos 级模型，输入 $10/百万 token、输出 $50/百万 token，价格正好是 Claude Opus 4.8 的 2 倍。本文基于 Anthropic 官方公告、API 文档、定价页、迁移指南以及 AWS 发布博客整理，数据核验时间 2026 年 6 月 10 日。

先给结论：Fable 5 是给"Opus 4.8 做不动的那 10-20% 高难任务"准备的专用顶配，不是全量替换。 按解题成本算，常规任务上 Opus 4.8 更便宜，前沿难度任务上 Fable 5 反而是最便宜的。

一、这次发布的是"一个模型、两个名字"

Fable 5 和 Mythos 5 是同一个底层模型，唯一区别是安全分类器：

模型	API ID	谁能用	区别
Claude Fable 5	claude-fable-5	所有人，GA	分类器开启；高风险请求回落到 Opus 4.8 回答
Claude Mythos 5	claude-mythos-5	仅 Project Glasswing 认证伙伴	同一模型，网络安全限制解除，价格同为 $10/$50
Claude Mythos Preview	claude-mythos-preview	2026 年 4 月起邀请制	研究预览版，即将退役；官方称 Fable 5 价格"不到它的一半"

一个数字解释这个双模型策略：ExploitBench（漏洞利用开发基准）上 Mythos 5 拿 78%，Opus 4.8 只有 40%。公开版主动路由掉的能力，正是认证版专门提供给防御方的能力。

二、定价：每一项费率都是 Opus 4.8 的 2.0 倍

缓存和批量费率首日同步公布，没有出现很多团队预期的"首日费率缺口"：

费率项	Fable 5	Opus 4.8	倍数
基础输入	$10.00	$5.00	2.0×
5 分钟缓存写入	$12.50	$6.25	2.0×
1 小时缓存写入	$20.00	$10.00	2.0×
缓存读取	$1.00	$0.50	2.0×
输出	$50.00	$25.00	2.0×
批量输入（5 折）	$5.00	$2.50	2.0×
批量输出（5 折）	$25.00	$12.50	2.0×
最小可缓存 prompt	512 token	1,024 token	Fable 可缓存更短的 prompt

三个会影响实际账单的细节：

无长上下文加价。 官方定价文档原话："900k token 请求与 9k token 请求按相同单价计费。" 对比 Gemini 3.1 Pro 超过 200K 后输入价直接翻倍（$2→$4），Fable 5 在长上下文场景悄悄缩小了差距。
分词器是 Opus 4.7 那一代。 同样文本比 4.7 之前的 Claude 模型多产出约 30%（最高 35%）token。跟 Opus 4.8 对比是同口径，跟你历史 Opus 4.5 时代的账单对比不是。
没有 fast mode。 而 Opus 4.8 的 fast mode 定价恰好也是 $10/$50——同样的钱，买速度还是买智力，二选一。

三、Benchmark：任务越难，差距越大

全部为 Anthropic 官方发布的 launch eval，独立复测还没出来，建议把"差值"当信号、别把绝对分数当真理：

基准	Fable 5	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-Bench Pro	80.3%	69.2%	58.6%	54.2%
FrontierCode	29.3%	13.4%	5.7%	未公布

SWE-Bench Pro 上领先 11.1 个百分点，有意义但属于渐进式；FrontierCode（生产级长任务）上 29.3% vs 13.4%，完成任务数翻倍还多，这才是卖点。

客户侧数据同方向：Stripe 报告用 Fable 5 一天完成 5000 万行 Ruby 代码库迁移（人工估算约两个月）；Davis Polk 律师盲评中每次都选 Fable 的合同修订版本；Anaconda 报告每个 effort 档位都赢 Opus 4.8 且快 25-30%。共 14 家具名客户，全部是厂商口径，未经审计。

四、API 三个破坏性变更（迁移必看）

自适应思考永远开启。 thinking: {"type": "disabled"} 直接报错。替代杠杆是 effort 参数：low / medium / high / xhigh / max 五档，默认 high。官方迁移指南明确说：就算你在 Opus 4.8 上跑的是 xhigh，迁过来也先从 high 起步。注意 max_tokens 现在同时封顶"思考+回复"总量，原来按裸回复设的输出预算会被截断。
拒答返回 HTTP 200。 拒答不是错误码，而是正常响应里带 stop_reason: "refusal"，stop_details.category 标注触发的分类器："cyber"、"bio"、"reasoning_extraction" 或 null。按 HTTP 状态码写的错误处理拦不住它，必须显式检查 stop_reason。计费规则：没产出就拒答 = $0；流式中途触发 = 输入 + 已流出的部分照常计费。
回落机制有独立账单逻辑。 被分类器标记的请求由 Opus 4.8 回答，按 Opus 价格（$5/$25）计费；对话中途触发则前段按 Fable 价、后段按 Opus 价。beta 的 fallbacks 参数只在 Claude API 和 Claude Platform on AWS 上做服务端自动重试，Batch API、Bedrock、Vertex、Foundry 上要靠 SDK 中间件（TS/Python/Go/Java/C#）在客户端处理。

原始思维链永远不返回（thinking.display 默认 omitted，可设 summarized）；prefill、手动思考预算、采样参数依旧 400，和 4.7/4.8 一致。Claude Code 里有 /claude-api migrate 命令可以自动完成整个代码库的模型替换和参数改造。

五、安全机制与合规代价

官方数据：触发安全分类器的会话不足 5%。但要注意几个实际影响：

误伤已经出现。 Hacker News 发布帖里有开发者报告 MRI 脑分割代码、蚊媒疟疾研究都被当成生物风险标记。官方文档对生物领域研究者的措辞很直接：预计几乎所有请求都会回落，后续会开 Biology Trusted Access Program。
工作区上下文也能触发。 Claude Code 文档确认：会话第一条请求就可能触发回落，因为它携带 CLAUDE.md、目录名、git status 等上下文——安全工具仓库或生物材料仓库光靠上下文就能踩线。claude --safe-mode 可以剥离自定义内容做诊断。
强制 30 天数据保留。 Fable 5 / Mythos 5 被指定为 Covered Model，输入输出强制保留 30 天，零保留（ZDR）协议不适用，没有任何变通。合规上要求 ZDR 的业务（法务、医疗、受监管金融），这个模型直接出局，比价格更硬。
越狱测试。 外部漏洞赏金累计 1000+ 小时没产出通用越狱，但官方公告自己承认英国 AI 安全研究所在初测中"取得了接近通用越狱的进展"。

独立批评里最尖锐的来自 Interconnects 的 Nathan Lambert：蒸馏分类器部分通过"prompt 修改、转向向量或参数高效微调"这类不可见手段干预，而非可见拒答。他的原话："一个会自动变笨且不通知我的 AI 模型，是范畴意义上的未对齐 AI。"

六、值不值 2 倍价：按解题成本算

代表性 agentic 任务（输入 100K + 输出 20K token）单次成本：Fable $2.00、Opus $1.00、GPT-5.5 $1.10。除以各自基准通过率后：

难度档	Fable 5	Opus 4.8	GPT-5.5	结论
SWE-Bench Pro 档（常规偏难）	$2.49	$1.45	$1.88	Opus 4.8 每解最便宜
FrontierCode 档（前沿难度）	$6.83	$7.46	$19.30	Fable 5 每解最便宜

交叉点就是全部决策：常规任务 Opus 解题率够高，2 倍价差守得住；前沿任务 Opus 失败太频繁，重试吃掉省下的钱。按任务难度路由，不要按价格忠诚度路由。

车队规模粗算：每月 5000 万输入 + 1000 万输出 token，Fable 5 月账单 $1,000 vs Opus 4.8 的 $500。一年 $6,000 差价，只有当更高完成率每周帮你省下约一小时工程师复核时间时才回本。

社区实测两边都有：有人报告 Fable 用更少轮次完成任务、diff "更克制更外科手术"，甚至有人称 token 用量约一半（如属实，实际成本接近 Opus 持平）；也有 Max 订阅用户单日跑出 $82.92 等效 API 用量。方差本身就是结论：先用一周做计量，再决定迁移车队流量。

七、可用性速查

Claude API：claude-fable-5，6 月 9 日 GA
Amazon Bedrock：anthropic.claude-fable-5（全球端点加 global. 前缀），美东 + 斯德哥尔摩；缓存最小值保持 1,024 token
Vertex AI / Microsoft Foundry：claude-fable-5，GA
GitHub Copilot：同日 GA
Claude Code：/model fable，要求 v2.1.170+，任何套餐都不是默认模型；ZDR 账户下直接隐藏
OpenRouter：anthropic/claude-fable-5，透传 $10/$50
Claude.ai 订阅侧：Pro/Max/Team/按席 Enterprise 6 月 9-22 日免费含用，6 月 23 日起改为消耗用量额度

最终建议

把 Fable 5 用在 Opus 4.8 失败率高到让你付重试和复核成本的那 10-20% 前沿难度任务上；其余流量留在 Opus 4.8 和 Sonnet 4.6；ZDR 约束的流量完全别碰它。缓存和批量折扣按精确 2 倍 Opus 费率平移，缓存重的工作负载迁移不会有费率惊喜。官方 benchmark 等独立复测，但解题成本的方向性结论对误差不敏感。

完整英文版（含全部 16 个来源链接、FAQ、可用性矩阵）：Claude Fable 5 Review 2026: Pricing, Benchmarks, vs Opus 4.8 - TokenMix Blog

数据来源：Anthropic 官方公告与 API 文档（定价页、迁移指南、模型总览）、AWS News Blog、TechCrunch、The Decoder、CNBC、GitHub Changelog、OpenRouter、Hacker News 发布帖、Interconnects。竞品价格与 OpenAI、Google 官方公示价交叉核对，核验时间 2026-06-10。作者：TokenMix Research Lab（探针），追踪 300+ 大模型定价与 API 可用性。