2026-06-09 — views

Anthropic 推出 Claude Fable 5：公众终于能用上的 Mythos 级前沿模型

为什么值得读一个前沿模型、两种发布：带安全护栏的公开版，与受限的完整版。定价、免费窗口与安全分类器回退机制，是开发者最该先确认的三件事。

Anthropic 发布 Claude Fable 5——首个公开可用的 Mythos 级模型，定价每百万 token 输入 $10／输出 $50；解除限制的 Mythos 5 仅开放给经审核的合作伙伴。

发布了什么

6 月 9 日，Anthropic 发布了两个本质上是同一回事的模型。Claude Fable 5 是公司的新旗舰——一个包裹着硬性安全分类器、向所有人开放的”Mythos 级”前沿模型。Claude Mythos 5 则是移除了网络安全护栏的同一个底层模型，仅限事先批准的组织使用：目前是 Project Glasswing 网络安全合作伙伴，之后还规划了面向生物研究者的信任访问计划，以及更广泛的网络安全信任层级。

命名本身就是这次公告的潜台词。Fable 源自拉丁文 fabula，与希腊文 mythos 同源——Anthropic 表示这两个名字的区别”主要在于安全护栏，而非底层能力”。这是 Mythos 级模型首次真正对公众开放；在此之前，这个层级一直藏在有限的预览计划之后。

Anthropic 摆上台面的数字

项目	数字
API 定价	每百万输入 token $10／每百万输出 token $50
对比 Mythos Preview 定价	不到一半
完全由 Fable 5 处理的会话	约 95%（约 5% 回退至 Opus 4.8）
越狱漏洞悬赏	超过 1,000 小时，未发现通用越狱
Stripe 案例	5,000 万行 Ruby 代码库一天内完成迁移（人工约需 2 个月）
蛋白质设计案例	约 10 倍加速；14 个靶点中 9 个产出强力候选
订阅计划可用性	6 月 9–22 日含在 Pro/Max/Team/Enterprise 内，之后需使用额度

对开发者来说，定价是头条。每百万 token $10/$50，Fable 5 的价格是 Opus 4.8 的两倍，但只有 Mythos Preview 收费的不到一半。Anthropic 显然把它定价成要让人真正大量使用，而不是浅尝辄止。

安全切分实际怎么运作

Fable 5 并不是更小或更笨的模型——它就是 Mythos 5 加上 AI 分类器，拦截三类请求：进攻性网络安全、双重用途的生物与化学，以及蒸馏企图（抽取能力去训练另一个模型）。当分类器触发时，该会话会默默改由 Claude Opus 4.8 接手，而不是直接拒绝。Anthropic 表示这种回退在不到 5% 的会话中触发，集中在与安全相关的工作。

根据公告，外部红队组织与超过 1,000 小时的漏洞悬赏都未能找到通用越狱，外部测试显示对有害的单轮网络攻击请求零配合。代价是：所有 Mythos 级流量——包括 Fable 5——都附带强制的 30 天保留期，Anthropic 表示仅用于安全与防御目的、绝不用于训练，人为访问会留下记录，且几乎所有情况下 30 天后即删除。

为什么这是开发者的新闻

如果你在交付软件，有三件事重要。第一，能力跃升瞄准的是长程任务。Cursor 的 CEO 称它是”CursorBench 上的最先进模型”，并说它”开启了一类过去够不着的长程问题”。GitHub 的 CPO 也呼应了自主性的说法。Stripe 一天完成 5,000 万行 Ruby 迁移这种数字，就算大幅打折，也会改变你规划重构项目的方式。

第二，免费窗口是真的，但很短。Pro、Max、Team 与按席位计费的 Enterprise 订阅用户，从 6 月 9 日到 6 月 22 日可直接使用 Fable 5；之后在 Anthropic 恢复容量之前需要使用额度。API 与按用量计费的 Enterprise 则立即可用。如果想在自己的工作负载上评估它，接下来两周是便宜的窗口。

第三，分类器回退是一种可能悄悄踩到的行为变化。如果你的产品涉及安全工具、漏洞分流或生物相关研究，一部分会话会悄悄改由 Opus 4.8 回答。这不是能在日志里用字符串匹配抓到的拒绝——而是换了一个模型在回答你。

值得点名的隐忧

早期的基准测试引言全来自发布合作伙伴，而发布伙伴的数字永远偏向美化。95%/5% 的分类器切分是整体平均；对一个以安全为主的团队，回退率可能高得多，让 Fable 5 对你买它来做的那种工作而言，实际上变成多绕几步的 Opus 4.8。而 30 天流量保留——即使有 Anthropic 的不用于训练承诺——在受监管的公司里，上线生产之前一定会是一场合规对话。

实务笔记

这周我会做的事：在免费窗口用固定的内部评测——从自己的代码库挑十张有代表性的长程工单——跑 Fable 5，以通过率、完成所需轮数、token 花费对比 Opus 4.8 计分。在每百万输出 token $50 的价位上，“更少轮数”的说法比纯粹质量更重要：三轮就完成的模型，可以赢过要九轮的便宜模型。我也会对回退机制加上监测：如果 API 有披露，就记录每个会话实际是哪个模型在回答，并把所有与安全相关的工作流标记为人工复查。我不会在 6 月 9–22 日的内含层级上建任何承重的东西——把它当成评估预算，然后用真实数字做决定。

被低估的视角

所有人都把这当成一次模型发布来读。更持久的转变其实是两层发布模式本身：一个训练出来的成品、两个只以护栏与访问政策区分的产品。如果这个模式站稳，“前沿访问”就会变成一种审查与合规产品，而不是能力产品——有趣的竞争会转移到谁掌控信任访问名单。尤其要盯着蒸馏分类器：它意味着前沿模型的公开版本现在会主动抵抗被当成别人训练的老师。这悄悄推高了每一家把策略建立在蒸馏领先者之上的实验室的快速跟随成本。