2026-06-09 — views
Anthropic 推出 Claude Fable 5:大眾終於摸得到的 Mythos 級前沿模型
為什麼值得讀 一個前沿模型、兩種發布:有安全護欄的公開版,與受限的完整版。定價、免費期間與安全分類器回退機制,是開發者最該先確認的三件事。
Anthropic 發布 Claude Fable 5——首個公開可用的 Mythos 級模型,定價每百萬 token 輸入 $10/輸出 $50;解除限制的 Mythos 5 僅開放給審核過的合作夥伴。
發布了什麼
6 月 9 日,Anthropic 發布了兩個本質上是同一回事的模型。Claude Fable 5 是公司的新旗艦——一個包覆著硬性安全分類器、向所有人開放的「Mythos 級」前沿模型。Claude Mythos 5 則是移除了網路安全護欄的同一個底層模型,僅限事先核准的組織使用:目前是 Project Glasswing 網路安全合作夥伴,之後還規劃了面向生物研究者的信任存取計畫,以及更廣泛的網路安全信任層級。
命名本身就是這次公告的潛台詞。Fable 源自拉丁文 fabula,與希臘文 mythos 系出同源——Anthropic 表示這兩個名字的區別「主要在於安全護欄,而非底層能力」。這是 Mythos 級模型首次真正對公眾開放;在此之前,這個層級一直藏在有限的預覽計畫之後。
Anthropic 端出的數字
| 項目 | 數字 |
|---|---|
| API 定價 | 每百萬輸入 token $10/每百萬輸出 token $50 |
| 對比 Mythos Preview 定價 | 不到一半 |
| 完全由 Fable 5 處理的工作階段 | 約 95%(約 5% 回退至 Opus 4.8) |
| 越獄漏洞懸賞 | 超過 1,000 小時,未發現通用越獄 |
| Stripe 案例 | 5,000 萬行 Ruby 程式碼庫一天內完成遷移(人工約需 2 個月) |
| 蛋白質設計案例 | 約 10 倍加速;14 個標的中 9 個產出強力候選 |
| 訂閱方案可用性 | 6 月 9–22 日含在 Pro/Max/Team/Enterprise 內,之後需使用額度 |
對開發者來說,定價是頭條。每百萬 token $10/$50,Fable 5 的價格是 Opus 4.8 的兩倍,但只有 Mythos Preview 收費的不到一半。Anthropic 顯然把它定價成要讓人真正大量使用,而不是淺嚐即止。
安全切分實際怎麼運作
Fable 5 並不是更小或更笨的模型——它就是 Mythos 5 加上 AI 分類器,攔截三類請求:攻擊性網路安全、雙重用途的生物與化學,以及蒸餾企圖(抽取能力去訓練另一個模型)。當分類器觸發時,該工作階段會默默改由 Claude Opus 4.8 接手,而不是直接拒絕。Anthropic 表示這種回退在不到 5% 的工作階段中觸發,集中在與安全相關的工作。
根據公告,外部紅隊組織與超過 1,000 小時的漏洞懸賞都未能找到通用越獄,外部測試顯示對有害的單輪網路攻擊請求零配合。代價是:所有 Mythos 級流量——包括 Fable 5——都附帶強制的 30 天保留期,Anthropic 表示僅用於安全與防禦目的、絕不用於訓練,人為存取會留下紀錄,且幾乎所有情況下 30 天後即刪除。
為什麼這是開發者的新聞
如果你在出貨軟體,有三件事重要。第一,能力躍升瞄準的是長時程工作。Cursor 的 CEO 稱它是「CursorBench 上的最先進模型」,並說它「開啟了一類過去搆不著的長時程問題」。GitHub 的 CPO 也呼應了自主性的說法。Stripe 一天完成 5,000 萬行 Ruby 遷移這種數字,就算大幅打折,也會改變你規劃重構專案的方式。
第二,免費期間是真的,但很短。Pro、Max、Team 與按席位計費的 Enterprise 訂閱用戶,從 6 月 9 日到 6 月 22 日可直接使用 Fable 5;之後在 Anthropic 恢復容量之前需要使用額度。API 與按用量計費的 Enterprise 則立即可用。如果想在自己的工作負載上評估它,接下來兩週是便宜的窗口。
第三,分類器回退是一種可能默默踩到的行為變化。如果你的產品涉及安全工具、漏洞分流或生物相關研究,一部分工作階段會悄悄改由 Opus 4.8 回答。這不是能在日誌裡用字串比對抓到的拒絕——而是換了一個模型在回答你。
值得點名的隱憂
早期的基準測試引言全來自發布合作夥伴,而發布夥伴的數字永遠偏向美化。95%/5% 的分類器切分是整體平均;對一個以安全為主的團隊,回退率可能高得多,讓 Fable 5 對你買它來做的那種工作而言,實際上變成多繞幾步的 Opus 4.8。而 30 天流量保留——即使有 Anthropic 的不用於訓練承諾——在受監管的公司裡,上線生產之前一定會是一場合規對話。
實務筆記
這週我會做的事:在免費期間用固定的內部評測——從自己的程式碼庫挑十張代表性的長時程工單——跑 Fable 5,以通過率、完成所需輪數、token 花費對比 Opus 4.8 計分。在每百萬輸出 token $50 的價位上,「更少輪數」的說法比純粹品質更重要:三輪就完成的模型,可以贏過要九輪的便宜模型。我也會對回退機制加上監測:如果 API 有揭露,就記錄每個工作階段實際是哪個模型在回答,並把所有與安全相關的工作流程標記為人工複查。我不會在 6 月 9–22 日的內含層級上蓋任何承重的東西——把它當成評估預算,然後用真實數字做決定。
被低估的視角
所有人都把這當成一次模型發布來讀。更持久的轉變其實是兩層發布模式本身:一個訓練出來的成品、兩個只以護欄與存取政策區分的產品。如果這個模式站穩,「前沿存取」就會變成一種審查與合規產品,而不是能力產品——有趣的競爭會轉移到誰掌控信任存取名單。尤其要盯著蒸餾分類器:它意味著前沿模型的公開版本現在會主動抵抗被當成別人訓練的老師。這悄悄推高了每一家把策略建立在蒸餾領先者之上的實驗室的快速跟隨成本。
來源
- Claude Fable 5 and Claude Mythos 5 — Anthropic ↗
- Anthropic's Claude Fable 5 is a version of Mythos the public can access today — TechCrunch ↗