Skip to content
AI-Daily-Builder

2026-06-09 views

Anthropic が Claude Fable 5 を出荷:一般ユーザーがついに触れる Mythos 級フロンティアモデル

読む理由 一つのフロンティアモデルに二つのリリース形態:ガードレール付きの公開版と、制限付きの完全版。ビルダーがまず確認すべきは価格、無料期間、安全分類器のフォールバック挙動だ。

Anthropic が初の一般公開 Mythos 級モデル Claude Fable 5 をリリース。価格は 100 万トークンあたり入力 $10/出力 $50。制限解除版 Mythos 5 は審査済みパートナー限定。

何が出荷されたか

6 月 9 日、Anthropic は、中身としては同じものである二つのモデルをリリースした。Claude Fable 5 は同社の新しいフラッグシップで、ハードな安全分類器に包まれ、誰でも利用できる「Mythos 級」フロンティアモデルだ。Claude Mythos 5 はサイバーセキュリティのガードレールを外した同一の基盤モデルで、事前承認された組織に限定される。現時点では Project Glasswing のサイバーセキュリティパートナーが対象で、生物学研究者向けの信頼アクセスプログラムと、より広いサイバーセキュリティ向け信頼アクセス層が計画されている。

命名自体がこの発表の静かなテーゼだ。Fable はラテン語の fabula に由来し、ギリシャ語の mythos と同根——Anthropic は両者の名前の違いは「基盤能力ではなく、主としてセーフガードによるもの」だと述べている。Mythos 級モデルが一般に公開されるのはこれが初めてで、これまでこの階層は限定プレビューの向こう側にあった。

Anthropic が提示した数字

項目数値
API 価格入力 100 万トークン $10/出力 100 万トークン $50
Mythos Preview 価格との比較半分以下
Fable 5 だけで完結するセッション約 95%(約 5% は Opus 4.8 にフォールバック)
ジェイルブレイク・バグバウンティ1,000 時間超、ユニバーサルな脱獄は未発見
Stripe の事例5,000 万行の Ruby コードベース移行を 1 日で完了(手作業なら約 2 か月)
タンパク質設計の事例約 10 倍の加速;14 ターゲット中 9 つで有力候補
サブスクリプションでの提供6 月 9–22 日は Pro/Max/Team/Enterprise に込み、以降は使用クレジット制

ビルダーにとっての見出しは価格だ。100 万トークンあたり $10/$50 という Fable 5 は Opus 4.8 の 2 倍だが、Mythos Preview の課金の半分以下に収まっている。Anthropic は明らかに、味見ではなく本気で使い倒されることを想定した値付けをしている。

安全分割は実際どう機能するか

Fable 5 は小さいモデルでも賢くないモデルでもない——Mythos 5 に AI ベースの分類器を載せたものであり、分類器は三つのカテゴリのリクエストを遮断する:攻撃的サイバーセキュリティ、デュアルユースの生物学・化学、そして蒸留の試み(能力を抽出して別モデルの学習に使う行為)だ。分類器が作動すると、そのセッションは単純に拒否するのではなく、静かに Claude Opus 4.8 へ委譲される。Anthropic によれば、このフォールバックは全セッションの 5% 未満で発生し、セキュリティ隣接の作業に集中するという。

発表によれば、外部レッドチーム組織と 1,000 時間超のバグバウンティはユニバーサルな脱獄を発見できず、外部テストでは有害な単一ターンのサイバー攻撃リクエストへの応諾はゼロだった。トレードオフは、Fable 5 を含むすべての Mythos 級トラフィックに強制的な 30 日間の保持期間が付くことだ。Anthropic はこれを安全と防御の目的にのみ使い、学習には決して使わず、人間によるアクセスはログに残り、ほぼすべてのケースで 30 日後に削除されるとしている。

なぜこれがビルダーのニュースなのか

ソフトウェアを出荷しているなら、重要なのは三つ。第一に、能力の跳躍は長期ホライズンの作業を狙っている。Cursor の CEO はこれを「CursorBench における最先端モデル」と呼び、「これまで手が届かなかった一群の長期ホライズン問題を切り開いた」と述べた。GitHub の CPO も自律性の主張に同調した。Stripe の「5,000 万行の Ruby 移行を 1 日で」という数字は、大幅に割り引いて見ても、リファクタリング案件の見積もり方を変える類のものだ。

第二に、無料期間は本物だが短い。Pro、Max、Team、シート課金 Enterprise のサブスクリプションユーザーは 6 月 9 日から 6 月 22 日まで Fable 5 を追加費用なしで使える。それ以降は Anthropic がキャパシティを回復するまで使用クレジットが必要になる。API と従量課金 Enterprise は即日利用可能だ。自分のワークロードで評価したいなら、この 2 週間が安価な窓だ。

第三に、分類器フォールバックは静かに踏みうる挙動変化だ。プロダクトがセキュリティツール、脆弱性トリアージ、生物学隣接の研究に触れるなら、一部のセッションはいつの間にか Opus 4.8 が答えていることになる。これはログを文字列マッチで拾える拒否ではない——別のモデルが回答しているのだ。

名指しすべき注意点

初期のベンチマーク評は全てローンチパートナーからのもので、ローンチパートナーの数字は常に実態より美しい。95%/5% という分類器の比率は全体平均であり、セキュリティ中心のチームではフォールバック率がはるかに高くなりうる。そうなると Fable 5 は、まさにそのために買った仕事に対して、手数の増えた Opus 4.8 と実質変わらなくなる。そして 30 日間のトラフィック保持は——Anthropic の「学習に使わない」誓約があっても——規制下の企業では本番投入前に必ずコンプライアンス協議の議題になる。

実務メモ

今週やるとしたら:無料期間中に固定の社内評価を回す——自分のリポジトリから代表的な長期ホライズンのチケットを 10 件選び、合格率、完了までのターン数、トークン消費を Opus 4.8 と比較して採点する。出力 100 万トークン $50 の価格帯では、「少ないターン数」の主張が純粋な品質より重要だ:3 ターンで終わるモデルは、9 ターンかかる安いモデルに勝てる。フォールバックの計測も仕込む:API が公開しているなら各セッションで実際に答えたモデルを記録し、セキュリティ関連のワークフローはすべて人間のレビュー対象としてフラグを立てる。6 月 9–22 日の同梱ティアの上に本番の重みを載せるものは作らない——評価予算として扱い、実数で判断する。

見落とされがちな視点

誰もがこれをモデルリリースとして読んでいる。より持続的な変化は二層リリースというパターンそのものだ:一つの学習済み成果物を、セーフガードとアクセスポリシーだけで区別された二つの製品にする。これが定着すれば、「フロンティアアクセス」は能力の製品ではなく審査とコンプライアンスの製品になり、興味深い競争は信頼アクセスのリストを誰が握るかに移る。特に蒸留分類器に注目してほしい。フロンティアモデルの公開版が、他者の学習の教師として使われることに能動的に抵抗するようになったということだ。これは、リーダーの蒸留に戦略を賭けてきたすべてのラボにとって、ファストフォロワーのコストを静かに引き上げる。


ソース

タグ

チップ