2026-06-08 — views

マイクロソフトが自社製コーディングモデルを GitHub Copilot に投入：MAI-Code-1-Flash がビルダーにとって意味するもの

読む理由 GitHub Copilot に入り浸っているなら、今週カーソル下のデフォルトモデルが密かに変わっているかもしれない。実際に何が出荷され、どう見分けるかを解説する。

マイクロソフトは Build 2026 で 5B の自社製コーディングモデルを VS Code に投入し、35B の推論モデルも出荷した——いずれも OpenAI の蒸留なしで訓練。

何が出荷されたか

6 月 2 日にサンフランシスコで開催された Build 2026 で、マイクロソフトはこれまでやったことのないことをした。完全に自社で構築し、OpenAI のものを含むいかなる第三者モデルからも蒸留していない基盤モデルを、VS Code 上の GitHub Copilot ユーザーのカーソル下に直接投入したのだ。

2 つのモデルが発表された。ほとんどのビルダーが最初に触れるのは MAI-Code-1-Flash、50 億パラメータのコーディングモデルで、同日から Visual Studio Code のデフォルトモデルの 1 つとして順次展開が始まり、モデルピッカーと自動（「auto」）ピッカーの両方に表示される。基調講演では初期展開を全ユーザーの約 10% としていた。2 つ目は MAI-Thinking-1、350 億のアクティブパラメータ（マイクロソフトは総数を約 1 兆としている）と 256,000 トークンのコンテキストウィンドウを持つスパースな Mixture-of-Experts 推論モデルで、同社いわく、600 ページの文書を 1 回で読めるほど大きい。こちらは Microsoft Foundry 経由のプライベートプレビューで、OpenRouter、Fireworks、Baseten を通じても配布されている。

実務者にとっての見出しはパラメータ数ではない。この小型モデルが日常のエージェント的コーディング向けのより安く、より無駄のないデフォルトとして位置づけられ、しかも数百万人が毎朝開くツールにすでに入り込んでいる、という点だ。

マイクロソフトが掲げた数字

マイクロソフトは MAI-Code-1-Flash を主に Anthropic の Claude Haiku 4.5 と対比してベンチマークした——フロンティア対フロンティアの誇示ではなく、「小型で高速」という同格の比較だ。

指標	MAI-Code-1-Flash	比較対象
パラメータ数	5B	—
SWE-Bench Pro	51.2%	Claude Haiku 4.5：35.2%
SWE-Bench Verified でのトークン使用量	最大 60% 削減	従来手法と比較
指示追従（IF Bench）	+28.9 ポイントの差	Claude Haiku 4.5 と比較
MAI-Thinking-1、AIME 25	97%	—
MAI-Thinking-1、SWE-Bench Pro	53%	—

私が丸を付けるのは「最大 60% のトークン削減」という主張だ。インタラクティブなループ——オートコンプリート、エージェントのステップ、繰り返されるツール呼び出し——の中で動くことを意図した小型モデルにとって、トークン効率は複利で効く。トークンが少なければステップごとの遅延が下がり、タスクごとのコストも下がる。マイクロソフトはこれを「トークンあたりのリターン」の向上とまとめた。SWE-Bench Pro で 51% を取りつつ、明らかに少ないトークンしか使わない 5B モデルは、ルーティンな編集というロングテールにとって信頼できるデフォルトだ——たとえ難しい 5% では、より大きなモデルに手を伸ばすとしても。

なぜこれが単なるマイクロソフトの話ではなく、ビルダーの話なのか

ソフトウェアを出荷するなら、3 つのことが重要だ。

第一に、デフォルトが変わった。Copilot の自動モデル選択を使っているなら、あなたの補完の一部は今や、動いていると思っていたものではなく、マイクロソフトのモデルを経由しているかもしれない。挙動の変化をデバッグして自分のプロンプトのせいにする前に、知っておく価値がある。

第二に、「蒸留なし」という打ち出しは調達上のシグナルであり、マーケティングの空語ではない。マイクロソフトは「エンタープライズグレードで、クリーンかつ商用ライセンスされたデータ来歴」を、第三者モデルからの蒸留ゼロで、と繰り返し強調した。規制対象あるいは知財に敏感な文脈にいるチームにとって、訓練データの出所はますます購買基準になりつつある。ベンダーがデータ来歴を保証する用意のあるモデルは、しないモデルより法務を通しやすい。

第三に、戦略的背景は本物の多様化だ。TechTimes によれば、これは 2026 年 4 月にマイクロソフトと OpenAI のパートナーシップが改定され、マイクロソフトの OpenAI 知財に対する独占ライセンスが終了したのを受けたものだ。マイクロソフトは OpenAI を切り捨てているわけではない——Azure はいまもそれらのモデルを提供している——が、いまや Foundry を、モデル選択の上に立つオーケストレーション層として位置づけ、自社のファーストパーティモデルを数ある選択肢の 1 つとしている。ビルダーにとって、カーブの小型側に信頼できるファーストパーティの選択肢が増えることは、通常、価格への下押し圧力と、ベンダー交渉でのより大きな交渉力を意味する。

名指ししておくべき落とし穴

5B モデルはフロンティアモデルではないし、マイクロソフトは比較対象を慎重に選んだ。Claude Haiku 4.5 は小型で安価な階層であり、旗艦ではない。SWE-Bench Pro でそれを上回るのは、その重量級としては本物の成果だが、厄介な複数ファイルのリファクタリングで MAI-Code-1-Flash が Sonnet 級や GPT 級のモデルにどう対峙するかについては何も語らない。SWE-Bench でのベンチマーク勝利も、雑然としたプライベート monorepo に接触すると必ずしも生き残らない。51.2% は「これは強力なデフォルトだ」と受け取り、「これがあなたの重量級モデルを置き換える」とは受け取らないことだ。

実務メモ

今週、私が実際にやること：VS Code を開き、Copilot のモデルピッカーを確認し、MAI-Code-1-Flash が提供されているか、あるいは自動ピッカーですでに選択されているかを見る。もしそうなら、ルーティンの補完や小さな編集ではオンのままにする——トークン効率の話は、まさに高速な小型モデルが本領を発揮する場所だ——が、アーキテクチャレベルや複数ファイルの変更を黙って任せることはしない。それらには明示的に大きなモデルをピン留めする。また、どんなベンダーのベンチマークも信用する前に、自分の内部評価を回す。自分の repo から代表的なチケットを 10 件固定で取り、合格率とトークン消費でスコア付けする方が、私の実コストを予測するには、どんな SWE-Bench の数字よりも優れている。MAI-Thinking-1 のプレビューは、具体的な長文コンテキストの推論タスクと、その商用ライセンスの訓練ストーリーが実際に解決するエンタープライズのデータ来歴要件がない限り、手を付けずにおく。

見落とされがちな視点

誰もがこれを「マイクロソフト対 OpenAI」と読んでいる。ビルダーにとってより興味深い変化は、小型で自社所有のデフォルトの台頭だ。IDE を握る会社が、その内部で自動選択される安価なモデルも出荷するとき、エージェント的コーディングの経済性は移動する。補完の限界費用は、第三者 API のマージンではなく、ホスト自身の推論コストへと近づいていく。これは流通を握る者に有利だ。このパターンが続くなら——ファーストパーティの小型モデルが Copilot 全体でデフォルトとして組み込まれ、おそらく他の IDE 所有者からも同様の動きがあるなら——競争の戦場は「リーダーボードで最良のモデル」であることをやめ、「すでに開発者が働く場所に座っている、許容できる中で最も安いモデル」になる。独立系のモデルベンダーは、デフォルトの枠が押さえられ、彼らの突破口がその小型デフォルトにはできない難しいタスク——それが今や無料でこなすルーティンなものではなく——になる世界に備えて計画を立てるべきだ。