2026-06-18 — views

Waymo Driverソフトウェアアーキテクチャ——世界最大の自動運転フリートを支える六層スタックの徹底解説

Waymoのモジュール型六層スタック——知覚・世界モデリング・予測・計画・制御——は安全記録を支える技術的基盤だ。

物理AI基準シリーズ第42回：Waymo Driverソフトウェアアーキテクチャ

Waymo Driverは、世界最大の商業用完全無人運転フリートを動かす自律走行ソフトウェアスタックだ。2026年中頃時点で、Waymoはサンフランシスコ、ロサンゼルス、フェニックス、オースティンの4都市で毎週10万回超の無人運転ライドを提供しており、安全員は一切乗車していない。このソフトウェアがどのように設計されているかを理解することは、なぜこの安全記録が成立するのかを解読するうえで不可欠であり、Waymoがいかにして新都市にサービスを展開し、16年間の開発で何の技術的堀を積み上げてきたかを把握するための鍵でもある。本稿はシリーズ内のTesla FSDアーキテクチャ記事の技術的対照篇として位置づけられる。

Teslaのエンドツーエンドニューラルネットワーク——センサー入力から単一の学習モデルでステアリング・アクセル・ブレーキ指令を直接生成する構成——とは対照的に、Waymoのアーキテクチャは明示的なモジュール型だ。各層には明確に定義された入力・出力と、有界の故障モードが存在する。このモジュール化は偶然ではない。「安全員なしで商業運転できるほど形式的に検証可能なシステムをどう構築するか」という問いに対するWaymoの意図的な工学的回答なのだ。

第1節：六層スタックの詳細

業界では「五層」と簡略化されることが多いが、Waymoの実際のシステムではセンサー処理層と知覚層が分離されているため、正確には六層構成になる。

層	役割	Waymoのアプローチ	Teslaのアプローチ
1. センサー処理	生センサーデータ → 補正・較正済み点群と画像	LiDAR + カメラ + レーダー融合；独自センサー較正パイプライン	カメラのみ；リアルタイム画像処理；LiDARなし
2. 知覚	センサーデータ → 位置・速度付きオブジェクト（車両・歩行者・自転車・コーン）	マルチモーダル融合：LiDARが精密な三次元形状を、カメラが外見・色・テキストを、レーダーが速度を提供	カメラのみ；エンドツーエンドニューラルネットが画像ストリームから直接オブジェクトを予測
3. 世界モデリング	オブジェクト → 現在環境の意味地図（車線・信号・工事ゾーン）	HDマップ + リアルタイムセンサー更新；意味地図層が車線接続性・信号フェーズ・法的行動規則を保持	疎な地図またはマップなし；カメラから車線構造を推論するニューラルネットに依存
4. 予測	現在の世界状態 → 全エージェントの将来状態の確率分布	不確実性モデリング付き構造化軌跡予測；社会規範・交通慣行を考慮	エンドツーエンド：予測はポリシーネットワーク内に暗黙的に組み込まれ、独立モジュールではない
5. 計画	予測された将来状態 → Waymoの意図軌跡（経路 + 速度プロファイル）	多仮説計画：N本の候補軌跡を生成し、安全性・快適性・規則の観点からスコアリングして最適を選択	エンドツーエンド：計画はポリシーネットワーク内に暗黙的に組み込まれ、独立モジュールではない
6. 制御	意図軌跡 → ステアリング・アクセル・ブレーキ指令	モデル予測制御（MPC）：予測補償付きで計画軌跡を追従	エンドツーエンド：制御はポリシーネットワークから直接出力される

各層の役割分担は明確だ。LiDARはセンサー処理層で高精度な三次元形状情報を提供し、カメラは知覚層で意味情報（色・テキスト・オブジェクトカテゴリ）を補完し、レーダーは速度推定における独立した検証機能を果たす。このマルチモーダル融合により、単一センサーの故障が知覚層全体のクラッシュには直結しない。

第2節：モジュール型アーキテクチャが安全において重要な理由

各層は独立して検証可能だ。

知覚層の誤差は検出・限界付けが可能——LiDARとカメラがオブジェクトについて不一致を示した場合、そのオブジェクトを不確実としてフラグ立てできる；
予測層の誤差は定量化可能——予測した歩行者軌跡が実際の軌跡とどの程度一致したかを系統的に計測できる；
計画層はシミュレーション内でルールセットに対して形式検証可能——「この軌跡はいかなる状況でも交通法規に違反しないか」という問いに答えられる；
制御層は既知の基準軌跡に対して独立してテスト可能だ。

Teslaのエンドツーエンドアーキテクチャは単一のニューラルネットワークだ。利点はシンプルさと汎化能力の高さ；欠点は形式検証の困難さだ——「予測バグ」と「計画バグ」は独立したモジュールとして存在しないため、切り分けて検証できない。

商業規模での展開において、Waymoのモジュール型アプローチは三つの重要な能力を実現する。

層単位のデバッグ能力： 歩行者が誤分類された場合、その故障は知覚層に局所化される。ポリシーネットワーク全体を検証する必要はなく、エンジニアは知覚層の訓練データ・モデル重み・後処理ルールを直接修正できる。

層単位の安全モニタリング： 各層の出力が次の層に渡される前に、独立した安全チェッカーによる検証が可能だ。この階層型安全アーキテクチャにより、単一層の異常出力が下流に伝播する前に遮断・対処できる。

HDマップによるハード制約： マップはポリシーネットワークが上書きできない物理的真値を提供する——「この道路は一方通行」はハード制約であり、学習された選好ではない。リアルタイムの知覚結果とマップ情報が矛盾した場合、マップのハード制約層がシステムのコンプライアンス違反決定を阻止できる。

第3節：HDマップ——優位性と制約

側面	HDマップ（Waymo）	マップ不要（Tesla）
マッピング済みエリアでの安全性	高——マップが物理的真値を提供；センサー融合が時間的ギャップを補完	良好——ニューラルネットがマッピング済み・未済エリアを同等に処理
展開速度	遅——新都市ごとに数ヶ月のマッピングと検証が必要	速——FSDはTeslaが走行したことのある道路ならどこでも動作可能
工事・イベント対応	頻繁なマップ更新が必要；Waymoは専用マッピング車両を運用	ニューラルネットが動的に対応（マップ更新不要）
エッジケース対応	マッピング済みエリアで十分に対応；マップカバレッジ外では性能低下	訓練データに類似状況が含まれるかによる
マップ更新レイテンシ	フリートによるリアルタイム更新；大規模変更はバッチ更新	更新すべきマップなし

HDマップこそが、Waymoの新都市参入に通常6〜12ヶ月（est.）を要する根本的な理由だ。最初の車両が商業運行を開始する前に、マッピング・アノテーション・シミュレーションキャンペーンを完了しなければならない。これはWaymoの都市展開速度に対する構造的制約だが、同時にマッピング済みエリアにおける安全性能の核心的な源泉でもある。HDマップは計画層に揺るぎない意味的基盤を与える——車線接続トポロジー・法定速度制限・転回禁止・信号機位置——これらはオフラインで高精度に収集され、フリートからのリアルタイムフィードバックによって継続的に更新される。

第4節：シミュレーションパイプライン——Waymoのデータフライホイールへの回答

Waymoのシミュレーションエンジンは公式に「Carcraft」と呼ばれている。主要コンポーネントは以下の通りだ。

エージェント行動モデル： Waymoの実際の無人走行マイルを学習したモデルで、シミュレーション内にリアリスティックな人間ドライバー・自転車乗り・歩行者を配置するために使用される。

センサーシミュレーション： LiDAR・カメラ・レーダーの信号を物理ベースモデルでシミュレート——LiDARにはレイトレーシング、カメラにはニューラルラジアンスフィールド（est.）を採用。

シナリオ抽出： 車両ログからリアルワールドのエッジケースを抽出し、タグ付けしてシミュレーションに大規模挿入。これが実世界の低確率イベントを高密度の訓練シグナルに変換する核心メカニズムだ。

敵対的テスト： シミュレーションシステムが実際のデータでは極めてまれな最悪ケースシナリオを積極的に生成し、システムが最悪条件下でどう振る舞うかを強制テストする。

Waymoは毎日数十億マイルのシミュレーション走行を実行していると報告されている（est.）。実際の無人走行1マイルが抽出パイプラインを経て約1,000マイルのシミュレーション走行を生成するとされている（est.）。これがTeslaの50〜60億マイルの教師あり実走行データに対するWaymoの非対称な回答だ——実走行マイルは少ないが、高品質の目的指向シミュレーションで補完する。シミュレーションが提供できるのは、実道路データでは大量収集できないもの——任意の密度でのエッジケース生成と、任意の仮想状況に対する反事実的テストだ。

第5節：都市参入の六段階プロセス

第1段階：マッピングキャンペーン。 専用マッピング車両がLiDAR・カメラ・GPSの地上真値データを収集する（都市あたり推定3〜6ヶ月）。

第2段階：アノテーションと意味ラベリング。 マップ特徴に人手でラベルを付与——車線境界・信号機・横断歩道・一時停止標識など。この段階が世界モデリング層が依拠できる意味地図の品質を決定する。

第3段階：シミュレーションキャンペーン。 その都市固有のジオメトリと交通パターンに特有のエッジケースをシミュレーションで生成する。他都市で訓練された汎用モデルがこの段階で新都市の特性に適応・テストされる。

第4段階：シャドーモード・有人監督テスト。 Waymo車両が安全員の監視下で新都市内を走行し、すべての人的介入（解除イベント）が記録・分析される。この段階のデータが次段階の安全ケース構築に直接使用される。

第5段階：無人運転検証。 その都市の運行条件に対して安全性を証明する体系的な安全ケース構築（推定3〜6ヶ月）。

第6段階：商業ローンチ。 ジオフェンス設定されたサービスエリアで24時間365日の運行開始。

マッピング開始から商業ローンチまでの推定合計期間は都市あたり12〜24ヶ月だ。このタイムラインがWaymoとTeslaの競争上の非対称性の核心だ——Tesla FSDはTeslaが走行した道路ならどこでも動作可能だが、Waymoのすべてのサービス路線には事前に上記六段階の完了が必要になる。

第6節：二つのアーキテクチャ哲学の合理的な賭け

Waymoのアーキテクチャは意図的な工学的選択だ——展開は遅く、スケール化の難易度は高いが、形式的検証可能性とマッピング済みエリアにおける走行マイルあたりの安全性において構造的な優位性を持つ。Teslaのエンドツーエンドアプローチは対抗する賭けだ——展開速度は速く、形式的検証の難易度は高いが、理論上はるかに広い地理的範囲をカバーできる可能性がある。

どちらの選択も、各社の出発点と資本構成を踏まえれば合理的だ。Waymoはオリジナルのリサーチ文化とAlphabetの長期資本から成長し、検証可能性を最優先とするエンジニアリング文化を形成した。Teslaは何百万台もの販売済み車両というデータフライホイールを起点に、迅速な地理的カバレッジを最優先とするエンジニアリング路線を構築した。

本シリーズの次稿ではWaymo第6世代車両のハードウェアアーキテクチャに焦点を当て、新センサースイートの設計がこの六層ソフトウェアスタックの各層に具体的にどのような影響を与えるかを分析する。

このシリーズについて

本稿は物理AIベンチマークシリーズ第42回として、Waymo Driverの六層ソフトウェアアーキテクチャを技術的に解説した。本シリーズは自動運転・ロボット・産業自動化など物理AIシステムの実商業運用における検証可能な技術進歩を継続追跡する。「（est.）」と表示されたデータはすべて、Waymoの公式発表ではなく、公開情報・規制申請書類・サードパーティアナリストレポートを出典とする推計値だ。