2026-06-18 — views
フィジカルAIシミュレーションとテスト——テスラ シャドーモード vs Waymo CarCraft:10億マイル規模のAV検証
CarCraft: 150億模擬マイル/日;テスラ影子モード: 600万FSD車両から実世界信号を収集。両者がAV安全論証に不可欠。
フィジカルAIベンチマークシリーズ 第148回——フィジカルAIシミュレーション・テストインフラ:テスラ シャドーモード vs Waymo CarCraft
シミュレーションは自動運転開発における秘密兵器だ。歩行者が自動運転車の前で赤信号を無視するシナリオは、実世界では約100万マイルに1回(推定値)しか発生しない。このシナリオについて統計的な安全確信度を確立するのに十分な回数をテストするには、1つのエッジケースあたり何年もの走行が必要となる。シミュレーションはこのタイムラインを劇的に短縮する:WaymoのCarCraftは1日150億マイルのシミュレーションを実行し(Waymo公開開示)、数十年分の実世界エッジケース蓄積を毎晩の継続的な演算に凝縮する。テスラのシャドーモードは補完的なアプローチを取る——約600万台(推定値)のFSD対応車両を公道上の継続的な実世界センサーアレイとして活用し、ドライバーの判断がFSDの計画行動と乖離するすべてのトリップから信号を収集する。
本記事はフィジカルAIベンチマークシリーズ第148回として、シミュレーションが自動運転開発に不可欠な理由、テスラとWaymoがいかに根本的に異なるシミュレーションアーキテクチャを構築したか、シミュレーションと現実のギャップが各社の安全論証に何を意味するか、そしてどのアプローチがどの次元で優れているかを総合的にベンチマークする。
「(推定値)」と表示されたすべての数値は、独立して検証された一次データではなく、公開開示、業界調査、アナリスト推計、および報告されたデータから導出されている。本記事は投資アドバイスを構成しない。
第1節——シミュレーションが自動運転開発に不可欠な理由
| 課題 | 実世界テストの限界 | シミュレーション解決策 | 規模的優位性 |
|---|---|---|---|
| 稀なエッジケース | 歩行者が自動運転車の前で赤信号を無視するシナリオは約100万マイルに1回(推定値);実世界でのテストはシナリオごとに年単位が必要 | シミュレーションは数時間でパラメータ変化を伴いそのシナリオを数百万回生成できる | 稀なイベントで1000倍以上の速度優位 |
| 障害注入テスト | センサー障害(カメラ遮蔽、LiDAR遮断)を公道で安全にテストできない | シミュレーションはいつでも任意のセンサー障害を注入でき、知覚劣化に対するシステム応答をテスト | 実世界では不可能な安全テスト |
| 回帰テスト | AVソフトウェア変更後、既存シナリオを壊していないことを確認するには全過去テストケースを再実行する必要がある | シミュレーションはコード変更後に全テストシナリオを自動再実行;AVのためのCI/CD | 継続的デプロイ検証 |
| 反事実テスト | 「車両が0.5秒早くブレーキをかけていたら何が起きたか?」実際の事故を再実行できない | シミュレーションはパラメータ変化を伴う任意の事故を再生;事故調査を支援 | 事後学習の加速 |
| 規模 | テスラは約600万台のFSD車両(推定値);Waymoは約2,500台(推定値) | シミュレーションは実効テスト車隊を100〜1000倍に乗算 | Waymoは特に小規模な実世界車隊を補うためシミュレーションに依存 |
| 新規シナリオ生成 | 人間ドライバーとスタントパフォーマーで一部のシナリオを生成できる;高コストで低速 | プロシージャル生成で無限のシナリオバリアント(照明、天候、歩行者密度、車両構成)を作成 | 無限のシナリオ多様性 |
実マイルとシミュレーションのどちらかだけでは不十分な理由
実マイルが代替不可能な根本的な理由がある:実世界はいかなるシミュレーションチームも予測しなかった真に新規のシナリオを生み出す。人間の運転行動、道路インフラの故障、予期しない環境条件は、野外でしか現れないエッジケースを生み出す。どれほど精巧であってもシミュレーションは、人間の設計者またはプロシージャルジェネレーターがパラメータ化したシナリオしかテストできない。実世界はすべてのシミュレーションシナリオが最終的に検証される基準真実だ。
一方、必要な統計的信頼水準を達成するために実マイルのみに依存することも現実的ではない。RAND Corporationの研究は、AVが死亡率において人間ドライバーより優れた安全性を統計的に実証するには約110億マイルの走行が必要と推定した。1台あたり1日100マイルとすると、1万台の車隊でも約30年(推定値)かかる。シミュレーションはその検証タイムラインを圧縮する唯一の信頼できる手段だ。
正しいアーキテクチャは両方を使用する:実世界の走行で新規シナリオを発見し基準真実の検証を提供し、シミュレーションで発見されたシナリオを徹底的にテストし、あらゆるコード変更にわたる回帰テストを実施し、公道でテストするには危険すぎるか稀すぎる敵対的エッジケースを生成する。
第2節——テスラ シャドーモード:アーキテクチャと規模
| 要素 | 詳細 | 備考 |
|---|---|---|
| シャドーモードとは? | テスラFSDはFSD対応のすべての車両でドライバーの行動と並行してサイレント実行;FSDの判断と実際のドライバー行動を比較;乖離を記録 | FSDが有効なすべてのテスラが継続的なシャドーモードデータポイント;約600万台(推定値)のすべてのトリップ |
| 規模(推定値) | 約600万台のFSD車隊(推定値)全体で1日数百万回のシャドーモード比較 | AV業界で最大規模の実世界シャドーモードデータセット、桁違いに |
| シャドーモードが検出するもの | FSDがドライバーと異なる判断をしたはずのケース;FSDがより強くブレーキをかけたはず、より早く曲がったはず、等 | すべてのFSD乖離がFSDの誤りを示すわけではない;一部はFSDがドライバーより保守的なケース;ラベリングには人間のレビューが必要 |
| シャドーモードにおけるDojoの役割 | Dojoは大規模にシャドーモード動画クリップを処理;FSDを人間ドライバーの行動に一致またはそれを超えるよう訓練 | シャドーモードデータ→Dojo訓練→より良いFSD→より良いシャドーモード信号——フライホイール |
| 限界:基準真実の品質 | シャドーモードはシミュレーションではなく実世界のセンサーデータを使用;しかし「基準真実」は最適行動ではなくドライバー行動 | ドライバー行動が訓練信号;ドライバーが間違えると、FSDはその間違いから学習 |
| 自動ラベリングパイプライン | テスラの4Dラベリング(空間+時間)はニューラルネットワークを使用して動画フレームを自動ラベリング;人間のラベリングコストを削減 | 自動ラベリングの規模により数百万時間の動画処理が可能;人間のレビューはエッジケースに集中 |
| シミュレーション vs シャドーモード | テスラは両方使用;シャドーモードは実世界のエッジケースを提供;シミュレーションは変化を伴い大規模に再実行 | 補完的:実世界がシナリオを特定;シミュレーションが徹底的にテスト |
| 介入データ | FSDの強制介入(ドライバーが引き継ぐ)のたびに訓練信号;介入率は年間で約半減(推定値) | 介入率はシャドーモード、Dojo、シミュレーションが共同で最適化している出力指標 |
シャドーモードのフライホイール効果
テスラのシャドーモードは、同等のインストール済み車隊規模なしにはいかなる競合他社も複製困難な自己強化改善ループを生み出す。テスラ約600万台(推定値)のFSD対応車両が毎日生み出す実世界のシャドーデータは、世界中のその他のAVプログラムがその全歴史で蓄積したデータを桁違いに上回る。
第3節——Waymo CarCraft:アーキテクチャと規模
| 要素 | 詳細 | 備考 |
|---|---|---|
| CarCraftとは? | Waymoの社内シミュレーション環境;車両エージェント、歩行者、自転車利用者、エッジケースシナリオを含む都市全体の環境を大規模にシミュレーション | WaymoはCarCraftを公開開示;世界で最も高度なAVシミュレーション環境の1つと説明される |
| 規模 | Waymoは1日約150億模擬マイルの実行を開示(Waymo開示) | 1日150億模擬マイル vs 1日約5万実マイル(推定値)= 約30万倍のシミュレーション乗数 |
| 忠実度アプローチ | 車両の高忠実度物理シミュレーション;その他エージェント(歩行者、自転車利用者、他車両)の行動モデリング | エージェント行動モデリングがWaymoの主要差別化要因;他のエージェントはランダムではなくリアルに振る舞う |
| シナリオソーシング | 実世界の車隊インシデント→シミュレーション再生→パラメータ変化→徹底的テスト | すべての実世界の不快イベント、ニアミス、または異常シナリオがシミュレーションテストスイートになる |
| 敵対的シナリオ生成 | Waymoは他のエージェントが最も挑戦的な方法で行動する敵対的シナリオを生成;システムの堅牢性をテスト | 敵対的テスト:最悪のタイミングで横断する歩行者;最小警告距離でAVを割り込む車両 |
| 知覚シミュレーション | センサーデータをシミュレーション(カメラ、LiDAR、レーダー)し、天候効果、照明変化、センサー劣化を含む | センサーシミュレーションの忠実度が最も難しいシミュレーション課題;シミュレーションLiDARと実LiDARにはまだギャップがある |
| クローズドループテスト | WaymoのシミュレーションはクローズドループでAVの判断がシミュレーション環境に影響;他のエージェントがAVに反応 | クローズドループによりシミュレーションがAVに現実より簡単なシナリオを与える「カンニング」を防止 |
| ソフトウェアインザループ(SIL) | 実際の本番AVソフトウェアスタックをシミュレーション内で実行;簡略化プロキシではない | SILによりシミュレーション結果が実世界ソフトウェア動作に転換されることを保証 |
第4節——シミュレーションと現実のギャップ
| ギャップの種類 | テスラの課題 | Waymoの課題 | 緩和策 |
|---|---|---|---|
| センサー忠実度ギャップ | カメラシミュレーションは実カメラ(レンズ歪み、露出、HDR動作)と一致する必要;改善中だがギャップが存在 | LiDARシミュレーションはカメラより難しい;シミュレーション点群と実センサーノイズパターンに差異 | 両社:ニューラルレンダリング(NeRFスタイル)で実データから写実的センサーシミュレーションを生成 |
| ロングテール行動ギャップ | シャドーモードが実世界の稀なイベントを提供;シミュレーションは再実行するが真に新規なシナリオは生成できない | Waymoの実世界車隊は小さい;エッジケースのためシミュレーションにより依存する必要 | 両社はプロシージャル生成を使用;新規シナリオには実世界データが不可欠 |
| 訓練分布ギャップ | シミュレーションで訓練されたモデルは実センサーデータで異なる挙動を示す可能性(ドメインシフト) | 同じ課題;ドメイン適応技術が必要 | 両社:主に実世界データで訓練;シミュレーションはエッジケース増強に使用 |
| 敵対的堅牢性 | FSDは主に実世界で訓練;敵対的シナリオカバレッジはシミュレーション品質に依存 | CarCraftの敵対的テストはコア差別化要因;最悪ケースエージェント行動を明示的にテスト | Waymoの明示的な敵対的プログラムは文書化された優位性 |
| 計算コスト | 1日150億模擬マイルには大量の計算が必要;DojはこのワークロードのためにAに設計 | 同様;CarCraftのスループットにはGoogle TPU規模が必要 | 両社とも計算規模ソリューションを持つ;WaymoはGoogleインフラから恩恵 |
| 検証の完全性 | 何模擬マイルが「十分安全」に等しいか?業界標準が存在しない | 同じ課題;シミュレーションは決して網羅的にはなれない | 両社ともシミュレーション+実世界+正式安全論証を使用 |
第5節——シミュレーションベンチマークスコアカード
| 次元 | テスラ | Waymo | 優位性 |
|---|---|---|---|
| シミュレーション規模 | 非常に高い——約600万台のシャドーモード車両(推定値)×日間マイル;Dojoが出力処理 | 非常に高い——1日150億模擬マイル(Waymo開示) | 異なるアプローチ;Waymoはシミュレーション量が多い;テスラは実世界シャドー量が多い |
| シャドーモード/実世界信号 | 決定的——600万台車隊(推定値)×継続シャドーモード=比類なき実世界訓練信号 | 実車隊が小さい;シミュレーションで補完 | テスラ |
| 敵対的テストプログラム | 公開文書が少ない | 決定的——CarCraftの敵対的シナリオがコア方法論(Waymo開示) | Waymo |
| クローズドループ忠実度 | SILと実世界検証の両方を使用 | クローズドループSIL CarCraftが業界ベンチマーク | Waymo |
| センサーシミュレーション忠実度 | カメラシミュレーションが改善中;ニューラルレンダリング研究が活発 | LiDARシミュレーションはカメラより難しい;Waymoが多大な投資 | ほぼ同等;異なるセンサー |
| CI/CD統合 | テスラはFSDをOTAデプロイ;シミュレーションで回帰テスト | WaymoはデプロイゲーティングにシミュレーションA使用 | 両社とも成熟 |
総合評価
テスラのシャドーモードは約600万台(推定値)規模で、AV業界で最も強力な実世界訓練信号だ。この規模の車隊から得られる実際の走行データ量に匹敵するAVプログラムは他に存在しない。WaymoのCarCraftは1日150億模擬マイル(Waymo開示)規模で、商業AV開発で最も高度なシミュレーション環境だ。
2つのアプローチは競合関係にあるのではなく補完関係にある。テスラは実世界データ量とシャドーモード信号の豊富さで決定的に勝る。Waymoはシミュレーションの厳格さ、敵対的テストカバレッジ、クローズドループ忠実度で決定的に勝る。両者は完全なAV安全論証に不可欠であり、だからこそ両社とも両方のアプローチを採用している。
注記: 「(推定値)」と表示されたすべての数値は、2026年中頃時点の公開開示、業界調査、アナリスト推計、および報告されたデータから導出されている。Waymoの1日150億模擬マイルの数値はWaymoの公開安全開示に基づく。本記事は投資アドバイスを構成しない。
ソース
- Waymoシミュレーションとカークラフト — Waymoブログ ↗
- テスラ DojoとFSDトレーニング — テスラ AI ↗
- AV シミュレーションとテスト手法論 — RAND Corporation ↗
- テスラ シャドーモードと自動ラベリング — テスラ AI Day 2022 ↗
- Waymo 150億模擬マイル — Waymo安全レポート ↗