Skip to content
AI-Daily-Builder

2026-06-18 views

フィジカルAIシミュレーションとテスト——テスラ シャドーモード vs Waymo CarCraft:10億マイル規模のAV検証

CarCraft: 150億模擬マイル/日;テスラ影子モード: 600万FSD車両から実世界信号を収集。両者がAV安全論証に不可欠。

フィジカルAIベンチマークシリーズ 第148回——フィジカルAIシミュレーション・テストインフラ:テスラ シャドーモード vs Waymo CarCraft

シミュレーションは自動運転開発における秘密兵器だ。歩行者が自動運転車の前で赤信号を無視するシナリオは、実世界では約100万マイルに1回(推定値)しか発生しない。このシナリオについて統計的な安全確信度を確立するのに十分な回数をテストするには、1つのエッジケースあたり何年もの走行が必要となる。シミュレーションはこのタイムラインを劇的に短縮する:WaymoのCarCraftは1日150億マイルのシミュレーションを実行し(Waymo公開開示)、数十年分の実世界エッジケース蓄積を毎晩の継続的な演算に凝縮する。テスラのシャドーモードは補完的なアプローチを取る——約600万台(推定値)のFSD対応車両を公道上の継続的な実世界センサーアレイとして活用し、ドライバーの判断がFSDの計画行動と乖離するすべてのトリップから信号を収集する。

本記事はフィジカルAIベンチマークシリーズ第148回として、シミュレーションが自動運転開発に不可欠な理由、テスラとWaymoがいかに根本的に異なるシミュレーションアーキテクチャを構築したか、シミュレーションと現実のギャップが各社の安全論証に何を意味するか、そしてどのアプローチがどの次元で優れているかを総合的にベンチマークする。

「(推定値)」と表示されたすべての数値は、独立して検証された一次データではなく、公開開示、業界調査、アナリスト推計、および報告されたデータから導出されている。本記事は投資アドバイスを構成しない。


第1節——シミュレーションが自動運転開発に不可欠な理由

課題実世界テストの限界シミュレーション解決策規模的優位性
稀なエッジケース歩行者が自動運転車の前で赤信号を無視するシナリオは約100万マイルに1回(推定値);実世界でのテストはシナリオごとに年単位が必要シミュレーションは数時間でパラメータ変化を伴いそのシナリオを数百万回生成できる稀なイベントで1000倍以上の速度優位
障害注入テストセンサー障害(カメラ遮蔽、LiDAR遮断)を公道で安全にテストできないシミュレーションはいつでも任意のセンサー障害を注入でき、知覚劣化に対するシステム応答をテスト実世界では不可能な安全テスト
回帰テストAVソフトウェア変更後、既存シナリオを壊していないことを確認するには全過去テストケースを再実行する必要があるシミュレーションはコード変更後に全テストシナリオを自動再実行;AVのためのCI/CD継続的デプロイ検証
反事実テスト「車両が0.5秒早くブレーキをかけていたら何が起きたか?」実際の事故を再実行できないシミュレーションはパラメータ変化を伴う任意の事故を再生;事故調査を支援事後学習の加速
規模テスラは約600万台のFSD車両(推定値);Waymoは約2,500台(推定値)シミュレーションは実効テスト車隊を100〜1000倍に乗算Waymoは特に小規模な実世界車隊を補うためシミュレーションに依存
新規シナリオ生成人間ドライバーとスタントパフォーマーで一部のシナリオを生成できる;高コストで低速プロシージャル生成で無限のシナリオバリアント(照明、天候、歩行者密度、車両構成)を作成無限のシナリオ多様性

実マイルとシミュレーションのどちらかだけでは不十分な理由

実マイルが代替不可能な根本的な理由がある:実世界はいかなるシミュレーションチームも予測しなかった真に新規のシナリオを生み出す。人間の運転行動、道路インフラの故障、予期しない環境条件は、野外でしか現れないエッジケースを生み出す。どれほど精巧であってもシミュレーションは、人間の設計者またはプロシージャルジェネレーターがパラメータ化したシナリオしかテストできない。実世界はすべてのシミュレーションシナリオが最終的に検証される基準真実だ。

一方、必要な統計的信頼水準を達成するために実マイルのみに依存することも現実的ではない。RAND Corporationの研究は、AVが死亡率において人間ドライバーより優れた安全性を統計的に実証するには約110億マイルの走行が必要と推定した。1台あたり1日100マイルとすると、1万台の車隊でも約30年(推定値)かかる。シミュレーションはその検証タイムラインを圧縮する唯一の信頼できる手段だ。

正しいアーキテクチャは両方を使用する:実世界の走行で新規シナリオを発見し基準真実の検証を提供し、シミュレーションで発見されたシナリオを徹底的にテストし、あらゆるコード変更にわたる回帰テストを実施し、公道でテストするには危険すぎるか稀すぎる敵対的エッジケースを生成する。


第2節——テスラ シャドーモード:アーキテクチャと規模

要素詳細備考
シャドーモードとは?テスラFSDはFSD対応のすべての車両でドライバーの行動と並行してサイレント実行;FSDの判断と実際のドライバー行動を比較;乖離を記録FSDが有効なすべてのテスラが継続的なシャドーモードデータポイント;約600万台(推定値)のすべてのトリップ
規模(推定値)約600万台のFSD車隊(推定値)全体で1日数百万回のシャドーモード比較AV業界で最大規模の実世界シャドーモードデータセット、桁違いに
シャドーモードが検出するものFSDがドライバーと異なる判断をしたはずのケース;FSDがより強くブレーキをかけたはず、より早く曲がったはず、等すべてのFSD乖離がFSDの誤りを示すわけではない;一部はFSDがドライバーより保守的なケース;ラベリングには人間のレビューが必要
シャドーモードにおけるDojoの役割Dojoは大規模にシャドーモード動画クリップを処理;FSDを人間ドライバーの行動に一致またはそれを超えるよう訓練シャドーモードデータ→Dojo訓練→より良いFSD→より良いシャドーモード信号——フライホイール
限界:基準真実の品質シャドーモードはシミュレーションではなく実世界のセンサーデータを使用;しかし「基準真実」は最適行動ではなくドライバー行動ドライバー行動が訓練信号;ドライバーが間違えると、FSDはその間違いから学習
自動ラベリングパイプラインテスラの4Dラベリング(空間+時間)はニューラルネットワークを使用して動画フレームを自動ラベリング;人間のラベリングコストを削減自動ラベリングの規模により数百万時間の動画処理が可能;人間のレビューはエッジケースに集中
シミュレーション vs シャドーモードテスラは両方使用;シャドーモードは実世界のエッジケースを提供;シミュレーションは変化を伴い大規模に再実行補完的:実世界がシナリオを特定;シミュレーションが徹底的にテスト
介入データFSDの強制介入(ドライバーが引き継ぐ)のたびに訓練信号;介入率は年間で約半減(推定値)介入率はシャドーモード、Dojo、シミュレーションが共同で最適化している出力指標

シャドーモードのフライホイール効果

テスラのシャドーモードは、同等のインストール済み車隊規模なしにはいかなる競合他社も複製困難な自己強化改善ループを生み出す。テスラ約600万台(推定値)のFSD対応車両が毎日生み出す実世界のシャドーデータは、世界中のその他のAVプログラムがその全歴史で蓄積したデータを桁違いに上回る。


第3節——Waymo CarCraft:アーキテクチャと規模

要素詳細備考
CarCraftとは?Waymoの社内シミュレーション環境;車両エージェント、歩行者、自転車利用者、エッジケースシナリオを含む都市全体の環境を大規模にシミュレーションWaymoはCarCraftを公開開示;世界で最も高度なAVシミュレーション環境の1つと説明される
規模Waymoは1日約150億模擬マイルの実行を開示(Waymo開示)1日150億模擬マイル vs 1日約5万実マイル(推定値)= 約30万倍のシミュレーション乗数
忠実度アプローチ車両の高忠実度物理シミュレーション;その他エージェント(歩行者、自転車利用者、他車両)の行動モデリングエージェント行動モデリングがWaymoの主要差別化要因;他のエージェントはランダムではなくリアルに振る舞う
シナリオソーシング実世界の車隊インシデント→シミュレーション再生→パラメータ変化→徹底的テストすべての実世界の不快イベント、ニアミス、または異常シナリオがシミュレーションテストスイートになる
敵対的シナリオ生成Waymoは他のエージェントが最も挑戦的な方法で行動する敵対的シナリオを生成;システムの堅牢性をテスト敵対的テスト:最悪のタイミングで横断する歩行者;最小警告距離でAVを割り込む車両
知覚シミュレーションセンサーデータをシミュレーション(カメラ、LiDAR、レーダー)し、天候効果、照明変化、センサー劣化を含むセンサーシミュレーションの忠実度が最も難しいシミュレーション課題;シミュレーションLiDARと実LiDARにはまだギャップがある
クローズドループテストWaymoのシミュレーションはクローズドループでAVの判断がシミュレーション環境に影響;他のエージェントがAVに反応クローズドループによりシミュレーションがAVに現実より簡単なシナリオを与える「カンニング」を防止
ソフトウェアインザループ(SIL)実際の本番AVソフトウェアスタックをシミュレーション内で実行;簡略化プロキシではないSILによりシミュレーション結果が実世界ソフトウェア動作に転換されることを保証

第4節——シミュレーションと現実のギャップ

ギャップの種類テスラの課題Waymoの課題緩和策
センサー忠実度ギャップカメラシミュレーションは実カメラ(レンズ歪み、露出、HDR動作)と一致する必要;改善中だがギャップが存在LiDARシミュレーションはカメラより難しい;シミュレーション点群と実センサーノイズパターンに差異両社:ニューラルレンダリング(NeRFスタイル)で実データから写実的センサーシミュレーションを生成
ロングテール行動ギャップシャドーモードが実世界の稀なイベントを提供;シミュレーションは再実行するが真に新規なシナリオは生成できないWaymoの実世界車隊は小さい;エッジケースのためシミュレーションにより依存する必要両社はプロシージャル生成を使用;新規シナリオには実世界データが不可欠
訓練分布ギャップシミュレーションで訓練されたモデルは実センサーデータで異なる挙動を示す可能性(ドメインシフト)同じ課題;ドメイン適応技術が必要両社:主に実世界データで訓練;シミュレーションはエッジケース増強に使用
敵対的堅牢性FSDは主に実世界で訓練;敵対的シナリオカバレッジはシミュレーション品質に依存CarCraftの敵対的テストはコア差別化要因;最悪ケースエージェント行動を明示的にテストWaymoの明示的な敵対的プログラムは文書化された優位性
計算コスト1日150億模擬マイルには大量の計算が必要;DojはこのワークロードのためにAに設計同様;CarCraftのスループットにはGoogle TPU規模が必要両社とも計算規模ソリューションを持つ;WaymoはGoogleインフラから恩恵
検証の完全性何模擬マイルが「十分安全」に等しいか?業界標準が存在しない同じ課題;シミュレーションは決して網羅的にはなれない両社ともシミュレーション+実世界+正式安全論証を使用

第5節——シミュレーションベンチマークスコアカード

次元テスラWaymo優位性
シミュレーション規模非常に高い——約600万台のシャドーモード車両(推定値)×日間マイル;Dojoが出力処理非常に高い——1日150億模擬マイル(Waymo開示)異なるアプローチ;Waymoはシミュレーション量が多い;テスラは実世界シャドー量が多い
シャドーモード/実世界信号決定的——600万台車隊(推定値)×継続シャドーモード=比類なき実世界訓練信号実車隊が小さい;シミュレーションで補完テスラ
敵対的テストプログラム公開文書が少ない決定的——CarCraftの敵対的シナリオがコア方法論(Waymo開示)Waymo
クローズドループ忠実度SILと実世界検証の両方を使用クローズドループSIL CarCraftが業界ベンチマークWaymo
センサーシミュレーション忠実度カメラシミュレーションが改善中;ニューラルレンダリング研究が活発LiDARシミュレーションはカメラより難しい;Waymoが多大な投資ほぼ同等;異なるセンサー
CI/CD統合テスラはFSDをOTAデプロイ;シミュレーションで回帰テストWaymoはデプロイゲーティングにシミュレーションA使用両社とも成熟

総合評価

テスラのシャドーモードは約600万台(推定値)規模で、AV業界で最も強力な実世界訓練信号だ。この規模の車隊から得られる実際の走行データ量に匹敵するAVプログラムは他に存在しない。WaymoのCarCraftは1日150億模擬マイル(Waymo開示)規模で、商業AV開発で最も高度なシミュレーション環境だ。

2つのアプローチは競合関係にあるのではなく補完関係にある。テスラは実世界データ量とシャドーモード信号の豊富さで決定的に勝る。Waymoはシミュレーションの厳格さ、敵対的テストカバレッジ、クローズドループ忠実度で決定的に勝る。両者は完全なAV安全論証に不可欠であり、だからこそ両社とも両方のアプローチを採用している。


注記: 「(推定値)」と表示されたすべての数値は、2026年中頃時点の公開開示、業界調査、アナリスト推計、および報告されたデータから導出されている。Waymoの1日150億模擬マイルの数値はWaymoの公開安全開示に基づく。本記事は投資アドバイスを構成しない。


ソース

タグ

チップ