Skip to content
AI-Daily-Builder

2026-06-18 views

フィジカルAIセンサー — WaymoライダーとカメラとレーダーフュージョンvsTesla純視覚FSD:知覚ハードウェアベンチマーク2026

Waymoはライダー・カメラ・レーダーを融合し冗長な3D知覚を実現。Teslaはカメラのみ——車両1台あたり10〜30倍安価——AIがカメラの弱点を補えるとの賭けだ。

概要

センサースタックは自動運転車設計において最も根本的なハードウェアの決断だ。Waymoはライダー(lidar)・カメラ・レーダーの3種類のセンサーを融合し、冗長性を持つ知覚システムを構築する。Teslaはカメラのみを使用する純視覚方式を採用し、AIが十分に強力であればライダーは高価な補助輪に過ぎないと主張する。この議論は車両コスト・悪天候下での知覚信頼性・センサーデータ処理に必要なAIの種類に対して重大な意味を持つ。本記事はフィジカルAIベンチマークシリーズ第168回だ。


セクション1 — Waymoのセンサースイート:ライダー + カメラ + レーダー融合

Waymo Gen 6車両は互いの弱点を補い合う3種類の相補的なセンシングモダリティを搭載し、単一障害点のない知覚システムを構築している。

センサー次元Waymo詳細戦略的意義
ライダー(主要測距センサー)Waymo Gen 6は自社開発ライダーを使用;lidarはレーザーパルスを発射し飛行時間を計測して精密な3Dポイントクラウドを生成;射程200m以上(推定);暗闇とほとんどの気象条件下で動作Lidarはカメラに匹敵できないセンチメートル精度の3D形状を提供;薄暗い光の中の50m先の歩行者も、カメラのコントラストが低くてもlidarは明確に検出
自社開発ライダーWaymoはGoogle SDCプロジェクト以来自社lidarを開発;複数世代の自社ライダー(Honeybee・Laser Bear Honeybeeなど);Gen 5からGen 6で大幅なコスト削減自社lidarは商用lidar購入より大幅にコストを削減;Waymo自社lidarは商用代替品より安価かつ高性能
カメラアレイGen 6は360度視覚カバレッジを提供する多眼カメラアレイを使用;カメラはlidarが提供できない色・テクスチャ・意味情報(標識・信号・車線)を取得カメラとlidarは相補的:lidarは深度と形状を提供し、カメラは意味と色を提供;融合知覚は単体センサーより優れる
レーダー短距離・長距離レーダーはドップラー効果で近隣物体の速度を計測;レーダーは豪雨・濃霧・粉塵の中でもlidarとカメラが劣化する状況で動作レーダーの速度計測は悪天候で不可欠:豪雨中lidarポイントクラウドはノイズが増加;濃霧中カメラはコントラストを失う;レーダーは両方を突破
センサー融合Waymoの知覚システムはセンサーレベルと物体レベルの両方でlidar・カメラ・レーダーデータを融合;融合表現は単体センサーより豊かで信頼性が高いセンサー融合は冗長性を提供:1つのセンサーが劣化しても(濡れたlidarレンズ・カメラへの太陽光グレア)他のセンサーが知覚品質を維持
センサーコスト(Gen 6)WaymoはGen 5からGen 6での大幅なコスト削減を発表;Gen 6正確コストは非公開;業界推定では完全なlidar+カメラ+レーダースイートは車両1台あたり推定5千〜1.5万ドル(推定)車両1台5千ドルでも、センサーコストは重大な製造コスト項目;Teslaのカメラのみのアプローチはこれを完全に排除——8カメラFSDアレイは推定200〜500ドル(推定)
センサー評価Waymoの多センサーアプローチは工学的に安全な選択だ:センシングモダリティが多いほど冗長性が高く、あらゆる条件での知覚が信頼できる。コスト面のペナルティは現実的で大きい。核心的な問いは、この冗長性が商業AV安全に必要かどうか、あるいはカメラとAIがはるかに低コストで同じ信頼性を達成できるかどうかだ——それがTeslaの賭けだ。

セクション2 — Teslaのセンサースイート:純視覚(カメラのみ)

Tesla HW4プラットフォームは9台のカメラを使用し、lidarもレーダーも搭載しない。賭けは、十分なカメラデータで訓練されたAIがlidarベースの知覚に匹敵するか超えられるというものだ。

センサー次元Tesla詳細戦略的意義
カメラアレイ(HW4)Tesla HW4は9台のカメラ(8台サラウンド+1台長距離前方);360度カバレッジ;HW3より解像度向上;Tesla自社製FSDコンピュータで処理9台のカメラが完全な空間カバレッジを提供;FSDコンピュータはすべてのカメラストリームを同時処理し単一ニューラルネットワーク出力を生成
TeslaがlidarとレーダーをなぜやめたのかAマスクはlidarが「松葉杖」であり、カメラとAIが十分良くなれば不要になると主張;人間は2つの目(カメラ)で運転しlidarに頼らない;lidarはコストと複雑さを増すが、大規模な安全性を根本的に改善しない;Teslaは2021〜2022年にほとんどのモデルからレーダーを廃止純視覚の賭けは特定の仮説に基づく:十分なカメラデータで訓練されたAIはlidarベースの知覚に匹敵または超えられる;この仮説は完全無人商業スケールでは未証明
「AIがセンサー限界を補う」という主張Teslaの立場:lidarは各センシング問題を単純なアルゴリズムで簡単にする;カメラは問題を難しくするが強力なAIが解決できる;Teslaのスケールでカメラデータで訓練されたAIはHDマップ依存のlidarシステムより汎化能力が高いこれは一貫した技術的主張だ:AIが十分良ければカメラで足りるかもしれない;問いはすべての気象・照明条件で完全無人運転に「十分良い」AIが既に存在するかどうかだ
純視覚の限界カメラが苦手な状況:豪雨(レンズ上の水)・雪(ホワイトアウト)・直射日光グレア(センサー飽和)・ヘッドライト範囲を超える完全な暗闇;純カメラシステムは霧中でのレーダー速度計測後退も低コントラストでのlidar 3D形状後退も持たないこれらの限界は仮説ではなく文書化された失敗モード;問いはAV運用ドメインでこれらの条件がどのくらい頻繁に発生するか、そしてAIがセンサー劣化を確実に検出・対応できるかどうかだ
HW4ハードウェア仕様Tesla FSDコンピュータ(HW4):AI推論チップ2個、各推定144 TOPS(推定);9路カメラストリームを同時処理;エンドツーエンドニューラルネットワーク推論向け最適化9路カメラストリームのリアルタイム処理に十分な推論算力;この特定ワークロード向けに最適化された自社シリコン
占有ネットワークアプローチFSD v12はカメラ画像のみから3D空間の占有を予測する占有ネットワークを使用;これはlidarポイントクラウドのニューラルネットワーク代替カメラからの占有ネットワークは印象的だが、遠距離でのlidarポイントクラウドよりも空間精度が低い;80m先の歩行者は占有ネットワークではlidarより精度が低い可能性
純視覚評価AIが十分良ければ、Teslaの純視覚の賭けはコスト最適な選択だ:カメラは安価・豊富・継続的に向上;lidarは高価でメンテナンス負担を増す。Teslaのスケールでlidar融合の知覚信頼性を達成できれば賭けは成功。気象・照明条件がlidarなら防げた事故を引き起こし続ければ失敗だ。

セクション3 — センサー議論:技術分析

技術次元ライダー+カメラ+レーダー(Waymo)純視覚(Tesla)現在の証拠
3D測距精度Lidar:200mでセンチメートル精度(推定);直接計測カメラ占有ネットワーク:80m以上でメートル精度(推定);2D画像から推定Lidarが3D精度で決定的優位;高速・長距離で最も重要
夜間性能Lidarは完全な暗闇で動作;カメラはヘッドライト照明が必要;レーダーは暗闇で動作純カメラはヘッドライト範囲に依存;ヘッドライト範囲内では良好;暗闇の長距離で劣化ライダー+カメラ+レーダー:遠距離の低照度で決定的優位
悪天候(雨/霧/雪)Lidarは豪雨で劣化(水滴リターン);カメラは霧で劣化;レーダーは両方を突破;センサー融合が性能を維持カメラは豪雨と濃霧で劣化;レーダー後退なし;悪天候に脆弱ライダー+カメラ+レーダー:レーダー後退により悪天候で決定的優位
信号機・標識認識カメラは意味(標識テキスト・信号色)を得意とする;lidarはテキストや色を認識不可カメラ:意味能力が強い;融合と同等の優位同等——双方ともカメラで意味を処理
車両あたりセンサーコストライダー+カメラ+レーダー:推定5千〜1.5万ドル(推定)純カメラ:推定200〜500ドル(推定)Teslaがセンサーコストで決定的優位、推定10〜30倍安価
メンテナンス複雑性センサーが多いほど保守ポイントが増える;lidarレンズは清潔に保つ必要;センシングモダリティ間のキャリブレーションが必要自動清掃機能付き9台カメラ;より簡単なメンテナンス;故障率が低いTeslaがメンテナンス簡便性で決定的優位
地図依存WaymoのlidarはHDマップ整合を可能にする;lidarポイントクラウドはHDマップ特徴と照合して測位TeslaのマップレスFSDはリアルタイム測位にカメラを使用;HDマップ不要Teslaが地図依存で決定的優位(依存なし)
AI訓練データlidarポイントクラウドとカメラ画像には異なる訓練データが必要;各モダリティに別個のデータパイプラインカメラが唯一のモダリティ;シンプルなデータパイプライン;Teslaの60億マイル全マイルが訓練に直接使用可能Teslaが訓練データ均質性で決定的優位

セクション4 — センサー選択がスケールとコストに意味すること

スケール次元Waymo多センサーTesla純視覚意味
車両製造コストセンサースイートが車両1台あたり推定5千〜1.5万ドル追加(推定)センサーコスト推定200〜500ドル(推定);10〜30倍低い10万台Cybercabで、TeslaはWaymoアプローチと比べ推定5億〜15億ドルのセンサーコストを節約(推定)
車隊更新サイクルLidarセンサーは劣化で交換が必要;Gen 5からGen 6への移行は車両全体の交換が必要カメラは劣化するが交換は安価;センサーアップグレードは車両交換でなくHW4チップ交換Teslaの低センサーコストが車隊更新費用を削減
都市展開各新都市はlidarベースのHDマップ生成(数週間〜数ヶ月のマッピング走行)が必要;都市ごとの立ち上げコストと期間が増加HDマッピング不要;OTA FSD更新が新地理をカバーTeslaが都市展開速度とコストで決定的優位
消費者車両統合Waymoは消費者向け車両を販売しない;センサースイートは純粋に商業車隊コストHW4搭載のすべての消費者向けTeslaは既にセンサーハードウェアを搭載;消費者からロボタクシーへの転換に追加センサーコストなしTeslaのセンサーをC消費者向け車両に統合した構造的優位は独自
サプライチェーン自社lidarサプライチェーンは専門メーカーが必要;地政学的・供給リスクカメラはグローバルに大規模製造される汎用部品;高度に弾力的なサプライチェーンTeslaがセンサーサプライチェーン弾力性で決定的優位

セクション5 — センサーベンチマークスコアカード

センサー次元Waymoライダー+融合Tesla純視覚優位2028年展望
3D知覚精度決定的——lidarが200m以上でセンチメートル精度占有ネットワークが80m以上でメートル精度WaymoAI改善でギャップは縮小するが消えない
悪天候性能決定的——lidar+カメラが劣化時にレーダー後退豪雨/濃霧/大雪に脆弱WaymoTesla AIは改善するが物理がカメラを悪天候で制限
車両あたりセンサーコスト高:推定5千〜1.5万ドル(推定)低:推定200〜500ドル(推定)Tesla(決定的10〜30倍)Lidarコストは下がり続けるがギャップは続く
メンテナンス複雑性高い:多センサーキャリブレーション・lidar清掃低い:カメラ中心、よりシンプルなメンテナンスTesla車隊が拡大するにつれTeslaが優位を維持
都市展開(地図依存)都市ごとにHDマップが必要:数週間〜数ヶ月のマッピングHDマップなし:OTAが新地理をカバーTesla(決定的)WaymoのHDマップコストは都市ごとの負担のまま
訓練データパイプラインマルチモーダル:lidar+カメラの別個パイプラインシングルモーダル:60億マイル全て直接使用可能Tesla車隊成長に伴いTeslaデータパイプライン優位が拡大
センサー総合評価Waymoのlidar+融合アプローチはエッジ条件(悪天候・遠距離暗闇)でより安全で3D幾何で精確だ。Teslaの純視覚アプローチは劇的にコストが低く・シンプル・スケーラブルで600万台に既に展開されている。賭けはTeslaのAIがカメラが最も弱い条件でlidarとの知覚ギャップを縮められるかどうかだ。縮められれば、Teslaのセンサー経済学が決定的に勝つ。縮められなければ、Waymoのセンサー冗長性が純視覚システムでは防げない事故でその価値を証明する。答えはTeslaの完全無人Cybercabが商業マイルを積み重ねる中で事故データから現れるだろう。

(推定)と記されたすべての数値は、公開企業開示・アナリスト推計・業界ベンチマークから導出されたものだ。本記事はフィジカルAIベンチマークシリーズ第168回だ。


ソース

タグ

チップ