2026-06-17 — views
自動運転センサースタック指数 — Teslaのカメラ単独 vs. WaymoのLiDAR:知覚アーキテクチャの競争
自動運転センサースタックの比較——Teslaのカメラ単独方式 vs. WaymoのLiDAR融合——コスト・悪天候耐性・設計思想の違いを解説。
センサースタックは自動運転アーキテクチャの最初の分岐点
自動運転システムがルートを計画したり操作を実行したりする前に、まず周囲の世界を認識しなければならない。その知覚パイプラインを支えるセンサーは些細な実装詳細ではない——それらが自動運転スタック全体のコスト、地理的適用範囲、悪天候への耐性、そして安全性の上限を決定する。
業界は二つの陣営に分かれている。Waymo、Mobileye、Cruise、Zooxはすべて、LiDAR、レーダー、カメラを冗長なセンサーフュージョンアーキテクチャに統合したシステムを構築している。Teslaは正反対の哲学を追求している:カメラのみ、LiDARなし、超音波センサーなし(2022年に廃止)、そして業界最大の映像学習データセットを基盤とする。
これはフィジカルAIベンチマークシリーズの第6弾だ。これまでの記事では、運用規模拡大、ヒューマノイドロボット、自動運転規制、投資資本、計算チップを扱ってきた。本記事では知覚レイヤーを詳細に解説する——センサーハードウェア、コストへの影響、そして両方のアーキテクチャが主張する核心的な論点。
第1節 — センサースタック主要比較表
以下の表は、2026年中頃時点で自動運転業界で最も参照されている5つのセンサーアーキテクチャをまとめたものだ。カメラ数、LiDARユニット数、レーダーモジュール数は公開仕様またはメーカー発表に基づく。
| 企業 | カメラ | LiDAR | レーダー | 超音波 | 計算 | アーキテクチャ |
|---|---|---|---|---|---|---|
| Waymo(第6世代) | 29 | 4基(360° Honeycomb+近距離) | 6 | 非公開 | 独自ASIC(Waymo Driverチップ) | 完全センサーフュージョン、無人L4 |
| Tesla(HW4) | 8(360°+前方望遠) | 0 | 1(一部車種でオプション) | 0(2022年廃止) | デュアルFSDチップ | カメラ単独、エンドツーエンドNN |
| Mobileye(EyeQ Ultra) | カメラ+LiDARオプション | オプション | あり | なし | EyeQ Ultra ASIC | REMマッピングレイヤー、スケーラブル融合 |
| Cruise(停止中) | 40 | 5 | 16 | あり | 独自ASIC | 最高冗長性スタック |
| Zoox(Amazon) | 8 | 4 | 4 | なし | 独自コンピュート | 双方向車両、完全融合 |
表の読み方: Waymoの29台のカメラは全方位360度周辺カバレッジに加えて近距離専用カメラも含み、Teslaの8台を大きく上回る。Cruiseのスタックは、GMが2023年末にプログラムを停止する前の、最も冗長な商用AVアーキテクチャを表していた。Zooxの双方向車両設計(前後の区別がなく、どちらの方向にも同じように走行できる)は両端に対称的なセンサーカバレッジを必要とする。
TeslaのLiDARゼロは意図的な設計上の選択であり、コスト削減ではない。 デュアルFSDチップは純粋なカメラベース推論で1,000 TOPS超(Teslaの内部ベンチマーク手法)を実現する。2022年の超音波センサー廃止も同じ方向の決定だ——いずれも、カメラデータで訓練されたニューラルネットワークがセンサーフュージョンアプローチと同等またはそれ以上の安全性を達成できるという同じアーキテクチャ上の賭けを反映している。
第2節 — 核心的な議論:カメラ単独 vs. センサーフュージョン
この2つのアーキテクチャは、自動運転の安全性についての根本的に異なる仮説を表している。どちらが明らかに間違っているわけではない——しかし前提の違いは、各社がそれぞれの理念を中心に全く異なるエンジニアリング組織を構築するほど深い。
Teslaのカメラ単独論
人間の道路は人間の目のために設計されている。 すべての交通標識、車線標示、信号機、歩行者用信号は、走行中の車両から人間の目で読み取れるように設計されている。人間の視覚のために設計された道路を走行するという課題があるなら、カメラが正しいセンサーだ——道路インフラが設計の基準とした情報源と同じ情報源を生み出すセンサーだ。
コスト計算。 LiDARユニットは現在の製造規模で1台あたり500ドルから5,000ドルかかる。カメラセンサーは数ドルで済む。数百万台の車両規模では、このコスト差が3万ドル以下の消費者向け製品と、車両コストを乗車収入で回収する必要があるロボタクシーサービスの違いを生む。
フリートデータのスケール。 Teslaの600万台以上のフリートは、実世界のエッジケースから継続的なカメラ映像を生成している:珍しいレーン構成、工事区間、予測不可能な歩行者、緊急車両、洪水、強い逆光。LiDARを搭載したどのフリートもこのデータ量には対抗できない。訓練上の優位性は時間とともに複利で積み上がる——フリートが新しいエッジケースに遭遇するたびに、他のすべてのTesla車両のモデルが改善される。
地図非依存のエンドツーエンド学習。 TeslaのDojoで訓練されたアプローチは、高精度の事前マッピング路網に頼ることなく、映像入力から直接運転方策を学習することを目指している。これによりシステムは、事前にサーベイ・マッピングされた道路だけでなく、あらゆる道路に対応できる。
Waymoのセンサーフュージョン論
LiDARはカメラでは得られない奥行きを提供する。 カメラは世界を2Dの投影として認識する。単一のカメラから3D距離を推定するには推論が必要——ニューラルネットワークは、見かけの大きさ、影、視差などの視覚的手がかりから奥行きを判断することを学習しなければならない。LiDARは飛行時間測定レーザーパルスで距離を直接計測し、照明条件に関わらず精密な3Dポイントクラウドを生成する。どれだけニューラルネットワークを訓練しても、単眼深度推定の根本的な曖昧さは排除できない。
レーダーはカメラが対応できない条件を貫通する。 ミリ波レーダーはカメラの画質を劣化させる雨、雪、霧を透過する。結露で曇ったレンズや大雨で覆われたカメラは有意なシグナルを失う。レーダーは違う。悪天候時において、レーダーが提供する構造的なシーン情報——大型物体がどこにあるか、どのくらいの速度で移動しているか——は、カメラシステムが失う情報だ。
無人運転に必要な冗長性。 セーフティドライバーなしのロボタクシーは、路肩に停めて人間に引き継いでもらうことができない。センサーの種類が一つ故障したとき——カメラレンズの破損、氷で詰まったLiDARユニット、破片で損傷したレーダーモジュール——システムは残りのセンサーで安全な運行を継続しなければならない。完全無人L4運用に必要な安全マージンは、人間がモニタリングして介入できるL2 ADASよりも高い。
安全規格は冗長性を支持する。 ISO 21448(SOTIF——意図した機能の安全性)とより広いL4規制環境は、暗黙的に複数の独立したセンシングモダリティを持つアーキテクチャを支持する。規制当局は、単一のセンサーが故障したときにシステムがいかに安全に劣化するかを実証するよう求めることができる。カメラ単独システムにはカメラ故障時のフォールバックがない。
第3節 — 車両1台あたりのセンサースタックコスト推定
2つのアーキテクチャ間のコスト差は、この議論で最も具体的な数字だ。以下の推定は、2026年時点で入手可能な業界データとアナリスト推定に基づく、大量生産コスト(小売価格や交換コストではない)を反映している。
| コンポーネント | Waymo第6世代(推定) | Tesla HW4(推定) |
|---|---|---|
| カメラアレイ | 約200ドル | 約150ドル |
| LiDAR(4基) | 約3,000〜5,000ドル | 0ドル |
| レーダー | 約300ドル | 約100ドル(オプション) |
| コンピュート(ASIC/FSDチップ) | 約500ドル | 約400ドル(デュアルチップ) |
| センサー+コンピュート合計 | 約4,000〜6,000ドル | 約650〜700ドル |
このコスト差がビジネスモデルに与える意味。 Waymoはライドヘイリングサービス——Waymo Oneロボタクシー——を運営しており、各車両が車両の運用寿命にわたって継続的な収入を生み出してハードウェアコストを償却する。このモデルは、車両が年間数万マイル走行し、乗車ごとに料金を請求する場合に、4,000〜6,000ドルのセンサースイートを正当化できる。
Teslaの目標価格3万ドル以下のCybercabは、5,000ドルのLiDARスタックと相容れない。カメラ単独アーキテクチャは単なる哲学的立場ではない——それはTeslaが構築しようとしている消費者向け車両ビジネスモデルの前提条件だ。WaymoのセンサースタックでCybercabを製造すれば、35,000〜40,000ドル以上の価格が必要になり、大衆市場ロボタクシーの命題が完全に消滅する。
第4節 — 天候と地理的制約
センサーアーキテクチャの選択が、システムが信頼できる動作を行える場所を決定する。以下の表は各条件における予想パフォーマンス特性を示している——これらはアーキテクチャの傾向であり、特定のシステムの保証された測定結果ではない。
| 条件 | カメラ単独(Tesla) | LiDAR+カメラ(Waymo) |
|---|---|---|
| 強い日差し | 良好 | 良好 |
| 夜間(都市部、照明あり) | 良好(HW4低照度最適化) | 優秀 |
| 大雨 | 劣化 | 良好(レーダーフォールバック) |
| 濃霧 | 著しく劣化 | 中程度(LiDARが霧で散乱) |
| 降雪(路面標示が隠れる) | 著しく劣化 | 中程度 |
| センサー閉塞(汚れ/氷) | 単一障害点リスク | 冗長フォールバックあり |
この表が業界の地理的選択を説明している。 Waymoはアリゾナ州フェニックスで商業サービスを開始し、サンフランシスコとロサンゼルスに拡大した——いずれも穏やかな気候、年間日照時間が長く、降雪がほとんどない市場だ。フェニックスの大雨は頻繁ではない。これは偶然ではない——LiDARとレーダーを持っていても、濃霧と氷は現在のAVシステムにとって依然として難しい条件だ。
Teslaはテキサス州オースティンを最初のロボタクシー市場として発表した(2025年予定)。オースティンの気候は乾燥した暑さと低降水量が特徴で、米国の高緯度都市と比べてより乾燥している。カメラ単独アーキテクチャは乾燥した明るい条件でより良いパフォーマンスを発揮する。シアトルやミネアポリスではなくオースティンを選択したことは、カメラ単独知覚の運用包絡線制約を認めていることだ。
第5節 — 収束論
一部のアナリストは、2つの陣営が時間とともに収束すると主張する。論点は双方向に成立する。
TeslaがLiDARを追加する理由。 LiDAR製造コストは2017年以降一貫して低下している。Luminar Technologiesは量産規模で1ユニットあたり100ドル以下のコスト目標を公表している。Innoviz TechnologiesやHesaiにも同様のロードマップがある。LiDARが1ユニットあたり50〜100ドルに下がれば——中級カメラモジュールのコストとほぼ同じ——LiDARに反対するコスト論は大幅に弱まる。消費者向け車両にLiDARを追加しなくても、Teslaはロボタクシーフリート向けにLiDARを採用するかもしれない。
TeslaがLiDARを追加しない理由。 Teslaの訓練パイプライン全体がビジョン最適化されている。Dojo訓練インフラはビデオを処理する。エンドツーエンドのニューラルネットワーク方策はカメラデータで訓練される。フリートデータ収集システムはカメラ映像を収集する。LiDARの追加は単に車にセンサーを取り付けることではない——LiDARポイントクラウドを取り込むデータパイプラインの再構築、融合データでのモデルの再訓練、推論スタックの再設計が必要だ。これは数年がかりのエンジニアリングプログラムであり、製品更新ではない。
最も可能性の高い結果。 両アプローチはそれぞれ独自に改善を続けるだろう。カメラベースのシステムはより大きな訓練データセット、より良いニューラルアーキテクチャ、より高解像度のセンサーから恩恵を受け続ける。LiDARベースのシステムはより低コスト、より長距離、より高解像度のユニットから恩恵を受ける。コスト差は縮小するかもしれないが、消費者向け車両に関連する製造量では完全に消えることはないかもしれない。
ベンチマーク背景:フィジカルAIシリーズ第6弾
本トラッカーはフィジカルAIを多角的に捉えたシリーズの第6弾だ:
- 運用規模拡大指標 — 生産台数、展開規模、走行距離
- ヒューマノイドロボット技術 — ハードウェア世代、巧みさベンチマーク、基盤モデル能力
- AV安全性と規制 — カリフォルニアDMVデータ、NHTSA事故報告、州許可マップ
- 投資と評価額 — 資本フロー、資金調達ラウンド、インプライド評価額
- コンピュートとシリコン — 推論チップ、訓練クラスター、NVIDIA供給制約
- センサースタックと知覚アーキテクチャ — 本記事
センサーアーキテクチャの問題はコスト、安全性、スケーラビリティの交差点にある。それは単一のデモンストレーションや単一の事故によって解決される問題ではない。フリートデータ、規制上の決定、そして最終的にどのアーキテクチャが実世界の運転条件の完全な分布を許容可能なコストで処理できるかによって解決される。その答えはまだ進行中だ。
ソース
- Waymo 第6世代車両センサースイート — Waymo公式ブログ ↗
- Tesla HW4 カメラ・レーダー仕様 — Tesla AI ↗
- Luminar LiDAR コストロードマップ — Luminar投資家向け情報 ↗
- SOTIF ISO 21448 規格概要 — ISO ↗