2026-06-18 — views
피지컬 AI 센서 — Waymo 라이다+카메라+레이더 융합 vs Tesla 비전 전용 FSD: 인식 하드웨어 벤치마크 2026
Waymo는 라이다·카메라·레이더를 융합해 중복 3D 인식을 구현한다. Tesla는 카메라만 사용——차량 1대당 10~30배 저렴——AI가 카메라의 약점을 보완할 수 있다는 도박이다.
개요
센서 스택은 자율주행차 설계에서 가장 근본적인 하드웨어 결정이다. Waymo는 라이다(lidar)·카메라·레이더 3종류의 센서를 융합해 중복성 있는 인식 시스템을 구축한다. Tesla는 카메라만 사용하는 순수 비전 방식을 채택하며, AI가 충분히 강력해지면 라이다는 불필요한 고비용 보조 장치에 불과하다고 주장한다. 이 논쟁은 차량 비용·악천후에서의 인식 신뢰성·센서 데이터 처리에 필요한 AI 종류에 중대한 함의를 지닌다. 이 글은 피지컬 AI 벤치마크 시리즈 제168회다.
섹션 1 — Waymo 센서 스위트: 라이다 + 카메라 + 레이더 융합
Waymo Gen 6 차량은 서로의 약점을 보완하는 3종류의 상보적 센싱 모달리티를 탑재해 단일 장애점이 없는 인식 시스템을 구축한다.
| 센서 차원 | Waymo 세부 사항 | 전략적 의의 |
|---|---|---|
| 라이다 (주요 거리측정 센서) | Waymo Gen 6는 자체 개발 라이다 사용;라이다는 레이저 펄스를 발사해 비행 시간을 측정하고 정밀한 3D 포인트 클라우드 생성;사거리 200m 이상(추정);어둠과 대부분의 기상 조건에서 작동 | 라이다는 카메라가 따라갈 수 없는 센티미터 정밀도의 3D 형상 제공;어두운 조명의 50m 거리 보행자도 카메라 대비가 낮아도 라이다는 명확히 탐지 |
| 자체 라이다 개발 | Waymo는 Google SDC 프로젝트부터 자사 라이다 개발;다세대 자체 라이다(Honeybee·Laser Bear Honeybee 등);Gen 5에서 Gen 6까지 큰 비용 절감 | 자체 라이다는 상용 라이다 구매보다 단가를 크게 절감;Waymo 자체 라이다는 상용 대안보다 저렴하고 고성능 |
| 카메라 어레이 | Gen 6는 360도 시각 커버리지를 제공하는 다중 카메라 어레이 사용;카메라는 라이다가 제공할 수 없는 색상·질감·의미 정보(표지판·신호등·차선) 포착 | 카메라와 라이다는 상호 보완:라이다는 깊이와 형상,카메라는 의미와 색상 제공;융합 인식은 단일 센서보다 우수 |
| 레이더 | 단거리·장거리 레이더는 도플러 효과로 인근 물체 속도 측정;레이더는 라이다와 카메라가 모두 성능 저하되는 폭우·짙은 안개·먼지에서도 작동 | 레이더의 속도 측정은 악천후에서 대체 불가:폭우에서 라이다 포인트 클라우드는 노이즈 증가;짙은 안개에서 카메라는 대비를 잃음;레이더는 두 가지 모두 돌파 |
| 센서 융합 | Waymo 인식 시스템은 센서 수준과 객체 수준 양쪽에서 라이다·카메라·레이더 데이터를 융합;융합 표현은 단일 센서보다 풍부하고 신뢰성 높음 | 센서 융합은 중복성 제공:한 센서가 저하되어도(젖은 라이다 렌즈·카메라 눈부심)다른 센서가 인식 품질 유지 |
| 센서 비용 (Gen 6) | Waymo는 Gen 5에서 Gen 6까지 큰 비용 절감 발표;Gen 6 정확한 비용은 미공개;업계 추정으로 완전한 라이다+카메라+레이더 스위트는 차량 1대당 추정 5천~1만5천 달러(추정) | 차량 1대 5천 달러에도 센서 비용은 중대한 제조 비용 항목;Tesla의 카메라 전용 접근법은 이를 완전히 제거——8개 카메라 FSD 어레이는 추정 200~500달러(추정) |
| 센서 평가 | Waymo의 다중 센서 접근법은 공학적으로 안전한 선택이다:센싱 모달리티가 많을수록 중복성이 높고 모든 조건에서 인식 신뢰도가 높다. 비용 패널티는 실제로 크다. 핵심 질문은 이 중복성이 상업용 AV 안전에 필요한지,아니면 카메라+AI가 훨씬 낮은 비용으로 동일한 신뢰성을 달성할 수 있는지이다——그것이 Tesla의 도박이다. |
섹션 2 — Tesla 센서 스위트: 순수 비전 (카메라만)
Tesla HW4 플랫폼은 9개의 카메라를 사용하며 라이다나 레이더는 없다. 충분한 카메라 데이터로 훈련된 AI가 라이다 기반 인식에 필적하거나 능가할 수 있다는 도박이다.
| 센서 차원 | Tesla 세부 사항 | 전략적 의의 |
|---|---|---|
| 카메라 어레이 (HW4) | Tesla HW4는 9개 카메라(8개 서라운드+1개 장거리 전방);360도 커버리지;HW3 대비 해상도 향상;Tesla 자체 FSD 컴퓨터로 처리 | 9개 카메라가 완전한 공간 커버리지 제공;FSD 컴퓨터는 모든 카메라 스트림을 동시 처리해 단일 신경망 출력 생성 |
| Tesla가 라이다와 레이더를 왜 포기했나 | 머스크는 라이다가 ‘목발’이라고 주장——카메라와 AI가 충분히 좋아지면 불필요;인간은 두 눈(카메라)으로 운전하며 라이다에 의존하지 않음;라이다는 비용과 복잡성을 늘리지만 대규모 안전성을 근본적으로 개선하지 않음;Tesla는 2021~2022년 대부분의 모델에서 레이더 제거 | 순수 비전 도박은 특정 가설에 기반:충분한 규모의 카메라 데이터로 훈련된 AI는 모든 실용적 AV 시나리오에서 라이다 기반 인식에 필적하거나 능가할 수 있다;이 가설은 완전 무인 상업 규모에서 미증명 |
| ”AI가 센서 한계를 보완한다”는 주장 | Tesla 입장:라이다는 각 센싱 문제를 단순 알고리즘으로 쉽게 만든다;카메라는 문제를 더 어렵게 하지만 강력한 AI가 해결한다;Tesla 규모에서 카메라 데이터로 훈련된 AI는 HD 지도 의존 라이다 시스템보다 일반화 능력이 높다 | 이것은 일관된 기술적 주장이다:AI가 충분히 좋다면 카메라로 충분할 수 있다;질문은 모든 날씨와 조명 조건에서 완전 무인 운전에 ‘충분히 좋은’ AI가 이미 존재하는지 여부다 |
| 순수 비전의 한계 | 카메라가 취약한 상황:폭우(렌즈 위 물)·눈(화이트아웃 조건)·직사광선 눈부심(센서 포화)·헤드라이트 범위를 넘는 완전한 어둠;순수 카메라 시스템은 안개 속 레이더 속도 측정 백업도 저 대비 라이다 3D 형상 백업도 없음 | 이러한 한계는 가상이 아닌 문서화된 실패 모드;질문은 AV 운영 도메인에서 이런 조건이 얼마나 자주 발생하는지,그리고 AI가 센서 저하를 신뢰성 있게 감지하고 대응할 수 있는지다 |
| HW4 하드웨어 사양 | Tesla FSD 컴퓨터(HW4):AI 추론 칩 2개,각 추정 144 TOPS(추정);모든 9개 카메라 스트림 동시 처리;엔드투엔드 신경망 추론 최적화 | 9개 카메라 스트림의 실시간 처리에 충분한 추론 연산력;이 특정 워크로드를 위해 최적화된 자체 실리콘 |
| 점유 네트워크 접근법 | FSD v12는 카메라 이미지만으로 3D 공간 점유를 예측하는 점유 네트워크 사용;이것은 라이다 포인트 클라우드의 신경망 대안 | 카메라 점유 네트워크는 인상적이지만 원거리에서 라이다 포인트 클라우드보다 공간 정확도가 낮음;80m 거리의 보행자는 점유 네트워크로 라이다보다 덜 정확하게 감지될 수 있음 |
| 순수 비전 평가 | AI가 충분히 좋다면 Tesla의 순수 비전 도박은 비용 최적의 선택이다:카메라는 저렴하고 풍부하며 지속적으로 향상;라이다는 비싸고 유지보수 부담을 늘린다. Tesla의 AI가 대규모로 라이다 융합의 인식 신뢰성을 달성하면 도박은 성공이다. 날씨나 조명 조건이 지속적으로 라이다가 막을 수 있는 사고를 초래하면 실패다. |
섹션 3 — 센서 논쟁: 기술 분석
| 기술 차원 | 라이다+카메라+레이더 (Waymo) | 순수 비전 (Tesla) | 현재 증거 |
|---|---|---|---|
| 3D 거리측정 정확도 | 라이다:200m에서 센티미터 정확도(추정);직접 측정 | 카메라 점유 네트워크:80m 이상에서 미터 정확도(추정);2D 이미지에서 추론 | 라이다가 3D 정확도에서 결정적 우위;고속·장거리에서 가장 중요 |
| 야간 성능 | 라이다는 완전한 어둠에서 작동;카메라는 헤드라이트 조명 필요;레이더는 어둠에서 작동 | 순수 카메라는 헤드라이트 범위에 의존;헤드라이트 범위 내에서는 양호;어둠의 장거리에서 저하 | 라이다+카메라+레이더:원거리 저조도에서 결정적 우위 |
| 악천후 (비/안개/눈) | 라이다는 폭우에서 저하(물방울 반사);카메라는 안개에서 저하;레이더는 둘 다 돌파;센서 융합이 성능 유지 | 카메라는 폭우와 짙은 안개에서 저하;레이더 백업 없음;악천후에 취약 | 라이다+카메라+레이더:레이더 백업으로 악천후에서 결정적 우위 |
| 신호등·표지판 인식 | 카메라는 의미론(표지판 텍스트·신호 색상)을 잘 처리;라이다는 텍스트나 색상 인식 불가 | 카메라:의미 능력 강함;융합과 동일한 우위 | 동등——양쪽 모두 카메라로 의미 처리 |
| 차량당 센서 비용 | 라이다+카메라+레이더:추정 5천~1만5천 달러(추정) | 순수 카메라:추정 200~500달러(추정) | Tesla가 센서 비용에서 결정적 우위,추정 10~30배 저렴 |
| 유지보수 복잡성 | 센서가 많을수록 유지보수 포인트 증가;라이다 렌즈는 청결 유지 필요;센싱 모달리티 간 캘리브레이션 필요 | 자동 세정 기능이 있는 9개 카메라;더 간단한 유지보수;낮은 고장률 | Tesla가 유지보수 단순성에서 결정적 우위 |
| 지도 의존성 | Waymo의 라이다는 정밀한 HD 지도 정렬 가능;라이다 포인트 클라우드는 측위를 위해 HD 지도 특징과 매칭 | Tesla의 무지도 FSD는 실시간 측위에 카메라 사용;HD 지도 불필요 | Tesla가 지도 의존성에서 결정적 우위(의존 없음) |
| AI 훈련 데이터 | 라이다 포인트 클라우드와 카메라 이미지는 다른 훈련 데이터 필요;각 모달리티에 별도 데이터 파이프라인 | 카메라가 유일한 모달리티;더 간단한 데이터 파이프라인;Tesla의 60억 마일 전체가 훈련에 직접 사용 가능 | Tesla가 훈련 데이터 균질성에서 결정적 우위 |
섹션 4 — 센서 선택이 규모와 비용에 의미하는 것
| 규모 차원 | Waymo 다중 센서 | Tesla 순수 비전 | 함의 |
|---|---|---|---|
| 차량 제조 비용 | 센서 스위트가 차량 1대당 추정 5천~1만5천 달러 추가(추정) | 센서 비용 추정 200 | 10만 대 Cybercab 기준,Tesla는 Waymo 방식 대비 추정 5억~15억 달러 센서 비용 절감(추정) |
| 차량 교체 주기 | 라이다 센서는 저하 시 교체 필요;Gen 5에서 Gen 6 전환 시 전체 차량 교체 필요 | 카메라는 저하되지만 교체 비용 저렴;센서 업그레이드는 차량 교체가 아닌 HW4 칩 교체 | Tesla의 낮은 센서 비용이 차량 교체 비용 절감 |
| 도시 확장 | 각 새 도시는 라이다 기반 HD 지도 생성(수 주~수 개월 매핑 주행)필요;도시당 출시 비용과 일정 증가 | HD 매핑 불필요;OTA FSD 업데이트가 새 지역 커버 | Tesla가 도시 확장 속도와 비용에서 결정적 우위 |
| 소비자 차량 통합 | Waymo는 소비자 차량 판매 안 함;센서 스위트는 순전히 상업 차량 비용 | HW4 탑재 모든 소비자 Tesla는 이미 센서 하드웨어 보유;소비자에서 로보택시로 전환 시 추가 센서 비용 없음 | Tesla의 센서와 소비자 차량 통합은 독자적인 구조적 이점 |
| 공급망 | 자체 라이다 공급망은 전문 제조업체 필요;지정학적·공급 리스크 | 카메라는 전 세계 대규모로 제조되는 범용 부품;높은 공급망 탄력성 | Tesla가 센서 공급망 탄력성에서 결정적 우위 |
섹션 5 — 센서 벤치마크 스코어카드
| 센서 차원 | Waymo 라이다+융합 | Tesla 순수 비전 | 우위 | 2028년 전망 |
|---|---|---|---|---|
| 3D 인식 정확도 | 결정적——라이다가 200m 이상에서 센티미터 정확도 | 점유 네트워크가 80m 이상에서 미터 정확도 | Waymo | AI 개선으로 격차는 좁아지지만 없어지지 않음 |
| 악천후 성능 | 결정적——라이다+카메라 저하 시 레이더 백업 | 폭우/짙은 안개/폭설에서 취약 | Waymo | Tesla AI는 개선되지만 물리법칙이 악천후에서 카메라 제한 |
| 차량당 센서 비용 | 높음:추정 5천~1만5천 달러(추정) | 낮음:추정 200~500달러(추정) | Tesla(결정적 10~30배) | 라이다 비용은 계속 하락하지만 격차 지속 |
| 유지보수 복잡성 | 높음:다중 센서 캘리브레이션·라이다 청소 | 낮음:카메라 중심,더 간단한 유지보수 | Tesla | 차량 규모가 커질수록 Tesla 우위 유지 |
| 도시 확장(지도 의존성) | 도시당 HD 지도 필요:수 주~수 개월 매핑 | HD 지도 없음:OTA가 새 지역 커버 | Tesla(결정적) | Waymo HD 지도 비용은 도시당 부담으로 남음 |
| 훈련 데이터 파이프라인 | 멀티모달:라이다+카메라 별도 파이프라인 | 단일 모달:60억 마일 전체 직접 사용 가능 | Tesla | 차량 성장에 따라 Tesla 데이터 파이프라인 우위 확대 |
| 전체 센서 평가 | Waymo의 라이다+융합 방식은 엣지 조건(악천후·원거리 어둠)에서 더 안전하고 3D 형상에서 더 정확하다. Tesla의 순수 비전 방식은 비용이 훨씬 낮고 단순하며 확장 가능하고 이미 600만 대에 배포되었다. 도박은 Tesla의 AI가 카메라가 가장 취약한 조건에서 라이다와의 인식 격차를 좁힐 수 있는지 여부다. 좁힐 수 있다면 Tesla의 센서 경제학이 결정적으로 이긴다. 좁힐 수 없다면 Waymo의 센서 중복성이 순수 비전 시스템이 막을 수 없는 사고에서 그 가치를 증명한다. 답은 Tesla의 완전 무인 Cybercab이 상업 마일을 쌓아가는 동안 사고 데이터에서 드러날 것이다. |
(추정)으로 표시된 모든 수치는 기업 공개 자료·애널리스트 추정·업계 벤치마크에서 도출되었다. 이 기사는 피지컬 AI 벤치마크 시리즈 제168회다.
출처
- Waymo Gen 6 센서 스위트 — Waymo 블로그 ↗
- Tesla 비전 전용 FSD 전략 — Tesla AI Day 2021 ↗
- Waymo 자체 라이다 개발 — Waymo 리서치 ↗
- Tesla HW4 FSD 컴퓨터 사양 — Tesla ↗
- 라이다 vs 카메라 AV 인식 논쟁 — IEEE Spectrum ↗