2026-06-18 — views

AV 데이터 플라이휠 비교 — 테슬라의 양 대 웨이모의 질과 AI 훈련 경쟁

테슬라는 수십억 마일의 감독 주행 데이터를 보유하고, 웨이모는 수천만 마일의 완전 무인 주행 데이터를 보유한다. AI 훈련 경쟁을 제패하는 것은 어느 쪽인가?

피지컬 AI 벤치마크 시리즈 30편 — 훈련 데이터 문제

테슬라와 웨이모 사이의 가장 심층적인 기술적 차이는 차량 수, 운행 횟수, 지리적 커버리지가 아니다. 각 회사가 생성하는 훈련 데이터, 그리고 데이터의 양과 질 중 어느 쪽이 AI 훈련 경쟁을 이기는가에 있다. 테슬라는 600만 대 이상의 소비자 차량에서 추정 50~~60억 마일의 감독 주행 데이터를 축적했다. 웨이모는 추정 3,000~~5,000만 마일의 완전 무인 상업 주행 데이터를 축적했다. 이 두 숫자는 표면적으로는 비교할 수 없어 보이지만, 실제 비교는 겉보기보다 훨씬 복잡하다.

이 글에서는 10가지 차원에 걸쳐 두 데이터 플라이휠을 전면적으로 비교하고, 핵심 질 대 양 논쟁을 검토하며, 질이 양보다 중요하다는 가장 강력한 논거인 ‘개입 격차’를 설명하고, 테슬라의 섀도 모드 대응을 검토하며, 각 회사의 데이터 우위가 2030년까지 어떻게 복리 성장하는지를 전망한다.

이 글의 모든 수치는 공개 정보, 기업 발표, 애널리스트 보고서, 캘리포니아 DMV 신고에 기반한 추정값이다. 테슬라도 웨이모도 완전한 데이터 통계 보고서를 공개하지 않는다.

제1절 — 데이터 플라이휠 비교표

아래 표는 두 데이터 플라이휠을 10가지 차원에서 비교한 것이다. 단일 행만으로는 전체 그림을 알 수 없다. 전략적 함의는 10가지 차원을 함께 읽을 때 드러난다.

차원	테슬라	웨이모
누적 주행 거리 (추정)	50~60억 마일 (FSD 활성화 감독 주행 누적)	3,000~5,000만 마일 (무인 상업 주행, 추정)
데이터 생성 중인 차량 수	약 200~300만 대 (FSD 구독/활성화, 추정)	약 1,000~1,500대 전용 차량
일일 주행 거리 (추정)	약 1,000~1,500만 마일/일	약 30~50만 마일/일
데이터 유형	감독형 (인간이 루프 내, 개입 가능)	완전 무인 (인간 개입 없음)
엣지 케이스 밀도	마일당 낮음 (인간이 대부분의 개입 방지)	마일당 높음 (모든 엣지 케이스를 AV가 자체 해결)
센서 모달리티	카메라 전용 (8대)	LiDAR + 카메라 + 레이더 (완전 센서 suite)
라벨링 방식	자동 라벨링 + 플래그된 클립 인간 검토	센서 퓨전에서 나온 고정밀 그라운드 트루스
지리적 다양성	미국 50개 주 + 캐나다 + 제한적 EU	4~5개 도시 (피닉스, SF, LA, 오스틴 + 애틀랜타)
날씨 다양성	높음 (모든 기후, 감독 드라이버가 엣지 케이스 처리)	낮음 (맑은 날/온화한 시장만; 적설 검증 없음)
개입 이벤트 (라벨링됨)	드묾 (인간이 인계하지만 항상 플래그되지 않음)	모든 자율 경계가 기록되고 라벨링됨

표 해석: 테슬라는 원시 데이터 양, 지리적 범위, 날씨 다양성, 일일 데이터 생성 속도에서 우위다. 웨이모는 마일당 데이터 품질, 센서 풍부성, 라벨링 정확도, 엣지 케이스 밀도에서 우위다. 전략적 논쟁의 핵심은 가장 어려운 주행 시나리오를 처리하는 모델 훈련에 어느 축이 더 중요한가이다.

제2절 — 질 대 양 논쟁

핵심 긴장 관계에는 두 가지 측면이 있으며, 둘 다 기술적으로 옹호할 수 있다.

테슬라의 논점 — 양이 이긴다:

추정 50억 마일 이상의 주행 거리에서는 드문 엣지 케이스도 충분히 자주 발생하여 훈련에 사용할 수 있다. 백만 분의 1 이벤트는 50억 마일 데이터셋에 약 5,000번 등장한다. 지리적 다양성은 대체 불가능하다: 피닉스의 여름 혹서, 뉴욕시의 혼잡, 미네소타주의 겨울 빙설 — 모두 하나의 데이터셋에 집약된다. 차량 규모는 데이터 수집이 사실상 무료임을 의미한다; 기존 고객들이 일상적인 주행의 부산물로 훈련 데이터를 생성하며, 마일당 추가 비용은 없다. 엔드투엔드 신경망 (테슬라가 FSD v12에서 배포하고 이후 버전에서 확장)은 양이 충분하면 불완전한 데이터에서도 학습을 추출할 수 있다. 모델은 유한한 전용 테스트 차량이 재현할 수 없는 조건에서의 일반화를 학습한다.

웨이모의 논점 — 질이 이긴다:

감독 주행 거리는 완전 무인 주행 거리와 본질적으로 다르다. 인간 드라이버가 개입할 때, AI 모델은 위기의 순간에 무엇을 해야 하는지 결코 배우지 못한다 — 인간은 시나리오가 가장 교육적이 되는 순간에 인계한다. 센서 퓨전 (LiDAR + 레이더 + 카메라)은 더 풍부한 그라운드 트루스를 만든다: 카메라만으로는 깊이, 반사율, 정확한 물체 거리를 포착할 수 없다. 웨이모의 무인 주행 데이터셋에서 AV의 매 순간 결정은 완전한 센서 충실도로 기록된다. 테슬라의 감독 데이터셋에서 인간의 개입은 가장 중요한 순간에 훈련 노이즈를 만들어낸다. 논점: 개입이 가장 중요한 시나리오를 체계적으로 제거한다면, 3,000만 마일의 완전 무인 주행 거리는 50억 마일의 감독 주행 거리보다 더 많은 실용적인 학습 신호를 포함할 수 있다.

이 문제는 공개 데이터만으로는 해결할 수 없다. 답은 각 회사가 내린 구체적인 아키텍처 선택과 모델이 훈련 중 다른 신호 유형에 어떻게 가중치를 부여하는지에 달려 있다.

제3절 — 개입 문제

가장 중요한 데이터 비대칭은 엣지 케이스 — 진정으로 어려운 순간 — 에 무슨 일이 일어나는가에 있다.

테슬라의 감독 주행에서:

인간 드라이버는 위험을 감지하면 개입한다. 이는 AI 모델의 위험한 순간의 행동이 기록되지 않음을 의미한다 — 인간은 위기 직전 또는 위기 중에 인계한다. 결과적으로 훈련 데이터셋에는 정확히 가장 중요한 순간에 체계적인 맹점이 생긴다. AI는 어려운 시나리오로 이어지는 전조를 학습하지만, 상황이 어려워질 때마다 인간의 해결책이 AI의 해결책을 대체하기 때문에 그것을 해결하는 방법은 배우지 못한다.

웨이모의 무인 주행에서:

개입할 수 있는 인간이 없다. 모든 엣지 케이스 — 아슬아슬한 상황, 공격적인 보행자 횡단, 도로의 잔해, 복잡한 다중 차량 합류, 모호한 공사 구간 — 는 AI가 처리하고 완전한 센서 데이터와 함께 기록된다. 모델은 가장 어려운 시나리오에서 자신의 행동으로부터 학습하며, 결정의 순간에 센서 퓨전이 제공하는 그라운드 트루스가 있다.

이 개입 격차는 데이터 양보다 질을 지지하는 가장 강력한 논거다. 테슬라의 감독 데이터셋은 쉬운 마일에 대한 선택 편향이 있다: 인간이 AI를 신뢰하여 개입하지 않은 마일들이다. 가장 어려운 마일 — 인간이 실제로 개입한 마일 — 은 개입 이벤트로 기록되지만, 완전한 AI 해결 궤적으로는 기록되지 않는다.

이 선택 편향이 치명적인지는 엔드투엔드 네트워크가 인접 데이터에서 누락된 해결 행동을 추론할 수 있는지, 아니면 그 격차가 축소 불가능한지에 달려 있다. 이것은 AV 연구에서 가장 중요한 미해결 문제 중 하나다.

제4절 — 테슬라의 대응: 섀도 모드 접근법

테슬라는 세 가지 메커니즘을 통해 데이터 전략을 발전시켜 개입 문제를 부분적으로 해결하려 한다.

섀도 모드: 인간이 수동으로 운전하는 동안에도 FSD는 백그라운드에서 의사결정을 내린다. 시스템은 계획된 궤적과 행동을 인간의 실제 행동과 비교한다 — 인간의 입력이 차량에 영향을 미치지 않으면서 둘 다 기록한다. 섀도 모드는 인간이 완전히 제어하는 시나리오에 대한 훈련 신호를 생성하며, 사실상 모든 테슬라 드라이버를 무의식적인 데이터 라벨러로 만든다.

규모화 자동 라벨링: 테슬라의 훈련 파이프라인은 차량 자체를 분산 센서 네트워크로 사용하여 수십억 개의 비디오 클립을 자동 라벨링한다. 모든 클립을 라벨링하기 위해 인간 어노테이터를 고용하는 대신, 테슬라는 모델 생성 라벨, 여러 카메라에 걸친 일관성 검사, 플래그된 엣지 케이스에 대한 표적화된 인간 검토의 조합을 사용한다. 라벨링 파이프라인은 고정된 어노테이션 인력이 아닌 차량 규모와 함께 확장된다.

개입을 부정적 보상 신호로 활용: 인간이 인계하더라도 인계 이벤트는 부정적인 훈련 신호로 기록된다 — 모델은 인간의 개입에 선행한 행동 패턴을 학습하고, 해당 패턴은 낮은 보상을 받는다. 이를 통해 개입 이벤트는 데이터 격차에서 불완전하지만 유용한 훈련 신호로 전환된다.

섀도 모드와 규모화 자동 라벨링이 웨이모의 그라운드 트루스 무인 주행 신호에 필적할 수 있는지는 AV 연구에서 가장 중요한 미해결 기술 문제다. 섀도 모드는 양을 생성하지만, 무인 주행 거리가 제공하는 위기의 순간의 정확한 해결책은 생성하지 못할 수 있다. 두 회사가 2026~2028년에 걸쳐 상업적 운영을 확대하면서 공개 데이터에 나타나는 안전 성능 비교 속에서 답이 점차 명확해질 것이다.

제5절 — 2030년까지 데이터 플라이휠 전망

데이터 우위는 정적이지 않다. 각 회사의 플라이휠은 다른 방식으로 복리 성장하며, 로보택시 차량 규모가 확대됨에 따라 격차도 변화한다.

연도	테슬라 데이터 궤적	웨이모 데이터 궤적	평가 (추정)
2026년	60~80억 마일 감독; FSD v14 훈련	4,000~6,000만 무인 주행 마일; Gen 6 기여	웨이모 질적 우위; 테슬라 양적 우위
2027년	100~120억 마일; Cybercab + FSD 소비자 차량	8,000만~1.2억 무인 주행 마일 (애틀랜타, 마이애미 추가)	수렴 — 테슬라 FSD 빠르게 개선 중
2028년	150억+ 마일; 로보택시 차량이 무인 주행 추가	1.5~2억 무인 주행 마일	로보택시 차량 확대 시 테슬라가 개입 없는 데이터에서 앞서
2030년	Optimus가 Embodied AI 데이터 스트림 추가	웨이모 독립 상장 후; 5억+ 무인 주행 마일	테슬라 (구현화 규모); 웨이모 (순수 AV 깊이)

테슬라의 핵심 잠금 해제: 테슬라가 오스틴 로보택시 차량을 수만 대로 확대하고, 최종적으로 전 세계적으로 수십만 대의 Cybercab에 도달한다면, 소비자 차량 속도로 자체 무인 주행 마일을 생성하기 시작한다. 하루 500만 마일의 무인 주행 마일을 생성하는 10만 대의 로보택시 차량은 지속적인 운영 약 2~3년 내에 웨이모와의 품질 격차를 좁힐 것이다.

웨이모의 핵심 잠금 해제: 지리적 확장 — 적설 시장 추가, 현재 5개 도시 이외의 고밀도 도시 핵심부, 그리고 최종적으로는 국제 시장 — 은 비교표의 날씨 다양성과 지리적 다양성 행을 실질적으로 변화시킬 것이다. 웨이모가 2028년까지 20개 도시에서, 2030년까지 50개 도시에서 운영한다면 격차는 상당히 좁혀진다.

2030년의 와일드카드: 테슬라의 Optimus 인형 로봇 프로그램은 웨이모에 동등한 것이 없는 완전히 새로운 데이터 모달리티 — 구현화된 조작과 실세계 물리적 상호작용 — 를 추가한다. Optimus가 테슬라의 예측대로 2028~2029년에 의미 있는 양산 규모에 도달한다면, 테슬라의 데이터 플라이휠은 단일 도메인 자산이 아닌 다중 도메인 자산이 되어 그 영향력은 자율주행을 훨씬 넘어 더 넓은 피지컬 AI 시장까지 미친다.

제6절 — 이 시리즈에 대해

이것은 피지컬 AI 벤치마크 시리즈의 30번째 기사다. 본 시리즈는 지금까지 램프 지수, 휴머노이드 경쟁, 유닛 이코노믹스, 글로벌 경쟁, HD 매핑, 차량 운영, 소프트웨어와 OTA, 보험과 책임, 소비자 수요, 파트너십, 경쟁 해자, Cybercab 대 Model Y, 안전 데이터, Waymo Gen 6, Optimus 제조, 스코어카드 스냅샷, 2030 예측 시나리오, 투자자 프레임워크, Waymo 도시 확장 파이프라인, 테슬라 주 승인 지도, AV 날씨 및 기후 제약, 인재 전쟁, 전향적 규제 캘린더 (28편), 로보택시 요금 가격 분석 (29편)을 다루어 왔다.

이 글은 위 모든 주제의 근본적인 기술적 질문을 다룬다: 어느 회사가 더 나은 AI 훈련 데이터를 생성하는가, 그리고 ‘더 나음’은 더 많음을 의미하는가 아니면 더 풍부함을 의미하는가? 답은 아직 결론이 나지 않았다. 개입 격차는 웨이모의 품질 논제를 지지한다; 테슬라의 섀도 모드와 로보택시 규모화 궤적은 의미 있는 대응이다. 데이터 플라이휠 비교는 2026~2030년 창에서 가장 중요한 기술 경쟁 중 하나가 될 것이다 — 그리고 차량 수나 운행 횟수와 달리, 훈련 우위가 공개 데이터에 나타나는 안전 성능 차이로 복리 현현될 때까지 외부 관찰자에게는 대부분 보이지 않는다.