2026-06-18 — views
피지컬 AI 데이터 플라이휠 — Tesla 600만 대 훈련 우위, Waymo 5000만 마일 무인 상업 주행, 그리고 데이터 양과 품질 중 어느 쪽이 AV 경쟁에서 승리하는가
Tesla 600만 대 차량 대 Waymo 5000만 마일 무인 주행: 데이터 플라이휠을 피지컬 AI 벤치마크 차원으로 분석하고 양과 품질 중 어느 쪽이 우세한지 검증.
피지컬 AI 벤치마크 시리즈 제123편 — 피지컬 AI 데이터 플라이휠: Tesla의 600만 대 훈련 우위, Waymo의 5000만 마일 무인 상업 주행, 그리고 데이터 양과 품질 중 어느 쪽이 AV 경쟁에서 승리하는가
피지컬 AI 벤치마크 시리즈는 122편에 걸쳐 자율주행차와 휴머노이드 로봇의 기술 준비도, 운영 지표, 안전 기록, 규제 프레임워크, 공급망, 시장 평가를 포괄적으로 분석해왔다. 제123편은 피지컬 AI에서 가장 깊은 경쟁 우위의 원천인 데이터로 눈을 돌린다.
주행하는 모든 마일이 신경망을 훈련시킨다. 기록되는 모든 엣지 케이스가 시스템을 개선시킨다. 그러나 모든 마일이 동등하지는 않다. 인간이 5번 개입한 감독 FSD 1마일과 안전 담당자 없이 복잡한 도시 교통을 주행하는 무인 상업 주행 1마일은 본질적으로 다른 훈련 신호다. 본 기사가 답하려는 질문은 구조적이다: 누가 가장 많은 마일을 보유하고, 누구의 마일이 가장 높은 품질이며, 양과 품질 중 어느 쪽이 자율주행 훈련 경쟁의 승자를 결정하는가.
“(추정)“으로 표시된 모든 수치는 검증된 1차 데이터가 아닌 공개 시장 정보, 애널리스트 추정 및 기업 공시에서 도출된 것이다.
제1절 — 데이터 플라이휠 메커니즘
“데이터 플라이휠”은 자기강화 사이클을 설명한다: 더 잘 훈련된 모델이 더 깨끗한 훈련 데이터를 생성하고, 깨끗한 데이터가 더 나은 모델을 훈련시키며, 이것이 반복된다. 자율주행차에서 플라이휠은 5가지 식별 가능한 단계를 가지며, 각 단계는 가장 일찍 진입하고 가장 큰 차량군을 보유한 기업의 우위를 복리로 축적시킨다.
| 플라이휠 단계 | 무슨 일이 일어나는가 | 왜 복리로 축적되는가 |
|---|---|---|
| 차량이 데이터를 수집 | 모든 카메라 프레임, 모든 센서 판독값, 모든 인간 개입, 모든 아차 사고가 기록되어 훈련 파이프라인으로 전송된다 | 현장의 차량이 많을수록 단위 시간당 더 많은 데이터가 수집된다; 데이터 수집 속도는 차량군 규모에 비례해 확장된다 |
| 데이터 라벨링 및 필터링 | 원시 영상 및 센서 데이터가 처리된다: 엣지 케이스, 개입 사건, 희귀 시나리오가 라벨링 우선순위를 가지며; 일상적인 고속도로 주행은 다운샘플링된다 | 라벨 품질이 훈련 신호 품질을 결정한다; 엣지 케이스의 잘못된 라벨링은 모델에게 잘못된 행동을 학습시킨다 |
| 라벨된 데이터로 모델 훈련 | 신경망 가중치가 라벨된 데이터셋에서 업데이트된다; Dojo(Tesla) 또는 TPU 클러스터(Waymo/Google)가 훈련을 처리한다 | 컴퓨팅 파워가 모델을 재훈련할 수 있는 빈도를 결정한다; Dojo 투자는 더 빠른 반복 사이클을 의미한다 |
| 개선된 모델을 OTA로 배포 | 더 나은 모델이 무선 업데이트를 통해 차량군에 배포된다; 모델이 실수할 가능성이 줄어들어 차량군은 즉시 더 나은 데이터를 생성한다 | 선순환: 더 나은 모델이 더 깨끗한 데이터를 생성하고, 이것이 더 나은 모델을 훈련시키며, 개입 이탈율을 낮춘다 |
| 엣지 케이스 발견 | 개선된 모델도 여전히 새로운 엣지 케이스를 발견한다; 이것들이 다음 라운드의 훈련 목표로 기록된다 | 분포의 꼬리(희귀하지만 위험한 시나리오)는 완전히 사라지지 않는다; 데이터 플라이휠은 영속적이다 |
| 차량군 규모가 모든 것을 증폭 | 600만 대 차량군은 1대 차량군 대비 단위 시간당 600만 배의 데이터를 수집한다 | Tesla의 소비자 차량군 우위는 구조적이다: 소비자 자동차 사업 없이는 어떤 AV 기업도 600만 대를 복제할 수 없다 |
제2절 — Tesla의 데이터 우위: 양
| 지표 | Tesla | Waymo | 비율 |
|---|---|---|---|
| 데이터를 수집하는 현장 차량 | 약 600만 대의 FSD 지원 차량 (추정) | 약 1,100-1,800대의 상업 AV 차량군 (추정) | 약 3,300-5,400배 더 많은 차량 (추정) |
| 일일 주행 거리 (차량군 합계) | 약 5,000만-7,000만 마일/일 (추정, 600만 대 x 평균 활성 약 10마일/일) | 약 15만-20만 마일/일 (추정, 1,500대 x 약 100마일/대/일) | 약 250-450배 더 많은 일일 원시 마일 (추정) |
| 누적 감독 FSD 주행 거리 | 약 50-60억 마일 (추정, 2026년 Q1 공시 범위) | 약 5,000만 마일의 무인 상업 주행 (공시됨) | 약 100배 더 많은 원시 마일 (추정) |
| 기록된 인간 개입 횟수 | 감독 FSD 모드의 모든 수동 인계가 기록 및 태그됨; 600만 대에서는 희귀 이벤트 유형도 자주 발생함 | Waymo는 모든 원격 지원 개입과 시스템 이탈을 기록함 | Tesla는 하루에 약 100배 더 많은 개입 이벤트를 기록함 (추정) |
| 지리적 다양성 | 미국 전체 50개 주 및 캐나다; EU는 제한적; 100,000개 이상의 도로 구성 | 피닉스, SF, LA, 오스틴, 애틀랜타 — 5개 지오펜스로 제한 | Tesla가 지리적으로 훨씬 더 다양함 |
| 날씨 다양성 | 미국의 모든 기후의 모든 날씨 조건 | 피닉스: 건조/더움; SF: 안개; LA: 온화함; 눈 노출 제한적 | Tesla는 눈, 얼음, 안개, 비, 사막, 고속도로, 도시를 포괄적으로 커버함 |
지리 및 날씨 다양성은 양적 우위의 과소평가된 차원이다. 피닉스, 샌프란시스코, 로스앤젤레스, 오스틴, 애틀랜타에서만 훈련된 모델은 — 아무리 심층적으로 훈련되었다 해도 — 미네소타 고속도로의 블랙아이스, 미시간의 눈보라, 텍사스의 계절풍을 한 번도 본 적이 없다. Tesla의 차량군은 매일 미국 모든 주에서 규모 있게 이 모든 조건을 경험한다.
제3절 — Waymo의 데이터 우위: 품질
| 지표 | Waymo의 우위 | 품질이 중요한 이유 |
|---|---|---|
| 무인 상업 주행 거리 | 5,000만 마일 이상, 차량 내 인간 운전자 없음; 모델이 안전망 없이 모든 것을 처리해야 했음 | 무인 주행 마일은 더 깨끗한 훈련 신호를 생성한다: 모델의 결정만 기록되며; 인간 인계의 노이즈가 데이터셋을 오염시키지 않는다 |
| 도시 밀도와 복잡성 | 샌프란시스코는 지구상 가장 복잡한 도시 주행 환경 중 하나: 이중 주차된 배달 차량, 공격적인 자전거 이용자, 보행자, 케이블카, 안개, 좁은 거리 | SF 무인 주행 마일은 고속도로나 교외 주행과 비교해 불균형적으로 엣지 케이스 밀도가 높다 |
| 풀 센서 스위트 데이터 | 매 마일의 라이더 + 카메라 + 레이더 융합 데이터 기록; 3D 포인트 클라우드 + RGB 비디오 + 속도 데이터 | 더 풍부한 센서 데이터는 더 강건한 지각 모델 훈련을 가능하게 한다; Tesla의 카메라 전용 데이터로는 라이더 지각을 훈련할 수 없다 |
| 클로즈드루프 시뮬레이션 | Waymo는 신경 렌더링(NeRF 기반)을 사용해 실제 시나리오를 재구성하고 수백만 개의 시뮬레이션 변형을 실행한다 | 실제 1마일이 1,000개 이상의 시뮬레이션 변형을 생성할 수 있다; 시뮬레이션이 유효 훈련 데이터를 배수 이상 증가시킨다 |
| 마일당 안전 임계 순간 밀도 | SF와 피닉스의 상업 라이드헤일은 고속도로 주행보다 마일당 더 많은 안전 임계 순간을 생성한다 | SF 무인 주행 1마일은 고속도로 FSD 100마일보다 더 많은 훈련 가치를 포함할 수 있다 |
| 어노테이션 품질 | Waymo는 전담 데이터 어노테이션 팀을 보유한다; 3D 라이더 어노테이션은 더 비싸지만 2D 카메라 어노테이션보다 정확하다 | 더 높은 어노테이션 비용은 더 높은 품질의 훈련 신호를 의미한다; Waymo는 라벨된 마일당 더 많이 투자한다 |
제4절 — 품질 대 양의 문제: 증거가 보여주는 것
| 증거 유형 | 보여주는 것 | 해석 |
|---|---|---|
| FSD 이탈율 추세 | Tesla FSD 임계 이탈율이 2022년부터 2026년까지 약 10배 개선됨 (추정, Tesla 분기 보고서 기반) | 감독 주행 마일의 양이 실제로 개선을 만들어내고 있다; 플라이휠이 Tesla에서 작동하고 있다 |
| Waymo 안전 기록 | 5,000만 마일 이상의 무인 주행에서 에어백 전개 사고 제로 (공시됨); 인간 운전 기준선을 크게 하회함 | 품질 있는 무인 주행 마일이 정의된 지오펜스 내에서 증명 가능한 안전 시스템을 만들어내고 있다 |
| 일반화 문제 | Tesla의 FSD는 새로운 도로에 즉시 일반화된다 (지도 불필요); Waymo는 새로운 지역 운영 전에 HD 지도가 필요하다 | Tesla의 양적 접근법은 지리적 일반화를 생성한다; Waymo의 품질 접근법은 지오펜스 내 안전 우선을 실현한다 |
| 엣지 케이스 꼬리 | Tesla는 차량군 규모 덕분에 매일 더 많은 새로운 엣지 케이스 유형을 발견한다; Waymo는 무인 주행 품질 덕분에 지도 구축 지역에서 엣지 케이스를 더 완전하게 해결한다 | 둘 다 동시에 사실이다; 경쟁은 Tesla의 양이 Waymo의 품질보다 빨리 엣지 케이스를 커버할 수 있는지에 달려있다 |
| 결정적 실험 | Tesla가 오스틴에서 안전 운전자를 제거할 때: 모델이 충분히 안전한가? 이것이 감독 주행 마일이 무인 주행 성능으로 전환되는지에 대한 실제 테스트다 | 이것이 AV에서 가장 중요한 열린 데이터 문제다: 감독 학습에서 무인 주행 능력으로의 전환율 |
| 학술적 증거 | 스케일링 법칙은 컴퓨팅 파워와 데이터 양 모두 중요함을 시사한다; 꼬리에서는 데이터 품질이 원시 양보다 중요한 경우가 많다 | 무인 주행 마일이 AV 훈련의 “고품질 토큰”일 수 있다; 그러나 Tesla의 양은 완전한 분포 커버리지를 보장한다 |
제5절 — 데이터 플라이휠 벤치마크 성적표
| 차원 | Tesla | Waymo | 우위 |
|---|---|---|---|
| 원시 마일 양 | 약 50-60억 마일의 감독 주행 거리 (추정) | 약 5,000만 마일의 무인 주행 거리 | Tesla가 약 100배 더 많은 원시 마일 |
| 일일 데이터 수집 속도 | 약 5,000만-7,000만 마일/일 (추정) | 약 15만-20만 마일/일 (추정) | Tesla가 약 300배 빠른 일일 축적 |
| 데이터 품질 (마일당) | 감독 모드; 인간 개입이 훈련 신호에 노이즈를 추가 | 무인 주행; 전 과정에서 모델의 결정만 존재 | Waymo가 마일당 높은 품질 |
| 지리적 다양성 | 미국 전체 50개 주 및 캐나다; 모든 날씨 조건 | 5개 지오펜스; 제한적인 날씨 노출 | Tesla가 압도적으로 더 다양함 |
| 마일당 엣지 케이스 밀도 | 낮음 — 차량군의 많은 부분이 고속도로와 교외 노선을 주행함 | 높음 — 복잡한 도시 환경에서의 상업 도시 노선 | Waymo가 마일당 높은 엣지 케이스 밀도 |
| 시뮬레이션 배증 능력 | Tesla는 재구성 기반 시뮬레이션을 사용함 (추정) | Waymo는 NeRF 기반 장면 재구성을 사용함 (공시됨); 고도로 발전된 파이프라인 | Waymo가 더 성숙한 시뮬레이션 배증 능력 |
| 센서 데이터 풍부도 | 카메라 전용 (차량당 8개 카메라) | 라이더 + 카메라 + 레이더 풀 퓨전 | Waymo가 마일당 더 풍부한 센서 데이터 |
| 훈련 반복 속도 | Dojo가 빠른 재훈련을 가능하게 함 (추정) | Google TPU 클러스터; 세계 수준의 인프라 | 동등함; 둘 다 훈련 컴퓨팅 최전선에 있음 |
| 총체적 평가 | 양, 지리, 날씨 다양성에서 우세 | 품질, 엣지 케이스 밀도, 센서 풍부도에서 우세 | 서로 다르지만 상호 보완적인 우위; 규모에서의 안전을 위해 둘 다 필요 |
성적표는 Tesla와 Waymo가 동일한 차원에서 경쟁하지 않음을 보여준다. Tesla는 폭넓은 커버리지를 최적화하고 있다: 가능한 가장 폭넓은 도로 구성, 날씨 조건, 지리적 시나리오. Waymo는 깊이를 최적화하고 있다: 정의된 운영 도메인 내에서 엣지 케이스의 가장 완전한 해결. 이것들은 동일한 문제에 대한 근본적으로 다른 접근법이다 — 모든 조건에서 안전하게 주행할 수 있는 모델을 생성하는 것.
참고: “(추정)“으로 표시된 모든 수치는 2026년 중반 기준 공개 시장 정보, 애널리스트 추정, 산업 보고서 및 기업 투자자 관계 자료에서 도출되었다. 주행 거리와 차량군 규모 추정은 공개 공시 범위와 공개 애널리스트 추정에 기반하며; 실제 수치는 크게 다를 수 있다. 본 기사는 투자 조언을 구성하지 않는다.
출처
- Tesla 분기별 차량 안전 보고서 — Tesla ↗
- Waymo 안전 보고서 및 주행 거리 — Waymo ↗
- Waymo 시뮬레이션 인프라 — Waymo Research ↗
- Chinchilla 스케일링 법칙 — DeepMind ↗
- Tesla Dojo 슈퍼컴퓨터 — Tesla AI ↗