2026-06-18 — views
Tesla FSD 데이터 플라이휠 — 600만 대의 차량이 만드는 재현 불가능한 AI 학습 루프
Tesla는 매일 전 세계 모든 로보택시 기업을 합친 것보다 많은 주행 훈련 데이터를 생성한다. FSD 데이터 플라이휠이 어떻게 복리로 성장하며 왜 경쟁사가 복제할 수 없는지 분석한다.
Physical AI 벤치마크 시리즈 제95편 — Tesla FSD 데이터 플라이휠: 600만 대의 차량이 자기강화 AI 학습 루프를 만드는 방법, 그리고 왜 로보택시 기업은 복제할 수 없는가
Physical AI 분야에서 Tesla의 가장 중요한 경쟁 우위는 차량도, 배터리 기술도, 제조 능력도 아니다. 그것은 데이터 플라이휠이다: 도로 위의 모든 Tesla 차량이 훈련 데이터를 생성하고, FSD 신경망을 개선하며, FSD 성능을 향상시키고, FSD 참여를 늘리며, 다시 더 많은 훈련 데이터를 생성하는 자기강화 루프다. 2026년 중반 기준으로 전 세계에 FSD 지원 소비자용 차량이 추정 600만 대 이상 운행 중이며, Tesla는 매일 전 세계 모든 로보택시 기업을 합친 것보다 수십 배 많은 주행 데이터를 생성한다.
이 글은 FSD 데이터 플라이휠의 기술적 메커니즘을 Physical AI 램프의 벤치마크 지수로 정리한다. 이 플라이휠은 마케팅 주장이 아니다. 섀도 모드 추론, 엣지 케이스 감지, 목표 데이터 수집, Dojo 훈련 컴퓨팅이라는 구체적이고 측정 가능한 기술 아키텍처이며, 규모에 따라 복리로 성장하지만 소비자용 차량 플리트가 없는 기업은 구조적으로 접근할 수 없다.
제1절 — 데이터 플라이휠의 4가지 구성 요소
FSD 데이터 플라이휠은 4가지 상호 연동된 메커니즘으로 구성된다. 각 메커니즘은 소비자용 차량 플리트에서 입력을 받으며, 각각이 다른 메커니즘에 직접 피드백된다.
| 구성 요소 | 기능 | 중요성 |
|---|---|---|
| 섀도 모드 | FSD 또는 Autopilot이 활성화된 모든 Tesla는 인간이 운전하는 동안 신경망을 병렬로 실행한다——스티어링, 제동, 가속에 대한 예측을 생성하지만 실행되지 않고 기록된다 | 수십억 개의 레이블된 훈련 샘플을 생성한다: 모델의 예측 대 인간의 실제 행동이 암묵적 레이블이 된다 |
| 엣지 케이스 감지 | Tesla 플리트는 모델의 예측이 인간의 행동과 크게 달랐던 상황, 또는 FSD 모드에서 인간이 개입해야 했던 상황을 식별한다 | 가장 어려운 시나리오를 자동으로 부각시킨다——이것이 바로 모델 개선에 가장 가치 있는 데이터다 |
| 데이터 엔진(목표 수집) | 엣지 케이스 유형이 식별되면(예: 비 오는 밤 비보호 좌회전), Tesla는 플리트를 프로그래밍하여 해당 특정 시나리오의 샘플을 더 많이 적극적으로 수집할 수 있다 | 수동적인 데이터 수집을 목표 커리큘럼으로 전환——플리트는 프로그래밍 가능한 훈련 데이터 수집기다 |
| Dojo 훈련 클러스터 | D1 칩으로 구축된 Tesla의 맞춤형 AI 훈련 인프라, 플리트의 고처리량 비디오 데이터를 처리하기 위해 특별히 설계 | 빠른 반복을 가능하게 한다: 모델 변경을 수십억 마일의 플리트 데이터로 훈련하고 며칠에서 몇 주 안에 OTA로 플리트에 배포할 수 있다 |
플라이휠 복리 효과: 더 나은 모델은 FSD 참여를 늘리고(사용자가 더 신뢰),그것이 섀도 모드 마일을 늘리며, 그것이 더 많은 엣지 케이스를 감지하고, 그것이 더 나은 다음 모델을 만든다. 이 루프가 복리로 성장하는 것은 각 개선이 더 많은 사용자를 섀도 모드 데이터 생성으로 유입시키기 때문이다.
핵심적인 구조적 통찰은 각 구성 요소가 실제 세계 조건에서 운행하는 대규모 소비자용 차량 플리트에 의존한다는 것이다. 섀도 모드는 인간 운전자가 있는 차량을 필요로 한다. 엣지 케이스 다양성에는 다양한 지역, 날씨, 도로 유형에서 운행하는 차량이 필요하다. 목표 데이터 수집에는 특정 시나리오를 프로그래밍해서 충분한 샘플을 빠르게 얻을 수 있을 만큼 충분히 큰 플리트가 필요하다. Dojo는 그 자본 지출을 정당화할 데이터 볼륨이 필요하다. 1,500대의 상업용 차량 플리트는 이러한 메커니즘에 의미 있는 규모로 입력을 공급할 수 없다.
제2절 — 수치로 보는 규모 우위
소비자용 차량 플리트에서 Tesla의 모든 로보택시 운영사에 대한 데이터 우위는 미미한 차이가 아니다. 그것은 구조적이며, 이를 묘사하는 수치는 전혀 가깝지 않다.
| 데이터 차원 | Tesla 플리트(2026년 중반 추정) | Waymo 상업 플리트(2026년 중반 추정) | 비율 |
|---|---|---|---|
| FSD/AV 지원 차량 | 600만 대 이상의 소비자용 차량(추정) | 약 1,500~2,000대의 상업용 AV 차량(추정) | 약 3,000~4,000배 더 많음 |
| 하루 마일수(추정) | 수억 마일(소비자 주행, 일부에서 FSD 섀도 모드 활성) | 약 50~100만 마일(상업 플리트, 하루 22시간)(추정) | 약 100~500배 더 많음 |
| 하루 섀도 모드 마일 | 수천만 마일(추정)——FSD 참여 마일마다 예측 데이터 생성 | 모든 상업 마일은 무인 주행; 동등한 섀도 모드 없음 | Tesla는 Waymo가 복제할 수 없는 섀도 모드 데이터 생성 |
| 엣지 케이스 다양성 | Tesla가 판매되는 모든 도로 유형, 기상 조건, 지리적 지역 | 4~5개 미국 도시의 지오펜스 상업 통로; 주로 좋은 날씨 낮 시간 조건(추정) | Tesla는 Waymo가 수년간 마주치지 못할 수도 있는 수백만 가지 고유 시나리오를 봄 |
| 지리적 커버리지 | 미국, 캐나다, 유럽, 중국, 호주——Tesla가 판매되는 모든 곳 | 샌프란시스코, 피닉스, 로스앤젤레스, 오스틴——미국 4개 도시 | Tesla의 지리적 커버리지는 글로벌 |
| 연간 훈련 데이터(추정) | 수천억 개의 레이블된 비디오 프레임(추정) | 수백억 개의 고품질 무인 주행 프레임(추정) | 다른 품질 프로필; Tesla는 볼륨과 다양성 우위 |
이 비교에서 중요한 뉘앙스는 품질과 수량이 다른 차원이라는 것이다. Waymo의 상업 무인 주행 마일은 특정 의미에서 더 고품질이라고 할 수 있다: 인간의 감독 없이 완전 자율 시스템으로 생성되며, 이는 매 마일이 섀도 모드 추론의 시연이 아닌 능력의 증명임을 의미한다. 그러나 Waymo의 그 고품질 데이터는 Tesla 플리트 대수의 3,000분의 1로, 4개 도시에서 생성된다. 반면 Tesla의 데이터는 품질 프로필이 어떻든 간에 어떤 규모로 도달하며, 드문 도로 시나리오의 긴 꼬리를 커버하는 것이 목표일 때는 어떤 품질 향상도 이 볼륨을 대체할 수 없다.
제3절 — 섀도 모드의 기술적 작동 원리
섀도 모드는 데이터 플라이휠을 가능하게 하는 메커니즘이며, 가장 자주 오해되는 메커니즘이기도 하다. 왜냐하면 보이지 않는 상태로 작동하기 때문이다——인간 운전자는 그것이 실행 중임을 전혀 알지 못한다.
| 섀도 모드 요소 | 기술적 세부 사항 |
|---|---|
| 병렬 추론 | 인간이 운전하는 동안에도 FSD 신경망은 모든 카메라 프레임에서 지속적으로 추론을 실행한다——실행되지 않고 기록되는 예측을 생성 |
| 레이블 소스 | 인간 운전자의 실제 행동이 기준 진실 레이블이 된다: 스티어링 각도, 제동 압력, 가속도——모두 정밀하게 기록 |
| 자동 편차 플래그 | 모델 예측이 인간 행동과 크게 다를 때(예: 모델이 좌회전 예측, 인간이 직진),그 클립이 흥미로운 훈련 샘플로 플래그됨 |
| 개입 플래그 | FSD가 활성화된 상태에서 운전자가 개입할 때(핸들을 넘겨받을 때),그 순간이 모델이 실패한 케이스로 플래그됨 |
| 개인정보 처리 | 클립은 업로드 전에 익명화; 훈련 데이터에서 얼굴과 번호판이 블러 처리(추정); Tesla 이용약관이 데이터 수집을 커버 |
| 업로드 대역폭 | 차량은 집 WiFi 또는 Tesla 슈퍼차저에서 압축 데이터 클립을 업로드; 고우선순위 엣지 케이스가 먼저 업로드 |
| 볼륨 | 수백만 대의 활성 섀도 모드 차량으로 Tesla는 매일 수백만 개의 레이블된 비디오 클립을 수신(추정) |
레이블 소스가 경쟁사가 복제할 수 없는 구조적 우위다. 상업 무인 주행 플리트에는 암묵적 레이블을 생성하는 행동을 하는 인간 운전자가 없다. Waymo의 훈련 데이터에는 수동 레이블링(인간이 클립을 보고 올바른 행동을 주석 달기)또는 합성 데이터 생성(실제 세계에서 발생하지 않은 시나리오 시뮬레이션)이 필요하다. 두 접근법 모두 유효하며 널리 사용된다. 그러나 둘 다 섀도 모드의 암묵적 레이블링 메커니즘보다 레이블된 샘플당 비용이 수십 배 더 높다——섀도 모드는 차량당 추가 비용 없이 자기 레이블링하기 때문이다.
제4절 — Dojo: 컴퓨팅 백본
Tesla의 Dojo 슈퍼컴퓨터는 플라이휠이 필요로 하는 규모에서 FSD 플리트의 비디오 데이터를 처리하기 위해 전용으로 구축됐다. Dojo——또는 동등한 맞춤형 컴퓨팅——없이는 600만 대의 차량이 생성하는 데이터 볼륨은 경쟁 우위가 요구하는 반복 일정 내에서 처리할 수 없다.
| Dojo 요소 | 세부 사항 |
|---|---|
| D1 칩 | Tesla의 맞춤형 AI 훈련 칩; 칩 간 고대역폭 상호연결에 최적화(비디오 처리 워크로드용 NVLink에 해당) |
| ExaPOD | ExaPOD당 120개의 Dojo D1 칩; 여러 ExaPOD가 클러스터를 구성 |
| 훈련 컴퓨팅(추정) | Tesla는 2025년 말까지 약 1 엑사FLOP의 훈련 용량 목표; 2026년을 통해 확장(추정) |
| 클라우드 대안과 비교 | AWS나 GCP에서 Dojo 규모의 훈련을 하면 연간 수억 달러 비용(추정); Dojo는 충분한 규모에서 그 비용을 상각 |
| 비디오 특화 | 범용 GPU 클러스터와 달리, Dojo는 FSD 훈련에 필요한 멀티카메라 비디오 처리 파이프라인에 특화되어 최적화 |
| OTA 배포 파이프라인 | 훈련된 모델 업데이트는 Tesla의 OTA 시스템을 통해 플리트에 배포; 훈련 실행 후 며칠 내에 전체 플리트 업데이트 가능 |
| 반복 속도 | 더 빠른 훈련은 더 빠른 모델 반복으로 이어지고, 더 빠른 개선 루프로 이어지며, 시간이 지남에 따라 복리로 쌓이는 경쟁 우위로 이어진다 |
Dojo의 전략적 논리는 단순한 비용 절감이 아니라 반복 속도다. Dojo에서 훈련된 모델은 몇 주 내에 플리트에서 테스트할 수 있다. 플리트가 발견한 회귀는 며칠 내에 목표 데이터 수집 캠페인을 트리거하고, 1주일 내에 재훈련이 완료되며, 2주 내에 플리트 배포가 이루어진다. 실제 세계 관찰에서 배포된 모델 개선까지의 이 피드백 루프 속도가 플라이휠이 기술적으로 실현하는 것이고 Dojo가 계산적으로 실현하는 것이다. 클라우드 규모에서의 제약은 비용만이 아니다; 범용 클라우드 스토리지 아키텍처를 위해 설계되지 않은 멀티 페타바이트 비디오 데이터셋에 대한 훈련 작업을 시작하는 지연도 있다.
제5절 — Waymo가 복제할 수 없는 이유
FSD 데이터 플라이휠의 경쟁 우위는 점진적인 것이 아닌 구조적인 것이다. 그것을 만들어내는 메커니즘은 인간 운전자가 있는 소비자용 차량 플리트를 갖는 것에 달려 있다——이 요건이 오늘날 운영 중인 모든 로보택시 기업을 배제한다.
| 플라이휠 요소 | Waymo의 위치 | 복제가 어려운 이유 |
|---|---|---|
| 플리트 규모 | 약 1,500~2,000대의 상업용 차량(추정) | 소비자용 자동차 사업에 진입하지 않고는 3,000~4,000배의 차량 격차를 좁힐 수 없음 |
| 섀도 모드 | 동등한 것 없음——Waymo의 상업 플리트는 무인 주행; 암묵적 레이블을 생성하는 인간 운전자가 없음 | 무인 주행 운영은 상업적으로 더 우월하지만 섀도 모드 메커니즘을 없애 버림 |
| 지리적 다양성 | 4~5개의 미국 도시(추정) | 도시 진입 플레이북이 지리적 확장을 연간 1~2개 새 도시로 제한(추정) |
| 소비자 데이터 동의 | Alphabet은 소비자 데이터(Google Maps, Android)를 보유하지만 개인 차량의 주행 행동 비디오는 없음 | 소비자 차량 시장 진입 필요——1,000억 달러 이상의 자본 투자 |
| Dojo 동등물 | Waymo는 Google Cloud TPU 인프라 사용(추정) | Google의 컴퓨팅에 대한 접근은 강력하지만 플리트 없이는 맞춤형 실리콘 수요를 이끄는 데이터 볼륨이 존재하지 않음 |
| 구조적 격차 | Tesla와 Waymo 간의 훈련 데이터 볼륨 격차는 소비자용 차량 플리트 없이는 좁혀지지 않음 | 이것이 해자다: 2~3년 내에 구매하거나 구축할 수 없음 |
중요한 반론은 Waymo가 Tesla가 아직 달성하지 못한 것을 이미 달성했다는 점이다——4개 도시에서의 상업 무인 주행이다. 반면 Tesla는 2026년 중반 기준으로 미국의 어떤 관할구역에서도 감독 없는 상업 로보택시 서비스에 대한 규제 승인을 아직 받지 못했다(추정). 플라이휠 우위는 훈련 데이터 우위다——그것은 모델 개선 우위로 전환된다——하지만 모델 개선은 결국 실제 세계 무인 주행 성능에서 증명되어야 상업적 우위가 된다. Tesla의 플라이휠은 능력 곡선을 가속시키고 있다. 그 곡선이 Waymo가 상업적 리드를 확장하기 전이나 후에 상업 무인 주행 능력 승인에 도달하는지가 Physical AI 램프의 핵심 벤치마크 질문이다.
제6절 — 데이터 플라이휠을 Physical AI 벤치마크 지수로
FSD 데이터 플라이휠을 벤치마크 지수로 프레이밍하는 것——단순히 기술적 특징이 아닌——은 시간이 지남에 따라 복리로 가시화되는 차원에서 Physical AI 램프를 추적할 수 있게 한다.
플라이휠 지표 1: 분기별 FSD 참여 마일. Tesla는 실적 발표에서 누적 FSD 마일을 공개한다. 분기별 참여 마일의 전분기 대비 성장률은 섀도 모드 데이터 볼륨 성장의 직접적인 대리 지표다. 가속 성장은 플라이휠이 가속되고 있음을 의미한다.
플라이휠 지표 2: FSD 버전 출시 주기. Tesla가 새 FSD 버전을 출시하는 빈도는 훈련 반복 속도의 하위 신호다. 더 빠른 주기는 Dojo가 플리트 데이터를 모델 업데이트로 처리하는 속도가 빨라지고 있음을 의미한다.
플라이휠 지표 3: FSD 개입률. 개입당 마일 지표(공개될 때)는 모델 품질을 측정한다. 개입률 개선과 참여 마일 증가의 조합이 플라이휠의 복리 효과가 성능에 나타나는 모습이다.
플라이휠 지표 4: 섀도 모드 지리적 확장. FSD가 새로운 국가와 지역에서 활성화됨에 따라 훈련 데이터의 지리적 다양성이 확장된다. 각 새로운 국가는 모델이 훈련 규모에서 마주치지 않은 도로 유형, 교통법 변형, 기상 패턴을 추가한다.
플라이휠 지표 5: Dojo 용량 발표. Dojo ExaPOD 배포 및 훈련 컴퓨팅 확장에 관한 Tesla의 공식 발표는 플라이휠을 지원하는 처리 능력 성장의 대리 지표다. 더 많은 Dojo는 더 빠른 반복을 의미한다.
이 5가지 지표가 함께 FSD 데이터 플라이휠의 복리 성장 속도에 대한 벤치마크 지수를 형성한다. 이 지수는 Tesla가 상업 무인 주행 승인을 받을지 여부를 측정하지 않는다——그것은 규제 문제다. 그것은 기저 능력 곡선이 가속되고 있는지를 측정하며, 이것이 상업 배포 이전에 오는 Physical AI 램프 신호다.
제7절 — 이 시리즈에 대하여
이 글은 Physical AI 벤치마크 시리즈의 제95편이다. 이전 94편에서는 램프 지수, 휴머노이드 로봇 경쟁, 유닛 이코노믹스, 글로벌 경쟁, HD 매핑, 소프트웨어 및 OTA 업데이트, 소비자 수요, 경쟁 해자, 안전 데이터, Waymo Gen 6, Optimus 제조, 스코어카드 스냅샷, 2030년 예측 시나리오, 투자자 프레임워크, 도시 확장 파이프라인, Tesla FSD 주 승인 지도, AV 날씨·기후 제약, 규제 캘린더, 로보택시 요금 책정, 휴머노이드 배포 트래커, 공급망 분석, 소비자 채택 수요 지수, 밸류에이션 및 IPO 분석, Physical AI 2026년 중반 총괄, AV 유닛 이코노믹스 마일당 비용 분석, AV 데이터 플라이휠 비교, Physical AI 공급망, AV 플리트 운영, 완전 생애주기 환경 비용, 접근성 레이어, 매핑 아키텍처 비교, 중국 AV 경쟁, 시뮬레이션 및 합성 데이터 훈련, AV 도시 계획과 도시 영향, 자율 트럭 물류 경제학, 유럽 AV 경쟁 환경, AV 센서 기술 논쟁, AV 안전 지표, AV 인재 전쟁, 글로벌 AV 규제 지도, AV 재무 지속가능성 번레이트, Tesla Cybercab 대 Waymo Gen 6 직접 비교(제84편), AV 사이버보안 공격 면(제85편), 휴머노이드 로봇 상업 배포 현황(제86편), AV 플리트 전기화와 충전 경쟁(제87편), 비즈니스로서의 AV 데이터(제88편), AV 보험과 책임(제89편), 무인 캐빈과 승객 경험(제90편), Physical AI 투자 환경(제91편), 인간 운전자 대비 AV 안전 통계(제92편), 노인·장애인을 위한 AV 접근성(제93편), Waymo 도시 확장 플레이북(제94편)을 다뤘다.
이 글은 FSD 데이터 플라이휠 차원을 추가한다: 플라이휠의 4가지 기술 구성 요소(섀도 모드, 엣지 케이스 감지, 목표 데이터 수집, Dojo), Waymo 상업 플리트와의 규모 비교, 자기 레이블링 메커니즘으로서의 섀도 모드의 기술적 작동 원리, 컴퓨팅 백본으로서의 Dojo, 소비자용 차량 플리트 없이는 플라이휠 구조가 복제될 수 없는 이유, 그리고 플라이휠의 복리 성장 속도를 추적하기 위한 5가지 지표 벤치마크 지수.
참고: 이 글의 플리트 규모 추정치, 훈련 데이터 볼륨 추정치, 경쟁 평가는 모두 방향성 추정으로, 2026년 중반 기준 Tesla의 공개 공시, 애널리스트 리서치, Waymo의 공식 발표, 언론 보도에 기반한다. 데이터가 불확실하거나 추정치인 경우 수치에 「(추정)」이 표시되며 확인된 확정 수치가 아닌 방향성 참고로 취급해야 한다. 이 글은 투자 조언을 구성하지 않는다.
출처
- Tesla AI 및 FSD 아키텍처 — Tesla AI Day ↗
- Tesla Dojo 슈퍼컴퓨터 — Tesla ↗
- Tesla 차량 안전 보고서(섀도 모드 데이터)— Tesla ↗
- Tesla FSD 마일리지 공개 — Tesla 실적 발표 ↗
- Waymo 드라이버 훈련 방법론 — Waymo ↗