2026-06-17 — views

자율주행 소프트웨어 스택 & OTA 파이프라인 지수 — 현장에서 가장 빠르게 개선되는 곳은? (2026년 중반)

OTA 업데이트 주기·시뮬레이션 깊이·현장 데이터 플라이휠 — 테슬라·Waymo·바이두의 실제 개선 속도를 결정하는 세 가지 핵심 요소.

벤치마크 뒤에 있는 질문

주행 거리, 개입률, 허가 건수는 자율주행 시스템이 오늘 어디에 있는지를 측정한다. 장기적인 경쟁 포지셔닝에 더 중요한 질문은 다르다: 시스템이 얼마나 빠르게 개선되는가? 개선 속도는 세 가지 곱해지는 요소로 결정된다 — 데이터 볼륨, 컴퓨팅 처리량, OTA 업데이트 주기. 그리고 최전선에 있는 세 플레이어는 각 요소에서 근본적으로 다른 아키텍처적 베팅을 했다. 이것은 피지컬 AI 벤치마크 시리즈의 열두 번째 기사다.

섹션 1 — 소프트웨어 아키텍처 비교

아키텍처 레벨의 근본적인 설계 선택은 모든 하위 능력에 연쇄적으로 영향을 미친다: 데이터 레이블링 방법, 모델 훈련 방법, 업데이트 검증 방법, 그리고 새로운 소프트웨어 버전이 실제 플리트에 얼마나 빨리 도달하는가.

차원	테슬라 FSD	Waymo Driver	바이두 Apollo	비고
핵심 아키텍처	엔드투엔드 신경망 (카메라에서 행동으로)	모듈식 (인식 + 예측 + 계획)	모듈식 (인식 + 예측 + 계획)	테슬라는 학습 정책에 베팅; 다른 회사는 명시적 계획 유지
센서 입력	카메라 8개만	LiDAR + 카메라 + 레이더	LiDAR + 카메라 + 레이더	단일 모달리티 vs 센서 퓨전
시뮬레이션 플랫폼	테슬라 Dojo + 내부 시뮬레이터	Waymo Simulation (Carcraft)	AADS 시뮬레이터	Waymo Carcraft는 동시에 약 25,000대의 가상 차량을 실행한다고 알려짐
OTA 업데이트 주기	주간 ~ 월간 (소비자 FSD)	분기 이상 (운영 플리트)	비공개	테슬라의 업데이트 주기가 양 경쟁사를 크게 앞섬
OTA 테스트 플리트 규모	600만 대 이상	약 1,500대	약 1,000대	테슬라는 인구 규모 A/B 테스트 가능
훈련 데이터 파이프라인	플리트→Dojo→모델→OTA	운영 플리트→Google TPU→모델→단계적 롤아웃	운영 플리트→바이두 클라우드	테슬라의 루프가 플리트 규모 덕분에 가장 빠름
쉐도우 모드 테스트	있음 — FSD 미구매 차량에서 FSD가 조용히 작동	운영 플리트로 제한	비공개	테슬라는 비지불 차량에서 한계 비용 제로로 데이터 수집

표 읽기: 엔드투엔드와 모듈식 사이의 아키텍처 분기는 단순한 기술적 선호가 아니라 반복 속도와 비용을 결정한다. 엔드투엔드 시스템은 더 많은 데이터로 재훈련함으로써 새로운 엣지 케이스를 개선할 수 있다; 모듈식 시스템은 어떤 모듈이 실패했는지 파악하고, 해당 모듈의 훈련 세트를 다시 레이블링하고, 모듈을 재훈련하고, 전체 스택을 재검증해야 한다. 테슬라의 아키텍처는 설계상 더 빠르게 반복할 수 있다. Waymo의 모듈식 아키텍처는 더 해석 가능하고 안전 규제 당국의 심사를 통과하기 더 쉽다.

섹션 2 — 개선 속도 방정식

세 가지 요소가 곱해져 현장에서 시스템의 개선 속도가 결정된다:

데이터 볼륨 — 월간 훈련 파이프라인에 입력되는 실제 주행 마일 수
컴퓨팅 — 해당 데이터를 처리하는 인프라의 훈련 처리량
업데이트 주기 — 개선된 모델이 실제 플리트에 도달하여 새로운 훈련 데이터를 생성하기 시작하는 속도

지표	테슬라	Waymo	바이두
월간 훈련 파이프라인 투입 마일	10~20억 마일 (추정)	500~1,000만 마일 (추정)	2,000~5,000만 마일 (추정)
훈련 컴퓨팅 (상대적)	높음 — Dojo 클러스터 + NVIDIA GPU	중간 — Google TPU	중간 — 바이두 클라우드
OTA 주기	주간	분기 이상	비공개
쉐도우 모드 커버리지	600만 대 이상	없음	없음
완전 자율주행 품질 마일	낮음 — 주로 감독 하의 소비자 주행	높음 — 전부 상업용 완전 자율주행	높음 — 지정 도시에서의 무인주행

테슬라의 데이터 볼륨 우위는 실재하며 크다. 추정 월간 10~20억 마일의 훈련 파이프라인 규모에서, 테슬라가 처리하는 원시 마일은 양 경쟁사를 수 자릿수 차이로 앞선다. 주의할 점은 데이터 품질이다: 감독 하의 소비자 주행 마일(모델이 전체 어려운 시나리오를 만나기 전에 사람이 개입할 수 있음)은 완전 자율주행 상업 마일(자율 시스템이 스스로 상황을 해결해야 함)과 동등하지 않다.

섹션 3 — Waymo Carcraft: 시뮬레이션 우위

Waymo의 Carcraft 시뮬레이션 플랫폼은 테슬라의 데이터 볼륨 우위에 대한 회사의 답이다. 동시에 약 25,000대의 가상 차량을 실행하는 것으로 알려진 Carcraft는 실제 모든 개입 이벤트와 엣지 케이스를 수천 가지 통제된 변형으로 재시뮬레이션한다 — 다른 날씨, 다른 보행자 타이밍, 다른 차속 — 그리고 OTA 업데이트가 승인되어 출시되기 전에 모델의 대응을 테스트한다.

이 접근법의 전략적 가치는 전방 커버리지다: Carcraft는 실제 세계에서 한 번도 일어나지 않은 시나리오를 테스트할 수 있다. 피닉스의 눈보라, 공사 구역에서 갑자기 달려드는 보행자, 특정 각도의 신호 위반 차량 — Waymo는 상업 배포에서 이를 만나기 전에 시뮬레이션하고 훈련할 수 있다. 테슬라의 훈련 파이프라인은 먼저 실제 세계에서 엣지 케이스를 만나야 그 시나리오에 대한 훈련 데이터가 존재한다.

섹션 4 — 테슬라의 쉐도우 모드 해자

테슬라는 FSD를 구매하지 않은 차량에서 FSD를 쉐도우 모드로 조용히 실행한다. 신경망은 카메라 피드를 무음으로 처리하고 실제로 했을 행동을 기록하지만, 실제 주행에는 전혀 개입하지 않는다. 쉐도우 모드의 예측이 사람 운전자의 실제 행동과 달라질 때, 그 순간들이 고가치 훈련 샘플이 된다.

쉐도우 모드는 테슬라의 훈련 플리트를 600만 대 이상의 활성 차량을 넘어 HW3 또는 HW4 하드웨어를 탑재한 대부분의 설치 기반까지 효과적으로 확장한다. 데이터 수집에는 유료 구독이 필요 없고, 특별한 등록도 필요 없으며, 훈련 샘플당 한계 비용은 제로다. 다른 AV 기업은 이 규모에서 유사한 수동적 데이터 수집 메커니즘을 보유하고 있지 않다.

섹션 5 — 경쟁 해자로서의 OTA

실제 플리트의 소프트웨어를 지속적으로 업데이트할 수 있는 능력 자체가 시간이 지남에 따라 복리로 커지는 경쟁 우위다. 다른 조건이 같다면, 주간 OTA 주기를 갖는 기업은 분기 주기 기업보다 약 13배 빠르게 개선된다.

능력	테슬라	Waymo	중요성
소비자 OTA (비상업용 플리트)	있음, 주간	소비자 플리트 없음	테슬라는 600만 사용자와 동시에 반복
상업 운영 OTA	있음	있음, 단계적이고 보수적	Waymo는 업데이트 속도보다 운영 안전 우선
롤백 능력	있음	있음	양사 모두 문제 있는 버전 복구 가능
대규모 A/B 테스트	있음 — 실험당 수백만 대	제한적 — 수백 대	테슬라는 통계적으로 유의미한 인구 규모 실험 가능
하드웨어 컴퓨팅 OTA	HW4 기능을 소프트웨어로 잠금 해제 가능	고정 하드웨어 구성	테슬라는 기존 배포 하드웨어에서 새 기능 활성화 가능

복리 효과가 여기서 중요하다. 더 빠른 업데이트 주기는 각 개선 루프 — 데이터 수집, 모델 훈련, 업데이트 출시, 새 데이터 수집 — 가 더 빨리 완료됨을 의미한다. 24개월 기간에서 주간 주기 기업은 루프를 약 100번 실행했다; 분기 주기 기업은 8번만 실행했다.

섹션 6 — 우위가 실제로 있는 곳

어느 접근법도 명확하게 이기지 못한다. 테슬라의 데이터 볼륨, 쉐도우 모드 커버리지, OTA 주기는 처음부터 복제하기 어려운 플라이휠을 만들어낸다. 약점은 검증이다: 600만 대 플리트와 주간 소프트웨어 업데이트로는 검증 실패의 비용이 매우 높다. Waymo의 더 느린 주기는 부분적으로 의도적인 선택이다 — 상업적 완전 자율주행 서비스는 유료 대중에게 퇴행 버전을 출시하는 평판 비용을 감당할 수 없다.

2026년 중반의 그림은 두 가지 다른 베팅이다: 테슬라는 데이터 볼륨과 업데이트 속도가 제약 요인이라고 베팅하고, Waymo는 시뮬레이션 품질과 완전 자율주행 마일의 깊이가 제약 요인이라고 베팅한다. 어느 베팅이 맞는지는 향후 24~36개월의 안전 데이터에서 드러날 것이다.

벤치마크 맥락: 이것은 피지컬 AI 시리즈의 열두 번째 기사

이 트래커는 피지컬 AI를 여러 각도에서 다루는 시리즈의 열두 번째다:

운영 규모 지표, 2. 휴머노이드 로봇 기술, 3. AV 안전 및 규제, 4. 투자 및 밸류에이션, 5. 컴퓨팅 및 실리콘, 6. 센서 스택 및 인식 아키텍처, 7. 로보택시 단위 경제학, 8. 글로벌 경쟁, 9. 마스터 스코어카드, 10. HD 매핑 및 로컬라이제이션, 11. 플리트 운영 및 원격 지원, 12. 소프트웨어 스택 및 OTA 파이프라인 (이 기사)

개선 속도 질문은 공개 데이터만으로는 확정적으로 답할 수 없다. 그러나 각 회사가 구축한 아키텍처, 플리트 규모, 업데이트 주기가 만들어내는 구조적 논리는 명확하다 — 이러한 차이는 시간이 지남에 따라 복리로 커진다.