2026-06-18 — views
Physical AI 안전 기록——AV 사고율 vs 인간 운전자, 궁극의 벤치마크
캘리포니아 DMV·NHTSA 데이터와 Waymo 안전 보고서가 보여주는 AV 사고율 실태와 이것이 Physical AI의 궁극적 벤치마크인 이유.
Physical AI 벤치마크 시리즈 120편——Physical AI 안전 기록: AV 사고율 vs 인간 운전자, 캘리포니아 DMV와 NHTSA 데이터가 보여주는 것, 그리고 안전 통계가 Physical AI의 궁극적 벤치마크인 이유
자율주행차(AV)에 관한 모든 상업적 주장——유닛 이코노믹스, 규제 승인, 탑승자 NPS, 투자자 가치 평가——은 결국 하나의 근본적인 질문으로 귀결된다: 자율주행차는 인간 운전자보다 안전한가? 이것은 부차적인 고려사항도 아니고 규제 체크박스도 아니다. 업계 전체의 핵심 전제다. AV가 인간보다 더 안전하다는 것을 증명하지 못하면 규제 창구는 좁아지고, 보험 경제는 악화되며, 공중의 신뢰는 붕괴하고, 투자 논리는 무너진다. 증명할 수 있다면 상업 모델의 모든 변수가 동시에 개선된다. 안전 통계는 많은 벤치마크 중 하나가 아니다——다른 모든 벤치마크가 의존하는 토대다.
이 글은 공개 데이터를 사용해 비교 안전 통계 프레임워크를 구축한다: 캘리포니아 DMV 연간 개입 보고서, Waymo 자체 안전 보고서, NHTSA 사고 데이터, 그리고 Tesla가 NHTSA에 제출하는 분기별 안전 보고서. AV가 현재 인간 기준 대비 어디에 서 있는지, 트렌드 라인이 무엇을 시사하는지, 그리고 안전 벤치마크가 구조적으로 단순한 ‘마일당 사고 수’ 비교보다 훨씬 복잡한 이유를 이해하는 것이 목표다.
1절——인간 운전자 기준값
AV 안전 데이터를 평가하기 전에 AV가 초과해야 하는 기준값을 설정해야 한다. 미국 인간 운전자 기준값은 NHTSA의 연간 교통 안전 통계 데이터베이스에서 도출되며, 모든 도로 유형, 모든 조건, 모든 운전자 연령, 모든 음주/주의 산만 상태를 포함한다. 이것은 미국 운전의 전체 모습——이상적인 조건으로 선별된 하위 집합이 아니다.
| 안전 지표 | 미국 인간 운전자 평균 | 비고 / 출처 |
|---|---|---|
| 1억 마일당 사망 사고 수 | 1억 마일당 약 1.37건 사망(NHTSA 2022 데이터) | 전국 평균; 모든 도로 유형·조건·연령·음주 상태 포함 |
| 1억 마일당 부상 사고 수 | 1억 마일당 약 77건(NHTSA 추정) | 부상 = 의료 처치가 필요한 모든 사고 |
| 1억 마일당 전체 사고 수 | 1억 마일당 약 200-250건(NHTSA 추정, 경미한 사고 포함) | 물손해 + 부상 + 사망 합계 |
| 음주 운전 기여도 | 전체 교통 사망의 약 37%가 알코올 관련(NHTSA) | AV는 이 카테고리를 완전히 제거 |
| 주의 산만 운전 기여도 | 치명적 사고의 약 8-9%가 주의 산만 운전(NHTSA) | AV는 이 카테고리를 완전히 제거 |
| 피로 운전 기여도 | 치명적 사고의 약 2-3%가 졸음 운전(NHTSA; 낮은 보고 가능성) | AV는 이 카테고리를 완전히 제거 |
| 인적 오류 전체 | 심각한 사고의 약 94%에 인적 오류가 기여(NHTSA 추정) | AV의 핵심 안전 논거: 인적 오류 제거 |
| 젊은 운전자 위험 | 16-19세 운전자의 사고율은 20세 이상의 3배(NHTSA) | AV는 ‘나이’에 상관없이 일관된 성능 제공 |
NHTSA의 94% 인적 오류 수치는 AV 안전 논거의 핵심이다. 거의 모든 심각한 사고가 인간의 의사결정——음주, 주의 산만, 피로, 판단 착오, 과속——에서 비롯된다면, 인간을 제어 루프에서 제거하는 시스템은 이론적으로 대부분의 사고를 제거할 수 있어야 한다. ‘이론적으로’라는 단어는 중요하다: AV는 인적 오류를 제거하면서 새로운 고장 모드를 도입해서는 안 된다. 따라서 안전 벤치마크는 ‘평균적인 인간보다 안전’이 아니라 ‘평균적인 인간보다 안전하면서 새로운 고장 카테고리를 도입하지 않음’이다.
2절——Waymo 안전 데이터(공개)
Waymo는 충분한 주행 거리와 공개된 안전 데이터를 보유하여 인간 기준값과 통계적으로 의미 있는 비교가 가능한 유일한 완전 무인 상업 AV 사업자다. 2026년 초 기준 Waymo는 5,000만 마일 이상의 무인 상업 주행 거리를 축적했다——사망률과 부상률을 비교하기에 충분한 표본 크기다.
| 지표 | Waymo 공개 데이터 | 인간 기준값과의 비교 | 신뢰도 |
|---|---|---|---|
| Waymo One 무인 주행 거리(누적) | 2026년 초 기준 5,000만 마일 이상의 무인 상업 주행(Waymo 발표) | 통계적 비교에 충분한 표본 크기 | Waymo 공개 |
| 1억 마일당 부상 사고율(Waymo 무인) | Waymo 2023년 안전 보고서: 비교 가능한 도시 주행 거리에서 인간 기준값을 크게 하회 | 도시 인간 기준값: 1억 마일당 약 76건(추정); Waymo는 이를 크게 하회(보고됨) | Waymo 안전 보고서 |
| 에어백 전개 / 중대 사고율 | Waymo는 2023년 보고 기간 무인 모드에서 에어백 전개 사고 0건 보고 | 인간 기준값 에어백 전개 사고: 1억 마일당 약 4-5건(추정) | Waymo 2023년 안전 보고서 |
| 보고된 사고의 과실 귀속 | CA DMV에 보고된 사고 중 대부분이 상대방 운전자 과실(정차 중인 Waymo 추돌, 적신호 무시 충돌) | Waymo 차량은 보수적으로 운전; 충돌하기보다 충돌 당하는 경우가 많음 | CA DMV 사고 보고서 |
| 개입률(CA DMV 보고서) | Waymo는 CA DMV에 보고하는 AV 기업 중 가장 낮은 개입률; 2022-2023년 보고서에서 지속적 개선 | 개입률은 시스템 신뢰성의 대리 지표(직접적인 안전 지표가 아님) | CA DMV 연간 AV 보고서 |
| 경찰 보고 필요 사고율 | Waymo는 비교 가능한 도시 운전의 인간 기준값을 하회한다고 공식 발표 | 도시 미국 사고율: 1억 마일당 약 200건(전체 중증도, 추정) | Waymo 블로그 공개 |
| 보행자 / 자전거 사고 | 2026년 중반 기준 Waymo One 무인 서비스에서 보행자 사망 없음(추정) | 인간 운전자는 미국에서 연간 약 7,500명의 보행자 사망 유발(NHTSA) | 추정; Waymo는 사망 사고를 공개하지 않음 |
Waymo 2023년 안전 보고서의 에어백 전개 사고 0건 수치는 특히 중요하다. 에어백 전개는 고중증도 충격의 대리 지표——차량 자체의 안전 시스템을 작동시킬 만큼 충분한 충격력을 가진 사고다. 인간 기준값의 에어백 전개 사고율은 약 1억 마일당 4-5건(추정)이다. Waymo가 수백만 마일의 도시 무인 주행에서 0건을 보고하는 것은 표본 편차만으로는 설명하기 어려운 안전 성능 차이를 나타낸다.
CA DMV 사고 보고서의 과실 귀속 패턴은 두 번째 중요한 신호다. Waymo 차량이 충돌에 연루될 때 대부분의 사고는 상대방 당사자가 과실 운전자다: 다른 차량이 정차 또는 서행 중인 Waymo를 추돌하거나, 운전자가 적신호를 무시하고 Waymo 경로에 진입한다. 이 패턴은 Waymo의 보수적인 운전 스타일을 반영한다——시스템은 적극적인 조작보다 양보, 정차, 완충 공간 유지를 우선시하도록 조정되어 있다.
3절——Tesla FSD 안전 데이터
Tesla의 안전 데이터 공개 방식은 Waymo와 근본적으로 다르다. Tesla는 NHTSA에 분기별 안전 데이터를 제출하고 웹사이트에 요약 통계를 공개하지만, 정부 데이터베이스에 포괄적인 안전 보고서를 제출하지는 않는다. 핵심 구별점은 Tesla의 FSD 시스템——상업 배치된 ‘Full Self-Driving’ 감독 모드 포함——이 항상 개입 가능한 인간 안전 운전자를 동반한다는 것이다. 이것은 감독형 자율화 시스템이지 무인 시스템이 아니다.
| 지표 | Tesla 보고 데이터 | 비고 |
|---|---|---|
| Tesla Autopilot/FSD 사고율(NHTSA) | Tesla는 NHTSA에 분기별 안전 데이터 제출; 2023년 Q4: Autopilot 사용 시 570만 마일당 1건 vs 미사용 시 150만 마일당 1건(Tesla 분기 보고서) | Autopilot은 인간 안전 운전자 포함; 완전 무인 비교가 아님 |
| 비교 주의 사항 | Autopilot과 감독형 FSD는 무인 운전과 동등하지 않음; 인간이 모니터링·개입 가능; 안전 이점에는 인간 개입도 포함 | Waymo 무인 데이터와의 직접 비교는 방법론적으로 복잡 |
| NHTSA 조사 | Tesla Autopilot 사고에 대한 NHTSA의 여러 조사; 긴급 차량(주차된 소방차, 구급차) 충돌 다수 포함; Tesla는 OTA 업데이트로 대응 | NHTSA는 Autopilot에 결함이 있다고 판단하지 않음; 조사는 진행 중인 과정 |
| Tesla의 안전 주장 | Autopilot 사용 중인 Tesla 차량은 평균적인 미국 운전자보다 약 4배 안전(Tesla 분기별 안전 보고서 표현) | 방법론적 논란: Autopilot은 사고율이 낮은 고속도로에서 주로 활성화됨 |
| FSD 무인 운전(오스틴) | Tesla의 오스틴 로보택시는 감독형 FSD 사용; 비감독 무인 운전의 안전 기록은 아직 공식적으로 확립되지 않음 | 이것이 핵심 데이터 공백; 오스틴 규모 확대와 함께 드러날 것 |
Tesla의 ‘4배 안전’이라는 주장 뒤의 방법론적 논란은 실제적이고 중요하다. Autopilot은 주로 고속도로와 통제된 접근 도로에서 활성화되는데, 이는 본질적으로 낮은 사고율 환경이다. 도로 유형과 운전 환경을 제어하는 것이 유효한 비교를 위해 필수적이지만 Tesla의 공개 통계는 이를 충분히 고려하지 않는다. 긴급 차량 충돌 사고에 대한 NHTSA 조사는 특정 고장 모드를 드러낸다: 차로 내 정지 물체(특히 복잡한 배경에 대해 특이한 시각적 특징을 가진 것)의 감지 및 회피 문제다.
4절——왜 안전 통계가 Physical AI의 궁극적 벤치마크인가
안전 통계는 AV 상업 모델에서 독특한 위치를 차지한다: 규제 관문, 투자자 신뢰 신호, 보험 가격 산정 입력, 공중 신뢰 동력, 그리고 핵심 기술 논거의 주요 검증, 이 모두를 동시에 담당한다.
| 메커니즘 | 안전 데이터가 상업화에 미치는 영향 | 위험 |
|---|---|---|
| 규제 관문 | 심각한 과실 AV 사망 사고는 조사 중에 회사 전체의 상업 운영을 중단시킬 수 있음; 캘리포니아는 2023년 사고 후 Cruise 운영 중단 | 치명적 사고 1건 = 수개월에서 수년의 규제 심사; 위험은 비대칭적 |
| Cruise 사건 선례(2023년 10월) | GM Cruise 차량이 다른 차량에 치인 보행자를 추돌한 후 20피트 끌고 감; 캘리포니아 DMV는 수 주 내에 Cruise의 무인 허가증 정지; Cruise는 상업 운영에 복귀하지 못함(GM은 2023년 말 사업 폐쇄) | 업계 정의 사건: 규제 당국이 안전 사고에 신속하게 행동함을 증명; 모든 AV 사업자의 기준 설정 |
| 투자자 신뢰 | Alphabet의 지속적인 Waymo 투자는 부분적으로 깨끗한 안전 기록에 의존; 중대한 과실 사고는 가치 평가와 자금 조달에 영향 | Waymo의 450억 달러 이상 가치 평가는 시장이 안전 기록이 지속될 것으로 믿음을 의미 |
| 보험 보험계리 데이터 | AV 보험사는 상업 차량 보장을 정확하게 가격 산정하기 위해 통계 데이터 필요; 깨끗한 기록과 함께 더 많은 마일수 = 더 낮은 보험 비용(복리 경제 이점) | 선순환: 안전 → 낮은 보험 → 더 나은 유닛 이코노믹스 |
| 공중 신뢰 형성 | AV 기술에 대한 공중의 신뢰는 취약함; 어디서든(다른 회사라도) 주목도 높은 사고는 전체 카테고리에 대한 신뢰를 훼손 | 업계 전체 외부성: Cruise 사건은 공중의 AV 수용도를 12-18개월 낮춤 |
| 94% 인적 오류 논거 | 사고의 약 94%에 인적 오류가 관여하고(NHTSA) AV가 인적 오류를 제거한다면 이론적 안전 상한은 거대함; 그러나 AV는 새로운 고장 모드도 도입해서는 안 됨 | 안전 벤치마크는 ‘평균적 인간보다 안전’이 아니라 ‘최고의 인간보다 안전하면서 새로운 고장 모드 없음’ |
2023년 10월의 Cruise 사건은 업계 전체의 규제 위험 템플릿을 확립했기 때문에 특별히 주목할 필요가 있다. 샌프란시스코에서 무인 운전 중인 GM Cruise 로보택시가 다른 차량에 치여 Cruise의 경로로 튕겨진 보행자와 충돌했다. Cruise 차량은 이후 갓길에 정차했는데——표준적인 사고 후 행동——이 과정에서 보행자를 약 20피트 끌었다. 캘리포니아 DMV는 수 주 내에 무인 허가증을 정지시켰다. 평행 조사에서 Cruise가 규제 당국에 사고를 완전히 공개하지 않은 것이 밝혀졌고, GM은 2023년 말 Cruise 사업 전체를 폐쇄했다. 수십억 달러의 투자, 대규모 샌프란시스코 차량 대수, 수년간의 상업 운영 경험——이 모두가 하나의 심각한 사고로부터 수개월 만에 사라졌다.
5절——안전 벤치마크 스코어카드: Waymo vs Tesla vs 인간 기준값
| 안전 차원 | 인간 운전자 | Waymo(무인) | Tesla(감독형 FSD) |
|---|---|---|---|
| 음주 운전 위험 | 존재(사망의 약 37%) | 제거 | 제거 |
| 주의 산만 운전 위험 | 존재(사망의 약 8-9%) | 제거 | 감소(인간이 모니터링) |
| 피로 위험 | 존재 | 제거 | 감소 |
| 1억 마일당 부상 사고율 | 약 76건(도시 추정) | 인간 기준값을 크게 하회(보고됨) | Autopilot 미사용 대비 약 4배 낮음(Tesla 주장) |
| 에어백 전개 사고율 | 1억 마일당 약 4-5건(추정) | 무인 상업 서비스에서 약 0건(보고됨) | FSD에 대해 별도 공개 없음 |
| 보행자 사망 | 미국에서 연간 약 7,500건 | Waymo One 무인 운전에서 없음(추정) | Autopilot 하에서 NHTSA 조사 사례 다수 |
| 과실 패턴 | 운전자에 따라 다양 | 대부분의 사고: 상대방 과실(CA DMV 데이터) | NHTSA 조사 진행 중; 긴급 차량 사건 |
| 추세 | 정체 / 완만한 개선(미국) | 더 많은 마일수와 함께 빠르게 개선 | OTA 업데이트와 함께 개선 |
트렌드 라인은 절대값만큼 중요하다. Waymo의 안전 지표는 주행 거리가 축적될수록 개선된다——더 많은 주행 거리가 더 많은 훈련 데이터를 생성하고, 이것이 모델을 개선하며, 이것이 안전 성능을 개선한다. 이 복리 역학은 오늘의 비교가 5,000만 마일 대비 5억 마일에서의 Waymo 안전 우위를 과소평가함을 의미한다. 인간 운전자 기준값은 반면 수년간 본질적으로 정체되어 있다.
6절——‘증명 가능한 인간 초월’ 성능으로 가는 길
통계적 과제는 희귀 사건——사망 사고——이 신뢰를 확립하는 데 방대한 표본 크기를 필요로 한다는 것이다. 미국 인간 운전자 사망률은 1억 마일당 약 1.37건(NHTSA 2022)이다. AV 시스템의 사망률이 이 수준을 하회함을 통계적 유의성으로 증명하려면 기대 사망자 수가 적어도 몇 명에 달할 만큼의 주행 거리가 필요하다. 1억 마일에서는 인간 기준값 기대 사망자 수가 약 1.37명——AV 비율이 더 낮은지 아니면 그냥 운이 좋은지를 결론 내리기에는 통계적 검정력이 부족하다. 5억 마일에서는 그림이 더 명확해진다. 10억 마일에서는 비교가 통계적으로 견고해진다.
Waymo의 5,000만 마일 이상의 무인 주행 거리는 부상 사고율 비교가 통계적으로 의미 있는 영역에 가까워지고 있지만, 사망률 비교는 아직 표본 크기의 제한을 받는다. 무인 운전에서의 사망 없는 기록은 긍정적인 신호지만 더 낮은 사망률의 통계적 증명은 아직 아니다. 5억 마일에서 0건의 사망이라면 후자의 해석은 매우 불가능해진다. 2026년 중반 업계의 궤적은 Waymo의 도시 무인 운영 안전 증명이 2-4년 내에 완성될 것임을 시사한다.
참고: ‘(추정)‘으로 표시된 모든 수치는 2026년 중반 기준 공개 규제 제출 서류, 회사 발표, 안전 보고서, 업계 추정치에서 도출되었습니다. 이 글은 투자 또는 법률 조언을 구성하지 않습니다.
출처
- NHTSA 2022년 교통 안전 통계 — NHTSA ↗
- Waymo 2023년 안전 보고서 — Waymo ↗
- Tesla 분기별 안전 보고서 — Tesla ↗
- 캘리포니아 DMV 자율주행차 테스트 연간 보고서 — California DMV ↗
- NHTSA 자동화 운전 시스템 조사 — NHTSA ↗