2026-06-18 — views

Physical AI 반도체 공급망 — Nvidia Orin vs Thor vs Tesla FSD 칩

Nvidia Orin vs Thor vs Tesla FSD 칩: AV 추론 컴퓨팅 공급망(TSMC·삼성·첨단 패키징)이 Physical AI 양산 확대를 제약하는 구조를 분석한다.

Physical AI 벤치마크 시리즈 제102편 — Physical AI 반도체 공급망: Nvidia Orin vs Thor vs Tesla FSD 칩, 그리고 모든 AV 내부의 컴퓨트 스택이 왜 양산 확대의 전략적 제약인가

모든 자율주행 차량은 본질적으로 주행 중인 추론 클러스터다. 전방 카메라 프레임이 도착하는 순간, 신경망은 50밀리초 이내에 물체 분류, 깊이 추정, 궤적 예측을 완료하고 제어 명령을 출력해야 한다——열적·전력적으로 제약된 차량 환경에서 현장 장애는 전혀 허용되지 않는다. 그 신경망을 실행하는 칩은 범용품이 아니다. 전략적으로 설계되고, 지정학적으로 고도로 집중되어 있으며, 수년의 개발 기간이 필요한 산물로, 특정 차량 플랫폼에서 어떤 AI 아키텍처가 물리적으로 실현 가능한지를 결정한다. 그러나 반도체 공급망 분석은 소비자 대상 자율주행 보도에서 거의 완전히 누락되어 있다. 본고는 이를 Physical AI 시리즈의 벤치마크 차원으로 체계적으로 매핑한다.

제1절 — AV 추론 컴퓨팅 전체 구도

모든 차량 탑재 컴퓨팅이 동일한 기능을 수행하는 것은 아니다. 상업용 자율주행 차량은 각기 다른 성능 요건, 안전 인증, 공급망 요건을 가진 최소 4개의 서로 다른 컴퓨팅 계층을 필요로 한다.

컴퓨팅 계층	기능	주요 플레이어
센서 전처리	카메라/라이다/레이더의 원시 데이터 정제, 시각 동기화, 기본 필터링	Mobileye EyeQ, Texas Instruments TDA, 자체 개발
인식 추론	센서 데이터 상에서 물체 감지, 세그멘테이션, 깊이 추정 신경망 실행	Nvidia Orin/Thor, Tesla FSD 칩, Qualcomm Snapdragon Ride
계획 및 제어	인식 출력을 궤적 예측 및 차량 제어 명령으로 변환	엔드투엔드 시스템에서는 인식과 동일 칩에서 실행되는 경우가 많음
이중화 / 안전 모니터	메인 컴퓨트를 감시하고 비상 정지를 트리거할 수 있는 독립 안전 프로세서	Infineon, Renesas, STMicro (자동차 안전 인증 취득)
클라우드 트레이닝	차량에 탑재되는 신경망 훈련——차량 탑재가 아닌 데이터센터에서 수행	Nvidia H100/A100 (Tesla: Dojo D1 추정), AMD Instinct, Google TPU

엔드투엔드 AI 주행 아키텍처로의 전환은 차량당 TOPS 요건을 대폭 높였다. 1세대 ADAS 시스템이 필요로 하는 TOPS는 5~~10에 불과했지만, 대형 트랜스포머 모델을 실행하는 엔드투엔드 시스템은 차량당 200~~2,000 TOPS를 필요로 할 수 있다. 이 요건 격차가 바로 Orin(254 TOPS)과 Thor(2,000 TOPS 추정) 간의 세대 차이가 점진적 개선이 아닌 주행 스택의 아키텍처 전환을 겨냥한 것인 이유다.

제2절 — Nvidia Drive Orin: 현재 표준

2026년 중반 기준으로 Nvidia Drive Orin은 AV 추론 칩 시장을 지배하는 제품이다. 높은 TOPS, 유연한 프로그래머빌리티, 광범위한 OEM 채택의 조합으로 프리미엄 자율주행 시스템의 사실상 표준 플랫폼이 되었다.

Orin 차원	세부 내용
아키텍처	12코어 Arm Cortex-A78AE + 2048코어 Ampere GPU + 전용 DLA(딥러닝 가속기) 유닛
성능	칩당 최대 254 TOPS
전력 소비	구성에 따라 45~60W TDP
공정 노드	Samsung 8nm (일부 변형은 TSMC 7nm 추정)
AV 배치	Mercedes EQS/S-Class DRIVE 시스템; Volvo EX90; Lucid Air; XPENG; Li Auto; Waymo (추정)
가격 (추정)	자동차 양산 규모에서 칩당 $100~300 (추정)
멀티칩 확장	듀얼 Orin = 508 TOPS; 고급 AV 플랫폼은 듀얼 Orin 이상 사용
경쟁자	Mobileye EyeQ Ultra (2024~2026년 목표), Qualcomm Snapdragon Ride Elite, Tesla FSD 칩 (독점)

Orin의 DLA 통합은 추론 워크로드에서의 전력 효율에서 GPU 코어 단독을 크게 상회한다. 또한 Nvidia의 DRIVE 소프트웨어 스택, CUDA 툴체인, Isaac 로보틱스 플랫폼은 OEM 엔지니어링 팀에 친숙한 프로그래밍 인터페이스를 제공해 강력한 소프트웨어 락인 해자를 형성하고 있다.

제3절 — Nvidia Drive Thor: 차세대

Nvidia Drive Thor는 Orin의 후계자로, 2025~2026년 양산 차량을 목표로 한다. 가장 파괴적인 아키텍처 특징은 통합이다: Thor는 여러 칩을 하나로 대체한다.

Thor 차원	세부 내용
아키텍처	AV 컴퓨트 + 차량 내 인포테인먼트(IVI) + ADAS를 통합하는 단일 칩
성능	2,000 TOPS (Orin 254 TOPS의 약 8배)
공정 노드	TSMC 4N (4nm 클래스)
전력 (추정)	~150W TDP (추정)——Orin보다 높아 차량 열 설계가 제약 요인이 됨
핵심 디자인 윈	BYD (세계 최대 전기차 제조업체)가 차세대 차량에 Drive Thor 채택 발표
아키텍처 우위	Blackwell GPU 아키텍처; 어텐션 기반 신경망을 위한 Transformer Engine; 엔드투엔드 주행 모델 가속
중요성	컴퓨트 세대가 어떤 AI 아키텍처가 차량에 실제 배포 가능한지를 결정

Thor 통합 전략은 단순한 성능 업그레이드가 아닌 시스템 수준의 아키텍처적 내기다. TSMC 4N 공정 노드로의 전환은 Nvidia Drive 칩이 처음으로 삼성이 아닌 TSMC에서 제조됨을 의미하며, Orin의 삼성 집중 공급망 리스크를 Thor의 대만 TSMC 집중 리스크로 전환한다. BYD 디자인 윈은 Thor의 가장 중요한 상업적 신호다.

제4절 — Tesla FSD 칩: 자체 개발 대안

Tesla는 Hardware 3(2019년) 이후 FSD 스택용 추론 칩을 자체 설계하고 있다. Nvidia 하드웨어를 구매하는 대신 자체 설계를 선택한 것은 자동차 산업에서 가장 영향력 있는 수직 통합 결정 중 하나다.

Tesla FSD 칩 차원	세부 내용
설계	완전 맞춤 설계——Tesla의 실리콘 팀이 설계 (Apple에서 영입한 Pete Bannon 주도); Arm CPU 코어 없음; Tesla 카메라 파이프라인 신경망 추론에 최적화
제조	TSMC 7nm (HW3 / FSD 칩 1); TSMC 7nm+ (HW4 / FSD 칩 2 추정)
성능	HW3: 칩당 144 TOPS (차량 1대에 2개 = 288 TOPS); HW4: 300~500+ TOPS (추정)
비용 우위 (추정)	자체 설계 후 TSMC에서 대량으로 실리콘 구매 시, 동등 성능의 Nvidia 칩 구매 대비 40~60% 저렴한 것으로 추정 (est.)
공급망 독립성	Tesla는 Nvidia의 칩 배분 제약이나 가격 정책에 얽매이지 않음; FSD 컴퓨트 공급망을 자체적으로 통제
맞춤화	Tesla는 자사의 특정 신경망 아키텍처에 맞게 칩 아키텍처를 정밀하게 최적화 가능
리스크	Tesla의 신경망 아키텍처가 FSD 칩이 제공할 수 없는 컴퓨트를 필요로 하면, 다음 칩 세대(12~18개월 실리콘 개발 사이클)를 기다려야 함
Dojo 칩 (D1)	FSD 칩과 별개; 훈련 전용 (Dojo 데이터센터); 차량에는 탑재되지 않음

자체 실리콘 결정은 AV 컴퓨트 스택에서 Tesla의 가장 중요한 구조적 우위다. Tesla의 신경망 아키텍처에 특화된 칩을 설계함으로써, 다양한 OEM 요건을 서비스해야 하는 범용 칩보다 와트당 훨씬 더 많은 유효 TOPS를 추출할 수 있다. Tesla 규모에서의 비용 우위는 복합 효과를 낳으며, 40~~60% 비용 절감은 합리적인 추정(est.)이다. 리스크 측면도 현실적이다: 칩 개발 사이클은 18~~36개월이 소요된다.

제5절 — 지정학적 공급망 리스크

리스크 차원	세부 내용
TSMC 집중도	Tesla FSD 칩과 Nvidia Thor 모두 TSMC(대만)에서 제조; 전 세계 첨단 노드(7nm 미만) 칩의 약 90%가 TSMC에서 생산; 대만 지정학적 리스크는 공급망의 실존적 변수
Orin의 Samsung 8nm	Nvidia Orin은 Samsung 8nm 사용; Samsung Foundry 평택 공장(한국)——대만 TSMC보다 지정학적 노출은 낮지만 여전히 집중되어 있음
미국 수출 규제	Nvidia Drive Orin/Thor는 중국 자동차 AI 용도에 수출 규제 적용; 중국 AV 기업은 국산 대안 사용 필요
Horizon Robotics Journey 6	중국 국산 AV 칩; 128~256 TOPS (추정); 구형 Orin과 저성능 계층에서 경쟁
HBM (고대역폭 메모리)	고성능 AI 칩은 SK하이닉스 또는 삼성의 HBM 필요; SK하이닉스가 주요 공급업체; 한국 집중도가 공급망 리스크 추가
첨단 패키징 (CoWoS, InFO)	AI 칩의 2.5D 패키징은 거의 TSMC의 CoWoS 공정에 독점; 패키징 용량이 Nvidia H100/H200 공급의 병목이었음

수출 규제 변수는 글로벌 AV 반도체 시장을 양분한다: 중국 외에서는 Nvidia 지배, 중국 내에서는 국산 칩 지배, Tesla는 자체 FSD 칩(Nvidia 수출 규제 비적용)으로 두 시장에서 독자적 위치를 점유한다. 첨단 패키징은 웨이퍼 생산과 독립된 병목으로 부상했으며, 패키징 용량 확장 타임라인은 18~24개월이다.

제6절 — 양산 확대 벤치마크 지표로서의 컴퓨트

컴퓨트 벤치마크	Tesla	Waymo (추정)	중국 AV (추정)
차량 탑재 추론 칩	독점 FSD 칩 (TSMC)	Nvidia Orin (추정, 듀얼 칩)	Horizon Robotics Journey 6 / Huawei MDC
차량당 TOPS (추정)	288+ TOPS (HW3); 500+ TOPS (HW4 추정)	508+ TOPS (듀얼 Orin 추정)	128~256 TOPS (추정)
공급망 독립성	높음 (독점 칩; TSMC 공급 계약)	낮음~중간 (Nvidia 배분 의존)	중간 (국산 칩; 미국 수출 규제 없음)
차량당 칩 비용 (추정)	낮음 (자체 설계 경제성)	높음 (Nvidia 양산 가격)	낮음 (국내 가격)
차세대 칩 타임라인	HW5 (추정 2026~2027년); TSMC 3nm 가능성	Thor 도입 (추정 2025~2026년)	Journey 7 / Ascend 자동차용 (추정)

세 가지 구조적 관찰: 첫째, Tesla의 자체 실리콘은 비중국 시장에서 가장 강력한 공급망 독립성을 제공한다. 둘째, Waymo의 Nvidia 의존성은 실제 운영상의 제약이다. 셋째, 중국 AV 생태계의 차량당 TOPS 격차는 가장 컴퓨팅 집약적인 엔드투엔드 AI 주행 아키텍처 배포의 실제 한계다. 컴퓨트 세대 리듬——약 3~~4년마다 한 세대, TOPS 4~~8배 향상——이 AV 스택의 아키텍처 발전 박자를 결정한다. Physical AI 양산 확대 타임라인은 칩 타임라인과 분리해서 분석할 수 없다.

주의: 본고의 모든 성능 수치, 비용 추정, 공급망 평가 및 시장 구조 관찰은 2026년 중반 기준의 공개된 기업 발표, 기술 문서, 언론 보도 및 애널리스트 리서치에 기반한다. “(추정)“으로 표시된 수치는 방향성 추정치이며 확인된 사양으로 취급해서는 안 된다. 본고는 투자 조언을 구성하지 않는다.