2026-05-03
피지컬 AI 라운드업 — 2026 Q2 휴머노이드 파운데이션 모델
2026 Q2 에 4 개의 휴머노이드 파운데이션 모델이 실기 데모를 공개했습니다: NVIDIA GR00T N2, Tesla Optimus Gen 3, Figure 03, Physical Intelligence π0.5. Sim-to-Real 격차는 좁혀지고 있지만 — 원격 조작 데이터가 풍부한 정교한 조작 작업에서만.
휴머노이드 로봇은 자신만의 “ChatGPT 모먼트”를 맞고 있습니다 — 다만 더 느리고, 더 혼란스럽고, 데이터 양에 제약되어 있을 뿐. 이번 분기에 실제로 출시된 것과 그것이 빌더에게 의미하는 바:
주목할 만한 4 가지 릴리스
1. NVIDIA GR00T N2 — 일반화 휴머노이드 파운데이션 모델
GR00T N2 는 RGB + 자기수용감각 + 언어를 입력으로 받아, 모든 휴머노이드 플랫폼의 관절 공간 액션을 출력하는 사전 학습된 Transformer 입니다. 헤드라인 숫자는 5 종 로봇 바디에서 70+ 작업 zero-shot 이지만, 실제로 유용한 숫자는 fine-tune 비율: 새 작업당 약 30 분의 원격 조작 데이터 (밑바닥부터 학습은 약 8 시간). Isaac Lab 및 Jetson Thor 개발 키트로 제공.
2. Tesla Optimus Gen 3 — 수직 통합 논리
Gen 3 는 무게를 57 kg 에서 48 kg 으로 줄이고 손의 DOF 를 22 까지 늘렸습니다 (Gen 2 는 11). 흥미로운 점은 하드웨어가 아니라 — Tesla 가 FSD V14 를 구동하는 같은 Dojo 학습 비전-언어 스택으로 Optimus 를 학습하기 시작한 것입니다. 그들은 “운전 데이터 규모가 조작 정책으로 복리적으로 이전된다”는 데 베팅합니다. 회의론자들은 “도로 보기”와 “나사 조이기”는 완전히 다른 액션 분포라고 지적합니다.
3. Figure 03 — 상업 배포 우선
Figure 03 은 신뢰성을 위해 DOF 를 희생: 총 28 DOF 이지만 BMW Spartanburg 공장의 고정 부품 로딩 작업에서 10,000+ 회 시도 95%+ 성공률. 교훈: 2026 Q2 공장 채택은 “일반화 데모”보다 “좁은 작업의 신뢰성”을 선호. Figure 는 두 독일 자동차 회사로부터 5 자릿수 백로그를 발표했습니다.
4. Physical Intelligence π0.5 — 데이터의 해자
π0.5 (π1 을 향한 반 걸음) 는 이번 분기 오픈 웨이트의 깜짝 등장입니다. Open X-Embodiment 2.0 데이터셋 (1.2M 궤적, 35 종 로봇 바디) 에서 학습되었고, GR00T N2 보다 약 6 배 작지만 벤치마크에서 동등한 성능. 핵심: 임바디드 정책에서는 데이터 다양성이 이미 파라미터 수를 이기고 있다.
빌더에게 의미하는 바
- Sim-to-Real 은 정교한 조작에서 좁혀지고 있지만 운동 제어에서는 여전히 막혀 있다. 새 물체의 픽-앤-플레이스: OK. 거친 지형 보행: 플랫폼별 수동 튜닝 필요.
- 원격 조작 데이터가 새로운 학습 코퍼스. ALOHA-2 리그 ($35K) 가 랩의 기본 셋업이 되었습니다. 커스텀 스킬을 학습하려면 작업당 약 50 시간의 원격 조작을 예산으로 잡으세요.
- 추론 지연이 작업 복잡도를 제한한다. Jetson Thor 의 GR00T N2 가 30 Hz 추론은 조작에는 충분하지만 반응형 장애물 회피에는 너무 느립니다. 하이브리드 스택 (빠른 저수준 + 느린 VLA) 이 우세합니다.
- 배포 병목은 이제 능력이 아니라 안전 인증. 위 4 플랫폼 모두 오늘 유용한 일을 할 수 있습니다; 매출을 막는 것은 ISO 10218 + ISO/TS 15066 통과입니다.
Q3 관전 포인트
- 오픈 웨이트 GR00T 변형 (소문)
- action-chunking transformer 아키텍처를 적용한 π1 출시
- Tesla 내부 공장 외 첫 Optimus 공개 고객
- Boston Dynamics 전기 Atlas 상업 프로그램 (유압식 Atlas 는 은퇴)