Builder Daily

2026-05-03

피지컬 AI 라운드업 — 2026 Q2 휴머노이드 파운데이션 모델

2026 Q2 에 4 개의 휴머노이드 파운데이션 모델이 실기 데모를 공개했습니다: NVIDIA GR00T N2, Tesla Optimus Gen 3, Figure 03, Physical Intelligence π0.5. Sim-to-Real 격차는 좁혀지고 있지만 — 원격 조작 데이터가 풍부한 정교한 조작 작업에서만.

휴머노이드 로봇은 자신만의 “ChatGPT 모먼트”를 맞고 있습니다 — 다만 더 느리고, 더 혼란스럽고, 데이터 양에 제약되어 있을 뿐. 이번 분기에 실제로 출시된 것과 그것이 빌더에게 의미하는 바:

주목할 만한 4 가지 릴리스

1. NVIDIA GR00T N2 — 일반화 휴머노이드 파운데이션 모델

GR00T N2 는 RGB + 자기수용감각 + 언어를 입력으로 받아, 모든 휴머노이드 플랫폼의 관절 공간 액션을 출력하는 사전 학습된 Transformer 입니다. 헤드라인 숫자는 5 종 로봇 바디에서 70+ 작업 zero-shot 이지만, 실제로 유용한 숫자는 fine-tune 비율: 새 작업당 약 30 분의 원격 조작 데이터 (밑바닥부터 학습은 약 8 시간). Isaac Lab 및 Jetson Thor 개발 키트로 제공.

2. Tesla Optimus Gen 3 — 수직 통합 논리

Gen 3 는 무게를 57 kg 에서 48 kg 으로 줄이고 손의 DOF 를 22 까지 늘렸습니다 (Gen 2 는 11). 흥미로운 점은 하드웨어가 아니라 — Tesla 가 FSD V14 를 구동하는 같은 Dojo 학습 비전-언어 스택으로 Optimus 를 학습하기 시작한 것입니다. 그들은 “운전 데이터 규모가 조작 정책으로 복리적으로 이전된다”는 데 베팅합니다. 회의론자들은 “도로 보기”와 “나사 조이기”는 완전히 다른 액션 분포라고 지적합니다.

3. Figure 03 — 상업 배포 우선

Figure 03 은 신뢰성을 위해 DOF 를 희생: 총 28 DOF 이지만 BMW Spartanburg 공장의 고정 부품 로딩 작업에서 10,000+ 회 시도 95%+ 성공률. 교훈: 2026 Q2 공장 채택은 “일반화 데모”보다 “좁은 작업의 신뢰성”을 선호. Figure 는 두 독일 자동차 회사로부터 5 자릿수 백로그를 발표했습니다.

4. Physical Intelligence π0.5 — 데이터의 해자

π0.5 (π1 을 향한 반 걸음) 는 이번 분기 오픈 웨이트의 깜짝 등장입니다. Open X-Embodiment 2.0 데이터셋 (1.2M 궤적, 35 종 로봇 바디) 에서 학습되었고, GR00T N2 보다 약 6 배 작지만 벤치마크에서 동등한 성능. 핵심: 임바디드 정책에서는 데이터 다양성이 이미 파라미터 수를 이기고 있다.

빌더에게 의미하는 바

Q3 관전 포인트


Sources

커피