Builder Daily

2025-12-25

NVIDIA, Groq를 200억 달러에 인수 — LPU 시대의 종말

NVIDIA가 2025년 크리스마스 이브에 Groq를 200억 달러에 인수하며 사상 최대 거래를 완료. Groq 창업자와 엔지니어 90%가 NVIDIA에 합류.

2025년 12월 24일, NVIDIA는 200억 달러에 Groq를 인수한다고 발표하고 새해 전에 거래를 마무리했다. NVIDIA 역사상 최대 인수이며, 전략적 의미에서는 2022년 무산된 Arm 인수(제안가 400억 달러)를 능가한다. Groq는 더 이상 독립 기업으로 존재하지 않는다.

Groq는 무엇이었나

Groq는 LPU(언어 처리 장치) 를 만들었다 — Transformer 추론에 특화된 결정적 스트리밍 칩 아키텍처다. 작업을 동적으로 스케줄링하는 GPU와 달리, LPU는 고정된 데이터플로우 그래프를 와이어 스피드로 실행한다. 결과: LLaMA-3-70B를 칩당 초당 300~800 토큰, TTFT 100ms 미만으로 처리하며, 2024년 대부분 동안 가장 빠른 공개 추론 엔드포인트가 되었다.

GroqCloud 공개 API는 다른 추론 제공업체의 벤치마크가 됐다. 2024년 3분기 정점에서 GroqCloud는 하루 10억 토큰 이상을 처리했다.

NVIDIA는 왜 200억 달러를 지불했나

NVIDIA의 H100/H200 트레이닝 분야 지배력은 흔들리지 않는다. 전장은 추론이다. LPU의 결정적 실행 모델은 근본적으로 다른 아키텍처를 제시했다 — CUDA에서 쉽게 복제할 수 없는 것이다. Groq를 인수함으로써 NVIDIA는:

  1. 추론 성능에서 가장 신뢰할 만한 NVIDIA 대안을 제거
  2. 약 400명의 칩 아키텍트와 컴파일러 엔지니어 흡수(창업자 Jonathan Ross와 Google TPU v1을 만든 팀 포함)
  3. LPU 특허 확보 — Transformer를 위한 정적 스케줄링 데이터플로우 실행을 포괄

거래 구조는 기술 및 인재 인수 — 기존 GroqCloud 고객 계약은 종료되거나 NVIDIA Cloud로 이전됐다.

LPU의 운명

Jonathan Ross와 Groq 엔지니어 90%가 NVIDIA에 합류했다. LPU 아키텍처는 차세대 NVIDIA 추론 하드웨어에 통합되는 것으로 보이며, 2026년 또는 2027년 제품에서 다른 이름으로 등장할 가능성이 있다. Groq가 개발 중이던 차세대 LPU TSQ-1은 다른 이름으로 NVIDIA 로드맵에 통합됐다.

사우디아라비아 SDAIA, Dell 등 이미 배포된 랙 스케일 시스템(LanguageModel System 1, LMS-1)은 계속 운영되지만 신규 배포는 받지 않는다.

시장 반응

이번 인수는 NVIDIA가 추론 전용 하드웨어를 점진적 경쟁자가 아닌 실존적 위협으로 본다는 점을 확인시켰다. AMD MI300X, Intel Gaudi 3, 그리고 이제 사라진 Groq는 모두 추론 시장을 갉아먹고 있었다 — 그러나 200억 달러라는 가격표는 NVIDIA가 아키텍처 록인을 유지하기 위해 비용을 지불할 의지가 있음을 보여준다.

남은 AI 칩 스타트업 — Cerebras, SambaNova, Tenstorrent, d-Matrix — 에게 Groq 인수는 양날의 검이다: 이 분야에 실질적 가치가 있음을 검증한 동시에, NVIDIA가 경쟁 대신 인수를 선택할 수 있음을 상기시켰다.

실무자 노트

GroqCloud를 사용했다면 API 액세스는 2026년 1분기에 종료됐다. 마이그레이션 옵션: Cerebras Inference(유사한 지연 시간 특성), Together AI, 또는 Fireworks. Groq 인수는 또한 다음을 상기시킨다: 단일 벤더 추론 스타트업에 인프라를 베팅하는 것은 실질적 중단 위험이 있다. 멀티 프로바이더 API 추상화(LiteLLM, LangChain)는 성능 도구가 아니라 사업 연속성 도구다.


출처

태그

커피