Skip to content
AI-Daily-Builder

2026-05-20 views

알리바바 T-Head 전우(Zhenwu) M890 —— 144GB 국산 AI 가속기, 전세대 3배

읽어야 하는 이유 중요한 숫자는 「이미 56만 대 출하」—— 페이퍼 론칭이 아니다. 중국 국산 가속기 스택은 볼륨에 도달했고, M890의 에이전트 워크로드 튜닝은 디커플링이 이제 NVIDIA가 파는 같은 워크로드를 겨냥함을 보여준다.

알리바바 T-Head가 항저우에서 전우 M890 공개: 144GB 메모리, 800GB/s 인터칩, 810E의 3배. 전우는 이미 56만 대를 400+ 고객에 출하. V900은 2027.

알리바바의 칩 자회사 T-Head(平头哥) 가 항저우에서 전우(Zhenwu) M890 AI 가속기를 공개했다(5/19-20). 스펙은 경쟁력 있다 —— 하지만 진짜 중요한 숫자는 아래 묻혀 있다: 전우 시리즈는 이미 56만 대 출하 되어 400+ 고객, 20개 산업에 걸쳐 있다. 이것은 볼륨 프로그램이지 페이퍼 론칭이 아니다.

스펙

지표전우 M890
GPU 메모리144 GB
인터칩 대역폭800 GB/s
전우 810E 대비 성능3배
워크로드 초점학습 추론, 에이전트 작업 튜닝
동반 모델Qwen 3.7-Max(35시간 연속 구동)

로드맵

T-Head는 다년 리듬을 제시:

공표된 다년 로드맵 자체가 신호: 중국 하이퍼스케일러와 기업에게, NVIDIA 수출 라이선스 가용성에 베팅하는 대신 국산 공급 라인을 중심으로 계획할 수 있다고 알린다.

왜 중요한가

세 가지 해석:

  1. 볼륨이 진짜다. 56만 대 출하는 T-Head를 「데모」 단계 너머로 보냈다. 중국 국산 가속기 시장 —— Huawei Ascend, Cambricon, 그리고 이제 규모화된 T-Head 전우 —— 는 진정한 제2 공급 생태계이지 열망이 아니다.
  2. 에이전트 워크로드 튜닝이 핵심. M890은 명시적으로 에이전트 작업용으로 튜닝되고 35시간 연속 구동 모델(Qwen 3.7-Max)과 페어. 중국 스택은 이제 NVIDIA가 파는 같은 고가치 워크로드를 겨냥 —— 단지 더 싼 추론이 아니다.
  3. 144GB는 HBM 급 메모리. 그 용량은 메모리 바운드 워크로드(대 컨텍스트 추론, 에이전트 상태)에서 하이엔드 서구 가속기와 경쟁하며, 이 워크로드가 점점 AI 경제성을 정의한다.

Practitioner note

과소평가된 각도: 디커플링 내러티브는 보통 학습에 초점을 맞추지만, M890은 에이전트 + 추론용으로 튜닝됐다 —— 연구가 아니라 배포와 함께 스케일하는 워크로드. 중국 국산 스택이 추론 경제성에서 경쟁력 있다면, 장기 대체는 학습 칩 헤드라인이 시사하는 것보다 구조적으로 더 크다. 볼륨이 추론에 있기 때문이다.


출처

태그

커피