2026-05-20 — views
阿里巴巴平头哥真武 M890 —— 144GB 国产 AI 加速器,前代 3 倍
为什么值得读 关键数字是「已出货 56 万颗」—— 这不是纸上发表。中国国产加速器堆叠已进入量产,而 M890 对代理工作量的调校显示,脱钩现在瞄准的是 NVIDIA 卖的同一批工作量。
阿里平头哥在杭州发表真武 M890:144GB 内存、800GB/s 互连、810E 的 3 倍。真武系列已出货 56 万颗给 400+ 客户。V900 于 2027。
阿里巴巴的芯片子公司 平头哥(T-Head) 在杭州发表 真武 M890 AI 加速器(5/19-20)。规格具竞争力 —— 但真正重要的数字埋在下面:真武系列已出货 56 万颗 给 400+ 客户、横跨 20 个产业。这是量产计划,不是纸上发表。
规格
| 指标 | 真武 M890 |
|---|---|
| GPU 内存 | 144 GB |
| 互连带宽 | 800 GB/s |
| 对比真武 810E 性能 | 3 倍 |
| 工作量焦点 | 训练 与 推理,为 代理任务 调校 |
| 配套模型 | Qwen 3.7-Max(连续运行 35 小时) |
Roadmap
平头哥列出多年节奏:
- 真武 M890 —— 现在
- V900 —— 2027 Q3
- J900 —— 2028 Q3
公布的多年 roadmap 本身就是信号:它告诉中国超大规模与企业,他们可以围绕国产供应线规划,而不必赌 NVIDIA 出口许可的可用性。
为什么重要
三个解读:
- 量是真的。 出货 56 万颗让平头哥跨过「展示」阶段。中国国产加速器市场 —— 华为昇腾、寒武纪、现在加上规模化的平头哥真武 —— 是真正的第二供应生态,不是愿景。
- 代理工作量调校是关键。 M890 明确为代理任务调校,并搭配一个连续运行 35 小时的模型(Qwen 3.7-Max)。中国堆叠现在瞄准的是 NVIDIA 卖的同一批高价值工作量 —— 不只是更便宜的推理。
- 144GB 是 HBM 级内存。 那个容量在内存受限工作量(大 context 推理、代理状态)上与高阶西方加速器竞争,而这些工作量越来越定义 AI 经济学。
Practitioner note
- 对西方开发者: 这不改变你的堆叠,但改变需求图。中国量产自己的加速器降低全球 HBM/算力供应的一个尾端风险来源 —— 并为 HBM controller IP 与内存供应链增加一个竞争者。
- 对任何在模型化 NVIDIA TAM 的人: 中国国产替代现在是可量化逆风,不是假设。56 万颗是地板,roadmap 延伸到 2028。
- 盯软件堆叠。 硬件必要但不充分 —— 平头哥的问题是 CUDA 等价工具是否成熟到让芯片以额定性能被使用。那是每个 NVIDIA 挑战者的历史瓶颈。
被低估的角度:脱钩叙事通常聚焦训练,但 M890 是为代理 + 推理调校 —— 随部署扩张的工作量,不是研究。若中国国产堆叠在推理经济学上有竞争力,长期替代在结构上比训练芯片头条暗示的更大,因为量在推理那边。
来源
- Alibaba reveals more powerful Zhenwu AI chip, new LLM — CNBC ↗
- Alibaba Unveils New AI Chip for Training and Inferencing — Bloomberg ↗
- Alibaba unveils Zhenwu M890 chip and Qwen3.7-Max LLM — Lets Data Science ↗
- Alibaba unveils new AI chip in push for domestic alternatives — Yahoo Finance ↗