2026-05-20 — views

阿里巴巴平头哥真武 M890 —— 144GB 国产 AI 加速器，前代 3 倍

为什么值得读关键数字是「已出货 56 万颗」—— 这不是纸上发表。中国国产加速器堆叠已进入量产，而 M890 对代理工作量的调校显示，脱钩现在瞄准的是 NVIDIA 卖的同一批工作量。

阿里平头哥在杭州发表真武 M890：144GB 内存、800GB/s 互连、810E 的 3 倍。真武系列已出货 56 万颗给 400+ 客户。V900 于 2027。

阿里巴巴的芯片子公司 平头哥（T-Head） 在杭州发表 真武 M890 AI 加速器（5/19-20）。规格具竞争力 —— 但真正重要的数字埋在下面：真武系列已出货 56 万颗 给 400+ 客户、横跨 20 个产业。这是量产计划，不是纸上发表。

规格

平头哥列出多年节奏：

公布的多年 roadmap 本身就是信号：它告诉中国超大规模与企业，他们可以围绕国产供应线规划，而不必赌 NVIDIA 出口许可的可用性。

三个解读：

量是真的。 出货 56 万颗让平头哥跨过「展示」阶段。中国国产加速器市场 —— 华为昇腾、寒武纪、现在加上规模化的平头哥真武 —— 是真正的第二供应生态，不是愿景。
代理工作量调校是关键。 M890 明确为代理任务调校，并搭配一个连续运行 35 小时的模型（Qwen 3.7-Max）。中国堆叠现在瞄准的是 NVIDIA 卖的同一批高价值工作量 —— 不只是更便宜的推理。
144GB 是 HBM 级内存。 那个容量在内存受限工作量（大 context 推理、代理状态）上与高阶西方加速器竞争，而这些工作量越来越定义 AI 经济学。

对西方开发者： 这不改变你的堆叠，但改变需求图。中国量产自己的加速器降低全球 HBM/算力供应的一个尾端风险来源 —— 并为 HBM controller IP 与内存供应链增加一个竞争者。
对任何在模型化 NVIDIA TAM 的人： 中国国产替代现在是可量化逆风，不是假设。56 万颗是地板，roadmap 延伸到 2028。
盯软件堆叠。 硬件必要但不充分 —— 平头哥的问题是 CUDA 等价工具是否成熟到让芯片以额定性能被使用。那是每个 NVIDIA 挑战者的历史瓶颈。

被低估的角度：脱钩叙事通常聚焦训练，但 M890 是为代理 + 推理调校 —— 随部署扩张的工作量，不是研究。若中国国产堆叠在推理经济学上有竞争力，长期替代在结构上比训练芯片头条暗示的更大，因为量在推理那边。