2026-05-19 — 次浏览 $RMBS · Rambus + Synopsys · HBM3E / HBM4 controller + PHY IP
HBM Controller 之争 — Rambus vs Synopsys 竞逐 AI 加速器内存 IP
Rambus(RMBS)与 Synopsys(SNPS)的 HBM controller IP 之争,决定哪一颗 AI 加速器硅片如期出货。每颗 NVIDIA / AMD / 超大规模 ASIC 都载 4-8 个 HBM 堆叠;每个堆叠都用这两家其中之一的 controller + PHY IP。
每颗 NVIDIA Blackwell、每颗 AMD MI400、每颗超大规模 AI 加速器都挂 4 到 8 个 HBM 堆叠 紧邻计算 die。每个堆叠与 SoC 通信需透过 controller + PHY(物理层)IP block,授权自两家其中之一:Rambus(RMBS) 或 Synopsys(SNPS)。
这是 AI 基建中最被忽视的瓶颈。2024-2025 是 CoWoS 上头条;2026-2027 将轮到 HBM controller。
HBM Controller IP 块实际做什么
HBM(高带宽内存)是 3D 堆叠 DRAM,住在计算 die 旁边的硅中介层上。要与它通信,SoC 需要:
| 块 | 功能 |
|---|---|
| 内存控制器(数字) | 把 SoC 内存请求翻译成 HBM 命令(读/写/refresh/训练) |
| PHY(物理层) | 模拟/混信号层,实际以 6.4 Gbps+ 每 pin 的速度驱动 >1000 pin 的 HBM 接口 |
| Refresh + ECC + RAS 逻辑 | 可靠性、可用性、可维护性 —— 在持续 AI 工作量下保持 HBM 稳定 |
| 电源管理 | HBM4 支援 DVFS(动态电压/频率调整),controller 管控 |
Controller + PHY 通常打包成单一单位授权。客户(NVIDIA、AMD、超大规模、有时是 HBM 厂的参考设计)把它实例化在计算 die 旁。
两家对比
Rambus(RMBS)—— 内存 IP 专家
| 面向 | Rambus 定位 |
|---|---|
| HBM3E controller | 量产中,多客户设计 |
| HBM4 controller | 2025 tape-out 公告;2026 量产硅 |
| PHY 支援 | 8.4-9.6 Gbps/pin(HBM4 规格);也支援 DDR5 / LPDDR5X / GDDR7 |
| 可靠性功能 | 晶粒上 ECC、post-package repair(PPR)、RAS 计数器 |
| 客户(披露) | NVIDIA(透过 HBM 厂参考)、AMD、多个超大规模 ASIC 设计 |
| 商业模式 | 纯 IP 授权 + 每堆叠权利金 |
| 强项 | 30+ 年内存 IP 血统;与 SK Hynix、Micron、Samsung 参考流程绑最紧 |
| 弱项 | 公司较小(~$10 亿市值);无法与更广的 EDA 授权打包 |
Synopsys(SNPS)—— 更广的 IP 目录含 HBM
| 面向 | Synopsys 定位 |
|---|---|
| HBM3E controller | 透过 DesignWare 量产;在 chiplet 参考流程中包套 |
| HBM4 controller | 2024 公告;2025 sample;2025 末量产 tape-out |
| PHY 支援 | 符合 HBM4 规格(基准 8.4 Gbps/pin,路线图到 9.6+) |
| 可靠性功能 | ECC、RAS、整合 DesignWare 验证 IP |
| 客户(披露) | 超大规模 ASIC 设计(Google TPU、AWS Trainium、MS Maia 都在设计某处用 Synopsys IP)、Intel、AMD MI300/400 周期 |
| 商业模式 | IP 授权,常与 EDA 工具合约打包 |
| 强项 | 单一供应商便利(EDA + IP + 验证 + 现在加 ANSYS 仿真);TSMC 参考流程整合最深 |
| 弱项 | 内存 IP 只是众多产品线之一;专精度不如 Rambus |
为什么此战对 AI 产能很重要
三个结构性原因,HBM controller 即将成为限制因素:
1. 下一代 AI 加速器强制 HBM4
Blackwell 级后继(NVIDIA Rubin、AMD MI500 级、Intel Falcon Shores 2、超大规模 ASIC v2)全部目标 12-Hi 堆叠 HBM4,每堆叠 ~2 TB/s 带宽、36-48 GB 容量。HBM3E 在 2026 年中对新旗舰 AI 硅片来说已是 EOL。
新 HBM4 controller IP block 必须:
- 在目标晶圆代工(TSMC N3/N2)验证
- 与 HBM 厂的堆叠共同设计
- 在客户计算 die 中 tape-out + 首批硅
这是 12-18 个月时间表,从 IP 可用到出货硅。若 Rambus 或 Synopsys 的 HBM4 IP 延迟,下游客户也延迟。
2. 量的算术 —— 每个堆叠都付权利金
2026 大略单位算术:
- 500 万颗 Blackwell 级 GPU 于 2026 出货(依目前分析师共识)
- × 每 GPU 8 个 HBM 堆叠 = 4,000 万个 HBM 堆叠
- × 每堆叠 $1-5 controller IP 权利金 = $4,000-2 亿美元年化,光 controller IP,加在内存营收之上
再加 AMD MI400 + 超大规模 ASIC。2026 年总 HBM controller IP 市场可能是 $1.5-4 亿美元,几乎全部被 Rambus + Synopsys 吃下。
3. HBM5 在地平线上(2027-2028)
JEDEC 的 HBM5 工作小组目标 每堆叠 3+ TB/s 与 64 GB 容量。IP 层必须在硅量产前进化。哪家先推出商业化 HBM5 controller,预设赢下未来 3 年周期 —— HBM IP 一旦赢得设计,切换成本极高。
谁在用谁
披露偏薄(HBM 客户关系多 NDA),但公开可追的:
| 硅片 | HBM 世代 | 可能 controller IP | 备注 |
|---|---|---|---|
| NVIDIA Blackwell B200 | HBM3E | 混合(Rambus + Synopsys 各有角色) | 多 HBM 供应商 → 多 IP 接触 |
| AMD MI300X / MI325X | HBM3 | Rambus 参考流程 | 长期 AMD-Rambus 关系 |
| AMD MI400(即将) | HBM4 | 可能 Synopsys 较重 | Synopsys DesignWare HBM4 公告共同设计 |
| Google TPU v6/v7 | HBM3E | Synopsys(内部定制) | 2024 TPU 简报披露 |
| AWS Trainium 3 | HBM3E | Synopsys | 依 AWS 硅片设计伙伴披露 |
| Intel Falcon Shores 2 | HBM3E → HBM4 | Synopsys + Intel 内部 | 混合模式 |
| Microsoft Maia 2 | HBM3E | 可能 Synopsys | 超大规模 ASIC 偏好 Synopsys 打包 |
头条观察: 超大规模偏好 Synopsys(与 EDA 支出打包)。纯商卖加速器厂(NVIDIA、AMD)偏好多源。Rambus 在 HBM4 周期抢下份额,因为与 HBM 厂专属共同设计;但 Synopsys 绝对营收仍领先。
两家的风险
- HBM 厂内制化。 SK Hynix 有自己的 controller IP 团队;若开始把预验证 controller 随 HBM SKU 出货,Rambus 与 Synopsys 都损失那些设计的每堆叠权利金。
- 客户内制化。 深硅片团队的超大规模(Google、AWS)可能想完全拥有设计而把 HBM controller 内制化。时间表大概 2027-2028。封顶可触及市场。
- HBM4 规格延迟。 9.6 Gbps/pin 变体仍在 JEDEC 定稿。若规格有意义改动,两家都得重新 tape-out —— 对两家都贵。
Practitioner note
对开发者/硅片设计者:
- 若你在规划自研 AI 加速器,从 IP 授权签订到首批硅预算 4-6 个季度。HBM4 IP 可用性是关键路径前置时间,不是计算 IP。
- 尽可能 HBM controller IP 多源。 两家的硅都可运作;周期中段引进备援困难,但一开始就双源可防单一供应商延迟卡死 tape-out。
- 对投资人: HBM controller 权利金流对 AI 服务器量 × HBM 强度的杠杆最大。RMBS 是纯押注;SNPS 是打包押注。两家都在 2026-2028 HBM4-HBM5 转换中复利。
被低估的角度:HBM controller IP 是 AI 基建中悄悄复利的那层。当业界头条聚焦 TSMC 产能、NVIDIA GPU 出货、内存模组 ASP 时,每堆叠 controller 权利金一路成长 —— 因为每颗加速器都载 4-8 个堆叠。若 2026 年全 AI 硅片出货 5,000 万个 HBM 堆叠、2028 年扩张到 2 亿个,IP 层就以硅片量速度复利。除非有人算给你看,否则它是隐形的。