Skip to content
AI-Daily-Builder

2026-06-06 次浏览 $ALAB · Astera Labs · Scorpio X-Series Smart Fabric Switch

Astera Labs 的 320 通道 Scorpio X 系列将内存语义的纵向扩展网状架构推进至 PCIe 6

Astera Labs 于 2026 年 5 月 5 日发布 Scorpio X 系列 320 通道智能网状交换机,这是一款具网内计算的高基数 PCIe 6 纵向扩展交换机,瞄准其估计到 2030 年达 200 亿美元的商用纵向扩展芯片市场,量产爬坡落在 2026 下半年。

发布内容

2026 年 5 月 5 日,Astera Labs 推出 Scorpio X 系列 320 通道智能网状交换机,并称其为业界最大的开放式内存语义网状交换机。最引人注目的数字是基数:单一设备上具备 320 通道的 PCIe 6 连接能力。同时,该公司将其 Scorpio P 系列 PCIe 网状架构家族扩展为涵盖 32 至 320 通道,让系统架构师在前端网络与加速器互连上都有多种交换机规模可选。

其卖点是结构性的。单一高基数交换机将过去由多个较小交换机组成的树状结构整合,使更多加速器能在一跳之内彼此互通。CEO Jitendra Mohan 将其定位为一款「取代多个传统交换机,以在单一跳数内实现更大的纵向扩展集群规模并降低整体延迟」的交换机。

为何「纵向扩展」与「内存语义」很重要

AI 网络世界分为纵向扩展(在一个 pod 内对加速器进行紧密、低延迟的耦合,是 Nvidia NVLink 的领域)与横向扩展(机架之间的 Ethernet/InfiniBand 网状架构)。Scorpio X 系列正是一个纵向扩展的布局,而 PCIe 6 是其传输层。

Astera 所倚重的差异化要素是内存语义连接:加速器使用原生的 load/store 操作来访问散布于网状架构上的资源,而非通过软件网络堆栈,因此整个网状架构表现得更像一个统一的内存池。这消除了数据包转译的开销,与 CXL 多年来推动的概念路线相同,如今应用于 GPU 对 GPU 的纵向扩展。

该交换机也搭载命名为 Hypercast 与 In-Network Compute 的硬件引擎。Astera 声称这些引擎可将集合运算提升至多达 2 倍,以改善首字输出时间(time-to-first-token)与每瓦词元数(tokens-per-watt)。脚注中的细节比标题更为具体:在 AllReduce 中相较于传统 Ring AllReduce 至少降低 50% 延迟,这是通过将 ReduceScatter 与 AllGather 步骤卸载至交换机本身来达成。

竞争定位

项目细节
通道数 / 传输层320 通道,PCIe 6
家族范围Scorpio P 系列现为 32 至 320 通道
集合运算宣称至多 2 倍;相较 Ring AllReduce 至少降低 50% AllReduce 延迟
量产爬坡2026 下半年
所述 TAM商用纵向扩展交换芯片到 2030 年约 200 亿美元

值得注意的是,Astera 将 Scorpio 定位为同时兼容于 Nvidia 的 NVLink Fusion 与开放的 UALink 标准,而非作为 NVLink 的正面替代品。这种两面押注正是有趣之处:它让同一款交换芯片能销售到以 Nvidia 为中心的机架,也能进入 AMD/Broadcom/超大规模厂商的开放标准阵营。该公司计划于 2026 年 6 月初在台北的 Computex 展出此产品。

实务者注记

对待这个「2 倍」集合运算数字,应与对待任何厂商的集合运算宣称抱持同等谨慎:真正具支撑力且可验证的数字是相较于 Ring AllReduce 至少降低 50% 的 AllReduce 延迟,而即便如此也取决于消息大小、拓扑结构,以及你的框架集合函数库是否真的卸载至交换机。商用芯片的论点唯有在超大规模厂商与新云端厂商购买交换芯片而非自行打造时才能兑现;量产爬坡是 2026 下半年,因此真正的证明在于未来两到三季的设计采用(design-win)披露,而非规格书本身。

被低估的角度

较少人谈的故事是,PCIe 6 正被要求承担 NVLink 与即将问世的 UALink 200G 网状架构原本就是为此打造的工作,而在 PCIe 上采用内存语义的 load/store 模型,更倚赖 CXL 式的一致性与寻址基础工程,而非原始的通道速度。如果「跨网状架构的 load/store」成为纵向扩展的默认编程模型,长期竞争的焦点将从「谁的连接最快」转向开发者实际针对谁的寻址、一致性与交换机内计算语义进行优化,这比起带宽之争,更是一场知识产权与软件生态系之战。这对最先让框架据以优化的交换芯片供应商有利,无论底层挂的是哪一面物理层旗帜(PCIe、NVLink Fusion 或 UALink)。


来源

请喝咖啡