Skip to content
AI-Daily-Builder

2026-06-06 次瀏覽 $ALAB · Astera Labs · Scorpio X-Series Smart Fabric Switch

Astera Labs 的 320 通道 Scorpio X 系列將記憶體語意的縱向擴充網狀架構推進至 PCIe 6

Astera Labs 於 2026 年 5 月 5 日發表 Scorpio X 系列 320 通道智慧網狀交換器,這是一款具網內運算的高基數 PCIe 6 縱向擴充交換器,鎖定其估計到 2030 年達 200 億美元的商用縱向擴充晶片市場,量產爬升落在 2026 下半年。

發表內容

2026 年 5 月 5 日,Astera Labs 推出 Scorpio X 系列 320 通道智慧網狀交換器,並稱其為業界最大的開放式記憶體語意網狀交換器。最引人注目的數字是基數:單一裝置上具備 320 通道的 PCIe 6 連接能力。同時,該公司將其 Scorpio P 系列 PCIe 網狀架構家族擴展為涵蓋 32 至 320 通道,讓系統架構師在前端網路與加速器互連上都有多種交換器規模可選。

其訴求是結構性的。單一高基數交換器將過去由多個較小交換器組成的樹狀結構整併,使更多加速器能在一跳之內彼此互通。執行長 Jitendra Mohan 將其定位為一款「取代多個傳統交換器,以在單一跳數內實現更大的縱向擴充叢集規模並降低整體延遲」的交換器。

為何「縱向擴充」與「記憶體語意」很重要

AI 網路世界分為縱向擴充(在一個 pod 內對加速器進行緊密、低延遲的耦合,是 Nvidia NVLink 的領域)與橫向擴充(機架之間的 Ethernet/InfiniBand 網狀架構)。Scorpio X 系列正是一個縱向擴充的布局,而 PCIe 6 是其傳輸層。

Astera 所倚重的差異化要素是記憶體語意連接:加速器使用原生的 load/store 操作來存取散布於網狀架構上的資源,而非透過軟體網路堆疊,因此整個網狀架構表現得更像一個統一的記憶體池。這消除了封包轉譯的開銷,與 CXL 多年來推動的概念路線相同,如今應用於 GPU 對 GPU 的縱向擴充。

該交換器也搭載命名為 Hypercast 與 In-Network Compute 的硬體引擎。Astera 聲稱這些引擎可將集合運算提升至多達 2 倍,以改善首字輸出時間(time-to-first-token)與每瓦詞元數(tokens-per-watt)。註腳中的細節比標題更為具體:在 AllReduce 中相較於傳統 Ring AllReduce 至少降低 50% 延遲,這是透過將 ReduceScatter 與 AllGather 步驟卸載至交換器本身來達成。

競爭定位

項目細節
通道數 / 傳輸層320 通道,PCIe 6
家族範圍Scorpio P 系列現為 32 至 320 通道
集合運算宣稱至多 2 倍;相較 Ring AllReduce 至少降低 50% AllReduce 延遲
量產爬升2026 下半年
所述 TAM商用縱向擴充交換晶片到 2030 年約 200 億美元

值得注意的是,Astera 將 Scorpio 定位為同時相容於 Nvidia 的 NVLink Fusion 與開放的 UALink 標準,而非作為 NVLink 的正面替代品。這種兩面押注正是有趣之處:它讓同一款交換晶片能銷售到以 Nvidia 為中心的機架,也能進入 AMD/Broadcom/超大規模業者的開放標準陣營。該公司計劃於 2026 年 6 月初在台北的 Computex 展出此產品。

實務者註記

對待這個「2 倍」集合運算數字,應與對待任何廠商的集合運算宣稱抱持同等謹慎:真正具支撐力且可驗證的數字是相較於 Ring AllReduce 至少降低 50% 的 AllReduce 延遲,而即便如此也取決於訊息大小、拓樸結構,以及你的框架集合函式庫是否真的卸載至交換器。商用晶片的論點唯有在超大規模業者與新雲端業者購買交換晶片而非自行打造時才能兌現;量產爬升是 2026 下半年,因此真正的證明在於未來兩到三季的設計採用(design-win)揭露,而非規格書本身。

被低估的角度

較少人談的故事是,PCIe 6 正被要求承擔 NVLink 與即將問世的 UALink 200G 網狀架構原本就是為此打造的工作,而在 PCIe 上採用記憶體語意的 load/store 模型,更倚賴 CXL 式的一致性與定址基礎工程,而非原始的通道速度。如果「跨網狀架構的 load/store」成為縱向擴充的預設程式設計模型,長期競爭的焦點將從「誰的連結最快」轉向開發者實際針對誰的定址、一致性與交換器內運算語意進行最佳化,這比起頻寬之爭,更是一場智慧財產與軟體生態系之戰。這對最先讓框架據以最佳化的交換晶片供應商有利,無論底層掛的是哪一面實體層旗幟(PCIe、NVLink Fusion 或 UALink)。


來源

請喝咖啡