Skip to content
AI-Daily-Builder

2026-06-07 次瀏覽 $AMD · AMD / UALink Consortium · UALink / UALink-over-Ethernet scale-up fabric (Instinct MI455X Helios)

UALink 的交換器矽晶缺口:為何 AMD 首批 Helios 機櫃改用乙太網路出貨

AMD 於 6 月 4 日揭露的 Helios MI455X 機櫃,其 72 顆 GPU 的 scale-up 網域是跑在 UALink-over-Ethernet 而非原生 UALink 交換器上,因為來自 Astera Labs、Auradine、Enfabrica、XConn 與 Upscale AI 的交換器 ASIC 仍在驗證中。其結果是一場即時測試:在專用網狀架構迎頭趕上之前,通用乙太網路對加速器 scale-up 是否已夠用。

訊號

AMD 圍繞 Instinct MI455X 打造的「Helios」機櫃級平台於 2026 年 6 月 4 日被詳細揭露,而有意思的部分並不是 GPU,而是 GPU 之間的那條線。這座機櫃把 72 顆 MI455X 加速器縫合成單一 scale-up 網域,具有約 260 TB/s 的整體 scale-up 頻寬、31 TB 的 HBM4,以及約 2,900 dense FP4 PFLOPS,由最多 256 核的 EPYC「Venice」CPU 餵食,並透過 Pensando 網卡提供 43 TB/s 的 scale-out 網路。但首批系統並不是以原生方式執行 AMD 的招牌 scale-up 協定。它們跑的是 UALink-over-Ethernet(UALoE),一種把 UALink 語意承載在標準乙太網路訊框之內的傳輸方式,因為以報導的話來說,原生 UALink 交換晶片正「等待 AMD 客戶驗證與認證」。

那單一的替換就是當下整個 infra-IP 故事的核心。UALink 是 AMD 與盟友對 Nvidia NVLink 的開放回應:一種記憶體語意、低延遲的網狀架構,設計用來在單一 pod 內連接最多 1,024 顆加速器。規格面已一路狂奔,但讓它成真的矽晶卻還沒。

規格領先矽晶

UALink 聯盟於 2026 年 4 月 7 日批准了第二波規格,發布 200G 1.0 資料連結層與實體層,外加用於 in-network compute(以削減 GPU 間訊息流量)的新增內容、一個 chiplet 定義(把 UALink 嵌入 SoC 之中),以及一份 1.0 可管理性規格(gRPC、YANG、SAI、Redfish)。值得注意的是,2.0 通用規格在任何 1.0 矽晶出貨之前就已落地。聯盟主席坦言 1.0 與 2.0 版「不會是 Nvidia 的完整競爭者」,對等水準僅鎖定在 3.0 版,預期約一年後才會出現。

硬體時程才是限制所在。依聯盟指引,1.0 矽晶在 2026 下半年抵達實驗室,於 2027 年現身,並在當年稍晚進入產品。實務上的採用取決於一份短名單的商用交換器供應商 —— Astera Labs、Auradine、Enfabrica 與 XConn(在 Marvell 以約 $540M 收購後現已納入其麾下)—— 以及像 Upscale AI 這類新創,其「SkyHammer」scale-up 網狀架構 ASIC(由 2026 年 1 月 21 日宣布的 $200M A 輪所支持)預定於 2026 年底樣品出貨、2027 年量產。在那些零件取得認證之前,一座 UALink 原生的交換式機櫃裡根本沒有交換器可放。

為何乙太網路是權宜之計

這就是乙太網路登場之處。以乙太網路承載 scale-up 流量的理由很單純:它已經存在、大量出貨,而且在 scale-up 與 scale-out 之間共用同一套用於監控、遙測與除錯的維運工具鏈。Broadcom 以其 Tomahawk Ultra 的定位積極推動這條路線 —— 一款 51.2 Tb/s 的交換器,宣稱約 250 ns 延遲並支援透過「scale-up Ethernet」連接 1,024 顆以上的加速器 —— 並主張你不該去等「某個還在開發中、也許過個幾年你才會有晶片的規格」。

反方論點同樣具體。乙太網路被設計為通用網路,而非加速器記憶體網狀架構,因此相較於專為此打造的交換式 UALink 網狀架構,UALoE 可能帶來更高延遲、更多協定額外負擔,以及較不確定的行為。對於訓練與大上下文推論而言,當集合通訊(collective operations)對尾端延遲敏感時,「較不確定」並不是個註腳 —— 而是被擱在地上的吞吐量。實際上,AMD 首批 Helios 系統就是一場真實世界的 A/B 測試:現在先以乙太網路出貨,等原生 UALink 交換器取得認證後再換上,並讓客戶量測其間的差距。

項目細節
平台AMD「Helios」機櫃,72x Instinct MI455X
Scale-up 傳輸(初期)UALink-over-Ethernet(UALoE)
整體 scale-up 頻寬約 260 TB/s
每櫃 HBM431 TB
Dense FP4約 2,900 PFLOPS
原生 UALink 交換器預計時程實驗室 H2 2026,產品 2027
商用交換器供應商Astera Labs、Auradine、Enfabrica、XConn(Marvell)、Upscale AI

從業者筆記

如果你正在估算 2026-2027 年的加速器建置規模,請把「UALink-capable」與「UALink-switched」當成兩個不同的採購決策。一個平台可以在加速器端點上具備 UALink 能力,但其首批出貨的網狀架構卻是以乙太網路為基礎;原生交換式組態可能是一個受制於第三方矽晶認證、稍後才推出的 SKU。請向供應商問三個問題:原生組態仰賴哪款交換器 ASIC 與哪個 stepping、認證時程窗口,以及集合延遲(collective-latency)的基準測試究竟是在 UALoE 上跑、還是在原生 UALink 交換器上跑 —— 因為招牌的整體頻寬數字並不會告訴你那個主宰真實訓練與推論效能的尾端延遲故事。

被低估的角度

市場一直把這件事框定為 UALink 對乙太網路,但更持久的結果或許是 UALink-over-Ethernet 成為一個永久層級,而非過渡安排。倘若在 51.2T 級交換器上的 UALoE 在延遲上「夠接近」,足以涵蓋推論與中規模訓練中相當可觀的一部分,那麼在 scale-up 與 scale-out 兩端重複使用同一套交換技術、同一條光學供應鏈與同一套維運堆疊的經濟引力,將極難克服。在那樣的世界裡,原生 UALink 交換器矽晶與其說是落敗,不如說是被推往決定論不可妥協的最高端訓練 pod —— 那是一個遠比商用交換器新創目前所募資對標的更小的 TAM。對於這些互連 IP 名號而言,風險不在於 UALink 失敗;而在於「夠好的乙太網路」悄悄為專用網狀架構最終所能觸及的 scale-up 插槽比例設下了上限。


來源

請喝咖啡