2026-06-17 — views

智譜 AI 開源 GLM-5.2 權重：100 萬 Token 上下文、頂尖開源編程模型，成本僅 GPT-5.5 的六分之一

為什麼值得讀開源權重與前沿閉源模型的差距，如今只能用個位數的基準分數來衡量。對自架部署的開發者而言，GLM-5.2 改寫了代理式編程「自建 vs 採購」的算式。

Z.ai 於 6 月 17 日以 MIT 授權釋出 GLM-5.2——一款 7,530 億參數的 MoE 模型，具 100 萬 token 上下文，登頂開源編程基準，成本約僅 GPT-5.5 的六分之一。

發生了什麼

中國實驗室 Z.ai——也就是先前的智譜 AI（Zhipu AI）——於 2026 年 6 月 17 日以 MIT 授權釋出 GLM-5.2 的完整權重，上架至 Hugging Face（帳號 zai-org/GLM-5.2）與 ModelScope。該模型在本週稍早、6 月 13 日至 16 日之間先行亮相，獨立 API 與 Z.ai 聊天機器人率先上線。值得注意的是，智譜在初次亮相時並未公布基準數據，而是與開源權重一同釋出——這種發布節奏，讓可驗證的宣稱與可下載的模型出現在同一個時間窗內。

重點在於定位：GLM-5.2 如今是長程編程基準上最強的開源權重模型，將與前沿閉源模型的差距縮小到僅幾個百分點。

規格確認了什麼

特性	細節
架構	混合專家（MoE），總參數約 7,530 億
啟用參數	每次查詢約 400 億
上下文視窗	100 萬 token（GLM-5.1 為 20 萬）
授權	MIT（不限制商業使用）
發布管道	Hugging Face + ModelScope，外加分級 API
努力模式	「High」與「Max」速度／品質權衡
成本	約為 GPT-5.5 的六分之一

在 Terminal-Bench 2.1（代理式、自主終端編程基準）上，GLM-5.2 得分 81.0，距 Claude Opus 4.8 的 85.0 僅四分。它在 SWE-bench Pro 上拿下 62.1，於 Code Arena 全球排名第二（僅次於 Opus 4.8），並在 FrontierSWE 上以約 1% 險勝 GPT-5.5。在所有開源模型中，它的長程編程任務排名第一。

為何對開發者重要

兩個數字承載了整個故事：100 萬 token 上下文視窗，以及成本。上下文從 20 萬躍升至 100 萬 token，讓整個程式庫的推理與長代理軌跡得以在單一視窗內完成——這類工作負載過去往往得仰賴檢索管線或分塊處理。成本約為 GPT-5.5 的六分之一，再加上允許不限制商業部署的 MIT 授權，改寫了任何大量執行代理式編程工作負載者的「自建 vs 採購」算式。

對於已在本地硬體自架的團隊，GLM-5.2 的 MoE 設計是務實的切入點。總參數約 7,530 億、每次查詢僅啟用約 400 億，它與其他大型稀疏模型置身同一場推理經濟學的對話：記憶體佔用由完整參數量決定，而每 token 的運算量則由被啟用的專家決定。正是這套架構，讓一個 7,530 億參數的模型得以實際被服務。

那個星號：API vs 權重

最重要的實務區別，在於消費 GLM-5.2 的兩種方式。MIT 權重可下載並在自有基礎設施上執行，資料不離開你的環境。相對地，託管的 Z.ai API 會將提示與輸出路由經由設於中國的服務——這是多家媒體在發布時點出的資料治理考量。對於受監管的工作負載、敏感程式碼，或任何受資料落地要求約束的情境，開源權重是安全路徑；API 是便利，但帶有司法管轄上的疑問。

開發者現在該做什麼

第一，若你大規模執行代理式編程，請用你自己的任務集測試 GLM-5.2 對比現有模型——公開分數雖貼近前沿，但唯有你的工作負載才是真正的考驗。第二，刻意在權重與 API 之間抉擇：成本優勢兩條路都成立，但只有自架路徑能讓你的程式碼留在你的管轄區內。第三，留意權重公開後，Terminal-Bench 與 SWE-bench Pro 數字在獨立複現下能否站得住——開源權重意味著宣稱可被檢驗，而這正是最強開源模型該樂於接受的審視。

結論：開源權重的前沿，如今只落後最佳閉源模型個位數的基準差距，以寬鬆授權提供，且價格只是零頭。這已是與三個月前都截然不同的格局。