2026-06-17 — views
智譜 AI 開源 GLM-5.2 權重:100 萬 Token 上下文、頂尖開源編程模型,成本僅 GPT-5.5 的六分之一
為什麼值得讀 開源權重與前沿閉源模型的差距,如今只能用個位數的基準分數來衡量。對自架部署的開發者而言,GLM-5.2 改寫了代理式編程「自建 vs 採購」的算式。
Z.ai 於 6 月 17 日以 MIT 授權釋出 GLM-5.2——一款 7,530 億參數的 MoE 模型,具 100 萬 token 上下文,登頂開源編程基準,成本約僅 GPT-5.5 的六分之一。
發生了什麼
中國實驗室 Z.ai——也就是先前的智譜 AI(Zhipu AI)——於 2026 年 6 月 17 日以 MIT 授權釋出 GLM-5.2 的完整權重,上架至 Hugging Face(帳號 zai-org/GLM-5.2)與 ModelScope。該模型在本週稍早、6 月 13 日至 16 日之間先行亮相,獨立 API 與 Z.ai 聊天機器人率先上線。值得注意的是,智譜在初次亮相時並未公布基準數據,而是與開源權重一同釋出——這種發布節奏,讓可驗證的宣稱與可下載的模型出現在同一個時間窗內。
重點在於定位:GLM-5.2 如今是長程編程基準上最強的開源權重模型,將與前沿閉源模型的差距縮小到僅幾個百分點。
規格確認了什麼
| 特性 | 細節 |
|---|---|
| 架構 | 混合專家(MoE),總參數約 7,530 億 |
| 啟用參數 | 每次查詢約 400 億 |
| 上下文視窗 | 100 萬 token(GLM-5.1 為 20 萬) |
| 授權 | MIT(不限制商業使用) |
| 發布管道 | Hugging Face + ModelScope,外加分級 API |
| 努力模式 | 「High」與「Max」速度/品質權衡 |
| 成本 | 約為 GPT-5.5 的六分之一 |
在 Terminal-Bench 2.1(代理式、自主終端編程基準)上,GLM-5.2 得分 81.0,距 Claude Opus 4.8 的 85.0 僅四分。它在 SWE-bench Pro 上拿下 62.1,於 Code Arena 全球排名第二(僅次於 Opus 4.8),並在 FrontierSWE 上以約 1% 險勝 GPT-5.5。在所有開源模型中,它的長程編程任務排名第一。
為何對開發者重要
兩個數字承載了整個故事:100 萬 token 上下文視窗,以及成本。上下文從 20 萬躍升至 100 萬 token,讓整個程式庫的推理與長代理軌跡得以在單一視窗內完成——這類工作負載過去往往得仰賴檢索管線或分塊處理。成本約為 GPT-5.5 的六分之一,再加上允許不限制商業部署的 MIT 授權,改寫了任何大量執行代理式編程工作負載者的「自建 vs 採購」算式。
對於已在本地硬體自架的團隊,GLM-5.2 的 MoE 設計是務實的切入點。總參數約 7,530 億、每次查詢僅啟用約 400 億,它與其他大型稀疏模型置身同一場推理經濟學的對話:記憶體佔用由完整參數量決定,而每 token 的運算量則由被啟用的專家決定。正是這套架構,讓一個 7,530 億參數的模型得以實際被服務。
那個星號:API vs 權重
最重要的實務區別,在於消費 GLM-5.2 的兩種方式。MIT 權重可下載並在自有基礎設施上執行,資料不離開你的環境。相對地,託管的 Z.ai API 會將提示與輸出路由經由設於中國的服務——這是多家媒體在發布時點出的資料治理考量。對於受監管的工作負載、敏感程式碼,或任何受資料落地要求約束的情境,開源權重是安全路徑;API 是便利,但帶有司法管轄上的疑問。
開發者現在該做什麼
第一,若你大規模執行代理式編程,請用你自己的任務集測試 GLM-5.2 對比現有模型——公開分數雖貼近前沿,但唯有你的工作負載才是真正的考驗。第二,刻意在權重與 API 之間抉擇:成本優勢兩條路都成立,但只有自架路徑能讓你的程式碼留在你的管轄區內。第三,留意權重公開後,Terminal-Bench 與 SWE-bench Pro 數字在獨立複現下能否站得住——開源權重意味著宣稱可被檢驗,而這正是最強開源模型該樂於接受的審視。
結論:開源權重的前沿,如今只落後最佳閉源模型個位數的基準差距,以寬鬆授權提供,且價格只是零頭。這已是與三個月前都截然不同的格局。
來源
- Z.ai GLM-5.2 outperforms GPT-5.5 on coding at one-sixth the cost — Crypto Briefing ↗
- GLM-5.2 open weights live, top coding benchmark — TechTimes ↗
- GLM 5.2 Release — 1M context, coding-first — Codersera ↗
- GLM-5.2 Review 2026: Z.ai 1M-context model — BuildFastWithAI ↗