2026-06-17 — views

智谱 AI 开源 GLM-5.2 权重：100 万 Token 上下文、顶尖开源编程模型，成本仅 GPT-5.5 的六分之一

为什么值得读开源权重与前沿闭源模型的差距，如今只能用个位数的基准分数来衡量。对自托管的开发者而言，GLM-5.2 改写了智能体编程「自建 vs 采购」的算式。

Z.ai 于 6 月 17 日以 MIT 许可证发布 GLM-5.2——一款 7530 亿参数的 MoE 模型，具 100 万 token 上下文，登顶开源编程基准，成本约仅 GPT-5.5 的六分之一。

发生了什么

中国实验室 Z.ai——也就是此前的智谱 AI（Zhipu AI）——于 2026 年 6 月 17 日以 MIT 许可证发布 GLM-5.2 的完整权重，上架至 Hugging Face（账号 zai-org/GLM-5.2）与 ModelScope。该模型在本周稍早、6 月 13 日至 16 日之间先行亮相，独立 API 与 Z.ai 聊天机器人率先上线。值得注意的是，智谱在首次亮相时并未公布基准数据，而是与开源权重一同发布——这种发布节奏，让可验证的宣称与可下载的模型出现在同一个时间窗内。

重点在于定位：GLM-5.2 如今是长程编程基准上最强的开源权重模型，将与前沿闭源模型的差距缩小到仅几个百分点。

规格确认了什么

特性	细节
架构	混合专家（MoE），总参数约 7530 亿
激活参数	每次查询约 400 亿
上下文窗口	100 万 token（GLM-5.1 为 20 万）
许可证	MIT（不限制商业使用）
发布渠道	Hugging Face + ModelScope，外加分级 API
努力模式	「High」与「Max」速度／质量权衡
成本	约为 GPT-5.5 的六分之一

在 Terminal-Bench 2.1（智能体式、自主终端编程基准）上，GLM-5.2 得分 81.0，距 Claude Opus 4.8 的 85.0 仅四分。它在 SWE-bench Pro 上拿下 62.1，于 Code Arena 全球排名第二（仅次于 Opus 4.8），并在 FrontierSWE 上以约 1% 险胜 GPT-5.5。在所有开源模型中，它的长程编程任务排名第一。

为何对开发者重要

两个数字承载了整个故事：100 万 token 上下文窗口，以及成本。上下文从 20 万跃升至 100 万 token，让整个代码库的推理与长智能体轨迹得以在单一窗口内完成——这类工作负载过去往往得依赖检索管线或分块处理。成本约为 GPT-5.5 的六分之一，再加上允许不限制商业部署的 MIT 许可证，改写了任何大量运行智能体编程工作负载者的「自建 vs 采购」算式。

对于已在本地硬件自托管的团队，GLM-5.2 的 MoE 设计是务实的切入点。总参数约 7530 亿、每次查询仅激活约 400 亿，它与其他大型稀疏模型置身同一场推理经济学的对话：内存占用由完整参数量决定，而每 token 的运算量则由被激活的专家决定。正是这套架构，让一个 7530 亿参数的模型得以实际被服务。

那个星号：API vs 权重

最重要的实务区别，在于消费 GLM-5.2 的两种方式。MIT 权重可下载并在自有基础设施上运行，数据不离开你的环境。相对地，托管的 Z.ai API 会将提示与输出路由经由设于中国的服务——这是多家媒体在发布时点出的数据治理考量。对于受监管的工作负载、敏感代码，或任何受数据本地化要求约束的情境，开源权重是安全路径；API 是便利，但带有司法管辖上的疑问。

开发者现在该做什么

第一，若你大规模运行智能体编程，请用你自己的任务集测试 GLM-5.2 对比现有模型——公开分数虽贴近前沿，但唯有你的工作负载才是真正的考验。第二，刻意在权重与 API 之间抉择：成本优势两条路都成立，但只有自托管路径能让你的代码留在你的管辖区内。第三，留意权重公开后，Terminal-Bench 与 SWE-bench Pro 数字在独立复现下能否站得住——开源权重意味着宣称可被检验，而这正是最强开源模型该乐于接受的审视。

结论：开源权重的前沿，如今只落后最佳闭源模型个位数的基准差距，以宽松许可证提供，且价格只是零头。这已是与三个月前都截然不同的格局。