2026-06-17 — views
智谱 AI 开源 GLM-5.2 权重:100 万 Token 上下文、顶尖开源编程模型,成本仅 GPT-5.5 的六分之一
为什么值得读 开源权重与前沿闭源模型的差距,如今只能用个位数的基准分数来衡量。对自托管的开发者而言,GLM-5.2 改写了智能体编程「自建 vs 采购」的算式。
Z.ai 于 6 月 17 日以 MIT 许可证发布 GLM-5.2——一款 7530 亿参数的 MoE 模型,具 100 万 token 上下文,登顶开源编程基准,成本约仅 GPT-5.5 的六分之一。
发生了什么
中国实验室 Z.ai——也就是此前的智谱 AI(Zhipu AI)——于 2026 年 6 月 17 日以 MIT 许可证发布 GLM-5.2 的完整权重,上架至 Hugging Face(账号 zai-org/GLM-5.2)与 ModelScope。该模型在本周稍早、6 月 13 日至 16 日之间先行亮相,独立 API 与 Z.ai 聊天机器人率先上线。值得注意的是,智谱在首次亮相时并未公布基准数据,而是与开源权重一同发布——这种发布节奏,让可验证的宣称与可下载的模型出现在同一个时间窗内。
重点在于定位:GLM-5.2 如今是长程编程基准上最强的开源权重模型,将与前沿闭源模型的差距缩小到仅几个百分点。
规格确认了什么
| 特性 | 细节 |
|---|---|
| 架构 | 混合专家(MoE),总参数约 7530 亿 |
| 激活参数 | 每次查询约 400 亿 |
| 上下文窗口 | 100 万 token(GLM-5.1 为 20 万) |
| 许可证 | MIT(不限制商业使用) |
| 发布渠道 | Hugging Face + ModelScope,外加分级 API |
| 努力模式 | 「High」与「Max」速度/质量权衡 |
| 成本 | 约为 GPT-5.5 的六分之一 |
在 Terminal-Bench 2.1(智能体式、自主终端编程基准)上,GLM-5.2 得分 81.0,距 Claude Opus 4.8 的 85.0 仅四分。它在 SWE-bench Pro 上拿下 62.1,于 Code Arena 全球排名第二(仅次于 Opus 4.8),并在 FrontierSWE 上以约 1% 险胜 GPT-5.5。在所有开源模型中,它的长程编程任务排名第一。
为何对开发者重要
两个数字承载了整个故事:100 万 token 上下文窗口,以及成本。上下文从 20 万跃升至 100 万 token,让整个代码库的推理与长智能体轨迹得以在单一窗口内完成——这类工作负载过去往往得依赖检索管线或分块处理。成本约为 GPT-5.5 的六分之一,再加上允许不限制商业部署的 MIT 许可证,改写了任何大量运行智能体编程工作负载者的「自建 vs 采购」算式。
对于已在本地硬件自托管的团队,GLM-5.2 的 MoE 设计是务实的切入点。总参数约 7530 亿、每次查询仅激活约 400 亿,它与其他大型稀疏模型置身同一场推理经济学的对话:内存占用由完整参数量决定,而每 token 的运算量则由被激活的专家决定。正是这套架构,让一个 7530 亿参数的模型得以实际被服务。
那个星号:API vs 权重
最重要的实务区别,在于消费 GLM-5.2 的两种方式。MIT 权重可下载并在自有基础设施上运行,数据不离开你的环境。相对地,托管的 Z.ai API 会将提示与输出路由经由设于中国的服务——这是多家媒体在发布时点出的数据治理考量。对于受监管的工作负载、敏感代码,或任何受数据本地化要求约束的情境,开源权重是安全路径;API 是便利,但带有司法管辖上的疑问。
开发者现在该做什么
第一,若你大规模运行智能体编程,请用你自己的任务集测试 GLM-5.2 对比现有模型——公开分数虽贴近前沿,但唯有你的工作负载才是真正的考验。第二,刻意在权重与 API 之间抉择:成本优势两条路都成立,但只有自托管路径能让你的代码留在你的管辖区内。第三,留意权重公开后,Terminal-Bench 与 SWE-bench Pro 数字在独立复现下能否站得住——开源权重意味着宣称可被检验,而这正是最强开源模型该乐于接受的审视。
结论:开源权重的前沿,如今只落后最佳闭源模型个位数的基准差距,以宽松许可证提供,且价格只是零头。这已是与三个月前都截然不同的格局。
来源
- Z.ai GLM-5.2 outperforms GPT-5.5 on coding at one-sixth the cost — Crypto Briefing ↗
- GLM-5.2 open weights live, top coding benchmark — TechTimes ↗
- GLM 5.2 Release — 1M context, coding-first — Codersera ↗
- GLM-5.2 Review 2026: Z.ai 1M-context model — BuildFastWithAI ↗