GLM-5.2 发布：753B 开源大模型登顶 Intelligence Index，性价比碾压闭源

原文来源：Simon Willison's Weblog — GLM-5.2 以 753B MoE 架构和 MIT 开源许可成为 Intelligence Index 上排名最高的开源模型，文本能力直追闭源旗舰。

一、事件概述

2026 年 6 月 16 日，中国 AI 实验室 Z.ai（智谱 AI） 正式以 MIT 许可证开源了 GLM-5.2 的模型权重。此前该模型已于 6 月 13 日向编程计划订阅者开放测试。

GLM-5.2 是一款纯文本模型，采用 753B 参数的 Mixture of Experts（MoE）架构，每次推理激活约 40B 参数。模型文件大小约 1.51TB，上下文窗口达到了 1,000,000 tokens（相比 GLM-5.1 的 200K 提升了 5 倍）。

—— 广告 ——

二、基准表现

GLM-5.2 在 Intelligence Index v4.1 上以 51 分 的成绩超越 MiniMax-M3（44 分）、DeepSeek V4 Pro Max（44 分）和 Kimi K2.6（43 分），是当前排名最高的开源模型。

在 Code Arena WebDev 排行榜上，GLM-5.2 排名第二（仅次于 Claude Fable 5）。这个榜单专门评测前端开发和 Agent 编码工作流的能力，能在此取得如此成绩实属不易——考虑到该模型不具备图像输入能力，它的前端代码生成主要依赖纯文本理解和推理。

不过需要注意的一个特点是，GLM-5.2 的输出非常"话多"：它在 Intelligence Index 的每个任务平均使用 43K 输出 tokens，远超 GLM-5.1 的 26K，也高于 MiniMax-M3（24K）、Kimi K2.6（35K）和 DeepSeek V4 Pro Max（37K）。这意味着虽然它的单价低，但实际使用成本需要结合输出长度来计算。

三、定价与性价比

在 OpenRouter 上，GLM-5.2 可通过 9 家不同的服务商调用：

指标	GLM-5.2	GPT-5.5	Claude Opus 4.8
输入价格	$1.40 /M tokens	$5 /M tokens	$5 /M tokens
输出价格	$4.40 /M tokens	$30 /M tokens	$25 /M tokens
上下文	1M tokens	—	—

性价比优势极为显著，输入价格仅为 GPT-5.5 的 1/4 左右，输出价格约为 1/5 至 1/6。

四、实测体验

Simon Willison 用两个 SVG 生成任务测试了 GLM-5.2 的创造力：

测试一："鹈鹕骑自行车"（优秀）

生成了完整自包含的动画 SVG
自行车、鹈鹕、围巾、喙等部件都正确呈现
车轮和踏板确实在旋转，动画未损坏
这是对模型 SVG 生成能力的强有力证明

测试二："北维吉尼亚负鼠骑电动滑板车"（失望）

滑板车不具辨识度，负鼠也几乎认不出来
相比 GLM-5.1 缺少了动画效果
说明模型在特定创意任务上表现不稳定

这种差异化的表现说明，GLM-5.2 在严谨的编程和推理任务上已达到相当高的水平，但创意生成仍存在波动。

五、开源的意义

GLM-5.2 采用 MIT 许可证 发布，这意味着开发者可以自由地将其用于商业项目、进行二次开发。同时，该模型的权重已在 Hugging Face 上开放下载。

其 1M token 的超长上下文窗口，对于需要处理大量文本的应用场景（如代码库分析、长文档问答、Agent 工具调用等）极具吸引力。结合极具竞争力的定价，GLM-5.2 有望成为 2026 年下半年最重要的开源模型之一。

六、局限与思考

纯文本限制 — 尽管 GLM-5.2 的文本能力突出，但它在多模态上无法与 GPT-5.5 或 Claude Opus 4.8 竞争。Z.ai 的视觉模型 GLM-5V-Turbo 并未开源。
输出 token 偏多 — 43K 每任务的平均输出意味着实际推理成本可能高于单纯的单价对比。
创意任务不稳定 — 在两个 SVG 创作任务中表现差异明显，说明模型在需要"理解 + 创造性输出"的场景中仍有改进空间。

尽管如此，GLM-5.2 的发布再次证明了一个趋势：开源模型与闭源模型的差距正在快速缩小，在价格只有后者的 1/4 到 1/6 的情况下，已经可以在多种任务上匹敌甚至超越旗舰闭源模型。

GLM-5.2 发布：753B 开源大模型登顶 Intelligence Index，性价比碾压闭源

一、事件概述

二、基准表现

三、定价与性价比

四、实测体验

五、开源的意义

六、局限与思考

相关文章

DeepSeek V4 预览版全面解读：1M 上下文、1.6T MoE、开源逼近闭源前沿

运行本地大模型已经够好了：2026 年本地 LLM 生态的里程碑

Claude Fable 5 和 Mythos 5 发布：Anthropic 迄今最强模型，以安全护栏释放前沿能力