
GLM-5.2 发布:753B 开源大模型登顶 Intelligence Index,性价比碾压闭源
智谱 AI 发布 GLM-5.2,753B 参数 MoE 架构、MIT 许可证、1M token 上下文窗口,Intelligence Index v4.1 开源模型排名第一,输入仅 $1.4/M tokens。
原文来源:Simon Willison's Weblog — GLM-5.2 以 753B MoE 架构和 MIT 开源许可成为 Intelligence Index 上排名最高的开源模型,文本能力直追闭源旗舰。
一、事件概述
2026 年 6 月 16 日,中国 AI 实验室 Z.ai(智谱 AI) 正式以 MIT 许可证开源了 GLM-5.2 的模型权重。此前该模型已于 6 月 13 日向编程计划订阅者开放测试。
GLM-5.2 是一款纯文本模型,采用 753B 参数的 Mixture of Experts(MoE)架构,每次推理激活约 40B 参数。模型文件大小约 1.51TB,上下文窗口达到了 1,000,000 tokens(相比 GLM-5.1 的 200K 提升了 5 倍)。
—— 广告 ——
二、基准表现
GLM-5.2 在 Intelligence Index v4.1 上以 51 分 的成绩超越 MiniMax-M3(44 分)、DeepSeek V4 Pro Max(44 分)和 Kimi K2.6(43 分),是当前排名最高的开源模型。
在 Code Arena WebDev 排行榜上,GLM-5.2 排名第二(仅次于 Claude Fable 5)。这个榜单专门评测前端开发和 Agent 编码工作流的能力,能在此取得如此成绩实属不易——考虑到该模型不具备图像输入能力,它的前端代码生成主要依赖纯文本理解和推理。
不过需要注意的一个特点是,GLM-5.2 的输出非常"话多":它在 Intelligence Index 的每个任务平均使用 43K 输出 tokens,远超 GLM-5.1 的 26K,也高于 MiniMax-M3(24K)、Kimi K2.6(35K)和 DeepSeek V4 Pro Max(37K)。这意味着虽然它的单价低,但实际使用成本需要结合输出长度来计算。
三、定价与性价比
在 OpenRouter 上,GLM-5.2 可通过 9 家不同的服务商调用:
| 指标 | GLM-5.2 | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|
| 输入价格 | $1.40 /M tokens | $5 /M tokens | $5 /M tokens |
| 输出价格 | $4.40 /M tokens | $30 /M tokens | $25 /M tokens |
| 上下文 | 1M tokens | — | — |
性价比优势极为显著,输入价格仅为 GPT-5.5 的 1/4 左右,输出价格约为 1/5 至 1/6。
四、实测体验
Simon Willison 用两个 SVG 生成任务测试了 GLM-5.2 的创造力:
测试一:"鹈鹕骑自行车"(优秀)
- 生成了完整自包含的动画 SVG
- 自行车、鹈鹕、围巾、喙等部件都正确呈现
- 车轮和踏板确实在旋转,动画未损坏
- 这是对模型 SVG 生成能力的强有力证明
测试二:"北维吉尼亚负鼠骑电动滑板车"(失望)
- 滑板车不具辨识度,负鼠也几乎认不出来
- 相比 GLM-5.1 缺少了动画效果
- 说明模型在特定创意任务上表现不稳定
这种差异化的表现说明,GLM-5.2 在严谨的编程和推理任务上已达到相当高的水平,但创意生成仍存在波动。
五、开源的意义
GLM-5.2 采用 MIT 许可证 发布,这意味着开发者可以自由地将其用于商业项目、进行二次开发。同时,该模型的权重已在 Hugging Face 上开放下载。
其 1M token 的超长上下文窗口,对于需要处理大量文本的应用场景(如代码库分析、长文档问答、Agent 工具调用等)极具吸引力。结合极具竞争力的定价,GLM-5.2 有望成为 2026 年下半年最重要的开源模型之一。
六、局限与思考
- 纯文本限制 — 尽管 GLM-5.2 的文本能力突出,但它在多模态上无法与 GPT-5.5 或 Claude Opus 4.8 竞争。Z.ai 的视觉模型 GLM-5V-Turbo 并未开源。
- 输出 token 偏多 — 43K 每任务的平均输出意味着实际推理成本可能高于单纯的单价对比。
- 创意任务不稳定 — 在两个 SVG 创作任务中表现差异明显,说明模型在需要"理解 + 创造性输出"的场景中仍有改进空间。
尽管如此,GLM-5.2 的发布再次证明了一个趋势:开源模型与闭源模型的差距正在快速缩小,在价格只有后者的 1/4 到 1/6 的情况下,已经可以在多种任务上匹敌甚至超越旗舰闭源模型。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://www.aprilzz.com/ai/glm-52-release
相关文章
DeepSeek V4 预览版全面解读:1M 上下文、1.6T MoE、开源逼近闭源前沿
DeepSeek 于 2026 年 4 月 24 日正式发布 V4 预览版,包含 Pro 和 Flash 两个版本,以 1.6T 总参数、1M 上下文窗口、极低 API 定价冲击 AI 格局。本文基于官方技术报告与 HuggingFace 开源模型信息,全面解读其架构创新、性能表现与行业影响。
运行本地大模型已经够好了:2026 年本地 LLM 生态的里程碑
Vicki Boykis 实测表明,本地模型已可达到闭源旗舰模型 75% 的编码能力,Gemma 4 + LM Studio + Pi agent 的组合正在改变开发者工作流。
Claude Fable 5 和 Mythos 5 发布:Anthropic 迄今最强模型,以安全护栏释放前沿能力
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5(面向公众的 Mythos 级模型)和 Claude Mythos 5(增强版)。新模型在几乎所有 AI 能力基准上实现 SOTA,定价仅为 Mythos Preview 的一半。