AI 前沿·阅读约 2 分钟·
GLM-5.2 发布:753B 开源大模型登顶 Intelligence Index,性价比碾压闭源

GLM-5.2 发布:753B 开源大模型登顶 Intelligence Index,性价比碾压闭源

智谱 AI 发布 GLM-5.2,753B 参数 MoE 架构、MIT 许可证、1M token 上下文窗口,Intelligence Index v4.1 开源模型排名第一,输入仅 $1.4/M tokens。

原文来源:Simon Willison's Weblog — GLM-5.2 以 753B MoE 架构和 MIT 开源许可成为 Intelligence Index 上排名最高的开源模型,文本能力直追闭源旗舰。

一、事件概述

2026 年 6 月 16 日,中国 AI 实验室 Z.ai(智谱 AI) 正式以 MIT 许可证开源了 GLM-5.2 的模型权重。此前该模型已于 6 月 13 日向编程计划订阅者开放测试。

GLM-5.2 是一款纯文本模型,采用 753B 参数的 Mixture of Experts(MoE)架构,每次推理激活约 40B 参数。模型文件大小约 1.51TB,上下文窗口达到了 1,000,000 tokens(相比 GLM-5.1 的 200K 提升了 5 倍)。

—— 广告 ——

二、基准表现

GLM-5.2 在 Intelligence Index v4.1 上以 51 分 的成绩超越 MiniMax-M3(44 分)、DeepSeek V4 Pro Max(44 分)和 Kimi K2.6(43 分),是当前排名最高的开源模型。

Code Arena WebDev 排行榜上,GLM-5.2 排名第二(仅次于 Claude Fable 5)。这个榜单专门评测前端开发和 Agent 编码工作流的能力,能在此取得如此成绩实属不易——考虑到该模型不具备图像输入能力,它的前端代码生成主要依赖纯文本理解和推理。

不过需要注意的一个特点是,GLM-5.2 的输出非常"话多":它在 Intelligence Index 的每个任务平均使用 43K 输出 tokens,远超 GLM-5.1 的 26K,也高于 MiniMax-M3(24K)、Kimi K2.6(35K)和 DeepSeek V4 Pro Max(37K)。这意味着虽然它的单价低,但实际使用成本需要结合输出长度来计算。

三、定价与性价比

OpenRouter 上,GLM-5.2 可通过 9 家不同的服务商调用:

指标GLM-5.2GPT-5.5Claude Opus 4.8
输入价格$1.40 /M tokens$5 /M tokens$5 /M tokens
输出价格$4.40 /M tokens$30 /M tokens$25 /M tokens
上下文1M tokens

性价比优势极为显著,输入价格仅为 GPT-5.5 的 1/4 左右,输出价格约为 1/5 至 1/6。

四、实测体验

Simon Willison 用两个 SVG 生成任务测试了 GLM-5.2 的创造力:

测试一:"鹈鹕骑自行车"(优秀)

  • 生成了完整自包含的动画 SVG
  • 自行车、鹈鹕、围巾、喙等部件都正确呈现
  • 车轮和踏板确实在旋转,动画未损坏
  • 这是对模型 SVG 生成能力的强有力证明

测试二:"北维吉尼亚负鼠骑电动滑板车"(失望)

  • 滑板车不具辨识度,负鼠也几乎认不出来
  • 相比 GLM-5.1 缺少了动画效果
  • 说明模型在特定创意任务上表现不稳定

这种差异化的表现说明,GLM-5.2 在严谨的编程和推理任务上已达到相当高的水平,但创意生成仍存在波动。

五、开源的意义

GLM-5.2 采用 MIT 许可证 发布,这意味着开发者可以自由地将其用于商业项目、进行二次开发。同时,该模型的权重已在 Hugging Face 上开放下载。

其 1M token 的超长上下文窗口,对于需要处理大量文本的应用场景(如代码库分析、长文档问答、Agent 工具调用等)极具吸引力。结合极具竞争力的定价,GLM-5.2 有望成为 2026 年下半年最重要的开源模型之一。

六、局限与思考

  1. 纯文本限制 — 尽管 GLM-5.2 的文本能力突出,但它在多模态上无法与 GPT-5.5 或 Claude Opus 4.8 竞争。Z.ai 的视觉模型 GLM-5V-Turbo 并未开源。
  2. 输出 token 偏多 — 43K 每任务的平均输出意味着实际推理成本可能高于单纯的单价对比。
  3. 创意任务不稳定 — 在两个 SVG 创作任务中表现差异明显,说明模型在需要"理解 + 创造性输出"的场景中仍有改进空间。

尽管如此,GLM-5.2 的发布再次证明了一个趋势:开源模型与闭源模型的差距正在快速缩小,在价格只有后者的 1/4 到 1/6 的情况下,已经可以在多种任务上匹敌甚至超越旗舰闭源模型。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://www.aprilzz.com/ai/glm-52-release