GLM-5.2:开源模型首次逼近闭源前沿的「DeepSeek 时刻」
发布时间:2026 年 6 月 13-16 日 | 模型:GLM-5.2(753B MoE) | 机构:Z.ai(智谱 AI)
论文/博客:https://z.ai/blog/glm-5.2
开源权重:https://huggingface.co/zai-org/GLM-5.2
深度分析:https://www.interconnects.ai/p/glm-52-is-the-step-change-for-open
License:MIT
📌 核心问题:开源模型能否替代闭源前沿?
2026 年上半年,AI Coding Agent 生态爆发式增长。Claude Code、Cursor、Codex CLI 等工具从「辅助编码」进化为「自主工程交付」,但这些 Agent 的核心驱动力——前沿编程模型——长期被 Anthropic 和 OpenAI 的闭源模型垄断。一个根本性问题摆在所有人面前:开源模型有没有可能在编程 Agent 场景下真正替代闭源前沿?
6 月 16 日,Z.ai 发布了 GLM-5.2,给出了迄今为止最有力的肯定答案。Interconnects AI 的 Nathan Lambert 评价这是自 DeepSeek R1 以来,开源模型最重要的里程碑——他称之为「DeepSeek Moment for Coding Agents」。Vercel CEO 则直言「genuinely impressed, almost shocked」。
这不是一个渐进式提升。从 Claude Opus 4.5(2025 年 11 月发布)到 GLM-5.2 的能力追赶,间隔仅 204 天(约 6.8 个月),精确命中了业界对中国开源模型与美国闭源模型之间「6-9 个月延迟」的普遍预期。考虑到美国实验室在过去一年大幅扩展算力,这个差距没有扩大本身就是重大信号。
📊 关键数据
- FrontierSWE:74.4 分,逼近 Claude Opus 4.8(75.1),超越 GPT-5.5(72)
- Design Arena:排名第一,超越刚被限制出口的 Claude Fable 5
- Agent Leaderboard(Arena):唯一一个与 OpenAI/Anthropic 最新模型并列的开源模型
- 参数规模:753B(MoE 架构),上下文窗口 1M tokens
- 开源协议:MIT,可商用、可部署、可微调
- 定价:GLM Coding Plan $18/月起,API $10/月起(约为 Claude 的 1/6)
🏗️ 技术架构与设计
- MoE(Mixture of Experts)架构:753B 总参数,激活参数量远小于总量,在保持前沿能力的同时控制推理成本
- 100 万 Token 上下文窗口:针对长程任务(Long-Horizon Tasks)专门优化,稳定可用的 1M context 是其核心卖点
- SLIME 强化学习框架:Z.ai 自研的 RL 框架(开源),社区广泛认可,用于后训练阶段的推理能力增强
- Max Thinking Effort 模式:官方建议始终使用最大思考强度模式,与 Claude 的 thinking 模式对标
- ZCode 3.0 协同:与 ZCode 3.0 编程工具同步发布,形成模型+工具的完整编程 Agent 闭环
🔑 关键洞察
🤔 引发思考
GLM-5.2 的意义超越了一个模型本身的发布。它标志着开源与闭源的竞争进入新阶段:不再是「能不能用」的问题,而是「值不值得用闭源」的问题。当一个 MIT 协议的 753B 模型在编程 Agent 场景下与 Claude Opus 打得有来有回,开发者和企业将面临真正的选择——而不是被迫接受闭源供应商的定价。
更深层的影响在于 Agent 生态的演进方向。当多个模型在不同子任务上各有所长时(规划、编码、子 Agent 调度),开发者可以在工作流中混合使用不同模型。GLM-5.2 作为首个在 Agent 场景「感觉对」的开源模型,将加速这种多模型编排范式的普及。未来不是单一模型统治一切,而是模型组合的艺术。
📎 相关阅读
- [Interconnects AI] GLM-5.2 is the step change for open agents — https://www.interconnects.ai/p/glm-52-is-the-step-change-for-open
- [Lenny's Newsletter] GLM 5.2: why I'm replacing Opus in Claude Code — https://www.lennysnewsletter.com/p/glm-52-why-im-replacing-opus-in-claude
- [Michael Tefula] GLM 5.2 vs Opus 4.8: Cheaper and Almost as Good — https://www.michaeltefula.com/blog/glm-5-2-vs-opus-4-8/
- [Semgrep] We have Mythos at Home: GLM 5.2 beats Claude in cyber benchmarks — https://semgrep.dev/blog/2026/we-have-mythos-at-home-glm-52-beats-claude-in-our-cyber-benchmarks
- [Reuters] After Anthropic shutdown, China's Z.ai closes frontier gap — https://www.reuters.com/world/asia-pacific/after-anthropic-shutdown-chinas-zai-closes-frontier-gap-it-plans-dual-listing-2026-06-25/
逍遥云初 | 2026.06.29






