📌 核心事件
2026 年 4 月 2 日,Google DeepMind 正式发布 Gemma 4 系列开源模型,包含 E2B、E4B、26B-A4B MoE、31B Dense 四个版本。这是 Google 迄今最强大的开源模型家族,首次采用 Apache 2.0 开源协议,并继承了 Gemini 3 的核心技术架构。
Google DeepMind CEO Demis Hassabis 在发布会上表示:「按字节计算,这是全球最强大的开源模型。」
🔥 关键数据
- Arena AI 排行榜:31B Dense 版本冲到全球开源第三,仅次于 GLM-5 和 Kimi 2.5
- 参数效率:31B 用不到 1/10 的参数量,击败 Qwen 3.5 397B 等 400 亿级模型
- MMLU Pro:85.2% | AIME 2026:89.2%(上代 Gemma 3 27B 仅 20.8%,提升 4 倍+)
- LiveCodeBench v6:80.0% | Codeforces ELO:2150
- 多模态 MMMU Pro:76.9% | MATH-Vision:85.6%
- 社区生态:累计 4 亿次下载,10 万个社区变体(「Gemmaverse」)
- 协议变更:从自定义限制性协议 → Apache 2.0 完全免费商用
🧠 技术架构:Gemini 3 的开源下放
Gemma 4 最大的技术亮点在于直接继承了 Gemini 3 的研究成果和架构。Google 将闭源旗舰模型的核心能力下放到了开源模型上——这在大厂中并不常见。
四款版本各有定位:
- E2B / E4B:移动端版本,可完全离线运行在 Android 手机甚至树莓派上,支持原生音频输入
- 26B-A4B MoE:260 亿参数但推理时仅激活 38 亿参数,速度快到飞起
- 31B Dense:追求极致质量,适合精细化微调
所有版本原生支持视频和图像输入,原生训练 140 多种语言,上下文窗口最大 25.6 万 token。
🔑 关键洞察
洞察一:「以小博大」的参数效率革命
Gemma 4 31B 用不到十分之一的参数量在排行榜上与 400 亿级模型掰手腕,这标志着开源模型进入了「智能密度」竞争时代。对于本地部署开发者来说,这意味着一张消费级显卡就能跑出接近顶级闭源模型的性能。
洞察二:Apache 2.0 是一次战略投降
Gemma 3 的自定义协议饱受诟病。这次换成 Apache 2.0,是 Google 听取社区反馈后的战略转向。在 DeepSeek、Qwen 等国产开源模型全球崛起的背景下,Google 不得不在开源策略上「放下身段」。
洞察三:本地 AI 的野心
Gemma 4 的四个版本覆盖手机到服务器全场景,配合 Arm SME2 优化和 litert-lm CLI 工具,Google 正在构建一个「不联网也能用顶级智能」的生态。这对隐私敏感场景和边缘计算场景意义重大。
🚀 引发思考
Gemma 4 的发布折射出全球开源模型竞争的白热化。但真正的考验在于——Google 开源模型的实际部署量历来落后于 LLaMA 和 DeepSeek。性能领先能否转化为生态繁荣,才是 Gemma 4 的终极考题。
对于开发者而言,Gemma 4 + Apache 2.0 意味着:你终于可以无顾虑地在商业产品中使用 Google 的开源模型了。
逍遥云初 | 2026.04.26


