原文链接:https://www.nxcode.io/zh-TW/resources/news/deepseek-v4-release-specs-benchmarks-2026


📌 核心问题

2026 年 4 月 24 日,DeepSeek 正式发布 V4 预览版,同步开源并上线官网、API 及 App 服务。这是中国 AI 实验室首次在不依赖 NVIDIA 硬件的情况下训练出万亿参数级模型,标志着开源 AI 与闭源前沿模型的差距进入实质性收敛阶段。

核心问题:一个完全基于国产算力(华为昇腾 + 寒武纪)训练的万亿参数 MoE 模型,能否在代码、推理、长上下文等关键维度追平甚至超越 OpenAI 和 Anthropic 的闭源旗舰?

🔥 关键数据

  • 总参数:1T(万亿),活跃参数约 37B(与 V3 持平)
  • 上下文窗口:100 万 tokens(全系标配)
  • 架构:MoE + 384 专家融合内核
  • SWE-bench Verified:80%+(V3 仅约 49%,Claude Opus 4.5 为 80.9%)
  • HumanEval:90%(创下新纪录)
  • 定价:V4-Flash 输入 0.2 元/百万 Token(缓存命中),推理成本仅为 GPT-5.5 的 1/8 至 1/50
  • 开源协议:Apache 2.0(允许商业使用、修改、无需 copyleft)
  • 训练硬件:华为昇腾 910B + 寒武纪 MLU,完全不依赖 NVIDIA

🧠 技术架构

1. MoE 架构升级:专家池扩大,成本不增

DeepSeek V4 延续 V3 的 Mixture-of-Experts 架构,将专家池扩大到 384 个专家融合内核,但保持每个 token 激活约 37B 参数不变。这意味着模型在不成比例增加计算需求的前提下,获得了在代码、数学、创意写作、多语言任务等各领域更深的专业化能力。量化后可在消费级硬件运行:INT8 量化仅需 2x RTX 4090,INT4 量化仅需 1x RTX 5090。

2. Engram 条件记忆:百万上下文不再只是营销数字

Engram 是 V4 最引人注目的创新——一种条件记忆架构,基于相关性信号选择性地储存和检索信息。在 Needle-in-a-Haystack 测试中,标准注意力在百万 token 下准确率 84.2%,Engram 达到 97%。这意味着从「大部分时候能处理长文档」升级为「可靠地处理长文档」。对开发者的直接影响:整个代码仓库理解无需分块和摘要;长文件分析一次性处理。

3. DSA 稀疏注意力 + 国产算力全栈适配

自研 DSA 稀疏注意力机制借助 token 智能压缩破解长文本算力困境。V4 完全基于华为昇腾 910B 和寒武纪 MLU 芯片训练,证明前沿 AI 模型可以在非 NVIDIA 硬件上训练成功。

🔑 关键洞察

开源 AI 的「价值竞赛」时代到来。DeepSeek V4 标志着中国大模型从「参数竞赛」进入「价值竞赛」——以高效架构、普惠成本、场景落地为核心。推理成本仅为 GPT-5.5 的 1/8 到 1/50,百万 token 上下文全系免费标配。
全球 AI 市场加速分化为两大阵营:OpenAI/Google/Anthropic 的「闭源高端 + 海外算力」阵营,与 DeepSeek 的「开源普惠 + 中国算力」阵营。
Engram 记忆如果经独立验证属实,将降低 RAG 架构的复杂度——开发者可能不再需要构建复杂的分块、嵌入和检索管线。

🚀 引发思考

DeepSeek V4 的 SWE-bench 80%+ 成绩如果经独立验证属实,将从根本上改变 AI 驱动开发工具的自建与购买决策。但需要保持理性:基准测试声明尚未经独立验证;在非 NVIDIA 硬件上以万亿参数规模训练的模型实际表现仍是未知领域。


逍遥云初 | 2026.04.28