原文链接:https://www.nxcode.io/zh-TW/resources/news/deepseek-v4-release-specs-benchmarks-2026
📌 核心问题
2026 年 4 月 24 日,DeepSeek 正式发布 V4 预览版,同步开源并上线官网、API 及 App 服务。这是中国 AI 实验室首次在不依赖 NVIDIA 硬件的情况下训练出万亿参数级模型,标志着开源 AI 与闭源前沿模型的差距进入实质性收敛阶段。
核心问题:一个完全基于国产算力(华为昇腾 + 寒武纪)训练的万亿参数 MoE 模型,能否在代码、推理、长上下文等关键维度追平甚至超越 OpenAI 和 Anthropic 的闭源旗舰?
🔥 关键数据
- 总参数:1T(万亿),活跃参数约 37B(与 V3 持平)
- 上下文窗口:100 万 tokens(全系标配)
- 架构:MoE + 384 专家融合内核
- SWE-bench Verified:80%+(V3 仅约 49%,Claude Opus 4.5 为 80.9%)
- HumanEval:90%(创下新纪录)
- 定价:V4-Flash 输入 0.2 元/百万 Token(缓存命中),推理成本仅为 GPT-5.5 的 1/8 至 1/50
- 开源协议:Apache 2.0(允许商业使用、修改、无需 copyleft)
- 训练硬件:华为昇腾 910B + 寒武纪 MLU,完全不依赖 NVIDIA
🧠 技术架构
1. MoE 架构升级:专家池扩大,成本不增
DeepSeek V4 延续 V3 的 Mixture-of-Experts 架构,将专家池扩大到 384 个专家融合内核,但保持每个 token 激活约 37B 参数不变。这意味着模型在不成比例增加计算需求的前提下,获得了在代码、数学、创意写作、多语言任务等各领域更深的专业化能力。量化后可在消费级硬件运行:INT8 量化仅需 2x RTX 4090,INT4 量化仅需 1x RTX 5090。
2. Engram 条件记忆:百万上下文不再只是营销数字
Engram 是 V4 最引人注目的创新——一种条件记忆架构,基于相关性信号选择性地储存和检索信息。在 Needle-in-a-Haystack 测试中,标准注意力在百万 token 下准确率 84.2%,Engram 达到 97%。这意味着从「大部分时候能处理长文档」升级为「可靠地处理长文档」。对开发者的直接影响:整个代码仓库理解无需分块和摘要;长文件分析一次性处理。
3. DSA 稀疏注意力 + 国产算力全栈适配
自研 DSA 稀疏注意力机制借助 token 智能压缩破解长文本算力困境。V4 完全基于华为昇腾 910B 和寒武纪 MLU 芯片训练,证明前沿 AI 模型可以在非 NVIDIA 硬件上训练成功。
🔑 关键洞察
🚀 引发思考
DeepSeek V4 的 SWE-bench 80%+ 成绩如果经独立验证属实,将从根本上改变 AI 驱动开发工具的自建与购买决策。但需要保持理性:基准测试声明尚未经独立验证;在非 NVIDIA 硬件上以万亿参数规模训练的模型实际表现仍是未知领域。
逍遥云初 | 2026.04.28






