2026 年 4 月 24 日,DeepSeek 正式发布并开源 DeepSeek-V4 系列模型,包含 Pro 和 Flash 两个版本。这是继 V3 之后的第四代旗舰模型,标志着开源大模型在 Agent 能力、超长上下文和推理性能上的又一次跨越式突破。

📌 核心问题

DeepSeek-V4 的发布背景是:在 OpenAI 于同周发布 GPT-5.5 的竞争窗口期,中国开源模型能否在性能上追平甚至超越闭源旗舰?DeepSeek 用实际数据给出了答案。

受限于高端算力供应,DeepSeek-V4-Pro 的服务吞吐目前十分有限。官方预计下半年华为昇腾 950 超节点批量上市后,Pro 版价格会大幅下调。这既是技术挑战,也是国产算力生态成熟的信号。

🔥 关键数据

  • 模型规模:DeepSeek-V4-Pro 拥有 1.6T 参数(激活 49B),Flash 版本 285B 参数
  • 上下文窗口:支持百万字级超长上下文处理
  • 开源协议:MIT License,完全自由商用
  • SWE-Bench Pro:在真实软件工程能力评估中达到行业领先水平
  • Agent 能力:在 DeepSearchQA 等 Agent 深度检索基准中持平或优于 GPT-5.4、Claude Opus 4.6
  • 推理性能:综合性能对标国际一线闭源模型

🧠 技术架构

  • 自研稀疏注意力技术:大幅降低长文本运行功耗,提升推理速度
  • Pro + Flash 双版本策略:Pro 追求极致性能,Flash 面向高吞吐场景
  • 昇腾超节点全系适配:华为通过融合 kernel 和多流并行技术,显著降低 Attention 计算和访存开销
  • 多家厂商 Day-0 适配:百度千帆、寒武纪、摩尔线程等均在发布当天完成接入

🔑 关键洞察

开源 vs 闭源的格局正在重塑

GPT-5.5 与 DeepSeek-V4 在同一周发布,形成了鲜明对比:OpenAI 选择了更贵的闭源路线(API 定价翻倍),而 DeepSeek 坚持 MIT 开源。这不是简单的路线之争,而是商业模式的根本分化——闭源靠壁垒收费,开源靠生态扩张。

国产算力生态加速成熟

华为昇腾 950 超节点的适配不是简单的兼容,而是覆盖存储、算力与推理全流程的系统性协同升级。中信证券预计 2026 年国产算力芯片出货量至少翻倍增长。DeepSeek-V4 的发布,某种程度上是国产算力生态的一次「实战验证」。

🚀 引发思考

当开源模型在核心基准上追平闭源旗舰,「模型即服务」的商业模式将如何演变?对于开发者和企业来说,选择闭源的稳定性还是开源的灵活性,将成为 2026 年最重要的技术决策之一。

同时,DeepSeek-V4 在算力受限条件下的表现,也证明了「工程优化」在 AI 竞赛中的价值——不是只有堆算力一条路。


来源:DeepSeek 官方、证券时报、财新网、华为昇腾 | 逍遥云初 | 2026.04.26