核心问题

2026 年 4 月 24 日,深度求索(DeepSeek)正式发布并开源旗舰模型 DeepSeek V4 预览版。这一天恰好与 OpenAI GPT-5.5 同日发布,全球 AI 圈迎来史无前例的「双王对决」。与 GPT-5.5 的闭源收费路线截然不同,DeepSeek 选择了开源免费策略——这究竟是理想主义的最后一搏,还是经过精密计算的商业阳谋?

关键数据

  • 总参数:1.6 万亿(1600B),激活参数仅 49B(Pro 版)
  • Flash 版:总参数 284B,激活参数 13B,轻量高效
  • 上下文窗口:原生 100 万 token(1M),成为所有官方服务的默认配置
  • Agent 基准:开源 SOTA,在 Agentic Coding 基准测试中领先所有开源模型
  • 世界知识:领先所有当前开源模型,仅次于 Gemini 3.1 Pro
  • 推理能力:在 Math/STEM/Coding 上击败所有开源模型,比肩顶级闭源模型
  • 硬件适配:首次深度适配华为昇腾等国产芯片
  • 定价策略:发布 4 天内连续三次调整,整体加速让利

技术架构

DeepSeek V4 在架构层面引入了多项关键创新:

  • Token-wise 压缩 + DSA(DeepSeek Sparse Attention):全新的注意力机制,在保持模型质量的同时大幅降低长上下文的计算与内存开销
  • 1M 上下文成为标配:不再是实验性功能,而是默认可用。这对 Agent 场景(长对话、大代码库理解)至关重要
  • Agent 能力专项优化:原生集成 Claude Code、OpenClaw、OpenCode 等主流 AI Agent 框架,DeepSeek 内部已在使用 V4 驱动自身的 Agentic Coding 工作流
  • 双模式支持:Thinking / Non-Thinking 模式,开发者可根据场景灵活选择

关键洞察

开源 vs 闭源的战略分野:GPT-5.5 收费翻倍,DeepSeek V4 开源免费——两种商业哲学在同一周正面碰撞。开源策略的核心逻辑是:通过免费模型抢占开发者生态,用 API 调用量和云服务变现。V4 发布后多家厂商在一天内完成私有化部署,验证了这一策略的吸引力。
国产芯片适配的政治经济学:DeepSeek V4 首次深度适配华为昇腾,这不仅是技术选择,更是地缘博弈下的战略卡位。在全球芯片管制背景下,一个能在国产算力上高效运行的顶级开源模型,其战略价值远超模型本身的性能指标。
1M 上下文的 Agent 意义:上下文窗口从 128K 跃升至 1M,不只是数字增长——它意味着 Agent 可以在单次对话中理解整个代码库、处理超长文档、维持复杂多步任务的完整上下文。这是 Agent 从「对话助手」进化为「自主协作者」的基础设施升级。

引发思考

DeepSeek V4 的发布标志着开源模型在 Agent 能力上首次追平闭源模型。当模型能力趋同,竞争焦点将转向 Harness 工程——谁能把模型包装成更好的工具,谁就赢得开发者。DeepSeek 已经在内部使用 V4 驱动自身的 Agentic Coding,这种「吃自己的狗粮」策略本身就是最好的技术背书。

同时,4 天 3 次定价调整暴露了开源商业模式的核心挑战:免费容易,找到可持续的变现路径才是真正的难题。


来源:[DeepSeek V4 Preview Release](https://api-docs.deepseek.com/news/news260424) | [DeepSeek 技术报告](https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf)

*逍遥云初 | 2026.04.28*