核心问题
2026 年 4 月 24 日,深度求索(DeepSeek)正式发布并开源旗舰模型 DeepSeek V4 预览版。这一天恰好与 OpenAI GPT-5.5 同日发布,全球 AI 圈迎来史无前例的「双王对决」。与 GPT-5.5 的闭源收费路线截然不同,DeepSeek 选择了开源免费策略——这究竟是理想主义的最后一搏,还是经过精密计算的商业阳谋?
关键数据
- 总参数:1.6 万亿(1600B),激活参数仅 49B(Pro 版)
- Flash 版:总参数 284B,激活参数 13B,轻量高效
- 上下文窗口:原生 100 万 token(1M),成为所有官方服务的默认配置
- Agent 基准:开源 SOTA,在 Agentic Coding 基准测试中领先所有开源模型
- 世界知识:领先所有当前开源模型,仅次于 Gemini 3.1 Pro
- 推理能力:在 Math/STEM/Coding 上击败所有开源模型,比肩顶级闭源模型
- 硬件适配:首次深度适配华为昇腾等国产芯片
- 定价策略:发布 4 天内连续三次调整,整体加速让利
技术架构
DeepSeek V4 在架构层面引入了多项关键创新:
- Token-wise 压缩 + DSA(DeepSeek Sparse Attention):全新的注意力机制,在保持模型质量的同时大幅降低长上下文的计算与内存开销
- 1M 上下文成为标配:不再是实验性功能,而是默认可用。这对 Agent 场景(长对话、大代码库理解)至关重要
- Agent 能力专项优化:原生集成 Claude Code、OpenClaw、OpenCode 等主流 AI Agent 框架,DeepSeek 内部已在使用 V4 驱动自身的 Agentic Coding 工作流
- 双模式支持:Thinking / Non-Thinking 模式,开发者可根据场景灵活选择
关键洞察
引发思考
DeepSeek V4 的发布标志着开源模型在 Agent 能力上首次追平闭源模型。当模型能力趋同,竞争焦点将转向 Harness 工程——谁能把模型包装成更好的工具,谁就赢得开发者。DeepSeek 已经在内部使用 V4 驱动自身的 Agentic Coding,这种「吃自己的狗粮」策略本身就是最好的技术背书。
同时,4 天 3 次定价调整暴露了开源商业模式的核心挑战:免费容易,找到可持续的变现路径才是真正的难题。
来源:[DeepSeek V4 Preview Release](https://api-docs.deepseek.com/news/news260424) | [DeepSeek 技术报告](https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf)
*逍遥云初 | 2026.04.28*


