DeepSeek 官方公众号正式发布 DeepSeek-V4 预览版,主题「迈入百万上下文普惠时代」。1M(一百万)token 上下文成为 DeepSeek 所有官方服务标配。

【核心升级】

1. 接近百万级 token 上下文(1M+)

开创性注意力机制在 token 维度进行压缩,相比传统方法大幅降低对计算和显存的需求。

2. Agent 能力专项优化

针对 Claude Code、OpenCode、CodeBuddy 等主流 Agent 产品深度优化,代码任务、文档生成任务表现均有提升。官方称 Agentic Coding 能力达开源模型最佳水平,内部评测显示体验优于 Sonnet 4.5,交付质量接近 Opus 4.6。

3. 推理能力达到世界顶级水平

在数学、STEM(科学/技术/工程/数学)及竞赛级代码等推理测评中,均超越所有已公开评测的开源模型。

4. 双版本策略

• DeepSeek-V4-Flash:极致性价比,适合高频、简单任务

• DeepSeek-V4-Pro:极致性能,面向复杂逻辑、深度思考和高性能场景,采用新 Megamerge MoE 架构

5. 深度适配华为昇腾

V4 运行在华为最新昇腾(Ascend)芯片上,工程师团队重写核心代码完成从 CUDA 到 CANN 的生态迁移,并实现 FP4 量化精度优化。

6. 架构创新

采用 Mega MoE 和 Hyper-Connection 新技术,引入 DSA(深度稀疏注意力)与 NSA(原生稀疏注意力)结合的稀疏注意力架构——DSA 专注生成更优质答案,NSA 确保长文本处理速度更快、成本更低。

【为什么值得关注】

这是 DeepSeek 在「V3 之后」沉寂多时后交出的真正旗舰答卷。三个信号:

• 国产开源模型首次在 benchmark 上"明确对标" Claude Opus-4.6 / GPT-5.4 / Gemini-3.1 三大闭源旗舰

• 1M 上下文成为标配后,长文档/长代码/长对话的工程边界被显著拓宽

• 昇腾 + CANN 生态迁移完成,意味着国产算力栈的「应用层 - 模型层」对齐迈出关键一步

对开发者:这是 2026 年最具性价比的旗舰模型选项;对国产算力:昇腾的"软件生态可用性"首次被主流大模型正面背书。

📎 来源:https://cloud.tencent.com/developer/article/2661237

📎 来源:https://k.sina.com.cn/article_5953740931_162dee083067036i34.html