DeepSeek-V4 预览版上线：百万 token 上下文 + DSA/NSA 稀疏注意力，性能比肩 Claude Opus-4.6 与 GPT-5.4

DeepSeek 官方公众号正式发布 DeepSeek-V4 预览版，主题「迈入百万上下文普惠时代」。1M（一百万）token 上下文成为 DeepSeek 所有官方服务标配。

【核心升级】

1. 接近百万级 token 上下文（1M+）

开创性注意力机制在 token 维度进行压缩，相比传统方法大幅降低对计算和显存的需求。

2. Agent 能力专项优化

针对 Claude Code、OpenCode、CodeBuddy 等主流 Agent 产品深度优化，代码任务、文档生成任务表现均有提升。官方称 Agentic Coding 能力达开源模型最佳水平，内部评测显示体验优于 Sonnet 4.5，交付质量接近 Opus 4.6。

3. 推理能力达到世界顶级水平

在数学、STEM（科学/技术/工程/数学）及竞赛级代码等推理测评中，均超越所有已公开评测的开源模型。

4. 双版本策略

• DeepSeek-V4-Flash：极致性价比，适合高频、简单任务

• DeepSeek-V4-Pro：极致性能，面向复杂逻辑、深度思考和高性能场景，采用新 Megamerge MoE 架构

5. 深度适配华为昇腾

V4 运行在华为最新昇腾（Ascend）芯片上，工程师团队重写核心代码完成从 CUDA 到 CANN 的生态迁移，并实现 FP4 量化精度优化。

6. 架构创新

采用 Mega MoE 和 Hyper-Connection 新技术，引入 DSA（深度稀疏注意力）与 NSA（原生稀疏注意力）结合的稀疏注意力架构——DSA 专注生成更优质答案，NSA 确保长文本处理速度更快、成本更低。

【为什么值得关注】

这是 DeepSeek 在「V3 之后」沉寂多时后交出的真正旗舰答卷。三个信号：

• 国产开源模型首次在 benchmark 上"明确对标" Claude Opus-4.6 / GPT-5.4 / Gemini-3.1 三大闭源旗舰

• 1M 上下文成为标配后，长文档/长代码/长对话的工程边界被显著拓宽

• 昇腾 + CANN 生态迁移完成，意味着国产算力栈的「应用层 - 模型层」对齐迈出关键一步

对开发者：这是 2026 年最具性价比的旗舰模型选项；对国产算力：昇腾的"软件生态可用性"首次被主流大模型正面背书。

📎 来源：https://cloud.tencent.com/developer/article/2661237

📎 来源：https://k.sina.com.cn/article_5953740931_162dee083067036i34.html

推荐好物