DeepSeek-V4预览版上线：百万上下文，75万字一次性读完三体

来源：界面新闻 | 时间：2026-04-24

原文：https://finance.sina.com.cn/jjxw/2026-04-24/doc-inhvqmqa4481511.shtml

这篇文章在讲什么

4月24日，DeepSeek发布V4预览版，同时开源两个版本：V4-Pro（49B激活参数）和V4-Flash（13B激活参数）。两款模型均标配100万字（1M Token）上下文能力，一举打破国内长文本处理的极限。100万Token约等于75万中文字，相当于一次性读完《三体》三部曲还有富余。

100万Token上下文是什么概念？相当于一次性读完《三体》三部曲还有富余。目前国内厂商公开的最强长文本能力

关键信息

• V4-Pro：激活参数49B，预训练数据33T，定位高性能旗舰；V4-Flash：激活参数13B，预训练数据32T，主打高速与低成本 • 上下文窗口：两个版本均为1M Token，国内最强 • 定价延续普惠路线：Flash版缓存命中0.2元/百万Token，未命中1元、输出2元；Pro版缓存命中1元、未命中12元、输出24元 • 兼容OpenAI与Anthropic接口，开发者可快速迁移 • 开创全新注意力机制：token维度压缩 + DSA稀疏注意力，实现全球领先长上下文的同时大幅降低计算和显存需求 • 国产算力适配：昇腾超节点全系列产品支持DeepSeek V4系列模型 • 东吴证券评价：综合能力全面超越当前海外主流顶级大模型，性能断层领先

我的看法

DeepSeek V4最值得关注的不只是「100万Token」这个数字，而是它背后的技术路径：token维度的压缩 + 稀疏注意力。这不是靠堆硬件实现的，是算法层面的创新。在国产算力受限的背景下，这条路线的战略价值被严重低估了。

当然，V4-Pro的「高性能旗舰」定位也意味着它的算力需求不低。DeepSeek自己也坦承，受限于当前高端算力，Pro版吞吐有限，下半年昇腾超节点批量上市后才有改善。这说明模型能力已经超前于算力供给——这不是DeepSeek一家的问题，是整个国产AI生态共同面临的瓶颈。

另一个值得关注的信息点：腾讯和阿里正在洽谈投资DeepSeek，估值超过200亿美元。如果这笔投资落地，DeepSeek的资金压力会大幅缓解，2027年商业化目标也更可信。目前DeepSeek API的普惠定价策略，在资金补充后有条件维持更久。

对普通开发者的影响是直接的：1M上下文配合Json输出和工具调用能力，意味着可以做真正的复杂助手应用——比如一次消化整本技术文档、多个API文档的对比分析。Flash版的价格也足够低，做原型验证阶段完全够用。值得上手试试。

核心判断：V4代表了国产大模型在「工程能力」维度追上甚至领先的时间节点。2027年的商业化目标，有资金支持的前提下，有合理路径

DeepSeek-V4预览版上线：百万上下文，75万字一次性读完三体

这篇文章在讲什么

关键信息

我的看法

相关阅读

推荐好物

相关文章

DeepSeek-V4预览版上线：百万上下文，75万字一次性读完三体

这篇文章在讲什么

关键信息

我的看法

相关阅读

推荐好物

酒类

女装

鲜花

相关文章

AI科技前沿快讯 | 2026年7月28日

长鑫科技今日 A 股科创板上市：国产 DRAM 龙头全球份额跃升至第四

2026 年国内 AI 剧漫剧市场规模将达 400 亿元，同比增长 138%