来源:界面新闻 | 时间:2026-04-24

原文:https://finance.sina.com.cn/jjxw/2026-04-24/doc-inhvqmqa4481511.shtml

这篇文章在讲什么

4月24日,DeepSeek发布V4预览版,同时开源两个版本:V4-Pro(49B激活参数)和V4-Flash(13B激活参数)。两款模型均标配100万字(1M Token)上下文能力,一举打破国内长文本处理的极限。100万Token约等于75万中文字,相当于一次性读完《三体》三部曲还有富余。

100万Token上下文是什么概念?相当于一次性读完《三体》三部曲还有富余。目前国内厂商公开的最强长文本能力

关键信息

• V4-Pro:激活参数49B,预训练数据33T,定位高性能旗舰;V4-Flash:激活参数13B,预训练数据32T,主打高速与低成本 • 上下文窗口:两个版本均为1M Token,国内最强 • 定价延续普惠路线:Flash版缓存命中0.2元/百万Token,未命中1元、输出2元;Pro版缓存命中1元、未命中12元、输出24元 • 兼容OpenAI与Anthropic接口,开发者可快速迁移 • 开创全新注意力机制:token维度压缩 + DSA稀疏注意力,实现全球领先长上下文的同时大幅降低计算和显存需求 • 国产算力适配:昇腾超节点全系列产品支持DeepSeek V4系列模型 • 东吴证券评价:综合能力全面超越当前海外主流顶级大模型,性能断层领先

我的看法

DeepSeek V4最值得关注的不只是「100万Token」这个数字,而是它背后的技术路径:token维度的压缩 + 稀疏注意力。这不是靠堆硬件实现的,是算法层面的创新。在国产算力受限的背景下,这条路线的战略价值被严重低估了。

当然,V4-Pro的「高性能旗舰」定位也意味着它的算力需求不低。DeepSeek自己也坦承,受限于当前高端算力,Pro版吞吐有限,下半年昇腾超节点批量上市后才有改善。这说明模型能力已经超前于算力供给——这不是DeepSeek一家的问题,是整个国产AI生态共同面临的瓶颈。

另一个值得关注的信息点:腾讯和阿里正在洽谈投资DeepSeek,估值超过200亿美元。如果这笔投资落地,DeepSeek的资金压力会大幅缓解,2027年商业化目标也更可信。目前DeepSeek API的普惠定价策略,在资金补充后有条件维持更久。

对普通开发者的影响是直接的:1M上下文配合Json输出和工具调用能力,意味着可以做真正的复杂助手应用——比如一次消化整本技术文档、多个API文档的对比分析。Flash版的价格也足够低,做原型验证阶段完全够用。值得上手试试。

核心判断:V4代表了国产大模型在「工程能力」维度追上甚至领先的时间节点。2027年的商业化目标,有资金支持的前提下,有合理路径

相关阅读

原文链接:https://finance.sina.com.cn/jjxw/2026-04-24/doc-inhvqmqa4481511.shtml

来源:界面新闻 | 时间:2026-04-24