1.6万亿参数、1M上下文、零帧开源——但真正改变格局的,是发布稿里一句被99%的人忽略的话。

2026年4月24日。

没有发布会。没有预热海报。没有"即将揭晓"的倒计时海报。

DeepSeek 把 V4 直接甩了出来——同步开源,同步上线官网和 App,同步更新 API。

零帧起手。

全球 AI 圈的反应是:先刷跑分,再吵参数,最后发现,真正改变格局的那句话,被 99% 的人忽略了。

如果你关注 AI 投资或正在做 AI 应用开发,这篇文章值得你花 8 分钟读完。因为 V4 的背后,藏着一个正在发生的结构性拐点。


01 V4 发布第一天,到底强在哪?

V4 一口气发了两个版本,刀法极准。

版本 总参数 激活参数 定位
V4-Pro 1.6 万亿 49 亿 旗舰,对标顶级闭源
V4-Flash 2840 亿 130 亿 性价比,更快更便宜

看到 1.6 万亿这个数字,你可能觉得"又是一个堆参数的暴力美学"。

但你理解错了。

V4 用的是 MoE(混合专家)架构。模型内部有大量"专家"子网络,每次处理请求时,路由机制只激活其中一小部分参与计算。

通俗地说——你家有 1600 个员工,个个身怀绝技,但每个项目只派 49 人上阵。 知识储备是 1600 人的水平,运营成本只有 49 人。

总参数决定知识容量,激活参数决定推理成本。

这才是 MoE 最核心的商业逻辑。

在能力对比上,V4 做了一个在国内 AI 发布中很少见的事:

它承认了自己不如谁。

发布稿明确写道:V4-Pro 的 Agent 能力优于 Sonnet 4.5,接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式存在一定差距。

不吹、不躲、不玩文字游戏。反而让人更信了。

不躲差距的自信,才是真自信。

数学、STEM、竞赛代码等推理密集型任务,V4-Pro 超越所有开源,比肩顶级闭源。

世界知识方面,仅稍逊于 Gemini Pro 3.1。

但最打动我的不是这些跑分——


02 1M 上下文:一年前还是"王牌",今天变成了"标配"

这是 V4 最值得你认真对待的技术变化。

一年前,百万 token 上下文窗口是 Gemini 的独家王牌。

彼时其他主流模型呢?闭源的要么 128K、要么 200K,开源的几乎没人能做到这个量级可用。

1M 上下文意味着什么?

一整部长篇小说 + 一个大型代码库 + 几十份研究报告,同时塞进模型的"工作记忆"。

这不是量变。这是质变。

今天,DeepSeek 把 1M 上下文做成了标配,并且开源。

问题来了:为什么之前做不到的事,现在做到了?

因为传统 Transformer 架构有一个死穴——注意力机制的计算量随上下文长度平方级增长。

上下文翻倍,计算量变四倍。128K 到 1M,理论计算量增长约 60 倍。结果就是:要么贵到离谱,要么慢到不可用,或者两者兼有。

V4 的解法叫 DSA(DeepSeek Sparse Attention,稀疏注意力机制)。

用大白话解释——假设你在读一本 1000 页的书,有人问你"第 500 页的观点和哪些内容有关"。

笨办法:把第 500 页和其他 999 页逐一比较。

DSA 的办法分两步:

  • 第一步,先粗筛——扫一眼就知道哪些页面可能相关,只精读那几十页,其余跳过。
  • 第二步,做压缩——就算那几十页"相关页面",也不用一字不差地读,先浓缩成摘要再比较。

两步叠加,书从 1000 页变成 2000 页,工作量不再是四倍,而是大概两倍多。

增长曲线被压平了。

真正厉害的突破,从来不是把现有的路走得更远,而是换一条路走。

1M 上下文变成开源标配的真正意义是什么?

是成本曲线被改写了。

这个技术壁垒一旦被打破并且开源,任何团队都能在 DSA 架构基础上继续迭代。长上下文从一个"有足够算力才能玩"的高端功能,变成了人人都能用的基础设施。

这对 Agent 应用的影响尤其致命——任务链越长,上下文窗口的瓶颈越明显。1M 意味着 Agent 可以在更长的操作链里保持状态连贯,处理更大规模的代码库。

但这些都还不是重点。


03 那条被忽略的消息,才是整场发布最狠的一步

回到文章开头我说的那句话。

发布稿里有一句轻描淡写的话,被绝大多数人忽略了:

下半年批量上国产算力。

轻吗?轻。

重要吗?太重要了。

这句话的分量,你得放在过去两年的地缘政治背景里才能看清。

2023 年起,美国对华芯片出口管制一波比一波紧。英伟达 H100、H800、A100 相继被禁。中国 AI 公司能合法拿到的高端 GPU 越来越少。

DeepSeek 此前靠的是英伟达——V3 的训练用的是 H800 集群。 但这条路,越走越窄。

昇腾,是目前国内最成熟的替代方案。

这次发布稿里,昇腾方面给出了相当硬的数据:昇腾 950 超节点上,V4-Pro 推理延迟 TPOT 20ms,V4-Flash 10ms。

算力自由,才是 AI 时代真正的自由。

当然,这些是离线推理的数据,实际部署会打折。但方向是明确的——

昇腾已经能支撑 V4 量产部署,不再是实验室里的"备胎"。

“下半年批量上国产算力”,至少两层含义:

第一层,供给安全。

如果 DeepSeek 能在昇腾上跑出和英伟达相近的推理性能,算力就不再是一个单点风险。出口管制的压力,被直接对冲。

第二层,生态信号。

这才是真正让英伟达睡不着觉的部分。

DeepSeek 是中国最具影响力的开源模型之一。它在昇腾上规模部署,意味着什么?

意味着整个开源社区和下游应用会被带动去适配昇腾生态。

这对国产算力生态的价值,远超卖出 1000 块芯片。

硬件卖的是产品,生态卖的是未来。

硬件层面的竞争是可以被超越的。但一旦生态形成了用户惯性和开发者社区,这就是一个自我强化的飞轮。

DeepSeek 和国产算力的深度绑定,是这次发布里最具长期战略意义的一笔。没有之一。


04 对你我意味着什么?

别急,下面这部分才是和你最相关的。

如果你是个开发者:

  • V4 是一个真正能替代部分商业 API 的开源大模型——成本更低,可控性更高。
  • 100 万 token 上下文,直接降低企业部署门槛。长文档、大代码库、多文件分析,一次性搞定。
  • 原生多模态,减少你拼接各种模型的复杂度。

如果你在做投资或关注市场:

  • 国产芯片厂商将直接受益——华为、寒武纪、海光等产业链标的。
  • AIDC 基础设施和云计算公司获得更多订单机会。
  • 别忘了,过去 DeepSeek 发新模型就引发过英伟达股价大跌。V4 同样可能带来市场波动。

但比这些更值得关注的是一个趋势——

AI 的竞争正在从"谁的模型更强"转向"谁能在更低的成本下把模型用得更广"。

V4 的 MoE 架构降低推理成本,DSA 降低长上下文成本,国产算力降低供给风险——三条线同时发力,指向同一个目标:

让顶级 AI 能力不再是"有足够预算才能玩"的奢侈品。


05 写在最后

回看 DeepSeek V4 的整个发布,给我最大的感受不是某个跑分数字。

是它安静地、几乎不着痕迹地,做了三件事:

把 1M 上下文做成了开源标配。
把国产算力的量产路线图摆上了台面。
把顶级 AI 能力的门槛又往下压了一截。

没有发布会。没有 PPT。没有一句"遥遥领先"。

引用发布稿里的那句荀子:

“不诱于誉,不恐于诽,率道而行,端然正己。”

不喧哗,但有分量。

这个时代最可怕的不是高调的颠覆者,而是安静地改变规则的人。

AI 这条赛道,正在从一个"技术竞赛"变成一个"生态战争"。

而生态战争的胜负,不取决于谁跑分最高——取决于谁能让最多的开发者,以最低的成本,做出最酷的东西。


你怎么看 DeepSeek V4 的发布?

是又一场 hype,还是真的在改变游戏规则?欢迎在评论区聊聊你的判断。

如果你觉得这篇文章有价值,点个在看转发,让更多人看到。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐