DeepSeek V4发布：让英伟达最焦虑的，不是模型

回看 DeepSeek V4 的整个发布，给我最大的感受不是某个跑分数字。把 1M 上下文做成了开源标配。把国产算力的量产路线图摆上了台面。把顶级 AI 能力的门槛又往下压了一截。没有发布会。没有 PPT。没有一句"遥遥领先"。“不诱于誉，不恐于诽，率道而行，端然正己。不喧哗，但有分量。这个时代最可怕的不是高调的颠覆者，而是安静地改变规则的人。AI 这条赛道，正在从一个"技术竞赛"变成一个"生态战

小饕

357人浏览 · 2026-04-24 19:52:24

小饕 · 2026-04-24 19:52:24 发布

1.6万亿参数、1M上下文、零帧开源——但真正改变格局的，是发布稿里一句被99%的人忽略的话。

2026年4月24日。

没有发布会。没有预热海报。没有"即将揭晓"的倒计时海报。

DeepSeek 把 V4 直接甩了出来——同步开源，同步上线官网和 App，同步更新 API。

零帧起手。

全球 AI 圈的反应是：先刷跑分，再吵参数，最后发现，真正改变格局的那句话，被 99% 的人忽略了。

如果你关注 AI 投资或正在做 AI 应用开发，这篇文章值得你花 8 分钟读完。因为 V4 的背后，藏着一个正在发生的结构性拐点。

01 V4 发布第一天，到底强在哪？

V4 一口气发了两个版本，刀法极准。

版本	总参数	激活参数	定位
V4-Pro	1.6 万亿	49 亿	旗舰，对标顶级闭源
V4-Flash	2840 亿	130 亿	性价比，更快更便宜

看到 1.6 万亿这个数字，你可能觉得"又是一个堆参数的暴力美学"。

但你理解错了。

V4 用的是 MoE（混合专家）架构。模型内部有大量"专家"子网络，每次处理请求时，路由机制只激活其中一小部分参与计算。

通俗地说——你家有 1600 个员工，个个身怀绝技，但每个项目只派 49 人上阵。 知识储备是 1600 人的水平，运营成本只有 49 人。

总参数决定知识容量，激活参数决定推理成本。

这才是 MoE 最核心的商业逻辑。

在能力对比上，V4 做了一个在国内 AI 发布中很少见的事：

它承认了自己不如谁。

发布稿明确写道：V4-Pro 的 Agent 能力优于 Sonnet 4.5，接近 Opus 4.6 非思考模式，但与 Opus 4.6 思考模式存在一定差距。

不吹、不躲、不玩文字游戏。反而让人更信了。

不躲差距的自信，才是真自信。

数学、STEM、竞赛代码等推理密集型任务，V4-Pro 超越所有开源，比肩顶级闭源。

世界知识方面，仅稍逊于 Gemini Pro 3.1。

但最打动我的不是这些跑分——

02 1M 上下文：一年前还是"王牌"，今天变成了"标配"

这是 V4 最值得你认真对待的技术变化。

一年前，百万 token 上下文窗口是 Gemini 的独家王牌。

彼时其他主流模型呢？闭源的要么 128K、要么 200K，开源的几乎没人能做到这个量级可用。

1M 上下文意味着什么？

一整部长篇小说 + 一个大型代码库 + 几十份研究报告，同时塞进模型的"工作记忆"。

这不是量变。这是质变。

今天，DeepSeek 把 1M 上下文做成了标配，并且开源。

问题来了：为什么之前做不到的事，现在做到了？

因为传统 Transformer 架构有一个死穴——注意力机制的计算量随上下文长度平方级增长。

上下文翻倍，计算量变四倍。128K 到 1M，理论计算量增长约 60 倍。结果就是：要么贵到离谱，要么慢到不可用，或者两者兼有。

V4 的解法叫 DSA（DeepSeek Sparse Attention，稀疏注意力机制）。

用大白话解释——假设你在读一本 1000 页的书，有人问你"第 500 页的观点和哪些内容有关"。

笨办法：把第 500 页和其他 999 页逐一比较。

DSA 的办法分两步：

第一步，先粗筛——扫一眼就知道哪些页面可能相关，只精读那几十页，其余跳过。
第二步，做压缩——就算那几十页"相关页面"，也不用一字不差地读，先浓缩成摘要再比较。

两步叠加，书从 1000 页变成 2000 页，工作量不再是四倍，而是大概两倍多。

增长曲线被压平了。

真正厉害的突破，从来不是把现有的路走得更远，而是换一条路走。

1M 上下文变成开源标配的真正意义是什么？

是成本曲线被改写了。

这个技术壁垒一旦被打破并且开源，任何团队都能在 DSA 架构基础上继续迭代。长上下文从一个"有足够算力才能玩"的高端功能，变成了人人都能用的基础设施。

这对 Agent 应用的影响尤其致命——任务链越长，上下文窗口的瓶颈越明显。1M 意味着 Agent 可以在更长的操作链里保持状态连贯，处理更大规模的代码库。

但这些都还不是重点。

03 那条被忽略的消息，才是整场发布最狠的一步

回到文章开头我说的那句话。

发布稿里有一句轻描淡写的话，被绝大多数人忽略了：

下半年批量上国产算力。

轻吗？轻。

重要吗？太重要了。

这句话的分量，你得放在过去两年的地缘政治背景里才能看清。

2023 年起，美国对华芯片出口管制一波比一波紧。英伟达 H100、H800、A100 相继被禁。中国 AI 公司能合法拿到的高端 GPU 越来越少。

DeepSeek 此前靠的是英伟达——V3 的训练用的是 H800 集群。 但这条路，越走越窄。

昇腾，是目前国内最成熟的替代方案。

这次发布稿里，昇腾方面给出了相当硬的数据：昇腾 950 超节点上，V4-Pro 推理延迟 TPOT 20ms，V4-Flash 10ms。

算力自由，才是 AI 时代真正的自由。

当然，这些是离线推理的数据，实际部署会打折。但方向是明确的——

昇腾已经能支撑 V4 量产部署，不再是实验室里的"备胎"。

“下半年批量上国产算力”，至少两层含义：

第一层，供给安全。

如果 DeepSeek 能在昇腾上跑出和英伟达相近的推理性能，算力就不再是一个单点风险。出口管制的压力，被直接对冲。

第二层，生态信号。

这才是真正让英伟达睡不着觉的部分。

DeepSeek 是中国最具影响力的开源模型之一。它在昇腾上规模部署，意味着什么？

意味着整个开源社区和下游应用会被带动去适配昇腾生态。

这对国产算力生态的价值，远超卖出 1000 块芯片。

硬件卖的是产品，生态卖的是未来。

硬件层面的竞争是可以被超越的。但一旦生态形成了用户惯性和开发者社区，这就是一个自我强化的飞轮。

DeepSeek 和国产算力的深度绑定，是这次发布里最具长期战略意义的一笔。没有之一。

04 对你我意味着什么？

别急，下面这部分才是和你最相关的。

如果你是个开发者：

V4 是一个真正能替代部分商业 API 的开源大模型——成本更低，可控性更高。
100 万 token 上下文，直接降低企业部署门槛。长文档、大代码库、多文件分析，一次性搞定。
原生多模态，减少你拼接各种模型的复杂度。

如果你在做投资或关注市场：

国产芯片厂商将直接受益——华为、寒武纪、海光等产业链标的。
AIDC 基础设施和云计算公司获得更多订单机会。
别忘了，过去 DeepSeek 发新模型就引发过英伟达股价大跌。V4 同样可能带来市场波动。

但比这些更值得关注的是一个趋势——

AI 的竞争正在从"谁的模型更强"转向"谁能在更低的成本下把模型用得更广"。

V4 的 MoE 架构降低推理成本，DSA 降低长上下文成本，国产算力降低供给风险——三条线同时发力，指向同一个目标：

让顶级 AI 能力不再是"有足够预算才能玩"的奢侈品。

05 写在最后

回看 DeepSeek V4 的整个发布，给我最大的感受不是某个跑分数字。

是它安静地、几乎不着痕迹地，做了三件事：

把 1M 上下文做成了开源标配。
把国产算力的量产路线图摆上了台面。
把顶级 AI 能力的门槛又往下压了一截。

没有发布会。没有 PPT。没有一句"遥遥领先"。

引用发布稿里的那句荀子：

“不诱于誉，不恐于诽，率道而行，端然正己。”

不喧哗，但有分量。

这个时代最可怕的不是高调的颠覆者，而是安静地改变规则的人。

AI 这条赛道，正在从一个"技术竞赛"变成一个"生态战争"。

而生态战争的胜负，不取决于谁跑分最高——取决于谁能让最多的开发者，以最低的成本，做出最酷的东西。

你怎么看 DeepSeek V4 的发布？

是又一场 hype，还是真的在改变游戏规则？欢迎在评论区聊聊你的判断。

如果你觉得这篇文章有价值，点个在看或转发，让更多人看到。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

vLLM 吞吐优化误区：为什么你的批处理大小反而拉低了 P99 延迟

DeepSeek技术社区

Agent工具越多越好？权限失控时如何用OpenTelemetry快速定位故障边界

DeepSeek技术社区

混合检索权重调参：BM25与向量分数归一化为何总踩坑？

DeepSeek技术社区

所有评论(0)

查看更多评论

小饕

@x32sky

已为社区贡献2条内容

DeepSeek V4发布：让英伟达最焦虑的，不是模型

小饕

01 V4 发布第一天，到底强在哪？

02 1M 上下文：一年前还是"王牌"，今天变成了"标配"

03 那条被忽略的消息，才是整场发布最狠的一步

04 对你我意味着什么？

05 写在最后

所有评论(0)

温馨提示：您尚未绑定手机号

小饕