图片

图片

温馨提醒:数据中心4件套(服务器、存储、网络、SSD全解系列)姊妹篇已全部发布,之前购买过“架构师技术全店资料打包汇总(全)(已持续更新至48本)”的读者免费发放全店更新(请在发货的汇总链接下载),或请凭借购买记录在微店留言获取(PDF阅读版本)。

刚发布没几天的 DeepSeek-V4,突然掀起了行业罕见的降价风暴。

4 月 25 日,V4-Pro 先砍一刀,直接 75% off。26 日晚间,第二刀更狠:全系列缓存命中价砍到首发价的 1/10

一夜之间,AI 定价逻辑被彻底改写。

Flash 版缓存命中输入:0.02 元 / 百万 token。Pro 版叠加优惠后:0.025 元 / 百万 token

有开发者算了笔账,高频调用场景直接省掉 73% 成本。网友调侃:像当年手机流量从 5 元 1G 跌到 5 毛 1G,token 自由真的来了

图片

这次降价不是赔本赚吆喝,而是技术底座彻底换血后的必然结果。

DeepSeek-V4 从架构阶段就深度绑定华为昇腾 950PR推理芯片,不是简单兼容,而是全栈定制优化。950PR 主打推理高吞吐、低时延,FP8 算力 1 PFLOPS,MXFP4 更是冲到 2 PFLOPS,单卡推理效率达到 H20 的近 3 倍。再加上自研高带宽内存与精细的算子优化,让 V4 在百万 token 长上下文下,算力消耗只有上一代的 27%,KV 缓存占用压到 10%。

同样一次推理,以前要花 1 块钱的算力,现在只要 2 毛多。成本下来了,价格才能跟着击穿地板。

Pro 版限时优惠到 5 月 5 日,缓存未命中输入 3 元 / 百万 token,输出 6 元。Flash 版保持常态低价,未命中输入 1 元,输出 2 元。

对企业来说,这不是小优惠,是商业模式的重启

RAG 知识库、智能客服、长文档分析、多轮 Agent…… 这些以前被 token 成本卡死的场景,现在全都能跑通、跑得起。开发者圈已经在说:现在就是把工作流从 GPT、Claude 迁回 DeepSeek 的最佳窗口期。

更关键的信号藏在官方小字里:下半年昇腾 950 超节点批量上市后,Pro 版还会继续大降价

这意味着,今天的 “地板价”,很可能只是起点。

DeepSeek 这波操作,不只是抢份额,更是在重新定义国产 AI 的竞争规则:模型强 + 算力稳 + 成本低,三者绑在一起,才是真正的壁垒。

当顶级大模型配上完全自主的推理芯片,价格战就变成了效率战生态战

对整个行业来说,这是一次清醒的提醒:AI 不再是炫参数、堆算力的游戏,谁能让企业用得起、用得稳、用得放心,谁才握有最终的话语权。

而这一切,才刚刚开始。

图片

免费加入微信交流群,参与技术讨论!

图片

温馨提醒:请之前购买过全店打包架构师技术全店资料打包汇总(全)”的读者,请凭借购买记录在微店留言免费获取(PDF阅读版本)。后续所有更新均免费发放(目前48本资料)。

图片

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

图片

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐