DeepSeek二连降价创全球大模型价格新低，或带动国产AI芯片销量

芯片只是第一层，真正决定国产算力能否吃下需求的是软件生态，模型能否稳定跑在昇腾上，推理框架能否适配，算子有无优化，开发者迁移成本高低，才决定这条路是“能演示”还是“能商业化”。大模型推理消耗算力、电力、带宽和运维，价格越低、调用量越大，对基础设施压力越大。月之暗面和MiniMax量大便宜，DeepSeek降价让它们有些难堪，但月之暗面的K 2.6以及MiniMax即将发布的M3模型，性能高于Dee

IT界那些事儿

1436人浏览 · 2026-04-28 17:21:04

IT界那些事儿 · 2026-04-28 17:21:04 发布

【DeepSeek二连降价，创全球大模型价格新低】

梁文锋又出手了，而且还是二连降价。4月25日，DeepSeek - V4 - Pro开启限时2.5折优惠，输入价格（缓存命中）降至0.25元/百万tokens。业内还没反应过来，4月26日晚间，DeepSeek再次降价，全系API输入缓存命中价格直接降至首发价的1/10。叠加限时折扣后，V4 - Pro的缓存输入低至0.025元/百万tokens，V4 - Flash降至0.02元/百万tokens，创下全球大模型价格新低。

这意味着什么呢？上海译文出版的《挪威的森林》，全书约20万字，将整本书命中缓存后喂给DeepSeek - V4 - Pro，总成本不到1分钱。DeepSeek这次降的不只是token的单价，还把“长文本、长代码、长知识库”等原本最烧钱的AI应用场景，打入了价格谷底。

【摸着DeepSeek过河，降价影响几何】

DeepSeek两天两降，并非简单的价格战。先用限时折扣测试市场承受力和服务器负载，紧接着对缓存命中这一高频场景实施永久性降价。对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景，成本可直接下降90%以上。DeepSeek研究员陈德里在社交媒体上确认，输入缓存降价是永久性的，并打上了“AGI for Everyone”的标签。

虽然国内AI公司几乎都摸着DeepSeek过河，但DeepSeek降价后，并非所有人都担心。大厂不在乎，因为大厂卖API本质是卖背后的一整套服务，大模型API只是引流，真正赚钱的是背后的计算、存储、数据库等云服务。以阿里云为例，4月15日算力卡涨5% - 34%、存储涨30%，却愿意代理DeepSeek，因为即便客户使用DeepSeek，也离不开阿里云的算力和存储。

真正难受的是智谱、MiniMax和月之暗面这样的中间层。智谱AI在4个月里连续三次涨价，累计涨幅83%，调价后，GLM系列编程场景缓存命中Token单价已接近Claude Sonnet 4.6的水平。智谱CEO张鹏称“瓶颈在算力，不在客户”，智谱公开的商业逻辑公式为：AGI商业价值 = 智能上限×Token消耗规模。对于智谱这个上市公司，算力是稀缺资源，其API年化收入（ARR）在过去12个月暴涨60倍至17亿元，Token调用量在价格上涨83%的背景下仍增长400%。

月之暗面和MiniMax量大便宜，DeepSeek降价让它们有些难堪，但月之暗面的K 2.6以及MiniMax即将发布的M3模型，性能高于DeepSeek - V4 - Pro，它们在客户群体上可能与DeepSeek有交集，但难形成全面冲突。

促使DeepSeek降价的原因或许来自融资，此前DeepSeek传出100亿美元估值，随着阿里、腾讯入局，估值拉高至200亿美元。估值拉高后融资金额增多，梁文锋需用市场、收入证明DeepSeek达到估值高度，所以即便赔本赚吆喝也不意外。对于上市公司，API是核心收入，压低API价格等于降低毛利。并且，若承认“要降价才能竞争”，就等于承认“没有技术护城河”；坚持高价，则需拿出有说服力的差异化价值。

DeepSeek降价本质是找到对应客户，梁文锋不需要DeepSeek有最强性能。模型性能和使用体验有鸿沟，只要开发者和企业知道“有便宜选择”，行业定价体系就会重构，就像当年小米手机冲击智能手机市场，改变了人们对“合理价格”的预期。梁文锋意识到AI是基础设施，价格战难免，最终AI会像云计算一样走向“规模经济 + 薄利多销”，成本结构优、技术迭代快、能更早实现规模效应的企业才能活到最后。

【DeepSeek适配昇腾，带动国产AI芯片替代】

更关键的是，DeepSeek已适配华为昇腾生态。DeepSeek官方透露，Pro版本服务吞吐受限于高端算力，预计下半年昇腾950超节点批量上市后，Pro价格将大幅下调，此次价格下降只是预告。

昇腾950超节点通过集群方案弥补单卡制程差距。单颗昇腾910C芯片的BF16性能仅为英伟达Blackwell单芯片的约三分之一，但通过超节点集群方式，单个CloudMatrix 384集群的BF16总性能反而是NVL72的1.7倍，总内存容量为后者3.6倍，总内存带宽为后者2.1倍。

考虑硬件成本，事情更有意思。华为昇腾950PR定价约7万元人民币，英伟达同级别H200约合人民币25万元。按FP8精度算，昇腾950PR是7万元/PFLOPS，英伟达H200是6.31万元/PFLOPS；按推理专用的FP4精度算，昇腾950PR是4.49万元/PFLOPS，英伟达B200是4.44万元/PFLOPS。

DeepSeek降价砍在缓存命中价格上，该场景不依赖“单卡训练峰值”，更适合通过国产芯片集群、工程优化和规模化调度摊薄成本。以100卡集群为例，英伟达H20方案裸卡成本1000万，13台服务器主机286万，加上机柜等，总价约不到1500万元；同规模华为昇腾950PR方案约1000万出头。昇腾950PR单卡功耗比H20高，但单位算力功耗低65%，相同算力下对电力和制冷需求大幅降低，基建投入显著减少，且1张昇腾950PR推理吞吐量约等于2.2 - 2.8张H20，昇腾方案可能比英伟达H20方案节省60%到70%。

大模型API价格很大程度取决于硬件成本，DeepSeek打折可能带动国产AI芯片销量。连DeepSeek都大规模使用国产芯片，产业链将被激活，云厂商会增加采购，芯片厂商会加大研发投入，开发者会适配国产生态。华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌在DeepSeek - V4发布当天就完成了适配，发布当天AI算力芯片板块股价大涨，海光信息、寒武纪、天数智芯等涨幅明显。

当然，这并不意味着国产算力已全面替代英伟达，训练侧仍更依赖高端GPU、成熟软件栈和大规模集群经验。DeepSeek真正走通的路径，可能是先在推理侧、缓存场景、长文本应用里，释放国产算力的性价比优势。芯片只是第一层，真正决定国产算力能否吃下需求的是软件生态，模型能否稳定跑在昇腾上，推理框架能否适配，算子有无优化，开发者迁移成本高低，才决定这条路是“能演示”还是“能商业化”。DeepSeek的价值在于，它是头部模型亲自把流量和需求带进国产算力生态。

【梁文锋为DeepSeek寻找商业模式】

梁文锋真正的杀招不在于“便宜”，而在于“定价”。他用DeepSeek的影响力，让市场形成新认知：“如果DeepSeek这个级别的模型已能做到这个价，别家为何还要卖这么贵？”一旦锚点形成，其他厂商就陷入两难，跟价利润空间被压缩，不跟则需向客户解释“贵在哪里”。

梁文锋曾在2024年表示，按自己步调做事，核算成本定价，原则是不贴钱、不赚暴利，价格在成本之上稍有利润。降价一方面是探索下一代模型结构时成本下降，另一方面认为API和AI应普惠、人人可用。他认为让AI普惠才能激发应用市场，应用市场足够大，技术迭代飞轮才能真正转起来。

便宜可打开市场，但不是商业模式。DeepSeek不能靠超低API价格生存，API价格低短期内可制造影响力、吸引客户，但难成长期公司全部收入来源。大模型推理消耗算力、电力、带宽和运维，价格越低、调用量越大，对基础设施压力越大。低价是入口，不应是终点。

DeepSeek目标是成为中国AI开发者的“默认底座”。只要足够多应用和agent以DeepSeek为基座模型开发，DeepSeek就掌握入口。API收入只是第一层，模型标准、开发者生态、企业部署、算力适配、云厂商合作，才是梁文锋想要的商业化空间。

DeepSeek更大的商业化机会可能在企业私有化部署。对于金融、政务、制造、能源等行业，数据安全可控是核心问题，它们未必长期使用公共API，但愿意为能部署在自己机房、云环境的模型系统付费。梁文锋可把开源模型作入口，将企业级部署、调优、运维、安全、权限管理、知识库接入变成收费服务。

若DeepSeek只停留在模型层，会卷入价格战，模型能力会被追赶，API价格会下降，开发者会在不同模型间切换。真正提高商业化上限的是应用层产品，如agent和CLI。所以，DeepSeek的低价API更像入口，先用价格打穿市场，再用开源建立生态，最后用企业服务、私有化部署、云厂商合作和应用产品承接价值，把“底座”价值最大化。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐