DeepSeek二连降价创全球大模型价格新低,或带动国产AI芯片销量
芯片只是第一层,真正决定国产算力能否吃下需求的是软件生态,模型能否稳定跑在昇腾上,推理框架能否适配,算子有无优化,开发者迁移成本高低,才决定这条路是“能演示”还是“能商业化”。大模型推理消耗算力、电力、带宽和运维,价格越低、调用量越大,对基础设施压力越大。月之暗面和MiniMax量大便宜,DeepSeek降价让它们有些难堪,但月之暗面的K 2.6以及MiniMax即将发布的M3模型,性能高于Dee

【DeepSeek二连降价,创全球大模型价格新低】
梁文锋又出手了,而且还是二连降价。4月25日,DeepSeek - V4 - Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。业内还没反应过来,4月26日晚间,DeepSeek再次降价,全系API输入缓存命中价格直接降至首发价的1/10。叠加限时折扣后,V4 - Pro的缓存输入低至0.025元/百万tokens,V4 - Flash降至0.02元/百万tokens,创下全球大模型价格新低。
这意味着什么呢?上海译文出版的《挪威的森林》,全书约20万字,将整本书命中缓存后喂给DeepSeek - V4 - Pro,总成本不到1分钱。DeepSeek这次降的不只是token的单价,还把“长文本、长代码、长知识库”等原本最烧钱的AI应用场景,打入了价格谷底。
【摸着DeepSeek过河,降价影响几何】
DeepSeek两天两降,并非简单的价格战。先用限时折扣测试市场承受力和服务器负载,紧接着对缓存命中这一高频场景实施永久性降价。对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景,成本可直接下降90%以上。DeepSeek研究员陈德里在社交媒体上确认,输入缓存降价是永久性的,并打上了“AGI for Everyone”的标签。
虽然国内AI公司几乎都摸着DeepSeek过河,但DeepSeek降价后,并非所有人都担心。大厂不在乎,因为大厂卖API本质是卖背后的一整套服务,大模型API只是引流,真正赚钱的是背后的计算、存储、数据库等云服务。以阿里云为例,4月15日算力卡涨5% - 34%、存储涨30%,却愿意代理DeepSeek,因为即便客户使用DeepSeek,也离不开阿里云的算力和存储。
真正难受的是智谱、MiniMax和月之暗面这样的中间层。智谱AI在4个月里连续三次涨价,累计涨幅83%,调价后,GLM系列编程场景缓存命中Token单价已接近Claude Sonnet 4.6的水平。智谱CEO张鹏称“瓶颈在算力,不在客户”,智谱公开的商业逻辑公式为:AGI商业价值 = 智能上限×Token消耗规模。对于智谱这个上市公司,算力是稀缺资源,其API年化收入(ARR)在过去12个月暴涨60倍至17亿元,Token调用量在价格上涨83%的背景下仍增长400%。
月之暗面和MiniMax量大便宜,DeepSeek降价让它们有些难堪,但月之暗面的K 2.6以及MiniMax即将发布的M3模型,性能高于DeepSeek - V4 - Pro,它们在客户群体上可能与DeepSeek有交集,但难形成全面冲突。
促使DeepSeek降价的原因或许来自融资,此前DeepSeek传出100亿美元估值,随着阿里、腾讯入局,估值拉高至200亿美元。估值拉高后融资金额增多,梁文锋需用市场、收入证明DeepSeek达到估值高度,所以即便赔本赚吆喝也不意外。对于上市公司,API是核心收入,压低API价格等于降低毛利。并且,若承认“要降价才能竞争”,就等于承认“没有技术护城河”;坚持高价,则需拿出有说服力的差异化价值。
DeepSeek降价本质是找到对应客户,梁文锋不需要DeepSeek有最强性能。模型性能和使用体验有鸿沟,只要开发者和企业知道“有便宜选择”,行业定价体系就会重构,就像当年小米手机冲击智能手机市场,改变了人们对“合理价格”的预期。梁文锋意识到AI是基础设施,价格战难免,最终AI会像云计算一样走向“规模经济 + 薄利多销”,成本结构优、技术迭代快、能更早实现规模效应的企业才能活到最后。
【DeepSeek适配昇腾,带动国产AI芯片替代】
更关键的是,DeepSeek已适配华为昇腾生态。DeepSeek官方透露,Pro版本服务吞吐受限于高端算力,预计下半年昇腾950超节点批量上市后,Pro价格将大幅下调,此次价格下降只是预告。
昇腾950超节点通过集群方案弥补单卡制程差距。单颗昇腾910C芯片的BF16性能仅为英伟达Blackwell单芯片的约三分之一,但通过超节点集群方式,单个CloudMatrix 384集群的BF16总性能反而是NVL72的1.7倍,总内存容量为后者3.6倍,总内存带宽为后者2.1倍。
考虑硬件成本,事情更有意思。华为昇腾950PR定价约7万元人民币,英伟达同级别H200约合人民币25万元。按FP8精度算,昇腾950PR是7万元/PFLOPS,英伟达H200是6.31万元/PFLOPS;按推理专用的FP4精度算,昇腾950PR是4.49万元/PFLOPS,英伟达B200是4.44万元/PFLOPS。
DeepSeek降价砍在缓存命中价格上,该场景不依赖“单卡训练峰值”,更适合通过国产芯片集群、工程优化和规模化调度摊薄成本。以100卡集群为例,英伟达H20方案裸卡成本1000万,13台服务器主机286万,加上机柜等,总价约不到1500万元;同规模华为昇腾950PR方案约1000万出头。昇腾950PR单卡功耗比H20高,但单位算力功耗低65%,相同算力下对电力和制冷需求大幅降低,基建投入显著减少,且1张昇腾950PR推理吞吐量约等于2.2 - 2.8张H20,昇腾方案可能比英伟达H20方案节省60%到70%。
大模型API价格很大程度取决于硬件成本,DeepSeek打折可能带动国产AI芯片销量。连DeepSeek都大规模使用国产芯片,产业链将被激活,云厂商会增加采购,芯片厂商会加大研发投入,开发者会适配国产生态。华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌在DeepSeek - V4发布当天就完成了适配,发布当天AI算力芯片板块股价大涨,海光信息、寒武纪、天数智芯等涨幅明显。
当然,这并不意味着国产算力已全面替代英伟达,训练侧仍更依赖高端GPU、成熟软件栈和大规模集群经验。DeepSeek真正走通的路径,可能是先在推理侧、缓存场景、长文本应用里,释放国产算力的性价比优势。芯片只是第一层,真正决定国产算力能否吃下需求的是软件生态,模型能否稳定跑在昇腾上,推理框架能否适配,算子有无优化,开发者迁移成本高低,才决定这条路是“能演示”还是“能商业化”。DeepSeek的价值在于,它是头部模型亲自把流量和需求带进国产算力生态。
【梁文锋为DeepSeek寻找商业模式】
梁文锋真正的杀招不在于“便宜”,而在于“定价”。他用DeepSeek的影响力,让市场形成新认知:“如果DeepSeek这个级别的模型已能做到这个价,别家为何还要卖这么贵?”一旦锚点形成,其他厂商就陷入两难,跟价利润空间被压缩,不跟则需向客户解释“贵在哪里”。
梁文锋曾在2024年表示,按自己步调做事,核算成本定价,原则是不贴钱、不赚暴利,价格在成本之上稍有利润。降价一方面是探索下一代模型结构时成本下降,另一方面认为API和AI应普惠、人人可用。他认为让AI普惠才能激发应用市场,应用市场足够大,技术迭代飞轮才能真正转起来。
便宜可打开市场,但不是商业模式。DeepSeek不能靠超低API价格生存,API价格低短期内可制造影响力、吸引客户,但难成长期公司全部收入来源。大模型推理消耗算力、电力、带宽和运维,价格越低、调用量越大,对基础设施压力越大。低价是入口,不应是终点。
DeepSeek目标是成为中国AI开发者的“默认底座”。只要足够多应用和agent以DeepSeek为基座模型开发,DeepSeek就掌握入口。API收入只是第一层,模型标准、开发者生态、企业部署、算力适配、云厂商合作,才是梁文锋想要的商业化空间。
DeepSeek更大的商业化机会可能在企业私有化部署。对于金融、政务、制造、能源等行业,数据安全可控是核心问题,它们未必长期使用公共API,但愿意为能部署在自己机房、云环境的模型系统付费。梁文锋可把开源模型作入口,将企业级部署、调优、运维、安全、权限管理、知识库接入变成收费服务。
若DeepSeek只停留在模型层,会卷入价格战,模型能力会被追赶,API价格会下降,开发者会在不同模型间切换。真正提高商业化上限的是应用层产品,如agent和CLI。所以,DeepSeek的低价API更像入口,先用价格打穿市场,再用开源建立生态,最后用企业服务、私有化部署、云厂商合作和应用产品承接价值,把“底座”价值最大化。
更多推荐



所有评论(0)