DeepSeek V4 连续降价与Coding Plan 停售:选择适合你的大模型

2026年4月27日 | 版本 v1.0


一、事件回顾

事件A:DeepSeek V4 连续降价

2026年4月24日,DeepSeek 发布新一代模型 V4-Preview,包含 V4-Pro(1.6万亿参数/49B激活)和 V4-Flash(2840亿参数/13B激活)两个版本,均支持1M上下文窗口。定价策略堪称"连环刀":

时间 V4-Pro 输入(百万Tokens) V4-Pro 输出(百万Tokens) 动作
4月24日 ¥12 ¥24 首发定价
4月25日 ¥3 ¥6 限时2.5折
4月26日 ¥0.025(缓存命中) ¥6 全系输入缓存命中降至1/10

V4-Flash 输入缓存命中价低至 ¥0.02/百万Tokens,比 OpenAI 最新模型便宜100多倍。DeepSeek 同时预告:下半年华为昇腾950超节点批量上市后,Pro版价格将进一步大幅下调。

事件B:云 Coding Plan 停售,转向 Token Plan

云百炼 Coding Plan 于2026年2月推出,Lite基础版仅40元/月(首月7.9元),整合通义千问、GLM、Kimi、MiniMax 等8款模型,兼容 OpenClaw、Claude Code 等主流编程工具。然而:

  • 3月20日:Lite 停止新购
  • 4月11日:突然通知4月13日18时起 停止续费和升级,自动续费强制失效
  • 替代产品 Token Plan 团队版:标准版198元/月(2.5万Credits)、高级版698元/月(10万Credits)、尊享版1398元/月(25万Credits)

从40元到198元,最低门槛上涨近5倍。且 Pro 版仍需每天9:30抢购,额度有限。


二、商业逻辑分析

2.1 DeepSeek:以价换量,构建生态护城河

DeepSeek 的降价不是简单的"价格战",而是一套精心设计的生态战略

第一层:用极致低价摧毁闭源模型的定价权。 OpenAI、Anthropic 等闭源厂商长期依赖"性能壁垒"维持高价。V4 以接近闭源旗舰的性能(内部评估优于 Claude Sonnet 4.5,接近 Opus 4.5)配合白菜价,直接瓦解了这一逻辑。

第二层:把降价与国产算力绑定,构建可持续的成本优势。 DeepSeek 在定价说明中明确将未来降价与华为昇腾950超节点的上市节奏挂钩——这在行业里极为罕见。这意味着 DeepSeek 的低价不再依赖算法优化或厂商补贴,而是结构性地绑定在国产算力的规模化部署上。高盛评论称这标志着"AI普惠元年"的到来。

第三层:以开源建立开发者生态。 V4 延续开源策略,同步发布技术报告,适配 Claude Code、OpenClaw、OpenCode 等主流 Agent 工具。低价+开源的组合拳,目的是让开发者习惯并依赖 DeepSeek 的技术栈,形成网络效应。

但风险同样明显: DeepSeek 团队仅约200人,已确认多位核心技术人员离职;计划融资500亿元(融前估值3000亿元),标志着从"技术理想主义"向"商业化压力"的转折。低价开源与商业回报之间存在天然张力。

2.2 云:从"烧钱圈地"到"收割盈利"

云的转向,本质上是中国互联网大厂经典商业路径的再现——先用低价补贴获取用户,再逐步提价实现盈利。

背景逻辑:

  • 2026年1-3月,云 Tokens 调用量3个月内快速增长,AI算力从"训练为主"变成"推理为王"
  • 国内AI算力短缺已成共识,GPU采购成本年涨超50%

可能的意图(个人观点):

  1. 用价格筛掉低价值用户:40元的 Lite 套餐吸引了大量个人开发者和尝鲜用户,但这些人对算力的消耗远大于其付费贡献。砍掉 Lite,转向198元起的团队版,是把稀缺算力留给高付费企业客户。

  2. 从个人开发者转向企业客户:Token Plan 团队版强调"席位管理"、“企业级数据安全”、“多用户隔离”,定位从个人编程工具转向企业AI基础设施。

  3. 多模型统一计费,提升客单价:Credits 积分制看似简化了计费,实际上模糊了不同模型的真实成本,让用户难以横向比价,有利于平台维持较高的综合利润率。

但这一策略的风险在于: 强行停售已承诺续费的服务,损害了用户信任。Coding Plan 上线仅48天就"绝版",这种行为可能推动开发者转向其他平台。


三、对比与评判

维度 DeepSeek V4 降价 云 Coding Plan → Token Plan
战略方向 进攻型:以价换量,扩张生态 防守型:收缩补贴,转向盈利
用户关系 讨好开发者,降低门槛 筛选用户,提高门槛
成本结构 算法优化+国产算力双轮驱动 算力成本压力倒逼
时间窗口 短期亏损换长期生态 财务周期压力(财年收官)
风险 商业化回报不确定 竞品替代
行业影响 重塑定价体系,倒逼全行业降价 跟随涨价潮,腾讯云/百度已跟进

核心判断:

DeepSeek 的降价是进攻性战略投资——它用短期亏损换取开发者生态的锁定,用开源建立技术标准,用国产算力构建长期成本优势。这条路风险高,但一旦成功,护城河极深。

云的转向是防御性财务操作——在算力成本飙升和盈利压力下,它选择了最直接的"提价止损"。这条路短期见效快,但牺牲了用户信任和市场份额。

两者代表了AI大模型商业化的两条岔路:

  • DeepSeek 路线:先做大蛋糕,再分蛋糕。以生态为王,相信"用量即护城河"。
  • 云路线:先确保自己吃饱,再考虑做大。以利润为先,相信"稀缺即定价权"。

四、行业趋势展望

  1. 价格战才刚刚开始。 DeepSeek V4 的降价已经导致 MiniMax 股价腰斩、智谱单日跌9%。国产模型厂商被迫重新计算定价逻辑。

  2. "Coding Plan 模式"将快速分化。 个人版订阅将逐步退出或涨价(云已开先例),企业版/团队版将成为主流。Credits 积分制等"模糊计费"方式会被更多厂商采用。

  3. 国产算力是降价的终极变量。 DeepSeek 把降价与昇腾950绑定,标志着模型价格开始被芯片供给决定。

  4. 用户忠诚度将成为最大变量。 在AI基础设施从"补贴换规模"转向"盈利优先"的过程中,如何平衡商业利益与用户信任,是所有厂商必须面对的考题。


五、当前主流大模型产品与价格全景(2026年4月)

5.1 国际闭源模型

厂商 模型 输入价(百万Tokens) 输出价(百万Tokens) 上下文 特色 支付方式
OpenAI GPT-5.4 $2.50 $10.00 128K 综合旗舰,编码SWE-Bench 86% Visa/Mastercard
OpenAI GPT-5 Codex $2.50 $10.00 128K 编码专精,SWE-Bench 86% Visa/Mastercard
Anthropic Claude Opus 4.6 $15.00 $75.00 1M 旗舰推理,SWE-Bench Verified 80.8% Visa/Mastercard
Anthropic Claude Sonnet 4.6 $3.00 $15.00 1M 性价比首选,编码能力★★★★★ Visa/Mastercard
Anthropic Claude Haiku 4.5 $1.00 $5.00 200K 轻量快速,适合高频调用 Visa/Mastercard
Google Gemini 2.5 Pro $1.25 $10.00 1M 多模态强,免费层最慷慨 Google Cloud
Google Gemini 2.5 Flash $0.30 $2.50 1M 性价比之王,1M上下文 Google Cloud
Google Gemini 2.5 Flash-Lite $0.10 $0.40 1M 最便宜闭源,1M上下文 Google Cloud

5.2 国产开源/闭源模型

厂商 模型 输入价(百万Tokens) 输出价(百万Tokens) 上下文 特色 支付方式
DeepSeek V4-Pro ¥3(缓存¥0.025) ¥6 1M 1.6T参数,开源SOTA,Agent强 支付宝/微信
DeepSeek V4-Flash ¥0.28(缓存¥0.02) ¥0.28 1M 高性价比,13B激活 支付宝/微信
DeepSeek V3.2 ¥0.28(缓存¥0.028) ¥0.42 128K 成熟稳定,广泛适配 支付宝/微信
智谱 GLM-5.1 ¥6(缓存¥1.3) ¥24 200K 开源#1,SWE-Pro 58.4,8h Agent 支付宝/微信
智谱 GLM-4.7 约¥1-2 约¥3-6 128K 上一代旗舰,性价比高 支付宝/微信
月之暗面 Kimi K2.5 ¥1.1 ¥4.32 128K Agent集群,100分身并行 支付宝/微信
MiniMax M2.5 ¥1.1 ¥1.1 200K 10B激活,Agent原生,SWE 80.2% 支付宝/微信
通义千问 Qwen3.5-Plus ¥0.8(缓存更低) ¥1.6-4.0 262K 397B-A17B,企业调用量第一 支付宝/微信
通义千问 Qwen-Flash ¥0.05-0.25 ¥0.4-2.0 1M 极速轻量,1M上下文 支付宝/微信
字节豆包 Doubao-Seed-2.0 极低 极低 128K 国民级,价格地板 支付宝/微信
小米 MiMo-V2-Pro $1-2(分段) $3-6(分段) 1M 1T参数,42B激活,OpenRouter周榜#1 支付宝/微信

5.3 订阅套餐对比

厂商 套餐 月费 核心模型 适合场景 备注
阿里云百炼 Coding Plan Pro ¥200/月 Qwen+GLM+Kimi+MiniMax 多模型编程 每天9:30抢购
阿里云百炼 Token Plan 标准 ¥198/月 8+模型 企业团队 2.5万Credits
阿里云百炼 Token Plan 高级 ¥698/月 8+模型 中型团队 10万Credits
阿里云百炼 Token Plan 尊享 ¥1398/月 8+模型 大型企业 25万Credits
智谱 GLM Coding Plan Lite ¥49/月 GLM-5/GLM-4.7 个人编程 ~80 Prompts/5h
智谱 GLM Coding Plan Pro ¥149/月 GLM-5/GLM-4.7 专业开发 ~400 Prompts/5h
智谱 GLM Coding Plan Max ¥469/月 GLM-5 重度使用 ~1600 Prompts/5h
MiniMax Token Plan Starter ¥29/月 M2.5 个人/轻量 多模态
MiniMax Token Plan Max ¥119/月 M2.5 专业开发 300 Prompts
Kimi Kimi Code ¥39/月起 K2.5 编程 多档位
OpenClaw 免费 免费 任意API 智能体框架 需自备API
Cursor Pro $20/月 GPT-4o/Claude IDE编程 体验最佳
Claude Code Pro $20/月 Sonnet 4.6 终端编程 复杂推理最强
Claude Code Max $100/月 Sonnet 4.6 重度编程 20倍额度

5.4 各模型核心特点总结

🔥 DeepSeek V4 系列

  • 优势:价格屠夫,开源SOTA,1M上下文,Agent能力强,国产算力适配
  • 劣势:Pro版吞吐有限,团队规模小,商业化压力
  • 适合:追求极致性价比、需要长上下文、Agent工作流

🔥 智谱 GLM-5

  • 优势:开源第一梯队,SWE-Pro 58.4(全球第一),8小时自主Agent,科研能力强
  • 劣势:近期涨价30%,Coding Plan 常售罄
  • 适合:科研场景、复杂编码、长程Agent任务

🔥 Kimi K2.5

  • 优势:Agent集群(100分身),长文本专家,海外收入爆发
  • 劣势:价格中等偏上
  • 适合:大规模搜索、多Agent协作、长文本处理

🔥 MiniMax M2.5

  • 优势:10B激活参数极致高效,Agent原生设计,SWE 80.2%,1万美元4个Agent跑一年
  • 劣势:品牌知名度较低
  • 适合:Agent工作流、成本敏感的大规模部署

🔥 Claude 系列(国际)

  • 优势:编码能力最强(SWE-Bench Verified 80.8%),产品化成熟,MCP生态
  • 劣势:价格最高,需外币信用卡
  • 适合:追求极致编码质量、预算充足的团队

🔥 Gemini 系列(国际)

  • 优势:免费层最慷慨,1M上下文,多模态强
  • 劣势:中文能力相对弱
  • 适合:多模态任务、预算极有限、Google生态用户

六、大模型选择与订阅路径指南

6.1 选择决策树

你的主要场景是什么?
├── 个人学习/尝鲜
│   ├── 预算极低 → DeepSeek V4-Flash(¥0.02起)或 Gemini 2.5 Flash-Lite(免费)
│   └── 想体验多模型 → 阿里云百炼免费额度(100万Credits试用)
│
├── 日常编程/开发
│   ├── 国内优先 → DeepSeek V4-Flash(性价比最高)或 MiniMax M2.5(Agent原生)
│   ├── 追求质量 → Claude Sonnet 4.6($3/M输入)或 智谱 GLM-5(开源第一)
│   └── 需要IDE体验 → Cursor Pro($20/月)或 GLM Coding Plan Lite(¥49/月)
│
├── 复杂编码/Agent工作流
│   ├── 预算充足 → Claude Opus 4.6(最强编码)或 GPT-5 Codex
│   ├── 国内部署 → DeepSeek V4-Pro(¥3/M输入)或 Kimi K2.5(Agent集群)
│   └── 成本敏感 → MiniMax M2.5(10B激活,1万美元跑一年)或 DeepSeek V3.2
│
├── 企业级部署
│   ├── 阿里云生态 → Token Plan 团队版(198-1398元/月)
│   ├── 多模型需求 → 阿里云百炼 Coding Plan Pro(¥200/月,8款模型)
│   ├── 数据安全优先 → 通义千问 Qwen3.5-Plus(企业调用量第一)
│   └── 混合架构 → 80%国产模型 + 20% Claude(欧洲工作室实践方案)
│
└── 长文本/大上下文
    ├── 1M上下文 → DeepSeek V4-Pro/Flash、Gemini 2.5 Pro、Qwen-Flash
    ├── 需要推理 → DeepSeek V4-Pro(开源SOTA)
    └── 需要速度 → Qwen-Flash 或 Gemini 2.5 Flash

6.2 推荐订阅路径

路径A:极致性价比(月预算 < ¥100)

主力模型:DeepSeek V4-Flash(¥0.28/M输入,缓存命中¥0.02)
辅助模型:Gemini 2.5 Flash-Lite(免费层)
编程工具:Cursor Free 或 Trae(字节跳动,完全免费)
智能体:OpenClaw + DeepSeek V4-Flash API
月成本:¥0-50

路径B:个人开发者主力(月预算 ¥100-300)

主力模型:DeepSeek V4-Flash(扛量)+ DeepSeek V4-Pro(关键任务)
辅助模型:MiniMax M2.5(Agent场景)或 Kimi K2.5(长文本)
编程工具:Cursor Pro($20/月)或 GLM Coding Plan Lite(¥49/月)
智能体:OpenClaw + 多模型切换
月成本:¥100-300

路径C:小团队(月预算 ¥500-2000)

主力模型:80% DeepSeek V4 系列 + 20% Claude Sonnet 4.6(复杂推理)
辅助模型:智谱 GLM-5(科研/编码)+ Kimi K2.5(长文本)
编程工具:Cursor Pro + Claude Code Pro
智能体:OpenClaw + 多模型Agent
聚合平台:阿里云百炼(多模型统一API)
月成本:¥500-2000

路径D:企业级部署(月预算 ¥2000+)

主力模型:通义千问 Qwen3.5-Plus
辅助模型:DeepSeek V4-Pro(性价比)+ Claude Opus 4.6(关键任务)
编程工具:Cursor Business + GitHub Copilot Business
智能体:OpenClaw 企业部署 + 阿里云百炼 Token Plan 团队版
管理:席位管理 + 用量统计 + 权限管控
月成本:¥2000-10000+

6.3 关键建议

  1. 不要把所有Token押在一个模型上

    • 利用 OpenRouter 或阿里云百炼的多模型切换能力
  2. 缓存命中是最大成本杠杆

    • DeepSeek V4 缓存命中价是未命中价的 1/100
    • 合理设计 prompt 复用前缀,可大幅降低成本
  3. 国产模型已覆盖90%场景

    • OpenRouter 数据显示中国模型调用量占全球前五中的四席
    • MiniMax M2.5、Kimi K2.5、GLM-5 在编程和Agent场景已达旗舰级水平
  4. 关注降价窗口期

    • DeepSeek V4 Pro 预计下半年随昇腾950上市进一步降价
    • 阿里云 Coding Plan Lite 停售后,竞品可能跟进降价争夺用户
  5. Agent 场景优先选国产模型

    • Agent 工作流 Token 消耗是传统对话的 10-100 倍
    • MiniMax M2.5(10B激活)和 DeepSeek V4-Flash(13B激活)是 Agent 场景的性价比最优解
  6. 企业部署考虑混合架构

    • 日常任务用国产开源模型(成本低、中文好、部署灵活)
    • 关键任务用闭源旗舰(Claude Opus / GPT-5 Codex)
    • 通过阿里云百炼或自建聚合层统一管理

七、结语

2026年的AI大模型市场,正在经历从"技术竞赛"到"商业验证"的拐点。DeepSeek 用 V4 的连环降价证明:开源+低价+国产算力可以构成一条可持续的进攻路线。

两条岔路,没有绝对的对错。但对于开发者和企业用户而言,AI算力的"免费午餐"时代正在终结,但"白菜价"的窗口期可能比想象中更长——前提是你能在价格彻底回归理性之前,锁定最适合自己的技术栈。

核心原则:没有最好的模型,只有最适合的场景。混合架构 + 多模型切换 + 缓存优化 = 最优成本方案。


Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐