DeepSeek V4 连续降价与Coding Plan 停售:选择适合你的大模型
🔥 DeepSeek V4 系列优势:价格屠夫,开源SOTA,1M上下文,Agent能力强,国产算力适配劣势:Pro版吞吐有限,团队规模小,商业化压力适合:追求极致性价比、需要长上下文、Agent工作流🔥 智谱 GLM-5优势:开源第一梯队,SWE-Pro 58.4(全球第一),8小时自主Agent,科研能力强劣势:近期涨价30%,Coding Plan 常售罄适合:科研场景、复杂编码、长程A
DeepSeek V4 连续降价与Coding Plan 停售:选择适合你的大模型
2026年4月27日 | 版本 v1.0
一、事件回顾
事件A:DeepSeek V4 连续降价
2026年4月24日,DeepSeek 发布新一代模型 V4-Preview,包含 V4-Pro(1.6万亿参数/49B激活)和 V4-Flash(2840亿参数/13B激活)两个版本,均支持1M上下文窗口。定价策略堪称"连环刀":
| 时间 | V4-Pro 输入(百万Tokens) | V4-Pro 输出(百万Tokens) | 动作 |
|---|---|---|---|
| 4月24日 | ¥12 | ¥24 | 首发定价 |
| 4月25日 | ¥3 | ¥6 | 限时2.5折 |
| 4月26日 | ¥0.025(缓存命中) | ¥6 | 全系输入缓存命中降至1/10 |
V4-Flash 输入缓存命中价低至 ¥0.02/百万Tokens,比 OpenAI 最新模型便宜100多倍。DeepSeek 同时预告:下半年华为昇腾950超节点批量上市后,Pro版价格将进一步大幅下调。
事件B:云 Coding Plan 停售,转向 Token Plan
云百炼 Coding Plan 于2026年2月推出,Lite基础版仅40元/月(首月7.9元),整合通义千问、GLM、Kimi、MiniMax 等8款模型,兼容 OpenClaw、Claude Code 等主流编程工具。然而:
- 3月20日:Lite 停止新购
- 4月11日:突然通知4月13日18时起 停止续费和升级,自动续费强制失效
- 替代产品 Token Plan 团队版:标准版198元/月(2.5万Credits)、高级版698元/月(10万Credits)、尊享版1398元/月(25万Credits)
从40元到198元,最低门槛上涨近5倍。且 Pro 版仍需每天9:30抢购,额度有限。
二、商业逻辑分析
2.1 DeepSeek:以价换量,构建生态护城河
DeepSeek 的降价不是简单的"价格战",而是一套精心设计的生态战略:
第一层:用极致低价摧毁闭源模型的定价权。 OpenAI、Anthropic 等闭源厂商长期依赖"性能壁垒"维持高价。V4 以接近闭源旗舰的性能(内部评估优于 Claude Sonnet 4.5,接近 Opus 4.5)配合白菜价,直接瓦解了这一逻辑。
第二层:把降价与国产算力绑定,构建可持续的成本优势。 DeepSeek 在定价说明中明确将未来降价与华为昇腾950超节点的上市节奏挂钩——这在行业里极为罕见。这意味着 DeepSeek 的低价不再依赖算法优化或厂商补贴,而是结构性地绑定在国产算力的规模化部署上。高盛评论称这标志着"AI普惠元年"的到来。
第三层:以开源建立开发者生态。 V4 延续开源策略,同步发布技术报告,适配 Claude Code、OpenClaw、OpenCode 等主流 Agent 工具。低价+开源的组合拳,目的是让开发者习惯并依赖 DeepSeek 的技术栈,形成网络效应。
但风险同样明显: DeepSeek 团队仅约200人,已确认多位核心技术人员离职;计划融资500亿元(融前估值3000亿元),标志着从"技术理想主义"向"商业化压力"的转折。低价开源与商业回报之间存在天然张力。
2.2 云:从"烧钱圈地"到"收割盈利"
云的转向,本质上是中国互联网大厂经典商业路径的再现——先用低价补贴获取用户,再逐步提价实现盈利。
背景逻辑:
- 2026年1-3月,云 Tokens 调用量3个月内快速增长,AI算力从"训练为主"变成"推理为王"
- 国内AI算力短缺已成共识,GPU采购成本年涨超50%
可能的意图(个人观点):
-
用价格筛掉低价值用户:40元的 Lite 套餐吸引了大量个人开发者和尝鲜用户,但这些人对算力的消耗远大于其付费贡献。砍掉 Lite,转向198元起的团队版,是把稀缺算力留给高付费企业客户。
-
从个人开发者转向企业客户:Token Plan 团队版强调"席位管理"、“企业级数据安全”、“多用户隔离”,定位从个人编程工具转向企业AI基础设施。
-
多模型统一计费,提升客单价:Credits 积分制看似简化了计费,实际上模糊了不同模型的真实成本,让用户难以横向比价,有利于平台维持较高的综合利润率。
但这一策略的风险在于: 强行停售已承诺续费的服务,损害了用户信任。Coding Plan 上线仅48天就"绝版",这种行为可能推动开发者转向其他平台。
三、对比与评判
| 维度 | DeepSeek V4 降价 | 云 Coding Plan → Token Plan |
|---|---|---|
| 战略方向 | 进攻型:以价换量,扩张生态 | 防守型:收缩补贴,转向盈利 |
| 用户关系 | 讨好开发者,降低门槛 | 筛选用户,提高门槛 |
| 成本结构 | 算法优化+国产算力双轮驱动 | 算力成本压力倒逼 |
| 时间窗口 | 短期亏损换长期生态 | 财务周期压力(财年收官) |
| 风险 | 商业化回报不确定 | 竞品替代 |
| 行业影响 | 重塑定价体系,倒逼全行业降价 | 跟随涨价潮,腾讯云/百度已跟进 |
核心判断:
DeepSeek 的降价是进攻性战略投资——它用短期亏损换取开发者生态的锁定,用开源建立技术标准,用国产算力构建长期成本优势。这条路风险高,但一旦成功,护城河极深。
云的转向是防御性财务操作——在算力成本飙升和盈利压力下,它选择了最直接的"提价止损"。这条路短期见效快,但牺牲了用户信任和市场份额。
两者代表了AI大模型商业化的两条岔路:
- DeepSeek 路线:先做大蛋糕,再分蛋糕。以生态为王,相信"用量即护城河"。
- 云路线:先确保自己吃饱,再考虑做大。以利润为先,相信"稀缺即定价权"。
四、行业趋势展望
-
价格战才刚刚开始。 DeepSeek V4 的降价已经导致 MiniMax 股价腰斩、智谱单日跌9%。国产模型厂商被迫重新计算定价逻辑。
-
"Coding Plan 模式"将快速分化。 个人版订阅将逐步退出或涨价(云已开先例),企业版/团队版将成为主流。Credits 积分制等"模糊计费"方式会被更多厂商采用。
-
国产算力是降价的终极变量。 DeepSeek 把降价与昇腾950绑定,标志着模型价格开始被芯片供给决定。
-
用户忠诚度将成为最大变量。 在AI基础设施从"补贴换规模"转向"盈利优先"的过程中,如何平衡商业利益与用户信任,是所有厂商必须面对的考题。
五、当前主流大模型产品与价格全景(2026年4月)
5.1 国际闭源模型
| 厂商 | 模型 | 输入价(百万Tokens) | 输出价(百万Tokens) | 上下文 | 特色 | 支付方式 |
|---|---|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $10.00 | 128K | 综合旗舰,编码SWE-Bench 86% | Visa/Mastercard |
| OpenAI | GPT-5 Codex | $2.50 | $10.00 | 128K | 编码专精,SWE-Bench 86% | Visa/Mastercard |
| Anthropic | Claude Opus 4.6 | $15.00 | $75.00 | 1M | 旗舰推理,SWE-Bench Verified 80.8% | Visa/Mastercard |
| Anthropic | Claude Sonnet 4.6 | $3.00 | $15.00 | 1M | 性价比首选,编码能力★★★★★ | Visa/Mastercard |
| Anthropic | Claude Haiku 4.5 | $1.00 | $5.00 | 200K | 轻量快速,适合高频调用 | Visa/Mastercard |
| Gemini 2.5 Pro | $1.25 | $10.00 | 1M | 多模态强,免费层最慷慨 | Google Cloud | |
| Gemini 2.5 Flash | $0.30 | $2.50 | 1M | 性价比之王,1M上下文 | Google Cloud | |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1M | 最便宜闭源,1M上下文 | Google Cloud |
5.2 国产开源/闭源模型
| 厂商 | 模型 | 输入价(百万Tokens) | 输出价(百万Tokens) | 上下文 | 特色 | 支付方式 |
|---|---|---|---|---|---|---|
| DeepSeek | V4-Pro | ¥3(缓存¥0.025) | ¥6 | 1M | 1.6T参数,开源SOTA,Agent强 | 支付宝/微信 |
| DeepSeek | V4-Flash | ¥0.28(缓存¥0.02) | ¥0.28 | 1M | 高性价比,13B激活 | 支付宝/微信 |
| DeepSeek | V3.2 | ¥0.28(缓存¥0.028) | ¥0.42 | 128K | 成熟稳定,广泛适配 | 支付宝/微信 |
| 智谱 | GLM-5.1 | ¥6(缓存¥1.3) | ¥24 | 200K | 开源#1,SWE-Pro 58.4,8h Agent | 支付宝/微信 |
| 智谱 | GLM-4.7 | 约¥1-2 | 约¥3-6 | 128K | 上一代旗舰,性价比高 | 支付宝/微信 |
| 月之暗面 | Kimi K2.5 | ¥1.1 | ¥4.32 | 128K | Agent集群,100分身并行 | 支付宝/微信 |
| MiniMax | M2.5 | ¥1.1 | ¥1.1 | 200K | 10B激活,Agent原生,SWE 80.2% | 支付宝/微信 |
| 通义千问 | Qwen3.5-Plus | ¥0.8(缓存更低) | ¥1.6-4.0 | 262K | 397B-A17B,企业调用量第一 | 支付宝/微信 |
| 通义千问 | Qwen-Flash | ¥0.05-0.25 | ¥0.4-2.0 | 1M | 极速轻量,1M上下文 | 支付宝/微信 |
| 字节豆包 | Doubao-Seed-2.0 | 极低 | 极低 | 128K | 国民级,价格地板 | 支付宝/微信 |
| 小米 | MiMo-V2-Pro | $1-2(分段) | $3-6(分段) | 1M | 1T参数,42B激活,OpenRouter周榜#1 | 支付宝/微信 |
5.3 订阅套餐对比
| 厂商 | 套餐 | 月费 | 核心模型 | 适合场景 | 备注 |
|---|---|---|---|---|---|
| 阿里云百炼 | Coding Plan Pro | ¥200/月 | Qwen+GLM+Kimi+MiniMax | 多模型编程 | 每天9:30抢购 |
| 阿里云百炼 | Token Plan 标准 | ¥198/月 | 8+模型 | 企业团队 | 2.5万Credits |
| 阿里云百炼 | Token Plan 高级 | ¥698/月 | 8+模型 | 中型团队 | 10万Credits |
| 阿里云百炼 | Token Plan 尊享 | ¥1398/月 | 8+模型 | 大型企业 | 25万Credits |
| 智谱 | GLM Coding Plan Lite | ¥49/月 | GLM-5/GLM-4.7 | 个人编程 | ~80 Prompts/5h |
| 智谱 | GLM Coding Plan Pro | ¥149/月 | GLM-5/GLM-4.7 | 专业开发 | ~400 Prompts/5h |
| 智谱 | GLM Coding Plan Max | ¥469/月 | GLM-5 | 重度使用 | ~1600 Prompts/5h |
| MiniMax | Token Plan Starter | ¥29/月 | M2.5 | 个人/轻量 | 多模态 |
| MiniMax | Token Plan Max | ¥119/月 | M2.5 | 专业开发 | 300 Prompts |
| Kimi | Kimi Code | ¥39/月起 | K2.5 | 编程 | 多档位 |
| OpenClaw | 免费 | 免费 | 任意API | 智能体框架 | 需自备API |
| Cursor | Pro | $20/月 | GPT-4o/Claude | IDE编程 | 体验最佳 |
| Claude Code | Pro | $20/月 | Sonnet 4.6 | 终端编程 | 复杂推理最强 |
| Claude Code | Max | $100/月 | Sonnet 4.6 | 重度编程 | 20倍额度 |
5.4 各模型核心特点总结
🔥 DeepSeek V4 系列
- 优势:价格屠夫,开源SOTA,1M上下文,Agent能力强,国产算力适配
- 劣势:Pro版吞吐有限,团队规模小,商业化压力
- 适合:追求极致性价比、需要长上下文、Agent工作流
🔥 智谱 GLM-5
- 优势:开源第一梯队,SWE-Pro 58.4(全球第一),8小时自主Agent,科研能力强
- 劣势:近期涨价30%,Coding Plan 常售罄
- 适合:科研场景、复杂编码、长程Agent任务
🔥 Kimi K2.5
- 优势:Agent集群(100分身),长文本专家,海外收入爆发
- 劣势:价格中等偏上
- 适合:大规模搜索、多Agent协作、长文本处理
🔥 MiniMax M2.5
- 优势:10B激活参数极致高效,Agent原生设计,SWE 80.2%,1万美元4个Agent跑一年
- 劣势:品牌知名度较低
- 适合:Agent工作流、成本敏感的大规模部署
🔥 Claude 系列(国际)
- 优势:编码能力最强(SWE-Bench Verified 80.8%),产品化成熟,MCP生态
- 劣势:价格最高,需外币信用卡
- 适合:追求极致编码质量、预算充足的团队
🔥 Gemini 系列(国际)
- 优势:免费层最慷慨,1M上下文,多模态强
- 劣势:中文能力相对弱
- 适合:多模态任务、预算极有限、Google生态用户
六、大模型选择与订阅路径指南
6.1 选择决策树
你的主要场景是什么?
├── 个人学习/尝鲜
│ ├── 预算极低 → DeepSeek V4-Flash(¥0.02起)或 Gemini 2.5 Flash-Lite(免费)
│ └── 想体验多模型 → 阿里云百炼免费额度(100万Credits试用)
│
├── 日常编程/开发
│ ├── 国内优先 → DeepSeek V4-Flash(性价比最高)或 MiniMax M2.5(Agent原生)
│ ├── 追求质量 → Claude Sonnet 4.6($3/M输入)或 智谱 GLM-5(开源第一)
│ └── 需要IDE体验 → Cursor Pro($20/月)或 GLM Coding Plan Lite(¥49/月)
│
├── 复杂编码/Agent工作流
│ ├── 预算充足 → Claude Opus 4.6(最强编码)或 GPT-5 Codex
│ ├── 国内部署 → DeepSeek V4-Pro(¥3/M输入)或 Kimi K2.5(Agent集群)
│ └── 成本敏感 → MiniMax M2.5(10B激活,1万美元跑一年)或 DeepSeek V3.2
│
├── 企业级部署
│ ├── 阿里云生态 → Token Plan 团队版(198-1398元/月)
│ ├── 多模型需求 → 阿里云百炼 Coding Plan Pro(¥200/月,8款模型)
│ ├── 数据安全优先 → 通义千问 Qwen3.5-Plus(企业调用量第一)
│ └── 混合架构 → 80%国产模型 + 20% Claude(欧洲工作室实践方案)
│
└── 长文本/大上下文
├── 1M上下文 → DeepSeek V4-Pro/Flash、Gemini 2.5 Pro、Qwen-Flash
├── 需要推理 → DeepSeek V4-Pro(开源SOTA)
└── 需要速度 → Qwen-Flash 或 Gemini 2.5 Flash
6.2 推荐订阅路径
路径A:极致性价比(月预算 < ¥100)
主力模型:DeepSeek V4-Flash(¥0.28/M输入,缓存命中¥0.02)
辅助模型:Gemini 2.5 Flash-Lite(免费层)
编程工具:Cursor Free 或 Trae(字节跳动,完全免费)
智能体:OpenClaw + DeepSeek V4-Flash API
月成本:¥0-50
路径B:个人开发者主力(月预算 ¥100-300)
主力模型:DeepSeek V4-Flash(扛量)+ DeepSeek V4-Pro(关键任务)
辅助模型:MiniMax M2.5(Agent场景)或 Kimi K2.5(长文本)
编程工具:Cursor Pro($20/月)或 GLM Coding Plan Lite(¥49/月)
智能体:OpenClaw + 多模型切换
月成本:¥100-300
路径C:小团队(月预算 ¥500-2000)
主力模型:80% DeepSeek V4 系列 + 20% Claude Sonnet 4.6(复杂推理)
辅助模型:智谱 GLM-5(科研/编码)+ Kimi K2.5(长文本)
编程工具:Cursor Pro + Claude Code Pro
智能体:OpenClaw + 多模型Agent
聚合平台:阿里云百炼(多模型统一API)
月成本:¥500-2000
路径D:企业级部署(月预算 ¥2000+)
主力模型:通义千问 Qwen3.5-Plus
辅助模型:DeepSeek V4-Pro(性价比)+ Claude Opus 4.6(关键任务)
编程工具:Cursor Business + GitHub Copilot Business
智能体:OpenClaw 企业部署 + 阿里云百炼 Token Plan 团队版
管理:席位管理 + 用量统计 + 权限管控
月成本:¥2000-10000+
6.3 关键建议
-
不要把所有Token押在一个模型上
- 利用 OpenRouter 或阿里云百炼的多模型切换能力
-
缓存命中是最大成本杠杆
- DeepSeek V4 缓存命中价是未命中价的 1/100
- 合理设计 prompt 复用前缀,可大幅降低成本
-
国产模型已覆盖90%场景
- OpenRouter 数据显示中国模型调用量占全球前五中的四席
- MiniMax M2.5、Kimi K2.5、GLM-5 在编程和Agent场景已达旗舰级水平
-
关注降价窗口期
- DeepSeek V4 Pro 预计下半年随昇腾950上市进一步降价
- 阿里云 Coding Plan Lite 停售后,竞品可能跟进降价争夺用户
-
Agent 场景优先选国产模型
- Agent 工作流 Token 消耗是传统对话的 10-100 倍
- MiniMax M2.5(10B激活)和 DeepSeek V4-Flash(13B激活)是 Agent 场景的性价比最优解
-
企业部署考虑混合架构
- 日常任务用国产开源模型(成本低、中文好、部署灵活)
- 关键任务用闭源旗舰(Claude Opus / GPT-5 Codex)
- 通过阿里云百炼或自建聚合层统一管理
七、结语
2026年的AI大模型市场,正在经历从"技术竞赛"到"商业验证"的拐点。DeepSeek 用 V4 的连环降价证明:开源+低价+国产算力可以构成一条可持续的进攻路线。
两条岔路,没有绝对的对错。但对于开发者和企业用户而言,AI算力的"免费午餐"时代正在终结,但"白菜价"的窗口期可能比想象中更长——前提是你能在价格彻底回归理性之前,锁定最适合自己的技术栈。
核心原则:没有最好的模型,只有最适合的场景。混合架构 + 多模型切换 + 缓存优化 = 最优成本方案。
更多推荐



所有评论(0)