DeepSeek V4 连续降价与Coding Plan 停售：选择适合你的大模型

🔥 DeepSeek V4 系列优势：价格屠夫，开源SOTA，1M上下文，Agent能力强，国产算力适配劣势：Pro版吞吐有限，团队规模小，商业化压力适合：追求极致性价比、需要长上下文、Agent工作流🔥 智谱 GLM-5优势：开源第一梯队，SWE-Pro 58.4（全球第一），8小时自主Agent，科研能力强劣势：近期涨价30%，Coding Plan 常售罄适合：科研场景、复杂编码、长程A

weixin_45880675

4084人浏览 · 2026-04-27 19:31:53

weixin_45880675 · 2026-04-27 19:31:53 发布

DeepSeek V4 连续降价与Coding Plan 停售：选择适合你的大模型

2026年4月27日 | 版本 v1.0

一、事件回顾

事件A：DeepSeek V4 连续降价

2026年4月24日，DeepSeek 发布新一代模型 V4-Preview，包含 V4-Pro（1.6万亿参数/49B激活）和 V4-Flash（2840亿参数/13B激活）两个版本，均支持1M上下文窗口。定价策略堪称"连环刀"：

时间	V4-Pro 输入（百万Tokens）	V4-Pro 输出（百万Tokens）	动作
4月24日	¥12	¥24	首发定价
4月25日	¥3	¥6	限时2.5折
4月26日	¥0.025（缓存命中）	¥6	全系输入缓存命中降至1/10

V4-Flash 输入缓存命中价低至 ¥0.02/百万Tokens，比 OpenAI 最新模型便宜100多倍。DeepSeek 同时预告：下半年华为昇腾950超节点批量上市后，Pro版价格将进一步大幅下调。

事件B：云 Coding Plan 停售，转向 Token Plan

云百炼 Coding Plan 于2026年2月推出，Lite基础版仅40元/月（首月7.9元），整合通义千问、GLM、Kimi、MiniMax 等8款模型，兼容 OpenClaw、Claude Code 等主流编程工具。然而：

3月20日：Lite 停止新购
4月11日：突然通知4月13日18时起 停止续费和升级，自动续费强制失效
替代产品 Token Plan 团队版：标准版198元/月（2.5万Credits）、高级版698元/月（10万Credits）、尊享版1398元/月（25万Credits）

从40元到198元，最低门槛上涨近5倍。且 Pro 版仍需每天9:30抢购，额度有限。

二、商业逻辑分析

2.1 DeepSeek：以价换量，构建生态护城河

DeepSeek 的降价不是简单的"价格战"，而是一套精心设计的生态战略：

第一层：用极致低价摧毁闭源模型的定价权。 OpenAI、Anthropic 等闭源厂商长期依赖"性能壁垒"维持高价。V4 以接近闭源旗舰的性能（内部评估优于 Claude Sonnet 4.5，接近 Opus 4.5）配合白菜价，直接瓦解了这一逻辑。

第二层：把降价与国产算力绑定，构建可持续的成本优势。 DeepSeek 在定价说明中明确将未来降价与华为昇腾950超节点的上市节奏挂钩——这在行业里极为罕见。这意味着 DeepSeek 的低价不再依赖算法优化或厂商补贴，而是结构性地绑定在国产算力的规模化部署上。高盛评论称这标志着"AI普惠元年"的到来。

第三层：以开源建立开发者生态。 V4 延续开源策略，同步发布技术报告，适配 Claude Code、OpenClaw、OpenCode 等主流 Agent 工具。低价+开源的组合拳，目的是让开发者习惯并依赖 DeepSeek 的技术栈，形成网络效应。

但风险同样明显： DeepSeek 团队仅约200人，已确认多位核心技术人员离职；计划融资500亿元（融前估值3000亿元），标志着从"技术理想主义"向"商业化压力"的转折。低价开源与商业回报之间存在天然张力。

2.2 云：从"烧钱圈地"到"收割盈利"

云的转向，本质上是中国互联网大厂经典商业路径的再现——先用低价补贴获取用户，再逐步提价实现盈利。

背景逻辑：

2026年1-3月，云 Tokens 调用量3个月内快速增长，AI算力从"训练为主"变成"推理为王"
国内AI算力短缺已成共识，GPU采购成本年涨超50%

可能的意图（个人观点）：

用价格筛掉低价值用户：40元的 Lite 套餐吸引了大量个人开发者和尝鲜用户，但这些人对算力的消耗远大于其付费贡献。砍掉 Lite，转向198元起的团队版，是把稀缺算力留给高付费企业客户。
从个人开发者转向企业客户：Token Plan 团队版强调"席位管理"、“企业级数据安全”、“多用户隔离”，定位从个人编程工具转向企业AI基础设施。
多模型统一计费，提升客单价：Credits 积分制看似简化了计费，实际上模糊了不同模型的真实成本，让用户难以横向比价，有利于平台维持较高的综合利润率。

但这一策略的风险在于： 强行停售已承诺续费的服务，损害了用户信任。Coding Plan 上线仅48天就"绝版"，这种行为可能推动开发者转向其他平台。

三、对比与评判

维度	DeepSeek V4 降价	云 Coding Plan → Token Plan
战略方向	进攻型：以价换量，扩张生态	防守型：收缩补贴，转向盈利
用户关系	讨好开发者，降低门槛	筛选用户，提高门槛
成本结构	算法优化+国产算力双轮驱动	算力成本压力倒逼
时间窗口	短期亏损换长期生态	财务周期压力（财年收官）
风险	商业化回报不确定	竞品替代
行业影响	重塑定价体系，倒逼全行业降价	跟随涨价潮，腾讯云/百度已跟进

核心判断：

DeepSeek 的降价是进攻性战略投资——它用短期亏损换取开发者生态的锁定，用开源建立技术标准，用国产算力构建长期成本优势。这条路风险高，但一旦成功，护城河极深。

云的转向是防御性财务操作——在算力成本飙升和盈利压力下，它选择了最直接的"提价止损"。这条路短期见效快，但牺牲了用户信任和市场份额。

两者代表了AI大模型商业化的两条岔路：

DeepSeek 路线：先做大蛋糕，再分蛋糕。以生态为王，相信"用量即护城河"。
云路线：先确保自己吃饱，再考虑做大。以利润为先，相信"稀缺即定价权"。

四、行业趋势展望

价格战才刚刚开始。 DeepSeek V4 的降价已经导致 MiniMax 股价腰斩、智谱单日跌9%。国产模型厂商被迫重新计算定价逻辑。
"Coding Plan 模式"将快速分化。 个人版订阅将逐步退出或涨价（云已开先例），企业版/团队版将成为主流。Credits 积分制等"模糊计费"方式会被更多厂商采用。
国产算力是降价的终极变量。 DeepSeek 把降价与昇腾950绑定，标志着模型价格开始被芯片供给决定。
用户忠诚度将成为最大变量。 在AI基础设施从"补贴换规模"转向"盈利优先"的过程中，如何平衡商业利益与用户信任，是所有厂商必须面对的考题。

五、当前主流大模型产品与价格全景（2026年4月）

5.1 国际闭源模型

厂商	模型	输入价（百万Tokens）	输出价（百万Tokens）	上下文	特色	支付方式
OpenAI	GPT-5.4	$2.50	$10.00	128K	综合旗舰，编码SWE-Bench 86%	Visa/Mastercard
OpenAI	GPT-5 Codex	$2.50	$10.00	128K	编码专精，SWE-Bench 86%	Visa/Mastercard
Anthropic	Claude Opus 4.6	$15.00	$75.00	1M	旗舰推理，SWE-Bench Verified 80.8%	Visa/Mastercard
Anthropic	Claude Sonnet 4.6	$3.00	$15.00	1M	性价比首选，编码能力★★★★★	Visa/Mastercard
Anthropic	Claude Haiku 4.5	$1.00	$5.00	200K	轻量快速，适合高频调用	Visa/Mastercard
Google	Gemini 2.5 Pro	$1.25	$10.00	1M	多模态强，免费层最慷慨	Google Cloud
Google	Gemini 2.5 Flash	$0.30	$2.50	1M	性价比之王，1M上下文	Google Cloud
Google	Gemini 2.5 Flash-Lite	$0.10	$0.40	1M	最便宜闭源，1M上下文	Google Cloud

5.2 国产开源/闭源模型

厂商	模型	输入价（百万Tokens）	输出价（百万Tokens）	上下文	特色	支付方式
DeepSeek	V4-Pro	¥3（缓存¥0.025）	¥6	1M	1.6T参数，开源SOTA，Agent强	支付宝/微信
DeepSeek	V4-Flash	¥0.28（缓存¥0.02）	¥0.28	1M	高性价比，13B激活	支付宝/微信
DeepSeek	V3.2	¥0.28（缓存¥0.028）	¥0.42	128K	成熟稳定，广泛适配	支付宝/微信
智谱	GLM-5.1	¥6（缓存¥1.3）	¥24	200K	开源#1，SWE-Pro 58.4，8h Agent	支付宝/微信
智谱	GLM-4.7	约¥1-2	约¥3-6	128K	上一代旗舰，性价比高	支付宝/微信
月之暗面	Kimi K2.5	¥1.1	¥4.32	128K	Agent集群，100分身并行	支付宝/微信
MiniMax	M2.5	¥1.1	¥1.1	200K	10B激活，Agent原生，SWE 80.2%	支付宝/微信
通义千问	Qwen3.5-Plus	¥0.8（缓存更低）	¥1.6-4.0	262K	397B-A17B，企业调用量第一	支付宝/微信
通义千问	Qwen-Flash	¥0.05-0.25	¥0.4-2.0	1M	极速轻量，1M上下文	支付宝/微信
字节豆包	Doubao-Seed-2.0	极低	极低	128K	国民级，价格地板	支付宝/微信
小米	MiMo-V2-Pro	$1-2（分段）	$3-6（分段）	1M	1T参数，42B激活，OpenRouter周榜#1	支付宝/微信

5.3 订阅套餐对比

厂商	套餐	月费	核心模型	适合场景	备注
阿里云百炼	Coding Plan Pro	¥200/月	Qwen+GLM+Kimi+MiniMax	多模型编程	每天9:30抢购
阿里云百炼	Token Plan 标准	¥198/月	8+模型	企业团队	2.5万Credits
阿里云百炼	Token Plan 高级	¥698/月	8+模型	中型团队	10万Credits
阿里云百炼	Token Plan 尊享	¥1398/月	8+模型	大型企业	25万Credits
智谱	GLM Coding Plan Lite	¥49/月	GLM-5/GLM-4.7	个人编程	~80 Prompts/5h
智谱	GLM Coding Plan Pro	¥149/月	GLM-5/GLM-4.7	专业开发	~400 Prompts/5h
智谱	GLM Coding Plan Max	¥469/月	GLM-5	重度使用	~1600 Prompts/5h
MiniMax	Token Plan Starter	¥29/月	M2.5	个人/轻量	多模态
MiniMax	Token Plan Max	¥119/月	M2.5	专业开发	300 Prompts
Kimi	Kimi Code	¥39/月起	K2.5	编程	多档位
OpenClaw	免费	免费	任意API	智能体框架	需自备API
Cursor	Pro	$20/月	GPT-4o/Claude	IDE编程	体验最佳
Claude Code	Pro	$20/月	Sonnet 4.6	终端编程	复杂推理最强
Claude Code	Max	$100/月	Sonnet 4.6	重度编程	20倍额度

5.4 各模型核心特点总结

🔥 DeepSeek V4 系列

优势：价格屠夫，开源SOTA，1M上下文，Agent能力强，国产算力适配
劣势：Pro版吞吐有限，团队规模小，商业化压力
适合：追求极致性价比、需要长上下文、Agent工作流

🔥 智谱 GLM-5

优势：开源第一梯队，SWE-Pro 58.4（全球第一），8小时自主Agent，科研能力强
劣势：近期涨价30%，Coding Plan 常售罄
适合：科研场景、复杂编码、长程Agent任务

🔥 Kimi K2.5

优势：Agent集群（100分身），长文本专家，海外收入爆发
劣势：价格中等偏上
适合：大规模搜索、多Agent协作、长文本处理

🔥 MiniMax M2.5

优势：10B激活参数极致高效，Agent原生设计，SWE 80.2%，1万美元4个Agent跑一年
劣势：品牌知名度较低
适合：Agent工作流、成本敏感的大规模部署

🔥 Claude 系列（国际）

优势：编码能力最强（SWE-Bench Verified 80.8%），产品化成熟，MCP生态
劣势：价格最高，需外币信用卡
适合：追求极致编码质量、预算充足的团队

🔥 Gemini 系列（国际）

优势：免费层最慷慨，1M上下文，多模态强
劣势：中文能力相对弱
适合：多模态任务、预算极有限、Google生态用户

六、大模型选择与订阅路径指南

6.1 选择决策树

你的主要场景是什么？
├── 个人学习/尝鲜
│   ├── 预算极低 → DeepSeek V4-Flash（¥0.02起）或 Gemini 2.5 Flash-Lite（免费）
│   └── 想体验多模型 → 阿里云百炼免费额度（100万Credits试用）
│
├── 日常编程/开发
│   ├── 国内优先 → DeepSeek V4-Flash（性价比最高）或 MiniMax M2.5（Agent原生）
│   ├── 追求质量 → Claude Sonnet 4.6（$3/M输入）或 智谱 GLM-5（开源第一）
│   └── 需要IDE体验 → Cursor Pro（$20/月）或 GLM Coding Plan Lite（¥49/月）
│
├── 复杂编码/Agent工作流
│   ├── 预算充足 → Claude Opus 4.6（最强编码）或 GPT-5 Codex
│   ├── 国内部署 → DeepSeek V4-Pro（¥3/M输入）或 Kimi K2.5（Agent集群）
│   └── 成本敏感 → MiniMax M2.5（10B激活，1万美元跑一年）或 DeepSeek V3.2
│
├── 企业级部署
│   ├── 阿里云生态 → Token Plan 团队版（198-1398元/月）
│   ├── 多模型需求 → 阿里云百炼 Coding Plan Pro（¥200/月，8款模型）
│   ├── 数据安全优先 → 通义千问 Qwen3.5-Plus（企业调用量第一）
│   └── 混合架构 → 80%国产模型 + 20% Claude（欧洲工作室实践方案）
│
└── 长文本/大上下文
    ├── 1M上下文 → DeepSeek V4-Pro/Flash、Gemini 2.5 Pro、Qwen-Flash
    ├── 需要推理 → DeepSeek V4-Pro（开源SOTA）
    └── 需要速度 → Qwen-Flash 或 Gemini 2.5 Flash

6.2 推荐订阅路径

路径A：极致性价比（月预算 < ¥100）

主力模型：DeepSeek V4-Flash（¥0.28/M输入，缓存命中¥0.02）
辅助模型：Gemini 2.5 Flash-Lite（免费层）
编程工具：Cursor Free 或 Trae（字节跳动，完全免费）
智能体：OpenClaw + DeepSeek V4-Flash API
月成本：¥0-50

路径B：个人开发者主力（月预算 ¥100-300）

主力模型：DeepSeek V4-Flash（扛量）+ DeepSeek V4-Pro（关键任务）
辅助模型：MiniMax M2.5（Agent场景）或 Kimi K2.5（长文本）
编程工具：Cursor Pro（$20/月）或 GLM Coding Plan Lite（¥49/月）
智能体：OpenClaw + 多模型切换
月成本：¥100-300

路径C：小团队（月预算 ¥500-2000）

主力模型：80% DeepSeek V4 系列 + 20% Claude Sonnet 4.6（复杂推理）
辅助模型：智谱 GLM-5（科研/编码）+ Kimi K2.5（长文本）
编程工具：Cursor Pro + Claude Code Pro
智能体：OpenClaw + 多模型Agent
聚合平台：阿里云百炼（多模型统一API）
月成本：¥500-2000

路径D：企业级部署（月预算 ¥2000+）

主力模型：通义千问 Qwen3.5-Plus
辅助模型：DeepSeek V4-Pro（性价比）+ Claude Opus 4.6（关键任务）
编程工具：Cursor Business + GitHub Copilot Business
智能体：OpenClaw 企业部署 + 阿里云百炼 Token Plan 团队版
管理：席位管理 + 用量统计 + 权限管控
月成本：¥2000-10000+

6.3 关键建议

不要把所有Token押在一个模型上
- 利用 OpenRouter 或阿里云百炼的多模型切换能力
缓存命中是最大成本杠杆
- DeepSeek V4 缓存命中价是未命中价的 1/100
- 合理设计 prompt 复用前缀，可大幅降低成本
国产模型已覆盖90%场景
- OpenRouter 数据显示中国模型调用量占全球前五中的四席
- MiniMax M2.5、Kimi K2.5、GLM-5 在编程和Agent场景已达旗舰级水平
关注降价窗口期
- DeepSeek V4 Pro 预计下半年随昇腾950上市进一步降价
- 阿里云 Coding Plan Lite 停售后，竞品可能跟进降价争夺用户
Agent 场景优先选国产模型
- Agent 工作流 Token 消耗是传统对话的 10-100 倍
- MiniMax M2.5（10B激活）和 DeepSeek V4-Flash（13B激活）是 Agent 场景的性价比最优解
企业部署考虑混合架构
- 日常任务用国产开源模型（成本低、中文好、部署灵活）
- 关键任务用闭源旗舰（Claude Opus / GPT-5 Codex）
- 通过阿里云百炼或自建聚合层统一管理