2026年5月第一周,一组数据在中国 AI 圈激起了巨大波澜:

据 OpenRouter 测算,4月27日至5月3日,中国 AI 大模型周调用量达到 7.942 万亿 Token,环比暴涨 81.7%。同期美国模型调用量为 3.258 万亿。这是中国模型第二次在调用量上超越美国对手。

上一次反超时,很多人说「这只是因为中国市场大」。但这一次,背景全变了。


底牌一:字节豆包登顶视觉榜——多模态不再是短板

5月初,字节 Doubao-Seed-2.0-Pro 在多模态视觉评测榜登顶。这是第一次有中国模型在视觉理解这一关键维度上实现全球领先。

多模态是 2026 年大模型竞争的核心维度。纯文本模型的竞争力窗口正在关闭——用户需要模型能看懂图表、理解视频、分析 PDF。字节豆包的登顶意味着:中国模型在最关键的增量战场上也具备了竞争力。

更值得注意的是,字节并非唯一在多模态上发力的中国公司。DeepSeek 在5月1日挂出多模态论文后虽连夜撤下,但识图功能的灰度测试已同步开启——论文可以撤回,产品能力不会。


底牌二:Qwen3.6-27B 代码反超——开发者用脚投票

阿里 Qwen3.6-27B 在代码评测中超越了上一代 397B 的旗舰模型——参数量不到 7%,性能反而更强。

这件事的意义超出了技术本身。代码生成是开发者选择模型的首要场景,而开发者是 AI 生态中最有话语权的群体。当全球开发者选择 Qwen 而非 GPT 来做代码生成,这不是一个 benchmark 游戏的胜利——这是市场份额的实质性转移。

Qwen 系列在 Hugging Face 上的下载量和使用量也在印证这个趋势。开源社区的选择往往是商业市场的前瞻指标。


底牌三:从中文优势到全局替代

上一次中国模型调用量反超,主要原因是中国市场对中文模型有天然需求——中文问答、中文写作、中文客服场景天然更适合国产模型。

但这一次的增量来自完全不同的方向:

  • 代码生成:用 Qwen 替代 GPT,不是因为中文好,而是因为代码能力强
  • 多模态理解:用字节豆包替代 Gemini,不是因为价格低,而是因为视觉评测分数高
  • Agent 工具调用:中国模型在 BFCL 和 ACEBench 等工具调用 benchmark 上的进步速度超过美国模型

前一次反超是市场驱动的。这一次是能力驱动的


模型调用量背后的「Token 经济」

中国移动 5 月 8 日发布的 MoMA 平台接入超过 300 款模型,首创了 Token 集约化运营模式。这背后是一个更大的趋势:AI 基础设施正在从「模型为王」切换到「平台为王」。

MoMA 本质上是一个模型调度层:自动根据成本、效果、延迟三个维度匹配最优模型。当某个模型出现超时或限流,秒级切换到备选。用户不需要关心底层调用的是 Qwen 还是 DeepSeek 还是字节豆包。

这种平台化思路让 Token 的流通效率大幅提升——就像电网让电力从「自备发电机」变成「即插即用」。中国在 AI 基础设施层的布局速度,可能是调用量持续反超的更深层原因。


价格战叠加:国产模型的性价比壁垒

xAI Grok 4.3 降价 60%,OpenAI 切换更高效的默认模型——美国模型也在降成本。但中国模型的性价比优势是结构性的:

  • DeepSeek 坚持极致性价比路线,同等能力价格只有美国模型的 1/5 到 1/10
  • Qwen 开源系列 可以本地部署,边际成本趋近于零
  • 字节豆包 在字节生态内以几乎零成本的方式触达数亿用户

当调用成本不再构成决策障碍,开发者选择模型的唯一标准变成了「哪个模型在这个任务上表现最好」。而中国模型正在越来越多的任务上达到这个标准。


结尾

7.942 万亿 Token 这个数字,放在一年前只是一个技术统计。放在今天,它是中国 AI 从「追赶者」变成「替代选项」的标志。

字节豆包在多模态上登顶,Qwen 在代码上反超,DeepSeek 在性价比上碾压——这不是一个模型的胜利,而是一个生态的系统性崛起。

对于全球开发者来说,2026 年的选择不再是「用美国模型还是用中国模型」,而是「这个任务,哪个模型做得最好?」

当这个问题开始被认真对待,调用量反超就成了必然。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐