Gemini 3.1 Pro上线橘子AI：0.03元/次，推理能力翻倍，谷歌这是要掀桌？

说实话，我之前推荐了这么久Nano Banana 2，今天看到Gemini 3.1 Pro在上线，价格直接干到了0.03元/次，第一反应是谷歌这是要把OpenAI往死里逼。先别急，给你看几个硬核数据。

2601_95217421

357人浏览 · 2026-05-02 19:26:47

2601_95217421 · 2026-05-02 19:26:47 发布

说实话，我之前推荐了这么久Nano Banana 2，今天看到Gemini 3.1 Pro在橘子AI（www.juziaigc.com） 上线，价格直接干到了0.03元/次，第一反应是谷歌这是要把OpenAI往死里逼。

先别急，给你看几个硬核数据。

推理能力翻倍，价格不涨，谷歌动真格了

Gemini 3.1 Pro跟老前辈相比，在ARC-AGI-2这个公认的推理基准测试中拿到了77.1%，老前辈只有31.1%。你没看错，翻了一倍多。谷歌的策略也很简单粗暴：能力翻倍，价格不涨。

核心原因是，它把Gemini 3 Deep Think里那个“深度思考”的架构直接拿来用了，定位就是处理“一个简单答案不够用”的复杂问题。

多模态：它更像个“理解大师”

Gemini 3.1 Pro是原生多模态架构，一出生就统一处理文本、图像、音频、视频。简单说，它不是靠猜，而是真正理解。

举个例子，你让它设计一把电竞椅，它会先去搜人体工学数据，再按物理规律生成设计图。甚至能同时分析攀岩视频和文字，给你出一份图文并茂的报告。这种跨模态的合并能力，叫一声“通才”不为过。

它还能分析PDF报告里的复杂图表，指出作者没明说的潜在相关性。100万Token的上下文，一部小说加整个代码库都能一次性读完。不过有人反馈文档中间部分的信息召回会弱一点，但这并不影响它多数场景下的超级表现。

代码能力强，编程质感有提升

编程这块，LiveCodeBench Pro上它的Elo积分断层领先；Terminal-Bench 2.0里它干掉了GPT-5.3-Codex。SWE-Bench Verified上它拿了80.6%，也高于Claude Opus 4.6的72.6%。

我个人体验，做日常编码完全够用，构建复杂系统架构和多层逻辑时，会明显感觉到它先“自我博弈”再给出方案。不过也有数据指出，在需要极高严谨性的数学证明场景，Claude的准确率（85%）略高于它（80%）。

多模态理解与文字渲染

在视频会议测试里，它能准确生成多个真实人物加一名二次元角色的截图，连“镜像翻转”这种逻辑都考虑到了。把不同人物锁定、引用、协同放置，能力相当突出。

文字渲染上，它对上千字的学术论文也能智能排版，直接产出带论点图表的海报。做了个“肾该按哪里”的中医指令测试，它也能准确标注足底涌泉穴。

安全隐私和性价比最高

极客最关心的安全隐私：100万Token的长上下文、幻觉率大幅下降。最关键的是，Gemini 3.1 Pro只要0.03元/次。

怎么用？

在橘子AI（www.juziaigc.com） 的导航栏里，直接点击Gemini 3.1 Pro模型就行。新用户注册送10000积分，够生好几百次。以前的几大模型依然在线，现在多了这个多模态新选择。

如果你想做推理密集型任务（写代码、分析复杂文档、生成结构化报告）或者跨模态数据处理的场景，这个新模型的0.03元/次的价格是完全没压力的试错。

去www.juziaigc.com 直接试试，输入你的复杂代码库，或者让它分析那堆没人看的行业报告，你自己的感受比别人说的更重要。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

DeepSeek 重排优化实战：当业务别名与模型路由表不一致时如何止损

DeepSeek技术社区

DeepSeek-V4 网关层限流熔断实战：当 P99 突增 3 倍时我们如何守住 SLA

DeepSeek技术社区

DeepSeek-V4 推理吞吐优化：批处理策略与 KV Cache 实践

DeepSeek技术社区

所有评论(0)

查看更多评论

2601_95217421

@2601_95217421

已为社区贡献1条内容

Gemini 3.1 Pro上线橘子AI：0.03元/次，推理能力翻倍，谷歌这是要掀桌？

2601_95217421

推理能力翻倍，价格不涨，谷歌动真格了

多模态：它更像个“理解大师”

代码能力强，编程质感有提升

多模态理解与文字渲染

安全隐私和性价比最高

怎么用？

所有评论(0)

温馨提示：您尚未绑定手机号

2601_95217421