Gemini 3.1 Pro上线橘子AI:0.03元/次,推理能力翻倍,谷歌这是要掀桌?
说实话,我之前推荐了这么久Nano Banana 2,今天看到Gemini 3.1 Pro在上线,价格直接干到了0.03元/次,第一反应是谷歌这是要把OpenAI往死里逼。先别急,给你看几个硬核数据。
说实话,我之前推荐了这么久Nano Banana 2,今天看到Gemini 3.1 Pro在橘子AI(www.juziaigc.com) 上线,价格直接干到了0.03元/次,第一反应是谷歌这是要把OpenAI往死里逼。
先别急,给你看几个硬核数据。
推理能力翻倍,价格不涨,谷歌动真格了
Gemini 3.1 Pro跟老前辈相比,在ARC-AGI-2这个公认的推理基准测试中拿到了77.1%,老前辈只有31.1%。你没看错,翻了一倍多。谷歌的策略也很简单粗暴:能力翻倍,价格不涨。
核心原因是,它把Gemini 3 Deep Think里那个“深度思考”的架构直接拿来用了,定位就是处理“一个简单答案不够用”的复杂问题。
多模态:它更像个“理解大师”
Gemini 3.1 Pro是原生多模态架构,一出生就统一处理文本、图像、音频、视频。简单说,它不是靠猜,而是真正理解。
举个例子,你让它设计一把电竞椅,它会先去搜人体工学数据,再按物理规律生成设计图。甚至能同时分析攀岩视频和文字,给你出一份图文并茂的报告。这种跨模态的合并能力,叫一声“通才”不为过。
它还能分析PDF报告里的复杂图表,指出作者没明说的潜在相关性。100万Token的上下文,一部小说加整个代码库都能一次性读完。不过有人反馈文档中间部分的信息召回会弱一点,但这并不影响它多数场景下的超级表现。
代码能力强,编程质感有提升
编程这块,LiveCodeBench Pro上它的Elo积分断层领先;Terminal-Bench 2.0里它干掉了GPT-5.3-Codex。SWE-Bench Verified上它拿了80.6%,也高于Claude Opus 4.6的72.6%。
我个人体验,做日常编码完全够用,构建复杂系统架构和多层逻辑时,会明显感觉到它先“自我博弈”再给出方案。不过也有数据指出,在需要极高严谨性的数学证明场景,Claude的准确率(85%)略高于它(80%)。
多模态理解与文字渲染
在视频会议测试里,它能准确生成多个真实人物加一名二次元角色的截图,连“镜像翻转”这种逻辑都考虑到了。把不同人物锁定、引用、协同放置,能力相当突出。
文字渲染上,它对上千字的学术论文也能智能排版,直接产出带论点图表的海报。做了个“肾该按哪里”的中医指令测试,它也能准确标注足底涌泉穴。
安全隐私和性价比最高
极客最关心的安全隐私:100万Token的长上下文、幻觉率大幅下降。最关键的是,Gemini 3.1 Pro只要0.03元/次。
怎么用?
在橘子AI(www.juziaigc.com) 的导航栏里,直接点击Gemini 3.1 Pro模型就行。新用户注册送10000积分,够生好几百次。以前的几大模型依然在线,现在多了这个多模态新选择。
如果你想做推理密集型任务(写代码、分析复杂文档、生成结构化报告)或者跨模态数据处理的场景,这个新模型的0.03元/次的价格是完全没压力的试错。
去www.juziaigc.com 直接试试,输入你的复杂代码库,或者让它分析那堆没人看的行业报告,你自己的感受比别人说的更重要。
更多推荐



所有评论(0)