【AI趣识】2个小问题助你辨别几个最好的免费AI聊天工具智商几何？

当前流行的AI聊天工具众多，本篇通过2个问题看看最好的免费产品（ChatGPT、Grok、Gemini、DeepSeek等）的推理能力，通过文末的测试总结，帮助朋友们进行针对性的选择。

vison20080808

652人浏览 · 2025-03-01 14:38:53

vison20080808 · 2025-03-01 14:38:53 发布

❝
当前流行的AI聊天工具众多，本篇通过2个问题看看最好的免费产品（ChatGPT、Grok、Gemini、DeepSeek等）的推理能力，通过文末的测试总结，帮助朋友们进行针对性的选择。
❞

问题1

输入：“deepseek中有几个e”

看看各家的答复：

（1）DeepSeek-V3与DeepSeek-R1均回答正确👍：

（2）ChatGPT-4o回答错误，o3-mini回答正确：

（3）Grok3与其推理模式均回答正确👍：

（4）Gemini 2.0 flash回答错误，2.0 Flash Thinking Experimental回答正确：

问题2

输入：“请用我给你的4个数字，通过加、减、乘、除、括号，组成一个运算，使得结果为24。注意:数字需要全部使用我提供的数字:4468”

看看各家的答复：

（1）DeepSeek-V3回答错误，DeepSeek-R1回答1次正确、1次错误：

（2）ChatGPT-4o回答错误，o3-mini回答错误（接近正确）：

（3）Grok3回答正确，推理模式1次正确、1次错误：

（4）Gemini 2.0 flash与2.0 Flash Thinking Experimental回答均错误：

小结

1、偏严谨的分析类问题，尽量选择“推理”/“深度思考”/“Think”模型，优先考虑DeepSeek-R1。

2、号称全球最好的（马斯克的Grok3），基础版本（非Think）确实表现好，但Think模式也会出偏差。

3、ChatGPT免费版本（4o与o3-mini）表现很差（体现其商业版的价值了？）。

4、谷歌的Gemini 2.0 flash表现很差（但速度很快）。

5、同一个问题，即便是推理模式，返回结果也会有对有错（记得多次校验）。

欢迎关注微信公众号“AI趣栈”，持续为您提供关于AI的好内容~

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

DeepSeek V4 全面开源：1.6T 参数背后的中国式创新

DeepSeek技术社区

cover

Agent 工具编排的边界控制：从 DeepSeek-V4 的验收标准看 MCP 容错设计

DeepSeek技术社区

cover

RAG 混合检索的离线评测门禁：何时向量搜索反而降低回答质量

DeepSeek技术社区

所有评论(0)

查看更多评论

vison20080808

已为社区贡献2条内容