不好意思啊,诸位。拖拖拉拉的拖到现在,已经有很多大佬做过测评了,我就不再具体阐述数据问题,我在下面,我会列出来,有需要自取就好。

纯个人体验

因为国内外ai基本上都用过,国内好多ai公司都有朋友,也就可能算是了解一点点的。

先横向对比,先比较国外

Claude 和Gemini个人认为是除了 ChatGPT以外的头部。

 

首先请允许我介绍一下,为什么会有体验不同的原因出现。

 

第1点

ChatGPT在ai行业的优势几乎就是断层的,至少在deepseek出现以前

请你们不要看那些空虚的数据,他们有用,但是他们控制了变量控制了在某些语言环境条件下,用标准的提示词帮你提问,这也就是为什么我们见到很多标称能与差的gpt相媲美的ai模型,却不能和他在实际体验上相比。

这是为什么

很简单,第一提示词不一定相同,如果说你的提问按照标准的提示方法,举一个例子

我让他帮我写一篇学术研究报告,在500字左右,有关于环保的

和假如你是一个环保研究行业的专家,请你使用毕生最厉害的功底,然后以来确保该报告的准确性,严谨性,学术性,专业性,可以引用文献,但是不计入正文字数,可以举例子,可以使用一切论证方法,但是在使用论证方法之后必须要检验是否正确,帮我写一份有关于美国加州大火环保的学术研究报告,字数在500字左右。

这两种提示词回答出来的结果是天差地别,这也就是为什么我们在使用不同的ai模型的时候,你会感觉不同的ai模型它给你带来的感觉不一样

你比如说ChatGPT,人们通常对于他的感觉比其他ai模型感觉要好,并不是人们对于ChatGPT第一印象好,而是因为他在提示词方面回答方面,他们的优化更好。简称听得懂人话, Ai都听不懂人话,但是他们能够训练的比其他的ai模型更好

这是不同ai模型给你带来主观体验不同的地点也是最重要的一点原因。

第2点

除此之外,训练文本中不同语言所占的比例不同也会造成体验的不同,比如说国内大模型通常以中文为主,而国外通常以英文为主,这种根本性的不同造成了不同语言输入和输出体验感完全不同,对于chatgpt gemini claude ,这种拥有许多高算力显卡的国外ai数据模型来说,他们相较于国内ai数据模型还稍微好一些,因为他们就主打一个量大,举一个例子就是我数学我一个题我做一遍我做不会,我做10遍肯定。我蒙答案也能蒙上。

那么国外ai的硬伤就是对于汉语言的理解

国内ai同样

现在我可以断言说,凭我的主观体验, Deepseek,CHATGPT,可以说是断层式的第一,尽管国内很多ai模型都有所进步,但是他们仍然存在听不懂人话的现象,但是这两个是真的极少极少极少存在,至少在我的使用过程中仅仅出现过1~2次,而对于其他的国外模型同样存在相同的问题,但是他们由于数据够多,样本够大,量大管饱的显卡策略,也勉强能听懂人话。

这两点基本上就构成了你对于一个ai模型体验感的基本面。

至于他实际的效果,性能,编码能力等等,这都是次要,他都听不懂你在问什么,他怎么回答你的问题呢。

在体验过程中,Gemini2.0Pro,他这个大数据模型最好的方面在于他能够真正基本上做到听懂你的话,而且执行好你的命令,尽管。他与ChatGPT o1模型和o3mini模型,都存在回答问题假大空的现象,但是,可以通过提示词去调节,他的编程能力是令我惊喜的,我假装我自己不知道如何去使用python,他完全可以较为独立的完成一款应用,当然肯定要我给予反馈,在大面上是没有问题的,包括bug的修复等等,肯定还是很粗略的,不是那么精细的,但是已经表现出了一种智能化的雏形,已经有种向deepseekr1靠拢的感觉,也就是我们所说的顿悟,如果说把深度求索的 r1模型,叫做天才,那么Gemini2.0Pro,可以称得上是无比努力的人才。

那么你在正常使用2.0Pro的时候,你会感觉他的回答速度是非常非常令人惊喜的,尤其是在编程方面,毕竟他能做到一秒钟小100tokens的回复。

当然,尽管如此还是不如gpt与深度求索,的体验感要好,但是相较于国内大模型,kimi,豆包,等等,体验感还是要好很多的,毕竟光对话文本长度就已经超过某些大模型不知道多少了。

但是科学上网要求强度比较高,如果有条件的话还是不错的,你既不想去花钱购买ChatGPT,然后又不想去等待deepseek,又不太想用国内那些无趣的模型,你们Gemini2.0pro是一个不错的替代品

 

 

 

 

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐