中国小厂逆袭!DeepSeek凭370亿参数竟让OpenAI连夜改代码?
打开纽约时报可以了解到,一家名为深度求索(DeepSeek)的中国小型初创公司发布了一个新的人工智能系统,其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美,它就是DeepSeek。打开各大网页都可以看到DeepSeek杀疯了的场景,所以今天索奇就引领大家,使用并测试一下这个模型。在DeepSeek的主页往下拉可以看到DeepSeek V3的测评图——在目前大模型主流榜单中,DeepSeek
DeepSeek是什么?
打开纽约时报可以了解到,一家名为深度求索(DeepSeek)的中国小型初创公司发布了一个新的人工智能系统,其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美,它就是DeepSeek。
打开各大网页都可以看到DeepSeek杀疯了的场景,所以今天索奇就引领大家,使用并测试一下这个模型。
在DeepSeek的主页往下拉可以看到DeepSeek V3的测评图——在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。
DeepSeek-V3几个关键信息:
DeepSeek-V3 拥有 671B(6710 亿)参数
激活参数:37B(370 亿)
预训练 token 量:14.8 万亿
如何使用呢?
可以使用网页端,也可以使用APP,这里进行网页端演示哈
网址:DeepSeek
打开主页如下所示,最上方写到一些小字——DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,可谓气质非凡,给国产AI争光啊(DeepSeek-R1 发布 2025/01/20) 另外开源所有训练技术,!
点击开始对话,就进行我们的聊天页面啦
打开之后,页面如下所示,我是 DeepSeek,很高兴见到你!
就下来就可正常的AI对话模型一样进行聊天了,给它发送一个Prompt,可以看到下面有深度思考(R1)和联网搜索功能。
测评
Prompt:“下面我给你发的任何内容都请按照下列标准进行回答:请使用轻松、自然、简洁的语气来表达,不要过于正式或标准化,避免使用过多的无序列表结构。 语言要直白、易懂,尽量像日常对话一样亲切、流畅,同时保持内容的重点突出,避免复杂的表达或冗余的修饰,不要太多哲理话的描述,输出让人感觉很自然的内容,而非机械感。” 注意:如果是文章,请您输出一个吸引人且反常惊奇且有悬念的标题
请牢记这个Prompt,接下来索奇进行测试
这里索奇用一句话进行测试:“目前openai发展到了哪个模型”
先拓展维基百科中的openai发展史
重点是最后一条:2024年12月20日,宣布推出o3和o3-mini模型,进一步提升推理能力。有的说是21日,有的说是20日,这个不容争议,这里都按正确来处理。
分别用DeepSeek提供的几种模式
-
未联网,未使用深度思考
可以看到这个效果还是不太理想的,另外没有记住我上方的Prompt,只回答了我当前的问题,上下文能力不算太强。
-
使用联网功能,未使用深度思考
联网功能下那是的数据还是不错的,能够正确推出最新模型。不过写的内容还是没有按照我之前的Prompt来。
-
使用深度思考,未使用联网功能
单独使用深度思考,可见文章效果还是不错的,能够清楚记住我上面的Prompt,并考虑到可能是文章,对文章起一个标题。下面的语言也更加自然。就是未使用联网功能,它认为小编是错的,因为它目前的训练数据截止日期还停留在2023年10月
-
使用深度思考,使用联网功能
这个推理效果还是比较准确的,但文章效果没有上面的单深度模型效果好,也可能是索奇问的太多了,到这里它忘记了初始的Prompt也是不为奇的。
所以下面再重开一个页面,开启深度+联网功能,进行提问
截至2025年1月27日,OpenAI的最新模型是 O3,这是其继2024年推出的O1模型后又一次重大升级,标志着AI推理能力的显著突破。这里显示的结果还是很正确的。不过没有记住初始的Prompt,也没有拓展到文章标题...
为了避免巧合,下面单独开启深度思考模型看看它是否能够输出标题和自然语气的文章内容。
可见不是偶然,如果不需要联网获取最新的数据——2023年10月之前,建议单独开启深度思考模型,会更加吃香。
好了,测评到此结束~ 另外需要注意,文章内容可能会随着Prompt的不同有所变化。
拓展
部分网友可能不确定o3模型是否会发布(或者认为是网上虚假信息),截至到2025.1.27,Sam Altman已经多次发布该模型的相关讯息,所以可以确定o3模型信息的准确性。
附:DeepSeekAPI文档:首次调用 API | DeepSeek API Docs
更多推荐
所有评论(0)