
DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!
DeepSeek 昨晚发文宣布推出 DeepSeek-V3-0324,各方面能力都得到大幅增强!据 DeepSeek 称,全新的 DeepSeek-V3-0324 在数学、代码能力等方面超过 GPT-4.5 和 Claude-Sonnet-3.7。我翻了下 huggingface 上的说明,新版本 V3 模型在中文写作能力上向 DeepSeek-R1 做了对齐,优化了中长篇写作能力;优化了中文搜索
DeepSeek 昨晚发文宣布推出 DeepSeek-V3-0324,各方面能力都得到大幅增强!
据 DeepSeek 称,全新的 DeepSeek-V3-0324 在数学、代码能力等方面超过 GPT-4.5 和 Claude-Sonnet-3.7。
我翻了下 huggingface 上的说明,新版本 V3 模型在中文写作能力上向 DeepSeek-R1 做了对齐,优化了中长篇写作能力;优化了中文搜索能力,提供了更强的报告分析和更详细的输出。
无论是 huggingface 还是推特,都是好评如潮,现在新版本 V3 模型已经在 huggingface 大模型中登顶!
其实从 DeepSeek-V3-0324 的名字看,就知道这个模型是 3 月 24 号就发布了。
我昨天下午也拿这个模型测试了下写作、搜索、代码等功能。
结果还是蛮惊艳的,新版本 V3 模型和之前一样,隐藏了思维链,但回答比 DeepSeek-R1 更好更快。
我猜测新版本 V3 模型是基于 DeepSeek-R1 蒸馏,在不影响回答质量的情况下,达到了更快的响应速度。
所以建议不复杂的推理任务,就不要开启“深度思考(R1)” 了,只开启“联网搜索”,直接使用新版本的 V3 模型,立刻享受速度更加流畅、效果全面提升的对话体验。
为了方便你直观感受,我还是贴下测试。
先看中文搜索能力。
以昨天讨论的 “未来 10 年内适合普通人的赚钱方向”为例,新版本 V3 模型给出的答案如下:
可以看到,对比 DeepSeek-R1 的答案,新版本 V3 模型无论是排版、详细程度还是深入程度都更优秀。
接着看看中文写作能力,我们仍以写小说为例,看下效果:
相对于之前 DeepSeek-R1 生成的文本,新版本 V3 模型生成的内容更长、上下文更连贯,不仅逻辑缜密,还能将现代知识和古代真实人物结合起来,最后还给出后续的故事线索走向提示,简直太贴心了!
据我说知,现在很多写小说的人都在借助 Claude 3.7 Sonnet,看看现在 DeepSeek 新版本 V3 模型交付的文本水准,不知道 Claude 3.7 Sonnet 还香么?
短短的一句话需求,根本不需要啥提示词,能得到这么一大段文字,我单方面说句新 V3 模型是目前中文写作的“地表最强”模型不过分吧!
最后看看代码能力。
有网友(@flavioAd)发了个新版本 V3 模型和 DeepSeek-R1 的编程比较视频,比我自己测试的更加直观,就借过来一用,如下:
视频中 DeepSeek-R1 生成的效果和我以前测试时的效果差不过,很多细节(如重力因素)并没有考虑到,而现在 DeepSeek-V3-0324 的效果就非常逼真了。
虽然官方称代码水平高于 Claude 3.7 Sonnet,但我感觉还是有点小差距,并没有 DeepSeek 官方吹的那么强。
毕竟上一个吹代码能力暴打 Claude 3.5 Sonnet 的 Grok3,跑下来也没那么强不是么。
不过考虑到 Claude 3.7 Sonnet 的价格,再看看 DeepSeek V3 的价格,就算水平差一点,也无所谓了。
如果你想在 Cherry Studio 等软件中使用 DeepSeek-V3-0324,那么除了 DeepSeek 官方 API 外,还可以使用 OpenRouter 提供的免费 deepseek-chat-v3-0324,具体的配置过程就不多说了,有兴趣的话翻以前的文章就行了。
一直以来,DeepSeek 都在超越自己的路上奋力前行,不仅开源,还物美廉价。
相比老美的 4 大 AI 巨头你追我赶,还是希望国内其他几家大语言模型厂商再加把油吧,咱也来个百花齐放。别整半天,打败 DeepSeek-R1 的还是 DeepSeek 自家产品。真的,国内苦老美的大模型久矣!
新 V3 模型都这么亮眼了,不知道 DeepSeek R2 会达到什么水平?
你用新 V3 模型了吗?有什么心得体会呢?欢迎留言与我探讨呀。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
更多推荐
所有评论(0)