Claude 3.5一夜封神?实测碾压GPT-4
<p><h1>🚀 Claude 3.5一夜封神?实测碾压GPT-4</h1></p> <p><h2>摘要</h2></p> <p>就在昨晚,AI 圈又发生了一次小型“地震”。Anthropic 在没有任何预热的情况下,直接发布了 Claude 3.5 Sonnet。不仅速度飞快,而且在多项基准测试中
🚀 Claude 3.5一夜封神?实测碾压GPT-4
摘要
就在昨晚,AI 圈又发生了一次小型“地震”。Anthropic 在没有任何预热的情况下,直接发布了 Claude 3.5 Sonnet。不仅速度飞快,而且在多项基准测试中直接干翻了 GPT-4o。更绝的是,它带来了一个名为“Artifacts”的新功能,让 AI 对话直接变成了工作台。今天,二筒就带大家看看,这位“新王”到底能不能打,以及咱们普通人怎么用它来“摸鱼”提升效率。
---
一、半夜惊雷:AI 界的“新王”登基
昨晚本来打算早点睡的,结果朋友圈突然刷屏了。大家都在喊一句话:“Claude 3.5 发布了,GPT-4o 不香了。”
说实话,这种“狼来了”的话我听得耳朵都起茧子了。毕竟每个月都有新模型说自己是“GPT-4 杀手”,结果实测下来连 GPT-3.5 都打不过。但这次不一样,Anthropic(Claude 的母公司)甚至都没发长篇大论的论文,直接甩出了一个模型:Claude 3.5 Sonnet。
这名字就有意思了。之前的 Claude 3 分为 Haiku(快)、Sonnet(中)、Opus(大)。这次直接跳过 3 的迭代,发了 3.5 的“中杯”版本,而且官方宣称:这是目前市面上最聪明的模型之一。
我赶紧爬起来实测了一下。首先最直观的感受就是快。真的太快了。那种响应速度,让你感觉对面不是在思考,而是在背书。以前用 GPT-4o 生成一段代码,有时候要等个几秒钟在那“转圈圈”,而 Claude 3.5 Sonnet 基本上是字随着光标直接喷涌而出。
根据官方数据,它在推理、数学、编码等方面的表现,直接超过了 GPT-4o 和 Gemini 1.5 Pro。最重要的是,它目前是免费开放的! 只要你注册了 Claude 账号,就能直接用。这对咱们普通用户来说,绝对是白嫖的快乐。
---
二、Artifacts:这才是真正的“生产力革命”
如果说速度和智商只是“量变”,那么 Artifacts 功能绝对是“质变”。这也是我觉得最值得跟大家细说的功能。
以前我们用 ChatGPT 或者其他 AI,更像是在“聊天”。你问,它答。如果让它写代码,它会给你一坨代码块,你得自己复制、粘贴、保存、运行。如果让它画图,它给你个链接或者 Markdown 代码,你还是得自己折腾。
但 Claude 3.5 的 Artifacts 做到了什么?它把对话窗口变成了一个“工作台”。
举个我刚才测试的例子。我对它说:“帮我写一个贪吃蛇游戏的网页代码。”
如果是以前的 AI,它会给你一堆 HTML 和 JS 代码。但在 Claude 3.5 里,屏幕右侧会突然弹出一个独立的预览窗口。代码写完的一瞬间,那个贪吃蛇游戏直接就在右边运行起来了!
我可以直接在右边玩游戏,甚至可以实时修改。我说:“把蛇的颜色改成红色,背景改成黑色。”话音刚落,右边的画面立马更新。
这就意味着,AI 不再只是一个“建议者”,它变成了一个“执行者”。这对职场人意味着什么?
* 做图表:你把 Excel 数据扔给它,它直接在右边生成一个可视化的柱状图,你可以直接截图放进 PPT。
* 写文档:你让它写个活动策划案,它直接在右边生成一个排版好的预览页,而不是一堆乱七八糟的 Markdown 文本。
* 写代码:前端开发的同学,甚至可以直接在预览窗口里调试简单的组件。
这种“所见即所得”的体验,是目前 GPT-4o 都没有的。这才是 AI 走向生产力工具的关键一步。
---
三、实测对比:写代码、写文案,到底谁更强?
光说不练假把式。为了验证它是不是真的“封神”,我做了两个小测试。
1. 代码能力:不再是“伪代码”
我给 Claude 3.5 和 GPT-4o 出了同一个题目:“用 Python 写一个脚本,自动整理下载文件夹里的文件,按照图片、文档、压缩包分类。”
GPT-4o 的表现:给出了代码,逻辑是对的,但是它引用了一个 `shutil` 库,却没处理文件名重复的异常情况。我运行了一下,遇到同名文件直接报错。我反馈给它,它才道歉并修改。
Claude 3.5 Sonnet 的表现:它不仅给出了代码,还在代码里预先写好了异常处理。它甚至贴心地加了注释:“如果文件夹不存在,会自动创建;如果文件名重复,会自动重命名。”
这就是“经验丰富”和“刚毕业实习生”的区别。Claude 3.5 的代码更像是老手写的,考虑到了实际运行中的坑。
2. 中文理解力:更懂“人话”
我又让它俩写一段文案。题目是:“给一个不想上班的打工人写一段心理独白,要带点自嘲和幽默,不要太丧。”
GPT-4o 写的:“啊,早晨的闹钟又响了。我不想起床,被窝是我的避风港……”(有点像小学生作文,略显生硬)。
Claude 3.5 写的:“闹钟响的那一刻,我悟了。我和我的床,才是真爱。至于上班?那只是为了给我的猫赚猫粮,顺便维持我体面人类的身份。只要我摸鱼的速度够快,老板的 PPT 就追不上我。”
说实话,看到“摸鱼”和“PPT”这种词用得这么地道,我甚至怀疑Anthropic 是不是偷偷训练了中文互联网语料。它对中文语境的把握,真的比 GPT-4o 要更接地气,更有“网感”。
---
四、普通人怎么用?手把手教你上手
看到这里,估计很多朋友手痒了。别急,二筒这就给大家整理一份保姆级上手指南。
1. 如何访问?
目前 Claude 3.5 Sonnet 已经向所有用户开放。
* 网址:直接搜索 `Claude.ai`。
* 注册:你需要一个魔法上网环境(懂的都懂),以及一个国外手机号(或者通过某些接码平台)。
* 免费额度:免费用户每天有一定的对话次数限制,但对于日常轻度使用完全够用。
2. 实用技巧:善用“角色扮演”
因为 Claude 3.5 的逻辑能力很强,建议大家在提问时,给它一个具体的“人设”。
比如,不要只说“帮我改一下这段话”,要说:
> “你现在是一位拥有 10 年经验的新媒体编辑,擅长爆款标题和情绪引导。请帮我修改这段文案,让它更适合发在小红书上,语气要活泼,多用 emoji。”
你会发现,加上人设后,它的输出质量会有质的飞跃。
3. 玩转 Artifacts
如果你想体验那个神奇的预览窗口,只需要在指令里加上几个关键词:
* “生成一个网页……”
* “画一个 SVG 图标……”
* “创建一个可视化的图表……”
只要涉及到代码生成或可视化,它大概率会自动触发 Artifacts 窗口。你可以直接在右边看到结果,不需要自己再跑一遍代码。
---
总结
Claude 3.5 Sonnet 的发布,确实给了 OpenAI 一记重拳。它证明了,AI 的竞争不仅仅是参数大小的竞争,更是用户体验的竞争。
Artifacts 功能的出现,让 AI 从“聊天框”里走了出来,变成了一个真正的“副驾驶”。对于我们普通职场人来说,这是一个巨大的利好。我们不需要懂代码,不需要懂复杂的提示词工程,只要会说话,就能让 AI 帮我们干活。
有人问:GPT-4o 还值得充钱吗? 我觉得目前来看,如果你主要做图文创作、代码辅助,Claude 3.5 可能是更好的选择;但如果你需要语音对话、实时视频交互,GPT-4o 依然有优势。
AI 的发展真的太快了,上个月还是 GPT 的天下,这个月 Claude 就反超了。作为普通人,我们最好的策略就是:保持好奇,多去尝试。 毕竟,这些工具最终都是为了解放我们的双手,让我们有更多时间去享受生活(或者摸鱼)。
你试用过 Claude 3.5 了吗?感觉比 GPT-4o 怎么样?欢迎在评论区留言分享你的体验!
---
*我是二筒,关注「AI 原来如此」,带你用最通俗的语言,看懂最硬核的 AI 科技。下期见!*
更多推荐



所有评论(0)