Claude 3.5一夜封神？实测碾压GPT-4

<p><h1>🚀 Claude 3.5一夜封神？实测碾压GPT-4</h1></p> <p><h2>摘要</h2></p> <p>就在昨晚，AI 圈又发生了一次小型“地震”。Anthropic 在没有任何预热的情况下，直接发布了 Claude 3.5 Sonnet。不仅速度飞快，而且在多项基准测试中

qq350861146

349人浏览 · 2026-04-08 12:40:18

qq350861146 · 2026-04-08 12:40:18 发布

🚀 Claude 3.5一夜封神？实测碾压GPT-4

摘要

就在昨晚，AI 圈又发生了一次小型“地震”。Anthropic 在没有任何预热的情况下，直接发布了 Claude 3.5 Sonnet。不仅速度飞快，而且在多项基准测试中直接干翻了 GPT-4o。更绝的是，它带来了一个名为“Artifacts”的新功能，让 AI 对话直接变成了工作台。今天，二筒就带大家看看，这位“新王”到底能不能打，以及咱们普通人怎么用它来“摸鱼”提升效率。

---

一、半夜惊雷：AI 界的“新王”登基

昨晚本来打算早点睡的，结果朋友圈突然刷屏了。大家都在喊一句话：“Claude 3.5 发布了，GPT-4o 不香了。”

说实话，这种“狼来了”的话我听得耳朵都起茧子了。毕竟每个月都有新模型说自己是“GPT-4 杀手”，结果实测下来连 GPT-3.5 都打不过。但这次不一样，Anthropic（Claude 的母公司）甚至都没发长篇大论的论文，直接甩出了一个模型：Claude 3.5 Sonnet。

这名字就有意思了。之前的 Claude 3 分为 Haiku（快）、Sonnet（中）、Opus（大）。这次直接跳过 3 的迭代，发了 3.5 的“中杯”版本，而且官方宣称：这是目前市面上最聪明的模型之一。

我赶紧爬起来实测了一下。首先最直观的感受就是快。真的太快了。那种响应速度，让你感觉对面不是在思考，而是在背书。以前用 GPT-4o 生成一段代码，有时候要等个几秒钟在那“转圈圈”，而 Claude 3.5 Sonnet 基本上是字随着光标直接喷涌而出。

根据官方数据，它在推理、数学、编码等方面的表现，直接超过了 GPT-4o 和 Gemini 1.5 Pro。最重要的是，它目前是免费开放的！ 只要你注册了 Claude 账号，就能直接用。这对咱们普通用户来说，绝对是白嫖的快乐。

---

二、Artifacts：这才是真正的“生产力革命”

如果说速度和智商只是“量变”，那么 Artifacts 功能绝对是“质变”。这也是我觉得最值得跟大家细说的功能。

以前我们用 ChatGPT 或者其他 AI，更像是在“聊天”。你问，它答。如果让它写代码，它会给你一坨代码块，你得自己复制、粘贴、保存、运行。如果让它画图，它给你个链接或者 Markdown 代码，你还是得自己折腾。

但 Claude 3.5 的 Artifacts 做到了什么？它把对话窗口变成了一个“工作台”。

举个我刚才测试的例子。我对它说：“帮我写一个贪吃蛇游戏的网页代码。”

如果是以前的 AI，它会给你一堆 HTML 和 JS 代码。但在 Claude 3.5 里，屏幕右侧会突然弹出一个独立的预览窗口。代码写完的一瞬间，那个贪吃蛇游戏直接就在右边运行起来了！

我可以直接在右边玩游戏，甚至可以实时修改。我说：“把蛇的颜色改成红色，背景改成黑色。”话音刚落，右边的画面立马更新。

这就意味着，AI 不再只是一个“建议者”，它变成了一个“执行者”。这对职场人意味着什么？

* 做图表：你把 Excel 数据扔给它，它直接在右边生成一个可视化的柱状图，你可以直接截图放进 PPT。

* 写文档：你让它写个活动策划案，它直接在右边生成一个排版好的预览页，而不是一堆乱七八糟的 Markdown 文本。

* 写代码：前端开发的同学，甚至可以直接在预览窗口里调试简单的组件。

这种“所见即所得”的体验，是目前 GPT-4o 都没有的。这才是 AI 走向生产力工具的关键一步。

---

三、实测对比：写代码、写文案，到底谁更强？

光说不练假把式。为了验证它是不是真的“封神”，我做了两个小测试。

1. 代码能力：不再是“伪代码”

我给 Claude 3.5 和 GPT-4o 出了同一个题目：“用 Python 写一个脚本，自动整理下载文件夹里的文件，按照图片、文档、压缩包分类。”

GPT-4o 的表现：给出了代码，逻辑是对的，但是它引用了一个 `shutil` 库，却没处理文件名重复的异常情况。我运行了一下，遇到同名文件直接报错。我反馈给它，它才道歉并修改。

Claude 3.5 Sonnet 的表现：它不仅给出了代码，还在代码里预先写好了异常处理。它甚至贴心地加了注释：“如果文件夹不存在，会自动创建；如果文件名重复，会自动重命名。”

这就是“经验丰富”和“刚毕业实习生”的区别。Claude 3.5 的代码更像是老手写的，考虑到了实际运行中的坑。

2. 中文理解力：更懂“人话”

我又让它俩写一段文案。题目是：“给一个不想上班的打工人写一段心理独白，要带点自嘲和幽默，不要太丧。”

GPT-4o 写的：“啊，早晨的闹钟又响了。我不想起床，被窝是我的避风港……”（有点像小学生作文，略显生硬）。

Claude 3.5 写的：“闹钟响的那一刻，我悟了。我和我的床，才是真爱。至于上班？那只是为了给我的猫赚猫粮，顺便维持我体面人类的身份。只要我摸鱼的速度够快，老板的 PPT 就追不上我。”

说实话，看到“摸鱼”和“PPT”这种词用得这么地道，我甚至怀疑Anthropic 是不是偷偷训练了中文互联网语料。它对中文语境的把握，真的比 GPT-4o 要更接地气，更有“网感”。

---

四、普通人怎么用？手把手教你上手

看到这里，估计很多朋友手痒了。别急，二筒这就给大家整理一份保姆级上手指南。

1. 如何访问？

目前 Claude 3.5 Sonnet 已经向所有用户开放。

* 网址：直接搜索 `Claude.ai`。

* 注册：你需要一个魔法上网环境（懂的都懂），以及一个国外手机号（或者通过某些接码平台）。

* 免费额度：免费用户每天有一定的对话次数限制，但对于日常轻度使用完全够用。

2. 实用技巧：善用“角色扮演”

因为 Claude 3.5 的逻辑能力很强，建议大家在提问时，给它一个具体的“人设”。

比如，不要只说“帮我改一下这段话”，要说：

> “你现在是一位拥有 10 年经验的新媒体编辑，擅长爆款标题和情绪引导。请帮我修改这段文案，让它更适合发在小红书上，语气要活泼，多用 emoji。”

你会发现，加上人设后，它的输出质量会有质的飞跃。

3. 玩转 Artifacts

如果你想体验那个神奇的预览窗口，只需要在指令里加上几个关键词：

* “生成一个网页……”

* “画一个 SVG 图标……”

* “创建一个可视化的图表……”

只要涉及到代码生成或可视化，它大概率会自动触发 Artifacts 窗口。你可以直接在右边看到结果，不需要自己再跑一遍代码。

---

总结

Claude 3.5 Sonnet 的发布，确实给了 OpenAI 一记重拳。它证明了，AI 的竞争不仅仅是参数大小的竞争，更是用户体验的竞争。

Artifacts 功能的出现，让 AI 从“聊天框”里走了出来，变成了一个真正的“副驾驶”。对于我们普通职场人来说，这是一个巨大的利好。我们不需要懂代码，不需要懂复杂的提示词工程，只要会说话，就能让 AI 帮我们干活。

有人问：GPT-4o 还值得充钱吗？ 我觉得目前来看，如果你主要做图文创作、代码辅助，Claude 3.5 可能是更好的选择；但如果你需要语音对话、实时视频交互，GPT-4o 依然有优势。

AI 的发展真的太快了，上个月还是 GPT 的天下，这个月 Claude 就反超了。作为普通人，我们最好的策略就是：保持好奇，多去尝试。 毕竟，这些工具最终都是为了解放我们的双手，让我们有更多时间去享受生活（或者摸鱼）。

你试用过 Claude 3.5 了吗？感觉比 GPT-4o 怎么样？欢迎在评论区留言分享你的体验！

---

*我是二筒，关注「AI 原来如此」，带你用最通俗的语言，看懂最硬核的 AI 科技。下期见！*

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

DeepSeek-V4 RAG 分块策略优化：512 vs 1024 token 的实测边界与工程取舍

DeepSeek技术社区

企业知识库问答中的权限迷宫：如何用 DeepSeek 实现文档级 ACL 下沉与安全召回

DeepSeek技术社区

RAG 文档预处理：为什么 90% 的失败案例源于切分策略不当

DeepSeek技术社区

所有评论(0)

查看更多评论

qq350861146

@qq350861146

已为社区贡献10条内容

Claude 3.5一夜封神？实测碾压GPT-4

qq350861146

🚀 Claude 3.5一夜封神？实测碾压GPT-4

摘要

一、半夜惊雷：AI 界的“新王”登基

二、Artifacts：这才是真正的“生产力革命”

三、实测对比：写代码、写文案，到底谁更强？

1. 代码能力：不再是“伪代码”

2. 中文理解力：更懂“人话”

四、普通人怎么用？手把手教你上手

1. 如何访问？

2. 实用技巧：善用“角色扮演”

3. 玩转 Artifacts

总结

所有评论(0)

温馨提示：您尚未绑定手机号

qq350861146