进入7月,各家AI厂商的更新节奏丝毫没有放缓。这周有几个功能对开发者影响很大:ChatGPT终于支持代码执行了,Claude搞了个网页实时预览,Gemini把深度研究功能开放给了所有付费用户。周末逐一做了深度体验,下面聊聊实际感受。
在这里插入图片描述

一、ChatGPT上线代码执行:对标Gemini和Claude的迟到功能

OpenAI这周给Plus用户推送了代码执行功能。之前ChatGPT只能生成代码,运行得靠Code Interpreter切到沙箱环境。现在直接在对话中就能执行Python代码并展示结果。

实际体验

数据分析场景。 上传了一份销售数据CSV,让它分析趋势并画图。ChatGPT自动写Python代码、执行、生成图表,整个流程在对话中一气呵成,不需要切换到Code Interpreter模式。

算法验证场景。 描述了一个排序逻辑,让它实现并跑测试用例。几秒钟出结果,修改参数后重跑也很流畅。

学习场景。 让它解释装饰器的概念,它自动运行了几个示例代码展示不同场景下的输出,学习体验比纯文字好很多。

和Gemini代码运行的对比

特性 ChatGPT Gemini
支持语言 Python为主 Python为主
执行速度 快,偶尔排队 快,几乎不排队
可视化 图表类型丰富 基础图表
文件处理 支持CSV、JSON、Excel等 支持CSV、JSON
生态整合 独立环境 Google Drive深度整合

ChatGPT的可视化能力更强,图表类型更丰富。Gemini胜在执行速度稳定,而且和Google Drive的整合让文件处理更便捷。

一个实际建议: 日常数据分析用ChatGPT,涉及Google生态文件时用Gemini,两者互补。

二、Claude推出网页实时预览:前端开发的利器

Anthropic这周给Claude上线了网页实时预览功能。在Claude中生成的前端代码,可以直接在对话旁边的预览窗口中看到渲染效果。

实际体验

我测了几个场景:

场景一:组件开发。 让Claude写一个Vue3的数据表格组件,写完代码后预览窗口立刻展示了表格的渲染效果。修改样式、调整列宽都能实时看到变化。

场景二:页面原型。 描述了一个后台管理页面的布局需求,Claude生成HTML+CSS代码后,预览窗口直接展示了完整的页面效果。做原型验证效率极高。

场景三:Bug调试。 写了一段有CSS布局问题的代码,预览窗口中能直观看到问题表现,结合Claude的代码分析能力,定位问题比纯看代码快很多。

和ChatGPT Artifacts的对比

ChatGPT的Artifacts功能也能预览前端代码,但Claude的预览窗口更大、刷新更快,而且支持响应式预览——可以切换手机、平板、桌面三种视图。

对于前端开发者来说,Claude的实时预览功能是目前体验最好的。Artifacts更多是“附带看看”,Claude的预览更像一个轻量级的在线IDE预览。

三、Gemini深度研究全面开放

Google本周把Deep Research功能开放给了所有Gemini Advanced用户,之前只对部分用户灰度测试。

Deep Research能做什么

开启深度研究模式后,Gemini会用多轮搜索和分析,自动生成一份结构化的调研报告,包含信息来源引用。和普通搜索的区别:

  • 普通搜索:给一个简短的回答+几个链接
  • 深度研究:多轮搜索→信息筛选→交叉验证→生成结构化报告,整个过程持续1-3分钟

实测案例

我让它调研“2026年微服务架构的最新实践趋势”,3分钟后输出了一份包含以下结构的报告:

  1. 当前微服务的主流技术栈
  2. 服务网格的最新发展
  3. 无服务器与微服务的融合趋势
  4. 可观测性工具对比
  5. 业界实践案例(附来源链接)

报告质量相当于一个初级分析师半天的工作量。每条结论都有引用来源,可以直接追溯验证。

使用建议: 适合技术选型、竞品分析、行业调研等需要深度信息整合的场景。日常简单问题没必要开启,用普通搜索就够了。

四、Grok上线了图片理解能力

xAI这周给Grok加入了多模态图片理解功能。之前Grok主要是文本和实时搜索,现在可以上传图片让Grok分析内容了。

实际体验

场景一:截图分析。 上传一张报错截图,Grok能准确识别错误信息并给出修复建议。

场景二:UI识别。 上传一个App界面截图,Grok能分析界面布局、识别组件类型,甚至推测使用的技术栈。

场景三:图表解读。 上传一张复杂的架构图,Grok能识别图中的组件和关系,生成文字描述。

和ChatGPT、Gemini的多模态能力相比,Grok的图片理解目前还比较基础,复杂场景的识别准确率略低。但作为后来者,起点不低。而且Grok的优势在于可以结合X平台数据做分析——比如上传一张产品截图,它能同时搜索X上关于这个产品的讨论。

五、我的最新工具使用方案

结合近期更新,工具分工进一步细化:

工具 版本 月费 核心场景 本周变化
ChatGPT Plus 付费 $20 主力编码、代码执行、日常问答 新增代码执行
Claude Pro 付费 $20 长文档分析、前端预览、架构审查 新增网页预览
Gemini Advanced 付费 $20 深度研究、多模态、Google生态 深度研究全面开放
Grok 按需 实时搜索、图片分析 新增图片理解

月均总投入约$60,覆盖了编码、执行、预览、研究、搜索、多模态六个场景。

各场景的工具选择速查

任务 首选 原因
写代码 ChatGPT 综合能力最强
前端开发 Claude 实时预览太好用
Python数据分析 ChatGPT 可视化图表最丰富
深度调研 Gemini 深度研究报告质量高
Google生态操作 Gemini Drive/Gmail整合独一份
长文档分析 Claude 200K上下文无敌
实时热点追踪 Grok X平台数据最快

六、关于使用门槛

功能越来越多,但门槛也在同步提高。这周ChatGPT代码执行功能上线后,Plus的性价比又提升了。但OpenAI对支付风控的收紧趋势没变,虚拟卡的存活周期越来越短。

对于还在观望的朋友,几点建议:

  • 只选一个:ChatGPT Plus,$20/月,场景最广
  • 再加一个:Claude Pro,$20/月,长文档和前端预览很强
  • 预算充裕:补Gemini Advanced,$20/月,深度研究和Google生态有独特价值
  • 账号和支付:对于不便自行处理海外支付与账号注册的开发者,可通过一站式服务平台 gpt108.com 获取 ChatGPT、Claude、Gemini、Grok 等主流 AI 工具的成品号与代充服务。该平台运营稳定,长期验证可靠,能够帮助开发者省去繁琐的门槛环节,将精力集中于核心开发工作。

七、总结

7月第一周的更新,几个要点:

  1. ChatGPT补齐了代码执行,数据分析场景体验大幅提升
  2. Claude的前端实时预览是目前同类产品中体验最好的,前端开发强烈推荐
  3. Gemini深度研究全面开放,技术调研场景有了新的高效工具
  4. Grok加入多模态,虽然起步晚但在追赶

工具越来越好,组合使用已经成为必然。核心建议不变:先解决“能用上”的问题,再研究“怎么用好”。


(本文内容基于个人实际使用体验整理,供大家参考)

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐