谷歌睡醒了?Gemini组合拳来袭,这波更新太顶了!

Gemini组合拳来袭

今年以来,谷歌在大模型领域的动作明显加快,简直像开了挂一样!上周,Gemini 2.0 Flash Experimental模型的图像生成功能刷爆朋友圈,让人惊呼“谷歌终于认真了!”

这还没完,今天一早,我又在X(原Twitter)上看到了Gemini的几个重磅更新:Canvas和Audio Overviews。这俩功能简直酷毙了!我赶紧把账号升级到Gemini Advanced,亲自体验了一把。

怎么说呢?感觉谷歌就像突然睡醒了一样,最近发布的新功能,一个比一个惊艳,而且还充分融合了谷歌自家的应用生态,简直是“组合拳”出击!

我知道很多人可能还没来得及体验Gemini的这些新能力,所以今天就给大家做个详细介绍。

OpenAI vs. 谷歌:大模型之战,胜负未分!

想当年,OpenAI凭借ChatGPT一骑绝尘,很多人都预言OpenAI要彻底颠覆谷歌,毕竟ChatGPT确实是新一代的搜索引擎。

但是,最近体验了Gemini的一系列功能之后,我觉得这话有点说早了。没错,OpenAI确实在前面领跑,但谷歌在后面追赶的速度也相当惊人,而且,肉眼可见,差距正在不断缩小。

Gemini Canvas:告别“一问一答”,让AI交互更流畅Gemini Canvas

Gemini这次更新的第一个重磅功能就是:Canvas。

其实,OpenAI在去年10月就发布过类似的功能。简单来说,Canvas突破了聊天机器人“一问一答”的模式,它支持用户在Chat应用中进行更丰富的操作,比如写文章、写代码等等。

我给大家做了个演示图,你们可以直观地感受一下:

我输入提示词:“帮我写一篇文章,总结Gemini最近的更新,要求不少于2000字。减少使用列表式的表达。文风参考MacTalk。”

然后,Canvas就会自动生成一篇初稿。重点来了!这时候,我不需要再把文本复制到另一个编辑器里修改,Canvas直接提供了简洁的编辑功能。

如果我对某一段话不满意,或者想让AI二次调整,只需要选中这段话,Gemini Canvas就会弹出几个按钮,右边的三个按钮从上到下分别是:

  • 更改长度
  • 更改语气
  • 提出修改建议

这个设计我个人非常喜欢,比很多国内文档产品那种选中段落后弹出一长串菜单的设计要简洁高效得多(很多都是参考Notion AI)。

当然,Canvas不仅能写文章,还能写代码。具体我就不演示了,现在这类Vibe Coding的产品太多了。

Gemini Audio Overviews:把文档变成播客,这操作太秀了!

除了Canvas,谷歌还把之前NotebookLM的播客生成功能集成到了Gemini中,这就是Audio Overviews。

只要我们上传一个文件,Gemini就能把它转换成“两个AI主持人之间的播客式讨论”,不过目前只支持英文。

我还没有被灰度到这个功能,下面这张图是X上其他用户的截图。

这功能简直太秀了!以后看文档再也不用费眼睛了,直接听“AI说书”就行了!

三月Gemini更新盘点:谷歌这是要“放大招”?

除了今天上线的这两个功能,我还盘点了下三月份Gemini的其他更新,简直是“放大招”的节奏:

  1. Deep Research功能向所有用户免费开放,并且支持2.0 Flash Thinking(推理模型)。
  2. 2.0 Flash Thinking模型升级,提供100万的上下文窗口。
  3. Personalization功能可以关联Gemini和搜索记录,为用户提供更个性化的建议。
  4. 免费开放Gems功能(自定义AI,可以为某次对话预置提示词和知识)。
  5. Flash Thinking可以关联更多应用,并且通过指令完成复杂任务。
  6. 在AI Studio中上线Gemini 2.0 Flash Experimental的图文生成功能

大模型浪潮:谁能笑到最后?

突然想起上周听Manus创始人肖弘的访谈播客,他提到一位硅谷投资人的观点:

这次大模型浪潮中,大概会有三类选手能够从中获益:

  1. 大公司:他们有钱做模型,而且模型做出来之后,因为自己的生态和渠道都很完善,所以,很快可以闭环。
  2. 独立开发者:Cursor等产品成为新的代码杠杆,同时,模型能力越来越强,这本身也是技术平权。独立开发者只要调API,只要愿意使用好的AI工具,就能获得更好的智能,这在过去从未发生过。
  3. 像OpenAI、Anthropic、DeepSeek这样的大模型创业公司:他们率先完成了技术突破,是整个行业的领头羊(至少一段时间),所以,也最先享受到了对应的红利。比如过去两年,OpenAI收会员订阅费收得多容易…

可惜的是,我没有找到这个观点的出处。如果你知道,记得告诉我。

从目前的情况来看,这位投资人的判断非常准确。

不说国外,我们就看看国内的情况。DeepSeek R1发布之后,AI“六小龙”的日子都不太好过。一方面,自家的模型没办法取得质的突破,没办法拿到对应的技术红利,而且研发新的模型,还需要继续烧钱。

另一方面,商业化受阻,ToC产品收不到钱,API也收不到钱,只能靠定制项目,而且竞争还很激烈。这种情况下,反倒大公司的优势凸显出来。你看,腾讯很快借力DeepSeek R1,完成了C端应用“元宝”的暂时领先,还有字节、百度、阿里等等。

我的判断是,未来一段时间内,大公司会进一步缩短和明星创业公司的模型能力差距。

总结:大模型之战,精彩继续!

总的来说,谷歌Gemini最近的表现让人眼前一亮,大模型领域的竞争也变得更加激烈和有趣。OpenAI的领先地位并非不可撼动,谷歌等大公司正在奋起直追,而独立开发者和大模型创业公司也在寻找自己的机会。

大模型之战,远未结束,好戏才刚刚开始!让我们拭目以待,看看谁能笑到最后!

AI绘画爱好者的福音! ChatTools 不仅能让你体验GPT-4o、Claude 3 Sonnet、DeepSeek-R1、Gemini等前沿大模型,还能让你免费畅玩Midjourney,无限生成精美图片!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐