前言

随着Chat GPT的横空出世,时至今天,LLM大模型已经进入了百花齐放的阶段。基于LLM大模型和AI工作流的发展,现在终于进入了AI Agent的时代。或许你已经从各种渠道了解到了AI Agent这个词,但是对于这个概念,要么解释的太过技术性,让你无法抓到他的本质。要么就是东拼西凑,不知所云。

其实知识的传递永远是要朴素与易解的,深蓝序列对AI Agent的解释就两句话:

  1. AI Agent:AI任务引擎,人类设定目标,无需监控或反复询问,AI 将主动完成整个过程。
  2. Agent翻译过来就是代理,AI Agent即AI代理了人类成为任务的决策者。

图 1

好了,你已经了解什么是AI Agent了。不过,先别急着划过,如果你想在深入了解些。接下来的内容,就是为了像我这样不太懂技术,又经常使用AI的人准备的!如果你想足够了解AI Agent,可以看完它。

我们将遵循事物发展的逻辑,顺序串联起你已经了解的大语言模型、AI工作流、到最终理解AI Agent。

放心!绝对没有一带而过的行业黑话来设置学习壁垒。

AI Agent的由来

从大规模语言模型(LLM)到智能工作流(RAG),再到 AI Agent,让你通俗易懂地领会它们的区别与演进:

LLM(大语言模型)

LLM(Large Language Model,大型语言模型)是基于深度学习技术构建的超大规模自然语言处理模型,通过海量文本数据训练获得对语言规律的深度理解能力,能够生成、理解和推理人类语言。

图 2

相信你在工作、学习中已经在使用了,像chat GPT、deepseek文心一言通义千问、豆包等等这些创建于LLM之上的应用。他们可以基于庞大的数据和机器学习来解答你的问题,辅助你学习和工作。

但是,LLM就有一个问题:LLM是基于现有的知识和数据的。

比如:我让deepseek帮我写一份邮件,邮件内容是明天我要请个假,理由是我要参加孩子的家长会。当然,我还可以要求它语气客气点。

分分钟,它就生成好了一份请假邮件。领导看了绝对舍不得反驳。

但是,如果我问deepseek我下次请假是什么时候,他是肯定不知道的,因为它不知道我私人信息

这就突出LLM的两个特点:

  1. 它所掌握的数据是公共的
  2. 它不了解我个人的,或者公司私有的信息

记住这两点!

AI工作流

进入到AI应用的第二级!

还是上面的例子,如果我问deepseek,下次请假是什么时候?它一定很懵逼!!

于是,我让它可以访问我的日历行程应用,那么它就知道不久后的一天是我和妻子的结婚纪念日,它回答我这天该请假了,好好陪陪老婆去逛街看电影。

但是,这个时候我可会再问,那天的天气怎么样?适不适合在户外活动?

这时候deepseek又犯难了,因为它访问的日历信息里面,没有关于天气的内容。这个时候,我让deepseek可以通过API访问天气应用。

它就可以继续回答我的问题了!

这就是AI工作流的特征,deepseek在回答问题前会有信息检索的步骤,当然无论这个步骤有多少,它也只是一个AI工作流。

图 3

上面提到的,就是我们提到的RAG,检索增强生成。很花里胡哨的术语,通过我们前面的例子,你就应该理解的,RAG就是帮助语言模型在回答问题前先查找相关内容的过程。

AI Agent

通过前两个AI场景的晋级,终于来到了AI Agent时代了!

还是上面的例子的延展:

我给AI一个任务,关注我的行程主动去帮我请假,这样我在有事的时候就不会忘记请假了!

于是,我把这个想法作为最终目标输入给AI,AI要完成这个目标会执行下面着几步

1.思考怎么完成这个任务

2.使用工具来获取要完成这个任务的信息

3.开始执行任务

这个过程中,作为人类的我不会干预AI。于是人类作为决策者的角色被AI取代了,AI会决定什么时候该请假,

并写好请假邮件,发送给我的领导,并提醒我休假。

这就是前面说的:

Agent翻译过来就是代理,AI代理的人类成为决策者

于是AI工作流就升级为了AI Agent!

好了,最终我们来总结、对比下RAG和AI Agent,彻底打通你的思维枷锁

图 4

至此你应该了解什么是AI Agent!

后面我还会分享一些AI Agent项目!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐