2025年,被视为智能体落地的元年!
在这里插入图片描述

1. 智能体(AI Agent)概述

1.1 智能体举例

在这里插入图片描述
Hyperwrite 研发的智能体个人助理插件实现自动预订航班机票。
在这里插入图片描述
“林间聊愈室”上线后获得了大量好评, App Store评分4.7,多数用户给出了五星好评。
在这里插入图片描述
ShopSpot多模态智能体图片识别功能展示
在这里插入图片描述
在这里插入图片描述

1.2 如何看待智能体

OpenAI 总裁 Brockman 认为 2025年将是智能体(agents)之年。
联想认为,AI 智能体将会是下一个重要的 AI 发展趋势,可以了解客户、 懂客户、为客户工作,从被动变为主动。
中国工程院院士邬贺铨指出,AI Agent是大模型落地载体的关键作用。
比尔盖茨、吴恩达等多位AI领域的知名专家均公开表示:AI Agent是重要发展方向。
智谱AI CEO张鹏:AI Agent是通往AGI(通用人工智能)的重要一步,是一种未来真正的人机交互方式,也就是让机器来适应人。
百度创始人、董事长兼首席执行官李彦宏更是直言:Agent是我们最看好的AI应用发展方向。

智能体在自主能力、决策能力、协作交互等方面展现出优势,弥补了大模型的不足,是未来大模型最主流的使用方式。
在这里插入图片描述

1.3 智能体的发展阶段

在这里插入图片描述

1.4 国内大模型厂家推出的智能体

在这里插入图片描述

1.4 国内大模型厂家推出的智能体

在这里插入图片描述

1.5 智能体的应用领域

在这里插入图片描述

1.6 到底智能体是什么

早期理解

智能体(AI Agent、人工智能代理)的概念最早在1986年由被誉为“AI之父”的马文·明斯基(Marvin Minsky)在《意识社会》(The Society of Mind)中提出。

明斯基定义的智能体的核心要素:

  • 要素1:分布式智能体集合
  • 要素2:层级协作机制
  • 要素3:无中央控制

1.6 到底智能体是什么

现代理解

OpenAI的元老翁丽莲于2023年6月在个人博客首次提出了现代AI Agent架构。

智能体(AI Agent)是一种能够自主行动、感知环境、 做出决策并与环境交互的计算机系统或实体,通常依赖大型语言模型作为其核心决策和处理单元,具备独立思考、 调用工具去逐步完成给定目标的能力。

文章链接如下:https://lilianweng.github.io/posts/2023-06-23-agent/

智能体架构
在这里插入图片描述
在这里插入图片描述

1.7 智能体核心要素

核心要素1:大模型(LLM)

大模型作为“大脑”:提供推理、规划和知识理解能力,是AI Agent的决策中枢。
在这里插入图片描述

核心要素2:记忆(Memory)

短期记忆:存储单次对话周期的上下文信息,属于临时信息存储机制。受限于模型的上下文窗口长度。
在这里插入图片描述

长期记忆:可以横跨多个任务或时间周期,可存储并调用核心知识,非即时任务。

长期记忆,可以通过模型参数微调(固化知识)、知识图谱(结构化语义网络)或向量数据库(相似性检索)方式实现。

核心要素3:工具使用(Tool Use)

工具使用:调用外部工具(如API、数据库)扩展能力边界。
在这里插入图片描述
核心要素4:规划决策(Planning)

规划决策:通过任务分解、反思与自省框架实现复杂任务处理。例如,利用思维链(Chain of Thought)将目标拆解为子任务,并通过反馈优化策略。

核心要素5:行动(Action)

行动:实际执行决策的模块,涵盖软件接口操作(如自动订票)和物理交互(如机器人执行搬运)。比如:检索、推理、编程等。

在这里插入图片描述

2. 搭建企业私有/个人知识库

2.1 哪些人需要搭建个人知识库

小型企业主或创业者:查阅和分享文件、文档、客户反馈、市场分析,大大提升你的工作效率。

职场打工人或自由职业者:无论是写作、设计、开发,还是视频制作,知识库都可以管理大量的素材、创意和客户需求,通过知识库,你可以轻松存储和搜索这些资料,并通过大模型二次创作

教育工作者或学生:利用知识库管理教学资源、课程安排、教材资料等,学生则可以将课堂笔记、参考书目和作业整理在一起,随时复习和备考。

生活中的普通人:无论是旅行计划、兴趣爱好,还是学习笔记,全部都可以集中在知识库管理。

2.2 哪些平台支持个人知识库

AnythingLLM

在这里插入图片描述
Dify

在这里插入图片描述

MaxKB

在这里插入图片描述
秘塔搜索在线: https://metaso.cn/
在这里插入图片描述
知乎直达:https://zhida.zhihu.com/pro

在这里插入图片描述

2.3 Cherry-Studio搭建个人知识库

搭建过程:

https://blog.csdn.net/su2231595742/article/details/148513974

2.4 ima搭建个人知识库

搭建过程:

https://blog.csdn.net/su2231595742/article/details/148514703

2.5 执行流程

在这里插入图片描述
在这里插入图片描述

2.6 RAG的理解

1、什么是RAG

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索(Retrieval)与文本生成(Generation)的技术,旨在提升大语言模型在回答专业问题时的准确性和可靠性。

2、为什么需要RAG

场景1:

大型语言模型(LLM)的训练依赖于网络上海量公开的静态数据,而某些特定领域(如企业内部资料、专有技术文档等)的数据通常不会作为公开的训练数据,导致模型在面对这些领域的查询时,可能因缺乏足够的信息而生成不准确甚至虚构的回复。

解决方案:

为了解决这一问题,RAG技术通过引入向量数据库(Vector Database)作为外部知识源,将模型缺失的知识以结构化的形式提供。

在这里插入图片描述
场景2:

随着 LLM 规模扩大,训练成本与周期相应增加。因此,包含最新信息的数据难以融入模型训练过程,无法及时反映最新的信息或动态变化。导致 LLM 在应对诸如“请推荐当前热门影片”等时间敏感性问题。

解决方案:提供联网搜索功能。
在这里插入图片描述
举例:

LLM在考试的时候面对陌生的领域,答复能力有限,然后就准备放飞自我了,而此时RAG给了一些提示和思路,让LLM懂了开始往这个提示的方向做,最终考试的正确率从60%到了90%!
在这里插入图片描述

3. 低阶智能体的搭建

3.1 智能体的三个发展阶段

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.2 阶段1:预设提示词创建简易版智能体

Cherry-Studio中创建智能体

在这里插入图片描述

其它平台:豆包

在这里插入图片描述
其它平台:讯飞星火

在这里插入图片描述
其它平台:百度文心智能体平台 https://agents.baidu.com/center

在这里插入图片描述
其它平台:腾讯元器 https://yuanqi.tencent.com/agent-shop

在这里插入图片描述

4. 高阶智能体的三种搭建

4.1 高阶智能体:通过Cline体现智能体

Cline是VS Code的插件,可以通过调用LLM的API实现自动化开发,可被视为用于开发智能体。

搭建及使用过程:https://blog.csdn.net/su2231595742/article/details/148515640

4.2 高阶智能体:通过Coze创建智能体

Coze(扣子)的介绍

字节跳动旗下的 AI 聊天机器人开发平台,致力于为用户提供快速且易于上手的聊天机器人搭建方案。

扣子官网:https://www.coze.cn/

搭建及使用过程:Coze搭建工作流

4.3 高阶智能体:通过Dify创建智能体

Dify 的介绍

Dify(DefineModify)是一个开源的大语言模型(LLM)应用开发平台,由苏州语灵人工智能推出。

Dify 直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让用户可以快速从原型到生产,构建AI应用。

Dify 为 AI Agent 提供了50多种内置工具,如谷歌搜索、DALL·E、Stable Diffusion 和WolframAlpha 等。

适用人群:专业技术人员、非技术人员

官网:https://dify.ai/zh

在线应用网址:https://cloud.dify.ai/apps

说明:https://github.com/langgenius/dify/blob/main/README_CN.md

搭建及使用过程:

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐