0代码0基础,小白搭建智能体&知识库DeepSeek|Coze|Dify|RAG
0代码0基础,小白搭建智能体&知识库DeepSeek|Coze|Dify|RAG
2025年,被视为智能体落地的元年!
1. 智能体(AI Agent)概述
1.1 智能体举例
Hyperwrite 研发的智能体个人助理插件实现自动预订航班机票。
“林间聊愈室”上线后获得了大量好评, App Store评分4.7,多数用户给出了五星好评。
ShopSpot多模态智能体图片识别功能展示
1.2 如何看待智能体
OpenAI 总裁 Brockman 认为 2025年将是智能体(agents)之年。
联想认为,AI 智能体将会是下一个重要的 AI 发展趋势,可以了解客户、 懂客户、为客户工作,从被动变为主动。
中国工程院院士邬贺铨指出,AI Agent是大模型落地载体的关键作用。
比尔盖茨、吴恩达等多位AI领域的知名专家均公开表示:AI Agent是重要发展方向。
智谱AI CEO张鹏:AI Agent是通往AGI(通用人工智能)的重要一步,是一种未来真正的人机交互方式,也就是让机器来适应人。
百度创始人、董事长兼首席执行官李彦宏更是直言:Agent是我们最看好的AI应用发展方向。
智能体在自主能力、决策能力、协作交互等方面展现出优势,弥补了大模型的不足,是未来大模型最主流的使用方式。
1.3 智能体的发展阶段
1.4 国内大模型厂家推出的智能体
1.4 国内大模型厂家推出的智能体
1.5 智能体的应用领域
1.6 到底智能体是什么
早期理解
智能体(AI Agent、人工智能代理)的概念最早在1986年由被誉为“AI之父”的马文·明斯基(Marvin Minsky)在《意识社会》(The Society of Mind)中提出。
明斯基定义的智能体的核心要素:
- 要素1:分布式智能体集合
- 要素2:层级协作机制
- 要素3:无中央控制
1.6 到底智能体是什么
现代理解
OpenAI的元老翁丽莲于2023年6月在个人博客首次提出了现代AI Agent架构。
智能体(AI Agent)是一种能够自主行动、感知环境、 做出决策并与环境交互的计算机系统或实体,通常依赖大型语言模型作为其核心决策和处理单元,具备独立思考、 调用工具去逐步完成给定目标的能力。
文章链接如下:https://lilianweng.github.io/posts/2023-06-23-agent/
智能体架构
1.7 智能体核心要素
核心要素1:大模型(LLM)
大模型作为“大脑”:提供推理、规划和知识理解能力,是AI Agent的决策中枢。
核心要素2:记忆(Memory)
短期记忆:存储单次对话周期的上下文信息,属于临时信息存储机制。受限于模型的上下文窗口长度。
长期记忆:可以横跨多个任务或时间周期,可存储并调用核心知识,非即时任务。
长期记忆,可以通过模型参数微调(固化知识)、知识图谱(结构化语义网络)或向量数据库(相似性检索)方式实现。
核心要素3:工具使用(Tool Use)
工具使用:调用外部工具(如API、数据库)扩展能力边界。
核心要素4:规划决策(Planning)
规划决策:通过任务分解、反思与自省框架实现复杂任务处理。例如,利用思维链(Chain of Thought)将目标拆解为子任务,并通过反馈优化策略。
核心要素5:行动(Action)
行动:实际执行决策的模块,涵盖软件接口操作(如自动订票)和物理交互(如机器人执行搬运)。比如:检索、推理、编程等。
2. 搭建企业私有/个人知识库
2.1 哪些人需要搭建个人知识库
小型企业主或创业者:查阅和分享文件、文档、客户反馈、市场分析,大大提升你的工作效率。
职场打工人或自由职业者:无论是写作、设计、开发,还是视频制作,知识库都可以管理大量的素材、创意和客户需求,通过知识库,你可以轻松存储和搜索这些资料,并通过大模型二次创作
教育工作者或学生:利用知识库管理教学资源、课程安排、教材资料等,学生则可以将课堂笔记、参考书目和作业整理在一起,随时复习和备考。
生活中的普通人:无论是旅行计划、兴趣爱好,还是学习笔记,全部都可以集中在知识库管理。
2.2 哪些平台支持个人知识库
AnythingLLM
Dify
MaxKB
秘塔搜索在线: https://metaso.cn/
知乎直达:https://zhida.zhihu.com/pro
2.3 Cherry-Studio搭建个人知识库
搭建过程:
https://blog.csdn.net/su2231595742/article/details/148513974
2.4 ima搭建个人知识库
搭建过程:
https://blog.csdn.net/su2231595742/article/details/148514703
2.5 执行流程
2.6 RAG的理解
1、什么是RAG
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索(Retrieval)与文本生成(Generation)的技术,旨在提升大语言模型在回答专业问题时的准确性和可靠性。
2、为什么需要RAG
场景1:
大型语言模型(LLM)的训练依赖于网络上海量公开的静态数据,而某些特定领域(如企业内部资料、专有技术文档等)的数据通常不会作为公开的训练数据,导致模型在面对这些领域的查询时,可能因缺乏足够的信息而生成不准确甚至虚构的回复。
解决方案:
为了解决这一问题,RAG技术通过引入向量数据库(Vector Database)作为外部知识源,将模型缺失的知识以结构化的形式提供。
场景2:
随着 LLM 规模扩大,训练成本与周期相应增加。因此,包含最新信息的数据难以融入模型训练过程,无法及时反映最新的信息或动态变化。导致 LLM 在应对诸如“请推荐当前热门影片”等时间敏感性问题。
解决方案:提供联网搜索功能。
举例:
LLM在考试的时候面对陌生的领域,答复能力有限,然后就准备放飞自我了,而此时RAG给了一些提示和思路,让LLM懂了开始往这个提示的方向做,最终考试的正确率从60%到了90%!
3. 低阶智能体的搭建
3.1 智能体的三个发展阶段
3.2 阶段1:预设提示词创建简易版智能体
Cherry-Studio中创建智能体
其它平台:豆包
其它平台:讯飞星火
其它平台:百度文心智能体平台 https://agents.baidu.com/center
其它平台:腾讯元器 https://yuanqi.tencent.com/agent-shop
4. 高阶智能体的三种搭建
4.1 高阶智能体:通过Cline体现智能体
Cline是VS Code的插件,可以通过调用LLM的API实现自动化开发,可被视为用于开发智能体。
搭建及使用过程:https://blog.csdn.net/su2231595742/article/details/148515640
4.2 高阶智能体:通过Coze创建智能体
Coze(扣子)的介绍
字节跳动旗下的 AI 聊天机器人开发平台,致力于为用户提供快速且易于上手的聊天机器人搭建方案。
扣子官网:https://www.coze.cn/
搭建及使用过程:Coze搭建工作流
4.3 高阶智能体:通过Dify创建智能体
Dify 的介绍
Dify(DefineModify)是一个开源的大语言模型(LLM)应用开发平台,由苏州语灵人工智能推出。
Dify 直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让用户可以快速从原型到生产,构建AI应用。
Dify 为 AI Agent 提供了50多种内置工具,如谷歌搜索、DALL·E、Stable Diffusion 和WolframAlpha 等。
适用人群:专业技术人员、非技术人员
在线应用网址:https://cloud.dify.ai/apps
说明:https://github.com/langgenius/dify/blob/main/README_CN.md
搭建及使用过程:
更多推荐
所有评论(0)