大模型本地部署：DeepSeek+dify 本地知识库：高级应用Agent+工作流

工作流通过将复杂的任务分解成较小的步骤（节点）降低系统复杂度，减少了对提示词技术和模型推理能力的依赖，提高了 LLM 应用面向复杂任务的性能，提升了系统的可解释性、稳定性和容错性。一个完整的工作流，必须具备。

python_知世

3115人浏览 · 2025-03-22 10:55:34

python_知世 · 2025-03-22 10:55:34 发布

dify的强大在于其灵活性，主要体现在智能体和工作流上。它可以让一个没有编程能力的人通过简单学习，快速搭建Agent和自动化流程。就像拼积木一样。

我们可以通过智能体或工作流，自定义工具完成很多我们好玩的功能。本文前面主要是介绍一些组件，有编程能力的同学建议直接跳过。

报文篇幅较长，简单说下内容：

1，dify面板功能的介绍，（重点知识库里的内容）

2，dify工作流介绍，包括主要节点

3，Agent的应用

4，工作流应用

dify 主要功能

dify的主要应用功能已经在导航上显示了。

探索

在这里插入图片描述

在这个模块里，dify给我们内置了一些应用模板，以降低我们的学习使用成本。按照分类已经帮我们罗列好了，我们可以点击对应的分类查询，看中哪个鼠标放上去，点击添加到工作区即可。

工作室

在这里插入图片描述

1工作室主要是当前工作空间下所有应用。
2包含了聊天助手、Agent、工作流等。
通过3我们可以创建应用
通过4我们可以以探索里的模板创建应用
通过5我们可以导入

在 Dify 中，一个“应用”是指基于 GPT 等大语言模型构建的实际场景应用。通过创建应用，你可以将智能 AI 技术应用于特定的需求。

知识库

在这里插入图片描述

我们可以在知识库中上传企业或个人的文件资料，上传后通过设置分段格式向量化文档，

在2的位置我们可以创建知识库，可以是选择文档，也可以选择同步Notion或同步web站点
通过3我们可以让dify使用外部知识库，不过用外部知识库之前，我们得先通过4配置，这个需要一定研发能力。

外部知识库的功能是我比较看中的，一般有点规模的企业，我建议自己建向量库，然后都过暴露api给应用平台，这样哪个平台好用我们就换哪个。

个人上传文档的知识库重点在于分段。

excel 分段

excel 如果按照单元格分段，需要把子分段设置为;

在这里插入图片描述

pdf和word分段

中文字分段以。作为分段标识符会比较好，这个需要大家根据自己的文档结构不断地调整。
在这里插入图片描述

使用默认\n句子都被截断了。
在这里插入图片描述

召回测试

在这里插入图片描述

当文档状态1变为可用，我们可以进行召回测试，验证文档的下效果。

在这里插入图片描述

1 我们输入测试问题
2设置检索方式
3 我们可以看到匹配到的内容以及socre,点击查看详情4

在这里插入图片描述

检索设置，我们可以设置向量检索、全文检索、混合检索

我们可以通过不断地测试看下哪种检索方式在这个知识库中效果比较好，然后选择设置对应的方式。

其中需要住下TopK和Score：

TopK 代表按相似分数倒排时召回分段的最大个数。TopK 值调小，将会召回更少分段，可能导致召回的相关文本不全；TopK 值调大，将召回更多分段，可能导致召回语义相关性较低的分段使得 LLM 回复质量降低。
召回阈值（Score）代表允许召回分段的最低相似分数。 召回分数调小，将会召回更多分段，可能导致召回相关度较低的分段；召回分数阈值调大，将会召回更少分段，过大时将会导致丢失相关分段。

工具

在这里插入图片描述

dify的工具是用来扩展LLM能力的，是对外部功能的封装，比如搜索、绘图、飞书、月缺等等。就是没有看到对mysql的调用工具。

工具有dify内置的应用，也有三方工具，也可以自定义工具。

工作流也可以发布为一个工具。

dify工作流（基础介绍）

工作流通过将复杂的任务分解成较小的步骤（节点）降低系统复杂度，减少了对提示词技术和模型推理能力的依赖，提高了 LLM 应用面向复杂任务的性能，提升了系统的可解释性、稳定性和容错性。

一个完整的工作流，必须具备开始和结束两个节点。

Dify 工作流分为两种类型：

Chatflow：面向对话类情景，包括客户服务、语义搜索、以及其他需要在构建响应时进行多步逻辑的对话式应用程序。
Workflow：面向自动化和批处理情景，适合高质量翻译、数据分析、内容生成、电子邮件自动化等应用程序。

变量

在dify中变量一共有三种、分别是系统变量、环境变量和用户变量。

系统变量

系统变量指的是在 Chatflow / Workflow 应用内预设的系统级参数，可以被其它节点全局读取。系统级变量均以 sys 开头。

主要有：

sys.user_id:每个用户在使用工作流应用时，系统会自动向用户分配唯一标识符，用以区分不同的对话用户
sys.app_id：系统会向每个 Workflow 应用分配一个唯一的标识符
sys.workflow_id用于记录当前 Workflow 应用内所包含的所有节点信息
sys.workflow_run_id用于记录 Workflow 应用中的运行情况

chatflow会额外多一些，不做具体解释。

环境变量

环境变量用于保护工作流内所涉及的敏感信息，例如运行工作流时所涉及的 API 密钥、数据库密码等。它们被存储在工作流程中，而不是代码中，以便在不同环境中共享。
在这里插入图片描述

在流程编排的时候，通过1的位置添加。

用户变量

在这里插入图片描述

当我们需要用户传入一些特定的信息的时候，可以通过添加变量来实现，在开始节点对应1的位置添加。

节点

节点是工作流中的关键构成，通过连接不同功能的节点，执行工作流的一系列操作。在dify的工作流中一共有下面几种类型的节点。

在这里插入图片描述

我们可以通过画布左下角的1的位置添加节点和工具

开始节点

在这里插入图片描述

1，所有的节点都可以通过这个位置修改名称，建议改成对应的功能名称

2，通过+号新增变量

3，我们可以选择变量的类型，设置变量名称、长度、是否必填等。

LLM 节点(重点)

具备调用大语言模型的能力。
在这里插入图片描述

这里面有下面这些操作模型选择：通过1可以选择使用哪个模型（模型供应商配置，参考前一篇）

模型参数：通过点击5，弹出区域6，我们可以配置模型的温度、TopP，最大标记、回复格式等。

上下文：在2的位置，我们想向LLM提供的背景信息，内置固定的信息。

提示词：在 3的位置，默认只有一个SYSTEM提示词，我们可以通过4添加消息，来添加USR提示词和ASSISTANT提示词。提示词中我们可以通过{获取变量，通过/获取上下文，

系统提示词我们可以通过7对应的位置自动生成填充。

在这里插入图片描述

我们可以设置失败重试策略。

知识检索（重点）

使用已经创建的知识库。

在这里插入图片描述

1，通过1的位置，设置查询知识库的变量

2，我们2的位置添加知识库

3，通过3的位置设置召回策略

下图为召回策略可设置的参数。

在这里插入图片描述

问题分类

问题分类主要是通过大模型，将用户的问题，进行意图分类，普通的条件分类为a=x 走什么，a=y走什么，都是具体的判断，逻辑。

比如我们通过这个是感知用户售后问题，还是产品使用咨询。然后匹配到相关的知识库。

在这里插入图片描述

通过1 我们可以选择模型
通过2 我们选择用户输入的内容
通过3我们设置分类类型
通过4 我们可以添加分类
通过5 我们可以填写分类提示词

通过分类，我们可以指向不同的知识库。

条件分支（重点）

主要用于流程节点中的逻辑判断。功能也很丰富，自主性特别高。

在这里插入图片描述

通过1 我们可以选择条件的变量
通过2我们可以选择逻辑条件，中文意思很直白了
通过3我们设置条件值
通过4可以添加条件
多个条件的时候，可以通过5 设置条件的逻辑关系
通过6 可以添加其他逻辑

迭代

一般用于多任务的处理（每个任务的处理流程必须一样）。

在这里插入图片描述

1迭代内部可以认为是一个子流程
2 迭代的输入是一个多个任务（数组形式）
3迭代的输出也是一个数组（每个输出包含是哪个输入，可以用于区分）
4 可以开启并行，同时执行几个
5 根据自己的需要，错误了是终结，还是继续

代码执行

代码执行，给我们带来了很大的灵活性，官方给的场景是结构化数据处理，数学计算、拼接数据。

代码的执行是有风险的，为了确保安全，dify使用sandbox执行代码，不能使用消耗大量系统资源或引发安全问题的操作。比如访问文件系统、进行网络请求、执行操作系统级别的命令。

也就意味着不能直接写代码连接数据库了。

在这里插入图片描述

通过123可以添加输入变量（每个节点内的）
通过4我们可以写PYTHON3或JAVASCRIPT代码来执行相应的逻辑
通过5 我们可以设置返回的数据类型
通过6我们可以设置重试机制，也就是失败以后，可以重试几次，以及每次重试之间的时间间隔

模板转换

这个是使用摸版引擎记性数据处理，代码执行也能实现。

变量聚合

将多路分支的变量聚合为一个变量，以实现下游节点统一配置。一般用于多个分支处理。

比如我有两个知识库A和B，我需要同时查A和B，查到以后，我需要将AB的数据整合，然后给大模型，这个就是这个作用。

文档提取器（重要）

用来提取用户上传上来的文档的内容，然后将提取到的文本内容给LLM处理。

在这里插入图片描述

参数提取

从指定的地方获取数据后，将数据结构化。

HTTP请求（重要）

这个让dify具备一切的可能性。

举两个例子：

dify没有权限管理，我们可以在我们的业务系统里给每个人生成一个密钥，通过http调用来鉴权。
dify不能直接连接数据库，我们可以通过暴露接口实现

在这里插入图片描述

Agent应用

在这里插入图片描述

我们在工作室中，通过，从应用模板创建。

在这里插入图片描述

通过1选择Agent
通过2选择旅游

在这里插入图片描述
改下应用名称即可。

我通过kimi把原提示词翻译成了中文，注意变量名，不能翻译
google搜索需要授权，我没有，换个其他的。
通过1删除google搜索插件（最后大家看提示词里，只用了wikipedia_search,但是在跑的时候可以动态切换，应该是有什么机制）
通过2添加插件，
选择3内置下面的4搜索里的5 ![](https://i-blog.csdnimg.cn/img_convert/5d4a09533561cc29d7b875d210b9091a.png) 通过1、2、3`切换下模型

在这里插入图片描述

开场白是英文的，我们通过点击1管理设置下。

在这里插入图片描述

通过1我们可以设置开场白，把英文转成中文

这里也有一些其他的功能，比如语音转文字、使用知识库或搜索的时候，显式源文档的引用
在这里插入图片描述

在wikipedia中没有搜索到，它会自动切换到下一个。

工作流应用

使用场景梳理

使用工作流，首先我们要知道我们要用工作流解决什么问题。梳理出相应的流程，然后再去落地。

我当时想到两个场景：

1,用户输入问题-> 大模型提炼关键词->然后查询数据库->将结果和问题给大模型->输出结果

在这里插入图片描述

2,用户输入问题->同时搜索本地知识库+联网搜索-> 代码整合->大模型推理->输出结果

在实验的过程中，场景1因为沙箱的安全机制，被拦截了，找了下通过改源码，可以解决这个问题，不过沙箱以后就得自己本地打镜像了。

场景2在搜索的时候，没有google和bing的key，用的searchapi遇到dns解析的问题，这个大家在玩的时候只用知识库就行了。然后搜索到返回的几个url链接，还得解析，比较麻烦，最后只连知识库了。

创建工作流

在这里插入图片描述

创建一个空白应用，选择1工作流，填写应用名称2 和描述3,点击4创建

在这里插入图片描述

添加查询入参

因为我们要询问，所以先在开始节点添加一个变量query用来接收我们的询问

在这里插入图片描述

添加知识检索

在这里插入图片描述

增加知识检索节点，并把开始节点的query设置到查询变量1里,点击2的位置添加知识库，通过3可以设置召回策略。

LLM设置

在这里插入图片描述

我们点击上下文，然后可以看到知识检索1的的输出result 2

在这里插入图片描述

设置系统提示词

添加结束节点

在这里插入图片描述

最后流程如下：

在这里插入图片描述

试运行

在这里插入图片描述

1`点击左上角的运行,输入页签`2`，填写问题`3`,点击开始运行`4

在这里插入图片描述

运行结束以后，我们点击跟踪1,可以看到各个节点的执行明细2,可以看到大模型数据结果3。

发布

在这里插入图片描述

我们可以直接运行，也可以发布为工具。

直接运行，直接把链接分享给同事，就能共用。（别忘了防火墙设置。）

在这里插入图片描述

如何零基础入门 / 学习AI大模型？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

想正式转到一些新兴的 AI 行业，不仅需要系统的学习AI大模型。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高

那么我作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，希望可以帮助到更多学习大模型的人！至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

👉 福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点 👈

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

read-normal-img

640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉 福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点 👈

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

企业微信如何使用deepseek-最简单的方法

DeepSeek技术社区

deepseek 关闭思考，在ollama中，在代码中

DeepSeek技术社区

第38次CCF-CSP认证——月票发行（chatgpt5 vs deepseekv3.1）

DeepSeek技术社区

所有评论(0)

查看更多评论

python_知世

@zhishi0000

已为社区贡献51条内容

大模型本地部署：DeepSeek+dify 本地知识库：高级应用Agent+工作流

python_知世

dify 主要功能

探索

工作室

知识库

excel 分段

pdf和word分段

召回测试

工具

dify工作流（基础介绍）

变量

系统变量

环境变量

用户变量

节点

开始节点

LLM 节点(重点)

知识检索（重点）

问题分类

条件分支（重点）

迭代

代码执行

模板转换

变量聚合

文档提取器（重要）

参数提取

HTTP请求（重要）

Agent应用

工作流应用

使用场景梳理

创建工作流

添加查询入参

添加知识检索

LLM设置

添加结束节点

试运行

发布

如何零基础入门 / 学习AI大模型？

全套AGI大模型学习大纲+路线

640套AI大模型报告合集

所有评论(0)

温馨提示：您尚未绑定手机号

python_知世