前言:

随着人工智能的火速发展,AI相关的技术越来越成熟,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。

在这里插入图片描述

一个基于大模型的AI Agent系统可以拆分 LLM(大模型)、记忆(Memory)、任务规划(Planning)以及工具使用(Tool) 的集合。在LLM为基础的AI Agent系统中,大模型为AI Agent系统的大脑负责计算,并需要其他组件进行辅助。

在这里插入图片描述

今天给大家来介绍一款 - 华为云Flexus与开源项目DeepSeek的深度融合产品,为AI Agent的搭建提供了强大的底层能力。而Dify平台作为一站式的大模型应用开发工具,也让智能体的构建更加轻量与灵活。

本文将以华为云主机部署提供的 Dify 平台为核心,结合的DeepSeek V3/R3大模型服务,如何构建一个融合鸿蒙手册的知识库的智能AI智能体,无论个人开发者、知识管理者,还是想提升内容利用效率的普通用户运营人员,都能从中学到知识点。


二、华为云主机Dify-LLM应用开发平台体验:

在成功部署社区版单机部署Dify 平台之后,我们可以开始实际构建一个基于 DeepSeek V3/R3大模型的智能问答AI智能体。在整个实现的过程中覆盖了Dify平台登录、DeepSeek V3/R3模型接入、个人私有知识库构建以及聊天应用的创建,如何能够快速实现搭建一个可用的生成式 AI 智能体。

1.1 华为开发者空间案例介绍:

以在“华为开发者空间”中的云主机为基础搭建Dify-LLM应用平台,为了更好的使用“华为云开通的ModelArts Studio 大模型即服务平台DeepSeek-V3-32K 和 DeepSeek-R1-32K 商用服务的大模型”和Dify功能,本案例中,我们将在华为开发者空间提供的云主机中安装Dify并进行探索相关功能展示。


1.2 华为云空间核心功能演示:

在华为开发者空间,华为云为每个新生态的开发者免费提供一台云主机,每位开发者每年可享有数百小时的云主机使用时长。

云主机预集成CodeArts IDE、代码仓及JDK、Python等运行时插件,解决本地开发环境中配置复杂、稳定性不足和依赖等问题,为开发者提供性能强大、安全、稳定、高效的开发环境,应用场景:

在这里插入图片描述

  • ①. 个人开发者:为开发者提供丰富的开发工具,支持开发者应用构建;
  • ②. 高校师生:支持教师开课、设计实验项目,学生学习课程及开发实践;
  • ③. 开源共创:开发者进行开源适配和开发,完成项目并发布开源仓库和云商店,获得开源激励。

默认机器配置是4核8G的配置,这里我们选择安装Ubuntu 24.04的镜像安装包,点击安装成功后,可以通过两种不同的远程访问方式,主要区别体现在连接目的、交互界面、适用场景和技术实现上:

在这里插入图片描述

  • ①. 进入桌面:为开发者提供丰富的开发工具,支持开发者应用构建。
  • 通过图形化界面远程操作目标计算机的完整桌面环境(如Windows、macOS或Linux桌面)。
  • 用户看到的界面与本地操作相同,可运行图形软件、编辑文件等。
  • 典型工具:Windows远程桌面(RDP)、第三方软件(向日葵、TeamViewer)。
    ‌ - 适用场景‌:远程办公、技术支持、图形化运维。‌
  • ②. 进入远程终端:支持教师开课、设计实验项目,学生学习课程及开发实践。
  • 通过命令行界面(CLI)远程登录目标设备,仅支持文本指令操作(如Linux的SSH、Windows的Telnet)。
  • 无图形界面,只能执行命令、查看文本输出。
  • 典型协议:SSH(安全)、Telnet(明文传输,不安全)。
    ‌ - 适用场景‌:服务器运维、网络设备配置、批量脚本执行。‌

这里可以在Ubuntu系统中,直接安装docker和docker-compose,然后使用-v命令来查看是否安装成功,也可以直接配置一下加速器。

在这里插入图片描述

接下来我们下载dify的链接,可以提示fatal无法访问这个连接,提示“Couldn’t connent to server”,试了几次了都没法成功,那我只能在本地下载这个包下来,然后,上传到开发者云空间中,但是使用wget和curl等相关命令都不可以下载这个云空间的连接,我们只能通过“进入桌面”的方式,从火狐浏览器进行下载成功。

在这里插入图片描述

在火狐浏览器下载完成后,我们再切回到远程终端上,在Downloads目录下面进行解压,我们进入解压的目录中,再到docker目录下面执行docker-compose up -d命令即可下载镜像,最后就会全部起来起来,接下来,就可以使用Dify来进行使用了。

在这里插入图片描述


2.1访问入口初始化Dify平台:

在几分钟进行部署完成后,系统会生成 Dify 平台的访问地址。通过系统提示供的IP地址,即可进入 Dify 的登陆界面,完成后续配置,通过邮箱完成注册,注册成功后登录进入 Dify 控制台。

在这里插入图片描述

登录后,在控制台中,可以看到简洁明了的操作界面,用户将看到一个可视化集成的操作界面,里面分为由4个核心功能模块组成,分别承担不同的职责:

在这里插入图片描述

  • ①. 探索:用于与大模型进行实时对话测试,快速验证模型效果。
  • ②. 工作室:构建聊天机器人或助手的主要区域,可配置提示词、模型、知识库等。
  • ③. 知识库:上传、处理和管理知识文档的模块,支持语义切分与向量化。
  • ④. 工具:用于配置外部API插件、集成第三方服务,支持更复杂的业务拓展。

在这里插入图片描述


2.2创建并配置知识库:

Dify平台提供了丰富的数据处理能力,使用户可以快速构建结构化的知识库体系,为后续智能问答思考提供底层的环境依赖,整个构建过程包含几个关键步骤:从知识库创建、文本处理、索引构建。

在这里插入图片描述

用户登录到Dify平台后,在主界面中间核心功能模块选择“知识库”模块,即可进入知识内容管理界面。点击“创建知识库”按钮,就可以完成基本设置创建成功后,即可进入“选择数据源”功能模块,导入自己的文本数据或通过 Webhook 实时写入数据以增强 LLM 的上下文。

在这里插入图片描述


2.3导入数据源内容:

在“选择数据源”中,Dify平台提供多种导入方式以满足不同场景下的需求,这些方式覆盖了从本地知识文档到在线内容的多种多样的不同来源渠道,使知识库构建过程更具通用性和可拓展性:

在这里插入图片描述

  • ①. 直接导入已有文本:可以上传本地已有文档,实现快速迁移
  • ②. 同步Notion内容:可以绑定Notion账户,实现跨平台笔记同步
  • ③. 同步Web站点:可以支持输入Web页面URL,从指定网站抓取网页内容并转换为可索引的知识片段。

2.4 导入本地知识库文档到OBS对象存储:

在上传文件时,Dify支持识别和处理包括TXT、MARKDOWN、MDX、PDF、HTML、XLSX、XLS、DOCX、CSV、VTT、PROPERTIES、MD、HTM等在内的多种主流文档格式,每个文件不能超过15M。

在这里插入图片描述

这里我们以本地的pdf和word文件来举例,可以直接将单个、多个文件或整个文件夹拖拽上传,系统将自动进行识别和接收(单个文件大小不超过15MB),可以保证文件上传的速度和解析文件的时间。

在这里插入图片描述


2.5 文本分段与索引构建、数据清洗:

在上面我们上传完数据后,平台会自动引导用户进入数据处理环节。Dify的文本处理与索引构建是其知识库功能的核心技术流程,通过智能化的处理方式将原始文档转化为可高效检索的知识体系。系统首先会对上传的各类文档进行自动解析和清洗,包括格式转换、冗余信息过滤等预处理操作。

在这里插入图片描述


2.6 保存并完成知识库创建:

所有数据处理设置完成后,用户点击保存,即可完成整个知识库的创建。系统会自动建立语义向量索引和传统关键词索引,形成混合检索能力,既能理解用户查询的深层含义,又能快速匹配精确术语。

在这里插入图片描述

整个过程实现了高度的自动化,无需人工干预便能将原始文件无缝转换为智能知识库。这一流程不仅高效,而且精准,能够迅速达到毫秒级的检索响应速度,这对于企业文档管理和智能客服等处理海量非结构化数据的场景来说,无疑是巨大的福音。

在这里插入图片描述

整个过程完全是自动化,无需人工干预即可完成从原始文件到智能知识库的转换,最终实现毫秒级的精准检索响应,特别适合企业文档管理、智能客服等需要处理海量非结构化数据的应用场景。

在这里插入图片描述

这里可以随便点一个文档,可以看到其中具体的元数据,标永文档的元数据允许AI访问它们并为用户公开参考来源。

在这里插入图片描述

通过这一技术,企业能够大幅提升文档处理的效率,确保数据的一致性和准确性,从而在面对客户需求时能够迅速响应,有效提升客户满意度。同时,智能知识库的应用还帮助企业更好地管理和利用其知识资产,通过智能分析和检索,挖掘出隐藏在海量数据中的宝贵信息,为企业的战略决策提供强有力的支持,推动企业的持续发展和创新。

在这里插入图片描述

这里可以看到知识库的名称不是太好理解,我们可以通过“设置”按钮来进行修改知识库的名称与知识库的描述。

在这里插入图片描述

这里可以进行“召回测试”的功能,可以根据给定的查询文本测试知识的召回效果,可以进行测试,这里我们看到从源文件中可以匹配到2条数据源信息,可以看到第2条信息,是与原文中一样的。

在这里插入图片描述

通过上面的几个小步骤,Dify平台将复杂的知识结构化过程简化为直观、自动化的操作体验,知识库是 AI 问答助手的主要信息来源,它决定了助手能够回答的内容范围和准确性,在 Dify 中,定制知识库主要有以下步骤:

在这里插入图片描述

  • ①. 添加知识源:点击 “知识库” 模块,选择 “添加知识源”,可以上传本地文件(如 PDF、Word、Excel 等),也能连接在线数据源(如网页链接、数据库),将与问答相关的知识导入系统。
  • ②. 知识整理与分割:上传后,Dify 会自动对知识进行分析和分割,你也可以手动调整分割规则,确保知识以合适的粒度存储,便于后续检索和回答。
  • ③. 测试与优化:添加完知识源后,通过简单提问测试知识库的准确性和完整性。如果发现回答不理想,可对知识源进行补充、删减或调整,不断优化知识库质量。

在这里插入图片描述


三、接入华为云“ModelArts Studio_MaaS_大模型即服务”提供的DeepSeek-R1推理商用大模型服务:

为了实现基于知识库的智能AI问答系统,需要为Dify平台接入大模型服务,ModelArts Studio大模型即服务平台,提供了简单易用的模型开发工具链,支持大模型定制开发。

华为云“ModelArts Studio_MaaS_大模型即服务”提供了DeepSeek-V3与DeepSeek-R1两个商用大模型,支持高精度的语言理解与问答生成能力, 让模型应用与业务系统无缝衔接,降低企业AI落地的成本与难度。

在这里插入图片描述

3.1 DeepSeek-V3商用模型:

上一节中,我们在“ModelArts Studio控制台”中的在线推理中开通了DeepSeek-V3与DeepSeek-R1两个商用大模型,可以自己选择一个适合自己的商用大模型,这是一个性能优秀、适合问答任务的大语言模型。在模型页面中点击“开通服务”,然后根据实际业务需求选择适合的推理规格,建议优先选择商用级服务以确保模型响应的稳定性和准确性。

在这里插入图片描述

服务开通后,点击“调用说明”,这里会显示“RestAPI”、“OpenAI SDK”2种模式的说明文档,可以在“获取API Key”这里系统会返回对应的推理API密钥与访问地址,这样后面在管理模型接入到Dify平台,在这里可以获取相对应的Key参数。

在这里插入图片描述

在“API key管理”中,可以进行创建API Key,创建API Key的标签中,不能使用中文,而且描述也是必须要填写的,在创建密钥之后,需要保存好这个密钥。不过这里需要注意一下,API Key仅会在新建后显示一次,请及时复制并妥善保存,若API Key丢失,请新建API Key。

在这里插入图片描述


3.2 在Dify中配置接入DeepSeek-V3商用模型:

在获取模型服务信息后,返回Dify平台,进入“模型管理”模块,开始新增一个模型接入项。在配置界面中,需选择接入类型为“自定义API模型”,并为该模型命名,例如命名为“DeepSeek-V1”以便识别.

在这里插入图片描述

在这里插入图片描述

随后,在API endpoint URL字段中填写从在调用MaaS的模型服务时的API URL地址,同时将上面生成的API Key填入认证密钥地方,需要填写API Key用于接口的鉴权认证。

在这里插入图片描述

这里需要注意一下,经测试命名不能乱填写,只能填写OpenAI SDK中的名称。完成上述配置后,DeepSeek-V3模型即可在Dify平台的工作流中被调用,此处还需根据大模型接口规范,比如说模型上下文的长度、最大token上限这些参数,确保模型能够按照预期解析用户输入并返回结果。

在这里插入图片描述

无论是在前端的问题理解阶段精准提取核心要点,还是在后端的内容生成环节高效输出优质答案,它都能充分发挥自身强大的自然语言处理能力,智能处理能力使其特别适合应用于智能客服、知识管理、数据分析等需要处理复杂语言任务的场景,帮助企业构建更加智能化的业务流程,实现效率与体验的双重提升。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐