cover

Dify+Ollama+Deepseek+BGE-M3来搭建本地知识库实操

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

AI小白熊

1004人浏览 · 2025-04-07 10:01:29

AI小白熊 · 2025-04-07 10:01:29 发布

智能体(Al Agent)是大模型与业务应用的桥梁，智能体=大模型+知识库+业务系统API+工作流编排

第一步创建智能体应用

点击左侧“创建空白应用"，在如下界面中点击”Agent“。给名称和图标，创建完成。

第二步配置智能体的模型

点击上一步中创建好的智能体，点击去 “去设置”，就可以输入申请的API Key或者本地大模型。API key是指去deepseek等官网申请账号并获取一个key，但是这个会收费而且知识库内容会暴露在网上，不安全。

本文采用的是本地大模型，所以选择Ollama。

2.1 配置LLM

创建智能体的时候，可以通过"去设置"来添加模型，如下图，点击模型供应商然后点击Ollama下面添加模型按钮。

当然也可以点击右上角的账户名，然后在菜单里面点击设置，就可以打开上图的设置页面来添加或者维护模型。

事先我已经安装了Ollama并下载了几个大模型，如果大家没有事先准备好。那先下载安装Ollama，并在命令行工具里面下载运行大模型即可，简单的命令如下：

如果有必要，我可以再写一篇关于Ollama相关的文章，这里不再描述。然后在弹出页面中输入具体内容，如下红色箭头部分不能直接输入 http://localhost:11434

输入localhost，点击保存总是报错"An error occurred during credentials validation: HTTPConnectionPool(host=‘localhost’, port=11434): Max retries exceeded with url: /api/chat (Caused by NewConnectionError(‘<urllib3.connection.HTTPConnection object at 0x7f4a84ce0590>: Failed to establish a new connection: [Errno 111] Connection refused’))"。

问题主要出在docker类似于虚拟机，如果直接写 http://localhost:11434，其实访问的是docker本身的服务，肯定就找不到了。其实当前请求相当于docker要访问主机机器的地址，那就需要把主机的ollama地址暴露出来，步骤如下：

系统变量里面加 OLLAMA_HOST，然后输入局域网地址或者直接输入"0.0.0.0"; 如果是对外的网络地址也行。然后在path里面增加%OLLAMA_HOST%，重启Ollama即可。

2.2 配置知识库Embedding模型

逻辑推理用deepseek大模型, 知识库Embedding不用deepseek，说命中率不高，回答问题效果不好，所以选用BGE-M3。按如下红色箭头命令操作，然后查看一下，模型已经下载完成。

BGE (BAAI General Embedding) 专注于检索增强LLM领域，对中文场景支持效果更好，当然也有很多其他embedding模型可供选择，可以根据自己的场景，在ollama上搜索“embedding”查询适合自己的嵌入模型。

配置如上图，如果说连不上报错，要确认Ollama是否启动，就直接在浏览器里面输入URL看看是否有“Ollama is running”字样。点击保存按钮，就可以看到如下所示LLM用了deepseek-r1:14b而TEXT EMBEDDING用的是bge-m3。

至此，两个模型配置完成。

第三步知识库操作

3.1 创建知识库

如下图操作

3.2 上传RAG资料

可以看到有三步，即选择数据源，文本分段与清洗，处理并完成。资料可以是本地的文本文件，或者直接同步网络资料等等。

支持的文本文件类型也很多，不过要注意单个文件不能超过15M。如果文件大了怎么办，拆呗。

3.3 保存资料并处理

我上传了一个自己写的用户手册，pdf格式，12.86M，可以处理。点击下一步，如下图。

分段设置直接用了通用的，索引方式用高质量，Embedding模型用bge-m3，检索设置用混合检索。点击保存并处理，等待处理完成。

完成前往文档，知识库里面就有一个文档知识库内容了。

第四步测试结果

点击工作室，并打开已经创建完成的智能体(Agent)

不错，AI能够自己检索并拼出结果给用户。接下来要研究怎么改进RAG，并嵌入到自己写的系统中。

普通人如何抓住AI大模型的风口？

=领取方式在文末==

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：

在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包，包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧，需要的小伙伴文在下方免费领取哦，真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，皆可用。
在这里插入图片描述

在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有，跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

四、LLM面试题

在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

六、deepseek部署包+技巧大全

在这里插入图片描述

😝朋友们如果有需要的话，可以V扫描下方二维码联系领取~
在这里插入图片描述

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

DeepSeek本地部署全攻略：保姆级教程带你轻松上手

DeepSeek技术社区

cover

function call介绍和实现（以DeepSeek为例）

DeepSeek技术社区

cover

或许是全网最全的 DeepSeek 使用指南，90% 的人都不知道的使用技巧

DeepSeek技术社区

所有评论(0)

查看更多评论

AI小白熊

已为社区贡献42条内容