1、知识库的痛点

在实际工作和学习中,我们经常需要查阅各种资料,比如技术文档、论文、书籍、博客等等。

如果这些资料散落在不同的文件夹分布在不同的云存储,甚至存储在各种笔记软件,查找起来就很麻烦。而且,如果这些知识点能跟 AI 结合,实现智能搜索和内容生成,那工作效率肯定会大大提升。

这就是我们今天要解决的问题:如何用 DeepSeek R1 + Cherry Studio 搭建一个本地 AI 知识库,让 AI 帮你管理和搜索你的知识!

2、Cherry Studio 知识库

介绍

Cherry Studio 目前已上线知识库功能,支持多种格式文件的导入和网页导入等来搭建个性化知识库。搭配 DeepSeek R1 之后,我们可以让 AI 在我们的知识库里搜索内容,并提供更加贴合个人需求的回答。

最最重要的是,Cherry Studio 数据本地储存,无需担心隐私泄露!

Cherry Studio 知识库中添加的数据全部存储在本地,不会上传到任何第三方服务器,在添加过程中会复制一份文档放在 Cherry Studio 数据存储目录,并且支持本地部署的模型调用。

知识库处理流程图如下:

知识库处理流程图知识库处理流程图

向量数据库:https://turso.tech/libsql

当文档被添加到 Cherry Studio 知识库之后,文件会被切分为若干个片段,然后这些片段会交给嵌入模型进行处理,当使用大模型进行问答的时候,会查询和问题相关的文本片段一并交个大语言模型处理

如果对数据隐私有要求,建议使用本地嵌入数据库和本地大语言模型。

配置模型

上面说到了,AI 知识库需要一个嵌入模型进行分段处理,所以它需要一个嵌入模型。

我们可以在 Ollama 中筛选嵌入模型:

https://ollama.com/search?c=embedding

img

然后我们以 bge-m3 为例进行下载:

ollama pull bge-m3

下载成功后可以使用 ollama list 列出模型:

$ ollama list
NAME               ID              SIZE      MODIFIED
bge-m3:latest      790764642607    1.2 GB    19 hours ago
deepseek-r1:14b    ea35dfe18182    9.0 GB    4 weeks ago

然后回到 Cherry Studio 模型服务中,把推理模型和嵌入模型都添加进来:

img

img

创建知识库

比如,我添加一个文章知识库:

img

img

CherryStudio 支持多种添加数据的方式:

  • 文件夹目录: 可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化。
  • 网址链接: 支持网址 url。
  • 站点地图: 支持 xml 格式的站点地图。
  • 纯文本笔记: 支持输入纯文本的自定义内容。

我这里上传了一些我写的 DeepSeek 文章:

img

当文件等资料向量化完成后,即可进行搜索,点击下面的「搜索知识库」按钮可以搜索知识库:

img

基于知识库对话

在助手对话框中选择刚创建的「文章」知识库进行对话:

img

问它一个问题:

deepseek是什么,300字总结

如图所示,它参考了我们指定的文章知识库进行思考和输出内容:

img

3、总结

以上,我们通过 DeepSeek R1 + Cherry Studio,我们实现了一个本地 AI 知识库:

  • 读取本地文档(Markdown、PDF、Word、TXT)
  • 智能搜索知识点(基于 Cherry Studio)
  • AI 生成智能回答(基于 DeepSeek R1)
  • 完全本地化运行(数据安全,不依赖外网)

相比于之前分享的ima 云知识库方案,这种本地 AI 知识库既能保护数据隐私,又能让 AI 变得更懂你。

这样,我们可以把所有的文档、笔记、网站都添加到本地知识库中,方便我们进行搜索、总结、对话、写作等操作,真的太香了!

我的DeepSeek部署资料已打包好(自取↓)
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!

❗️为什么你必须了解大模型?

1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构:金融、医疗、教育正在被AI重塑,不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车:90%的进阶技巧不需写代码!会说话就能指挥AI

(附深度求索BOSS招聘信息)
在这里插入图片描述

⚠️警惕:当同事用DeepSeek 3小时干完你3天的工作时,淘汰倒计时就开始了。

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?老师啊,我自学没有方向怎么办?老师,这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!当然这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!
在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐