零代码搭建本地知识库：基于DeepSeek+RAG+Ollama+Cherry Studio全流程指南

核心价值企业敏感数据100%离线处理个人知识库智能问答本地模型快速响应支持PDF/Word/网页等多格式文档工具链Ollama：开源模型托管平台（支持150+模型）：深度求索开源的16K长文本大模型：中文语义向量模型：AI应用可视化客户端本方案在Intel i7-12700H + RTX 4070设备上实测，可流畅处理200页以内的技术文档问答。通过本地化部署既保障了数据安全，又充分发挥了Deep

我爱学AI

1550人浏览 · 2025-03-22 13:52:12

我爱学AI · 2025-03-22 13:52:12 发布

一、方案优势与工具简介

核心价值：通过本地化部署的LLM（DeepSeek）与RAG技术结合，实现：

企业敏感数据100%离线处理
个人知识库智能问答
本地模型快速响应
支持PDF/Word/网页等多格式文档

工具链：

Ollama：开源模型托管平台（支持150+模型）
DeepSeek-R1：深度求索开源的16K长文本大模型
dmeta-embedding：中文语义向量模型
Cherry Studio：AI应用可视化客户端

二、环境准备与工具安装

1. 安装Ollama服务

访问Ollama官网下载对应系统安装包：

Windows用户双击.exe自动安装
macOS使用brew install ollama
Linux执行curl -fsSL https://ollama.com/install.sh | sh

验证安装成功：

ollama --version
# 应显示版本号（如：0.1.25）

2. 获取模型文件

在终端执行以下命令（按设备配置选择模型）：

# 基础版（8G显存+16G内存）
ollama run deepseek-r1:8b

# 高性能版（24G显存+32G内存）
ollama run deepseek-r1:128b

在这里插入图片描述

3. 安装嵌入模型

执行中文向量化模型安装：

ollama run shaw/dmeta-embedding-zh

三、Cherry Studio配置详解

客户端安装
从Cherry Studio官网下载最新版本，完成基础安装。
连接本地模型服务
- 左下角设置 → 模型服务 → Ollama
- 添加模型服务：```
  API地址: http://localhost:11434/v1/
  API密钥: 任意字符（本地验证可不填）
- 点击「检查连接」确认状态正常
关键配置项
- 务必为dmeta-embedding-zh选择嵌入模式
- 设置默认对话模型为deepseek-r1
- 调整上下文长度至16K（匹配模型能力）

四、知识库创建实战

新建知识库
- 点击「知识库」→「新建」
- 命名后选择dmeta-embedding-zh作为嵌入模型
文档导入技巧
- 支持格式：PDF/Word/Markdown/HTML/TXT
- 批量上传建议不超过50个文件
- 网页抓取需完整URL（支持https）
向量化处理
上传后自动启动解析，进度条显示绿色即完成。常见处理速度：
- 文本文件：约100页/分钟
- PDF扫描件：依赖OCR识别速度

五、智能问答测试

基础对话测试

# 示例问题
"请解释RAG技术的工作原理"

在这里插入图片描述

知识库检索验证

# 基于上传文档提问
"我们公司2023年的研发投入占比是多少？"

混合问答模式

"结合行业趋势分析，我们的产品路线图需要哪些调整？"

六、高级配置技巧

性能优化方案

# 调整Ollama运行参数
OLLAMA_NUM_GPU=2 ollama serve

多知识库协同
- 创建技术文档、市场情报等分类库
- 通过@知识库名称指定检索源

API集成开发

import requests
response = requests.post(
    "http://localhost:11434/v1/chat/completions",
    json={
        "model": "deepseek-r1",
        "messages": [{"role": "user", "content": "问题内容"}]
    }
)

七、常见问题排查

现象	解决方案
模型加载失败	检查显存占用，尝试较小模型
知识库检索无结果	确认dmeta模型设为嵌入模式
响应速度慢	调整Ollama的num_ctx参数
中文乱码	安装中文字体包并重启服务

结语

本方案在Intel i7-12700H + RTX 4070设备上实测，可流畅处理200页以内的技术文档问答。通过本地化部署既保障了数据安全，又充分发挥了DeepSeek模型的逻辑推理能力。建议企业用户可将此方案部署在内网服务器，配合NAS实现团队级知识管理。

技术演进路线：

短期：接入本地搜索引擎实现混合检索
中期：训练行业专属LoRA适配器
长期：构建自动化知识图谱系统

DeepSeek无疑是2025开年AI圈的一匹黑马，在一众AI大模型中，DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破，各大科技巨头都火速出手，争先抢占DeepSeek大模型的流量风口。

DeepSeek的爆火，远不止于此。它是一场属于每个人的科技革命，一次打破界限的机会，一次让普通人也能逆袭契机。

DeepSeek的优点

read-normal-img

掌握DeepSeek对于转行大模型领域的人来说是一个很大的优势，目前懂得大模型技术方面的人才很稀缺，而DeepSeek就是一个突破口。现在越来越多的人才都想往大模型方向转行，对于想要转行创业，提升自我的人来说是一个不可多得的机会。

那么应该如何学习大模型

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

想正式转到一些新兴的 AI 行业，不仅需要系统的学习AI大模型。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。

大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。

read-normal-img

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把都打包整理好，希望能够真正帮助到大家。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

read-normal-img

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；
第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；
第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；
第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；
第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈
光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

read-normal-img