在某些情景下创建本地知识库有一些需求,现在以Deepseek R1与 RAGFlow搭档,组建一个本地企业级知识库。关于本地知识库和微调有一些区别,本地知识库操作起来更简单,但不如微调的效果好,成本比微调便宜。RAGFLow是一个可以构建知识库的应用,整体的流程是在docker中部署RAGFlow展开,配置嵌入模型,填加大语言模型,本地的ollama或者调用api,创建知识,再到具体应用。

一、Windows上安装Docker

💡 提示:Docker安装是基础步骤,如已安装可直接跳至第二部分。

1.1 检查WSL版本

# 以管理员身份打开PowerShell
wsl --version

如果打开不显示版本,就需要安装,如果像下面有版本号,说明本地已安装,直接跳到虚拟化那一步。图片

1.2 安装WSL

如显示WSL不存在,执行以下命令:

dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart

1.3 启用虚拟化功能

dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

完成后必须重启电脑

1.4 下载WSL2更新包

访问微软官方网站下载WSL2内核更新包并安装。地址:

https://aka.ms/wlskernel

点红框内内核更新包,下载安装。图片

1.5 设置WSL2为默认版本

wsl --set-default-version 2
wsl --version

再次检查版本就能看到版本信息。

1.6 启用Hyper-V和虚拟化平台

  1. 打开控制面板 → 程序 → 启用或关闭Windows功能
  2. 勾选"Hyper-V"和"虚拟机平台"
  3. 确定后重启电脑

图片

图片

1.7 安装Docker Desktop

  1. 从Docker官网下载Docker Desktop for Windows
  2. 双击安装包运行,按默认设置安装
  3. 安装完成后重启电脑

1.8 配置Docker国内镜像

  1. 打开Docker Desktop,点击右上角设置按钮
  2. 找到Docker Engine选项
  3. 在配置中添加以下内容(注意保留大括号):
"registry-mirrors": [
    "https://registry.cn-hangzhou.aliyuncs.com",
    "https://mirror.baidubce.com",
    "https://docker.mirrors.ustc.edu.cn",
    "https://registry.docker-cn.com"
  ]

图片

  1. 点击Apply应用设置

二、RAGFlow部署

2.1 下载RAGFlow源码

从Github下载RAGFlow程序包:

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose -f docker-compose.yml up -d

2.2 启用专业版模式

使用VSCode或Cursor打开下载的程序包,进行以下修改:

  1. 找到主配置文件(约第84行)
  2. 注释掉轻量版配置行(加上#)
  3. 取消注释专业版配置行(删除#)
# 修改前
# Defaults to the v0.17.2-slim edition, which is the RAGFlow Docker image without embedding models.
RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
# RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2

# 修改后
# Defaults to the v0.17.2-slim edition, which is the RAGFlow Docker image without embedding models.
#RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2

图片

2.3 修改端口(可选)

如果80端口被占用,可修改Docker配置文件中的端口:

  1. 找到Docker目录下的docker-compose.yml文件
  2. 找到RAGFlow服务部分
  3. 将端口从"80:80"改为"8080:80"

图片

2.4 启动RAGFlow服务

# 在项目根目录下执行
docker-compose up -d

虽然更换源了,下载时间也比较长,如果没有下载进度,再次更新源。图片

图片

2.5 验证服务状态

docker ps

确认所有RAGFlow相关容器状态均为"Up"。

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=data%3Aimage%2Fsvg%2Bxml%2C%253C%253Fxml%20version%3D’1.0’%20encoding%3D’UTF-8’%253F%253E%253Csvg%20width%3D’1px’%20height%3D’1px’%20viewBox%3D’0%200%201%201’%20version%3D’1.1’%20xmlns%3D’http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg’%20xmlns%3Axlink%3D’http%3A%2F%2Fwww.w3.org%2F1999%2Fxlink’%253E%253Ctitle%253E%253C%2Ftitle%253E%253Cg%20stroke%3D’none’%20stroke-width%3D’1’%20fill%3D’none’%20fill-rule%3D’evenodd’%20fill-opacity%3D’0’%253E%253Cg%20transform%3D’translate(-249.000000%2C%20-126.000000&pos_id=img-Ui3aVM1A-1742615945269)’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

2.6 访问RAGFlow网页

浏览器访问 http://localhost:80(如修改了端口则使用对应端口)。

图片

注册登录。进入后在右上角切换成中文。

三、DeepSeek本地部署

3.1 安装Ollama

  1. 从Ollama官网下载Windows版本
  2. 双击安装包完成安装
  3. 验证安装:
ollama --version

3.2 部署本地DeepSeek模型

ollama pull deepseek:7b

3.3 验证模型安装

ollama list

确认DeepSeek模型已在列表中。

四、RAGFlow配置与使用

4.1 配置嵌入模型

  1. 点击个人设置 → 模型提供商
  2. 点击系统模型设置
  3. 嵌入模型选择"BGE Large"
  4. 点击确定保存

4.2 添加大语言模型

添加本地Ollama模型:
  1. 点击"添加模型" → 选择"Ollama"
  2. 模型名称填写本地安装的模型名(如"deepseek:7b")
  3. URL填写:“http://localhost:11434/api/chat”
  4. 最大Token数:131072
  5. 点击确定保存
添加云平台API(可选):

RAGFlow支持多种模型提供商,包括智谱AI、通义千问、火山引擎等。以火山引擎为例,填加Deepseek R1。

图片

https://www.volcengine.com/product/ark 进入控制台。点在线推理,再选自定义接入点,

图片创建推理接入点。

图片

再回到接入点,就能看到接入点:

图片

红框内即为接入点。在RAGFLow模型管理中选择VolEngine,填加模型。

图片

这就把Deepseek R1填加成功。再点右上角系统模型设置。

图片

图片

火山引擎的开通的几个模型都可以看到,从中选择deepseek R1,嵌入模型选择默认这个,在修改84个那个位置,就是选择了系统自带的模型。点保存。

4.3 创建知识库

  1. 点击"知识库" → “创建知识库”图片
  2. 填写名称,选择语言(中文文档选择中文)
  3. 解析方法选择适合你文档类型的方法(通常选择"通用"),切片方法选择默认。图片
  4. 点击保存

4.4 上传文档

  1. 点击"新增文件" → “本地文件”

图片

  1. 选择需要上传的文档

图片

  1. 上传完成后,选择文件并点击"解析"

图片红框内的按钮为解析,所有的都要点。

  1. 等待解析完成图片每个pdf文件都可以点进去,确定是否使用。

4.5 测试知识库

  1. 点击"聊天" → “新建助理”
  2. 配置助理并选择前面创建的知识库图片
  3. 开始提问测试,新建一个聊天。

图片进行提问,他会思考一会,从知识中找答案,最后给出一个结果,会标注各个结果出自那篇文章,那个段落等。

通过本教程,我们成功搭建了一个基于RAGFlow和DeepSeek的企业级私人知识库系统。本次演示主要使用了Deepseek R1 api,没有使用本地的ollama模型,它的效果是一样的,ollama的好处是不需要联网,可能一些商业机密的内容可以自建知识库进行检索查询会话等。

如何零基础入门 / 学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么我作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,希望可以帮助到更多学习大模型的人!至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

read-normal-img

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈
基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

img

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐