
RagFlow与DeepSeek R1本地知识库从0到1搭建指南
在某些情景下创建本地知识库有一些需求,现在以Deepseek R1与 RAGFlow搭档,组建一个本地企业级知识库。关于本地知识库和微调有一些区别,本地知识库操作起来更简单,但不如微调的效果好,成本比微调便宜。RAGFLow是一个可以构建知识库的应用,整体的流程是在docker中部署RAGFlow展开,配置嵌入模型,填加大语言模型,本地的ollama或者调用api,创建知识,再到具体应用。💡:D
在某些情景下创建本地知识库有一些需求,现在以Deepseek R1与 RAGFlow搭档,组建一个本地企业级知识库。关于本地知识库和微调有一些区别,本地知识库操作起来更简单,但不如微调的效果好,成本比微调便宜。RAGFLow是一个可以构建知识库的应用,整体的流程是在docker中部署RAGFlow展开,配置嵌入模型,填加大语言模型,本地的ollama或者调用api,创建知识,再到具体应用。
一、Windows上安装Docker
💡 提示:Docker安装是基础步骤,如已安装可直接跳至第二部分。
1.1 检查WSL版本
# 以管理员身份打开PowerShell
wsl --version
如果打开不显示版本,就需要安装,如果像下面有版本号,说明本地已安装,直接跳到虚拟化那一步。
1.2 安装WSL
如显示WSL不存在,执行以下命令:
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
1.3 启用虚拟化功能
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
完成后必须重启电脑
1.4 下载WSL2更新包
访问微软官方网站下载WSL2内核更新包并安装。地址:
https://aka.ms/wlskernel
点红框内内核更新包,下载安装。
1.5 设置WSL2为默认版本
wsl --set-default-version 2
wsl --version
再次检查版本就能看到版本信息。
1.6 启用Hyper-V和虚拟化平台
- 打开控制面板 → 程序 → 启用或关闭Windows功能
- 勾选"Hyper-V"和"虚拟机平台"
- 确定后重启电脑
1.7 安装Docker Desktop
- 从Docker官网下载Docker Desktop for Windows
- 双击安装包运行,按默认设置安装
- 安装完成后重启电脑
1.8 配置Docker国内镜像
- 打开Docker Desktop,点击右上角设置按钮
- 找到Docker Engine选项
- 在配置中添加以下内容(注意保留大括号):
"registry-mirrors": [
"https://registry.cn-hangzhou.aliyuncs.com",
"https://mirror.baidubce.com",
"https://docker.mirrors.ustc.edu.cn",
"https://registry.docker-cn.com"
]
- 点击Apply应用设置
二、RAGFlow部署
2.1 下载RAGFlow源码
从Github下载RAGFlow程序包:
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose -f docker-compose.yml up -d
2.2 启用专业版模式
使用VSCode或Cursor打开下载的程序包,进行以下修改:
- 找到主配置文件(约第84行)
- 注释掉轻量版配置行(加上#)
- 取消注释专业版配置行(删除#)
# 修改前
# Defaults to the v0.17.2-slim edition, which is the RAGFlow Docker image without embedding models.
RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
# RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2
# 修改后
# Defaults to the v0.17.2-slim edition, which is the RAGFlow Docker image without embedding models.
#RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.2
2.3 修改端口(可选)
如果80端口被占用,可修改Docker配置文件中的端口:
- 找到Docker目录下的docker-compose.yml文件
- 找到RAGFlow服务部分
- 将端口从"80:80"改为"8080:80"
2.4 启动RAGFlow服务
# 在项目根目录下执行
docker-compose up -d
虽然更换源了,下载时间也比较长,如果没有下载进度,再次更新源。
2.5 验证服务状态
docker ps
确认所有RAGFlow相关容器状态均为"Up"。
’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)
2.6 访问RAGFlow网页
浏览器访问 http://localhost:80(如修改了端口则使用对应端口)。
注册登录。进入后在右上角切换成中文。
三、DeepSeek本地部署
3.1 安装Ollama
- 从Ollama官网下载Windows版本
- 双击安装包完成安装
- 验证安装:
ollama --version
3.2 部署本地DeepSeek模型
ollama pull deepseek:7b
3.3 验证模型安装
ollama list
确认DeepSeek模型已在列表中。
四、RAGFlow配置与使用
4.1 配置嵌入模型
- 点击个人设置 → 模型提供商
- 点击系统模型设置
- 嵌入模型选择"BGE Large"
- 点击确定保存
4.2 添加大语言模型
添加本地Ollama模型:
- 点击"添加模型" → 选择"Ollama"
- 模型名称填写本地安装的模型名(如"deepseek:7b")
- URL填写:“http://localhost:11434/api/chat”
- 最大Token数:131072
- 点击确定保存
添加云平台API(可选):
RAGFlow支持多种模型提供商,包括智谱AI、通义千问、火山引擎等。以火山引擎为例,填加Deepseek R1。
https://www.volcengine.com/product/ark 进入控制台。点在线推理,再选自定义接入点,
创建推理接入点。
再回到接入点,就能看到接入点:
红框内即为接入点。在RAGFLow模型管理中选择VolEngine,填加模型。
这就把Deepseek R1填加成功。再点右上角系统模型设置。
火山引擎的开通的几个模型都可以看到,从中选择deepseek R1,嵌入模型选择默认这个,在修改84个那个位置,就是选择了系统自带的模型。点保存。
4.3 创建知识库
- 点击"知识库" → “创建知识库”
- 填写名称,选择语言(中文文档选择中文)
- 解析方法选择适合你文档类型的方法(通常选择"通用"),切片方法选择默认。
- 点击保存
4.4 上传文档
- 点击"新增文件" → “本地文件”
- 选择需要上传的文档
- 上传完成后,选择文件并点击"解析"
红框内的按钮为解析,所有的都要点。
- 等待解析完成
每个pdf文件都可以点进去,确定是否使用。
4.5 测试知识库
- 点击"聊天" → “新建助理”
- 配置助理并选择前面创建的知识库
- 开始提问测试,新建一个聊天。
进行提问,他会思考一会,从知识中找答案,最后给出一个结果,会标注各个结果出自那篇文章,那个段落等。
通过本教程,我们成功搭建了一个基于RAGFlow和DeepSeek的企业级私人知识库系统。本次演示主要使用了Deepseek R1 api,没有使用本地的ollama模型,它的效果是一样的,ollama的好处是不需要联网,可能一些商业机密的内容可以自建知识库进行检索查询会话等。
如何零基础入门 / 学习AI大模型?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?
”“谁的饭碗又将不保了?
”等问题热议不断。
不如成为「掌握AI工具的技术人」
,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高
那么我作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,希望可以帮助到更多学习大模型的人!至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
👉 福利来袭
CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈
全套AGI大模型学习大纲+路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉 福利来袭
CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
更多推荐
所有评论(0)