有小伙伴私信我,DeepSeek-R1能用来搭建 RAG(检索增强生成)系统吗?答案是绝对可以!

春节前夕,我们接到了业务方的紧急任务,需要探讨如何将 DeepSeek-R1 快速集成到即将上线的项目中。经过多次深入讨论,我们团队决定在现有 RAG 系统的一个核心模块中使用 DeepSeek-R1,与原有的 Qwen 模型进行线上AB测试。更换完成后,我们对系统进行了一系列严格的测试,以确保其稳定运行。在经过彻底验证后,我们成功地在除夕之夜将系统上线。

鉴于所处理数据的敏感性,本文将详尽介绍如何使用DeepSeek-R1、LangChain、Ollama和Streamlit搭建一个本地的、专门处理PDF文件的RAG系统。这套系统利用LangChain的模块化特点和DeepSeek-R1的隐私保护能力,非常适合处理技术文档、法律文件及学术资料等。在后续的分享中,我将详细介绍如何利用 DeepSeek-R1 对系统进行Fine-tuning和优化的过程。

在这里插入图片描述

此项目整合了 LangChain(一种用于 RAG 工作流程的 AI 框架)、Ollama(负责 DeepSeek-R1 的本地部署)和 Streamlit(提供用户界面)。最终成品是一个 AI 助手,它能在本地处理 PDF 文件,并以高精确度和速度回答问题。

在此次演示中,我们将使用一个参数为 7B 的 DeepSeek-R1 精简模型。但如果你的计算资源更充足,我建议尝试使用其他版本的 DeepSeek-R1 精简模型。

为什么选择本地部署的 RAG 解决方案?

虽然云端 AI 解决方案功能强大,但它们往往涉及到隐私和成本问题。使用 LangChain 的模块化框架,你可以在本地搭建一个 RAG 系统,这样做有几大优点:

  • 数据隐私:所有的操作都在你自己的设备上完成,数据安全得到保障。
  • 成本效率:避免了昂贵的 API 订阅费用,这个方案不仅免费还是开源的。
  • 高度定制化:你可以根据需要调整文档检索和回答生成的具体流程。
  • 强大的 AI 能力:整合了 DeepSeek-R1,这是一款专为解决复杂问题和技术任务而设计的模型。

所用工具和技术:LangChain, DeepSeek-R1, Ollama, ChromaDB 和 Streamlit

这个项目涵盖了以下几个部分:

  • LangChain:这是构建 RAG 工作流程的核心框架,支持集成文档加载、向量存储和大型语言模型(LLM)。它的模块化设计让你可以根据具体需求进行调整。
  • DeepSeek-R1:一种专为编程、问题解决和技术任务优化的推理型语言模型。它提供了多种本地部署的版本,可通过 Ollama 轻松部署。
  • Ollama:一个命令行工具,用于简化本地大型语言模型和嵌入模型(如 DeepSeek-R1 和 mxbai-embed-large)的部署与管理。
  • ChromaDB:一个向量数据库,能存储和检索文档向量,方便进行基于相似性的快速查询。
  • Streamlit:一个 Python 库,用于创建易于操作的 Web 用户界面,使你的 RAG 应用更加用户友好,易于使用。

构建 RAG 工作流:分步指南

以下是如何设置你的本地 ChatPDF 解决方案:

1. 安装先决条件

确保你已经安装了 Python 3.8+ 和Ollama。运行以下命令:

curl -fsSL https://ollama.com/install.sh | sh
ollama -v  # 验证安装

下载所需的 AI 模型:

ollama pull deepseek-r1:latest # 默认 7B 模型
ollama pull mxbai-embed-large  # 嵌入模型

在这里插入图片描述

2. 项目设置

克隆仓库并设置虚拟环境:

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1.git
cd chatpdf-rag-deepseek-r1
python3 -m venv venv
source venv/bin/activate

安装依赖:

pip install -r requirements.txt

3. 启动Streamlit

启动 Streamlit 应用:

streamlit run app.py

在浏览器中访问http://localhost:8501。上传你的 PDF 文件,调整检索设置,开始提问。

在这里插入图片描述

使用 DeepSeek-R1、Ollama、LangChain 和 ChromaDB 构建 RAG 管道

这个项目我将利用 LangChain 来从零开始搭建的文档处理流程:

  1. PDF 文件的处理:

    • 利用 LangChain 读取 PDF 文件,并将其分割成小块。
    • 使用 Ollama 将这些小块转换成向量形式,便于计算机理解和处理。
  2. 文档的查找:

    • 通过 ChromaDB 这个工具,快速找到与你问题最相关的文档部分。
    • 你可以设置想要查找的结果数量和查找的严格程度。
  3. 生成回答:

    • DeepSeek-R1 会拿到这些相关的文档小块,然后生成准确的回答。
    • LangChain 确保这些回答格式对用户友好,易于理解。

调整设置以获得更好的结果

LangChain 允许你轻松调整设置,以优化搜索结果:

  • 检索结果数量(k :这个参数决定了将使用多少文档片段来生成答案。如果设置的数目较多,可以获得更全面的答案,但响应时间会变慢;如果设置的数目较少,响应速度会加快,但可能因信息不足而影响答案的全面性。
  • 相似度阈值(score_threshold :这个参数用于设定检索时的匹配严格度。阈值设定得高,只有最相关的文档片段才会被检索出来;阈值设定得低,虽然能检索到更多的信息,但可能会包括一些相关性不高的内容。

在这里插入图片描述

如何使用和测试你的 RAG 应用

这里介绍几种常见的场景,帮助你测试你的应用程序:

测试用的 PDF 文件:
  • 金融:分析财务报告,挖掘出可实施的商业见解。
  • 医疗保健:总结医学研究论文或指南,提取关键信息。
  • 教育:从电子书和学术论文中提取摘要或主要观点。
示例问题:
  • “这个 Python 库的核心功能有哪些?”
  • “这份合同的第五部分主要讨论了什么内容?”
  • “简要概述这本电子书的第二章。”

结论

结合 LangChain、DeepSeek-R1 和 ChromaDB 的使用,你可以构建一个重视隐私保护、灵活性和成本效率的 RAG 系统。这种本地化的解决方案非常适用于分析技术性文件和法律文件,无需依赖于云服务。如此一来,你便可以在完全控制数据安全的环境下,有效地处理和分析专业文档。

DeepSeek无疑是2025开年AI圈的一匹黑马,在一众AI大模型中,DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破,各大科技巨头都火速出手,争先抢占DeepSeek大模型的流量风口。

DeepSeek的爆火,远不止于此。它是一场属于每个人的科技革命,一次打破界限的机会,一次让普通人也能逆袭契机。

DeepSeek的优点

read-normal-img

掌握DeepSeek对于转行大模型领域的人来说是一个很大的优势,目前懂得大模型技术方面的人才很稀缺,而DeepSeek就是一个突破口。现在越来越多的人才都想往大模型方向转行,对于想要转行创业,提升自我的人来说是一个不可多得的机会。

那么应该如何学习大模型

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。

read-normal-img

掌握大模型技术你还能拥有更多可能性:

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

read-normal-img

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

read-normal-img

👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

read-normal-img

read-normal-img

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

read-normal-img

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐