DeepSeek + RAG：让大模型更智能、更精准

在大模型应用中，**如何保证答案的准确性和实时性** 一直是一个难题。尽管 LLM（Large Language Models）具有强大的生成能力，但它们的知识存在 **时间局限性**，并且容易产生“幻觉”（hallucination）。为了解决这些问题，**RAG（检索增强生成）** 方案应运而生。在 RAG（检索增强生成）中，检索机制负责获取相关信息，而 LLM 负责生成最终答案。DeepSe

咔咔学姐kk

695人浏览 · 2025-03-20 11:04:00

咔咔学姐kk · 2025-03-20 11:04:00 发布

在大模型应用中，如何保证答案的准确性和实时性 一直是一个难题。尽管 LLM（Large Language Models）具有强大的生成能力，但它们的知识存在 时间局限性，并且容易产生“幻觉”（hallucination）。为了解决这些问题，RAG（检索增强生成） 方案应运而生。在 RAG（检索增强生成）中，检索机制负责获取相关信息，而 LLM 负责生成最终答案。DeepSeek 作为国内领先的大模型之一，可以在 RAG 体系中作为生成部分，为检索增强的上下文提供自然、准确的回答。本文将带你了解 DeepSeek 与 RAG 的结合，并提供代码示例。

一、什么是 RAG（检索增强生成）？

RAG（Retrieval-Augmented Generation） 是一种将 信息检索（Retrieval） 与 大模型生成（Generation） 结合的技术，主要分为 两步：

检索（Retrieve）: 在外部知识库（如文档数据库、向量数据库）中找到与用户问题相关的信息。
生成（Generate）: 将检索到的内容作为上下文输入给大模型，提高回答的准确性。

优点：

让 LLM 能够利用最新的外部知识，不再局限于训练数据。
降低 LLM 胡编乱造（幻觉） 的概率。
提供可验证的答案来源，提高可靠性。

hallucination

二、为什么选择 DeepSeek 作为 RAG 模型？

DeepSeek 是一个强大的国产 LLM，具备以下特点：

支持中文优化，相比 GPT-4/Claude，在中文场景下表现更佳。
更开放的 API，可以免费试用，并且提供了本地部署版本。
模型能力强，支持代码、数学推理、知识问答等任务，适合 RAG 场景。

此外，DeepSeek 提供 DeepSeek-VL（视觉+文本） 以及 DeepSeek-Coder（代码生成） 版本，使其在 技术文档问答、代码辅助、金融分析等领域 表现优异。当然最重要的一点是，DeepSeek 是开源的，这意味着你可以在本地部署它，并且可以根据自己的需求进行定制。谁能拒绝白嫖呢？

三、如何实现 DeepSeek + RAG？

我们可以结合 DeepSeek + Qdrant 向量数据库 来实现一个简单的 RAG 系统：

前置条件：

本地部署ollama。
ollama运行DeepSeek。
一个 Qdrant 实例。

架构

数据预处理：将文档（如 PDF、网页）分割成小段，并向量化存储。
用户输入查询：计算输入问题的向量，并检索相似的文档片段。
DeepSeek 生成回答：将检索到的文档片段和用户问题一起输入 DeepSeek，生成最终答案。

代码实现

这里我们使用 Qdrant 作为向量数据库，并结合 DeepSeek 进行 RAG 任务。

安装依赖

pip install qdrant-client openai tiktoken

1️⃣ 数据预处理（文本向量化 + 存入 Qdrant）

import Qdrant
import numpy as np
from openai import OpenAI

# 配置参数
COLLECTION_NAME = "deepseek_rag"
QDRANT_URL = "http://localhost:6333"

# 连接 Qdrant
client = QdrantClient(QDRANT_URL)
ollamaClient = ollama.Client(host="http://127.0.0.1:11434")

# 假设我们有一些文本需要存入 Qdrant
docs = [
        "DeepSeek 是一个强大的大模型，支持代码生成和中文优化。",
        "RAG 是结合检索与生成的技术，能够提升大模型回答的准确性。",
        "Qdrant 是一个高效的向量数据库，适用于大规模检索。",
        "ITProHub是一个致力于信息技术领域，为专业人士、学习者和技术爱好者提供丰富的资源、技能培训的社区交流平台。",
]

# 向量化
doc_vectors = []
for doc in docs:
     """ 使用本地 Ollama 计算文本嵌入向量 """
    response = ollamaClient.embeddings(model="mxbai-embed-large", prompt=text)
    vector = response.embeddingresponse.data[0].embedding
    doc_vectors.append(vector)

# 存入 Qdrant
points = [
    PointStruct(id=i, vector=vectors[i], payload={"text": docs[i]})
    for i in range(len(docs))
]
client.upsert(collection_name=COLLECTION_NAME, points=points)
print(f"📥 已存入 {len(docs)} 篇文档")

2️⃣ 用户查询 + 向量检索

def retrieve_similar_docs(query, top_k=2):
    """ 从 Qdrant 中检索与查询最相似的文档 """
    query_vector = get_embedding(query)
    search_result = client.search(
        collection_name=COLLECTION_NAME, query_vector=query_vector, limit=top_k
    )
    return [hit.payload["text"] for hit in search_result]

# 示例查询
query = "你知道ITProHub么？"
retrieved_docs = retrieve_similar_docs(query)
print("检索到的相关文档：", retrieved_docs)

3️⃣ DeepSeek 生成答案

def generate_answer(query, retrieved_docs):
    """ 使用 DeepSeek 结合检索内容生成答案 """
    context = "\n".join(retrieved_docs)
    prompt = f"根据以下信息回答用户问题：\n{context}\n\n用户问题：{query}"

    response = ollamaClient.chat(
        model="deepseek-r1:1.5b",
        messages=[{"role": "user", "content": prompt}],
    )
    return response["message"]["content"]

# 生成答案
final_answer = generate_answer(query, retrieved_docs)
print("DeepSeek 生成的答案：", final_answer)

4️⃣ 看看效果

原始搜索结果

提出问题：“你知道ITProHub?” 显然在原始模型的数据里面是没有关于本公众号的任何信息的，所以你可以看到deepseek针对这个问题开始胡言乱语了
可以看到针对 ITProHub 这个问题，原始的模型并不知道是啥。
接入RAG之后的效果

接入RAG之后，模型可以根据检索到的内容，生成更准确的答案。

典型应用场景

企业知识库问答（客户支持、内部文档搜索）
AIOps（通过 RAG，结合实时运维数据，快速定位和分析故障原因）
代码辅助（自动补全、代码文档解析）
学术研究（查询特定文献，生成摘要）

总结

RAG 作为一种 结合外部知识和大模型的增强技术，极大提高了回答的准确性和可解释性。DeepSeek 作为国产 LLM，在 中文优化、API 兼容性、代码生成能力 方面有独特优势，适合作为 RAG 系统的核心组件。

我的DeepSeek部署资料已打包好（自取↓）
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码甚至预测市场趋势——答案就藏在大模型技术里！

❗️为什么你必须了解大模型？

1️⃣ 薪资爆炸：应届大模型工程师年薪40万起步，懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构：金融、医疗、教育正在被AI重塑，不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车：90%的进阶技巧不需写代码！会说话就能指挥AI

（附深度求索BOSS招聘信息）
在这里插入图片描述

⚠️警惕：当同事用DeepSeek 3小时干完你3天的工作时，淘汰倒计时就开始了。

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？老师啊，我自学没有方向怎么办？老师，这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！当然这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

DeepSeek算法研发闭环解析：如何打造持续进化的AI生产线？

DeepSeek技术社区

DeepSeek集成：如何将DeepSeek修炼成‘国殇剑舞‘

DeepSeek技术社区

DeepSeek 从热潮到应用，腾讯云携手行业专家共探 AI 下一步

在精彩的观点 PK 讨论下，本次「DeepSeek从热潮到应用」TVP AI 创变研讨会圆满落幕。通过今天的交流与探讨，各位专家帮助我们梳理 DeepSeek 技术发展脉络，分析热潮背后的逻辑与创新，更重要的是探索 AI 落地实践，为我们带来许多启发与思考。TVP AI 创变研讨会，是为 TVP 等技术管理者、AI 创业者打造的专属交流活动，旨在聚焦 AI 前沿，通过系列专题研讨，共同探索 AI