【LangChain】LangChain + 通义千问 + Chroma 实现本地知识库问答（附完整源码）

书接上回，前一篇文章（）简单说了下向量库相关知识，这边文章主要讲解如何具体实现RAG，简单实现，原理都一样！！！

程序员迷途

229人浏览 · 2026-05-09 16:50:08

程序员迷途 · 2026-05-09 16:50:08 发布

书接上回，前一篇文章（点击直达）简单说了下向量库相关知识，这边文章主要讲解如何具体实现RAG，简单实现，原理都一样！！！

一、环境准备

1. 安装依赖库

创建 Python 环境，执行以下命令安装核心依赖：

pip install langchain langchain_chroma langchain_community langchain_core
pip install transformers torch sentence-transformers

2. 准备 API Key

前往阿里通义千问开放平台，获取你的DASHSCOPE_API_KEY。

二、核心代码实现

完整源码（更改通过上篇内容代码保存的向量库位置）

import os

from langchain_chroma import Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms import Tongyi
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

# ---------------------- 配置 ----------------------
DB_DIR = "./chroma_db/chroma_db_txt"

os.environ["DASHSCOPE_API_KEY"] = "你自己的KEY"


print("加载向量库...")
# ---------------------- 向量库 & 模型 ----------------------
embeddings = HuggingFaceEmbeddings(
    model_name="BAAI/bge-large-zh-v1.5",
    model_kwargs={"device": "cuda"},
    encode_kwargs={"normalize_embeddings": True}
)
db = Chroma(persist_directory=DB_DIR, embedding_function=embeddings)

retriever = db.as_retriever(search_kwargs={"k": 5})

llm = Tongyi(model_name="qwen-turbo", temperature=0.1, max_tokens=1024)

# ---------------------- 提示词 ----------------------
template = """
你是一个专业的问答助手，请根据下面的参考资料回答问题。
如果参考资料中没有答案，请直接说“没有找到相关信息”。

参考资料：
{context}

问题：{question}

请回答，并在最后列出你参考了哪些文件。
回答格式要求：
【回答】
xxx

【参考文件】
xxx
"""

prompt = PromptTemplate.from_template(template)

# ====================== ✅ 修复：把内容 + 文件名一起传给模型 ======================
def format_docs(docs):
    formatted = []
    for doc in docs:
        content = doc.page_content
        filename = doc.metadata.get("filename", "未知文件")
        formatted.append(f"【内容】：{content}\n【来源文件】：{filename}")
    return "\n\n------------------------\n\n".join(formatted)

# 调试检索
def debug_retriever(query):
    print("\n====== 检索到的知识库内容 ======")
    docs = retriever.invoke(query)
    for i, doc in enumerate(docs):
        print(f"[{i+1}] {doc.metadata.get('filename', '未知文件')} | {doc.page_content}")
    print("==================================\n")

# RAG 链
rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# ---------------------- 启动 ----------------------
# 增加知识库向量标签，补充回答文本来源
if __name__ == "__main__":
    print("\n 知识库启动成功！输入 exit 退出")
    while True:
        query = input("\n输入：")
        if query.lower() == "exit":
            print("结束")
            break
        debug_retriever(query)
        answer = rag_chain.invoke(query)
        print("\nAI：", answer)