项目介绍

本项目设计并实现了一个面向中文医疗健康场景的智能问答系统。系统以华佗医疗健康问答数据集为知识来源,先将原始问答数据转换为统一的 JSON 格式,再使用中文向量模型生成语义向量索引。当用户在网页端输入医疗健康问题后,系统会对问题进行向量化处理,并在本地知识库中检索出最相关的若干条问答资料。随后,系统将用户问题和检索结果共同传入 DeepSeek 大语言模型,由模型结合上下文生成较为自然、清晰的中文回答。

基于DeepSeek+RAG的医疗智能问答系统实现.png

image.png

选题背景与意义

随着人工智能和大语言模型的发展,智能问答系统在教育、政务、医疗健康等领域得到了广泛关注。医疗健康问题与公众生活密切相关,用户常常希望通过自然语言快速了解疾病常识、用药注意事项、饮食护理和康复建议。然而,通用大模型直接回答医疗问题时可能存在知识来源不明确、内容不可追溯、回答不稳定等问题。基于 RAG 的问答方式能够在生成回答前先检索本地知识库,将相关资料作为上下文提供给大模型,从而在一定程度上降低模型编造内容的风险。

关键技术栈:RAG

RAG 即检索增强生成,是当前大语言模型应用中常用的一种技术架构。它的核心思想是在模型生成回答之前,先从外部知识库中检索与用户问题相关的资料,再将这些资料作为上下文输入给大模型,使模型基于检索内容进行回答。在本系统中,RAG 主要包括数据准备、向量化、相似度检索、上下文构造和答案生成五个环节。系统首先把医疗问答数据整理为标准问答记录,然后使用中文向量模型将每条资料转换为固定维度的向量,并保存为本地向量索引。用户提问时,系统同样将问题转换为向量,通过 NumPy 点积相似度计算召回 Top-K 相关资料。最后,DeepSeek 根据用户问题和检索结果生成回答。相比单纯依赖大模型内部知识,RAG 能够提升回答的知识约束能力和来源可解释性,是本项目实现智能医疗问答的关键技术。

技术架构图

image.png

系统功能模块图

image.png

演示视频 and 完整代码 and 安装

地址:https://xm.ziwuit.com/articles/4wrkfw

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐