【AI4TCM】基于GraphRAG技术赋能的大语言模型系统OpenTCM

OpenTCM通过。

发菜君

1666人浏览 · 2025-06-02 17:43:38

发菜君 · 2025-06-02 17:43:38 发布

摘要

OpenTCM系统通过构建中医知识图谱（含68本妇科典籍的370万古汉字提炼出的4.8万实体和15.2万关系）与GraphRAG技术结合，解决了中医古籍语义解析和复杂概念建模的难题；该系统无需模型微调即可实现高精度药物检索（专家评分4.5/5）和诊断问答（评分3.8/5），知识图谱构建精度达98.55%，为中医智能化提供了高效可靠的新范式。

一、背景：当古老中医遇见人工智能

传统中医（TCM）拥有数千年历史，其典籍蕴含丰富的诊疗智慧，如《黄帝内经》《伤寒杂病论》等。然而，这些古籍以文言文写成，术语晦涩（如“气滞血瘀”），知识体系复杂（药物、症状、方剂关联紧密），现代医师学习和应用难度大。尽管AI技术（如ChatGPT）已在现代医学中广泛应用，但直接用于中医面临严重挑战：误读古籍语义、忽略经典文献、开方“幻觉”风险（生成错误药方）。

香港中文大学团队开发的 OpenTCM 系统，首次将大语言模型（LLM）与中医知识图谱深度融合，构建了一个“免训练”的智能辅助平台。它从68本妇科古籍（370万古汉字）中提炼出4.8万条实体（药物、症状等）和15.2万条关系，通过创新的 GraphRAG 技术，实现高精度药物检索（专家评分4.5/5）和诊断问答（准确率75.1%），为中医数字化开辟新路径。

二、核心难题：中医知识现代化的三座大山

论文指出，中医AI化需攻克三大难关：

古籍语义鸿沟

古籍文言文与现代汉语差异巨大（如“当归”在古方中称“乾归”），且一词多义（“表证”既可指症状也可指病理阶段），通用AI模型无法准确解析。

知识关联复杂性

中医强调“辨证论治”，需综合症状、体质、药物相互作用（如“十八反十九畏”）等多维关系。现有系统多孤立处理信息，忽视整体关联。

结构化知识缺失

经典TCM文献缺乏数字化知识图谱（类似“中医版百科关联网络”），导致AI依赖“死记硬背”而非逻辑推理，易产生误导性结论。

例如，若问“产后头痛如何用药？”，通用AI可能机械推荐“川芎”，但忽略患者是否伴有“血虚”或“瘀血”，导致药不对症。

三、破解之道：OpenTCM的三步革新

Step 1：构建中医“知识互联网”

团队在中医专家协助下，从 68本妇科典籍（涵盖产科、妇科、不孕症）中提取370万字符原始文本，并创新设计 定制化提示词（Prompt）指导AI解析：

角色定义：要求AI扮演“中医数据处理专家”，专注提取古籍关键信息；
结构化输出：强制生成标准化JSON数据，包含药物、症状、方剂等4类表结构（如“药物-方剂关联表”需注明剂量与炮制法）；
示例学习：提供古文范例及对应输出格式，让AI“照葫芦画瓢”。

最终建成含 4.8万实体+15.2万关系 的知识图谱，精度高达 98.55%。例如，将“当归补血汤”拆解为：

成分（当归、黄芪）→ 功效（补气生血）→ 适用症状（产后血虚发热）→ 禁忌（阴虚火旺者忌用）

Step 2：知识图谱 + GraphRAG = 中医“最强大脑”

传统AI检索如同“关键词匹配”（输入“头痛”即搜所有含“头痛”的文本），而 GraphRAG 的核心突破是“关系推理”：

多跳检索：沿知识图谱路径自动关联多层信息。

用户问“月经不调伴腹痛该用什么药？”

→ 系统检索路径：腹痛 → 关联证型“气滞血瘀” → 推荐方剂“桃红四物汤” → 解析成分（桃仁、红花、当归等）

降幻觉设计：答案严格限定在图谱关联范围内，避免编造不存在的关系。
免训练部署：直接调用开源模型（如DeepSeek、Kimi），节省百万元级算力成本。

Step 3：双场景验证，效果碾压现有方案

系统在两类任务中完胜通用AI（如GPT-4）和中医专用模型（如BianCang、Lingdan）：

任务类型	OpenTCM表现	对比模型最佳表现
药物知识检索	专家评分4.5/5，准确率89.6%	评分3.2，准确率72%
诊断问答	专家评分3.8/5，准确率75.1%	评分3.0，准确率68%