
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:4
- 浏览量:459
相关文章
暂无数据
基于知识图谱和注意力机制的中医证候诊断研究
Research on TCM Syndrome Diagnosis Based on Knowledge Graph and Attention Mechanism
引言
中医作为我国医学体系的重要组成部分,凭借整体观念与辨证施治理念,在慢性病管理、复杂疾病诊疗及亚健康干预中成效显著,与西医形成有效互补。当前,《“十四五”中医发展规划》等政策将中医现代化纳入国家战略,重点推进智慧中医医院建设与人工智能辅助诊断系统研发,加速诊疗服务向标准化、智能化转型。知识图谱与深度学习技术的结合,已为中药配伍规律挖掘、证候诊断模型构建提供新思路。技术的进步显著提高了中医临床诊疗信息的处理能力,但当前模型的数理推导路径与医师的思辨过程之间常难以有效对接,这种可解释性差的情况降低了医师对辅助诊疗系统的信任度,成为制约中医临床辅助诊疗技术推广应用的关键因素之一。另外,现代医疗标准化强调在循证医学框架下构建规范化的诊疗路径,而中医辨证论治则注重因人制宜的动态调治原则,两者之间存在一定的矛盾。
本研究针对医疗标准化规范与中医个体化诊疗的核心矛盾,提出“知识驱动+数据智能”双路径解决方案。在标准化维度,通过构建以国家标准《中医临床诊疗术语》为核心的知识图谱,建立症状-证候关联体系;在个体化维度,运用注意力机制分析患者的症状组合,自适应分配症状权重。结合知识图谱的规范约束与注意力机制的特征挖掘能力,有效提升诊断水平,同时保留个体化辨证优势,并借助注意力权重生成可解释的辨证逻辑链。
1相关研究
1.1 中医知识图谱研究现状
中医涵盖疾病、方剂、中药等多维度知识,具有显著的跨域关联特性,通过知识图谱技术,可将零散的中医知识进行整合,可视化呈现症状-证候间的关联。如表所示,知识图谱在中医基础理论、临床实践、养生保健等多个领域已经获得了一系列成果。但是大部分知识图谱的应用阶段仍是以知识表示和检索为主,在知识问答及辅助决策等应用层面仍有巨大的发展前景。Xie等学者通过强化学习与知识图谱的协同应用,深入挖掘文本中潜藏的实体关系,将TF-IDF融入证候评分体系,构建症状-证候的推理路径,显著提升了诊断结果的可信度。姚帅君团队则利用深度学习模型对门诊医案进行实体关系联合抽取,构建名老中医临证经验知识图谱,系统解析“方—证—症”动态关联的辨证思维模式。中医知识图谱是构建证候诊断模型的基础,但是中医术语与理论的多元化及灵活性容易导致知识图谱实体和关系定义模糊、模式层逻辑不够严密,提升中医知识图谱实用性的关键在于优化模式层设计。因此,如何通过高质量的模式层设计和整合多源异构数据构建中医知识图谱成为值得关注的研究问题。
| 范围 | 实例 | 应用阶段 |
|---|---|---|
| 中医基础理论 | 中医体质知识图谱 | 知识表示 |
| 中医古籍知识图谱 | 知识检索 | |
| 中医临床诊断 | 脑瘤知识图谱 | 决策支持 |
| 慢性萎缩性胃炎知识图谱 | 知识表示 | |
| 中医不寐知识图谱 | 决策支持 | |
| 其他 | 中医养生知识图谱 | 决策支持 |
| 中医健康管理知识图谱 | 知识表示 |
1.2 注意力机制的医学领域应用现状
注意力机制是深度学习中一种通过分配权重系数,帮助模型聚焦输入信息关键特征的技术。它通过抑制无关干扰、强化重要信号,显著提升模型的判别精度与可解释性,现已成为医学人工智能领域的重要技术。Chen运用多层图注意力网络构建患者特异性基因互作网络,用于膀胱癌驱动基因的精准预测与个性化诊疗策略制定。wang设计了多模态注意力模型,优化肺结节良恶性分类的敏感性与准确性,验证了注意力机制在医学影像分析中的有效性。Zhang开发了基于多头自注意力的文本解析模型,从放射学报告中自动提取病灶信息,提升结构化信息提取效率。然而,现有研究对注意力权重的解释仍局限于技术指标。对于具有鲜明的语义特性的中医来说,各类专业术语蕴含丰富的诊断内涵,这也导致诊断标准难以量化,依赖医师经验判断。注意力机制能有效解析中医术语间的深层语义关联,并通过权重分配为各类要素建立量化指标,推动辨证论治从经验驱动向数据—知识双驱动的转变。
2 中医证候诊断模型框架
尽管深度学习模型具有较强的预测能力,但由于其“黑箱”特性,缺乏医学解释性,难以获得临床医生的信任。为此,本文提出一种融合知识图谱与注意力机制的中医证候诊断模型,旨在兼顾预测性能与结果的可解释性。以下为该模型的各模块设计。
2.1 知识图谱模块
在构建中医知识体系方面,中医学语言系统语义网络具有良好的适用性。在本研究中,知识图谱所涉及的症状、病性、病位、证候四个实体及其相互关系,均源自《健康信息学—中医学语言系统语义网络框架》,以此确保知识图谱的质量。
知识图谱的数据来源包括《中医临床诊疗术语》《证素辨证学》《常见症状中医鉴别诊疗学》《中华人民共和国药典(2020版)》及中药查询网。由于数据来源不同,存在异名、简称等问题,因此使用国家标准文件《中华人民共和国药典:2020版》和《中医临床诊疗术语》建立标准化词典,并引入百度ERNIE语言模型计算语义相似度,实现实体标准化。当相似度大于0.75即视为同义并做合并处理,介于0.65至0.75之间则标记留作人工审核。
由于已构建的中医知识图谱的实体具有非对称与多对多的关系特性,本文采用ComplEx嵌入模型进行建模。在患者症状数量少于20条的情况下,引入零向量填充策略,以统一输入维度,并通过掩码机制屏蔽无效位置。嵌入维度为512维,兼顾中医辨证语义的复杂性与模型的泛化能力。
,
,
是患者第个症状,是通过嵌入模型生成的第个症状的嵌入向量,是由20个症状嵌入向量构成的矩阵。
2.2 注意力机制模块
在实际诊断中,症状数量具有个体差异性,且各症状对诊断结果的贡献程度不一,因此本文引入单头注意力机制自适应地提取关键判别特征。
首先,通过矩阵和偏置项降维缓解高维嵌入空间的噪声问题,同时保留症状与证候间的核心关联信息。随后使用Tanh激活函数进行非线性变换,便于模型判断症状对不同证候的正负贡献。然后,通过权重矩阵和偏置项计算每个症状的注意力分数,用以衡量其对证候判定的影响。同时引入掩码机制以抑制无效填充症状的干扰,得到有效的注意力分数。
,
最后,通过Softmax函数归一化生成注意力权重直接反映了症状对目标证候的相对重要性。
加权求和能根据输入症状的组合动态计算各症状的权重,并非预设或固定值,有效模拟了中医临床中“抓主症”的辨证思维,输出的是融合患者所有症状信息的向量c。
,
采用深度神经网络架构,结合正则化策略以提升模型的稳定性与泛化能力。首先,通过权重矩阵和偏置项对融合后的上下文向量进行线性变换,并使用ReLU激活函数进行非线性处理,该操作筛选出最具判别力的特征,保留高响应的症状信号,同时将较弱特征归零,降低噪声干扰。
,,
为提高模型在面对症状缺失或异质输入时的鲁棒性,引入Dropout正则化机制,在训练过程中随机丢弃部分神经元连接,得到正则化后的特征向量:
,
最终,分类层通过全连接层和偏置项将正则化后的特征映射为各证候的输出。
,,
随后,采用Softmax函数归一化生成第k类证候的预测概率:
2.3 可解释性模块
可解释性模块将通过症状综合贡献分数和知识图谱路径展示模型的辨证逻辑链,其中注意力机制、梯度反向传播以及知识图谱路径推理构建了综合贡献评分。
基础分数综合考虑了注意力分数和梯度贡献,其计算公式为:
为注意力层所得到的各症状的权重。是模型预测类别的概率输出,是症状i的嵌入向量。表示模型输出关于症状i的嵌入向量的梯度,反映了症状嵌入向量的变化对预测类别概率的影响方向和程度。
P为症状到预测证候的有效路径集合。为症状的某一条有效路径贡献分数。为长度惩罚系数,过长的路径可能会引入更多的误差,其可靠性相对较低。为症状的总路径贡献分数。表示从症状到预测证候的有效路径数量,路径数量越多,意味着该症状对证候判断的支持力度越强。因此,通过(1 +0.5 )给予路径数量奖励。
综合贡献评分公式:
和是调节参数,取值为0.5用以平衡基础贡献与路径推理在最终综合贡献分数中的影响。
3 实验及分析
3.1数据集
为评估算法有效性,选择疾病发病率和风险性较高的胸痹病作为证候诊断算法的探究病种。胸痹病中医证候主要有气虚血瘀、气滞血瘀、气阴两虚、痰湿内蕴及脾肾阳虚五大证型。本次实验采用公开数据集Traditional-Chinese-Medicine-Dataset-SFT,经筛选、删除重复项和缺失项等预处理,最终得到1428例患者医案数据。随后,将处理后患者数据中的症状和证候,使用第三章的实体对齐方法与已构建的中医知识图谱中的实体进行匹配映射,匹配出超过相似度阈值的症状实体。
| 证型 | 气虚血瘀证 | 气滞血瘀证 | 气阴两虚证 | 痰湿内蕴证 | 脾肾阳虚证 |
|---|---|---|---|---|---|
| 患者数量 | 248 | 102 | 535 | 112 | 429 |
3.2实验参数及评估指标
采用Adam优化器在实验数据集上对超参数进行微调,具体搜索如下:嵌入维度k和批量大小取值为{32,64,128,256,512,1024},正则化系数为1e-4,隐藏层为{16,32,64,128},学习率为{0.1,0.01,0.001}。数据集按7:3比例随机划分为训练集与测试集,基线模型超参数按照原论文或代码中的默认设置。评估指标重点关注Macro Precision与Macro Recall以应对证候类别不均衡。
Macro Precision是各类别精确率的算术平均,定义为:
为证候c的真阳性样本数,为证候c的假阳性样本数,该指标衡量各证候预测结果的准确性,反映模型的诊断可靠性。
Macro Recall是各类别召回率的算术平均,计算式为:
为证候c的假阴性样本数,召回率衡量模型从真实阳性样本中正确识别的能力,反映模型的诊断全面性。
3.3 实验结果与分析
3.3.1 基线模型对比
本实验选取以下四个模型作为基准对比,覆盖传统机器学习、深度学习及图神经网络的典型范式,系统验证本文模型在中医证候预测任务中的优势。
SVM模型基于最大间隔原理,在高维空间中进行特征划分,适用于小样本下的中医证候判别任务。
Decision Tree模型通过规则划分对中医症状进行逐层分类,具有良好的可解释性,便于提取诊断路径。
MLP模型利用多层感知结构建模症状与证候间的非线性关系,增强对复杂诊断模式的表达能力。
GCN模型依托中医知识图谱,聚合节点邻居信息,挖掘证候与症状间的结构化联系,提升模型的知识表达能力。
| Model | MacPrec | MacRec | BalAcc | MacF1 | MacAUC |
|---|---|---|---|---|---|
| SVM | 0.8121 | 0.6068 | 0.6068 | 0.6554 | 0.9206 |
| Decision Tree | 0.7828 | 0.614 | 0.6140 | 0.6579 | 0.9199 |
| MLP | 0.7503 | 0.7208 | 0.7208 | 0.7297 | 0.9408 |
| GCN | 0.8624 | 0.8041 | 0.8041 | 0.8219 | 0.9737 |
| Our Model | 0.9107 | 0.8916 | 0.8916 | 0.8998 | 0.9833 |
实验结果显示,传统模型SVM和Decision Tree的MacPrec分别为0.8121和0.7828,MacRec相对较低,表明其在处理中医证候分类时存在一定能力,但在区分复杂证候上仍有限。深度学习模型表现更优,MLP与GCN的MacPrec和MacRec均明显提升,尤其GCN在建模症状与证候的结构关系方面效果突出。本研究提出的模型在MacPrec与MacRec上分别达到0.9107与0.8916,显著优于各基准模型,表现出其对中医证候特征的精准识别能力。
3.3.2 消融实验
为进一步验证知识图谱与注意力机制在模型中的作用与贡献,本文设计了四组消融实验:完整模型(Full)、去除知识图谱的模型(NO_KG)、去除注意力机制的模型(NO_ATTN),以及同时去除两者的模型(NO_KG_ATTN)。
| Metric | MacPrec | MacRec | BalAcc | MacF1 | MacAUC |
|---|---|---|---|---|---|
| Full | 0.9107 | 0.8759 | 0.8916 | 0.8998 | 0.9833 |
| NO_KG | 0.8759 | 0.8472 | 0.8472 | 0.8569 | 0.9828 |
| NO_ATTN | 0.8831 | 0.8366 | 0.8366 | 0.8567 | 0.9727 |
| NO_KG_ATTN | 0.8699 | 0.8187 | 0.8187 | 0.8405 | 0.9736 |
消融实验结果(见表4)表明,完整模型表现最优,平衡准确率达0.8916,宏AUC高达0.9833,显示出知识图谱与注意力机制在中医证候分类中的协同优势。去除知识图谱(NO_KG)后,模型准确率下降至0.8472,表明知识图谱对症状与证候关系的建模至关重要;去除注意力机制(NO_ATTN)后,准确率为0.8366,说明注意力机制有助于聚焦关键症状特征。在两者均去除(NO_KG_ATTN)时,性能降至最低,凸显两者对模型效果的核心支撑作用。
3.3.3 可解释性分析
以患者ID为594的病例为例,其真实与预测证候均为“气阴两虚证”。模型对各症状赋予不同贡献度,反映了它们对诊断结果的重要性。该患者表现出倦怠乏力、出虚汗等气虚症状与口渴、舌尖红等阴虚症状,这些症状的贡献度较高说明具有显著辨证意义。小便特多等症状也提示津液不足,进一步印证气阴两虚的病机。知识图谱展示了症状与证候之间的关联,增强了诊断的逻辑支撑。这种路径推理方式不仅补充了症状的量化信息,也符合中医辨证的思维方式。
4结论
本文提出了一种融合知识图谱与注意力机制的中医证候诊断模型,充分利用中医领域的结构化知识与症状特征信息,增强模型对复杂辨证关系的建模能力。知识图谱帮助模型理解症状与证候之间的语义关联,注意力机制则提升了对关键症状的识别能力。实验表明该方法为构建智能化中医辅助诊断系统提供了有效技术支撑,具有良好的应用前景。未来研究可进一步融合更多元化的信息,除患者症状、舌象脉象外,纳入体质数据、生活习惯等信息,使模型对患者个体情况的刻画更为精准,进一步提升诊断性能和可解释性。
参考文献:
- [1] 国家卫生健康委员会.全国护理事业发展规划(2021—2025年)[J].中国护理管理,2022,22(06):801-804.
- [2] Zhang A H, Sun H, Yan G L, et al. Chinmedomics: A powerful approach integrating metabolomics with serum pharmacochemistry to evaluate the efficacy of traditional Chinese medicine[J].Engineering,2019,5(01):60-68.
- [3] Jiao X, Jin X, Ma Y, et al. A comprehensive application: Molecular docking and network pharmacology for the prediction of bioactive constituents and elucidation of mechanisms of action in component-based Chinese medicine[J].Computational biology and chemistry,2021,90:107402.
- [4] Lin F, Zhang J, Wang Z, et al. Research on feature mining algorithm and disease diagnosis of pulse signal based on piezoelectric sensor[J].Informatics in medicine unlocked,2021,26:100717.
- [5] Xie Y, Hu L, Chen X, et al. Auxiliary diagnosis based on the knowledge graph of TCM syndrome[J].Computers, materials & continua,2020,65(01):481-494.
- [6] 姚帅君,杨继红,闫敬来,等.基于深度学习的名老中医用方经验传承知识图谱研究[J].中国中医图书情报杂志,2024,48(06):125-129.
- [7] 曾子玲,张华敏,于彤,等.知识图谱及其关键技术在中医领域的研究与应用综述[J].世界科学技术-中医现代化,2022,24(02):780-788.
- [8] 崔德华,张惠敏,黄蓉,等.基于CiteSpace的中医体质学说知识图谱可视化分析[J].中华中医杂志,2019,34(02):598-601.
- [9] 陈莹璇,谢炜豪,陈帆,等.中医古籍《灵枢》的知识图谱构建与可视化探讨[J].广州中医药大学学报,2024,41(03):782-790.
- [10] 杜梦男,胡晨骏,叶放,等.周仲瑛教授诊治脑瘤的知识图谱构建与链接预测研究[J].软件导刊,2023,22(07):1-7.
- [11] 王静.基于知识图谱的中医治疗慢性萎缩性胃炎可视化分析[J].湖南中医杂志,2022,38(08):134-142.
- [12] 任高,张伦伦,李冉,等.中医不寐知识图谱构建与知识发现[J].湖南中医药大学学报,2023,43(09):1664-1671.
- [13] 张一帆,朱赠桦,钟方榕,等.基于知识图谱的中医智能养生系统的设计与应用[J].中国数字医学,2023,18(10):77-82.
- [14] 周宗慧,朱青青,孙璇,等.基于Citespace的中医健康管理知识图谱可视化分析[J].天津中医,2022,39(01):30-35.
- [15] Ibrahim T S, Saraya M S, Saleh A I, et al. An efficient graph attention framework enhances bladder cancer prediction[J].Scientific reports,2025,15(01):11127.
- [16] Liu G, Liu F, Gu J, et al. An attention-based deep learning network for lung nodule malignancy discrimination[J]. Frontiers in neuroscience,2023,17:1106937.
- [17] Peng Y, Yan K, Sandfort V, et al. A self-attention based deep learning method for lesion attribute detection from CT reports[C]//2019 IEEE international conference on healthcare informatics (ICHI).2019.
- [18] 顾天宇,严壮志,蒋皆恢.基于支持向量机的中风病中医证候分类[J].中医信息,2021,38(09):1-3.
- [19] 周丽娜,李慧颖,陈晓云,等.基于机器学习构建干燥综合征中医辨证辅助决策模型[J].中华中医杂志,2025,40(01):87-92.
- [20] 张新格,许强,温川飙,等.基于深度学习的中医体质预测模型构建及优化研究(英文)[J].Digital Chinese Medicine,2024,7(03):241-255.
- [21] 何圆姣,刘国华.融合BERT和GCN的中医问诊辅助诊断算法研究[J].南开大学学报(自然科学版),2024,57(02):70-78.
- [22] 蒋寅,张心怡,赵梦竹,等.融入辨治逻辑点的中医辅助诊疗平台医师信任度预调查分析[J].医学新知,2022,32(06):417-423.
