CN116680412A

CN116680412A - 一种基于知识图谱的中医处方推荐方法

Info

Publication number: CN116680412A
Application number: CN202310690324.1A
Authority: CN
Inventors: 张明川; 王琳; 吴庆涛; 徐文萱; 朱军龙; 赵旭辉; 刘牧华; 郑瑞娟; 冀治航; 张茉莉
Original assignee: Henan University of Science and Technology
Current assignee: Henan University of Science and Technology
Priority date: 2023-06-12
Filing date: 2023-06-12
Publication date: 2023-09-01

Abstract

一种基于知识图谱的中医处方推荐方法，应用了知识图嵌入模型、多头注意力机制、图卷积等将图谱特征与推荐系统相结合，综合考虑患者情况，进行中医处方推荐，以中医医案描述文本为研究对象，融合中医知识图谱信息，吸取名老中医的临床对症下药经验，充分综合考虑药性、功效、病情和患者的体质等多个个性化因素，在于依据中医的整体论原则及辨证论治的思想，根据患者的不同症状和病情归纳证候选择不同的药材组合，提出融合知识图谱的中医处方推荐方法，考虑个人体征及症状和药物之间的复杂关系，结合每个处方具体分析局部规律，为医生和患者推荐更可靠的处方药材，为中医临床诊疗提供辅助决策支持。

Description

一种基于知识图谱的中医处方推荐方法

技术领域

本发明涉及中医处方推荐领域，尤其涉及一种基于知识图谱的中医处方推荐方法。

背景技术

中医是源自中国古代，历经数千年实践及总结归纳的医学理论体系，是中华民族的宝贵财富和智慧结晶。近年来，中国政府高度重视中医药事业的发展和传承，积极采取措施，推动中医药在国内外的传播和应用，进一步促进中医药传承与开放创新发展。中医作为一种独树一帜的医学体系，采用望、闻、问、切等多种方法来获取病症信息，进而实施辨证论治。在中医临床实践中，必须立足于科学的辩证基础，根据患者的个体特征，遵循药材搭配规律来选取适当的药方。中医药方所发挥的功效并非单一药物效果的简单叠加，而是通过药物的综合作用，达到调和人体阴阳平衡，从而使疾病痊愈。

然而，目前中医诊疗主证和兼证区分不开，处方无的放矢，药物配伍杂乱无章，中医经典著作和名方秘法尚未形成规范诊疗的知识模型，基层医生经验不足，受人为因素影响导致治法用药不够客观。当前，中医知识分布于众多古籍和文献中，松散且非结构化的特点使得中医知识的利用率不高。此外，中医注重整体论，需要综合考虑患者的身体、年龄、性别、病史等多方面因素，而非仅仅针对单一症状或疾病进行治疗，目前一些研究使用注意神经网络用于检测中药方剂中不同药物分组等，然而其在个性化方面考虑不足。同时由于草药具有一定的副作用，需通过药材配伍的“君臣佐使”组合来达到平衡药效和防止药物间相互抵消或产生副作用的目的，但目前一些研究如使用BRNN等来学习草药表征，对药材配伍等处理效果不佳，这些问题限制中医的应用和发展。

而中医知识图谱的应用可以极大地提高中医知识的传播。通过中医知识图谱和人工智能算法的结合，可以重新梳理中医理论体系的复杂语义关系，找到其潜在的关联关系，从而使中医理论更加科学化和标准化。智能辅助诊疗系统可以利用中医知识图谱，对病历内容进行语义推理，为医生提供患者病情最相关的诊断证据和治疗方案，从而提高医生工作效率，减少误诊和漏诊的情况，为患者提供个性化的诊疗方案，提高患者的治疗质量。因此，中医辅助诊疗在中医诊疗现代化中扮演着关键角色，融合中医知识图谱信息，构建一种具备辨证论治内涵的智能中医辅助诊疗决策系统，为中医临床诊疗提供辅助决策支持，是促进中医诊疗智能化的发展的重点。

目前由于中医知识体系庞大、复杂，且分布在众多古籍和文献中，因此现有的中医处方推荐无法很好的处理松散、非结构化的知识，导致至中医知识的利用率不高；中医注重整体论，需要需要对患者的身体、年龄、性别、病史等多方面进行考虑，而非单纯地针对某一个症状或疾病进行治疗，但目前的中医处方推荐对患者个性化方面考虑不足；同时由于中药有一定的副作用，在遣药组方的过程中通过“君臣佐使”达到平衡药效和防止药物间相互抵消或产生副作用，然而目前的中医处方推荐对药材配伍的处理效果不好，存在诸多问题。

发明内容

为解决现有的中医处方推荐知识利用率不高，对患者个性化方面考虑不足，对药材配伍处理效果不好的问题，本发明提供了一种基于知识图谱的中医处方推荐方法。

本发明为解决上述技术问题所采用的技术方案是：一种基于知识图谱的中医处方推荐方法，包括以下步骤：

步骤一、收集中医数据并对数据进行预处理，去除重复数据、标准化实体名称；

步骤二、对预处理后的中医数据进行命名实体识别和关系抽取，得到实体集合E和关系集合R，将实体集合E中的实体要素作为节点，将关系集合R中的关系要素作为节点之间的连线，构建中医知识图谱；

步骤三、采用ComplEx模型对中医知识图谱进行表示学习，在中医知识图谱中选出所有症状节点和所有中药节点，并选出与症状节点或中药节点存在关系连线的年龄信息节点、性别信息节点、效用信息节点、药性信息节点、证候信息节点和治法治则信息节点，将上述选出的节点分别表示为复数向量，然后分别计算融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'：

；

上式中，s为症状节点向量表示，h为中药节点向量表示，a为年龄向量表示，W_a为年龄权重矩阵，g为性别向量表示，W_g为性别权重矩阵，tr为治法治则向量表示，W_tr为治法治则权重矩阵，ef为效用向量表示，W_ef为效用权重矩阵，p为药性向量表示，W_pr为药性权重矩阵，sy为证候向量表示，W_sy为证候权重矩阵；

然后通过ComplEx模型的嵌入层对融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'进行基于张量的知识图嵌入，将融合其它信息的症状节点向量表示s'映射到低维向量空间，得到使用图嵌入模型后的症状节点向量表示e_s'，并将融合其它信息的中药节点向量表示h'映射到低维向量空间，得到使用图嵌入模型后的中药节点向量表示e_h'；

然后通过ComplEx模型的得分函数P（e_s'，r，e_h'）对ComplEx模型进行训练并生成推荐训练集；

将使用图嵌入模型后的症状节点向量表示e_s'和使用图嵌入模型后的中药节点向量表示分别表示为：

；

上式中，Re（e_s'）为e_s'的实部，Re（e_h'）为e_h'的实部，Im（e_s'）为e_s'的虚部，Im（e_h'）为e_h'的虚部；

得分函数P（e_s'，r，e_h'）的公式为：

；

上式中，r为e_s'和e_h'之间的关系向量表示，σ为激活函数，Re（r）为r的实部，Im（r）为r的虚部；

步骤四、根据推荐训练集中KG实体的覆盖率，对ComplEx模型经过训练学习到的实体嵌入向量进行冻结或微调：

；

上式中，表示对实体嵌入向量/>进行冻结，/>表示对实体嵌入向量/>进行微调，threshold为实体覆盖率的判定阈值；

步骤五、通过图卷积神经网络学习症状节点自身特征信息r_s和中药节点自身特征信息r_h，症状节点自身特征信息r_s通过症状节点在图卷积神经网络中每一层的向量表示获得，中药节点自身特征信息r_h通过中药节点在图卷积神经网络中每一层的向量表示获得；

对于症状节点s，其一跳邻居草药节点集合为N_s，第k层邻居节点的消息为：

；

症状节点s在图卷积神经网络中第k层的向量表示为：

；

上式中，为症状节点的相邻节点数量，/>为症状节点在第k层的权重矩阵，为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层中药节点传递给症状节点的信息；

对于草药节点h，其一跳邻居症状节点集合为N_h，第k层邻居节点的消息为：

；

中药节点h在图卷积神经网络中第k层的向量表示为：

；

上式中，为中药节点的相邻节点数量，/>为中药节点在第k层的权重矩阵，为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层症状节点传递给中药节点的信息；

步骤六、采用注意力机制将图谱特征与推荐系统相结合，根据使用图嵌入模型后的症状节点向量表示e_s'和症状节点自身特征信息r_s得到症状节点的Query矩阵、Key矩阵和Value 矩阵：

；

根据使用图嵌入模型后的中药节点向量表示e_h'和中药节点自身特征信息r_h得到中药节点的Query矩阵、Key矩阵和 Value 矩阵：

；

分别为从多头注意力层中的三个线性变换层学到的参数矩阵；

然后通过softmax函数计算症状节点的注意力矩阵A_s和中药节点的注意力矩阵A_h：

，式中d_k为维度值；

然后求得症状节点的融合表示向量e_s ^*和中药节点的融合表示向量e_h ^*：

；

步骤七、根据所需辨别的症状实体集合sc构建多热向量x_sc：

；

根据症状节点的融合表示向量e_s ^*得到总体症状矩阵E_s ^*：

；

然后将多热向量x_sc作为掩码，对总体症状矩阵E_s ^*进行抽取，得到辨别证候矩阵M_sc：

，

通过diag函数将多热向量x_sc转换为一个对角矩阵，并使辨别证候矩阵M_sc中的非零行对应于症状实体集合sc中的症状节点的融合表示向量e_s ^*；

然后采用平均池化操作对辨别证候矩阵M_sc进行单一归纳，得到单一表示向量e_sc：

；

将单一表示向量e_sc输入到多层感知机中，进行证候归纳，得到最终证候表示：

多层感知机的表达式为：

；

上式中，W_L为第L层的权重矩阵，b_L为第L层的偏置项，ReLU为非线性激活函数；

将多层感知机的输出作为最终证候表示向量e_z，即e_z=h_L；

步骤八、根据中药节点的融合表示向量e_h ^*得到总体中药矩阵E_H ^*：

；

然后根据最终辨别向量e_z和总体中药矩阵E_H ^*得到预测概率向量m（sc）：

，σ为激活函数；

对于每个候选中药，计算其预测概率与真实标签之间的二元交叉熵损失，并对所有中药求和，假设有H个候选中药，对于症状实体集合sc，通过m（sc）得到一个H维的预测概率向量，记为，模型选择m（sc）中概率最高的前k个中药作为推荐给症状sc的中药处方。

优选的，步骤一中，同时收集结构化数据和非结构化数据，结构化数据包括中医字典、数据库和本体论，非结构化数据包括中医文献、临床记录和专家知识。

根据上述技术方案，本发明的有益效果是：

本发明应用了知识图嵌入模型、多头注意力机制、图卷积等将图谱特征与推荐系统相结合，综合考虑患者情况，进行中医处方推荐。以中医医案描述文本为研究对象，融合中医知识图谱信息，吸取名老中医的临床对症下药经验，充分综合考虑药性、功效、病情和患者的体质等多个个性化因素，在于依据中医的整体论原则及辨证论治的思想，根据患者的不同症状和病情归纳证候选择不同的药材组合，提出融合知识图谱的中医处方推荐方法，考虑个人体征及症状和药物之间的复杂关系，结合每个处方具体分析局部规律，为医生和患者推荐更可靠的处方药材，为中医临床诊疗提供辅助决策支持。

具体实施方式

一种基于知识图谱的中医处方推荐方法，包括以下步骤：

步骤一、收集中医数据并对数据进行预处理，去除重复数据、标准化实体名称。同时收集结构化数据和非结构化数据，结构化数据包括中医字典、数据库和本体论，非结构化数据包括中医文献、临床记录和专家知识。

步骤二、对预处理后的中医数据进行命名实体识别和关系抽取，得到实体集合E和关系集合R，将实体集合E中的实体要素作为节点，将关系集合R中的关系要素作为节点之间的连线，构建中医知识图谱。

；

上式中，s为症状节点向量表示，h为中药节点向量表示，a为年龄向量表示，W_a为年龄权重矩阵，g为性别向量表示，W_g为性别权重矩阵，tr为治法治则向量表示，W_tr为治法治则权重矩阵，ef为效用向量表示，W_ef为效用权重矩阵，p为药性向量表示，W_pr为药性权重矩阵，sy为证候向量表示，W_sy为证候权重矩阵。

然后通过ComplEx模型的嵌入层对融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'进行基于张量的知识图嵌入，将融合其它信息的症状节点向量表示s'映射到低维向量空间，得到使用图嵌入模型后的症状节点向量表示e_s'，并将融合其它信息的中药节点向量表示h'映射到低维向量空间，得到使用图嵌入模型后的中药节点向量表示e_h'。

然后通过ComplEx模型的得分函数P（e_s'，r，e_h'）对ComplEx模型进行训练并生成推荐训练集。

；

上式中，Re（e_s'）为e_s'的实部，Re（e_h'）为e_h'的实部，Im（e_s'）为e_s'的虚部，Im（e_h'）为e_h'的虚部。

得分函数P（e_s'，r，e_h'）的公式为：

；

上式中，r为e_s'和e_h'之间的关系向量表示，σ为激活函数，Re（r）为r的实部，Im（r）为r的虚部。

；

上式中，表示对实体嵌入向量/>进行冻结，/>表示对实体嵌入向量/>进行微调，threshold为实体覆盖率的判定阈值。

步骤五、通过图卷积神经网络学习症状节点自身特征信息和中药节点自身特征信息，症状节点自身特征信息通过症状节点在图卷积神经网络中每一层的向量表示获得，中药节点自身特征信息通过中药节点在图卷积神经网络中每一层的向量表示获得。

；

症状节点s在图卷积神经网络中第k层的向量表示为：

；

上式中，为症状节点的相邻节点数量，/>为症状节点在第k层的权重矩阵，为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层中药节点传递给症状节点的信息。

；

中药节点h在图卷积神经网络中第k层的向量表示为：

；

上式中，为中药节点的相邻节点数量，/>为中药节点在第k层的权重矩阵，为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层症状节点传递给中药节点的信息。

步骤六、采用注意力机制将图谱特征与推荐系统相结合，根据使用图嵌入模型后的症状节点向量表示和症状节点自身特征信息得到症状节点的Query矩阵、Key矩阵和Value 矩阵：

；

分别为从多头注意力层中的三个线性变换层学到的参数矩阵。

，式中d_k为维度值。

。

步骤七、根据所需辨别的症状实体集合sc构建多热向量x_sc：

；

根据症状节点的融合表示向量e_s ^*得到总体症状矩阵E_s ^*：

。

，

通过diag函数将多热向量x_sc转换为一个对角矩阵，并使辨别证候矩阵M_sc中的非零行对应于症状实体集合sc中的症状节点的融合表示向量e_s ^*。

。

将单一表示向量e_sc输入到多层感知机中，进行证候归纳，得到最终证候表示。

多层感知机的表达式为：

；

将多层感知机的输出作为最终证候表示向量e_z，即e_z=h_L。

。

，σ为激活函数。

Claims

1.一种基于知识图谱的中医处方推荐方法，其特征在于，包括以下步骤：

；

得分函数P（e_s'，r，e_h'）的公式为：

；

症状节点s在图卷积神经网络中第k层的向量表示为：

；

上式中，为症状节点的相邻节点数量，/>为症状节点在第k层的权重矩阵，/>为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层中药节点传递给症状节点的信息；

；

中药节点h在图卷积神经网络中第k层的向量表示为：

；

上式中，为中药节点的相邻节点数量，/>为中药节点在第k层的权重矩阵，/>为偏置项，tanh为激活函数，CONCAT为向量拼接操作，/>为第k-1层症状节点传递给中药节点的信息；

；

，式中d_k为维度值；

；

步骤七、根据所需辨别的症状实体集合sc构建多热向量x_sc：

；

根据症状节点的融合表示向量e_s ^*得到总体症状矩阵E_s ^*：

；

，

；

多层感知机的表达式为：

；

将多层感知机的输出作为最终证候表示向量e_z，即e_z=h_L；

；

，σ为激活函数；

2.根据权利要求1所述的一种基于知识图谱的中医处方推荐方法，其特征在于：步骤一中，同时收集结构化数据和非结构化数据，结构化数据包括中医字典、数据库和本体论，非结构化数据包括中医文献、临床记录和专家知识。