CN113593698B

CN113593698B - 一种基于图注意网络的中医证型识别方法

Info

Publication number: CN113593698B
Application number: CN202110884629.7A
Authority: CN
Inventors: 张云; 杨世刚; 刘勇国; 朱嘉静; 李巧勤; 杨尚明
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-08-03
Filing date: 2021-08-03
Publication date: 2023-04-18
Anticipated expiration: 2041-08-03
Also published as: CN113593698A

Abstract

本发明公开了一种基于图注意网络的中医证型识别方法，其包括将多个医案数据进行标准化，并构建训练集，即语料库数据；将语料库中的所有不重复的症状和证型分别建立一个症状集合和一个证型集合；将属于训练集的每个医案数据中的症状各自两两相连作为节点，计算症状集合中两个症状间的点互信息，并利用图注意力网络更新图中的节点；利用注意力机制加权更新后的节点，得到症状的特征向量；将特征向量输入一个线性层进行分类，得到每个证型的概率；结合每个证型的概率与训练集中真实的情况，计算损失函数；根据损失函数进行反向传播，完成模型迭代；将待识别的症状信息输入训练后的模型得到证型识别结果。本发明有效提高了证型识别的准确性。

Description

一种基于图注意网络的中医证型识别方法

技术领域

本发明涉及中医证型识别系统领域，一种基于图注意网络的中医证型识别方法。

背景技术

中医药有超过3000年的历史，为中华人民的医疗健康提供了重要保障。中医诊疗可以划分为3个过程：辨证、立法和组方，其中辨证是医生根据四诊信息综合判断患者目前的状态，得到证型的过程，是决定整个中医诊疗的关键步骤。传统的中医辨证识别方法首先提前预设好每个症状对于每个证型的决定权重，然后计算各个证型的得分，取较高分数的证型作为系统的输出。例如早期的帕金森病中医证型识别系统，其中的证型识别模块通过临床症状来识别早期帕金森病患者的中医证型，该方法将获得的症状对应赋值分别代入四个中医辨证分型判别函数中计算以得到四个对应得分，得分最高对应的中医辨证分型识别为早期帕金森病患者的目标中医辨证分型，但是该方法所得结果准确度不高。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于图注意网络的中医证型识别方法解决了传统方法证型识别结果精确度不高的问题。

为了达到上述发明目的，本发明采用的技术方案为：

提供一种基于图注意网络的中医证型识别方法，其包括以下步骤：

S1、将多个医案数据进行标准化，并构建训练集，用属于训练集的医案数据建立用于模型训练的语料库数据；

S2、将语料库中的所有不重复的症状建立成一个症状集合，将语料库中的所有不重复的证型建立成一个证型集合，并完成初始化；

S3、将属于训练集的每个医案数据中的症状各自两两相连作为节点，计算症状集合中两个症状间的点互信息，并利用图注意网络对节点进行信息更新；

S4、结合点互信息，利用注意力机制加权更新后的节点，得到症状的特征向量；

S5、将特征向量输入一个线性层进行证型分类，得到每个证型的概率；其中概率最高的证型即为证型识别结果；

S6、结合每个证型的概率与训练集中真实的情况，计算损失函数；

S7、根据损失函数进行反向传播，完成模型迭代；

S8、将待识别的症状信息输入训练后的模型得到证型识别结果。

进一步地，步骤S2初始化时，每个症状随机初始化为100维向量，训练批处理大小设置为32，学习率设置为0.001，迭代轮次设置为20。

进一步地，步骤S3的具体方法为：

根据公式：

score_j＝cos(h_j,h_i)

获取更新后的节点信息h′_i；其中h′_i为更新后的节点信息，即更新后的症状s_i的特征向量，h_i为更新前的节点信息，即更新前的症状s_i的特征向量，h_j为症状s_i的相邻症状s_j的特征向量，α为权重调节系数，|N_i|为症状s_i的相邻症状集合N_i的大小，β_j为症状s_i与相邻症状s_j的相似度，e为自然对数，score_j为症状s_i与相邻症状s_j的余弦分数，cos(·)为余弦函数，

为症状s_i和症状s_j的点互信息，P(s_i,s_j)为症状s_i和症状s_j出现在同一个医案数据中的概率，P(s_i)为症状s_i出现的概率，P(s_j)为症状s_j出现的概率，log[·]为对数函数，|·|为取模。

进一步地，步骤S4的具体方法为：

根据公式：

获取症状的特征向量H；其中γ_i为经过softmax归一化的症状s_i的权重，|X|为一个医案数据中症状的个数，attention_i为中间参数，

为节点特征向量h′_i的加权参数，且在训练开始时获得随机初始化，*为点积。

进一步地，步骤S6的具体方法为：

根据公式：

获取损失函数L；c_i为线性层的输出，即第i个证型的概率，y_i为输出的概率与真实情况的比较结果，若输出的概率与真实情况相等则y_i＝1，否则y_i＝0，|T|为输出证型的类别数，log为对数函数。

本发明的有益效果为：在大规模语料库上进行训练，利用图注意网络的节点信息更新过程融合了症状间的点互信息，能够更好地建立症状间的联系，更好地表示症状特征；在图信息导出时，利用注意力机制对各个症状节点信息分配权重，能够有效提升证型识别结果的准确度。

附图说明

图1为本发明的流程图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，该基于图注意网络的中医证型识别方法包括以下步骤：

S7、根据损失函数进行反向传播，完成模型迭代；

步骤S2初始化时，每个症状随机初始化为100维向量，训练批处理大小设置为32，学习率设置为0.001，迭代轮次设置为20。

步骤S3的具体方法为：

根据公式：

score_j＝cos(h_j,h_i)

步骤S4的具体方法为：

根据公式：

步骤S6的具体方法为：

根据公式：

训练集中的每个医案数据的症状都可表示为向量，该向量来自于症状嵌入矩阵，训练开始时，该矩阵进行一次随机初始化，并利用多个医案数据构建训练集和测试集，训练结束后，利用测试集对训练结果进行测试，以检测训练结果是否准确。

本发明在大规模语料库上进行训练，利用图注意网络的节点信息更新过程融合了症状间的点互信息，能够更好地建立症状间的联系，更好地表示症状特征；在图信息导出时，利用注意力机制对各个症状节点信息分配权重，能够有效提升证型识别结果的准确度。

Claims

1.一种基于图注意网络的中医证型识别方法，其特征在于，包括以下步骤：

S3、将属于训练集的每个医案数据中的症状各自两两相连作为节点，计算症状集合中两个症状间的点互信息，并利用图注意网络对节点进行信息更新；具体方法为：

根据公式：

score_j＝cos(h_j,h_i)

获取更新后的节点信息h_i′；其中h_i′为更新后的节点信息，即更新后的症状s_i的特征向量，h_i为更新前的节点信息，即更新前的症状s_i的特征向量，h_j为症状s_i的相邻症状s_j的特征向量，α为权重调节系数，|N_i|为症状s_i的相邻症状集合N_i的大小，β_j为症状s_i与相邻症状s_j的相似度，e为自然对数，score_j为症状s_i与相邻症状s_j的余弦分数，cos(·)为余弦函数，

为症状s_i和症状s_j的点互信息，P(s_i,s_j)为症状s_i和症状s_j出现在同一个医案数据中的概率，P(s_i)为症状s_i出现的概率，P(s_j)为症状s_j出现的概率，log[·]为对数函数，|·|为取模；

S4、结合点互信息，利用注意力机制加权更新后的节点，得到症状的特征向量；具体方法为：

根据公式：

为节点特征向量h_i′的加权参数，且在训练开始时获得随机初始化，*为点积；

S7、根据损失函数进行反向传播，完成模型迭代；

2.根据权利要求1所述的一种基于图注意网络的中医证型识别方法，其特征在于，步骤S2初始化时，每个症状随机初始化为100维向量，训练批处理大小设置为32，学习率设置为0.001，迭代轮次设置为20。

3.根据权利要求1所述的一种基于图注意网络的中医证型识别方法，其特征在于，步骤S6的具体方法为：

根据公式：