CN112037912B

CN112037912B - 基于医疗知识图谱的分诊模型训练方法、装置及设备

Info

Publication number: CN112037912B
Application number: CN202010941859.8A
Authority: CN
Inventors: 李彦轩; 孙行智
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-09-09
Filing date: 2020-09-09
Publication date: 2023-07-11
Anticipated expiration: 2040-09-09
Also published as: CN112037912A; WO2021151325A1

Abstract

本发明涉及一种人工智能技术领域的智能决策应用领域，揭露一种基于医疗知识图谱的分诊模型训练方法、装置、设备及介质，包括：获取医疗知识图谱，采用图神经网络对医疗知识图谱进行表征学习，获取图谱症状向量；获取疾病对应的医学节点集，医学节点集包括同一疾病的症状、用药和检验检查，采用图神经网络对医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量；获取训练症状和与训练症状对应的科室标签，基于训练症状对节点集关联向量进行筛选，获取与训练症状对应的目标向量；采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，对TextCNN模型进行模型训练，获取分诊模型。

Description

基于医疗知识图谱的分诊模型训练方法、装置及设备

技术领域

本发明涉及基于人工智能技术领域的智能决策应用领域，具体提供一种基于医疗知识图谱的分诊模型训练方法、装置、设备及介质。

背景技术

随着计算机技术不断地发展，人工智能技术被应用到生活的方方面面，为人们提供更多便利。近年来，人工智能方法被应用于分诊模型中，以利用分诊模型实现为用户智能化确定科室，提供工作效率。但是现有技术中通常是基于异质图训练得到的分诊模型，该分诊模型的训练过程仅仅依据异质图，没有很好地将医学知识融入到分诊模型的建模的过程中，得到的分诊模型鲁棒性和精度不高。

发明内容

本发明实施例提供一种基于医疗知识图谱的分诊模型训练方法、装置、计算机设备及存储介质，以解决现有分诊模型训练存在的鲁棒性和精度不高的问题。

一种基于医疗知识图谱的分诊模型训练方法，包括：

获取医疗知识图谱，采用图神经网络对所述医疗知识图谱进行表征学习，获取图谱症状向量；

获取疾病对应的医学节点集，所述医学节点集包括同一疾病的症状、用药和检验检查，采用图神经网络对所述医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量；

获取训练症状和与所述训练症状对应的科室标签，基于所述训练症状对所述节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；

采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型。

一种基于医疗知识图谱的分诊模型训练装置，包括：

图谱症状向量获取模块，用于获取医疗知识图谱，采用图神经网络对所述医疗知识图谱进行表征学习，获取图谱症状向量；

节点集关联向量获取模块，用于获取疾病对应的医学节点集，所述医学节点集包括同一疾病的症状、用药和检验检查，采用图神经网络对所述医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量；

目标向量获取模块，用于获取训练症状和与所述训练症状对应的科室标签，基于所述训练症状对所述节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；

分诊模型获取模块，用于采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于医疗知识图谱的分诊模型训练方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于医疗知识图谱的分诊模型训练方法的步骤。

上述基于医疗知识图谱的分诊模型训练方法、装置、计算机设备及存储介质，获取医疗知识图谱，采用图神经网络对所述医疗知识图谱进行表征学习，获取图谱症状向量，可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量，减少人工提取节点特征的工作量。获取疾病对应的医学节点集，采用图神经网络对所述医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量，以实现对同一疾病的信息进行挖掘，深入学习同一疾病的信息间关联性，以使获得的节点集关联向量具有更深层的联系，以提升分诊模型的鲁棒性，使得后续生成的分诊模型准确率更高。采用训练症状对所述节点集关联向量进行筛选，获取与所述训练症状对应的目标向量，确保模型训练样本具有对应关系，保证模型训练的可行性。将采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量作为模型训练样本，采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型，使得分诊模型可反映医学节点深层的关联关系，提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的一应用环境示意图；

图2是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的一流程图；

图3是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图；

图4是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图；

图5是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图；

图6是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图；

图7是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的异质图；

图8是本发明一实施例中基于医疗知识图谱的分诊模型训练装置的一原理框图；

图9是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的基于医疗知识图谱的分诊模型训练方法，该基于医疗知识图谱的分诊模型训练方法可应用如图1所示的应用环境中。具体地，该基于医疗知识图谱的分诊模型训练方法应用在基于医疗知识图谱的分诊模型训练系统中，该基于医疗知识图谱的分诊模型训练系统包括如图1所示的客户端和服务器，客户端与服务器通过网络进行通信，用于实现快速地根据用户的症状输出对应的科室，实现自动化分类，提高工作效率。其中，客户端又称为用户端，是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种基于医疗知识图谱的分诊模型训练方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S201：获取医疗知识图谱，采用图神经网络对医疗知识图谱进行表征学习，获取图谱症状向量。

其中，医疗知识图谱是包括症状(如发热和咳嗽等)、疾病(如肺炎和发烧等)、用药(是指治疗疾病的药，例如泰洛和布洛芬等)和检验检查(检测疾病的项目，例如CT等)等医学节点中至少一种的图谱，该医疗知识图谱具体是依据医学节点对应的医学特征间的关联关系得到的，医疗知识图谱包括同质图和异质图。医学节点包括症状、疾病、用药和检验检查。节点特征是指医学节点对应的特征，例如，医学节点为症状，则节点特征为咳嗽等。

同质图是医学节点和边类型的数量均只有一种的图，该医学节点对应医学概念，边为节点特征是否存在相似关系。也就是说，同质图是同一医学节点的相似的节点特征或者不相似的节点特征组成的图，反映节点特征之间是否存在相似关系的图。同质图包括用药同质图、疾病同质图、症状同质图和检验检查同质图，例如将药效相同的用药相连，药效不同的用药不相连所形成的图确定为用药同质图，在用药同质图中边关系代表对某种疾病的用药组合或成分相近的用药。同理地，将相似的疾病相连，不相似的疾病不相连所形成的图确定为疾病同质图。同理地，将相似的症状相连，不相似的症状不相连所形成的图确定为症状同质图，在症状同质图中，存在边关系的两个节点为相似症状，可能是同一种疾病的两个常见症状，也可能是表现相近的两种症状。

异质图指的是医学节点或边类型的数量大于一种的图，如图7所示。本实施例中，异质图的医学节点包括症状、疾病、用药和检验检查，也就是说，异质图为症状、疾病、用药和检验检查等医学特征对应的节点特征形成的图，异质图中相连的节点特征关联性较强，不相连的节点特征关联性较弱，后续对异质图进行表征学习，得到异质图的深层信息。

本实施例中，采用图神经网络对医疗知识图谱进行表征学习，以得到医疗知识图谱中各个医学节点对应的图谱关联向量，该图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量，并从图谱关联向量中获取图谱症状向量，以便后续对图谱症状向量进行训练。其中，图谱关联向量是指与医疗知识图谱对应的向量。

表征学习是采用计算机学习一个特征的技术的集合，是将数据转换成为能够被机器学习和开发的一种学习形式。本实施例中采用图神经网络对医疗知识图谱进行表征学习，以将医疗知识图谱转化为对应的图谱关联向量。本示例中，医疗知识图谱包括症状、疾病、用药和检验检查等医学节点所形成的图谱，则其对应的图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量。

具体地，采用图神经网络(指图卷积神经网络)学习同质图中同一医学节点对应的各个节点特征和边的关系，依据同质图的节点特征和边之间的关系形成目标同质向量，具体是采用图神经网络(指图卷积神经网络)分别学习用药同质图、疾病同质图、症状同质图和检验检查同质图中各个节点特征和边的关系，依据同质图的节点特征和边之间的关系形成目标同质向量，因此，该目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量，依据同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量初始化图神经网络(指基于注意力机制的异质图神经网络)，采用初始化后的图神经网络对异质图的各个医学节点对应的节点特征进行表征学习，以获取用于表征异质图的医学节点的连接关系的图谱关联向量，该图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量，可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量，减少人工提取节点特征的步骤。本实施例中，依据目标同质向量初始化图神经网络，再利用初始化后的图神经网络对异质图进行表征学习，使得初始化后的图神经网络可以在同质图中医学节点之间的关联性的基础上对异质图进行表征学习，以有效全面地提取异质图的深层信息。

图神经网络旨在将计算机学中的图结构转化成可以量化且对深度学习模型友好的向量形式。图神经网络可以忽略图结构中节点的输入顺序，在计算过程中，节点的表示受其周围邻居节点的影响，但图本身连接不变；图结构的表示，使得可以进行基于图的解释和推理，从而提取图结构的中节点与节点之间的关联关系。图神经网络包括基于注意力机制的异质图神经网络(HAN)和图卷积网络(GCN)等。

S202：获取疾病对应的医学节点集，医学节点集包括同一疾病的症状、用药和检验检查，采用图神经网络对医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量。

其中，医学节点集是以疾病为中心，将同一疾病相关的症状、用药和检验检查的对应的节点特征形成集合。例如，以肺炎为例，与肺炎相关的症状为呼吸困难、咳嗽和发热；与肺炎相关的用药为抗生素；与肺炎相关的检验检查为肺部CT，则肺炎对应的医学节点集为肺炎-呼吸困难、咳嗽和发热-抗生素-肺部CT。

节点集关联向量是表征同一疾病对应的症状、用药和检验检查对应的节点特征的关联关系的向量。

本实施例中，采用图神经网络对同一疾病形成的医学节点集的关系进行表征学习，得到同一疾病的医学节点集关系形成的节点集关联向量，以实现对同一疾病的信息进行挖掘，深入学习同一疾病的节点特征的关联性，以使获得的节点集关联向量具有更深层的联系，以提升分诊模型的鲁棒性，使得后续生成的分诊模型准确率更高。

S203：获取训练症状和与训练症状对应的科室标签，基于训练症状对节点集关联向量进行筛选，获取与训练症状对应的目标向量。

其中，训练症状是指用于进行训练TextCNN模型的症状。科室标签是与训练症状对应的科室，该科室标签为训练标签，例如，若训练症状为皮肤问题，则对应的科室标签为皮肤科。

目标向量是指与训练症状相对应的向量，例如，训练症状对应的症状为咳嗽，则根据该症状从节点集关联向量中筛选出目标向量。本实施例中，根据训练症状对节点集关联向量进行筛选，以匹配出训练症状对应的目标向量，确保模型训练样本具有对应关系，保证模型训练的可行性。

S204：采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，对TextCNN模型进行模型训练，获取分诊模型。

其中，分诊模型是用于根据用户的症状自动化为用户确定对应科室的模型。

本实施例中，基于采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，形成用于进行模型训练的训练样本，将该训练样本输入TextCNN模型进行模型训练，获取分诊模型。可以理解地，图谱症状向量从不同疾病和不同疾病的症状、用药、检验检查的维度为模型提供训练数据，目标向量从同一疾病的的症状、用药、检验检查的维度为模型提供训练数据，因此，可以为模型训练提供全面的信息，且图谱症状向量和目标向量包括了医学节点深层的关联关系，以提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。

本实施例所提供的基于医疗知识图谱的分诊模型训练方法，获取医疗知识图谱，采用图神经网络对医疗知识图谱进行表征学习，获取图谱症状向量，可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量，减少人工提取节点特征的工作量。获取疾病对应的医学节点集，采用图神经网络对医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量，以实现对同一疾病的信息进行挖掘，深入学习同一疾病的信息间关联性，以使获得的节点集关联向量具有更深层的联系，以提升分诊模型的鲁棒性，使得后续生成的分诊模型准确率更高。采用训练症状对节点集关联向量进行筛选，获取与训练症状对应的目标向量，确保模型训练样本具有对应关系，保证模型训练的可行性。将采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量作为模型训练样本，采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，对TextCNN模型进行模型训练，获取分诊模型，使得分诊模型可反映医学节点深层的关联关系，提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。

在一实施例中，如图3所示，步骤S201，即采用图神经网络对医疗知识图谱进行表征学习，获取图谱症状向量，包括：

S301：对医疗知识图谱进行处理，获取图谱邻接矩阵，图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵。

其中，图谱邻接矩阵与医疗知识图谱对应的矩阵，以将医疗知识图谱转化为计算机可以识别的矩阵。同质邻接矩阵是与同质图对应的邻接矩阵。异质邻接矩阵是与异质图对应的邻接矩阵。

本实施例中，根据医疗知识图谱的医学节点获取全集矩阵，具体是依据医学节点对应的节点特征与节点特征之间的关联关系初始化全集矩阵，形成图谱邻接矩阵，该图谱邻接矩阵为计算机可以识别的矩阵。

以异质图为例，异质图中包括肺炎、咳嗽、肺部CT、慢性咽炎和慢严舒柠等节点特征，则该异质图形成的全集矩阵为：

	肺炎	咳嗽	肺部CT	慢性咽炎	慢严舒柠
						肺炎	0	0	0	0	0
咳嗽	0	0	0	0	0
						肺部CT	0	0	0	0	0
慢性咽炎	0	0	0	0	0
						慢严舒柠	0	0	0	0	0

然后，根据节点特征之间的关联关系初始化全集矩阵，具有连接关系的节点特征，则置为1，没有关联关系的节点特征，则置为0，由于肺炎与咳嗽和肺部CT连接，慢性咽炎与咳嗽和慢严舒柠连接，则得到异质图对应的如下所示的异质邻接矩阵：

	肺炎	咳嗽	肺部CT	慢性咽炎	慢严舒柠
						肺炎	0	1	1	0	0
咳嗽	1	0	0	1	0
						肺部CT	1	0	0	0	0
慢性咽炎	0	1	0	0	1
						慢严舒柠	0	0	0	1	0

S302：采用图卷积网络对同质邻接矩阵进行表征学习，获取目标同质向量。

其中，图卷积网络是用于对图片或者其他具有欧几里得结构的图结构进行处理，以提取图结构信息的网络。

目标同质向量是对同质邻接矩阵进行表征学习所获取的向量，该目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量。

本实施例中，采用图卷积网络对同质邻接矩阵进行表征学习，以得到同质图的节点特征的关联关系，使得目标同质向量具有深层的关联关系。

S303：采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化。

具体地，采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化，使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系，从而更好地学习异质图的深层关联信息，使得后续生成的分诊模型鲁棒性较佳，且有助于提高基于注意力机制的异质图神经网络得到图谱关联向量的速度。

本实施例中目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量，可采用同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量，分别对基于注意力机制的异质图神经网络中的症状、疾病、用药和检验检查等节点特征映射前的初始向量进行初始化。

S304：采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习，获取图谱关联向量。

本实施例采用初始化后的基于注意力机制的异质图神经网络能够更好地学习到异质图中的节点特征的深层关联关系，以使得到的图谱关联向量表征异质图的深层信息。

相比于现有技术仅对异质图进行表征学习，得到的医学节点的关联信息较少且不全面，使得训练得到的分诊模型效果不佳，而且现有对异质图进行训练的异质图神经网络常常随机初始化，表征学习过程中不能很好地提取异质图的深层信息的问题。本实施例，采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化，使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系，从而更好地学习异质图的深层关联信息，使得后续生成的分诊模型鲁棒性好且有效提供模型精确性。

本实施例所提供的基于医疗知识图谱的分诊模型训练方法，对医疗知识图谱进行处理，获取图谱邻接矩阵，以得到计算机可以识别并处理的矩阵。采用图卷积网络对同质邻接矩阵进行表征学习，获取目标同质向量，采用图卷积网络对同质邻接矩阵进行表征学习，以得到同质图的医学节点的关联关系，使得目标同质向量具有深层的关联关系。采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化，使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系，以使得到的基于注意力机制的异质图神经网络可以更好地学习异质图的深层关联信息，使得后续生成的分诊模型鲁棒性较佳，且加快了基于注意力机制的异质图神经网络得到图谱关联向量的速度。采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习，获取图谱关联向量，为分诊模型提供深层关联信息的训练数据，以提高分诊模型的精度。

在一实施例中，如图4所示，步骤S301，即对医疗知识图谱进行处理，获取图谱邻接矩阵，包括：

S401：获取医疗知识图谱中的医学节点，基于医学节点确定对应的节点特征。

其中，节点特征是指医学节点对应的节点特征，例如，医学节点为疾病，节点特征为肺炎、发烧和慢性咽炎等。

S402：基于节点特征构建全集矩阵，基于节点特征的连接关系对全集矩阵进行初始化，获取图谱邻接矩阵。

本实施例中，根据医学节点的节点特征之间的关联关系初始化全集矩阵，具有连接关系的节点特征，则置为1，没有关联关系的节点特征，则置为0，根实现节点特征获得计算机可以识别的图谱邻接矩阵，为后续的表征学习提供基础。

本实施例所提供的基于医疗知识图谱的分诊模型训练方法，获取医疗知识图谱中的医学节点，基于医学节点确定对应的节点特征。基于节点特征构建全集矩阵，基于节点特征的连接关系对全集矩阵进行初始化，以获取计算机可以识别的图谱邻接矩阵，为后续的表征学习提供基础。

在一实施例中，如图5所示，步骤S201，即获取医疗知识图谱，包括：

S501：根据至少两种疾病之间的关联关系形成疾病同质图，根据至少两种症状之间的关联关系形成症状同质图，根据至少两种用药之间的关联关系形成用药同质图，根据至少两种检验检查之间的关联关系形成检验检查同质图。

其中，同质图是医学节点和边类型的数量均为一种的图。

作为一示例，服务器查询数据库，以确定各种疾病，根据至少两种疾病的关联关系，形成疾病同质图，例如，若两种疾病是相似的疾病，则两者之间相连；若两种疾病非相似的疾病，则两者之间不相连，以形成疾病同质图。

作为一示例，服务器查询数据库，以确定各种症状，根据至少两种症状的关联关系，形成症状同质图，例如，若两种症状是相似的症状，则两者之间相连，若两种症状非相似的症状，则两者之间不相连，以形成症状同质图。

作为一示例，服务器查询数据库，以确定各种用药，根据至少两种用药的关联关系，形成用药同质图，例如，若两种用药是相似的用药，则两者之间相连，若两种用药非相似的用药，则两者之间不相连，以形成用药同质图。

作为一示例，服务器查询数据库，以确定各种检验检查，根据至少两种检验检查的关联关系，形成检验检查同质图，例如，若两种检验检查是相似的检验检查，则两者之间相连，若两种检验检查非相似的检验检查，则两者之间不相连，以形成检验检查同质图。

S502：将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图。

S503：根据疾病、症状、用药和检验检查的关联关系形成异质图；

本实施例中，服务器查询数据库，以疾病为中心，连接同一疾病对应的症状、用药和检验检查，并根据症状、用药和检验检查连接疾病所形成的关联关系，形成异质图，该异质图中包含不同疾病、症状、用药和检验检查之间的深层的关联关系。

S504：将同质图和异质图，确定为医疗知识图谱。

本实施例所提供的基于医疗知识图谱的分诊模型训练方法，将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图，以反映医疗知识图谱中疾病、症状、用药和检验查验等节点特征对应的目标同质向量，以便后续利用目标同质向量对基于注意力机制的异质图神经网络进行初始化，提取异质图中的深层信息，确保图谱关联向量的信息更加完整。根据疾病、症状、用药和检验检查的关联关系形成异质图，将同质图和异质图，确定为医疗知识图谱，实现后续根据同质图和异质图得到的图谱关联向量更加全面，避免仅对异质图得到的训练数据具有局限性，获得的模型精度不高。

在一实施例中，步骤S202，即采用图神经网络对医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量，包括：将医学节点集对应的节点特征转化为节点集邻接矩阵，采用图神经网络对节点集邻接矩阵进行表征学习，获取节点集关联向量。

本实施例中，将表征同一疾病对应的症状、用药和检验检查关联关系的节点特征进行转化，形成同一疾病对应对应的节点全集矩阵，对节点全集矩阵进行初始化，以得到对应的节点集邻接矩阵，采用图神经网络对节点集邻接矩阵进行表征学习，获取节点集关联向量，以便后续根据节点集关联向量和图谱关联向量得到更为信息更为全面的拼接向量，以得到鲁棒性高、泛化能力强的分诊模型。

在一实施例中，TextCNN模型包括第一嵌入层和第二嵌入层；如图6所示，步骤204，即采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，对TextCNN模型进行模型训练，获取分诊模型，包括：

S601：在第一嵌入层对图谱症状向量进行映射操作，获取图谱嵌入向量。

其中，第一嵌入层是用于对图谱症状向量进行降维处理的层，以使谱图症状向量映射为维数较低的图谱嵌入向量。

本示例中，第一嵌入层中采用预先设置的映射表对图谱症状向量进行处理，以得到图谱嵌入向量，从而减少图谱症状向量的维数，减低后续的运算难度。

S602：在第二嵌入层对目标向量进行映射操作，获取目标嵌入向量。

其中，第二嵌入层是用于对目标向量进行降维处理的层，以使目标向量映射为维数较低的目标嵌入向量。

具体地，在第二嵌入层中采用预先设置的映射表对目标向量进行处理，以得到目标嵌入向量，从而减少目标嵌入向量的维数，减低后续的运算难度。

S603：基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接，获取拼接向量。

其中，拼接向量是根据图谱嵌入向量和目标嵌入向量得到的向量，以形成具有深层意义的向量，本示例中，在分诊模型训练过程中充分利用获取信息更为全面的拼接向量，使得获取的分诊模型泛化能力强，鲁棒性高。

本实施例中，采用TensorFlow的tf.concat()函数对图谱嵌入向量和目标嵌入向量进行拼接，快速得到拼接向量。

S604：在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果。

其中，预测输出结果是预测的与训练症状对应的科室结果。

本实施例中，采用输出层计算训练症状对应的可能的科室的概率，并将概率最大的科室作为预测输出结果，以实现依据模型训练样本得到对应的预测输出结果。

S605：基于预测输出结果与科室标签，计算预测误差损失，根据预测误差损失，更新TextCNN模型的参数，在TextCNN模型收敛时，获取分诊模型。

本实施例中，预测误差损失是表示预测输出结果与科室标签的误差。

具体地，对预测误差损失进行求偏导得到梯度值，根据梯度值更新TextCNN模型的参数，实现对TextCNN模型的调优，当预测误差损失小于预设阈值，则TextCNN模型收敛，将textcnn模型确定为分诊模型；若否，则重复步骤S601-S605，直至TextCNN模型收敛。

本实施例所提供的基于医疗知识图谱的模型训练，在第一嵌入层对图谱症状向量进行映射操作，获取图谱嵌入向量，在第二嵌入层对目标向量进行映射操作，获取目标嵌入向量，从而减少图谱症状向量的维数，减低后续的运算难度。基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接，获取拼接向量，在分诊模型训练过程中充分利用获取信息更为全面的拼接向量，使得获取的分诊模型泛化能力强，鲁棒性高。在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果。基于预测输出结果与科室标签，计算预测误差损失，根据预测误差损失，更新TextCNN模型的参数，在TextCNN模型收敛时，获取分诊模型。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种基于医疗知识图谱的分诊模型训练装置，该基于医疗知识图谱的分诊模型训练装置与上述实施例中基于医疗知识图谱的分诊模型训练方法一一对应。如图8所示，该基于医疗知识图谱的分诊模型训练装置包括图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804。各功能模块详细说明如下：

图谱症状向量获取模块801，用于获取医疗知识图谱，采用图神经网络对医疗知识图谱进行表征学习，获取图谱症状向量；

节点集关联向量获取模块802，用于获取疾病对应的医学节点集，医学节点集包括同一疾病的症状、用药和检验检查，采用图神经网络对医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量；

目标向量获取模块803，用于获取训练症状和与训练症状对应的科室标签，基于训练症状对节点集关联向量进行筛选，获取与训练症状对应的目标向量；

分诊模型获取模块804，用于采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量，对TextCNN模型进行模型训练，获取分诊模型。

优选地，图谱症状向量获取模块801，包括：图谱邻接矩阵获取单元、目标同质向量获取单元、初始化单元和图谱关联向量获取单元。

图谱邻接矩阵获取单元，用于对医疗知识图谱进行处理，获取图谱邻接矩阵，图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵；

目标同质向量获取单元，用于采用图卷积网络对同质邻接矩阵进行表征学习，获取目标同质向量；

初始化单元，用于采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化；

图谱关联向量获取单元，用于采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习，获取图谱关联向量。

优选地，图谱邻接矩阵获取单元，包括：节点特征确定子单元和图谱邻接矩阵获取子单元。

节点特征确定子单元，用于获取医疗知识图谱中的医学节点，基于医学节点确定对应的节点特征；

图谱邻接矩阵获取子单元，用于基于节点特征构建全集矩阵，基于节点特征的连接关系对全集矩阵进行初始化，获取图谱邻接矩阵。

优选地，图谱症状向量获取模块801，包括：关联关系确定单元、同质图确定单元、异质图确定单元和医疗知识图谱确定单元。

关联关系确定单元，用于根据至少两种疾病之间的关联关系形成疾病同质图，根据至少两种症状之间的关联关系形成症状同质图，根据至少两种用药之间的关联关系形成用药同质图，根据至少两种检验检查之间的关联关系形成检验检查同质图；

同质图确定单元，用于将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图；

异质图确定单元，用于根据疾病、症状、用药和检验检查的关联关系形成异质图，

医疗知识图谱确定单元，用于将同质图和异质图，确定为医疗知识图谱。

优选地，节点集关联向量获取模块802，包括：节点集关联向量获取单元。

节点集关联向量获取单元，用于将医学节点集对应的节点特征转化为节点集邻接矩阵，采用图神经网络对节点集邻接矩阵进行表征学习，获取节点集关联向量。

优选地，分诊模型获取模块804，包括：图谱嵌入向量获取单元、目标嵌入向量获取单元、拼接向量获取单元、预测输出结果获取单元和分诊模型获取单元。

图谱嵌入向量获取单元，用于在第一嵌入层对图谱症状向量进行映射操作，获取图谱嵌入向量；

目标嵌入向量获取单元，用于在第二嵌入层对目标向量进行映射操作，获取目标嵌入向量；

拼接向量获取单元，用于基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接，获取拼接向量；

预测输出结果获取单元，用于在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果；

分诊模型获取单元，用于基于预测输出结果与科室标签，计算预测误差损失，根据预测误差损失，更新TextCNN模型的参数，在TextCNN模型收敛时，获取分诊模型。

关于基于医疗知识图谱的分诊模型训练装置的具体限定可以参见上文中对于基于医疗知识图谱的分诊模型训练方法的限定，在此不再赘述。上述基于医疗知识图谱的分诊模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异质图。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于医疗知识图谱的分诊模型训练方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中基于医疗知识图谱的分诊模型训练方法的步骤，例如图2所示的步骤S201-S204，或者图3至图6中所示的步骤，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现基于医疗知识图谱的分诊模型训练装置这一实施例中的各模块/单元的功能，例如图8所示的图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804的功能，为避免重复，这里不再赘述。

在一实施例中，提供一计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中基于医疗知识图谱的分诊模型训练方法的步骤，例如图2所示的步骤S201-S204，或者图3至图6中所示的步骤，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现基于医疗知识图谱的分诊模型训练装置这一实施例中的各模块/单元的功能，例如图8所示的图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804的功能，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于医疗知识图谱的分诊模型训练方法，其特征在于，包括：

所述采用图神经网络对所述医疗知识图谱进行表征学习，获取图谱症状向量，包括：

对所述医疗知识图谱进行处理，获取图谱邻接矩阵，所述图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵；

采用图卷积网络对同质邻接矩阵进行表征学习，获取目标同质向量；

采用所述目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化；

采用初始化后的基于注意力机制的异质图神经网络对所述异质邻接矩阵进行表征学习，获取图谱关联向量；

采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型；

所述TextCNN模型包括第一嵌入层和第二嵌入层；所述采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型，包括：

在所述第一嵌入层对所述图谱症状向量进行映射操作，获取图谱嵌入向量；

在所述第二嵌入层对所述目标向量进行映射操作，获取目标嵌入向量；

基于训练症状对所述图谱嵌入向量和所述目标嵌入向量进行拼接，获取拼接向量；

在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将所述卷积关联向量输入输出层，获取预测输出结果；

基于所述预测输出结果与所述科室标签，计算预测误差损失，根据预测误差损失，更新所述TextCNN模型的参数，在所述TextCNN模型收敛时，获取分诊模型。

2.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法，其特征在于，所述对所述医疗知识图谱进行处理，获取图谱邻接矩阵，包括：

获取所述医疗知识图谱中的医学节点，基于所述医学节点确定对应的节点特征；

基于所述节点特征构建全集矩阵，基于所述节点特征的连接关系对所述全集矩阵进行初始化，获取图谱邻接矩阵。

3.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法，其特征在于，所述获取医疗知识图谱，包括：

根据至少两种疾病之间的关联关系形成疾病同质图，根据至少两种症状之间的关联关系形成症状同质图，根据至少两种用药之间的关联关系形成用药同质图，根据至少两种检验检查之间的关联关系形成检验检查同质图；

将所述疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图；

根据疾病、症状、用药和检验检查的关联关系形成异质图；

将所述同质图和所述异质图，确定为医疗知识图谱。

4.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法，其特征在于，所述采用图神经网络对所述医学节点集进行表征学习，获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量，包括：

将所述医学节点集对应的节点特征转化为节点集邻接矩阵，采用图神经网络对所述节点集邻接矩阵进行表征学习，获取节点集关联向量。

5.一种基于医疗知识图谱的分诊模型训练装置，其特征在于，包括：

所述图谱症状向量获取模块，包括：

图谱邻接矩阵获取单元，用于对所述医疗知识图谱进行处理，获取图谱邻接矩阵，所述图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵；

初始化单元，用于采用所述目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化；

图谱关联向量获取单元，用于采用初始化后的基于注意力机制的异质图神经网络对所述异质邻接矩阵进行表征学习，获取图谱关联向量；

分诊模型获取模块，用于采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量，对TextCNN模型进行模型训练，获取分诊模型；

6.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述基于医疗知识图谱的分诊模型训练方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述基于医疗知识图谱的分诊模型训练方法的步骤。