CN111899883A

CN111899883A - 少样本或零样本的疾病预测设备、方法、装置及存储介质

Info

Publication number: CN111899883A
Application number: CN202011048178.5A
Authority: CN
Inventors: 徐啸; 徐衔; 孙瑜尧; 刘小双
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-09-29
Filing date: 2020-09-29
Publication date: 2020-11-06
Anticipated expiration: 2040-09-29
Also published as: CN111899883B

Abstract

本发明实施例涉及医疗技术领域，公开了一种少样本或零样本的疾病预测设备、方法、装置及存储介质，该设备的处理器用于执行：获取与训练集中的历史诊疗数据和历史结局数据的医学知识图谱对应的图结构；将图结构中的初始表征向量输入图注意力神经网络模型得到第一表征向量；根据历史就诊记录的医疗项目和第一表征向量确定第二表征向量；将第一表征向量和第二表征向量输入循环神经网络模型得到历史表征向量，并根据将历史表征向量输入多层感知机模型得到的结局数据确定疾病预测模型；将待测试用户的目标医疗数据输入疾病预测模型得到待测试用户的预测结局数据，实现了对少样本或零样本疾病的预测。本发明涉及区块链技术，上述数据可存储于区块链中。

Description

少样本或零样本的疾病预测设备、方法、装置及存储介质

技术领域

本发明涉及医疗技术领域，尤其涉及一种少样本或零样本的疾病预测设备、方法、装置及存储介质。

背景技术

疾病预测是基于用户的历史就诊信息判断将来可能发生的疾病风险。现有的数据驱动的机器学习方法可以有效构建历史信息表征用于预测任务。但医疗数据中往往容易出现数据量样本不足或不平衡的情况，即某些疾病的样本非常稀缺，甚至没有该疾病的样本，这就使得预测模型在训练过程中很难获取这类疾病的信息，从而在应用中几乎不会给出此类少样本或零样本疾病的正确预测结果。因此，如何更好地预测少样本或零样本疾病非常重要。

发明内容

本发明实施例提供了一种少样本或零样本的疾病预测设备、方法、装置及存储介质，可以实现对少样本或零样本疾病的预测，有助于提高疾病预测的准确率。

第一方面，本发明实施例提供了一种少样本或零样本的疾病预测设备，所述设备包括：存储器和处理器；

所述存储器，用于存储程序指令；

所述处理器，用于调用所述程序指令，当所述程序指令被执行时，用于执行以下操作：

获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；

获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；

将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；

根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；

将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；

获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。

进一步地，所述处理器获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时，具体用于：

获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱；

将所述医学知识图谱转化为图结构，其中，所述图结构包括多条路径，每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成；

所述处理器将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量时，具体用于：

将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型，得到所述每个节点的第一表征向量。

进一步地，所述处理器根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量时，具体用于：

获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点；

根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量；

根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量。

进一步地，所述处理器获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时，具体用于：

根据预设的诊疗数据与医疗项目的映射关系，确定与所述历史诊疗数据对应的医疗项目，所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种；

从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。

进一步地，所述处理器将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据时，具体用于：

将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的预测结果向量；

根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据。

进一步地，所述处理器根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据时，具体用于：

计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离；

确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。

进一步地，所述处理器将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据时，具体用于：

将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结果向量；

根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量，计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离；

确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。

第二方面，本发明实施例提供了一种少样本或零样本的疾病预测方法，包括：

第三方面，本发明实施例提供了一种少样本或零样本的疾病预测装置，包括：

获取单元，用于获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；

第一确定单元，用于获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；

处理单元，用于将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；

第二确定单元，用于根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；

训练单元，用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；

预测单元，用于获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行以实现上述第二方面的方法。

本发明实施例可以获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测，有助于提高疾病预测的准确率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种疾病预测系统的结构示意图；

图2是本发明实施例提供的一种少样本或零样本的疾病预测方法的示意流程图；

图3是本发明实施例提供的一种少样本或零样本的疾病预测装置的示意框图；

图4是本发明实施例提供的一种少样本或零样本的疾病预测设备的示意框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的少样本或零样本的疾病预测方法可以应用于一种疾病预测系统，在某些实施例中，所述疾病预测系统包括医疗服务器和少样本或零样本的疾病预测设备。在某些实施例中，所述医疗服务器可以与少样本或零样本的疾病预测设备建立通信连接。在某些实施例中，所述通信连接的方式可以包括但不限于Wi-Fi、蓝牙、近场通信（Near Field Communication，NFC）等。在某些实施例中，所述医疗服务器用于存储用户的样本医疗数据。

下面结合附图1对本发明实施例提供的疾病预测系统进行示意性说明。

请参见图1，图1是本发明实施例提供的一种疾病预测系统的结构示意图。所述疾病预测系统包括：少样本或零样本的疾病预测设备11和医疗服务器12。在某些实施例中，少样本或零样本的疾病预测设备11与医疗服务器12可以通过无线通信连接方式建立通信连接；其中，在某些场景下，所述少样本或零样本的疾病预测设备11与医疗服务器12之间也可以通过有线通信连接方式建立通信连接。在某些实施例中，所述少样本或零样本的疾病预测设备11可以包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等智能终端设备。

本发明实施例中，少样本或零样本的疾病预测设备11可以从医疗服务器12中获取训练集，所述训练集中包括每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数。少样本或零样本的疾病预测设备11可以获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量，以及将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量。少样本或零样本的疾病预测设备11可以根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量，将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。少样本或零样本的疾病预测设备11可以获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测，有助于提高疾病预测的准确率。

下面结合附图2对本发明实施例提供的少样本或零样本的疾病预测方法进行示意性说明。

请参见图2，图2是本发明实施例提供的一种少样本或零样本的疾病预测方法的示意流程图，如图2所示，该方法可以由少样本或零样本的疾病预测设备执行，所述少样本或零样本的疾病预测设备的具体解释如前所述，此处不再赘述。具体地，本发明实施例的所述方法包括如下步骤。

S201：获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数。

本发明实施例中，少样本或零样本的疾病预测设备可以获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数。在某些实施例中，根据n次历史就诊记录中的每一次就诊记录预测下一次就诊的结局数据。例如，根据第一次历史就诊记录预测得到下一次（即第二次）就诊的疾病诊断结果（即历史结局数据），因此，n次历史就诊记录对应n-1个历史结局数据。

S202：获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量。

本发明实施例中，少样本或零样本的疾病预测设备可以获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量。

在一个实施例中，少样本或零样本的疾病预测设备在获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时，可以获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱，并将所述医学知识图谱转化为图结构，其中，所述图结构包括多条路径，每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成。

S203：将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量。

本发明实施例中，少样本或零样本的疾病预测设备可以将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量。

在一个实施例中，少样本或零样本的疾病预测设备在将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量时，可以将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型，得到所述每个节点的第一表征向量。

S204：根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量。

本发明实施例中，少样本或零样本的疾病预测设备可以根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量。

在一个实施例中，少样本或零样本的疾病预测设备在根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量时，可以获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点，并根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量，以及根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量。

在一个实施例中，少样本或零样本的疾病预测设备在获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时，可以根据预设的诊疗数据与医疗项目的映射关系，确定与所述历史诊疗数据对应的医疗项目，所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种，并从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。

S205：将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。

本发明实施例中，少样本或零样本的疾病预测设备可以将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。

在一个实施例中，少样本或零样本的疾病预测设备在将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据时，可以将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的预测结果向量，并根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据。

在一个实施例中，少样本或零样本的疾病预测设备在根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据时，可以计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离，并确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。

S206：获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。

本发明实施例中，少样本或零样本的疾病预测设备可以获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。在某些实施例中，所述待测试用户的预测结局数据为预测的所述待测试用户下一次就诊的疾病诊断结果。

在一个实施例中，少样本或零样本的疾病预测设备在将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据时，可以将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结果向量；并根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量，计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离；以及确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。

例如，少样本或零样本的疾病预测设备可以将待测试用户的当前就诊的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结果向量；并根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量，计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离；如果距离最小的结局数据的节点对应的疾病诊断结果为新冠肺炎，则可以确定所述待测试用户的预测结局数据为新冠肺炎。

本发明实施例中，少样本或零样本的疾病预测设备可以获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测，有助于提高疾病预测的准确率。

本发明实施例还提供了一种少样本或零样本的疾病预测装置，该少样本或零样本的疾病预测装置用于执行前述任一项所述的方法的单元。具体地，参见图3，图3是本发明实施例提供的一种少样本或零样本的疾病预测装置的示意框图。本实施例的少样本或零样本的疾病预测装置包括：获取单元301、第一确定单元302、处理单元303、第二确定单元304、训练单元305以及预测单元306。

获取单元301，用于获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；

第一确定单元302，用于获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；

处理单元303，用于将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；

第二确定单元304，用于根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；

训练单元305，用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；

预测单元306，用于获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。

进一步地，所述第一确定单元302获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时，具体用于：

所述处理单元303将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量时，具体用于：

进一步地，所述第二确定单元304根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量时，具体用于：

进一步地，所述第二确定单元304获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时，具体用于：

进一步地，所述训练单元305将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据时，具体用于：

进一步地，所述训练单元305根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据时，具体用于：

进一步地，所述预测单元306将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据时，具体用于：

本发明实施例中，少样本或零样本的疾病预测装置可以获取训练集中每个用户的样本医疗数据，其中，所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据，所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种，所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果，n为大于或等于2的正整数；获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构，并确定所述图结构中每个节点的初始表征向量；将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量；根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量；将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；获取待测试用户的目标医疗数据，并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测，有助于提高疾病预测的准确率。

参见图4，图4是本发明实施例提供的一种少样本或零样本的疾病预测设备的示意框图。如图所示的本实施例中的设备可以包括：一个或多个处理器401和存储器402。存储器402用于存储计算机程序，所述计算机程序包括程序，处理器401 用于执行存储器402存储的程序。其中，处理器401被配置用于调用所述程序执行：

进一步地，所述处理器401获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时，具体用于：

所述处理器401将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型，得到所述每个节点的第一表征向量时，具体用于：

进一步地，所述处理器401根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量时，具体用于：

进一步地，所述处理器401获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时，具体用于：

进一步地，所述处理器401将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据时，具体用于：

进一步地，所述处理器401根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据时，具体用于：

进一步地，所述处理器401将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据时，具体用于：

应当理解，在本发明实施例中，所称处理器401可以是中央处理单元 (CenSralProcessing UniS，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (DigiSalSignal Processor，DSP)、专用集成电路 (ApplicaSion Specific InSegraSed CircuiS，ASIC)、现成可编程门阵列 (Field-Programmable GaSe Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器402可以包括只读存储器和随机存取存储器，并向处理器401 提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如，存储器402还可以存储设备类型的信息。

本发明实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现图2所对应实施例中描述的少样本或零样本的疾病预测方法，也可实现本发明图3所对应实施例的少样本或零样本的疾病预测装置，在此不再赘述。

所述计算机可读存储介质可以是前述任一实施例所述的少样本或零样本的疾病预测设备的内部存储单元，例如少样本或零样本的疾病预测设备的硬盘或内存。所述计算机可读存储介质也可以是所述少样本或零样本的疾病预测设备的外部存储设备，例如所述少样本或零样本的疾病预测设备上配备的插接式硬盘，智能存储卡（SmarS Media Card,SMC），安全数字（Secure DigiSal, SD）卡，闪存卡（Flash Card）等。进一步地，所述计算机可读存储介质还可以既包括所述少样本或零样本的疾病预测设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述少样本或零样本的疾病预测设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备 ( 可以是个人计算机，终端，或者网络设备等 ) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括：U 盘、移动硬盘、只读存储器 (ROM，Read-Only Memory)、随机存取存储器 (RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所述，仅为本发明的部分实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。

Claims

1.一种少样本或零样本的疾病预测设备，其特征在于，所述设备包括：存储器和处理器；

所述存储器，用于存储程序指令；

将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；

2.根据权利要求1所述的设备，其特征在于，所述处理器获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时，具体用于：

3.根据权利要求2所述的设备，其特征在于，所述处理器根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量，确定所述每个用户n次历史就诊记录的第二表征向量时，具体用于：

4.根据权利要求3所述的设备，其特征在于，所述处理器获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时，具体用于：

5.根据权利要求1所述的设备，其特征在于，所述处理器将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据时，具体用于：

6.根据权利要求5所述的设备，其特征在于，所述处理器根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量，确定所述每个用户的结局数据时，具体用于：

7.根据权利要求1所述的设备，其特征在于，所述处理器将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型，得到所述待测试用户的预测结局数据时，具体用于：

8.一种少样本或零样本的疾病预测方法，其特征在于，包括：

9.一种少样本或零样本的疾病预测装置，其特征在于，包括：

训练单元，用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型，得到所述每个用户的历史表征向量，并将所述每个用户的历史表征向量输入多层感知机模型，得到所述每个用户的结局数据，并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求8所述的方法。