CN111899883A - 少样本或零样本的疾病预测设备、方法、装置及存储介质 - Google Patents

少样本或零样本的疾病预测设备、方法、装置及存储介质 Download PDF

Info

Publication number
CN111899883A
CN111899883A CN202011048178.5A CN202011048178A CN111899883A CN 111899883 A CN111899883 A CN 111899883A CN 202011048178 A CN202011048178 A CN 202011048178A CN 111899883 A CN111899883 A CN 111899883A
Authority
CN
China
Prior art keywords
user
historical
data
characterization vector
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011048178.5A
Other languages
English (en)
Other versions
CN111899883B (zh
Inventor
徐啸
徐衔
孙瑜尧
刘小双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011048178.5A priority Critical patent/CN111899883B/zh
Publication of CN111899883A publication Critical patent/CN111899883A/zh
Application granted granted Critical
Publication of CN111899883B publication Critical patent/CN111899883B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明实施例涉及医疗技术领域,公开了一种少样本或零样本的疾病预测设备、方法、装置及存储介质,该设备的处理器用于执行:获取与训练集中的历史诊疗数据和历史结局数据的医学知识图谱对应的图结构;将图结构中的初始表征向量输入图注意力神经网络模型得到第一表征向量;根据历史就诊记录的医疗项目和第一表征向量确定第二表征向量;将第一表征向量和第二表征向量输入循环神经网络模型得到历史表征向量,并根据将历史表征向量输入多层感知机模型得到的结局数据确定疾病预测模型;将待测试用户的目标医疗数据输入疾病预测模型得到待测试用户的预测结局数据,实现了对少样本或零样本疾病的预测。本发明涉及区块链技术,上述数据可存储于区块链中。

Description

少样本或零样本的疾病预测设备、方法、装置及存储介质
技术领域
本发明涉及医疗技术领域,尤其涉及一种少样本或零样本的疾病预测设备、方法、装置及存储介质。
背景技术
疾病预测是基于用户的历史就诊信息判断将来可能发生的疾病风险。现有的数据驱动的机器学习方法可以有效构建历史信息表征用于预测任务。但医疗数据中往往容易出现数据量样本不足或不平衡的情况,即某些疾病的样本非常稀缺,甚至没有该疾病的样本,这就使得预测模型在训练过程中很难获取这类疾病的信息,从而在应用中几乎不会给出此类少样本或零样本疾病的正确预测结果。因此,如何更好地预测少样本或零样本疾病非常重要。
发明内容
本发明实施例提供了一种少样本或零样本的疾病预测设备、方法、装置及存储介质,可以实现对少样本或零样本疾病的预测,有助于提高疾病预测的准确率。
第一方面,本发明实施例提供了一种少样本或零样本的疾病预测设备,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
进一步地,所述处理器获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时,具体用于:
获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱;
将所述医学知识图谱转化为图结构,其中,所述图结构包括多条路径,每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成;
所述处理器将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量时,具体用于:
将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
进一步地,所述处理器根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量时,具体用于:
获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点;
根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
进一步地,所述处理器获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时,具体用于:
根据预设的诊疗数据与医疗项目的映射关系,确定与所述历史诊疗数据对应的医疗项目,所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种;
从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。
进一步地,所述处理器将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据时,具体用于:
将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的预测结果向量;
根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据。
进一步地,所述处理器根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据时,具体用于:
计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离;
确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。
进一步地,所述处理器将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据时,具体用于:
将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;
根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;
确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。
第二方面,本发明实施例提供了一种少样本或零样本的疾病预测方法,包括:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
第三方面,本发明实施例提供了一种少样本或零样本的疾病预测装置,包括:
获取单元,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
第一确定单元,用于获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
处理单元,用于将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
第二确定单元,用于根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
训练单元,用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第二方面的方法。
本发明实施例可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测,有助于提高疾病预测的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种疾病预测系统的结构示意图;
图2是本发明实施例提供的一种少样本或零样本的疾病预测方法的示意流程图;
图3是本发明实施例提供的一种少样本或零样本的疾病预测装置的示意框图;
图4是本发明实施例提供的一种少样本或零样本的疾病预测设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的少样本或零样本的疾病预测方法可以应用于一种疾病预测系统,在某些实施例中,所述疾病预测系统包括医疗服务器和少样本或零样本的疾病预测设备。在某些实施例中,所述医疗服务器可以与少样本或零样本的疾病预测设备建立通信连接。在某些实施例中,所述通信连接的方式可以包括但不限于Wi-Fi、蓝牙、近场通信(Near Field Communication,NFC)等。在某些实施例中,所述医疗服务器用于存储用户的样本医疗数据。
下面结合附图1对本发明实施例提供的疾病预测系统进行示意性说明。
请参见图1,图1是本发明实施例提供的一种疾病预测系统的结构示意图。所述疾病预测系统包括:少样本或零样本的疾病预测设备11和医疗服务器12。在某些实施例中,少样本或零样本的疾病预测设备11与医疗服务器12可以通过无线通信连接方式建立通信连接;其中,在某些场景下,所述少样本或零样本的疾病预测设备11与医疗服务器12之间也可以通过有线通信连接方式建立通信连接。在某些实施例中,所述少样本或零样本的疾病预测设备11可以包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等智能终端设备。
本发明实施例中,少样本或零样本的疾病预测设备11可以从医疗服务器12中获取训练集,所述训练集中包括每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数。少样本或零样本的疾病预测设备11可以获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量,以及将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量。少样本或零样本的疾病预测设备11可以根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量,将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。少样本或零样本的疾病预测设备11可以获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测,有助于提高疾病预测的准确率。
下面结合附图2对本发明实施例提供的少样本或零样本的疾病预测方法进行示意性说明。
请参见图2,图2是本发明实施例提供的一种少样本或零样本的疾病预测方法的示意流程图,如图2所示,该方法可以由少样本或零样本的疾病预测设备执行,所述少样本或零样本的疾病预测设备的具体解释如前所述,此处不再赘述。具体地,本发明实施例的所述方法包括如下步骤。
S201:获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数。
本发明实施例中,少样本或零样本的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数。在某些实施例中,根据n次历史就诊记录中的每一次就诊记录预测下一次就诊的结局数据。例如,根据第一次历史就诊记录预测得到下一次(即第二次)就诊的疾病诊断结果(即历史结局数据),因此,n次历史就诊记录对应n-1个历史结局数据。
S202:获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量。
本发明实施例中,少样本或零样本的疾病预测设备可以获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量。
在一个实施例中,少样本或零样本的疾病预测设备在获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时,可以获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱,并将所述医学知识图谱转化为图结构,其中,所述图结构包括多条路径,每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成。
S203:将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
本发明实施例中,少样本或零样本的疾病预测设备可以将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
在一个实施例中,少样本或零样本的疾病预测设备在将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量时,可以将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
S204:根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
本发明实施例中,少样本或零样本的疾病预测设备可以根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
在一个实施例中,少样本或零样本的疾病预测设备在根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量时,可以获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点,并根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量,以及根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
在一个实施例中,少样本或零样本的疾病预测设备在获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时,可以根据预设的诊疗数据与医疗项目的映射关系,确定与所述历史诊疗数据对应的医疗项目,所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种,并从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。
S205:将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。
本发明实施例中,少样本或零样本的疾病预测设备可以将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型。
在一个实施例中,少样本或零样本的疾病预测设备在将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据时,可以将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的预测结果向量,并根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据。
在一个实施例中,少样本或零样本的疾病预测设备在根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据时,可以计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离,并确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。
S206:获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
本发明实施例中,少样本或零样本的疾病预测设备可以获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。在某些实施例中,所述待测试用户的预测结局数据为预测的所述待测试用户下一次就诊的疾病诊断结果。
在一个实施例中,少样本或零样本的疾病预测设备在将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据时,可以将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;并根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;以及确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。
例如,少样本或零样本的疾病预测设备可以将待测试用户的当前就诊的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;并根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;如果距离最小的结局数据的节点对应的疾病诊断结果为新冠肺炎,则可以确定所述待测试用户的预测结局数据为新冠肺炎。
本发明实施例中,少样本或零样本的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测,有助于提高疾病预测的准确率。
本发明实施例还提供了一种少样本或零样本的疾病预测装置,该少样本或零样本的疾病预测装置用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种少样本或零样本的疾病预测装置的示意框图。本实施例的少样本或零样本的疾病预测装置包括:获取单元301、第一确定单元302、处理单元303、第二确定单元304、训练单元305以及预测单元306。
获取单元301,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
第一确定单元302,用于获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
处理单元303,用于将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
第二确定单元304,用于根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
训练单元305,用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元306,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
进一步地,所述第一确定单元302获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时,具体用于:
获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱;
将所述医学知识图谱转化为图结构,其中,所述图结构包括多条路径,每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成;
所述处理单元303将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量时,具体用于:
将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
进一步地,所述第二确定单元304根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量时,具体用于:
获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点;
根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
进一步地,所述第二确定单元304获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时,具体用于:
根据预设的诊疗数据与医疗项目的映射关系,确定与所述历史诊疗数据对应的医疗项目,所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种;
从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。
进一步地,所述训练单元305将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据时,具体用于:
将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的预测结果向量;
根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据。
进一步地,所述训练单元305根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据时,具体用于:
计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离;
确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。
进一步地,所述预测单元306将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据时,具体用于:
将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;
根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;
确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。
本发明实施例中,少样本或零样本的疾病预测装置可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测,有助于提高疾病预测的准确率。
参见图4,图4是本发明实施例提供的一种少样本或零样本的疾病预测设备的示意框图。如图所示的本实施例中的设备可以包括:一个或多个处理器401和存储器402。存储器402用于存储计算机程序,所述计算机程序包括程序,处理器401 用于执行存储器402存储的程序。其中,处理器401被配置用于调用所述程序执行:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,以及根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
进一步地,所述处理器401获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时,具体用于:
获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱;
将所述医学知识图谱转化为图结构,其中,所述图结构包括多条路径,每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成;
所述处理器401将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量时,具体用于:
将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
进一步地,所述处理器401根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量时,具体用于:
获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点;
根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
进一步地,所述处理器401获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时,具体用于:
根据预设的诊疗数据与医疗项目的映射关系,确定与所述历史诊疗数据对应的医疗项目,所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种;
从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。
进一步地,所述处理器401将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据时,具体用于:
将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的预测结果向量;
根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据。
进一步地,所述处理器401根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据时,具体用于:
计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离;
确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。
进一步地,所述处理器401将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据时,具体用于:
将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;
根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;
确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。
本发明实施例中,少样本或零样本的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。通过这种方式可以实现对少样本或零样本的疾病的预测,有助于提高疾病预测的准确率。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元 (CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (DigiSalSignal Processor,DSP)、专用集成电路 (ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列 (Field-Programmable GaSe Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器402可以包括只读存储器和随机存取存储器,并向处理器401 提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如,存储器402还可以存储设备类型的信息。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图2所对应实施例中描述的少样本或零样本的疾病预测方法,也可实现本发明图3所对应实施例的少样本或零样本的疾病预测装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的少样本或零样本的疾病预测设备的内部存储单元,例如少样本或零样本的疾病预测设备的硬盘或内存。所述计算机可读存储介质也可以是所述少样本或零样本的疾病预测设备的外部存储设备,例如所述少样本或零样本的疾病预测设备上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal, SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述少样本或零样本的疾病预测设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述少样本或零样本的疾病预测设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备 ( 可以是个人计算机,终端,或者网络设备等 ) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U 盘、移动硬盘、只读存储器 (ROM,Read-Only Memory)、随机存取存储器 (RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种少样本或零样本的疾病预测设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
2.根据权利要求1所述的设备,其特征在于,所述处理器获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构时,具体用于:
获取与所述历史诊疗数据和所述历史结局数据对应的医学知识图谱;
将所述医学知识图谱转化为图结构,其中,所述图结构包括多条路径,每条路径由多个历史诊断数据的节点、一个历史结局数据的节点以及多条边组成;
所述处理器将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量时,具体用于:
将所述图结构中的每条路径中每个节点的初始表征向量分别输入图注意力神经网络模型,得到所述每个节点的第一表征向量。
3.根据权利要求2所述的设备,其特征在于,所述处理器根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量时,具体用于:
获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点;
根据所述医疗项目对应的各个节点的第一表征向量确定所述医疗项目对应的项目表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目的项目表征向量和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量。
4.根据权利要求3所述的设备,其特征在于,所述处理器获取所述每个用户的n次历史就诊记录所涉及的医疗项目对应的各个节点时,具体用于:
根据预设的诊疗数据与医疗项目的映射关系,确定与所述历史诊疗数据对应的医疗项目,所述医疗项目包括诊疗、手术、麻醉、检查、化疗中的一种或多种;
从所述图结构中获取与所述历史诊疗数据的医疗项目对应的一个或多个节点。
5.根据权利要求1所述的设备,其特征在于,所述处理器将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据时,具体用于:
将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的预测结果向量;
根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据。
6.根据权利要求5所述的设备,其特征在于,所述处理器根据所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量,确定所述每个用户的结局数据时,具体用于:
计算所述每个用户的预测结果向量与所述每个用户n-1次历史就诊记录中的疾病诊断结果的各节点对应的表征向量之间的距离;
确定距离最小的节点对应的疾病诊断结果为所述每个用户的结局数据。
7.根据权利要求1所述的设备,其特征在于,所述处理器将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据时,具体用于:
将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结果向量;
根据所述预测结果向量和所述图结构中所有结局数据的节点的表征向量,计算所述预测结果向量与所述图结构中每个结局数据的节点的表征向量的距离;
确定距离最小的结局数据的节点对应的疾病诊断结果为所述待测试用户的预测结局数据。
8.一种少样本或零样本的疾病预测方法,其特征在于,包括:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
9.一种少样本或零样本的疾病预测装置,其特征在于,包括:
获取单元,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,所述历史结局数据包括n-1次历史就诊记录中的疾病诊断结果,n为大于或等于2的正整数;
第一确定单元,用于获取与所述历史诊疗数据和所述历史结局数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始表征向量;
处理单元,用于将所述图结构中每个节点的初始表征向量输入图注意力神经网络模型,得到所述每个节点的第一表征向量;
第二确定单元,用于根据所述每个用户的n次历史就诊记录所涉及的医疗项目和所述每个节点的第一表征向量,确定所述每个用户n次历史就诊记录的第二表征向量;
训练单元,用于将所述每个用户的所述第一表征向量和所述第二表征向量输入循环神经网络模型,得到所述每个用户的历史表征向量,并将所述每个用户的历史表征向量输入多层感知机模型,得到所述每个用户的结局数据,并根据所述每个用户的结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入所述训练得到的疾病预测模型,得到所述待测试用户的预测结局数据。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求8所述的方法。
CN202011048178.5A 2020-09-29 2020-09-29 少样本或零样本的疾病预测设备、方法、装置及存储介质 Active CN111899883B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011048178.5A CN111899883B (zh) 2020-09-29 2020-09-29 少样本或零样本的疾病预测设备、方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011048178.5A CN111899883B (zh) 2020-09-29 2020-09-29 少样本或零样本的疾病预测设备、方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111899883A true CN111899883A (zh) 2020-11-06
CN111899883B CN111899883B (zh) 2020-12-15

Family

ID=73224014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011048178.5A Active CN111899883B (zh) 2020-09-29 2020-09-29 少样本或零样本的疾病预测设备、方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111899883B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112532630A (zh) * 2020-11-30 2021-03-19 罗鑫龙 一种基于5g和区块链的基因大数据疾病预测系统
CN112835805A (zh) * 2021-02-26 2021-05-25 中国银行股份有限公司 一种客服系统的测试方法、装置及电子设备
CN113314206A (zh) * 2021-06-08 2021-08-27 北京大数医达科技有限公司 图像显示方法、装置和终端设备

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109378066A (zh) * 2018-12-20 2019-02-22 翼健(上海)信息科技有限公司 一种基于特征向量实现疾病预测的控制方法及控制装置
EP3480824A1 (en) * 2017-11-01 2019-05-08 University Of Virginia Patent Foundation Method, system, and computer readable medium for generating pulse oximetry predictive scores (pops) for predicting adverse outcomes in preterm infants
CN109949929A (zh) * 2019-03-19 2019-06-28 挂号网(杭州)科技有限公司 一种基于深度学习大规模病历的辅助诊断系统
WO2019161411A1 (en) * 2018-02-17 2019-08-22 Sanmina Corporation System and method for obtaining health data using a neural network
CN110211690A (zh) * 2019-04-19 2019-09-06 平安科技(深圳)有限公司 疾病风险预测方法、装置、计算机设备及计算机存储介质
US20190279761A1 (en) * 2017-05-25 2019-09-12 Enlitic, Inc. Medical scan comparison system
CN110349664A (zh) * 2019-06-18 2019-10-18 精锐视觉智能科技(深圳)有限公司 基于循环神经网络的肿瘤预测装置、终端设备及存储介质
US20190348179A1 (en) * 2018-05-11 2019-11-14 International Business Machines Corporation Predicting interactions between drugs and diseases
CN110459324A (zh) * 2019-06-27 2019-11-15 平安科技(深圳)有限公司 基于长短期记忆模型的疾病预测方法、装置和计算机设备
CN110751261A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法和系统以及预测方法和系统
US20200090812A1 (en) * 2018-07-16 2020-03-19 Smart Score Technologies, LLC Machine learning for measuring and analyzing therapeutics
WO2019071098A3 (en) * 2017-10-05 2020-03-26 Iquity, Inc. Methods for predicting or detecting disease
CN111161884A (zh) * 2019-12-31 2020-05-15 天津开心生活科技有限公司 针对不平衡数据的疾病预测方法、装置、设备及介质
EP3663758A1 (en) * 2012-03-18 2020-06-10 Shiseido Company, Ltd. Apparatus, system and method for analyzing disease sample
CN111341459A (zh) * 2020-02-28 2020-06-26 上海交通大学医学院附属上海儿童医学中心 分类深度神经网络模型的训练方法、遗传病检测方法
CN111710420A (zh) * 2020-05-15 2020-09-25 深圳先进技术研究院 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3663758A1 (en) * 2012-03-18 2020-06-10 Shiseido Company, Ltd. Apparatus, system and method for analyzing disease sample
US20190279761A1 (en) * 2017-05-25 2019-09-12 Enlitic, Inc. Medical scan comparison system
WO2019071098A3 (en) * 2017-10-05 2020-03-26 Iquity, Inc. Methods for predicting or detecting disease
EP3480824A1 (en) * 2017-11-01 2019-05-08 University Of Virginia Patent Foundation Method, system, and computer readable medium for generating pulse oximetry predictive scores (pops) for predicting adverse outcomes in preterm infants
WO2019161411A1 (en) * 2018-02-17 2019-08-22 Sanmina Corporation System and method for obtaining health data using a neural network
US20190348179A1 (en) * 2018-05-11 2019-11-14 International Business Machines Corporation Predicting interactions between drugs and diseases
US20200090812A1 (en) * 2018-07-16 2020-03-19 Smart Score Technologies, LLC Machine learning for measuring and analyzing therapeutics
CN110751261A (zh) * 2018-07-23 2020-02-04 第四范式(北京)技术有限公司 神经网络模型的训练方法和系统以及预测方法和系统
CN109378066A (zh) * 2018-12-20 2019-02-22 翼健(上海)信息科技有限公司 一种基于特征向量实现疾病预测的控制方法及控制装置
CN109949929A (zh) * 2019-03-19 2019-06-28 挂号网(杭州)科技有限公司 一种基于深度学习大规模病历的辅助诊断系统
CN110211690A (zh) * 2019-04-19 2019-09-06 平安科技(深圳)有限公司 疾病风险预测方法、装置、计算机设备及计算机存储介质
CN110349664A (zh) * 2019-06-18 2019-10-18 精锐视觉智能科技(深圳)有限公司 基于循环神经网络的肿瘤预测装置、终端设备及存储介质
CN110459324A (zh) * 2019-06-27 2019-11-15 平安科技(深圳)有限公司 基于长短期记忆模型的疾病预测方法、装置和计算机设备
CN111161884A (zh) * 2019-12-31 2020-05-15 天津开心生活科技有限公司 针对不平衡数据的疾病预测方法、装置、设备及介质
CN111341459A (zh) * 2020-02-28 2020-06-26 上海交通大学医学院附属上海儿童医学中心 分类深度神经网络模型的训练方法、遗传病检测方法
CN111710420A (zh) * 2020-05-15 2020-09-25 深圳先进技术研究院 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐亮;阮晓雯;李弦;洪博然;肖京竹: "人工智能在疾病预测中的应用", 《自然杂志》 *
程淑玉;黄淑桦;印鉴: "融合知识图谱与循环神经网络的推荐模型", 《小型微型计算机系统》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112532630A (zh) * 2020-11-30 2021-03-19 罗鑫龙 一种基于5g和区块链的基因大数据疾病预测系统
CN112532630B (zh) * 2020-11-30 2021-09-24 广州瘦吧网络科技有限公司 基于算法、5g和区块链的基因大数据疾病预测系统
CN112835805A (zh) * 2021-02-26 2021-05-25 中国银行股份有限公司 一种客服系统的测试方法、装置及电子设备
CN113314206A (zh) * 2021-06-08 2021-08-27 北京大数医达科技有限公司 图像显示方法、装置和终端设备
CN113314206B (zh) * 2021-06-08 2024-04-26 北京大数医达科技有限公司 图像显示方法、装置和终端设备

Also Published As

Publication number Publication date
CN111899883B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN111899883B (zh) 少样本或零样本的疾病预测设备、方法、装置及存储介质
Theis et al. Improving the in-hospital mortality prediction of diabetes ICU patients using a process mining/deep learning architecture
Li et al. A simple method to estimate the time-dependent receiver operating characteristic curve and the area under the curve with right censored data
CN112259246B (zh) 一种融合医学概念层级结构的疾病预测方法及相关设备
CN112259180B (zh) 一种基于异构医学知识图谱的疾病预测方法及相关设备
US20180144244A1 (en) Distributed clinical workflow training of deep learning neural networks
Li et al. A weighting analogue to pair matching in propensity score analysis
CN109887562B (zh) 电子病历的相似度确定方法、装置、设备和存储介质
JP6006081B2 (ja) 疾患診断のための最適の診断要素セット決定装置及び方法
Antolini et al. Inference on correlated discrimination measures in survival analysis: a nonparametric approach
CN109948680B (zh) 病历数据的分类方法及系统
US20190180882A1 (en) Device and method of processing multi-dimensional time series medical data
KR20190086345A (ko) 시계열 데이터 처리 장치, 이를 포함하는 건강 예측 시스템, 및 시계열 데이터 처리 장치의 동작 방법
Koola et al. Predicting 30-day hospital readmission risk in a national cohort of patients with cirrhosis
CN112017776B (zh) 基于动态图和医学知识图谱的疾病预测方法及相关设备
Duffy et al. Confounders mediate AI prediction of demographics in medical imaging
MacKay et al. Application of machine learning approaches to administrative claims data to predict clinical outcomes in medical and surgical patient populations
Caetano et al. A data-driven approach to predict hospital length of stay-a portuguese case study
Rodríguez-González et al. Analysis of a multilevel diagnosis decision support system and its implications: a case study
CN114298234A (zh) 脑部医学影像分类方法、装置、计算机设备和存储介质
Ruyssinck et al. Random survival forests for predicting the bed occupancy in the intensive care unit
US20190221294A1 (en) Time series data processing device, health prediction system including the same, and method for operating the time series data processing device
Ramlakhan et al. Building artificial intelligence and machine learning models: a primer for emergency physicians
Bing et al. Conditional generation of medical time series for extrapolation to underrepresented populations
US20210174229A1 (en) Device for ensembling data received from prediction devices and operating method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant