CN112017776A - 基于动态图和医学知识图谱的疾病预测方法及相关设备 - Google Patents
基于动态图和医学知识图谱的疾病预测方法及相关设备 Download PDFInfo
- Publication number
- CN112017776A CN112017776A CN202011161296.7A CN202011161296A CN112017776A CN 112017776 A CN112017776 A CN 112017776A CN 202011161296 A CN202011161296 A CN 202011161296A CN 112017776 A CN112017776 A CN 112017776A
- Authority
- CN
- China
- Prior art keywords
- node
- data
- graph structure
- characterization vector
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Animal Behavior & Ethology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明实施例涉及医疗技术领域,公开了一种基于动态图和医学知识图谱的疾病预测方法及相关设备,该方法包括:获取与样本医疗数据中历史诊疗数据的医学知识图谱对应的图结构,并确定图结构中每个节点的初始知识表征向量以及初始状态表征向量;根据历史诊疗数据更新得到每个节点的知识表征向量和状态表征向量;将每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到每个用户的结局数据,并根据结局数据训练多层感知机模型得到疾病预测模型;将待测试用户的目标医疗数据输入疾病预测模型,得到待测试用户下一次就诊的预测结局数据,利用动态图技术提高了疾病预测结果的准确度。本发明涉及区块链技术,上述预测结局数据可存储于区块链中。
Description
技术领域
本发明涉及医疗技术领域,尤其涉及一种基于动态图和医学知识图谱的疾病预测方法及相关设备。
背景技术
疾病预测是基于用户的历史信息推断未来的疾病或临床事件的风险,为解决数据驱动的疾病预测方法容易受数据量有限、数据偏差较大的影响,很多工作尝试将医学知识图谱融入疾病预测过程,以提升预测精准度和与现有医学知识的吻合度。
目前一些方法尝试在深度学习模型中引入知识图谱,以应对医疗数据量不足和数据偏差所带来的影响。由于知识图谱是静态图,而用户的历史信息是动态更新的,所以现有的基于知识图谱的疾病预测方法往往难以考虑历史信息的时序性,进而影响预测性能。因此,如何更有效地提高疾病预测结果的准确性非常重要。
发明内容
本发明实施例提供了一种基于动态图和医学知识图谱的疾病预测方法及相关设备,通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
第一方面,本发明实施例提供了一种基于动态图和医学知识图谱的疾病预测设备,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
进一步地,所述处理器确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量时,具体用于:
对所述图结构中的每个节点随机添加初始化向量,并确定所述每个节点的初始化向量为所述每个节点的初始知识表征向量;以及,
对所述图结构中的每个节点添加零向量,并确定所述每个节点的零向量为所述每个节点的初始状态表征向量。
进一步地,所述处理器根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量时,具体用于:
将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量;
获取所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量,其中,t为小于或等于n-1的正整数;
根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量。
进一步地,所述处理器根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量时,具体用于:
获取第t次历史就诊记录对应的图结构中每个节点的激活向量;
将所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量以及所述第t次历史就诊记录对应的图结构中每个节点的激活向量输入循环神经网络模型中,得到所述图结构中每个节点的状态表征向量。
进一步地,所述处理器获取第t次历史就诊记录对应的图结构中每个节点的激活向量时,具体用于:
检测第t次历史就诊记录对应的图结构中每个节点的诊断结果是否与所述每个节点第t次的历史结局数据匹配;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全1向量;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据不匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全0向量。
进一步地,所述处理器将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据时,具体用于:
将更新得到的t次历史就诊记录对应的图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户在第t+1次就诊时的结局数据,其中,t为小于或等于n-1的正整数;
根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型。
进一步地,所述处理器根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型时,具体用于:
将所述多层感知机模型预测得到的所述训练集中每个用户在第t+1次就诊时的结局数据与所述训练集中每个用户的第t+1次历史结局数据进行对比;
根据对比结果训练所述多层感知机模型,得到所述疾病预测模型。
第二方面,本发明实施例提供了一种基于动态图和医学知识图谱的疾病预测方法,包括:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
第三方面,本发明实施例提供了一种基于动态图和医学知识图谱的疾病预测装置,包括:
获取单元,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
确定单元,用于获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
处理单元,用于根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
训练单元,用于将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第二方面的方法。
本发明实施例可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据;获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量;根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种疾病预测系统的结构示意图;
图2是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测方法的示意流程图;
图3是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测装置的示意框图;
图4是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于动态图和医学知识图谱的疾病预测方法可以应用于一种疾病预测系统,在某些实施例中,所述疾病预测系统包括医疗服务器和基于动态图和医学知识图谱的疾病预测设备,其中,所述基于动态图和医学知识图谱的疾病预测设备可以设置于终端中。在某些实施例中,所述医疗服务器可以与基于动态图和医学知识图谱的疾病预测设备建立通信连接。在某些实施例中,所述通信连接的方式可以包括但不限于Wi-Fi、蓝牙、近场通信(Near Field Communication,NFC)等。在某些实施例中,所述医疗服务器用于存储用户的历史诊疗数据,其中,所述历史诊疗数据包括历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;所述历史结局数据用于根据t-1次历史就诊记录确定的第t次就诊的诊断结果,其中,t为小于或等于n-1的正整数。
下面结合附图1对本发明实施例提供的疾病预测系统进行示意性说明。
请参见图1,图1是本发明实施例提供的一种疾病预测系统的结构示意图。所述疾病预测系统包括:基于动态图和医学知识图谱的疾病预测设备11和医疗服务器12。在某些实施例中,基于动态图和医学知识图谱的疾病预测设备11与医疗服务器12可以通过无线通信连接方式建立通信连接;其中,在某些场景下,所述基于动态图和医学知识图谱的疾病预测设备11与医疗服务器12之间也可以通过有线通信连接方式建立通信连接。在某些实施例中,所述基于动态图和医学知识图谱的疾病预测设备11可以包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑等智能终端设备。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备11可以从医疗服务器12中获取训练集,所述训练集中包括多个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;基于动态图和医学知识图谱的疾病预测设备11可以获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;基于动态图和医学知识图谱的疾病预测设备11可以根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;基于动态图和医学知识图谱的疾病预测设备11可以将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;基于动态图和医学知识图谱的疾病预测设备11可以获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
下面结合附图2对本发明实施例提供的基于动态图和医学知识图谱的疾病预测方法进行示意性说明。
请参见图2,图2是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测方法的示意流程图,如图2所示,该方法可以由基于动态图和医学知识图谱的疾病预测设备执行,所述基于动态图和医学知识图谱的疾病预测设备的具体解释如前所述,此处不再赘述。具体地,本发明实施例的所述方法包括如下步骤。
S201:获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种,n为大于或等于1的正整数。在某些实施例中,所述历史结局数据用于指示下一次就诊的诊断结果,例如,下一次就诊的诊断结果是否发生肝硬化。
S202:获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在获取与所述历史诊疗数据的医学知识图谱对应的图结构时,可以获取与所述历史诊疗数据对应的医学知识图谱,并将所述医学知识图谱转换为图结构,其中,所述图结构由多个节点和边组成,所述节点用于表示医学概念,如疾病名称、药物名称等,边用于表示节点之间的关联关系。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量时,可以对所述图结构中的每个节点随机添加初始化向量,并确定所述每个节点的初始化向量为所述每个节点的初始知识表征向量;以及,对所述图结构中的每个节点添加零向量,并确定所述每个节点的零向量为所述每个节点的初始状态表征向量。
S203:根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量时,可以将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量;并获取所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量,其中,t为小于或等于n-1的正整数;以及根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量时,可以将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量的权重,并根据所述相邻节点的知识表征向量和对应的权重,进行加权求和得到所述图结构中每个节点的知识表征向量。
例如,假设在计算节点C的知识表征向量时,获取到所述节点C的相邻节点包括A节点和B节点,则可以获取A节点和B节点的初始知识表征向量,并对所述A节点和B节点的初始知识表征向量进行加权求和,得到节点C的知识表征向量。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量时,可以获取第t次历史就诊记录对应的图结构中每个节点的激活向量,并将所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量以及所述第t次历史就诊记录对应的图结构中每个节点的激活向量输入循环神经网络模型中,得到所述图结构中每个节点的状态表征向量。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在获取第t次历史就诊记录对应的图结构中每个节点的激活向量时,可以检测第t次历史就诊记录对应的图结构中每个节点的诊断结果是否与所述每个节点第t次的历史结局数据匹配;当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全1向量;当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据不匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全0向量。
例如,假设检测到第3次历史就诊记录对应的图结构中节点m的诊断结果为发生肝硬化,如果训练集中节点m第3次历史结局数据为下一次(即第4次)就诊发生肝硬化,因此可以确定所述第3次历史就诊记录对应的图结构中节点m的诊断结果与节点m第3次的历史结局数据匹配,并确定所述第3次历史就诊记录对应的图结构中节点m的激活向量为全1向量。
S204:将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据时,可以将更新得到的t次历史就诊记录对应的图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户在第t+1次就诊时的结局数据,其中,t为小于或等于n-1的正整数,并根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型。
在一个实施例中,基于动态图和医学知识图谱的疾病预测设备在根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型时,可以将所述多层感知机模型预测得到的所述训练集中每个用户在第t+1次就诊时的结局数据与所述训练集中每个用户的第t+1次历史结局数据进行对比,并根据对比结果训练所述多层感知机模型,得到所述疾病预测模型。
S205:获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
例如,假设待测试用户的目标医疗数据为最近一次就诊的就诊数据,则可以将所述待测试用户最近一次就诊的就诊数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据为发生脑梗塞。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据;获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量;根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
本发明实施例还提供了一种基于动态图和医学知识图谱的疾病预测装置,该装置用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测装置的示意框图。本实施例的基于动态图和医学知识图谱的疾病预测装置包括:获取单元301、确定单元302、处理单元303、训练单元304以及预测单元305。
获取单元301,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
确定单元302,用于获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
处理单元303,用于根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
训练单元304,用于将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元305,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
进一步地,所述确定单元302确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量时,具体用于:
对所述图结构中的每个节点随机添加初始化向量,并确定所述每个节点的初始化向量为所述每个节点的初始知识表征向量;以及,
对所述图结构中的每个节点添加零向量,并确定所述每个节点的零向量为所述每个节点的初始状态表征向量。
进一步地,所述处理单元303根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量时,具体用于:
将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量;
获取所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量,其中,t为小于或等于n-1的正整数;
根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量。
进一步地,所述处理单元303根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量时,具体用于:
获取第t次历史就诊记录对应的图结构中每个节点的激活向量;
将所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量以及所述第t次历史就诊记录对应的图结构中每个节点的激活向量输入循环神经网络模型中,得到所述图结构中每个节点的状态表征向量。
进一步地,所述处理单元303获取第t次历史就诊记录对应的图结构中每个节点的激活向量时,具体用于:
检测第t次历史就诊记录对应的图结构中每个节点的诊断结果是否与所述每个节点第t次的历史结局数据匹配;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全1向量;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据不匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全0向量。
进一步地,所述训练单元304将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据时,具体用于:
将更新得到的t次历史就诊记录对应的图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户在第t+1次就诊时的结局数据,其中,t为小于或等于n-1的正整数;
根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型。
进一步地,所述训练单元304根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型时,具体用于:
将所述多层感知机模型预测得到的所述训练集中每个用户在第t+1次就诊时的结局数据与所述训练集中每个用户的第t+1次历史结局数据进行对比;
根据对比结果训练所述多层感知机模型,得到所述疾病预测模型。
本发明实施例中,基于动态图和医学知识图谱的疾病预测装置可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据;获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量;根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
参见图4,图4是本发明实施例提供的一种基于动态图和医学知识图谱的疾病预测设备的示意框图。如图所示的本实施例中的基于动态图和医学知识图谱的疾病预测设备可以包括:一个或多个处理器401和存储器402。存储器402用于存储计算机程序,所述计算机程序包括程序指令,处理器401 用于执行存储器402存储的程序指令。其中,处理器401被配置用于调用所述程序执行:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
进一步地,所述处理器401确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量时,具体用于:
对所述图结构中的每个节点随机添加初始化向量,并确定所述每个节点的初始化向量为所述每个节点的初始知识表征向量;以及,
对所述图结构中的每个节点添加零向量,并确定所述每个节点的零向量为所述每个节点的初始状态表征向量。
进一步地,所述处理器401根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量时,具体用于:
将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量;
获取所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量,其中,t为小于或等于n-1的正整数;
根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量。
进一步地,所述处理器401根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量时,具体用于:
获取第t次历史就诊记录对应的图结构中每个节点的激活向量;
将所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量以及所述第t次历史就诊记录对应的图结构中每个节点的激活向量输入循环神经网络模型中,得到所述图结构中每个节点的状态表征向量。
进一步地,所述处理器401获取第t次历史就诊记录对应的图结构中每个节点的激活向量时,具体用于:
检测第t次历史就诊记录对应的图结构中每个节点的诊断结果是否与所述每个节点第t次的历史结局数据匹配;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全1向量;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据不匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全0向量。
进一步地,所述处理器401将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据时,具体用于:
将更新得到的t次历史就诊记录对应的图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户在第t+1次就诊时的结局数据,其中,t为小于或等于n-1的正整数;
根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型。
进一步地,所述处理器401根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型时,具体用于:
将所述多层感知机模型预测得到的所述训练集中每个用户在第t+1次就诊时的结局数据与所述训练集中每个用户的第t+1次历史结局数据进行对比;
根据对比结果训练所述多层感知机模型,得到所述疾病预测模型。
本发明实施例中,基于动态图和医学知识图谱的疾病预测设备可以获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据;获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量;根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。通过对医学知识图谱对应的图结构进行更新,可以实现利用动态图技术提高疾病预测结果的精准度,以及提高疾病预测结果与现有医学知识的匹配度。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元 (CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (DigiSalSignal Processor,DSP)、专用集成电路 (ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列 (Field-Programmable GaSe Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器402可以包括只读存储器和随机存取存储器,并向处理器401 提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如,存储器402还可以存储设备类型的信息。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图2所对应实施例中描述的基于动态图和医学知识图谱的疾病预测方法,也可实现本发明图3所对应实施例的疾病预测设备,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的疾病预测设备的内部存储单元,例如疾病预测设备的硬盘或内存。所述计算机可读存储介质也可以是所述疾病预测设备的外部存储设备,例如所述疾病预测设备上配备的插接式硬盘,智能存储卡(SmarSMedia Card, SMC),安全数字(Secure DigiSal, SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述疾病预测设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述疾病预测设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备 ( 可以是个人计算机,终端,或者网络设备等 ) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U 盘、移动硬盘、只读存储器 (ROM,Read-Only Memory)、随机存取存储器 (RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于动态图和医学知识图谱的疾病预测设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
2.根据权利要求1所述的设备,其特征在于,所述处理器确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量时,具体用于:
对所述图结构中的每个节点随机添加初始化向量,并确定所述每个节点的初始化向量为所述每个节点的初始知识表征向量;以及,
对所述图结构中的每个节点添加零向量,并确定所述每个节点的零向量为所述每个节点的初始状态表征向量。
3.根据权利要求2所述的设备,其特征在于,所述处理器根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量时,具体用于:
将所述图结构中每个节点的初始知识表征向量输入图注意力神经网络模型中,得到所述图结构中每个节点的知识表征向量;
获取所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量,其中,t为小于或等于n-1的正整数;
根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量。
4.根据权利要求3所述的设备,其特征在于,所述处理器根据所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量和所述样本医疗数据,确定所述图结构中每个节点的状态表征向量时,具体用于:
获取第t次历史就诊记录对应的图结构中每个节点的激活向量;
将所述图结构中t-1次历史就诊记录对应的图结构中每个节点的初始状态表征向量以及所述第t次历史就诊记录对应的图结构中每个节点的激活向量输入循环神经网络模型中,得到所述图结构中每个节点的状态表征向量。
5.根据权利要求4所述的设备,其特征在于,所述处理器获取第t次历史就诊记录对应的图结构中每个节点的激活向量时,具体用于:
检测第t次历史就诊记录对应的图结构中每个节点的诊断结果是否与所述每个节点第t次的历史结局数据匹配;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全1向量;
当检测结果为所述第t次历史就诊记录对应的图结构中每个节点的诊断结果与所述每个节点第t次的历史结局数据不匹配时,确定所述第t次历史就诊记录对应的图结构中每个节点的激活向量为全0向量。
6.根据权利要求1所述的设备,其特征在于,所述处理器将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据时,具体用于:
将更新得到的t次历史就诊记录对应的图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户在第t+1次就诊时的结局数据,其中,t为小于或等于n-1的正整数;
根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型。
7.根据权利要求6所述的设备,其特征在于,所述处理器根据所述每个用户在第t+1次就诊时的结局数据训练所述多层感知机模型得到疾病预测模型时,具体用于:
将所述多层感知机模型预测得到的所述训练集中每个用户在第t+1次就诊时的结局数据与所述训练集中每个用户的第t+1次历史结局数据进行对比;
根据对比结果训练所述多层感知机模型,得到所述疾病预测模型。
8.一种基于动态图和医学知识图谱的疾病预测方法,其特征在于,包括:
获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
9.一种基于动态图和医学知识图谱的疾病预测装置,其特征在于,包括:
获取单元,用于获取训练集中每个用户的样本医疗数据,其中,所述样本医疗数据包括所述训练集中每个用户的历史诊疗数据和历史结局数据,所述历史诊疗数据包括n次历史就诊记录中的诊断数据、药物数据、检查数据、就诊时间中的一种或多种, n为大于或等于1的正整数;
确定单元,用于获取与所述历史诊疗数据的医学知识图谱对应的图结构,并确定所述图结构中每个节点的初始知识表征向量以及所述每个节点的初始状态表征向量,其中,所述图结构由多个节点和边组成;
处理单元,用于根据所述历史诊疗数据更新所述图结构中每个节点的初始知识表征向量和初始状态表征向量,得到所述图结构中每个节点的知识表征向量和状态表征向量;
训练单元,用于将所述图结构中每个节点的知识表征向量和状态表征向量输入多层感知机模型,得到所述训练集中每个用户的结局数据,并根据所述结局数据训练所述多层感知机模型得到疾病预测模型;
预测单元,用于获取待测试用户的目标医疗数据,并将所述待测试用户的目标医疗数据输入训练得到的疾病预测模型,得到所述待测试用户下一次就诊的预测结局数据。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求8所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011161296.7A CN112017776B (zh) | 2020-10-27 | 2020-10-27 | 基于动态图和医学知识图谱的疾病预测方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011161296.7A CN112017776B (zh) | 2020-10-27 | 2020-10-27 | 基于动态图和医学知识图谱的疾病预测方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112017776A true CN112017776A (zh) | 2020-12-01 |
CN112017776B CN112017776B (zh) | 2021-01-15 |
Family
ID=73528188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011161296.7A Active CN112017776B (zh) | 2020-10-27 | 2020-10-27 | 基于动态图和医学知识图谱的疾病预测方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112017776B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113707322A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 信息预测模型的训练方法、装置、计算机设备及存储介质 |
CN114496283A (zh) * | 2022-02-15 | 2022-05-13 | 山东大学 | 一种基于路径推理的疾病预测系统、存储介质及设备 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140236872A1 (en) * | 2013-02-15 | 2014-08-21 | The Charles Stark Draper Laboratory, Inc. | Method for integrating and fusing heterogeneous data types to perform predictive analysis |
CN106021281A (zh) * | 2016-04-29 | 2016-10-12 | 京东方科技集团股份有限公司 | 医学知识图谱的构建方法、其装置及其查询方法 |
EP3282382A1 (fr) * | 2016-08-10 | 2018-02-14 | L'air Liquide Societe Anonyme Pour L'etude Et L'exploitation Des Procedes Georges Claude | Système de traitement de données pour prédire une crise d'exacerbation d'un patient atteint d'une maladie respiratoire chronique |
WO2018134682A1 (en) * | 2017-01-23 | 2018-07-26 | Ucb Biopharma Sprl | Method and system for predicting refractory epilepsy status |
WO2018204311A1 (en) * | 2017-05-01 | 2018-11-08 | The Charles Stark Draper Laboratory, Inc. | Deep learning architecture for cognitive examination subscore trajectory prediction in alzheimer's disease |
CN110287337A (zh) * | 2019-06-19 | 2019-09-27 | 上海交通大学 | 基于深度学习和知识图谱获取医学同义词的系统及方法 |
CN110297908A (zh) * | 2019-07-01 | 2019-10-01 | 中国医学科学院医学信息研究所 | 诊疗方案预测方法及装置 |
CN110310740A (zh) * | 2019-04-15 | 2019-10-08 | 山东大学 | 基于交叉注意神经网络的再就医信息预测方法及系统 |
CN110335676A (zh) * | 2019-07-09 | 2019-10-15 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN110415822A (zh) * | 2019-07-23 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种预测癌症的方法和装置 |
EP3594861A1 (en) * | 2018-07-09 | 2020-01-15 | Tata Consultancy Services Limited | Systems and methods for classification of multi-dimensional time series of parameters |
CN111367961A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 基于图卷积神经网络的时序数据事件预测方法、系统及其应用 |
CN111370122A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 一种基于知识指导的时序数据风险预测方法、系统及其应用 |
CN111444348A (zh) * | 2020-02-27 | 2020-07-24 | 上海交通大学 | 知识图谱架构的构建与应用方法、系统及介质 |
EP3451209B1 (en) * | 2017-08-31 | 2020-08-12 | Nokia Technologies Oy | Apparatus and method for anonymizing image content |
CN111611893A (zh) * | 2020-05-14 | 2020-09-01 | 青岛翰林汇力科技有限公司 | 应用神经网络深度学习的智能测判方法 |
CN111681726A (zh) * | 2020-05-29 | 2020-09-18 | 北京百度网讯科技有限公司 | 电子病历数据的处理方法、装置、设备和介质 |
-
2020
- 2020-10-27 CN CN202011161296.7A patent/CN112017776B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140236872A1 (en) * | 2013-02-15 | 2014-08-21 | The Charles Stark Draper Laboratory, Inc. | Method for integrating and fusing heterogeneous data types to perform predictive analysis |
CN106021281A (zh) * | 2016-04-29 | 2016-10-12 | 京东方科技集团股份有限公司 | 医学知识图谱的构建方法、其装置及其查询方法 |
EP3282382A1 (fr) * | 2016-08-10 | 2018-02-14 | L'air Liquide Societe Anonyme Pour L'etude Et L'exploitation Des Procedes Georges Claude | Système de traitement de données pour prédire une crise d'exacerbation d'un patient atteint d'une maladie respiratoire chronique |
WO2018134682A1 (en) * | 2017-01-23 | 2018-07-26 | Ucb Biopharma Sprl | Method and system for predicting refractory epilepsy status |
WO2018204311A1 (en) * | 2017-05-01 | 2018-11-08 | The Charles Stark Draper Laboratory, Inc. | Deep learning architecture for cognitive examination subscore trajectory prediction in alzheimer's disease |
EP3451209B1 (en) * | 2017-08-31 | 2020-08-12 | Nokia Technologies Oy | Apparatus and method for anonymizing image content |
EP3594861A1 (en) * | 2018-07-09 | 2020-01-15 | Tata Consultancy Services Limited | Systems and methods for classification of multi-dimensional time series of parameters |
CN110310740A (zh) * | 2019-04-15 | 2019-10-08 | 山东大学 | 基于交叉注意神经网络的再就医信息预测方法及系统 |
CN110287337A (zh) * | 2019-06-19 | 2019-09-27 | 上海交通大学 | 基于深度学习和知识图谱获取医学同义词的系统及方法 |
CN110297908A (zh) * | 2019-07-01 | 2019-10-01 | 中国医学科学院医学信息研究所 | 诊疗方案预测方法及装置 |
CN110335676A (zh) * | 2019-07-09 | 2019-10-15 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN110415822A (zh) * | 2019-07-23 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种预测癌症的方法和装置 |
CN111367961A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 基于图卷积神经网络的时序数据事件预测方法、系统及其应用 |
CN111370122A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 一种基于知识指导的时序数据风险预测方法、系统及其应用 |
CN111444348A (zh) * | 2020-02-27 | 2020-07-24 | 上海交通大学 | 知识图谱架构的构建与应用方法、系统及介质 |
CN111611893A (zh) * | 2020-05-14 | 2020-09-01 | 青岛翰林汇力科技有限公司 | 应用神经网络深度学习的智能测判方法 |
CN111681726A (zh) * | 2020-05-29 | 2020-09-18 | 北京百度网讯科技有限公司 | 电子病历数据的处理方法、装置、设备和介质 |
Non-Patent Citations (1)
Title |
---|
胡满满;陈旭;孙毓忠;沈曦;王晓青;余天洋;梅御东;肖立;程伟;杨杰;杨焱: "基于动态采样和迁移学习的疾病预测模型", 《计算机学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113707322A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 信息预测模型的训练方法、装置、计算机设备及存储介质 |
CN113707322B (zh) * | 2021-08-31 | 2023-09-19 | 平安科技(深圳)有限公司 | 信息预测模型的训练方法、装置、计算机设备及存储介质 |
CN114496283A (zh) * | 2022-02-15 | 2022-05-13 | 山东大学 | 一种基于路径推理的疾病预测系统、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112017776B (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ElShawi et al. | Interpretability in healthcare: A comparative study of local machine learning interpretability techniques | |
Kallus et al. | Confounding-robust policy improvement | |
Lee et al. | Dynamic-deephit: A deep learning approach for dynamic survival analysis with competing risks based on longitudinal data | |
Turgeman et al. | Insights from a machine learning model for predicting the hospital Length of Stay (LOS) at the time of admission | |
CN112259246B (zh) | 一种融合医学概念层级结构的疾病预测方法及相关设备 | |
Grantz et al. | Disparities in influenza mortality and transmission related to sociodemographic factors within Chicago in the pandemic of 1918 | |
EP3292492B1 (en) | Predicting likelihoods of conditions being satisfied using recurrent neural networks | |
JP6530085B2 (ja) | 再帰型ニューラル・ネットワークを用いた健康現象の分析 | |
US11276495B2 (en) | Systems and methods for predicting multiple health care outcomes | |
CN111899883B (zh) | 少样本或零样本的疾病预测设备、方法、装置及存储介质 | |
CN112259180A (zh) | 一种基于异构医学知识图谱的疾病预测方法及相关设备 | |
CN112017776B (zh) | 基于动态图和医学知识图谱的疾病预测方法及相关设备 | |
US20150341350A1 (en) | Privacy preserving biometric authentication based on error correcting codes | |
Chmait et al. | An information-theoretic predictive model for the accuracy of AI agents adapted from psychometrics | |
Rashidian et al. | Deep learning on electronic health records to improve disease coding accuracy | |
CN109274639A (zh) | 开放平台异常数据访问的识别方法和装置 | |
Titman et al. | General tests of the Markov property in multi-state models | |
CN112309565B (zh) | 用于匹配药品信息和病症信息的方法、装置、电子设备和介质 | |
Koola et al. | Predicting 30-day hospital readmission risk in a national cohort of patients with cirrhosis | |
US20190221294A1 (en) | Time series data processing device, health prediction system including the same, and method for operating the time series data processing device | |
Alazzam et al. | [Retracted] Diagnosis of Melanoma Using Deep Learning | |
CN115794958A (zh) | 一种基于区块链的医疗数据共享方法、装置以及系统 | |
CN112037918B (zh) | 一种融合并发症风险的慢病医保费用预测方法及相关设备 | |
CN113868608A (zh) | 一种身份验证方法及装置 | |
CN111368337B (zh) | 保护隐私的样本生成模型构建、仿真样本生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |