CN110459324B - 基于长短期记忆模型的疾病预测方法、装置和计算机设备 - Google Patents

基于长短期记忆模型的疾病预测方法、装置和计算机设备 Download PDF

Info

Publication number
CN110459324B
CN110459324B CN201910570055.9A CN201910570055A CN110459324B CN 110459324 B CN110459324 B CN 110459324B CN 201910570055 A CN201910570055 A CN 201910570055A CN 110459324 B CN110459324 B CN 110459324B
Authority
CN
China
Prior art keywords
long
disease
short
term memory
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910570055.9A
Other languages
English (en)
Other versions
CN110459324A (zh
Inventor
贾文笑
谭克为
李响
谢国彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910570055.9A priority Critical patent/CN110459324B/zh
Priority to PCT/CN2019/103547 priority patent/WO2020220545A1/zh
Priority to US17/264,299 priority patent/US11710571B2/en
Priority to SG11202008385YA priority patent/SG11202008385YA/en
Publication of CN110459324A publication Critical patent/CN110459324A/zh
Application granted granted Critical
Publication of CN110459324B publication Critical patent/CN110459324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请揭示了一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质,所述方法包括:获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。

Description

基于长短期记忆模型的疾病预测方法、装置和计算机设备
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质。
背景技术
疾病风险预测是人工智能和医学结合产生的,它的核心是预测未来一段时间内患某种疾病的概率,主要的计算方法包括经典的回归分析,传统的机器学习方法和新兴的深度学习方法。但是真实世界的医学数据质量差,数据维度高,数据不平衡和医学数据不连续的时序性,导致准确地预测疾病的风险难度很大。现有的疾病风险预测系统需要患者的体检数据,但是体检过程耗时费力;同时现有产品只能分析单一疾病的风险,不能考虑疾病之间的关联;此外,现有产品的风险预测只能预测未来一段时间的患病风险,不能考虑输入变量的时间信息;并且,现有的疾病预测只考虑被测对象的医疗数据,预测准确度有待提高;现有的疾病预测产品仅采用单一的预测模型,预测准确度不足。
发明内容
本申请的主要目的为提供一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质,旨在提高疾病预测的准确度。
为了实现上述发明目的,本申请提出一种基于长短期记忆模型的疾病预测方法,包括以下步骤:
获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出所述疾病预测结果与所述关联疾病。
进一步地,所述将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
将所述第一医疗数据根据预设的时间段分为多段数据序列;
根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;
将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。
进一步地,所述将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;
将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段。
进一步地,所述将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段的步骤,包括:
根据公式:
Figure BDA0002110672360000021
eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;
将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2...、cn
进一步地,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤,包括:
将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,从而得到所述第二长短期记忆网络输出的高维向量序列;
根据预设的分向量与预测结果含义对应关系,解读所述高维向量序列,从而得到在将来不同时间段内的疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。
进一步地,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤之后,包括:
接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;
获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;
根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。
进一步地,所述疾病关联网络为知识图谱网络,所述根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型的步骤之前,包括:
采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;
对所述初始实体进行去重处理,从而获取最终实体;
从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。
本申请提供一种基于长短期记忆模型的疾病预测装置,包括:
医疗数据获取单元,用于获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
隐藏状态向量序列获取单元,用于将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
疾病预测结果获取单元,用于将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
关联疾病获取单元,用于从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出单元,用于输出所述疾病预测结果与所述关联疾病。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质,获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。
附图说明
图1为本申请一实施例的基于长短期记忆模型的疾病预测方法的流程示意图;
图2为本申请一实施例的基于长短期记忆模型的疾病预测装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种基于长短期记忆模型的疾病预测方法,包括以下步骤:
S1、获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
S2、将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
S3、将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
S4、从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
S5、输出所述疾病预测结果与所述关联疾病。
如上述步骤S1所述,获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史。本申请用于预测目标对象的疾病,而关联对象的第二医疗数据用于辅助预测目标对象的疾病,第二医疗数据包括遗传病治疗史。由于遗传病与血缘相关联,具有血缘关系的对象即使没有表现出显现的遗传病特征,也可能具有隐性的生理特征(隐疾),因此关联对象的遗传病治疗史有助于预测目标对象的疾病。其中第一医疗数据包括用药史、疾病史和手术史,由于用药史、疾病史和手术史会对人体具有影响,可以作为疾病预测的依据。例如,对于曾经采用吡格列酮、卡托普利和尼群地平作为治疗糖尿病、高血压和房颤的历史用药的病人,其在未来有可能患有心梗、冠心病、脑卒中等风险。传统技术仅采取一对一分析的策略,即仅考虑目标对象的医疗数据对目标对象将来的疾病进行预测,而本申请还采用关联对象的第二医疗数据作为预测用数据,以增加预测准确度。并且传统技术仅对单一疾病进行建模,因此只能预测单一疾病,而本申请能实现多种疾病在不同时间区段内的预测。并且本申请的医疗数据不仅包括目标对象的第一医疗数据,还考虑关联对象的第二医疗,使预测更精准,且克服了目标对象慌报病史、隐瞒家族病史的缺陷(即即使目标对象身上的遗传病为隐性表示,但在基因层面上也是存在的,在将来可能呈显性表性,并天也可能存在对身体机能、其他疾病产生影响,因此通过关联对象的第二医疗数据,以获知目标对象的遗传病等数据,从而提高疾病预测的准确性)。
如上述步骤S2所述,将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络。长短期记忆模型是使用长短期记忆网络的模型,其中长短期记忆网络是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,相对于普通的循环神经网络,其加入了一个判断信息有用与否的“处理器”,只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘,从而解决了长序依赖问题。本申请采用的长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络,以实现多种疾病的时序性预测。其中,本申请中的编码指将输入的信息转换为指定长度的向量序列,解码指将输入的向量序列转换为预测的向量序列。
如上述步骤S3所述,将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。其中第二长短期记忆网络可采用任意的方法进行运算,例如采用公式:
Figure BDA0002110672360000071
eij=score(si,hj),
Figure BDA0002110672360000072
其中ci为所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数,WC为权值,p为输出概率,yt为第二长短期记忆网络的对应第t个时间段的输出,x为输入(与第一医疗数据和第二医疗数据直接相关)。
如上述步骤S4所述,从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型。其中,所述疾病关联网络可以为任意关联网络,例如为知识图谱网络,所述知识图谱网络的构建方式例如为:采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;对所述初始实体进行去重处理,从而获取最终实体;从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。从而在长短期记忆模型的基础上,进一步进行预测,进一步提高预测的准确性。
如上述步骤S5所述,输出所述疾病预测结果与所述关联疾病。其中所述疾病预测结果是所述长短期记忆模型的输出结果,关联疾病是疾病关联网络的输出结果,从而通过结合所述长短期记忆模型和疾病关联网络,进一步提高预测的准确性。
在一个实施方式中,所述将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤S2,包括:
S201、将所述第一医疗数据根据预设的时间段分为多段数据序列;
S202、根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;
S203、将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。
如上所述,实现了得到所述第一长短期记忆网络中的隐藏状态向量序列。其中所述指定影响因子在不同时间段中取值相同或者取值动态变化(因为在随着时间的变化,遗传病对其他疾病的影响程度也随之变化)。其中第一医疗数据是一段时间内的医疗数据,将其分为不同时间段内的多段数据序列,并且为了将第二医疗数据容纳入长短期记忆模型中,本申请将第二医疗数据反应为指定影响因子,从而将所述多段数据序列与所述指定影响因子共同作为长短期记忆模型的输入。具体地,单段数据与对应的指定影响因子将生成一个高维向量,因此多段数据序列与分别对应的指定影响因子将生成高维向量序列,从而作为已训练完成的长短期记忆模型中的计算基础。其他疾病指除所述遗传病之外的疾病。所述影响因子指将遗传病对其他疾病的影响数值化得到的数据,用于在长短期记忆网络进行计算,所述影响因子可以任意形式存在,例如以分离的向量形式。
在一个实施方式中,所述将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤S203,包括:
S2031、根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;
S2032、将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段。
如上所述,实现了将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。本申请采用公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,并将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段。据此,第一长短期记忆网络将所述多段数据序列与所述指定影响因子编码为隐藏状态向量序列,作为第二长短期记忆网络的解码基础。
在一个实施方式中,所述将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段的步骤S2032,包括:
S20321、根据公式:
Figure BDA0002110672360000091
eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;
S20322、将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2...、cn
如上所述,实现了将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn。本申请根据公式:
Figure BDA0002110672360000092
eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,也即是引入了注意力机制自动捕捉对结局重要的信息,从而将最终隐藏状态向量序列作为第二长短期记忆网络的解码基础。由于采用了注意力机制,使得权重分配更为准确,有利于改善预测的准确性。
在一个实施方式中,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤S3,包括:
S301、将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,从而得到所述第二长短期记忆网络输出的高维向量序列;
S302、根据预设的分向量与预测结果含义对应关系,解读所述高维向量序列,从而得到在将来不同时间段内的疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。
如上所述,实现了将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果。其中所述第二长短期记忆网络输出的是高维向量序列,所述高维向量序列代表了不同时间段的预测结果,其中的高维向量的分向量代表了预测的疾病类型、对应的患病机率。根据预设的分向量与预测结果含义对应关系,即可获知将来不同时间段内的预测疾病类型与对应的发病机率。
在一个实施方式中,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤S3之后,包括:
S311、接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;
S312、获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;
S313、根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。
如上所述,实现了生成治疗推荐方案。由于本申请的输入为包括用药史和手术史的医疗数据,因此也可以接受假设的用药或者手术,进而本申请的长短期记忆模型可以模拟治疗方案的疗效。因此接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。其中预设的选择规则例如为预测的疾病类型最少,或者预测的疾病类型的发病率均小于预设的阈值等。
在一个实施方式中,所述疾病关联网络为知识图谱网络,所述根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型的步骤S4之前,包括:
S321、采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;
S322、对所述初始实体进行去重处理,从而获取最终实体;
S323、从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。
如上所述,实现了构建所述包括所述指定成员的知识图谱。其中预设的知识图谱构建工具可以为任意工具,任如为现有的SPSS、Ucinet NetDraw、VOSviewer等等,由于上述工具是现有的知识图谱构建工具,因此不再赘述。其中指定信息记载了疾病信息,据此可以获知疾病之间的关联关系。其中所述实体即是知识图谱中的知识节点,初始实体指未经过去重处理的知识节点。识别出初始实体的过程例如为:对指定信息进行分词处理,从而获得由多个词构成的词序列,将所述词序列输入预设的语句结构模型,从而在所述词序列中获取初始实体。再对所述初始实体进行去重处理,从而获取最终实体。去重处理的过程例如为:对所有初始实体进行同义词判断,将属于同一同义词组的初始实体替换为所述同义词组中的一个词汇。再从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述包括所述指定成员的知识图谱。其中三元组例如指两个实体之间的关系。其中,所述从所述指定信息中提取出最终实体之间的关系的方法例如:将所述指定信息套入预设的语句结构,从而通过所述语句结构将表述多个实体间的关系的词汇提取出来。据此,将疾病之间的相互关系以知识图谱的网络形式表示出来,其中疾病类型作为知识图谱中的一个知识节点。进一步地,所述知识图谱的知识节点还可以包括非疾病类型的实体。
本申请的基于长短期记忆模型的疾病预测方法,获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。
参照图2,本申请实施例提供一种基于长短期记忆模型的疾病预测装置,包括:
医疗数据获取单元10,用于获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
隐藏状态向量序列获取单元20,用于将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
疾病预测结果获取单元30,用于将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
关联疾病获取单元40,用于从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出单元50,用于输出所述疾病预测结果与所述关联疾病。
其中上述单元分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述隐藏状态向量序列获取单元20,包括:
多段数据序列获取子单元,用于将所述第一医疗数据根据预设的时间段分为多段数据序列;
指定影响因子获取子单元,用于根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;
隐藏状态向量序列获取子单元,用于将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。
其中上述子单元分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述隐藏状态向量序列获取子单元,包括:
隐藏状态向量计算模块,用于根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;
隐藏状态向量序列获取模块,用于将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段。
其中上述模块分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述隐藏状态向量序列获取模块,包括:
最终隐藏状态向量获取子模块,用于根据公式:
Figure BDA0002110672360000131
Figure BDA0002110672360000132
eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;
隐藏状态向量序列获取子模块,用于将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2...、cn
其中上述子模块分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述疾病预测结果获取单元30,包括:
高维向量序列获取子单元,用于将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,从而得到所述第二长短期记忆网络输出的高维向量序列;
疾病预测结果获取子单元,用于根据预设的分向量与预测结果含义对应关系,解读所述高维向量序列,从而得到在将来不同时间段内的疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。
其中上述子单元分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述装置,包括:
改善因素组接收单元,用于接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;
改善疾病预测结果获取单元,用于获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;
生成治疗推荐方案单元,用于根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。
其中上述单元分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述疾病关联网络为知识图谱网络,所述装置,包括:
初始实体识别单元,用于采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;
最终实体获取单元,用于对所述初始实体进行去重处理,从而获取最终实体;
知识图谱网络生成单元,用于从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。
其中上述单元分别用于执行的操作与前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
本申请的基于长短期记忆模型的疾病预测装置,获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于长短期记忆模型的疾病预测方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于长短期记忆模型的疾病预测方法。
上述处理器执行上述基于长短期记忆模型的疾病预测方法,其中所述方法包括的步骤分别与执行前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于长短期记忆模型的疾病预测方法,其中所述方法包括的步骤分别与执行前述实施方式的基于长短期记忆模型的疾病预测方法的步骤一一对应,在此不再赘述。
本申请的计算机可读存储介质,获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于长短期记忆模型的疾病预测方法,其特征在于,包括:
获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出所述疾病预测结果与所述关联疾病。
2.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
将所述第一医疗数据根据预设的时间段分为多段数据序列;
根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;
将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。
3.根据权利要求2所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;
将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2…、hn,其中共有n个时间段。
4.根据权利要求3所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2…、hn,其中共有n个时间段的步骤,包括:
根据公式:
Figure FDA0002110672350000021
eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;
将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2…、cn
5.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤,包括:
将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,从而得到所述第二长短期记忆网络输出的高维向量序列;
根据预设的分向量与预测结果含义对应关系,解读所述高维向量序列,从而得到在将来不同时间段内的疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。
6.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤之后,包括:
接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;
获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;
根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。
7.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述疾病关联网络为知识图谱网络,所述根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型的步骤之前,包括:
采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;
对所述初始实体进行去重处理,从而获取最终实体;
从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。
8.一种基于长短期记忆模型的疾病预测装置,其特征在于,包括:
医疗数据获取单元,用于获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
隐藏状态向量序列获取单元,用于将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
疾病预测结果获取单元,用于将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
关联疾病获取单元,用于从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出单元,用于输出所述疾病预测结果与所述关联疾病。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910570055.9A 2019-06-27 2019-06-27 基于长短期记忆模型的疾病预测方法、装置和计算机设备 Active CN110459324B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201910570055.9A CN110459324B (zh) 2019-06-27 2019-06-27 基于长短期记忆模型的疾病预测方法、装置和计算机设备
PCT/CN2019/103547 WO2020220545A1 (zh) 2019-06-27 2019-08-30 基于长短期记忆模型的疾病预测方法、装置和计算机设备
US17/264,299 US11710571B2 (en) 2019-06-27 2019-08-30 Long short-term memory model-based disease prediction method and apparatus, and computer device
SG11202008385YA SG11202008385YA (en) 2019-06-27 2019-08-30 Disease prediction method and apparatus based on long short-term memory model, and computer device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910570055.9A CN110459324B (zh) 2019-06-27 2019-06-27 基于长短期记忆模型的疾病预测方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN110459324A CN110459324A (zh) 2019-11-15
CN110459324B true CN110459324B (zh) 2023-05-23

Family

ID=68481784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910570055.9A Active CN110459324B (zh) 2019-06-27 2019-06-27 基于长短期记忆模型的疾病预测方法、装置和计算机设备

Country Status (4)

Country Link
US (1) US11710571B2 (zh)
CN (1) CN110459324B (zh)
SG (1) SG11202008385YA (zh)
WO (1) WO2020220545A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161880B (zh) * 2019-12-23 2022-12-02 深圳平安医疗健康科技服务有限公司 基于分类模型的医疗信息分类方法、装置和计算机设备
CN111476092B (zh) * 2020-03-05 2023-07-21 平安科技(深圳)有限公司 基于车联网的数据存储方法、装置和计算机设备
CN111785370B (zh) * 2020-07-01 2024-05-17 医渡云(北京)技术有限公司 病历数据处理方法及装置、计算机存储介质、电子设备
CN112002410A (zh) * 2020-08-20 2020-11-27 医渡云(北京)技术有限公司 传染病疾病状态预测方法及装置、存储介质、电子设备
CN111899883B (zh) * 2020-09-29 2020-12-15 平安科技(深圳)有限公司 少样本或零样本的疾病预测设备、方法、装置及存储介质
CN111933303B (zh) * 2020-09-30 2021-01-15 平安科技(深圳)有限公司 事件预测方法、装置、电子设备及存储介质
CN112102950B (zh) * 2020-11-04 2021-02-12 平安科技(深圳)有限公司 一种数据处理系统、方法、装置及存储介质
CN112447298A (zh) * 2020-11-24 2021-03-05 平安科技(深圳)有限公司 基于联邦迁移学习的神经退行性疾病建模装置及相关设备
CN113241178B (zh) * 2021-05-28 2023-06-27 温州康宁医院股份有限公司 一种确定被测者的抑郁症严重程度的装置
CN113270182B (zh) * 2021-07-20 2021-09-28 武汉泰乐奇信息科技有限公司 基于长短期记忆网络的共同医疗访问合约生成方法和系统
CN113688119B (zh) * 2021-08-24 2023-09-12 深圳平安智慧医健科技有限公司 基于人工智能的医疗数据库构建方法及相关设备
CN113679348B (zh) * 2021-08-26 2024-02-06 深圳平安智慧医健科技有限公司 血糖预测方法、血糖预测装置、设备及存储介质
CN113707323B (zh) * 2021-08-31 2024-05-14 平安科技(深圳)有限公司 基于机器学习的疾病预测方法、装置、设备及介质
CN114022058A (zh) * 2022-01-06 2022-02-08 成都晓多科技有限公司 基于时序知识图谱的中小企业失信风险预测方法
US20230420127A1 (en) * 2022-06-26 2023-12-28 Danika Gupta Multi-modal machine learning medical assessment
CN115886766A (zh) * 2022-11-29 2023-04-04 重庆理工大学 一种基于注意力机制与ctg图像的胎儿、新生儿缺氧无创诊断系统
CN117594241B (zh) * 2024-01-15 2024-04-30 北京邮电大学 基于时序知识图谱邻域推理的透析低血压预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145746A (zh) * 2017-05-09 2017-09-08 北京大数医达科技有限公司 一种病情描述的智能分析方法及系统
CN107977709A (zh) * 2017-04-01 2018-05-01 北京昆仑医云科技有限公司 预测血管树血管路径上的血流特征的深度学习模型和系统
CN109785971A (zh) * 2019-01-30 2019-05-21 华侨大学 一种基于先验医学知识的疾病风险预测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11432778B2 (en) * 2017-01-24 2022-09-06 General Electric Company Methods and systems for patient monitoring
US10636518B2 (en) * 2017-08-08 2020-04-28 Virgo Surgical Video Solutions, Inc. Automated medical note generation system utilizing text, audio and video data
US11238989B2 (en) * 2017-11-08 2022-02-01 International Business Machines Corporation Personalized risk prediction based on intrinsic and extrinsic factors
EP3536245A1 (en) * 2018-03-08 2019-09-11 Koninklijke Philips N.V. A system and method of identifying characteristics of ultrasound images
US10765409B2 (en) * 2018-06-28 2020-09-08 Fitbit, Inc. Menstrual cycle tracking
CN109147954A (zh) * 2018-07-26 2019-01-04 南京邮电大学 基于知识图谱的患者信息处理装置
CN109599177B (zh) * 2018-11-27 2023-04-11 华侨大学 一种基于病历的深度学习预测医疗轨迹的方法
CN109754852A (zh) * 2019-01-08 2019-05-14 中南大学 基于电子病历的心血管疾病风险预测方法
US11557380B2 (en) * 2019-02-18 2023-01-17 Merative Us L.P. Recurrent neural network to decode trial criteria
US20200293882A1 (en) * 2019-03-15 2020-09-17 Samsung Electronics Co., Ltd. Near-infrared spectroscopy (nir) based glucose prediction using deep learning
US11366985B2 (en) * 2020-05-15 2022-06-21 Retrace Labs Dental image quality prediction platform using domain specific artificial intelligence

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977709A (zh) * 2017-04-01 2018-05-01 北京昆仑医云科技有限公司 预测血管树血管路径上的血流特征的深度学习模型和系统
CN107145746A (zh) * 2017-05-09 2017-09-08 北京大数医达科技有限公司 一种病情描述的智能分析方法及系统
CN109785971A (zh) * 2019-01-30 2019-05-21 华侨大学 一种基于先验医学知识的疾病风险预测方法

Also Published As

Publication number Publication date
CN110459324A (zh) 2019-11-15
US11710571B2 (en) 2023-07-25
US20210296002A1 (en) 2021-09-23
SG11202008385YA (en) 2020-12-30
WO2020220545A1 (zh) 2020-11-05

Similar Documents

Publication Publication Date Title
CN110459324B (zh) 基于长短期记忆模型的疾病预测方法、装置和计算机设备
CN108986908B (zh) 问诊数据处理方法、装置、计算机设备和存储介质
Zhu et al. Electrocardiogram generation with a bidirectional LSTM-CNN generative adversarial network
Bashir et al. BagMOOV: A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting
Ambekar et al. Disease risk prediction by using convolutional neural network
CN110119775B (zh) 医疗数据处理方法、装置、系统、设备和存储介质
CN109326353B (zh) 预测疾病终点事件的方法、装置及电子设备
CN104572583B (zh) 用于数据致密化的方法和系统
WO2020172607A1 (en) Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients
Chowdhury et al. Heart disease prognosis using machine learning classification techniques
CN112132624A (zh) 医疗理赔数据预测系统
Bock et al. Machine learning for biomedical time series classification: from shapelets to deep learning
CN111785366A (zh) 患者治疗方案的确定方法、装置及计算机设备
CN113409907A (zh) 一种基于互联网医院的智能预问诊方法及系统
Lilhore et al. Hybrid CNN-LSTM model with efficient hyperparameter tuning for prediction of Parkinson’s disease
CN110752027B (zh) 电子病历数据推送方法、装置、计算机设备和存储介质
CN113345564B (zh) 一种基于图神经网络的患者住院时长早期预测方法及装置
CN114191665A (zh) 机械通气过程中人机异步现象的分类方法和分类装置
CN112071431B (zh) 基于深度学习和知识图谱的临床路径自动生成方法及系统
CN113657970A (zh) 基于人工智能的药品推荐方法、装置、设备及存储介质
CN113724830A (zh) 基于人工智能的用药风险检测方法及相关设备
CN113722507A (zh) 基于知识图谱的住院费用预测方法、装置及计算机设备
CN116884636A (zh) 传染病数据分析方法、装置、计算机设备及存储介质
CN115579153A (zh) 问诊评价方法、问诊评价装置、电子设备和可读存储介质
Dedhia et al. SCouT: Synthetic Counterfactuals via Spatiotemporal Transformers for Actionable Healthcare

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant