CN110957036A - 一种基于因果推理构建的疾病预后风险评估模型的方法 - Google Patents

一种基于因果推理构建的疾病预后风险评估模型的方法 Download PDF

Info

Publication number
CN110957036A
CN110957036A CN201911017727.XA CN201911017727A CN110957036A CN 110957036 A CN110957036 A CN 110957036A CN 201911017727 A CN201911017727 A CN 201911017727A CN 110957036 A CN110957036 A CN 110957036A
Authority
CN
China
Prior art keywords
patient
disease
neural network
fully
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911017727.XA
Other languages
English (en)
Other versions
CN110957036B (zh
Inventor
何昆仑
黄正行
白永怿
刘宏斌
边素艳
贾倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Chinese PLA General Hospital
Original Assignee
Zhejiang University ZJU
Chinese PLA General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Chinese PLA General Hospital filed Critical Zhejiang University ZJU
Priority to CN201911017727.XA priority Critical patent/CN110957036B/zh
Publication of CN110957036A publication Critical patent/CN110957036A/zh
Application granted granted Critical
Publication of CN110957036B publication Critical patent/CN110957036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种基于因果推理构建的疾病预后风险评估模型的方法及基于因果推理的疾病预后风险评估系统。基于因果推理,利用全连接神经网络来预测癌症或心脑血管疾病患者一年内再入院的概率,评估不同治疗方案的效果,从而辅助医生制定合理的诊疗措施,支持临床决策,降低医疗开支。

Description

一种基于因果推理构建的疾病预后风险评估模型的方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于因果推理构建的癌症或心脑血管疾病预后风险评估模型的方法及预后风险评估的系统。
背景技术
心力衰竭简称心衰,是指由于心脏的收缩功能和(或)舒张功能发生障碍,不能将静脉回心血量充分排出心脏,导致静脉系统血液淤积,动脉系统血液灌注不足,从而引起心脏循环障碍症候群,此种障碍症候群集中表现为肺淤血、腔静脉淤血。心力衰竭并不是一个独立的疾病,而是心脏疾病发展的终末阶段。其中绝大多数的心力衰竭都是以左心衰竭开始的,即首先表现为肺循环淤血。
因受试人群的不同,心力衰竭患者3~6个月内的再入院率达27%~50%,1年的全因死亡率达30%。据国内既往的研究数据显示,心力衰竭患者出院后1年内因心功能不全再住院率为58.4%,重症心力衰竭患者在确诊后第1年内全因死亡率超过20%。
现有的一些心衰预后评估方法包括:
心衰生存评分(heart failure survival score,HFSS):文献Development andprospective validation of a clinical index to predict survival in ambulatorypatients referred for cardiac transplant evaluation提出针对心脏供体稀缺的状况,以筛选出最合适的心脏移植受体的目的。模型的推导样本来自同一家医院的268例非卧床心力衰竭患者(年龄小于70岁,LVEF小于等于40%)的80种临床特征数据。
西雅图心衰模型(Seattle heart failure model,SHFM):文献The SeattleHeart Failure Model:prediction of survival in heart failure预测心衰患者的1-3年生存率而建立,使用参数包括疾病状态,治疗及实验室检查数据。模型的推导样本来自氨氯地平试验的资料库,样本量大,大约9942例,范围涉及46个不同国家。SHFM分数等于多元模型中各变量乘以其β系数,再求和的值。
MUSIC风险评分:文献The MUSIC Risk score:a simple method for predictingmortality in ambulatory patients with chronic heart failure通过来自992例连续的无需卧床的心衰患者作为模型样本,全部按照指南进行治疗,其中还包括224例射血分数保留的心衰患者,研究的主要终点是心源性死亡。
峰心肌氧耗量(Peak VO2)方法:文献Value of peak exercise oxygenconsumption for optimal timing of cardiac transplantation in ambulatorypatients with heart failure指出Peak VO2大于14mL/kg·min的患者为低危,可以安全的推迟移植;而Peak VO2小于14mL/kg·min的患者则有52%在1年内死亡或是接受了紧急移植。
6min步行实验(6minute walking test,6MWT):文献The utility of the 6-minute walk test as a measure of frailty in older adults with heart failure指出运动量接近患者日常活动量,可客观反映患者实际活动能力,是运动量较小的次级量运动试验,不需要特殊设备,方法简单、易行、重复性及安全性均较好等。
这些工具已经在临床实践中得到应用,但仍然存在以下局限性,仅有少量特征作为风险因子,虽然简化了计算,方便其在临床环境中使用,然而这也导致了评分工具缺乏概括性。
随着医疗信息化的迅速发展,可基于电子健康记录或者医院提供的患者特征构建机器学习模型,来预测心衰患者一年内再入院的概率。因果推理是一种分析不同条件下数据分布的方法,根据因果推理来分析得到使用不同治疗方案对于心衰患者治疗效果的影响。
因此,本发明提供了借助因果推理,得到分别使用不同方案时,患者一年内再入院的概率。
发明内容
本发明提供了一种基于因果推理构建的疾病预后风险评估模型的方法,所述的方法包括:
采集患者特征,对预后风险特征进行标注作为真值标签,获得带有真值标签的训练样本;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure BDA0002246237460000021
将特征输出集
Figure BDA0002246237460000031
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出;获得疾病预后风险评估模型。
优选的,所述的疾病选自癌症或心脑血管疾病;所述的心脑血管疾病选自心力衰竭、先天性心脏病、心肌病、肺动脉高压、动脉粥样硬化、高血脂、血液粘稠、高血压或遗传性主动脉疾病。
优选的,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数;所述的患者特征选自体征(如年龄、身高、体重等)、检查检验信息(如红细胞计数、白细胞计数等)、病程报告、药物(如阿司匹林等)使用记录、一年内是否再次入院、既往病史或预防性的诊疗。
在本发明的一个具体实施方式中,所述的患者特征采集自电子健康记录,所述的电子健康记录经过预处理,所述的预处理为处理实验数据缺失值。
优选的,所述的疾病预后风险评估为评估患者一年内再入院的概率。
优选的,所述的标注的预后风险特征为一年内是否再次入院。
优选的,所述的全连接神经网络提取特征为将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数。
优选的,所述的全连接神经网络分类为以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure BDA0002246237460000032
在本发明的一个具体实施方式中,所述的方法包括:
采集患者的特征,对一年内是否再次入院进行标注,作为真值标签,获得带有真值标签的训练样本,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数;其中,所述的特征选自体征(如年龄、身高、体重等)、检查检验信息(如红细胞计数、白细胞计数等)、病程报告、药物(如阿司匹林等)使用记录、一年内是否再次入院、既往病史或预防性的诊疗;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure BDA0002246237460000041
即将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数,优选的,所述的激活函数为relu激活函数σ(x)=max(x,0);
将特征输出集
Figure BDA0002246237460000042
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出,即以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure BDA0002246237460000043
获得疾病预后风险评估模型。
优选的,所述的疾病预后风险模型采用交叉熵代价函数作为损失函数表示疾病治疗方案的效果评估模型拟合的好坏,所述的交叉熵代价函数的计算方式如下:
Figure BDA0002246237460000044
其中,N是所有输入x的个数,j则代表第几个输入;并通过梯度下降算法来更新参数w和b,表达式如下:
Figure BDA0002246237460000045
Figure BDA0002246237460000046
在本发明的一个具体实施方式中,所述的疾病为心力衰竭。
本发明还提供了一种基于因果推理构建的心力衰竭预后风险评估模型的方法,所述的方法包括:
采集心力衰竭患者特征,对预后风险特征进行标注作为真值标签,获得带有真值标签的训练样本;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure BDA0002246237460000051
将特征输出集
Figure BDA0002246237460000052
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出;获得心力衰竭预后风险评估模型。
优选的,所述的模型的样本来自736个心力衰竭患者。
优选的,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数;所述的患者特征选自体征(如年龄、身高、体重等)、检查检验信息(如红细胞计数、白细胞计数等)、病程报告、药物(如阿司匹林等)使用记录、一年内是否再次入院、既往病史或预防性的诊疗。
在本发明的一个具体实施方案中,所述的治疗方案为药物治疗方案。
在本发明的一个具体实施方式中,所述的患者特征采集自电子健康记录,所述的电子健康记录经过预处理,所述的预处理为处理实验数据缺失值。
优选的,所述的心力衰竭预后风险评估为评估患者一年内再入院的概率。
优选的,所述的标注的预后风险特征为一年内是否再次入院。
优选的,所述的全连接神经网络提取特征为将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数。
优选的,所述的全连接神经网络分类为以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure BDA0002246237460000053
在本发明的一个具体实施方式中,所述的方法包括:
采集患者的特征,对一年内是否再次入院进行标注,作为真值标签,获得带有真值标签的训练样本,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数;其中,所述的特征选自体征(如年龄、身高、体重等)、检查检验信息(如红细胞计数、白细胞计数等)、病程报告、药物(如阿司匹林等)使用记录、一年内是否再次入院、既往病史或预防性的诊疗;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure BDA0002246237460000061
即将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数,优选的,所述的激活函数为relu激活函数σ(x)=max(x,0);
将特征输出集
Figure BDA0002246237460000062
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出,即以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure BDA0002246237460000063
获得心力衰竭预后风险评估模型。
优选的,所述的心力衰竭预后风险模型采用交叉熵代价函数作为损失函数表示心力衰竭治疗方案的效果评估模型拟合的好坏,所述的交叉熵代价函数的计算方式如下:
Figure BDA0002246237460000064
其中,N是所有输入x的个数,j则代表第几个输入;并通过梯度下降算法来更新参数w和b,表达式如下:
Figure BDA0002246237460000065
Figure BDA0002246237460000066
本发明还提供了根据所述的基于因果推理构建的疾病预后风险评估模型的方法构建的疾病预后风险评估模型。优选的,所述的疾病预后风险评估模型为心力衰竭预后风险评估模型。
本发明进一步提供了一种基于因果推理的疾病预后风险评估系统,所述的系统包括输入模块、存储模块、计算模块及输出模块,所述的存储模块存储所述的疾病预后风险评估模型。
优选的,所述的输入模块用于输入患者特征。
优选的,所述的存储模块存储的疾病预后风险评估模型包括患者特征提取模块、分类模块。
优选的,所述的计算模块执行时具体步骤如下:
将心力衰竭患者的特征作为提取模块的输入,输出非线性变换后的特征输出集φ;将变换后的输出集φ和治疗方案作为分类模块的输入,输出患者一年内再入院的概率。
优选的,所述的非线性变化为全连接神经网络提取特征。
优选的,所述的输出模块用于输出患者一年内再入院的概率。
本发明还提供了一种疾病预后风险评估的方法,所述的方法包括如下步骤:
采集患者特征,治疗方案,全连接神经网络提取特征得到特征输出集
Figure BDA0002246237460000071
Figure BDA0002246237460000072
通过全连接神经网络以治疗方案进行分类,得到患者一年内再入院的概率。
优选的,所述的疾病预后风险评估的方法包括采集患者特征,并将其输入本发明所述的疾病预后风险评估系统,经提取模块、分类模块后输出患者一年内再入院的概率。
在本发明的一个具体实施方式中,所述的疾病选自癌症或心脑血管疾病。优选为心力衰竭。
本发明所述的治疗方案选自药物治疗方案、放疗治疗方案、化疗治疗方案、针灸治疗方案、手术治疗方案等。
本发明所述的“癌症”包括淋巴瘤,母细胞瘤,髓母细胞瘤,视网膜母细胞瘤,肉瘤,脂肪肉瘤,滑膜细胞肉瘤,神经内分泌肿瘤,类癌肿瘤,胃泌素瘤,胰岛细胞癌,间皮瘤,神经鞘瘤,听神经瘤,脑膜瘤,腺癌,黑素瘤,白血病或淋巴样恶性肿瘤,鳞状细胞癌,上皮鳞状细胞癌,肺癌,小细胞肺癌,非小细胞肺癌,腺癌肺癌,肺鳞癌,腹膜癌,肝细胞癌,胃癌,肠癌,胰腺癌,成胶质细胞瘤,子宫颈癌,卵巢癌,肝癌,膀胱癌,肝癌,乳腺癌,转移性乳腺癌,结肠癌,直肠癌,结肠直肠癌,子宫癌,唾液腺癌,肾癌,前列腺癌,外阴癌,甲状腺癌,肝癌,肛门癌,阴茎癌,梅克尔细胞癌,食管癌,胆道肿瘤,头颈部癌和血液恶性肿瘤。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1为基于因果推理的心力衰竭药物治疗效果评估模型的网络结构图。
图2为现有的名为CFR模型的网络结构图。
图3为模型的拟合效果图,即更迭次数与损失函数的关系。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所述的“和/或”是指包括择一列出的项目以及任何数量的项目组合。
本发明所述的“治疗”是指在疾病已开始发展后通过施用本发明所述的产品产生减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。
实施例1获得评估模型
一、模型获得步骤
模型样本来自736个心力衰竭患者,其中所述的736个心力衰竭患者由中国人民解放军总医院提供,不包括姓名等私人信息。在整个数据集中,一年内再入院的患者共有461例,占全部样本数的62.6%。
1、提取736个心力衰竭患者的特征,对一年内是否再次入院进行标注,作为真值标签,获得带有真值标签的训练样本,其中,所述的特征选自体征(如年龄、身高、体重等)、检查检验信息(如红细胞计数、白细胞计数等)、病程报告、药物(如阿司匹林等)使用记录、一年内是否再次入院、既往病史或预防性的诊疗;
构建训练样本的具体步骤为:
对原始记录中获得的736个患者的数据集进行预处理,处理实验数据缺失值,提取心力衰竭患者的特征样本,设训练样本的数据集为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和药物治疗方案类别组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表药物治疗方案的种数;其中,所述的训练样本的数据集中,N=736,代表一共736个患者样本,m=105,表示患者的特征维度为105,t=3,表示我们将患者的药物治疗方案分为3类。
2、将所述的训练样本作为输入,通过全连接神经网络提取特征得到的特征输出集
Figure BDA0002246237460000091
即将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hmm=σ(hm-1W+b),σ为激活函数,所述的激活函数为relu激活函数σ(x)=max(x,0);
3、将特征输出集
Figure BDA0002246237460000092
作为输入,根据患者药物治疗方案类别进行全连接神经网络分类,将所述训练样本中的真值标签作为输出,对所述模型进行训练,得到对应的特征提取模块,分类器模块,组成心衰药物治疗效果评估模型,即以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据药物治疗方案类别分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure BDA0002246237460000093
获得疾病预后风险评估模型。
二、验证模型
采用交叉熵代价函数作为损失函数表示心力衰竭药物治疗效果评估模型拟合的好坏,所述的交叉熵代价函数的计算方式如下:
Figure BDA0002246237460000094
其中,N是所有输入x的个数,j则代表第几个输入;并通过梯度下降算法来更新参数w和b,表达式如下:
Figure BDA0002246237460000095
Figure BDA0002246237460000101
因此,权重的更新是受f(x)-Y的影响,即受模型误差的影响。当模型的误差越大时,权重更新越快;当模型的误差越小时,权重的更新越慢。模型训练时观察到输出的损失函数的大小后,可以调整模型的迭代次数及模型的隐藏单元的大小,进而改变损失函数的输出,从而判断模型的拟合效果(见图3)。
三、基于因果推理的疾病预后风险评估系统
系统包括输入模块、存储模块、计算模块和输出模块,将上述获得的评估模型存储在评估系统的存储模块中,应用时,通过输入模块接受患者的特征,治疗方案类别;计算模块进行全连接神经网络特征提取层以患者的特征为输入得到中间结果输出集φ,全连接神经网络分类器以患者特征和治疗方案类别为输入,得到患者一年内再入院的概率,将得到的概率通过输出模块输出。
实施例2
本实施例采用的心衰患者病例数据中共有736份,由国内某三甲医院提供,不包括姓名等私人信息。在整个数据集中,一年内再入院的患者共有461例,占全部样本数的62.6%。
按照实施例1步骤流程进行训练:
为了更好地比较本发明所提出的模型的优越性,从模型在预测患者一年内再入院的准确性进行比较。本实施例将数据按0.56,0.24,0.20比例将数据分为训练集,验证集和测试集,然后重复100次实验,与基准模型BART,CFR_mmd,CFB_lin和CFR_wass进行比较。从准确率(ACC),来比较几个模型的优劣。表1显示,本发明所述的模型相较于其他几种方法,我们的模型取得了最好的准确率。其中ResCF为本发明模型。
表1不同模型的精准度对比
Figure BDA0002246237460000102
Figure BDA0002246237460000111
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

Claims (10)

1.一种基于因果推理构建的疾病预后风险评估模型的方法,其特征在于,所述的方法包括:
采集患者特征,对预后风险特征进行标注作为真值标签,获得带有真值标签的训练样本;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure FDA0002246237450000012
将特征输出集
Figure FDA0002246237450000013
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出;
获得疾病预后风险评估模型。
2.根据权利要求1所述的方法,其特征在于,所述的疾病选自癌症或心脑血管疾病;所述的心脑血管疾病选自心力衰竭、先天性心脏病、心肌病、肺动脉高压、动脉粥样硬化、高血脂、血液粘稠、高血压或遗传性主动脉疾病;优选的,所述的疾病为心力衰竭。
3.根据权利要求1或2所述的方法,其特征在于,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数。
4.根据权利要求1-3任一所述的方法,其特征在于,所述的疾病预后风险评估为评估患者一年内再入院的概率,所述的标注的预后风险特征为一年内是否再次入院。
5.根据权利要求1-4任一所述的方法,其特征在于,所述的全连接神经网络为将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数。
6.根据权利要求1-5任一所述的方法,其特征在于,所述的全连接神经网络分类为以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure FDA0002246237450000011
7.根据权利要求1-6任一所述的方法,其特征在于,所述的方法包括:
采集患者的特征,对一年内是否再次入院进行标注,作为真值标签,获得带有真值标签的训练样本,所述的训练样本的数据集设为D={P1,P2,…,PN},N代表患者总数,P代表每一个患者;每一个患者由特征和治疗方案组成,即P={X,T},其中X∈Rm,T∈Rt,m代表病人特征的维度,t代表治疗方案的种数;
将所述的训练样本作为输入,通过全连接神经网络提取特征得到特征输出集
Figure FDA0002246237450000025
即将N位患者的特征X输入m层全连接网络,每一层网络的变换过程为hm=σ(hm-1W+b),σ为激活函数,优选的,所述的激活函数为relu激活函数σ(x)=max(x,0);
将特征输出集
Figure FDA0002246237450000026
作为输入,根据患者治疗方案进行全连接神经网络分类,将所述训练样本中的真值标签作为输出,即以全连接神经网络提取特征得到的特征输出集φ作为输入,建立t个全连接神经网络分类器,每个患者根据治疗方案分别进入各自的分类器中,分类器为k层全连接网络,每一层的变换过程为hk=σ(hk-1W+b),σ(x)=max(x,0),其中,最后一层输出分类结果时
Figure FDA0002246237450000021
获得疾病预后风险评估模型。
8.根据权利要求1-7任一所述的方法,其特征在于,所述的疾病预后风险模型采用交叉熵代价函数作为损失函数表示疾病治疗方案的效果评估模型拟合的好坏,所述的交叉熵代价函数的计算方式如下:
Figure FDA0002246237450000022
其中,N是所有输入x的个数,j则代表第几个输入;并通过梯度下降算法来更新参数w和b,表达式如下:
Figure FDA0002246237450000023
Figure FDA0002246237450000024
9.根据权利要求1-8任一所述的方法构建的疾病预后风险评估模型。
10.一种基于因果推理的疾病预后风险评估系统,其特征在于,所述的系统包括输入模块、存储模块、计算模块及输出模块,所述的存储模块存储权利要求9所述的疾病预后风险评估模型。
CN201911017727.XA 2019-10-24 2019-10-24 一种基于因果推理构建的疾病预后风险评估模型的方法 Active CN110957036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911017727.XA CN110957036B (zh) 2019-10-24 2019-10-24 一种基于因果推理构建的疾病预后风险评估模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911017727.XA CN110957036B (zh) 2019-10-24 2019-10-24 一种基于因果推理构建的疾病预后风险评估模型的方法

Publications (2)

Publication Number Publication Date
CN110957036A true CN110957036A (zh) 2020-04-03
CN110957036B CN110957036B (zh) 2023-07-14

Family

ID=69976450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911017727.XA Active CN110957036B (zh) 2019-10-24 2019-10-24 一种基于因果推理构建的疾病预后风险评估模型的方法

Country Status (1)

Country Link
CN (1) CN110957036B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160986A (zh) * 2021-04-23 2021-07-23 桥恩(北京)生物科技有限公司 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN116052885A (zh) * 2023-02-07 2023-05-02 齐鲁工业大学(山东省科学院) 基于改进ReliefF的癌症组学特征选择算法提高预后预测精度系统、方法、设备及介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007240837A1 (en) * 2006-04-17 2007-11-01 Siemens Medical Solutions Usa, Inc. Personalized prognosis modeling in medical treatment planning
US20140379363A1 (en) * 2013-06-19 2014-12-25 Passport Health Communications, Inc. Patient readmission risk assessment
WO2016040790A1 (en) * 2014-09-12 2016-03-17 H. Lee Moffitt Cancer Center And Research Institute, Inc. Supervised learning methods for the prediction of tumor radiosensitivity to preoperative radiochemotherapy
US20170109494A1 (en) * 2015-10-16 2017-04-20 Carefusion 303, Inc. Readmission risk scores
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN107492095A (zh) * 2017-08-02 2017-12-19 西安电子科技大学 基于深度学习的医学图像肺结节检测方法
WO2018201083A1 (en) * 2017-04-28 2018-11-01 University Of Southern California System and method for predicting survival time
US20180315507A1 (en) * 2017-04-27 2018-11-01 Yale-New Haven Health Services Corporation Prediction of adverse events in patients undergoing major cardiovascular procedures
CN109009102A (zh) * 2018-08-10 2018-12-18 中南大学 一种基于脑电图深度学习的辅助诊断方法及系统
CN109493976A (zh) * 2018-12-20 2019-03-19 广州天鹏计算机科技有限公司 基于卷积神经网络模型的慢性病复发预测方法和装置
CN109585020A (zh) * 2018-11-27 2019-04-05 华侨大学 一种运用卷积神经网络对疾病风险预测的模型
CN109659033A (zh) * 2018-12-18 2019-04-19 浙江大学 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN109686441A (zh) * 2018-12-21 2019-04-26 质直(上海)教育科技有限公司 一种大数据医疗数据特征提取和智能分析预测方法
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109949936A (zh) * 2019-03-13 2019-06-28 成都数联易康科技有限公司 一种基于深度学习混合模型的再住院风险预测方法
US20190221310A1 (en) * 2018-01-16 2019-07-18 James Stewart Bates System and method for automated diagnosis and treatment

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007240837A1 (en) * 2006-04-17 2007-11-01 Siemens Medical Solutions Usa, Inc. Personalized prognosis modeling in medical treatment planning
US20140379363A1 (en) * 2013-06-19 2014-12-25 Passport Health Communications, Inc. Patient readmission risk assessment
WO2016040790A1 (en) * 2014-09-12 2016-03-17 H. Lee Moffitt Cancer Center And Research Institute, Inc. Supervised learning methods for the prediction of tumor radiosensitivity to preoperative radiochemotherapy
US20170109494A1 (en) * 2015-10-16 2017-04-20 Carefusion 303, Inc. Readmission risk scores
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
US20180315507A1 (en) * 2017-04-27 2018-11-01 Yale-New Haven Health Services Corporation Prediction of adverse events in patients undergoing major cardiovascular procedures
WO2018201083A1 (en) * 2017-04-28 2018-11-01 University Of Southern California System and method for predicting survival time
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法
CN107492095A (zh) * 2017-08-02 2017-12-19 西安电子科技大学 基于深度学习的医学图像肺结节检测方法
US20190221310A1 (en) * 2018-01-16 2019-07-18 James Stewart Bates System and method for automated diagnosis and treatment
CN109009102A (zh) * 2018-08-10 2018-12-18 中南大学 一种基于脑电图深度学习的辅助诊断方法及系统
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109585020A (zh) * 2018-11-27 2019-04-05 华侨大学 一种运用卷积神经网络对疾病风险预测的模型
CN109659033A (zh) * 2018-12-18 2019-04-19 浙江大学 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN109493976A (zh) * 2018-12-20 2019-03-19 广州天鹏计算机科技有限公司 基于卷积神经网络模型的慢性病复发预测方法和装置
CN109686441A (zh) * 2018-12-21 2019-04-26 质直(上海)教育科技有限公司 一种大数据医疗数据特征提取和智能分析预测方法
CN109949936A (zh) * 2019-03-13 2019-06-28 成都数联易康科技有限公司 一种基于深度学习混合模型的再住院风险预测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
AHMED ALLAM等: "Neural networks versus Logistic regression for 30 days all-cause readmission prediction", Retrieved from the Internet <URL:https://www.nature.com/articles/s41598-019-45685-z> *
丁宝芬: "《医学信息学》", 30 September 2009, 东南大学出版社, pages: 28 - 33 *
寥廓长空: "全连接神经网络", 《HTTPS://BLOG.CSDN.NET/BAIDU_36602427/ARTICLE/DETAILS/96429838?》 *
寥廓长空: "全连接神经网络", 《HTTPS://BLOG.CSDN.NET/BAIDU_36602427/ARTICLE/DETAILS/96429838?》, 22 July 2019 (2019-07-22), pages 1 - 7 *
董蔚等: "医疗大数据在心衰中心建设中的作用", 中国医学前沿杂志(电子版), vol. 10, no. 08, pages 8 - 10 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160986A (zh) * 2021-04-23 2021-07-23 桥恩(北京)生物科技有限公司 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN113160986B (zh) * 2021-04-23 2023-12-15 桥恩(北京)生物科技有限公司 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN116052885A (zh) * 2023-02-07 2023-05-02 齐鲁工业大学(山东省科学院) 基于改进ReliefF的癌症组学特征选择算法提高预后预测精度系统、方法、设备及介质
CN116052885B (zh) * 2023-02-07 2024-03-08 齐鲁工业大学(山东省科学院) 基于改进ReliefF的癌症组学特征选择算法提高预后预测精度系统、方法、设备及介质

Also Published As

Publication number Publication date
CN110957036B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
Shung et al. Validation of a machine learning model that outperforms clinical risk scoring systems for upper gastrointestinal bleeding
Amin et al. Identification of significant features and data mining techniques in predicting heart disease
Khanam et al. A comparison of machine learning algorithms for diabetes prediction
Kam et al. Learning representations for the early detection of sepsis with deep neural networks
Sawhney et al. A comparative assessment of artificial intelligence models used for early prediction and evaluation of chronic kidney disease
Razavian et al. Multi-task prediction of disease onsets from longitudinal laboratory tests
Tripoliti et al. Heart failure: diagnosis, severity estimation and prediction of adverse events through machine learning techniques
LaFreniere et al. Using machine learning to predict hypertension from a clinical dataset
Dileep et al. An automatic heart disease prediction using cluster-based bi-directional LSTM (C-BiLSTM) algorithm
Raji et al. Long-term forecasting the survival in liver transplantation using multilayer perceptron networks
Manemann et al. Longitudinal cohorts for harnessing the electronic health record for disease prediction in a US population
CN110957036A (zh) 一种基于因果推理构建的疾病预后风险评估模型的方法
Pavithra et al. Hybrid feature selection technique for prediction of cardiovascular diseases
Rani et al. Coronary artery disease diagnosis using extra tree-support vector machine: ET-SVMRBF
Yang et al. Application of extreme learning machine in the survival analysis of chronic heart failure patients with high percentage of censored survival time
Wadhawan et al. ETCD: An effective machine learning based technique for cardiac disease prediction with optimal feature subset selection
Ichikawa et al. Impact of predicting health-guidance candidates using massive health check-up data: a data-driven analysis
Prasanna et al. Building an efficient heart disease prediction system by using clustering techniques
Amer et al. Biolearner: a machine learning-powered smart heart disease risk prediction system utilizing biomedical markers
Oliveira et al. CML-Cardio: a cascade machine learning model to predict cardiovascular disease risk as a primary prevention strategy
Islam et al. An Improved Heart Disease Prediction Using Stacked Ensemble Method
Akazue et al. Machine Learning Survival Analysis Model for Diabetes Mellitus
Jijji et al. Ensemble Model for the Prediction of Hypertension using KNN and SVM Algorithms
Hakim Performance Evaluation of Machine Learning Techniques for Early Prediction of Brain Strokes
Ouyang et al. Interpretable machine learning models for predicting in-hospital death in patients in the intensive care unit with cerebral infarction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant