CN110289096A - 一种基于深度学习的icu院内死亡率预测方法 - Google Patents
一种基于深度学习的icu院内死亡率预测方法 Download PDFInfo
- Publication number
- CN110289096A CN110289096A CN201910574239.2A CN201910574239A CN110289096A CN 110289096 A CN110289096 A CN 110289096A CN 201910574239 A CN201910574239 A CN 201910574239A CN 110289096 A CN110289096 A CN 110289096A
- Authority
- CN
- China
- Prior art keywords
- icu
- follows
- memory unit
- patient
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003466 anti-cipated effect Effects 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000013135 deep learning Methods 0.000 title claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 14
- 208000010513 Stupor Diseases 0.000 claims description 11
- 239000008280 blood Substances 0.000 claims description 11
- 210000004369 blood Anatomy 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 229910052760 oxygen Inorganic materials 0.000 claims description 6
- 239000001301 oxygen Substances 0.000 claims description 6
- 230000036772 blood pressure Effects 0.000 claims description 5
- 230000036760 body temperature Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 3
- 230000035487 diastolic blood pressure Effects 0.000 claims description 3
- 239000008103 glucose Substances 0.000 claims description 3
- 230000036387 respiratory rate Effects 0.000 claims description 3
- 239000004576 sand Substances 0.000 claims description 3
- 230000035488 systolic blood pressure Effects 0.000 claims description 3
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000005070 sampling Methods 0.000 abstract description 4
- 230000001788 irregular Effects 0.000 abstract description 3
- 230000007787 long-term memory Effects 0.000 abstract description 3
- 230000007246 mechanism Effects 0.000 abstract description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 206010010071 Coma Diseases 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的ICU院内死亡率预测方法。本发明通过使用深度学习对ICU内死亡进行预测,不仅使用患者动态体征变化数据,还加入了年龄、患病类型等影响死亡率的重要人口统计学特征;在经典LSTM(多层双向与单向长短期记忆模型)网络的基础上增加了三个用于控制时间增量变化的时间门,解决临床数据常见的不规则采样及数据缺失问题;引入注意力机制对每个时刻的隐藏状态进行融合,模型收敛速度更快,且不易丢失初始阶段包含的信息。
Description
技术领域
本发明涉及死亡率预测技术领域,具体涉及一种基于深度学习的ICU院内死亡率预测方法。
背景技术
重症加强护理病房(Intensive Care Unit,ICU)内收治各种危重症患者,通常都需要对患者进行日常监护,比如心率、心电、血压、呼吸、体温等,以及针对不同患者的特殊监护,因此每天会产生大量监测数据,包括各类医学和生物传感器采集的生理数据,以及医护人员的主观评估结果,这些时序数据可用于对患者进行分类诊断、住院时间估计和死亡率预测等,其中急性护理环节最关注的是院内死亡率预测,即预测患者在ICU住院期间是否死亡。ICU死亡率预测可以帮助临床医生对患者的治疗手段作出辅助决策,也可以帮助医院进行更合理的医疗资源配置。因此,ICU患者院内死亡率预测是临床研究的重要课题之一。
针对该问题的传统模型方法有简化急性生理学评分SAPS、病死概率模型MPM等方法。SAPS II包含17项变量,包括心率、血压等生理学变量以及年龄、住院类型等统计学变量,每项变量分值0-26分不等,选取患者入住ICU后24小时内的最差值,如果既有高值又有低值,则按高分计算,不累计积分。各项分值之和即为SAPS II总得分,最低0分,最高163分。总分越高,表示病情越重,院内死亡风险更高。MPM也采取类似的方式,按既定评分规则进行评分。临床中还依据该分值作为划分患者病情严重程度的指标,协助医生确定更合适的治疗和护理措施以降低死亡率。
现有技术使用历史体征数据记录中的11项变量作为输入,构建监督型双向长短期记忆网络(BiLSTM-ST),在体征数据序列每个时刻都有预测结果,并通过最终池化输出表示患者死亡的风险系数(在0~1之间),值越大表示死亡风险越高。APS、MPM等评分模型均使用患者进入ICU后24小时内的10多项生理学数据及统计学数据,按照既定评分规则进行打分,医生根据分数确定救治措施。但是这种方式没有考虑患者进入ICU后的数据动态变化情况,评分较为粗糙。ICU的临床观察记录不定期,测量频率在不同患者之间、不同变量之间、甚至随着时间的推移而变化。一种常见的建模策略是用离散的、可变的时间步长将这些观测结果表示为序列,但由于采样的不规则性,得到的序列常常包含缺失的值。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于深度学习的ICU院内死亡率预测方法解决了ICU患者院内死亡率预测结果不准确的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于深度学习的ICU院内死亡率预测方法,包括以下步骤:
S1、采集患者入住ICU后48小时内的体征指标;
S2、对采集到的体征指标进行预处理,得到预处理后的体征指标;
S3、根据预处理后的体征指标对AT-LSTM模型进行训练,得到训练好的AT-LSTM模型;
S4、对进入ICU后48小时的新患者采集体征指标并进行预处理,将预处理后的新患者体征指标输入到训练好的AT-LSTM模型中,得到该新患者的死亡率预测结果。
进一步地:所述步骤S1中体征指标包括离散变量、连续变量和人口统计学信息,所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分,所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值,所述人口统计学信息包括年龄、性别、种族和患病类型。
进一步地:所述步骤S2中预处理包括对离散变量通过One-hot进行编码,得到编码后的离散变量,和对连续变量进行归一化处理,得到归一化后的连续变量,所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布,其具体公式为:
上式中,x′为归一化后的连续变量,x为连续变量,为所有连续变量的均值,σ为所有连续变量的标准差;
所述预处理后的体征指标包括编码后的离散变量和归一化后的连续变量。
进一步地:所述步骤S3的具体步骤为:
S31、在AT-LSTM模型中加入三个单独时间门和对输入、遗忘和输出门进行联合控制,更新AT-LSTM模型的记忆单元;
S32、通过更新后的记忆单元预测患者临床结局;
S33、通过患者临床结局计算代价函数;
S34、根据代价函数对模型训练参数进行更新迭代,使得模型的总体代价最小,得到训练好的AT-LSTM模型。
进一步地:所述步骤S31中记忆单元更新为:
上式中,ct为改进后的t时刻记忆单元状态,ft为时间t处的遗忘门控,ct-1为t时刻记忆单元状态,it为时间t处的输入门控,Wcx为输入与记忆单元连接权重矩阵,为预处理后的体征指标,ht-1为t-1时刻输出,Wch为记忆单元与输出的连接权重矩阵,bc为输入与记忆单元连接偏置向量,为向量乘积运算。
进一步地:所述步骤S32的具体步骤为:
S321、根据更新后的记忆单元计算时间的注意力,计算公式为:
at=Wact+ba
上式中,at为时间的注意力,Wa和ba分别表示待学习的注意力计算连接权重及偏置参数;
S322、根据时间的注意力和更新后的记忆单元计算带有注意力的隐藏状态向量,计算公式为:
上式中,lt为带有注意力的隐藏状态向量;
S323、根据带有注意力的隐藏状态向量和更新后的记忆单元计算注意隐藏单元,计算公式为:
上式中,为注意隐藏单元,Why为连接权重矩阵;
S324、将注意隐藏单元通过最终的sigmoid层预测患者临床结局,预测公式为:
上式中,y′n为预测的患者临床结局,Ws和bs为该层连接对应的权重及偏置。
进一步地:所述步骤S33中代价函数的计算公式为:
上式中,L(x1,x2,...,xN|θ)为代价函数,x1,x2,...,xN为AT-LSTM模型的训练样本,θ为AT-LSTM模型中所有待训练参数,N为训练集中患者的数量,yn为第n个患者的真实临床标签。
进一步地:所述步骤S34中模型训练参数更新为:
上式中,θ′为更新后的模型训练参数,lr为学习率。
本发明的有益效果为:本发明通过使用深度学习对ICU内死亡进行预测,不仅使用患者动态体征变化数据,还加入了年龄、患病类型等影响死亡率的重要人口统计学特征;在经典LSTM(多层双向与单向长短期记忆模型)网络的基础上增加了三个用于控制时间增量变化的时间门,解决临床数据常见的不规则采样及数据缺失问题;引入注意力机制对每个时刻的隐藏状态进行融合,模型收敛速度更快,且不易丢失初始阶段包含的信息。
附图说明
图1为本发明流程图;
图2为本发明中AT-LSTM模型的网络结构图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于深度学习的ICU院内死亡率预测方法,包括以下步骤:
S1、采集患者入住ICU后48小时内的体征指标;
体征指标包括离散变量、连续变量和人口统计学信息,所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分,所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值,所述人口统计学信息包括年龄、性别、种族和患病类型。
S2、对采集到的体征指标进行预处理,得到预处理后的体征指标;
预处理包括对离散变量通过One-hot进行编码,得到编码后的离散变量,和对连续变量进行归一化处理,得到归一化后的连续变量,所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布,其具体公式为:
上式中,x′为归一化后的连续变量,x为连续变量,为所有连续变量的均值,σ为所有连续变量的标准差;
所述预处理后的体征指标包括编码后的离散变量和归一化后的连续变量。
S3、根据预处理后的体征指标对AT-LSTM模型进行训练,得到训练好的AT-LSTM(注意力与时间门控LSTM)模型;具体步骤为:
对于均匀采样的序列建模,时间轴为1,2,3,...,T,但是临床事件的发生不规律,本发明将时间轴记录为Δt1,Δt2,...,ΔtT,并作为单独时间门联合输入、遗忘、输出门控制模型对不同时间间隔的响应,例如k时刻的体征数据输入在较长时间间隔Δtk之后到达,则遗忘门需要保留少量过去的状态,输入门需要包含更多的新输入内容。
传统的LSTM中的输入、遗忘、输出门公式为:
其中it,ft,ot分别代表时间t处的输入、遗忘和输出门控,ct是激活的单元状态向量,而和ht分别表示时间t处的输入向量和隐藏输出向量。输入、遗忘和输出门使用经典的sigmoid函数σ和tanh非线性函数,其权重参数分别为Wih,Wfh,Woh,Wix,Wfx和Wox,以及对应的偏置bi,bf和bo,它们将不同的输入、门控、存储器单元及输出连接起来。单元状态ct本身用由ft控制的先前单元状态的小部分以及新状态来更新,其中表示向量乘积运算。可选的窥视孔(Peepholes)连接权重wic、wfc、woc进一步影响输入、遗忘和输出门的操作。然而,单向LSTM的一个缺点是当序列的长度非常大时预测性能会下降。为了克服这个缺点,我们在所提出的AT-LSTM中引入双向长短期记忆(Bi-LSTM),使用来自两个方向的所有可用临床变量的信息来训练以改善预测性能。
AT-LSTM网络结构有三层,如图2所示。在第一层中,双向LSTM用于提取序列中的正向和反向特征。在每个时刻,获得整合前向和后向上下文的特征向量和通过级联将两个向量融合到中并用作下一层的输入序列。下一个单向LSTM层融合双向输出,并获得特征空间中每个时刻所有临床测量变量的矢量表示。
S31、在AT-LSTM模型中加入三个单独时间门和对输入、遗忘和输出门进行联合控制,更新AT-LSTM模型的记忆单元;
记忆单元更新为:
上式中,ct为改进后的t时刻记忆单元状态,ft为时间t处的遗忘门控,ct-1为t时刻记忆单元状态,it为时间t处的输入门控,Wcx为输入与记忆单元连接权重矩阵,为预处理后的体征指标,ht-1为t-1时刻输出,Wch为记忆单元与输出的连接权重矩阵,bc为输入与记忆单元连接偏置向量,为向量乘积运算。
其中,AT-LSTM模型的输出单元ht为:
上式中,ot为时间t处的输出门控。
其中,Δt表示当前事件距离前一次同类型事件发生的时间间隔,表示输入、遗忘和输出时间门控的权重向量。
S32、通过更新后的记忆单元预测患者临床结局;具体步骤为:
在死亡预测任务中,最终目标是根据从t=1到t=T的临床测量变量,预测患者在住院期间是否会死亡的二元表示,即yi∈{0,1}。第T时刻的记忆单元状态cT是患者状态的向量化估计表示,并且通常直接用于临床预测任务。然而,它主要包含患者在T时刻的状态信息,不能反映1至T-1时刻的历史状态对死亡率预测结果之间的关系。因此,如何得到一个上下文向量来捕获相关信息,从而帮助预测死亡率y′n是关键问题。
S321、根据更新后的记忆单元计算时间的注意力,计算公式为:
at=Wact+ba
上式中,at为时间的注意力,Wa和ba分别表示待学习的注意力计算连接权重及偏置参数;
S322、根据时间的注意力和更新后的记忆单元计算带有注意力的隐藏状态向量,计算公式为:
上式中,lt为带有注意力的隐藏状态向量;
S323、根据带有注意力的隐藏状态向量和更新后的记忆单元计算注意隐藏单元,计算公式为:
上式中,为注意隐藏单元,Why为连接权重矩阵;
S324、将注意隐藏单元通过最终的sigmoid层预测患者临床结局,预测公式为:
上式中,y′n为预测的患者临床结局,Ws和bs为该层连接对应的权重及偏置。
S33、通过患者临床结局计算代价函数;代价函数的计算公式为:
上式中,L(x1,x2,...,xN|θ)为代价函数,x1,x2,...,xN为AT-LSTM模型的训练样本,θ为AT-LSTM模型中所有待训练参数,N为训练集中患者的数量,yn为第n个患者的真实临床标签。
S34、根据代价函数对模型训练参数进行更新迭代,使得模型的总体代价最小,得到训练好的AT-LSTM模型。模型训练参数更新为:
上式中,θ′为更新后的模型训练参数,lr为学习率。
S4、对进入ICU后48小时的新患者采集体征指标并进行预处理,将预处理后的新患者体征指标输入到训练好的AT-LSTM模型中,得到该新患者的死亡率预测结果。
本发明基于经典LSTM加入人口统计学特征,增加了时间门控单元用于处理临床事件的不规律性,结合注意力机制提升模型的收敛速度及精度。采用MIMIC-III重症监护数据库的数据与现有技术进行了对比实验。MIMIC-III是一个免费开放的、公共资源的重症监护室研究数据库,包括40000多名重症监护病人的60000多条ICU停留记录,排除新生儿和儿科患者(ICU住院时年龄18岁或以下)的数据以及再次入住ICU的数据,剩余共42276条患者数据中有4493条(10.63%)记录为最终死亡。
本发明死亡率预测方法的主要指标是接受者操作特征曲线下面积(Area Underthe Receiver Operator Characteristic Curve,AUROC),这是死亡率预测研究中最常报告的指标。然而,当存在不平衡类别的情况下,单纯的AUROC得分难以解释,本发明采用了两个更适合不平衡类别问题的附加指标:精确-召回率曲线下的面积(AUPRC)和最小精度与灵敏度(min(Se,+P)),这是Physionet/CinC Challenge 2012中提出的指标。上述所有指标取值在0-1之间,值越大表示模型性能越好。
如表1所示的是分别采用逻辑回归(LR)、经典LSTM、双向LSTM(BiLSTM)及本文提出的AT-LSTM所构建并训练的ICU死亡率预测模型评估效果对比表。
表1实验对比结果表
可以看出本发明所构建的ICU死亡风险性评估模型从AUROC、AUPRC及(min(Se,+P))上均明显优于其他模型。
Claims (8)
1.一种基于深度学习的ICU院内死亡率预测方法,其特征在于,包括以下步骤:
S1、采集患者入住ICU后48小时内的体征指标;
S2、对采集到的体征指标进行预处理,得到预处理后的体征指标;
S3、根据预处理后的体征指标对AT-LSTM模型进行训练,得到训练好的AT-LSTM模型;
S4、对进入ICU后48小时的新患者采集体征指标并进行预处理,将预处理后的新患者体征指标输入到训练好的AT-LSTM模型中,得到该新患者的死亡率预测结果。
2.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S1中体征指标包括离散变量、连续变量和人口统计学信息,所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分,所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值,所述人口统计学信息包括年龄、性别、种族和患病类型。
3.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S2中预处理包括对离散变量通过One-hot进行编码,得到编码后的离散变量,和对连续变量进行归一化处理,得到归一化后的连续变量,所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布,其具体公式为:
上式中,x′为归一化后的连续变量,x为连续变量,为所有连续变量的均值,σ为所有连续变量的标准差;
所述预处理后的体征指标包括编码后的离散变量和归一化后的连续变量。
4.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S3的具体步骤为:
S31、在AT-LSTM模型中加入三个单独时间门和对输入、遗忘和输出门进行联合控制,更新AT-LSTM模型的记忆单元;
S32、通过更新后的记忆单元预测患者临床结局;
S33、通过患者临床结局计算代价函数;
S34、根据代价函数对模型训练参数进行更新迭代,使得模型的总体代价最小,得到训练好的AT-LSTM模型。
5.根据权利要求4所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S31中记忆单元更新为:
上式中,ct为改进后的t时刻记忆单元状态,ft为时间t处的遗忘门控,ct-1为t时刻记忆单元状态,it为时间t处的输入门控,Wcx为输入与记忆单元连接权重矩阵,为预处理后的体征指标,ht-1为t-1时刻输出,Wch为记忆单元与输出的连接权重矩阵,bc为输入与记忆单元连接偏置向量,○为向量乘积运算。
6.根据权利要求5所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S32的具体步骤为:
S321、根据更新后的记忆单元计算时间的注意力,计算公式为:
at=Wact+ba
上式中,at为时间的注意力,Wa和ba分别表示待学习的注意力计算连接权重及偏置参数;
S322、根据时间的注意力和更新后的记忆单元计算带有注意力的隐藏状态向量,计算公式为:
上式中,lt为带有注意力的隐藏状态向量;
S323、根据带有注意力的隐藏状态向量和更新后的记忆单元计算注意隐藏单元,计算公式为:
上式中,为注意隐藏单元,Why为连接权重矩阵;
S324、将注意隐藏单元通过最终的sigmoid层预测患者临床结局,预测公式为:
上式中,y′n为预测的患者临床结局,Ws和bs为该层连接对应的权重及偏置。
7.根据权利要求6所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S33中代价函数的计算公式为:
上式中,L(x1,x2,…,xN|θ)为代价函数,x1,x2,…,xN为AT-LSTM模型的训练样本,θ为AT-LSTM模型中所有待训练参数,N为训练集中患者的数量,yn为第n个患者的真实临床标签。
8.根据权利要求7所述的基于深度学习的ICU院内死亡率预测方法,其特征在于,所述步骤S34中模型训练参数更新为:
上式中,θ′为更新后的模型训练参数,lr为学习率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910574239.2A CN110289096B (zh) | 2019-06-28 | 2019-06-28 | 一种基于深度学习的icu院内死亡率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910574239.2A CN110289096B (zh) | 2019-06-28 | 2019-06-28 | 一种基于深度学习的icu院内死亡率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110289096A true CN110289096A (zh) | 2019-09-27 |
CN110289096B CN110289096B (zh) | 2021-12-07 |
Family
ID=68019486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910574239.2A Expired - Fee Related CN110289096B (zh) | 2019-06-28 | 2019-06-28 | 一种基于深度学习的icu院内死亡率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110289096B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110880127A (zh) * | 2019-10-24 | 2020-03-13 | 北京三快在线科技有限公司 | 消费水平的预测方法、装置、电子设备及存储介质 |
CN111612278A (zh) * | 2020-06-01 | 2020-09-01 | 戴松世 | 生命状态预测方法、装置、电子设备及存储介质 |
CN111627559A (zh) * | 2020-06-17 | 2020-09-04 | 北京大学第三医院(北京大学第三临床医学院) | 预测患者死亡风险的系统 |
CN111651220A (zh) * | 2020-06-04 | 2020-09-11 | 上海电力大学 | 一种基于深度强化学习的Spark参数自动优化方法及系统 |
TWI715397B (zh) * | 2019-12-31 | 2021-01-01 | 高雄榮民總醫院 | 根據領先標準將同儕數據繪製為圖表的方法、電腦程式產品及電腦可讀取媒體 |
CN112466469A (zh) * | 2020-12-08 | 2021-03-09 | 杭州脉兴医疗科技有限公司 | 一种重大危机及死亡风险预测方法 |
CN112967816A (zh) * | 2021-04-26 | 2021-06-15 | 四川大学华西医院 | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 |
CN113077901A (zh) * | 2021-03-31 | 2021-07-06 | 厦门大学 | 一种电子病历分析装置和方法 |
CN113782209A (zh) * | 2020-09-25 | 2021-12-10 | 北京大学 | 一种基于循环神经网络的慢性病患者智能预后方法及系统 |
CN113902186A (zh) * | 2021-09-30 | 2022-01-07 | 中南大学 | 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质 |
CN117672495A (zh) * | 2023-11-30 | 2024-03-08 | 北京医院 | 基于人工智能的房颤合并冠心病患者远期死亡率预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341462A (zh) * | 2017-06-28 | 2017-11-10 | 电子科技大学 | 一种基于注意力机制的视频分类方法 |
CN107909427A (zh) * | 2017-10-25 | 2018-04-13 | 浙江大学 | 一种提升推荐模型时序数据挖掘能力的循环神经网络方法 |
CN108388900A (zh) * | 2018-02-05 | 2018-08-10 | 华南理工大学 | 基于多特征融合和时空注意力机制相结合的视频描述方法 |
CN108829766A (zh) * | 2018-05-29 | 2018-11-16 | 苏州大学 | 一种兴趣点推荐方法、系统、设备及计算机可读存储介质 |
CN109710761A (zh) * | 2018-12-21 | 2019-05-03 | 中国标准化研究院 | 基于注意力增强的双向lstm模型的情感分析方法 |
-
2019
- 2019-06-28 CN CN201910574239.2A patent/CN110289096B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341462A (zh) * | 2017-06-28 | 2017-11-10 | 电子科技大学 | 一种基于注意力机制的视频分类方法 |
CN107909427A (zh) * | 2017-10-25 | 2018-04-13 | 浙江大学 | 一种提升推荐模型时序数据挖掘能力的循环神经网络方法 |
CN108388900A (zh) * | 2018-02-05 | 2018-08-10 | 华南理工大学 | 基于多特征融合和时空注意力机制相结合的视频描述方法 |
CN108829766A (zh) * | 2018-05-29 | 2018-11-16 | 苏州大学 | 一种兴趣点推荐方法、系统、设备及计算机可读存储介质 |
CN109710761A (zh) * | 2018-12-21 | 2019-05-03 | 中国标准化研究院 | 基于注意力增强的双向lstm模型的情感分析方法 |
Non-Patent Citations (2)
Title |
---|
W.D. GE等: "An Interpretable ICU Mortality Prediction Model Based on Logistic Regression and Recurrent Neural Networks with LSTM units", 《AMIA ANNUAL SYMPOSIUM PROCEEDINGS》 * |
王红 等: "基于注意力机制的LSTM的语义关系抽取", 《计算机应用研究》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110880127B (zh) * | 2019-10-24 | 2022-04-12 | 北京三快在线科技有限公司 | 消费水平的预测方法、装置、电子设备及存储介质 |
CN110880127A (zh) * | 2019-10-24 | 2020-03-13 | 北京三快在线科技有限公司 | 消费水平的预测方法、装置、电子设备及存储介质 |
TWI715397B (zh) * | 2019-12-31 | 2021-01-01 | 高雄榮民總醫院 | 根據領先標準將同儕數據繪製為圖表的方法、電腦程式產品及電腦可讀取媒體 |
CN111612278A (zh) * | 2020-06-01 | 2020-09-01 | 戴松世 | 生命状态预测方法、装置、电子设备及存储介质 |
CN111651220A (zh) * | 2020-06-04 | 2020-09-11 | 上海电力大学 | 一种基于深度强化学习的Spark参数自动优化方法及系统 |
CN111651220B (zh) * | 2020-06-04 | 2023-08-18 | 上海电力大学 | 一种基于深度强化学习的Spark参数自动优化方法及系统 |
WO2021253484A1 (zh) * | 2020-06-17 | 2021-12-23 | 北京大学第三医院(北京大学第三临床医学院) | 预测患者死亡风险的系统 |
CN111627559A (zh) * | 2020-06-17 | 2020-09-04 | 北京大学第三医院(北京大学第三临床医学院) | 预测患者死亡风险的系统 |
CN111627559B (zh) * | 2020-06-17 | 2023-08-29 | 北京大学第三医院(北京大学第三临床医学院) | 预测患者死亡风险的系统 |
CN113782209A (zh) * | 2020-09-25 | 2021-12-10 | 北京大学 | 一种基于循环神经网络的慢性病患者智能预后方法及系统 |
CN112466469A (zh) * | 2020-12-08 | 2021-03-09 | 杭州脉兴医疗科技有限公司 | 一种重大危机及死亡风险预测方法 |
CN113077901A (zh) * | 2021-03-31 | 2021-07-06 | 厦门大学 | 一种电子病历分析装置和方法 |
CN113077901B (zh) * | 2021-03-31 | 2022-05-10 | 厦门大学 | 一种电子病历分析装置和方法 |
CN112967816B (zh) * | 2021-04-26 | 2023-08-15 | 四川大学华西医院 | 一种急性胰腺炎器官衰竭预测方法、计算机设备和系统 |
CN112967816A (zh) * | 2021-04-26 | 2021-06-15 | 四川大学华西医院 | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 |
CN113902186A (zh) * | 2021-09-30 | 2022-01-07 | 中南大学 | 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质 |
CN113902186B (zh) * | 2021-09-30 | 2024-08-16 | 中南大学 | 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质 |
CN117672495A (zh) * | 2023-11-30 | 2024-03-08 | 北京医院 | 基于人工智能的房颤合并冠心病患者远期死亡率预测方法 |
CN117672495B (zh) * | 2023-11-30 | 2024-05-14 | 北京医院 | 基于人工智能的房颤合并冠心病患者远期死亡率预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110289096B (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110289096A (zh) | 一种基于深度学习的icu院内死亡率预测方法 | |
Yu et al. | Using a multi-task recurrent neural network with attention mechanisms to predict hospital mortality of patients | |
Ma et al. | Length of stay prediction for ICU patients using individualized single classification algorithm | |
Baxt | Use of an artificial neural network for the diagnosis of myocardial infarction | |
Pandey et al. | Knowledge and intelligent computing system in medicine | |
Afsaneh et al. | Recent applications of machine learning and deep learning models in the prediction, diagnosis, and management of diabetes: a comprehensive review | |
Al-Dmour et al. | A fuzzy logic–based warning system for patients classification | |
CN110880362A (zh) | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 | |
JP2006507875A (ja) | 患者の健康を自動診断するシステムおよび方法 | |
Georga et al. | Data mining for blood glucose prediction and knowledge discovery in diabetic patients: The METABO diabetes modeling and management system | |
Lee et al. | Glucose transformer: Forecasting glucose level and events of hyperglycemia and hypoglycemia | |
CN110752002A (zh) | 一种药物用量预测装置 | |
Sandham et al. | Blood glucose prediction for diabetes therapy using a recurrent artificial neural network | |
Zhang et al. | Time-aware adversarial networks for adapting disease progression modeling | |
CN115274140A (zh) | 一种基于大数据和人工智能的糖尿病数字化健康管理系统 | |
CN117409984B (zh) | 一种糖尿病随访管理系统、装置、电子设备和存储介质 | |
CN113990502A (zh) | 一种基于异构图神经网络的icu心衰预测系统 | |
Shi et al. | IDDSAM: an integrated disease diagnosis and severity assessment model for intensive care units | |
CN111317440A (zh) | 患者的预警方法、使用该方法的监护设备及可读存储介质 | |
CN115602299A (zh) | 一种基于深度学习的icu辅助干预手段预测方法 | |
Barducci et al. | ALSFRS-R score prediction for amyotrophic lateral sclerosis | |
Liu et al. | A deep learning post-discharge mortality prediction method considering diagnosis information for icu patients | |
Nikolić | Expert fuzzy system for estimating risks of hypertension | |
Raju et al. | An advanced learning approach for early stage diabetes detection | |
CN116705230B (zh) | 具有胰岛素灵敏度自适应估计的mdi决策系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211207 |