CN110289096A

CN110289096A - 一种基于深度学习的icu院内死亡率预测方法

Info

Publication number: CN110289096A
Application number: CN201910574239.2A
Authority: CN
Inventors: 刘勇国; 刘朗; 李巧勤; 杨尚明; 曹晨; 任志扬; 傅翀
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-06-28
Filing date: 2019-06-28
Publication date: 2019-09-27
Anticipated expiration: 2039-06-28
Also published as: CN110289096B

Abstract

本发明公开了一种基于深度学习的ICU院内死亡率预测方法。本发明通过使用深度学习对ICU内死亡进行预测，不仅使用患者动态体征变化数据，还加入了年龄、患病类型等影响死亡率的重要人口统计学特征；在经典LSTM(多层双向与单向长短期记忆模型)网络的基础上增加了三个用于控制时间增量变化的时间门，解决临床数据常见的不规则采样及数据缺失问题；引入注意力机制对每个时刻的隐藏状态进行融合，模型收敛速度更快，且不易丢失初始阶段包含的信息。

Description

一种基于深度学习的ICU院内死亡率预测方法

技术领域

本发明涉及死亡率预测技术领域，具体涉及一种基于深度学习的ICU院内死亡率预测方法。

背景技术

重症加强护理病房(Intensive Care Unit,ICU)内收治各种危重症患者，通常都需要对患者进行日常监护，比如心率、心电、血压、呼吸、体温等，以及针对不同患者的特殊监护，因此每天会产生大量监测数据，包括各类医学和生物传感器采集的生理数据，以及医护人员的主观评估结果，这些时序数据可用于对患者进行分类诊断、住院时间估计和死亡率预测等，其中急性护理环节最关注的是院内死亡率预测，即预测患者在ICU住院期间是否死亡。ICU死亡率预测可以帮助临床医生对患者的治疗手段作出辅助决策，也可以帮助医院进行更合理的医疗资源配置。因此，ICU患者院内死亡率预测是临床研究的重要课题之一。

针对该问题的传统模型方法有简化急性生理学评分SAPS、病死概率模型MPM等方法。SAPS II包含17项变量，包括心率、血压等生理学变量以及年龄、住院类型等统计学变量，每项变量分值0-26分不等，选取患者入住ICU后24小时内的最差值，如果既有高值又有低值，则按高分计算，不累计积分。各项分值之和即为SAPS II总得分，最低0分，最高163分。总分越高，表示病情越重，院内死亡风险更高。MPM也采取类似的方式，按既定评分规则进行评分。临床中还依据该分值作为划分患者病情严重程度的指标，协助医生确定更合适的治疗和护理措施以降低死亡率。

现有技术使用历史体征数据记录中的11项变量作为输入，构建监督型双向长短期记忆网络(BiLSTM-ST)，在体征数据序列每个时刻都有预测结果，并通过最终池化输出表示患者死亡的风险系数(在0～1之间)，值越大表示死亡风险越高。APS、MPM等评分模型均使用患者进入ICU后24小时内的10多项生理学数据及统计学数据，按照既定评分规则进行打分，医生根据分数确定救治措施。但是这种方式没有考虑患者进入ICU后的数据动态变化情况，评分较为粗糙。ICU的临床观察记录不定期，测量频率在不同患者之间、不同变量之间、甚至随着时间的推移而变化。一种常见的建模策略是用离散的、可变的时间步长将这些观测结果表示为序列，但由于采样的不规则性，得到的序列常常包含缺失的值。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于深度学习的ICU院内死亡率预测方法解决了ICU患者院内死亡率预测结果不准确的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于深度学习的ICU院内死亡率预测方法，包括以下步骤：

S1、采集患者入住ICU后48小时内的体征指标；

S2、对采集到的体征指标进行预处理，得到预处理后的体征指标；

S3、根据预处理后的体征指标对AT-LSTM模型进行训练，得到训练好的AT-LSTM模型；

S4、对进入ICU后48小时的新患者采集体征指标并进行预处理，将预处理后的新患者体征指标输入到训练好的AT-LSTM模型中，得到该新患者的死亡率预测结果。

进一步地：所述步骤S1中体征指标包括离散变量、连续变量和人口统计学信息，所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分，所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值，所述人口统计学信息包括年龄、性别、种族和患病类型。

进一步地：所述步骤S2中预处理包括对离散变量通过One-hot进行编码，得到编码后的离散变量，和对连续变量进行归一化处理，得到归一化后的连续变量，所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布，其具体公式为：

上式中，x′为归一化后的连续变量，x为连续变量，为所有连续变量的均值，σ为所有连续变量的标准差；

所述预处理后的体征指标包括编码后的离散变量和归一化后的连续变量。

进一步地：所述步骤S3的具体步骤为：

S31、在AT-LSTM模型中加入三个单独时间门和对输入、遗忘和输出门进行联合控制，更新AT-LSTM模型的记忆单元；

S32、通过更新后的记忆单元预测患者临床结局；

S33、通过患者临床结局计算代价函数；

S34、根据代价函数对模型训练参数进行更新迭代，使得模型的总体代价最小，得到训练好的AT-LSTM模型。

进一步地：所述步骤S31中记忆单元更新为：

上式中，c_t为改进后的t时刻记忆单元状态，f_t为时间t处的遗忘门控，c_t-1为t时刻记忆单元状态，i_t为时间t处的输入门控，W_cx为输入与记忆单元连接权重矩阵，为预处理后的体征指标，h_t-1为t-1时刻输出，W_ch为记忆单元与输出的连接权重矩阵，b_c为输入与记忆单元连接偏置向量，为向量乘积运算。

进一步地：所述步骤S32的具体步骤为：

S321、根据更新后的记忆单元计算时间的注意力，计算公式为：

a_t＝W_ac_t+b_a

上式中，a_t为时间的注意力，W_a和b_a分别表示待学习的注意力计算连接权重及偏置参数；

S322、根据时间的注意力和更新后的记忆单元计算带有注意力的隐藏状态向量，计算公式为：

上式中，l_t为带有注意力的隐藏状态向量；

S323、根据带有注意力的隐藏状态向量和更新后的记忆单元计算注意隐藏单元，计算公式为：

上式中，为注意隐藏单元，W_hy为连接权重矩阵；

S324、将注意隐藏单元通过最终的sigmoid层预测患者临床结局，预测公式为：

上式中，y′_n为预测的患者临床结局，W_s和b_s为该层连接对应的权重及偏置。

进一步地：所述步骤S33中代价函数的计算公式为：

上式中，L(x₁，x₂，...，x_N|θ)为代价函数，x₁，x₂，...，x_N为AT-LSTM模型的训练样本，θ为AT-LSTM模型中所有待训练参数，N为训练集中患者的数量，y_n为第n个患者的真实临床标签。

进一步地：所述步骤S34中模型训练参数更新为：

上式中，θ′为更新后的模型训练参数，lr为学习率。

本发明的有益效果为：本发明通过使用深度学习对ICU内死亡进行预测，不仅使用患者动态体征变化数据，还加入了年龄、患病类型等影响死亡率的重要人口统计学特征；在经典LSTM(多层双向与单向长短期记忆模型)网络的基础上增加了三个用于控制时间增量变化的时间门，解决临床数据常见的不规则采样及数据缺失问题；引入注意力机制对每个时刻的隐藏状态进行融合，模型收敛速度更快，且不易丢失初始阶段包含的信息。

附图说明

图1为本发明流程图；

图2为本发明中AT-LSTM模型的网络结构图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于深度学习的ICU院内死亡率预测方法，包括以下步骤：

S1、采集患者入住ICU后48小时内的体征指标；

体征指标包括离散变量、连续变量和人口统计学信息，所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分，所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值，所述人口统计学信息包括年龄、性别、种族和患病类型。

预处理包括对离散变量通过One-hot进行编码，得到编码后的离散变量，和对连续变量进行归一化处理，得到归一化后的连续变量，所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布，其具体公式为：

S3、根据预处理后的体征指标对AT-LSTM模型进行训练，得到训练好的AT-LSTM(注意力与时间门控LSTM)模型；具体步骤为：

对于均匀采样的序列建模，时间轴为1，2，3，...，T，但是临床事件的发生不规律，本发明将时间轴记录为Δt₁，Δt₂，...，Δt_T，并作为单独时间门联合输入、遗忘、输出门控制模型对不同时间间隔的响应，例如k时刻的体征数据输入在较长时间间隔Δt_k之后到达，则遗忘门需要保留少量过去的状态，输入门需要包含更多的新输入内容。

传统的LSTM中的输入、遗忘、输出门公式为：

其中i_t，f_t，o_t分别代表时间t处的输入、遗忘和输出门控，c_t是激活的单元状态向量，而和h_t分别表示时间t处的输入向量和隐藏输出向量。输入、遗忘和输出门使用经典的sigmoid函数σ和tanh非线性函数，其权重参数分别为W_ih，W_fh，W_oh，W_ix，W_fx和W_ox，以及对应的偏置b_i，b_f和b_o，它们将不同的输入、门控、存储器单元及输出连接起来。单元状态c_t本身用由f_t控制的先前单元状态的小部分以及新状态来更新，其中表示向量乘积运算。可选的窥视孔(Peepholes)连接权重w_ic、w_fc、w_oc进一步影响输入、遗忘和输出门的操作。然而，单向LSTM的一个缺点是当序列的长度非常大时预测性能会下降。为了克服这个缺点，我们在所提出的AT-LSTM中引入双向长短期记忆(Bi-LSTM)，使用来自两个方向的所有可用临床变量的信息来训练以改善预测性能。

AT-LSTM网络结构有三层，如图2所示。在第一层中，双向LSTM用于提取序列中的正向和反向特征。在每个时刻，获得整合前向和后向上下文的特征向量和通过级联将两个向量融合到中并用作下一层的输入序列。下一个单向LSTM层融合双向输出，并获得特征空间中每个时刻所有临床测量变量的矢量表示。

记忆单元更新为：

其中，AT-LSTM模型的输出单元h_t为：

上式中，o_t为时间t处的输出门控。

其中，Δt表示当前事件距离前一次同类型事件发生的时间间隔，表示输入、遗忘和输出时间门控的权重向量。

S32、通过更新后的记忆单元预测患者临床结局；具体步骤为：

在死亡预测任务中，最终目标是根据从t＝1到t＝T的临床测量变量，预测患者在住院期间是否会死亡的二元表示，即y_i∈{0，1}。第T时刻的记忆单元状态c_T是患者状态的向量化估计表示，并且通常直接用于临床预测任务。然而，它主要包含患者在T时刻的状态信息，不能反映1至T-1时刻的历史状态对死亡率预测结果之间的关系。因此，如何得到一个上下文向量来捕获相关信息，从而帮助预测死亡率y′_n是关键问题。

a_t＝W_ac_t+b_a

上式中，l_t为带有注意力的隐藏状态向量；

上式中，为注意隐藏单元，W_hy为连接权重矩阵；

S33、通过患者临床结局计算代价函数；代价函数的计算公式为：

S34、根据代价函数对模型训练参数进行更新迭代，使得模型的总体代价最小，得到训练好的AT-LSTM模型。模型训练参数更新为：

上式中，θ′为更新后的模型训练参数，lr为学习率。

本发明基于经典LSTM加入人口统计学特征，增加了时间门控单元用于处理临床事件的不规律性，结合注意力机制提升模型的收敛速度及精度。采用MIMIC-III重症监护数据库的数据与现有技术进行了对比实验。MIMIC-III是一个免费开放的、公共资源的重症监护室研究数据库，包括40000多名重症监护病人的60000多条ICU停留记录，排除新生儿和儿科患者(ICU住院时年龄18岁或以下)的数据以及再次入住ICU的数据，剩余共42276条患者数据中有4493条(10.63％)记录为最终死亡。

本发明死亡率预测方法的主要指标是接受者操作特征曲线下面积(Area Underthe Receiver Operator Characteristic Curve,AUROC)，这是死亡率预测研究中最常报告的指标。然而，当存在不平衡类别的情况下，单纯的AUROC得分难以解释，本发明采用了两个更适合不平衡类别问题的附加指标：精确-召回率曲线下的面积(AUPRC)和最小精度与灵敏度(min(Se，+P))，这是Physionet/CinC Challenge 2012中提出的指标。上述所有指标取值在0-1之间，值越大表示模型性能越好。

如表1所示的是分别采用逻辑回归(LR)、经典LSTM、双向LSTM(BiLSTM)及本文提出的AT-LSTM所构建并训练的ICU死亡率预测模型评估效果对比表。

表1实验对比结果表

可以看出本发明所构建的ICU死亡风险性评估模型从AUROC、AUPRC及(min(Se，+P))上均明显优于其他模型。

Claims

1.一种基于深度学习的ICU院内死亡率预测方法，其特征在于，包括以下步骤：

S1、采集患者入住ICU后48小时内的体征指标；

2.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S1中体征指标包括离散变量、连续变量和人口统计学信息，所述离散变量包括毛细血管再充盈率、Glascow昏迷量表眼睛睁开度、Glascow昏迷量表运动反应、Glascow昏迷量表语言反应和Glascow昏迷总分，所述连续变量包括舒张压、收缩压、吸入氧气分数、血液葡萄糖含量、心率、平均血压、血氧饱和度、呼吸速率、体温、体重、身高和血液PH值，所述人口统计学信息包括年龄、性别、种族和患病类型。

3.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S2中预处理包括对离散变量通过One-hot进行编码，得到编码后的离散变量，和对连续变量进行归一化处理，得到归一化后的连续变量，所述归一化处理为使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布，其具体公式为：

4.根据权利要求1所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S3的具体步骤为：

S32、通过更新后的记忆单元预测患者临床结局；

S33、通过患者临床结局计算代价函数；

5.根据权利要求4所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S31中记忆单元更新为：

上式中，c_t为改进后的t时刻记忆单元状态，f_t为时间t处的遗忘门控，c_t-1为t时刻记忆单元状态，i_t为时间t处的输入门控，W_cx为输入与记忆单元连接权重矩阵，为预处理后的体征指标，h_t-1为t-1时刻输出，W_ch为记忆单元与输出的连接权重矩阵，b_c为输入与记忆单元连接偏置向量，○为向量乘积运算。

6.根据权利要求5所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S32的具体步骤为：

a_t＝W_ac_t+b_a

上式中，l_t为带有注意力的隐藏状态向量；

上式中，为注意隐藏单元，W_hy为连接权重矩阵；

7.根据权利要求6所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S33中代价函数的计算公式为：

上式中，L(x₁,x₂,…,x_N|θ)为代价函数，x₁,x₂,…,x_N为AT-LSTM模型的训练样本，θ为AT-LSTM模型中所有待训练参数，N为训练集中患者的数量，y_n为第n个患者的真实临床标签。

8.根据权利要求7所述的基于深度学习的ICU院内死亡率预测方法，其特征在于，所述步骤S34中模型训练参数更新为：

上式中，θ′为更新后的模型训练参数，lr为学习率。