CN113902186B

CN113902186B - 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质

Info

Publication number: CN113902186B
Application number: CN202111165778.4A
Authority: CN
Inventors: 安莹; 刘洋; 盛羽; 陈先来
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2021-09-30
Filing date: 2021-09-30
Publication date: 2024-08-16
Anticipated expiration: 2041-09-30
Also published as: CN113902186A

Abstract

本发明公开了一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质。本发明所述方法构建的患者死亡风险预测模型，其将时间信息添加至医疗特征数据中得到具有时间特性的患者特征数据，再利用时序模型学习各类患者特征数据的特征表示，挖掘不规则时间模式，再引入具有层次结构的注意力机制将异构的特征数据进行融合，得到更为全面的融合特征，最后，将患者的融合表示应用于死亡风险预测，提高了模型预测精度以及可靠性。本发明有效地解决了现有技术面临的不规则时序建模问题以及多元异构数据融合问题，并将本发明所述方法与其他方法在同一数据集上测试比较，实验结果表明本发明所述方法在危重症患者死亡风险预测方面具有较好的性能。

Description

一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质

技术领域

本发明属于人工智能与医疗应用领域，具体涉及一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质。

背景技术

重症监护病房(ICU)通常集中了医院最重要的资源，例如科室、医疗设备和人员，目的是为危重症患者提供优质、全面的诊疗服务，以降低患者的死亡率。重症患者的住院死亡率容易受到医院资源情况和患者自身状况的影响。在全球范围内，重症监护病房的患者死亡率居高不下，昂贵的诊疗费用极大增加了病患及家属的生活负担。实现ICU内患者死亡风险预测有利于医生对患者病情进行评估，采取适当的诊疗措施，提高ICU患者的生存几率；其次通过对患者病情的判断，结合医院的ICU资源状况，可以对ICU资源分配做合理调控；再次，在ICU使用费用居高不下的情况下，合理制定诊疗计划可以防止过度治疗，有利于减轻患者的经济负担。但是，医生的决策充满了不确定性，即使是经验丰富的医生，仅通过经验来评估患者的死亡风险也比较困难。因此开发一种基于患者数据的死亡风险预测工具以辅助医生决策具有重要意义和应用价值。

针对该问题的传统方法有简化急性生理评分模型(SAPS)、急性生理功能和慢性健康状况评分模型(APACHE)和死亡概率模型等。这些模型通常是根据患者的一些生命体征和检验指标等进行评分，总分越高，表示病情越重，院内死亡风险越高。虽然这些评分模型广泛应用于临床，但仍存在泛化能力不足，个性化程度不高，无法考虑到患者病情记录的时序性等问题。随着电子病历的普及，大量临床数据得以保存，为基于深度学习的预测模型的开发提供了数据支持。近年来，深度学习在电子病历挖掘中得到广泛应用，并表现出良好想能。但与此同时，也存在许多亟待解决的挑战性问题。

首先是电子病历中不规则时序建模问题。在医学领域，不同的临床事件通常以不同的频率发生或记录，这些事件的不规则性通常与患者的病情相关。因此，从电子病历中包含的多元不规则时序数据中挖掘不同患者特有的不规则时间模式十分重要。另一个挑战性的问题是多元异构数据的融合表示。电子病历中包含大量与患者病情相关的异构数据，如人口统计数据、诊断、实验室检验结果、处方和临床记录等。这些异构数据相互关联、相互作用，从不同方面反映患者的健康状况。因此准确全面地表示电子病历中的异构数据是提升预测模型准确率的关键。

发明内容

本发明针对现有技术面临的不规则时序建模问题以及多元异构数据融合问题，提出一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质，所述方法能充分利用时序数据不规则采样的特点，挖掘各医疗事件的不规则时间模式，并通过考虑不同类型医疗数据在临床环境中的相互依赖关系，实现多元异构数据的有效融合表示，从而提高基于患者电子病历预测死亡风险的整体性能。

一方面，本发明提供一种基于电子病历的患者死亡风险预测方法，其包括以下步骤：

步骤1：获取待预测患者的电子病历；

步骤2：基于所述患者的电子病历以及患者死亡风险预测模型得到患者死亡预测结果；所述患者死亡风险预测模型的构建过程为：

基于患者的电子病历构建数据集，所述数据集包含了从电子病历中获取的目标类别的患者医疗特征数据以及患者的死亡结果；

将数据集中患者的死亡结果作为训练标签，按照下述步骤S1-S4处理数据集中的患者医疗特征数据并进行网络训练得到患者死亡风险预测模型，如下：

S1：数据预处理：对所述数据集中的数据进行预处理，其至少包括：基于所述医疗特征数据提取时间信息并添加至医疗特征数据中得到具有时间特性的患者特征数据；

S2：时序模型学习：根据患者特征数据的时序特性选择不同时序模型学习得到各类患者特征数据的特征表示；

S3：异构数据融合表示：基于注意力机制构建注意力模型，将所述各类患者特殊数据的特征表示输入至所述注意力模型中得到融合表示；

S4：死亡风险预测：将所述融合表示输入预测网络得到死亡风险预测结果。

可选地，步骤S3中若患者特征数据的时序特性为不规则时序性，构建时间感知的Transformer模型学习得到对应一类患者特征数据的特征表示。

可选地，针对不规则时序性的一类患者特征数据的特征表示，其获取过程如下：

首先，对所述患者特征数据中时间序列进行归一化处理，使得时间序列与特征序列处于同一潜在空间；

然后，将所述时间序列与所述特征序列合并得到输入序列；

最后，将所述输入序列输入至所述Transformer模型得到具有时间感知的特征表示。

可选地，所述数据集中患者医疗特征数据分为连续性数据和离散型数据；

其中，针对连续性的每一类患者医疗特征数据，步骤S2中基于所述医疗特征数据的记录时间提取时间间隔序列，并将所述时间间隔序列添加至医疗特征数据中得到具有时间特性的患者特征数据；

针对离散型的每一类患者医疗特征数据，步骤S2中基于所述医疗特征数据的记录时间顺序将患者的医疗特征数据进行排列。

可选地，所述注意力模型为多层结构，第一层融合具有直接联系的不同类别的患者特征数据；其他层是基于前一层的融合结果继续进行融合。

可选地，若所述数据集包括实验室检验数据、生命体征数据和用药记录，则步骤S4中融合表示的生成过程如下：

第一层特征融合：

首先，将实验室检验数据的特征表示和生命体征数据的特征表示被分别映射到查询向量和用药记录的特征表示被映射到键向量k；，t表示第t次记录，l表示实验室检验数据，r对应生命体征数据；

然后，基于注意力函数并利用查询向量和键向量分别计算实验室检验数据、生命体征数据对应的注意力权重

接着，基于注意力权重分别计算得到实验室检验数据和用药记录的融合表示生命体征数据与用药记录的融合表示

第二次特征融合：

首先，将生命体征数据与用药记录的融合表示作为查询向量，实验室检验数据和用药记录的融合表示作为值向量，用药记录的特征表示被映射到键向量k；

然后，基于注意力函数并利用查询向量和键向量计算出注意力权重；

最后，将所述注意力权重映射到所述值向量上得到融合表示，再经过全局平均池化作降维处理得到最终的融合表示。

本发明考虑到在临床中，实验室检验和生命体征可以指导用药，反之，药物的作用也通过实验室检验和生命体征数据的变化反映。因此在第一层融合具有直接联系的数据，然后第二层融合经过第一层融合过的数据以进一步挖掘数据间的潜在联系和影响。

可选地，步骤S5中的所述预测网络为全连接网络层。

第二方面，本发明提供一种基于上述患者死亡风险预测方法的系统，其包括：数据获取模块、模型获取模块以及预测模块；

数据获取模块，用于获取待预测患者的电子病历；

模型获取模块，用于获取训练好的患者死亡风险预测模型；

预测模块，用于基于所述患者的电子病历以及患者死亡风险预测模型得到患者死亡预测结果。

第三方面，本发明提供一种终端，其包括：

一个或多个处理器；

存储了一个或多个计算机程序的存储器；

所述处理器调用所述计算机程序以执行：

一种基于电子病历的患者死亡风险预测方法的步骤。

第四方面，本发明提供一种可读存储介质，其存储了计算机程序，所述计算机程序被处理器调用以实现：

一种基于电子病历的患者死亡风险预测方法的步骤。

有益效果

本发明构建的患者死亡风险预测模型，其将时间信息添加至医疗特征数据中得到具有时间特性的患者特征数据，再利用时序模型学习各类患者特征数据的特征表示，挖掘不规则时间模式，再引入注意力模型将异构的特征数据进行融合，得到更为全面的融合特征，最后，将患者的融合表示应用于死亡风险预测，进而提高了模型预测精度以及可靠性。本发明充分考虑了电子病历数据不规则采样的特性，使得数据特征的提取更加完整，而且本发明充分考虑了不同类型数据在临床环境中存在的相互依赖关系，从而全面地捕获了电子病历中异构数据之间的相互影响、相互作用，实现更准确的死亡风险预测，并增强模型的可解释性能，有效地解决了现有技术面临的不规则时序建模问题以及多元异构数据融合问题。

附图说明

图1为本发明患者死亡风险预测方法的流程示意图；

图2为本发明中TERTIAN模型(患者死亡风险预测模型)的网络结构图；

图3为与其他现有方法性能对比实验结果图；

图4为验证时间感知的Transformer模块的有效性的实验结果图；

图5为不同融合方式的结构图，其中，(a)图为TERTIAN模型，(b)图为TERTIAN#模型，(c)图为TERTIAN*模型，(d)图为TERTIAN&模型；

图6为验证层次注意力融合模块的有效性的实验结果图。

具体实施方式

本发明提供了一种基于电子病历的患者死亡风险预测方法，其充分挖掘电子病历中的信息，利用时序数据不规则采样的特点，挖掘各医疗事件的不规则时间模式，并通过考虑不同类型医疗数据在临床环境中的相互依赖关系，实现多元异构数据的有效融合表示，构建了可以准确预测患者死亡风险的患者死亡风险预测模型，尤其是将本发明所述方法应用到危重症患者身上，对辅助医生决策具有重要意义和应用价值。下面将结合实施例对本发明做进一步的说明。

实施例1：

下文将先陈述本发明的患者死亡风险预测模型的内容以及构建流程。患者死亡风险预测模型的构建过程为：1.基于患者的电子病历构建数据集；2.将数据集中患者的死亡结果作为训练标签，按照下述步骤S1-S4处理数据集中的患者医疗特征数据并进行网络训练得到患者死亡风险预测模型。

关于模型训练时所使用的数据集，本实施例中以数据集包括实验室检验数据集合、生命体征数据集合和用药记录集合为例进行说明，应当理解，其他可行的实施例中，根据病历数据特性，数据集中还可以选择其他类型患者医疗特征数据，本发明对此并不进行具体的限定。

为了实现模型训练，需要对数据集中的数据进行处理，具体如下：

S1：数据预处理：对所述数据集中的数据进行预处理。本实施例中至少包括：对数据集中患者医疗特征数据以及患者的死亡结果进行编码；以及基于所述医疗特征数据提取时间信息并添加至医疗特征数据中得到具有时间特性的患者特征数据。

譬如针对用药记录，其为离散型数据，本实施例中针对药物信息使用one-hot编码，然后再根据药物记录的时间顺序排列为药物的one-hot编码序列M＝{m₁，m₂，…，m_Z}，m_Z表示第Z次记录的用药信息。应当理解，该数据处理手段适用于其他的离散型数据；也可以采用其他编码规则进行编码。

针对实验室检验数据、生命体征数据，其均为连续性数据，优选在输入模型之前需要对其进行归一化得到患者的实验室检验序列和生命体征序列 T为记录总个数，为第t次记录的实验室检验数据，为第t次记录的生命体征数据。优选使用z-score标准化将连续变量归一化为均值为0、标准差为1的样本分布，其具体公式为：

上式中，x′为归一化后的连续变量，x为连续变量，为连续变量的均值，σ为连续变量的标准差。

然后，根据实验室检验数据、生命体征数据中各个特征的记录时间计算出时间间隔，得到实验室检验数据、生命体征数据各自对应时间间隔序列δ＝[δ₁,δ₂,…,δ_T]。假设第t次记录的时间戳为d_t，第一条记录的时间戳记为0，即d₁＝0，利用同一特征相邻两次记录的时间戳可以得到时间间隔。本实施例中进一步考虑到医疗事件记录的不规则性，会存在特征缺失的情况，因此设置缺失向量c_t∈{0,1}表示连续变量在第t次记录中的缺失情况，0表示缺失，1表示未缺失，则时间间隔的计算方式如公式(2)、(3)所示：

式中，为某一类连续性的医疗特征数据中第t次记录的第b个特征变量对应在缺失向量c_t中的值，为某一类连续性的医疗特征数据中第t次记录的第b个特征变量，为某一类连续性的医疗特征数据中第t-1次记录、第t次记录的第b个特征变量对应的时间间隔。

根据上述公式(2)、(3)可以计算出实验室检验数据、生命体征数据各自对应时间间隔序列δ＝[δ₁,δ₂,…δ_t…,δ_T]，譬如实验室检验数据对应的时间间隔序列δ中δ_t由实验室检验数据中第t次记录的所有特征变量对应的时间间隔构成。

需要说明的是，上述数据处理手段适用于其他类型的连续性数据，本发明对此不进行具体的限定。

通过上述预处理可知，不论是离散型数据或连续性数据，均得到了与时间相关的特征，离散型数据是依据时间顺序排列的医疗特征数据，连续性数据得到了包含时间间隔序列以及医疗特征数据的医疗特征数据。其中，离散型数据以及连续性数据是针对用药数据以及实验室检验数据和生命体征数据的特性进行定义的。

S2：时序模型学习：根据患者特征数据的时序特性选择不同时序模型学习得到各类患者特征数据的特征表示。

本实施例中针对不规则时序数据，构建一个时间感知的Transformer模块以学习不规则时间模式；针对其他类型的数据，构建一个Gated Recurrent Unit(GRU)模型学习其特征表示。

譬如，实验室检验数据和生命体征数据为不规则时序数据，其处理流程如下：

A)首先对实验室检验数据、生命体征数据中时间间隔序列分别进行归一化处理，使得时间间隔序列与特征序列处于同一潜在空间，归一化公式(4)如下所示：

s_t＝W_s(1-tanh((W_δδ_t+b_δ)²))+b_s (4)

式中，W_s和W_δ为参数矩阵，b_δ与b_s为权重矩阵，δ_t为时间间隔序列δ中第t次记录对应的时间间隔，s_t为δ_t归一化后的值。其中，参数矩阵以及权重矩阵的大小是依据特征序列的大小而定，目的在使得归一化后的时间间隔序列与特征序列处于同一潜在空间，能够合并计算。

B)通过如下公式计算出模型的输入向量e_t：

e_t＝x_t+s_t (5)

即不规则的患者医疗特征数据被映射到输入序列E＝[e₁，e₂，…e_t…，e_T]，e_t为第t次记录对应在输入序列E的取值。如本实施例中针对实验室检验数据、生命体征数据，分别根据公式(5)得到各自对应的输入序列E。

C)然后将验室检验数据、生命体征数据对应的输入序列E＝[e₁,e₂,…,e_T]输入至Transformer模型学习到隐藏表示通过激活函数sigmoid计算得到时间感知的注意力权重α＝[α₁,α₂,…，α_T]，将该注意力权重通过元素乘法运算作用于归一化后的不规则时序特征表示得到具有时间感知的特征表示f_t，其计算过程如下：

f_t＝α_t*x_t (8)

式中，α_t为注意力权重α中第t次记录对应的注意力权重值。f_t为第t次记录对应的特征表示。应当理解，针对验室检验数据、生命体征数据对应的输入序列分别按照上述公式(6)-(8)的计算可以得到各自对应的特征表示。

针对其他类型的数据，构建一个GRU模型学习其特征表示。如本实施例中用药记录M＝{m₁,m₂,…,m_Z}仅有记录顺序而没有详细的记录时间的特点，将用药记录视为有时间顺序的编码序列，而不考虑其时间间隔信息。因此利用GRU模型提取用药记录中的隐藏信息，得到其特征表示如下：

[g₁,g₂,…g_Z]＝GRU([m₁,m₂,…m_Z]) (9)

应当理解，其他可行的实施例中，若有其他学习模型能够挖掘数据隐藏信息得到特征表示的手段也是可行的，但可能会影响其最终的预测性能，如效果可能稍劣于选择的Transformer模块，因此，本实施例优选针对不规则时序数据选择Transformer模块进行处理。

S3：异构数据融合表示。基于注意力机制构建注意力模型，将所述各类患者特殊数据的特征表示输入至所述注意力模型中得到融合表示。

本实施例中的数据是以实验室检验数据、生命体征和用药记录三类数据为例，因此，本实施例构建的注意力模型为两层的注意力机制，利用其来捕获不同类型数据之间的相互依赖关系，并得到最终的融合表示。

首先，在第一层融合中，实验室检验数据的特征表示和生命体征的表示被分别映射到查询向量序列和中，用药记录的特征表示g_Z被映射到键向量k，然后分别计算注意力权重β^l和β^r以捕捉实验室检验结果与用药记录的关系，生命体征与用药记录的关系。

以捕捉实验室检验结果与用药记录的关系为例，其计算过程如下：

k＝W_kg_z+b_k (11)

其中，为参数矩阵，和b_k∈R^q为偏置向量；q,l,m,d分别为查询向量的维度，检验数据的特征表示维度，用药记录的特征表示维度，键向量的维度。为实验室检验结果与用药记录之间对应的注意力权重β^l中第t次记录对应的权重。

β^r的计算过程与β^l的计算过程相同，因此不再赘述。

由此，可以得到实验室检验结果和用药记录的融合表示和生命体征与用药记录的融合表示

实验室检验结果和用药记录的融合表示H^l中第t次记录对应的表示如下：

第二层融合是为了进一步捕获三类数据之间的潜在联系与影响，基于前述得到的实验室检验数据和用药记录的融合表示生命体征数据与用药记录的融合表示再次使用注意力机制融合上述过程得到的两个融合表示序列，其中以为查询向量，为值向量，用药记录的特征表示g_Z依旧被映射到键向量k，融合方式与第一层融合方式相同，由此可以得到三类医疗数据的融合表示γ＝[γ₁,γ₁,…,γ_T]。

最后，将上述过程中得到的融合表示γ经过全局平均池化作降维处理以得到最终的患者表示O。

O＝GlobalAveragePooling(γ) (14)

从上述可知，本实施例为了挖掘实验室检验数据、生命体征和用药记录三类数据之间的联系，设置了基于注意力机制的双层结构。临床中，实验室检验和生命体征可以指导用药，反之，药物的作用也通过实验室检验和生命体征数据的变化反映。因此在第一层融合具有直接联系的数据，然后第二层融合经过第一层融合过的数据以进一步挖掘数据间的潜在联系和影响，得到异构数据的融合表示。其他可行的实施例中，若存在其他类型的医疗特征数据，可以根据医疗数据之间的直接联系或间接连接调整融合规则，同时，根据医疗特征数据的类型总数还适应性调整注意力模型的层次数量，总之，注意力模型是用于融合异构数据，利用数据之间的连接关系进行融合。

根据生成的最终的患者表示，利用全连接网络层生成预测结果y′：

y′＝softmax(W_yO+b_y)#(24)

其中，y′∈{0,1}¹，是参数矩阵，是偏置向量。y′＝0与y′＝1的各自含义是依据训练标签的设定而定，表示患者死亡风险低，死亡风险高。

综上所述，本发明数据集中的数据按照上述步骤S1-S4的方式进行处理，并以数据集中的标签进行训练，调整模型参数得到训练好的患者死亡风险预测模型。其中，训练实现过程可以采用现有的诸多训练算法进行，本发明对此不进行具体的限定。

从而，基于训练好的患者死亡风险预测模型，本发明提供的一种基于电子病历的患者死亡风险预测方法，其包括以下步骤：

步骤1：获取待预测患者的电子病历；

步骤2：基于所述患者的电子病历以及患者死亡风险预测模型得到患者死亡预测结果。

其中，获取待预测患者的电子病历后，其电子病历的数据会按照步骤S1-S4的方式被处理得到死亡预测结果。

在一些实现方式中，可以理解为本发明构建的患者死亡风险预测模型是包含了数据预处理层、时序模型学习层、异构数据融合表示层以及死亡风险预测层；再另一些实现方式中，也可以将数据预处理层等部分层次视为患者死亡风险预测模型的前置数据处理手段，本发明对模型层次的划分，不进行具体的限定。

实施例2：

本实施例提供一种基于上述患者死亡风险预测方法的系统，其包括：数据获取模块、模型获取模块以及预测模块。

其中，数据获取模块，用于获取待预测患者的电子病历；

模型获取模块，用于获取训练好的患者死亡风险预测模型；

在一些实现方式中，患者死亡风险预测模型是包含了数据预处理层、时序模型学习层、异构数据融合表示层以及死亡风险预测层，进而根据步骤S1-S4的方式进行数据处理以及结果预测。

在一些实现方式中，若患者死亡风险预测模型不包括数据预处理，则对应系统还包括：数据预处理模块，用于对所述数据集中的数据以及待预测患者的电子病历数据进行预处理。

因此，若患者死亡风险预测模型不包含数据预处理层、时序模型学习层、异构数据融合表示层以及死亡风险预测层中的部分模块，将其作为模型的前置处理模块，则对应系统应当包括对应前置处理模块。对此，模块的具体划分以及设定，本发明不进行具体的限定。

在一些实现方式中，患者死亡风险预测模型是从外部导入系统的，则所述系统直接利用数据获取模块、模型获取模块以及预测模块实现对待预测患者的评估。在另一些实现方式中，患者死亡风险预测模型是在系统中训练完成的，则对应系统还包括：模型训练模块。其中，数据获取模块获取数据集的数据，模型训练模块利用所述数据集的数据进行模型训练，训练的过程按照前述实施例1的具体陈述。

应当理解，上述单元模块的具体实现过程参照方法内容，本发明在此不进行具体的赘述，且上述功能模块单元的划分仅仅是一种逻辑功能的划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。同时，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

实施例3：

本实施例提供一种终端，其包括：一个或多个处理器以及存储了一个或多个计算机程序的存储器。其中，所述处理器调用所述计算机程序以执行：一种基于电子病历的患者死亡风险预测方法的步骤。

若针对待预测患者，所述处理器调用所述计算机程序以执行：

步骤1：获取待预测患者的电子病历；

其中，获取待预测患者的电子病历后，所述处理器调用所述计算机程序具体执行：

S1：数据预处理，对待预测患者的电子病历数据进行预处理；

S3：异构数据融合表示：基于注意力机制构建注意力模型，将所述各类患者特殊数据的特征表示输入至所述注意力模型中得到融合表示。

若是针对患者死亡风险预测模型的构建以及训练过程，所述处理器调用所述计算机程序以执行：

基于患者的电子病历构建数据集；

将数据集中患者的死亡结果作为训练标签，按照步骤S1-S4处理数据集中的患者医疗特征数据并进行网络训练得到患者死亡风险预测模型。

该终端还包括：通信接口，用于与外界设备进行通信，进行数据交互传输。

其中，存储器可能包含高速RAM存储器，也可能还包括非易失性除颤器，例如至少一个磁盘存储器。

如果存储器、处理器和通信接口独立实现，则存储器、处理器和通信接口可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构总线，外部设备互联总线或扩展工业标准体系结构总线等。所述总线可以分为地址总线、数据总线、控制总线等。

可选的，在具体实现上，如果存储器、处理器和通信接口集成在一块芯片上，则存储器、处理器即通信接口可以通过内部接口完成相互之间的通信。

各个步骤的具体实现过程请参照前述方法的阐述。

应当理解，在本发明实施例中，所称处理器可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如，存储器还可以存储设备类型的信息。

实施例4：

本实施例提供一种可读存储介质，其存储了计算机程序，所述计算机程序被处理器调用以实现：

一种基于电子病历的患者死亡风险预测方法的步骤。

若针对待预测患者，所述计算机程序被处理器调用以实现：

步骤1：获取待预测患者的电子病历；

其中，获取待预测患者的电子病历后，所述计算机程序被处理器调用以实现：

若是针对患者死亡风险预测模型的构建以及训练过程，所述计算机程序被处理器调用以实现：

基于患者的电子病历构建数据集；

各个步骤的具体实现过程请参照前述方法的阐述。

所述可读存储介质为计算机可读存储介质，其可以是前述任一实施例所述的控制器的内部存储单元，例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备，例如所述控制器上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

实验过程

1.评价指标

本发明旨在构建一个实用高效的危重症患者死亡风险预测方法(TERTIAN)，可以用于提升ICU内死亡风险预测的性能。对于所有模型，均使用准确率(precision)、AUC、F1值、召回率(recall)作为评价指标。对于所有试验，均采用五折交叉验证，以减少误差带来的影响。

2.与其他方法的比较

为评价本发明所提出的危重症患者死亡风险预测方法的有效性，将本发明与以下几种方法进行了比较。

IseeU:该方法使用多尺度卷积神经网络学习患者的时序特征实现死亡率预测。

TimeLine:该方法为每种特征学习一个衰减因子然后通过衰减函数衰减历史就诊信息来进行疾病预测。

GRUD:该方法在GRU的基础上引入输入衰减和隐藏状态衰减以处理患者不规则采样的历史数据进而学习得到患者表示实现死亡率预测。

ConCare:该方法使用衰减函数衰减历史信息并利用注意力机制融合患者的静态数据和动态时序数据以得到患者的特征表示进行死亡率测。

图3展示了以上方法在同一数据集上的评估结果，从是实验结果可以看到，本发明(TERTIAN)方法的Precision、AUC、F1和Recall分别达到了96.89％、95.06％、94.57％和92.36％，明显优于其他对比方法。

3.时间感知的Transformer模块的有效性验证

为了分析用于时间模式学习的时间感知的Transformer模块对预测性能的作用，本发明比较了TERTIAN和它的三种变体：TERTIAN_GRU，它使用GRU代替TERTIAN中的Transformer；TERTIAN_temp：不使用时间间隔信息；TERTIAN_att：移除TERTIAN中连接在Transformer后的注意力机制。如图4所示，该发明提出的时间模式学习方法明显优于其变体，这说明时间感知的Transformer更易于学习到时序数据中的长期依赖性和不规则时序数据中的隐藏信息，Transformer后连接的注意力机制可以进一步捕获到不同历史医疗记录对患者未来健康状况的影响权重，从而提高模型特征表征的准确性。

4.层次注意力融合方式的有效性验证

本发明使用了具有层次结构的注意力机制用于不同类型数据的融合，为验证该融合方法的有效性。比较了TERTIAN和其他三种使用了不同融合方法的模型的预测性能。如图5所示，第一个模型为TERTIAN#，它将TERTIAN融合模块中的第二层注意力机制替换为连接；第二个模型为TERTIAN*，它在TERTIAN#的基础上进一步简化，第一层注意力机制替换为元素乘；第三个模型为TERTIAN&，该模型将TERTIAN中的融合模块简化为直接拼接各类数据的表示向量。从图6可以看出，TERTIAN*和TERTIAN&的性能较差而注意力机制的引入显著提高了模型的整体性能。该发明提出的融合方法采用了双层注意力机制，可以充分挖掘各类数据之间的相互关系，能够有效提高融合表示的准确性，从而取得了最好的预测性能。

需要强调的是，本发明所述的实例是说明性的，而不是限定性的，因此本发明不限于具体实施方式中所述的实例，凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式，不脱离本发明宗旨和范围的，不论是修改还是替换，同样属于本发明的保护范围。

Claims

1.一种基于电子病历的患者死亡风险预测方法，其特征在于：包括以下步骤：

步骤1：获取待预测患者的电子病历；

所述数据集中患者医疗特征数据分为连续性数据和离散型数据；

其中，针对连续性数据类型的每一类患者医疗特征数据，步骤S2中基于所述医疗特征数据的记录时间提取时间间隔序列，并将所述时间间隔序列添加至医疗特征数据中得到具有时间特性的患者特征数据；

针对离散型数据类型的每一类患者医疗特征数据，步骤S2中基于所述医疗特征数据的记录时间顺序将患者的医疗特征数据进行排列；

步骤S3中若患者特征数据的时序特性为不规则时序性，构建时间感知的Transformer模型学习对应一类患者特征数据的特征表示；

针对不规则时序性的一类患者特征数据的特征表示，其获取过程如下：

然后，将所述时间序列与所述特征序列合并得到输入序列；

最后，将所述输入序列输入至所述Transformer模型得到具有时间感知的特征表示；

2.根据权利要求1所述的方法，其特征在于：所述注意力模型为多层结构，第一层融合具有直接联系的不同类别的患者特征数据；其他层是基于前一层的融合结果继续进行融合。

3.根据权利要求2所述的方法，其特征在于：若所述数据集包括实验室检验数据、生命体征数据和用药记录，则步骤S4中融合表示的生成过程如下：

第一层特征融合：

首先，将实验室检验数据的特征表示和生命体征数据的特征表示被分别映射到查询向量和；用药记录的特征表示被映射到键向量；

然后，基于注意力函数并利用查询向量和键向量分别计算实验室检验数据、生命体征数据对应的注意力权重、；

接着，基于注意力权重、分别计算得到实验室检验数据和用药记录的融合表示、生命体征数据与用药记录的融合表示；

第二次特征融合：

首先，将生命体征数据与用药记录的融合表示作为查询向量，实验室检验数据和用药记录的融合表示作为值向量，用药记录的特征表示被映射到键向量；

4.根据权利要求1所述的方法，其特征在于：步骤S5中的所述预测网络为全连接网络层。

5.一种基于权利要求1-4任一项所述方法的系统，其特征在于：包括：数据获取模块、模型获取模块以及预测模块；

数据获取模块，用于获取待预测患者的电子病历；

模型获取模块，用于获取训练好的患者死亡风险预测模型；

6.一种终端，其特征在于：包括：

一个或多个处理器；

存储了一个或多个计算机程序的存储器；

所述处理器调用所述计算机程序以执行：

权利要求1-4任一项所述方法的步骤。

7.一种可读存储介质，其特征在于：存储了计算机程序，所述计算机程序被处理器调用以实现：

权利要求1-4任一项所述方法的步骤。