CN110603547A

CN110603547A - 医疗不良事件预测、报告和预防

Info

Publication number: CN110603547A
Application number: CN201880029614.9A
Authority: CN
Inventors: S·萨里亚; H·索雷玛尼
Original assignee: Johns Hopkins University
Current assignee: Johns Hopkins University
Priority date: 2017-03-02
Filing date: 2018-03-01
Publication date: 2019-12-20
Also published as: EP3590089A4; US20200005941A1; EP3590089A1; CA3055187A1; WO2018160801A1

Abstract

公开了用于预测、报告和预防医疗不良事件诸如败血症的技术。例如，所述技术可以在客户端‑服务器布置中实现，其中所述客户端存在于医疗专业人员的智能电话上。所公开的技术检测即将发生的医疗不良事件的能力利用了两种创新。首先，一些实施方案包括基于稀疏多输出高斯过程的灵活且可扩展的联合模型。与现有技术的联合模型不同，所公开的模型可以解释包括非高斯噪声的极具挑战性的结构，同时可扩展到大数据。其次，一些实施方案利用最优策略以使用由所述联合模型估计的事件发生的分布来预测事件。

Description

医疗不良事件预测、报告和预防

相关申请

本申请要求2017年3月2日提交的授予Saria等人的名称为“Medical AdverseEvent Prediction and Reporting”的美国临时专利申请号62/465,947的优先权和权益，该临时专利申请的全部内容据此以引用方式并入。

技术领域

本公开一般涉及预测、报告和预防即将发生的医疗不良事件。

背景技术

败血症是美国的第11大死因。及时治疗可导致死亡率降低，住院时间缩短。

数据缺失和观察结果含有噪声对于从不规则采样的多变量时间序列(纵向)数据可靠地预测不良医疗事件提出了重大挑战。通常用于在事件预测之前完成数据的插补方法缺乏用于考虑到由于缺失而导致的不确定性的原理机制。

发明内容

根据各种实施方案，公开了一种预测即将发生的医疗不良事件的方法。该方法包括：获得多个全局化验结果，所述多个全局化验结果包括，对于多个患者中的每一个和多种化验类型中的每一种，在第一时间间隔内获得的多个患者化验结果；由至少一个电子处理器按比例放大所述多个全局化验结果的至少一部分的模型，以便获得包括至少一个随机变量的纵向事件模型；由至少一个电子处理器，对于所述多个患者中的每一个，并且根据纵向事件模型，确定包括至少一个随机变量的危险函数，其中每个危险函数以直至给定时间相应患者未发生不良事件的信息为条件，指示在给定时间相应患者发生不良事件的可能性；由至少一个电子处理器，对于所述多个患者中的每一个，生成包括纵向事件模型和从危险函数生成的事件发生时间模型的联合模型，每个联合模型指示在给定时间间隔内发生不良事件的可能性；对于新患者和多种化验类型中的每一种，获得在第二时间间隔内获得的多个新患者化验结果；由至少一个电子处理器将联合模型应用于在第二时间间隔获得的所述多个新患者化验结果；从联合模型中获得新患者可能在第三时间间隔内经历即将发生的医疗不良事件的指示；以及向新患者的护理提供者发送电子消息，指示新患者可能会经历即将发生的医疗不良事件。

上述实施方案的各种可选特征包括以下这些。不良事件可以是败血症。所述多种化验类型可包括肌酐水平。发送可以包括向新患者的护理提供者的移动电话发送消息。可以一起学习纵向事件模型和事件发生时间模型。化验阶段可以进一步包括将检测器应用于联合模型，其中检测器的输出被限制为：是、否和放弃。纵向事件模型可以提供关于预测的化验参数水平的置信区间。生成可以包括联合学习纵向事件模型和事件发生时间模型。按比例放大可以包括将稀疏变分推理技术应用于所述多个全局化验结果的至少一部分的模型。按比例放大可以包括应用以下各项之一：用于推断关于所述多个全局化验结果的不确定性的基于可扩展优化的技术，用于推断关于所述多个全局化验结果的不确定性的基于采样的技术，用于推断关于所述多个全局化验结果的不确定性的具有可扩展精确或近似推理算法的概率方法，或者用于推断关于所述多个全局化验结果的不确定性的基于多重插补的方法。

根据各种实施方案，公开了一种用于预测即将发生的医疗不良事件的系统。该系统包括至少一个移动设备以及通信地耦合到至少一个电子处理器和所述至少一个移动设备的至少一个电子服务器计算机，其中所述至少一个电子处理器执行指令以实施包括以下方面的指令：获得多个全局化验结果，所述多个全局化验结果包括，对于多个患者中的每一个和多种化验类型中的每一种，在第一时间间隔内获得的多个患者化验结果；由至少一个电子处理器按比例放大所述多个全局化验结果的至少一部分的模型，以便获得包括至少一个随机变量的纵向事件模型；由至少一个电子处理器，对于所述多个患者中的每一个，并且根据纵向事件模型，确定包括至少一个随机变量的危险函数，其中每个危险函数以直至给定时间相应患者未发生不良事件的信息为条件，指示在给定时间相应患者发生不良事件的可能性；由至少一个电子处理器，对于所述多个患者中的每一个，生成包括纵向事件模型和从危险函数生成的事件发生时间模型的联合模型，每个联合模型指示在给定时间间隔内发生不良事件的可能性；对于新患者和多种化验类型中的每一种，获得在第二时间间隔内获得的多个新患者化验结果；由至少一个电子处理器将联合模型应用于在第二时间间隔获得的所述多个新患者化验结果；从联合模型中获得新患者可能在第三时间间隔内经历即将发生的医疗不良事件的指示；以及向新患者的医疗专业人员的移动设备发送电子消息，指示新患者可能会经历即将发生的医疗不良事件。

上述实施方案的各种可选特征包括以下这些。不良事件可以是败血症。所述多种化验类型可包括肌酐水平。移动设备可以包括新患者的护理提供者的移动电话。可以一起学习纵向事件模型和事件发生时间模型。化验阶段可以进一步包括将检测器应用于联合模型，其中检测器的输出被限制为：是、否和放弃。纵向事件模型可以提供关于预测的化验参数水平的置信区间。生成可以包括联合学习纵向事件模型和事件发生时间模型。按比例放大可以包括将稀疏变分推理技术应用于所述多个全局化验结果的至少一部分的模型。按比例放大可以包括应用以下各项之一：用于推断关于所述多个全局化验结果的不确定性的基于可扩展优化的技术，用于推断关于所述多个全局化验结果的不确定性的基于采样的技术，用于推断关于所述多个全局化验结果的不确定性的具有可扩展精确或近似推理算法的概率方法，或者用于推断关于所述多个全局化验结果的不确定性的基于多重插补的方法。

附图说明

并入本说明书并构成其一部分的附图示出了所描述技术的实现方式。在图中：

图1展示示出了根据各种实施方案的所观察到的纵向数据和事件发生时间数据以及基于该数据从联合模型得到的估计值的图。

图2是根据各种实施方案的用于稳健事件预测策略的示例算法；

图3是示出根据各种实施方案的使用根据图2的算法的策略作出的三个示例决策的示意图；

图4展示根据各种实施方案的来自患有败血性休克的患者和没有观察到休克的患者的观察信号的数据，以及以拟合纵向数据为条件的估计事件概率；

图5示出根据各种实施方案的接收者操作特征(“ROC”)曲线，以及真阳性率(“TPR”)和假阳性率(“FPR”)曲线；

图6是根据各种实施方案的患者状态列表的移动设备屏幕截图；

图7是根据各种实施方案的患者警报的移动设备屏幕截图；

图8是根据各种实施方案的单个患者报告的移动设备屏幕截图；

图9是根据各种实施方案的治疗束(treatment bundle)的移动设备屏幕截图；

图10是根据各种实现方式的方法的流程图；以及

图11是适用于实现本发明的一些实施方案的计算机通信系统的示意图。

具体实施方式

现在将详细参考在附图中示出的示例实现方式。在可能的情况下，在所有附图中将使用相同的附图标记来表示相同或相似的部分。

现有的联合建模技术可用于对纵向数据和医疗不良事件数据联合建模，并计算以纵向观察结果为条件的事件概率。然而，这些方法作出了强有力的参数假设，并且不容易扩展到具有许多观察结果的多变量信号。因此，一些实施方案包括若干创新。首先，一些实施方案包括基于稀疏多输出高斯(Gaussian)过程的灵活且可扩展的联合模型。与现有技术的联合模型不同，所公开的模型可以解释包括非高斯噪声的极具挑战性的结构，同时可扩展到大数据。其次，一些实施方案利用最优策略以使用由联合模型估计的事件发生的分布来预测事件。导出的策略在延迟检测与不正确评估的成本之间取得折衷，并且当估计的事件概率不满足导出的置信度标准时，放弃作出决策。对大型数据集的实验表明，所提出的框架在事件预测方面明显优于现有技术水平。

1.引言

一些实施方案至少部分地解决了从有噪声、多变量纵向数据(不规则采样的重复观察结果)中预测事件的问题。作为示例应用，考虑可靠地预测例如医院中的即将发生的医疗不良事件的挑战。如果早期发现，诸如败血症和心脏骤停之类的许多危及生命的不良事件是可以治疗的。为此，人们可以利用临床医生已随时间而记录的大量信号(例如，心率、呼吸率、血细胞计数、肌酐)来跟踪个体的健康状况。但是，没有定期记录每个信号的重复观察结果。相反，选择何时记录是由临床医生的怀疑指数驱动的。例如，如果过去对血细胞计数的观察结果表明个体的健康状况正在恶化，则他们可能会更频繁地要求进行化验，从而导致更频繁的观察结果。此外，还可能在不同时间要求不同的化验，从而导致不同信号之间的不同“缺失”模式。在监控数据中心的健康状况以及基于产品和系统使用情况统计的纵向数据来预测故障时，也会出现类似性质的问题。

在统计学中，事件预测的任务可以在事件发生时间或生存分析的框架下进行。这里，有两类主要方法。在第一类中，对纵向数据和事件数据进行联合建模，并且在给出直至给定时间观察到的纵向数据的情况下，获得事件概率的条件分布。例如，一些现有技术为纵向数据假定了线性混合效应(“LME”)模型。事件发生时间数据通过LME参数链接到纵向数据。因此，给定在任何时间t的过去纵向数据，可以计算在任何未来间隔Δ内事件发生概率的条件分布。一些技术允许更灵活的模型，使得参数假设更少：具体而言，它们拟合高斯过程的混合体，但它们侧重于单个时间序列。通常，用于纵向数据和事件数据的联合建模的现有技术需要对纵向数据的形式作出强有力的参数假设，以便扩展到具有许多观察结果的多个信号。这种作出强有力的参数假设的需要限制了对具有挑战性的时间序列的适用性(例如由一些实施方案解决的那些时间序列)。

另一类方法使用两阶段建模：根据纵向数据来计算特征，并在给定特征的情况下，学习单独的事件发生时间预测器。对于不规则采样的信号，使用插补来完成缺失值，并从事件发生时间模型的完成数据中提取特征的点估计值。该后一类方法的问题是，它们没有原理性的方法来考虑由于缺失而导致的不确定性。例如，与具有非常少的测量值的区域相比，可以在具有密集观察结果的区域中更可靠地估计特征。但是通过忽略由于缺失导致的不确定性，所得到的事件预测器更可能在具有不可靠特征估计值的区域中触发假的或错过的检测。

另外的现有技术将事件预测视为时间序列分类任务。这包括将事件数据转换为二进制标签序列，如果事件可能在给定范围内发生，则为1，否则为0。但是，为了对事件数据进行二值化，操作员选择固定的范围(Δ)。此外，这样做时，可能丢失关于事件的精确定时的有价值信息(例如，关于事件是在范围(Δ)的开始还是接近结束时发生的信息。对于预测，滑动窗口可以用于通过以下方式计算特征的点估计值：使用用于完成数据的插补技术，或者使用来自将复杂的概率模型拟合到时间序列数据的模型参数。这些方法具有与上述两阶段事件发生时间分析方法类似的缺点：它们没有充分利用由于纵向数据中的缺失而导致的不确定性。

因此，一些实施方案解决了以下问题：可以利用由于纵向数据中的缺失而导致的不确定性来提高预测未来事件的可靠性吗？呈现的实施方案肯定地回答了该问题，并且提供了包括以下创新中的一个或两个的可靠的事件预测框架。

首先，提出了一种灵活的贝叶斯(Bayesian)非参数模型，用于对高维、多变量纵向数据和事件发生时间数据联合建模。该模型可以直至t观察到的纵向数据y^0:t为条件用于计算在任何给定范围(t,t+Δ]内事件发生的概率H(Δ|y^0:t,t)。与联合建模中的现有技术相比，这种方法可以扩展到大数据，而无需对纵向数据的形式作出强有力的参数假设。具体而言，不需要假设时间序列数据的简单参数模型。多输出高斯过程(GP)用于对多变量纵向数据进行建模。这考虑了时间序列中的非平凡关联，同时灵活地捕获序列内的结构。此外，为了促进可扩展学习和推理，一些实施方案包括利用稀疏GP技术的随机变分推理算法。这降低了从O(N³D³)到O(NDM²)的推理复杂度，其中N是每个信号的观察结果数量，D是信号的数量，并且M(<<N)是诱导点的数量，它们被引入以粗略估计后验分布。

其次是用于导出最优检测器的决策理论方法，该检测器使用预测的事件概率H(Δ|y^0:t,t)及其相关的不确定性来在延迟检测的成本与作出不正确的评估的成本之间取得折衷。

图1展示示出了根据各种实施方案的所观察到的纵向数据104和事件发生时间数据102以及基于该数据从联合模型得到的估计值的图。如示例检测器输出106中所示，检测器可以选择等待以避免引起误报警的成本。其他人已经探索了其他可靠预测的概念。例如，之前已经研究过具有放弃(或具有拒绝)的分类。在这些方法中作出决策基于特征和事件概率的点估计值。其他人已经考虑了在分段视频帧的分类中进行可靠预测，每个视频帧都包含单个类。在这些方法中，目标是尽可能早地确定类别标签。

2.生存分析

本节介绍了在一些实施方案中使用的生存分析和联合模型。一般而言，生存分析参考一类为预测和分析生存时间(直至感兴趣的事件发生所剩余的时间)而开发的统计模型。这包括例如预测直至机械系统失效或直至患者经历败血性休克的时间。如本文所用的生存分析的主要焦点是计算生存概率；即，在给定到目前为止观察到的信息的情况下，每个个体在一段时间内生存的概率。

更正式地说，对于每个个体i，令为表示即将发生的事件的发生时间的非负连续随机变量。该随机变量使用生存函数S(t)＝Pr(T≥t)来表征；即，个体存活到时间t的概率。在给定生存函数的情况下，可以计算概率密度函数在生存分析中，这种分布通常用危险函数λ(t)来指定，该危险函数被定义为以个体存活到时间t的信息为条件，事件发生的瞬时概率；即，

根据等式(1)，可以容易地计算出和

在λ(t)＝λ₀的特殊情况下，其中λ₀是常数，该分布缩小到指数分布，其中p(t)＝λ₀exp(λ₀t)。通常，危险(风险)函数可能取决于一些时变因素和个体特定特征。对于已经存活到时间t的个体的危险函数，合适的参数选择是

其中是基于直到时间t的纵向观察结果计算出的特征的向量，并且α是应该学习的自由参数的向量。此外，λ₀(s；t)是基线危险函数，该函数指定所有个体的风险的自然演变，而与个体特定特征无关。λ₀(s；t)的典型参数形式是分段常数函数，并且其中a和b是自由参数。一些实施方案利用后一种形式。

在给定此危险函数的情况下，事件发生时间模型中感兴趣的数量是事件概率(失效概率)，该概率可以定义为事件在接下来Δ小时内发生的概率：

事件概率是许多应用中的重要数量。例如，等式(3)可以用作风险评分，以优先考虑重症监护病房中的患者，并将更多资源分配给在接下来的Δ小时内具有更大的经历不良健康事件风险的那些患者。此类应用可以包括随着时间的推移有新的观察结果可用时，动态地更新失效概率。

联合建模：等式(2)给出的危险函数和等式(3)的事件概率假设根据直到时间t的纵向数据确定性地计算特征然而，在纵向数据具有缺失的背景下，计算这些特征可能是有挑战性的。在这一背景下，并且根据一些实施方案，呈现了概率模型以对纵向数据和事件发生时间数据联合建模。

令为个体i的直到时间t的纵向数据。纵向分量对时间序列进行建模，并以为(即)为条件来估计特征的分布。在给定此分布的情况下，事件发生时间分量对生存数据进行建模，并估计事件概率。

注意，因为特征是具有分布的随机变量，所以事件概率现在是随机数量；即，从中抽取的特征的每次实现都计算事件概率的不同估计值。结果，随机变量引起上的分布，即，可以使用变量变换技术来从分布中获得该分布。

通常，为事件预测计算的预期值：

然而，一些实施方案还可以考虑该分布的方差或分位数来量化事件概率估计中的不确定性(参见图1)。

学习：联合模型最大化纵向数据和事件发生时间数据的联合可能性，其中p(y_i，T_i)＝∫p(y_i|f_i)p(T_i|f_i)df_i。在许多实际情况下，由于删失而未观察到某些个体的确切事件时间。一些实施方案考虑了两种类型的删失：右删失和区间删失。在右删失中，事件在时间T_ri之前没有发生是已知的，但事件的确切时间是未知的。类似地，在区间删失中，事件在时间窗口内发生，T_i∈[T_li，T_ri]是已知的。在给定该部分信息的情况下，事件发生时间分量的可能性可以表示为p(T_i，δ_i|f_i)，其中T_i＝{T_i，T_li，T_ri}，并且

其中为了简洁性和可读性，省略了对λ(T_i|f_i)和S(T_i|f_i)中的f_i的显式调节(explicit conditioning)。

注意，每次s≥t时危险函数(2)的值都取决于特征f^0：t的历史。替代性地，危险率有时被定义为瞬时特征的函数，即，该定义通常用在研究重点是回顾性分析时；即，识别不同特征与事件数据之间的关联。然而，该方法可能不适于动态事件预测，动态事件预测旨在在事件发生之前很好地预测故障。在该方法中，在(t,t+Δ]范围内发生事件的概率涉及计算获得以y^0:t为条件的f^0：t+Δ的分布是有挑战性的，因为它可能包括对(t,t+Δ]间隔的特征的远景预测。此外，S(t+Δ|y^0:t)的预期值可能在计算上难以处理。相反，通常采用动态训练方法，该方法使用等式(2)中定义的危险函数。在这里，在一系列网格点t_i1≤t_i2≤......≤T_i评估每个个体的可能性。在每个训练时间点t，定义新的事件发生时间随机变量，生存时间为T_i-t，危险函数为直观地，这种方法不是对特征与事件之间的瞬时关系进行建模，而是直接学习事件概率与历史特征之间的关联。这是在一些实施方案中使用的方法。

3.联合纵向和事件发生时间模型

本节介绍了用于对纵向数据和事件发生时间数据联合建模的框架。概率联合模型包括两个子模型：纵向子模型和事件发生时间子模型。直观地，事件发生时间模型计算以纵向模型中估计的特征为条件的事件概率。通过最大化纵向数据和事件发生时间数据的联合可能性来一起学习这两个子模型。

令为直至时间t，个体i的观察到的纵向数据。呈现了通过最大化可能性的概率联合建模框架，其中T_i和δ_i是第2节中定义的事件发生时间信息。除非存在歧义，否则为了便于阅读，此后减少使用t上标。

本节的其余部分介绍了两个子模型。这指定分布接下来描述一些实施方案如何联合学习这些纵向子模型和事件发生时间子模型。

3.1纵向子模型

一些实施方案使用多输出高斯过程(“GP”)来为每个个体的多变量纵向数据进行建模。GP提供对函数的灵活的先验，所述先验可以捕获临床数据所表现出的复杂模式。可以基于已知的协同区域化线性模型(“LMC”)框架来开发纵向子模型。LMC可以捕获每个个体的不同信号之间的相关性。这提供了一种基于稀疏信号与更密集采样信号的相关性来估计稀疏信号的机制。

令为个体i的信号d的N_id个观察结果的集合。通过y_i＝{y_i1,......,y_iD}来表示个体i的D个纵向信号的观察结果的集合。不失一般性地，假设数据是随机缺失的(“MAR”)；即，缺失机制不依赖于未观察到的因素。在该假设下，可以忽略导致缺失数据的过程，并且可以仅基于观察到的数据来推断模型的参数。

每个信号y_id(t)可以表示为：

y_id(t)＝f_id(t)+ε_id(t)， (6)

其中R是共享的隐性函数，v_id(t)是信号特定的隐性函数，并且w_idr和κ_id分别是共享项和信号特定项的加权系数。

每个共享的隐性函数g_ir＝g_ir(t_id)是来自GP的抽取，平均值为0，协方差为即，和该内核的参数在不同信号之间共享。信号特定的函数是从GP生成的，其内核参数是信号特定的：

对于每个隐性函数，一些实施方案利用Matérn-1/2内核(例如，如Rasmussen和C.Williams,Gaussian Processes for Machine Learning,MIT Press,2006中所公开的)。对于共享隐性函数，例如，其中l_ir>0是内核的长度尺度，并且|t–t’|是t与t’之间的欧几里德(Euclidean)距离。

不失一般性地，假设ε_id(t)是从具有尺度σ_id和三个自由度ε_id(t)～T₃(0，σ_id)的非标准化学生t分布生成的。一些实施方案利用学生t分布，因为它具有比高斯分布更重的尾部并且具有更强的抵御异常值的能力。

直观地，该模型的这种特定结构假定每个个体的多变量时间序列所表现出的模式可以通过两个分量来描述：所有信号之间共享的低维函数空间和信号特定的隐性函数。共享分量是学习信号之间相关性的主要机制；更高度相关的信号给同一组隐性函数赋予高权重(即，w_idr和w’_idr是相似的)。在健康等领域对相关性建模是很自然的，其中任何单个器官系统的恶化都可能会影响多个信号。此外，通过对相关性进行建模，该模型可以基于与更频繁采样的信号的相关性来改善稀疏采样信号的数据缺失时的估计。

跨个体共享内核长度尺度：长度尺度l_ir确定点之间的相关性随时间的距离而减小的速率。为了捕获共同的动态模式并跨个体共享统计强度，一些实施方案跨所有个体共享每个隐性函数的长度尺度。然而，特别是在随着时间的推移有新的观察结果可用的动态背景下，一个长度尺度可能不能适合具有不同观察长度的所有个体。通过实验，发明人发现内核长度尺度可以定义为每个个体的最大观察时间的函数：

其中是个体i的最大观察时间，并且γ_r和β_r是可以与其他模型参数一起估计的群体级参数。因此，不是在可能具有不同观察长度的个体之间共享相同的长度尺度，而是共享γ_r和β_r。通过使用此函数，具有相同的两个个体将具有相同的长度尺度。此外，是获得正长度尺度的适当映射。设以得到l_ir∈[10,15010]；这防止过小或过大的长度尺度。在实验中，发明人设R＝2并初始化β和γ，使得一个内核捕获共享隐性函数的短期变化而另一个内核学习长期趋势。一些实施方案初始化γ_r＝1，2，β₁＝-12并且β₂＝-16。在初始化之后，一些实施方案学习这些参数以及模型的其他参数。

类似地，定义信号特定的隐性函数的内核和长度尺度并且其中并且γ_d和β_d是自由参数。

除非存在歧义，否则此后丢弃个体i的索引。另外，为了简化表示法，假设并写作注意，对于学习算法，不需要对齐来自不同信号的观察结果。

3.2事件发生时间子模型

事件发生时间子模型计算以纵向子模型中估计的特征为条件的事件概率。具体而言，对于存活到时间t的每个个体i，在给定预测的情况下，定义时间s≥t的动态危险函数：

和这里，ρ_c(t′；t)是积分的加权因子，并且c≥0是自由参数。在任何时间t，ρ_c(t′；t)对特征轨迹的最近历史给出指数级更大的权重；参数c控制指数权重的比率。给予最近历史的相对权重通过增大c来增大。一些实施方案还将ρ归一化，使得

我们还可以通过将等式(6)代入等式(8)而按照隐性函数来书写危险函数：

其中和3.3节描述了如何在等式(11)中分析计算隐性函数的积分。在给定(11)的情况下，在任何点t，一些实施方案计算事件概率p_H(h)的分布。对于的给定实现，事件概率可表示为：

等式(8)中定义的危险函数基于线性特征(即，线性特征在生存分析中是常见的，因为它们是可解释的。在一些实施方案中，可解释的特征优于难以解释的非线性特征。非线性特征可以包含在所公开的框架内。

3.3学习和推理

本节公开了所提出的联合模型的学习和推理。一些实施方案利用具有全局和局部参数的模型。由Θ₀表示的全局参数是事件发生时间模型的参数(α,a,b,c)和定义内核长度尺度的参数(γ_r,γ_d,β_r,β₀)；即，Θ₀＝{α,a,b,c,γ_r,γ_d,β_r,β₀}。一些实施方案独立地更新小批量个体的局部参数，并使用所得到的分布来更新全局参数。与经典随机变分推理过程不同，此类局部更新是高度非线性的，并且一些实施方案在循环内使用基于梯度的优化。

3.3.1局部参数

推理的瓶颈是在纵向子模型中使用稳健的稀疏GP。具体而言，由于矩阵求逆，即使在单变量纵向背景下，GP推理也会在观察结果数量上三次方地按比例放大。为了降低该计算复杂度，一些实施方案利用基于稀疏变分方法的学习算法。此外，重尾噪声的假设使得模型具有抵御异常值的强大能力，但这意味着GP中通常的共轭关系可能会丢失：变分方法还允许对隐性函数上的非高斯后验的近似计算。由Θ_i表示的所公开模型的局部参数包括控制这些高斯过程近似计算、噪声尺度和过程间权重ω,κ的变分参数。可以进行这些参数的点估计。

所公开的模型涉及多个GP：对于每个个体，存在R个隐性函数g_r和D个信号特定函数v_d。在变分近似法中，不失一般性地，假设这些函数中的每一个都是独立的，并由一些诱导输入-响应对Z,u控制，其中Z是一些伪输入(以规则网格排列)并且u是过程在这些点的值。变量u具有变分分布其产生变分GP分布其中且

其中可以类似地获得变分分布

由于感兴趣的函数f_d,由这些过程的线性组合给出，因此，变分分布q(f)通过采用这些GP的线性组合给出。具体而言：

其中并且这些变分分布用于计算ELBO，ELBO用作优化变分参数m,S的目标函数。

对于每个个体，给出纵向数据y_i、事件发生时间数据T_i和删失数据δ_i。通过将这些收集到中，个体的似然函数是在此，为了便于阅读，丢弃单个下标i和对Θ_i和Θ₀的显式调节。在给定GP近似值的情况下并使用Jensen不等式，得到：

其中q(f)＝E_q(f)p(f|u)。等式(14)的计算可以利用事件发生时间和纵向数据独立地以f为条件的事实。

首先考虑E_q(f)和log(p(y|f))的计算。由于以f为条件，因此，y的分布在d上进行因式分解，得到其中q(f_d)在等式(13)中计算。在给定噪声分布的选择的情况下，不能通过分析来计算该预期值。然而，以f_d为条件，也在所有个体观察结果上进行因式分解。因此，该预期值减少到几个一维积分的总和，每个观察结果对应一个一维积分，可以使用高斯-埃尔米特(Gauss-Hermite)求积来求其近似值。

接下来，考虑E_q(f)log(p(T，δ|f)的计算。与y不同，事件发生时间子模型的可能性不在d上进行因式分解。一些实施方案取涉及危险函数(11)的项的预期值，该危险函数涉及计算隐性函数随时间的积分。为此，一些实施方案利用以下属性：

令f(t)是具有均值μ_t和内核函数K(t,t’)的高斯过程。那么，是具有均值和方差的高斯随机变量。

使用该属性，推断出，是具有均值和方差的高斯随机变量，其可以以闭合形式分析地计算。然后，通过替换等式(5)中定义的似然函数，并遵循用于定义3.2节中描述的危险函数的动态方法来计算E_q(f)log(p(T，δ|f)。与似然函数中的区间删失相关的项的预期值不能以闭合形式获得。相反，计算该项的蒙特卡洛(Monte Carlo)估计值，并使用重新参数化技术来计算该项相对于模型参数的梯度。

现在，在等式(14)中计算ELBO_i。等式(14)中的KL项以闭合形式获得。

3.3.2全局参数

本节描述了全局参数Θ₀＝{α,a,b,c,γ_r,γ_d,β_r,β₀}的估计。用于最大化Θ₀的总体目标函数是：其中I是个体总数。由于ELBO是I项的累加，因此一些实施方案可以使用随机梯度技术。在算法的每次迭代中，随机选择一小批个体，并相对于其局部参数来优化ELBO(如3.3.1节中所讨论)，使Θ₀保持固定。然后，基于在小批量上计算出的梯度执行随机梯度上升的一个步骤以更新全局参数。重复此过程，直到全局参数的相对变化小于阈值，或直到达到最大迭代次数。一些实施方案使用AdaGrad来进行随机梯度优化。

一些实施方案利用软件，该软件自动计算ELBO相对于所有变量的梯度，并在多个处理器上并行运行学习算法。

4.感知不确定性的事件预测

第3节中开发的联合模型计算在任何给定范围Δ内发生事件的概率本节导出使用此事件概率及其相关联的不确定性来检测事件发生的最优策略。检测器的期望行为是等待看到更多的数据，并在估计的事件概率不可靠且不正确分类的风险高时放弃分类。为了获得该策略，一些实施方案采用决策理论方法。

在任何给定时间，检测器采取三种可能的动作之一：它作出阳性预测(即，预测事件将在接下来的Δ小时内发生)、阴性预测(即，确定事件不会在接下来的Δ小时内发生)、或放弃(即，不作出任何预测)。检测器通过在不正确分类的成本与放弃的惩罚之间取得折衷来在这些动作之间作出决定。通过指定与每种类型的可能错误(假阳性和假阴性)或放弃相关联的相对成本项来定义风险(成本)函数。然后，通过最小化指定的风险函数来导出最优决策函数(策略)。

具体而言，对于每个个体i，在给定直到时间t的观察结果的情况下，目的是确定事件是将在接下来的Δ小时内发生(ψ_i＝1)还是不发生(ψ_i＝0)。在此，为了简洁起见，再次丢弃i和t下标。将ψ视为具有概率的未观察到的伯努利(Bernoulli)随机变量。联合模型通过计算分布pH(h).来估计此概率。H上的分布提供关于Pr(ψ＝1)的估计的不确定性的有价值信息。下面给出的稳健策略使用该信息来提高事件预测的可靠性。

通过来表示检测器作出的决策。最优策略选择动作其中a表示放弃，并且分别表示阴性和阳性预测。

通过分别将L₀₁和L₁₀定义为与假阳性(如果ψ＝0且)和假阴性(如果ψ＝1且)错误相关联的成本项，并将L_a定义为放弃的成本(如果)，来指定风险函数。以ψ为条件，整体风险函数是

其中指标函数1(x)根据布尔变量x是真还是假，等于1或0。

由于ψ是未观察到的随机变量，而不是最小化等式(15)，因此最小化相对于ψ,Pr(ψ＝1)＝H的分布的预期值：即，因为H是随机变量，所以预期的风险函数也是的每个可能选择的随机变量。可以基于H，pH(h)的分布，容易地计算出的分布。

图2是根据各种实施方案的用于稳健事件预测策略的示例算法。通过最小化风险分布的分位数来获得稳健的策略。直观地，这样做时，可能以一定概率发生的最大成本被最小化。例如，概率为0.95，的任何选择下的成本小于R^(0.95)，即风险分布的第95个分位数。

具体而言，令h^(q)为分布pH(h)的q分位数；即，对于或a，计算风险函数的q分位数

当风险函数的q分位数是L₁₀h^(q)。类似地，对于的情况，风险函数的q分位数是L₀₁h^(1-q)。这里，使用随机变量1-H的q分位数是1-h^(1-q)的属性，其中h^(1-q)是H的(1-q)-分位数。最后，在放弃的情况下，风险函数的q分位数是L_a。获取风险函数的q分位数：

最小化等式(16)以计算最优策略。最优策略确定何时选择或a作为h^(q)，h^(1-q)，以及成本项L₀₁、L₁₀和L_a的函数。特别是，当h^(q)L₁₀≤(1-h^(1-q))L₀₁且h^(q)L₁₀≤L_a时，选择因为最优策略仅取决于相对成本项，因此，为了简化表示法，定义且此外，不失一般性地，假设q>0.5，并定义这里c_q是H的1-2q置信区间。因此，替换L₁、L₂和c_q，用于选择的条件简化为h^(q)≤(1+c_q)/(1+L₁)且h^(q)≤L₂。

类似地，获得用于选择或的最优条件。最优决策规则如下：

其中并且

图3是示出根据各种实施方案的使用根据图2的算法的策略作出的三个示例决策的示意图。特别地，图3示出了使用图2中描述的策略作出的三个示例决策，其中L₁＝1且L₂＝0.4。阴影区域是三种分布302、304、306的q的一些选择的置信区间[h^(1-q)，h^(q)]。0.4和0.6处的箭头分别为L₂和1-L₁L₂。所有情况均满足c_q≥L₂(1+L₁)-1。对于302，最优决策是对于304，最优决策是以及对于306，最优决策是

(17)中的阈值τ(c_q)和可以取两个可能的值，具体取决于c_q与L₁和L₂比较的情况：在c_q>L₂(1+L₁)-1的特殊情况下，可以通过将置信区间[h^(1-q)，h^(q)]与阈值L₂和1-L₁L₂比较来进行预测。特别地，如果整个置信区间低于L₂(即，如果h^(q)<L₂，如图3中302所示)，则声明如果整个置信区间高于1-L₁L₂(即，如果h^(1-q)>1-L₁L₂，如图3中304所示)，则预测如果这些条件都不满足，则分类器不作出任何决策(如图3中的306所示)。在c_q<L₂(1+L₁)–1的情况下(即，不确定性水平低于阈值)，如果h^(1-q)+L₁h^(q)小于或大于1，则分别为0或1。图2总结了这一策略。成本项L₁、L₂和q可以由现场专家根据他们对惩罚不同类型的错误的偏好及其所需的置信水平来提供。替代性地，可以对L₁、L₂、q执行网格搜索，以及在选择的特异性、灵敏度和误警率方面实现期望性能的组合。在实验中，发明人采用后一种方法。

4.1.特殊情况：没有不确定性信息的策略

基于插补的方法和其他不考虑由于缺失引起的不确定性的方法只能计算失效概率的点估计值H。在这种情况下，H上的分布可以被认为是简并分布，在H的点估计值上具有质量1；即，pH(h)＝1(h-h₀)，其中h₀是H的点估计值。这里，由于简并分布，h^(q)＝h^(1-q)＝h₀且c_q＝0。

在这种特殊情况下，图2中总结的稳健策略简化为以下简单情况：

例如，考虑L₁＝1的情况。这里，如果放弃的相对成本是L₂≥0.5，那么这是没有放弃且阈值等于0.5的二元分类的策略。替代性地，当L₂<0.5时，放弃区间为[L₂,1-L₂]。在这种情况下，当事件概率L₂<h₀<1-L₂时(即，当h₀接近边界时)，分类器选择放弃。

4.1.1.与具有不确定性的稳健策略的比较

等式(17)的稳健策略及其等式(18)的特殊情况两者都是基于将统计量与区间进行比较，即，在等式(17)的情况下h^(q)与区间进行比较；以及在等式(18)的情况下，h₀与区间进行比较。

这两种情况之间的重要区别是，根据等式(18)的策略，放弃区域仅取决于L₁和L₂，它们对于所有个体都是相同的，但根据等式(17)的稳健策略，放弃区域的长度是max{0,c_q-(L₂(1+L₁)-1)}。也就是说，放弃区域基于H的估计值的置信区间的长度来适应每个个体。在分类器不确定H的估计值的情况下，放弃区间更大。这有助于防止不正确的预测。例如，考虑图3中的示例306。这里，预期值h₀(虚线)大于但其置信区间(阴影框)相对较大。假设这是阴性样本，基于h₀(等式(18)的策略)作出决策将导致假阳性错误。为了根据等式(18)的策略放弃该个体，放弃区间应该非常大。但由于所有个体的放弃区间都相同，因此使区间过大会导致放弃分类器可能是正确的许多其他个体。然而，根据稳健策略，可以基于H的置信区间，针对每个个体调整放弃区间。在这种特定情况下，例如，所得的放弃区间很大(因为c_q很大)，因此避免了假阳性预测。

5.实验结果

发明人评估了关于预测医院中的患者何时处于败血性休克(危及生命的不良事件)的高风险的任务的所提出的框架。目前，临床医生只有用于实时、自动预测休克风险的基本工具。这些工具的误警率高。早期识别为临床医生提供调查和提供及时补救治疗的机会。

5.1.数据

发明人使用MIMIC-II临床数据库，这是一个公开可用的数据库，包括从住院的患者(位于波士顿的贝斯以色列女执事医疗中心(Beth Israel Deaconess MedicalCenter))收集的临床数据。为了对数据进行注释，发明人使用以下文献中描述的败血性休克的定义：K.E.Henry等人,“A targeted real-time early warning score(TREWScore)for septic shock,”Science translational medicine,第7卷第299期,第299ra122页,2015。删失是该数据集中的常见问题：存在败血性休克高风险的患者可接受延迟或预防败血性休克的治疗。在这些情况下，他们的真实事件时间(即，在未经治疗的情况下的事件)被删失或未被观察到。一些实施方案将接受了治疗然后发生败血性休克的患者视为区间删失的，因为休克发作的确切时间可以是在治疗时间与观察到的休克发作时间之间的任何时间。接受治疗后从未发生败血性休克的患者被视为右删失的。对于这些患者，确切的休克发作时间可能在治疗后的任何时间点。

发明人对以下10个纵向流进行了建模：心率(“HR”)、收缩压(“SBP”)、尿量、血尿素氮(“BUN”)、肌酐(“CR”)、格拉斯哥(Glasgow)昏迷评分(“GCS”)、通过动脉管路测量的血液pH(“动脉pH”)、呼吸率(“RR”)、动脉血氧分压(“PaO2”)和白细胞计数(“WBC”)。这些是用于鉴别败血症的临床信号。此外，发明人还包括了以下被证明是高度预测性的静态特征：自第一次使用抗生素以来的时间，自器官衰竭以来的时间，以及慢性肝病、慢性心力衰竭和糖尿病的状态。

发明人随机选择了3151个每个信号具有至少两个测量值的患者。因为原始数据集是高度不平衡的，所以发明人包括了所有经历败血性休克且每个信号具有至少两个观察结果的患者以及没有观察到休克的子采样患者以构建相对平衡的数据集。发明人随机将患者分成训练组和测试组。训练组由2363个患者组成，包括287个观察到败血性休克的患者和2076个无事件的患者。此外，在训练组中的患者之中，279个接受了败血症治疗，其中166个后来发生败血性休克(因此，它们是区间删失的)；其余113个患者是右删失的。测试组包括788个患者，包括101个观察到休克的患者和687个无事件的患者。

该数据有两个具有挑战性的方面。首先，个体患者每个信号有多达2500个观察结果。这是现有技术的联合模型可以处理的数据量的几个数量级。其次，如图4所示，这些信号具有挑战性的属性：非高斯噪声，有些信号采样频率高于其他信号，采样率甚至在给定信号内也变化很大，并且各个信号包含多个尺度的结构。

5.2.基线

为了了解所提出的模型的优点，将其与以下常用替代方案进行比较。1.因为原始数据集是高度不平衡的，所以发明人包括了所有经历败血性休克且每个信号具有至少两个观察结果的患者以及没有观察到休克的子采样患者以构建相对平衡的数据集。

1)MoGP：对于第一基线，发明人实施了用于对纵向数据和事件发生时间数据建模的两阶段生存分析方法。具体而言，发明人拟合MoGP，它提供高度灵活的拟合以输入缺失的数据。使用基于多变量GP的模型对生理数据进行建模的现有技术性能是可以实现的。但是，正如前面所讨论的那样(参见第3节)，它们的推理在记录数量上三次方地按比例放大；因此，使得不可能拟合本文考虑的数据集。这里，发明人使用第3节中描述的GP近似法来进行学习和推理。发明人使用根据拟合的MoGP的均值预测来计算等式(8)的危险函数的特征。使用该基线，发明人评估了稳健策略在多大程度上有助于改善预测性能，该稳健策略在估计事件概率时考虑了由于缺失纵向数据而导致的不确定性。

2)逻辑回归：对于第二基线，发明人使用时间序列分类方法。来自每个时间序列信号的记录被分入四小时的窗口；对于具有多个测量值的分组，发明人使用平均值。对于具有缺失值的分组，发明人使用协变量依赖性(年龄和体重)回归插补。来自所有信号的10个连续窗口的分组值被用作用于事件预测的逻辑回归(LR)分类器中的特征。L2正则化用于学习LR模型；使用对训练数据的2折交叉验证(2-fold cross-validation)来选择正则化权重。

3)SVM：对于第三基线，发明人用支持向量机(“SVM”)替换LR以试验更灵活的分类器。发明人使用RBF内核，并使用对训练数据的2折交叉验证来确定超参数。

要考虑的最终基线是现有技术的联合模型。如前所讨论，现有的联合建模方法需要为纵向数据假定参数函数：发明人使用多项式函数的初步实验给出了非常差的拟合，考虑到临床数据的复杂性，这并不奇怪(参见例如图4)。因此，发明人省略了该基线。

所有基线方法都提供在任何给定时间的事件概率的点估计值。因此，它们使用没有不确定性的稳健策略(等式(18)的策略)的特殊情况来进行事件预测。

评估：发明人计算了事件概率，并用Δ＝12小时预测范围作出了预测。为了避免对于具有较长住院时间的患者的报告偏差，出于评估的目的，发明人考虑了三天间隔内的五个等间隔时间点的预测，在休克发作或删失之前一小时结束。对于其余的患者，发明人评估他们住院期间的最后三天的预测。

为了评估，所有预测都是独立对待的。作为决策率的函数来报告分类器的性能，决策率是分类器选择作出决策的实例数；即，对相对成本项L₁、L₂和q(对于稳健策略而言)以及所记录的群体真阳性率(TPR)、群体假阳性率(FPR)和误警率(FA R)执行网格搜索。这些是和FA

为了确定结果的统计学意义，发明人对引导(boot-strap)样本大小为20的测试组执行非参数引导，并报告性能标准的平均和标准偏差。

5.3.数值结果

图4展示根据各种实施方案的来自患有败血性休克的患者和没有观察到休克的患者的观察信号的数据，以及以拟合纵向数据为条件的估计事件概率。来自10个信号(点)和纵向拟合(实线)的数据以及两个患者(患有败血性休克的402患者p1，没有观察到休克的404患者p2)的置信区间(阴影区域)。在右侧，发明人示出了以在左侧显示的每个患者的纵向数据为条件的随后五天时段的估计事件概率。

首先，定性地研究所提出的模型(在此称为J-LTM)对纵向数据建模并估计事件概率的能力。在图4中，示出了J-LTM对以下两个患者的所有10个信号实现的拟合：患有败血性休克的患者(患者p1)和未经历休克的患者(患者p2)。注意，HR、SBP和呼吸率(RR)是密集采样的；其他信号如动脉pH、尿量和PaO2长时间缺失(例如，对于患者p1，在第15天与第31天之间没有动脉pH和PaO2记录)。尽管他们的生理数据很复杂，但J-LTM可以很好地拟合数据。J-LTM捕获信号之间的相关性。例如，患者p2的呼吸率在第四天左右下降。RR的降低减慢了血液气体交换，继而导致PaO2降低，因为吸入的氧气较少。RR的降低也导致CO2在血液中积聚，从而导致动脉pH降低。此外，动脉pH的降低对应于酸度水平的增大，这导致精神状态(GCS)恶化。这些相关性可用于获得事件概率的更可靠估计。另请注意，J-LTM能稳健地抵御异常值。例如，在第5天对患者p1的一次动脉pH测量值显著大于在同一天内来自相同信号的其他测量值。此外，这种突然增大并未反映在任何其他信号中。因此，这种单一观察结果似乎是异常值，可能并不表示发生败血性休克的风险有任何变化。因此(且部分地由于重尾噪声模型)，当天动脉pH值的J-LTM预测不会受到这个单一异常值的影响。

图5示出根据各种实施方案的接收者操作特征(“ROC”)曲线，以及真阳性率(“TPR”)和假阳性率(“FPR”)曲线。如图所示，图5描绘了ROC曲线502，在每个FAR水平下获得的最大TPR 504，在任何固定FAR<0.4的决策率下实现的最佳TPR 506，以及在任何固定FAR<0.5的决策率下实现的最佳TPR 508。

接下来，定量评估J-LTM的性能。在图5中的502处描绘了J-LTM和基线方法(LR、SVM和MoGP)的ROC曲线(TPR对比FPR)。为了绘制每种方法的ROC曲线，对相对成本项L₁和L₂和q(对于稳健策略而言)进行网格搜索，并记录获得的FPR和TPR对。J-LTM实现的AUC为0.82(±0.02)，优于LR、SVM和MoGP，它们的AUC分别为0.78(±0.02)、0.79(±0.02)和0.78(±0.02)。如图5中的502所示，与基线方法相比，J-LTM的TPR增加主要发生在0.1-0.5的FPR范围内，该范围与实际使用最相关。特别是，在FPR＝0.15时，J-LTM恢复了群体中72％(±6)的阳性患者。在相同的FPR下，LR、SVM和MoGP的TPR分别为0.57(±0.04)、0.58(±0.05)和0.61(±0.05)。值得注意的是，为了进行公平比较，图5中在502处示出的TPR和FPR率是相对于群体而不是每种方法选择报警的实例子集来计算的。

此外，图5中的502比较了使用TPR和FPR的性能，但没有明确错误报警的数量。报警系统的性能标准是误警率(FAR)。分类器作出的每个阳性预测都可能促使临床医生到场和调查。因此，高误警率会增大临床医生的工作量并导致警报疲劳。理想的分类器以几乎没有误报警(低FAR)来检测败血性休克(高TPR)患者。图5中的504绘制了对于J-LTM和基线而言在每个FAR水平下获得的最大TPR。在任何TPR下，J-LTM的FAR显著低于所有基线的FAR。特别是，在TPR范围为0.6至0.8的情况下，J-LTM显示FAR比次最佳基线提高6％至16％。从实际的角度来看，16％的FAR降低可以相当于每天节省数小时。

为了进一步详细说明这种比较，作为决策数量的函数(即，在1时，所有模型都选择对每个实例作出决策)，检查每种方法的TPR和FAR。在给定的决策率下，每个模型都可以放弃不同的患者子集。图5在506和508处描绘了对于最大FAR的两个不同设置，在任何给定决策率下实现的最佳TPR。在图5中的506处，例如，在每个放弃率下，绘制了对于误警率小于40％的每个模型实现的最佳TPR。在所有决策率下，J-LTM实现了比基线方法明显更高的TPR。换句话说，在任何给定的决策率下，J-LTM能够更准确地识别可以对其进行预测的实例子集。在图5中的508处示出了类似的图：在所有决策率下，J-LTM的FAR<0.5时的最大TPR是0.66(±0.05)。在相同FAR水平下，这显著大于LR(0.41(±0.06))、SVM(0.33(±0.05))和MoGP(0.18(±0.14))的最佳TPR。一个自然要问的问题是报告的TPR是否足够实用。最好的标准护理工具无需放弃即可实现LR基线。这对应于图5中506和508处决策率为1时的LR的性能。如图所示，对于两个FAR设置，J-LTM实现的TPR增益很大。

6.报告技术和用户界面

图6-9是适合于提供用户界面和患者报告的用户设备的示例屏幕截图。例如，这种用户设备可以实现为图11的用户计算机1102。在使用中，这种用户设备可以由医生或其他医疗专业人员携带。用户设备可以用于将经验数据(诸如患者化验结果)输入到一些实施方案的系统中。此外，用户设备还可以提供患者报告，并且如果预测到不良事件，则提供警报。

图6是根据各种实施方案的患者状态列表的移动设备屏幕截图600。屏幕截图600包括反映以下患者的患者状态的部分：最有可能发生医疗不良事件风险的患者，处于急诊室的患者，以及处于重症监护病房的患者。由实施方案确定的可能经历即将发生的医疗不良事件的患者的条目(例如，检测器对相应患者作出阳性预测；对于某个时间间隔Δ诸如两小时，超过某个阈值，诸如20％；或者患者的TREWScore超过某个阈值)被标记为“有风险”或以其他方式突出显示。

图7是根据各种实施方案的患者警报的移动设备屏幕截图700。根据一个实施方案，当确定患者存在发生医疗不良事件的风险时(例如，检测器对相应患者作出阳性预测；对于某个时间间隔Δ诸如两小时，超过某个阈值，诸如20％；或患者的TREWScore超过某个阈值)，用户设备可以显示警报，可能伴有声音和/或触觉报告。警报可以指定患者并包括基本信息，诸如患者的TREWScore。警报可以为医疗专业人员提供打开下文参考图9详细描述的治疗束的能力。

图8是根据各种实施方案的单个体患者报告的移动设备屏幕截图800。该单个患者报告包括对患者风险的描述，例如患者的TREWScore。该报告可以包括患者最近的生命体征和实验室报告中的任一个或全部。通常，可以表示和阐述任何纵向数据类型。

图9是根据各种实施方案的治疗束的移动设备屏幕截图900。治疗束指定要进行的一组实验室检测以及为阻止医疗不良事件而采取的治疗措施。激活后，治疗束会向医疗专业人员(以及团队中的其他人)发出警报，以进行实验室检测或采取治疗措施。

7.结论

图10是根据各种实施方案的方法1000的流程图。方法1000可以由诸如图11的系统1100之类的系统来执行。

在框1002处，方法1000获得多个全局化验结果，所述多个全局化验结果包括对于多个患者中的每一个和多种化验类型中的每一种而言的多个患者化验结果。本文例如参考患者记录的训练集描述了该框的动作。所述多个全局化验结果可包括超过100,000个化验结果。

在框1004处，方法1000按比例放大所述多个全局化验结果的至少一部分的模型以产生纵向事件模型。该框的动作如本文所公开，例如，在3.1节中公开。

在框1006处，方法1000对于多个患者中的每一个并根据纵向事件模型，确定危险函数。该框的动作在本文公开，例如在3.2节中公开。

在框1008处，方法1000生成联合模型。该框的动作在本文公开，例如，在3.3节中公开。

在框1010处，方法1000对于多种化验类型中的每一种，获得患者的多个新患者化验结果。在本文中公开了该框的动作。

在框1012处，方法1000将新患者的联合模型应用于新的患者化验结果。该框的动作在本文公开，例如在4节中公开。

在框1014处，方法1000获得新患者可能会经历即将发生的医疗不良事件的指示。该框的动作在本文公开，例如在4节中公开。

在框1016处，方法1000向医疗专业人员发送消息，指示新患者可能会经历医疗不良事件。该框的动作在本文公开，例如在6节中公开。

图11是适用于实现本发明的一些实施方案的计算机通信系统的示意图。系统1100可以基于电子硬件互联网服务器计算机1106，该计算机可以通信地耦合到网络1104。网络1104可以是内联网、广域网、互联网、无线数据网络或另一种网络。服务器计算机1106包括网络接口1108以影响到网络1104的通信耦合。网络接口1108可以包括物理网络接口，诸如网络适配器或天线，后者用于无线通信。服务器计算机1106可以是适于可靠性和高带宽通信的专用计算机。因此，例如，服务器计算机1106可以体现在各个硬件服务器计算机的集群中。替代性地或除此之外，服务器计算机1106可包括冗余电源。永久存储器1112可以采用廉价磁盘驱动器冗余阵列(RAID)配置，以提高可靠性，而易失性存储器1114可以是或包括纠错码(ECC)存储器硬件设备。服务器计算机1106还包括一个或多个电子处理器1110，所述处理器可以是适合于处理大量信息的多核处理器。电子处理器1110通信地耦合到永久存储器1112，并且可以执行存储在其上的指令以实现本文公开的技术，例如，参考图10所示和所述的方法1000。电子处理器1110还通信地耦合到易失性存储器1114。

服务器计算机1106经由网络1104与用户计算机1102通信。用户计算机1102可以是移动或固定计算设备。因此，用户计算机1102可以是智能电话、平板电脑、膝上型电脑或台式计算机。为进行无线通信，用户计算机1102可以经由诸如WiFi之类的无线协议或相关标准通信地耦合到服务器计算机1106。用户计算机1102可以是医疗专业人员的移动设备，该移动设备发送和接收信息，特别是如本文参考图6-9所示和所述的。

总而言之，公开了一种用于通过结合由于纵向数据中的缺失引起的不确定性来提高事件预测的可靠性的概率框架。该方法包括若干创新。首先，提出了一种灵活的贝叶斯非参数模型，用于对高维、连续值纵向数据和事件发生时间数据联合建模。为了便于扩展到大型数据集，使用了利用稀疏GP技术的随机变分推理算法；这显著降低了用于从O(N³D³)到O(NDM²)的联合建模的推理的复杂性。与联合建模中的现有技术相比，所公开的方法可以扩展到大几个数量级的数据集，而不会影响模型可表达性。使用联合模型使得能够以不规则采样的纵向数据为条件来计算事件概率。其次，公开了一种用于事件预测的策略，该策略结合了与事件概率相关联的不确定性，以在警报可能不正确时放弃作出决策。对于预测即将发生的院内不良事件的重要且具有挑战性的任务，发明人已经证明所公开的模型可以按比例扩展到每个患者具有许多测量值的时间序列，估计良好拟合，以及相对于现有技术替代方案显著改善事件预测的性能。

可以使用一种计算机程序或一组程序来执行某些实施方案。计算机程序可以以活动和非活动的各种形式存在。例如，计算机程序可以作为以下形式存在：由源代码、目标代码、可执行代码或其他格式的程序指令组成的软件程序，固件程序，或硬件描述语言(HDL)文件。以上任何内容都可以以压缩或非压缩形式体现在包括存储设备和信号的暂时性或非暂时性计算机可读介质上。示例性计算机可读存储设备包括常规计算机系统RAM(随机存取存储器)、ROM(只读存储器)、EPROM(可擦除可编程ROM)、EEPROM(电可擦除可编程ROM)以及磁盘或光盘或磁带。

虽然已经参考本发明的示例性实施方案描述了本发明，但是本领域技术人员将能够在不脱离真实精神和范围的情况下对所描述的实施方案进行各种修改。本文使用的术语和描述仅以说明的方式提出，并不意味着限制。特别地，尽管已经通过示例描述了该方法，但是该方法的步骤可以以与图示的顺序不同的顺序执行或同时执行。本领域技术人员将认识到，在所附权利要求及其等同物所限定的精神和范围内，这些和其他变化是可能的。

Claims

1.一种预测即将发生的医疗不良事件的方法，所述方法包括：

获得多个全局化验结果，所述多个全局化验结果包括，对于多个患者中的每一个和多种化验类型中的每一种，在第一时间间隔内获得的多个患者化验结果；

由至少一个电子处理器按比例放大所述多个全局化验结果的至少一部分的模型，由此获得包括至少一个随机变量的纵向事件模型；

由至少一个电子处理器，对于所述多个患者中的每一个并且根据所述纵向事件模型，确定包括至少一个随机变量的危险函数，其中每个危险函数以直至给定时间相应患者未发生不良事件的信息为条件，指示在所述给定时间所述相应患者发生不良事件的可能性；

由至少一个电子处理器，对于所述多个患者中的每一个，生成包括所述纵向事件模型和从所述危险函数生成的事件发生时间模型的联合模型，每个联合模型指示在给定时间间隔内发生不良事件的可能性；

对于新患者和多种化验类型中的每一种，获得在第二时间间隔内获得的多个新患者化验结果；

由至少一个电子处理器将所述联合模型应用于在所述第二时间间隔获得的所述多个新患者化验结果；

根据所述联合模型，获得所述新患者可能在第三时间间隔内经历即将发生的医疗不良事件的指示；以及

向所述新患者的护理提供者发送电子消息，指示所述新患者可能经历即将发生的医疗不良事件。

2.如权利要求1所述的方法，其中所述医疗不良事件是败血症。

3.如权利要求1所述的方法，其中所述多种化验类型包括肌酐水平。

4.如权利要求1所述的方法，其中所述发送包括向所述新患者的护理提供者的移动电话发送消息。

5.如权利要求1所述的方法，其中一起学习所述纵向事件模型和所述事件发生时间模型。

6.如权利要求1所述的方法，还包括将检测器应用于所述联合模型，其中所述检测器的输出被限制为：是、否和放弃。

7.如权利要求1所述的方法，其中所述纵向事件模型提供关于预测的化验参数水平的置信区间。

8.如权利要求1所述的方法，其中所述生成包括联合学习所述纵向事件模型和所述事件发生时间模型。

9.如权利要求1所述的方法，其中所述按比例放大包括将稀疏变分推理技术应用于所述多个全局化验结果的至少一部分的所述模型。

10.如权利要求1所述的方法，其中所述按比例放大包括应用以下各项之一：

用于推断关于所述多个全局化验结果的不确定性的基于可扩展优化的技术，

用于推断关于所述多个全局化验结果的不确定性的基于采样的技术，

用于推断关于所述多个全局化验结果的不确定性的具有可扩展精确或近似推理算法的概率方法，或者

用于推断关于所述多个全局化验结果的不确定性的基于多重插补的方法。

11.一种用于预测即将发生的医疗不良事件的系统，所述系统包括至少一个移动设备以及通信地耦合到至少一个电子处理器和所述至少一个移动设备的至少一个电子服务器计算机，其中所述至少一个电子处理器执行指令以执行包括以下方面的操作：

由至少一个电子处理器将所述联合模型应用于在所述第二时间间隔内获得的所述多个新患者化验结果；

向所述移动设备发送电子消息，指示所述新患者可能经历即将发生的医疗不良事件。

12.如权利要求11所述的系统，其中所述医疗不良事件是败血症。

13.如权利要求11所述的系统，其中所述多种化验类型包括肌酐水平。

14.如权利要求11所述的系统，其中所述移动设备包括所述新患者的护理提供者的移动电话。

15.如权利要求11所述的系统，其中一起学习所述纵向事件模型和所述事件发生时间模型。

16.如权利要求11所述的系统，其中所述操作还包括将检测器应用于所述联合模型，其中所述检测器的输出被限制为：是、否和放弃。

17.如权利要求11所述的系统，其中所述纵向事件模型提供关于预测的化验参数水平的置信区间。

18.如权利要求11所述的系统，其中所述生成包括联合学习所述纵向事件模型和所述事件发生时间模型。

19.如权利要求11所述的系统，其中所述按比例放大包括将稀疏变分推理技术应用于所述多个全局化验结果的至少一部分的所述模型。

20.如权利要求11所述的系统，其中所述按比例放大包括应用以下各项之一：