CN112908480A - 器官衰竭的预警方法、系统、电子设备及存储介质 - Google Patents

器官衰竭的预警方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112908480A
CN112908480A CN202110285405.4A CN202110285405A CN112908480A CN 112908480 A CN112908480 A CN 112908480A CN 202110285405 A CN202110285405 A CN 202110285405A CN 112908480 A CN112908480 A CN 112908480A
Authority
CN
China
Prior art keywords
case
organ failure
characteristic data
positive
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110285405.4A
Other languages
English (en)
Inventor
赖志明
林志哲
薛佩姣
薛佳佳
蒋劲峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Electric Group Corp
Original Assignee
Shanghai Electric Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Electric Group Corp filed Critical Shanghai Electric Group Corp
Priority to CN202110285405.4A priority Critical patent/CN112908480A/zh
Publication of CN112908480A publication Critical patent/CN112908480A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种器官衰竭的预警方法、系统、电子设备及存储介质。其中,预警方法包括:提取目标病例的特征数据;将所述特征数据输入器官衰竭预警模型,以输出所述目标病例在预设时长之后器官衰竭阳性的发作概率;其中,所述器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到。本发明的器官衰竭的预警方法能够根据目标病例的特征数据预测该目标病例在预设时长之后器官衰竭阳性的发作概率,进而能够有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。

Description

器官衰竭的预警方法、系统、电子设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种器官衰竭的预警方法、系统、电子设备及存储介质。
背景技术
器官衰竭,或称多器官衰竭、多脏器功能衰竭,是一种病因繁多、发病机制复杂、病死率极高的临床综合征,是指机体在经受严重损害(如严重疾病、外伤、手术、感染、休克等)后,发生两个或两个以上器官功能障碍,甚至功能衰竭的综合征。据相关文献报道,累及1个器官衰竭的病死率为30%,累及2个器官衰竭的病死率为50%-60%,累及3个以上器官衰竭的病死率为72%-100%。及早的诊断和及时的干预治疗是降低器官衰竭病死率的重要途径和方法,但是,由于器官衰竭发病早期的症状比较隐匿,并且当前技术难以提前对器官衰竭进行准确地风险评估,也就难以实现器官衰竭的及早诊断与及早干预治疗。
发明内容
本发明要解决的技术问题是为了克服现有技术中难以提前对器官衰竭进行准确地风险评估的缺陷,提供一种器官衰竭的预警方法、系统、电子设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种器官衰竭的预警方法,包括:
提取目标病例的特征数据;
将所述特征数据输入器官衰竭预警模型,以输出所述目标病例在预设时长之后器官衰竭阳性的发作概率;
其中,所述器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练,所述阳性病例特征数据包括在预测时刻之前采集到的特征数据,所述预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长。
较佳地,所述器官衰竭预警模型通过以下步骤训练得到:
将所述阳性病例特征数据划分为与多个年龄段对应的分组阳性病例特征数据;
将所述阴性病例特征数据划分为与多个所述年龄段对应的分组阴性病例特征数据;
从每一所述分组阳性病例特征数据中提取预设比例的阳性病例特征数据,并从每一所述阴性病例特征数据中提取所述预设比例的阴性病例特征数据,来构建特征数据集;
利用所述特征数据集训练得到所述器官衰竭预警模型;
其中,所述特征数据集包括训练集、测试集与验证集中的至少一种。
较佳地,所述利用所述特征数据集训练得到所述器官衰竭预警模型的步骤包括:
打乱所述特征数据集;
利用打乱后的所述特征数据集训练得到所述器官衰竭预警模型。
较佳地,所述阳性病例特征数据的提取条件包括:
符合阳性病例的确定条件;
所述阳性病例的发作时刻位于进入当前ICU(Intensive Care Unit,重症监护室)的第一指定时长之后;
所述阳性病例在之前的ICU中未被确定为阳性病例;
所述阳性病例的年龄不小于年龄阈值;
所述阴性病例特征数据的提取条件包括:
符合阴性病例的确定条件;
所述阴性病例在当前ICU内的任意连续第二指定时长内的SOFA(SequentialOrgan Failure Assessment,序贯器官衰竭估计评分)分值的最大变化量不超过SOFA阈值;
所述阴性病例在当前ICU内的停留时间超过第三指定时长;
所述阴性病例的ICD9(The International Classification of Diseases,国际疾病分类)诊断码中不含有器官衰竭的病症代码;
所述阴性病例的年龄不小于年龄阈值。
较佳地,通过以下步骤判断是否符合阳性病例的确定条件以及是否符合阴性病例的确定条件:
获取多组病例原始数据;
判断所述病例原始数据对应的病例是否属于器官衰竭的疑似病例;
若属于疑似病例,则确定所述病例的疑似感染时刻,然后判断所述病例的SOFA分值在包括所述疑似感染时刻的预设时间范围内的最大变化量是否大于所述SOFA阈值;
若大于所述SOFA阈值,则确定所述病例符合阳性病例的确定条件,并确定所述阳性病例器官衰竭阳性的发作时刻;
若不属于疑似病例,或者,不大于所述SOFA阈值,则确定所述病例符合阴性病例的确定条件。
较佳地,所述阳性病例特征数据和所述阴性病例特征数据均包括多个特征字段的数据;
所述阳性病例特征数据通过以下步骤提取得到:
从所述阳性病例对应的病例原始数据中提取阳性病例特征数据;
利用第一筛选规则筛选所述阳性病例特征数据;
所述第一筛选规则包括:所述阳性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阳性病例特征数据中有效的特征字段的数量不小于第一阈值;
所述阴性病例特征数据通过以下步骤提取得到:
从所述阴性病例对应的病例原始数据中提取阴性病例特征数据;
利用第二筛选规则筛选所述阴性病例特征数据;
所述第二筛选规则包括:所述阴性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阴性病例特征数据中有效的特征字段的数量不小于第二阈值;
其中,所述第一阈值不小于所述第二阈值。
较佳地,所述预设时长的取值范围为1小时至5小时;
和/或,所述第一指定时长取值为5小时;
和/或,所述年龄阈值取值为18周岁;
和/或,所述第二指定时长取值为72小时;
和/或,所述SOFA阈值取值为1分;
和/或,所述第三指定时长取值为5小时;
和/或,所述器官衰竭的病症代码包括:785.52,995.91,995.92。
一种器官衰竭的预警系统,包括:
提取模块,用于提取目标病例的特征数据;
预警模块,用于将所述特征数据输入器官衰竭预警模型,以输出所述目标病例在预设时长之后器官衰竭阳性的发作概率;
其中,所述器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到,所述阳性病例特征数据包括在预测时刻之前采集到的特征数据,所述预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种器官衰竭的预警方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种器官衰竭的预警方法的步骤。
本发明的积极进步效果在于:本发明中的器官衰竭预警模型能够根据目标病例的特征数据预测该目标病例在预设时长之后器官衰竭阳性的发作概率,进而能够有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。
附图说明
图1为根据本发明实施例1的器官衰竭的预警方法的流程图。
图2为根据本发明实施例1的器官衰竭的预警方法中确认阳性病例与阴性病例的流程图。
图3为根据本发明实施例1的器官衰竭的预警方法中疑似感染时刻的确定示意图。
图4为根据本发明实施例1的器官衰竭的预警方法中发作时刻的确定示意图。
图5为根据本发明实施例1的器官衰竭的预警方法中训练器官衰竭预警模型的流程图。
图6为根据本发明实施例2的器官衰竭的预警系统的模块示意图。
图7为根据本发明实施例3的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种器官衰竭的预警方法,参照图1,本实施例的预警方法包括:
S11、提取目标病例的特征数据;
S12、将特征数据输入器官衰竭预警模型,以输出目标病例在预设时长之后器官衰竭阳性的发作概率。
在本实施例中,器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到。其中,阳性病例特征数据包括在预测时刻之前采集到的特征数据,预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长,例如,为了预测2小时之后器官衰竭阳性的发作概率,有病例A器官衰竭阳性的发作时刻为某日12点,则有预测时刻为该日10点并且有获取病例A在该日10点之前采集到的特征数据作为训练数据;有病例B器官衰竭阳性的发作时刻为某日17点,则有预测时刻为该日15点并且有获取病例B在该日15点之前采集到的特征数据作为训练数据。
在本实施例中,器官衰竭预警模型用于根据目标病例的特征数据预测目标病例在预设时长之后器官衰竭阳性的发作概率,也即,能够提前预设时长对器官衰竭阳性的发作概率进行预测,其中,预设时长可以根据实际应用自定义设置,例如,预设时长的取值范围可以为1小时至5小时,进一步地,预设时长可以取值为1小时,2小时,3小时,4小时,5小时等,从而有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。当训练多个分别对应不同预设时长的器官衰竭预警模型时,利用当前采集到的特征数据,即能够预测未来多个时刻器官衰竭阳性的发作概率。
进一步地,在本实施例中,用于训练器官衰竭预警模型的阳性病例特征数据的提取条件包括:
符合阳性病例的确定条件;
阳性病例的发作时刻位于进入当前ICU的第一指定时长之后;
阳性病例在之前的ICU中未被确定为阳性病例;
阳性病例的年龄不小于年龄阈值。
在本实施例中,用于训练器官衰竭预警模型的阴性病例特征数据的提取条件包括:
符合阴性病例的确定条件;
阴性病例在当前ICU内的任意连续第二指定时长内的SOFA分值的最大变化量不超过SOFA阈值;
阴性病例在当前ICU内的停留时间超过第三指定时长;
阴性病例的ICD9诊断码中不含有器官衰竭的病症代码;
阴性病例的年龄不小于年龄阈值。
具体地,在本实施例中,提取条件中的第一指定时长、年龄阈值、第二指定时长、SOFA阈值、第三指定时长等可以根据实际应用自定义设置,例如,在本实施例中,第一指定时长优选取值为5小时,年龄阈值优选取值为18周岁,第二指定时长优选取值为72小时,SOFA阈值优选取值为1分,第三指定时长优选取值为5小时。至于器官衰竭的病症代码,通过查表可知包括:785.52,995.91,995.92。
具体地,参照图2,本实施例中可以通过以下步骤判断是否符合阳性病例或阴性病例的确定条件:
S21、获取多组病例原始数据;
S22、判断病例原始数据对应的病例是否属于器官衰竭的疑似病例;
若是,则执行步骤S23-S24;若否,则执行步骤S26;
S23、确定病例的疑似感染时刻;
S24、判断病例的SOFA分值在包括疑似感染时刻的预设时间范围内的最大变化量是否大于SOFA阈值;
若是,则执行步骤S25;若否,则执行步骤S26;
S25、确定病例符合阳性病例的确定条件,并确定阳性病例器官衰竭阳性的发作时刻;
S26、确定病例符合阴性病例的确定条件。
在本实施例中,多组病例原始数据可以从MIMIC(Medical Information Mart forIntensive Care,重症医学数据库)公共数据集获取得到,其中,MIMIC是麻省理工下属管理的一个公共临床数据库,包含2001年~2012年在Beth Israel Deaconess医疗中心重症监护室中住院的46520位病人的医疗数据及58976次住院记录,具体涵盖的内容包括人口统计资料、床旁生命体征、实验室检查结果、手术、用药、监护记录、影像报告和死亡情况(包括院内和院外)等。在本实施例中,优选采用共包括26个CSV(Comma-Separated Values,逗号分隔值)格式的表格的MIMIC-III v1.4数据集。
在本实施例中,优选通过SQL(Structured Query Language,结构化查询语言)语言对数据集进行数据提取和整理,并且在此之前,还优选对数据集进行预处理。具体地,预处理旨在基于上述多个表格,整合得到包括病例出入院时间、所需抗生素名称、抗生素服用和体液培养情况以及病例的各种基础信息的一个表格,并且,预处理还涉及对数据集中异常值的忽略,重复数据的合并,矛盾数据的处理以及缺失值的填补等。
在本实施例中,步骤S22中器官衰竭疑似病例的确定条件优选包括抗生素服用和体液培养呈阳性这两方面,具体地,如果某病例服用了抗生素,并且在抗生素服用的前24小时到后72小时内有体液培养,且结果呈阳性,则确定该病例属于器官衰竭的疑似病例。
进一步地,在本实施例步骤S23中,优选将抗生素服用和体液培养这二者中较早发生的时刻确定为该病例的疑似感染时刻,具体如图3所示,即,t_sus=min{t_abx,t_cul},if t_abx-24h≤t_cul≤t_abx+72h,其中,t_abx为抗生素服用时刻,t_cul为体液培养时刻,t_sus为疑似感染时刻,h表示小时。
进一步地,在本实施例步骤S24中,结合SOFA分值来确定疑似感染器官衰竭的病例在预设时间范围内是否器官衰竭阳性发作,其中,SOFA分值计算标准如表1所示:
表1:SOFA分值计算标准
Figure BDA0002980255770000081
在本实施例中,预设时间范围与SOFA阈值可以根据实际应用自定义设置,例如,预设时间范围可以设置为疑似感染时刻的前48小时到后24小时,SOFA阈值可以取值为1,具体地,在预设时间范围内,如果有某个小时的SOFA分值比之前最低的SOFA分值提高了至少2分,则确定对应的病例在预设时间范围内器官衰竭阳性发作,就确定对应的病例符合阳性病例的确定条件,也即,将对应的病例确定为阳性病例,并将首个满足这个条件的小时的开始时刻确定为该阳性病例的发作时刻tonset,具体如图4所示。此外,不符合阳性病例的确定条件的病例,即确认其符合阴性病例的确定条件,也即,将其确定为阴性病例。
本实施例中器官衰竭阳性病例的确定,在需存在多器官功能衰竭现象的同时,还需疑似感染器官衰竭,提高了所确定的阳性病例的准确性,从而有利于提高本实施中器官衰竭预警模型预测结果的准确性。
在本实施例中,阳性病例特征数据和阴性病例特征数据均包括多个特征字段的数据,其中,特征字段的数量和类型可以根据实际应用自定义设置。在本实施例中,阳性病例特征数据和阴性病例特征数据优选均包括床旁数据、实验室数据和人口学数据等如表2所示的共79个特征字段。
表2:79个特征字段
Figure BDA0002980255770000091
Figure BDA0002980255770000101
本实施例在提取阳性特征病例特征数据与阴性病例特征数据时,优选提取各阳性病例与各阴性病例在ICU停留时间内,各特征字段在各采集周期内的最小值、平均值、中位数和最大值,其中,采集周期可以根据实际应用自定义设置,例如,本实施例中采集周期可以取值为1小时。进一步地,如果存在某个采集周期没有数据,则优选使用上一采集周期的数据填充,如果仍然没有数据,则使用所有病例对应的中位数填充。在本实施例中,将除使用中位数填充的特征字段之外的其他特征字段视作有效的特征字段。
本实施例优选通过从阳性病例对应的病例原始数据中提取阳性病例特征数据的步骤,以及利用第一筛选规则筛选阳性病例特征数据的步骤来提取阳性病例特征数据,其中,第一筛选规则可以根据实际应用自定义设置。在本实施例中,第一筛选规则优选包括:阳性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阳性病例特征数据中有效的特征字段的数量不小于第一阈值,其中,第一阈值可以根据实际应用自定义设置,以筛选出有效的特征字段充足的特征数据。在特征字段的数量为79时,本实施例中的第一阈值优选取值为55。
本实施例优选通过从阴性病例对应的病例原始数据中提取阴性病例特征数据的步骤,以及利用第二筛选规则筛选阴性病例特征数据的步骤来提取阴性病例特征数据,其中,第二筛选规则可以根据实际应用自定义设置。在本实施例中,第二筛选规则优选包括:阴性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阴性病例特征数据中有效的特征字段的数量不小于第二阈值,其中,第二阈值可以根据实际应用自定义设置,以筛选出有效的特征字段充足的特征数据。在特征字段的数量为79时,本实施例中的第二阈值优选取值为45。
在本实施例中,预设数量可以根据实际应用自定义设置,例如,本实施例中的预设数量可以取值为5,也即,本实施例中的器官衰竭预警模型旨在根据至少连续5个小时的特征数据来预测预设时长之后对应病例器官衰竭阳性的发作概率。
参见表2,本实施例中的特征字段包括年龄字段,为了使得本实施例的器官衰竭预警模型能够适用于不同年龄段的潜在病例,而不仅仅适用于老年病例,本实施例中年龄字段的取值优选不小于18周岁。
进一步地,在本实施例中,可以按照年龄字段的取值对阳性病例特征数据和阴性病例特征数据进行分组,其中,年龄段的具体划分方式可以根据实际应用自定义设置,例如,在本实施例中,多个年龄段可以包括:[18,40),[40,50),[50,60),[60,70),[70,80),[80,∞)。
在本实施例中,参照图5,训练器官衰竭预警模型的步骤具体可以包括:
S51、将阳性病例特征数据划分为与多个年龄段对应的分组阳性病例特征数据;
S52、将阴性病例特征数据划分为与多个年龄段对应的分组阴性病例特征数据;
S53、从每一分组阳性病例特征数据中提取预设比例的阳性病例特征数据,并从每一阴性病例特征数据中提取预设比例的阴性病例特征数据,来构建特征数据集;
S54、利用特征数据集训练得到器官衰竭预警模型。
在本实施例中,不同年龄段对应的预设比例相同,有利于保持特征数据集中的年龄平衡,从而有利于提高器官衰竭预警模型对潜在的所有病例的适用性。进一步地,为了提高器官衰竭预警模型的鲁棒性,步骤S54优选包括打乱特征数据集的步骤,使得特征数据集中各阳性病例特征数据和隐形病例特征数据乱序排放,以及利用打乱后的特征数据集训练得到器官衰竭预警模型的步骤。基于此,增强了本实施例的器官衰竭预警模型的泛化能力。
此外,在本实施例中,特征数据集包括训练集、测试集与验证集中的至少一种。具体地,在本实施例中,特征数据集优选同时包括训练集、测试集与验证集,其中,训练集用于训练模型参数,验证集用于选择超参,测试集用于测试结果。并且,在本实施例中,优选按照0.7的预设比例提取训练集,按照0.2的预设比例提取测试集,按照0.1的预设比例提取验证集。
本实施例中优选采用集成学习的方法来训练器官衰竭预警模型,具体地,在预设时长具体取值为1小时、2小时、3小时、4小时以及5小时时,也即,在器官衰竭预警模型分别能够提前1小时、2小时、3小时、4小时以及5小时对器官衰竭阳性的发作概率进行预测时,其指标结果如表3所示。
表3:模型指标结果
提前小时数 测试集ACC 测试集AUC 测试集SENS 测试集SPEC
1 0.8892 0.9839 0.8090 0.9693
2 0.8954 0.9840 0.8192 0.9717
3 0.8950 0.9825 0.8255 0.9646
4 0.9075 0.9833 0.8491 0.9660
5 0.9076 0.9848 0.8420 0.9733
表3中各指标的说明如表4所示:
表4:指标说明
Figure BDA0002980255770000131
本实施例中的器官衰竭预警模型能够根据目标病例的特征数据预测该目标病例在预设时长之后器官衰竭阳性的发作概率,进而能够有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。此外,本实施例的器官衰竭预警模型,可以不依赖于标准数据模板,而适用于各医院或机构的数据处理。
实施例2
本实施例提供一种器官衰竭的预警系统,参照图6,本实施例的预警系统包括:
提取模块1,用于提取目标病例的特征数据;
预警模块2,用于将特征数据输入器官衰竭预警模型,以输出目标病例在预设时长之后器官衰竭阳性的发作概率。
在本实施例中,器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到。其中,阳性病例特征数据包括在预测时刻之前采集到的特征数据,预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长,例如,为了预测2小时之后器官衰竭阳性的发作概率,有病例A器官衰竭阳性的发作时刻为某日12点,则有预测时刻为该日10点并且有获取病例A在该日10点之前采集到的特征数据作为训练数据;有病例B器官衰竭阳性的发作时刻为某日17点,则有预测时刻为该日15点并且有获取病例B在该日15点之前采集到的特征数据作为训练数据。
在本实施例中,器官衰竭预警模型用于根据目标病例的特征数据预测目标病例在预设时长之后器官衰竭阳性的发作概率,也即,能够提前预设时长对器官衰竭阳性的发作概率进行预测,其中,预设时长可以根据实际应用自定义设置,例如,预设时长的取值范围可以为1小时至5小时,进一步地,预设时长可以取值为1小时,2小时,3小时,4小时,5小时等,从而有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。当训练多个分别对应不同预设时长的器官衰竭预警模型时,利用当前采集到的特征数据,即能够预测未来多个时刻器官衰竭阳性的发作概率。
进一步地,在本实施例中,用于训练器官衰竭预警模型的阳性病例特征数据的提取条件包括:
符合阳性病例的确定条件;
阳性病例的发作时刻位于进入当前ICU的第一指定时长之后;
阳性病例在之前的ICU中未被确定为阳性病例;
阳性病例的年龄不小于年龄阈值。
在本实施例中,用于训练器官衰竭预警模型的阴性病例特征数据的提取条件包括:
符合阴性病例的确定条件;
阴性病例在当前ICU内的任意连续第二指定时长内的SOFA分值的最大变化量不超过SOFA阈值;
阴性病例在当前ICU内的停留时间超过第三指定时长;
阴性病例的ICD9诊断码中不含有器官衰竭的病症代码;
阴性病例的年龄不小于年龄阈值。
具体地,在本实施例中,提取条件中的第一指定时长、年龄阈值、第二指定时长、SOFA阈值、第三指定时长等可以根据实际应用自定义设置,例如,在本实施例中,第一指定时长优选取值为5小时,年龄阈值优选取值为18周岁,第二指定时长优选取值为72小时,SOFA阈值优选取值为1分,第三指定时长优选取值为5小时。至于器官衰竭的病症代码,通过查表可知包括:785.52,995.91,995.92。
具体地,本实施例中可以通过以下单元来判断是否符合阳性病例或阴性病例的确定条件:
获取单元,用于获取多组病例原始数据;
第一判断单元,用于判断病例原始数据对应的病例是否属于器官衰竭的疑似病例;若是,则调用第一确定单元和第二判断单元;若否,则调用第三确定单元;
第一确定单元,用于确定病例的疑似感染时刻;
第二判断单元,用于判断病例的SOFA分值在包括疑似感染时刻的预设时间范围内的最大变化量是否大于SOFA阈值;若是,则调用第二确定单元;
第二确定单元,用于确定病例符合阳性病例的确定条件,并确定阳性病例器官衰竭阳性的发作时刻;
第三确定单元,用于确定病例符合阴性病例的确定条件。
在本实施例中,多组病例原始数据可以从MIMIC(Medical Information Mart forIntensive Care,重症医学数据库)公共数据集获取得到,其中,MIMIC是麻省理工下属管理的一个公共临床数据库,包含2001年~2012年在Beth Israel Deaconess医疗中心重症监护室中住院的46520位病人的医疗数据及58976次住院记录,具体涵盖的内容包括人口统计资料、床旁生命体征、实验室检查结果、手术、用药、监护记录、影像报告和死亡情况(包括院内和院外)等。在本实施例中,优选采用共包括26个CSV(Comma-Separated Values,逗号分隔值)格式的表格的MIMIC-III v1.4数据集。
在本实施例中,优选通过SQL(Structured Query Language,结构化查询语言)语言对数据集进行数据提取和整理,并且在此之前,还优选对数据集进行预处理。具体地,预处理旨在基于上述多个表格,整合得到包括病例出入院时间、所需抗生素名称、抗生素服用和体液培养情况以及病例的各种基础信息的一个表格,并且,预处理还涉及对数据集中异常值的忽略,重复数据的合并,矛盾数据的处理以及缺失值的填补等。
在本实施例中,器官衰竭疑似病例的确定条件优选包括抗生素服用和体液培养呈阳性这两方面,具体地,如果某病例服用了抗生素,并且在抗生素服用的前24小时到后72小时内有体液培养,且结果呈阳性,则确定该病例属于器官衰竭的疑似病例。
进一步地,在本实施例中,优选将抗生素服用和体液培养这二者中较早发生的时刻确定为该病例的疑似感染时刻,具体如图3所示,即,t_sus=min{t_abx,t_cul},if t_abx-24h≤t_cul≤t_abx+72h,其中,t_abx为抗生素服用时刻,t_cul为体液培养时刻,t_sus为疑似感染时刻,h表示小时。
进一步地,第二判断单元结合SOFA分值来确定疑似感染器官衰竭的病例在预设时间范围内是否器官衰竭阳性发作,其中,SOFA分值计算标准如表1所示。
在本实施例中,预设时间范围与SOFA阈值可以根据实际应用自定义设置,例如,预设时间范围可以设置为疑似感染时刻的前48小时到后24小时,SOFA阈值可以取值为1,具体地,在预设时间范围内,如果有某个小时的SOFA分值比之前最低的SOFA分值提高了至少2分,则确定对应的病例在预设时间范围内器官衰竭阳性发作,就确定对应的病例符合阳性病例的确定条件,也即,将对应的病例确定为阳性病例,并将首个满足这个条件的小时的开始时刻确定为该阳性病例的发作时刻tonset,具体如图4所示。此外,不符合阳性病例的确定条件的病例,即确认其符合阴性病例的确定条件,也即,将其确定为阴性病例。
本实施例中器官衰竭阳性病例的确定,在需存在多器官功能衰竭现象的同时,还需疑似感染器官衰竭,提高了所确定的阳性病例的准确性,从而有利于提高本实施中器官衰竭预警模型预测结果的准确性。
在本实施例中,阳性病例特征数据和阴性病例特征数据均包括多个特征字段的数据,其中,特征字段的数量和类型可以根据实际应用自定义设置。在本实施例中,阳性病例特征数据和阴性病例特征数据优选均包括床旁数据、实验室数据和人口学数据等如表2所示的共79个特征字段。
本实施例在提取阳性特征病例特征数据与阴性病例特征数据时,优选提取各阳性病例与各阴性病例在ICU停留时间内,各特征字段在各采集周期内的最小值、平均值、中位数和最大值,其中,采集周期可以根据实际应用自定义设置,例如,本实施例中采集周期可以取值为1小时。进一步地,如果存在某个采集周期没有数据,则优选使用上一采集周期的数据填充,如果仍然没有数据,则使用所有病例对应的中位数填充。在本实施例中,将除使用中位数填充的特征字段之外的其他特征字段视作有效的特征字段。
本实施例优选通过用于从阳性病例对应的病例原始数据中提取阳性病例特征数据的第一提取单元,以及用于利用第一筛选规则筛选阳性病例特征数据的第一筛选单元来提取阳性病例特征数据,其中,第一筛选规则可以根据实际应用自定义设置。在本实施例中,第一筛选规则优选包括:阳性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阳性病例特征数据中有效的特征字段的数量不小于第一阈值,其中,第一阈值可以根据实际应用自定义设置,以筛选出有效的特征字段充足的特征数据。在特征字段的数量为79时,本实施例中的第一阈值优选取值为55。
本实施例优选通过用于从阴性病例对应的病例原始数据中提取阴性病例特征数据的第二提取单元,以及用于利用第二筛选规则筛选阴性病例特征数据的第二筛选单元来提取阴性病例特征数据,其中,第二筛选规则可以根据实际应用自定义设置。在本实施例中,第二筛选规则优选包括:阴性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阴性病例特征数据中有效的特征字段的数量不小于第二阈值,其中,第二阈值可以根据实际应用自定义设置,以筛选出有效的特征字段充足的特征数据。在特征字段的数量为79时,本实施例中的第二阈值优选取值为45。
在本实施例中,预设数量可以根据实际应用自定义设置,例如,本实施例中的预设数量可以取值为5,也即,本实施例中的器官衰竭预警模型旨在根据至少连续5个小时的特征数据来预测预设时长之后对应病例器官衰竭阳性的发作概率。
参见表2,本实施例中的特征字段包括年龄字段,为了使得本实施例的器官衰竭预警模型能够适用于不同年龄段的潜在病例,而不仅仅适用于老年病例,本实施例中年龄字段的取值优选不小于18周岁。
进一步地,在本实施例中,可以按照年龄字段的取值对阳性病例特征数据和阴性病例特征数据进行分组,其中,年龄段的具体划分方式可以根据实际应用自定义设置,例如,在本实施例中,多个年龄段可以包括:[18,40),[40,50),[50,60),[60,70),[70,80),[80,∞)。
在本实施例中,用于训练器官衰竭预警模型的训练模块具体可以包括:
第一分组单元,用于将阳性病例特征数据划分为与多个年龄段对应的分组阳性病例特征数据;
第二分组单元,用于将阴性病例特征数据划分为与多个年龄段对应的分组阴性病例特征数据;
构建单元,用于从每一分组阳性病例特征数据中提取预设比例的阳性病例特征数据,并从每一阴性病例特征数据中提取预设比例的阴性病例特征数据,来构建特征数据集;
训练单元,用于利用特征数据集训练得到器官衰竭预警模型。
在本实施例中,不同年龄段对应的预设比例相同,有利于保持特征数据集中的年龄平衡,从而有利于提高器官衰竭预警模型对潜在的所有病例的适用性。进一步地,为了提高器官衰竭预警模型的鲁棒性,训练单元优选包括用于打乱特征数据集的打乱子单元,使得特征数据集中各阳性病例特征数据和隐形病例特征数据乱序排放,以及用于利用打乱后的特征数据集训练得到器官衰竭预警模型的训练子单元。基于此,增强了本实施例的器官衰竭预警模型的泛化能力。
此外,在本实施例中,特征数据集包括训练集、测试集与验证集中的至少一种。具体地,在本实施例中,特征数据集优选同时包括训练集、测试集与验证集,其中,训练集用于训练模型参数,验证集用于选择超参,测试集用于测试结果。并且,在本实施例中,优选按照0.7的预设比例提取训练集,按照0.2的预设比例提取测试集,按照0.1的预设比例提取验证集。
本实施例中优选采用集成学习的方法来训练器官衰竭预警模型,具体地,在预设时长具体取值为1小时、2小时、3小时、4小时以及5小时时,也即,在器官衰竭预警模型分别能够提前1小时、2小时、3小时、4小时以及5小时对器官衰竭阳性的发作概率进行预测时,其指标结果如表3所示。
本实施例中的器官衰竭预警模型能够根据目标病例的特征数据预测该目标病例在预设时长之后器官衰竭阳性的发作概率,进而能够有利于实现器官衰竭的及早诊断与及早干预治疗,以降低器官衰竭的病死率。此外,本实施例的器官衰竭预警模型,可以不依赖于标准数据模板,而适用于各医院或机构的数据处理。
实施例3
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1提供的器官衰竭的预警方法。
图7示出了本实施例的硬件结构示意图,如图7所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的器官衰竭的预警方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1所提供的器官衰竭的预警方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1所述的器官衰竭的预警方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种器官衰竭的预警方法,其特征在于,包括:
提取目标病例的特征数据;
将所述特征数据输入器官衰竭预警模型,以输出所述目标病例在预设时长之后器官衰竭阳性的发作概率;
其中,所述器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到,所述阳性病例特征数据包括在预测时刻之前采集到的特征数据,所述预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长。
2.如权利要求1所述的器官衰竭的预警方法,其特征在于,所述器官衰竭预警模型通过以下步骤训练得到:
将所述阳性病例特征数据划分为与多个年龄段对应的分组阳性病例特征数据;
将所述阴性病例特征数据划分为与多个所述年龄段对应的分组阴性病例特征数据;
从每一所述分组阳性病例特征数据中提取预设比例的阳性病例特征数据,并从每一所述阴性病例特征数据中提取所述预设比例的阴性病例特征数据,来构建特征数据集;
利用所述特征数据集训练得到所述器官衰竭预警模型;
其中,所述特征数据集包括训练集、测试集与验证集中的至少一种。
3.如权利要求2所述的器官衰竭的预警方法,其特征在于,所述利用所述特征数据集训练得到所述器官衰竭预警模型的步骤包括:
打乱所述特征数据集;
利用打乱后的所述特征数据集训练得到所述器官衰竭预警模型。
4.如权利要求1所述的器官衰竭的预警方法,其特征在于,所述阳性病例特征数据的提取条件包括:
符合阳性病例的确定条件;
所述阳性病例的发作时刻位于进入当前ICU的第一指定时长之后;
所述阳性病例在之前的ICU中未被确定为阳性病例;
所述阳性病例的年龄不小于年龄阈值;
所述阴性病例特征数据的提取条件包括:
符合阴性病例的确定条件;
所述阴性病例在当前ICU内的任意连续第二指定时长内的SOFA分值的最大变化量不超过SOFA阈值;
所述阴性病例在当前ICU内的停留时间超过第三指定时长;
所述阴性病例的ICD9诊断码中不含有器官衰竭的病症代码;
所述阴性病例的年龄不小于年龄阈值。
5.如权利要求4所述的器官衰竭的预警方法,其特征在于,通过以下步骤判断是否符合阳性病例的确定条件以及是否符合阴性病例的确定条件:
获取多组病例原始数据;
判断所述病例原始数据对应的病例是否属于器官衰竭的疑似病例;
若属于疑似病例,则确定所述病例的疑似感染时刻,然后判断所述病例的SOFA分值在包括所述疑似感染时刻的预设时间范围内的最大变化量是否大于所述SOFA阈值;
若大于所述SOFA阈值,则确定所述病例符合阳性病例的确定条件,并确定所述阳性病例器官衰竭阳性的发作时刻;
若不属于疑似病例,或者,不大于所述SOFA阈值,则确定所述病例符合阴性病例的确定条件。
6.如权利要求5所述的器官衰竭的预警方法,其特征在于,所述阳性病例特征数据和所述阴性病例特征数据均包括多个特征字段的数据;
所述阳性病例特征数据通过以下步骤提取得到:
从所述阳性病例对应的病例原始数据中提取阳性病例特征数据;
利用第一筛选规则筛选所述阳性病例特征数据;
所述第一筛选规则包括:所述阳性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阳性病例特征数据中有效的特征字段的数量不小于第一阈值;
所述阴性病例特征数据通过以下步骤提取得到:
从所述阴性病例对应的病例原始数据中提取阴性病例特征数据;
利用第二筛选规则筛选所述阴性病例特征数据;
所述第二筛选规则包括:所述阴性病例特征数据至少由连续预设数量的采集周期采集得到,并且每个采集周期采集到的阴性病例特征数据中有效的特征字段的数量不小于第二阈值;
其中,所述第一阈值不小于所述第二阈值。
7.如权利要求4所述的器官衰竭的预警方法,其特征在于,所述预设时长的取值范围为1小时至5小时;
和/或,所述第一指定时长取值为5小时;
和/或,所述年龄阈值取值为18周岁;
和/或,所述第二指定时长取值为72小时;
和/或,所述SOFA阈值取值为1分;
和/或,所述第三指定时长取值为5小时;
和/或,所述器官衰竭的病症代码包括:785.52,995.91,995.92。
8.一种器官衰竭的预警系统,其特征在于,包括:
提取模块,用于提取目标病例的特征数据;
预警模块,用于将所述特征数据输入器官衰竭预警模型,以输出所述目标病例在预设时长之后器官衰竭阳性的发作概率;
其中,所述器官衰竭预警模型由器官衰竭的阳性病例特征数据和阴性病例特征数据训练得到,所述阳性病例特征数据包括在预测时刻之前采集到的特征数据,所述预测时刻与器官衰竭阳性的发作时刻之间的间隔为预设时长。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的器官衰竭的预警方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的器官衰竭的预警方法的步骤。
CN202110285405.4A 2021-03-17 2021-03-17 器官衰竭的预警方法、系统、电子设备及存储介质 Pending CN112908480A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110285405.4A CN112908480A (zh) 2021-03-17 2021-03-17 器官衰竭的预警方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110285405.4A CN112908480A (zh) 2021-03-17 2021-03-17 器官衰竭的预警方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112908480A true CN112908480A (zh) 2021-06-04

Family

ID=76105292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110285405.4A Pending CN112908480A (zh) 2021-03-17 2021-03-17 器官衰竭的预警方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112908480A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872819A (zh) * 2019-01-30 2019-06-11 杭州脉兴医疗科技有限公司 一种基于重症监护检测项的急性肾损伤发病概率预测系统
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN110991536A (zh) * 2019-12-02 2020-04-10 上海应用技术大学 原发性肝癌的早期预警模型的训练方法
CN111261282A (zh) * 2020-01-21 2020-06-09 南京航空航天大学 一种基于机器学习的脓毒症早期预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872819A (zh) * 2019-01-30 2019-06-11 杭州脉兴医疗科技有限公司 一种基于重症监护检测项的急性肾损伤发病概率预测系统
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN110991536A (zh) * 2019-12-02 2020-04-10 上海应用技术大学 原发性肝癌的早期预警模型的训练方法
CN111261282A (zh) * 2020-01-21 2020-06-09 南京航空航天大学 一种基于机器学习的脓毒症早期预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王正国: "《国际交通医学》", vol. 9787535282514, 31 December 2020, 湖北科学技术出版社, pages: 317 - 318 *

Similar Documents

Publication Publication Date Title
CN107016438B (zh) 一种基于中医辨证人工神经网络算法模型的系统
CN113707297A (zh) 医疗数据的处理方法、装置、设备及存储介质
Do et al. Classification of asthma severity and medication using TensorFlow and multilevel databases
Yan et al. Automatic sleep scoring: A deep learning architecture for multi-modality time series
US20230401466A1 (en) Method for temporal knowledge graph reasoning based on distributed attention
CN115363599B (zh) 一种用于心房颤动识别的心电信号处理方法及系统
CN112466462B (zh) 一种基于图深度学习的emr信息关联及演化方法
CN116719945B (zh) 一种医学短文本的分类方法、装置、电子设备及存储介质
CN112562808A (zh) 患者画像的生成方法、装置、电子设备及存储介质
CN115240803A (zh) 模型训练方法、并发症预测方法及系统、设备和介质
CN106777966B (zh) 基于医疗信息平台的数据互动训练方法及系统
CN113377845B (zh) 基于大数据的智慧养老数据处理方法及系统
CN109119155B (zh) 基于深度学习的icu死亡危险性评估系统
CN108122005B (zh) 一种临床药物层次分类的方法
EP4149351A1 (en) System and method for testing for sars-cov-2/covid-19 based on wearable medical sensors and neural networks
CN107085655B (zh) 基于属性的约束概念格的中医数据处理方法及系统
CN111261283B (zh) 基于金字塔型卷积层的心电信号深度神经网络建模方法
Lin et al. Medical Concept Embedding with Variable Temporal Scopes for Patient Similarity.
CN112908480A (zh) 器官衰竭的预警方法、系统、电子设备及存储介质
Frandsen Machine learning for disease prediction
CN115862897A (zh) 一种基于临床数据的症候群监测方法及系统
Chang et al. Using machine learning algorithms in medication for cardiac arrest early warning system construction and forecasting
CN115631823A (zh) 相似病例推荐方法及系统
CN114664400A (zh) 病历档案归档方法及装置
Bindiya et al. Diabetes Mellitus Prediction Using Machine Learning Algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination