CN112967803A - 基于集成模型的急诊患者早期死亡率预测方法及系统 - Google Patents

基于集成模型的急诊患者早期死亡率预测方法及系统 Download PDF

Info

Publication number
CN112967803A
CN112967803A CN202110124629.7A CN202110124629A CN112967803A CN 112967803 A CN112967803 A CN 112967803A CN 202110124629 A CN202110124629 A CN 202110124629A CN 112967803 A CN112967803 A CN 112967803A
Authority
CN
China
Prior art keywords
data
integrated model
prediction
patient
emergency patients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110124629.7A
Other languages
English (en)
Inventor
黄月瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Yiyao Technology Co ltd
Original Assignee
Chengdu Yiyao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yiyao Technology Co ltd filed Critical Chengdu Yiyao Technology Co ltd
Priority to CN202110124629.7A priority Critical patent/CN112967803A/zh
Publication of CN112967803A publication Critical patent/CN112967803A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本发明涉及医学数据挖掘领域,具体是基于集成模型的急诊患者早期死亡率预测方法及系统,包括:便携式健康监测设备、医疗设备终端、患者监控管理系统、电子健康档案、中央业务服务器、中央存储服务器、数据载入模块、数据预处理模块、特征构建与选择模块、模型构建与更新模块、患者预测模块、患者排序模块、患者预警模块;包括如下方法:步骤一、采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标;步骤二、挖掘并构建有效数据特征,删除冗余特征;步骤三、处理数据类别不平衡问题;步骤四、构建集成模型,并利用集成模型预测急诊患者早期死亡率;步骤五、统计预测结果;解决了现有系统预测精度低的问题。

Description

基于集成模型的急诊患者早期死亡率预测方法及系统
技术领域
本发明涉及医学数据挖掘领域,具体是指基于集成模型的急诊患者早期死亡率预测方法及系统。
背景技术
急诊科是医院中重症病人最为集中、病种最多的科室,旨在为危急患者提供专业护理,并持续监控各项生命指标。在早期医疗阶段,有效的资源管理和人员配置常常受到限制,这已经被证明与患者的治疗效果成正相关。通过大量的临床数据对患者危机程度进行及时、准确的评估,可以辅助医生做出及时的治疗手段,潜在的降低患者死亡率。因此,急诊患者早期死亡率预测是临床研究的重要课题之一。
针对该问题提出的传统方法有急诊危重指数(Emergency Severity Index,ESI)和简化急性生理评分-Ⅱ(simplified acute physiology score-Ⅱ,SAPS-Ⅱ)等。这些评分系统通过多种临床变量得到一个严重程度评分值来反映患者的危重度,尽管应用广泛,但是通常要求变量与结果呈现线性关系,在复杂、多变量综合影响的急诊患者上使用时,其准确度较低,且缺乏针对性。
医疗信息化的发展促进了大数据技术的进步和在医疗领域中的应用,现有技术使用电子健康记录中的相关评估变量作为输入,构建各种机器学习模型进行预测。但是由于急诊的临床观察记录不定期,且不同患者、不同指标的测量频率不同,导致现有方法对特征的构建和选择较为粗糙,甚至没有考虑到变量的时序变化性。仅仅将它们作为静态特征来处理,导致部分动态信息的丢失。此外,急诊患者死亡数量与存活数量差异较大,导致采集到的数据类别分布不平衡,现有方法对此差异考虑不足,一定程度上影响了模型最终的预测性能。
发明内容
基于以上问题,本发明提供了基于集成模型的急诊患者早期死亡率预测方法及系统,解决了现有系统预测精度低的问题。
为解决以上技术问题,本发明采用的技术方案如下:
基于集成模型的急诊患者早期死亡率预测系统,包括:
便携式健康监测设备和医疗设备终端,所述便携式健康监测设备和医疗设备终端连接;
患者监控管理系统和电子健康档案,所述患者监控管理系统和电子健康档案连接;
中央业务服务器和中央存储服务器,其中,医疗设备终端和电子健康档案通过移动互联网与基于集成模型的急诊患者早期死亡率预测系统连接;
数据载入模块,用于导入采集到的急诊患者入住期间各项生理指标测量值,所述数据载入模块通过两种方式导入数据,其一为导入采集的原始数据文件,其二为将基于集成模型的急诊患者早期死亡率预测系统作为子系统,集成在医院使用的患者健康管理系统中;
数据预处理模块,用于导入的原始数据进行数据清洗、特征编码和规范化;
特征构建与选择模块,针对不同类型数据,挖掘并构建有效的数据特征,删除冗余特征,提取出最终预测特征;
模型构建与更新模块,用于完成集成模型训练和更新,如果样本出现类别不平衡问题,首先采用SMOTE方法对少样本类别进行过采样,然后再构建集成模型预测急诊患者早期死亡率,所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型;
患者预测模块,利用训练好的集成模型进行预测,并统计预测结果;
患者排序模块,对急诊患者进行实时预测,并将各个患者按照危急程度进行排序;
患者预警模块,根据患者排序模块的结果,对高风险、波动剧烈的患者及时发出预警,通知医护人员采取相应措施。
基于集成模型的急诊患者早期死亡率预测方法,包括如下步骤:
步骤一、采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标,所述步骤一具体包括如下步骤:
S11:从多个维度采集急诊患者从入住到出院或者死亡整个住院期间的各项生理指标测量值,所述各项生理指标主要包括人口统计学信息、生命体征和病理测验;
S12:对获得的原始数据进行数据清洗,包括统一数据格式,删除重复记录,填充缺失数据和处理异常值;
S13:对非数值类预测指标进行编码,并对编码后的所有变量进行规范化;
步骤二、挖掘并构建有效数据特征,删除冗余特征,所述步骤二具体包括如下步骤:
S21、特征构建,从急诊患者各项生理指标测量值构建相关预测特征,作为集成模型后续输入变量;
S22:特征选择,预测特征选择与患者早期死亡率最相关的特征,删除冗余的预测特征;
步骤三、处理数据类别不平衡问题;
步骤四、构建集成模型,并利用集成模型预测急诊患者早期死亡率;
步骤五、统计预测结果。
进一步,所述步骤S11进一步包括:
所述人口统计学信息包括性别、年龄、入院时间和出院(死亡)时间,所述生命体征包括体温、心率、呼吸率、收缩压、舒张压和氧饱和度,所述病理测验包括血常规、生化测试、凝血功能、尿钠肽和心肌标志物。
进一步,所述步骤S12进一步包括:
采用相邻时刻的非空值来插补高采样时序数据的缺失值,采用均值来插补低采样数据的缺失值;同时利用箱型图可视化各个指标的分位数,用正常范围的最大值、最小值来替代超出上、下界分位数的异常值。
进一步,所述步骤S13进一步包括:
对非数值类预测指标分别进行one-hot编码,得到相应的数值变量;然后对所有数值变量采用min-max归一化方法,保留0~1相同数值范围,具体公式为:
Figure BDA0002923462360000031
进一步,所述步骤S21进一步包括:
利用时序特征提取工具来自动化构建高采样生命体征数据的相关时序特征;对低采样的病理测验数据,提取其均值作为静态特征;同时提取患者的相关人口统计学信息作为静态特征。
进一步,所述步骤S22进一步包括:
采用多重假设检验方法来计算所构建的预测特征与预测结果之间的相关度,初步过滤冗余的预测特征;然后使用集成模型的特征重要性算法,将预测特征按照重要性进行排序,选择与患者早期死亡率最相关的特征用于死亡率预测。
进一步,所述步骤三具体包括如下步骤:
采用SMOTE过采样方法处理死亡患者数据、非死亡患者数据类别不平衡的问题,针对少样本类别构建新样本,其构建公式如下:
Figure BDA0002923462360000041
其中,xi为少样本类别中的第个样本,i=1,2,3,......n,.n为少样本类别的总样本数量,
Figure BDA0002923462360000042
为xi的近邻中随机选择的样本,rand()函数用于生成(0,1)随机数,xnew为新构建的样本。
进一步,所述步骤四具体包括如下步骤:
所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型,所述三个子模型均采用网格搜索方法和五折交叉验证进行超参数调节,并在80%训练集上进行训练,在20%测试集上进行验证,最终的加权融合公式为:
H(x)=exp(w1*hcat(x)+w2*hxgb(x)+w3*hlgb(x));
其中,hcat(x)、hxgb(x)、hlgb(x)分别为集成模型CatBoost、XGBoost和LightGBM的模型输出,w1(i=1,2,3)为各模型的权重,w1>0,∑wi=1(i=1,2,3),exp()为指数函数。
进一步,所述步骤五具体包括如下步骤:
采用5折交叉验证,以及准确率、召回率、精准率和AUC四个性能指标来评估集成模型性能,其计算公式为:
Figure BDA0002923462360000043
Figure BDA0002923462360000044
Figure BDA0002923462360000045
其中,TP、FN表示实际死亡,且预测结果分别为死亡、存活的患者数量;FP、TN表示实际存活,且预测结果分别为死亡、存活的患者数量,Accuracy表示准确率,Recall表示召回率,Precision表示准确率。
与现有技术相比,本发明的有益效果是:通过采集临床数据,将患者各项生理指标值与早期死亡率建立联系,结合静态特征和时序特征共同预测患者早期死亡率,在此基础上,建立了一套完整的临床辅助决策支持系统,不仅可以辅助临床医生做出及时的治疗手段,避免患者错失最佳治疗时机,也可以帮助医院进行更合理的医疗资源管理,具有客观、高效、准确、自动等特点,同时也将为急诊医学的发展提供新的动力,在急诊医学的临床决策、流行病学研究、急诊分级诊疗等各个方面发挥重要作用。
附图说明
图1为本实施例的流程图;
图2为采用的SMOTE过采样方法针对少样本类别生成新样本的原理示意图;
图3为本实施例中核心功能模块结构图。
具体实施方式
下面结合附图对本发明作进一步的说明。本发明的实施方式包括但不限于下列实施例。
本实施例中,基于集成模型的急诊患者早期死亡率预测系统,其包括:
便携式健康监测设备和医疗设备终端,便携式健康监测设备和医疗设备终端连接;
患者监控管理系统和电子健康档案,患者监控管理系统和电子健康档案连接;
中央业务服务器和中央存储服务器,其中,医疗设备终端和电子健康档案通过移动互联网与基于集成模型的急诊患者早期死亡率预测系统连接;
数据载入模块,用于导入采集到的急诊患者入住期间各项生理指标测量值,数据载入模块通过两种方式导入数据,其一为导入便携式健康监测设备采集的原始数据文件,其二为直接从医院对应的患者健康管理系统中导入相应数据记录,对于后者,本系统可作为一个子系统,集成在患者健康管理系统中;
数据预处理模块,用于导入的原始数据进行数据清洗、特征编码和规范化;
特征构建与选择模块,针对不同类型数据,挖掘并构建有效的数据特征,删除冗余特征,提取出最终预测特征;
模型构建与更新模块,用于完成集成模型训练和更新,如果样本出现类别不平衡问题,首先采用SMOTE方法对少样本类别进行过采样,然后再构建集成模型预测急诊患者早期死亡率,所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型;
患者预测模块,利用训练好的集成模型进行预测,并统计预测结果;
患者排序模块,对急诊患者进行实时预测,并将各个患者按照危急程度进行排序,其中,患者初入院还未进行检测时,由医生根据经验进行初步判断;
患者预警模块,根据患者排序模块的结果,对高风险、波动剧烈的患者及时发出预警,通知医护人员采取相应措施。
一种基于集成模型的急诊患者早期死亡率预测方法,包括如下步骤:
S1:采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标;
其中,S1包括如下步骤:
S11:从多个维度采集急诊患者从入住到出院或者死亡整个住院期间的各项生理指标测量值;多维度的信息能更为全面地反映患者的病情,并能挖掘出更多与急诊早期死亡率预测有关的特征,
另外,各项生理指标主要包括人口统计学信息、生命体征和病理测验,其中,人口统计学信息包括性别、年龄、入院时间、出院时间和死亡时间,生命体征包括体温、心率、呼吸率、收缩压、舒张压和氧饱和度,病理测验包括血常规、生化测试、凝血功能、尿钠肽和心肌标志物等相关变量。
S12:对获得的原始数据进行数据清洗,主要包括统一数据格式,删除重复记录,填充缺失数据和处理异常值;合适的数据处理方法能够提高数据质量,对模型的预测性能有明显的提升,需要强调的是,对异常值的判断和处理需要结合数据本身的分布情况;
本实施例中采用相邻时刻的非空值来插补高采样时序数据的缺失值,采用均值来插补低采样数据的缺失值;同时利用箱型图可视化各个指标的分位数,用正常范围的最大值、最小值来替代超出上、下界分位数的异常值。
S13:对非数值类预测指标进行编码,并对编码后的所有变量进行规范化,降低变量不同量纲对集成模型带来的不利影响,具体地,对类别预测指标分别进行one-hot编码,得到相应的数值变量;然后对所有变量采用min-max归一化方法,保留0~1相同数值范围,具体公式为:
Figure BDA0002923462360000061
S2:挖掘并构建有效数据特征,删除冗余特征;
其中,S2包括如下步骤:
S21:特征构建,从急诊患者各项生理指标测量值构建相关预测特征,作为集成模型后续输入变量,具体地,利用时序特征提取工具Tsfresh来自动化构建高采样生命体征数据的相关时序特征,这些特征包括最大值、最小值、中位数、分位数、近似熵以及傅里叶变换等;对低采样的病理测验数据,提取其均值作为静态特征;同时提取患者的相关人口统计学信息也作为静态特征。
S22:特征选择,预测特征选择与患者早期死亡率最相关的特征,删除冗余的预测特征,有效的预测特征能更好的量化病人的危急程度,提高预测准确度,具体地,首先利用Tsfresh工具提供的多重假设检验方法Mann-Whitney U test和Benjamini-Yekutieliprocedure来计算所构建的特征特征与预测结果之间的相关度,并初步过滤冗余的预测特征;然后使用集成模型的特征重要性算法,将预测特征按照重要性进行排序,选择最相关的特征用于死亡率预测。
S3:采用过采样方法处理数据类别不平衡问题,降低模型过拟合风险,具体地,采用SMOTE过采样方法处理死亡患者数据、非死亡患者数据类别不平衡的问题,针对少样本的类别构建新样本,从而达到平衡的目的,其构建公式如下:
Figure BDA0002923462360000071
其中,xi为少样本类别中的第个样本,i=1,2,3,......n,.n为少样本类别的总样本数量,
Figure BDA0002923462360000072
为xi的近邻中随机选择的样本,rand()函数用于生成(0,1)随机数,xnew为新构建的样本。
S4:结合静态特征和时序特征,共同构建集成模型预测急诊患者早期死亡率,具体地,集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型,三个子模型都采用网格搜索方法和五折交叉验证进行超参数调节,并在训练集(80%)上进行训练,在测试集(20%)上进行验证,最终的加权融合公式为:
H(x)=exp(w1*hcat(x)+w2*hxgb(x)+w3*hlgb(x));
其中,hcat(x)、hxgb(x)、hlgb(x)分别为集成模型CatBoost、XGBoost和LightGBM的模型输出,w1(i=1,2,3)为各模型的权重,w1>0,∑wi=1(i=1,2,3),exp()为指数函数。
S5:采用准确率、AUC、召回率和精准率等性能度量指标,结合K折交叉验证共同评估模型性能,统计预测结果,具体地,采用5折交叉验证,以及准确率(Accuracy)、召回率(Recall)、精准率(Precision)和AUC(接受者操作特征曲线下面积)四个性能指标来评估整体模型性能,此外,采用平衡准确率(Balanced accuracy)来评估SMOTE过采样方法的实际效果,对于类别平衡的数据,平衡准确率与准确率等价,其计算公式为:
Figure BDA0002923462360000073
Figure BDA0002923462360000074
Figure BDA0002923462360000075
其中,TP、FN表示实际死亡,且预测结果分别为死亡、存活的患者数量;FP、TN表示实际存活,且预测结果分别为死亡、存活的患者数量。
本发明实施例的方法可以显著地提升集成模型在数据类别不平衡数据中的分类性能,通过对三个子模型的加权融合,可以弥补单一模型的不足,最大程度的提高各个指标的预测结果,此外,在特征构建阶段,对高采样生命体征数据的时序特征提取,能有效的反映患者病情的变化情况,进一步提高集成模型的预测性能,本发明实施例的基于集成模型的急诊患者早期死亡率预测系统将整个预测方法流程自动化,同时按照危急程度对急诊患者实时排序,并对高危患者进行及时预警,能够辅助医护人员做出相应的治疗手段,潜在的降低患者死亡率。
综上所述,本发明解决了传统分诊系统预测精度低的缺点,通过采集临床数据,将患者各项生理指标与早期死亡率建立联系,结合静态特征和时序特征共同预测患者早期死亡率,可以辅助临床医生做出及时的治疗手段,避免患者错失最佳治疗时机,也可以帮助医院进行更合理的医疗资源管理,具有客观、高效、准确、自动等特点。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (10)

1.基于集成模型的急诊患者早期死亡率预测系统,其特征在于:包括
便携式健康监测设备和医疗设备终端,所述便携式健康监测设备和医疗设备终端连接;
患者监控管理系统和电子健康档案,所述患者监控管理系统和电子健康档案连接;
中央业务服务器和中央存储服务器,其中,医疗设备终端和电子健康档案通过移动互联网与基于集成模型的急诊患者早期死亡率预测系统连接;
数据载入模块,用于导入采集到的急诊患者入住期间各项生理指标测量值,所述数据载入模块通过两种方式导入数据,其一为导入便携式健康监测设备采集的原始数据文件,其二为将基于集成模型的急诊患者早期死亡率预测系统作为子系统,集成在医院使用的患者健康管理系统中;
数据预处理模块,用于导入的原始数据进行数据清洗、特征编码和规范化;
特征构建与选择模块,针对不同类型数据,挖掘并构建有效的数据特征,删除冗余特征,提取出最终预测特征;
模型构建与更新模块,用于完成集成模型训练和更新,如果样本出现类别不平衡问题,首先采用SMOTE方法对少样本类别进行过采样,然后再构建集成模型预测急诊患者早期死亡率,所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型;
患者预测模块,利用训练好的集成模型进行预测,并统计预测结果;
患者排序模块,对急诊患者进行实时预测,并将各个患者按照危急程度进行排序;
患者预警模块,根据患者排序模块的结果,对高风险、波动剧烈的患者及时发出预警,通知医护人员采取相应措施。
2.基于集成模型的急诊患者早期死亡率预测方法,其特征在于:包括如下步骤:
步骤一、采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标,所述步骤一具体包括如下步骤:
S11:从多个维度采集急诊患者从入住到出院或者死亡整个住院期间的各项生理指标测量值,所述各项生理指标主要包括人口统计学信息、生命体征和病理测验;
S12:对获得的原始数据进行数据清洗,包括统一数据格式,删除重复记录,填充缺失数据和处理异常值;
S13:对非数值类预测指标进行编码,并对编码后的所有变量进行规范化;
步骤二、挖掘并构建有效数据特征,删除冗余特征,所述步骤二具体包括如下步骤:
S21、特征构建,从急诊患者各项生理指标测量值构建相关预测特征,作为集成模型后续输入变量;
S22:特征选择,预测特征选择与患者早期死亡率最相关的特征,删除冗余的预测特征;
步骤三、处理数据类别不平衡问题;
步骤四、构建集成模型,并利用集成模型预测急诊患者早期死亡率;
步骤五、统计预测结果。
3.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤S11进一步包括:
所述人口统计学信息包括性别、年龄、入院时间、出院时间和死亡时间,所述生命体征包括体温、心率、呼吸率、收缩压、舒张压和氧饱和度,所述病理测验包括血常规、生化测试、凝血功能、尿钠肽和心肌标志物。
4.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤S12进一步包括:
采用相邻时刻的非空值来插补高采样时序数据的缺失值,采用均值来插补低采样数据的缺失值;同时利用箱型图可视化各个指标的分位数,用正常范围的最大值、最小值来替代超出上、下界分位数的异常值。
5.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤S13进一步包括:
对非数值类预测指标分别进行one-hot编码,得到相应的数值变量;然后对所有数值变量采用min-max归一化方法,保留0~1相同数值范围,具体公式为:
Figure FDA0002923462350000021
6.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤S21进一步包括:
利用时序特征提取工具来自动化构建高采样生命体征数据的相关时序特征;对低采样的病理测验数据,提取其均值作为静态特征;同时提取患者的相关人口统计学信息作为静态特征。
7.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤S22进一步包括:
采用多重假设检验方法来计算所构建的预测特征与预测结果之间的相关度,初步过滤冗余的预测特征;然后使用集成模型的特征重要性算法,将预测特征按照重要性进行排序,选择与患者早期死亡率最相关的特征用于死亡率预测。
8.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤三具体包括如下步骤:
采用SMOTE过采样方法处理死亡患者数据、非死亡患者数据类别不平衡的问题,针对少样本类别构建新样本,其构建公式如下:
Figure FDA0002923462350000031
其中,xi为少样本类别中的第个样本,i=1,2,3,......n,.n为少样本类别的总样本数量,
Figure FDA0002923462350000032
为xi的近邻中随机选择的样本,rand()函数用于生成(0,1)随机数,xnew为新构建的样本。
9.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤四具体包括如下步骤:
所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型,所述三个子模型均采用网格搜索方法和五折交叉验证进行超参数调节,并在80%训练集上进行训练,在20%测试集上进行验证,最终的加权融合公式为:
H(x)=exp(w1*hcat(x)+w2*hxgb(x)+w3*hlgb(x));
其中,hcat(x)、hxgb(x)、hlgb(x)分别为集成模型CatBoost、XGBoost和LightGBM的模型输出,w1(i=1,2,3)为各模型的权重,w1>0,∑wi=1(i=1,2,3),exp()为指数函数。
10.根据权利要求2所述的基于集成模型的急诊患者早期死亡率预测方法,其特征在于:所述步骤五具体包括如下步骤:
采用5折交叉验证,以及准确率、召回率、精准率和AUC四个性能指标来评估集成模型性能,其计算公式为:
Figure FDA0002923462350000041
Figure FDA0002923462350000042
Figure FDA0002923462350000043
其中,TP、FN表示实际死亡,且预测结果分别为死亡、存活的患者数量;FP、TN表示实际存活,且预测结果分别为死亡、存活的患者数量,Accuracy表示准确率,Recall表示召回率,Precision表示准确率。
CN202110124629.7A 2021-01-29 2021-01-29 基于集成模型的急诊患者早期死亡率预测方法及系统 Pending CN112967803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110124629.7A CN112967803A (zh) 2021-01-29 2021-01-29 基于集成模型的急诊患者早期死亡率预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110124629.7A CN112967803A (zh) 2021-01-29 2021-01-29 基于集成模型的急诊患者早期死亡率预测方法及系统

Publications (1)

Publication Number Publication Date
CN112967803A true CN112967803A (zh) 2021-06-15

Family

ID=76272450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110124629.7A Pending CN112967803A (zh) 2021-01-29 2021-01-29 基于集成模型的急诊患者早期死亡率预测方法及系统

Country Status (1)

Country Link
CN (1) CN112967803A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116978570A (zh) * 2023-09-25 2023-10-31 之江实验室 一种在线实时患者危重程度评估及生命体征参数预测系统
CN117238446A (zh) * 2023-10-24 2023-12-15 惠州市第一人民医院 基于创伤患者的辅助处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014033681A2 (en) * 2012-08-31 2014-03-06 Koninklijke Philips N.V. Modeling techniques for predicting mortality in intensive care units
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测系统
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN111370126A (zh) * 2020-03-17 2020-07-03 杭州妞诺科技有限公司 基于惩罚集成模型的icu死亡率预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014033681A2 (en) * 2012-08-31 2014-03-06 Koninklijke Philips N.V. Modeling techniques for predicting mortality in intensive care units
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测系统
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN111370126A (zh) * 2020-03-17 2020-07-03 杭州妞诺科技有限公司 基于惩罚集成模型的icu死亡率预测方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116978570A (zh) * 2023-09-25 2023-10-31 之江实验室 一种在线实时患者危重程度评估及生命体征参数预测系统
CN116978570B (zh) * 2023-09-25 2024-02-06 之江实验室 一种在线实时患者危重程度评估及生命体征参数预测系统
CN117238446A (zh) * 2023-10-24 2023-12-15 惠州市第一人民医院 基于创伤患者的辅助处理方法及系统

Similar Documents

Publication Publication Date Title
CN112365978B (zh) 心动过速事件早期风险评估的模型的建立方法及其装置
CN109920547A (zh) 一种基于电子病历数据挖掘的糖尿病预测模型构建方法
CN112786204A (zh) 一种机器学习糖尿病发病风险预测方法及应用
WO2021190300A1 (zh) Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及系统
CN110739076A (zh) 一种医疗人工智能公共训练平台
CN111951975B (zh) 一种基于深度学习模型gpt-2的脓毒症早期预警方法
CN111553478B (zh) 基于大数据的社区老年人心血管疾病预测系统与方法
CN114023441A (zh) 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN113160986B (zh) 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
CN111063448A (zh) 输血不良反应数据库建立方法、存储系统以及主动预警系统
Al-Mualemi et al. A deep learning-based sepsis estimation scheme
CN111243753A (zh) 一种面向医疗数据的多因素相关性交互式分析方法
CN115116612A (zh) 一种儿童患者病情智能风险评估系统及方法
CN109192312B (zh) 一种心力衰竭患者不良事件智能管理系统及方法
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统
CN116597981A (zh) 一种结合数字孪生技术进行慢阻肺疾病防治管理的方法
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
CN115954102A (zh) 一种人工关节假体周围感染诊断模型及诊断系统
CN112420197A (zh) 一种智能公卫服务管理系统及方法
CN114550855A (zh) 基于人工智能的静脉血栓栓塞症预测方法、装置、终端及介质
CN110910980A (zh) 一种脓毒血症的预警装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination