CN114724701A

CN114724701A - 基于叠加集成算法和自动编码器的无创通气疗效预测系统

Info

Publication number: CN114724701A
Application number: CN202210235401.XA
Authority: CN
Inventors: 梁娜; 汪成亮; 汪应钦; 段均; 谢辛; 李娟�; 郑理; 钟文
Original assignee: Individual
Current assignee: Individual
Priority date: 2022-03-11
Filing date: 2022-03-11
Publication date: 2022-07-08

Abstract

本发明提出了一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，包括：数据获取模块、数据处理模块、特征生成模块和预测模块，数据获取模块的数据输出端与数据处理模块的数据输入端相连，数据处理模块的数据输出端与特征生成模块的数据输入端相连，特征生成模块的数据输出端与预测模块的数据输入端相连；将数据获取模块获取的医疗数据文档通过数据处理模块预处理后输入到特征生成模块中，得到影响无创通气疗效预测概率的特征，然后所述特征输入预测模块进行训练；最后将待测数据输入训练完毕的预测模块中，得到预测结果。本系统可以在使用无创通气前或无创通气早期(1‑2小时)更准确地预测无创通气失败概率。

Description

基于叠加集成算法和自动编码器的无创通气疗效预测系统

技术领域

本发明涉及医疗数据挖掘领域，尤其涉及基于叠加集成算法和自动编码器的无创通气疗效预测系统。

背景技术

气流阻塞引起的慢性支气管炎和肺气肿，多伴有细菌感染、气道分泌物阻塞、呼吸肌疲劳等，严重者则出现活动性气短、换气功能障碍，引起缺氧和二氧化碳潴留，COPD合并呼吸衰竭的患者发病常表现为急性发作，病情进展迅速，如不及时对症治疗将威胁患者生命。常规治疗主要是吸氧、抗感染、舒张支气管和化痰平喘等对症治疗，但效果并不理想。目前，无创通气技术治疗呼吸衰竭临床应用范围越来越广泛，且取得了巨大进展。通过大数据构建早期预测无创通气失败概率，提高干预的准确性，通过适当的干预来改善愈后。

无创通气(NIV)失败患者的总死亡率为23％-27％。晚期NIV失败患者的死亡率急剧增加，从50％到80％不等，早期预测无创通气失败对于危重ICU患者升级或改变治疗方案具有重要意义。前期，有研究者通过传统统计学方法中的卡方和/或费舍尔的精确检验，组间的差异用未配对的t检验或Mann-WhitneyU检验进行分析，开发了一套HACOR评分方法，HACOR评分仅对COPD患者NIV衰竭的预测具有较高的敏感性和特异性，尤其是早期NIV衰竭，但对于除COPD以外的其他疾病，特别是合并了多种基础疾病的患者，生命体征、护理等变量参数在随时增加，如何提高预测的准确性，是目前研究的热点也是难点。加之，该项研究因医院缺乏信息系统自动采集时序性数据，采集上来的数据集容易出现不平衡的现象。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于叠加集成算法和自动编码器的无创通气疗效预测系统。

为了实现本发明的上述目的，本发明提供了一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，包括：数据获取模块、数据处理模块、特征生成模块和预测模块，

数据获取模块的数据输出端与数据处理模块的数据输入端相连，数据处理模块的数据输出端与特征生成模块的数据输入端相连，特征生成模块的数据输出端与预测模块的数据输入端相连；

将数据获取模块获取的医疗数据文档通过数据处理模块预处理后输入到特征生成模块中，得到影响无创通气疗效预测概率的特征，然后所述特征输入预测模块进行训练；最后将待测数据输入训练完毕的预测模块中，得到预测结果。若预测结果大于或者等于预设设定阈值，则发出提醒信息。可以通过短信的方式及时了解状况。

进一步地，数据获取模块用于采集医院/科室基本信息、病人基本信息、疾病诊断、生命体征参数信息之一或者任意组合；其中生命体征参数信息采用实时推送方式更新。

进一步地，所述数据处理模块包括：数据清洗模块或/和数据质控模块；

数据采集模块：采集医院/科室基本信息、病人基本信息、疾病诊断、生命体征参数信息之一或者任意组合；其中生命体征参数信息采用实时推送方式更新；

数据清洗模块：利用Kettle对重复数据进行清洗，K均值对不完整数据进行填充，箱线图检测异常值数据；

将异常数值或未采集到的个别数据视为缺失值进行处理，替换缺失值用中位数来填充，然后根据条件删除掉重复行即根据实际情况，如果判定是正常重复就不需要删除，如果不是，则删除，所以要由医生根据经验判断，以此避免出现冗余。

箱线图用于将数据划分为四分位数。当默认距离的数据超过3δ的平均值时，视为异常数据。这些异常数据或未收集的数据被视为缺失值，以中位数代替。

使用中位数来填充缺失值，增加了填充缺失值的稳定性

数据质控模块：用于检查是否填写了技术必填字段；若技术必填项出现空值，则拒绝接收该份文档；若技术必填项都不为空，则接收该文档。.

进一步地，还包括数据展示模块；将采集的数据进行展示。

展示数据包括：动脉血压(ABP)或无创血压(NBP)，腋温、肛温或鼻咽温，机器测量中心静脉压(CVP)或手工测量CVP，鼻导管或面罩吸氧、经鼻、经口气管插管或气管切开，每班护士根据病人的病情和监测的需要设置监护项目采集的间隔和频率之一或者任意组合；

进一步地，所述特征生成模块包括：

特征生成：包括特征交叉技术生成的特征、先验知识特征和两个时间点的特征均值之一或者任意组合；

利用已有的特征生成新的特征，充分挖掘数据集的信息，提高模型的预测能力；

特征选择：采用低方差过滤进行特征选择，计算样本中每个特征值对应的方差，如果低于阈值，将被过滤；和/或通过特征和标签之间的皮尔逊相关系数，过滤不相关的特征。特征生成的数据输出端与特征选择的数据输入端相连。

特征选择是一种降低输入变量维数和机器学习分类器运行时间，提高预测精度的技术。采用方差和皮尔逊相关系数对部分特征进行过滤，保留与模型相关性最高的特征。

进一步地，所述特征生成中的两个时间点的特征均值是使用LSTM自动编码器模型提取两个时间点采样数据的时间序列特征。在ICU数据集中，收集每个患者在两个时间点的呼吸检测数据，形成时间序列。

进一步地，所述预测模块包括：使用改进的SMOTE算法处理数据不平衡的问题，然后使用叠加集成算法，得到无创通气疗效预测的概率。

进一步地，所述改进的SMOTE算法包括以下步骤：

S1，使用SVM分类算法得到一组少数错误实例；

S2，它从少数错误实例集中删除所有孤立实例，以获得一组新的实例点；

S3，在实例点集中使用k-means算法进行聚类，得到N个聚类；

S4，聚类中心和聚类中的实例被用来生成新的实例点。

改进的SMOTE算法有助于防止出现较高的假阴性率，能处理数据不平衡问题，提高预测的准确率。

进一步地，所述叠加集成算法包括：

使用Catboost、随机森林和逻辑回归作为基础学习器，逻辑回归作为元学习器；将每个基学习器的预测概率连接起来形成一个新的训练集来训练元学习器。选择的分类器之间存在相当大的差异，堆叠是能够充分利用每个学习器的优势来提高分类器的性能。

进一步地，包括：

对于实例集T＝(t₁,t₂,…t_m)中，其中t_m表示第m个实例，每个实例的权重为：

W_T＝(wt₁,wt₂,…wt_m)

其中，W_T表示实例权重集；

wt₁表示第一个实例的权重；

wt₂表示第二个实例的权重；

wt_m表示第m个实例的权重；

一共有i个基础学习器，则每个基础学习器的权重为：

α_i＝0.5log(1-e_i)

其中e_i表示第i个基础学习器的误差系数；

元学习器可表示为：

其中K表示基础学习器的总数；

h_i(x)表示第i个基础学习器。

综上所述，由于采用了上述技术方案，本发明的有益效果为：

首先，我们首次提出了SMSN模型，包括三个阶段：数据处理、特征生成和建模。通过实验验证，SMSN模型在AUC、F1和精度性能指标上都是最好的，提高了预测精度。

其次，我们创新性地采用了基于LSTM的自动编码器模型。它可以利用LSTM处理时间序列的能力和自动编码器提取特征的能力，主动提取时间序列数据并自动提取时间序列特征，从而将它们添加到数据集中，以提高预测精度。

然后，针对少数类别难以分类的问题，首次提出了一种过采样算法(改进的SMOTE)。这种算法更多地关注数据较少的类，促进了类平衡，提高了分类器的灵敏度或召回率。

最后，将三种不同的机器学习分类器结合起来，得到了SMSN模型。通过实验验证，SMSN分类器即逻辑回归、随机森林、Catboost算法叠加集成的分类器，也称SMSN模型，在AUC、F1和精度性能上都是最优的。此外，以SMSN模型中的组件，即逻辑回归分类器为例，使用SHAP分析每个患者预测结果的决策路径，即每个特征如何影响最终预测。通过提出的SMSN模型，可以在使用无创通气前或无创通气早期(1-2小时)更准确地预测无创通气失败概率。因此，针对高风险患者提出建议，帮助医生决定何时升级或改变治疗计划，对于低资历医生的决策支持具有重要的科学意义。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明SMSN模型训练流程图。

图2是本发明视觉时间序列示意图。

图3是本发明自动编码器的结构示意图。

图4是本发明LSTM网络的结构示意图。

图5是本发明不同分类器的ROC曲线示意图。

图6是本发明分类器的混淆矩阵示意图。

图7是本发明SMSN模型的SHAP值分析示意图。

图8是本发明Ⅰ型无创通气失败患者的SHAP分析示意图。

图9是本发明Ⅱ型无创通气失败患者的SAAP分析示意图。

图10是本发明采用无创呼吸治疗的成功患者I的SHAP分析示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

本发明提供了一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，包括以下模块：

数据采集模块：数据交换采用中间库的方式，由业务系统主动推送数据到中间库，从中间库采集数据到中心库，包括医院/科室基本信息、病人基本信息、疾病诊断、生命体征参数信息等。基础数据以全量+增量方式推送，基础信息全量推送，病情需实时更新的数据采用增量方式推送，特别是生命体征参数数据采用实时推送方式更新。

表1病人数据采集特征

数据清洗模块：数据清洗是数据挖掘过程中的必经步骤，从数据源头出发，结合回溯思想来处理一些不合适的数据，例如：重复数据、缺失数据、错误数据。建立相对应的清洗模型方便同种模型的数据在预处理平台中进行有效的清洗，利用Kettle对重复数据进行清洗、K均值对不完整数据进行填充、箱线图检测异常值数据(异常数据一般是离群数据，也不完全是错误数据)，如每隔1小时记录这些数据，住院后按每隔1小时记录患者上述字段的数值，利用箱线图将数据进行四分位数划分，默认距离超过平均值3δ的数据为异常数据，将异常数值或未采集到的个别数据视为缺失值进行处理，替换缺失值用中位数来填充。重复数据是从现有数据中搜索行或列相同的数据，标记重复的行列出现重复的次数，最后一步就是根据条件删除掉重复行即根据实际情况，如果判定是正常重复就不需要删除，如果不是，则删除，所以要由医生根据经验判断，以此避免出现冗余。

数据质控模块：非空项目报错梳理的若干字段为技术必填字段，若出现空值，技术必填机制将启动，拒绝接收该份文档；若技术必填项都不为空，平台接收该文档。梳理的限定阈值的字段为业务必填字段；值域范围检查：对有值域范围要求的字段，检查数据类型、格式、长度填写是否正确；逻辑矛盾检查：重点监测必填字段的逻辑内容；关联性不符：重点监测必填字段的逻辑内容，若出现手术操作名称，则大病历中一定包含手麻记录、手术知情同意书；若出现有检查检验费用，大病历中缺检查检验报告等则出现关联性不符报错；语义解析：通过后台程序监控进行随机抽查。

数据展示模块：病人入院后根据病人病情选择监测项目变化进行实时自动采集，其中监护项目变化选择包括动脉血压(ABP)或无创血压(NBP)；腋温、肛温或鼻咽温；机器测量中心静脉压(CVP)或手工测量CVP；鼻导管或面罩吸氧、经鼻、经口气管插管或气管切开，每班护士根据病人的病情和监测的需要设置监护项目采集的间隔和频率；并将采集数据以表格和趋势图形式灵活而直观展现在医护人员面前。系统可进行数据检索和数据统计，数据检索包括：病人查询、病案查询、补液平衡计算、体征查询等。数据统计包括：日常工作中常用到数据统计工作，如病人流动统计、设备使用情况等，即能够完成日常所需要的所有统计需求。

我们提出了如何建立一个良好的预测模型，并分析了哪些特征会影响患者在早期(1-2小时)或之前使用无创通气的最终预测。首先，在ICU患者的治疗过程中，医院收集的无创通气失败样本远少于成功样本。由于故障样本数量少，分类器的预测或召回率降低，导致临床实践中容易出现漏诊。其次，单个分类器的预测偏差较大。面对复杂的疾病，医院需要征求不同学科医生的意见，进行综合判断，以提高患者的诊断准确率和患者的治疗方案的适应性。最后，大多数机器学习算法并不主动获取数据的时间序列关系，例如治疗前一小时采集的数据，和治疗后一小时采集的数据，观察采取治疗方案后的效果，它们之间的关系是连续性的。然而，这些数据对于医生观察疾病变化和判断疗效非常重要。总之，构建一个具有解释性的预测分类器，分析影响预测的整体特征和个体特征，是具有重要意义的。在本文中，我们的创新点如下：

最后，我们在非线性树分类器中采用了包括简单logistic回归、随机森林和Catboost三种分类器的叠加集成算法。无创通气失败被定义为有创机械通气的插管要求，然而，对于年资低的医生，由于缺乏经验，他们通常会对何时升级治疗方案、采用什么样的治疗方案给出错误的判断。因此，机器学习算法可以帮助医生做出正确的判断，对于提高患者治愈率、降低死亡率具有重要意义。

评估预测无创性呼吸衰竭概率的任务。为了提高分类器的准确性和客观性，采用了五种不同的评价指标对实验进行评价。首先介绍混淆矩阵的基本术语。真正(TPs)的正类实例被认为是正类；误报(FPs)的阴性类实例被识别为阳性类；假阴性(FN)的阳性类实例被识别为阴性类；将真负的负类样本(TNs)识别为负类。具体的五项绩效指标如下：

如图1所示，所提出的SMSN模型包括处理数据不平衡的改进SMOTE算法和精确时间序列特征的LSTM自动编码器，以及堆叠集成算法进行集成学习，并结合多个机器学习分类器以提高预测精度。首先，在数据集中进行数据处理，包括缺失值处理、异常值处理和数据标准化。其次，在数据集中执行特征工程，包括特征生成和特征选择。为了充分利用数据中时间序列的特征，采用LSTM自动编码器作为数据特征的提取SMSN模型时间序列。最终，建立了修正的SMOTE模型，以平衡少数类和多数类。同时，将logistic回归、随机森林和Catboost算法相结合，提出了一种提高预测精度的叠加集成算法。最终模型输出预测结果，包括无创通气疗效的失败率。

1.数据处理

收集的数据中存在异常值。在本文中，箱线图用于将数据划分为四分位数。当默认距离的数据超过3δ的平均值时，视为异常数据。这些异常数据或未收集的数据被视为缺失值。为了增加填充缺失值的稳定性，本文没有使用平均值，而是使用中位数来填充缺失值。

基于距离的机器学习算法，例如KNN、逻辑回归和SVM，对输入数据的每个维度的规模都很敏感，因此需要进行预处理。本文选用zscore标准化算法对数据进行预处理。假设输入数据x，其平均值和标准差分别为

σ，变换如下：

在本文收集的数据集中，呼吸衰竭的原因以分类变量为特征，在各个类别之间分布不均，并且与预测变量的治疗失败具有高度相关性。本文选择One Hot编码作为分类变量编码方法。此外，样本中某些疾病的数量少于20种。在整体编码的过程中，这些疾病被归类为其他疾病。

2.特征工程

2.1特征生成

特征生成利用已有的特征生成新的特征，充分挖掘数据集的信息，提高模型的预测能力。新功能需要验证，以及领域知识、行业经验和数学需要知识来综合考虑特征的有效性。本文根据数据的时间序列相关性和临床专家知识的特点，采用三种方法进行特征生成。

首先，在ICU数据集中，收集每个患者在两个时间点的呼吸检测数据，形成时间序列。传统机器学习分类器的性能下降是因为它们没有利用数据中时间序列的特征。如图2所示，将两个类别在h＝0和h＝1两个时间点的不同检测特征的平均值可视化。与治疗成功患者相比，治疗失败患者的GCS、PaCO2和氧合指数特征水平较低，而治疗失败患者的HR、RR和FIO2特征水平较高。此外，治疗成功的患者当h＝1时，PaO2和氧合指数特征显着增加。同时，治疗失败患者的HR、RR和FIO2在h＝1时显着增加。随着时间的推移，检测特征的变化与预测高度相关。

在特征工程阶段，使用LSTM自动编码器模型提取两个时间点采样数据的时间序列特征。如图3所示，变量x表示原始数据，这些数据在输入层中被视为节点。它被编码为降维向量h，表示隐藏层中的节点。它被编码为降维向量h，表示隐藏层中的节点。然后，向量h表明自动编码器的输入层和输出层的尺寸相同，隐藏层中的编码器自动提取最有用的特征，并将提取的特征恢复为原始数据。LSTM网络可以被构建为一个重复模块链，其中每个模块对应于一个时间点。

详细结构如图4所示。链的关键组成部分是存储历史信息的单元状态。在每个时间点，信息在3个门的交互作用下更新和传输：遗忘门、输入门和输出门。每一层都是一个sigmoid神经网络层。LSTM善于处理时间序列数据，因为它能够记忆历史信息。本文采用基于LSTM的自动编码器模型，结合LSTM处理时间序列数据和自动编码器自动特征提取。

表2专家经验特征

NIV前(H0)	NIV(H1)1小时后	单位
			氧合指数/H0RR	H1氧合指数/H1RR	毫米汞柱/呼吸/分钟
年龄*H0RR	年龄*H1RR	年*呼吸/分钟
			H0RR*H0HR	H1RR*H1HR	呼吸/分钟*节拍/分钟
H0RRH0HRH0FIO2	H1RRH1HRH1FIO2	呼吸/分钟*节拍/分钟

NIV＝无创通气，RR＝呼吸频率，HR＝心率，FIO2＝吸入氧分数，H0表示在NIV之前收集的数据，H1表示NIV1小时后收集的数据。

具有丰富临床经验的主治医师形成了专家公式来生成先验特征，如表2所示。此外，使用特征交叉技术将成对特征相乘以生成新特征。

2.2特征选择

制作新特征需要考虑它们的有效性，以防止生成无意义的特征。特征选择是一种降低输入变量维数和机器学习分类器运行时间，提高预测精度的技术。低方差过滤的特征选择算法是一种计算样本中每个特征值对应的方差的简单方法。如果低于阈值，将被过滤(拒绝)。此外，特征和标签之间的皮尔逊相关系数用于特征选择，可以过滤不相关的特征。本文采用方差和皮尔逊相关系数对部分特征进行过滤，保留与模型相关性最高的特征。

3.模型

3.1改进的SMOTE

SMOTE算法是经典的过采样算法。新实例的生成由少数类实例和它们附近的k之间的插值决定。因此，SMOTE算法在生成新实例的过程中依赖于邻居k，只能通过在数据集中反复测试得到k的最优值。另外，SMOTE算法的使用会影响少数实例的数据分布。如果数据集中少数类中存在孤立点，则附近没有少数类实例点。假设不考虑特殊性，SMOTE算法也会在孤立点附近生成新的实例点，这将在很大程度上改变原始数据分布。同时，SMOTE算法对所有少数实例一视同仁。在分类中，一些被错误分类的少数实例称为硬实例，而正确分类的样本称为易实例。此外，SMOTE算法并没有更多地关注硬实例。

本文提出了改进的SMOTE，在保持Borderline-SMOTE和k-meansSMOTE的优势的同时，比Borderline-SMOTE和k-meansSMOTE更侧重于硬样本。修改后的SMOTE算法首先使用SVM分类算法得到一组少数错误实例。然后，它从少数错误实例集中删除所有孤立实例，以获得一组新的实例点。随后，在实例点集中使用k-means算法进行聚类，得到N个聚类。最终，聚类中心和聚类中的实例被用来生成新的实例点。修改后的SMOTE算法过程在算法1中给出：

3.2预测模型

在模型阶段，采用stacking集成学习算法，集成了逻辑回归、随机森林和Catboost。逻辑回归通过在线性回归的基础上添加sigmoid函数成为二元分类算法。二元分类算法需要在[0,1]范围内进行预测，而线性回归只能在实数域内进行预测。在这种情况下，将sigmoid函数添加到线性回归中，使其能够在所需范围内进行预测。随机森林以随机方式建立森林。森林由许多决策树组成，它们之间没有相关性。由于其随机性，抗噪能力强，不易过拟合。Catboost是基于遗忘树的GBDT框架，参数少，准确率高，支持类别变量。它最大的优点是对类别特征的高效处理。它基于XGBOOST算法进行了增强，在处理类别特征方面具有巨大优势。

如图1所示，所提出的预测模型使用Catboost、随机森林和逻辑回归作为基础学习器，逻辑回归作为元学习器。将每个基学习器的预测概率连接起来形成一个新的训练集来训练元学习器。选择的分类器之间存在相当大的差异，堆叠是能够充分利用每个学习器的优势来提高分类器的性能。

4.结果

4.1绩效指标

评估了预测无创呼吸衰竭概率的任务。为提高分类器的综合评价和客观评价，采用五个不同的评价指标对实验进行评价。首先介绍混淆矩阵的基本术语。真阳性(TP)的阳性类实例被识别为阳性类；假阳性(FP)的负类实例被识别为正类；假阴性(FN)的正类实例被识别为负类；真阴性(TN)的负类样本被识别为负类。具体五项绩效指标如下：

准确率是指正确预测的实例数量或实例总数。准确率代表分类器的整体分类性能，其公式如下：

精度表示被判断为正类的实例中真正的正类的比率。它衡量模型预测的正类错误的数量是错误的。公式如下：

Recall表示正类实例中被判断为正类的实例的比例，衡量模型识别正类的能力。

计算受试者工作特征曲线下面积(AUC)。受试者工作特征曲线(ROC)代表假阳性率(FPR)和真阳性率(TPR)。

F1-Meature(F1)的得分是F-Meature的一个特例，是Precision和Recall的加权和，适合分类器的综合判断。F1分数表达式如下：

表3不同特征的分类实验结果

特征	Acc	AUC	F1	precision	recall
						原本的特征	0.869	0.905	0.747	0.872	0.653
手册特征	0.874	0.907	0.753	0.889	0.653
						所有特征	0.878	0.907	0.77	0.864	0.694

如表3所示，本文使用逻辑回归分类器在原始特征、人工特征和所有特征三个条件下进行实验。观察到使用原始特征时，分类准确率为0.869。当加入深度特征以外的特征时，包括特征交叉技术生成的特征、先验知识特征和两个时间点的特征均值，分类精度提高了0.05。使用所有特征时，分类准确率为0.878；也就是说，当添加深度特征时，模型的分类准确率提高了0.04与没有添加深度特征的情况相比。加入深度特征后，召回率显着提高，说明时间序列特征对于无创呼吸衰竭的预测非常有意义。

通过将生成的特征与原始特征进行比较和相加，可以看出生成的特征可以提高分类器的性能。

表4不同过采样算法的分类实验结果

分类器	Accuracy	AUC	F1	Precision	Recall
						Random oversampling	0.844	0.904	0.759	0.695	0.837
SMOTE	0.846	0.896	0.749	0.719	0.782
						Borderline SMOTE	0.836	0.898	0.734	0.702	0.769
SVM SMOTE	0.848	0.904	0.75	0.726	0.776
						Modified SMOTE	0.834	0.905	0.758	0.663	0.884

如表4所示，本文使用了常见的过采样算法，包括Random oversampling、SMOTE、Borderline SMOTE、SVM SMOTE和提出的改进的SMOTE，基于逻辑回归模型。根据表3，SVMSMOTE模型的准确度和精度得分最高。提出的修改后的SMOTE在AUC、F1和召回指数中是最佳的，表明修改后的SMOTE可以识别更多的少数类。

表5不同机器学习分类器的分类实验结果

分类器	Accuracy	AUC	F1	Precision	Recall
						RandomForest	0.862	0.896	0.729	0.861	0.633
LogisticRegression	0.834	0.905	0.758	0.663	0.884
						Catboost	0.866	0.901	0.755	0.817	0.701
SVM	0.832	0.845	0.754	0.662	0.878
						GBDT	0.862	0.892	0.745	0.815	0.687
XGBoost	0.858	0.888	0.732	0.822	0.66
						LightGBM	0.872	0.893	0.763	0.837	0.701
SMSN	0.882	0.915	0.794	0.814	0.776

如表5所示，本文使用所有特征和改进的SMOTE过采样算法来比较常见的机器学习分类器与提出的SMSN分类器。随机森林的精度最高，偏向于识别负类。然而，它的召回率是最低的，它识别正类的能力是很差。逻辑回归的召回率最高，对正类的识别率最高，但对负类的识别率很低。SMSN模型具有最高的准确度、AUC和F1。Precision和Recall位居前三。结合随机森林、逻辑回归和Catboost三种基础模型的优势，其性能得到显着提升。

不同机器学习分类器的ROC曲线如图5所示。SMSN模型的ROC曲线面积最大，其AUC为0.915，大于其他机器学习分类器。如图6所示，SMSN分类器的召回率为0.776，具有与没有过采样算法的逻辑回归分类器相比增加了0.082，表明所提出的过采样算法可以提高对正类的识别率。此外，与使用改进的SMOTE算法的逻辑回归分类器相比，SMSN模型的召回率降低了0.108。但是，它的精度提高了0.151，其他所有指标的表现都更好。SMSN模型在正负类的识别上取得了平衡，因为它的AUC和F1最高。

4.2可解释性

本文采用SHAP对三个基分类器进行特征重要性分析。

图7是SMSN的SHAP值直观图，按照SHAP平均值排序，特征越高，平均SHAP值越大。图中横轴代表SHAP值，每个特征在横轴上有很多点来表示测试数据集中实例的SHAP值的大小。此外，这些点的颜色代表特征值。深蓝色表示特征值小，深红色表示特征值大。H1PH、H1GCS、H1FIO2、H1RR和发现特征平均值在NIV1h时的PaO2/FiO2具有最高的SHAP值。其中，H1PH、H1GCS和PaO2/FiO2在NIV1h的特征值越高，其SHAP值越小，患者无创通气失败的概率越低。此外，H1FIO2、H1RR和呼吸衰竭原因-ARDS的特征值越高，其SHAP值越大，患者发生无创通气失败的概率越高。

如图8和图9所示，以随机森林分类器为例，SHAP分析用于预测两名无创呼吸治疗失败的患者。E[f(X)]＝0.545表示测试集中实例的平均预测值。在图8中，f(X)＝1.594表示无创呼吸衰竭患者I的预测值治疗，高于平均预测值1.049。根据SHAP公式，89个特征的SHAP值之和为1.049。如图8所示，NIV1小时时的PaO2/FiO2较低，导致SHAP值较高。然而，患者的实体瘤为0，导致SHAP值为负值。根据专家知识生成的Age*H1RR特征，其SHAP为正值。如图9所示，呼吸衰竭ARDS的原因为1，NIV1小时的PaO2/FiO2较低，这使得SHAP值较高。与图8相比，图9中的H1GCS值较高，其SHAP值为负值，而图8中的SHAP值为正值。即使预测结果都失败了，同一特征的形状值也是正的和负的，差别很大。此外，两名患者获得相同预测结果的决策过程不同，SHAP可作为临床医生解释预测过程的工具。

如图10所示，尽管患者在NIV治疗1小时时PaO2/FiO2较低，但它没有实体瘤Solidtumor、ARDS和高H1GCS，这使得最终模型预测的患者失败概率较低。可以观察到，SHAP对SNSM预测的解释有助于医生做出决定。在收集的无创呼吸数据中有与时间序列相关的数据。当使用基于LSTM的自动编码器模型提取时间序列特征时，精度和F1代有提高。传统的机器学习算法无法很好地处理数据不平衡，导致召回率很低。当引入改进的SMOTE算法时，肯定类的识别能力增强，召回率显著提高，但其AUC和F1仍然不高。为了进一步提高分类器的性能，引入了集成学习的思想，并采用了叠加集成算法。此外，将三种不同的机器学习分类器结合起来，得到了SMSN模型。通过实验验证，SMSN分类器在AUC、F1和精度性能指标上都是最优的。此外，以SMSN模型中的组件，即逻辑回归分类器为例，使用SHAP分析每个患者预测结果的决策路径，即每个特征如何影响最终预测。通过提出的SMSN模型，可以在使用无创通气前或无创通气早期(1-2小时)更准确地预测无创通气的失败概率。因此，针对高风险患者提出建议，帮助医生决定何时升级或改变治疗计划，这对于低资历医生的决策支持具有科学意义。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，包括：数据获取模块、数据处理模块、特征生成模块和预测模块，

将数据获取模块获取的医疗数据文档通过数据处理模块预处理后输入到特征生成模块中，得到影响无创通气疗效预测概率的特征，然后所述特征输入预测模块进行训练；最后将待测数据输入训练完毕的预测模块中，得到预测结果。

2.根据权利要求1所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，数据获取模块用于采集医院/科室基本信息、病人基本信息、疾病诊断、生命体征参数信息之一或者任意组合；其中生命体征参数信息采用实时推送方式更新。

3.根据权利要求1所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，所述数据处理模块包括：数据清洗模块或/和数据质控模块；

将异常数值或未采集到的个别数据视为缺失值进行处理，替换缺失值用中位数来填充，然后根据条件删除掉重复行；

数据质控模块：用于检查是否填写了技术必填字段；若技术必填项出现空值，则拒绝接收该份文档；若技术必填项都不为空，则接收该文档。

4.根据权利要求3所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，还包括数据展示模块；将采集的数据进行展示。

5.根据权利要求1所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，所述特征生成模块包括：

特征选择：采用低方差过滤进行特征选择，计算样本中每个特征值对应的方差，如果低于阈值，将被过滤；和/或通过特征和标签之间的皮尔逊相关系数，过滤不相关的特征；

特征生成的数据输出端与特征选择的数据输入端相连。

6.根据权利要求5所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，所述特征生成中的两个时间点的特征均值是使用LSTM自动编码器模型提取两个时间点采样数据的时间序列特征。

7.根据权利要求1所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，所述预测模块包括：使用改进的SMOTE算法处理数据不平衡的问题，然后使用叠加集成算法，得到无创通气疗效预测的概率。

8.根据权利要求7所述的一种基于叠加集成算法和自动编码器的无创通气疗效预测系统，其特征在于，所述改进的SMOTE算法包括以下步骤：