CN116230222A

CN116230222A - 对冠心病住院患者死亡概率预测的方法

Info

Publication number: CN116230222A
Application number: CN202211597551.1A
Authority: CN
Inventors: 尤丽珏; 陈龙; 曲新凯; 刘伊威; 陈裔; 曹译
Original assignee: Huadong Hospital
Current assignee: Huadong Hospital
Priority date: 2022-12-12
Filing date: 2022-12-12
Publication date: 2023-06-06

Abstract

本发明公开了对冠心病住院患者死亡概率预测的方法，包括以下步骤：步骤一，目标定义；步骤二，数据采集；步骤三，构建预测模型；步骤四，模型效果评价；步骤五，模型的验证与更新；所述步骤二中，模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息；所述步骤四中，评价指标为F1值或者AUC指标；本发明利用利用机器学习技针对冠心病住院患者的全维度信息进行分析，对具体患者的死亡概率进行预测，从而为临床判断提供辅助决策依据，提高临床判断的准确性和时效性，医生和病人借助该预测模型可以更好的做出共同决策，政府部门与卫生管理者也能更好的进行医疗质量管理，合理的配置医疗资源。

Description

对冠心病住院患者死亡概率预测的方法

技术领域

本发明涉及机器学习技术领域，具体为对冠心病住院患者死亡概率预测的方法。

背景技术

预测重点关注疾病住院患者在院内死亡的概率，对于医院临床治疗、疾病风险管理和运营管理而言非常重要。通过各种设备采集大量的数据，并通过大数据的方法来进行预测，为医院进行及时干预、改进医院临床水平、改进医院运营管理提供了数字化的依据。随着当前医疗数据的不断积累，医疗开始进入大数据时代。大数据时代之前，人们获得的信息贫乏，只能依靠碎片化零星化的信息来对未知全貌的事物做出判断，这种判断结果最后都会与实际有很大偏差。而大数据是在时空维度上的全新数据，且源头多个，方向不同，对一个对象进行全方位数据记录，数据之间可以相互应着的多元数据。大数据是将众多小数据拼接起来，同时把决定事物性状的、反应规律的、决定走向的点找出来，呈现出一个更加接近本质的全景图。这幅全景图减少了未来的不确定性，使人类将对未知世界的挑战进行充分准备，帮助我们更加准确地分析判断。当大数据与人工智能相结合，就能对医疗科研和应用产生巨大的推动。

当前，冠心病等病种积累了大量的临床数据，甚至形成了专门服务于医学科研的专病数据库。从已有的临床数据中，可以构建模型，为临床判断提供辅助决策依据。但在现有技术中，对冠心病住院患者死亡概率的预测无法做到针对具体患者估算概率，只能根据历史上该病种的死亡数计算整体上的死亡概率。这就无法得到个性化的死亡概率预测，影响疾病的精准治疗。

发明内容

本发明的目的在于提供对冠心病住院患者死亡概率预测的方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：对冠心病住院患者死亡概率预测的方法，包括以下步骤：步骤一，目标定义；步骤二，数据采集；步骤三，构建预测模型；步骤四，模型效果评价；步骤五，模型的验证与更新；

其中在上述步骤一中，将死亡概率预测的问题转化为适合人工智能项目的问题，即住院期间是否死亡的分类问题；

其中在上述步骤二中，通过不同数据源采集模型构建所需的数据；

其中在上述步骤三中，具体包括以下步骤：

3.1数据理解和数据预处理：处理数据噪声、数据冗余和数据丢失，对数据进行初步分析与探索，制作出数据集；

3.2特征工程：通过特征工程获取数据集中可解释的优质特征；

3.3模型训练：利用优质特征作为自变量，在院内是否死亡的结局作为因变量构建一个分类模型，把数据集分为训练集和验证集，利用训练集进行模型训练，将验证集代入训练好的模型，调整模型参数并进行模型优化；

其中在上述步骤四中，通过评价指标评估模型的性能；

其中在上述步骤五中，通过外部验证集对模型验证，验证通过后，将模型用于新的住院冠心病患者，观察记录模型的有效性，对模型效果进行动态监控，并对模型进行不断改进。

优选的，所述步骤二中，数据源包括医院业务系统、医疗影像仪器和生理信号测量仪。

优选的，所述步骤二中，模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息。

优选的，所述患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据；患者入院后每天的血压、血脂、血糖的时间序列数据；患者在历史上的冠心病发病、住院的信息；患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息；住院时是否能自行行走。

优选的，所述就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用)。

优选的，所述科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率，医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率。

优选的，所述步骤3.2中，优质特征的获取方法具体为：

3.2.1将时间序列数据拆分为三个部分：

y(t)＝g(t)+s(t)+h；

其中，g(t)表示整体趋势，s(t)表示周期性因素，h表示测量误差；

对于长期趋势g(t)，采用线性函数来拟合：

g(t)＝kt+m；

拟合出的参数k和m作为后续建模的特征；

对于周期性因素s(t)，采用傅里叶级数来拟合：

拟合出的参数a，b，n，P作为后续建模的特征；

3.2.2入院以后重要指标在各个时间点的趋势特征:

R_t＝log_e(P_t)-log_e(P_t-1)；

其中P(t)代表t时刻的指标值，P(t-1)代表t-1时刻的指标值，R(t)是计算出来的指标在各个时间点的趋势变动，作为后续建模的特征。

优选的，所述步骤3.3中，分类模型为Light GBM(Light Gradient BoostingMachine)。

优选的，所述步骤四中，评价指标为F1值或者AUC指标。

与现有技术相比，本发明的有益效果是：本发明利用利用机器学习技针对冠心病住院患者的全维度信息进行分析，对具体患者的死亡概率进行预测，从而为临床判断提供辅助决策依据，提高临床判断的准确性和时效性，医生和病人借助该预测模型可以更好的做出共同决策，政府部门与卫生管理者也能更好的进行医疗质量管理，合理的配置医疗资源。

附图说明

图1为本发明的方法流程图；

图2为本发明的技术架构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，本发明提供的一种实施例：对冠心病住院患者死亡概率预测的方法，包括以下步骤：步骤一，目标定义；步骤二，数据采集；步骤三，构建预测模型；步骤四，模型效果评价；步骤五，模型的验证与更新；

其中在上述步骤二中，通过不同数据源采集模型构建所需的数据；其中，数据源包括医院业务系统、医疗影像仪器和生理信号测量仪；模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息，患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据；患者入院后每天的血压、血脂、血糖的时间序列数据；患者在历史上的冠心病发病、住院的信息；患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息；住院时是否能自行行走；就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用)；科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率，医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率；

其中在上述步骤三中，具体包括以下步骤：

3.2特征工程：通过特征工程获取数据集中可解释的优质特征，具体为：

3.2.1将时间序列数据拆分为三个部分：

y(t)＝g(t)+s(t)+h；

对于长期趋势g(t)，采用线性函数来拟合：

g(t)＝kt+m；

拟合出的参数k和m作为后续建模的特征；

对于周期性因素s(t)，采用傅里叶级数来拟合：

拟合出的参数a，b，n，P作为后续建模的特征；

3.2.2入院以后重要指标在各个时间点的趋势特征:

R_t＝log_e(P_t)-log_e(P_t-1)；

其中P(t)代表t时刻的指标值，P(t-1)代表t-1时刻的指标值，R(t)是计算出来的指标在各个时间点的趋势变动，作为后续建模的特征；

3.3模型训练：利用优质特征作为自变量，在院内是否死亡的结局作为因变量构建一个分类模型，把数据集分为训练集和验证集，利用训练集进行模型训练，将验证集代入训练好的模型，调整模型参数并进行模型优化；其中，分类模型为Light GBM；

其中在上述步骤四中，通过评价指标F1值或者AUC指标评估模型的性能；

基于上述，本发明的优点在于，本发明通过在获取整体发展特征和其他本质特征时，分解相关的时间序列特征，以及计算入院以后重要指标在各个时间点的趋势特征，从而获取优质特征，并将其运用于预测模型的建立；而本发明所采用的Light GBM模型相比逻辑回归，具有更高的准确率，相比GBDT和XGB，具有更快的训练速度、更低的内存消耗和更好的准确率；本发明利用预测模型针对冠心病住院患者的全维度信息进行分析，对具体患者的死亡概率进行预测，从而为临床判断提供辅助决策依据，提高临床判断的准确性和时效性，医生和病人借助该预测模型可以更好的做出共同决策，政府部门与卫生管理者也能更好的进行医疗质量管理，合理的配置医疗资源。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.对冠心病住院患者死亡概率预测的方法，包括以下步骤：步骤一，目标定义；步骤二，数据采集；步骤三，构建预测模型；步骤四，模型效果评价；步骤五，模型的验证与更新；其特征在于：

其中在上述步骤三中，具体包括以下步骤：

3.1数据理解和数据预处理：处理数据噪声、数据冗余和数据丢失，

对数据进行初步分析与探索，制作出数据集；

其中在上述步骤四中，通过评价指标评估模型的性能；

2.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述步骤二中，数据源包括医院业务系统、医疗影像仪器和生理信号测量仪。

3.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述步骤二中，模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息。

4.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据；患者入院后每天的血压、血脂、血糖的时间序列数据；患者在历史上的冠心病发病、住院的信息；患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息；住院时是否能自行行走。

5.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用)。

6.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率，医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率。

7.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述步骤3.2中，优质特征的获取方法具体为：

3.2.1将时间序列数据拆分为三个部分：

y(t)＝g(t)+s(t)+h；

对于长期趋势g(t)，采用线性函数来拟合：

g(t)＝kt+m；

拟合出的参数k和m作为后续建模的特征；

对于周期性因素s(t)，采用傅里叶级数来拟合：

拟合出的参数a，b，n，P作为后续建模的特征；

3.2.2入院以后重要指标在各个时间点的趋势特征:

R_t＝log_e(P_t)-log_e(P_t-1)；

8.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述步骤3.3中，分类模型为Light GBM(Light Gradient Boosting Machine)。

9.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法，其特征在于：所述步骤四中，评价指标为F1值或者AUC指标。