CN116230222A - 对冠心病住院患者死亡概率预测的方法 - Google Patents

对冠心病住院患者死亡概率预测的方法 Download PDF

Info

Publication number
CN116230222A
CN116230222A CN202211597551.1A CN202211597551A CN116230222A CN 116230222 A CN116230222 A CN 116230222A CN 202211597551 A CN202211597551 A CN 202211597551A CN 116230222 A CN116230222 A CN 116230222A
Authority
CN
China
Prior art keywords
model
information
data
heart disease
coronary heart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211597551.1A
Other languages
English (en)
Inventor
尤丽珏
陈龙
曲新凯
刘伊威
陈裔
曹译
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huadong Hospital
Original Assignee
Huadong Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huadong Hospital filed Critical Huadong Hospital
Priority to CN202211597551.1A priority Critical patent/CN116230222A/zh
Publication of CN116230222A publication Critical patent/CN116230222A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • G16H10/65ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records stored on portable record carriers, e.g. on smartcards, RFID tags or CD
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了对冠心病住院患者死亡概率预测的方法,包括以下步骤:步骤一,目标定义;步骤二,数据采集;步骤三,构建预测模型;步骤四,模型效果评价;步骤五,模型的验证与更新;所述步骤二中,模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息;所述步骤四中,评价指标为F1值或者AUC指标;本发明利用利用机器学习技针对冠心病住院患者的全维度信息进行分析,对具体患者的死亡概率进行预测,从而为临床判断提供辅助决策依据,提高临床判断的准确性和时效性,医生和病人借助该预测模型可以更好的做出共同决策,政府部门与卫生管理者也能更好的进行医疗质量管理,合理的配置医疗资源。

Description

对冠心病住院患者死亡概率预测的方法
技术领域
本发明涉及机器学习技术领域,具体为对冠心病住院患者死亡概率预测的方法。
背景技术
预测重点关注疾病住院患者在院内死亡的概率,对于医院临床治疗、疾病风险管理和运营管理而言非常重要。通过各种设备采集大量的数据,并通过大数据的方法来进行预测,为医院进行及时干预、改进医院临床水平、改进医院运营管理提供了数字化的依据。随着当前医疗数据的不断积累,医疗开始进入大数据时代。大数据时代之前,人们获得的信息贫乏,只能依靠碎片化零星化的信息来对未知全貌的事物做出判断,这种判断结果最后都会与实际有很大偏差。而大数据是在时空维度上的全新数据,且源头多个,方向不同,对一个对象进行全方位数据记录,数据之间可以相互应着的多元数据。大数据是将众多小数据拼接起来,同时把决定事物性状的、反应规律的、决定走向的点找出来,呈现出一个更加接近本质的全景图。这幅全景图减少了未来的不确定性,使人类将对未知世界的挑战进行充分准备,帮助我们更加准确地分析判断。当大数据与人工智能相结合,就能对医疗科研和应用产生巨大的推动。
当前,冠心病等病种积累了大量的临床数据,甚至形成了专门服务于医学科研的专病数据库。从已有的临床数据中,可以构建模型,为临床判断提供辅助决策依据。但在现有技术中,对冠心病住院患者死亡概率的预测无法做到针对具体患者估算概率,只能根据历史上该病种的死亡数计算整体上的死亡概率。这就无法得到个性化的死亡概率预测,影响疾病的精准治疗。
发明内容
本发明的目的在于提供对冠心病住院患者死亡概率预测的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:对冠心病住院患者死亡概率预测的方法,包括以下步骤:步骤一,目标定义;步骤二,数据采集;步骤三,构建预测模型;步骤四,模型效果评价;步骤五,模型的验证与更新;
其中在上述步骤一中,将死亡概率预测的问题转化为适合人工智能项目的问题,即住院期间是否死亡的分类问题;
其中在上述步骤二中,通过不同数据源采集模型构建所需的数据;
其中在上述步骤三中,具体包括以下步骤:
3.1数据理解和数据预处理:处理数据噪声、数据冗余和数据丢失,对数据进行初步分析与探索,制作出数据集;
3.2特征工程:通过特征工程获取数据集中可解释的优质特征;
3.3模型训练:利用优质特征作为自变量,在院内是否死亡的结局作为因变量构建一个分类模型,把数据集分为训练集和验证集,利用训练集进行模型训练,将验证集代入训练好的模型,调整模型参数并进行模型优化;
其中在上述步骤四中,通过评价指标评估模型的性能;
其中在上述步骤五中,通过外部验证集对模型验证,验证通过后,将模型用于新的住院冠心病患者,观察记录模型的有效性,对模型效果进行动态监控,并对模型进行不断改进。
优选的,所述步骤二中,数据源包括医院业务系统、医疗影像仪器和生理信号测量仪。
优选的,所述步骤二中,模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息。
优选的,所述患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据;患者入院后每天的血压、血脂、血糖的时间序列数据;患者在历史上的冠心病发病、住院的信息;患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息;住院时是否能自行行走。
优选的,所述就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用)。
优选的,所述科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率,医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率。
优选的,所述步骤3.2中,优质特征的获取方法具体为:
3.2.1将时间序列数据拆分为三个部分:
y(t)=g(t)+s(t)+h;
其中,g(t)表示整体趋势,s(t)表示周期性因素,h表示测量误差;
对于长期趋势g(t),采用线性函数来拟合:
g(t)=kt+m;
拟合出的参数k和m作为后续建模的特征;
对于周期性因素s(t),采用傅里叶级数来拟合:
Figure BDA0003993899230000031
拟合出的参数a,b,n,P作为后续建模的特征;
3.2.2入院以后重要指标在各个时间点的趋势特征:
Rt=loge(Pt)-loge(Pt-1);
其中P(t)代表t时刻的指标值,P(t-1)代表t-1时刻的指标值,R(t)是计算出来的指标在各个时间点的趋势变动,作为后续建模的特征。
优选的,所述步骤3.3中,分类模型为Light GBM(Light Gradient BoostingMachine)。
优选的,所述步骤四中,评价指标为F1值或者AUC指标。
与现有技术相比,本发明的有益效果是:本发明利用利用机器学习技针对冠心病住院患者的全维度信息进行分析,对具体患者的死亡概率进行预测,从而为临床判断提供辅助决策依据,提高临床判断的准确性和时效性,医生和病人借助该预测模型可以更好的做出共同决策,政府部门与卫生管理者也能更好的进行医疗质量管理,合理的配置医疗资源。
附图说明
图1为本发明的方法流程图;
图2为本发明的技术架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供的一种实施例:对冠心病住院患者死亡概率预测的方法,包括以下步骤:步骤一,目标定义;步骤二,数据采集;步骤三,构建预测模型;步骤四,模型效果评价;步骤五,模型的验证与更新;
其中在上述步骤一中,将死亡概率预测的问题转化为适合人工智能项目的问题,即住院期间是否死亡的分类问题;
其中在上述步骤二中,通过不同数据源采集模型构建所需的数据;其中,数据源包括医院业务系统、医疗影像仪器和生理信号测量仪;模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息,患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据;患者入院后每天的血压、血脂、血糖的时间序列数据;患者在历史上的冠心病发病、住院的信息;患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息;住院时是否能自行行走;就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用);科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率,医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率;
其中在上述步骤三中,具体包括以下步骤:
3.1数据理解和数据预处理:处理数据噪声、数据冗余和数据丢失,对数据进行初步分析与探索,制作出数据集;
3.2特征工程:通过特征工程获取数据集中可解释的优质特征,具体为:
3.2.1将时间序列数据拆分为三个部分:
y(t)=g(t)+s(t)+h;
其中,g(t)表示整体趋势,s(t)表示周期性因素,h表示测量误差;
对于长期趋势g(t),采用线性函数来拟合:
g(t)=kt+m;
拟合出的参数k和m作为后续建模的特征;
对于周期性因素s(t),采用傅里叶级数来拟合:
Figure BDA0003993899230000051
拟合出的参数a,b,n,P作为后续建模的特征;
3.2.2入院以后重要指标在各个时间点的趋势特征:
Rt=loge(Pt)-loge(Pt-1);
其中P(t)代表t时刻的指标值,P(t-1)代表t-1时刻的指标值,R(t)是计算出来的指标在各个时间点的趋势变动,作为后续建模的特征;
3.3模型训练:利用优质特征作为自变量,在院内是否死亡的结局作为因变量构建一个分类模型,把数据集分为训练集和验证集,利用训练集进行模型训练,将验证集代入训练好的模型,调整模型参数并进行模型优化;其中,分类模型为Light GBM;
其中在上述步骤四中,通过评价指标F1值或者AUC指标评估模型的性能;
其中在上述步骤五中,通过外部验证集对模型验证,验证通过后,将模型用于新的住院冠心病患者,观察记录模型的有效性,对模型效果进行动态监控,并对模型进行不断改进。
基于上述,本发明的优点在于,本发明通过在获取整体发展特征和其他本质特征时,分解相关的时间序列特征,以及计算入院以后重要指标在各个时间点的趋势特征,从而获取优质特征,并将其运用于预测模型的建立;而本发明所采用的Light GBM模型相比逻辑回归,具有更高的准确率,相比GBDT和XGB,具有更快的训练速度、更低的内存消耗和更好的准确率;本发明利用预测模型针对冠心病住院患者的全维度信息进行分析,对具体患者的死亡概率进行预测,从而为临床判断提供辅助决策依据,提高临床判断的准确性和时效性,医生和病人借助该预测模型可以更好的做出共同决策,政府部门与卫生管理者也能更好的进行医疗质量管理,合理的配置医疗资源。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (9)

1.对冠心病住院患者死亡概率预测的方法,包括以下步骤:步骤一,目标定义;步骤二,数据采集;步骤三,构建预测模型;步骤四,模型效果评价;步骤五,模型的验证与更新;其特征在于:
其中在上述步骤一中,将死亡概率预测的问题转化为适合人工智能项目的问题,即住院期间是否死亡的分类问题;
其中在上述步骤二中,通过不同数据源采集模型构建所需的数据;
其中在上述步骤三中,具体包括以下步骤:
3.1数据理解和数据预处理:处理数据噪声、数据冗余和数据丢失,
对数据进行初步分析与探索,制作出数据集;
3.2特征工程:通过特征工程获取数据集中可解释的优质特征;
3.3模型训练:利用优质特征作为自变量,在院内是否死亡的结局作为因变量构建一个分类模型,把数据集分为训练集和验证集,利用训练集进行模型训练,将验证集代入训练好的模型,调整模型参数并进行模型优化;
其中在上述步骤四中,通过评价指标评估模型的性能;
其中在上述步骤五中,通过外部验证集对模型验证,验证通过后,将模型用于新的住院冠心病患者,观察记录模型的有效性,对模型效果进行动态监控,并对模型进行不断改进。
2.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述步骤二中,数据源包括医院业务系统、医疗影像仪器和生理信号测量仪。
3.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述步骤二中,模型构建所需的数据包括患者的信息、就诊的信息、科室的信息和医生的信息。
4.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述患者的信息包括患者入院前的历史血压、血脂、血糖的时间序列数据;患者入院后每天的血压、血脂、血糖的时间序列数据;患者在历史上的冠心病发病、住院的信息;患者其他疾病(如脑梗塞、糖尿病)的发病、住院的信息;住院时是否能自行行走。
5.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述就诊的信息包括就诊的月份、本次住院时的发病时长、重要并发症的信息(如糖尿病)、检查的信息(进行CT影像学检查的时间、进行临床实验室检查的时间、是否进行深静脉血栓风险评估及时间、是否进行血管评价及时间)、用药的信息(是否进行静脉溶栓及时间、是否进行抗血小板药物治疗及时间、是否使用他汀类药物及用药时间、是否使用抗血栓药物及用药时间)等、费用的信息(个人支付费用、医保支付费用)。
6.根据权利要求3所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述科室的信息为该科室过去5年每个月冠心病患者整体上的住院死亡率,医生的信息为主治医生过去5年每个月冠心病患者整体上的住院死亡率。
7.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述步骤3.2中,优质特征的获取方法具体为:
3.2.1将时间序列数据拆分为三个部分:
y(t)=g(t)+s(t)+h;
其中,g(t)表示整体趋势,s(t)表示周期性因素,h表示测量误差;
对于长期趋势g(t),采用线性函数来拟合:
g(t)=kt+m;
拟合出的参数k和m作为后续建模的特征;
对于周期性因素s(t),采用傅里叶级数来拟合:
Figure FDA0003993899220000031
拟合出的参数a,b,n,P作为后续建模的特征;
3.2.2入院以后重要指标在各个时间点的趋势特征:
Rt=loge(Pt)-loge(Pt-1);
其中P(t)代表t时刻的指标值,P(t-1)代表t-1时刻的指标值,R(t)是计算出来的指标在各个时间点的趋势变动,作为后续建模的特征。
8.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述步骤3.3中,分类模型为Light GBM(Light Gradient Boosting Machine)。
9.根据权利要求1所述的对冠心病住院患者死亡概率预测的方法,其特征在于:所述步骤四中,评价指标为F1值或者AUC指标。
CN202211597551.1A 2022-12-12 2022-12-12 对冠心病住院患者死亡概率预测的方法 Pending CN116230222A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211597551.1A CN116230222A (zh) 2022-12-12 2022-12-12 对冠心病住院患者死亡概率预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211597551.1A CN116230222A (zh) 2022-12-12 2022-12-12 对冠心病住院患者死亡概率预测的方法

Publications (1)

Publication Number Publication Date
CN116230222A true CN116230222A (zh) 2023-06-06

Family

ID=86586206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211597551.1A Pending CN116230222A (zh) 2022-12-12 2022-12-12 对冠心病住院患者死亡概率预测的方法

Country Status (1)

Country Link
CN (1) CN116230222A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117672495A (zh) * 2023-11-30 2024-03-08 北京医院 基于人工智能的房颤合并冠心病患者远期死亡率预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117672495A (zh) * 2023-11-30 2024-03-08 北京医院 基于人工智能的房颤合并冠心病患者远期死亡率预测方法
CN117672495B (zh) * 2023-11-30 2024-05-14 北京医院 基于人工智能的房颤合并冠心病患者远期死亡率预测方法

Similar Documents

Publication Publication Date Title
Zhang et al. Patient2vec: A personalized interpretable deep representation of the longitudinal electronic health record
Shickel et al. DeepSOFA: a continuous acuity score for critically ill patients using clinically interpretable deep learning
Moreira et al. A comprehensive review on smart decision support systems for health care
KR102216689B1 (ko) 시계열 의료 데이터를 통한 질병 예후 예측을 위한 딥 뉴럴 네트워크의 분류 결과 시각화 방법 및 시스템
Ambekar et al. Disease risk prediction by using convolutional neural network
US20220254493A1 (en) Chronic disease prediction system based on multi-task learning model
Knaus et al. The SUPPORT prognostic model: Objective estimates of survival for seriously ill hospitalized adults
US20170249434A1 (en) Multi-format, multi-domain and multi-algorithm metalearner system and method for monitoring human health, and deriving health status and trajectory
JP2023544550A (ja) 機械学習支援される認知的評価および処置のためのシステムおよび方法
Pal et al. Deep learning techniques for prediction and diagnosis of diabetes mellitus
Theerthagiri et al. Diagnosis and classification of the diabetes using machine learning algorithms
CN111951965A (zh) 基于时序知识图谱的全景式健康动态监测与预测系统
Javed et al. Artificial intelligence for cognitive health assessment: state-of-the-art, open challenges and future directions
Llamocca et al. Personalized characterization of emotional states in patients with bipolar disorder
CN115249541A (zh) 一种基于深度学习的动态血糖预测模型构建方法
Sheikhalishahi et al. Benchmarking machine learning models on eICU critical care dataset
CN116230222A (zh) 对冠心病住院患者死亡概率预测的方法
Gangwar et al. Deep learning for analysis of electronic health records (EHR)
Thilakarathne et al. Artificial Intelligence-Enabled IoT for Health and Wellbeing Monitoring
CN116959715B (zh) 一种基于时序演进过程解释的疾病预后预测系统
CN114504298B (zh) 基于多源健康感知数据融合的生理特征判别方法及系统
Basha et al. Deep learning neural network (DLNN)-based classification and optimization algorithm for organ inflammation disease diagnosis
Iapăscurtă A less traditional approach to biomedical signal processing for sepsis prediction
CN113990502A (zh) 一种基于异构图神经网络的icu心衰预测系统
Bhardwaj et al. Improved healthcare monitoring of coronary heart disease patients in time-series fashion using deep learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination