CN117133471A - 急性主动脉夹层疾病的输血预测方法、系统、设备及介质 - Google Patents
急性主动脉夹层疾病的输血预测方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117133471A CN117133471A CN202311048285.1A CN202311048285A CN117133471A CN 117133471 A CN117133471 A CN 117133471A CN 202311048285 A CN202311048285 A CN 202311048285A CN 117133471 A CN117133471 A CN 117133471A
- Authority
- CN
- China
- Prior art keywords
- blood transfusion
- patient
- transfusion
- data
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000008280 blood Substances 0.000 title claims abstract description 213
- 210000004369 blood Anatomy 0.000 title claims abstract description 213
- 238000000034 method Methods 0.000 title claims abstract description 53
- 208000002251 Dissecting Aneurysm Diseases 0.000 title claims abstract description 38
- 206010002895 aortic dissection Diseases 0.000 title claims abstract description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 33
- 230000001154 acute effect Effects 0.000 title claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 238000010801 machine learning Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims description 29
- 238000004393 prognosis Methods 0.000 claims description 16
- 208000007502 anemia Diseases 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 102000001554 Hemoglobins Human genes 0.000 claims description 8
- 108010054147 Hemoglobins Proteins 0.000 claims description 8
- 238000009825 accumulation Methods 0.000 claims description 8
- 201000010099 disease Diseases 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 7
- 238000010219 correlation analysis Methods 0.000 claims description 7
- 238000011161 development Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000005399 mechanical ventilation Methods 0.000 claims description 5
- 206010057751 Post procedural discharge Diseases 0.000 claims description 4
- 238000000540 analysis of variance Methods 0.000 claims description 4
- 238000013075 data extraction Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000000546 chi-square test Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 description 19
- 239000010836 blood and blood product Substances 0.000 description 8
- 229940125691 blood product Drugs 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 230000002980 postoperative effect Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000001356 surgical procedure Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000002699 waste material Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000035965 Postoperative Complications Diseases 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013103 analytical ultracentrifugation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Infusion, Injection, And Reservoir Apparatuses (AREA)
Abstract
本发明公开一种急性主动脉夹层疾病的输血预测方法、系统、设备及介质,涉及医疗技术领域。该方法包括:建立历史患者数据集;历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;根据历史患者的临床资料确定历史患者的输血相关特征;采用机器学习算法,根据历史患者的输血相关特征和历史患者的输血决策,训练输血预测模型;输血预测模型包括:输血分类模型和输血量预测模型;输血分类模型用于预测是否输血;输血量预测模型用于预测输血量;获取待测患者的临床资料,并利用输血预测模型,根据待测患者的临床资料,预测得到待测患者的输血决策。本发明能够实现准确预测急性主动脉夹层疾病患者术中或术后是否需要输血以及输血量。
Description
技术领域
本发明涉及医疗技术领域,特别是涉及一种急性主动脉夹层疾病的输血预测方法、系统、设备及介质。
背景技术
急性主动脉夹层疾病是心血管疾病中最为凶险的疾病之一,其死亡率在65%-70%左右,因此早期的外科急诊手术治疗是必要的。由于主动脉夹层手术是需要更换夹层累及的大血管,因此术中需要的血制品种类和数量较大,一般输血率为40%-90%。在临床上,手术中大量输血并没有较好的指导方案,一般主刀医生会根据个人经验来提前申请血制品,这会导致一些不必要的血制品浪费。短期内需要准备大量的血制品对于医院输血科及血库都是不小的考验,如果准备过多会造成血制品的浪费,如果准备过少则会导致手术用血不够,严重的甚至能够影响手术安全及效果。此外,输血治疗是一把双刃剑,过度输血会导致患者术后呼吸、循环和神经系统并发症。主动脉夹层手术用血量大,影响输血的因素多,目前暂无能够预测该类手术输血的模型。
发明内容
本发明的目的是提供一种急性主动脉夹层疾病的输血预测方法、系统、设备及介质,以实现准确预测急性主动脉夹层疾病患者术中或术后是否需要输血以及输血量。
为实现上述目的,本发明提供了如下方案:
一种急性主动脉夹层疾病的输血预测方法,所述输血预测方法包括:
建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量;
根据所述历史患者的临床资料确定历史患者的输血相关特征;
采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量;
获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
可选地,所述历史患者数据集还包括:历史患者的预后情况;所述预后情况包括:术后是否贫血、术后引流量、机械通气时间和住院天数;所述输血预测方法还包括:
获取待测患者的预后情况;
采用倾向得分匹配算法,根据所述待测患者的预后情况和所述历史患者数据集,确定待测患者的输血误差;
将所述待测患者的输血误差反馈至所述输血预测模型,以对所述输血预测模型进行修正。
可选地,所述输血预测方法还包括:
根据所述待测患者的临床资料、所述待测患者的输血决策和所述待测患者的预后情况更新所述历史患者数据集,以对所述输血预测模型进行更新。
可选地,根据所述历史患者的临床资料确定历史患者的输血相关特征,具体包括:
对所述历史患者的临床资料进行特征抽取,得到历史患者的原始特征;
采用特征分析方法对所述历史患者的原始特征进行重要性和相关性分析,得到历史患者的输血相关特征;所述输血相关特征为与所述输血决策的相关程度大于第一设定值且与其他原始特征的相关程度小于第二设定值的若干个原始特征。
可选地,所述特征分析方法包括:Person相关性分析、卡方检验、方差分析和随机森林中的至少一项。
可选地,采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型,具体包括:
将所述历史患者的输血相关特征和所述历史患者的输血决策确定为训练数据集,并将所述训练数据集按照设定比例划分为开发集和测试集;
采用机器学习算法,并结合交叉验证方法和超参数优化算法,根据所述开发集训练初步预测模型;
根据所述测试集对所述初步预测模型的预测效果进行测试,得到测试结果;所述测试结果包括:RUC曲线、PR曲线、AUC和误差平方和中的至少一项;
若所述测试结果不满足设定要求,则对所述机器学习算法进行调整,并重新训练初步预测模型;
若所述测试结果满足设定要求,则将所述初步预测模型确定为输血预测模型。
可选地,所述机器学习算法包括:XGBoost、Bayesian和Deep Learning中的至少一项;所述超参数优化算法包括:Hyperopt。
一种急性主动脉夹层疾病的输血预测系统,所述输血预测系统包括:
数据抽取模块,用于建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量;
特征工程模块,用于根据所述历史患者的临床资料确定历史患者的输血相关特征;
模型构建模块,用于采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量;
个体应用模块,用于获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述的急性主动脉夹层疾病的输血预测方法。
一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述的急性主动脉夹层疾病的输血预测方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的急性主动脉夹层疾病的输血预测方法,通过建立历史患者数据集,从中确定对输血决策影响较大的输血相关特征,并根据输血相关特征和对应的输血决策,采用机器学习算法训练输血预测模型,从而能够根据待测患者的临床资料,准确预测待测患者术中或术后是否需要输血以及输血量。因此,采用本发明提供的急性主动脉夹层疾病的输血预测方法能够为主刀医生提供更加准确的输血预测,以辅助其决策,从而减少不必要的血制品资源浪费,尽可能救治更多的患者,保证了治疗过程的有效性和安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的急性主动脉夹层疾病的输血预测方法的流程图;
图2为本发明提供的急性主动脉夹层疾病的输血预测方法的具体流程图;
图3为本发明提供的急性主动脉夹层疾病的输血预测模型的构建流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种急性主动脉夹层疾病的输血预测方法、系统、设备及介质,以实现准确预测急性主动脉夹层疾病患者术中或术后是否需要输血以及输血量。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
本发明实施例提供一种急性主动脉夹层疾病的输血预测方法。如图1所示,所述输血预测方法包括:
步骤S1:建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量。
步骤S2:根据所述历史患者的临床资料确定历史患者的输血相关特征。
步骤S3:采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量。
步骤S4:获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
进一步地,所述历史患者数据集还包括:历史患者的预后情况;所述预后情况包括:术后是否贫血、术后引流量、机械通气时间和住院天数;所述输血预测方法还包括:
步骤S5:获取待测患者的预后情况。
步骤S6:采用倾向得分匹配(Propensity Score Matching,PSM)算法,根据所述待测患者的预后情况和所述历史患者数据集,确定待测患者的输血误差。
步骤S7:将所述待测患者的输血误差反馈至所述输血预测模型,以对所述输血预测模型进行修正。
进一步地,所述输血预测方法还包括:
步骤S8:根据所述待测患者的临床资料、所述待测患者的输血决策和所述待测患者的预后情况更新所述历史患者数据集,以对所述输血预测模型进行更新。
下面结合图2和图3,分别从以下六个方面对上述输血预测方法进行详细论述,包括:(1)基本数据资料的抓取、(2)分析数据并找出特征量、(3)建立预测模型、(4)导入数据并预测输血结果、(5)评价预测输血效果和(6)根据评价结果修正预测模型。
1、基本数据资料的抓取。通过抓取历史患者的基本数据资料建立历史患者数据集。
患者信息的抓取采用编程方法,构建自动抓取程序嵌入到病例系统中,当然不限于此方法,也包括人工收集的补充,具体搜索关键词包括“急性主动脉夹层”等,重点收集患者的术前数据集、术中数据集、输血相关数据集和预后数据集。其中,术前数据集包括患者性别、年龄、身高、体重等因素,术中数据集包括手术方式、手术时间、体外循环时间等,输血相关数据包括输血量、输血种类、输血次数、输注后血红蛋白指标等,预后数据集包括患者是否死亡、术后相关心血管并发症、术后住院天数和机械通气天数等。
通过接入医院HIS(Hospital Information System,医院信息系统)、LIS(Laboratory Information System,实验室信息系统)、PACS(Picture Archiving andCommunication system,医学影像存贮与传输系统)等信息系统,实现患者全量临床数据互通操作。抓取院内患者的信息根据数据类型可分为以下三种:结构化信息:如患者实验室检查、入院记录等信息多是以结构化的形式存储。这类数据经过简单处理可以直接用于模型构建;文本信息(非结构化信息):如患者文本、病历等。这类数据都是使用自然语言记录,需要将其中信息抽取出来及其后处理方可使用;影像信息:如患者CT(Computed Tomography,电子计算机断层扫描)、MRI(Magnetic resonance imaging,核磁共振成像)等影像信息。这类数据需要从图像中抽取有用信息,按照图像和文字两种类型储存,其中图像是相关辅助检查的图像资料,文字是根据每位患者的辅助检查报告,提取出相应的关键内容,比如主要诊断、描述、病灶大小、位置等信息。方可和上面两部分信息结合用于后续分析与建模。
在上述步骤中,默认患者收录条件为:诊断为急性主动脉夹层并做手术的患者,可以自动依据此条件对患者进行全量数据提取,以供后续特征工程处理。支持用户在此基础上添加新的纳排条件。为了识别和提取患者历史所有数据,还内置了EMPI(EnterpriseMasterPatient Index,企业级患者主索引)等智能数据处理和识别程序。
2、分析数据并找出特征量。通过对历史患者的临床资料进行分析以确定历史患者的输血相关特征。
上述步骤具体包括:对所述历史患者的临床资料进行特征抽取,得到历史患者的原始特征;采用特征分析方法对所述历史患者的原始特征进行重要性和相关性分析,得到历史患者的输血相关特征;所述输血相关特征为与所述输血决策的相关程度大于第一设定值且与其他原始特征的相关程度小于第二设定值的若干个原始特征。
其中,所述特征分析方法包括:Person相关性分析、卡方检验、方差分析和随机森林中的至少一项。
具体地,利用常规机器学习方法,如Catboost、Gradientboosting等挖掘出数据集里与输血相关的特征量,并将这些特征量定性分析,为后面建立预测模型做准备。之后系统(即为了执行上述输血预测方法所构建的输血预测系统)根据用户指定的特征池,实现对样本自动特征提取、离散化等功能。对于不同的数据类型其处理方法如下:(1)结构化信息:如患者可能需要做多次血常规检查,为了预测术中是否需要输血,取每种检查项术前最近一条。用户也可以自定义取值方式:取均值、最大值等。(2)文本信息:采用NLP(NaturalLanguage Processing,自然语言处理)模型,从文本信息中进行特征抽取。用户也可以自己标注一部分患者病历,然后进行特定字段的抽取。如患者的吸烟史、饮酒史等特征。(3)影像信息:采用Deep Learning(深度学习)模型,可根据需求抽取影像中指定特征。用户可人工标注或者分割,以便获取指定特征(可参考影像组学)。(4)衍生特征:用户可根据需要利用患者基本信息衍生新的特征,比如使用体重和身高衍生BMI。(5)特征离散化:为了使系统更易用、更符合临床习惯。系统内置多种连续变量离散化方法:用户自定义、分位数等。如将年龄根据临床习惯划分为少年、中年、老年。(6)特征选择:用户自定义的特征池或者系统自生成的特征会很多,并非每个特征都对预测是否输血/输多少血起重要作用,有些特征间呈高度相关性。系统内置了Person相关分析、卡方检验、方差分析、随机森林等算法评价每个特征重要性以及相关性。并且,系统内置了急性主动脉夹层相关的知识图谱,结合特征重要性、相关性评价,可自动选择重要且互不相关的特征构建模型。用户也可自定义选择输血相关特征。
3、建立预测模型。即采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型。
上述步骤具体包括:将所述历史患者的输血相关特征和所述历史患者的输血决策确定为训练数据集,并将所述训练数据集按照设定比例划分为开发集和测试集;采用机器学习算法,并结合交叉验证方法和超参数优化算法,根据所述开发集训练初步预测模型;根据所述测试集对所述初步预测模型的预测效果进行测试,得到测试结果;所述测试结果包括:RUC曲线、PR曲线、AUC和误差平方和中的至少一项;若所述测试结果不满足设定要求,则对所述机器学习算法进行调整,并重新训练初步预测模型;若所述测试结果满足设定要求,则将所述初步预测模型确定为输血预测模型。
其中,所述机器学习算法包括:XGBoost(eXtreme GradientBoosting,极致梯度提升)、Bayesian(朴素贝叶斯)和Deep Learning中的至少一项;所述超参数优化算法包括:Hyperopt。
作为一种具体的实施方式,可以根据SHAP(Shapley Additive exPlanations)图或AUC(AreaUnderCurve,曲线下面积)来挖掘特征因素和评价不同算法构建模型的拟合度,从而选择最佳的算法预测模型。这些算法会利用患者信息集构建预测模型,并且根据一定比例分配来构建和测试模型,比如70%的数据用于构建模型,30%的数据用于测试模型。
如图3所示,上述输血预测模型的构建具体包括:数据预处理、数据集划分、模型构建、模型选择和模型评价。(1)数据预处理:对经过特征工程处理后的数据进行缺失值、One-hot、Scaling等处理,为后续建模与分析做准备。(2)数据集划分:默认按照7:3对数据集划分为开发集(dev set)和测试集(test set)。前者用来构建模型、选择模型,后者用来评价模型。(3)模型构建:采用XGBoost、Bayesian、Deep Learning等算法,根据因变量类型自动选择不同的算法或者目标函数。比如,XGBoost算法,当用来预测术中是否需要输血,就用二分类目标函数,而预测术中需要输多少血(即输血量),则使用线性目标函数。为了充分训练算法超参和选择模型,还采用了交叉验证(cross validation)和超参数优化算法(如Hyperopt)。(4)模型选择:默认运行符合因变量条件的算法(用户也可自定义),根据表现从中选择最佳的进行后续模型评价。(5)模型评价:利用训练、选择好的模型在测试集上进行评价,使用AUC、误差平方和等指标,RUC曲线、PR曲线等图形评价模型的鲁棒性、准确性。用户根据这些评价指标以决定是否将其作为预测模型:如果模型在测试集上表现不佳,则重新构建算法。反之则可用作预测模型。
4、导入数据并预测输血结果。即获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
本实施例所构建的输血预测模型能够根据患者术前基本资料及术中情况预测术中或术后是否需要输血及输血的预计量,从而保证了更加精准输血。
进一步地,还包括:采用SHAP/LIME等模型解释算法(默认使用SHAP),解释模型为何预测单个个体需要/不需要术中输血,以及输血量,是哪些特征起了正向/反向作用及其权重大小。这样用户可结合临床知识判断系统预测的准确性,以及辅助决策。
进一步地,还可以自动生成个体预测应用网页,该网页自动从业务系统提取/可输入患者信息,然后显示该患者术中是否需要输血及输血量。
5、评价预测输血效果。
具体地,本实施例提供一整套评价体系,根据临床指南及国际标准,涵盖患者输血术后相关指标变化及出院后的预后情况,包括术后的引流量、机械通气时间、住院天数、是否死亡等,预后指标根据不断随访获取,包括患者术后一定时间的复查指标变化等,利用这些数据为输血后的效果进行系统评价,从而为模型预测结果做客观评价。
随着输血预测模型被使用次数增多,医院会逐渐累积新的符合条件患者数据。系统会定时进行模型更新与优化。或者纳入新的医院/中心数据,模型也会根据新的数据集进行更新与优化。因此能够不断提高系统预测的性能。
6、根据评价结果修正预测模型。
本发明提供的输血预测模型具有深度学习和自我改进的潜力,随着患者数据集的不断增添和更新,以及每次预测后都有一个输血疗效评价体系,根据评价结果会反过来重新判断模型中的特征参数的权重和正确性,从而进行自我修正,进一步提高了模型预测的精准性和有效性。
具体地,对于患者术后结局信息(贫血、住院天数等)的累积。本实施例中使用PSM算法结合历史文献形成的知识图谱(术中输血对术后结局影响和权重),以患者术后结局信息为依据,来评价术中输血量预测值的误差。将误差信息反馈给模型,以纠正和优化模型。比如:两个基线和病情相同的患者,只是输血量不同,导致一个患者出现贫血,另一个无该症状。则可认为无症状的患者输血量和有症状的之差为贫血患者预测值的误差。
在具体实施过程中,选取一个医疗中心作为预测模型构建适用的机构,在此机构内安装设计好的数据抓取程序,具体数据项目可根据医疗中心现有的项目类型及临床输血相关可能影响因素进行设定,比如包括诊断、体重、年龄、性别等基本资料,也包括术前主动脉夹层累积范围、术前血红蛋白、术前基础疾病等术前相关临床资料,然后继续抓取患者术中、术后相关指标,比如术中手术操作方式、手术类型、手术时间,及术后相关指标,包括术后并发症、术后引流情况、术后住院天数等,然后将这些数据集打包分类,完成数据抓取第一步。接着利用机器学习方法包括Catboost、Gradientboosting等常用预测模型算法,挖掘出数据集里与输血相关的特征量,比如患者体重低于一定数值的病人更需要输血等特征,并将这些特征量定性分析,为后面建立预测模型做准备。
接着依据这些不同算法的模型绘制出SHAP图或AUC来评价不同算法构建模型的拟合度,从而选择最佳的算法预测模型。当该中心有新的患者住院时可采用此模型预测输血,然后按照模型预测量进行输血治疗,当患者治愈出院后,进一步跟踪随访患者相关预后数据,将这些数据纳入整套客观评价体系评价,根据评价结果反过来重新判断模型中的特征参数的权重和正确性,从而进行自我修正,进一步提高了模型预测的精准性和有效性。形成一个自我学习和自我修正的闭环结构模型,从而能够随着医疗中心治疗主动脉夹层患者的数量增加而变得更能够精准预测。
实施例二
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种急性主动脉夹层疾病的输血预测系统。所述输血预测系统包括:
数据抽取模块,用于建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量。
特征工程模块,用于根据所述历史患者的临床资料确定历史患者的输血相关特征。
模型构建模块,用于采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量。
个体应用模块,用于获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
具体地,本发明提供的输血预测系统直接对接医院各系统,以便获取医院目标人群的所有数据。数据抽取模块负责对医院患者进行EMPI等患者信息集成,根据定义的纳排条件进行目标人群资料抽取,以建立历史患者数据集。特征工程模块负责从目标人群中抽取对应特征,以便后续构建模型。模型构建模块负责使用特征工程抽取的信息构建、优化、评价模型。个体应用模块主要负责预测个体是否输血,以及输血量,并对模型的决策进行可视化展示等。此外,该输血预测系统还包括解释模型构建模块和输血疗效评价模块。解释模型构建模块负责针对输血预测模型构建解释模型,以便和其一起应用于个体应用模块。输血疗效评价模块主要根据患者后期结局对输血决策进行评价,并将评价结果用来优化模型,使系统模型不断进行更新、优化、可持续学习。
实施例三
本发明实施例还提供一种电子设备,包括存储器和处理器,该存储器用于存储计算机程序,该处理器用于运行计算机程序以使电子设备执行实施例一中的急性主动脉夹层疾病的输血预测方法。所述电子设备可以是服务器。
另外,本发明还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一中的急性主动脉夹层疾病的输血预测方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种急性主动脉夹层疾病的输血预测方法,其特征在于,所述输血预测方法包括:
建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量;
根据所述历史患者的临床资料确定历史患者的输血相关特征;
采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量;
获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
2.根据权利要求1所述的急性主动脉夹层疾病的输血预测方法,其特征在于,所述历史患者数据集还包括:历史患者的预后情况;所述预后情况包括:术后是否贫血、术后引流量、机械通气时间和住院天数;所述输血预测方法还包括:
获取待测患者的预后情况;
采用倾向得分匹配算法,根据所述待测患者的预后情况和所述历史患者数据集,确定待测患者的输血误差;
将所述待测患者的输血误差反馈至所述输血预测模型,以对所述输血预测模型进行修正。
3.根据权利要求2所述的急性主动脉夹层疾病的输血预测方法,其特征在于,所述输血预测方法还包括:
根据所述待测患者的临床资料、所述待测患者的输血决策和所述待测患者的预后情况更新所述历史患者数据集,以对所述输血预测模型进行更新。
4.根据权利要求1所述的急性主动脉夹层疾病的输血预测方法,其特征在于,根据所述历史患者的临床资料确定历史患者的输血相关特征,具体包括:
对所述历史患者的临床资料进行特征抽取,得到历史患者的原始特征;
采用特征分析方法对所述历史患者的原始特征进行重要性和相关性分析,得到历史患者的输血相关特征;所述输血相关特征为与所述输血决策的相关程度大于第一设定值且与其他原始特征的相关程度小于第二设定值的若干个原始特征。
5.根据权利要求4所述的急性主动脉夹层疾病的输血预测方法,其特征在于,所述特征分析方法包括:Person相关性分析、卡方检验、方差分析和随机森林中的至少一项。
6.根据权利要求1所述的急性主动脉夹层疾病的输血预测方法,其特征在于,采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型,具体包括:
将所述历史患者的输血相关特征和所述历史患者的输血决策确定为训练数据集,并将所述训练数据集按照设定比例划分为开发集和测试集;
采用机器学习算法,并结合交叉验证方法和超参数优化算法,根据所述开发集训练初步预测模型;
根据所述测试集对所述初步预测模型的预测效果进行测试,得到测试结果;所述测试结果包括:RUC曲线、PR曲线、AUC和误差平方和中的至少一项;
若所述测试结果不满足设定要求,则对所述机器学习算法进行调整,并重新训练初步预测模型;
若所述测试结果满足设定要求,则将所述初步预测模型确定为输血预测模型。
7.根据权利要求6所述的急性主动脉夹层疾病的输血预测方法,其特征在于,所述机器学习算法包括:XGBoost、 Bayesian和Deep Learning中的至少一项;所述超参数优化算法包括:Hyperopt。
8.一种急性主动脉夹层疾病的输血预测系统,其特征在于,所述输血预测系统包括:
数据抽取模块,用于建立历史患者数据集;所述历史患者数据集包括:历史患者的临床资料和历史患者的输血决策;所述临床资料包括:术前资料和术中资料;所述术前资料包括:性别、年龄、身高、体重、术前是否贫血、血红蛋白数值、术前主动脉夹层累积范围和术前基础疾病;所述术中资料包括:手术方式、手术时间和体外循环时间;所述输血决策包括:是否输血和输血量;
特征工程模块,用于根据所述历史患者的临床资料确定历史患者的输血相关特征;
模型构建模块,用于采用机器学习算法,根据所述历史患者的输血相关特征和所述历史患者的输血决策,训练输血预测模型;所述输血预测模型包括:输血分类模型和输血量预测模型;所述输血分类模型用于预测是否输血;所述输血量预测模型用于预测输血量;
个体应用模块,用于获取待测患者的临床资料,并利用所述输血预测模型,根据所述待测患者的临床资料,预测得到待测患者的输血决策。
9.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行如权利要求1至7中任意一项所述的急性主动脉夹层疾病的输血预测方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的急性主动脉夹层疾病的输血预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048285.1A CN117133471A (zh) | 2023-08-18 | 2023-08-18 | 急性主动脉夹层疾病的输血预测方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048285.1A CN117133471A (zh) | 2023-08-18 | 2023-08-18 | 急性主动脉夹层疾病的输血预测方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117133471A true CN117133471A (zh) | 2023-11-28 |
Family
ID=88850163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311048285.1A Pending CN117133471A (zh) | 2023-08-18 | 2023-08-18 | 急性主动脉夹层疾病的输血预测方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117133471A (zh) |
-
2023
- 2023-08-18 CN CN202311048285.1A patent/CN117133471A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rady et al. | Prediction of kidney disease stages using data mining algorithms | |
Yuan et al. | The development an artificial intelligence algorithm for early sepsis diagnosis in the intensive care unit | |
Cramer et al. | Predicting the incidence of pressure ulcers in the intensive care unit using machine learning | |
Ahmad et al. | Diagnostic decision support system of chronic kidney disease using support vector machine | |
US20190156947A1 (en) | Automated information collection and evaluation of clinical data | |
CN111492437A (zh) | 支持医学决策的方法和系统 | |
CN102405473A (zh) | 医护点动作医疗系统和方法 | |
CN114023441A (zh) | 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法 | |
Hug et al. | ICU acuity: real-time models versus daily models | |
CN112967803A (zh) | 基于集成模型的急诊患者早期死亡率预测方法及系统 | |
CN116864139A (zh) | 疾病风险评估方法、装置、计算机设备及可读存储介质 | |
Chou et al. | Extracting drug utilization knowledge using self-organizing map and rough set theory | |
US20230245779A1 (en) | System and method for peri-anaesthetic risk evaluation | |
Prasad et al. | Detection of ckd from ct scan images using knn algorithm and using edge detection | |
CN116210058A (zh) | 慢性肾脏疾病(ckd)机器学习预测系统、方法和装置 | |
CN116864104A (zh) | 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统 | |
CN117133471A (zh) | 急性主动脉夹层疾病的输血预测方法、系统、设备及介质 | |
CN116309346A (zh) | 医学图像的检测方法、装置、设备、存储介质及程序产品 | |
CN114783587A (zh) | 严重急性肾损伤智能预测系统 | |
Ahmed et al. | Recent trends and techniques of blood glucose level prediction for diabetes control | |
Akter | Diabetes mellitus prediction and feature importance score finding using extreme gradient boosting | |
CN113012808A (zh) | 一种健康预测方法 | |
Altikardes et al. | A study to classify Non-Dipper/Dipper blood pressure pattern of type 2 diabetes mellitus patients without Holter device | |
Musleh | Classification of Diabetes from Phenotype, Personal, and Lifestyle Data | |
CN115762698B (zh) | 一种医疗慢病检查报告数据提取方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |