CN116580847B - 一种脓毒性休克预后预测方法及系统 - Google Patents
一种脓毒性休克预后预测方法及系统 Download PDFInfo
- Publication number
- CN116580847B CN116580847B CN202310862389.XA CN202310862389A CN116580847B CN 116580847 B CN116580847 B CN 116580847B CN 202310862389 A CN202310862389 A CN 202310862389A CN 116580847 B CN116580847 B CN 116580847B
- Authority
- CN
- China
- Prior art keywords
- data set
- prediction
- septic shock
- prognosis
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010040070 Septic Shock Diseases 0.000 title claims abstract description 90
- 230000036303 septic shock Effects 0.000 title claims abstract description 76
- 238000004393 prognosis Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 38
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 claims abstract description 22
- 239000008280 blood Substances 0.000 claims abstract description 20
- 210000004369 blood Anatomy 0.000 claims abstract description 20
- 102100030009 Azurocidin Human genes 0.000 claims abstract description 13
- 101710154607 Azurocidin Proteins 0.000 claims abstract description 13
- 108010048233 Procalcitonin Proteins 0.000 claims abstract description 13
- CWCXERYKLSEGEZ-KDKHKZEGSA-N procalcitonin Chemical compound C([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H]1NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@@H](N)CSSC1)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 CWCXERYKLSEGEZ-KDKHKZEGSA-N 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 13
- 108010074051 C-Reactive Protein Proteins 0.000 claims abstract description 11
- 102100032752 C-reactive protein Human genes 0.000 claims abstract description 11
- 235000014655 lactic acid Nutrition 0.000 claims abstract description 11
- 239000004310 lactic acid Substances 0.000 claims abstract description 11
- 238000003745 diagnosis Methods 0.000 claims abstract description 9
- 210000003374 extravascular lung water Anatomy 0.000 claims description 9
- 230000004217 heart function Effects 0.000 claims description 9
- 230000035485 pulse pressure Effects 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000011282 treatment Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 206010040047 Sepsis Diseases 0.000 abstract description 20
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000036772 blood pressure Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000006378 damage Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000004768 organ dysfunction Effects 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 208000010444 Acidosis Diseases 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 206010053159 Organ failure Diseases 0.000 description 2
- 206010044248 Toxic shock syndrome Diseases 0.000 description 2
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 2
- 102000018368 Triggering Receptor Expressed on Myeloid Cells-1 Human genes 0.000 description 2
- 108010066451 Triggering Receptor Expressed on Myeloid Cells-1 Proteins 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 230000007950 acidosis Effects 0.000 description 2
- 208000026545 acidosis disease Diseases 0.000 description 2
- 230000002924 anti-infective effect Effects 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 208000010718 Multiple Organ Failure Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005182 global health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005541 medical transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000029744 multiple organ dysfunction syndrome Diseases 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,尤其涉及一种脓毒性预后预测的建模方法及系统,本发明为了使患者入院24小时内即可实现患者脓毒性休克预后的快速预测,选取获取较为容易的指标:血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸作为卷积神经网络模型的预测指标,大大提高了脓毒性休克预后的预测速度;另外,本发明在对卷积网络模型训练后,采用能准确反应脓毒性预后的指标输入至训练好的模型,将得到的预测结果与病历中诊断结果比较,从而剔除可能存在问题的样本组成更新后的数据集,然后采用更新后的数据集对卷积神经网络模型训练,得到脓毒性休克预后预测模型,从而提高脓毒性休克预后预测的准确度。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种脓毒性休克预后预测方法及系统。
背景技术
脓毒症是指机体对感染的调节反应失控,从而引起的威胁生命的器官功能障碍,进一步发展可导致脓毒性休克,多器官功能障碍综合征,最终导致患者死亡。2017年,世界卫生组织(WHO)将脓毒症确定为全球卫生重点,针对脓毒症的防治已成为世界卫生关注的重点。
脓毒症的早期识别和处理对于脓毒症预后的提高具有极其重要的意义。严重感染患者往往首诊于急诊科,在严重感染尚未出现脓毒症时给与及时识别及时处理,阻断脓毒症的发病进程意义重大。2018年5月,中国急诊专家提出开展“中国预防脓毒症行动(preventing sepsis campaign in China, PSCC)”,并发布预防脓毒症的专家共识,提出了“脓毒症前状态”和脓毒症“未病先防,既病防传”的防治理念。因此,在严重感染患者发展为脓毒症或脓毒症及脓毒性休克早期对患者的预后进行精准预测对于改善预后意义重大。
目前对脓毒性休克的预后预测主要通过单一的评分或生物标志物评估,如快速器官功能障碍评分(quick sequential organ failure assessment,qSOFA),器官功能障碍评分(sequential organ failure assessment,SOFA),降钙素原(Procalcitonin,PCT),肝素结合蛋白(heparin-binding protein, HBP),人髓系细胞触发受体-1(Triggering receptor expressed on myeloid cells-1, TREM-1),细胞外组蛋白(extracellular histones,EH)等。也有采取支持向量机的技术方法进行预测,例如,中国发明专利(CN107480441A)公开了一种基于支持向量机的儿童脓毒性休克预后预测的建模方法及系统,上述方法根据儿童脓毒性休克预后基因表达高通量数据进行特征筛选,对筛选出的多个特征采用支持向量机算法建模,实现对儿童脓毒性休克的预后精准预测,对儿童脓毒性休克的临床预后预测提供分子水平的补充与支持。
然而,上述方案或者受到其他因素的干扰较大,或者存在明显的时间滞后性,或者指标难以获取,如基因数据获取。这些将会导致脓毒症及脓毒性休克患者在不能在第一时间对预后得到预测。同时,上述方案对所有样本不加甄别就输入至模型中,导致整体的脓毒性休克预后预测的准确度不高;因此,现有技术急需一种快速且准确度较高的脓毒性休克预后预测方法,用于提高脓毒性休克预后预测的速度和精度。
发明内容
本发明要解决的技术问题是针对上述技术方案的不足,提供一种脓毒性休克预后预测方法,用于提高脓毒性休克预后预测的速度和精度。
为了实现上述目的,根据本发明的一个方面,提供一种脓毒性休克预后预测方法,包括以下步骤:
步骤1:数据集样本获取;
步骤2:对所述数据集样本进行预处理,得到数据集;
步骤3:采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;
步骤4:采用所述数据集中第一预测指标集合输入至到所述卷积神经网络模型第一预测模型,得到第一预测结果结论;
步骤5:判断所述第一预测结果与所述数据集中的结论是否一致,若一致则保留该数据集样本,若不一致,则删除结论不一致的数据集样本;
步骤6:采用所述步骤5对所述数据集更新;
步骤7:采用更新后的数据集中的第二预测指标集合对卷积神经网络模型训练,得到第二预测模型,作为最终脓毒性休克预后预测模型。
优选地,通过自主收集方式形成数据集;
更进一步地,在某医院病例库中检索脓毒症或脓毒性关键词,获得的患者病历作为数据集样本;
优选地,所述预处理包括:
步骤2.1:删除不完整数据集样本;
优选地,选取血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸作为预测指标;
优选地,所述删除不完整数据集样本具体包括,删除所述数据集样本中不包含血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸、SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数中任一项指标的样本;
更近一步地,所述删除不完整数据集样本还包括删除所述数据集样本中诊断结果不明确或者具有多次入院记录的样本;
步骤2.2:处理异常值;
异常值指上述指标中的数值明显处于正常范围之外的值;
优选地,通过统计分析法获取异常值;同时,所述处理异常值具体为采用中位数或者均值取代所述异常值;
步骤2.3:缺失值处理;
优选地,所述缺失值处理具体为:采用均值填充法、中位数填充法、众数填充法、前后向补齐法和插值补缺法中的一种对缺失值补齐;
步骤2.4:对所有所述数据集样本进行步骤2.1-2.3操作,得到数据集;
优选地,所述采用所述数据集对卷积神经网络模型训练,得到第一预测模型具体为:
步骤3.1:选取第一预测指标集合;
优选地,所述第一预测指标集合为SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数;
步骤3.2:构建卷积神经网络模型结构;
优选地,所述卷积神经网络模型由输入层、卷积层、池化层、全连接层以及输出层组成;
步骤3.3:采用所述数据集中的第一预测指标集合对所述卷积神经网络模型结构训练,得到所述第一预测模型。
优选地,所述步骤4中,所述第一预测结果为脓毒性休克前期,脓毒性休克中期,脓毒性休克后期;所述数据集中的诊断结论同样为脓毒性休克前期,脓毒性休克中期,脓毒性休克后期;
优选地,所述步骤5中,若第一预测结果与所述数据集中的结论一致,则说明所述数据集样本无问题,若第一预测结果与所述数据集中的结论不一致,则说明所述数据集样本可能存在问题,比如说该数据集样本指标录入错误或者是疑难杂症导致诊断结论不唯一等,此时若采用该样本对卷积神经网络训练,会影响卷积神经网络的预测精度,因此,应该对结论不一致样本输出;
优选地,所述步骤6中,采用所述步骤5方法对所述数据集更新具体为:删除结论不一致的样本,只保留结论一致的样本,使得参与模型训练的数据集样本准确度较高,这样可大大提高模型训练的精度,进而大大提高模型预测的精度。
具体地,所述步骤7中,第二预测模型的训练过程和所述步骤3相同,在此不进行详细论述。
其中,采用本发明构建的脓毒性休克预后预测模型对入院后的患者的脓毒性休克预后进行预测,最终的预测结果分为:脓毒性休克前期、脓毒性休克中期、脓毒性休克后期。
所述脓毒性休克前期预后一般会较好,对身体损伤较小,此时可积极予以液体复苏、抗感染等治疗;
所述脓毒性休克中期预后中等,对身体产生了部分不可逆损伤,机体出现了酸中毒等情况;
所述毒性休克后期预后一般相对较差,此时休克往往很难治疗,患者血压会明显降低,死亡率很高。
根据本发明的另一个方面,提供一种脓毒性休克预后预测系统,该系统采用上述的脓毒性休克预后预测方法,还包括:
数据集样本获取模块,用于获取数据集样本;
预处理模块,用于对所述数据集样本进行预处理;
第一预测模型训练模块,用于采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;
第一预测结果获得模块,用于采用数据集中第一预测指标集合对输入到所述卷积神经网络模型,得到第一预测结果;
结果对比模块,用于判断所述第一预测结果与所述数据集中的结论是否一致,若不一致,则删除结论不一致的数据集样本;
数据集更新模块,用于采用步骤5对所述数据集更新;
脓毒性休克预后预测模型确立模块,用于根据更新后的数据集中第二预测指标集合对卷积神经网络模型训练,得到第二预测模型,作为最终脓毒性休克预后预测模型。
根据本发明的一个方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有数据处理程序,数据处理程序被处理器执行实施例一的脓毒性休克预后预测方法。
基于上述技术方案,本申请提供的一种脓毒性休克预后预测方法及系统,具有如下技术效果:
本发明为了使患者入院24小时内即可实现患者脓毒性休克预后的快速预测,选取获取较为容易的指标:血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸作为卷积神经网络模型的预测指标,这样可以在较短的时间内即可获得脓毒性休克的预后情况;
另外,本发明为了提高脓毒性休克预后的准确预测,在对卷积网络模型训练后,采用样本中的能准确反应脓毒性休克预后的指标输入至训练好的模型,将得到的结果与病历中医生诊断结果比较,从而剔除可能存在问题的样本组成更新后的数据集,然后采用更新后的数据集对卷积神经网络模型训练,得到脓毒性休克预后预测模型,从而提高脓毒性休克预后预测的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种脓毒性休克预后预测方法的流程图;
图2为本申请实施例提供的预处理操作的流程图;
图3为本申请实施例提供的采用所述数据集对卷积神经网络模型训练,得到第一预测模型的流程图;
图4为本申请实施例提供的卷积神经网络模型结构的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面首先结合附图对本申请所涉及的概念进行说明。在此需要指出的是,以下对各个概念的说明,仅为了使本申请的内容更加容易理解,并不表示对本申请保护范围的限定。
实施例一、在本实施例的实例中,为了实现上述目的,如图1所示,提供一种脓毒性休克预后预测方法,包括以下步骤:
步骤1:数据集样本获取;
临床医学上,数据集样本获取一般有两种途径,一种为自主收集,另一种为公共数据库,其中,自主收集为根据临床标准选择符合要求的患者病历作为数据集,公共数据库为由研发机构收集发布的某段时期的患者临床数据,一般地,公共数据库样本数据相对较少,因此,本实施例通过自主收集形成数据集;
具体地,在某医院病例库中检索脓毒症或脓毒性关键词,获得的患者病历作为数据集样本;
步骤2:对所述数据集样本进行预处理;
具体地,如图2所示,所述预处理包括:
步骤2.1:删除不完整数据集样本;
本实施例希望在患者入院24小时内即可实现患者脓毒性休克预后的准确预测,因此,输入至预测模型中的参数需要尽可能快速的获得,因此,选取血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸作为预测指标,因为上述指标获取较为容易,且经过了长期的实际验证,可准确有效预测浓度性休克的预后;同时,本实施例还利用一些获取时间较长但是预测结果较为准确的指标用于训练模型,从而识别出结果不准确的样本,并将不准确样本删除以提高模型训练精度,比如说SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数;
具体地,所述删除不完整数据集样本具体包括,删除所述数据集样本中不包含血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸、SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数中任一项指标的样本;
更近一步地,所述删除不完整数据集样本还包括删除所述数据集样本中诊断结果不明确或者具有多次入院记录的样本;
步骤2.2:处理异常值;
异常值指上述指标中的数值明显处于正常范围之外的值;
示例性地,医生输入病历时,将血压输入为960,此时,血压明显超出了人体的血压范围,可以认定其为异常值,需要对其进行处理;
具体地,通过统计分析法获取异常值;同时,所述处理异常值具体为采用中位数或者均值取代所述异常值;
步骤2.3:缺失值处理;
在患者的电子病历中,会由于各种原因造成数据的缺失,因此,需要对缺失值处理;
具体地,所述缺失值处理具体为:采用均值填充法、中位数填充法、众数填充法、前后向补齐法和插值补缺法中的一种对缺失值补齐;
步骤2.4:对所有所述数据集样本进行步骤2.1-2.3操作,得到数据集;
步骤3:采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;
更进一步地,如图3所示,所述采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型具体为:
步骤3.1:选取第一预测指标集合;
具体地,所述第一预测指标集合包括:SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数;
在脓毒性休克预后预测发展过程中,产生了非常多的预测指标,各种指标从不同的维度对脓毒性休克预后预测,其中有的指标在入院初期即可获得,有的指标在入院治疗中获得,不同的指标的预测准确度也不近相同;
在本实施例中,设置所述步骤3的目的用于实现不准确样本的删除,以提高模型训练的准确度,其中,训练模型的工作在用于患者住院前已经完成,因此,在选择第一预测指标时,可以不考虑指标获取的时间长短,仅仅考虑指标对脓毒性休克指示作用的准确度,因此,本实施例采用了SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数作为第一预测指标集合;上述指标为在脓毒性休克治疗过程中获取的指标,此类指标对脓毒性休克预后准确度较高,但是获取过程较为复杂,本实施例通过上述指标输入至所述步骤3训练好的卷积神经网络模型中,得到第一预测结果;
步骤3.2:构建卷积神经网络模型结构;
具体地,如图4所示,所述卷积神经网络模型由输入层、卷积层、池化层、全连接层以及输出层组成;
步骤3.3:采用所述数据集中的第一预测指标集合对所述卷积神经网络模型结构训练,得到所述第一预测模型;
步骤4:采用所述数据集中其他第一预测指标集合对输入至到所述卷积神经网络模型第一预测模型,得到第一预测结果结论;
具体地,所述第一预测结果为脓毒性休克前期,脓毒性休克中期,脓毒性休克后期;
步骤5:判断所述第一预测结果与所述数据集中的结论是否一致,若一致则保留该数据集样本,若不一致,则删除结论不一致的数据集样本;
实际上,虽然所述第一预测模型经过了上述的数据集训练,但是,在将训练集输入至训练好的模型中时,由于模型训练过程中会不断地对模型参数进行调优,并且由于不准确样本的影响,使得将数据集输入至训练好的模型中时,并不会导致所有的预测结果和数据集中的诊断结论一致,而不一致的结论很较大概率是数据集中诊断结论有偏差,或者是该样本为疑难样本,本身的脓毒性前期、中期和后期的界限并不是很明显,因此,本实施例出于提高模型训练精度的考量,将上述的样本删除,从而提高了模型训练的精度,进而提高预测精度。
具体地,若第一预测结果与所述数据集中的结论一致,则说明所述数据集样本无问题,若第一预测结果与所述数据集中的结论一致,则说明所述数据集样本可能存在问题,此时若采用该样本对卷积神经网络训练,会影响卷积神经网络的预测精度,因此,将结论不一致样本删除;
步骤6:采用所述步骤5对所述数据集更新;
具体地,所述采用所述步骤5对所述数据集更新具体为删除结论不一致的样本,只保留结论一致的样本,使得参与模型训练的数据集样本准确度较高,这样可大大提高模型训练的精度,进而大大提高模型预测的精度;
步骤7:采用更新后的数据集中的第二预测指标集合对卷积神经网络模型训练,得到最终的卷积神经网络预测模型第二预测模型,作为最终脓毒性休克预后预测模型。
本实施例寄希望在入院初期即可快速准确确定脓毒性休克预后,因此,在预测指标选取上,选取相对较为容易获取的指标,并且,选取的指标不能过多,过多的指标会极大的增加模型训练和模型预测的时间,并且对模型运行硬件也会有更高的要求,因此,以选取6-8个预测指标为宜;同时,发明人在实际行医过程中,发现了一些对脓毒性休克预后预测准确度较高的一些指标,比如说血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸等,因此,也把上述指标加入了预测指标中;
具体地,所述预测指标具体为:血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸;
具体地训练过程和步骤3相同,在此不进行详细论述。
同时,采用本实施例构建的脓毒性休克预后预测模型对入院后的患者的脓毒性休克预后进行预测,预测结论分为:脓毒性休克前期、脓毒性休克中期、脓毒性休克后期。
其中,所述脓毒性休克前期预后一般会较好,对身体损伤较小,此时可积极予以液体复苏、抗感染等治疗;
所述脓毒性休克中期预后中等,对身体产生了部分不可逆损伤,机体出现了酸中毒等情况;
所述毒性休克后期预后一般相对较差,此时休克往往很难治疗,患者血压会明显降低,死亡率很高;
实施例二:本实施例包括一种脓毒性休克预后预测系统,该系统采用上述的脓毒性休克预后预测方法,还包括:
数据集样本获取模块,用于获取数据集样本;
预处理模块,用于对所述数据集样本进行预处理;
第一预测模型训练模块,用于采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;
第一预测结果获得模块,用于采用数据集中第一预测指标集合对输入到所述卷积神经网络模型,得到第一预测结果;
结果对比模块,用于判断所述第一预测结果与所述数据集中的结论是否一致,若不一致,则删除结论不一致的数据集样本;
数据集更新模块,用于采用步骤5对所述数据集更新;
脓毒性休克预后预测模型确立模块,用于根据更新后的数据集中第二预测指标集合对卷积神经网络模型训练,得到第二预测模型,作为最终脓毒性休克预后预测模型。
实施例三,本实施例包括一种计算机可读存储介质,计算机可读存储介质上存储有数据处理程序,数据处理程序被处理器执行实施例一的脓毒性休克预后预测方法。
本领域技术人员应明白,本文的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本文可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质等。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文是参照根据本文实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的实施例及/或实施方式,仅是用以说明实现本发明技术的较佳实施例及/或实施方式,并非对本发明技术的实施方式作任何形式上的限制,任何本领域技术人员,在不脱离本发明内容所公开的技术手段的范围,当可作些许的更动或修改为其它等效的实施例,但仍应视为与本发明实质相同的技术或实施例。
Claims (6)
1.一种脓毒性休克预后预测方法,其特征在于,包括以下步骤:
步骤1:数据集样本获取;
步骤2:对所述数据集样本进行预处理,得到数据集;
步骤3:采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;
所述采用所述数据集对卷积神经网络模型训练,得到第一预测模型具体为:
步骤3.1:选取第一预测指标集合;所述第一预测指标集合为:SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数;
步骤3.2:构建卷积神经网络模型结构;
步骤3.3:采用所述数据集中的第一预测指标集合对所述卷积神经网络模型结构训练,得到所述第一预测模型;
步骤4:采用所述数据集中第一预测指标集合输入至所述第一预测模型,得到第一预测结果;
步骤5:判断所述第一预测结果与所述数据集中的医生诊断结论是否一致,若不一致,则删除结论不一致的数据集样本;
步骤6:采用所述步骤5方法对所述数据集更新;
步骤7:采用更新后的数据集中的第二预测指标集合对卷积神经网络模型训练,得到第二预测模型,作为最终脓毒性休克预后预测模型,所述第二预测指标集合为:血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸;
其中,所述最终脓毒性休克预后预测模型的预测结果为脓毒性休克前期,脓毒性休克中期,脓毒性休克后期。
2.根据权利要求1所述的一种脓毒性休克预后预测方法,其特征在于,所述预处理包括:
步骤2.1:删除不完整数据集样本;
步骤2.2:处理异常值;
步骤2.3:缺失值处理;
步骤2.4:对所有所述数据集样本进行步骤2.1-2.3操作,得到所述数据集。
3.根据权利要求2所述的一种脓毒性休克预后预测方法,其特征在于,所述删除不完整数据集样本包括,删除所述数据集样本中不包含血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸、SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数中任一项指标的样本;
所述删除不完整数据集样本还包括删除所述数据集样本中诊断结果不明确或者具有多次入院记录的样本。
4.根据权利要求2所述的一种脓毒性休克预后预测方法,其特征在于,所述缺失值处理具体为:采用均值填充法、中位数填充法、众数填充法、前后向补齐法和插值补缺法中的一种对缺失值补齐。
5.根据权利要求4所述的一种脓毒性休克预后预测方法,其特征在于,所述卷积神经网络模型结构由输入层、卷积层、池化层、全连接层以及输出层组成。
6.一种脓毒性休克预后预测系统,该系统采用权利要求1-5任一项所述的脓毒性休克预后预测方法,还包括:
数据集样本获取模块,用于获取数据集样本;
预处理模块,用于对所述数据集样本进行预处理;
第一预测模型训练模块,用于采用所述数据集中第一预测指标集合对卷积神经网络模型训练,得到第一预测模型;所述第一预测指标集合为:SOFA评分、APACHEII评分、胸腔内血容积、脉压变异、心功能指数、血管外肺水指数;
第一预测结果获得模块,用于采用数据集中第一预测指标集合对输入到所述卷积神经网络模型,得到第一预测结果;
结果对比模块,用于判断所述第一预测结果与所述数据集中的结论是否一致,若不一致,则删除结论不一致的数据集样本;
数据集更新模块,用于采用步骤5对所述数据集更新;
脓毒性休克预后预测模型确立模块,用于根据更新后的数据集中第二预测指标集合对卷积神经网络模型训练,得到第二预测模型,作为最终脓毒性休克预后预测模型,所述第二预测指标集合为血浆肝素结合蛋白、降钙素原、C反应蛋白、动脉血乳酸;所述最终脓毒性休克预后预测模型的预测结果为脓毒性休克前期,脓毒性休克中期,脓毒性休克后期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310862389.XA CN116580847B (zh) | 2023-07-14 | 2023-07-14 | 一种脓毒性休克预后预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310862389.XA CN116580847B (zh) | 2023-07-14 | 2023-07-14 | 一种脓毒性休克预后预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116580847A CN116580847A (zh) | 2023-08-11 |
CN116580847B true CN116580847B (zh) | 2023-11-28 |
Family
ID=87534645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310862389.XA Active CN116580847B (zh) | 2023-07-14 | 2023-07-14 | 一种脓毒性休克预后预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116580847B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117238510B (zh) * | 2023-11-16 | 2024-02-06 | 天津中医药大学第二附属医院 | 一种基于深度学习的脓毒症预测方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480441A (zh) * | 2017-08-04 | 2017-12-15 | 方芳 | 一种基于支持向量机的儿童脓毒性休克预后预测的建模方法及系统 |
CN108681532A (zh) * | 2018-04-08 | 2018-10-19 | 天津大学 | 一种面向中文微博的情感分析方法 |
KR20190081825A (ko) * | 2017-12-29 | 2019-07-09 | 재단법인대구경북과학기술원 | 질량 분석 및 기계 학습을 활용하는 암 결정기 및 암 결정기가 수행하는 방법 |
CN110123277A (zh) * | 2019-05-17 | 2019-08-16 | 上海电气集团股份有限公司 | 一种脓毒血症的数据处理系统 |
CN111261282A (zh) * | 2020-01-21 | 2020-06-09 | 南京航空航天大学 | 一种基于机器学习的脓毒症早期预测方法 |
CN111599466A (zh) * | 2020-05-13 | 2020-08-28 | 上海森亿医疗科技有限公司 | 儿童血液肿瘤患者脓毒性休克预测方法、装置、终端及介质 |
CN112200255A (zh) * | 2020-10-16 | 2021-01-08 | 浙江大学 | 一种针对样本集的信息去冗余方法 |
CN113593708A (zh) * | 2021-07-12 | 2021-11-02 | 杭州电子科技大学 | 基于集成学习算法的脓毒症预后预测方法 |
CN113705769A (zh) * | 2021-05-17 | 2021-11-26 | 华为技术有限公司 | 一种神经网络训练方法以及装置 |
CN114141363A (zh) * | 2021-12-07 | 2022-03-04 | 川北医学院附属医院 | 一种基于机器学习方法的重症胰腺炎预测模型构建方法 |
CN114298299A (zh) * | 2021-08-05 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 基于课程学习的模型训练方法、装置、设备及存储介质 |
CN115063700A (zh) * | 2022-06-01 | 2022-09-16 | 三峡大学 | 一种基于小尺度松材线虫病树的检测方法 |
CN116245399A (zh) * | 2022-12-29 | 2023-06-09 | 浙江中控技术股份有限公司 | 模型训练方法、装置、非易失性存储介质及电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8283131B2 (en) * | 2008-10-28 | 2012-10-09 | Assistance Publique-Hopitaux De Paris | Methods and kits for the rapid determination of patients at high risk of death during severe sepsis and septic shock |
WO2019028448A1 (en) * | 2017-08-04 | 2019-02-07 | The Johns Hopkins University | APPLICATION FOR EARLY PREDICTION OF SEPTIC SHOCK WAITING |
-
2023
- 2023-07-14 CN CN202310862389.XA patent/CN116580847B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480441A (zh) * | 2017-08-04 | 2017-12-15 | 方芳 | 一种基于支持向量机的儿童脓毒性休克预后预测的建模方法及系统 |
KR20190081825A (ko) * | 2017-12-29 | 2019-07-09 | 재단법인대구경북과학기술원 | 질량 분석 및 기계 학습을 활용하는 암 결정기 및 암 결정기가 수행하는 방법 |
CN108681532A (zh) * | 2018-04-08 | 2018-10-19 | 天津大学 | 一种面向中文微博的情感分析方法 |
CN110123277A (zh) * | 2019-05-17 | 2019-08-16 | 上海电气集团股份有限公司 | 一种脓毒血症的数据处理系统 |
CN111261282A (zh) * | 2020-01-21 | 2020-06-09 | 南京航空航天大学 | 一种基于机器学习的脓毒症早期预测方法 |
CN111599466A (zh) * | 2020-05-13 | 2020-08-28 | 上海森亿医疗科技有限公司 | 儿童血液肿瘤患者脓毒性休克预测方法、装置、终端及介质 |
CN112200255A (zh) * | 2020-10-16 | 2021-01-08 | 浙江大学 | 一种针对样本集的信息去冗余方法 |
CN113705769A (zh) * | 2021-05-17 | 2021-11-26 | 华为技术有限公司 | 一种神经网络训练方法以及装置 |
CN113593708A (zh) * | 2021-07-12 | 2021-11-02 | 杭州电子科技大学 | 基于集成学习算法的脓毒症预后预测方法 |
CN114298299A (zh) * | 2021-08-05 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 基于课程学习的模型训练方法、装置、设备及存储介质 |
CN114141363A (zh) * | 2021-12-07 | 2022-03-04 | 川北医学院附属医院 | 一种基于机器学习方法的重症胰腺炎预测模型构建方法 |
CN115063700A (zh) * | 2022-06-01 | 2022-09-16 | 三峡大学 | 一种基于小尺度松材线虫病树的检测方法 |
CN116245399A (zh) * | 2022-12-29 | 2023-06-09 | 浙江中控技术股份有限公司 | 模型训练方法、装置、非易失性存储介质及电子设备 |
Non-Patent Citations (8)
Title |
---|
MSCT孤立肺小结节的神经网络模型的应用研究分析;何俊诗;梁鹏;罗英华;史瑞雪;姬智艳;陈汉威;黄益;;中国CT和MRI杂志(第06期);全文 * |
Semaphorin 3A contributes to sepsis-induced immunosuppression by impairing CD4+ T cell anergy;Yulei Gao;Molecular Medicine Reports;全文 * |
Sepsis Prediction with temporal convolutional networks;Xing Wang;https://arxiv.org/pdf/2205.15492v1.pdf;全文 * |
Septic shock by Neural Networks and Rule based systems;R.Brause;Computational Intelligence processing in Medical Diagnosis;全文 * |
The Parenteral Vitamin C Improves Sepsis and Sepsis-Induced Multiple Organ Dysfunction Syndrome via Preventing Cellular Immunosuppression;Yu-Lei Gao;Mediators of Inflammation;全文 * |
全心舒张末期容积指数及血管外肺水指数在老年心力衰竭合并脓毒性休克患者预后中的预测价值;李欢;心脏杂志;全文 * |
肝素结合蛋白联合SOFA评分对脓毒性休克的预测价值;杨亚南;中华危重急救医学;第336~340页 * |
脓毒性休克的液体复苏策略;柴艳芬等;实用休克杂志(中英文);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116580847A (zh) | 2023-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ge et al. | An Interpretable ICU Mortality Prediction Model Based on Logistic Regression and Recurrent Neural Networks with LSTM units. | |
CN106339593B (zh) | 基于医疗数据建模的川崎病分类预测方法 | |
US20190378619A1 (en) | Using machine learning to predict health conditions | |
García-Gallo et al. | A machine learning-based model for 1-year mortality prediction in patients admitted to an Intensive Care Unit with a diagnosis of sepsis | |
CN116580847B (zh) | 一种脓毒性休克预后预测方法及系统 | |
CN115019919B (zh) | 基于深度学习的脑卒中早期康复后功能预测模型建立方法 | |
US11735321B2 (en) | System for the prognostics of the chronic diseases after the medical examination based on the multi-label learning | |
CN111640512B (zh) | 肾脏替代疗法启动策略评估方法、装置及电子设备 | |
WO2020172607A1 (en) | Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients | |
Wang et al. | XGBoost machine learning algorithm for prediction of outcome in aneurysmal subarachnoid hemorrhage | |
CN109243604B (zh) | 一种基于神经网络算法的川崎病风险评估模型的构建方法及构建系统 | |
WO2022166158A1 (zh) | 一种基于卷积生存网络的血透并发症长期风险预测系统 | |
CN116403714B (zh) | 脑卒中end风险预测模型建立方法、装置、end风险预测系统、电子设备及介质 | |
CN113988209A (zh) | 脑卒中预后预测模型的训练方法及装置 | |
Savaş et al. | Comparison of deep learning models in carotid artery intima-media thickness ultrasound images: Caimtusnet | |
KR20230029752A (ko) | 조산 예측 | |
CN113057587A (zh) | 一种病症预警方法、装置、电子设备及存储介质 | |
Reddy et al. | Evaluation of deep belief network to predict hospital readmission of diabetic patients | |
Marathe et al. | Prediction of heart disease and diabetes using naive Bayes algorithm | |
CN117238510B (zh) | 一种基于深度学习的脓毒症预测方法及系统 | |
Mohammadi et al. | Learning to identify patients at risk of uncontrolled hypertension using electronic health records data | |
CN109979591B (zh) | 一种基于图神经网络分析斑块进展因子的方法及装置 | |
Edvinsson et al. | Predicting intensive care need in women with preeclampsia using machine learning–a pilot study | |
CN115631860A (zh) | 一种基于多任务学习的肝癌预后分析方法、系统及设备 | |
Suneetha et al. | Fine tuning bert based approach for cardiovascular disease diagnosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |