CN116189906B - 脓毒症实时预警的神经网络模型、方法和电子设备 - Google Patents
脓毒症实时预警的神经网络模型、方法和电子设备 Download PDFInfo
- Publication number
- CN116189906B CN116189906B CN202310476267.7A CN202310476267A CN116189906B CN 116189906 B CN116189906 B CN 116189906B CN 202310476267 A CN202310476267 A CN 202310476267A CN 116189906 B CN116189906 B CN 116189906B
- Authority
- CN
- China
- Prior art keywords
- time sequence
- point
- output
- sequence point
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010040047 Sepsis Diseases 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000003062 neural network model Methods 0.000 title claims abstract description 18
- 230000007246 mechanism Effects 0.000 claims abstract description 59
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 35
- 230000006870 function Effects 0.000 claims description 59
- 238000005070 sampling Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 230000000873 masking effect Effects 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 17
- 230000002457 bidirectional effect Effects 0.000 abstract description 7
- 238000011161 development Methods 0.000 abstract description 3
- 230000002829 reductive effect Effects 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 48
- 238000013528 artificial neural network Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 14
- 230000001419 dependent effect Effects 0.000 description 12
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 10
- 125000004122 cyclic group Chemical group 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 7
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 229910002092 carbon dioxide Inorganic materials 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 239000001569 carbon dioxide Substances 0.000 description 4
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 3
- 229910052753 mercury Inorganic materials 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000029058 respiratory gaseous exchange Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- PGOHTUIFYSHAQG-LJSDBVFPSA-N (2S)-6-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-1-[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylsulfanylbutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]-3-sulfanylpropanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]-5-oxopentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoyl]amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-oxopentanoyl]amino]-3-phenylpropanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-carboxybutanoyl]amino]-5-oxopentanoyl]amino]hexanoic acid Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O PGOHTUIFYSHAQG-LJSDBVFPSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 2
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 2
- 238000008789 Direct Bilirubin Methods 0.000 description 2
- 108010049003 Fibrinogen Proteins 0.000 description 2
- 102000008946 Fibrinogen Human genes 0.000 description 2
- 102000001554 Hemoglobins Human genes 0.000 description 2
- 108010054147 Hemoglobins Proteins 0.000 description 2
- 241000594011 Leuciscus leuciscus Species 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 102000002262 Thromboplastin Human genes 0.000 description 2
- 108010000499 Thromboplastin Proteins 0.000 description 2
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 2
- PNNCWTXUWKENPE-UHFFFAOYSA-N [N].NC(N)=O Chemical compound [N].NC(N)=O PNNCWTXUWKENPE-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000004872 arterial blood pressure Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 229940109239 creatinine Drugs 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005534 hematocrit Methods 0.000 description 2
- 239000004310 lactic acid Substances 0.000 description 2
- 235000014655 lactic acid Nutrition 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 238000002106 pulse oximetry Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KVZLHPXEUGJPAH-UHFFFAOYSA-N 2-oxidanylpropanoic acid Chemical compound CC(O)C(O)=O.CC(O)C(O)=O KVZLHPXEUGJPAH-UHFFFAOYSA-N 0.000 description 1
- 101100184045 Arabidopsis thaliana MICU gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010051379 Systemic Inflammatory Response Syndrome Diseases 0.000 description 1
- 108090001027 Troponin Proteins 0.000 description 1
- 102000004903 Troponin Human genes 0.000 description 1
- 102000013394 Troponin I Human genes 0.000 description 1
- 108010065729 Troponin I Proteins 0.000 description 1
- CPGKMLVTFNUAHL-UHFFFAOYSA-N [Ca].[Ca] Chemical compound [Ca].[Ca] CPGKMLVTFNUAHL-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000035487 diastolic blood pressure Effects 0.000 description 1
- 230000003205 diastolic effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- IXCSERBJSXMMFS-UHFFFAOYSA-N hcl hcl Chemical compound Cl.Cl IXCSERBJSXMMFS-UHFFFAOYSA-N 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- HZZOEADXZLYIHG-UHFFFAOYSA-N magnesiomagnesium Chemical compound [Mg][Mg] HZZOEADXZLYIHG-UHFFFAOYSA-N 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004768 organ dysfunction Effects 0.000 description 1
- 238000006213 oxygenation reaction Methods 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- QVLTXCYWHPZMCA-UHFFFAOYSA-N po4-po4 Chemical compound OP(O)(O)=O.OP(O)(O)=O QVLTXCYWHPZMCA-UHFFFAOYSA-N 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000035488 systolic blood pressure Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Physiology (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Epidemiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请公开了一种脓毒症实时预警的神经网络模型、方法和电子设备,采用了一种新的神经网络模型由此进行脓毒血症的预警,该神经网络模型综合了双向时序循环网络和注意力机制,能够将特征缺失值的数值回归预测任务以及序列点结局分类预测任务,在一次训练中同时进行,无需将回归和分类任务拆分成两个独立任务分别独立训练,提高模型开发效率,减轻部署难度;该算法充分利用相同特征在不同时序点的关联性以及不同特征在相同时序点上的关联性,并对这两种关联性进行数学建模,以提高算法预测性能。在正反两个方向分别增加注意力机制模块,大幅消除长序列预测功能丧失的问题。
Description
技术领域
本申请涉及到医学检测技术领域,具体涉及一种脓毒症实时预警的神经网络模型、方法、装置、存储介质和电子设备。
背景技术
脓毒症是一种由机体对感染反应异常引起的危及生命的器官功能障碍,在全球范围内,其影响的人群达数百万之多,其中三分之一到六分之一的人死于此病。
通常使用SIRS、SOFA和qSOFA等临床方法别脓毒症,但存在如下瑕疵:(1)临床方法存在主观误判风险,其准确度与临床医生专业素养及经验强相关;(2)临床方法不具备实时预警功能,临床医生需要一系列复杂的定性及定量记录及检测才能完成一次评估,每日最多可完成2~3次。(3)临床方法不具备早期预警功能,临床方法确定潜在患者为脓毒症患者的时刻落后于患者罹患脓毒症的临界时刻,已经不存在疾病预警期,患者失去规避疾病发生的机会。
相比临床方法,以机器学习为主导的脓毒症判别算法是一种完全数字驱动的决策系统,一种全天候的实时预警系统,一种可自定义预警期的早期预警系统。Li等在Li X, XuX, Xie F, Xu X, Sun Y, Liu X, Jia X, Kang Y, Xie L, Wang F, Xie G. A Time-Phased Machine Learning Model for Real-Time Prediction of Sepsis in CriticalCare. Crit Care Med. 2020 Oct;48(10):e884-e888. doi: 10.1097/CCM.0000000000004494. PMID: 32931194中使用lightGBM算法可以提前6小时实时预测出患者是否患有脓毒症,性能指标AUC达到0.845。 需要说明的是该方法采用的脓毒症数据集来自真实医疗环境的时序化数据,其多数特征缺失率达80%以上,数据的时序化以及高缺失率是脓毒症数据的显著特点,也是创建机器学习算法的难点。对于时序化数据,lightGBM并不是最佳选择,lightGBM处理时序化样本数据时,默认相同特征在不同时序点上相互独立,这显然与实际不符。另外,在处理缺失值时,该方法并未对空值插值,大量的空值会降低模型预测准确度。在与临床医生探讨中发现,医生不仅关注预测结果,更注重缺失值的估计,某些特定时间戳上的缺失值很可能是造成脓毒症发生的主因。针对该算法存在的问题,Cao等在W. Cao, D. Wang, J. Li, H. Zhou, L. Li, Y. Li, BRITS: Bidirectionalrecurrent imputation for time series, in: Adv. Neural Inf. Process. Syst.31,2018, pp. 6774–6784.中提出的BRITS算法可以解决时序化数据插值和时序特征关联性建模等问题。BRITS实质是双向循环神经网络,它认为相同特征在不同时间戳上的值存在关联性,并充分利用这种关系提高了算法预测性能,同时它使用循环神经网络完成缺失值的估计,进一步提高算法预测性能。然而循环神经网络在处理较长序列数据时,容易出现梯度消失,这将导致未来多个时序点上训练停止,失去预测功能。采用双向循环神经网络可以小幅度抵消梯度消失问题,但效果不明显。
发明内容
本申请实施例提供了一种脓毒症实时预警的神经网络模型、方法和电子设备,用于解决现有技术中对脓毒血症预测不准确的技术问题。
本申请的一个方面,提供了一种脓毒症实时预警的神经网络模型,包括:
数据处理模块,用于根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;
编码器模块,用于根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;
注意力机制模块,用于在每个所述顺序方向上根据所有时序点的隐藏状态、所有第一译码器输入进行注意力机制调节获得注意力机制输出;
译码器模块,用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;
求和模块,用于将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;
回归输出模块,用于根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;
分类输出模块,用于根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
其中,,H为单个时序点对应隐藏单元的个数,D为所述变量观测数据中变量种类的数量;/>均为输出端衰减函数/>的待定系数、且/>的初始值均由高斯分布抽样确定;/>为所述时间间隔数据中时序点t的时间间隔向量,/>;
其中,为矩阵取内积符号,/>代表纵向拼接;/>,默认初始值/>由高斯分布抽样确定;/>,/>为第t 个序列点对应的遮蔽向量且 />,为sigmoid激活函数;B,C,d均为隐藏状态/>的待定系数、且B,C,d初始值均由高斯分布抽样确定;/>为/>完成最终插值后的值,/>;
进一步的,在本发明中,所述每个顺序方向上各有一个注意力机制模块,所述每个注意力机制模块包括第一全连接层、第一softmax层和加权求和模块;所述注意力机制输出的获得方法包括:
将所有时序点的隐藏状态、所有时序点的第一译码器的输入,输入至所述第一全连接层获得第一全连接层的输出;将所述第一全连接层的输出,输入至所述第一softmax层后得到所述第一softmax层输出;
将所有时序点的隐藏状态和第一全连接层的输出在所述加权求和模块中进行矩阵运算后获得注意力机制输出。
按照时序点排列的从后向前的顺序上,所述时序点的译码器输出为 ;其中,/>均为译码器输出/>的待定系数且/>均使用高斯分布抽样初始化,/>为按照时序点排列的从前向后的顺序上的时序点t的注意力机制输出,。
进一步的,在本发明中,根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据包括:利用相同变量在不同时序点上的关系得到插值结果;其中,/>为时序点t上所有变量的预测值;为/>的待定系数且/>使用高斯分布抽样初始化;/>使用预测值/>填充自身的缺失值后得到/>;
进一步的,在本发明中,所述分类输出模块包括第二全连接层和第二softmax层,根据所述每个时序点的输出获得所述每个时序点是否会发生脓毒血症的预测分类结果的方法包括:
将所述每个时序点的输出输入至所述第二全连接层获得第二全连接层输出;
将所述第二全连接层输出输入至所述第二softmax层获得所述softmax层输出作为发生脓毒血症的预测分类结果。
进一步的,在本发明中,还包括:
和/或,
本发明的第二个方面,提供一种脓毒症实时预警的方法,包括:
根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;
根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;
在每个所述顺序方向上根据所述所有时序点的隐藏状态、所有时序点的第一译码器输入进行注意力机制调节获得每个时序点的注意力机制输出;
用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;
将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;
根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;
根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
进一步的,在本发明中,所述方法还包括:
和/或,
本申请的第三个方面,提供一种电子设备,包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时采用本申请第一方面所述模型获得所述脓毒血症的预测分类结果。
在本申请实施例中,采用了一种新的神经网络模型由此进行脓毒血症的预警,该神经网络模型综合了双向时序循环网络和注意力机制,能够将特征缺失值的数值回归预测任务以及序列点结局分类预测任务,在一次训练中同时进行,无需将回归和分类任务拆分成两个独立任务分别独立训练,提高模型开发效率,减轻部署难度;该算法充分利用相同特征在不同时序点的关联性以及不同特征在相同时序点上的关联性,并对这两种关联性进行数学建模,以提高算法预测性能。在正反两个方向分别增加注意力机制模块,大幅消除长序列预测功能丧失的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种脓毒症实时预警的神经网络模型建立方法;
图3是根据本申请实施例中一种脓毒症实时预警的神经网络模型结构示意图;
图4是根据本申请实施例中利用遗传算法确定神经网络模型超参数的流程图;
图5是根据本申请实施例中利用遗传算法优化神经网络模型超参数结果的可视化图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明的具体实施例提供一种新的脓毒症实时预警的神经网络模型,以针对脓毒症预警场景下常出现的数据缺失、预测性能差的技术问题。
如图1所示,上述一种脓毒症实时预警的神经网络模型的建立方法,包括如下步骤:
步骤S1、输入数据的数学建模。
步骤S2、构建ABRITS算法模型。
步骤S3、遗传算法确定ABRITS的超参数。
步骤S4、SHAP归因分析及DiCE干预方案推荐。
上述模型的建立方法的过程中,步骤S1具体包括,根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据。上述过程在图3中通过所述数据处理模块完成。具体该步骤的处理过程如下:
本发明的实施例的输入数据为多变量序列X,作为观测值序列,/>。每个时序点上的任一变量均对应一个指标特征。第t个序列点的观测值集合表示第t个序列点的第d个变量值。/>对应的时间戳用表示。需要特别说明的是/>之间的时间间隔并不是相同的。/>很可能存在缺失值,因此本发明的实施例中引入遮蔽矩阵/>,其中/>为第t个序列点对应的遮蔽向量,,即/>为D行1列向量。使用/>表示/>中的第d变量的遮蔽值,其表达式如公式(1)所示。/>。
许多实际场景中出现连续多个缺失值的情形,所以需要构建衰减单元,因此本发明的具体实施例中引入时间间隔矩阵,其中/>为第t个序列点对应的时间间隔向量,/>,衰减单元的重要输入参数就是/>。使用/>表示时间间隔矩阵/>的第d个变量的时间间隔值,具体表达式如公式(2)所示。/>。
上述之间关系的图解说明如图2所示。由图2可以看出/>对应的时间戳/>分别为0,2,7,9,14,15,对应的遮蔽向量为/>,对应的时间间隔向量为。现在考察/>,根据定义,/>对应的缺失值/>的上一次真实观测到的值是/>,其时间戳之差/>,同理可得其余/>值。
上述模型的建立方法的过程中,步骤S2中构建的模型ABRITS即为本发明实施例中带有注意力的双向时序循环插值模型(Attentional Bidirectional RecurrentImputation for Time Series, 简称ABRITS),如图3所示处所述数据处理模块以外的部分,该部分主要包括分布于图3左右两侧的一个前向循环神经网络和一个后向循环神经网络,该模型的具体组成如下:
编码器模块,用于根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态。
注意力机制模块,用于在每个所述顺序方向上根据所有时序点的隐藏状态、所有第一译码器输入进行注意力机制调节获得注意力机制输出。
译码器模块,用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出。
求和模块,用于将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出。
回归输出模块,用于根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据。
分类输出模块,用于根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
下面介绍前向循环神经网络中涉及的编码器模块、注意力机制模块和译码器模块的具体工作过程。
如图3所示,多维变量X输入到所述数据处理模块,数据处理模块输出X、m以及,获得时序点t对应编码器的输入为向量/>、/>、/>以及/>,通过编码器获得的输出为/>,,H为隐藏层神经元的个数,所有时序点共享编码器。其中编码器内部包含如下过程:
2) 根据输出端衰减函数构建模型的隐藏状态。。/>为矩阵取内积符号,“/>”代表纵向拼接;,表示第t个时序点对应的隐藏层输出状态,/>表示第t-1个时序点对应的隐藏层输出状态,默认初始值/>由高斯分布抽样确定;/>,为sigmoid激活函数;B,C,d均为隐藏状态/>的待定系数、且B,C,d初始值均由高斯分布抽样确定;/>为/>完成最终插值后的值当前编码器中不包含其计算公式,但不影响首次迭代计算,因为可以使用初始值进行插值,在公式(21)中包含/>计算公式,/>。/>时序点对应的衰减单元,正常来说,/>越大,/>受长时间缺失值的影响,包含的错误信息就越大,那么/>也相应失真(公式4)。为了削弱/>错误信息影响,引入衰减单元/>,/>越大,/>越小(公式3),相应的/>也减小,比如/>减小到0,则公式(4)变为,隐藏状态/>输出只受/>影响,避免了失真。由于/>削弱了失真,相对容易收敛到准确值,那么模型收敛速度也会加快。
注意力机制模块包括第一全连接层、第一softmax层和加权求和模块;所述注意力机制输出的获得方法包括:将所有时序点的隐藏状态、所有时序点的第一译码器的输入,输入至所述第一全连接层获得第一全连接层的输出;将所述第一全连接层的输出,输入至所述第一softmax层后得到所述第一softmax层输出;将所有时序点的隐藏状态和第一全连接层的输出在所述加权求和模块中进行矩阵运算后获得注意力机制输出。
具体如图3所示,所述注意力机制模块中的加权求和标志对应的输入为softmax层的输出以及/>;注意力机制模块的全连接层输入为以及/>,其中/>是译码器输出值,/>,首次迭代训练可以随机初始化,公式(8)为/>计算公式。注意力机制模块的输出为/>,/>被称为上下文向量,/>。该模块的注意力权重矩阵为/>,,/>计算步骤如下:
2) 计算softmax层的输出。/>。softmax层内部包含softmax函数,它是将/>放缩到0~1之间,即/>表示第t个序列点的输入数据/>对第d个序列点回归和分类综合预测结果准确性的影响程度,/>越大则影响越大。计算出所有/>,则注意力权重矩阵为/>得解。
接着,下面介绍后向循环神经网络中涉及的编码器模块、注意力机制模块和译码器模块的具体工作过程。对于后向循环神经网络,多维变量X输入到数据处理模块,数据处理模块输出X、m以及,时序点t对应编码器的输入为向量/>以及/>,输出为,H为隐藏层神经元的个数,所有时序点共享编码器。其中编码器内部包含如下过程:
2) 根据输出端衰减函数构建模型的隐藏状态。。/>为矩阵取内积符号,“/>”代表纵向拼接;/>表示第t+1个时序点对应的隐藏层输出状态,默认初始值/>由高斯分布抽样确定;,/>为sigmoid激活函数;均为隐藏状态/>的待定系数、且/>初始值均由高斯分布抽样确定;/>为/>完成最终插值后的值,当前编码器中不包含其计算公式,但不影响首次迭代计算,因为可以使用初始值进行插值,在公式(21)中包含/>计算公式,/>为时序点对应的衰减单元,正常来说,/>越大,/>受长时间缺失值的影响,包含的错误信息就越大,那么/>也相应失真(公式10)。为了削弱/>错误信息影响,引入衰减单元/>越大,/>越小(公式9),相应的/>也减小,比如/>减小到0,则公式(10)变为/>,隐藏状态输出只受/>影响,避免了失真。由于/>削弱了失真,相对容易收敛到准确值,那么模型收敛速度也会加快。
同样的,后向循环神经网络中的注意力机制模块所述每个注意力机制模块的结构与前向循环神经网络中的注意力机制模块结构相同但具体参数因训练数据不同而不同。具体的,该注意力机制模块中的加权求和标志对应的输入为softmax层的输出以及;注意力机制模块的全连接层输入为/>以及,其中/>是译码器输出值,/>,首次迭代训练可以随机初始化,公式(14)为/>计算公式。注意力机制模块的输出为/>被称为上下文向量,。该模块的注意力权重矩阵为/>,/>,,/>计算步骤如下1) 计算全连接层的输出/>。。其中/>为/>与/>拼接得到的向量,全连接层权重矩阵,/>采用高斯分布抽样初始化。所有/>使用同一个全连接层的权重矩阵进行计算及/>的迭代更新。
2) 计算softmax层的输出。/>。softmax层内部包含softmax函数,它是将/>放缩到0~1之间,即/>表示第t个序列点的输入数据/>对第d个序列点回归和分类综合预测结果准确性的影响程度,/>越大则影响越大。计算出所有/>,则注意力权重矩阵为/>得解。
前向循环神经网络和后向循环神经网络的处理结果通过求和模块进一步融合,如
图3所示的输出模块,具体包括求和模块和分类输出模块,所述求和模块为图3上方左右两
个神经网络的结果按照时序交汇的位置,其中的加权求和标志的输入为和,输出
为。其中为时序点t的输出的待定系数且初始值由高斯分布抽样确定。
3)利用相同变量在不同时序点以及不同变量在相同时序点上的关系得到插值结果。/>。/>。均为/>的待定系数且/>初始值均由高斯分布抽样确定,/>为sigmoid函数。/>作为/>与/>的融合系数,其中,/>中的每个元素的取值介于0~1,含端值。
4) 最终插值结果为。/>。同时还将求和模块的结果输入到分类输出模块进行分类预测,所述分类输出模块包括第二全连接层和第二softmax层,根据所述每个时序点的输出获得所述每个时序点是否会发生脓毒血症的预测分类结果的方法包括:将所述每个时序点的输出输入至所述第二全连接层获得第二全连接层输出;将所述第二全连接层输出输入至所述第二softmax层获得所述softmax层输出作为发生脓毒血症的预测分类结果。上述具体通过分类译码器实现,所述分类译码器的输出为/>,所述分类译码器的内部具有如下机制:
2)输入到softmax函数,输出为/>。/>。N表示该模型为N分类任务,/>;使用softmax函数目的是将各分类预测的结果放缩到0~1之间,如此便可以使用概率的定义,/>中数值最大元素对应的类别即为分类预测结果。
上述模型在训练过程中,为了在一阶段同时完成插值回归预测和分类预测,损失函数要包含回归损失函数和分类损失函数两个部分。
回归损失函数包含的机理如下:1) 一个样本的回归损失函数为。。/>的转置。为了完成回归算法的训练,必须随机选择/>中一定比例/>的非空缺真实值/>用于回归损失计算,/>为/>的回归预测结果。2) 一个训练批次,/>个样本的回归损失函数为/>。/>。
遗传算法是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。通过上述过程,建模已经完成,超参数的优化也是后续必须的步骤,当前主流算法优化基本都采用经验判断以及网格穷举搜索,但这种方式耗时耗力,无法获得全局最优解。如图4所示,为本申请优化超参数的方法的流程图,首先需要初始化种群规模、演化代数、交叉概率以及变异概率。交叉概率就是模仿遗传学的子代继承父母基因的概率,变异概率模仿子代本身受环境影响发生基因变异的概率。然后初始化ABRITS模型的超参数,超参数通常为类别参数或数值参数,对于数值型参数需要离散化处理,然后对类别参数以及离散化的数值参数按照设定的规则进行二进制编码。将S次独立试验获得的综合损失函数L的均值作为适应度,适应度越小,模型参数越接近最优解。当当前子代中的所有个体都完成适应度计算,记录下最小的适应度以及对应的个体超参数取值,然后使用轮盘赌算法赋予适应度更大的个体遗传到下一代,反之,尽可能将适应度较小的个体去除。随后,按照交叉概率,随机抽取两个个体进行部分编码交换,完成交叉。交叉完毕后,再按照变异概率,随机选取个体,并将个体的编码由1变0,由0变1。完成轮盘赌以及交叉和变异,则生成新一代超参数的二进制编码。最后根据编码规则进行译码获取新一代的入模参数,再判断演化代数目是否达到设定值,如果未达到设定值则重复上述过程,若达到设定值则输出最佳超参数集合以及对应的适应度。
依赖上述模型,本发明的实施例提供一种脓毒症实时预警的方法,包括:
步骤S101、根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据。
步骤S102、根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态。
步骤S103、在每个顺序方向上根据所述所有时序点的隐藏状态、所有时序点的第一译码器输入进行注意力机制调节获得每个时序点的注意力机制输出。
步骤S104、用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出。
步骤S105、将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出。
步骤S106、根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据。
步骤S107、根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
上述模型结合双向循环神经网络和能够同时完成缺失值的补齐和脓毒症发生与否的预测,模型开发效率高。上述方法充分利用相同特征在不同时序点的关联性以及不同特征在相同时序点上的关联性,并对这两种关联性进行数学建模,以提高算法预测性能。在正反两个方向分别增加注意力机制模块,大幅消除长序列预测功能丧失的问题。
为了进一步提高本发明实施例中模型的功能,本发明的实施例在上述模块的基础上的还具有模块特征值贡献计算模块和/或干预方案提供模块,用于执行步骤S4,具体的,所述模块特征值贡献计算模块用于针对每个样本,使用KernelSHAP算法计算出样本/>中每个特征/>在每个时序点上的贡献值/>,并根据/>与0之间的关系获得特征/>对发生脓毒血症的贡献;所述干预方案提供模块,用于针对每个样本/>,采用DiCE算法获得与所述样本/>对应的患者的指标调整方案作为干预发生脓毒血症的参考方案。
KernelSHAP为Kernel SHapley Additive exPlanations 的缩写,是一种归因分析方法,本发明实施例的上述模型与KernelSHAP算法结合可以筛查出有利因素、有害因素和无关系因素。我们将样本的数据输入到已训练的本发明实施例的上述模型模型预测分类结果,并使用KernelSHAP算法自动计算出样本的SHAP值为/>。。
表示所有参与SHAP计算的样本SHAP值的均值;/>表示样本/>的第/>个因素对预测结果的贡献值;当/><0时,表明增大特征/>的值会减弱脓毒症的风险;当/>>0时,表明增大特征/>的值会增大脓毒症的风险;当/>=0时,表明特征/>与脓毒症没有关系。
KernelSHAP是一种静态解释方法,它能够筛查出预测结果对应的高风险因素。以往临床专家在筛查出高风险因素后,通过主观决策调整患者身体指标以规避脓毒症发生,但这种主观决策误差大。因此该发明将DiCE算法引入到脓毒症的干预中来,DiCE是reversed by diverse counterfactual explanations 的简称,DiCE与已经训练的本发明实施例的模型结合,实现脓毒症干预方案的自动推荐,每一个方案都有具体量化指标,患者选择性价比最高的一个方案并实践落实,就可以规避脓毒症的发生。当然,DiCE是以两个假设为前提的,即模型预测能力不受时间轴变化影响且特征之间相互独立。为了尽可能抵消假设造成的误差,我们建议对DiCE的干预方案设置多轮约束筛查,比如年龄不可降低,性别不能变等,另外患者预后要尽快落实干预方案。DiCE的具体建模过程如下:
DiCE推荐的方案要具有多样性、合理性并且可以反转预测结果。DiCE产生的推荐方案过少,医生和/或患者无法查找到合适的推荐方案,这显然是不合理的。但是过多的推荐方案意味着需要同时修正的指标要多,患者无法在同一时期约束如此大量身体指标,这样反而又不合理。所以我们要兼顾DiCE产生推荐方案的多样性和合理性,在二者中确定最佳折中点。
基于推荐方案多样性的损失函数为。表示第/>个推荐方案。K表示产生的推荐方案的个数;表示/>与/>之间的曼哈顿距离;/>表示行列式的值,且对角线增加了扰动以防止行列式为0;推荐方案之间多样性越明显,则/>越大,由于我们计算损失函数,所以要加上负号。
基于推荐方案合理性的损失函数为。x表示对应于预测结果的真实观测特征;/>通过更改x某个或多个特征观测值得到的反转预测结果的推荐方案。当/>与x之间距离越近,意味着/>较x更改的特征少,患者更加容易落实推荐方案。
成功反转预测结果的损失函数为。/>表示将/>带入已训练模型的预测概率。我们可以把/>看做发生脓毒症。当时,相应的惩罚值即/>为0。当/>且时,意味着推荐方案没有反转预测结果,相应的惩罚值为/>。当且/>,相应惩罚值为/>。/>函数并不唯一,比如对于/>且/>时,可以增加惩罚值。
和/>是用于平衡损失函数的超参数。事先我们需确定生成候选方案的个数,然后使用梯度下降法降低损失函数,损失函数已经收敛或进行5000次迭代作为训练停止条件。最后我们将可以反转预测结果的推荐方案送入特征约束程序进行多轮筛查,直到性价比最高的推荐方案被找到为止。
通过上述方法,尽管本发明的实施例的输入数据为矩阵型数据,但选取特定的输入及输出建立映射关系,仍可以采用KernelSHAP量化任意时序点上任意特征值的贡献大小,即用KernelSHAP量量化风险因素贡献,可以使用DiCE自动推荐干预方案,患者只要在预警期将生命体征等指标调整到DiCE推荐的数值后,即可规避特定时序点上的脓毒症。
在本实施例中,提供一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行以上实施例中的方法。
这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。
上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
模型训练测试
本发明实施例的模型训练及测试的数据集来自2019年脓毒症预测挑战赛,该数据集为时序化数据集,竞赛要求完成脓毒症分类任务,但在本发明的实施例中,不仅完成了脓毒症早期预警的分类任务,还完成了特征插值任务。
数据网址为:https://physionet.org/content/challenge-2019/1.0.0/,需要使用到的特征值如表1所示。
表1 特征及标签信息表
特征缩写 | 特征 | 释义 |
HR | Heart rate (beats per minute) | 每分钟心跳次数 |
O2Sat | Pulse oximetry (%) | 脉搏血氧饱和度(%) |
Temp | Temperature (deg C) | 温度(摄氏度) |
SBP | Systolic BP (mm Hg) | 收缩压(mm hg) |
MAP | Mean arterial pressure (mm Hg) | 平均动脉压(毫米汞) |
DBP | Diastolic BP (mm Hg) | 舒张压(毫米汞柱) |
Resp | Respiration rate (breaths per minute) | 呼吸速率(每分钟呼吸次数) |
EtCO2 | End tidal carbon dioxide (mm Hg) | 呼吸末二氧化碳分压(毫米汞) |
BaseExcess | Excess bicarbonate (mmol/L) | 过量碳酸氢盐(mmol/l) |
HCO3 | Bicarbonate (mmol/L) | 碳酸氢盐(mmol/l) |
FiO2 | Fraction of inspired oxygen (%) | 吸入氧的分数(%) |
pH | pH | pH |
PaCO2 | Partial pressure of carbon dioxide from arterial blood (mm Hg) | 动脉血二氧化碳分压(毫米汞柱) |
SaO2 | Oxygen saturation from arterial blood (%) | 来自动脉血的血氧饱和度(%) |
AST | Aspartate transaminase (IU/L) | 天冬氨酸氨基转移酶(IU/L) |
BUN | Blood urea nitrogen (mg/dL) | 尿素氮(mg/dL) |
Alkalinephos | Alkaline phosphatase (IU/L) | 碱性磷酸酶 (IU/L) |
Calcium | Calcium (mg/dL) | 钙(mg/dL) |
Chloride | Chloride (mmol/L) | 氯化物(mmol/l) |
Creatinine | (mg/dL) | 肌酐(mg/dL) |
Bilirubin_direct | Direct bilirubin (mg/dL) | 直接胆红素(mg/dl) |
Glucose | Serum glucose (mg/dL) | 血清葡萄糖(mg/dl) |
Lactate | Lactic acid (mmol/L) | 乳酸(mmol/L) |
Magnesium | Magnesium (mmol/dL) | 镁(mmol/dl) |
Phosphate | Phosphate (mg/dL) | 磷酸盐(mg/dl) |
Potassium | Potassiam (mmol/L) | 钾(mmol/l) |
Bilirubin_total | Total bilirubin (mg/dL) | 总胆红素(毫克/分升) |
TroponinI | Troponin I (ng/mL) | 肌钙蛋白 i (ng/ml) |
Hct | Hematocrit (%) | 红细胞压积(%) |
Hgb | Hemoglobin (g/dL) | 血红蛋白(g/dl) |
PTT | Partial thromboplastin time (seconds) | 部分凝血活酶时间(秒) |
WBC | Leukocyte count (count/L) | 白细胞计数(计数/升) |
Fibrinogen | Fibrinogen concentration (mg/dL) | 纤维蛋白原浓度(mg/dl) |
Platelets | Platelet count (count/mL) | 血小板计数(计数/毫升) |
Age | Age (years) | 年龄 |
Gender | Female (0) or male (1) | 性别 |
Unit1 | Administrative identififier for ICU unit (MICU); false (0) or true (1) | 进入医药ICU |
Unit2 | Administrative identififier for ICU unit (SICU); false (0) or true (1) | 进入外科ICU |
HospAdmTime | Time between hospital and ICU admission (hours since ICU admission) | 从进入医院到进入ICU之间的时间 |
ICULOS | ICU length of stay (hours since ICU admission) | 入住ICU的时长 |
从上述脓毒症数据集中随机抽取5000个样本,每个样本对应一名入住ICU的患者,每个样本包含入住ICU的第1~32小时的时序化数据,以及每个时序点上是否有脓毒症发生的标签。每一次试验都随机将5000个样本按照2:8的比例拆分为测试集和训练集。
需要人工设定的参数包括:时序点个数T取32;取0.5,即回归损失函数与分类损失函数各占综合损失函数的一半;/>取0.2,即随机选择/>中20%的非空缺真实值/>用于回归损失计算;取40,即每个时序点上有40个特征变量。
另外,涉及遗传算法需要人工设定的参数包括:S取100,即重复试验100次,100次试验的综合损失函数的均值作为适应度;并设定种群大小为30,演化更新的子代数目为30,交叉概率为0.7,变异概率为0.15。
需要使用遗传算法优化的超参数包括:学习率为0.08;隐藏层神经元个数为60;用于训练的单批次样本数为32(如图5所示)。
为了比较出本发明实施例的优劣势,我们还使用遗传算法优化了BRITS、lightGBM、random forest以及Logistic regression。其中,BRITS最优超参数包括:学习率为0.075;隐藏层神经元个数为55;用于训练的单批次样本数为16。lightGBM最优超参数包括:训练迭代次数为150,学习率为0.115,树最大深度为6,以最小叶子节点样本权重为3。random forest最优超参数包括:最大特征个数为25,决策树最大深度为5,弱学习器最大迭代次数为200,叶结点最少样本数为2。Logistic regression最优超参数包括:正则化参数为L2,损失函数优化器为‘lbfgs’。遗传算法优化的五种机器学习算法性能如表2。
表2 五种算法性能比较
模型 | 综合损失函数值 | 分类评价指标 AUC |
Logistic regression | —— | 0.802 |
random forest | —— | 0.833 |
lightGBM | —— | 0.845 |
BRITS | 2.01 | 0.847 |
本发明的实施例 | 1.82 | 0.861 |
表2中BRITS和本发明的实施例同时具备插值和分类预测功能。Random forest、Logistic regression以及lightGBM直接使用零值填充,不具备特征缺失值预测功能,仅考察分类性能。很显然,本发明的实施例的综合损失函数值最小,分类评价指标AUC为0.861,为最高,所以本发明的实施例的插值和分类性能优异。
模型的迁移应用
采用与北京某三甲医院合作的方式,进一步验证训练完的本发明实施例的模型的泛化能力。随机抽取该医院2020年~2022年间的500名患者入住ICU的时序化样本数据进行预测评估,最终得到分类评价指标AUC为0.852,综合损失函数值为2.12。模型迁移应用后其AUC有了较小幅度降低,综合损失函数也有小幅度升高,但性能总体仍优异,在不同国度、不同时间段上仍表现较强的泛化能力。
进一步的,随机选择一名潜在脓毒症患者,使用本发明实施例中的模型和算法完成该潜在患者的第7~38小时是否发生脓毒症,并且量化造成该时序点脓毒症发生的特征贡献值,表3显示了第1个时序点预测发生脓毒症,即第7小时发生脓毒症,对应的特征贡献绝对值较大的前5个特征。
表3 KernelSHAP 量化特征贡献值
由于在第一个时序点上预测出了脓毒症,因此只考察了第一个时序点的特征贡献值。由表3可以看出,呼吸率Resp的特征贡献为-0.91,说明Resp为有利因素,剩余四个特征因素的贡献值为正值,所以为不利因素。为了能规避时序点1预测出的脓毒症,需要在6小时的预警期内调整身体指标,很显然年龄Age与脓毒症正相关,然而无法通过降低年龄来规避脓毒症,但可以通过调整乳酸(Lactate)、呼吸末CO2分压(EtCO2)以及氧合指数(FiO2)来规避时序点1的脓毒症预测结果。因此我们可以使用DiCE自动推荐这四个参数的调整值以规避脓毒症,具体调整结果见表4。
表4 DiCE推荐方案
表4中“——”表示不对特征观测值进行调整。只要在6小时预警期内将患者的乳酸由4mmol/L调整到2mmol/L;EtCO2由70mmHg调整到40mmHg;FiO2由80%调整到55%,则患者可以规避第7小时脓毒症的发生。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.脓毒症实时预警的神经网络模型,其特征在于,包括:
数据处理模块,用于根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;
编码器模块,用于根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;
注意力机制模块,用于在每个所述顺序方向上根据所有时序点的隐藏状态、所有第一译码器输入进行注意力机制调节获得注意力机制输出;
译码器模块,用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;
求和模块,用于将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;
回归输出模块,用于根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;
分类输出模块,用于根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果;
其中,所述隐藏状态的获得方法包括:
其中,根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据包括:
3.根据权利要求1所述的模型,其特征在于:所述每个顺序方向上各有一个注意力机制模块,所述每个注意力机制模块包括第一全连接层、第一softmax层和加权求和模块;所述注意力机制输出的获得方法包括:
将所有时序点的隐藏状态、所有时序点的第一译码器的输入,输入至所述第一全连接层获得第一全连接层的输出;
将所述第一全连接层的输出,输入至所述第一softmax层后得到所述第一softmax层输出;
将所有时序点的隐藏状态和第一全连接层的输出在所述加权求和模块中进行矩阵运算后获得注意力机制输出。
6.根据权利要求1所述的模型,其特征在于:所述分类输出模块包括第二全连接层和第二softmax层,根据所述每个时序点的输出获得所述每个时序点是否会发生脓毒血症的预测分类结果的方法包括:
将所述每个时序点的输出输入至所述第二全连接层获得第二全连接层输出;
将所述第二全连接层输出输入至所述第二softmax层获得所述softmax层输出作为发生脓毒血症的预测分类结果。
8.脓毒症实时预警的方法,采用权利要求1所述模型,其特征在于,包括:
根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;
根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;
在每个所述顺序方向上根据所述所有时序点的隐藏状态、所有时序点的第一译码器输入进行注意力机制调节获得每个时序点的注意力机制输出;
用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;
将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;
根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;
根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
10.一种电子设备,其特征在于:包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时采用所述权利要求1~7中任意一项所述的模型获得所述脓毒血症的预测分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310476267.7A CN116189906B (zh) | 2023-04-28 | 2023-04-28 | 脓毒症实时预警的神经网络模型、方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310476267.7A CN116189906B (zh) | 2023-04-28 | 2023-04-28 | 脓毒症实时预警的神经网络模型、方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116189906A CN116189906A (zh) | 2023-05-30 |
CN116189906B true CN116189906B (zh) | 2023-07-14 |
Family
ID=86452724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310476267.7A Active CN116189906B (zh) | 2023-04-28 | 2023-04-28 | 脓毒症实时预警的神经网络模型、方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116189906B (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101208602A (zh) * | 2005-04-15 | 2008-06-25 | 贝克顿迪金森公司 | 脓毒症的诊断 |
US10845769B2 (en) * | 2018-09-13 | 2020-11-24 | Diveplane Corporation | Feature and case importance and confidence for imputation in computer-based reasoning systems |
CN110123274A (zh) * | 2019-04-29 | 2019-08-16 | 上海电气集团股份有限公司 | 一种脓毒血症的监测系统 |
US20210183484A1 (en) * | 2019-12-06 | 2021-06-17 | Surgical Safety Technologies Inc. | Hierarchical cnn-transformer based machine learning |
CN111951975B (zh) * | 2020-08-19 | 2022-03-25 | 哈尔滨工业大学 | 一种基于深度学习模型gpt-2的脓毒症早期预警方法 |
CN114742209A (zh) * | 2022-04-24 | 2022-07-12 | 北京建筑大学 | 一种短时交通流预测方法及系统 |
CN115458158B (zh) * | 2022-09-23 | 2023-09-15 | 深圳大学 | 一种针对脓毒症患者的急性肾损伤预测系统 |
CN115456460A (zh) * | 2022-09-30 | 2022-12-09 | 昆明理工大学 | 一种制丝松散回潮工艺的多质量指标输出预测方法、系统 |
-
2023
- 2023-04-28 CN CN202310476267.7A patent/CN116189906B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN116189906A (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9959390B2 (en) | Modeling techniques for predicting mortality in intensive care units | |
Zhang et al. | Lstm for septic shock: Adding unreliable labels to reliable predictions | |
EP2614480A2 (en) | Medical scoring systems and methods | |
Teisseyre et al. | Cost-sensitive classifier chains: Selecting low-cost features in multi-label classification | |
CN114420231B (zh) | 一种可解释的急性肾损伤持续预警方法、系统、存储介质及电子设备 | |
Carrara et al. | Mortality prediction model of septic shock patients based on routinely recorded data | |
Nanayakkara et al. | Unifying cardiovascular modelling with deep reinforcement learning for uncertainty aware control of sepsis treatment | |
Khoshnevisan et al. | An adversarial domain separation framework for septic shock early prediction across ehr systems | |
Ali et al. | Multitask deep learning for cost-effective prediction of patient's length of stay and readmission state using multimodal physical activity sensory data | |
Moreno-Sánchez | Data-driven early diagnosis of chronic kidney disease: development and evaluation of an explainable AI model | |
Qiu et al. | A latent batch-constrained deep reinforcement learning approach for precision dosing clinical decision support | |
CN115116612A (zh) | 一种儿童患者病情智能风险评估系统及方法 | |
Nesaragi et al. | A correlation matrix-based tensor decomposition method for early prediction of sepsis from clinical data | |
Duan et al. | Early prediction of sepsis using double fusion of deep features and handcrafted features | |
CN114611879A (zh) | 一种基于多任务学习的临床风险预测系统 | |
Yang et al. | Development of a machine learning model for the prediction of the short-term mortality in patients in the intensive care unit | |
Du et al. | The effects of deep network topology on mortality prediction | |
CN116189906B (zh) | 脓毒症实时预警的神经网络模型、方法和电子设备 | |
Macias et al. | Mortality prediction enhancement in end-stage renal disease: A machine learning approach | |
KR102615261B1 (ko) | 섬망 예측 방법 및 이의 장치 | |
Arzeno et al. | Designing optimal mortality risk prediction scores that preserve clinical knowledge | |
Kausch et al. | Individual illness dynamics: an analysis of children with sepsis admitted to the pediatric intensive care unit | |
Liu et al. | Interpretable machine learning model for early prediction of mortality in elderly patients with multiple organ dysfunction syndrome (MODS): a multicenter retrospective study and cross validation | |
Zhang et al. | Modelling EHR timeseries by restricting feature interaction | |
Ge et al. | Using deep learning with attention mechanism for identification of novel temporal data patterns for prediction of ICU mortality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |