CN116825356B - 多关联手术并发症风险评估方法、系统及计算设备 - Google Patents
多关联手术并发症风险评估方法、系统及计算设备 Download PDFInfo
- Publication number
- CN116825356B CN116825356B CN202310853311.1A CN202310853311A CN116825356B CN 116825356 B CN116825356 B CN 116825356B CN 202310853311 A CN202310853311 A CN 202310853311A CN 116825356 B CN116825356 B CN 116825356B
- Authority
- CN
- China
- Prior art keywords
- complications
- complication
- pre1
- network
- markov
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012502 risk assessment Methods 0.000 title claims abstract description 34
- 238000001356 surgical procedure Methods 0.000 title abstract description 18
- 238000010801 machine learning Methods 0.000 claims abstract description 33
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 9
- 230000000241 respiratory effect Effects 0.000 claims description 7
- 206010053692 Wound complication Diseases 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 230000001732 thrombotic effect Effects 0.000 claims description 5
- 208000012902 Nervous system disease Diseases 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 4
- 230000001965 increasing effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000002980 postoperative effect Effects 0.000 description 5
- 230000002265 prevention Effects 0.000 description 5
- 206010002091 Anaesthesia Diseases 0.000 description 4
- 230000037005 anaesthesia Effects 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 101000951325 Homo sapiens Mitoferrin-1 Proteins 0.000 description 3
- 206010020772 Hypertension Diseases 0.000 description 3
- 102100037984 Mitoferrin-1 Human genes 0.000 description 3
- 102000007562 Serum Albumin Human genes 0.000 description 3
- 108010071390 Serum Albumin Proteins 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 208000028659 discharge Diseases 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000036407 pain Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 206010053481 Bronchopleural fistula Diseases 0.000 description 1
- 208000008279 Dumping Syndrome Diseases 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- 208000034486 Multi-organ failure Diseases 0.000 description 1
- 206010053159 Organ failure Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 208000032395 Post gastric surgery syndrome Diseases 0.000 description 1
- 206010071229 Procedural haemorrhage Diseases 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 208000004756 Respiratory Insufficiency Diseases 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- PNNCWTXUWKENPE-UHFFFAOYSA-N [N].NC(N)=O Chemical compound [N].NC(N)=O PNNCWTXUWKENPE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229940109239 creatinine Drugs 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013110 gastrectomy Methods 0.000 description 1
- 238000002682 general surgery Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000029744 multiple organ dysfunction syndrome Diseases 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- -1 platelet count Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 201000004193 respiratory failure Diseases 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种多关联手术并发症风险评估方法、系统及计算设备。利用马尔科夫网与多关联并发症之间的有效契合性,通过有监督的机器学习算法和模型,将马尔科夫网嵌入多标签双层模型架构,突破长期以来外科领域一直存在的由于并发症间复杂关系难以厘清而阻碍了对其风险进行系统评估的技术瓶颈,还原并发症间及其与风险因素间错综复杂的交织关系,产生一套围术期全程的多关联手术并发症风险评估系统,该系统具有过程透明,准确直观,可预测的特点,为围术期全程多关联手术并发症的风险量化管理,为临床预防和降低手术并发症的发生提供了智能化的辅助决策工具,对于提高医疗质量和加强患者安全管理具有广阔的应用前景。
Description
技术领域
本发明涉及医疗设备技术领域,特别是涉及一种多关联手术并发症风险评估方法、系统及计算设备。
背景技术
外科手术是医疗安全风险最高的临床工作。高质量的医疗准则是避免给患者带来可预防的伤害。随着人口老龄化进程加剧和手术医疗资源可及性的增加,全球手术量呈现出逐年上升的趋势。外科手术患者的安全问题成为一项巨大且日益严重的公共卫生挑战,据一项世界范围内的调查显示,高达20%-30%左右的患者会出现手术并发症,术后1个月死亡率从1%到4%不等,且发生并发症将会显著增加患者死亡率。作为一系列相互关联的术后结局,并发症本身还可引起其他继发性并发症,具有共发、级联特点,约有17%的患者发生多重并发症,其死亡风险增大约30倍,给患者及家庭带来了极大伤害和痛苦,也给医疗保健带来了巨大的临床压力和经济负担。
手术并发症是指手术操作而引起的组织器官的损伤、缺失、功能障碍等,可见于临床各手术科室,分为一般性并发症和特殊并发症。一般并发症在各种手术后都可能会出现,如切口感染、出血和肺炎等;特殊并发症与手术方式有关,如胃切除后的倾倒综合征、肺叶切除术后的支气管胸膜瘘等。并发症轻者增加患者痛苦,延迟康复时间;重者可危及生命。及时防治并发症是术后处理的一个重要组成部分。
手术并发症的发生主要有以下三种原因:
1、患者因素:如解剖异常,个体差异,病情轻重等。
2、医生因素:手术者技术生疏,操作粗燥,诊断失误等。
3、护理因素:如护理操作失误,管理混乱等。
如何对并发症进行系统的优化管理,避免其发生和发展是外科领域长期关注和研究的重点。2004年修订完成的Clavien-Dindo手术并发症分级系统是目前最广泛使用的并发症管理工具,但其以发生并发症后的治疗措施为分级标准使得临床进行风险干预仍处于被动地位,若能将并发症与患者风险因素相结合,从治疗为主转向防治结合,进行有针对性的预防和和量化管理,将有望进一步减少并发症的发生。
机器学习技术在应对数量和复杂性呈指数级增长的临床数据上已表现出优于经典统计学模型的潜力,利用高维的术前或术中特征,基于机器学习的手术风险评估工具为加强手术并发症的管理带来了新机遇。目前现有的各种机器学习算法突破的技术点大多集中在对相互关联的模型输入(即患者风险因素)的处理上,对于相互关联的结局变量(即多关联手术并发症),尚无分级且量化风险评估的模型构建。因此产生一套可用于有效评估具有相互影响的复杂关系的多关联手术并发症的系统,成为提高医疗质量和保障患者安全亟待解决的技术难题。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:提供一种易于操作,可靠性高,且切实有效的多关联手术并发症风险评估方法、系统及计算设备。
(二)技术方案
为解决上述问题,本发明一方面提出了一种多关联手术并发症风险评估方法,包括以下步骤:
S1:编码每位患者的所有术前特征x和多关联并发症y y=(y1,y2,…,yi,…,yC),其中,yi (i=1,2,…,C) 表示每种并发症类型,C表示所考虑并发症的类型数;
S2:构建多关联并发症y之间复杂网络关系的马尔科夫网(MARKOV网);
S3:识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi);
S4:以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi);
S5:以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症yi的初步预测结果pre1(yi);
S6:对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(y)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x, pre1(yi), pre1(MB(yi))};
S7:对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi);
S8:将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的最终预测结果pre2(yi)。
优选地,该方法还包括以下步骤:
S9:对S8产生的最终预测结果pre2(yi)进行校准得到校准风险r(yi)及相对风险估计RR(yi);
校准过程采用MILLER’S校准方法进行,利用数据库中所有个体的观测值及预测值拟合模型:
,
得到α与β的参数估计值后,代入pre2(yi),通过下式变换得到校准风险r(yi);
,
相对风险RR(yi)为某一个体的风险r(yi)相对于全人群平均风险的比值,计算公式为:
。
优选地,该方法还包括以下步骤:
S10:对模型最终预测结果进行个体解释,分为两大部分:术前因素x对并发症的作用,以及并发症之间的相互作用;
两部分均采用Shapley additive explanations (SHAP)模型解释方法,第j个特征的贡献,即SHAP值的计算公式为:
,
其中,F是所有特征的集合,S为F的任意子集,SHAP值通过计算包含第j个特征与未包含第j个特征时预测值的差异在所有特征子集S上的加权平均来反映该特征的重要程度。
优选地,所述步骤S2进一步包括如下步骤:
S21:将每个并发症yi视作网络中的一个结点,采用基于约束的贝叶斯网络结构学习算法,通过一系列的条件独立性检验依次识别每个结点的马尔科夫毯,以此得到网络在每个结点局部的约束条件,从而从全局上建立一个满足所有局部约束条件的贝叶斯网络;
S22:连接所述贝叶斯网络中每个子结点的任意两个父结点,并忽略贝叶斯网络中所有弧的方向,从而得到马尔科夫网。
优选地,该方法所述步骤S4的机器学习模型为随机森林基模型。
优选地,该方法所述步骤S7的机器学习模型为随机森林基模型。
优选地,该方法所述步骤S1的多关联并发症y包括:伤口类并发症;血栓类并发症;非计划重返手术间;神经类并发症;心脏类并发症;呼吸类并发症;衰竭类并发症;死亡八种类型。
本发明另一方面提出了一种多关联手术并发症风险评估系统,包括以下模块:
编码模块,编码每位患者的术前特征x和多关联并发症y;
马尔科夫网构建模块,构建多关联并发症y之间复杂网络关系的马尔科夫网;
马尔科夫毯识别模块,识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi);
第一训练模块,以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi);
初步预测模块,以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症y的初步预测结果pre1(yi);
聚合模块,对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(yi)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x, pre1(yi), pre1(MB(yi))};
第二训练模块,对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi);
风险评估模块,将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的风险评估结果pre2(yi)。
本发明第三方面提出了一种计算设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述多关联手术并发症风险评估方法的步骤。
(三)有益效果
本发明的上述多关联手术并发症风险评估方法、系统及计算设备,利用马尔科夫网与多关联并发症之间的有效契合性,通过机器学习算法和模型,实现多关联并发症风险的有效评估,方法客观有效,能够实现较好的医疗风险评估效果,为预防和降低手术并发症的发生提供依据,对提高医疗质量和保障患者安全具有广阔的应用前景。
附图说明
图1为本发明一实施例的多关联手术并发症风险评估方法的流程示意图。
图2为本发明一实施例的患者术前特征示意图。
图3为本发明一实施例的各并发症相对风险RR(yi)估值雷达图。
图4 - 图11本发明一实施例的影响各并发症风险的最重要的术前特征示意图。
图12 - 图18为本发明一实施例的并发症之间的相互作用示意图。
图19为本发明一实施例的多关联手术并发症风险评估方法的方法学通路示意图。
图20为本发明一实施例的多关联并发症复杂关系可视化网络示意图。
具体实施方式
本发明是基于《现代手术麻醉安全管理体系建设与推广项目》(The ModernSurgery and Anesthesia Safety Management System Construction and Promotion,MSCP)而产生的研究成果。该项目由北京协和医院牵头,国家行业基金资助(2014-2017),联合国内3家具有区域代表性的大型三甲医院,包括中国医科大学附属第一医院、青海省人民医院和中南大学湘雅医院。MSCP是一项以医院外科手术患者人群为基础的多中心前瞻性队列研究,旨在通过采取系统性干预策略来规范外科相关医务人员常规的医疗操作,以达到提升患者安全的目的,是迄今为止国内首项涉及全外科的患者安全项目。根据项目整体设计,平行收集了2015年1月至6月和2016年1月至6月两阶段四家医院所有实施外科手术患者的相关数据5万多例,全部患者数据已做脱敏处理,项目已通过所有参与医院的伦理审查。
本发明数据基于MSCP项目独立搭建的电子数据采集(Electronic DataCollection,EDC)系统进行收集,主要包括患者基本信息、术前检查、手术麻醉、术中护理、术后相关信息和手术结局6个版块,对应术前、术中及术后三个阶段信息,均由相应的病房、手术室和重症监护室(intensive care unit,ICU)部门专职人员完成填写。EDC系统正式运行前经过了全部外科科室的培训和预实验过程。术前信息包括患者基本信息,术前体格检查,术前实验室检查,术前麻醉分级和手术相关信息,术中信息主要包括手术时长和术中出血量。术后信息主要包括术后是否直接去向ICU、是否因病情危重转入ICU、ICU进入和返回病房时间、手术结局(死亡或并发症)、出院主要诊断和出院日期等,数据收集过程经过严格的质量控制。
下面结合附图及实施例对本发明进行详细说明如下。
图1是本发明一个实施例的多关联手术并发症风险评估方法的流程示意图,如图1所示,该方法包括以下步骤:
S1:编码每位患者的所有术前特征x和多关联并发症y y=(y1,y2,…,yi,…,yC),其中,yi (i=1,2,…,C) 表示每种并发症类型,C表示所考虑并发症的类型数。
术前特征x可能包括:人口学特征(年龄,性别,吸烟,BMI);手术相关变量(手术科室,急诊,ASA得分);合并症(心脏疾病史,糖尿病,高血压,慢性肺部疾病史,肾功能不全,卒中史);最新一次实验室检测特征(心率,体温,血白细胞计数,血红蛋白,血小板计数,血清白蛋白,血清肌酐,血清尿素氮)等。
术前特征x可选择多种变量编码类型,如二分类0-1编码,多分类编码或连续性变量编码方式等。
多关联并发症y是指C个并发症yi之间是相关的,本发明旨在评估y整体的风险,即在评估每个yi风险的基础上同时评估y作为一个整体的风险。
多关联并发症y=(y1,y2,…,yi,…,yC)可选择二进制向量编码方式,向量中每个并发症yi为0-1取值,表示该患者是否发生该种类型并发症。如向量(1,0,…,0,…,1)表示该患者发生第一种和第C种并发症,而没有发生其他类型并发症。
S2:构建多关联并发症y之间复杂网络关系的马尔科夫网。
S3:识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi)。
关于马尔科夫毯,有如下性质:
,
即在给定某结点yi的马尔科夫毯MB(yi)的条件下,结点yi与网络中其他结点条件独立。
S4:以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi),机器学习模型可选择随机森林基模型。
S5:以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症yi的初步预测结果pre1(yi);
S6:对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(y)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x, pre1(yi), pre1(MB(yi))};
S7:对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi),本步骤的机器学习模型同样可选择随机森林基模型。
S8:将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的最终预测结果pre2(yi)。
在本发明第一方面的实施例中,该方法还包括以下步骤:
S9:对S8产生的最终预测结果pre2(yi)进行校准得到校准风险r(yi)及相对风险估计RR(yi);
校准过程采用MILLER’S校准方法进行,利用数据库中所有个体的观测值及预测值拟合模型:
,
得到α与β的参数估计值后,代入pre2(yi),通过下式变换得到校准风险r(yi);
,
相对风险RR(yi)为某一个体的风险r(yi)相对于全人群平均风险的比值,计算公式为:
。
在本发明第一方面的实施例中,该方法还包括以下步骤:
S10:对模型最终预测结果进行个体解释,分为两大部分:术前因素x对并发症的作用,以及并发症之间的相互作用;
两部分均采用Shapley additive explanations (SHAP)模型解释方法,第j个特征的贡献,即SHAP值的计算公式为:
,
其中,F是所有特征的集合,S为F的任意子集,SHAP值通过计算包含第j个特征与未包含第j个特征时预测值的差异在所有特征子集S上的加权平均来反映该特征的重要程度。
在本发明第一方面的一个实施例中,所述步骤S2进一步包括如下步骤:
S21:将每个并发症yi视作网络中的一个结点,采用基于约束的贝叶斯网络结构学习算法,通过一系列的条件独立性检验依次识别每个结点的马尔科夫毯,以此得到网络在每个结点局部的约束条件,从而从全局上建立一个满足所有局部约束条件的贝叶斯网络;
S22:连接所述贝叶斯网络中每个子结点的任意两个父结点,并忽略贝叶斯网络中所有弧的方向,从而得到马尔科夫网。
在本发明第一方面的一个实施例中,该方法所述步骤S1的多关联并发症y包括:伤口类并发症;血栓类并发症;非计划重返手术间;神经类并发症;心脏类并发症;呼吸类并发症;衰竭类并发症;死亡八种类型。
在本发明第一方面的一个实施例中,如图2 - 图18所示,该实施例中男性普外科手术患者年龄超过65岁、有高血压病史、术前血清白蛋白小于35g/L,图2为患者术前特征示意图,右侧代表异常特征(高风险指征),左侧代表正常特征。
图3为各个并发症的相对风险RR(yi)估计值雷达图,RR>1代表高风险,RR<1代表低风险。如图3所示,图中提示该患者面临着6种并发症发生风险: 血栓类并发症, 呼吸类并发症, 心脏类并发症, 伤口类并发症,非计划重返手术间, 衰竭类并发症,其中血栓类并发症发生风险远高于其他并发症。
图4 - 图11为影响各并发症风险的最重要的术前特征示意图,柱形长度代表shap值大小,大于0代表患者某因素增加该并发症风险,小于0代表降低该并发症风险。如图4 -图11表示,导致大多数并发症发生的主要因素是低血清白蛋白和高龄,此外高血压和性别也会促进血栓形成,因此可通过针对这些因素进行术前干预以降低并发症风险。
图12 – 图18为并发症之间的相互作用示意图,即执行步骤S10所获得的相关结果,其中柱形长度代表shap值大小,大于0代表患者某因素增加该并发症风险,小于0代表降低该并发症风险。如图12 – 图18所示,在并发症之间的相互作用方面,呼吸类并发症增加了其他六种并发症的风险,排在非计划重返手术间、神经类并发症、心脏类并发症和死亡的第一位。心脏类并发症是增加呼吸类并发症、衰竭类并发症和死亡风险的第二大并发症。此外,伤口类并发症增加了呼吸类并发症的风险,非计划重返手术间对伤口类并发症和衰竭类有负面影响。表明不仅要警惕这些高危并发症,而且要警惕它们可能引发的级联反应。
本发明实施例的多关联手术并发症风险评估方法的方法学通路如图19所示,能够生成如图20所示的多关联并发症复杂关系可视化网络,以便全局视角下展现各个并发症之间的相互依赖关系,还可以是个体化并发症风险评估工具,即患者个体级别的风险评估结果,包括每种并发症的发生风险评估,风险来源推断(如高龄增加了患者器官衰竭的风险),以及并发症间可能的级联关系提示(如呼吸衰竭增加了多器官功能衰竭的风险)等。
本发明另一方面的多关联手术并发症风险评估系统的一个实施例中,该系统包括以下模块:
编码模块,编码每位患者的术前特征x和多关联并发症y;
马尔科夫网构建模块,构建多关联并发症y之间复杂网络关系的马尔科夫网;
马尔科夫毯识别模块,识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi);
第一训练模块,以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi);
初步预测模块,以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症y的初步预测结果pre1(yi);
聚合模块,对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(yi)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x, pre1(yi), pre1(MB(yi))};
第二训练模块,对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi);
风险评估模块,将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的风险评估结果pre2(yi)。
在本发明第三方面的计算设备的一个实施例中,该计算设备包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述多关联手术并发症风险评估方法的步骤。
本发明利用马尔科夫网与多关联并发症之间的有效契合性,通过有监督的机器学习算法和模型,将马尔科夫网嵌入多标签双层模型架构,突破长期以来外科领域一直存在的由于并发症间复杂关系难以厘清而阻碍了对其风险进行系统评估的技术瓶颈,还原了临床情境中真实存在的风险因素与并发症间的交织关系,并建立了对该种复杂关系实现系统性量化的通道,产生了一套准确直观且过程透明的多关联手术并发症风险评估系统。该系统提供了一套可覆盖整个围术期的全流程风险量化管理的智能化辅助决策工具,以支持实现术前风险-轻微并发症-严重并发症的术前防发生,术后防发展的三级管理策略,全面渗透精准医疗理念,为每位患者提供个性化的安全管理服务。从切实解决临床问题出发,建立了方法学前沿与临床医生之间沟通的桥梁,以技术方案为突破点,为精准分层、精准干预的系统视角下的并发症管理开辟新路径。系统包含完整的可通用的算法体系,参数训练基于临床真实数据,以半引导的模型构建过程和全自动的后期学习方式完成系统的概率修正和自我优化的训练过程,以适用于临床实践中不断增长的医疗数据和具有较大区域间异质性的医疗环境,为临床干预提供可发展可持续的具有前瞻性的因地制宜的量化依据,为实现世界卫生组织在《2021-2030 年全球患者安全行动计划》中提出的“零伤害”愿景贡献力量。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (8)
1.一种多关联手术并发症风险评估方法,其特征在于,包括以下步骤:
S1:编码每位患者的所有术前特征x和多关联并发症y,y=(y1,y2,…,yi,…,yC) ,其中,yi (i=1,2,…,C) 表示每种并发症类型,C表示所考虑并发症的类型数;
S2:构建多关联并发症y之间复杂网络关系的马尔科夫网;
所述步骤S2进一步包括如下步骤:
S21:将每个并发症yi视作网络中的一个结点,采用基于约束的贝叶斯网络结构学习算法,通过一系列的条件独立性检验依次识别每个结点的马尔科夫毯,以此得到网络在每个结点局部的约束条件,从而从全局上建立一个满足所有局部约束条件的贝叶斯网络;
S22:连接所述贝叶斯网络中每个子结点的任意两个父结点,并忽略贝叶斯网络中所有弧的方向,从而得到马尔科夫网;
S3:识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi);
S4:以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi);
S5:以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症yi的初步预测结果pre1(yi);
S6:对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(y)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x, pre1(yi), pre1(MB(yi))};
S7:对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi);
S8:将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的最终预测结果pre2(yi)。
2.如权利要求1所述的多关联手术并发症风险评估方法,其特征在于,还包括以下步骤:
S9:对S8产生的最终预测结果pre2(yi)进行校准得到校准风险r(yi)及相对风险估计RR(yi);
校准过程采用MILLER’S校准方法进行,利用数据库中所有个体的观测值及预测值拟合模型:
,
得到α与β的参数估计值后,代入pre2(yi),通过下式变换得到校准风险r(yi);
,
相对风险RR(yi)为某一个体的风险r(yi)相对于全人群平均风险的比值,计算公式为:
。
3.如权利要求2所述的多关联手术并发症风险评估方法,其特征在于,还包括以下步骤:
S10:对模型最终预测结果进行个体解释,分为两大部分:术前因素x对并发症的作用,以及并发症之间的相互作用;
两部分均采用Shapley additive explanations (SHAP)模型解释方法,第j个特征的贡献,即SHAP值的计算公式为:
,
其中,F是所有特征的集合,S为F的任意子集,SHAP值通过计算包含第j个特征与未包含第j个特征时预测值的差异在所有特征子集S上的加权平均来反映该特征的重要程度。
4.如权利要求1所述的多关联手术并发症风险评估方法,其特征在于,所述步骤S4的机器学习模型为随机森林基模型。
5.如权利要求1所述的多关联手术并发症风险评估方法,其特征在于,所述步骤S7的机器学习模型为随机森林基模型。
6.如权利要求1所述的多关联手术并发症风险评估方法,其特征在于,所述步骤S1的多关联并发症y包括:伤口类并发症;血栓类并发症;非计划重返手术间;神经类并发症;心脏类并发症;呼吸类并发症;衰竭类并发症;死亡八种类型。
7.一种多关联手术并发症风险评估系统,其特征在于,包括以下模块:
编码模块,编码每位患者的术前特征x和多关联并发症y;
马尔科夫网构建模块,构建多关联并发症y之间复杂网络关系的马尔科夫网,具体地,将每个并发症yi视作网络中的一个结点,采用基于约束的贝叶斯网络结构学习算法,通过一系列的条件独立性检验依次识别每个结点的马尔科夫毯,以此得到网络在每个结点局部的约束条件,从而从全局上建立一个满足所有局部约束条件的贝叶斯网络,连接所述贝叶斯网络中每个子结点的任意两个父结点,并忽略贝叶斯网络中所有弧的方向,从而得到马尔科夫网;
马尔科夫毯识别模块,识别马尔科夫网中每个结点的马尔科夫毯,得到每个并发症yi的马尔科夫毯MB(yi);
第一训练模块,以所有术前特征x为输入特征,为每个并发症yi独立训练有监督的机器学习模型BR(yi);
初步预测模块,以所有术前特征x为输入特征,输入机器学习模型BR(yi),产生每个并发症y的初步预测结果pre1(yi);
聚合模块,对每个并发症yi,将所有的术前特征x,初步预测结果pre1(yi),马尔科夫毯MB(yi)输入机器学习模型BR(yi)产生的预测结果pre1(MB(yi)),聚合为增强特征空间{x,pre1(yi), pre1(MB(yi))};
第二训练模块,对每个并发症yi,用增强特征空间{x, pre1(yi), pre1(MB(yi))}再次进行有监督的机器学习模型训练,得到最终模型MA(yi);
风险评估模块,将每个并发症yi对应的增强特征空间{x, pre1(yi), pre1(MB(yi))}输入最终模型MA(yi),得到该并发症yi的风险评估结果pre2(yi)。
8.一种计算设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310853311.1A CN116825356B (zh) | 2023-07-12 | 2023-07-12 | 多关联手术并发症风险评估方法、系统及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310853311.1A CN116825356B (zh) | 2023-07-12 | 2023-07-12 | 多关联手术并发症风险评估方法、系统及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116825356A CN116825356A (zh) | 2023-09-29 |
CN116825356B true CN116825356B (zh) | 2024-02-06 |
Family
ID=88120188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310853311.1A Active CN116825356B (zh) | 2023-07-12 | 2023-07-12 | 多关联手术并发症风险评估方法、系统及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116825356B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108735296A (zh) * | 2018-06-29 | 2018-11-02 | 广东医科大学 | 基于Hidden Markov Model的2型糖尿病危险因素分析方法 |
WO2018220600A1 (en) * | 2017-06-02 | 2018-12-06 | University Of Florida Research Foundation, Inc. | Method and apparatus for prediction of complications after surgery |
CN111524598A (zh) * | 2020-04-21 | 2020-08-11 | 赵述武 | 一种围术期并发症预测方法及系统 |
CN111933284A (zh) * | 2020-09-27 | 2020-11-13 | 平安科技(深圳)有限公司 | 一种并发症风险预测系统、方法、装置、设备及介质 |
CN113178258A (zh) * | 2021-04-28 | 2021-07-27 | 青岛百洋智能科技股份有限公司 | 外科手术术前风险评估方法及系统 |
CN113362954A (zh) * | 2021-05-20 | 2021-09-07 | 浙江大学 | 一种老年患者术后感染并发症风险预警模型及其建立方法 |
CN114242234A (zh) * | 2021-12-15 | 2022-03-25 | 四川大学 | 基于聚合神经网络的tavr术后并发症风险值预测方法 |
CN114334143A (zh) * | 2021-11-10 | 2022-04-12 | 阜外华中心血管病医院 | 一种成人心脏外科术后发生胃肠道并发症预测的建模 |
CN115206530A (zh) * | 2022-07-18 | 2022-10-18 | 南通市肿瘤医院 | 一种提高食管癌术后并发症预测精度的方法及系统 |
CN115240803A (zh) * | 2021-04-25 | 2022-10-25 | 华中科技大学同济医学院附属协和医院 | 模型训练方法、并发症预测方法及系统、设备和介质 |
CN116052882A (zh) * | 2023-01-06 | 2023-05-02 | 福州大学 | 基于机器学习的嗜铬细胞瘤术后高血压并发症预测系统 |
CN116313053A (zh) * | 2023-03-16 | 2023-06-23 | 山西医科大学 | 术后并发症预测模型训练方法及术后并发症预测方法 |
-
2023
- 2023-07-12 CN CN202310853311.1A patent/CN116825356B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018220600A1 (en) * | 2017-06-02 | 2018-12-06 | University Of Florida Research Foundation, Inc. | Method and apparatus for prediction of complications after surgery |
CN108735296A (zh) * | 2018-06-29 | 2018-11-02 | 广东医科大学 | 基于Hidden Markov Model的2型糖尿病危险因素分析方法 |
CN111524598A (zh) * | 2020-04-21 | 2020-08-11 | 赵述武 | 一种围术期并发症预测方法及系统 |
CN111933284A (zh) * | 2020-09-27 | 2020-11-13 | 平安科技(深圳)有限公司 | 一种并发症风险预测系统、方法、装置、设备及介质 |
CN115240803A (zh) * | 2021-04-25 | 2022-10-25 | 华中科技大学同济医学院附属协和医院 | 模型训练方法、并发症预测方法及系统、设备和介质 |
CN113178258A (zh) * | 2021-04-28 | 2021-07-27 | 青岛百洋智能科技股份有限公司 | 外科手术术前风险评估方法及系统 |
CN113362954A (zh) * | 2021-05-20 | 2021-09-07 | 浙江大学 | 一种老年患者术后感染并发症风险预警模型及其建立方法 |
CN114334143A (zh) * | 2021-11-10 | 2022-04-12 | 阜外华中心血管病医院 | 一种成人心脏外科术后发生胃肠道并发症预测的建模 |
CN114242234A (zh) * | 2021-12-15 | 2022-03-25 | 四川大学 | 基于聚合神经网络的tavr术后并发症风险值预测方法 |
CN115206530A (zh) * | 2022-07-18 | 2022-10-18 | 南通市肿瘤医院 | 一种提高食管癌术后并发症预测精度的方法及系统 |
CN116052882A (zh) * | 2023-01-06 | 2023-05-02 | 福州大学 | 基于机器学习的嗜铬细胞瘤术后高血压并发症预测系统 |
CN116313053A (zh) * | 2023-03-16 | 2023-06-23 | 山西医科大学 | 术后并发症预测模型训练方法及术后并发症预测方法 |
Non-Patent Citations (2)
Title |
---|
基于Logistic回归模型的5类普外科并发症预测;陈王跃等;《基础医学与临床》;第43卷(第6期);全文 * |
多状态马尔科夫模型估计2型糖尿病患者慢性并发症累积数量的转移概率及影响因素研究;石舒原等;《中华流行病学杂志》;第42卷(第7期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116825356A (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021120936A1 (zh) | 一种基于多任务学习模型的慢病预测系统 | |
Rothman et al. | Development and validation of a continuous measure of patient condition using the electronic medical record | |
Fialho et al. | Data mining using clinical physiology at discharge to predict ICU readmissions | |
Romano et al. | The evolving science of quality measurement for hospitals: implications for studies of competition and consolidation | |
Mayer et al. | Doubly robust treatment effect estimation with missing attributes | |
NZ537623A (en) | Method for training a learning-capable system | |
Cascini et al. | Developing a data-driven approach in order to improve the safety and quality of patient care | |
Abbas et al. | Cause analysis of caesarian sections and application of machine learning methods for classification of birth data | |
Khajehali et al. | Extract critical factors affecting the length of hospital stay of pneumonia patient by data mining (case study: an Iranian hospital) | |
Cummings et al. | Predicting intensive care transfers and other unforeseen events: analytic model validation study and comparison to existing methods | |
Agor et al. | The value of missing information in severity of illness score development | |
Fernández et al. | Analyzing the use of artificial intelligence for the management of chronic obstructive pulmonary disease (COPD) | |
Yuan et al. | Efficient symptom inquiring and diagnosis via adaptive alignment of reinforcement learning and classification | |
CN116825356B (zh) | 多关联手术并发症风险评估方法、系统及计算设备 | |
Ahmed et al. | A computer aided system for post-operative pain treatment combining knowledge discovery and case-based reasoning | |
Anggrawan et al. | Application of KNN Machine Learning and Fuzzy C-Means to Diagnose Diabetes | |
Huang et al. | Automatic surgery and anesthesia emergence duration prediction using artificial neural networks | |
Kusiak et al. | Hypoplastic left heart syndrome: Knowledge discovery with a data mining approach | |
Sethi et al. | State-of-the-art reviews: safety in complex spine surgery | |
Khalid et al. | A bayesian patient-based model for detecting deterioration in vital signs using manual observations | |
Yet | Bayesian Networks for Evidence Based Clinical Decision Support. | |
Mahani et al. | Predicting lab values for gastrointestinal bleeding patients in the intensive care unit: a comparative study on the impact of comorbidities and medications | |
Nugroho et al. | Preeclampsia Classification Modeling Based on Fuzzy Rules | |
Price et al. | Evaluating the performance of the National Early Warning Score in different diagnostic groups | |
Hu | A Recurrent Network Approach to G-Computation for Sepsis Outcome Prediction Under Dynamic Treatment Regimes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |