CN116564512A - 心力衰竭合并肾功能不全患者的人工智能预后评估系统 - Google Patents
心力衰竭合并肾功能不全患者的人工智能预后评估系统 Download PDFInfo
- Publication number
- CN116564512A CN116564512A CN202310241378.XA CN202310241378A CN116564512A CN 116564512 A CN116564512 A CN 116564512A CN 202310241378 A CN202310241378 A CN 202310241378A CN 116564512 A CN116564512 A CN 116564512A
- Authority
- CN
- China
- Prior art keywords
- module
- analysis module
- risk
- data
- prognosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004393 prognosis Methods 0.000 title claims abstract description 43
- 238000011156 evaluation Methods 0.000 title claims abstract description 34
- 206010019280 Heart failures Diseases 0.000 title claims abstract description 26
- 208000001647 Renal Insufficiency Diseases 0.000 title claims abstract description 21
- 201000006370 kidney failure Diseases 0.000 title claims abstract description 21
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 20
- 238000007405 data analysis Methods 0.000 claims abstract description 29
- 230000006854 communication Effects 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims abstract description 13
- 230000004083 survival effect Effects 0.000 claims description 59
- 238000004458 analytical method Methods 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 18
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 claims description 13
- 238000002790 cross-validation Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 claims description 8
- 238000013209 evaluation strategy Methods 0.000 claims description 8
- 239000000654 additive Substances 0.000 claims description 7
- 230000000996 additive effect Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000007175 bidirectional communication Effects 0.000 claims description 6
- 238000011282 treatment Methods 0.000 claims description 6
- 238000001325 log-rank test Methods 0.000 claims description 5
- 230000002861 ventricular Effects 0.000 claims description 5
- 206010003119 arrhythmia Diseases 0.000 claims description 4
- 230000006793 arrhythmia Effects 0.000 claims description 4
- 230000000747 cardiac effect Effects 0.000 claims description 4
- 229940109239 creatinine Drugs 0.000 claims description 4
- 230000024924 glomerular filtration Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 102000001554 Hemoglobins Human genes 0.000 claims description 3
- 108010054147 Hemoglobins Proteins 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000008050 Total Bilirubin Reagent Methods 0.000 claims description 3
- 102000013394 Troponin I Human genes 0.000 claims description 3
- 108010065729 Troponin I Proteins 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 208000020832 chronic kidney disease Diseases 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 208000029078 coronary artery disease Diseases 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 210000003743 erythrocyte Anatomy 0.000 claims description 3
- 238000012854 evaluation process Methods 0.000 claims description 3
- 238000007667 floating Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 3
- 210000004698 lymphocyte Anatomy 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 abstract description 2
- 208000019269 advanced heart failure Diseases 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 101800000407 Brain natriuretic peptide 32 Proteins 0.000 description 1
- 101800002247 Brain natriuretic peptide 45 Proteins 0.000 description 1
- 206010007556 Cardiac failure acute Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010052337 Diastolic dysfunction Diseases 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102400001263 NT-proBNP Human genes 0.000 description 1
- 102000004903 Troponin Human genes 0.000 description 1
- 108090001027 Troponin Proteins 0.000 description 1
- 206010000891 acute myocardial infarction Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000007211 cardiovascular event Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000027744 congestion Diseases 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 229940030606 diuretics Drugs 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000005986 heart dysfunction Effects 0.000 description 1
- 208000038003 heart failure with preserved ejection fraction Diseases 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 229940124975 inotropic drug Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 230000036284 oxygen consumption Effects 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 108010008064 pro-brain natriuretic peptide (1-76) Proteins 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000002227 vasoactive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种心力衰竭合并肾功能不全患者的人工智能预后评估系统,涉及生物检测技术领域,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块。本发明所提供的预后评估系统系相比所有队列的其他临床特征、客观风险标记和公布的综合评分具有更高的准确性和稳健性。
Description
技术领域
本发明涉及生物检测技术技术领域,更具体的是涉及一种心力衰竭合并肾功能不全患者的人工智能预后评估系统。
背景技术
尽管随着循证治疗的实施,短期结果有所改善,但大多数心力衰竭(HF)患者最终仍进展到晚期,心衰患者的肾功能不全(RD)通常与死亡率和再入院风险增加相关,大约40%-50%的晚期心力衰竭(AHF)患者患有慢性RD,形成了导致不良结局的恶性循环,原因是缺乏可靠的工具来预测未来的风险。
人工智能(AI)已经得出了许多单一风险标记和多参数综合评分,帮助医生得出全面的预后评估,为决策提供信息,尽管许多模型显示出在不久的将来被广泛纳入的潜力,但在临床应用时,有几个重要的考虑因素和限制经常被忽视,首先,大多数预后工具不是来自AHF和RD患者群体,再者,风险评分在住院或心血管事件方面表现良好,但在死亡率方面表现较差,使得评估系统的准确性和稳健性差。
因此,提出一种心力衰竭合并肾功能不全患者的人工智能预后评估系统来解决上述问题很有必要。
发明内容
(一)解决的技术问题
本发明的目的在于:为了解决现有评估系统准确性和稳健性差的问题,本发明提供一种心力衰竭合并肾功能不全患者的人工智能预后评估系统。
(二)技术方案
本发明为了实现上述目的具体采用以下技术方案:
心力衰竭合并肾功能不全患者的人工智能预后评估系统,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将生存率及置信区间进一步可视化为K-M曲线和柱状图;
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
进一步地,所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度、总胆红素。
进一步地,所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
进一步地,所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
进一步地,所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
进一步地,所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
进一步地,所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征,以两个检验中未调整的P值均<0.05为标准,筛选出48种潜在的生存特征。
进一步地,所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列和Replication队列,基于此训练生成最终的生存评估系统。
进一步地,所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
进一步地,所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
与现有技术相比,本发明提供的预后评估系统的有益效果为:
1、本发明所提供的预后评估系统系相比所有队列的其他临床特征、客观风险标记和公布的综合评分具有更高的准确性和稳健性。
2,本发明开发了一个综合框架,集成了12种算法来筛选构建的生存评估系统,使得该系统具有优于其他临床特征和客观风险模型的泛化和性能。
附图说明
图1为研究队列的总体情况:(A)HN-CRCD队列总体基线概况:利用电子医疗记录系统收集患者的合并症,治疗,临床,实验室,随访等数据;(B)患者诊断出心力衰竭合并肾功能不全后,存活时间为0-18个月的患者的有条件存活期可达30个月的K-M曲线;
图2为单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量;
图3为该生存评估系统的综合开发框架;
图4中(A)表示12种人工智能算法;(B)表示通过综合模型评估策略,对包含132个方案的前向算法网络进行了模型效能评估;(C)表示累积Kaplan-Meier分析基于验证队列和Meta队列证实生存评估系统的预后价值;
图5中(A)表示将该系统与其他临床变量在预测预后方面的表现进行比较;(B)表示该系统的C指数和IBS分析;(C)表示亚组分析;(D)表示多因素Cox回归证实该系统预测评分是患者全因死亡的独立预后因素;(E)Shapley图表;
图6中(A)该生存评估系统进一步被打包成一个网络应用程序;(B)K-M曲线;(C)柱状图;(D)和(E)Shapley图表;(F)风险等级图表。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-6,一种心力衰竭合并肾功能不全患者的人工智能预后评估系统,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表,如附图6中的(F)所示;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将此结果进一步可视化为K-M曲线(如附图6中的(B)所示)和柱状图(如附图6中的(C)所示);
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表,如附图6中的(D)和(E)所示或如如附图5中的(E)所示,在X轴上,给出了每个特征的贡献,Shapley值为负的特征有利于影响预测(降低全因死亡的风险),特征本身的值的影响呈现在Y轴上,例如,对于年龄,高的值(红色)与正的Shapley值相关联,这将增加全因死亡的风险,而低的值(蓝色)将降低Shapley值和全因死亡的风险;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
具体的,所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度、总胆红素。
具体的,所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
具体的,所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
具体的,所述步骤1中的数据源源于HN-CRCCD,通过提取病例系统记录、电话或邮件联系患者、亲属和转介医生来建立随访队列数据。
具体的,所述步骤1中的数据源选用的标准如下:
标准1、年龄18岁周岁以上;
标准2、首次入院后根据国际疾病分类第9版诊断为晚期心衰,尽管已经接受过治疗的患者,其至少必须满足以下三个标准中的两个:
标准21、严重且持续的心衰症状(NYHA-III或-IV);
标准22、严重心功能不全的定义至少有一项,(1)射血分数30%;(2)无法手术的严重先天性畸形或严重瓣膜异常;(3)孤立性右心功能不全;(4)BNP或NT-proBNP持续升高;(5)HFpEF定义的严重左室结构异常或舒张期功能障碍;
标准23、低输出量阵发性心衰,需要正性肌力药物和血管活性药物;或肺部或全身充血发作,需要大剂量静脉注射利尿剂;或在过去12个月内住院;或恶性心律失常,导致>1次计划外就诊;
标准24、因心脏原因而削弱运动能力、不能运动或进行6分钟短距离步行试验(<300米)或最高耗氧量>12毫升/公斤/分钟;
标准3、诊断为肾功能不全,排除标准:(1)首次发病的急性心力衰竭;(2)原发性肾脏疾病;(3)感染性疾病或恶性肿瘤;(4)接受肾透析治疗;(5)研究所需相关协变量的个人资料缺失>20%;(6)住院时间>2天。
具体的,所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
具体的,所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
具体的,结合附图2所示,所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征(如附图2所示),以两个检验中未调整的P值均<0.05为标准,单因素Cox比例风险回归和单因素Log-rank检验分别确定了50和63个预后标记物,筛选出48种潜在的生存特征。
具体的,结合图4所示,所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程,12种学习器包括:生存随机森林SRC学习器(Survival-RFsrc)、L1正则化PH回归(L1-regularization)、L2正则化PH回归(L2-regularization)、弹性网正则化PH回归(Enet-regularization)、生存支持向量机(Survival-SVM)、生存树(Survival-rpart)、基于似然增强的Cox模型(Survival-CoxBoost)、增强型广义线性生存学习器(Survival-GlmBoost)、极端梯度助推生存学习器(Survival-XgBoost)、生存梯度助推机学习器(Survival-GBM)、生存完全参数学习器(Survival-Fully-parametric)、加速斜向随机生存森林学习器(survival-aorsf),该框架的主要目标之一是找到一个共识预后特征,即对手头任务具有最高区分能力的所有生存特征的子集,从而在惩罚冗余的同时增强模型的可解释性和性能;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序,滤器是一种外部算法,允许对特征进行排序和快速训练,通过对每一个潜在的生存特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该特征的重要性,然后依据权重从高到低排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征,包装器探索要找到的特征子集与模型本身之间的交互,通过递归地考虑越来越小的特征集来选择特征,首先,在初始训练集上训练估计器,并且获得每个特征的重要性,然后,从当前的一组特征中删除最不重要的特征,在修剪的集合上递归地重复该过程,直到最终到达所需数量的要选择的特征,使得模型的性能达到最优;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列(70%,n=498)和Replication队列(剩余30%,n=214),基于此训练生成最终的生存评估系统。
具体的,所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
具体的,所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
通过对132种方案进行了拟合,并通过共识评估策略计算了每个方案的C指数,得到的最优方案是将Survival-GBM和Survive-XgBoost相结合,平均C指数最高(0.821),在所有评估技术中表现一致,具有领先的判别能力(图3),最终的系统是使用这个方案从发现号队列中安装和训练的。
生存系统的验证
结合图5中(A)所示,基于步骤47,应用整个HN-CRCCD队列(Meta队列)和外部独立队列(BIDMC队列)对系统进行进一步验证,通过AUC和C-index对特定时间点和总体时间评估的歧视程度进行量化,综合Brier评分(IBS)被用作预测性能的总体总结性测量,并通过校准曲线图对校准进行评估,决策曲线分析(DCA)用于确定CPS系统的临床价值是否在实际的阈值概率范围内增加了净收益;
在Meta队列和BIDMC队列中,生存系统对每位患者分别生成相应的风险评分,高评分组患者的远期急性心肌梗死发生率显著高于低评分组,ROC分析显示,在6个月、12个月、24个月和30个月时,以全因死亡率(ACM)为终点的AUC在Meta队列和BIDMC队列中分别为0.931/0.952/0.973/0.976和0.925/0.947/0.965/0.960;
基于Meta队列和BIDMC队列,该系统预测的6个月、12个月和24个月存活率的校准曲线与实际观察结果吻合良好;
基于Meta队列和BIDMC队列,该系统在6个月、12个月和24个月存活的DCA也证实了良好临床实用价值;
将该系统的预测性能与其他收集的临床特征和变量进行了比较,结合图5中(B)所示,C-index和综合Brier评分(IBS)表明该系统具有明显更高的准确性;
进一步收集了几个已发表的危险标记物和评分,包括全身免疫炎症指数(SII)、中性粒细胞-淋巴细胞比率(NLR)、中性粒细胞/白细胞-中性粒细胞计数(DNLR)、淋巴细胞-单核细胞比率(LMR)、血小板-淋巴细胞比率(PLR)、白蛋白/纤维蛋白原比率(AFR)、甘油三酯-葡萄糖(TYG)指数、MAGGIC-HF、PREDICT-HF、BCN生物-HF、REMATCH-HF和3C-HF score,根据C-index和IBS,系统表现出比其他风险评分更好的性能。
为了合理地解释决策过程和调整治疗策略,医生需要了解CPS系统如何依赖于特定对象的系统特征或任何共病,Shapley Additive解释(Shap)值被归因于解决透明度问题,基于合作博弈理论估计每个特征的贡献,在个体尺度上,我们进一步可视化了参与预测的任何新受试者的特征,以及它们如何影响未来的生存结果。
结合图5中(C)所示,使用Shap机器学习可解释性分析,显示了12个生存特征对该评估系统决策的贡献,其中肾小球滤过率、年龄、肌钙蛋白、血肌酐和左室射血分数被确定为最重要的特征。
此外,结合图6中的(A)所示,该生存评估系统能够进一步被打包成一个网络应用程序,其中前12项为患者的12项预后特征,最下端的一个输入栏为患者择未来任意一个感兴趣时间点,该系统可以在任何新病例上工作,提供了一种更直观和更容易理解的方式来解释工作原理,对于任何患有HF和RD的受试者,使用13个简单问题的答案,该应用程序评估诊断后的未来存活率以及每个指标对结果的贡献,Web服务器是使用Django部署的;
进一步地,将该系统部署在一个免费且易于使用的在线网络应用程序中,用于任何新的主题,这项工作有助于优化监测方案和分层管理,并改善合并RD的AHF患者的临床结局。
以上,仅为本发明的较佳实施例,并不用以限制本发明,本发明的专利保护范围以权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (10)
1.心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将生存率及置信区间进一步可视化为K-M曲线和柱状图;
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
2.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度和总胆红素。
3.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者的12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
4.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
5.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
6.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
7.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征,以两个检验中未调整的P值均<0.05为标准,筛选出48种潜在的生存特征。
8.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列和Replication队列,基于此训练生成最终的生存评估系统。
9.根据权利要求8所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
10.根据权利要求8所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310241378.XA CN116564512A (zh) | 2023-03-13 | 2023-03-13 | 心力衰竭合并肾功能不全患者的人工智能预后评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310241378.XA CN116564512A (zh) | 2023-03-13 | 2023-03-13 | 心力衰竭合并肾功能不全患者的人工智能预后评估系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564512A true CN116564512A (zh) | 2023-08-08 |
Family
ID=87492238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310241378.XA Pending CN116564512A (zh) | 2023-03-13 | 2023-03-13 | 心力衰竭合并肾功能不全患者的人工智能预后评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564512A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079743A (zh) * | 2023-10-18 | 2023-11-17 | 中日友好医院(中日友好临床医学研究所) | 一种他汀类药物治疗效果预测模型及应用 |
-
2023
- 2023-03-13 CN CN202310241378.XA patent/CN116564512A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079743A (zh) * | 2023-10-18 | 2023-11-17 | 中日友好医院(中日友好临床医学研究所) | 一种他汀类药物治疗效果预测模型及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fu et al. | Development and validation of early warning score system: A systematic literature review | |
Rowan et al. | The use of artificial neural networks to stratify the length of stay of cardiac patients based on preoperative and initial postoperative factors | |
US11664126B2 (en) | Clinical predictor based on multiple machine learning models | |
CN113327679A (zh) | 一种肺栓塞临床风险及预后评分方法与系统 | |
US11676722B1 (en) | Method of early detection, risk stratification, and outcomes prediction of a medical disease or condition with machine learning and routinely taken patient data | |
CN116564512A (zh) | 心力衰竭合并肾功能不全患者的人工智能预后评估系统 | |
Berg et al. | Mortality risk prediction in cardiac surgery: comparing a novel model with the EuroSCORE | |
CN116598012A (zh) | 一种基于联邦学习价值评估的慢性病医疗保健方法和系统 | |
Mpanya et al. | Predicting in-hospital all-cause mortality in heart failure using machine learning | |
Zhao et al. | Machine learning models in heart failure with mildly reduced ejection fraction patients | |
Estépar | Artificial intelligence in COPD: New venues to study a complex disease | |
CN114724706A (zh) | 二型糖尿病合并癌症与常规化验指标相关性分析模型 | |
CN113782197B (zh) | 基于可解释性机器学习算法的新冠肺炎患者转归预测方法 | |
Findlay et al. | Individual risk modelling for esophagectomy: a systematic review | |
Lokhorst et al. | Risk stratification in adult and pediatric pulmonary arterial hypertension: A systematic review | |
АБУБАКАР et al. | Analytical review of publications on machine learning methods in oncology and approach to evaluating their quality | |
Rong et al. | Machine learning for prediction of outcomes in cardiogenic shock | |
Rajmohan et al. | G-Sep: A deep learning algorithm for detection of long-term sepsis using bidirectional gated recurrent unit | |
López Ratón et al. | GsymPoint: An R package to estimate the generalized symmetry point, an optimal cut-off point for binary classification in continuous diagnostic tests | |
CN113658693A (zh) | 一种用于新冠肺炎患者加重风险预测模型系统 | |
Zhao et al. | Random survival forests for predicting the interactions of multiple physiological risk factors on all-cause mortality | |
Boonvisuth | Development of an artificial intelligence model for prediction of dry weight in chronic hemodialysis patients and assessment of its accuracy compared to standard bioelectrical impedance analysis | |
Wu et al. | Predicting length of stay in intensive care unit using ensemble learning methods | |
Adamson | Personalisation of heart failure care using clinical trial data | |
Ray et al. | LUCAS: Development and Validation of a Simple Mortality Risk Calculator that Predicts 60-Day Survival of Adult SARS-CoV-2 Positive Patients at Hospital Admission Using Rapid Routine Tests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |