CN116564512A - 心力衰竭合并肾功能不全患者的人工智能预后评估系统 - Google Patents

心力衰竭合并肾功能不全患者的人工智能预后评估系统 Download PDF

Info

Publication number
CN116564512A
CN116564512A CN202310241378.XA CN202310241378A CN116564512A CN 116564512 A CN116564512 A CN 116564512A CN 202310241378 A CN202310241378 A CN 202310241378A CN 116564512 A CN116564512 A CN 116564512A
Authority
CN
China
Prior art keywords
module
analysis module
risk
data
prognosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310241378.XA
Other languages
English (en)
Inventor
唐俊楠
张金盈
张格�
仝壮
王泽禹
孙钊威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Zhengzhou University
Original Assignee
First Affiliated Hospital of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Zhengzhou University filed Critical First Affiliated Hospital of Zhengzhou University
Priority to CN202310241378.XA priority Critical patent/CN116564512A/zh
Publication of CN116564512A publication Critical patent/CN116564512A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种心力衰竭合并肾功能不全患者的人工智能预后评估系统,涉及生物检测技术领域,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块。本发明所提供的预后评估系统系相比所有队列的其他临床特征、客观风险标记和公布的综合评分具有更高的准确性和稳健性。

Description

心力衰竭合并肾功能不全患者的人工智能预后评估系统
技术领域
本发明涉及生物检测技术技术领域,更具体的是涉及一种心力衰竭合并肾功能不全患者的人工智能预后评估系统。
背景技术
尽管随着循证治疗的实施,短期结果有所改善,但大多数心力衰竭(HF)患者最终仍进展到晚期,心衰患者的肾功能不全(RD)通常与死亡率和再入院风险增加相关,大约40%-50%的晚期心力衰竭(AHF)患者患有慢性RD,形成了导致不良结局的恶性循环,原因是缺乏可靠的工具来预测未来的风险。
人工智能(AI)已经得出了许多单一风险标记和多参数综合评分,帮助医生得出全面的预后评估,为决策提供信息,尽管许多模型显示出在不久的将来被广泛纳入的潜力,但在临床应用时,有几个重要的考虑因素和限制经常被忽视,首先,大多数预后工具不是来自AHF和RD患者群体,再者,风险评分在住院或心血管事件方面表现良好,但在死亡率方面表现较差,使得评估系统的准确性和稳健性差。
因此,提出一种心力衰竭合并肾功能不全患者的人工智能预后评估系统来解决上述问题很有必要。
发明内容
(一)解决的技术问题
本发明的目的在于:为了解决现有评估系统准确性和稳健性差的问题,本发明提供一种心力衰竭合并肾功能不全患者的人工智能预后评估系统。
(二)技术方案
本发明为了实现上述目的具体采用以下技术方案:
心力衰竭合并肾功能不全患者的人工智能预后评估系统,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将生存率及置信区间进一步可视化为K-M曲线和柱状图;
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
进一步地,所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度、总胆红素。
进一步地,所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
进一步地,所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
进一步地,所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
进一步地,所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
进一步地,所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征,以两个检验中未调整的P值均<0.05为标准,筛选出48种潜在的生存特征。
进一步地,所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列和Replication队列,基于此训练生成最终的生存评估系统。
进一步地,所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
进一步地,所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
与现有技术相比,本发明提供的预后评估系统的有益效果为:
1、本发明所提供的预后评估系统系相比所有队列的其他临床特征、客观风险标记和公布的综合评分具有更高的准确性和稳健性。
2,本发明开发了一个综合框架,集成了12种算法来筛选构建的生存评估系统,使得该系统具有优于其他临床特征和客观风险模型的泛化和性能。
附图说明
图1为研究队列的总体情况:(A)HN-CRCD队列总体基线概况:利用电子医疗记录系统收集患者的合并症,治疗,临床,实验室,随访等数据;(B)患者诊断出心力衰竭合并肾功能不全后,存活时间为0-18个月的患者的有条件存活期可达30个月的K-M曲线;
图2为单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量;
图3为该生存评估系统的综合开发框架;
图4中(A)表示12种人工智能算法;(B)表示通过综合模型评估策略,对包含132个方案的前向算法网络进行了模型效能评估;(C)表示累积Kaplan-Meier分析基于验证队列和Meta队列证实生存评估系统的预后价值;
图5中(A)表示将该系统与其他临床变量在预测预后方面的表现进行比较;(B)表示该系统的C指数和IBS分析;(C)表示亚组分析;(D)表示多因素Cox回归证实该系统预测评分是患者全因死亡的独立预后因素;(E)Shapley图表;
图6中(A)该生存评估系统进一步被打包成一个网络应用程序;(B)K-M曲线;(C)柱状图;(D)和(E)Shapley图表;(F)风险等级图表。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-6,一种心力衰竭合并肾功能不全患者的人工智能预后评估系统,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表,如附图6中的(F)所示;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将此结果进一步可视化为K-M曲线(如附图6中的(B)所示)和柱状图(如附图6中的(C)所示);
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表,如附图6中的(D)和(E)所示或如如附图5中的(E)所示,在X轴上,给出了每个特征的贡献,Shapley值为负的特征有利于影响预测(降低全因死亡的风险),特征本身的值的影响呈现在Y轴上,例如,对于年龄,高的值(红色)与正的Shapley值相关联,这将增加全因死亡的风险,而低的值(蓝色)将降低Shapley值和全因死亡的风险;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
具体的,所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度、总胆红素。
具体的,所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
具体的,所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
具体的,所述步骤1中的数据源源于HN-CRCCD,通过提取病例系统记录、电话或邮件联系患者、亲属和转介医生来建立随访队列数据。
具体的,所述步骤1中的数据源选用的标准如下:
标准1、年龄18岁周岁以上;
标准2、首次入院后根据国际疾病分类第9版诊断为晚期心衰,尽管已经接受过治疗的患者,其至少必须满足以下三个标准中的两个:
标准21、严重且持续的心衰症状(NYHA-III或-IV);
标准22、严重心功能不全的定义至少有一项,(1)射血分数30%;(2)无法手术的严重先天性畸形或严重瓣膜异常;(3)孤立性右心功能不全;(4)BNP或NT-proBNP持续升高;(5)HFpEF定义的严重左室结构异常或舒张期功能障碍;
标准23、低输出量阵发性心衰,需要正性肌力药物和血管活性药物;或肺部或全身充血发作,需要大剂量静脉注射利尿剂;或在过去12个月内住院;或恶性心律失常,导致>1次计划外就诊;
标准24、因心脏原因而削弱运动能力、不能运动或进行6分钟短距离步行试验(<300米)或最高耗氧量>12毫升/公斤/分钟;
标准3、诊断为肾功能不全,排除标准:(1)首次发病的急性心力衰竭;(2)原发性肾脏疾病;(3)感染性疾病或恶性肿瘤;(4)接受肾透析治疗;(5)研究所需相关协变量的个人资料缺失>20%;(6)住院时间>2天。
具体的,所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
具体的,所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
具体的,结合附图2所示,所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征(如附图2所示),以两个检验中未调整的P值均<0.05为标准,单因素Cox比例风险回归和单因素Log-rank检验分别确定了50和63个预后标记物,筛选出48种潜在的生存特征。
具体的,结合图4所示,所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程,12种学习器包括:生存随机森林SRC学习器(Survival-RFsrc)、L1正则化PH回归(L1-regularization)、L2正则化PH回归(L2-regularization)、弹性网正则化PH回归(Enet-regularization)、生存支持向量机(Survival-SVM)、生存树(Survival-rpart)、基于似然增强的Cox模型(Survival-CoxBoost)、增强型广义线性生存学习器(Survival-GlmBoost)、极端梯度助推生存学习器(Survival-XgBoost)、生存梯度助推机学习器(Survival-GBM)、生存完全参数学习器(Survival-Fully-parametric)、加速斜向随机生存森林学习器(survival-aorsf),该框架的主要目标之一是找到一个共识预后特征,即对手头任务具有最高区分能力的所有生存特征的子集,从而在惩罚冗余的同时增强模型的可解释性和性能;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序,滤器是一种外部算法,允许对特征进行排序和快速训练,通过对每一个潜在的生存特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该特征的重要性,然后依据权重从高到低排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征,包装器探索要找到的特征子集与模型本身之间的交互,通过递归地考虑越来越小的特征集来选择特征,首先,在初始训练集上训练估计器,并且获得每个特征的重要性,然后,从当前的一组特征中删除最不重要的特征,在修剪的集合上递归地重复该过程,直到最终到达所需数量的要选择的特征,使得模型的性能达到最优;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列(70%,n=498)和Replication队列(剩余30%,n=214),基于此训练生成最终的生存评估系统。
具体的,所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
具体的,所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
通过对132种方案进行了拟合,并通过共识评估策略计算了每个方案的C指数,得到的最优方案是将Survival-GBM和Survive-XgBoost相结合,平均C指数最高(0.821),在所有评估技术中表现一致,具有领先的判别能力(图3),最终的系统是使用这个方案从发现号队列中安装和训练的。
生存系统的验证
结合图5中(A)所示,基于步骤47,应用整个HN-CRCCD队列(Meta队列)和外部独立队列(BIDMC队列)对系统进行进一步验证,通过AUC和C-index对特定时间点和总体时间评估的歧视程度进行量化,综合Brier评分(IBS)被用作预测性能的总体总结性测量,并通过校准曲线图对校准进行评估,决策曲线分析(DCA)用于确定CPS系统的临床价值是否在实际的阈值概率范围内增加了净收益;
在Meta队列和BIDMC队列中,生存系统对每位患者分别生成相应的风险评分,高评分组患者的远期急性心肌梗死发生率显著高于低评分组,ROC分析显示,在6个月、12个月、24个月和30个月时,以全因死亡率(ACM)为终点的AUC在Meta队列和BIDMC队列中分别为0.931/0.952/0.973/0.976和0.925/0.947/0.965/0.960;
基于Meta队列和BIDMC队列,该系统预测的6个月、12个月和24个月存活率的校准曲线与实际观察结果吻合良好;
基于Meta队列和BIDMC队列,该系统在6个月、12个月和24个月存活的DCA也证实了良好临床实用价值;
将该系统的预测性能与其他收集的临床特征和变量进行了比较,结合图5中(B)所示,C-index和综合Brier评分(IBS)表明该系统具有明显更高的准确性;
进一步收集了几个已发表的危险标记物和评分,包括全身免疫炎症指数(SII)、中性粒细胞-淋巴细胞比率(NLR)、中性粒细胞/白细胞-中性粒细胞计数(DNLR)、淋巴细胞-单核细胞比率(LMR)、血小板-淋巴细胞比率(PLR)、白蛋白/纤维蛋白原比率(AFR)、甘油三酯-葡萄糖(TYG)指数、MAGGIC-HF、PREDICT-HF、BCN生物-HF、REMATCH-HF和3C-HF score,根据C-index和IBS,系统表现出比其他风险评分更好的性能。
为了合理地解释决策过程和调整治疗策略,医生需要了解CPS系统如何依赖于特定对象的系统特征或任何共病,Shapley Additive解释(Shap)值被归因于解决透明度问题,基于合作博弈理论估计每个特征的贡献,在个体尺度上,我们进一步可视化了参与预测的任何新受试者的特征,以及它们如何影响未来的生存结果。
结合图5中(C)所示,使用Shap机器学习可解释性分析,显示了12个生存特征对该评估系统决策的贡献,其中肾小球滤过率、年龄、肌钙蛋白、血肌酐和左室射血分数被确定为最重要的特征。
此外,结合图6中的(A)所示,该生存评估系统能够进一步被打包成一个网络应用程序,其中前12项为患者的12项预后特征,最下端的一个输入栏为患者择未来任意一个感兴趣时间点,该系统可以在任何新病例上工作,提供了一种更直观和更容易理解的方式来解释工作原理,对于任何患有HF和RD的受试者,使用13个简单问题的答案,该应用程序评估诊断后的未来存活率以及每个指标对结果的贡献,Web服务器是使用Django部署的;
进一步地,将该系统部署在一个免费且易于使用的在线网络应用程序中,用于任何新的主题,这项工作有助于优化监测方案和分层管理,并改善合并RD的AHF患者的临床结局。
以上,仅为本发明的较佳实施例,并不用以限制本发明,本发明的专利保护范围以权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (10)

1.心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于,所述评估系统包括与主控模块通信连接的数据分析模块、显示模块、调取模块、存储模块以及用于输入患者入院后共12项预后特征的输入模块;
所述主控模块与输入模块单向通信连接,用于接收输入模块输入的信息,并反馈给数据分析模块;
所述数据分析模块与主控模块双向通信连接,所述数据分析模块包括Survival-GBM分析模块和Survive-XgBoost分析模块,所述Survival-GBM分析模块用于分析得到一项具体的数值型风险评分,所述Survive-XgBoost分析模块依据数值型风险评分将风险等级划分为高危、中危或低危,并生成风险等级图表;
所述数据分析模块还包括Kaplan-Meier分析模块以及Shapley Additive分析模块,所述Kaplan-Meier分析模块中还设置有ggplot R分析模块;
所述Kaplan-Meier分析模块基于风险等级来分析患者的未来每个时间段的生存率及置信区间,所述ggplot R分析模块将生存率及置信区间进一步可视化为K-M曲线和柱状图;
所述Shapley Additive分析模块用于分析12项预后特征对风险评分的影响,以生成Shapley图表;
所述调取模块与主控模块单向通信连接,用于调取风险等级图表、K-M曲线、柱状图或Shapley图表;
所述显示模块与主控模块单向通信连接,用于显示调取模块调取的风险等级图表、K-M曲线、柱状图或Shapley图表,并显示在显示屏上;
所述存储模块与主控模块双向通信连接,用于存储数据分析模块分析得到的每个患者的数据。
2.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述12项预后特征为:年龄、冠心病合并症、心律失常合并症、慢性肾脏病分期、左室射血分数、血肌酐、肾小球滤过率、淋巴细胞百分率、红细胞平均血红蛋白浓度、每博心输出量、血肌钙蛋白I浓度和总胆红素。
3.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述评估系统进行评估的过程如下:
步骤A:将患者的12项预后特征通过输入模块进行输入,由主控模块将结果反馈至数据分析模块进行分析:
步骤B:基于步骤A输入的患者的12项预后特征,由数据分析模块中的Survival-GBM分析模块将输入模块输入的12项预后特征进行分析,得到一项具体的数值型风险评分,由Survive-XgBoost分析模块将数值型风险评分进行分析后,将其划分为高危、中危或低危的风险等级,并生成风险等级图表;
步骤C:基于步骤B得到的风险等级,由Kaplan-Meier分析模块来分析患者未来每个时间段的生存率及置信区间,由ggplot R分析模块将此结果进一步可视化为K-M曲线和柱状图,通过Shapley Additive分析模块来分析12项预后特征的变化对风险评分的影响,生成Shapley图表;
步骤D:基于步骤C和步骤B生成的数据结果,医生通过调取模块调取风险等级图表、K-M曲线、柱状图或Shapley图表,主控模块将调取模块调取的内容显示在显示屏上,同时患者还能够选择未来任意一个感兴趣时间点,医生通过调取模块来调取该时间点的生存率及置信区间的柱状图。
4.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述评估系统的构建方法包括以下步骤:
步骤1、根据数据源建立随访队列数据;
步骤2、对步骤1中的随访队列数据预处理,得到第二数据集;
步骤3、鉴定步骤2的第二数据集中潜在预后特征,筛选出标准的潜在的生存特征,生成共识预后特征模型;
步骤4、构建生存评估系统。
5.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤2中利用链式方程的多重填补方法对随访队列数据具有随机缺失假设的变量进行了填补,生成五个初始数据集,并使用中位数进一步聚合为一个数据集,进一步对异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理。
6.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤2中经过预处理后第二数据集总共纳入了在患者入院后最初的24小时内的95个候选变量,包括人口学特征、合并症、生理指标、实验室参数、影像和超声心动图数据、治疗和临床管理数据。
7.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤3中采用单因素Cox比例风险回归和单因素Log-rank检验基于95个候选变量筛选与潜在生存预后相关的共识特征,以两个检验中未调整的P值均<0.05为标准,筛选出48种潜在的生存特征。
8.根据权利要求1所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤4中构建生存评估系统的具体步骤为:
步骤41、将12个ML学习器组成的大型串联式网络框架对步骤3中鉴定的48种潜在生存特征使用过滤器和包装器的混合特征选择方式进行模型拟合特征工程;
步骤42、对于每个ML学习器,采用过滤器方法根据相关性调整回归生存分数对潜在生存特征进行降序排序;
步骤43、采用与交叉验证相结合的顺序正向浮动选择搜索策略作为特征选择的包装器,通过C-index来确定最优特征;
步骤44、每一种学习器基于上述步骤均产生一组相对于该算法最优的特征子集,12个学习器中产生12组特征子集分别纳入其余11个ML学习器产生新的模型,最终该框架生成了包含132个预测模型方案;
步骤45、根据共识评估策略对步骤44中的132种方案的有效性和适用性进行评估;
步骤46、得到12项预后特征;
步骤47、HN-CRCCD队列进一步随机分为Discovery队列和Replication队列,基于此训练生成最终的生存评估系统。
9.根据权利要求8所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤43中采用交叉验证的具体步骤为:
步骤431、采用10倍交叉验证的方法将数据集分为10组,每次选取9组作为训练子集,其余组作为测试子集;
步骤432、对于每个训练子集,将分类后的特征按顺序添加到特征集中;
步骤433、每个选定的特征构造运用最大似然方法进行学习,并用网格搜索方法确定最优参数;
步骤434、根据SFFS策略和学习器的C-index,如果具有新特征集的模型的C-index没有得到改善,则从特征集中删除新增加的特征,否则,保留该特征;
步骤435、重复上述步骤,直到选择了所有潜在的生存特征,最后计算出测试子集的C-index。
10.根据权利要求8所述的心力衰竭合并肾功能不全患者的人工智能预后评估系统,其特征在于:所述步骤45中的共识评估策略包括一下3种方案:
方案1、10次迭代的10次交叉验证;
方案2、100次迭代的蒙特卡罗交叉验证;
方案3、1000次迭代的Bootstrap分析;
对于每个方案,分别计算出三种策略的C-index,具有最高平均C-index的方案作为搭建最终系统模型的方案。
CN202310241378.XA 2023-03-13 2023-03-13 心力衰竭合并肾功能不全患者的人工智能预后评估系统 Pending CN116564512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310241378.XA CN116564512A (zh) 2023-03-13 2023-03-13 心力衰竭合并肾功能不全患者的人工智能预后评估系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310241378.XA CN116564512A (zh) 2023-03-13 2023-03-13 心力衰竭合并肾功能不全患者的人工智能预后评估系统

Publications (1)

Publication Number Publication Date
CN116564512A true CN116564512A (zh) 2023-08-08

Family

ID=87492238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310241378.XA Pending CN116564512A (zh) 2023-03-13 2023-03-13 心力衰竭合并肾功能不全患者的人工智能预后评估系统

Country Status (1)

Country Link
CN (1) CN116564512A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079743A (zh) * 2023-10-18 2023-11-17 中日友好医院(中日友好临床医学研究所) 一种他汀类药物治疗效果预测模型及应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079743A (zh) * 2023-10-18 2023-11-17 中日友好医院(中日友好临床医学研究所) 一种他汀类药物治疗效果预测模型及应用

Similar Documents

Publication Publication Date Title
Fu et al. Development and validation of early warning score system: A systematic literature review
Rowan et al. The use of artificial neural networks to stratify the length of stay of cardiac patients based on preoperative and initial postoperative factors
US11664126B2 (en) Clinical predictor based on multiple machine learning models
CN113327679A (zh) 一种肺栓塞临床风险及预后评分方法与系统
US11676722B1 (en) Method of early detection, risk stratification, and outcomes prediction of a medical disease or condition with machine learning and routinely taken patient data
CN116564512A (zh) 心力衰竭合并肾功能不全患者的人工智能预后评估系统
Berg et al. Mortality risk prediction in cardiac surgery: comparing a novel model with the EuroSCORE
CN116598012A (zh) 一种基于联邦学习价值评估的慢性病医疗保健方法和系统
Mpanya et al. Predicting in-hospital all-cause mortality in heart failure using machine learning
Zhao et al. Machine learning models in heart failure with mildly reduced ejection fraction patients
Estépar Artificial intelligence in COPD: New venues to study a complex disease
CN114724706A (zh) 二型糖尿病合并癌症与常规化验指标相关性分析模型
CN113782197B (zh) 基于可解释性机器学习算法的新冠肺炎患者转归预测方法
Findlay et al. Individual risk modelling for esophagectomy: a systematic review
Lokhorst et al. Risk stratification in adult and pediatric pulmonary arterial hypertension: A systematic review
АБУБАКАР et al. Analytical review of publications on machine learning methods in oncology and approach to evaluating their quality
Rong et al. Machine learning for prediction of outcomes in cardiogenic shock
Rajmohan et al. G-Sep: A deep learning algorithm for detection of long-term sepsis using bidirectional gated recurrent unit
López Ratón et al. GsymPoint: An R package to estimate the generalized symmetry point, an optimal cut-off point for binary classification in continuous diagnostic tests
CN113658693A (zh) 一种用于新冠肺炎患者加重风险预测模型系统
Zhao et al. Random survival forests for predicting the interactions of multiple physiological risk factors on all-cause mortality
Boonvisuth Development of an artificial intelligence model for prediction of dry weight in chronic hemodialysis patients and assessment of its accuracy compared to standard bioelectrical impedance analysis
Wu et al. Predicting length of stay in intensive care unit using ensemble learning methods
Adamson Personalisation of heart failure care using clinical trial data
Ray et al. LUCAS: Development and Validation of a Simple Mortality Risk Calculator that Predicts 60-Day Survival of Adult SARS-CoV-2 Positive Patients at Hospital Admission Using Rapid Routine Tests

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination