CN116525105B - 一种心源性休克预后预测预警系统、设备及可存储介质 - Google Patents

一种心源性休克预后预测预警系统、设备及可存储介质 Download PDF

Info

Publication number
CN116525105B
CN116525105B CN202310782125.3A CN202310782125A CN116525105B CN 116525105 B CN116525105 B CN 116525105B CN 202310782125 A CN202310782125 A CN 202310782125A CN 116525105 B CN116525105 B CN 116525105B
Authority
CN
China
Prior art keywords
patient
cardiogenic shock
treatment
sample
genetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310782125.3A
Other languages
English (en)
Other versions
CN116525105A (zh
Inventor
孙宇慧
何昆仑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese PLA General Hospital
Original Assignee
Chinese PLA General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese PLA General Hospital filed Critical Chinese PLA General Hospital
Priority to CN202310782125.3A priority Critical patent/CN116525105B/zh
Publication of CN116525105A publication Critical patent/CN116525105A/zh
Application granted granted Critical
Publication of CN116525105B publication Critical patent/CN116525105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Bioethics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种心源性休克预后预测预警系统、设备及可存储介质,涉及智能医疗领域。所述系统包括:获取单元、特征提取单元、诊断单元、第二获取单元和决策单元,获取单元用于获取患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;特征提取单元对所述遗传信息进行特征提取,得到遗传特征;诊断单元基于所述遗传特征判断患者是否给予ECMO治疗;第二获取单元用于获取患者心源性休克分期诊断结果;决策单元基于所述分期诊断结果选择治疗方案。本发明开发的系统基于患者的基因信息,预测患者接受ECMO治疗后的效果,为患者能否接受ECMO治疗提供分子诊断证据,以更好地利用和分配医疗资源,具有重要的临床价值。

Description

一种心源性休克预后预测预警系统、设备及可存储介质
技术领域
本发明涉及智能医疗领域,更具体地,涉及一种心源性休克预后预测预警的系统、设备、计算机可读存储介质及其应用。
背景技术
心源性休克(cardiogenic shock, CS)是一种严重的心血管系统疾病,指心脏无法提供足够的血液流量以维持身体器官的功能,导致多个器官功能衰竭。常见病因包括急性心肌梗死、心肌炎、心脏手术等。大多数CS患者最初使用强心药物或血管升压药物进行治疗。然而,强心药物通常不足以改善组织灌注不足,并充分解决CS相关的代谢紊乱。此外,尽管这些药物可以增加心输出量并将血压维持在正常范围内,但这样做的代价是增加心肌耗氧量。另外,使用血管升压药可增加左室后负荷,导致微循环恶化,进而降低心输出量,导致CS的血流动力学恶化和代谢紊乱。因此,CS临床治疗中,常根据临床、血流动力学、影像学和实验室数据,来指导机械循环支持治疗方式的升级和降级。
机械支持包括主动脉内球囊反搏(Intra-aortic balloon pump, IABP)、体外膜氧合(Extracorporeal Membrane Oxygenation, ECMO)、便携式体外循环系统(TandemHeart)、心脏辅助装置(Impella)、左心室辅助装置(Left Ventricular Assist Device,LVAD)和右心室辅助装置(Right Ventricular Assist Device, RVAD)等。ECMO是一种重症监护技术,全称为体外膜肺氧合(Extracorporeal Membrane Oxygenation),通过将患者的静脉血引流至人工肺氧合器中进行氧合和二氧化碳清除,再将氧合后的血液输送回患者体内,以维持患者的生命体征。ECMO可分为VA-ECMO和VV-ECMO两种,前者主要用于心肺功能衰竭,后者主要用于肺功能衰竭。在心源性休克临床治疗中,ECMO可以通过提供充分的氧合和血流量,维持患者的生命体征,为治疗提供时间窗口。此外,ECMO还可以减轻心脏负荷,促进心肌功能的恢复。但是,采用ECMO治疗必须慎重,因为ECMO是为患者暂时提供心肺支持的机器,它的开机和维持费用高昂,操作难度大,也存在着一定的风险和并发症,例如出血、感染、血栓形成等,维持过程要求多科室协同配合,需要在专业医护人员的监护下进行。
发明内容
本发明方法获取患者外周血单核细胞样本的遗传信息,基于患者遗传信息中的基因表达量数据预测给予ECMO治疗的效果,进一步根据患者分期给予个性化的治疗方案,辅助医生做出临床决策。
本发明公开一种心源性休克预后预测预警系统,包括:
获取单元,用于获取患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
特征提取单元,对所述遗传信息进行特征提取,得到遗传特征,所述遗传特征包括以下基因中的一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132;
诊断单元,基于所述遗传特征判断患者是否给予ECMO治疗。
一种心源性休克预后预测预警设备,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行以下心源性休克预后预测预警方法,包括:
获取训练集患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
对所述遗传信息进行特征提取,得到遗传特征;
将所述遗传特征输入机器学习模型进行模型构建,得到初步分类结果,将所述初步分类结果与所述分类标签比对,生成损失函数,基于损失函数优化机器学习模型,得到训练好的心源性休克预后预测预警模型。
进一步,所述遗传特征的筛选方法包括:差异表达分析、Lasso特征筛选、重要基因的相关性分析。
进一步,所述遗传特征包括以下基因中的一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132。
进一步,所述机器学习模型采用下列分类算法中的一种或几种:KNN、决策树、随机森林、SVM、逻辑回归、GBDT、XGBoost、Ensemble-Boosting、Ensemble-Bagging。
进一步,所述随机森林为负反馈随机森林,所述负反馈随机森林是在随机森林的基础上,引入了负反馈机制,在每一轮迭代中,对训练样本进行重新赋权,以提高被错误分类的样本在下一轮迭代中被正确分类的概率。
进一步,所述负反馈随机森林的训练过程包括:
步骤1:初始化样本权重;
步骤2:对于每一轮迭代,依据当前样本权重,训练一棵决策树;
步骤3:计算所述决策树在训练集上的分类错误率;
步骤4:基于所述分类错误率计算负反馈学习率;
步骤5:基于所述负反馈学习率和分类错误率计算决策树的权重;
步骤6:更新样本权重,输出最终模型。
进一步,所述步骤3分类错误率的计算公式为:
其中,/>是求和函数,为待分类样本,/>为决策树/>对样本/>分类标签,/>为样本/>的真实标签。/>为指示函数,即当/>时,/>;否则,/>
进一步,所述步骤5计算决策树权重的公式为:
其中,函数的底数为自然底数/>,/>为第/>棵决策树的权重,/>是负反馈学习率。
所述心源性休克预后预测预警系统还包括:
第二获取单元,用于获取患者心源性休克分期诊断结果,所述分期诊断结果为C期、D期或E期;
决策单元,用于给予所述分期诊断结果选择治疗方案:当分期诊断结果为C期时,给予一种升压强心药物治疗或机械支持治疗;当分期诊断结果为D期时,给予一种升压强心药物治疗和机械支持治疗;当分期诊断结果为E期时,给予两种以上升压强心药物治疗和机械支持治疗。
进一步,所述机械支持治疗包括下列中的一种或几种:IABP、ECMO、Tandem Heart、Impella、LVAD、RVAD。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的心源性休克预后预测预警设备的心源性休克预后预测预警方法。
本发明的优点:
1.本发明公开了一种心源性休克预后预测预警系统,该系统基于患者的基因信息,预测患者接受ECMO治疗后的效果,为患者能否接受ECMO治疗提供分子诊断证据,所述基因信息为患者8种基因任意一种或几种的表达水平,所述8种基因包括:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132。
2.本发明公开了一种心源性休克预后预测预警系统,该系统预测患者使用ECMO的治疗效果,如果治疗效果不好,该设备会建议停止治疗。
3.本发明公开了一种心源性休克预后预测预警系统,该系统获取患者心源性休克分期诊断结果,基于不同的分期诊断结果选择治疗方案,通过临床统计数据优化了D期、E期的治疗方案。
4.本发明创新性的优化分类模型算法,采用引入负反馈机制的随机森林算法,对在上一轮迭代中被错误分类的样本进行重新赋权,使得这些样本在下一轮迭代中被正确分类的概率得到提高,进而提高分类准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是一种本发明实施例提供的心源性休克预后预测预警系统示意图;
图2是一种本发明实施例提供的心源性休克预后预测预警设备示意图;
图3是一种本发明实施例提供的心源性休克预后预测预警方法的流程示意图;
图4是一种本发明实施例提供的基于Lasso回归的变量筛选示意图;
图5是一种本发明实施例提供的反映重要基因之间相关性的示意图;
图6是一种本发明实施例提供的反映重要基因之间相关性的热图;
图7是一种本发明实施例提供的21个基因的重要性排序图;
图8是一种本发明实施例提供的AUC随mRNA个数增加曲线图;
图9是一种本发明实施例提供的准确率随mRNA个数增加曲线图;
图10是一种本发明实施例提供的4种基因表达量的箱线图,其中,a是AVPI1基因、b是C4orf19基因、c是C20orf135基因、d是DMBX1;
图11是一种本发明实施例提供的4种基因表达量的箱线图,其中,a是GPX3基因、b是MEA1基因、c是SYT7基因、d是ZNF132基因;
图12是一种本发明实施例提供的4种基因的ROC曲线图,其中,a是AVPI1基因、b是C4orf19基因、c是C20orf135基因、d是DMBX1;
图13是一种本发明实施例提供的4种基因的ROC曲线图,其中,a是GPX3基因、b是MEA1基因、c是SYT7基因、d是ZNF132基因。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种心源性休克预后预测预警系统,包括:
获取单元101,获取患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
在一个实施例中,所述遗传信息是有多个探针对应的基因的表达矩阵。
特征提取单元102,对所述遗传信息进行特征提取,得到遗传特征,所述遗传特征包括以下基因中的一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132;
在一个实施例中,所述遗传特征的具体筛选方法包括:差异表达分析、Lasso特征筛选、重要基因的相关性分析。经过上述筛选方法选择了21个基因,应用机器学习算法对所述21个基因进行筛选,得到最优的生物标志物。
诊断单元103,基于所述遗传特征判断患者是否给予ECMO治疗。
在一个实施例中,根据患者的临床分期和基因信息,建议患者是否采取机械支持辅助治疗,如果处于D期或E期,建议使用机械支持辅助治疗。如果患者处于D期或E期,并且以下基因异常表达存在一种或几种,建议不使用ECMO治疗:AVPI1、C4orf19、DMBX1、GPX3、SYT7基因表达上调,C20orf135、MEA1、ZNF132基因表达下调。
第二获取单元104,用于获取患者心源性休克分期诊断结果,所述分期诊断结果为C期、D期或E期;
决策单元105,基于所述分期诊断结果选择治疗方案:当分期诊断结果为C期时,给予一种升压强心药物治疗或机械支持治疗;当分期诊断结果为D期时,给予一种升压强心药物治疗和机械支持治疗;当分期诊断结果为E期时,给予两种以上升压强心药物治疗和机械支持治疗。
在一个实施例中,所述升压药物包括下列中的一种或几种:多巴胺、去甲肾上腺素、肾上腺素、去氧肾上腺素、加压素;所述强心药物包括下列中的一种或几种:多巴酚丁胺、异丙肾上腺素、米力农、依诺昔酮、左西孟旦;所述机械支持治疗包括下列中的一种或几种:IABP、ECMO、Tandem Heart、Impella、LVAD和RVAD。
在发明人团队的临床研究中,基于951名C期患者、455名D期患者、474名E期患者的临床治疗数据,对D期、E期的临床治疗措施进行优化。C期患者中,725名仅接受一种药物,226名仅接受IABP,发现接受IABP治疗患者的相对危险是使用1种药物治疗患者的1.4倍,无统计学差异(P = 0.283);D期患者中,229名接受了2种药物,226名接受了IABP加1种药物,发现接受IABP结合1种药物治疗患者的相对危险是接受2种药物治疗患者的0.48倍,具有统计学意义(P = 0.005);E期患者中,200名接受了3种及以上药物,272名接受了IABP加2种以上药物,发现接受IABP加2种以上药物治疗患者的相对危险是接受3种及以上药物治疗患者的0.53倍,具有统计学意义(P = 0.022)。综上所述,当患者处于C期时,优先考虑药物治疗;当患者处于D期时,选择一种升压强心药物治疗和机械支持治疗;当患者处于E期时,选择两种以上升压强心药物治疗和机械支持治疗。
图2是本发明实施例提供的一种心源性休克预后预测预警设备,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行以下心源性休克预后预测预警方法,见图3,包括:
301:获取患者外周血单核细胞样本的遗传信息;
在一个实施例中,所述遗传信息是有多个探针对应的基因的表达矩阵。
302:对所述遗传信息进行特征提取,得到遗传特征;
在一个实施例中,所述遗传特征的具体筛选方法包括:差异表达分析、Lasso特征筛选、重要基因的相关性分析。经过上述筛选方法选择了21个基因,应用机器学习算法对所述21个基因进行筛选,得到最优的生物标志物。
在一个实施例中,决定心源性休克机械支持临床效果的基因包括以下一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132。当分期诊断结果为D或E期时,获取患者外周血单核细胞样本的遗传信息,提取所述细胞样本的上述8个基因的表达水平。
AVPI1基因编码一种蛋白质,参与细胞凋亡、细胞周期、细胞增殖、信号转导等多种生物学过程,可能与多种肿瘤发生相关;C4orf19基因的功能尚未完全明确,其可能与心血管疾病、新陈代谢紊乱、神经系统疾病等疾病发生相关;C20orf135基因编码一种参与细胞周期、细胞凋亡、细胞分化等多种生物学过程的蛋白质;DMBX1基因编码一种参与转录调节、信号传导、细胞增殖等多种生物学过程的蛋白质;GPX3基因编码一种谷胱甘肽过氧化物酶,参与细胞氧化应激反应,保护细胞免受氧化损伤,其异常表达可能与心血管疾病、炎症、肝病等疾病发生相关;MEA1基因编码一种参与胚胎发育、细胞凋亡、细胞分化、信号转导等多种生物学过程蛋白质;SYT7基因编码一种参与神经递质的释放过程,以及神经元的突触可塑性的蛋白质;ZNF132基因编码一种转录因子,参与基因转录调节,影响细胞增殖、细胞分化、细胞凋亡等多种生物学过程。
在一个实施例中,患者外周血单核细胞样本的遗传信息来源于公共数据库,所述数据库包括以下一种或几种:NCBI(National Center for Biotechnology Information)、EMBL(European Molecular Biology Laboratory)、DDBJ(DNA Data Bank of Japan)、CNGB(China National GeneBank)、BIGD(Beijing Institute of Genomics)。
在一个实施例中,患者外周血单核细胞样本的遗传信息采用高通量测序的方法获得,所述高通量测序方法用到的测序平台包括以下一种或几种:PacBio三代测序平台、Illumina二代测序平台、10x Genomics Chromium单细胞平台、华大智造的DNBelab C4单细胞平台、Stratos genomics的纳米孔三代测序平台。
在一个实施例中,患者外周血单核细胞样本的遗传信息包括所述细胞样本的DNA或蛋白质的序列和/或DNA或蛋白质的结构和/或基因表达量。
在一个具体实施例中,从NCBI下载GSE93101数据集,该数据集包含ECMO 下心源性休克患者的外周血单核细胞样本,共分为两组(失败:成功=16:17),成功定义为 ECMO 安装后存活超过7天,失败则在7天内死亡或出现多器官衰竭。使用平台文件GPL14951对探针进行注释,有多个探针对应的基因取其平均值作为基因表达量,经此处理之后,得到33个样本20814个基因的表达矩阵;使用R语言的limma对得到的表达矩阵进行差异表达分析,差异表达mRNA筛选标准为p值 < 0.05,共获得401个差异表达mRNA;利用Lasso回归分析对401个差异表达基因进行高维变量筛选和特征选择,筛选出21个重要特征,结果见图4;利用R语言的corrgram包对21个重要基因进行相关性分析,结果见图5和图6,颜色越深,说明基因两两之间的相关性越强;利用R语言的randomForest包对上面得到的21个重要基因进行机器学习,以筛选最优biomarkers,通过随机森林算法构建分类模型,按Mean Decrease Accuary值从大到小对21个mRNA进行重要性排序,结果见图7;按随机森林排序结果的顺序,从上而下依次增加1个mRNA,分别利用随机森林(R语言randomForest包)算法进行分类,并用十折交叉验证(10-fold cross-validation)过程求准确率和AUC。参考图8可以看出,当mRNA的数量达到8的时候,AUC值达到最大值,参考图9可以看出,当mRNA的数量达到8时,准确率可以达到98%,所以选取前8个mRNA作为最优的biomarkers;对上面筛选的8个mRNA应用支持向量机(R语言e1071包)来构建预后模型,并用随机森林算法构建分类模型与之比较,发现2个模型AUC都很高。SVM分类器ROC曲线的AUC值为1,随机森林算法分类器ROC曲线的AUC值为0.996;模型内8个基因的表达量在成功组和失败组间的差异参考图10和图11;模型内8个基因每个基因的ROC曲线参考图12和图13,其中,AVPI1基因的AUC(Aera Under Curve)为0.82,C4orf19的AUC为0.776,C20orf135的AUC为0.805,DMBX1的AUC为0.794,GPX3的AUC为0.926,MEA1的AUC为0.805,SYT7的AUC为0.761,ZNF132的AUC为0.842。
303:将所述遗传特征输入心源性休克预后预测预警模型判断患者是否给予ECMO治疗;
在一个实施例中,所述心源性休克预后预测预警模型的构建方法包括:
获取训练集患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
对所述遗传信息进行特征提取,得到遗传特征;
遗传特征的筛选方法包括:差异表达分析、Lasso特征筛选、重要基因的相关性分析。其中,差异表达分析是一种用于比较两个或多个不同条件下基因表达的方法,旨在寻找在不同条件下表达水平存在显著差异的基因。差异表达分析通常通过基因表达数据进行,可以利用RNA-seq、microarray等高通量测序技术获取基因表达数据。差异表达分析可以帮助研究人员了解基因在不同条件下的表达模式,发现与疾病相关的基因,以及揭示复杂疾病的发病机制等。Lasso特征筛选是一种基于L1正则化的特征选择方法,它可以对给定的特征进行筛选,挑选出与目标变量最相关的特征。Lasso特征筛选的核心思想是通过减小某些特征的系数,达到稀疏化的目的,即将一些不重要的特征系数变为0。这样可以减少特征数量,提高模型的泛化性能,同时也可以更好地理解模型的特征贡献。重要基因的相关性分析是针对差异表达分析或特征筛选后的重要基因进行的一种分析方法,旨在探索这些基因之间的相互关系和调控机制。相关性分析可以从多个角度进行,如基于共表达网络的方法、基于共现性分析的方法等。相关性分析可以帮助研究人员深入了解重要基因之间的相互作用,从而更好地理解复杂疾病的发病机制和调控网络。
遗传特征包括以下基因中的一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132。
304:所述心源性休克预后预测预警模型的构建方法包括:
获取训练集患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
对所述遗传信息进行特征提取,得到遗传特征;
将所述遗传特征输入机器学习模型进行模型构建,得到初步分类结果,将所述初步分类结果与所述分类标签比对,生成损失函数,基于损失函数优化机器学习模型,得到训练好的心源性休克预后预测预警模型。
机器学习模型采用下列分类算法中的一种或几种:KNN、决策树、随机森林、SVM、逻辑回归、GBDT、XGBoost、Ensemble-Boosting、Ensemble-Bagging。所述随机森林为负反馈随机森林,所述负反馈随机森林是在随机森林的基础上,引入了负反馈机制,在每一轮迭代中,对训练样本进行重新赋权,以提高被错误分类的样本在下一轮迭代中被正确分类的概率。
在一个实施例中,对于每个样本,负反馈随机森林的训练过程首先需初始化样本权重,可以表示为:
其中,为样本数量,/>表示样本/>在第Dm轮时的样本权重。
进一步地,对于每一轮迭代,依据当前样本权重,训练一棵决策树/>。其中,/>为随机森林的总体迭代次数。
进一步地,计算该决策树在训练集上的分类错误率/>,计算方法可以表示为:
其中,/>是求和函数,为待分类样本,/>为决策树/>对样本/>分类标签,/>为样本/>的真实标签。/>为指示函数,即当/>时,/>;否则,/>
进一步地,计算决策树的权重,可以表示为:
其中,函数的底数为自然底数/>,/>为第/>棵决策树的权重,/>是负反馈学习率。所述负反馈学习率由以下公式计算得出:
负反馈学习率能够根据模型的表现自动调整权重更新的程度,进而使得负反馈随机森林更好地适应训练过程中的各种情况,同时也使得模型的表现更加稳定。
具体的,假设在某次迭代中,分类错误率比较大,则/>就会接近1,从而使得减小,权重更新的程度则会降低。相反,如果分类错误率/>比较小,则/>就会接近0,从而使得/>增大,权重更新的程度就会增加。
进一步地,更新样本权重,可以表示为:
其中,为更新后的样本/>在第/>轮时的样本权重,/>表示以自然常数e为底的指数函数,/>表示样本/>在第Dm+1轮时的样本权重。
进一步地,输出最终模型。每一棵树的预测结果按其权重进行加权,最终取加权结果中得分最高的类别作为预测结果,此过程可以表示为:
其中,是数学表达中的一种对函数求参集的函数,即/>表示对于/>个样本进行参数求解,并取使后面表达式取得最大值时的/>。/>表示样本/>对应的类别,/>为决策树/>对样本/>分类标签。
基于此,负反馈随机森林通过引入了负反馈机制,使得被模型错误分类的样本在后续迭代中获得更大的权重,从而提高其被正确分类的概率。同时,每一轮迭代后,都会对决策树进行权重赋值,使得模型能够更好地关注那些难以分类的样本。故,通过这种方式,负反馈随机森林能够提高模型的泛化能力和分类准确率,特别是对于心源性休克分期分类这种复杂的多类别分类任务。
在一个实施例中,如果患者的以下基因异常表达存在一种或几种,不建议使用ECMO等机械支持治疗:1. AVPI1基因表达上调;2. C4orf19基因表达上调;3. C20orf135基因表达下调;4. DMBX1基因表达上调;5. GPX3基因表达上调;6. MEA1基因表达下调;7.SYT7基因表达上调;8. ZNF132基因表达下调。
机械支持包括主动脉内球囊反搏(Intra-aortic balloon pump, IABP)、体外膜氧合(Extracorporeal Membrane Oxygenation, ECMO)、便携式体外循环系统(TandemHeart)、心脏辅助装置(Impella)、左心室辅助装置(Left Ventricular Assist Device,LVAD)和右心室辅助装置(Right Ventricular Assist Device, RVAD)。其中,IABP通过在主动脉内插入一根导管,将一个气囊球囊插入至主动脉内,然后根据心脏节律的规律,调节球囊的充气和放气,从而改善冠状动脉的血流动力学,减少心脏后负荷,提高心脏输出量,同时降低心肌氧耗;ECMO是一种通过外科手术将导管插入颈部或股动脉,将血液引流至体外,经过人工氧合后再回输到体内,从而维持心肺功能,提高组织灌注的装置。它可以同时支持心脏和肺功能,对于严重的心肺功能衰竭和心脏手术后的患者有很好的治疗效果;Tandem Heart是通过将心房内血流进行分流的一种微量泵,其溶血和血栓发生率均较低,可以用于伴有左心室血栓的患者;Impella通过外科手术植入患者的胸部,一端植入心脏,另一端连接到一个推动器上,推动器由电机发动,电机按照设定的模式推动心脏;LVAD是一种能够辅助心脏泵血的装置,通过将导管插入至左心室和主动脉,将血液引流至装置内,再通过电动泵将血液回输至主动脉,从而减轻左心室的负荷,提高心脏输出量,达到辅助心脏泵血的效果,它主要用于重度心力衰竭患者的治疗,包括心脏移植前的暂时辅助等;RVAD是一种能够辅助心脏泵血的装置,通过将导管插入至右心室和肺动脉,将血液引流至装置内,再通过电动泵将血液回输至肺动脉,从而减轻右心室的负荷,提高心脏输出量,达到辅助心脏泵血的效果,它主要用于重度肺动脉高压、肺栓塞等导致右心室衰竭的患者治疗。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述心源性休克预后预测预警方法。
本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以适度改善本方法的性能。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种心源性休克预后预测预警设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行以下心源性休克预后预测预警方法,包括:
获取患者外周血单核细胞样本的遗传信息;对所述遗传信息进行特征提取,得到遗传特征,所述遗传特征包括以下基因中的一种或几种:AVPI1、C4orf19、C20orf135、DMBX1、GPX3、MEA1、SYT7、ZNF132;
将所述遗传特征输入心源性休克预后预测预警模型判断患者是否给予ECMO治疗;
所述心源性休克预后预测预警模型的构建过程包括:
获取训练集患者外周血单核细胞样本的遗传信息和是否给予ECMO治疗的分类标签;
对所述遗传信息进行特征筛选,得到遗传特征;
将所述遗传特征输入机器学习模型进行模型构建,得到初步分类结果,将所述初步分类结果与所述分类标签比对,生成损失函数,基于损失函数优化机器学习模型,得到训练好的心源性休克预后预测预警模型;
所述机器学习模型为负反馈随机森林,所述负反馈随机森林的训练过程包括:
步骤1:初始化样本权重;
步骤2:对于每一轮迭代,依据当前样本权重,训练一棵决策树;
步骤3:计算所述决策树在训练集上的分类错误率;
步骤4:基于所述分类错误率计算负反馈学习率;
步骤5:基于所述负反馈学习率和分类错误率计算决策树的权重;
步骤6:更新样本权重,输出最终模型。
2.根据权利要求1所述的心源性休克预后预测预警设备,其特征在于,所述特征筛选方法包括:差异表达分析、Lasso特征筛选和重要基因的相关性分析。
3.根据权利要求1所述的心源性休克预后预测预警设备,其特征在于,所述步骤3分类错误率的计算公式为:
其中,是求和函数,/>为待分类样本,/>为决策树/>对样本/>分类标签,为样本/>的真实标签,/>为指示函数,/>表示样本/>在第Dm轮时的样本权重,即当时,/>;否则,/>
4.根据权利要求1所述的心源性休克预后预测预警设备,其特征在于,所述步骤5计算决策树权重的公式为:
其中,函数的底数为自然底数/>,/>为第/>棵决策树的权重,/>为分类错误率,是负反馈学习率。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述的心源性休克预后预测预警设备的心源性休克预后预测预警方法。
CN202310782125.3A 2023-06-29 2023-06-29 一种心源性休克预后预测预警系统、设备及可存储介质 Active CN116525105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310782125.3A CN116525105B (zh) 2023-06-29 2023-06-29 一种心源性休克预后预测预警系统、设备及可存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310782125.3A CN116525105B (zh) 2023-06-29 2023-06-29 一种心源性休克预后预测预警系统、设备及可存储介质

Publications (2)

Publication Number Publication Date
CN116525105A CN116525105A (zh) 2023-08-01
CN116525105B true CN116525105B (zh) 2023-10-03

Family

ID=87405087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310782125.3A Active CN116525105B (zh) 2023-06-29 2023-06-29 一种心源性休克预后预测预警系统、设备及可存储介质

Country Status (1)

Country Link
CN (1) CN116525105B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117393153B (zh) * 2023-12-11 2024-03-08 中国人民解放军总医院 基于医疗物联网时序数据和深度学习算法的休克实时风险预警监测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108474040A (zh) * 2015-10-09 2018-08-31 夸登特健康公司 使用无细胞dna的基于群体的治疗推荐
CN110427311A (zh) * 2019-06-26 2019-11-08 华中科技大学 基于时序特征处理与模型优化的磁盘故障预测方法和系统
CN114026428A (zh) * 2019-02-20 2022-02-08 日耳曼人特里亚斯艾普霍尔健康科学研究院基金会 用于预测正在经受休克的患者的死亡风险的体外方法
CN115803627A (zh) * 2020-04-06 2023-03-14 B.R.A.H.M.S有限公司 肾上腺髓质素原用于预测严重急性呼吸系统综合征(sars)中的疾病进展

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3608673A1 (en) * 2018-08-08 2020-02-12 B.R.A.H.M.S GmbH Pro-adm for prognosing the risk of a medical condition requiring hospitalization in patients with symptoms of infectious disease

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108474040A (zh) * 2015-10-09 2018-08-31 夸登特健康公司 使用无细胞dna的基于群体的治疗推荐
CN114026428A (zh) * 2019-02-20 2022-02-08 日耳曼人特里亚斯艾普霍尔健康科学研究院基金会 用于预测正在经受休克的患者的死亡风险的体外方法
CN110427311A (zh) * 2019-06-26 2019-11-08 华中科技大学 基于时序特征处理与模型优化的磁盘故障预测方法和系统
CN115803627A (zh) * 2020-04-06 2023-03-14 B.R.A.H.M.S有限公司 肾上腺髓质素原用于预测严重急性呼吸系统综合征(sars)中的疾病进展

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Identification of key programmed cell death-related genes and immune infiltration in extracorporeal membrane oxygenation treatment for acute myocardial infarction based on bioinformatics analysis;Jingqi Yang;Frontiers in Cardiovascular Medicine;第9卷;原文第1-11页 *

Also Published As

Publication number Publication date
CN116525105A (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN116525105B (zh) 一种心源性休克预后预测预警系统、设备及可存储介质
CN110638438B (zh) 用于对血流储备分数的基于机器学习的评估的方法和系统
Lemor et al. Impella versus extracorporeal membrane oxygenation for acute myocardial infarction cardiogenic shock
Hsich et al. Variables of importance in the Scientific Registry of Transplant Recipients database predictive of heart transplant waitlist mortality
WO2002099568A2 (en) Information processing method for disease stratification and assessment of disease progressing
Huang et al. Modeling the relationship between LVAD support time and gene expression changes in the human heart by penalized partial least squares
Sarajlic et al. Artificial intelligence models reveal sex-specific gene expression in aortic valve calcification
Taghavi et al. Continuous flow left ventricular assist device technology has influenced wait times and affected donor allocation in cardiac transplantation
CN112562855B (zh) 一种肝细胞癌术后早期复发风险预测方法、介质及终端设备
US11955214B2 (en) Tree-based data exploration and data-driven protocol
Medved et al. Predicting the outcome for patients in a heart transplantation queue using deep learning
Rali et al. Early blood pressure variables associated with improved outcomes in VA-ECLS: The ELSO registry analysis
CN105718726A (zh) 基于粗糙集的医疗辅助检查系统知识获取和推理方法
Shin et al. Early prediction of mortality in critical care setting in sepsis patients using structured features and unstructured clinical notes
CN116434960B (zh) 一种心源性休克临床决策支持系统、设备及可存储介质
CN116525116B (zh) 一种心源性休克实时风险预警监测系统、设备及可存储介质
Graefe et al. Influence of left ventricular assist device pressure-flow characteristic on exercise physiology: Assessment with a verified numerical model
Meuwese et al. Twelve years of circulatory extracorporeal life support at the University Medical Centre Utrecht
CN111897857A (zh) 主动脉夹层心脏手术后icu时长预测方法
CN113571179B (zh) 基于知识图谱的指标提取方法和装置
Rizwan et al. Heart attack prediction using machine learning approach
CN116525104B (zh) 一种心源性休克快速分期分诊系统、设备及可存储介质
CN116631572A (zh) 基于人工智能的急性心肌梗死临床决策支持系统及设备
Kado et al. Use of a virtual mock loop model to evaluate a new left ventricular assist device for transapical insertion
CN113284611B (zh) 基于个体通路活性的癌症诊断和预后预测系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant