CN116130106A

CN116130106A - 一种用于脑胶质瘤预后的预测模型的构建方法

Info

Publication number: CN116130106A
Application number: CN202310181289.0A
Authority: CN
Inventors: 古亮; 严振宇; 顾竞; 段远清; 葛宜枝; 何侠
Original assignee: Nanjing Medical University
Current assignee: Nanjing Medical University
Priority date: 2023-03-01
Filing date: 2023-03-01
Publication date: 2023-05-16

Abstract

本申请公开了一种用于脑胶质瘤预后的预测模型的构建方法，步骤包括：获取基因表达数据库的数据；根据数据筛选出与细胞焦亡相关的差异表达基因；基于差异表达基因筛选出关键基因；根据关键基因构建预后风险评估模型；将预后风险评估模型输入验证数据库中，验证预测效果。本申请通过一组细胞焦亡相关基因用来克服有争议的诊断标准、观察者间的变异性和不具代表性的样本，避免了相同级别的胶质瘤患者的不准确的生存评估。

Description

一种用于脑胶质瘤预后的预测模型的构建方法

技术领域

本申请涉及生物检测领域，具体涉及一种用于脑胶质瘤预后的预测模型的构建方法。

背景技术

胶质瘤是最恶性的肿瘤类型，通常被认为是中枢神经系统癌症中的一种致命疾病。由于胶质瘤复发频繁、高度弥漫侵袭、破坏正常脑组织以及对传统和靶向治疗的抵抗，胶质瘤的治疗仍然是癌症治疗中最大的挑战之一。组织学诊断是基于肿瘤细胞恶性程度的治疗和预后的临床“金标准”。然而，有争议的诊断标准、观察者间的变异性和不具代表性的样本导致了相同级别的胶质瘤患者的不准确的生存评估。分子生物学标志物，如MGMT启动子甲基化、IDH突变、染色体1p/19q共缺失等，对临床诊断和预后预测有重要价值。

发明内容

为准确评估脑胶质瘤患者的预后情况，本申请提供了一种用于脑胶质瘤预后的预测模型的构建方法，包括以下步骤：

获取基因表达数据库的数据；

根据所述数据得到与细胞焦亡相关的差异表达基因；

基于所述差异表达基因得到出关键基因；

根据所述关键基因构建预后风险评估模型；

将所述预后风险评估模型输入验证数据库中进行验证，验证后的所述预后风险评估模型用于脑胶质瘤预后的预测。

可选的，所述数据包括：胶质瘤患者和健康人的临床特征和基因表达谱信息。

可选的，得到所述差异表达基因的方法包括：对所述数据进行归一化处理后，用“Limma”包Wilcoxon检验，在TCGA和GTEx中筛选出与细胞焦亡相关的所述差异表达基因。

可选的，获取所述关键基因的方法包括：通过lasso对所述差异表达基因进行筛选，得到所述关键基因。

可选的，构建所述预后风险评估模型的方法包括：对所述关键基因进行COX回归分析。

可选的，构建的所述预后风险评估模型表达为：

risk score＝CASP3*0.201+CASP4*0.500+ELANE*0.148+IL18*0.024+CASP6*0.3S0-CASP9*0.196-GSDMC*0.036+IL6*0.001+PLCG1*0.105+PRKACA*0.158-TNF*0.033。

可选的，所述验证数据库包括：TCGA数据库和CGGA数据库。

可选的，在所述TCGA数据库中验证的方法包括：通过R包“Survival”和“survminer”对所述TCGA数据库中脑胶质瘤患者进行K-M生存分析，并利用Survival ROC包进行生存率的时间依赖性ROC曲线分析评价所述预后风险评估模型模型的特异性以验证效果。

与现有技术相比，本申请的有益效果为：

通过一组细胞焦亡相关基因用来克服有争议的诊断标准、观察者间的变异性和不具代表性的样本，避免了相同级别的胶质瘤患者的不准确的生存评估。

附图说明

为了更清楚地说明本申请的技术方案，下面对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请流程示意图；

图2为本申请37个与细胞焦亡相关的差异表达基因示意图；

图3为本申请lasso回归分析筛选出的11个基因示意图；

图4为在TCGA数据库验证过程中的K-M生存分析结果示意图；

图5为在TCGA数据库验证过程中的ROC曲线分析结果示意图；

图6为在CGGA数据库验证过程中的K-M生存分析结果示意图；

图7为在TCGA数据库验证过程中的ROC曲线分析结果示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

如图1所示为本申请的流程示意图，首先从肿瘤基因组图谱(TCGA)，中国胶质瘤基因组图谱(CGGA)和基因类型-组织表达(GTEX)中下载胶质瘤患者和健康人的临床特征和基因表达谱信息。对基因表达数据库的数据进行归一化处理后。用“Limma”包WilCoxon检验，在本实施例中以p＜0.05，|fold change|≥1.5为阈值，如图2所示，在TCGA和GTEx中筛选出37个与细胞焦亡相关的差异表达基因。并进一步通过lasso从这37个与细胞焦亡相关的差异表达基因中筛选出11个基因。如图3所示，利用COX回归分析，构建11个基因的预后风险评估模型。该预后风险评估模型表达为：

risk score＝CASP3*0.201+CASP4*0.500+ELANE*0.148+IL18*0.024+CASP6*0.380-CASP9*0.196-GSDMC*0.036+IL6*0.001+PLCG1*0.105+PRKACA*0.158-TNF*0.033。

之后将预后风险评估模型输入至TCGA数据库中验证其性能，通过R包“survival”和“survminer”对TCGA数据库中脑胶质瘤患者进行Kaplan-Meier(K-M)生存分析以验证预后模型的效果。结果如图4所示，高风险患者的总生存率低于低风险组。利用survival ROC包进行1年、3年和5年生存率的时间依赖性ROC曲线分析评价模型的特异性，结果如图5所示，其曲线下面积(AUC)均＞0.85，表明该模型具有很好的预测效果。

最后将预后风险评估模型输入至CGGA数据库中验证模型性能，其过程同上述步骤，只是RNA表达谱及患者临床数据来源于CGGA数据库。K-M分析结果如图6所示，高风险患者的总生存率低于低风险组。ROC分析结果如图7所示，其曲线下面积(AUC)均＞0.71，表明模型在CGGA数据库中仍具有很好的预测效果。

以上所述的实施例仅是对本申请优选方式进行的描述，并非对本申请的范围进行限定，在不脱离本申请设计精神的前提下，本领域普通技术人员对本申请的技术方案做出的各种变形和改进，均应落入本申请权利要求书确定的保护范围内。

Claims

1.一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，步骤包括：

获取基因表达数据库的数据；

根据所述数据得到与细胞焦亡相关的差异表达基因；

基于所述差异表达基因得到出关键基因；

根据所述关键基因构建预后风险评估模型；

2.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，所述数据包括：胶质瘤患者和健康人的临床特征和基因表达谱信息。

3.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，得到所述差异表达基因的方法包括：对所述数据进行归一化处理后，用“Limma”包Wilcoxon检验，在TCGA和GTEx中筛选出与细胞焦亡相关的所述差异表达基因。

4.根据权利要求3所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，获取所述关键基因的方法包括：通过lasso对所述差异表达基因进行筛选，得到所述关键基因。

5.根据权利要求4所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，构建所述预后风险评估模型的方法包括：对所述关键基因进行COX回归分析。

6.根据权利要求5所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，构建的所述预后风险评估模型表达为：

7.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，所述验证数据库包括：TCGA数据库和CGGA数据库。

8.根据权利要求7所述的一种用于脑胶质瘤预后的预测模型的构建方法，其特征在于，在所述TCGA数据库中验证的方法包括：通过R包“survival”和“survminer”对所述TCGA数据库中脑胶质瘤患者进行K—M生存分析，并利用survival ROC包进行生存率的时间依赖性ROC曲线分析评价所述预后风险评估模型模型的特异性以验证效果。