CN116130106A - 一种用于脑胶质瘤预后的预测模型的构建方法 - Google Patents
一种用于脑胶质瘤预后的预测模型的构建方法 Download PDFInfo
- Publication number
- CN116130106A CN116130106A CN202310181289.0A CN202310181289A CN116130106A CN 116130106 A CN116130106 A CN 116130106A CN 202310181289 A CN202310181289 A CN 202310181289A CN 116130106 A CN116130106 A CN 116130106A
- Authority
- CN
- China
- Prior art keywords
- prognosis
- constructing
- glioma
- genes
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Bioethics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了一种用于脑胶质瘤预后的预测模型的构建方法,步骤包括:获取基因表达数据库的数据;根据数据筛选出与细胞焦亡相关的差异表达基因;基于差异表达基因筛选出关键基因;根据关键基因构建预后风险评估模型;将预后风险评估模型输入验证数据库中,验证预测效果。本申请通过一组细胞焦亡相关基因用来克服有争议的诊断标准、观察者间的变异性和不具代表性的样本,避免了相同级别的胶质瘤患者的不准确的生存评估。
Description
技术领域
本申请涉及生物检测领域,具体涉及一种用于脑胶质瘤预后的预测模型的构建方法。
背景技术
胶质瘤是最恶性的肿瘤类型,通常被认为是中枢神经系统癌症中的一种致命疾病。由于胶质瘤复发频繁、高度弥漫侵袭、破坏正常脑组织以及对传统和靶向治疗的抵抗,胶质瘤的治疗仍然是癌症治疗中最大的挑战之一。组织学诊断是基于肿瘤细胞恶性程度的治疗和预后的临床“金标准”。然而,有争议的诊断标准、观察者间的变异性和不具代表性的样本导致了相同级别的胶质瘤患者的不准确的生存评估。分子生物学标志物,如MGMT启动子甲基化、IDH突变、染色体1p/19q共缺失等,对临床诊断和预后预测有重要价值。
发明内容
为准确评估脑胶质瘤患者的预后情况,本申请提供了一种用于脑胶质瘤预后的预测模型的构建方法,包括以下步骤:
获取基因表达数据库的数据;
根据所述数据得到与细胞焦亡相关的差异表达基因;
基于所述差异表达基因得到出关键基因;
根据所述关键基因构建预后风险评估模型;
将所述预后风险评估模型输入验证数据库中进行验证,验证后的所述预后风险评估模型用于脑胶质瘤预后的预测。
可选的,所述数据包括:胶质瘤患者和健康人的临床特征和基因表达谱信息。
可选的,得到所述差异表达基因的方法包括:对所述数据进行归一化处理后,用“Limma”包Wilcoxon检验,在TCGA和GTEx中筛选出与细胞焦亡相关的所述差异表达基因。
可选的,获取所述关键基因的方法包括:通过lasso对所述差异表达基因进行筛选,得到所述关键基因。
可选的,构建所述预后风险评估模型的方法包括:对所述关键基因进行COX回归分析。
可选的,构建的所述预后风险评估模型表达为:
risk score=CASP3*0.201+CASP4*0.500+ELANE*0.148+IL18*0.024+CASP6*0.3S0-CASP9*0.196-GSDMC*0.036+IL6*0.001+PLCG1*0.105+PRKACA*0.158-TNF*0.033。
可选的,所述验证数据库包括:TCGA数据库和CGGA数据库。
可选的,在所述TCGA数据库中验证的方法包括:通过R包“Survival”和“survminer”对所述TCGA数据库中脑胶质瘤患者进行K-M生存分析,并利用Survival ROC包进行生存率的时间依赖性ROC曲线分析评价所述预后风险评估模型模型的特异性以验证效果。
与现有技术相比,本申请的有益效果为:
通过一组细胞焦亡相关基因用来克服有争议的诊断标准、观察者间的变异性和不具代表性的样本,避免了相同级别的胶质瘤患者的不准确的生存评估。
附图说明
为了更清楚地说明本申请的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请流程示意图;
图2为本申请37个与细胞焦亡相关的差异表达基因示意图;
图3为本申请lasso回归分析筛选出的11个基因示意图;
图4为在TCGA数据库验证过程中的K-M生存分析结果示意图;
图5为在TCGA数据库验证过程中的ROC曲线分析结果示意图;
图6为在CGGA数据库验证过程中的K-M生存分析结果示意图;
图7为在TCGA数据库验证过程中的ROC曲线分析结果示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
如图1所示为本申请的流程示意图,首先从肿瘤基因组图谱(TCGA),中国胶质瘤基因组图谱(CGGA)和基因类型-组织表达(GTEX)中下载胶质瘤患者和健康人的临床特征和基因表达谱信息。对基因表达数据库的数据进行归一化处理后。用“Limma”包WilCoxon检验,在本实施例中以p<0.05,|fold change|≥1.5为阈值,如图2所示,在TCGA和GTEx中筛选出37个与细胞焦亡相关的差异表达基因。并进一步通过lasso从这37个与细胞焦亡相关的差异表达基因中筛选出11个基因。如图3所示,利用COX回归分析,构建11个基因的预后风险评估模型。该预后风险评估模型表达为:
risk score=CASP3*0.201+CASP4*0.500+ELANE*0.148+IL18*0.024+CASP6*0.380-CASP9*0.196-GSDMC*0.036+IL6*0.001+PLCG1*0.105+PRKACA*0.158-TNF*0.033。
之后将预后风险评估模型输入至TCGA数据库中验证其性能,通过R包“survival”和“survminer”对TCGA数据库中脑胶质瘤患者进行Kaplan-Meier(K-M)生存分析以验证预后模型的效果。结果如图4所示,高风险患者的总生存率低于低风险组。利用survival ROC包进行1年、3年和5年生存率的时间依赖性ROC曲线分析评价模型的特异性,结果如图5所示,其曲线下面积(AUC)均>0.85,表明该模型具有很好的预测效果。
最后将预后风险评估模型输入至CGGA数据库中验证模型性能,其过程同上述步骤,只是RNA表达谱及患者临床数据来源于CGGA数据库。K-M分析结果如图6所示,高风险患者的总生存率低于低风险组。ROC分析结果如图7所示,其曲线下面积(AUC)均>0.71,表明模型在CGGA数据库中仍具有很好的预测效果。
以上所述的实施例仅是对本申请优选方式进行的描述,并非对本申请的范围进行限定,在不脱离本申请设计精神的前提下,本领域普通技术人员对本申请的技术方案做出的各种变形和改进,均应落入本申请权利要求书确定的保护范围内。
Claims (8)
1.一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,步骤包括:
获取基因表达数据库的数据;
根据所述数据得到与细胞焦亡相关的差异表达基因;
基于所述差异表达基因得到出关键基因;
根据所述关键基因构建预后风险评估模型;
将所述预后风险评估模型输入验证数据库中进行验证,验证后的所述预后风险评估模型用于脑胶质瘤预后的预测。
2.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,所述数据包括:胶质瘤患者和健康人的临床特征和基因表达谱信息。
3.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,得到所述差异表达基因的方法包括:对所述数据进行归一化处理后,用“Limma”包Wilcoxon检验,在TCGA和GTEx中筛选出与细胞焦亡相关的所述差异表达基因。
4.根据权利要求3所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,获取所述关键基因的方法包括:通过lasso对所述差异表达基因进行筛选,得到所述关键基因。
5.根据权利要求4所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,构建所述预后风险评估模型的方法包括:对所述关键基因进行COX回归分析。
6.根据权利要求5所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,构建的所述预后风险评估模型表达为:
risk score=CASP3*0.201+CASP4*0.500+ELANE*0.148+IL18*0.024+CASP6*0.380-CASP9*0.196-GSDMC*0.036+IL6*0.001+PLCG1*0.105+PRKACA*0.158-TNF*0.033。
7.根据权利要求1所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,所述验证数据库包括:TCGA数据库和CGGA数据库。
8.根据权利要求7所述的一种用于脑胶质瘤预后的预测模型的构建方法,其特征在于,在所述TCGA数据库中验证的方法包括:通过R包“survival”和“survminer”对所述TCGA数据库中脑胶质瘤患者进行K—M生存分析,并利用survival ROC包进行生存率的时间依赖性ROC曲线分析评价所述预后风险评估模型模型的特异性以验证效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310181289.0A CN116130106A (zh) | 2023-03-01 | 2023-03-01 | 一种用于脑胶质瘤预后的预测模型的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310181289.0A CN116130106A (zh) | 2023-03-01 | 2023-03-01 | 一种用于脑胶质瘤预后的预测模型的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116130106A true CN116130106A (zh) | 2023-05-16 |
Family
ID=86308183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310181289.0A Pending CN116130106A (zh) | 2023-03-01 | 2023-03-01 | 一种用于脑胶质瘤预后的预测模型的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116130106A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117711616A (zh) * | 2023-11-23 | 2024-03-15 | 北京爱思益普生物科技股份有限公司 | 基于基因表达数据的阿尔兹海默预测模型建立方法及系统 |
-
2023
- 2023-03-01 CN CN202310181289.0A patent/CN116130106A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117711616A (zh) * | 2023-11-23 | 2024-03-15 | 北京爱思益普生物科技股份有限公司 | 基于基因表达数据的阿尔兹海默预测模型建立方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107267598A (zh) | 用于评估杂合性丢失的方法与材料 | |
CN112143810B (zh) | 一组用于预测癌症免疫治疗效果的基因标志物及其应用 | |
CN109830264B (zh) | 肿瘤患者基于甲基化位点进行分类的方法 | |
CN111564214A (zh) | 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法 | |
CN115410713A (zh) | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 | |
CN113355419B (zh) | 一种乳腺癌预后风险预测标志组合物及应用 | |
CN101173313B (zh) | 乳腺癌转移和预后分子分型基因群及其基因芯片制备和应用方法 | |
CN111833963B (zh) | 一种cfDNA分类方法、装置和用途 | |
Markunas et al. | Epigenome‐wide analysis uncovers a blood‐based DNA methylation biomarker of lifetime cannabis use | |
Huang et al. | Prognostic nomogram of prognosis-related genes and clinicopathological characteristics to predict the 5-year survival rate of colon cancer patients | |
CN116130106A (zh) | 一种用于脑胶质瘤预后的预测模型的构建方法 | |
CN112831562A (zh) | 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒 | |
CN113234829A (zh) | 结肠癌预后评估基因集及其构建方法 | |
CN115019880A (zh) | 一种基于ddr和icd基因表达的肝癌预后模型及其构建方法和应用 | |
CN114807377A (zh) | 膀胱癌预后生存期标志物的应用、评估装置以及计算机可读取介质 | |
Bao et al. | New insights into glioma frequency maps: From genetic and transcriptomic correlate to survival prediction | |
Zhou et al. | A Prognostic Signature for Colon Adenocarcinoma Patients Based on m6A‐Related lncRNAs | |
CN109735619B (zh) | 与非小细胞肺癌预后相关的分子标志物及其应用 | |
CN117038067A (zh) | 神经内分泌型前列腺癌风险预测方法及其应用 | |
WO2022156610A1 (zh) | 基于基因检测判断肝癌药物敏感性和远期预后的预测工具及其应用 | |
CN110408706A (zh) | 一种评估鼻咽癌复发的生物标志物及其应用 | |
CN116529835A (zh) | 预测癌症进展的方法 | |
CN112481380A (zh) | 一种评估晚期膀胱癌抗肿瘤免疫治疗反应性和预后生存的标志物及其应用 | |
CN111733252A (zh) | 一种特征miRNA表达谱组合及胃癌早期预测方法 | |
Guo et al. | [Retracted] Screening Tumor‐Related Genes of Gallbladder Cancer Based on AR‐Based Tumor Expression Profile Gene Chip |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |