CN113096739B - 一种卵巢癌的免疫预后诊断标志物组合的分析方法 - Google Patents
一种卵巢癌的免疫预后诊断标志物组合的分析方法 Download PDFInfo
- Publication number
- CN113096739B CN113096739B CN202110383674.4A CN202110383674A CN113096739B CN 113096739 B CN113096739 B CN 113096739B CN 202110383674 A CN202110383674 A CN 202110383674A CN 113096739 B CN113096739 B CN 113096739B
- Authority
- CN
- China
- Prior art keywords
- tmb
- prognosis
- ovarian cancer
- irs
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010061535 Ovarian neoplasm Diseases 0.000 title claims abstract description 74
- 206010033128 Ovarian cancer Diseases 0.000 title claims abstract description 73
- 238000004393 prognosis Methods 0.000 title claims abstract description 59
- 238000004458 analytical method Methods 0.000 title claims abstract description 32
- 239000003550 marker Substances 0.000 title claims abstract description 14
- 238000003745 diagnosis Methods 0.000 title claims abstract description 11
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 50
- 210000002865 immune cell Anatomy 0.000 claims abstract description 15
- 230000008595 infiltration Effects 0.000 claims abstract description 14
- 238000001764 infiltration Methods 0.000 claims abstract description 14
- 230000035772 mutation Effects 0.000 claims abstract description 10
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 230000001575 pathological effect Effects 0.000 claims abstract description 4
- 238000007619 statistical method Methods 0.000 claims abstract description 4
- 230000004083 survival effect Effects 0.000 claims description 39
- 230000014509 gene expression Effects 0.000 claims description 23
- 238000000611 regression analysis Methods 0.000 claims description 20
- 238000010200 validation analysis Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 10
- 238000013211 curve analysis Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 206010069754 Acquired gene mutation Diseases 0.000 claims description 4
- 230000037439 somatic mutation Effects 0.000 claims description 4
- 238000010201 enrichment analysis Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 206010028980 Neoplasm Diseases 0.000 abstract description 18
- 238000011282 treatment Methods 0.000 abstract description 8
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 abstract description 2
- 102100025279 C-X-C motif chemokine 11 Human genes 0.000 abstract description 2
- 102100028758 Chondroitin sulfate proteoglycan 5 Human genes 0.000 abstract description 2
- 102100030074 Dickkopf-related protein 1 Human genes 0.000 abstract description 2
- 108010083068 Dual Oxidases Proteins 0.000 abstract description 2
- 102000006265 Dual Oxidases Human genes 0.000 abstract description 2
- 102100029880 Glycodelin Human genes 0.000 abstract description 2
- 101000858088 Homo sapiens C-X-C motif chemokine 10 Proteins 0.000 abstract description 2
- 101000858060 Homo sapiens C-X-C motif chemokine 11 Proteins 0.000 abstract description 2
- 101000916485 Homo sapiens Chondroitin sulfate proteoglycan 5 Proteins 0.000 abstract description 2
- 101000864646 Homo sapiens Dickkopf-related protein 1 Proteins 0.000 abstract description 2
- 101000585553 Homo sapiens Glycodelin Proteins 0.000 abstract description 2
- 101000795167 Homo sapiens Tumor necrosis factor receptor superfamily member 13B Proteins 0.000 abstract description 2
- 101000801255 Homo sapiens Tumor necrosis factor receptor superfamily member 17 Proteins 0.000 abstract description 2
- -1 PI3 Proteins 0.000 abstract description 2
- 102100029675 Tumor necrosis factor receptor superfamily member 13B Human genes 0.000 abstract description 2
- 102100033726 Tumor necrosis factor receptor superfamily member 17 Human genes 0.000 abstract description 2
- 239000000101 novel biomarker Substances 0.000 abstract description 2
- 238000010837 poor prognosis Methods 0.000 abstract description 2
- 238000012795 verification Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 6
- 238000009169 immunotherapy Methods 0.000 description 6
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 5
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 5
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 210000004996 female reproductive system Anatomy 0.000 description 2
- 210000003630 histaminocyte Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 239000012661 PARP inhibitor Substances 0.000 description 1
- 229940121906 Poly ADP ribose polymerase inhibitor Drugs 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 238000011254 conventional chemotherapy Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009093 first-line therapy Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000001024 immunotherapeutic effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000004197 pelvis Anatomy 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种卵巢癌的免疫预后诊断标志物组合的分析方法,标志物组合包括如下基因:CSPG5,CXCL10,CXCL11,DKK1,PI3,TNFRSF17,DUOX1,TNFRSF13B和PAEP;分析方法包括:S1、数据收集和预处理;S2、TMB分数的计算和预后分析;S3、差异分析;S4、TMB‑免疫预后相关风险评分模型的构建和评估;S5、确立临床病理因素和TMB‑IRS模型的关系;S6、CIBERSORT数据库分析;S7、统计分析。本发明通过卵巢癌9个关键的肿瘤突变负荷相关免疫预后基因,构建与TMB有关的免疫风险评分模型,将患者分为高风险组和低风险组,证明了高风险组与较差的预后有关,以及低风险组患者的免疫细胞浸润比例更高;为卵巢癌的临床治疗提供预后提示,可作为预测卵巢癌预后的新型生物标志物和潜在治疗靶标。
Description
技术领域
本发明属于生物分子学领域,具体涉及一种卵巢癌的免疫预后诊断标志物组合的分析方法。
背景技术
卵巢癌是最常见的女性生殖系统恶性肿瘤之一,全球发病率仅次于宫颈癌,在女性生殖系统相关肿瘤死亡中排第一位。由于卵巢位于盆腔深处,体表不易触及,卵巢癌缺乏典型症状,故早期不易诊断且缺乏有效的筛查手段,加之肿瘤生长速度较快,多数患者就诊时病灶已扩散,预后较差,五年生存率较低仅30%~45%。卵巢癌的一线疗法包括手术治疗和化学疗法,但是许多卵巢癌患者对化疗药物呈原发性耐药或继发性耐药,所以我们需要寻找新的治疗方法来改善卵巢癌患者的预后。
肿瘤微环境(TME)在肿瘤的生长和治疗中起着重要作用。免疫细胞浸润是调节肿瘤微环境的关键部分,这些浸润可以协调先天性和适应性免疫反应。随着对肿瘤微环境的深入了解,免疫治疗因其持久的抗肿瘤效应已被批准用于晚期或复发性的多种类型癌症的治疗,成为治疗肿瘤的重要手段之一。卵巢癌表达高度免疫原性的组织特异性抗原,产生的免疫浸润是主要的预后因素。因此,对于卵巢癌免疫疗法的发展有很强的生物学基础。目前,免疫检查点抑制剂疗法是卵巢癌中最有前途的免疫疗法,但是免疫疗法单独使用的客观反应率不容乐观,PD(L)-1抗体与PARP抑制剂或常规化学疗法的结合在临床试验中获得了良好的反应。此外,也需要研究能够预测免疫治疗在卵巢癌疗效中的分子标志物,以筛选合适的免疫治疗人群。
肿瘤突变负荷(TMB)被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。TMB是影响肿瘤突变程度的重要生物标志物,是预测预后和对免疫检查点抑制剂(ICIs)敏感的新兴生物标志物。TMB已成为预测黑色素瘤、非小细胞肺癌等多种癌症的有用的免疫生物标志物。来自回顾性研究数据表明,TMB较高的癌症更有可能对免疫检查点抑制剂(ICIs)做出反应。Chalmers(查尔姆斯理工大学)等研究显示,运用CGP(全面基因组测序)分析可以准确评估TMB,使用这种方法,许多肿瘤类型的高TMB患者中有很大一部分可能会受益于免疫疗法。
目前,对于TMB相关的免疫基因在卵巢癌的预后中的作用以及TMB相关的免疫基因与卵巢癌免疫细胞浸润之间的关联尚未明确。因此找到合适的卵巢癌TMB相关免疫预后标记是符合当今时代需要的。
针对上述提出的问题,现设计一种卵巢癌的免疫预后诊断标志物组合的分析方法。
发明内容
针对现有技术的不足,本发明的目的在于提供一种卵巢癌的免疫预后诊断标志物组合的分析方法,解决了现有技术中TMB相关的免疫基因在卵巢癌的预后中的作用以及TMB相关的免疫基因与卵巢癌免疫细胞浸润之间的关联尚未明确的问题。
本发明的目的可以通过以下技术方案实现:
一种卵巢癌的免疫预后诊断标志物组合的分析方法,包括如下步骤:
S1、数据收集和预处理;
S2、TMB分数的计算和预后分析;
S3、差异分析;
S4、TMB-免疫预后相关风险评分模型的构建和评估;
S5、确立临床病理因素和TMB-IRS模型的关系;
S6、CIBERSORT数据库分析;
S7、统计分析。
进一步的,一种卵巢癌的免疫预后诊断标志物组合的分析方法,所述S2由突变数除以外显子长度计算得出每个人的TMB得分,再根据中位数将卵巢癌样本分为高TMB组和低TMB组。
运用Kaplan-Meier生存曲线分析比较两组之间的总生存期差异,Kaplan-Meier生存曲线的生存率公式如下:
上式中n为存活总人数,d为事件发生数目,接着对卵巢癌患者的体细胞突变情况进行可视化处理。
进一步的,所述S3中以log2|FC|>1和P<0.05为标准,鉴定在高TMB组和低TMB组中差异表达的基因,进行基因本体论富集分析,统计显着性的标准是调整后的P值小于0.05。
进一步的,所述S4在TCGA-OV队列中建立TMB-IRS模型,采用单因素Cox和LASSO回归分析来筛选与预后相关的独立免疫基因,具体为先根据TMB分组情况,将高TMB组和低TMB组进行差异分析,获得差异表达基因,再与免疫基因取交集得到的差异表达的免疫基因。
根据LASSO回归分析得到的基因的回归系数和基因表达,使用下列公式计算每位患者的TMB-IRS:
TMB-IRS=ΣCox coefficient of gene Xi×scale expression value of geneXi
上式中coefficient of gene为基因系数,scale expression value of gene为基因表达量表,Xi指的是第i个数据中的X值。
接着计算每个个体的风险评分并在OC患者中进行排名,然后根据中位数将其分为高风险和低风险组。
进一步的,所述S4在GEO数据库中下载的卵巢癌队列作为验证集,排除突变信息缺失和生存时间小于30天的患者,对符合条件的患者进行预后分析,根据TCGA数据库中卵巢癌队列所建立的IRS公式,计算验证集中每个患者的风险评分,再根据TCGA数据库队列计算所得的IRS中位数,将验证集分为低风险组和高风险组。
进一步的,所述S5采用单因素Cox回归分析寻找与预后相关的临床特征,然后进行多因素Cox回归分析以寻找独立因素,证明TMB-IRS模型可作为评估OC患者预后的独立预测因子。
建立一个综合评估模型,将临床信息与TMB-IRS模型相结合,以综合评估卵巢癌患者预后,构建预测患者生存率的列线图。
比较卵巢癌的实际生存状态与预测效果的一致性,并计算TNM分期、IRS和列线图的一致性指数,用于比较三者对卵巢癌患者预后的预测能力,并计算未来的决策曲线分析,以衡量建立的列线图的临床应用价值。
进一步的,所述S6通过计算高TMB-IRS和低TMB-IRS两组组织中免疫细胞的比例,以估计免疫细胞的浸润情况。
进一步的,所述S7进行多变量Cox回归分析,进行单因素和多因素Cox回归分析基因表达,确立临床特征和预后之间的关系。
本发明的有益效果:
1、本发明提出的卵巢癌的免疫预后诊断标志物组合的分析方法,通过卵巢癌9个关键的肿瘤突变负荷(TMB)相关免疫预后基因,构建与TMB有关的免疫风险评分模型,将患者分为高风险组和低风险组,证明了高风险组与较差的预后有关,以及低风险组患者的免疫细胞浸润比例更高;
2、本发明提出的卵巢癌的免疫预后诊断标志物组合的分析方法,为卵巢癌的临床治疗提供预后提示,可作为预测卵巢癌预后的新型生物标志物和潜在治疗靶标。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的TMB-IRS模型的建立和验证中差异基因和免疫基因交集的维恩图;
图2是本发明实施例的TMB-IRS模型的建立和验证中用于调整LASSO模型中参数选择的十次交叉验证示意图;
图3是本发明实施例的TMB-IRS模型的建立和验证中LASSO系数曲线示意图;
图4是本发明实施例的TMB-IRS模型的建立和验证中Kaplan-Meier曲线显示TCGA-OC高危组与低危组总体生存率的差异示意图;
图5是本发明实施例的TMB-IRS模型的建立和验证中预测2、3、5年生存率的时间相关ROC曲线示意图;
图6是本发明实施例的TMB-IRS模型的建立和验证中卵巢癌患者的9种免疫基因的风险评分示意图;
图7是本发明实施例的TMB-IRS模型的建立和验证中卵巢癌患者的9种免疫基因的生存状态示意图;
图8是本发明实施例的TMB-IRS模型的建立和验证中卵巢癌患者的9种免疫基因的热图;
图9是本发明实施例的TMB-IRS模型的建立和验证中Kaplan-Meier曲线显示GSE26712中低危人群与高危人群总体生存率的对比图;
图10是本发明实施例的TMB-IRS模型的建立和验证中GSE26712中TMB-IRS模型2、3、5年的随时间变化的ROC曲线分析示意图;
图11是本发明实施例的预测卵巢癌的总体生存率的线型图;
图12是本发明实施例的预测2年,3年,5年总体生存率的校准曲线图;
图13是本发明实施例的决策曲线分析示意图;
图14是本发明实施例的决策曲线分析示意图;
图15是本发明实施例的与总体生存率相关的卵巢癌临床病理特征的单因素/多因素Cox回归分析表。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1
S1、数据收集和预处理
从癌症基因组图谱(TCGA)(https://portal.gdc.cancer.gov/)数据库中依据纳入标准和排出标准收集卵巢癌患者,包括体细胞突变,临床信息,生存信息和基因表达数据(FPKM——每千个碱基的转录每百万映射读取的fragments(片段)归一化)。
纳入标准为:(1)患者的病理诊断为卵巢癌;(2)完整的mRNA表达谱;(3)完整的临床资料。
排除标准为:(1)非原发性卵巢癌;(2)患者缺少突变信息和生存信息;(3)卵巢癌复发的患者。
本实施例中选择271个卵巢癌样本作为训练集,包括年龄,癌症状态,等级,分期和种族等临床特征。
所有免疫基因的基因名称均直接从免疫学数据库和分析门户(ImmPort)数据库(https://immport.niaid.nih.gov)下载,本实施例中下载了免疫相关基因的完整列表,包括总共2483个免疫相关基因。
S2、TMB分数的计算和预后分析
由突变数除以外显子长度(30MB)计算得出每个人的TMB得分,再根据中位数将卵巢癌样本分为高TMB组和低TMB组(高TMB组和低TMB组分组根据中位数和四分位间距M(IRQ)=1.173(0.798,1.718)为标准,大于M的为高TMB组,低于M的为TMB组),此外运用Kaplan-Meier生存曲线分析比较两组之间的总生存期(OS)差异,Kaplan-Meier生存曲线的生存率公式如下:
其中n为存活总人数,d为事件发生数目。
同时使用“maptools”R软件(R语言)包对卵巢癌患者的体细胞突变情况进行可视化处理。
S3、差异分析
基于TMB分组先进行差异分析,以鉴定在高TMB组和低TMB组中差异表达的基因,具体而言使用R软件中的“limma”程序包获得差异表达的基因(DEG)。以log2|FC|>1和P<0.05(折叠数的倍数变化>1,P<0.05)为标准。DEG的可视化是通过R软件中的“ggplot2”,“Cairo”和“ggrepel”软件包绘制火山图来实现的。
为了研究DEG的潜在生物学过程和富集途径,使用“clusterprofiler”R软件包进行了基因本体论(GO)富集分析,统计显着性的标准是调整后的P值小于0.05。
S4、TMB-免疫预后相关风险评分(TMB-IRS)模型的构建和评估
一种卵巢癌的免疫预后诊断标志物组合,是由9个关键基因所建立的风险评估模型。
在TCGA(癌症基因组图谱)-OV队列中建立TMB-IRS标记,采用多变量Cox(比例风险回归模型)和LASSO(一种回归模型)分析来筛选与预后相关的独立免疫基因,具体为先根据TMB分组情况,将高TMB组和低TMB组进行差异分析,共获得892个差异表达基因,再与2483个免疫基因取交集得到101的差异表达的免疫基因。此外,单变量Cox回归分析获得了12个与疾病预后相关的免疫基因。在大多数样品中去除两个表达为零的基因后,进行LASSO回归分析,得到了9个独立的预后免疫基因,即CSPG5,CXCL10,CXCL11,DKK1,PI3,TNFRSF17,DUOX1,TNFRSF13B和PAEP。接着根据上述9个基因的回归系数和基因表达,使用下列公式计算每位患者的TMB-IRS:
TMB-IRS=ΣCox coefficient of gene Xi×scale expression value of geneXi
其中coefficient of gene为基因系数,scale expression value of gene为基因表达量表,Xi指的是第i个数据中的X值。
结合本实施例的实验结果,得到下式:
TMB-IRS=0.417×expDKK1+0.091×expPI3+0.166×expDUOX1+0.013×expPAEP+0.184×expCXCL10-0.254×expCSPG5-0.392×expCXCL11-0.219×expTNFRSF17-0.428×expTNFRSF13B
接着计算每个个体的风险评分并在OC(卵巢癌)患者中进行排名,然后根据中位数将其分为高风险和低风险组。Kaplan-Meier分析表明,与低风险组相比,高风险组患者的预后往往更差(P<0.0001)。此外,生存ROC曲线结果表明TMB-IRS标志物能够准确预测OC的预后(5年AUC(ROC曲线下面积)=0.754)。
为了验证TMB-IRS标记的普遍适用性,将在GEO数据库(一个储存芯片、二代测序以及其他高通量测序数据的一个数据库)中下载的卵巢癌队列作为验证集,排除突变信息缺失和生存时间小于30天的患者,共对148个患者进行了预后分析。根据TCGA数据库中卵巢癌队列所建立的IRS(免疫预后相关风险评分)公式,计算验证集中每个患者的风险评分。再根据TCGA数据库队列计算所得的IRS中位数,将验证集分为低风险组和高风险组。Kaplan-Meier分析结果显示,IRS与预后显著相关,低风险组的预后较好,而高风险组的预后较差,这与TCGA数据库队列结果一致。ROC曲线表明,该模型在OS预测概率和实际概率上具有较好的一致性(5年AUC=0.639)。
S5、临床病理因素和TMB-IRS模型的关系
为了评价TMB-IRS模型是否可以作为预后的独立预测因子,首先采用单因素Cox回归分析来寻找与预后相关的临床特征,然后进行多因素Cox回归分析以寻找独立因素。经过多因素Cox回归分析证明TMB-IRS模型可作为评估OC患者预后的独立预测因子。
为了综合评估卵巢癌患者预后,建立一个综合评估模型,将临床信息与TMB-IRS模型相结合。即利用R软件的rms软件包,构建一个可以预测2年、3年、5年患者生存率的列线图。
比较卵巢癌的实际生存状态与预测效果的一致性,绘制了校正曲线(2年、3年和5年生存预测),曲线与X轴角度为45°时意味着列线图具有较好的预测准确性。接着利用R软件的“survival”包计算TNM分期、IRS和列线图的一致性指数(C-指数)用于比较三者对卵巢癌患者预后的预测能力。同时地,计算2、3和5年的决策曲线分析(DCA),以衡量建立的列线图的临床应用价值。x轴代表门槛概率的百分比,y轴代表净收入。校正曲线结果表明,用列线图预测OC患者的预后生存率与实际概率吻合良好。
S6、CIBERSORT数据库分析
为了估计免疫细胞的浸润情况,我们运用CIBERSORT在线免疫细胞浸润估计分析工具(基于线性支持向量回归的原理对免疫细胞亚型的表达矩阵进行去卷积的一个工具),能够可以计算出高TMB-IRS和低TMB-IRS两组组织中22种免疫细胞的比例。需要注意的是,当P<0.05意味着有显著的统计学意义。结果表明,低危人群中浆细胞,T细胞CD4(表面有CD4+T分子的T淋巴细胞,是人体免疫系统中的一种重要免疫细胞,由于艾滋病病毒攻击对象是CD4+T细胞,所以其检测结果对艾滋病治疗效果的判断和对患者免疫功能的判断有重要作用。)记忆激活,T细胞滤泡辅助,单核细胞,巨噬细胞M1和肥大细胞的浸润较高,而T细胞CD4记忆静止,T细胞γ和肥大细胞活化高危人群的浸润率较高。低风险组患者的免疫细胞浸润比例更高。
S7、统计分析
采用SPSS 20.0(一种统计软件)进行多变量Cox回归分析,逐步进入的概率为0.05,移除的概率为0.1。简单的数学运算过程和所有表格制作均由Excel软件完成。进行单因素和多因素Cox回归分析基因表达,临床特征和预后之间的关系。此外,“survival R卵巢癌”软件包用于在R中绘制生存R卵巢癌(v 3.6.1)。与预后相关的所有分析均使用“生存”软件包进行,具有显着差异的概率阈值设置为P<0.05。
图1—图10为本实施例中TMB-IRS模型的建立和验证过程中的流程图,图11—图14为建立卵巢癌患者的总体生存率列线图,其中图13和图14用于评估2、3、5年TNM阶段,IRS和列线图的净收益,图15为本实施例中与总体生存率相关的卵巢癌临床病理特征的单因素/多因素Cox回归分析总表。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (7)
1.一种卵巢癌的免疫预后诊断标志物组合的分析方法,包括如下步骤:
S1、数据收集和预处理;
S2、TMB分数的计算和预后分析;
S3、差异分析;
S4、TMB-免疫预后相关风险评分模型的构建和评估;
S5、确立临床病理因素和TMB-IRS模型的关系;
S6、CIBERSORT数据库分析;
S7、统计分析;
所述S2由突变数除以外显子长度计算得出每个人的TMB得分,再根据中位数将卵巢癌样本分为高TMB组和低TMB组;
运用Kaplan-Meier生存曲线分析比较两组之间的总生存期差异,Kaplan-Meier生存曲线的生存率公式如下:
上式中n为存活总人数,d为事件发生数目,接着对卵巢癌患者的体细胞突变情况进行可视化处理。
2.根据权利要求1所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S3中以log2|FC|>0.58和P<0.05为标准,鉴定在高TMB组和低TMB组中差异表达的基因,进行基因本体论富集分析,统计显著性的标准是校正后的P值小于0.05。
3.根据权利要求2所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S4在TCGA-OV队列中建立TMB-IRS标记,采用单因素Cox和LASSO回归分析来筛选与预后相关的独立免疫基因,具体为先根据TMB分组情况,将高TMB组和低TMB组进行差异分析,获得差异表达基因,再与免疫基因取交集得到的差异表达的免疫基因;
根据LASSO回归分析得到的基因的回归系数和基因表达,使用下列公式计算每位患者的TMB-IRS:
TMB-IRS=ΣCox coefficient ofgene Xi×scale expression value ofgene Xi
上式中coefficient ofgene为基因系数,scale expressionvalue ofgene为基因表达量表,Xi指的是第i个数据中的X值;
接着计算每个个体的风险评分并在OC患者中进行排名,然后根据中位数将其分为高风险和低风险组。
4.根据权利要求3所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S4在GEO数据库中下载的卵巢癌队列作为验证集,排除突变信息缺失和生存时间小于30天的患者,对符合条件的患者进行预后分析,根据TCGA数据库中卵巢癌队列所建立的IRS公式,计算验证集中每个患者的风险评分,再根据TCGA数据库队列计算所得的IRS中位数,将验证集分为低风险组和高风险组。
5.根据权利要求4所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S5采用单因素Cox回归分析寻找与预后相关的临床特征,然后进行LASSO回归分析以寻找独立因素,证明TMB-IRS模型作为评估OC患者预后的独立预测因子;
建立一个综合评估模型,将临床信息与TMB-IRS模型相结合,以综合评估卵巢癌患者预后,构建预测患者生存率的列线图;
比较卵巢癌的实际生存状态与预测效果的一致性,并计算TNM分期、IRS和列线图的一致性指数,用于比较三者对卵巢癌患者预后的预测能力,并计算未来的决策曲线分析,以衡量建立的列线图的临床应用价值。
6.根据权利要求5所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S6通过计算高TMB-IRS和低TMB-IRS两组组织中免疫细胞的比例,以估计免疫细胞的浸润情况。
7.根据权利要求6所述的一种卵巢癌的免疫预后诊断标志物组合的分析方法,其特征在于,所述S7进行单因素和多因素Cox回归分析基因表达,确立临床特征和预后之间的关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110383674.4A CN113096739B (zh) | 2021-04-09 | 2021-04-09 | 一种卵巢癌的免疫预后诊断标志物组合的分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110383674.4A CN113096739B (zh) | 2021-04-09 | 2021-04-09 | 一种卵巢癌的免疫预后诊断标志物组合的分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113096739A CN113096739A (zh) | 2021-07-09 |
CN113096739B true CN113096739B (zh) | 2024-04-12 |
Family
ID=76675666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110383674.4A Active CN113096739B (zh) | 2021-04-09 | 2021-04-09 | 一种卵巢癌的免疫预后诊断标志物组合的分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113096739B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113774135B (zh) * | 2021-09-17 | 2024-03-08 | 广东省人民医院 | 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用 |
CN114657245B (zh) * | 2021-11-26 | 2022-10-04 | 中南大学湘雅二医院 | 基因的应用、预测i期非小细胞肺癌术后复发转移的模型及其构建方法 |
CN114015780A (zh) * | 2021-12-13 | 2022-02-08 | 西安交通大学医学院第二附属医院 | 用于卵巢癌诊断或预后风险评估的标志物 |
CN114242157B (zh) * | 2021-12-28 | 2023-03-21 | 江苏先声医学诊断有限公司 | 基于bGMS预测非小细胞肺癌免疫治疗疗效 |
CN115631857B (zh) * | 2022-04-01 | 2023-06-23 | 洛兮医疗科技(杭州)有限公司 | 甲状腺癌cd8+t细胞免疫相关基因预后预测模型 |
CN114807374A (zh) * | 2022-06-01 | 2022-07-29 | 北京大学第三医院(北京大学第三临床医学院) | 基于多不饱和脂肪酸相关基因的卵巢癌预后风险模型及其制备方法和应用 |
CN115527681A (zh) * | 2022-11-11 | 2022-12-27 | 北京科技大学 | 一种结直肠癌预后预测模型构建方法及装置 |
CN117594243B (zh) * | 2023-10-13 | 2024-05-14 | 太原理工大学 | 基于跨模态视图关联发现网络的卵巢癌预后预测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8030060B2 (en) * | 2007-03-22 | 2011-10-04 | West Virginia University | Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer |
US20120329878A1 (en) * | 2009-07-20 | 2012-12-27 | University College Dublin | Phenotyping tumor-infiltrating leukocytes |
-
2021
- 2021-04-09 CN CN202110383674.4A patent/CN113096739B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
Also Published As
Publication number | Publication date |
---|---|
CN113096739A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113096739B (zh) | 一种卵巢癌的免疫预后诊断标志物组合的分析方法 | |
CN109859801B (zh) | 一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法 | |
CN111564214B (zh) | 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法 | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
CN111676288B (zh) | 用于预测肺腺癌患者预后的系统及其应用 | |
CN111440869A (zh) | 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用 | |
CN109979532B (zh) | 甲状腺乳头状癌远处转移分子突变预测模型、方法及系统 | |
Zhang et al. | Development and validation of a nomogram for predicting survival in patients with surgically resected lung invasive mucinous adenocarcinoma | |
CN115798703A (zh) | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 | |
Zhang et al. | Development of RECLS score to predict survival in lung cancer patients with malignant pleural effusion | |
Chen et al. | Construction and validation of a prognostic model for kidney renal clear cell carcinoma based on podocyte‐associated genes | |
Zhu et al. | Identification of pyroptosis-relevant signature in tumor immune microenvironment and prognosis in skin cutaneous melanoma using network analysis | |
Zhao et al. | A novel signature based on pairwise PD‐1/PD‐L1 signaling pathway genes for predicting the overall survival in patients with hepatocellular carcinoma | |
Dehal et al. | Accuracy of nodal staging is influenced by sidedness in colon cancer | |
Li et al. | A novel oxidative stress-related gene signature as an indicator of prognosis and immunotherapy responses in HNSCC | |
Tian et al. | The lncRNAs MIR600HG and TSPOAP1-AS1 may potentially act as biomarkers for predicting pancreatic cancer | |
Mamoor | Differential expression of tubulin alpha 3d in human epithelial ovarian cancer. | |
Lin et al. | A novel assessing system for predicting the prognosis of gastric cancer | |
WO2023240725A1 (zh) | 一组nk/t细胞淋巴瘤预后相关基因、基因组预后模型及其用途 | |
Mamoor | Differential expression of collagen type III alpha 1 chain in human epithelial ovarian cancer. | |
Mamoor | Differential expression of pre-B-cell leukemia homeobox 1 in human epithelial ovarian cancer. | |
Zhang et al. | Analysis of Immune Infiltration and Clinical Significance of Lysosome-Related Genes in Colon Adenocarcinoma | |
CN116656820A (zh) | 一种基于乳腺肿瘤干细胞相关基因的预后模型及其应用 | |
港窦 | Establishment of a prognostic model of hepatocellular carcinoma based on inflammatory factor-related genes and prognosis-related characteristics | |
Wang et al. | Anoikis-associated signatures predict prognosis and immune response in bladder cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |