CN116805509A - 结直肠癌免疫治疗预测标志物的构建方法及应用 - Google Patents
结直肠癌免疫治疗预测标志物的构建方法及应用 Download PDFInfo
- Publication number
- CN116805509A CN116805509A CN202310599226.7A CN202310599226A CN116805509A CN 116805509 A CN116805509 A CN 116805509A CN 202310599226 A CN202310599226 A CN 202310599226A CN 116805509 A CN116805509 A CN 116805509A
- Authority
- CN
- China
- Prior art keywords
- colorectal cancer
- immunotherapy
- module
- data
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 53
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 50
- 238000002619 cancer immunotherapy Methods 0.000 title claims abstract description 18
- 238000010276 construction Methods 0.000 title claims abstract description 16
- 239000003550 marker Substances 0.000 title claims abstract description 16
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 39
- 238000009169 immunotherapy Methods 0.000 claims abstract description 34
- 238000004393 prognosis Methods 0.000 claims abstract description 23
- 230000000694 effects Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 18
- YFVOQMWSMQHHKP-UHFFFAOYSA-N cobalt(2+);oxygen(2-);tin(4+) Chemical compound [O-2].[O-2].[O-2].[Co+2].[Sn+4] YFVOQMWSMQHHKP-UHFFFAOYSA-N 0.000 claims abstract description 15
- 235000012736 patent blue V Nutrition 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims abstract description 6
- 206010028980 Neoplasm Diseases 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000011282 treatment Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 11
- 230000014509 gene expression Effects 0.000 claims description 9
- 230000004186 co-expression Effects 0.000 claims description 7
- 230000001024 immunotherapeutic effect Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000001325 log-rank test Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 102100022584 3-keto-steroid reductase/17-beta-hydroxysteroid dehydrogenase 7 Human genes 0.000 claims description 2
- 102100025277 C-X-C motif chemokine 13 Human genes 0.000 claims description 2
- 102000049320 CD36 Human genes 0.000 claims description 2
- 108010045374 CD36 Antigens Proteins 0.000 claims description 2
- 102100021633 Cathepsin B Human genes 0.000 claims description 2
- 102100022731 Diacylglycerol kinase delta Human genes 0.000 claims description 2
- 102100027088 Dual specificity protein phosphatase 5 Human genes 0.000 claims description 2
- 101150097734 EPHB2 gene Proteins 0.000 claims description 2
- 102100031968 Ephrin type-B receptor 2 Human genes 0.000 claims description 2
- 102100027867 FH2 domain-containing protein 1 Human genes 0.000 claims description 2
- 102100023934 Heparan sulfate glucosamine 3-O-sulfotransferase 2 Human genes 0.000 claims description 2
- 101001045215 Homo sapiens 3-keto-steroid reductase/17-beta-hydroxysteroid dehydrogenase 7 Proteins 0.000 claims description 2
- 101000858064 Homo sapiens C-X-C motif chemokine 13 Proteins 0.000 claims description 2
- 101000898449 Homo sapiens Cathepsin B Proteins 0.000 claims description 2
- 101001044810 Homo sapiens Diacylglycerol kinase delta Proteins 0.000 claims description 2
- 101001057612 Homo sapiens Dual specificity protein phosphatase 5 Proteins 0.000 claims description 2
- 101001060553 Homo sapiens FH2 domain-containing protein 1 Proteins 0.000 claims description 2
- 101001002170 Homo sapiens Glutamine amidotransferase-like class 1 domain-containing protein 3, mitochondrial Proteins 0.000 claims description 2
- 101001048053 Homo sapiens Heparan sulfate glucosamine 3-O-sulfotransferase 2 Proteins 0.000 claims description 2
- 101001000801 Homo sapiens Integral membrane protein GPR137B Proteins 0.000 claims description 2
- 101001032345 Homo sapiens Interferon regulatory factor 8 Proteins 0.000 claims description 2
- 101001090919 Homo sapiens N-acylglucosamine 2-epimerase Proteins 0.000 claims description 2
- 101000700918 Homo sapiens SERTA domain-containing protein 1 Proteins 0.000 claims description 2
- 101000843556 Homo sapiens Transcription factor HES-1 Proteins 0.000 claims description 2
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 claims description 2
- 102100035571 Integral membrane protein GPR137B Human genes 0.000 claims description 2
- 102100038069 Interferon regulatory factor 8 Human genes 0.000 claims description 2
- 102100034977 N-acylglucosamine 2-epimerase Human genes 0.000 claims description 2
- 102100020949 Putative glutamine amidotransferase-like class 1 domain-containing protein 3B, mitochondrial Human genes 0.000 claims description 2
- 102100029341 SERTA domain-containing protein 1 Human genes 0.000 claims description 2
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims description 2
- 230000004083 survival effect Effects 0.000 abstract description 7
- 230000001225 therapeutic effect Effects 0.000 abstract description 3
- 238000012795 verification Methods 0.000 abstract 1
- 201000011510 cancer Diseases 0.000 description 4
- 238000003012 network analysis Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 2
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 2
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 208000026278 immune system disease Diseases 0.000 description 2
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000011254 conventional chemotherapy Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种结直肠癌免疫治疗预测标志物的构建方法及应用,依靠从TCGA数据库下载直肠癌数据集CRC_TCGA、从GEO数据库下载多个结直肠癌数据集,通过筛选GSE39582数据集获得免疫相关的skyblue基因模块,然后构建结直肠癌免疫治疗标志物并进行预后效果评估,最后利用GSE39582分析该标签预测免疫治疗的效果,并利用其他4个数据集进行免疫治疗预测的验证。本发明的结直肠癌免疫治疗预测标志物的构建方法,能准确的筛选、构建出结直肠癌免疫治疗预测标志物,可以预测免疫治疗是否有响应,从而选择相应的治疗措施,对降低医疗成本和提高患者的生存率有着重要的指导和参考意义。
Description
技术领域
本发明属于数据分析技术领域,具体涉及一种结直肠癌免疫治疗预测标志物的构建方法及应用。
背景技术
结直肠癌(Colorectal cancer,CRC)是指发生于结肠或者是直肠的癌变,可发生于结直肠的任何部位,但尤以直肠、乙状结肠最为常见。国际癌症研究机构编制的2020年癌症发病率和死亡率评估数据显示,2020年全球范围内新发1930万例癌症病例,死亡人数近1000万例。其中,CRC发病数近193万(10%),排名仅次于乳腺癌和肺癌,居第三位;死亡人数近92万(9.2%),仅次于肺癌,位居等二位。在我国,CRC是最常见的消化道恶性肿瘤之一,发病率和死亡率在所有癌症中分别位居第三位和第五位,且发病率仍在继续增长,给社会经济带来了巨大压力。尽管治疗手段在不断地进步,但是结直肠癌的死亡率仍居高不下。免疫治疗是近年来肿瘤治疗领域的研究特点。与常规化疗和靶向治疗相比,免疫治疗改变了各种实体瘤的治疗前景。基于免疫检查点抑制剂(ICI)的免疫治疗在结直肠癌患者中的应用在安全性和有效性方面取得了令人满意的结果,包括派姆单抗、纳沃单抗和伊匹单抗在内的几种免疫治疗药物已被批准用于晚期结直肠癌的治疗。其他免疫疗法的出现,如嵌合抗原受体修饰的T(CAR-T)细胞或癌症疫苗,也促进了结直肠癌免疫疗法的发展。但是,免疫治疗费用较高、患者响应率较低仍然对临床构成比较大的挑战。
预后标志物是指在患者接受治疗后,预示其疾病进展、存活期或治疗效果的生物学指标。这些标志物可以是分子、细胞、组织或影像学特征。预后标志物对于评估疾病的严重程度、选择治疗方案以及监测治疗效果都具有重要的作用。常见的预后标志物包括肿瘤标志物、心血管标志物、炎症标志物等。通过对预后标志物的监测,可以及早发现疾病的变化,采取相应的治疗措施,提高患者的生存率和生活质量。
在结直肠癌的免疫治疗中,如果能准确的筛选、构建出标志物,对于结直肠癌患者的康复无疑具有重要的指导意义。
发明内容
本发明的目的是提供一种结直肠癌免疫治疗预测标志物的构建方法及应用。
为了解决上述技术问题,本发明公开了一种结直肠癌免疫治疗预测标志物的构建方法,包括如下步骤:
a.数据下载与处理:从TCGA数据库下载CRC_TCGA数据集,提取TPM格式的数据,用log2方法处理数据;从GEO数据库下载结直肠癌数据集GSE39582、GSE38832、GSE14333和GSE17536,经过id转换和标准化处理;
b.筛选结直肠癌免疫相关基因模块:
b1.计算肿瘤微环境指标免疫评分:使用“ESTIMATE”计算结直肠癌数据集中每个样本的肿瘤微环境的免疫评分;
b2.WGCNA分析:使用R包“WGCNA”构建权重共表达网络:首先,利用基因表达谱构建相似矩阵,在相关系数大于0.8时,选择最优软阈值为7以确保网络为无标度网络;接着将相似矩阵转换为邻接矩阵,然后再将邻接矩阵转换为拓扑重叠矩阵;基于TOM,采用层次聚类的average-linkage方法,按照混合动态剪切树的标准,设置每个基因网络模块最少基因数目为30,模块分割灵敏度为3,以及模块最大距离为0.25,将基因聚类成不同模块,接着,对每个模块在表达谱中的第一主成分确定模块特征,并计算模块特征与性状的相关性,最终形成可识别的关键模块skyblue;
c.从GSE39582数据集skyblue模块中进行预后相关基因的筛选:
使用R软件包“survival”,整合生存时间、生存状态和基因表达数据,利用cox方法评估每个基因的预后显著性;
d.结直肠癌免疫治疗预测标志物的构建方法:
d1.预后lasso变量轨迹的建立:使用R软件包中的glmnet对清洗过后的GSE39582数据进行分析得到变量系数值、λ对数值、L1正则化值,并对数据进行可视化;
d2.预后lasso系数筛选:使用R软件包中的glmnet包对清洗过后的GSE39582数据进行分析得到变量λ值、最大似然数或C指数并对数据进行可视化;
e.免疫治疗预测标志物预后效果评估:
根据预后标志物风险评分将患者分为两组,使用R软件包“survival”的“survfit”函数分析两组患者预后差异,并使用logrank检验方法评估差异显著性;随后,利用R软件包“pROC”的“ROC”函数在1年、3年和5年三个时间点进行ROC分析,并使用“ci”函数评估曲线下面积和置信区间,获得最终AUC结果。
f.免疫治疗标志物预测疗效与验证:
使用TIDE(Tumor Immune Dysfunction and Exclusion,TIDE)(http://tide.dfci.harvard.edu/)预测免疫治疗响应。根据预后标志物风险分数(Riskscore)将GSE39582中结直肠癌患者分为2组,计算高、低风险组间免疫治疗响应率的差异。然后,利用CRC_TCGA、GSE38832、GSE14333和GSE17536数据集验证免疫治疗预测效果。
优选地,所述关键模块skyblue包含614个基因。
优选地,所述步骤c中,预后标志物风险分数计算公式为:
Riskscore=IRF8×(-0.09)+USP30-AS1×(-0.19)+CXCL13×(-0.07)+TNFRSF14×(-0.08)+RENBP×(0.17)+HS3ST2×(0.10)+SP140×(-0.01)+DGKD×(-0.07)+GPR137B×(0.03)+EPHB2×(-0.02)+CTSB×(0.03)+FHDC1×(-0.05)+CD36×(0.08)+HSD17B7×(-0.06)+SERTAD1×(0.01)+DUSP5×(0.03)+HES1×(-0.02)
一种采用结直肠癌预后标志物进行预测免疫治疗的应用方法,利用线上工具TIDE预测抗PD1和抗CTLA4免疫治疗响应;根据风险分数将患者分为2组,计算高、低风险组间免疫治疗响应率的差异。
本发明的结直肠癌预后标志物的构建方法,能准确的筛选、构建出结直肠癌预后标志物,通过对结直肠癌预后标志物的监测,可以及早发现疾病的变化,从而尽早采取相应的治疗措施,对提高患者的生存率和生活质量有着重要的指导和参考意义。
附图说明
图1示出了一种加权基因共表达网络分析(Weighted correlation networkanalysis,WGCNA)筛选结直肠癌中免疫相关的基因模块,其中,A为不同软阈值对用的R2;B为不同软阈值对应的基因邻接系数;C为通过基因邻接系数层次聚类构建的基因树状图;D为共表达基因模块与结直肠癌免疫评分的关系;E为关键模块skyblue(在软件中分析结果表现为skyblue模块)中614个基因的显著性散点图。
图2示出了GSE39582数据集skyblue模块中预后相关基因。
图3示出了Lasso-cox分析构建结直肠癌免疫治疗预测标志物,其中,A为LASSO回归系数路径图;B为LASSO回归交叉验证图;C为预后标志物风险分数计算公式;D为生存曲线;E为时间依赖ROC曲线。
图4示出了不同数据集中免疫治疗标志物预测免疫治疗的效果,其中,A为CRC_TCGA数据集中免疫治疗预测效果;B为GSE39582数据集中免疫治疗预测效果;C为GSE14333数据集中免疫治疗预测效果;D为GSE17536数据集中免疫治疗预测效果;E为GSE38832数据集中免疫治疗预测效果。
具体实施方式
下面通过实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”,“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。
实施例1
本实施例用于说明构建免疫治疗预测标志物的结直肠癌数据类型、下载与处理。
1、数据下载与处理:
表1.结直肠癌表达谱和临床随访数据队列
如表1所示,从TCGA数据库(https://portal.gdc.cancer.gov)下载CRC_TCGA临床和RNAseq数据,提取TPM格式的数据,用log2(表达值+1)方法处理数据。从GEO(https://www.ncbi.nlm.nih.gov/gds)数据库下载结直肠癌数据集GSE39582、GSE38832、GSE14333和GSE17536,经过id转换和标准化处理。
图1示出了加权基因共表达网络分析(Weighted correlation networkanalysis,WGCNA)筛选结直肠癌中免疫相关的基因模块,其中,(A)不同软阈值对用的R2;(B)不同软阈值对应的基因邻接系数;(C)通过基因邻接系数层次聚类构建的基因树状图;(D)共表达基因模块与结直肠癌免疫评分的关系;(E)skyblue模块中614个基因的显著性散点图。
实施例2
本实施例用于说明WGCNA筛选结直肠癌免疫相关基因模块。
1、计算肿瘤微环境(TME)指标免疫评分
使用“ESTIMATE”计算结直肠癌数据集中每个样本的肿瘤微环境(Tumormicroenvironment,TME)免疫评分。
2、WGCNA分析
使用R包“WGCNA”构建权重共表达网络。首先,利用基因表达谱构建相似矩阵,在相关系数(scale free R2)大于0.8时,选择最优软阈值(β,soft-thresholding power)为7以确保网络为无标度网络。下一步将相似矩阵转换为邻接矩阵,然后再将邻接矩阵转换为拓扑重叠矩阵(TOM,topological overlap matrix)。基于TOM,我们使用层次聚类的average-linkage方法,按照混合动态剪切树的标准,设置每个基因网络模块最少基因数目(minimummodule size)为30,模块分割灵敏度(deep split)为3,以及模块最大距离(merge cutheight)为0.25,将基因聚类成不同模块。接着,对每个模块在表达谱中的第一主成分确定模块特征(ME,module eigengenes),并计算模块特征与性状的相关性,最终识别关键模块skyblue,该模块包含614个基因。
图2示出了GSE39582数据集skyblue模块中单因素生存分析预后相关基因。
实施例3
本实施例用于说明GSE39582数据集skyblue模块中预后相关基因。
1、GSE39582数据集skyblue模块中预后相关基因的筛选:
使用R(4.2.1版本)软件包“survival”[3.3.1],整合生存时间、生存状态和基因表达数据,利用cox方法评估每个基因的预后显著性。
图3示出了Lasso-cox分析构建结直肠癌预后标志物。其中,(A)LASSO回归系数路径图;(B)LASSO回归交叉验证图;(C)预后标志物风险分数计算公式;(D)生存曲线;(E)时间依赖ROC曲线。
实施例4
本实施例用于说明Lasso-cox分析构建结直肠癌免疫治疗预测标志物及其预后评估。
1、Lasso-cox分析
预后lasso(Construction of Prognostic Signature With least absoluteshrinkage and selection operator)变量轨迹:使用R(4.2.1版本)R包:glmnet[4.1.4]对清洗过后的GSE39582数据进行分析得到变量系数值、λ对数值、L1正则化值,并对数据进行可视化。预后lasso系数筛选:使用glmnet包对清洗过后的数据进行分析得到变量λ值、最大似然数或C指数并对数据进行可视化。
2、预后效果评估
根据预后标志物风险评分百分位数(50%)将患者分为两组,使用R包“survival”的“survfit”函数分析两组患者预后差异,并使用logrank检验方法评估差异显著性。随后,利用R包“pROC”的“ROC”函数在1年、3年和5年三个时间点进行ROC(Receiver operatingcharacteristic curve,ROC)分析,并使用“ci”函数评估曲线下面积(Area Under TheCurve,AUC)和置信区间,获得最终AUC结果。
图4示出了不同数据集中预后标志物预测免疫治疗的效果。其中,(A)CRC_TCGA数据集中免疫治疗预测效果;(B)GSE39582数据集中免疫治疗预测效果;(C)GSE14333数据集中免疫治疗预测效果;(D)GSE17536数据集中免疫治疗预测效果;(E)GSE38832数据集中免疫治疗预测效果。
实施例5
本实施例用于说明免疫治疗标志物预测免疫疗效与验证:
使用TIDE(Tumor Immune Dysfunction and Exclusion,TIDE)(http://tide.dfci.harvard.edu/)预测免疫治疗响应。根据预后标志物风险分数(Riskscore)将GSE39582中结直肠癌患者分为2组,计算高、低风险组间免疫治疗响应率的差异。然后,利用CRC_TCGA、GSE38832、GSE14333和GSE17536数据集验证免疫治疗预测效果。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的实施例。
Claims (4)
1.一种结直肠癌免疫治疗预测标志物的构建方法,其特征在于,包括如下步骤:
a.数据下载与处理:从TCGA数据库下载CRC_TCGA数据集,提取TPM格式的数据,用log2方法处理数据;从GEO数据库下载结直肠癌数据集GSE39582、GSE38832、GSE14333和GSE17536,经过id转换和标准化处理;
b.筛选结直肠癌免疫相关基因模块:
b1.计算肿瘤微环境指标免疫评分:使用“ESTIMATE”计算结直肠癌数据集中每个样本的肿瘤微环境的免疫评分;
b2.WGCNA分析:使用R包“WGCNA”构建权重共表达网络:首先,利用基因表达谱构建相似矩阵,在相关系数大于0.8时,选择最优软阈值为7以确保网络为无标度网络;接着将相似矩阵转换为邻接矩阵,然后再将邻接矩阵转换为拓扑重叠矩阵;基于TOM,采用层次聚类的average-linkage方法,按照混合动态剪切树的标准,设置每个基因网络模块最少基因数目为30,模块分割灵敏度为3,以及模块最大距离为0.25,将基因聚类成不同模块,接着,对每个模块在表达谱中的第一主成分确定模块特征,并计算模块特征与性状的相关性,最终形成可识别的关键模块skyblue;
c.从GSE39582数据集skyblue模块中进行预后相关基因的筛选:
使用R软件包“survival”,整合生存时间、生存状态和基因表达数据,利用cox方法评估每个基因的预后显著性;
d.结直肠癌免疫治疗预测标志物的构建方法:
d1.预后lasso变量轨迹的建立:使用R软件包中的glmnet对清洗过后的GSE39582数据进行分析得到变量系数值、λ对数值、L1正则化值,并对数据进行可视化;
d2.预后lasso系数筛选:使用R软件包中的glmnet包对清洗过后的GSE39582数据进行分析得到变量λ值、最大似然数或C指数并对数据进行可视化;
e.免疫治疗预测标志物的预后效果评估:
根据预后标志物风险评分将GSE39582中患者分为两组,使用R软件包“survival”的“survfit”函数分析两组患者预后差异,并使用logrank检验方法评估差异显著性;随后,利用R软件包“pROC”的“ROC”函数在1年、3年和5年三个时间点进行ROC分析,并使用“ci”函数评估曲线下面积和置信区间,获得最终AUC结果。
f.免疫治疗标志物预测疗效与验证:
使用TIDE预测免疫治疗响应;根据预后标志物风险分数将GSE39582中结直肠癌患者分为2组,计算高、低风险组间免疫治疗响应率的差异;然后,利用CRC_TCGA、GSE38832、GSE14333和GSE17536数据集验证免疫治疗预测效果。
2.根据权利要求1所述的结直肠癌免疫治疗预测标志物的构建方法,其特征在于,所述关键模块skyblue包含614个基因。
3.根据权利要求1所述的结直肠癌免疫治疗预测标志物的构建方法,其特征在于,所述步骤c中,免疫治疗预测标志物风险分数计算公式为:
Riskscore=IRF8×(-0.09)+USP30-AS1×(-0.19)+CXCL13×(-0.07)+TNFRSF14×(-0.08)+RENBP×(0.17)+HS3ST2×(0.10)+SP140×(-0.01)+DGKD×(-0.07)+GPR137B×(0.03)+EPHB2×(-0.02)+CTSB×(0.03)+FHDC1×(-0.05)+CD36×(0.08)+HSD17B7×(-0.06)+SERTAD1×(0.01)+DUSP5×(0.03)+HES1×(-0.02)
4.一种结直肠癌免疫治疗预测标志物的构建方法的应用,其特征在于,利用线上工具TIDE预测免疫治疗响应;根据风险分数将各数据集中的患者分为2组,计算高、低风险组间免疫治疗响应率的差异。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310599226.7A CN116805509A (zh) | 2023-05-25 | 2023-05-25 | 结直肠癌免疫治疗预测标志物的构建方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310599226.7A CN116805509A (zh) | 2023-05-25 | 2023-05-25 | 结直肠癌免疫治疗预测标志物的构建方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116805509A true CN116805509A (zh) | 2023-09-26 |
Family
ID=88079150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310599226.7A Pending CN116805509A (zh) | 2023-05-25 | 2023-05-25 | 结直肠癌免疫治疗预测标志物的构建方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116805509A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872776A (zh) * | 2019-02-14 | 2019-06-11 | 辽宁省肿瘤医院 | 一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法及其应用 |
CN113969315A (zh) * | 2020-07-23 | 2022-01-25 | 碳逻辑生物科技(香港)有限公司 | 用于评估结直肠癌患者对免疫治疗药物响应性的标志物 |
CN116030880A (zh) * | 2022-11-01 | 2023-04-28 | 苏州科技大学 | 用于结直肠癌预后风险预测的生物标志物、模型及其应用 |
-
2023
- 2023-05-25 CN CN202310599226.7A patent/CN116805509A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872776A (zh) * | 2019-02-14 | 2019-06-11 | 辽宁省肿瘤医院 | 一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法及其应用 |
CN113969315A (zh) * | 2020-07-23 | 2022-01-25 | 碳逻辑生物科技(香港)有限公司 | 用于评估结直肠癌患者对免疫治疗药物响应性的标志物 |
CN116030880A (zh) * | 2022-11-01 | 2023-04-28 | 苏州科技大学 | 用于结直肠癌预后风险预测的生物标志物、模型及其应用 |
Non-Patent Citations (1)
Title |
---|
张琪 等: "结直肠癌免疫治疗生物标志物研究进展", 肿瘤综合治疗电子杂志, no. 02, 30 April 2020 (2020-04-30) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | Computed tomography-based deep-learning prediction of neoadjuvant chemoradiotherapy treatment response in esophageal squamous cell carcinoma | |
CN112185569B (zh) | 一种乳腺癌患者无病生存期预测模型及其构建方法 | |
US20120066163A1 (en) | Time to event data analysis method and system | |
CN111128299B (zh) | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 | |
CN112289455A (zh) | 一种人工智能神经网络学习模型构建系统、构建方法 | |
US20110282819A1 (en) | Data analysis method and system | |
Wang et al. | Identification and validation of a prognostic 9-genes expression signature for gastric cancer | |
CN111128385B (zh) | 一种用于食管鳞癌的预后预警系统及其应用 | |
Alqudah | Ovarian cancer classification using serum proteomic profiling and wavelet features a comparison of machine learning and features selection algorithms | |
CN111440869A (zh) | 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用 | |
CN115410713A (zh) | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 | |
CN110916666B (zh) | 一种预测手术切除肝细胞癌复发的影像组学特征处理方法 | |
CN115896242A (zh) | 一种基于外周血免疫特征的癌症智能筛查模型及方法 | |
Liang et al. | A radiomics model that predicts lymph node status in pancreatic cancer to guide clinical decision making: A retrospective study | |
Bhardwaj et al. | Deep learning techniques in gastric cancer prediction and diagnosis | |
Nath et al. | A survey on cancer prediction and detection with data analysis | |
CN110942808A (zh) | 一种基于基因大数据的预后预测方法及预测系统 | |
Abreu et al. | Personalizing breast cancer patients with heterogeneous data | |
CN116805509A (zh) | 结直肠癌免疫治疗预测标志物的构建方法及应用 | |
WO2011119967A2 (en) | System,method and computer-accessible medium for evaluating a maliganacy status in at-risk populations and during patient treatment management | |
Trivedi et al. | Changing Landscape of Clinical-Genomic Oncology Practice. | |
Dong et al. | Development of a novel deep learning-based prediction model for the prognosis of operable cervical cancer | |
Ead et al. | Feedforward Deep Learning Optimizer-based RNA-Seq Women's Cancers Detection with a Hybrid Classification Models for Biomarker Discovery | |
Li et al. | Identification and validation of a radiomic signature for predicting survival outcomes in non-small-cell lung cancer treated with radiation therapy | |
Patel et al. | Predicting Mutation Status and Recurrence Free Survival in Non-Small Cell Lung Cancer: A Hierarchical ct Radiomics–Deep Learning Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |