CN113066585A - 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 - Google Patents
一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 Download PDFInfo
- Publication number
- CN113066585A CN113066585A CN202110244943.9A CN202110244943A CN113066585A CN 113066585 A CN113066585 A CN 113066585A CN 202110244943 A CN202110244943 A CN 202110244943A CN 113066585 A CN113066585 A CN 113066585A
- Authority
- CN
- China
- Prior art keywords
- stage
- prognosis
- model
- colorectal cancer
- irgcrc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法及IRGCRCⅡ预后模型的构建方法,采用IRGCRCⅡ预后模型对Ⅱ期结直肠癌患者预后进行评估,所述IRGCRCⅡ预后模型包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF免疫基因。本发明所构建的IRGCRCⅡ预后模型以高表达的Ⅱ期结直肠癌患者体内6种免疫基因含量测定为基础来进行构建的用于评估Ⅱ期CRC患者预后的基因模型工具,为Ⅱ期结直肠癌患者生存结局的评估提供了新的评价体系,并对患者是否进行化学治疗等治疗方案的选择提供了新的依据。
Description
技术领域
本发明涉及医学技术领域,尤其涉及一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法。
背景技术
结直肠癌(CRC)是全球第三大常见的癌症,也是癌症相关死亡的主要原因,仅2018年就有180万新发病例和88万CRC患者死亡。外科手术是治疗结直肠癌的基础,但约20%的Ⅱ期CRC患者术后复发。虽然术后辅助化疗现在是Ⅲ期CRC的标准治疗方法,但在Ⅱ期CRC中化疗的益处仍然存在争议。因此,构建新的特征以预测不同的预后是必要的,并且有助于在II期CRC中选择合适的治疗方案。肿瘤免疫微环境与肿瘤的发生、发展有着密不可分的联系,而免疫相关基因(IRGs)分子特征可能预示着肿瘤免疫微环境中的免疫失调。
因此,IRGs在肿瘤免疫微环境中的分子标志物可以作为II期CRC预后的生物标志物,发挥重要价值。自从临床实践中提出预后模型的概念以来,基于大规模基因表达数据集的基因特征模型的建立在各种癌症中得到了广泛的研究。预测基因模型的构建可以有效地对患者进行分层,并制定个性化的治疗策略。因此,各种预后IRGs模型已被报道在多种癌症类型。例如,基于肝癌基因组图谱(TCGA)构建的由7个IRGs组成的模型,用于预测肝癌的生存率。在宫颈癌、卵巢癌、甲状腺乳头状癌、浸润性导管癌、肺癌、胃癌等方面,基于IRGs的类似预后模型也有报道。这些研究显示了预后IRGs模型在预测生存率方面的有效性。
发明内容
因此,基于以上背景,本发明旨在建立这种基于IRGs的预后模型来对Ⅱ期结直肠患者进行预后评估,以为临床上II期CRC患者治疗方式选择提供更为科学与针对性的依据。
本发明的技术方案为:
一种基于免疫基因表达特征谱对Ⅱ期结直肠患者预后进行高效快捷评估的方法,采用IRGCRCⅡ预后模型对Ⅱ期结直肠患者预后进行评估,所述IRGCRCⅡ预后模型包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF免疫基因。
进一步地,所述IRGCRCⅡ预后模型构建方法步骤为:
S1:患者信息获取:从TCGA数据库获取结直肠患者的基因表达谱(数据等级3)和临床数据;从GEO数据库获取GSE39582微阵列数据集中符合诊断标准的II期CRC转录组数据及临床数据;从ImmPort数据库中获得免疫相关基因(IRGs);对选自TCGA数据库和GEO数据库的GSE39582数据集的患者进行筛选,将符合诊断标准的Ⅱ期结直肠患者纳入分析;
S2:转录组数据处理和差异分析:使用统计学软件R中的“limma”包对步骤S1筛选的Ⅱ期结直肠患者转录组数据进行处理,去除在样本中表达过低或没有表达的基因;符合条件的基因依次进行肿瘤样本和正常样本之间的差异表达分析,并将差异表达倍数大于两倍,并具有统计学意义的基因筛选出来;然后将筛选出的差异基因与从Immport数据库下载的IRGs取交集,从而获得差异表达的274个免疫相关基因(DEIRGs);
S3:IRGCRCⅡ预后模型的开发与应用
①IRGCRCⅡ预后模型的开发:
将临床资料完整的Ⅱ期结直肠患者进行预后分析:采用机械学习法,将步骤S1中筛选的TCGA数据集中的Ⅱ期结直肠患者按7:3的比例分为训练组和测试组,基于训练组的数据,使用单变量Cox回归分析确定与生存相关的15个DEIRGs,然后使用最小绝对收缩和选择算子(LASSO)Cox惩罚回归模型最小化过度拟合,进一步缩小单变量Cox回归分析的DEIRGs范围,并使用R软件包“glmnet”确定与生存最相关的13个DEIRGs,然后进行多因素Cox回归分析,并采用逐步回归的方法将Akaike信息准则(AIC)引入到多元分析中,依次剔除一个变量,降低AIC值,直到出现最小的AIC值,得到包含6个DEIRGs(CCL28、FGF18、IL23A、LIF、SLIT2和VGF)的最优模型,即为IRGCRCⅡ预后模型,所述IRGCRCⅡ预后模型中包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF的基因系数βi;
所述CCL28的基因系数为-0.19,所述FGF18的基因系数为0.351,所述IL23A的基因系数为0.501,所述LIF的基因系数为0.766,所述SLIT2的基因系数为0.179,所述VGF的基因系数为0.384。
②IRGCRCⅡ预后模型的应用:根据IRGCRCⅡ预后模型中各基因的系数和患者基因表达水平,来对每个患者的IRGCRCⅡ风险评分进行计算,风险评分计算公式为:
所述风险评分的具体计算公式为:风险评分=(-0.190×CCL28)+(0.351×FGF18)+(0.501×IL23A)+(0.766×LIF)+(0.179×SLIT2)+(0.384×VGF)。
进一步地,步骤S1中的临床数据包括年龄,性别,肿瘤分期,化疗,生存时间和生存状态。
进一步地,步骤S1的诊断标准为美国癌症联合委员会(AJCC)第8版确定的II期CRC患者的诊断标准。
进一步地,步骤S2中基因筛选标准为:错误发现率(FDR)<0.01和|log2foldchange(FC)|>1。
采用上述技术方案,具有的有益效果如下:
本发明所构建的IRGCRCⅡ预后模型以高表达的Ⅱ期结直肠患者体内6种免疫基因含量测定为基础来进行构建的用于评估Ⅱ期CRC患者预后的基因模型工具,为Ⅱ期结直肠患者生存结局的评估提供了新的评价体系,并对患者是否进行化学治疗等治疗方案的选择提供了新的依据。此外,经对比分析,本发明与FDA批准的OncotypeDX colon模型相比,本发明的模型在预测效果上更好。并且目前基因检测技术在临床的广泛的应用,进一步地为本发明构建的IRGCRCⅡ预后模型的预后评估的应用提供了保障,本发明具有一定的实施基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1:为本发明筛选的DEGs的基因;(请对各图给予合适的命名)
图2:为识别DEIRG并构建IGCRCⅡ模型;
图3:为IGCRCⅡ模型预测价值的分组分析;
图4:为总体组中高风险组和低风险组患者的风险评分分布和生存状态及模型预测效能评估;
图5:为训练组与验证组中高风险组和低风险组患者的风险评分分布和生存状态,以及IGCRCⅡ模型与OncotypeDX模型预测效能对比;
图6:为诺莫图临床预测模型的构建;
图7:为IRGCRCⅡ预后模型与临床病理特征分析;
图8:为临床标本验证模型基因表达。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:IRGCRCⅡ预后模型构建方法步骤为:
S1:患者信息获取:从TCGA数据库获取CRC患者的基因表达谱(数据等级3)和临床数据;从GEO数据库获取GSE39582微阵列数据集中符合诊断标准的II期CRC转录组数据及临床数据;从ImmPort数据库中获得免疫相关基因(IRGs);对选自TCGA数据库和GEO数据库的GSE39582数据集的患者进行筛选,将符合美国癌症联合委员会(AJCC)第8版确定的II期CRC患者的诊断标准的癌患者纳入分析,来自TCGA数据库的有201例,来自于GEO数据库的GSE39582数据集的有466例(见表1);上述临床数据包括年龄,性别,肿瘤分期,化疗,生存时间和生存状态。
表1:患者人口统计学和临床特征一
(一)S2:转录组数据处理和差异分析:使用统计学软件R中的“limma”package对步骤S1筛选的Ⅱ期CRC患者转录组数据进行处理,去除在样本中表达过低或没有表达的基因;符合条件的基因依次进行肿瘤样本和正常样本之间的差异表达分析,并将差异表达倍数大于两倍,并具有统计学意义的基因筛选出来,具体的筛选标准为错误发现率(FDR)<0.01和|log2fold change(FC)|>1,从而得到了2989个DEGs(图1A);然后将筛选出的差异基因与从Immport数据库下载的IRGs取交集,从而获得差异表达的274个免疫相关基因(DEIRGs)(图1B-C)。
S3:IRGCRCⅡ预后模型的开发、应用与验证:
①IRGCRCⅡ预后模型的开发:
将临床资料完整的Ⅱ期CRC患者进行预后分析:采用机械学习法,将步骤S1中筛选的TCGA数据集中的Ⅱ期CRC患者按7:3的比例分为训练组和测试组,基于训练组的数据,使用单变量Cox回归分析确定与生存相关的15个DEIRGs(图2A),然后使用最小绝对收缩和选择算子(LASSO)Cox惩罚回归模型最小化过度拟合(图2B),进一步缩小单变量Cox回归分析的DEIRGs范围,并使用R软件包“glmnet”确定与生存最相关的13个DEIRGs(图2D),然后进行多因素Cox回归分析,并采用逐步回归的方法将Akaike信息准则(AIC)引入到多元分析中,依次剔除一个变量,降低AIC值,直到出现最小的AIC值,得到包含6个DEIRGs(CCL28、FGF18、IL23A、LIF、SLIT2和VGF)的最优模型,即为IRGCRCⅡ预后模型(图2C),所述IRGCRCⅡ预后模型中包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF的基因系数βi(见表2);
表2:逐步多元Cox回归分析结果
Coef:回归系数;HR:风险比;HR.95L:95%置信区间;HR.95H:95%置信区间。
②IRGCRCⅡ预后模型的应用:根据IRGCRCⅡ预后模型中各基因的系数和表达,来对每个患者的IRGCRCⅡ风险评分进行计算,风险评分计算公式为:
③IRGCRCⅡ预后模型的验证:
将来自于TCGA数据集的总体组(训练组和验证组)作为内部验证组,而步骤S1筛选的GSE39582的Ⅱ期CRC患者作为外部验证组来评估预后模型的有效性;然后根据IRGCRCⅡ预后模型中各基因的系数和表达,计算每个患者的IRGCRCⅡ风险评分。
所述风险评分的具体计算公式为:风险评分=(-0.190×CCL28)+(0.351×FGF18)+(0.501×IL23A)+(0.766×LIF)+(0.179×SLIT2)+(0.384×VGF)。
以风险评分中位数为界值(1.087),将训练组患者分为高风险组和低风险组。采用Kaplan-Meier(K-M)和log-rank检验比较两组患者之间的生存率,K-M生存曲线显示,高风险组的DFS比低风险组差(p<0.001)(图3A)。用R包“survival ROC”进行ROC(受试者工作特征曲线)分析曲线下面积(AUC),评价风险评分预测1、3、5年DFS的特异性和敏感性,结果显示1年、3年和5年DFS的AUC分别为0.759、0.875和0.906(图3E)。同时,风险评分曲线和生存状态图显示,高危组患者预后更差,死亡更多,长期生存期更短(图5A)。此外,IRGCRCⅡ模型通过验证组和总体组以及外部验证组(GSE39582)进一步验证,根据上述风险评分公式,验证组、总体组和外部验证组也被分为高风险组和低风险组。K-M生存曲线显示,在三个队列中,高风险组的DFS显著短于低风险组(p=0.030,p<0.001,p=0.047)(图3B-D)。验证组的ROC分析显示,1年、3年和5年DFS的AUC分别为0.726、0.758和0.708(图3F)。总体组的ROC分析显示,1年、3年和5年DFS的AUC分别为0.755、0.840和0.823(图4A)。此外,验证组和总体组的风险评分曲线和生存状态图与训练组的结果相似(图5B和图4B)。
本发明通过6个免疫基因(CCL28,FGF18,IL23A,LIF,SLIT2和VGF)在模型中的系数与患者基因检测结果中6个免疫基因表达量的乘积得到患者的危险评分,并根据模型中位风险评分(1.087),将患者分为高风险组和低风险组。采取多种评估方式证实与低风险组相比,高风险组患者的预后更差,因此,可以用做临床中评估II期CRC患者预后的工具。
实施例2:将本发明IRGCRCⅡ预后模型与OncotypeDX结肠模型的比较
为了进一步评估IRGCRCⅡ预后模型预测生存率的准确性,本实施例将其与在II期CRC肠癌中应用最广泛的基因标志物OncotypeDX结肠模型进行了比较。采用两种模型对训练队列进行ROC分析,评价生存预测的敏感性和特异性。IRGCRCⅡ预后模型的AUCs分别在1年(0.759vs.0.623)、3年(0.875vs.0.629)和5年(0.906vs.0.698)时显著高于OncotypeDX结肠模型,表明IRGCRCⅡ模型具有更好的预后准确性(图5C-E)。
实施例3:IRGCRCⅡ预后模型与临床病理特征的关系
为了进一步评估IRGCRCII模型在预测预后中的作用,本实施例将IRGCRCII风险评分和一些常见的临床病理特征如年龄、性别、T分期和化疗纳入预后相关分析。在训练组中,单变量Cox回归分析显示年龄、化疗和风险评分与患者生存率显著相关(图6A)。多变量Cox回归分析显示年龄(危险比(HR)=1.034,95%可信区间(CI)=1.000–1.068,p=0.047)和风险评分(HR=1.184,95%CI=1.113–1.260,p<0.001)是II期大肠癌的独立预后因素(图6B)。在总体组中,本实施例中通过单变量和多变量Cox分析发现风险评分可以作为II期CRC的独立预后因素(图7A-B)。
实施例4:构建诺莫图
为了开发一种定量方法来预测临床环境中II期大肠癌患者的预后,本实施例建立了一个诺模图,整合了临床病理特征和训练队列中的IRGCRCII风险评分(图6C)。其中年龄对预后的影响最大,其次是风险评分、T分期、性别和化疗。1年、3年和5年DFS的校准曲线接近标准曲线,一致性指数(C指数)为0.779,表明模型性能良好(图6D-F)。
实施例5:IRGCRCⅡ预后模型的GSEA和转录因子(TFs)调节网络分析
为了评估IRGCRCⅡ模型对生物学特性的影响,本实施例利用GSEA(4.1.0版)软件分析KEGG通路中高危组和低危组基因的富集情况。通过模拟1000个随机基因集的排列,得到富集p值。统计学差异的阈值为FDR<0.05。结果表明,11条KEGG途径显著富集。高风险组在轴突导向、GNRH信号通路、MAPK信号通路、黑素生成、血管平滑肌收缩和VEGF信号通路方面表现出显著的富集,而低风险组在细胞周期功能、DNA复制、同源重组,错配修复和核苷酸切除修复方面显著富集(图7C)。TFs数据从Cistrome癌症数据库下载(http://cistrome.org/CistromeCancer/)。该数据库通过系统建模方法将可公开获取的染色质分析数据与TCGA数据相结合,以深入分析控制癌症基因表达异常模式的转录和表观遗传因素。我们对318个TF进行了差异表达分析,得到66个差异表达的TFs,筛选条件为TFs满足p<0.05和|log2FC|>1。以相关系数>0.4和p<0.05作为阈值,对IRGCRCⅡ中差异表达的TFs与免疫基因进行相关分析。最终,IRGCRCⅡ模型中3个基因和9个差异表达的TFs之间的调节关系在网络中显示,使我们能够探索控制II期CRC中基因表达异常模式的转录和表观遗传因素(图7D)。
实施例6:临床病理标本验证IRGCRCⅡ预后模型
病理诊断为Ⅱ期CRC的30对原发肿瘤和配对正常组织来自中山大学附属第六医院组织库(见表3)。这些患者没有接受任何术前化疗、放疗或免疫治疗。所有患者均获得知情同意,本研究经中山大学附属第六医院医学伦理委员会批准。采用定量逆转录聚合酶链反应(qRT-PCR)对临床标本中IRGCRCⅡ的免疫基因表达进行定量分析。根据制造商的说明,用TRIzol试剂(Invitrogen,USA)从上述60个组织样品中提取总RNA,并使用NanoDrop 2000分光光度计(Thermo Scientific,USA)检测RNA的OD260/OD280。只有当RNA的OD260/OD280在1.8到2.0之间时,RNA才使用逆转录试剂盒(FSQ-301,Toyobo,Japan)用于随后的逆转录。使用Applied Biosystems 7500Real-time PCR system和SYBR Green Real-time PCRMaster Mix(QPK-201,Toyobo,Japan)在10μl反应体积中进行逆转录。以磷酸甘油醛脱氢酶(GAPDH)标准化后计算IRGCRCⅡ中各基因的相对表达。从上述60个组织标本的福尔马林固定石蜡包埋(FFPE)组织块上切取4μm组织切片。在用二甲苯脱蜡并用分级酒精系列再水化后,将切片在4℃下与抗体(FGF18、LIF、IL23A、SLIT2)在加湿容器中培养过夜,然后在室温下与适当的二级抗体培养30分钟。切片用3,3′-二氨基联苯胺四盐酸盐(DAB)加0.05%H2O2染色3min后观察。在每个实验中评估固定阳性和阴性对照,以控制各批实验中的染色变异性。免疫反应评分系统(HSCORE,0-3级)用于组织中蛋白质水平的半定量评估。简单地说,染色强度分级(0,无;1,弱;2,中等;3,强)。HSCORE的计算公式为:HSCORE=∑Pi×i,其中i为染色强度,Pi为各强度水平对应细胞的百分比。每个数据点反映了两位经验丰富的病理学家的平均得分,他们对所有临床病理变量不知情。结果显示与癌旁组织相比,FGF18、IL23A、LIF和VGF在肿瘤组织中显著升高,而CCL28和SLIT2则显著下调(图8A-F)。六个基因的表达水平也显示在热图中(图8G)。免疫组化(IHC)检测FGF18、IL23A、LIF和SLIT2的蛋白表达水平。结果表明,肿瘤组织中FGF18、IL23A和LIF的平均HScore显著高于正常组织(P<0.05),而SLIT2则相反(图8H)。
表3:临床患者人口统计学和临床特征二
以上对本发明及其实施方式进行了描述,这种描述没有限制性,上述实施例中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
Claims (5)
1.一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法,其特征在于,采用IRGCRCⅡ预后模型对Ⅱ期结直肠癌患者预后进行评估,所述IRGCRCⅡ预后模型包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF免疫基因。
2.根据权利要求1所述的一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法,其特征在于,
所述IRGCRCⅡ预后模型构建方法步骤为:
S1:患者信息获取:从TCGA数据库获取结直肠癌患者的基因表达谱(数据等级3)和临床数据;从GEO数据库获取GSE39582微阵列数据集中符合诊断标准的II期结直肠癌转录组数据及临床数据;从ImmPort数据库中获得免疫相关基因(IRGs);对选自TCGA数据库和GEO数据库的GSE39582数据集的患者进行筛选,将符合诊断标准的Ⅱ期结直肠癌患者纳入分析;
S2:转录组数据处理和差异分析:使用统计学软件R中的“limma”包对步骤S1筛选的Ⅱ期结直肠癌患者转录组数据进行处理,去除在样本中表达过低或没有表达的基因;符合条件的基因依次进行肿瘤样本和正常样本之间的差异表达分析,并将差异表达倍数大于两倍,并具有统计学意义的基因筛选出来;然后将筛选出的差异基因与从Immport数据库下载的IRGs取交集,从而获得差异表达的274个免疫相关基因(DEIRGs);
S3:IRGCRCⅡ预后模型的开发与应用
①IRGCRCⅡ预后模型的开发:
将临床资料完整的Ⅱ期结直肠癌患者进行预后分析:采用机械学习法,将步骤S1中筛选的TCGA数据集中的Ⅱ期结直肠癌患者按7:3的比例分为训练组和测试组,基于训练组的数据,使用单变量Cox回归分析确定与生存相关的15个DEIRGs,然后使用最小绝对收缩和选择算子(LASSO)Cox惩罚回归模型最小化过度拟合,进一步缩小单变量Cox回归分析的DEIRGs范围,并使用R软件包“glmnet”确定与生存最相关的13个DEIRGs,然后进行多因素Cox回归分析,并采用逐步回归的方法将Akaike信息准则(AIC)引入到多元分析中,依次剔除一个变量,降低AIC值,直到出现最小的AIC值,得到包含6个DEIRGs(CCL28、FGF18、IL23A、LIF、SLIT2和VGF)的最优模型,即为IRGCRCⅡ预后模型,所述IRGCRCⅡ预后模型中包含CCL28、FGF18、IL23A、LIF、SLIT2和VGF的基因系数βi;
②IRGCRCⅡ预后模型的应用:根据IRGCRCⅡ预后模型中各基因的系数和患者基因表达水平,来对每个患者的IRGCRCⅡ风险评分进行计算,风险评分计算公式为:
所述风险评分的具体计算公式为:风险评分=(-0.190×CCL28)+(0.351×FGF18)+(0.501×IL23A)+(0.766×LIF)+(0.179×SLIT2)+(0.384×VGF)。
3.根据权利要求2所述的一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法,其特征在于,步骤S1中的临床数据包括年龄,性别,肿瘤分期,化疗,生存时间和生存状态。
4.根据权利要求2所述的一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法,其特征在于,步骤S1的诊断标准为美国癌症联合委员会(AJCC)第8版确定的II期结直肠癌患者的诊断标准。
5.根据权利要求2所述的一种基于免疫基因表达特征谱对Ⅱ期结直肠癌患者预后进行高效快捷评估的方法,其特征在于,步骤S2中基因筛选标准为:错误发现率(FDR)<0.01和|log2fold change(FC)|>1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110244943.9A CN113066585A (zh) | 2021-03-05 | 2021-03-05 | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110244943.9A CN113066585A (zh) | 2021-03-05 | 2021-03-05 | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113066585A true CN113066585A (zh) | 2021-07-02 |
Family
ID=76559927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110244943.9A Withdrawn CN113066585A (zh) | 2021-03-05 | 2021-03-05 | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113066585A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114594259A (zh) * | 2022-04-22 | 2022-06-07 | 北京易科拜德科技有限公司 | 一种新型的用于结直肠癌预后预测和诊断的模型及其应用 |
CN114974598A (zh) * | 2022-06-29 | 2022-08-30 | 山东大学 | 一种肺癌预后预测模型构建方法及肺癌预后预测系统 |
CN115527681A (zh) * | 2022-11-11 | 2022-12-27 | 北京科技大学 | 一种结直肠癌预后预测模型构建方法及装置 |
CN115831216A (zh) * | 2022-08-26 | 2023-03-21 | 中山大学孙逸仙纪念医院 | 一种基于肿瘤免疫微环境的肿瘤免疫治疗疗效预测模型及其构建方法 |
CN116013525A (zh) * | 2023-01-06 | 2023-04-25 | 中国人民解放军军事科学院军事医学研究院 | 一种基于铁死亡特征构建的结直肠癌预后模型及其构建方法 |
-
2021
- 2021-03-05 CN CN202110244943.9A patent/CN113066585A/zh not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114594259A (zh) * | 2022-04-22 | 2022-06-07 | 北京易科拜德科技有限公司 | 一种新型的用于结直肠癌预后预测和诊断的模型及其应用 |
CN114594259B (zh) * | 2022-04-22 | 2022-09-13 | 北京易科拜德科技有限公司 | 一种新型的用于结直肠癌预后预测和诊断的模型及其应用 |
CN114974598A (zh) * | 2022-06-29 | 2022-08-30 | 山东大学 | 一种肺癌预后预测模型构建方法及肺癌预后预测系统 |
CN114974598B (zh) * | 2022-06-29 | 2024-04-16 | 山东大学 | 一种肺癌预后预测模型构建方法及肺癌预后预测系统 |
CN115831216A (zh) * | 2022-08-26 | 2023-03-21 | 中山大学孙逸仙纪念医院 | 一种基于肿瘤免疫微环境的肿瘤免疫治疗疗效预测模型及其构建方法 |
CN115831216B (zh) * | 2022-08-26 | 2023-08-25 | 中山大学孙逸仙纪念医院 | 一种基于肿瘤免疫微环境的肿瘤免疫治疗疗效预测模型及其构建方法 |
CN115527681A (zh) * | 2022-11-11 | 2022-12-27 | 北京科技大学 | 一种结直肠癌预后预测模型构建方法及装置 |
CN116013525A (zh) * | 2023-01-06 | 2023-04-25 | 中国人民解放军军事科学院军事医学研究院 | 一种基于铁死亡特征构建的结直肠癌预后模型及其构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Biswas et al. | A clonal expression biomarker associates with lung cancer mortality | |
CN113066585A (zh) | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 | |
Northcott et al. | Rapid, reliable, and reproducible molecular sub-grouping of clinical medulloblastoma samples | |
Klein et al. | A genomic classifier improves prediction of metastatic disease within 5 years after surgery in node-negative high-risk prostate cancer patients managed by radical prostatectomy without adjuvant therapy | |
Jacquemier et al. | SISH/CISH or qPCR as alternative techniques to FISH for determination of HER2 amplification status on breast tumors core needle biopsies: a multicenter experience based on 840 cases | |
CN109897899B (zh) | 一种用于局部晚期食管鳞癌预后判断的标志物及其应用 | |
CN110577998A (zh) | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 | |
JP2011523049A (ja) | 頭頚部癌の同定、モニタリングおよび治療のためのバイオマーカー | |
WO2008058018A2 (en) | Predicting cancer outcome | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
CN103459597A (zh) | 用于预测胃癌预后的标记和用于预测胃癌预后的方法 | |
CN113366577A (zh) | 通过片段尺寸分析增强的对靶dna的检测 | |
CN113450873A (zh) | 一种预测胃癌预后和免疫治疗适用性的标志物及其应用 | |
CN105874080A (zh) | 用于食道癌的分子诊断测试 | |
CN112331343A (zh) | 建立肝细胞癌术后风险评估模型的方法 | |
EP3950960A1 (en) | Dna methylation marker for predicting recurrence of liver cancer, and use thereof | |
CN109072481A (zh) | 早期乳腺癌内分泌治疗后剩余风险的基因特征 | |
CN112626218A (zh) | 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒 | |
CN110760585B (zh) | 前列腺癌生物标志物及其应用 | |
Hunt et al. | MST1R (RON) expression is a novel prognostic biomarker for metastatic progression in breast cancer patients | |
CA2889276A1 (en) | Method for identifying a target molecular profile associated with a target cell population | |
CA2795242A1 (en) | Gene-based prediction of psa recurrence for clinically localized prostate cancer patients | |
US11732305B2 (en) | Method and kit for diagnosing early stage pancreatic cancer | |
CN116179701A (zh) | 用于预测食管鳞癌免疫治疗疗效的标记基因及其应用 | |
CN116153387A (zh) | 一种肺鳞癌患者总体生存率预后模型及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210702 |
|
WW01 | Invention patent application withdrawn after publication |