CN115141887A - 基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 - Google Patents
基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 Download PDFInfo
- Publication number
- CN115141887A CN115141887A CN202210990262.1A CN202210990262A CN115141887A CN 115141887 A CN115141887 A CN 115141887A CN 202210990262 A CN202210990262 A CN 202210990262A CN 115141887 A CN115141887 A CN 115141887A
- Authority
- CN
- China
- Prior art keywords
- colon cancer
- prognosis
- cells
- secretory
- benefit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Oncology (AREA)
- Physiology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用,属于生物医学领域。本发明通过采用共识聚类分析确定非转移性结肠癌患者肿瘤组织中分泌细胞的富集模式,并基于此通过Boruta算法、LASSO‑COX回归分析筛选特征基因建立基于分泌细胞富集模式的评分模型,SCSscore=FAM13C+PRKD1+AKAP12+A2M+FSTL1‑ASCL2‑FAM74A。该评分模型由7个基因组成,容易转化为临床可用的试剂盒;计算简便,使用方便,评分结果容易理解;不仅是肠癌患者不良预后的独立预测因素,也可有效的鉴别存在化疗抵抗的患者,指导术后辅助化疗的决策,有临床转化意义。
Description
技术领域
本发明涉及生物医学领域,特别是涉及基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用。
背景技术
结肠癌(colon cancer)是常见的危及人类健康的恶性肿瘤之一。尽管外科手术理念与技术已经取得较大的进展,术后辅助化疗依旧是根治术后结肠癌综合治疗中的重要环节,多项研究证实辅助化疗可显著改善患者的生存。然而,尽管辅助化疗的治疗地位已经明确,仍有80%的结肠癌患者于原发灶切除后3年内复发,提示有相当比例的患者似乎并未从中获益,或者获益较少。另外,随着对肿瘤生物学、遗传学、免疫学等特征认识的深入以及“个体化治疗”观念的推广,既往“一招走天下”式的用药模式受到质疑。临床工作者们开始更加关注如何精准地筛选潜在的可获益患者以最终实现围手术期“个体化”治疗,进一步改善患者预后。
目前,基于肿瘤浸润深度(T)、淋巴结转移(N)以及远处转移(M)评估的TNM分期依旧是结肠癌患者临床最常用的预后指标,也是术后是否需要辅助化疗最直接的参考依据。然而长期的临床实践表明,TNM分期的应用存在局限:一是相同TNM分期的不同患者经过相同或类似治疗后,其临床结局亦存在显著差异;二是由于TNM分期仅根据患者的复发风险判断是否应行辅助化疗,缺乏进一步的精确指导,如TNM分期为II期的患者是否应进行辅助化疗,III期患者辅助化疗时程的长短等均是TNM分期无法解决的问题,这表明需要更多的生物标志物补充TNM系统,进一步推动肠癌的精准诊疗进程。
随着高通量检测技术水平的突飞猛进以及文库筛选技术的成熟,人们已经认识到肿瘤生物学特征差异的根源在于基因水平的改变。因此,近年来已有多种基于分子水平的肠癌分型模式被提出,例如“Colorectal Cancer Assigner”,“Colon Cancer Subtype,”和“Consensus Molecular Subtype”等。然而一方面由于这些分型的判定需要用到全基因转录组且有赖于电脑黑箱判定使得临床应用成本高,难以开发成具有临床实用性的检测试剂盒、分型对于临床预后作用的研究结果不一致、对于术后辅助化疗疗效指导作用有限的相应研究数据等原因,这些分型均未成功转化为临床应用。因此,在肠癌辅助化疗获益人群筛选领域中有效的生物标志物依旧匮乏。开发预测精准、使用简便且易于转化的辅助治疗决策模型依旧是亟待解决的难题。
结肠癌在组织病理学上主要分为经典型腺癌、粘液腺癌、印戒细胞癌和其他更不常见的形式(小细胞癌、鳞状细胞癌、腺鳞癌、髓样癌和未分化癌)。然而,尽管一些研究表明,与经典腺癌相比,粘液腺癌和印戒细胞癌的预后更差且对更难以从当前化疗方案中获益,这两种组织病理亚型(粘液腺癌和印戒细胞癌)的患者的治疗模式目前仍遵循与经典腺癌相同的指南标准,即仅基于病理TNM分期制定手术与术后化疗策略。因此,探索粘液腺癌和印戒细胞癌的预后及疗效预测因素对指导相应患者的个体化治疗至关重要。分泌细胞是粘液腺癌和印戒细胞癌的粘液池的主要来源。分泌细胞是一个小的分化群体,主要包括杯状细胞和肠内分泌细胞。二者均来源于LGR5+多能干细胞,其分化途径由Notch信号控制。生理上,为了响应管腔刺激,肠内分泌细胞可分泌多种肽类激素以传统的内分泌方式和旁分泌方式作用于远处器官和邻近细胞,而杯状细胞则主要排出由水、盐、蛋白质组成的粘蛋白颗粒。目前研究认为,成人肠道分泌细胞群的更新依赖于增殖和分化之间的微妙平衡,而这种平衡被破坏是结肠癌的特征之一。
目前尚不清楚结肠腺癌中存在的杯状细胞和肠内分泌细胞是否在功能上促进肿瘤进展,研究结论相互矛盾。例如,尽管一些研究报道结肠癌粘膜中杯状细胞的数量显著低于正常组织,但杯状细胞也被认为是促进肿瘤进展的关键因素,因为它们可以产生对细胞存活和化疗耐药至关重要的分泌肽(如MUC2和TFF3);杯状细胞的标记分子也被发现高表达于BRAF突变型结肠癌组织,这是一种高度侵袭性的疾病亚型。此外,肿瘤内表达癌症相关转录因子Brachyury的肠内分泌细胞子集可能代表具有癌症干细胞特性(例如肿瘤侵袭性和耐药性)的细胞群。在分泌细胞和肿瘤微环境关联方面,已被大量研究证实的肠道炎症过程中分泌细胞和免疫细胞之间的机制和生化交互作用,也提示了分泌细胞在形成结肠癌肿瘤微环境异质性中的潜在作用。因此,更全面地了解分泌细胞和免疫细胞之间的相互作用将有助于加深我们对癌症免疫的理解。目前尚无基于肠癌组织中粘液细胞的富集状态开发结肠癌预后预测及辅助化疗决策模型的相关研究报道和专利。
发明内容
本发明第一个目的是提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的生物标志物,以解决上述技术问题,该标志物可通过量化结肠癌患者的肿瘤组织分泌细胞的富集模式,有效识别预后差且无法从辅助化疗获益的一类特定分泌细胞富集模式的肠癌患者群体,鉴别的准确率在不同数据集中分别为96%(合并GEO结肠癌数据库)、96%(TCGA结肠癌数据库)。
本发明第二个目的是提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的试剂盒,对于临床检测结肠癌预后及辅助化疗获益效果具有重要意义。
本发明第三个目的是提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型,利于预测非转移性肠癌患者的预后以及指导非转移性肠癌的个体化辅助化疗。
本发明第四个目的是提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型的构建方法,通过该方法筛选出7个特征基因并构建评分模型,为预测结肠癌预后及辅助化疗获益奠定基础。
本发明第五个目的是提供评分模型在设计预测结肠癌预后及辅助化疗获益系统或者装置中应用,通过构建的评分模型结合系统或装置辅助预测结肠癌预后及辅助化疗获益的效果。
为实现上述目的,本发明提供了如下方案:
本发明提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的生物标志物,所述生物标志物包括基因ASCL2,FAM84,FAM13C,PRKD1,AKAP12,A2M以及FSTL1。
本发明还提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的试剂盒,包括检测所述的生物标志物中的7个基因转录表达水平的试剂。
所述试剂盒包括核酸提取试剂、PCR试剂、基因组/转录组测序试剂、基因特异性引物或探针、基因表达产物的特异性抗体中的一种或多种。所述试剂盒还包括样品处理剂、如样品裂解试剂、样品纯化试剂及核酸提取试剂等。所述试剂是本领域已知的任何可用于检测基因表达水平的试剂在具体的实施方案中,所述试剂是用于执行以下一种或多种方法的试剂:通过测序技术、核酸杂交技术、核酸扩增技术等检测基因的转录表达水平。
转录组测序可通过二代测序平台快速全面地获得某一物种特定细胞或组织在某一状态下的几乎所有的转录本及基因序列,可以用于研究基因表达量、基因功能、结构、可变剪接和新转录本预测等。此外,通过设计合适的引物,可以通过PCR如逆转录PCR测定基因的转录表达水平。还可以使用基因蛋白特异性抗体,通过免疫测定例如免疫组化、ELISA等方法测定各基因的蛋白表达水平。
本发明还提供检测所述的生物标志物的试剂在制备预测结肠癌预后和辅助化疗获益的试剂盒中的应用。
本发明还提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型,所述评分模型以所述的生物标志物表达水平作为输入变量,用以评估预测结肠癌预后及辅助化疗获益;其中,所述评分模型使用如下公式计算结肠癌预后及辅助化疗获益评分:SCS score=FAM13C+PRKD1+AKAP12+A2M+FSTL1-ASCL2-FAM74A。
本发明还提供一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型的构建方法,包括以下步骤:
(1)采用共识聚类分析确定非转移性结肠癌患者肿瘤组织中分泌细胞的富集模式;
(2)基于步骤(1)所述富集模型的分析结果,通过Boruta算法、LASSO-COX回归分析筛选具有预后指示价值的特征基因,构建基于分泌细胞富集模式的评分模型;
所述特征基因包括基因ASCL2,FAM84,FAM13C,PRKD1,AKAP12,A2M以及FSTL1。
优选的是,所述分泌细胞包括肠内分泌细胞、1型杯状细胞和2型杯状细胞。
优选的是,所述非转移性结肠癌患者肿瘤组织中分泌细胞的富集模式具体为:所述分泌细胞将所述非转移性结肠癌患者分为分泌细胞亚型1、分泌细胞亚型2、分泌细胞亚型3和分泌细胞亚型4;其中,分泌细胞亚型1患者表现为肠内分泌细胞与2型杯状细胞的中度富集,分泌细胞亚型2表现为肠内分泌细胞与2型杯状细胞的高度富集,分泌细胞亚型3表现为肠内分泌细胞与2型杯状细胞的缺失,分泌细胞亚型4表现为1型杯状细胞的高度富集。
优选的是,所述评分模型的公式为:
SCS score=FAM13C+PRKD1+AKAP12+A2M+FSTL1-ASCL2-FAM74A。
本发明还提供所述的评分模型在设计预测结肠癌预后及辅助化疗获益系统或者装置中的应用。
优选的是,所述评分模型通过如下判断标准预测结肠癌预后及辅助化疗获益:当所述评分模型的公式得到的结果>cut-off时,判定为预后高风险人群,对化疗存在抵抗,不推荐单独使用辅助化疗;当所述评分模型的公式得到结果≤cut-off时,判定为预后低风险人群,可从辅助化疗中获益;所述cut-off值是指将评分结果由大到小排位后前1/3与后2/3的交界值。
本发明公开了以下技术效果:
本发明基于共识聚类分析量化非转移性肠癌患者肿瘤组织分泌细胞的富集模式,有效识别预后差及无法从辅助化疗获益的一类特定组蛋白修饰模式的肠癌患者群体;结合Boruta算法、LASSO-COX回归分析筛选出仅有7个基因组成的评分模型,该评分模型实现了鉴别的准确率在不同数据集中分别为96%(合并GEO结肠癌数据库)、96%(TCGA结肠癌数据库)。
本发明构建的评分模型可预测非转移性肠癌患者的预后(包括复发风险和死亡风险),是患者预后预测的独立风险因素;还可以有效的鉴别存在化疗抵抗的患者,指导术后辅助化疗的决策,具有临床转化意义。
本发明构建的评分模型鉴别可从以氟尿嘧啶为基础的辅助化疗中获益的非转移性肠癌患者,指导非转移性肠癌的个体化辅助化疗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为结肠癌组织中三种分泌细胞含量之间的相关性;A:meta-GEO中分泌细胞含量相关性矩阵热图;B:TCGA-COAD中分泌细胞含量相关性矩阵热图;A和B中圆圈的颜色和大小代表相关性系数大小;C:分泌细胞含量与患者预后关联的森林图;
图2为结肠癌分泌细胞富集分型的热图;A:meta-GEO队列;B:TCGA-COAD队列;
图3为结肠癌分泌细胞富集分型在meta-GEO队列中与结肠癌患者RFS和OS的相关性;A:在meta-GEO队列中,不同分泌细胞富集分型的RFS生存曲线;B:在meta-GEO队列中,不同分泌细胞富集分型的OS生存曲线;C:在GSE39582中未接受辅助化疗的患者队列中,不同分泌细胞富集分型的OS生存曲线;D:在GSE39582中接受辅助化疗的患者队列中,不同分泌细胞富集分型的OS生存曲线;
图4为结肠癌分泌细胞富集分型在TCGA-COAD队列中与结肠癌患者OS的相关性;A:在TCGA-COAD队列中,不同分泌细胞富集分型的OS的生存曲线;B:在TCGA-COAD中未接受辅助化疗的患者队列中,不同分泌细胞富集分型的OS生存曲线;C:在TCGA-COAD中接受辅助化疗的患者队列中,不同分泌细胞富集分型的OS生存曲线;
图5为结肠癌分泌细胞富集分型与辅助化疗获益的森林图;
图6为不同结肠癌分泌细胞富集分型的基于CTRP2.0数据库的氟尿嘧啶化疗敏感性;A:meta-GEO队列;B:TCGA-COAD队列;
图7为SCS score模型中的组成基因在不同分泌细胞富集分型中的表达;
图8为meta-GEO数据集中SCS score得分在不同分泌细胞富集分型中的分布(A),以及meta-GEO数据集中SCS score得分对于SCS2型患者的鉴别作用(B);
图9为TCGA-COAD数据集中SCS score得分在不同分泌细胞富集分型中的分布(A),以及TCGA-COAD数据集中SCS score得分对于SCS2型患者的鉴别作用(B);
图10为SCS score在meta-GEO队列的临床应用情况;A:对RFS的作用;B:对OS的指示作用;C:辅助化疗在不同SCS score组的获益;D:对氟尿嘧啶抵抗患者的鉴别作用;
图11为SCS score在TCGA-COAD队列的临床应用情况;A:对OS的指示作用;B:辅助化疗在不同SCS score组的获益;C:对氟尿嘧啶抵抗患者的鉴别作用;
图12为SCS score在TCGA-COAD队列的临床应用情况;A:与肠内分泌细胞、1型杯状细胞、2型杯状细胞含量的相关性;B:对氟尿嘧啶抵抗患者的鉴别。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为还具体公开了该范围的上限和下限之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。
在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见的。本申请说明书和实施例仅是示例性的。
关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
实施例1鉴定结肠癌患者肿瘤组织中分泌细胞的含量及临床相关性
1、结肠癌公共数据集的下载与整理
分别从NCBI的Gene Expression Omnibus(GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)与TCGA数据库下载非转移肠癌患者的转录组数据。其中,从GEO数据库下载的数据集分别包括:GSE17538、GSE33113、GSE37892、GSE38832、GSE39582。这些数据集的共同特征为:①样品使用的检测芯片均为昂飞HG-U133 Plus2.0(GEOaccession number GPL570);②每个数据集包含的I-III期肠癌患者人数均大于50人;③数据集中的每个患者均有TNM分期信息。每个数据集所包含的患者临床信息将通过“GEOquery”包获取。各数据集的原始表达谱数据全部利用全局归一化(robust multiarrayaveraging,RMA)的方法进行预处理校正,并使用sva包的combat函数对批次效应进行去除合并,形成合并GEO结肠癌数据库(meta-GEO)数据。TCGA数据库中的结肠癌转录组count数据于UCSC xena网站中“TCGA Colon Cancer(COAD)(25datasets)”条目栏下载并进行VOOM转化,形成TCGA结肠癌数据库(TCGA-COAD)。GEO与TCGA数据集附带的临床数据分别通过“GEOquery”包和UCSC xena网站下载,整理对应至样本的转录组数据后去除IV期患者的数据形成待分析数据集,其中meta-GEO数据集包含988名患者样本,TCGA-COAD数据集包含382名患者样本。
2、解析结肠癌组织中分泌细胞的富集含量并探索不同类型分泌细胞的含量与肿瘤微环境构成、生物学意义与临床相关性的联系
使用文献报道的分泌细胞的特征性标志物,在R软件中运用IOBR包中的主成分分析(PCA)算法,对meta-GEO结肠癌数据集中的988名结肠癌患者和TCGA-COAD数据集中382名结肠癌患者肿瘤组织中分泌细胞的含量进行解析。所用的标志物来源于Gao等通过单细胞测序解析成人肠粘膜组织识别的三类分泌细胞的特征基因,分别是:肠内分泌细胞、1型杯状细胞、2型杯状细胞。
如图1所示,通过相关性分析显示,肠内分泌细胞与2型杯状细胞的含量高度显著正相关,而1型杯状细胞的浸润独立于上述两种细胞。进一步临床相关性分析表明,肠内分泌细胞与2型杯状细胞的含量越高的患者复发风险显著增高;而在接受辅助化疗的患者群中,肠内分泌细胞与2型杯状细胞的含量与患者的死亡风险显著正相关;此外,1型杯状细胞与患者的无复发生存时间(RFS)及总生存时间(OS)间未见显著关联。
实施例2鉴定结肠癌患者组蛋白修饰调节分子的表达状况及临床相关性
1、解析肠癌组织中分泌细胞分型
为了评估上述三种分泌细胞富集含量是否有助于对非转结肠癌患者进行分类,首先分别在实施例1的“1、结肠癌公共数据集的下载与整理”中整理好的meta-GEO及TCGA-COAD队列中“ConsensuClusterPlus”包基于K-means无监督聚类的方法进行分型,参数设置为:maxK=10,reps=1000,pItem=0.95,以及pFeature=1。结果显示三种分泌细胞可将患者分为稳健的4种类型,分别为:分泌细胞亚型1(SCS1)、分泌细胞亚型2(SCS2)、分泌细胞亚型3(SCS3)和分泌细胞亚型4(SCS4)。其中,SCS1型患者表现为肠内分泌细胞与2型杯状细胞的中度富集,SCS2表现为肠内分泌细胞与2型杯状细胞的高度富集,SCS3表现为肠内分泌细胞与2型杯状细胞的缺失,而SCS4型表现为1型杯状细胞的高度富集。
2、明确结肠癌患者分泌细胞富集分型的临床意义
接下来,探讨不同分泌细胞富集分型是否有临床意义。
在meta-GEO数据库中绘制了不同分型患者的生存曲线并计算。四类分型的患者在无复发生存预后存在显著差异(log-rank比较结果:p=0.0032)。其中,以SCS2型患者复发风险最高,四型患者的五年无复发生存率分别为(以SCS1、SCS2、SCS3、SCS4的顺序,下同):73.1%,64.3%,75.8%,74.9%。而在总生存期方面,不论在meta-GEO队列还是在TCGA-COAD队列的总体患者群中,均未显示出分泌细胞富集分型与生存时间的统计学关联(见图2)。但是,在接受氟尿嘧啶为基础的辅助化疗患者亚组中,SCS2亚型患者的OS显著差于其他三组分型的患者。在meta-GEO队列的该亚组中四型患者的五年总生存率分别为:79.1%,52.5%,82.3%,87.9%(见图3)。在TCGA-COAD队列的该亚组中四型患者的五年总生存率分别为:79.1%,52.5%,82.3%,87.9%(见图4)。如图5和图6所示,在化疗获益方面,通过pRRophetic包运用岭回归,基于CTRP2.0数据库对meta-GEO和TCGA-COAD队列患者的氟尿嘧啶化疗敏感性预测显示:SCS2型患者对于氟尿嘧啶化疗的敏感性在所有分型中最低;其次为SCS1;SCS3和SCS4型患者氟尿嘧啶化疗的敏感性较SCS1及SCS2型显著升高,差异具有统计学意义。这一结果提示,不同分泌细胞富集分型患者的化疗敏感性与肠内分泌细胞及2型杯状细胞的浸润丰度有关。生存分析结果同样显示:基于氟尿嘧啶的辅助化疗,在GSE39582及TCGA-COAD队列中均不仅未给SCS1及SCS2型患者带来获益,相反更增加了SCS2型患者的死亡风险。在SCS3及SCS4型患者中,辅助化疗可降低患者的死亡风险。因此,鉴于SCS2型患者预后最差且对氟尿嘧啶反应最差,我们认为这类患者不适宜单用辅助化疗进行治疗,开发一种可有效识别SCS2型患者的工具具有重要的临床意义。
实施例3基于结肠癌分泌细胞富集分型的分泌细胞分型评分模型SCS score建立与评估
1、分析不同组蛋白分型的差异基因
鉴于SCS2型患者的特殊临床特征(预后最差且具有氟尿嘧啶化疗敏感性最低),拟开发一个评分工具以量化非转移性肠癌患者分泌细胞浸润特征并精准识别出SCS2型患者。为达到这一目的,首先通过“LIMMA”包在GSE39582队列中将SCS2型患者与所有非SCS2型患者行差异分析,以查找在SCS2型中特异表达的基因,差异基因的筛选标准为|log2FC|>1和矫正p<0.01。结合筛选标准,共获628个差异基因(608个在SCS2中上调及20个下调)。
2、运用Boruta算法对差异基因进行降维
随后,在R软件中应用“Boruta”包,运用Boruta算法在meta-GEO数据集(训练集)中,再对SCS2中高表达与低表达的差异基因群体进行分别降维,运算参数设置为:doTrace=2,maxRuns=100,ntree=500。通过降维,将在SCS2中高表达608个基因缩减为102个基因,命名为A类基因;而在SCS2中低表达基因群降维后剩余12个基因,命名为B类基因。
3、运用LASSO-COX回归分析进一步挑选具有预后指示价值的差异基因形成SCSscore模型
进一步在上述降维基因中挑选具有预后指示作用的基因。首先,通过单因素cox回归分析114个差异基因与无复发生存的联系,并识别出102个p<0.05的基因。移除1个在TCGA-COAD数据库中没有检测到的基因,并对剩余101个基因行LASSO-COX回归筛选。这里使用“glmnet”包并以十倍交叉验证进行LASSO-COX算法运算。当“Partial LikelihoodDeviance”值最小时对应的变量组合即为建模基因。最终,挑选出7个基因构建模型,分别为:ASCL2,FAM84,FAM13C,PRKD1,AKAP12,A2M,FSTL1。由这7个基因的转录表达相加减获得最终得分,具体预测公式为:SCS score=FAM13C+PRKD1+AKAP12+A2M+FSTL1-ASCL2-FAM74A。
4、评估SCS score模型对于SCS2型患者鉴别的准确度
使用ROC曲线分析判断模型对SCS2型患者鉴别的准确性,发现在meta-GEO队列中,SCS score评分对SCS2型患者的鉴别AUC为0.96(0.95-0.97)。接着,以TCGA-COAD数据集作为验证集,通过ROC分型在验证集中进一步明确模型对SCS2型患者鉴别的准确性,AUC为0.96(0.94-0.98)。
结果如图7-图9所示,图7为SCS score模型包含的7个基因在meta-GEO数据库不同分泌细胞富集分型患者中转录表达情况的热图。其中,FAM13C,PRKD1,AKAP12,A2M,FSTL1基因在SCS2型患者中的表达较其他分型患者明显升高。而ASCL2,FAM84A则在SCS2型患者呈现低表达。图8A为meta-GEO队列中患者SCS score得分情况在不同分泌细胞富集分型中的分布的小提琴图;可以看到在SCS2型患者中分布最高,其次是SCS1型患者,而在SCS3型中最低。同时,从图8B中可以看出meta-GEO数据集中SCS score得分对于SCS2型患者的鉴别作用,ROC曲线下面积为0.96,95%置信区间为0.95-0.97,说明鉴别的准确性比较高。图9A为TCGA-COAD队列中患者SCS score得分情况在不同分泌细胞富集分型中的分布的小提琴图;可以看到在SCS2型患者中分布最高,其次是SCS1型患者,而在SCS3型中最低。图9B中可以看出TCGA-COAD数据集中SCS score得分对于SCS2型患者的鉴别作用,ROC曲线下面积为0.96,95%置信区间为0.94-0.98,说明鉴别的准确性比较高。
实施例4运用分泌细胞富集模型SCS score在meta-GEO队列中对结肠癌患者预后、辅助化疗获益及氟尿嘧啶敏感性进行预测
首先,在meta-GEO队列中探索SCS score的使用效果,发现SCS score与GEO数据集肠癌患者的无复发生存显著相关。高SCS score评分的患者复发风险显著高于低SCS score评分患者(HR=1.75,95%CI=1.36-22.6),且SCS score是无复发风险的独立预测因素(见图10A)。而在总生存期方面,如图10B森林图显示SCS score对于总生存期的指示作用取决于患者接受辅助化疗与否,仅有在接受辅助化疗的患者中高SCS score得分显著预示不良预后(HR=1.82,95%CI=1.09-3.07),提示SCS score与辅助化疗存在交互作用,具有指示辅助化疗获益的作用。进一步我们探索了辅助化疗在不同SCS score评分组对患者生存的影响,如图10C所示结果发现:高SCS score的结肠癌患者中辅助化疗的实施增加了患者的死亡风险(HR=1.16,95%CI=0.68-2.00),而在低SCS score的结肠癌患者中辅助化疗的实施带来了生存获益(HR=0.58,95%CI=0.38-0.91),提示SCS score可预测辅助化疗获益,指导辅助化疗实施的决策。最后,我们使用通过pRRophetic包运用岭回归基于CTRP2.0数据库对meta-GEO队列患者的氟尿嘧啶(非转移性结肠癌患者辅助化疗的基础用药)化疗敏感性预测显示氟尿嘧啶不反应的患者SCS score得分显著升高,运用SCS score可有效鉴别氟尿嘧啶不反应患者,准确率为85.7%(见图10D)。
实施例5运用分泌细胞富集模型SCS score在TCGA-COAD队列中对结肠癌患者预后、辅助化疗获益及氟尿嘧啶敏感性进行预测
为了进一步明确SCS score的使用效果,在TCGA-COAD数据库行进一步探索,同样发现在TCGA-COAD数据集中,SCS score对于总生存期的指示作用同样与辅助化疗存在交互,在接受了辅助化疗的患者中高SCS score得分显著预示不良预后(HR=7.27,95%CI=1.90-27.40)(见图11A)。进一步探索了辅助化疗在不同SCS score评分组对患者生存的影响发现,高SCS score的结肠癌患者中辅助化疗的实施同样增加了患者的死亡风险(HR=1.26,95%CI=0.54-2.95),提示SCS score在TCGA-COAD数据集中也可预测辅助化疗获益,指导辅助化疗实施的决策(见图11B)。最后,使用通过pRRophetic包运用岭回归基于CTRP2.0数据库对TCGA-COAD队列患者的氟尿嘧啶化疗敏感性预测,结果显示氟尿嘧啶不反应的患者SCS score得分显著升高,运用SCS score可有效鉴别氟尿嘧啶不反应患者,准确率为81.3%(见图11C)。
实施例6SCS score在中山大学肿瘤医院数据集中对结肠癌患者肿瘤组织中分泌细胞富集以及氟尿嘧啶敏感性的指示作用
为了进一步确认SCS score的临床价值,申请人在中山大学肿瘤医院数据集中验证SCS score对患者肠内分泌细胞、1型杯状细胞、2型杯状细胞含量及氟尿嘧啶敏感性的预测作用。在分泌细胞含量相关性方面,SCS score与肠内分泌细胞、1型杯状细胞、2型杯状细胞含量呈显著正相关,而与1型杯状细胞含量无明显关系(见图12A)。申请人使用通过pRRophetic包运用岭回归基于CTRP2.0数据库对中山大学肿瘤医院数据集患者的氟尿嘧啶化疗敏感性预测显示氟尿嘧啶不反应的患者SCS score得分显著升高,运用SCS score可有效鉴别氟尿嘧啶不反应患者,ROC分析显示鉴别的AUC值为0.84(见图12B)。以上数据表明:SCS score在识别肠内分泌细胞与2型杯状细胞高度富集的患者类型及氟尿嘧啶抵抗的非转移性结肠癌患者方面的作用,具有良好的可重复性和稳健性。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (10)
1.一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的生物标志物,其特征在于,所述生物标志物包括基因ASCL2,FAM84,FAM13C,PRKD1,AKAP12,A2M以及FSTL1。
2.一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的试剂盒,其特征在于,包括检测权利要求1所述的生物标志物中的7个基因转录表达水平的试剂。
3.检测如权利要求1所述的生物标志物的试剂在制备预测结肠癌预后和辅助化疗获益的试剂盒中的应用。
4.一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型,其特征在于,所述评分模型以权利要求1所述的生物标志物表达水平作为输入变量,用以评估预测结肠癌预后及辅助化疗获益;其中,所述评分模型使用如下公式计算结肠癌预后及辅助化疗获益评分:SCS score=FAM13C+PRKD1+AKAP12+A2M+FSTL1-ASCL2-FAM74A。
5.一种基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型的构建方法,其特征在于,包括以下步骤:
(1)采用共识聚类分析确定非转移性结肠癌患者肿瘤组织中分泌细胞的富集模式;
(2)基于步骤(1)所述富集模型的分析结果,通过Boruta算法、LASSO-COX回归分析筛选具有预后指示价值的特征基因,构建基于分泌细胞富集模式的评分模型;
所述特征基因包括基因ASCL2,FAM84,FAM13C,PRKD1,AKAP12,A2M以及FSTL1。
6.如权利要求5所述的构建方法,其特征在于,所述分泌细胞包括肠内分泌细胞、1型杯状细胞和2型杯状细胞。
7.如权利要求6所述的构建方法,其特征在于,所述非转移性结肠癌患者肿瘤组织中分泌细胞的富集模式具体为:所述分泌细胞将所述非转移性结肠癌患者分为分泌细胞亚型1、分泌细胞亚型2、分泌细胞亚型3和分泌细胞亚型4;其中,分泌细胞亚型1患者表现为肠内分泌细胞与2型杯状细胞的中度富集,分泌细胞亚型2表现为肠内分泌细胞与2型杯状细胞的高度富集,分泌细胞亚型3表现为肠内分泌细胞与2型杯状细胞的缺失,分泌细胞亚型4表现为1型杯状细胞的高度富集。
8.如权利要求7所述的构建方法,其特征在于,所述评分模型的公式为:
SCS score=FAM13C+PRKD1+AKAP12+A2M+FSTL1-ASCL2-FAM74A。
9.如权利要求4所述的评分模型在设计预测结肠癌预后及辅助化疗获益系统或者装置中的应用。
10.如权利要求9所述的应用,其特征在于,所述评分模型通过如下判断标准预测结肠癌预后及辅助化疗获益:当所述评分模型的公式得到的结果>cut-off时,判定为预后高风险人群,对化疗存在抵抗,不推荐单独使用辅助化疗;当所述评分模型的公式得到结果≤cut-off时,判定为预后低风险人群,可从辅助化疗中获益;所述cut-off值是指将评分结果由大到小排位后前1/3与后2/3的交界值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210990262.1A CN115141887B (zh) | 2022-08-18 | 2022-08-18 | 基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210990262.1A CN115141887B (zh) | 2022-08-18 | 2022-08-18 | 基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115141887A true CN115141887A (zh) | 2022-10-04 |
CN115141887B CN115141887B (zh) | 2023-04-21 |
Family
ID=83416328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210990262.1A Active CN115141887B (zh) | 2022-08-18 | 2022-08-18 | 基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115141887B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116665898A (zh) * | 2023-06-01 | 2023-08-29 | 南方医科大学南方医院 | 一种基于组蛋白修饰调节因子特征的预测胃癌预后的生物标志物、评分模型及应用 |
CN117153371A (zh) * | 2023-08-24 | 2023-12-01 | 南方医科大学南方医院 | 一种预测结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 |
CN117373545A (zh) * | 2023-12-07 | 2024-01-09 | 广州金墁利医药科技有限公司 | 肠癌放化疗预测评分模型、应用、系统及其构建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008100913A2 (en) * | 2007-02-12 | 2008-08-21 | The Johns Hopkins University | Early detection and prognosis of colon cancers |
WO2013052480A1 (en) * | 2011-10-03 | 2013-04-11 | The Board Of Regents Of The University Of Texas System | Marker-based prognostic risk score in colon cancer |
CN111863130A (zh) * | 2020-04-07 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 肿瘤免疫治疗预后标志物的筛选方法及应用 |
-
2022
- 2022-08-18 CN CN202210990262.1A patent/CN115141887B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008100913A2 (en) * | 2007-02-12 | 2008-08-21 | The Johns Hopkins University | Early detection and prognosis of colon cancers |
WO2013052480A1 (en) * | 2011-10-03 | 2013-04-11 | The Board Of Regents Of The University Of Texas System | Marker-based prognostic risk score in colon cancer |
CN111863130A (zh) * | 2020-04-07 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 肿瘤免疫治疗预后标志物的筛选方法及应用 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116665898A (zh) * | 2023-06-01 | 2023-08-29 | 南方医科大学南方医院 | 一种基于组蛋白修饰调节因子特征的预测胃癌预后的生物标志物、评分模型及应用 |
CN116665898B (zh) * | 2023-06-01 | 2024-01-30 | 南方医科大学南方医院 | 一种基于组蛋白修饰调节因子特征的预测胃癌预后的生物标志物、评分模型及应用 |
CN117153371A (zh) * | 2023-08-24 | 2023-12-01 | 南方医科大学南方医院 | 一种预测结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 |
CN117373545A (zh) * | 2023-12-07 | 2024-01-09 | 广州金墁利医药科技有限公司 | 肠癌放化疗预测评分模型、应用、系统及其构建方法 |
CN117373545B (zh) * | 2023-12-07 | 2024-05-10 | 广州金墁利医药科技有限公司 | 肠癌放化疗预测评分的系统及模型的应用和构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115141887B (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ozawa et al. | A microRNA signature associated with metastasis of T1 colorectal cancers to lymph nodes | |
Kim et al. | A nineteen gene-based risk score classifier predicts prognosis of colorectal cancer patients | |
CN115141887B (zh) | 基于分泌细胞富集特征的结肠癌预后及辅助化疗获益的评分模型、构建方法及应用 | |
Chen et al. | TOP2A, HELLS, ATAD2, and TET3 are novel prognostic markers in renal cell carcinoma | |
US20230040907A1 (en) | Diagnostic assay for urine monitoring of bladder cancer | |
Yang et al. | Identification of hub genes and outcome in colon cancer based on bioinformatics analysis | |
EP3935192A1 (en) | Methylation status of gasdermin e gene as cancer biomarker | |
CN109929934B (zh) | 免疫相关基因在结直肠癌预后的试剂盒和系统中的应用 | |
WO2010060055A1 (en) | Predicting cancer risk and treatment success | |
Wang et al. | Transcriptomic analysis of cutaneous squamous cell carcinoma reveals a multigene prognostic signature associated with metastasis | |
Sun et al. | Combining gene expression signature with clinical features for survival stratification of gastric cancer | |
Zhong et al. | Overexpression of MAL2 correlates with immune infiltration and poor prognosis in breast cancer | |
US20240018600A1 (en) | Mitochondrial dna prostate cancer marker and related systems and methods | |
CN116153387A (zh) | 一种肺鳞癌患者总体生存率预后模型及应用 | |
He et al. | Identification of a combined RNA prognostic signature in adenocarcinoma of the lung | |
US20240093306A1 (en) | Micro rna liver cancer markers and uses thereof | |
Jin et al. | Identification and validation of the mitochondrial function related hub genes by unsupervised machine learning and multi-omics analyses in lung adenocarcinoma | |
Lin et al. | Mining the role of RECQL5 in gastric cancer and seeking potential regulatory network by bioinformatics analysis | |
Parasramka et al. | Validation of gene expression signatures to identify low-risk clear-cell renal cell carcinoma patients at higher risk for disease-related death | |
Carr et al. | A unique gene signature predicting recurrence-free survival in stage IA lung adenocarcinoma | |
Zhang et al. | Tumor microenvironment derived signature predicting relapse-free survival in I-III cancer and preliminary experiment verification | |
US12123058B2 (en) | Molecular signature and use thereof for the identification of indolent prostate cancer | |
CN112037851A (zh) | 自噬相关基因在结直肠癌预后的试剂盒和系统中的应用 | |
Liu et al. | PSMC2 and CXCL8-Modulated Four Critical Gene Biomarkers and Druggable and Vaccinable Targets for Colorectal Cancer | |
Liu et al. | Novel molecular classification and prognosis of papillary renal cell carcinoma based on a large-scale CRISPR-Cas9 screening and machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |