CN113881771A - 与结直肠癌预后相关的标志分子 - Google Patents

与结直肠癌预后相关的标志分子 Download PDF

Info

Publication number
CN113881771A
CN113881771A CN202111060999.5A CN202111060999A CN113881771A CN 113881771 A CN113881771 A CN 113881771A CN 202111060999 A CN202111060999 A CN 202111060999A CN 113881771 A CN113881771 A CN 113881771A
Authority
CN
China
Prior art keywords
seq
gene sequence
sequence shown
sample
expression level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111060999.5A
Other languages
English (en)
Inventor
王艳
余和芬
黄蔚
高天杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Medical University
Original Assignee
Capital Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Medical University filed Critical Capital Medical University
Priority to CN202111060999.5A priority Critical patent/CN113881771A/zh
Publication of CN113881771A publication Critical patent/CN113881771A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Public Health (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及与结直肠癌预后相关的标志分子,所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。本发明提供的标志分子与结直肠癌的预后密切相关,结直肠癌患者预后预测与分析提供了新策略。

Description

与结直肠癌预后相关的标志分子
技术领域
本发明涉及癌症治疗以及预后评价领域,具体涉及与结直肠癌预后相关的标志分子。
背景技术
结直肠癌(colorectal cancer,CRC)是指发生在结肠或直肠上的恶性肿瘤。如今,它约占全球所有诊断出的癌症和与癌症相关的死亡病例的10%,每年约有90万人因该病去世。CRC大部分是零星散发的,并且在很大程度上归因于西化的环境风险因素,例如肥胖、不良饮食习惯、饮酒和吸烟。其诊断主要是依靠结肠镜检查以及在结肠镜下取样进行病理确诊。结直肠癌在治疗上大多采取以手术治疗为主的综合治疗,相对于结肠癌,直肠癌对放疗的敏感性更高,效果更好一些。结直肠癌由于解剖位置关系复杂,彻底手术难度大,术后复发率高;结肠癌由于发生快和转移多而通常预后较差。
转录因子(TFs)是具有调节功能的蛋白质。它们通过识别基因上游的特定DNA序列来调节基因转录,从而在发育和分化中起关键作用。许多转录因子不仅影响细胞类型的决定和个体发育模式,还参与许多生物途径的调节(例如免疫应答)。大量研究表明,TFs与肿瘤的形成和治疗密切相关。以往研究都是利用少量样本的RNA-seq数据筛选与结直肠癌预后相关的基因集;很少关注转录因子在结直肠癌早期诊断与预后方面的提示作用;大多研究是基于已知的结直肠癌相关调控因子,结合测序数据或者文献报道挖掘与该调控因子具有显著上下游相关调控关系的基因或信号通路及其在结直肠癌中的调控作用,未有研究利用数据库大量癌症与癌旁样本的测序数据结合WGCNA分析筛选与结直肠癌预后相关的特征转录因子。因此,直接利用CRC相关的TFs来构建结直肠癌的预后模型可能为CRC的诊断和治疗提供新的思路。
发明内容
在过去十年中,新技术的飞速发展使我们能够快速获取大量的CRC生理和病理信息。加权基因共表达网络分析(WGCNA)是探索基因与表型之间复杂关系的有效方法。WGCNA的独特优势是其可将基因表达数据转换为共表达模块,从而深入了解可能负责人们感兴趣表型特征的信号网络。它不仅可以比较差异表达的基因,还可以帮助我们弄清楚不同共表达模块中基因间的相互作用。因此,本发明通过提取CRC癌症和癌旁组织中的差异表达基因,利用WGCNA分析来筛选疾病相关TFs,同时建立疾病预后风险模型,实现TFs靶标调控网络的构建。
本发明的第一目的在于提供分离的与结直肠癌预后相关的标志分子,包括:如SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ IDNO:13所示的至少一个基因序列。
具体而言,本发明提供的与结直肠癌预后相关的标志分子可以是SEQ ID NO:1~SEQ ID NO:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或全部十三个序列。
其中,如SEQ ID NO:1所示的基因序列,其编码的蛋白又名ZEB1。ZEB1是肿瘤上皮-间质转化的关键驱动因子,直接与CDH1启动子结合,抑制E-cadherin转录。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:2所示的基因序列,其编码的蛋白又名转录因子7样蛋白1,TCF7L1。TCF7L1是一种定位于内质网的氨基酸蛋白,属于糖基转移酶的岩藻糖基转移酶亚家族,在胰腺、肾、肺、心脏、脑、肝、胎盘和骨骼肌中高表达。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:3所示的基因序列,其编码的蛋白又名MEIS1。MEIS1是调控细胞发育和增殖过程中决定细胞命运的重要转录因子,其在非小细胞肺癌细胞中的表达增加会导致肿瘤细胞增殖受限。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:4所示的基因序列,其编码的蛋白又名微邻苯二甲酸相关转录因子,MITF。MITF能够协调十分广泛的生物学过程,包括细胞存活、分化、增殖、侵袭、衰老、新陈代谢和DNA损伤修复等。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:5所示的基因序列,其编码的蛋白又名NK3同源框蛋白,NKX3-2。经人卵巢癌验证,NKX3-2在耐药性肿瘤中显著上调,其过表达与远处转移显著相关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:6所示的基因序列,其编码的蛋白又名PGR。PGR基因位于染色体11q22上,可编码孕酮受体(PGR或PR)。大多数乳腺癌显示具有雌激素受体或孕激素受体的过表达。根据ER、PR、HER2三种激素受体状态的变化,乳腺癌可被分为四种亚型,这些分类影响疾病治疗方法的选择。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:7所示的基因序列,其编码的蛋白又名MEIS2。MEIS2蛋白通常与HOX或PBX蛋白相互作用形成同源蛋白-DNA复合物,在调节神经嵴和肢体发育中起重要作用。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:8所示的基因序列,其编码的蛋白又名WWTR1(TAZ)。WWTR1(TAZ)是Hippo信号通路的核心组分,YAP/TAZ使癌细胞克服接触抑制,不受控制地生长和扩散。小G蛋白Rac1的鸟苷酸交换因子TIAM1在细胞质中可与TAZ相互作用,促进TAZ降解。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:9所示的基因序列,其编码的蛋白又名KCNIP3。钾离子电压门控通道相互作用蛋白KCNIP3目前与癌症疾病相关关系的研究较少。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:10所示的基因序列,其编码的蛋白又名APBB1。APBB1最初作为脑发育过程中的淀粉样前体蛋白结合蛋白被发现,与阿尔兹海默症的发病过程密切相关,但它在癌症中的作用研究甚少。有研究发现APBB1与增强癌症干细胞(CSC)和上皮-间充质转化(EMT)以及增强肺癌细胞的抗辐射特性有关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:11所示的基因序列,其编码的蛋白又名CBX7。CBX7蛋白属于转录抑制因子的一种,能够参与细胞增殖转录过程,在维持胚胎干细胞自身更新和全能性、抑制ESC分化中有着非常重要的作用。已有文献报道CBX7与甲状腺癌的恶性表型相关。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:12所示的基因序列,其编码的蛋白又名HAND2。HAND2是心脏形成的一种关键调节因子,同时也是子宫内膜癌中差异甲基化的热点,HAND2甲基化是子宫内膜癌中常见而重要的分子改变。目前,尚未见该基因序列与结直肠癌预后相关的报道。
如SEQ ID NO:13所示的基因序列,其编码的蛋白又名LMO3。神经特异性转录因子LMO3可通过Akt-mTOR和Akt-GSK3β信号通路促进前列腺癌细胞增殖和转移,同时LMO3-BORCS5融合癌基因在尤文氏肉瘤复发时是肿瘤进展的驱动因素。目前,尚未见该基因序列与结直肠癌预后相关的报道。
本发明的第二目的是提供评价结直肠癌预后效果的检测试剂盒,其中包括:用于检测与结直肠癌预后相关的标志分子表达量的试剂;所述标志分子包括:如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或者全部十三个序列。
作为本发明的优选方案,所述试剂盒用于检测标志分子mRNA的表达量,所述试剂包括针对所述标志分子的反转录引物对,优选还包括针对所述标志分子的特异性荧光探针,通过实时监控PCR体系中的荧光信号,对检测患者样品中所述标志分子的表达量进行定量检测。
本发明的第三目的是提供结直肠癌预后效果的评价模型,所述模型具体为:
RiskScore=-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1;
其中,ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量,MITF代表样品中如SEQ ID NO:4所示基因序列的表达量,APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量,CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量,HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量,LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量,KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量,WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量,MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量,PGR代表样品中如SEQ ID NO:6所示基因序列的表达量,NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量,MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量,TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
本发明的第四目的是提供结直肠癌预后效果的评价系统,所述评价系统包括:(1)数据输入模块,用于将与结直肠癌预后相关的标志分子的表达量检测结果输入模型计算模块;所述表达量为标志分子对应的mRNA含量;(2)模型计算模块,用于对输入的检测结果进行计算处理,得到被测患者的预后效果数据;(3)结果输出模块,用于根据结直肠癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果。
作为本发明的优选方案,所述模型计算模块采用的模型具体为:
RiskScore=-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1;
其中,ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量,MITF代表样品中如SEQ ID NO:4所示基因序列的表达量,APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量,CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量,HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量,LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量,KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量,WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量,MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量,PGR代表样品中如SEQ ID NO:6所示基因序列的表达量,NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量,MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量,TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
所述与结直肠癌预后相关的标志分子包括:如SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:13中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或者全部十三个序列。
本发明的第五目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌诊断中的应用。
本发明的第六目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌患者预后评价中的应用。
本发明首次从转录因子与疾病预后关系的角度出发,在结直肠癌组织和癌旁组织中筛选出差异表达的TFs基因集(DF-TFs),后续通过WGCNA分析、lasso回归分析、COX回归分析、ROC曲线分析和风险评分等方法,筛选出与结直肠癌预后显著相关的13个转录因子。在利用特征计算的风险评分预测肿瘤患者的预后和临床病理特征时,其ROC曲线下面积值较高,表明这13个基因能很好的反应直肠癌患者的预后,为提高临床结直肠癌患者的诊断和生存预后提供了新思路。
附图说明
图1为TCGA数据库结直肠癌样本中差异转录因子的表达热图;
图2为WGCNA分析结果;A.软阈值筛选;B.聚类结果;C.模块内GS指标均值;D.模块与表型的相关性计算;
图3为Turquoise模块内TFs的共表达网络图;外围为hub TFs,内部为相对低节点的TFs,后续选择外围TFs进行分析;
图4为利用COX单因素回归结果进行lasso回归;
图5为模型的KM曲线验证(A)和ROC曲线(B)验证;
图6为外部数据集验证;A.高低风险组的K-M曲线图;B.样本风险表;C.样本删失图;D.模型中TFs的表达热图;
图7为单因素和多因素COX分析结果;
图8为基于COX多因素回归的列线图(A)和1年(B)、2年(C)、3年(D)、5年(E)OS的校正曲线;
图9为模型内TFs的TF-target调控网络;网络内围为TFs,点的大小符合TFs节点度的大小,外围为作用靶点基因。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例
本实施例利用TCGA数据库得到具有表型信息的结直肠癌RNA-seq测序样本;整合TRRUST数据库和JASPAR数据库收集目前已报道的所有TFs;通过WGCNA分析、lasso回归分析、COX回归分析、ROC曲线分析和风险评分筛选出与结直肠癌预后密切相关的基因。
具体采用包括如下步骤的方法:
首先从TCGA数据库中下载得到434份具有表型的RNA-seq测序样本,其中有383个癌症样本和51个癌旁样本。进一步整合TRRUST数据库和JASPAR数据库提供的转录因子信息,最终得到981个TFs的表达矩阵用于后续分析。进一步使用R包limma进行差异表达TFs的鉴定,去掉低表达的TFs,最终利用978个TFs进行差异分析,筛选出250个TFs,其中上调102个,下调148个。TCGA数据库结直肠癌样本中差异转录因子的表达热图如图1所示。
进一步利用DE_TFs进行WGCNA分析(结果如图2所示),通过软阈值筛选得到最适power=3,然后以此通过一步法构建网络,合并相似模块后最终的得到两个模块,通过模块与预后表型的关联分析,确定与OS_status相关性最高turquoise模块(113TFs),导出网络,导入Cytoscape,以degree=112筛选出62个具有高节点数的TFs(hub TFs),用于后期模型构建。Turquoise模块内TFs的共表达网络图如图3所示。
对62个hub TFs进行批量COX单因素回归分析,最终筛选到14个显著相关的TFs。对相关TFs进行功能富集分析,主要富集在各器官系统发育,转录因子复合体,癌症相关的转录失调以及RNA聚合酶II特异的DNA结合活性等通路。
进一步利用lasso回归从COX单因素回归分析结果(如图4所示)中筛选出更加显著相关的13个TFs,利用公式计算每个样本依赖模型的风险得分,并以median为cutoff区分高低风险组,利用该分组结合生存数据绘制KM曲线(如图5A所示),发现高风险组的生存率显著低于低风险组,表明构建的模型具有代表性,之后进一步绘制ROC曲线(如图5B所示),得到的AUC=0.706,暗示模型的预测能力较强。
然后利用GEO数据库中的GSE14333数据进行模型验证,按照同上的数据处理方法,对测试数据进行基于模型的高低风险分组,然后结合生存数据绘制K-M曲线,曲线表明高风险组的生存率显著低于低风险组,暗示构建模型的的预后效果较好(如图6所示)。
为了鉴定Risk Score是否为唯一预后影响因素,选择年龄,性别,PathologicStage和Lymphatic Invasion为其他因素,分别利用COX单因素回归和多因素回归鉴定相关因素与疾病预后的相关性(结果如图7所示),在COX单因素回归分析中,Pathologic Stage的Hazardratio值最高,其次为Risk Score和Lymphatic Invasion。之后进一步对以上5种因素进行了COX多因素回归分析(结果如图8所示),除了Pathologic Stage,其他因素分析结果的Hazard ratio值均有所下降,Risk Score的Hazardratio值仍为第二高,表明除了Pathologic Stage外,依赖模型的Risk Score是较合适的预后因素。模型内TFs的TF-target调控网络图如图9所示。
RiskScore=-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1。
以上结果表明如SEQ ID NO:1~SEQ ID NO:13所示的13个因子与结直肠癌的预后密切相关,有潜力作为结直肠癌患者预后预测与分析的特征因子,且基于上述13个因子提供的直肠癌预后效果的评价模型能够有效评价直肠癌的预后效果。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 首都医科大学
<120> 与结直肠癌预后相关的标志分子
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3327
<212> DNA
<213> 人(Homo sapiens)
<400> 1
atgaaagtta caaattataa tactgtggta gaaacaaatt cagattcaga tgatgaagac 60
aaactgcata ttgtggaaga agaaagtgtt acagatgcag ctgactgtga aggtgtacca 120
gaggatgacc tgccaacaga ccagacagtg ttaccaggga ggagcagtga aagagaaggg 180
aatgctaaga actgctggga ggatgacaca ggaaaggaag ggcaagaaat cctggggcct 240
gaagctcagg cagatgaagc aggatgtaca gtaaaagatg atgaatgcga gtcagatgca 300
gaaaatgagc aaaaccatga tcctaatgtt gaagagtttc tacaacaaca agacactgct 360
gtcatttttc ctgaggcacc tgaagaggac cagaggcagg gcacaccaga agccagtggt 420
catgatgaaa atggaacacc agatgcattt tcacaattac tcacctgtcc atattgtgat 480
agaggctata aacgctttac ctctctgaaa gaacacatta aatatcgtca tgaaaagaat 540
gaagataact ttagttgctc cctgtgcagt tacacctttg catacagaac ccaacttgaa 600
cgtcacatga catcacataa atcaggaaga gatcaaagac atgtgacgca gtctgggtgt 660
aatcgtaaat tcaaatgcac tgagtgtgga aaagctttca aatacaaaca tcacctaaaa 720
gagcacttaa gaattcacag tggagagaag ccatatgaat gcccaaactg caagaaacgc 780
ttttcccatt ctggctccta tagctcacac ataagcagta agaaatgtat cagcttgata 840
cctgtgaatg ggcgaccaag aacaggactc aagacatctc agtgttcttc accgtctctt 900
tcagcatcac caggcagtcc cacacgacca cagatacggc aaaagataga gaataaaccc 960
cttcaagaac aactttctgt taaccaaatt aaaactgaac ctgtggatta tgaattcaaa 1020
cccatagtgg ttgcttcagg aatcaactgt tcaacccctt tacaaaatgg ggttttcact 1080
ggtggtggcc cattacaggc aaccagttct cctcagggca tggtgcaagc tgttgttctg 1140
ccaacagttg gtttggtgtc tcccataagt atcaatttaa gtgatattca gaatgtactt 1200
aaagtggcgg tagatggtaa tgtaataagg caagtgttgg agaataatca agccaatctt 1260
gcatccaaag aacaagaaac aatcaatgct tcacccatac aacaaggtgg ccattctgtt 1320
atttcagcca tcagtcttcc tttggttgat caagatggaa caaccaaaat tatcatcaac 1380
tacagtcttg agcagcctag ccaacttcaa gttgttcctc aaaatttaaa aaaagaaaat 1440
ccagtcgcta caaacagttg taaaagtgaa aagttaccag aagatcttac tgttaagtct 1500
gagaaggaca aaagctttga agggggggtg aatgatagca cttgtcttct gtgtgatgat 1560
tgtccaggag atattaatgc acttccagaa ttaaagcact atgacctaaa gcagcctact 1620
cagcctcctc cactccctgc agcagaagct gagaagcctg agtcctctgt ttcatcagct 1680
actggagatg gcaatttgtc tcctagtcag ccacctttaa agaacctctt gtctctccta 1740
aaagcatatt atgctttgaa tgcacaacca agtgcagaag agctctcaaa aattgctgat 1800
tcagtaaacc taccactgga tgtagtaaaa aagtggtttg aaaagatgca agctggacag 1860
atttcagtgc agtcttctga accatcttct cctgaaccag gcaaagtaaa tatccctgcc 1920
aagaacaatg atcagcctca atctgcaaat gcaaatgaac cccaggacag cacagtaaat 1980
ctacaaagtc ctttgaagat gactaactcc ccagttttac cagtgggatc aaccaccaat 2040
ggttccagaa gtagtacacc atccccatca cctctaaacc tttcctcatc cagaaataca 2100
cagggttact tgtacacagc tgagggtgca caagaagagc cacaagtaga acctcttgat 2160
ctttcactac caaagcaaca gggagaatta ttagaaaggt caactatcac tagtgtttac 2220
cagaacagtg tttattctgt ccaggaagaa cccttgaact tgtcttgcgc aaaaaaggag 2280
ccacaaaagg acagttgtgt tacagactca gaaccagttg taaatgtaat cccaccaagt 2340
gccaacccca taaatatcgc tatacctaca gtcactgccc agttacccac aatcgtggcc 2400
attgctgacc agaacagtgt tccatgctta agagcgctag ctgccaataa gcaaacgatt 2460
ctgattcccc aggtggcata cacctactca actacggtca gccctgcagt ccaagaacca 2520
cccttgaaag tgatccagcc aaatggaaat caggatgaaa gacaagatac tagctcagaa 2580
ggagtatcaa atgtagagga tcagaatgac tctgattcta caccgcccaa aaagaaaatg 2640
cggaagacag aaaatggaat gtatgcttgt gatttgtgtg acaagatatt ccaaaagagt 2700
agttcattat tgagacataa atatgaacac acaggtaaaa gacctcatga gtgtggaatc 2760
tgtaaaaagg catttaaaca caaacatcat ttgattgaac acatgcgatt acattctgga 2820
gaaaagccct atcaatgtga caaatgtgga aagcgcttct cacactctgg gtcttattct 2880
caacacatga atcatcgcta ctcctactgt aagagagaag cggaagaacg tgacagcaca 2940
gagcaggaag aggcagggcc tgaaatcctc tcgaatgagc acgtgggtgc cagggcgtct 3000
ccctcacagg gcgactcgga cgagagagag agtttgacaa gggaagagga tgaagacagt 3060
gaaaaagagg aagaggagga ggataaagag atggaagaat tgcaggaaga aaaagaatgt 3120
gaaaaaccac aaggggatga ggaagaggag gaggaggagg aagaagtgga agaagaagag 3180
gtagaagagg cagagaatga gggagaagaa gcaaaaactg aaggtctgat gaaggatgac 3240
agggctgaaa gtcaagcaag cagcttagga caaaaagtag gcgagagtag tgagcaagtg 3300
tctgaagaaa agacaaatga agcctaa 3327
<210> 2
<211> 1767
<212> DNA
<213> 人(Homo sapiens)
<400> 2
atgccccagc tcggcggcgg gggcggcggc ggcggcggcg gcagcggggg aggcggcggc 60
tccagcgccg gggcggccgg cggaggggac gacctcgggg cgaacgacga gctgatcccc 120
ttccaggacg aggggggcga ggagcaggag ccgagcagcg atagcgcctc ggcgcagcgg 180
gacctagacg aggtcaagtc gtccctggtc aacgagtcgg agaaccagag cagcagctcg 240
gactcggagg cggagaggcg cccgcagccc gtccgggaca ctttccagaa gccgcgggac 300
tatttcgccg aagtgagaag gcctcaggac agcgcgttct ttaaaggacc cccgtaccct 360
gggtacccct tcctgatgat cccggacctg agcagcccgt acctctccaa cggacccctg 420
tctcccggag gagcgcgcac ctacctgcag atgaaatggc ccctcctcga tgtcccctcc 480
agcgccacag tcaaggacac gaggtcacca tctccagcac acttgtctaa taaagttcct 540
gtcgttcagc acccgcatca catgcatccg ctgactcccc tcatcaccta cagcaatgac 600
cacttctccc ccggctcccc tcccacccac ctctccccag agatcgatcc aaagacagga 660
atcccccggc cccctcaccc atccgagctg tcaccgtatt acccactctc tcccggagct 720
gtcggacaaa tcccccaccc cctcggctgg ctcgtcccac agcaaggcca gcccatgtac 780
tcccttcctc ccggtggctt ccggcaccct taccccgccc tcgccatgaa cgcctcgatg 840
tccagcctgg tctccagtcg gttctctcct cacatggtgg ctcctgccca ccctggcctg 900
cccacctcag ggatccccca ccctgccatc gtctccccca tcgtcaagca ggaaccggca 960
ccccccagcc tgagccctgc agtgagcgtg aaatcaccag tcaccgtgaa aaaggaggag 1020
gaaaagaagc cccacgtgaa gaagcctctg aatgccttca tgttgtatat gaaggagatg 1080
agggccaagg tggtggctga gtgcaccctg aaggaaagtg cagccattaa ccagatcctt 1140
ggaagaaagt ggcacaacct gtctcgagaa gaacaggcca agtactacga gctggcccgg 1200
aaggagcggc agcttcactc gcagctctac ccaacctggt cagcccggga caactatggt 1260
aagaaaaaga agaggaagag agaaaagcag ctgtcccaga cacagtcaca gcagcaagtc 1320
caggaggcag agggtgccct ggcctccaag agcaagaagc catgtgttca gtacctgccc 1380
cccgagaagc cctgtgacag ccctgcctcc tcccacggga gcatgctgga ctccccggcc 1440
actccctctg cagctttggc ctcaccagct gcccctgctg ccacccattc ggagcaagcc 1500
cagcccctct ccctcaccac caaaccagaa acccgggccc agctggctct ccactctgcc 1560
gccttcctgt cggctaaggc tgcagcctcc tcctctgggc agatgggcag ccagcctccc 1620
ctcctgtccc ggcccctccc ccttgggtcc atgcccacag ctctgctggc ctctcccccg 1680
tccttccccg ccacgctcca tgcccaccag gccctcccgg tgctacaggc ccagcctctt 1740
tccctggtca ccaagtctgc ccactaa 1767
<210> 3
<211> 1173
<212> DNA
<213> 人(Homo sapiens)
<400> 3
atggcgcaaa ggtacgacga tctaccccat tacgggggca tggatggagt aggcatcccc 60
tccacgatgt atggggaccc gcatgcagcc aggtccatgc agccggtcca ccacctgaac 120
cacgggcctc ctctgcactc gcatcagtac ccgcacacag ctcataccaa cgccatggcc 180
cccagcatgg gctcctctgt caatgacgct ttaaagagag ataaagatgc catttatgga 240
caccccctct tccctctctt agcactgatt tttgagaaat gtgaattagc tacttgtacc 300
ccccgcgagc cgggggtggc gggcggggac gtctgctcgt cagagtcatt caatgaagat 360
atagccgtgt tcgccaaaca gattcgcgca gaaaaacctc tattttcttc taatccagaa 420
ctggataact tgatgattca agccatacaa gtattaaggt ttcatctatt ggaattagag 480
aaggtacacg aattatgtga caatttctgc caccggtata ttagctgttt gaaagggaaa 540
atgcctatcg atttggtgat agacgataga gaaggaggat caaaatcaga cagtgaagat 600
ataacaagat cagcaaatct aactgaccag ccctcttgga acagagatca tgatgacacg 660
gcatctactc gttcaggagg aaccccaggc ccttccagcg gtggccacac gtcacacagt 720
ggggacaaca gcagtgagca aggtgatggc ttggacaaca gtgtagcttc ccccagcaca 780
ggtgacgatg atgaccctga taaggacaaa aagcgtcaca aaaagcgtgg catctttccc 840
aaagtagcca caaatatcat gagggcgtgg ctgttccagc atctaacaca cccttaccct 900
tctgaagaac agaaaaagca gttggcacaa gacacgggac tcaccatcct tcaagtgaac 960
aattggttta ttaatgcccg gagaagaata gtgcagccca tgatagacca gtccaaccga 1020
gcagtaagtc aaggaacacc ttataatcct gatggacagc ccatgggagg tttcgtaatg 1080
gacggtcagc aacatatggg aattagagca ccaggaccta tgagtggaat gggcatgaat 1140
atgggcatgg aggggcagtg gcactacatg taa 1173
<210> 4
<211> 1260
<212> DNA
<213> 人(Homo sapiens)
<400> 4
atgctggaaa tgctagaata taatcactat caggtgcaga cccacctcga aaaccccacc 60
aagtaccaca tacagcaagc ccaacggcag caggtaaagc agtacctttc taccacttta 120
gcaaataaac atgccaacca agtcctgagc ttgccatgtc caaaccagcc tggcgatcat 180
gtcatgccac cggtgccggg gagcagcgca cccaacagcc ccatggctat gcttacgctt 240
aactccaact gtgaaaaaga gggattttat aagtttgaag agcaaaacag ggcagagagc 300
gagtgcccag gcatgaacac acattcacga gcgtcctgta tgcagatgga tgatgtaatc 360
gatgacatca ttagcctaga atcaagttat aatgaggaaa tcttgggctt gatggatcct 420
gctttgcaaa tggcaaatac gttgcctgtc tcgggaaact tgattgatct ttatggaaac 480
caaggtctgc ccccaccagg cctcaccatc agcaactcct gtccagccaa ccttcccaac 540
ataaaaaggg agctcacagc gtgtattttt cccacagagt ctgaagcaag agcactggcc 600
aaagagaggc agaaaaagga caatcacaac ctgattgaac gaagaagaag atttaacata 660
aatgaccgca ttaaagaact aggtactttg attcccaagt caaatgatcc agacatgcgc 720
tggaacaagg gaaccatctt aaaagcatcc gtggactata tccgaaagtt gcaacgagaa 780
cagcaacgcg caaaagaact tgaaaaccga cagaagaaac tggagcacgc caaccggcat 840
ttgttgctca gaatacagga acttgaaatg caggctcgag ctcatggact ttcccttatt 900
ccatccacgg gtctctgctc tccagatttg gtgaatcgga tcatcaagca agaacccgtt 960
cttgagaact gcagccaaga cctccttcag catcatgcag acctaacctg tacaacaact 1020
ctcgatctca cggatggcac catcaccttc aacaacaacc tcggaactgg gactgaggcc 1080
aaccaagcct atagtgtccc cacaaaaatg ggatccaaac tggaagacat cctgatggac 1140
gacacccttt ctcccgtcgg tgtcactgat ccactccttt cctcagtgtc ccccggagct 1200
tccaaaacaa gcagccggag gagcagtatg agcatggaag agacggagca cacttgttag 1260
<210> 5
<211> 1002
<212> DNA
<213> 人(Homo sapiens)
<400> 5
atggctgtgc gcggcgccaa caccttgacg tccttctcca tccaggcgat cctcaacaag 60
aaagaggagc gcggcgggct ggccgcgcca gaggggcgcc cggcgcccgg gggcacagcg 120
gcatcggtgg ccgcggctcc cgctgtctgc tgttggcggc tctttgggga gagggacgcg 180
ggcgcgttgg ggggcgccga ggactctctg ctggcgtctc ctgccggtac cagaacagct 240
gcggggcgga ctgcggagag cccggaaggc tgggactcgg actccgcgct cagcgaggag 300
aacgagagca ggcggcgctg cgcggacgcg cggggggcca gcggggccgg ccttgcgggg 360
ggatccttga gcctcggcca gccggtctgt gagctggccg cttccaaaga cctagaggag 420
gaagccgcgg gccggagcga cagcgagatg tccgccagcg tctcaggcga ccgcagccca 480
aggaccgagg acgacggtgt tggccccaga ggtgcacacg tgtccgcgct gtgcagcggg 540
gccggcggcg ggggcggcag cgggccggca ggcgtcgcgg aggaggagga ggagccggcg 600
gcgcccaagc cacgcaagaa gcgctcgcgg gccgctttct cccacgcgca ggtcttcgag 660
ctggagcgcc gctttaacca ccagcgctac ctgtccgggc ccgagcgcgc agacctggcc 720
gcgtcgctga agctcaccga gacgcaggtg aaaatctggt tccagaaccg tcgctacaag 780
acaaagcgcc ggcagatggc agccgacctg ctggcctcgg cgcccgccgc caagaaggtg 840
gccgtaaagg tgctggtgcg cgacgaccag agacaatacc tgcccggcga agtgctgcgg 900
ccaccctcgc ttctgccact gcagccctcc tactattacc cgtactactg cctcccaggc 960
tgggcgctct ccacctgcgc agctgccgca ggcacccagt ga 1002
<210> 6
<211> 2310
<212> DNA
<213> 人(Homo sapiens)
<400> 6
atgagccggt ccgggtgcaa ggttggagac agctccggga cggcagctgc ccataaagtg 60
ctgccccggg gcctgtcacc agcccggcag ctgctgctcc cggcctctga gagccctcac 120
tggtccgggg ccccagtgaa gccgtctccg caggccgctg cggtggaggt tgaggaggag 180
gatggctctg agtccgagga gtctgcgggt ccgcttctga agggcaaacc tcgggctctg 240
ggtggcgcgg cggctggagg aggagccgcg gctgtcccgc cgggggcggc agcaggaggc 300
gtcgccctgg tccccaagga agattcccgc ttctcagcgc ccagggtcgc cctggtggag 360
caggacgcgc cgatggcgcc cgggcgctcc ccgctggcca ccacggtgat ggatttcatc 420
cacgtgccta tcctgcctct caatcacgcc ttattggcag cccgcactcg gcagctgctg 480
gaagacgaaa gttacgacgg cggggccggg gctgccagcg cctttgcccc gccgcggagt 540
tcaccctgtg cctcgtccac cccggtcgct gtaggcgact tccccgactg cgcgtacccg 600
cccgacgccg agcccaagga cgacgcgtac cctctctata gcgacttcca gccgcccgct 660
ctaaagataa aggaggagga ggaaggcgcg gaggcctccg cgcgctcccc gcgttcctac 720
cttgtggccg gtgccaaccc cgcagccttc ccggatttcc cgttggggcc accgcccccg 780
ctgccgccgc gagcgacccc atccagaccc ggggaagcgg cggtgacggc cgcacccgcc 840
agtgcctcag tctcgtctgc gtcctcctcg gggtcgaccc tggagtgcat cctgtacaaa 900
gcggagggcg cgccgcccca gcagggcccg ttcgcgccgc cgccctgcaa ggcgccgggc 960
gcgagcggct gcctgctccc gcgggacggc ctgccctcca cctccgcctc tgccgccgcc 1020
gccggggcgg cccccgcgct ctaccctgca ctcggcctca acgggctccc gcagctcggc 1080
taccaggccg ccgtgctcaa ggagggcctg ccgcaggtct acccgcccta tctcaactac 1140
ctgaggccgg attcagaagc cagccagagc ccacaataca gcttcgagtc attacctcag 1200
aagatttgtt taatctgtgg ggatgaagca tcaggctgtc attatggtgt ccttacctgt 1260
gggagctgta aggtcttctt taagagggca atggaagggc agcacaacta cttatgtgct 1320
ggaagaaatg actgcatcgt tgataaaatc cgcagaaaaa actgcccagc atgtcgcctt 1380
agaaagtgct gtcaggctgg catggtcctt ggaggtcgaa aatttaaaaa gttcaataaa 1440
gtcagagttg tgagagcact ggatgctgtt gctctcccac agccagtggg cgttccaaat 1500
gaaagccaag ccctaagcca gagattcact ttttcaccag gtcaagacat acagttgatt 1560
ccaccactga tcaacctgtt aatgagcatt gaaccagatg tgatctatgc aggacatgac 1620
aacacaaaac ctgacacctc cagttctttg ctgacaagtc ttaatcaact aggcgagagg 1680
caacttcttt cagtagtcaa gtggtctaaa tcattgccag gttttcgaaa cttacatatt 1740
gatgaccaga taactctcat tcagtattct tggatgagct taatggtgtt tggtctagga 1800
tggagatcct acaaacacgt cagtgggcag atgctgtatt ttgcacctga tctaatacta 1860
aatgaacagc ggatgaaaga atcatcattc tattcattat gccttaccat gtggcagatc 1920
ccacaggagt ttgtcaagct tcaagttagc caagaagagt tcctctgtat gaaagtattg 1980
ttacttctta atacaattcc tttggaaggg ctacgaagtc aaacccagtt tgaggagatg 2040
aggtcaagct acattagaga gctcatcaag gcaattggtt tgaggcaaaa aggagttgtg 2100
tcgagctcac agcgtttcta tcaacttaca aaacttcttg ataacttgca tgatcttgtc 2160
aaacaacttc atctgtactg cttgaataca tttatccagt cccgggcact gagtgttgaa 2220
tttccagaaa tgatgtctga agttattgct gcacaattac ccaagatatt ggcagggatg 2280
gtgaaacccc ttctctttca taaaaagtga 2310
<210> 7
<211> 1206
<212> DNA
<213> 人(Homo sapiens)
<400> 7
atggcgcaaa ggtacgatga gctgccccat tacggcggga tggacggagt aggggttccc 60
gcttccatgt acggagaccc tcacgcgccg cggccgatcc ccccggttca ccacctgaac 120
cacgggccgc cgctccacgc cacacagcac tacggcgcgc acgccccgca ccccaatgtc 180
atgccggcca gtatgggatc cgctgtcaac gacgccttga agcgggacaa ggacgcgatc 240
tatgggcacc cgttgtttcc tctgttagct ctggtctttg agaagtgcga gctggcgacc 300
tgcactcccc gggaacctgg agtggctggc ggagacgtct gctcctccga ctccttcaac 360
gaggacatcg cggtcttcgc caagcaggtt cgcgccgaaa agccactttt ttcctcaaat 420
ccagagctgg acaatttgat gatacaagca atacaagtac taaggtttca tcttttggag 480
ttagaaaagg tccacgaact gtgcgataac ttctgccacc gatacattag ctgtttgaag 540
gggaaaatgc ccatcgacct cgtcattgat gaaagagacg gcagctccaa gtcagatcat 600
gaagaacttt caggctcctc cacaaatctc gctgaccata acccttcttc ttggcgagac 660
cacgatgatg caacctcaac ccactcagca ggcaccccag ggccctccag tgggggccat 720
gcttcccaga gcggagacaa cagcagtgag caaggggatg gtttagacaa cagtgtagct 780
tcacctggta caggtgacga tgatgatccg gataaggaca aaaaacgcca gaagaaaaga 840
ggcattttcc ccaaagtagc aacaaatatc atgagagcat ggctcttcca gcatctcaca 900
catccgtacc cttccgaaga gcagaagaaa cagttagcgc aagacacagg acttacaatt 960
ctccaagtaa acaactggtt tattaatgcc agaagaagaa tagtacagcc catgattgac 1020
cagtcaaatc gagcaggttt tcttcttgat ccttcagtga gccaaggagc agcatatagt 1080
ccagagggtc agcccatggg gagctttgtg ttggatggtc agcaacacat ggggatccgg 1140
cctgcaggac ctatgagtgg aatgggcatg aatatgggca tggatgggca atggcactac 1200
atgtaa 1206
<210> 8
<211> 1203
<212> DNA
<213> 人(Homo sapiens)
<400> 8
atgaatccgg cctcggcgcc ccctccgctc ccgccgcctg ggcagcaagt gatccacgtc 60
acgcaggacc tagacacaga cctcgaagcc ctcttcaact ctgtcatgaa tccgaagcct 120
agctcgtggc ggaagaagat cctgccggag tctttcttta aggagcctga ttcgggctcg 180
cactcgcgcc agtccagcac cgactcgtcg ggcggccacc cggggcctcg actggctggg 240
ggtgcccagc atgtccgctc gcactcgtcg cccgcgtccc tgcagctggg caccggcgcg 300
ggtgctgcgg gtagccccgc gcagcagcac gcgcacctcc gccagcagtc ctacgacgtg 360
accgacgagc tgccactgcc cccgggctgg gagatgacct tcacggccac tggccagagg 420
tacttcctca atcacataga aaaaatcacc acatggcaag accctaggaa ggcgatgaat 480
cagcctctga atcatatgaa cctccaccct gccgtcagtt ccacaccagt gcctcagagg 540
tccatggcag tatcccagcc aaatctcgtg atgaatcacc aacaccagca gcagatggcc 600
cccagtaccc tgagccagca gaaccacccc actcagaacc cacccgcagg gctcatgagt 660
atgcccaatg cgctgaccac tcagcagcag cagcagcaga aactgcggct tcagagaatc 720
cagatggaga gagaaaggat tcgaatgcgc caagaggagc tcatgaggca ggaagctgcc 780
ctctgtcgac agctccccat ggaagctgag actcttgccc cagttcaggc tgctgtcaac 840
ccacccacga tgaccccaga catgagatcc atcactaata atagctcaga tcctttcctc 900
aatggagggc catatcattc gagggagcag agcactgaca gtggcctggg gttagggtgc 960
tacagtgtcc ccacaactcc ggaggacttc ctcagcaatg tggatgagat ggatacagga 1020
gaaaacgcag gacaaacacc catgaacatc aatccccaac agacccgttt ccctgatttc 1080
cttgactgtc ttccaggaac aaacgttgac ttaggaactt tggaatctga agacctgatc 1140
cccctcttca atgatgtaga gtctgctctg aacaaaagtg agccctttct aacctggctg 1200
taa 1203
<210> 9
<211> 771
<212> DNA
<213> 人(Homo sapiens)
<400> 9
atgcagccgg ctaaggaagt gacaaaggcg tcggacggca gcctcctggg ggacctcggg 60
cacacaccac ttagcaagaa ggagggtatc aagtggcaga ggccgaggct cagccgccag 120
gctttgatga gatgctgcct ggtcaagtgg atcctgtcca gcacagcccc acagggctca 180
gatagcagcg acagtgagct ggagctgtcc acggtgcgcc accagccaga ggggctggac 240
cagctgcagg cccagaccaa gttcaccaag aaggagctgc agtctctcta caggggcttt 300
aagaatgagt gtcccacggg cctggtggac gaagacacct tcaaactcat ttacgcgcag 360
ttcttccctc agggagatgc caccacctat gcacacttcc tcttcaacgc ctttgatgcg 420
gacgggaacg gggccatcca ctttgaggac tttgtggttg gcctctccat cctgctgcgg 480
ggcacagtcc acgagaagct caagtgggcc tttaatctct acgacattaa caaggatggc 540
tacatcacca aagaggagat gctggccatc atgaagtcca tctatgacat gatgggccgc 600
cacacctacc ccatcctgcg ggaggacgcg ccggcggagc acgtggagag gttcttcgag 660
aaaatggacc ggaaccagga tggggtagtg accattgaag agttcctgga ggcctgtcag 720
aaggatgaga acatcatgag ctccatgcag ctgtttgaga atgtcatcta g 771
<210> 10
<211> 2133
<212> DNA
<213> 人(Homo sapiens)
<400> 10
atgtctgttc catcatcact gagccagtcg gccattaatg ccaacagcca cggaggcccc 60
gcactgagcc tacccctgcc tctgcacgct gcccacaacc agctgctcaa cgccaagctg 120
caggccacag ctgtgggacc caaggacctg cgcagcgcca tgggggaggg tggtgggcct 180
gagccaggcc ctgccaatgc caagtggcta aaagagggcc agaaccagct ccggcgggcc 240
gccacggccc accgtgacca gaatcgcaat gtgaccttga ccttggcgga ggaggccagc 300
caggagcctg agatggcacc cttgggcccc aaaggcctga tacacctgta ctctgagctg 360
gagctctcag ctcacaacgc agccaaccga ggcctacgag gacctggcct gatcatcagc 420
actcaagagc aggggccaga tgagggagag gagaaggcgg ccggggaggc cgaggaggag 480
gaggaggatg atgatgatga agaggaggag gaggacttat cttctccccc agggctgcct 540
gagcccctgg agagtgtgga ggcccctccc aggccccaag cccttacaga tggcccccgg 600
gaacacagca agagtgccag cctcctgttt ggcatgcgga acagtgcagc cagtgatgag 660
gactcaagct gggctacctt atcccagggc agcccctcct atggctcccc agaggacaca 720
gattccttct ggaaccccaa cgccttcgag acggattccg acctgccggc tggatggatg 780
agggtccagg acacctcagg gacctattac tggcacatcc caacagggac cacccagtgg 840
gaaccccccg gccgggcctc cccctcacag gggagcagcc cccaagagga gtcccagctc 900
acctggacag gttttgctca tggagaaggc tttgaggatg gagaattttg gaaggatgaa 960
cccagtgatg aggccccaat ggagctggga ctgaaggaac ctgaggaggg gacgttgacc 1020
ttcccagctc agagcctcag cccagagccg ttgccccaag aggaggagaa gcttccccca 1080
cggaatacca acccagggat caagtgtttc gccgtgcgct ccctaggctg ggtagagatg 1140
accgaggagg agctggcccc tggacgcagc agtgtggcag tcaacaattg catccgtcag 1200
ctctcttacc acaaaaacaa cctgcatgac cccatgtctg ggggctgggg ggaaggaaag 1260
gatctgctac tgcagctgga ggatgagaca ctaaagctag tggagccaca gagccaggca 1320
ctgctgcacg cccaacccat catcagcatc cgcgtgtggg gcgtcgggcg ggacagtgga 1380
agagagaggg actttgccta cgtagctcgt gataagctga cccagatgct caagtgccac 1440
gtgtttcgct gtgaggcacc tgccaagaac atcgccacca gcctgcatga gatctgctct 1500
aagatcatgg ccgaacggcg taatgcccgc tgcttggtaa atggactctc cctggaccac 1560
tctaaacttg tggatgtccc tttccaagtg gaattcccag cgcctaagaa tgagttggtc 1620
cagaagttcc aagtctatta cctggggaat gtacctgttg ctaaacctgt tggggtagat 1680
gtgattaatg gggccctcga gtcagtcctg tcctccagca gccgtgaaca atggacccca 1740
agtcatgtca gtgtggcccc tgctaccctc accatcttgc accagcagac agaggcagtg 1800
ctgggagagt gtcgggtgcg tttcctctcc ttcctggccg tgggcagaga tgtccacacg 1860
tttgcattca tcatggctgc cggcccagcc tccttctgct gccacatgtt ctggtgcgag 1920
cccaatgctg ccagcctctc agaggctgtg caggctgcgt gcatgcttcg ctaccagaag 1980
tgtctggatg cccgttccca ggcctccacc tcctgcctcc cagcaccccc tgctgagtct 2040
gtggcacggc gtgtagggtg gactgtccgc aggggtgttc agtcgctgtg gggctccctg 2100
aagcccaaac ggctgggggc ccatacccca tga 2133
<210> 11
<211> 756
<212> DNA
<213> 人(Homo sapiens)
<400> 11
atggagctgt cagccatcgg cgagcaggtg ttcgccgtgg agagcatccg gaagaagcgc 60
gtgcggaagg gtaaagtcga gtatctggtg aagtggaaag gatggccccc aaagtacagc 120
acgtgggagc cagaagagca catcttggac ccccgcctcg tcatggccta cgaggagaag 180
gaggagagag accgagcatc ggggtatagg aagagaggtc cgaaacccaa gcggcttctg 240
ctgcagcggc tgtacagcat ggacctgcgg agctcccaca aggccaaggg caaggagaag 300
ctctgcttct ccctgacgtg cccactcggc agcgggagcc ctgagggggt ggtcaaggcg 360
ggggcacctg agctggtgga caagggcccc ttggtgccca ccctgccctt cccgctccgc 420
aagccccgaa aggcccacaa gtacctgcgg ctctcgcgca agaagttccc gccccgcggg 480
cccaacctgg agagccacag ccatcgacgg gagctcttcc tgcaggagcc accggcccca 540
gacgtcctgc aggcggctgg cgagtgggag cctgctgcgc agccccctga agaggaggca 600
gatgccgacc tggccgaggg gccccctccc tggacacctg cgctcccctc aagtgaggtg 660
accgtgaccg acatcaccgc caactccatc accgtcacct tccgcgaggc ccaggcagct 720
gagggcttct tccgagaccg cagtgggaag ttctga 756
<210> 12
<211> 654
<212> DNA
<213> 人(Homo sapiens)
<400> 12
atgagtctgg taggtggttt tccccaccac ccggtggtgc accacgaggg ctacccgttt 60
gccgccgccg ccgccgcagc tgccgccgcc gccgccagcc gctgcagcca tgaggagaac 120
ccctacttcc atggctggct catcggccac cccgagatgt cgccccccga ctacagcatg 180
gccctgtcct acagccccga gtatgccagc ggcgccgccg gcctggacca ctcccattac 240
gggggggtgc cgccgggcgc cgggcccccg ggcctggggg ggccgcgccc ggtgaagcgc 300
cgaggcaccg ccaaccgcaa ggagcggcgc aggactcaga gcatcaacag cgccttcgcc 360
gaactgcgcg agtgcatccc caacgtaccc gccgacacca aactctccaa aatcaagacc 420
ctgcgcctgg ccaccagcta catcgcctac ctcatggacc tgctggccaa ggacgaccag 480
aatggcgagg cggaggcctt caaggcagag atcaagaaga ccgacgtgaa agaggagaag 540
aggaagaagg agctgaacga aatcttgaaa agcacagtga gcagcaacga caagaaaacc 600
aaaggccgga cgggctggcc gcagcacgtc tgggccctgg agctcaagca gtga 654
<210> 13
<211> 504
<212> DNA
<213> 人(Homo sapiens)
<400> 13
atgctctcag tccagccaga caccaagccg aaaggttgtg ctggctgcaa ccgaaagatc 60
aaggaccggt atcttctaaa ggcactggac aaatactggc atgaagactg cctgaagtgt 120
gcctgctgtg actgtcgctt gggagagcat ttgaagaggt gtggatctat atacatacat 180
gctgcacata cagagattgg aatctgtgta accttagaat ggccattacc ttttgtcatc 240
attgacttta gccaacaaat caccatagct tggctctttg gtgtaacggg aaactgcgct 300
gcctgtagta agctcatccc tgcctttgag atggtgatgc gtgccaagga caatgtttac 360
cacctggact gctttgcatg tcagctttgt aatcagagat tttgtgttgg agacaaattt 420
ttcctaaaga ataacatgat cctttgccag acggactacg aggaaggttt aatgaaagaa 480
ggttatgcac cccaggttcg ctga 504

Claims (10)

1.与结直肠癌预后相关的标志分子,其特征在于,包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。
2.根据权利要求1所述的标志分子,其特征在于,包括SEQ ID NO:1~SEQ ID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。
3.评价结直肠癌预后效果的检测试剂盒,其特征在于,包括:用于检测与结直肠癌预后相关的标志分子表达量的试剂;所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列;所述表达量为标志分子对应的mRNA含量。
4.根据权利要求3所述的试剂盒,其特征在于,所述标志分子包括SEQ ID NO:1~SEQID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。
5.根据权利要求3或4所述的试剂盒,其特征在于,用于检测所述标志分子表达量的试剂包括针对所述标志分子的引物对;优选还包括针对所述标志分子的特异性荧光探针。
6.结直肠癌预后效果的评价模型,其特征在于,所述模型具体为:
RiskScore=-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1;
其中,ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量,MITF代表样品中如SEQID NO:4所示基因序列的表达量,APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量,CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量,HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量,LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量,KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量,WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量,MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量,PGR代表样品中如SEQ ID NO:6所示基因序列的表达量,NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量,MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量,TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
7.结直肠癌预后效果的评价系统,其特征在于,所述系统包括:
(1)数据输入模块,用于将与结直肠癌预后相关的标志分子的表达量检测结果输入模型计算模块;所述表达量为标志分子对应的mRNA含量;
所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列;
(2)模型计算模块,用于对输入的检测结果进行计算处理,得到被测患者的预后效果数据;
(3)结果输出模块,用于根据结直肠癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果;
优选地,所述模型计算模块采用的模型具体为:
RiskScore=-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1;
其中,ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量,MITF代表样品中如SEQID NO:4所示基因序列的表达量,APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量,CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量,HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量,LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量,KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量,WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量,MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量,PGR代表样品中如SEQ ID NO:6所示基因序列的表达量,NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量,MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量,TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
8.根据权利要求7所述的评价系统,其特征在于,所述标志分子包括SEQ ID NO:1~SEQID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。
9.权利要求1或2所述标志分子、权利要求3~5任意一项所述试剂盒、权利要求6所述评价模型或权利要求7或8所述评价系统在结直肠癌诊断中的应用。
10.权利要求1或2所述标志分子、权利要求3~5任意一项所述试剂盒、权利要求6所述评价模型或权利要求7或8所述评价系统在结直肠癌患者预后评价中的应用。
CN202111060999.5A 2021-09-10 2021-09-10 与结直肠癌预后相关的标志分子 Pending CN113881771A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111060999.5A CN113881771A (zh) 2021-09-10 2021-09-10 与结直肠癌预后相关的标志分子

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111060999.5A CN113881771A (zh) 2021-09-10 2021-09-10 与结直肠癌预后相关的标志分子

Publications (1)

Publication Number Publication Date
CN113881771A true CN113881771A (zh) 2022-01-04

Family

ID=79008745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111060999.5A Pending CN113881771A (zh) 2021-09-10 2021-09-10 与结直肠癌预后相关的标志分子

Country Status (1)

Country Link
CN (1) CN113881771A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060188883A1 (en) * 2003-03-08 2006-08-24 Murray Graeme I Markers for colorectal cancer
CN108034724A (zh) * 2017-12-29 2018-05-15 中山大学肿瘤防治中心 用于预测结直肠癌预后及死亡风险的环状rna分子标记物及其应用
CN109486948A (zh) * 2018-10-16 2019-03-19 温州医科大学 一种功能驱动的个体化预测结直肠癌预后的多分子标志物及其装置与评价方法
CN113151483A (zh) * 2021-05-25 2021-07-23 复旦大学附属中山医院 结直肠癌代谢基因预后预测模型

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060188883A1 (en) * 2003-03-08 2006-08-24 Murray Graeme I Markers for colorectal cancer
CN108034724A (zh) * 2017-12-29 2018-05-15 中山大学肿瘤防治中心 用于预测结直肠癌预后及死亡风险的环状rna分子标记物及其应用
CN109486948A (zh) * 2018-10-16 2019-03-19 温州医科大学 一种功能驱动的个体化预测结直肠癌预后的多分子标志物及其装置与评价方法
CN113151483A (zh) * 2021-05-25 2021-07-23 复旦大学附属中山医院 结直肠癌代谢基因预后预测模型

Similar Documents

Publication Publication Date Title
Bornstein et al. Single-cell mapping of the thymic stroma identifies IL-25-producing tuft epithelial cells
CN103403181B (zh) ncRNA及其用途
Heselmeyer-Haddad et al. Single-cell genetic analysis of ductal carcinoma in situ and invasive breast cancer reveals enormous tumor heterogeneity yet conserved genomic imbalances and gain of MYC during progression
Thieblemont et al. Small lymphocytic lymphoma, marginal zone B-cell lymphoma, and mantle cell lymphoma exhibit distinct gene-expression profiles allowing molecular diagnosis
Buffart et al. Gastric cancers in young and elderly patients show different genomic profiles
JP6280206B2 (ja) 局所進行性胃癌に対する予後予測システム
Mastracci et al. Genomic alterations in lobular neoplasia: a microarray comparative genomic hybridization signature for early neoplastic proliferationin the breast
CN109072309A (zh) 癌症进化检测和诊断
CN106164296A (zh) 用于预测对抗血管生成药的应答和癌症预后的分子诊断测试
Kwon et al. Prognosis of stage III colorectal carcinomas with FOLFOX adjuvant chemotherapy can be predicted by molecular subtype
CN104212889B (zh) 一种用于诊断Xp11.2 易位性血管周上皮样细胞肿瘤的探针组合及其应用
CN110423816A (zh) 乳腺癌预后量化评估系统及应用
CN109837340A (zh) 用于肺癌无创诊断的外周血基因标记物
CN109666745A (zh) 染色体1p/19q联合杂合性缺失的检测方法及试剂盒
US20190024173A1 (en) Computer System And Methods For Harnessing Synthetic Rescues And Applications Thereof
Lu et al. Comparison of Xiphophorus and human melanoma transcriptomes reveals conserved pathway interactions
CN108026578A (zh) Lrp5作为用于鉴定免疫细胞特别是b细胞的表观遗传标志物
CN109402252A (zh) 急性髓系白血病风险评估基因标志物及其应用
CN106967722A (zh) 与水牛泌乳相关基因srebp1及其作为分子标记的应用
DK2148932T3 (en) SOX11 expression in malignant lymphomas
CN109439747A (zh) 一组用于肺癌诊断的circRNA标志物及其应用
KR102578551B1 (ko) 편평상피암에 대한 화학 방사선 요법의 유효성을 평가하기 위한 방법
CN113881771A (zh) 与结直肠癌预后相关的标志分子
Zhao et al. Osteopontin promoter polymorphisms at locus-443 are associated with metastasis and poor prognosis of human intrahepatic cholangiocarcinoma in Chinese population
Pinheiro et al. Significant overexpression of oligophrenin-1 in colorectal tumors detected by cDNA microarray analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination