CN113337605B - 与胃癌预后相关的标志分子 - Google Patents

与胃癌预后相关的标志分子 Download PDF

Info

Publication number
CN113337605B
CN113337605B CN202110594423.0A CN202110594423A CN113337605B CN 113337605 B CN113337605 B CN 113337605B CN 202110594423 A CN202110594423 A CN 202110594423A CN 113337605 B CN113337605 B CN 113337605B
Authority
CN
China
Prior art keywords
seq
gene sequence
sample
sequence shown
exp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110594423.0A
Other languages
English (en)
Other versions
CN113337605A (zh
Inventor
王艳
余和芬
黄蔚
霍苗苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Medical University
Original Assignee
Capital Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Medical University filed Critical Capital Medical University
Priority to CN202110594423.0A priority Critical patent/CN113337605B/zh
Publication of CN113337605A publication Critical patent/CN113337605A/zh
Application granted granted Critical
Publication of CN113337605B publication Critical patent/CN113337605B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及与胃癌预后相关的标志分子,所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8以及SEQ ID NO:9所示的至少一个基因序列。本发明联合m6A修饰特征和肿瘤免疫微环境所筛选出的标志分子,可能在胃癌患者的预后评估中发挥重要的作用。

Description

与胃癌预后相关的标志分子
技术领域
本发明涉及癌症治疗以及预后评价领域,具体涉及与胃癌预后相关的标志分子以及检测试剂盒。
背景技术
胃癌是全球最常见的消化道肿瘤之一。随着生物信息技术和医疗手段的进步,基因组分析已成为国际上发现胃癌新生物靶点的主要方法。研究表明,包括DNA甲基化、组蛋白修饰、RNA修饰在内的基因组表观遗传修饰在肿瘤发生发展中起到重要作用,癌症表观遗传改变的广泛失调和这些修饰的动态变化特征为肿瘤治疗干预和预后预测提供了可能。6-甲基腺嘌呤(m6A)是真核生物mRNA最常见的转录后修饰之一,其含量占总腺苷酸的0.1-0.4%。与DNA和组蛋白的修饰相似,RNA的m6A修饰也是一个动态可逆的过程,由被称为“writers”,“erasers”和“readers”的甲基化酶,去甲基化酶和结合蛋白所调节。m6A的修饰过程由m6A甲基化酶复合体来实现,包括甲基转移酶METTL3,METTL14以及其他调节因子如WTAP,KIAA1429,ZC3H13和RBM15/RBM15B,近期研究报道了新的甲基转移酶METTL16,ZCCHC4和METTL5;m6A的去甲基化过程由FTO和ALKBH5来完成;m6A结合蛋白的报道不断更新,主要包括YTHDC1,YTHDC2,YTHDF1,YTHDF2,YTHDF3,IGF2BP1,HNRNPA2B1,HNRNPC,FMR1,LRPPRC,ELAVL1。这些m6A修饰相关基因在多种层面影响基因的表达,对于许多正常的生物过程至关重要,包括胚胎干细胞和造血干细胞的自我更新和分化,组织发育,昼夜节律,热休克或DNA损伤反应以及性别决定,此外,m6A的总体丰度及其调节因子的表达水平在各种类型的癌症中经常失调,对于癌症的发生、进展、转移以及耐药性和癌症复发至关重要。在胃癌中,与正常对照组织相比,人胃癌组织中mRNA或总RNA的整体m6A丰度显著增加,METTL3水平的升高也可以作为预后不良的独立预测因子。与正常胃黏膜相比,胃癌IGF2BP3的表达显著增加,并且IGF2BP3与HDGF mRNA中m6A位点的结合增强了其稳定性,导致HDGF的表达和分泌增加以及随后的胃癌生长和肝转移。
随着科学研究的进步,大量的研究发现肿瘤的进展不只是一个只涉及肿瘤细胞的遗传和表观遗传变异的过程。肿瘤细胞依赖于生长和存活的微环境也在肿瘤的进展中起着至关重要的作用。癌细胞通过与其他肿瘤微环境(TME)成分的直接和间接相互作用,如诱导增殖和血管生成、抑制凋亡、避免缺氧以及诱导免疫耐受等,引起多种生物学行为的改变。随着对肿瘤微环境多样性和复杂性的理解不断加深,新出现的证据揭示了它在肿瘤进展、免疫逃逸中的关键作用,以及它对免疫治疗反应的影响,预测免疫检查点阻断反应的生物标志物正在被广泛研究,以进一步改善精确免疫治疗。
目前,尚且没有全面地基于m6ARNA甲基化调控因子联合肿瘤免疫细胞浸润对胃癌样本进行预后模型构建,也未有联合m6ARNA甲基化调控因子和肿瘤免疫细胞浸润筛选HubGenes构建风险预测模型的报道。
发明内容
本发明的目的是提供一组与m6A特征和肿瘤免疫微环境密切相关的标志分子来预测胃癌的预后,先是利用TCGA数据库中胃癌患者基因表达谱数据,基于m6A修饰的基因联合肿瘤免疫微环境筛选与胃癌预后相关的特征基因集,然后通过k-means聚类分析、PCA分析、COX回归分析、WGCNA分析、ROC曲线分析和风险评分筛选出9个与胃癌预后密切相关的基因。本发明提供的标志分子为临床治疗策略的制定提供帮助,提高患者的生命质量。
本发明的第一目的在于提供分离的与胃癌预后相关的标志分子,包括:如SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8以及SEQ ID NO:9所示的至少一个基因序列。
具体而言,本发明提供的与胃癌预后相关的标志分子可以是SEQ ID NO:1~SEQID NO:9中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个或者全部九个序列。
其中,如SEQ ID NO:1所示的基因序列(其编码的蛋白又名ZFP64),通过增强p65亚基的激活,促进巨噬细胞toll样受体触发促炎和I型干扰素的产生;CGA-LUAD检测ZFP64在肿瘤组织中的表达及总体生存分析发现,ZFP64在肺腺癌组织和肺腺癌细胞系中表达较高,与不良预后相关;过表达ZFP64通过激活Notch通路促进肺腺癌细胞的增殖,Notch抑制剂MK-0752抑制过表达ZFP64对H1975细胞活力、细胞周期、迁移、EMT进展和Notch通路激活的影响。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:2所示的基因序列(其编码的蛋白又名TOMM34),CD4+T细胞特异性诱导线粒体蛋白TOMM34的表达;有报道称TOMM34在乳腺癌中高表达,并且是其预后不良的机制。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:3所示的基因序列(其编码的蛋白又名DNMT3B),DNMT3B在非小细胞肺癌中广泛上调,一项临床前研究表明,靶向EGFR的昔妥珠单抗(necitumumab)联合顺铂/吉西他滨可以显著提高抑制肿瘤的效果,有助于增加肿瘤细胞凋亡和/或降低肿瘤细胞增殖。在A549细胞构建的皮下肿瘤模型中这一过程会增加hsa-mir-29b的表达,hsa-miR-29b下调DMNT3B可减少肿瘤抑制基因的启动子甲基化,促进其表达增加。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:4所示的基因序列(其编码的蛋白又名CSTF1),CSTF1基因与DNA损伤修复有关,编码蛋白CstF-50。预测位于AURKA旁边的CSTF1变异可能与BRCA2突变携带者的乳腺癌风险相关。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:5所示的基因序列(其编码的蛋白又名TM9SF4),TM9SF4是一个新发现的癌基因,主要参与细胞黏附、先天免疫和吞噬作用。在人类中,TM9SF4的功能和生物学意义目前正在研究中。然而,人们发现TM9SF4在人类转移性黑素瘤、急性髓细胞白血病(AMLs)和骨髓增生异常综合征的小部分患者中过表达,这与该基因的致癌功能一致。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:6所示的基因序列(其编码的蛋白又名TTI1),Tti1与mTOR具有结构上的相互作用,参与组成了mTORC1和mTORC2。SCFFbxo9泛素连接酶可以靶向降解们TORC1内的Tti1,进而调控mTOR对生长因子的反应性。Tti1的下调抑制了mTORC1底物(S6K1和4E-BP1)和mTORC2底物(Akt)的磷酸化,并诱导自噬。在多发性骨髓瘤中,SCFFbxo9和CK2通过Tel2/Tti1降解介导细胞对生长因子抑制的反应,并促进生存。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:7所示的基因序列(其编码的蛋白又名ACTR5),有报道称,在神经母细胞瘤中,利用siRNA敲降ACTR5可以降低细胞的增殖和分化能力,这说明在神经母细胞瘤中ACTR5具有促瘤作用。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:8所示的基因序列(其编码的蛋白又名STK35),有报道称,在骨肉瘤中STK35调控骨肉瘤细胞的凋亡和增殖,起到癌基因的作用。此外,在结直肠癌中STK35与肿瘤的进展密切相关,并且维持肿瘤细胞的耐药性。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
如SEQ ID NO:9所示的基因序列(其编码的蛋白又名SSL18L1),有报道称,SS18L1与子宫内膜浆液性癌的发生发展相关。目前,尚未见该基因序列或相应的蛋白与胃癌预后相关的报道。
本发明提供的所述标志分子是依据m6A修饰特征和肿瘤免疫微环境所筛选得到,经验证与胃癌预后高度相关,可以作为临床胃癌患者预后评价的生物标志,从而提高患者的生命质量。
本发明的第二目的是提供评价胃癌预后效果的检测试剂盒,其中包括:用于检测与胃癌预后相关的标志分子表达量的试剂;所述标志分子包括:如SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8以及SEQ ID NO:9所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:9中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个或者全部九个序列。
作为本发明的优选方案,所述试剂盒用于检测标志分子mRNA的表达量,所述试剂包括针对所述标志分子的反转录引物对,优选还包括针对所述标志分子的特异性荧光探针,通过实时监控PCR体系中的荧光信号,对检测患者样品中所述标志分子的表达量进行定量检测。
本发明的第三目的是提供胃癌预后效果的评价模型,所述评价模型具体为:
Risk Score=EXP ZFP64*(-0.044)+EXP TOMM34*(-0.041)+EXP DNMT3B*(0.131)+EXP CSTF1*(-0.273)+EXP TM9SF4*(0.264)+EXP TTI1*(0.136)+EXP ACTR5*(-0.255)+EXP STK35*(-0.006)+EXP SS18L1*(-0.047);
其中,ZFP64代表样品中如SEQ ID NO:1所示基因序列的表达量,TOMM34代表样品中如SEQ ID NO:2所示基因序列的表达量,DNMT3B代表样品中如SEQ ID NO:3所示基因序列的表达量,CSTF1代表样品中如SEQ ID NO:4所示基因序列的表达量,TM9SF4代表样品中如SEQ ID NO:5所示基因序列的表达量,TTI1代表样品中如SEQ ID NO:6所示基因序列的表达量,ACTR5代表样品中如SEQ ID NO:7所示基因序列的表达量,STK35代表样品中如SEQ IDNO:8所示基因序列的表达量,SS18L1代表样品中如SEQ ID NO:9所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
上述模型可以用于评价胃癌患者的预后情况。
本发明的第四目的是提供胃癌预后效果的评价系统,所述评价系统包括:(1)数据输入模块,用于将与胃癌预后相关的标志分子的表达量检测结果输入模型计算模块;(2)模型计算模块,用于对输入的检测结果进行计算处理,得到被测患者的预后效果数据;(3)结果输出模块,用于根据胃癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果。
所述与胃癌预后相关的标志分子包括:如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8以及SEQ ID NO:9所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:9中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个或者全部九个序列。
作为本发明的优选方案,所述模型计算模块采用的模型具体为:
Risk Score=EXP ZFP64*(-0.044)+EXP TOMM34*(-0.041)+EXP DNMT3B*(0.131)+EXP CSTF1*(-0.273)+EXP TM9SF4*(0.264)+EXP TTI1*(0.136)+EXP ACTR5*(-0.255)+EXP STK35*(-0.006)+EXP SS18L1*(-0.047);
其中,ZFP64代表样品中如SEQ ID NO:1所示基因序列的表达量,TOMM34代表样品中如SEQ ID NO:2所示基因序列的表达量,DNMT3B代表样品中如SEQ ID NO:3所示基因序列的表达量,CSTF1代表样品中如SEQ ID NO:4所示基因序列的表达量,TM9SF4代表样品中如SEQ ID NO:5所示基因序列的表达量,TTI1代表样品中如SEQ ID NO:6所示基因序列的表达量,ACTR5代表样品中如SEQ ID NO:7所示基因序列的表达量,STK35代表样品中如SEQ IDNO:8所示基因序列的表达量,SS18L1代表样品中如SEQ ID NO:9所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量。
在所述结果输出模块,根据Risk Score的值的高低进行风险高低评估,据此对被测患者的预后效果数据进行评价。
在进行临床实际评估之前,可通过大数据的方式采集大量患者数据,并将大量数据汇总后统计得到的风险评分中位数或者最优临界值为截断值,将样本分为高、低风险组,据此对被测患者的预后效果数据进行评价。即如果患者的Risk Score值高于该截断值,则为高风险;如果患者的Risk Score值低于该截断值,则为低风险。
本发明的第五目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在胃癌诊断中的应用。
本发明的第六目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在胃癌患者预后评价中的应用。
本发明从发生m6A修饰的角度出发,基于m6ARNA甲基化修饰调控基因,将胃癌患者样本进行一致性聚类分为存在显著预后差异的两组;然后根据预后相关的5种免疫细胞浸润比例将胃癌患者样本分为存在显著预后差异的高低浸润两组。后续基于胃癌差异基因进行WGCNA分析筛选得到一个与m6ARNA甲基化簇和免疫浸润分组均相关的模块,进而根据MM和GS筛选出37个Hub Genes,采用LASSO回归,构建了一个9基因的风险预测模型。在用特征计算的风险评分预测肿瘤患者的预后时,其ROC曲线下面积值较高,表明这9个基因能很好的反应胃癌患者的预后,风险评分对样本的分类效果较好。
附图说明
图1为m6A甲基化调控因子一致性聚类结果示意图;其中,A为亚组相关性;B为PCA分析;C为聚类累积分布函数;D为DeltaArea Plot;E为甲基化调控因子在两组的分布。
图2为m6A簇间生存曲线及突变分布结果示意图;其中,A为对两组样本进行生存分析比较的结果;B为对两组样本的突变情况进行分析比较的结果。
图3为样本免疫浸润分组与m6A的结果示意图;其中,A为免疫细胞森林图;B为不同免疫浸润分组生存曲线;C为5种免疫细胞在不同免疫浸润分组的分布热图;D为m6A甲基化调控因子的表达水平在不同免疫浸润分组的分布;E为m6A甲基化调控因子的表达与免疫细胞比例的相关性。
图4为差异基因火山图与热图;其中,A为火山图;B为取logFC绝对值排在前100的DEGs进行热图展示。
图5为WGCNA共表达模块挖掘结果示意图;其中,A为不同软阈值的拓扑网络分析;B为基因系统树状图和模块颜色;C为模块-特征相关性;D为基因模块GS均值误差图;E为HubGenes相关性热图。
图6为Hub Gene与甲基化因子、免疫细胞的相关性结果示意图;其中,A免疫细胞与DNMT3B的相关性;B为M0态巨噬细胞与甲基化因子DNMT3B的相关性;C为m6A甲基化因子与DNMT3B的相关性;D为IGF2BP2与DMNT3B的相关性。
图7为预后相关基因结果示意图;其中,A为LASSO回归自变量的变化轨迹,横坐标表示自变量Lambda的对数,纵坐标表示自变量的系数;B为LASSO回归每个Lambda的置信区间;C、D分别为基因生存曲线。
图8为预后模型构建结果示意图;其中,A为1、3、5年AUC曲线;B为高低危组预后比较;C、D、E分别为风险评分从小到大进行排序,横坐标表示样本,C的纵轴表示风险评分,D的纵轴表示生存时间,E的因子表达量z-score归一化热图,随着样本风险评分增加,各因子表达趋势增加/递减。
图9为预后模型验证结果示意图;其中,A为1、3、5年AUC曲线;B为高低危组预后比较;C、D、E分别为风险评分从小到大进行排序,横坐标表示样本,C的纵轴表示风险评分,D的纵轴表示生存时间,E的因子表达量z-score归一化热图,随着样本风险评分增加,各因子表达趋势增加/递减。
图10为临床表型与风险评分的ROC曲线。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例
1、数据的获得
从TCGA数据库中获取胃癌(STAD)患者样本和对照样本(32例)的基因表达谱数据,从cBioportal网站(http://www.cbioportal.org/)获取患者样本的突变信息、生存信息(DFS)、年龄信息、病理分期以及其他临床信息,选择生存信息和病理分期明确并且有表达值的样本,共267例。
从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)下载编号为GSE62254的数据集,芯片平台为GPL570,其中含300个胃癌患者样本的基因表达谱数据和生存信息。
从文献中获得31个针对甲基化过程中不同作用的m6A甲基化调控因子:Writers(甲基转移酶)-METTL3,METTL14,METTL16,WTAP,VIRMA(KIAA1429),RBMX,ZC3H13,RBM15B,ZCCHC4,,CBLL1;Readers(结合蛋白)-YTHDC1,YTHDC2,YTHDF1,YTHDF2,YTHDF3,HNRNPC,HNRNPA2B1,IGF2BP1,IGF2BP2,IGF2BP3,EIF3A,ELAVL1,LRPPRC,PRRC2A,SND1,FMR1;Erasers(去甲基化酶)-FTO,ALKBH5;还有其他调控因子G3BP1,G3BP2。
2、具体步骤
(1)样本一致性聚类
基于31个m6A甲基化调控因子在267例胃癌患者样本中的表达谱数据,使用R的Consensus Cluster Plus包对样本进行pam聚类(k=2),将样本分为Cluster1和Cluster2两组(图1A)。采用主成分分析(PCA)比较两组样本间的差异(图1B),一致性累计分布图(图1C、图1D)可以看出K=2之后折线大幅度升高。对两组样本的31个m6A甲基化调控因子的表达量进行Wilcoxon检验,结果显示YTHDC2,IGF2BP2,YTHDC1以及HNRNPC等17个甲基化因子表达量在两组样本中具有显著差异(图1E)。
(2)m6A簇间亚组生存分析及功能通路分析
使用Kaplan-Meier进行生存分析,用log-rank test检验,定义p<0.05的因素是与生存相关的预后因素。具体而言,同时对两组样本进行生存分析比较,发现两组样本存在显著差异(p<0.05,图2A),统计两组样本的突变情况,结果显示两组样本的突变数量不存在显著差异(p>0.05,图2B)。
使用R软件包GSVA对不同亚组进行通路富集分析(校正的p值<0.05),结果显示不同亚组与p53通路、干扰素γ反应、活性氧通路等功能相关(参见表1所示)。
表1:不同亚组通路富集结果(部分)
Figure BDA0003090422500000051
Figure BDA0003090422500000061
(3)免疫细胞类型比例评估
利用CIBERSORT方法结合LM22特征矩阵估计胃癌样本中22中免疫细胞的比例,对19种细胞的比例进行单因素COX回归分析(其中初始CD4+T细胞比例只在3个样本中大于0,γδT细胞比例只在18个样本中大于0,嗜酸性粒细胞细胞比例只在21个样本中大于0,所以并未进行COX分析)。结果显示初始B细胞、浆细胞以及记忆性CD4+T细胞等5种免疫细胞与预后显著相关(图3A)。基于这5种免疫细胞浸润比例,利用K-means无监督聚类方法将患者样本分为两类(High infiltration/Low infiltration),两类的样本数分别为196例和71例(图3C)。结合患者的生存信息,两类不同免疫浸润的样本在预后上具有显著差异(图3B)。根据免疫浸润分组,对两组样本的31个m6ARNA甲基化因子表达量进行Wilcoxon检验,结果显示YTHDC2、METTL16以及YTHDF1等6个甲基化因子表达量在两组样本中具有显著差异(图3D)。利用R包psych计算31个m6ARNA甲基化因子与22种免疫细胞浸润比例的皮尔逊相关性系数,大部分RNA甲基化因子与记忆性CD4+T细胞、滤泡辅助性T细胞等免疫细胞浸润比例显著相关(图3E)。
(4)差异基因分析
利用TCGA数据库267例患者样本和32例对照样本的基因表达谱数据进行差异基因筛选,根据差异倍数(|logFC|>0.585)和显著性阈值(FDR<0.01),利用R包limma共筛选出4391个差异表达基因,其中上调表达基因3232个,下调表达基因1159个,绘制差异基因火山图(图4A)和热图(图4B)。
(5)权重共表达网络分析
基于4391个差异表达基因,利用R软件包WGCNA进行权重共表达网络的构建。
WGCNA是利用基因表达数据来构建无尺度网络的一种系统生物学方法。首先利用基因表达数据构建相似性矩阵,即计算两两基因之间皮尔森相关系数的绝对值,使用公式1计算基因i和基因j之间的皮尔森相关系数,其中xi和yi分别表示第i和第j个基因的表达值。
公式1:
Figure BDA0003090422500000062
然后使用公式2将基因表达相似性矩阵转换成邻接矩阵,网络类型为signed,其中β为软阈值,将每对基因的皮尔森相关系数β次方,从指数级别强化强相关性和减弱弱相关性。
公式2:
Figure BDA0003090422500000063
下一步使用公式3将临街矩阵转换成拓扑矩阵,拓扑重叠(topological overlapmeasure,TOM)用来描述基因之间的关联程度。
公式3:
Figure BDA0003090422500000064
1-TOM表示基因i和基因j之间的相异程度。使用1-TOM作为距离对基因进行层次聚类,然后使用动态剪切树的方法进行模块的识别。每个模块中最具有代表性的基因称为特征向量基因,简称ME,代表该模块内基因表达的整体水平,是每个模块中的第一主成分,使用公式4来计算ME,其中i表示模块q中的基因,l表示模块q中的芯片样本。
公式4:
Figure BDA0003090422500000071
用某个基因在所有样本中的表达谱与某个特征向量基因ME表达谱的皮尔森相关性来衡量这个基因在该模块中的身份,即模块身份(module membership,MM)。使用公式5计算MM,其中MEq表示第i个基因的表达谱,xi表示模块q的特征向量基因ME,MEiq表示了基因i在模块q中的身份,当MEiq=0,则说明基因i不在模板q中,MEiq越接近+1或者-1,则说明基因i与模板q高度相关。正负号表示了基因i与模板q是正相关还是负相关。
公式5:
Figure BDA0003090422500000072
基因显著性(gene significance),简称GS,用来衡量基因与外部信息的关联程度,GS越高表示基因越具有生物学意义,GS=0,说明这个基因不参与所研究的生物学问题。
具体在本发明中:
聚类结果显示其中1个样本是outlier,因此对剩余样本(266例)进行后续分析。研究表明共表达网络符合无尺度网络,即出现连接度为k的节点的对数log(k)与该节点出现的概率的对数log(p(k))呈负相关,且相关系数要大于0.8。为了确保网络为无尺度网络,我们选择最优β=4(图5A)。下一步将表达矩阵转换为邻接矩阵,然后再将邻接矩阵转换为拓扑矩阵,基于TOM,我们使用average-linkage层次聚类法对基因进行聚类,按照混合动态剪切树的标准,并设置每个基因网络模块最少基因数目为30。在使用动态剪切法确定基因模块后,我们一次计算每个模块的特征向量值(eigengenes),然后对模块进行聚类分析,将距离较近模块合并成新模块,设置height=0.25,共得到了13个模块(图5B)。计算每个模块的ME与样本表型特征的皮尔森相关系数,越高代表模块越重要。图5C中行表示每个模块的特征向量基因,列表示样本表型特征,从红色到蓝色表示相关系数由高到低依次递减。每个小格子里数字表示基因模块与样本表型特征的相关系数,括号中数字表示显著程度p值。随后计算每个基因模块的gene significance值(图5D),GS值越大,表明该模块与cluster1样本越相关。从以上两种分析模块与表型相关性方法的结果来看,与m6ARNA甲基化簇以及免疫浸润均相关且最相关的模块是green。根据module membership(MM)>0.7和genesignificance(GS)>0.1在green模块中筛选得到37个Hub Genes,这37个Hub Gene之间密切相关(图5E)。
计算37个Hub Genes与m6ARNA甲基化调控因子以及免疫浸润细胞比例的相关性,DNMT3B与IGF2BP1、YTHDF1、VIRMA等正相关,与YTHDC2负相关(图6)。
(6)预后模型的构建和验证
对37个Hub Genes采用LASSO法筛选出9个预后相关基因(图7),通过将这9个HubGenes的表达量与LASSO回归系数进行加权,建立预测样本生存的风险评分模型,具体为:Risk Score=EXPZFP64*(-0.044)+EXPTOMM34*(-0.041)+EXPDNMT3B*(0.131)+EXPCSTF1*(-0.273)+EXPTM9SF4*(0.264)+EXPTTI1*(0.136)+EXPACTR5*(-0.255)+EXPSTK35*(-0.006)+EXPSS18L1*(-0.047)
利用ROC对模型的预测结果进行评估,胃癌患者样本在1年,3年,5年的预测结果AUC分别达到0.645,0.678和0.748(图8A)。本发明计算每个样本的风险评分,根据评分中值(-0.063)将样本分为高危组和低危组,两组样本在预后上具有显著差异(图8B)。
根据上面构建的风险预后模型,在验证组GSE62254中进行验证。该模型对验证组的300例胃癌样本在1年,3年,5年的预测结果AUC分别为0.543,0.551和0.535(图9A)。计算每个样本的风险评分,根据最优cutoff值(-0.331)将样本分为高危组和低危组,两组样本在预后上具有显著差异(图9B)。
利用ROC曲线分别展示不同临床因素以及风险评分区分样本的生存情况,结果显示风险评分对样本的分类效果最好(图10)。
由结果可知,本发明提供的标志分子以及模型可以用于胃癌患者的预后评估。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
SEQUENCE LISTING
<110> 首都医科大学
<120> 与胃癌预后相关的标志分子
<130> RYP2011033.0
<160> 9
<170> PatentIn version 3.5
<210> 1
<211> 2046
<212> DNA
<213> Homo sapiens
<400> 1
atgaacgcga gcagcgaggg cgagagcttc gcgggctcgg tgcaaattcc aggtggcaca 60
acggtgctgg tggagctgac tcccgacatc catatctgcg gcatctgcaa gcagcagttt 120
aacaacctgg atgcctttgt agctcacaag caaagtggct gccagctgac aggcacatcc 180
gcagcagccc ccagcacggt ccagtttgta tcggaggaaa cagtgcctgc cacccagact 240
cagaccacca ccagaaccat cacctcggag acccagacaa tcacagtttc agctccagaa 300
tttgtttttg aacatggcta tcaaacttac ctgcccacgg aaagtaatga aaaccagaca 360
gccactgtca tctctctccc tgccaagtca cgcaccaaaa agcccacaac accacctgct 420
cagaaaaggc ttaactgttg ctatccaggt tgccaattca agactgctta tggcatgaag 480
gacatggagc ggcatttaaa aattcacacg ggagacaaac cccataagtg tgaagtctgt 540
ggcaagtgct ttagccggaa agacaagctg aaaactcaca tgcggtgcca cacgggcgtg 600
aagccctaca agtgtaagac gtgtgactac gccgctgccg acagcagcag cctcaacaag 660
cacctgagga tccactcgga cgagcggccc ttcaaatgcc agatctgccc ctacgccagc 720
cgcaactcca gccagctcac tgtccacctg cgatcccaca cgggggacgc ccccttccag 780
tgctggctct gtagcgccaa gttcaaaatc agctcggact tgaaaaggca catgcgggtg 840
cactcggggg agaagccttt caagtgcgag ttctgcaatg tccgctgcac catgaagggg 900
aacctcaagt cgcacatccg tatcaagcac agcgggaata acttcaagtg tcctcattgc 960
gacttcctgg gtgacagcaa agccaccctc cggaagcaca gccgcgtgca ccagtcggag 1020
catcctgaga agtgctcgga atgcagctac tcctgctcca gcaaggccgc cctgcgcatc 1080
cacgagcgta tccactgcac cgaccgccct ttcaagtgca actactgcag cttcgacacc 1140
aaacagccca gcaacctgag caagcacatg aagaagttcc atggggacat ggttaagact 1200
gaggctctag agaggaagga caccggcagg cagagcagcc ggcaggtggc caagctggat 1260
gccaagaaga gtttccactg cgatatatgc gatgcctcct tcatgcggga ggactcgctc 1320
cgcagccaca agagacagca cagtgagtac agtgagagta agaactcgga cgtgaccgtt 1380
ctccagtttc agatcgaccc cagcaagcag cccgccacgc ccctcactgt gggacacctc 1440
caggtgcccc tccagcccag ccaagtgccc cagttcagcg agggaagagt caaaatcatc 1500
gttgggcatc aggtgcccca ggcgaacacc atcgtccagg ctgccgccgc tgcagtgaac 1560
atcgtcccgc ctgccttggt ggcccagaac ccagaggaac tcccagggaa cagccggctg 1620
cagatcctgc gccaggtcag tctgatcgcc ccccctcagt cctcgcggtg tccgagcgag 1680
gcgggcgcaa tgacccagcc ggctgtcctg ctgaccaccc acgagcagac ggacggagcc 1740
actctgcacc agactctcat ccccacggcc tcaggtggcc cccaggaagg ctctggcaat 1800
caaactttca ttaccagttc gggtattact tgcactgact ttgaaggcct aaacgccttg 1860
attcaggagg ggacagcaga agtgacagtg gtgagcgatg gaggccagaa catcgcagtg 1920
gccaccacag cgccaccggt cttctcctcc tcttcccagc aagaactacc caagcagacc 1980
tactccatca ttcaaggggc agcccatcca gctttgctct gtcccgccga ctccattcca 2040
gattag 2046
<210> 2
<211> 930
<212> DNA
<213> Homo sapiens
<400> 2
atggccccca aattcccaga ctctgtggag gagctccgcg ccgccggcaa tgagagtttc 60
cgcaacggcc agtacgccga ggcctccgcg ctctacggcc gcgcgctgcg ggtgctgcag 120
gcgcaaggtt cttcagaccc agaagaagaa agtgttctct actccaaccg agcagcatgt 180
cacttgaagg atggaaactg cagagactgc atcaaagatt gcacttcagc actggccttg 240
gttcccttca gcattaagcc cctgctgcgg cgagcatctg cttatgaggc tctggagaag 300
taccctatgg cctatgttga ctataagact gtgctgcaga ttgatgataa tgtgacgtca 360
gccgtagaag gcatcaacag aatgaccaga gctctcatgg actcgcttgg gcctgagtgg 420
cgcctgaagc tgccctcaat ccccttggtg cctgtttcag ctcagaagag gtggaattcc 480
ttgccttcgg agaaccacaa agagatggct aaaagcaaat ccaaagaaac cacagctaca 540
aagaacagag tgccttctgc tggggatgtg gagaaagcca gagttctgaa ggaagaaggc 600
aatgagcttg taaagaaggg aaaccataag aaagctattg agaagtacag tgaaagcctc 660
ttgtgtagta acctggaatc tgccacgtac agcaacagag cactctgcta tttggtcctg 720
aagcagtaca cagaagcagt gaaggactgc acagaagccc tcaagctgga tggaaagaac 780
gtgaaggcat tctacagacg ggctcaagcc cacaaagcac tcaaggacta taaatccagc 840
tttgcagaca tcagcaacct cctacagatt gagcctagga atggtcctgc acagaagttg 900
cggcaggaag tgaagcagaa cctacactaa 930
<210> 3
<211> 2562
<212> DNA
<213> Homo sapiens
<400> 3
atgaagggag acaccaggca tctcaatgga gaggaggacg ccggcgggag ggaagactcg 60
atcctcgtca acggggcctg cagcgaccag tcctccgact cgcccccaat cctggaggct 120
atccgcaccc cggagatcag aggccgaaga tcaagctcgc gactctccaa gagggaggtg 180
tccagtctgc taagctacac acaggacttg acaggcgatg gcgacgggga agatggggat 240
ggctctgaca ccccagtcat gccaaagctc ttccgggaaa ccaggactcg ttcagaaagc 300
ccagctgtcc gaactcgaaa taacaacagt gtctccagcc gggagaggca caggccttcc 360
ccacgttcca cccgaggccg gcagggccgc aaccatgtgg acgagtcccc cgtggagttc 420
ccggctacca ggtccctgag acggcgggca acagcatcgg caggaacgcc atggccgtcc 480
cctcccagct cttaccttac catcgacctc acagacgaca cagaggacac acatgggacg 540
ccccagagca gcagtacccc ctacgcccgc ctagcccagg acagccagca ggggggcatg 600
gagtccccgc aggtggaggc agacagtgga gatggagaca gttcagagta tcaggatggg 660
aaggagtttg gaatagggga cctcgtgtgg ggaaagatca agggcttctc ctggtggccc 720
gccatggtgg tgtcttggaa ggccacctcc aagcgacagg ctatgtctgg catgcggtgg 780
gtccagtggt ttggcgatgg caagttctcc gaggtctctg cagacaaact ggtggcactg 840
gggctgttca gccagcactt taatttggcc accttcaata agctcgtctc ctatcgaaaa 900
gccatgtacc atgctctgga gaaagctagg gtgcgagctg gcaagacctt ccccagcagc 960
cctggagact cattggagga ccagctgaag cccatgttgg agtgggccca cgggggcttc 1020
aagcccactg ggatcgaggg cctcaaaccc aacaacacgc aaccagtggt taataagtcg 1080
aaggtgcgtc gtgcaggcag taggaaatta gaatcaagga aatacgagaa caagactcga 1140
agacgcacag ctgacgactc agccacctct gactactgcc ccgcacccaa gcgcctcaag 1200
acaaattgct ataacaacgg caaagaccga ggggatgaag atcagagccg agaacaaatg 1260
gcttcagatg ttgccaacaa caagagcagc ctggaagatg gctgtttgtc ttgtggcagg 1320
aaaaaccccg tgtccttcca ccctctcttt gagggggggc tctgtcagac atgccgggat 1380
cgcttccttg agctgtttta catgtatgat gacgatggct atcagtctta ctgcactgtg 1440
tgctgcgagg gccgagagct gctgctttgc agcaacacga gctgctgccg gtgtttctgt 1500
gtggagtgcc tggaggtgct ggtgggcaca ggcacagcgg ccgaggccaa gcttcaggag 1560
ccctggagct gttacatgtg tctcccgcag cgctgtcatg gcgtcctgcg gcgccggaag 1620
gactggaacg tgcgcctgca ggccttcttc accagtgaca cggggcttga atatgaagcc 1680
cccaagctgt accctgccat tcccgcagcc cgaaggcggc ccattcgagt cctgtcattg 1740
tttgatggca tcgcgacagg ctacctagtc ctcaaagagt tgggcataaa ggtaggaaag 1800
tacgtcgctt ctgaagtgtg tgaggagtcc attgctgttg gaaccgtgaa gcacgagggg 1860
aatatcaaat acgtgaacga cgtgaggaac atcacaaaga aaaatattga agaatggggc 1920
ccatttgact tggtgattgg cggaagccca tgcaacgatc tctcaaatgt gaatccagcc 1980
aggaaaggcc tgtatgaggg tacaggccgg ctcttcttcg aattttacca cctgctgaat 2040
tactcacgcc ccaaggaggg tgatgaccgg ccgttcttct ggatgtttga gaatgttgta 2100
gccatgaagg ttggcgacaa gagggacatc tcacggttcc tggagtgtaa tccagtgatg 2160
attgatgcca tcaaagtttc tgctgctcac agggcccgat acttctgggg caacctaccc 2220
gggatgaaca ggcccgtgat agcatcaaag aatgataaac tcgagctgca ggactgcttg 2280
gaatacaata ggatagccaa gttaaagaaa gtacagacaa taaccaccaa gtcgaactcg 2340
atcaaacagg ggaaaaacca acttttccct gttgtcatga atggcaaaga agatgttttg 2400
tggtgcactg agctcgaaag gatctttggc tttcctgtgc actacacaga cgtgtccaac 2460
atgggccgtg gtgcccgcca gaagctgctg ggaaggtcct ggagcgtgcc tgtcatccga 2520
cacctcttcg cccctctgaa ggactacttt gcatgtgaat ag 2562
<210> 4
<211> 1296
<212> DNA
<213> Homo sapiens
<400> 4
atgtacagaa ccaaagtggg cttgaaggac cgccagcagc tctacaagct gatcattagc 60
cagctgctat atgacggcta catcagcatc gccaatggcc tcatcaatga aatcaagcct 120
cagtctgtgt gtgcaccctc ggagcagctc ctgcatctca tcaaactcgg aatggaaaac 180
gatgacaccg cagttcagta tgcaattggt cgttcagata ctgttgcccc tggcacaggg 240
attgacctgg aatttgatgc agatgttcag actatgtccc cagaggcttc tgagtacgaa 300
acatgctatg tcacatcaca taaaggacca tgccgtgtag ctacctatag tagagatgga 360
cagttaatag ctactgggtc tgctgatgct tcgataaaga tacttgacac agagaggatg 420
ttggccaaaa gtgccatgcc aatagaggtc atgatgaatg agaccgcaca acaaaatatg 480
gaaaaccacc cagtgattcg aactctttat gaccatgtgg atgaagtcac gtgccttgct 540
ttccacccaa cagaacagat cctggcttct ggttcaaggg attatactct taaattattt 600
gattattcca aaccatcagc aaaaagagcc ttcaaataca ttcaggaagc tgaaatgtta 660
cgttccatct cttttcatcc ttctggagac tttatacttg tcggaactca gcatcctact 720
cttcgccttt atgatatcaa cacctttcaa tgttttgtct cttgcaatcc tcaagatcaa 780
cacaccgatg ctatatgttc cgttaattac aattctagtg ccaatatgta cgtaactgga 840
agcaaggacg gctgcatcaa attatgggat ggtgtttcaa atcgatgcat cacaactttt 900
gagaaagcac atgacggtgc tgaagtttgt tctgccattt tttccaaaaa ttctaaatac 960
attctctcaa gtggaaaaga ctctgtagct aaactttggg aaatatcaac gggacgaaca 1020
ctggtcagat acacgggcgc gggtttaagt ggacgccagg tgcaccggac acaggctgtg 1080
tttaaccaca ccgaggacta tgtgttgctg cccgacgaga ggacgatcag tctttgctgc 1140
tgggactcga ggacagccga gcggagaaac ctgctgtcgt tggggcacaa caatattgta 1200
cgctgcatag tgcactcccc caccaacccc gggttcatga cgtgcagcga tgacttcaga 1260
gcgcggtttt ggtaccggag atcgaccact gactga 1296
<210> 5
<211> 1878
<212> DNA
<213> Homo sapiens
<400> 5
atgtgtgaaa caagcgcctt ctatgtgcct ggggtcgcgc ctatcaactt ccaccagaac 60
gatcccgtag aaatcaaggc tgtgaagctc accagctctc gaacccagct accttatgaa 120
tactattcac tgcccttctg ccagcccagc aagataacct acaaggcaga gaatctggga 180
gaggtgctga gaggggaccg gattgtcaac acccctttcc aggttctcat gaacagcgag 240
aagaagtgtg aagttctgtg cagccagtcc aacaagccag tgaccctgac agtggagcag 300
agccgactcg tggccgagcg gatcacagaa gactactacg tccacctcat tgctgacaac 360
ctgcctgtgg ccacccggct ggagctctac tccaaccgag acagcgatga caagaagaag 420
gaaaaagatg tgcagtttga acacggctac cggctcggct tcacagatgt caacaagatc 480
tacctgcaca accacctctc attcatcctt tactatcatc gggaggacat ggaagaggac 540
caggagcaca cgtaccgtgt cgtccgcttc gaggtgattc cccagagcat caggctggag 600
gacctcaaag cagatgagaa gagttcgtgc actctgcctg agggtaccaa ctcctcgccc 660
caagaaattg accccaccaa ggagaatcag ctgtacttca cctactctgt ccactgggag 720
gaaagtgata tcaaatgggc ctctcgctgg gacacttacc tgaccatgag tgacgtccag 780
atccactggt tttctatcat taactccgtt gttgtggtct tcttcctgtc aggtatcctg 840
agcatgatta tcattcggac cctccggaag gacattgcca actacaacaa ggaggatgac 900
attgaagaca ccatggagga gtctgggtgg aagttggtgc acggcgacgt cttcaggccc 960
ccccagtacc ccatgatcct cagctccctg ctgggctcag gcattcagct gttctgtatg 1020
atcctcatcg tcatctttgt agccatgctt gggatgctgt cgccctccag ccggggagct 1080
ctcatgacca cagcctgctt cctcttcatg ttcatggggg tgtttggcgg attttctgct 1140
ggccgtctgt accgcacttt aaaaggccat cggtggaaga aaggagcctt ctgtacggca 1200
actctgtacc ctggtgtggt ttttggcatc tgcttcgtat tgaattgctt catttgggga 1260
aagcactcat caggagcggt gccctttccc accatggtgg ctctgctgtg catgtggttc 1320
gggatctccc tgcccctcgt ctacttgggc tactacttcg gcttccgaaa gcagccatat 1380
gacaaccctg tgcgcaccaa ccagattccc cggcagatcc ccgagcagcg gtggtacatg 1440
aaccgatttg tgggcatcct catggctggg atcttgccct tcggcgccat gttcatcgag 1500
ctcttcttca tcttcagtgc tatctgggag aatcagttct attacctctt tggcttcctg 1560
ttccttgttt tcatcatcct ggtggtatcc tgttcacaaa tcagcatcgt catggtgtac 1620
ttccagctgt gtgcagagga ttaccgctgg tggtggagaa atttcctagt ctccgggggc 1680
tctgcattct acgtcctggt ttatgccatc ttttatttcg ttaacaagct ggacatcgtg 1740
gagttcatcc cctctctcct ctactttggc tacacggccc tcatggtctt gtccttctgg 1800
ctgctaacgg gtaccatcgg cttctatgca gcctacatgt ttgttcgcaa gatctatgct 1860
gctgtgaaga tagactga 1878
<210> 6
<211> 2634
<212> DNA
<213> Homo sapiens
<400> 6
atggcagttt ttgatactcc tgaggaggcc tttggtgtct tacgtccagt ctgtgttcag 60
ctcacaaaga cccagacagt ggagaatgtg gagcatctgc agacacgact acaagctgtg 120
agtgacagtg cccttcagga acttcagcag tacatcctct tccctctgcg atttaccctg 180
aagaccccag gtcccaaaag agagcgtttg atccaaagtg tggtggaatg cctcacattt 240
gtcctttctt caacatgtgt gaaagaacag gagcttctcc aggaactctt ttcagaactc 300
tctgcttgtc tgtattcacc cagctcccaa aaacctgcgg ctgtgtccga ggagttgaaa 360
ttggctgtga tccagggact tagcacatta atgcactcag cttatgggga catcattctg 420
actttttatg agccctccat tctgccacgt ttaggatttg ctgtatcttt actgttaggc 480
cttgcagaac aggagaaatc aaagcaaatt aaaattgctg ccttaaaatg tttacaggtt 540
ctactcttgc agtgtgattg tcaggaccat ccaaggtcat tggatgaact tgaacaaaag 600
cagctggggg atttgtttgc ctctttttta cctggaatct caactgcact gaccaggctt 660
atcacaggag actttaaaca aggtcacagc attgtcgtat cttccctaaa gatcttttac 720
aagacagtga gcttcattat ggctgatgaa cagctcaaaa gaatctcaaa ggtccaagca 780
aaacctgcag ttgagcacag agtagcagag ctgatggttt acagggaagc agattgggta 840
aaaaagactg gcgacaagtt gactatcctt attaaaaaga taattgagtg tgtttctgtt 900
cacccacact ggaaggtgag actggaactg gtagaacttg tggaggacct tcttttgaag 960
tgcagtcaat cattggtcga atgtgctggt ccccttctga aggccttagt gggactagta 1020
aatgatgaga gtcctgaaat ccaagcccag tgcaataaag ttctgagaca ttttgcagat 1080
caaaaagtag tggtgggcaa caaagccctc gctgacatct tgtcagaaag cctgcattcc 1140
cttgccacat ctcttcctcg cctaatgaac tcccaagatg accagggcaa attctctact 1200
ctttccttgt tacttggtta tctgaaactc ttgggcccaa aaataaactt tgtcctcaac 1260
tctgtggccc atctccagcg gctttccaaa gcactcatcc aagttctaga gctagacgtg 1320
gctgacatca agattgttga ggaacggcgt tggaactctg atgatctgaa tgcttctcca 1380
aagacctcag ccacacagcc ttggaaccgc atccagagga gatatttccg cttcttcact 1440
gatgagagaa tcttcatgct cttgaggcag gtttgtcagc tacttggtta ttatgggaat 1500
ctttatttgc ttgtggatca ctttatggaa ctttaccatc aatctgtggt ttaccggaag 1560
caagctgcca tgatccttaa tgaactggtt acaggggctg ctgggctgga ggttgaggat 1620
cttcacgaaa aacatattaa aacaaaccca gaagaactga gagagattgt gacatctata 1680
cttgaagaat acacaagtca agaaaattgg tatttggtta cctgtcttga aactgaggaa 1740
atgggagagg agctgatgat ggagcaccca ggcctccaag ccatcacgtc tggtgaacac 1800
acctgccaag ttacatcttt tctagccttc tcaaagccaa gtcccactat ttgctccatg 1860
aacagtaaca tctggcaaat atgcattcag ttggaaggaa ttggccagtt tgcatatgca 1920
ctaggaaaag acttctgttt gctcttgatg tcagcccttt atccagtact ggagaaggct 1980
ggagaccaaa ccctactcat tagtcaggtg gctaccagca ccatgatgga cgtttgccgt 2040
gcttgtggct acgactccct gcagcacctg atcaatcaaa attcagacta tttagtgaat 2100
gggatctctt taaatctgcg tcatctggct ctgcatcctc ataccccaaa ggtcctggaa 2160
gtcatgctgc ggaactcaga tgctaacctg cttcctttgg tggcagatgt ggttcaagat 2220
gtcttggcca ccctggacca attttacgat aagagagctg cttcctttgt cagcgttctg 2280
catgctctga tggcagcatt agcccagtgg ttcccagaca caggtaatct tgggcacctc 2340
caagagcaaa gtttaggaga agagggaagt catttgaacc aaagaccagc agctcttgag 2400
aagagcacca ccacagctga agacatcgaa cagtttttgc tgaactacct caaagagaag 2460
gatgtggcag atggaaatgt ctcggatttt gataatgaag aaggtcttgg atgtgctgga 2520
tctgtgtgtg gttgttcttc agtcccacaa aaaccagctg cttcccttgg ctcatcaggc 2580
ctggccctcg ctcgttcacc gactcacacg ggacgccccc ctggcagtgc ttag 2634
<210> 7
<211> 1824
<212> DNA
<213> Homo sapiens
<400> 7
atggcggcga acgtgttccc gttccgcgac gcccgtgccg caccggaccc agtgctggag 60
gccggcccgg tggcacacgg gccactgccg gtaccgctgg tgctggacaa cgggtcgttc 120
caagtccgcg ctggctgggc gtgtcccggg caggacccag gtcccgagcc gcgcctgcag 180
ttccgcgcgg tgtgcgcccg cggtcgtggc ggggcacggg gcgcgtcggg cccgcaggtg 240
gggaacgctc tgggcagcct ggagccactg cgctggatgc tgcgctcgcc cttcgaccgc 300
aacgtgccgg tcaacctgga gcttcaggag ttgctgctgg actacagctt ccagcacctg 360
ggtgtctcct cacagggctg tgttgatcat cccatagttt tgacagaagc tgtgtgcaac 420
ccactgtatt cacggcaaat gatgtctgag cttctttttg agtgctacgg gattcccaag 480
gttgcctatg gaatagacag cctcttcagc ttctaccaca ataagccaaa gaactcgatg 540
tgcagtgggc taatcatttc atctggatac cagtgtacgc atgttttacc catcttagaa 600
gggagattag atgctaaaaa ctgcaagcgc atcaatcttg gaggaagcca agcagctggt 660
tacctccagc gtctcctcca gctgaagtac cctgggcacc tggcagccat caccctcagc 720
cgcatggagg agattctgca tgagcacagc tacatcgctg aggattatgt ggaagaatta 780
cacaaatggc ggtgtcctga ttattatgag aataatgtcc acaagatgca gctcccattt 840
tccagcaagc tcctgggcag cactctgacc tctgaggaga aacaagaaag gcggcagcag 900
caattgcggc ggctgcagga gctcaatgcc cggcggcggg aggagaagct gcagctggat 960
caggagcgtc tggaccgact gctatatgtg caggaacttc tagaggatgg ccagatggat 1020
cagtttcaca aagctctgat agagctgaat atggactccc cagaagagct gcagtcctac 1080
atccagaagc tcagtatagc agtggagcag gctaagcaga aaatcctcca agcggaagtc 1140
aacctcgagg tggatgtggt agacagcaag ccagagaccc ctgacctgga gcagctggag 1200
ccgtctttgg aagatgtgga aagcatgaat gattttgatc ccttgttttc agaggaaaca 1260
cctggagtgg agaagccggt caccactgtt cagcccgtgt ttaacttggc agcatatcat 1320
cagctatttg ttgggacaga aagaattcga gctccagaga ttattttcca gccatctctc 1380
ataggagaag aacaggctgg gattgcagag actcttcagt acattctgga caggtaccca 1440
aaggacattc aggaaatgct ggttcagaac gttttcctca ctggcggcaa cacgatgtat 1500
cctggcatga aagccagaat ggagaaggaa ctgttggaga tgagaccctt ccggtcttct 1560
tttcaggttc aacttgcctc gaaccctgtg ctggatgcct ggtacggtgc tcgtgactgg 1620
gccttgaacc acctagatga taatgaagtt tggatcacca ggaaagagta tgaagaaaag 1680
ggaggagagt acctcaagga gcactgtgct tccaacatct atgtccccat ccgcctgccg 1740
aagcaggcct cccgctcctc agatgcccag gcatccagca agggctccgc tgctggtgga 1800
ggtggtgctg gtgagcaggc atag 1824
<210> 8
<211> 1540
<212> DNA
<213> Homo sapiens
<400> 8
atgggccacc aggagtctcc gctggcccgg gcgccggcgg gaggtgcagc ttatgtaaag 60
aggttatgta aagggctcag ctggcgcgaa cacgtggaaa gccacgggag cctaggagcc 120
caggcttccc cagcgagcgc cgcggcagca gaaggatccg ctacacgccg ggctcgggcc 180
gccacctccc gcgctgctcg gtcccggagg cagcccgggc ccggagcgga ccatccccag 240
gcaggggctc caggggggaa acgggccgcc cggaagtgga ggtgcgcggg ccaggtcaca 300
atccaaggtc cggctcctcc gcgtcccagg gccggacgga gggatgaggc agggggggcc 360
cgggcagcgc cgttgctgct ccccccgccg cccgcagcca tggaaacggg gaaggacggc 420
gcccgcagag gtacacaaag cccggagcgg aaaaggcgaa gcccagtgcc gcgggcgccc 480
agcacgaagc tgaggccggc ggcggcggcc cgggccatgg atccggtggc ggccgaggcc 540
ccgggcgagg ccttcctggc gcggcgacgg cctgagggcg gtggcgggtc cgcgcggccg 600
cgttacagcc tgttggcgga gatcgggcgc ggcagctacg gcgtggttta tgaggcagtg 660
gccgggcgca gcggggcccg ggtggcggtc aagaagatcc gctgcgacgc ccccgagaac 720
gtggagctgg cgctggctga attctgggcc ctcaccagcc tcaagcggcg ccaccagaac 780
gtcgtgcagt ttgaggagtg cgtcctgcag cgcaatgggt tagcccagcg catgagtcac 840
ggcaacaaga gctcgcagct ttacctgcgc ctggtggaga cctcgctgaa aggagaaagg 900
atcctgggtt atgctgagga gccctgctat ctctggtttg tcatggagtt ctgtgaaggt 960
ggagacctga atcagtatgt cctgtcccgg aggccagacc cagccaccaa caaaagtttc 1020
atgctacagc tgacgagcgc cattgccttc ctgcacaaaa accatattgt gcacagggac 1080
ctgaagccag acaacatcct catcacagag cggtctggca cccccatcct caaagtggcc 1140
gactttggac taagcaaggt ctgtgctggg ctggcacccc gaggcaaaga gggcaatcaa 1200
gacaacaaaa atgtgaatgt gaataagtac tggctgtcct cagcctgcgg ttcggacttc 1260
tacatggctc ctgaagtctg ggagggacac tacacagcca aggcggacat ctttgccctg 1320
ggcattatca tctgggcaat gatagaaaga atcactttta ttgactctga gaccaagaag 1380
gagctcctgg ggacctacat taaacagggg actgagatcg tccctgttgg tgaggcgctg 1440
ctagaaaacc caaagatgga gttgcacatc ccccaaaaac gcaggacttc catgtctgag 1500
gggatcaagc agctcttgaa agatatgtta gctgctaacc 1540
<210> 9
<211> 798
<212> DNA
<213> Homo sapiens
<400> 9
atgcagcaga cggcgcctaa cacgctgccc accacctcca tgagcatctc tgggcccggc 60
tacagccacg cgggacccgc ctcgcagggc gtccccatgc aggggcaagg caccatcggc 120
aactacgtgt ctcggaccaa catcaacatg cagtccaacc cagtctccat gatgcagcag 180
caggcggcca cgtcgcacta cagctcggcg cagggcggca gccagcacta ccagggccag 240
tcgtccatcg ccatgatggg gcagggcagc caggggagca gcatgatggg gcagcggccc 300
atggcgccct accggccctc ccagcaaggc tcttcccagc agtacctggg ccaggaggag 360
tactatggcg agcagtacag ccacagccag ggcgccgcgg agcccatggg ccagcagtac 420
taccccgacg gccatggcga ttacgcctac cagcagtcat cctacacgga gcagagctac 480
gaccggtcct tcgaggagtc cacgcagcac tactatgagg ggggaaactc ccagtacagc 540
cagcagcagg ccgggtacca gcagggtgcc gcgcagcagc agacgtactc ccagcagcag 600
taccccagcc agcagagcta ccccgggcag cagcagggct acgggtctgc ccagggagcc 660
ccgtcacagt accccggcta ccagcaaggc caaggccagc agtacggaag ctaccgagca 720
ccgcagacag cgccgtctgc ccagcagcag cggccctacg gctatgaaca gggccagtat 780
ggaaattacc agcagtaa 798

Claims (2)

1.胃癌预后效果的评价系统,其特征在于,所述系统包括:
(1)数据输入模块,用于将样品中与胃癌预后相关的标志分子的表达量检测结果输入模型计算模块;所述表达量为标志分子对应的mRNA含量;
所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8以及SEQ ID NO:9所示基因序列;
(2)模型计算模块,用于对输入的检测结果进行计算处理,得到被测患者的预后效果数据;
(3)结果输出模块,用于根据胃癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果;
所述模型计算模块采用的模型具体为:
Risk Score = EXP ZFP64 * (-0.044) + EXP TOMM34 * (-0.041) + EXP DNMT3B *(0.131) + EXP CSTF1 * (-0.273) + EXP TM9SF4 * (0.264) + EXP TTI1 * (0.136) +EXP ACTR5 * (-0.255) + EXP STK35 * (-0.006) + EXP SS18L1 * (-0.047);
其中,ZFP64代表样品中如SEQ ID NO:1所示基因序列的表达量,TOMM34代表样品中如SEQ ID NO:2所示基因序列的表达量,DNMT3B代表样品中如SEQ ID NO:3所示基因序列的表达量,CSTF1代表样品中如SEQ ID NO:4所示基因序列的表达量,TM9SF4代表样品中如SEQID NO:5所示基因序列的表达量,TTI1代表样品中如SEQ ID NO:6所示基因序列的表达量,ACTR5代表样品中如SEQ ID NO:7所示基因序列的表达量,STK35代表样品中如SEQ ID NO:8所示基因序列的表达量,SS18L1代表样品中如SEQ ID NO:9所示基因序列的表达量;所述表达量为基因序列对应的mRNA含量;
所述结果输出模块中,以最优cutoff值-0.331为截断值,将样本分为高、低风险组,据此对被测患者的预后效果数据进行评价;如果患者的Risk Score值高于该截断值,则为高风险;如果患者的Risk Score值低于该截断值,则为低风险。
2.权利要求1所述评价系统在胃癌患者预后评价中的应用。
CN202110594423.0A 2021-05-28 2021-05-28 与胃癌预后相关的标志分子 Active CN113337605B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110594423.0A CN113337605B (zh) 2021-05-28 2021-05-28 与胃癌预后相关的标志分子

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110594423.0A CN113337605B (zh) 2021-05-28 2021-05-28 与胃癌预后相关的标志分子

Publications (2)

Publication Number Publication Date
CN113337605A CN113337605A (zh) 2021-09-03
CN113337605B true CN113337605B (zh) 2022-06-07

Family

ID=77472043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110594423.0A Active CN113337605B (zh) 2021-05-28 2021-05-28 与胃癌预后相关的标志分子

Country Status (1)

Country Link
CN (1) CN113337605B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114182015A (zh) * 2021-11-29 2022-03-15 常州市第二人民医院 基于rna甲基化蛋白ythdf2在胃癌细胞的调控应用
CN113862371A (zh) * 2021-12-03 2021-12-31 广东乾晖生物科技有限公司 一种酒精相关性肝细胞癌疾病进展和预后风险的预测装置及其预测模型的训练方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019178217A1 (en) * 2018-03-13 2019-09-19 Baylor Research Institute Methods and compositions for treating, diagnosing, and prognosing cancer
CN112029860A (zh) * 2020-09-03 2020-12-04 首都医科大学 与直肠癌预后相关的标志分子以及检测试剂盒
CN112048559A (zh) * 2020-09-10 2020-12-08 辽宁省肿瘤医院 基于m6A相关的IncRNA网络胃癌预后的模型构建及临床应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10876167B2 (en) * 2017-01-12 2020-12-29 The Regents Of The University Of California 12-gene prognostic signature for breast cancer survival

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019178217A1 (en) * 2018-03-13 2019-09-19 Baylor Research Institute Methods and compositions for treating, diagnosing, and prognosing cancer
CN112029860A (zh) * 2020-09-03 2020-12-04 首都医科大学 与直肠癌预后相关的标志分子以及检测试剂盒
CN112048559A (zh) * 2020-09-10 2020-12-08 辽宁省肿瘤医院 基于m6A相关的IncRNA网络胃癌预后的模型构建及临床应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
m6A甲基化调节因子影响口腔鳞状细胞癌生存预后的生物信息学分析;徐莉等;《华中科技大学学报(医学版)》;20200815(第04期);71-77页 *

Also Published As

Publication number Publication date
CN113337605A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
JP4938672B2 (ja) p53の状態と遺伝子発現プロファイルとの関連性に基づき、癌を分類し、予後を予測し、そして診断する方法、システム、およびアレイ
CN103459597B (zh) 用于预测胃癌预后的标记和使用该标记预测胃癌预后的方法
KR101504817B1 (ko) 국소 진행형 위암에 대한 예후 예측 시스템
KR102055305B1 (ko) 위식도경계부선암의 진단 및 표적 치료를 위한 마커
CN113337605B (zh) 与胃癌预后相关的标志分子
Kwon et al. Prognosis of stage III colorectal carcinomas with FOLFOX adjuvant chemotherapy can be predicted by molecular subtype
US20120123105A1 (en) Gene Signature for Diagnosis and Prognosis of Breast Cancer and Ovarian Cancer
Chen et al. Integrating biological knowledge with gene expression profiles for survival prediction of cancer
WO2010063121A1 (en) Methods for biomarker identification and biomarker for non-small cell lung cancer
Song et al. Identify lymphatic metastasis-associated genes in mouse hepatocarcinoma cell lines using gene chip
ITRM20110044A1 (it) Marcatori di sopravvivenza al tumore e uso di essi
WO2009094318A2 (en) Molecular staging of stage ii and iii colon cancer and prognosis
Zhong et al. Integrative analysis of prognostic long non-coding RNAs with copy number variation in bladder cancer
WO2013109613A1 (en) Gene signature is associated with early stage rectal cancer recurrence
Jin et al. A novel prognostic signature revealed the interaction of immune cells in tumor microenvironment based on single-cell RNA sequencing for lung adenocarcinoma
WO2014066984A1 (en) Method for identifying a target molecular profile associated with a target cell population
Asaka et al. Genetic prognostic index influences patient outcome for node-positive breast cancer
Phan et al. Robust microarray meta-analysis identifies differentially expressed genes for clinical prediction
Pan et al. Overall survival signature of 5-methylcytosine regulators related long non-coding RNA in hepatocellular carcinoma
Kawaguchi et al. Identification and validation of a gene expression signature that predicts outcome in malignant glioma patients
Yuan et al. The role of N6-Methyladenosine-associated lncRNAs in the immune microenvironment and prognosis of colorectal cancer
Gao et al. A tumor microenvironment-related mRNA–ncRNA signature for prediction early relapse and chemotherapeutic sensitivity in early-stage lung adenocarcinoma
KR20090025898A (ko) 폐암 환자의 폐암 재발 위험을 예측하기 위한 마커, 키트,마이크로어레이 및 방법
Wang et al. Identification of three differentially expressed miRNAs as potential biomarkers for lung adenocarcinoma prognosis
Tang et al. Development of a tRNA-Derived small RNA prognostic panel and their potential functions in osteosarcoma

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant