CN111471773A - 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用 - Google Patents

预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用 Download PDF

Info

Publication number
CN111471773A
CN111471773A CN202010514992.5A CN202010514992A CN111471773A CN 111471773 A CN111471773 A CN 111471773A CN 202010514992 A CN202010514992 A CN 202010514992A CN 111471773 A CN111471773 A CN 111471773A
Authority
CN
China
Prior art keywords
mir
hsa
mirna
gastric adenocarcinoma
prognosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010514992.5A
Other languages
English (en)
Inventor
罗善山
廖锡文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qin Haiquan
Wang Tingan
Original Assignee
Qin Haiquan
Wang Tingan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qin Haiquan, Wang Tingan filed Critical Qin Haiquan
Priority to CN202010514992.5A priority Critical patent/CN111471773A/zh
Publication of CN111471773A publication Critical patent/CN111471773A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Bioethics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Microbiology (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Oncology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了预测胃腺癌患者预后的microRNA及其确定方法、应用。该诊断生物标记物,包括以下microRNA中的至少一种:hsa‑mir‑509‑2、hsa‑mir‑3917、hsa‑mir‑495、hsa‑mir‑653、hsa‑mir‑3605、hsa‑mir‑2115、hsa‑mir‑1292、hsa‑mir‑137、hsa‑mir‑6511b‑1、hsa‑mir‑145和hsa‑mir‑138‑2。其是预后因子,并用于构建胃腺癌的预后特征。这些预后特征在预测预后上显示出良好的表现。综合生存分析表明,11个miRNA的预后特征是胃腺癌预后的独立特征,与传统的临床参数相比,在OS预测方面表现出优越的性能。

Description

预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用
技术领域
本发明涉及临床医学领域,尤其涉及预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用。
背景技术
2012年全球胃癌新增病例近951600例,死亡723100人,胃癌构成死亡的重要死亡原因。然而,男性胃癌的发病率通常高于女性。此外,包括中国、日本、韩国和蒙古在内的东亚地区胃癌或胃癌的发病率高于世界其他地区。
胃癌最常见的组织学类型是胃腺癌。胃癌的发生在很大程度上是由遗传和环境因素驱动的,其中最著名的病因是慢性幽门螺杆菌感染。这种细菌被认为是非心脏性胃癌的主要病因。高盐摄入量、硝酸盐和腌制食品摄入量、肥胖和吸烟也与胃癌发病风险增加有关。在遗传因素方面,癌症基因组图谱(TCGA)提供了原发性胃腺癌的全基因组图谱,并提出了将胃癌分为四个不同亚类的分子排列。根据多个基因的基因组转化,这包括磷脂酰肌醇-4,5-二磷酸3-激酶催化亚单位α(PIK3CA)突变、极端DNA甲基化、Janus激酶2(JAK2)扩增、程序性细胞死亡配体1(CD274:也称为PD-L1)和程序性细胞死亡配体2(PDCD1LG2:也称为PD-L2)。然而,由于其复杂性,胃癌的遗传发病机制尚需进一步研究。
此外,为了好地治疗胃癌,临床上再次手术切除被认为是唯一的治疗选择。然而,晚期或转移性胃癌患者往往无法再次手术,需要寻求替代治疗。这包括靶向治疗和化疗。先前的研究报道microRNA(miRNA)可能在胃癌患者中具有治疗不确定的潜力,包括化疗和靶向治疗。此外,miRNA还可作为胃癌的预后和诊断生物标记物,并与胃癌的进展和转移相关。因此,系统性地研究胃癌的发病机制和发现可以预测预后miRNA标志物,有助于制定有针对性的治疗策略,提高临床疗效。
发明内容
通过TCGA研究网络提供了一个开放的、全基因组的胃腺癌-miRNA数据集,可用于进一步的研究。发明人进行了全基因组筛选,以确定潜在的预后miRNA指标,这些指标能够预测胃腺癌患者的总体生存率(OS)。
本发明的第一方面在于提供预测胃腺癌患者预后的microRNA的诊断生物标记物,包括以下microRNA中的至少一种:hsa-mir-509-2、hsa-mir-3917、hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-137、hsa-mir-6511b-1、hsa-mir-145和hsa-mir-138-2;
优选地,包括以下microRNA中的至少一种:has-mir-509-2、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292和hsa-mir-6511b-1。
本发明的第二方面在于提供确定第一方面所述的诊断生物标记物的方法,包括以下步骤:
S1,从数据库中提取胃腺癌全基因组miRNA测序数据集和胃腺癌的相关临床信息;
S2,通过全基因组多变量Cox回归模型进行预后miRNA的筛选;
S3,建立预后胃腺癌的特征。
在本发明的一些实施方式中,S1步骤中,从数据库中提取胃腺癌全基因组miRNA测序数据集为从TCGA网站提取TCGA-STAD 3级miRNA测序数据集。
在本发明的一些实施方式中,还包括以下步骤:
利用edgeR对STAD-miRNA原始计数数据集在R中进行标准化,挑选出平均表达值大于1的MiRNAs。
在本发明的一些实施方式中,S2步骤中,使用R生存包,通过使用多变量Cox比例风险回归框架测量预后miRNA值,并根据肿瘤分期对模型进行校正;校正后的P值<0.05被认为是STAD-OS的预后相关miRNA。
在本发明的一些实施方式中,S3步骤中,通过“逐步”函数测量,以选择最佳筛选组合,miRNAs被纳入预后特征筛选面板,以P值最显著的组合为最佳组合。
在本发明的一些实施方式中,预后miRNAs在风险评分框架中的权重采用多变量Cox回归模型计算;
优选地,确定基于miRNA表达的预后特征,即风险评分,的公式为:风险评分=miRNA1×β1miRNA1+miRNA2×β2miRNA2+miRNA1×βNMirNa2+miRNA n×βNMirNa。
本发明的第三方面在于提供第一方面所述的诊断生物标记物的靶基因,包括以下基因中的至少一种:
SERPINE1、MLEC、ANGPT2、C5orf38、FZD7、MARCKS、PDGFD、DUSP6、IRS1、PSAT1、TENM3、TMEM127、BLMH和TIRAP。
本发明的第四方面在于提供预测胃腺癌患者预后的试剂或医疗器械,包括第一方面所述的诊断生物标记物。
本发明的第五方面在于提供第一方面所述的诊断生物标记物在制备预测胃腺癌患者预后的试剂或医疗器械中的应用。
本发明中,缩写代表的意义为:
STAD,胃腺癌;TCGA,癌症基因组图谱;OS,总生存率;miRNA Seq,miRNA测序;DAVID,注释、可视化和综合发现数据库;BiNGO,生物网络基因本体工具;STRING,检索相互作用基因/蛋白质的搜索工具;GSEA,基因集富集分析;FDR,错误发现率;AUC,曲线下面积;HR,危险比;CI,置信区间;GO,基因本体论;KEGG,京都基因与基因组百科全书。
本发明的有益效果:
11个miRNAs(hsa-mir-509-2、hsa-mir-3917、hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-137、hsa-mir-6511b-1、hsa-mir-145、hsamir-138-2)被认为是预后因子,并用于构建胃腺癌的预后特征。这些预后特征在预测预后上显示出良好的表现(adjusted P<0.0001,adjusted hazard ratio=3.047,and 95%confidenceinterval=2.148–4.323)。时间依赖接收操作特性检测显示曲线下面积为0.697,0.711,0.697,0.716,0.733,0.805和0.805,或估算其1-,2-,3-,4-,5-,10年生存率。综合生存分析表明,11个miRNA的预后特征是胃腺癌预后的独立特征,与传统的临床参数相比,在OS预测方面表现出优越的性能。
附图说明
图1为胃腺癌中11个预后相关miRNA序列的Kaplan-Meier曲线。序列观察如下:hsa-mir-145(A)、hsa-mir-495(B)、hsa-mir-653(C)、hsa-mir-3917(D)、hsa-mir-3605(E)、hsa-mir-6511b-1(F)、hsa-mir-509-2(G)、hsa-mir-137(H)、hsa-mir-138-2(I)、hsamir-2115(J)和hsa-mir-1292(K)。
图2为11种预后miRNAs在肿瘤与邻近正常组织间的分布及其对胃腺癌诊断价值的探讨。(A)11种预后miRNAs在胃腺癌肿瘤与邻近正常组织中的表达水平分布。具有诊断价值的差异表达mirna的ROC曲线为:hsa-mir-509-2(B)、hsa-mir-495(C)、hsa-mir-2115(D)、hsa-mir-1292(E)、hsa-mir-3917(F)、hsa-mir-6511b-1(G)和hsa-mir-145(H)。
图3为胃腺癌患者11种预后miRNAs的预后风险评分模型分析。(A)风险评分自上而下与患者生存状态分布相结合。11个预后miRNAs在低风险组和高风险组的表达热图也显示出来。(B)低风险组和高风险组的Kaplan-Meier曲线。(C)ROC曲线用于根据风险评分确定胃腺癌患者的生存率。(D)这11个预后miRNAs在按风险评分分层的组中的表达水平。*P<0.05,**P<0.01,**P<0.0001。
图4为风险评分与临床参数的关系。(A)分层分析确定胃腺癌患者风险评分与OS的关系。(B)使用风险评分和临床参数预测1年、3年和5年事件(死亡)的列线图。
图5为根据胃腺癌的危险评分和临床参数分层时OS的联合效应分析。采用以下参数进行联合效应分析分层:年龄(A)、性别(B)、肿瘤分期(C)以及根据早期和晚期肿瘤分期(D)进行分组。
图6为这些预后mirna及其靶基因的协作网络。红色三角形代表miRNA,绿色箭头代表靶向基因,而黑色链接显示miRNA靶向基因关系。
图7为11个预后miRNAs相关靶基因的功能评价。(A)靶基因的GO富集结果;(B)靶基因的KEGG富集结果。
图8为这些靶基因的存活分析显示与STAD-OS显著相关。这些基因的Kaplan-Meier曲线顺序如下:SERPINE1(A)、MLEC(B)、ANGPT2(C)、C5orf38(D)、FZD7(E)、MARCKS(F)、PDGFD(G)、DUSP6(H)、IRS1(I)、PSAT1(J)、TENM3(K)、TMEM127(L)、BLMH(M)和TIRAP(N)。
图9为高风险组(A-L)c2参考基因集的GSEA发现。
图10为高风险组(A-L)c5参考基因集的GSEA结。
具体实施方式
以下对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
1数据处理
从TCGA网站(https://portal.gdc.cancer.gov/,2018年7月1日访问)提取TCGA-STAD3级miRNA测序(miRNA Seq)数据集以及相关临床参数。利用edgeR对STAD-miRNA原始计数数据集在R中进行了标准化。平均表达值大于1的MiRNAs被进一步分析。患者纳入标准包括:(1)miRNA-Seq数据集中的患者;和(2)具有完整生存信息的胃腺癌患者。本发明排除了缺乏生存信息、生存时间为零或没有miRNA表达数据集的胃腺癌患者。由于应用了从TCGA中提取的开放存取数据,本研究不需要伦理委员会的额外批准(https://cancergenome.nih.gov/publications/publicationguidelines,2018年7月1日访问)。
2预后相关miRNAs的鉴定
使用R生存包,通过使用多变量Cox比例风险回归框架测量预后miRNA值,并根据肿
瘤分期对模型进行校正。校正后的P值<0.05被认为是STAD-OS的预后相关miRNA。
3基于MicroRNA表达的预后特征构建
通过“逐步”函数测量,以选择最佳筛选组合,miRNAs被纳入预后特征筛选面板。以P值最显著的组合为最佳组合。此外,预后miRNAs在风险评分框架中的权重采用多变量Cox回归模型计算。miRNA的表达水平与加权多变量Cox回归系数(β)的线性组合产生了基于miRNA表达的预后特征,也被称为风险评分。确定风险评分的公式为:风险评分=miRNA1×β1miRNA1+miRNA2×β2miRNA2+miRNA1×βNMirNa2+miRNA n×βNMirNa的经验根据风险评分的中位数确定高风险和低风险患者。通过survivalROC包在R中确定风险评分模型的准确性。
4风险评分模型的预后意义
采用分层生存分析和联合效应生存分析来确定胃腺癌患者OS的临床特征与其相关风险评分之间的关系。根据临床参数和风险评分建立诺模图评估个体化预后框架。
5靶基因预测与功能评价
应用三种在线工具确定miRNAs的靶基因。它们是:TargetScan(http://www.TargetScan.org/,2018年7月1日访问),miRDB(http://www.miRDB.org/,于2018年7月1日访问,和miRTarBase(http://miRTarBase.mbc.nctu.edu.tw/,于2018年7月1日访问)。数据库工具确认了所选miRNA靶向的上覆基因,并用于下游分析。这些miRNA靶向基因的相互作用网络通过Cytoscape v3.4.0建立,功能评估通过注释、可视化和集成发现v6.8数据库(davidv6.8,https://DAVID.ncifcrf.gov/home.jsp,2018年7月1日访问)和生物网络基因本体(BiNGO)工具。基因-基因相互作用和蛋白质-蛋白质相互作用是分别通过GeneMANIA来确定的(http://www.GeneMANIA.org/,2018年7月1日访问)和检索相互作用基因/蛋白质的搜索工具(STRING,https://STRING-db.org/,2018年7月1日访问)Gene set enrichmentanalysis(GSEA)
6基因集富集分析(GSEA)
根据STAD-OS的预后特征,对高风险和低风险miRNA组的生物学过程功能和相关途径之间的区别进行了研究。GSEA(http://software。broadinstitute.org/gsea/index.jsp,访问日期:2018年7月1日[34,35]被用于使用c2(c2.all.v6.1.symbols)和c5(c5.all.v6.1.symbols)的分子标记数据库(MSigDB)研究高风险和低风险miRNA组的潜在机制。各GSEA结果的标称P值小于0.05,错误发现率(FDR)小于0.25被认为具有统计学意义。
7统计分析
采用Benjamini-Hochberg程序,对GSEA中的FDR进行多次测试调整。临床特征和操作系统的单变量分析采用对数秩检验。应用多变量Cox比例危险度回归模型进行临床分析,P<0.05。此外,P小于0.05的概率值被认为具有统计学意义。使用SPSS版本20.0(IBM公司,Armonk,NY,USA)和R 3.5.0(http://www.R-project.org/)进行统计分析。
8研究人群与预后相关的miRNA筛查
表1总结了胃腺癌患者的人口统计数据,并显示那些因诊断为晚期肿瘤而更有可能经历死亡结局的患者。TCGA数据中可提供共有436例患者、446例肿瘤组织和45例邻近正常组织。通过将临床数据与miRNA-Seq数据集进行比较,从临床数据集中删除符合排除标准的患者。总共408名患者符合研究标准,并被纳入随后的生存分析。共有620个平均值大于1的miRNA,用于进一步研究它们在预后miRNA筛查中的应用,它们来自miRNA-Seq数据集。
表1胃腺癌患者OS与临床病理特征的相关性研究
Figure BDA0002529724510000061
Notes:
Figure BDA0002529724510000062
Age information are unavailable in 6patients;&Tumor stageinformation are unavailable in17patients.OS,overall survival;STAD,colonadenocarcinoma;MST,median survival time;HR,hazard ratio;CI,confidenceinterval.
这些miRNAs是用R生存包和多变量Cox比例风险回归模型结合肿瘤分期调整确定的。多变量Cox比例风险回归模型结果见表S1。经多重比较校正后,41个miRNAs与预后相关,经校正P<0.05,可进一步用于筛选预后标志物的构建。
9预测信号结构
为了研究潜在的预后相关miRNAs的最佳组合,我们在R中进行了阶跃函数,并对每一个相关的统计数据进行log2转换,以作进一步的分析。随后,11个miRNA在胃腺癌预后中产生最显著的P值,包括:hsa-mir-509-2、hsa-mir-3917、hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-137、hsa-mir-6511b-1、hsa-mir-145和hsa-mir-138-2。这些miRNA被用于建立miRNA预后模型,Kaplan-Meier和receiver-operatingcharacteristic(ROC)曲线如图1A-K所示。在确定这些预后miRNA在区分胃腺癌肿瘤和癌旁组织hsa-mir-509-2、hsa-mir-495、hsa-mir-2115方面的潜在诊断价值时,hsa-mir-1292、hsamir-137、hsa-mir-6511b-1和hsa-mir-145在这些组织类型之间失调(图2A)。ROC分析表明hsa-mir-509-2(图2B)、hsa-mir-495(图2C)、hsa-mir-2115(图2D)、hsa-mir-1292(图2E)、hsa-mir-137(图2F)、hsa-mir-6511b-1(图2G)和hsa-mir-145(图2H)可作为胃腺癌潜在诊断生物标记物。应用多变量Cox回归分析评估这些潜在预后miRNAs在生存预测中的价值。风险评估公式为:风险评分=Exp of hsa-mir-509-2×(-0.1228)+Exp of hsa-mir-3917×(-0.2394)+Exp of hsa-mir-495×(0.2389)+Exp of hsa-mir-653×(0.1473)+Exp of hsa-mir-3605×(0.2180)+Exp of hsa-mir-2115×(-0.1632)+Exp of hsa-mir-1292×(-0.1974)+Exp of hsa-mir-137×(0.1031)+Exp of hsa-mir-6511b-1×(0.2684)+Exp of hsa-mir-145×(-0.1186)+Exp of hsa-mir-138-2×(-0.1715)。
在确定风险评分和肿瘤分期校正后,风险评分较高的患者预后较差,导致死亡的机会增加(校正后P<0.0001,校正后危险比[HR]=3.047,95%CI=2.148–4.323,图3A-B)。此外,使用R-survivalROC软件包进行的时间依赖性ROC检查表明,该风险评分模型对判断STADOS有很大的帮助。时间依赖性ROC曲线下面积(AUC)分别为:1年、2年、3年、4年、5年和10年生存率分别为0.711、0.697、0.716、0.733、0.805和0.805(图3C)。除hsa-mir-2115外,其余所有mirna在两个危险组间均有差异表达。高风险组和低风险组之间的miRNA表达谱如图3D所示。
10综合生存分析
为了进一步探讨临床特征与STAD-OS危险评分的关系,对诺模图资料进行综合生存检查,并进行分层生存分析和联合效应生存分析。分层生存分析结果显示,在所有有利层和不利层的患者中,较高的危险评分显著增加了死亡的机会。然而,该结果排除了被诊断为I期和IV期肿瘤的患者(图4A)。这表明这种预后特征与这些临床特征无关。由rms及其辅助数据集导出的列线图确定,这些临床特征比其他临床特征(图4B)对11个miRNA信号和计算的风险点(0-100之间)的预后预测贡献更大。
尽管如此,联合效应检查显示,该风险评分模型在STAD OS预测和与常规临床指标分组方面表现良好(图5A-D和表2)。
表2胃腺癌患者临床因素与OS危险评分的联合效应生存分析
Figure BDA0002529724510000081
Notes:£Adjusted for tumor stage.
Figure BDA0002529724510000082
Age information are unavailable in6patients;&Tumor stage information are unavailable in 17patients.OS,
overall survival;STAD,colon adenocarcinoma;MST,median survival time;HR,hazard ratio;CT,confidence interval.
11靶基因预测与功能评价
为了评估这11个miRNAs最可能的生物学功能,使用了Targetscan、miRDB和miRTarBase。在这三个分析系统中,每个miRNA的潜在靶基因都是独立确定的,在所有三个平台上都可以观察到靶基因的重叠。目标基因只与hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-145和hsa-mir-138-2miRNAs被考虑用于富集分析。最终有134个基因被认为是这7个mirna的靶基因,并进一步应用于交互网络的构建(图6)。
Gene Ontology(GO)(GO)分析表明,miRNA靶向基因在许多生物学过程中都有丰富的表达,包括细胞增殖、细胞迁移、凋亡和血管生成过程的调控、Notch信号通路的参与和生长因子β受体信号通路的转化(图7A)。使用GO进行的功能丰富性评估证实了这些发现(图S1)。
KEGG(Kyoto Encyclopedia of Genes and Genome,京都基因和基因组百科全书)分析显示,在某些癌症途径中有显著的富集。这包括Hippo、转化生长因子β(TGFB)、Wnt、磷脂酰肌醇3′-激酶(PI3K)-Akt和叉头盒O(FoxO)信号通路(图7B)。STRING和GeneMANIA分析得到蛋白质(图S2)和基因-基因(图S3)相互作用,此外,GeneMANIA还证明这些miRNA靶基因参与复杂的共表达相互作用。
在评估这些miRNA靶基因的预后价值时,采用了一个多变量Cox比例风险回归框架。从TCGA网站获得的RNA测序(RNA Seq)数据集通过DESeq软件包在R中进行了标准化。这14个miRNA 靶向基因与STAD OS显著相关(表S2),这些基因的Kaplan-Meier曲线如图8A-N所示。这14个预后miRNA靶向基因包括serpin家族E成员1(serpin E1)、malectin(MLEC)、angiopoietin 2(ANGPT2)、染色体5开放阅读框38(C5orf38),frizzled class receptor 7(FZD7)、肉豆蔻酰化富含丙氨酸蛋白激酶C底物(MARCKS)、血小板衍生生长因子D(PDGFD)、双特异性磷酸酶6(DUSP6)、胰岛素受体底物1(IRS1)、磷酸丝氨酸转氨酶1(PSAT1)、Tenurin跨膜蛋白3(TENM3)、TMEM127、博莱霉素水解酶(BLMH),以及含有衔接蛋白(TIRAP)的TIR结构域。
12GSEA
图9A-L和表S3说明了高风险相关组c2参考基因集的GSEA结果。更高的风险分数是与核因子kappa B、Wnt、有丝分裂原活化蛋白激酶(MAPK)、整合素、转化生长因子B、PI3K和成纤维细胞生长因子(FGF)信号通路显著相关。这些评分也是与癌症相关的表皮生长因子受体(EGFR)信号和癌症途径。图10A-L和表S4显示了高风险相关组c5参考基因集的GSEA结果。这些结果表明高风险评分与血管生成、TGFB、Wnt、Notch和凋亡途径显著相关。
本研究的优点是利用多变量Cox比例风险回归模型进行全基因组筛选研究,以确定潜在的预后miRNAs。此外,建立了基于miRNA表达的风险评分模型,综合分析其对胃腺癌预后的潜在预测价值。此外,本研究首次采用GSEA方法,不仅探讨了不同患者危险评分组的生物学过程和途径的差异,而且尝试阐明其与胃腺癌预后相关的分子机制。最后,采用多变量Cox比例风险回归模型对14个可能作为STAD-OS生物标志物的预后miRNA靶基因进行了鉴定。
本发明进行了基因组规模的预后miRNA筛选,并确定了一组候选的预后miRNA标记物,这些标记物有可能在胃腺癌患者中进行进一步的研究。更具体地说,本发明确定了一个新的11miRNA表达特征,它可以作为那些胃腺癌患者的潜在预后指标。这些表达特征包括hsa-mir-509-2、hsa-mir-3917、hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-137、hsa-mir-6511b-1、hsa-mir-145和hsa-mir-138-2。在进行全面的生存分析时,证明这种新的miRNA表达特征独立于传统的胃腺癌临床指标。
以上对本发明优选的具体实施方式和实施例作了详细说明,但是本发明并不限于上述实施方式和实施例,在本领域技术人员所具备的知识范围内,还可以在不脱离本发明构思的前提下作出各种变化。

Claims (10)

1.预测胃腺癌患者预后的诊断生物标记物,包括以下microRNA中的至少一种:hsa-mir-509-2、hsa-mir-3917、hsa-mir-495、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292、hsa-mir-137、hsa-mir-6511b-1、hsa-mir-145和hsa-mir-138-2;
优选地,包括以下microRNA中的至少一种:has-mir-509-2、hsa-mir-653、hsa-mir-3605、hsa-mir-2115、hsa-mir-1292和hsa-mir-6511b-1。
2.确定根据权利要求1所述的诊断生物标记物的方法,包括以下步骤:
S1,从数据库中提取胃腺癌全基因组miRNA测序数据集和胃腺癌的相关临床信息;
S2,通过全基因组多变量Cox回归模型进行预后miRNA的筛选;
S3,建立预后胃腺癌的特征。
3.根据权利要求2所述的方法,其特征在于,S1步骤中,从数据库中提取胃腺癌全基因组miRNA测序数据集为从TCGA网站提取TCGA-STAD 3级miRNA测序数据集。
4.根据权利要求2或3所述的方法,其特征在于,还包括以下步骤:
利用edgeR对STAD-miRNA原始计数数据集在R中进行标准化,挑选出平均表达值大于1的MiRNAs。
5.根据权利要求2-4任一所述的方法,其特征在于,S2步骤中,使用R生存包,通过使用多变量Cox比例风险回归框架测量预后miRNA值,并根据肿瘤分期对模型进行校正;校正后的P值<0.05被认为是STAD-OS的预后相关miRNA。
6.根据权利要求2-5任一所述的方法,其特征在于,S3步骤中,通过“逐步”函数测量,以选择最佳筛选组合,miRNAs被纳入预后特征筛选面板,以P值最显著的组合为最佳组合。
7.根据权利要求2-6任一所述的方法,其特征在于,预后miRNAs在风险评分框架中的权重采用多变量Cox回归模型计算;
优选地,确定基于miRNA表达的预后特征,即风险评分,的公式为:风险评分=miRNA1×β1miRNA1+miRNA2×β2miRNA2+miRNA1×βNMirNa2+miRNA n×βNMirNa。
8.根据权利要求1所述的诊断生物标记物的靶基因,包括以下基因中的至少一种:
SERPINE1、MLEC、ANGPT2、C5orf38、FZD7、MARCKS、PDGFD、DUSP6、IRS1、PSAT1、TENM3、TMEM127、BLMH和TIRAP。
9.预测胃腺癌患者预后的试剂或医疗器械,包括根据权利要求1所述的诊断生物标记物。
10.根据权利要求1所述的诊断生物标记物在制备预测胃腺癌患者预后的试剂或医疗器械中的应用。
CN202010514992.5A 2020-06-08 2020-06-08 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用 Pending CN111471773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010514992.5A CN111471773A (zh) 2020-06-08 2020-06-08 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010514992.5A CN111471773A (zh) 2020-06-08 2020-06-08 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用

Publications (1)

Publication Number Publication Date
CN111471773A true CN111471773A (zh) 2020-07-31

Family

ID=71765256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010514992.5A Pending CN111471773A (zh) 2020-06-08 2020-06-08 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用

Country Status (1)

Country Link
CN (1) CN111471773A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022242967A1 (en) * 2021-05-20 2022-11-24 Hummingbird Diagnostics Gmbh Predictive mirnas for response to cancer therapy
CN115961042A (zh) * 2022-12-09 2023-04-14 广东医科大学 Igfbp1基因或chaf1a基因在作为胃腺癌预后分子标志物中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109971862A (zh) * 2019-02-14 2019-07-05 辽宁省肿瘤医院 C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法
CN110305964A (zh) * 2019-07-26 2019-10-08 安徽医科大学第一附属医院 一种前列腺癌患者预后复发风险预测标志工具及其风险评估模型的建立

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109971862A (zh) * 2019-02-14 2019-07-05 辽宁省肿瘤医院 C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法
CN110305964A (zh) * 2019-07-26 2019-10-08 安徽医科大学第一附属医院 一种前列腺癌患者预后复发风险预测标志工具及其风险评估模型的建立

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHAN-SHAN LUO等: "Genome-wide analysis to identify a novel microRNA signature that predicts survival in patients with stomach adenocarcinoma" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022242967A1 (en) * 2021-05-20 2022-11-24 Hummingbird Diagnostics Gmbh Predictive mirnas for response to cancer therapy
CN115961042A (zh) * 2022-12-09 2023-04-14 广东医科大学 Igfbp1基因或chaf1a基因在作为胃腺癌预后分子标志物中的应用

Similar Documents

Publication Publication Date Title
CN103733065B (zh) 用于癌症的分子诊断试验
CN106834462B (zh) 一组胃癌基因的应用
Xu et al. Development and clinical validation of a novel 9-gene prognostic model based on multi-omics in pancreatic adenocarcinoma
EP2622100A1 (en) Gene marker sets and methods for classification of cancer patients
EP4265739A1 (en) Gene combination for human tumor grading, and use thereof
CN108424970A (zh) 用于检测癌症复发风险的生物标志物及检测方法
EP3950960A1 (en) Dna methylation marker for predicting recurrence of liver cancer, and use thereof
Lu et al. A novel seven‑miRNA prognostic model to predict overall survival in head and neck squamous cell carcinoma patients
CN112626218A (zh) 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒
CN111471773A (zh) 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用
Zhang et al. Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma
Kumar et al. Integrative ontology and pathway-based approach identifies distinct molecular signatures in transcriptomes of esophageal squamous cell carcinoma
Luo et al. Genome-wide analysis to identify a novel microRNA signature that predicts survival in patients with stomach adenocarcinoma
Xu et al. An effective seven-CpG-based signature to predict survival in renal clear cell carcinoma by integrating DNA methylation and gene expression
WO2018049506A1 (en) Mirna prostate cancer marker
Chen et al. Identification and validation of a novel genomic instability-associated long non-coding RNA prognostic signature in head and neck squamous cell carcinoma
US20190112729A1 (en) Novel set of biomarkers useful for predicting lung cancer survival
CN116153387A (zh) 一种肺鳞癌患者总体生存率预后模型及应用
Yang et al. An integrated model of clinical information and gene expression for prediction of survival in ovarian cancer patients
He et al. Identification of a combined RNA prognostic signature in adenocarcinoma of the lung
Liu et al. The comprehensive and systematic identification of BLCA-specific SF-regulated, survival-related AS events
Li et al. Identification and validation of anoikis-associated gene SNCG as a prognostic biomarker in gastric cancer
CN114507717A (zh) 一种联合多个mRNA预测胆管癌复发的方法及其应用
Zhang et al. A high epigenetic risk score shapes the non-inflamed tumor microenvironment in breast cancer
Tang et al. DNA methylation data-based classification and identification of prognostic signature of children with Wilms tumor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination