CN109136370A - 一种肺癌的预后标记物及其应用 - Google Patents
一种肺癌的预后标记物及其应用 Download PDFInfo
- Publication number
- CN109136370A CN109136370A CN201810744302.8A CN201810744302A CN109136370A CN 109136370 A CN109136370 A CN 109136370A CN 201810744302 A CN201810744302 A CN 201810744302A CN 109136370 A CN109136370 A CN 109136370A
- Authority
- CN
- China
- Prior art keywords
- lung cancer
- gene
- prognostic markers
- markers object
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种肺癌的预后标记物及其应用,本发明公开的的标记物长链非编码RNA基因RP11‑434D9.1与肺癌患者的预后生存期非常相关,通过标记物及检测标记物的表达,迅速、准确、方便地预测了肺癌预后,从分子水平实现了肺癌危险底高低的分级分层,显著地将高低风险的患者分开,本发明通过共表达分析,找出与长非编码RP1‑434D9.1相关的238个基因,通过对这238个基因的GO与KEGG通路的富集分析,找到了长非编码RP1‑434D9.1的分子功能,为提高肺腺癌患者的预后分子诊断,以及相关药物靶点提供了生物学实验重要的新线索。
Description
技术领域
本发明属于生物医学领域,具体涉及一种肺癌的预后标记物及其应用。
背景技术
肺癌是发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤之一。近50年来许多国家都报道肺癌的发病率和死亡率均明显增高,男性肺癌发病率和死亡率均占所有恶性肿瘤的第一位,女性发病率占第二位,死亡率占第二位。目前治疗肺癌的标准疗法包括手术切除、基于铂的双重化疗和放射治疗等。但是这些疗法很少能达到治愈肺癌的目的,5年生存率仍只有17%。造成肺癌高死亡率的主要原因是患者确诊时已处于癌症晚期阶段,肿瘤细胞已发生了侵袭和转移,缺乏有效的治疗措施。为提高肺癌患者的生存率,改善肺癌患者整体治疗水平,必须积极寻找有效的早期诊断及预后标志物和有效治疗策略,尽早抑制肿瘤发生侵袭转移。
长链非编码RNA(long non-coding RNA,lncRNA)是一类长度超过200个核苷酸,无蛋白质编码功能的RNA分子,可在转录、转录后及表观遗传学等多个水平参与基因的表达调控,影响细胞的生长、发育、增殖、分化、代谢和凋亡等重要生理过程。越来越多的证据表明lncRNA与肺癌的发生发展密切相关,在肿瘤细胞凋亡调控、肿瘤浸润与转移等过程中发挥着促癌或抑癌作用,有望成为肺癌诊断及治疗中的新型分子标记物和治疗靶点。结合国内外最新报道,近年发现的与肺癌促癌作用相关的lncRNAs主要有HOX转录反义RNA(HOTAIR)、肺腺癌转移相关转录子1(MALAT1)、H19、linc-p21,与肺癌作用有关的lncRNAs主要有CCAT1、MALAT1等长链非编码RNA,改变其表达水平对肺癌细胞的增殖、侵袭等生物学行为有明显影响,与肺腺癌临床病理因素密切相关,影响疾病预后。长非编码RNA与肺癌的发生发展有密切关系。为寻找肺癌诊断及预后标志物提供了新思路,同时也为肺癌治疗提供了新策略。
发明内容
本发明的目的在于提供一种肺癌的预后标记物及其应用。
本发明所采取的技术方案是:
一种肺癌的预后标记物,所述标记物为长链非编码RNA基因RP11-434D9.1,所述RP11-434D9.1的cDNA序列为SEQ ID NO:1。
一种肺癌的预后标记物,所述标记物为长链非编码RNA基因RP11-434D9.1的共表达基因。
优选的,所述共表达基因为以下基因中的至少一个:BCL9P1、PLK1、SAPCD2、PKMYT1、GAPDH、CDCA5、VIPR1、NCKAP5、SLC2A1、RAD51、CDT1、AGER、ANOS1、TK1、KL、TMEM170B、ZWINT、CDCA3、CDC20、CYP4B1、TPX2、FAM189A2、CDCA8、FOXM1、PRC1、DAPK2、C16orf59、CD3EAPCDC6、HMGA1、ORC1、CD302、PPP1R14B、SKA3、HJURP、PRKCE、NCAPH、ATIC、CEP55、KIF2C、SESN1、ERO1A、FAM184A、CCNA2、PFKP、SLC15A2、PLEK2、LANCL1-AS1、SLCO4C1、GJB2、CDC45、AURKB、BUB1B、TROAP、BIRC5、MTURN、RS1、ARRB1、EXO1、CCNB2、PBK、EMP2、TEK、IER5L、LRP2BP、RP1-78O14.1、C19orf48、SKA1、DPPA3P2、CLIC5、BTNL9、NEK2、ANLN、ABCA8、LDHA、KIF11、LIFR、NDC80、FEN1、SCN4B、ABCA3、KIFC1、FANCI、ADRB2、OIP5、RRM2、RGCC、NUP62、GTSE1、NCAPG、KIAA0101、TIMELESS、UHRF1、PAICS、MKI67、HDGF、SLC6A4、RHOV、OTX1、KIF18B、NUSAP1、MCM10、UBE2T、MAMDC2、GPI、CDCA2、ORC6、LYPD3、LGI3、ADGRF5、SPAG5、CBLC、AURKA、TONSL、GPIHBP1、ESYT3、DLGAP5、C1QTNF6、EMCN、CCNB1、UBE2C、KIF4A、RTKN2、MYBL2、PPP1R14BP3、EDNRB、AFF3、CKS1B、TICRR、CHEK1、CENPA、GPC3、PPIF、LRRC36、SHCBP1、SNRPA1、MCM4、SFTPC、SPC24、SFTA3、FAM107A、CDC25C、FAM136A、NOP2、FANCG、TACC3、SGOL1、SDPR、PHACTR1、PTPRQ、IGSF10、FIGF、ASF1B、HM13、CLDN18、KIF14、DTYMK、INMT、RP11-259K15.2、MND1、CDK1、RECQL4、CCNE1、BLM、TMEM100、DCPS、RAD54L、MAD2L1、SBSPON、PIK3R1、CACNA2D2、RNASEH2A、C20orf194、COL6A6、H2AFX、GMPPA、NME1、RCCD1、SASH1、CENPM、MRGBP、HMMR、MASP1、DPYSL2、GOLM1、ESPL1、FENDRR、CAT、BUB1、NUDT1、UBE2S、IQGAP3、TPI1、LMNB2、ARHGEF26、C2orf71、RP11-133L19.3、ERG、NEDD9、SMOX、SPC25、SNRPA、ARHGAP11A、NUF2、CHAF1B、KIF20A、PDE8B、LPL、GGTLC1、CHRNA2、TNS1、ESCO2、FAM83A、ARNTL2、SLC5A6、C17orf53、RP11-35J10.6、KCNAB1、DNAJC9、AGMAT、DEPDC1B、CCDC141、MELK、MTIF2、MBNL1-AS1、GUCY1A2、CASC5、PAFAH1B3、SLC5A9、ARHGAP6、PEBP4、PYCR1、AC090616.2、ADAMTS8、LIG1、CDC25A、RAD51AP1、PREX2。
优选的,所述肺癌为肺腺癌。
上述的预后标记物在制备肺癌预后预测试剂中的应用。
一种用于评估肺癌预后生存期的试剂盒,其包括用于检测所述预后标记物的mRNA或蛋白表达水平的试剂。优选的,用于检测所述预后标记物的mRNA表达水平的试剂是与所述基因特异性结合的引物和/或探针;用于检测所述预后标记物的蛋白表达水平的试剂是对所述基因编码的蛋白特异的抗体。
一种肺癌的预后预测方法,包括以下步骤:
1)从肺癌患者采集样品,检测并获得所述肺癌的预后标记物RP11-434D9.1的表达量;
2)将所得RP11-434D9.1的表达量与参比值比较,检测RP11-434D9.1的表达量低于参比值预测为高风险,表达量高于参比值的预测为低风险;
所述参比值为1447.539。
优选的,所述低风险五年生存率为43.44%,所述高风险五年生存率为24.4%。
所述肺癌的预后预测模型为:
优选的,所述的预后标记物在制备肺癌预后药物中的应用。
上述的预后标记物在制备肺癌检测或筛查试剂中的应用。
一种用于肺癌检测或筛查的试剂盒,其包括用于检测所述预后标记物的mRNA或蛋白表达水平的试剂。优选的,用于检测所述预后标记物的mRNA表达水平的试剂是与所述基因特异性结合的引物和/或探针;用于检测所述预后标记物的蛋白表达水平的试剂是对所述基因编码的蛋白特异的抗体。
本发明的有益效果是:
本发明的标记物长链非编码RNA基因RP11-434D9.1与肺癌患者的预后生存期非常相关,通过标记物及检测标记物的表达,迅速、准确、方便地预测了肺癌预后,从分子水平实现了肺癌危险底高低的分级分层,显著地将高低风险的患者分开,从而指导个体化治疗,具有较高的临床应用价值,节约了医疗成本。
本发明通过共表达分析,找出与长非编码RP1-434D9.1相关的238个基因,.通过对这238个基因的GO与KEGG通路的富集分析,找到了长非编码RP1-434D9.1的分子功能。为提高肺腺癌患者的预后分子诊断,以及相关药物靶点提供了生物学实验重要的新线索。
附图说明
图1是长非编码RP11-434D9.1的高低风险生存曲线比较;
图2是长非编码RP11-434D9.1在正常人与肺腺癌患者的表达量;
图3是长非编码RP1-434D9.1 相关238个共表达基因的蛋白互作网络;
图4是长非编码RP1-434D9.1 相关GO 分析;
图5是长非编码RP1-434D9.1 相关KEGG 通路分析;
图6是RP11-434D9.1与其对应基因BCL9P1的RPKM值的散点图;
图7是RP11-434D9.1与其对应基因VIPR1的RPKM值的散点图;
图8是RP11-434D9.1与其对应基因AGER的RPKM值的散点图;
图9是RP11-434D9.1与其对应基因LANCL1-AS1的RPKM值的散点图;
图10是RP11-434D9.1与其对应基因RGCC的RPKM值的散点图;
图11是RP11-434D9.1与其对应基因GPIHBP1的RPKM值的散点图;
图12是RP11-434D9.1与其对应基因CYP4B1的RPKM值的散点图;
图13是RP11-434D9.1与其对应基因FAM189A2的RPKM值的散点图;
图14是RP11-434D9.1与其对应基因DAPK2的RPKM值的散点图;
图15是RP11-434D9.1与其对应基因RS1的RPKM值的散点图。
具体实施方式
下面结合具体的实施例对本发明作进一步的说明,但并不局限于此。
长非编码RNA基因RP11-434D9.1的Ensembl ID为ENSG00000249364,其cDNA序列见SEQ ID NO:1:
CCCAGTGTGAAGTGAAAGCAAAGTTTTAAAATTTTTTCTCCTCTGCAAGAAAATATATTTCAGAAAATCTCTATCTCAAAAATGAAGCAATTAAGAACTGTCTGGCTGTGAGGATCTGGCCTCAACTTGACTTAAAGCAACAACTTCAGTTACATATCAAGATGTGCGTGAGAATGAACCTGCTCTGCTCAGCCAACGTGCTGAGTGACTTGATGTTTGTAATAAATAAATAAATAAACAACAAACAGGTTGTCATGAAATATCCTTTGTAATTATAAACACAGGAAACTTTCTGAGATGCAAGTGGGTGTTAAATGGTTCAGCAAAGCCAAGCCAGAGCAGTTGGTGTGCTTTGAAATGAAGCAACATTGGAAAAATGAAATCTACTGAAAGATCACTACGTGTTTCAAAGAACTGACTAGAACCAGAACTCTTCAGAAAAGAATGTGCTAAAGGTTTGTCCTTGAGAAGTTTCCAAGCCAAGACACTCCTAGGAGCACTTCCCATTGAGGCCGAAAGGCTCATCCACTTACAGCGATTCATGGGAAAAGAGGACAGCACCCTCATCTTTGGTCCAAGAACACAATCCTGAGTGACACAGGATTGCCCTGAAAGTCAACAGCATCCGTCTTACAAAAATCAACAACACTCGCTTTTCAAACTTCCAAAGAATTTACTGGTCTGGTTTGGCCTTTTGGTGCCACATTCCATTCCAGAACCCCAGCTAAAATGTTCTCAAGGGCTGACCAGAGATTCCTCCTCCTTTCTCTGGGCTGGTAC
长非编码RNA基因RP11-434D9.1与肺癌患者的预后生存期关系:
通过对TCGA的LUAD板块的RNA-seq以及生存期数据的大数据挖掘,我们使用Survival软件的R包对基因RP11-434D9.1(序列为SEQ ID NO:1)进行Kaplan-Meier方法的log-rank检验进行生存期分析,RP11-434D9.1在肺腺癌患者之间有显著差异(p值=0.014)。基因RP11-434D9.1的高低风险生存曲线比较见图1,由图1也可知,长非编码RP11-434D9.1的表达量高低与肺腺癌患者间预后生存期密切相关。横坐标代表病人的生存时间(以年为单位),纵坐标代表总生存率。蓝色线条代表低风险组,红色线条代表高风险组,log-rank检验显著性p=0.014,说明高低风险组之间的生存曲线具有显著的差异。低风险五年生存率为43.44%,高风险五年生存率为24.4%,五年生存率相差非常明显。RP11-434D9.1基因表达量的中位值为1447.539,表达量低于中位值预测为高风险,表达量高于中位值的预测为低风险,低风险相比高风险五年生存率差异显著。
通过对TCGA的LUAD板块的RNA-seq测序数据的分析,基因RP11-434D9.1在正常人与肺腺癌患者的表达量比较见图2,由图2可知,长非编码RP11-434D9.1基因的表达量在肺腺癌肿瘤与其癌旁标本有显著的表达差异。
肺腺癌的预后长非编码RNA基因RP11-434D9.1的鉴定与功能预测:
1.2016年6月从TCGA下载肺腺癌数据,包括转录组数据和临床生存数据,共515个样品。
2.去除临床数据不完整的样品,如随访不完全的数据,剩余464个样品。
3.使用DESeq R包比较正常人和癌症病人之前的基因表达量(筛选条件为:|log2FC|>2,padj<0.001),得到1618个差异表达基因。DESeq查找差异基因的主要代码如下:
>library("DESeq")
>group=c(rep("normal",num1),rep("tumor",num2))
>design = factor(group)
>newTab = newCountDataSet( data, design )
>newTab = estimateSizeFactors(newTab)
>newTab = estimateDispersions( newTab, fitType = "local")
>diff = nbinomTest( newTab, "normal", "tumor")
4.单因素COX并用于分析生存时间与差异基因的关系,找出与生存时间相关的基因(p<0.001),得到131个与生存相关的基因。单因素COX分析代码如下:
>library(survival)
>cox <- coxph(Surv(futime, fustat) ~ geneName, data = rt)
5.对于单因素分析得到的生存时间相关的基因,我们使用多因素COX进行分析,采用的是逐步回归法。最后,我们得到基因表达量评估肺腺癌生存期的模型。多因素COX分析代码如下:
> library(survival)
>rt=read.table("tumor.time.txt",header=T,sep="\t",check.names=F,row.names=1)
> rt[,"futime"]=rt[,"futime"]/365
> a=rt[,"RP11-434D9.1|lincRNA"]>median(rt[,"RP11-434D9.1|lincRNA"])
>median(rt[,"RP11-434D9.1|lincRNA"])
> diff=survdiff(Surv(futime, fustat) ~a,data = rt)
> fit=survfit(Surv(futime, fustat) ~ a, data = rt)
> pValue=1-pchisq(diff$chisq,df=1)
> pValue=round(pValue,10)
> print(pValue)
>tiff(file="survival.tiff",width=17,height=13,units="cm",compression="lzw",bg="white",res=1500)
> par(oma=c(0.5,1,0,1),font.lab=1.5,font.axis=1.5)
> plot(fit, col=c("red","blue"), xlab="Time (year)", ylab="Overallsurvival",
main="Survival curve (p=6.853e-07)",mark.time=T,lwd = 2, cex.main=1.3,cex.lab=1.2, cex.axis=1.2, font=1.2)
> legend("topright", c("Low risk", "High risk"), col=c("red","blue"),bty="n",lwd = 2,cex=1.2)
所述评估肺腺癌生存期的模型为:
S=∑Pi * Ci
其中,S是肺癌预后风险值,Pi 是第i位基因的定量表达值,Ci代表第i位基因的COX回归系数,i=1,2,3,4…n,n为肺癌的预后标记物的总数。
6.通过共表达分析,找出相关表达量相关的基因群:我们通过对TCGA的RNA-seq表达谱的进行共表达分析,就是将表达量与基因RP11-434D9.1有一定正相关或者负相关关系的基因,即通过correlation函数,找出绝对值大于0.40的相关基因(表1)。
6.基因共表达网络分析(Gene Co-expression Network Analysis)是基于基因间表达数据的相似性而构建的网络图,图3中的节点代表基因,具有相似表达谱的基因被连接起来形成网络。通过对RP11-434D9.1的共表达基因群(表1)做蛋白互作分析,我们得到蛋白互作网络(Protein-Protein Interaction Network,PPI)(图3)。
7.GO是Gene ontology(基因功能注解)的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
开源的生物信息学在线软件DAVID(Database for Annotation, Visualizationand Integration Discovery)是生物信息学资源的工具,开源网站http://david.abcc.ncifcrf.gov提供来自基因组研究的大量基因列表的功能解释。使用DAVID对RP11-434D9.1这个长非编码RNA共表达基因进行GO分析(图4),结果表格如表2。
伪发现率(FDR, false discovery rate),是统计学中常见的一个名词,其意义为是错误拒绝(拒绝原来是真的假设)的个数占所有被拒绝的原假设个数的比例的期望值。
8. GO分析是将基因分门别类放入一个个功能类群的篮子,而KEGG 通路分析则是将基因一个个具体放到功能网络中的指定位置。KEGG 通路分析指KEGG通路分析,对差异基因进行通路分析,可以了解实验条件下显著改变的分子通路,在生物机制研究中显得尤为重要。
我们使用网上开源软件DAVID进行生物信息分析,对RP11-434D9.1的238个共表达基因(表1)进行KEGG富集分析(图5),结果表格见表3,其中例如细胞周期(cell cycle)的18个相关基因,就是RP11-434D9.1这个长非编码RNA的非常显著的分子信号通路(伪发现率<1.8E-09)以及其调控的靶基因。
共表达网络的建设从概念上来讲是简单直观的,通过基因表达的相似性可分析基因产物可能的相互作用关系(图3),从而了解基因间相互作用脉络及寻找核心基因,核心基因是重要的枢纽,在网络模块中起关键性作用,加上GO分析(表2)以及KEGG分子通路分析(表3),我们可以预测图3核心基因RP11-434D9.1的功能:我们成功预测了共表达网络的核心基因RP11-434D9.1这个长非编码RNA的分子生物功能。
本发明通过对TCGA肿瘤临床数据库的RNA-seq大数据挖掘,验证RP11-434D9.1长链非编码RNA与肺腺癌患者的预后生存期非常相关;通过对238个与RP11-434D9.1共表达的基因进行生物信息学GO与KEGG通路的富集分析,我们成功预测了RP11-434D9.1这个长链非编码RNA的分子功能,为提高肺腺癌患者的预后分子诊断,以及相关药物靶点提供了生物学实验重要的新线索。
通过共表达分析,我们成功预测长非编码RP1-434D9.1在肺腺癌分子功能与下面肿瘤密切相关的信号通路影响患者的预后生存期:细胞分裂(cell division),细胞周期(cell cycle),有丝分裂(mitosis),细胞周期M期(M Phase)等通路,肺腺癌预后相关的RP1-434D9.1相关的靶基因见表1。
本发明从TCGA下载肺癌病人的RNA-seq和临床数据,就可以解决收集样品难,测序费用高,以及对病人随访的问题。TCGA,即癌症和肿瘤基因图谱(Cancer Genome Atlas)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症的基因组变异图谱绘制出来。此外,TCGA的随访数据也做得非常完善,可以很方便地从TCGA下载病人的随访数据。
本发明从TCGA数据库下载所有肺腺癌样品的表达数据和临床数据。为了保证结果的准备性,临床数据不完善和总生存时间小于一个月的样品也排除在分析之外。然后,我们通过对正常样品和癌症样品的进行差异基因分析,得到在癌症样品中具有差异表达的基因,对于单因素分析得到的生存相关的基因,我们使用多因素COX进行分析,采用的是逐步回归法。RP11-434D9.1基因表达量的中位值为1447.539,表达量低于中位值预测为高风险组,表达量高于中位值的预测为低风险组,低风险组相比高风险组五年生存率差异显著。最后,我们得到基因表达量评估肺腺癌生存期的模型,通过RP11-434D9.1这个个长链非编码RNA的相关共表达靶基因,预测RP11-434D9.1的分子功能与信号通路。
本发明只需从网络TCGA肿瘤数据库下载数据,解决收集样品难,测序费用高,以及对病人随访困难的问题。同时使用Cox比例风险回归模型,解决了病人的生存时间有很多截尾数据,以及生存期的资料一般不服从正态分布的问题。
本发明的长非编码RP11-434D9.1的表达量高低与肺腺癌密切相关,得到的高低风险组可以显著地将高低风险的病人分开,五年生存率相差非常明显。
下面结合实验,进一步说明本发明的技术方案。
本发明通过RNA-seq测序,在574个肺腺癌患者标本中,验证了RP11-434D9.1高表达,而且相关的共表达基因也同时高表达,相关性显著(p<0.0001)。具体的实验操作和结果如下:
样品提取总RNA后,要选择质量合格的Total RNA作为mRNA测序的建库起始样品,其质量要求通过Agilent 2100 BioAnalyzer检测结果RIN≥7,28S和18S的RNA 的比值大于或等于1.5:1,起始量的要求范围是0.1∽1ug。用QUBIT RNA ASSAY KIT对起始的Total RNA进行准确定量。对于真核生物,用带有Oligo(dT)的磁珠富集mRNA,向得到的mRNA中加入Fragmentation Buffer使其片断成为短片段,再以片断后的mRNA为模板,用六碱基随机引物(random hexamers)合成cDNA第一链,并加入缓冲液、dNTPs、RNase H 和DNA polymeraseI 合成cDNA第二链,经过QiaQuick PCR试剂盒纯化并加 EB缓冲液洗脱经末端修复、加碱基A,加测序接头,再经琼脂糖凝胶电泳回收目的大小片段,并进行PCR扩增,从而完成整个文库制备工作,构建好的文库用Illumina HiSeq进行测序。
1)样品提取总RNA后,过柱纯化,保留200nt以上的RNA;
2)富集mRNA,并用二价阳离子高温加热的方法将mRNA片断化;
3)以mRNA短片段为模板,用六碱基随机引物反转录合成双链cDNA;
4)经纯化、末端修复、加碱基A、加测序接头的步骤,根据测序长度和是否做对读测序,确定琼脂糖凝胶电泳回收片段的大小,并进行PCR扩增,完成测序文库的制备;
5)构建好的文库经cBot扩增,用Illumina HiSeq进行测序。
RNA-seq测序实验表明RP11-434D9.1在肺腺癌中高表达,本项目利用RNA-seq测序与生物信息数据分析流程,利用基因表达量(Fragment perkilometer,FPKM)的计算方法,分析肺腺癌标本的RNA-seq高通量测序数据,其中长非编码RNA基因RP11-434D9.1在肺腺癌等相关组织内高表达。从RNA-seq测序结果,发明人找出RP11-434D9.1相关的调控基因群,将表达量与RP11-434D9.1有正相关的关系的基因,通过correlation函数,找出相关性大于0.48的相关基因,其中表4显示了前10个LINC00702在肺腺癌中最相关的基因。
通过高通量测序得到574个肺腺癌患者的RNA-seq数据,并探索长非编码RP11-434D9.1与其它相关基因的关系,画出RP11-434D9.1与其对应基因的RPKM值的散点图且添加相应的回归线,其相关关系由皮尔森相关系数及其相应的t检验所确定。与表1中一一对应的图形如图6-15所示。
序列表
<110> 广州表观生物科技有限公司;广州万德基因医学科技有限公司
<120> 一种肺癌的预后标记物及其应用
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 780
<212> DNA
<213> human RP11-434D9.1 cDNA
<400> 1
cccagtgtga agtgaaagca aagttttaaa attttttctc ctctgcaaga aaatatattt 60
cagaaaatct ctatctcaaa aatgaagcaa ttaagaactg tctggctgtg aggatctggc 120
ctcaacttga cttaaagcaa caacttcagt tacatatcaa gatgtgcgtg agaatgaacc 180
tgctctgctc agccaacgtg ctgagtgact tgatgtttgt aataaataaa taaataaaca 240
acaaacaggt tgtcatgaaa tatcctttgt aattataaac acaggaaact ttctgagatg 300
caagtgggtg ttaaatggtt cagcaaagcc aagccagagc agttggtgtg ctttgaaatg 360
aagcaacatt ggaaaaatga aatctactga aagatcacta cgtgtttcaa agaactgact 420
agaaccagaa ctcttcagaa aagaatgtgc taaaggtttg tccttgagaa gtttccaagc 480
caagacactc ctaggagcac ttcccattga ggccgaaagg ctcatccact tacagcgatt 540
catgggaaaa gaggacagca ccctcatctt tggtccaaga acacaatcct gagtgacaca 600
ggattgccct gaaagtcaac agcatccgtc ttacaaaaat caacaacact cgcttttcaa 660
acttccaaag aatttactgg tctggtttgg ccttttggtg ccacattcca ttccagaacc 720
ccagctaaaa tgttctcaag ggctgaccag agattcctcc tcctttctct gggctggtac 780
Claims (9)
1.一种肺癌的预后标记物,所述标记物为长链非编码RNA基因RP11-434D9.1,所述RP11-434D9.1的cDNA序列为SEQ ID NO:1。
2.一种肺癌的预后标记物,所述标记物为长链非编码RNA基因RP11-434D9.1的共表达基因。
3.根据权利要求1或2所述的预后标记物,其特征在于,所述肺癌为肺腺癌。
4.权利要求1或2所述的预后标记物在制备肺癌预后预测试剂中的应用。
5.根据权利要求4所述的应用,其特征在于,一种用于评估肺癌预后生存期的试剂盒,其包括用于检测所述预后标记物的mRNA或蛋白表达水平的试剂。
6.根据权利要求5所述的应用,其特征在于,用于检测所述预后标记物的mRNA表达水平的试剂是与所述基因特异性结合的引物和/或探针;用于检测所述预后标记物的蛋白表达水平的试剂是对所述基因编码的蛋白特异的抗体。
7.权利要求1或2所述的预后标记物在制备肺癌检测或筛查试剂中的应用。
8.根据权利要求7所述的应用,其特征在于,一种用于肺癌检测或筛查的试剂盒,其包括用于检测所述预后标记物的mRNA或蛋白表达水平的试剂。
9.根据权利要求8所述的应用,其特征在于,用于检测所述预后标记物的mRNA表达水平的试剂是与所述基因特异性结合的引物和/或探针;用于检测所述预后标记物的蛋白表达水平的试剂是对所述基因编码的蛋白特异的抗体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810548706X | 2018-05-31 | ||
CN201810548706 | 2018-05-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109136370A true CN109136370A (zh) | 2019-01-04 |
Family
ID=64799969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810744302.8A Pending CN109136370A (zh) | 2018-05-31 | 2018-07-09 | 一种肺癌的预后标记物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109136370A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110331203A (zh) * | 2019-07-30 | 2019-10-15 | 中南大学湘雅三医院 | 泛素连接酶chaf1b作为靶位点在制备肺腺癌顺铂增敏药物中的应用 |
CN110942808A (zh) * | 2019-12-10 | 2020-03-31 | 山东大学 | 一种基于基因大数据的预后预测方法及预测系统 |
CN111635941A (zh) * | 2020-06-08 | 2020-09-08 | 重庆医科大学附属第一医院 | Sdpr基因表达和/或sdpr基因甲基化水平的检测试剂盒及应用 |
CN112011617A (zh) * | 2020-09-10 | 2020-12-01 | 广西医科大学 | Fhl1在制备肺腺癌手术患者预后诊断的试剂盒中的应用 |
CN113203780A (zh) * | 2021-05-13 | 2021-08-03 | 桂林电子科技大学 | 一种无标记适配体传感器检测gpc3的方法 |
CN113322326A (zh) * | 2021-08-02 | 2021-08-31 | 北京泱深生物信息技术有限公司 | 肺癌的预后标志物、预后模型及相关应用 |
CN113373232A (zh) * | 2021-06-29 | 2021-09-10 | 北京泱深生物信息技术有限公司 | 用于预测肺癌患者生存期的生物标志物及相关产品 |
CN113388683A (zh) * | 2021-06-29 | 2021-09-14 | 北京泱深生物信息技术有限公司 | 与肺癌预后相关的生物标志物及其应用 |
CN113785076A (zh) * | 2019-05-03 | 2021-12-10 | 株式会社递希真 | 预测癌症预后的方法及其组合物 |
CN114032308A (zh) * | 2021-11-19 | 2022-02-11 | 上海生物芯片有限公司 | Fam83a、kpna2、krt6a和ldha联合作为肺腺癌生物标志物的用途 |
CN114388063A (zh) * | 2021-12-31 | 2022-04-22 | 深圳承启生物科技有限公司 | 与肿瘤细胞恶性表型关联的非差异基因及其筛选方法和应用 |
CN114870017A (zh) * | 2022-05-07 | 2022-08-09 | 温州医科大学附属第六医院 | Tmem100在调控肺癌5-氟尿嘧啶耐药的应用 |
CN115637292A (zh) * | 2022-11-14 | 2023-01-24 | 中国医学科学院肿瘤医院 | 预测肺腺癌患者小细胞转化风险的模型及其建立方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102465172A (zh) * | 2010-11-04 | 2012-05-23 | 中山大学达安基因股份有限公司 | 非小细胞肺癌分子标志物相关探针的制备方法及其应用 |
EP2732049A1 (en) * | 2011-07-14 | 2014-05-21 | Traslational Cancer Drugs Pharma, S.L. | Method for predicting outcome of cancer in a subject |
CN104450899A (zh) * | 2014-11-27 | 2015-03-25 | 武昌理工学院 | 一种用于肺癌检测的rbm5fish探针的制备方法 |
CN106119405A (zh) * | 2016-08-31 | 2016-11-16 | 广州万德基因医学科技有限公司 | 一种肺癌的预后标记物、使用该标记预测肺癌预后的方法及应用 |
-
2018
- 2018-07-09 CN CN201810744302.8A patent/CN109136370A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102465172A (zh) * | 2010-11-04 | 2012-05-23 | 中山大学达安基因股份有限公司 | 非小细胞肺癌分子标志物相关探针的制备方法及其应用 |
EP2732049A1 (en) * | 2011-07-14 | 2014-05-21 | Traslational Cancer Drugs Pharma, S.L. | Method for predicting outcome of cancer in a subject |
CN104450899A (zh) * | 2014-11-27 | 2015-03-25 | 武昌理工学院 | 一种用于肺癌检测的rbm5fish探针的制备方法 |
CN106119405A (zh) * | 2016-08-31 | 2016-11-16 | 广州万德基因医学科技有限公司 | 一种肺癌的预后标记物、使用该标记预测肺癌预后的方法及应用 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113785076A (zh) * | 2019-05-03 | 2021-12-10 | 株式会社递希真 | 预测癌症预后的方法及其组合物 |
CN113785076B (zh) * | 2019-05-03 | 2024-06-11 | 株式会社递希真 | 预测癌症预后的方法及其组合物 |
CN110331203A (zh) * | 2019-07-30 | 2019-10-15 | 中南大学湘雅三医院 | 泛素连接酶chaf1b作为靶位点在制备肺腺癌顺铂增敏药物中的应用 |
CN110331203B (zh) * | 2019-07-30 | 2023-04-18 | 中南大学湘雅三医院 | 泛素连接酶chaf1b作为靶位点在制备肺腺癌顺铂增敏药物中的应用 |
CN110942808A (zh) * | 2019-12-10 | 2020-03-31 | 山东大学 | 一种基于基因大数据的预后预测方法及预测系统 |
CN111635941A (zh) * | 2020-06-08 | 2020-09-08 | 重庆医科大学附属第一医院 | Sdpr基因表达和/或sdpr基因甲基化水平的检测试剂盒及应用 |
CN112011617A (zh) * | 2020-09-10 | 2020-12-01 | 广西医科大学 | Fhl1在制备肺腺癌手术患者预后诊断的试剂盒中的应用 |
CN113203780A (zh) * | 2021-05-13 | 2021-08-03 | 桂林电子科技大学 | 一种无标记适配体传感器检测gpc3的方法 |
CN113203780B (zh) * | 2021-05-13 | 2022-05-31 | 桂林电子科技大学 | 一种非诊断目的无标记适配体传感器检测gpc3的方法 |
CN113388683A (zh) * | 2021-06-29 | 2021-09-14 | 北京泱深生物信息技术有限公司 | 与肺癌预后相关的生物标志物及其应用 |
CN113373232A (zh) * | 2021-06-29 | 2021-09-10 | 北京泱深生物信息技术有限公司 | 用于预测肺癌患者生存期的生物标志物及相关产品 |
CN113322326A (zh) * | 2021-08-02 | 2021-08-31 | 北京泱深生物信息技术有限公司 | 肺癌的预后标志物、预后模型及相关应用 |
CN114032308A (zh) * | 2021-11-19 | 2022-02-11 | 上海生物芯片有限公司 | Fam83a、kpna2、krt6a和ldha联合作为肺腺癌生物标志物的用途 |
CN114032308B (zh) * | 2021-11-19 | 2022-11-29 | 上海生物芯片有限公司 | Fam83a、kpna2、krt6a和ldha联合作为肺腺癌生物标志物的用途 |
CN114388063A (zh) * | 2021-12-31 | 2022-04-22 | 深圳承启生物科技有限公司 | 与肿瘤细胞恶性表型关联的非差异基因及其筛选方法和应用 |
CN114388063B (zh) * | 2021-12-31 | 2022-11-29 | 深圳承启生物科技有限公司 | 与肿瘤细胞恶性表型关联的非差异基因及其筛选方法和应用 |
CN114870017A (zh) * | 2022-05-07 | 2022-08-09 | 温州医科大学附属第六医院 | Tmem100在调控肺癌5-氟尿嘧啶耐药的应用 |
CN115637292A (zh) * | 2022-11-14 | 2023-01-24 | 中国医学科学院肿瘤医院 | 预测肺腺癌患者小细胞转化风险的模型及其建立方法 |
CN115637292B (zh) * | 2022-11-14 | 2023-03-10 | 中国医学科学院肿瘤医院 | 预测肺腺癌患者小细胞转化风险的模型及其建立方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109136370A (zh) | 一种肺癌的预后标记物及其应用 | |
Poore et al. | Microbiome analyses of blood and tissues suggest cancer diagnostic approach | |
Gao et al. | Delineating copy number and clonal substructure in human tumors from single-cell transcriptomes | |
Gambardella et al. | A single-cell analysis of breast cancer cell lines to study tumour heterogeneity and drug response | |
Tellez-Gabriel et al. | Tumour heterogeneity: the key advantages of single-cell analysis | |
Berglund et al. | Spatial maps of prostate cancer transcriptomes reveal an unexplored landscape of heterogeneity | |
Wang et al. | Analysis of serum microRNA profile by solexa sequencing in women with endometriosis | |
Sun et al. | Gene co-expression network reveals shared modules predictive of stage and grade in serous ovarian cancers | |
KR102071491B1 (ko) | 차세대 염기서열분석을 이용한 기계학습 기반 유방암 예후 예측 방법 및 예측 시스템 | |
Bertucci et al. | Lobular and ductal carcinomas of the breast have distinct genomic and expression profiles | |
US20160068915A1 (en) | Methods and compositions for classification of samples | |
Montero-Conde et al. | Molecular profiling related to poor prognosis in thyroid carcinoma. Combining gene expression data and biological information | |
Cheang et al. | Gene expression profiling of breast cancer | |
Xia et al. | Identification of four hub genes associated with adrenocortical carcinoma progression by WGCNA | |
Milanez-Almeida et al. | Cancer prognosis with shallow tumor RNA sequencing | |
Chandrasekaran et al. | Implementation of multigene germline and parallel somatic genetic testing in epithelial ovarian cancer: SIGNPOST study | |
Zhang et al. | Identification of the key transcription factors in esophageal squamous cell carcinoma | |
Wang et al. | Transcriptome analysis in primary colorectal cancer tissues from patients with and without liver metastases using next‐generation sequencing | |
Jee et al. | Molecular classification of basal cell carcinoma of skin by gene expression profiling | |
Hartung et al. | A core program of gene expression characterizes cancer metastases | |
Wang et al. | Single-cell sequencing-enabled hexokinase 2 assay for noninvasive bladder cancer diagnosis and screening by detecting rare malignant cells in urine | |
Sarafidis et al. | An integrated bioinformatics analysis towards the identification of diagnostic, prognostic, and predictive key biomarkers for urinary bladder cancer | |
Xu et al. | Decoding expression dynamics of protein and transcriptome at the single-cell level in paired picoliter chambers | |
Slattery et al. | Improved survival among colon cancer patients with increased differentially expressed pathways | |
Wang et al. | A gene interaction network‑based method to measure the common and heterogeneous mechanisms of gynecological cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190104 |
|
WD01 | Invention patent application deemed withdrawn after publication |