用于联合诊断肺腺癌的生物标志物
技术领域
本发明属于疾病诊断领域,涉及用于联合诊断肺腺癌的生物标志物,具体涉及EEF1A2、MUC3A、IGF2BP3或B4GALNT4在肺腺癌联合诊断中的应用。
背景技术
肺癌是世界上癌症相关死亡的重要原因,肺癌在男性癌症中的发病率仅次于前列腺癌,在女性癌症中的发病率仅次于乳腺癌,且肺癌的死亡率在男性和女性的癌症相关死亡率中均占首位。
目前常用的用于肺癌诊断的方法包括如下方式:
计算机断层扫描成像(Computed Tomography,CT),不够清楚显示早期肺癌病变的影像学特征,预测的阳性率不高,不能准确地评估病变部位大小,不能较细的观察病灶的内部结构和边缘特点,需要辅助其他的诊断手段。
磁共振成像(Magnetic Resonance Imaging,MRI)对软组织显像效果较好,但是由于肺组织里含有气体,质子密度较低导致信号的轻度较弱,它很少被应用于检查呼吸系统的疾病。
PET是一种功能性分子成像方法,诊断时静脉使用示踪剂18F-FDG,该示踪剂的第二位碳原子缺乏氧原子,不能参与正常的葡萄糖代谢,所以在被细胞摄取后不能被细胞进一步代谢而存留在细胞之内,而PET-CT价格非常昂贵,检查时需要向身体内注射放射性的药物,对身体有一定的辐射。而且CT本身的X射线照射剂量也很多。没有指征的进行PET/CT检查只会让身体接受不必要的辐射。
研究表明,肺癌的发生和发展过程包含多种分子和通路的调节机制。从肺癌中寻找有更多差异表达且有临床意义的基因,对探讨其与肺癌的发生、发展的关系,对提高肺癌的临床诊断评价具有重要的价值。
发明内容
本发明的目的在于提供能够诊断、筛查或监测肺腺癌、预测形成肺腺癌的风险或预测肺腺癌的结果的生物标志物。
为了实现上述目的,本发明采用如下技术方案:
本发明提供了检测分子标志物的试剂在制备诊断肺腺癌的产品中的应用,所述分子标志物包括EEF1A2、MUC3A、IGF2BP3或B4GALNT4中的至少两种。
优选的,所述分子标志物包括EEF1A2、MUC3A、IGF2BP3和B4GALNT4中的四种。
在本发明中,所述试剂包括能够定量所述分子标志物的表达水平的试剂。
“表达水平”是指受试者的样品中由所述分子标志物产生的基因产物的可测量的量,其中基因产物可以是转录产物或翻译产物。因此,表达水平与核酸基因产物(如mRNA或cDNA)或多肽基因产物有关,同时表达水平衍生自受试者的样品和/或参考样品。
进一步,所述试剂包括通过基于测序的方法、基于芯片的方法和基于PCR的方法定量所述分子标志物表达水平的试剂。
“基于测序的方法”指通过使测序方法平行化,一次产生几千个或几百万个序列的高通量测序技术。方法包括大规模平行标签测序(Massively Pa rallel SignatureSequencing,MPSS)、Polony测序、454焦磷酸测序、Illumina(Solexa)测序、SOLiD测序、离子半导体测序、DNA纳米球测序、Helioscope(TM)单分子测序、单分子SMRT(TM)测序、单分子实时(RNAP)测序、纳米孔DNA测序。
“基于芯片的方法”包含针对至少一种mRNA生物标志物的探针,本发明中所述至少一种mRNA生物标志物是包括EEF1A2、MUC3A、IGF2BP3或B4GALNT4及辅因子组、多变量面板或它们的任意组合。
“基于PCR的方法”指包含聚合酶链式反应PCR的方法。这是利用一种、两种或更多种引物在体外酶促复制指数扩增核酸(例如DNA或RNA)的方法。对于RNA扩增,可使用逆转录作为第一步。基于PCR的方法包含动力学或定量PCR(如QPCR,其特别适宜于分析表达水平)。基于PCR的方法(如逆转录PCR,RT-PCR)可以通过检测目标基因mRNA的存在来确定表达水平,其过程为(1)在逆转录酶的协助下将完整的mRNA库(所谓的转录物组)逆转录为cDNA,(2)在相应的引物的协助下检测cDNA产物的存在。“基于PCR的方法”也包含端点PCR及应用特别的荧光团或嵌入染料的动力学/实时PCR技术,所述荧光团或嵌入染料发射荧光信号作为扩增的靶标的函数,并允许进行靶标的监测和定量。用于定量的外部标准曲线可由绝对的或相对的内部标准品通过计算得到。
在本发明的PCR中,可使用各种常规的耐热DNA聚合酶进行扩增,包括但不限于FastStart Taq DNA聚合酶(Roche)、Ex Taq(注册商标,Takara)、Z-Taq、AccuPrime TaqDNA聚合酶和HotStarTaq Plus DNA聚合酶。
在获得PCR产物后,可对PCR产物进行处理,单链PCR产物的产生和纯化可通过本领域周知的方法来进行。常见的产生和纯化单链PCR产物的方法包括但不限于T7逆转录法[Hughes等人,Nat.Biotechnol.,2001,19:342-347]、核酸外切酶法[Higuchi和Ochman,Nucleic.Acids Res.,1989,17:5865]、变性高效液相色谱法[denaturing high-performance liquid chromatography,DHPLC]、[Dickman和Hornby,Anal.Biochem.,2000,284:164-167]和磁珠捕获法[Espelund等人,Nucleic.Acids Res.,1990,18:6157-6158]等。
另外,也可使用不对称PCR方法直接制备单链PCR产物,从而省去了PCR后额外的处理过程。不对称PCR可在PCR扩增的同时制备DNA单链。常规不对称PCR使用两条不等量的引物,在开始的循环里进行正常扩增。随着循环的增加,量少的引物被逐渐耗尽,而超量的引物可继续直线扩增生成DNA单链[Gyllensten和Erlich,Proc.Natl.Acad.Sci.U.S.A.,1988,85:7652-7656]。
作为一种优选的实施方案,所述基于PCR的方法定量所述分子标志物表达水平的试剂包括特异性扩增所述分子标志物的引物。
本发明中,所述特异性扩增所述分子标志物的引物序列如SEQ ID NO.1-8所示。
本发明提供了一种用于肺腺癌诊断的产品,所述产品包括检测分子标志物的表达水平的试剂,所述分子标志物包括EEF1A2、MUC3A、IGF2BP3或B4GALNT4中的至少两种。
进一步,所述试剂包括能够定量所述分子标志物mRNA的试剂,和/或能够定量所述分子标志物编码的蛋白的试剂。
进一步,定量所述分子标志物mRNA的试剂包括特异性扩增所述分子标志物的引物或特异性识别所述分子标志物的探针。
进一步,特异性扩增EEF1A2、MUC3A、IGF2BP3或B4GALNT4的引物序列如SEQ IDNO.1-8所示。
本发明所用的“引物”通常指与靶序列互补和退火的线性寡核苷酸。引物长度的下限按杂交能力而定,因为非常短的引物(例如小于5个核苷酸)在大多数杂交条件下形不成热力学稳定的双链体。引物长度通常在8-50个核苷酸内变化。在某些实施方案中,引物介于大约15-25个核苷酸之间。本发明中“正向引物”是指与靶DNA的一条特定链退火的寡核苷酸,“反向引物”是指与靶DNA的相反链退火的寡核苷酸。总之,正向引物和反向引物通常以类似于PCR引物的方式定向在靶DNA序列上,使得其3'末端比其5'末端更接近靶序列。天然存在的核苷酸(尤其是鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶,在下文称为“G”、“A”、“C”和“T”)以及核苷酸类似物,都可作为本发明的引物。
本发明所述的基因来源于智人(Homo sapiens),可在GeneBank数据库中查询到:
EEF1A2基因(Gene ID:1917)。
MUC3A基因(Gene ID:4584)
IGF2BP3基因(Gene ID:10643)
B4GALNT4基因(Gene ID:338707)
ALAS2基因(Gene ID:212)。
本发明的优点和有益效果:
本发明发现了用于诊断肺腺癌的生物标志物,使用该生物标志物可以判断是否患有肺腺癌或患有肺腺癌的风险,以期实现早发现早治疗,提高患者的生存率。
附图说明
图1是利用QPCR检测EEF1A2、MUC3A、IGF2BP3、B4GALNT4或ALAS2基因在肺腺癌组织与癌旁组织中的表达水平图,其中图A为EEF1A2,图B为MUC3A,图C为IGF2BP3,图D为B4GALNT4,图E为ALAS2。
具体实施方式
实施例1肺腺癌组织中差异表达基因的检测
1、样本的收集
收集肺腺癌组织和癌旁组织各59例,所有样本离体后立即放入装有RNA保护液的冻存管中,并在30分钟内置于-80℃冰箱中冷冻保存,整个操作及保存过程遵循无酶原则。
2、RNA样品的制备
利用TRIzol RNA提取方法提取肺腺癌组织和癌旁组织中的总RNA。
(1)用液氮预冷研钵,组织样品放入加有液氮的研钵中,在液氮下把组织样品充分研磨成粉末;
(2)把样品粉末转入到装有TRIzol裂解液的2.0ml EP管中,(每ml裂解液可加50mg组织样品)剧烈震荡,充分混匀,平放室温静置5-10min;
(3)10000rpm,4℃离心5min;
(4)吸取上清液至新的2.0ml EP管中,每毫升裂解液加入200μl氯仿/异戊醇,剧烈颠倒混匀;
(5)10000rpm,4℃离心10min;
(6)吸取上清液至新的1.5ml离心管,注意不要吸到中间蛋白层,加入等上清液体积的异丙醇,轻轻颠倒混匀;
(7)放入-20℃冰箱沉淀1h;
(8)13600rpm,4℃离心20min;
(9)吸弃上清,加入1ml 75%乙醇,用移液器吹洗沉淀;
(10)10000rpm,4℃离心3min,吸弃上清,短暂离心,吸去残留液体,晾干3-5min;
(11)用30-100μl DEPC水或者RNase Free水溶解沉淀;
(12)置于-80℃冰箱保存。
3、总RNA逆转录
利用TIANGEN公司的逆转录试剂盒(货号KR106)进行RNA的逆转录(方法按照试剂盒推荐标准流程操作)
(1)去除基因组DNA
将1.0μg的总RNA模板与2.0μl的5×gDNA buffer和RNase Free水混合,终体积为10μl,42℃孵育3min。
(2)逆转录PCR反应体系
将2.0μl的10×Fast RT buffer、1.0μl的PrimerScript RT Enzyme Mix I与2.0μl的FQ-RT Primer Mix混合,加入10μl的去除基因组DNA的反应体系和5.0μl的RNase Free水,共20μl,42℃反应15min,之后95℃反应3min。
4、QPCR反应
(1)引物设计
根据基因序列,设计引物,引物序列如下:
EEF1A2基因:
正向引物:5’-ATCAACATCGTGGTCATC-3’(SEQ ID NO.1);反向引物:5’-AACTTCTCAATGGTCCTT-3’(SEQ ID NO.2)。
MUC3A基因:
正向引物:5’-ATTACCTATGATGACAGA-3’(SEQ ID NO.3);反向引物:5’-CTAACAGAGATTGAGATT-3’(SEQ ID NO.4)。
IGF2BP3基因:
正向引物为5’-GCGGCTTGTAAGTCTATT-3’(SEQ ID NO.5);反向引物为5’-GTCTGTGTCTTGCTCAAT-3’(SEQ ID NO.6)。
B4GALNT4基因:
正向引物为5’-GACAACAAGTGCTTCTAC-3’(SEQ ID NO.7);反向引物为5’-TCTTCTTCATCCTCATCC-3’(SEQ ID NO.8)。
ALAS2基因:
正向引物为5’-ATGCTGTAGGACTGTATG-3’(SEQ ID NO.9);反向引物为5’-AGAGTTCCAGAGATGATG-3’(SEQ ID NO.10)。
管家基因β-actin基因:
正向引物为5’-TGGACTTCGAGCAAGAGATG-3’(SEQ ID NO.11);反向引物为5’-GAAGGAAGGCTGGAAGAGTG-3’(SEQ ID NO.12)。
(2)配制20μl PCR反应体系:
利用TIANGEN公司的SuperReal PreMix Plus试剂盒。2×SuperReal PreMix Plus10μl,正向(反向)引物0.6μl,cDNA模板2μl,50×ROX Reference Dye 2μl,ddH2O 4.8μl。
(3)PCR反应条件:95℃15min,(95℃10s,55℃30s,72℃32s)进行40个循环,之后95℃15s,60℃60s,95℃15s。以SYBR Green作为荧光标志物,在ABI 7300型荧光定量PCR仪上进行PCR反应,通过熔解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
5、结果
如图1所示,与癌旁组织相比,EEF1A2、MUC3A、IGF2BP3或B4GALNT4基因在肺腺癌组织中表达上调,ALAS2基因在肺腺癌组织中表达下调,差异具有统计学意义(P<0.05)。
实施例2候选基因ROC曲线分析
1、ROC曲线分析
使用R语言的pROC包分析EEF1A2、MUC3A、IGF2BP3、B4GALNT4或ALAS2的受试者工作特征,计算二项精确置信空间,绘制ROC曲线,计算曲线下面积。
2、结果
如表一所示,与EEF1A2、MUC3A、IGF2BP3或B4GALNT4单个基因的AUC值相比,IGF2BP3、SPINK1、TMEM63C或B3GNT6基因之间的任意组合的AUC值均有增加,提示上述4种基因中的至少两种可联合用于肺腺癌的诊断。
表一候选基因联合AUC值
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围之内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 用于联合诊断肺腺癌的生物标志物
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atcaacatcg tggtcatc 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aacttctcaa tggtcctt 18
<210> 3
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
attacctatg atgacaga 18
<210> 4
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ctaacagaga ttgagatt 18
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gcggcttgta agtctatt 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtctgtgtct tgctcaat 18
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gacaacaagt gcttctac 18
<210> 8
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tcttcttcat cctcatcc 18
<210> 9
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atgctgtagg actgtatg 18
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
agagttccag agatgatg 18
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tggacttcga gcaagagatg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gaaggaaggc tggaagagtg 20