辅助诊断肺腺癌的基因标志物及其用途
技术领域
本发明属于疾病诊断领域,涉及辅助诊断肺腺癌的基因标志物及其用途,具体涉及ONECUT2、PLPP4、YBX2、ZNF695在肺腺癌辅助诊断中的应用。
背景技术
肺癌是世界范围内致死性极高的恶性肿瘤之一[Torre LA,Bray F,Siegel RL,Ferlay J,Lortet-Tieulent J,Jemal A.Global cancer statistics,2012.CA Cancer JClin,2015,65(2):87-108]。2018年最新数据显示,当年全球约有176万人死于肺癌,死亡率约18.4%,且在全球总人口(统指两性人口)中,肺癌的发病率为11.6%,二者均排肿瘤首位[Bray F,Ferlay J,Soerjomataram I,Siegel RL,Torre LA,Jemal A.Global cancerstatistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for36cancers in 185countries.CA Cancer J Clin,2018,68(6):394-424]。肺癌可以总体上分为小细胞型肺癌(SCLC,约占15%)和非小细胞型肺癌(NSCLC,约占85%),后者的主要组织学亚型包括肺腺癌(AdCs)和肺鳞癌(SCCs)等。从临床角度看,肺腺癌和肺鳞癌的患者如果能够早期诊断后及时进行手术切除,会有较为良好的预后(I期患者五年生存率约为70-90%)[Goldstraw P,Chansky K et al.The IASLC Lung Cancer Staging Project:Proposals for Revision of the TNM Stage Groupings in the Forthcoming(Eighth)Edition of the TNM Classification for Lung Cancer.J Thorac Oncol,2016,11(1):39-51]。然而大多数患者(约75%)在诊断时已经是晚期阶段(III/IV期)。尽管近年来部分发达国家对于晚期肺癌的治疗已经取得重大进展,但生存率依然很低。据2018年柳叶刀杂志报道,特别是在发展中国家,肺癌的生存率甚至不足20%[ClaudiaAllemani etal.Global surveillance of trends in cancer survival 2000-14(CONCORD-3):analysis of individual records for 37 513 025patients diagnosed with one of18cancers from 322population-based registries in 71countries.The Lancet,2018,391(10125):1023-1075]。
寻找新的靶点以提高肺癌的诊断效果迫在眉睫,研究表明高达69%的晚期非小细胞肺癌患者具有潜在的可控的分子靶点[Anne S.Tsao,Giorgio V.Scagliotti,PaulA.Bunn,et al.Scientific advances in lung cancer 2015[J].Journal of ThoracicOncology,2016,11(5):613-38]。除此之外,肺癌的发生和发展不仅取决于它们与肿瘤微环境的相互作用[Patrick M.Forde,Ronan J.Kelly and Julie R.Brahmer.New strategiesin lung cancer:Translating immunotherapy into clinical practice[J].ClinicalCancer Research,2014,20(5):1067-73],而且还取决于癌细胞的基因组学和分子特性的演变。因此寻找与肺癌诊断相关的分子生物学指标,可以为进一步研究肺癌的发生和发展提供依据。
发明内容
本发明的目的在于提供能够用于辅助诊断肺腺癌的基因标志物,本发明也提供其诊断产品或试剂盒。
为了实现上述目的,本发明采用如下技术方案:
本发明提供了检测基因的试剂在制备诊断肺腺癌的产品中的应用,所述基因包括ONECUT2、PLPP4、YBX2、ZNF695中的任意2种基因、任意3种基因、任意4种基因。
进一步,所述检测基因的试剂包括:通过RT-PCR、实时定量PCR、原位杂交、芯片、免疫技术或测序技术对受试者样品进行检测以诊断肺腺癌的试剂。
进一步,所述受试者样品来自受试者的外周血、体液或组织样品。在本发明的具体实施方案中,受试者样品为组织样品。
本发明中,所述通过RT-PCR诊断肺腺癌的试剂包括特异性扩增所述基因的引物;所述通过实时定量PCR诊断肺腺癌的试剂包括特异性扩增所述基因的引物;所述通过原位杂交诊断肺腺癌的试剂包括特异性杂交所述基因的探针;所述通过芯片诊断肺腺癌的试剂包括基因芯片和蛋白芯片,其中基因芯片包括与所述基因的核酸序列杂交的探针,蛋白芯片包括与所述基因编码的蛋白特异性结合的抗体;所述通过免疫技术诊断肺腺癌的试剂包括与所述基因编码的蛋白特异性结合的抗体。
进一步,所述引物序列如SEQ ID NO.1-8所示。
本发明提供了一种用于诊断肺腺癌的产品,所述产品包括检测基因的芯片、试剂盒或核酸膜条,所述基因包括ONECUT2、PLPP4、YBX2、ZNF695中的任意2种基因、任意3种基因、任意4种基因。
本发明提供了一种用于诊断肺腺癌的试剂盒,所述试剂盒包括检测基因的QPCR试剂盒、DNA芯片试剂盒或检测基因编码的蛋白的蛋白芯片试剂盒、ELISA试剂盒,所述基因包括ONECUT2、PLPP4、YBX2、ZNF695中的任意2种基因、任意3种基因、任意4种基因。
进一步,所述QPCR试剂盒包括特异性扩增所述基因的引物。
进一步,所述引物序列如SEQ ID NO.1-8所示。
作为优选的实施方案,试剂盒还包括采用特异性引物进行PCR的常规试剂。
本发明所述的基因来源于智人(Homo sapiens),可在GeneBank数据库中查询到:
ONECUT2基因(Gene ID:9480)
PLPP4基因(Gene ID:196051)
YBX2基因(Gene ID:51087)
ZNF695基因(Gene ID:57116)
CSF3基因(Gene ID:1440)。
与现有技术相比,本发明的优点和有益效果为:
本发明首次得到ONECUT2、PLPP4、YBX2、ZNF695中的任意两种或多种可作为辅助诊断肺腺癌的基因标志物,可以为肺腺癌的诊断提供技术支持。本发明还提供了用于辅助诊断肺腺癌的产品或试剂盒,以便于辅助诊断肺腺癌。
附图说明
图1:肺腺癌组织与癌旁组织中ONECUT2、PLPP4、YBX2、ZNF695或CSF3基因mRNA的表达情况图;
图注:A至E分别对应ONECUT2、PLPP4、YBX2、ZNF695、CSF3。
具体实施方式
本发明人针对大量的临床样本,经过深入的研究和比较,确定了与肺腺癌相关的基因标志物,包括如下基因:ONECUT2基因,PLPP4基因,YBX2基因,ZNF695基因。
上述各个基因或其转录本的片段、衍生物、变体或修饰形式也包括在本发明中,只要它们的片段、衍生物、变体或修饰形式上包括其全长序列中的代表性的序列,都能够实现对基因的检测。
基于本发明人的发现,可以以所述的各个基因作为诊断(确定、鉴定或检测)肺腺癌的标志物。通过分析这些基因的存在情况或表达情况,从而得知受试者是否患有肺腺癌,为疾病的诊断提供依据,或可早期评估受试者罹患肺腺癌的可能性。
本发明所用的术语“受试者样品”是指取自受试者(例如,患有肺腺癌的受试者)的任何样本(如细胞、组织(例如,通过活组织检查获得的组织样品)、血液、血清、血浆、尿、脑脊液或胰液)。优选的,样品是取自患癌的身体的一部分(例如,癌组织如肺腺癌组织)。活组织检查可涉及细针抽吸活检、核芯针穿刺活检(例如,立体定位核芯针穿刺活检、真空辅助核芯活检或磁共振成像(MRI)导向的活检)、手术活检(例如,切取活检或切除活检)。样品可经历另外的纯化和加工,例如以除去细胞碎片和其它不希望有的分子。另外的加工可进一步涉及在样品中产生对应于核酸分子(例如mRNA)的cDNA分子和/或例如使用PCR(如RT-PCR)扩增核酸分子。样品纯化的标准方法(如不希望有的分子的去除)是本领域中已知的。
可采用各种技术来检测所述基因标志物ONECUT2、PLPP4、YBX2、ZNF695的存在情况或表达情况,这些技术均包含在本发明中。针对基因的检测,可用的已有技术如,但不限于:聚合酶链反应(PCR)、原位杂交、Southern印迹、Western印迹、SDS-PAGE、酶联免疫反应、蛋白序列分析、质谱分析或DNA序列分析等。此外,现有的一些核酸分析软件、核酸分析工具、多肽分析工具,也可被应用于检测分析中。
本发明还提供了用于在样品中检测ONECUT2、PLPP4、YBX2、ZNF695的存在情况和表达情况的试剂。所述的试剂包括但不限于:特异性扩增ONECUT2、PLPP4、YBX2、ZNF695的引物,特异性杂交ONECUT2、PLPP4、YBX2、ZNF695的探针,特异性结合ONECUT2、PLPP4、YBX2、ZNF695蛋白的抗体。
在本发明的具体实施方案中,可以采用基于引物的PCR技术来测定ONECUT2、PLPP4、YBX2、ZNF695的存在情况和表达情况。在确定了ONECUT2、PLPP4、YBX2、ZNF695基因的序列片段后,可以根据本领域公知的方法或应用本领域公知的设计工具设计出适合的扩增引物。所述的扩增产物可以是ONECUT2、PLPP4、YBX2、ZNF695基因的全长,也可以是其中代表性的、能被辨识的片段。
作为本发明的一种可选的方式,可以采用基于探针的杂交技术来测定ONECUT2、PLPP4、YBX2、ZNF695的存在情况和表达情况。当应用探针进行检测时,可以在探针上设置可检测信号,从而便于进行扩增产物的识别,所述的可检测信号例如是荧光信号、染料信号、显色剂信号。例如,可检测信号可以是生物素,基于生物素作为显色标记的原位杂交技术已经是本领域技术人员熟知的技术。
作为本发明的另一种可选的方式,可以采用高通量测序技术来对样品进行序列分析,以获知ONECUT2、PLPP4、YBX2、ZNF695的存在情况或表达情况。
作为本发明的另一种可选的方式,可以采用基因芯片技术来检测ONECUT2、PLPP4、YBX2、ZNF695的存在情况或表达情况。所述的基因芯片上包含针对上述基因的探针;更优选的,所述的基因芯片上包含针对两种或两种以上所述基因的探针。所述的基因芯片可包括固相载体和有序固定在所述固相载体上的寡核苷酸探针;所述探针还可以在其5’端包含一段氨基修饰的1-30聚的聚脱氧胸苷酸(聚dT)。所述固相载体可采用基因芯片领域的各种常用材料,例如但不限于尼龙膜,经活性基团(如醛基、氨基、异硫氰酸基等)修饰的玻片或硅片、未修饰的玻片、塑料片等。基因芯片的制备可采用生物芯片的常规制造方法。例如,如果固相载体采用的是修饰玻片或硅片,探针的5’端含有氨基修饰的聚dT串,可将寡核苷酸探针配制成溶液,然后点样仪将其点在修饰玻片或硅片,排列成预定的序列或阵列,固定,就可得到所述的基因芯片。当然,寡核苷酸探针也可不含氨基修饰。对核酸样本进行标记的标记基团包括但不限于:地高辛分子(DIG)、生物素分子(Bio)、荧光素及其衍生生物分子(FITC等)、其他荧光分子(如Cy3、Cy5等)、碱性磷酸酶(AP)、辣根过氧化物酶(HRP)等。
作为本发明的另一种可选的方式,根据本发明提供的ONECUT2、PLPP4、YBX2、ZNF695基因,可建立预测肺腺癌的统计分析模型。模型的建立和分析,可结合应用本领域已有的生物信息学手段进行。在获得临床样本后,检测该生物学样本中ONECUT2、PLPP4、YBX2、ZNF695的表达模式和表达水平,基于ONECUT2、PLPP4、YBX2、ZNF695的表达水平来诊断肺腺癌。
本领域的技术人员可通多种分析软件,例如R,WEKA等,实现统计分析模型的建立。可以采用随机森林算法,或其他公知的数据挖掘方法。
以上的多种检测手段,可以独立地运用,也可以结合地运用。
本发明还提供一种用于检测ONECUT2、PLPP4、YBX2、ZNF695的存在情况或表达情况的试剂盒。所述试剂盒包括QPCR试剂盒、DNA芯片试剂盒、蛋白芯片试剂盒或ELISA试剂盒。试剂盒中包括本发明所述的特异性引物、探针、芯片或抗体等。
所述的试剂盒中还可包括用于提取RNA、PCR、杂交、显色等所需的各种试剂,包括但不限于:核酸抽提试剂;聚合酶链反应试剂;固相载体;显色剂或指示剂。
此外,所述的试剂盒中还可包括使用说明书和/或芯片图像分析软件、核酸分析软件等。
为了更清楚地理解本发明,现参照下列实施例进一步描述本发明。实施例仅用于解释而不以任何方式限制本发明。实施例中未注明具体条件的实验方法为所属领域熟知的常规方法和常规条件,或按照制造商所建议的条件。
实施例1肺腺癌组织中差异表达基因的检测
1、样本的收集
收集肺腺癌组织和癌旁组织各59例,所有样本离体后立即放入装有RNA保护液的冻存管中,并在30分钟内置于-80℃冰箱中冷冻保存,整个操作及保存过程遵循无酶原则。
2、RNA样品的制备
利用TRIzol RNA提取方法提取肺腺癌组织和癌旁组织中的总RNA。
(1)用液氮预冷研钵,组织样品放入加有液氮的研钵中,在液氮下把组织样品充分研磨成粉末;
(2)把样品粉末转入到装有TRIzol裂解液的2.0ml EP管中,(每ml裂解液可加50mg组织样品)剧烈震荡,充分混匀,平放室温静置5-10min;
(3)10000rpm,4℃离心5min;
(4)吸取上清液至新的2.0ml EP管中,每毫升裂解液加入200μl氯仿/异戊醇,剧烈颠倒混匀;
(5)10000rpm,4℃离心10min;
(6)吸取上清液至新的1.5ml离心管,注意不要吸到中间蛋白层,加入等上清液体积的异丙醇,轻轻颠倒混匀;
(7)放入-20℃冰箱沉淀1h;
(8)13600rpm,4℃离心20min;
(9)吸弃上清,加入1ml 75%乙醇,用移液器吹洗沉淀;
(10)10000rpm,4℃离心3min,吸弃上清,短暂离心,吸去残留液体,晾干3-5min;
(11)用30-100μl DEPC水或者RNase Free水溶解沉淀;
(12)置于-80℃冰箱保存。
3、总RNA逆转录
利用TIANGEN公司的逆转录试剂盒(货号KR106)进行RNA的逆转录(方法按照试剂盒推荐标准流程操作)
(1)去除基因组DNA
将1.0μg的总RNA模板与2.0μl的5×gDNA buffer和RNase Free水混合,终体积为10μl,42℃孵育3min。
(2)逆转录PCR反应体系
将2.0μl的10×Fast RT buffer、1.0μl的PrimerScript RT Enzyme Mix I与2.0μl的FQ-RT Primer Mix混合,加入10μl的去除基因组DNA的反应体系和5.0μl的RNase Free水,共20μl,42℃反应15min,之后95℃反应3min。
4、QPCR反应
(1)引物设计
根据基因序列,设计引物,引物序列如下:
ONECUT2基因:
正向引物:5’-AACGCAAAGAGCAAGAAC-3’(SEQ ID NO.1);反向引物:5’-TTGGAGGTCAGTGAACAC-3’(SEQ ID NO.2)。
PLPP4基因:
正向引物:5’-GCAATCAGATAACATACCTAC-3’(SEQ ID NO.3);反向引物:5’-TTTCACCACACAAATAACAG-3’(SEQ ID NO.4)。
YBX2基因:
正向引物为5’-TTACGGATTCATCAACAG-3’(SEQ ID NO.5);反向引物为5’-GTTACATTAGTGGCTTCT-3’(SEQ ID NO.6)。
ZNF695基因:
正向引物为5’-AGACAGCCAGACACTCAG-3’(SEQ ID NO.7);反向引物为5’-TTCATATCTTCTCAGCATCACTT-3’(SEQ ID NO.8)。
CSF3基因:
正向引物为5’-CCTGCTCAAGTGCTTAGA-3’(SEQ ID NO.9);反向引物为5’-CTCACTCACCAGCTTCTC-3’(SEQ ID NO.10)。
管家基因β-actin基因:
正向引物为5’-TGGACTTCGAGCAAGAGATG-3’(SEQ ID NO.11);反向引物为5’-GAAGGAAGGCTGGAAGAGTG-3’(SEQ ID NO.12)。
(2)配制20μl PCR反应体系:
利用TIANGEN公司的SuperReal PreMix Plus试剂盒。2×SuperReal PreMix Plus10μl,正向(反向)引物0.6μl,cDNA模板2μl,50×ROX Reference Dye 2μl,ddH2O 4.8μl。
(3)PCR反应条件:95℃15min,(95℃10s,55℃30s,72℃32s)进行40个循环,之后95℃15s,60℃60s,95℃15s。以SYBR Green作为荧光标志物,在ABI 7300型荧光定量PCR仪上进行PCR反应,通过熔解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
5、结果
如图1所示,肺腺癌组织中ONECUT2、PLPP4、YBX2或ZNF695 mRNA的表达明显高于癌旁组织,CSF3 mRNA的表达明显低于癌旁组织,差异具有统计学意义(P<0.05)。
实施例2候选基因ROC曲线分析
1、ROC曲线分析
使用R语言的pROC包分析ONECUT2、PLPP4、YBX2、ZNF695、CSF3的受试者工作特征,计算二项精确置信空间,绘制ROC曲线,计算曲线下面积。
2、结果
候选基因联合应用的AUC值如表1所示,可以看出ONECUT2、PLPP4、YBX2、ZNF695联合用于诊断相比单独应用,具有较高的准确性。
表1候选基因联合应用AUC值
以上对本发明优选的具体实施方式和实施例作了详细说明,但是本发明并不限于上述实施方式和实施例,在本领域技术人员所具备的知识范围内,还可以在不脱离本发明构思的前提下作出各种变化。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 辅助诊断肺腺癌的基因标志物及其用途
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aacgcaaaga gcaagaac 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ttggaggtca gtgaacac 18
<210> 3
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gcaatcagat aacataccta c 21
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tttcaccaca caaataacag 20
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ttacggattc atcaacag 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gttacattag tggcttct 18
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agacagccag acactcag 18
<210> 8
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ttcatatctt ctcagcatca ctt 23
<210> 9
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cctgctcaag tgcttaga 18
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctcactcacc agcttctc 18
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tggacttcga gcaagagatg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gaaggaaggc tggaagagtg 20