生物标志物在肺腺癌诊断中的应用
技术领域
本发明属于疾病诊断领域,涉及生物标志物在肺腺癌诊断中的应用,具体涉及S100P、EEF1A2或MUC3A在肺腺癌诊断中的应用。
背景技术
在世界范围内,肺癌是癌症发病率和死亡率的主要原因。2018年新诊断肺癌210万例,死亡180万人,占癌症死亡人数的近1/5(18.4%)。在男性中,肺癌是东欧大多数国家和东亚某些国家(中国)的主要死亡原因。在28个国家中,女性肺癌是癌症死亡的主要原因。非小细胞肺癌(Non-small cell lung cancer,NSCLC)是发达国家最常见的肿瘤之一,也是全世界癌症死亡的主要原因。约80%的肺癌是NSCLC,包括肺腺癌(LUAD,50-60%)和肺鳞癌(LUSC,30%)。环境和遗传因素在肺癌的病因和发展中起关键作用。然而,大多数因素尚不确定,但其中一些因素已得到认可,如基因和遗传多态性,吸烟,辐射和病毒。
已显示某些蛋白与肺腺癌相关。采用免疫组化法检测蛋白的表达,并分析其与肺腺癌临床病理特征之间的关系,这些蛋白包括Lnc00673蛋白(丁和国,徐玥,王近瑜,刘顺林.Lnc00673蛋白在肺腺癌组织中的表达及意义[J].广东医学.2019)。采用生物信息学的方法探讨差异表达长链非编码RNA(lncRNAs)与肺腺癌患者预后的关系,筛选出的lncRNAs,可作为肺腺癌患者预后的独立标志物,为临床医生对肺腺癌患者的预后判断提供帮助(陶冶,李云慧,黄俊杰,梁彬.采用生物信息学方法筛选与肺腺癌患者预后相关的LncRNAs[J].国际检验医学杂志.2019)。另外,醛-酮还原酶家族7成员A3(AKR7A3)、甲状腺转录因子-1(TTF-1)、肺表面活性物质A(SPA)、SCC-Ag、CYFRA21-1被鉴定为有希望的肺腺癌检测标志物。
肺癌严重危害着人类的健康和生命,局限性肺癌患者五年生存率能有55.6%,但若是等到转移才发现就只有4.5%了(W.Weichert,A.Warth.Early lung cancer withlepidic pattern:Adenocarcinoma in situ,minimally invasive adenocarcinoma,andlepidic predominant adenocarcinoma.Curr.Opin.Pulm.Med.20,309–316.2014),因此如果能够做好早期检测,肺癌的杀伤力就会大减。但现在的早检手段显然是不足的,根据NIH的数据,只有16%的新诊断肺癌患者是局限性肿瘤,其他或多或少都已扩散到了淋巴结或更远的转移灶,所以本领域仍然需要能够有效用于肺腺癌筛查和诊断的有利生物标志物。
发明内容
为了弥补现有技术的不足,本发明的目的在于寻找新的诊断肺腺癌的生物标志物,为肺腺癌发生发展机制研究、肺腺癌诊断、预后及靶向治疗等研究提供有力基础。
为了实现上述目的,本发明采用如下技术方案:
本发明提供了生物标志物的检测试剂在制备诊断肺腺癌的产品中的应用,所述生物标志物选自S100P、EEF1A2和MUC3A中的任意两种或三种。
优选的,所述生物标志物为S100P、EEF1A2和MUC3A中的三种。
上面所述生物标志物的检测试剂包括特异性识别S100P、EEF1A2、MUC3A的探针或抗体;或特异性扩增S100P、EEF1A2、MUC3A的引物。
进一步,所述特异性扩增S100P、EEF1A2、MUC3A的引物序列如SEQ ID NO.1-6所示。
本发明提供了一种诊断肺腺癌的产品,所述产品包括检测S100P、EEF1A2、MUC3A的表达水平的试剂。
进一步,所述产品包括通过测序技术、核酸杂交技术、核酸扩增技术或免疫技术测定S100P、EEF1A2、MUC3A的表达水平的试剂。
进一步,所述核酸扩增技术选自聚合酶链式反应、逆转录聚合酶链式反应、转录介导的扩增、连接酶链式反应、链置换扩增和基于核酸序列的扩增。
本发明中所述通过核酸扩增技术测定S100P、EEF1A2、MUC3A的表达水平的试剂包括特异性扩增S100P、EEF1A2、MUC3A的引物,其中S100P的上游引物序列为SEQ ID NO.1,下游引物序列为SEQ ID NO.2;EEF1A2的上游引物序列为SEQ ID NO.3,下游引物序列为SEQID NO.4,MUC3A的上游引物序列为SEQ ID NO.5,下游引物序列为SEQ ID NO.6。
本发明提供了一种诊断肺腺癌的试剂盒,所述试剂盒包括基因检测试剂盒和蛋白免疫检测试剂盒;所述基因检测试剂盒包括用于检测S100P、EEF1A2、MUC3A基因转录水平的试剂;所述蛋白免疫检测试剂盒包括S100P、EEF1A2、MUC3A蛋白的特异性抗体。
进一步,所述检测S100P、EEF1A2、MUC3A基因转录水平的试剂包括检测S100P、EEF1A2、MUC3A基因mRNA的引物和/或探针。
S100P基因位于4号染色体,登录号为NC_000004.12,可在GeneBank数据库中查询到。
EEF1A2基因位于20号染色体,登录号为NC_000020.11,可在GeneBank数据库中查询到。
MUC3A基因位于7号染色体,登录号为NC_000007.14,可在GeneBank数据库中查询到。
本发明的优点和有益效果:
本发明发现了准确性更好的诊断肺腺癌的生物标志物,将生物标志物联合应用可以在肺腺癌发生的早期做出判断,提高患者的生存率。
附图说明
图1是利用QPCR检测四种基因在肺腺癌组织与癌旁组织中的表达情况图,其中,图A是QPCR检测S100P在肺腺癌组织和癌旁组织中的表达情况图,图B是QPCR检测EEF1A2在肺腺癌组织和癌旁组织中的表达情况图,图C是QPCR检测MUC3A在肺腺癌组织和癌旁组织中的表达情况图,图D是QPCR检测CSF3在肺腺癌组织和癌旁组织中的表达情况图。
具体实施方式
生物标志物
在一些实施方案中,生物标志物是指与疾病相关的分子,例如生物标志物可以是与肺腺癌的存在、阶段、预后等相关的分子,具体的,肺腺癌生物标志物可以包括在肺腺癌受试者中有差异表现的蛋白(例如全长多肽、剪接变体、翻译后修饰多肽等)以及基因产物的片段及相应多核苷酸序列,如mRNA、DNA等。
试剂盒
在一些实施方案中,试剂盒包含多种探针,所述探针能够与生物标志物特异性结合。在一些实施方案中,试剂盒包含多种抗体,所述抗体能够与生物标志物特异性结合。在一些实施方案中,试剂盒包括与生物标志物蛋白或蛋白质片段特异性结合的抗体、抗体衍生物或抗体片段。在一些实施方案中,所述试剂盒可以包括多种与生物标志物与蛋白或其片段特异性结合的抗体、抗体衍生物或抗体片段。在一些实施方案中,试剂盒包括与生物标志物核酸或其片段特异性结合的核酸探针。在一些实施方案中,试剂盒可以包括多种与生物标志物核酸或其片段特异性结合的探针。检测试剂可以包括互补核酸。例如,固定于基质上的标记或未标记的寡核苷酸、未与基质结合的寡核苷酸、PCR引物、分子信标等。在一些实施方案中,试剂盒包括结合生物标志物的捕获试剂和包括至少一种生物标志物的容器。在一些实施方案中,所述捕获试剂可以结合多种生物标记,也可以结合至少一种已知生物标记。在一些实施方案中,试剂盒还可以包括第二或更多种捕获试剂。在一些实施方案中,试剂盒包括缓冲液。在一些实施方案中,试剂盒包括使用说明书。在一些实施方案中,试剂盒包括芯片或微阵列。在一些实施方案中,试剂盒还包括附有吸附剂的一种或多种基质。
检测方法
本发明中的生物标志物可通过本领域技术人员已知的任何方法来确定基因的表达水平。具体而言,可通过测量mRNA的量和/或通过测量编码蛋白的量来确定表达水平。
用于确定mRNA量的方法在本领域中是众所周知的,并且包括但不限于定量或半定量RT-PCR、实时定量或半定量RT-PCR、Nanostring技术、基于测序的方法或转录组方法。
样本(例如从患者制备的组织)中所含的核酸可首先根据标准方法例如使用裂解酶或化学溶液提取或者按照制造商的说明书通过核酸结合树脂提取。这些核酸可以在使用前冷冻储存。
然后可通过杂交(例如Northern印迹分析)和/或扩增(例如RT-PCR)检测提取的mRNA。定量或半定量RT-PCR是优选的。实时定量或半定量RT-PCR是特别有利的。优选的,设计引物对以重叠内含子,从而区分cDNA扩增与推定的基因组污染。本领域技术人员可以容易地设计出这样的引物。其它扩增方法包括但不限于连接酶链反应(LCR)、转录介导的扩增(TMA)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。可选地,mRNA的量也可使用Nanostring的NCOUNTER TM数字基因表达系统(Geiss等,2008《自然-生物技术(Nat.Biotechnol.)》,26:317-325)测量,该系统捕获mRNA转录物并通过分子条形码技术对各个mRNA转录物计数并且由Nanostring Technologies商业化;或使用Plex 2.0测定法(Affymetrix)测量。mRNA的量还可以使用基于高通量测序技术如RNA-Seq(Wang等,《自然评论-遗传学(Nat Rev Genet.)》,2009年1月;10(1):57-63)或使用微流体系统的测序技术的方法来确定。
基因的表达水平还可以通过转录组方法,特别是通过使用DNA微阵列测量mRNA的量来确定。为了确定基因的表达水平,首先将逆转录的样本进行标记,之后在杂交条件下与微阵列接触,形成与微阵列表面的探针序列互补的靶核酸之间的复合物。然后定量或半定量的检测被标记的杂交复合物。标记可以通过各种方法来实现,例如通过使用放射性或荧光标记。微阵列杂交技术的许多变体可为本领域技术人员所用。测量感兴趣基因的表达水平的DNA生物芯片的实例包括但不限于人类基因组U133 Plus 2.0阵列(Affymetrix)。也可以使用下一代测序方法(NGS)。在本发明的具体实施方案中,通过QPCR来测量mRNA的量。所述需要测定的基因的表达水平相对于参考表达水平,优选相对于一种或多种管家(或对照或参考)基因的表达水平进行归一化。如本发明所用,术语“管家基因”是指涉及维持细胞所需的基本功能的基因。管家基因以相对恒定的水平被转录,因此用于对不同样本之间变化的基因的表达水平进行归一化。管家基因包括但不限于GAPDH(Gene ID NCBI 2597)、核糖体18S基因(RNA18S5,Gene ID NCBI:100008588)、β-葡糖苷酸酶、肌动蛋白、微管蛋白、泛素、RPLPO、HPRT1或B2M基因。
在本发明的具体实施方案中,通过QPCR测量mRNA的量来确定每个基因的表达水平,利用β-actin对其进行归一化,用2-ΔΔCT方法进行相对定量。
另外,用于测量编码蛋白的量或活性的方法也是本领域技术人员众所周知的,并且方法的选择取决于编码蛋白。通常,样本需要与能够选择性地与样本中存在的蛋白质相互作用的结合搭配物接触。结合搭配物通常是多克隆或单克隆抗体,优选单克隆抗体。通过半定量蛋白质印迹、免疫化学(酶标记的和介导的免疫测定法,例如ELISA、生物素/抗生物素蛋白类型测定法、放射免疫测定法、免疫电泳或免疫沉淀)或通过蛋白质或抗体阵列来测量蛋白质的量。在一个实施方案中,通过反相蛋白质微阵列(RPPM)评估蛋白质表达水平。还可以在癌症样本的组织切片(例如冷冻或福尔马林固定的石蜡包埋材料)上通过免疫组织化学来评估蛋白质表达水平。反应通常包括显示标记,例如荧光、化学发光、放射性、酶标记或染料分子,或检测抗原和与其反应的一种或多种抗体形成的复合物。特别是当编码蛋白是酶时,可以使用比活性测定法测定蛋白质的量。
引物
如本发明所用的,术语“引物”指天然出现的(例如作为限制性酶切片段)或合成产生的寡核苷酸,加入核苷酸和用于核酸聚合的物质(如DNA依赖性或RNA依赖性聚合酶)在合适条件(例如缓冲液、盐、温度和pH)下,引物能够充当与核酸链(模板或靶标序列)互补的延伸产物的合成的引发点。引物必须足够长,能够引发延伸产物的合成。典型的引物含有与靶序列基本上互补或同源的、长度至少约10个核苷酸的序列,但优选稍长的引物。通常,引物含有约15-26个核苷酸。
探针
“探针”是指能够与特定生物分子特异性结合或相互作用的分子或物质。术语“引物”、“引物对”或“探针”应具有分子生物学领域技术人员已知的这些术语的常规含义。本发明中,“引物”、“引物对”和“探针”指能够特异性识别S100P、EEF1A2、MUC3A的寡核苷酸或多核苷酸分子,其序列与待检测或定量的靶分子或靶序列的区域相同、互补、作为该区域的同源物、或同源,从而引物、引物对或探针可特异性地与靶分子结合,所述靶分子例如,待检测或待定量的靶核酸、RNA、DNA、cDNA、基因、转录物、肽、多肽或蛋白。引物也可自身发挥探针功能。如本发明所理解的,“探针”还可包含引物对和内部标记探针的组合,其是许多商品化qPCR方法中所常见的。
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1 QPCR验证相关差异表达基因
1、样本的收集
收集肺腺癌组织和癌旁组织各59例,所有样本离体后立即放入装有RNA保护液的冻存管中,并在30分钟内置于-80℃冰箱中冷冻保存,整个操作及保存过程遵循无酶原则。
2、RNA样品的制备
利用TRIzol RNA提取方法提取肺腺癌组织和癌旁组织中的总RNA。
(1)用液氮预冷研钵,组织样品放入加有液氮的研钵中,在液氮下把组织样品充分研磨成粉末;
(2)把样品粉末转入到装有TRIzol裂解液的2.0ml EP管中,(每ml裂解液可加50mg组织样品)剧烈震荡,充分混匀,平放室温静置5-10min;
(3)10000rpm,4℃离心5min;
(4)吸取上清液至新的2.0ml EP管中,每毫升裂解液加入200μl氯仿/异戊醇,剧烈颠倒混匀;
(5)10000rpm,4℃离心10min;
(6)吸取上清液至新的1.5ml离心管,注意不要吸到中间蛋白层,加入等上清液体积的异丙醇,轻轻颠倒混匀;
(7)放入-20℃冰箱沉淀1h;
(8)13600rpm,4℃离心20min;
(9)吸弃上清,加入1ml 75%乙醇,用移液器吹洗沉淀;
(10)10000rpm,4℃离心3min,吸弃上清,短暂离心,吸去残留液体,晾干3-5min;
(11)用30-100μl DEPC水或者RNase Free水溶解沉淀;
(12)置于-80℃冰箱保存。
3、总RNA逆转录
利用TIANGEN公司的逆转录试剂盒(货号KR106)进行RNA的逆转录(方法按照试剂盒推荐标准流程操作)
(1)去除基因组DNA
将1.0μg的总RNA模板与2.0μl的5×gDNA buffer和RNase Free水混合,终体积为10μl,42℃孵育3min。
(2)逆转录PCR反应体系
将2.0μl的10×Fast RT buffer、1.0μl的PrimerScript RT Enzyme Mix I与2.0μl的FQ-RT Primer Mix混合,加入10μl的去除基因组DNA的反应体系和5.0μl的RNase Free水,共20μl,42℃反应15min,之后95℃反应3min。
4、QPCR反应
(1)引物设计
根据基因序列,设计引物,引物序列如下:
S100P基因:
上游引物:5’-TTCAGTGAGTTCATAGTGTTC-3’(SEQ ID NO.1);下游引物:5’-ATTTGAGTCCTGCCTTCT-3’(SEQ ID NO.2)。
EEF1A2基因:
上游引物:5’-ATCAACATCGTGGTCATC-3’(SEQ ID NO.3);下游引物:5’-AACTTCTCAATGGTCCTT-3’(SEQ ID NO.4)。
MUC3A基因:
上游引物为5’-ATTACCTATGATGACAGA-3’(SEQ ID NO.5);下游引物为5’-CTAACAGAGATTGAGATT-3’(SEQ ID NO.6)。
CSF3基因:
上游引物为5’-CCTGCTCAAGTGCTTAGA-3’(SEQ ID NO.7);下游引物为5’-CTCACTCACCAGCTTCTC-3’(SEQ ID NO.8)。
管家基因β-actin
上游引物为5’-TGGACTTCGAGCAAGAGATG-3’(SEQ ID NO.9);下游引物为5’-GAAGGAAGGCTGGAAGAGTG-3’(SEQ ID NO.10)。
(2)配制20μl PCR反应体系
利用TIANGEN公司的SuperReal PreMix Plus试剂盒(货号:FP205)进行QPCR。2×SuperReal PreMix Plus 10μl,上游(下游)引物0.6μl,cDNA模板2μl,50×ROX ReferenceDye 2μl,ddH2O 4.8μl。
(3)PCR反应条件:95℃15min,(95℃10s,55℃30s,72℃32s)进行40个循环,之后95℃15s,60℃60s,95℃15s。以SYBR Green作为荧光标志物,在ABI 7300型荧光定量PCR仪上进行PCR反应,通过熔解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
5、结果
如图1所示,与癌旁组织相比,肺腺癌组织中的S100P、EEF1A2、MUC3A的表达水平显著上调,CSF3的表达水平显著下调,差异具有统计学意义(P<0.01)。提示S100P、EEF1A2、MUC3A可以作为临床检测标志物用于肺腺癌的诊断。
实施例2候选基因ROC曲线分析
1、ROC曲线分析
使用R语言的pROC包分析S100P、EEF1A2、MUC3A或CSF3的受试者工作特征,计算二项精确置信空间,绘制ROC曲线,计算曲线下面积。
2、结果
结果如表1所示,肺腺癌患者的S100P、EEF1A2、MUC3A的ROC曲线下面积AUC值分别为0.789428、0.871876、0.825768,当将上述基因联合应用诊断肺腺癌时,任意组合的AUC值均升高,而S100P、EEF1A2、MUC3A中的三种联合时AUC值最高,为0.955473,表明这三种基因任意两种或三种的联合诊断比单独诊断具有更高的准确性。综上S100P、EEF1A2、MUC3A中的两种或三种联合可用于肺腺癌的早期诊断。
表1候选基因联合应用的AUC值
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围之内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 生物标志物在肺腺癌诊断中的应用
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttcagtgagt tcatagtgtt c 21
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atttgagtcc tgccttct 18
<210> 3
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atcaacatcg tggtcatc 18
<210> 4
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aacttctcaa tggtcctt 18
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
attacctatg atgacaga 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctaacagaga ttgagatt 18
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cctgctcaag tgcttaga 18
<210> 8
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ctcactcacc agcttctc 18
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tggacttcga gcaagagatg 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gaaggaaggc tggaagagtg 20