发明内容
本发明涉及使用一种对核酸特异识别实时检测的新式探针。该探针为2条寡核苷酸组成,寡核苷酸的5’端和3’端分别标记有荧光基团或淬灭基团,2条寡核苷酸绝大多数碱基完全互补,除了第一条链中间区域比第二条多1-3个碱基,在一定条件下探针的2条链由于互补碱基而结合为双链结构,使探针形成一个带有凸环的二级结构,任何一条寡核苷酸的5端都可标记有荧光基团或荧光供体,而另一条3端标记有淬灭剂或者荧光受体。在一定条件下,探针的2条链杂交结合,形成一个带有凸环的结构,标记的荧光基团和淬灭剂能够充分靠近、淬灭荧光,当探针与靶序列杂交时,探针的2条链分别被靶序列置换,凸环结构消失,探针被靶序列张开,荧光强度随之发生改变。合适条件下,该探针不仅可以与它完全互补的靶序列结合;而且一定设计的探针只要靶序列里含有一个碱基的突变,该探针仍然能够保持凸环的二级结构,不与靶序列杂交。根据此,本发明的探针可以被用于实时PCR中靶核酸的检测。
所述的第一条链的中间区域,为寡核苷酸链中间碱基±5个碱基区域,最佳地,为寡核苷酸链中间碱基±2个碱基区域。
本发明的探针所使用的核苷酸可以是DNA,RNA,LNA,或PNA,或任何非自然核苷组成。
本发明还涉及到凸环探针技术的应用。
积极效果:
设计简单:凸环探针设计时没有太多要求,探针序列为扩增靶序列的一部分,只要探针其中的一条链中间区域有比第二条链多余的1-3个碱基即可。Tm值与相应的PCR反应体系中的引物或使用的退火温度保持一致或高出。任何设计过PCR引物的人员都可以设计。
荧光淬灭效率高:荧光报告基团和淬灭基团非常靠近,淬灭效果佳。
对靶序列核酸组成耐受性强:对于目前现存的荧光探针而言,其对于AT富集区和GC富集区的困难模板,有着很好的应用性。
合成方便简单:无需任何特别的仪器,只需普通的DNA合成仪即可完成合成。
特异性高:由于本探针存在一个自身的互补双链结构,只有当靶序列与探针第一条链的结合力大与第二条链结合的能量,探针才可以与靶序列发生杂交,放出荧光信号。如果与靶序列中存在突变,如单碱基的改变,突变识别的位置在第一条链的中间位置,该探针可以保持自身环形结构的稳定。另外,由于自身存在一个互补双链结构,设计时可以调节互补区域的长短,来调整探针的特异性。
和普通互补双链探针相比,优点在于:
1、杂交效率高,多余的碱基在探针第一条链的中间区域,中间区域碱基对探针与靶序列结合能力的影响往往大于5端或3端,非互补碱基在探针内部比非互补碱基在5端或3端所导致的探针自身二级结构和探针第一条链与靶序列的结合力的差值更大,因此杂交效率更高。
2、对SNP这类单碱基突变的识别能力更强。由于探针第二条链中间部位缺少碱基,第二条链和靶序列只有一半才能够结合,与靶序列结合力较弱,不像普通双链探针的第二条链与野生型靶序列仅有一个碱基不匹配,结合力相对较高,这样可能由于第二条链与野生型还存在一定较高的结合力从而导致非特异信号的产生。
具体实施方式
凸环探针构成
本发明的凸环探针由2条寡核苷酸组成,任意一条寡核苷酸的5’端和和另一条3’端分别标记有荧光基团或淬灭基团,2条寡核苷酸绝大多数碱基完全互补,但其中一条链中间区域比另外一条多1-3个碱基,在一定条件下探针的2条链由于互补碱基而结合为双链结构,使探针形成一个带有凸环的二级结构。凸环探针在不同的条件下可以有不同的形态,荧光值也随之变化。在一定条件下,探针的2条链杂交结合,形成一个带有凸环的结构,标记的荧光基团和淬灭剂能够充分靠近、淬灭荧光,当探针与靶序列杂交时,探针的2条链分别被靶序列置换,凸环结构消失,探针被靶序列张开,荧光强度随之发生改变。合适条件下,该探针不仅可以与它完全互补的靶序列结合;而且一定设计的探针只要靶序列里含有一个碱基的突变,该探针仍然能够保持凸环的二级结构,不与靶序列杂交。当在变性条件下,比如酸性、碱性或高温条件下,探针的双链被打开,凸环结构消失,荧光基团或荧光供体与淬灭剂或荧光受体远离,荧光基团或荧光供体放出荧光。在一定的杂交条件下,比如PCR的退火阶段,探针可以和反应液中的靶序列结合,探针的双链部分被打开,凸环结构消失,荧光基团或荧光供体与淬灭剂或荧光受体远离,荧光基团或荧光供体放出荧光。
凸环探针与靶序列反应
凸环探针可以与溶液中单链寡核苷酸发生反应。凸环探针的第一条链可以和靶序列结合,从而第二条链被取代。凸环探针的2条互补结合的结构的消失引起荧光的产生。凸环探针可以在该反应中,将完全匹配的靶序列检测出来,见图1。
根据图1,凸环探针由2条寡核苷酸A和B组成。寡核苷酸A的5端用荧光剂1标记,寡核苷酸B的3端用淬灭剂2标记,寡核苷酸A和寡核苷酸B绝大多数碱基完全互补,但寡核苷酸A中间区域比寡核苷酸B多1-3个碱基区域3,在一定条件下寡核苷酸A和B由于互补碱基而结合为双链结构,使探针形成一个带有凸环的二级结构,此时标记的荧光基团和淬灭剂能够充分靠近、淬灭荧光。当存在靶序列4时,由于寡核苷酸A能够于靶序列4完全匹配,一定条件下,寡核苷酸A更趋向于跟靶序列4杂交。当寡核苷酸A跟靶序列4杂交时,探针的寡核苷酸A和B分别被靶序列置换,凸环结构消失,探针的寡核苷酸A和B被靶序列4分开,荧光强度随之发生改变。
凸环探针用于核酸扩增体系
如前所述,本发明的凸环探针可以与单链靶序列发生杂交反应。从PCR实验中,我们进一步发现凸环探针也可以用于检测在PCR体系中不断指数扩增放大的靶序列。在PCR反应每个循环周期中包括高温变性、低温退火和延伸三个阶段。凸环探针在变性阶段由于高温变性使双链不能形成而产生荧光;在退火阶段,假若没有靶序列存在,探针的2条链就能够互补结合形成双链,探针形成一个凸环结构,荧光基团和淬灭剂靠近,而不产生荧光;但是当有靶序列存在时,探针将与靶序列杂交,探针自身2条链形成的互补双链打开,凸环结构随即消失,从而产生荧光。在延伸阶段,探针会从靶序列上解离。通过对PCR每个循环的退火阶段的荧光信号的检测,在实时状态中扩增产物就可以被检测到了。见图2。
根据图2所示一种凸环探针P和双链扩增产物E,在媒介PCR周期中二者都存在于PCR扩增反应中。探针P包括寡核苷酸A和B,寡核苷酸A的5’端由荧光剂1标记,寡核苷酸B的3’端由淬灭剂2标记。扩增产物E包括互补的链C、D。在高温变性时,凸环探针的寡核苷酸A和B打开,扩增产物的链C、D分离。当温度低于退火温度时(为PCR引物退火),寡核苷酸A和其互补的扩增产物E的靶链C杂交。探针的寡核苷酸A和B分别被靶序列C、D置换,凸环结构消失,荧光剂1不被淬灭剂淬灭,而发出荧光。
只要调节探针自身双链结合部分互补碱基的数量以及凸环区域碱基数量,就可以调节探针对突变碱基或不匹配碱基的区分检测能力。对单碱基突变区分,双链结合部分要有一定的Tm值和碱基数量,探针第一条链Tm值约比第二条链Tm值高2-10℃,而且第一条链具有突变位置的碱基,而第二条链不具有该位置互补的碱基。一般突变碱基的位置放在第一条链的中间位置。
凸环探针的设计方法
探针的长度:一般情况,探针第一条链长度为12-80bp,靶序列结合区12-80bp,第二条链长度为9-79bp,探针内部互补区即为第二条链的长度:9-79bp。
凸环位置和长度:凸环结构形成的位置一般安排在第一条链的中间区域,也可以是第一条链靠近其5’或者3’端区域,一般碱基数量为1-3bp。
更佳地,所述的探针第一条链长度为13-53bp,靶序列结合区13-53bp,第二条链长度为12-50bp,探针内部互补区即为第二条链的长度:12-50bp。
探针双链结合区域Tm值:在大多数情况下,探针的互补碱基为12-50bp,其Tm值与扩增引物Tm值相当或高于退火温度2-10℃。根据本发明的一部分具体实施方案的实验结果,如用于单碱基突变区分检测的实时PCR的凸环探针互补区Tm值可以高于退火温度3-8℃。
荧光标记位置:荧光基团和淬灭剂都可以标记在探针任意一条链的5端或3端,但是一端只能标记荧光基团和淬灭剂的一种。
非自然核苷酸的使用:任何非自然核苷酸,如LNA,均可以在探针的任何位置使用。
凸环探针的最适检测结构:凸环探针可以用于实时PCR中特异靶序列的扩增检测。荧光基团的信号在退火阶段被检测。目前凸环探针适用的实时PCR仪器包括:
Applied Biosystems(ABI)公司的7300、7500,Bio-Rad公司的IQ Cycler,Roche公司的LightCycler480,Corbett Research公司的Rotor-Gene 3000、6000,Strategene公司的MX3000P和MX3005P等等。
实施例1:实时PCR检测乙肝病毒
为考察凸环探针应用在实时PCR检测的有效性,PCR模板为一系列稀释的标准DNA样品。反应体系总体积为50μl,包括5μl 10×buffer(100mM[NH
4]
2SO
4,6700mM Tris-HClpH 8.3),1.5μl 25mM MgCl
2,每种dNTP 400μM,上下游引物0.4μM,探针0.1μM,2.0U Taq DNA聚合酶,5μl模板DNA。实时PCR反应在MX3000P实时PCR仪上进行。反应条件为:94℃预变性3min,随后94℃25s,58℃20s(检测FAM、荧光信号),72℃15s,共35个循环。标准DNA连续10倍梯度稀释,H
2O作为阴性对照。凸环探针包括一段与扩增产物互补的核酸序列。上下游引物扩增乙肝病毒的S区基因(NC-003977),扩增174bp。其上游引物为:5′-caacatcaggattcctaggacc-3′,下游引物为:5′-ggtgagtgattggaggttg-3′,探针的靶序列靠近上游引物,探针第一条链序列:FAM-5′-CAGAGTCTAGACT
GTGGTGGACTTC-3′。探针上带有方框标示的碱基为探针内自身凸环区;第二条链序列为:GAAGTCCACCACAGTCTAGACTCTG-3′-BHQ,形成的凸环结果见图3:
在PCR扩增时荧光实时检测测量了35个循环,其结果如图4所示。初始的靶浓度在稀释物最浓时的线a,线b、c、d分别表示当模板被连续10倍稀释3个梯度后的荧光曲线。线e说明无靶(水)的对比。图4从上至下,模板被连续10倍稀释,直至最后样品为水。
与引物相同浓度或为引物浓度的1/2~1/4,凸环探针可以很快与靶序列杂交结合,显出荧光信号。没有靶序列存在时,探针自身互补的碱基分子内杂交,形成稳定的带凸环的双链结构,荧光基团和淬灭基团靠近,自身荧光被淬灭。因此,凸环探针可以用于实时核酸扩增检测,可以用于检测乙肝病毒的PCR检测技术中。
实施例2:凸环探针应用在检测SNP
选择人类血小板同种异型抗原(human platelet alloantigen,HPA)的HPA-4基因,由于该基因内存在一个G>A的突变,而导致产生HPA-4a和HPA-4b两个血小板抗原,HPA-4a为野生型,HPA-4b为突变型。针对两个抗原的基因序列分别设计凸环探针,两个探针只相差1个碱基,并选择已知基因型的3个典型样品进行试验。1个为纯和HPA-4a样品,1个为纯和HPA-4b样品,1个为杂合样品,同时含有HPA-4a和HPA-4b。试验时同时做一个无(阴性)样品即H2O对照。野生型(HPA-4a)探针第一条链序列为:
5’-FAM-GGTGAGCTTTCGCATCTGGGT-3’,第二条链序列为5’
-ACCCAGATGCAAAGCTCACC-3’-BHQ,突变型(HPA-4b)探针序列为:
5’-HEX-ACCCAGATGCAAAAGCTCACC-3’,第二条链序列为5’
-GGTGAGCTTTGCATCTGGGT-3’-BHQ,带有下划线的碱基为突变发生碱基。上游引物为:5’-GGACCTGTCTTACTCCATGAAGG-3’;下游引物为:
5’-GAAGCCAATCCGCAGGTTAC-3’。
反应总体系为25μL,包括2.5μl 10×buffer(100mM[NH4]2SO4,600mM Tris-HCl pH8.8),1.5μl 25mM MgCl2,每种dNTP 400μM,每种引物0.4μM,每种探针0.1μM,2.0U Taq DNA聚合酶,20ng模板DNA。实时PCR反应在MX3000P实时PCR仪上进行。反应条件为:96℃预变性3min,随后94℃25s,58℃25s(检测FAM和HEX种荧光信号),72℃15s,共35个循环。
图5显示了实时荧光PCR循环数据的结果。相当于野生型靶的探针发出的荧光被正方实心表示,相当于突变异种靶的探针发出的荧光被实心圆环表示。
相对于阴性样本,野生型探针(曲线a1),及突变型探针(曲线a2),均没有发出荧光。结果显示仅当模板包括在反应中相应荧光强度增强。当两个靶均在样本中时,野生型探针(曲线d2),及突变探针(曲线d1),荧光强度显著增加。但是,对于野生型靶,荧光强度显著增强来自于野生型探针(曲线b1),而不是突变异种型探针(曲线b2)。相反,对于突变型靶,荧光强度显著增强来自于突变型探针(曲线c1),而不是野生型探针(曲线c2)。结果显示仅仅是匹配的探针可以产生正确的信号。野生模板与突变异种模板的100%完全检测。这证明了根据本发明的探针通过一个单核苷区分了靶。当无模板时无信号被发现,当有两个模板时,两个信号均被发现。
上述仅为本发明的具体实施例,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
序列表
<110>厦门艾德生物医药科技有限公司
<120>一种对核酸特异识别实时检测的探针
<160>10
<210>1
<211>22
<212>DNA
<213>人工序列
<400>1
caacatcagg attcctagga cc 22
<210>2
<211>19
<212>DNA
<213>人工序列
<400>2
ggtgagtgat tggaggttg 19
<210>3
<211>26
<212>DNA
<213>人工序列
<400>3
CAGAGTCTAG ACTCGTGGTG GACTTC 26
<210>4
<211>25
<212>DNA
<213>人工序列
<400>4
GAAGTCCACC ACAGTCTAGA CTCTG 25
<210>5
<211>21
<212>DNA
<213>人工序列
<400>5
GGTGAGCTTT CGCATCTGGG T 21
<210>6
<211>20
<212>DNA
<213>人工序列
<400>6
ACCCAGATGC AAAGCTCACC 20
<210>7
<211>21
<212>DNA
<213>人工序列
<400>7
ACCCAGATGC AAAAGCTCAC C 21
<210>8
<211>20
<212>DNA
<213>人工序列
<400>8
GGTGAGCTTT GCATCTGGGT 20
<210>9
<211>23
<212>DNA
<213>人工序列
<400>9
GGACCTGTCT TACTCCATGA AGG 23
<210>10
<211>20
<212>DNA
<213>人工序列
<400>10
GAAGCCAATC CGCAGGTTAC 20