发明内容
本发明的目的在于提供一种用于基因测序的方法,该方法简化了合成步骤,且成像装置较为简单,成本低;而且采用的荧光标记核酸荧光分子只有3种,每个测序周期都不会在DNA链上留下多余的残留分子,不会影响DNA聚合酶与待测的DNA链的结合,可以大幅度地提高测序准确率和读长。
本发明的上述目的是通过如下技术方案来实现的:一种基因测序的方法,利用三种不同波长的激光激发三种荧光标记的核苷酸分子,所述的核苷酸分子为A、C、G和T四种核苷酸分子中的任意三种,剩余一种核苷酸分子无荧光核酸标记,以该方法为基础重新定义了基因测序仪,是一种采用三色荧光边合成边测序的方法。
该方法采用三色荧光边合成边测序,与目前市场主流的四色荧光测序仪有本质的区别。
作为本发明的一种优选的实施方案,本发明提供的基因测序的方法,具体含以下步骤:
(1)合成一套基因测序用核酸分子,包括三种荧光标记核酸分子和一种无荧光标记核酸分子,所述的三种荧光标记核酸分子为A、C、G和T四种核苷酸分子中的任意三种,剩余一种即为无荧光标记的核酸分子;
(2)将待测的单链DNA连接到通用的DNA序列上,然后固定在玻璃基底表面;
(3)将互补的DNA引物与连接有待测DNA的通用的DNA序列配对,并且引物上设有3’-OH官能团;
(4)利用DNA聚合酶,将上述荧光标记核酸加入到引物的3’-OH上,获得待测样品;
(5)使用3种不同波长的激光分别先后照射待测样品,每种激光会激发相应的荧光基团,并且产生相应的荧光,通过显微镜成像系统,信号通过3种不同的滤波片,读出每段DNA上带有的不同荧光信号,其中3种不同波长的激光为波长之间差别在30nm以上的激光;
(6)化学切除保护基团,引物3’-OH上的-N3,以及荧光分子和碱基之间的-N3;
(7)进行下一轮的测序,测得引物的DNA序列,从而测得待测DNA的序列。
本发明步骤(1)中采用的一套基因测序用核酸分子,包括三种荧光标记的核酸分子A,C和G,以及一种无荧光标记的核酸分子T,各核酸分子的结构式如下:
(T)。
一般来说,本发明可以采用各种各样的荧光分子,都可以达到测序的目的。
但本发明也可以优选采用如下列举的荧光分子,本发明所述的荧光分子1优选为rhodamine X或Alexa Fluor 594,所述的荧光分子2优选为Cy5或Alexa Fluor 647,所述的荧光分子3优选为BOIDIPY-FL或Alexa Fluor 488。
实际上,本发明该方法所用的激光和荧光分子包括但不局限于上述的几种。只需要每个激光器的波长处于相应的一种荧光分子的最大激发波长附近即可。
且本发明中采用的三种修饰的核苷酸分子组合也不局限于上述所列的组合(A,C,G),也可以是其他组合如(C,G,T)、(G,T,A)或(T,A,C),此处不再一一列举。
本发明所述的核酸分子C优选通过以下合成工艺制得:
在上述合成工艺中,各步骤代表的反应过程如下:
(1)选取起始原料1胞嘧啶,其5’-OH被硅保护,3’-OH被叠氮甲基保护,将原料与条件(i)中的三乙胺TEA、二氯甲烷DCM以及酰氯化合物反应,形成碱基被修饰的产物2;
(2)将产物2与条件(ii)中的四正丁基氟化铵TBAF反应,5’-OH的硅保护被去掉,形成碱基被修饰的产物3;
(3)将产物3与条件(iii)中的三氯氧磷POCl3、磷酸三甲酯(MeO)3PO、丁基胺二氢焦磷酸BuNH2H2P2O7、三乙胺碳酸氢盐TEAB和三丁胺Bu3N反应,形成5’-OH的三磷酸产物4;
(4)将产物4与条件(iv)中的哌啶piperidine、二甲基甲酰胺DMF反应,脱掉芴基保护集团,形成含有氨基的产物5;
(5)将产物5与条件(v)中的荧光分子3 BODIPY-FL-NHS(Life Technologies公司),在浓度为0.1mol/L、pH为8~9的碳酸氢钠/碳酸钠缓冲溶液中反应,形成含有荧光基团的最终产物6,即为所述的核酸分子C。
本发明所述的核酸分子A和核酸分子G的合成过程同核酸分子C。
核酸分子A合成的起始原料为2’-deoxyadenosine monohydrate,从Berry and Associates公司购买, 产品编号是PR-3445;核酸分子G合成起始原料为2’-deoxyguanosine monohydrate,从Berry and Associates公司购买, 产品编号是PR-3452。除了核酸分子A和核酸分子G的合成过程中所采用的起始原料与核酸分子C的不同之外,核酸分子A和核酸分子G的合成过程中的其他步骤皆同荧光标记核酸分子C的合成过程相同。
本发明中采用的无荧光标记的核酸分子T为市售产品,可以从如Sigma Aldrich公司可以购买,www.sigmaaldrich.com,产品编号是T0251-50MG。
其中,显微镜成像系统采用TIRF,TIRF是total internal reflection fluorescent microscope的简称,即“全内反射荧光显微镜”的缩写,本发明所述3种不同波长的激光可以是任意三种可见光波段的、与荧光分子对应的、彼此相差30纳米以上的激光组合;优选波长分别为488nm,568nm和643nm的激光;或波长为512nm,568nm和633nm的激光。
3种激光的波长必须分别在3种荧光的最大吸收波长附近,并且使用3种不同的滤波片,必须分别在3种荧光的最大发射波长附近,以便达到最大的荧光产生效率,而且3种荧光信号不至于互相干扰。
读出信号后,通过化学还原反应切除保护基团,3’-OH上的-N3终止基团,以及荧光分子和碱基之间的-N3,该基团被还原成为氨基,之后3’-OH上发生水解脱落,而荧光分子和碱基之间的氨基甲酸酯键受氨基进攻断裂,从而恢复为天然碱基。
上述切除保护基团原理和过程如下:
读出信号后,必须通过化学还原反应切除保护基团,3’-OH上的-N3终止基团,以及荧光分子和碱基之间的-N3。从而恢复为天然碱基,进入下一个测序循环。
切除保护基团的原理如下所示(其中Base代表碱基,是腺嘌呤、胞嘧啶和鸟嘌呤中的任何一种。Fluorophore代表任何一种荧光分子):
(1)叠氮基团与三价的磷发生还原反应,形成活性中间体;
(2)活性中间体自身反应,形成四元环状的产物;
(3)四元环状的产物不稳定,脱掉一个氮气分子,形成新的中间体;
(4)新的中间体和水分子发生水解反应,被还原成为氨基;
(5)氨基上的孤对电子进攻附近的羰基碳,之后形成环状的中间体;
(6)环状的中间体不稳定,断裂形成氨基,从而恢复为天然碱基。而含有荧光分子的部分与碱基脱离,可以被清洗除去。而恢复的天然碱基是存在于连接在玻璃表面的DNA分子上,不被清洗,可以进行下一个测序循环。
以上6个步骤对应以下6个箭头表示的化学反应。
。
与现有技术相比,本发明具有如下优点:该方法简化了合成步骤,且成像装置较为简单,成本低;而且采用的荧光标记核酸荧光分子只有3种,每个测序周期都不会在DNA链上留下多余的残留分子,不会影响DNA聚合酶与待测的DNA链的结合,可以大幅度地提高测序准确率和读长。
具体实施方式
实施例1
本实施例提供的一种基因测序的方法,主要是利用三种不同波长的激光激发三种荧光标记的核苷酸分子,所述的核苷酸分子为A、C、G和T四种核苷酸分子中的任意三种,剩余一种核苷酸分子无荧光核酸标记,该方法以无荧光激发为标志重新定义了测序仪,是一种采用三色荧光边合成边测序的方法。
具体的,本实施例提供的一种基因测序的方法,包含以下步骤:
(1)合成一套基因测序用核酸分子,包括三种荧光标记核酸分子和一种无荧光标记核酸分子,所述的三种荧光标记核酸分子为A、C、G和T四种核苷酸分子中的任意三种,剩余一种即为无荧光标记的核酸分子;
(2)将待测的单链DNA例如人的基因片段,大概100~500核苷酸长度左右连接到通用的DNA序列上,然后固定在玻璃基底表面;
(3)将互补的DNA引物与连接有待测DNA的通用的DNA序列(一般是10个左右连续的T胸腺嘧啶组成的序列)配对,并且引物上设有3’-OH官能团;
(4)利用DNA聚合酶,将上述荧光标记核酸加入到引物的3’-OH上,获得待测样品(采用New England Biolabs公司生产的Therminator II DNA polymerase,获得的待测样品是聚合酶反应之后,带有荧光的引物);
(5)使用3种不同波长的激光分别先后照射待测样品,每种激光会激发相应的荧光基团,并且产生相应的荧光,通过显微镜成像系统,信号通过3种不同的滤波片,读出每段DNA上带有的不同荧光信号,其中3种不同波长的激光为波长之间差别在30nm以上的激光;
(6)化学切除保护基团,引物3’-OH上的-N3,以及荧光分子和碱基之间的-N3;
(7)进行下一轮的测序,测得引物的DNA序列,从而测得待测DNA的序列。
步骤(1)中采用的一套基因测序用核酸分子,包括三种荧光标记的核酸分子A,C和G,以及一种无荧光标记的核酸分子T,各核酸分子的结构式如下:
其中荧光分子1为rhodamine X或Alexa Fluor 594,荧光分子2为Cy5或Alexa Fluor 647,荧光分子3为BOIDIPY-FL或Alexa Fluor 488。
其中核酸分子C通过以下合成工艺制得:
(1)选取起始原料1胞嘧啶,其5’-OH被硅保护,3’-OH被叠氮甲基保护,将原料与条件(i)中的三乙胺TEA、二氯甲烷DCM以及酰氯化合物反应,形成碱基被修饰的产物2;
其中起始原料1胞嘧啶(N4-Benzoyl-5'-O-tert-butyldimethylsilyl-2'-deoxycytidine,从CNH technologies公司购买,http://www.cnhtechnologies.com,产品编号Y-1123,合成路线可参考文献J. Milton, X. Wu, M. Smith, J. Brennan, C. Barnes, X. Liu, S. Ruediger, WOPatent, 2004, 2004018497,;S. G. Zavgorodny, M. Polianski, E. Besidsky, V. Kriukov, A. Sanin, M.Pokrovskaya, G. Gurskaya, H. Lonnberg, A. Azhayev, Tetrahedron Lett., 1991, 32:7593-7596;A. Semenyuk, A. Foldesi, T. Johansson, C. Estmer-Nilsson, P. Blomgren, M Brannvall, L. A. Kirsebom, M. Kwiatkowski, J. Am. Chem. Soc., 2006, 128: 12356-12357.等)
(2)将产物2与条件(ii)中的四正丁基氟化铵TBAF反应,5’-OH的硅保护被去掉,形成碱基被修饰的产物3;
(3)将产物3与条件(iii)中的三氯氧磷POCl3、磷酸三甲酯(MeO)3PO、丁基胺二氢焦磷酸BuNH2H2P2O7、三乙胺碳酸氢盐TEAB和三丁胺Bu3N反应,形成5’-OH的三磷酸产物4;
(4)将产物4与条件(iv)中的哌啶piperidine、二甲基甲酰胺DMF反应,脱掉芴基保护集团,形成含有氨基的产物5;
(5)将产物5与条件(v)中的荧光分子3,在浓度为0.1mol/L、pH为8~9的碳酸氢钠/碳酸钠缓冲溶液中反应,形成含有荧光基团的最终产物6,即为所述的核酸分子C;
具体反应过程如下:
其中核酸分子A和核酸分子G的合成过程同核酸分子C。无荧光标记的核酸分子T为市售产品,可以从如Sigma Aldrich公司可以购买,www.sigmaaldrich.com,产品编号是T0251-50MG。
3种不同波长的激光的波长为488nm,568nm和643nm;或3种不同波长的激光的波长为512nm,568nm和633nm。
其中化学切除保护基团的过程如下:
切除保护基团的原理如下所示(其中Base代表碱基,是腺嘌呤、胞嘧啶和鸟嘌呤中的任何一种。Fluorophore代表任何一种荧光分子):
(1)叠氮基团与三价的磷发生还原反应,形成活性中间体;
(2)活性中间体自身反应,形成四元环状的产物;
(3)四元环状的产物不稳定,脱掉一个氮气分子,形成新的中间体;
(4)新的中间体和水分子发生水解反应,被还原成为氨基;
(5)氨基上的孤对电子进攻附近的羰基碳,之后形成环状的中间体;
(6)环状的中间体不稳定,断裂形成氨基,从而恢复为天然碱基。而含有荧光分子的部分与碱基脱离,可以被清洗除去。而恢复的天然碱基是存在于连接在玻璃表面的DNA分子上,不被清洗,可以进行下一个测序循环。
以上6个步骤对应以下6个箭头表示的化学反应:
实施例2
(1)利用上述荧光标记核酸分子测定单核苷酸多态性SNP(Single Nucleotide Polymorphism),并用质谱鉴定结果:
SNP是基因序列只在一个核苷酸中发生的变异。在很多应用中,比如确定病毒的类型,或者基因缺陷时,需要进行SNP的测定。
本实施例中,选用人类P53基因中编号为Exon8的一段DNA序列进行测单个碱基的测定,该序5’-TGCCTCTTGCTTCTCTTTTCCTATCCTGAGTAGTGGTAATCTACTGGGACGGAACAGCTTGAGGTGCGTGTTTGTGCCTGTCCTGGGAGAGACCGGCGCACAGAGGAAG-3’,该序列一共100多个碱基,与其对应的引物使用17个碱基,分子量为 5144的DNA,序列是 5’- TCTCTGGCCGCGTGTCT-3’,引物的序列与模板序列中的黑体部分互补。
测序使用3种不同波长的荧光的波长修饰三种核酸A,C和G,如下式(A)、(C)和(G)中所示。
(A)
(C)
(G)
加上没有荧光的核酸T,如下式(T)所示:
(T)
其中,荧光标记核酸分子A中采用的荧光分子1为rhodamine X;荧光标记核酸分子C中采用的荧光分子2为Cy5,荧光标记核酸分子G中采用的荧光分子3为Bodipy-FL-NHS。
测定单核苷酸步骤:
将3种不同波长的rhodamine X,BOIDIPY-FL和Cy5的荧光分子修饰的三种核酸A、C和G(各120pmol)加上没有荧光的核酸T(1nmol)混合,加入DNA聚合酶Thermonator III(1单位),加入上述的模板(40pmol)和引物(60pmol)以及MnCl240nmol,混合物用1X Thermopol I 缓冲液(含20 mM Tris-HCl/10 mM (NH4)2SO4/10 mM KCl/ 2 mM MgSO4/0.1 % Triton X-100, pH 8.8, 从New England Biolabs订购)20微升溶解。
混合物在恒温65摄氏度,反应30分钟。
反应结束后,混合物使用Zip Tip TM 分离出引物,然后用基质辅助激光解吸附飞行时间质谱(MALDI-TOF-Mass Spectroscopy)进行分子量的测定。
由于使用的4种碱基分子量各不同,所以通过反应后引物链的分子量变化,可以确定加入的一个碱基是那一个,从而得知模板链上对应位置的碱基序列。
实验结果如图2中所示:加入单个碱基后,引物链的分子量为5969;对应的碱基是C, 可以确定加入的一个碱基是C,从而得知模板链上对应位置的碱基是G。
(2)在玻璃表面固定DNA阵列进行测序:
利用3种不同波长的荧光的波长修饰三种碱基C,A和G,3种不同波长的荧光的激发波长为488nm,594nm和633nm;测序结果图由红、绿和紫色三种点,分别代表C,A和G,加上黑色表示没有荧光的碱基,代表T。
如图3和4中所示,为一轮测序所得的颜色图谱,由图3和4中可见玻璃表面的DNA阵列由于加上了荧光分子,得到不同的信号,从而可以得到阵列中各个点的碱基序列,其中图3是大约100X150个点的测序图,图4是图3的局部放大的图。
(3)在玻璃表面固定DNA进行多读长的测序:
利用3种不同波长的荧光的波长修饰三种碱基C,A和G,3种不同波长的荧光的波长为488nm,594nm和633nm,测序结果如图3和4中所示,由红、绿和紫色三种点,分别代表C,A和G,加上黑色表示没有荧光的碱基,代表T。
切除化学切除保护基团,包括引物3’-OH上的-N3,以及荧光分子和碱基之间的-N3,切除方式同实施例1,然后进行下一轮测序,结果如图5所示,对玻片12轮测序所得的颜色图谱,每个测序周期中,用三种激光依次照射玻璃表面,表面固定的DNA如果被DNA聚合酶加上了荧光分子,就得到相应的信号,CCD测定的荧光强度比较高,从信号最强的荧光可以推断加入的荧光碱基;如果没有荧光,CCD测定的荧光强度非常低,则表示加入的是没有荧光的碱基,代表T。
12轮测序所得的碱基连接起来,就是引物的序列GGCATGCATGAC。与其互补的序列就是模板链,即样品DNA的序列CCGTACGTACTG,该结果与实际符合。
表1是12轮测序结果
表1中每行数值是每种荧光标记的碱基的信号发光强度,数值在几千左右的代表有信号,而数值在几百左右的代表没有信号,从数值大小可以确定每轮测定的碱基。
从本实施例中可以看出,采用三色荧光测序方法与预期相符,可以给出准确的DNA序列。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围。