发明内容
本发明的目的是针对上述不足之处提供一种可二次验证碱基信息的DNA测序方法,该方法不仅实现了原位清除延伸标记物的目的,而且还能够二次验证同一碱基位置的信息,降低测序中可能出现的错误率,并在硫代修饰保护碱基的基础上测定下一个碱基信息,错误延伸的累积效应不严重,序列的测定准确,所进行的步骤按照传统的分子生物学方法进行,能够维持DNA模板和测序引物的量以保证足够的延伸信号,没有标记物量的累积效应,保证结果的易读性和可靠性,不存在测序长度的限制。
可二次验证碱基信息的DNA测序方法是采取以下技术方案实现:
可二次验证碱基信息的DNA测序方法,其特征在于DNA序列上一个碱基的信息的确定是通过两次延伸测序步骤来实现的,该DNA测序过程如下:
步骤1)3′端碱基硫代修饰的测序引物与被固定的待测DNA序列进行杂交;
步骤2)加入第一次延伸反应溶液,溶液成份包括1~10U/μL DNA聚合酶、四种用荧光标记的核苷酸单体A、T、C、G和四种正常的核苷酸单体A、T、C、G,用荧光标记的核苷酸单体和同种类正常核苷酸单体之间的分子数比例为1∶50~100,通过在上述测序引物上延伸四种核苷酸单体A、T、C、G中的一种、并通过荧光检测到第一次延伸的碱基信息;
步骤3)将步骤2)中延伸上的用荧光标记核苷酸单体通过生物酶切割方法进行清除;
步骤4)加入第二次延伸反应溶液,溶液成份包括1~10U/μL DNA聚合酶、四种用荧光标记的可脱保护的硫代核苷酸单体A、T、C、G和四种未标记荧光的可脱保护的硫代核苷酸单体A、T、C、G,用荧光标记的可脱保护的硫代核苷酸单体和同种类未标记荧光的可脱保护的硫代核苷酸单体之间的分子数比例为1∶50~100,通过在测序引物上延伸可脱保护的硫代核苷酸单体A、T、C、G中的一种,并通过荧光检测到第二次延伸的同一位置的碱基信息;
步骤5)用化学试剂去除上述步骤4)中延伸上的用荧光标记的可脱保护的硫代核苷酸单体上的可脱保护基团,同时去除该硫代核苷酸单体上的荧光基团;
循环上述步骤2)、3)、4)和5)所进行的过程,直到确定待测DNA中的碱基序列信息。
在执行上述的步骤4)之前,步骤2)和步骤3)被同时执行1到10次。
所述的可二次验证碱基信息是指待测DNA模板上某一个具体位置的碱基信息采用两次检测的方式获得,第一次检测得到该位置的碱基信息,第二次检测则是进一步验证该碱基信息。
所述的固定的待测DNA模板是指待测定序列的DNA片段。
所述的步骤(2)中用荧光标记的核苷酸单体上修饰有以下荧光化学基团中的一种:DAPI、Cy2、Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、Rhodamine6G、Tetramethylrhodamine、Lissamine、Texas Red、BODIPY 630/650、BODIPY 650/665;所述的核苷酸单体是脱氧核糖核苷酸、双脱氧核糖核苷酸或核糖核苷酸。
所述的步骤(4)中所用的荧光标记的可脱保护的硫代核苷酸单体上修饰有以下荧光化学基团中的一种:DAPI、Cy2、Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、Rhodamine 6G、Tetramethylrhodamine、Lissamine、Texas Red、BODIPY 630/650、BODIPY 650/665;
所述的硫代核苷酸单体特征在于结构为:
其中,Y为嘌呤碱基基团或者嘧啶碱基基团,核糖或脱氧核糖基团2′和3′位置上连接着R1和R2基团,在一定条件下,R1或R2基团可以被分解,形成羟基,R1基团选自但不限于下列化学基团之一:
R2选自但不限于H、OH、羰基,以及与R1相同的基团;R4,R5和R6分别是:R4选用氢原子或烃基;R5选用氢原子或烃基;R6选用烃基、环烃基、链烯基、环烯基或苄基。
所述的用荧光标记核苷酸单体或用荧光标记的可脱保护的硫代核苷酸单体是单色的,即四种核苷酸单体均修饰着同一种类的荧光基团;或者是不同种类的荧光,即四种核苷酸单体标记不相同或者不完全相同的荧光基团。
所述的待测DNA序列中的碱基信息是通过检测是否有荧光标记和荧光标记的强度以及碱基互补原理来确定模板的序列信息,相同重复碱基的确定通过信号的线性递增关系进行确定。
所述步骤3)中的生物酶选用Lamda核酸外切酶、T7核酸外切酶、核酸外切酶I、核酸外切酶III、核酸外切酶T中的一种。
所述步骤5)中的化学试剂至少选用高碘酸盐溶液、氨水、氢氧化钠溶液、双氧水、碘化钾溶液、硫酸铜溶液、DABCYL溶液中的一种。
有益效果:本发明与现有技术相比,具有如下优点:
1、本发明的最大优点是能够极大程度地降低测序过程中的错误率。在DNA扩增中通常所用的Taq DNA聚合酶扩增碱基出错率为10-5左右,Pfu DNA聚合酶的碱基出错率为10-6,在合成测序中,假如所使用的DNA聚合酶的碱基出错率为10-6,那么在测序过程中,某一个碱基的出错率为1/106,再次测定这个碱基时,其出错率为1/1012,结果的准确率提高了6个数量级。
2、本发明可以降低DNA模板的需要量。目前的高通量测序方法通常在乳液单克隆扩增之前都需要进行DNA模板的PCR扩增,以保证相同序列区域能够有多个相同的克隆,随着碱基识别准确率的提高,我们可以减少克隆的需要量,甚至于不需要进行乳液扩增之前的PCR扩增过程。
3、本发明与其他测序技术的一个明显区别在于,本发明对同一个位置的碱基验证不止可以进行一次,图1所示为本测序方法的示意图,在未加入硫代修饰的核苷酸之前(步骤.4),步骤.2和步骤.3可以进行多次,正如有益效果第1条所述的那样,这两个步骤进行次数越多,这个位置碱基出错的可能性就越小,碱基出错的可能性越小,意味着序列出错的可能性越小,也就越有利于后续的生物学分析。如此方便的能对碱基进行重复验证的测序方法是当前测序技术不曾拥有的。
具体实施方式
实施例1.可二次验证碱基信息的DNA测序方法:
可二次验证碱基信息的DNA测序方法是通过两次延伸测序步骤来实现的对DNA序列上一个碱基信息的确定,该DNA测序过程如下:
步骤1)3′端碱基硫代修饰的测序引物与被固定的待测DNA序列进行杂交;
步骤2)加入第一次延伸反应溶液,溶液成份包括1~10U/μL DNA聚合酶、四种用荧光标记的核苷酸单体A、T、C、G和四种正常的核苷酸单体A、T、C、G,用荧光标记的核苷酸单体和同种类正常核苷酸单体之间的分子数比例为1∶50~100,通过在上述测序引物上延伸四种核苷酸单体A、T、C、G中的一种、并通过荧光检测到第一次延伸的碱基信息;
步骤3)将步骤2)中延伸上的用荧光标记核苷酸单体通过生物酶切割方法进行清除;
步骤4)加入第二次延伸反应溶液,溶液成份包括1~10U/μL DNA聚合酶、四种用荧光标记的可脱保护的硫代核苷酸单体A、T、C、G和四种未标记荧光的可脱保护的硫代核苷酸单体A、T、C、G,用荧光标记的可脱保护的硫代核苷酸单体和同种类未标记荧光的可脱保护的硫代核苷酸单体之间的分子数比例为1∶50~100,通过在测序引物上延伸可脱保护的硫代核苷酸单体A、T、C、G中的一种,并通过荧光检测到第二次延伸的同一位置的碱基信息;
步骤5)用化学试剂去除上述步骤4)中延伸上的用荧光标记的可脱保护的硫代核苷酸单体上的可脱保护基团,同时去除该硫代核苷酸单体上的荧光基团;
步骤6)循环上述步骤2)、3)、4)和5)所进行的过程,直到确定待测DNA中的碱基序列信息。
在执行上述的步骤4)之前,步骤2)和步骤3)可以被同时执行1到10次。
所述的可二次验证碱基信息是指待测DNA模板上某一个具体位置的碱基信息采用两次检测的方式获得,第一次检测得到该位置的碱基信息,第二次检测则是进一步验证该碱基信息。
所述的固定的待测DNA模板是指待测定序列的DNA片段。
所述的步骤(2)中用荧光标记的核苷酸单体上修饰有以下荧光化学基团中的一种:DAPI、Cy2、Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、Rhodamine6G、Tetramethylrhodamine、Lissamine、Texas Red、BODIPY 630/650、BODIPY 650/665;所述的核苷酸单体是脱氧核糖核苷酸、双脱氧核糖核苷酸或核糖核苷酸。
所述的步骤(4)中所用的荧光标记的可脱保护的硫代核苷酸单体上修饰有以下荧光化学基团中的一种:DAPI、Cy2、Cy3、Cy5、Cy5.5、Cy7、FITC、Alexa 488、Alexa 568、JOE、ROX、Rhodamine 6G、Tetramethylrhodamine、Lissamine、Texas Red、BODIPY 630/650、BODIPY 650/665;所述的硫代核苷酸单体特征在于结构为:
其中,Y为嘌呤碱基基团或者嘧啶碱基基团,核糖或脱氧核糖基团2′和3′位置上连接着R1和R2基团,在一定条件下,R1或R2基团可以被分解,形成羟基,R1基团选自但不限于下列化学基团之一:
R2选自但不限于H、OH、羰基,以及与R1相同的基团;R4,R5和R6分别是:R4选用氢原子或烃基;R5选用氢原子或烃基;R6选用烃基、环烃基、链烯基、环烯基或苄基。
所述的用荧光标记核苷酸单体或用荧光标记的可脱保护的硫代核苷酸单体是单色的,即四种核苷酸单体均修饰着同一种类的荧光基团;或者是不同种类的荧光,即四种核苷酸单体标记不相同或者不完全相同的荧光基团。
所述的待测DNA序列中的碱基信息是通过检测是否有荧光标记和荧光标记的强度以及碱基互补原理来确定模板的序列信息,相同重复碱基的确定通过信号的线性递增关系进行确定。
所述步骤3)中的生物酶选用Lamda核酸外切酶、T7核酸外切酶、核酸外切酶I、核酸外切酶III、核酸外切酶T中的一种。
所述步骤5)中的化学试剂选用高碘酸盐溶液、氨水、氢氧化钠溶液、双氧水、碘化钾溶液、硫酸铜溶液、DABCYL溶液中的一种或几种。
实施例2:具体的可二次验证碱基信息的DNA测序方法实施方案
第一步:将2μg人类基因组DNA用超声波打断,通过割胶纯化的方法割取25bp~50bp的基因组片段范围。取100ng已纯化的DNA片段与100nM的公共连接引物,在T4连接酶的作用下进行连接。连接好后的基因片段用公共引物进行10个循环的PCR预扩增,用纯化试剂盒纯化PCR产物,并进行浓度测定。
第二步:将预扩增后基因组DNA片段稀释到1fM,与事先固定在醛基片上的配对引物杂交,然后在片进行PCR扩增,形成用于测序的微阵列芯片。
第三步:将扩增好后的基片用0.3M的氢氧化钠溶液洗涤,使得基片上的PCR产物变性为单链,然后与2μM 3′端用硫代修饰的测序引物在42℃杂交30分钟,洗涤后待用。
第四步:基片上加上第一次延伸反应溶液,其中包括1~10U/μL的Taq DNA聚合酶、2μM的ddNTP、20nM Cy3-ddCTP、20nM Cy5-ddGTP、20nM FITC-ddATP、20nM JOE-ddTTP,52℃反应30秒钟,用去离子水洗涤后,用CCD进行拍照,获得该位置的碱基信息。
第五步:加入3U/μL的核酸外切酶III,37℃反应30秒钟,去除延伸上的碱基,并用去离子水进行洗涤。
第六步:基片上加上第二次延伸反应溶液,其中包括2U/μL的Taq DNA聚合酶、2μM的2′位修饰
的硫代脱氧核糖核苷酸(即dNTP)、1nM用不同荧光修饰的、2′位同样修饰着
的硫代脱氧核糖核苷酸,分别是Cy3-dCTP、Cy5-dGTP、FITC-dATP、JOE-dTTP,52℃反应30秒钟,用去离子水洗涤后,用CCD进行拍照,再次获得该位置的碱基信息。
第七步:用0.1M的氢氧化钠溶液与基片作用1分钟,去除基团,活化出羟基,并使四种荧光发生淬灭。
第八步:反复进行第四、五、六、七步,直到全部获得待测DNA模板的碱基信息。
第九步:利用图像分析软件,由荧光与碱基类型已知的对应关系,得到待测DNA模板的具体序列信息,由于同一个位置的碱基,测定了两次,两次碱基信息完全相同的位置,判定为准确。两次碱基信息不一致的位置,标识为可疑。由于,待测DNA模板进行了预扩增,那么存在着相同序列的其他克隆,可疑位置的碱基信息与其他克隆相同位置的信息进行比较,占90%以上的碱基信息被判定为准确。
实施例3:可二次验证碱基信息的DNA测序方法测定人基因组p16外显子1序列
设计一对针对人基因组p16外显子1的PCR引物,其中一条引物5′端修饰着氨基。用PCR引物扩增人样本(血液、组织等)中的p16外显子1序列片段,PCR产物纯化后,通过点样的办法在醛基修饰的基片上形成阵列,洗去未结合的PCR产物,加入0.3M的氢氧化钠溶液,用变性的办法去除未固定的DNA链,得到单一的模板链,然后与2μM 3′端用硫代修饰的测序引物在42℃杂交30分钟,洗涤后待用。进行以下步骤:
第一步:基片上加上第一次延伸反应溶液,其中包括2U/μL的Taq DNA聚合酶、2μM的ddNTP、20nM Cy3-ddCTP、20nM Cy5-ddGTP、20nM FITC-ddATP、20nM JOE-ddTTP,52℃反应30秒钟,用去离子水洗涤后,用CCD进行拍照,获得该位置的碱基信息。
第二步:加入3U/μL的核酸外切酶III,37℃反应30秒钟,去除延伸上的碱基,并用去离子水进行洗涤。
第三步:基片上加上第二次延伸反应溶液,其中包括5U/μL的Taq DNA聚合酶、2μM的2′位修饰
的硫代脱氧核糖核苷酸(即dNTP)、20nM用不同荧光修饰的、2′位同样修饰着
的硫代脱氧核糖核苷酸,分别是Cy3-dCTP、Cy5-dGTP、FITC-dATP、JOE-dTTP,52℃反应30秒钟,用去离子水洗涤后,用CCD进行拍照,再次获得该位置的碱基信息。
第四步:用0.01M的高碘酸钠溶液与基片作用1分钟,去除
基团,活化出羟基,洗涤后,再加上0.01M的硫酸铜溶液使四种荧光发生淬灭。
第五步:反复进行第一步到第四步,直到全部获得待测DNA模板的碱基信息。
第六步:利用图像分析软件,由荧光与碱基类型已知的对应关系,得到待测DNA模板的具体序列信息,由于同一个位置的碱基,测定了两次,两次碱基信息完全相同的位置,判定为准确。两次碱基信息不一致的位置,标识为可疑。由于,待测DNA模板进行了预扩增,那么存在着相同序列的其他克隆,可疑位置的碱基信息与其他克隆相同位置的信息进行比较,占90%以上的碱基信息被判定为准确。