多样本混合测序方法及试剂盒
技术领域
本发明涉及一种多样本混合测序的方法,更具体地,涉及一种构建多样本高通量测序文库的方法以及用于其的试剂盒。
背景技术
DNA测序技术开启了人类深入研究生命遗传密码的大门,其自发明以来就一直在推动分子生物学发展方面起着至关重要的作用。
Frederick Sanger在20世纪70年代中期发明了末端终止法测序,Sanger法因为既简便又快速,并经过后续的不断改良,成为了当时DNA测序的主流。
然而随着科学的发展,传统的Sanger测序已经不能完全满足研究的需要,对基因组测序,需要费用更低、通量更高、速度更快的测序技术,第二代测序技术应运而生。第二代测序技术的核心思想是边合成边测序,即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454FLX、Illumina/Solexa Genome Analyzer和Applied BiosystemsSOLID system等。
下文将以Illumina/Solexa Genome Analyzer测序为例,简述第二代测序技术的基本原理、操作流程。
Illumina/Solexa Genome Analyzer测序的基本原理也是边合成边测序。用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。
Illumina/Solexa Genome Analyzer测序的操作流程如下:1)测序文库的构建:首先准备基因组DNA,然后将DNA随机片段化成数百碱基,并在两头加上特定的接头(Adaptor),然后进行PCR扩增(参见图1);2)锚定桥接:Solexa测序的反应在称为flow cell的玻璃管中进行,flow cell又被细分成8个通道,每个通道的内表面有无数的被固定的单链接头。将上述步骤得到的带接头的DNA片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用;3)产生DNA簇:添加未标记的dNTP和普通Taq酶进行固相桥式PCR扩增,单链桥型待测片段被扩增成为双链桥型片段(参见图2)。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flow cell的固相表面上获得上百万条成簇分布的双链待测片段;4)单碱基延伸测序:在测序的flow cell中加入四种荧光标记的dNTP、DNA聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息;5)数据分析:这一步严格来讲不能算作测序操作流程的一部分,但是只有通过这一步前面的工作的意义才能显现出来。测序得到的原始数据是长度在几十个到几百个碱基的序列,要通过生物信息学工具将这些短的序列组装成为长的结构甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种的基因组序列上,并进一步分析得到有生物学意义的结果。
随着第二代测序技术的不断发展,测序能力不断提高。Illumina/Solexa Genome Analyzer测序仪,从2008年的每运行一次读取50M个序列发展到现在的每运行一次读取300M个序列,测序能力提高了十几倍。到目前为止,HiSeq 2000每运行一次可以达到300G个碱基的通量,人基因组的碱基数为约3G,如果以人类基因组三十倍的覆盖率计算,每运行一次也能够检测3个人类基因组的序列。而现实的情况是,大多待测序列(如mRNA、植物基因等)都远远小于人类基因组序列。由于测序仪每运行一次都需要一定的时间,有一定的成本。出于经济和测序效率的考虑,研究人员提出了多样品混合测序的方式。多样品混合测序即将不同来源的多个样品在一次测序仪的运行中进行测序。这种测序需要对不同来源的样品加以区分,也就是不同来源的样品需要加上不同的标签。
给不同来源的样品加上不同的标签,需要在构建测序文库的过程中完成,图1中示出了第二代高通量测序文库构建的主要过程:先进行DNA片段化,然后再在DNA末端接上Y型接头(如图3中所述),在Y型接头中就包括了Rdl SP(第一端测序引物,read 1 sequencingprimer)。最后在PCR的过程中,通过PCR引物引入与flow cell的一种表面引物互补的连接位点以及3’端标签序列(可参见图3和图4),从图3中可以看出,现有技术在构建测序文库的过程中一共使用了三种引物,通过引物1引入了与flow cell表面固定的一种序列互补的连接位点P5,通过引物2引入了标签SP(标签测序引物,index sequencing primer)和Rd2 SP(第二端测序引物,read 2 sequencing primer),通过引物3引入了与flow cell的另一种表面引物互补的连接位点P7和标签序列。在最终的DNA片段的两端就依次包括了P5、Rd1 SP、标签SP、标签序列和P7(如图3所示),三种PCR引物的比例约为:引物1∶引物2∶引物3=40~50∶1∶40~50。
现有技术构建测序文库的过程中使用了三种引物,在PCR的过程中是在开始时就将三种引物同时放入待扩增的序列当中。由于对三种引物的比例和量要求很高,在加样过程中,三种引物量的微小变化就会引起扩增产物与预想结果的较大差异,而且由于三种引物导致的扩增系统的复杂性,使扩增得到的产物也很复杂,包含了多种混杂的产物。样品混入均匀度也较低。
发明内容
鉴于在多样品混合测序过程中上面提到的问题,发明人发明了一种新的构建多样品混合测序文库的方法,适用于多种第二代测序平台,如Roche/454 FLX、Illumina/Solexa GenomeAnalyzer和Applied Biosystems SOLID system等。
本发明提供了一种制备多样品DNA混合测序文库的方法,包括:a)将一种样品DNA链片段化成长度为数百个碱基的DNA片段;b)分别在所述DNA片段的两端连接上Y型接头;c)对两端连接上Y型接头的所述DNA片段进行PCR扩增;d)根据上机测序通道的安排以及标签序列的不同将多种经过步骤a)、b)和c)处理的样品DNA混合;其中,所述Y型接头中包括了区别不同样品的标签序列,用于所述PCR扩增的第一引物和用于所述PCR扩增的第二引物除了与所述Y型接头互补的序列外,还分别包括与第二代测序平台中的两种表面引物互补的序列,以用于在测序过程中使扩增得到的DNA片段与所述表面引物能够互补杂交。
在本发明的某些实施例中,所述标签序列存在于距离所述Y型接头的双链区域末端6-10个碱基的双链区。
本发明提供了一种利用第二代测序平台同时测试多样品DNA的方法,包括:通过上述的方法制备多样品DNA混合测序文库;将所述多样品DNA混合测序文库上机检测。
在本发明的某些实施例中,待检测的DNA序列首先与第一端测序引物杂交读取待测DNA片段的第一条链,然后与标签序列引物杂交读取标签序列,最后与第二端测序引物杂交读取待测DNA片段的第二条链。
在本发明的某些实施例中,所述第一端测序引物读到的第一个碱基为所述待测DNA片段一端的第一个碱基,所述标签引物读到的第一个碱基为所述标签序列,所述第二端测序引物读到的第一个碱基为所述待测DNA片段另一端的第一个碱基。
在本发明的某些实施例中,所述第一端测序引物与所述标签序列不完全碱基配对。
在本发明的某些实施例中,所述第二端测序引物与反向标签序列不完全碱基配对。
在本发明的某些实施例中,不包括对待测DNA片段的第二条链测序的过程。也就是说仅进行单向测序,也不需要第二端测序引物与待测DNA片段的第二条链杂交并测序。
本发明提供了一种制备多样品DNA混合测序文库的试剂盒,包括:对片段化的DNA末端进行修复的酶和对DNA末端进行5’端磷酸化的酶;在DNA的3’端加上腺嘌呤的酶和d ATP;将Y型接头与DNA连接的酶;适用于各种酶的缓冲液;Y型接头混合物;用于PCR扩增接上Y型接头的第一引物和第二引物;d NTP混合液;其中,所述Y型接头上包括标签序列,一种来源的DNA片段用包括一种特定标签序列的Y型接头,不同来源的DNA片段分别对应不同的标签序列,所述第一引物和所述第二引物除了与所述Y型接头互补的序列外,还分别包括与第二代测序平台中的两种表面引物互补的序列,以用于在测序过程中使扩增得到的DNA片段与所述表面引物能够互补杂交。
在本发明的某些实施例中,进一步包括:第一端测序引物、第二端测序引物和标签测序引物,其中,第一端测序引物读到的第一个碱基为所述待测DNA片段一端的第一个碱基,所述标签引物读到的第一个碱基为所述标签序列,所述第二端测序引物读到的第一个碱基为所述待测DNA片段另一端的第一个碱基。
在本发明的某些实施例中,所述第一端测序引物与所述标签序列不完全碱基配对。
在本发明的某些实施例中,所述第二端测序引物与所述标签序列不完全碱基配对。
在本发明的某些实施例中,不包括所述第二端测序引物。
本发明的方法和试剂盒使在构建文库的过程中只需要两种PCR引物,简化了实验的步骤,缩短了操作时间。使样品混入的均匀性也增加。
附图说明
图1是构建第二代多样品测序文库的步骤框图。
图2是以Illumina/Solexa Genome Analyzer为例,示出了边合成边测序过程的示意图。
图3是在现有技术中,制备多样品混合测序文库步骤的示意图,如图中所示,Rd1 SP为读取第一端时的测序引物杂交位点,P5和P7分别为连接flow cell的位点,Rd2 SP为读取第二端时的测序引物杂交位点,标签SP为读取标签时的测序引物杂交位点。在接头中包含了Rd1 SP,通过第一引物引入了P5,通过第二引物引入了标签SP和Rd2 SP,通过第三引物引入了标签序列和P7。
图4是在现有技术中,进行多样品混合测序的示意图。在图中示出了(1)DNA片段化、末端修整、5’端磷酸化、3’末端悬A后得到的DNA片段;(2)Y型接头;(3)连接了Y型接头的DNA片段;(4)通过第一引物与连接了Y型接头的DNA杂交后,进行PCR得到的产物,其中仅仅示出了两个可能的对称产物中的一个;(5)通过第二引物和第三引物与(4)中的产物进行退火杂交后得到PCR产物,其中第三引物中的IIIIIII是指标签序列,这是制备多样品测序文库中PCR得到的最终待测片段;(6)分别示出了在测序过程中的两种读取待测序列的引物和读取标签序列的引物。在此需要说明的是,图4中示出的Y型接头的碱基顺序仅仅是示例性的目的,可以是任何能够实现上述功能的Y型接头序列。
图5是本发明的进行多样品混合测序的示意图。在图中示出了(1)连接了Y型接头的DNA片段;(2)通过第一引物与Y型接头的其中一条链杂交并进行PCR扩增得到的产物;(3)通过第二引物与Y型接头的另一条链的互补链杂交并进行PCR扩增得到的产物;(4)分别示出了第一端测序引物、标签序列引物和第二端测序引物。在此需要说明的是,图5中示出的Y型接头的碱基顺序仅仅是示例性的目的,可以是任何符合本发明设计的包括标签序列的Y型接头。
具体实施方式
名词解释:
Y型接头是不完全互补的两条链,其在一端两条链上的碱基互补形成双链,在另一端的碱基之间不完全互补,没有形成互补的双链。
第二代测序平台是指基于边合成边测序的方式,通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454 FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system等。
需要说明的是,本领域的技术人员应该理解本发明的附图及其实施例仅仅是为了例举的目的,并不能对本发明构成任何限制。在不矛盾的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
实施例1:第二代高通量测序文库的制备
下面先简述第二代多样品混合测序文库的制备步骤:
断裂到指定范围的DNA片断;
末端补平和5’端磷酸化:由酶Klenow(New England Biolabs)、T4磷酸化酶和DNA聚合酶共同完成,之后对产物进行清洁纯化;
末端悬A:将上一步骤的产物在klenow ex-(New England Biolabs)(是一种改进的Klenow酶,其3’-5’外切活性缺失)作用下双链末端悬出A碱基,之后对产物进行清洁纯化;
连接:根据样品的不同来源及计划上机的通道连接不同的接头,需要T4DNA连接酶作用,其中不同的接头带有表5中不同的标签序列,以用来区分样品的来源;
电泳:将上一步骤的产物进行琼脂糖电泳,将连好接头的特定目的片断割胶回收;
PCR富集:将割胶回收产物进行聚合酶链反应扩增;
电泳:将PCR产物进行琼脂糖电泳,将目的片断割胶回收;
定量:利用定量工具如nano drop(nano drop科技有限公司)、Bioanalyser 2100(agilent)或Qubit(life technologies)进行定量;
混合:根据上机通道的安排及标签序列的不同将样品等量混合;
样品上机。
下面示出了利用本发明的方法进行多样品测序的具体实例
步骤1:纯化样品DNA并对样品DNA进行片段化,片段范围在300-500bp;(人全血的DNA样品)
步骤2:末端补平
制备如下的反应混合液
表1
在20℃温浴30分钟;
在纯化柱上纯化DNA样品,并在42μl的无菌dH2O或洗脱缓冲液中洗脱。
步骤3:在DNA片段的3’末端加多聚腺嘌呤尾制备如下的反应混合液
表2
在37℃温浴30分钟;
在柱上纯化DNA样品,并在25μl的无菌dH2O或洗脱缓冲液中洗脱。
步骤4:为DNA片段连接接头
制备如下的反应混合液
表3
在20℃温浴15分钟。
步骤5:纯化连接产物
50ml 2%的凝胶,80V进行电泳约40分钟;
用灭菌刀片割取目标条带,例如350+25bp;
在Qiagen凝胶提取柱上胶纯化回收DNA样品,并在25μl的无菌dH2O或洗脱缓冲液中洗脱。
步骤6:通过PCR富集接头修饰的DNA片段
制备如下的PCR反应混合液
表4
用如下的PCR实验方案进行扩增:
a.98℃30秒;
b.13个如下的循环:
98℃10秒,65℃30秒,72℃30秒;
c.72℃5分钟;
d.保持在4℃。
步骤7:纯化PCR产物
50mL2%琼脂糖凝胶,80V电泳40分钟;
用灭菌刀片割取目标条带,例如350±25bp;
在Qiagen凝胶提纯柱上提取DNA样品并在25μl的无菌dH2O或洗脱缓冲液中洗脱。
步骤8:文库定量及混合
取1μL文库Qubit定量;
根据通道安排,将同一通道内不同接头的样品文库等量混合;
再次取1μL混合样品Qubit定量。
步骤9:上机测序
将第一端测序引物、标签引物、第二端测序引物稀释成100μM;
按照Illmina GAIIx操作说明上机。
可替换地,可以进行双端测序,也可以进行单端测序,在进行单端测序时不需要第二端测序引物。
经上机测序验证后符合设计要求,其统计结果见下表:
表5
样品 |
标签 |
数量 |
百分数 |
样品1 |
AC |
10519444 |
31.57891 |
样品2 |
CG |
6789107 |
20.3806 |
样品3 |
GT |
5127397 |
15.39222 |
样品4 |
TA |
5732817 |
17.20966 |
未知 |
|
5142851 |
15.43861 |
总计 |
|
33311616 |
100 |
实施例2:用于制备多样品DNA混合测序文库的试剂盒
本发明提供的用于制备多样品DNA混合测序文库的试剂盒主要包括以下几种成分:
对片段化的DNA末端进行修复的酶和对DNA末端进行5’端磷酸化的酶,包括酶Klenow、T4磷酸化酶和DNA聚合酶,以及各种酶所需要的缓冲液;
在DNA的3’端加上腺嘌呤的酶如klenow ex-(3’-5’外切活性缺失),和dATP;
将Y型接头与DNA连接的酶如DNA连接酶;
适用于各种酶的缓冲液如DNA连接酶缓冲液,Klenow酶缓冲液和T4DNA连接酶缓冲液(NEB);
Y型接头混合物,包括多种Y型接头,每种Y型接头中所包括的标签序列不同,如可以包括在表5中列出的各种标签序列,包括一种标签序列的Y型接头对应用于一种来源的DNA序列;
用于PCR扩增接上Y型接头的第一引物和第二引物,所述第一引物和所述第二引物除了与所述Y型接头互补的序列外,还分别包括与第二代测序平台中的两种表面引物互补的序列,以用于在测序过程中使扩增得到的DNA片段与所述表面引物能够互补杂交;dNTP混合液。
本发明的测序引物可以进一步包括:第一端测序引物、第二端测序引物和标签测序引物,其中,第一端测序引物读到的第一个碱基为所述待测DNA片段一端的第一个碱基,所述标签引物读到的第一个碱基为所述标签序列,所述第二端测序引物读到的第一个碱基为所述待测DNA片段另一端的第一个碱基。所述第一端测序引物与所述标签序列之间可以不完全碱基配对。所述第二端测序引物与所述标签序列之间可以不完全碱基配对。
可替换地,本发明的试剂盒也可以不包括所述第二端测序引物,仅仅用于单端的测序。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。