具体实施方式
为了使本发明要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种一次制备多个DNA大片段插入双末端测序文库的方法,包括以下步骤,如附图1所示:
S01.将待测DNA打断并连接上带有生物素的DNA接头,得到生物素标记的DNA片段;
S02.将所述生物素标记的DNA片段分选成N个不同大小的DNA片段,其中,10≤N≤12;
S03.将所述N个不同大小的DNA片段分别进行环化处理得到环状DNA,并清除未环化的线性片段,将所述不同大小的环状DNA打断后连接上带有不同索引序列的Truseq接头,得到带有不同索引序列Truseq接头的DNA片段;
S04.将所述带有不同索引序列Truseq接头的DNA片段混合在一起与链霉亲和素磁珠进行反应,富集带有生物素标记的DNA片段;
S05.PCR扩增所述带有生物素标记的DNA片段并测序。
具体的,如附图1A所示,上述步骤S01中,将待测DNA打断并连接上生物素标记的接头,优选采用Tn5转座酶复合体实现,具体的,可采用NexteraMate-pair kit中Tn5转座酶复合体将待测DNA打断。由于得到的被打断的DNA片段的大小,由Tn5转座酶复合体和待测DNA的分子比例决定。因此,为了得到不同大小片段均匀分布的DNA,需要用不同分子比例的Tn5转座酶复合体和待测DNA反应。作为优选实施例,所述Tn5转座酶复合体和所述待测DNA的比例为(3-5.5μL Tn5转座酶复合体):(1μg待测基因组DNA)。更进一步地,为了得到不同大小片段均匀分布的DNA,采用数个不同比例的所述Tn5转座酶复合体和所述待测DNA形成反应体系,进行DNA打断再混合。
作为具体优选实施例,选用下表1所述的4种不同分子比例的Tn5转座酶复合体和待测DNA来打断待测DNA,当然,应当理解,下表中各样品的具体含量仅为优选情况,本发明可根据下表中各样品体系中各组分的比例,对各组分的用量进行调整。
表1
将上述4中反应体系样品放置在55℃的水浴锅中反应30min。将反应后的4个样品体系混合后进行纯化。具体的,所述纯化可采用Genomic DNA Clean&ConcentratorTM-10 kit(Zymo Research,货号:D4010)并按其说明书纯化DNA,最后用洗脱液进行洗脱,所述洗脱液的用量及其洗脱次数可根据实际情况进行调整。具体的,本发明实施例可视上述体系的各组分的用量和体积,使用40μL的洗脱液洗脱两次,得到80μL的DNA。
将打断处理后得到的DNA片段中由转座酶复合体导致的DNA缺口补平,其方法可通过下述操作实现:
将打断处理后得到的DNA片段、10X stand displacement buffer、DNAPolymerase、dNTP按体积比参照下表2所述条件配置反应样品:
表2
将上述反应样品放置在37℃的水浴锅中反应30min。将反应后的样品进行纯化处理。具体的,所述纯化可采用Genomic DNA Clean&ConcentratorTM-10 kit(Zymo Research,货号:D4010)并按其说明书纯化DNA,最后用洗脱液进行洗脱,所述洗脱液的用量及其洗脱次数可根据实际情况进行调整。具体的,本发明实施例视上述体系的各组分的用量和体积,使用17μL的洗脱液洗脱两次,得到34μL的DNA。
如附图1B所示,上述步骤S02中,对所述生物素标记的DNA片段进行分选,作为优选实施例,采用Sage Science公司的Sage ELF(Sage Science,货号:ELF0001)实现,也可采用传统的切胶回收的方法或其它类似方法。采用SageScience公司的Sage ELF的具体方法为:
将34μL生物素标记的DNA片段和6μL 6X loading buffer进行混合处理,将得到的混合样品按照Sage ELF说明书要求加入到SageELF 0.75%琼脂糖凝胶DNA回收胶盒(Sage Science,货号:ELD7510)中,使用“时间”模式电泳200-240min,回收不同片段的DNA。
作为具体实施例,将所述生物素标记的DNA片段34μL和6X loading buffer6μL混匀,加入到SageELF0.75%琼脂糖凝胶DNA回收胶盒中,设定用“时间”模式电泳230min,回收不同片段的DNA,并用dsDNA HS Assay Kit(LifeTechnologies,货号:Q32851)检测回收到的DNA的浓度。用Agilent HighSensitivity DNA Kit(Agilent Technologies,货号:5067-4626)和Agilent DNA12000 Kit(Agilent Technologies,货号:5067-1508)分析各个片段的大小。
通过Sage ELF片段分选,可一次性将所述生物素标记的DNA片段分选成13个不同大小的DNA片段(图1B),实际应用中,可根据不同片段的浓度舍弃其中1-2个浓度较低的片段,最后的文库一般包含10-12个片段(10≤N≤12)。
如附图1C所示,上述步骤S03中,对DNA分子进行环化处理。作为优选实施例,所述环化处理的方法为:
将所述11个不同大小的DNA片段、T4 DNA ligase buffer、T4 DNA ligase(New England Biolabs,货号:M0202M)混合得到混合液,用水调节所述混合液的体积,并使得所述混合液中所述T4 DNA连接酶的终浓度为0.10-0.30U/μL,所述DNA片段的终浓度为1.0-3.0ng/μL;进一步的,所述混合液中所述T4 DNA连接酶的终浓度为0.15U/μL,所述DNA片段的终浓度为2.0ng/μL。将所述混合液在16℃条件下反应1-17小时;进一步的,将所述混合液在16℃条件下反应10小时。
作为优选实施例,所述清除未环化的线性片段的方法为:
参照表3所述条件配置反应样品:
表3
将所述反应体系在37℃条件下反应30-90min后,70℃灭活酶蛋白30min。进一步的,将所述反应体系在37℃条件下反应60min后,70℃灭活酶蛋白30min。
如附图1D所示,本发明实施例需要将将环化的DNA分子随机打断成300-800bp的小片段。作为具体实施例,将所述环状DNA打断可采用下述方法实现,将所述环状DNA转入到microTUBE(Covaris,货号:520045)中,利用Covaris S220将所述环状DNA打断为300-800bp大小的DNA片段,其中,Covaris S220的参数设置如下:Peak Incident Power(W):120-170,Duty Factor:5-10%,Cycles per Burst:200,Treatment Time(s)30-90。进一步的,Covaris S220的参数设置优选如下:Peak Incident Power(W):140,Duty Factor:10%,Cyclesper Burst:200,Treatment Time(s)40。
本发明实施例中,优选采用UltraTM DNA Library Prep Kit for(New England Biolabs,商品号:E7370S)将含有不同barcode标记的IlluminaDNA adaptor(来自DNA LT Sample Prep Kit v2-SetA kit中,Illumina,商品号:FC-121-2001)连接到上一步骤打断的DNA上。
作为又一个优选实施例,在打断的DNA片段上连接具有不同序列的Truseq接头步骤之前,还包括对所述打断的DNA片段进行末端修复和加A尾处理。作为具体实施例,对所述打断的DNA片段进行末端修复和加A尾处理的方法为:按表4所述比例配置得到反应体系1:
表4
将所述反应体系1在20℃条件下反应30min,65℃反应30min
如附图1E所示,将上述末端修复和加A尾处理的DNA片段进行Truseq接头连接,具体方法为:按表5所述比例在反应体系1中加入下列试剂得到反应体系2:
表5
将经过上述处理后得到Truseq接头的11个DNA片段混合在一起进行纯化处理,所述纯化处理优选采用DNA Clean&ConcentratorTM-5kit(Zymo Research,货号:D4013)纯化,纯化后使用25μL洗脱液洗脱两次,得到50μL的DNA溶液。
如附图1F所示,上述步骤S04中,采用链霉亲和素磁珠富集含有生物素的DNA片段。优选的,所述链霉亲和素磁珠选用M-280Streptavidin(Life Technologies,商品号:11205D),操作步骤如说明书所述,略有改动。
作为具体实施例,富集带有生物素标记接头的DNA片段的方法如下:
S04.1.将链霉亲和素磁珠如M-280Streptavidin在涡旋仪上混匀,然后取所述Truseq接头的DNA片段至离心管中,具体的,取20μL所述M-280Streptavidin至1.5mL离心管中;
S04.2.将离心管置于磁铁架上,2-3min后吸去上清液;
S04.3.加入1x Binding and washing(B&W)Buffer(5mMTris-HCl pH 7.5,0.5mM EDTA,1M NaCl),混匀处理,静置后吸去上清液。作为具体实施例,加入200μL 1x B&WBuffer,用涡旋仪震荡5秒钟,然后置于磁铁架上,2-3min后吸去上清液。该步骤可视情况重复一至数次;
S04.4.加入50μL1x B&WBuffer;
S04.5.将所述50μL带Truseq接头的DNA片段加入到步骤S04.4中的链霉亲和素磁珠中,混匀处理后室温孵育。作为具体优选实施例,室温孵育30min。为防止磁珠沉淀在管底,所述EP管要放置在涡旋仪上(vortex mixer,2000rpm)震荡处理;
S04.6.将离心管置于磁铁架上,2-3min后弃掉上清液;
S04.7.加入500μL1x B&W Buffer洗涤磁珠,用涡旋仪震荡处理5min,然后置于磁铁架上,静置2-3min后吸去上清液;该步骤可视情况重复数次,更优选为重复四次,然后加入30μLTE buffer。
上述步骤S05中,在PCR扩增前,利用30μL链霉亲和素磁珠测试PCR模板的量。PCR反应体系如表6所述:
表6
1:来自UltraTM DNA Library Prep Kit forNew England Biolabs,商品号:E7370S。
2:来自DNA LT Sample Prep Kit v2-Set A kit中,Illumina,商品号:FC-121-2001
作为本发明优选实施例,如附图1G所示,所述PCR扩增反应程序为:
第一阶段:98℃,3min,循环1次;
第二阶段:98℃,15s;60℃,30s;72℃,45s,循环7次;
第三阶段:72℃,5min,循环1次;
第四阶段:12℃,10min,循环1次。
对PCR扩增产物进行纯化处理,具体的,可用DNA Clean&ConcentratorTM-5kit(Zymo Research,货号:D4013)纯化DNA后,用9μL洗脱液洗脱2次。然后用dsDNA HS Assay Kit(Life Technologies,货号:Q32851)检测回收到的DNA的浓度。通常,利用7个循环的PCR可以得到40-80ng的DNA,若PCR产物少于40ng,可根据情况增加2-4个PCR循环,若PCR产物多于80ng,可根据情况减少1-2个PCR循环。本实施例中,利用7个PCR循环扩增得到70ng的DNA。
利用10μL链霉亲和素磁珠测试PCR模板的量后,根据PCR的结果决定剩余20μL磁珠的PCR循环数。本实施例中,利用7个PCR循环扩增剩余20μL磁珠。PCR反应体系如表7所述:
表7
1:来自UltraTM DNA Library Prep Kit forNew England Biolabs,商品号:E7370S。
2:来自DNA LT Sample Prep Kit v2-Set A kit中,Illumina,商品号:FC-121-2001
用DNA Clean&ConcentratorTM-5kit纯化DNA,用9μL洗脱液洗脱2次。
本发明实施例中,可对PCR扩增产物的片段分布进行检测,具体的,选用Agilent High Sensitivity DNA Kit检测PCR扩增产物的片段分布。然后,对所述PCR扩增产物进行片段分选,具体方法可为:将35μL两次纯化的PCR扩增产物和6μL6X loading buffer混匀,加入到SageELF 2%琼脂糖凝胶DNA回收胶盒(Sage Science,货号:ELD2010)中,设定用“时间”模式电泳80-130分钟,回收不同片段的DNA。将回收得到的不同片段的DNA用dsDNA HSAssay Kit检测回收到的DNA的浓度。用Agilent High Sensitivity DNA Kit分析各个片段的大小。根据测序平台和测序长度的要求挑选不同大小的片段测序。在本实施例中,电泳时间为110min,挑选DNA片段长度为300bp左右的片段,利用Illumina Miseq测序,测序类型为双末端150bp(PE 2x150bp),设置单索引测序以区分不同长度的插入片段。
本发明提供的一次制备多个DNA大片段插入双末端测序文库的方法,将打断后的DNA分选成不同长度的片段,能一次制备获得多达10个以上不同插入长度的DNA大片段文库,并能将10个以上不同插入长度的大片段文库整合在一个测序文库中,对建库而言,通过将多个不同长度插入片段的大片段文库整合在一个文库中,大大降低了建库成本,而且避免了DNA样品在片段选择步骤中的浪费,降低了DNA样品的需要量,对临床样品和珍贵样品中有重要的意义;对后续分析而言,不同插入长度的大片段文库可以为基因组的从头组装和重测序提供不同的信息和更准确的结果,在基因组的从头组装和通过重测序鉴定各种不同类型的遗传变异(包括SNP和小的indel,尤其是大的基因组结构变异如插入、缺失、倒置、异位等)方面具有重要的应用前景。
下面结合具体实施例进行说明。
实施例一
附图2为本发明实施例制备的包含11个片段的大片段文库数据峰值分布图,由图2可见,每个片段跨度非常窄,非常有利于后续的基因组组装和结构变异分析。
对比例1
千年基因公司制备的5Kb文库,其文库数据峰值分布图如附图3所示(http://www.macrogencn.com/_d276876289.htm),由图3可见,其文库只包含一个长度的片段,且片段跨度很大(从2k-8k)。
对比例2
千年基因公司制备的8kb文库,其文库数据峰值分布图如附图4所示(http://www.macrogencn.com/_d276876289.htm),由图4可见,其文库数据峰值分布跨度比较大(5-10kb),跨度大不利于后续分析。
本发明实施例中使用的英文释义均为分子生物学领域的常规释义。
Truseq:Illumina公司一种测序文库的商标名;
PS Reaction Buffer:PS(Plasmid safe)反应缓冲液;
Plasmid-Safe DNase:一种可以消化线性DNA的DNA酶混合物,由于plasmid是环状的,不能被消化,因此命名为plasmid-safe DNA酶;
End Repair Reaction Buffer:末端修复缓冲液;
End Prep Enzyme Mix:末端修复酶混合液;
Blunt/TA Ligase Master Mix:平末端/TA连接酶预混液;
Adaptor:Truseq接头;
Ligation Enhancer:连接反应增强剂;
Tagmentation Buffer:片段化反应缓冲液;
Tagmentation Enzyme:片段化反应酶;
Stand Displacement Buffer:链置换反应缓冲液;
DNA Polymerase:DNA聚合酶;
Loading Buffer:上样缓冲液;
T4 DNALigase Buffer:T4 DNA连接酶缓冲液;
T4 DNALigase:T4 DNA连接酶;
IlluminaDNA adaptor:Illumina是公司名,Truseq是Illumina公司的一大类测序文库的商标;
Binding and washingBuffer:结合和洗涤缓冲液;
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。