CN107794573A

CN107794573A - 一种构建dna大片段文库的方法及其应用

Info

Publication number: CN107794573A
Application number: CN201611046464.1A
Authority: CN
Inventors: 梁峻彬; 李小林; 张介中; 韩典昂; 刘三阳; 玄兆伶; 李大为; 陈重建
Original assignee: Annuo Uni-Data (yiwu) Medical Inspection Co Ltd; Zhejiang Annuo Uni-Data Biotechnology Co Ltd; ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Current assignee: Annuo Uni-Data (yiwu) Medical Inspection Co Ltd; Zhejiang Annuo Uni-Data Biotechnology Co Ltd; ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Priority date: 2016-08-31
Filing date: 2016-11-23
Publication date: 2018-03-13
Anticipated expiration: 2036-11-23
Also published as: CN107794573B

Abstract

本发明涉及一种DNA大片段文库的构建方法及其应用。本发明提供的DNA大片段文库的构建方法用于DNA大片段文库的构建，包括将DNA大片段的两端加上具有脱氧尿苷的接头，通过酶的消化得到具有黏性末端的大片段DNA；以及将具有黏性末端的大片段DNA进行环化，得到环化大片段DNA的步骤。通过本发明的文库构建方法可以提高大片段文库的有效数据率。此外本发明通过对接头进行特殊设计，还可以为构建的大片段DNA文库提供质控点。

Description

一种构建DNA大片段文库的方法及其应用

技术领域

本发明属于分子生物学领域，具体涉及一种DNA大片段文库的构建方法，由该方法构建的DNA大片段文库以及该DNA大片段文库在测序中的应用。

背景技术

对基因组序列未知或没有近源物种基因组信息的某个物种，对其不同长度基因组DNA片段及其文库进行序列测定，然后用生物信息学方法进行拼接、组装和注释，从而获得该物种完整的基因组序列图谱，称为基因组从头测序，也叫de novo测序。在基因组学飞速发展的今天，de novo测序与比较基因组方法联合可以用来探索该物种的起源和进化，研究其生长发育、形状生产以及环境适应的分子机制，是快速了解一个物种的途径之一。一个物种基因组序列图谱的完成，也将带动这个物种下游一系列研究的开展，可以构建该物种的基因组数据库，为该物种的后基因组学研究搭建一个高效的平台；为后续的基因挖掘、功能验证提供DNA序列信息。

高通量测序也叫二代测序，它可以对上千万条DNA片段同时进行测序，通量、时效和单碱基成本上较Sanger测序有着突破性的提高，这些优点使得目前de novo测序主要由二代测序来完成。二代测序的缺点是读长短，二代测序仪里读长最长的罗氏454也仅能进行最长400bp的DNA测序，这使得二代测序在进行de novo项目时要先构建小片段文库，根据不同小片段上的重合序列将其测序结构拼接成大小不一的contig(片段重叠群)。这些contig进一步拼接成基因组，对于不能重叠的contig则需要一种称为大片段文库的DNA文库，来确定其在基因组中的位置和距离。

大片段文库是一种从一定片段大小的随机打断基因组DNA构建过来的文库，这些片段大小通常从2k到200k不等。由于这些片段大小已经远超二代测序读长的极限，因此在测序时不能采用全部测通的方法，而是采用双端配对测序，仅对这些片段的两端进行成对测序，以此判断测出的成对序列在基因组上的距离。为达到这个目的，构建大片段文库时，通常的方法是：(1)回收固定大小的DNA大片段；(2)对固定大小的DNA大片段进行末端修复和添加生物素标记，或者将固定大小的DNA大片段末端加上带有生物素标记的接头；(3)将带有生物素标记的DNA大片段或者带有生物素标记接头的DNA大片段进行环化；(4)将未环化的DNA大片段进行消化；(5)将环化的DNA大片段进行随机打断，使用链霉亲和素磁珠钓取带有生物素标记的打断片段(即末端配对片段)；(6)将调取出的打断片段进行扩增，建成测序用DNA大片段文库。但是现有方法得到的大片段文库测序的有效数据率偏低。

此外，现有技术的DNA大片段文库构建方法都需要测序结束后根据测序数据来判断文库构建成功与否，都不能在建库过程中或者测序前提供评价文库质量(尤其是是否适合进一步测序)的方法。将含有末端配对信息量较低的不合格文库的文库进行高通量测序会导致大量时间成本、人力成本和仪器成本的浪费，因此，能够在建库过程中或者测序前对大片段文库的质量进行评价已经成为大片段文库构建甚至de novo测序技术都亟待解决的问题。

非专利文献

1.Illumina.(2009)Mate Pair Library v2 Sample Preparation Guide For 2-5kb Libraries.

2.Filip Van Nieuwerburgh,Ryan C.Thompson,Jessica Ledesma,etal.Illumina mate-paired DNA sequencing-library preparation using Cre-Loxrecombination.Nucleic Acids Research.2012,40(3):e24.

发明内容

本发明的发明人为解决上述技术问题进行了深入研究，结果发现：通过使用具有脱氧尿苷的接头替代现有方法采用的接头，可以提高大片段文库的有效数据率。进一步的，环化DNA大片段在其连接区域形成至少一个切割位点，这个切割位点可以作为大片段文库的质控点，用于在测序前对大片段文库的质量进行评价，从而完成了本发明。

即，本发明包括：

1.一种DNA大片段文库的构建方法，包括：

步骤B：将经过处理的DNA大片段的两端加具有脱氧尿苷的接头，得到具有脱氧尿苷的DNA大片段，所述接头带有生物素标记；

步骤C-1：采用具有脱氧尿苷切割功能的酶切割具有脱氧尿苷的DNA大片段，得到带有缺口的DNA大片段；

步骤C-2：采用高温条件处理带有缺口的DNA大片段，使缺口至3'端的碱基序列游离，得到具有黏性末端的DNA大片段；

步骤D：将具有黏性末端的DNA大片段进行环化，得到环化DNA大片段。

2.根据项1所述的DNA大片段文库的构建方法，所述环化DNA大片段中除去所述DNA大片段以外的碱基序列为连接区域，所述连接区域包括至少一个切割位点。

3.根据项1或2所述的DNA大片段文库的构建方法，所述切割位点为酶切位点。

4.根据项1-3任一项所述的DNA大片段文库的构建方法，还包括在所述步骤D之后进行的步骤E，将所述环化DNA大片段进行线性消化，得到消化后的环化DNA大片段；

步骤F：将所述消化后的环化DNA大片段进行打断，得到测序用DNA片段；

步骤G：将测序用DNA片段进行片段捕获，采用链霉亲和素化固相载体钓取带有生物素标记的测序用DNA片段；

步骤H：将带有生物素标记的测序用DNA片段进行扩增，得到扩增产物，从而构建DNA大片段文库。

5.根据项4所述的DNA大片段文库的构建方法，还包括在步骤B之前进行的步骤A：将固定长度DNA大片段进行末端修复，或者进行末端修复和加A碱基，得到经过处理的DNA大片段；和/或在步骤A之前进行的步骤A-0：将希望进行测序的DNA片段打断，得到DNA大片段。

6.根据项4或5所述的DNA大片段文库的构建方法，所述步骤G为步骤H-步骤J，

步骤H：将带有生物素标记的测序用DNA片段进行末端修复，得到平末端DNA片段；

步骤I：将步骤G中得到的平末端DNA片段进行加接头，得到加接头DNA片段；和

步骤J：将加接头DNA片段进行PCR扩增，得到扩增产物，从而构建DNA大片段文库。

7.根据项1所述的DNA大片段文库的构建方法，所述DNA大片段的片段大小为1.5k～30kbp，优选2k～10kbp，更优选3k～5kbp。

8.一种DNA大片段文库的质量检测方法，将通过项1-7任一项所述的DNA大片段文库的构建方法得到的测序用DNA片段或扩增产物作为待测样本，所述待测样本包括切割位点，并进行如下步骤：

步骤K：将待测样本进行琼脂糖凝胶电泳，得到待测样本电泳条带；

步骤L：将待测样本进行切割处理，得到质检样本；

步骤M：将质检样本进行琼脂糖凝胶电泳，得到质检样本电泳条带；

步骤N：质检样本电泳条带的位置均值与待测样本电泳条带的位置均值，当质检样本电泳条带的位置均值移至待测样本电泳条带的位置均值的一半±10％处时，判断待测样本为合格文库。

9.一种DNA大片段文库，其是通过项1-7中任一项所述的DNA大片段文库的构建方法构建得到的。

10.一种DNA大片段文库的测序方法，以项9所述的DNA大片段文库作为对象进行测序。

11.根据项9所述的测序方法，其中，所述测序为双端测序。

12.一种用于构建DNA大片段文库的试剂盒，用于实施项1-7任一项所述的DNA大片段文库的构建方法，包括

加接头试剂，所述加接头试剂包括具有脱氧尿苷的接头，切割试剂，所述切割试剂包括具有脱氧尿苷切割功能的酶。

13.根据项12所述的试剂盒，其特征在于，所述具有脱氧尿苷的接头在一条链上有一个脱氧尿苷，具有脱氧尿苷切割功能的酶为USER酶。

14.根据项12-13任一项所述的试剂盒，还包括选自下组试剂中的至少一种或两种以上：用于末端修复的试剂，用于加接头的试剂，用于DNA片段环化的试剂，用于线性消化的试剂，用于生物素钓取的试剂，用于DNA片段扩增的试剂。

15.根据项12-14任一项所述的试剂盒，其还包括选自下组试剂中的至少一种以上：用于DNA打断的试剂，用于加核苷酸的试剂，用于DNA片段延伸的试剂，用于核酸纯化的试剂，用于核酸提取的试剂，用于蛋白消化的试剂，用于RNA消化的试剂，用于DNA消化的试剂。

与现有技术相比，本发明的有益效果是：

(1)解决了现有大片段建库方案中测序结果有效数据率偏低的问题，提高了DNA大片段文库的有效数据率。

(2)解决了现有大片段建库方案中没有能够在建库过程中或者测序前提供评价文库质量(尤其是得到的文库是否适合进行测序)的方法的问题，本发明的建库方法使得环化DNA大片段的连接区域具有一个切割位点(质控点)，本领域技术人员能够通过切割该质控点后得到的片段大小变化情况来判断文库质量。

附图说明

图1是实施例1得到的文库进行质检的电泳结果图；

图2是实施例1得到的文库的插入片段大小分布图。

具体实施方式

本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义，如有冲突以本说明书中的定义为准。

首先，在一个方面，本发明提供一种DNA大片段文库的构建方法(本发明的文库构建方法)，包括：

步骤D：将具有黏性末端的DNA大片段进行环化，得到环化DNA大片段。在本说明书中，具有脱氧尿苷(尿嘧啶脱氧核糖核苷酸，Deoxyuridine，简称dU)的接头指含有脱氧尿苷的双链DNA片段。本领域技术人员可以采用任何已知的方法制备具有脱氧尿苷的接头，也可以通过本领域技术人员已知的方法从商业途径可获得的产品制备，还可以原样使用商业途径可获得的产品。对脱氧尿苷的数量和确切位置没有特别的限制，其可以是例如适合USER酶切割并方便其所在的DNA片段形成黏性末端切割的形式。优选的脱氧尿苷的数量为10个以下，更优选的为5个以下。优选的脱氧尿苷的位置为在一条链上，更优选的为在一条链上的靠近3'端的区域。所述“靠近”是指20个bp以内，优选为10个bp以内，更优选为5个bp以内。

在本说明书中，接头通常含有生物素标记。获得带有生物素标记的DNA片段(例如，接头)方法是本领域技术人员已知的，例如可以视情况通过使用含有生物素dNTP和Klenow酶来进行。

在所述步骤B中，对DNA大片段的两端加脱氧尿苷的接头的方法没有特殊限制，可以通过任何本领域技术人员已知的方法来实现，例如，可以通过例如使用具有平末端连接功能的DNA连接酶(例如T4DNA连接酶、T3DNA连接酶)来进行。

在所述步骤C-1中，对具有脱氧尿苷的DNA大片段的切割方法没有限制，可以采用任何合适的酶、化学或光学切割方式都可以用于切割。切割反应可以导致部分的链被切割。合适的切割方法可以采用，例如RNA酶消化(具体的可以如USER酶消化)。例如，可以利用尿嘧啶DNA核苷酶(UDG)除去脱氧尿苷，在DNA片段的一条链上生成无碱基位点(缺口)，然后可以通过核酸内切酶(如，EndoⅣ核酸内切酶、AP裂解酶)、热或碱处理来切割包含缺口的DNA片段，得到具有粘性末端的片段。“黏末端切割”是指为得到具有黏性末端的目标DNA片段而对样本DNA片段进行的切割。为了得到具有黏性末端的目的片段，任何合适的酶、化学或光学切割方式都可以用于切割。合适的切割方法包括，例如，限制性酶消化，在此情况下，所述切割位点是适合于指导双链DNA片段的一条或两条链切割的酶的限制性位点。

在所述步骤C-2中，高温条件还可以是其他适于DNA双链轻度分离的条件，适当的条件例如，在这样的条件不会使长度在20bp以上的DNA片段发生接连反应，但对于在20bp以下的片段则会发生游离。

在所述步骤D中，对具有黏性末端的DNA大片段的环化的方法没有特殊限制，可以通过任何本领域技术人员已知的方法来实现，例如，可以通过使用具有环化功能的DNA连接酶(例如T4 DNA连接酶)来进行。

优选地，本发明的文库构建方法中，连接区域指述环化DNA大片段中除去所述DNA大片段以外的碱基序列。连接区域的碱基序列中包括至少一个切割位点。

在本书明书中，“切割位点”是指一段核苷酸序列，可以设计为允许对两条链进行序列选择性切割的位点，例如限制性内切酶的识别位点。在适当时也可以设计为仅允许对一条链进行序列选择性切割的位点。所述“核苷酸”是指脱氧核糖核苷酸，但是在适当的时候可以是核糖核苷酸。对所述切割位点的长度和确切序列没有特别的限制，其可以是任何所需的序列，例如可以设计为可被任意选定的酶切割。

优选地，本发明的文库构建方法中，所述切割位点指1-20bp的核苷酸序列，优选为酶切位点和/或核酸酶作用位点，例如，Apal的酶切位点为6bp的核苷酸序列5'GGGCC^C3'；可以被UDG酶去除的dU。

此外，还提供了本发明的文库构建方法的更优选的实施方案。本发明的文库构建方法还包括，

在所述步骤D之后进行的步骤E，将所述环化DNA大片段进行线性消化，得到消化后的环化DNA大片段；

步骤H：将测序用DNA片段进行扩增，得到扩增产物，从而构建DNA大片段文库。

在所述步骤E中，线性消化可以通过任何本领域技术人员已知的方法来实现，例如，plasmid safe ATP-Dependent DNase线性DNA消化体系。

在所述步骤F中，DNA片段的打断方式是本领域技术人员已知的，如可以采用超声打断法、转座酶法、液压剪切法，将所述环化DNA大片段进行打断，得到测序用DNA片段。需要说明的是，在本发明中对于步骤E中的“测序用DNA片段”没有特殊限制，从测序仪可接受的角度来看，优选是10～1000bp左右，更优选是20～800bp左右，更优选是30～750bp左右，更优选是40～700bp左右，更优选是50～650bp左右，更优选是100～600bp左右，更优选是150～550bp左右，更优选是300～400bp左右的DNA片段。

在所述步骤G中，对测序用DNA片段进行片段捕获是将带有生物素标记的测序用DNA片段钓取出来，通常采用链霉亲和素化固相载体来完成。所述链霉亲和素化固相载体可以是，例如链霉亲和素化的磁珠。以所述步骤F中得到的带有生物素标记的测序用DNA片段，构建测序用DNA文库。可以采用例如标准Illumina DNA小片段建库方法、PCR free方法、一步法等DNA小片段建库方法来构建所述测序用DNA文库。各种构建测序用DNA文库的方法是本领域技术人员已知的，可以由本领域技术人员按照常规操作来进行。例如，标准IlluminaDNA小片段建库方法通常包括末端修复、末端加A、Adapter连接、扩增、扩增产物纯化等步骤，可以按照Illumina公司推荐的方法来进行。

在所述步骤H中，扩增(PCR，聚合酶链反应)是本领域技术人员熟知的，其一般通过一定的PCR反应程序(温度循环)来实现。所述PCR反应程序一般包括变性、退火、延伸等步骤。对于扩增方法没有特殊限制，只要能够获得对构建测序用DNA文库而言为充足量(例如1ng～1000μg)的扩增产物即可。扩增方法的具体条件可由本领域技术人员视需要适宜选择。

此外，进一步提供了本发明的文库构建方法的更优选的实施方案。本发明的文库构建方法还包括，在步骤B之前进行的步骤A：将固定长度DNA大片段进行末端修复，或者进行末端修复和加A碱基，得到经过处理的DNA大片段；和/或在步骤A之前进行的步骤A-0：将希望进行测序的DNA片段打断，得到DNA大片段。

在所述步骤A-0中，希望进行测序的DNA片段的打断方式是本领域技术人员已知的，如可以采用超声打断法、转座酶法、液压剪切法，将所述希望进行测序的DNA片段大片段化，然后再对目标固定大小的DNA大片段进行回收。需要说明的是，在本说明书中对于“DNA大片段”的大小没有特殊限制，从构建De Novo测序文库的需求或者其他任何需要进行大片段文库的要求来看，可以是是1.5k～30kbp左右的片段，更优选是2k～10kbp左右的片段，更优选是3k～5kbp左右的片段。

在所述步骤A中，末端修复可以通过任何本领域技术人员已知的方法来实现，例如，可以通过使用具有上述功能的DNA聚合酶(例如T4 DNA聚合酶)来进行。加A碱基可以通过任何本领域技术人员已知的方法来实现，例如，可以通过使用具有加A碱基功能的DNA聚合酶(例如缺失3'端到5'端外切酶活性的Klenow片段)来进行。

优选地，本发明的文库构建方法还包括，所述步骤G为步骤H-步骤J，

上述步骤H、I和J均可采用本技术领域的常规方法来进行。

优选地，在本发明的文库构建方法的各个步骤之间例如步骤A-1或步骤A-2与步骤B之间、步骤B与步骤C之间、步骤C与步骤D之间、步骤D与步骤E之间、步骤E与步骤F之间、步骤F与步骤G之间、步骤F与步骤H之间、步骤H与步骤I之间、步骤I与步骤J之间，和/或在步骤J之后可以加入对DNA片段进行纯化的步骤。

该纯化步骤可以采用本技术领域的常规方法来进行，例如可以通过使用纯化磁珠来进行。

在一个方面，本发明提供一种DNA大片段文库的质量检测方法(本发明的质量检测方法)，将通过本发明的文库构建方法得到的测序用DNA片段或扩增产物作为待测样本，所述待测样本包括切割位点，并进行如下步骤：

步骤K：将待测样本进行琼脂糖凝胶电泳，得到待测样本电泳图；

步骤L：将待测样本进行切割处理，得到质检样本；

步骤M：将质检样本进行琼脂糖凝胶电泳，得到质检样本电泳图；

步骤N：请补充判断步骤。

在所述步骤K和步骤M中，对琼脂糖凝胶电泳的条件没有特殊限制，通常采用的实验条件例如浓度在0.5-2％质检的琼脂糖凝胶，TAE和TBE缓冲液，20V/cm以下的电压以及30℃以下的温度等。

在所述步骤L中，对待测样本进行切割处理。任何合适的酶、化学或光学切割方式都可以用于切割。合适的切割方法包括，例如，限制性酶消化(例如，采用HindIII的酶进行的消化)，在此情况下，所述切割位点是适合于指导双链DNA片段的一条或两条链切割的酶的限制性位点(例如，A^AGCTT)。

在一个方面，本发明提供一种DNA大片段文库(本发明的文库)，其可以采用例如本发明的文库构建方法来构建。

此外，在一个方面中，本发明提供一种DNA大片段文库的测序方法(本发明的测序方法)，其中，以本发明的文库作为对象进行测序。本发明的测序方法可以采用本技术领域的常规方法来进行。优选地，本发明的测序方法可以采用双端测序，例如利用Illumina平台(例如HiSeq2500或NextSeq500)进行的双端测序。但在一次测序可以将待测序DNA片段测通的情况下，也可以是单端测序。本发明的文库构建方法可以例如使用试剂盒来实施，因此，在另一个方面，本发明提供一种用于构建DNA大片段文库的试剂盒(本发明的试剂盒)，其可用于实施本发明的文库构建方法。

本发明的试剂盒包括：加接头试剂，所述加接头试剂包括具有脱氧尿苷的接头，切割试剂，所述切割试剂包括具有脱氧尿苷切割功能的酶。优选地，切割试剂选自下组中的至少一种或两种以上：核酸外切酶Ⅰ-Ⅷ、T5核酸外切酶、S1核酸酶、绿豆核酸酶、微球菌核酸酶、BAL-31核酸酶、RecJf核酸外切酶、脱氧核糖核酸酶Ⅰ、Ⅰ型限制性内切酶、Ⅱ型限制性内切酶、Ⅲ型限制性内切酶、HindIII内切酶、BglⅡ内切酶和USER酶。

优选地，所述具有脱氧尿苷的接头在一条链上有一个脱氧尿苷，具有脱氧尿苷切割功能的酶为USER酶。

优选地，本发明的建库试剂盒还包括选自下组试剂中的至少一种或两种以上：用于末端修复的试剂，用于加接头的试剂，用于DNA片段环化的试剂，用于生物素钓取的试剂，用于DNA片段扩增的试剂。上述试剂可以采用任何本领域技术人员已知的试剂，例如，T4DNA聚合酶、Klenow片段、Klenow缓冲液、DNA连接酶缓冲液、DNA连接酶、Taq酶、dNTP、T4多聚核苷酸激酶、以及T4多聚核苷酸激酶缓冲液。

在本发明的建库试剂盒中，各试剂或装置优选单独包装，但在不影响本发明的实施的前提下，也可以混合包装。

实施例

以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例1大片段DNA文库构建

1.DNA样本的大片段处理

1.1取1mL健康人全血按血液基因组DNA提取系统(0.1-20mL)(天根生化科技<北京>有限公司)操作说明书进行提取，得到DNA样本。取5μg DNA样本，使用HydroShear PlusDNA片段化仪按照说明书进行DNA样本的大片段打断处理，目标大片段长度为5kb。

2.末端修复

2.1在1.5mL的离心管中配制末端修复反应体系：

dNTP Mix(dNTP混合物)(10mM each)是含有dATP，dCTP，dGTP和dTTP的钠盐的预混溶液，各自的浓度分别为10mM，总浓度为40mM(pH7.5)。2.2在Thermomixer C恒温混匀仪(EPPENDORF公司，以下简称恒温仪)中20℃温浴30分钟。

2.3用Agencourt AMPure XP beads(BECKMAN COULTER公司，以下简称纯化磁珠)100μL纯化回收DNA，用35μL的EB缓冲液洗脱得到末端修复DNA样品。

3末端加“A”

4 3.1按照下表配制加“A”反应体系:

3.2在恒温仪中37℃温浴30分钟。

3.3用1×纯化磁珠100μL纯化回收DNA，用35μL的EB缓冲液洗脱得到末端修复DNA样品。

4.接头连接

本步采用的具有脱氧尿苷的接头由SEQ ID NO：1和SEQ ID NO：2所示的核苷酸序列组成。接头序列如下所示：

4.1在1.5ml的离心管中配制加接头反应体系：

4.2在恒温仪中25℃温浴15分钟。

4.3配制0.8％的琼脂糖凝胶，使用TIANGEN公司1Kb DNA Ladder为分子量标准，100V电泳2小时。电泳结束后取出凝胶，放入含EB染料的TAE中染色20分钟。紫外照射下对4.8-5.5kb左右的片段进行切胶。

4.4将切下的胶块放入已称重的干净的2.0mL离心管中，用琼脂糖凝胶回收试剂盒进行胶纯化回收DNA。

4.5回收得到加接头DNA大片段样本，用于下步反应或置于-80℃储存。

5.黏性末端生成反应

5.1在1.5ml的离心管中配制黏性末端生成反应体系：

5.2在恒温仪中37℃温浴30分钟。脱氧尿苷被USER酶消化，DNA大片段在原脱氧尿苷所在的单链形成缺口。然后75℃温浴15分钟，后立即置于冰上，使脱氧尿苷所在单链的3'端残留的短DNA单链脱落，从而形成具有黏性末端的DNA大片段。

5.3用1×纯化磁珠纯化回收DNA片段，用35μL的EB缓冲液洗脱得到具有黏性末端的DNA大片段。

6.DNA环化

6.1在1.5mL的离心管中配制环化反应体系：

6.2在恒温仪中16℃温浴30分钟。

7.线性DNA的消化

7.1在反应完的步骤6.1的反应体系中依次加入以下试剂：

7.2在恒温仪中37℃温浴30分钟消化线性DNA。

7.3在恒温仪中75℃温浴10分钟酶失活后置冰上。

7.4加入2μL EDTA(0.5M)到上述反应液中，充分终止消化作用，得到消化后的环化DNA大片段。此步骤得到的环化DNA大片段具有切割位点，为A^AGCTT。

8.环化DNA片段化

8.1使用Bioruptor DNA打断仪按下表打断程序打断环化DNA，得到打断DNA。

打断参数：

目标片段大小	ON/OFF时间(秒)	循环数
			300-400bp	15/30	10

具体操作方法见《Bioruptor标准操作流程》

8.2用1×纯化磁珠回收纯化步骤8.1中的打断DNA，溶于约50μL的EB缓冲液中用于下步反应或置于-80℃储存。

9.纯化生物素标记的DNA

9.1振荡重悬M-280Streptavidin magnetic beads(链霉亲和素磁珠)。

9.2吸取20μL重悬的磁珠置于1.5mL离心管，将离心管放置在磁分离架上等待1分钟，小心吸取弃上清。

9.3用50μL Bead Binding Buffer(磁珠结合缓冲液)洗涤磁珠。小心的重悬沉淀，将离心管放置在磁分离架上，等待1分钟，弃上清。重复步骤9.3一次。

9.4用50μL磁珠结合缓冲液重悬磁珠。

9.5加入来自步骤8.2的结果产物50μL，在恒温仪中20℃温浴15分钟(每2分钟震荡15秒，600rpm)。

9.6将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的Bead WashBuffer Ⅰ(磁珠洗涤缓冲液)洗涤磁珠三次。

9.7将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的EB缓冲液洗涤磁珠两次。

9.8移去最后一次洗涤的EB缓冲液，使用75μL的EB缓冲液重悬磁珠。

10.末端修复

10.1按照下表配制末端修复反应体系:

10.2在恒温仪中20℃温浴30分钟(每2分钟震荡15秒，600rpm)。

10.3将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的磁珠洗涤缓冲液洗涤磁珠三次。

10.4将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的EB缓冲液洗涤磁珠两次。

10.5移去最后一次洗涤的EB缓冲液，使用32μL的EB缓冲液重悬磁珠。

11.末端加“A”

11.1按照下表配制加“A”反应体系:

11.2置于恒温仪中37℃温浴30分钟(每2分钟震荡15秒，600rpm)。

11.3将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的磁珠洗涤缓冲液洗涤磁珠三次。

11.4将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的EB缓冲液洗涤磁珠两次。

11.5移去最后一次洗涤的EB缓冲液，使用18μL的EB缓冲液重悬磁珠。

12.Illumina测序接头连接：

12.1按照下表配制接头连接反应体系：

PE Adapters的碱基序列如下所示：

12.2置于恒温仪中20℃温浴15分钟(每2分钟震荡15秒，600rpm)。

12.3将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的磁珠洗涤缓冲液洗涤磁珠三次。

12.4将离心管放置在磁分离架上，等待1分钟，舍弃上清，用200μL的EB缓冲液洗涤磁珠两次。

12.5移去最后一次洗涤的EB缓冲液，使用21μL的EB缓冲液重悬磁珠。

13.文库扩增

13.1按照下表配制文库扩增反应体系:

引物1及引物2的碱基序列如下所示：

13.2 PCR反应的程序设定如下：

13.3扩增产物使用琼脂糖电泳切胶回收400bp-600bp范围内的片段，获得大片段文库，可用于下步质量评价和测序。

13.4文库质检，片段大小与切胶回收一致，浓度测试符合上机测序要求。

实施例2对实施例1得到的文库进行质量评价

1.1采用限制性内切酶Hind III消化实施例1得到的大片段文库产物。

按照下表配制酶切反应体系：

1.2置于恒温仪中37℃温浴2小时。用琼脂糖凝胶回收试剂盒进行胶纯化回收DNA。

1.3对实施例1的文库产物和步骤1.2的结果产物采用2％的琼脂糖凝胶进行电泳检测，结果如图1所示。

判断标准：当文库酶切后的电泳条带平均值移至原文库条带平均值的大小一半附近，且呈现出比文库条带更为分散的状态，则文库构建成功。

由图1可知，文库片段达效均值约为400bp，酶切后电泳条带变得更为分散，而片段大小均值移至200bp附近，是合格的大片段文库，可以进行上机测序。

实施例3对实施例1得到的文库进行上机测序及测序结果分析

1.1将检测合格的步骤13.3得到的大片段测序文库，在HiSeq 2500测序平台上运行双端测序程序(PE150)，得到下机数据如表1所示。

表1

通过表1可知：Clean reads占Raw reads比例较高，Q30较高，整体测序结果较好。

1.2截取100bp的序列reads进行分析，通过去loxp接头的软件DeLoxer(非专利文献2)去掉本实施例的接头序列，并将Clean reads数据进行分类，分类结果如表2所示。

表2：

Mate-paired数据为通过DeLoxer软件处理后得到的大片段文库中真实的末端配对片段的数值和比率，其是在没有参考基因组情况下可以用于构建基因组骨架的有效数据。本实施例中，有效数据率为可比对数据(Mate-paired pair number)占原始数据(Cleanreads number的一半)的百分比。如表2所示的实施例1所得文库的有效数据率为43％，而这个比率在参考文献2中仅有28.62％。

1.3将步骤1.2所得Mate-paired数据比对到人类参考基因组HG19，每对Mate-paired数据之间的距离对应一个大片段文库中原始大片段的大小(即插入片段大小，Insert size)，Insert size出现的频次强度如图2所示。

由图2可知，实施例1构建的文库的插入片段主峰为4622bp，在期望建库大小5kb±5％以内，与目标大片段长度5kb基本一致。插入片段主峰±20％的范围内插入片段比例为97.52％，即所得文库的插入片段大小主要分布在目标大片段长度5kb附近。

上述说明示出并描述了本发明的优选实施例，如前所述，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

序列表

<110> 安诺优达基因科技（北京）有限公司

<120> 一种构建DNA大片段文库的方法及其应用

<130> 1613-2SDCN

<160> 6

<170> PatentIn version 3.3

<210> 1

<211> 19

<212> DNA

<213> 人工序列

<400>

CGATCGATGCTAGCAAGCT 19

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<400>

AGCdUTGCTAGCATCGATCGT 20

<210> 3

<211> 32

<212> DNA

<213> 人工序列

<400>

GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG 32

<210> 4

<211> 32

<212> DNA

<213> 人工序列

<400>

ACACTCTTTCCCTACACGACGCTCTTCCGATC 32

<210> 5

<211> 38

<212> DNA

<213> 人工序列

<400> 引物1

AATGATACGGCGACCACCGAGATCTACACTCTTTCCCT 38

<210> 6

<211> 38

<212> DNA

<213> 人工序列

<400> 引物2

CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTC 38

Claims

1.一种DNA大片段文库的构建方法，包括：

2.根据权利要求1所述的DNA大片段文库的构建方法，其特征在于，所述环化DNA大片段中除去所述DNA大片段以外的碱基序列为连接区域，所述连接区域包括至少一个切割位点，优选地，所述切割位点为酶切位点。

3.根据权利要求1或2所述的DNA大片段文库的构建方法，还包括

步骤H：将带有生物素标记的测序用DNA片段进行扩增，得到扩增产物，从而构建DNA大片段文库，

优选地，

所述步骤G为步骤H-步骤J，

4.根据权利要求3所述的DNA大片段文库的构建方法，还包括

在步骤B之前进行的步骤A：将固定长度DNA大片段进行末端修复，或者进行末端修复和加A碱基，得到经过处理的DNA大片段；和/或

在步骤A之前进行的步骤A-0：将希望进行测序的DNA片段打断，得到DNA大片段，

优选地，DNA大片段的片段大小为1.5k～30kbp，优选2k～10kbp，更优选3k～5kbp。

5.一种DNA大片段文库的质量检测方法，将通过权利要求1-4任一项所述的DNA大片段文库的构建方法得到的测序用DNA片段或扩增产物作为待测样本，所述待测样本包括切割位点，并进行如下步骤：

步骤L：将待测样本进行切割处理，得到质检样本；

6.一种DNA大片段文库，其是通过权利要求1-5中任一项所述的DNA大片段文库的构建方法构建得到的。

7.一种DNA大片段文库的测序方法，以权利要求9所述的DNA大片段文库作为对象进行测序，优选地，所述测序为双端测序。

8.一种用于构建DNA大片段文库的试剂盒，用于实施权利要求7所述的DNA大片段文库的构建方法，包括

加接头试剂，所述加接头试剂包括具有脱氧尿苷的接头，

切割试剂，所述切割试剂包括具有脱氧尿苷切割功能的酶。

9.根据权利要求8所述的试剂盒，其特征在于，所述具有脱氧尿苷的接头在一条链上有一个脱氧尿苷，具有脱氧尿苷切割功能的酶为USER酶。

10.根据权利要求8或9所述的试剂盒，还包括选自下组试剂中的至少一种或两种以上：用于末端修复的试剂，用于加接头的试剂，用于DNA片段环化的试剂，用于线性消化的试剂，用于生物素钓取的试剂，用于DNA片段扩增的试剂。