CN106459968A

CN106459968A - 用于加工dna底物的改进方法

Info

Publication number: CN106459968A
Application number: CN201580017244.3A
Authority: CN
Inventors: V·马卡洛夫; J·拉利伯特
Original assignee: Swift Biosciences Inc
Current assignee: Integrated DNA Technologies Inc
Priority date: 2014-01-31
Filing date: 2015-01-30
Publication date: 2017-02-22
Anticipated expiration: 2035-01-30
Also published as: EP3099796B1; US20220162672A1; US20210238657A1; EP3604544A1; US20190241935A1; US11203781B2; EP3099796A4; US10316359B2; EP4273264A3; US20160362726A1; ES2908644T3; EP3363904A2; KR20210135343A; EP4039811A1; EP4273264A2; US10316357B2; KR102482592B1; HUE058149T2; AU2015210705A1; AU2015210705B2

Abstract

本发明描述了将衔接体连接至片段化的双链DNA分子的端部的方法。这种新方法克服了向DNA片段的5’端添加磷酸基团的需要。相反，5’末端碱基由于DNA的物理片段化而被破坏。通过去除破坏的碱基，具有5’磷酸的连接相容性碱基暴露并且衔接体连接效率恢复，导致从减少的输入DNA量构建文库的能力和文库产量显著增加。

Description

用于加工DNA底物的改进方法

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2014年1月31日提交的美国临时专利申请号61/934,515和2014年11月11日提交的美国临时专利申请号62/078,309的优先权，所述申请的公开文本各自通过引用其全文纳入本文。

电子提交材料通过引用纳入

本申请包含计算机可读形式的序列表(文件名：47999A_Seqlisting.txt；建立时间2015年1月29日；47,035字节)，其作为公开内容的独立部分，并且通过引用其全文纳入本文。

引言

所有市售的新一代测序(NGS)技术均需要文库制备，由此，使特定的衔接体序列(adapter sequence)对连接至DNA片段的端部，以允许通过仪器进行测序。大多数NGS衔接体包含三个功能结构域：(1)用于文库和克隆扩增的独特PCR引物退火序列，(2)独特测序引物退火序列，和(3)独特样品索引序列。目前，大多数平台采用克隆扩增，以产生各个体DNA文库分子的数百种拷贝。这通过桥式扩增或乳液PCR来实现，其目的是扩增产生的信号，以用于针对各文库分子的具体序列检测模式(例如，荧光或pH)。对于通过合成的测序，测序引物的退火域并置于衔接体插入物接合处；为了允许配对末端测序，各衔接体具有用于引物退火的独特序列。样品索引序列(index sequence)包含短独特序列，通常在6-8个碱基，从而在经测序时，鉴定具体序列读数的样品来源，以允许多重测序或共同测序样品。现有并不断涌现单一分子测序技术，其不依赖于用于信号检测的克隆扩增，但仍需要将衔接体序列连接至其末端以用于其它目的，例如，向DNA双链体添加末端发夹环以允许对作为单一分子的两条链进行测序，或引入前导序列以用于纳米孔进入。

靶向的新一代测序由如下两种领导性技术涵盖：扩增子测序和全基因组文库的靶标杂交-捕获富集。扩增子测序是为了快速周转时间而选择的方法，因为减少了步骤的数量，其用于所需的目标基因座的组的数量显著小于全外显子组时，并且用于大量节省制备性试剂和测序深度方面的总体成本。扩增子测序由多种可用技术代表。这些的示例包括1.多重PCR，其采用可降解的靶标特异性引物以消除引物二聚体，随后进行精加工和NGS衔接体连接，其中，重叠的靶标被分入分开的管中(离子激流AmpliSeq)；2.多重延伸-连接反应，其将NGS衔接体引至各靶标特异性寡核苷酸对的末端处，随后进行NGS衔接体介导的PCR扩增，总之这避免了多重PCR；然而，连接介导的PCR需要较高的输入DNA的量(IlluminaTSCA)；3.微流体室上进行的多重PCR，其将引物对分开，以避免形成引物二聚体，并且允许重叠的目标基因座；分开的反应需要较高的输入DNA的量(Fluidigm访问阵列)；4.通过数字微滴式PCR进行的多重PCR，其也将引物对分开以避免形成引物二聚体，并允许重叠的目标基因座；同样地，其需要较高的输入DNA的量(Raindance)。各技术经设计以消除引物二聚体或避免其在多重扩增过程中形成，为了避免所得的NGS扩增子文库被这些矫作物主导。现有方法的缺点是：A.微流体或数字微滴式仪器与耗材的高成本，B.较高的输入量需求；和C.必须分开多重反应，其中需要重叠或连续的覆盖范围，因此进一步增加了输入量需求。当需要连续覆盖时，这些选项的替代方式是进行长片段PCR。然而，长片段PCR难以多重化，并且分开NGS文库制备之后的大多数测序平台所需的后续片段化既耗时间又费成本。本领域需要扩增子生成的简单方法，其允许约10纳克(ng)DNA的低输入，不需要除热循环仪以外的仪器，并且，当需要连续覆盖时，无关于靶标是不是分开的热点基因座，或者靶标是不是基因组的重叠区域。本文所述的组合物和方法提供了满足该需求的方案。

通常，NGS DNA文库的制备涉及5个步骤：(1)DNA片段化、(2)精加工、(3)衔接体连接、(4)尺寸选择，和(5)文库扩增(参见图1和2)。

(1)片段化：DNA片段化可通过酶促消化或物理方法，例如声处理、雾化或水动力剪切来进行。各片段化方法具有其优势和限制。酶促消化产生DNA端部，其可被高效地精加工并连接至衔接体序列。然而，难以控制酶促反应并产生具有可预测长度的片段。此外，酶促片段化常常是碱基特异性的，因此向序列分析中引入表示偏差(representation bias)。使DNA片段化的物理方法更加随机，并且DNA大小分布可能更易被控制，但由物理片段化产生的DNA端部是被破坏的，并且常规精加工反应不足以产生充分连接相容性端部。

(2)精加工：典型的精加工混合物包含T4DNA聚合酶和T4多核苷酸激酶(PNK)。T4DNA聚合酶的5'-3'聚合酶和3'-5'核酸外切酶活性切下3’突出，并填充3’凹陷的端部，这导致切除破坏的3’碱基并且精加工(产生钝端)DNA端部。精加工混合物中的T4多核苷酸激酶将磷酸添加至DNA片段的5’端，其可能对此有所缺乏，因而使其与NGS衔接体连接-相容。

本领域依然未知的是，由物理片段化产生的大量5’端以不明方式被破坏，并且不被PNK磷酸化。常规精加工混合物中没有能够修剪被破坏的5'末端碱基的酶。由此，制备中的大量DNA片段部分没有被转化成NGS文库分子，因为它们的5'末端处仍保持与NGS衔接体连接不相容。尽管本领域已知，衔接体连接是无效的，但连接通常在两条链上同时进行，从而仍然未知哪一条链是受限的。我们将反应分成链特异性连接，以分别测试其各自的效率。通过该分析，我们能够查明对于5'末端的总体过程中的速率限制步骤，其对于大量DNA片段部分，对于PNK以及衔接体连接而言是较差的底物。

(3)衔接体连接：除缺乏5’磷酸基团之外，促成低NGS文库产率的另一个因素是连接反应本身。在连接之前，通常进行的是采用缺乏3'-5'核酸外切酶活性的DNA聚合酶对于修复的DNA进行的腺苷酰化，以使嵌合体形成以及衔接体-衔接体(二聚体)连接产物最小化。在这些方法中，单一3’A-突出DNA片段被连接至单一5’T-突出衔接体，而A-突出片段和T-突出衔接体具有对于自身连接而言不相容的粘性端部。然而，腺苷酰化反应不完整的，并且产生非特异性副产物，这进一步减少了可用于连接的分子的数量，从而降低了文库生成。本文中提供了更高效的替代性方法，以使多联体形成最小化。

(4)尺寸选择：尺寸选择过程也影响文库生成。在尺寸选择过程中，通过基于凝胶或珠的选择方式将具有不需要的尺寸的片段从文库消除，以使文库插入物大小(insertsize)对于所需的测序读取长度最优化。这通过使从短DNA文库插入物发生的成对末端测序的重叠最小化而使序列数据输出最大化。在样品具有极其有限的输入量的情况中，可跳过该步骤，并且，为了换取更高程度的成对端部重叠，对更多的稀有片段测序。

(5)扩增：低文库产量的问题导致必须在NGS分析之前通过PCR扩增文库，这导致文库复杂性的丧失和碱基组成偏差的引入。目前用以避免该问题的唯一方案是采用较高量的输入DNA用于文库制备，但提交用于NGS分析的高达20％的临床样品的DNA量不足，于是要替代性地进行额外的PCR循环来克服DNA输入的不足。这导致因存在不可接受的PCR重复百分比而造成减少的序列数据。

发明内容

为了解决上文所述的造成NGS文库构建的低产量的现存问题，提供了增强的衔接体连接方法。这一新方法克服了向DNA片段的5’端添加磷酸基团的必要性(这是常规衔接体连接所需的；参见图1和2)。作为替代，将DNA的物理片段化造成的破坏的5'末端碱基移除。通过移除所述破坏的碱基，暴露了具有5’磷酸的连接相容性碱基，并且恢复了衔接体连接效率，这导致文库产量的显著增加和从减小的输入DNA的量构建文库的能力。此外，引入了用于防止嵌合文库插入物(连接过程中的多联体形成)和形成衔接体二聚体连接产物的腺苷酰化/TA连接的替代物，这也促成较高的文库制备产量。在本文所述方法的任何实施方式中，所述加工包括将底物分子的5'和/或3'末端转化成连接相容性形式。

该方法，在其示例性形式中，包含四个分开的孵育(参见图3、4和5)，以产生经加工的底物分子。在第一孵育中，在合适的反应条件下将双链的片段化的DNA与磷酸酶合并，所述酶从所述DNA片段的末端移去磷酸基团。这通过防止后续连接反应中形成DNA片段多联体来防止嵌合文库插入物的产生。

在第二孵育中，将去磷酸化的DNA片段与具有3'-5'核酸外切酶活性的聚合酶或聚合酶混合物合并。在合适的反应条件下且在dNTP存在下，通过切除物理片段化过程中产生的3’突出并填充3’凹陷的端部，修正破坏的3’碱基，并且实现对于双链的DNA片段的精加工。在该步骤完成时，DNA片段具有钝端，其具有缺乏磷酸基团的连接相容的3’末端和5'末端，因此使得所述DNA片段无法自身连接。

在第三孵育中，将所述钝端的双链DNA片段与DNA连接酶以及第一双链钝端的NGS衔接体(3'衔接体)合并，所述第一双链钝端的NGS衔接体包含5’磷酸，并且其能够连接至所述DNA片段的3’端(参见图3)。该3’衔接体的特殊特点是：所述衔接体DNA链(其通常会同时连接至DNA片段的5’端)具有防止连接的3’端修饰，因此，在连接反应之后，甚至在5’磷酸存在的情况下，在各DNA片段的5'末端和3’衔接体的3’端的接合处仍保留缺口(nick)。所述防止连接至DNA片段的5’末端的同一3’修饰还能防止形成衔接体-衔接体连接产物，尽管它们将包含单一衔接体序列，其不会是功能衔接体二聚体(功能二聚体包含两个衔接体)。该步骤的产物是具有单一NGS衔接体的双链DNA片段，所述单一NGS衔接体连接至两个3’末端的仅一个链。

在第四孵育中，留下的尚未连接至DNA片段(归因于3’修饰)的3’衔接体的链也是可置换或可降解的，这归因于寡聚体合成过程中可降解碱基的引入。在第四孵育过程中，在任选的、合适的酶的存在下，所述3’衔接体链被降解或被(新的单链衔接体)置换(displace)，所述新的单链衔接体包含第二NGS衔接体序列，其也存在于所述反应中(5'衔接体，参见图3)，并且，通过位于衔接体-插入物的接合处的3’衔接体的互补序列，单链的5’衔接体退火至所述3’衔接体的所述互补部分，其连接至双链DNA片段的3’端，这导致缺口或间隙(gap)的恢复。此外，在反应是具有5'-3'核酸外切酶活性的DNA聚合酶的情况中，并且在dNTP、连接酶和合适的反应条件的存在下，在位于5’衔接体和DNA片段的5’末端的接合处的缺口或间隙处起始缺口平移(nick translation)。缺口平移导致破坏的5'末端碱基(和5’末端内部的一个或多个其它碱基)被替代，并且暴露连接相容性5'末端磷酸基团。随后，当连接酶封闭该缺口，所述缺口被译为一个或多个碱基时，发生5’衔接体与DNA底物分子的高效连接(参见图4)。在该新式衔接体连接方法完成时，各双链DNA片段的两个端部均被两个不同的单链NGS衔接体侧接，所述不同的单链NGS衔接体共有位于衔接体插入物接合处的短互补衔接体序列。

或者，5'末端碱基的去除和5’衔接体连接可在不经聚合的情况下，通过使单链的5’衔接体退火来实现，所述单链的5’衔接体在其3'末端具有一个或多个额外随机碱基，其与底物分子的破坏的5’碱基重合，并且，在不存在dNTP的情况下，在置换之后发生5’侧翼特异性核酸酶对位于DNA底物分子的5’末端处的被置换的碱基的切割，这导致第二NGS衔接体与经切割的DNA底物分子的末端上的暴露的5’磷酸的高效连接(参见图5)。

在另一个可选情况中，5'末端碱基移除和5’衔接体连接可通过如下方式来实现：从3’衔接体的可降解的或可置换的链的单一双脱氧碱基延伸，随后由聚合酶的5’侧翼核酸内切酶活性切割DNA片段的5'末端碱基。然后，该链被降解或被5'衔接体置换，并且在连接酶的存在下，5’衔接体高效地连接至DNA片段上暴露的5’磷酸。该步骤和先前步骤的替代性实施方式如下文所示。

因此，在一个方面中，本发明提供一种产生经加工的底物分子的方法，所述方法包括：(i)连接第一多核苷酸至底物分子的3’末端，所述底物分子是至少部分双链的；(ii)在促进退火的条件下，使第二多核苷酸退火至第一多核苷酸；(iii)从所述底物分子的5’末端切下至少一个核苷酸；和然后(iv)将第二多核苷酸连接至所述双链的底物分子的5’末端，以产生经加工的底物分子。在一个实施方式中，所述方法还包括如下步骤，在步骤(i)之前，使所述底物分子与磷酸酶接触。在另一个实施方式中，所述方法还包括如下步骤：通过使所述底物分子与具有3’-5’核酸外切酶活性的聚合酶接触，来使所述底物分子具有钝端。而在另一个实施方式中，所述方法还包括如下步骤：使所述底物分子与模板非依赖性聚合酶接触，以使所述底物分子的3’端腺苷酸化。

在本文所述的任何方法中，设想所述底物分子是天然产生的或所述底物分子是合成的。在一个实施方式中，所述底物分子是天然产生的。在另一个实施方式中，所述底物分子是基因组DNA，并且在另一实施方式中，所述基因组DNA是真核的或原核的。在其中所述底物分子是基因组DNA的实施方式中，本发明设想所述基因组DNA是体内或体外片段化的。在一些实施方式中，所述体外片段化通过选自下组的方法进行：剪切、用核酸内切酶切割、声处理、加热、采用α、β或γ源的辐照、在金属离子存在下进行化学切割、自由基切割，及其组合。在一些实施方式中，所述体内片段化通过选自下组的方法发生：凋亡、辐照，和石棉接触。

本发明还设想如下实施方式，其中所述底物分子是合成的，并且选自下组：cDNA、通过全基因组扩增产生的DNA、包含至少一个双链末端的引物延伸产物，和PCR扩增子。

在本发明的任何方面或实施方式中，设想所述第一多核苷酸是至少部分双链的，并且包含寡核苷酸1和寡核苷酸2。在一些实施方式中，第二多核苷酸退火至寡核苷酸1，并且在另一实施方式中，所述退火导致第二多核苷酸与底物分子之间的缺口、间隙，或重叠碱基。在一些实施方式中，退火导致寡核苷酸1和寡核苷酸2的去杂交。

在不同的实施方式中，使第二多核苷酸与聚合酶接触，导致寡核苷酸2的降解。

本发明还设想如下实施方式，其中，寡核苷酸2包含易于降解的碱基，并且本发明还提供如下实施方式，其中，寡核苷酸2包含位于其3’末端的封闭基团，该封闭基团防止连接。在一些实施方式中，所述第二多核苷酸包含修饰的碱基。

在另一实施方式中，本发明的方法还包括：(i)将第三多核苷酸连接至至少部分双链的另一底物分子的3’末端；(ii)在促进退火的条件下使第四多核苷酸退火至第三多核苷酸；(iii)从所述另一底物分子的5’末端切下至少一个核苷酸；和，然后(iv)将所述第四多核苷酸连接至所述双链的另一底物分子的5’末端，以产生经加工的另一底物分子。在一些实施方式中，第一多核苷酸和第三多核苷酸是相同的。在一些实施方式中，第二多核苷酸和第四多核苷酸是相同的。

靶向扩增子NGS文库构建的方法包括两个分开的步骤：多重PCR目标富集，随后是NGS衔接体连接步骤(参见图39)。两个分开的工作流选项是可行的：两步PCR随后进行衔接体连接或一步PCR随后进行连接。

在采用其任意方法的多重PCR步骤中，根据所需的目标基因座设计靶标特异性引物对，并且所述靶标特异性引物对在其5'末端包含通用截短型NGS衔接体序列(参见图40和41，表2)。第一PCR循环具有延长的循环时间，以允许引物对具有高复杂性，其各自处于低浓度，以从其靶序列产生带有通用NGS衔接体标签的扩增子。这些引物任选地具有独特的简并序列标签，以鉴定个体扩增子(UI＝独特标识物)，其中各UI位于各引物的5'末端的通用NGS衔接体序列和3'末端的靶标特异性部分之间(并且表示为NNNN碱基的延伸，图40、41)。如果采用UI序列，则将延长的多重PCR循环限制至2次，以避免使额外的UI序列纳入先前产生的扩增子的拷贝中；如果不采用UI序列，则延长的多重PCR循环可进行多于2次循环。进行的靶标特异性循环数越受限制，累积的引物二聚体产物越少，因此应进行对于输入样品的量可行的最小数量的多重循环。在多重循环(2次或更多次)之后，采用较短的延长时间的第二阶段的扩增继续PCR，其中采用单一的通用引物，所述单一的通用引物对应于侧接各靶标扩增子的通用截短型NGS衔接体。相较于靶标特异性引物，所述通用引物以相对较高的浓度采用，其中总循环数通过所需的文库产量来确定。靶标特异性引物的浓度不足以扩增靶标，因此无法自身相互作用的通用引物掌管了扩增反应，其中没有额外引物二聚体形成。此外，在有限的多重循环过程中累积的引物二聚体将在长度上短于所需的扩增子，并且将受制于稳定的二级结构，这导致通过单一通用引物进行的较低效的扩增。如果采用UI序列，则在添加通用引物之前需要进行多重引物的核酸外切酶I消化或纯化步骤，以防止额外UI序列标记先前产生的扩增子的后续拷贝。如果不采用UI序列，可在采用多重引物的反应开始时添加通用引物，并且所述通用引物可在带有通用衔接体标签的扩增子产生后行使功能。

通用引物的另一个特点是，其任选地包含可切割的碱基，以允许下游衔接体连接。不意在限制，所述可切割的碱基可包含脱氧尿嘧啶、RNA或脱氧次黄苷。或者，所述通用引物不包含可切割的碱基，并且序列在之后采用5'核酸外切酶切除，以允许衔接体连接(参见图42)。此外，两种靶标特异性引物和通用引物任选地在其3’末端包含核酸酶抗性修饰；这些包括硫代磷酸酯连接、2'O-甲基或甲基膦酸酯修饰。在采用具有3’到5'核酸外切酶活性的校对聚合酶时，这些允许更高特异性且高效的引物功能。如果采用该酶来在衔接体连接之前从扩增子移除通用衔接体序列，其还限制5'核酸外切酶消化。在PCR之后，需要纯化步骤来去除未利用的试剂和聚合酶。

对于衔接体连接的最终步骤(参见图42)，将源自通用引物的各扩增子的部分消化，这归因于可降解的碱基在引物中的纳入和修饰特异性核酸内切酶的采用。或者，对于在其3’端包含核酸酶抗性碱基的引物，各扩增子的5’部分可通过5'核酸外切酶消化来修整。在该情况中，扩增子的5’末端的核酸外切酶消化将止于抗核酸酶的碱基的位置。引物消化反应在各扩增子的两个末端均产生单链的3’突出。该反应中同时存在的是全长、单链的衔接体B，其包含第二NGS衔接体序列，并且通过位于衔接体-靶标接合处的通用衔接体的互补序列，所述单链的第二衔接体B退火至位于各扩增子的3’突出处的通用衔接体的互补部分，其中，衔接体退火导致缺口或间隙的形成。此外，在反应是具有5'-3'核酸外切酶活性的DNA聚合酶的情况中，并且在dNTP、连接酶和合适的反应条件存在下，在位于扩增子的5'末端和衔接体B的接合处的缺口或间隙处起始缺口平移。缺口平移导致5’末端内部的一个或多个碱基的替代，并且暴露连接相容性5'末端磷酸基团。随后，当连接酶封闭该缺口，所述缺口被译为一个或多个碱基时，发生衔接体B与DNA底物扩增子的高效连接。或者，衔接体B的连接采用置换-切割(displacement-cleavage)反应来完成，所述置换-切割反应采用具有侧翼核酸内切酶活性的聚合酶，以及额外地，连接酶。在该情况中，不需要dNTP，仅仅衔接体B的3'末端和通用衔接体部分的5'末端之间的数个碱基重叠留在各扩增子上。为了完成衔接体连接过程，同时进行接头介导的连接，以使留在各扩增子3’端处的剩下的通用衔接体序列上的第1衔接体(A)完整。接头寡核苷酸与各扩增子上的剩下的通用衔接体的3'末端互补，并且与包含第一衔接体的剩余部分的寡核苷酸互补。通过其对于两种序列的互补性，该接头寡核苷酸杂交至第1衔接体的3’剩余部分和各扩增子上存在的剩下的通用衔接体，从而允许连接发生。在该新型衔接体连接方法完成时，各扩增子的两个端部通过两个不同的、单链的NGS衔接体(A和B)侧接，所述两个不同的、单链的NGS衔接体(A和B)共有位于衔接体靶标接合处的短互补衔接体序列。然后，在文库定量和测序之前，进行最终纯化步骤。

本文公开的方法的另一特点是，选择多重PCR扩增反应中所用的DNA聚合酶。当采用高保真Pfu DNA聚合酶、Phusion DNA聚合酶、KAPA HiFi DNA聚合酶、Q5DNA聚合酶或其衍生物和类似物时，可改善扩增过程中的出错率。此外，鉴于第二阶段的扩增反应中所用的通用引物任选地包含可切割的碱基，耐受尿嘧啶、RNA或肌苷碱基的高保真DNA聚合酶也是理想的。这包括但不限于KAPA HiFi U+聚合酶、Themo Phusion U和Enzymatics VeraSeqULtra聚合酶，其均经工程改造以耐受含尿嘧啶底物。鉴于在扩增反应中使用了具有3’到5'核酸外切酶活性的高保真酶，所有靶标特异性引物以及通用引物在其3’末端包含抗核酸酶的连接，以提高引物延伸的保真度和效率。这包括但不限于硫代磷酸酯连接或其它抗核酸酶的部分。

此外，如前所述，用于能够扩增用于单一管形式中的连续覆盖的重叠靶标的靶向NGS文库的多重PCR的方法是所需的。本文公开的方法能够实现该作用(图43和44)。在具有重叠目标区域的两个引物对的情况中，可产生4个可能的扩增子：对于所述两个引物对各自具有特异性的扩增子、由两个远端引物的扩增产生的大扩增子，和由两个近端引物的扩增产生的小扩增子。为了避免让小扩增子主导多重PCR反应(例如，所述的短扩增子和引物二聚体常常主导扩增反应，这归因于其较短长度和易于扩增的性质)，大多数方法将重叠引物对分入两个管，这虽有效，但会使工作量和所需的DNA输入量加倍。本文所述的方法允许重叠扩增子在单一管中产生，因为鉴于各末端处通用序列的存在，所述短小扩增子将受制于稳定的二级结构，其导致通过单一通用引物的较低效的扩增。因此，即便小扩增子在最初靶标特异性PCR循环过程中产生，其也不会被高效地扩增。由此，采用本文所述的方法，仅仅对各引物对具有特异性的扩增子和大扩增子由高质量、高分子量DNA输入产生。当采用交联的FFPE DNA或片段化的DNA(尤其是165bp范围内的循环无细胞DNA)时，大扩增子(maxi-amplicon)的形成被遏制，因为模板长度或完整性无法支持该大小的扩增子，并且仅产生对各引物对具有特异性的扩增子。

在本文所述的任何方法中，设想所述样品DNA输入是天然产生的。在一个实施方式中，输入DNA是基因组DNA，其为完整高分子量DNA或片段化的循环无细胞DNA，而在另一实施方式中，所述基因组DNA是真核、原核、线粒体或病毒来源的。在其它实施方式中，输入DNA是单链或双链的，或者是合成的，并且来自先前的全基因组扩增或来自随机或其它情况下的引导的RNA逆转录。

在本发明的另一方面中，提供一种组合物，其包含连接酶和第一多核苷酸，所述第一多核苷酸是至少部分双链的且包含寡核苷酸1和寡核苷酸2；其中，寡核苷酸1包含5’磷酸和位于其3’末端的封闭基团；并且其中，寡核苷酸2(i)包含易于降解的碱基，和/或(ii)可通过非变性热条件被置换，并且还包含位于其3’末端的封闭基团，所述封闭基团阻止寡核苷酸1的3’端的连接但允许5’端的连接。

在一些实施方式中，寡核苷酸2的3'封闭基团是3’脱氧胸腺嘧啶、3'脱氧腺嘌呤、3'脱氧鸟嘌呤、3'脱氧胞嘧啶或双脱氧核苷酸。在另一实施方式中，易于降解的碱基是脱氧尿嘧啶、核糖核苷酸、脱氧次黄苷，或肌苷。在不同的实施方式中，非变性热条件是约50℃至约85℃。

在一些实施方式中，寡核苷酸2包含碱基修饰，所述碱基修饰降低寡核苷酸2的结合稳定性，其中，所述碱基修饰是脱氧次黄苷、肌苷或通用碱基。

在一些方面中，本发明还提供一种组合物，其包含：连接产物，所述连接产物由双链底物与本发明的组合物进行孵育所产生；连接酶、具有缺口平移活性的DNA聚合酶、识别易于降解的碱基的核酸内切酶，和第二多核苷酸，所述第二多核苷酸是单链的并且包含3’域，其与多核苷酸2的寡核苷酸1的5’部分足够互补，以在多核苷酸1的寡核苷酸2被降解或置换时在合适的条件下退火。

在一些实施方式中，所述第二多核苷酸具有足够的长度以置换第一多核苷酸的寡核苷酸2的位置，或所述第二多核苷酸包含增加其结合稳定性的碱基修饰。在其他实施方式中，所述核酸内切酶选自下组：UDG加核酸内切酶VIII、RNA酶HI、RNA酶H2和核酸内切酶V。而在其他实施方式中，所述连接酶是大肠杆菌DNA连接酶或T4DNA连接酶。在不同的实施方式中，增加其结合稳定性的碱基修饰是锁核酸(LNA)。

在本发明的另一方面中，提供一种组合物，其包含连接产物，所述连接产物由双链底物与本发明的组合物的孵育产生；连接酶；侧翼核酸内切酶；识别易于降解的碱基的核酸内切酶；第二多核苷酸，所述第二多核苷酸包含含有3’域的单链的寡核苷酸，其与多核苷酸2的寡核苷酸1的5’部分足够互补，以在多核苷酸1的寡核苷酸2被降解或置换时在合适的条件下退火，其中，所述第二多核苷酸具有足够的长度以置换第一多核苷酸的寡核苷酸2的位置，或者所述第二多核苷酸包含增加其结合稳定性的碱基修饰，并且其中，所述第二多核苷酸还包含3’末端简并碱基。

在另一方面中，本发明提供一种产生经加工的底物分子的方法，所述方法包括：(i)连接第一多核苷酸至底物分子的3’末端，所述底物分子是至少部分双链的；(ii)在促进退火的条件下，使第二多核苷酸退火至第一多核苷酸；(iii)从所述底物分子的5’末端切下至少一个核苷酸；然后(iv)将第二多核苷酸连接至所述双链的底物分子的5’末端，以产生经加工的底物分子。在一些实施方式中，所述方法还包括如下步骤，在步骤(i)之前，使所述底物分子与磷酸酶接触。

在一些实施方式中，所述磷酸酶是牛小肠磷酸酶或虾磷酸酶。

在其它实施方式中，所述方法还包括如下步骤：通过使所述底物分子与具有3’-5’核酸外切酶活性的聚合酶接触，来使所述底物分子具有钝端。

在一些实施方式中，所述聚合酶选自下组：T4DNA连接酶、Klenow片段、T7聚合酶，及其组合。而在另一实施方式中，所述方法还包括如下步骤：使所述底物分子与模板非依赖性聚合酶接触，以使所述底物分子的3’端腺苷酸化。

在不同的实施方式中，所述底物分子是天然产生的或所述底物分子是合成的。因此，在一些实施方式中，所述底物分子是天然产生的。在其他实施方式中，所述底物分子是基因组DNA。而在其他实施方式中，所述基因组DNA是真核或原核的，而在其它实施方式中，所述基因组DNA是体内或体外片段化的。一些实施方式中，所述底物分子是循环无细胞DNA。

在一些实施方式中，所述方法还包括，在步骤(i)之前，调节温度至约50℃～约85℃。在一些实施方式中，所述温度是65℃。

在其它实施方式中，所述体外片段化通过选自下组的方法进行：剪切、用核酸内切酶切割、声处理、加热、采用α、β或γ源的辐照、在金属离子存在下进行化学切割、自由基切割，及其组合。在其它实施方式中，所述体内片段化通过选自下组的方法发生：凋亡、辐照，和石棉接触。

在其它实施方式中，所述底物分子是合成的，并且选自下组：cDNA、通过全基因组扩增产生的DNA、包含至少一个双链末端的引物延伸产物，和PCR扩增子。

在一些实施方式中，所述第一多核苷酸是至少部分双链的，并且包含寡核苷酸1和寡核苷酸2。在不同的实施方式中，所述第二多核苷酸退火至寡核苷酸1。在一些实施方式中，所述退火导致第二多核苷酸和所述底物分子之间的缺口、间隙，或重叠碱基。

在一些实施方式中，寡核苷酸2包含易于降解的碱基。在其他实施方式中，所述易于降解的碱基选自下组：脱氧尿嘧啶、RNA、脱氧次黄苷，和肌苷。而在其他实施方式中，寡核苷酸2包含位于其3’末端的封闭基团，该封闭基团防止连接。在不同的实施方式中，所述封闭基团是3’脱氧核苷酸或双脱氧核苷酸。

在一些实施方式中，所述第二多核苷酸包含修饰的碱基。

在其它实施方式中，退火导致寡核苷酸1和寡核苷酸2的去杂交。

而在另一实施方式中，所述方法还包括：(i)将第三多核苷酸连接至至少部分双链的另一底物分子的3’末端；(ii)在促进退火的条件下使第四多核苷酸退火至第三多核苷酸；(iii)从所述另一底物分子的5’末端切下至少一个核苷酸；和，然后(iv)将所述第四多核苷酸连接至所述双链的另一底物分子的5’末端，以产生经加工的另一底物分子。

在一些实施方式中，第一多核苷酸和第三多核苷酸是相同的。在其他实施方式中，第二多核苷酸和第四多核苷酸是相同的。

在另一方面中，本发明提供一种组合物，其包含通用引物和多个靶标特异性寡核苷酸引物对；其中，所述多个引物对的各靶标特异性引物包含靶标特异性序列和5'末端序列，其不与靶标底物分子互补；其中，所述通用引物包含所述5'末端序列和可切割的碱基或抗核酸酶的修饰；其中，所述多个引物对的各靶标特异性引物和所述通用引物各自在其3’末端包含抗核酸酶的修饰；耐受引入所述通用引物的可切割的碱基的高保真聚合酶；其中，所述靶标特异性引物对和所述通用引物在相同温度退火至其靶标底物分子；并且其中，靶标特异性引物与通用引物的摩尔比是至少约1:100。

在一些实施方式中，所述可切割的碱基是脱氧尿嘧啶、RNA、脱氧次黄苷，或肌苷。在其他实施方式中，所述抗核酸酶的修饰是硫代磷酸酯。

在其它实施方式中，至少一种靶标特异性引物还包含所述靶标特异性序列和所述5’末端序列之间的分子鉴定标签。

在本发明的不同的实施方式中，靶标特异性引物与通用引物的摩尔比是至少约1:200，或至少约1:300，或至少约1:400，或至少约1:500，或至少约1:1000，或至少约1:2000，或至少约1:3000，或至少约1:5000，或至少约1:10,000或更高。

在不同的实施方式中，所述组合物还包含底物分子。

在一些方面中，提供一种组合物，其包含通过通用引物产生的聚合酶链式反应(PCR)产物，其中，所述产物包含通过所述通用引物引入的至少一个可切割的碱基；能够切割所述可切割的碱基的核酸内切酶；(i)至少一种核苷酸和具有缺口平移活性的DNA聚合酶，或(ii)具有侧翼核酸内切酶活性的酶；DNA连接酶；5’衔接体，所述5’衔接体包含(i)与通过所述通用引物的核酸内切酶切割暴露的所述通用引物的反向互补序列的5’部分互补的3'序列，和(ii)不与所述通用引物的反向互补序列互补的5’部分；并且其中，所述通用引物的反向互补序列的3’部分退火至部分双链的截短型3'衔接体。

在一些实施方式中，所述核酸内切酶选自下组：UDG+核酸内切酶VIII、RNA酶HI、RNA酶H2，和核酸内切酶V。在其他实施方式中，所述DNA连接酶是大肠杆菌DNA连接酶或T4DNA连接酶。

在另一方面中，本发明提供一种组合物，其包含：通过通用引物产生的聚合酶链式反应(PCR)产物，其中，所述产物包含通过所述通用引物引入的至少一个抗核酸酶的修饰；5’核酸外切酶，所述5’核酸外切酶无法越过所述抗核酸酶的修饰来消化所述PCR产物；(i)至少一种核苷酸和具有缺口平移活性的DNA聚合酶，或(ii)具有侧翼核酸内切酶活性的酶；DNA连接酶；5’衔接体，所述5’衔接体包含(i)与通过所述通用引物的核酸内切酶切割暴露的所述通用引物的反向互补序列的5’部分互补的3'序列，和(ii)不与所述通用引物的反向互补序列互补的5’部分；并且其中，所述通用引物的反向互补序列的3’部分退火至部分双链的截短型3’衔接体分子。

而在其它方面，提供一种聚合酶链式反应(PCR)的方法，所述方法包括使底物分子与如下物质接触：(i)靶标特异性引物对，其中各引物包含不与底物分子互补，并且将单一通用衔接体引入到所得的扩增子的末端处的5'序列；和(ii)单一引物，所述单一引物包含所述单一通用衔接体序列，并且还包含可切割的碱基或抗核酸酶的修饰，其中，在合适的反应条件下，在高保真DNA聚合酶和核苷酸的存在下，PCR的各循环采用恒定退火温度，但应用不同的退火时间，其中，各靶标特异性引物与通用引物的摩尔比是至少约1:100，靶标特异性扩增子在具有5分钟或更长的退火时间的前两个或更多个PCR循环的过程中产生，随后在剩下的PCR循环中扩增所得的扩增子，所述剩下的PCR循环各包含1分钟或更短的退火时间，其中，实现通过较高浓度单一通用引物进行所述靶标特异性扩增子的扩增。

在其它方面中，提供一种多重PCR的方法，所述方法包括：使底物分子与如下物质接触：(i)多个靶标特异性引物对，其中，各引物包含不与所述底物互补且将单一通用衔接体引入至所得的扩增子的末端处的5'序列，和(ii)单一引物，所述单一引物包含所述单一通用衔接体序列，并且还包含可切割的碱基或抗核酸酶的修饰，其中，在合适的反应条件下，在高保真DNA聚合酶和核苷酸的存在下，各PCR循环采用恒定退火温度，但应用不同的退火时间，其中，各靶标特异性引物:通用引物的摩尔比是至少约1:100，靶标特异性扩增子在具有5分钟或更长的退火时间的前两个或更多个PCR循环过程中产生，随后在剩下的PCR循环过程中扩增所得的扩增子，所述剩下的PCR循环各包含1分钟或更短的退火时间，其中，实现通过较高浓度单一通用引物进行的所述靶标特异性扩增子的多重扩增。

在一些方面中，提供转化聚合酶链式反应(PCR)产物的方法，包括将位于各末端的单一通用衔接体序列转化成在各末端包含不对称的5’和3'衔接体的产物，所述方法包括：(a)消化所述PCR产物的5’末端，其中，引入可切割的碱基或抗核酸酶的修饰，然后进行(b)退火和5’衔接体的(i)缺口平移连接或(ii)侧翼核酸内切酶切割连接，所述5’衔接体与通过消化而暴露的所述通用衔接体的反向互补序列的5’部分互补，和(c)，其中，部分双链的截短型3’衔接体退火并连接至所述通用衔接体的反向互补序列的3’部分，由此将所述PCR产物转化成在其各末端处包含不对称衔接体的产物。

在一些实施方式中，所述PCR产物是全基因组扩增(WGA)产物。

在本文所述的任何方法中，设想所选用于多重扩增的目标基因座对应于任何多种多样的应用，包括但不限于肿瘤学特异性靶标、药物抗性特异性靶标、针对遗传性疾病的靶标、来自感染性病原体的靶标、用于病原体宿主的靶标、物种特异性靶标，和任何临床可用靶标。

附图说明

图1现有的NGS衔接体

填充衔接体(钝端或具有T-突出)具有3’和5’羟基

Y-衔接体(具有T-突出)具有3’羟基和5’磷酸

茎-环衔接体(钝端或具有T-突出)具有3’羟基和5'羟基或磷酸

图2，A和B.常规衔接体连接化学

图3 3’和5’衔接体特征

图4通过缺口平移的5’衔接体连接

步骤包括：

-底物分子脱磷酸

-底物分子精加工/钝端生成

-3’衔接体连接

-3’衔接体的部分降解和5'衔接体的退火

-通过缺口平移的5’衔接体的聚合酶延伸

-延伸的5’衔接体与DNA底物的暴露的5’磷酸的连接

图5通过置换-切割的5’衔接体连接

步骤包括：

1–底物分子脱磷酸

2–底物分子端部精加工/钝端生成

3–3’衔接体连接

4–3’衔接体的部分降解和5'衔接体的退火

5–DNA片段的一个或多个5’碱基的置换和5'衔接体的一个或多个3’碱基的退火

6–通过5'-侧翼核酸内切酶进行的DNA的被置换的一个或多个5’碱基的切割

7–5’衔接体的3’端与底物DNA的暴露的5’磷酸的连接

图6衔接体连接采用两次孵育完成

在两次孵育中实现了通过成对的(coupled)退火-缺口平移-连接进行的5'-衔接体接合(attachment)，其中，第1孵育是3'-衔接体连接，而第2孵育合并了依序发生的3个反应：(1)5'-衔接体的退火，(2)通过具有缺口平移活性(切除底物DNA的破坏的5'末端)的DNA聚合酶进行的5'-衔接体延伸，和(3)5'-衔接体与底物DNA的暴露的5'-磷酸的连接。

在两次孵育中实现了通过成对的(coupled)退火-碱基切除-连接进行的5'-衔接体接合，其中，第1孵育是3'-衔接体连接，而第2孵育合并了依序发生的3个反应：(1)5'-衔接体与处于3'端的一个或数个随机碱基的退火，和底物DNA的一个或数个末端5'-碱基的置换，(2)通过5'-侧翼核酸内切酶(切除底物DNA的破坏的5'末端)对被置换的5-碱基的切割，和(3)5'-衔接体与底物DNA的暴露的5'-磷酸的连接。

图7单链的3’突出的生成

3'-衔接体突出序列可通过至少4种不同的方法酶促添加：

o通过采用T4DNA连接酶的常规连接

o通过单链DNA(RNA)连接酶

o通过末端转移酶加尾的常规均聚物

o通过采用末端转移酶、DNA连接酶和弱化子-衔接体分子的可控加尾和同时衔接体连接。参见2013年3月13日提交的国际专利申请号PCT/US13/31104，其通过引用全文纳入本文。

或者，DNA片段化或其它加工可导致先已存在的具有3'-突出的DNA端部足以供于5’衔接体退火。

图8使5'衔接体退火的方法。图8A描述步骤(i)-(iii)；图8B描述步骤(iv)-(v)。

i)通过在第2寡核苷酸的降解后的连接，所述第2寡核苷酸先前退火至3'-衔接体

ii)通过第2寡核苷酸的竞争性置换，所述第2寡核苷酸先前退火至所述3'-衔接体

iii)通过结合至3'-衔接体的上游区域(随后进行第2寡核苷酸的受限的缺口平移和降解，所述第2寡核苷酸先前退火至所述3'-衔接体)

iv)通过使5'-衔接体预退火至3'-衔接体的上游区域(随后进行第2寡核苷酸的受限的缺口平移和降解，所述第2寡核苷酸先前退火至3'-衔接体)

v)通过采用3’封闭的5'-衔接体替代第2寡核苷酸，其通过切割被活化

图9A-D.采用单一碱基延伸的5’衔接体连接

图10 Illumina NGS文库I的合成

文库I合成在5或6个步骤中发生：

图10a：

1–底物分子脱磷酸和精加工

2–3’衔接体与Illumina序列P7(a)或P5’(b)的连接

3–3’衔接体的部分降解和互补性5’衔接体与Illumina序列P5(a)或P7'(b)的退火

4–通过缺口平移的5’衔接体的聚合酶延伸，和

5–5’衔接体的3’端与DNA底物的暴露的5’磷酸的连接

或者，图10b中：

4–DNA底物的一个或多个5’碱基的置换和5'衔接体的一个或多个3’碱基的退火

5-通过5'-侧翼核酸内切酶进行的DNA底物的被置换的一个或多个5’碱基的切割，和

6–5’衔接体的3’端与DNA底物的暴露的5’磷酸的连接

文库通过采用引物P5和P7'的PCR扩增

图11 Illumina NGS文库II的合成

文库II合成在4个步骤中发生：

1–采用截短型衔接体P7通过图6中所述的两种方法之一进行的NGS文库的合成

2–采用截短的或全长可降解的引物P7*的文库扩增

3–纳入的P7*引物的降解，随后是5’衔接体P5的退火和连接

4–如果在步骤二中采用截短型可降解的引物P7*，则进行P7*”衔接体与截短型衔接体P7*'的桥式-连接以使全长衔接体P7完整

图12 A和B.离子激流(Ion Torrent)文库的合成

文库合成通过如下方式进行：

1–DNA底物脱磷酸和精加工

2–3’衔接体与序列A1'-P1'(a)或A'(b)的连接

3–具有序列A(a)或序列P1-A₁(b)的5’衔接体的3’端与经修整的DNA的5’端的缺口平移连接或碱基切割连接

4–通过采用引物A和P1的PCR的文库扩增

图13仅采用20个衔接体序列的离子激流文库的合成，其具有96种组合条形码序列

文库合成步骤：

1–DNA端部脱磷酸和精加工(未显示)

2–具有序列T'_n-L'-P1'和5’磷酸基团的(钝)3'-衔接体P1_n和具有序列P1_tr-L-T_n的3'-封闭的互补寡核苷酸的连接

3-3'-封闭的互补寡核苷酸P1_tr-L-T_n的降解

4–具有序列A-t_m-L的5'-衔接体A_m退火至接头区域L'

5–通过缺口平移聚合的5'-衔接体A_m的延伸和延伸的5'-衔接体A_m的3’端与DNA的5’端的连接

6–通过采用引物A和P1的PCR的文库扩增

具有组合型条形码的衔接体包括：8个衔接体P1_n，其包含条形码序列T₁、T₂、…、T₈，和12个衔接体A_m，其包含条形码序列t₁、t₂、…、t₁₂

产生的文库具有组合的条形码序列t_m-L-T_n，其具有至多96种条形码组合。

图14通过5’衔接体连接进行所选限制性片段的富集

通过5'-衔接体连接随后PCR扩增来选择限制性DNA片段。选择通过两个5'-衔接体-选择体A和B发生，其包含与限制性片段的5'末端序列相同的序列a和b。富集方法涉及：

1.采用限制性核酸内切酶的DNA消化；

2.3'-衔接体的连接；

3.3'-衔接体的部分降解和5'-衔接体-选择体的退火；

4.5'-衔接体-选择体侵入所述限制性片段的末端序列a和b；

5.被置换的末端序列a和b被5'-侧翼核酸内切酶切割；

6.5'-衔接体-选择体与限制性片段的端部的连接；

7.通过PCR扩增所选的限制性片段。

步骤1、2以及步骤3–6可合并成单一孵育反应。

图15通过引物延伸进行的目标富集

富集通过5’衔接体接合来进行，其中所述3’突出通过采用衔接体A和B的引物延伸和对衔接体A的5’域的部分消化来产生，所述引物与文库上的目标DNA区域互补。生物素化的5'-衔接体退火至衔接体A的3'-突出，然后在通过受限缺口平移修剪之后(a)或侵入-切割反应(b)来连接至衔接体A的5’端。然后，包含目标DNA区域的文库片段通过采用链霉亲和素磁珠的亲和捕获来分离，通过PCR扩增并通过测序分析。

图16替代性文库构建I

文库构建可采用单一衔接体在6或7个步骤中进行：

1–底物分子脱磷酸

2–底物分子端部精加工/钝端生成

3–3’衔接体与序列A'的连接

4–3’衔接体的部分降解和互补5’衔接体与序列A的退火

5–通过缺口平移的5’衔接体的聚合酶延伸，和

6–5’衔接体的3’端与DNA底物的暴露的5’磷酸的连接

或者，通过

5–DNA的一个或多个5’碱基的置换和5'衔接体的一个或多个3’碱基的退火

6–通过5'-侧翼核酸内切酶进行的DNA的被置换的一个或多个5’碱基的切割，和

7–5’衔接体的3’端与DNA底物的暴露的5’磷酸的连接

所述文库可通过采用单一引物A的PCR扩增

图17替代性文库构建II

衔接体接合可产生具有共价连接的3’和5’DNA端部的双链DNA片段的文库。文库构建通过如下方式进行：

1–底物分子脱磷酸(未显示)

2-底物分子端部精加工/钝端生成(未显示)

3–具有磷酸化的5’端和封闭的(任选)3’端的发夹钝端衔接体的连接

4–发夹衔接体的部分降解，以产生可延伸的3’端

5–发夹衔接体的3’端的缺口平移，以及其与DNA底物的暴露的5’磷酸的连接

图18替代性文库构建III

环化的NGS文库可采用如下步骤构建：

1–底物分子脱磷酸(未显示)

2-底物分子端部精加工/钝端生成(未显示)

3–具有磷酸化的5’端和封闭的(任选)3’端的衔接体和彼此互补序列X和X'的连接

4–未连接的衔接体链的降解，以产生单链的3’突出

5–通过末端序列X和X'的退火进行的(在低DNA浓度下进行)DNA的非共价环化

6–通过缺口平移连接反应进行的DNA的共价环化

图19常规衔接体连接与3’衔接体连接的比较，其采用FAM-标记的寡核苷酸底物(实施例1)

图20常规衔接体连接与3’衔接体连接的比较，其采用剪切的、尺寸选择的基因组DNA底物(实施例2)

图21 A和B.5’衔接体连接的温度优化，其采用FAM-标记的寡核苷酸底物(实施例3)

图22 dNTP组合物对5’衔接体连接的作用的分析(实施例4)

图23 A和B.采用热稳定酶的成对的缺口平移-连接反应(实施例5)

图24成对的置换-切割-连接反应(实施例6)

图25成对的置换-切割-连接反应，其采用"N"通用/简并或"T"底物特异性5’衔接体3’突出(实施例7)

图26成对的缺口平移-连接反应，其采用DNA聚合酶I(实施例8)

图27物理剪切的DNA的钝端连接需要精加工，并且脱磷酸防止嵌合连接产物的形成(实施例9)

图28 A和B.当采用与衔接体连接反应联合的5’碱基修剪制备时，NGS文库具有增加的产量(实施例10)

图29A、B和C.采用与衔接体连接联合的5’碱基修剪制备的NGS文库的序列分析(实施例11)

图30描述实施例1中所述的衔接体、模型底物和寡核苷酸构建体的结构。

图31描述FAM底物分子(参见实施例1)。

图32–描述实施例2中描述的衔接体的结构

图33–描述实施例3、4、5和8中所述的寡核苷酸构建体系统。

图34–描述实施例6中所述的寡核苷酸构建系统。

图35–描述实施例7中所述的寡核苷酸构建系统。

图36–描述实施例7中所述的寡核苷酸构建系统。

图37–描述实施例10中所述的P7和P5衔接体的结构。

图38–描述实施例11中所述的P7和P5衔接体的结构。

图39.描述用于扩增子NGS文库构建方法的两个工作流。

图40.描述第一工作流，其中多重PCR通过纯化步骤分开。

图41.描述第二工作流，其中多重PCR作为单一步骤进行。

图42.描述将衔接体A和B同时连接至各扩增子的最终步骤。

图43.比较了单管和双管工作流。

图44A和44B.描述了由重叠引物对目标区域产生的扩增子产物。

图45.实施例1：TP53编码外显子上的扩增子覆盖图。

图46.实施例1：鉴定TP53的外显子8中的体细胞突变。

发明详述

在一个方面中，本发明描述了一种将衔接体连接至片段化的双链DNA分子的端部的高效方法。所述DNA分子在本文中称为"底物分子"。在一个方面中，所述方法包括单一孵育，其包括：(1)5’衔接体退火至底物分子上先已存在的3’突出，所述底物分子优选3'衔接体，(2)从所述底物分子的5'-末端移除破坏的碱基，其允许(3)所述5’衔接体与所述底物分子的暴露的5'-磷酸的高效连接。在另一方面中，所述方法包括两个孵育，其中在第一孵育中，将3’衔接体连接至所述底物分子，而在第二孵育中，将5’衔接体连接至所述底物分子，如上所述(参见图6)。在不同的实施方式中，本发明还提供方法，其包括在一个或两个连接步骤之前发生的额外步骤，其包括：(i)脱磷酸反应，(ii)精加工反应，以切除破坏的3’末端并产生钝端，和(iii)腺苷酰化反应；本发明设想所述步骤的不同组合，并且在下文中进一步详细讨论。

在另一方面中，本发明描述了一种多重扩增子NGS文库制备的高效方法。在一个方面中，所述方法允许在单管中合成并扩增多重重叠扩增子。在另一方面中，其描述了一种将衔接体连接至不含嵌合扩增子和衔接体-二聚体的PCR扩增子的端部的新型、高效方法。在一个方面中，其允许引入独特简并序列标签来鉴定个体扩增子。在另一方面中，所述方法包括单一孵育，其包括降解扩增子的5'末端，然后同时进行第二衔接体B的连接和接头介导的第1衔接体A的剩余部分与底物扩增子的连接。在不同的实施方式中，本发明还提供方法，其包括在连接步骤之前发生的额外步骤，其包括：(i)多重PCR反应(ii)纯化步骤，和(iii)通用单一引物扩增步骤。或者，在连接步骤之前发生的额外步骤包括：(i)采用通用单一引物扩增的合并的多重PCR反应，随后是(ii)纯化步骤。本发明设想所述步骤的不同选项，并在下文中进一步详细讨论。

本文所用的术语"反应条件"或"标准反应条件"指，按照生产商说明的条件。应理解，除非另有说明，本文中所述的所有的酶在标准反应条件下使用。本文中所用的术语"第一多核苷酸"可与"3'衔接体"、"第一衔接体"或"衔接体A"互换使用，且本文中所用的术语"第二多核苷酸"可与"5'衔接体"、"第二衔接体"或"衔接体B"互换使用。在某些情况中，当衔接体A述及IonTorrent^TM技术使用时，例如，图12-13，它指的是生产商提供用于IonTorrent^TM方法的衔接体A，而非本文中定义的"衔接体A"。

本文所用的"3'衔接体"连接至底物分子的3’端，而"5'衔接体"连接至底物分子的5’端。

本文中所用的"破坏的"5'末端是缺乏5’磷酸的5'末端。

本文中所用的"加工的"底物分子是其上已连接5’衔接体的底物分子。

本文中所用的"高保真聚合酶"是具有3'-5'核酸外切酶(即，校对)活性的聚合酶。

本文中所用的术语"耐受"指聚合酶的性质，其能够延伸通过包含可切割的碱基(例如，尿嘧啶、肌苷和RNA)的模板。

本文中所用的术语"不对称的"指在两个末端具有两个衔接体而非在两个末端具有单一衔接体的双链分子。因此，不对称性源自两个衔接体彼此高度非互补且具有单链的部分。

本文中所用的"通用引物"是用于扩增反应以引入通用衔接体序列的寡核苷酸。本文所用的"通用衔接体"对应于所述通用引物序列及其反向互补序列的扩增产物的部分。

应理解，降低两种核酸的结合稳定性的修饰包括但不限于，核苷酸错配、脱氧次黄苷、肌苷或通用碱基。

还应理解，增加两种核酸的结合稳定性的修饰包括但不限于，锁核酸(LNA)、精胺和亚精胺或其它多胺，以及胸腺嘧啶甲基化。

本文中所用的术语"通用碱基"能与所有四种天然产生的碱基发生碱基配对的碱基，其无氢键且减稳低于错配，并且包括但不限于5’硝基吲哚。

本文任何部分所用的"分子鉴定标签"的长度是4～16个碱基，其中最优长度是8～12个简并N碱基。

底物分子

设想底物分子获自天然产生的来源，或可以是合成的。天然产生的来源包括但不限于基因组DNA、cDNA、通过全基因组扩增产生的DNA、包含至少一个双链末端的引物延伸产物，和PCR扩增子。在不同的实施方式中，天然产生的来源是原核来源或真核来源。例如但不意在限制，所述来源可以是人、小鼠、病毒、植物或细菌或包含多个基因组的混合物。

应理解，本文中所用的"扩增子"指已采用扩增技术合成的多核苷酸的部分。

如果所述底物分子的来源是基因组DNA，在一些实施方式中设想所述基因组DNA是片段化的。基因组DNA的片段化是本领域技术人员已知的常规工艺，并且通过如下方式进行：例如但不限于在体外通过剪切(雾化(nebulizing))DNA、用核酸内切酶切割DNA、声处理DNA、通过加热DNA、通过采用α、β、γ或其它放射性来源辐照DNA、通过光、通过在金属离子的存在下化学切割DNA、通过自由基切割，及其组合。基因组DNA的片段化可体内发生，例如但不限于，归因于凋亡、辐照和/或石棉接触。根据本文提供的方法，底物分子的群不需要具有统一大小。因此，本发明方法有效于采用不同的大小的底物多核苷酸片段的群。

本文所述的底物分子是至少部分双链的，并且包含3’突出(参见图7a)、钝端、3’凹陷的端部，或无3’羟基基团。底物多核苷酸的突出或凹陷的端部的长度可变化。在不同的方面中，底物分子的突出或凹陷的端部的长度是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在其他实施方式中，底物分子的突出或凹陷的端部的长度是至少1，至少2，至少3，至少4，至少5，至少6，至少7，至少8，至少9，至少10，至少11，至少12，至少13，至少14，至少15，至少16，至少17，至少18，至少19或至少20个核苷酸。而在其他实施方式中，底物分子的突出或凹陷的端部的长度是约1～约5，或约1～约10，或约1～约15，或约1～约20个核苷酸。在不同的方面中，底物分子的群包括，其中，多于一种上述类型的底物分子存在于单一反应中的那些。本发明还设想底物分子是至少部分单链的。其中底物分子是单链的底物分子的本发明的方面涉及采用单链的连接酶。

本发明的一些应用涉及衔接体序列与通过引物延伸合成产生的双链DNA的接合，而非与原始或天然双链的DNA底物分子的接合。所述应用的一个示例是通过如下方式产生的DNA文库：(a)包含引物结合序列的寡核苷酸与单链或双链DNA的3’端的接合，以允许引物延伸，(b)退火至寡核苷酸的引物的延伸，和(c)3’和5'衔接体与通过所述引物-延伸产生的双链DNA端部的接合。

设想底物分子的双链部分或单链部分的长度是约3～约1x 10⁶个核苷酸。在一些方面中，底物分子的长度是约10～3000个核苷酸，或约40～2000个核苷酸，或约50～1000个核苷酸，或约100～500个核苷酸，或约1000～5000个核苷酸，或约10,000至50,000个核苷酸，或约100,000至1x10⁶个核苷酸。在其他方面中，底物分子的长度是至少3且至多约50、100或1000个核苷酸；或至少10且至多约50、100或1000个核苷酸；或至少100和至多约1000、5000或10000个核苷酸；或至少1000和至多约10000、20000和50000；或至少10000和至多约20000、50000和100,000个核苷酸；或至少20000和至多约100,000、200,000或500,000个核苷酸；或至少200,000和至多约500,000、700,000或1,000,000个核苷酸。在不同的方面中，底物分子的长度是约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约310、约320、约330、约340、约350、约360、约370、约380、约390、约400、约410、约420、约430、约440、约450、约460、约470、约480、约490、约500、约510、约520、约530、约540、约550、约560、约570、约580、约590、约600、约610、约620、约630、约640、约650、约660、约670、约680、约690、约700、约710、约720、约730、约740、约750、约760、约770、约780、约790、约800、约810、约820、约830、约840、约850、约860、约870、约880、约890、约900、约910、约920、约930、约940、约950、约960、约970、约980、约990、约1000、约1100、约1200、约1300、约1400、约1500、约1600、约1700、约1800、约1900、约2000、约2100、约2200、约2300、约2400、约2500、约2600、约2700、约2800、约2900、约3000、约3100、约3200、约3300、约3400、约3500、约3600、约3700、约3800、约3900、约4000、约4100、约4200、约4300、约4400、约4500、约4600、约4700、约4800、约4900、约5000、10,000、15,000、20,000、50,000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000、1,000,000或更多个核苷酸。

扩增子分子

设想扩增子的长度是约10bp～175bp，其中所需的扩增子大小显著短于循环无细胞DNA片段(约165bp)，并且在大小上足够小以不跨越来自保存的样品的福尔马林诱导的交联的DNA，理想长度<150bp。设想所述扩增子的长度可以是15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、51bp、52bp、53bp、54bp、55bp、56bp、57bp、58bp、59bp、60bp、61bp、62bp、63bp、64bp、65bp、66bp、67bp、68bp、69bp、70bp、71bp、72bp、73bp、74bp、75bp、76bp、77bp、78bp、79bp、80bp、81bp、82bp、83bp、84bp、85bp、86bp、87bp、88bp、89bp、90bp、91bp、92bp、93bp、94bp、95bp、96bp、97bp、98bp、99bp、100bp、101bp、102bp、103bp、104bp、105bp、106bp、107bp、108bp、109bp、110bp、111bp、112bp、113bp、114bp、115bp、116bp、117bp、118bp、119bp、120bp、121bp、122bp、123bp、124bp、125bp、126bp、127bp、128bp、129bp、130bp、131bp、132bp、133bp、134bp、135bp、136bp、137bp、138bp、139bp、140bp、141bp、142bp、143bp、144bp、145bp、146bp、147bp、148bp、149bp、150bp、151bp、152bp、153bp、154bp、155bp、156bp、157bp、158bp、159bp、160bp、161bp、162bp、163bp、164bp、165bp、166bp、167bp、168bp、169bp、170bp、171bp、172bp、173bp、174bp、175bp或更长。

或者，当采用高分子量DNA作为输入DNA用于扩增反应时，对于较长的读数，尤其是对于能够提供数千碱基读数的(其提供单体型分析信息或跨度重复或其它困难序列(PacBio))的长读数序列技术，设想扩增子长度是150bp～150,000bp或更长。设想所述扩增子的长度可以是150bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1,000bp、2,000bp、3,000bp、4,000bp、5,000bp、6,000bp、7,000bp、8,000bp、9,000bp、10,000bp、11,000bp、12,000bp、13,000bp、14,000bp、15,000bp、16,000bp、17,000bp、18,000bp、19,000bp、20,000bp、30,000bp、40,000bp、50,000bp、100,000bp、150,000bp或更长。

在本文所述的任何方法中，设想所选用于多重扩增的目标基因座对应于任何多种多样的应用，包括但不限于肿瘤学特异性靶标、药物抗性特异性靶标、药物代谢和吸收靶标(例如CYP2D6)、针对遗传性疾病的靶标(例如囊胞性纤维症CFTR基因、林奇综合征MLH1、MSH2、MSH6、PMS2和EPCAM基因)来自感染性病原体的靶标、针对病原体宿主基因座的靶标、物种特异性靶标，和任何临床可用靶标。在一个方面中，所述目标基因座选自一组肿瘤学靶标，其包括但不限于BRAF、KRAS、EGFR、KIT、HRAS、NRAS、MET、RET、GNA11、GNAQ、NOTCH1、ALK、PIK3CA、JAK2、AKT1、DNMT3A、IDH2、ERBB2和TP53。在另一方面中，所述肿瘤学靶标包括400-600个基因，包括但不限于如下基因亚组：ACURL1、AKT1、APC、APEX1、AR、ATM、ATP11B、BAP1、BCL2L1、BCL9、BIRC2、BIRC3、BRCA1、BRCA2、CCND1、CCNE1、CD274、CD44、CDH1、CDK4、CDK6、CDKN2A、CSNK2A1、DCON1D1、EGFR、ERBB2、FBXW7、FGFR1、FGFR2、FGFR3、FGFR4、FLT3、GAS6、GATA3、IGF1R、IL6、KIT、KRAS、MCL1、MDM2、MET、MSH2、MYC、MYCL、MYCN、MYO18A、NF1、NF2、NKX2-1、NKX2-8、NOTCH1、PDCD1LG2、PDGFRA、PIK3CA、PIK3R1、PNP、PPARG、PTCH1、PTEN、RB1、RPS6KB1、SMAD4、SMARCB1、SOX2、STK11、TERT、TET2、TIAF1、TP53、TSC1、TSC2、VHL、WT1和ZNF217。在另一实施方式中，所述目标基因座选自已知具有肿瘤学临床相关性的基因亚组，包括但不限于ABI1、ABL1、ABL2、ACSL3、AF15Q14、AF1Q、AF3p21、AF5q31、AKAP9、AKT1、AKT2、ALDH2、ALK、ALO17、AMER1、APC、ARHGEF12、ARHH、ARID1A、ARID2、ARNT、ASPSCR1、ASXL1、ATF1、ATIC、ATM、ATP1A1、ATP2B3、ATRX、AXIN1、BAP1、BCL10、BCL11A、BCL11B、BCL2、BCL3、BCL5、BCL6、BCL7A、BCL9、BCOR、BCR、BHD、BIRC3、BLM、BMPR1A、BRAF、BRCA1、BRCA2、BRD3、BRD4、BRIP1、BTG1、BUB1B、C12orf9、C15orf21、C15orf55、C16orf75、C2orf44、CACNA1D、CALR、CAMTA1、CANT1、CARD11、CARS、CASP8、CBFA2T1、CBFA2T3、CBFB、CBL、CBLB、CBLC、CCDC6、CCNB1IP1、CCND1、CCND2、CCND3、CCNE1、CD273、CD274、CD74、CD79A、CD79B、CDC73、CDH1、CDH11、CDK12、CDK4、CDK6、CDKN2A、CDKN2C、CDKN2a(p14)、CDX2、CEBPA、CEP1、CEP89、CHCHD7、CHEK2、CHIC2、CHN1、CIC、CIITA、CLIP1、CLTC、CLTCL1、CMKOR1、CNOT3、COL1A1、COL2A1、COPEB、COX6C、CREB1、CREB3L1、CREB3L2、CREBBP、CRLF2、CRTC3、CSF3R、CTNNB1、CUX1、CYLD、D10S170、DAXX、DCTN1、DDB2、DDIT3、DDX10、DDX5、DDX6、DEK、DICER1、DNM2、DNMT3A、DUX4、EBF1、ECT2L、EGFR、EIF3E、EIF4A2、ELF4、ELK4、ELKS、ELL、ELN、EML4、EP300、EPS15、ERBB2、ERC1、ERCC2、ERCC3、ERCC4、ERCC5、ERG、ETV1、ETV4、ETV5、ETV6、EVI1、EWSR1、EXT1、EXT2、EZH2、EZR、FACL6、FAM46C、FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG、FAS、FBXO11、FBXW7、FCGR2B、FEV、FGFR1、FGFR1OP、FGFR2、FGFR3、FH、FHIT、FIP1L1、FLI1、FLJ27352、FLT3、FNBP1、FOXA1、FOXL2、FOXO1A、FOXO3A、FOXO4、FOXP1、FSTL3、FUBP1、FUS、FVT1、GAS7、GATA1、GATA2、GATA3、GMPS、GNA11、GNAQ、GNAS、GOLGA5、GOPC、GPC3、GPHN、GRAF、H3F3A、H3F3B、HCMOGT-1、HEAB、HERPUD1、HEY1、HIP1、HIST1H3B、HIST1H4I、HLA-A、HLF、HLXB9、HMGA1、HMGA2、HNRNPA2B1、HOOK3、HOXA11、HOXA13、HOXA9、HOXC11、HOXC13、HOXD11、HOXD13、HRAS、HSPCA、HSPCB、IDH1、IDH2、IGH\、IGK、IGL、IKZF1、IL2、IL21R、IL6ST、IL7R、IRF4、IRTA1、ITK、JAK1、JAK2、JAK3、JAZF1、JUN、KCNJ5、KDM5A、KDM5C、KDM6A、KDR、KIAA1549、KIAA1598、KIF5B、KIT、KLF4、KLK2、KMT2D、KRAS、KTN1、LAF4、LASP1、LCK、LCP1、LCX、LHFP、LIFR、LMNA、LMO1、LMO2、LPP、LRIG3、LSM14A、LYL1、MAF、MAFB、MALAT1、MALT1、MAML2、MAP2K1、MAP2K2、MAP2K4、MAX、MDM2、MDM4、MDS1、MDS2、MECT1、MED12、MEN1、MET、MITF、MKL1、MLF1、MLH1、MLL、MLL3、MLLT1、MLLT10、MLLT2、MLLT3、MLLT4、MLLT6、MLLT7、MN1、MPL、MSF、MSH2、MSH6、MSI2、MSN、MTCP1、MUC1、MUTYH、MYB、MYC、MYCL1、MYCN、MYD88、MYH11、MYH9、MYO5A、MYST4、NAB2、NACA、NBS1、NCOA1、NCOA2、NCOA4、NDRG1、NF1、NF2、NFATC2、NFE2L2、NFIB、NFKB2、NIN、NKX2-1、NONO、NOTCH1、NOTCH2、NPM1、NR4A3、NRAS、NRG1、NSD1、NT5C2、NTRK1、NTRK3、NUMA1、NUP214、NUP98、NUTM2A、NUTM2B、OLIG2、OMD、P2RY8、PAFAH1B2、PALB2、PAX3、PAX5、PAX7、PAX8、PBRM1、PBX1、PCM1、PCSK7、PDE4DIP、PDGFB、PDGFRA、PDGFRB、PER1、PHF6、PHOX2B、PICALM、PIK3CA、PIK3R1、PIM1、PLAG1、PLCG1、PML、PMS1、PMS2、PMX1、PNUTL1、POT1、POU2AF1、POU5F1、PPARG、PPFIBP1、PPP2R1A、PRCC、PRDM1、PRDM16、PRF1、PRKAR1A、PSIP1、PTCH1、PTEN、PTPN11、PTPRB、PTPRC、PTPRK、PWWP2A、RAB5EP、RAC1、RAD21、RAD51L1、RAF1、RALGDS、RANBP17、RAP1GDS1、RARA、RB1、RBM15、RECQL4、REL、RET、RNF43、ROS1、RPL10、RPL22、RPL5、RPN1、RSPO2、RSPO3、RUNDC2A、RUNX1、RUNXBP2、SBDS、SDC4、SDH5、SDHB、SDHC、SDHD、42253、SET、SETBP1、SETD2、SF3B1、SFPQ、SFRS3、SH2B3、SH3GL1、SIL、SLC34A2、SLC45A3、SMAD4、SMARCA4、SMARCB1、SMARCE1、SMO、SOCS1、SOX2、SRGAP3、SRSF2、SS18、SS18L1、SSX1、SSX2、SSX4、STAG2、STAT3、STAT5B、STAT6、STK11、STL、SUFU、SUZ12、SYK、TAF15、TAL1、TAL2、TBL1XR1、TCEA1、TCF1、TCF12、TCF3、TCF7L2、TCL1A、TCL6、TERT、TET2、TFE3、TFEB、TFG、TFPT、TFRC、THRAP3、TIF1、TLX1、TLX3、TMPRSS2、TNFAIP3、TNFRSF14、TNFRSF17、TOP1、TP53、TPM3、TPM4、TPR、TRA、TRAF7、TRB、TRD、TRIM27、TRIM33、TRIP11、TRRAP、TSC1、TSC2、TSHR、TTL、U2AF1、UBR5、USP6、VHL、VTI1A、WAS、WHSC1、WHSC1L1、WIF1、WRN、WT1、WWTR1、XPA、XPC、XPO1、YWHAE、ZCCHC8、ZNF145、ZNF198、ZNF278、ZNF331、ZNF384、ZNF521、ZNF9和ZRSR2。

在另一方面中，所述靶标对于药物抗性基因座具有特异性，包括提供针对用作靶向抗肿瘤试剂的酪氨酸激酶抑制剂的抗性的基因座、关于靶向抗肿瘤试剂的其它靶向基因座、抗生素抗性基因座，和抗病毒抗性基因座。

在另一方面中，可进行对于肠、血源性、CNS、呼吸道、性传播，和泌尿道病原体，包括细菌、真菌、酵母、病毒，或寄生虫的检测。也可检测造成耳部、皮肤或眼部感染的病原体。可进行细菌或病毒的致病变种之间的区分，以及促进性抗生素抗性或编码毒素的基因之间的区分。

可由所得的扩增子的序列分析检测的遗传损伤的类型包括SNV(单一核苷酸变体)、点突变、转换、颠换、无义突变、错义突变、单一碱基插入和缺失、引物对之间映射的较大插入和缺失、已知染色体重排例如易位、基因融合、缺失、插入，其中引物对经设计以侧接所述已知重排的断裂点；拷贝数变化，包括扩增事件、缺失和杂合性丧失(LOH)、异倍性、单亲二体型，和其它遗传或获得性染色体异常。此外，如果双亚硫酸盐转化在多重PCR之前进行，并且引物针对双亚硫酸盐转化的DNA设计且任选地不与CpG双核苷酸重叠(这可导致不同的修饰序列状态，使得引物设计更加复杂)，甲基化变化也可采用本文公开的方法来检测。

对于目标基因座的扩增，所述引物的3’靶标特异性部分的最优长度是15～30个碱基，但不限于该范围，其中，所述引物的靶标特异性部分是5～50个碱基或10～40个碱基或其间的任何长度。在2.5mM Mg²⁺、50mM NaCl和0.25μM的寡核苷酸确定的所需的Tm是63℃，其中多重引物间的Tm变化不多于±2.5℃，以确保甚至在固定反应条件下也能扩增。所述引物的靶标特异性部分的所需的GC含量优选是50％，但可在30％和70％之间变化。靶标特异性引物经设计以避免与重复的、非独特序列或对于检测的条件共有的SNP多态性或已知突变重叠，以确保从来自不同遗传背景的DNA样品进行特异性、无偏差的扩增。此外，靶标特异性靶标和互补引物设计应不受制于二级结构形成(其可能降低性能)。

所述通用引物包含可切割的碱基，包括但不限于脱氧尿嘧啶、脱氧次黄苷或RNA，并且可包含一、二、三、四、五或更多个可切割的碱基。此外，所述靶标特异性引物和所述通用引物在其3’末端包含1、2、3、4或更多抗核酸酶的部分。

衔接体分子

本发明设想应用5’衔接体和3’衔接体(参见图3)。根据本发明，3’衔接体任选地是双链的，包含"寡核苷酸1"和"寡核苷酸2"。对于所述双链的底物分子，设想任何长度的寡核苷酸1和寡核苷酸2，只要这两种寡核苷酸能够在标准反应条件下彼此退火即可。因此，寡核苷酸1和寡核苷酸2之间的互补性使得它们能够退火至彼此。在不同的实施方式中，所述互补性从约70％、75％、80％、85％、90％、95％～约100％、或约70％、75％、80％、85％、90％，到约95％，或约70％、75％、80％、85％～约90％。在特定的实施方式中，寡核苷酸1和寡核苷酸2之间的互补性程度是70％、75％、80％、85％、90％、95％、99％或100％。在其他实施方式中，寡核苷酸2包含易于降解/移除的核苷酸，例如，无碱基核苷酸或核糖核苷酸。在某些实施方式中，寡核苷酸1和寡核苷酸2具有不同的长度，并且寡核苷酸1杂交至沿寡核苷酸2长度的任何位置。

在另一实施方式中，所述5’衔接体是单链的。在其中所述5’衔接体杂交至3'衔接体的寡核苷酸1的实施方式中，在另一实施方式中，设想所述退火导致5’衔接体和底物分子之间的缺口、间隙或一个或多个重叠碱基(参见图8)。在不同的实施方式中，所述间隙或重叠碱基的数量是，长度为1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基。在其中所述3’衔接体是双链的另一个实施方式中，在5’衔接体退火至3'衔接体之后，添加酶以通过缺口平移催化5’衔接体的"向前咀嚼(chewingforward)"，以去除寡核苷酸2。在一些实施方式中，所述5’衔接体在其3'末端还包含随机的单个、两个或更多个N碱基，其不与寡核苷酸1互补，并且其可退火至底物分子的一个或多个第一碱基(如果其5’碱基被置换)。在其它实施方式中，所述5’衔接体是修饰的多核苷酸。设想可用的修饰的寡核苷酸公开于美国专利申请公开号2011/0129832，其通过引用全文纳入本文。在特定实施方式中，所述5’衔接体包含选自下组的碱基修饰：锁核酸(LNA)和肽核酸(PNA)。在某些实施方式中，所述5'-衔接体寡核苷酸预退火至3'-衔接体(参见图8)。

本发明还设想应用通过PCR纳入的通用衔接体、单链的5’衔接体，和连接至部分加工的扩增子底物上的通用衔接体的一个链的3’衔接体的剩余部分。根据本发明，3’衔接体的剩余部分的连接通过接头介导。对于接头分子，设想与通用衔接体和3’衔接体的剩余部分互补的任何长度，只要三种寡核苷酸能够在标准反应条件下退火至彼此即可。因此，互补性使得它们能够退火至彼此。在不同的实施方式中，所述互补性从约70％、75％、80％、85％、90％、95％～约100％、或约70％、75％、80％、85％、90％，到约95％，或约70％、75％、80％、85％～约90％。

在另一实施方式中，所述5’衔接体是单链的。在其中所述5’衔接体杂交至扩增子末端的通用衔接体的3’突出的实施方式中，在另一实施方式中，设想所述退火导致5’衔接体和扩增子底物之间的缺口或间隙。在不同的实施方式中，所述间隙的长度是1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基。

设想通用衔接体、5’衔接体B或3’衔接体A的剩余部分的长度是约5～约200个核苷酸。在一些方面中，通用衔接体、5’衔接体或3’衔接体的长度是约5～约200个核苷酸，或约5～约150个核苷酸，或约5～约100个核苷酸，或约5～约50个核苷酸，或约5～约25个核苷酸，或约10～200个核苷酸，或约10～100个核苷酸。在其他方面中，5’衔接体或3’衔接体的长度是至少5且至多约50、100或200个核苷酸；或至少10且至多约50、100或200个核苷酸；或至少15且至多约50、100，或200个核苷酸；或至少20且至多约50、100或200个核苷酸；或至少30且至多约50、100或200个核苷酸；或至少40且至多约50、100或200个核苷酸。在不同的方面中，底物分子的长度是约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约1100、约1200、约1300、约1400、约1500、约1600、约1700、约1800、约1900、约2000、约2100、约2200、约2300、约2400、约2500、约2600、约2700、约2800、约2900、约3000、约3100、约3200、约3300、约3400、约3500、约3600、约3700、约3800、约3900、约4000、约4100、约4200、约4300、约4400、约4500、约4600、约4700、约4800、约4900、约5000、约5100、约5200、约5300、约5400、约5500、约5600、约5700、约5800、约5900、约6000、约6100、约6200、约6300、约6400、约6500、约6600、约6700、约6800、约6900、约7000、约7100、约7200、约7300、约7400、约7500、约7600、约7700、约7800、约7900、约8000、约8100、约8200、约8300、约8400、约8500、约8600、约8700、约8800、约8900、约9000、约9100、约9200、约9300、约9400、约9500、约9600、约9700、约9800、约9900、约10000、约10500、约11000、约11500、约12000、约12500、约13000、约13500、约14000、约14500、约15000、约15500、约16000、约16500、约17000、约17500、约18000、约18500、约19000、约19500、约20000、约20500、约21000、约21500、约22000、约22500、约23000、约23500、约24000、约24500、约25000、约25500、约26000、约26500、约27000、约27500、约28000、约28500、约29000、约29500、约30000、约30500、约31000、约31500、约32000、约32500、约33000、约33500、约34000、约34500、约35000、约35500、约36000、约36500、约37000、约37500、约38000、约38500、约39000、约39500、约40000、约40500、约41000、约41500、约42000、约42500、约43000、约43500、约44000、约44500、约45000、约45500、约46000、约46500、约47000、约47500、约48000、约48500、约49000、约49500、约50000、约60000、约70000、约80000、约90000、约100000或更多个核苷酸。

为了完成NGS衔接体连接，所述通用衔接体引物还包含修饰的碱基和/或连接，其可通过酶促、化学或物理方式被破坏。修饰包括但不限于dU-碱基、脱氧次黄苷和RNA碱基。作为对应于具有可切割的碱基的通用引物的通用衔接体的一个链的降解的结果，单链的5’衔接体向扩增子的3’突出的退火。在一些实施方式中，降解通过酶促进行，更具体地，通过采用尿嘧啶-DNA糖苷酶(UDG)，或UDG和无嘌呤/无嘧啶核酸内切酶的组合(如果寡核苷酸包含脱氧尿嘧啶碱基)，或通过核酸内切酶V(如果寡核苷酸包含脱氧次黄苷碱基)。如果纳入的引物包含RNA碱基，降解还可通过采用RNA酶H1或RNA酶H2的孵育来进行。在一些应用中，纳入的引物的降解可通过化学或物理(例如，通过光)方式进行。或者，扩增子的3’突出可通过扩增子的5’端的有限核酸外切酶消化来产生。所述有限消化可通过酶促法实现，更具体地，如果引物寡核苷酸包含位于3’端处的抗核酸酶的一个或多个碱基，具体是具有硫代磷酸酯连接的一个或多个碱基，则通过采用T7基因6核酸外切酶或λ5'→3'核酸外切酶。在该情况中，所述核酸外切酶反应止于所述修饰的碱基并产生3’突出。

方法–步骤

所述方法的前三个孵育是预连接步骤，并且包括(i)脱磷酸、(ii)精加工和(iii)任选腺苷酰化。所述方法的剩下两个孵育包括(1)3’衔接体连接，和(2)5’衔接体连接，其包含(a)5’衔接体退火(b)从底物分子移除5’碱基和(c)5’衔接体连接(参见图4-6)。在该方面中，所述方法具有至多3个预连接步骤和2个连接步骤。在另一方面中，如果底物分子包含先已存在的3’突出，优选作为3’衔接体，所述方法具有5’衔接体的单一连接步骤(参见图7a)。

在所述扩增反应中，多重循环的数量限制在最小2次，或可进行3次循环、4次循环、5次循环或更多次，至多N次循环，然后转换至非多重通用衔接体单一引物扩增。通用循环的数量可以是从1次循环至40次或更多次循环，这取决于DNA输入和所需的文库产量。在多重PCR扩增之后，进行纯化步骤，然后进行同时衔接体连接步骤。

预连接步骤：

(I)脱磷酸

衔接体连接之前，任选地加工DNA端部以提高衔接体连接反应的效率。现有方法中的DNA端部加工通常是采用两个酶促反应：(a)采用一种或多种校对DNA聚合酶的孵育，以通过去除3'-突出并填充凹陷的3’端来精加工DNA端部，和(b)采用多核苷酸激酶的孵育，以添加磷酸基团至5'末端。当加工DNA端部时，一些方法也通过用非校对DNA聚合酶孵育精加工的DNA来使钝端DNA在3’末端腺苷酸化。腺苷酰化帮助防止DNA自身连接和嵌合产物的形成。其也使衔接体-二聚体的形成最小化，这归因于对应的衔接体的3’端处的dT的存在。本发明以完全不同的方式解决了这些问题。本发明的方法进行从DNA片段的5’端任选完全移除磷酸基团，而不是向DNA片段的5’端添加磷酸基团。DNA端部的脱磷酸通过用能够从DNA末端移除磷酸的酶来孵育DNA片段来实现。可用于本发明方法以移除5'或3’磷酸的酶的示例包括但不限于，任何磷酸酶，例如牛小肠碱性磷酸酶、细菌碱性磷酸酶、虾碱性磷酸酶、南极(Antarctic)磷酸酶，和胎盘碱性磷酸酶，其各自根据标准条件使用。

(ii)精加工

在移除碱性磷酸酶或通过加热使其失活之后，任选地对DNA底物分子进行采用校对DNA聚合酶在dNTP存在下的孵育以产生钝端。所述反应根据标准条件进行。去磷酸化和精加工的DNA片段是用于接合3’衔接体的良好底物，但它们对于DNA片段多联体连接和嵌合体形成而言是较差的底物。它们对于常规衔接体的连接而言也是较差的底物。

在本发明的一些应用中，可省去通过磷酸酶的5’端脱磷酸，但在该情况中，将酶例如T4多核苷酸激酶添加至DNA精加工混合物是优选的，以确保在DNA精加工之前从3’末端移除磷酸基团。或者，上述前两个预连接反应，脱磷酸和精加工，可以任何顺序进行并导致在其末端缺乏5’磷酸基团的钝端、双链DNA。

(iii)腺苷酰化

本发明还设想应用钝端DNA片段的3'末端的腺苷酰化，其采用具有非模板聚合酶活性的DNA聚合酶，包括但不限于，DNA聚合酶I的(缺失3’外切酶活性(exo-))Klenow片段，和Taq DNA聚合酶。碱性磷酸酶处理和腺苷酰化均减少DNA片段自身连接的进行和嵌合文库分子的形成。在包括腺苷酰化步骤的情况中，用于后续步骤的3’衔接体将需要单一T突出。

连接步骤：

(1)3’衔接体连接，或，DNA底物上单链3’突出的产生

选项示于图7。

选项1a：3’封闭的寡核苷酸2作为双链3’衔接体的部分(图7a)

现有的NGS文库制备方案依赖于衔接体的3'OH基团和DNA片段末端的5’磷酸基团之间的连接。为此，用于常规方法中的衔接体通常具有带有3’羟基基团和任选的5’磷酸基团的一个功能双链端部(参见图1和2)。相反，本发明采用3’衔接体的5’磷酸基团与DNA片段的3'OH基团之间的连接反应，而留下3’衔接体的3'末端和DNA片段的5’末端之间的缺口(参见图3)。3’衔接体具有带有5'-磷酸基团的功能性双链端部，并且在该选项中，不能胜任连接的3’核苷酸(例如，包含糖修饰的碱基类似物，例如，2',3’双脱氧碱基或3'-脱氧碱基)。3’衔接体通过使两种寡核苷酸退火来形成：在5’端具有磷酸基团且在3’端具有封闭护基团(例如，C3间隔子)的寡核苷酸1，和缺乏5’端的磷酸基团且在3’端包含不可连接碱基的寡核苷酸2。寡核苷酸2还包含修饰的碱基和/或连接，其能通过酶促、化学或物理方式被破坏。在大多数应用中，涉及与底物分子连接的3’衔接体的末端是钝端。在涉及DNA片段的腺苷酰化的应用中，3’衔接体的可连接的端部具有包含2',3’双脱氧胸腺嘧啶或3'-脱氧胸腺嘧啶碱基(或胸腺嘧啶碱基的其它修饰，封闭其与邻近碱基形成共价连接的能力)的3’突出。在其它应用中，3’衔接体的功能性端部可具有包含多个碱基的3'或5’突出。在采用DNA连接酶的孵育过程中，3’衔接体的5’磷酸变得连接至所述DNA底物分子的3’末端，而在3’衔接体的3'末端和所述DNA底物分子的5’末端之间留下缺口。在反应完成后，通过旋转柱或SPRI珠基纯化法对连接的DNA进行纯化，以去除连接反应的过量的衔接体和其它组分。

选项1b：3’羟基寡核苷酸2作为双链3’衔接体的部分(图7a)

在替代性方法中，采用缺乏位于寡核苷酸2的3'末端的封闭的、不可连接的碱基的3'-衔接体。无封闭的(non-blocked)寡核苷酸2与底物分子的连接将仍通过因脱磷酸反应而缺乏底物分子上的5’磷酸而被阻止。采用无封闭的寡核苷酸2的优点是，采用双脱氧核苷酸混合物和能够缺口平移DNA合成的DNA聚合酶，寡核苷酸2的3’端可通过单一碱基被延伸。这使得能够采用替代性的方法，来对底物分子进行5’碱基切除，后续步骤参见下文。采用无封闭的3'-衔接体的缺点是，会在连接反应过程中产生衔接体-二聚体，这会降低衔接体浓度，由此可能会降低衔接体连接效率。同样地，对于该选项，寡核苷酸2还包含修饰的碱基和/或连接，其能通过酶促、化学或物理方式被破坏。

选项2：单链的3’衔接体(图7a)

在能够将单链的衔接体共价结合至双链的(或单链的)底物分子的连接酶(DNA或RNA)的存在下，可从反应中省去寡核苷酸2。

选项3：均聚物3’衔接体(图7a)

在模板非依赖性聚合酶例如末端脱氧核苷酸基转移酶(TdT)、多聚(A)聚合酶、多聚(U)聚合酶或缺乏3'-核酸外切酶校对活性的DNA聚合酶的存在下，并且包含核苷酸，均聚物或其它尾部可被纳入至底物分子的3’末端，其可作为3’衔接体序列。

选项4：受控加尾和同时3’衔接体连接(图7a)

在模板非依赖性聚合酶例如TdT、核苷酸的存在下，并且还包含连接酶和弱化子(attenuator)-衔接体分子，可将合成的尾部和确定的3’衔接体序列纳入底物分子的3’末端。参见2013年3月13日提交的国际专利申请号PCT/US13/31104，其通过引用全文纳入本文。

选项5：省去3’衔接体连接步骤(图7b)

在底物分子包含天然产生的或由先前酶促或其它处理导致的先已存在的3’突出(确定或随机的序列)的情况中，不需要且可省去分开的3’衔接体连接步骤，其中，所述先已存在的3’突出可作为3'衔接体。

在替代性的实施方式中，可将具有锌和其它反应组分的磷酸酶在3’衔接体连接反应完成时添加至该反应。在3’衔接体连接之后进行磷酸酶反应是致使任何未连接的3’衔接体分子无法后续连接的手段，其防止在5’衔接体存在时于后续步骤中形成衔接体二聚体。

(2)5’衔接体连接，其包括在单一孵育中发生的三个步骤

(I)5'衔接体的退火

在单链的3’衔接体连接(选项2)、均聚物添加(选项3)或应用先已存在的3’突出作为3’衔接体(选项5)的情况中，5’衔接体的退火可直接进行而无需其它考虑，因为无寡核苷酸2需要降解或置换。

当采用双链3'-衔接体的连接来产生位于双链DNA的端部的单链的3’突出时(上述选项1a、1b和4)，可采用五种不同选项中的任一种来使5'-衔接体退火至3'-衔接体，其各自在下文中讨论并示于图8：

i)在降解退火至3'衔接体的寡核苷酸2之后

ii)通过对退火至3'衔接体的寡核苷酸2进行竞争性置换

iii)通过，相对于寡核苷酸2的退火位点，使5’衔接体进一步退火至寡核苷酸1的3’，然后进行缺口平移和寡核苷酸2的降解

iv)通过，使5’衔接体预退火至3'衔接体的寡核苷酸1的3’区域，然后进行缺口平移和寡核苷酸2的降解

v)通过，使具有3'封闭基团的5’衔接体预退火至3’衔接体的寡核苷酸1的5’区域(而不是寡核苷酸2)，然后进行3'封闭基团的酶促切除

选项i：

3’衔接体的寡核苷酸2还包含修饰的碱基和/或连接，其能通过酶促、化学或物理方式被破坏。修饰包括但不限于dU-碱基、脱氧次黄苷和RNA碱基。单链的5’衔接体向3’衔接体的寡核苷酸1的5’部分的退火作为3'衔接体的部分降解(具体是寡核苷酸2的部分降解)的结果而发生。在一些实施方式中，寡核苷酸2的降解通过酶促法实现，更具体地，通过采用尿嘧啶-DNA糖苷酶(UDG)，或UDG和无嘌呤/无嘧啶核酸内切酶的组合(如果第二寡核苷酸包含脱氧尿嘧啶碱基)，或通过核酸内切酶V(如果第二寡核苷酸包含脱氧次黄苷碱基)。如果第二寡核苷酸包含RNA碱基，寡核苷酸2的降解也可通过采用RNA酶H1或RNA酶H2的孵育来进行。在一些应用中，第二寡核苷酸的降解可通过化学或物理(例如，通过光)方式来完成。

选项ii：

在一些应用中，5’衔接体向3'衔接体的寡核苷酸1的退火在无需降解寡核苷酸2的情况下发生。在该情况中，用单链的5’衔接体替代寡核苷酸2可利用5’衔接体的高于寡核苷酸2的较高亲和性来促进，这归因于寡核苷酸1和5’衔接体序列之间增加的互补性或归因于5’衔接体内的提高其解链温度碱基修饰(例如，LNA碱基)。取决于5'衔接体的设计，退火至3’衔接体的寡核苷酸1可能会导致5’衔接体的3’端和DNA底物分子的5’端之间的缺口或间隙，或对应地导致5’衔接体和DNA底物分子的3’和5’碱基重叠。

选项iii：

在该情况中，均不采用寡核苷酸2的可降解的修饰或竞争性置换。替代性地，5’衔接体通过如下方式来替代寡核苷酸2：相对于寡核苷酸2的退火位点，退火至3’衔接体，进一步地，寡核苷酸1的3’，随后进行有限的缺口平移"向前咀嚼”，这导致寡核苷酸2的降解或部分降解。

选项iv和v：

在这些情况中，5’衔接体构成3’衔接体的部分，并且其存在于3’衔接体与DNA底物的连接的过程中。在选项iv中，相对于寡核苷酸2的退火位点，5’衔接体预退火至3’衔接体，进一步地寡核苷酸1的3’(类似于选项iii)。在选项v中，5’衔接体在3’端具有封闭基团，并且其是预退火的，由3’衔接体替代寡核苷酸2。在3'衔接体的连接之后，位于5’衔接体的3’端的封闭基团被酶促去除，以允许其通过DNA聚合酶的延伸。

(II)从底物分子移除5'-碱基导致5’磷酸的暴露

在该步骤中，底物分子上连接相容性5'末端磷酸基团的产生通过移除DNA底物分子的破坏的5'末端碱基来实现，所述移除通过如下方式来进行：采用DNA聚合酶和核苷酸进行5’衔接体寡核苷酸的缺口平移(选项i)，采用5’衔接体和5'-侧翼核酸内切酶在不存在核苷酸的情况下进行置换-切割反应(选项ii)，或从寡核苷酸2进行单一双脱氧碱基延伸，然后采用5'-侧翼核酸内切酶在不存在核苷酸的情况下进行置换-切割(选项iii)。对于第三选项，底物分子的5’碱基切除在5’衔接体退火之前发生，因为其替代性地采用退火的寡核苷酸2而不是5'衔接体来进行，但包括在该部分中以简化所述方法的描述(参见图9)。

选项i：

缺口平移DNA合成在5’衔接体寡核苷酸的3’端和所述DNA底物分子的5’端之间的缺口或间隙处起始，并在连接反应封闭缺口时停止(参见图4和6a)。缺口平移反应可通过但不限于DNA聚合酶来进行，例如DNA聚合酶I(全酶)、Taq DNA聚合酶、Tth DNA聚合酶，和BstDNA聚合酶(全酶)。设想采用的其它酶包括但不限于，具有5'-3'核酸外切酶活性的DNA聚合酶、5’侧翼核酸内切酶，和链置换聚合酶与5’侧翼核酸内切酶的组合。

设想的用于该步骤的反应条件包括如下那些：其中(i)具有内源性5'核酸外切酶活性的聚合酶和连接酶均有活性；(ii)链置换聚合酶和侧翼核酸内切酶聚合酶与连接酶均有活性；(iii)侧翼核酸内切酶和连接酶均有活性，(iv)同时发挥热稳定的酶和热不稳定的酶活性；或(v)其中仅可出现热稳定的或仅热不稳定的酶的活性。在一些实施方式中，条件(i)和(ii)各自采用dNTP进行以用于缺口平移。在一个具体实施方式中，Taq聚合酶和大肠杆菌连接酶用于40℃的反应温度。然而，在不同的实施方式中，设想10℃～75℃的反应温度范围。

在5’衔接体延伸产物和DNA底物分子之间发生连接反应之前，缺口平移反应导致一个、两个或更多个碱基从所述DNA底物分子的5’端移除。缺口平移合成可在全部四种核苷酸dGTP、dCTP、dTTP和dATP或其限制性组合的存在下发生。限制性组合包括但不限于三-核苷酸组合，例如dGTP、dCTP和dATP，或dGTP、dCTP和dTTP，或dGTP、dATP和dTTP，或dCTP、dATP和dTTP，二-核苷酸组合，例如dGTP和dCTP，或dGTP和dATP，或dGTP和dTTP，或dCTP和dATP，或dCTP和dTTP，或dATP和dTTP，或仅单核苷酸，例如dGTP，或dCTP，或dATP，或dTTP。

选项ii：

置换-切割反应不要求dNTP但要求5’衔接体序列在3'末端包含一个、两个或更多个随机碱基，以与底物分子产生重叠，并且其在所述反应中包含多个5'衔接体(参见图5和6b)。所述置换-切割反应通过如下方式起始：5'衔接体的退火、与5'衔接体的3’碱基重叠的DNA底物分子的5’DNA碱基的置换，和通过5'-侧翼核酸内切酶对被置换的碱基进行切割。在一些实施方式中，所述5’衔接体在3’端具有一个随机碱基dN。在该情况中，所述重叠涉及一个碱基且仅单一5’碱基将从DNA底物分子的5’端被移除并用来自5’衔接体序列的类似碱基替代。置换-切割反应的效率通过40℃～65℃的反应温度的循环来增加，以允许5'衔接体解离和再退火(如果其末端3’碱基被错配至DNA底物分子的5’碱基)。

选项iii：

在先前步骤中，参与底物分子的5’碱基切除的5’衔接体的替代性实施方式将替代使3’衔接体的寡核苷酸2参与底物分子的5’碱基切除(参见图9)。

在一个方法中(图9a和c)，3’衔接体的寡核苷酸2包含可延伸的3'末端，并且在双脱氧核苷酸混合物和聚合酶的存在下，在合适的条件下，发生单一双脱氧碱基添加，其导致与底物分子的5'末端的单一碱基重叠，其诱导通过合适的侧翼核酸内切酶或具有5’侧翼核酸内切酶活性的聚合酶进行的单一碱基置换-切割。随后，采用在其3'末端具有随机dN碱基的5’衔接体(图9a)，其中，缺口在结合至3'-衔接体之后形成，所述3'-衔接体接合至双链DNA的端部。该缺口可被DNA连接酶封闭，这导致5'衔接体与DNA底物分子的5’末端的共价接合。

或者，可采用在其3'末端缺乏随机dN碱基的5'衔接体寡核苷酸(图9c)，其在结合至3'-衔接体之后形成单一碱基间隙，所述3'-衔接体接合至双链DNA底物分子的端部。该间隙可被缺乏链-置换活性的DNA聚合酶(例如T7或T4DNA聚合酶)填充，以产生缺口，该缺口可进而被DNA连接酶封闭，导致5'衔接体与DNA底物分子的5’端的共价接合。

在另一个可选情况中(参见图9b和d)，包含封闭的3'末端的寡核苷酸2被引物寡核苷酸部分降解或移置，所述引物核苷酸通过具有5’侧翼核酸内切酶活性的DNA聚合酶以单一双脱氧-碱基逐渐延伸，导致从DNA的5'末端切除单一碱基。所述引物寡核苷酸，进而，逐渐被降解或被在其3'末端具有随机dN碱基的5’衔接体置换，以产生能够由DNA连接酶封闭的缺口。

(III)5'衔接体的连接

5’衔接体与底物分子的共价接合涉及5’衔接体或其延伸产物与底物分子的暴露的5’磷酸之间的连接。当DNA底物分子的一个或多个5’碱基的切除通过缺口平移反应来实现时，所述连接反应将聚合酶-延伸的5’衔接体和DNA底物分子的切下的5’端之间的缺口封闭。当DNA底物分子的5’碱基的切除通过置换-切割反应实现时，连接在原始5’衔接体寡核苷酸和DNA底物分子的切下的5’端之间发生。在不同的实施方式中，该步骤中关于连接反应的标准条件包括，采用能够封闭DNA中的缺口或间隙的任何DNA连接酶。在一个实施方式中，所述连接酶是大肠杆菌DNA连接酶，并且所述反应在10℃～50℃的温度范围中发生。在一些实施方式中，所述连接酶是热稳定的DNA连接酶，例如，Taq DNA连接酶，或Ampl连接酶，并且所述反应在30℃～75℃的温度范围中发生。

在本发明的不同的方面中，5’衔接体连接步骤的这三个步骤(I)、(II)和(III)在单一孵育中同时进行，其通过混合并孵育3'-衔接的底物DNA和(i)任选降解核酸内切酶(例如，UDG、核酸内切酶V、RNA酶H，或其组合)；(ii)缺口平移DNA聚合酶或5'-侧翼核酸内切酶；和(iii)DNA连接酶来进行(参见图6)。所述孵育在恒定温度下或采用范围为10℃～75℃的温度循环条件来进行。在其它应用中，3’衔接体部分降解与下游反应分开进行。

NGS文库的构建

Illumina NGS文库的合成可采用本文所述的方法进行。如图10所示，Illumina文库可采用缺口平移连接方法(左侧)或置换切割连接方法(右侧)构建。两种Illumina衔接体的接合的顺序是灵活的，在图10a中，Illumina衔接体P7是3’衔接体且Illumina衔接体P5是5'衔接体，而在图10b中，Illumina衔接体P5是3’衔接体且Illumina衔接体P7是5'衔接体。图10所示的文库可不通过PCR构建或可经PCR扩增的来构建，这取决于输入底物DNA的量。或者，Illumina NGS文库的合成可采用本文公开的方法进行，其中，需要PCR扩增，因为所述方法采用截短型衔接体序列(参见图11)。在该情况中，将P5或P7引入作为截短型衔接体(仅显示了P7)，并且，后跟扩增采用将全长衔接体序列引入并在其5'末端包含可降解的碱基的PCR引物，后跟所得的扩增子的5’部分的降解，P7或P5可通过退火与连接引入。如果替代性地采用截短型可降解的引物用于PCR扩增，则可进行衔接体的剩余部分的桥式-连接来使全长序列完整。

本文公开的方法可用于构建NGS文库，用于多种测序平台，并且另一个示例示于图12和13，其中描述离子激流文库构建。如图12所示，通过引入A衔接体序列在插入接合点处的P1衔接体上的部分重复，可发生3’衔接体连接之后的5’衔接体的后续退火。连接的顺序是灵活的，其中与衔接体A具有部分重复的衔接体P1可被引入，作为3’衔接体，然后采用缺口平移或置换切割进行作为5’衔接体的衔接体A的连接(图12a)。或者，衔接体A可作为3’衔接体被引入，并且，与衔接体A具有部分重复的衔接体P1可以是5’衔接体(图12b)。因为离子激流测序作为来自A衔接体的单一读数来进行，归因于衔接体A在P1衔接体上的部分重复的长度，其将不会干扰测序引物退火或其它衔接体功能。

或者，在图13中，可采用所述方法将组合的条形码引入离子激流文库。在3’衔接体连接步骤过程中，导入双重组合的条形码的第一部分，其邻接所有20种条形码共有的接头区域L。在降解不连接至DNA底物的3’封闭的链之后，使5’衔接体退火至共有接头区域L，其引入邻接接头区域L的双重条形码5’的第二部分。在缺口平移连接之后，所得的文库可采用标准离子激流PCR引物来扩增，并且当从A衔接体侧测序文库分子时，将在读取开始时读取各离子球的样品标识(identification)，其中可获得96种可能的组合。

目标选定的NGS文库的应用

本文公开的方法可用于构建NGS文库，其中特异性靶标可被选定并富集，作为一种相对于全基因组测序而言降低复杂性和测序需求的方式。所述应用的一个示例将是，3’衔接体与5’衔接体与随机片段化、变性且经引物-延伸的DNA底物的接合，其中引物或多种引物退火至已知的靶标DNA区域。在该情况中，仅靶标的基因座将包含双链的末端，其中未选定的基因座将保持为单链的，并且衔接体连接将不在其末端上发生。

在其它应用中，本发明的5’衔接体可用于选定并富集小部分的具有已知末端序列的DNA片段。预选定的DNA序列可包含一个、两个、三个或更多个末端DNA碱基。为了实现所述选择，所述5’衔接体序列应在3’端包含选定的侵入碱基或碱基组合。由此，仅具有选定的末端序列的DNA片段将被连接至5’衔接体并被扩增。如图14所示，具有与选定的限制性片段的末端序列互补的3’末端的5'衔接体可用于从多种限制性片段选择限制性片段靶标。在另一个实施方式中，具有包含CpG双核苷酸的3’末端的5'衔接体将针对源自CpG岛的片段进行富集。

或者，目标选择可在采用本文所述的方法的文库构建之后进行(参见图15)。如果构建这样的文库，其中一个衔接体在其5'末端包含可降解的碱基，后跟靶标特异性引物延伸和衔接体的可降解的部分的部分消化，生物素化的5’衔接体可退火至所得的3’突出，并且采用缺口平移连接(图15a)或置换切割连接(图15b)，所述生物素化的5’衔接体被共价接合至仅靶标DNA底物，并可随后采用链霉亲和素磁珠被捕获，然后PCR扩增以产生足够供于测序的物质。

替代性衔接体设计和应用

还呈现采用本发明方法的若干替代性衔接体设计和连接方法。在图16中，采用单一衔接体序列而非衔接体序列对来构建文库。在该示例中，采用相同的步骤用于底物加工，然后进行连接，以及3’衔接体连接和5'衔接体的缺口平移连接或置换切割连接，并且所得文库可采用单一引物经PCR扩增。

在图17中，呈现了用于连接单一寡核苷酸发夹衔接体的方法，其中，发夹衔接体的5'末端用于进行与底物分子的3’衔接体连接，并且后跟发夹衔接体的封闭的3'末端的降解，所述发夹衔接体的截短型3'末端用于缺口平移连接至底物分子的暴露的5’磷酸。

有时，产生环形DNA文库是有利的，例如，用于构建双端测序(mate-pair)NGS文库的中间结构。如图18所示，所述文库可采用本发明的方法构建。在第一步骤中，3’衔接体连接采用互相互补衔接体X和X'来进行。在非连接的链的降解之后，可通过各底物分子上的3’突出X和X'的互补性进行非共价DNA环化。为了有利于单分子退火并减少多联体形成，该退火反应以合适低的DNA浓度进行。在3’突出退火之后，可进行缺口平移连接。

酶

可按照标准反应条件使用以实践本发明方法的连接酶包括但不限于：T4DNA连接酶、T4RNA连接酶、T3DNA连接酶或T7DNA连接酶、Taq DNA连接酶、Amp连接酶、大肠杆菌DNA连接酶和大肠杆菌RNA连接酶。在不同的实施方式中，本发明设想适于钝端或粘着("粘性")末端连接的反应条件。在一些实施方式中，所述粘性末端，包含5’突出或3’突出。

可用于本发明方法以移除5'或3’磷酸的酶的示例包括但不限于，任何磷酸酶，例如牛小肠碱性磷酸酶、细菌碱性磷酸酶、虾碱性磷酸酶、南极(Antarctic)磷酸酶，和胎盘碱性磷酸酶，其各自根据标准条件使用。此外，可利用T4多核苷酸激酶的磷酸酶活性来移除3’磷酸基团。

用于实践本发明的聚合酶包括但不限于DNA聚合酶(其可包括热稳定的DNA聚合酶，例如，Taq DNA聚合酶)、RNA聚合酶、DNA聚合酶I和逆转录酶。可用于实践本发明的酶的非限制性示例包括但不限于KAPA高保真和KAPA高保真尿嘧啶+、VeraSeq Ultra DNA聚合酶、VeraSeq 2.0高保真DNA聚合酶、Takara PrimeSTAR DNA聚合酶、Agilent Pfu Turbo CX聚合酶、Phusion U DNA聚合酶、Deep VentR^TM DNA聚合酶、LongAmp^TM Taq DNA聚合酶、Phusion^TM高保真DNA聚合酶、Phusion^TM热启动高保真DNA聚合酶、Kapa高保真DNA聚合酶、Q5高保真DNA聚合酶、Platinum Pfx高保真聚合酶、Pfu高保真DNA聚合酶、Pfu Ultra高保真DNA聚合酶、KOD高保真DNA聚合酶、iProof高保真聚合酶、高保真2DNA聚合酶、Velocity高保真DNA聚合酶、ProofStart高保真DNA聚合酶、Tigo高保真DNA聚合酶、Accuzyme高保真DNA聚合酶、DNA聚合酶、DyNAzyme^TM II热启动DNA聚合酶、Phire^TM热启动DNA聚合酶、Phusion^TM热启动High-保真度DNA聚合酶、Crimson LongAmp^TM Taq DNA聚合酶、DyNAzyme^TMEXT DNA聚合酶、LongAmp^TM Taq DNA聚合酶、Phusion^TM高保真DNA聚合酶、带有标准Taq(无Mg)缓冲液的Taq DNA聚合酶、带有标准Taq缓冲液的Taq DNA聚合酶、带有ThermoPol II(无Mg)缓冲液的Taq DNA聚合酶、带有ThermoPol缓冲液的Taq DNA聚合酶、Crimson Taq^TM DNA聚合酶、带有(无Mg)缓冲液的Crimson Taq^TM DNA聚合酶、Phire^TM热启动DNA聚合酶、(exo-)DNA聚合酶、Hemo KlenTaq^TM、Deep VentR^TM(exo-)DNA聚合酶、Deep VentR^TMDNA聚合酶、DyNAzyme^TM EXT DNA聚合酶、Hemo KlenTaq^TM、LongAmp^TM Taq DNA聚合酶、AMV第一链cDNA合成试剂盒、M-MuLV第一链cDNA合成试剂盒、Bst DNA聚合酶、全长、Bst DNA聚合酶、大片段、9°Nm DNA聚合酶、DyNAzyme^TM II热启动DNA聚合酶、Hemo KlenTaq^TM、硫化叶菌DNA聚合酶IV、Therminator^TM γDNA聚合酶、Therminator^TM DNA聚合酶、Therminator^TM II DNA聚合酶、Therminator^TM III DNA聚合酶、Bsu DNA聚合酶、大片段、DNA聚合酶I(大肠杆菌)、DNA聚合酶I、大(Klenow)片段、Klenow片段(3′→5′exo–)、phi29DNA聚合酶、T4DNA聚合酶、T7DNA聚合酶(未修饰的)、末端转移酶、逆转录酶和RNA聚合酶、大肠杆菌多聚(A)聚合酶、AMV逆转录酶、M-MuLV逆转录酶、phi6RNA聚合酶(RdRP)、多聚(U)聚合酶、SP6RNA聚合酶，和T7RNA聚合酶。

具有可用于本发明的侧翼核酸内切酶活性的酶包括但不限于侧翼核酸内切酶1(FEN1)、T5核酸外切酶、Taq DNA聚合酶、Bst聚合酶、Tth聚合酶、DNA聚合酶I及其衍生物。

实施例

实施例1

比较常规衔接体连接与3’衔接体连接，采用FAM-标记的寡核苷酸

原理：采用FAM-标记的寡核苷酸系统，以底物:衔接体的不同摩尔比测试采用填充衔接体(图2A)或3'衔接体(图3)的钝端连接，以测试对于连接效率和嵌合体形成的效果。

材料：

填充衔接体包含寡核苷酸12-900和13-426(表1)

3'衔接体；第1寡核苷酸13-340(表1)

3'衔接体；第2寡核苷酸选项1(在3'末端具有封闭性3’脱氧胸腺嘧啶碱基)13-559(表1)

3'衔接体；第2寡核苷酸选项2(在3'末端具有磷酸基团)13-558(表1)

FAM底物A包含寡核苷酸13-562和13-563，其中FAM基团标记与底物的5’磷酸的连接(表1)

FAM底物B包含寡核苷酸13-561和13-564，其中FAM基团标记与底物的3’OH的连接，并且其中底物的对应的5'末端具有磷酸(表1)

FAM底物C包含寡核苷酸13-560和13-564，其中FAM基团标记与底物的3’OH的连接，并且其中底物的对应的5'末端缺乏磷酸(表1)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

方法：

常规衔接体连接反应在10μl的总体积中组装，其包含1x T4DNA连接酶缓冲液、10皮摩尔的FAM底物A、20或200皮摩尔的填充衔接体、600个单位的T4DNA连接酶(快速)或无连接酶。

3’衔接体连接反应在10μl的总体积中组装，其包含1x T4DNA连接酶缓冲液、10皮摩尔的FAM底物B或10皮摩尔的FAM底物C、20或200皮摩尔的3'衔接体选项1或20或200皮摩尔的3'衔接体选项2和600个单位的T4DNA连接酶(快速)或无T4DNA连接酶。

全部连接反应在25℃进行30分钟。总连接反应体积(10μl)与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照。随后，凝胶用金核酸凝胶染剂(英杰公司(Invitrogen)，目录号S11494)染色(未显示)。

结果：

在填充衔接体和T4DNA连接酶的存在下，FAM底物A被转化成连接产物(图19，泳道1-2)。该常规衔接体连接显示，相较于20:1的比率(泳道2)，仅采用2:1的衔接体:底物比率(图19，泳道1)时，一些FAM底物A嵌合体形成。在不存在T4DNA连接酶时，无连接产物(图19，泳道3)。

泳道4-12中测试了不同情况的3’衔接体连接的(图19)。泳道4和5显示FAM底物B和3’衔接体选项1之间的连接反应。采用2:1(泳道4)或20:1(泳道5)衔接体:底物比时，形成较高分子量的嵌合产物，其可涉及或不涉及3'衔接体。然而，在20:1衔接体:底物的比率下(泳道5)，连接产物的丰度更高，且其形成更有利。泳道6和7显示FAM底物C和3’衔接体选项1之间的连接反应。该反应在20:1衔接体:底物的比率下有利(泳道7)且没有观察到嵌合产物。泳道8和9显示FAM底物B和3’衔接体选项2之间的连接反应。没有观察到连接产物，然而检测到嵌合产物。泳道10和11显示FAM底物C和3’衔接体选项2之间的连接反应。没有观察到连接产物。在不存在T4DNA连接酶时，没有观察到连接产物(泳道12)。

结论：

常规衔接体连接需要FAM底物上的5'-磷酸，如果填充衔接体不过量，其导致形成嵌合体。当FAM底物具有5'羟基基团且3’衔接体具有封闭性3-脱氧胸腺嘧啶碱基(选项1)时，其阻止衔接体分子之间的连接并有利于底物和衔接体之间的连接，3’衔接体的连接更高效且几乎没有嵌合体。在两种情况中，衔接体:底物为20:1的比率有利于连接产物形成。

实施例2

比较常规衔接体连接与3’衔接体连接，采用剪切的、尺寸选择的基因组DNA

原理

进行该实验以测试物理剪切的基因组DNA的精加工对常规或3’衔接体连接的效率的作用

材料：

填充衔接体包含寡核苷酸13-489和13-426(表1)

3'衔接体；第1寡核苷酸13-340(表1)和第2寡核苷酸选项1(在3'末端包含封闭性3’脱氧胸腺嘧啶碱基)13-559(表1)

NE缓冲液2(新英格兰生物实验室公司(New England BioLabs)，目录号B7002S)

100mM 2'-脱氧核苷5'-三磷酸(dNTP)组，PCR级(英杰(生命技术)公司(Invitrogen(Life technologies))，目录号10297-018)

腺苷5′-三磷酸(ATP)(新英格兰生物实验室公司(New England BioLabs)，目录号P0756S)

DNA聚合酶I，大(Klenow)片段(新英格兰生物实验室公司(New EnglandBioLabs)，目录号M0210S)

T4DNA聚合酶(新英格兰生物实验室公司(New England BioLabs)，目录号M0203S)

T4多核苷酸激酶(新英格兰生物实验室公司(New England BioLabs)，目录号M0201S)

核酸外切酶III(大肠杆菌)(新英格兰生物实验室公司(New England BioLabs)，目录号M0293S)

南极(Antarctic)磷酸酶(新英格兰生物实验室公司(New England BioLabs)，目录号M0289S)

南极磷酸酶反应缓冲液(新英格兰生物实验室公司(New England BioLabs)，目录号B0289S)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

大肠杆菌基因组DNA ATCC 11303菌株(昂飞公司(Affymetrix)，目录号14380)

M220聚焦超声仪，(Covaris公司，目录号PN 500295)

Pippin Prep仪(赛吉科学公司(Sage Science))

CDF2010 2％琼脂糖，免染w/内标(赛吉科学公司(Sage Science))

DNA清洁与浓缩仪-5(Zymo研究公司，目录号D4004)

25bp梯标DNA大小标志物(英杰(生命技术)公司(Invitrogen(Lifetechnologies))，目录号10488-022)

方法：

大肠杆菌基因组(gDNA)以100ng/ul的浓度重悬于DNA悬浮缓冲液(天惠华公司(Teknova)，目录号T0227)。DNA采用M220聚焦超声仪片段化成150个碱基对的平均大小。随后，采用Pippin Prep仪在2％琼脂糖凝胶上分离出从约150bp到约185bp的片段化的DNA的紧密大小分布。

200ng的尺寸选定的DNA经历不同的酶的活性。反应在30μl的总体积中组装，其包含终浓度为1x NE缓冲液2、100μM的各dNTP、3个单位的T4DNA聚合酶或5个单位的DNA聚合酶I、大(Klenow)片段或3个单位的T4DNA聚合酶和5个单位的DNA聚合酶I、大(Klenow)片段或3个单位的T4DNA聚合酶和5个单位的DNA聚合酶I、大(Klenow)片段和1个单位的核酸外切酶III。另一反应在30μl的总体积中组装，其包含最终浓度1x NE缓冲液2，1mM ATP、10个单位的T4多核苷酸激酶。另一反应在30μl的总体积中组装，其包含最终浓度1x南极磷酸酶反应缓冲液和5个单位的南极磷酸酶。对照反应采用200ng的尺寸选定的DNA与1x NE缓冲液2组装。所有反应在37℃孵育30分钟，并且DNA采用DNA清洁与浓缩-5柱纯化。DNA在30μl的DNA悬浮缓冲液中洗脱，并以15μl分入2管，供于后续常规衔接体连接或3’衔接体连接。常规衔接体连接在30μl的总体积中组装，其包含1x T4DNA连接酶缓冲液，填充衔接体包含寡核苷酸13-489(220皮摩尔)和13-426(440皮摩尔)，和1200个单位的T4DNA连接酶(快速)。3’衔接体连接反应在30μl的总体积中组装，其包含1x T4DNA连接酶缓冲液、220皮摩尔的3’衔接体第1寡核苷酸、440皮摩尔的3'衔接体第2寡核苷酸，和1200个单位的T4DNA连接酶(快速)。所有反应采用DNA清洁与浓缩-5-柱纯化。DNA重悬于10μl的DNA悬浮缓冲液，并与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，且随后在65℃炉预制的6％聚丙烯酰胺凝胶TBE-Urea(英杰公司(Invitrogen)，目录号S11494)上跑动。所述凝胶用金核酸凝胶染剂(英杰公司(Invitrogen)，目录号S11494)染色并在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察，并采用数码相机拍照。

结果：

需要剪切的DNA底物上的5’磷酸的常规衔接体连接反应(图20，上图)显示效率低于3’衔接体连接(其不需要)(图20，下图)。在仅用T4DNA聚合酶(泳道3)或联合Klenow(泳道7)或Klenow加核酸外切酶III(泳道8)处理DNA之后，对于两种类型的连接，连接反应均更高效。相较于未处理的DNA(泳道2)，仅采用Klenow、T4多核苷酸激酶或南极磷酸酶处理(分别为泳道4、5和6)仅有中等增强的钝端连接。将紧密范围分布片段化的DNA上样至泳道9。

结论：

钝衔接体与剪切的DNA的连接高度依赖于对该DNA的精加工。具有强5’-3’核酸外切酶活性和5’-3’聚合酶活性的DNA聚合酶如T4DNA聚合酶良好适于该目的。常规衔接体连接反应依赖于底物的钝端上的完整5’磷酸的存在。然而，3’衔接体的连接并非如此，因为所述连接在片段化的DNA的3’羟基末端上发生。因为剪切的DNA的5'末端不是T4DNA聚合酶的酶促底物，这解释了为什么3’衔接体比填充衔接体更成功地连接(泳道3)。T4DNA聚合酶加Klenow和核酸外切酶III的组合显著增强了钝端连接。核酸外切酶III活性通过移除3’羟基末端产生进行钝衔接体的连接所需要的钝端，其可在DNA的3'末端被破坏。核酸外切酶III也具有3’磷酸酶活性，其使3'末端对DNA聚合酶精加工活性可及。

实施例3

用于5’衔接体连接的温度优化，采用FAM-标记的寡核苷酸底物

原理：该实验评估了对于缺口平移介导的5’衔接体连接的温度依赖性和dNTP组合物。

材料：

5’衔接体寡核苷酸用于缺口平移(13-144)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

大肠杆菌DNA连接酶(新英格兰生物实验室公司(New England BioLabs)，目录号M0205S)

10X大肠杆菌DNA连接酶反应缓冲液(新英格兰生物实验室公司(New EnglandBioLabs))

Taq DNA聚合酶，浓缩型25U/ul(金斯瑞公司(Genscript)，目录号E00012)

方法：

第一组缺口平移反应在30μl的总体积中组装，其包含终浓度为1x大肠杆菌DNA连接酶缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于缺口平移和45皮摩尔的寡核苷酸模板、200μM的dTTP或200uM的各dTTP/dGTP的混合物或200uM的各dATP/dTTP/dGTP和2.5个单位的Taq DNA聚合酶或无Taq DNA聚合酶。所述反应在30℃、40℃或50℃孵育30分钟。

连接后的第二组缺口平移反应在30ul中组装，其包含终浓度为1x大肠杆菌DNA连接酶缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于缺口平移和45皮摩尔的寡核苷酸模板、200uM的各dATP/dTTP/dGTP，和2.5个单位的Taq DNA聚合酶。反应在50℃、53℃、56℃或60℃孵育30分钟。那些反应的10μl用于凝胶分析。添加10个单位的大肠杆菌连接酶至20μl，静置并在25℃孵育15分钟。额外的对照反应在30ul中组装，其包含终浓度为1x大肠杆菌DNA连接酶缓冲液，和30皮摩尔的FAM寡核苷酸底物。那些反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(ClareChemical Research))上观察并采用数码相机拍照。

结果：

如图21所示，图A，Taq DNA聚合酶延长了5’衔接体寡核苷酸的3’羟基末端用于缺口平移，通过其5’侧翼核酸内切酶活性移除了FAM寡核苷酸底物上的核苷酸。仅添加dTTP(图21，泳道2、5、8，图A)仅允许添加一个碱基至5’衔接体寡核苷酸的3'末端用于缺口平移，添加dTTP/dGTP(图21，泳道3、6、9，图A)允许添加三个碱基，而添加dTTP/dGTP/dATP(图21，泳道4、7、10，图A)允许添加四个碱基，其与从FAM寡核苷酸底物切割的碱基数量成比例(图21，图A)。从FAM寡核苷酸底物切割的碱基数量也取决于反应发生的温度。在50℃(图21，泳道2-4，图A)，从FAM寡核苷酸底物切割的碱基的量大于在40℃或30℃切割的那些。缺口平移的效率和切割的FAM寡核苷酸底物的量也高度依赖于反应的温度。在40℃或30℃，仅添加dTTP(图21，泳道5、8，图A)，未允许对FAM寡核苷酸底物的任何切割，如同在50℃观察到的那样(图21，泳道2，图A)。添加dTTP/dGTP或dTTP/dGTP/dATP允许在40℃(泳道6和7)或30℃(泳道9和10)的一些切割，其效率低于50℃(泳道3和4)。泳道1(图21，图A)显示在不存在TaqDNA聚合酶的情况下的FAM寡核苷酸底物。

缺口平移的效率和切割的FAM寡核苷酸底物的量高度依赖于反应温度。在60℃，FAM寡核苷酸底物几乎完全加工成较小物质(图21，泳道4，图B)。FAM寡核苷酸底物切割产物大小也随着反应温度的升高而减小(图21，泳道1-4，图B)。泳道5(图21，图B)显示在不存在Taq DNA聚合酶的情况下的FAM寡核苷酸底物。在缺口平移反应过程中，Taq DNA聚合酶切割FAM寡核苷酸底物的5'末端并产生末端5’磷酸，其是大肠杆菌连接酶共价连接5’衔接体寡核苷酸的3'末端至FAM寡核苷酸底物的5'末端所必需的。连接效率依赖于反应发生的温度。连接产物在50℃(泳道6)丰度较高，而在60℃(泳道9)几乎不存在，并且，中等量的连接产物在53℃和56℃产生。

结论：

在缺口平移过程中，从FAM寡核苷酸底物切割的碱基数量取决于引入所述反应的互补dNTP和反应发生的温度。在缺口平移反应的过程中，Taq DNA聚合酶切割FAM寡核苷酸底物的5'末端，并产生大肠杆菌连接酶连接两种片段所必需的末端5’磷酸。通过在较高温度下缺口平移而切割的FAM寡核苷酸底物对于通过大肠杆菌连接酶的连接而言是较差的底物，因为在5’衔接体寡核苷酸的3'末端和FAM寡核苷酸底物的5'末端之间可能形成间隙。

实施例4

分析dNTP组合物对于5’衔接体连接的作用

原理：进行该实验以评估不同dNTP组合物存在下发生的缺口平移的程度和对于成对的连接反应的作用。

材料：

5’衔接体寡核苷酸用于缺口平移(13-144)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

大肠杆菌DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6090L)

10X大肠杆菌DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6090)

Taq-B DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7250L)

方法：

反应在30μl的总体积中组装，其包含终浓度为1x大肠杆菌DNA连接酶缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于缺口平移和45皮摩尔的寡核苷酸模板、200μM的各4dNTP或200μM的如下各物的混合物：dCTP、dTTP、dGTP或dATP，dTTP、dGTP或dATP，dCTP、dGTP或dATP，dTTP、dCTP或无dNTP，10个单位的大肠杆菌连接酶和10个单位的Taq-B DNA聚合酶。所有反应在40℃孵育30分钟。那些反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照(下图)。随后，凝胶用金核酸凝胶染剂(英杰公司(Invitrogen)，目录号S11494)染色，在Dark读取灯箱(克莱尔化学研究公司(ClareChemical Research))上观察并采用数码相机拍照(上图)。

结果：

图22的前两个泳道显示对照寡核苷酸。在不存在Taq-B DNA聚合酶的情况下，仅大肠杆菌连接酶无法连接5’衔接体寡核苷酸至FAM寡核苷酸底物，因为FAM底物缺乏5’磷酸修饰(图22，泳道3)。在存在Taq-B DNA聚合酶和4种dNTP的情况下，5’衔接体寡核苷酸被延伸，形成58个碱基的新产物，并且FAM寡核苷酸底物通过Taq-B DNA聚合酶的5’侧翼核酸内切酶活性被置换和降解(图22，泳道4)。在大肠杆菌连接酶、Taq-B DNA聚合酶和dATP/dTTP/dGTP(图22，泳道7)或dCTP/dTTP/dGTP(图22，泳道6)或dATP/dTTP/dCTP(图22，泳道9)的存在下，缺口平移被分别限制于四个、三个或一个碱基的添加。随着5'衔接体的延伸，在FAM寡核苷酸底物的5'末端形成侧翼。该侧翼成为Taq-B 5’侧翼核酸内切酶活性的底物，该酶产生连接所需的5’磷酸。5’衔接体被连接至FAM寡核苷酸底物，形成69个碱基的产物。相较于一个碱基的侧翼(图22，泳道9)，三个或四个碱基的侧翼(图22，泳道6和7)支持更高效的连接。在大肠杆菌连接酶、Taq-B DNA聚合酶和dATP/dCTP/dGTP的存在下(图22，泳道8)，观察到对应于连接产物的较淡条带。弱连接活性可能来自于"未匹配的"碱基(A、C或G代替T)的纳入，导致在一些FAM寡核苷酸底物上形成侧翼。在大肠杆菌连接酶、Taq-B DNA聚合酶存在且无dNTP的情况下，没有观察到连接产物。在大肠杆菌连接酶、Taq-B DNA聚合酶和4种dNTP的存在下，5’衔接体连接至FAM寡核苷酸底物，形成69个碱基的产物(图22，泳道5)。因为5’衔接体和寡核苷酸模板相对于FAM寡核苷酸底物是过量的，也在58个碱基处观察到缺口平移产物(图22，泳道5，上图)。然而，观察到相同量的连接产物。25bp梯标DNA大小标志物上样于泳道M。

结论：

FAM寡核苷酸底物的5'末端的磷酸化是连接所需的。在dNTP存在下，需要Taq DNA聚合酶的聚合酶活性以形成5'衔接体的延伸，其在FAM寡核苷酸底物的5'末端产生侧翼。该侧翼对于Taq DNA聚合酶的5’侧翼核酸内切酶活性而言是良好底物，其对于通过大肠杆菌连接酶的连接而言产生完美的5’磷酸底物。即便仅通过一个碱基形成侧翼，也发生连接。当全部四种dNTP存在时，也发生连接，其不限制侧翼的长度或缺口平移的程度，表明连接在FAM寡核苷酸底物5'末端的5'磷酸产生之后立即发生。

实施例5

采用热稳定酶的成对的缺口平移-连接反应

原理：进行该实验以评估成对反应中反应温度和Taq DNA聚合酶的单位数量的作用。

材料：

5’衔接体寡核苷酸用于缺口平移(13-144)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

Taq DNA连接酶(新英格兰生物实验室公司(New England BioLabs)，目录号M0208S)

10X Taq DNA连接酶反应缓冲液(新英格兰生物实验室公司(New EnglandBioLabs))

方法：

反应在30μl的总体积中组装，其包含终浓度为1x Taq DNA连接酶反应缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于缺口平移和45皮摩尔的寡核苷酸模板，200μM的如下各物：dATP、dTTP、dGTP或dTTP、40个单位的Taq DNA连接酶，或80个单位的Taq DNA连接酶，或120个单位的Taq DNA连接酶和10个单位的Taq DNA聚合酶。反应在45℃、50℃、55℃或60℃孵育30分钟。那些反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照。

结果：

Taq DNA聚合酶延长了5’衔接体寡核苷酸的3’羟基末端，通过其5’侧翼核酸内切酶活性移除了FAM寡核苷酸底物上的核苷酸。添加dTTP/dGTP/dATP(图23，泳道2-5，图A)或dTTP(图23，泳道6-9，图A)允许在5’衔接体寡核苷酸的3'末端分别添加四个和一个碱基，以及FAM寡核苷酸底物的5'末端的后续切割。在60℃，所述连接是不成对的(图23，泳道5和9，图A)。连接效率不受添加dTTP/dGTP/dATP(图23，泳道2-5，图A)或dTTP(图23，泳道6-9，图A)的影响。连接效率依赖于反应中存在的Taq DNA连接酶的量。相较于40或80个单位(图23，分别为泳道2和3，图B)，当向反应添加120个单位的Taq DNA连接酶时(图23，泳道4，图B)，连接产物丰度更高。泳道1、图A和泳道1、图B显示无酶对照寡核苷酸。

结论：

在缺口平移反应过程中，Taq DNA聚合酶切割FAM寡核苷酸底物的5’末端，并产生Taq DNA连接酶所需的5’磷酸末端，以在45℃～60℃进行连接。该连接在60℃减少。反应中Taq DNA连接酶的浓度也影响连接效率，因为相较于80U和40U，在120U酶的存在下观察到更多产物。

实施例6

成对置换-切割-连接反应

原理：进行该实验以显示，在成对的置换-切割连接反应中，热稳定的Taq DNA连接酶或热不稳定的大肠杆菌连接酶能与Taq DNA聚合酶合并。

材料：

5’衔接体寡核苷酸用于置换-切割(13-156)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

方法：

反应在30μl的总体积中组装，其包含终浓度为1x大肠杆菌DNA连接酶反应缓冲液或1x Taq DNA连接酶反应缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于置换-切割和45皮摩尔的寡核苷酸模板、10个单位的大肠杆菌DNA连接酶或40个单位的Taq DNA连接酶，和10个单位的Taq DNA聚合酶。反应在40℃或45℃孵育30分钟。那些反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照。

结果：

用于置换-切割的5’衔接体寡核苷酸在其3'末端具有额外匹配碱基"T"，其与FAM寡核苷酸底物的5’末端重叠。当5’衔接体寡核苷酸的3'末端置换FAM寡核苷酸底物的5’末端时，Taq DNA聚合酶的5’侧翼核酸内切酶活性切割FAM寡核苷酸底物的5’末端，以产生5’磷酸，其是采用大肠杆菌连接酶(图24，泳道2，图A)或Taq DNA连接酶(图24，泳道2，图B)的连接所必需的。图A和B的泳道1显示无酶寡核苷酸对照。

结论：

在不存在dNTP的情况下，无5’衔接体延伸发生。然而，Taq DNA聚合酶可切割FAM寡核苷酸底物的5’末端并产生末端5’磷酸，其对于大肠杆菌DNA连接酶或Taq DNA连接酶进行连接而言是必需的。

实施例7

成对的置换-切割-连接反应，其采用"N"通用/简并或"T"底物特异性5’衔接体3’突出

原理：该实验显示，如果5’衔接体3'末端突出是序列特异性匹配的或如果其包含简并非序列特异性'N'，可进行采用侧翼核酸内切酶的5’衔接体连接。

材料：

5’衔接体寡核苷酸用于置换-切割"T"(13-607)(表1)

5’衔接体寡核苷酸用于置换-切割"N"(13-596)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

方法：

反应在30μl的总体积中组装，其包含终浓度为1x Taq DNA连接酶反应缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸"T"或45皮摩尔的5’衔接体寡核苷酸"N"1或180皮摩尔的5’衔接体寡核苷酸"N"或450皮摩尔的5’衔接体寡核苷酸"N"和45皮摩尔的寡核苷酸模板、40个单位的Taq DNA连接酶，和10个单位的Taq DNA聚合酶。反应在45℃或50℃或55℃孵育30分钟或在45℃3分钟、65℃15秒循环8次。那些反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，在Dark读取灯箱(克莱尔化学研究公司(ClareChemical Research))上观察并采用数码相机拍照。

结果：

当用于置换-切割的5’衔接体寡核苷酸在其3'末端具有匹配寡核苷酸模板的"T"时(图25，泳道3、5、7，图A)，(其与FAM寡核苷酸底物的5’末端重叠)，连接以较高速率发生，高于当5’衔接体寡核苷酸具有简并"N"碱基，其中在寡聚物合成过程中，全部四种核苷酸在该位置存在的情况(图25，泳道2、4、6，图A)，其仅是四分之一时间对于寡核苷酸模板的完美匹配。测试了不同的反应温度(45℃、50℃和55℃)，没有采用5’衔接体寡核苷酸"N"改善连接(图25，泳道2、4、6，图A)。同样地，测试了不同的量的5’衔接体寡核苷酸"N"(45皮摩尔、180皮摩尔和450皮摩尔)，没有改善连接反应(图25，泳道3-5，图B)。然而，所述反应的45℃～65℃的温度循环允许连接以最高速率发生，其与"T"匹配碱基5’衔接体寡核苷酸相当(图25，泳道6，图B)。图A和B的泳道1显示无酶寡核苷酸对照。

结论：

为了允许与采用5’衔接体寡核苷酸"N"的置换-切割配合的高效5’衔接体连接，用于Taq DNA连接酶以操作的第一温度和其中寡核苷酸模板和5’衔接体寡核苷酸"N"之间的双链体可分离的第二温度之间的循环是关键的。所述循环条件允许5’衔接体寡核苷酸"N"和寡核苷酸模板之间的多重相关，其中如果5’衔接体寡核苷酸的3'末端碱基与模板完美匹配，并且可置换FAM寡核苷酸底物的5’末端，则仅发生置换-切割反应。

实施例8

采用DNA聚合酶I的成对缺口平移-连接反应

原理：该实验显示具有5'-3'核酸外切酶活性的DNA聚合酶I也可参与与衔接体连接方法成对的缺口平移。

材料：

5’衔接体寡核苷酸用于缺口平移(13-144)(表1)

FAM寡核苷酸底物(13-581)(表1)

寡核苷酸模板(13-582)(表1)

大肠杆菌DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6090L)

Taq-B DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7250L)

DNA聚合酶I(新英格兰生物实验室公司(New England BioLabs)，目录号M0209S)

方法：

反应在30μl的总体积中组装，其包含终浓度为1x大肠杆菌DNA连接酶缓冲液、30皮摩尔的FAM寡核苷酸底物、45皮摩尔的5’衔接体寡核苷酸用于缺口平移和45皮摩尔的寡核苷酸模板、200μM的各4种dNTP、10个单位的大肠杆菌连接酶和10个单位的Taq-B DNA聚合酶或5个单位的DNA聚合酶I或1单位的DNA聚合酶I。反应在40℃、18℃、16℃或14℃孵育30分钟。各反应的10μl与10μl的2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，采用或不采用SYBR金(分别为上图和下图)在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照。

结果：

图26的第一泳道显示无酶对照。在Taq-B DNA聚合酶和大肠杆菌连接酶的存在下(图26，泳道2)，5’衔接体寡核苷酸连接至FAM寡核苷酸底物，产生69个碱基的产物(图26，泳道2，上图和下图)，或完全延伸，形成58个碱基的新产物(图26，泳道2，上图)。69碱基产物来自通过Taq-B DNA聚合酶进行的延伸，并且在FAM寡核苷酸底物的5’端形成侧翼。Taq-B 5’侧翼核酸内切酶活性切割侧翼并产生5’磷酸，其被大肠杆菌连接酶利用，以使连接完整。当FAM寡核苷酸底物在延伸过程中完全被置换并被Taq-B DNA聚合酶的5’侧翼核酸内切酶活性降解时，获得58个碱基的产物。当Taq-B DNA聚合酶被DNA聚合酶I替代时(图26，泳道3-8)，也形成这两个类型的产物，所述DNA聚合酶I具有5′→3′核酸外切酶活性，其一个又一个地移除生长的DNA链头部的核苷酸，并允许发生缺口平移。该反应采用5个单位的DNA聚合酶I(图26，泳道3-5)或1单位的DNA聚合酶I(图26，泳道6-8)进行。采用嗜热Taq-B DNA聚合酶的反应在40℃进行(图26，泳道2)，而采用嗜常温DNA聚合酶I的反应在18℃(图26，泳道3和6)、16℃(图26，泳道4和7)或14℃(图26，泳道5和8)进行。在全部情况中获得69个碱基的连接产物，但仅添加1单位的DNA聚合酶I(图26，泳道6-8)比采用5个单位(图26，泳道3-5)更高效。这解释了DNA聚合酶的极强的5′→3′核酸外切酶活性，其造成FAM寡核苷酸底物在其可被连接之前的快速部分降解。在下图的底部观察到降解产物(图26，泳道3-5)。25bp梯标DNA大小标志物上样于泳道M。

结论：

Taq-B DNA聚合酶(嗜热聚合酶)和DNA聚合酶I(嗜常温聚合酶)均能用于进行缺口平移介导的连接，但它们需要不同的条件以完全发挥活性。它们均产生69个碱基的产物，其是在连接之前切除5’端的结果，但它们采用不同的机制。尽管Taq-B产生侧翼，该侧翼被切割以产生所需的5’磷酸化的末端供于通过大肠杆菌连接酶的连接，DNA聚合酶I在生长的链的前方一个又一个地移除核苷酸，并产生5’磷酸化的核苷酸，其为用于大肠杆菌连接酶以接合两种片段的完美底物。DNA聚合酶I可用于进行缺口平移介导的5’衔接体连接。

实施例9

物理剪切的DNA的钝端连接需要精加工，并且脱磷酸防止嵌合连接产物的形成

原理：该实验显示，末端精加工和脱磷酸对于衔接体与物理剪切的DNA底物的钝端连接的重要性。

材料：

Blue缓冲液(安赛麦蒂公司(Enzymatics)，目录号B0110)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

虾碱性磷酸酶(昂飞公司(Affymetrix)，目录号78390)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

M220聚焦超声仪，(Covaris，目录号PN 500295)

Pippin Prep仪(赛吉科学公司(Sage Science))

DNA清洁与浓缩仪-5(Zymo研究公司，目录号D4004)

CDF2010 2％琼脂糖，免染w/内标(赛吉科学公司(Sage Science))

方法

大肠杆菌gDNA以100ng/ul的浓度重悬于DNA悬浮缓冲液(天惠华公司(Teknova)，目录号T0227)。DNA采用M220聚焦超声仪片段化成150个碱基对的平均大小。随后，采用Pippin Prep仪从2％琼脂糖凝胶尺寸选择从约150bp到约185bp的片段化的DNA的紧密分布。

在反应A的组中，100ng或500ng的尺寸选定的DNA经历精加工酶的活性。所述反应在30μl的总体积中组装，其包含终浓度为1x Blue缓冲液、100μM的各dNTP、3个单位的T4DNA聚合酶、5个单位的DNA聚合酶I、大(Klenow)片段、1mM ATP、10个单位的T4多核苷酸激酶。反应在30℃孵育20分钟。DNA采用DNA清洁与浓缩-5柱纯化。DNA在15μl的DNA悬浮缓冲液中洗脱，并且进行后续脱磷酸反应B，然后进行衔接体连接或不经脱磷酸直接置入连接反应。脱磷酸反应在30μl终体积中组装，包括处理的DNA、1x Blue缓冲液，和1单位的虾碱性磷酸酶。反应在37℃孵育10分钟。DNA采用DNA清洁与浓缩-5柱纯化并在15μl的DNA悬浮缓冲液中洗脱。

在一组反应C中，使100ng的尺寸选定的DNA经历脱磷酸，然后进行精加工，或者在一组反应D中直接精加工。脱磷酸反应在30μl终体积中组装，包括加工的DNA、1x Blue缓冲液，和1单位的虾碱性磷酸酶。反应在37℃孵育10分钟。DNA采用DNA清洁与浓缩-5柱纯化并在15μl的DNA悬浮缓冲液中洗脱。精加工反应D在30μl的总体积中组装，其包含终浓度为1xBlue缓冲液、100μM的各dNTP、3个单位的T4DNA聚合酶、5个单位的DNA聚合酶I、大(Klenow)片段，(泳道6-7)。DNA采用DNA清洁与浓缩-5柱纯化并在15μl的DNA悬浮缓冲液中洗脱。

纯化后，全部先前反应经历连接反应。反应在30μl的终体积中组装，包含加工的DNA、1x T4DNA连接酶反应缓冲液和1200个单位的T4DNA连接酶。反应在25℃孵育15分钟。来自各个连接的33ng的DNA与2x甲酰胺上样缓冲液(97％甲酰胺，10mM EDTA，0.01％溴酚蓝和0.01％二甲苯蓝)混合，在95℃加热5分钟，随后在65℃炉中预制的15％聚丙烯酰胺凝胶(TBE-Urea(英杰公司(Invitrogen)，目录号S11494))上跑动，用SYBR金染色，在Dark读取灯箱(克莱尔化学研究公司(Clare Chemical Research))上观察并采用数码相机拍照。

结果：

在精加工之前，物理剪切的DNA对于通过T4DNA连接酶进行的钝端的衔接体的连接不是合适的底物(图27，泳道1)。采用T4多核苷酸激酶、T4DNA聚合酶和Klenow片段的精加工之后，DNA端部是钝的，一些5'末端被磷酸化，并且分子能彼此连结或连接，并连结或连接至钝的衔接体(图27，泳道2和4)。约325个碱基、约500个碱基和超过500个碱基的物质分别对应于约175碱基的2个分子、3个分子和4个分子在一起的连接(图27，泳道2和4)。DNA的浓度影响连接产物的形成。在较高浓度的DNA存在时，较高分子量的嵌合连接物质丰度较高(图27，泳道4)。精加工步骤之后，采用虾碱性磷酸酶的DNA处理影响DNA分子之间的多联体形成(图27，泳道3和5)。如果在片段化的DNA的精加工之前进行，采用虾碱性磷酸酶的处理也阻止多联体形成(图27，泳道6)。相较于采用T4DNA聚合酶、Klenow和T4多核苷酸激酶的精加工(图27，泳道2)，采用T4DNA聚合酶和Klenow片段的精加工之后观察到的连接产物(图27，泳道7)的丰度较低。

结论：

物理剪切的DNA的钝连接效率取决于通过DNA聚合酶进行的末端精加工。所述连接也通过添加T4多核苷酸激酶而得到改善，其使DNA片段的5’末端磷酸化并使3'末端去磷酸化。DNA的浓度也影响连接的量和嵌合产物的形成。在较高浓度下，DNA更可能在T4DNA连接酶的存在下形成嵌合产物。碱性磷酸酶移除5’磷酸(其为连接所需的)并阻止嵌合连接产物(多联体)的形成。

实施例10

当采用与衔接体连接反应成对的5’碱基修剪制备时，NGS文库具有增加的产量。

原理：该实验显示了其示例性应用于NGS文库构建中存在的反应的应用，尤其是文库产量的增加，其获自包括了与5’衔接体连接成对的5’碱基修剪。文库由尺寸选择的剪切的DNA构建，因此文库产物可容易地通过凝胶电泳来观察。

材料：

Blue缓冲液(安赛麦蒂公司(Enzymatics)，目录号B0110)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

Klenow片段(安赛麦蒂公司(Enzymatics)，目录号P7060L)

T4DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7080L)

T4多核苷酸激酶(安赛麦蒂公司(Enzymatics)，目录号Y904L)

虾碱性磷酸酶(昂飞公司(Affymetrix)，目录号78390)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

3'衔接体；第1寡核苷酸13-501(表1)

3'衔接体；第2寡核苷酸13-712(表1)

M220聚焦超声仪，(Covaris公司，目录号PN 500295)

大肠杆菌DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6090L)

大肠杆菌DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6090)

尿嘧啶-DNA糖苷酶(安赛麦蒂公司(Enzymatics)，目录号G5010L)

Taq-B DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7250L)

5’衔接体寡核苷酸用于缺口平移(13-489)(表1)

5’衔接体寡核苷酸用于置换-切割(13-595)(表1)

Taq DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6060L)

SPRIselect(贝克曼库尔特公司(Beckman Coulter)，目录号B23419)

方法：

大肠杆菌基因组DNA以100ng/μl的浓度重悬于DNA悬浮缓冲液(天惠华公司(Teknova)，目录号T0227)。DNA采用M220聚焦超声仪片段化成150个碱基对的平均大小。随后，采用Pippin Prep仪从2％琼脂糖凝胶尺寸选择从约150bp到约185bp的片段化的DNA的紧密分布。

利用增强的衔接体连接方法，采用100ng的尺寸选择的大肠杆菌基因组DNA来制备文库。精加工反应在30μl中组装，包含终浓度为1x Blue缓冲液、100μM的各dNTP、3个单位的T4DNA聚合酶、5个单位的DNA聚合酶I、大(Klenow)片段、10个单位的T4多核苷酸激酶。反应在37℃孵育20分钟。DNA采用DNA清洁与浓缩-5纯化并在15μl中采用DNA悬浮缓冲液洗脱。3’衔接体连接反应在30μl中组装，包括，1x T4DNA连接酶缓冲液、220皮摩尔的3’衔接体第1寡核苷酸、440皮摩尔的3’衔接体第2寡核苷酸、15μl的纯化DNA和1200个单位的T4DNA连接酶。反应在25℃孵育15分钟。将DNA置于至多50μl的体积并采用70μl SPRIselect珠(比率1.4x)进行纯化和大小选择。DNA在15μl的DNA重悬缓冲液中洗脱。3'衔接体的部分降解，5'衔接体的退火，5’衔接体的5'端修剪和连接均在下一反应中发生，其在30μl的终体积中组装，包含1x大肠杆菌DNA连接酶缓冲液或1x Taq DNA连接酶缓冲液、200μM的各dNTP或200μM的各dATP、dTTP、dGTP或无dNTP、200皮摩尔的5’衔接体寡核苷酸用于缺口平移或5’衔接体寡核苷酸用于置换-切割、10个单位的大肠杆菌连接酶或40个单位的Taq DNA连接酶、2个单位的尿嘧啶-DNA糖苷酶、10个单位的Taq-B DNA聚合酶和15μl的在3’衔接体连接反应之后纯化的DNA。反应在40℃或45℃孵育10分钟或采用30个如下循环(45℃45秒–65℃5秒)(文库5)。将DNA置于至多50μl体积并采用40μl的SPRIselect珠(比率0.8x)进行纯化和大小选择。DNA在20μl中洗脱并采用Kapa文库定量试剂盒-Illumina/通用(目录号KK4824)通过qPCR定量。

结果：

文库浓度报告在图中(图28，图A)且文库在6％聚丙烯酰胺凝胶上通过在变性条件下进行电泳来观察(图28，图B)。输入DNA在约150个碱基和约185个碱基之间迁移(图28，泳道I，图B)。在3’衔接体连接步骤之后取等份并上样在凝胶上。该产物在约225到约250个碱基之间迁移，其对应于添加64个碱基的3’衔接体(图28，泳道L，图B)。Taq-B DNA聚合酶在5’衔接体的连接之前去除一个或多个碱基并暴露DNA的5'末端的5'磷酸基团中的贡献示于文库1对比2(图28，泳道1和2，图A和B)。不采用Taq-B制得的文库1的浓度(2.6nM)是采用Taq-BDNA聚合酶制得的文库2(7.9nM)的三分之一。甚至在采用T4多核苷酸激酶处理之后，75％的片段化的DNA需要其5'末端的加工，以变得连接相容。完成的文库也在凝胶上上样(图28，泳道1和2，图B)。这些文库在约275碱基和约300碱基之间迁移，其对应于添加58个碱基的用于缺口平移的5’衔接体寡核苷酸或用于置换-切割的5’衔接体寡核苷酸和64个碱基的3'衔接体。文库1产物显示的强度低于文库2的条带(图28，图B)。在3'衔接体的部分降解，5'衔接体的退火，5'端修剪和5’衔接体步骤的连接过程中，文库3和4分别采用dATP、dTTP、dGTP和大肠杆菌连接酶或Taq DNA连接酶制备。文库3浓度(4.8nM)是文库2(7.9nM)的约60％。产量的这一30％的损失相关于大肠杆菌基因组中胸腺嘧啶"C"的百分比(25％)。每次DNA底物的5'末端是胸腺嘧啶，用于缺口平移的5’衔接体寡核苷酸无法通过Taq延伸且5'末端无法被修整。还有额外的6.25％和1.5％的可能性以在DNA底物的5'末端分别具有两个和三个连续的胸腺嘧啶。当与40℃的大肠杆菌连接酶(5.2nM)(文库3)相比时，在45℃采用Taq DNA连接酶的连接(文库4)获得了相似的产量(4.8nM)。文库5，其采用用于置换-切割的5’衔接体寡核苷酸制备，(4.2nM)其效率低于采用用于缺口平移的5’衔接体寡核苷酸制备的文库2(7.9nM)。

结论：

文库采用本文公开的衔接体连接方法成功制得。相较于不具有5’端加工步骤的文库而言，通过Taq DNA聚合酶进行的5'端DNA修剪允许5’衔接体连接产物的产量的三倍增加(文库1对比2)。Taq DNA连接酶(文库4)和大肠杆菌连接酶(文库3)均在缺口平移之后高效地连接5’衔接体。Taq DNA连接酶特在置换-切割之后连接5’衔接体(文库5)。在缺口平移过程中采用4种dNTP(文库2)而不是3种(文库3和4)可允许连接更多DNA底物至5'衔接体。

实施例11

采用与衔接体连接成对的5’碱基修剪制备的NGS文库的序列分析

原理：该实验显示在其示例性应用至NGS文库构建中存在的反应的应用。文库由剪切的大肠杆菌DNA构建，然后测序，以显示在基因组的宽碱基组成范围上获得的覆盖的优越的均匀性。

材料：

Blue缓冲液(安赛麦蒂公司(Enzymatics)，目录号B0110)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

Klenow片段(安赛麦蒂公司(Enzymatics)，目录号P7060L)

T4DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7080L)

T4多核苷酸激酶(安赛麦蒂公司(Enzymatics)，目录号Y904L)

虾碱性磷酸酶(昂飞公司(Affymetrix)，目录号78390)

T4DNA连接酶(快速)(安赛麦蒂公司(Enzymatics)，目录号L6030-HC-L)

10X T4DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6030)

3'衔接体；第1寡核苷酸13-510(表1)

3'衔接体；第2寡核苷酸13-712(表1)

M220聚焦超声仪，(Covaris公司，目录号PN 500295)

大肠杆菌DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6090L)

尿嘧啶-DNA糖苷酶(安赛麦蒂公司(Enzymatics)，目录号G5010L)

Taq-B DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7250L)

5’衔接体寡核苷酸用于缺口平移(13-489)

SPRIselect(贝克曼库尔特公司(Beckman Coulter)，目录号B23419)

方法：

大肠杆菌基因组DNA以100ng/μl的浓度重悬于DNA悬浮缓冲液(天惠华公司(Teknova)，目录号T0227)。DNA采用M220聚焦超声仪片段化成150个碱基对的平均大小。采用100ng的大肠杆菌Covaris基因组DNA来制备文库。脱磷酸的第一反应在15μl的总体积中组装，包含终浓度为1x Blue缓冲液，100ng的片段化的大肠杆菌基因组DNA和1单位的虾碱性磷酸酶。反应在37℃孵育10分钟。虾碱性磷酸酶在65℃失活处理5分钟。精加工反应在30μl中组装，包含终浓度为1x Blue缓冲液、100μM的各dNTP、3个单位的T4DNA聚合酶、5个单位的DNA聚合酶I、大(Klenow)片段和15μl的去磷酸化反应。反应在20℃孵育30分钟。DNA采用DNA清洁与浓缩-5纯化。DNA在15μl中采用DNA悬浮缓冲液洗脱。3’衔接体连接反应在30μl中组装，包括，1x T4DNA连接酶缓冲液、220皮摩尔的3’衔接体第1寡核苷酸、440皮摩尔的3’衔接体第2寡核苷酸、精加工后纯化的15μl DNA和1200个单位的T4DNA连接酶。反应在25℃孵育15分钟。在调节体积至50μl之后，DNA采用45μl SPRIselect珠(比率0.9x)纯化并选定大小。DNA在15μl的DNA重悬缓冲液中洗脱。3'衔接体的部分降解，5'衔接体的退火，5’衔接体的5'端DNA修剪和连接均在下一反应中发生，其在30μl的终体积中组装，包含1x大肠杆菌DNA连接酶、200μM的各dNTP、200皮摩尔的5’衔接体寡核苷酸用于缺口平移、10个单位的大肠杆菌连接酶、2个单位的尿嘧啶-DNA糖苷酶、10个单位的Taq-B DNA聚合酶和在3’衔接体连接反应之后纯化的15μl的DNA。反应在40℃孵育10分钟。在调节体积至50μl之后，DNA采用70μl的SPRIselect珠(比率1.4x)纯化。DNA在20μl中洗脱并采用Kapa文库定量试剂盒-Illumina/通用(目录号KK4824)通过qPCR定量。DNA采用终浓度为0.1mM的氢氧化钠变性处理5分钟，并将600μl的10pM文库上样在MiSeq(Illumina)上。

结果：

文库浓度通过qPCR定量为2.8nM。通过Illumina MiSeq的v2化学法产生了76个碱基的双末端读数。产生928K/mm²簇，并且第一和第二读数的Q30分数分别是97.8％和96.9％。序列数据质量采用FastQC报告(巴巴汉姆生物信息学(BabrahamBioinformatics))来评估。分析的汇总显示9个绿色打勾标记、2个黄色感叹号(警示)，但没有观察到红色X(失败)(图29，图A)。所有序列中的全部碱基的总体％GC是50％，如同关于大肠杆菌基因组所预期的那样(绿色打勾标记，图29，图B)。贯穿分析的76个碱基的每个读数的序列的质量优异(绿色打勾标记，图29，图C)。各碱基的百分比绘于图D。在任何读数处，G/C和A/T的量具有<10％的差异(绿色打勾标记，图29，图D)。贯穿分析的76个碱基的GC含量相似(绿色打勾标记，图29，图E)。贯穿各序列的长度的每读数GC含量与理论分布做比较(黄色感叹号，图29，图F)。出现提醒是因为在超过15％的读数中发现与正态分布的差异的总和(黄色感叹号，图29，图F)。对于每碱基N含量或序列长度分布没有出现提醒(总结，图29，图A)。序列重复水平是35.85％(图29，图G)。出现黄色警告是因为非独特序列组成了总量的超过20％，这归因于高水平的覆盖135x(黄色感叹号，图29，图G)。没有报告过多出现的序列或kmer(总结，图29，图A)。事实上，没有观察到衔接体二聚体(0.02％，数据未显示)。GC偏差采用Picard CollectGcBiasMetrics来评价。贯穿宽广范围的碱基组成保持了覆盖均匀性。覆盖偏差仅在低于10％GC含量或高于80％观察到。碱基质量超过Q25，其对应于碱基判别中的99.8％准确性。同样地，较低质量仅在极低和高GC含量处观察到。

结论：

采用片段化的大肠杆菌基因组DNA成功制备了文库。测序显示高质量数据且在贯穿GC含量范围的覆盖无偏差。

实施例12

联合TP53基因的全面覆盖的肿瘤学热点图

原理：设计总计51个扩增子以覆盖TP53基因的整个编码区域以及肿瘤学中表示临床可用突变的30个热点基因座。

原理：该扩增子图提供了关于本文所述方法的概念的证明，其中51个扩增子具有显著重叠，以显示缺乏主导反应的小扩增子，以及可采用有限多重循环数实现的扩增子之间的覆盖均匀性。此外，目标读数上的高百分比显示引物作用的特异性，因为引物二聚体和非特异性脱靶扩增产物没有出现于测序文库中。

材料：

*人类HapMap基因组DNA(科里尔研究所(Coriell Institute)，NA12878)

*KAPA高保真热启动尿嘧啶+ReadyMix(KAPA生物系统公司，目录号KK2802)

*102个靶标特异性引物(表2)

*通用引物，其包含3’衔接体寡核苷酸截短的序列和可切割的碱基14-882(表2)

*大肠杆菌DNA连接酶缓冲液(安赛麦蒂公司(Enzymatics)，目录号B6090)

*5’衔接体寡核苷酸，用于衔接体连接步骤(14-571)

*3’衔接体寡核苷酸的5’部分，用于衔接体连接步骤(14-877)

*接头寡核苷酸，用于衔接体连接步骤14-382(表2)

*大肠杆菌DNA连接酶(安赛麦蒂公司(Enzymatics)，目录号L6090L)

*尿嘧啶-DNA糖苷酶(安赛麦蒂公司(Enzymatics)，目录号G5010L)

*核酸内切酶VIII(安赛麦蒂公司(Enzymatics)，目录号Y9080L)

*Taq-B DNA聚合酶(安赛麦蒂公司(Enzymatics)，目录号P7250L)

*SPRIselect(贝克曼库尔特公司，目录号B23419)

*20％PEG-8000/2.5M NaCl溶液，用于纯化步骤

方法：

人类基因组DNA以2ng/μl的浓度稀释于DNA悬浮缓冲液(天惠华公司(Teknova)，目录号T0227)。DNA通过涡旋2分钟轻度剪切。采用10ng的该剪切的基因组DNA来制备文库。扩增的第一反应在30μl的总体积中组装，包含终浓度为1x KAPA高保真热启动尿嘧啶+ReadyMix、10ng的剪切的人类基因组DNA、300pmol的通用引物和终浓度为0.85uM的102种靶标特异性引物的以不同比例存在的混合物。该反应运行如下循环程序：95℃3分钟，然后进行4次如下循环：98℃20秒，63℃5分钟和72℃1分钟，以产生靶标特异性扩增子，并通过23次如下循环来终止：98℃20秒和64℃1分钟，以产生多拷贝的靶标特异性扩增子。在调节体积至50μl之后，DNA产物采用60μl的SPRIselect珠(比率1.2x)纯化。珠重悬于50μl的1x反应混合物中，所述反应混合物包含1x大肠杆菌连接酶缓冲液、100pmol的接头寡核苷酸、10个单位的大肠杆菌连接酶、10个单位的核酸内切酶VIII、2个单位的尿嘧啶-DNA糖苷酶、20个单位的Taq-B DNA聚合酶、100pmol的5’衔接体寡核苷酸和100pmol的3’衔接体寡核苷酸的5’部分。反应在37℃孵育10分钟，然后通过添加42.5μl的20％PEG-8000/2.5M NaCl溶液(比率0.85x)来纯化。DNA在20μl中洗脱并采用Kapa文库定量试剂盒-Illumina/通用(目录号KK4824)通过qPCR定量。DNA采用终浓度为0.1mM的氢氧化钠变性处理5分钟，并将600μl的10pM文库上样在MiSeq(Illumina)上。

结果：

文库浓度通过qPCR定量为19.1nM。通过Illumina MiSeq的v2化学法产生了101个碱基的双末端读数。在数据分析之前，从读数1和读数2的5’端进行序列特异性修剪，以采用Cutadapt程序移除合成引物序列。采用BWA-MEM工具进行的成对的读数与人类基因组和与靶标区域的比对显示超常质量的数据，其中98％与靶标区域比对上。还采用BED工具获得覆盖数据。覆盖均一性为100％，这表示51种扩增子各自在最终文库中显示。还计算了各扩增子中各个体碱基的覆盖，并且其高于平均每碱基覆盖的20％，这表示51种扩增子均没有在终产物中显示不足。图45描述对于覆盖TP53基因的编码外显子的重叠扩增子获得的覆盖。图46描述通过采用VarScan和SAMtools的序列分析获得的18％频率的变体识别。

结论：

采用人类基因组DNA成功制备了靶向的扩增子文库。测序显示高质量数据。

表1.

*:硫代磷酸化的DNA碱基

/5SpC3/:5’C3间隔子(IDT)

/3SpC3/:3’C3间隔子(IDT)

/5PHOS/:5’磷酸化(IDT)

/3PHOS/:3’磷酸化(IDT)

/5FAM/:5’6-羧基荧光素(IDT)

/3FAM/:3’6-羧基荧光素(IDT)

ddT:2',3'-双脱氧胸腺嘧啶(TriLink)

表2用于实施例12的寡核苷酸

*:硫代磷酸化的DNA碱基(IDT)

/3PHOS/:3’磷酸化(IDT)

前述公开内容通过如下对于本发明的各方面和实施方式的描述来补充，其在下述枚举的段落中提供。

1.一种产生经加工的底物分子的方法，所述方法包括：

(i)连接第一多核苷酸至底物分子的3’末端，所述底物分子是至少部分双链的；

(ii)在促进退火的条件下，使第二多核苷酸退火至第一多核苷酸；

(iii)从所述底物分子的5’末端切下至少一个核苷酸；和，然后

(iv)将所述第二多核苷酸连接至所述双链的底物分子的5'末端，以产生所述经加工的底物分子。

2.如段落1所述的方法，其在步骤(i)之前还包括使所述底物分子与磷酸酶接触的步骤。

3.如段落2所述的方法，其还包括，通过使所述底物分子与具有3’-5’核酸外切酶活性的聚合酶接触来使所述底物分子具有钝端的步骤。

4.如段落3所述的方法，其还包括使所述底物分子与模板非依赖性聚合酶接触的步骤，以使所述底物分子的3’端腺苷酸化。

5.如段落1-4中任一项所述的方法，其中，所述底物分子是天然产生的，或所述底物分子是合成的。

6.如段落5所述的方法，其中，所述底物分子是天然产生的。

7.如段落6所述的方法，其中，所述底物分子是基因组DNA。

8.如段落7所述的方法，其中，所述基因组DNA是真核的或原核的。

9.如段落7或段落8所述的方法，其中，所述基因组DNA体内或体外片段化的。

10.如段落9所述的方法，其中，所述体外片段化通过选自下组的方法进行：剪切、用核酸内切酶切割、声处理、加热、采用α、β或γ源的辐照、在金属离子存在下进行化学切割、自由基切割，及其组合。

11.如段落9所述的方法，其中，所述体内片段化通过选自下组的方法发生：凋亡、辐照，和石棉接触。

12.如段落5所述的方法，其中，所述底物分子是合成的，并且选自下组：cDNA、通过全基因组扩增产生的DNA、包含至少一个双链末端的引物延伸产物，和PCR扩增子。

13.如段落1-12中任一项所述的方法，其中，所述第一多核苷酸是至少部分双链的，且包含寡核苷酸1和寡核苷酸2。

14.如段落13所述的方法，其中，所述第二多核苷酸退火至寡核苷酸1。

15.如段落14所述的方法，其中，所述退火导致第二多核苷酸和所述底物分子之间的缺口、间隙，或重叠碱基。

16.如段落14或段落15所述的方法，其中，使所述第二多核苷酸与聚合酶接触，导致寡核苷酸2的降解。

15.如段落13-16中任一项所述的方法，其中，寡核苷酸2包含易于降解的碱基。

16.如段落13-17中任一项所述的方法，其中，寡核苷酸2包含位于其3’末端的封闭基团，所述封闭基团防止连接。

17.如段落1-16中任一项所述的方法，其中，所述第二多核苷酸包含修饰的碱基。

18.如段落14所述的方法，其中，所述退火导致寡核苷酸1和寡核苷酸2的去杂交。

19.如段落1～18中任一项所述的方法，其还包括：

(i)将第三多核苷酸连接至至少部分双链的另一底物分子的3’末端；

(ii)在促进退火的条件下使第四多核苷酸退火至第三多核苷酸；

(iii)从所述另一底物分子的5’末端切下至少一个核苷酸；和，然后

(iv)将所述第四多核苷酸连接至所述双链的另一底物分子的5’末端，以产生经加工的另一底物分子。

20.如段落19所述的方法，其中，第一多核苷酸和第三多核苷酸是相同的。

21.如段落19或段落20所述的方法，其中，第二多核苷酸和第四多核苷酸是相同的。

Claims

1.一种组合物，其包含：

连接酶和第一多核苷酸，所述第一多核苷酸是至少部分双链的且包含寡核苷酸1和寡核苷酸2；

其中，寡核苷酸1包含5’磷酸和位于其3’末端的封闭基团；并且

其中，寡核苷酸2(i)包含易于降解的碱基，和/或(ii)可通过非变性热条件被置换，并且还包含位于其3’末端的封闭基团，所述封闭基团阻止寡核苷酸1的3’端的连接但允许5’端的连接。

2.如权利要求1所述的组合物，其中，寡核苷酸2的3'封闭基团是3’脱氧胸腺嘧啶、3'脱氧腺嘌呤、3'脱氧鸟嘌呤、3'脱氧胞嘧啶或双脱氧核苷酸。

3.如权利要求1或权利要求2所述的组合物，其中，所述易于降解的碱基是脱氧尿嘧啶、核糖核苷酸、脱氧次黄苷，或肌苷。

4.如权利要求1-3中任一项所述的组合物，其中，所述非变性热条件是约50℃至约85℃。

5.如权利要求1所述的组合物，其中，寡核苷酸2包含使寡核苷酸2的结合稳定性降低的碱基修饰，其中，所述碱基修饰是脱氧次黄苷、肌苷或通用碱基。

6.一种组合物，其包含：

由双链底物与如权利要求1所述的组合物孵育所得的连接产物；

连接酶，

具有缺口平移活性的DNA聚合酶，识别易于降解的碱基的核酸内切酶，和

第二多核苷酸，所述第二多核苷酸是单链的，并且包含3’域，其与多核苷酸2的寡核苷酸1的5’部分足够互补以在多核苷酸1的寡核苷酸2被降解或置换时，在合适的条件下退火。

7.如权利要求6所述的组合物，其中，所述第二多核苷酸具有足够的长度以置换第一多核苷酸的寡核苷酸2，或所述第二多核苷酸包含使其结合稳定性增加的碱基修饰。

8.如权利要求6所述的组合物，其中，所述核酸内切酶选自下组：UDG加核酸内切酶VIII、RNA酶HI、RNA酶H2和核酸内切酶V。

9.如权利要求6所述的组合物，其中，所述连接酶是大肠杆菌DNA连接酶或T4DNA连接酶。

10.如权利要求7所述的组合物，其中，使其结合稳定性增加的碱基修饰是锁核酸(LNA)。

11.一种组合物，其包含：

连接酶；

侧翼核酸内切酶；

识别易于降解的碱基的核酸内切酶；

第二多核苷酸，所述第二多核苷酸包含含有3’域的单链的寡核苷酸，其与多核苷酸2的寡核苷酸1的5’部分足够互补以在多核苷酸1的寡核苷酸2被降解或置换时，在合适的条件下退火。

其中，所述第二多核苷酸具有足够的长度以置换第一多核苷酸的寡核苷酸2，或所述第二多核苷酸包含使其结合稳定性增加的碱基修饰，并且

其中，所述第二多核苷酸还包含3’末端简并碱基。

12.一种产生经加工的底物分子的方法，所述方法包括：

13.如权利要求12所述的方法，其还包括如下步骤：在步骤(i)之前，使所述底物分子与磷酸酶接触。

14.如权利要求13所述的方法，其中，所述磷酸酶是牛小肠磷酸酶或虾磷酸酶。

15.如权利要求13或权利要求14所述的方法，其还包括如下步骤：通过使所述底物分子与具有3’-5’核酸外切酶活性的聚合酶接触来使所述底物分子具有钝端。

16.如权利要求15所述的方法，其中，所述聚合酶选自下组：T4DNA连接酶、Klenow片段、T7聚合酶，及其组合。

17.如权利要求15所述的方法，其还包括如下步骤：使所述底物分子与模板非依赖性聚合酶接触，以使所述底物分子的3’端腺苷酸化。

18.如权利要求12-17中任一项所述的方法，其中，所述底物分子是天然产生的，或所述底物分子是合成的。

19.如权利要求18所述的方法，其中，所述底物分子是天然产生的。

20.如权利要求19所述的方法，其中，所述底物分子是基因组DNA。

21.如权利要求20所述的方法，其中，所述基因组DNA是真核的或原核的。

22.如权利要求20或权利要求21所述的方法，其中，所述基因组DNA体内或体外片段化的。

23.如权利要求18或权利要求19所述的方法，其中，所述底物分子是循环无细胞DNA。

24.如权利要求23所述的方法，其还包括：在步骤(i)之前，调节温度至约50℃～约85℃。

25.如权利要求24所述的方法，其中，所述温度是65℃。

26.如权利要求22所述的方法，其中，所述体外片段化通过选自下组的方法进行：剪切、用核酸内切酶切割、声处理、加热、采用α、β或γ源的辐照、在金属离子存在下进行化学切割、自由基切割，及其组合。

27.如权利要求22所述的方法，其中，所述体内片段化通过选自下组的方法发生：凋亡、辐照，和石棉接触。

28.如权利要求18所述的方法，其中，所述底物分子是合成的，并且选自下组：cDNA、通过全基因组扩增产生的DNA、包含至少一个双链末端的引物延伸产物，和PCR扩增子。

29.如权利要求12-28中任一项所述的方法，其中，所述第一多核苷酸是至少部分双链的，且包含寡核苷酸1和寡核苷酸2。

30.如权利要求29所述的方法，其中，所述第二多核苷酸退火至寡核苷酸1。

31.如权利要求30所述的方法，其中，所述退火导致第二多核苷酸和所述底物分子之间的缺口、间隙，或重叠碱基。

32.如权利要求30或权利要求31所述的方法，其中，使所述第二多核苷酸与聚合酶接触，导致寡核苷酸2的降解。

33.如权利要求29-32中任一项所述的方法，其中，寡核苷酸2包含易于降解的碱基。

34.如权利要求33所述的方法，其中，所述易于降解的碱基选自下组：脱氧尿嘧啶、RNA、脱氧次黄苷，和肌苷。

35.如权利要求29-34中任一项所述的方法，其中，寡核苷酸2包含位于其3’末端的封闭基团，所述封闭基团防止连接。

36.如权利要求35所述的方法，其中，所述封闭基团是3’脱氧核苷酸或双脱氧核苷酸。

37.如权利要求12-36中任一项所述的方法，其中，所述第二多核苷酸包含修饰的碱基。

38.如权利要求30所述的方法，其中，所述退火导致寡核苷酸1和寡核苷酸2的去杂交。

39.如权利要求12-38中任一项所述的方法，其还包括：

40.权利要求39所述的方法，其中，第一多核苷酸和第三多核苷酸是相同的。

41.权利要求39或权利要求40所述的方法，其中，第二多核苷酸和第四多核苷酸是相同的。

42.一种组合物，其包含：

通用引物和多个靶标特异性寡核苷酸引物对；

其中，所述多个引物对的各靶标特异性引物包含靶标特异性序列和不与靶标底物分子互补的5'末端序列；

其中，所述通用引物包含所述5'末端序列和可切割的碱基或抗核酸酶的修饰；

其中，所述多个引物对的各靶标特异性引物和所述通用引物各自在其3’末端包含抗核酸酶的修饰；

高保真聚合酶，其耐受纳入所述通用引物的可切割的碱基；

其中，所述靶标特异性引物对和所述通用引物在相同温度退火至其靶标底物分子；和

其中，靶标特异性引物与通用引物的摩尔比是至少约1:100。

43.如权利要求42所述的组合物，其中，所述可切割的碱基是脱氧尿嘧啶、RNA、脱氧次黄苷，或肌苷。

44.如权利要求42或43所述的组合物，其中，所述抗核酸酶的修饰是硫代磷酸酯。

45.如权利要求42-44中任一项所述的组合物，其中，至少一种靶标特异性引物还包含分子鉴定标签，所述分子鉴定标签位于所述靶标特异性序列和所述5’末端序列之间。

46.如权利要求42-45中任一项所述的组合物，其中，靶标特异性引物与通用引物的摩尔比是至少约1:200，或至少约1:300，或至少约1:400，或至少约1:500，或至少约1:1000，或至少约1:2000，或至少约1:3000，或至少约1:5000，或至少约1:10,000或更高。

47.如权利要求42-46中任一项所述的组合物，其还包含底物分子。

48.一种组合物，其包含：

通过通用引物产生的聚合酶链式反应(PCR)产物，其中，所述产物包含通过所述通用引物引入的至少一个可切割的碱基；

能够切割所述可切割的碱基的核酸内切酶；

(i)至少一种核苷酸和具有缺口平移活性的DNA聚合酶，或(ii)具有侧翼核酸内切酶活性的酶；

DNA连接酶；

5’衔接体，其包含(i)3'序列，该3'序列与通过核酸内切酶切割所述通用引物而暴露的所述通用引物的反向互补序列的5’部分互补，和(ii)5’部分，所述5’部分与所述通用引物的反向互补序列不互补；和

其中，所述通用引物的反向互补序列的3’部分退火至部分双链的截短型3'衔接体。

49.如权利要求48所述的组合物，其中，所述核酸内切酶选自下组：UDG+核酸内切酶VIII、RNA酶HI、RNA酶H2，和核酸内切酶V。

50.如权利要求48或权利要求49所述的组合物，其中，所述DNA连接酶是大肠杆菌DNA连接酶或T4DNA连接酶。

51.一种组合物，其包含：

通过通用引物产生的聚合酶链式反应(PCR)产物，其中，所述产物包含通过所述通用引物引入的至少一个抗核酸酶的修饰；

无法越过所述抗核酸酶的修饰来消化所述PCR产物的5’核酸外切酶；

DNA连接酶；

其中，所述通用引物的反向互补序列的3’部分退火至部分双链的截短型3’衔接体分子。

52.一种聚合酶链式反应(PCR)方法，其包括，使底物分子与如下物质接触：

(i)靶标特异性引物对，其中，各引物包含5'序列，其与所述底物分子不互补，并且其在所得扩增子的末端引入单一通用衔接体；和

(ii)单一引物，其包含所述单一通用衔接体序列，并且还包含可切割的碱基或抗核酸酶的修饰，

其中，在合适的反应条件下，在高保真DNA聚合酶和核苷酸的存在下，对于各PCR循环采用恒定退火温度但不同的退火时间，其中，所述各靶标特异性引物:通用引物的摩尔比是至少约1:100，靶标特异性扩增子在具有5分钟或更长的退火时间的前两个或更多次PCR循环的过程中产生，然后在剩下的PCR循环过程中进行所得扩增子的扩增，所述剩下的PCR循环各包括1分钟或更短的退火时间，其中，实现通过较高浓度的单一通用引物进行的所述靶标特异性扩增子的扩增。

53.一种多重PCR方法，其包括，使底物分子与如下物质接触：(i)多个靶标特异性引物对，其中，各引物包含与所述底物不互补的5'序列，并且其在所得扩增子的末端纳入如单一通用衔接体，和

其中，在合适的反应条件下，在高保真DNA聚合酶和核苷酸的存在下，对于各PCR循环采用恒定退火温度但不同的退火时间，其中，所述各靶标特异性引物:通用引物的摩尔比是至少约1:100，靶标特异性扩增子在具有5分钟或更长的退火时间的前两个或更多次PCR循环的过程中产生，然后在剩下的PCR循环过程中进行所得扩增子的扩增，所述剩下的PCR循环各包括1分钟或更短的退火时间，其中，实现通过较高浓度的单一通用引物进行的所述靶标特异性扩增子的多重扩增。

54.一种将在各末端包含单一通用衔接体序列的聚合酶链式反应(PCR)产物转化成在各末端包含不对称的5’和3'衔接体的产物的方法，所述方法包括：

(a)消化所述PCR产物的5’末端，其中，引入可切割的碱基或抗核酸酶的修饰，然后

(b)退火，和5’衔接体的(i)缺口平移连接或(ii)侧翼核酸内切酶切割连接，所述5’衔接体与通过所述消化暴露的所述通用衔接体的反向互补序列的5’部分互补，和

(c)，其中，部分双链的截短型3’衔接体退火并连接至所述通用衔接体的反向互补序列的3’部分，由此将所述PCR产物转化成在其各末端处包含不对称衔接体的产物。

55.如权利要求54所述的方法，其中，所述PCR产物是全基因组扩增(WGA)产物。