CN105917004B

CN105917004B - 在固体支持物上的多核苷酸修饰

Info

Publication number: CN105917004B
Application number: CN201480073405.6A
Authority: CN
Inventors: 罗伯托·里加蒂; 尼尔·葛姆雷; 艾伦·E·埃克哈特; 乔纳森·马克·鲍特尔
Original assignee: Illumina Cambridge Ltd
Current assignee: Illumina Cambridge Ltd
Priority date: 2014-01-16
Filing date: 2014-12-23
Publication date: 2019-12-17
Anticipated expiration: 2034-12-23
Also published as: WO2015106941A1; AU2014377372A1; CN105917004A; US20150197799A1; EP3094743A1; US9677132B2; CA2932545C; EP3094743B1; CA2932545A1; HK1231514A1; DK3094743T3; AU2014377372B2

Abstract

本公开内容涉及分子生物学领域，并且更具体地涉及用于在固体表面上捕获和扩增靶多核苷酸的方法。

Description

在固体支持物上的多核苷酸修饰

技术领域

背景

新一代测序已经使全基因组测序和全基因组分析成为可能。新一代测序方法典型地依赖于基因组片段的通用扩增，所述通用扩增首先配备通用扩增区域，并且然后通过在固体表面上的通用捕获引物无差别地捕获。该通用捕获引物介导多核苷酸捕获和桥式扩增二者，是新一代测序方法中的关键元件(参见，例如，WO 2011/025477 A1、US 2011/0172119A1)。

虽然当前的方法能有效地支持全基因组测序，但其不允许靶向捕获特定多核苷酸，并且因此不支持，例如，部分基因组的靶向测序。但是，对于促进例如生物体的外显子组或转录组的特定部分的靶向测序的方法存在增长的需要。该需要部分被成本但也被数据处理考虑驱动。

概述

因此，对使部分基因组的靶向的新一代测序成为可能的新方法存在需要。本公开内容通过提供用于修饰表面上固定的捕获引物的方法解决该需要。也提供相关的优势。

本公开内容提供修饰固定的捕获引物的方法。

在一方面，本公开内容提供修饰固定的捕获引物的方法，所述方法包括：a)提供具有固定的应用特异性捕获引物的固体支持物，该应用特异性捕获引物包括：i)包括应用特异性捕获区域的3’部分和ii)包括通用捕获区域的5’部分；b)对于杂交足够将应用特异性多核苷酸与该应用特异性捕获引物接触在对于杂交足够的条件下，以产生固定的应用特异性多核苷酸，和c)移除未与应用特异性多核苷酸杂交的应用特异性捕获引物的应用特异性捕获区域，以将未杂交的应用特异性捕获引物转化成通用捕获引物。在一些实施方案中，应用特异性捕获区域的一部分被移除。

在一些实施方案中，应用特异性捕获引物包括多个不同的固定的应用特异性捕获引物。

在一些实施方案中，应用特异性多核苷酸包括多个不同的应用特异性多核苷酸。

在一些实施方案中，应用特异性捕获区域包括靶特异性捕获区域且应用特异性多核苷酸包括靶多核苷酸。

在一些实施方案中，应用特异性捕获区域包括转座子末端(TE)区域且应用特异性多核苷酸包括TE寡核苷酸。

在一些实施方案中，所述方法还包括在执行步骤c)之前，在对于寡核苷酸与应用特异性捕获引物的通用捕获区域杂交足够的条件下，施加寡核苷酸，以产生双链DNA区域。在某些实施方案中，所述寡核苷酸是P5或P7寡核苷酸。

在一些实施方案中，所述方法还包括在执行步骤c)之前，在对于寡核苷酸与应用特异性捕获引物的应用特异性捕获区域杂交足够的条件下，施加寡核苷酸，以产生双链DNA区域。

在一些实施方案中，所述方法还包括将所述应用特异性捕获引物与核酸酶接触，其中未与应用特异性多核苷酸杂交的应用特异性捕获引物的应用特异性捕获区域被核酸酶移除。在一些实施方案中，所述核酸酶为外切核酸酶。在一些实施方案中，所述外切核酸酶是外切核酸酶I。在一些实施方案中，所述外切核酸酶是外切核酸酶III。在一些实施方案中，所述核酸酶为内切核酸酶。

在一些实施方案中，提供固体支持物包括将应用特异性捕获引物固定到固体支持物上。在一些实施方案中，所述应用特异性捕获引物被直接固定到固体支持物上。在一些实施方案中，固定所述应用特异性捕获引物包括将通用捕获引物固定到固体支持物上。在一些实施方案中，所述方法还包括将固定的通用捕获引物转化成应用特异性捕获引物。

附图简述

图1是阐明应用特异性捕获引物和通用捕获引物的设计的示意图。通用捕获引物由通用的捕获引物P5和P7代表，其用黑色箭头表示。应用特异性捕获引物用延伸的箭头表示。通用捕获区域由P5和P7区域示例，其显示为延伸的箭头中的黑色区域。应用特异性捕获区域显示为具有不同模式的虚线。在应用特异性捕获引物中，通用捕获区域位于引物靠近固体支持物的5’末端。应用特异性捕获区域位于引物的3’末端。

图2是示例将应用特异性捕获引物附接到固体支持物的两种方法的示意图。图2A示例直接固定通用捕获引物(称为“标准的P5”和“标准的P7”)和应用特异性捕获引物(称为“修饰的P5”和“修饰的P7”)。图2B示例将通用捕获引物转化成应用特异性捕获引物的杂交和延伸方法。

图3是示例从应用特异性捕获引物移除应用特异性捕获区域，因此将应用特异性捕获引物转化成通用捕获引物的方法的示意图。

图4是例示在直接的靶捕获应用中，从捕获引物中移除靶特异性捕获区域的方法的示意图。

图5是阐明两种备选的涉及固定的靶多核苷酸的杂交方案的示意图。图5A阐明，固定的靶多核苷酸可与匹配的靶特异性捕获区域杂交并且支持有效的捕获引物延伸以复制靶多核苷酸。图5B阐明，固定的靶多核苷酸偶尔可与不匹配的靶特异性探针，例如，与其通用捕获区域，错误杂交。错误杂交的靶多核苷酸不能有效地支持捕获引物延伸。

图6是示例制备用于表面标签化的流动池的示意图。

图7是阐明表面标签化反应的示意图。

图8显示在仅具有通用捕获引物(也称为标准表面引物)的未修饰的流动池上获得的DNA测序结果(泳道1，上图)和在仅具有应用特异性捕获引物(也称为修饰的表面引物P5-ME和P7-ME)的修饰的流动池上获得的DNA测序结果(泳道2，下图)的比较。

图9显示表明使用外切核酸酶I从应用特异性捕获引物有效地移除应用特异性捕获区域的实验的结果。具有转座子末端区域(ME区域)和通用捕获区域(P5和P7区域)的应用特异性捕获引物被固定在流动池上，与标记的寡核苷酸杂交，并且在Typhoon扫描仪上成像。流动池的图像显示在左侧(L1、2、3等等指示泳道1、2、3等等)。显示对每个流动池泳道的定量信号的图显示在右侧。图9A显示当流动池与标记的抗P5和抗P7寡核苷酸杂交后的成像结果。图9B显示在后续去除标记的抗P5和抗P7寡核苷酸以及标记的抗ME寡核苷酸与流动池杂交之后的成像结果。移除标记的抗ME寡核苷酸之后，流动池的泳道3、6、7和8与未标记的抗P5和抗P7寡核苷酸杂交。然后，对泳道4、5、6和8进行外切核酸酶I处理。移除未标记的抗P5和抗P7寡核苷酸之后，流动池再次与标记的寡核苷酸杂交。图9C显示对于标记的抗P5和抗P7寡核苷酸的成像结果。图9D显示对于标记的抗ME寡核苷酸的成像结果。

图10是阐明在表面标签化实验中从应用特异性捕获引物移除转座子末端区域的示意图。

图11显示表面标签化实验的结果，比较未移除转座子末端区域(泳道1，上图)或通过外切核酸酶I移除转座子末端区域(ME区域)之后(泳道2，下图)观察到的完全扩增聚簇的比例。

图12是阐明针对外切核酸酶I的活性自我保护的发夹结构的表面引物的示意图。图12A阐明包括通用捕获区域(P5和P7)和在其3’末端的转座子末端区域(ME)的应用特异性捕获引物。一些表面引物与转座子末端寡核苷酸(16-mer)杂交并且结合转座酶。引物-转座酶复合物可以二聚化以形成表面转座体。未能装配为转座体的发夹捕获引物的转座子末端区域，可用外切核酸酶I移除。图12B阐明具有在约38℃(外切核酸酶I起作用的温度)是稳定的，但在60℃(进行桥式扩增的温度)被破坏的二级结构的捕获引物。

图13阐明用靶向DNA扩增产物占据模式化的流动池的方法的实例的流程图；

图14图示图13的方法的步骤；

图15显示根据图13的方法制备的靶向DNA文库的每泳道的聚簇密度图；

图16阐明制备用于模式化的流动池的靶向DNA扩增产物的方法的实例的流程图；

图17图示图16的方法的步骤；

图18A和图18B显示对于根据图16的方法制备的珠富集的靶向DNA文库，每泳道的簇密度图和序列度量(sequence metric)的汇总数据表。

详述

桥式扩增是新一代测序中的一个步骤。桥式扩增依赖于通过固定在固体表面上的通用捕获引物捕获多核苷酸模板。通用捕获引物不能基于其特定的核酸序列靶向或捕获特定的多核苷酸。但是，越来越多的新一代测序应用要求应用特异性多核苷酸的应用特异性捕获，和因此在相同表面上固定除了通用捕获引物以外的应用特异性捕获引物。

例如，越来越多的新一代测序应用要求靶特异性多核苷酸的靶特异性捕获，和因此在相同表面上除了通用捕获引物以外固定靶特异性捕获引物。在另一个实例中，序列标签化应用要求存在通用捕获引物，并且还存在具有转座子末端(TE)并且与转座子末端寡核苷酸杂交的应用特异性捕获引物。

本公开内容部分地基于以下认识：固体表面上靠近通用捕获引物的应用特异性捕获引物的存在干扰当前的桥式扩增方案。

例如，靠近通用捕获引物的靶特异性捕获引物的存在干扰桥式扩增。直接的靶捕获可通过将特异地与靶多核苷酸，例如，编码突变的癌基因的多核苷酸，杂交的靶特异性捕获引物固定在表面上来实现。在需要在同一流动池上捕获许多靶多核苷酸(例如，编码人类癌基因中已知突变的多个多核苷酸)的应用中，靶特异性捕获引物必然很多并且多变。固体支持物上高浓度的靶特异性捕获引物将使靶捕获快速、高效和稳健。在靶多核苷酸极其稀少并且具有低丰度时，例如在靶多核苷酸编码人类癌基因的体细胞突变的情况下，速度、效率和稳健性尤其重要。但是，如果支持物上仅存在靶特异性捕获引物，有效的桥式扩增不能发生。

通常，仅特异性捕获的靶多核苷酸可以有效地支持桥式扩增。与之相比，与错配的捕获引物错误杂交的多核苷酸在支持捕获引物延伸中可以是无效的。因此，错配的多核苷酸可被无效地复制或扩增(参见例如图5)。因此，如果1,000个不同的靶多核苷酸将被捕获到流动池上，并且如果所有的捕获引物是靶特异性捕获探针，仅0.1％的捕获探针可有效地支持特异靶性分子的桥式扩增，这是无效的。因此，为了确保高效扩增，大量过量的通用捕获引物将必须与仅少量的靶特异性捕获引物在固体支持物上组合。此外，小心地选择足够捕获靶多核苷酸，但不是太高以至于妨碍后续的扩增步骤的靶特异性捕获引物的密度将是必要的。

因此，在有效靶捕获和有效靶扩增之间折中的需要潜在地限制直接捕获应用的性能，例如，通过降低靶检测的灵敏度。此外，次优的靶捕获和靶扩增将增加方法的结果的噪音，降低方法的稳健性，并且最终减少直接靶捕获应用的效用。

本公开内容还部分地基于以下认识：可设计应用特异性捕获引物以包括应用特异性捕获区域和通用捕获区域二者。例如，图1阐明，应用特异性捕获引物可被设计为包括在其5’-末端的通用捕获区域(更接近固体支持物的部分，显示为黑色实线)和在其3’-末端的另外的应用特异性捕获区域(显示为具有不同模式的虚线)。应用特异性捕获区域的性质可根据应用特异性捕获引物意图用于的应用类型而改变。例如，为了捕获编码癌基因突变的靶多核苷酸，该捕获引物将包括与靶向癌基因突变互补的靶特异性捕获区域。在另一个实例中，应用特异性捕获引物可包括编码转座子末端(TE)的应用特异性捕获区域并且介导表面标签化反应(参见，例如，图6)。

本公开内容还部分地基于以下认识：应用特异性捕获引物可以以若干方式被装配在表面上(参见，例如，图2)。例如，应用特异性捕获引物可被直接固定到固体表面上(参见，例如，图2A，通用捕获区域显示为黑色实线，应用特异性捕获区域显示为具有不同模式的虚线)。在另一个实例中，应用特异性捕获引物可被装配在固体表面上，例如，通过使用引物杂交和延伸方法(参见，例如，图2B)。

本公开内容部分地涉及以下惊人发现：应用特异性多核苷酸可与应用特异性捕获引物杂交，并且未杂交的应用特异性捕获引物的应用特异性区域其后可被移除，以将未杂交的应用特异性捕获引物转化成通用引物(参见，例如，图3、4和6)。

本公开内容提供用于修饰固定的捕获引物的方法和试剂盒。本公开内容的一个好处是，其使得能够在新一代测序中有效使用应用特异性捕获引物。具体地，本公开内容促进在要求使用应用特异性捕获引物的先进的新一代测序应用中收集高质量数据。高数据质量为靶特异性新一代测序在打开宽广的新应用领域，例如，在疾病诊断和预测中。

此外，出人意外地有效的从未杂交的应用特异性捕获引物移除应用特异性捕获区域改善表面标签化应用的数据质量(错误率、灵敏度)和数据数量(计数的簇的数目)二者。通过促进在新一代测序中的表面标签化技术，本公开内容有利于自动化和简单化样品制备以及样品通量的努力。因此，本文提供的方法帮助减少高通量测序技术的成本。此外，本公开内容预期通过促进罕见遗传突变的可靠的早期检测，使患有涉及罕见遗传突变的疾病的患者，例如，癌症患者受益。典型地，越早的疾病检测转化成越多数目的治疗选择和改进的治疗效果。

必须注意，如在本说明书和所附的权利要求书中使用的，单数形式“一个(a)”、“一个(an)”和“该(the)”包括复数指代对象，除非内容另有清楚的指示。因此，例如，提及“生物标记物”包括两种或更多种生物标记物的混合物等等。

特别地在提及给定量时，术语“约”意味着涵盖正或负百分之五的偏离。

如本文使用的，术语“包括(includes)”、“包括(including)”、“包括(includes)”、“包括(including)”、“包含(contains)”、“包含(containing)”和其任何变化形式意图涵盖非排他性包括，诸如包括(includes)、包括(includes)、或包含(contains)要素或要素的列表的过程、方法、方法限定的产品或物质组合物，不仅包括所述要素，也可包括此类过程、方法、方法限定的产品或物质组合物未明确列出的或固有的其他要素。

如本文使用的，术语“多个”指两个或更多个成员诸如多核苷酸成员或其他提及的分子的群体。在一些实施方案中，多个成员的两个或更多个成员是相同的成员。例如，多个多核苷酸可包括具有相同核酸序列的两个或更多个多核苷酸成员。在一些实施方案中，多个成员的两个或更多个成员是不同的成员。例如，多个多核苷酸可包括具有不同核酸序列的两个或更多个多核苷酸成员。多个包括2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100或更多个不同的成员。多个也可包括200、300、400、500、1000、5000、10000、50000、1x10⁵、2x10⁵、3x10⁵、4x10⁵、5x10⁵、6x10⁵、7x10⁵、8x10⁵、9x10⁵、1x10⁶、2x10⁶、3x10⁶、4x10⁶、5x10⁶、6x10⁶、7x10⁶、8x10⁶、9x10⁶或1x10⁷或更多个不同的成员。多个包括在上面示例多个数字之间的所有整数。

如本文使用的，术语“靶多核苷酸”意指是为分析或作用的目标的多核苷酸。所述分析或作用包括使多核苷酸经过复制、扩增、测序和/或用于核酸询问(interrogation)的其他过程。靶多核苷酸可包括除了待分析的靶序列以外的核苷酸序列。例如，靶多核苷酸可包括一个或更多个衔接物，包括在待分析的靶多核苷酸序列侧翼的作为引物结合位点发挥功能的衔接物。与捕获寡核苷酸或捕获引物杂交的靶多核苷酸可包含以不是所有的靶核苷酸都可顺从延伸的方式，延伸超过捕获寡核苷酸的5’或3’末端的核苷酸。在特别的实施方案中，如在下面进一步详细描述的，多个靶多核苷酸包括不同种类，该不同种类在靶多核苷酸序列上不同但具有对两个或更多个不同种类是相同的衔接物。在特定靶多核苷酸序列两侧的两个衔接物可具有相同的序列或两个衔接物可具有不同的序列。相应地，多个不同的靶多核苷酸在靶多核苷酸序列的每个末端可具有相同的衔接物序列或两个不同的衔接物序列。因此，在多个靶多核苷酸中的种类可包括要通过例如测序评价的未知序列的区域两侧的已知序列的区域。在靶多核苷酸在单个末端携带衔接物的情况，所述衔接物可位于该靶多核苷酸的3’末端或5’末端。可使用无任何衔接物的靶多核苷酸，在这种情况下引物结合序列可直接来自在靶多核苷酸中发现的序列。

如本文使用的，术语“捕获引物”意指具有在例如在扩增或测序反应的引物退火步骤遇到的条件下，能与待分析或待经过核酸询问(interrogation)的单链多核苷酸序列特异地退火的核苷酸序列的寡核苷酸。通常，术语“核酸”、“多核苷酸”和“寡核苷酸”在本文可互换地使用。不同术语不意图指示在大小、序列或其他性质上的任何特定差异，除非另有具体地指示。为了描述的简洁，当描述包括若干核酸种类的特定的方法或组合物时，所述术语可用于区别一种核酸与另一种核酸。

如本文使用的，在提及捕获引物或其他寡核苷酸时使用的术语“靶特异”意指包括对靶多核苷酸序列特异的核苷酸序列的捕获引物或其他寡核苷酸，所述对靶多核苷酸序列特异的核苷酸序列即能与靶多核苷酸的鉴定区域选择性退火的核苷酸的序列。靶特异性捕获引物可具有单一种类的寡核苷酸，或其可包括两种或更多种具有不同序列的种类。因此，所述靶特异性捕获引物可以是两种或更多种序列，包括3、4、5、6、7、8、9或10或更多种不同的序列。靶特异捕获寡核苷酸可包括靶特异性捕获引物序列和通用捕获引物序列。其他的序列诸如测序引物序列等等也可被包括在靶特异性捕获引物内。

相比之下，在提及捕获引物或其他寡核苷酸序列时使用的术语“通用”意指在多个捕获引物之中具有共同的核苷酸序列的捕获引物或其他寡核苷酸。共同的序列可以是，例如，与相同的衔接物序列互补的序列。通用捕获引物适用于询问(interrogating)多个不同的多核苷酸而无需区分不同种类，而靶特异性捕获引物适用于区分不同的种类。

如本文使用的，当提及核酸时使用的术语“固定的”意指经由共价键或非共价键直接或间接附接到固体支持物。在本发明的某些实施方案中，可使用共价附接，但是通常地所有需要的是，核酸保持静止或在其中意图使用支持物的条件下，例如，在要求核酸扩增和/或测序的应用中，附接至支持物。典型地，待被用作捕获引物或扩增引物的寡核苷酸是固定的，使得3’末端对于酶延伸是可用的，并且至少部分的所述序列能与互补序列杂交。固定化可经由与表面附接的寡核苷酸杂交发生，在这种情况下，固定的寡核苷酸或多核苷酸可呈3’-5’方向。可选地，固定化可通过除了碱基配对杂交以外的方式发生，诸如上文描述的共价附接。

如本文使用的，术语“转座体复合物”通常地指非共价地结合至双链核酸的转座酶。例如，复合物可以是在支持非共价复合物形成的条件下与双链转座子DNA预孵育的转座酶。双链转座子DNA可包括但不限于Tn5DNA、Tn5 DNA的一部分、转座子末端成分、转座子末端成分的混合物或能与转座酶诸如超活性Tn5转座酶相互作用的其他双链DNA。

“转座酶”指能与含有转座子末端的成分(例如，转座子、转座子末端、转座子末端成分)形成功能性复合物且能在例如体外转座反应中催化含转座子末端的成分插入或转座至与其一起孵育的双链靶DNA的酶。本文呈现的转座酶也可包括来自逆转录转座子和逆转录病毒的整合酶。转座酶、转座体和转座体复合物通常地是为本领域技术人员所熟知的，如由US 2010/0120098的公开内容所例示的，其内容通过引用全部并入本文。尽管本文描述的很多实施方案涉及Tn5转座酶和/或超活性Tn5转座酶，但是将领会，为了其意图的目的能以足够的效率将转座子末端插入5'-标签并片段化靶DNA的任何转座系统可在本发明中使用。在特定的实施方案中，优选的转座系统能以随机或几乎随机的方式将转座子末端插入至5'-标签并片段化靶DNA。

术语“转座子末端”(TE)指仅展现对于与转座酶或整合酶形成复合物是必要的核苷酸序列(“转座子末端序列”)的双链核酸DNA，所述转座酶或整合酶在体外转座反应中是功能性的。在一些实施方案中，转座子末端能在转座反应中与转座酶形成功能性的复合物。作为非限制性实例，转座子末端可包括19-bp外末端(“OE”)转座子末端、内末端(“IE”)转座子末端、或被野生型或突变体Tn5转座酶识别的“嵌合(mosaic)末端”(“ME”)转座子末端、或如在US 2010/0120098的公开内容中描述的R1和R2转座子末端，其内容通过引用全部并入本文。转座子末端可包括适于在体外转座反应中与转座酶或整合酶形成功能性复合物的任何核酸或核酸类似物。例如，转座子末端可包括DNA、RNA、修饰的碱基、非天然碱基、修饰的骨架，并且可在一条或两条链中包括缺口。尽管贯穿本公开内容与转座子末端的成分相连使用术语“DNA”，但是应理解，任何合适的核酸或核酸类似物可在转座子末端中被使用。

如本文使用的术语“转座子末端寡核苷酸”(TEO)或“转座子末端区域”(TER)指包括转座子末端序列的单链核酸DNA。

术语“转移链(transferred strand)”指两个转座子末端的转移部分。类似地，术语“非转移链(non-transferred strand)”指两个“转座子末端”的非转移部分。转移链的3’-末端在体外转座反应中被连接或转移到靶DNA。展现出与转移的转座子末端序列互补的转座子末端序列的非转移链，在体外转座反应中不被连接或转移至靶DNA。

在一些实施方案中，转移链和非转移链被共价地连接。例如，在一些实施方案中，在单个寡核苷酸上提供转移链序列和非转移链序列，所述单寡核苷酸例如，呈发夹构造。像这样，尽管非转移链的游离末端不通过转座反应直接地连接至靶DNA，但是非转移链变成间接地附接至DNA片段，因为非转移链通过发夹结构的环连接至转移链。转座体结构的另外的实例以及制备和使用转座体的方法可见于US 2010/0120098的公开内容中，其内容通过引用全部并入本文。

在本文提供的方法和组合物中，捕获引物被固定至固体支持物上。在一些实施方案中，捕获引物可经由将捕获引物偶联至固体支持物的接头分子被固定。当提及将分子(例如，核酸)固定至固体支持物时，术语“固定”和“附接”在本文是可互换地使用的，并且两个术语均意图涵盖直接或间接的、共价或非共价的附接，除非另有明确地或通过上下文的指示。在本发明的某些实施方案中，共价附接是优选的，但是通常地所有需要的是，分子(例如，核酸)在其中意图使用支持物的条件下例如在要求核酸扩增和/或测序的应用中，保持固定或附接至支持物。

本发明的某些实施方案可使用包括惰性基底或基质(例如，载玻片、聚合物珠等)的固体支持物，所述惰性基底或基质已通过例如应用包括活性基团的中间材料的层或包衣而被功能化，所述活性基团允许共价附接至诸如多核苷酸的生物分子。此类支持物的实例包括但不限于负载于诸如玻璃的惰性基底上的聚丙烯酰胺水凝胶，特别是WO 2005/065814和US 2008/0280773中描述的聚丙烯酰胺水凝胶，其内容通过引用全部并入本文。在此类实施方案中，生物分子(例如，多核苷酸)可被直接地共价附接至中间材料(例如，水凝胶)，但是中间材料其自身可被非共价地附接至基底或基质(例如，玻璃基底)。术语“共价附接至固体支持物”要相应地理解为包括这种排列类型。

本文中术语“固体表面”、“固体支持物”和其他语法等同物指适合于或可被改性以适合用于附接转座体复合物的任何材料。如本领域人员将领会的，可能的基底的数目是很巨大的。可能的基底包括但不限于：玻璃和改性的或功能化的玻璃、塑料(包括丙烯酸树脂、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、Teflon^TM等)、多糖、尼龙或硝酸纤维素、陶瓷、树脂、二氧化硅或基于二氧化硅的材料(包括硅和改性的硅)、碳、金属、无机玻璃、塑料、光学纤维束、和很多其他聚合物。对于一些实施方案特别有用的固体支持物和固体表面位于流动池装置内。示例性流动池在以下被更详细地描述。

在一些实施方案中，固体支持物包括适于以有序的模式固定捕获引物的模式化的表面。“模式化的表面”指在固体支持物的暴露层中或暴露层上不同区域的排列。例如，区域中的一个或更多个可以是其中存在一个或更多捕获引物的特征。特征可被其中不存在捕获引物的间隙区域分开。在一些实施方案中，模式可以是行和列形式的x-y格式的特征。在一些实施方案中，模式可以是特征和/或间隙区域的重复排列。在一些实施方案中，模式可以是特征和/或间隙区域的随机排列。在一些实施方案中，捕获引物在固体支持物上随机地分布。在一些实施方案中，捕获引物分布在模式化的表面上。可在本文描述的方法和组合物中使用的示例性模式化的表面在美国系列号13/661,524或美国专利申请公布号2012/0316086 A1中描述，其每个通过引用并入本文。

在一些实施方案中，固体支持物包括表面中的孔或凹的阵列。如本领域普遍所知的，这可利用多种技术被制造，包括但不限于照相平板印刷术、冲压技术、塑模技术和显微蚀刻技术。如将被本领域人员所领会的，使用的技术将取决于阵列基底的组成和形状。

固体支持物的组成和几何结构可随其用途而不同。在一些实施方案中，固体支持物是平面结构，诸如载玻片、芯片、微芯片和/或阵列。像这样，基底的表面可以是平面层的形式。在一些实施方案中，固体支持物包括流动池的一个或更多个表面。如本文使用的术语“流动池”指包括固体表面的室，一种或更多种流体试剂可流动穿过所述室。可在本公开内容的方法中容易地使用的流动池和相关流体系统和检测平台的实例被描述于例如，Bentley等人,Nature 456:53-59(2008)；WO 04/018497；US 7,057,026；WO 91/06678；WO07/123744；US 7,329,492；US 7,211,414；US 7,315,019；US 7,405,281和US 2008/0108082中，其每个通过引用并入本文。

在一些实施方案中，固体支持物或其表面是非平面的，诸如管或容器的内表面或外表面。在一些实施方案中，固体支持物包括微球或珠。本文中“微球”或“珠”或“颗粒”或语法上的等同物是指小的离散颗粒。合适的珠成分包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁材料、二氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖诸如Sepharose、纤维素、尼龙、交联胶束和teflon，以及本文概述用于固体支持物的任何其他材料可全部被使用。来自Bangs Laboratories,Fishers Ind.的“微球检测指南(Microsphere Detection Guide)”是有用的指南。在某些实施方案中，微球为磁性微球或珠。

珠不必是球形的；不规则颗粒可被使用。可选地或另外的，珠可以是多孔的。珠大小范围从纳米，例如，100nm，至毫米例如1mm，从约0.2微米至约200微米的珠是优选的，并且从约0.5至约5微米的珠是特别优选的，尽管在一些实施方案中，更小或更大的珠可被使用。

本文提供修饰固定的捕获引物的方法，包括a)提供具有固定的应用特异性捕获引物的固体支持物，该应用特异性捕获引物包括i)包括应用特异性捕获区域的3’部分和ii)包括通用捕获区域的5’部分；b)在对于杂交足够的条件下，将应用特异性多核苷酸与该应用特异性捕获引物接触，以产生固定的应用特异性多核苷酸，和c)移除未与应用特异性多核苷酸杂交的应用特异性捕获引物的应用特异性捕获区域，以将未杂交的应用特异性捕获引物转化成通用捕获引物。

在一方面，本公开内容提供修饰固定的捕获引物的方法，包括：a)提供具有固定的应用特异性捕获引物的固体支持物，所述应用特异性捕获引物包括：i)包括靶特异性捕获区域的3’部分和ii)包括通用捕获区域的5’部分；b)在对于杂交足够的条件下，将靶多核苷酸与该应用特异性捕获引物接触，以产生固定的靶特异性多核苷酸，c)延伸杂交的应用特异性捕获引物以产生与固定的靶特异性多核苷酸互补的固定的延伸产物；d)在对于寡核苷酸与固定的应用特异性捕获引物的通用捕获区域杂交足够的条件下，施加寡核苷酸；e)在对于核酸酶足够的条件下，将固定的应用特异性捕获引物与核酸酶接触，以去除未与靶多核苷酸杂交的应用特异性捕获引物的靶特异性捕获区域，以将未杂交的应用特异性捕获引物转化成通用捕获引物；f)从固定的应用特异性捕获引物移除寡核苷酸；g)将通用捕获引物与固定的延伸产物退火；h)通过PCR扩增固定的延伸产物以产生多个固定的扩增子；和i)对多个固定的扩增子测序，其中测序包括桥式扩增步骤。

在另一个方面，本公开内容提供修饰固定的多核苷酸捕获引物的方法，包括：a)提供具有固定的应用特异性捕获引物的固体支持物，所述应用特异性捕获引物包括：i)包括转座子末端(TE)区域的3’部分和ii)包括通用捕获区域的5’部分；b)在对于杂交足够的条件下，将转座子末端寡核苷酸(TEO)与应用特异性捕获引物接触，以产生固定的TE区域-TEO杂合体；c)将转座酶结合到TE区域-TEO杂合体以产生支持物结合的转座体复合物；d)在其中支持物结合的转座体复合物将在应用特异性捕获引物的TE区域的3’-末端(“转移链”)连接到靶多核苷酸的条件下，将支持物结合的转座体复合物与靶多核苷酸接触，以产生固定的靶多核苷酸；e)从固体支持物移除转座酶和TEO；g)延伸固定的靶多核苷酸的3’-末端；h)在对于寡核苷酸与在固定的应用特异性捕获引物中的通用捕获区域杂交足够的条件下，施加寡核苷酸；i)在对于核酸酶足够的条件下，将应用特异性捕获引物与核酸酶接触，除去未与TEO杂交的应用特异性捕获引物的TE区域，以将应用特异性捕获引物转化成通用捕获引物；j)从通用捕获引物移除寡核苷酸；k)通过PCR扩增固定的靶多核苷酸以产生多个固定的扩增子；l)对多个固定的扩增子测序，其中测序包括桥式扩增步骤。

在一些实施方案中，该应用特异性捕获区域包括靶特异性捕获区域且应用特异性多核苷酸包括靶多核苷酸。

在一些实施方案中，该应用特异性捕获区域包括转座子末端(TE)区域且应用特异性多核苷酸包括TE寡核苷酸。

在一些实施方案中，本公开内容的方法还包括在执行步骤c)之前，在对于寡核苷酸与应用特异性捕获引物的通用捕获区域杂交足够的条件下，施加寡核苷酸，以产生双链DNA区域。在某些实施方案中，在执行步骤b)之前，例如，在产生固定的应用特异性多核苷酸之前，施加寡核苷酸。在某些其他的实施方案中，在完成步骤b)之后，例如，在产生固定的靶特异多核苷酸之后，施加寡核苷酸。

在某些实施方案中，寡核苷酸可与捕获引物P5(5’-AATGATACGGCGACCACCGA-3’)或P7(5’-CAAGCAGAAGACGGCATACGA-3’)杂交。在某些实施方案中，寡核苷酸是捕获引物P5(“抗-P5”:5’-TCGGTGGTCGCCGTATCATT-3’)或P7(“抗-P7”:5’-TCGTATGCCGTCTTCTGCTTG-3’)的反向互补物。在某些实施方案中，寡核苷酸可与捕获引物P5(双端)(5’-AATGATACGGCGACCACCGAGAUCTACAC-’)或P7(双端)(5’-CAAGCAGAAGACGGCATACGA(8-oxo-G)AT--3’)杂交。在某些实施方案中，寡核苷酸可与捕获引物P5(双端)(“抗-P5(双端)”:5’-GTGTAGATCTCGGTGGTCGCCGTATCATT-3’)或P7(双端)(“抗-P7(双端)”:5’-ATCTCGTATGCCGTCTTCTGCTTG-3’)的反向互补物杂交。

本公开内容的捕获引物可以是通用捕获引物或应用特异性捕获引物。在一些实施方案中，通用捕获引物包括已知的序列。在某些实施方案中，已知的序列是捕获引物P5和P7的序列(参见，例如，图1；通用捕获引物显示为黑色箭头)。

应用特异性捕获引物包括i)包括应用特异性捕获区域的3’部分和ii)包括通用捕获区域的5’部分(参见，例如，图1；通用捕获区域由P5和P7区域例示，显示为黑色实线；应用特异性捕获区域显示为具有不同模式的虚线)。本公开内容的应用特异性捕获引物与应用特异性多核苷酸杂交。在一些实施方案中，应用特异性多核苷酸是转座子末端(TE)寡核苷酸(TEO；例如，嵌合末端寡核苷酸(MEO))。在一些实施方案中，应用特异性多核苷酸是靶多核苷酸。在一些实施方案中，靶多核苷酸呈其野生型形式。在一些实施方案中，靶多核苷酸呈其突变体形式。在一些实施方案中，靶多核苷酸编码多肽。在一些实施方案中，靶多核苷酸编码癌基因。在一些实施方案中，靶多核苷酸编码生物标志物(例如，疾病标志物)。

在一些实施方案中，捕获引物具有发夹结构(参见，例如，图12)。

在一些实施方案中，本公开内容的方法包括提供具有固定的应用特异性捕获引物的固体支持物。在一些实施方案中，提供固体支持物包括将应用特异性捕获引物固定到固体支持物上。

图2A和图2B大体阐明可如何固定应用特异性捕获引物的一种构造。

在一些实施方案中，应用特异性捕获引物被直接固定到固体支持物上。为了这些实施方案的目的，“直接”意味着，在其固定化之前，合成应用特异性捕获引物，与从固体支持物上的不同部分被装配不同。

图2A大体上阐明根据一个实施方案，应用特异性捕获引物(在图2A中称为“修饰的P7”和“修饰的P5”)可如何被直接固定到表面上(通用捕获区域显示为黑色实线；应用特异性捕获区域显示为呈不同模式的虚线)。

在一些实施方案中，应用特异性捕获引物以一步或更多步被装配到固体支持物上。在一些实施方案中，固定应用特异性捕获引物包括将通用捕获引物固定到固体支持物上。在某些实施方案中，所述方法还包括将固定的通用捕获引物转化成应用特异性捕获引物。在某些实施方案中，所述方法还包括将夹板(splint)寡核苷酸与通用捕获引物退火，其中所述夹板寡核苷酸包括与应用特异性捕获引物的通用区域互补的通用区域和与在应用特异性核苷酸中的应用特异性区域互补的应用特异性区域。在某些实施方案中，所述方法还包括延伸通用捕获引物以产生应用特异性捕获引物。

图2B大体上阐明根据一个实施方案，使用引物杂交和延伸方法，可如何修饰固体支持物诸如流动池以装配应用特异性捕获引物(通用捕获区域显示为黑色实线；应用特异性捕获区域显示为呈不同模式的虚线)。

在一些实施方案中，应用特异性捕获引物与其他应用特异性捕获引物被联合固定。在一些实施方案中，应用特异性捕获引物包括多个应用特异性捕获引物。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物是相同的应用特异性捕获引物。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物是不同的应用特异性捕获引物。

在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物具有相同的通用捕获区域。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物具有不同的通用捕获区域。

在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物具有相同的应用特异性捕获区域。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物具有不同的应用特异性捕获区域。

在一些实施方案中，多个应用特异性捕获引物仅包括一个成员。在一些实施方案中，一个应用特异性捕获引物包括通用捕获区域和靶特异性捕获区域。在一些实施方案中，一个应用特异性捕获引物包括通用捕获区域和转座子末端序列。

在一些实施方案中，多个应用特异性捕获引物包括两个不同的应用特异性捕获引物。在一些实施方案中，每个应用特异性捕获引物包括两个通用捕获区域的一个，例如P5区域或P7区域，并且每个包含相同的应用特异性区域。在一些实施方案中，相同的应用特异性区域是靶特异性捕获区域。在一些实施方案中，相同的应用特异性区域是靶-末端区域。

在一些实施方案中，多个应用特异性捕获引物包括多于两个不同的应用特异性捕获引物。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物，每个包括相同的通用捕获区域，例如，P5区域或P7区域，并且每个包括不同的应用特异性捕获区域。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物，每个包括两个通用捕获区域的一个，例如P5区域或P7区域，并且每个包括不同的应用特异性捕获区域。在一些实施方案中，多个应用特异性捕获引物中的应用特异性捕获引物，每个包括两个或更多个通用捕获区域的一个，例如，P5区域或P7区域，并且每个包括不同的应用特异性捕获区域。在一些实施方案中，具有不同的应用特异性捕获区域的多个应用特异性捕获引物可包括多于10、100、1,000、10,000、100,000、1,000,000或10,000,000个不同的成员。在一些实施方案中，不同的应用特异性捕获区域是靶特异性捕获区域。在一些实施方案中，不同的应用特异性捕获区域是转座子末端区域。

在一些实施方案中，应用特异性多核苷酸是多个应用特异性多核苷酸。在一些实施方案中，在多个应用特异性多核苷酸中的应用特异性多核苷酸是相同的应用特异性多核苷酸。在一些实施方案中，在多个应用特异性多核苷酸中的应用特异性多核苷酸是不同的应用特异性多核苷酸。

在一些实施方案中，靶多核苷酸是多个靶多核苷酸。在一些实施方案中，多个靶多核苷酸中的靶多核苷酸是相同的靶多核苷酸。在一些实施方案中，多个靶核苷酸中的靶多核苷酸是不同的靶多核苷酸。

在一些实施方案中，靶多核苷酸包括在多个不同的靶多核苷酸之间保守的区域。在一些实施方案中，多个不同的靶多核苷酸包括基因家族(例如，HLA基因家族)的成员。在一些实施方案中，多个不同的靶多核苷酸包括疾病标志物的多个突变的变体。在一些实施方案中，多个不同的靶多核苷酸包括基因，例如，癌基因，的多个突变的变体。

在一些实施方案中，转座子末端寡核苷酸是多个转座子末端寡核苷酸。在一些实施方案中，多个转座子末端寡核苷酸中的转座子末端寡核苷酸是相同的转座子末端寡核苷酸。在一些实施方案中，多个转座子末端寡核苷酸中的转座子末端寡核苷酸是不同的转座子末端寡核苷酸。

在本公开内容的一些实施方案中，固定的应用特异性捕获引物包括多个固定的应用特异性捕获引物。在一些实施方案中，应用特异性多核苷酸包括多个应用特异性多核苷酸。在一些实施方案中，多个应用特异性多核苷酸包括多个靶多核苷酸。在一些实施方案中，多个应用特异性多核苷酸包括多个TE区域。

在一些实施方案中，基本上所有固定的捕获引物是应用特异性捕获引物。在其他的实施方案中，应用特异性捕获引物与通用捕获引物被联合固定。在一些实施方案中，过量的应用特异性捕获引物被固定。在一些实施方案中，应用特异性捕获引物超过通用捕获引物的过量是大于2:1、3:1、5:1、10:1、50:1、100:1、500:1、1,000:1、10,000:1、50,000:1或100,000:1。在一些实施方案中，过量的通用捕获引物被固定。在一些实施方案中，通用捕获引物超过应用特异性捕获引物的过量是大于2:1、3:1、5:1、10:1、50:1、100:1、500:1、1,000:1、10,000:1、50,000:1或100,000:1。

本公开内容的方法包括移除未杂交的应用特异性捕获引物的一些或所有的应用特异性捕获区域。应用特异性捕获区域可通过任何化学方法(例如，使用金属-有机复合物)、生物化学方法(例如，使用酶)、或物理方法(例如，使用辐射、原子力镊、光镊)或任何本领域已知的用于从较大的寡核苷酸或多核苷酸移除单链未杂交的寡核苷酸或多核苷酸部分的方法来移除。

在一些实施方案中，应用特异性捕获区域被生物分子移除。本公开内容的生物分子包括但不限于酶、抗体(例如，催化抗体)或适体。

在一些实施方案中，该生物分子是核酸酶。在一些实施方案中，该核酸酶为外切核酸酶。该外切核酸酶可以是5’到3’外切核酸酶、3’到5’外切核酸酶或poly(A)特异的3’到5’外切核酸酶。外切核酸酶可包括任何具有外切核酸酶活性的蛋白或蛋白结构域，例如DNA聚合酶I。在某些实施方案中，外切核酸酶是外切核酸酶I。在某些实施方案中，外切核酸酶是外切核酸酶II。在某些实施方案中，外切核酸酶是外切核酸酶III。在某些实施方案中，外切核酸酶是外切核酸酶IV。在某些实施方案中，外切核酸酶是外切核酸酶V。

在一些实施方案中，核酸酶为内切核酸酶。在某些实施方案中，内切核酸酶是限制性内切核酸酶。限制性内切核酸酶可以是I型酶(EC3.1.21.3)、II型酶(EC 3.1.21.4)、III型酶(EC 3.1.21.5)、或IV型酶(EC3.1.21.5)。限制性内切核酸酶可包括，例如，但不限于Alu I、Ava I、Bam HI、Bgl II、Eco P15 I、Eco RI、Eco RII、Eco RV、Hae III、Hga I、HhaI、Hind III、Hinf I、Hpa I、Kpn I、Mbo I、Not I、Pst I、Pvu II、Sac I、Sal I、Sau 3A、ScaI、Sma I、Spe I、Sph I、Sst I、Stu I、Taq I、Xba I或Xma I。限制性内切核酸酶可以是重组的限制性酶。重组限制性酶可包括但不限于，包括天然的或改造的DNA结合结构域(例如，锌指结构域、TAL效应物结构域)和核酸酶结构域(例如，ⅡS型限制性酶Fokl的裂解结构域)的融合蛋白。

生物分子可衍生自任何表达各生物分子的任何生物体，包括真核生物(例如，植物、昆虫、哺乳动物)和原核生物。在某些实施方案中，生物分子衍生自真细菌(例如，革兰氏阳性、革兰氏阴性)、古细菌、酵母菌、真菌、藻类。原核生物可包括，例如，但不限于藤黄节杆菌(Arthrobacter luteus)、多变鱼腥藻(Anabaena variabilis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、球芽孢杆菌(Bacillus globigii)、大肠杆菌RY 13(Escherichia coli RY 13)、大肠杆菌R245(Escherichia coli R245)、埃及嗜血杆菌(Haemophilus aegyptius)、溶血性嗜血杆菌(Haemophilus haemolyticus)、流感嗜血杆菌Rd(Haemophilus inflenzae Rd)、禽嗜血杆菌(Haemophilus gallinarum)、副流感嗜血杆菌(Haemophilus parainflenzae)、肺炎克雷伯杆菌(Klebsiella pneumonia)、牛莫拉氏杆菌(Moraxella bovis)、Nocardia otitidis、普通变形杆菌(Proteus vulgaris)、斯氏普罗威登斯菌(Providencia stuartii)、粘质沙雷氏菌(Serratia marcescens)、浮游球衣菌(Sphaerotilus natans)、金黄色葡萄球菌(Staphylococcus aureus)、产色链霉菌(Streptomyces achromogenes)、白色链霉菌G(Streptomyces albus G)、头状链霉菌(Streptomyces caespitosus)、Streptomyces stanford、杀结核链霉菌(Streptomycestubercidicus)、暗色产色链霉菌(Streptomyces phaeochromogenes)、水生栖热菌(Thermophilus aquaticus)、巴氏黄单胞菌(Xanthamonas badrii)或Xanthamonasmalvacearum。

生物分子可以是野生型形式或突变体形式。生物分子可以是重组生物分子。

在一些实施方案中，所述方法还包括将应用特异性捕获引物与核酸酶接触，其中应用特异性捕获区域被核酸酶移除。在一些实施方案中，所述方法还包括将应用特异性捕获引物与核酸酶接触，其中应用特异性捕获引物具有靶特异性捕获区域并且该靶特异性捕获区域被核酸酶移除。

在一些实施方案中，所述核酸酶为外切核酸酶。在一些实施方案中，所述外切核酸酶是外切核酸酶I。

图3大体上阐明本公开内容的实施方案(还参见实施例I)。上图显示固定到固体支持物的应用特异性捕获引物。所述应用特异性捕获引物包含接近表面的通用捕获区域(“P5”或“P7”，显示为黑色实线)。应用特异性捕获区域存在于捕获引物的3’末端(显示为具有不同模式的虚箭头)。在一些实施方案中，应用特异性捕获区域是靶特异性捕获区域。应用特异性捕获区域可与应用特异性多核苷酸(例如，转座子末端寡核苷酸(TEO))或靶多核苷酸诸如基因组DNA片段杂交。根据图3的方法，应用特异性捕获引物的通用捕获区域被与互补的寡核苷酸(例如，“抗P5”或“抗P7”)杂交以形成双链DNA区段。捕获引物的应用特异性区域保持未杂交(例如，单链)，并且用外切核酸酶I移除。移除应用特异性区域将应用特异性捕获引物转化成通用捕获引物。

在一些实施方案中，本公开内容的方法还包括在执行步骤c)之前，在对于寡核苷酸与应用特异性捕获引物的靶特异性捕获区域杂交足够的条件下施加寡核苷酸，以产生双链DNA区域。在某些实施方案中，在执行步骤b)之前，例如，在产生固定的应用特异性多核苷酸之前，施加寡核苷酸。在某些其他的实施方案中，在完成步骤b)之后，例如，在产生固定的靶特异性多核苷酸之后，施加寡核苷酸。在一些实施方案中，所述方法还包括将应用特异性捕获引物与核酸酶接触，其中双链DNA被核酸酶移除。在某些实施方案中，所述核酸酶是外切核酸酶III。在某些实施方案中，寡核苷酸与转座子末端区域杂交。在某些实施方案中，寡核苷酸与靶特异性捕获区域杂交。在某些实施方案中，寡核苷酸是多个寡核苷酸。在某些实施方案中，多个寡核苷酸与固定在固体支持物上的应用特异性捕获引物的一些或所有靶特异性捕获区域杂交(例如，多于1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、15％、20％、30％、40％、50％、60％、70％、80％、90％、95％或99％)。

在本公开内容的方法中，移除应用特异性捕获区域可包括移除一些或所有的应用特异性捕获区域。在一些实施方案中，所有的应用特异性捕获区域被移除(100％)。在一些实施方案中，少于5％、10％、20％、30％、50％、60％、70％、80％、90％、95％或99％的应用特异性捕获区域被移除。

在一些实施方案中，所述方法还包括移除一些或所有的通用捕获区域。在一些实施方案中，所有的通用捕获区域被移除(100％)。在一些实施方案中，少于5％、10％、20％、30％、50％、60％、70％、80％、90％、95％或99％的通用捕获区域被移除。在一些实施方案中，所述方法包括将应用特异性捕获引物与核酸酶接触，其中通用捕获区域被核酸酶移除。在某些实施方案中，所述核酸酶是外切核酸酶I。在某些实施方案中，所述核酸酶是外切核酸酶III。

在一些实施方案中，应用特异性捕获引物还包括包含限制位点的部分。限制位点可通过限制性内切核酸酶裂解。在某些实施方案中，所述限制位点长4-8碱基对。在某些实施方案中，所述限制位点是回文序列(例如被EcoRI裂解的限制位点，GAATTC)。在某些实施方案中，所述限制位点位于应用特异性捕获引物的应用特异性捕获区域和通用捕获区域之间。

在一些实施方案中，所述方法还包括将应用特异性捕获引物与限制性内切核酸酶接触，其中所述应用特异性捕获引物包括限制位点。在一些实施方案中，所述限制性内切核酸酶裂解所述限制位点。在一些实施方案中，所述限制性内切核酸酶移除应用特异性捕获引物的应用特异性区域。

在一些实施方案中，应用特异性捕获区域被从基本上一些或所有固定的应用特异性捕获引物移除。在一些实施方案中，应用特异性捕获区域被从多于5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、95％或99％的固定的应用特异性捕获引物移除。在一些实施方案中，基本上所有固定的捕获引物是应用特异性捕获引物，并且应用特异性捕获区域被从基本上所有应用特异性捕获引物移除。在一些实施方案中，基本上所有应用特异性捕获引物被转化成通用捕获引物。

在一些实施方案中，本公开内容的方法在靶捕获应用中使用。图4大体上阐明在直接靶捕获中的使用。上图显示合适用于靶捕获的流动池。在该流动池中，所有应用特异性捕获引物在其3’末端具有靶特异性捕获区域。每个显示的捕获引物靶向不同的靶多核苷酸(如被在3’末端的具有不同模式的虚线指示)。多个靶多核苷酸，例如片段化的基因组DNA，在流动池内部流动。靶多核苷酸通过与靶特异性捕获引物匹配被捕获。不是靶的多核苷酸被洗掉。随后是第一轮的DNA聚合作用(第1链延伸)，据此靶分子被复制并且从单链靶多核苷酸转化成双链DNA。在一些实施方案中，随后是第一个循环的桥式扩增(如在例如，图4中显示的)。然后，抗P5和抗P7寡核苷酸与捕获引物的通用捕获区域P5和P7杂交，以产生双链区域。在下一步，未杂交的捕获引物的靶特异性捕获区域通过外切核酸酶I被移除，而呈其双链构造的通用捕获区域被保护。移除抗P5和抗P7寡核苷酸之后，固定的靶多核苷酸可通过桥式扩增被进一步扩增和测序。

在一些实施方案中，该应用特异性捕获区域包括靶特异性捕获区域且应用特异性多核苷酸包括靶多核苷酸。在一些实施方案中，所述方法还包括延伸与靶多核苷酸杂交的应用特异性捕获引物的靶特异性捕获区域，以产生与靶多核苷酸互补的固定的延伸产物。在一些实施方案中，所述方法包括将通用捕获引物与固定的延伸产物退火。在一些实施方案中，所述方法包括通过PCR扩增固定的延伸产物以产生多个固定的扩增子。在一些实施方案中，所述方法包括对所述多个固定的扩增子测序。在一些实施方案中，测序包括桥式扩增步骤。

在一些实施方案中，本公开内容的方法在表面标签化应用中使用。标签化实验的大体设计显示在图10中。首先，使用引物杂交和延伸方法将转座子末端区域(例如，ME)添加到通用捕获引物的3’末端。下一步，转座子末端寡核苷酸与转座子末端区域杂交，以形成双链转座子末端。转座酶结合到转座子末端，因此产生表面转座体。在一些实施方案中，转座酶结合到所有双链转座子末端。在其他的实施方案中，转座酶结合到少于所有的双链转座子末端(例如，少于99％、95％、90％、80％、70％、60％、50％、40％、30％、20％、10％、5％或1％)。靶多核苷酸被直接标签化到表面上。标签化的靶多核苷酸包括例如基因组DNA。标签化包括将延伸的通用引物的3’-链与靶多核苷酸链连接，因此固定靶多核苷酸。在一些实施方案中，转座酶复合物和转座子末端寡核苷酸被移除，并且随后是一轮的靶多核苷酸延伸(参见，例如，图10)。捕获引物的通用捕获区域(例如，P5和P7区域)通过与互补的寡核苷酸(抗P5和抗P7)杂交将这些区域转化成双链被保护免于外切核酸酶消化。单链转座子末端区域被用外切核酸酶I移除。进行桥式扩增并且准备得到的靶多核苷酸簇用于测序。

在一些实施方案中，该应用特异性捕获区域包括转座子末端(TE)区域且应用特异性多核苷酸包括TE寡核苷酸。在一些实施方案中，所述方法还包括在执行步骤b)之后和执行步骤c)之前，将转座酶结合到TE区域-TE寡核苷酸(TEO)杂合体以产生支持物结合的转座体复合物。在一些实施方案中，所述方法还包括在其中支持物结合的转座体复合物连接在应用特异性捕获引物的TE区域的3’-末端(“转移链”)到靶多核苷酸的条件下，将支持物结合的转座体复合物与靶多核苷酸接触，以产生固定的靶多核苷酸。在一些实施方案中，所述方法还包括延伸固定的靶多核苷酸的3’-末端。在一些实施方案中，所述方法还包括从固体支持物移除转座酶和TEO。在一些实施方案中，所述方法还包括延伸固定的靶多核苷酸的3’-末端。在一些实施方案中，所述方法还包括通过PCR扩增固定的靶多核苷酸以产生多个固定的扩增子。在一些实施方案中，所述方法还包括对所述多个固定的扩增子测序。在一些实施方案中，测序包括桥式扩增。

在一些实施方案中，相对于其中未进行本公开内容的方法的对照，本公开内容的方法改进在直接靶捕获应用或在表面标签化应用中的测序数据质量或测序数据数量(参见，例如，实施例II)。在一些实施方案中，所述方法降低错配率百分比(PF％；纯度过滤器(pruity filter))。在某些实施方案中，在表面标签化应用中的错配率％少于0.6％、0.5％、0.4％、0.3％、0.2％或更少。在一些实施方案中，所述方法增加高于Q30的碱基的百分比(大于1/1,000的碱基正确的概率)。在某些实施方案中，在表面标签化应用中高于Q30的碱基的百分比大于90％、91％、92％、93％、94％、95％、96％或更多。在一些实施方案中，所述方法增加PF簇的百分比(PF％，穿过最小信号阈值的簇的数目)。在某些实施方案中，所述方法增加在表面标签化应用中PF簇的百分比到大于70％、75％、80％、85％或更多。在一些实施方案中，所述方法增加对齐读段的百分比(对齐(PF)％)。在某些实施方案中，所述方法增加对齐读段的百分比到大于70％、75％、80％、85％或90％。

本公开内容还涉及根据本文提供的方法产生的固定的核酸片段的扩增。固定的核酸片段可包括，例如，与作为直接捕获应用的部分捕获的靶多核苷酸互补的固定的延伸产物。在另一个实例中，固定的核酸片段可包括，在标签化应用的过程中固定的靶多核苷酸。固定的核酸片段可根据本领域已知的任何合适的扩增方法被扩增。在一些实施方案中，在固体支持物上扩增固定的核酸片段。在一些实施方案中，固体支持物与其上发生表面结合的标签化的固体支持物是同一固体支持物。在此类实施方案中，本文提供的方法和组合物允许从最初的样品引入步骤至扩增且任选地至测序步骤，样品制备在同一固体支持物上进行。

例如，在一些实施方案中，固定的核酸片段使用簇扩增方法来扩增，如由美国专利号7,985,565和7,115,400的公开内容所例示的，其每个的内容通过引用以全文并入本文。美国专利号7,985,565和7,115,400的并入的材料描述了固相核酸扩增的方法，其允许扩增产物被固定在固体支持物上，以形成包括固定的核酸分子的簇或“集群”的阵列。在此类阵列上的每个簇或集群从多个相同的固定的多核苷酸链和多个相同的固定的互补多核苷酸链形成。如此形成的阵列本文中通常地被称作“成簇的阵列”。固相扩增反应的产物诸如在美国专利号7,985,565和7,115,400中描述的那些，是通过固定的多核苷酸链和固定的互补的链的对的退火形成的所谓的“桥接的”结构，两种链在5'末端被固定在固体支持物上，优选地经由共价附接。簇扩增方法是其中固定的核酸模板被用来产生固定的扩增子的方法的实例。其他合适的方法也可被用来从根据本文提供的方法产生的固定的核酸片段产生固定的扩增子。例如，一个或更多个簇或集群可经由固相PCR来形成，每对扩增引物中的一个或两个引物是被固定的。

在其他的实施方案中，在溶液中扩增固定的核酸片段。例如，在一些实施方案中，固定的核酸片段被裂解或者以其他方式从固体支持物释放，并且然后扩增引物在溶液中与释放的分子杂交。在其他的实施方案中，对于一个或更多个初始扩增步骤，扩增引物被与固定的核酸片段杂交，然后是在溶液中的随后扩增步骤。因此，在一些实施方案中，固定的核酸模板可被用来产生溶液相扩增子。

将领会的是，本文描述的或本领域一般已知的任何扩增方法可与通用引物或靶特异性引物一起使用以扩增固定的核酸片段。用于扩增的合适的方法包括但不限于聚合酶链式反应(PCR)、链置换扩增(SDA)、转录介导的扩增(TMA)和基于核酸序列的扩增(NASBA)，如在美国专利号8,003,354中描述的，其通过引用以其全文并入本文。以上扩增方法可被用来扩增一个或更多个感兴趣的核酸。例如，PCR，包括多重PCR、SDA、TMA、NASBA等可被用来扩增固定的DNA片段。在一些实施方案中，将特异地针对感兴趣的核酸的引物包括在扩增反应中。

用于核酸扩增的其他合适方法可包括寡核苷酸延伸和连接技术、滚环扩增(RCA)技术(Lizardi等人,Nat.Genet.19:225-232(1998)，其通过引用并入本文)和寡核苷酸连接测定(OLA)技术(通常参见美国专利号7,582,420、5,185,243、5,679,524和5,573,907；EP 0320 308 B1；EP 0 336 731 B1；EP 0 439 182 B1；WO 90/01069；WO 89/12696和WO 89/09835，其全部通过引用并入本文)。将领会，这些扩增方法可被设计为扩增固定的核酸片段。例如，在一些实施方案中，扩增方法可包括连接探针扩增或寡核苷酸连接测定(OLA)反应，其包括特异地针对感兴趣的核酸的引物。在一些实施方案中，扩增方法可包括引物延伸-连接反应，其包括特异地针对感兴趣的核酸的引物。作为引物延伸和可被特异地设计为扩增感兴趣的核酸的连接引物的非限制性实例，扩增可包括用于GoldenGate测定(Inc.,San Diego,CA)的引物，如由美国专利号7,582,420和7,611,869所例示的，其每个通过引用以其全文并入本文。

可在本公开内容的方法中使用的示例性等温扩增方法包括但不限于多重置换扩增(MDA)，如由例如Dean等Proc.Natl.Acad.Sci.USA99:5261-66(2002)所例示的，或等温链置换核酸扩增，由例如美国专利号6,214,587所例证的，其每个通过引用以其全文并入本文。可在本公开内容中使用的其他的非基于PCR的方法包括例如链置换扩增(SDA)，其在例如Walker等Molecular Methods for Virus Detection,Academic Press,Inc.,1995；美国专利号5,455,166和5,130,238，以及Walker等Nucl.Acids Res.20:1691-96(1992)中被描述；或超支化链置换扩增，其在例如Lage等Genome Research 13:294-307(2003)中被描述，其每个通过引用以其全文并入本文。等温扩增方法可与用于基因组DNA的随机引物扩增的链置换Phi29聚合酶或Bst DNA聚合酶大片段5'->3'外切酶一起使用。这些聚合酶的使用利用其高的持续合成能力和链置换活性。高的持续合成能力允许聚合酶产生长10-20kb的片段。如以上描述的，可在等温条件下使用具有低的持续合成能力和链置换活性的聚合酶诸如Klenow聚合酶产生较小的片段。在美国专利号7,670,810的公开内容中详细描述了扩增反应、条件和组分的另外的描述，其通过引用以其全文并入本文。

在本公开内容中有用的另一种核酸扩增方法是加标签的PCR，其使用具有恒定的5’区域接着是随机的3’区域的多个双域引物，例如在Grothues等Nucleic Acids Res.21(5):1321-2(1993)中描述的，通过引用以其全文并入本文。进行第一轮扩增以允许基于从随机合成的3'区域单独杂交的对热变性的DNA的大量起始。由于3’区域的性质，所以起始位点预期是遍及基因组随机的。其后，未结合的引物可被移除并且进一步的复制可使用与恒定的5’区域互补的引物发生。

本公开内容还涉及根据本文提供的方法产生的固定的靶多核苷酸的测序。例如由表面结合的转座体介导的标签化或直接靶捕获产生的固定的靶多核苷酸可根据任何合适的测序方法而被测序，所述测序方法诸如直接测序，包括合成测序、连接测序、杂交测序、纳米孔测序等。在一些实施方案中，在固体支持物上对固定的靶多核苷酸测序。在一些实施方案中，用于测序的固体支持物与其上发生表面结合的标签化的固体支持物是同一固体支持物。在一些实施方案中，用于测序的固体支持物与于上发生扩增的固体支持物为同一固体支持物。

一种优选的测序方法是合成测序法(SBS)。在SBS中，监测核酸引物沿着核酸模板(例如，靶核酸或其扩增子)的延伸以确定模板中核苷酸的序列。根本的化学方法可以是聚合作用(例如，如被聚合酶催化)。在特定的基于聚合酶的SBS实施方案中，荧光标记的核苷酸以模板依赖模式被添加至引物(从而延伸引物)，以使得添加至引物的核苷酸的顺序和类型的检测可被用来确定模板的序列。

流动池提供了用于容纳由本公开内容的方法产生的扩增的DNA片段的方便的固体支持物。此类形式的一种或更多种扩增的DNA片段可经受SBS或包括以循环重复递送试剂的其他检测技术。例如，为了起始第一SBS循环，一个或更多个标记的核苷酸、DNA聚合酶等可流入/流经容纳一个或更多个扩增的核酸分子的流动池。其中引物延伸导致标记的核苷酸被并入的那些位点可被检测。任选地，核苷酸还可包括可逆终止特性，在核苷酸已被添加至引物后，终止进一步的引物延伸。例如，具有可逆终止子部分的核苷酸类似物可被添加至引物，以使得随后的延伸不能发生，直到递送解阻断剂以移除该部分。因此，对于使用可逆终止的实施方案，可将解阻断剂递送至流动池(在检测发生之前或之后)。在多个递送步骤之间可进行洗涤。然后可重复循环n次，以将引物延伸n个核苷酸，从而检测长度n的序列。可容易地适于与由本公开内容的方法产生的扩增子一起使用的示例性SBS过程、流体系统和检测平台被描述于例如Bentley等Nature 456:53-59(2008)；WO 04/018497；US 7,057,026；WO 91/06678；WO 07/123744；US 7,329,492；US 7,211,414；US 7,315,019；US 7,405,281和US 2008/0108082中。

使用循环反应的其他测序过程可被利用，诸如焦磷酸测序。焦磷酸测序检测随着特定核苷酸并入新生的核酸链，无机焦磷酸(PPi)的释放(Ronaghi,等AnalyticalBiochemistry 242(1),84-9(1996)；Ronaghi,Genome Res.11(1),3-11(2001)；Ronaghi等Science 281(5375),363(1998)；US 6,210,891；US 6,258,568和US.6,274,320，其每个通过引用并入本文)。在焦磷酸测序中，释放的PPi可通过以下检测：立即被ATP硫酸化酶转化成腺苷三磷酸(ATP)，并且产生的ATP的水平可经由荧光素酶产生的质子来检测。因此，测序反应可经由发光检测系统来监测。用于基于荧光的检测系统的激发放射源对于焦磷酸测序过程不是必需的。可适用于对根据本公开内容产生的扩增子应用焦磷酸测序的有用的流体系统、检测器和过程，被描述例如在WIPO专利申请系列号PCT/US11/57111、US 2005/0191698A1、US 7,595,883和US 7,244,559中。

一些实施方案可利用包括DNA聚合酶活性的实时监测的方法。例如，核苷酸并入可通过载有荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用，或用零模波导(ZMW)来检测。用于基于FRET的测序的技术和试剂被描述于例如Levene等Science 299,682–686(2003)；Lundquist等Opt.Lett.33,1026–1028(2008)；Korlach等Proc.Natl.Acad.Sci.USA 105,1176–1181(2008)。

一些SBS实施方案包括检测将核苷酸并入延伸产物后释放的质子。例如，基于检测释放的质子的测序可使用电子检测器和从Ion Torrent(Guilford,CT,a LifeTechnologies subsidiary)商业可得的相关技术，或在US 2009/0026082 A1；US 2009/0127589 A1；US 2010/0137143 A1；或US 2010/0282617 A1中描述的测序方法和系统。本文描述的用于使用动力学排除扩增靶核酸的方法可容易地应用于被用来检测质子的底物。更具体地，本文描述的方法可被用来产生用于检测质子的扩增子的克隆群体。

另一种有用的测序技术是纳米孔测序(参见，例如，Deamer等TrendsBiotechnol.18,147–151(2000)；Deamer等Acc.Chem.Res.35:817-825(2002)；Li等Nat.Mater.2:611–615(2003)。在一些纳米孔实施方案中，将靶核酸或从靶核酸移除的单个核苷酸通过纳米孔。随着核酸或核苷酸通过纳米孔，每个核苷酸类型可通过测量孔的电导率波动来鉴定。(美国专利号7,001,792；Soni等Clin.Chem.53,1996–2001(2007)；Healy,Nanomed.2,459–481(2007)；Cockroft等J.Am.Chem.Soc.130,818–820(2008)。

可应用于根据本公开内容的检测的用于基于阵列的表达和基因分型分析的示例性方法被描述于美国专利号7,582,420；6,890,741；6,913,884或6,355,431或美国专利公布号2005/0053980 A1；2009/0186349 A1或US 2005/0181440 A1。

本文描述的方法的有益用途是，其提供了多个核酸片段的快速且高效的平行检测。相应地，本公开内容提供了能够利用本领域已知的技术诸如以上例示的那些制备并检测核酸的整合系统。因此，本公开内容的整合系统可包括能够将扩增试剂和/或测序试剂递送至一个或更多个固定的核酸片段的流体组件；系统包括诸如泵、阀门、储液箱、射流线路等组件。流动池可被构造和/或在用于检测靶核酸的整合系统中使用。示例性流动池被描述在，例如，US 2010/0111768 A1和美国系列号13/273,666中，其每个通过引用并入本文。作为流动池的例示，整合系统的一个或更多个流体组件可被用于扩增方法和用于检测方法。以核酸测序实施方案为例，整合系统中的一种或更多种流体组件可被用于本文描述的扩增方法并用于在诸如以上例证的那些的测序方法中递送测序试剂。可选地，整合系统可包括分隔流体系统以进行扩增方法和进行检测方法。能够产生扩增的核酸且还能够确定核酸的序列的整合测序系统的实例包括但不限于MiSeqTM平台(Inc.,San Diego,CA)和在美国系列号13/273,666中描述的装置。

本公开内容还涉及用于修饰固定的捕获引物的试剂盒。在一些实施方案中，所述试剂盒包括a)应用特异性捕获引物，所述应用特异性捕获引物包括i)包括应用特异性捕获区域的3’部分，和ii)包括通用捕获区域的5’部分，和b)核酸酶。在其他实施方案中，所述试剂盒包括a)第一通用捕获引物；b)第二通用捕获引物；c)包括与在第一通用捕获引物中的区域互补的区域和与在应用特异性多核苷酸中的区域互补的区域的寡核苷酸；d)包括与在第二通用捕获引物中的区域互补的区域和与在应用特异性多核苷酸中的区域互补的区域的寡核苷酸；和e)核酸酶。在一些实施方案中，所述核酸酶为外切核酸酶。在一些实施方案中，所述核酸酶是外切核酸酶I。在一些实施方案中，所述核酸酶是外切核酸酶III。在一些实施方案中，所述核酸酶为内切核酸酶。在一些实施方案中，所述核酸酶为限制性内切核酸酶。

在一些实施方案中，所述试剂盒还包括用于固定应用特异性捕获引物或通用捕获引物的基底。在一些实施方案中，所述试剂盒还包括包括与通用捕获引物或通用捕获区域互补的区域的一种或更多种寡核苷酸。在一些实施方案中，所述试剂盒还包括一种或更多种包括与靶捕获区域互补的区域的寡核苷酸。在一些实施方案中，所述试剂盒还包括使用试剂盒的组分用于修饰固定的捕获引物的说明书。在一些实施方案中，所述试剂盒还包括一种或更多种对照分析物的混合物，例如两种或更多种对照分析物，用于在测试试剂盒中使用。

本发明还提供用PCR扩增的靶DNA序列占据模式化的流动池的方法。

图13阐明用靶向的DNA扩增产物占据模式化的流动池的方法100的实例的流程图。例如，靶向的DNA扩增可根据在WO2010/038042公布、WO2011/025477公布、U.S.61/928,368专利申请、和/或U.S.61/928,382专利申请中描述的方法进行。方法100使用DNA聚合酶介导的引物延伸步骤和洗涤步骤将在流动池表面上的扩增的靶DNA序列的接种与捕获的靶序列的克隆扩增分开。方法100包括但不限于以下步骤。

在步骤110，靶向的DNA扩增产物被加载到模式化的流动池。所述模式化的流动池包括在流动池表面上的基因特异捕获引物。

在步骤115，靶序列被与在模式化的流动池上的捕获引物杂交。孵育阶段之后，洗涤流动池以移除未结合的序列。

在步骤120，捕获引物通过DNA聚合酶延伸以产生杂交的靶序列的互补物。孵育阶段之后，洗涤流动池。

在步骤125，变性dsDNA。流动池被洗涤以移除未结合的原始的靶序列。

在步骤130，结合的单链模板准备用于克隆扩增和后续测序。在一个实例中，用于占据模式化的流动池的扩增方法是动力学排除方法。例如，动力学排除可根据在U.S.20130338042专利公布中描述的方法进行。在另一个实例中，用于占据模式化的流动池的扩增方法是桥式扩增(28个循环)。

图14图示了图13的方法100的步骤。即，模式化的流动池210包括捕获引物220和多个P5/P7引物225。捕获引物220包括对感兴趣的靶基因特异的寡核苷酸序列。在步骤110，靶向的DNA扩增产物225被加载到流动池210的表面上。靶向的DNA扩增产物225包括感兴趣的靶序列230、过量的引物和DNA。在步骤115，靶序列230被与捕获引物220杂交。在步骤120，捕获引物220通过DNA聚合酶延伸以产生杂交的靶序列230的互补物235。在步骤125，dsDNA被变性并且流动池被洗涤以移除未结合的原始靶序列230。

图15显示通过根据图13的方法100制备的靶向的DNA文库的每泳道的簇密度图。在这个实例中，使用不同密度的捕获探针：25、50、100或200pM制备模式化的流动池。模板输入是10μL或2.5μL的扩增的靶DNA。探针密度和模板输入的汇总显示在表A中。数据显示通过过滤器(绿色框)的簇，具有约30％占据。当分析簇时，从分析结果中移除最不可靠的数据(通常来自重叠簇)。因此，原始数据被过滤以移除任何不满足如通过纯洁性过滤器测量的整体质量的读段。碱基访问的纯洁性被计算为最亮的强度除以最亮的强度和次亮的强度的总数的比率。例如，如果在前25个循环不超过1个碱基访问具有<0.6的纯洁性，则簇“通过过滤器(PF)”。虚线条代表原始簇的预期数目/mm2。数据显示，在模式化的流动池上使用标准加载方法，通过过滤器的簇的百分比是限于约30％到约40％的泊松分布。该限制是因为使用单一模板杂交步骤播种模式化的阵列，所以泊松加载预测，一些阵列将保持空的，一些将具有单一模板，且其他的将具有多个模板。

图16阐明制备用于模式化的流动池的靶向的DNA扩增产物的方法400的实例的流程图。在加载到模式化的流动池之前，方法400使用基于珠的靶捕获以预富集靶分子。方法400包括但不限于以下步骤。

在步骤410，P7引物被珠结合，并且“夹板”寡核苷酸随后与结合的P7引物杂交。在一个实例中，P7引物是生物素化的并且珠是链霉抗生物素蛋白涂覆的珠。P7引物经由生物素-链霉抗生物素蛋白结合复合物结合到珠表面。在另一个实例中，P7引物使用可用于结合寡核苷酸到固体表面的任何合适的DNA化学反应来结合珠。“夹板”寡核苷酸包括与P7引物(或其的部分)互补的3’序列和包括与捕获探针序列互补的序列的5’寡核苷酸序列。

在步骤415，结合的P7/夹板双链体延伸以形成经由其5’末端连接到珠的捕获探针。捕获探针包括对感兴趣的靶分子特异的序列。各自含有不同的互补捕获探针序列的多个夹板可被连接到珠。

在步骤420，靶向的DNA扩增产物被添加到其上结合有捕获探针的珠的悬浮液。

在步骤425，在靶向的DNA扩增产物中的靶序列被与捕获探针杂交。

在步骤430，捕获探针通过DNA聚合酶延伸以产生杂交的靶序列的互补物。新合成的链包括P7和P5引物二者。

在步骤435，变性dsDNA以移除未结合的原始模板。新合成的互补链保持与珠结合。

在步骤440，互补链被从珠释放。在一个实例中，通过生物素-链霉抗生物素蛋白复合物结合到珠的互补链通过在水中煮沸珠悬浮液持续一段足以释放链的时间被从珠释放。

在步骤445，P7-P5引导的靶向的序列被加载到模式化的流动池上用于随后的簇产生和测序。

图17图示图16的方法400的步骤。即，珠510被用于捕获靶序列。在步骤410，P7引物515被结合到珠510，并且夹板寡核苷酸(未显示)被与P7引物515杂交。在步骤415，P7引物/夹板双链体延伸以形成捕获探针520。在步骤420，靶向的DNA扩增产物525被添加到具其上结合有捕获探针520的珠510的悬浮液。在步骤425，包含在PCR产物525中的靶序列530与捕获探针520杂交。在步骤430，捕获探针520通过DNA聚合酶延伸以产生靶序列530的互补链535。在步骤435，变性dsDNA以移除靶序列530。在步骤440，延伸的互补链535被从珠510释放。

图18A和图18B显示对于根据图16的方法400制备的珠富集的靶向的DNA文库，每泳道的簇密度图和序列度量的汇总数据表。在该实例中，簇产生和测序在pazam模式化的流动池上进行。将对照样品(CT13776)和从珠释放的延伸的(EXT)互补ssDNA与动力学排除扩增试剂混合，并且加载到流动池的单独的泳道上，如在数据表中显示的。对照样品(CT13776)是从人类基因组DNA衍生的TruSeq无PCR文库。EXT DNA是来自使用10ng的Coriell人类DNA样品的初始扩增的CPT珠选择的靶向的DNA扩增产物。参考图18A，该图显示对于模式化的流动池的每个泳道，通过过滤器的簇。在图18A的顶部的虚线是对于700nm倾斜模式化的流动池的特征的预期原始密度。在图18A中显示的框标绘通过过滤器的簇的实际数目(每mm2)。参考图18B，对于泳道2和泳道3，通过过滤器的簇的百分比(PF簇％)是约50％到约60％，并且显示与人类基因组的对齐(对齐(PF)％)是约77％。数据显示，CPT珠富集的材料可被用于有效地加载带有PCR扩增的靶DNA序列的模式化的流动池。

在一些实施方案中，基于珠的靶向捕获的低产量可通过用亚氨基生物素或脱硫生物素取代生物素化的P7寡核苷酸上的生物素来克服。在某些情况下的低产量可归因于难以从链霉抗生物素蛋白洗脱生物素。但是，使用亚氨基生物素产生文库产物，其可以在pH 7.5或高于7.5有效地结合到链霉抗生物素蛋白，并且在pH 4.0、室温以接近100％的产率温和地洗脱。可选地，用脱硫生物素取代生物素产生文库产物，其有高效地结合到链霉抗生物素蛋白并且用游离的生物素洗脱。

在本文描述的某些靶向捕获测定格式中，生物素-P7寡核苷酸结合到链霉抗生物素蛋白珠。在将捕获探针与链霉抗生物素蛋白结合的P7寡核苷酸退火之后，捕获探针序列通过引物延伸被附接到结合的P7寡核苷酸。靶不对称PCR产物与捕获探针退火，并且充当用于链延伸的模板。在某些实施方案中，洗涤之后，通过在100℃在水中孵育5分钟从链霉抗生物素蛋白珠洗脱单链生物素化的P7-捕获探针-靶DNA。这种洗脱方法可导致，仅小部分的ssDNA产物通过这种方法从链霉抗生物素蛋白洗脱，导致可用于成簇的低的文库产率。用亚氨基生物素取代生物素导致文库产物可易于通过pH变成pH 4从链霉抗生物素蛋白洗脱。可选地，用脱硫生物素取代生物素导致文库产物可易于用游离的生物素从链霉抗生物素蛋白洗脱。这两种洗脱方法都是温和的并且可产生几乎100％文库产物回收，这可减少用于文库制备需要的DNA输入量，导致增加的灵敏度。任何合适形式的亚氨基生物素可在本文提供的方法中使用。亚氨基生物素对于典型地用于合成之后寡核苷酸去保护的某些条件不稳定。并入亚氨基生物素的可选的方法是将NHS-亚氨基生物素与用C6或C12修饰的氨基基团修饰的寡捕获探针偶联。脱硫生物素-TEG亚磷酰胺商购可得。结构显示在下面。脱硫生物素可在常规合成期间被并入寡核苷酸。

从前面的描述，将明显的是，可对本文描述的发明进行改变和修饰以将其采用到各种用法和条件。此类实施方案也在所附权利要求书的范围内。

本文中变量的任何定义的要素列表的列举包括作为列出的要素的任何单一要素或组合(或子组合)的该变量的定义。本文中一个实施方案的列举包括，作为任何单一实施方案或与任何其他实施方案或其部分组合的实施方案。

本说明书中提到的所有专利和出版物通过引用并入本文，其程度如同每个单独专利和出版物被具体和单独地指明通过引用并入的相同程度。

下面的实施例以例示方式提供而并非限制。

实施例I

通过外切核酸酶从捕获引物移除转座子末端序列

该实施例描述了用于通过引物杂交和延伸以及随后通过外切核酸酶移除应用特异性捕获区域，将通用捕获引物转化成应用特异性捕获引物的整合过程。

具体地，该实施例描述了证实在图2B(通过引物杂交和延伸修饰通用引物)和在图3(通过外切核酸酶I移除修饰的引物的应用特异性区域)中阐明的实施方案的实验。

使用如在表1和图9A-D中所示的条件和对照的列表在8泳道流动池上进行实验。

转座子末端区域(ME区域)通过杂交夹板寡核苷酸并且用聚合酶将其复制被添加到表面结合的P5和P7引物的3’末端。ME序列被添加到流动池泳道2、3、5、6、7和8，但未被添加到泳道1和4。在移除夹板寡核苷酸之后，通过使用以标记的寡核苷酸(P5(“抗P5”)和P7(“抗P7”)的反向互补物)的引物密度测定，评价每个泳道中表面结合的P5和P7序列的量。该实验的结果显示在图9A中。所有8条泳道显示在表面上具有类似量的表面结合的P5和P7序列。

用使用标记的抗ME寡核苷酸的引物密度测定，对流动池的每个泳道评价ME区域的相对量。该实验的结果显示在图9B中。未经过引物杂交和延伸方案的泳道(泳道1和4)显示无ME特异性信号。与之相比，经过引物杂交和延伸的泳道(泳道2、3、5、6、7和8)显示强的ME特异性信号。

为了保护靶特异性捕获引物的通用捕获区域(P5和P7区域)免受外切核酸酶I消化，抗P5和P7寡核苷酸被与泳道3、6、7和8杂交。然后，泳道4、5、6和8被用外切核酸酶I在38℃处理30分钟。该实验设计概述在表1中。

表1：外切核酸酶消化实验的设计

表1的最后两列代表在每个流动池泳道中观察到的P5/P7特异性信号和ME特异性信号。加号指示观察到强的信号，而减号指示仅观察到弱的信号或背景信号。该实验的结果也显示在图9C和9D中。

发现抗P5和抗P7寡核苷酸有效地保护捕获引物的通用P5和P7区域。例如，在泳道6和8中观察到强的信号，其中P5和P7区域通过与抗P5和抗P7寡核苷酸杂交被保护。与之相比，在泳道4中未观察到P5或P7特异性信号，其中捕获引物的P5和P7区域保持未杂交和单链。

这些结果显示外切核酸酶可有效地移除未杂交的、单链捕获引物，但单链引物可通过与互补寡核苷酸杂交被保护免受外切核酸酶。

显示外切核酸酶有效地从捕获引物移除靶特异ME区域。其中捕获引物的通用捕获区域被保护免受外切核酸酶的泳道6显示无ME特异性信号。与之相比，未经过外切核酸酶处理的泳道7显示强的信号。

概括地说，在该实施例中显示的结果表明，引物延伸和杂交是用于添加靶特异性捕获区域(例如，ME区域)到固定的通用捕获引物的3’末端，因此产生靶特异性捕获引物的有效的方法。外切核酸酶可被用于移除未杂交的靶特异性捕获区域，并且因此将靶特异性捕获引物转化成通用捕获引物。通用捕获引物的通用捕获区域(例如，P5和P7区域)可通过与互补寡核苷酸(例如，抗P5和抗P7寡核苷酸)杂交被保护免受外切核酸酶。

实施例II

表面标签化后，从捕获引物移除转座子末端区域促进桥式扩增

该实施例描述了用于通过表面标签化、移除未杂交的转座子末端区域、桥式扩增和对扩增子测序的DNA固定化的整合过程。

具体地，该实施例描述了证实在图6(准备流动池用于表面标签化)、图7(表面标签化反应)和图10(表面标签化随后移除转座子末端区域)中阐明的实施方案的实验。

例如，可根据在图6中阐明的方案准备流动池用于表面标签化。首先，包含与通用捕获引物(例如，P5或P7)互补的区域和与转座子末端区域(例如，嵌合末端(ME))互补的区域的夹板寡核苷酸与在标准流动池上的通用捕获引物杂交。其次，在其3’-末端延伸通用捕获引物以添加转座子末端区域。在移除夹板寡核苷酸之后，转座子末端寡核苷酸与延伸的捕获引物的转座子末端区域杂交以形成转座子末端。然后，转座酶结合到转座子末端。未结合到转座酶并且不是可变转座体的一部分的转座子末端区域可阻碍桥式扩增，如下文所示。

例如，可根据在图7中阐明的方案进行表面标签化。首先，基因组DNA(示例的靶多核苷酸)在具有表面结合的转座体的流动池内部流动。这些转座体可在“标签化反应”中片段化并且固定基因组DNA。在该反应的过程中，延伸的引物(“转移链”)的3’-末端连接到靶DNA，其因此被固定到流动池(固定的靶多核苷酸)。在完成标签化反应之后，转座酶分子被移除(例如用PBI(Quiagen缓冲液))，并且靶DNA中在标签化反应期间产生的3’末端被延伸。移除转座体之后，保留了过量的具有转座子区域的延伸的捕获引物。

大体上发现，相对于在仅包含通用捕获引物的未修饰的标准流动池上进行的类似的反应，过量靶特异性捕获引物的存在降低测序反应的数据质量和数据数量。例如，与使用仅具有通用捕获引物的未修饰的标准的流动池相比，当使用具有过量靶特异性捕获引物的修饰的流动池时，发现％PF值更低，发现高于Q30的碱基百分位数更低，并且发现当成像在初始SBS(合成测序)循环中的簇时观察到背景信号更高。

在一个具体的实例中，通过在未修饰的标准的表面上(具有标准的P5和P7引物)和在具有包括转座子末端区域(P5-ME和P7-ME引物)的捕获引物的表面上对标准的NEXTERA^TM文库测序，展示了靶特异性捕获引物的作用。该实验的结果显示在表2和图8中。

表2.对NEXTERA^TM文库测序的实验结果

表2显示，标准的表面(泳道1)相比于修饰的表面(泳道2)，产生更多数据(更高的原始簇计数)和也更高的％PF并且获得的数据具有更高质量(更低的错误率，高于Q30的碱基更多)。

图8下图显示正确读段的部分(浅灰色区域)和包含一个错误的读段的部分(深灰色区域)。从标准的表面(泳道1)获得的绝大部分读段是无错误的，而约60％的从修饰的表面(泳道2)获得的读段具有至少一个错误。

下面的标签化实验阐明，通过在完成标签化反应之后和在桥式扩增之前从延伸的捕获引物移除转座子区域，可以改进DNA测序数据的质量。

使用如在图11和表3和4中所示的条件和对照的列表在8泳道流动池上进行实验。

表3.标签化实验的实验条件

实验号：130618_EAS89_0423_FC664KHAAX

表4.标签化实验的实验结果

表4显示来自标签化实验的主要的测序度量。

在泳道2、4、6和8中，在桥式扩增之前，用外切核酸酶I移除靶特异性捕获引物的转座子末端序列。在这些泳道中的测序数据相对于保持未经外切核酸酶处理的泳道1、3和7的数据，在更高的％PF和更高的对齐％和更低的错误率方面显示改进的质量。

图11显示正确簇(浅灰色区域)和具有1个或2个错误的簇(分别为深灰色和黑色区域)的比例。其中转座子末端序列在簇扩增之前被用外切核酸酶I移除的泳道2相比于保持未经外切核酸酶处理的泳道1，显示较大比例的正确簇(浅灰色区域)。

概括来说，该实施例展示，在固定应用特异性多核苷酸之后但在桥式扩增之前，从应用特异性捕获引物移除未杂交的应用特异性捕获区域，充分改善DNA测序数据质量和数量。

尽管已经参考公开的实施方案描述了本公开内容，本领域的技术人员将容易地理解，上文详述的具体的实施例和研究仅是本公开内容的例示。应该理解，可进行各种改变而不偏离本公开内容的精神。因此，本公开内容仅由下面的权利要求书来限制。

Claims

1.一种修饰固定的捕获引物的方法，所述方法包括：

a.提供具有固定的应用特异性捕获引物的固体支持物，所述应用特异性捕获引物包括：

i.包括应用特异性捕获区域的3’部分，和

ii.包括通用捕获区域的5’部分；

b.将应用特异性多核苷酸与所述应用特异性捕获引物在对于杂交足够的条件下接触以产生固定的应用特异性多核苷酸，并且，在对于寡核苷酸与应用特异性捕获引物的通用捕获区域杂交足够的条件下施加寡核苷酸，以产生双链DNA区域，和

c.将所述应用特异性捕获引物与核酸酶接触，以通过核酸酶将未与应用特异性多核苷酸杂交的应用特异性捕获引物的应用特异性捕获区域除去，以将未杂交的应用特异性捕获引物转化为通用捕获引物。

2.根据权利要求1所述的方法，其中所述应用特异性捕获引物包括多个不同的固定的应用特异性捕获引物。

3.根据权利要求1所述的方法，其中所述应用特异性多核苷酸包括多个不同的应用特异性多核苷酸。

4.根据权利要求1所述的方法，其中所述应用特异性捕获区域的一部分被移除。

5.根据权利要求1所述的方法，其中所述应用特异性捕获区域包括靶特异性捕获区域并且其中所述应用特异性多核苷酸包括靶多核苷酸。

6.根据权利要求1所述的方法，其中所述应用特异性捕获区域包括转座子末端区域并且其中所述应用特异性多核苷酸包括转座子末端寡核苷酸。

7.根据权利要求1所述的方法，其中所述通用捕获区域包括已知的序列。

8.根据权利要求1所述的方法，所述方法还包括在执行步骤c之前，在对于寡核苷酸与应用特异性捕获引物的应用特异性捕获区域杂交足够的条件下施加寡核苷酸，以产生双链DNA区域。

9.如权利要求1所述的方法，其中所述核酸酶是外切核酸酶。

10.如权利要求9所述的方法，其中所述外切核酸酶是外切核酸酶I。

11.根据权利要求9所述的方法，其中所述外切核酸酶是外切核酸酶III。

12.根据权利要求1所述的方法，其中所述核酸酶是内切核酸酶。

13.根据权利要求5所述的方法，所述方法还包括延伸与靶多核苷酸杂交的应用特异性捕获引物的靶特异性捕获区域，以产生与所述靶多核苷酸互补的固定的延伸产物。

14.根据权利要求13所述的方法，所述方法还包括将所述通用捕获引物与所述固定的延伸产物退火。

15.根据权利要求14所述的方法，所述方法还包括通过PCR扩增所述固定的延伸产物以产生多个固定的扩增子。

16.根据权利要求15所述的方法，所述方法还包括对所述多个固定的扩增子测序。

17.根据权利要求16所述的方法，其中测序包括桥式扩增步骤。

18.根据权利要求1所述的方法，其中提供固体支持物包括将所述应用特异性捕获引物固定到所述固体支持物上。

19.根据权利要求18所述的方法，其中所述应用特异性捕获引物被直接固定到所述固体支持物上。

20.根据权利要求19所述的方法，其中所述应用特异性捕获引物的固定包括将通用捕获引物固定到所述固体支持物上。

21.根据权利要求20所述的方法，所述方法还包括将固定的通用捕获引物转化成应用特异性捕获引物。

22.根据权利要求21所述的方法，所述方法还包括将夹板寡核苷酸与所述通用捕获引物退火，其中所述夹板寡核苷酸包括与应用特异性捕获引物的通用区域互补的通用区域和与在应用特异性核苷酸中的应用特异性区域互补的应用特异性区域。

23.根据权利要求22所述的方法，所述方法还包括延伸所述通用捕获引物以产生应用特异性捕获引物。

24.根据权利要求6所述的方法，所述方法还包括在执行步骤b之后和执行步骤c之前，将转座酶结合到转座子末端区域-转座子末端寡核苷酸杂合体以产生支持物结合的转座体复合物。

25.根据权利要求24所述的方法，所述方法还包括在其中所述支持物结合的转座体复合物连接所述应用特异性捕获引物的转座子末端区域的3’-末端到靶多核苷酸的条件下，将所述支持物结合的转座体复合物与所述靶多核苷酸接触，以产生固定的靶多核苷酸。

26.根据权利要求25所述的方法，所述方法还包括从所述固体支持物移除所述转座酶和转座子末端寡核苷酸。

27.根据权利要求26所述的方法，所述方法还包括延伸所述固定的靶多核苷酸的3’-末端。

28.根据权利要求27所述的方法，所述方法还包括通过PCR扩增所述固定的靶多核苷酸以产生多个固定的扩增子。

29.根据权利要求28所述的方法，所述方法还包括对所述多个固定的扩增子测序。

30.根据权利要求29所述的方法，其中测序包括桥式扩增步骤。

31.一种修饰固定的捕获引物的方法，所述方法包括：

i.包括靶特异性捕获区域的3’部分，和

ii.包括通用捕获区域的5’部分；

b.将靶多核苷酸与所述应用特异性捕获引物在对于杂交足够的条件下接触以产生固定的靶特异性多核苷酸；

c.延伸与所述固定的靶特异性多核苷酸杂交的应用特异性捕获引物以产生与所述固定的靶特异性多核苷酸互补的固定的延伸产物；

d.在对于寡核苷酸与所述固定的应用特异性捕获引物的所述通用捕获区域杂交足够的条件下，施加寡核苷酸；

e.在对于核酸酶移除未与所述固定的靶特异性多核苷酸杂交的应用特异性捕获引物的靶特异性捕获区域足够的条件下，将所述固定的应用特异性捕获引物与核酸酶接触，以将未杂交的应用特异性捕获引物转化成通用捕获引物；

f.从所述通用捕获引物移除所述寡核苷酸；

g.将所述通用捕获引物与所述固定的延伸产物退火；

h.通过PCR扩增所述固定的延伸产物以产生多个固定的扩增子，和

i.对所述多个固定的扩增子测序，其中测序包括桥式扩增步骤。

32.根据权利要求31所述的方法，其中所述核酸酶是外切核酸酶。

33.根据权利要求32所述的方法，其中所述外切核酸酶是外切核酸酶I。

34.根据权利要求1-33中任一项所述的方法，其中所述固体支持物包括平面的表面。

35.根据权利要求1-33中任一项所述的方法，其中所述固体支持物包括模式化的表面。

36.根据权利要求1-33中任一项所述的方法，其中所述固体支持物包括珠。

37.根据权利要求36所述的方法，其中捕获引物被使用生物素固定到所述珠。

38.根据权利要求36所述的方法，其中捕获引物被使用亚氨基生物素固定到所述珠。

39.根据权利要求36所述的方法，其中捕获引物被使用脱硫生物素固定到所述珠。

40.一种用于修饰固定的捕获引物的试剂盒，所述试剂盒包括：

a.应用特异性捕获引物，所述应用特异性捕获引物包括：

i.包括应用特异性捕获区域的3’部分，其中所述应用特异性捕获区域包含转座子末端区域，和

ii.包括通用捕获区域的5’部分，和

b.核酸酶。

41.一种用于修饰固定的捕获引物的试剂盒，所述试剂盒包括：

a.第一通用捕获引物，

b.第二通用捕获引物，

c.包括与在所述第一通用捕获引物中的区域互补的区域和与在应用特异性多核苷酸中的区域互补的区域的寡核苷酸，其中所述与在应用特异性多核苷酸中的区域互补的区域包含转座子末端寡核苷酸，

d.包括与在所述第二通用捕获引物中的区域互补的区域和与在应用特异性多核苷酸中的区域互补的区域的寡核苷酸，所述与在应用特异性多核苷酸中的区域互补的区域包含转座子末端寡核苷酸，和

e.核酸酶。

42.根据权利要求40或41所述的试剂盒，其中所述核酸酶是外切核酸酶。

43.根据权利要求42所述的试剂盒，其中所述外切核酸酶是外切核酸酶I。

44.根据权利要求40所述的试剂盒，所述试剂盒还包括用于固定所述应用特异性捕获引物的基底。

45.根据权利要求41所述的试剂盒，所述试剂盒还包括用于固定所述第一通用捕获引物和所述第二通用捕获引物的基底。

46.根据权利要求40或41所述的试剂盒，所述试剂盒还包括使用所述试剂盒的组分用于修饰固定的捕获引物的说明书。