CN112739830A

CN112739830A - 使用单一表面引物进行配对末端测序的方法和组合物

Info

Publication number: CN112739830A
Application number: CN201980042671.5A
Authority: CN
Inventors: J.M.鲍特尔; P.加蒂-拉夫兰科尼
Original assignee: Illumina Cambridge Ltd
Current assignee: Illumina Cambridge Ltd
Priority date: 2018-12-18
Filing date: 2019-12-09
Publication date: 2021-04-30
Also published as: JP2022513546A; US11634765B2; WO2020126602A1; CA3103633A1; EP3899041A1; SG11202012807YA; US20230137106A1; KR20210104554A; AU2019411272A1; US20200190578A1

Abstract

本公开涉及用于靶核酸的配对末端测序的组合物和方法，并且更具体地涉及使用具有单一类型的表面引物的扩增位点从靶核酸的两个分开的区域获得核苷酸序列信息。

Description

使用单一表面引物进行配对末端测序的方法和组合物

发明领域

本公开尤其涉及靶核酸的配对末端测序，并且更特别地涉及使用具有表面引物的单一群体的扩增位点从靶核酸的两个分开的区域获得核苷酸序列信息。

发明背景

下一代测序(NGS)技术依赖于从单一靶核酸产生的扩增子单克隆群体的高度平行测序。NGS方法大大提高了测序速度和数据输出，从而导致当前测序平台的大量样品通量。进一步减少对模板进行测序的时间是非常期望的，但是有必要维持有用的信噪比、强度以及增加的通过滤器的簇的百分比，它们都有助于增加的数据输出和数据质量。

已经证明簇产生在制备文库中非常有用。它通常包括文库的生成，其中文库的成员包括各个末端存在的通用序列。将文库加载到流动池中，并将文库的单独成员捕获在与通用序列互补的表面结合寡聚物的地点(lawn)上。然后通过桥式扩增将各个成员扩增成独特的克隆簇。

簇中模板的测序通常包括“配对末端”或“成对”测序的技术(美国专利No.8,017,335)。配对末端测序是一个多步骤过程，其允许从单一模板上的两个位置测定序列的两个“读段”。配对末端方法的优势在于，从对各自来自单一模板的碱基的两个区段进行测序比从以随机模式对来自两个独立模板各自的相同数目的碱基进行测序获得显著更多的信息。通过使用适当的软件工具来组装序列信息，可以利用以下知识：“配对末端”序列不是完全随机的，而是已知发生在单一模板上，因此可以在基因组中连接或配对。已经显示此信息大大帮助将全基因组序列组装成共有序列。

发明概述

本文中提供了靶核酸的配对末端测序方法，该方法显著缩短阵列扩增位点上存在的靶核酸测序需要的时间。标准方法通常包括使用具有表面引物的两个群体的扩增位点，测定一条链的序列，然后采取几个步骤完成配对末端测序中通常使用的翻转(turnaround)。比较而言，本文中提供的方法不需要翻转。相反，使用具有一个表面引物的扩增位点，并且减少从两条链获得序列数据的步骤数目。此方法提供了与标准方法相当的通过滤器的簇的百分比，以及在使用较长插入物时高于标准方法的通过滤器的簇的百分比。

方法允许对靶核酸的两个区域(本文中称为第一和第二区域)进行测序，以进行序列测定。用于序列测定的第一和第二区域位于靶核酸的互补链上，它们在本文中分别称为第一和第二模板。用于序列测定的两个区域可以彼此互补或者可以彼此不互补。用于对靶核酸的两个区域进行测序的标准方法通常包括配对末端转角(paired-end turn)，例如，使用具有两个不同表面引物(本文也称为捕获核酸)的扩增位点，以及形成一个模板，然后形成第二个模板。如本文中详细描述的，不使用配对末端转角。相反，这些方法包括使用以单一表面引物填充的扩增位点的优点。

本文中提供了用于靶核酸的第一和第二区域的成对测序的方法，其中第一和第二区域在靶核酸的互补链中。在一个实施方案中，方法包括提供包含多个扩增位点的阵列。扩增位点包括多个捕获核酸和多个克隆单链扩增子。各个单链扩增子在其5’末端附着于捕获核酸，并且捕获核酸包含切割位点。该方法还包括使第一测序引物与各个单链扩增子上存在的通用序列杂交，并进行第一测序反应。第一测序反应包括使用单链扩增子作为第一模板向第一测序引物顺序添加核苷酸。测序反应导致鉴定第一区域的序列并产生第一区域的互补链。将互补链延伸形成双链扩增子，其包括第一测序引物、在测序反应期间掺入的核苷酸和在互补链延伸期间掺入的核苷酸。

方法还包括切割附着于单链扩增子的捕获核酸。切割将单链扩增子转化为缩短的捕获核酸和在5’末端未附着于捕获核酸的未附着的第一模板。通过向与互补链杂交的第二测序引物顺序添加核苷酸并使用所述互补链作为第二模板进行第二测序反应以测定第二区域的序列。

本文中还提供了组合物。在一个实施方案中，组合物包含扩增位点的阵列。扩增位点包含多个克隆双链扩增子。各个双链扩增子包括通过5’末端附着于扩增位点表面的第一链和不附着于扩增位点表面并具有与第一链的核苷酸互补并杂交的核苷酸的第二链。第一链在主链中具有断裂，其中第一链的主链中的断裂在两侧上侧翼有第二链的互补核苷酸。

定义

除非另有规定，否则本文中使用的术语应理解为具有相关领域中的普通含义。下面列出本文中使用的几个术语及其含义。

如本文所用，术语“扩增子”在用于指核酸时指对核酸复制的产物，其中产物具有与核酸的核苷酸序列的至少一部分相同或互补的核苷酸序列。扩增子可以通过使用核酸，例如靶核酸或其扩增子作为模板的多种扩增方法中的任一种来产生，所述方法包括例如聚合酶延伸、聚合酶链式反应(PCR)、滚环扩增(RCA)、连接延伸或连接链式反应。扩增子可以是具有特定核苷酸序列的单拷贝(例如聚合酶延伸产物)或核苷酸序列的多个拷贝(例如RCA的多联体(concatameric)产物)的核酸分子。靶核酸的第一扩增子通常是互补拷贝。后续的扩增子是在产生第一扩增子后从靶核酸或从第一扩增子创建的拷贝。后续的扩增子可具有与靶核酸基本上互补或与靶核酸基本上相同的序列。

如本文所用，术语“扩增位点”是指阵列中或阵列上可产生一个或多个扩增子的位点。扩增位点可以进一步配置为含有、保持或附着在该位点处产生的至少一个扩增子。

如本文所用，术语“阵列”是指可以根据相对位置彼此区分的位点群体。可以根据阵列中位点的位置将位于阵列的不同位点处的不同分子彼此区分。阵列的单独位点可包括一个或多个特定类型的分子。例如，位点可以包括具有特定序列的单一靶核酸分子，或者位点可以包含具有相同序列(和/或其互补序列)的几个核酸分子。阵列的位点可以是位于同一基底上的不同特征。示例性特征包括但不限于，基底中的孔、基底中或基底上的珠(或其他颗粒)、从基底的突起、基底上的脊或基底中的通道。阵列的位点可以是各自带有不同分子的分开的底物。可以根据在与基底缔合的表面上基底位置或者根据液体或凝胶中基底的位置鉴定附着于分开的基底的不同分子。分开的基底位于表面上的示例性阵列包括但不限于在孔中具有珠的那些阵列。

如本文所用，术语“容量”当用于提及位点和核酸材料时指可以占据位点的最大量的核酸材料，例如源自靶核酸的扩增子。例如，该术语可以指在特定条件下可以占据该位点的核酸分子的总数。也可以使用其他测量，包括例如核酸材料的总质量或在特定条件下可占据该位点的特定核苷酸序列的拷贝总数。通常，靶核酸的位点的容量将基本上等同于靶核酸的扩增子的位点的容量。

如本文所用，术语“捕获剂”是指能够附着、保留或结合靶分子(例如靶核酸)的材料、化学物质、分子或其部分。示例性捕获剂包括但不限于与经修饰的靶核酸的至少一部分互补的捕获核酸(例如通用捕获结合序列)、能够结合经修饰的靶核酸(或附着于它的连接部分)的受体-配体结合对的成员(例如抗生物素蛋白、链霉抗生物素蛋白、生物素、凝集素、碳水化合物、核酸结合蛋白、表位、抗体等)，或能够与经修饰的靶核酸(或附着于它的连接部分)形成共价键的化学试剂。在一个实施方案中，捕获剂是核酸。核酸捕获剂也可以用作扩增引物或测序引物。

当提及核酸捕获剂时，可以使用术语“P5”和“P7”。术语“P5’”(P5 prime)和“P7’”(P7 prime)分别是指P5和P7的互补物。应当理解的是，任何合适的核酸捕获剂可用于本文提出的方法中，并且P5和P7的使用仅是示例性的实施方案。如WO 2007/010251、WO 2006/064199、WO 2005/065814、WO 2015/106941、WO 1998/044151和WO 2000/018957的公开示例，流动池上核酸捕获剂诸如P5和P7的使用是本领域中已知的。本领域技术人员将认识到，核酸捕获剂也可以发挥扩增引物或测序引物的功能。例如，任何合适的核酸捕获剂都可以起正向扩增引物的作用，无论是固定化的还是在溶液中，并且可以用于本文提出的方法以与序列(例如，通用捕获结合序列)杂交和序列扩增。类似地，任何合适的核酸捕获剂都可以起反向扩增引物的作用，无论是固定化的还是溶液中，并且可以用于本文提出的方法以与序列杂交(例如，通用捕获结合序列)和扩增序列。此外，如本文中所述，核酸捕获剂也可以发挥测序引物的功能。例如，任何合适的核酸捕获剂或其部分可以充当测序引物，无论是固定化的还是在溶液中，并且可以用于本文中呈现的用于与序列(例如通用捕获结合序列)杂交和位于引物3’的核苷酸测序的方法。鉴于可获得的常识和本公开的教导，本领域技术人员将理解如何设计和使用适合于捕获和扩增如本文所提出的靶核酸的序列。

如本文所用，术语“通用序列”是指两个或更多个靶核酸共有的序列区域，其中分子还具有彼此不同的序列区域。存在于分子集合的不同成员中的通用序列可以允许使用与通用序列(例如通用捕获结合序列)的一部分互补的捕获核酸群体来捕获多个不同的核酸。通用捕获结合序列的非限制性实例包括与P5和P7引物相同或互补的序列。类似地，存在于分子集合的不同成员中的通用序列可以允许使用与通用序列，例如通用引物结合位点的一部分互补的通用引物群体来复制或扩增多个不同的核酸。如本文所述，可以修饰靶核酸分子以在例如不同靶序列的一个或两个末端附着通用衔接子(在本文中也称为衔接子)。

如本文所用，术语“衔接子”及其衍生物，例如通用衔接子，通常是指可以与靶核酸连接的任何线性寡核苷酸。在一些实施方案中，衔接子基本上与样品中存在的任何靶序列的3’末端或5’末端非互补。在一些实施方案中，合适的衔接子长度在约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸的范围内。通常，衔接子可以包括核苷酸和/或核酸的任何组合。在一些方面，衔接子可在一个或多个位置处包含一个或多个可切割基团。在另一方面，衔接子可以包含与引物，例如捕获核酸的至少一部分基本上相同或基本上互补的序列。在一些实施方案中，衔接子可以包括条形码，也称为索引或标签，以辅助下游校正、鉴定或测序。术语“衔接头”和“衔接子”可互换使用。

如本文所定义，“样品”及其衍生物以其最广泛的含义使用，并且包括怀疑包括靶核酸的任何样品、培养物等。在一些实施方案中，样品包含DNA、RNA、PNA、LNA、核酸的嵌合或杂合形式。样品可以包括任何含有一种或多种核酸的基于生物、临床、外科、农业、大气或水生的样品。该术语还包括任何分离的核酸样品，例如基因组DNA、新鲜冷冻的或福尔马林固定的石蜡包埋的核酸样本。还涵盖的是样品可以来自单一个体、来自遗传相关成员的核酸样品的集合、来自遗传无关成员的核酸样品、来自单一个体的核酸样品(匹配)，例如肿瘤样品和正常组织样品，或来自含有遗传材料的两种独特形式，诸如从母体受试者获得的母体和胎儿DNA的单一来源的样品，或者在含有植物或动物DNA的样品中污染性细菌DNA的存在。在一些实施方案中，核酸材料的来源可以包括获自新生儿的核酸，例如通常用于新生儿筛查的核酸。

如本文所用，术语“克隆”和“单克隆”可互换使用，并且是指就特定核苷酸序列而言同质的核酸群体。同源序列通常长至少10个核苷酸，但是甚至可以更长，包括例如至少50、至少100、至少250、至少500或至少1000个核苷酸长。克隆群体可以源自单一靶核酸。通常，克隆群体中的所有核酸将具有相同的核苷酸序列。应当理解，在不脱离克隆性的情况下，少数突变(例如由于扩增伪像(artifacts))可以在克隆群体中发生。还应理解，在不脱离克隆性的情况下，少数不同的靶核酸(例如由于未扩增或以有限程度扩增的靶核酸)可以在克隆群体中发生。

如本文所用，术语“不同”在用于提及核酸时指核酸具有彼此不同的核苷酸序列。两个或更多个核酸可以具有沿其整个长度不同的核苷酸序列。或者，两个或更多个核酸可以具有沿着其长度的实质性部分不同的核苷酸序列。例如，两个或更多个核酸可以具有彼此不同的靶核苷酸序列部分，同时还具有彼此相同的通用序列区域。如本文所用，术语“不同”当用于指扩增位点时指扩增位点存在于同一阵列上的独特的分开位置处。

如本文所用，术语“流体进入(fluidic access)”在用于指流体中的分子和与流体接触的位点时指分子在流体中或通过流体移动以接触或进入该位点的能力。该术语还可以指分子与位点分离或离开位点以进入溶液的能力。当没有障碍物时可以发生流体进入，所述障碍物阻止分子进入位点，接触位点，与位点分离和/或离开位点。然而，只要不绝对防止进入，即使扩散被延迟，减少或改变，也理解存在流体进入。

如本文所用，术语“双链”在用于指核酸分子时是指核酸分子中基本上所有的核苷酸都与互补核苷酸氢键键合。部分双链核酸可以具有其与互补核苷酸氢键键合的核苷酸的至少10％、至少25％、至少50％、至少60％、至少70％、至少80％、至少90％或至少95％。

如本文所用，术语“各(each)”当用于指项集合时意图鉴定该集合中的个别项，但是不一定指该集合中的每个项，除非上下文清楚地指示其他事项。

如本文所用，术语“间隙区域”是指基底中或表面上的与基底或表面的其他区域分开的区域。例如，间隙区域可以将阵列的一个特征与阵列的另一特征分开。彼此分开的两个区域可以是离散的，缺乏彼此接触。在另一个示例中，间隙区域可以将特征的第一部分与特征的第二部分分开。由间隙区域提供的分开可以是部分分开或完全分开。间隙区域通常将具有与表面上的特征的表面材料不同的表面材料。例如，阵列的特征可具有的捕获剂的量或浓度超过间隙区域中存在的量或浓度。在一些实施方案中，捕获剂可以不存在于间隙区域处。

如本文所用，术语“聚合酶”意图与其在本领域中的用途一致，并且包括例如使用核酸作为模板链产生核酸分子的互补重复的酶。通常，DNA聚合酶结合模板链，然后沿着模板链向下移动，从而在核酸的生长链的3'端顺序向游离羟基添加核苷酸。DNA聚合酶通常从DNA模板合成互补DNA分子，而RNA聚合酶通常从DNA模板合成RNA分子(转录)。聚合酶可以使用称为引物的短RNA或DNA链来开始链生长。如本文中详细描述的，可以在扩增过程中使用聚合酶以产生克隆簇，可以在测序反应过程中使用聚合酶以确定核酸的序列，并且在这些的各方面中可以使用不同的聚合酶。一些聚合酶可以置换位点上游的链，在该位点处它们正在将碱基添加到链。认为此类聚合酶是链置换的，意味着它们具有从聚合酶读取的模板链中除去互补链的活性。具有链置换活性的示例性聚合酶包括但不限于Bsu(枯草芽孢杆菌(Bacillus subtilis))、Bst(嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))聚合酶、exo-Klenow聚合酶或测序级T7 exo-聚合酶的大片段。一些聚合酶降解它们前面的链，从而有效地将其替换为后面的增长链(5’外切核酸酶活性)。一些聚合酶具有降解其后面的链的活性(3’外切核酸酶活性)。一些有用的聚合酶已经通过突变或其他方式进行了修饰，以减少或消除3’和/或5’外切核酸酶活性。

如本文所用，术语“核酸”意图与其在本领域中的使用一致，并且包括天然存在的核酸及其功能类似物。特别有用的功能类似物能够以序列特异性的方式与核酸杂交或者能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似物结构可具有交替的主链连接，包括本领域已知的多种主链连接之任一种。天然存在的核酸通常具有脱氧核糖(例如在脱氧核糖核酸(DNA)中发现)或核糖(例如在核糖核酸(RNA)中发现)。核酸可含有本领域已知的这些糖部分的多种类似物中的任一种。核酸可包括天然或非天然碱基。在这方面，天然脱氧核糖核酸可以具有选自腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤的一种或多种碱基，并且核糖核酸可以具有选自尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤的一种或多种碱基。可以包含在核酸中的有用的非天然碱基是本领域已知的。当用于指核酸时，术语“靶物”在本文所述方法或组合物的上下文中意图作为核酸的语义标识符，并不一定限制超出其他情况下明确指示的情况的核酸结构或功能。具有每个末端的通用序列，例如在每个末端的通用衔接子的靶核酸可以称为经修饰的靶核酸。

如本文所用，术语“转运”是指分子通过流体的移动。该术语可包括被动转运，例如分子沿其浓度梯度的移动(例如被动扩散)。该术语还可以包括主动转运，由此分子可以沿着分子的浓度梯度或逆着其浓度梯度移动。因此，转运可包括施加能量以使一个或多个分子沿期望的方向移动或移动至期望的位置，例如扩增位点。

如本文所用，术语“速率”当用于指转运、扩增、捕获或其他化学过程时，意图与其在化学动力学和生化动力学中的含义一致。可以就最大速率(例如，在饱和时)、稳态前速率(例如，在平衡之前)、动力学速率常数或本领域已知的其他度量而言比较两个过程的速率。在具体的实施方案中，可以就完成过程的总时间而言确定特定过程的速率。例如，可以就完成扩增所花费的时间而言确定扩增速率。但是，不需要就完成过程的总时间而言确定特定过程的速率。

术语“和/或”是指所列元件中的一个或全部或所列元件中任何两个或更多个的组合。

词语“优选的”和“优选地”是指在某些情况下可以提供某些益处的本发明的实施方案。然而，在相同或其他情况下，其他实施方案也可以是优选的。此外，对一个或多个优选实施方案的叙述并不意味着其他实施方案不可用，并且不意图从本发明的范围排除其他实施方案。

术语“包括”及其变型在说明书和权利要求书中出现这些术语时不具有限制意义。

应当理解的是，无论何处用语言“包括”等描述实施方案，也提供了以术语“由……组成”和/或“基本上由……组成”描述的其他方面类似的实施方案。

除非另有规定，否则“一个”、“一种”，“所述/该”和“至少一个”可互换使用并且表示一个/种或超过一个/种。

“适合”于事件发生的条件，例如外切核酸酶介导的核酸消化，或“适合”条件是不阻止此类事件发生的条件。因此，这些条件允许、增强、促进和/或有利于该事件。

如本文所用，在组合物、制品或核酸的上下文中“提供”指制备组合物、制品或核酸，购买组合物、制品或核酸，或以其他方式获得化合物、组合物、制品、核酸。

还有，在本文中，通过端点叙述数值范围包括该范围内所包含的所有数字(例如1至5包括1、1.5、2、2.75、3、3.80、4、5等)。

在整个说明书中提及“一个实施方案”、“实施方案”、“某些实施方案”或“一些实施方案”等意味着本公开的至少一个实施方案中包括结合该实施方案描述的特定特征、配置、组成或特性。因此，在整个说明书中这些短语在各个地方的出现不一定是指本公开的相同实施方案。此外，在一个或多个实施方案中，可以以任何合适的方式组合特定的特征、配置、组成或特性。

在本文的描述中，为了清楚起见，可以独立地描述具体的实施方案。除非另外明确指出具体实施方案的特征与另一个实施方案的特征不相容，否则某些实施方案可以包括本文结合一个或多个实施方案描述的相容特征的组合。

对于本文公开的包括离散步骤的任何方法，步骤可以以任何可行的顺序进行。并且，适当时，可以同时进行两个或更多个步骤的任何组合。

本发明的以上概述并非意图描述本发明的各个公开的实施方案或每个实施方式。下面的描述更具体地举例说明了示例性实施方案。在整个申请中的多个地方，通过示例列表提供了指导，这些示例可以以各种组合使用。在各种情况下，所列举的列表仅充当代表组，而不应解释为排他性列表。

附图简述

当结合以下附图阅读时，可以最佳理解本公开的示例性实施方案的以下详细描述。

图1A-1G显示了根据本文呈现的本公开的各个方面的制备用于测序的靶核酸的实施方案的示意图。为简单起见，仅显示一个扩增子。

对于图2、3和5：标记为“流动池图”的图显示了从左到右具有第1-8道的流动池；标记为“按循环计的数据”的图显示了运行期间质量度量的进展；标记为“按泳道计的数据”的图显示了每道的质量度量；标记为“QScore分布”的图按质量得分显示读段数目；标记为“QScore热图”的图按循环显示Q得分。

图2显示了单一引物扩增位点的读段1(R1)测序的结果。左图显示了附着于扩增位点表面的引物和用于流动池的各道中测序的R1引物。“接枝”指附着于扩增位点表面的表面引物(在本文中也称为捕获核酸)。T6-P5/P7指附着有P5和P7表面引物两者的泳道，并且T10-P7仅指具有P7表面引物的泳道。“R1 hyb”是指使用的R1测序引物。SBS3+T是标准R1引物，并且Bio-P5-SBS3+T是添加有双重生物素的引物。

图3显示了处理来自实施例2的流动池以进行读段2(R2)测序的结果。左图显示了附着于扩增位点表面的引物和用于流动池各道中测序的R1引物，并且与图2相同。左图还显示了流动池各道的其他处理。“延伸/切口”指用Bst扩增混合物和FpG处理以切割一条链；“激酶”是指用激酶处理；“Dehyb？”指是否以及如何除去未附着的链；并且““R2”hyb(40)”是指使用的R2引物。

图4显示了图3中呈现的结果的第5道(图4A)和第6道(图4B)的按循环计的数据。

图5显示了处理来自实施例3的流动池以在去杂交(dehybridization)后用R2测序的结果。左侧图显示了如图2和图3中所描述的泳道，并用NaOH进行额外处理以使双链扩增子变性和用于额外测序反应的R2引物。

示意图不一定按比例绘制。附图中使用的相同数字指代相同的组件、步骤等。然而，应当理解，在给定附图中使用数字来指代组件并非意图限制另一附图中用相同数字标记的组件。另外，使用不同的数字来指代组件并非意图指示不同编号的组件不能与其他编号的组件相同或相似。

发明详述

本文中呈现了与对核酸进行测序有关的方法和组合物。本公开提供了用于对靶核酸的第一和第二区域进行成对测序的方法，其中第一和第二区域在互补链中。在一个实施方案中，方法包括提供包含多个扩增位点的阵列。每个扩增位点包含通过5’末端附着于扩增位点的多个捕获核酸。捕获核酸包含切割位点。各个扩增位点还包括多个克隆单链扩增子，其中各个单链扩增子在其5’末端附着于捕获核酸，并且单链扩增子的3’末端未附着于扩增位点的表面。存在一个捕获核酸群体。例如，在图1A中，显示了扩增位点10，具有附着于捕获核酸12的多个单链扩增子11的一个成员。图1A中还显示了切割位点，在捕获核酸12上用X标记。

方法进一步包括将测序引物与单链扩增子杂交。例如，在图1B中，测序引物13与单链扩增子11退火。通过向测序引物的3’末端顺序添加核苷酸来进行第一测序反应。DNA聚合酶使用测序引物来启动合成，并且单链扩增子充当第一个模板。测序反应的结果是测定第一区域的序列并产生第一区域的互补链。例如，在图1C中，与单链扩增子11退火的测序引物13在测序反应期间已经得到延伸，并且整合到第一区域的所得互补链14中，以产生部分双链结构15。

进一步延伸互补链，形成双链扩增子，其是单链扩增子中大部分的互补物，并且包含第一测序引物、在测序反应期间掺入的核苷酸和在延伸互补链期间掺入的核苷酸。例如，在图1D中，延伸的互补链16包含第一测序引物的核苷酸、在测序反应期间掺入的核苷酸和在延伸期间掺入的核苷酸。

方法进一步包括切割附着于单链扩增子的捕获核酸。例如，如图1E所示，切割位点X被切割，留下不再附着于阵列的切割链11’和缩短的捕获核酸12’。

在一个实施方案中，方法还可以包括使图1E所示的结构经受变性条件，以除去未附着于阵列的切割链(图1D中的11’)的部分。这导致延伸的互补链16在其大部分长度上是单链的。可以将第二测序引物(图1F中的17)与延伸的互补链16退火，并用于第二测序反应，其中延伸的互补链16用作第二模板。

在另一个实施方案中，缩短的捕获核酸12’可以用作引发测序反应的引物。当将缩短的捕获核酸12’用作测序引物时，除去未附着于阵列的切割链(图1E中的11’)是任选的。具有链置换活性的DNA聚合酶的使用可以从缩短的捕获核酸开始测序，并在合成期间置换切割的链。在一些实施方案中，可能有必要修饰缩短的捕获核酸的3’末端以终止于3’-OH。例如，在图1G中，具有链置换DNA聚合酶的缩短的捕获核酸12’的延伸序列18导致切割链11’的置换。

阵列

在本文所述方法中使用的扩增位点的阵列可以作为一种或多种基底存在。可以用于阵列的基底材料的示例类型包括玻璃、改性玻璃、功能化玻璃、无机玻璃、微球(例如惰性和/或磁性颗粒)、塑料、多糖、尼龙、硝化纤维素、陶瓷、树脂、二氧化硅、基于二氧化硅的材料、碳、金属、光纤或光纤束、聚合物和多孔(例如微量滴定)板。示例性塑料包括丙烯酸、聚苯乙烯、苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯和Teflon^TM。示例性的基于二氧化硅的材料包括硅和各种形式的改性硅。

在具体的实施方案中，基底可以在诸如孔、管、通道、皿、培养皿、瓶等的容器之内或是该容器的部分。特别有用的容器是流动池，例如，如美国专利No.8,241,573或Bentley等人,Nature 456:53-59(2008)中所述。示例性的流动池是可购自Illumina,Inc.(SanDiego,Calif.)的流动池。另一个特别有用的容器是多孔板或微量滴定板中的孔。

在一些实施方案中，阵列的扩增位点可以被配置为表面上的特征。这些特征可以以多种期望形式中的任一种存在。例如，位点可以是孔、坑、通道、脊、凸起区域、钉、柱等。在一个实施方案中，扩增位点可以含有珠。但是，在具体的实施方案中，位点不需要含有珠或颗粒。示例性位点包括存在于用于由454LifeSciences(Roche,Basel Switzerland的子公司)或Ion Torrent(Life Technologies,Carlsbad,CA,USA的子公司)出售的商业测序平台的基底的孔。具有孔的其他基底包括例如蚀刻的光纤和其它基底，记载于美国专利No.6,266,459；美国专利No.6,355,431；美国专利No.6,770,441；美国专利No.6,859,570；美国专利No.6,210,891；美国专利No.6,258,568；美国专利No.6,274,320；美国专利No.8,262,900；美国专利No.7,948,015；美国专利公开文本No.2010/0137143；美国专利No.8,349,167,或PCT公开文本No.WO 00/63437。在几种情况下，在这些参考文献中举例说明在孔中应用珠的基底。在本公开的方法或组合物中，含孔的基底可以与或不与珠一起使用。在一些实施方案中，基底的孔可以包含凝胶材料(具有或不具有珠)，如美国专利No.9,512,422中所述。

阵列的扩增位点可以是非金属表面上的金属特征，例如玻璃、塑料或本文示例的其他材料。可以使用本领域已知的方法将金属层沉积在表面上，例如湿法等离子体蚀刻、干法等离子体蚀刻、原子层沉积、离子束蚀刻、化学气相沉积、真空溅射等。可以适当地使用多种商业仪器中的任一种，包括例如

Ionfab

或Optofab

系统(Oxford Instruments,UK)。金属层也可以通过电子束蒸发或溅射来沉积，如Thornton,Ann.Rev.Mater.Sci.7:239-60(1977)中所述。金属层沉积技术，例如本文示例的那些，可以与光刻技术结合以在表面上创建金属区域或斑块。在美国专利No.8,778,848和美国专利No.8,895,249中提供了用于组合金属层沉积技术和光刻技术的示例性方法。

特征阵列可以以斑点或斑块的网格出现。特征可以以重复图案或不规则的非重复图案定位。特别有用的图案是六边形图案、直线图案、网格图案、具有反射对称性的图案、具有旋转对称性的图案等。不对称图案也可以是有用的。在不同对的最近邻特征之间的间距可以是相同的，或者在不同对的最近邻特征之间的间距可以存在变化。在具体的实施方案中，阵列的特征可各自具有大于约100nm²、250nm²、500nm²、1μm²、2.5μm²、5μm²、10μm²、100μm²或500μm²的面积。或者/另外，阵列的特征可以各自具有小于约1mm²、500μm²、100μm²、25μm²、10μm²、5μm²、1μm²、500nm²、或100nm²的面积。实际上，区域可以具有在选自上文示例者的上限和下限之间的范围内的大小。

对于在表面上包括特征阵列的实施方案，特征可以是离散的，被间隙区域隔开。特征的大小和/或区域之间的间隔可以存在变化，使得阵列可以是高密度、中密度或较低密度的。高密度阵列的特征为具有间隔小于约15μm的区域。中密度阵列具有间隔约15至30μm的区域，而低密度阵列具有间隔大于30μm的区域。在本公开中有用的阵列可以具有间隔小于100μm、50μm、10μm、5μm、1μm或0.5μm的区域。

在具体的实施方案中，阵列可以包括珠或其他颗粒的集合。可以将颗粒悬浮于溶液中或者可以将它们定位于基底的表面上。溶液中的珠阵列的例子是那些由Luminex(Austin,TX,USA)商业化的。具有位于表面上的珠的阵列的例子包括其中珠位于孔中的阵列，例如BeadChip阵列(Illumina Inc.,San Diego,CA,USA)或用于来自454LifeSciences(Roche,Basel,Switzerland的子公司)或Ion Torrent(Life Technologies,Carlsbad,CAUSA的子公司)的测序平台中的基底。具有位于表面上的珠的其他阵列记载于美国专利No.6,266,459；美国专利No.6,355,431；美国专利No.6,770,441；美国专利No.6,859,570；美国专利No.6,210,891；美国专利No.6,258,568；美国专利No.6,274,320；美国专利公开文本No.2009/0026082 A1；美国专利公开文本No.2009/0127589 A1；美国专利公开文本No.2010/0137143 A1；美国专利公开文本No.2010/0282617 A1；或PCT公开文本No.WO 00/63437。上面的几个参考文献描述了在阵列基底中或阵列基底上加载珠之前将靶核酸附着于珠的方法。然而，应当理解，可将珠制成包含扩增引物，然后可将珠用于加载阵列，从而形成用于本文所述方法的扩增位点。如本文先前所述，可以在没有珠的情况下使用基底。例如，可以直接将扩增引物附着于孔或孔中的凝胶材料。因此，参考文献例示了可以被修改以用于本文所述的方法和组合物中的材料、组合物或装置。

阵列的扩增位点可以包含多种能够结合靶核酸的捕获剂。在一个实施方案中，捕获剂包括捕获核酸。捕获核酸的核苷酸序列与靶核酸的通用序列互补。在一些实施方案中，捕获核酸还可以充当用于扩增靶核酸的引物。在一些实施方案中，一个捕获核酸群体包括P5引物或其互补物。在一些实施方案中，扩增位点还包含多个第二捕获核酸，并且此第二捕获核酸可以包含P7引物或其互补物。在一些实施方案中，捕获核酸可以包括切割位点。在本文中更详细地描述了捕获核酸中的切割位点。

在具体的实施方案中，可以将捕获剂如捕获核酸附着于扩增位点。例如，可以见捕获剂附着于阵列特征的表面。附着可以通过中间结构，例如珠、颗粒或凝胶。通过凝胶将捕获核酸附着于阵列的例子描述于美国专利No.8,895,249，并进一步以可购自IlluminaInc.(San Diego,CA,USA)或在WO 2008/093098中描述的流动池举例说明。可以在本文所述的方法和装置中使用的示例性凝胶包括但不限于具有胶体结构的那些，例如琼脂糖；聚合物网状结构，例如明胶；或交联的聚合物结构，例如聚丙烯酰胺，SFA(例如，参见美国专利公开文本No.2011/0059865 A1)或PAZAM(例如，参见美国专利No.9,012,022)。经由珠的附着可如在本文先前所述的描述和引用的参考文献中举例说明的那样实现。

在一些实施方案中，阵列基底的表面上的特征是不连续的，被表面的间隙区域隔开。与阵列的特征相比，具有基本上较低数目或浓度的捕获剂的间隙区域是有利的。缺少捕获剂的间隙区域是特别有利的。例如，在间隙区域处相对少量或不存在捕获部分有利于将靶核酸以及随后产生的簇定位于期望的特征。在具体的实施方案中，特征可以是表面(例如孔)中的凹形特征，并且特征可以含有凝胶材料。含有凝胶的特征可以由表面上的间隙区域彼此分开，在所述间隙区域中基本上不存在凝胶，或者若存在的话，凝胶基本上不能支持核酸的定位。在美国申请No.9,512,422中阐述了制备和使用具有含凝胶的特征如孔的基底的方法和组合物。

靶核酸

本文所述方法中使用的阵列包括双链修饰的靶核酸。术语“靶核酸”、“靶片段”、“靶核酸片段”、“靶分子”和“靶核酸分子”可互换使用，指期望鉴定其核苷酸序列的核酸分子。靶核酸基本上可以是已知或未知序列的任何核酸。例如，它可以是基因组DNA或cDNA的片段。测序可导致测定全部或部分靶分子的序列。靶物可以源自已经随机片段化的初级核酸样品。在一个实施方案中，可以通过在各个靶标片段的末端放置通用扩增序列，例如通用衔接头中存在的序列，将靶标加工成适合于扩增的模板。在各个末端具有通用衔接子的靶核酸可以称为“经修饰的靶核酸”。在本文详述了通用衔接子。

初级核酸样品可以源自来自样品的双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)或者可以以单链形式源自样品(如DNA或RNA)并转换为dsDNA形式。举例来说，可以使用本领域公知的标准技术将mRNA分子复制成适用于本文所述方法的双链cDNA。来自初级核酸样品的多核苷酸分子的精确序列通常对本公开内容并不重要，并且可以是已知的或未知的。

在一个实施方案中，来自初级核酸样品的初级多核苷酸分子是DNA分子。更特别地，初级多核苷酸分子代表生物体的整个遗传互补物，并且是基因组DNA分子，其既包括内含子和外显子序列，又包括非编码调控序列，例如启动子和增强子序列。在一个实施方案中，可以使用多核苷酸序列或基因组DNA的特定子集，诸如例如特定的染色体。更特别地，初级多核苷酸分子的序列是未知的。仍然更特别地，初级多核苷酸分子是人基因组DNA分子。可以在任何随机片段化过程之前或之后，以及在通用衔接头序列连接之前或之后，化学或酶处理DNA靶片段。

核酸样品可以包括高分子量材料，例如基因组DNA(gDNA)。样品可以包括低分子量材料，例如从福尔马林固定的石蜡包埋或存档的DNA样品中获得的核酸分子。在另一个实施方案中，低分子量材料包括酶或机械片段化的DNA。样品可以包含无细胞的循环DNA。在一些实施方案中，样品可包括获自活组织检查、肿瘤、刮擦物、拭、血液、粘液、尿液、血浆、精液、毛发、激光捕获显微切割、手术切除以及其他临床或实验室获得的样品的核酸分子。在一些实施方案中，样品可以是流行病学、农业、法医或病原学样品。在一些实施方案中，样品可以包括获自诸如人类或哺乳动物来源的动物的核酸分子。在另一个实施方案中，样品可以包括获自非哺乳动物来源如植物、细菌、病毒或真菌的核酸分子。在一些实施方案中，核酸分子的来源可以是已存档或耗尽的样品或种类。

此外，本文公开的方法和组合物可用于扩增具有低质量核酸分子的核酸样品，例如来自法医样品的降解和/或片段化的基因组DNA。在一个实施方案中，法医样品可以包括从犯罪现场、失踪人员DNA数据库、与法医调查相关的实验室、或从执法机构、一个或多个军事部门或任何此类人员获得的法医样品获得的核酸。核酸样品可以是纯化的样品或含有粗DNA的裂解物，例如源自口腔拭子、纸、织物或其他可以用唾液、血液或其他体液浸渍的基底。因此，在一些实施方案中，核酸样品可以包括少量的DNA(例如基因组DNA)或该DNA的片段化部分。在一些实施方案中，靶序列可以存在于一种或多种体液中，包括但不限于血液、痰液、血浆、精液、尿液和血清。在一些实施方案中，靶序列可获自受害者的毛发、皮肤、组织样品、尸检或遗骸。在一些实施方案中，可以从已故的动物或人获得包括一个或多个靶序列的核酸。在一些实施方案中，靶序列可包括获自非人DNA的核酸，例如微生物、植物或昆虫学DNA。在一些实施方案中，靶序列或扩增的靶序列针对人类鉴定的目的。在一些实施方案中，本文描述的方法可以用于鉴定法医样品的特征。在一些实施方案中，本文描述的方法可以用于使用一种或多种靶物特异性引物或使用已知引物设计标准设计的一种或多种靶物特异性引物的人鉴定方法。在一个实施方案中，可以使用任何一种或多种靶物特异性引物扩增包含至少一个靶序列的法医或人鉴定样品，所述靶物特异性引物使用已知的引物标准得到。

生物样品来源的其他非限制性实例可包括完整的生物体以及从患者获得的样品。生物样品可以从任何生物流体或组织获得，并且可以为多种形式，包括液体流体和组织、实体组织和保存形式，例如干燥、冷冻和固定形式。样品可以是任何生物组织、细胞或体液的。此类样品包括但不限于痰液、血液、血清、血浆、血细胞(例如白细胞)、腹水、尿液、唾液、泪液、痰液、阴道液(排出)、在医疗程序期间获得的清洗液(例如，在活组织检查、内窥镜检查或手术期间获得的骨盆或其他清洗物)、组织、乳头抽吸物、核心或细针活组织检查样品、含细胞的体液、游离的浮动核酸、腹膜液和胸膜液，或来自它们的细胞。生物样品还可以包括组织切片，例如出于组织学目的而采取的冷冻切片或固定切片，或者显微切割的细胞或其细胞外部分。在一些实施方案中，样品可以是血液样品，诸如例如全血样品。在另一个实例中，样品是未处理的干燥血斑样品。在另一个实例中，样品是福尔马林固定的石蜡包埋的样品。在又一个实例中，样品是唾液样品。在又一个实例中，样品是干燥唾液斑样品。

可以衍生靶核酸的示例性生物学样品包括，例如，来自真核生物的样品，例如哺乳动物，例如啮齿动物、小鼠、大鼠、兔、豚鼠、有蹄动物、马、绵羊、猪、山羊、牛、猫、狗、灵长类动物、人或非人灵长类；植物，如拟南芥(Arabidopsis thaliana)、玉米、高粱、燕麦、小麦、稻、芥花或大豆；藻，例如莱茵衣藻(Chlamydomonas reinhardtii)；线虫，如秀丽隐杆线虫(Caenorhabditis elegans)；昆虫，如黑腹果蝇(Drosophila melanogaster)、蚊、果蝇、蜜蜂或蜘蛛；鱼，例如斑马鱼；爬行动物；两栖动物，例如青蛙或非洲爪蟾(Xenopus laevis)；盘基网柄菌(Dictyostelium discoideum)；真菌，如卡氏肺囊虫(Pneumocystis carinii)、红鳍东方鲀(Takifugu rubripes)、酵母如酿酒酵母(Saccharamoyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe)；或恶性疟原虫(Plasmodium falciparum)。靶核酸还可以源自原核生物，例如细菌、大肠杆菌、葡萄球菌或肺炎支原体(Mycoplasmapneumoniae)；古菌(archaeon)；病毒，如人丙型肝炎病毒或人类免疫缺陷病毒；或类病毒。靶核酸可以源自生物体的均质培养物或群体，或者可替代地源自例如社区或生态系统中的几种不同生物体的集合。

随机片段化指通过酶促、化学或机械方法以无序方式片段化来自初级核酸样品的多核苷酸分子。磁力片段化方法是本领域已知的，并使用标准方法(Sambrook andRussell,Molecular Cloning,A Laboratory Manual，第三版)。在一个实施方案中，可以使用通常被称为标签片段化(tagmentation)的过程来实现片段化。标签片段化使用转座体复合物，并组合成一步片段化和连接以添加通用衔接子(Gunderson等，WO 2016/130704)。为了清楚起见，通过较大片段的核酸序列保持完整(即，保留完整的核酸序列)，通过特异性PCR扩增较小片段产生较大段核酸的此类较小片段并不等同于将较大段核酸进行片段化，因为较大段核酸序列保持完整(即不被PCR扩增片段化)。此外，设计随机片段化以产生片段，而与包含和/或围绕断裂的核苷酸的序列同一性或位置无关。更特别地，随机片段化是通过机械手段，例如雾化或超声处理，以产生长度为约50个碱基对至长度为约1500个碱基对的片段，还更特别地长度为50-700个碱基对，更特别地长度为50-400个碱基对。最特别地，该方法用于产生长度为50-150个碱基对的较小片段。

通过机械手段(例如雾化，超声处理和Hydroshear)将多核苷酸分子片段化产生具有平端和3’-和5’-突出端的异质混合的片段。因此，期望使用本领域已知的方法或试剂盒(例如Lucigen DNA终止剂末端修复试剂盒)来修复片段末端，以产生对于插入例如克隆载体的平位点中而言最佳的末端。在一个具体的实施方案中，核酸群体的片段末端是平末端的。更特别地，片段末端是平末端并磷酸化的。可以通过酶处理来引入磷酸部分，所述酶处理例如使用多核苷酸激酶。

靶核酸群体可以具有对于本文所述方法或组合物的特定应用而言期望或合适的平均链长度。例如，平均链长度可以小于约100,000个核苷酸、50,000个核苷酸、10,000个核苷酸、5,000个核苷酸、1,000个核苷酸、500个核苷酸、100个核苷酸或50个核苷酸。或者/另外，平均链长度可以大于约10个核苷酸、50个核苷酸、100个核苷酸、500个核苷酸、1,000个核苷酸、5,000个核苷酸、10,000个核苷酸、50,000个核苷酸或100,000个核苷酸。靶核酸群体的平均链长可以在本文所述的最大值和最小值之间的范围内。应当理解，在扩增位点处产生(或在本文中以其它方式制备或使用)的扩增子可以具有在选自上文示例者的上限和下限之间的范围内的平均链长度。

在某些情况下，靶核酸群体可以在一定条件下产生或以其他方式配置为具有其成员的最大长度。例如，用于本文所述方法的一个或多个步骤中或存在于特定组合物中的成员的最大长度可以小于100,000个核苷酸、小于50,000个核苷酸、小于10,000个核苷酸、小于5,000个核苷酸、小于1,000个核苷酸、小于500个核苷酸、小于100个核苷酸或小于50个核苷酸。或者/另外，靶核酸群体可以在一定条件下产生或以其他方式配置为具有其靶成员的最小长度。例如，用于本文所述方法的一个或多个步骤中或存在于特定组合物中的成员的最小长度可以是大于10个核苷酸、大于50个核苷酸、大于100个核苷酸、大于100个核苷酸、大于500个核苷酸、大于1000个核苷酸、大于5,000个核苷酸、大于10,000个核苷酸、大于50,000个核苷酸或大于100,000个核苷酸。群体中靶核酸的最大和最小链长度可以在上文阐述的最大和最小值之间的范围内。应当理解，在扩增位点处产生(或在本文中以其它方式制备或使用)的扩增子可以具有在以上示例者的上限和下限之间的范围内的最大和/或最小链长度。

在一个具体的实施方案中，通过例如某些类型的DNA聚合酶如Taq聚合酶或Klenowexo minus聚合酶的活性制备具有单一突出的核苷酸的靶片段序列，所述聚合酶具有非模板依赖性的末端转移酶活性，该活性将单一脱氧核苷酸，例如脱氧腺苷(A)添加到DNA分子(例如PCR产物)的3’末端。此类酶可用于在双链靶片段的各条链的平末端3’端添加单核苷酸“A”。因此，可以通过与Taq或Klenow exo minus聚合酶反应在双链靶片段的每个末端修复链的3’末端添加“A”，而通用衔接子多核苷酸构建体可以是T构建体，其具有通用衔接子的双链核酸的各个区域的3’末端存在的相容性“T”突出端。此末端修饰还防止载体和靶标两者的自身连接，使得存在对在各个末端处具有通用衔接子的靶核酸形成的偏爱。

在一些情况下，在用于本文的方法或组合物之前，可以扩增源自此类来源的靶核酸。可以使用多种已知扩增技术中的任一种，包括但不限于聚合酶链式反应(PCR)、滚环扩增(RCA)、多置换扩增(MDA)或随机引发扩增(random prime amplification,RPA)。应当理解，在用于本文所述方法或组合物之前，靶核酸的扩增是任选的。因此，在用于本文所述的方法和组合物的一些实施方案之前，可不扩增靶核酸。靶核酸可以任选地源自合成文库。合成的核酸可以具有天然的DNA或RNA组成或者可以是其类似物。

通用衔接子

本文所述的方法或组合物中使用的靶核酸包括附着于各个末端的通用衔接子。在各个末端具有通用衔接子的靶核酸可以称为“经修饰的靶核酸”。在本文描述的方法中使用的将通用衔接子附着于靶核酸的各个末端的方法是本领域技术人员已知的。可以通过使用连接的标准文库制备技术(美国专利公开文本No.2018/0305753)，或通过使用转座酶复合物的标签片段化(Gunderson et al.,WO 2016/130704)进行连接。

在一个实施方案中，通过首先将相同的通用衔接子分子(“错配的衔接子”，其一般特征在下面定义，并且在Gormley等人,美国专利No.7,741,463和Bignell等人,美国专利No.8,053,192中进一步描述)连接至双链靶核酸的5’和3’末端来处理来自样品，例如片段化的样品的双链靶核酸。在一个实施方案中，通用衔接子包括将靶核酸固定化在阵列上以进行后续测序所必需的通用捕获结合序列。在另一个实施方案中，在固定化和测序之前，使用PCR步骤进一步修饰存在于靶核酸的各个末端的通用衔接子。例如，使用通用引物结合位点进行初始引物延伸反应，其中形成与各个单独靶核酸的两条链互补的延伸产物并添加通用捕获结合序列。所得的引物延伸产物和任选的其扩增的拷贝共同提供了可被固定化，然后测序的经修饰的靶核酸的文库。术语“文库”是指在其3’和5’末端含有已知的共同序列的靶核酸的集合，并且也可以称为3’和5’修饰的文库。

在本公开的方法中使用的通用衔接子称为“错配”衔接头，因为如本文中详细解释的，衔接头包含序列错配的区域，即，它们不通过退火完全互补的多核苷酸链形成。

如下形成用于本文的错配衔接头，即退火两条部分互补的多核苷酸链，以在两条链退火时提供至少一个双链区(也称为双链核酸区域)和至少一个不匹配的单链区，也称为单链非互补核酸链的区域。

通用衔接子的双链区是短的双链区，通常包含5个或更多个连续碱基对，其通过退火两个部分互补的多核苷酸链形成。该术语指两条链退火的核酸双链区，并不意味着任何特定的结构构象。

通常有利的是，双链区在不损失功能的情况下尽可能短。在本文中，“功能”指双链区在酶催化的核酸连接反应的标准反应条件下形成稳定双链体的能力，所述条件对于熟练的读者是公知的(例如，在适合于酶的连接缓冲液中在4℃至25℃的范围内的温度温育)，从而形成通用衔接子的两条链在通用衔接子与靶分子的连接期间保持部分退火。双链区在引物延伸或PCR反应的退火步骤中通常使用的条件下稳定不是绝对必要的。

通用衔接子的双链区通常在连接中使用的所有通用衔接子中是相同的。因为通用衔接子与各个靶分子的两个末端连接，所以经修饰的靶核酸侧翼可以有源自通用衔接子的双链区的互补序列。在经修饰的靶核酸构建体中双链区以及由其衍生的互补序列越长，经修饰的靶核酸构建体能够在引物延伸和/或PCR中使用的退火条件下在内部自身互补性的这些区域内向后折叠并且与其自身进行碱基配对的可能性越大。因此，通常优选的是双链区的长度为20或更小、15或更小或10或更小的碱基对，以降低此效应。可以通过包含比标准Watson-Crick碱基对表现出更强的碱基配对的非天然核苷酸增加双链区的稳定性，并因此潜在缩短其长度。

在一个实施方案中，通用衔接子的两条链在双链区中100％互补。应当理解的是，可以在双链区内容许一个或多个核苷酸错配，条件是两条链能够在标准连接条件下形成稳定的双链体。

用于本文的通用衔接子通常可包括形成衔接头的“可连接”末端的双链区，例如在连接反应中与双链靶核酸连接的末端。通用衔接头的可连接末端可以是平端，或者在其他实施方案中，可以存在一个或多个核苷酸的短5’或3’突出端，以便于/促进连接。通用衔接子的可连接末端的5’端核苷酸通常被磷酸化以实现与靶多核苷酸上的3’羟基的磷酸二酯连接。

术语“不匹配区”是指通用衔接头的区域，单链非互补核酸链的区域，其中形成通用衔接头的两条多核苷酸链的序列表现出一定程度的非互补性，使得在引物延伸或PCR反应的标准退火条件下，两条链不能完全彼此退火。在酶催化的连接反应的标准反应条件下，不匹配区可以表现出一定程度的退火，只要两条链在扩增反应中的退火条件下转化为单链形式。

应当理解，“不匹配区”由形成双链区的相同两条多核苷酸链的不同部分提供。衔接头构建体中的错配可以采取一条链长于另一条链的形式，使得其中一条链上存在单链区，或者采用如下的序列，该序列选择为使得两条链不杂交，从而在两条链上形成单链区。错配也可以采取“气泡”的形式，其中通用衔接子构建体的两个末端能够彼此杂交并形成双链体，而中心区域则不能。在将相同两条链的其他部分退火以形成一个或多个双链区的条件下，形成不匹配区的链部分不退火。为了避免疑问，应当理解，在本公开的上下文中，随后经历与靶序列的连接的多核苷酸双链体的3’末端的单链或单碱基突出端不构成“不匹配区”。

不匹配区长度的下限通常由功能决定，例如提供适合于以下项的序列的需要：i)引物结合以进行引物延伸、PCR和/或测序(例如，引物与通用引物结合位点的结合)，或者ii)通用捕获结合序列与捕获核酸的结合，以将经修饰的靶核酸固定化于表面。理论上，不匹配区的长度没有上限，只是通常有利的是使通用衔接子的总长度最小化，例如，以便于在连接步骤后将未结合的通用衔接子与经修饰的靶核酸构建体分开。因此，通常优选的是，不匹配区的长度应小于50、或小于40、或小于30、或小于25个连续核苷酸。

单链非互补核酸链的区域在3’末端包含至少一个通用捕获结合序列。通用衔接子的3’末端包含通用捕获结合序列，其将与存在于阵列扩增位点处的捕获核酸杂交。任选地，通用衔接子的5’末端包含附着于靶核酸的各个末端的第二通用捕获结合序列，其中第二通用捕获结合序列将与存在于阵列的扩增位点处的不同捕获核酸杂交。

单链非互补核酸链的区域通常还包括至少一个通用引物结合位点。通用引物结合位点是通用序列，其可用于扩增和/或测序与通用接头连接的靶核酸。

单链非互补核酸链的区域也可以包括至少一个索引。索引可用作阵列上特定靶核酸来源特征性的标志物(美国专利No.8,053,192)。通常，索引是作为通用衔接子的一部分的核苷酸的合成序列，所述通用衔接子作为文库制备步骤的一部分添加至靶核酸。因此，索引是附着于特定样品的各个靶分子的核酸序列，其存在指示或用于鉴定分离出靶分子的样品或来源。在一个实施方案中，可以使用双索引系统。在双索引系统中，附着于靶核酸的通用接头包括两个不同的索引序列(美国专利公开文本No.2018/0305750，美国专利公开文本No.2018/0305751，美国专利公开文本No.2018/0305752和美国专利公开文本No.2018/0305753)。

优选地，索引的长度可以高达20个核苷酸，更优选地为1-10个核苷酸，并且最优选地长度为4-6个核苷酸。4核苷酸索引给出同一阵列上多路复用256个样品的可能性，6碱基索引实现同一阵列上处理4096个样品。

在一个实施方案中，当通用捕获结合序列与双链靶片段连接时，它是通用衔接子的一部分，并且在另一个实施方案中，在通用衔接子与双链靶片段连接后，将通用引物延伸结合位点添加到通用衔接子。可以使用常规方法来完成添加，包括基于扩增的方法，例如PCR。

通用衔接子的精确核苷酸序列通常对本公开内容不重要，并且可以由用户选择，使得期望的序列元件最终包括在多个不同的经修饰的靶核酸的共同序列中，例如，以提供通用捕获结合序列和用于特定组的通用扩增引物和/或测序引物的结合位点。可以包括其他序列元件，例如，以提供用于测序引物的结合位点，例如在固体支持物上，所述测序引物最终会用于文库中靶核酸的测序，索引测序或源自文库中靶核酸扩增的产物。

尽管通用衔接子的精确核苷酸序列通常不限于本公开，但是在不匹配区中的单独链的序列应使得任何单独链均不表现出任何内部自互补性，其在标准退火条件下可以导致自退火、形成发夹结构等。应当避免在不匹配区中链的自退火，因为它可以阻止或减少扩增引物与此链的特异性结合。

错配的衔接子优选自两条DNA链形成，但可以包括通过磷酸二酯和非磷酸二酯主链连接的混合物连接的天然和非天然核苷酸(例如一个或多个核糖核苷酸)的混合物。

通用衔接子的连接和扩增

连接方法是本领域已知的并且使用标准方法。此类方法使用连接酶，例如DNA连接酶来实现或催化在此种情况下通用衔接子和双链靶核酸的两条多核苷酸链的末端的连接，从而形成共价连接。通用接头可含有5’-磷酸部分，以促进与靶片段上存在的3’-OH的连接。双链靶核酸含有5’-磷酸部分，自剪切过程残留或者使用酶处理步骤添加，并已进行末端修复，并任选地通过一个或多个突出碱基进行延伸，从而给出适合于连接的3’-OH。在本上下文中，连接指先前未共价连接的多核苷酸链的共价连接。在本公开的特定方面，此类连接通过在两条多核苷酸链之间形成磷酸二酯连接而发生，但是可以使用其他共价连接的方式(例如非磷酸二酯主链连接)。

如本文所讨论，在一个实施方案中，用于连接的通用衔接子是完整的，并且包括通用捕获结合序列和其他通用序列，例如通用引物结合位点和索引序列。所得的多个经修饰的靶核酸可用于制备固定化的样品用于测序。

同样如本文所讨论，在一个实施方案中，用于连接的通用衔接头包含通用引物结合位点和索引序列，并且不包含通用捕获结合序列。所得的多个经修饰的靶核酸可以进一步修饰以包括特定序列，例如通用捕获结合序列。用于向与双链靶片段连接的通用引物添加特定序列，如通用捕获结合序列的方法包括基于扩增的方法，例如PCR，并且在本领域中是已知的，并且例如描述于：Bignell等人(US 8,053,192)和Gunderson等人(WO2016/130704)。

在通用接头被修饰的实施方案中，制备扩增反应。扩增反应的内容物是本领域技术人员已知的，并且包括扩增反应所需要的合适的底物(例如dNTP)、酶(例如DNA聚合酶)和缓冲液组分。通常，扩增反应需要至少两个扩增引物，通常表示为“正向”和“反向”引物(引物寡核苷酸)，它们能够在扩增反应的各个循环的引物退火步骤中遇到的条件下与待扩增的多核苷酸序列(例如经修饰的靶核酸)的一部分特异性退火。应当理解，如果引物含有在第一扩增循环中不与经修饰的靶核酸退火的任何核苷酸序列，则可以将此序列复制到扩增产物中。例如，使用具有通用捕获结合序列，例如不与经修饰的靶核酸退火的序列的引物，通用捕获结合序列将被掺入所得的扩增子中。

扩增引物通常是单链多核苷酸结构。它们也可以含有天然和非天然碱基以及天然和非天然主链连接的混合物，条件是任何非天然修饰均不排除作为引物的功能——定义为在扩增反应的条件期间与模板多核苷酸链退火的能力并且作用为合成与模板链互补的新多核苷酸链的起始点。另外，引物可以包含非核苷酸化学修饰，例如硫代磷酸酯以增加外切核酸酶抗性，再次条件是使得修饰不阻止引物功能。

扩增以产生簇

可以使用本领域技术人员已知的方法来产生包括扩增位点的阵列，各个扩增位点包含扩增子的克隆群体(也称为簇)。在一个实施方案中，使用等温扩增方法，并且包括从已经接种该位点的单独靶核酸(单链或双链)产生双链扩增子的克隆群体。在一些实施方案中，扩增反应进行到产生足够数目的扩增子以填充相应扩增位点的容量。以此种方式填充已经接种的位点至容量排除随后的靶核酸落于该位点处，从而在该位点处产生扩增子的克隆群体。因此，在一些实施方案中，期望的是产生扩增子以填充扩增位点容量的速率超过将单独靶核酸转运至单独扩增位点的速率。

在一些实施方案中，扩增方法包括但不限于固相扩增。如本文所用，术语“固相扩增”是指在固相支持物上或与固相支持物结合进行的任何多核苷酸扩增反应，使得全部或部分扩增产物在形成它们时被固定化在固相支持物上。特别地，该术语涵盖固相聚合酶链式反应(固相PCR)和固相等温扩增，其是类似于标准溶液相扩增的反应，只是将正向和反向扩增引物之一或两者固定化在固体支持物上。固相扩增包括但不限于系统，诸如阵列，其中将一种引物锚定于阵列表面，并且另一种在游离溶液中；乳液，其中将一种引物锚定到珠，并且另一种在游离溶液中；和固相凝胶基质中的集落形成，其中将一种引物锚定于表面，并且一种在游离溶液中。在一些实施方案中，使用依赖于桥式扩增的方法，其中两个引物均附着于表面(参见例如WO 2000/018957,美国专利No.7,972,820；美国专利No.7,790,418 andAdessi et al.,Nucleic Acids Research(2000):28(20):E87)。在一些实施方案中，使用依赖于动力学排除的方法，其中重组酶促进的扩增和等温条件扩增文库(美国专利No.9,309,502,美国专利No.8,895,249,美国专利No.8,071,308)。可以以温度或等温方式进行扩增反应。

在一些实施方案中，即使在第二靶核酸在该位点处开始扩增之前未将扩增位点填充至容量，也可以实现明显的克隆性。在某些条件下，第一靶核酸的扩增可以进行到如下的点，即产生足够数目的拷贝以有效胜过或压倒自转运至该位点的第二靶核酸的拷贝产生。例如，在对直径小于500nm的圆形特征上使用桥式扩增过程的实施方案中，已经确定在对第一靶核酸进行14轮指数扩增的循环之后，来自相同位点处的第二靶核酸的污染将产生数目不足的污染性扩增子以对Illumina测序平台上的合成测序分析产生不利影响。

在所有实施方案中，阵列中的扩增位点不需要是完全克隆的。相反，对于某些应用，单独的扩增位点可以主要填充有来自第一靶核酸的扩增子，并且还可以具有低水平的来自第二靶核酸的污染性扩增子。阵列可以具有一个或多个具有低水平污染扩增子的扩增位点，只要污染水平不对阵列的后续使用产生不可接受的影响。例如，当阵列要用于检测应用时，可接受的污染水平是不以不可接受的方式影响信噪比或检测技术的分辨率的水平。因此，表观克隆性通常与通过本文所述方法制成的阵列的特定用途或应用有关。对于特定应用在单独的扩增位点处可接受的污染的示例性水平包括但不限于最多0.1％、0.5％、1％、5％、10％或25％的污染扩增子。阵列可以包括一个或多个具有这些示例性水平的污染扩增子的扩增位点。例如，阵列中多达5％、10％、25％、50％、75％或甚至100％的扩增位点可以具有一些污染性扩增子。

在一些实施方案中，可以在发生扩增时将靶核酸转运(例如通过扩散)至扩增位点的条件下进行制备可用于本文所述方法的阵列的方法。因此，一些扩增方法可以利用相对于随后的扩增子形成的相对较慢的转运速率和相对较慢的第一扩增子的产生两者。例如，可以进行本文所述的扩增反应，使得与以下项同时将靶核酸从溶液中转移到扩增位点：(i)产生第一扩增子，和(ii)在阵列的其他位点处产生随后的扩增子。在具体的实施方案中，在扩增位点处产生随后扩增子的平均速率可以超过将靶核酸从溶液转运至扩增位点的平均速率。在某些情况下，可以从单独的扩增位点处的单一靶核酸产生足够数目的扩增子，以填充相应扩增位点的容量。产生扩增子以填充相应扩增位点的容量的速率可以例如超过将单独的靶核酸从溶液转运至扩增位点的速率。

用于在扩增位点处扩增靶核酸的组合物，在本文中称为“扩增试剂”，通常能够快速地在扩增位点处制备靶核酸拷贝。在本公开内容的方法中使用的扩增试剂通常将包括聚合酶和核苷酸三磷酸(NTP)。可以使用本领域已知的多种聚合酶中的任一种，但是在一些实施方案中，可以优选使用外切核酸酶阴性的聚合酶。适用于本公开实施方案的核酸聚合酶的实例包括但不限于DNA聚合酶(例如Klenow片段、T4 DNA聚合酶、Bst(嗜热脂肪芽孢杆菌)聚合酶)、热稳定性DNA聚合酶(例如Taq、Vent、Deep Vent、Pfu、Tfl和9°N DNA聚合酶)及其遗传修饰的衍生物(参见例如美国专利No.9,677,057,美国临时申请No.62/753,558,和美国临时申请No.62/775,662)。在一些实施方案中，扩增试剂还可以包括重组酶、辅助蛋白和单链DNA结合(SSB)蛋白，用于重组酶促进的扩增(参见例如美国专利No.8,071,308)。

对于产生DNA拷贝的实施方案，NTP可以是脱氧核糖核苷酸三磷酸(dNTP)。通常，DNA扩增试剂中将存在四种天然种类dATP、dTTP、dGTP和dCTP。但是，若想要的话，可以使用类似物。对于产生RNA拷贝的实施方案，NTP可以是核糖核苷酸三磷酸(rNTP)。通常，RNA扩增试剂中存在四种天然种类rATP、rUTP、rGTP和rCTP。但是，若想要的话，可以使用类似物。可以用荧光或放射性基团修饰NTP。为了增加核酸的可检测性和/或功能多样性，已经开发出用于化学和生物学方法的极其多种合成修饰的核酸。这些官能化/修饰的分子(例如核苷酸类似物)可以与天然聚合酶完全相容，从而维持天然对应物的碱基配对和复制特性。

在一些实施方案中，使用四种经修饰的核苷酸三磷酸类型，称为可逆封闭的核苷酸三磷酸(rbNTP)(参见例如美国专利No.9,453,258)。rbNTP拥有在3’核糖位置上包含烷氧基和叠氮基官能性两者的3’终止剂，其可通过用膦试剂切割而除去，从而创建可逆封闭并再次具有功能以进一步延伸(即，完全功能性或ff)的核苷酸。完全功能性核苷酸ffNTP可购自Illumina,Inc.(San Diego,CA)，并且是rbNTP示例性的。在一些实施方案中，一种或多种rbNTP包括经由接头附着的荧光标记物。接头可包括一个或多个切割基团，或不包括切割基团。例如，将一个或多个rbNTP附着到荧光团的接头可以例如在同一碳上包含叠氮化物和/或烷氧基，使得可以在各个掺入循环后通过如先前提及的膦试剂切割接头，从而释放荧光部分用于进一步的序列延长。

因此，将扩增溶液的其他成分添加到聚合酶的选择，并且它们基本上对应于本领域已知为有效支持各种聚合酶活性的化合物。化合物诸如二甲基亚砜(DMSO)、牛血清白蛋白(BSA)、聚乙二醇(PEG)、甜菜碱、Triton X-100、变性剂(例如甲酰胺)或MgCl₂等化合物的浓度在现有技术中公知为对于具有最佳扩增而言是重要的，因此操作者可以基于以下给出的实施例和通常可获得的知识容易地针对本公开的方法调节此类浓度。

可以通过增加扩增反应的一种或多种活性成分的浓度或量来增加扩增反应发生的速率，例如，聚合酶、核苷酸三磷酸或引物的量或浓度。在一些情况下，量或浓度增加(或在本文所述的方法中以其他方式操作)的扩增反应的一种或多种活性成分是扩增反应的非核酸成分。

还可以通过调节温度在本文所述的方法中提高扩增速率。例如，可通过将一个或多个位点处的温度升高至由于变性或其他不良事件导致反应速率降低的最大温度来提高一个或多个扩增位点处的扩增速率。最佳温度或期望温度可以从使用的扩增组分的已知特性或者对于给定扩增反应混合物凭经验确定。可以基于引物解链温度(Tm)的先验预测或凭经验进行此类调整。在某些实施方案中，扩增反应的温度为至少35℃至不大于70℃。例如，扩增反应可以为至少35℃至不大于48℃。与测定锚定于表面的核酸序列的其它方法形成对比，通过与锚定于表面的核酸杂交将根据本公开测序的核酸附着于表面。因此，较低的温度经常是优选的。

在扩增后，可以通过使扩增子经受变性条件将扩增位点处存在的双链扩增子转化成单链扩增子。变性条件包括但不限于甲酰胺、热或碱。

制备用于测序的固定化样品

扩增的结果是在扩增位点处的克隆扩增产物，即单链扩增子的群体。将单链扩增子在5’末端固定化在扩增位点的表面上(例如，参见图1A，其中单链扩增子11附着于捕获核酸12，其在5’末端附着于扩增位点10)。扩增位点内的扩增子将是克隆的，并源自单一靶核酸的扩增，或具有可接受水平的一种或多种其他扩增子，如本文所述。

通过将第一测序引物与单链扩增子杂交来起始扩增子的测序。本文详细描述了测序方法。在一个实施方案中，第一测序引物与存在于扩增子的3’区域中的通用序列互补。通过使用单链扩增子作为模板向第一测序引物顺序添加核苷酸(在一个实施方案中预定数目的核苷酸)来进行测序。在一些实施方案中，测序反应可以进行到模板的末端。在其他实施方案中，在测序反应完成之后，新合成的核苷酸序列沿着单链扩增子的剩余部分延伸至固定化的捕获核酸的末端，产生互补链并将单链扩增子转化为双链结构。例如，如在图1C中显示，与单链扩增子11退火的测序引物13已在测序反应期间得到延伸，并整合到所得的互补链14中。图1D显示了完全延伸的互补链16。互补链未附着于扩增位点。

在一个实施方案中，可以封闭第一测序引物的5’末端，这意味着修饰引物的5’末端以防止外切核酸酶的作用。5’末端的封闭可以任何合适的方式完成。

为了促进新合成的互补链的测序，将附着于表面并且还附着于原始单链扩增子(例如，图1A中分别为12和11)的捕获核酸切割成允许从双链结构中选择性除去原始的单链扩增子。该切割在存在于捕获核酸和互补链之间的双链区域中，并且仅导致捕获核酸的切割。核苷酸序列的切割以允许任选地除去特定链在本文中称为“线性化”。本文描述了合适的线性化方法的实例，并在申请号WO 2007/010251、美国专利No.8,431,348和美国专利No.8,017,335中描述。

切割位点存在于捕获核酸中，并且通常位于如下的位置中，该位置导致原始单链扩增子的大部分没有扩增位点的表面——不再固定化——并且在除去步骤后易于丧失。例如，如图1E中显示，单链扩增子11在切割位点X处被切割，留下切割链11’和缩短的捕获核酸12’。互补链16的3’末端的核苷酸与缩短的捕获核酸12’的碱基杂交，导致互补链16保持与扩增位点10缔合。本领域普通技术人员将理解，切割位点通常也位于如下的位置中，该位置导致具有足够核苷酸的缩短的捕获核酸，所述核苷酸足以与互补链3’末端的核苷酸杂交。切割使得互补链可用于第二测序引物的杂交，并导致允许配对末端测序的方法，即，从单个多核苷酸模板上的两个位置测定序列的两个“读段”。有利地，本文描述的方法中可能的配对末端测序不需要配对末端转角所必需的步骤，例如，使用具有两个不同捕获核酸的扩增位点以及使用两个不同捕获核酸形成合适的单链模板。

任何合适的酶促、化学或光化学切割反应都可以用于位点X处的切割，只要条件不破坏缩短的捕获核酸的核苷酸和互补链之间的杂交。切割可通过例如切口酶消化来实现，在此种情况下，切割位点是指导捕获核酸切割的酶的合适限制性位点；脱氧核糖核苷酸和核糖核苷酸之间的键的RNA酶消化或化学切割，在此种情况下，切割位点可包括一个或多个核糖核苷酸；用还原剂(例如TCEP)化学还原二硫键，在此种情况下，切割位点应包括适当的二硫化物连接；用高碘酸盐对二醇连接进行化学裂解，在此种情况下，切割位点应包括二醇连接；以及产生无碱基位点并随后水解。

用于本公开的方法的合适切割技术包括但不限于化学切割、无碱基位点的切割、核糖核苷酸的切割、光化学切割、半甲基化DNA的切割、PCR停止剂(stopper)、肽接头的切割和具有切口内切核酸酶的酶消化。本领域普通技术人员将认识到，鉴于从缩短的捕获核酸使互补链变性的潜力，使用本文所述的一些条件(例如热或碱)可能是不希望的。

化学切割

术语“化学切割”包括使用非核酸和非酶化学试剂以促进/实现原始单链扩增子的切割的任何方法。如果需要的话，单链扩增子可以包括一个或多个非核苷酸化学部分和/或非天然核苷酸和/或非天然主链连接，以允许化学切割反应。在一个实施方案中，捕获核酸包括二醇连接，其允许通过用高碘酸盐(例如高碘酸钠)处理进行的裂解。应当理解，在切割位点处可以包含超过一个二醇。

适合于掺入捕获核酸的基于亚磷酰胺化学的二醇连接单元可购自Fidelitysystems Inc.(Gaithersburg,Md.,USA)。可以使用用于自动化化学DNA合成的标准方法将一种或多种二醇单元掺入捕获核酸中。因此，可以通过化学合成方便地制备包含一个或多个二醇接头的捕获核酸。

通过用“切割剂”处理来切割二醇接头，所述切割剂可以是任何促进二醇切割的物质。优选的切割剂是高碘酸盐，例如高碘酸钠水溶液(NaIO₄)。用切割剂(例如高碘酸盐)处理以切割二醇后，可以用“封端剂”处理切割产物，以中和切割反应中产生的反应性物质。为此目的合适的封端剂包括胺，例如乙醇胺。有利的是，封端剂(例如乙醇胺)可以与切割剂(例如高碘酸盐)一起包含在混合物中，使得反应性物质一形成就被封端。

在另一个实施方案中，捕获核酸可包括二硫基，其允许用化学还原剂例如三(2-羰基乙基)磷盐酸盐(Tris(2-carboxyethyl)-phosphate hydrochloride TCEP)切割。

切割无碱基位点

“无碱基位点”定义为核酸中已经除去碱基成分的位置。无碱基位点可以在生理条件下通过核苷残基的水解而天然存在于DNA中，但也可以在人工条件下或通过酶的作用以化学方式形成。一旦形成，可以切割无碱基位点(例如，通过用内切核酸酶或其他单链切割酶、暴露于热或碱处理)，从而提供用于位点特异性切割捕获核酸的手段。本领域普通技术人员将认识到，考虑到从缩短的捕获核酸使互补链变性的潜力，使用热或碱可能是不希望的。

在一个实施方案中，可以在捕获核酸的预定位置上产生无碱基位点，然后通过首先在预定的裂解位点掺入脱氧尿苷(U)来切割。然后可以使用尿嘧啶DNA糖基化酶(UDG)除去尿嘧啶碱基，从而产生无碱基位点。然后可以通过用内切核酸酶(例如EndoIV内切核酸酶、AP裂合酶、FPG糖基化酶/AP裂合酶、EndoVIII糖基化酶/AP裂合酶)、热或碱处理，在无碱基位点处切割包含无碱基位点的链。

还可以在除脱氧尿苷之外的非天然/修饰的脱氧核糖核苷酸上产生无碱基位点，并通过用内切核酸酶、热或碱处理以类似的方式切割。例如，可以通过暴露于FPG糖基化酶将8-氧代鸟嘌呤转化为无碱基位点。可以通过暴露于AlkA糖基化酶将脱氧肌苷转化为无碱基位点。然后通常可通过用合适的内切核酸酶(例如，EndoIV，AP裂合酶)处理来切割产生的无碱基位点。因为非天然/修饰的核苷酸将被掺入捕获核酸中以用于产生靶核酸的阵列和扩增的用途，所以非天然/修饰的核苷酸应能够被用于扩增反应的聚合酶复制。

在一个实施方案中，可以将待切割的分子暴露于含有合适的糖基化酶和一种或多种合适的内切核酸酶的混合物。在此类混合物中，糖基化酶和内切核酸酶通常将以至少约2:1的活性比率存在。在一个具体的实施方案中，可购自New England Biolabs(NEB#M5505S)的USER试剂用于在捕获核酸中的尿嘧啶碱基处创建单核苷酸缺口。用内切核酸酶处理在切割位点处产生3’-磷酸部分，其可用合适的磷酸酶如碱性磷酸酶除去。例如，如图1E中显示，如果使用USER试剂产生切割位点X，则缩短的捕获核酸12’将以3’-磷酸基团终止。

此方法的优点包括在切割链上释放游离的3’磷酸基团的选项，其在磷酸酶处理后可以提供用于对互补链的区域进行测序的起始点(例如，对图1G的链16的区域进行测序，使用缩短的捕获核酸12’作为测序引物)。由于切割反应需要DNA中不天然存在，但是在其它情况下不依赖于序列背景的残基，例如脱氧尿苷，若仅包含一个非天然碱基，则在双链体中不想要的位置处在其它地方发生糖基化酶介导的切割没有可能性。通过UDG对尿嘧啶的作用而产生的固定化扩增子的双链区中的无碱基位点的切割而获得的另一个优点是，在通过切割形成的游离3’羟基处启动的合成测序反应中掺入的第一个碱基总会是T。因此，对于以此种方式切割以产生测序模板的阵列的不同扩增位点处的所有克隆簇，在整个阵列中普遍掺入的第一个碱基将为T。这可以提供测序运行开始时单独簇强度的不依赖于序列的测定法。

核糖核苷酸的切割

将一种或多种核糖核苷酸掺入核酸中可提供使用能够选择性切割脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键的化学试剂或使用核糖核酸酶(RNA酶)进行切割的位点，所述核酸在其它情况下由脱氧核糖核苷酸(具有或不具有额外的非核苷酸化学部分、非天然碱基或非天然主链连接)构成。因此，可以通过使用此类化学切割剂或RNA酶在含有一个或多个连续核糖核苷酸的位点处切割捕获核酸来产生测序模板。在一个实施方案中，待切割的链包含单个核糖核苷酸以提供用于化学切割的位点。

能够选择性切割脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键的合适的化学裂解剂包括金属离子，例如稀土金属离子(特别是La³⁺，特别是Tm³⁺、Yb³⁺、或Lu³⁺,(Chen等人.Biotechniques.2002,32:518-520；Komiyama等人.Chem.Commun.1999,1443-1451))、Fe(3)或Cu(3)或暴露于升高的pH，例如用碱如氢氧化钠处理。“选择性切割脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键”是指化学切割剂不能在相同条件下切割两个脱氧核糖核苷酸之间的磷酸二酯键。

核糖核苷酸的基本组成通常不是重要的，而是可以进行选择以优化化学(或酶促)切割。举例而言，如果要通过暴露于金属离子，特别是稀土金属离子进行切割，则通常优选rUMP或rCMP。

核糖核苷酸和脱氧核糖核苷酸之间或两个核糖核苷酸之间的磷酸二酯键也可以被RNA酶切割。具有适当底物特异性的任何内吞核糖核酸酶均可用于该目的。为了用核糖核酸酶切割，优选包括两个或更多个连续的核糖核苷酸，例如2至10个或5至10个连续的核糖核苷酸。核糖核苷酸的精确序列通常并不重要，只是某些RNA酶对某些残基后的切割具有特异性。合适的RNA酶包括例如RNA酶A，其在C和U残基之后切割。因此，当用RNA酶A切割时，切割位点必须包含至少一个作为C或U的核糖核苷酸。

掺入一个或多个核糖核苷酸的捕获核酸可以使用用于寡核苷酸化学合成的标准技术与合适的核糖核苷酸前体容易地合成。

光化学切割

术语“光化学切割”涵盖使用光能以实现捕获核酸的切割的任何方法。捕获核酸中的非核苷酸化学间隔物单元可以提供光化学切割的位点。合适的光化学可切割间隔物包括由Glen Research,Sterling,Va.,USA(目录号10-4913-XX)提供的PC间隔物亚磷酰胺(4-(4,4’-二甲氧基三苯甲氧基)丁酰胺基甲基)-1-(2-硝基苯基)-乙基]-2--氰基乙基-(N，N-二异丙基)-亚磷酰胺，具有结构：

可以通过暴露于紫外光源来切割间隔物单元。

可以使用用于寡核苷酸的化学合成的标准技术将此间隔物单元与允许附着于固体表面的硫代磷酸基团一起附着于多核苷酸的5’末端。

半甲基化DNA的切割

也可以如下实现捕获核酸的位点特异性切割，即将一个或多个甲基化核苷酸掺入捕获核酸中，然后用内切核酸酶切割，所述内切核酸酶对于包含甲基化核苷酸的识别序列是特异性的。

捕获核酸中的甲基化核苷酸会与互补链上的非甲基化脱氧核糖核苷酸相对，使得两条链的退火产生半甲基化的双链体结构。然后，可以通过合适的内切核酸酶的作用切割半甲基化的双链体。

可以使用适当的甲基化核苷酸前体，使用自动DNA合成的标准技术，制备掺入一个或多个甲基化核苷酸的捕获核酸。

具有切口内切核酸酶的酶消化

用切口内切核酸酶切割双链核酸的一条链是分子生物学领域常规使用的技术。切口内切核酸酶是选择性切割或“切口”双链核酸的一条链的酶，并且在分子生物学领域是公知的。基本上可以使用任何切口内切核酸酶，条件是可以在捕获核酸上存在的切割位点处包含合适的识别序列。

切割捕获核酸后，测定互补链的序列。在一个实施方案中，通过将第二测序引物与互补链杂交来启动此测序反应。第二测序引物可以与存在于扩增子的3’区域中的通用序列互补。通常，在第二测序引物杂交之前，除去与互补链杂交的切割链。切割链可以通过任何合适的方法除去。

在一个实施方案中，切割链可以通过酶法除去，例如通过使用外切核酸酶。在一个实施方案中，外切核酸酶是5’-3’DNA外切核酸酶。任选地，5’-3’DNA外切核酸酶对双链DNA具有偏爱。对dsDNA偏爱的5’至3’外切核酸酶的例子包括但不限于T7外切核酸酶和外切核酸酶III(New England Biolabs)。任选地，5’-3’DNA外切核酸酶对5’末端具有5’磷酸的双链DNA具有偏爱。对在5’末端具有5’磷酸的dsDNA偏爱的5’-3’DNA外切核酸酶的例子包括但不限于lambda外切核酸酶(New England Biolabs)。本领域普通技术人员将认识到变性可用于除去切割链，但是由于需要维持缩短的捕获核酸与互补链之间的杂交以允许互补链的测序，因此需要仔细考虑条件。

在另一个实施方案中，通过使用缩短的捕获核酸的3’末端作为第二测序引物来启动测定互补链序列的测序反应。通过使用互补链作为模板向第二测序引物顺序添加核苷酸，例如预定数目的核苷酸来进行测序。在本公开的此方面，切割链的除去是任选的。在一个实施方案中，可以通过使用具有链置换活性的DNA聚合酶来测定互补链的序列。在另一个实施方案中，可以如本文所述除去切割链，并且可以使用没有置换活性的DNA聚合酶。

测序方法

例如已经通过本文所述方法产生并且在扩增位点处包括扩增的靶核酸的本公开的阵列可以用于多种应用中的任一种。特别有用的应用是核酸测序。一个例子是合成测序(SBS)。在SBS中，监测核酸引物沿核酸模板(例如靶核酸或其扩增子)的延伸，以确定模板中核苷酸的序列。潜在的化学过程可以是聚合反应(例如，如通过聚合酶催化)。在特定的基于聚合酶的SBS实施方案中，将荧光标记的核苷酸以模板依赖的方式添加到引物(从而延伸引物)，以便可以使用添加到引物的核苷酸的顺序和类型的检测来确定模板的序列。在本文所述的阵列的不同位点处的多个不同模板可以在由于其在阵列中的位置而可以区分针对不同模板发生的事件的条件下经受SBS技术。

流动池提供了容纳阵列的便利形式，该阵列通过本公开的方法生产，并经过SBS或其他检测技术，其涉及循环中试剂的重复递送。例如，为了启动第一个SBS循环，可以将一个或多个标记的核苷酸，DNA聚合酶等流入/流到容纳核酸模板阵列的流动池。可以检测引物延伸导致掺入标记核苷酸的阵列的那些位点。任选地，标记的核苷酸可以进一步包括可逆的终止性质，一旦已经将核苷酸添加到引物，该可逆的终止性质终止进一步的引物延伸。例如，可以将具有可逆终止剂部分的核苷酸类似物添加至引物，使得随后的延伸直到递送解封闭剂来除去该部分时才发生。因此，对于使用可逆终止的实施方案，可以(在发生检测之前或之后)将解封闭剂递送至流动池。可以在各个递送步骤之间进行洗涤。然后可以将循环重复n次以将引物延伸n个核苷酸，从而检测长度n的序列。可以容易地适合于与通过本公开的方法生产的阵列一起使用的示例性SBS程序、流体系统和检测平台描述于例如Bentley等人.,Nature 456:53-59(2008),WO 04/018497；美国专利No.7,057,026；WO 91/06678；WO07/123,744；美国专利No.7,329,492；美国专利No.7,211,414；美国专利No.7,315,019；美国专利No.7,405,281,和美国专利No.8,343,746。

可以使用其他使用循环反应的测序程序，例如焦磷酸测序。焦磷酸测序检测在特定的核苷酸被掺入新生核酸链中时无机焦磷酸盐(PPi)的释放(Ronaghi,等人.,Analytical Biochemistry 242(1),84-9(1996)；Ronaghi,Genome Res.11(1),3-11(2001)；Ronaghi等人.Science 281(5375),363(1998)；美国专利号6,210,891；6,258,568和6,274,320)。在焦磷酸测序中，释放的PPi可以通过被ATP硫化酶立即转化为三磷酸腺苷(ATP)来检测，并且产生的ATP的水平可以通过萤光素酶产生的光子进行检测。因此，可以通过发光检测系统监测测序反应。焦磷酸测序程序不必需用于基于荧光的检测系统的激发辐射源。可用于将焦磷酸测序应用于本公开的阵列的有用的流体系统、检测器和程序描述于例如WIPO公开的专利申请2012/058096、US 2005/0191698 A1、美国专利No.7,595,883和美国专利No.7,244,559。

连接测序反应也是有用的，包括例如Shendure等人.Science 309:1728-1732(2005)；美国专利No.5,599,675；和美国专利No.5,750,341中描述的。一些实施方案可以包括杂交测序程序，如记载于Bains等人.,Journal of Theoretical Biology 135(3),303-7(1988)；Drmanac等人.,Nature Biotechnology 16,54-58(1998)；Fodor等人.,Science251(4995),767-773(1995)；和WO 1989/10977。在连接测序和杂交测序程序两者中，对存在于阵列位点处的模板核酸(例如，靶核酸或其扩增子)进行寡核苷酸递送和检测的重复循环。如本文所述或本文引用的参考文献中所述的用于SBS方法的流体系统可以容易地适于递送试剂以用于连接测序或杂交测序程序。通常，寡核苷酸被荧光标记并且可以使用荧光检测器检测，所述荧光检测器类似于就本文或本文引用的参考文献中的SBS程序而言描述的荧光检测器。

一些实施方案可以使用涉及实时监测DNA聚合酶活性的方法。例如，可以通过携带荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用或使用零模波导来检测核苷酸掺入。用于基于FRET的测序的技术和试剂描述于例如Levene等人.Science 299,682-686(2003)；Lundquist等人.Opt.Lett.33,1026-1028(2008)；Korlach等人.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)。

一些SBS实施方案包括检测将核苷酸掺入延伸产物后释放的质子。例如，基于释放的质子的检测的测序可以使用电检测器和可购自Ion Torrent(Guilford,Conn.,a LifeTechnologies子公司)的相关技术或US 2009/0026082 A1；US 2009/0127589 A1；US 2010/0137143 A1；或US 2010/0282617 A1中描述的测序方法和系统。用于使用排除扩增来扩增靶核酸的本文所述的方法可以容易地应用于用于检测光子的基底。更具体地，本文所述的方法可以用于在用于检测光子的阵列的位点处的扩增子的克隆群体。

例如已经通过本文所述方法产生的本公开的阵列的有用应用是基因表达分析。可以使用RNA测序技术，如那些称为数字RNA测序的技术检测或定量基因表达。RNA测序技术可以使用本领域已知的测序方法进行，例如上述方法。还可以使用通过与阵列直接杂交进行的杂交技术或使用在阵列上检测其产物的多重测定法来检测或定量基因表达。例如，已经通过本文所述方法产生的本公开的阵列还可用于确定来自一个或多个个体的基因组DNA样品的基因型。可在本公开的阵列上进行的用于基于阵列的表达和基因型分型分析的示例性方法记载于美国专利No.7,582,420；6,890,741；6,913,884或6,355,431或美国专利公开文本No.2005/0053980 A1；2009/0186349 A1或US 2005/0181440 A1。

已经通过本文所述方法产生的阵列的另一个有用应用是单细胞测序。当与索引化方法组合时，可以在染色质可及性测定法中使用单细胞测序，以在数千个单细胞中产生活性调控元件的概况，并且可以产生单细胞全基因组文库。可以在本公开的阵列上进行的单细胞测序的实例记载于美国公布的专利申请2018/0023119 A1，美国临时申请流水号62/673,023和62/680,259。

本文所述方法提供了从多种核酸文库中的任一种快速且有效创建阵列。因此，本公开提供了集成系统，其能够使用本文中阐述的一种或多种方法来制备阵列并且还能够使用本领域中已知的技术(例如上文举例说明的那些)来检测阵列上的核酸。因此，本公开的集成系统可以包括能够将扩增试剂递送到扩增位点阵列的流体组件，例如泵、阀、储器、流体线等。特别有用的流体成分是流动池。流动池可以在集成系统中配置和/或使用以创建本公开的阵列并检测该阵列。示例性流动池描述于例如US 2010/0111768 A1和美国专利No.8,951,781。如流动池例示，集成系统的一个或多个流体组件可用于扩增方法和检测方法。以核酸测序实施方案为例，集成系统的一种或多种流体组件可用于本文所述的扩增方法和用于测序方法诸如上文所述的测序方法中的测序试剂的递送。或者，集成系统可以包括分开的流体系统以进行扩增方法和进行检测方法。能够创建核酸阵列并确定核酸序列的集成测序系统的例子包括但不限于来自Illumina,Inc.(San Diego,CA)的MiSeq^TM、HiSeq^TM、NextSeq^TM、MiniSeq^TM、NovaSeq^TM和iSeq^TM测序平台和美国专利No.8,951,781中描述的装置。可以根据本文阐述的指导修改此类装置以制备使用排除扩增的阵列。

能够进行本文所述方法的系统不需要与检测装置集成在一起。相反，也可以是独立系统或与其他装置集成的系统。在此类实施方案中可以使用与以上在集成系统的上下文中例示的那些类似的流体组件。

无论与检测能力集成与否，能够进行本文提出的方法的系统可以包括系统控制器，该系统控制器能够执行一组指令以进行本文所述的方法、技术或过程的一个或多个步骤。例如，指令可以指导在排除扩增条件下创建阵列的步骤的进行。任选地，指令可以进一步指导使用本文先前所述的方法检测核酸的步骤的进行。有用的系统控制器可以包括任何基于处理器或基于微处理器的系统，包括使用微控制器、精简指令集计算机(RISC)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑电路、和任何其他能够执行本文所述功能的电路或处理器的系统。用于系统控制器的一组指令可以是软件程序的形式。如本文所使用，术语“软件”和“固件”是可互换的，并且包括存储在存储器中以供计算机执行的任何计算机程序，包括RAM存储器、ROM存储器、EPROM存储器、EEPROM存储器和非易失性RAM(NVRAM)存储器。软件可以采用各种形式，例如系统软件或应用软件。此外，软件可以采取单独程序的集合，或较大程序内的程序模块或程序模块的一部分的形式。软件还可以包括面向对象编程形式的模块化编程。

应当理解，例如已经通过本文所述方法生产的本公开的阵列不需要用于检测方法。相反，该阵列可用于储存核酸文库。因此，可以以在其中保存核酸的状态储存阵列。例如，阵列可以以干燥状态、冷冻状态(例如在液氮中)或在保护核酸的溶液中储存。或者/另外，阵列可用于复制核酸文库。例如，阵列可以用于从阵列上一个或多个位点创建重复扩增子。

组合物

在进行本文描述的方法期间或之后，可以得到不同的组合物。在一个实施方案中，组合物包括扩增位点的阵列，所述扩增位点包括多个克隆双链扩增子。各个双链扩增子包含通过5’末端附着于扩增位点表面的第一链，并且还包含主链中的断裂。各个双链扩增子还包括不附着于扩增位点表面的第二链，以及与第一链的核苷酸互补并杂交的核苷酸(参见例如图1E)。第一链的主链中的断裂在两侧上侧翼有第二链的互补核苷酸(例如，参见图1E，其中11’和12’构成第一链，并且16是第二链)。双链扩增子可以是部分双链的，例如，在一些实施方案中，第一链的3’末端的核苷酸不与第二链的核苷酸杂交。

示例性实施方案

实施方案1.用于靶核酸的第一和第二区域的成对测序的方法，其中所述第一和第二区域在所述靶核酸的互补链中，所述方法包括：

(a)提供包含多个扩增位点的阵列，

其中所述扩增位点包含(i)多个捕获核酸，和(ii)多个克隆单链扩增子，

其中各个单链扩增子在其5’末端附着于捕获核酸，

其中所述捕获核酸包含切割位点；

(b)使第一测序引物与各个单链扩增子上存在的通用序列杂交；

(c)通过使用所述单链扩增子作为第一模板向所述第一测序引物顺序添加核苷酸来进行第一测序反应，以测定第一区域的序列并且产生所述第一区域的互补链；

(d)延伸所述第一区域的互补链以形成双链扩增子，其包含所述第一测序引物、在所述测序反应期间掺入的核苷酸和在所述延伸期间掺入的核苷酸；

(e)切割附着于所述单链扩增子的所述捕获核酸，

其中所述切割将所述单链扩增子转化为(i)缩短的捕获核酸和(ii)未在5’末端附着于所述捕获核酸的未附着的第一模板；

(f)通过向与所述互补链杂交的第二测序引物顺序添加核苷酸并使用所述互补链作为第二模板进行第二测序反应以测定第二区域的序列。

实施方案2.实施方案1的方法，其中所述切割位点允许酶促、化学或光化学切割。

实施方案3.实施方案2或3的方法，其中所述切割位点是用切口内切核酸酶切割的位点。

实施方案4.实施方案1-3中任一项的方法，其中所述切割包括使所述阵列与包含至少一种酶的组合物接触以在所述切割位点处产生无碱基位点，

其中所述切割在所述切割位点处发生。

实施方案5.实施方案1-4中任一项的方法，其中所述捕获核酸包含尿嘧啶碱基或8-氧代鸟嘌呤碱基。

实施方案6.实施方案1-5中任一项的方法，其中所述至少一种在所述切割位点处产生无碱基位点的酶包括尿嘧啶DNA糖基化酶和选自DNA糖基化酶-裂合酶内切核酸酶VIII或FpG糖基化酶的内切核酸酶。

实施方案7.实施方案1-6中任一项的方法，其中所述第一测序引物在溶液中。

实施方案8.实施方案1-7中任一项的方法，其中所述第一测序引物的5’末端被封闭。

实施方案9.实施方案1-8中任一项的方法，其中所述第二测序引物包含所述切割位点的3’末端。

实施方案10.实施方案1-9中任一项的方法，其中用酶切割导致以3’-磷酸终止的切割位点的3’末端，所述方法进一步包括使所述阵列与磷酸酶接触以导致以3’-OH终止的切割位点。

实施方案11.实施方案1-10中任一项的方法，其中所述第二测序反应包括使用具有链置换活性的DNA聚合酶。

实施方案12.实施方案1-11中任一项的方法，其中所述第二测序引物在溶液中。

实施方案13.实施方案1-12中任一项的方法，其中所述第二测序反应包括使切割的双链扩增子经受除去所述未附着的第一模板的条件，并使所述第二测序引物与所述互补链上存在的通用序列杂交。

实施方案14.实施方案1-13中任一项的方法，其中所述除去未附着的第一模板包括使所述阵列与具有5’至3’外切核酸酶活性的外切核酸酶接触。

实施方案15.实施方案1-14中任一项的方法，其中所述外切核酸酶是T7外切核酸酶。

实施方案16.实施方案1-15中任一项的方法，其中所述阵列上至少95％的所述扩增位点包含源自不同单一靶核酸的扩增的克隆单链扩增子。

实施方案17.实施方案1-16中任一项的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域与所述互补链的区域互补。

实施方案18.实施方案1-17中任一项的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域不与所述互补链的区域互补。

实施方案19.实施方案1-18中任一项的方法，其中在(d)或(f)期间掺入的所述核苷酸包含完全功能性核苷酸。

实施方案20.实施方案1-19中任一项的方法，其中所述第一测序反应包括向所述第一测序引物顺序添加预定数目的核苷酸。

实施方案21.实施方案1-20中任一项的方法，其中所述第二测序反应包括向所述第二测序引物顺序添加预定数目的核苷酸。

实施方案22.实施方案1-21中任一项的方法，其中所述捕获核酸、所述第一测序引物或所述第二测序引物包含至少一个非核苷酸化学部分、非天然存在的核苷酸或非天然存在的主链连接。

实施方案23.实施方案1-22中任一项的方法，其中所述单链扩增子包含两个索引。

实施方案24.实施方案1-23中任一项的方法，其进一步包括对所述索引进行测序。

实施方案25.实施方案1-24中任一项的方法，其中在(c)之后对所述第一索引进行测序。

实施方案26.实施方案1-25中任一项的方法，其中在(f)之后对所述第二索引进行测序。

实施方案27.实施方案1-26中任一项的方法，其中通过方法产生所述阵列，所述方法包括：

(a)提供扩增试剂，其包含

(i)扩增位点的阵列，

(ii)包含多个不同靶核酸和引物的溶液，

其中所述扩增位点各自包含所述多个捕获核酸，它们能够与所述溶液中所述不同靶核酸上存在的通用序列杂交，

其中所述溶液中所述不同靶核酸的数目超过所述阵列中扩增位点的数目，

其中所述不同靶核酸对所述多个扩增位点具有流体进入，和

其中所述扩增位点各自包含所述多个不同靶核酸中的几个核酸的容量；和

(b)使所述扩增试剂反应以产生多个扩增位点，它们各自包含来自所述溶液的单独靶核酸的双链扩增子的克隆群体，

其中所述双链扩增子包含第一链和第二链，所述第一链在其5’末端附着于捕获核酸，所述第二链未附着于所述扩增位点，

其中所述反应包括同时

(i)以平均转运速率将所述不同的靶核酸转运至所述扩增位点，和

(ii)以平均扩增速率扩增在所述扩增位点处的所述靶核酸，其中所述平均扩增速率超过所述平均转运速率。

实施方案28.实施方案1-27中任一项的方法，其还包括使所述双链扩增子经受除去未附着于所述扩增位点的所述第二链的条件。

实施方案29.实施方案1-28中任一项的方法，其中所述除去第二链的条件包含变性剂。

实施方案30.实施方案1-29中任一项的方法，其中所述变性剂包括甲酰胺。

实施方案31.实施方案1-30中任一项的方法，其中所述溶液包含分子拥挤剂。

实施方案32.实施方案1-31中任一项的方法，其中所述引物与各个单链扩增子上存在的通用序列杂交。

实施方案33.组合物，其包含扩增位点的阵列，

其中扩增位点包含多个克隆双链扩增子，

其中各个双链扩增子包含第一链和第二链，所述第一链通过5’末端附着于所述扩增位点的表面并且在主链中包含断裂，所述第二链未附着于所述扩增位点的表面并且包含与所述第一链的核苷酸互补并杂交的核苷酸，

其中所述第一链的主链中的所述断裂在两侧上侧翼有所述第二链的互补核苷酸。

实施方案34.实施方案33的组合物，其中所述阵列上至少95％的所述扩增位点包含克隆单链扩增子。

实施方案35.实施方案33或34的组合物，其中所述主链中的断裂包含第一链中的断裂，其包含至少一个缺少的磷酸二酯键。

实施方案36.实施方案33-35中任一项的组合物，其中所述第一链包含非天然存在的主链连接。

实施方案37.实施方案33-36中任一项的组合物，其中所述主链中的断裂包括第一链中的断裂，其包含至少一个缺少的非天然存在的主链连接。

实施方案38.实施方案33-37中任一项的组合物，其中所述主链中的断裂包含至少一个无碱基位点。

实施方案39.实施方案33-38中任一项的组合物，其中所述第二链与所述第一链的小于所有的核苷酸互补。

实施方案40.实施方案33-39中任一项的组合物，其中所述第二链的5’末端包含5’嵌段。

实施方案41.实施方案33-40中任一项的组合物，其中所述主链中的所述断裂位于距附着的5’末端的5至50个核苷酸。

实施方案42.实施方案33-41中任一项的组合物，其中所述第一链包含位于所述断裂的5’的至少5个核苷酸，其与所述第二链杂交。

实施方案43.包括本文所述的一个或多个特征的化合物、组合物或方法。

实施例

通过以下实施例说明本公开。应当理解的是，具体的例子、材料、数目和程序将根据本文所述的本公开的范围和精神来广义地解释。

实施例1

一般测定方法和条件

除非另有说明，否则这描述了本文所述实施例中使用的一般测定条件。

使用cBot(ILMN)上的v2.5 HiSeqX流动池(ILMN)运行实验。在实验期间，将各种酶混合物泵入流动池中，并在37℃温育15分钟。T7外切核酸酶、USER酶和FpG(PLM2v2)由NewEngland Biolabs提供。在HiSeq^TMX system(Illumina,Inc.,San Diego,Calif.)上根据制造商的说明进行测序。

P7引物包含可由FpG糖基化酶切割的8-氧代鸟嘌呤切割位点。P5引物包含可被USER酶切割的尿嘧啶切割位点。

读段1

使用标准方法，用单个引物P7或P5和P7引物两者包被HiSeqX^TM流动池的泳道的扩增位点。通过向所有泳道添加300pM单链DNA，然后扩增来接种扩增位点。使用EPX混合物(Illumina，San Diego，CA)通过30分钟的排阻扩增来扩增具有附着于扩增位点的两个引物的泳道。使用补充有溶液中的第二引物P5的EPX混合物，通过30分钟的排阻扩增来扩增具有附着于扩增位点的单个引物的泳道。在单一表面引物泳道中的扩增需要溶液中的P5引物。扩增后，一些泳道用USER试剂线性化。将读段1(R1)引物添加到各个泳道。R1引物的5’末端的消化在随后的步骤中暴露于T7外切核酸酶后是预期的，因此引物的5’末端被封闭。一个R1引物是SBS3+T，标准R1测序引物，并且另一个R1引物是经过修饰以包含两个生物素的SBS3+T引物(bio-P5-SBS3+T)。使用标准的1x36循环HiSeqX测序运行。

读段2

在来自单一引物簇的读段1后，将流动池在cBot上处理以得到读段2，然后测序。在某些泳道中，使用AMX混合物(Bst扩增混合物(Illumina,San Diego,CA))进一步延伸通过从R1引物延伸合成的链。延伸后，在切割位点处切割P7引物，并且位于切割位点的3’侧的所得链用T7外切核酸酶除去。向每个泳道添加读段2(R2)引物，并使用标准的1x36循环HiSeqX测序运行。在一个泳道中，用T4激酶替换T7外切核酸酶以将切割位点3’侧的3’磷酸转化为3’OH，并且测序运行在不添加R2引物的情况下进行。所有测序运行均在低温(45℃)进行，以减少测序期间链的去杂交，并显示合理的强度、PF和质量度量。

第二读段2

为了进一步评估在工作流期间发生的假设结构，在读段2(R2)后从测序仪取出流动池，并暴露于NaOH以使簇变性。再次将R1或R2引物添加到泳道中，并在相同条件下进行另一次测序。

实施例2

单一引物簇提供具有第一读段的有用的序列数据

在第4(SBS3+T引物)、5(bio-P5-SBS3+T引物)、6(SBS3+T引物)和8(bio-P5-SBS3+T引物)道中的单一表面引物簇产生有用的序列数据，显示单一引物簇提供用第一读段引物得到的有用的序列数据(图2)。单一表面引物簇(第1-3道)比来自双引物簇的结果表现出更高的强度，但更低的PF。较高的强度可能是由于较高的有效表面引物密度所致，并且较低的PF可能是因为使用尚未针对此新工艺优化的DNA浓度所致。数据还指示不同引物表现相同。第7道未能在cBot上进行泵送，因此是流体学故障。

实施例3

在存在和不存在第二读段引物的情况下，单一引物簇提供具有第二读段的有用的序列数据

图3显示了用R2测序的结果。那些具有单一引物扩增位点的泳道以及包括通过T7外切核酸酶除去链的过程产生有用的序列数据(第4和5道，以及图4A)。这是从单一表面引物簇中获得R2信息的第一个证据。不包含R2引物的泳道(第6道)也显示了一些从切割位点进行测序的证据。

第二测序运行显示，唯一恢复的泳道是第1道(对照泳道，用R1引物再杂交)和第5道(不进行NaOH变性且未添加R1引物，因此在读段2的循环37+时仍旧)。所有其他泳道均为空白，因为通过变性除去仅通过与表面P7引物杂交被保持原位的链。

第6道还显示了从切口进行测序的一些证据，因为在此泳道中，簇被AMX延伸，被FpG裂解，然后缺口中的3’磷酸通过T4激酶步骤转化为3’OH。由于该序列经过我们的簇的单模板区域，因此来自此泳道的PF为约0，但是通过循环追踪得到的强度直至约第20个循环才显示预期序列(图4B)。

实施例4

具有预测的通过杂交进行的附着的那些泳道的变性和随后的R2测序不产生信号

作为评估是否获得预期序列数据的对照，在读段2之后将流动池从测序仪取下，并在R2引物杂交之前使用NaOH进行“再杂交”以使簇变性。图5显示了在再杂交后恢复的唯一泳道是第1道(对照泳道，用R1引物进行再杂交)和第5道(未进行NaOH变性或杂交，因为在读数2的循环37+时仍旧)。所有其他泳道均为空白，因为我们对链进行了去杂交(dehybed)，所述链仅通过与表面P7寡聚物的杂交才保持在原位。

本文中引用的所有专利、专利申请和出版物以及电子可获得的材料(包括例如在例如GenBank和RefSeq中的核苷酸序列提交以及在例如SwissProt，PIR，PRF，PDB中的氨基酸序列提交，以及来自GenBank和RefSeq中带注释的编码区的翻译)的完整公开通过引用整体并入。出版物中引用的补充材料(例如补充表，补充图，补充材料和方法和/或补充实验数据)同样通过引用完整并入。在本申请的公开与通过引用并入本文的任何文件的公开之间存在任何不一致的情况下，以本申请的公开为准。仅出于清楚理解的目的给出了前面的详细描述和示例。不应从它们理解不必要的限制。本公开不限于所示出和描述的确切细节，对于本领域技术人员显而易见的变化将包括在由权利要求书限定的本公开之内。

除非另有说明，否则在说明书和权利要求书中使用的所有表示组分数目，分子量等的数字在所有情况下均应理解为由术语“约”修饰。因此，除非另有相反指示，否则说明书和权利要求书中列出的数字参数是近似值，其可以根据本公开试图获得的期望性质而变化。无论如何，不作为将等同原则限于权利要求范围的尝试，每个数字参数应至少根据所报告的有效数字的数目并通过应用普通的舍入技术来解释。

尽管阐述本公开的广泛范围的数值范围和参数是近似值，然而在具体实施例中阐述的数值尽可能精确报告。然而，所有数值固有含有一定范围，该范围必然是由存在于它们各自的测试测量中的标准偏差得出的。

除非另有说明，否则所有标题都是为了方便读者阅读，并且不应用于限制标题后面的文本的含义。

权利要求书(按照条约第19条的修改)

1.用于靶核酸的第一和第二区域的成对测序的方法，其中所述第一和第二区域在所述靶核酸的互补链中，所述方法包括：

(a)提供包含多个扩增位点的阵列，

其中各个单链扩增子在其5’末端附着于捕获核酸，

其中所述捕获核酸包含切割位点；

(d)延伸所述第一区域的互补链以形成双链扩增子，其包含所述第一测序引物、在所述测序反应期间掺入的核苷酸和在所述延伸期间掺入的核苷酸，其中所述第一区域的互补链不附着于所述扩增位点的表面；

(e)切割附着于所述单链扩增子的所述捕获核酸，

(f)通过向与所述互补链杂交的第二测序引物顺序添加核苷酸并使用所述互补链作为第二模板进行第二测序反应以测定第二区域的序列，其中所述第二测序引物在溶液中，并且其中所述第二测序反应包含使切割的双链扩增子经受除去所述未附着的第一模板的条件，并使所述第二测序引物与所述互补链上存在的通用序列杂交。

2.权利要求1的方法，其中所述切割位点允许酶促、化学或光化学切割。

3.权利要求2的方法，其中所述切割位点是用切口内切核酸酶切割的位点。

4.权利要求2的方法，其中所述切割包括使所述阵列与包含至少一种酶的组合物接触以在所述切割位点处产生无碱基位点，

其中所述切割在所述切割位点处发生。

5.权利要求4的方法，其中所述捕获核酸包含尿嘧啶碱基或8-氧代鸟嘌呤碱基。

6.权利要求4或5的方法，其中所述至少一种在所述切割位点处产生无碱基位点的酶包括尿嘧啶DNA糖基化酶和选自DNA糖基化酶-裂合酶内切核酸酶VIII或FpG糖基化酶的内切核酸酶。

7.权利要求1的方法，其中所述第一测序引物在溶液中。

8.权利要求7的方法，其中所述第一测序引物的5’末端被封闭。

9.权利要求1的方法，其中所述第二测序引物包含所述切割位点的3’末端。

10.权利要求6的方法，其中用酶切割导致以3’-磷酸终止的切割位点的3’末端，所述方法进一步包括使所述阵列与磷酸酶接触以导致以3’-OH终止的切割位点。

11.权利要求9或10的方法，其中所述第二测序反应包括使用具有链置换活性的DNA聚合酶。

12.权利要求1的方法，其中所述除去未附着的第一模板包括使所述阵列与包含5’至3’外切核酸酶活性的外切核酸酶接触。

13.权利要求12的方法，其中所述外切核酸酶是T7外切核酸酶。

14.权利要求1的方法，其中所述阵列上至少95％的所述扩增位点包含源自不同单一靶核酸的扩增的克隆单链扩增子。

15.权利要求1的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域与所述互补链的区域互补。

16.权利要求1的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域不与所述互补链的区域互补。

17.权利要求1的方法，其中在(d)或(f)期间掺入的所述核苷酸包含完全功能性核苷酸。

18.权利要求1的方法，其中所述第一测序反应包括向所述第一测序引物顺序添加预定数目的核苷酸。

19.权利要求1的方法，其中所述第二测序反应包括向所述第二测序引物顺序添加预定数目的核苷酸。

20.权利要求1的方法，其中所述捕获核酸、所述第一测序引物或所述第二测序引物包含至少一个非核苷酸化学部分、非天然存在的核苷酸或非天然存在的主链连接。

21.权利要求1的方法，其中所述单链扩增子包含两个索引。

22.权利要求21的方法，其进一步包括对所述索引进行测序。

23.权利要求22的方法，其中在(c)之后对所述第一索引进行测序。

24.权利要求22的方法，其中在(f)之后对所述第二索引进行测序。

25.权利要求1的方法，其中通过方法产生所述阵列，所述方法包括：

(a)提供扩增试剂，其包含

(i)扩增位点的阵列，

(ii)包含多个不同靶核酸和引物的溶液，

其中所述扩增位点各自包含所述多个捕获核酸，所述多个捕获核酸能够与所述溶液中所述不同靶核酸上存在的通用序列杂交，

其中所述不同靶核酸对所述多个扩增位点具有流体通路，和

(b)使所述扩增试剂反应以产生多个扩增位点，所述多个扩增位点各自包含来自所述溶液的单独靶核酸的双链扩增子的克隆群体，

其中所述反应包括同时

26.权利要求25的方法，其还包括使所述双链扩增子经受除去未附着于所述扩增位点的所述第二链的条件。

27.权利要求26的方法，其中所述除去第二链的条件包含变性剂。

28.权利要求27的方法，其中所述变性剂包括甲酰胺。

29.权利要求25的方法，其中所述溶液包含分子拥挤剂(molecular crowding agent)。

30.权利要求25的方法，其中所述引物与各个单链扩增子上存在的通用序列杂交。

31.组合物，其包含扩增位点的阵列，

其中扩增位点包含多个克隆双链扩增子，

其中所述第一链的主链中的所述断裂在两侧上侧翼有所述第二链的互补核苷酸，并且

其中所述主链中的所述断裂位于距附着的5’末端的5至50个核苷酸。

32.权利要求31的组合物，其中所述阵列上至少95％的所述扩增位点包含克隆单链扩增子。

33.权利要求31的组合物，其中所述主链中的断裂包含第一链中的断裂，其包含至少一个缺少的磷酸二酯键。

34.权利要求31的组合物，其中所述第一链包含非天然存在的主链连接。

35.权利要求34的组合物，其中所述主链中的断裂包括第一链中的断裂，其包含至少一个缺少的非天然存在的主链连接。

36.权利要求31的组合物，其中所述主链中的断裂包含至少一个无碱基位点。

37.权利要求31的组合物，其中所述第二链与所述第一链的小于所有的核苷酸互补。

38.权利要求31的组合物，其中所述第二链的5’末端包含5’嵌段。

39.权利要求31的组合物，其中所述第一链包含位于所述断裂的5’的至少5个核苷酸，其与所述第二链杂交。

40.组合物，其包含扩增位点的阵列，

其中扩增位点包含多个克隆双链扩增子，

其中各个双链扩增子包含通过5’末端附着于所述扩增位点的表面并且包含主链中的断裂的第一链，和未附着于所述扩增位点的表面并且包含与所述第一链的核苷酸互补并且杂交的核苷酸的第二链，

其中所述第一链的主链中的所述断裂在两侧侧翼有所述第二链的互补核苷酸，并且

其中所述第一链包含与所述第二链杂交的位于所述断裂的5’的至少5个核苷酸。

41.权利要求40的组合物，其中所述阵列上的至少95％的所述扩增位点包含克隆单链扩增子。

42.权利要求40的组合物，其中所述主链中的所述断裂包含含有至少一个缺少的磷酸二酯键的第一链中的断裂。

43.权利要求40的组合物，其中所述第一链包含非天然存在的主链连接。

44.权利要求43的组合物，其中所述主链中的断裂包含含有至少一个缺少的非天然存在的主链连接的第一链中的断裂。

45.权利要求40的组合物，其中所述主链中的断裂包含至少一个无碱基位点。

46.权利要求40的组合物，其中所述第二链与所述第一链的小于所有的核苷酸互补。

47.权利要求40的组合物，其中所述第二链的5’末端包含5’嵌段。

48.权利要求40的组合物，其中所述主链中的所述断裂位于距附着的5’末端的5至50个核苷酸。

Claims

(a)提供包含多个扩增位点的阵列，

其中各个单链扩增子在其5’末端附着于捕获核酸，

其中所述捕获核酸包含切割位点；

(e)切割附着于所述单链扩增子的所述捕获核酸，

其中所述切割在所述切割位点处发生。

7.权利要求1的方法，其中所述第一测序引物在溶液中。

12.权利要求1的方法，其中所述第二测序引物在溶液中。

13.权利要求12的方法，其中所述第二测序反应包括使切割的双链扩增子经受除去所述未附着的第一模板的条件，并使所述第二测序引物与所述互补链上存在的通用序列杂交。

14.权利要求13的方法，其中所述除去未附着的第一模板包括使所述阵列与包含5’至3’外切核酸酶活性的外切核酸酶接触。

15.权利要求14的方法，其中所述外切核酸酶是T7外切核酸酶。

16.权利要求1的方法，其中所述阵列上至少95％的所述扩增位点包含源自不同单一靶核酸的扩增的克隆单链扩增子。

17.权利要求1的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域与所述互补链的区域互补。

18.权利要求1的方法，其中所述第一测序反应测定所述单链扩增子的区域的序列，其中所述第二测序反应测定所述互补链的区域的序列，并且其中所述单链扩增子的区域不与所述互补链的区域互补。

19.权利要求1的方法，其中在(d)或(f)期间掺入的所述核苷酸包含完全功能性核苷酸。

20.权利要求1的方法，其中所述第一测序反应包括向所述第一测序引物顺序添加预定数目的核苷酸。

21.权利要求1的方法，其中所述第二测序反应包括向所述第二测序引物顺序添加预定数目的核苷酸。

22.权利要求1的方法，其中所述捕获核酸、所述第一测序引物或所述第二测序引物包含至少一个非核苷酸化学部分、非天然存在的核苷酸或非天然存在的主链连接。

23.权利要求1的方法，其中所述单链扩增子包含两个索引。

24.权利要求23的方法，其进一步包括对所述索引进行测序。

25.权利要求24的方法，其中在(c)之后对所述第一索引进行测序。

26.权利要求24的方法，其中在(f)之后对所述第二索引进行测序。

27.权利要求1的方法，其中通过方法产生所述阵列，所述方法包括：

(a)提供扩增试剂，其包含

(i)扩增位点的阵列，

(ii)包含多个不同靶核酸和引物的溶液，

其中所述不同靶核酸对所述多个扩增位点具有流体通路，和

其中所述反应包括同时

28.权利要求27的方法，其还包括使所述双链扩增子经受除去未附着于所述扩增位点的所述第二链的条件。

29.权利要求28的方法，其中所述除去第二链的条件包含变性剂。

30.权利要求29的方法，其中所述变性剂包括甲酰胺。

31.权利要求27的方法，其中所述溶液包含分子拥挤剂(molecular crowding agent)。

32.权利要求27的方法，其中所述引物与各个单链扩增子上存在的通用序列杂交。

33.组合物，其包含扩增位点的阵列，

其中扩增位点包含多个克隆双链扩增子，

34.权利要求33的组合物，其中所述阵列上至少95％的所述扩增位点包含克隆单链扩增子。

35.权利要求33的组合物，其中所述主链中的断裂包含第一链中的断裂，其包含至少一个缺少的磷酸二酯键。

36.权利要求33的组合物，其中所述第一链包含非天然存在的主链连接。

37.权利要求36的组合物，其中所述主链中的断裂包括第一链中的断裂，其包含至少一个缺少的非天然存在的主链连接。

38.权利要求33的组合物，其中所述主链中的断裂包含至少一个无碱基位点。

39.权利要求33的组合物，其中所述第二链与所述第一链的小于所有的核苷酸互补。

40.权利要求33的组合物，其中所述第二链的5’末端包含5’嵌段。

41.权利要求33的组合物，其中所述主链中的所述断裂位于距附着的5’末端的5至50个核苷酸。

42.权利要求33的组合物，其中所述第一链包含位于所述断裂的5’的至少5个核苷酸，其与所述第二链杂交。

43.包括本文所述的一个或多个特征的化合物、组合物或方法。