CN111315895A

CN111315895A - 用于产生环状单链dna文库的新型方法

Info

Publication number: CN111315895A
Application number: CN201880059003.9A
Authority: CN
Inventors: A.海斯; M.拉尼克; M.赫雷拉; R.丹内鲍姆; S.马格里东; D.巴登霍斯特
Original assignee: F Hoffmann La Roche AG; Kapa Biosystems Inc
Current assignee: F Hoffmann La Roche AG; Kapa Biosystems Inc
Priority date: 2017-09-14
Filing date: 2018-09-13
Publication date: 2020-06-19
Also published as: WO2019053132A1; EP3682025A1; US20200308576A1; JP2020532976A

Abstract

本发明是经由夹板连接而制备和使用文库诸如单链环状核酸模板的测序文库的新型方法。

Description

用于产生环状单链DNA文库的新型方法

发明领域

本发明涉及核酸分析领域，且更具体地，涉及制备用于核酸测序的环状模板。

发明背景

环状核酸模板在核酸分析中具有多种应用。将直链核酸转化成环状形式用于扩增（例如，通过滚环扩增（RCA））和随后的检测和定量，参见美国专利号RE44265。环状模板在测序中的应用也是本领域已知的。参见美国专利号7,302,146和8,153,375。当前的测序策略也要求，将辅助序列诸如引物结合位点和条形码引入模板中。本发明是制备适合用于测序的环状核酸模板的新型的有效方法。所述方法允许制备基本上无限制长度的模板。

发明内容

在一些实施方案中，本发明是从靶核酸形成环状分子的方法，所述方法包括：用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增靶核酸以产生双链扩增子；分离所述双链扩增子的链；使所述扩增子的链与环化寡核苷酸接触以产生杂交结构，其中所述链中的通用环化序列与所述环化寡核苷酸杂交，使得所述链的末端可连接地靠近；和连接所述链的末端，由此形成环状分子。所述靶核酸可以包含选自无细胞血浆DNA、声处理的DNA和限制性消化的DNA的基因组片段。在一些实施方案中，在所述第一和第二扩增引物上的通用序列是独特的。所述第一或第二扩增引物的通用序列可以包含测序引物。在一些实施方案中，所述通用引物包含SED ID NO: 1和2。在一些实施方案中，所述第一和第二扩增引物中的仅一种包含5’-磷酸酯基团。

在一些实施方案中，通过核酸酶消化或通过物理方式分离所述双链扩增子的链。

在一些实施方案中，所述环化寡核苷酸包含捕获部分的配体。在一些实施方案中，所述配体-捕获部分对选自生物素-抗生蛋白链菌素、抗体-抗原或寡核苷酸-互补捕获寡核苷酸。在一些实施方案中，所述环化寡核苷酸包含SED ID NO: 3。在一些实施方案中，所述环化寡核苷酸是Y-形结构，其具有与所述双组分引物中的通用环化序列互补的单链区域。

在一些实施方案中，本发明是制备用于测序的环状靶核酸的文库，其包括：用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增靶核酸以产生双链扩增子；分离所述双链扩增子的链；使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；和连接所述链的末端，由此形成环状靶核酸的文库。在一些实施方案中，所述靶核酸包含通用衔接子序列，其包含缀合至所述靶序列的通用引物结合位点。

在一些实施方案中，本发明是一种确定样品中的双链靶核酸的序列的方法，所述方法包括: 将通用引物结合位点连接至样品中的靶核酸的末端以形成衔接的靶核酸；用第一和第二双组分扩增引物扩增所述衔接的靶核酸，以产生双链扩增子，所述双组分扩增引物包含与通用引物结合位点互补的通用引物和通用环化序列；分离所述双链扩增子的链；使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；连接所述链的末端，由此形成环状靶核酸；使所述样品与测序引物接触，所述测序引物与所述双组分引物的通用序列之一互补；和用核酸聚合酶延伸所述测序引物，由此确定所述靶核酸的序列。在一些实施方案中，通过连接包含所述通用引发位点的衔接子，连接所述通用引发位点。

在一些实施方案中，本发明是一种确定样品中的双链靶核酸的序列的方法，所述方法包括: 用包含靶标特异性序列和通用环化序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子；分离所述双链扩增子的链；使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；和连接所述链的末端，由此形成环状靶核酸；使所述样品与测序引物接触，所述测序引物与所述双组分引物的通用序列之一互补；和用核酸聚合酶延伸所述测序引物，由此确定所述靶核酸的序列。

在一些实施方案中，本发明是一种用于确定靶核酸的序列的试剂盒，所述试剂盒包含：第一和第二双组分扩增引物，其包含通用环化序列和靶标结合序列；环化寡核苷酸，其至少部分地与双组分引物中的通用环化序列互补，使得包含所述双组分引物的链的末端可以可连接地靠近。在一些实施方案中，所述试剂盒也包含DNA聚合酶和DNA连接酶。在一些实施方案中，所述第一和第二双组分扩增引物中的仅一种在5’-末端处被磷酸化。在一些实施方案中，所述环化寡核苷酸包含捕获部分的配体。在一些实施方案中，所述环化寡核苷酸是Y-形结构，其具有与所述双组分引物中的通用环化序列互补的单链区域。

附图说明

图1显示了环化方法的一般路线图。

图2显示了环化方法的详细路线图。

图3显示了在各种条件下单链环状DNA的产率。

图4显示了单链DNA文库的测序的结果。

具体实施方式

定义

以下定义有助于本公开内容的理解。

术语“样品”表示含有或假定含有靶核酸的任何组合物。这包括从个体分离的组织或流体的样品，例如，皮肤、血浆、血清、脊髓液、淋巴液、滑液、尿液、泪水、血细胞、器官和肿瘤，并且也表示从取自个体的细胞建立的体外培养物的样品，包括福尔马林固定的石蜡包埋组织(FFPET)和从其分离的核酸。样品还可以包括无细胞材料，诸如含有无细胞DNA(cfDNA)或循环肿瘤DNA (ctDNA)的无细胞血液级分。

术语“核酸”表示核苷酸(例如，天然的和非天然的核糖核苷酸和脱氧核糖核苷酸)的聚合物，包括DNA、RNA及其亚类，诸如cDNA、mRNA等。核酸可以是单链的或双链的，且通常含有5'-3'磷酸二酯键，尽管在一些情况下，核苷酸类似物可能具有其它键。核酸可以包括天然存在的碱基(腺苷、鸟苷、胞嘧啶、尿嘧啶和胸苷)以及非天然碱基。非天然碱基的一些实例包括在例如Seela等人, (1999) Helv. Chim. Acta 82:1640中描述的那些。非天然碱基可以具有特定功能，例如，增加核酸双链体的稳定性、抑制核酸酶消化或阻断引物延伸或链聚合。

术语“多核苷酸”和“寡核苷酸”可互换使用。多核苷酸是单链或双链核酸。寡核苷酸是有时用于描述较短多核苷酸的术语。寡核苷酸可以由至少6个核苷酸或约15-50个核苷酸构成。通过本领域已知的任意合适方法制备寡核苷酸，例如，通过涉及直接化学合成的方法，如以下文献中所述：Narang等人(1979) Meth. Enzymol. 68:90-99；Brown等人(1979)Meth. Enzymol. 68:109-151; Beaucage等人(1981) Tetrahedron Lett. 22:1859-1862;Matteucci等人(1981) J. Am. Chem. Soc. 103:3185-3191。

术语“引物”表示与靶核酸中的序列(“引物结合位点”)杂交且能够在适合这种合成的条件下充当沿着核酸的互补链的合成的起始点的单链寡核苷酸。

术语“衔接子”意指可以被添加至另一个序列以便将额外的特性输入该序列的核苷酸序列。衔接子通常是这样的寡核苷酸：其可以是单链或双链的，或者可以同时具有单链部分和双链部分。

术语“连接”表示接合两条核酸链的缩合反应，其中一个分子的5'-磷酸酯基团与另一个分子的3'-羟基基团反应。连接通常是由连接酶或拓扑异构酶催化的酶促反应。连接可以接合两条单链以产生一个单链分子。连接还可以接合两条链(每条链属于一个双链分子)，因此接合两个双链分子。连接还可以将双链分子的两条链接合至另一个双链分子的两条链，因此接合两个双链分子。连接还可以接合在双链分子内的链的两个末端，因此修复双链分子中的切口。

术语“条形码”表示可以检测和鉴别的核酸序列。可以将条形码掺入多种核酸中。条形码是足够长的，例如2、5、20个核苷酸，使得在样品中，可以将掺入条形码的核酸根据所述条形码区分或分组。

术语“多重标识符”或“MID”表示鉴别靶核酸的来源(例如，衍生出核酸的样品)的条形码。来自相同样品的所有或基本上所有的靶核酸将共享相同的MID。可以将来自不同来源或样品的靶核酸混合并同时测序。使用MID，可以将序列读出分配至靶核酸来源的各个样品。

术语“独特分子标识符”或“UID”表示鉴别与其附接的核酸的条形码。来自相同样品的所有或基本上所有的靶核酸将具有不同的UID。源自相同原始靶核酸的所有或基本上所有的后代(例如，扩增子)将共享相同的UID。

术语“通用引物”和“通用引发结合位点”或“通用引发位点”表示存在于(通常，通过体外添加至)不同靶核酸的引物和引物结合位点。使用衔接子或使用具有在5'-部分中的通用引发位点的靶标特异性(非通用)引物将通用引发位点添加至多种靶核酸。所述通用引物可以结合通用引发位点并指导从所述通用引发位点的引物延伸。

更一般而言，术语“通用”表示可以添加至任何靶核酸并独立于靶核酸序列执行它的功能的核酸分子(例如，引物或其它寡核苷酸)。通用分子可以通过使互补物例如通用引物与通用引物结合位点杂交或使通用环化寡核苷酸与通用引物序列杂交来执行它的功能。

本文中使用的术语“靶序列”、“靶核酸”或“靶标”表示要检测或分析的样品中的核酸序列的一部分。术语靶标包括靶序列的所有变体，例如，一种或多种突变型变体和野生型变体。

术语“测序”表示确定靶核酸中的核苷酸的序列的任何方法。

本发明是制备环状靶核酸分子和这样的分子的文库用于下游分析诸如核酸测序的方法。如在图1中所示，所述方法包括寡核苷酸探针用于环化核酸分子的用途。首先，所述核酸分子具有添加至每个末端的通用序列。然后使在每个末端处具有通用序列的核酸成为单链并与探针接触，所述探针与通用序列的至少一部分互补。所述探针杂交以实现单链环状(sscDNA)分子的环化和形成。

所述方法具有胜过现有环化方法（例如，USRE44265和US2012003657）的优点。与该方法相比，本发明的方法使用附接至靶序列的通用环化序列。本发明的方法不使用含有多个限制位点的非靶寡核苷酸，所述限制位点插入在靶分子的末端之间以确保限制位点的存在(参见USRE44265，其中的图2)。在US2012003657中使用了相同的策略(参见其中的图1A)，其中使用含有测序引物结合位点的“载体”寡核苷酸。本发明使用更有效的分子内环化而不是用辅助寡核苷酸的分子间连接。

本发明包括检测样品中的靶核酸。在一些实施方案中，所述样品源自受试者或患者。在一些实施方案中，所述样品可以包含源自受试者或患者的实体组织或实体瘤的片段，例如通过活组织检查。所述样品还可以包含体液(例如，尿液、痰液、血清、血浆或淋巴液、唾液、痰液、汗液、泪液、脑脊髓液、羊水、滑液、心包液、腹膜液、胸膜液、囊液、胆汁、胃液、肠液和/或粪便样品)。所述样品可以包含其中可能存在肿瘤细胞的全血或血液级分。在一些实施方案中，所述样品、尤其是液体样品可以包含无细胞材料，诸如无细胞DNA或RNA，包括无细胞肿瘤DNA或肿瘤RNA。在一些实施方案中，所述样品是无细胞样品，例如无细胞血液来源的样品，其中存在无细胞肿瘤DNA或肿瘤RNA。在其它实施方案中，所述样品是含有或被怀疑含有传染性病原体或源自传染性病原体的核酸的培养样品，例如，培养物或培养上清液。在一些实施方案中，所述传染性病原体是细菌、原生动物、病毒或支原体。

靶核酸是可能存在于样品中的目标核酸。在一些实施方案中，所述靶核酸是基因或基因片段。在其它实施方案中，所述靶核酸含有遗传变体，例如，多态性，包括单核苷酸多态性或变体(SNP或SNV)，或导致例如基因融合的遗传重排。在一些实施方案中，所述靶核酸包含生物标志物。在其它实施方案中，所述靶核酸是特定生物体所特有的，例如，有助于鉴别病原生物体，或病原生物体所特有的，例如，药物敏感性或药物抗性。在其它实施方案中，所述靶核酸是人受试者所特有的，例如，定义受试者的独特HLA或KIR基因型的HLA或KIR序列。在其它实施方案中，样品中的所有序列都是靶核酸，例如，在鸟枪基因组测序中。

在本发明的一个实施方案中，将双链靶核酸转化为本发明的模板构型。在一些实施方案中，所述靶核酸在自然界中以单链形式(例如，RNA，包括mRNA、微RNA、病毒RNA；或单链病毒DNA)存在。将单链靶核酸转化为双链形式以实现请求保护的方法的另外步骤。

可以将较长靶核酸片段化，尽管在一些应用中，可能需要较长靶核酸来实现较长阅读。在一些实施方案中，所述靶核酸被天然地片段化，例如，循环的无细胞DNA (cfDNA)或化学降解的DNA诸如在保存的样品中发现的DNA。在其它实施方案中，所述靶核酸在体外被片段化，例如，通过物理方式诸如声处理或通过内切核酸酶消化，例如，限制性消化。

在一些实施方案中，本发明是包括扩增靶核酸的步骤的方法。所述扩增可以是通过聚合酶链式反应(PCR)或利用寡核苷酸引物的任意其它方法。在PCR Strategies(M. A.Innis, D. H. Gelfand, 和J. J. Sninsky编, 1995, Academic Press, San Diego, CA)第14章; PCR Protocols : A Guide to Methods and Applications (M. A. Innis, D.H. Gelfand, J. J. Sninsky, 和T. J. White编, Academic Press, NY, 1990)中描述了多种PCR条件。

所述扩增可以利用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物以产生双链扩增子(图2)。在一些实施方案中，正在查询确定的靶标或靶核酸组。在这样的实施方案中，可以使用靶标特异性扩增引物。引物可以具有由在引物的3’-部分中的靶标特异性序列和在引物的5’-部分中的通用序列构成的双组分结构。通常，将靶标特异性引物用作一对独特的寡核苷酸，例如，正向引物和反向引物。对于后续步骤，可以将不同的通用序列添加至正向引物和反向引物的5’-部分以便在所述方法的后续步骤中区分互补链(即，(+)和(-)链)。在一些实施方案中，所述双组分引物的通用序列包含测序引物结合位点。

所述扩增也可以利用通用衔接子序列，其包含缀合至所述靶序列的通用引物结合位点。在其它实施方案中，正在查询多个靶核酸，例如，存在于样品（例如，被怀疑含有一种或多种未知病原性生物体的样品）中的全基因组或所有核酸。在这样的实施方案中，靶标特异性的引物不是有利的，且使用通用引物。在这样的实施方案中，添加通用引物结合位点，例如，通过连接含有通用引物结合位点序列的衔接子分子。通常，独立于靶核酸的序列添加这样的衔接子，例如，通过连接。在这样的实施方案中，靶核酸在每个末端接受相同的衔接子分子。为了区分得到的衔接的靶核酸的链，衔接子可以具有Y-结构，参见例如，美国专利号8,053,192、8,182,989和8,822,150。

在本发明的一些实施方案中，所述衔接子分子连接至所述靶核酸。所述连接可以是平端连接或更有效的粘性末端连接。通过链填充，即通过DNA聚合酶延伸3'-端以消除5'-突出端，可以使靶核酸或衔接子末端变平。在一些实施方案中，通过将单个核苷酸添加至衔接子的3'-末端并将单个互补核苷酸添加至靶核酸的3'-末端，例如通过DNA聚合酶或末端转移酶，可以使平端的衔接子和靶核酸具有粘性。在其它实施方案中，所述衔接子和所述靶核酸可以通过用限制性内切核酸酶消化而获得粘性末端(突出端)。后一种选择对于已知含有限制性酶识别位点的已知靶序列是更有利的。在上述实施方案中的每一个中，所述衔接子分子可以通过下文进一步描述的合成衔接子寡核苷酸的设计而获得所需末端(平端、单碱基延伸或多碱基突出端)。在一些实施方案中，可能需要其它酶促步骤来完成连接。在一些实施方案中，可以使用多核苷酸激酶将5'-磷酸酯添加至靶核酸分子和衔接子分子。

在一些实施方案中，所述衔接子分子是体外合成的人工序列。在其它实施方案中，所述衔接子分子是已知具有所需二级结构的体外合成的天然存在的序列。在其它实施方案中，所述衔接子分子是分离的天然存在的分子或分离的非天然存在的分子。

在一些实施方案中，本发明包括将条形码引入靶核酸中。对各个分子测序通常需要分子条形码诸如在例如美国专利号7,393,665、8,168,385、8,481,292、8,685,678和8,722,368中所述的。独特的分子条形码是通常在体外操作的最早步骤期间添加给样品（诸如患者的样品）中的每种分子的短人工序列。所述条形码标记所述分子和它的后代。所述独特分子条形码(UID)具有多种用途。条形码允许跟踪样品中的每种单个核酸分子以评估例如循环的肿瘤DNA (ctDNA)分子在患者的血液中的存在和量，以便不经活组织检查而检测和监测癌症。独特的分子条形码还可以用于测序误差校正。单个靶分子的整个后代用相同条形码标记并形成带条形码的家族。不被带条形码的家族的所有成员共享的序列变异被作为伪像抛弃且不是真突变。条形码还可以用于位置两分（positional deduplication）和靶标定量，因为整个家族代表原始样品中的单一分子。参见美国专利申请14/209,807和14/774,518。

在本发明的一些实施方案中，双组分扩增引物包含一个或多个条形码。在其它实施方案中，衔接子包含一个或多个条形码。条形码可以是在样品发生混合(多重化)的情况下用于鉴别样品的来源的多重样品ID (MID)。条形码也可以充当用于鉴别每种原始分子和它的后代的独特分子ID (UID)。条形码也可以是UID和MID的组合。在一些实施方案中，将单个条形码用作UID和MID。

在一些实施方案中，每个条形码包含预定义的序列。在其它实施方案中，所述条形码包含随机序列。条形码可以是1-20个核苷酸长。

在一些实施方案中，所述方法查询靶核酸的两条链中的仅一条。本发明包括分离双链扩增子的链的步骤。在一些实施方案中，将一条链降解并将另一条链保留用于所述方法的后续步骤。在一些实施方案中，对所述扩增子进行外切核酸酶处理(例如，通过病毒外切核酸酶、T7或λ外切核酸酶)。在一些实施方案中，可以将所述引物或衔接子修饰成包括5’-或3’-末端保护(诸如硫代磷酸酯)以特异性地靶向用于外切核酸酶消化的替代链。通过物理方式，即，碱性变性或热变性，也可以分离两条链。在其它实施方案中，用能够选择性地结合具有亲和配体的链的亲和试剂捕获期望的链。在一些实施方案中，将引物生物素化并用抗生蛋白链菌素捕获所述链。

在一些实施方案中，将靶核酸的末端磷酸化。在一些实施方案中，将一种引物的5’-末端磷酸化，以便实现外切核酸酶（例如，λ外切核酸酶）对一条链的降解。在其它实施方案中，为该目的将衔接子的5’-末端磷酸化。磷酸化的和非磷酸化的衔接子的混合物(例如，相等混合物)可以用于确保衔接的靶分子的单个5’-末端被磷酸化。

在其它实施方案中，磷酸化对于后续连接步骤而言是必要的。引物、衔接子或在链分离步骤以后的单链分子的磷酸化可以例如使用多核苷酸激酶(PNK)诸如T4 PNK执行。

在一些实施方案中，所述方法包括环化步骤。该步骤包括使扩增子的5’-磷酸化的链与环化寡核苷酸接触以产生杂交结构，其中所述链中的通用环化序列与所述环化寡核苷酸杂交，使得所述链的末端可连接地靠近。所述环化寡核苷酸可以是直链寡核苷酸或两个寡核苷酸的Y-形组合。所述Y-形结构包含与双组分引物中的通用环化序列互补的单链区域。所述环化寡核苷酸也可以包含捕获部分，其用于被捕获对（诸如生物素-抗生蛋白链菌素、抗体-抗原或捕获寡核苷酸-互补寡核苷酸）中的亲和试剂捕获。所述环化寡核苷酸可以是在溶液中游离的或结合至固体支持物，例如，通过上述的捕获部分。所述捕获也可以发生在杂交以后或下述的连接步骤以后。

在一些实施方案中，本发明进一步包括连接步骤，该步骤包括连接与环化寡核苷酸杂交的链的末端，由此形成环状分子。将所述链的5’-末端磷酸化，从而实现所述连接步骤。

在一些实施方案中，本发明包括外切核酸酶消化步骤，其中从反应混合物除去可能包含过量的寡核苷酸的直链核酸或未环化的扩增子。终产物是含有测序引物结合位点的环状ssDNA模板。

在一些实施方案中，本发明是一种制备环状靶核酸的文库的方法。所述方法包括使用通用引物的扩增步骤。将通用引物结合位点添加至样品中的核酸，例如，通过衔接子连接以产生衔接的分子的文库。在所述文库中的分子包含被通用序列（例如，通用引物结合位点和测序引物结合位点）侧接的靶序列。所述环化寡核苷酸可以与所述衔接子中所含的序列互补。在其它实施方案中，所述衔接子仅包含通用引物结合位点，且通用引物引入在所述衔接子中不存在的额外序列。所述通用引物可以是包含通用引物结合位点和例如测序引物结合位点的双组分扩增引物。然后对所述扩增子进行上述方法的步骤以产生单链分子的文库。

在一些实施方案中，本发明包括通过核酸测序来检测样品中的靶核酸。可以将多种核酸（包括样品中的所有核酸）转化成本发明的模板构型并测序。在一些实施方案中，可以对本文描述的环状分子的文库进行核酸测序。

通过本领域已知的任意方法可以执行测序。特别有利的是高通量单分子测序。这样的技术的例子包括Illumina HiSeq平台(Illumina, San Diego, Cal.)、Ion Torrent平台(Life Technologies, Grand Island, NY)、利用SMRT的Pacific BioSciences平台(Pacific Biosciences, Menlo Park, Cal.)或利用纳米孔技术的平台（诸如由OxfordNanopore Technologies (Oxford, UK)或Roche Sequencing Solutions (Santa Clara,Cal.)制造的那些）和任意其它目前存在的或将来的涉及或不涉及合成测序(sequencingby synthesis)的DNA测序技术。测序步骤可以利用平台特异性的测序引物。可以将这些引物的结合位点引入如本文中所述的本发明的方法中，即，通过成为衔接子或扩增引物的一部分。在一些实施方案中，所述测序平台不需要特异性测序引物且不将测序引物结合位点引入环状分子。

在一些实施方案中，本发明是确定双链靶核酸的序列的方法。在该实施方案中，使连接的单链环状核酸与测序引物（其与存在于ssDNA中的测序引物结合位点互补）接触并用核酸聚合酶延伸所述测序引物，由此确定所述靶核酸的序列。

本发明的方法能够在终产物(单链环状靶核酸分子)中包含测序引物结合位点，这允许靶分子的直接测序。利用这样的构造，可能将ssDNA的同一链测序多次并因此产生共有序列。值得注意的是，本发明的方法可适用于多种靶核酸大小。在一些实施方案中，所述靶核酸短至100个碱基对和长至1万个碱基。

在一些实施方案中，所述测序步骤涉及序列分析，其包括序列比对的步骤。在一些实施方案中，使用比对来确定来自多个序列（例如，具有相同条形码(UID)的多个）的共有序列。在一些实施方案中，使用条形码(UID)来确定来自都具有相同条形码(UID)的多个序列的共有序列。在其它实施方案中，使用条形码(UID)来消除伪像，即，存在于一些但并非全部具有相同条形码(UID)的序列中的变异。可以消除这样的源自PCR误差或测序误差的伪像。

在一些实施方案中，通过定量样品中具有每种条形码(UID)的序列的相对数目，可以定量样品中的每种序列的数目。每个UID代表在原始样品中的单个分子，且计数与每种序列变体相关的不同UID可以确定在原始样品中的每种序列的分数。本领域技术人员将能够确定为确定共有序列所必需的序列阅读的数目。在一些实施方案中，所述有关数目是准确定量结果所必需的阅读/UID (“序列深度”)。在一些实施方案中，期望的深度是5-50个阅读/UID。

在一些实施方案中，本发明是一种用于执行本发明的方法的试剂盒。所述试剂盒包含：第一和第二双组分扩增引物，其包含靶标结合序列和任选的与所述环化寡核苷酸互补的通用序列；环化寡核苷酸，其至少部分地与所述双组分引物中的两种通用环化序列互补，使得包含所述双组分引物的链的末端可以可连接地靠近。所述试剂盒也可以包含DNA连接酶(在一些实施方案中，使用T4 DNA连接酶、Taq DNA连接酶或大肠杆菌DNA连接酶)、多核苷酸激酶和DNA聚合酶，诸如扩增聚合酶或测序聚合酶。聚合酶的非限制性例子包括原核DNA聚合酶(例如Pol I、Pol II、Pol III、Pol IV和Pol V)、真核DNA聚合酶、古细菌DNA聚合酶、端粒酶、逆转录酶和RNA聚合酶。逆转录酶是从RNA模板合成DNA的、RNA依赖性的DNA聚合酶。逆转录酶家族含有DNA聚合酶功能性和RNA酶H功能性，其降解与DNA发生碱基配对的RNA。

在一些实施方案中，所述DNA聚合酶具有链置换活性且不具有5’-3-外切核酸酶活性。在一些实施方案中，使用Phi29聚合酶及其衍生物，参见美国专利号5,001,050、5,576,204、7,858747和8921086。在一些实施方案中，所述聚合酶具有3’-5’外切核酸酶活性，该活性有利地从扩增子链除去3’-A突出端。在一些实施方案中，具有5’-3’和3’-5’外切核酸酶活性的重组热球菌衍生的高保真度DNA聚合酶能够产生平端产物。参见Frey, B.和Suppman, B. (1995). BioChemica. 2, 34-35。

实施例

实施例1. 从HIV-B参照序列形成单链环.

用于试验的DNA材料是从Genewiz定购的合成质粒DNA。从HIV-B参照序列设计质粒以靶向约3.2kb的pol基因区域，其具有用于克隆方法的载体骨架pUC57 (总计约6.2kb)。使用标准程序将所述质粒转化进大肠杆菌感受态细胞，克隆，提取，并纯化。将纯化的质粒DNA用限制性酶线性化，并将消化过的质粒DNA使用Bioanalzyer定量并稀释至10⁸拷贝/mL用于PCR扩增。

使用下述引物：

。

每个50uL PCR反应包含Phusion DNA聚合酶(New England BioLabs, Ipswich,Mass)、正向和反向靶标特异性引物和10⁶个拷贝的HIV Genewiz DNA模板。

按照生产商的推荐在热循环仪中执行PCR扩增。使用Fragment Analyzer或Bioanalyzer和Qubit dsDNA Broad Range进行PCR QC评估以确定是否存在任何脱靶产物和PCR反应是否是有效的。使用SPRI珠子将PCR产物纯化以除去过量的引物和PCR试剂。将每份珠子清除物（cleanup）在TrisHCl pH 8.0中洗脱，并计算向外切核酸酶反应中输入2ug的体积量。

使用λ外切核酸酶的外切核酸酶反应包含λ外切核酸酶和2 ug的dsDNA扩增子。将反应物在具有加热盖的热循环仪中在37℃温育30 min，随后在75℃热灭活10 min。

将产物用SPRI珠子纯化以准备用于工作流中的下一反应，在30uL洗脱缓冲液中洗脱，并在Qubit ssDNA和dsDNA试剂盒以及Bioanalyzer上测量以确定外切核酸酶反应的效率。

用T4多核苷酸激酶执行磷酸化。单链DNA模板的磷酸化将实现连接。

将产物用SPRI珠子纯化以准备用于工作流中的下一反应，并在30uL洗脱缓冲液中洗脱，并直接地进入-连接(环化)反应，不需要QC步骤。

用DNA连接酶和环化寡核苷酸执行连接。将具有引物序列尾巴和M13尾巴的互补序列的长探针用于环化。

在49 uL体积中将5’-磷酸化的ssDNA模板与10 ul的20uM直链探针混合，并加入Taq DNA连接酶以便允许环化和连接发生。

将连接后产物用SPRI珠子纯化以准备用于工作流中的下一反应，并在45uL洗脱缓冲液中洗脱。在Qubit ssDNA和dsDNA试剂盒上测量连接后产物。

在制备单链环状靶核酸的最终步骤中，用外切核酸酶Exo I和Exo III的混合物或用Exo VII除去直链的或未环化的核酸。将反应物在37℃温育30分钟。

将产物用SPRI珠子纯化，在20uL洗脱缓冲液中洗脱，并用Qubit ssDNA和dsDNA以及Bioanalzyer High Sensitivity进行QC以确定经纯化的最终文库的产率和大小。示例性的ss和dsDNA文库产率显示在图3上。

实施例2. 测序单链环状模板.

根据生产商的说明书在Pacific BioSciences RSII仪器(Pacific BioSciences,Menlo Park, Cal.)上对上述的单链环状分子测序。结果显示在表1和图4中。

表1.

文库ID	聚合酶阅读长度	空的(P0)	生产的(P1)	其它(P2)
					T7	7373	57722 (38%)	59226 (39%)	33344 (22%)
λ	15081	68401 (46%)	61531 (41%)	20360 (14%)

Claims

1.一种从靶核酸形成环状分子的方法，所述方法包括：

a)用包含通用环化序列和靶标特异性序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子；

b)分离所述双链扩增子的链；

c)使所述扩增子的链与环化寡核苷酸接触以产生杂交结构，其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交，使得所述链的末端可连接地靠近；和

d)连接所述链的末端，由此形成环状分子。

2.根据权利要求1所述的方法，其中所述靶核酸包含选自无细胞血浆DNA、声处理的DNA和限制性消化的DNA的基因组片段。

3.根据权利要求1所述的方法，其中所述第一和第二扩增引物上的通用序列是独特的。

4.根据权利要求1所述的方法，其中所述第一或第二扩增引物的通用序列包含测序引物。

5.根据权利要求1所述的方法，其中所述第一和第二扩增引物中的仅一种包含5’-磷酸酯基团。

6.根据权利要求1所述的方法，其中通过核酸酶消化而分离所述双链扩增子的链。

7.根据权利要求1所述的方法，其中通过物理方式而分离所述双链扩增子的链。

8.根据权利要求1所述的方法，其中所述环化寡核苷酸包含捕获部分的配体。

9.根据权利要求8所述的方法，其中所述配体-捕获部分对选自生物素-抗生蛋白链菌素、抗体-抗原或寡核苷酸-互补捕获寡核苷酸。

10.根据权利要求1所述的方法，其中所述环化寡核苷酸是Y-形结构，其具有与所述双组分引物中的通用环化序列互补的单链区域。

11.一种制备用于测序的环状靶核酸的文库的方法，所述方法包括：

b)分离所述双链扩增子的链；

c)使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；和

d)连接所述链的末端，由此形成环状靶核酸的文库。

12.根据权利要求11所述的方法，其中所述靶核酸包含通用衔接子序列，所述通用衔接子序列包含缀合至所述靶序列的通用引物结合位点。

13.一种确定样品中的双链靶核酸的序列的方法，所述方法包括：

a)将通用引物结合位点连接至样品中的靶核酸的末端以形成衔接的靶核酸；

b)用第一和第二双组分扩增引物扩增所述衔接的靶核酸，以产生双链扩增子，所述双组分扩增引物包含与所述通用引物结合位点互补的通用引物和通用环化序列；

c)分离所述双链扩增子的链；

d)使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；和；

e)连接所述链的末端，由此形成环状靶核酸；

f)使所述样品与测序引物接触，所述测序引物与所述双组分引物的通用序列之一互补；和

g)用核酸聚合酶延伸所述测序引物，由此确定所述靶核酸的序列。

14.根据权利要求13所述的方法，其中通过连接包含所述通用引发位点的衔接子，连接所述通用引发位点。

15.一种确定样品中的双链靶核酸的序列的方法，所述方法包括：

a)用包含靶标特异性序列和通用环化序列的第一和第二双组分扩增引物扩增所述靶核酸以产生双链扩增子；

b)分离所述双链扩增子的链；

c)使所述链与环化寡核苷酸接触以产生杂交结构，其中所述链中的所述通用环化序列与所述环化寡核苷酸杂交，使得每条链的末端可连接地靠近；

d)连接所述链的末端，由此形成环状靶核酸；

e) 使所述样品与测序引物接触，所述测序引物与所述双组分引物的通用序列之一互补；和

f)用核酸聚合酶延伸所述测序引物，由此确定所述靶核酸的序列。

16.一种用于确定靶核酸的序列的试剂盒，所述试剂盒包含：

a)第一和第二双组分扩增引物，其包含通用环化序列和靶标结合序列；

b)环化寡核苷酸，其至少部分地与所述双组分引物中的所述通用环化序列互补，使得包含所述双组分引物的链的末端可以可连接地靠近。