CN116397007A

CN116397007A - 使用argonaute系统的多核苷酸富集和扩增

Info

Publication number: CN116397007A
Application number: CN202310557305.1A
Authority: CN
Inventors: 杰弗里·G·曼德尔; 莫利·何
Original assignee: Illumina Inc
Current assignee: Illumina Inc
Priority date: 2016-05-11
Filing date: 2017-05-10
Publication date: 2023-07-07
Also published as: EP3455372A1; EP3455372B1; US20190136303A1; CN109477137A; US11542544B2; EP4269611A3; EP4269611A2; WO2017197027A1; EP3656873A2; CN109477137B; DK3455372T3; US20230295701A1; EP3656873A3

Abstract

本申请涉及使用ARGONAUTE系统的多核苷酸富集和扩增。一种用于富集或扩增靶核酸的方法，所述方法包括提供一种系统，所述系统具有指导核酸以及Cas蛋白或Argonaute蛋白或其变体。指导核酸包含与靶核酸的一个区域基本上互补的靶特异性核苷酸区域，并且使靶核酸与所述系统接触以形成复合物。

Description

使用ARGONAUTE系统的多核苷酸富集和扩增

本申请是申请日为2017年05月10日，申请号为201780044607.1，发明名称为“使用ARGONAUTE系统的多核苷酸富集和扩增”的申请的分案申请。

本公开内容大体上涉及用于富集或扩增多核苷酸的方法，并且更具体地涉及用于使用CRISPR-Cas或Argonaute系统富集或扩增多核苷酸的方法及其应用。

背景

存在期望在多核苷酸群体中，例如在全基因组中富集或扩增靶多核苷酸的多种方法和应用。

目前用于序列特异性DNA富集的许多方法涉及多个步骤，并且需要相对大量的样品核酸，并且通常是困难、冗长、费力、耗时、低效和昂贵的。此外，目前用于双链DNA的靶向富集的方法需要在序列特异性靶向之前产生单链DNA。它们还需要较长的时间用于使探针与靶DNA杂交。因此，对能够快速并有效的序列特异性多核苷酸富集的新方法存在需求。

核酸扩增是许多基于核酸的方法例如核酸测序的关键步骤。目前，使用的大多数核酸扩增方法，例如在下一代测序中用于簇产生的那些，需要温度循环和流体交换两者。在另一方面，等温扩增可以通过消除温度斜坡(temperature ramp)和平衡时间而是时间和能量有效的。已经开发了若干等温扩增方法，例如基于重组酶聚合酶扩增(RPA)的等温扩增。这些等温扩增系统通常缺乏理想地适合于一些应用的期望的速度和效率。此外，一些系统需要另外的酶和试剂，包括ATP。因此，本领域对方便、快速和有效的等温核酸扩增方法仍存在需求。

CRISPR-CAS和相关蛋白在PCT公布第WO2016/014409号和第WO2016/077350号中讨论，其通过引用以其整体特此并入。

本公开内容通过提供用于使用CRISPR-Cas或Argonaute系统富集或扩增核酸的方法来解决这些和其他需求。还提供了相关的益处。

概述

本公开内容提供了用于富集或扩增多核苷酸的方法，并且更具体地涉及用于使用内切核酸酶系统，例如CRISPR-Cas系统或Argonaute系统，富集或扩增靶DNA序列的方法及其应用。

在一个方面，本文提供了用于使用CRISPR-Cas系统扩增靶双链核酸的方法。

在某些实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供一种系统，所述系统具有：成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及CRISPR相关(Cas)蛋白或其变体，其中crRNA或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)使靶双链核酸与系统接触以形成复合物；(c)使引物与靶双链核酸的第二链杂交，所述引物包含与靶双链核酸的第二链的一个区域互补的序列，以及(d)使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。

在一些实施方案中，本文提供的方法还包括重复步骤(c)至步骤(d)一次或更多次，例如，直至达到期望的扩增程度。在一些实施方案中，本文提供的方法还包括重复步骤(a)至步骤(d)直至达到期望的扩增程度。

在一些实施方案中，本文提供的靶核酸是双链DNA(dsDNA)。在一些实施方案中，靶核酸是双链RNA(dsRNA)。

在一些实施方案中，系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中，系统是III型CRISPR-Cas系统或其衍生物。

在一些实施方案中，系统还包含反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。

在一些实施方案中，靶双链核酸的第一链包含与5’-NGG前间区(protospacer)相邻基序(PAM)互补的序列。

在一些实施方案中，靶双链核酸的第一链包含通用序列，并且其中crRNA或其衍生物包含与通用序列的一个区域互补的序列。在一些实施方案中，引物包含通用序列的一个区域的序列。

在一些实施方案中，通用序列具有SEQ ID No.3的序列。在一些实施方案中，crRNA包含SEQ ID No.7的序列。在一些实施方案中，通用序列具有SEQ ID No.5的序列。

在一些实施方案中，通用序列具有SEQ ID No.4的序列。在一些实施方案中，crRNA包含SEQ ID No.8的序列。在一些实施方案中，通用序列具有SEQ ID No.6的序列。

在一些实施方案中，Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白包含两个失活的核酸酶结构域。在一些实施方案中，两个失活的核酸酶结构域包含切割与crRNA互补的链的结构域中的第一突变以及切割与crRNA不互补的链的结构域中的第二突变。在一些实施方案中，第一突变是D10A，并且第二突变是H840A。在一些实施方案中，Cas蛋白或其变体是级联蛋白或其变体。在一些实施方案中，Cas蛋白或其变体是Cas3蛋白或其变体。

在一些实施方案中，聚合酶是链置换聚合酶。在一些实施方案中，聚合酶选自由以下组成的组：Bst、Bsu和Phi29。

在一些实施方案中，本文提供的方法还包括：在靶核酸和包含转移链的至少一种转座子末端组合物经历转座反应的条件下，将至少一种转座酶和所述至少一种转座子末端组合物应用于包含靶核酸的样品以产生混合物，其中靶核酸被片段化以产生多于一个靶核酸片段，并且将通用引物序列掺入到多于一个靶核酸片段的每一个中，其中crRNA或其衍生物包含与通用引物的一个区域互补的靶特异性核苷酸区域。

在一些实施方案中，通用引物通过PCR反应被掺入到多于一个靶核酸片段中。在一些实施方案中，通用引物具有与5’-NGG前间区相邻基序(PAM)互补的序列。

在一些实施方案中，通用引物具有SEQ ID No.4的序列。在一些实施方案中，crRNA包含SEQ ID No.8的序列。在一些实施方案中，通用序列具有SEQ ID No.6的序列。

在一些实施方案中，两种通用引物被掺入到多于一个靶核酸片段的每一个的两个末端中。在一些实施方案中，两种通用引物具有SEQ ID No.3和SEQ ID No.4的序列。在一些实施方案中，两种通用引物具有SEQ IDNo.5和SEQ ID No.6的序列。

在一些实施方案中，靶双链核酸被线性地扩增。在一些实施方案中，靶双链核酸被指数地扩增。

在一些实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供第一系统，所述第一系统具有：第一成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第一CRISPR相关(Cas)蛋白或其变体，其中第一crRNA或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)提供第二系统，所述第二系统具有：第二成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第二CRISPR相关(Cas)蛋白或其变体，其中第二crRNA或其衍生物包含与靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；(c)使靶双链核酸与第一系统和第二系统接触；(d)使第一引物与靶双链核酸的第二链杂交，第一引物包含与靶双链核酸的第二链的一个区域互补的序列，并且使第二引物与靶双链核酸的第一链杂交，第二引物包含与靶双链核酸的第一链的一个区域互补的序列，以及(e)用一种或更多种聚合酶延伸第一引物和第二引物的3’末端，以产生第一双链靶核酸和第二双链靶核酸。在一些实施方案中，本文提供的方法还包括重复步骤(a)至步骤(e)一次或更多次，例如，直至达到期望的扩增程度。

在一些实施方案中，靶核酸是双链DNA(dsDNA)。在一些实施方案中，靶核酸是双链RNA(dsRNA)。

在一些实施方案中，第一系统或第二系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，第一系统或第二系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中，第一系统或第二系统是III型CRISPR-Cas系统或其衍生物。

在一些实施方案中，第一系统或第二系统还包含反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，第一系统或第二系统的crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方案中，靶双链核酸的第一链和第二链包含与5’-NGG前间区相邻基序(PAM)互补的序列。

在一些实施方案中，靶双链核酸的第一链包含第一通用序列，且其中第一系统的crRNA或其衍生物包含与第一通用序列的一个区域互补的序列，并且靶双链核酸的第二链包含第二通用序列，且其中第二系统的crRNA或其衍生物包含与第二通用序列的一个区域互补的序列。

在一些实施方案中，第一引物包含第一通用序列的一个区域的序列，并且第二引物包含第二通用序列的一个区域的序列。在一些实施方案中，第一通用序列(其包含第一引物)具有SEQ ID No.3的序列，第一系统的crRNA或其衍生物包含SEQ ID No.7的序列，且第一引物包含SEQ ID No.5的序列，并且第二通用序列(其包含第二引物)具有SEQ ID No.4的序列，第二系统的crRNA或其衍生物包含SEQ ID No.8的序列，且第二引物包含SEQ ID No.6的序列。

在一些实施方案中，第一系统或第二系统的Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白包含两个失活的核酸酶结构域。在一些实施方案中，两个失活的核酸酶结构域包含切割与crRNA互补的链的结构域中的第一突变以及切割与crRNA不互补的链的结构域中的第二突变。在一些实施方案中，第一突变是D10A，并且第二突变是H840A。在一些实施方案中，第一系统或第二系统的Cas蛋白或其变体是级联蛋白或其变体。在一些实施方案中，第一系统或第二系统的Cas蛋白或其变体是Cas3蛋白或其变体。

在一些实施方案中，靶核酸是基因组DNA。在一些实施方案中，靶核酸包含染色体DNA或其片段。在一些实施方案中，靶核酸包括基因组或部分基因组。

在一些实施方案中，本文提供的方法还包括对靶核酸或靶核酸片段测序。在一些实施方案中，测序包括使用合成测序、桥式PCR测序、链终止测序、杂交测序、纳米孔测序和连接测序中的一个或更多个。

在另一个方面，本文提供了用于使用Argonaute系统扩增靶双链核酸的方法。

在某些实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供一种系统，所述系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)使靶双链核酸与系统接触以形成复合物；(c)使引物与靶双链核酸的第二链杂交，所述引物包含与靶双链核酸的第二链的一个区域互补的序列，以及(d)使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。

在一些实施方案中，5’磷酸化单链核酸是单链DNA(指导DNA或gDNA)。在一些实施方案中，5’磷酸化单链核酸是小于100个核苷酸的单链DNA。在一些实施方案中，5’磷酸化单链核酸是小于50个核苷酸的单链DNA。在一些实施方案中，5’磷酸化单链核酸是小于25个核苷酸的单链DNA。单链DNA的示例性长度包括10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个和50个核苷酸。

在一些实施方案中，Argonaute蛋白是格氏嗜盐碱杆菌(Natronobacteriumgregoryi)Argonaute(Ng Argonaute)。在一些实施方案中，Argonaute蛋白或其变体被工程化以去除内切核酸酶活性，使得Argonaute系统不会产生双链DNA断裂或单链DNA断裂。在其他实施方案中，Argonaute蛋白或其变体被工程化以能够产生单链DNA断裂。

在一些实施方案中，靶双链核酸的第一链包含通用序列，并且其中gDNA或其衍生物包含与通用序列的一个区域互补的序列。在一些实施方案中，引物包含通用序列的一个区域的序列。

在一些实施方案中，本文提供的方法还包括：在靶核酸和包含转移链的至少一种转座子末端组合物经历转座反应的条件下，将至少一种转座酶和所述至少一种转座子末端组合物应用于包含靶核酸的样品以产生混合物，其中靶核酸被片段化以产生多于一个靶核酸片段。

在一些实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供第一系统，所述第一系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)提供第二系统，所述第二系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；(c)使靶双链核酸与第一系统和第二系统接触；(d)使第一引物与靶双链核酸的第二链杂交，第一引物包含与靶双链核酸的第二链的一个区域互补的序列，并且使第二引物与靶双链核酸的第一链杂交，第二引物包含与靶双链核酸的第一链的一个区域互补的序列，以及(e)用一种或更多种聚合酶延伸第一引物和第二引物的3’末端，以产生第一双链靶核酸和第二双链靶核酸。在一些实施方案中，本文提供的方法还包括重复步骤(a)至步骤(e)一次或更多次，例如，直至达到期望的扩增程度。

在一些实施方案中，Argonaute蛋白是格氏嗜盐碱杆菌Argonaute(NgArgonaute)。在一些实施方案中，Argonaute蛋白或其变体被工程化以去除内切核酸酶活性，使得Argonaute系统不会产生双链DNA断裂或单链DNA断裂。在其他实施方案中，Argonaute蛋白或其变体被工程化以能够产生单链DNA断裂。

在一些实施方案中，靶双链核酸的第一链包含第一通用序列，且其中第一系统的gDNA或其衍生物包含与第一通用序列的一个区域互补的序列，并且靶双链核酸的第二链包含第二通用序列，且其中第二系统的gDNA或其衍生物包含与第二通用序列的一个区域互补的序列。

在一些实施方案中，第一引物包含第一通用序列的一个区域的序列，并且第二引物包含第二通用序列的一个区域的序列。

在又另一个方面，本文提供了用于使用CRISPR-Cas或Argonaute系统富集多核苷酸的方法。在某些实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：提供一种系统，所述系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在一些实施方案中，方法还包括从复合物分离靶核酸。在一些实施方案中，方法还包括扩增靶向核酸。

在一些实施方案中，靶核酸是双链DNA(dsDNA)。

在一些实施方案中，系统被标记。在一些实施方案中，gDNA被用生物素标记。在一些实施方案中，本文提供的方法还包括添加链霉亲和素，并且从而分离复合物。在一些实施方案中，Argonaute蛋白或其衍生物被用捕获标签标记。

在某些实施方案中，本文提供了一种用于富集靶双链核酸的方法，所述方法包括：提供一种内切核酸酶系统，所述内切核酸酶系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；使靶双链核酸与内切核酸酶系统接触以形成第一复合物；使标记的核酸与靶双链核酸的第二链杂交以形成第二复合物，靶双链核酸的第二链与5’磷酸化单链核酸或其衍生物不互补，并且分离第二复合物并从而富集靶核酸。

在一些实施方案中，靶核酸是双链DNA(dsDNA)。

在一些实施方案中，内切核酸酶系统被标记。在一些实施方案中，5’磷酸化单链核酸被用生物素标记。在一些实施方案中，本文提供的方法还包括添加链霉亲和素，并且从而分离复合物。

在一些实施方案中，Argonaute蛋白或其衍生物被捕获标签标记。

在某些实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：从受试者的血浆或血清获得无细胞DNA(cfDNA)的群体，所述无细胞DNA的群体包含靶核酸；提供一种系统，所述系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在一些实施方案中，靶核酸包含单核苷酸变体(SNV)。在一些实施方案中，方法还包括从复合物分离靶核酸。在一些实施方案中，方法还包括扩增靶向核酸。在一些实施方案中，靶核酸是双链DNA(dsDNA)。

在一些实施方案中，系统被标记。在一些实施方案中，gDNA被生物素标记。在一些实施方案中，本文提供的方法还包括添加链霉亲和素，并且从而分离复合物。在一些实施方案中，Argonaute蛋白或其衍生物被捕获标签标记。

在一些实施方案中，靶核酸在无细胞DNA的胎儿细胞级分中，并且其中无细胞DNA来自母体血浆。在一些实施方案中，受试者是癌症患者。

在某些实施方案中，本文提供了一种用于检测单核苷酸变体(SNV)的方法，所述方法包括：从受试者的血浆或血清获得无细胞DNA的群体；提供第一系统，所述第一系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与第一靶核酸的一个区域互补的第一靶特异性核苷酸区域，并且其中第一Argonaute蛋白具有核酸酶活性；使用第一内切核酸酶系统切割第一靶核酸，并且使用聚合酶链式反应(PCR)扩增第二靶核酸，其中第二靶核酸包含单核苷酸变体形式的第一靶核酸。

在一些实施方案中，本文提供的方法还包括：提供第二系统，所述第二系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与第二靶核酸的一个区域互补的第二靶特异性核苷酸区域；使第二靶核酸与第二内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集第二靶核酸。

在一些实施方案中，本文提供的方法还包括从复合物分离第二靶核酸。在一些实施方案中，第二靶核酸是双链DNA(dsDNA)。

在一些实施方案中，第二系统被标记。在一些实施方案中，第二5’磷酸化单链核酸被用生物素标记。在一些实施方案中，本文提供的方法还包括添加链霉亲和素，并且从而分离复合物。在一些实施方案中，第二Argonaute蛋白或其衍生物被用捕获标签标记。

在某些实施方案中，本文提供了一种用于标记靶核酸的方法，所述方法包括：提供第一系统，所述第一系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与靶核酸的第一区域互补的第一靶特异性核苷酸区域，并且其中第一Argonaute蛋白能够产生单链切口；使包含靶核酸的双链核酸与第一核酸酶系统接触以在靶核酸的第一区域处产生第一单链切口，并且标记靶核酸。

在一些实施方案中，本文提供的方法还包括通过标记分离靶核酸，并且从而富集靶核酸。在一些实施方案中，本文提供的方法还包括扩增靶核酸。

在一些实施方案中，靶核酸是双链DNA(dsDNA)。

在一些实施方案中，本文提供的方法还包括进行切口平移。在一些实施方案中，切口平移通过使用选自由DNA Pol 1、Bst和Taq组成的组的切口平移聚合酶进行。在一些实施方案中，切口平移在包含生物素化的dNTP的反应混合物中进行。在一些实施方案中，生物素化的dNTP是生物素化的dUTP。在一些实施方案中，本文提供的方法还包括添加磁性链霉亲和素珠以富集生物素化的靶核酸。

在一些实施方案中，本文提供的方法还包括：提供第二系统，所述第二系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与靶核酸的第二区域互补的第二靶特异性核苷酸区域，并且其中第二Argonaute蛋白能够产生单链切口，以及使包含靶核酸的双链核酸与第二核酸酶系统接触以在靶核酸的第二区域处产生第二单链切口，其中靶核酸的第一区域不同于靶核酸的第二区域。

在一些实施方案中，第一单链切口和第二单链切口在靶核酸的同一链上。在一些实施方案中，在靶核酸的同一链上的第一单链切口和第二单链切口之间的间隔是1bp至20bp。在一些实施方案中，方法还包括进行切口平移。在一些实施方案中，切口平移通过使用切口平移聚合酶Phi29进行。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的不同链上。在一些实施方案中，第一单链切口和第二单链切口之间的间隔是从20bp至500bp。

在一些实施方案中，本文提供的方法还包括添加捕获探针；以及用捕获探针交换在第一单链切口和第二单链切口之间的单链核酸产物，其中捕获探针能够与同单链核酸产物互补的核酸杂交。

在一些实施方案中，捕获探针的序列与单链核酸产物的序列10％至100％相同。在一些实施方案中，捕获探针是生物素化的探针。在一些实施方案中，本文提供的方法还包括添加磁性链霉亲和素珠以富集靶核酸。在一些实施方案中，捕获探针包含突出端(overhang)核苷酸序列，该突出端核苷酸序列与固定在表面上的寡核苷酸互补。

在一些实施方案中，第一单链切口和第二单链切口在靶核酸的相对链上，从而产生第一双链核酸断裂末端。

在一些实施方案中，本文提供的方法还包括将衔接子连接到第一双链DNA断裂末端。在一些实施方案中，衔接子是生物素化的。在一些实施方案中，本文提供的方法还包括添加磁性链霉亲和素珠以富集靶核酸。

在一些实施方案中，本文提供的方法还包括：提供第三系统，所述第三系统具有：第三5’磷酸化单链核酸或其衍生物、以及第三Argonaute蛋白或其变体，其中第三5’磷酸化单链核酸或其衍生物包含与靶核酸的第三区域基本上互补的第三靶特异性核苷酸区域，并且其中第三Argonaute蛋白能够产生单链切口；提供第四系统，所述第四系统具有：第四5’磷酸化单链核酸或其衍生物、以及第四Argonaute蛋白或其变体，其中第四5’磷酸化单链核酸或其衍生物包含与靶核酸的第四区域基本上互补的第四靶特异性核苷酸区域，并且其中第四Argonaute蛋白能够产生单链切口；以及使包含靶核酸的双链核酸与第三系统和第四系统接触，以在靶核酸的第三区域处产生第三单链切口并且在靶核酸的第四区域处产生第四单链切口，其中第三单链切口和第四单链切口在靶核酸的相对链上，从而产生第二双链核酸断裂末端，该第二双链核酸断裂末端不同于第一双链核酸断裂末端。在一些实施方案中，方法还包括将衔接子连接到第二双链核酸断裂末端。

在某些实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：提供由一组5’磷酸化单链核酸编程的Argonaute蛋白的群体，其中该组5’磷酸化单链核酸包含与靶核酸的一系列不同区域互补的5’磷酸化单链核酸；使靶核酸与由该组5’磷酸化单链核酸编程的Argonaute蛋白的群体接触，以产生一系列核酸片段，并且将衔接子连接到核酸片段的至少一个，其中Argonaute蛋白能够产生双链DNA断裂。

在一些实施方案中，该组5’磷酸化单链核酸包含与靶核酸的两个不同区域互补的5’磷酸化单链核酸。在一些实施方案中，靶核酸是双链DNA。在一些实施方案中，靶核酸是基因组DNA、染色体DNA、基因组或部分基因组。

在另一个方面，本文提供了一种用于对靶核酸测序的方法，所述方法包括：提供由一组5’磷酸化单链核酸编程的Argonaute蛋白的群体，其中该组5’磷酸化单链核酸包含与跨靶核酸的一系列不同区域互补的5’磷酸化单链核酸；使靶核酸与由该组5’磷酸化单链核酸编程的Argonaute蛋白的群体接触，以产生一系列核酸片段，并且对该系列的核酸片段测序。

在一些实施方案中，本文提供了一种用于对靶核酸测序的方法，所述方法包括：提供Argonaute蛋白的多于一个群体，Argonaute蛋白的每个群体由不同的一组5’磷酸化单链核酸编程，其中每组5’磷酸化单链核酸包含与跨靶核酸的不同系列的区域互补的5’磷酸化单链核酸，在单独的反应中使靶核酸与Argonaute蛋白的多于一个群体中的每一个群体接触以产生不同系列的核酸片段，并且对核酸片段测序。

在一些实施方案中，Argonaute蛋白的多于一个群体包括Argonaute蛋白的三个群体，并且其中由Argonaute蛋白的三个群体中的每一个群体产生的核酸片段包含与由Argonaute蛋白的三个群体中的至少另一个群体产生的核酸片段重叠的序列。在一些实施方案中，Argonaute蛋白能够产生双链DNA断裂。在一些实施方案中，靶核酸是双链DNA。在一些实施方案中，靶核酸是基因组DNA、染色体DNA、基因组或部分基因组。在一些实施方案中，方法还包括将衔接子连接到核酸片段。在一些实施方案中，本文提供的方法还包括将包含靶DNA的DNA样品稀释至单倍体含量(haploid content)。在一些实施方案中，对核酸片段测序包括使用合成测序、桥式PCR测序、链终止测序、杂交测序、纳米孔测序和连接测序中的一个或更多个。

本文还提供了以下项目：

1.一种用于扩增靶双链核酸的方法，所述方法包括：

(a)提供一种系统，所述系统具有：

5’磷酸化单链核酸或其衍生物，和

Argonaute蛋白或其变体，

其中所述5’磷酸化单链核酸或其衍生物包含与所述靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；

(b)使所述靶双链核酸与所述系统接触以形成复合物；

(c)使引物与所述靶双链核酸的第二链杂交，所述引物包含与所述靶双链核酸的所述第二链的一个区域互补的序列，以及

(d)使用聚合酶从所述引物延伸与所述靶双链核酸的所述第二链互补的核酸。

2.如项目1所述的方法，还包括重复步骤(a)至步骤(d)一次或更多次。

3.如项目1所述的方法，其中所述靶双链核酸被线性地扩增。

4.如项目1所述的方法，其中所述靶双链核酸被指数地扩增。

5.如项目1所述的方法，其中所述靶核酸是双链DNA(dsDNA)。

6.如项目1所述的方法，其中所述靶核酸是双链RNA(dsRNA)。

7.如项目1所述的方法，其中所述Argonaute蛋白是格氏嗜盐碱杆菌(Natronobacterium gregoryi)Argonaute(Ng Argonaute)。

8.如项目1所述的方法，其中所述5’磷酸化单链核酸是单链DNA。

9.如项目1所述的方法，其中所述5’磷酸化单链核酸是小于25个核苷酸的单链DNA。

10.如项目1所述的方法，其中所述靶双链核酸的所述第一链包含通用序列，并且其中所述5’磷酸化单链核酸或其衍生物包含与所述通用序列的一个区域互补的序列。

11.如项目10所述的方法，其中所述引物包含所述通用序列的一个区域的序列。

12.如项目1所述的方法，其中所述聚合酶是链置换聚合酶。

13.如项目12所述的方法，其中所述聚合酶选自由以下组成的组：Bst、Bsu和Phi29。

14.如项目1所述的方法，还包括：

在所述靶核酸和包含转移链的至少一种转座子末端组合物经历转座反应的条件下，将至少一种转座酶和所述至少一种转座子末端组合物应用于包含所述靶核酸的样品以产生混合物，其中所述靶核酸被片段化以产生多于一个靶核酸片段，以及

将通用引物序列掺入到所述多于一个靶核酸片段的每一个中，

其中所述5’磷酸化单链核酸或其衍生物包含与所述通用引物的一个区域互补的靶特异性核苷酸区域。

15.如项目14所述的方法，其中所述通用引物通过PCR反应被掺入到所述多于一个靶核酸片段中。

16.如项目14所述的方法，其中两种通用引物被掺入到所述多于一个靶核酸片段的每一个的两个末端中。

17.一种用于扩增靶双链核酸的方法，所述方法包括：

(a)提供第一系统，所述第一系统具有：

第一5’磷酸化单链核酸或其衍生物、以及

第一Argonaute蛋白或其变体，

其中所述第一5’磷酸化单链核酸或其衍生物包含与所述靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；

(b)提供第二系统，所述第二系统具有：

第二5’磷酸化单链核酸或其衍生物、以及

第二Argonaute蛋白或其变体，

其中所述第二5’磷酸化单链核酸或其衍生物包含与所述靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；

(c)使所述靶双链核酸与所述第一系统和所述第二系统接触；

(d)使第一引物与所述靶双链核酸的第二链杂交，所述第一引物包含与所述靶双链核酸的所述第二链的一个区域互补的序列，并且使第二引物与所述靶双链核酸的第一链杂交，所述第二引物包含与所述靶双链核酸的所述第一链的一个区域互补的序列，以及

(e)用一种或更多种聚合酶延伸所述第一引物和所述第二引物的3’末端，以产生第一双链靶核酸和第二双链靶核酸。

18.如项目17所述的方法，还包括重复步骤(a)至步骤(e)一次或更多次。

19.如项目17所述的方法，其中所述靶核酸是双链DNA(dsDNA)。

20.如项目17所述的方法，其中所述靶核酸是双链RNA(dsRNA)。

21.如项目17所述的方法，其中所述第一Argonaute蛋白和所述第二Argonaute蛋白是格氏嗜盐碱杆菌Argonaute(Ng Argonaute)。

22.如项目17所述的方法，其中所述第一5’磷酸化单链核酸和所述第二5’磷酸化单链核酸是单链DNA。

23.如项目17所述的方法，其中所述第一5’磷酸化单链核酸和所述第二5’磷酸化单链核酸是小于25个核苷酸的单链DNA。

24.如项目17所述的方法，其中：

所述靶双链核酸的所述第一链包含第一通用序列，并且其中所述第一系统的所述第一5’磷酸化单链核酸或其衍生物包含与所述第一通用序列的一个区域互补的序列，以及

所述靶双链核酸的所述第二链包含第二通用序列，并且其中所述第二系统的所述第二5’磷酸化单链核酸或其衍生物包含与所述第二通用序列的一个区域互补的序列。

25.如项目17所述的方法，其中所述第一引物包含所述第一通用序列的一个区域的序列，并且所述第二引物包含所述第二通用序列的一个区域的序列。

26.如项目17所述的方法，其中所述聚合酶是链置换聚合酶。

27.如项目26所述的方法，其中所述聚合酶选自由以下组成的组：Bst、Bsu和Phi29。

28.如项目1-27中任一项所述的方法，其中所述靶核酸是基因组DNA。

29.如项目1-27中任一项所述的方法，其中所述靶核酸包含染色体DNA或其片段。

30.如项目1-27中任一项所述的方法，其中所述靶核酸包括基因组或部分基因组。

附图简述

图1A示出了根据本方法设计的用于扩增DNA片段的引物，该引物包含Illumina通用测序引物衔接子P5和P7的全部或部分。引物可以使用Nextera(Illumina,Inc.)文库制备方法来添加。图1B阐释了使用靶向修饰的P5引物的crRNA的一轮Cas9介导的线性扩增。1B(I)描绘了具有适当的引物序列P5和P7的待扩增的DNA。与Cas9结合的靶向P5的指导RNA也显示为P5'。1B(II)示出了在指导RNA与第一链杂交之后由Cas9创建的R环。1B(III)阐释了固定的P5引物与置换的第二链杂交，随后是聚合酶延伸。1B(IV)示出了产生的被延伸的引物P5。产生的扩增子可以被Cas9+crRNA重新靶向，如步骤1B(II)中示出的。图1C阐释了使用靶向修饰的P7引物的crRNA的一轮Cas9介导的线性扩增。1C(I)描绘了具有适当的引物序列P5和P7的待扩增的DNA。与Cas9结合的靶向P7的指导RNA也显示为P7'。1C(II)示出了在指导RNA与第一链杂交之后由Cas9创建的R环。1C(III)阐释了固定的P7引物与置换的第二链杂交，随后是聚合酶延伸。1C(IV)示出了产生的被延伸的引物P7。产生的扩增子可以被Cas9+crRNA重新靶向，如步骤1C(II)中示出的。随着扩增子的两侧经历扩增(图1B和图1C)，可以实现指数扩增。

详细描述

本公开内容提供了用于使用CRISPR-Cas或Argonaute系统快速且有效富集或扩增靶核酸的方法。

目前的靶特异性富集方案要求在与探针靶特异性杂交之前制备单链核酸。在由本公开内容提供的各种优势中，本公开内容提供了富集方法，该富集方法可以首先略过产生单链核酸的步骤，并且能够直接靶向双链核酸，例如双链DNA(dsDNA)。相比于单链富集策略，直接靶向双链DNA(部分或完全的双链)的方法具有独特的优势。例如，单链基因组DNA与靶向区域的非特异性杂交降低了特异性，并且经常需要大量的严格洗涤步骤或其他耗时步骤；并且单链富集方案经常利用Cot-1或其他阻断DNA以减少非特异性杂交。根据双链DNA富集方案不需要这些添加物(additives)，降低了所需要的试剂的成本和数目两者。此外，从双链DNA制备测序文库比从单链DNA制备测序文库更容易。因此，双链DNA的富集允许文库制备(例如标签化)在富集之后发生。另举例，由于特异性(树状结构和非特异性杂交对双链DNA富集较不是问题)，与单链DNA富集方案相比，潜在地较大的DNA片段可以更好地特异性富集。如果人们在单体型分析(haplotyping)和组装的背景中考虑靶向测序，则这是特别重要的优势。此外，由于较长的DNA片段可以潜在地被富集，我们对在哪里设计靶探针具有较大的灵活性。例如，我们可以避免高多态性区域，但仍然捕获这些区域。此外，需要使用较少的探针来捕获较大的区域，降低捕获探针的成本和设计两者。

此外，目前的靶特异性杂交方案具有缓慢的动力学，并且通常需要高温。本公开内容提供了酶驱动的序列靶向方法，其提供更快速的富集动力学和更容易的富集工作流程。因为在本方法中与靶核酸的杂交是酶驱动的，所以该方法可以等温地发生。在一些实施方案中，本文的方法提供了在20℃-37℃DNA的等温靶向。此外，在本文的系统中指导RNA，例如crRNA，提供了序列特异性以及灵活的编程，其能够多重靶向富集(例如，用以多种方式(包括来自寡核苷酸库的IVT)制成的更多个探针靶向多个靶向区域)。

核酸扩增是许多基于核酸的方法例如下一代测序的一个步骤。目前，聚合酶链式反应(PCR)是用于例如检测和鉴定传染病、遗传紊乱和其他研究目的的DNA扩增的最广泛使用的方法。PCR反应典型地使用与双链体靶核酸序列的3’末端杂交的两个寡核苷酸引物和可以通过添加脱氧核糖核苷三磷酸(dNTP)来延伸退火的引物以产生双链核酸产物的DNA聚合酶。Gill和Ghaemi,Nucleosides,Nucleotides,and Nucleic Acids,2008,27:224-243。然而，PCR反应需要热循环以分离两条DNA链。类似地，许多目前使用的核酸扩增方法，例如在下一代测序中用于簇产生的那些，需要温度循环和流体交换两者。

已经开发了若干等温扩增方法，以消除温度斜坡和平衡时间，例如基于重组酶聚合酶扩增(RPA)的等温扩增、转录介导的扩增、基于核酸序列的扩增、信号介导的RNA扩增、链置换扩增、滚环扩增、环介导的DNA扩增、等温多重置换扩增、解旋酶依赖性扩增、单引物等温扩增和环状解旋酶依赖性扩增(circular helicase-dependent amplification)，如在Gill和Ghaemi，Nucleosides,Nucleotides,and Nucleic Acids,2008,27:224-243中描述的。

例如，在转录介导的扩增(TMA)中，RNA聚合酶用于由被工程化在引物区域中的启动子制备RNA，并且然后逆转录酶由该引物合成cDNA。然后，可以使用第三种酶，例如，RNA酶H，以降解来自cDNA的靶RNA而无需热变性步骤。这种扩增技术非常类似于自主维持序列复制(Self-Sustained Sequence Replication)(3SR)和基于核酸序列的扩增(NASBA)，但采用的酶不同。同上。另举例，解旋酶依赖性扩增(HDA)利用热稳定解旋酶(Tte-UvrD)而不加热来解开dsDNA以创建单链，然后单链可用于杂交和通过聚合酶延伸引物。已示出，扩增长度为70个-120个碱基对的产物的反应时间超过1小时。同上。又另举例，环介导的扩增(LAMP)采用具有链置换能力的热稳定聚合酶和一组四种或更多种特别设计的引物。每一种引物被设计为具有发夹末端，在被置换后扣成发夹(snap into a hairpin)以促进自引发和进一步的聚合酶延伸。在LAMP反应中，尽管反应在等温条件下进行，但双链靶需要初始热变性步骤。另外，扩增产生梯形模式的各种长度的产物。同上。又另举例，链置换扩增(SDA)结合了限制性内切核酸酶将其靶DNA的未修饰的链切口的能力与外切核酸酶缺陷型DNA聚合酶在切口处延伸3’末端并置换下游DNA链的能力。同上。其他示例性等温扩增方法包括，但不限于，在Craw和Balachandran，Lab Chip,2012,12：2469-2486中描述的那些。

然而，这些目前开发的等温扩增系统通常缺乏理想地适合于一些应用的期望的速度和效率。此外，一些系统需要另外的酶和试剂，包括ATP。因此，本领域对方便、快速和有效的等温核酸扩增方法仍存在需求。

本公开内容通过提供用于使用CRISPR-Cas系统或Argonaute系统富集或扩增核酸的方法来解决这一和其他需求。例如，由本方法提供的一个优势是，本文使用的系统例如Cas蛋白识别靶核酸而无需消耗ATP或能量投入，并且因此本文中的方法提供了成本和时间上有效的等温扩增方法。

本公开内容还提供了以较高的灵敏度和特异性用于富集和/或检测多核苷酸变体的方法。此外，本发明还提供了用于使用CRISPR-Cas或Argonaute系统靶向测序的方法。

定义

如本文使用的，术语“包括(includes)”、“包括(including)”、“包括(includes)”、“包括(including)”、“包含(contains)”、“包含(containing)”、“具有(have)”、“具有(having)”及其任何变化意图覆盖非排除性包含对象，使得包括(includes)、包括(includes)或包含(contains)一个要素或要素列表的所述及的工艺(process)、方法(method)、工艺限定的产品或组合物不仅包括那些要素，还可以包括未明确列出的其他要素或对于所述及的这样的工艺(process)、方法(method)、工艺限定的产品或组合物是固有的其他要素。

如本文使用的，除非上下文另外清楚地规定，否则单数形式"一(a)"、"一(an)"和"该(the)"包括复数指示物。因此，例如，提及“一种蛋白”包括两种或更多种蛋白的混合物等。

如本文使用的，术语“约”或“大约”意指在给定的值或范围的5％以内。

如本文使用的，术语“核酸”意指核苷酸单体的单链聚合物和双链聚合物，包括通过核苷酸间磷酸二酯键键合或核苷酸间类似物连接的2’-脱氧核糖核苷酸(DNA)和核糖核苷酸(RNA)，以及缔合的抗衡离子，例如H⁺、NH₄ ⁺、三烷基铵、四烷基铵、Mg²⁺、Na⁺等。核酸可以是多核苷酸或寡核苷酸。核酸可以完全由脱氧核糖核苷酸，完全由核糖核苷酸组成，或可以是其嵌合混合物。核苷酸单体单位可以包括本文描述的任何核苷酸，包括但不限于天然存在的核苷酸和核苷酸类似物。核酸的尺寸范围典型地从几个单体单元例如5个-40个至几千个单体核苷酸单元。核酸包括但不限于基因组DNA、cDNA、hnRNA、mRNA、rRNA、tRNA、片段化的核酸、从亚细胞细胞器例如线粒体或叶绿体获得的核酸、以及从可以存在于生物样品上或生物样品中的微生物或DNA或RNA病毒获得的核酸。

如本文使用的，术语“靶核酸”意图意指为分析或作用的目标物的核酸。分析或作用包括使核酸经历拷贝、扩增、测序和/或用于核酸询问(interrogation)的其他程序。靶核酸可以包括除了待分析的靶序列以外的核苷酸序列。例如，靶核酸可以包含一个或更多个衔接子，包括在待分析的靶核酸序列的侧翼作为引物结合位点发挥作用的衔接子。与捕获寡核苷酸或捕获引物杂交的靶核酸可以包含延伸超过捕获寡核苷酸的5'或3'末端的核苷酸，这样的方式并不是所有的靶核酸都适于延伸。

如本文使用的，当提及指导RNA或DNA、crRNA或其衍生物、5’磷酸化单链核酸、或其他核苷酸使用时，术语“靶特异性”意图意指这样的多核苷酸，其包含对靶多核苷酸序列特异性的核苷酸序列，即能够选择性退火至靶多核苷酸(例如，靶DNA)的识别区域的核苷酸序列。靶特异性核苷酸可以具有单一种类的寡核苷酸，或者靶特异性核苷酸可以包括具有不同序列的两个或更多个种类的寡核苷酸。因此，靶特异性核苷酸可以是两种或更多种序列，包括3种、4种、5种、6种、7种、8种、9种或10种或更多种不同的序列。在一个实施方案中，crRNA或其衍生物包含与靶DNA序列的一个区域互补的靶特异性核苷酸区域。在一个实施方案中，crRNA或其衍生物可以包含除靶特异性核苷酸区域以外的其他核苷酸序列。在一个实施方案中，其他核苷酸序列可以来自tracrRNA序列。在一个实施方案中，5’磷酸化单链核酸或其衍生物包含与靶DNA序列的一个区域互补的靶特异性核苷酸区域。在一个实施方案中，5’磷酸化单链核酸或其衍生物可以包含除靶特异性核苷酸区域以外的其他核苷酸序列。

如本文使用的，当提及多核苷酸使用时，术语“互补”意图意指包括能够在某些条件下选择性退火至靶多核苷酸的鉴定区域的核苷酸序列的多核苷酸。如本文使用的，术语“基本上互补”和语法等同物意图意指包括能够在某些条件下特异性退火至靶多核苷酸的鉴定区域的核苷酸序列的多核苷酸。退火指的是一种核酸与另一种核酸的核苷酸碱基配对相互作用，该相互作用导致形成双链体、三链体或其他更高等级的结构。通过沃森-克里克(Watson-Crick)和Hoogsteen型氢键键合，主要的相互作用典型地是核苷酸碱基特异性的，例如，A:T、A:U、和G:C。在某些实施方案中，碱基堆积和疏水相互作用还可以有助于双链体稳定性。多核苷酸与靶核酸的互补区域或基本上互补的区域退火的条件是本领域熟知的，例如，如在Nucleic Acid Hybridization,A Practical Approach,Hames和Higgins，编著，IRL Press,Washington,D.C.(1985)以及Wetmur和Davidson,Mol.Biol.31:349(1968)中描述的。退火条件将取决于特定应用，并且可以由本领域技术人员常规地确定，而无需过度的实验。

如本文使用的，术语“杂交”指的是两个单链多核苷酸非共价地结合以形成稳定的双链多核苷酸的过程。产生的双链多核苷酸是“杂交体(hybrid)”或“双链体”。杂交条件典型地将包括小于约1M，更通常地小于约500mM的盐浓度，并且可以是小于约200mM。杂交缓冲液包括缓冲盐溶液例如5％SSPE或本领域已知的其他这样的缓冲液。杂交温度可以低至5℃，但典型地大于22℃，并且更典型地大于约30℃，并且典型地超过37℃。杂交通常在严格条件，即探针将与其靶子序列杂交，但将不与其他非互补的序列杂交的条件下进行。严格条件是序列依赖性的，并且在不同情况下是不同的，并且可以由本领域技术人员常规地确定。

在“多核苷酸”的上下文中，如本文使用的术语“变体”和“衍生物”指的是这样的多核苷酸，其包含已经通过引入核苷酸取代、缺失或添加而改变的多核苷酸或多核苷酸的片段的核苷酸序列。多核苷酸的变体或衍生物可以是包含多核苷酸的核苷酸序列的一部分的融合多核苷酸。如本文使用的术语“变体”或“衍生物”还指的是例如，通过任何类型的分子与多核苷酸的共价附接而被化学修饰的多核苷酸或其片段。例如，但不限于，多核苷酸或其片段可以被化学修饰，例如通过乙酰化、磷酸化、甲基化等等。变体或衍生物被以在附接的分子的类型或位置不同于天然存在的或起始的核苷酸或多核苷酸的方式被修饰。变体或衍生物还包括天然存在于核苷酸或多核苷酸上的一个或更多个化学基团的缺失。多核苷酸或多核苷酸片段的变体或衍生物可以使用本领域技术人员已知的技术，包括，但不限于特异性化学切割、乙酰化、甲酰化等等通过化学修饰而化学修饰。此外，多核苷酸或多核苷酸片段的变体或衍生物可以包含一个或更多个dNTP或核苷酸类似物。多核苷酸变体或衍生物可以具有与本文描述的多核苷酸或多核苷酸片段类似的或相同的功能。与本文描述的多核苷酸或多核苷酸片段相比，多核苷酸变体或衍生物可以具有另外的或不同的功能。

如本文使用的，术语“dNTP”指的是脱氧核苷三磷酸。NTP指的是核糖核苷三磷酸，例如用于合成crRNA或tracrRNA的那些。嘌呤碱基(Pu)包括腺嘌呤(A)、鸟嘌呤(G)及其衍生物和类似物。嘧啶碱基(Py)包括胞嘧啶(C)、胸腺嘧啶(T)、尿嘧啶(U)及其衍生物和类似物。通过说明而非限制的方式，这样的衍生物或类似物的实例是用报告物基团修饰的、生物素化的、胺修饰的、放射性标记的、烷基化等修饰的那些衍生物或类似物，并且还包括硫代磷酸酯、亚磷酸酯、环原子修饰的衍生物等。报告物基团可以是荧光基团例如荧光素、化学发光基团例如鲁米诺、铽螯合物例如能够通过延迟荧光检测的N-(羟乙基)乙二胺三乙酸等。

如本文使用的，术语“核苷酸类似物”指的是具有修饰的核苷酸碱基部分、修饰的戊糖部分和/或修饰的磷酸酯部分的合成类似物，并且在多核苷酸的情况下，修饰的核苷酸间键合，如其他地方通常描述的(例如，Scheit,Nucleotide Analogs,John Wiley,NewYork,1980；Englisch,Angew.Chem.Int.Ed.Engl.30:613-29,1991；Agarwal,Protocolsfor Polynucleotides and Analogs,Humana Press,1994；以及S.Verma和F.Eckstein,Ann.Rev.Biochem.67:99-134,1998)。示例性磷酸酯类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、phosphoroanilothioate、phosphoranilidate、氨基磷酸酯(phosphoramidate)、二羟硼基磷酸酯(boronophosphate)，包括缔合的抗衡离子，例如H⁺、NH₄ ⁺、Na⁺(如果存在这样的抗衡离子)。示例性修饰的核苷酸碱基部分包括但不限于5-甲基胞嘧啶(5mC)；C-5-丙炔基类似物，包括但不限于C-5丙炔基-C和C-5丙炔基-U；2,6-二氨基嘌呤，也被称为2-氨基腺嘌呤或2-氨基-dA；次黄嘌呤、假尿苷、2-硫代嘧啶(2-thiopyrimidine)、异胞嘧啶(isoC)、5-甲基isoC和异鸟嘌呤(isoG；参见，例如，美国专利第5,432,272号)。示例性修饰的戊糖部分包括但不限于，锁核酸(LNA)类似物包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA、和T-LNA(参见，例如，The Glen Report,16(2):5,2003；Koshkin等人，Tetrahedron 54:3607-30,1998)和2’-或3’-修饰，其中2’-位或3’-位是氢、羟基、烷氧基(例如，甲氧基、乙氧基、烯丙氧基(allyloxy)、异丙氧基、丁氧基、异丁氧基(isobutoxy)和苯氧基)、叠氮基、氨基、烷基氨基、氟代、氯代或溴代。修饰的核苷酸间键合包括磷酸酯类似物，具有非手性和不带电荷的亚基间键合的类似物(例如，Sterchak,E.P.等人，Organic Chern.,52:4202,1987)和具有非手性亚基间键合的不带电荷的基于吗啉的聚合物(参见，例如，美国专利第5,034,506号)。一些核苷酸间键合类似物包括morpholidate、缩醛和聚酰胺连接的杂环。

如本文使用的术语“聚合酶链式反应”或“PCR”指的是其中少量核酸例如，RNA和/或DNA被扩增的程序，如例如在属于Mullis的美国专利第4,683,195号中描述的。通常，来自感兴趣的区域末端或以外的序列信息需要是可获得的，使得可以设计寡核苷酸引物；这些引物在序列上将与待扩增的模板的相对链相同或类似。两种引物的5’末端核苷酸可以与扩增的材料的末端一致。PCR可以用于扩增特定RNA序列、来自总基因组DNA的特定DNA序列、以及从总细胞RNA转录的cDNA、噬菌体或质粒序列等等。通常参见Mullis等人，Cold SpringHarbor Symp.Quant.Biol.,51:263(1987)；Erlich,编著,PCR Technology,(StocktonPress,NY,1989)。

如本文使用的，术语“连接(ligation)”、“连接(ligating)”及其语法等同物意图意指典型地在模板驱动反应中在两个或更多个核酸(例如，寡核苷酸和/或多核苷酸)的末端之间形成共价键或键合。键或键合的性质可以广泛变化，并且连接可以通过酶法或化学法进行。如本文使用的，连接通常通过酶法进行以在一个寡核苷酸的5’碳末端核苷酸与另一个核苷酸的3'碳之间形成磷酸二酯键合。模板驱动的连接反应在以下参考文献中被描述：美国专利第4,883,750号；第5,476,930号；第5,593,826号；和第5,871,921号，通过引用以其整体并入本文。术语“连接”还涵盖磷酸二酯键的非酶促形成、以及寡核苷酸的末端之间的非磷酸二酯共价键的形成，例如硫代磷酸酯键、二硫键等。

如本文使用的，术语“衔接子”是可以与其他核酸的末端连接的单链核酸分子或双链核酸分子。在一个实施方案中，衔接子是短的化学合成的可以用于连接两个其他核酸分子的末端的双链核酸分子。在一个实施方案中，衔接子是在5’末端和/或3’末端包含单链核苷酸突出端的双链核酸(例如寡核苷酸)。在一些实施方案中，单链突出端是1个、2个或更多个核苷酸。在一些实施方案中，衔接子包含用于克隆或分析“插入物(inserts)”的另外的核酸序列。在一些实施方案中，衔接子包括用于分析或纯化“插入物”的标记物或亲和标签。术语“插入物”指的是感兴趣的核酸序列。在一些实施方案中，插入物是在5’末端和/或3’末端包含单链核苷酸突出端的双链DNA。在一些实施方案中，单链突出端是1个、2个或更多个核苷酸。

如本文使用的，术语“CRISPR-Cas系统”指的是包括指导RNA序列和具有核酸酶活性的蛋白质的酶系统，所述指导RNA序列包含与靶多核苷酸的一个区域互补或基本上互补的核苷酸序列。CRISPR-Cas系统包括I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统及其衍生物。CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包含工程化的和/或突变的Cas蛋白。CRISPR-Cas系统可以包含工程化的和/或编程的指导RNA。

如本文使用的，术语“Argonaute系统”指的是包括指导核酸和Argonaute家族蛋白或其变体的酶系统，所述指导核酸包含与靶多核苷酸的一个区域互补或基本上互补的核苷酸序列，例如指导DNA。Argonaute系统包括源自天然存在的Argonaute系统的工程化的和/或编程的核酸酶系统。Argonaute系统可以包含工程化的和/或突变的Argonaute蛋白。Argonaute系统可以包含工程化的和/或编程的指导DNA。

如本文使用的，术语“指导RNA”指的是包含与靶DNA序列的一个区域互补或基本上互补的序列的RNA。指导RNA可以包含除了与靶DNA序列的一个区域互补或基本上互补的区域以外的核苷酸序列。指导RNA可以是crRNA或其衍生物，例如，crRNA：tracrRNA嵌合体。

如本文使用的，术语“指导DNA”指的是包含与靶DNA序列的一个区域互补或基本上互补的序列的DNA。指导DNA可以包含除了与靶DNA序列的一个区域互补或基本上互补的区域以外的核苷酸序列。

如本文使用的，术语“核酸酶”指的是能够切割核酸的核苷酸亚基之间的磷酸二酯键的酶；术语“内切核酸酶”指的是能够切割多核苷酸链内的磷酸二酯键的酶；并且术语“切口酶”指的是仅切割DNA双链体的单链的内切核酸酶。术语“Cas9切口酶”指的是典型地通过使Cas9蛋白的一个核酸酶结构域失活源自Cas9蛋白的切口酶。

在多肽的上下文中，如本文使用的术语“变体”和“衍生物”指的是包含已经通过引入氨基酸残基取代、缺失或添加而改变的多肽或多肽片段的氨基酸序列的多肽。多肽的变体或衍生物可以是包含多肽的氨基酸序列的一部分的融合蛋白。如本文使用的术语“变体”或“衍生物”还指的是例如，已经通过任何类型的分子与多肽的共价附接而化学修饰的多肽或多肽片段。例如，但非限制性地，多肽或多肽片段可以被化学修饰，例如，通过糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化，通过已知保护/封闭基团的衍生化、蛋白水解切割、与细胞配体或其他蛋白键合等等。变体或衍生物以在附接的分子的类型或位置上不同于天然存在的或起始的肽或多肽的方式被修饰。变体或衍生物还包括天然存在于肽或多肽上的一个或更多个化学基团的缺失。多肽或多肽片段的变体或衍生物可以使用本领域技术人员已知的技术通过化学修饰被化学修饰，本领域技术人员已知的技术包括，但不限于特异性化学切割、乙酰化、甲酰化、衣霉素的代谢合成等等。此外，多肽或多肽片段的变体或衍生物可以包含一种或更多种非经典的氨基酸。多肽变体或衍生物可以具有与本文描述的多肽或多肽片段类似的或相同的功能。与本文描述的多肽或多肽片段相比，多肽变体或衍生物可以具有另外的或不同的功能。

如本文使用的，术语“检测”核酸分子或其片段指的是典型地当核酸分子或其片段与样品或组合物的其他组分已经完全或部分分离时，确定核酸分子的存在，并且还可以包括确定核酸分子或其片段的荷质比(charge-to-mass ratio)、质量、量、吸光度、荧光或其他性质。

如本文使用的，术语“引物”指的是当被置于引物延伸(不限于延伸碱基的数目)被启动的条件下时能够充当核酸合成的起始点的天然的或合成的寡核苷酸引物。引物可以是单链寡脱氧核糖核苷酸。引物的长度可以在从约10个至约50个核苷酸的范围内，例如10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或约50个核苷酸。引物不需要反映模板的准确序列，但必须充分互补，以与模板杂交，用于引物延伸发生。如果期望，可以通过例如光谱学、光化学、生物化学、免疫化学或化学手段通过掺入可检测的标记物来标记引物。示例性标记物包括，但不限于生物素、胺、放射性标记物(例如，32P)、荧光染料、电子致密试剂、酶(通常用于ELISA)或生物素。

如本文使用的，术语“线性扩增”指的是使用多个循环的引物延伸反应扩增靶核酸的扩增过程。随着线性扩增，转录物的丰度随循环数目成比例增加并且线性放大。线性扩增程序的实例是LCR、上文的Phillips和Eberwine的aRNA方法、以及本文描述的线性扩增方法。与指数扩增不同，扩增产物的量不呈指数增长。例如，在拷贝率是2000个拷贝/分钟的理想的4小时线性扩增反应中，2000个拷贝的模板DNA将产生960,000,000个拷贝。

如本文使用的，术语“指数扩增”指的是其中产物(即，扩增子)随每个反应循环加倍的扩增程序。“指数扩增”是非线性扩增，其导致存在的核酸拷贝的数目呈指数增长。例如，当在一个扩增循环中引物延伸起始于扩增子的两端时，指数扩增可以发生。例如，PCR是指数扩增程序。例如，在具有30个循环的理想PCR反应中，2个拷贝的模板DNA将产生2^30或1,073,741,824个拷贝。

如本文使用的，在富集靶多核苷酸的上下文中，术语“富集(enrich)”、“富集(enriching)”或“富集(enrichment)”指的是在多核苷酸群体中产生较高百分比的靶多核苷酸的过程。在一个实施方案中，百分比增加约5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％。在一个实施方案中，百分比增加约2倍、5倍、10倍、50倍或100倍。在一个实施方案中，靶多核苷酸基本上从多核苷酸群体中分离。

如本文使用的，术语“聚合酶”指的是能够催化核苷酸的特异性掺入以针对核酸靶序列延伸引物分子(诸如例如，模板寡核苷酸)的3’羟基末端的蛋白。聚合酶可以是例如嗜热的，使得其在升高的反应温度是有活性的。例如，它还可以具有链置换能力。

如本文使用的，术语“单核苷酸多态性(SNP)”指的是当基因组(或其他共有序列)中的单个核苷酸—A、T、C或G在物种的成员之间(或在个体中的成对染色体之间)不同时，发生的DNA序列变异。

如本文使用的，术语“单核苷酸变体(SNV)”指的是一种基因型或多核苷酸，其包括单核苷酸多态性(SNP)或点突变位点。

如本文使用的，术语“受试者”和“患者”可互换地使用。如本文使用的，受试者优选地是哺乳动物，例如非灵长类动物(例如牛、猪、马、猫、狗、大鼠等)或灵长类动物(例如猴子和人类)。在特定的实施方案中，受试者是人类。在一个实施方案中，受试者是具有癌症的哺乳动物(例如人类)。

如本文使用的，术语“单体型(haplotype)”、“单倍体基因型”以及本文中的其他语法等同物指的是存在于单个母系或父系染色体上的通常作为单元遗传的一组核苷酸序列多态性或等位基因。

如本文使用的，当在基因组或染色体的上下文中使用时，术语“分相测序”、“单体型测序”和其他语法等同物分别指的是确定单个基因组或单个染色体的核酸序列，其中核酸序列从单个基因组或单个染色体的测序获得。当在染色体片段的上下文中使用时，术语“分相测序”、“单体型测序”和其他语法等同物指的是确定单个染色体片段的核酸序列，其中核酸序列从单个染色体片段的测序获得。

用于扩增多核苷酸的方法

本文提供了用于核酸酶系统介导的扩增，例如CRISPR-Cas介导的扩增和Argonaute介导的扩增的方法。

在一个方面，本公开内容提供了一种用于CRISPR-Cas系统介导的扩增的方法。在另一个方面，本公开内容提供了一种用于Argonaute介导的扩增的方法。本文提供的方法部分地基于：指导核酸(例如指导RNA或指导DNA)与靶双链核酸的一个区域的结合破坏靶核酸的两条链之间的相互作用，并且从而创建环结构(也被称为“R环”)，暴露与指导核酸不互补的链。该暴露的链可以经历与引物杂交，用于例如，在核酸扩增过程中通过适当的聚合酶延伸。如实施例1中阐释的，由CRISPR-Cas系统(例如包含Cas9或级联蛋白的系统)创建的该环结构可以被其他酶接近。因此，环结构还可以用作模板以启动引物杂交并且与聚合酶相互作用以用于扩增。

在一些实施方案中，本公开内容提供了一种用于扩增靶双链核酸的方法，所述方法包括提供一种系统，所述系统具有：成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及CRISPR相关(Cas)蛋白或其变体，其中crRNA或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；使靶双链核酸与系统接触以形成复合物；使引物与靶双链核酸的第二链杂交，所述引物包含与靶双链核酸的第二链的一个区域互补的序列，以及使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。

在其他实施方案中，本公开内容提供了一种用于扩增靶双链核酸的方法，所述方法包括提供一种系统，所述系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；使靶双链核酸与系统接触以形成复合物；使引物与靶双链核酸的第二链杂交，所述引物包含与靶双链核酸的第二链的一个区域互补的序列，以及使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。

本文提供的方法可以用于多种扩增方法，包括但不限于，线性核酸扩增和指数核酸扩增。

在一些实施方案中，靶核酸根据本文提供的方法被线性地扩增。例如，在一些实施方案中，本文提供的方法还包括重复以下一次或更多次，例如直至实现期望的扩增量：使引物与靶双链核酸的第二链杂交，并且使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。

在其他实施方案中，靶核酸被指数地扩增。在示例性指数核酸扩增中，产物(即，扩增子)随每个反应循环加倍。“指数扩增”是非线性扩增，其导致存在的核酸拷贝的数目呈指数增长。典型地，在指数扩增中，引物延伸(或拷贝)从扩增子的两端发生。为了确保新创建的链在两个末端具有引物结合位点，在指数扩增中，新合成的核酸的3’末端包含引物的反向互补物，并且模板的末端通常在每一个扩增循环中被拷贝。

根据本方法的反应的循环数目取决于应用和期望的扩增产物的量。在一些实施方案中，循环数目是5至100。在一些实施方案中，循环数目是10至90。在一些实施方案中，循环数目是20至80。在一些实施方案中，循环数目是30至70。在一些实施方案中，循环数目是40至60。示例性循环数目包括10、15、20、25、30、35、40、45和50。循环不需要在扩增子之间同步，因为它们处于其中通过改变温度来控制每个循环的起始的PCR反应中。因此，如本文使用的循环指的是扩增子经历的扩增的轮的平均数目。

在一些实施方案中，初始化步骤包括向靶核酸提供多个CRISPR-Cas系统或多个Argonaute系统，以在两个或更多个靶向序列处打开双链核酸结构并形成两个或更多个R环结构。初始化步骤不需要如PCR反应中需要的加热反应，因为该初始化步骤是酶驱动的。根据本方法的下一步骤涉及提供靶向R环区域的引物并退火引物以形成相对稳定的核酸-核酸相互作用，例如，DNA-DNA杂交体。典型地，当引物序列具有模板序列的基本互补性时，稳定的核酸-核酸杂交体形成。然后一种或更多种聚合酶结合引物-模板杂交体，并且在延伸(extension)/延长(elongation)步骤中开始核酸合成。在一些实施方案中，该延伸/延长步骤的温度取决于所使用的聚合酶。在该步骤时，通过添加与模板互补的dNTP，聚合酶合成与模板链互补的新的核酸链。在一些实施方案中，当使用DNA聚合酶时，反应将dNTP的5’-磷酸基团与新生(延伸的)DNA链的末端处的3’-羟基基团缩合。延伸时间取决于所使用的聚合酶和待扩增的核酸片段的长度两者。这些步骤中的一个或更多个可以重复一次或更多次，例如，直至实现期望的扩增量。

为了允许扩增产物的指数生长，在每个循环中新创建的核酸产物在两个末端包含引物结合位点是有益的。在一些实施方案中，新合成的分子的3’末端是引物的反向互补物。在一些实施方案中，各自靶向靶核酸的一个末端的两种引物可以用于指数扩增。在一些实施方案中，引物以这样的方式设计还是有益的：引物可以被本文提供的CRISPR-Cas系统靶向-即引物可以被CRISPR-Cas系统的指导RNA，例如，crRNA靶向使得CRISPR-Cas系统可以被重复地用于结合靶核酸以启动新一轮扩增。类似地，在一些实施方案中，引物以这样的方式设计还是有益的：引物可以被本文提供的Argonaute系统靶向-即引物可以被Argonaute系统的5’磷酸化单链核酸(指导核酸)，例如，gDNA靶向，使得Argonaute系统可以被重复地用于结合靶核酸以启动新一轮扩增。

因此，在一些实施方案中，两个或更多个CRISPR-Cas系统或Argonaute系统用于启动引物在靶核酸的两个末端处结合。

在一些实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供第一系统，所述第一系统具有：第一成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第一CRISPR相关(Cas)蛋白或其变体，其中第一crRNA或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)提供第二系统，所述第二系统具有：第二成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第二CRISPR相关(Cas)蛋白或其变体，其中第二crRNA或其衍生物包含与靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；(c)使靶双链核酸与第一系统和第二系统接触；(d)使第一引物与靶双链核酸的第二链杂交，第一引物包含与靶双链核酸的第二链的一个区域互补的序列，并且使第二引物与靶双链核酸的第一链杂交，第二引物包含与靶双链核酸的第一链的一个区域互补的序列，和(e)用一种或更多种聚合酶延伸第一引物和第二引物的3’末端，以产生第一双链靶核酸和第二双链靶核酸。在一些实施方案中，引物杂交和通过聚合酶的延伸步骤被重复一次或更多次，例如，直至达到期望的扩增程度。

在其他实施方案中，本文提供了一种用于扩增靶双链核酸的方法，所述方法包括：(a)提供第一系统，所述第一系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；(b)提供第二系统，所述第二系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；(c)使靶双链核酸与第一系统和第二系统接触；(d)使第一引物与靶双链核酸的第二链杂交，第一引物包含与靶双链核酸的第二链的一个区域互补的序列，并且使第二引物与靶双链核酸的第一链杂交，第二引物包含与靶双链核酸的第一链的一个区域互补的序列，和(e)用一种或更多种聚合酶延伸第一引物和第二引物的3’末端，以产生第一双链靶核酸和第二双链靶核酸。在一些实施方案中，本文提供的方法还包括重复步骤(a)至步骤(e)一次或更多次，例如，直至达到期望的扩增程度。

在其他实施方案中，本文提供的方法用于多重扩增。如本文使用的，术语“多重扩增”指的是多于一个感兴趣的核酸的扩增，例如来自同一样品的多个序列的扩增。术语“多重扩增”还指的是同时或以逐步的方式扩增存在于多个样品中的一个或更多个序列。因此，在一些实施方案中，两种或更多种靶核酸序列在扩增反应中扩增，并且扩增反应包含适当的模板和酶以扩增至少两种靶核酸序列。本文提供的多重扩增的一个应用是检测样品中的两种或更多种靶序列，因为多重扩增能够扩增两种或更多种靶序列。当靶序列中仅一种实际上存在于被测试的样品中时，多重扩增的结果可以是对存在的仅一种序列的扩增。多重扩增可以利用相同的引物对来扩增一种或更多种间插(intervening)扩增子序列。可选择地，多重扩增可以利用一个或更多个引物对。

在一些实施方案中，本文提供的双链核酸是双链DNA。在其他实施方案中，本文提供的双链核酸是双链RNA。在一些实施方案中，靶核酸是基因组DNA。在其他实施方案中，靶核酸包含染色体DNA或其片段。在又其他实施方案中，靶核酸包括基因组或部分基因组。

在一些实施方案中，本文提供的系统源自CRISPR-Cas系统。CRISPR-Cas系统通常可以分类为三种主要类型(I型-III型)，其基于核心元件含量和序列被进一步细分为十个亚型(Makarova等人，2011,Nat Rev Microbiol 9:467-77)。这些CRISPR-Cas系统的两个关键元件是Cas蛋白和CRISPR RNA(crRNA)。crRNA由散布着源自侵入物DNA的间隔区序列的短重复序列组成。Cas蛋白具有多种活性，例如核酸酶活性。因此，CRISPR-Cas系统提供了用于靶向特定序列以及对该序列的某些酶活性的机制。

典型的I型CRISPR-Cas系统包含具有独立的解旋酶和DNA酶活性的Cas3蛋白。例如，在I-E型系统中，crRNA被掺入到称为级联体的多亚基效应复合物(用于抗病毒防御的CRISPR相关复合物)(Brouns等人，2008,Science 321:960-4)，其结合靶DNA并通过Cas3蛋白触发降解(Sinkunas等人，2011,EMBO J 30:1335-1342；Beloglazova等人，2011,EMBO J30:616-627)。

II型CRISPR-Cas系统包括特征(signature)Cas9蛋白，一种能够产生crRNA并切割靶DNA的单一蛋白(约160KDa)。Cas9蛋白典型地包含两个核酸酶结构域，氨基末端附近的RuvC样核酸酶结构域和蛋白中间附近的HNH(或McrA样)核酸酶结构域。Cas9蛋白的每一个核酸酶结构域专门用于切割双螺旋的一条链(Jinek等人，2012,Science 337(6096):816-821)。

III型CRISPR-Cas系统包含聚合酶和RAMP模块。III型系统可以被进一步分为III-A亚型和III-B亚型。已经示出III-A型CRISPR-Cas系统靶向质粒，并且III-A型系统的聚合酶样蛋白参与靶DNA的切割(Marraffini和Sontheimer,2008,Science 322:1843-1845)。还已经示出III-B型CRISPR-Cas系统靶向RNA(Hale等人，2009,Cell 139:945-956)。

因此，在一些实施方案中，系统是I型CRISPR-Cas系统或其衍生物。在其他实施方案中，系统是II型CRISPR-Cas系统或其衍生物。在又其他实施方案中，系统是III型CRISPR-Cas系统或其衍生物。

CRISPR-Cas系统的关键元件包括指导RNA，例如crRNA和Cas蛋白。crRNA或其衍生物包含与靶核酸的一个区域互补或基本上互补的靶特异性核苷酸区域。在一些实施方案中，crRNA或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的20个-50个核苷酸。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的小于20个核苷酸。示例性用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、或19个核苷酸。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域100％的碱基对匹配。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域90％-100％、80％-100％、或70％-100％的碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在三个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在四个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在五个碱基对错配。

在一些实施方案中，本文提供的系统还包括反式作用crRNA(tracrRNA)或其衍生物。

本文提供的CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包含工程化的和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化的和/或编程的指导RNA。在一些实施方案中，本文提供的crRNA或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。嵌合的单一指导RNA(sgRNA)在Jinek等人，2012,Science 337,816-821中被描述，其以其整体并入本文。在一个实施方案中，本文提供的Cas蛋白或其变体可以通过嵌合sgRNA被引导至后面是5’-NGG前间区相邻基序(PAM)的任何基因组基因座。例如，在一些实施方案中，使用包含T7启动子的合成双链DNA模板，通过体外转录合成crRNA和tracrRNA。tracrRNA具有固定的序列，而靶序列规定crRNA序列的一部分。将等摩尔浓度的crRNA和tracrRNA混合并在55℃加热持续30秒。在37℃以相同的摩尔浓度添加Cas9，并且与RNA混合物一起孵育持续10分钟。然后将10倍-20倍摩尔过量的Cas9复合物添加至靶DNA中。结合反应可以在15分钟内发生。

在一些实施方案中，Cas蛋白或其变体是Cas9蛋白或其变体。来自嗜热链球菌(S.Thermophilus)CRISPR-Cas系统的分离的Cas9-crRNA复合物以及由单独的组分体外组装的复合物证明，它与携带与crRNA互补的核苷酸序列的合成的寡脱氧核苷酸和质粒DNA两者结合。已经示出Cas9具有两个核酸酶结构域-RuvC-和HNH-活性位点/核酸酶结构域，并且这两个核酸酶结构域负责切割相对的DNA链。在一些实施方案中，Cas9蛋白源自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些实施方案中，Cas9蛋白是具有约1,409个氨基酸残基的多结构域蛋白。

在一些实施方案中，Cas9蛋白或其变体是Cas9蛋白的无核酸酶变体(nuclease-null variant)，其中RuvC-和HNH-活性位点/核酸酶结构域两者被突变。Cas9蛋白的无核酸酶变体与双链DNA结合，但不切割DNA，并且因此其也可以用于靶特异性DNA富集。在一些实施方案中，Cas9蛋白具有两个失活的核酸酶结构域，所述两个失活的核酸酶结构域具有切割与crRNA互补的链的结构域中的第一突变以及切割与crRNA不互补的链的结构域中的第二突变。在一些实施方案中，Cas9蛋白具有第一突变D10A和第二突变H840A。

在一些实施方案中，Cas蛋白或其变体是级联蛋白或其变体。大肠杆菌中(E.coli)中的级联复合物以序列特异性方式识别双链DNA(dsDNA)靶。大肠杆菌级联复合物是包含五个功能必需的CRISPR相关(Cas)蛋白(CasA1B2C6D1E1，也被称为级联蛋白)和61个核苷酸的crRNA的405-kDa复合物。crRNA通过与互补DNA链形成碱基对来将级联复核物指导至dsDNA靶序列，同时置换非互补链以形成R环。级联体识别靶DNA而不消耗ATP，这表明持续的侵入物DNA监视在没有能量投入的情况下发生。Matthijs等人，Nature Structural&MolecularBiology,2011,18,529-536。

在一些实施方案中，Cas蛋白或其变体是Cas3蛋白或其变体。大肠杆菌Cas3可以催化RNA与DNA的ATP非依赖性退火，形成R环以及RNA碱基配对到双链体DNA的杂交体。Cas3蛋白可以使用比Cas9的gRNA长的gRNA。Howard等人，Biochem J.,2011,439(1):85-95。这样的较长的RNA可以允许其他元件更容易地接近靶DNA，例如，接近待被聚合酶延伸的引物。Cas3蛋白提供的另一个优势是，Cas3蛋白不像Cas9需要PAM序列，因此为靶向期望的序列提供了更多的灵活性。通过Cas3形成R环可能需要镁作为辅因子。Howard等人，Biochem J.,2011,439(1):85-95。因此，在一些实施方案中，本文提供的系统还包括镁。

应该理解，可以在本方法中使用能够破坏双链核酸并创建环结构的任何CRISPR-Cas系统。例如，本文提供的Cas蛋白可以包括但不限于，在Haft等人，PLoS Comput Biol.,2005,1(6):e60,和Zhang等人，Nucl.Acids Res.,2013,10.1093/nar/gkt1262中描述的Cas蛋白。这些CRISPR-Cas系统中的一些要求，针对这些CRISPR-Cas系统存在识别和结合靶序列的特定序列。例如，Cas9要求存在5’-NGG前间区相邻基序(PAM)。因此，在一些实施方案中，PAM序列或与PAM序列互补的序列被工程化到靶核酸中，用于启动CRISPR-Cas系统与靶核酸的结合。

在其他实施方案中，本文提供的系统源自Argonaute系统。Argonaute蛋白家族首先在遗传上被发现，并且在植物中被首次鉴定。成员由PAZ(Piwi-Argonaute-Zwille)和PIWI结构域的存在来定义。Argonaute蛋白在物种之间高度保守，并且许多生物体编码该家族的多个成员。Argonaute基因的数目在从裂殖酵母粟酒裂殖酵母(Schizosaccharomycespombe)中的1个至线虫蠕虫秀丽隐杆线虫(Caenorhabditis elegans)中的27个的范围内。在哺乳动物中，存在八个Argonaute基因。Argonaute蛋白家族可以分为Ago亚家族和Piwi亚家族。在迄今为止调查的大多数生物体，包括果蝇、斑马鱼和小鼠中，Piwi蛋白的表达限于种系，在种系中，Piwi蛋白与Piwi相互作用蛋白(piRNA)结合。相比之下，Ago蛋白在许多生物体中普遍表达。人类Ago1、Ago3和Ago4基因簇集在第1号染色体上，而Ago2基因位于第8号染色体。人类Piwi亚家族包括HIWI1、HIWI2、HIWI3和HILI；它们分别由第12号染色体、第11号染色体、第22号染色体和第8号染色体上的基因编码。示出了Argonaute蛋白家族的成员是由小RNA指导的基因沉默途径中的关键角色。小RNA，例如短干扰RNA(siRNA)、微小RNA(miRNA)或Piwi相互作用RNA(piRNA)被锚定在特定的结合口袋中，并且指导Argonaute蛋白靶向mRNA分子以用于沉默或破坏。Hock和Meister,Genome Biol,.2008,9(2):210。最近，还示出了，某些Argonaute蛋白由小DNA指导用于进行DNA切割。参见例如，Gao等人,naturebiotechnology,2016,doi:10.1038/nbt.3547。因此，Argonaute系统提供了用于靶向特定序列以及对该序列的某些酶活性的机制。

因此，在一些实施方案中，系统是Ago亚家族系统或其衍生物。在其他实施方案中，系统是Piwi亚家族系统或其衍生物。在一些特定的实施方案中，Argonaute蛋白是格氏嗜盐碱杆菌Argonaute(Ng Argonaute)或其变体。

Argonaute系统的关键元件包括指导核酸，例如5’磷酸化单链核酸。5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补或基本上互补的靶特异性核苷酸区域。在一些实施方案中，5’磷酸化单链核酸或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的DNA序列。在一些实施方案中，用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的20个-50个核苷酸。在一些实施方案中，5’磷酸化单链核酸是小于100个核苷酸的用户可选择的单链DNA序列。在一些实施方案中，5’磷酸化单链核酸是小于50个核苷酸的单链DNA。在一些实施方案中，5’磷酸化单链核酸是小于25个核苷酸的单链DNA。单链DNA的示例性长度包括10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个和50个核苷酸。在一些实施方案中，用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的小于20个核苷酸。示例性用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、或19个核苷酸。

在一些实施方案中，5’磷酸化单链核酸的靶特异性核苷酸区域具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，5’磷酸化单链核酸的靶特异性核苷酸区域具有与靶核酸的一个区域90％-100％、80％-100％、或70％-100％碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在5’磷酸化单链核酸的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个碱基对错配。在一些实施方案中，在5’磷酸化单链核酸的靶特异性核苷酸区域和靶核酸的一个区域之间存在三个碱基对错配。在一些实施方案中，在5’磷酸化单链核酸的靶特异性核苷酸区域和靶核酸的一个区域之间存在四个碱基对错配。在一些实施方案中，在5’磷酸化单链核酸的靶特异性核苷酸区域和靶核酸的一个区域之间存在五个碱基对错配。

本文提供的Argonaute系统包括源自天然存在的Argonaute系统的工程化的和/或编程的核酸酶系统。Argonaute系统可以包含工程化的和/或突变的Argonaute蛋白。Argonaute系统还可以包含工程化的和/或编程的指导核酸。在一些实施方案中，Argonaute蛋白或其变体被工程化以去除内切核酸酶活性，使得Argonaute系统不会产生双链DNA断裂或单链DNA断裂。在其他实施方案中，Argonaute蛋白或其变体被工程化以能够产生单链DNA断裂。

应该理解，可以在本方法中使用能够通过指导核酸结合核酸或破坏双链核酸并创建环结构的任何Argonaute系统。

在一些实施方案中，本文提供的引物是单链寡脱氧核糖核苷酸。在一些实施方案中，引物长度在从约10个至约50个核苷酸的范围。本文提供的引物的示例性长度是10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、或50个核苷酸。

在一些实施方案中，本文提供的引物具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，本文提供的引物具有与靶核酸的一个区域90％-100％、80％-100％、或70％-100％碱基对匹配。在一些实施方案中，在引物和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在引物和靶核酸的一个区域之间存在两个碱基对错配。在一些实施方案中，在引物和靶核酸的一个区域之间存在三个碱基对错配。在一些实施方案中，在引物和靶核酸的一个区域之间存在四个碱基对错配。在一些实施方案中，在引物和靶核酸的一个区域之间存在五个碱基对错配。

在一些实施方案中，本文提供的引物被标记，例如，用于扩增产物的富集或检测。在一些实施方案中，本文提供的引物被标记用于通过光谱学、光化学、生物化学、免疫化学或化学手段检测。在一些实施方案中，引物用生物素、胺、放射性标记物(例如，32P)、荧光染料、电子致密试剂、酶(通常用于ELISA)或生物素来标记。

在一些实施方案中，本文提供的聚合酶催化核苷酸的掺入以使引物分子的3’羟基末端相对于核酸靶序列延伸。在一些实施方案中，通过本文提供的聚合酶的反应在等温条件进行。在一些实施方案中，聚合酶是链置换聚合酶。示例性聚合酶包括但不限于Bst DNA聚合酶、9°Nm DNA聚合酶、Phi29 DNA聚合酶、DNA聚合酶I(大肠杆菌)、DNA聚合酶I(大片段(Large))m、(Klenow)片段、Klenow片段(3’-5‘外切-(exo-))、T4 DNA聚合酶、T7 DNA聚合酶、Deep VentR^TM(外切-)DNA聚合酶、Deep VentR^TMDNA聚合酶、DyNAzyme^TMEXT DNA、DyNAzyme^TMII热启动DNA聚合酶、Phusion^TM高保真DNA聚合酶、Therminator^TMDNA聚合酶、Therminator TM II DNA聚合酶、

DNA聚合酶、/>

(外切-)DNA聚合酶、RepliPHI^TMPhi29 DNA聚合酶、rBst DNA聚合酶、rBst DNA聚合酶(大片段)、Fragment(IsoTherm ^TM DNA聚合酶)、MasterAmp^TMAmpliTherm ^TM DNA聚合酶、Taq DNA聚合酶、TthDNA聚合酶、Tfl DNA聚合酶、Tgo DNA聚合酶、SP6 DNA聚合酶、Tbr DNA聚合酶、DNA聚合酶β和ThermoPhi DNA聚合酶。在一些实施方案中，聚合酶选自由以下组成的组：Bst、Bsu和Phi29。当聚合酶延伸杂交链时，包括单链结合蛋白(SSB)可以是有益的。SSB可以稳定置换的(非模板)链。因此，在一些实施方案中，本文提供的方法还可以包括SSB蛋白。

如讨论的，通过本文提供的线性扩增或指数扩增提供的一个优势是，可以在恒定温度或等温条件下进行扩增。如本文使用的，术语“恒定温度”、“等温条件”或“等温地”指的是在扩增反应过程期间反应温度被保持基本恒定的一组反应条件。然而，不必将温度精确地维持在一个温度。如果用于维持升高温度的设备允许反应混合物的温度变化几度，这对扩增反应无害，并且仍然可以被认为是等温反应。在一些实施方案中，扩增反应在20℃至70℃之间的恒定温度运行。在一些实施方案中，扩增反应在25℃至60℃之间的恒定温度运行。在一些实施方案中，扩增反应在40℃至55℃之间的恒定温度运行。在一些实施方案中，扩增反应在30℃至40℃之间的恒定温度运行。示例性扩增反应温度包括30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃和60℃。在一个实施方案中，扩增反应温度是约37℃。

在一些实施方案中，扩增反应运行的时间可以从例如1分钟至数小时变化，直至实现期望的扩增量。在一些实施方案中，扩增反应的时间是5分钟至1小时。扩增反应的示例性时间包括5分钟、10分钟、15分钟、20分钟、30分钟、40分钟、50分钟和60分钟。

在一些实施方案中，本方法可以用于其中期望检测和/或定量扩增的核酸产物的某些应用中。扩增的靶序列可以通过本领域普通技术人员已知的任何方法来检测。

在一些实施方案中，特异性染色双链DNA的染料可以用于检测或定量扩增产物。在一些实施方案中，嵌入染料在结合至DNA或RNA后展现出增强的荧光。在一些实施方案中，染料可以是，例如DNA或RNA嵌入荧光团。示例性DNA或RNA嵌入荧光团包括但不限于吖啶橙、溴化乙锭、Hoechst染料、PicoGreen、碘化丙啶、SYBR I(不对称花青染料)、SYBR II、TOTO(噻唑橙二聚体)和YOYO(噁唑黄二聚体)。

在一些实施方案中，具有特定尺寸的扩增产物可以通过凝胶电泳来检测。在一些实施方案中，扩增反应中使用的核苷酸可以用例如生物素标记。生物素标记的扩增序列可以使用与信号产生酶(例如过氧化物酶)结合的抗生物素蛋白来捕获。

在一些实施方案中，标记的核苷酸可以被直接掺入到靶序列或掺入到包含感兴趣的靶的互补序列的引物中。这样的标记物本质上可以是放射性的和/或荧光的，并且可以以本文讨论的任何方式来分辨。

检测和/或连续监测核酸产物扩增的方法也是本领域技术人员熟知的。例如，在一些实施方案中，靶核酸和核酸序列的产生或存在可以由分子信标(Molecular Beacon)来检测和监测。分子信标是包含在一端上的荧光团和在相对端上的猝灭染料的发夹形寡核苷酸。发夹的环包含与靶序列互补的探针序列，而茎通过位于探针序列任一侧上的互补臂序列的退火形成。当分子信标遇到靶分子时，杂交发生；环结构被转化为稳定的更为刚性的构象，引起荧光团和猝灭物分子的分离，产生荧光。Tyagi等人，Nature Biotechnology,1996,303-308。因此，荧光的产生指示预期的扩增产物的合成。另举例，在一些实施方案中，靶核酸和核酸序列的产生或存在可以通过荧光共振能量转移(FRET)来检测和监测。例如在DNA-DNA相互作用中，FRET是定量分子动力学的有用工具。为了监测特定产物的产生，探针可以在一个末端上用供体分子而在另一个末端上用受体分子标记。探针-靶杂交导致供体和受体的距离或取向变化，并且观察到FRET变化。Lakowicz,“Principles of FluorescenceSpectroscopy,”Plenum Publishing Corporation,第2版(1999年7月1日)。用于检测和/或连续监测核酸产物扩增的其他示例性方法包括但不限于如本领域技术人员已知的质谱、毛细管凝胶电泳、测序和多种表面捕获方法。在一些实施方案中，以不对称量的引物运行扩增反应(即，一种引物以比另一种高的浓度存在)将允许以偏向一条链的扩增。过量的单链可以促进通过如检测ssDNA的分子信标的这样的方式的检测。

本文提供的扩增方法可以用于多种应用。例如，在一些实施方案中，本文提供的方法可以用于通过选择性扩增特定的DNA区域来从基因组DNA分离DNA片段。

另举例，在一些实施方案中，本文提供的扩增方法可以用于基于与特定疾病相关的靶核酸的产生或存在来诊断多种疾病。在一些实施方案中，本文提供的方法可以用于早期诊断恶性疾病例如白血病和淋巴瘤。在其他实施方案中，本文提供的方法可以直接用于基因组DNA样品，以扩增和检测易位特异性恶性细胞。

在其他实施方案中，本文提供的方法可以用于诊断传染病，包括由细菌或病毒引起的传染病。例如，本方法可以用于检测感染原(infectious agent)，并通过特定核酸序列区分非致病菌株与致病菌株。在一些实施方案中，本文提供的扩增方法可以扩增和鉴定来自组织培养测定和动物模型的不可培养或缓慢生长的微生物，例如分枝杆菌(mycobacteria)、厌氧细菌或病毒。在其他实施方案中，本文提供的扩增方法可以扩增和鉴定来自个体的样品中的病毒DNA。

在又其他实施方案中，本扩增方法可以用于产生核酸材料以增强其他程序。例如，在一些实施方案中，本扩增方法可以用于产生用于要求相对较大量的代表特定DNA区域的DNA的DNA杂交或RNA杂交和DNA克隆的杂交探针。另举例，本文提供的方法可以用于核酸测序。

在特定的实施方案中，本文提供的CRISPR-Cas或Argonaute介导的核酸扩增方法可以用于扩增例如，使用文库制备方法和/或从Illumina,Inc.(San Diego,CA)购得的试剂盒产生的核酸片段文库。

在一些实施方案中，本文提供的方法可以用于扩增由基因组DNA产生的核酸片段文库。在特定的实施方案中，使用标签化(tagmentation)产生核酸片段文库。在特定的实施方案中，使用Illumina的Nextera文库制备方法和试剂盒(从Illumina,Inc,San Diego,CA购得)由基因组DNA产生核酸片段文库。

因此，在一些实施方案中，本文提供的方法还包括：在靶核酸和包含转移链的至少一种转座子末端组合物经历转座反应的条件下，将至少一种转座酶和所述至少一种转座子末端组合物应用于包含靶核酸的样品以产生混合物，其中靶核酸被片段化以产生多于一个靶核酸片段，并且因此将通用引物序列掺入到多于一个靶核酸片段的每一个中，其中核酸酶系统中的指导核酸，例如crRNA或其衍生物或5’磷酸化单链核酸包含与通用引物的一个区域互补的靶特异性核苷酸区域。

在一些实施方案中，靶核酸经历转座酶介导的标签化，所述标签化导致靶核酸的片段化，以及衔接子与双链DNA片段的两条链的5'末端的连接。任选地，使用如在美国公布第2010/0120098号(其通过引用以其整体并入本文)中描述的标签化或转座可以将靶核酸片段化，并将衔接子添加至5’末端和3’末端。简言之，“转座反应”是其中一个或更多个转座子在随机位点处被插入到靶核酸中的反应。转座反应中的基本组分是转座酶和展现转座子的核苷酸序列的DNA寡核苷酸(包括转移的转座子序列及其互补物(未转移的转座子末端序列))以及形成功能性转座复合物或转座体复合物需要的其他组分。DNA寡核苷酸还可以根据需要或期望包含另外的序列(例如衔接子或引物序列)。适合于在本文提供的方法中使用的示例性转座复合物包括，但不限于，由超活性Tn5转座酶和Tn5型转座子末端形成的那些、或由MuA转座酶和包含R1和R2末端序列的Mu转座子末端形成的那些(参见，例如，Goryshin和Reznikoff,J.Biol.Chem.273:7367,1998；和Mizuuchi,Cell 35:785,1983；Savilahti等人,EMBO J.14:4893,1995；以上文献通过引用以其整体并入本文)。然而，能够将转座子末端以足够的效率插入至标签靶核酸用于其预期的目的的任何转座系统可以用于所提供的方法中。可以用于所提供的方法中的已知转座系统的其他实例包括，但不限于，金黄色葡萄球菌(Staphylococcus aureus)Tn552、Tyl、转座子Tn7、Tn/O和IS10、Mariner转座酶、Tel、P元件、Tn3、细菌插入序列、逆转录病毒和酵母的逆转录转座子(参见，例如，Colegio等人，2001，J.Bacteriol.183:2384-8；kirby等人，2002,Mol.Microbiol.43:173-86；Devine和Boeke,1994,Nucleic Acids Res.,22:3765-72；国际专利申请第WO 95/23875号；Craig，1996，Science 271：1512；Craig,1996,综述于：Curr Top Microbiol Immunol.204:27-48；Kleckner等人，1996,Curr Top Microbiol Immunol.204:49-82；Lampe等人，1996,EMBOJ.15:5470-9；Plasterk,1996,Curr Top Microbiol Immunol 204:125-43；Gloor,2004,Methods Mol.Biol.260:97-114；Ichikawa和Ohtsubo,1990,J Biol.Chem.265:18829-32；Ohtsubo和Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26；Brown等人，1989,ProcNatl Acad Sci USA 86:2525-9；Boeke和Corces,1989,Annu Rev Microbiol.43:403-34；以上文献通过引用以其整体并入本文)。在一些实施方案中，本公开内容的方法还包括去除转座酶，并通过PCR添加至衔接的DNA片段的末端。

如本文使用的术语“标签化(tagmentation)”、“标签化(tagment)”或“标签化(tagmenting)”指的是在溶液中将核酸(例如，DNA)转化为衔接子修饰的模板，准备用于通过使用转座酶介导的片段化和加标签进行簇形成和测序。该方法经常涉及通过包含与包含转座子末端序列的衔接子复合的转座酶的转座体复合物来修饰核酸。标签化导致同时地核酸片段化和衔接子与双链体片段的两条链的5’末端的连接。在纯化步骤去除转座酶之后，另外的序列通过PCR被添加至衔接的片段的末端。

如本文使用的术语“转座体复合物”指的是与双链核酸非共价地结合的转座酶。例如，复合物可以是在支持非共价复合物形成的条件下与双链转座子DNA一起预孵育的转座酶。双链转座子DNA可以包括但不限于Tn5DNA、Tn5 DNA的部分、转座子末端组合物、转座子末端组合物或能够与转座酶例如超活性Tn5转座酶相互作用的其他双链DNA的混合物。

“转座酶”意指这样的酶，其能够与包含转座子末端的组合物(例如，转座子、转座子末端、转座子末端组合物)形成功能性复合物，且例如能够在体外转座反应中催化包含转座子末端的组合物插入或转座到与其一起孵育的双链靶核酸。如本文呈现的转座酶还可以包括来自逆转录转座子和逆转录病毒的整合酶。转座酶、转座体和转座体复合物通常是本领域技术人员已知的，如由US 2010/0120098的公开内容所示例的，其内容通过引用以其整体并入本文。尽管本文描述的许多实施方案涉及Tn5转座酶和/或超活性Tn5转座酶，但将理解，能够为了其预期的目的以足够的效率将转座子末端插入到5’-标签并片段化靶核酸的任何转座系统可以用于本发明。在特定的实施方案中，优选的转座系统能够以随机或几乎随机的方式将转座子末端插入到5’-标签并片段化靶核酸。

如本文使用的，术语“转座反应”指的是其中一个或更多个转座子在例如随机位点或几乎随机位点处被插入到靶核酸中的反应。转座反应中的基本组分是转座酶和展现转座子的核苷酸序列的DNA寡核苷酸(包括转移的转座子序列及其互补物(未转移的转座子末端序列))以及形成功能性转座复合物或转座体复合物需要的其他组分。DNA寡核苷酸还可以根据需要或期望包含另外的序列(例如衔接子或引物序列)。在一些实施方案中，本文提供的方法通过采用由超活性Tn5转座酶和Tn5型转座子末端形成的转座复合物(Goryshin和Reznikoff,1998,J.Biol.Chem.,273:7367)或由MuA转座酶和包含R1和R2末端序列的Mu转座子末端形成的转座复合物(Mizuuchi,1983,Cell,35:785；Savilahti等人，1995,EMBOJ.,14:4893)来例示。然而，能够为了其预期的目的将转座子末端以随机或几乎随机的方式以足够的效率插入到5’标签并片段化靶DNA的任何转座系统可以用于本发明。本领域已知的可以用于本方法的转座系统的实例包括但不限于金黄色葡萄球菌Tn552(Colegio等人，2001,J Bacterid.,183:2384-8；Kirby等人，2002,MoI Microbiol,43:173-86)、TyI(Devine和Boeke,1994,Nucleic Acids Res.,22:3765-72和国际专利申请第WO 95/23875号)、转座子Tn7(Craig,1996,Science.271:1512；Craig,1996,综述于：Curr TopMicrobiol Immunol,204:27-48)、TnIO和ISlO(Kleckner等人，1996,Curr Top MicrobiolImmunol,204:49-82)、Mariner转座酶(Lampe等人，1996,EMBO J.,15:5470-9)、Tci(Plasterk,1996,Curr Top Microbiol Immunol,204:125-43)、P元件(Gloor,2004,Methods MoI Biol,260:97-114)、TnJ(Ichikawa和Ohtsubo,1990,JBiol Chem.265:18829-32)、细菌插入序列(Ohtsubo和Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26)、逆转录病毒(Brown等人，1989,Proc Natl Acad Sci USA,86:2525-9)和酵母的逆转录转座子(Boeke和Corces,1989,Annu Rev Microbiol.43:403-34)。用于将转座子末端插入到靶序列中的方法可以使用任何合适的转座子系统在体外进行，对于所述合适的转座子系统存在可用的合适的体外转座系统或所述合适的转座子系统可以基于本领域的知识开发。通常，用于本文提供的方法的合适的体外转座系统最少要求：具有足够纯度、足够浓度和足够的体外转座活性的转座酶；以及转座酶与其一起形成功能性复合物的转座子末端，所述功能性复合物具有各自的能够催化转座反应的转座酶。可以用于本发明的合适的转座酶转座子末端序列包括但不限制于，与转座酶形成复合物的野生型转座子末端序列、衍生的转座子末端序列或突变的转座子末端序列，所述转座酶选自野生型转座酶、衍生形式的转座酶、或突变形式的转座酶中。

术语“转座子末端”(TE)指的是仅展现对于与在体外转座反应中为功能性的转座酶或整合酶形成复合物为必要的核苷酸序列(“转座子末端序列”)的双链核酸，例如，双链DNA。在一些实施方案中，转座子末端能够在转座反应中与转座酶形成功能性复合物。作为非限制性实例，转座子末端可以包括19-bp外末端(“OE”)转座子末端、内末端(“IE”)转座子末端、或被野生型或突变Tn5转座酶识别的“马赛克(mosaic)末端”(“ME”)转座子末端、或如在US 2010/0120098的公开内容中阐述的R1和R2转座子末端，该文献的内容通过引用以其整体并入本文。转座子末端可以包括适合于在体外转座反应中与转座酶或整合酶形成功能性复合物的任何核酸或核酸类似物。例如，转座子末端可以包括DNA、RNA、修饰的碱基、非天然碱基、修饰的骨架，并且可以在一条或两条链中包含切口。尽管术语“DNA”在本公开内容中有时与转座子末端的组合物相连使用，但应理解任何合适的核酸或核酸类似物可以在转座子末端中被利用。

通过体外转座反应，靶核酸片段被在5'末端加标签。在一些实施方案中，本文提供的方法还包括将3’末端标签掺入到5'加标签的核酸片段以制备加双标签的核酸片段的文库的步骤。添加3’末端标签可以通过多种方法进行，例如如在WO 2010/048605中描述的通过使用DNA聚合酶、末端转移酶和/或连接酶进行，该文献的内容通过引用以其整体并入。

在一些实施方案中，加双标签的核酸片段通过使用具有链置换或5’核酸酶活性的聚合酶例如DNA聚合酶来产生。在一些实施方案中，本文提供的方法包括：在无热循环且其中退火的5’加标签的核酸片段不变性的条件下，将退火的5’加标签的核酸片段的群体与具有链置换或5’核酸酶活性的DNA聚合酶一起孵育，其中DNA聚合酶使用互补链作为模板延伸退火的5’加标签的核酸片段的每一条链的3’末端，并置换或消化非转移链，从而产生加双标签的双链DNA片段的文库。

在其他实施方案中，在其中末端转移酶将第二标签连接至5’加标签的核酸片段的3’末端的条件下，将5’加标签的核酸片段与由末端转移酶组成的DNA聚合酶和该末端转移酶的至少一种底物一起孵育并持续足够的时间，从而产生加双标签的核酸片段的文库。在一些实施方案中，构成转座子末端组合物的非转移的转座子末端的3'末端被封闭(例如，通过使用具有双脱氧核苷酸或3'-O-甲基核苷酸作为3'末端核苷酸的非转移的转座子末端)。

在又其他实施方案中，加双标签的核酸片段通过使用模板依赖性连接酶和连接加标签寡核苷酸来产生。在一些实施方案中，在其中第二标签被连接至退火的5’加标签的DNA片段的条件下，将5’加标签的核酸片段与模板依赖性DNA连接酶和具有3’部分和5’部分的连接加标签寡脱氧核苷酸一起孵育并持续足够的时间，从而产生包括退火的加双标签的DNA片段的DNA片段的文库，其中3’部分展现第二标签，所述第二标签展现被期望连接至5'加标签的DNA片段的3'末端的任何序列，并且5'部分具有5'单磷酸酯基团并展现随机序列。

在一些实施方案中，产生的核酸片段在核酸片段的两个末端处包含通用序列。例如在文库中，在核酸片段的两个末端处的通用序列可以根据本文提供的方法被CRISPR-Cas系统或Argonaute系统靶向，并且如此，这样的片段可以例如在簇形成反应中被扩增。

这样的通用序列可以通过PCR或Nextera转座子反应被引入到文库中核酸片段的两个末端。在一些实施方案中，在产生加标签的核酸片段的文库之后，加标签的核酸片段可以例如使用有限循环聚合酶链式反应(PCR)来扩增，以引入其他末端序列或衔接子，例如索引物(index)、通用引物以及簇形成和测序所需的其他序列。在特定的实施方案中，进行有限循环PCR扩增以将索引物1(P7)和索引物2(P5)(从Illumina,Inc,San Diego,CA购得)添加至核酸片段的两个末端。

在一些实施方案中，对5’加标签的核酸片段的文库进行这样的扩增。在一些实施方案中，对加双标签的核酸片段的文库进行这样的扩增。示例性扩增方法包括：聚合酶链式反应(PCR)、链置换扩增反应、滚环扩增反应、连接酶链式反应、转录介导的扩增反应和环介导的扩增反应。

在一些实施方案中，本文提供的方法包括使用PCR扩增加双标签的核酸片段的文库。在一些实施方案中，本文提供的方法包括使用本文提供的Cas9或Argonaute介导的扩增方法扩增加双标签的核酸片段的文库。在一些实施方案中，本文提供的方法使用单引物PCR扩增加双标签的DNA片段的文库。在一些实施方案中，扩增加双标签的DNA片段的步骤包括使用DNA聚合酶和与第二标签互补的至少一种引物。在一些实施方案中，扩增加双标签的DNA片段的文库的步骤包括通过使用展现转移链的至少一部分的序列的仅一种寡脱氧核糖核苷酸作为PCR引物并使用加双标签的DNA片段作为模板的PCR来扩增加标签的DNA片段的文库。在一些实施方案中，引物包含5'部分，所述5'部分包含另外的序列，例如衔接子序列。

在一些实施方案中，使用两种不同的PCR引物，每一种PCR引物展现构成转座子末端组合物的转移的转座子末端的至少一部分的序列。在一些实施方案中，每种PCR引物包含3’部分和5’部分，其中3’部分展现各个转移的转座子末端序列，并且5’部分展现用于特定目的的各个标签结构域或衔接子(例如，用于下一代测序或扩增的测序标签结构域/衔接子或扩增标签结构域/衔接子，和任选地寻址标签结构域/衔接子)的序列。例如，当在体外转座反应中使用单一转座子末端组合物以使用具有链置换或5’核酸酶活性的DNA聚合酶产生加双标签的DNA片段的文库时，加双标签的DNA片段可以使用两种不同的PCR引物通过PCR来扩增。每种PCR引物包含3’部分和5’部分，其中3’部分展现各个转移的转座子末端序列，并且5’部分展现用于特定目的的各个标签结构域/衔接子(例如，用于下一代测序或扩增的测序标签结构域/衔接子或扩增标签结构域/衔接子，和任选地寻址标签结构域/衔接子)的序列。在一些实施方案中，每种PCR引物的5’部分不同于另一种引物的5’部分，并且如此PCR产物的两个末端的序列不同。例如，一个末端包含一种索引物和/或通用引物序列，并且另一个末端包含不同的索引物和/或通用引物序列。

在一些实施方案中，加双标签的核酸片段的两个末端源自两个不同的转移链序列。例如，在一些实施方案中，在体外转座反应中可以使用两种不同的转座体，并且两种转座体中的每一种包含相同的转座酶但不同的转座子末端组合物。在一些实施方案中，使用两种不同的转座体，并且两种不同的转座体各自包含相同的转座酶而转座子末端组合物包含不同的转移链。在一些实施方案中，使用两种不同的转座体，并且两种转座体中的每一种包含不同的转座酶和不同的转座子末端组合物，所述不同的转座子末端组合物中的每一种与各自的转座酶形成功能性复合物。在一些实施方案中，其中在体外转座反应中使用两种不同的转座子末端组合物，并且加双标签的单链核酸片段的文库使用具有链置换或5’核酸酶活性的DNA聚合酶来产生，第一标签展现一种转座子末端组合物的转移链的序列并且第二标签展现另一种转座子末端组合物的非转移链的序列。

在上文提及的实施方案和其中两种不同的转移链被连接至双链核酸的每一条相对链的5’末端的其他实施方案中，本文提供的方法还可以包括使用两种不同的PCR引物通过PCR扩增加双标签的核酸片段的步骤。PCR引物中的一种展现构成一种转座子末端组合物的一条转移链的至少一部分的序列，而PCR引物中的另一种展现构成另一种转座子末端组合物的另一条转移链的至少一部分的序列。

在其中使用两种引物的一些实施方案中，每种PCR引物包含3’部分和5’部分，其中3’部分展现各个转移的转座子末端序列，并且5’部分展现用于特定目的的各个标签结构域/衔接子(例如，用于下一代测序或扩增的测序标签结构域或扩增标签结构域，和任选地寻址标签结构域)的序列。在一些实施方案中，每种PCR引物的5’部分不同于另一种引物的5’部分，并且如此将不同的序列引入至PCR产物的两个末端。在一些实施方案中，第一PCR引物的5’部分或第二PCR引物的5’部分，或第一PCR引物和第二PCR引物两者的5’部分分别包含第一测序标签/衔接子或第二测序标签/衔接子，用于针对特定的测序平台产生用于下一代测序的模板(例如，用于Illumina Nextera测序平台的测序标签)。在一些实施方案中，第一PCR引物的5’部分或第二PCR引物的5’部分另外地包含寻址标签结构域/衔接子或用于特定目的的另一种标签结构域/衔接子。

各种各样的酶和试剂盒可用于通过PCR进行扩增反应，如本领域技术人员已知的。例如，在一些实施方案中，使用来自EPICENTRE Biotechnologies,Madison,WI的FAILSAFE^TMPCR系统或MASTERAMP^TMExtra-Long PCR系统，如制造商描述的进行PCR扩增。然而，本公开内容不限于使用那些产品或条件用于扩增反应，而可以使用允许在退火至靶序列的引物和退火至转座子的引物之间的序列扩增的任何合适的热稳定DNA聚合酶和反应混合物。

本文提供的方法不限于使用PCR来扩增加标签的核酸片段的文库。扩增同一序列并产生用于预期目的的合适的组成和量的扩增产物的任何合适的扩增方法(例如，滚环扩增、riboprimer扩增(例如美国专利第7,413,857号)、ICAN、UCAN、ribospia、末端加标签(美国专利申请第20050153333号)、Eberwine型aRNA扩增或链置换扩增)可以用于本发明的实施方案中。例如，可以使用的一些链置换方法在以下中被描述：Takara Shuzo Company,Kyoto,Japan的PCT专利公布第WO 02/16639号；第WO 00/56877号；和第AU 00/29742号；Becton Dickinson and Company的美国专利第5,523,204号；第5,536,649号；第5,624,825号；第5,631,147号；第5,648,211号；第5,733,752号；第5,744,311号；第5,756,702号；和第5,916,779号；Nanogen/Becton Dickinson Partnership的美国专利第6,238,868号；第6,309,833号；和第6,326,173号；Bio Merieux的美国专利第5,849,547号；第5,874,260号；和第6,218,151号；Gen-Probe,Inc.的美国专利第5,786,183号；第6,087,133号；和第6,214,587号；Wick等人的美国专利第6,063,604号；Kurn的美国专利第6,251,639号；EikenKagaku Kabushiki Kaishi,Tokyo,Japan的美国专利第6,410,278号；和PCT公布第WO 00/28082号；Auerbach的美国专利第5,591,609号；第5,614,389号；第5,773,733号；第5,834,202号；和第6,448,017号；以及Lizardi的美国专利第6,124,120号；和第6,280,949号。在一些实施方案中，本文提供的Cas介导的扩增用于扩增靶核酸片段的文库。

在一些实施方案中，当靶核酸具有例如，如使用上文提供的方法产生的通用引物序列时，指导RNA，例如crRNA可以靶向文库中核酸片段的通用引物序列，使得等温扩增核酸片段的文库。

图1A-图1C阐释了一种根据本公开内容扩增由Nextera文库制品(从Illumina,Inc.,San Diego,CA购得)产生的核酸片段的方法。在一些实施方案中，本文提供的Cas蛋白需要PAM序列以便识别靶。例如，Cas9蛋白需要与靶序列相邻的基序NGG的序列。与PAM序列互补的序列可以被掺入到被添加至文库插入物的流通池(flowcell)引物(例如，P5和P7)以产生能够靶向包含PAM的序列的PAM修饰的P5和P7引物。标准通用引物P5和P7的序列示于图1A中(SEQ ID No.1和SEQ ID No.2)。PAM修饰的引物P5和P7的序列也示于图1A中(SEQ IDNo.3和SEQ ID No.4)。因此，在一些实施方案中，PAM修饰的引物P5和P7被添加至文库中的核酸片段。在特定的实施方案中，使用有限循环PCR将PAM修饰的引物P5和P7添加至核酸片段中。

如图1B-图1C中示出的，DNA片段(例如溶液中的Nextera扩增子)在扩增子的末端包含P5和P7引物序列(SEQ ID No.1和SEQ ID No.2)。添加包含靶向P5引物序列的一个区域的SEQ ID No.7的指导RNA的CRISPR-Cas9系统(参见图1B)和包含靶向P7引物序列的一个区域的SEQ ID No.8的指导RNA的CRISPR-Cas9系统(参见图1C)。CRISPR-Cas9系统打开双链DNA的一些区域，通过使crRNA与引物序列结合，在DNA片段的两个末端附近创建R环结构。然后可以使用截短的PAM修饰的P5和P7引物(SEQ ID No.5和SEQ ID No.6)来扩增DNA片段。

因此，在一些实施方案中，靶双链核酸的第一链包含通用序列，并且其中crRNA或其衍生物包含与通用序列的一个区域互补的序列。在一些实施方案中，引物包含通用序列的一个区域的序列。

在一些实施方案中，通用引物具有SEQ ID No.3的序列。在一些实施方案中，crRNA包含SEQ ID No.7的序列。在一些实施方案中，引物包含SEQ ID No.5的序列。

在一些实施方案中，通用引物序列具有SEQ ID No.4的序列。在一些实施方案中，crRNA包含SEQ ID No.8的序列。在一些实施方案中，引物包含SEQ ID No.6的序列。

在一些实施方案中，靶双链核酸的第一链包含第一通用序列，并且其中第一系统的crRNA或其衍生物包含与第一通用序列的一个区域互补的序列，并且靶双链核酸的第二链包含第二通用序列，并且其中第二系统的crRNA或其衍生物包含与第二通用序列的一个区域互补的序列。在一些实施方案中，第一引物包含第一通用序列的一个区域的序列，并且第二引物包含第二通用序列的一个区域的序列。在特定的实施方案中，第一通用序列具有SEQ ID No.3的序列，第一系统的crRNA或其衍生物包含SEQ IDNo.7的序列，且第一引物包含SEQ ID No.5的序列，并且第二通用序列具有SEQ ID No.4的序列，第二系统的crRNA或其衍生物包含SEQ ID No.8的序列，且第二引物包含SEQ ID No.6的序列。

本文提供的方法可以用于等温扩增以用于例如，在由Illumina，Inc.(San Diego,CA)开发的簇扩增中测序。在一些实施方案中，本方法的靶核酸可以被固定在表面上以用于扩增。例如，在一些实施方案中，固定的核酸片段使用簇扩增方法来扩增，如由美国专利第7,985,565号和第7,115,400号的公开内容例示的，其每一个的内容通过引用以其整体并入本文。美国专利第7,985,565号和第7,115,400号的并入的材料描述了固相核酸扩增的方法，其允许扩增产物被固定在固体支持物上，以便形成包括固定的核酸分子的簇或“集群(colonies)”的阵列。在这样的阵列上的每一个簇或集群由多于一个相同的固定的多核苷酸链和多于一个相同的固定的互补多核苷酸链形成。如此形成的阵列在本文中通常被称为“成簇的阵列”。固相扩增反应例如在美国专利第7,985,565号和第7,115,400号中描述的那些反应的产物是通过成对的固定的多核苷酸链和固定的互补的链的退火形成的所谓的“桥式”结构，两条链在5’末端优选地经由共价附接被固定在固体支持物上。簇扩增方法是其中固定的核酸模板被用来产生固定的扩增子的方法的实例。其他合适的方法也可以用于从根据本文提供的方法产生的固定的核酸片段产生固定的扩增子。例如，无论每一对扩增引物中的一个或两个引物是否被固定，一个或更多个簇或集群可以经由固相PCR来形成。

如本文使用的，本文中的术语“固体表面”、“固体支持物”和其他语法等同物指的是适于或可以被修饰以适于附接多核苷酸的任何材料。可能的基底包括但不限于：玻璃和修饰的或功能化的玻璃、塑料(包括丙烯酸树脂、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、Teflon^TM等等)、多糖、尼龙或硝酸纤维素、陶瓷、树脂、二氧化硅或基于二氧化硅的材料，包括硅和改性的硅、碳、金属、无机玻璃、塑料、光学纤维束、和很多其他聚合物。在一些实施方案中，固体支持物和固体表面位于流通池装置内。在一些实施方案中，固体支持物包括适合于以有序的模式固定分子的模式化的表面。“模式化的表面”指的是不同区域在固体支持物的暴露层中或暴露层上的排列。在一些实施方案中，固体支持物包括表面中的孔或凹的阵列。固体支持物的组成和几何结构可以随其使用而变化。在一些实施方案中，固体支持物是平面结构，例如载玻片、芯片、微芯片和/或阵列。如此，基底的表面可以呈平面层的形式。在一些实施方案中，固体支持物包括流通池的一个或更多个表面。如本文使用的术语“流通池”指的是包含固体表面的室，一种或更多种流体试剂可以流动穿过所述室。可以在本公开内容的方法中容易地使用的流通池和相关流体系统和检测平台的实例在以下中被描述：例如Bentley等人,Nature 456:53-59(2008)；WO 04/018497；US 7,057,026；WO 91/06678；WO 07/123744；US 7,329,492；US 7,211,414；US 7,315,019；US 7,405,281和US 2008/0108082，其每一个通过引用并入本文。在一些实施方案中，固体支持物或其表面是非平面的，例如管或容器的内表面或外表面。在一些实施方案中，固体支持物包括微球或珠。在本文中“微球”、“珠”、“颗粒”或语法等同物意图意指由多种材料包括但不限于塑料、陶瓷、玻璃和聚苯乙烯制成的小的分散的颗粒。在某些实施方案中，微球是磁性微球或珠。可选择地或另外地，珠可以是多孔的。珠的尺寸在从纳米，例如，100nm至毫米，例如1mm的范围。

在其他的实施方案中，固定的核酸片段在溶液中被扩增。例如，在一些实施方案中，固定的核酸片段被切割或者以其他方式从固体支持物释放，并且然后扩增引物在溶液中与释放的分子杂交。在其他实施方案中，对于一个或更多个初始扩增步骤，扩增引物与固定的核酸片段杂交，然后是随后在溶液中的扩增步骤。因此，在一些实施方案中，固定的核酸模板可以用于产生溶液相扩增子。将理解，本文描述的任何扩增方法可以与通用的或靶特异的引物一起利用以扩增固定的核酸片段。

根据本文提供的方法扩增的核酸可以根据任何合适的测序方法来测序，例如直接测序，包括合成测序、连接测序、杂交测序、纳米孔测序等。在一些实施方案中，在固体支持物上对固定的DNA片段测序。在一些实施方案中，用于测序的固体支持物是与于其上发生扩增的固体支持物相同的固体支持物。

在一些实施方案中，在本文提供的方法中使用的测序方法是合成测序(SBS)。在SBS中，监测核酸引物沿着核酸模板(例如，靶核酸或其扩增子)的延伸以确定模板中核苷酸的序列。潜在的化学过程可以是聚合(例如，如被聚合酶催化)。在特定的基于聚合酶的SBS实施方案中，荧光标记的核苷酸以模板依赖性方式被添加至引物(从而延伸引物)，使得检测添加至引物的核苷酸的顺序和类型可以被用于确定模板的序列。

可以利用使用循环反应的其他测序程序，例如焦磷酸测序。焦磷酸测序检测随着特定核苷酸被掺入到新生核酸链中，无机焦磷酸(PPi)的释放(Ronaghi,等人，1996,Analytical Biochemistry 242(1),84-9；Ronaghi,2001,Genome Res.11(1),3-11；Ronaghi等人，1998,Science281(5375),363；US 6,210,891；US 6,258,568和US.6,274,320，其每一个通过引用并入本文)。在焦磷酸测序中，释放的PPi可以通过立即被ATP硫酸化酶转化的腺苷三磷酸(ATP)来检测，并且产生的ATP的水平可以经由荧光素酶产生的质子来检测。因此，测序反应可以经由发光检测系统来监测。用于基于荧光的检测系统的激发放射源对于焦磷酸测序程序不是必需的。可以被调整以应用于根据本公开内容产生的扩增子的焦磷酸测序的有用的流体系统、检测器和程序在以下中被描述：例如，WIPO专利申请系列第PCT/US11/57111号、US 2005/0191698A1、US 7,595,883和US 7,244,559，其每一个通过引用并入本文。

一些实施方案可以利用涉及DNA聚合酶活性的实时监测的方法。例如，核苷酸掺入可以通过携带荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用，或用零模波导(ZMW)来检测。用于基于FRET的测序的技术和试剂在以下中被描述：例如Levene等人，2003，Science 299,682–686；Lundquist等人，2008,Opt.Lett.33,1026–1028；Korlach等人，2008,Proc.Natl.Acad.Sci.USA 105,1176–1181，其公开内容通过引用并入本文。

一些SBS实施方案包括检测将核苷酸掺入到延伸产物后释放的质子。例如，基于检测释放的质子的测序可以使用从Ion Torrent(Guilford,CT,aLife Technologiessubsidiary)商购的电子检测器和相关技术，或在US 2009/0026082A1、US 2009/0127589A1、US 2010/0137143 A1或US 2010/0282617A1中描述的测序方法和系统，其每一个通过引用并入本文。本文列出的用于使用动力学排除扩增靶核酸的方法可以容易地应用于被用来检测质子的基底。更具体地，本文列出的方法可以用于产生用于检测质子的扩增子的克隆群体。

另一种有用的测序技术是纳米孔测序(参见，例如Deamer等人，2000,TrendsBiotechnol.18,147–151；Deamer等人，2002,Acc.Chem.Res.35:817-825；Li等人，2003,Nat.Mater.2:611–615，其公开内容通过引用并入本文)。在一些纳米孔实施方案中，将靶核酸或从靶核酸去除的单个核苷酸通过纳米孔。随着核酸或核苷酸通过纳米孔，每个核苷酸类型可以通过测量孔的电导率波动来鉴定。(美国专利第7,001,792号；Soni等人，2007，Clin.Chem.,53,1996–200；Healy,2007,Nanomed.2,459–481；Cockroft等人，2008,J.Am.Chem.Soc.,130,818–820，其公开内容通过引用并入本文)。在其他纳米孔测序实施方案中，待测序的DNA片段使用γ磷酸修饰的核苷酸创建独特的纳米孔电流特征(signature)。

用于富集多核苷酸的方法

本公开内容部分地涉及利用CRISPR-Cas或Argonaute系统及其衍生物用于靶特异性富集。

目前的靶特异性富集方案要求在与探针靶特异性杂交之前制备单链核酸。在由本公开内容提供的各种优势中，本公开内容提供了富集方法，该富集方法可以首先略过产生单链核酸的步骤，并且能够直接靶向双链核酸，例如双链DNA(dsDNA)。相比于单链富集策略，直接靶向双链DNA(部分或完全的双链)的方法具有独特的优势。例如，单链基因组DNA与靶向区域的非特异性杂交降低了特异性，并且经常需要大量的严格洗涤步骤或其他耗时步骤；并且单链富集方案经常利用Cot-1或其他阻断DNA以减少非特异性杂交。根据双链DNA富集方案不需要这些添加物，降低了所需要的试剂的成本和数目两者。此外，从双链DNA制备测序文库比从单链DNA制备测序文库更容易。因此，双链DNA的富集允许文库制备(例如标签化)在富集之后发生。另举例，由于特异性(树状结构和非特异性杂交对双链DNA富集较不是问题)，与单链DNA富集方案相比，潜在地较大的DNA片段可以更好地特异性富集。如果人们在单体型分析和组装的背景中考虑靶向测序，则这是特别重要的优势。此外，由于较长的DNA片段可以潜在地被富集，我们对在哪里设计靶探针具有较大的灵活性。例如，我们可以避免高多态性区域，但仍然捕获这些区域。此外，需要使用较少的探针来捕获较大的区域，降低捕获探针的成本和设计两者。

此外，目前的靶特异性杂交方案具有缓慢的动力学，并且通常需要高温。本公开内容提供了酶驱动的序列靶向方法，其提供更快速的富集动力学和更容易的富集工作流程。因为在本方法中与靶核酸的杂交是酶驱动的，所以该方法可以等温地发生。在一些实施方案中，本文的方法提供了在20℃-37℃DNA的等温靶向。此外，在本文的系统中指导核酸提供了序列特异性以及灵活的编程，其能够多重靶向富集(例如，用以多种方式(包括来自寡核苷酸库的IVT)制成的更多个探针靶向多个靶向区域)。本公开内容还提供了以较高的灵敏度和特异性用于富集和/或检测多核苷酸变体的方法。此外，本发明还提供了用于使用CRISPR-Cas或Argonaute系统靶向测序的方法。

在一个方面，本公开内容提供了一种用于使用源自CRISPR-Cas或Argonaute系统的核酸酶系统富集靶核酸的方法。本公开内容部分地基于CRISPR-Cas或Argonaute系统特异性结合靶核酸的能力。通过CRISPR-Cas或Argonaute系统的这样的靶特异性结合提供了用于有效富集靶核酸的方法，例如，通过拉下(pull down)与靶核酸相关的CRISPR-Cas或Argonaute系统的元件。CRISPR-Cas或Argonaute介导的核酸富集绕过了传统上需要的在靶特异性结合之前产生单链核酸的步骤，并且能够直接靶向双链核酸，例如双链DNA(dsDNA)。此外，CRISPR-Cas或Argonaute介导的核酸结合是酶驱动的，并且因此它可以在较低温度和/或等温反应条件提供更快速的富集动力学和更容易的富集工作流程。

在一些实施方案中，本公开内容提供了一种用于富集靶核酸的方法，所述方法包括：提供一种内切核酸酶系统，所述内切核酸酶系统具有成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及CRISPR相关(Cas)蛋白或其变体，其中crRNA或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在其他实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：提供一种内切核酸酶系统，所述内切核酸酶系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在一些实施方案中，本文提供的方法还包括从复合物分离靶核酸。在一个实施方案中，一旦发现靶向区域，CRISPR-Cas系统或Argonaute系统可以结合至表面，例如平板中的表面。这可以防止复合物提前解离，并且因此改进捕获效率。在一些实施方案中，本文提供的方法还包括扩增靶核酸序列。

在一些实施方案中，本文提供的靶核酸是双链DNA(dsDNA)。

在一些实施方案中，本文提供的内切核酸酶系统源自CRISPR-Cas系统。在一些实施方案中，本文提供的内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，本文提供的内切核酸酶系统是II型CRISPR-Cas系统。在一些实施方案中，本文提供的内切核酸酶系统是III型CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包含工程化的和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化的和/或编程的指导RNA。

crRNA或其衍生物包含与靶核酸的一个区域互补或基本上互补的靶特异性核苷酸区域。在一些实施方案中，crRNA或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的20个-50个核苷酸。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域90％-100％、80％-100％、或70％-100％碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在三个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在四个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在五个碱基对错配。

在一些实施方案中，本文提供的内切核酸酶系统还包括反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，本文提供的crRNA或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。嵌合的单一指导RNA(sgRNA)在Jinek等人，2012,Science 337,816-821中被描述，其以其整体并入本文。在一个实施方案中，本文提供的Cas蛋白或其变体可以通过嵌合sgRNA被引导至后面是5’-NGG前间区相邻基序(PAM)的任何基因组基因座。

在一些实施方案中，Cas蛋白或其变体是Cas9蛋白或其变体。来自嗜热链球菌CRISPR-Cas系统的分离的Cas9-crRNA复合物以及由单独的组分体外组装的复合物证明，它与携带与crRNA互补的核苷酸序列的合成的寡脱氧核苷酸和质粒DNA两者结合。已经示出，Cas9具有两个核酸酶结构域—RuvC-和HNH-活性位点/核酸酶结构域，并且这两个核酸酶结构域负责切割相对的DNA链。在一些实施方案中，Cas9蛋白源自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些实施方案中，Cas9蛋白是具有约1,409个氨基酸残基的多结构域蛋白。

在一些实施方案中，Cas9蛋白或其变体保留两个核酸酶结构域，并且能够切割相对的DNA链并产生双链DNA断裂。本方法部分地基于一项令人惊讶的发现，即保留两个核酸酶结构域的野生型Cas9蛋白可以在DNA切割后以足够的强度和长度保持在结合位点，使得能够通过内切核酸酶系统拉下DNA-内切核酸酶系统复合物。将包含野生型Cas9蛋白的CRISPR-Cas系统添加至含有靶Braf序列的溶液。系统用生物素化的dUTP标记，并且添加链霉亲和素珠以用其相关的DNA片段拉下该系统。从珠洗脱中检测切割的DNA片段，指示在切割之后酶系统和DNA之间的关联。

在其他实施方案中，Cas9蛋白或其变体是Cas9切口酶，并且能够产生单链核酸切口，例如单链DNA切口。Cas9蛋白的切口酶变体在产生切口之后留在靶核酸，并且因此其可以用于靶特异性富集。在一些实施方案中，仅RuvC核酸酶结构域被突变和失活。在一些实施方案中，仅HNH核酸酶结构域被突变和失活。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA互补的靶核酸链的突变。在一个实施方案中，突变是D10A。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA不互补的靶核酸链的突变。在一个实施方案中，突变是H840A。

在其他实施方案中，本文提供的系统源自Argonaute系统。在一些实施方案中，系统是Ago亚家族系统或其衍生物。在其他实施方案中，系统是Piwi亚家族系统或其衍生物。在一些特定的实施方案中，Argonaute蛋白是格氏嗜盐碱杆菌Argonaute(Ng Argonaute)或其变体。

在一些实施方案中，5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补或基本上互补的靶特异性核苷酸区域。在一些实施方案中，5’磷酸化单链核酸或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的DNA序列。在一些实施方案中，用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的20个-50个核苷酸。在一些实施方案中，5’磷酸化单链核酸是小于100个核苷酸的用户可选择的单链DNA序列。在一些实施方案中，5’磷酸化单链核酸是小于50个核苷酸的单链DNA。在一些实施方案中，5’磷酸化单链核酸是小于25个核苷酸的单链DNA。单链DNA的示例性长度包括10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个和50个核苷酸。在一些实施方案中，用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的小于20个核苷酸。示例性用户可选择的DNA序列包含与靶DNA序列的一个区域互补或基本上互补的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、或19个核苷酸。

在一些实施方案中，本方法可以用于在核酸片段的文库例如使用Illumina的Nextera文库制备法制备的文库中富集靶核酸片段。

在一些实施方案中，Cas9蛋白或其变体或Argonaute蛋白或其变体是Cas9蛋白或Argonaute蛋白的无核酸酶变体。例如，在一些实施方案中，Cas9蛋白的RuvC-和HNH-活性位点/核酸酶结构域两者被突变。Cas9蛋白或Argonaute蛋白的无核酸酶变体与双链DNA结合，但不切割DNA，并且因此其也可以用于靶特异性DNA富集。

可以通过拉下靶核酸相关的CRISPR-Cas或Argonaute系统或其元件来分离靶核酸。在一些实施方案中，内切核酸酶系统被标记，并且酶-核酸复合物通过标记物被拉下。在一些实施方案中，指导核酸被标记。在一个实施方案中，指导核酸，例如crRNA或5’磷酸化单链核酸，用生物素标记。在其他实施方案中，Cas蛋白或Argonaute或其变体用捕获标签标记。蛋白捕获标签包括但不限于GST、Myc、血凝素(HA)、绿色荧光蛋白(GFP)、flag、His标签、TAP标签和Fc标签。本领域中已知的其他蛋白捕获标签，例如亲和标签，也可以用于本方法。本领域技术人员将认识到，为纯化步骤选择的方案将对所使用的标签是特异性的。在一些实施方案中，抗体或其片段，例如抗-Cas9抗体或抗-Argonaute抗体，还可以用于分离复合物。

在另一个方面，指导核酸与靶双链核酸的一个区域的结合破坏靶核酸的两条链之间的相互作用，并且从而创建环结构，暴露与指导核酸不互补的链。该暴露的链可以与如本文提供的另一个核苷酸探针经历杂交。由本文的方法提供的一个优势是富集的双重特异性—一重来自指导核酸，而另一重来自探针。

在一个实施方案中，本公开内容提供了一种用于富集靶双链核酸的方法，所述方法包括：提供一种内切核酸酶系统，所述内切核酸酶系统具有：成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及CRISPR相关(Cas)蛋白或其变体，其中crRNA或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；使靶双链核酸与内切核酸酶系统接触以形成第一复合物；使标记的核酸与靶双链核酸的第二链杂交以形成第二复合物，靶双链核酸的第二链与crRNA或其衍生物不互补，并且分离第二复合物并从而富集靶核酸。

在另一个实施方案中，本公开内容提供了一种用于富集靶双链核酸的方法，所述方法包括：提供一种内切核酸酶系统，所述内切核酸酶系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；使靶双链核酸与内切核酸酶系统接触以形成第一复合物；使标记的核酸与靶双链核酸的第二链杂交以形成第二复合物，靶双链核酸的第二链与5’磷酸化单链核酸或其衍生物不互补，并且分离第二复合物并从而富集靶核酸。

在一些实施方案中，本公开内容的方法还包括从第二复合物分离靶双链DNA序列。在一些实施方案中，本申请的方法还包括扩增靶双链DNA序列。

在一些实施方案中，本文提供的靶核酸是双链DNA(dsDNA)。

在一些实施方案中，本文提供的内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，本文提供的内切核酸酶系统是II型CRISPR-Cas系统。在一些实施方案中，本文提供的内切核酸酶系统是III型CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包含工程化的和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化的和/或编程的指导RNA。

在一些实施方案中，crRNA或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的20-50个核苷酸。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域90％-100％、80％-100％、或70％-100％碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个、三个、四个或五个碱基对错配。

在一些实施方案中，本文提供的内切核酸酶系统还包括反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，本文提供的crRNA或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一个实施方案中，本文提供的Cas蛋白或其变体可以通过嵌合sgRNA被引导至后面是5’-NGG前间区相邻基序(PAM)的任何基因组基因座。

在一些实施方案中，Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白源自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些实施方案中，Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。

在一些实施方案中，Cas9蛋白或其变体保留两个核酸酶结构域，并且能够切割相对的DNA链并产生双链DNA断裂。在其他实施方案中，Cas9蛋白或其变体是Cas9切口酶，并且能够产生单链核酸切口，例如单链DNA切口。在一些实施方案中，仅RuvC核酸酶结构域被突变和失活。在一些实施方案中，仅HNH核酸酶结构域被突变和失活。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA互补的靶核酸链的突变。在一个实施方案中，突变是D10A。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA不互补的靶核酸链的突变。在一个实施方案中，突变是H840A。在又其他实施方案中，Cas9蛋白或其变体是Cas9蛋白的无核酸酶变体，其中RuvC-和HNH-活性位点/核酸酶结构域两者被突变。Cas9蛋白的无核酸酶变体与双链DNA结合，但不切割DNA，并且因此其也可以用于靶特异性DNA富集。在一些实施方案中，Cas9蛋白具有两个失活的核酸酶结构域，所述两个失活的核酸酶结构域具有切割与crRNA互补的链的结构域中的第一突变以及切割与crRNA不互补的链的结构域中的第二突变。在一些实施方案中，Cas9蛋白具有第一突变D10A和第二突变H840A。

在另一个方面，靶核酸可以被片段化并被连接到衔接子，准备用于其他程序例如测序。在一些实施方案中，靶核酸还经历转座酶介导的标签化，所述标签化导致靶核酸的片段化，以及衔接子与双链DNA片段的两条链的5'末端的连接。任选地，使用如在美国公布第2010/0120098号(其通过引用以其整体并入本文)中描述的标签化或转座可以将靶核酸片段化，并将衔接子添加至5’末端和3’末端。简言之，“转座反应”是其中一个或更多个转座子在随机位点处被插入到靶核酸中的反应。转座反应中的基本组分是转座酶和展现转座子的核苷酸序列的DNA寡核苷酸(包括转移的转座子序列及其互补物(未转移的转座子末端序列))以及形成功能性转座复合物或转座体复合物需要的其他组分。DNA寡核苷酸还可以根据需要或期望包含另外的序列(例如衔接子或引物序列)。适合于在本文提供的方法中使用的示例性转座复合物包括，但不限于，由超活性Tn5转座酶和Tn5型转座子末端形成的那些、或由MuA转座酶和包含R1和R2末端序列的Mu转座子末端形成的那些(参见，例如，Goryshin和Reznikoff,J.Biol.Chem.273:7367,1998；和Mizuuchi,Cell 35:785,1983；Savilahti等人,EMBO J.14:4893,1995；以上文献通过引用以其整体并入本文)。然而，能够将转座子末端以足够的效率插入至标签靶核酸用于其预期的目的的任何转座系统可以用于所提供的方法中。可以用于所提供的方法中的已知转座系统的其他实例包括，但不限于，金黄色葡萄球菌(Staphylococcus aureus)Tn552、Tyl、转座子Tn7、Tn/O和IS10、Mariner转座酶、Tel、P元件、Tn3、细菌插入序列、逆转录病毒和酵母的逆转录转座子(参见，例如，Colegio等人，2001，J.Bacteriol.183:2384-8；kirby等人，2002,Mol.Microbiol.43:173-86；Devine和Boeke,1994,Nucleic Acids Res.,22:3765-72；国际专利申请第WO 95/23875号；Craig，1996，Science 271：1512；Craig,1996,综述于：Curr Top Microbiol Immunol.204:27-48；Kleckner等人，1996,Curr Top Microbiol Immunol.204:49-82；Lampe等人，1996,EMBOJ.15:5470-9；Plasterk,1996,Curr Top Microbiol Immunol 204:125-43；Gloor,2004,Methods Mol.Biol.260:97-114；Ichikawa和Ohtsubo,1990,J Biol.Chem.265:18829-32；Ohtsubo和Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26；Brown等人，1989,ProcNatl Acad Sci USA 86:2525-9；Boeke和Corces,1989,Annu Rev Microbiol.43:403-34；以上文献通过引用以其整体并入本文)。在一些实施方案中，本公开内容的方法还包括去除转座酶，并通过PCR添加至衔接的DNA片段的末端。

在一些实施方案中，标签化在靶核酸富集之后进行。

在一些实施方案中，指导核酸，例如CRSPR-Cas系统中的RNA(例如，crRNA或其衍生物、sgRNA和tracrRNA或其衍生物)，或5’磷酸化单链核酸(例如，gDNA)，包含转座子末端，并且本公开内容的方法还包括添加转座酶。添加的转座酶可以组装在转座子末端上，并且因此靶DNA被转座酶切割。在一些实施方案中，转座子末端是马赛克末端(mosaic end，ME)，并且转座酶是Tn5转座酶。

在一些实施方案中，本文提供的核酸酶系统还包括转座酶，并且因此转座酶是内切核酸酶系统的一部分，并且本公开内容的方法还包括将转座子末端添加至靶DNA序列；和通过转座酶标签化靶DNA序列。在一些实施方案中，转座酶与内切核酸酶系统的核苷酸序列结合。在一些实施方案中，转座酶与crRNA或其衍生物结合。在一些实施方案中，转座酶与tracrRNA或其衍生物结合。在一些实施方案中，转座酶与sgRNA或具有crRNA多核苷酸和tracrRNA多核苷酸的嵌合多核苷酸结合。在一些实施方案中，转座酶与5’磷酸化单链核酸或其衍生物结合。在一些实施方案中，转座子末端是马赛克末端(mosaic end，ME)，并且转座酶是Tn5转座酶。

在另一个方面，本公开内容提供了用于使用CRISPR-Cas或Argonaute系统富集和/或检测无细胞DNA群体中的靶核酸的方法。血浆或血清中的无细胞DNA作为一种非侵入性诊断工具在许多医学领域中具有巨大的潜力。例如，已经研究并甚至优化了无细胞胎儿DNA，用于测试不相容的RhD因子、用于X连锁遗传紊乱的性别确定、用于单基因紊乱的测试、先兆子痫的鉴定等。例如，对母体血浆中的无细胞DNA的胎儿细胞级分测序是用于检测与胎儿染色体非整倍性相关的拷贝数变化的可靠方法。另举例，对从癌症患者中分离的无细胞DNA(也被称为循环肿瘤DNA)测序已经被用来检测与治疗决策具有相关性的关键基因中的突变。本公开内容提供了用于改进富集和/或检测无细胞DNA中的靶DNA序列的方法。

在一些实施方案中，本公开内容提供了一种用于富集靶核酸的方法，所述方法包括：从受试者的血浆或血清中获得无细胞DNA(cfDNA)的群体，该无细胞DNA的群体包含靶核酸；提供一种内切核酸酶系统，所述内切核酸酶系统具有成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及CRISPR相关(Cas)蛋白或其变体，其中crRNA或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在其他实施方案中，本公开内容提供了一种用于富集靶核酸的方法，所述方法包括：从受试者的血浆或血清中获得无细胞DNA(cfDNA)的群体，所述无细胞DNA的群体包含靶核酸；提供一种内切核酸酶系统，所述内切核酸酶系统具有：5’磷酸化单链核酸或其衍生物、以及Argonaute蛋白或其变体，其中5’磷酸化单链核酸或其衍生物包含与靶核酸的一个区域互补的靶特异性核苷酸区域；使靶核酸与内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集靶核酸。

在一些实施方案中，本文提供的方法还包括从复合物分离靶DNA序列。在一些实施方案中，本文提供的方法还包括扩增靶向DNA序列。在一些实施方案中，本文提供的靶核酸是双链DNA(dsDNA)。

在一些实施方案中，crRNA或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的20-50个核苷酸。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个、三个、四个或五个碱基对错配。

在一些实施方案中，靶DNA在无细胞DNA的胎儿细胞级分中，并且无细胞DNA来自母体血浆。用于提取无细胞胎儿DNA的方案是本领域已知的(参见，例如，Li等人,2004,Clinical Chemistry 50(6):1002-1011；和Li等人,2005,The Journal of the AmericanMedical Association 293(7):843-849,其通过引用以其整体并入本文)。许多用于从母体血浆中提取胎儿DNA的方案利用胎儿DNA的大小来区分它和母体DNA。用于从母体血液中分离血浆的典型的步骤包括离心，随后是分离和纯化无细胞DNA(参见，例如，Chiu等人,2001,Clinical Chemistry 47(9):1607-1613)。任选地，由Legler等人开发的方案可以用于提取无细胞胎儿DNA(参见Legler等人.2007,Prenatal Diagnosis 27(9):824-829)。任选地，甲醛可以被添加至母体血液样品以增加无细胞胎儿DNA的百分比。已经示出甲醛可以稳定完整的细胞，并且抑制母体DNA的进一步释放(参见，例如，Dhallan等人.2004,The Journalof the American Medical Association 291(9):1114-1119)。

在一些实施方案中，受试者是癌症患者。肿瘤本身通常是肿瘤DNA的主要来源。然而，如果可能的话，通过活检获得DNA是侵入性的且是有风险的。血流中从死亡肿瘤细胞释放的无细胞循环肿瘤DNA为检测肿瘤中存在的体细胞突变提供了另一个有用的工具。在早期和晚期两者的许多类型的癌症中已经鉴定了具有突变的无细胞循环肿瘤DNA。此外，无细胞循环DNA的量随着癌症的发展已经显示出增加。因此，无细胞循环DNA也可以用作监测肿瘤进展和测试患者的肿瘤是否将响应靶向药物治疗的一种方式(参见例如，Bettegowda等人,2014,Sci.Transl.Med,6(224):24)。本公开内容提供了一种用于富集和/或检测来自癌症患者的无细胞循环DNA中的靶DNA序列的方法。在一个实施方案中，癌症患者具有胰腺癌、卵巢癌、结肠直肠癌、膀胱癌、胃食管癌、乳腺癌、黑素瘤、肝细胞癌或头颈癌。在一些实施方案中，癌症患者具有脑癌、肾癌、前列腺癌或甲状腺癌。在一些实施方案中，癌症患者具有癌瘤(carcinoma)。在一些实施方案中，癌症患者具有肉瘤。在一些实施方案中，癌症患者具有淋巴瘤或白血病。在一些实施方案中，本文提供的方法用于诊断癌症。在一些实施方案中，本文提供的方法用于监测肿瘤进展和/或测试肿瘤患者对靶向药物治疗的响应。

在一些实施方案中，靶核酸包含单核苷酸变体(SNV)。在一些实施方案中，SNV包含单核苷酸多态性(SNP)。在一些实施方案中，SNV包含点突变。单核苷酸多态性(SNP)是常见类型的遗传变异，其包括DNA位置中的多态性，在所述DNA位置处在人类群体中两种或更多种替代碱基以可观的频率存在(通常大于或等于1％)。点突变是具有小于1％频率的碱基变异。单核苷酸多态性(SNP)和点突变代表了在人类基因组中多样性的最大来源。这些单核苷酸多态性(SNP)和点突变可以充当生物标志物用于将疾病定位到人基因组图谱上，因为它们通常位于靠近与某种疾病有关的基因处。因此，检测单核苷酸多态性(SNP)、点突变和类似突变对于临床活动性、人类健康和控制遗传疾病是很重要的。通过对无细胞DNA测序检测胎儿或癌症相关的SNV可能是困难的，因为这些变体通常以总无细胞DNA的非常低的百分比存在(典型地0.1％和更低)。本公开内容提供的一个优势是用于检测和/或富集具有SNV的DNA序列的更灵敏的方法。在一个实施方案中，本公开内容的方法允许检测以0.1％至0.01％的频率范围存在于无细胞DNA样品中的SNV。在一个实施方案中，本文提供的方法富集和/或检测以0.01％至0.05％的频率范围存在于无细胞DNA样品中的SNV。在一些实施方案中，本文提供的方法富集和/或检测以约0.01％、0.02％、0.03％、0.04％、0.05％、0.06％、0.07％、0.08％、0.09％或0.1％的频率存在于无细胞DNA样品中的SNV。

作为直接富集包含SNV的靶核酸序列的替代，本公开内容还提供了一种用于通过使用CRISPR-Cas或Argonaute系统破坏不包含SNV的其他基因型或多核苷酸来富集包含SNV的核酸序列的方法。

在一些实施方案中，本公开内容提供了一种用于检测单核苷酸变体(SNV)的方法，所述方法包括：从受试者的血浆或血清中获得无细胞DNA的群体；提供第一内切核酸酶系统，所述第一内切核酸酶系统具有：第一成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第一CRISPR相关(Cas)蛋白或其变体，其中第一crRNA或其衍生物包含与第一靶核酸的一个区域互补的第一靶特异性核苷酸区域，并且其中第一Cas蛋白具有核酸酶活性；使用内切核酸酶系统切割第一靶核酸，并且使用聚合酶链式反应(PCR)扩增第二靶核酸，其中第二靶核酸包含单核苷酸变体形式的第一靶核酸。

在其他实施方案中，本公开内容提供了一种用于检测单核苷酸变体(SNV)的方法，所述方法包括：从受试者的血浆或血清中获得无细胞DNA的群体；提供第一内切核酸酶系统，所述第一内切核酸酶系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与第一靶核酸的一个区域互补的第一靶特异性核苷酸区域，并且其中第一Argonaute蛋白具有核酸酶活性；使用第一内切核酸酶系统切割第一靶核酸，并且使用聚合酶链式反应(PCR)扩增第二靶核酸，其中第二靶核酸包含单核苷酸变体形式的第一靶核酸。

在一些实施方案中，本文提供的第二靶核酸是双链DNA(dsDNA)。

在一些实施方案中，本文提供的第一内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，本文提供的内切核酸酶系统是II型CRISPR-Cas系统。在一些实施方案中，本文提供的内切核酸酶系统是III型CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包含工程化的和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化的和/或编程的指导RNA。

在一些实施方案中，第一crRNA或其衍生物包含允许酶特异性靶向互补双链核酸的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与第一靶DNA序列的一个区域互补的20个-50个核苷酸。在一些实施方案中，crRNA的第一靶特异性核苷酸区域具有与第一靶核酸的一个区域100％碱基对匹配。在一些实施方案中，在crRNA的第一靶特异性核苷酸区域和第一靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的第一靶特异性核苷酸区域和第一靶核酸的一个区域之间存在两个、三个、四个或五个碱基对错配。

在一些实施方案中，本文提供的第一内切核酸酶系统还包括反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，本文提供的第一crRNA或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一个实施方案中，本文提供的第一Cas蛋白或其变体可以通过嵌合sgRNA被引导至后面是5’-NGG前间区相邻基序(PAM)的任何基因组基因座。

在一些实施方案中，第一Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白源自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些实施方案中，Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。在一些实施方案中，Cas9蛋白或其变体保留两个核酸酶结构域，并且能够切割相对的DNA链并产生双链DNA断裂。

在一些实施方案中，第二靶核酸包含单核苷酸变体(SNV)。在一些实施方案中，SNV包含单核苷酸多态性(SNP)。在一些实施方案中，SNV包含点突变。在一个实施方案中，本公开内容的方法允许检测以0.1％至0.01％的频率范围存在于无细胞DNA样品中的SNV。在一个实施方案中，本文提供的方法富集和/或检测以0.01％至0.05％的频率范围存在于无细胞DNA样品中的SNV。在一些实施方案中，本文提供的方法富集和/或检测以约0.01％、0.02％、0.03％、0.04％、0.05％、0.06％、0.07％、0.08％、0.09％或0.1％的频率存在于无细胞DNA样品中的SNV。

可选择地，可以提供两种内切核酸酶系统：第一内切核酸酶系统用于消化不含SNV的核酸，并且第二内切核酸酶系统用于拉下具有SNV的核酸。

在一些实施方案中，本文的方法还包括提供第二内切核酸酶系统，所述第二内切核酸酶系统具有第二成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第二CRISPR相关(Cas)蛋白或其变体，其中第二crRNA或其衍生物包含与第二靶核酸的一个区域互补的第二靶特异性核苷酸区域；使第二靶核酸与第二内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集第二靶核酸。

在一些实施方案中，本文的方法还包括：提供第二内切核酸酶系统，所述第二内切核酸酶系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与第二靶核酸的一个区域互补的第二靶特异性核苷酸区域；使第二靶核酸与第二内切核酸酶系统接触以形成复合物，并且分离复合物并从而富集第二靶核酸。

在一些实施方案中，本文提供的方法还包括从复合物分离第二靶核酸。在一些实施方案中，本文提供的第二靶核酸是双链DNA(dsDNA)。

在一些实施方案中，本文提供的第二内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。在一些实施方案中，本文提供的第二内切核酸酶系统是II型CRISPR-Cas系统。在一些实施方案中，本文提供的第二内切核酸酶系统是III型CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括源自天然存在的CRISPR-Cas系统的工程化的和/或编程的核酸酶系统。CRISPR-Cas系统可以包括包含工程化和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化和/或编程的指导RNA。

在一些实施方案中，第二crRNA或其衍生物包含允许酶特异性靶向互补双链DNA的用户可选择的RNA序列。在一些实施方案中，用户可选择的RNA序列包含与靶DNA序列的一个区域互补或基本上互补的20个-50个核苷酸。在一些实施方案中，crRNA的靶特异性核苷酸区域具有与靶核酸的一个区域100％碱基对匹配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在一个碱基对错配。在一些实施方案中，在crRNA的靶特异性核苷酸区域和靶核酸的一个区域之间存在两个、三个、四个或五个碱基对错配。

在一些实施方案中，本文提供的第二内切核酸酶系统还包括反式作用crRNA(tracrRNA)或其衍生物。在一些实施方案中，本文提供的crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。

在一些实施方案中，第二Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白源自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些实施方案中，Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。

在一些实施方案中，Cas9蛋白或其变体保留两个核酸酶结构域，并且能够切割相对的DNA链并产生双链DNA断裂。在其他实施方案中，Cas9蛋白或其变体是Cas9切口酶，并且能够产生单链核酸切口，例如单链DNA切口。在一些实施方案中，仅RuvC核酸酶结构域被突变和失活。在一些实施方案中，仅HNH核酸酶结构域被突变和失活。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA互补的靶核酸链的突变。在一个实施方案中，突变是D10A。在一些实施方案中，Cas9蛋白包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与crRNA不互补的靶核酸链的突变。在一个实施方案中，突变是H840A。在又其他实施方案中，Cas9蛋白或其变体是Cas9蛋白的无核酸酶变体，其中RuvC-和HNH-活性位点/核酸酶结构域两者被突变。在一些实施方案中，Cas9蛋白具有两个失活的核酸酶结构域，所述两个失活的核酸酶结构域具有切割与crRNA互补的链的结构域中的第一突变以及切割与crRNA不互补的链的结构域中的第二突变。在一些实施方案中，Cas9蛋白具有第一突变D10A和第二突变H840A。

在一些实施方案中，第二靶核酸在无细胞DNA的胎儿细胞级分中，并且无细胞DNA来自母体血浆。在一些实施方案中，受试者是癌症患者。在一个实施方案中，癌症患者具有胰腺癌、卵巢癌、结肠直肠癌、膀胱癌、胃食管癌、乳腺癌、黑素瘤、肝细胞癌或头颈癌。在一些实施方案中，癌症患者具有脑癌、肾癌、前列腺癌或甲状腺癌。在一些实施方案中，癌症患者具有癌瘤。在一些实施方案中，癌症患者具有肉瘤。在一些实施方案中，癌症患者具有淋巴瘤或白血病。在一些实施方案中，本文提供的方法用于诊断癌症。在一些实施方案中，本文提供的方法用于监测肿瘤进展和/或测试肿瘤患者对靶向药物治疗的响应。

在又另一个方面，本公开内容提供了一种用于使用包含切口酶的CRISPR-Cas或Argonaute系统标记靶核酸序列的方法。本文提供的切口酶可以将靶特异性切口引入到双链核酸。切口还可以用于插入捕获标签，例如生物素化的dNTP、寡核苷酸探针或双链核酸衔接子，用于靶核酸的富集策略。单链核酸富集方案的现有方法需要产生杂交产物的“树结构”，并且这样的结构通常降低特异性。本文提供的方法直接靶向双链核酸，并且因此规避了产生这样的“树结构”的需要。此外，本文提供的方法能够富集长核酸片段。

在一些实施方案中，本文提供的方法包括产生一个单链切口，并且从该切口进行切口平移以引入用于回收靶核酸的捕获标记物。在其他实施方案中，本文提供的方法包括在靶核酸的同一链上产生两个连续的单链切口。两个切口之间的单链核酸产物可以用用于回收靶核酸的捕获标记物替代。在又其他实施方案中，本文提供的方法包括在靶核酸的相对链上产生两个连续的单链切口，并且因此产生可以连接到用于富集的衔接子的双链核酸断裂。

在一些实施方案中，本公开内容提供了一种用于标记靶核酸的方法，所述方法包括：提供第一核酸酶系统，所述第一核酸酶系统具有：第一成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及第一CRISPR相关(Cas)蛋白或其变体，其中第一crRNA或其衍生物包含与靶核酸的第一区域互补的第一靶特异性核苷酸区域，并且其中第一Cas蛋白包含一个失活的核酸酶结构域；使包含靶核酸的双链核酸与第一核酸酶系统接触以在靶核酸的第一区域处产生第一单链切口，并且标记靶核酸。

在其他实施方案中，本公开内容提供了一种用于标记靶核酸的方法，所述方法包括：提供第一核酸酶系统，所述第一核酸酶系统具有：第一5’磷酸化单链核酸或其衍生物、以及第一Argonaute蛋白或其变体，其中第一5’磷酸化单链核酸或其衍生物包含与靶核酸的第一区域互补的第一靶特异性核苷酸区域，并且其中第一Argonaute蛋白能够产生单链切口；使包含靶核酸的双链核酸与第一核酸酶系统接触以在靶核酸的第一区域处产生第一单链切口，并且标记靶核酸。

在一些实施方案中，本文的方法还包括通过标记分离靶核酸，并且从而富集靶核酸。在一些实施方案中，本文提供的方法还包括扩增靶核酸。

在一些实施方案中，本文提供的第一核酸酶系统还包括反式作用crRNA(tracrRNA)。在一些实施方案中，本文提供的第一crRNA或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方案中，本文提供的第一核酸酶系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中，第一Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中，Cas9蛋白或其变体包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA互补的靶核酸链的突变。在一些实施方案中，突变是D10A。在一些实施方案中，第一Cas9蛋白或其变体包含一个失活的核酸酶结构域，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA不互补的靶核酸链的突变。在一些实施方案中，突变是H840A。

在一些实施方案中，本公开内容的方法还包括进行切口平移。在一些实施方案中，本文提供的切口平移通过使用选自由DNA Pol 1、Bst和Taq组成的组的切口平移聚合酶进行。本领域已知的其他切口平移聚合酶也被包括在本文提供的方法中。在一些实施方案中，本文提供的切口平移在包含生物素化的dNTP的反应混合物中进行。在一些实施方案中，本文提供的生物素化的dNTP是生物素化的dUTP。在一些实施方案中，本公开内容的方法还包括添加磁性链霉亲和素珠以富集生物素化的靶DNA。

在一些实施方案中，本公开内容的方法还包括：提供第二核酸酶系统，所述第二核酸酶系统具有：第二crRNA或其衍生物、以及第二Cas蛋白或其变体，其中第二crRNA或其衍生物包含与靶核酸的第二区域互补的第二靶特异性核苷酸区域，并且其中第二Cas蛋白包含一个失活的核酸酶结构域；以及使包含靶核酸的双链核酸与第二核酸酶系统接触以在靶核酸的第二区域处产生第二单链切口，其中靶核酸的第一区域不同于靶核酸的第二区域。

在一些实施方案中，本公开内容的方法还包括：提供第二核酸酶系统，所述第二核酸酶系统具有：第二5’磷酸化单链核酸或其衍生物、以及第二Argonaute蛋白或其变体，其中第二5’磷酸化单链核酸或其衍生物包含与靶核酸的第二区域互补的第二靶特异性核苷酸区域，并且其中第二Argonaute蛋白能够产生单链切口，以及使包含靶核酸的双链核酸与第二核酸酶系统接触以在靶核酸的第二区域处产生第二单链切口，其中靶核酸的第一区域不同于靶核酸的第二区域。

在一些实施方案中，第一单链切口和第二单链切口在靶核酸的同一链上。

例如，在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的同一链上，并且第一Cas9蛋白和第二Cas9蛋白两者包含切割与其各自的crRNA互补的靶核酸链的结构域中的突变，使得第一单链切口和第二单链切口在靶核酸的同一链上。在一些实施方案中，第一Cas蛋白是包含一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA互补的靶核酸链的第一突变，并且第二Cas蛋白是包含一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中包含切割与第二crRNA互补的靶核酸链的第二突变。在一些实施方案中，第一突变和第二突变两者是D10A。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的同一链上，并且第一Cas9蛋白和第二Cas9蛋白两者包含切割与其各自的crRNA不互补的靶核酸链的结构域中的突变，使得第一单链切口和第二单链切口在靶核酸的同一链上。在一些实施方案中，第一Cas蛋白是包含一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA不互补的靶核酸链的第一突变，并且第二Cas蛋白是包含一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中包含切割与第二crRNA不互补的靶核酸链的第二突变。在一些实施方案中，第一突变和第二突变两者是H840A。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的不同链上，并且两种Cas9蛋白保留了不同的核酸酶结构域，使得第一单链切口和第二单链切口在靶核酸的同一链上。在一些实施方案中，第一Cas蛋白是包含一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA互补的靶核酸链的第一突变，并且第二Cas蛋白是包含一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第二crRNA不互补的靶核酸链的第二突变。在一些实施方案中，第一突变是D10A，并且所述第二突变是H840A。

在一些实施方案中，第一单链切口和第二单链切口之间的间隔是从20个碱基对(bp)至10kp。在一些实施方案中，第一单链切口和第二单链切口之间的间隔是从20个碱基对(bp)至5kp。在一些实施方案中，第一单链切口和第二单链切口之间的间隔是从20个碱基对(bp)至1000bp。在一些实施方案中，第一单链切口和第二单链切口之间的间隔是从20个碱基对(bp)至500bp。在一些实施方案中，第一单链切口和第二单链切口之间的间隔是约20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp或500bp。

在一些实施方案中，本公开内容的方法还包括添加捕获探针；以及用捕获探针交换在第一单链切口和第二单链切口之间的单链核酸产物，其中捕获探针能够与同单链核酸产物互补的核酸链杂交。在一些实施方案中，捕获探针的序列与单链核酸产物的序列10％至100％相同。在一些实施方案中，捕获探针的序列与单链核酸产物的序列约10％、20％、30％、40％、50％、60％、70％、80％或90％相同。在一些实施方案中，本文提供的捕获探针是生物素化的探针。在一些实施方案中，本公开内容的方法还包括添加磁性链霉亲和素珠以富集靶核酸。

在一些实施方案中，本文提供的核酸酶系统中的切口酶在靶DNA的同一链上产生两个连续的单链切口。添加两种酶系统，其中酶系统各自靶向靶DNA序列的不同区域，并且因此在同一链上产生两个连续的单链切口。然后两个切口之间的单链DNA产物被捕获探针例如生物素化的捕获探针替代，用于富集步骤。

在一些实施方案中，捕获探针包含突出端核苷酸序列，该突出端核苷酸序列与固定在表面上的寡核苷酸基本上互补。因此，通过将突出物退火至固定在表面上的互补寡核苷酸，突出物可以用于拉下靶DNA。在一个实施方案中，突出物包含通用

捕获引物P5(从Illunima,Inc,San Diego,CA购得)或与其互补。表面可以是固体支持物的外部部分或外层。固体支持物可以是刚性固体，并且任选地可以是对液体或气体不可渗透的。固体支持物还可以是半刚性固体，例如，对液体或气体可渗透。表面可以与另一种材料接触，例如气体、液体、凝胶、类似或不同固体支持物的第二表面、金属或涂层。表面或其区域可以基本上是平坦的。表面可以具有表面特征，例如孔、凹陷、通道、脊、凸起区域、桩、标杆等。在一些实施方案中，表面或其区域可以位于容器中，例如孔、管、通道、比色杯、培养皿、瓶等。有用的容器是流通池。示例性流通池是从Illumina,Inc(San Diego,CA)商购的那些流通池。另一个有用的容器是多孔板或微量滴定板中的孔。在一些实施方案中，本文提供的方法还包括Nextera文库制备和在表面上簇集。在一些实施方案中，转座可以在流通池捕获之前进行。各种实施方案已经在可商购的固相平台(例如从Illumina Inc.(San Diego,Ca)购得)的上下文中描述，并且本领域技术人员将理解，各种实施方案中的任一个可以用本领域熟知的各种其他固相配置来进行。这样的配置基本上包括固相和捕获探针。

在其他实施方案中，本文提供的方法可以用于在重复区域中引入特定的间隙。在一个实施方案中，捕获探针具有“发夹”或者是具有与靶DNA互补的5’和3’区域的错配探针。因此，每个重复单元被允许引入标志(landmark)的独特标志物(或条形码)替代。标志可以用于重复区域的组装或计数重复的确切数目。

某些聚合酶，例如Phi29，可以引发从间隙的切口平移。因此，在又其他实施方案中，在靶核酸的同一链上的第一单链切口和第二单链切口之间的间隔是1bp至20bp。在一些实施方案中，本文提供的方法还可以包括进行切口平移。在一些实施方案中，切口平移通过使用切口平移聚合酶Phi29进行。

在一些实施方案中，第一单链切口和第二单链切口在靶DNA序列的相对链上，从而产生第一双链DNA断裂末端。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的同一链上；第一Cas蛋白是具有一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA互补的靶核酸链的第一突变，并且第二Cas蛋白是具有一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第二crRNA不互补的靶核酸链的第二突变。在一些实施方案中，第一突变是D10A，并且第二突变是H840A。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的相对链上；第一Cas蛋白是包含一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA互补的靶核酸链的第一突变，并且第二Cas蛋白是包含一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中包含切割与第二crRNA互补的靶核酸链的第二突变。在一些实施方案中，第一突变和第二突变两者是D10A。

在一些实施方案中，靶核酸的第一区域和靶核酸的第二区域在靶核酸的相对链上；第一Cas蛋白是包含一个失活的核酸酶结构域的第一Cas9蛋白，所述失活的核酸酶结构域在结构域中具有切割与第一crRNA不互补的靶核酸链的第一突变，并且第二Cas蛋白是包含一个失活的核酸酶结构域的第二Cas9蛋白，所述失活的核酸酶结构域在结构域中包含切割与第二crRNA不互补的靶核酸链的第二突变。在一些实施方案中，第一突变和第二突变两者是H840A。

在一些实施方案中，在相对靠近的核酸位置处形成切口，并且可以产生平端断裂。在一些实施方案中，在彼此相对远离处形成切口，并且可以产生具有5’或3’突出端的粘性末端断裂。在一些实施方案中，本公开内容的方法还包括将衔接子连接到双链核酸断裂末端。在一些实施方案中，本公开内容的衔接子是生物素化的。在一些实施方案中，本公开内容的方法包括添加磁性链霉亲和素珠以富集靶核酸。

在一些实施方案中，本文提供的方法还包括：提供第三核酸酶系统，所述第三核酸酶系统具有：第三crRNA或其衍生物、以及第三Cas蛋白或其变体，其中第三crRNA或其衍生物包含与靶核酸的第三区域基本上互补的第三靶特异性核苷酸区域，并且其中第三Cas蛋白包含一个失活的核酸酶结构域；提供第四核酸酶系统，所述第四核酸酶系统具有：第四crRNA或其衍生物、以及第四Cas蛋白或其变体，其中第四crRNA或其衍生物包含与靶核酸的第四区域基本上互补的第四靶特异性核苷酸区域，并且其中第四Cas蛋白包含一个失活的核酸酶结构域；以及使包含靶核酸的双链核酸与第三核酸酶系统和第四核酸酶系统接触，以在靶核酸的第三区域处产生第三单链切口并且在靶核酸的第四区域处产生第四单链切口，其中第三单链切口和第四单链切口在靶核酸的相对链上，从而产生第二双链核酸断裂末端，该第二双链核酸断裂末端不同于第一双链核酸断裂末端。

在其他实施方案中，本文提供的方法还包括：提供第三核酸酶系统，所述第三核酸酶系统具有：第三5’磷酸化单链核酸或其衍生物、以及第三Argonaute蛋白或其变体，其中第三5’磷酸化单链核酸或其衍生物包含与靶核酸的第三区域基本上互补的第三靶特异性核苷酸区域，并且其中第三Argonaute蛋白能够产生单链切口；提供第四核酸酶系统，所述第四核酸酶系统具有：第四5’磷酸化单链核酸或其衍生物、以及第四Argonaute蛋白或其变体，其中第四5’磷酸化单链核酸或其衍生物包含与靶核酸的第四区域基本上互补的第四靶特异性核苷酸区域，并且其中第四Argonaute蛋白能够产生单链切口；以及使包含靶核酸的双链核酸与第三核酸酶系统和第四核酸酶系统接触，以在靶核酸的第三区域处产生第三单链切口并且在靶核酸的第四区域处产生第四单链切口，其中第三单链切口和第四单链切口在靶核酸的相对链上，从而产生第二双链核酸断裂末端，该第二双链核酸断裂末端不同于第一双链核酸断裂末端。

在一些实施方案中，第一双链核酸断裂末端和第二双链核酸断裂末端之间的核酸片段可以包含从10个核苷酸至数千个核苷酸。在一些实施方案中，可以添加捕获探针，例如单链寡核苷酸、DNA哑铃和双链DNA衔接子以标记核酸片段。在一些实施方案中，本文提供的方法还包括将衔接子连接到第二双链核酸断裂末端。

例如，提供两对CRISPR-Cas系统或Argonaute系统。每对酶包含两种切口酶，例如Cas9切口酶或Argonaute切口酶，并且两种切口酶可以在DNA的相对链上产生单链DNA切口。因此，每对酶产生双链DNA断裂末端，并且在靶DNA序列的两个末端周围或两个末端处产生两个双链DNA断裂末端。在一个实施方案中，两个双链DNA断裂末端之间的DNA片段是约10kb。在一些实施方案中，两个双链DNA断裂末端之间的DNA片段是约1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb或9kb。DNA片段还可以被连接到靶特异性生物素化的PCR衔接子，通过该靶特异性生物素化的PCR衔接子可以富集靶DNA。

富集的双链核酸还可以经历测序。在一个实施方案中，富集的DNA被标签化为较小的片段并被引入到测序衔接子。在一些实施方案中，本文提供的方法还包括在标签化之前稀释。在一个实施方案中，在PCR和/或标签化之前，富集的DNA被稀释至单倍体含量。

在一些实施方案中，进行Nextera文库制备(从Illumina,Inc,San Diego,CA购得)以片段化输入DNA并引入测序引物，并且然后使片段化的DNA与本文提供的CRISPR-Cas或Argonaute系统接触以形成复合物。复合物被拉下，并且靶DNA可以从复合物中释放，例如使用EDTA、热、SDS和RNA酶。然后可以进行测序。

在另一个方面，本公开内容提供了一种使用多种CRISPR-Cas或Argonaute系统富集双链DNA的方法，所述多种CRISPR-Cas或Argonaute系统保留完全的内切核酸酶活性(即，能够产生双链断裂)，例如，多种CRISPR-Cas系统中的每个具有包含两个核酸酶结构域的野生型Cas9。

在一些实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：提供用一组crRNA编程的Cas9蛋白的群体，其中该组crRNA包含与靶核酸的一系列不同区域互补的crRNA；使靶核酸与用该组crRNA编程的Cas9蛋白的群体接触，以产生一系列核酸片段，并且将衔接子连接到核酸片段的至少一个，其中Cas9蛋白保留了两个核酸酶结构域。

在其他实施方案中，本文提供了一种用于富集靶核酸的方法，所述方法包括：提供用一组5’磷酸化单链核酸编程的Argonaute蛋白的群体，其中该组5’磷酸化单链核酸包含与靶核酸的一系列不同区域互补的5’磷酸化单链核酸；使靶核酸与用该组5’磷酸化单链核酸编程的Argonaute蛋白的群体接触，以产生一系列核酸片段，并且将衔接子连接到核酸片段的至少一个，其中Argonaute蛋白能够产生双链DNA断裂。

在一些实施方案中，该组crRNA包含与靶核酸的两个不同区域互补的crRNA。在一些实施方案中，该组5’磷酸化单链核酸包含与靶核酸的两个不同区域互补的5’磷酸化单链核酸。

本文提供的方法可以用于富集长DNA片段。在一些实施方案中，两个不同区域之间的间隔长于10kb。

在一些实施方案中，靶核酸是双链DNA。在一些实施方案中，靶核酸是基因组DNA、染色体DNA、基因组或部分基因组。

在另一个方面，本公开内容提供了一种Cas9或Argonaute介导的核酸片段化和靶向测序的方法。本公开内容提供了一种用于在用户定义的区域中以序列特异性方式片段化DNA，并产生用于随后测序的核酸片段，例如，适于掺入到Illumina测序文库的DNA片段的方法。

在一些实施方案中，本文提供的用于对靶核酸测序的方法包括：提供用一组crRNA编程的Cas9蛋白的群体，其中该组crRNA包含与跨靶核酸的一系列不同区域互补的crRNA；使靶核酸与用该组crRNA编程的Cas9蛋白的群体接触，以产生一系列核酸片段，并且对该系列的核酸片段测序。

在其他实施方案中，本文提供的用于对靶核酸测序的方法包括：提供用一组5’磷酸化单链核酸编程的Argonaute蛋白的群体，其中该组5’磷酸化单链核酸包含与跨靶核酸的一系列不同区域互补的5’磷酸化单链核酸；使靶核酸与用该组5’磷酸化单链核酸编程的Argonaute蛋白的群体接触，以产生一系列核酸片段，并且对该系列的核酸片段测序。

在一些实施方案中，核酸的靶向片段化可以通过制备Cas9或Argonaute蛋白的群体来实现，所述Cas9或Argonaute蛋白的群体用靶向跨靶核酸平铺(tiled)的区域的指导核酸编程。在一些实施方案中，本文提供的Cas9或Argonaute蛋白可以产生双链核酸断裂，并且因此产生一系列核酸片段。这些核酸片段还可以经历核酸测序工作流程。

相同的核酸样品可以用多个Cas9或Argonaute蛋白的群体单独处理，所述多个Cas9或Argonaute蛋白的群体用不同组的靶向跨靶核酸平铺的区域的指导核酸编程。由每个群体产生的核酸片段与由另一个群体产生的核酸片段重叠。更加可靠和综合的测序数据可以通过对具有重叠序列的核酸片段测序来获得。

在一些实施方案中，本文提供的用于对靶核酸测序的方法包括：提供Cas9蛋白的多于一个群体，Cas9蛋白的每个群体用不同的一组crRNA编程，其中每组crRNA包含与跨靶核酸的不同系列的区域互补的crRNA；在单独的反应中使靶核酸与Cas9蛋白的多于一个群体中的每一个接触以产生不同系列的核酸片段，并且对核酸片段测序。

在其他实施方案中，本文提供的用于对靶核酸测序的方法包括：提供Argonaute蛋白的多于一个群体，Argonaute蛋白的每个群体用不同的一组5’磷酸化单链核酸编程，其中每组5’磷酸化单链核酸包含与跨靶核酸的不同系列的区域互补的5’磷酸化单链核酸，在单独的反应中使靶核酸与Argonaute蛋白的多于一个群体中的每一个接触以产生不同系列的核酸片段，并且对核酸片段测序。

在一些实施方案中，Cas9或Argonaute蛋白的多于一个群体包括Cas9或Argonaute蛋白的三个群体，并且其中由Cas9或Argonaute蛋白的三个群体中的每一个产生的核酸片段包含与由Cas9蛋白的三个群体中的至少另一个产生的核酸片段重叠的序列。例如，10kb靶DNA可以用Cas9蛋白处理，所述Cas9蛋白用三组跨靶DNA序列具有约500bp间隔的crRNA靶向区域编程。每组crRNA包含约57个crRNA。Cas9蛋白与切割的DNA的末端保持非共价缔合，切割的靶DNA可以通过用蛋白酶或去污剂处理样品来释放。然后切割产物被收集并被转化为测序文库，例如，使用Illumina的TruSeq Nano工作流程。切割可以在单独的反应中使用不同的一组crRNA进行。例如，切割可以在3个管(锅1、锅2和锅3)中用三个Cas9复合物的文库进行，所述Cas9复合物的文库用crRNA重组，产生尺寸约500bp的重叠片段。这样的重叠片段可以改进测序准确性。

在一些实施方案中，本公开内容提供了一种用于靶向单体型测序(分相测序)的方法。在一些实施方案中，本文提供的方法还包括将包含靶DNA的DNA样品稀释至单倍体含量。分相或单体型信息(其指的是二倍体生物体中两个同源染色体的独特含量)提供了有用的工具以更好地理解人类DNA序列和表型(包括疾病)之间的关系。本公开内容提供了一种用于使用CRISPR-Cas或Argonaute系统来单体型测序的方法。单体型测序工作流程可以利用Cas9或Argonaute蛋白保持在切割的DNA的末端的能力。由于Cas9或Argonaute蛋白与切割的DNA的末端保持关联，这产生了一个DNA单体型块，其尺寸与靶序列中Cas9或Argonaute靶区域之间的数目和距离成比例。在一些实施方案中，在切割后，反应可以在微量滴定孔中稀释至亚单体型水平，并且然后可以用蛋白酶处理以释放结合片段并转化成测序文库，例如，使用从Illumina,Inc.(San Diego,CA)购得的TruSeq Nano文库制备方法。

在一些实施方案中，本文提供的靶核酸是双链DNA。在一些实施方案中，本文提供的靶核酸是基因组DNA、染色体DNA、基因组或部分基因组。

在一些实施方案中，核酸片段可以例如使用有限循环聚合酶链式反应(PCR)来扩增，以引入其他末端序列或衔接子，例如索引物(index)、通用引物以及簇形成和测序所需的其他序列。

在一些实施方案中，对核酸片段测序包括使用合成测序、桥式PCR、链终止测序、杂交测序、纳米孔测序和连接测序中的一个或更多个。

可以利用使用循环反应的其他测序程序，例如焦磷酸测序。焦磷酸测序检测随着特定核苷酸被掺入到新生核酸链中，无机焦磷酸(PPi)的释放(Ronaghi,等人,AnalyticalBiochemistry 242(1),84-9(1996)；Ronaghi,Genome Res.11(1),3-11(2001)；Ronaghi等人.Science 281(5375),363(1998)；US 6,210,891；US 6,258,568和US.6,274,320，其每一个通过引用并入本文)。在焦磷酸测序中，释放的PPi可以通过立即被ATP硫酸化酶转化的腺苷三磷酸(ATP)来检测，并且产生的ATP的水平可以经由荧光素酶产生的质子来检测。因此，测序反应可以经由发光检测系统来监测。用于基于荧光的检测系统的激发放射源对于焦磷酸测序程序不是必需的。可以被调整以应用于根据本公开内容产生的扩增子的焦磷酸测序的有用的流体系统、检测器和程序在以下中被描述：例如，WIPO专利申请系列第PCT/US11/57111号、US 2005/0191698A1、US 7,595,883和US 7,244,559，其每一个通过引用并入本文。

一些实施方案可以利用涉及DNA聚合酶活性的实时监测的方法。例如，核苷酸掺入可以通过携带荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用，或用零模波导(ZMW)来检测。用于基于FRET的测序的技术和试剂在例如以下中被描述：Levene等人.Science299,682–686(2003)；Lundquist等人.Opt.Lett.33,1026–1028(2008)；Korlach等人.Proc.Natl.Acad.Sci.USA 105,1176–1181(2008)，其公开内容通过引用并入本文。

一些SBS实施方案包括检测将核苷酸掺入到延伸产物后释放的质子。例如，基于检测释放的质子的测序可以使用电子检测器和从Ion Torrent(Guilford,CT,a LifeTechnologies subsidiary)商购的相关技术，或在US 2009/0026082A1、US 2009/0127589A1、US 2010/0137143 A1或US 2010/0282617A1中描述的测序方法和系统，其每一个通过引用并入本文。本文列出的用于使用动力学排除扩增靶核酸的方法可以容易地应用于被用来检测质子的基底。更具体地，本文列出的方法可以用于产生用于检测质子的扩增子的克隆群体。

另一种有用的测序技术是纳米孔测序(参见，例如Deamer等人.TrendsBiotechnol.18,147–151(2000)；Deamer等人.Acc.Chem.Res.35:817-825(2002)；Li等人.Nat.Mater.2:611–615(2003)，其公开内容通过引用并入本文)。在一些纳米孔实施方案中，将靶核酸或从靶核酸去除的单个核苷酸通过纳米孔。随着核酸或核苷酸通过纳米孔，每个核苷酸类型可以通过测量孔的电导率波动来鉴定。(美国专利第7,001,792号；Soni等人.Clin.Chem.53,1996–2001(2007)；Healy,Nanomed.2,459–481(2007)；Cockroft等人.J.Am.Chem.Soc.130,818–820(2008)，其公开内容通过引用并入本文)。

从前面的描述将明显的是，可以对本文描述的发明进行变化和改变，以使其适应多种用途和条件。这样的实施方案也在以下权利要求书的范围内。

在本文的任何的变量的定义中对一列要素的叙述包括那个变量作为任一单个要素或所列要素的组合(或子组合)的定义。本文中对实施方案的叙述包括作为任一单独的实施方案的实施方案或与任何其他实施方案或其部分组合。

在本说明书中提到的所有专利和出版物通过引用并入本文，其程度如同每一个单独专利和出版物被特别地和单独地指明通过引用并入的相同程度。

另外的实施方案

实施方案1.一种用于扩增靶双链核酸的方法，所述方法包括：

(a)提供一种系统，所述系统具有：

成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及

CRISPR相关(Cas)蛋白或其变体，

其中所述crRNA或其衍生物包含与所述靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；

(b)使所述靶双链核酸与所述系统接触以形成复合物；

实施方案2.如实施方案1所述的方法，还包括重复步骤(a)至步骤(d)一次或更多次。

实施方案3.如实施方案1所述的方法，其中所述靶双链核酸被线性地扩增。

实施方案4.如实施方案1所述的方法，其中所述靶双链核酸被指数地扩增。

实施方案5.如实施方案1所述的方法，其中所述靶核酸是双链DNA(dsDNA)。

实施方案6.如实施方案1所述的方法，其中所述靶核酸是双链RNA(dsRNA)。

实施方案7.如实施方案1所述的方法，其中所述系统是I型CRISPR-Cas系统或其衍生物。

实施方案8.如实施方案1所述的方法，其中所述系统是II型CRISPR-Cas系统或其衍生物。

实施方案9.如实施方案1所述的方法，其中所述系统是III型CRISPR-Cas系统或其衍生物。

实施方案10.如实施方案1所述的方法，其中所述系统还包含反式作用crRNA(tracrRNA)或其衍生物。

实施方案11.如实施方案1所述的方法，其中所述crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。

实施方案12.如实施方案1所述的方法，其中所述靶双链核酸的所述第一链包含与5’-NGG前间区相邻基序(PAM)互补的序列。

实施方案13.如实施方案1所述的方法，其中所述靶双链核酸的所述第一链包含通用序列，并且其中所述crRNA或其衍生物包含与所述通用序列的一个区域互补的序列。

实施方案14.如实施方案13所述的方法，其中所述引物包含所述通用序列的一个区域的序列。

实施方案15.如实施方案13所述的方法，其中所述通用序列具有SEQ ID No.3的序列。

实施方案16.如实施方案15所述的方法，其中所述crRNA包含SEQ ID No.7的序列。

实施方案17.如实施方案16所述的方法，其中所述引物包含SEQ IDNo.5的序列。

实施方案18.如实施方案13所述的方法，其中所述通用序列具有SEQ ID No.4的序列。

实施方案19.如实施方案18所述的方法，其中所述crRNA包含SEQ ID No.8的序列。

实施方案20.如实施方案19所述的方法，其中所述引物包含SEQ IDNo.6的序列。

实施方案21.如实施方案1所述的方法，其中所述Cas蛋白或其变体是Cas9蛋白或其变体。

实施方案22.如实施方案21所述的方法，其中所述Cas9蛋白包含两个失活的核酸酶结构域。

实施方案23.如实施方案22所述的方法，其中所述两个失活的核酸酶结构域包含切割与所述crRNA互补的链的结构域中的第一突变以及切割与所述crRNA不互补的链的结构域中的第二突变。

实施方案24.如实施方案23所述的方法，其中所述第一突变是D10A，并且所述第二突变是H840A。

实施方案25.如实施方案1所述的方法，其中所述Cas蛋白或其变体是级联蛋白或其变体。

实施方案26.如实施方案1所述的方法，其中所述Cas蛋白或其变体是Cas3蛋白或其变体。

实施方案27.如实施方案1所述的方法，其中所述聚合酶是链置换聚合酶。

实施方案28.如实施方案27所述的方法，其中所述聚合酶选自由以下组成的组：Bst、Bsu和Phi29。

实施方案29.如实施方案1所述的方法，还包括：

在靶核酸和包含转移链的至少一种转座子末端组合物经历转座反应的条件下，将至少一种转座酶和所述至少一种所述转座子末端组合物应用于包含所述靶核酸的样品以产生混合物，其中所述靶核酸被片段化以产生多于一个靶核酸片段，以及

其中所述crRNA或其衍生物包含与所述通用引物的一个区域互补的靶特异性核苷酸区域。

实施方案30.如实施方案29所述的方法，其中所述通用引物通过PCR反应被掺入到所述多于一个靶核酸片段中。

实施方案31.如实施方案30所述的方法，其中所述通用引物具有与5’-NGG前间区相邻基序(PAM)互补的序列。

实施方案32.如实施方案30所述的方法，其中所述通用序列具有SEQ ID No.3的序列。

实施方案33.如实施方案32所述的方法，其中所述crRNA包含SEQ ID No.7的序列。

实施方案34.如实施方案33所述的方法，其中所述引物包含SEQ IDNo.5的序列。

实施方案35.如实施方案30所述的方法，其中所述通用引物具有SEQ ID No.4的序列。

实施方案36.如实施方案35所述的方法，其中所述crRNA包含SEQ ID No.8的序列。

实施方案37.如实施方案36所述的方法，其中所述引物包含SEQ IDNo.6的序列。

实施方案38.如实施方案29所述的方法，其中两种通用引物被掺入到所述多于一个靶核酸片段的每一个的两个末端中。

实施方案39.如实施方案38所述的方法，其中所述两种通用引物具有SEQ ID No.3和SEQ ID No.4的序列。

实施方案40.一种用于扩增靶双链核酸的方法，所述方法包括：

(a)提供第一系统，所述第一系统具有：

第一成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及

第一CRISPR相关(Cas)蛋白或其变体，

其中所述第一crRNA或其衍生物包含与所述靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；

(b)提供第二系统，所述第二系统具有：

第二成簇的规律间隔的短回文重复(CRISPR)RNA(crRNA)或其衍生物、以及

第二CRISPR相关(Cas)蛋白或其变体，

其中所述第二crRNA或其衍生物包含与所述靶双链核酸的第二链的一个区域互补的靶特异性核苷酸区域；

(c)使所述靶双链核酸与所述第一系统和所述第二系统接触；

实施方案41.如实施方案40所述的方法，还包括重复步骤(a)至步骤(e)一次或更多次。

实施方案42.如实施方案40所述的方法，其中所述靶核酸是双链DNA(dsDNA)。

实施方案43.如实施方案40所述的方法，其中所述靶核酸是双链RNA(dsRNA)。

实施方案44.如实施方案40所述的方法，其中所述第一系统或所述第二系统是I型CRISPR-Cas系统或其衍生物。

实施方案45.如实施方案40所述的方法，其中所述第一系统或所述第二系统是II型CRISPR-Cas系统或其衍生物。

实施方案46.如实施方案40所述的方法，其中所述第一系统或第二系统是III型CRISPR-Cas系统或其衍生物。

实施方案47.如实施方案40所述的方法，其中所述第一系统或所述第二系统还包含反式作用crRNA(tracrRNA)或其衍生物。

实施方案48.如实施方案40所述的方法，其中所述第一系统或所述第二系统的所述crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。

实施方案49.如实施方案40所述的方法，其中所述靶双链核酸的所述第一链和所述第二链包含与5’-NGG前间区相邻基序(PAM)互补的序列。

实施方案50.如实施方案40所述的方法，其中：

所述靶双链核酸的所述第一链包含第一通用序列，并且其中所述第一系统的所述crRNA或其衍生物包含与所述第一通用序列的一个区域互补的序列，以及

所述靶双链核酸的所述第二链包含第二通用序列，并且其中所述第二系统的所述crRNA或其衍生物包含与所述第二通用序列的一个区域互补的序列。

实施方案51.如实施方案50所述的方法，其中所述第一引物包含所述第一通用序列的一个区域的序列，并且所述第二引物包含所述第二通用序列的一个区域的序列。

实施方案52.如实施方案51所述的方法，其中：

所述第一通用序列具有SEQ ID No.3的序列，所述第一系统的所述crRNA或其衍生物包含SEQ ID No.7的序列，且所述第一引物包含SEQ IDNo.5的序列，并且

所述第二通用序列具有SEQ ID No.4的序列，所述第二系统的所述crRNA或其衍生物包含SEQ ID No.8的序列，且所述第二引物包含SEQ IDNo.6的序列。

实施方案53.如实施方案40所述的方法，其中所述第一系统或所述第二系统的所述Cas蛋白或其变体是Cas9蛋白或其变体。

实施方案54.如实施方案53所述的方法，其中所述Cas9蛋白包含两个失活的核酸酶结构域。

实施方案55.如实施方案54所述的方法，其中所述两个失活的核酸酶结构域包含切割与所述crRNA互补的链的结构域中的第一突变以及切割与所述crRNA不互补的链的结构域中的第二突变。

实施方案56.如实施方案55所述的方法，其中所述第一突变是D10A，并且所述第二突变是H840A。

实施方案57.如实施方案40所述的方法，其中所述第一系统或所述第二系统的所述Cas蛋白或其变体是级联蛋白或其变体。

实施方案58.如实施方案40所述的方法，其中所述第一系统或所述第二系统的所述Cas蛋白或其变体是Cas3蛋白或其变体。

实施方案59.如实施方案40所述的方法，其中所述聚合酶是链置换聚合酶。

实施方案60.如实施方案59所述的方法，其中所述聚合酶选自由以下组成的组：Bst、Bsu和Phi29。

实施方案61.如实施方案1-60中任一项所述的方法，其中所述靶核酸是基因组DNA。

实施方案62.如实施方案1-60中任一项所述的方法，其中所述靶核酸包含染色体DNA或其片段。

实施方案63.如实施方案1-60中任一项所述的方法，其中所述靶核酸包括基因组或部分基因组。

实施方案64.如实施方案1-63中任一项所述的方法，还包括对所述靶核酸或靶核酸片段测序。

实施方案65.如实施方案64所述的方法，其中所述测序包括使用合成测序、桥式PCR测序、链终止测序、杂交测序、纳米孔测序和连接测序中的一个或更多个。

实施方案66.如实施方案1-65中任一项所述的方法，还包括对所述靶核酸或靶核酸片段测序。

实施方案67.如实施方案66所述的方法，其中所述测序包括使用合成测序、桥式PCR测序、链终止测序、杂交测序、纳米孔测序和连接测序中的一个或更多个。

Claims

1.一种用于富集靶双链核酸的方法，所述方法包括：

(a)提供一种系统，所述系统包含：5’磷酸化单链核酸和Argonaute蛋白，其中所述5’磷酸化单链核酸包含与所述靶双链核酸的第一链的一个区域互补的靶特异性核苷酸区域；

(b)使具有所述靶双链核酸的核苷酸序列的多于一个核酸与所述系统接触，以与所述靶双链核酸形成复合物；以及

(c)使所述复合物与非复合的核酸分离，从而富集所述靶核酸。

2.根据权利要求1所述的方法，其中所述系统被结合至表面。

3.根据权利要求1所述的方法，其中所述Argonaute蛋白或所述5’磷酸化单链核酸包含捕获标签。

4.根据权利要求1所述的方法，其中所述分离包括使所述复合物与捕获探针接触，所述捕获探针选自抗-Argonaute抗体或其抗原结合片段以及与所述靶核酸的一个区域互补的多核苷酸。

5.根据权利要求1-4中任一项所述的方法，所述方法还包括扩增所富集的靶核酸，包括：

(d)使引物与所述靶双链核酸的第二链杂交，其中所述引物包含与所述靶双链核酸的第二链的一个区域互补的序列，以及

(e)用聚合酶延伸所杂交的引物。

6.一种用于制备核酸的文库的方法，所述方法包括：

(i)使双链靶核酸标签化以获得多于一个双链片段，其中每一个双链片段的第一链包含通用序列；以及

(ii)扩增所述多于一个双链片段，包括：

(a)提供一种系统，所述系统包含：5’磷酸化单链核酸和Argonaute蛋白，其中所述5’磷酸化单链核酸包含与所述通用序列的一个区域互补的序列；

(b)使所述多于一个双链片段与所述系统接触以形成多于一个复合物；

(c)使引物与每一个所述双链片段的第二链杂交，其中所述引物包含与所述双链片段的第二链的一个区域互补的序列，以及

(e)用聚合酶延伸所杂交的引物。

7.根据权利要求6所述的方法，其中所述标签化包括使所述靶核酸与转座体接触，所述转座体包含转座酶和含有所述通用序列的核酸。

8.根据权利要求5-7中任一项所述的方法，其中所述扩增是线性的。

9.根据权利要求5-7中任一项所述的方法，其中所述扩增是指数的。

10.根据权利要求5-9中任一项所述的方法，其中所述聚合酶是链置换聚合酶。

11.根据权利要求5-10中任一项所述的方法，其中所述聚合酶选自由以下组成的组：Bst聚合酶、Bsu聚合酶和Phi29聚合酶。

12.根据权利要求1-11中任一项所述的方法，其中所述靶核酸是双链DNA或双链RNA。

13.根据权利要求1-12中任一项所述的方法，其中所述Argonaute蛋白是格氏嗜盐碱杆菌(Natronobacterium gregoryi)Argonaute。

14.根据权利要求1-13中任一项所述的方法，其中所述5’磷酸化单链核酸是具有25个核苷酸或更小的长度的单链DNA。

15.根据权利要求1-14中任一项所述的方法，其中所述靶双链核酸包含基因组DNA。

16.根据权利要求1所述的方法，其中所述Argonaute蛋白被捕获标签标记，或者所述5’磷酸化单链核酸被标记。

17.根据权利要求1所述的方法，其中所述分离包括使所述复合物与抗-Argonaute抗体或其片段接触。