CN113039285A

CN113039285A - 用于纳米孔测序的液体样品工作流程

Info

Publication number: CN113039285A
Application number: CN201980073080.4A
Authority: CN
Inventors: 黄意巍; 卡斯滕·迪特里克; 蒂瓦达尔·马赫; 斯特凡·普劳斯; 马克西米利安·乌尔斯特勒
Original assignee: Siemens Healthcare GmbH
Current assignee: Siemens Healthcare GmbH
Priority date: 2018-11-07
Filing date: 2019-10-29
Publication date: 2021-06-25
Also published as: WO2020094457A1; EP3650558A1; US20210388427A1; EP3877544A1

Abstract

本发明涉及表征靶标DNA多核苷酸的方法，其使用滚环扩增(RCA)和合成的单链向导RNA(sgRNA)来识别和切割靶标DNA多核苷酸的WT版本。还提供了表征步骤，其基于使用跨膜孔和控制DNA多核苷酸移动通过跨膜孔的DNA易位酶。进一步设想的是一种试剂盒，其包括对靶标DNA多核苷酸的至少一部分特异的一个或多个寡核苷酸、对靶标DNA多核苷酸的WT版本特异的sgRNA以及sgRNA引导的核酸结合蛋白。

Description

用于纳米孔测序的液体样品工作流程

技术领域

本发明涉及表征靶标DNA多核苷酸的方法，其使用滚环扩增(RCA)和合成的单链向导RNA(sgRNA)来识别和切割靶标DNA多核苷酸的WT版本。还提供了其基于使用跨膜孔和DNA易位酶表征步骤，该DNA易位酶控制DNA多核苷酸通过跨膜孔的移动。进一步设想的是一种试剂盒，其包括对靶标DNA多核苷酸的至少一部分特异的一个或多个寡核苷酸、对靶标DNA多核苷酸的WT版本特异的sgRNA以及由sgRNA引导的核酸结合蛋白。

背景技术

下一代测序(NGS)是遗传学和分子研究的主要驱动力，尤其是包括癌症医学领域中的现代诊断。该技术为研究DNA或RNA样品提供了有力的方法。已经开发出新的和改进的方法和方案以支持多种范围的应用，包括分析遗传变异和样品特异性差异。为了改进该方法，已经开发了旨在通过集中于特定序列、转录本、基因或基因组子区域或通过消除不想要的序列来有针对性地靶向富集测序文库的方法。

靶向富集在许多情况下可以是有用的，例如，其中需要分析整个基因组的特定部分。完整外显子组(所有转录序列)的有效测序是该方法的典型实例。进一步的实例包括特定转录本的富集、突变热点的富集或干扰核酸种类的排除。

当前的靶向富集技术包括(i)杂交捕获，其中源自输入样品的核酸链在溶液中或在固相支持物上与互补于关注的靶向区域的预先制备的DNA片段特异性杂交，因此可以物理捕获并分离出关注的序列；(ii)选择性环化或分子倒置探针(MIP)，其中通过间隙填充和连接化学以高度特异性的方式形成包括靶区域序列的单链DNA环，形成具有常见DNA元素的结构，然后将其用于选择性扩增关注的靶标区域；以及(iii)聚合酶链反应(PCR)扩增，其中通过并行进行多个长距离PCR、有限数量的标准多重PCR或高度多重PCR方法，PCR被引导朝向关注的靶向区域，扩增非常多的短片段(Mertes et al.,2011,Briefings infunctional Genomics,10,6,374-386)。

然而，为了利用这些技术，首先必须从患者获得合适的活检材料，特别是如果该方法用于癌症诊断中时。实体组织活检是昂贵的，并且在许多情况下使患者痛苦。此外，不能总是进行实体组织活检，因为它们不能反映当前的疾病动态或对治疗的敏感性，例如在癌症的情况下。因此，有必要提供一种替代实体组织活检的方法，同时增加该方法的灵敏度。对抗NGS的敏感性限制和获取组织样品的侵入性二者的一种新兴解决方案是富集液体活检(Hesse et al.,2015,Advances in Molecular Diagnostics,1,1,2-7)。液体活检通常是血液样品，可以由其分离出循环细胞如循环肿瘤细胞(CTC)或循环无细胞DNA(cfDNA)。这些无细胞的DNA(cfDNA)或循环核酸(包括DNA，以及如micoRNA的RNA物种)作为循环片段保留在血液中一段时间，并且像其他血液分析物一样，可以通过简单的血液采样进行评估。然而，cfDNA和类似的循环核酸是具有挑战性的分析物，因为它们的血浆差异很大，不仅因人而异，而且还取决于疾病状况。例如，血浆中的cfDNA水平通常限制为1至100ng/ml血浆，此外，cfDNA片段与正常cfDNA之间的信噪比很低。cfDNA和其他循环核酸片段也非常小，平均大小约为60-180bp，需要特定的提取和NGS文库大小选择方案。

因此，需要简化的、对成本和资源敏感的富集和测序方法，其允许有效表征靶标DNA多核苷酸，特别是来源于液体活检组织的靶标DNA多核苷酸。

发明内容

本发明满足了这一需求，并提供了表征靶标DNA多核苷酸的方法，该方法包括：(i)提供DNA多核苷酸的混合物，该DNA多核苷酸的混合物至少包括所述DNA多核苷酸的野生型(WT)版本和突变版本；(ii)通过滚环扩增(RCA)来扩增步骤(i)的所述DNA多核苷酸的混合物，提供扩增的和串联的DNA多核苷酸的库；(iii)通过使用对所述WT版本特异的合成的单链向导RNA(sgRNA)和sgRNA引导的核酸结合蛋白，优选Cas9，识别和切割靶标DNA多核苷酸的WT版本；(iv)对未切割的突变靶标DNA多核苷酸进行大小选择；以及(v)表征未切割的突变靶标DNA多核苷酸。由于去除了WT序列，该方法有利地允许减小测序深度。该方法还适合于多路复用不同的患者样品，并允许富集基因或外显子的选定区域或组合(panel)。

在一个优选的实施方式中，如上所述的步骤(v)包括以下子步骤：(v-a)将与DNA易位酶和至少一个胆固醇系链节段(segment)相关的转接子(adaptor)多核苷酸与步骤(iv)中获得的突变靶标DNA多核苷酸连接；(v-b)使步骤(v-a)中获得的修饰的DNA多核苷酸与跨膜孔接触，以使DNA易位酶控制DNA多核苷酸移动通过跨膜孔，并且胆固醇系链将DNA多核苷酸锚定在跨膜孔附近；以及(v-c)在DNA多核苷酸移动通过所述跨膜孔期间进行一次或多次测量，其中该测量指示DNA多核苷酸的一种或多种特征，从而表征靶标DNA多核苷酸。因此，用上述方法获得的具有重复序列的长读取(读段，read)显著提高了基于跨膜孔的测序中用于突变调用的测序准确性。

在另一个优选的实施方式中，如上所述的方法在步骤(i)之后还包括DNA多核苷酸的末端修复和A尾添加的步骤(i-a)。

在又一个优选的实施方式中，如上所述的方法在步骤(i-a)之后还包括用茎环寡核苷酸环化DNA多核苷酸的步骤(i-b)，其中所述茎环寡核苷酸包括条形码序列(barcodingsequence)和限制酶识别位点。

特别优选用对靶标DNA多核苷酸的至少一部分特异的一种或多种寡核苷酸进行所述滚环扩增。在本发明的另一个特定的实施方式中，对所述靶标DNA多核苷酸的至少一部分特异的所述一种或多种寡核苷酸是六聚体、七聚体和/或八聚体。

在本发明的另一个实施方式中，进行滚环扩增直到扩增的DNA多核苷酸具有至少约300个核苷酸的大小。特别优选其具有约至少3000个核苷酸的大小。

在另一个实施方式中，使用T7核酸内切酶、DNA聚合酶和可选的连接酶修复获得的滚环扩增产物。

在另一个实施方式中，所述靶标DNA多核苷酸代表基因、基因的一个或多个外显子、基因间区域、非转录调控区域和/或开放阅读框或其子部分；或一组不同基因、一组不同基因的一个或多个外显子、一组基因间区域、一组非转录调控区和/或一组开放阅读框或其子部分、或前面提到的任何要素的任何组合。

优选地，所述靶标DNA多核苷酸是细胞游离DNA(cfDNA)。特别优选地，所述cfDNA源自液体活检。

在本发明方法的一个特定的实施方式中，DNA多核苷酸的所述表征是(i)测定DNA多核苷酸的长度，(ii)测定DNA多核苷酸的身份，或(iii)测定DNA多核苷酸的序列。特别优选测定DNA多核苷酸的序列。

在利用如上定义的跨膜孔的方法的一个特定实施方式中，DNA易位酶是DNA解旋酶，如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶。

在所述方法的另一个实施方式中，所述跨膜孔是来源于以下各项的蛋白孔：溶血素、杀白细胞素、MspA、MspB、MspC、MspD、CsgG、lysenin、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏菌自转运蛋白脂蛋白(NalP)或WZA。

在另一方面，本发明涉及用于表征靶标DNA多核苷酸的试剂盒，该试剂盒包括对靶标DNA多核苷酸的至少一部分特异的一个或多个寡核苷酸、对靶标DNA多核苷酸的WT版本特异的合成的单链向导RNA(sgRNA)以及sgRNA引导的核酸结合蛋白。特别优选的是，sgRNA引导的核酸结合蛋白是Cas9核酸内切酶。

在所述试剂盒的一个特定的实施方式中，试剂盒另外包括DNA易位酶和胆固醇系链。

应当理解，在不脱离本发明的范围的情况下，不仅可以以所示的各个组合使用上述特征以及在下文中将要说明的特征，而且可以以其他组合或单独地使用。

附图说明

图1显示了根据本发明的实施方式的使用滚环扩增(RCA)和合成的单链向导RNA(sgRNA)表征靶标DNA多核苷酸的步骤的示意图。

具体实施方式

尽管将针对特定实施例描述本发明，但是该描述不应被理解为限制性的。

在详细描述本发明的示例性实施方式之前，给出对于理解本发明重要的定义。

如在本说明书和所附权利要求书中所使用的，单数形式的“一个(a)”和“一种(an)”也包括各自的复数，除非上下文另外明确指出。

在本发明的上下文中，术语“约”和“大约”表示本领域技术人员将理解以仍然确保所讨论特征的技术效果的精度范围。该术语通常表示与所指示的数值的偏差为±20％，优选地为±15％，更优选地为±10％，并且甚至更优选地为±5％。

应当理解，术语“包括”不是限制性的。为了本发明的目的，术语“由……组成”或“基本上由……组成”被认为是术语“包括”的优选实施方式。如果在下文中组被定义为包括至少一定数量的实施方式，则这意味着还包括优选地仅由这些实施方式组成的组。

此外，说明书或权利要求书中的术语“(i)”、“(ii)”、“(iii)”或“(a)”、“(b)”、“(c)”、“(d)”或“第一”、“第二”、“第三”等，用于区分相似的元件，而不必用于描述顺序或时间顺序。

应当理解，如此使用的术语在适当的情况下是可互换的，并且本文描述的本发明的实施方式能够以不同于本文描述或示出的其他顺序来操作。如果这些术语与方法、过程或使用的步骤有关，则步骤之间没有时间或时间间隔的连贯性，即，除非另有说明，这些步骤可以同时执行，或者在此类步骤之间可以有几秒钟、几分钟、几小时、几天、几周的时间间隔。

应当理解，本发明不限于本文描述的特定方法、协议等，因为这些可以变化。还应当理解，本文所使用的术语仅出于描述特定实施方式的目的，并不旨在限制本发明的范围，本发明的范围仅由所附权利要求书来限制。

附图应被认为是示意性表示，并且附图中示出的元件不必按比例示出。而是，各种元件被表示为使得它们的功能和通用目的对于本领域技术人员而言是显而易见的。

除非另有定义，否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。

如上所述，本发明在一个方面涉及一种表征靶标DNA多核苷酸的方法，该方法包括：(i)提供DNA多核苷酸的混合物，该DNA多核苷酸的混合物至少包括所述DNA多核苷酸的野生型(WT)版本和突变版本；(ii)通过滚环扩增(RCA)来扩增步骤(i)的所述DNA多核苷酸的混合物，提供扩增的和串联的DNA多核苷酸的库；(iii)通过使用对所述WT版本特异的合成的单链向导RNA(sgRNA)和sgRNA引导的核酸结合蛋白，优选Cas9，识别和切割靶标DNA多核苷酸的WT版本；(iv)对未切割的突变靶标DNA多核苷酸进行大小选择；以及(v)优选通过测序表征未切割的突变靶标DNA多核苷酸。

如本文所用，术语“靶标DNA多核苷酸”涉及任何适合分子分析的关注的DNA分子。在本发明的特定的实施方式中，靶标多核苷酸代表基因、基因的一个或多个外显子、基因间区域、非转录调控区域和/或开放阅读框或其子部分。在另外的实施方式中，靶标多核苷酸也可以是一组不同基因、一组不同基因的一个或多个外显子、一组基因间区域、一组非转录调控区和/或一组开放阅读框或其子部分。靶标DNA多核苷酸可以进一步作为单个DNA分子提供，或者优选以DNA分子库的形式提供，例如代表如上所述的基因、基因的一个或多个外显子、基因间区域、非转录调控区域和/或开放阅读框或其子部分，或一组不同基因、一组不同基因的一个或多个外显子、一组基因间区域、一组非转录调控区域和/或一组开放阅读框或其子部分。

在本发明方法的第一步骤中，提供了DNA多核苷酸的混合物，该DNA多核苷酸的混合物至少包括所述DNA多核苷酸的野生型(WT)版本和突变版本。

“DNA多核苷酸”可以是天然存在的或是人工的。它可以包括修饰，如氧化的或甲基化的核苷酸。在某些实施方式中，DNA多核苷酸还可以包括人工添加物，如标签或标记。

DNA多核苷酸可以是任何可能的来源，例如原核、真核、古细菌或病毒。根据本发明待表征的DNA多核苷酸可以具有任何已知的可能的生物学或细胞功能。例如，它可以是任何天然存在的或合成的多核苷酸。

DNA多核苷酸的提供可以包括DNA分子的提取和/或纯化、与细胞碎片的分离、过滤、从柱(例如硅胶膜柱)上的洗脱、离心、消化(例如RNase消化)或样品中核苷酸或蛋白组分的去除。优选在缓冲溶液中提供DNA多核苷酸，该缓冲溶液包括防止DNA降解的任何合适成分。该缓冲液可以例如是包括EDTA(例如0.1mM)的3/40缓冲液或TE缓冲液(10mM Tris，ImM EDTA)。优选缓冲液可以包括DNA酶阻断化合物或DNA酶抑制剂。还设想提供例如通过逆转录从RNA多核苷酸获得的DNA多核苷酸。

DNA多核苷酸的提供还可以涉及获取来自受试者的样品并对其进行处理，例如DNA的提取或促进DNA提取的准备步骤。如本文所用，术语“来自受试者的样品”涉及通过本领域技术人员已知的合适方法从受试者获得的任何生物材料。在本发明的上下文中使用的样品应优选以临床上可接受的方式采集，更优选以保存DNA多核苷酸的方式采集。生物样品可以包括身体组织和/或流体，如血液或血液成分(如血清或血浆)、汗液、痰或唾液、精液和尿液、以及粪便或粪便样品。特别优选地，样品是液体活检样品。

如本文所用，术语“液体活检”涉及对非固体生物组织(主要是血液)的采样和分析。采样在很大程度上是非侵入性的，允许频繁重复采样，从而有助于跟踪随时间变化的突变或修饰，或验证治疗的效率。液体活检采样通常旨在获得不同种类的细胞和/或核酸。例如，可以采样循环内皮细胞(CEC)或细胞游离胎儿DNA(cffDNA)。优选地，对循环肿瘤细胞(CTC)，特别是细胞游离DNA进行采样。因此，在一个特别优选的实施方式中，根据本发明待分析的DNA多核苷酸是细胞游离DNA。

在进一步的实施方式中，生物样品可以含有来源于上皮细胞的细胞提取物或包括上皮细胞的细胞群，优选为赘生性上皮细胞或来源于怀疑为赘生性组织的上皮细胞。可替代地，生物样品可以源自环境，例如源自土壤、湖泊、河流等，或源自动物来源。

在某些实施方式中，细胞可以用作DNA多核苷酸的主要来源。因此，如果需要，可以从获得的身体组织和体液中纯化细胞，然后进一步处理以获得DNA多核苷酸。在某些实施方式中，特别是在初始处理之后，可以合并(pool)样品。本发明优选地设想使用非合并样品。

在本发明的一个特定的实施方式中，生物样品的含量也可以进行富集步骤。例如，样品可以与对某些细胞类型的细胞膜或细胞器特异的配体接触，例如被磁性颗粒官能化。被磁性颗粒富集的材料可随后用于提取DNA多核苷酸。在本发明的其他实施方式中，可以获取和/或使用活检或切除样品。此类样品可以包括细胞或细胞裂解物。此外，可以通过流体或液体样品(例如血液、尿液、汗液等)的过滤过程来富集细胞，例如肿瘤细胞。如上所述，此类过滤过程还可与基于配体特异性相互作用的富集步骤结合。

如本文所用，DNA多核苷酸的“混合物”是指样品或任何起始组合物包括靶标DNA多核苷酸的至少两种(野生型(WT)和突变版本)的情况。本文所用的术语“靶标DNA多核苷酸的野生型”涉及DNA多核苷酸的典型形式，例如基因、外显子、开放阅读框等，因为其通常在自然界中发生，例如在健康个体中，如果DNA多核苷酸与疾病或个体群体中的大多数个体相关。因此，“靶标DNA多核苷酸的突变版本是与WT版本相比其分子结构例如序列发生变化的版本。例如，在DNA多核苷酸与疾病相关的情况下，DNA多核苷酸的突变版本可以与疾病的发生相关，而WT版本可以与健康状态相关。除了所述差异之外，两种分子通常是相同的或至少高度相似的。因此，在本发明的上下文中，两者均被认为是靶标DNA多核苷酸。如上所述的两种实体的混合物可以具有允许对两种实体进行识别的任何比例。

在一个特定的实施方式中，在提供至少包括靶标DNA多核苷酸的WT版本和突变版本的DNA多核苷酸的混合物之后，进行所述DNA多核苷酸的末端修复和A尾添加的可选步骤。该步骤旨在将具有钝的或突出的3'或5'末端的DNA多核苷酸转化成包括3'A突出端的DNA多核苷酸，所述3'A突出端被磷酸化并且可用于随后的连接反应。该步骤的执行很大程度上取决于DNA多核苷酸的形式和来源。在某些实施方式中，它也可以被修改和/或适应于必要性。例如，如果不需要末端修复步骤或DNA多核苷酸上已经存在合适的平末端，则可以不使用末端修复活性。类似地，在DNA多核苷酸中已经存在合适的A突出端的情况下，不需要A尾添加活性，其可以被相应地跳过。末端修复可以通过任何合适的末端修复酶活性来进行，例如DNA聚合酶I(优选其Klenow片段)、T4 DNA聚合酶或T4多核苷酸激酶。优选在20℃下用T4DNA聚合酶、T4 PNK和Klenow进行末端修复。可以通过任何合适的A尾添加酶活性(如TaqDNA聚合酶或Klenow片段)来进行A尾添加活性。优选在65℃下用Taq DNA聚合酶进行A尾添加。可以从合适的文献来源获得更多细节，如核酸研究Nucleic Acids Research,2010,38,13,e137。

在另一个优选的实施方式中，在所述DNA多核苷酸的末端修复和A尾添加步骤之后，或者如果DNA多核苷酸已经包括合适的A突出端，而没有所述末端修复和A尾添加步骤，则对具有茎环寡核苷酸的DNA多核苷酸进行环化的步骤。

通常，首先将茎环寡核苷酸连接至所述DNA多核苷酸。连接优选发生在DNA多核苷酸的两个末端。进一步优选地，该连接在双链DNA多核苷酸的3'末端使用3'突出端核苷酸，更优选在双链DNA多核苷酸的3'A突出端使用。在典型的实施方式中，茎环寡核苷酸包括3'突出端，其与DNA多核苷酸上的相应突出端相容。在DNA多核苷酸处有3'A突出端的情况下，茎环寡核苷酸可包括互补的3'T突出端。本文所用的术语“连接”涉及茎环寡核苷酸的退火反应，然后是退火的茎环寡核苷酸的合适的键形成反应，通常是连接。连接可以是化学或酶促连接。酶促连接是优选的。化学连接通常需要缩合剂的存在。本发明所设想的化学连接的一个实例利用亲电的硫代磷酸硫酯基。进一步的实例包括使用溴化氰作为缩合剂。可以用技术人员已知的任何合适的酶促连接酶进行酶促连接。合适的连接酶的实例包括T4 DNA连接酶、大肠杆菌DNA连接酶、T3 DNA连接酶和T7 DNA连接酶。可替代地，可以使用连接酶，如Taq DNA连接酶、Tma DNA连接酶、9°N DNA连接酶、T4聚合酶1、T4聚合酶2或热稳定的5'AppDNA/RNA连接酶。

在另一步骤中，可以在与茎环寡核苷酸连接之后，或者可替代地在没有所述连接的情况下，即DNA多核苷酸不与茎环寡核苷酸连接，将DNA多核苷酸环化。本文所用的术语“环化”涉及线性核酸分子向环状核酸分子的转化。原则上，可以通过连接多核苷酸的两个末端或通过解链所述多核苷酸同时通过环元件的存在而保持3'和5'末端的连贯性来实现环化。优选地，遵循基于循环元素的策略。在该实施方式中，循环包括解链步骤，例如将反应温度升高至DNA多核苷酸的解链温度。所得分子是环状ssDNA多核苷酸。

特别优选的是，通过DNA多核苷酸和本文定义的茎环寡核苷酸的先前连接来辅助链分离和转化为环状ssDNA分子。

本文所用的术语“茎环寡核苷酸”是指核酸，通常是DNA寡核苷酸，其包括部分双链节段，该部分双链节段包括双链茎节段和连接双链节段的发夹或发夹环节段。因此，茎部分通常包括同一链的两个区域，当以相反的方向阅读时，它们在核苷酸序列上是互补的。这些节段可以碱基配对并形成以不成对的环结尾的双螺旋。

不希望受到理论的束缚，据信茎环结构的形成取决于所得的螺旋和环区域的稳定性。第一个先决条件通常是存在一个序列，该序列可以自身折叠以形成配对的双螺旋。该螺旋的稳定性主要取决于其长度，其可能含有的错配或凸起的数量以及配对区域的碱基组成。由于鸟嘌呤和胞嘧啶之间的配对具有三个氢键，与腺嘌呤-胸腺嘧啶配对只有两个氢键相比，它们更稳定。在某些实施方式中，茎节段包括比腺嘌呤-胸腺嘧啶配对更多的鸟嘌呤-胞嘧啶配对。

此外，环的稳定性可能会影响茎环结构的形成。优选发夹环不小于三个碱基，例如4、5、6、7、8个或更多个碱基长。进一步优选的是，环的长度不超过约10至12个碱基，因为大的环通常趋于不稳定。在某些实施方式中，环的大小可以大于12个碱基，并显示出其他二级结构，如假结。特别优选的是，环的长度为约4至8个碱基。在一些实施方式中，环具有序列5'-TNCG-3'，即，是由于其组成核苷酸的碱基堆积相互作用而稳定的四环。

如上所述，根据本发明的茎环寡核苷酸可以在特定的实施方式中另外包括条形码序列或节段。如本文所用，术语“条形码序列”或“条形码节段”涉及人为地包括在多核苷酸中并且在表征步骤之后(例如在测序之后)用于识别目的的序列。条形码节段因此可以通知用户正在表征例如采样的几个样品中的哪一个。因此，条形码节段包括唯一的序列，该唯一的序列仅被提供一次，即仅针对如上所述的一个分子/多核苷酸。条形码序列优选不同于已知的天然序列基序。在其他实施方式中，其优选地足够长以避免与自然发生的序列或不同的条形码序列混淆。根据优选的实施方式，条形码序列的长度为至少6至约12个或更多个核苷酸。在某些实施方式中，条形码节段可以在本发明的多核苷酸中存在一次或多次。如果存在一个以上的条形码节段，例如2、3、4或5或更多，则每个节段的区分(即索引顺序)是不同的，因此允许两个或多个独立的识别过程。条形码序列可以例如有利地用于多路复用于不同的患者或不同的患者样品等。进一步的细节对于技术人员将是已知的，或者可以从合适的文献来源中获得，如Kozarewa et al.,2011,Methods Mol.Biol.733,279-298。

如上所述，在特定的实施方式中，根据本发明的茎环寡核苷酸可以可替代地或另外地包括限制酶识别位点。限制酶识别位点可以位于茎环节段内的任何合适的位置。限制酶识别位点优选位于茎环寡核苷酸的茎节段中。它允许在所述寡核苷酸或与其相连或包括它的任何分子中的切割。例如，在进行了如本文所述的RCA之后，扩增的DNA多核苷酸的每个重复单元包括至少一个限制性酶识别位点的单元。随后可以在任何合适的时间点将其切割(cleave)或切割(cut)，例如，如果将较长的串联体尺寸减小为较短的片段或单个重复单元。本文所用的术语“切割("cleaving"或"cleavage")”是指双链切割，即通常通过限制酶或限制核酸内切酶进行的在双链核酸分子中通过每条链的切口。用于该活性的限制酶可以是技术人员已知的任何合适的限制酶。通过在限制酶识别位点切割，可以产生在切割位点的任何合适的末端。此类末端可以是粘性末端，即包括5'或3'突出端，也可以是平末端，即没有突出端。优选获得粘性的末端。进一步优选的是，粘性末端是3'突出端。在特别优选的实施方式中，突出端是1个核苷酸的3'突出端。甚至更优选的是3'突出端是1个核苷酸A突出端。因此，设想限制酶识别位点是一个在被同源限制酶切割时提供3'A突出端的位点。

在一组特定的实施方式中，限制酶识别位点可以具有序列5'-ACAGT-3'或5'-TCAGA-3'。根据另外的实施方式，可以在第三位置切割限制性酶识别位点5'-ACAGT-3'以产生5'-ACA/GT-3'，从而提供1个核苷酸的3'突出端，更具体地提供1个核苷酸的3'A突出端。已知酶Bst4CI、HpyCH4III和Taal可识别限制酶识别位点5'-ACAGT-3'。因此，这些酶可以优选在本发明的上下文中使用。根据不同的实施方式，限制酶识别位点5'-TCAGA -3'可以在第三位置被切割以产生5'-TCA/GA-3'，从而提供1个核苷酸的3'突出端，更具体地提供1个核苷酸的3'A突出端。已知酶Hpyl88I识别限制性酶识别位点5'-TCAGA-3'。因此，这些酶可以优选在本发明的上下文中使用。

在本发明方法的后续步骤中，通过滚环扩增(RCA)来扩增DNA多核苷酸。本文使用的术语“滚环扩增”或“RCA”涉及等温酶促过程，其中通常使用环状DNA模板和合适的聚合酶将通常短的DNA多核苷酸扩增以形成长的单链DNA多核苷酸。RCA产物通常是串联体，其含有与环状模板互补的若干(例如5至500个)串联重复序列。通常，合适的DNA聚合酶用于该过程。实例包括Phi29聚合酶、Bst聚合酶或外切DNA聚合酶。优选使用Phi29聚合酶。在本发明的上下文中使用的RCA模板是单链环状DNA分子。本质上，该反应是将核苷酸连续添加至被退火至所述环状ssRNA模板的引物上。因此，本发明设想例如通过使用一种或多种适当退火的寡核苷酸，将在步骤(i)中获得的双链DNA多核苷酸转化成环状模板并将所述模板转化成链状形式。

在一个优选的实施方式中，用对靶标DNA多核苷酸的至少一部分特异的一种或多种寡核苷酸进行RCA。如本文所用，术语“对靶标DNA多核苷酸特异的”涉及寡核苷酸和DNA多核苷酸之间的序列互补性，其允许将所述寡核苷酸退火至DNA多核苷酸并随后进行扩增反应。因此，术语“互补的”或“互补性”是指在相反的核酸链中，即在寡核苷酸和DNA多核苷酸中，存在匹配的碱基对。例如，互补链或反义链的核苷酸或碱基T与有义链中的核苷酸或碱基A结合，反之亦然；同样，互补链或反义链的核苷酸或碱基C与有义链中的核苷酸或碱基G结合，反之亦然。在本发明的某些实施方式中，可以通过在有义和/或反义链内存在单个或多个非互补碱基或核苷酸延伸的可能性来修饰这种完全或完美互补的方案。因此，为了落入一对有义和反义链的概念之内，两条链可以是完全互补的或可以仅是部分互补的，例如显示出在两条链的所有核苷酸之间或本文定义的特定节段中所有核苷酸之间约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或100％的互补性。非互补碱基可以包括核苷酸A、T、G、C之一，即，例如在A和G之间、或者在T和C之间显示错配，或者可以包括任何修饰的核苷碱基，包括例如WIPO标准ST.25中所述的修饰的碱基。此外，本发明还设想了不同核酸分子之间的互补性，例如DNA链与RNA链、DNA链与PNA链、DNA链与CNA链等之间的互补性。优选地，如本文所定义的链或片段之间的互补性是完全或100％互补性。

寡核苷酸和DNA多核苷酸的“特异性”退火意味着完全或部分互补/部分匹配是可能的，其允许识别DNA多核苷酸，但是在某些实施方式中，其也接受不匹配核苷酸的存在。例如，在退火发生在DNA多核苷酸的不同节段的情况下，用WT靶标DNA多核苷酸以及如本文所定义的突变靶标DNA多核苷酸进行特异性退火是可能的。如果突变体因单核苷酸多态性或2至3个核苷酸差异而不同，则特别设想此类退火。在其他实施方式中，特异性退火可以涉及完全的互补性，这可以通过DNA多核苷酸的节段中的结合来实现，该结合不受本发明的靶标DNA多核苷酸的WT和突变版本的差异所反映的序列修饰的影响。

如本文所用，在某些实施方式中，术语“对靶标DNA多核苷酸的至少一部分特异的”是指寡核苷酸可与所述靶标DNA多核苷酸具有至少互补的重叠。该重叠可以例如是4、5、7、6、7、8、9、10、12、15、18或20个核苷酸的重叠，或者是在所述值之间的任何值。重叠可以取决于寡核苷酸的大小，并且可以相应地进行调整。在所述重叠内，互补碱基之间的匹配或互补性优选为100％。在替代实施例中，匹配小于100％，例如99％、95％、90％、85％或小于85％。可以通过设定退火温度来进一步调整退火的特异性，其中较高的温度增加特异性。杂交温度可以由技术人员根据已知规则在很大程度上取决于所涉及的序列来计算。特别优选的是，杂交条件和寡核苷酸设计(包括其长度)适合于本文所定义的用于RCA的聚合酶的工作条件。例如，在使用Phi29聚合酶的实施方式中，可以使用约30℃的加工温度。

在某些替代实施方式中，寡核苷酸可以对如上所述的茎环寡核苷酸序列特异的，或者它可以至少部分地与所述茎环寡核苷酸序列的至少一部分结合。

在一个非常特定的实施方式中，针对RCA执行以下步骤：连接后，将寡核苷酸添加到连接的DNA。随后如上所述进行解链步骤。解链后，降低温度，并使寡核苷酸结合至其靶标序列。随后添加聚合酶，例如Phi29聚合酶，以扩增环状模板。

在某些实施方式中，仅一种结合至靶标DNA多核苷酸的寡核苷酸可用于RCA。在其他实施方式中，可以使用一种以上的寡核苷酸，例如2、3、4、5种等。这些寡核苷酸可以优选在靶标DNA多核苷酸中的不同位置结合，优选地不受由靶标DNA多核苷酸的WT和突变版本的差异所反映的序列修饰影响的那些寡核苷酸。

寡核苷酸可以具有任何合适的大小，例如6至30个核苷酸。优选的寡核苷酸是六聚体、七聚体或八聚体。如果RCA使用了一种以上的不同寡核苷酸，则优选使用相似或相同的大小。

RCA可以在任何合适的温度下，例如在室温或高达37℃的温度下进行。该温度可以是恒定温度。RCA可以进一步在任何合适的环境中进行，例如在溶液中或在固体支持物上。在特定的实施方式中，还设想在复杂的生物环境中(如在细胞表面上)的RCA反应。

在另一个实施方式中，可以进行RCA，直到扩增的DNA多核苷酸具有确定的、优选预定的大小。大小可以取决于为获得的DNA多核苷酸计划的后续活性。例如，如果要用基于跨膜孔的测序技术进行DNA多核苷酸的表征，则优选长扩增。在替代实施方式中，如果要执行不同的NGS方法，这通常需要短输入多核苷酸，则可以获得短扩增子。扩增子的大小可以是至少300个核苷酸，优选地可以在约300个核苷酸至约10000个核苷酸的范围内，更优选地，其可以在约300至7000个核苷酸的范围内，例如300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000个或上述大小之间的任何值。在最优选的实施方式中，它的大小可以为至少约3000个核苷酸。在另外的优选实施方式中，也可以通过切割更长的扩增物而获得短片段，例如通过如本文所述的茎环结构中存在的限制性酶识别位点。

扩增物(amplificate)的大小可以通过任何合适的手段来控制，例如使用温度控制，例如加热变性步骤，或加入抑制分子、加入EDTA、或加入蛋白酶等。优选通过使用加热变性步骤来控制扩增物的大小。

在某些另外的实施方式中，本发明所设想的RCA还可以包括多重扩增步骤，其中例如本文所定义的多个寡核苷酸与相同的靶标DNA多核苷酸环杂交或退火，从而允许同时产生多个RCA产物。类似地，可以执行超支化RCA，其中RCA产物用作模板以用第二或第三组寡核苷酸进一步扩增。

在本发明中还设想了监测和检测RCA过程。这可以通过将荧光染料掺入RCA产物中来实现，例如通过荧光团偶联的dTNP或与荧光团连接的互补链杂交。因此可以借助荧光光谱、流式细胞术或显微镜术进行检测。还设想使用金纳米颗粒、磁珠或量子点来检测RCA产物。

优选地，借助于凝胶电泳分析来进行RCA过程的监测和检测。进一步的RCA详细信息可以从适当的文献资料中获得，例如Ali et al.,2014,Chem.Soc.Rev.,43,3324-3341。

在一个特定的实施方式中，可以使用T7核酸内切酶和DNA聚合酶修复获得的滚环扩增产物。例如，T7核酸内切酶I和T4 DNA聚合酶活性可用于去除错配结构并用于修复目的。可选地，连接酶活性也可以用于该目的。

在本发明的方法的另一步骤中，使用对所述WT版本特异的合成的单链向导RNA(sgRNA)和sgRNA引导的核酸结合蛋白来识别并切割靶标DNA多核苷酸的WT版本。

通常，此步骤基于CRISPR/Cas系统的使用。如本文所用，术语“CRISPR/Cas系统”涉及特异性切割和修饰核酸的生化方法。例如，通常可以使用CRISPR/Cas系统来插入、去除或关闭基因组中的基因，也可以改变基因或核酸分子中的核苷酸。CRISPR/Cas系统的概念和活性步骤的作用与RNA干扰具有多种相似性，因为约18至20个核苷酸的短RNA片段在两种细菌防御机制中介导了与靶标的结合。在CRSIPR/Cas系统中，通常RNA引导的核酸结合蛋白，如Cas蛋白，结合某些RNA序列作为核糖核蛋白。例如，Cas核酸内切酶(例如Cas9、Cas5、Csn1或Csxl2或其衍生物)可以结合至被称为crRNA重复的某些RNA序列，并在这些序列的紧邻处切割DNA。不希望被理论所束缚，据信crRNA重复序列形成二级RNA结构，然后被核酸结合蛋白(例如Cas)结合，该核酸结合蛋白改变其蛋白折叠，从而允许靶标DNA被RNA结合。此外，在靶标DNA中必须存在PAM基序，即原间隔子相邻基序，以激活核酸结合蛋白(例如Cas)。通常在PAM基序之前将DNA切割三个核苷酸。crRNA重复序列之后通常是与靶标DNA结合的序列，即crRNA间隔子；通常将两个序列，即crRNA重复基序和靶标结合节段标记为“crRNA”。crRNA的第二部分(靶标结合节段)是具有可变转接子功能的crRNA间隔子序列。它与靶标DNA互补，并与所述靶标DNA结合。还需要另外的RNA、tracrRNA或反式作用CRISPR RNA。tracrRNA与crRNA部分互补，使得它们彼此结合。tracrRNA通常与前体crRNA结合，形成RNA双螺旋，并被RNase III转化为活性形式。这些性质允许结合至DNA并通过结合位点附近的核酸结合蛋白(例如Cas)的核酸内切酶功能进行切割。

在本文中，本文使用的术语“合成的单链向导RNA(sgRNA)”或“单链向导RNA(sgRNA)”涉及如上所述的CRISPR/Cas系统的crRNA和tracrRNA序列的人工或合成组合。通常，sgRNA包括靶标特异性序列，其可用于将DNA结合蛋白引导向结合位点。该靶标特异性序列可以具有任何合适的长度。优选地，所述长度在约19至30个核苷酸之间。更优选地，该序列具有20个核苷酸的长度。

如Jinek et al.,2012,Science,337,816-821所述，crRNA和tracrRNA可以被组合成实现上述两种活性(crRNA和tracrRNA)的功能性品种(sgRNA)。例如，crRNA-sp2的核苷酸1-42、crRNA-sp2的核苷酸1-36或crRNA-sp2的核苷酸1-32可以与tracrRNA的核苷酸4-89结合。获得sgRNA的其他选择可以从Nowak et al.,2016,Nucleic Acids Research,44,20,9555–9564获得。例如，可以提供包括不同形式的上部茎结构的sgRNA，或者其中间隔区序列被差异性地从标准的20个核苷酸截短到14或15个核苷酸。进一步设想的变体包括从下部茎中去除推定的RNAP III终止子序列的那些。还设想了一种变体，其中延长了上部茎以增加sgRNA的稳定性并增强了其与sgRNA引导的核酸结合蛋白(例如Cas蛋白)的组装。根据本发明的其他实施方式，sgRNA的序列和形式可以根据sgRNA引导的核酸结合蛋白(例如Cas蛋白)的形式或同一性而变化。因此，取决于所述sgRNA引导的核酸结合蛋白的来源，可以使用序列元件的不同组合。本发明进一步设想了在这种情况下的任何未来发展，并且包括对sgRNA-核酸-结合蛋白相互作用的任何修饰或改进，其超过了可来源于Jinke et al.,2012或Nowak et al.,2016的信息。在特定的实施方式中，待使用的sgRNA可以具有SEQ ID NO:1至3中任一个的序列。

特别优选化脓链球菌sgRNA的用途，例如用在可商购的试剂盒中，如由新英格兰生物实验室公司提供的EnGen sgRNA合成试剂盒。还设想了来自其他商业供应商的类似sgRNA形式，或单独制备的sgRNA。如果与同源核酸结合蛋白形式的化脓性链球菌一起使用，则此类sgRNA可以源自SEQ ID NO:1的序列。可替代地，如果与同源核酸结合蛋白形式的金黄色葡萄球菌(Staphylococcus aureus)一起使用，则sgRNA可以源自SEQ ID NO:2的序列。在另一替代方案中，如果与同源核酸结合蛋白形式的嗜热链球菌一起使用，则sgRNA可以源自SEQ ID NO:3的序列。

本发明的中心原理是使用与sgRNA内的靶标DNA节段结合的序列，其中所述结合序列对靶标DNA多核苷酸的WT版本是特异性的，因此能够识别所述序列并将其与其他序列区别开来，特别是不同于结合节段的突变序列。根据如上定义的CRSPR/Cas方法，随后可以通过应用或添加合适的sgRNA引导的核酸结合蛋白来切割已被sgRNA识别的WT序列。

在优选的实施方式中，本文使用的“sgRNA引导的核酸结合蛋白”是DNA结合Cas蛋白。此类DNA结合Cas蛋白的实例是Cas2、Cas3、Cas5、Csnl或Csxl2或Cas9。还设想了其衍生物或突变体。在特别优选的实施方式中，sgRNA引导的核酸结合蛋白来源于Cas9蛋白家族或其衍生物。甚至更优选地，sgRNA引导的核酸结合蛋白是Cas9或其衍生物。衍生物优选是具有核酸酶活性的功能性衍生物。本发明进一步设想了使用源自不同细菌来源的Cas9。例如，Cas9蛋白可以来源于化脓性链球菌、金黄色葡萄球菌或嗜热链球菌。优选地，Cas9是化脓链球菌Cas9蛋白。有关Cas蛋白形式和用途的更多详细信息，可从适当的文献来源中获得，例如Jiang and Doudna,2017,Annu.Rev.Biophys.,46,505-529；Makarova et al.,2011,Biology Direct,6,38；或Wang et al.,2016,Annu.Rev.Biochem.,85,22.1-22.38。

通过sgRNA引导的活性在RCA串联体中切割WT序列通常导致提供几个小片段，例如由于重复RCA方法引入的序列，其长度对应于RCA的原始环状模板。因此，获得了未切割的(突变的)分子和切割的(WT)分子之间的显著大小差异。本文使用的术语“未切割的”分子或多核苷酸涉及未被本文定义的特异性sgRNA识别的靶标DNA多核苷酸。此类多核苷酸可以包括与来自WT序列的sgRNA结合节段的任何序列差异。在某些实施方式中，序列差异是单核苷酸多态性。还设想插入、缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸等。

在该方法的下一步骤中利用了如上所述的大小差异，其中根据这两种DNA多核苷酸形式之间的大小差异，将未切割的突变靶标DNA多核苷酸与切割的WT片段分离。可以用任何合适的方法来执行该大小选择步骤。例如，可以使用基于琼脂糖凝胶或聚丙烯酰胺凝胶的方法或基于珠子的方法。特别优选使用磁珠，其可以在合适的条件下与不同长度的DNA多核苷酸结合。

随后可以将获得的靶标多核苷酸即包括突变序列基序的DNA多核苷酸进行纯化、储存和/或用于另外的活性。

在该方法的最后步骤中，对未切割的突变靶标DNA多核苷酸进行表征。本文所用的术语“表征”涉及DNA多核苷酸某些特征的测定。根据本发明要测定的特征之一是DNA多核苷酸的长度。在另一个实施方式中，根据本发明待测定的DNA多核苷酸的另一个特征是DNA多核苷酸的GO含量。还设想识别指示特定功能的某些基序或序列延伸或其缺失，或识别DNA多核苷酸的同一性。特别优选的是DNA多核苷酸序列的表征。

如本文所用，术语“序列的表征”涉及技术人员已知的任何合适的测序方法。优选地，可以使用下一代序列(NGS)或第二代测序技术，其通常是以高度并行方式执行的大规模并行测序方法。例如可以根据并行测序方法在如Roche 454、GS FLX Titanium、Illumina、Life Technologies Ion Proton、Oxford Nanopore Technologies、Solexa、Solid orHelicos Biosciences Heliscope系统的平台上进行测序。在某些实施方式中，测序还可包括多核苷酸的另外制备、测序以及随后的成像和初始数据分析步骤。

用于测序分析的制备步骤可以例如包括用具有同源限制酶识别位点的限制酶切割多核苷酸，优选在本文所述的茎环寡核苷酸中。可替代地，可以将多核苷酸随机地断裂成较小的尺寸。从而产生测序模板，如片段模板。因此，未切割的串联DNA多核苷酸可以减小尺寸以与同源测序方法相容。还设想了用合适的测序技术对未切割的串联DNA多核苷酸进行直接测序。

空间分离的模板可以例如附着或固定在固体表面上，这允许同时进行测序反应。在典型的实例中，产生核酸片段的文库，并将含有通用引物位点的转接子连接至片段的末端。随后，将片段变性成单链并被珠子捕获。扩增后，大量模板可以附着或固定在聚丙烯酰胺凝胶中，或化学交联到氨基涂层的玻璃表面，或沉积在单独的滴定板上。可替代地，可以采用固相扩增。在这种方法中，通常将正向和反向引物连接到固体支持物上。扩增片段的表面密度由引物与支持物上模板的比率定义。这种方法可以产生数百万个空间分离的模板簇，这些模板簇可以与通用测序引物杂交，以进行大规模并行测序反应。其他合适的选择包括多种位移扩增方法。合适的测序方法包括但不限于环状可逆终止(CRT)或通过Illumina的合成测序(SBS)、通过连接测序(SBL)、单分子加成(焦磷酸测序)或实时测序。使用CRT方法的示例性平台是Illumina/Solexa和HelicoScope。示例性的SBL平台包括Life/APG/SOLiD支持寡核苷酸连接检测。示例性的焦磷酸测序平台是Roche/454。示例性的实时测序平台包括Pacific Biosciences平台和Life/Visi-Gen平台。获得大量并行核酸序列数据的其他测序方法包括纳米孔测序、杂交测序、基于纳米晶体管阵列的测序、基于扫描隧道显微镜(STM)的测序或基于纳米线分子传感器的测序。关于测序方法的更多细节对于技术人员将是已知的，或者可以从合适的文献来源中获得，如Goodwin et al.,2016,NatureReviews Genetics,17,333-351；van Dijk et al.,2014,Trends in Genetics,9,418-426；或Feng et al.,2015,Genomics Proteomics Bioinformatics,13,4-16。

可以根据技术人员已知的任何合适的方案通过剪切或片段化方法获得未切割的DNA多核苷酸的尺寸减小。此类方法包括限制酶切消化、自适应聚焦声波剪切(AFA)或Covaris剪切、使用雾化力、超声处理、点片(point-sink)剪切或使用法压(French press)剪切程序。如上所述，优选在茎环寡核苷酸中利用限制酶消化。进一步优选所获得的多核苷酸的大小是相似的或在预定范围内。设想的范围是约120至约400个核苷酸。特别优选的是约150至300个核苷酸的大小。

在特别优选的实施方式中，如上所述的表征步骤(v)包括与跨膜孔碱基序列表征有关的另外的子步骤。通常，此类表征包括以下步骤：(v-a)将与DNA易位酶和至少一个胆固醇系链节段相关的转接子多核苷酸与步骤(iv)中获得的突变靶标DNA多核苷酸连接；(v-b)使步骤(v-a)中获得的修饰的DNA多核苷酸与跨膜孔接触，以使DNA易位酶控制DNA多核苷酸移动通过跨膜孔，并且胆固醇系链将DNA多核苷酸锚定在跨膜孔附近；以及(v-c)在DNA多核苷酸移动通过所述跨膜孔期间进行一次或多次测量，其中该测量指示DNA多核苷酸的一种或多种特征，从而表征靶标DNA多核苷酸。

本文所用的术语“转接子多核苷酸复合物”是指多核苷酸的复合物，其尤其包括促进DNA易位酶进入跨膜孔的序列。在本发明的特定的实施方式中，所述转接子多核苷酸复合物包括一对两个至少部分互补的多核苷酸。特别优选地，所述转接子多核苷酸复合物连接至DNA多核苷酸的两条链，以表征两条链。

在某些实施方式中，转接子复合物的与DNA易位酶相关联的部分可包括前导序列。通常，如本文所述，所述前导序列穿入跨膜孔。前导序列可以进一步包括另外的片段，如一个或多个间隔子。间隔子可以例如包括能够使DNA易位酶暂停的序列。特别优选的是，前导序列包括DNA易位酶的结合位点。如本文所用，术语“DNA易位酶结合位点”包括一定长度的DNA或DNA类似物序列，其允许一种或多种DNA易位酶与其结合。结合位点的长度通常取决于应与其结合的DNA易位酶的数量。DNA易位酶能够结合的区域优选是多核苷酸，如DNA、修饰的多核苷酸(例如脱碱基DNA)、PNA、LNA或聚乙二醇(PEG)。优选地，DNA易位酶的结合位点是单链的非杂交区。因此，在优选的实施方式中，所述转接子多核苷酸复合物预先结合至一个或多个DNA易位酶。如本文所用，术语“DNA易位酶”涉及运动蛋白，其能够与本文所述的跨膜孔相互作用，并因此将多核苷酸作为单链实体运输通过所述孔，即，控制如本文所述的多核苷酸的易位，例如，如上文所定义的DNA多核苷酸，优选根据本发明获得的串联DNA多核苷酸。合适的易位酶的实例包括DNA解旋酶，如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶。

在进一步的实施方式中，前导序列可以包括一个或多个阻断位点，其能够防止DNA易位酶的向后移动或阻止所述酶从跨膜孔中滑出。

转接子多核苷酸复合物可以进一步与系链节段相关或包括系链节段。如本文所用，术语“系链节段”涉及能够将转接子多核苷酸复合物和与其连接的任何其他元件偶联至双层膜的元件。偶联通常是瞬时的，并且通过任何合适的分子进行传递，优选胆固醇实体或脂肪酸，更优选胆固醇实体，如胆固醇-TEG分子。因此，偶联有助于将转接子多核苷酸复合物及其相关元件锚定在跨膜孔处或附近，从而允许引入相反位置的DNA多核苷酸进入跨膜孔并进行表征。特别优选的是，在DNA多核苷酸的两条链上都提供所述系链节段，以允许对两条链进行表征。

可用于偶联至膜的替代化合物包括生物素、硫醇或脂质。除偶联官能度外，系链通常还包括非RNA多核苷酸，其连接至所述偶联实体，例如胆固醇实体。系链节段可以进一步包括一个或多个接头节段，例如可变长度的一部分，其可用于增加靶标DNA多核苷酸与跨膜孔之间的距离以促进其表征。在另外的实施方式中，该接头可以包括如本文上文所定义的DNA易位酶结合位点。

多核苷酸复合物与在先前步骤中获得的多核苷酸的连接可以通过连接步骤来进行。可替代地，可以使用任何其他合适的连接方法，例如通过点击化学或共价键合等进行化学连接。优选进行所述连接，使得DNA易位酶与待表征的DNA多核苷酸连接，并且系链元件连接至互补链。

在进一步的步骤中，将在先前步骤(v-a)中获得的修饰的DNA多核苷酸与跨膜孔接触，使得DNA易位酶控制DNA多核苷酸移动通过跨膜孔，并且胆固醇系链将DNA多核苷酸锚定在跨膜孔附近。通常，本文所述的系链锚定的功能是将分子带到跨膜孔所在的膜表面。在这种情况下，由于可以更轻松地达到跨膜孔，因此可以促进DNA多核苷酸的表征。如本文所用，术语“跨膜孔”涉及跨越双层膜的蛋白质，该双层膜包括能够引导通过多核苷酸的开口。跨膜孔可以是任何合适的蛋白质。优选的跨膜蛋白的实例包括来源于以下各项的蛋白孔：溶血素、杀白细胞素、MspA、MspB、MspC、MspD、CsgG、lysenin、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏菌自转运蛋白脂蛋白(NalP)或WZA。还设想了可商购的跨膜孔蛋白，如Oxford Nanopore Technology提供的或描述的孔蛋白。

在最终步骤(v-c)中，在DNA多核苷酸移动通过所述跨膜孔期间进行一个或多个测量。所述测量可以指示DNA多核苷酸的一种或多种特征，其允许表征如上文所定义的靶标DNA多核苷酸，特别是DNA多核苷酸的序列。如本文所用，术语“测量”涉及光学和/或电学测量，优选地涉及跨膜孔处的电学测量。通常，在靶标DNA多核苷酸通过跨膜孔时测量通过跨膜孔的电流。所测量的电流通常指示所分析的多核苷酸的一种或多种特征。例如，可以使用现有技术中描述的设备来执行该方法，例如在WO2008/102120中原则上公开的设备或其衍生或修改版本。通常，可以使用膜片钳或电压钳来执行该方法，以在多核苷酸移动通过所述孔时检测跨膜孔上电流的变化。在某些实施方式中，该测量包括使用电荷载体，如金属盐、氯化物盐、离子液体、有机盐，特别是NaCl、KCl、CsCl；进一步设想使用合适的缓冲液，例如HEPES、Tris-HCl等；进一步设想使用核苷酸，例如AMP、ADP、ATP、dAMP、dADP、dATP等，这些核苷酸可用于易位酶活性；以及酶辅助因子，如Mg²⁺、Ca²⁺、Co²⁺等二价金属离子。

在另一方面，本发明涉及一种试剂盒，该试剂盒包括优选地如本文上文所定义的对靶标DNA多核苷酸的至少一部分特异的一种或多种寡核苷酸、优选地如上文所定义的对靶标DNA多核苷酸的WT版本特异的合成的单链向导RNA(sgRNA)、以及优选地如上文所定义的sgRNA引导的核酸结合蛋白。该试剂盒优选用于表征靶标DNA多核苷酸。如上文所定义的方法的特征也适用于本发明的试剂盒。试剂盒可例如包括如本发明方法的一个或多个步骤中所定义的或为本领域技术人员已知的试剂和组分。例如，试剂盒可包括用于基于本文定义的一种或多种寡核苷酸进行RCA的试剂或组分。此外，它可以包括用于随后修复RCA产物的试剂和组分，如本文所述的T7核酸内切酶和/或DNA聚合酶以及可选的连接酶。试剂盒可替代地或另外地包括用于用本文定义的sgRNA引导的核酸结合蛋白切割靶标DNA多核苷酸的WT版本的试剂和组分。在不同的实施方式中，试剂盒可以包括或可以另外包括用于进行大小选择的试剂或组分。试剂盒通常可以包括合适的缓冲溶液、标记或洗涤液等。此外，试剂盒可以包括一定量的已知核酸分子或蛋白质，其可以用于试剂盒的校准或用作内部对照。相应的成分是技术人员已知的。

在另一个优选的实施方式中，试剂盒可以包括或另外包括进行测序反应所必需的组分。特别优选在试剂盒内提供跨膜孔测序方法所需的组分和试剂。例如，试剂盒可以包括或可以另外包括用于将与DNA易位酶和至少一个胆固醇系链节段相关的转接子多核苷酸复合物连接至本文所述的多核苷酸的试剂或组分。在另一个实施方式中，试剂盒可以包括或可以另外包括用于使如本文所定义的靶标DNA多核苷酸与跨膜孔接触的试剂或组分，以使得DNA易位酶控制靶标DNA多核苷酸移动通过跨膜孔以及胆固醇系链将靶标DNA多核苷酸锚定在跨膜孔附近。在又一个实施方式中，试剂盒可以包括或可以另外包括在靶标DNA多核苷酸移动通过跨膜孔期间进行一次或多次测量的试剂或组分，其中该测量指示靶标DNA多核苷酸的一个或多个特征，如上所述，从而表征靶标DNA多核苷酸。试剂盒可以进一步包括两个或更多个如上所定义的组分或试剂组，例如用于执行如本文中定义的2个步骤、如本文中定义的3个步骤、如本文中定义的4个步骤的组分或试剂等。

另外，该试剂盒可以包括说明书传单和/或可以提供关于其用法等的信息。

还设想了一种执行上述方法步骤的设备。该设备可以例如由可执行本发明的方法的一个或多个步骤的不同模块组成。这些模块可以以任何合适的方式组合，例如，它们可以存在于单个位置或分开。还设想了该方法在不同的时间点和/或在不同的位置处的执行。如本文所定义的方法的一些步骤之后可以中断或暂停，其中将试剂或产物等适当地存储在例如冰箱或冷却装置中。如果在如本文所定义的设备的特定模块中执行这些步骤，则所述模块可以用作存储工具。模块可以进一步用于将反应产物或试剂运输到不同的位置，例如不同的实验室等。

本发明还设想了如上所述的一种或多种试剂盒组分在表征靶标DNA多核苷酸中的用途。

现在转向图1，示出了根据本发明的一个实施方式的使用滚环扩增(RCA)和合成的单链向导RNA(sgRNA)表征靶标DNA多核苷酸的步骤的示意图。在第一步中，提供代表靶标DNA多核苷酸的混合物的DNA多核苷酸1。通过末端修复和T尾添加3活性来修饰DNA多核苷酸2。随后，将具有相容的3'T突出端的茎环寡核苷酸4与DNA多核苷酸连接5。该步骤产生具有两个末端都包括茎环寡核苷酸4的ds DNA多核苷酸6。随后将对至少一部分靶标DNA多核苷酸特异的寡核苷酸8退火7至修饰的DNA多核苷酸6。下一步骤是滚环扩增(RCA)9，然后通过DNA聚合酶和可选的连接酶的活性提供ds DNA多核苷酸10。该步骤产生代表WT序列12或突变序列13的串联DNA多核苷酸的混合物。在DNA多核苷酸代表WT序列12的情况下，将串联体用sgRNA和sgRNA引导的核酸结合蛋白(如Cas 9)加工14成较小的片段15。在DNA多核苷酸代表突变序列的情况下，它们保持为未切割的13。未切割的突变DNA多核苷酸随后通过大小选择16与WT序列分离。它们可以被进一步修饰并用于基于跨膜孔17的测序方法18，其在合适的测序仪19中进行。

附图标记

1 代表靶标DNA多核苷酸混合物的DNA多核苷酸

2 DNA多核苷酸的修饰

3 A尾添加的DNA多核苷酸

4 茎环寡核苷酸

5 茎环寡核苷酸与DNA多核苷酸的连接

6 两个末端均带有茎环寡核苷酸的ds DNA多核苷酸

7 退火反应

8 对靶标DNA多核苷酸的至少一部分特异的寡核苷酸

9 滚环扩增(RCA)

10 提供ds DNA多核苷酸

11 串联DNA多核苷酸的混合物

12 WT序列的串联体

13 突变序列的串联体

14 用sgRNA和sgRNA引导核酸结合蛋白进行加工

15 WT序列的串联体片段

16 突变串联体的大小选择

17 跨膜孔

18 测序反应

19 测序仪

下图仅供说明。因此，应当理解，该附图不应被解释为限制性的。本领域技术人员将清楚地能够设想对本文提出的原理的进一步修改。

Claims

1.一种表征靶标DNA多核苷酸的方法，包括：

(i)提供DNA多核苷酸的混合物，所述DNA多核苷酸的混合物至少包括所述DNA多核苷酸的野生型(WT)版本和突变版本；

(ii)通过滚环扩增(RCA)来扩增步骤(i)的所述DNA多核苷酸的混合物，提供扩增的和串联的DNA多核苷酸的库；

(iii)通过使用对所述WT版本特异的合成的单链向导RNA(sgRNA)和sgRNA引导的核酸结合蛋白，优选Cas9，识别和切割所述靶标DNA多核苷酸的所述WT版本；

(iv)对未切割的突变靶标DNA多核苷酸进行大小选择；以及

(v)表征所述未切割的突变靶标DNA多核苷酸。

2.根据权利要求1所述的方法，其中，步骤(v)包括以下子步骤：

(v-a)将与DNA易位酶和至少一个胆固醇系链节段相关的转接子多核苷酸与步骤(iv)中获得的所述突变靶标DNA多核苷酸连接；

(v-b)使步骤(v-a)中获得的修饰的DNA多核苷酸与跨膜孔接触，以使所述DNA易位酶控制所述DNA多核苷酸移动通过所述跨膜孔，并且所述胆固醇系链将所述DNA多核苷酸锚定在所述跨膜孔附近；以及

(v-c)在所述DNA多核苷酸移动通过所述跨膜孔期间进行一次或多次测量，其中所述测量指示所述DNA多核苷酸的一种或多种特征，从而表征所述靶标DNA多核苷酸。

3.根据权利要求1或2所述的方法，其在步骤(i)之后还包括所述DNA多核苷酸的末端修复和A尾添加的步骤(i-a)。

4.根据权利要求3所述的方法，在步骤(i-a)之后还包括用茎环寡核苷酸环化所述DNA多核苷酸的步骤(i-b)，其中所述茎环寡核苷酸包括条形码序列和限制酶识别位点。

5.根据权利要求1至4中任一项所述的方法，其中，用对所述靶标DNA多核苷酸的至少一部分特异的一种或多种寡核苷酸进行所述滚环扩增。

6.根据权利要求5所述的方法，其中对所述靶标DNA多核苷酸的至少一部分特异的所述一种或多种寡核苷酸是六聚体、七聚体和/或八聚体。

7.根据权利要求1至6中任一项所述的方法，其中进行所述滚环扩增，直到所述扩增的DNA多核苷酸具有至少约300个核苷酸的大小，优选地具有约至少3000个核苷酸的大小。

8.根据权利要求5至7中任一项所述的方法，其中使用T7核酸内切酶、DNA聚合酶和可选的连接酶修复来获得的所述滚环扩增产物。

9.根据权利要求1至8中任一项所述的方法，其中，所述靶标DNA多核苷酸代表基因、基因的一个或多个外显子、基因间区域、非转录调控区域和/或开放阅读框或其子部分；或一组不同基因、一组不同基因的一个或多个外显子、一组基因间区域、一组非转录调控区和/或一组开放阅读框或其子部分、或前面提到的任何要素的任何组合。

10.根据权利要求1至9中任一项所述的方法，其中所述靶标DNA多核苷酸是细胞游离DNA(cfDNA)，优选来源于液体活检。

11.根据权利要求1至10中任一项所述的方法，其中所述DNA多核苷酸的所述表征是(i)测定所述DNA多核苷酸的长度，(ii)测定所述DNA多核苷酸的身份，或(iii)测定所述DNA多核苷酸的序列；优选地，所述DNA多核苷酸的序列。

12.根据权利要求2至11中任一项所述的方法，其中所述DNA易位酶是DNA解旋酶，如Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶。

13.根据权利要求2至12中任一项所述的方法，其中所述跨膜孔是来源于以下各项的蛋白孔：溶血素、杀白细胞素、MspA、MspB、MspC、MspD、CsgG、lysenin、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟氏菌自转运蛋白脂蛋白(NalP)或WZA。

14.一种用于表征靶标DNA多核苷酸的试剂盒，其包括对所述靶标DNA多核苷酸的至少一部分特异的一个或多个寡核苷酸、对所述靶标DNA多核苷酸的WT版本特异的合成的单链向导RNA(sgRNA)以及sgRNA引导的核酸结合蛋白，优选Cas9核酸内切酶。

15.根据权利要求14所述的试剂盒，还包括DNA易位酶和胆固醇系链。