CN111065746A

CN111065746A - 用于用重组核酸酶选择性切割核酸的方法和组合物

Info

Publication number: CN111065746A
Application number: CN201980003318.6A
Authority: CN
Inventors: C·L·王
Original assignee: Illumina Inc
Current assignee: Illumina Inc
Priority date: 2018-03-19
Filing date: 2019-03-15
Publication date: 2020-04-24
Also published as: CA3067251A1; US20240076717A1; CA3067251C; AU2019239623A1; AU2019239623B2; US11773427B2; AU2022202908A1; US20210324444A1; EP3768856A1; WO2019182891A1

Abstract

本文提供的方法和组合物的一些实施方式涉及靶核酸的选择性切割。一些这样的实施方式包括用重组核酸酶选择性切割与DNA结合蛋白相关联或包含甲基化CpG岛的靶核酸。在一些实施方式中，DNA结合蛋白包括染色质蛋白。一些实施方式还包括通过选择性切割样品中的靶核酸，和从样品除去切割的靶核酸来富集样品中的非靶核酸。

Description

用于用重组核酸酶选择性切割核酸的方法和组合物

相关申请的交叉引用

本申请要求2018年3月19日提交、题为“METHODS AND COMPOSITIONS FORSELECTIVE CLEAVAGE OF NUCLEIC ACIDS WITH RECOMBINANT NUCLEASES”的美国临时专利申请号62/644697的优先权，其全部内容通过引用并入本文。

序列表的引用

本申请与电子格式的序列表一起提交。序列表作为创建于2019年3月13日、题为ILLINC407WOSEQLISTING的文件提供，其大小为约13Kb。序列表的电子格式的信息的全部内容通过引用并入本文。

技术领域

背景技术

下一代测序技术可用于快速且经济地确定基因组的整个序列。DNA和RNA测序可用于检测病原体和诊断传染病。

下一代测序的应用是执行无偏DNA测序，其中样品没有基于先前的序列知识而富集。没有富集，对患者样品进行测序可产生压倒性大多数的人序列和少数病原体序列，并且检测的灵敏度可太低而无法检测低水平病原体。

发明内容

一些实施方式包括选择性切割宿主DNA的方法：(a)获得包含宿主DNA的样品，其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG；和(b)通过使所述样品与重组蛋白接触来选择性切割所述宿主DNA，所述重组蛋白包含：选择性结合所述DNA结合蛋白或甲基化CpG的结合结构域，和具有切割DNA的活性的核酸酶结构域。在一些实施方式中，所述样品包含非宿主核酸。一些实施方式还包括(c)从非宿主核酸除去切割的宿主DNA。在一些实施方式中，所述非宿主核酸不与所述DNA结合蛋白结合。

在一些实施方式中，所述DNA结合蛋白包括染色质蛋白。在一些实施方式中，所述DNA结合蛋白包括组蛋白。在一些实施方式中，所述结合结构域选择性结合组蛋白。在一些实施方式中，所述组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中，所述结合结构域包含RBBP4蛋白或其片段。

在一些实施方式中，所述非宿主核酸缺乏甲基化CpG。在一些实施方式中，所述结合结构域包含甲基-CpG结合结构域(MBD)。在一些实施方式中，所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。在一些实施方式中，所述结合结构域包含MBD2蛋白或其片段。

一些实施方式包括选择性切割宿主DNA的方法，所述方法包括：(a)获得包含宿主DNA的样品，其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG；和(b)通过使所述样品与以下接触来选择性切割所述宿主DNA：选择性结合所述DNA结合蛋白或甲基化CpG的抗体或其片段，和重组蛋白，所述重组蛋白包含：选择性结合所述抗体或其片段的结合结构域，和具有切割DNA的活性的核酸酶结构域。在一些实施方式中，所述样品包含非宿主核酸。一些实施方式还包括(c)从非宿主核酸除去切割的宿主DNA。

在一些实施方式中，所述DNA结合蛋白包括染色质蛋白。在一些实施方式中，所述染色质蛋白包括组蛋白。在一些实施方式中，所述非宿主核酸不与染色质结合。在一些实施方式中，所述抗体或其片段选择性结合组蛋白。在一些实施方式中，所述组蛋白选自H1、H2A、H2B、H3和H4。

在一些实施方式中，所述非宿主核酸缺乏甲基化CpG。在一些实施方式中，所述抗体或其片段选择性结合包含甲基-CpG结合结构域(MBD)的蛋白。在一些实施方式中，所述包含MBD的蛋白是选自MECP2、MBD1、MBD2和MBD4的蛋白。在一些实施方式中，所述包含MBD的蛋白是MBD2蛋白或其片段。

在一些实施方式中，所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。在一些实施方式中，所述核酸酶结构域包含非特异性核酸内切酶。在一些实施方式中，所述核酸酶结构域包含选自Fok I和Tev I的蛋白或其片段。在一些实施方式中，所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。

在一些实施方式中，所述宿主DNA是哺乳动物DNA。在一些实施方式中，所述宿主DNA是人DNA。在一些实施方式中，所述非宿主核酸选自真核核酸、原核核酸和病毒核酸。

在一些实施方式中，(c)包括选自以下的步骤：使所述非宿主核酸与基质结合，使所述非宿主核酸与捕获探针杂交，和进行凝胶过滤。在一些实施方式中，所述基质包括固相可逆固定化(SPRI)珠。

一些实施方式包括从样品中选择性切割宿主DNA的方法，所述方法包括：(a)获得包含宿主DNA的样品，其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG岛；(b)通过使所述样品与以下接触来选择性切割所述宿主DNA：(i)选择性结合所述DNA结合蛋白或甲基化CpG岛的抗体或其片段，和(ii)重组蛋白，所述重组蛋白包含：选择性结合所述抗体或其片段的结合结构域，和第一核酸酶结构域，和(iii)第二核酸酶结构域，其中所述第一核酸结构域和所述第二核酸酶结构域在一起具有切割DNA的活性。在一些实施方式中，所述样品包含非宿主核酸。一些实施方式还包括(c)从所述非宿主核酸除去切割的宿主DNA。

在一些实施方式中，第二重组蛋白包含所述第二核酸酶结构域和第二结合结构域，其中所述第二结合结构域选择性结合所述抗体或其片段、所述DNA结合蛋白或甲基化CpG岛。在一些实施方式中，所述DNA结合蛋白包括染色质蛋白。在一些实施方式中，所述染色质蛋白包括组蛋白。

一些实施方式包括制备核酸文库的方法，其包括：(a)根据权利要求1-34中任一项所述的方法在包含所述宿主DNA和非宿主核酸的样品中选择性切割宿主DNA，并从所述样品除去切割的宿主DNA；和(b)使所述非宿主核酸与文库制备试剂接触，从而制备核酸文库。在一些实施方式中，(a)是在(b)之前进行。在一些实施方式中，(a)是在(b)之后进行。在一些实施方式中，所述文库制备试剂选自转座子、测序引物和连接酶。

一些实施方式还包括对所述核酸文库进行测序。

一些实施方式包括重组蛋白，其包含：选择性结合DNA结合蛋白、甲基化CpG或抗体的结合结构域；和核酸酶结构域。

在一些实施方式中，所述DNA结合蛋白包括染色质蛋白。在一些实施方式中，所述染色质蛋白包括组蛋白。在一些实施方式中，所述结合结构域选择性结合组蛋白。在一些实施方式中，所述组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中，所述结合结构域包含RBBP4蛋白或其片段。

在一些实施方式中，所述结合结构域包含甲基-CpG结合结构域(MBD)。在一些实施方式中，所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。在一些实施方式中，所述结合结构域包含MBD2蛋白或其片段。

在一些实施方式中，所述结合结构域选择性结合抗体。在一些实施方式中，所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。

在一些实施方式中，所述核酸酶结构域包含非特异性核酸内切酶。在一些实施方式中，所述核酸酶结构域包含选自Fok I和Tev I的蛋白或其片段。在一些实施方式中，所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。在一些实施方式中，所述核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。

一些实施方式包括编码前述重组蛋白中任一种的核酸。

一些实施方式包括包含前述核酸的细胞。

一些实施方式包括用于选择性切割与DNA结合蛋白结合的宿主DNA或包含甲基化CpG的结合的宿主DNA的试剂盒，所述试剂盒包括：(a)权利要求40-52中任一项所述的重组蛋白；和(b)选自以下的试剂：选择性结合DNA结合蛋白或甲基化CpG的抗体，包含第二核酸酶结构域的第二重组蛋白，用于从非宿主DNA除去切割的宿主DNA的试剂，文库制备试剂，核酸测序试剂，和用于未切割核酸的捕获试剂。在一些实施方式中，所述DNA结合蛋白包括染色质蛋白。在一些实施方式中，所述染色质蛋白包含组蛋白。

附图说明

图1描绘了一个实施方式，其中将宿主DNA(10)包装到组蛋白复合物(20)中，而病原体DNA(30)没有包装在这样的复合物中。重组酶(40)与宿主组蛋白复合物结合，并切割宿主DNA，而使病原体DNA(30)完整。

图2描绘了一个实施方式，其中组蛋白核酸酶用于切割人样品中的人DNA，剩余的病原体核酸用于制备用于测序的文库。

图3描绘了一个实施方式，其中从人样品制备核酸文库，并且使用组蛋白核酸酶从文库切割人DNA。

图4描绘了具有核酸酶结构域(50)和组蛋白结合结构域(60)的重组蛋白的实施方式。

图5描绘了具有蛋白G抗体结合结构域(70)和核酸酶结构域(50)的重组蛋白的实施方式。蛋白G抗体结合结构域与抗组蛋白抗体(80)结合，所述抗组蛋白抗体与组蛋白结合。

图6描绘了一个实施方式，其中重组蛋白具有异二聚体核酸酶结构域和两个抗体结合结构域。两个抗体结合结构域各自结合不同种类的抗组蛋白抗体。

图7描绘了一个实施方式，其中重组蛋白具有蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G结合结构域与抗5-甲基胞嘧啶抗体(90)结合，所述抗5-甲基胞嘧啶抗体(90)与5-甲基胞嘧啶(100)结合。

图8描述了一个实施方式，其中重组蛋白包含甲基-CpG结合结构域(110)和核酸酶结构域(50)。甲基-CpG结合结构域与甲基-CpG DNA(100)结合。

图9是加载有纯化的重组蛋白的考马斯蓝染色的聚丙烯酰胺凝胶的照片。泳道1加载有来自未用编码重组脱宿主(dehosting)蛋白的DNA转化的BL21 AI大肠杆菌的阴性对照。泳道2-4加载有在BL21AI大肠杆菌中分别从PGFkShHomol，MBmuFkShELD1和MBwtFkShKKR1 DNA构建体表达的纯化重组蛋白。

图10(左侧小图和右侧小图)是琼脂糖凝胶中溴化乙锭染色的核酸的照片。左侧小图的凝胶加载有组合或不组合纯化的重组甲基化CpG核酸酶(mCpGnuclease)的甲基-CpGDNA或非甲基-CpG DNA。右侧小图的凝胶加载有组合或不组合纯化的mCpGnuclease的甲基CpG DNA或非甲基CpG DNA，或阴性对照。

具体实施方式

本文提供的方法和组合物的一些实施方式涉及靶核酸例如宿主DNA的选择性切割。一些这样的实施方式包括用重组核酸酶选择性切割靶核酸，例如与DNA结合蛋白相关联或包含甲基化CpG岛的宿主DNA。如本文所用，与DNA结合蛋白相关联的核酸(例如宿主DNA)可以包括与DNA结合蛋白(例如染色质蛋白，例如组蛋白)结合的核酸。一些实施方式还包括通过选择性切割样品中的靶核酸，和从样品除去切割的靶核酸来富集样品中的非靶核酸。有利地，所提供的方法和组合物可用于从包含宿主DNA和非宿主核酸的多核苷酸样品极大地富集非宿主核酸，从而提高检测非宿主核酸的灵敏度，以及降低这样的检测的成本。

本文提供的方法和组合物的一些实施方式包括选择性降解宿主DNA的重组蛋白。在一些实施方式中，重组蛋白特异性靶向宿主DNA的特征，例如与宿主DNA相关联的蛋白，例如宿主DNA结合蛋白，例如染色质蛋白，例如组蛋白。在一些实施方式中，重组蛋白特异性地靶向宿主DNA的特征，例如化学特征，例如CpG甲基化，或将宿主DNA与非宿主核酸区分开的任何其他特征。本文提供的方法和组合物的实施方式可用于例如其中非宿主核酸在包含宿主DNA和非宿主核酸的多核苷酸样品中具有特别低的频率的应用中，例如病原体检测。

术语“多核苷酸”和“核酸”在本文可以互换使用，并且是指具有任何长度的核苷酸的聚合形式，即核糖核苷酸或脱氧核糖核苷酸。因此，该术语包括但不限于单链、双链或多链DNA或RNA，基因组DNA，cDNA，DNA-RNA杂合体，或包含嘌呤和嘧啶碱基的聚合物或其他天然的、化学或生化修饰的、非天然的或衍生的核苷酸碱基。

术语“结合”是指由于例如共价、静电、疏水和离子和/或氢键相互作用而在两个分子之间的直接关联。

重组蛋白

本文提供的方法和组合物的一些实施方式涉及具有选择性结合宿主DNA的结合结构域和具有切割DNA的活性的核酸酶结构域的重组蛋白。在一些实施方式中，宿主DNA与DNA结合蛋白相关联，和/或包含甲基化CpG。在一些实施方式中，DNA结合蛋白是染色质蛋白，例如组蛋白。在一些实施方式中，重组蛋白是结合结构域和核酸酶结构域的融合体。

在一些实施方式中，结合结构域可以选择性结合DNA结合蛋白、甲基化CpG或抗体。结合结构域可以将核酸酶结构域靶向至宿主DNA。在一些实施方式中，结合结构域选择性结合与非宿主核酸(例如病原体核酸)未相关联的宿主DNA的特征。

在一些实施方式中，结合结构域选择性结合染色质。染色质包含DNA和相关联的组蛋白和组蛋白蛋白。在一些实施方式中，结合结构域选择性结合人染色质。在一些实施方式中，结合结构域选择性结合真核染色质。在一些实施方式中，结合结构域是染色质结合结构域。在一些实施方式中，染色质结合结构域选择性结合染色质蛋白或核酸。

在一些实施方式中，结合结构域可以选择性结合组蛋白和/或组蛋白结合蛋白。组蛋白存在于真核细胞的细胞核中，也存在于某些古细菌中，即Thermoproteales和Euryarchaea，但不存在于细菌或病毒中。组蛋白通常遍及整个真核染色体DNA。真核生物属于真核生物(Eukaryota或Eukarya)界，可以是单细胞或多细胞生物。真核生物的实例是其细胞具有细胞核和包裹在膜内的其他细胞器的生物，人、动物、植物、真菌和原生动物。

在一些实施方式中，结合结构域选择性结合组蛋白和DNA。图1描绘了一个实施方式，其中重组蛋白(40)切割由组蛋白包装成组蛋白复合物(20)的宿主DNA(10)，而使病原体DNA(30)完整。包含组蛋白结合结构域和核酸酶结构域的重组组蛋白核酸酶的实例描绘于图4中，其包含核酸酶结构域(50)和组蛋白结合结构域(60)。在一些实施方式中，组蛋白(histone或histone protein)可以包括组蛋白，例如H1、H2A、H2B、H3和H4。组蛋白结合结构域可以结合任何组蛋白或其任何变体、成员或等位基因变异。组蛋白可以包括H1、H2A、H2B、H3或H4，或其任何变体。组蛋白的一个实例是两个H2A-H2B二聚体的四聚体和H3-H4四聚体。组蛋白可以包含接头组蛋白：H1或H5。H1的亚家族变体包括H1F和H1H1。H2A的亚家族变体包括H2AF、H2A1和H2A2。H2B的亚家族变体包括H2BF、H2B1和H2B2J。H3的亚家族变体包括H3A1、H3A2和H3A3。H4的亚家族变体包括H41和H44。任何组蛋白的各个亚家族变体可以包括多个成员和/或等位基因变异。

在一些实施方式中，结合结构域包含组蛋白结合蛋白或其片段。在一些实施方式中，结合结构域包含组蛋白结合蛋白RBBP4(RBBP4)。在一些实施方式中，结合结构域包含RBBP4的片段。

在一些实施方式中，结合结构域或其片段衍生自真核生物。在一些实施方式中，结合结构域或其片段衍生自人。在一些实施方式中，结合结构域或其片段衍生自人以外的生物。在一些实施方式中，结合结构域是天然组蛋白结合蛋白或其片段。例如，组蛋白核酸酶的组蛋白结合结构域可以来自天然人蛋白质。在一些实施方式中，结合结构域是修饰或突变的组蛋白结合蛋白或其片段。

在一些实施方式中，组蛋白结合结构域可以包括与组蛋白特异性结合的蛋白结构域，例如染色域、Tudor、恶性脑肿瘤(MBT)、植物同源域(PHD)、溴域、SANT、YEATS，脯氨酸-色氨酸-色氨酸-脯氨酸(PWWP)、溴邻体同源性(BAH)、Akryin重复、WD40重复、ATRX-DNMT3A-DNMT3L(ADD)或zn-CW。在一些实施方式中，组蛋白结合结构域可以包括与来自以下蛋白的组蛋白特异性结合的结构域，例如HAT1、CBP/P300、PCAF/GCN5、TIP60、HB01(ScESAl、SpMSTl)、ScSAS3、ScSAS2(SpMST2)、ScRTTl09、SirT2(ScSir2)、SUV39H1、SUV39H2、G9a、ESET/SETDB1、EuHMTase/GLP、CLL8、SpClr4、MLL1、MLL2、MLL3、MLL4、MLL5、SET1A、SET1B、ASH1、Sc/Sp SET1、SET2(Sc/Sp SET2)、NSD1、SYMD2、DOT1、Sc/Sp DOT1、Pr-SET 7/8、SUV420H1、SUV420H2、SpSet 9、EZH2、RIZ1、LSD1/BHC110、JHDMla、JHDMlb、JHDM2a、JHDM2b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、CARM1，PRMT4、PRMT5，Haspin，MSK1、MSK2、CKII、Mstl、Bmi/RmglA、RNF20/RNF40或ScFPR4或其组蛋白结合片段。在一些实施方式中，结合结构域可以衍生自与组蛋白修饰过程相关的蛋白质，例如组蛋白乙酰化、脱乙酰化、甲基化、脱甲基化、磷酸化、脱磷酸化、泛素化、脱泛素化、sumo化(sumoylation)、去sumo化、核糖基化、去核糖基化、瓜氨酸化、去瓜氨酸化、胺化或脱氨。在一些实施方式中，结合结构域与除组蛋白或与组蛋白相关的蛋白以外的DNA结合蛋白结合。

在一些实施方式中，结合结构域可以选择性结合包含甲基化CpG的DNA。在DNA的区域中发现了CG二核苷酸基序(“CpG位点”或“CG位点”)，在该区域中沿其5'至3'方向的碱基的线性序列中的胞嘧啶核苷酸之后是鸟嘌呤核苷酸。CpG岛(或CG岛)是具有高频率CpG位点的区域。CpG是5'-C-磷酸酯-G-3'的简写，也就是说，胞嘧啶和鸟嘌呤被一个磷酸酯分开。CpG二核苷酸中的胞嘧啶可以被甲基化以形成5-甲基胞嘧啶。

胞嘧啶甲基化在整个人类基因组的许多CpG位点处发生。CG位点处的胞嘧啶甲基化也在其他真核生物的整个基因组中发生。例如，在哺乳动物中，CpG胞嘧啶的70％至80％可以被甲基化。在许多感兴趣的病原体(例如细菌和病毒)中，这种CpG甲基化不发生或显著低于人基因组中的CpG甲基化。因此，可以通过选择性切割CpG甲基化DNA来实现脱宿主(dehost)。在一些实施方式中，重组蛋白是核酸酶结构域和甲基-CpG结合结构域的融合体。在图8中示出了一个实例，其中重组蛋白包含甲基-CpG结合结构域(110)和核酸酶结构域(50)。甲基-CpG结合结构域结合甲基-CpG DNA(100)。结合结构域将重组蛋白靶向至CpG甲基化宿主DNA，使得相关联的核酸酶结构域可以对其进行切割。

在一些实施方式中，结合结构域包含与CpG岛或CpG位点结合的蛋白或其片段。在一些实施方式中，结合结构域包含与甲基化CpG岛结合的蛋白或其片段。在一些实施方式中，结合结构域包含甲基-CpG结合结构域(MBD)。MBD的一个实例是折叠成α/β三明治结构的约70个残基的多肽，所述三明治结构包含一层扭曲的β折叠，背后是在C末端由α1螺旋和发夹环形成的另一层。这些层都是两亲性的，α1螺旋和β折叠平行，疏水面彼此紧密堆积。β折叠包含两条较短的外链(βl和β4)夹在中间的两条较长的内链(β2和β3)。在一些实施方式中，结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白质或其片段。在一些实施方式中，结合结构域包含MBD2。在一些实施方式中，结合结构域包含MBD2的片段。在一些实施方式中，结合结构域包含MBD5、MBD6、SETDB1、SETDB2、TIP5/BAZ2A或BAZ2B或其片段。在一些实施方式中，结合结构域包含CpG甲基化或脱甲基化蛋白或其片段。

在一些实施方式中，结合结构域可以选择性结合抗体，所述抗体选择性结合宿主DNA的特征，例如DNA结合蛋白或甲基化CpG。在一些实施方式中，DNA结合蛋白是染色质蛋白，例如组蛋白。然后可以将核酸酶结构域靶向至抗体附近的DNA。在一些实施方式中，结合结构域可包含选择性结合抗体的抗体结合蛋白的结构域。在一些实施方式中，抗体结合结构域结合抗体的Fab或Fc区。在一些实施方式中，结合结构域包含选自蛋白G和蛋白A的蛋白质或其片段。在一些实施方式中，蛋白G或蛋白A或其片段来自链球菌。在一些实施方式中，蛋白G或蛋白A或其片段结合抗体的Fc区或Fc抗体片段。在一些实施方式中，抗体结合结构域是蛋白A/G或蛋白L或其片段。如将容易理解的，包含抗体的一些实施方式是模块化的，从而允许依赖于抗体靶向宿主DNA的不同特征。在图5中描绘了示例实施方式，其中重组蛋白包含蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G抗体结合结构域结合与组蛋白结合的抗组蛋白抗体(80)。在图7中描绘了另一个示例实施方式，其中重组蛋白包含蛋白G抗体结合结构域(70)和核酸酶结构域(50)。蛋白G结合结构域结合与5-甲基胞嘧啶(100)结合的抗5-甲基胞嘧啶抗体(90)。一些这样的实施方式可以靶向甲基化DNA的区域以进行降解。

可以通过本领域已知的方法制备针对宿主DNA特征的抗体。抗体或免疫球蛋白的一个实例是约150kDa的大球形血浆蛋白。它可以包含例如四个多肽：连接以形成“Y”形分子的两个重链和两个轻链。在不同的抗体之间，“Y”的尖端的氨基酸序列可以有很大差异。该可变区包含例如110-130个氨基酸，可以赋予抗体用于结合抗原的特异性。可变区可以包含轻链和重链的末端。用蛋白酶处理抗体可以切割该区域，产生包含抗体的可变末端的Fab或抗原结合片段。在一些实施方式中，抗体包括IgM、IgG、Iga、IgD或IgE类抗体。在一些实施方式中，抗体是单克隆的。在一些实施方式中，单克隆抗体由杂交瘤细胞系产生。在一些实施方式中，抗体是多克隆的。

在一些实施方式中，结合结构域包含与宿主DNA的特征选择性结合的抗体片段。在一些实施方式中，结合结构域包含与特定DNA结合蛋白例如染色质蛋白选择性结合的抗体片段。在一些实施方式中，结合结构域包含抗组蛋白抗体的片段。在一些实施方式中，结合结构域包含抗甲基-CpG抗体的片段。在一些实施方式中，抗甲基CpG抗体包含抗5-甲基胞嘧啶抗体。

在一些实施方式中，重组蛋白可包含第二结合结构域。例如，重组蛋白可以包含甲基-CpG结合结构域和组蛋白结合结构域，两个甲基-CpG结合结构域或两个组蛋白结合结构域。在一些实施方式中，包含第二结合结构域改善了与宿主DNA结合的特异性。

在一些实施方式中，重组蛋白的核酸酶结构域可包括非特异性核酸酶。在一些实施方式中，核酸酶结构域是核酸内切酶或其片段。在一些实施方式中，核酸酶结构域是非特异性核酸内切酶或其片段。在一些实施方式中，核酸酶结构域是非特异性核酸外切酶或其片段。在一些实施方式中，核酸酶结构域是归巢核酸内切酶或其片段。在一些实施方式中，核酸酶结构域是限制性核酸内切酶或其片段。在一些实施方式中，核酸酶结构域是人蛋白质或其片段。在一些实施方式中，核酸酶结构域是真核蛋白或其片段。在一些实施方式中，核酸酶结构域是非真核蛋白或其片段。

在一些实施方式中，核酸酶结构域衍生自其中核酸酶结构域本身不具有其自身独特靶标的任何核酸酶。在一些实施方式中，当与其他蛋白质融合时，核酸酶结构域具有活性。非特异性核酸酶的实例包括Fok1和I-Tev1。在一些实施方式中，核酸酶结构域是Fok1或其片段。在一些实施方式中，核酸酶结构域是I-Tev1或其片段。在一些实施方式中，Fok1或I-Tev1或其片段是未突变的和/或野生型的。

表1列出了示例性Fok1变体及其多肽序列。在一些实施方式中，Fok1或其功能性片段包含具有与选自SEQ ID NO:01、SEQ ID NO:02、SEQ ID NO:03、SEQ ID NO:04、SEQ IDNO:05、SEQ ID NO:06、SEQ ID NO:07、SEQ ID NO:08、SEQ ID NO:09、SEQ ID NO:10和SEQID NO:11的多肽至少70％、80％、90％、95％或100％，或前述百分比中任意两个的范围内的百分比的同一性的多肽，或上述多肽中任一种的保守变化。在一些实施方式中，Fok1包括在SEQ ID NO:01-11中识别的任何多肽的二聚体。在一些实施方式中，使用一种或多种Fokl变体代替野生型Fokl增强了重组蛋白的核酸酶活性。在一些实施方式中，核酸酶结构域具有使其冷或热敏感的突变。

表1

在一些实施方式中，核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。在一些实施方式中，核酸酶结构域是同型二聚体。在一些实施方式中，核酸酶结构域是异二聚体。例如，在一些实施方式中，可以通过使用分裂的、异二聚的核酸酶结构域(图6)来增加特异性。第二异二聚体亚基可以在核酸酶的初始结合后用作另一融合体(图6中所示)或单独添加(不融合至核酸酶结构域)。

在一些实施方式中，核酸酶结构域是脱氧核糖核酸酶I(DNase I)、RecBCD核酸酶、T7核酸内切酶、T4核酸内切酶IV、Bal 31核酸内切酶、核酸内切酶(内切I)、微球菌核酸酶、核酸内切酶II(内切VI、外切III)、神经孢子内切核酸酶、S1-核酸酶、P1-核酸酶、绿豆核酸酶I、Utilago核酸酶(Dnase I)、AP核酸内切酶或Endo R，或其片段。

在一些实施方式中，核酸酶结构域包含具有与选自SEQ ID NO：01-11的多肽至少70％、80％、90％、95％、99％或100％同一性的多肽，其功能性片段，或前述多肽中任一者的保守变异。在一些实施方式中，保守氨基酸变异可包括替代功能等价氨基酸的氨基酸置换。保守氨基酸变异导致所得肽的氨基酸序列的沉默变化。例如，具有相似极性的一个或多个氨基酸充当功能等同物，并导致肽的氨基酸序列内的沉默改变。电荷中性且用较小残基代替残基的置换也可被视为“保守置换”，即使残基位于不同的组中，例如，用较小的异亮氨酸置换苯丙氨酸。具有相似侧链的氨基酸残基家族已在本领域中定义。表2显示了多个保守氨基酸置换家族。

表2

家族	氨基酸
		非极性	Trp，Phe，Met，Leu，Ile，Val，Ala，Pro
不带电极性	Gly，Ser，Thr，Asn，Gln，Tyr，Cys
		酸性/带负电	Asp，Glu
碱性/正电荷	Arg，Lys，His
		β支化	Thr，Val，Ile
影响链取向的残基	Gly，Pro
		芳香族	Trp，Tyr，Phe，His

在一些实施方式中，重组蛋白包含在结合结构域和核酸酶结构域之间的接头。在一些实施方式中，接头直接连接结合结构域和核酸酶结构域。接头可以是柔性的或刚性的，长的或短的，天然的或合成的。表3列出了重组蛋白可在各种排列中包括的结合结构域、接头和核酸酶结构域的实例。

表3

在一些实施方式中，重组蛋白包含可检测标记。可检测标记的实例包括例如生物素、谷胱甘肽S-转移酶(GST)、聚组氨酸(HIS)和地高辛(digioxigenin)。

在一些实施方式中，蛋白质是纯化的或基本上纯化的。在一些实施方式中，使用可检测标记纯化或基本上纯化蛋白质。上述重组蛋白可以被称为“重组核酸酶”、“重组酶”、“工程化核酸酶”和“工程化酶”。本文提供的一些实施方式涉及编码上述任何重组蛋白的核酸。在一些实施方式中，核酸在载体内编码。在一些实施方式中，载体是克隆载体或表达载体。载体的实例包括人或动物病毒，例如牛痘病毒或腺病毒；昆虫病毒，例如杆状病毒；酵母载体；噬菌体载体(例如λ)以及质粒和粘粒DNA载体，以上仅举几例。在一些实施方式中，载体包含选择标志物。这样的标志物可以允许识别和/或选择掺入并表达该标志物编码的蛋白质的宿主细胞。在一些实施方式中，载体包含用于指导基因转录的启动子元件。本文提供的一些实施方式涉及包含上述核酸或重组蛋白的细胞。在一些实施方式中，核酸由细胞稳定表达。在一些实施方式中，核酸被整合到细胞的基因组中。在一些实施方式中，核酸是瞬时表达的。

宿主DNA的选择性切割

本文提供的一些实施方式涉及使用本文提供的重组蛋白选择性切割宿主DNA的方法。一些实施方式包括获得包含宿主DNA的样品，其中宿主DNA与DNA结合蛋白相关联或包含甲基化CpG。在一些实施方式中，DNA结合蛋白是染色质蛋白，例如组蛋白。样品可以与重组蛋白接触，从而选择性切割宿主DNA。一些实施方式包括用本文提供的重组蛋白和与宿主DNA的特征(例如DNA结合蛋白或甲基化CpG)选择性结合的抗体或其片段选择性切割宿主DNA。在一些这样的实施方式中，抗体结合宿主DNA的特征，重组蛋白结合抗体并切割宿主DNA。一些实施方式还包括使包含宿主DNA和非宿主核酸的多核苷酸样品脱宿主。一些这样的实施方式包括选择性切割宿主DNA，以及从非宿主核酸除去切割的宿主DNA。

在一些实施方式中，样品可以获自来自生物体或细胞培养物的细胞，流体，组织或器官，例如血液，血清，血浆，眼泪，唾液，粘液，尿液，乳液，精液，肌肉，心脏，肝脏，皮肤，肝脏，肾脏或脂肪组织。在一些实施方式中，样品可以来自细胞培养物。在一些实施方式中，样品是环境样品，例如土壤，水或空气样品。在一些实施方式中，样品是生物样品。在一些实施方式中，样品来自人。在一些实施方式中，样品来自非人真核生物。在一些实施方式中，样品来自动物。在一些实施方式中，样品来自植物。在一些实施方式中，样品来自真菌。在一些实施方式中，样品来自原生动物。在一些实施方式中，样品包含来自至少两种不同原核生物的核酸。在一些实施方式中，样品包含来自人和细菌生物体的核酸。在一些实施方式中，样品包含来自真核和原核生物的核酸。在一些实施方式中，样品包含来自至少两种不同的真核生物的核酸。在一些实施方式中，样品包含来自未知生物的核酸。

在一些实施方式中，样品包含例如小于10pg，小于9pg，小于8pg，小于7pg，小于6pg，小于5pg，小于4pg，小于3pg，小于2pg或小于1pg的非宿主核酸，或其值的任意范围。在一些实施方式中，样品含有例如10pg至1pg，9pg至1pg，8pg至1pg，7pg至1pg，6pg至1pg，5pg至1pg，4pg至1pg，3pg至1pg或2pg至1pg的非宿主核酸。

在一些实施方式中，宿主DNA与蛋白质例如染色质蛋白例如组蛋白结合。在一些实施方式中，宿主DNA包含表观遗传修饰，例如甲基化CpG。在一些实施方式中，宿主DNA是真核的，例如哺乳动物的，例如人的。在一些实施方式中，宿主DNA是非人DNA。宿主DNA可以包含双链DNA和/或单链DNA。在一些实施方式中，宿主DNA是染色质，非宿主核酸是非染色质核酸。在一些实施方式中，宿主DNA包含组蛋白或组蛋白。在一些实施方式中，宿主DNA的组蛋白选自H1、H2A、H2B、H3和H4。在一些实施方式中，重组蛋白的结合结构域选择性结合组蛋白。在一些实施方式中，重组蛋白的结合结构域包含RBBP4蛋白或其片段。

在一些实施方式中，非宿主核酸可包括未与可与宿主核酸相关联的DNA结合蛋白结合的核酸。在一些实施方式中，DNA结合蛋白是染色质蛋白，例如组蛋白。在一些实施方式中，非宿主核酸可包括缺乏甲基化CpG的核酸。在一些实施方式中，非宿主核酸不包含结合配偶体或未与由本文提供的重组蛋白的结合结构域选择性结合的结合配偶体结合。在一些实施方式中，非宿主核酸不包含结合配偶体或未与由抗体选择性结合的结合配偶体结合，所述抗体由本文提供的重组蛋白的结合结构域选择性结合。在一些实施方式中，非宿主核酸可包含真核、原核核酸或病毒核酸。在一些实施方式中，非宿主核酸是古细菌核酸(archaic nucleic acids)。非宿主核酸可以包括DNA和RNA。

一些实施方式包括从样品中提取宿主DNA。在一些这样的实施方式中，可以从样品中提取DNA，使得相关联的蛋白质，例如某些DNA结合蛋白，例如组蛋白，保持与所提取的DNA相关联。在一些实施方式中，保持某些DNA结合蛋白，例如与提取的DNA相关联的组蛋白，可以包括在DNA提取过程中排除蛋白酶，使用温和的洗涤步骤，使用配制为保持组蛋白完整的缓冲液，避免干扰DNA结合蛋白与DNA之间的非共价键的刺激性试剂和去污剂，或提取DNA而不沉淀DNA。在一些实施方式中，所述方法包括用蛋白酶抑制剂处理样品。

一些实施方式包括从非宿主核酸除去切割的宿主DNA。在一些这样的实施方式中，可以基于切割的宿主DNA片段和非宿主核酸的平均大小的差异，从非宿主核酸除去切割的宿主DNA。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于1000个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于500个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于400个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于300个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于200个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于100个碱基或碱基对的核酸。在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括除去具有少于2000个碱基或碱基对的核酸。

在一些实施方式中，从非宿主核酸除去切割的宿主DNA包括使非宿主核酸结合基质，使非宿主核酸与捕获探针杂交，或进行凝胶过滤。在一些实施方式中，基质包含固相可逆固定化(SPRI)珠。在一些实施方式中，基质包含固体基质，例如，磁珠、微量滴定板孔和柱表面。

本文提供的一些实施方式涉及从样品除去宿主DNA的方法，所述方法包括：(a)获得包含宿主DNA和非宿主核酸的样品；(b)通过使样品与以下接触来选择性切割宿主DNA：(i)选择性结合宿主DNA的抗体或其片段，和重组蛋白，所述重组蛋白包含：选择性结合抗体或其片段的结合结构域，和第一核酸酶结构域，和(ii)第二核酸酶结构域，其中第一和第二核酸酶结构域在一起具有切割DNA的活性；(c)从非宿主核酸除去切割的宿主DNA。在一些实施方式中，第一和第二核酸酶结构域形成二聚体。在一些实施方式中，第二重组蛋白包含第二核酸酶结构域和第二结合结构域，其中第二结合结构域选择性结合抗体或其片段，或选择性结合宿主DNA。

核酸文库的制备

本文提供的一些实施方式涉及制备核酸文库。在一些实施方式中，文库制备试剂可包括转座子、测序引物或连接酶。在一些实施方式中，核酸文库可以被测序。一些实施方式可以包括在包含宿主DNA和非宿主核酸的多核苷酸样品中选择性切割宿主DNA。可以从切割的宿主DNA除去非宿主核酸，并用于制备核酸文库。在图2中描绘了示例实施方式。在图2中，重组蛋白例如组蛋白核酸酶可用于在文库制备之前使样品脱宿主。例如，提供人样品；进行DNA提取，保持组蛋白相关联。将上述组蛋白核酸酶添加至提取的DNA。然后通过例如添加蛋白酶或沉淀DNA来除去蛋白质(包括组蛋白核酸酶)；然后提取病原体核酸并通过例如SPRI或电泳和凝胶纯化从较短的切割的宿主DNA片段中分离病原体核酸；然后例如使用

或

技术(Illumina，Inc，San Diego，CA)制备测序文库，得到脱宿主测序文库，所述文库可以例如进行无偏测序以识别在初始人样品中的非宿主和/或病原体核酸。在另一个实施方式中，重组蛋白可以是甲基-CpG核酸酶。

在一些实施方式中，可以从包含宿主DNA和非宿主核酸的多核苷酸样品制备核酸文库，随后通过使用本文提供的重组蛋白选择性切割宿主DNA而从核酸文库除去宿主DNA。在图3中描绘了示例实施方式，其中重组蛋白例如组蛋白核酸酶可用于在文库制备后使样品脱宿主。例如，提供人样品；进行DNA提取，保持组蛋白相关联；测序文库是通过例如使用

技术制备；然后将上述组蛋白核酸酶添加至文库；然后通过例如添加蛋白酶或沉淀DNA来除去蛋白质(包括组蛋白核酸酶)；在组蛋白核酸酶处理后的某个时刻，通过例如SPRI或电泳和凝胶纯化从较短的切割的宿主DNA片段中提取并分离病原体核酸；这产生脱宿主测序文库，其可以例如进行无偏测序以识别初始人样品中的非宿主和/或病原体核酸。在另一个实施方式中，重组蛋白可以是甲基-CpG核酸酶。

可以将酶处理整合到修饰的lllumina文库样品制备工作流程中，以在测序前除去宿主DNA。可在制备测序文库之前使用核酸酶。例如，可以从人血浆中提取同时包含宿主和非宿主核酸例如病原体DNA的总DNA。在其中核酸酶识别DNA结合蛋白的组蛋白核酸酶或其他发明变体的情况下，提取条件确保任何宿主DNA保持与DNA结合蛋白相关联。将重组核酸酶和任何必要抗体添加到混合物中。消化后，所有蛋白质和任何其他非DNA分子均被除去，留下富集了来自病原体基因组的长片段的DNA。然后通过常见的大小选择方法(例如SPRI珠、电泳)提取这些长片段，留下短的、切割的宿主片段。然后通过标准文库样品制备方法处理DNA，例如通过末端修复和连接

或转座子

添加接头。

在一些实施方式中，所述方法产生包含例如至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的非宿主核酸，或其值的任意范围的样品或测序文库。在一些实施方式中，所述方法产生其中非宿主核酸占样品或测序文库中的核酸的例如50％至100％，60％至100％，70％至100％，80％至100％，90％至100％，或95％至100％的样品或测序文库。在一些实施方式中，所述方法产生富集非宿主核酸的样品或测序文库。在一些实施方式中，样品或测序文库相比于起始样品使非宿主核酸富集2×、3×、4×、5×、10×、20×、50×、100×、200×、500×、1000×、10,000×、或1,000,000×。

在一些实施方式中，文库可使用接头序列中的引物位点扩增，并使用接头序列中的测序引物位点测序。在一些实施方式中，接头序列可以包含识别核酸来源的索引。通过形成引物二聚体可以降低后续扩增步骤的效率。为了提高后续扩增步骤的效率，可以从连接产物除去未连接的单链接头。

在一些实施方式中，使用基于连接的文库制备方法(例如，Illumina TruSeq，Illumina，San Diego Calif)。基于连接的文库制备方法通常利用接头(例如，甲基化接头)设计，该设计可在初始连接步骤中引入索引序列，并且常用于制备用于单读测序、双末端测序和多重测序的样品。例如可以通过填充反应、核酸外切酶反应或其组合来末端修复核酸(例如片段化的核酸或无细胞DNA)。在一些实施方式中，然后可以将所得平末端修复核酸延伸单个核苷酸，其与接头/引物的3'端上的单个核苷酸突出端(overhang)互补。任何核苷酸均可用于延伸/突出端核苷酸。在一些实施方式中，核酸文库制备包括连接接头寡核苷酸。接头寡核苷酸通常与流动池锚互补，有时用于将核酸文库固定至固体支持物，例如流动池的内表面。在一些实施方式中，接头寡核苷酸包含标识符、一个或多个测序引物杂交位点(例如，与通用测序引物、单末端测序引物、配对末端测序引物、多重测序引物等互补的序列)或其组合(例如，接头/序列，接头/标识符，接头/标识符/序列)。

在一些实施方式中，使用基于转座子的文库制备方法(例如

Epicentre,Madison,Wis.)。基于转座子的方法可以使用体外转座在单管反应中对DNA同时进行片段化和标记(通常允许引入平台特异性标签和任选的条形码)，并制备测序仪即用型文库。

在一些实施方式中，核酸文库或其部分被扩增(例如通过基于PCR的方法扩增)。在一些实施方式中，测序方法包括扩增核酸文库。核酸文库可以在固定在固体支持物(例如流动池中的固体支持物)之前或之后扩增。核酸扩增包括通过产生模板和/或其互补的一个或多个拷贝来扩增或增加存在(例如在核酸文库中)的核酸模板和/或其互补物的数量的过程。扩增可以通过任何合适的方法进行。

本文提供的一些实施方式可包括对核酸进行测序。在一个实施方式中，用切割宿主DNA同时使病原体DNA完整的重组蛋白处理混合核酸的样品。病原体DNA用于制备DNA文库并进行测序。一种测序方法是合成测序(SBS)。在SBS中，监测核酸引物沿核酸模板(例如靶核酸或其扩增子)的延伸，以确定模板中的核苷酸的序列。作为基础的化学过程可以是聚合反应(例如，通过聚合酶催化)。在特定的基于聚合酶的SBS实施方式中，将荧光标记核苷酸以模板依赖性方式添加至引物(从而扩展引物)，使得可以使用对添加至引物的核苷酸的顺序和类型的检测来确定模板的序列。

可以对一个或多个扩增的包封的核酸进行SBS或涉及以循环方式重复递送试剂的其他检测技术。例如，为了启动第一个SBS循环，可以使一个或多个经标记核苷酸，DNA聚合酶等流入/通过容纳一个或多个扩增的核酸分子的水凝胶珠。可以检测到引物延伸导致掺入经标记核苷酸的那些位点。任选地，核苷酸还可以包含一旦将核苷酸添加至引物则终止进一步的引物延伸的可逆终止性质。例如，可以将具有可逆终止子部分的核苷酸类似物添加至引物，使得后续延伸直到递送解封闭剂以除去该部分才发生。因此，对于使用可逆终止的实施方式，可以在检测之前或之后将解封闭剂递送至流动池。可以在各个递送步骤之间进行洗涤。然后可以重复该循环n次以将引物延伸n个核苷酸，从而检测长度为n的序列。

可以使用其他使用循环反应的测序程序，例如焦磷酸测序。焦磷酸测序检测在特定核苷酸被引入新生核酸链中时无机焦磷酸盐(PPi)的释放。在焦磷酸测序中，释放的PPi可以通过被ATP硫化酶立即转化为三磷酸腺苷(ATP)的方式进行检测，并且可以通过荧光素酶产生的光子来检测所产生的ATP的水平。因此，可以通过发光检测系统监测测序反应。焦测序过程不需要用于基于荧光的检测系统的激发辐射源。

一些实施方式可以使用涉及实时监测DNA聚合酶活性的方法。例如，可以通过带有荧光团的聚合酶和γ-磷酸酯标记的核苷酸之间的荧光共振能量转移(FRET)相互作用，或使用零模波导(ZMW)来检测核苷酸掺入。

一些SBS实施方式包括检测在将核苷酸掺入延伸产物后释放的质子。例如，基于对释放的质子的检测的测序可以使用电检测器和可商购的相关技术。这样的测序系统的实例是焦磷酸测序(例如来自Roche的子公司454Life Sciences的可商购平台)，使用γ-磷酸酯标记的核苷酸的测序(例如来自Pacific Biosciences的可商购平台)和使用质子检测的测序(例如来自Life Technologies的子公司Ion Torrent的可商购平台)。

另一种有用的测序技术是纳米孔测序。在一些纳米孔实施方式中，靶核酸或从靶核酸除去的个体核苷酸穿过纳米孔。随着核酸或核苷酸穿过纳米孔，可以通过测量孔的电导率波动来识别每种核苷酸类型。

在分离核酸、扩增和测序的方法中，各种试剂可用于核酸分离和制备。这样的试剂可以包括例如溶菌酶、蛋白酶K、随机六聚体、聚合酶(例如Φ29DNA聚合酶、Taq聚合酶、Bsu聚合酶)、转座酶(例如Tn5)、引物(例如P5和P7接头序列)、连接酶、催化酶、脱氧核苷酸三磷酸、缓冲液或二价阳离子。

接头可包含测序引物位点、扩增引物位点和索引。如本文所用，“索引”可以包括可以用作分子标识符和/或条形码以标记核酸和/或识别核酸来源的核苷酸序列。在一些实施方式中，索引可用于识别单个核酸或核酸亚群。在一些实施方式中，可以在流动池装置上的水凝胶内制备核酸文库。

试剂盒

本文提供的一些实施方式涉及一种用于从包含宿主DNA和非宿主核酸的样品除去宿主DNA的试剂盒，所述试剂盒包括：(a)上述任何重组蛋白；(b)选自以下的试剂：选择性结合DNA结合蛋白或甲基化CpG的抗体，包含第二核酸酶结构域的第二重组蛋白，用于从非宿主除去切割的宿主DNA的试剂，文库制备试剂，和核酸测序试剂。在一些实施方式中，DNA结合蛋白是染色质蛋白，例如组蛋白。例如，试剂盒可包括重组组蛋白核酸酶和用于从非宿主DNA除去切割的宿主DNA的试剂，或甲基-CpG核酸酶和文库制备试剂。

如本文所用，术语“试剂”描述了用于与样品反应、相互作用、稀释或添加至样品的试剂或两种或更多种试剂的混合物。文库制备试剂和核酸测序试剂的实例包括用于核酸扩增反应的试剂，包括例如缓冲液、化学品、酶、模板核酸、核苷酸、标记、染料、核酸酶、随机六聚体、聚合酶(例如，Φ29DNA聚合酶、Taq聚合酶、Bsu聚合酶)、引物、催化酶、脱氧核苷酸三磷酸、缓冲液和二价阳离子。在一些实施方式中，文库制备试剂可包括转座酶，例如Tn5、接头序列或连接酶。用于从非宿主DNA除去切割的宿主DNA的试剂的实例包括缓冲液、乙醇、异丙醇、琼脂糖和其他胶凝剂。

实施例

实施例1—重组核酸酶

各自合成编码重组蛋白的基因，在大肠杆菌BL21 AI中表达，并纯化表达的蛋白。重组蛋白包括：(1)PGFkShHomol，其包含蛋白G结合结构域、Fok1核酸酶和同二聚体结合结构域；(2)MBwtFkShKKR1，其包含野生型MBD2结合结构域、Fok1核酸酶结构域和KKR异二聚体结构域；和(3)MBmuFkShELD1，其包含增强的突变体MBD2结合结构域、Fok1核酸酶结构域和ELD异二聚体结构域。Fok1核酸酶结构域包含SEQ ID NO:10的Sharkey突变。

图9显示了加载有纯化重组蛋白的考马斯蓝染色的聚丙烯酰胺凝胶。在图9中，泳道1是阴性对照，泳道2-4是纯化重组蛋白。凝胶中的条带证实表达了重组核酸酶。

合成、表达和纯化了包含来自MBD2的DNA结合结构域和来自Fokl Sharkey的核酸酶结构域的重组甲基化CpG核酸酶(mCpG核酸酶)。为了证明mCpG核酸酶与甲基化CpG DNA的选择性结合，将mCpG核酸酶与甲基化CpG DNA或非甲基化CpG DNA一起孵育，并将复合物在琼脂糖凝胶上解开。图10(左小图)显示了与非甲基化CpG DNA(-)一起孵育的mCpG核酸酶相比，与甲基化CpG DNA(+)一起孵育的mCpG核酸酶的带移。因此，mCpG核酸酶选择性结合甲基化CpG DNA。为了证明mCpG核酸酶对甲基化CpG DNA的核酸酶活性，将mCpG核酸酶与包含甲基化CpG DNA(+)或非甲基化CpG DNA(-)的超螺旋质粒DNA一起孵育，并将产物在琼脂糖凝胶上解开。图10(右小图)显示了mCpG核酸酶选择性消化了包含甲基化CpG DNA的超螺旋质粒DNA。

如本文所用，术语“包含”与“包括”、“含有”或“特征在于……”同义，并且是包括性的或开放性的，不排除另外的、未记载的要素或方法步骤。

以上描述公开了本发明的多种方法和材料。本发明容许方法和材料的改变，以及制造方法和设备的改变。通过考虑本文公开的本发明的该公开内容或实践，这样的改变对于本领域技术人员将变得显而易见。因此，无意将本发明限制于本文公开的特定实施方式，而是其涵盖了落入本发明的真实范围和精神内的所有改变和替代。

本文引用的所有参考文献，包括但不限于已公布和未公布的申请、专利和文献参考，均通过引用全文并入本文，并因此成为本说明书的一部分。对于通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾的程度，本说明书旨在代替和/或优先于任何这样的相矛盾的内容。

Claims

1.一种选择性切割宿主DNA的方法，其包括：

(a)获得包含宿主DNA的样品，其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG；和

(b)通过使所述样品与重组蛋白接触来选择性切割所述宿主DNA，所述重组蛋白包含：

选择性结合所述DNA结合蛋白或甲基化CpG的结合结构域，和

具有切割DNA的活性的核酸酶结构域。

2.根据权利要求1所述的方法，其中所述样品包含非宿主核酸。

3.根据权利要求2所述的方法，其还包括(c)从非宿主核酸除去切割的宿主DNA。

4.根据权利要求1-3中任一项所述的方法，其中所述非宿主核酸不与所述DNA结合蛋白结合。

5.根据权利要求1-4中任一项所述的方法，其中所述DNA结合蛋白包括染色质蛋白。

6.根据权利要求1-5中任一项所述的方法，其中所述DNA结合蛋白包括组蛋白。

7.根据权利要求1-6中任一项所述的方法，其中所述结合结构域选择性结合组蛋白。

8.根据权利要求7所述的方法，其中所述组蛋白选自H1、H2A、H2B、H3和H4。

9.根据权利要求8所述的方法，其中所述结合结构域包含RBBP4蛋白或其片段。

10.根据权利要求1-3中任一项所述的方法，其中非宿主核酸缺乏甲基化CpG。

11.根据权利要求10所述的方法，其中所述结合结构域包含甲基-CpG结合结构域(MBD)。

12.根据权利要求11所述的方法，其中所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。

13.根据权利要求12所述的方法，其中所述结合结构域包含MBD2蛋白或其片段。

14.一种选择性切割宿主DNA的方法，所述方法包括：

(b)通过使所述样品与以下接触来选择性切割所述宿主DNA：

选择性结合所述DNA结合蛋白或甲基化CpG的抗体或其片段，和

重组蛋白，所述重组蛋白包含：

选择性结合所述抗体或其片段的结合结构域，和

具有切割DNA的活性的核酸酶结构域。

15.根据权利要求14所述的方法，其中所述样品包含非宿主核酸。

16.根据权利要求15所述的方法，其还包括(c)从所述非宿主核酸除去切割的宿主DNA。

17.根据权利要求14-16中任一项所述的方法，其中所述DNA结合蛋白包括染色质蛋白。

18.根据权利要求17所述的方法，其中所述染色质蛋白包括组蛋白。

19.根据权利要求16-18中任一项所述的方法，其中所述非宿主核酸不与染色质结合。

20.根据权利要求14-19中任一项所述的方法，其中所述抗体或其片段选择性结合组蛋白。

21.根据权利要求20所述的方法，其中所述组蛋白选自H1、H2A、H2B、H3和H4。

22.根据权利要求14所述的方法，其中所述非宿主核酸缺乏甲基化CpG。

23.根据权利要求22所述的方法，其中所述抗体或其片段选择性结合包含甲基-CpG结合结构域(MBD)的蛋白。

24.根据权利要求23所述的方法，其中所述包含MBD的蛋白是选自MECP2、MBD1、MBD2和MBD4的蛋白。

25.根据权利要求24所述的方法，其中所述包含MBD的蛋白是MBD2蛋白或其片段。

26.根据权利要求14-25中任一项所述的方法，其中所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。

27.根据权利要求1-26中任一项所述的方法，其中所述核酸酶结构域包含非特异性核酸内切酶。

28.根据权利要求1-27中任一项所述的方法，其中所述核酸酶结构域包含选自FokI和TevI的蛋白或其片段。

29.根据权利要求1-28中任一项所述的方法，其中所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。

30.根据权利要求1-29中任一项所述的方法，其中所述宿主DNA是哺乳动物DNA。

31.根据权利要求1至30中任一项所述的方法，其中所述宿主DNA是人DNA。

32.根据权利要求1-31中任一项所述的方法，其中所述非宿主核酸选自真核核酸、原核核酸和病毒核酸。

33.根据权利要求1-32中任一项所述的方法，其中(c)包括选自以下的步骤：使所述非宿主核酸与基质结合，使所述非宿主核酸与捕获探针杂交，和进行凝胶过滤。

34.根据权利要求33所述的方法，其中所述基质包括固相可逆固定化(SPRI)珠。

35.一种从样品中选择性切割宿主DNA的方法，所述方法包括：

(a)获得包含宿主DNA的样品，其中所述宿主DNA与DNA结合蛋白相关联或包含甲基化CpG岛；

(b)通过使所述样品与以下接触来选择性切割所述宿主DNA：

(i)选择性结合所述DNA结合蛋白或甲基化CpG岛的抗体或其片段，和

(ii)重组蛋白，所述重组蛋白包含：选择性结合所述抗体或其片段的结合结构域，和第一核酸酶结构域，和

(iii)第二核酸酶结构域，其中所述第一核酸结构域和所述第二核酸酶结构域在一起具有切割DNA的活性。

36.根据权利要求35所述的方法，其中所述样品包含非宿主核酸。

37.根据权利要求36所述的方法，其还包括(c)从所述非宿主核酸除去切割的宿主DNA。

38.根据权利要求35-37中任一项所述的方法，其中第二重组蛋白包含所述第二核酸酶结构域和第二结合结构域，其中所述第二结合结构域选择性结合所述抗体或其片段、所述DNA结合蛋白、或甲基化CpG岛。

39.根据权利要求35-38所述的方法，其中所述DNA结合蛋白包括染色质蛋白。

40.根据权利要求39所述的方法，其中所述染色质蛋白包括组蛋白。

41.一种制备核酸文库的方法，其包括：

(a)根据权利要求1-34中任一项所述的方法在包含宿主DNA和非宿主核酸的样品中选择性切割所述宿主DNA，并从所述样品除去切割的宿主DNA；和

(b)使所述非宿主核酸与文库制备试剂接触，从而制备核酸文库。

42.根据权利要求41所述的方法，其中(a)是在(b)之前进行。

43.根据权利要求41所述的方法，其中(a)是在(b)之后进行。

44.根据权利要求41所述的方法，其中所述文库制备试剂选自转座子、测序引物和连接酶。

45.根据权利要求41至44中任一项所述的方法，其还包括对所述核酸文库进行测序。

46.一种重组蛋白，其包含：

选择性结合DNA结合蛋白、甲基化CpG或抗体的结合结构域；和

核酸酶结构域。

47.根据权利要求46所述的重组蛋白，其中所述DNA结合蛋白包括染色质蛋白。

48.根据权利要求46所述的重组蛋白，其中所述染色质蛋白包括组蛋白。

49.根据权利要求46所述的重组蛋白，其中所述结合结构域选择性结合组蛋白。

50.根据权利要求49所述的重组蛋白，其中所述组蛋白选自H1、H2A、H2B、H3和H4。

51.根据权利要求46所述的重组蛋白，其中所述结合结构域包含RBBP4蛋白或其片段。

52.根据权利要求46所述的重组蛋白，其中所述结合结构域包含甲基-CpG结合结构域(MBD)。

53.根据权利要求52所述的重组蛋白，其中所述结合结构域包含选自MECP2、MBD1、MBD2和MBD4的蛋白或其片段。

54.根据权利要求53所述的重组蛋白，其中所述结合结构域包含MBD2蛋白或其片段。

55.根据权利要求46所述的重组蛋白，其中所述结合结构域选择性结合抗体。

56.根据权利要求46所述的重组蛋白，其中所述结合结构域包含选自蛋白G和蛋白A的蛋白或其片段。

57.根据权利要求46-56中任一项所述的重组蛋白，其中所述核酸酶结构域包含非特异性核酸内切酶。

58.根据权利要求57所述的重组蛋白，其中所述核酸酶结构域包含选自FokI和TevI的蛋白或其片段。

59.根据权利要求46-58中任一项所述的重组蛋白，其中所述重组蛋白包含在所述结合结构域和所述核酸酶结构域之间的接头。

60.根据权利要求46-59中任一项所述的重组蛋白，其中所述核酸酶结构域与第二核酸酶结构域组合具有切割DNA的活性。

61.一种核酸，其编码权利要求46-60中任一项所述的重组蛋白。

62.一种细胞，其包含权利要求61所述的核酸。

63.一种用于选择性切割与DNA结合蛋白结合的宿主DNA或包含甲基化CpG的结合的宿主DNA的试剂盒，所述试剂盒包括：

(a)权利要求46-60中任一项所述的重组蛋白；和

(b)选自以下的试剂：

选择性结合DNA结合蛋白或甲基化CpG的抗体，

包含第二核酸酶结构域的第二重组蛋白，

用于从非宿主DNA除去切割的宿主DNA的试剂，

文库制备试剂，

核酸测序试剂，和

用于未切割核酸的捕获试剂。

64.根据权利要求63所述的试剂盒，其中所述DNA结合蛋白包括染色质蛋白。

65.根据权利要求64所述的试剂盒，其中所述染色质蛋白包含组蛋白。