CN117377761A

CN117377761A - 用于位点特异性修饰的组合物和方法

Info

Publication number: CN117377761A
Application number: CN202280024526.6A
Authority: CN
Inventors: 李松沅; M·马雷斯卡; S·斯维科维奇
Original assignee: AstraZeneca AB
Current assignee: AstraZeneca AB
Priority date: 2021-04-07
Filing date: 2022-04-06
Publication date: 2024-01-09

Abstract

本披露提供了一种多核苷酸，该多核苷酸包含RNA指导序列、Cas结合区和DNA模板序列。本披露还提供了组合物，这些组合物包含Cas核酸酶或Cas切口酶以及含有指导序列、Cas结合区和DNA模板序列的一种或多种多核苷酸。本披露进一步提供了一种融合蛋白，该融合蛋白包含Cas核酸酶或Cas切口酶和DNA聚合酶募集部分。还提供了用于在细胞的靶DNA中提供靶向插入的方法。

Description

用于位点特异性修饰的组合物和方法

技术领域

背景技术

可编程核酸酶(诸如CRISPR/Cas9)可以产生位点特异性双链断裂(DSB)，该双链断裂可以通过在靶位点处诱导插入和缺失的混合(indel)来破坏基因。然而，依赖于模板依赖性同源定向修复(HDR)的DSB修复的频率可能较低，而高效的模板非依赖性非同源末端连接(NHEJ)可能容易出错并且可能不利于所期望的插入。

Anzalone等人(Nature[自然]576：149-157(2019))描述了先导编辑(primeediting)的发展，它利用Cas9切口酶-逆转录酶融合酶在切割位点处插入短序列。先导编辑依赖于RNA去除和单链DNA与靶位点杂交的复杂机制，并且还需要通过细胞平衡去除重叠的“flap”序列。

发明内容

在一些实施例中，本披露提供了一种多核苷酸，该多核苷酸包含(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

在一些实施例中，该DNA模板序列包含经修饰的核苷酸、非BDNA结构、DNA聚合酶募集部分、DNA连接酶募集部分或其组合。

在一些实施例中，该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。在一些实施例中，该共价接头包含三乙二醇(TEG)。在一些实施例中，该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶-乙二醇或其组合。在一些实施例中，该DNA光产物包含环丁烷嘧啶二聚体(CPD)、嘧啶(6-4)嘧啶酮光产物或其组合。在一些实施例中，该经修饰的脱氧核糖核苷包含脱氧尿苷。在一些实施例中，该经甲基化的核苷酸包含5-羟甲基胞嘧啶、5-甲基胞嘧啶或其组合。

在一些实施例中，该非B DNA结构包含发夹、十字形、Z-DNA、H-DNA(三链体DNA)、G-四联体DNA(四链体DNA)、滑移DNA(slipped DNA)、粘性DNA或其组合。在一些实施例中，该DNA聚合酶募集部分包含与该DNA模板序列连接的DNA聚合酶募集蛋白。在一些实施例中，该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。在一些实施例中，该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

在一些实施例中，本披露提供了一种多核苷酸，该多核苷酸包含：(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端，并且其中该DNA模板序列包含硫代磷酸酯键。在一些实施例中，该DAN模板序列在该多核苷酸的5′端。

在一些实施例中，该DNA模板序列包含引物结合序列和目的序列。在一些实施例中，该Cas结合区包含RNA，或者其中该Cas结合区包含RNA和DNA的组合。在一些实施例中，该Cas结合区包含tracrRNA。在一些实施例中，该Cas结合区能够与tracrRNA杂交。

在一些实施例中，该tracrRNA能够与Cas核酸酶结合。在一些实施例中，该Cas核酸酶是Cas9或Casl2a。在一些实施例中，该Cas核酸酶是II-B型Cas。在一些实施例中，该tracrRNA能够与Cas切口酶结合。在一些实施例中，该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

在一些实施例中，该DNA模板序列的长度为约8至约10000个核苷酸。在一些实施例中，该引物结合序列的长度为约4至约300个核苷酸。在一些实施例中，该目的序列的长度为约4至约100个核苷酸。在一些实施例中，该RNA指导序列的长度为约15至约25个核苷酸。

在一些实施例中，该多核苷酸进一步包含位于该Cas结合区与该DNA模板序列之间的间隔子。在一些实施例中，该间隔子包含DNA聚合酶的终止序列。在一些实施例中，该间隔子包含多于一个终止序列。在一些实施例中，该终止序列包含二级结构。在一些实施例中，该二级结构包含茎环。在一些实施例中，该间隔子的长度为约10至约200个核苷酸。

在一些实施例中，本披露提供了一种细胞，该细胞包含本文所述的多核苷酸。

在一些实施例中，本披露提供了一种组合物，该组合物包含：Cas核酸酶或Cas切口酶；以及多核苷酸，该多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

在一些实施例中，本披露提供了一种组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。

在一些实施例中，本披露提供了一种组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。

在一些实施例中，该DNA模板序列包含引物结合序列和目的序列。在一些实施例中，该DNA模板序列包含经修饰的核苷酸、非BDNA结构、DNA聚合酶募集部分、DNA连接酶募集部分或其组合。

在一些实施例中，该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。在一些实施例中，该经修饰的核苷酸包含硫代磷酸酯键。在一些实施例中，该共价接头包含三乙二醇(TEG)。在一些实施例中，该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶-乙二醇或其组合。在一些实施例中，该DNA光产物包含环丁烷嘧啶二聚体(CPD)、嘧啶(6-4)嘧啶酮光产物或其组合。在一些实施例中，该脱氧核糖核苷包含脱氧尿苷。在一些实施例中，该经甲基化的核苷酸包含5-羟甲基胞嘧啶、5-甲基胞嘧啶或其组合。

在一些实施例中，该非B DNA结构包含发夹、十字形、Z-DNA、H-DNA(三链体DNA)、G-四联体DNA(四链体DNA)、滑移DNA、粘性DNA或其组合。在一些实施例中，该DNA聚合酶募集部分包含与该DNA模板序列连接的DNA聚合酶募集蛋白。在一些实施例中，该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。在一些实施例中，该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

在一些实施例中，该指导序列包含RNA，或者其中该指导序列包含RNA和DNA的组合。在一些实施例中，该Cas结合区包含RNA，或者其中该Cas结合区包含RNA和DNA的组合。在一些实施例中，该Cas结合区包含tracrRNA。在一些实施例中，该Cas结合区能够与tracrRNA杂交，并且其中该组合物进一步包含tracrRNA。

在一些实施例中，该tracrRNA能够与该Cas核酸酶或Cas切口酶结合。在一些实施例中，该组合物包含Cas核酸酶。在一些实施例中，该Cas核酸酶是Cas9或Cas12a。在一些实施例中，该组合物包含Cas核酸酶，并且其中该Cas核酸酶是II-B型Cas。在一些实施例中，该组合物包含Cas切口酶。在一些实施例中，该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

在一些实施例中，该DNA模板序列的长度为约8至约500个核苷酸。在一些实施例中，该引物结合序列的长度为约4至约30个核苷酸。在一些实施例中，该目的序列的长度为约4至约100个核苷酸。在一些实施例中，该RNA指导序列的长度为约15至约25个核苷酸。

在一些实施例中，该第一杂交区和该第二杂交区是RNA。在一些实施例中，该第一杂交区和该第二杂交区是单链DNA。在一些实施例中，该第一杂交区是RNA并且该第二杂交区是单链DNA，或者其中该第一杂交区是单链DNA并且该第二杂交区是RNA。在一些实施例中，该第一杂交区的长度为约4至约5000个核苷酸。在一些实施例中，该第二杂交区的长度为约4至约5000个核苷酸。

在一些实施例中，该多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。在一些实施例中，该第二多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。在一些实施例中，该间隔子包含DNA聚合酶的终止序列。在一些实施例中，该间隔子包含多于一个终止序列。在一些实施例中，该终止序列包含二级结构。在一些实施例中，该二级结构包含茎环。在一些实施例中，该间隔子的长度为约10至约200个核苷酸。

在一些实施例中，该Cas核酸酶或该Cas切口酶与DNA聚合酶募集蛋白融合。在一些实施例中，该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

在一些实施例中，本披露提供了一种细胞，该细胞包含本文所述的组合物。在一些实施例中，该细胞进一步包含外源DNA聚合酶、外源DNA连接酶或两者。

在一些实施例中，本披露提供了一种融合蛋白，该融合蛋白包含(i)Cas核酸酶或Cas切口酶；和(ii)DNA聚合酶募集蛋白。

在一些实施例中，该融合蛋白包含Cas核酸酶。在一些实施例中，该Cas核酸酶是Cas9或Cas12a。在一些实施例中，该Cas核酸酶是II-B型Cas。在一些实施例中，该融合蛋白包含Cas切口酶。在一些实施例中，该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

在一些实施例中，该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

在一些实施例中，本披露提供了一种多核苷酸，该多核苷酸编码本文所述的融合蛋白。在一些实施例中，本披露提供了一种载体，该载体包含编码该融合蛋白的多核苷酸。在一些实施例中，本披露提供了一种细胞，该细胞包含该融合蛋白、该载体或该多核苷酸。在一些实施例中，该细胞进一步包含本文所述的多核苷酸，该多核苷酸包含(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

在一些实施例中，本披露提供了一种在细胞的靶DNA中提供靶向插入的方法，该方法包括将本文所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。

在一些实施例中，该方法不包括将DNA聚合酶引入该细胞中。在一些实施例中，该Cas核酸酶在该靶DNA中产生双链切割，并且该细胞的内源DNA聚合酶使该DNA模板序列延伸。

在一些实施例中，该方法进一步包括将外源DNA聚合酶引入该细胞中。在一些实施例中，该Cas核酸酶在该靶DNA中产生双链切割，并且该外源DNA聚合酶使该DNA模板序列延伸。

在一些实施例中，该DNA模板序列包含引物结合序列和目的序列，并且该DNA聚合酶合成与该目的序列互补的DNA链以形成包含该目的序列的双链序列。在一些实施例中，将该双链序列插入经切割的靶DNA中。在一些实施例中，通过非同源末端连接(NHEJ)将该双链序列插入经切割的靶DNA中。在一些实施例中，通过DNA连接酶将该双链序列插入经切割的靶DNA中。在一些实施例中，该DNA连接酶是该细胞的内源DNA连接酶。在一些实施例中，该DNA连接酶是外源DNA连接酶。

在一些实施例中，本披露涉及一种组合物，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)。

在一些实施例中，本披露涉及一种组合物，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及(d)第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；和(ii)目的序列(SOI)。

在一些实施例中，本披露涉及一种融合蛋白，该融合蛋白包含(i)Cas核酸酶或Cas切口酶；和(ii)DNA聚合酶募集蛋白、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合。

在一些实施例中，本披露提供了一种在细胞的靶DNA中提供靶向插入的方法，该方法包括将如本文所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。

附图说明

以下附图形成本说明书的一部分，并且被包括在内以进一步展示本发明的某些方面的示例性实施例。

图1展示了本文的实施例中所述的示例性方法。Cas核酸酶被指导序列引导至细胞中的靶DNA，并且切割靶DNA。DNA模板序列包含(i)与作为引物的经切割的DNA杂交的引物结合序列和(ii)目的序列。DNA聚合酶(例如，细胞的内源DNA聚合酶)与引物结合并合成与目的序列互补的DNA链，从而形成包含目的序列的双链序列。可以通过DNA修复途径(例如，NHEJ)将双链序列插入经切割的靶DNA中。

图2A-图2D展示了在本文所述的体内靶向插入实验中测试的示例性多核苷酸构建体(“springRNA”)。图2A示出了包含RNA指导序列、tracrRNA和RNA模板序列的仅RNA多核苷酸。图2B示出了包含RNA指导序列、tracrRNA和DNA模板序列(“DNA”)或具有硫代磷酸酯键的DNA模板序列(“PS-DNA”)的RNA-DNA杂合多核苷酸。图2C示出了包含RNA指导序列、tracrRNA和具有无碱基位点的RNA模板序列的仅RNA多核苷酸。图2D示出了包含RNA指导序列、tracrRNA和具有TEG的RNA模板序列的仅RNA多核苷酸。

图3涉及实例1，并且示出了使用仅SpCas9或SpCas9-逆转录酶(SpCas9-RT)融合蛋白与各种springRNA构建体得到的靶向插入的结果。图3的小图A-小图E示出了在SpCas9和图2A-图2D中的每种springRNA构建体情况下的靶向插入。图3的小图F-小图J示出了在SpCas9-RT(“PE0”)和图2A-图2D中的每种springRNA构建体情况下的靶向插入。

图4涉及实例1，并且示出了通过SpCas9或SpCas9-RT与图2A-图2D中的每种springRNA构建体的组合得到的插入的相对频率。每个点表示一个独立的复制。将三个实验的平均值和标准差以晶须图指示。

图5A-图5F涉及实例2，并且示出了使用仅SpCas9或SpCas9-RT得到的靶向插入的结果。图5A-图5C示出了在SpCas9-RT(“PE0”)以及仅RNA springRNA(图5A)、具有DNA尾的springRNA(图5B)和具有PS-DNA的springRNA(图5C)情况下的靶向插入。图5D-图5F示出了在SpCas9以及仅RNA springRNA(图5D)、具有DNA尾的springRNA(图5E)和具有PS-DNA的springRNA(图5F)情况下的靶向插入。

图6示出了本文所述的体外测定的概述。用不同的荧光团标记两条互补的DNA链(经6FAM标记的非靶链和经HEX标记的靶链)。这样设计指导序列，使得Cas9切割产生两条长度不同的链。DNA聚合酶使与springRNA的引物结合序列杂交的经6FAM标记的非靶链延伸。使产物变性并将其通过毛细管电泳分离，并且检测经荧光团偶联的链。

图7A-图7F涉及实例3，并且示出了图6所展示的体外测定的结果。蓝色迹线对应于非靶链，并且绿色迹线对应于靶链。星号指示经切割的合成靶DNA底物，并且黑色箭头指示通过DNA聚合酶得到的延伸产物。图7A示出了在Cas9和springRNA情况下的测定结果。图7B示出了在Cas9、克列诺片段和springRNA情况下的测定结果。图7C-图7F示出了在Cas9、Bst3.0聚合酶和以下springRNA情况下的测定结果：springRNA(图7C和图7D)、具有无碱基位点的springRNA(图7E)或具有TEG的springRNA(图7F)。

图8示出了在实例3的体外测定中使用的DNA聚合酶Bst 3.0聚合酶和克列诺片段的延伸反应动力学。

图9展示了本文的实施例中所述的示例性组合物，该组合物包含Cas蛋白(例如，Cas核酸酶或Cas切口酶)；第一多核苷酸，其包含指导序列(称为“间隔子”)、Cas结合区(称为“gRNA支架”)、第一杂交区(称为“着陆垫(landing pad)”)和引物结合序列(PBS)；以及第二多核苷酸，其包含第二杂交区(称为“杂交序列”)、SOI(称为“插入片段”)和同源序列。图9中组合物的各种组分的术语贯穿图9-图23而使用。

图10A-图10C展示了本文的实施例中所述的示例性方法。在图10A中，指导序列、Cas结合区、第一杂交区和引物结合位点位于第一多核苷酸上。通过被指导序列引导至靶DNA的Cas核酸酶在靶DNA处产生双链断裂。使引物结合位点与经切割的DNA杂交，并且第二多核苷酸经由包含互补序列的第一和第二杂交区与第一多核苷酸杂交。第二多核苷酸包含目的序列，其被连接酶连接至经切割的DNA的5′和3′两端(图10A)。第二多核苷酸可以进一步包括同源序列，并且5′端被连接酶连接至经切割的DNA中，并且通过同源介导的机制整合3′端(图10B)。在连接和/或同源介导的整合后，将复合物转化为双链DNA，从而将目的序列整合到靶DNA中(图10C)。

图11(A)-图11(J)展示了本文所述的组合物的示例性实施例。图11(A)描绘了含有以下所有三种元件的供体：第二杂交序列、目的序列和同源序列。图11(B)描绘了没有同源序列的供体。图11(C)描绘了没有第二杂交序列的供体。图11(D)表示标准供体，其序列与所杂交的目的序列互补，以形成具有5′和3′两个突出端的双链目的区序列。这种构型被称为“突出端”。图11(E)描绘了如图11(A)中的供体，但是plugRNA由两个核酸组成。sgRNA在3′端添加了约30nt的长序列。这个3′序列可以与互补多核苷酸配对，然后是第一杂交序列和引物结合序列。这种构型被称为“分拆式(split)plugRNA”或“分拆式系统”。图11(F)描绘了如图11(A)中的构型，但是杂交序列更短，在所引发的靶位点的3′端与供体的5′端之间产生缺口。这种构型被称为“缺口”。图11(G)与图11(A)相同，但是供体在5′端具有另外的核苷酸，产生flap，其在一些实施例中可以接合FEN1和其他修复机器。这种构型被称为“flap”。图11(H)与图11(B)相同，但是与目的序列互补的序列被退火，在供体的3′端产生平末端。这种构型被称为“平末端”。图11(I)供体被拆分为两个多核苷酸。第一供体链包含第二杂交序列和目的序列。第二序列包含同源序列和与目的序列互补的序列。这种构型被称为“桥”。在11(J)图中，同源序列嵌入plugRNA中，紧邻gRNA支架的下游。这个同源序列退火至Cas诱导的断裂的3′侧。供体包含侧翼为以下两个杂交序列的目的序列：第二杂交序列和另一杂交序列，第二杂交序列与第一杂交序列互补，并且另一杂交序列与和同源序列相邻的区域互补。这种构型使供体的5′和3′两侧都靠近双链断裂。这种构型被称为“双杂交式(dualhybridization)”。

图12A示出了如实例8中所述的示例性体外测定的实验设计。图12B和图12C示出了测定的结果，其中图12B示出了连接产物百分比，并且12C示出了连接效率百分比。

图13A示出了使用HeLa细胞核提取物进行示例性体外连接测定的实验设计，如实例9中所述。图13B和图13C示出了测定的热图结果，其中图13B示出了连接产物百分比，并且13C示出了连接效率百分比。

图14A示出了使用HeLa细胞核提取物进行示例性测定的实验设计，其中扩增所得DNA并分析其靶向插入，如实例10中所述。图14B示出了靶向插入序列的代表性下一代测序(NGS)结果。

图15示出了用图11A-图11J所示的各种构型的组合物进行的示例性测定的结果，如实例11中所述。

图16A示出了本文所述的组合物的示例性实施例。图16B示出了用组合物的长度变化的不同组分进行的示例性测定的结果，如实例12中所述。

图17A示出了本文所述的组合物的示例性实施例。图17B示出了用组合物的长度变化的不同组分进行的示例性测定的结果，如实例13中所述。

图18A示出了本文所述的组合物的示例性实施例。图18B示出了用组合物的长度和/或修饰变化的不同组分进行的示例性测定的结果，如实例14中所述。

图19A示出了本文所述的组合物的示例性实施例。图19B示出了用组合物的长度变化的不同组分进行的示例性测定的结果，如实例15中所述。

图20A示出了本文所述的组合物的示例性实施例。图20B示出了用组合物的长度和/或修饰变化的不同组分且在存在或不存在DNA依赖性蛋白激酶(DNA-PK)抑制剂的情况下进行的示例性测定的结果，如实例16中所述。

图21A示出了本文所述的组合物的示例性实施例。图21B示出了用各种组合物构型且在存在经共表达的DNA连接酶的情况下进行的示例性测定的结果，如实例17中所述。

图22示出了用本文所述的不同构型的组合物进行的测定结果的总结，如实例18中所述。

图23A示出了本文所述的组合物的示例性实施例。图23B示出了用组合物和不同连接酶或DNA聚合酶募集蛋白进行的示例性测定的结果，如实例19中所述。

具体实施方式

本披露涉及经改进的CRISPR系统及其组分以及使用它们的方法。通常，CRISPR系统(例如，CRISPR/Cas系统)包括在靶多核苷酸(例如，靶DNA序列)的位点处促进CRISPR复合物形成的元件，诸如指导多核苷酸和Cas蛋白。在天然存在的CRISPR系统(例如，细菌免疫CRISPR/Cas9系统)中，外来DNA被掺入CRISPR阵列中，然后产生CRISPR-RNA(crRNA)。crRNA包括与外来DNA位点互补的RNA指导序列区，并且与也由CRISPR系统编码的反式激活CRISPR-RNA(tracrRNA)杂交。tracrRNA形成二级结构(例如，茎环)，并且能够与Cas9蛋白结合。crRNA/tracrRNA杂合体与Cas9缔合，并且crRNA/tracrRNA/Cas9复合物识别并切割带有原型间隔子序列的外来DNA，从而赋予对入侵病毒或质粒的免疫力。CRISPR/Cas系统进一步描述于例如以下文献中：Jinek等人，Science[科学]337(6096)：816-821(2012)；Cong等人，Science[科学]339(6121)：819-823(2013)；Mali等人，Science[科学]339(6121)：823-826(2013)；和Sander等人，Nat Biotechnol[自然·生物技术]32：347-355(2014)。

CRISPR/Cas系统已经被工程化为将插入(也称为靶向插入)引入靶多核苷酸中。典型地，这样设计指导多核苷酸，使得Cas蛋白在靶多核苷酸处产生双链切割，并且通过细胞DNA修复机制(例如，非同源末端连接(NHEJ)或同源定向修复(HDR))将包含目的序列的单独供体模板插入经切割的靶多核苷酸中。插入效率取决于几个因素，包括供体模板、Cas蛋白和指导多核苷酸的转染率；供体模板的序列和大小；和所触发的DNA修复机制的类型。例如，HDR提供高保真DNA修复，但是插入频率低；而NHEJ的插入频率更高，但是也可能将突变引入靶DNA中。

在一些实施例中，本披露提供了用于经改进的靶向插入方法的组合物、多核苷酸和/或融合蛋白。在一些实施例中，本披露的组合物、多核苷酸和/或融合蛋白所提供的插入目的序列的精度更高。在一些实施例中，本披露的组合物、多核苷酸和融合蛋白所提供的插入目的序列的效率更高。

除非本文另有定义，否则本披露所用的科学和技术术语应当具有本领域普通技术人员通常所理解的含义。另外，除非上下文另有要求，否则单数术语应当包括复数形式，并且复数术语应当包括单数形式。如本文所用，“一个/一种(a)”或“一个/一种(an)”可以意指一个或多个/一种或多种。如本文所用，当与单词“包含”结合使用时，单词“一个/一种(a)”或“一个/一种(an)”可以意指一个或多于一个/一种或多于一种。如本文所用，“另一个/另一种”或“另一”可以意指至少第二个或更多个/至少第二种或更多种。

在整个本申请中，术语“约”用于指示值包括被采用以确定该值的方法/装置的误差的固有变化，或者研究受试者之间存在的变化。典型地，术语“约”意在涵盖近似于或小于1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％或20％变化，这取决于具体情况。

在权利要求中使用术语“或”用于意指“和/或”，除非明确指示仅指代替代方案或替代方案是相互排斥的，但本披露支持仅指代替代方案和“和/或”的定义。

如本文所用，术语“包含(comprising)”(和包含(comprising)的任何变体或形式，诸如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(和具有(having)的任何变体或形式，诸如“具有(have)”和“具有(has)”)、“包括(including)”(和包括(including)的任何变体或形式，诸如“包括(includes)”和“包括(include)”)或“含有(containing)”(和含有(containing)的任何变体或形式，诸如“含有(contains)”和“含有(contain)”)是包容性或开放性的，并不排除另外的未列举的要素或方法步骤。设想到了本说明书中所讨论的任何实施例都可以相对于本披露的任何蛋白质、组合物、多核苷酸、载体、细胞、方法和/或试剂盒实施。此外，本披露的组合物、多核苷酸、载体、细胞和/或试剂盒可以用于实现本披露的方法和蛋白质。

除非另有明确说明，否则术语“例如(for example)”及其对应的缩写“例如(e.g.)”(无论是否斜体)的使用意指所列举的特定术语是本披露的代表性示例和实施例，它们并不旨在限于所参考或引用的特定示例。

如本文所用，“之间”是包括范围末端的范围。例如，x与y之间的数值明确包括数值x和y，以及落在x和y内的任何数值。

“核酸”、“核酸分子”、“核苷酸”、“核苷酸序列”、“寡核苷酸”或“多核苷酸”意指包括共价连接的核苷酸的聚合化合物。术语“核酸”包括核糖核酸(RNA)或脱氧核糖核酸(DNA)，两者都可以是单链或双链的。多核苷酸可以包含天然存在的核碱基(例如，鸟嘌呤、腺嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶)、经修饰的核碱基(例如，次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、二氢尿嘧啶、5-甲基胞嘧啶、5-羟甲基胞嘧啶)和/或人工核碱基(例如，异鸟嘌呤或异胞嘧啶)。核酸从5′端至3′端进行转录。在一些实施例中，本披露提供了包含RNA和DNA核苷酸的多核苷酸。产生包含RNA和DNA两种核苷酸的多核苷酸的方法是本领域已知的，并且包括例如连接或寡核苷酸合成方法。在一些实施例中，本披露提供了能够与如本文所述的Cas核酸酶或Cas切口酶形成复合物的多核苷酸。在一些实施例中，本披露提供了编码本文披露的任一种蛋白质(例如，Cas核酸酶或Cas切口酶)的多核苷酸。

“基因”是指编码多肽的核苷酸的集合，并且包括cDNA和基因组DNA核酸分子。在一些实施例中，“基因”还指代可以充当编码序列之前(即，5′)和之后(即，3′)的调节序列的非编码核酸片段。

当单链形式的核酸分子可以在适当的温度和溶液离子强度条件下退火至另一核酸分子上时，该核酸分子与该另一核酸分子(诸如cDNA、基因组DNA或RNA)“可杂交”或“杂交”。杂交和洗涤条件是已知的，并且在以下文献中有例示：Sambrook等人，MolecularCloning：A Laboratory Manual[分子克隆：实验室手册]，第二版，Cold Spring HarborLaboratory Press[冷泉港实验室出版社]，Cold Spring Harbor[冷泉港](1989)，特别是其中的第11章和表11.1。温度和离子强度条件决定了杂交的严格性。可以选择杂交条件的严格性，以在存在其他潜在交叉反应或干扰多核苷酸的情况下提供两个互补多核苷酸的所期望的杂交产物的选择性形成或维持。严格条件是序列依赖性的；典型地，与更短的互补序列相比，更长的互补序列在更高的温度下特异性杂交。通常，严格杂交条件比特定多核苷酸在确定的离子强度、化学变性剂浓度、pH和杂交配偶体浓度下的热熔点T_m(即，50％的序列与基本上互补的序列杂交时的温度)低约5℃至约10℃之间。通常，与具有更低百分比的G和C碱基的核苷酸序列相比，具有更高百分比的G和C碱基的核苷酸序列在更严格条件下杂交。通常，可以通过增加温度、增加pH、降低离子强度和/或增加化学核酸变性剂(诸如甲酰胺、二甲基甲酰胺、二甲亚砜、乙二醇、丙二醇和碳酸乙烯酯)的浓度来提高严格性。严格杂交条件典型地包括小于约1M、500mM、200mM、100mM或50mM的盐浓度或离子强度；高于约20℃、30℃、40℃、60℃或80℃的杂交温度；以及高于约10％、20％、30％、40％或50％的化学变性剂浓度。因为许多因素可以影响杂交的严格性，所以与任何单独的参数的绝对值相比，参数的组合可能更显著。

术语“互补的”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如，对于DNA，腺苷与胸腺嘧啶互补，而胞嘧啶与鸟嘌呤互补。当两个核酸是“互补的”时，这意指第一核酸或其一个或多个区域能够与第二核酸或其一个或多个区域氢键合。互补核酸不需要在每个核苷酸处都具有互补性，并且可以包括一个或多个核苷酸错配，即不发生氢键合的点。例如，互补寡核苷酸可以具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％氢键合的核苷酸。相比之下，关于寡核苷酸的“完全互补”或“100％互补”意指每个核苷酸都氢键合而没有任何核苷酸错配。

术语“同源重组”是指将外来多核苷酸(例如，DNA)插入另一个核酸(例如，DNA)分子中，例如将载体插入染色体中。在一些情况下，载体靶向特定的染色体位点以进行同源重组。对于特定的同源重组，载体典型地含有与染色体序列具有同源性的足够长的区域，以允许载体与染色体的互补结合和将载体掺入染色体中。更长的同源性区域和更大程度的序列相似性可以提高同源重组的效率。在一些实施例中，本文所述的多核苷酸或组合物通过在核酸序列中产生断裂(例如，双链断裂)来促进同源重组。

如本文所用，术语“可操作地连接”意指目的多核苷酸(例如，编码核酸酶的多核苷酸)以允许多核苷酸表达的方式与调节元件连接。调节元件可以是顺式调节元件或反式调节元件。调节元件包括例如启动子、增强子、终止子、5′和3′UTR、绝缘子、沉默子、操作子等。在一些实施例中，调节元件是启动子。在一些实施例中，表达目的蛋白的多核苷酸与表达载体上的启动子可操作地连接。

如本文所用，“启动子”、“启动子序列”或“启动子区”是指能够结合RNA聚合酶并参与起始下游编码或非编码序列的转录的DNA调节区或多核苷酸。在一些实施例中，启动子序列包括转录起始位点并向上游延伸以包括以高于背景可检测水平起始转录所使用的最少数目的碱基或元件。在一些实施例中，启动子序列包括转录起始位点以及负责RNA聚合酶结合的蛋白质结合结构域。真核启动子典型地含有“TATA”框和“CAT”框。各种启动子(包括诱导型启动子)可以用于驱动本披露的各种载体的表达。

“载体”是用于将核酸克隆和/或转移到宿主细胞中的任何工具。载体可以是复制子，另一个DNA区段可以连接到该复制子上，以便引起所连接区段的复制。“复制子”是任何遗传因子(例如，质粒、噬菌体、粘粒、染色体、病毒)，其充当体内DNA复制的自主单元，即能够在其自我控制下复制。在一些实施例中，载体是附加型载体，其在许多个细胞世代后例如通过不对称分配从细胞群中去除/丢失。术语“载体”包括用于在体外、离体或体内将核酸引入细胞中的病毒性和非病毒性工具两者。本领域已知的大量载体可以用于操纵核酸、将应答元件和启动子掺入基因中等。载体可以包括一个或多个调节区，和/或可用于选择、测量和监测核酸转移结果(转移到哪些组织、表达持续时间等)的选择性标记。

可能的载体包括例如质粒或经修饰的病毒，包括例如噬菌体(诸如λ衍生物)，或质粒(诸如PBR322或pUC质粒衍生物)，或Bluescript载体。例如，将对应于应答元件和启动子的DNA片段插入合适的载体中可以通过将适当的DNA片段连接至具有互补粘性末端的选定载体中来完成。替代性地，DNA分子的末端可以被酶促地修饰，或者任何位点都可以通过将多核苷酸(接头)连接至DNA末端中来产生。此类载体可以被工程化为含有提供对细胞进行选择的选择性标记基因，这些细胞将标记掺入细胞基因组中。此类标记允许鉴定和/或选择宿主细胞，其掺入和表达由标记编码的蛋白质。

病毒载体、特别是逆转录病毒载体已经用于细胞以及活体动物受试者的各种各样的基因递送应用中。可以使用的病毒载体包括但不限于逆转录病毒、腺病毒、腺相关病毒、痘病毒、杆状病毒、牛痘病毒、单纯疱疹病毒、EB病毒、腺病毒、双生病毒和花椰菜花叶病毒载体。在一些实施例中，利用病毒载体来提供本文所述的多核苷酸。在一些实施例中，利用病毒载体来提供编码本文所述的蛋白质的多核苷酸。

可以通过已知的方法将载体引入所期望的宿主细胞中，这些方法包括但不限于转染、转导、细胞融合和脂质体转染。载体可以包括各种调节元件，包括启动子。在一些实施例中，载体设计可以基于按照以下文献设计的构建体：Mali等人，Nat Methods[自然·方法]10：957-63(2013)。

本领域已知的方法可以用于扩增本文提供的多核苷酸和/或载体。一旦建立了合适的宿主系统和生长条件，便可以大量扩增和制备重组表达载体。如本文所述，可以使用的表达载体包括但不限于以下载体或其衍生物：人或动物病毒，诸如牛痘病毒或腺病毒；昆虫病毒，诸如杆状病毒；酵母载体；噬菌体载体(例如，λ)；以及质粒和粘粒DNA载体。

术语“质粒”是指额外的染色体元件，其通常携带不是细胞的中心代谢的一部分的基因，并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性、环状或超螺旋的自主复制序列、基因组整合序列、噬菌体或核苷酸序列，其中许多多核苷酸已经连接或重组到独特结构中，该独特结构能够将针对选定基因产物的启动子片段和DNA序列连同适当的3′非翻译序列引入细胞中。在一些实施例中，利用质粒来提供本文所述的多核苷酸。在一些实施例中，利用质粒来提供编码本文所述的蛋白质的多核苷酸。

如本文所用的术语“转染”意指将外源核酸分子(包括载体)引入细胞中。转染方法(例如，用于本文所述的CRISPR/Cas组合物的组分)是本领域普通技术人员已知的。“经转染的”细胞包括细胞内的外源核酸分子，并且“经转化的”细胞是细胞内的外源核酸分子诱导细胞中的表型变化的细胞。所转染的核酸分子可以整合到宿主细胞的基因组DNA中，和/或可以由细胞暂时或长时间维持在染色体外。表达外源核酸分子或片段的宿主细胞或生物体在本文中被称为“重组的”、“经转化的”或“转基因的”生物体。在一些实施例中，本披露提供了包含本文所述的任何表达载体(例如，包含编码本文所述的蛋白质的多核苷酸的表达载体)的宿主细胞。

术语“宿主细胞”是指已经引入重组表达载体的细胞，或者“宿主细胞”也可以指代这种细胞的后代。因为在随后的世代中可能发生修饰(例如，由于突变或环境影响)，所以后代可能与亲本细胞不相同，但是仍被包括在术语“宿主细胞”的范围内。

术语“肽”、“多肽”和“蛋白质”在本文中可互换地使用，并且是指任何长度的氨基酸的聚合形式，其可以包括编码和非编码的氨基酸、经化学或生物化学修饰或衍生的氨基酸和具有经修饰的肽骨架的多肽。

蛋白质或多肽的起点被称为“N末端(N-terminus)”(也称为氨基末端、NH2末端、N末端(N-terminal end)或胺末端)，是指蛋白质或多肽的第一个氨基酸残基的游离胺(-NH₂)基团。蛋白质或多肽的末端被称为“C末端(C-terminus)”(也称为羧基末端(carboxy-terminus)、羧基末端(carboxyl-terminus)、C末端(C-terminal end)或COOH末端)，是指蛋白质或多肽的最后一个氨基酸残基的游离羧基(-COOH)。

如本文所用的“氨基酸”是指包括羧基(-COOH)和氨基(-NH₂)两者的化合物。“氨基酸”是指天然和非天然(即，合成)两种氨基酸。天然氨基酸(采用其三字母和单字母缩写)包括：丙氨酸(Ala；A)；精氨酸(Arg；R)；天冬酰胺(Asn；N)；天冬氨酸(Asp；D)；半胱氨酸(Cys；C)；谷氨酰胺(Gln；Q)；谷氨酸(Glu；E)；甘氨酸(Gly；G)；组氨酸(His；H)；异亮氨酸(Ile；I)；亮氨酸(Leu；L)；赖氨酸(Lys；K)；甲硫氨酸(Met；M)；苯丙氨酸(Phe；F)；脯氨酸(Pro；P)；丝氨酸(Ser；S)；苏氨酸(Thr；T)；色氨酸(Trp；W)；酪氨酸(Tyr；Y)；和缬氨酸(Val；V)。非天然或合成氨基酸包括与上文提供的天然氨基酸不同的侧链，并且可以包括例如荧光团、翻译后修饰、金属离子螯合剂、光笼和光交联部分、独特的反应性官能团以及NMR、IR和x射线晶体学探针。示例性非天然或合成氨基酸提供于例如以下文献中：Mitra等人，Mater Methods[材料与方法]3：204(2013)和Wals等人，Front Chem[化学前沿]2：15(2014)。非天然氨基酸还可以包括典型地不掺入蛋白质或多肽中的天然存在的化合物，例如像瓜氨酸(Cit)、硒代半胱氨酸(Sec)和吡咯赖氨酸(Pyl)。

“氨基酸取代”是指包括一个或多个野生型或天然存在的氨基酸被相对于野生型或天然存在的氨基酸不同的氨基酸在该氨基酸残基处取代的多肽或蛋白质。所取代的氨基酸可以是合成或天然存在的氨基酸。在一些实施例中，所取代的氨基酸是选自下组的天然存在的氨基酸，该组由以下组成：A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V。在一些实施例中，所取代的氨基酸是非天然或合成氨基酸。可以使用缩写系统来描述取代突变体。例如，第五(第5)个氨基酸残基被取代的取代突变可以缩写为“X5Y”，其中“X”是待被代替的野生型或天然存在的氨基酸，“5”是蛋白质或多肽的氨基酸序列内该氨基酸残基的位置，并且“Y”是所取代的或非野生型或非天然存在的氨基酸。

“分离的”多肽、蛋白质、肽或核酸是已经从其天然环境中去除的分子。还应理解，“分离的”多肽、蛋白质、肽或核酸可以用赋形剂(诸如稀释剂或佐剂)进行配制，并且仍被认为是分离的。如本文所用，“分离的”不一定暗示多肽、蛋白质、肽或核酸的任何特定水平纯度。

当关于核酸分子、肽、多肽或蛋白质使用时，术语“重组的”意指已知在自然界中不存在的遗传材料的新组合或由其产生。重组分子可以通过重组技术领域可用的任何技术来产生，这些技术包括但不限于聚合酶链式反应(PCR)、基因剪接(例如，使用限制性核酸内切酶)以及核酸分子、肽或蛋白质的固相合成。

术语“外源的”意指引入宿主细胞中的所参考分子或活性。可以例如通过将编码核酸引入宿主遗传材料中(诸如通过整合到宿主染色体中或作为非染色体遗传材料(例如，质粒))来引入分子。“外源的”蛋白质可以经由编码该蛋白质的“外源的”核酸引入宿主细胞中。术语“内源的”是指天然存在于宿主细胞中的所参考分子或活性。“内源的”蛋白质由宿主细胞内所含的核酸表达。术语“异源的”是指来源于所参考生物体/物种以外的来源的分子或活性，而“同源的”是指来源于宿主生物体/物种的分子或活性。因此，编码核酸的外源表达可以利用异源或同源编码核酸中的任一者或两者。

当关于多肽或蛋白质使用时，术语“结构域”意指蛋白质中独特的功能和/或结构单元。结构域有时负责特定的功能或相互作用，有助于蛋白质的整体作用。在多种生物学背景下可以存在结构域。在具有不同功能的蛋白质中可以找到相似的结构域。替代性地，具有低序列同一性(即，小于约50％、小于约40％、小于约30％、小于约20％、小于约10％、小于约5％或小于约1％的序列同一性)的结构域可以具有相同的功能。

当关于多肽或蛋白质使用时，术语“基序”通常是指一组典型地长度短于20个氨基酸的保守的氨基酸残基，其对于蛋白质功能可能是重要的。特定的序列基序可以介导多种蛋白质中的共同功能，诸如蛋白质结合或靶向特定亚细胞位置。基序的示例包括但不限于核定位信号、微体靶向基序、阻止或促进分泌的基序以及促进蛋白质识别和结合的基序。基序数据库和/或基序搜索工具是本领域已知的，并且包括例如PROSITE、PFAM、PRINTS和MiniMotif Miner。

如本文所用，“经工程化的”蛋白质意指在蛋白质中包括一个或多个修饰以获得所期望的特性的蛋白质。示例性修饰包括但不限于插入、缺失、取代和/或与另一结构域或蛋白质融合。“融合蛋白”(也称为“嵌合蛋白”)是包含至少两个结构域的蛋白质，该至少两个结构域典型地由两个单独的基因编码，该两个单独的基因已经这样连接使得它们作为单个单元进行转录和翻译，从而产生具有每个结构域的功能特性的单一多肽。本披露的经工程化的蛋白质包括Cas核酸酶、Cas切口酶以及Cas蛋白与DNA聚合酶、DNA连接酶和/或DNA聚合酶结合蛋白的融合物。

在一些实施例中，经工程化的蛋白是从野生型蛋白质产生的。如本文所用，“野生型”蛋白质或核酸是天然存在的未经修饰的蛋白质或核酸。例如，野生型Cas9蛋白可以分离自生物体酿脓链球菌(Streptococcus pyogenes)。野生型可以与“突变体”形成对比，“突变体”在蛋白质或核酸的氨基酸和/或核苷酸序列中包括一个或多个修饰。在一些实施例中，经工程化的蛋白质可以具有与野生型蛋白质基本上相同的活性，例如野生型蛋白质活性的大于约80％、大于约85％、大于约90％、大于约95％或大于约99％。在一些实施例中，本文所述的融合蛋白的Cas核酸酶具有与野生型Cas核酸酶基本上相同的活性。

如本文所用，术语“序列相似性”或“相似性％”是指核酸序列或氨基酸序列之间的同一性或对应性程度。在多核苷酸的背景下，“序列相似性”可以指代这样的核酸序列，其中一个或多个核苷酸碱基的改变导致一个或多个氨基酸的取代，但是不影响由多核苷酸编码的蛋白质的功能特性。“序列相似性”还可以指代多核苷酸的修饰，诸如基本上不影响所得转录物的功能特性的一个或多个核苷酸碱基的缺失或插入。因此，应理解，本披露不仅仅涵盖特定的示例性序列。进行核苷酸碱基取代的方法以及确定所编码多肽的生物活性保留的方法是已知的。

此外，熟练技术人员认识到，本披露所涵盖的相似多核苷酸也由其在严格条件下与本文例示的序列杂交的能力来定义。本披露的相似多核苷酸与本文披露的多核苷酸具有约70％、至少约70％、约75％、至少约75％、约80％、至少约80％、约85％、至少约85％、约90％、至少约90％、约95％、至少约95％、约99％、至少约99％或约100％同一性。

在多肽的背景下，“序列相似性”是指这样的两个或更多个多肽，其中大于约40％的氨基酸是相同的，或者大于约60％的氨基酸是在功能上相同的。“在功能上相同的”或“在功能上相似的”氨基酸具有在化学上相似的侧链。例如，可以根据功能相似性按照以下方式对氨基酸进行分组：(i)带正电的侧链：Arg、His、Lys；(ii)带负电的侧链：Asp、Glu；(iii)极性、不带电的侧链：Ser、Thr、Asn、Gln；(iv)疏水性侧链：Ala、Val、Ile、Leu、Met、Phe、Tyr、Trp；和(v)其他：Cys、Gly、Pro。

在一些实施例中，本披露的相似多肽具有约40％、至少约40％、约45％、至少约45％、约50％、至少约50％、约55％、至少约55％、约60％、至少约60％、约65％、至少约65％、约70％、至少约70％、约75％、至少约75％、约80％、至少约80％、约85％、至少约85％、约90％、至少约90％、约95％、至少约95％、约97％、至少约97％、约98％、至少约98％、约99％、至少约99％或约100％相同的氨基酸。在一些实施例中，本披露的相似多肽具有约60％、至少约60％、约65％、至少约65％、约70％、至少约70％、约75％、至少约75％、约80％、至少约80％、约85％、至少约85％、约90％、至少约90％、约95％、至少约95％、约97％、至少约97％、约98％、至少约98％、约99％、至少约99％或约100％在功能上相同的氨基酸。

可以使用本领域已知的方法通过序列比对来确定序列相似性，这些方法例如像BLAST、MUSCLE、Clustal(包括ClustalW和ClustalX)和T-Coffee(包括例如像M-Coffee、R-Coffee和Expresso等变体)。

当在指定的比较窗口上比对多核苷酸或多肽序列时，可以确定多核苷酸或多肽的同一性百分比。在一些实施例中，仅将两个或更多个序列的特定部分进行比对以确定序列同一性。在一些实施例中，仅将两个或更多个序列的特定结构域进行比对以确定序列相似性。比较窗口可以是至少10至超过1000个残基、至少20至约1000个残基或至少50至500个残基的区段，在其中可以比对和比较这些序列。用于确定序列同一性的比对方法是熟知的，并且可以使用公开可用的数据库(诸如BLAST)来进行。例如，在一些实施例中，使用Karlin和Altschul，Proc Nat Acad Sci USA[美国国家科学院院刊]87：2264-2268(1990)的算法，如Karlin和Altschul，Proc Nat Acad Sci USA[美国国家科学院院刊]90：5873-5877(1993)中所改良的，确定两个氨基酸序列的“同一性百分比”。此类算法被并入BLAST程序中，例如以下文献中所述的BLAST+或NBLAST和XBLAST程序：Altschul等人，J Mol Biol[分子生物学杂志]，215：403-410(1990)。可以用例如像XBLAST程序(得分＝50、字长＝3)等程序执行BLAST蛋白质搜索，以获得与本披露的蛋白质分子同源的氨基酸序列。在两个序列之间存在缺口的情况下，可以利用缺口BLAST，如以下文献中所述：Altschul等人，Nucleic AcidsRes[核酸研究]25(17)：3389-3402(1997)。当利用BLAST和缺口BLAST程序时，可以使用相应程序(例如，XBLAST和NBLAST)的缺省参数。

在一些实施例中，多肽或多核苷酸与本文提供的参考多肽或多核苷酸(或参考多肽或多核苷酸的片段)具有70％、至少70％、75％、至少75％、80％、至少80％、85％、至少85％、90％、至少90％、95％、至少95％、97％、至少97％、98％、至少98％、99％或至少99％或100％的序列同一性。在一些实施例中，多肽或多核苷酸与本文提供的参考多肽或多核苷酸(或参考多肽或核酸分子的片段)具有约70％、至少约70％、约75％、至少约75％、约80％、至少约80％、约85％、至少约85％、约90％、至少约90％、约95％、至少约95％、约97％、至少约97％、约98％、至少约98％、约99％、至少约99％或约100％的序列同一性。

如本文所用，“复合物”是指一组两个或更多个相缔合的多核苷酸和/或多肽。在复合物形成的背景下，术语“缔合(associate)”或“缔合(association)”是指通过静电、疏水/亲水和/或氢键合相互作用彼此结合而不是共价连接的分子。包含彼此共价连接的不同部分的分子是已知的。在一些实施例中，当复合物的所有组分一起存在时，形成复合物，即自组装复合物。在一些实施例中，通过复合物的不同组分之间的化学相互作用(例如像氢键合)形成复合物。在一些实施例中，本文提供的多核苷酸通过蛋白质对多核苷酸的二级结构的识别与本文提供的蛋白质形成复合物。在一些实施例中，本文提供的多核苷酸的Cas结合区包含由本文提供的Cas核酸酶、Cas切口酶或融合蛋白识别的二级结构。

组合物

在一些实施例中，本披露提供了组合物，该组合物包含：Cas核酸酶或Cas切口酶；以及多核苷酸，该多核苷酸包含(i)指导序列；Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

在一些实施例中，本披露提供了组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。

在一些实施例中，本披露提供了组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。

在一些实施例中，本披露提供了组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)目的序列(SOI)。

在一些实施例中，本披露提供了组合物，该组合物包含：Cas核酸酶或Cas切口酶；第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；(ii)目的序列(SOI)。

如本文所用，“Cas蛋白”涵盖Cas核酸酶和Cas切口酶两者。Cas蛋白是本文所述的CRISPR/Cas系统的一部分。包括Cas蛋白和多核苷酸(也称为“指导多核苷酸”)的CRISPR/Cas系统可以用于位点特异性基因组修饰。在一些实施例中，该CRISPR/Cas系统包含Cas蛋白和指导多核苷酸，该指导多核苷酸包含Cas结合区(其结合和/或激活该Cas蛋白)和指导序列(其与靶序列杂交)，其中该Cas蛋白和该指导多核苷酸形成如本文所述的复合物。在一些实施例中，该CRISPR/Cas系统包含Cas蛋白、含有指导序列的第一多核苷酸和含有Cas结合区的第二多核苷酸，其中该第一和第二多核苷酸彼此杂交，并且与该Cas蛋白形成复合物。

根据该系统中的Cas蛋白，CRISPR/Cas系统可以分为I型至VI型。例如，Cas9在II型系统中找到，并且Cas12在V型系统中找到。每种类型都可以进一步划分为子类型。例如，II型可以包括II-A、II-B和II-C子类型，并且V型可以包括V-A和V-B子类型。CRISPR/Cas系统和Cas核酸酶的分类进一步讨论于例如以下文献中：Makarova等人，Methods Mol Biol[分子生物学方法]1311：47-75(2015)；Makarova等人，The CRISPR Journal[CRISPR杂志]2018年10月；325-336；和Koonin等人，Phil Trans R Soc B[皇家学会哲学会刊B系列]374：20180087(2018)。除非另有规定，否则本文所述的Cas核酸酶可以涵盖任何类型或变体。

在一些实施例中，该组合物包含Cas核酸酶。通常，Cas核酸酶能够产生双链多核苷酸切割，例如双链DNA切割。通常，Cas核酸酶可以包括一个或多个核酸酶结构域(诸如RuvC和HNH)，并且可以切割双链DNA。在一些实施例中，Cas核酸酶包含RuvC结构域和HNH结构域，其各自切割双链DNA的一条链。在一些实施例中，该Cas核酸酶产生平末端。在一些实施例中，Cas核酸酶的RuvC和HNH在相同位置处切割每条DNA链，从而产生平末端。在一些实施例中，该Cas核酸酶产生粘性末端。在一些实施例中，Cas核酸酶的RuvC和HNH在不同位置处切割每条DNA链(即，在“偏移”处切割)，从而产生粘性末端。如本文所用，术语“粘性末端(cohesive end)”、“交错末端”或“粘性末端(sticky end)”是指具有长度不等的链的核酸片段。与“平末端”相反，粘性末端是由双链核酸(例如，DNA)上的交错切割产生的。粘性末端(sticky或cohesive end)具有突出的单链的链(这些链具有不成对的核苷酸)或突出端(例如，3′或5′突出端)。

在一些实施例中，该Cas核酸酶是Cas9核酸酶。示例性Cas9核酸酶包括但不限于来自酿脓链球菌、嗜热链球菌(Streptococcus thermophilus)、变形链球菌(Streptococcusmutans)、无害利斯特菌(Listeria innocua)、脑膜炎奈瑟菌(Neisseria meningitidis)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎克雷伯菌(Klebisella pneumoniae)和许多其他细菌的Cas9。其他示例性Cas9核酸酶描述于例如以下专利中：US 8,771,945；US 9,023,649；US 10,000,772；和US 10,407,697。在一些实施例中，该Cas9核酸酶来自酿脓链球菌(S.pyogenes)(SpCas9)。

在一些实施例中，该Cas核酸酶是Cas12核酸酶。在一些实施例中，该Cas核酸酶是Cas12a核酸酶(以前称为“Cpf1”或“C2c1”)。Cas12核酸酶通常比Cas9核酸酶小，并且可以典型地产生粘性末端。示例性Cas12蛋白包括但不限于来自新凶手弗朗西丝氏菌(Francisella novicida)、氨基酸球菌属物种(Acidaminococcus sp.)、毛螺菌科物种(Lachnospiraceae sp.)、普雷沃菌属物种(Prevotella sp.)和许多其他细菌的Cas12蛋白。其他Cas12核酸酶描述于例如以下文献中：US 9,580,701；US 2016/0208243；Zetsche等人，Cell[细胞]163(3)：759-771(2015)；和Chen等人，Science[科学]360：436-439(2018)。

在一些实施例中，该Cas核酸酶是II-B型Cas核酸酶。II-B型Cas核酸酶能够产生如本文所述的粘性末端。示例性IIB型Cas9蛋白包括但不限于来自嗜肺军团菌(Legionellapneumophila)、新凶手弗朗西丝氏菌、排泄物副腺杆菌(Parasutterellaexcrementihominis)、华德萨特菌(Sutterella wadsworthensis)、产琥珀酸沃廉菌(Wolinella succinogenes)、已测序的肠道宏基因组MH0245_GL0161830.1和许多其他细菌的Cas9蛋白。其他II-B型Cas9蛋白描述于例如WO 2019/099943中。在一些实施例中，该II-B型Cas核酸酶来自已测序的肠道宏基因组MH0245_GL0161830.1(MHCas9)。

在一些实施例中，该组合物包含Cas切口酶。在双链多核苷酸(例如，DNA)上产生单链切割的切口酶与核酸酶不同，后者切割双链多核苷酸(例如，DNA)的两条链。如本文所讨论，野生型Cas核酸酶典型地包含两个催化核酸酶结构域RuvC和HNH，并且每个核酸酶结构域负责双链DNA的一条链的切割。因此，在一些实施例中，相对于Cas核酸酶，Cas切口酶在催化结构域中包含氨基酸突变。Cas切口酶进一步描述于例如以下文献中：Cho等人，GenomeRes[基因组研究]24：132-141(2013)；Ran等人，Cell[细胞]154：1380-1389(2013)；和Mali等人，Nat Biotechnol[自然·生物技术]31：833-838(2013)。

在一些实施例中，该Cas切口酶是Cas9切口酶。在一些实施例中，该Cas切口酶是Cas12a切口酶。在一些实施例中，该Cas切口酶是II-B型Cas切口酶。在一些实施例中，该Cas切口酶通过在Cas核酸酶中提供突变来产生。例如，相对于野生型SpCas9核酸酶，SpCas9切口酶包含D10A突变或H840A突变。本领域普通技术人员将理解，诸如本文所述的那些等比对方法可以用于确定其他Cas核酸酶(例如，Cas12a或II-B型Cas核酸酶)中的相应氨基酸残基，以产生Cas切口酶。

在一些实施例中，该组合物的Cas核酸酶或Cas切口酶不与异源蛋白质结构域融合。在一些实施例中，该Cas核酸酶或Cas切口酶不与DNA聚合酶、DNA连接酶或逆转录酶融合。

在一些实施例中，该组合物的Cas核酸酶或Cas切口酶与异源蛋白质结构域融合。在一些实施例中，该Cas核酸酶或Cas切口酶与DNA聚合酶、DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合。本文进一步描述了包含Cas核酸酶或Cas切口酶的融合蛋白。

多核苷酸

在一些实施例中，本披露的组合物包含多核苷酸。在一些实施例中，该多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。在一些实施例中，该指导序列是RNA指导序列。在一些实施例中，该多核苷酸以5′至3′顺序包含：该指导序列(例如，RNA指导序列)、该Cas结合区和该DNA模板序列。

在一些实施例中，本披露的组合物包含第一和第二多核苷酸。在一些实施例中，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；并且该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列、该Cas结合区和该第一杂交区。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区和该DNA模板序列。

在一些实施例中，该第一多核苷酸包含∶(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；并且该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列和该第一杂交区。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区、该Cas结合区和该DNA模板序列。

在一些实施例中，本披露的组合物包含第一和第二多核苷酸。在一些实施例中，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；并且该第二多核苷酸包含：第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)。在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列、该Cas结合区、该第一杂交区和该引物结合序列。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区和该SOI。在一些实施例中，该第一多核苷酸和/或该第二多核苷酸包含RNA、DNA、经修饰的核苷酸或其组合。本文描述了经修饰的核苷酸。包含如本文所述的第一和第二多核苷酸的组合物的非限制性示例性图示示于图11(B)中。

在一些实施例中，该第一多核苷酸和/或该第二多核苷酸进一步包含同源序列。在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列、该Cas结合区、该第一杂交区和该引物结合序列。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区、该SOI和该同源序列。在一些实施例中，该同源序列能够与经切割的靶多核苷酸(例如，由Cas核酸酶或Cas切口酶产生)近侧的序列杂交。在一些实施例中，该指导序列与切割位点一侧上的区域杂交，并且该同源序列与切割位点另一侧上的区域杂交，例如如图9或图11(A)所展示。在图9和图11(A)中，第一多核苷酸包含该指导序列(称为“间隔子”)、Cas结合区(称为“gRNA支架”)、第一杂交区(称为“着陆垫”)和引物结合序列(PBS)，第二多核苷酸包含该第二杂交区(称为“杂交序列”)、SOI(称为“插入片段”)和同源序列。

在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列、该Cas结合区、该同源序列、该第一杂交区和该引物结合序列。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区、该SOI和另一杂交区，其中该第二杂交区和该另一杂交区与该第一杂交区的非重叠部分杂交。在一些实施例中，该第二杂交区和该另一杂交区位于该SOI的侧翼，并且与该第一杂交区的相邻部分杂交，例如如图11(J)所展示。在一些实施例中，该指导序列与切割位点一例上的区域杂交，并且该同源序列与切割位点另一例且在相对DNA链上的区域杂交，例如如图11(J)所展示。

在一些实施例中，本披露的组合物包含第一、第二和第三多核苷酸。在一些实施例中，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；并且该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；(ii)目的序列(SOI)。在一些实施例中，该第一多核苷酸以5′至3′顺序包含：该指导序列、该Cas结合区和该第一杂交区。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区、该第三杂交区和该引物结合序列。在一些实施例中，该第三多核苷酸以5′至3′顺序包含：该第四杂交区和该SOI。在一些实施例中，该第一多核苷酸、该第二多核苷酸和/或该第三多核苷酸中的任一个包含RNA、DNA、经修饰的核苷酸或其组合。本文描述了经修饰的核苷酸。

在一些实施例中，该第一多核苷酸、该第二多核苷酸和/或该第三多核苷酸中的任一个进一步包含如本文所述的同源序列，例如如图11(E)所展示。在一些实施例中，该第一多核苷酸以5′至3′顺序包含∶该指导序列、该Cas结合区和该第一杂交区。在一些实施例中，该第二多核苷酸以5′至3′顺序包含：该第二杂交区、该第三杂交区和该引物结合序列。在一些实施例中，该第三多核苷酸以5′至3′顺序包含：该第四杂交区、该SOI和该同源序列。

在一些实施例中，本文的组合物(例如，包含该第一、第二和/或第三多核苷酸)进一步包含含有与该SOI互补的序列的SOI互补体寡核苷酸。在一些实施例中，该SOI互补体寡核苷酸在5′和3′端中的一个或两个处比该SOI长，从而产生包含突出末端的双链序列，如图11(D)所展示。在一些实施例中，该SOI互补体寡核苷酸的长度与该SOI相同，从而产生具有平末端的双链序列，例如如图11(H)所展示。在一些实施例中，该SOI互补体寡核苷酸与该SOI杂交以形成双链SOI。在一些实施例中，与单链SOI相比，双链SOI的精确插入效率更高。在一些实施例中，该SOI互补体寡核苷酸进一步包含同源序列，例如如图11(I)所展示。

在一些实施例中，该第二杂交区在该第一杂交区的整个长度上杂交。在一些实施例中，该第二杂交区比该第一杂交区短例如约1至约10个核苷酸、或约2至约8个核苷酸、或约3至约6个核苷酸、或约4至约5个核苷酸。在一些实施例中，该第二杂交区在该第二杂交区的5′端比该第一杂交区短，从而在该第二杂交区与经切割的DNA之间留下缺口，例如如图11(F)所展示。在一些实施例中，该第二杂交区比该第一杂交区长例如约1至约10个核苷酸、或约2至约8个核苷酸、或约3至约6个核苷酸、或约4至约5个核苷酸。在一些实施例中，该第二杂交区在该第二杂交区的5′端比该第一杂交区长，从而在该第一杂交区与该第二杂交区之间杂交后提供flap，例如如图11(G)所展示。在一些实施例中，该flap募集和/或接合诸如FEN1等修复机器，从而便于精确地插入该目的序列。

在一些实施例中，本披露提供了多核苷酸，该多核苷酸包含：(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。在一些实施例中，本披露提供了多核苷酸，该多核苷酸包含：(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端，并且其中该DNA模板序列包含硫代磷酸酯键。在一些实施例中，该多核苷酸以5′至3′顺序包含：该指导序列(例如，RNA指导序列)、该Cas结合区和该DNA模板序列。

在一些实施例中，该指导序列能够与靶多核苷酸(例如，宿主细胞基因组中的靶多核苷酸)杂交。在实施例中，该指导序列与该靶多核苷酸互补。在一些实施例中，该靶多核苷酸是旨在被该Cas核酸酶或Cas切口酶切割的靶DNA。在一些实施例中，该指导序列包含RNA，即RNA指导序列。在一些实施例中，该指导序列包含RNA和DNA的组合。杂合RNA-DNA指导序列进一步描述于例如以下文献中：Rueda等人，Nat Comm[自然·通讯]8：1610(2017)。

在一些实施例中，该指导序列的长度为约10至约40个核苷酸。在一些实施例中，该指导序列的长度为约12至约30个核苷酸。在一些实施例中，该指导序列的长度为约15至约20个核苷酸。在一些实施例中，该指导序列的长度为约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39或约40个核苷酸。在一些实施例中，该指导序列的长度足以与该靶多核苷酸杂交。

在一些实施例中，该Cas结合区能够与组合物中的Cas蛋白(例如，Cas核酸酶或Cas切口酶)结合，从而与该Cas蛋白形成复合物。在一些实施例中，该Cas结合区包含RNA。在一些实施例中，该Cas结合区包含RNA和DNA的组合。可以结合和/或激活Cas蛋白的杂合RNA-DNA序列进一步描述于例如以下文献中：Rueda等人，Nat Comm[自然·通讯]8：1610(2017)。

在一些实施例中，该Cas结合区包含结合并激活该Cas蛋白的tracrRNA。在一些实施例中，该Cas结合区能够与tracrRNA杂交，并且该组合物进一步包含tracrRNA。在一些实施例中，该tracrRNA能够结合该Cas核酸酶或Cas切口酶。在一些实施例中，该tracrRNA能够激活该Cas核酸酶或Cas切口酶。在一些实施例中，激活包括起始或增加该Cas核酸酶或Cas切口酶的切割活性。在一些实施例中，激活包括促进该Cas核酸酶或Cas切口酶与靶多核苷酸的结合(例如，如在该指导序列的引导下)。在一些实施例中，激活包括以下的组合：促进该Cas核酸酶或Cas切口酶与该靶多核苷酸的结合；和起始或增加该Cas核酸酶或Cas切口酶的切割活性。Cas蛋白(例如，本文所述的Cas9、Cas12a或II-B型Cas蛋白)的tracrRNA序列可从包括RNAcentral和Rfam在内的公共数据库获得，并且进一步描述于例如以下文献中：Chylinski等人，RNA Biol[RNA生物学]10(5)：726-737(2013)和Gasiunas等人，Nat Comm[自然·通讯]11：5512(2020)。

在一些实施例中，本披露的多核苷酸在该多核苷酸的3′端包含DNA模板序列。在一些实施例中，该DNA模板序列包含单链DNA。在一些实施例中，该DNA模板序列包含目的序列。在一些实施例中，该DNA模板序列包含引物结合序列和目的序列。在一些实施例中，该DNA模板序列包含用于通过DNA聚合酶扩增的模板。在一些实施例中，该目的序列包含用于通过DNA聚合酶扩增的模板。在一些实施例中，该组合物的Cas核酸酶或Cas切口酶被该指导序列引导至靶多核苷酸并切割该靶多核苷酸，并且经切割的靶多核苷酸的一条链与该引物结合序列杂交并充当DNA聚合酶的引物。在一些实施例中，该DNA聚合酶能够合成与该目的序列互补的DNA链，以形成包含该目的序列的双链序列。在一些实施例中，将包含该目的序列的双链序列例如经由本文所述的连接或DNA修复途径插入经切割的靶多核苷酸中。Cas介导的目的序列的靶向插入的示例性非限制性概述展示于图1中。在图1中，Cas核酸酶被指导序列引导至细胞中的靶DNA并切割该靶DNA。该DNA模板序列包含(i)与作为引物的经切割的DNA杂交的引物结合序列和(ii)目的序列。DNA聚合酶(例如，该细胞的内源DNA聚合酶)与该引物结合并合成与该目的序列互补的DNA链，从而形成包含该目的序列的双链序列。可以通过DNA修复途径(例如，NHEJ)将该双链序列插入经切割的靶DNA中。

在一些实施例中，本文所述的DNA模板序列的组分(例如，该目的序列和该引物结合序列)位于两个单独的多核苷酸(例如，如本文所述的第一和第二多核苷酸)上。该目的序列和该引物结合序列位于两个单独的多核苷酸上的实施例的示例性非限制性概述展示于图10A-图10C中。在图10A中，该指导序列、Cas结合区、第一杂交区和引物结合位点位于第一多核苷酸上。通过被指导序列引导至靶DNA的Cas核酸酶在该靶DNA处产生双链断裂。该引物结合位点与经切割的DNA杂交，并且第二多核苷酸经由包含互补序列的该第一和第二杂交区与该第一多核苷酸杂交。该第二多核苷酸包含目的序列，其被连接酶连接至经切割的DNA的5′和3′两端(图10A)。该第二多核苷酸可以进一步包括同源序列，并且5′端被连接酶连接至经切割的DNA中，并且通过同源介导的机制整合3′端(图10B)。在一些实施例中，同源介导的机制包括HDR、合成依赖性链退火(SDSA)、单链退火(SSA)、替代末端连接(alt-EJ)或其组合。在连接和/或同源介导的整合后，将该复合物转化为双链DNA，从而将该目的序列整合到该靶DNA中(图10C)。

在一些实施例中，该目的序列包含目的基因。如本文所用，术语“目的基因”是指编码目的生物分子(例如，蛋白质或RNA分子)的基因。在一些实施例中，该目的基因编码目的蛋白。在一些实施例中，该目的蛋白包含胞内蛋白、膜蛋白、胞外蛋白或其组合。在一些实施例中，该目的蛋白包含核蛋白、转录因子、核膜转运体、胞内细胞器相关蛋白、膜受体、催化蛋白、酶、治疗性蛋白、膜蛋白、膜转运蛋白、信号转导蛋白、免疫蛋白或其组合。在一些实施例中，该免疫蛋白包含抗体，例如IgG、IgA、IgM、IgD、IgE或其组合。在一些实施例中，该目的序列编码该宿主细胞的天然基因的拷贝。在一些实施例中，该目的序列编码该宿主细胞中缺乏的天然基因的拷贝。在一些实施例中，该宿主细胞在基因中包含突变，并且该目的序列编码该基因的野生型拷贝。在一些实施例中，该宿主细胞包含野生型基因，并且该目的序列编码包含目的突变的基因的拷贝。在一些实施例中，该目的序列编码并非天然存在于该宿主细胞中的异源基因。

在一些实施例中，该目的基因编码目的RNA。在一些实施例中，该目的RNA包含治疗性RNA。在一些实施例中，该目的RNA包含信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、小核RNA(snRNA)、反义RNA、微RNA(miRNA)、小干扰RNA(siRNA)、无细胞RNA(cfRNA)或其组合。在一些实施例中，该目的序列包含目的调节元件。在一些实施例中，将该目的序列插入宿主细胞的靶多核苷酸中，使得该目的序列上的调节元件能够调节该宿主细胞的天然基因。本文描述了调节元件，并且包括例如启动子、增强子、沉默子、操作子、应答元件、5′UTR、3′UTR、绝缘子等。

在一些实施例中，该DNA模板序列的长度为约5个核苷酸至约5000个核苷酸。在一些实施例中，该DNA模板序列的长度为约6个核苷酸至约1000个核苷酸。在一些实施例中，该DNA模板序列的长度为约7个核苷酸至约750个核苷酸。在一些实施例中，该DNA模板序列的长度为约8个核苷酸至约500个核苷酸。在一些实施例中，该DNA模板序列的长度为约9个核苷酸至约250个核苷酸。在一些实施例中，该DNA模板序列的长度为约10个核苷酸至约100个核苷酸。在一些实施例中，该DNA模板序列的长度为约15个核苷酸至约90个核苷酸。在一些实施例中，该DNA模板序列的长度为约20个核苷酸至约80个核苷酸。在一些实施例中，该DNA模板序列的长度为约25个核苷酸至约70个核苷酸。在一些实施例中，该DNA模板序列的长度为约30个核苷酸至约50个核苷酸。在一些实施例中，该DNA模板序列的长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施例中，该DNA模板序列的长度大于约10个核苷酸、大于约15个核苷酸、大于约20个核苷酸、大于约25个核苷酸、大于约30个核苷酸、大于约35个核苷酸、大于约40个核苷酸、大于约45个核苷酸或大于约50个核苷酸。

在一些实施例中，该引物结合序列的长度为约3至约50个核苷酸。在一些实施例中，该引物结合序列的长度为约4至约45个核苷酸。在一些实施例中，该引物结合序列的长度为约5至约40个核苷酸。在一些实施例中，该引物结合序列的长度为约6至约35个核苷酸。在一些实施例中，该引物结合序列的长度为约7至约30个核苷酸。在一些实施例中，该引物结合序列的长度为约8至约25个核苷酸。在一些实施例中，该引物结合序列的长度为约10至约20个核苷酸。在一些实施例中，该引物结合序列的长度为约4至约30个核苷酸。在一些实施例中，该引物结合序列的长度为约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸。在一些实施例中，该引物结合序列的长度足以与经切割的靶DNA序列的区域杂交。

在一些实施例中，该目的序列的长度为约3至约500个核苷酸。在一些实施例中，该目的序列的长度为约4至约100个核苷酸。在一些实施例中，该目的序列的长度为约5至约90个核苷酸。在一些实施例中，该目的序列的长度为约6至约80个核苷酸。在一些实施例中，该目的序列的长度为约7至约70个核苷酸。在一些实施例中，该目的序列的长度为约8至约60个核苷酸。在一些实施例中，该目的序列的长度为约9至约50个核苷酸。在一些实施例中，该目的序列的长度为约10至约40个核苷酸。在一些实施例中，该目的序列的长度为约11至约30个核苷酸。在一些实施例中，该目的序列的长度为约12至约20个核苷酸。在一些实施例中，该目的序列的长度为约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸。在一些实施例中，该目的序列的长度大于约10个核苷酸、大于约15个核苷酸、大于约20个核苷酸、大于约25个核苷酸、大于约30个核苷酸、大于约35个核苷酸、大于约40个核苷酸、大于约45个核苷酸或大于约50个核苷酸。

在一些实施例中，该DNA模板序列包含经修饰的核苷酸。在一些实施例中，该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。

在一些实施例中，该经修饰的核苷酸减少或防止该DNA聚合酶对该目的序列的过度延伸。在一些实施例中，减少或防止该DNA聚合酶对该目的序列的过度延伸提高了插入包含该目的序列的双链序列的精度。在一些实施例中，该经修饰的核苷酸包含无碱基位点，也称为无嘌呤/无嘧啶位点(AP位点)。在一些实施例中，该经修饰的核苷酸包含共价接头。在一些实施例中，该共价接头包含三乙二醇(TEG)接头。在一些实施例中，该共价接头包含氨基接头。已表明TEG接头和氨基接头可阻断聚合酶延伸；参见例如，Strobel等人，bioRxivdoi：10.1101/2019.12.26.888743(2020年1月23日)。

在一些实施例中，该经修饰的核苷酸减少或防止本披露的多核苷酸的核酸酶降解。在一些实施例中，该经修饰的核苷酸包含异种核酸(XNA)。XNA是一种合成核苷酸类似物，其糖基团与DNA的脱氧核糖或RNA的核糖不同。XNA的示例性糖基团包括但不限于苏糖、环己烯、乙二醇或锁核糖。在一些实施例中，该XNA包含1，5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁核酸(LNA)和肽核酸(PNA)。在一些实施例中，该经修饰的核苷酸包含锁核酸(LNA)，也称为桥接核酸(BNA)。LNA是一种经修饰的RNA核苷酸，其中核糖部分用连接2′氧和4′碳的额外桥进行修饰。在一些实施例中，该经修饰的核苷酸包含肽核酸(PNA)。与DNA或RNA的脱氧核糖或核糖骨架不同，PNA聚合物的骨架包含通过肽键连接的N-(2-氨基乙基)-甘氨酸单元，并且嘌呤和嘧啶碱基通过亚甲基桥和羰基与PNA骨架连接。在一些实施例中，该经修饰的核苷酸包含硫代磷酸酯键。硫代磷酸酯键包含硫原子，代替连接两个核苷酸的磷酸基团中的氧之一。在一些实施例中，多核苷酸中XNA(例如，LNA或PNA)或硫代磷酸酯键的存在提高了该多核苷酸抵抗核酸酶降解的稳定性。

在一些实施例中，多核苷酸(例如，本文提供的组合物的多核苷酸)中经修饰的核苷酸的存在能够将DNA聚合酶募集至该多核苷酸。在一些实施例中，募集DNA聚合酶包括：增加DNA聚合酶识别该多核苷酸的可能性，例如由于其中存在该经修饰的核苷酸；促进DNA聚合酶与该多核苷酸的结合；和/或激活DNA聚合酶，例如起始或增加该DNA聚合酶的活性。在一些实施例中，经募集的DNA聚合酶与经切割的靶多核苷酸的链结合并使该DNA模板序列上的目的序列延伸，如本文所述。

在一些实施例中，该经修饰的核苷酸包含DNA损伤。如本文所用，“DNA损伤”是指DNA多核苷酸中含有典型地指示DNA损害的碱基改变、碱基缺失和/或糖改变的区域。DNA损伤可能由核碱基的水解、氧化、烷基化、脱嘌呤、脱嘧啶和/或脱氨基引起。在一些实施例中，该DNA损伤能够募集DNA聚合酶。在一些实施例中，该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶＝乙二醇、N7＝(2＝羟乙基)鸟嘌呤(7HEG)、7-(2-氧代乙基)鸟嘌呤或其组合。在一些实施例中，该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶-乙二醇或其组合。

在一些实施例中，该经修饰的核苷酸包含DNA光产物。DNA光产物是紫外线(UV)诱导的DNA损伤，并且进一步描述于例如以下文献中：Yokoyama等人，Int J Mol Sci[国际分子科学杂志]15(11)：20321-20338(2014)。在一些实施例中，该DNA光产物能够募集DNA聚合酶。在一些实施例中，该DNA光产物包含嘧啶二聚体、环丁烷嘧啶二聚体(CPD)、嘧啶(6-4)嘧啶酮光产物(也称为“(6-4)光产物”)、腺嘌呤-胸腺嘧啶异二聚体、杜瓦嘧啶酮(Dewarpyrimidinone)或其组合。在一些实施例中，该DNA光产物包含CPD、(6-4)光产物或其组合。

在一些实施例中，该经修饰的核苷酸包含经修饰的脱氧核糖核苷。在一些实施例中，该经修饰的脱氧核糖核苷能够募集DNA聚合酶。在一些实施例中，该经修饰的脱氧核糖核苷包含典型地并不存在于DNA中的碱基，即腺嘌呤、胞嘧啶、鸟嘌呤或胸腺嘧啶。在一些实施例中，该经修饰的脱氧核糖核苷包含脱氧尿苷、丙烯醛-脱氧鸟嘌呤、丙二醛-脱氧鸟嘌呤、脱氧肌苷、脱氧黄苷或其组合。在一些实施例中，该经修饰的脱氧核糖核苷包含脱氧尿苷。

在一些实施例中，该经修饰的核苷酸包含经甲基化的核苷酸。在一些实施例中，经甲基化的核苷酸(例如，经甲基化的胞嘧啶)能够募集DNA聚合酶。在一些实施例中，该经甲基化的核苷酸包含5-羟甲基胞嘧啶、5-甲基胞嘧啶或其组合。

在一些实施例中，该DNA模板序列包含非B DNA结构。如本文所用，“非B DNA结构”是并非典型的右手B-DNA螺旋的DNA二级结构构象。非B DNA结构的非限制性示例包括G-四联体、三链体DNA(H-DNA)、Z-DNA、十字形、滑移DNA链、A束弯曲结构(A-tract bending)、粘性DNA。非B DNA结构进一步描述于例如以下文献中：Guiblet等人，Nucleic AcidsRes[核酸研究]49(3)：1497-1516(2021)。在一些实施例中，该非B DNA结构能够募集DNA聚合酶。在一些实施例中，该非B DNA结构包含发夹、十字形、Z-DNA、H-DNA(三链体DNA)、G-四联体DNA(四链体DNA)、滑移DNA、粘性DNA或其组合。

在一些实施例中，该DNA模板序列包含DNA聚合酶募集部分。本文描述了DNA聚合酶募集。可以被该DNA聚合酶募集部分募集的DNA聚合酶的非限制性示例包括细菌DNA聚合酶，诸如Pol I(包括其克列诺片段)、Pol II、Pol III、Pol IV或Pol V；真核DNA聚合酶，诸如Polα、Polβ、Polλ、Polγ、Polσ、Polμ、Polδ、Polε、Polη、Polι、Polκ、Polζ、Polθ、REV1或REV3；等温DNA聚合酶，诸如Bst、T4或Φ29(phi29)DNA聚合酶；热稳定DNA聚合酶，诸如Taq、Pfu、KOD、Tth或Pwo DNA聚合酶；或其变体或同源物。

在一些实施例中，该DNA聚合酶募集部分包含经修饰的核苷酸，例如本文所述的DNA损伤、DNA光产物、经修饰的脱氧核糖核苷和/或经甲基化的核苷酸。在一些实施例中，该经修饰的核苷酸募集跨损伤DNA合成(TLS)聚合酶。TLS聚合酶能够使包含本文所述的经修饰的核苷酸的DNA延伸。示例性TLS聚合酶包括但不限于来自大肠杆菌(E.coli)的Pol II、Pol IV和Pol V；来自酿酒酵母(S.cerevisiae)的Rev1p、Rev3p和Polη；以及人REV1、REV3、Polη、Polι和Polκ。其他TLS聚合酶描述于例如以下文献中：Goodman等人，Cold SpringHarb Perspect Biol[冷泉港生物学展望]5(10)：a010363(2013)和Waters等人，MicrobiolMol Biol Rev[微生物学与分子生物学综述]73(1)：134-154(2009)。在一些实施例中，该DNA聚合酶募集部分包含本文所述的非B DNA结构。在一些实施例中，被该非B DNA结构募集的DNA聚合酶能够通过该非B DNA结构使DNA延伸。在一些实施例中，该非B DNA结构募集选自PrimPol、REV1、REV3、Polδ、Polη、Polι、Polκ和Polθ的DNA聚合酶。

在一些实施例中，该DNA聚合酶募集部分包含DNA聚合酶募集蛋白。在一些实施例中，该DNA聚合酶募集蛋白能够识别并结合DNA聚合酶。在一些实施例中，该DNA聚合酶募集蛋白与该DNA模板序列连接。在一些实施例中，该DNA聚合酶募集蛋白与该引物结合序列交联。将蛋白质与多核苷酸连接的方法是本领域普通技术人员已知的，并且包括例如共价缀合方法，诸如铜催化的环加成、环张力促进的叠氮-炔环加成和反电子需求狄尔斯-阿尔德反应(例如，环丙烯与四嗪之间的反应)；或基于亲和力的方法，例如将包含生物素部分的多核苷酸与包含抗生物素蛋白或链霉亲和素部分的蛋白质连接。

在一些实施例中，该DNA模板序列包含DNA连接酶募集部分。在一些实施例中，多核苷酸(例如，本文提供的组合物的多核苷酸)中DNA连接酶募集部分的存在能够将DNA连接酶募集至该多核苷酸。在一些实施例中，募集DNA连接酶包括：增加DNA连接酶识别该多核苷酸的可能性，例如由于其中存在该DNA连接酶募集部分；促进DNA连接酶与该多核苷酸的结合；和/或激活DNA连接酶，例如起始或增加该DNA连接酶的活性。在一些实施例中，经募集的DNA连接酶与包含由DNA聚合酶产生的目的序列的双链序列结合，并且将该双链序列连接至经切割的靶多核苷酸中，如本文所述。

在一些实施例中，该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。在一些实施例中，该DNA连接酶募集部分包含DNA连接酶募集蛋白。示例性DNA连接酶募集蛋白包括但不限于DNA依赖性蛋白激酶(DNA-PK)、增殖细胞核抗原(PCNA)或X射线修复交叉互补蛋白1(XRCCl)。可以被该DNA连接酶部分募集的DNA连接酶的非限制性示例包括细菌DNA连接酶(诸如大肠杆菌DNA连接酶)、T4 DNA连接酶、T7 DNA连接酶、哺乳动物DNA连接酶(诸如DNA连接酶I、DNA连接酶II、DNA连接酶III或DNA连接酶IV)、热稳定DNA连接酶(诸如Taq DNA连接酶)或其变体或同源物。

在一些实施例中，本文所述的指导序列、Cas结合区和DNA模板序列存在于该组合物中的单一多核苷酸上。在一些实施例中，该DNA模板序列位于该指导序列和该Cas结合区的3′。在一些实施例中，该DNA模板序列在该多核苷酸的3′端。在一些实施例中，位于该多核苷酸的3′端的DNA模板序列促进DNA聚合酶对经切割的靶多核苷酸的结合和/或延伸，以形成包含该目的序列的双链序列，如本文所述。在一些实施例中，位于该多核苷酸的3′端的DNA模板序列促进通过DNA连接酶将该双链序列连接至经切割的靶多核苷酸中，如本文所述。

在一些实施例中，本文所述的指导序列、Cas结合区和DNA模板序列存在于该组合物中的多于一种多核苷酸上。在一些实施例中，该指导序列和Cas结合区在第一多核苷酸上，并且该DNA模板序列在第二多核苷酸上。在一些实施例中，该指导序列在第一多核苷酸上，并且该Cas结合区和该DNA模板序列在第二多核苷酸上。在一些实施例中，该第一多核苷酸包含第一杂交区。在一些实施例中，该第二多核苷酸包含与该第一杂交区互补的第二杂交区。在一些实施例中，该第一杂交区和该第二杂交区能够杂交。在一些实施例中，该第一杂交区和该第二杂交区包含RNA。在一些实施例中，该第一杂交区和该第二杂交区包含单链DNA。在一些实施例中，该第一杂交区包含RNA，并且该第二杂交区包含单链DNA。在一些实施例中，该第一杂交区包含单链DNA，并且该第二杂交区包含RNA。在一些实施例中，该RNA和单链DNA能够杂交。

在一些实施例中，该第一杂交区在该第一多核苷酸的3′端。在一些实施例中，该第二杂交区在该第二多核苷酸的5′端。在一些实施例中，在该第一杂交区与该第二杂交区杂交后，该DNA模板序列位于该指导序列和该Cas结合区两者的3′。在一些实施例中，该DNA模板序列在该第二多核苷酸的3′端。在一些实施例中，位于该第二多核苷酸的3′端的DNA模板序列促进DNA聚合酶对经切割的靶多核苷酸的结合和/或延伸，以形成包含该目的序列的双链序列，如本文所述。在一些实施例中，位于该第二多核苷酸的3′端的DNA模板序列促进通过DNA连接酶将该双链序列连接至经切割的靶多核苷酸中，如本文所述。

在一些实施例中，该指导序列、该Cas结合区、该目的序列(SOI)和该引物结合序列存在于多于一种多核苷酸上，如本文所述。在一些实施例中，该指导序列、该Cas结合区和该引物结合序列在第一多核苷酸上；该SOI在第二多核苷酸上；并且该第一和第二多核苷酸分别包含能够彼此杂交的第一和第二杂交区。在一些实施例中，该引物结合序列位于该第一多核苷酸的3′端。在一些实施例中，位于该第一多核苷酸的3′端的引物结合序列促进通过DNA连接酶将该SOI结合和/或连接至经切割的靶多核苷酸中，如本文所述。在一些实施例中，位于该第一多核苷酸的3′端的引物结合序列促进DNA聚合酶对经切割的靶多核苷酸的结合和/或延伸，以形成包含该SOI的双链序列，如本文所述。

在一些实施例中，该第一杂交区的长度为约3至约10000个核苷酸。在一些实施例中，该第一杂交区的长度为约4至约5000个核苷酸。在一些实施例中，该第一杂交区的长度为约5至约1000个核苷酸。在一些实施例中，该第一杂交区的长度为约10至约800个核苷酸。在一些实施例中，该第一杂交区的长度为约20至约600个核苷酸。在一些实施例中，该第一杂交区的长度为约30至约500个核苷酸。在一些实施例中，该第一杂交区的长度为约40至约400个核苷酸。在一些实施例中，该第一杂交区的长度为约50至约300个核苷酸。在一些实施例中，该第一杂交区的长度为约100至约200个核苷酸。在一些实施例中，该第一杂交区的长度为约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500或5000个核苷酸。

在一些实施例中，该第二杂交区的长度为约3至约10000个核苷酸。在一些实施例中，该第二杂交区的长度为约4至约5000个核苷酸。在一些实施例中，该第二杂交区的长度为约5至约1000个核苷酸。在一些实施例中，该第二杂交区的长度为约10至约800个核苷酸。在一些实施例中，该第二杂交区的长度为约20至约600个核苷酸。在一些实施例中，该第二杂交区的长度为约30至约500个核苷酸。在一些实施例中，该第二杂交区的长度为约40至约400个核苷酸。在一些实施例中，该第二杂交区的长度为约50至约300个核苷酸。在一些实施例中，该第二杂交区的长度为约100至约200个核苷酸。在一些实施例中，该第二杂交区的长度为约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500或5000个核苷酸。

在一些实施例中，该第一和第二杂交区的长度基本上相同。在一些实施例中，该第一和第二杂交区的长度相差小于约1、小于约2、小于约3、小于约4、小于约5、小于约6、小于约7、小于约8、小于约9、小于约10、小于约15、小于约20、小于约25、小于约30、小于约35、小于约40、小于约45、小于约50、小于约55、小于约60、小于约65、小于约70、小于约75、小于约80、小于约85、小于约90、小于约95或小于约100个核苷酸。在一些实施例中，该第一和第二杂交区的长度相差该第一或第二杂交区中核苷酸数目的小于约30％、小于约25％、小于约20％、小于约15％、小于约10％、小于约5％、小于约2％或小于约1％。在一些实施例中，该第一和第二杂交区的长度相同。在一些实施例中，该第一和第二杂交区完全互补。在一些实施例中，该第一和第二杂交区至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％互补。在一些实施例中，该第一和第二杂交区能够在标准核酸杂交条件下杂交，例如如以下文献中所述：Herzer和Englert，“Chapter14.Nucleic Acid Hybridization[第14章.核酸杂交]，”Molecular Biology ProblemSolver：A Laboratory Guide[分子生物学问题解难：实验室指南]，(2001)编辑AlanS.Gersterin；Wiley-Liss，Inc[威利·利斯出版公司]。

在一些实施例中，该指导序列在第一多核苷酸上，该Cas结合区在第二多核苷酸上，并且该DNA模板序列在第三多核苷酸上。在一些实施例中，该第一多核苷酸在3′端包含第一杂交区；该第二多核苷酸包含(i)在5′端的与该第一杂交区互补的第二杂交区和(ii)在3′端的与第四杂交区互补的第三杂交区；并且该第三多核苷酸在5′端包含该第四杂交区。在一些实施例中，该第二多核苷酸在3′端包含第一杂交区；该第一多核苷酸包含(i)在5′端的与该第一杂交区互补的第二杂交区和(ii)在3′端的与第四杂交区互补的第三杂交区；并且该第三多核苷酸在5′端包含该第四杂交区。在一些实施例中，在该第一、第二、第三和第四杂交区杂交后，该DNA模板序列位于该指导序列和该Cas结合区两者的3′。在一些实施例中，该第一、第二、第三和第四杂交区中的每一个的长度为约3至约10000个核苷酸，或长度为约4至约5000个核苷酸，或长度为约5至约1000个核苷酸，或长度为约10至约800个核苷酸，或长度为约20至约600个核苷酸，或长度为约30至约500个核苷酸，或长度为约40至约400个核苷酸，或长度为约50至约300个核苷酸，或长度为约100至约200个核苷酸。在一些实施例中，该第一和第二杂交区的长度基本上相同，并且该第三和第四杂交区的长度基本上相同。在一些实施例中，该第一和第二杂交区至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或100％互补。在一些实施例中，该第三和第四杂交区至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或100％互补。

在一些实施例中，该指导序列、该Cas结合区、该SOI和该引物结合序列存在于第一、第二和第三多核苷酸上，如本文所述。在一些实施例中，该指导序列和该Cas结合区存在于该第一多核苷酸上；该引物结合序列在该第二多核苷酸上；并且该SOI在该第三多核苷酸上；并且其中该第一和第二多核苷酸分别包含能够彼此杂交的第一和第二杂交区，并且该第二和第三多核苷酸分别包含能够彼此杂交的第三和第四杂交区。在一些实施例中，该引物结合序列位于该第二多核苷酸的3′端。在一些实施例中，位于该第二多核苷酸的3′端的引物结合序列促进通过DNA连接酶将该SOI结合和/或连接至经切割的靶多核苷酸中，如本文所述。在一些实施例中，位于该第一多核苷酸的3′端的引物结合序列促进DNA聚合酶对经切割的靶多核苷酸的结合和/或延伸，以形成包含该SOI的双链序列，如本文所述。在一些实施例中，该第一、第二、第三和第四杂交区中的每一个的长度为约3至约10000个核苷酸，或长度为约4至约5000个核苷酸，或长度为约5至约1000个核苷酸，或长度为约10至约800个核苷酸，或长度为约20至约600个核苷酸，或长度为约30至约500个核苷酸，或长度为约40至约400个核苷酸，或长度为约50至约300个核苷酸，或长度为约100至约200个核苷酸。在一些实施例中，该第一和第二杂交区的长度基本上相同，并且该第三和第四杂交区的长度基本上相同。在一些实施例中，该第一和第二杂交区至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或100％互补。在一些实施例中，该第三和第四杂交区至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或100％互补。

在一些实施例中，本披露的多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。在一些实施例中，该多核苷酸包含该指导序列、该Cas结合区和该DNA模板序列，并且该间隔子位于该Cas结合区与该DNA模板序列之间。在一些实施例中，本披露的第二多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。在一些实施例中，该第二多核苷酸包含该第二杂交区、该Cas结合区和该DNA模板序列，并且该间隔子位于该Cas结合区与该DNA模板序列之间。在一些实施例中，该第二多核苷酸包含该第二杂交区和该DNA模板序列，并且该间隔子位于该第二杂交区与该DNA模板序列之间。

在一些实施例中，该间隔子包含该DNA聚合酶的终止序列，使得该DNA聚合酶在合成该目的序列的互补链后终止。在一些实施例中，该间隔子包含多于一个终止序列。在一些实施例中，该间隔子包含1、2、3、4、5个或多于5个终止序列。在一些实施例中，多个终止序列提供了终止该DNA聚合酶的冗余。在一些实施例中，该终止序列抑制该DNA聚合酶的活性。在一些实施例中，该终止序列促进该DNA聚合酶从该DNA模板序列解离。

在一些实施例中，该终止序列包含二级结构。在一些实施例中，该二级结构是DNA聚合酶活性的抑制剂。在一些实施例中，该二级结构促进该DNA聚合酶从该DNA模板序列解离。在一些实施例中，该二级结构是发夹环(也称为茎环)。在一些实施例中，该二级结构是假结。

在一些实施例中，该间隔子的长度为约5至约500个核苷酸。在一些实施例中，该间隔子的长度为约10至约400个核苷酸。在一些实施例中，该间隔子的长度为约10至约300个核苷酸。在一些实施例中，该间隔子的长度为约10至约200个核苷酸。在一些实施例中，该间隔子的长度为约20至约150个核苷酸。在一些实施例中，该间隔子的长度为约30至约100个核苷酸。在一些实施例中，该间隔子的长度为约50至约100个核苷酸。在一些实施例中，该间隔子的长度为约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约75、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190或约200个核苷酸。

本文的披露设想，如本文所述的多核苷酸的元件和特征可以以任何组合进行组合。仅出于示例性目的，该多核苷酸可以包括如表1所示的特征(从5′至3′)：

表1.

/>

在一些实施例中，任何Cas核酸酶结合区都与Cas9或Cas12a核酸酶结合。在一些实施例中，任何Cas切口酶结合区都与Cas9切口酶或Cas12a切口酶结合。在一些实施例中，该多核苷酸包含在上文所述的指导序列(例如，RNA指导序列或RNA/DNA指导序列)、Cas结合区(例如，Cas核酸酶结合区或Cas切口酶结合区)和DNA模板序列中的任一个之间的间隔子。

本文的披露设想，本文所述的组合物可以包含多于一种多核苷酸，例如两种多核苷酸。仅出于示例性目的，这些组合物可以包含两种多核苷酸，其可以包括如表或表3所示的特征(从5′至3′)：

表2.

/>

表3.

/>

在一些实施例中，上文所述的任何第二多核苷酸的DNA模板序列都包含引物结合序列和目的序列。在一些实施例中，上文所述的任何第二多核苷酸的DNA模板序列都包含引物结合序列、目的序列以及经修饰的核苷酸、DNA聚合酶募集部分、DNA连接酶募集部分中的一个或多个。

在一些实施例中，任何Cas核酸酶结合区都与Cas9或Cas12a核酸酶结合。在一些实施例中，任何Cas切口酶结合区都与Cas9切口酶或Cas12a切口酶结合。在一些实施例中，该第一和/或第二多核苷酸包含在上文所述的指导序列(例如，RNA指导序列或RNA/DNA指导序列)、Cas结合区(例如，Cas核酸酶结合区或Cas切口酶结合区)和DNA模板序列中的任一个之间的间隔子。

融合蛋白

在一些实施例中，本披露的组合物包含Cas核酸酶或Cas切口酶，其中该Cas核酸酶或Cas切口酶与DNA聚合酶募集蛋白融合。在一些实施例中，本披露提供了融合蛋白，该融合蛋白包含(i)Cas核酸酶或Cas切口酶；和(ii)DNA聚合酶募集蛋白。在一些实施例中，本披露提供了融合蛋白，该融合蛋白包含(i)Cas核酸酶或Cas切口酶；和(ii)DNA聚合酶募集蛋白、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合。

如本文所讨论，融合蛋白典型地包括至少两个具有不同功能的结构域。在一些实施例中，该融合蛋白包含Cas核酸酶。本文描述了Cas核酸酶。在一些实施例中，该Cas核酸酶是Cas9核酸酶。在一些实施例中，该Cas核酸酶是Cas12a核酸酶。在一些实施例中，该Cas核酸酶是II-B型Cas核酸酶。在一些实施例中，该融合蛋白包含Cas切口酶。本文进一步描述了Cas切口酶。在一些实施例中，该Cas切口酶是Cas9切口酶。在一些实施例中，该Cas切口酶是Cas12a切口酶。在一些实施例中，该Cas切口酶是II-B型Cas切口酶。

在一些实施例中，融合蛋白包含DNA聚合酶募集蛋白。本文进一步描述了DNA聚合酶募集蛋白。在一些实施例中，该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

在一些实施例中，该DNA聚合酶募集蛋白能够募集DNA聚合酶，其中该DNA聚合酶包含Pol I或其克列诺片段、Pol II、Pol III、Pol IV、Pol V、Polα、Polβ、Polλ、Polγ、Polσ、Polμ、Polδ、Polε、Polη、Polι、Polκ、Polζ、Polθ、REV1、REV3、Bst DNA聚合酶、T4 DNA聚合酶、Φ29(phi29)DNA聚合酶、Taq DNA聚合酶、Pfu DNA聚合酶、KOD DNA聚合酶、Tth DNA聚合酶、Pwo DNA聚合酶、或其变体或同源物。

在一些实施例中，该DNA连接酶包含T4 DNA连接酶、绿草履虫小球藻病毒1(Paramecium bursaria Chlorella virus 1，PCBV-1)DNA连接酶、分枝杆菌属(Mycobacterium)连接酶D(LigD)、人连接酶1(Ligl)、人连接酶3(Lig3α)、人连接酶4(Lig4)或其组合。在一些实施例中，该DNA连接酶募集部分包含5′-腺嘌呤基焦磷酰基帽。

在一些实施例中，该DNA结合蛋白包含复制蛋白A(RPA)或其亚基，包括RPA1、RPA2和RPA3；单链DNA结合蛋白(SSBP)，包括SSBP1、SSBP2、SSBP3和SSBP4；或其组合。在一些实施例中，该DNA修复蛋白包含酪氨酰基-DNA磷酸二酯酶1(TDP1)、aprataxin、拓扑异构酶I或其组合。

在一些实施例中，向该融合蛋白提供包含如本文所述的指导序列、Cas结合区和DNA模板序列的一种或多种多核苷酸。在一些实施例中，该融合蛋白的Cas核酸酶或Cas切口酶能够与靶多核苷酸结合并切割靶多核苷酸。在一些实施例中，该融合蛋白的DNA聚合酶募集部分将DNA聚合酶募集至经切割的靶多核苷酸。在一些实施例中，将募集的DNA聚合酶合成与该DNA模板序列上的目的序列互补的DNA链，从而产生包含可以插入切割靶多核苷酸中的目的序列的双链序列。

在一些实施例中，该融合蛋白通过募集DNA聚合酶、DNA连接酶和/或DNA修复蛋白来提高将该双链序列插入经切割的靶多核苷酸中的效率，从而提高产生该双链序列的效率。在一些实施例中，与未与DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合的Cas核酸酶或Cas切口酶相比，包含该DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合的融合蛋白的插入效率更高，如本文所述。

在一些实施例中，该融合蛋白进一步包含核定位信号(NLS)。如本文所用，“核定位信号”或“核定位序列”(NLS)是指对蛋白质“加标签”以通过核转运输入到细胞核中的多肽，即具有NLS的蛋白质被转运到细胞核中。典型地，该NLS包括暴露在蛋白质表面的带正电的Lys或Arg残基。示例性NLS包括但不限于来自以下的NLS：SV40大T抗原、核质蛋白、EGL-13、c-Myc和TUS蛋白。

在一些实施例中，该融合蛋白进一步包含连接该Cas核酸酶或Cas切口酶和该DNA聚合酶募集蛋白的接头。在一些实施例中，该接头具有足够的长度和/或柔性，使得可以定位该Cas核酸酶或Cas切口酶而不受来自该DNA聚合酶募集蛋白的空间位阻。在一些实施例中，该接头的长度包含约3至约100个氨基酸。在一些实施例中，该接头的长度包含约5至约80个氨基酸。在一些实施例中，该接头的长度包含约10至约60个氨基酸。在一些实施例中，该接头的长度包含约20至约50个氨基酸。在一些实施例中，该接头的长度包含约25至约40个氨基酸。

在一些实施例中，本披露提供了多核苷酸，该多核苷酸编码本文所述的融合蛋白。在一些实施例中，该多核苷酸是用于在细菌细胞中表达的经密码子优化的多核苷酸。在一些实施例中，该多核苷酸是用于在真核细胞中表达的经密码子优化的多核苷酸。在一些实施例中，该多核苷酸是用于在哺乳动物细胞中表达的经密码子优化的多核苷酸。在一些实施例中，该多核苷酸是用于在人细胞中表达的经密码子优化的多核苷酸。如本文所用，“密码子优化”是指调节密码子以匹配表达宿主的tRNA丰度，以便提高重组或异源蛋白表达的产率和效率。密码子优化方法是本领域已知的，并且可以使用软件程序来执行，这些软件程序例如像来自集成DNA技术公司(Integrated DNA Technologies)的密码子优化工具、来自Entelechon公司的密码子使用表分析工具等。

在一些实施例中，本披露提供了载体，该载体包含编码本文所述的融合蛋白的多核苷酸。本文提供了各种类型的载体，例如病毒和非病毒载体。在一些实施例中，该载体是表达载体。在一些实施例中，该载体是细菌表达载体。在一些实施例中，该载体是哺乳动物表达载体。在一些实施例中，该载体是人表达载体。在一些实施例中，该载体是植物表达载体。

在一些实施例中，该载体是病毒载体。在一些实施例中，该病毒载体是逆转录病毒、腺相关病毒、痘病毒、杆状病毒、牛痘病毒、单纯疱疹病毒、EB病毒、腺病毒、双生病毒或花椰菜花叶病毒载体。在一些实施例中，该病毒载体是腺病毒、慢病毒或腺相关病毒载体。用腺病毒、腺相关病毒(AAV)和慢病毒载体进行的病毒转导(其中施用可以是局部的、靶向的或全身的)已经被用作体内基因疗法的递送方法。本文描述了将载体(例如，病毒载体)引入细胞中的方法(例如，转染)。

在一些实施例中，该载体进一步包含与编码该融合蛋白的多核苷酸可操作地连接的调节元件。在一些实施例中，该调节元件包含启动子、增强子、终止子、5′UTR、3′UTR或其组合。本文进一步描述了调节元件。在一些实施例中，该调节元件包含启动子。在一些实施例中，该启动子是细菌启动子。在一些实施例中，该启动子是病毒启动子。在一些实施例中，该启动子是哺乳动物启动子。

在一些实施例中，本披露提供了试剂盒，该试剂盒包含本文所述的融合蛋白。在一些实施例中，该试剂盒中的融合蛋白作为编码该融合蛋白的多核苷酸提供。在一些实施例中，编码该融合蛋白的多核苷酸提供在载体(例如，本文所述的载体)上。

在一些实施例中，该试剂盒进一步包含多核苷酸，其中该多核苷酸包含Cas结合区。在一些实施例中，该Cas结合区能够与该融合蛋白的Cas核酸酶或Cas切口酶结合。在一些实施例中，该Cas结合区包含tracrRNA。在一些实施例中，该Cas结合区能够与tracrRNA杂交。在一些实施例中，该试剂盒进一步包含tracrRNA。本文进一步描述了包含Cas结合区的多核苷酸。

在一些实施例中，该试剂盒进一步包含DNA聚合酶。在一些实施例中，该DNA聚合酶包含phi29 DNA聚合酶、DNA聚合酶μ、DNA聚合酶δ或DNA聚合酶ε。在一些实施例中，该试剂盒进一步包含DNA连接酶。在一些实施例中，该DNA连接酶包含T4 DNA连接酶、PCBV-1DNA连接酶、LigD、人Lig1、人Lig3α或人Lig4。

在一些实施例中，该试剂盒进一步包含用于该融合蛋白、该DNA聚合酶和/或该DNA连接酶的反应缓冲液和/或储存缓冲液。在一些实施例中，该试剂盒进一步包含用于进行DNA切割反应、DNA聚合酶反应和/或DNA连接酶反应的试剂。在一些实施例中，该试剂包含ATP、dNTP、MgCl₂、寡聚(dT)和/或RNA酶抑制剂。在一些实施例中，该试剂盒包含一种或多种对照，例如对照靶DNA。例如，可以将该对照靶DNA设计为被该融合蛋白的Cas核酸酶或Cas切口酶以一定量的效率特异性切割，从而校准该Cas核酸酶或Cas切口酶的活性。

细胞

在一些实施例中，本披露提供了细胞，该细胞包含本文所述的融合蛋白。在一些实施例中，本披露提供了细胞，该细胞包含编码本文所述的融合蛋白的多核苷酸。在一些实施例中，本披露提供了细胞，该细胞包含含有编码本文所述的融合蛋白的多核苷酸的载体。在一些实施例中，该细胞进一步包含本文所述的多核苷酸，其中该多核苷酸包含指导序列(例如，RNA指导序列)、Cas结合蛋白和DNA模板序列。

在一些实施例中，本披露提供了细胞，该细胞包含本文所述的多核苷酸，其中该多核苷酸包含RNA指导序列、Cas结合区和DNA模板序列。在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含：Cas核酸酶或Cas切口酶；以及包含指导序列、Cas结合区和DNA模板序列的一种或多种多核苷酸。在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含(a)Cas核酸酶或Cas切口酶以及(b)含有指导序列、Cas结合区和DNA模板序列的多核苷酸，其中该DNA模板序列在该多核苷酸的3′端。在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。本文进一步描述了该多核苷酸和该组合物的组分。在一些实施例中，该Cas核酸酶或Cas切口酶与DNA聚合酶募集蛋白融合。本文进一步描述了包含Cas核酸酶或Cas切口酶和DNA聚合酶募集蛋白的融合蛋白。

在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)。在一些实施例中，本披露提供了细胞，该细胞包含本文所述的组合物，其中该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及(d)第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；和(ii)目的序列(SOI)。本文进一步描述了这些组合物的组分。在一些实施例中，该Cas核酸酶或Cas切口酶与DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合。本文进一步描述了融合蛋白。

在一些实施例中，该细胞包含内源DNA聚合酶、内源DNA连接酶或两者。在一些实施例中，该细胞不包含外源DNA聚合酶。在一些实施例中，该细胞不包含外源DNA连接酶。

在一些实施例中，该细胞进一步包含外源DNA聚合酶、外源DNA连接酶或两者。在一些实施例中，该外源DNA聚合酶与该细胞同源。在一些实施例中，该外源DNA聚合酶与该细胞异源。在一些实施例中，该外源DNA聚合酶来源于与该细胞不同的生物体。例如，该细胞可以是大肠杆菌细胞，并且该DNA聚合酶可以是T4 DNA聚合酶。在一些实施例中，该外源DNA聚合酶包含Pol I或其克列诺片段、PolII、Pol III、Pol IV、Pol V、Polα、Polβ、Polλ、Polγ、Polσ、Polμ、Polδ、Polε、Polη、Polι、Polκ、Polζ、Polθ、REV1、REV3、Bst DNA聚合酶、T4 DNA聚合酶、Φ29(phi29)DNA聚合酶、Taq DNA聚合酶、Pfu DNA聚合酶、KOD DNA聚合酶、Tth DNA聚合酶、Pwo DNA聚合酶、或其变体或同源物。在一些实施例中，该外源DNA连接酶与该细胞同源。在一些实施例中，该外源DNA连接酶与该细胞异源。在一些实施例中，该外源DNA连接酶来源于与该细胞不同的生物体。在一些实施例中，该外源DNA连接酶包含大肠杆菌DNA连接酶、T4DNA连接酶、T7 DNA连接酶、DNA连接酶I、DNA连接酶II、DNA连接酶III、DNA连接酶IV、TaqDNA连接酶或其变体或同源物。例如，该细胞可以是大肠杆菌细胞，并且该DNA连接酶可以是T4连接酶。

在一些实施例中，该细胞是细菌细胞。在一些实施例中，该细菌细胞是实验室菌株。此类细菌细胞的示例包括但不限于大肠杆菌、金黄色葡萄球菌(S.aureus)、霍乱弧菌(V.cholerae)、肺炎链球菌(S.pneumoniae)、枯草芽孢杆菌(B.subitlis)、新月形柄杆菌(C.crescentus)、生殖支原体(M.genitalium)、费氏曲霉(A.fischeri)、集胞藻属(Synechocystis)、荧光假单胞菌(P.fluorescens)、棕色固氮菌(A.vinelandii)、天蓝色链霉菌(S.coelicolor)。在一些实施例中，该细菌细胞属于用于制备食物和/或饮料的细菌。此类细胞的非限制性示例性属包括但不限于醋杆菌属(Acetobacter)、节杆菌属(Arthrobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短状杆菌属(Brachybacterium)、短杆菌属(Brevibacterium)、肉杆菌属(Carnobacterium)、棒状杆菌属(Corynebacterium)、肠球菌属(Enterococcus)、葡糖醋杆菌属(Gluconacetobacter)、哈夫尼菌属(Hafnia)、盐单胞菌属(Halomonas)、考克氏菌属(Kocuria)、乳杆菌属(Lactobacillus)(包括耐酸乳杆菌(L.acetotolerans)、酸鱼乳杆菌(L.acidipiscis)、嗜酸乳杆菌(L.acidophilus)、消化乳杆菌(L.alimentarius)、短乳杆菌(L.brevis)、布氏乳杆菌(L.bucheri)、干酪乳酸菌(L.casei)、弯曲乳杆菌(L.curvatus)、发酵乳杆菌(L.fermentum)、希氏乳杆菌(L.hilgardii)、詹氏乳杆菌(L.jensenii)、金氏乳杆菌(L.kimchii)、乳酸乳杆菌(L.lactis)、副干酪乳杆菌(L.paracasei)、植物乳杆菌(L.plantarum)和清酒乳杆菌(L.sakei))、明串珠菌属(Leuconostoc)、微杆菌属(Microbacterium)、片球菌属(Pediococcus)、丙酸杆菌属(Propionibacterium)、魏斯氏菌属(Weissella)和发酵单胞菌属(Zymomonas)。

在一些实施例中，该细胞是真核细胞。在一些实施例中，该真核细胞是哺乳动物细胞。在一些实施例中，该真核细胞是动物细胞。在一些实施例中，该真核细胞是哺乳动物细胞。在一些实施例中，该真核细胞属于动物或人细胞、细胞系或细胞株。动物或哺乳动物细胞、细胞系或细胞株的示例包括但不限于小鼠骨髓瘤(NSO)、中国仓鼠卵巢(CHO)、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(幼仓鼠肾)、EBX、EB14、EB24、EB26、EB66、或Ebvl3、VERO、SP2/0、YB2/0、Y0、C127、L细胞、COS(例如，COS1和COS7)、QC1-3、HEK293、VERO、PER.C6、HeLA、EB1、EB2、EB3、溶瘤细胞或杂交瘤细胞。在一些实施例中，该真核细胞是CHO细胞。在一些实施例中，该细胞是CHO-K1细胞、CHO-K1 SV细胞、DG44 CHO细胞、DUXB11CHO细胞、CHOS、CHO GS敲除细胞、CHO FUT8 GS敲除细胞、CHOZN或CHO源性细胞。该CHOGS敲除细胞(例如，GSKO细胞)可以是例如CHO-K1 SV GS敲除细胞。

在一些实施例中，该真核细胞是人干细胞。这些干细胞可以是例如多能干细胞，包括胚胎干细胞(ESC)、成体干细胞、诱导多能干细胞(iPSC)、组织特异性干细胞(例如，造血干细胞)和间充质干细胞(MSC)。在一些实施例中，该细胞是本文所述的任何细胞的分化形式。在一些实施例中，该真核细胞是来源于培养中的任何原代细胞的细胞。

在一些实施例中，该真核细胞是肝细胞，诸如人肝细胞、动物肝细胞或非实质细胞。例如，该真核细胞可以是可铺板代谢合格的人肝细胞、可铺板诱导合格的人肝细胞、可铺板人肝细胞、悬浮合格的人肝细胞(包括10供体和20供体合并的肝细胞)、人肝库普弗细胞、人肝星状细胞、狗肝细胞(包括单个和合并的比格犬肝细胞)、小鼠肝细胞(包括CD-1和C57BI/6肝细胞)、大鼠肝细胞(包括Sprague-Dawley、Wistar Han和Wistar肝细胞)、猴肝细胞(包括食蟹猴或恒河猴肝细胞)、猫肝细胞(包括短毛家猫肝细胞)和兔肝细胞(包括新西兰白兔肝细胞)。

在一些实施例中，该真核细胞是植物细胞。例如，该植物细胞可以属于诸如木薯、玉米、高粱、小麦或水稻等农作物。该植物细胞可以属于藻类、树木或蔬菜。该植物细胞可以属于单子叶植物或双子叶植物，或者可以属于农作物或谷物植物、生产植物、水果或蔬菜。例如，该植物细胞可以属于树木，例如柑橘属树木，诸如橘子树、葡萄柚树或柠檬树；桃树或油桃树；苹果树或梨树；坚果树，诸如杏仁树或核桃树或开心果树；茄属植物，例如马铃薯、番茄、茄子、胡椒、红辣椒；芸苔属(Brassica)植物；莴苣属(Lactuca)植物；菠菜属(Spinacia)植物；辣椒属(Capsicum)植物；棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。

方法

在一些实施例中，本披露提供了在细胞的靶多核苷酸中提供靶向插入的方法，该方法包括将本披露的组合物引入该细胞中。在一些实施例中，该靶多核苷酸是靶DNA。在一些实施例中，该组合物包含：Cas核酸酶或Cas切口酶；以及包含指导序列、Cas结合区和DNA模板序列的一种或多种多核苷酸。在一些实施例中，该组合物包含(a)Cas核酸酶或Cas切口酶以及(b)含有指导序列、Cas结合区和DNA模板序列的多核苷酸，其中该DNA模板序列在该多核苷酸的3′端。在一些实施例中，该组合物包含(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。在一些实施例中，该组合物包含(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。本文进一步描述了该多核苷酸和该组合物的组分。

该方法的示例性非限制性概述展示于图1中。在图1中，Cas核酸酶被指导序列引导至细胞中的靶DNA并切割该靶DNA。该DNA模板序列包含(i)与作为引物的经切割的DNA杂交的引物结合序列和(ii)目的序列。DNA聚合酶(例如，该细胞的内源DNA聚合酶)与该引物结合并合成与该目的序列互补的DNA链，从而形成包含该目的序列的双链序列。可以通过DNA修复途径(例如，NHEJ)将该双链序列插入经切割的靶DNA中。

在一些实施例中，在细胞的靶DNA中提供靶向插入的方法包括：将本文所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。在一些实施例中，该DNA模板序列包含单链DNA。在一些实施例中，该指导序列能够与该靶DNA杂交。在一些实施例中，该Cas核酸酶或Cas切口酶经由该指导序列和该靶DNA的杂交被引导至该靶DNA。在一些实施例中，该方法在足以使该Cas核酸酶或Cas切口酶在该靶DNA中产生切割的条件下进行。

在一些实施例中，经切割的靶DNA的一条链是DNA聚合酶的引物。在一些实施例中，该DNA模板序列包含引物结合序列和目的序列。在一些实施例中，该引物结合序列能够与该引物结合。在一些实施例中，该方法不包括将外源DNA聚合酶引入该细胞中。在一些实施例中，该方法在足以使该细胞的内源DNA聚合酶结合该引物并使该DNA模板序列延伸的条件下进行。在一些实施例中，延伸包括合成与该目的序列互补的DNA链，以形成包含该目的序列的双链序列。

在一些实施例中，该方法包括将外源DNA聚合酶引入该细胞中。在一些实施例中，经由编码该外源DNA聚合酶的多核苷酸将该外源DNA聚合酶引入该细胞中。在一些实施例中，经由包含该多核苷酸的载体将该外源DNA聚合酶引入该细胞中。本文描述了将外源组分(例如，外源DNA聚合酶)引入细胞中的方法。在一些实施例中，该外源DNA聚合酶与该细胞同源。在一些实施例中，该外源DNA聚合酶与该细胞异源。在一些实施例中，该外源DNA聚合酶来源于与该细胞不同的生物体。在一些实施例中，该外源DNA聚合酶包含Pol I或其克列诺片段、Pol II、Pol III、Pol IV、Pol V、Polα、Polβ、Polλ、Polγ、Polσ、Polμ、Polδ、Polε、Polη、Polι、Pol κ、Polζ、Polθ、REVl、REV3、Bst DNA聚合酶、T4 DNA聚合酶、Φ29(phi29)DNA聚合酶、Taq DNA聚合酶、Pfu DNA聚合酶、KOD DNA聚合酶、TthDNA聚合酶、Pwo DNA聚合酶、或其变体或同源物。在一些实施例中，该方法在足以使该外源DNA聚合酶结合该引物并使该DNA模板序列延伸的条件下进行。在一些实施例中，延伸包括合成与该目的序列互补的DNA链，以形成包含该目的序列的双链序列。

在一些实施例中，将该双链序列插入经切割的靶DNA中。在一些实施例中，通过DNA修复途径将包含该目的序列的双链序列插入经切割的靶序列中。DNA修复途径包括非同源末端连接(NHEJ)途径、微同源介导的末端连接(MMEJ)途径、同源定向修复(HDR)途径、合成依赖性链退火(SDSA)、单链退火(SSA)和替代末端连接(Alt-EJ)。NHEJ不需要同源模板。通常，当与HDR相比时，NHEJ的修复效率更高但保真度更低，尽管当双链断裂具有相容的粘性末端或突出端时错误会减少。MMEJ，其在双链断裂的两侧具有微同源性(例如，约2至约10个碱基对)。HDR需要同源模板来引导修复，并且与NHEJ和MMEJ相比，HDR修复典型地保真度高但效率低。SDSA、SSA和Alt-EJ是基于HDR的修复途径。SDSA进一步描述于例如以下文献中：Sung等人，Nat Rev Mol Cell Biol[自然综述·分子细胞生物学]7：741(2006)。SSA和Alt-EJ进一步描述于例如以下文献中：Bhargava等人，Trends Genet[遗传学趋势]32(9)：566-575(2016)。在一些实施例中，该方法在足以用于非同源末端连接(NHEJ)的条件下进行。在一些实施例中，通过NHEJ将包含该目的序列的双链序列插入经切割的靶序列中。在一些实施例中，该方法在足以用于HDR、SDSA、SSA、Alt-EJ或其组合的条件下进行。

在一些实施例中，通过连接将该双链序列插入经切割的靶DNA中。在一些实施例中，通过DNA连接酶将包含该目的序列的双链序列插入经切割的靶序列中。在一些实施例中，该DNA连接酶是该细胞的内源DNA连接酶。在一些实施例中，该方法不包括将外源DNA连接酶引入该细胞中。

在一些实施例中，该方法进一步包括将外源DNA连接酶引入该细胞中，并且该外源DNA连接酶将该双链序列插入经切割的靶DNA中。在一些实施例中，经由编码该外源DNA连接酶的多核苷酸将该外源DNA连接酶引入该细胞中。在一些实施例中，经由包含该多核苷酸的载体将该外源DNA连接酶引入该细胞中。本文描述了将外源组分(例如，外源DNA连接酶)引入细胞中的方法。在一些实施例中，该外源DNA连接酶与该细胞同源。在一些实施例中，该外源DNA连接酶与该细胞异源。在一些实施例中，该外源DNA连接酶来源于与该细胞不同的生物体。在一些实施例中，该外源DNA连接酶包含大肠杆菌DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、DNA连接酶I、DNA连接酶II、DNA连接酶III、DNA连接酶IV、Taq DNA连接酶或其变体或同源物。

在一些实施例中，该双链序列进一步包含核酸内切酶、转座酶或重组酶的识别位点。在一些实施例中，该核酸内切酶、转座酶或重组酶将该双链序列整合到该靶DNA中。在一些实施例中，该核酸内切酶、转座酶或重组酶对于该细胞而言是内源的。通过核酸内切酶、转座酶和重组酶进行序列整合的机制是本领域普通技术人员已知的，并且进一步描述于例如以下文献中：Carlson等人，Mol Microbiol[分子微生物学]27(4)：671-676(1998)、Nesmelova等人，Adv Drug Deliv Rev[高等药物递送综述]62：1187-1195(2010)和Hallet等人，FEMS Microbiol Rev[欧洲微生物学会联合会微生物学综述]21(2)：157-178(1997)。

在一些实施例中，该DNA模板序列与该指导序列和该Cas结合区在同一多核苷酸上，因此靠近该靶DNA上的切割位点。在一些实施例中，使包含该DNA模板序列、该指导序列和该Cas结合区的该一种或多种多核苷酸杂交，因此该DNA模板序列靠近该靶DNA上的切割位点。在一些实施例中，该DNA模板序列与该切割位点的靠近促进了将通过该DNA聚合酶形成的双链序列插入经切割的靶DNA中。

在一些实施例中，本发明的方法通过靠近经切割的靶DNA提供该双链序列来提高将该双链序列插入经切割的靶DNA中的效率。在一些实施例中，本发明的方法通过减少经切割的靶DNA的重新连接来提高将该双链序列插入经切割的靶DNA中的效率。在一些实施例中，与不使DNA模板序列靠近经切割的靶DNA的方法相比，本发明的方法的效率得到改进。在一些实施例中，与不使DNA模板序列靠近经切割的靶DNA的方法相比，本发明的方法的效率高至少2倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、至少150倍或至少200倍或更高。

在一些实施例中，本披露提供了在靶DNA中提供靶向插入的方法，该方法包括使本文所述的组合物与该靶DNA接触，其中该指导序列能够与该靶DNA杂交。在一些实施例中，该组合物包含：Cas核酸酶或Cas切口酶；以及包含指导序列、Cas结合区、引物结合序列和目的序列的一种或多种多核苷酸。在一些实施例中，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)。在一些实施例中，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及(d)第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；和(ii)目的序列(SOI)。本文进一步描述了这些组合物的组分。在一些实施例中，该Cas核酸酶或Cas切口酶与DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合。本文进一步描述了融合蛋白。

在一些实施例中，该Cas核酸酶或Cas切口酶经由该指导序列和该靶DNA的杂交被引导至该靶DNA。在一些实施例中，该方法在足以使该Cas核酸酶或Cas切口酶在该靶DNA中产生切割的条件下进行。在一些实施例中，经切割的靶DNA的一条链是DNA聚合酶的引物。在一些实施例中，该第一和/或该第二多核苷酸的引物结合序列能够与该引物结合。

在一些实施例中，该方法进一步包括使该靶DNA与DNA连接酶接触。本文进一步描述了DNA连接酶。在一些实施例中，该DNA连接酶是T4连接酶、PCBV-1DNA连接酶、LigD、人连接酶蛋白或其组合。在一些实施例中，该DNA连接酶将该目的序列连接至经切割的靶DNA。

在一些实施例中，该方法进一步包括使该靶DNA与DNA聚合酶、DNA修复途径中的蛋白质或其组合接触。在一些实施例中，该目的序列是通过该DNA聚合酶、DNA修复途径中的该蛋白质或其组合转化为双链序列的单链序列。本文描述了DNA聚合酶和DNA修复途径。

在一些实施例中，该方法包括使该靶DNA与细胞提取物接触，其中该细胞提取物包含本文所述的DNA连接酶、DNA聚合酶和/或DNA修复途径蛋白。在一些实施例中，使该靶DNA与重组DNA连接酶、DNA聚合酶和/或DNA修复途径蛋白接触。

在一些实施例中，该方法在体内进行。在一些实施例中，该方法在体外进行。在一些实施例中，该方法离体进行。在一些实施例中，该靶DNA包含质粒、PCR产物、粘粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、基因组DNA、线粒体DNA、叶绿体DNA或其组合。

在一些实施例中，本披露提供了在细胞的靶多核苷酸中提供靶向插入的方法，该方法包括将本披露的组合物引入该细胞中。在一些实施例中，该靶多核苷酸是靶DNA。在一些实施例中，该组合物包含：Cas核酸酶或Cas切口酶；以及包含指导序列、Cas结合区、引物结合序列和目的序列的一种或多种多核苷酸。在一些实施例中，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)目的序列(SOI)。在一些实施例中，该组合物包含：(a)Cas核酸酶或Cas切口酶；(b)第一多核苷酸，该第一多核苷酸包含(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；(c)第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及(d)第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；(ii)目的序列(SOI)。本文进一步描述了这些组合物的组分。在一些实施例中，该Cas核酸酶或Cas切口酶与DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合。本文进一步描述了融合蛋白。

该方法的示例性非限制性概述展示于图10A-图10C中。在图10A中，该指导序列、Cas结合区、第一杂交区和引物结合位点位于第一多核苷酸上。通过被指导序列引导至靶DNA的Cas核酸酶在该靶DNA处产生双链断裂。使该引物结合位点与经切割的DNA杂交，并且第二多核苷酸经由包含互补序列的该第一和第二杂交区与该第一多核苷酸杂交。该第二多核苷酸包含目的序列，其被连接酶连接至经切割的DNA的5′和3′两端(图10A)。该第二多核苷酸可以进一步包括同源序列，并且5′端被连接酶连接至经切割的DNA中，并且通过同源介导的机制整合3′端。在一些实施例中，同源介导的机制包括HDR、合成依赖性链退火(SDSA)、单链退火(SSA)、替代末端连接(alt-EJ)或其组合(图10B)。在连接和/或同源介导的整合后，将该复合物转化为双链DNA，从而将该目的序列整合到该靶DNA中(图10C)。

在一些实施例中，在细胞的靶DNA中提供靶向插入的方法包括：将本文所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。在一些实施例中，该Cas核酸酶或Cas切口酶经由该指导序列和该靶DNA的杂交被引导至该靶DNA。在一些实施例中，该方法在足以使该Cas核酸酶或Cas切口酶在该靶DNA中产生切割的条件下进行。

在一些实施例中，经切割的靶DNA的一条链是DNA聚合酶的引物。在一些实施例中，该第一和/或该第二多核苷酸的引物结合序列能够与该引物结合。在一些实施例中，该方法不包括将外源DNA聚合酶引入该细胞中。在一些实施例中，该方法在足以使该细胞的内源DNA聚合酶结合该引物并使该目的序列延伸的条件下进行。在一些实施例中，延伸包括合成与该目的序列互补的DNA链，以形成包含该目的序列的双链序列。在一些实施例中，该方法不包括将外源DNA连接酶引入该细胞中。在一些实施例中，该方法在足以使该细胞的内源DNA连接酶将该目的序列连接至经切割的靶DNA的条件下进行。

在一些实施例中，该方法包括将外源DNA聚合酶引入该细胞中。本文描述了外源DNA聚合酶。在一些实施例中，该外源DNA聚合酶合成与该目的序列互补的DNA链。在一些实施例中，该方法包括将外源DNA连接酶引入该细胞中。在一些实施例中，该外源DNA连接酶将该目的序列连接至经切割的靶DNA。在一些实施例中，该目的序列是通过该细胞的DNA修复途径转化为双链序列的单链序列。

在一些实施例中，该方法进一步包括使该细胞与DNA依赖性蛋白激酶(DNA-PK)抑制剂接触。在一些实施例中，抑制DNA-PK减少NHEJ并促进HDR。在一些实施例中，使该细胞在与本文所述的组合物接触之前与该DNA-PK抑制剂接触。在一些实施例中，该DNA-PK抑制剂是AZD7648。

在一些实施例中，经由转染将本文所述的组合物、多核苷酸和/或融合蛋白引入该细胞中。本文进一步描述了转染方法。在一些实施例中，将本披露的多核苷酸(例如，包含指导序列、Cas结合区、DNA模板序列或其任何组合)转染到该细胞中。在一些实施例中，这些多核苷酸在一种或多种载体上。

在一些实施例中，经由编码蛋白质的一种或多种多核苷酸将本披露的蛋白质(例如，融合蛋白、Cas核酸酶、Cas切口酶、DNA聚合酶和/或DNA连接酶)引入该细胞中。在一些实施例中，该一种或多种多核苷酸在一种或多种载体上。在一些实施例中，该方法包括将多种蛋白质(例如，融合蛋白、Cas核酸酶、Cas切口酶、DNA聚合酶和DNA连接酶的任何组合)引入该细胞中。在一些实施例中，该方法包括将Cas核酸酶、Cas切口酶或融合蛋白和DNA聚合酶引入该细胞中。在一些实施例中，该方法包括将Cas核酸酶、Cas切口酶或融合蛋白和DNA连接酶引入该细胞中。在一些实施例中，该方法包括引入：Cas核酸酶、Cas切口酶或融合蛋白；DNA聚合酶；和DNA连接酶到该细胞中。在一些实施例中，编码该多种蛋白质的多核苷酸在单一载体上。在一些实施例中，编码该多种蛋白质的多核苷酸在多于一种载体上。

在一些实施例中，本文所述的组合物的组分在单一载体上。在一些实施例中，本文所述的组合物的组分在多于一种载体上。在一些实施例中，该方法包括将一种或多种载体转染到该细胞中，其中该一种或多种载体包含：编码融合蛋白、Cas核酸酶或Cas切口酶的一种或多种多核苷酸；以及包含该指导序列、Cas结合区、DNA模板序列的一种或多种多核苷酸。在一些实施例中，该方法包括将第一载体和第二载体转染到该细胞中，其中该第一载体包含编码融合蛋白、Cas核酸酶或Cas切口酶的多核苷酸；并且其中该第二载体包含含有该指导序列、Cas结合区、DNA模板序列的一种或多种多核苷酸。在一些实施例中，该方法包括将单一载体转染到该细胞中，其中该单一载体包含：(i)编码融合蛋白、Cas核酸酶或Cas切口酶的一种或多种多核苷酸；以及(ii)包含该指导序列、Cas结合区、DNA模板序列的一种或多种多核苷酸。

在一些实施例中，经由递送颗粒将本文所述的组合物、多核苷酸和/或融合蛋白引入该细胞中。在一些实施例中，将该组合物的组分在单一递送颗粒中递送。在一些实施例中，将该组合物的组分在多种递送颗粒中递送。递送颗粒可以用于递送外源生物材料，例如像本文所述的多核苷酸和蛋白质。在一些实施例中，该递送颗粒是固体、半固体、乳液或胶体。在一些实施例中，该递送颗粒是基于脂质的颗粒、脂质体、胶束、囊泡或外泌体。在一些实施例中，该递送颗粒是纳米颗粒。递送颗粒进一步描述于例如以下专利中：US 201I/0293703、US 2012/0251560、US 2013/0302401、US 5,543,158、US 5,855,913、US 5,895,309、US 6,007,845和US 8,709,843。

在一些实施例中，经由囊泡将本文所述的组合物、多核苷酸和/或融合蛋白引入细胞中。在一些实施例中，将该组合物的组分在单一囊泡中递送。在一些实施例中，将该组合物的组分在多种囊泡中递送。在一些实施例中，该囊泡包含外泌体或脂质体。用于将外源生物材料递送到靶细胞中的经工程化的囊泡描述于例如以下文献中：US 2008/0234183；US2019/0167810；US 2020/0207833；和Alvarez-Erviti等人，Nat Biotechnol[自然·生物技术]29：341(2011)。

将本文引用的所有参考文献(包括专利、专利申请、论文、教科书等)以及其中引用的参考文献(如同它们还未曾引用过的程度)通过援引以其全文特此并入本文。

实例

实例1.评价多核苷酸的靶向插入

测试单独的酿脓链球菌Cas9蛋白(SpCas9)或与逆转录酶融合的SpCas9(SpCas9-RT)与指导多核苷酸(在本文中称为“springRNA”)的体内靶向插入，这些指导多核苷酸包含靶向AAVS1基因座的RNA指导序列、用于结合SpCas9的tracrRNA和3′端的模板序列。制备以下五种springRNA构建体：

(1)仅RNA springRNA-由RNA核苷酸组成并且包含RNA指导序列、tracrRNA、6bp插入序列(AATATG)和引物结合序列的多核苷酸(参见图2A)；

(2)具有DNA尾(“DNA”)的springRNA-序列与仅RNA springRNA相同，并且全部包括RNA核苷酸，除插入序列和引物结合序列由DNA核苷酸组成之外(参见图2B)；

(3)具有DNA尾和硫代磷酸酯键(“PS-DNA”)的springRNA-与具有DNA插入片段的springRNA相同，不同之处在于插入序列和引物结合序列含有硫代磷酸酯键而不是磷酸二酯键(参见图2B)；

(4)具有无碱基位点的springRNA-与仅RNA springRNA相同并且由RNA核苷酸组成，不同之处在于插入序列中的第三个碱基被无碱基位点dSpacer核苷酸1′2′-双脱氧核糖代替(参见图2C)；

(5)具有TEG接头的springRNA-与仅RNA springRNA相同并且由RNA核苷酸组成，不同之处在于插入序列的第三个碱基共价连接到三乙二醇(TEG)(参见图2D)。

用表达SpCas9或SpCas9-RT的质粒使用转染HEK293T细胞。在二十四小时后，用2pmol上文列出的springRNA构建体使用LIPOFECTAMINETM RNAiMAX进一步转染细胞。

在转染springRNA后48小时收获细胞。通过PCR扩增AAVS1基因座，并且使用Illumina测序平台进行测序。结果示于图3和图4中。图3的小图A-小图E示出了在SpCas9和上文的每种springRNA构建体情况下的靶向插入。图3的小图F-小图J示出了在SpCas9-RT(“PE0”)和上文的每种springRNA构建体情况下的靶向插入。图4示出了通过仅SpCas9或SpCas9-RT与上文的每种springRNA构建体的组合得到的插入的相对频率。

图3和图4中的结果表明，含有DNA尾或具有硫代磷酸酯键的DNA尾(即，具有DNA核苷酸的插入序列和引物结合序列，如上文针对构建体(2)和(3)所述)的springRNA与表达SpCas9的质粒的共转染导致插入序列的靶向插入，即使在不存在与SpCas9融合的逆转录酶的情况下也是如此。因此，内源细胞因子(例如，内源细胞DNA聚合酶)能够使用插入序列作为DNA合成的模板。因此，可以使用仅Cas9和含有DNA插入片段(即，DNA插入序列和DNA引物结合序列)的springRNA进行靶向插入。

实例2.进一步评价多核苷酸的靶向插入

进一步测试仅RNA springRNA、具有DNA尾的springRNA以及具有DNA尾和硫代磷酸酯键(PS-DNA)的springRNA与仅SpCas9或SpCas9-RT融合物。如在实例1中的，springRNA构建体含有靶向AAVS1的指导序列和SpCas9 tracrRNA序列。springRNA的序列提供于表4中。插入序列和引物结合序列加下划线；双下划线代表DNA核苷酸。由安捷伦公司(Agilent)合成springRNA。

表4.springRNA序列

如针对实例1所述，将SpCas9或SpCas9-RT和springRNA转染到细胞中，收获细胞，并且分析AAVS1基因座。结果示于图5A-图5F中。图5A-图5C示出了在SpCas9-RT(“PE0”)以及仅RNA springRNA(图5A)、具有DNA尾的springRNA(图5B)和具有PS-DNA的springRNA(图5C)情况下的靶向插入。图5D-图5F示出了在SpCas9以及仅RNA springRNA(图5D)、具有DNA尾的springRNA(图5E)和具有PS-DNA的springRNA(图5F)情况下的靶向插入。

结果表明，SpCas9和含有DNA尾或具有PS-DNA的PS-DNA尾(即，具有DNA核苷酸的插入序列和引物结合序列)的springRNA的组合实现了与SpCas9-RT和springRNA的组合相似的插入模式。

实例3.体外测定

进行体外测定以评价DNA聚合酶在使用Cas9的靶向插入中的作用。测定的概述示于图6中。在体外测定中，用不同的荧光团标记两条互补的DNA链(经6FAM标记的非靶链和经HEX标记的靶链)。这样设计指导序列，使得Cas9切割产生两条长度不同的链。DNA聚合酶使与springRNA的引物结合序列杂交的经6FAM标记的非靶链延伸。使产物变性并将其通过毛细管电泳分离，并且检测经荧光团偶联的链。

通过使以下两条互补链退火来制备合成靶DNA底物：经6FAM标记的非靶链和经HEX标记的靶链。将Cas9和springRNA以等摩尔比混合，并且在室温下形成核糖核蛋白复合物。将Cas9：springRNA复合物以15倍摩尔过量添加到合成靶DNA底物中。将DNA聚合酶(Bst3.0DNA聚合酶或大肠杆菌DNA Pol I的克列诺片段，在其经优化的缓冲液中)添加到反应混合物中，并且在37℃下孵育1小时。通过蛋白酶K消化使反应停止。将1μL反应混合物添加到HIDI^TM甲酰胺中，并且在95℃下变性3分钟。在3730DNA分析仪(应用生物系统公司(Applied Biosystems))上通过毛细管电泳分离和分析经变性的产物。

结果示于图7A-图7F中。蓝色迹线对应于非靶链，并且绿色迹线对应于靶链。星号指示经切割的合成靶DNA底物，并且黑色箭头指示通过DNA聚合酶得到的延伸产物。图7A示出了在Cas9和springRNA情况下的测定结果。图7B示出了在Cas9、克列诺片段和springRNA情况下的测定结果。图7C-图7F示出了在Cas9、Bst 3.0聚合酶和以下springRNA情况下的测定结果：springRNA(图7C-图7D)、具有无碱基位点的springRNA(图7E)或具有TEG的springRNA(图7F)。体外测定结果表明，DNA聚合酶可以在不与Cas9融合的情况下进行靶向插入。图8示出了通过克列诺片段或Bst 3.0聚合酶进行的延伸反应的动力学。

实例4.近侧连接上游gRNA

以下实例5-19涉及近侧连接上游gRNA(proximal ligation upstream gRNA，“plugRNA”)。

如贯穿本披露和实例所述，plugRNA包括具有附加到3′端的多核苷酸的gRNA分子。多核苷酸包含以下两种元件：第一杂交区(在实例和附图中也称为“着陆垫”)和与Cas蛋白诱导的切割上游的序列杂交的引物结合序列(PBS)。plugRNA可以是单一分子，或者可以包含彼此退火从而形成二元、三元或四元复合物的多个多核苷酸。plugRNA的任何元件都可以包含DNA、RNA、LNA、PNA或经化学修饰的核苷酸。

如贯穿本披露和实例所述，Cas蛋白可以是能够结合plugRNA的任何Cas蛋白。Cas蛋白可以是任何I型或II型Cas蛋白，包括但不限于Cas9、Cas12、级联复合物。Cas蛋白可以与以下融合：荧光标签，DNA聚合酶，逆转录酶，DNA连接酶(例如但不限于：T4 DNA连接酶、绿草履虫小球藻病毒1(PBCV-1)连接酶、分枝杆菌属连接酶D(LigD)、人连接酶1、人连接酶3、人连接酶4)，连接酶衔接蛋白(例如但不限于：XRCC1、XRCC4、PCNA)，单链DNA结合蛋白(诸如RPA1/2/3、SSBP1-4)，DNA修复蛋白(TDP1、aprataxin、拓扑异构酶I)，或其组合。

本文的实例进一步提及“供体”多核苷酸，在本披露中也称为“第二多核苷酸”。供体多核苷酸包含第二杂交区，其与plugRNA中的第一杂交区互补；目的序列(在实例和附图中也称为“插入片段”)；和同源序列，其与靶切割位点近侧的序列互补或基本上互补。供体设计可以省略这些元件中的任一种，并且可以包含彼此杂交的两个或更多个多核苷酸，或者可以与另一个多核苷酸配对以形成双链区。供体的任何部分都可以包含DNA、RNA、PNA、LNA或经化学修饰的核苷酸。供体的5′和3′端可以被磷酸化、腺苷酸化、硫代磷酸化等。

本披露提供了进行位点特异性修饰(在本文中也称为敲入核苷酸引导的(knock-in nucleotide guided，“KING”)编辑)的方法。用于KING编辑的一般策略示于图10中。简而言之，Cas9与如本文所述的plugRNA和供体形成三元(或更高阶)复合物。Cas9诱导双链断裂。plugRNA的PBS退火至靶位点，将供体与断裂位点并置。可以通过内源或外源提供的DNA连接酶直接连接供体(图10A和图10B)。替代性地，可以通过DNA连接酶和基于同源性的机制(同源重组、单链退火[SSA]、微同源介导的末端连接[MMEJ]、合成依赖性链退火[SDSA]、DNA或RNA模板化的DNA修复)的协同作用来整合供体。一旦将供体整合到靶链中，内源细胞机器便可以分离中间体，导致将所期望的序列插入靶DNA中。

实例5：plugRNA和供体的设计

图9描绘了plugRNA与供体和相关元件的一般设计。plugRNA由指导序列(“靶向特定序列的间隔子RNA”)(1)、然后是允许Cas9蛋白结合和活性的gRNA支架组成。间隔子-gRNA支架的3′端延伸到多核苷酸中。此多核苷酸(由DNA、RNA组成，以各种化学方式及其组合修饰)由以下两种元件组成：第一杂交序列(“着陆垫”)(2)和与Cas蛋白诱导的切割上游的序列杂交的引物结合序列(3)。在断裂(即，第一杂交序列与引物结合序列之间的连接)附近的核苷酸由DNA组成。

第一杂交序列与供体的第二杂交序列(“杂交序列”)(4)杂交，将供体的5′端与断裂位点并置。在此构型中，三个多核苷酸呈现带切口的核酸，其是DNA连接酶的精致底物。

杂交序列可以被磷酸化、腺苷酸化、共价连接到蛋白质或以在化学上不同的方式修饰。供体进一步由目的序列(“插入序列”)(5)和同源序列(6)组成，后者与断裂位点近侧的序列同源。同源序列用于参与基于同源性的机制(HR、SSA或MMEJ)，潜在地提高编辑效率。

供体和plugRNA两者都可以含有另外的元件，省略一些元件或者在多个寡核苷酸中分拆式(参见图11和实例7)。为清楚起见，未描绘供体与plugRNA之间的碱基配对。

实例6：用于通过连接酶活性产生精确插入的策略

图10描绘了用于敲入核苷酸引导的(“KING”)编辑的一般策略。在plugRNA的引导下，Cas蛋白可以在指定的DNA序列处诱导切割。通过引物结合序列(“PBS”)与断裂位点的杂交，将供体与断裂位点并置。供体可以直接在5′和3′两端连接，或者在一端(这里描绘为5′)连接并且在另一端通过同源介导的机制(HR、SDSA、SSA、alt-EJ等)整合。将所产生的嵌合分子转化为dsDNA，将所期望的序列整合到靶位点中。

实例7：不同plugRNA：供体构型的示例

图11描绘了用于进行KING编辑的一些策略。图11(A)描绘了含有以下所有三种元件的供体：第二杂交序列、目的序列和同源序列。图11(B)描绘了没有同源序列的供体。图11(C)描绘了没有第二杂交序列的供体。图11(D)表示标准供体，其序列与所杂交的目的序列互补，以形成具有5′和3′两个突出端的双链目的区序列。这种构型被称为“突出端”。图11(E)描绘了如图11(A)中的供体，但是plugRNA由两个核酸组成。sgRNA在3′端添加了约30nt的长序列。这个3′序列可以与互补多核苷酸配对，然后是第一杂交序列和引物结合序列。这种构型被称为“分拆式plugRNA”或“分拆式系统”。图11(F)描绘了如图11(A)中的构型，但是杂交序列更短，在所引发的靶位点的3′端与供体的5′端之间产生缺口。这种构型被称为“缺口”。图11(G)与图11(A)相同，但是供体在5′端具有另外的核苷酸，产生flap，其在一些实施例中可以接合FEN1和其他修复机器。这种构型被称为“flap”。图11(H)与图11(B)相同，但是与目的序列互补的序列被退火，在供体的3′端产生平末端。这种构型被称为“平末端”。图11(I)供体被拆分为两个多核苷酸。第一供体链包含第二杂交序列和目的序列。第二序列包含同源序列和与目的序列互补的序列。这种构型被称为“桥”。在11(J)图中，同源序列嵌入plugRNA中，紧邻gRNA支架的下游。这个同源序列退火至Cas诱导的断裂的3′侧。供体包含侧翼为以下两个杂交序列的目的序列：第二杂交序列和另一杂交序列，第二杂交序列与第一杂交序列互补，并且另一杂交序列与和同源序列相邻的区域互补。这种构型使供体的5′和3′两侧都靠近双链断裂。这种构型被称为“双杂交式”。

实例8：概念验证体外测定

材料与方法

将经HEX标记的DNA寡核苷酸通过在95℃下变性2分钟而退火至其互补序列，在退火缓冲液(10mM Tris pH 7.5、50mM NaCl)中为200nM，然后以0.1℃/s逐步降低至4℃。将plugRNA与供体寡核苷酸以等摩尔比混合(在退火缓冲液中的终浓度为1μM)，并且如上所述进行退火。将Cas9核酸酶溶解在反应缓冲液(1X T4 DNA连接酶缓冲液，NEB公司)中，并且以等摩尔量(终浓度150nM)混合。通过在环境温度下孵育10分钟来组装Cas9-plugRNA-供体复合物。向经组装的RNP中添加荧光双链DNA底物(终浓度10nM)。将反应在37℃下孵育10分钟以切割靶DNA。在孵育后，添加200U T4DNA连接酶，并且在37℃下继续反应一小时。通过添加终止溶液(终浓度：蛋白酶K 0.1mg/ml、0.1％SDS、12.5mM EDTA)使反应终止，并且在56℃下孵育30min。将反应产物与GeneScan LIZ500一起溶解在HiDi甲酰胺中，在95℃下变性，然后通过毛细管电泳分离。

图12A表示测定的布局。图12B和图12C分别表示用具有不同长度的第一和第二杂交序列的plugRNA和供体的组合进行的体外测定的定量。计算以下两个参数：连接产物％，计算为在测定中检测到的对应于经连接的DNA占总DNA的百分比；和连接效率％，计算为已经被连接的切割DNA的分数。图12B显示，连接产物以高频率产生，其中当plugRNA具有20bp的着陆垫和15bp的杂交序列时，达到最大量。如果plugRNA不含着陆垫，则观察不到连接，这表明需要将供体DNA退火至plugRNA。图12C显示，无论组合如何，连接都是极其高效的，达到>90％的连接效率。

实例9.使用HeLa细胞核提取物进行体外连接

材料与方法

将经HEX标记的DNA寡核苷酸通过在95℃下变性2分钟而退火至其互补序列，在退火缓冲液(10mM Tris pH 7.5、50mM NaCl)中为200nM，然后以0.1℃/s逐步降低至4℃。将plugRNA与供体寡核苷酸以等摩尔比混合(在退火缓冲液中的终浓度为1μM)，并且如上所述进行退火。将Cas9核酸酶溶解在反应缓冲液(50mM Tris-HCl(pH 7.5)、0.5mM乙酸镁、60mM乙酸钾和0.1mg/ml BSA)中，并且以等摩尔量(终浓度150nM)混合。通过在环境温度下孵育10分钟来组装Cas9-plugRNA-供体复合物。向经组装的RNP中添加荧光双链DNA底物(终浓度10nM)。将反应在37℃下孵育10分钟以切割靶DNA。在孵育过程中，将HeLa细胞核提取物(伊普拉细胞公司(Ipracell))与dNTP和rNTP混合物预混合，并且在室温下孵育10分钟。在孵育后，将经预混合的HeLa细胞核提取物添加到RNP/底物混合物(2.5mg/ml HeLa细胞核提取物、5mM ATP、0.2mM CTP、0.2mM GTP、0.2mM UTP、0.2mM dATP、0.2mM dCTP、0.2mM dGTP、0.2mM dUTP)中。将反应在37℃下再孵育1小时。通过添加终止溶液(终浓度：蛋白酶K0.1mg/ml、0.1％SDS、12.5mM EDTA)使反应终止，并且在37℃下孵育30min。将反应产物与GeneScan LIZ500一起溶解在HiDi甲酰胺中，在95℃下变性，然后通过毛细管电泳分离。

图13A表示实验的布局。HeLa细胞核提取物一直被广泛地用于生化研究中，因为它保留了大多数蛋白质的活性，并且可以用于重建各种复杂的过程(包括复制、修复和转录)。进一步使用病毒性重组连接酶外，HeLa细胞核提取物还可以提供对使用人细胞中存在的酶活性进行KING编辑的可行性的深入了解。

图13B和图13C描绘了用HeLa细胞核提取物进行的体外测定的定量。如在图12和实例8中的，对产物丰度(作为对应于连接产物占总DNA的分数)和连接效率(作为转化为连接产物的切割DNA的比例)两者进行定量。图13B和图13C中的结果的热图证明，KING编辑是高效的。随着第一杂交区(“着陆垫”)和第二杂交区(“杂交序列”)的大小增加，观察到丰度更高的连接产物。还观察到，当使用HeLa细胞核提取物时，连接格外高效。

实例10.使用细胞核提取物重建KING编辑

材料与方法

将plugRNA与供体寡核苷酸以等摩尔比混合(在退火缓冲液中的终浓度为1μM)，并且通过在95℃下变性2分钟进行退火，然后以0.1℃/s逐步降低至4℃。将Cas9核酸酶溶解在反应缓冲液(50mM Tris-HCl(pH 7.5)、0.5mM乙酸镁、60mM乙酸钾和0.1mg/ml BSA)中，并且以等摩尔量混合(终浓度150nM)。通过在环境温度下孵育10分钟来组装Cas9-plugRNA-供体复合物。向经组装的RNP中添加含有靶向AAVS1序列的质粒(终浓度10nM)。将反应在37℃下孵育10分钟以切割靶DNA。在孵育过程中，将HeLa细胞核提取物(伊普拉细胞公司)与dNTP和rNTP混合物预混合，并且在室温下孵育10分钟。在孵育后，将经预混合的HeLa细胞核提取物添加到RNP/底物混合物(2.5mg/ml HeLa细胞核提取物、5mM ATP、0.2mM CTP、0.2mM GTP、0.2mM UTP、0.2mM dATP、0.2mM dCTP、0.2mM dGTP、0.2mM dUTP)中。将反应在37℃下再孵育1小时。将半微升的反应物用作PCR反应的模板，以扩增靶向AAVS1序列。使用毛细管电泳分离PCR产物，或者提交以使用NextSeq500进行下一代测序。将测序结果与参考序列进行比对，并且通过RIMA分析编辑(参见(例如，Taheri-Ghahfarokhi等人，PMID：30032200)。

图14A示出了方案的布局。图14B描绘了NGS后的代表性结果。描绘了在经恢复的AAVS1靶位点处检测到的前10个插入变体。包含>75％的经编辑的读段的居首位的变体对应于预测且期望的序列(杂交序列[点虚线]和插入片段[交叉阴影线])。还以低得多的频率检测到缩短的插入。还以低于0.5％的频率检测到具有错误的所期望的序列的插入。这些结果表明，可以重建整个KING反应，导致以高精度和保真度将所期望的序列插入靶位点中。

实例11.用各种底物进行的重建KING测定中的插入效率

材料与方法

将plugRNA与供体寡核苷酸以等摩尔比混合(在退火缓冲液中的终浓度为1μM)，并且通过在95℃下变性2分钟进行退火，然后以0.1℃/s逐步降低至4℃。将Cas9核酸酶溶解在反应缓冲液(50mM Tris-HCl(pH 7.5)、0.5mM乙酸镁、60mM乙酸钾和0.1mg/ml BSA)中，并且以等摩尔量混合(终浓度150nM)。通过在环境温度下孵育10分钟来组装Cas9＝plugRNA-供体复合物。向经组装的RNP中添加含有靶向AAVS1序列的质粒(终浓度10nM)。将反应在37℃下孵育10分钟以切割靶DNA。在孵育过程中，将HeLa细胞核提取物(伊普拉细胞公司)与dNTP和rNTP混合物预混合，并且在室温下孵育10分钟。在孵育后，将经预混合的HeLa细胞核提取物添加到RNP/底物混合物(2.5mg/ml HeLa细胞核提取物、5mM ATP、0.2mM CTP、0.2mM GTP、0.2mM UTP、0.2mM dATP、0.2mM dCTP、0.2mM dGTP、0.2mM dUTP)中。将反应在37℃下再孵育1小时。将半微升的反应物用作PCR反应的模板，以扩增靶向AAVS1序列。使用毛细管电泳分离PCR产物，或者提交以使用NextSeq500进行下一代测序。将测序结果与参考序列进行比对，并且通过RIMA分析编辑(PMID：30032200)。

图15描绘了当使用不同的策略时所期望的插入片段的频率(通过NGS测定)(参见图11)。如图15所示，杂交序列和同源序列和/或双链供体的存在导致精确KING编辑的频率更高。具有这些元件的不同构型的plugRNA：供体复合物能够以变化水平产生插入。

实例12.优化KING编辑组分以实现精确插入

在此实例中，测试各种KING编辑组分(参见图16A)以实现产生更精确的插入的能力。

方法：

用FugeneHD用驱动Cas9表达的质粒转染HEK293T细胞。24小时后，使用以下条件组装plugRNA和ssDNA供体：在95℃下变性2分钟，然后以0.1℃/s的速率逐步降低至4℃。用RNAiMAX用2pmol经组装的plugRNA和ssDNA供体转染细胞。靶向各种AAVS位点测试plugRNA的不同长度的第一杂交区(“着陆垫”)以及ssDNA供体的不同长度的第二杂交区(“杂交序列”)和同源序列。在48小时后从经转染的细胞中收获基因组DNA，并且在扩增后通过ILLUMINA下一代测序进行分析。

结果：

观察到，着陆垫、同源序列和杂交序列用于通过使用ssDNA供体进行KING编辑来引入精确的插入。参见图16B。使用plugRNA1.2(+AAVS6)、plugRNA1.4(+AAVS7)和plugRNA1.5(+AAVS7或+AAVS8)检测到预期的精确插入。

实例13.用ssDNA供体进行KING编辑

在此实例中，测试用于KING编辑的ssDNA供体和各种长度的同源序列。

方法：

用FugeneHD用驱动Cas9表达的质粒转染HEK293T细胞。24小时后，使用以下条件组装plugRNA和ssDNA供体：在95℃下变性2分钟，然后以0.1℃/s的速率逐步降低至4℃。用RNAiMAX用2pmol经组装的plugRNA和ssDNA供体转染细胞。测试ssDNA供体或具有缺口或flap的ssDNA的不同长度的同源序列(图17A)。在48小时后从经转染的细胞中收获基因组DNA，并且在扩增后通过ILLUMINA下一代测序进行分析。

结果：

观察到，通过优化ssDNA供体的同源序列的长度进一步改进了KING的绝对和相对精确编辑效率。参见图17B。对于plugRNA1.5，使用具有10或50bp同源序列的ssDNA供体检测到KING编辑的最高绝对精确编辑效率。对于plugRNAl.4，使用具有50bp同源序列的ssDNA供体检测到KING编辑的最高绝对精确编辑效率。图17B进一步证明，可以通过使用含有缺口或flap的供体进行KING编辑来引入精确的插入。

实例14.用dsDNA供体进行KING编辑

在此实例中，用具有图18A所示的各种构型的dsDNA供体测试KING编辑。

方法：

用FugeneHD用驱动Cas9表达的质粒转染HEK293T细胞。24小时后，使用以下条件组装plugRNA和ssDNA供体：在95℃下变性2分钟，然后以0.1℃/s的速率逐步降低至4℃。用RNAiMAX用2pmol经组装的plugRNA和ssDNA/dsDNA供体转染细胞。测试dsDNA的不同设计或对照ssDNA(图18A)。在48小时后从经转染的细胞中收获基因组DNA，并且在扩增后通过ILLUMINA下一代测序进行分析。

结果：

观察到，通过使用具有平末端、突出端或桥设计的dsDNA供体进行KING编辑引入了精确的插入。当使用具有平末端和突出端设计的供体时，通过对供体寡核苷酸进行硫代磷酸酯键修饰进一步改进了绝对和相对精确编辑效率(图18B)。

实例15.用Cas9(H840A)切口酶进行KING编辑

在此实例中，用Cas9(H840A)切口酶测试KING编辑。

方法：

用FugeneHD用驱动SpCas9(H840A)切口酶表达的质粒转染HEK293T细胞。24小时后，使用以下条件组装plugRNA和ssDNA供体：在95℃下变性2分钟，然后以0.1℃/s的速率逐步降低至4℃。用RNAiMAX用2pmol经组装的plugRNA和ssDNA供体转染细胞。测试ssDNA的不同设计(图19A)。在48小时后从经转染的细胞中收获基因组DNA，并且在扩增后通过ILLUMINA下一代测序进行分析。

结果：

观察到，通过使用SpCas9(H840A)切口酶进行KING引入了精确的插入。当使用SpCas9(H840A)切口酶时，实现了高达36％的相对精确编辑效率(图19B)，这高于用SpCas9核酸酶实现的精确编辑效率(小于5％)。

实例16.在用DNA依赖性蛋白激酶(DNA-PK)抑制剂处理后的KING编辑

在此实例中，用DNA-PK抑制剂测试KING编辑。DNA-PK是非同源末端连接(NHEJ)修复途径的一部分。

方法：

将HEK293T细胞用1μM DNAPK抑制剂(AZD7648)预处理1h，然后转染细胞。将DMSO用作模拟对照。在1h后，用FugeneHD试剂用驱动Cas9和PEn表达的质粒转染HEK293T细胞。24小时后，使用RNAiMAX用2pmol合成RNA转染细胞。通过在95℃下使合成plugRNA变性2分钟，将其退火至供体序列，然后缓慢冷却至4℃。测试几种不同的plugRNA和供体构型(参见图20A)。

在RNA转染后四十八小时，收获细胞，通过PCR扩增AAVS1基因座并使用Illumina平台进行测序。通过将读段与参考序列进行比对来分析数据，并且通过RIMA分析编辑频率(PMID：30032200)。

结果表明，Cas9和PEn与合成寡核苷酸的组合进行KING插入。用DNAPK抑制剂预处理改进了HEK293T细胞中的精确编辑。

图20B表示所转染的plugRNA：供体的不同组合的绝对期望编辑百分比。与DMSO对照(深灰色)相比，用DNA-PK抑制剂预处理改进了绝对期望编辑(浅灰色)。

实例17.在存在经共表达的连接酶的情况下的KING编辑

在此实例中，在存在连接酶或连接酶衔接蛋白(也称为“连接酶募集蛋白”)的情况下进行KING编辑。

方法：

使用FugeneHD试剂用驱动Cas9和连接酶/连接酶衔接物表达的一种或多种质粒转染HEK293T细胞。测试一组三种不同的供体构型(图21A)，每种构型具有九种不同的连接酶条件：具有细菌起源的连接酶(T4 DNA连接酶、LigD和PBCVl)；具有人起源的连接酶(Lig1、Lig3α、Lig4)；和人DNA修复蛋白(XRCC1、XRCC4、PCNA)。从单独的质粒中表达Cas9和连接酶。

在RNA转染后四十八小时，收获细胞，并且通过PCR扩增AAVS1基因座并使用Illumina平台进行测序。通过将读段与参考序列进行比对来分析数据，并且通过RIMA分析编辑频率(PMID：30032200)。

图21B示出了经共表达的Cas9与不同连接酶的组合的绝对期望编辑百分比。结果表明，在存在连接酶的情况下，Cas9进行KING插入。

实例18.不同供体的组成及其在体外测定和细胞中的性能的总结

图22中的表格总结了如本文的实例中所示的plugRNA：供体复合物的构型和每种构型的编辑效率。例如，“-”意指没有观察到KING编辑；“++++”意指高效的编辑。

实例19.双杂交式设计

在此实例中，测试双杂交式构型(图23A)。

方法：

用FugeneHD用驱动Cas9表达的质粒转染HEK293T细胞。24小时后，使用RNAiMAX用2pmol合成RNA转染细胞。通过在95℃下使合成plugRNA变性2分钟，将其退火至供体序列，然后缓慢冷却至4℃。

在转染后四十八小时，收获细胞，并且通过PCR扩增AAVS1基因座并使用Illumina平台进行测序。通过将读段与参考序列进行比对来分析数据，并且通过RIMA分析编辑频率(PMID：30032200)。

结果：

观察到先导编辑插入。图23B中的结果示出了总编辑和精确编辑(PE)插入的频率。

Claims

1.一种多核苷酸，该多核苷酸包含(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

2.如权利要求1所述的多核苷酸，其中该DNA模板序列包含经修饰的核苷酸、非B DNA结构、DNA聚合酶募集部分、DNA连接酶募集部分或其组合。

3.如权利要求2所述的多核苷酸，其中该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。

4.如权利要求3所述的多核苷酸，其中该共价接头包含三乙二醇(TEG)。

5.如权利要求3所述的多核苷酸，其中该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶-乙二醇或其组合。

6.如权利要求3所述的多核苷酸，其中该DNA光产物包含环丁烷嘧啶二聚体(CPD)、嘧啶(6-4)嘧啶酮光产物或其组合。

7.如权利要求3所述的多核苷酸，其中该经修饰的脱氧核糖核苷包含脱氧尿苷。

8.如权利要求3所述的多核苷酸，其中该经甲基化的核苷酸包含5-羟甲基胞嘧啶、5-甲基胞嘧啶或其组合。

9.如权利要求2所述的多核苷酸，其中该非B DNA结构包含发夹、十字形、Z-DNA、H-DNA(三链体DNA)、G-四联体DNA(四链体DNA)、滑移DNA、粘性DNA或其组合。

10.如权利要求2所述的多核苷酸，其中该DNA聚合酶募集部分包含与该DNA模板序列连接的DNA聚合酶募集蛋白。

11.如权利要求10所述的多核苷酸，其中该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

12.如权利要求2所述的多核苷酸，其中该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

13.一种多核苷酸，该多核苷酸包含：(i)RNA指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端，并且其中该DNA模板序列包含硫代磷酸酯键。

14.如权利要求1至13中任一项所述的多核苷酸，其中该DNA模板序列包含引物结合序列和目的序列。

15.如权利要求1至14中任一项所述的多核苷酸，其中该Cas结合区包含RNA，或者其中该Cas结合区包含RNA和DNA的组合。

16.如权利要求1至15中任一项所述的多核苷酸，其中该Cas结合区包含tracrRNA。

17.如权利要求1至15中任一项所述的多核苷酸，其中该Cas结合区能够与tracrRNA杂交。

18.如权利要求16或17所述的多核苷酸，其中该tracrRNA能够与Cas核酸酶结合。

19.如权利要求18所述的多核苷酸，其中该Cas核酸酶是Cas9或Cas12a。

20.如权利要求18所述的多核苷酸，其中该Cas核酸酶是II-B型Cas。

21.如权利要求16或17所述的多核苷酸，其中该tracrRNA能够与Cas切口酶结合。

22.如权利要求21所述的多核苷酸，其中该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

23.如权利要求1至22中任一项所述的多核苷酸，其中该DNA模板序列的长度为约8至约10000个核苷酸。

24.如权利要求14至23中任一项所述的多核苷酸，其中该引物结合序列的长度为约4至约300个核苷酸。

25.如权利要求14至24中任一项所述的多核苷酸，其中该目的序列的长度为约4至约100个核苷酸。

26.如权利要求1至25中任一项所述的多核苷酸，其中该RNA指导序列的长度为约15至约25个核苷酸。

27.如权利要求1至26中任一项所述的多核苷酸，该多核苷酸进一步包含位于该Cas结合区与该DNA模板序列之间的间隔子。

28.如权利要求27所述的多核苷酸，其中该间隔子包含DNA聚合酶的终止序列。

29.如权利要求28所述的多核苷酸，其中该间隔子包含多于一个终止序列。

30.如权利要求28或29所述的多核苷酸，其中该终止序列包含二级结构。

31.如权利要求30所述的多核苷酸，其中该二级结构包含茎环。

32.如权利要求27至31中任一项所述的多核苷酸，其中该间隔子的长度为约10至约200个核苷酸。

33.一种细胞，该细胞包含如权利要求1至32中任一项所述的多核苷酸。

34.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；以及

多核苷酸，该多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)DNA模板序列，其中该DNA模板序列在该多核苷酸的3′端。

35.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；

第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及

第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区和(ii)DNA模板序列。

36.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；

第一多核苷酸，该第一多核苷酸包含：(i)指导序列；和(ii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；以及

第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)Cas结合区；和(iii)DNA模板序列。

37.如权利要求34至36中任一项所述的组合物，其中该DNA模板序列包含引物结合序列和目的序列。

38.如权利要求34至37中任一项所述的组合物，其中该DNA模板序列包含经修饰的核苷酸、非B DNA结构、DNA聚合酶募集部分、DNA连接酶募集部分或其组合。

39.如权利要求38所述的组合物，其中该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。

40.如权利要求39所述的组合物，其中该经修饰的核苷酸包含硫代磷酸酯键。

41.如权利要求39所述的组合物，其中该共价接头包含三乙二醇(TEG)。

42.如权利要求39所述的组合物，其中该DNA损伤包含8-氧代鸟嘌呤、胸腺嘧啶-乙二醇或其组合。

43.如权利要求39所述的组合物，其中该DNA光产物包含环丁烷嘧啶二聚体(CPD)、嘧啶(6-4)嘧啶酮光产物或其组合。

44.如权利要求39所述的组合物，其中该脱氧核糖核苷包含脱氧尿苷。

45.如权利要求39所述的组合物，其中该经甲基化的核苷酸包含5-羟甲基胞嘧啶、5-甲基胞嘧啶或其组合。

46.如权利要求38所述的组合物，其中该非B DNA结构包含发夹、十字形、Z-DNA、H-DNA(三链体DNA)、G-四联体DNA(四链体DNA)、滑移DNA、粘性DNA或其组合。

47.如权利要求38所述的组合物，其中该DNA聚合酶募集部分包含与该DNA模板序列连接的DNA聚合酶募集蛋白。

48.如权利要求47所述的组合物，其中该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

49.如权利要求38所述的组合物，其中该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

50.如权利要求34至49中任一项所述的组合物，其中该指导序列包含RNA，或者其中该指导序列包含RNA和DNA的组合。

51.如权利要求34至50中任一项所述的组合物，其中该Cas结合区包含RNA，或者其中该Cas结合区包含RNA和DNA的组合。

52.如权利要求34至51中任一项所述的组合物，其中该Cas结合区包含tracrRNA。

53.如权利要求34至51中任一项所述的组合物，其中该Cas结合区能够与tracrRNA杂交，并且其中该组合物进一步包含tracrRNA。

54.如权利要求52或53所述的组合物，其中该tracrRNA能够与该Cas核酸酶或Cas切口酶结合。

55.如权利要求34至54中任一项所述的组合物，其中该组合物包含Cas核酸酶。

56.如权利要求55所述的组合物，其中该Cas核酸酶是Cas9或Cas12a。

57.如权利要求55所述的组合物，其中该组合物包含Cas核酸酶，并且其中该Cas核酸酶是II-B型Cas。

58.如权利要求34至54中任一项所述的组合物，其中该组合物包含Cas切口酶。

59.如权利要求58所述的组合物，其中该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

60.如权利要求34至59中任一项所述的组合物，其中该DNA模板序列的长度为约8至约500个核苷酸。

61.如权利要求34至60中任一项所述的组合物，其中该引物结合序列的长度为约4至约30个核苷酸。

62.如权利要求34至61中任一项所述的组合物，其中该目的序列的长度为约4至约100个核苷酸。

63.如权利要求34至62中任一项所述的组合物，其中该指导序列的长度为约15至约25个核苷酸。

64.如权利要求35至63中任一项所述的组合物，其中该第一杂交区和该第二杂交区是RNA。

65.如权利要求35至63中任一项所述的组合物，其中该第一杂交区和该第二杂交区是单链DNA。

66.如权利要求35至63中任一项所述的组合物，其中该第一杂交区是RNA并且该第二杂交区是单链DNA，或者其中该第一杂交区是单链DNA并且该第二杂交区是RNA。

67.如权利要求36至66中任一项所述的组合物，其中该第一杂交区的长度为约4至约5000个核苷酸。

68.如权利要求36至66中任一项所述的组合物，其中该第二杂交区的长度为约4至约5000个核苷酸。

69.如权利要求34或37至63中任一项所述的组合物，其中该多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。

70.如权利要求35至68中任一项所述的组合物，其中该第二多核苷酸进一步包含位于该DNA模板序列的5′的间隔子。

71.如权利要求69或70所述的组合物，其中该间隔子包含DNA聚合酶的终止序列。

72.如权利要求71所述的组合物，其中该间隔子包含多于一个终止序列。

73.如权利要求71或72所述的组合物，其中该终止序列包含二级结构。

74.如权利要求73所述的组合物，其中该二级结构包含茎环。

75.如权利要求69至74中任一项所述的组合物，其中该间隔子的长度为约10至约200个核苷酸。

76.如权利要求34至75中任一项所述的组合物，其中该Cas核酸酶或该Cas切口酶与DNA聚合酶募集蛋白融合。

77.如权利要求76所述的组合物，其中该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

78.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；

第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；(iii)第一杂交区；和(iv)引物结合序列，其中该引物结合序列在该第一多核苷酸的3′端；以及

第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)。

79.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；

第一多核苷酸，该第一多核苷酸包含：(i)指导序列；(ii)Cas结合区；和(iii)第一杂交区，其中该第一杂交区在该第一多核苷酸的3′端；

第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；(ii)第三杂交区；和(iii)引物结合序列，其中该引物结合序列在该第二多核苷酸的3′端；以及

第三多核苷酸，该第三多核苷酸包含：(i)与该第三杂交区互补的第四杂交区；和(ii)目的序列(SOI)。

80.如权利要求78所述的组合物，其中该第一多核苷酸和/或该第二多核苷酸包含RNA、DNA、经修饰的核苷酸或其组合。

81.如权利要求78或80所述的组合物，其中该第一多核苷酸和/或该第二多核苷酸进一步包含同源序列。

82.如权利要求81所述的组合物，其中该第一多核苷酸进一步包含(v)该同源序列，并且该第二多核苷酸包含该第二杂交区、该SOI和与该第一多核苷酸杂交的另一杂交区，其中该第二杂交区和该另一杂交区位于该SOI的侧翼。

83.如权利要求79所述的组合物，其中该第一多核苷酸、该第二多核苷酸和/或该第三多核苷酸中的任一个包含RNA、DNA、经修饰的核苷酸或其组合。

84.如权利要求79或83所述的组合物，其中该第一多核苷酸、该第二多核苷酸和/或该第三多核苷酸中的任一个进一步包含同源序列。

85.如权利要求80或83所述的组合物，其中该经修饰的核苷酸包含无碱基位点、共价接头、异种核酸(XNA)、锁核酸(LNA)、肽核酸(PNA)、硫代磷酸酯键、DNA损伤、DNA光产物、经修饰的脱氧核糖核苷、经甲基化的核苷酸或其组合。

86.如权利要求78至85中任一项所述的组合物，该组合物进一步包含含有与该SOI互补的序列的SOI互补体寡核苷酸。

87.如权利要求86所述的组合物，其中该SOI互补体寡核苷酸进一步包含同源序列。

88.如权利要求78至87中任一项所述的组合物，其中该Cas核酸酶或该Cas切口酶与DNA聚合酶、DNA聚合酶募集部分、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合融合。

89.如权利要求88所述的组合物，其中该DNA聚合酶募集部分包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

90.如权利要求88所述的组合物，其中该DNA连接酶包含T4DNA连接酶、PCBV-1DNA连接酶、LigD、人连接酶蛋白或其组合。

91.如权利要求88所述的组合物，其中该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

92.如权利要求91所述的组合物，其中该DNA结合蛋白包含复制蛋白A(RPA)或其亚基、单链DNA结合蛋白(SSBP)、或其组合。

93.如权利要求88所述的组合物，其中该DNA修复蛋白包含酪氨酰基-DNA磷酸二酯酶1(TDP1)、aprataxin、拓扑异构酶I或其组合。

94.如权利要求78至93中任一项所述的组合物，其中该Cas结合区包含tracrRNA。

95.如权利要求78至93中任一项所述的组合物，其中该Cas结合区能够与tracrRNA杂交，并且其中该组合物进一步包含tracrRNA。

96.如权利要求94或95所述的组合物，其中该tracrRNA能够与该Cas核酸酶或Cas切口酶结合。

97.如权利要求78至96中任一项所述的组合物，其中该组合物包含Cas核酸酶。

98.如权利要求97所述的组合物，其中该Cas核酸酶是Cas9或Cas12a。

99.如权利要求97所述的组合物，其中该Cas核酸酶是II-B型Cas。

100.如权利要求78至96中任一项所述的组合物，其中该组合物包含Cas切口酶。

101.如权利要求100所述的组合物，其中该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

102.如权利要求78至101中任一项所述的组合物，其中该目的序列的长度为约4至约100个核苷酸。

103.如权利要求78至102中任一项所述的组合物，其中该引物结合序列的长度为约4至约30个核苷酸。

104.如权利要求78至103中任一项所述的组合物，其中该指导序列的长度为约15至约25个核苷酸。

105.如权利要求78至104中任一项所述的组合物，其中该第一杂交区和/或该第二杂交区各自的长度为约4至约5000个核苷酸。

106.一种细胞，该细胞包含如权利要求34至105中任一项所述的组合物。

107.如权利要求106所述的细胞，该细胞进一步包含外源DNA聚合酶、外源DNA连接酶或两者。

108.一种融合蛋白，该融合蛋白包含(i)Cas核酸酶或Cas切口酶；和(ii)DNA聚合酶募集蛋白、DNA连接酶、DNA连接酶募集部分、DNA结合蛋白、DNA修复蛋白或其组合。

109.如权利要求108所述的融合蛋白，其中该融合蛋白包含Cas核酸酶。

110.如权利要求109所述的融合蛋白，其中该Cas核酸酶是Cas9或Cas12a。

111.如权利要求109所述的融合蛋白，其中该Cas核酸酶是II-B型Cas。

112.如权利要求108所述的融合蛋白，其中该融合蛋白包含Cas切口酶。

113.如权利要求112所述的融合蛋白，其中该Cas切口酶是Cas9切口酶、Cas12a切口酶或II-B型Cas切口酶。

114.如权利要求108至113中任一项所述的融合蛋白，其中该DNA聚合酶募集蛋白包含增殖细胞核抗原(PCNA)、单链DNA结合蛋白(SSBP)、肿瘤坏死因子α诱导蛋白(TNFAIP)、聚合酶δ相互作用蛋白(PolDIP)、X射线修复交叉互补蛋白(XRCC)、ES细胞特异性5-羟甲基胞嘧啶结合(HMCES)蛋白、RAD1、RAD9、HUS1或其组合。

115.如权利要求108至113中任一项所述的融合蛋白，其中该DNA连接酶包含T4 DNA连接酶、PCBV-1DNA连接酶、LigD、人连接酶蛋白或其组合。

116.如权利要求108至113中任一项所述的融合蛋白，其中该DNA连接酶募集部分包含该DNA模板序列的5′腺苷酸化。

117.如权利要求108至113中任一项所述的融合蛋白，其中该DNA结合蛋白包含复制蛋白A(RPA)或其亚基、单链DNA结合蛋白(SSBP)、或其组合。

118.如权利要求108至113中任一项所述的融合蛋白，其中该DNA修复蛋白包含酪氨酰基-DNA磷酸二酯酶1(TDP1)、aprataxin、拓扑异构酶I或其组合。

119.一种多核苷酸，该多核苷酸编码如权利要求108至118中任一项所述的融合蛋白。

120.一种载体，该载体包含如权利要求119所述的多核苷酸。

121.一种细胞，该细胞包含如权利要求108至118中任一项所述的融合蛋白、如权利要求119所述的多核苷酸、如权利要求120所述的载体或其组合。

122.如权利要求121所述的细胞，该细胞进一步包含如权利要求1至32中任一项所述的多核苷酸。

123.一种在细胞的靶DNA中提供靶向插入的方法，该方法包括将如权利要求34至77中任一项所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。

124.如权利要求123所述的方法，其中该方法不包括将DNA聚合酶引入该细胞中。

125.如权利要求124所述的方法，其中该Cas核酸酶在该靶DNA中产生双链切割，并且该细胞的内源DNA聚合酶使该DNA模板序列延伸。

126.如权利要求123所述的方法，其中该方法进一步包括将外源DNA聚合酶引入该细胞中。

127.如权利要求126所述的方法，其中该Cas核酸酶在该靶DNA中产生双链切割，并且该外源DNA聚合酶使该DNA模板序列延伸。

128.如权利要求125至127中任一项所述的方法，其中该DNA模板序列包含引物结合序列和目的序列，并且该DNA聚合酶合成与该目的序列互补的DNA链以形成包含该目的序列的双链序列。

129.如权利要求128所述的方法，其中将该双链序列插入经切割的靶DNA中。

130.如权利要求129所述的方法，其中通过非同源末端连接(NHEJ)将该双链序列插入该经切割的靶DNA中。

131.如权利要求130所述的方法，其中通过DNA连接酶将该双链序列插入该经切割的靶DNA中。

132.如权利要求131所述的方法，其中该DNA连接酶是该细胞的内源DNA连接酶。

133.如权利要求131所述的方法，其中该DNA连接酶是外源DNA连接酶。

134.一种在细胞的靶DNA中提供靶向插入的方法，该方法包括将如权利要求78至105中任一项所述的组合物引入该细胞中，其中该指导序列能够与该靶DNA杂交。

135.如权利要求134所述的方法，其中该方法不包括将DNA聚合酶或DNA连接酶引入该细胞中。

136.如权利要求135所述的方法，其中该Cas核酸酶在该靶DNA中产生双链切割，并且该细胞的内源DNA连接酶将该目的序列与经切割的靶DNA连接。

137.如权利要求134所述的方法，其中该方法进一步包括将外源DNA连接酶引入该细胞中。

138.如权利要求137所述的方法，其中该Cas核酸酶在该靶DNA中产生双链切割，并且该外源DNA连接酶将该目的序列与经切割的靶DNA连接。

139.如权利要求134至138中任一项所述的方法，其中该目的序列是通过该细胞的DNA修复途径转化为双链序列的单链序列。

140.一种在靶DNA中提供靶向插入的方法，该方法包括使如权利要求78至105中任一项所述的组合物与该靶DNA接触，其中该指导序列能够与该靶DNA杂交。

141.如权利要求140所述的方法，该方法进一步包括使该靶DNA与DNA连接酶接触。

142.如权利要求141所述的方法，其中该Cas核酸酶在该靶DNA中产生双链切割，并且该DNA连接酶将该目的序列与经切割的靶DNA连接。

143.如权利要求140至143中任一项所述的方法，该方法进一步包括使该靶DNA与DNA聚合酶、DNA修复途径中的蛋白质或其组合接触。

144.一种组合物，该组合物包含：

Cas核酸酶或Cas切口酶；

第二多核苷酸，该第二多核苷酸包含：(i)与该第一杂交区互补的第二杂交区；和(ii)目的序列(SOI)；

第三多核苷酸，该第三多核苷酸包含：(i)与该第二多核苷酸部分互补的第三杂交区；和(ii)目的序列(SOI)。