CN118103502A

CN118103502A - V型rna可编程核酸内切酶系统

Info

Publication number: CN118103502A
Application number: CN202280055410.9A
Authority: CN
Inventors: A·科宁; F·里奇特; P·克尼普豪森; A·尼林克斯; S·D·马克特; C·贝德纳斯基; S·图兰
Original assignee: Bayer AG
Current assignee: Bayer AG
Priority date: 2021-06-11
Filing date: 2022-06-09
Publication date: 2024-05-28

Abstract

本文描述了使用新型V型B‑GEn.1或B‑GEn.2核酸酶及其变体在细胞或无细胞环境中用于靶向、编辑或操纵DNA的新型系统，以及用于操纵DNA的方法和试剂盒。进一步公开的是新型和改进的单向导RNA。

Description

V型RNA可编程核酸内切酶系统

技术领域

本公开内容通常涉及分子生物学领域，特别涉及用于基因编辑的新型CRISPR CasRNA可编程DNA核酸内切酶。

背景技术

成簇的规律间隔的短回文重复序列(CRISPR)和CRISPR相关(Cas)基因，统称为CRISPR-Cas或CRISPR/Cas系统，目前被认为是为细菌和古细菌提供对噬菌体感染的免疫力。原核生物适应性免疫的CRISPR-Cas系统是一组极其多样化的蛋白质效应器非编码元件，及基因座架构，其中一些实例已被工程化和适应以产生重要的生物技术。

参与宿主防御的系统的组成部分包括一种或多种能够修饰DNA或RNA的效应蛋白，以及负责将这些蛋白活性靶向至噬菌体DNA或RNA上特定序列的RNA向导元件。向导RNA由CRISPR RNA(crRNA)组成，且可需要额外的反式作用RNA(tracrRNA)以能够通过所述效应蛋白操纵靶核酸。crRNA由称为“正向重复序列”的区段(segment)和称为“间隔区序列(spacersequence)”的区段组成，称为“正向重复序列”的区段负责将crRNA与效应蛋白结合，称为“间隔区序列”的区段与所需的核酸靶序列互补。CRISPR系统可以通过修饰crRNA的间隔区序列来重新编程以靶向替代的DNA或RNA靶标。

CRISPR-Cas系统可大致分为两类：第1类系统由多个效应蛋白组成，其共同在crRNA周围形成复合物，以及第2类系统由单一效应蛋白组成，其与crRNA的复合物引导至靶DNA或RNA底物。第2类系统的单亚基效应器组合物为工程化和应用提供了更简单的组分集，且因此是迄今为止可编程的效应器的重要来源。因此，新的第2类系统的发现、工程化和优化可产生用于基因组工程化和其他领域的广泛应用且强大的可编程技术。使用CRISPR(成簇的规律间隔的短回文重复序列，Clustered Regularly interspaced ShortPalindromic Repeats)-Cas(CRISPR相关蛋白，CRISPR associated proteins)的RNA引导的DNA靶向原理编辑基因组，在过去几年中得到了广泛的应用。已经记载了五种类型的CRISPR-Cas系统(I型，II型和IIb型，Ill型，V型和VI型)。用于基因组编辑的最多使用的CRISPR-Cas是II型系统。细菌II型CRISPR-Cas系统提供的主要优势在于对可编程DNA干涉的最低需求:由可定制的双RNA结构引导的核酸内切酶Cas9。正如在酿脓链球菌(Streptococcus pyogenes)的原始II型系统中所证实的，反式激活CRISPR RNA(tracrRNA)与前体CRISPR RNA(pre-crRNA)的不可变重复序列结合，以形成双RNA，该双RNA对于RNaseIII在存在Cas9的情况下的crRNA共成熟和Cas9切割侵入DNA都是必不可少的。正如在化脓链球菌中所证明的，Cas9在成熟活化的tracrRNA和靶向crRNA之间形成的双链体的引导下，在入侵的同源DNA中引入了位点特异性双链DNA(dsDNA)断裂。Cas9是多结构域酶，其使用HNH核酸酶结构域来切割靶标链(定义为与crRNA的间隔区序列互补)和RuvC-样结构域来切割非靶标链。

除了II型CRISPR Cas9核酸酶外，还记载了许多不同的V型CRISPR Cas9核酸酶，例如Cas12a、Cas12b、Cas12e、Cas12f、Cas13a、Cas13b(Koonin等人，Curr OpinMicrobiol.2017年6月；37:67-78，和Makarova等人，Nat Rev Microbiol.2020年2月；18(2):67-83.)。这些系统中的一些系统不需要tracr RNA(Cas 12a，Cas 13a，Cas 13b)，然而Cas 12b通常需要tracr RNA(Kooni等人，Curr Opin Microbiol.2017年6月；37:67-78)。

哺乳动物细胞中的基因组编辑至今受到限制，部分原因是各种Cas9蛋白的尺寸。来自酿脓葡萄球菌(Staphylococcus pyogenes)的Cas9(SpyCas9)是迄今使用最广泛的酶，包含约4.2kb的DNA(W02013/176722)，与同源单向导RNA(sgRNA)的直接结合进一步增加了其尺寸。腺相关病毒是基因治疗应用中用于递送Cas9酶的载体之一。然而，AAV的载货(cargo)尺寸限制在4.5kb左右。由于尺寸限制，递送Cas9与其sgRNA和潜在的DNA修复模板可成为使用该方法的障碍。更小的Cas9分子的特点已被表征，但它们中的大多数具有原型间隔相邻基序(PAM)序列，该序列不如SpyCas9所使用的序列那样明确定义。例如，金黄色葡萄球菌(Staphylococcus aureus)(SauCas9使用“NNGRR(T)”序列，其中R＝A或G，且空肠弯曲杆菌(Campylobacter jejuni)(Cja)Cas9分别使用“NNNACAC”/“NNNRYAC”PAM(其中Y＝T或G)。所述PAM的模糊性增加了酶在与PAM具有高度或完全序列一致性的脱靶序列上产生不需要活性的可能性。这些系统的特异性仍然值得关注，因为意外(“脱靶”)靶向类似位点将增加不良事件的可能性。

现有的CRISPR-Cas系统通常具有以下一个或多个缺点：

a)它们的尺寸太大，以至于无法在已建立的适合治疗的病毒递送系统的基因组中携带，如腺相关病毒(AAV)。

b)它们中多数在非宿主环境中无明显活性，例如在真核细胞中，且特别是在哺乳动物细胞中。

c)当间隔区序列和原型间隔序列之间存在错配时，它们的核酸酶可以催化DNA链切割，导致不期望的脱靶效应，例如，使它们不适合基因治疗用途或其他需要高精度的应用。

d)它们可引发免疫应答，该应答可限制其在哺乳动物体内的应用。

e)它们需要复杂的和/或长的PAM，该PAM限制DNA靶向区段的靶标选择。

f)它们在质粒或病毒载体上表现出低表达。

g)它们需要额外的RNA序列来激活或额外的RNA序列作为向导RNA的一部分。

发明内容

本发明涉及一种命名为B-GEn的新型V型CRISPR Cas核酸酶，其包含B-GEn.1(SEQID NO:1)，B-Gen1.2(SEQ ID NO:39)和B-GEn.2(SEQ ID NO:2)，或任何蛋白质或编码其的任何核酸，所述蛋白质与SEQ ID NO:1、2或39中的任一序列在其整个长度上具有至少80％同一性，优选至少85％，更优选至少90％，甚至更优选至少95％，特别地优选至少99％，最优选至少99.5％的氨基酸同一性。

或者，本发明涉及一种命名为B-GEn的新型V型CRISPR Cas核酸酶，其包含B-GEn.1(SEQ ID NO:1)和B-GEn.2(SEQ ID NO:2)，或任何蛋白质或编码其的任何核酸，所述蛋白质或与SEQ ID NO:1、2中的任一序列在其整个长度上具有至少80％同一性，优选地至少85％，更优选地至少90％，甚至更优选地至少95％，特别优选地至少99％，最优选地至少99.5％的氨基酸同一性。

本发明进一步涉及CRISPR Cas系统，其包含B-GEn.1或B-GEn.2，合适的向导RNA(特别的根据SEQ ID NO:40-44)，其包含SEQ ID NO:3和SEQ ID NO:4中包括的序列，和靶DNA。

在一个替代实施方案中，任何B-GEn1.2(SEQ ID NO:39)是本文中在任何对于B-GEn.1(SEQ ID NO:1)的实施方案中的合适且功能相同的替代物。

在一个方面，本文提供了一种在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的方法，该方法包括(I)将本文公开的异源B-GEn.1或B-GEn.2多肽或编码本文公开的B-GEn.1或B-GEn.2的核酸引入至细胞或引入至体外环境中；和(II)将一个或多个异源单向导RNA(sgRNA)或编码这样的一个或多个sgRNA的DNA引入至细胞或体外环境中，每个sgRNA或编码该sgRNA的DNA包含：(a)工程化的DNA靶向区段，其包含RNA且能够与多核苷酸基因座上的靶序列杂交，(b)由RNA组成的tracr伴侣序列(tracr mate sequence)，以及(c)由RNA组成的tracr RNA序列，其中所述tracr伴侣序列与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列；和(III)在靶DNA中产生一个或多个切口(nick)或缺口(cut)或碱基编辑，其中B-GEn.1或B-GEn.2多肽以其加工或未加工形式通过所述sgRNA被引导至靶DNA。

在一个方面，本文提供了一种组合物用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的用途，所述组合物包含：(I)本文公开的B-GEn.1或B-GEn.2多肽或编码其的核酸；和/或(II)一个或多个单异源向导RNA(sgRNA)或适合于原位产生这样的一个或多个sgRNA的DNA，每种包含：(a)工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上这样的靶序列杂交；(b)由RNA组成的tracr伴侣序列；和(c)由RNA组成的tracrRNA序列，其中所述tracr伴侣序列与所述tracr序列杂交，且其中(c)、(b)和(a)分别以5’至3’方向排列。

在另一个方面，本文提供了一种细胞，其包含：(I)如本文公开的B-GEn.1或B-GEn.2多肽，或编码本文公开的B-GEn.1或B-GEn.2多肽的核酸；和(II)一个或多个单异源向导RNA(sgRNA)或适合于原位产生这样的一个或多个sgRNA的DNA，每种包含：(a)工程化的DNA靶向区段，其可以与多核苷酸基因座上的靶序列杂交，(b)tracr伴侣序列，和(c)tracrRNA序列，其中所述tracr伴侣序列可以与所述tracr序列杂交，且其中(c)、(b)和(a)分别以5’至3’方向排列。

在另一个方面，本文提供了一种试剂盒，其包含：(I)编码如本文所公开的B-GEn.1或B-GEn.2多肽的核酸序列，其中编码B-GEn.1或B-GEn.2的核酸序列可操作地连接至启动子；和(II)一个或多个单异源向导RNA(sgRNA)或适合于原位产生这样的一个或多个sgRNA的DNA,每个sgRNA包含：(a)工程化的DNA靶向区段，其可以与多核苷酸基因座上的靶序列杂交，(b)tracr伴侣序列，和(c)tracr RNA序列，其中所述tracr伴侣序列可以与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列。

在另一个方面，本文还公开了5个合成衍生和优化的sgRNA(SEQ ID Nos:40-44)序列。这些序列需要在其3’端有大约20个核苷酸的序列特异性段(stretch)，其提供所述序列特异性引导。

为了在低活性靶标上，提高B-GEn.1(SEQ ID NO:1)的活性，和其他还可能的V型CRISPR Cas核酸酶的活性，且为了减少用于未来治疗方案的RNA合成负担，设计了缩短和突变的sgRNA。SEQ ID Nos:40-44的sgRNA表现出更高的活性，特别是在难以编辑的靶标上，且具有显著降低的长度(用20个核苷酸向导序列表示)：

1.SEQ ID NO:40:B-GEn.1_sgRNA4,117个核苷酸

2.SEQ ID NO:41:B-GEn.1_sgRNA4.2,107个核苷酸

3.SEQ ID NO:42:B-GEn.1_sgRNA4.3,107个核苷酸

4.SEQ ID NO:43:B-GEn.1_sgRNA4.4,107个核苷酸

5.SEQ ID NO:44:B-GEn.1_sgRNA4.5,106个核苷酸

在另一方面，本发明涉及以下的组合：

a)B-GEn.1(SEQ ID NO:1)或B-GEn.1.2(SEQ ID NO:39)，或任何蛋白质或编码其的任何核酸，所述蛋白质与SEQ ID NO:1、2中的任一序列在其整个长度上具有至少80％同一性，优选地至少85％，更优选地至少90％，甚至更优选地至少95％，特别优选地至少99％，最优选地至少99.5％的氨基酸同一性，和

b)包含选自SEQ ID NOs:40、41、42、43和45的序列的sgRNA。

通常，这些sgRNA序列在它们的3’端包含靶标特异性序列，其通常具有大约20个核苷酸的长度。

所述sgRNA也可以用于其他V型CRSIPR Cas核酸酶。

本文引用的每一项专利文件和科学文献的全部公开内容，以及在其中引用的那些专利文件和科学文献，均通过引用明确并入本文，用于所有目的。

下面更具体地描述本发明的额外的特征和优点。

附图说明

图1说明了筛选试验以及用于测试B-GEn多肽作为CRISPR Cas核酸内切酶的活性的试验。

图2示出了实验3的结果。

具有以下sgRNA序列：v1 SEQ ID NO:3；v4 SEQ ID NO:40；v4.2SEQ ID NO:41；v4.3 SEQ ID NO:42；v4.4 SEQ ID NO:43；v4.5 SEQ ID NO:44；且v4.6、v5、v5.2、v5.3、v5.4、v5.5、v5.6是较少或无活性序列。

所有sgRNA在其3’端均包含根据实施例3的23个核苷酸长的TCRA序列特异性区域。实心柱为TCRA引导1和阴影线柱为TCRA引导2。

对序列表的引用

命名为BHC211037-FC_Sequence_Listing.xml的序列表中包括本文公开的序列。也记载SEQ ID NO:1(B-GEn.1蛋白)和SEQ ID NO:2(B-GEn.2蛋白)的序列。

序列表中出现的序列总结

SEQ ID NO:1

/>

具体实施方式

本申请提供了新的CRISPR-Cas核酸酶和基于这种核酸酶的基因编辑系统。所述新型核酸酶在本文中称为B-GEn核酸酶或B-GEn.1或B-GEn.2核酸酶。

通常，B-GEn核酸酶组包括以下成员，其在表1中列出：

根据本发明的一个实施方案是多肽或编码相同多肽的核酸，其相比于SEQ ID NO:1、2和9，在氨基酸水平上有至少80％的同一性。

根据本发明的一个优选实施方案是多肽或编码相同多肽的核酸，其相比于SEQ IDNO:1、2和9，在氨基酸水平上有至少85％的同一性。

根据本发明的一个更优选实施方案是多肽或编码相同多肽的核酸，其相比于SEQID NO:1、2和9，在氨基酸水平上有至少90％的同一性。

根据本发明的一个甚至更优选实施方案是多肽或编码相同多肽的核酸，其相比于SEQ ID NO:1、2和9，在氨基酸水平上有至少95％的同一性。

根据本发明的一个特别的优选实施方案是多肽或编码相同多肽的核酸，其相比于SEQ ID NO:1、2和9，在氨基酸水平上有至少99％的同一性。

根据本发明的一个非常特别的优选实施方案是多肽或编码相同多肽的核酸，其相比于SEQ ID NO:1、2和9，在氨基酸水平上有至少99.5％的同一性。

而根据本发明的另一个实施方案是B-GEn.1或B-GEn.2的下列变体：

(I)以增加的优选顺序与SEQ ID NOs:1或2的任何序列在其整个长度上有至少80％，例如，至少85％、至少90％、至少95％、至少99％、至少99.5％的氨基酸同一性的变体。

(II)根据(I)的变体，其包含额外的组分如作为核定位信号，从而不仅在无细胞反应或在原核细胞，还在真核细胞环境，包括活生物体如植物或动物中获得B-GEn.1或B-GEn.2CRISPR系统的适当的活性；

(III)相应的多核苷酸序列的密码子优化变体，其编码B-GEn.1或B-GEn.2和根据(I)和(II)的变体。

如无特别说明，术语B-GEn和B-GEn.1或B-GEn.2包括在(I)、(II)、(III)下指明的所有变体。

而根据本发明的另一个替代实施方案是B-GEn.1的下列变体，其具有以下氨基酸交换：L235Q、K673R、D1036E，可以是单独、两个的组合或优选地全部三个，特别地为根据SEQID NO 39的B-GEn.1的变体：

(I)以增加的优选顺序与SEQ ID NOs:1或39的任何序列在其整个长度上有至少80％，例如，至少85％、至少90％、至少95％、至少99％、至少99.5％的氨基酸同一性的变体。

(II)根据(I)的变体，其包含额外的组分如作为核定位信号，从而不仅在无细胞反应或在原核细胞，还在真核细胞环境，包括活生物体如植物或动物中获得B-GEn.1或B-GEn.1.2CRISPR系统的适当的活性；

(III)相应的多核苷酸序列的密码子优化变体，其编码B-GEn.1或B-GEn.1.2和根据(I)和(II)的变体。

基于B-Gen.1或B-GEn.2的CRISPR-Cas系统

根据本发明的一个实施方案展示了组合物，其包含：

(a)B-GEn.1或B-GEn.2多肽或编码这样的B-GEn.1或B-GEn.2的多核苷酸；

(b)单异源向导RNA(sgRNA)或允许原位产生这样的sgRNA的DNA，其包含：

i.工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上的靶序列杂交

ii.由RNA组成的tracr伴侣序列，和

iii.由RNA组成的tracr RNA序列，

其中，所述tracr伴侣序列与tracr序列杂交，且其中(i)、(ii)和(iii)以5’至3’方向排列。

在sgRNA中，tracr伴侣序列和tracr序列通常通过合适的环序列连接，并形成茎环结构。

用于包含B-GEn.1或B-GEn.2的CRISPR-Cas系统的适合的PAM序列

B-GEn.1和B-GEn.2的功能需要在靶序列上的合适的原型间隔相邻基序(“PAM”)序列。

合适的PAM序列在表2中列出，其中所述工程化的DNA靶向区段在其3’端与靶向的DNA区段上的PAM序列直接相邻，或这样的PAM序列是靶向的DNA序列在其5’部分的一部分。

表2：对于相应的B-GEn.1或B-GEn.2核酸内切酶的适合的PAM序列

B-GEn	PAM序列
		B-GEn.1	“DTTN”，其中“D”代表“A”或“T”或“G”；优选地“ATT”
B-GEn.2	“DTTN”，其中“D”代表“A”或“T”或“G”；优选地“ATT”

用于CRISPR-Cas系统中B-GEn.1或B-GEn.2的适合的tracr序列

用于CRISPR-Cas系统中B-GEn.1或B-GEn.2的适合的tracr序列在表3中列出。或者，可以使用这些序列的变体。变体可以包含这些序列的部分或截断版本和/或在这些序列的一个或多个位置具有碱基修饰的序列。相应的DNA序列分别在SEQ ID NOs:5和6中公开。

表3

/>

在一些实施方案中，编码B-GEn.1或B-GEn.2的多核苷酸和sgRNA包含用于在细胞内或体外环境表达的合适的启动子和/或合适的核定位信号。

根据本发明的另一个实施方案展示了在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的方法，其包括以下步骤：

(a)将异源B-GEn.1或B-GEn.2多肽或编码相同蛋白质的核酸引入至细胞或体外环境；和

(b)引入单异源向导RNA(sgRNA)或适合原位产生这种sgRNA的DNA，其包含：

i.工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上的靶序列杂交，

ii.由RNA组成的tracr伴侣序列，和

iii.由RNA组成的tracr RNA序列，

其中所述tracr伴侣序列可以与所述tracr序列杂交，且其中(i)、(ii)和(iii)以5’至3’方向排列；

(c)在靶DNA中产生一个或多个切口、缺口或编辑，其中B-GEn.1或B-GEn.2多肽以其加工或未加工形式通过所述gRNA引导至靶DNA。

根据本发明的另一个实施方案是一种组合物用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的用途，该组合物包含：

(a)B-GEn.1或B-GEn.2多肽或编码这样的B-GEn.1或B-GEn.2的多核苷酸；

(b)单异源向导RNA(sgRNA)或适合于原位产生这种sgRNA的DNA，其包含：

i.工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上的这种靶序列杂交，

ii.由RNA组成的tracr伴侣序列，和

iii.由RNA组成的tracr RNA序列，

其中所述tracr伴侣序列与所述tracr序列杂交，且其中(i)、(ii)和(iii)以5’至3’方向排列。

根据本发明的另一个实施方案是离体或体外的细胞，其包含：

(a)异源B-GEn.1或B-GEn.2多肽或编码相同多肽的核酸；

ii.由RNA组成的tracr伴侣序列，和

iii.由RNA组成的tracr RNA序列，

其中所述tracr伴侣序列与所述tracr序列杂交，且其中(i)、(ii)和(iii)分别以5’至3’方向排列；

或已经使用上述(a)和(b)对其基因组进行靶向、编辑、修饰或操纵的这样的细胞。

根据本发明的另外的实施方案是试剂盒，其包含：

(a)编码B-GEn.1或B-GEn.2的核酸序列，其中编码B-GEn.1或B-GEn.2的核酸序列可操纵地连接至启动子或核糖体结合位点；

ii.由RNA组成的tracr RNA伴侣序列，和

iii.由RNA组成的tracr RNA序列，

或

(a)B-GEn.1或B-GEn.2蛋白质；

(b)一个或多个单异源向导RNA(sgRNA)，其每个sgRNA包含：

iv.工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上的这种靶序列杂交，

v.由RNA组成的tracr伴侣序列，和

vi.由RNA组成的tracr RNA序列，

而根据本发明的另一个实施方案包括用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵一个或多个靶DNA的组合物和方法，包括：

(a)B-GEn.1或B-GEn.2

(b)向导RNA(gRNA)或适合于原位产生这种gRNA的DNA，其包含：

ii.由RNA组成的tracr RNA序列；

其中(i)和(ii)是单个RNA分子，(iii)位于单独的RNA分子上。

多重技术(Multiplexing)

在另一方面，本文提供了用于在细胞中多个位置编辑或修饰DNA的方法，该方法主要由以下步骤组成：i)将B-GEn.1或B-GEn.2多肽或编码B-GEn.1或B-GEn.2多肽的核酸引入至细胞；和ii)将包含两个或多个前体CRISPR RNA(pre-CRISPR RNA，pre-crRNA)的单异源核酸以作为RNA的形式或编码为DNA的形式并在一个启动子的控制下引入至细胞，每个pre-crRNA包含重复序列间隔区阵列或重复序列间隔区，其中间隔区包含与DNA中的靶序列互补的核酸序列，且重复序列包含茎环结构，其中B-GEn.1或B-GEn.2多肽切割茎环结构上游的两个或多个pre-crRNA以生成两个或多个中间crRNA，其中所述两个或多个中间crRNA被加工成两个或多个成熟crRNA，且其中每个两个或多个成熟crRNA引导B-GEn.1或B-GEn.2多肽，以使得在DNA中产生两个或多个双链断裂(DSBs)。例如，B-GEn.1或B-GEn.2的一个优势是其可以只引入一个包含多个重复序列间隔区单元的pre-crRNA，其在引入后通过B-GEn.1或B-GEn.2加工，将其转化为靶向DNA上多个不同序列的活性重复序列间隔区单元。

在另一方面，本文提供了用于编辑或修饰细胞中多个位置的DNA的方法，该方法主要由以下步骤组成：i)将具有降低的内切核糖核酸酶活性的B-GEn.1或B-GEn.2多肽以多肽的形式或以编码B-GEn.1或B-GEn.2多肽的核酸的形式引入至细胞；ii)将包含两个或多个前体CRISPR RNA(pre-CRISPR RNA，pre-crRNA)、中间crRNA或成熟crRNA的单异源核酸以作为RNA的形式或以编码为DNA的形式并在一个或多个启动子的控制下引入，每个crRNA包含重复序列间隔区阵列，其中间隔区包含与DNA中的靶序列互补的核酸序列，且重复序列包含茎环结构，其中B-GEn.1或B-GEn.2多肽与单异源RNA的一个或多个区域结合，该单异源RNA具有降低或缺失的内切核糖核酸酶活性且由单异源核酸中的一个或多个间隔区序列引导时具有完整的核酸内切酶活性。

在一些实施方案中，单异源核酸中的pre-crRNA序列在特定的位置、方向、序列或特定的化学键连接在一起，以定向或差异调节B-GEn.1或B-GEn.2在由不同crRNA序列指明的每个位点的核酸内切酶活性。

在另一个方面，本文提供了用于编辑或修饰细胞中多个位置DNA的结构或功能的通用方法的实例，其主要由以下步骤组成：i)将RNA引导的核酸内切酶(如B-GEn.1或B-GEn.2)，以作为多肽的形式或以编码RNA引导的核酸内切酶的核酸的形式引入至细胞；和ii)将包含两个或多个向导RNA或编码两个或多个向导RNA的单异源核酸以作为RNA的形式或以编码为DNA的形式并在一个或多个启动子的控制下引入，其中RNA引导的核酸内切酶的活性或功能由单异源核酸中的向导RNA序列引导。

定义

术语“多核苷酸(polynucleotide)”和“核酸(nucleic acid)”在本文中可互换使用，是指任何长度的核苷酸的多聚形式，可以是核糖核苷酸或脱氧核糖核苷酸。因此，该术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体/三股螺旋体，或包括嘌呤和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。

“寡核苷酸(Oligonucleotide)”通常是指单链或双链DNA的介于大约5和大约100个核苷酸之间的多核苷酸。然而，为了本公开内容的目的，对寡核苷酸的长度没有上限。寡核苷酸也被称为“低聚物(oligomer)”或“寡核苷酸(oligo)”，并可从基因中分离，或通过本领域已知的方法化学合成。术语“多核苷酸”和“核酸”应理解为包括，当应用于所描述的实施方案，单链(例如正义或反义)和双链多核苷酸。

“基因组DNA(Genomic DNA)”是指生物体的基因组的DNA，其包括但不限于细菌、真菌、古细菌、原生生物、病毒、植物或动物基因组的DNA。

术语“操纵(manipulating)”DNA包括结合、切开(nicking)一条链或切割(cleaving)，例如剪切(cutting)两条DNA链；或包括修饰或编辑DNA或与DNA相关的多肽。操纵DNA可以沉默、激活或调节(无论增加或减少)RNA或DNA编码的多肽的表达，或防止或增强多肽与DNA的结合。

“茎环结构(stem-loop structure)”是指具有二级结构的核酸，该二级结构包括已知或预测形成双链(茎部分)的核苷酸区域，该双链在一侧由主要为单链核苷酸(环部分)的区域连接。术语“发夹(hairpin)”和“折回(fold-back)”结构在本文中还用于指茎环结构。这样的结构在本领域中是熟知的，且这些术语与它们在本领域的已知含义的使用一致。正如本领域所知，茎环结构不需要精确的碱基配对。因此，茎结构可包括一个或多个碱基错配。或者，碱基配对可为精确的，如，不包括任何错配。

“可杂交(hybridizable)”或“互补的(complementary)”或“基本上互补的(substantially complementary)”，是指核酸(如RNA或DNA)包含使其能够非共价结合的核苷酸序列，如形成沃森-克里克碱基对(Watson-Crick base pair)和/或G/U碱基对，在适当的体外和/或体内温度和溶液离子强度条件下以序列特异性、反向平行的方式(如，核酸特异性地与互补核酸结合)与另一个核酸的“退火(anneal)”或“杂交(hybridize)”。如本领域所知，标准的沃森-克里克碱基配对包括：腺嘌呤(A)与胸腺嘧啶(T)配对，腺嘌呤(A)与尿嘧啶(U)配对，鸟嘌呤(G)与胞嘧啶(C)配对[DNA,RNA]。此外，本领域还所熟知的，对于两个RNA分子(如dsRNA)之间的杂交，鸟嘌呤(G)碱基与尿嘧啶(U)配对。例如，G/U碱基对在tRNA反密码子与mRNA中的密码子碱基配对的情况下部分负责遗传密码的简并性(如，冗余性)。在本公开内容的上下文中，向导RNA分子的蛋白质结合区段(dsRNA双链体)的鸟嘌呤(G)被认为与尿嘧啶(U)互补，反之亦然。因此，当G/U碱基对可以在给定的核苷酸位置，即向导RNA分子的蛋白质结合区段(dsRNA双链体)上形成时，该位置不被认为是非互补的，而是被认为是互补的。

杂交和洗涤条件已被熟知且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring HarborLaboratory Press,Cold Spring Harbor(1989)，特别是其中第11章和表11.1；和Sambrook,J.and Russell,W.,Molecular Cloning:A Laboratory Manual,ThirdEdition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(2001)中举例说明。温度和离子强度的条件决定了杂交的“严格性”。

杂交要求两个核酸包含互补序列，尽管碱基之间可能错配。适于在两种核酸之间杂交的条件取决于核酸的长度和互补的程度，这是本领域所熟知的变量。两个核苷酸序列之间的互补程度越大，具有这些序列的杂交核酸的熔解温度(Tm)值越大。对于具有较短的互补段的核酸之间的杂交(例如互补性超过35或更少，30或更少，25或更少，22或更少，20或更少，或18或更少的核苷酸)，错配的位置变得重要(参见Sambrook等人，同上(supra)，11.7-11.8)。通常，杂交核酸的长度至少为10个核苷酸。可杂交核酸的示例性最小长度为:至少15个核苷酸；至少20个核苷酸；至少22个核苷酸；至少25个核苷酸；和至少30个核苷酸)。此外，技术人员将认识到，根据诸如互补区域的长度和互补程度等因素，如必要可调整温度和洗涤溶液的盐的浓度。

本领域中应当理解，多核苷酸的序列不需要与其靶核酸的序列100％互补才能特异性杂交。此外，多核苷酸可与一个或多个区段杂交，使得介入或邻近区段不参与杂交事件(例如，环结构或发夹结构)。多核苷酸可包含与它们所靶向的靶核酸序列内的靶区域至少70％、至少80％、至少90％、至少95％、至少99％或100％的序列互补性。例如，一种反义核酸，其中反义化合物的20个核苷酸中有18个与靶区域互补，并因此会特异性杂交，这表示90％的互补性。在这个实例中，剩余的非互补核苷酸与互补核苷酸可为成簇的或散布的，且非互补核苷酸不需要彼此连续或与互补核苷酸连续。在核酸内核酸序列的特定段之间的互补性百分比可以使用BLAST程序常规确定(基于局部序列比对算法的搜索工具)和本领域已知的PowerBLAST程序(Altschul等人,J.Mol.Biol.1990,215,403-410；Zhang and Madden,Genome Res.,1997,7,649-656)或使用Gap程序(Wisconsin Sequence Analysis Package,Version 8for Unix,Genetics Computer Group,University Research Park,MadisonWis.)，使用默认设置，其使用Smith和Waterman算法(Adv.Appl.Math.1981(2)482-489)。

术语“肽”、“多肽”和“蛋白质”在本文中可互换使用，且是指任何长度的氨基酸的聚合形式，其可包括编码和非编码氨基酸、化学或生物化学修饰或衍生的氨基酸，及具有修饰肽骨架的多肽。

本文所用的“结合”(如关于多肽的RNA结合结构域)是指大分子之间的非共价相互作用(如蛋白质和核酸之间)。当处于非共价相互作用状态时，大分子被称为“相关”或“相互作用”或“结合”(例如，当分子X被称为与分子Y相互作用时，这意味着分子X以非共价方式与分子Y结合)。并非结合相互作用的所有成分都需要序列特异性(如与DNA骨架中的磷酸残基接触)，但结合相互作用的某些部分可为序列特异性的。结合相互作用一般由解离常数(Kd)表征，其小于10^-6M、小于10^-7M、小于10^-8M、小于10^-9M、小于10^-10M、小于10^-11M、小于10^-12M、小于10^-13M、小于10^-14M或小于10^-15M。“亲和力”是指结合的强度，结合亲和力的增加与Kd的降低相关。

“结合结构域”是指能够与另一个分子非共价结合的蛋白质结构域。结合结构域可以与例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。对于蛋白质结构域结合蛋白，其可以与自身结合(以形成同型二聚体，同型三聚体等)和/或它可以结合一个或多个不同蛋白质的一个或多个分子。

术语“保守性氨基酸置换”是指具有相似侧链的氨基酸残基在蛋白质中的互换性。例如，一组具有脂肪族侧链的氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成；一组具有脂肪族羟基侧链的氨基酸由丝氨酸和苏氨酸组成；一组具有含酰胺侧链的氨基酸由天冬酰胺和谷氨酰胺组成；一组具有芳香族侧链的氨基酸由苯丙氨酸、酪氨酸和色氨酸组成；一组具有碱性侧链的氨基酸由赖氨酸、精氨酸和组氨酸组成；一组具有酸性侧链的氨基酸由谷氨酸和天冬氨酸组成；一组具有含硫侧链的氨基酸由半胱氨酸和蛋氨酸组成。典型的保守性氨基酸置换组有：缬氨酸-亮氨酸-异亮氨酸，苯丙氨酸-酪氨酸，赖氨酸-精氨酸，丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。

多核苷酸或多肽与另一个多核苷酸或多肽具有一定百分比的“序列同一性”，这意味着，当比对两个序列时，该百分比的碱基或氨基酸是相同的，且当比较所述两个序列时，位于相同的相对位置。序列同一性可以用许多不同的方式确定。为了确定序列的同一性，可以使用各种方法和计算机程序(如BLAST,T-COFFEE,MUSCLE,MAFFT等)对序列进行比对，这些程序可在万维网上的网站中获得，包括ncbi.nlm.nili.gov/BLAST,ebi.ac.uk/Tools/msa/tcoffee,ebi.Ac.Uk/Tools/msa/muscle,mafft.cbrc/alignment/software.参见如Altschul等人(1990),J.Mol.Biol.215:403-10。在本公开内容的一些实施方案中，根据本公开内容使用本领域的序列比对标准以确定与另一Cas9核酸内切酶中的氨基酸残基“对应”的B-GEn.1或B-GEn.2多肽或其变体中的氨基酸残基。与其他Cas9核酸内切酶的氨基酸残基相对应的B-GEn.1或B-GEn.2多肽或其变体的氨基酸残基在序列的比对中出现在相同的位置。

“编码”特定RNA的DNA序列是转录成RNA的DNA核酸序列。多聚脱氧核糖核苷酸可编码翻译成蛋白质的RNA(mRNA)，或者多聚脱氧核糖核苷酸可编码不翻译成蛋白质的RNA(如tRNA、rRNA或向导RNA；也称为“非编码”RNA或“ncRNA”)。“蛋白质编码序列”或编码特定蛋白质或多肽的序列是核酸序列，其转录为mRNA(在DNA的情况下)，并当将其置于适当的调节序列的控制下时在体外或体内被翻译成多肽(在mRNA的情况下)。编码序列的边界由5’端(N端)的起始密码子和3’端(C端)的翻译终止无义密码子决定。编码序列可以包括但不限于，原核或真核mRNA的cDNA，原核或真核DNA的基因组DNA序列，以及合成核酸。转录终止序列一般位于编码序列的3’处。

如本文所用，“启动子序列”或“启动子”是能够结合RNA聚合酶并启动下游(3’方向)编码或非编码序列转录的DNA调控区域。如本文所使用的，所述启动子序列的界限在其3’端的转录起始位点，并延伸至上游(5’方向)以包含在高于背景可检测水平上启动转录必要的最少数量的碱基或元件。在启动子序列内可发现转录起始位点，以及负责RNA聚合酶结合的蛋白质结合结构域。真核生物启动子通常，但并非总是，包含“TATA”盒和“CAAT”盒。各种启动子，包括诱导型启动子(inducible promoter)，可用于驱动本公开内容的各种载体。启动子可以是组成型激活启动子(constitutively active promoter)(如组成型地处于激活“开”状态的启动子)，其可为诱导型启动子(inducible promoter)(如其状态，激活/“开”或非激活/“关”的启动子，是由外部刺激控制，如特定温度、化合物或蛋白质的存在)，其可为空间限制性启动子(spatially restricted promoter)(如转录调控元件、增强子等)(如组织特异性启动子，细胞类型特异性启动子等)，且其可为时间限制性启动子(temporallyrestricted promoter)(如启动子在胚胎发育的特定阶段或在生物过程的特定阶段中，如小鼠的毛囊周期，处于“开”状态或“关”状态)。合适的启动子可源自病毒，且因此可称为病毒启动子，或者它们可源自任何生物体，包括原核生物或真核生物。合适的启动子可用于驱动任何RNA聚合酶的表达(如pol I、pol II、pol III)。典型的启动子包括但不限于SV40早期启动子(SV40 early promoter)、鼠乳腺肿瘤病毒长末端重复(mouse mammary tumorvirus long terminal repeat，LTR)启动子；腺病毒主要晚期启动子(adenovirus majorlate promoter，Ad MLP)；单纯疱疹病毒(herpes simplex virus，HSV)启动子，巨细胞病毒(cytomegalovirus，CMV)启动子，例如CMV立即早期启动子区(CMV immediate earlypromoter region，CMVIE)，劳斯肉瘤病毒(Rous sarcoma virus，RSV)启动子，人U6小核启动子(human U6 small nuclear promoter，U6)(Miyagishi等人,Nature Biotechnology20,497-500(2002))，增强型U6启动子(enhanced U6 promoter)(如Xia等人,NucleicAcids Res.2003Sep 1；31(17))，人H1启动子(human H1 promoter，H1)等。诱导型启动子的实例包括但不限于T7 RNA聚合酶启动子(T7 RNA polymerase promoter)、T3 RNA聚合酶启动子(T3 RNA polymerase promoter)、异丙基-β-D-硫代半乳糖苷(IPTG)调控启动子(isopropyl-beta-D-thiogalactopyranoside-regulated promoter)、乳糖诱导启动子(lactose induced promoter)、热休克启动子(heat shock promoter)、四环素调控启动子(Tetracycline-regulated promoter)、类固醇调控启动子(Steroid-regulatedpromoter)、金属调控启动子(Metal-regulated promoter)、雌激素受体调控启动子(estrogen receptor-regulated promoter)等。因此，诱导型启动子可以由分子调节，包括但不限于强力霉素(doxycycline)；RNA聚合酶，如T7 RNA聚合酶；雌激素受体(estrogenreceptor)；雌激素受体融合(estrogen receptor fusion)等。

在一些实施方案中，启动子是空间限制性启动子(如，细胞类型特异性启动子、组织特异性启动子等)，使得在多细胞生物体中，启动子在特定细胞的子集中是活跃的(如，“ON”)。空间限制性启动子也可称为增强子、转录调控元件、调控序列等。可使用任何合适的空间限制性启动子，且选择合适的启动子(如，脑特异性启动子、驱动在神经元子集中表达的启动子、驱动在生殖系中表达的启动子、驱动在肺中表达的启动子、驱动在肌肉中表达的启动子、驱动在胰腺胰岛细胞中表达的启动子等)将取决于生物体。例如，对于已知的植物、苍蝇、蠕虫、哺乳动物、小鼠等的各种空间限制性启动子。因此，空间限制性启动子根据生物体可用于调控编码位点特异性修饰酶的核酸在多种不同组织和细胞类型中的表达。一些空间限制性启动子也为时间限制性，使得启动子在胚胎发育的特定阶段或生物过程的特定阶段(如小鼠的毛囊周期)处于“开”状态或“关”状态。为了说明的目的，空间限制性启动子的实例包括，但不限于，神经元特异性启动子(neuron-specific promoter)、脂肪细胞特异性启动子(adipocyte-specific promoter)、心肌细胞特异性启动子(cardiomyocyte-specific promoter)、平滑肌特异性启动子(smooth muscle-specific promoter)、光感受器特异性启动子(photoreceptor-specific promoter)等。神经元特异性空间限制性启动子包括但不限于神经元特异性烯醇化酶(neuron-specific enolase，NSE)启动子(参见，如EMBL HSEN02,X51956)；芳香族氨基酸脱羧酶(aromatic amino acid decarboxylase，AADC)启动子；神经丝启动子(neurofilament promoter)(参见，如GenBank HUMNFL,L04147)；突触蛋白启动子(synapsin promoter)(参见，如GenBank HUMSYNIB,M55301)；thy-1启动子(参见，如Chen等人(1987)Cell 51:7-19；和Llewellyn等人(2010)Nat.Med.16(10):1161-1166)；血清素受体启动子(serotonin receptor promoter)(参见，如GenBankS62283)；酪氨酸羟化酶启动子(tyrosine hydroxylase promoter，TH)(参见，如Oh等人(2009)Gene Ther.16:437；Sasaoka等人(1992)Mol.Brain Res.16:274；Boundy等人(1998)J.Neurosci.18:9989；Kaneda等人(1991)Neuron:583-594)；GnRH启动子(参见，如Radovick等人(1991)Proc.Natl.Acad.Sci.USA 88:3402-3406)；L7启动子(参见，如Oberdick等人(1990)Science248:223-226)；DNMT启动子(参见，如Bartge等人(1988)Proc.Natl.Acad.Sci.USA 85:3648-3652)；脑啡肽启动子(enkephalin promoter)(参见，如Comb等人(1988)EMBO J.17:3793-3805)；髓磷脂碱性蛋白(myelin basic protein，MBP)启动子；Ca2+/钙调蛋白依赖激酶II-α(Ca²⁺-calmodulin-dependent protein kinase II-alpha，CaMKIM)启动子(参见，如Mayford等人(1996)Proc.Natl.Acad.Sci.USA 93:13250；和Casanova等人(2001)Genesis 31:37)；CMV增强子/血小板源性生长因子-p启动子(CMVenhancer/platelet-derived growth factor-ppromoter)(参见，如Liu等人(2004)GeneTherapy 11:52-60)等。

术语“DNA调控序列”、“控制元件”和“调控元件”在本文中可互换使用，是指转录和翻译控制序列，例如启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号等，其提供和/或调控非编码序列(如向导RNA)或编码序列(如B-GEn.1或B-GEn.2多肽或其变体)的转录和/或调控被编码的多肽的翻译。

本文中用于核酸、多肽、细胞或生物体的术语“天然存在的”或“未修饰的”是指在自然界中发现的核酸、多肽、细胞或生物体。例如，存在于生物体(包括病毒)中的多肽或多核苷酸序列，其可以从自然界的来源中分离出来，且没有在实验室中被人为修饰，是天然存在的。

本文中用于核酸或多肽的术语“嵌合的”是指由来自不同来源的结构组成的一个实体。例如，当在嵌合多肽(如嵌合B-GEn.1或B-GEn.2蛋白)的上下文中使用“嵌合的”时，嵌合多肽包括源自不同多肽的氨基酸序列。嵌合多肽可包括修饰的或天然存在的多肽序列(如来自修饰的或未修饰的B-GEn.1或B-GEn.2蛋白质的第一氨基酸序列；以及B-GEn.1或B-GEn.2蛋白质以外的第二氨基酸序列)。类似地，在编码嵌合多肽的多核苷酸的背景下的“嵌合的”包括源自不同编码区域的核苷酸序列(如编码修饰或未修饰B-GEn.1或B-GEn.2蛋白质的第一核苷酸序列；以及编码除B-GEn.1或B-GEn.2蛋白质以外的多肽的第二核苷酸序列)。

术语“嵌合多肽”是指非天然存在的多肽，如通过人为干预将两个或多个其他的分离的氨基酸区段人工组合(如“融合”)而制成。包含嵌合氨基酸序列的多肽是嵌合多肽。一些嵌合多肽可以称为“融合变体”。

如本文所使用的“异源的”，是指无法分别在天然核酸或蛋白质中发现的核酸或蛋白质。本文所描述的B-GEn.1或B-GEn.2融合蛋白可包含B-GEn.1或B-GEn.2多肽(或其变体)的RNA结合结构域，其与异源多肽序列(如，来自除B-GEn.1或B-GEn.2以外的蛋白质的多肽序列)融合。异源多肽可表现出活性(如酶活性)，B-GEn.1或B-GEn.2融合蛋白也表现出该活性(如甲基转移酶(methyltransferase)活性、乙酰转移酶(acetyltransferase)活性、激酶(kinase)活性、泛素化(ubiquitinating)活性等)。可将异源核酸连接至天然存在的核酸(或其变体)(如通过基因工程)以产生编码融合多肽的融合多核苷酸。在另一个实例，在B-GEn.1或B-GEn.2多肽融合变体中，B-GEn.1或B-GEn.2多肽变体可融合至异源多肽(如，除B-GEn.1或B-GEn.2以外的多肽)，其表现出B-GEn.1或B-GEn.2多肽融合变体所表现出的活性。异源核酸可连接至B-GEn.1或B-GEn.2多肽变体(如通过基因工程)以产生编码B-GEn.1或B-GEn.2多肽融合变体的多核苷酸。如本文所用的“异源的”，另外是指不是天然细胞的细胞中的核苷酸或多肽。

术语“同源物(cognate)”是指自然界中通常相互作用或共存的两种生物分子。

如本文所用的“重组”，是指特定核酸(DNA或RNA)或载体为克隆、限制、聚合酶链式反应(PCR)和/或连接的步骤的各种组合的产物，导致与自然系统中发现的内源性核酸区别的具有结构编码或非编码序列的构建体。编码多肽的DNA序列可以由cDNA片段或一系列合成的寡核苷酸组装而成，以提供能够在包含于细胞中的重组转录单元或无细胞的转录和翻译系统中表达的合成核酸。包含相关序列的基因组DNA也可以用于形成重组基因或转录单元。非翻译DNA序列可出现在开放阅读框的5’或3’处，其中这些序列不会干扰编码区的操纵或表达，并且可确实通过各种机制调节所需产物的产生(参见下文“DNA调控序列”)。此外或可选地，编码不翻译的RNA(如向导RNA)的DNA序列也可被认为是重组的。因此，如术语“重组”核酸是指非天然存在的核酸，如通过人为干预将两个其他的分离的序列区段人工组合而成。这种人工组合通常是通过化学合成方式，或通过人工操作分离的核酸区段来完成的，如通过基因工程技术。这样做通常是将密码子替换为编码相同氨基酸、保守氨基酸或非保守氨基酸的密码子。此外或可选地，将所期望的功能的核酸区段连接在一起以产生所期望的功能组合。这种人工组合通常是通过化学合成方式，或通过人工操作分离的核酸区段来完成的，例如通过基因工程技术。当重组多核苷酸编码多肽时，所编码多肽的序列可以是天然存在的(“野生型”)，或可以是天然存在序列的变体(如突变体)。因此，术语“重组”多肽不是必要的指其序列非天然存在的多肽。相反，“重组”多肽由重组DNA序列编码，但多肽的序列可以是天然存在的(“野生型”)或非天然存在的(如变体、突变体等)。因此，“重组”多肽是人为干预的结果，但也可为天然存在的氨基酸序列。术语“非天然存在的”包括与天然存在的对应物(counterpart)明显不同的分子，其包括化学修饰或突变的分子。

“载体”或“表达载体”是复制子，例如质粒(plasmid)、噬菌体(phage)、病毒(virus)或粘粒(cosmid)，可将另一DNA区段，如“插入体”，连接到载体或表达载体上从而在细胞中复制所连接的区段。

“表达盒”包括与启动子可操作地连接的DNA编码序列。“可操作地连接”是指并置(juxtaposition)，其中所述的组分处于允许它们以预期的方式发挥功能的关系中。例如，如果启动子影响其转录或表达，则该启动子可操作地连接至编码序列。术语“重组表达载体”或“DNA构建体”在本文中可互换地使用，是指包含载体和至少一个插入体的DNA分子。重组表达载体通常用于表达和/或繁殖(propagating)插入体的目的，或用于构建其他重组核苷酸序列。核酸可被或可不被可操作地连接到启动子序列，且可被或可不被可操作地连接到DNA调控序列。

如本文所用的术语“可操作地连接”，是指两个或多个元件之间的物理或功能连接，如，多肽序列或多核苷酸序列，其允许它们以其预期的方式操作。例如，在感兴趣的多核苷酸和调控序列(例如，启动子)之间的可操作地连接是允许感兴趣的多核苷酸表达的功能连接。从这个意义上来说，术语“可操作地连接”是指将调控区域与待转录的编码序列进行定位，使调控区域能够有效地调控感兴趣的编码序列的转录或翻译。在本文公开的一些实施方案中，术语“可操作地连接”是指将调控序列放置在相对于编码多肽或功能性RNA的序列的适当位置上的构象，使得控制序列指导或调节编码多肽的mRNA、多肽和/或功能性RNA的表达或细胞定位。因此，如果启动子能够介导核酸序列的转录，则该启动子与核酸序列处于可操作地连接。可操作地连接的元件可以是连续的，也可以是非连续的。

当外源DNA(如重组表达载体)被引入细胞内时，细胞已被“基因修饰”或“转化”或“转染”。外源DNA的存在导致永久或短暂的遗传改变。转化DNA可被也可不被整合(共价连接)至细胞的基因组中。

在例如原核生物、酵母和哺乳动物细胞中，转化DNA可维持在游离基因元件(episomal element)上，例如质粒。对于真核细胞，稳定转化的细胞是其中转化的DNA已经整合到染色体中的细胞，从而通过染色体复制被子细胞遗传。这种稳定性是通过真核细胞建立包括含有转化DNA的子细胞群的细胞系或克隆的能力来证明。“克隆”是源自单个细胞或共同祖先通过有丝分裂而产生的细胞群。“细胞系”是原代细胞能够在体外稳定生长许多代的克隆。

合适的基因修饰(也称为“转化”)的方法包括但不限于，如病毒或噬菌体感染、转染(transfection)、缀合(conjugation)、原生质体融合(protoplast fusion)、脂质体转染(lipofection)、电穿孔(electroporation)、磷酸钙沉淀(calcium phosphateprecipitation)、聚乙烯亚胺(PEI)介导的转染(polyethyleneimine-mediatedtransfection)、DEAE-葡聚糖介导的转染(DEAE-dextran mediated transfection)、脂质体介导的转染(liposome-mediated transfection)、粒子枪技术(particle guntechnology)、磷酸钙沉淀(calcium phosphate precipitation)、直接显微注射(directmicro injection)、纳米颗粒介导的核酸递送(nanoparticle-mediated nucleic aciddelivery)(参见，如，Panyam等人，Adv Drug Deliv Rev.2012年9月13日，pp:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。

如本文所使用的“宿主细胞”是指体内或体外真核细胞、原核细胞(如细菌或古细菌细胞)或作为单细胞实体培养的来自多细胞生物体(如细胞系)的细胞，其中真核细胞或原核细胞可以或已经被用作核酸的受体，且包括已被核酸转化的原始细胞的后代。应当理解的是，由于天然的、偶然的或故意的突变，单个细胞的后代可不必要在形态或基因组或总DNA互补性上与原始亲本完全相同。“重组宿主细胞”(也称为“基因修饰宿主细胞”)是已经引入异源核酸(如表达载体)的宿主细胞。例如，细菌宿主细胞是通过将外源性核酸(如质粒或重组表达载体)引入合适的细菌宿主细胞而成为基因修饰的细菌宿主细胞，和真核宿主细胞是通过将外源性核酸引入合适的真核宿主细胞而成为基因修饰的真核宿主细胞(如哺乳动物生殖细胞)。

本文使用的“靶DNA”是包含“靶位点”或“靶序列”的多聚脱氧核糖核苷酸。术语“靶位点”、“靶序列”、“靶原型间隔序列DNA”或“原型间隔样序列”在本文中可互换使用，是指存在于靶DNA中的核酸序列，只要提供足够的结合条件，向导RNA的DNA靶向区段(也称为“间隔区”)将与其结合。例如，靶DNA内的靶位点(或靶序列)5’-GAGCATATC-3’由RNA序列5’-GAGCATATC-3’靶向(或与之结合、杂交或互补)的。合适的DNA/RNA结合条件包括细胞中通常存在的生理条件。本领域已知的其他合适的DNA/RNA结合条件(如无细胞系统中的条件)；参见，如上所述的Sambrook。与向导RNA互补并杂交的靶DNA链被称为“互补链”，与“互补链”互补的靶DNA链(且因此不与向导RNA互补)被称为“非互补链”。

“位点特异性修饰酶”或“RNA结合位点特异性修饰酶”是指结合RNA并被靶向至特定DNA序列的多肽，例如B-GEn.1或B-GEn.2多肽。本文所述的位点特异性修饰酶通过其结合的RNA分子靶向于特定的DNA序列。RNA分子包括与靶DNA内的靶序列结合、杂交或互补的序列，因此将结合的多肽靶向至靶DNA内的特定位置(靶序列)。通过“切割”是指DNA分子共价骨架的断裂。切割可以通过多种方法启动，包括但不限于，磷酸二酯键的酶解或化学水解。单链切割和双链切割都是可能的，且双链切割可能是两个不同的单链切割事件的结果。DNA切割可以产生钝端或交错端。在某些实施方案中，包含向导RNA和位点特异性修饰酶的复合物用于靶向双链DNA切割。

“核酸酶”和“核酸内切酶”在本文中可互换使用，意指具有用于多核苷酸切割的具有内切核苷酸的催化活性的酶。

核酸酶的“切割结构域”或“活性结构域”或“核酸酶结构域”是指核酸酶内具有使DNA切割的催化活性的多肽序列或结构域。切割结构域可以包含在单个多肽链中，或者可以由两个(或更多)多肽的结合产生切割活性。在给定的多肽内，单个核酸酶结构域可由一个以上的氨基酸分离段组成。

“向导序列”或“DNA靶向区段”或“DNA靶向序列”或“间隔区”包括与靶DNA(靶DNA的互补链)，在本文指定为“原型间隔样”序列内的特定序列互补的核苷酸序列。蛋白质结合区段(或“蛋白质结合序列”)与位点特异性修饰酶相互作用。当位点特异性修饰酶是B-GEn.1或B-GEn.2或B-GEn.1或B-GEn.2相关的多肽时(在下文更详细地描述)，靶DNA的位点特异性切割发生在由以下两点决定的位置：(i)向导RNA和靶DNA之间的碱基配对互补性；(ii)靶DNA中的短基序(称为原型间隔相邻基序(PAM))。向导RNA的蛋白质结合区段部分包含两个互补的核苷酸段，其相互杂交以形成双链RNA双链体(dsRNA双链体)。在一些实施方案中，核酸(如，向导RNA，包含编码向导RNA的核苷酸序列的核酸；编码位点特异性修饰酶的核酸；等)包含提供额外所期望的特性的修饰或序列(如，修饰的或调控的稳定性；亚细胞靶向；追踪，如荧光标签；用于蛋白质或蛋白质复合物的结合位点；等)。非限定性实例包括：5’帽(如7-甲基鸟苷帽(7-methylguanylate cap，m7G))；3’多聚腺苷酸尾(如，3’poly(A)尾)；核糖开关序列(riboswitch sequence)(如允许调控的稳定性和/或调控的蛋白质和/或蛋白质复合物的可及性)；稳定性控制序列；形成dsRNA双链体的序列(如，发夹序列)；将RNA靶向至亚细胞位置(如细胞核、线粒体、叶绿体等)的修饰或序列；提供追踪的修饰或序列(如，对荧光分子的直接缀合、对有利于荧光检测的部分的缀合、允许荧光检测的序列等)；提供蛋白质结合位点的修饰或序列(如，作用于DNA的蛋白质，包括转录激活子、转录抑制子、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)；及其组合。

在一些实施方案中，向导RNA包括在5'或3'端提供上述任何特征的额外的区段。例如，合适的第三区段可包括5'帽(如7-甲基鸟苷帽(m7G)；3'多聚腺苷化尾(如，3’poly(A)尾)；核糖开关序列(如允许调控的稳定性和/或调控的蛋白质和/或蛋白质复合物的可及性)；稳定性控制序列；形成dsRNA双链体的序列(如，发夹序列)；将RNA靶向至亚细胞位置(如细胞核、线粒体、叶绿体等)的序列；提供追踪的修饰或序列(如，对荧光分子的直接缀合、对有利于荧光检测的部分的缀合、允许荧光检测的序列等)；提供蛋白质结合位点的修饰或序列(如，作用于DNA的蛋白质，包括转录激活子、转录抑制子、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)；及其组合。

向导RNA和位点特异性修饰酶，例如B-GEn.1或B-GEn.2多肽或其变体，其可形成核糖核蛋白复合物(如，通过非共价相互作用结合)。向导RNA通过包含与靶DNA序列互补的核苷酸序列来提供该复合体的靶向特异性。该复合物的位点特异性修饰酶提供核酸内切酶活性。换句话说，将位点特异性修饰酶借助其与向导RNA的蛋白结合区段相结合被引导至靶DNA序列(如，染色体核酸中的靶序列；染色体外核酸中的靶序列，如，游离核酸、微环等；线粒体核酸中的靶序列；叶绿体核酸中的靶序列；质粒中的靶序列；等)。RNA适配体(RNAaptamer)是本领域已知的，且通常是核糖开关的合成版本。术语“RNA适配体”和“核糖开关”在本文中可互换使用，以包括合成的和天然的核酸序列，其提供它们所属的RNA分子的结构的可诱导的调控(并因此提供特定序列的可用性)。RNA适配体通常包含折叠成特定结构(如发夹)的序列，其特异性地与特定药物(如小分子)结合。药物的结合引起RNA折叠的结构变化，其改变了适配体所属的核酸的特征。作为非限定性实例：(i)具有适配体的激活物RNA可能无法与同源靶RNA结合，除非适配体被适当的药物结合；(ii)具有适配体的靶RNA可能无法与同源激活物RNA结合，除非适配体被适当的药物结合；(iii)靶RNA和激活物RNA，其各自包含结合不同药物的不同适配体，除非两种药物都存在，否则可能无法相互结合。如这些实例所说明的，双分子向导RNA可以被设计成可诱导的。

适配体和核糖开关的实例可见于，例如：Nakamura等人,Genes Cells.2012May；17(5):344-64；Vavalle等人,Future Cardiol.2012 May；8(3):371-82；Citarta等人,Biosens Bioelectron.2012 Apr 15；34(1):1-11；和Liberman等人,Wiley lnterdiscipRev RNA.2012 May-Jun；3(3):369-84；所有这些通过引用以其整体内容并入本文。

遗传修饰方法的选择通常取决于被转化细胞的类型和发生转化的环境(如，在体外、离体或体内)。关于这些方法的常规讨论可见于Ausubel,等人,Short Protocols inMolecular Biology，第三版，Wiley&Sons,1995。

适配体和核糖开关的实例可见于，例如：Nakamura等人,Genes Cells.2012 May；17(5):344-64；Vavalle等人,Future Cardiol.2012 May；8(3):371-82；Citarta等人,Biosens Bioelectron.2012 Apr 15；34(1):1-11；和Liberman等人,Wiley lnterdiscipRev RNA.2012 May-Jun；3(3):369-84；所有这些通过引用以其整体内容并入本文。

本文所使用的术语“干细胞”是指具有自我更新和产生分化细胞类型的能力的细胞(如植物干细胞、脊椎动物干细胞)(参见Morrison等人(1997)Cell 88:287-298)。在细胞个体发生学的上下文中，形容词“分化的(differentiated)”或“分化的(differentiating)”是一个相对术语。“分化的细胞”是在发育途径中与相比的细胞发展更深的细胞。因此，多能干细胞(如下所述)可以分化为谱系限制的祖细胞(如中胚层干细胞(mesodermal stem cells))，其又可以分化为进一步限制的细胞(如神经元祖细胞)，其可以分化为末期细胞(如分化末期细胞，如神经元、心肌细胞等)，其在某种组织类型中起着特征性的作用，且可或可不保留进一步增殖的能力。干细胞的特征可存在特异性标记物(如蛋白质、RNA等)，也可不存在特异性标记物。干细胞也可通过体外和体内的功能性试验来识别，特别的与干细胞产生多分化后代的能力有关的试验。

感兴趣的干细胞包括多能干细胞(PSCs)。术语“多能干细胞”或“PSC”在本文中用于是指能够产生生物体的所有细胞类型的干细胞。因此，PSC可以产生生物体所有胚层的细胞(如脊椎动物的内胚层、中胚层和外胚层)。多能细胞能够形成畸胎瘤，并在生物体中形成外胚层、中胚层或内胚层组织。植物的多能干细胞能够产生植物的所有细胞类型(如根、茎、叶等的细胞)。

动物的PSCs可以通过许多不同的方式获得。例如，胚胎干细胞(ESCs)是来源于胚胎的内部细胞团(Thomson等人,Science.1998年11月6日；282(5391):1145-7)，然而诱导多能干细胞(iPSCs)来源于体细胞(Takahash等人,Cell.2007年11月30日；131(5):861-72；Takahashi等人,Nat Protoc.2007；2(12):3081-9；Yu等人,Science.2007年12月21日；318(5858):1917-20.Epub 2007年11月20日)。

因为术语PSC是指多能干细胞(不考虑其来源)，因此术语PSC包括术语ESC和iPSC，以及术语胚胎生殖干细胞(embryonic germ stemcells，EGSC)，其是PSC的另一个实例。PSC可为已建立的细胞系的形式，它们可直接从原代胚胎组织中获得，或它们可来自体细胞。PSC可以是本文所述方法的靶细胞。

“胚胎干细胞”(ESC)是指从胚胎中分离出来的PSC，通常从囊胚的内细胞群中分离出来。ESC细胞系已在NIH Human Embryonic Stem Cell Registry中列出，如hESBGN-01、hESBGN-02、hESBGN-03、hESBGN-04(BresaGen,Inc.)；HES-1、HES-2、HES-3、HES-4、HES-5、HES-6(ES Cell International)；MizMedi(MizMedi Hospital-Seoul NationalUniversity)；HSF-1、HSF-6(University of California at San Francisco)；H1、H7、H9、H13、H14(Wisconsin Alumni Research Foundation(WiCell Research Institute))。感兴趣的干细胞还包括来自其他灵长类动物的胚胎干细胞，例如恒河猴(Rhesus)干细胞和狨猴(marmoset)干细胞。所述干细胞可从任何哺乳动物物种获得，如人、马(equine)、牛(bovine)、猪(porcine)、犬(canine)、猫(feline)、啮齿动物(rodent)，如小鼠、大鼠、仓鼠(hamster)、灵长类动物等(Thomson等人(1998)Science 282:1145；Thomson等人(1995)Proc.Natl.Acad.Sci.USA 92:7844；Thomson等人(1996)Biol.Reprod.55:254；Shamblott等人,Proc.Natl.Acad.Sci.USA 95:13726,1998)。在培养中，ESC通常生长为扁平的菌落，具有较大的核质比，明确的边界和突出的核仁。此外，ESC表达SSEA-3、SSEA-4、TRA-1-60、TRA-1-81和碱性磷酸酶，但不表达SSEA-1。生成和表征ESC的方法实例可参见例如US专利号7,029,913、US专利号5,843,780和US专利号6,200,806，其公开的内容通过引用并入本文。未分化形式的hESC的增殖方法记载于WO 99/20741、WO 01/51616和WO 03/020920。“胚胎生殖干细胞”(EGSC)或“胚胎生殖细胞”或“EG细胞”是指源自生殖细胞和/或生殖细胞祖细胞的PSC，如原始生殖细胞，如那些将成为精子和卵子的生殖细胞。胚胎生殖细胞(EG细胞)被认为具有类似于上述胚胎干细胞的特性。产生和表征EG细胞的方法的实例可参见，例如，US专利号7,153,684；Matsui,Y.,等人，(1992)Cell 70:841；Shamblott,M.,等人(2001)Proc.Natl.Acad.Sci.USA 98:113；Shamblott,M.,等人(1998)Proc.Natl.Acad.Sci.USA,95:13726；和Koshimizu,U.,等人(1996)Development,122:1235，其公开内容通过引用并入本文。

“诱导多能干细胞”或“iPSC”是指从非PSC细胞衍生的PSC(如，从相对于PSC分化的细胞衍生的PSC)。多能干细胞可以来源于多种不同的细胞类型，包括终末分化细胞。iPSC具有ES细胞样的形态，生长为扁平的菌落，核质比大，边界明确，细胞核突出。此外，iPSCs表达本领域技术人员已知的一种或多种关键多能性标记物，包括但不限于碱性磷酸酶、SSEA3、SSEA4、Sox2、Oct3/4、Nanog、TRA160、TRA181、TDGF 1、Dnmt3b、Fox03、GDF3、Cyp26al、TERT和zfp42。

生成和表征iPSC的方法实例可参见，例如，US专利公开号US20090047263、US20090068742、US20090191159、US20090227032、US20090246875和US20090304646，其公开内容通过引用纳入本文。通常，为了生成iPSCs，需要为体细胞提供本领域已知的重编程因子(如Oct4、SOX2、KLF4、MYC、Nanog、Lin28等)，对体细胞进行重编程，使其成为多能干细胞。

“体细胞”是指在没有实验操作的情况下，生物体中通常不会产生生物体中所有类型细胞的任何细胞。换句话说，体细胞是已经充分分化的细胞，它们不会自然地产生身体所有三个胚层的细胞，例如外胚层、中胚层和内胚层。例如，体细胞可包括神经元和神经祖细胞，后者可能够自然地产生中枢神经系统的所有或某些细胞类型，但不能产生中胚层或内胚层细胞系。

“有丝分裂细胞”是指正在进行有丝分裂的细胞。

“有丝分裂后细胞”指的是已经退出有丝分裂的细胞，如，它是“静止的”，如，它不再进行分裂。这种静止状态可为暂时的，如可逆的，或其可为永久的。

“减数分裂细胞”是指正在进行减数分裂的细胞。

“重组”是指两个多核苷酸之间交换遗传信息的过程。如本文所用，“同源定向修复(HDR)”是指，例如，在细胞内双链断裂的修复过程中发生的特殊形式的DNA修复。这一过程需要核苷酸序列同源性，使用“供体”分子对“靶标”分子(如，经历双链断裂的分子)进行模板修复，并导致遗传信息从供体转移到靶标。如果供体多核苷酸与靶标分子不同，并且供体多核苷酸的部分或全部序列被并入靶DNA中，则同源定向修复可能导致靶标分子序列的改变(如插入、删除、突变)。在一些实施方案中，供体多核苷酸、部分供体多核苷酸、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合到靶DNA中。

“非同源末端连接(NHEJ)”指的是DNA双链断裂的修复，通过将断裂末端直接连接在一起，而不需要同源模板(与同源定向修复相反，同源定向修复需要同源序列指导修复)。NHEJ通常导致双链断裂位点附近的核苷酸序列的丢失(缺失)。

术语“治疗(treatment)”、“治疗(treating)”等在本文中使用，通常是指获得所需的药理学和/或生理学效果。对于完全或部分预防疾病或其症状，所述效果可为预防性，和/或对于部分或完全治愈疾病和/或归因于该疾病的不良影响，所述效果可为治疗性。本文所用的“治疗”涵盖对哺乳动物中的疾病或症状的任何治疗，并包括：(a)预防疾病或症状在可能倾向于获得该疾病或症状但尚未被诊断为患有该疾病或症状的受试者中发生；(b)抑制疾病或症状，如阻止其发展；或(c)缓解疾病，如，使疾病消退。治疗剂可以在疾病或损伤发作之前、期间或之后给药。特别感兴趣的是对持续疾病的治疗，其中所述治疗稳定或减少受试者的不良临床症状。这样的治疗应在受影响组织的功能完全丧失之前进行。所述治疗将在疾病的症状阶段期间给药，且在某些情况下在疾病的症状阶段之后给药。

术语“个体”、“受试者”、“宿主”和“患者”在本文中可互换使用，并且是指希望对其进行诊断、治疗(treatment)或治疗(therapy)的任何哺乳动物受试者，特别是人类。

分子和细胞生物化学的一般方法可参见这样的标准教科书，如MolecularCloning:A Laboratory Manual,第三版(Sambrook等人,Harbor Laboratory Press2001)；Short Protocols in Molecular Biology,第四版(Ausubel等人编辑，John Wiley&Sons 1999)；Protein Methods(Bollag等人,John Wiley&Sons 1996)；Nonviral Vectorsfor Gene Therapy(Wagner等人编辑,Academic Press 1999)；Viral Vectors(Kaplift&Loewy编辑,Academic Press 1995)；Immunology Methods Manual(1.Lefkovits编辑,Academic Press 1997)；和Cell and Tissue Culture:Laboratory Procedures inBiotechnology(Doyle&Griffiths,John Wiley&Sons 1998)，其公开内容通过引用并入本文。

在提供数值范围的情况下，应当理解，除非上下文明确另有规定，否则在该范围的上限和下限之间的每个中间值，直至下限的十分之一单位，以及任何其他规定的或在该规定的范围内的中间值，都包括在本公开内容中。这些较小范围的上限和下限可以独立地包括在该较小范围中，并且也包括在本公开内容中，受制于规定的范围内任何特定的不包括的界限。在规定的范围包括所述界限中的一个或两个的情况下，不包括所述界限中的一个或两个的范围也包括在本公开内容中。

短语“基本上由…组成”在本文中意指不包括任何不是系统特定活性的一个成分或多个成分，或不是分子特定活性的一个部分或多个部分。

本文中出现的某些范围，具有前面加上术语“约”的数值。术语“约”在本文中用于为其前面的确切数字以及接近或近似于该术语前面的数字提供书面支持。在确定数字是否接近或近似于具体列举的数字时，接近或近似的未列举的数字可为在其出现的上下文中提供与具体列举的数字实质相等的数字。

应当理解，本公开内容的某些特征，为清楚起见，在分别的实施方案的上下文中描述，也可组合在单个实施方案中提供。相反，本公开内容的各种特征，为简短起见，在单一实施方案的上下文中描述，也可单独提供或以任何合适的子组合提供。本公开内容明确地包含与本公开内容有关的实施方案的所有组合，并且在本文中公开，正如每个和每个组合都单独且明确地公开。此外，各种实施方案及其元素的所有子组合也被本公开内容明确地包含，并且在本文中公开，正如在本文中单独和明确地公开了每个和每个这样的子组合。

B-GEn.1或B-GEn.2融合多肽

B-GEn.1或B-GEn.2可以用来形成与B-GEn.1或B-GEn.2核酸酶相比具有额外结构域和活性的融合蛋白。通过一种非限制性的说明，Fokl结构域可以与B-GEn.1或B-GEn.2多肽或其变体融合，其可以包含催化活性核酸内切酶结构域，或Fokl结构域可以与B-GEn.1或B-GEn.2多肽或其变体融合，其已被修饰以使B-GEn.1或B-GEn.2核酸内切酶结构域无活性。其他可以与B-GEn.1或B-GEn.2融合形成融合蛋白的结构域包括转录调节剂、表观遗传修饰剂、标签和其他标记或显像剂、组蛋白和/或本领域已知的调节或修饰基因序列的结构或活性的其他模式。

在一些实施方案中，本文所述的B-GEn.1或B-GEn.2多肽或其变体融合为转录激活剂或抑制剂，或表观遗传修饰剂，例如甲基化酶、去甲基化酶、乙酰化酶或去乙酰化酶。

在一些实施方案中，本文所述的B-GEn.1或B-GEn.2多肽或其变体融合成功能性蛋白质组分，用于检测、分子间相互作用、翻译激活、修饰或本领域已知的任何其他操纵方法。

B-GEn.1或B-GEn.2变体多肽的示例

在一些实施方案中，本文所述的B-GEn.1或B-GEn.2多肽或其变体保留了a)与靶位点结合的能力，可选地，b)保留其活性。在一些实施方案中，所保留的活性是核酸内切酶活性。在某些实施方案中，内切酶活性不需要tracrRNA。

在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体的活性部分被修饰。在一些实施方案中，所述修饰包括减少或增加B-GEn.1或B-GEn.2多肽或其变体的核酸酶活性的氨基酸改变(如缺失、插入或替换)。例如，在一些实施方案中，修饰后的B-GEn.1或B-GEn.2多肽或其变体具有少于50％、少于40％、少于30％、少于20％、少于10％、少于5％或少于1％的相应未修饰B-GEn.1或B-GEn.2多肽或其变体的核酸酶活性。在一些实施方案中，修饰后的B-GEn.1或B-GEn.2多肽或其变体没有实质性核酸酶活性。在一些实施方案中，它可具有50％、2倍、4倍或多达10倍以上的核酸酶活性。

在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体的活性部分包含具有DNA修饰活性和/或转录因子活性和/或DNA相关多肽修饰活性的异源多肽。在一些实施方案中，异源多肽替代了提供核酸酶活性的B-GEn.1或B-GEn.2多肽或其变体的部分。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体包含通常提供核酸酶活性的B-GEn.1或B-GEn.2多肽或其变体的部分(且该部分可以被完全激活或可以代替地被修饰为具有少于100％的相应未修饰活性)和异源多肽。换句话说，在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体可以是包含通常提供核酸酶活性的部分的B-GEn.1或B-GEn.2多肽或其变体的部分和异源多肽的融合多肽。

例如，在B-GEn.1或B-GEn.2融合蛋白中，B-GEn.1或B-GEn.2多肽或其变体可融合至异源多肽序列(如，源自除B-GEn.1或B-GEn.2以外蛋白质的多肽序列)。所述异源多肽序列可表现出活性(如酶活性)，其也由B-GEn.1或B-GEn.2融合蛋白表现出来(如甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。异源核酸序列可被连接至另一核酸序列(如，通过基因工程)以产生编码融合多肽的融合核苷酸序列。在一些实施方案中，B-GEn.1或B-GEn.2融合多肽是由B-GEn.1或B-GEn.2多肽或其变体与具有提供亚细胞定位(如，用于靶向细胞核的核定位信号(NLS)；用于靶向线粒体的线粒体定位信号；靶向叶绿体的叶绿体定位信号；ER滞留信号；等)的异源序列融合产生的。在一些实施方案中，异源序列可提供易于追踪或纯化的标签(如荧光蛋白，如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等；HIS标签，如6XHis标签；血凝素(hemagglutinin，HA)标签；FLAG标签；Myc标签；等)。在一些实施方案中，异源序列可提供增加或减少的稳定性。在一些实施方案中，异源序列可提供结合结构域(如提供B-GEn.1或B-GEn.2融合多肽结合到另一个感兴趣的蛋白质(如DNA或组蛋白修饰蛋白，转录因子或转录抑制子，募集蛋白等)，或感兴趣的核苷酸(如核酸结合蛋白的适配体或靶位)的能力)。

在一些实施方案中，根据任何本文所述的B-GEn.1或B-GEn.2多肽变体，所述B-GEn.1或B-GEn.2多肽变体降低了脱氧核糖核酸酶活性。例如，适合用于本公开内容的转录调节方法的B-GEn.1或B-GEn.2多肽变体表现出少于约20％、少于约15％、少于约10％、少于约5％、少于约1％或少于约0.1％的未修饰B-GEn.1或B-GEn.2多肽的内脱氧核糖核酸酶活性。

在一些实施方案中，B-GEn.1或B-GEn.2多肽变体实质上没有可检测到的脱氧核糖核酸酶活性(dB-GEn.1或B-GEn.2)。在一些实施方案中，当B-GEn.1或B-GEn.2多肽变体具有降低的催化活性时，只要多肽保留与向导RNA相互作用的能力，所述多肽仍然可以以位点特异性的方式与靶DNA结合(因为其仍然被向导RNA引导至靶DNA序列)。在一些实施方案中，B-GEn.1或B-GEn.2多肽变体是切口酶(nickase)，其可以切割靶DNA的互补链，但具有降低的切割靶DNA的非互补链的能力。

在一些实施方案中，在切口酶中的B-GEn.1或B-GEn.2多肽变体可切割靶DNA的非互补链，但具有降低的切割靶DNA的互补链的能力。

在一些实施方案中，B-GEn.1或B-GEn.2多肽变体具有降低的切割靶DNA的互补链和非互补链的能力。例如，预期的丙氨酸替代。

在一些实施方案中，B-GEn.1或B-GEn.2多肽变体是融合多肽(“B-GEn.1或B-GEn.2融合多肽变体”)，如，包含：i)B-GEn.1或B-GEn.2多肽变体；ii)共价连接的异源多肽(也称为“融合伙伴”)的融合多肽。

异源多肽序列可表现出活性(如酶促活性)，其也由B-GEn.1或B-GEn.2融合蛋白变体表现出来(如甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。异源核酸序列可被连接至另一核酸序列(如，通过基因工程)以产生编码融合多肽的融合核苷酸序列。在一些实施方案中，B-GEn.1或B-GEn.2融合多肽变体是由B-GEn.1或B-GEn.2多肽变体与具有提供亚细胞定位(如，异源序列为亚细胞定位序列，如用于靶向细胞核的核定位信号(NLS)；用于靶向线粒体的线粒体定位信号；靶向叶绿体的叶绿体定位信号；ER滞留信号；等)的异源序列融合产生的。在一些实施方案中，异源序列可提供易于追踪和/或纯化的标签(如，异源序列为可检测的标记)(如荧光蛋白，如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等；组氨酸标签，如6XHis标签；血凝素(hemagglutinin，HA)标签；FLAG标签；Myc标签；等)。在一些实施方案中，异源序列可提供增加或减少的稳定性(如，外源序列是稳定性控制肽，如降解决定子(degron)，其在一些情况下是可控的(如，温度敏感或药物可控的降解决定子序列，参见下文)。在一些实施方案中，异源序列可以提供增加或减少的来自靶DNA的转录(如，外源序列是转录调节序列，如转录因子/激活因子或其片段，募集转录因子/激活因子的蛋白质或其片段，转录抑制子或其片段，募集转录抑制子的蛋白质或其片段，小分子/药物反应性转录调节因子等)。在一些实施方案中，异源序列可提供结合结构域(如外源序列为蛋白质结合序列，如提供dB-GEn.1或B-GEn.2融合多肽结合到另一个感兴趣的蛋白质(如DNA或组蛋白修饰蛋白，转录因子或转录抑制子，募集蛋白等)的能力)。

合适的提供增加或降低稳定性的融合伙伴包括，但不限于，降解决定子序列。本领域技术人员容易理解，降解决定子是控制其所属的蛋白质稳定性的氨基酸序列。例如，包含降解决定子序列的蛋白质的稳定性至少部分地由降解决定子序列控制。在一些实施方案中，合适的降解决定子是组成型的，使得该降解决定子对蛋白质稳定性施加其独立于实验控制的影响(如，降解决定子不是药物诱导的、温度诱导的，等)。在一些实施方案中，降解决定子为B-GEn.1或B-GEn.2多肽变体提供具有可控的稳定性，使得B-GEn.1或B-GEn.2多肽变体可以根据所需的条件“打开”(如，稳定)或“关闭”(如，不稳定，降解)。例如，如果降解决定子是温度敏感的降解决定子，B-GEn.1或B-GEn.2多肽变体可在阈值温度以下(如42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃等)具有功能的(如“开”，稳定的)，但在阈值温度以上是不具有功能的(如“关”，降解的)。作为另一个实例，如果降解决定子是药物诱导的降解决定子，药物的存在或不存在可以将蛋白质从“关”(如，不稳定)状态切换到“开”(如，稳定)状态，反之亦然。药物诱导的降解决定子的实例是源自FKBP12蛋白。降解决定子的稳定性是由与降解决定子结合的小分子的存在与否来控制的。

合适的降解决定子的实例包括，但不限于，由Shield-1、DHFR、植物生长素(auxin)和/或温度控制的降解决定子。合适的降解决定子的非限制性实例是本领域已知的(如，Dohmen等人,Science,1994.263(5151):p.1273-1276:Heat-inducibledegron:a methodfor constructing temperature-sensitive mutants；Schoeber等人,Am J PhysiolRenal Physiol.2009年1月；296(1):F204-11:Conditional fast expression andfunction of multimeric TRPV5 channels using Shield-1；Chu等人,Bioorg Med ChemLett.2008年11月15日；18(22):5941-4:Recent progress with FKBP-deriveddestabilizing domains；Kanemaki,Pflugers Arch.2012年12月28日:Frontiers ofprotein expression control with conditional degrons；Yang等人,Mol Cell.2012Nov30；48(4):487-8:Titivated for destruction:the methyl degron；Barbour等人,BiosciRep.2013年1月18日；33(1).:Characterization of the bipartite degron thatregulates ubiquitin-independent degradation of thymidylate synthase；以及Greussing等人,J Vis Exp.2012年11月10日；(69):Monitoring of ubiquitin-proteasome activity in living cells using a Degron(dgn)-destabilized greenfluorescent protein(GFP)-based reporter protein；其通过引用以其整体内容并入本文)。

降解决定子序列的示例已在细胞和动物中都得到了很好的表征和试验。因此，将B-GEn.1或B-GEn.2与降解决定子序列融合产生“可调谐的(tunable)”和“可诱导的”B-GEn.1或B-GEn.2多肽。本文所述的任何融合伙伴均可用于任何所需的组合。作为一个非限制性实例来说明这一点，B-GEn.1或B-GEn.2融合蛋白可以包含用于检测的YFP序列、用于稳定性的降解决定子序列和用于增加靶DNA转录的转录激活子序列。此外，B-GEn.1或B-GEn.2融合蛋白中可以使用的融合伙伴的数量是没有限制的。在一些实施方案中，B-GEn.1或B-GEn.2融合蛋白包含一个或多个(如两个或多个、三个或多个、四个或多个、或五个或多个)异源序列。

合适的融合伙伴包括，但不限于，提供甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、去乙酰化酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酰化活性、脱腺苷化活性、SUMO化修饰活性、去SUMO化修饰活性、核糖基化活性、去核糖基化活性、巴豆酰化活性、去巴豆酰化活性、丙酰化活性、去丙酰化活性、豆蔻酰化活性或肉豆蔻酰化活性的多肽，其中任何活性均可被指导至直接修饰DNA(如，DNA甲基化)或修饰DNA相关多肽(如，组蛋白或DNA结合蛋白)。进一步合适的融合伙伴包括但不限于边界元件(如CTCF)、提供外周募集的蛋白质及其片段(如核纤层蛋白A(Lamin A)、核纤层蛋白B(LaminB)等)和蛋白质对接元件(如FKBP/FRB、Pil 1/Aby 1等)。

B-GEn.1或B-GEn.2多肽或其变体也可根据重组合成的常规方法分离和纯化。可以制备表达宿主的裂解物，并使用HPLC、排阻色谱法(exclusion chromatography)、凝胶电泳(gel electrophoresis)、亲和层析(affinity chromatography)或其他纯化技术纯化裂解物。对于大多数情况，所使用的组合物将包括至少20％重量的所需产物，至少约75％重量，至少约95％重量，且对于治疗目的，通常至少99.5％重量，其涉及产物制备方法及其纯化相关的污染物。通常，百分比基于总蛋白质。为了诱导DNA切割和重组，或对靶DNA进行任何所需的修饰，或对与靶DNA相关的多肽进行任何所需的修饰，向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸，无论是作为核酸或多肽引入，被提供给细胞约30分钟至约24小时，如1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、5小时、6小时、7小时、8小时、12小时、16小时、18个小时、20小时，或任何其他从约30分钟到约24小时的时间段，其可以约每天至约每4天的频率重复，如，每1.5天、每2天、每3天，或任何其他约每天至约每四天的频率。可将试剂提供给细胞一次或多次，如一次、两次、三次或三次以上，且在每次接触事件(如16-24小时)之后，可将细胞与试剂一起孵育一段时间，之后将培养基替换为新鲜培养基并进一步培养细胞。在向细胞提供两种或两种以上不同的靶向复合物的情况下(如，在与相同或不同的靶DNA内与不同序列互补的两种不同的向导RNA)，可同时提供复合物(如，作为两种多肽和/或核酸)，或同时递送。或者，可连续地提供它们，如，首先提供靶复合物，然后提供第二靶复合物，等，或反之亦然。

核酸

向导RNA/sgRNA

在一些实施方案中所述的系统、组合物和方法使用可以指导相关多肽(如B-GEn.1或B-GEn.2多肽或其变体)活性的基因组靶向核酸至靶核酸内的特定靶序列。在一些实施方案中，基因组靶向核酸是RNA。基因组靶向RNA在本文中称为“向导RNA”或“gRNA”。向导RNA具有至少可与感兴趣的靶核酸序列和CRISPR重复序列杂交的间隔区序列(这样的CRISPR重复序列也称为“tracr伴侣序列”)。在II型系统中，gRNA也有第二RNA，称为tracrRNA序列。在II型向导RNA(gRNA)中，CRISPR重复序列和tracrRNA序列相互杂交以形成双链体。在V型向导RNA(gRNA)中，crRNA形成双链体。在这两种系统中，双链体与位点特异性多肽结合，使得向导RNA和位点指导多肽形成复合物。基因组靶向核酸凭借其与位点特异性多肽的关联为该复合体提供了靶向特异性。基因组靶向核酸因此指导位点特异性多肽的活性。

在一些实施方案中，基因组靶向核酸是双分子向导RNA。在一些实施方案中，基因组靶向核酸是单分子向导RNA或单向导RNA(sgRNA)。双分子向导RNA有两条RNA链。第一条链在5’到3’方向上，有可选的间隔区延伸序列，间隔区序列和最小的CRISPR重复序列。第二条链具有最小的tracrRNA序列(与最小的CRISPR重复序列互补)、3’tracrRNA序列和可选的tracrRNA延伸序列。II型系统中的单分子向导RNA(sgRNA)在5’到3’方向上有可选的间隔区延伸序列、间隔区序列、最小的CRISPR重复序列、单分子向导接头、最小的tracrRNA序列、3’tracrRNA序列和可选的tracrRNA延伸序列。可选的tracrRNA延伸可具有为向导RNA提供额外功能(如，稳定性)的元件。单分子引导接头将最小的CRISPR重复序列和最小的tracrRNA序列连接起来，形成发夹结构。可选的tracrRNA延伸有一个或多个发夹。

V型系统中的单分子向导RNA(sgRNA)在5’到3’方向上有最小的CRISPR重复序列和间隔区序列。或者，V型系统中的单分子向导RNA(sgRNA)在5’到3’方向上具有可选的tracr延伸序列、tracr RNA序列、单分子向导接头、最小的CRISPR重复序列、间隔区序列和可选的间隔区延伸序列。

或者，V型系统中的单分子向导RNA(sgRNA)在5’到3’方向上有可选的延伸序列、最小的CRISPR重复序列、间隔区序列和可选的间隔区延伸序列。

在另一种替代方案中，V型系统中的单分子向导RNA(sgRNA)在5’至3’方向上包括可选的延伸序列、人工核酸酶结合RNA序列和间隔区序列，及可选的间隔区延伸序列。

根据本发明的对于所述CRISPR Cas核酸酶及对于潜在的其他V型CRISPR Cas核酸酶特别有用的sgRNA，是SEQ ID Nos:40-44中公开的序列。

SEQ ID NO:40 B-GEn.1-sgRNA_v4

SEQ ID NO 41 B-GEn.1-sgRNA_v4.2

SEQ ID NO 42 B-GEn.1-sgRNA_v4.3

SEQ ID NO 43 B-GEn.1-sgRNA_v4.4

SEQ ID NO 44 B-GEn.1-sgRNA_v4.5

这些允许在它们的3’端添加合适的靶向特定序列。

例如，在WO2018002719中描述了示例的基因组靶向核酸。通常，CRISPR重复序列包括与tracr序列具有足够的互补性以促进以下一种或多种情况的任何序列：(1)在含有相应的tracr序列的细胞中切除CRISPR重复序列侧翼的DNA靶向区段；和(2)在靶序列处形成CRISPR复合物，其中所述CRISPR复合物包含与tracr序列杂交的CRISPR重复序列。通常，互补程度是指CRISPR重复序列和tracr序列沿两个序列中较短的长度的最佳比对。最佳比对可由任何合适的比对算法确定，且可进一步考虑二级结构，例如在tracr序列或CRISPR重复序列内的自互补性。在一些实施方案中，当tracr序列与CRISPR重复序列在最佳比对时，沿着两者中较短的30个核苷酸长度之间的互补程度约为或大于25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％或更高。在一些实施方案中，tracr序列的长度约为或多于5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。在一些实施方案中，tracr序列和CRISPR重复序列包含在单个转录物中，使两者之间的杂交产生具有二级结构的转录物，例如发夹。在一些实施方案中，转录物或转录的多核苷酸序列具有至少两个或多个发夹。

向导RNA的间隔区包括与靶DNA中的序列互补的核苷酸序列。换句话说，向导RNA的间隔区通过杂交(如碱基配对)以序列特异性的方式与靶DNA相互作用。因此，间隔区的核苷酸序列可变化，并决定靶DNA内向导RNA和靶DNA相互作用的位置。向导RNA的DNA靶向区段可以被修饰(如，通过基因工程)以与靶DNA内的任何所需序列杂交。

在一些实施方案中，间隔区具有10个核苷酸到30个核苷酸的长度。在一些实施方案中，间隔区具有13个核苷酸到25个核苷酸的长度。在一些实施方案中，间隔区具有15个核苷酸到23个核苷酸的长度。在一些实施方案中，间隔区具有18个核苷酸到22个核苷酸的长度，如，20到22个核苷酸。

在一些实施方案中，间隔区的DNA靶向序列与靶DNA的原型间隔区之间的互补性百分比在20-22个核苷酸上至少为60％(如，至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％)。

在一些实施方案中，原型间隔区在其3’端直接毗邻合适的PAM序列，或者这样的PAM序列是其3’部分中的DNA靶向序列的一部分。

向导RNA的修饰可用于增强包含向导RNA和Cas核酸内切酶(例如B-GEn.1或B-GEn.2)的CRISPR-Cas基因组编辑复合物的形成或稳定。向导RNA的修饰也可以或替代地用于增强基因组编辑复合物与基因组中靶序列之间相互作用的启动、稳定性或动力学，例如可用于增强在靶活性。向导RNA的修饰也可以或替代地用于增强特异性，如，与其他(脱靶)位点的效果相比，在靶位点的基因组编辑的相对比率。

修饰也可以或替代地用于增加向导RNA的稳定性，如，通过增加其对细胞中存在的核糖核酸酶(RNases)降解的抗性，从而使其在细胞中的半衰期延长。增强向导RNA半衰期的修饰在为了产生B-GEn.1或B-GEn.2核酸内切酶，将Cas核酸内切酶如B-GEn.1或B-GEn.2通过需要翻译的RNA引入至被编辑的细胞内的实施方案中特别有用，因为引入的向导RNA的半衰期增加同时编码核酸内切酶的RNA可以用来增加向导RNA和编码的Cas核酸内切酶在细胞内共存的时间。

供体DNA或供体模板

位点特异性多肽，例如DNA核酸内切酶，可以在核酸(如基因组DNA)中引入双链断裂或单链断裂。双链断裂可以刺激细胞的内源性DNA修复途径(如同源依赖性修复(HDR)或非同源末端连接或选择性非同源末端连接(A-NHEJ)或微同源介导末端连接(MMEJ))。NHEJ可以在不需要同源模板的情况下修复断裂的靶核酸。这有时会导致靶核酸在切割位点的小缺失或插入(indels)，其可以导致基因表达的中断或改变。HDR，也称为同源重组(HR)，可在同源修复模板或供体可用时发生。

同源供体模板具有与靶核酸切割位点侧翼的序列同源的序列。姐妹染色单体通常被细胞用作修复模板。然而，出于基因组编辑的目的，修复模板通常以外源核酸的形式提供，如质粒、双链体寡核苷酸、单链寡核苷酸、双链寡核苷酸或病毒核酸。对于外源性供体模板，通常在同源的侧翼区域之间引入额外的核酸序列(如转基因)或修饰(如单个或多个碱基变化或缺失)，以便额外或改变的核酸序列也被纳入至靶基因座。MMEJ导致的遗传结果与NHEJ相似，在切割位点可以发生小的缺失和插入。MMEJ利用切割位点侧翼的几个碱基对的同源序列来驱动有利的末端连接DNA修复结果。在一些实施方案中，可以基于对核酸酶靶区域的潜在微同源性的分析来预测可能的修复结果。

因此，在某些情况下，采用同源重组将外源多核苷酸序列插入到靶核酸切割位点。外源多核苷酸序列在本文中称为供体多核苷酸(或供体或供体序列或多核苷酸供体模板)。在一些实施方案中，将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入到靶核酸切割位点。在一些实施方案中，供体多核苷酸是外源多核苷酸序列，即不天然存在于靶核酸切割位点的序列。

当外源DNA分子在发生双链断裂的细胞核内具有足够的浓度时，外源DNA可以在NHEJ修复过程中在双链断裂处被插入，从而成为基因组的永久性添加。这些外源DNA分子在一些实施方案中被称为供体模板。如果供体模板包含用于本文所述的一个或多个系统组分的编码序列以及相关的调控序列，如启动子、增强子、polyA序列和/或剪接受体序列，则可以从基因组中的整合核酸中表达一个或多个系统组分，从而在细胞的生命周期内永久表达。此外，当细胞分裂时，供体DNA模板的整合核酸可以传递给子细胞。

如果存在足够浓度的供体DNA模板，DNA模板包含与双链断裂的任一侧的DNA序列同源的侧翼DNA序列(称为同源臂)，则供体DNA模板可以通过HDR途径整合。同源臂作为底物在供体模板和双链断裂的任一侧的序列之间进行同源重组。这可以导致供体模板的无错误插入，其中双链断裂的任一侧的序列与未修饰的基因组中的序列都没有改变。

提供的供给HDR编辑的供体差异明显，但通常包含预期的序列，具有小或大的侧翼同源臂，以使对基因组DNA进行退火。引入的遗传变化侧翼的同源区域可以是30bp或更小，也可以像包含启动子、cDNA等的几千碱基盒一样大。可以使用单链和双链寡核苷酸供体。这些寡核苷酸的大小范围从小于100nt到超过许多kb，尽管也可以生成和使用更长的ssDNA。通常使用双链供体，包括PCR扩增子、质粒和微环(mini-circle)。一般来说，已经发现AAV载体是递送供体模板的一种非常有效的手段，尽管单个供体的包装限制小于5kb。供体的主动转录使HDR增加了3倍，这表明包含启动子可以增加转化。相反，供体的CpG甲基化可以降低基因表达和HDR。

在一些实施方案中，供体DNA可以与核酸酶一起供给或通过多种不同的方法独立供给，例如通过转染、纳米颗粒、微注射或病毒转导。在一些实施方案中，可使用一系列捆绑选项来增加HDR供体的可用性。实例包括将供体连接到核酸酶上，连接到结合附近的DNA结合蛋白上，或连接到参与DNA末端结合或修复的蛋白上。

除了通过NHEJ或HDR进行基因组编辑外，还可以同时使用NHEJ途径和HR途径插入位点特异性基因。组合方法可适用于某些设置，可能包括内含子/外显子边界。NHEJ对内含子的连接有效，而无差错的HDR更适合于编码区。

载体

在另一方面，本文提供了包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的多核苷酸序列的核酸、gRNA和/或进行本公开内容的实施方案所必需的任何核酸或蛋白质分子。在一些实施方案中，这样的核酸是载体(如，重组表达载体)。

考虑的表达载体包括但不限于：基于牛痘病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒、人类免疫缺陷病毒、逆转录病毒(如，小鼠白血病病毒、脾死亡病毒以及源自逆转录病毒的载体，例如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生性肉瘤病毒、以及乳腺肿瘤病毒)的病毒载体，和其他重组载体。考虑用于真核靶细胞的其他载体包括但不限于载体pXT1、pSG5、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。考虑用于真核靶细胞的其他载体包括但不限于载体pCTx-1、pCTx-2和pCTx-3。其他载体只要与宿主细胞兼容就可以使用。

在一些实施方案中，载体具有一个或多个转录和/或翻译控制元件。根据所使用的宿主/载体系统，可以在表达载体中使用许多合适的转录和翻译控制元件，包括组成型启动子和诱导型启动子、转录增强子元件、转录终止子等。在一些实施方案中，载体是自我灭活载体，其使病毒序列或CRISPR机制的组分或其他元件灭活。

合适的真核启动子(即在真核细胞中起作用的启动子)的非限制性实例包括这些启动子，其源自巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶(thymidinekinase)、早期和晚期SV40、逆转录病毒的长末端重复序列(long terminal repeats，LTRs)、人延伸因子-1(elongation factor-1promoter，EF1)、巨细胞病毒(cytomegalovirus，CMV)增强子与鸡β强肌动蛋白启动子(beta-actin promoter，CAG)融合的杂交结构、鼠干细胞病毒(stem cell virus promoter，MSCV)、磷酸甘油酸激酶-1基因座(phosphoglycerate kinase-1locus promoter，PGK)和小鼠金属硫蛋白-I(metallothionein-I)。

对于小RNA的表达，包括用于与Cas核酸内切酶连接的向导RNA，各种启动子，如RNA聚合酶III启动子，包括例如U6和H1，可以是有利的。关于加强使用这种启动子的描述和参数在本领域是已知的，且额外的信息和方法被频繁地描述；参见，如，Ma,H.等人,MolecularTherapy-Nucleic Acids 3,e161(2014)doi:10.1038/mtna.2014.12。

表达载体还可以包含用于翻译起始的核糖体结合位点和转录终止子。表达载体还可以包含用于扩增表达的适当序列。表达载体还可以包含编码非天然标签(如组氨酸标签、血凝素标签、绿色荧光蛋白等)的核苷酸序列，这些标签与位点特异性多肽融合，从而形成融合蛋白。

在一些实施方案中，启动子是诱导型启动子(如，热休克启动子、四环素调控启动子、类固醇调控启动子、金属调控启动子、雌激素受体调控启动子等)。在一些实施方案中，启动子是组成型启动子(例如，CMV启动子、UBC启动子)。在一些实施方案中，启动子是空间限制和/或时间限制的启动子(例如，组织特异性启动子、细胞类型特异性启动子等)。在一些实施方案中，如果该基因在插入基因组后将在基因组中存在的内源性启动子下表达，载体不具有用于至少一个基因在宿主细胞中表达的启动子。

核酸和多肽的修饰

在一些实施方案中，本文所述的多核苷酸包含如本文进一步描述和本领域已知的一种或多种修饰，如可用于增强活性、稳定性或特异性、改变递送、减少宿主细胞中的先天免疫应答、进一步减小蛋白质大小或用于其他增强。在一些实施方案中，这样的修饰将产生B-GEn.1或B-GEn.2多肽，其包含与SEQ ID NO:2序列具有至少75％、至少80％、至少85％、至少90％、至少95％、至少99％或100％氨基酸序列同一性的氨基酸序列。

密码子优化

在某些实施方案中，在本文所述的CRISPR-B-GEn.1或B-GEn.2系统中使用的修饰的多核苷酸，其中向导RNA和/或包含编码B-GEn.1或B-GEn.2多肽或其变体的多核苷酸序列的DNA或RNA可以被修饰，如下文所述和说明。这种修饰的多核苷酸可用于CRISPR-B-GEn.1或B-GEn.2系统以编辑任何一个或多个基因组基因座。在一些实施方案中，本公开内容的多核苷酸中的此类修饰通过密码子优化实现，如，基于编码的多肽在其中表达的特定宿主细胞的密码子优化。本领域技术人员将理解，本公开内容的任何核苷酸序列和/或重组核酸都可以被密码子优化，以便在任何感兴趣的物种中表达。密码子优化在本领域是众所周知的，且涉及使用物种特异性密码子使用表修饰核苷酸序列的密码子使用偏差。密码子使用表是基于对感兴趣物种的最高表达基因的序列分析而生成的。在一个非限制性的实例中，当核苷酸序列将在细胞核中表达时，密码子使用表是基于对感兴趣物种的高表达核基因的序列分析生成的。通过比较物种特异性密码子使用表与天然多核苷酸序列中存在的密码子来确定核苷酸序列的修饰。

在一些实施方案中，本文所述的B-GEn.1或B-GEn.2多肽或其变体是从密码子优化的多核苷酸序列表达的。例如，如果预期的靶细胞是人类细胞，则人类密码子优化的编码B-GEn.1或B-GEn.2(或B-GEn.1或B-GEn.2变体，如酶失活变体)的多核苷酸序列将是合适的。作为另一个非限制性实例，如果预期的宿主细胞是小鼠细胞，那么小鼠密码子优化的编码B-GEn.1或B-GEn.2(或B-GEn.1或B-GEn.2变体，如酶失活变体)的多核苷酸序列将是合适的。

密码子优化的策略和方法是本领域已知的，且对于各种系统已被描述，包括但不限于酵母(Outchkourov等人,Protein Expr Purif,24(1):18-24(2002))和大肠杆菌(E.coli)(Feng等人,Biochemistry,39(50):15399-15409(2000))。在一些实施方案中，密码子优化是通过使用表达优化技术(ATUM)和使用制造商推荐的表达优化算法进行的。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在人细胞中表达。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在大肠杆菌细胞中表达。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在昆虫细胞中表达。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在Sf9昆虫细胞中表达。在一些实施方案中，密码子优化过程中使用的表达优化算法定义为避免推定的polyA信号(例如AATAAA和ATTAAA)以及可能导致聚合酶滑移的长(大于4)A段。

如本领域所熟知的，核苷酸序列的密码子优化导致核苷酸序列与天然核苷酸序列具有小于100％的同一性(如，小于70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％)，但其编码的多肽仍然与原始天然核苷酸序列编码的多肽功能相同。因此，在本公开内容的代表性实施方案中，本公开内容的核苷酸序列和/或重组核酸可以是优化的密码子，以便在特定感兴趣的物种中表达。

在一些实施方案中，密码子优化的多核苷酸序列与SEQ ID NO:1至少具有90％、92％、93％、94％、95％、96％、97％、98％、99％、99.2％、99.5％、99.8％、99.9％或100％的序列同一性。在一些实施方案中，本公开内容的多核苷酸是密码子优化的，以增加靶细胞中的编码的B-GEn.1或B-GEn.2多肽的表达。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在人细胞中的表达。通常，本公开内容的多核苷酸是密码子优化的，以增加在任何人类细胞中的表达。在一些实施方案中，本公开内容的多核苷酸是密码子优化的，以增加在大肠杆菌细胞中的表达。在一些实施方案中，本公开内容的多核苷酸是密码子优化的，以增加在昆虫细胞中的表达。通常，本公开内容的多核苷酸是密码子优化的，以增加在任何昆虫细胞中的表达。在一些实施方案中，本公开内容的多核苷酸为密码子优化的，以增加在Sf9昆虫细胞表达系统中的表达。

也可以选择聚腺苷化信号来优化在预期的宿主中的表达。

其他修饰

修饰也可以或代替地用于降低引入到细胞的RNA引发先天免疫应答的可能性或程度。如下文和本领域所述的这种应答在RNA干扰(RNAi)，包括小干扰RNA(siRNA)的上下文中已被很好地表征，它们往往与RNA半衰期缩短和/或细胞因子或与免疫反应相关的其他因素的激发有关。

引入到细胞的编码核酸内切酶(例如B-GEn.1或B-GEn.2)的RNA也可以进行一种或多种类型的修饰，包括，但不限于，增强RNA稳定性的修饰(例如通过减少细胞中存在的RNA酶对其的降解)，增强所得产物翻译的修饰(如，核酸内切酶)，和/或降低引入到细胞的RNA引发先天免疫应答的可能性或程度的修饰。也可以使用诸如上述和其他修饰的组合。对于CRISPR-B-GEn.1或B-GEn.2的情况下，例如，可以对于向导RNA进行一种或多种类型的修饰(包括上述示例的那些)，和/或可以对编码B-GEn.1或B-GEn.2核酸内切酶的RNA进行一种或多种类型的修饰(包括上述示例的那些)。

通过举例说明，CRISPR-B-GEn.1或B-GEn.2系统中使用的向导RNA或其他更小的RNA可以通过化学手段容易地合成，使得许多修饰可以容易地纳入，如下文所述和本领域所述。虽然化学合成程序不断扩大，但由于多核苷酸长度显著增加，超过100个左右的核苷酸，使用高效液相色谱(HPLC，其避免使用例如PAGE等凝胶)等程序纯化这些RNA往往变得更具挑战性。用于产生更长的化学修饰RNA的一种方法是产生两个或多个连接在一起的分子。更长的RNA，比如编码B-GEn.1或B-GEn.2核酸内切酶的RNA，更容易通过酶促产生。虽然通常可用于酶促产生的RNA的修饰类型较少，但仍有一些修饰可用于如增强稳定性、降低先天免疫应答的可能性或程度和/或增强其他属性，如下文进一步所述和本领域所述；且新型的修饰也在不断被开发。通过举例说明各种类型的修饰，特别是那些经常用于较小的化学合成RNA的修饰，修饰可以包括在糖的2'位置修饰的一个或多个核苷酸，在一些实施方案中为2’-O-烷基、2’-O-烷基-O-烷基或2’-氟修饰的核苷酸。在一些实施方案中，RNA修饰包括嘧啶核糖上的2’-氟、2’-氨基和2’-O-甲基修饰、碱基残基或RNA 3’端上的反碱基。这种修饰通常被纳入至寡核苷酸中，且这些寡核苷酸已被证明具有比针对给定靶标的2’-脱氧寡核苷酸更高的Tm(如，更高的靶标结合亲和力)。

许多核苷酸和核苷修饰已被证明使纳入它们的寡核苷酸比天然寡核苷酸对核酸酶消化具有更高的抗性；这些修饰的寡核苷酸比未修饰的寡核苷酸完整地存活的时间更长。修饰寡核苷酸的具体实例包括包含修饰骨架的那些，例如，磷硫酸酯、磷酸三酯、膦酸甲酯、短链烷基或环烷基糖间键或短链杂原子或杂环糖间键。有些寡核苷酸是具有磷基骨架的寡核苷酸和具有杂原子骨架的寡核苷酸，特别是CH2-NH-O-CH2,CH,-N(CH3)-O-CH2(称为亚甲基(甲基亚氨)(methylene(methylimino))或MMI骨架),CH2-O-N(CH3)-CH2,CH2-N(CH3)-N(CH3)-CH2和O-N(CH3)-CH2-CH2；酰胺骨架[参见De Mesmaeker等人,Ace.Chem.Res.,28:366-374(1995)]；吗啉骨架结构(见Summerton和Weller，美国专利号5,034,506)；肽核酸(PNA)骨架(其中寡核苷酸的磷酸二酯骨架被聚酰胺骨架取代，核苷酸直接或间接与聚酰胺骨架的氮杂氮原子连接，参见Nielse等人,Science 1991,254,1497)。含磷键包括但不限于：硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸盐，包括3’烷基膦酸盐和手性膦酸盐、膦酸盐、磷酰胺酸盐，包括3’-氨基磷酸酯和氨基烷基磷酸酯、硫代磷酰胺酸盐、硫代烷基膦酸盐、硫代烷基磷酸三酯和具有正常3’-5’键的硼磷酸盐，这些的2’-5’连接的类似物，以及具有反向极性的类似物，其中相邻的核苷单元对连接为3’-5’到5’-3’或2’-5’到5’-2’；参见美国专利号3,687,808；4,469,863；4,476,301；5,023,243；5,177,196；5,188,897；5,264,423；5,276,019；5,278,302；5,286,717；5,321,131；5,399,676；5,405,939；5,453,496；5,455,233；5,466,677；5,476,925；5,519,126；5,536,821；5,541,306；5,550,111；5,563,253；5,571,799；5,587,361；和5,625,050。

基于吗啉基的寡聚化合物记载于Braasch和Corey,Biochemistry,41(14):4503-4510(2002)；Genesis,第30卷,第3期,(2001)；Heasman,Dev.Biol.,243:209-214(2002)；Naseviciu等人,Nat.Genet.,26:216-220(2000)；Lacenra等,Proc.Nat/.Acad.Sci.,97:9591-9596(2000)；和美国专利号5,034,506,发布于1991年7月23日。环己烯基核酸寡核苷酸模拟物记载于Wang等人,J.Am.Chem.Soc.,122:8595-8602(2000).

其中不包括磷原子的修饰寡核苷酸骨架具有由短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的骨架。这些包括具有吗啉键的(部分由核苷的糖部分形成)的那些骨架；硅氧烷(siloxane)骨架；硫化物(sulfide)、亚砜(sulfoxide)和砜(sulfone)骨架；甲乙酰基(formacetyl)和硫代甲乙酰基(thioformacetyl)骨架；亚甲基甲乙酰基和硫代甲乙酰基骨架；含烯烃骨架；氨基磺酸盐骨架；亚甲基亚胺和亚甲基肼骨架；磺酸盐和磺胺骨架；酰胺骨架；和其他具有混合的N、0、S和CH₂的组分部分的骨架；参见美国专利号5,034,506；5,166,315；5,185,444；5,214,134；5,216,141；5,235,033；5,264,562；5,264,564；5,405,938；5,434,257；5,466,677；5,470,967；5,489,677；5,541,307；5,561,225；5,596,086；5,602,240；5,610,289；5,602,240；5,608,046；5,610,289；5,618,704；5,623,070；5,663,312；5,633,360；5,677,437；和5,677,439，其每一个通过引用并入本文。

一个或多个取代的糖基也可以包括，如在2'位置上的以下中的一个：OH、SH、SCH₃、F、OCN、OCH₃、OCH₃O(CH₂)_nCH₃、O(CH₂)_nNH₂或O(CH₂)_nCH₃，其中n为1至10；C₁-C₁₀低烷基、烷氧基烷氧基、取代的低烷基、烷芳基或芳烷基；Cl；Br；CN；CF₃；OCF₃；O-、S-或N-烷基；O-、S-或N-烯基；SOCH₃；SO₂CH₃；ONO₂；NO₂；N₃；NH₂；杂环烷基(heterocycloalkyl)；杂环烷芳基(heterocycloalkaryl)；氨基烷氨基(aminoalkylamino)；聚烷氨基(polyalkylamino)；取代的甲硅烷基；RNA切割基团；报告基团；嵌入剂(intercalator)；改进寡核苷酸药代动力学特性的基团；或用于改进寡核苷酸的药效学性质的基团和具有类似性质的其他取代基。在一些实施方案中，修饰包括2’-甲氧基乙氧基(2’-O-CH₂CH₂OCH₃，也称为2’-O-(2-甲氧乙基))(Martinet a/,Helv.Chim.Acta,1995,78,486)。其他修饰包括2’-甲氧基(2’-O-CH₃)、2’-丙氧基(2’-OCH₂CH₂CH₃)和2’-氟基(2’-F)。在寡核苷酸的其他位置也可以进行类似的修饰，特别的在3’端核苷酸上的糖的3’位置和5’端核苷酸的5’位置。寡核苷酸也可以具有糖模拟物，例如取代戊呋喃基()pentofuranosyl)基团的环丁基。在一些实施方案中，核苷酸单元的糖和核苷间键，如，所述骨架，都被新的基团取代。被保留的碱基单位用于与合适的核酸靶化合物杂交。一种这样的寡聚化合物(已被证明具有优异的杂交特性的寡核苷酸模拟物)被称为肽核酸(PNA)。在PNA化合物中，寡核苷酸的糖骨架被含有酰胺的骨架取代，例如氨基乙基甘氨酸骨架。核碱基被保留并直接或间接连接到骨架的酰胺部分的氮杂氮原子上。教导PNA化合物制备的具有代表性的美国专利包括，但不限于，美国专利号5,539,082；5,714,331；和5,719,262。PNA化合物的进一步教导记载于Nielsen等人,Science,254:1497-1500(1991)。

向导RNA还可以额外或替代地包含核碱基(在本领域通常简称为“碱基”)修饰或取代。如本文所使用的，“未修饰的”或“天然的”核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括仅在天然核酸中很少或短暂存在的核碱基，如次黄嘌呤(hypoxanthine)、6-甲基腺嘌呤(6-methyladenine)、5-Me嘧啶(5-Mepyrimidines)，特别地5-甲基胞嘧啶(5-methylcytosine)(也称为5-甲基-2’脱氧胞嘧啶(5-methyl-2'deoxycytosine)，本领域中通常称为5-Me-C)、5-羟甲基胞嘧啶(5-hydroxymethylcytosine，HMC)、糖基HMC和龙胆二糖基HMC(gentobiosyl HMC)，以及合成核碱基，如2-氨基腺嘌呤、2-(甲氨基)腺嘌呤、2-(咪唑烷基)腺嘌呤、2-(氨基烷基)腺嘌呤或其他杂取代的烷基腺嘌呤、2-硫脲嘧啶、2-硫胸腺嘧啶、5-溴嘧啶、5-羟甲基尿嘧啶、8-氮杂鸟嘌呤、7-去氮杂鸟嘌呤、N6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤。Kornberg,A,DNAReplication,W.H.Freeman&Co.,San Francisco,pp75-77(1980)；Gebeyehu等人,Nucl.Acids Res.15:4513(1997)。还可以包括本领域已知的“通用”碱基，如肌苷。5-Me-C取代已被证明能将核酸双链体稳定性提高0.6-1.2摄氏度(Sanghvi,Y.S.,in Crooke,S.T.和Lebleu,B.,编辑,Antisense Research and Applications,CRC Press,Boca Raton,1993,pp.276-278)，且是碱基取代的实施方案。

修饰的核碱基包括其他合成和天然的核碱基，例如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、6-甲基和其他腺嘌呤和鸟嘌呤的烷基衍生物、2-丙基和其他腺嘌呤和鸟嘌呤的烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤尿嘧啶和胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-巯基、8-硫烷基、8-羟基和其他a-取代腺嘌呤和鸟嘌呤、5-卤代特别是5-溴、5-三氟甲基和其他5-取代基尿嘧啶和胞嘧啶、7-甲基喹(7-methylquanine)和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂鸟嘌呤、7-去氮杂鸟嘌呤和7-去氮杂鸟嘌呤及3-去氮杂鸟嘌呤和3-去氮杂鸟嘌呤。

其他有用的核碱基包括在美国专利号3,687,808中公开的那些，在“The ConciseEncyclopedia of Polymer Science And Engineering”，第858-859页Kroschwitz,J.l编辑.John Wiley&Sons,1990中公开的那些,Englisch等人,Angewandte Chemie,International Edition,1991,30,第613页公开的那些，以及在Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.ea.,CRCPress,1993公开的那些。这些核碱基中的某些核碱基对于增加本公开内容的低聚化合物的结合亲和力特别有用。这些包括5-取代嘧啶、6-氮杂嘧啶和N-2、N-6和-O-6取代嘌呤，包括2-氨基丙基腺嘌呤、5-丙基尿嘧啶和5-丙基胞嘧啶。5-甲基胞嘧啶的取代已被证明可将核酸双链体稳定性提高0.6-1.2℃(Sanghvi,Y.S.,Crooke,S.T.和Lebleu,B.,编辑,“Antisense Research and Applications”,CRC Press,Boca Raton,1993,第276-278页)，且是碱基取代的实施方案，甚至更特别地当与2'-O-甲氧基乙基糖修饰结合时。修饰的核碱基记载于美国专利号3,687,808，以及4,845,205；5,130,302；5,134,066；5,175,273；5,367,066；5,432,272；5,457,187；5,459,255；5,484,908；5,502,177；5,525,711；5,552,540；5,587,469；5,596,091；5,614,617；5,681,941；5,750,692；5,763,588；5,830,653；6,005,096；和美国专利申请公开20030158403。

在给定的寡核苷酸中的所有位置都不需要被一致地修饰，且事实上，上述修饰中的不止一种可以被纳入在单个寡核苷酸中，甚至在寡核苷酸内的单个核苷内。

在一些实施方案中，编码核酸内切酶(例如本公开内容的B-GEn.1或B-GEn.2)的向导RNA和/或mRNA使用目前加帽方法中的任何一种进行加帽，例如mCAP、ARCA或酶促加帽方法，以创造保持生物活性并避免自身/非自身细胞内应答的可行mRNA构建体。在一些实施方案中，编码核酸内切酶(例如本公开内容的B-GEn.1或B-GEn.2)的向导RNA和/或mRNA通过使用CleanCap^TM(TriLink)共转录加帽方法进行加帽。

在一些实施方案中，编码本公开内容的内切酶的向导RNA和/或mRNA包括选自假尿嘧啶、N¹-甲基假尿嘧啶和5-甲氧基尿嘧啶中的一种或多种修饰。在一些实施方案中，将一种或多种N¹-甲基假尿嘧啶纳入编码本公开内容的核酸内切酶的向导RNA和/或mRNA中，以便在动物细胞(例如哺乳动物细胞(如人类和小鼠))中提供增强的RNA稳定性和/或蛋白质表达和降低的免疫原性。在一些实施方案中，N¹-甲基假尿嘧啶修饰与一种或多种5-甲基胞嘧啶组合纳入。

在一些实施方案中，编码核酸内切酶(例如B-GEn.1或B-GEn.2)的向导RNA和/或mRNA(或DNA)化学连接至一个或多个部分或缀合物物，其增强了寡核苷酸的活性、细胞分布或细胞摄取。这些部分包括但不限于脂质部分，如胆固醇部分[Letsinger等人,Proc.Nat/.Acad.Sci.USA,86:6553-6556(1989)]；胆酸[Manoharan等人,Bioorg.Med.Chem.Let.,4:1053-1060(1994)]；硫醚，如己基-S-三苯甲硫醇[Manoharan eta/,Ann.N.Y Acad.Sci.,660:306-309(1992)和Manoharan等人,Bioorg.Med.Chem.Let.,3.·2765-2770(1993)]；巯基胆固醇[Oberhauser等人,Nucl.Acids Res.,20:533-538(1992)]；脂肪族链，如十二烷二醇或十一烷基残基[Kabanov等人,FEBS Lett.,259:327-330(1990)和Svinarchuk等人,Biochimie,75:49-54(1993)]；磷脂，如双十六烷基-rac-甘油或三乙铵1,2-双-O-十六烷基-rac-甘油-3-H-膦酸酯[Manoharan等人,Tetrahedron Lett.,36:3651-3654(1995)和Shea等人,Nucl.Acids Res.,18:3777-3783(1990)]；多胺或聚乙二醇链[Mancharan等,Nucleosides&Nucleotides,14:969-973(1995)]；金刚烷乙酸[Manoharan等人,Tetrahedron Lett.,36:3651-3654(1995)]；棕榈基基团[(Mishra等,Biochim.Biophys.Acta,1264:229-237(1995)]；或十八胺或己胺-羰基-t含氧胆固醇不跟[Crooke等人,J.Pharmacol.Exp.Ther.,277:923-937(1996)]。另参见美国专利号4,828,979；4,948,882；5,218,105；5,525,465；5,541,313；5,545,730；5,552,538；5,578,717,5,580,731；5,580,731；5,591,584；5,109,124；5,118,802；5,138,045；5,414,077；5,486,603；5,512,439；5,578,718；5,608,046；4,587,044；4,605,735；4,667,025；4,762,779；4,789,737；4,824,941；4,835,263；4,876,335；4,904,582；4,958,013；5,082,830；5,112,963；5,214,136；5,082,830；5,112,963；5,214,136；5,245,022；5,254,469；5,258,506；5,262,536；5,272,250；5,292,873；5,317,098；5,371,241,5,391,723；5,416,203,5,451,463；5,510,475；5,512,667；5,514,785；5,565,552；5,567,810；5,574,142；5,585,481；5,587,371；5,595,726；5,597,696；5,599,923；5,599,928和5,688,941。

糖和其他部分可用于将蛋白质和包含核苷酸的复合物(如阳离子多核糖体和脂质体)靶向至特定位点。例如，肝细胞定向转移可以通过去唾液酸糖蛋白受体(asialoglycoprotein receptors，ASGPRs)介导；参见，如Hu等人,Protein Pept Lett.21(10):1025-30(2014)。本领域已知的并不断开发的其他系统可用于将本申请中使用的生物分子和/或其复合物靶向于感兴趣的特定靶细胞。

这些靶向部分或缀合物可包括与诸如伯羟基或仲羟基等官能团共价连接的缀合基团。合适的缀合基团包括嵌入剂、报告分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物药效学性质的基团和增强低聚物药代动力学性质的基团。典型的缀合基团包括胆固醇、脂类、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。能够增强药效学特性的基团包括改进摄取、增强降解抗性和/或加强与靶核酸序列特异性杂交的基团。能够增强药代动力学特性的基团包括改善本公开内容化合物的摄取、分布、代谢或分泌的基团。具有代表性的缀合基团公开于国际专利申请号PCT/US92/09196，提交于1992年10月23日，及美国专利号6287860，其通过引用并入本文。缀合部分包括，但不限于，脂质基团如胆固醇部分、胆酸、硫醚，如己基-5-三苯甲硫醇、巯基胆固醇、脂肪族链，如十二烷二醇或十一烷基残基、磷脂、如双十六烷基-rac-甘油或三乙铵1,2-双-O-十六烷基-rac-甘油-3-H-膦酸酯、多胺或聚乙二醇链、或金刚烷乙酸、棕榈部分或十八胺或己胺-羰基-含氧胆固醇部分。参见，例如美国专利号4,828,979；4,948,882；5,218,105；5,525,465；5,541,313；5,545,730；5,552,538；5,578,717,5,580,731；5,580,731；5,591,584；5,109,124；5,118,802；5,138,045；5,414,077；5,486,603；5,512,439；5,578,718；5,608,046；4,587,044；4,605,735；4,667,025；4,762,779；4,789,737；4,824,941；4,835,263；4,876,335；4,904,582；4,958,013；5,082,830；5,112,963；5,214,136；5,082,830；5,112,963；5,214,136；5,245,022；5,254,469；5,258,506；5,262,536；5,272,250；5,292,873；5,317,098；5,371,241,5,391,723；5,416,203,5,451,463；5,510,475；5,512,667；5,514,785；5,565,552；5,567,810；5,574,142；5,585,481；5,587,371；5,595,726；5,597,696；5,599,923；5,599,928和5,688,941。

不太适合化学合成，通常通过酶促法合成产生的较长的多核苷酸，也可以通过各种方法进行修饰。这种修饰可包括，例如，引入某些核苷酸类似物、在分子的5’或3’端纳入特定序列或其他部分，以及其他修饰。通过举例说明，编码B-GEn.1或B-GEn.2的mRNA长度约为4kb，可通过体外转录合成。对mRNA的修饰可用于例如增加其翻译或稳定性(例如通过增加其在细胞中的降解的抗性)，或减少RNA引发先天性免疫应答的倾向，这种倾向通常在引入外源RNA，特别是较长的RNA，如编码B-GEn.1或B-GEn.2的RNA后的细胞中观察到。

本领域已描述了许多此类修饰，如多聚A尾、5’帽类似物(如抗反向帽类似物(AntiReverse Cap Analog，ARCA)或m7G(5’)ppp(5’)G(mCAP))、修饰的5’或3’非翻译区(UTR)、使用修饰的碱基(如假-UTP、2-硫代-UTP、5-甲基胞苷-5’-三磷酸(5-甲基-CTP)或N6-甲基-ATP)，或用磷酸酶处理以去除5’末端磷酸盐。这些及其他修饰方法都是本领域已知的，且新的RNA修饰方法也在不断开发中。

修饰RNA的商业供应商有很多，包括例如TriLink Biotech、Axolabs、Bio-Synthesis Inc.、Dharmacon和很多其他的。如TriLink所述，例如，5-甲基-CTP可用于赋予所需的特性，例如增加核酸酶稳定性、增加翻译或减少先天性免疫受体与体外转录RNA的相互作用。5’-甲基胞嘧啶-5’-三磷酸(5-甲基-CTP)、N6-甲基-ATP以及假-UTP和2-硫代-UTP也已被证明可减少培养物和体内的先天性免疫刺激，同时提高翻译能力，如下文提到的记载于Konmann等人和Warren等人的出版物中所说明的。

已经表明可以使用化学修饰在体内递送的mRNA以实现更好的治疗效果；参见如Kormann等人,Nature Biotechnology 29,154-157(2011)。这样的修饰可用于，例如，提高RNA分子的稳定性和/或降低其免疫原性。通过使用假-U、N6-甲基-A、2-硫代-U和5-甲基-C等化学修饰，已经发现，只要用2-硫代-U和5-甲基-C分别取代尿苷和胞苷残基的四分之一，就能显著降低小鼠体内由toll样受体(TLR)介导的对mRNA的识别。因此，通过减少先天性免疫系统的激活，这些修饰可用于有效提高mRNA在体内的稳定性和寿命；参见例如Konmann等人，同上。

还已经表明，反复给药设计为绕过先天性抗病毒应答的纳入修饰的信使RNA，可将已分化的人类细胞重新编程为多能性细胞。参见例如Warren等人,Cell Stem Cell,7(5):618-30(2010)。这种作为初级重编程蛋白的修饰mRNA是重编程多种人类细胞类型的有效手段。这种细胞被称为诱导多能干细胞(iPSC)。且已经发现，酶促法合成的RNA纳入5-甲基-CTP、假-UTP和抗反向帽类似物(ARCA)，可用于有效逃逸细胞的抗病毒应答；参见例如Warren等人，同上。本领域中描述的对多核苷酸的其他修饰包括，例如，使用多聚A尾、添加5’端帽类似物(如m7G(5’)ppp(5’)G(mCAP))、5’或3’非翻译区(UTR)的修饰，或用磷酸酶处理以去除5'端磷酸盐-且新的方法也在不断开发中。

已经开发了许多适用于生成用于本文的修饰RNA的组合物和技术，其与RNA干扰(RNAi)的修饰(包括小干扰RNA(siRNA))有关。siRNA在体内面临着特别的挑战，因为它们通过mRNA干扰对基因沉默的影响通常是短暂的，这可能需要重复给药。此外，siRNA是双链RNA(dsRNA)，哺乳动物细胞具有已经进化到检测和中和dsRNA的免疫应答，这通常是病毒感染的副产物。因此，有一些哺乳动物酶，如PKR(dsRNA应答激酶)和潜在的视黄酸诱导基因I(RIG-I)，其可以介导对dsRNA的细胞应答，也有可以触发细胞因子对这些分子的诱导的toll样受体(如TLR3、TLR7和TLR8)；参见例如Angart等人的综述，Pharmaceuticals(Basel)6(4):440-468(2013)；Kanasty等人,Molecular Therapy 20(3):513-524(2012)；Burnett等人,Biotechnol J.6(9):1130-46(2011)；Judge和Maclachlan,Hum Gene Ther 19(2):111-24(2008)；及其中引用的参考文献。

已经开发并应用了大量的修饰方法提高RNA的稳定性、减少先天性免疫应答和/或实现本文所述的将多核苷酸引入到人体细胞方面可能有用的其他益处；参见，如，Whitehead KA等人的综述，Annual Review of Chemical and BiomolecularEngineering,2:77-96(2011)；Gaglione和Messere,Mini Rev Med Chem,10(7):578-95(2010)；Chernolovskaya等人,Curr Opin Mol Ther.,12(2):158-67(2010)；Deleavey等人,Curr Protoc Nucleic Acid Chem Chapter 16:Unit 16.3(2009)；Behlke,Oligonucleotides 18(4):305-19(2008)；Fucini等人,Nucleic Acid Ther 22(3):205-210(2012)；Bremsen等人,Front Genet 3:154(2012)。

如上所述，有许多修饰RNA的商业供应商，其中许多专门从事旨在提高siRNA有效性的修饰。根据文献中报道的各种发现，提供了各种方法。例如，Dharmacon注意到，用硫(硫代磷酸酯(phosphorothioate，PS))取代非桥接氧已被广泛用于改进siRNA的核酸酶抗性，如Kale,Nature Reviews Drug Discovery 11:125-140(2012)所报道的。核糖2’位置的修饰已经报道可以改善核苷酸间磷酸键的核酸酶抗性，同时增加双链体稳定性(Tm)，这也显示可以提供免疫激活保护。适度的PS骨架修饰与小的、耐受性良好的2’-取代(2’-O-，2’-氟，2’-氢)的组合已与高度稳定的siRNA在体内的应用相关联，如Soutschek等人，Nature432:173-178(2004)所报道的；且已经报道了2’-O-甲基修饰在提高稳定性方面是有效的，如Volkov,Oligonucleotides 19:191-202(2009)所报道的。关于减少先天免疫应答的诱导，已经报道用2’-O-甲基，2’-氟，2’-氢修饰特定序列可以减少TLR7/TLR8相互作用，同时通常保持沉默活性；参见例如Judge等人,Mol.Ther.13:494-505(2006)；和Cekaite等人,J.Mol.Biol.365:90-108(2007)。额外的修饰，如2-硫脲嘧啶、假尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶和N6-甲基腺苷也被证明可以最小化TLR3、TLR7和TLR8介导的免疫效应；参见如，Kariko等人,Immunity 23:165-175(2005)。

如本领域所知的且可商业获得的，许多缀合物可应用于多核苷酸，例如本文所使用的RNA，其可增强他们被细胞递送和/或摄取，包括例如胆固醇、生育酚(tocopherol)和叶酸、脂质、肽、聚合物、接头和适配体；参见，如，Winkler的综述,Ther.Deliv.4:791-809(2013)，和其中引用的参考文献。

额外的序列

在某些实施方案中，向RNA在5’端或3’端包括至少一个额外的区段。例如，合适的附加片段可包括5’帽(如7-甲基鸟苷酸帽(m7G))；3’多聚腺苷酸化尾(如，3’poly(A)尾)；核糖开关序列(如允许调控稳定性和/或通过蛋白质和蛋白质复合物的调控可及性)；形成dsRNA双链体的序列(如发夹)；将RNA靶向亚细胞位置(如细胞核、线粒体、叶绿体等)的序列；提供追踪功能的修饰或序列(如直接与荧光分子缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等)；提供蛋白质结合位点的修饰或序列(如，作用于DNA的蛋白质，包括转录激活剂、转录抑制剂、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)；提供增加、降低和/或可控稳定性的修饰或序列；及其组合。

稳定性控制序列

稳定性控制序列影响RNA(如向导RNA)的稳定性。合适的稳定性控制序列的非限制性实例是转录终止子区段(如转录终止序列)。向导RNA的转录终止子区段的总长度可以从10个核苷酸到100个核苷酸，如从10个核苷酸(nt)到20nt，从20nt至30nt，从30nt至40nt，从40nt至50nt，从50nt至60nt，从60nt至70nt，从70nt至80nt，从80nt至90nt，或从90nt至100nt。例如，转录终止子区段的长度可以是15个核苷酸(nt)至80nt、从15nt至50nt、从15nt至40nt、从15nt至30nt或从15nt至25nt。

在一些实施方案中，转录终止序列是在真核细胞中起作用的序列。在一些实施方案中，转录终止序列是在原核细胞中起作用的序列。

可包含在稳定性控制序列(如转录终止区段，或向导RNA的任何区段，以提供提高的稳定性)中的核苷酸序列包括，例如不依赖Rho的trp终止位点等。

模拟物

在一些实施方案中，核酸可以是核酸模拟物。术语“模拟物”应用于多核苷酸时，旨在包括其中仅呋喃糖环或呋喃糖环和核苷酸间连接均被非呋喃糖基团取代的多核苷酸，仅呋喃糖环的取代在本领域也被称为糖替代物。杂环碱基部分或经修饰的杂环碱基部分保持与适当的靶核酸杂交。这样一种核酸，一种已被证明具有优异的杂交特性的多核苷酸模拟物，被称为肽核酸(PNA)。在PNA中，多核苷酸的糖骨架被含酰胺的骨架(尤其是氨基乙基甘氨酸骨架)取代。核苷酸被保留下来，并直接或间接地与骨架酰胺部分的氮杂氮原子结合。

一种已经报道的具有优异的杂交特性的多核苷酸模拟物是肽核酸(PNA)。PNA化合物的骨架是两个或两个以上连接的氨基乙基甘氨酸单元，这使PNA成为含有酰胺的骨架。杂环基部分直接或间接与骨架酰胺部分的氮杂氮原子结合。描述PNA化合物制备的代表性美国专利包括但不限于：美国专利号No.5,539,082；5,714,331；和5,719,262。

另一类已被研究的多核苷酸模拟物是基于连接的吗啉代单元(吗啉代核酸)，其杂环碱基连接在吗啉代环上。据报道，有许多连接基团可以连接到吗啉代核酸中的吗啉代单体单元。选择了一类连接基团来得到非离子低聚化合物。非离子的基于吗啉代的低聚化合物不太可能与细胞蛋白产生不期望的相互作用。基于吗啉代的多核苷酸是寡核苷酸的非离子模拟物，它不太可能与细胞蛋白形成不期望的相互作用(Dwaine A.Braasch和DavidR.Corey,Biochemistry,2002,41(14),45034510)。基于吗啉代的多核苷酸在美国专利号5,034,506中公开。已制备多核苷酸的吗啉代类内的各种化合物，其具有各种不同的连接基团连接单体亚基。

另一类多核苷酸模拟物被称为环己烯基核酸(GeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环取代。根据经典的亚磷酰胺化学，已经制备了受GeNA DMT保护的亚磷酰胺单体，并将其用于低聚化合物的合成。已经制备和研究了完全修饰的GeNA寡聚化合物和具有特定位置的GeNA修饰的寡核苷酸(参见Wang等人，J.Am.Chem.Soc.,2000,122,85958602)。通常，在DNA链中纳入GeNA单体增加了DNA/RNA杂交的稳定性。GeNA低聚腺苷酸与RNA和DNA形成复合物，其具有与天然复合物相似的稳定性。NMR和圆二色谱表明，将GeNA结构纳入天然核酸结构的研究易于构象适应。

进一步的修饰包括锁核酸(Locked Nucleic Acids，LNAs)，其中2'-羟基基团与糖环的4’碳原子相连，从而形成2’-C，4’-C-甲氧基键，从而形成双环糖部分。连接可以是亚甲基(-CH2-)，基团桥接2’氧原子和4’碳原子，其中n为1或2(Singh等人,Chem.Commun.,1998,4,455-456)。LNA和LNA类似物与互补的DNA和RNA表现出非常高的双链体热稳定性(Tm＝+3至+10℃)，对3’-外切核酸酶降解的稳定性和良好的溶解性。已经描述含有LNAs的潜在的和无毒的反义寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A,2000,97,5633-5638)。

已经描述LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备，以及它们的寡聚和核酸识别特性(Koshkin等人，Tetrahedron,1998,54,3607-3630)。LNAs及其制备也描述于WO 98/39352和WO 99/14226。

修饰的糖部分

核酸还可以包括一个或多个取代的糖部分。合适的多核苷酸包括糖取代基，其选自：OH；F；O-、S-或N-烷基；O-、S-或N-烯基；O-、S-或N-炔基；或O-烷基-O-烷基，其中所述烷基、烯基和炔基可为取代或不取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是O((CH₂)_nO)_mCH₃、O(CH₂)_nOCH₃、O(CH₂)_nNH₂、O(CH₂)CH₃、O(CH₂)_nONH₂和O(CH₂)_nON((CH₂)_nCH₃)₂，其中n和m的取值范围为1至大约10。其他合适的多核苷酸包含糖取代基，其选自：C₁至C₁₀低烷基、取代的低烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH₃、OCN、Cl、Br、CN、CF₃、OCF₃、SOCH₃、SO₂CH₃、ONO₂、NO₂、N₃、NH₂、杂环烷基(heterocycloalkyl)、杂环烷芳基(heterocycloalkaryl)、氨基烷氨基(aminoalkylamino)、聚烷氨基(polyalkylamino)、取代的甲硅烷基(substituted silyl)、RNA切割基团、报告基团、嵌入剂、改进寡核苷酸药代动力学特性的基团、或用于改进寡核苷酸的药效学性质的基团和具有类似性质的其他取代基。合适的修饰包括2’-甲氧基乙氧基(2’-O-CH₂-CH₂OCH₃，也称为2’-O-(2-甲氧乙基)或2'-MOE)(Martin等人,Hely.Chim.Acta,1995,78,486-504)，例如，烷氧基烷氧基基团。其他合适的修饰包括2'-二甲基氨基氧基乙氧基，例如O(CH₂)₂ON(CH₃)₂基团(2'-DMAOE)，如下文实施例中所述，和2'-二甲基氨基乙氧基乙氧基(在本领域中也称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE)，例如2'-O-CH₂-O-CH₂-N(CH3)₂。

其他合适的糖取代基包括甲氧基(-O-CH₃)、氨基丙氧基(-O-CH₂CH₂CH₂NH₂)、烯丙基(-CH₂-CH＝CH₂)、-O-烯丙基(-O-CH₂-CH＝CH₂)和氟(F)。2'-糖取代基可以位于阿拉伯糖(上)位置或核糖(下)位置。合适的2'-阿拉伯糖修饰是2'-F。在低聚化合物的其他位置也可以进行类似的修饰，特别是糖在3'端核苷上的3'位置或在2'-5'连接的寡核苷酸和5'端核苷酸的5'位置。低聚化合物还可以具有糖模拟物，例如取代戊呋喃基糖的环丁基部分。

碱基修饰和取代

核酸还可包含核碱基(在本领域通常简称为“碱基”)修饰或取代。如本文所用，“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G)，嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成和天然核碱基，例如5-甲基胞嘧啶(5-methylcytosine，5-me-C)、5-羟甲基胞嘧啶(5-hydroxymethyl cytosine)、黄嘌呤(xanthine)、次黄嘌呤(hypoxanthine)、2-氨基腺嘌呤(2-aminoadenine)、腺嘌呤和鸟嘌呤的6-甲基(6-methyl)和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基(2-propyl)和其他烷基衍生物、2-硫脲嘧啶(2-thiouracil)、2-硫胸腺嘧啶(2-thiothymine)和2-硫胞嘧啶(2-thiocytosine)、5-卤尿嘧啶和胞嘧啶、5-丙炔基(-C＝C-CH₃)尿嘧啶和胞嘧啶及嘧啶碱基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤、8-氨基、8-硫醇、8-硫烷基、8-羟基及其他8-取代的腺嘌呤和鸟嘌呤、5-卤特别是5-溴、5-三氟甲基及其他5-取代尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤，7-去氮杂鸟嘌呤和7-去氮杂腺嘌呤以及3-去氮杂鸟嘌呤和3-去氮杂腺嘌呤。进一步修饰的核碱基包括三环嘧啶，如吩恶嗪胞嘧啶核苷(phenoxazine cytidine，1H-嘧啶并(5,4-b)(1,4)苯并恶嗪-2(3H)-酮)、吩噻嗪嘧啶核苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-钳夹(G-clamps)，例如取代的吩恶嗪嘧啶核苷(如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并恶嗪-2(3H)-酮)、咔唑胞嘧啶核苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞嘧啶核苷(H-吡啶并(3’,2’:4,5)吡咯并(2,3-d)嘧啶-2-酮)。

杂环碱基部分还可包含嘌呤或嘧啶碱基被其他杂环取代的那些，例如7-去氮杂-腺嘌呤、7-去氮杂鸟嘌呤核苷、2-氨基吡啶和2-吡啶酮。进一步的核碱基包括美国专利号3,687,808中公开的那些、The Concise Encyclopedia Of Polymer Science AndEngineering，第858-859页，Kroschwitz,J.1.,编辑John Wiley&Sons,1990中公开的那些、Englisch等人,Angewandte Chemie,International Edition,1991,30,613中公开的那些，和Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.,编辑,CRC Press,1993中公开的那些。这些核碱基中的某些可用于增加寡聚化合物的结合亲和力。这些包含5-取代嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代嘌呤，包括2-氨基丙基腺嘌呤，5-丙基尿嘧啶和5-丙基胞嘧啶。5-甲基胞嘧啶取代已被证明可使核酸双链体稳定性提高0.6-1.2℃(Sanghvi等人,编辑,Antisense Research andApplications,CRC Press,Boca Raton,1993,第276-278页)，且是合适的碱基取代，如当与2’-O-甲氧基乙基糖修饰结合时。

“互补”是指在两个序列之间通过碱基堆叠和特定的氢键进行配对的能力，这些序列包括天然或非天然存在的(如，如上所述修饰的)碱基(核苷)或其类似物。例如，如果核酸某一位置上的碱基能够与靶标相应位置上的碱基形成氢键，则认为该碱基在该位置上是互补的。核酸可以包含通用碱基，或对氢键没有正负作用的惰性碱基间隔区。碱基配对可以包括典型的沃森-克里克碱基配对和非沃森-克里克碱基配对(如Wobble碱基配对和Hoogsteen碱基配对)。

应当理解的是，对于互补碱基配对，腺苷型碱基(A)与胸腺嘧啶型碱基(T)或尿嘧啶型碱基(U)互补，胞嘧啶型碱基(C)与鸟苷型碱基(G)互补，以及通用碱基，例如3-硝基吡咯或5-硝基吲哚等可以与任何A、C、U或T杂交并可以认为是互补的。Nichols等人,Nature,1994；369:492-493和Loakes等人,Nucleic Acids Res.,1994；22:4039-4043。肌苷(I)在本领域也被认为是一种通用的碱基，且被认为与任何A、C、U或T互补。参见Watkins和Santalucia,Nucl.Acids Research,2005；33(19):6258-6267。

缀合

核酸的另一种可能的修饰涉及化学连接至多核苷酸的一个或多个部分或缀合物，其增强寡核苷酸的活性、细胞分布或细胞摄取。这些部分或缀合物可包含与官能团，例如伯羟基或仲羟基等，共价结合的缀合基团。缀合基团包括但不限于嵌入剂、报告分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物药效学性质的基团和增强低聚物药代动力学性质的基团。合适的缀合基团包括但不限于胆固醇、脂类、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。增强药效学特性的基团包括改进摄取、增强降解抗性和/或加强与靶核酸序列特异性杂交的基团。增强药代动力学特性的基团包括改进核酸的摄取、分布、代谢或分泌的基团。

缀合部分包括但不限于脂质部分，例如胆固醇部分(Letsinger等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556)，胆酸(Manoharan等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060)；硫醚，如己基-S-三苯甲硫醇(Manoharan等人,Ann.N.Y.Acad.Sci.,1992,660,306-309；Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770)；巯基胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538)；和脂肪族链，如十二烷二醇或十一烷基残基(Saison-Behmoaras等人,EMBO J.,1991,10,1111-1118；Kabanov等人,FEBS Lett.,1990,259,327-330；Svinarchuk等人,Biochimie,1993,75,49-54)；磷脂，如双十六烷基-rac-甘油或三乙铵1,2-双-O-十六烷基-rac-甘油-3-H-膦酸酯(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654；Shea等人,Nucl.Acids Res.,1990,18,3777-3783)；多胺或聚乙二醇链(Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973)；或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,36513654)；棕榈基部分(Mishra等人,Biochim.Biophys.Acta,1995,1264,229-237)；或十八胺或己胺-羰基-氧基胆固醇部分(Crooke等人,J.Pharmacal.Exp.Ther.,1996,277,923-937)。

缀合物可包含“蛋白质转导结构域(Protein Transduction Domain)”或PTD(也称为CPP-细胞穿透肽)，其可指多肽、多核苷酸、碳水化合物或有机或无机化合物，其促进穿过脂质双分子层、胶束(micelle)、细胞膜、细胞器膜或囊泡膜(vesicle membrane)。连接在另一个分子上的PTD，其范围可以从小极性分子至大的大分子和/或纳米颗粒，可以促进分子穿过膜，例如从细胞外空间到细胞内空间，或从细胞质溶胶到细胞器内。在一些实施方案中，PTD共价连接至外源多肽(如B-GEn.1或B-GEn.2多肽或其变体)的氨基端。在一些实施方案中，PTD与外源多肽(如B-GEn.1或B-GEn.2多肽或其变体)的C-端或N-端共价连接。在一些实施方案中，PTD共价连接至核酸(如，向导RNA、编码向导RNA的多核苷酸、编码B-GEn.1或B-GEn.2多肽或其变体的多核苷酸等)。示例性PTD包括但不限于最小的十一氨基酸多肽蛋白转导结构域(undecapeptide protein transduction domain)(对应于包含YGRKKRRQRRR的HIV-1TAT的残基47-57；包含足以直接进入细胞的多个精氨酸的多精氨酸序列(如3、4、5、6、7、8、9、10或10-50个精氨酸)；VP22结构域(Zender等人(2002)Cancer Gene Ther.9(6):489-96)；果蝇触角蛋白转导结构域(Noguchi等人(2003)Diabetes52(7):1732-1737)；截短的人类降钙素肽(Trehin等人(2004)Pharm.Research 21:1248-1256)；聚赖氨酸(Wender等人(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008)。在一些实施方案中，PTD是可激活的CPP(ACPP)(Aguilera等人(2009)lntegr Biol(Camb)June；1(5-6):371-381)。ACPP包含聚阳离子CPP(如Arg9或“R9”)，通过可切割的接头连接到匹配的聚阴离子(如Glu9或“E9”)，它将净电荷减少到接近零，并从而抑制粘附和吸收至细胞中。当接头被切割时，聚阴离子被释放，局部揭开聚精氨酸及其固有的粘附性，从而“激活”ACPP穿过膜。在一些实施方案中，PTD被化学修饰以增加PTD的生物利用度。示例性的修饰在Expert Opin Drug Deliv.2009Nov；6(11):1195-205中公开。

多肽修饰

从密码子优化的多核苷酸序列表达的B-GEn.1或B-GEn.2多肽或其变体可在体外或由真核细胞、原核细胞或通过体外转录和翻译(IVTT)产生，并且可通过展开，如热变性、OTT还原等进一步处理，且可使用本领域已知的方法进一步再次折叠。

不改变一级序列的感兴趣的修饰包括多肽的化学衍生作用，如酰化、乙酰化、羧化、酰胺化等。还包括糖基化的修饰，如，通过在多肽的合成和加工期间或在进一步加工步骤中改变多肽的糖基化模式而进行的修饰；如，将多肽暴露于影响糖基化的酶中，例如哺乳动物糖基化酶或去糖基化酶。还包括具有磷酸化氨基酸残基的序列，如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸。

在一些实施方案中，使用普通分子生物学技术和合成化学修饰B-GEn.1或B-GEn.2多肽或其变体，以提高其对蛋白水解降解的抗性、改变靶序列特异性、优化溶解度特性、改变蛋白质活性(如转录调节活性，酶活性等)或使其更适合作为治疗剂。这种多肽的类似物包括那些含有除天然存在的L-氨基酸以外的残基的多肽，例如O-氨基酸或非天然的合成氨基酸。D-氨基酸可取代为部分或全部氨基酸残基。可以使用本领域已知的常规方法通过体外合成制备B-GEn.1或B-GEn.2多肽或其变体。各种商用合成设备可供选择，例如，通过Applied Biosystems,Inc.,Beckman等自动合成器。利用合成器，天然氨基酸可以被非天然氨基酸取代。特定序列和制备方式可由便利性、经济性、所需纯度等因素决定。

如果需要，可以在合成或表达期间将各种基团引入肽中，从而允许与其他分子或表面连接。因此，半胱氨酸可用于制造硫醚、用于连接到金属离子复合物物的组氨酸、用于形成酰胺或酯的羧基、用于形成酰胺的氨基等。

重组细胞

在一些实施方案中，本文所述的密码子优化的B-GEn.1或B-GEn.2系统可用于真核生物，例如哺乳动物细胞，例如人类细胞。任何人类细胞都适合使用本文公开的密码子优化的B-GEn.1或B-GEn.2系统。

在一些实施方案中，离体或体外细胞包含：(a)包含编码本文所述的B-GEn.1或B-GEn.2多肽或变体的密码子优化的多核苷酸序列的核酸，或由核酸表达的B-GEn.1或B-GEn.2多肽或其变体；和(b)编码该gRNA的gRNA或核酸，其中该gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列。在一些实施方案中，所述细胞包含核酸，核酸包含密码子优化的多核苷酸序列。在一些实施方案中，细胞包括gRNA。在一些实施方案中，细胞包含编码gRNA的核酸。在一些实施方案中，gRNA是单向导RNA(sgRNA)。在一些实施方案中，细胞包含一个或多个额外的gRNA或编码一个或多个额外的gRNA的核酸。在一些实施方案中，细胞进一步包含供体模板。

在一方面，本文公开的一些实施方案涉及转化细胞的方法，该方法包括将本文提供的核酸引入至宿主细胞，例如动物细胞，并选择或筛选转化的细胞。术语“宿主细胞”和“重组宿主细胞”在本文可互换使用。应当理解，这样的术语不仅指特定的受试者细胞，而且还指这样的细胞的子代或潜在子代。因为，由于突变或环境影响，某些修饰可发生在后代，这样的后代实际上可与亲本细胞不相同，但仍包括在本文所用术语的范围内。用于转化多种上述宿主细胞和物种的技术是本领域已知的，且记载于技术和科学文献中。因此，包含本文所公开的至少一个重组细胞的细胞培养物也在本申请的范围内。适合于产生和维持细胞培养物的方法和系统是本领域已知的。

在相关方面，一些实施方案涉及重组宿主细胞，例如，包括本文所述核酸的重组动物细胞。核酸可以稳定地整合在宿主基因组中，或可以单独复制，或作为微环表达载体存在于重组宿主细胞中进行稳定或短暂表达。因此，在本文公开的一些实施方案中，核酸作为游离单位在重组宿主细胞中维持和复制。在一些实施方案中，将核酸稳定地整合到重组细胞的基因组中。在一些实施方案中，核酸作为用于稳定或瞬时表达的微环表达载体存在于重组宿主细胞中。

在一些实施方案中，宿主细胞可以用例如本申请的载体构建体进行基因工程(如，转导或转化或转染)，该载体构建体可以是例如用于同源重组的载体，其包含与宿主细胞基因组的一部分同源的核酸序列，或者可以为用于任何表达或感兴趣基因的组合的表达载体。例如，载体可以为质粒、病毒颗粒、噬菌体等形式。在一些实施方案中，用于感兴趣多肽的表达的载体也可以被设计为整合到宿主中，如，通过同源重组。

在一些实施方案中，本公开内容提供了基因修饰的宿主细胞，如，分离的基因修饰的宿主细胞，其中基因修饰的宿主细胞包含：1)外源的向导RNA；2)外源的核酸，其包含编码向导RNA的核苷酸序列；3)外源核酸，其包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的多核苷酸序列；4)外源的B-GEn.1或B-GEn.2多肽或其变体，其由包含密码子优化的多核苷酸序列的核酸表达；或5)上述任何组合。在一些实施方案中，通过对宿主细胞进行遗传修饰来产生基因修饰的细胞，例如：1)外源的向导RNA；2)外源的核酸，其包含编码向导RNA的核苷酸序列；3)外源的核酸，其包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的多核苷酸序列；4)外源的B-GEn.1或B-GEn.2多肽或其变体，其由包含密码子优化的多核苷酸序列的核酸表达；或5)上述任何组合。

如上所述，所有适合作为靶细胞的细胞也适合作为基因修饰的宿主细胞。例如，感兴趣的基因修饰的宿主细胞可以是来自任何生物体的细胞，如细菌细胞、古细菌细胞、单细胞真核生物的细胞、植物细胞、藻类细胞(如，布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorela pyrenoidosa)、展枝马尾藻(Sargassum patens(C.Agardh))等)、真菌细胞(如，酵母细胞)、动物细胞、来自无脊椎动物(如，果蝇(fruit fly)、刺胞动物(cnidarian)、棘皮动物(echinoderm)、线虫(nematode)等)的细胞，来自脊椎动物(如，鱼、两栖动物、爬行动物、鸟类、哺乳动物)的细胞，来自哺乳动物(如，猪、牛、山羊、绵羊、啮齿动物大鼠、小鼠、非人灵长类动物、人类等)的细胞。在一些实施方案中，基因修饰的宿主细胞可以为来自人的任何细胞。

在一些实施方案中，本公开内容的基因修饰的宿主细胞已使用含有编码B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列的外源的核酸进行基因修饰。在一些实施方案中，基因修饰的宿主细胞使用包含编码本文所述的B-GEn.1或B-GEn.2多肽或变体的核苷酸序列的外源的核酸进行基因修饰。通过向细胞中引入向导RNA(或编码向导RNA的DNA，其决定待修饰的基因组位置/序列)和任选地供体核酸，基因修饰的宿主细胞的DNA可以被靶向修饰。在某些实施方案中，编码B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列可操作地连接至可诱导的启动子(如热休克启动子(heat shock promoter)、四环素调控启动子(Tetracycline-regulated promoter)、类固醇调控启动子(Steroid-regulatedpromoter)、金属调控启动子(Metal-regulated promoter)、雌激素受体调控启动子(estrogen receptor-regulated promoter)等)。在一些实施方案中，编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列可操作地连接至空间限制性和/或时间限制性启动子(如组织特异性启动子、细胞类型特异性启动子、细胞周期特异性启动子)。在一些实施方案中，编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列可操作地连接至组成型启动子。

在一些实施方案中，基因修饰的宿主细胞是体外的。在一些实施方案中，基因修饰的宿主细胞在体内。在一些实施方案中，基因修饰的宿主细胞是原核细胞或源自原核细胞。在一些实施方案中，基因修饰的宿主细胞是细菌细胞或源自细菌细胞。在一些实施方案中，基因修饰的宿主细胞是古细胞，或源自古细胞。在一些实施方案中，基因修饰的宿主细胞是真核细胞或源自真核细胞。在一些实施方案中，基因修饰的宿主细胞是植物细胞或源自植物细胞。在一些实施方案中，基因修饰的宿主细胞是动物细胞或源自动物细胞。在一些实施方案中，基因修饰的宿主细胞是无脊椎动物细胞或源自无脊椎动物细胞。在一些实施方案中，基因修饰的宿主细胞是脊椎动物细胞或源自脊椎动物细胞。在一些实施方案中，基因修饰的宿主细胞是哺乳动物细胞或源自哺乳动物细胞。在一些实施方案中，基因修饰的宿主细胞是啮齿类细胞或源自啮齿类细胞。在一些实施方案中，基因修饰的宿主细胞是人类细胞或源自人类细胞。在一些实施方案中，基因修饰的宿主细胞是人类细胞或源自人类细胞。

本公开内容进一步提供了基因修饰的细胞的后代，其中后代可包括与其衍生的基因修饰的细胞相同的外源核酸或多肽。在一些实施方案中，本公开内容进一步提供了包含基因修饰的宿主细胞的组合物。

在一些实施方案中，基因修饰的宿主细胞是基因修饰的干细胞或祖细胞。合适的宿主细胞包括，如干细胞(成人干细胞、胚胎干细胞、iPS细胞等)和祖细胞(如心脏祖细胞、神经祖细胞等)。其他合适的宿主细胞包括哺乳动物干细胞和祖细胞，例如啮齿动物干细胞、啮齿动物祖细胞、人类干细胞、人类祖细胞等。其他合适的宿主细胞包括体外宿主细胞，如分离的宿主细胞。在一些实施方案中，基因修饰的宿主细胞包含外源的向导RNA核酸。在一些实施方案中，基因修饰的宿主细胞包含外源核酸，该核酸包含编码向导RNA的核苷酸序列。在一些实施方案中，基因修饰的宿主细胞包含由密码子优化的核苷酸序列表达的外源B-GEn.1或B-GEn.2多肽或其变体。在一些实施方案中，基因修饰的宿主细胞包含外源核酸，该核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。在一些实施方案中，基因修饰的宿主细胞包括外源核酸，该核酸包含1)编码向导RNA的核苷酸序列和2)编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。

非人基因修饰的生物体

在一些实施方案中，基因修饰的宿主细胞已用外源核酸进行基因修饰，外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。如果这样的细胞是真核单细胞生物体，那么经修饰的细胞可视为基因修饰的生物体。在一些实施方案中，非人基因修饰的生物体是B-GEn.1或B-GEn.2转基因的多细胞生物。

在一些实施方案中，基因修饰的非人类宿主细胞(如，用外源核酸进行基因修饰的细胞，该外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列)可产生基因修饰的非人类生物体(如，小鼠、鱼、蛙、蝇、蠕虫等)。例如，如果基因修饰的宿主细胞是多能干细胞(如，PSC)或生殖细胞(如精子、卵细胞等)，则整个基因修饰的生物体可源自基因修饰的宿主细胞。在一些实施方案中，基因修饰的宿主细胞是体内或体外的多能干细胞(如，ESC、iPSC、多能植物干细胞等)或生殖细胞(如精子细胞、卵细胞等)，其可产生基因修饰的生物体。在一些实施方案中，基因修饰的宿主细胞是脊椎动物的PSC(如ESC、iPSC等)，并用于产生基因修饰的生物体(如将PSC注射到囊胚中产生嵌合的/整合的动物(chimeric/mosaic animal)，然后进行交配产生非嵌合的/非整合的基因修饰的生物体；植物的嫁接等)。任何合适的生产基因修饰的生物体的方法/方案，包括本文所述的方法，都适用于生产包含外源核酸的基因修饰的宿主细胞，所述外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。生产基因修饰的生物体的方法是本领域已知的。例如，参见Cho等人,Curr Protoc Cell Biol.2009年3月；第19章:Unit 19.11:Generation of transgenic mice；Gama等人,Brain Struct Funct.2010年3月；214(2-3):91-109.Epub 2009年11月25日:Animal transgenesis:an overview；Husaini等人,GMCrops.2011年6月-12月；2(3):150-62.Epub 2011年6月1日:Approaches for genetargeting and targeted gene expression in plants。

在一些实施方案中，基因修饰的生物体包含用于本公开内容方法的靶细胞，且因此可视为靶细胞的来源。例如，如果包含外源核酸的基因修饰的细胞被用于产生基因修饰的生物体，该外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列，那么基因修饰的生物体的细胞包含外源核酸，该外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。在一些这样的实施方案中，可通过向细胞中引入向导RNA(或编码向导RNA的DNA)和任选地供体核酸，基因修饰的生物体的一个或多个细胞的DNA可以被靶向修饰。例如，将向导RNA(或编码向导RNA的DNA)引入到基因修饰的生物体的细胞(如脑细胞、肠道细胞、肾细胞、肺细胞、血细胞等)亚集中，可以靶向修饰这些细胞的DNA，其基因组位置取决于引入的向导RNA的DNA靶向序列。

在一些实施方案中，基因修饰的生物体是本公开内容方法的靶细胞来源。例如，包含用外源核酸基因修饰的细胞的基因修饰的生物体，外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列，可以提供基因修饰的细胞源，例如PSCs(如ESCs、iPSCs、精子、卵细胞等)、神经元、祖细胞、心肌细胞等。

在一些实施方案中，基因修饰的细胞是包含外源核酸的PSC，外源核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。因此，PSC可以是靶细胞，使得通过向PSC中引入向导RNA(或编码向导RNA的DNA)和任选地供体核酸，可以靶向修饰PSC的DNA，而修饰的基因组位置将取决于引入的向导RNA的DNA靶向序列。因此，在一些实施方案中，本文所述的方法可用于修饰源自基因修饰的生物体的PSC的DNA(如缺失和/或替换任何所需的基因组位置)。这样修饰过的PSC随后可用于产生同时具有以下两种特征的生物体：(i)包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列的外源核酸；(ii)引入到PSC的DNA修饰。

在一些实施方案中，外源核酸可以受未知启动子的控制(如，与未知启动子可操作地连接)(如，当核酸随机整合至宿主细胞基因组中时)，也可以受已知启动子的控制(例如，与已知启动子可操作连接)。合适的已知启动子可以是任何已知启动子，包括组成型活性启动子(如CMV启动子)、诱导型启动子(如热休克启动子、四环素调控启动子、类固醇调控启动子、金属调控启动子、雌激素受体调控启动子等)、空间限制性和/或时间限制性启动子(如组织特异性启动子、细胞类型特异性启动子等)等。

基因修饰的生物体(如，其细胞包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列的生物体)可以是任何生物，包括例如植物；藻类；无脊椎动物(如刺胞动物、棘皮动物、蠕虫、苍蝇等)；脊椎动物(如鱼类(如斑马鱼、河豚、金鱼等)；两栖动物(如蝾螈、青蛙等)；爬行动物、鸟类、哺乳动物等)；有蹄类动物(如山羊、猪、绵羊、牛等)；啮齿动物(如小鼠、大鼠、仓鼠、豚鼠等)；长尾目动物(如兔子)等。

在一些实施方案中，活性部分是多个RNase结构域。在一些实施方案中，活性部分是DNase结构域。

转基因的非人类动物

如上所述，在一些实施方案中，核酸(例如编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列)或重组表达载体用作转基因，以生成生产B-GEn.1或B-GEn.2多肽或其变体的转基因动物。因此，本公开内容进一步提供了一种转基因非人类动物，该动物包含转基因，该转基因包含核酸，该核酸包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列，如上所述。在一些实施方案中，转基因非人类动物的基因组包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。在一些实施方案中，转基因非人类动物对于基因修饰是同源的。在一些实施方案中，转基因非人类动物对于基因修饰是异源的。在一些实施方案中，转基因非人类动物是脊椎动物，例如鱼类(如斑马鱼、金鱼、河豚、洞穴鱼等)、两栖动物(青蛙、蝾螈等)、鸟类(如鸡、火鸡等)、爬行动物(如蛇、蜥蜴等)、哺乳动物(如有蹄类动物，如猪、牛、山羊、绵羊等；长尾目动物(如兔子)；啮齿动物(如大鼠、小鼠)；非人灵长类动物等)等。

在一些实施方案中，核酸是外源核酸，其包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。在一些实施方案中，外源核酸可以受未知启动子的控制(例如，与未知启动子可操作连接)(例如，当核酸随机整合到宿主细胞基因组中时)，也可以受已知启动子的控制(例如，与已知启动子可操作连接)。合适的已知启动子可以是任何已知启动子，包括组成型活性启动子(如CMV启动子)、诱导型启动子(如热休克启动子、四环素调控启动子、类固醇调控启动子、金属调控启动子、雌激素受体调控启动子等)、空间限制性和/或时间限制性启动子(如组织特异性启动子、细胞类型特异性启动子等)等。

将核酸引入到宿主细胞

在一些实施方案中，本公开内容的方法包括涉及将一种或多种核酸引入到宿主细胞(或宿主细胞群)，所述核酸包含编码向导RNA的核苷酸序列和/或编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列。在一些实施方案中，包含靶DNA的细胞是体外细胞。在一些实施方案中，包含靶DNA的细胞是体内细胞。在一些实施方案中，编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列与诱导启动子可操作地连接。在一些实施方案中，编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列与组成型启动子可操作地连接。

向导RNA或包含编码向导RNA的核苷酸序列的核酸可通过任何各种众所周知的方法引入到宿主细胞。类似地，当方法涉及将包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的核苷酸序列的核酸引入到宿主细胞时，这种核酸可以通过任何各种众所周知的方法引入到宿主细胞。向导多核苷酸(RNA或DNA)和/或B-GEn.1或B-GEn.2多核苷酸(RNA或DNA)可通过本领域已知的病毒或非病毒递送载体递送。

将核酸引入到宿主细胞的方法是本领域已知的，任何已知的方法都可用于将核酸(如表达构建体)引入到干细胞或祖细胞。合适的方法包括，例如病毒或噬菌体感染、转染、缀合、原生质体融合、脂质感染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、二乙胺乙基葡聚糖(DEAE-dextran)介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微量注射、纳米粒子介导的核酸递送(参见如Panyam等人，Adv Drug Deliv Rev.2012年9月13日.pii:50169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)等，包括但不限于外泌体递送。

多核苷酸可通过非病毒递送载体递送，包括但不限于纳米颗粒、脂质体、核糖核蛋白、带正电的肽、小分子RNA缀合物、适配体-RNA嵌合体和RNA融合蛋白复合物。一些示例性的非病毒递送载体记载于Peer和Lieberman，Gene Therapy，18:1127-1133(2011)(其关注于siRNA的非病毒递送载体，这些载体也可用于递送其他多核苷酸)。

用于递送本公开内容的核酸(如mRNA和sgRNA)以进行基因编辑的合适系统和技术包括脂质纳米颗粒(LNPs)。如本文所使用的，术语“脂质纳米颗粒”包括脂质体，不论其薄片度(lamellarity)、形状或结构如何，也包括描述用于将核酸和/或多肽引入到细胞的脂质复合物。这些脂质纳米颗粒可与生物活性化合物(如核酸和/或多肽)复合，并可用作体内递送载体。通常，本领域已知的任何方法都可用于制备包含本公开内容的一种或多种核酸的脂质纳米颗粒，以及制备生物活性化合物与所述脂质纳米颗粒的复合物。这样的方法的实例已被广泛公开，如在Biochim Biophys Acta 1979,557:9；Biochim et Biophys Acta1980,601:559；Liposomes:A practical approach(Oxford University Press,1990)；Pharmaceutica Acta Helvetiae 1995,70:95；Current Science 1995,68:715；PakistanJournal of Pharmaceutical Sciences 1996,19:65；Methods in Enzymology 2009,464:343。制备包含本公开内容的一种或多种核酸和/或多肽的LNP制剂的特别合适的系统和技术包括但不限于由Intellia(参见，如，WO2017173054A1)、Alnylam(参见，如，WO2014008334A1)、Modernatx(参见、如，WO2017070622A1和WO2017099823A1)、TranslateBio、Acuitas(参见，如，WO2018081480A1)、Genevant Sciences、ArbutusBiopharma、Tekmira、Arcturus、Merck(参见，如WO2015130584A2)、诺华(Novartis)(参见，如，WO2015095340A1)和Dicerna所开发的那些系统和技术；所有这些文献的均通过引用以其整体内容并入本文。

包含编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列的合适核酸包括表达载体，其中表达载体包含编码向导的核苷酸序列。在一些实施方案中，表达载体是病毒构建体，例如重组腺相关病毒构建体(参见，如美国专利号7,078,387)、重组腺病毒构建体、重组慢病毒构建体、重组逆转录病毒构建体等。合适的表达载体包括但不限于病毒载体(如基于疫苗病毒的病毒载体；基于脊髓灰质炎病毒的病毒载体；基于腺病毒的病毒载体(参见，如Li等人,Invest Opthalmol Vis Sci 35:25432549,1994；Borras等人,GeneTher 6:515 524,1999；Li和Davidson,PNAS 92:7700 7704,1995；Sakamoto等人,H GeneTher 5:10881097,1999；WO 94/12649,WO 93/03769；WO 93/19191；WO 94/28938；WO 95/11984和WO 95/00655)；腺相关病毒(参见，如Ali等人,Hum Gene Ther 9:8186,1998,Flannery等人,PNAS 94:6916 6921,1997；Bennett等人,Invest Opthalmol Vis Sci 38:2857 2863,1997；Jomary等人,Gene Ther 4:683-690,1997,Rolling等人,Hum Gene Ther10:641 648,1999；Ali等人,Hum Mol Genet 5:591 594,1996；Srivastava in WO 93/09239,Samulski等人,J.Vir.(1989)63:3822-3828；Mendelson等人,Viral.(1988)166:154-165；和Flotte等人,PNAS(1993)90:10613-10617)；SV40；单纯疱疹病毒；人类免疫缺陷病毒(参见，如，Miyoshi等人，PNAS 94:10319-23，1997；Takahashi等人，J Virol 73:78127816，1999)；逆转录病毒载体(如，鼠白血病病毒、脾坏死病毒、逆转录病毒衍生的载体，例如Rous肉瘤病毒、Harvey肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒)等。

腺相关病毒(AAV)

重组腺相关病毒(AAV)载体可用于递送。本领域生产rAAV粒子的已知技术是在两个AAV反向末端重复序列(ITR)、AAV rep和cap基因以及辅助病毒功能之间提供具有待递送多核苷酸的细胞。生产rAAV需要在单个细胞(在此称为包装细胞)中具备以下成分：两个ITR之间的感兴趣的多核苷酸、与AAV基因组分离(即不在AAV基因组中)的AAV rep和cap基因以及辅助病毒功能。AAV rep和cap基因可以来自任何重组病毒可衍生的AAV血清型，也可以来自与包装多核苷酸上的ITR不同的AAV血清型，包括但不限于AAV血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13和AAV rh.74。例如，WO 01/83692公开了假病毒rAAV的生产。

AAV血清型	Genbank登录号
		AAV-1	NC_002077.1
AAV-2	NC_001401.2
		AAV-3	NC_001729.1
AAV-38	AF028705.1
		AAV-4	NC_001829.1
AAV-5	NC_006152.1
		AAV-6	AF028704.1
AAV-7	NC_006260.1
		AAV-8	NC_006261.1
AAV-9	AX753250.1
		AAV-10	AY631965.1
AAV-11	AY631966.1
		AAV-12	00813647.1
AAV-13	EU285562.1

产生包装细胞的方法是创建稳定表达AAV粒子生产所需的所有成分的细胞系。例如，将质粒(或多个质粒)整合到细胞的基因组中，该质粒包含多个AAV ITR之间的感兴趣的多核苷酸、独立于AAV基因组的AAV rep和cap基因以及可选择标记物，例如新霉素抗性基因。AAV基因组已通过例如GC加尾(Samulski等人,1982,Proc.Natl.Acad.Sci.USA,79:2077-2081)、添加含有限制性核酸内切酶裂解位点的合成接头(Laughlin等人,1983,Gene,23:65-73)或直接钝性末端连接(Senapathy&Carter,1984,J.Bioi.Chem.,259:4661-4666)等程序引入到细菌质粒。然后用辅助病毒，例如腺病毒，感染包装细胞系。这种方法的优点是细胞具有可选择性，且适合大规模生产rAAV。其他合适方法的实例是利用腺病毒或杆状病毒而不是质粒将rAAV基因组和/或rep和cap基因引入到包装细胞。

rAAV生产的一般原则在如下文献中综述，例如，Carter,1992,Current Opinionsin Biotechnology,1533-539；和Muzyczka,1992,Curr.Topics in Microbial.andlmmunol.,158:97-129)。多种方法记载于Ratschin等人,Mol.Cell.Biol.4:2072(1984)；Hermonat等人.,Proc.Natl.Acad.Sci.USA,81:6466(1984)；Tratschin等人,Mol.Cell.Biol.5:3251(1985)；Mclaughlin等人,J.Virol.,62:1963(1988)；和Lebkowski等人,1988Mol.Cell.Biol.,7:349(1988)。Samulski等人(1989,J.Virol.,63:3822-3828)；美国专利号5,173,414；WO 95/13365和相应的美国专利号5,658.776；WO 95/13392；WO 96/17947；PCT/US98/18600；WO97/09441(PCT/US96/14423)；WO 97/08298(PCT/US96/13872)；WO 97/21825(PCT/US96/20777)；WO 97/06243(PCT/FR96/01064)；WO 99/11764；Perrin等人(1995)Vaccine 13:1244-1250；Paul等人(1993)Human Gene Therapy 4:609-615；Clark等人(1996)Gene Therapy 3:1124-1132；美国专利号5,786,211；美国专利号5,871,982；和美国专利号6,258,595.

用于转导的AAV载体血清型取决于靶细胞类型。例如，下列示例性细胞类型已知地可由指示的AAV血清型等转导。

组织/细胞类型	血清型
		肝	AAV8,AAV9
骨骼肌	AAV1,AAV7,AAV6,AAV8,AAV9
		中枢神经系统	AAV5,AAV1,AAV4
RPE	AAV5,AAV4
		感光细胞	AAV5
肺	AAV9
		心	AAV8
胰腺	AAV8
		肾脏	AAV2

本领域技术人员已知许多合适的表达载体，且许多是可商购的。以下载体以实例方式提供；对于真核宿主细胞：pXT1,pSG5(Stratagene)，pSVK3,pBPV,pMSG和pSVLSV40(Pharmacia)。然而，只要与宿主细胞兼容，可以使用任何其他载体。

根据所使用的宿主/载体系统，可以在表达载体中使用许多合适的转录和翻译控制元件，包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见如Bitter等人(1987)Methods in enzyme,153:516-544)。

在一些实施方案中，向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体可作为RNA提供。在这种情况下，向导RNA和/或编码B-GEn.1或B-GEn.2多肽或其变体的RNA可通过直接化学合成产生，或可在体外从编码该向导RNA的DNA转录。从DNA模板合成RNA的方法在本领域是众所周知的。在一些实施方案中，向导RNA和/或编码B-GEn.1或B-GEn.2多肽或其变体的RNA将使用RNA聚合酶(如T7聚合酶、T3聚合酶、SP6聚合酶等)在体外合成。一旦合成，RNA可直接接触靶DNA，或可通过任何众所周知的将核酸引入到细胞的技术(如显微注射、电穿孔、转染等)引入到细胞。

编码向导RNA(作为DNA或RNA引入)和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸(作为DNA或RNA引入)和/或供体多核苷酸可以使用成熟的转染技术提供给细胞；参见，如Angel和Yanik(2010)PLoS ONE 5(7):e 11756，以及Qiagen公司的市售试剂、源自Stemgent的stemeffect^TMRNA转染试剂盒和源自Mims Bio的/>-mRNA转染试剂盒。另参见Beumer等人(2008)Efficient gene targeting inDrosophila by direct embryo injection with zinc-finger nucleases.PNAS105(50):19821-19826。此外或替代地，编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体的核酸和/或供体多核苷酸可在DNA载体上提供。可获得许多载体，如质粒、粘粒、微环、噬菌体、病毒等可用于将核酸转移至靶细胞。包含核酸的载体可保持游离状态，如质粒、微环DNA、巨细胞病毒、腺病毒等，或其也可通过同源重组或随机整合整合至靶细胞基因组中，如逆转录病毒衍生的载体，例如MMLV、HIV-1、ALV等。

载体可以直接提供给细胞。换句话说，细胞与包含编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体的核酸和/或供体多核苷酸的载体接触，使得载体被细胞摄取。将细胞与作为质粒的核酸载体接触的方法，包括电穿孔、氯化钙转染、显微注射和脂质体感染，在本领域是众所周知的。对于病毒载体的递送，细胞与含有编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体的核酸和/或供体多核苷酸的病毒颗粒接触。逆转录病毒，例如慢病毒，特别适用于本公开内容的方法。常用的逆转录病毒载体是“有缺陷的”，如，不能产生有效感染所需的病毒蛋白。相反，载体的复制需要在包装细胞系中生长。为了产生包含感兴趣的核酸的病毒颗粒，由包装细胞系将包含核酸的逆转录病毒核酸包装到病毒衣壳中。不同的包装细胞系提供不同的包膜蛋白(生态型、两性型或异向型)来整合至衣壳中，这种包膜蛋白决定了细胞的病毒颗粒的特异性(小鼠和大鼠的生态型；对于大多数哺乳动物细胞类型，包括人、狗和老鼠，均为两性型；且除小鼠细胞外，大多数哺乳动物细胞类型都是异种型)。可使用适当的包装细胞系来确保细胞被包装的病毒颗粒靶向。将包含编码重编程因子的核酸的逆转录病毒载体引入到包装细胞系并收集由所述包装细胞系产生的病毒颗粒的方法是本领域众所周知的。核酸也可以通过直接显微注射(如将RNA注射到斑马鱼胚胎中)来引入。

用于将编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体的核酸和/或供体多核苷酸提供给细胞的载体通常包含用于驱动感兴趣的核酸的表达(即转录激活)的合适启动子。换句话说，感兴趣的核酸将可操作地连接到启动子上。这可能包括无处不在的活性启动子，例如CMV-13-肌动蛋白启动子，或诱导启动子，例如在特定细胞群中活跃的启动子或对药物(例如四环素)的存在作出反应的启动子。通过转录激活，预期转录将在靶细胞的基础水平上增加至少10倍，至少100倍，更通常的是至少1000倍。此外，用于将向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体和/或供体多核苷酸提供给细胞的载体可包括编码靶细胞中可选择的标记物的核酸序列，以便识别已摄取向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体和/或供体多核苷酸的细胞。

向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或B-GEn.1或B-GEn.2融合多肽或其变体可代替地用于接触DNA或作为RNA引入到细胞。将RNA引入细胞的方法是本领域已知的，并且可以包括例如，直接注射、转染或用于引入DNA的任何其他方法。B-GEn.1或B-GEn.2多肽或其变体可代替地作为多肽提供给细胞。这样的多肽可任选地融合到增加产物溶解度的多肽结构域。结构域可通过确定的蛋白酶裂解位点连接到多肽上，如TEV序列，该序列被TEV蛋白酶切割。接头还可以包括一个或多个柔性序列，例如从1到10个甘氨酸残基。在一些实施方案中，融合蛋白的切割在保持产物溶解度的缓冲液中进行，如存在0.5至2M尿素的情况，存在增加溶解度的多肽和/或多核苷酸等的情况等。感兴趣的结构域包括内涵体溶解结构域(endosomolytic domain)，如流感病毒HA结构域；和其他有助于生产的多肽，如IF2结构域、GST结构域、GRPE结构域等。可制定多肽以提高稳定性。例如，肽可被聚乙二醇化(PEGylated)，其中聚乙烯氧基(polyethyleneoxy group)提供延长在血液中的寿命。

此外，或替代地，B-GEn.1或B-GEn.2多肽或其变体可融合到多肽渗透结构域以促进细胞的摄取。多种渗透结构域是本领域已知的，且可用于本公开内容的非整合多肽，包括多肽、肽拟物和非肽载体。例如，渗透肽可源自黑腹果蝇转录因子触角足基因(Antennapaedia)的第三个α螺旋，称为渗透肽(penetratin)，其包含氨基酸序列RQIKIWFQNRRMKWKK(该序列不在本专利申请项下的公开内容)。作为另一个实例，渗透肽包含HIV-1 tat碱性区域的氨基酸序列，其可包括，例如天然存在的tat蛋白质的氨基酸49-57。

其它渗透肽结构域包括多精氨酸基序，例如，HIV-1rev蛋白的氨基酸34-56区域、九聚精氨酸(nona-arginine)、acta-精氨酸等。(参见，例如，Futaki等人(2003)CurrProtein Pept Sci.2003Apr；4(2):87-9和446；和Wender等人(2000)Proc.Natl.Acad.Sci.U.S.A.2000年11月21日；97(24):13003-8；公开的美国专利申请公开号20030220334；20030083256；20030032593；和20030022831，通过引用特别并入本文，以教导易位肽和肽类)。九聚精氨酸(R9)序列是已被表征的更有效的PTD之一(Wender等人,2000；Uemura等人2002)。为了优化多肽的生物活性、分泌或结合特性，可选择进行融合的位点。最佳位点可通过常规试验确定。在一些实施方案中，多肽渗透结构域被化学修饰以增加PTD的生物利用度。在Expert Opin Drug Deliv.2009年11月；6(11):1195-205中公开了示例性修饰。

通常，向靶DNA或细胞提供有效量的向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸以诱导靶向修饰。向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸的有效量是相对于阴性对照，例如，与空载体或不相关多肽接触的细胞，诱导用gRNA观察到的靶向修饰量的2倍的增加或更多。也就是说，有效的量或剂量的向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸将诱导2倍增加、3倍增加，4倍增加或更多的在靶DNA区域处观察到的靶修饰的量，在一些实施方案中，5倍增加、6倍增加或更多，有时7倍或8倍增加或更多观察到的重组量，如增加10倍、50倍或100倍或更多，在一些实施方案中，增加200倍、500倍、700倍或1000倍或更多，如观察到的重组量增加5000倍或10,000倍。靶修饰量可用任何合适的方法测量。例如，可将包含与向导RNA(其侧翼为同源序列)的间隔区互补序列的分裂报告构建体，当重组时，将重建编码活性报告子的核酸被共转染到细胞中，并且在与向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸接触后，例如2小时、4小时、8小时、12小时、24小时、36小时、48小时、72小时或更长时间，评估报告蛋白的量。作为另一种更灵敏的测定，例如，在与向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸接触后，例如在与向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸接触后2小时、4小时、8小时、12小时、24小时、36小时、48小时、72小时或更长时间，可通过PCR或区域的Southern杂交来评估在包含靶DNA序列的基因组DNA感兴趣区域处的重组程度。

使细胞与向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸接触可以在促进细胞存活的任何培养基和任何培养条件下进行。例如，细胞可悬浮在任何合适的营养培养基中，如伊思柯夫(lscove)改良的DMEM或RPMI1640，补充有胎牛血清或热灭活胎牛血清(约5-10％)，L-谷氨酰胺，硫醇，特别是2-巯基乙醇，和抗生素，如青霉素和链霉素。培养基可含有细胞有反应的生长因子。如本文所限定的，生长因子是能够通过对跨膜受体的特定作用促进细胞在培养物或完整组织中的存活、生长和/或分化的分子。生长因子包括多肽因子和非多肽因子。促进细胞存活的条件通常允许非同源末端连接和同源定向修复。在期望将多核苷酸序列插入靶DNA序列的应用中，还向细胞提供包含待插入的供体序列的多核苷酸。“供体序列”或“供体多核苷酸”是指在B-GEn.1或B-GEn.2多肽或其变体诱导的切割位点插入的核酸序列。供体多核苷酸与切割位点的侧翼基因组区域具有足够的序列同一性，如与切割位点侧翼的核苷酸序列，如在切割位点的大约50个碱基或更少的碱基内，如在大约30个碱基内，在大约15个碱基内，在大约10个碱基内，在大约5个碱基内，或紧邻切割位点的侧翼具有70％、80％、85％、90％、95％或100％的序列同一性，以支持其和与其具有同源性的基因组序列之间的同源定向修复。供体和基因组序列之间的同源序列的大约25、50、100或200个核苷酸，或超过200个核苷酸(或10至200个核苷酸之间的任何整数值，或更多)将支持同源定向修复。供体序列可以是任何长度，如10个或更多核苷酸、50个或更多核苷酸、100个或更多核苷酸、250个或更多核苷酸、500个或更多核苷酸、1000个或更多核苷酸、5000个或更多核苷酸等。

供体序列通常与它所取代的基因组序列不完全相同。相反，供体序列可包含相对于基因组序列的至少一个或多个单碱基替换、插入、缺失、反转或重排，只要存在足够的序列同一性以支持同源性定向修复。在一些实施方案中，供体序列包括由与靶DNA区域同源的两个区域(也称为同源臂)侧翼的非同源序列，使得靶DNA区域和两个侧翼同源臂之间的同源定向修复导致非同源序列在靶区域处的插入。供体序列还可以包括载体骨架，该载体骨架包含与感兴趣的DNA区域不同源并且不打算插入到感兴趣的DNA区域中的序列。通常，供体序列的同源区与期望重组的基因组序列具有至少50％的序列同一性。在某些实施方案中，存在60％、70％、80％、90％、95％、98％、99％或99.9％的序列同一性。根据供体多核苷酸的长度，可以存在1％到100％序列同一性之间的任意值。供体序列可包括与基因组序列相比的某些序列差异，例如限制性位点、核苷酸多态性、可选择标记物(例如耐药基因、荧光蛋白、酶等)等，其可用于评估供体序列在切割位点的成功插入，或在某些情况下可用于其他目的(例如表示在靶向基因组基因座的表达)。在一些实施方案中，如果位于编码区，这种核苷酸序列差异将不会改变氨基酸序列，或者将使氨基酸变化不实质性地影响蛋白质的结构或功能。或者，这些序列差异可以包括侧翼重组序列，如FLPs、loxP序列等，这些序列可以在以后的时间被激活以去除标记物序列。

供体序列可以单链DNA、单链RNA、双链DNA或双链RNA的形式提供给细胞。其可以线性或圆形形式引入至细胞。如果以线性形式引入，则供体序列的末端可以通过本领域技术人员已知的方法来保护(如防止核酸外切酶降解)。例如，一个或多个双脱氧核苷酸残基被添加到线性分子的3’末端和/或自互补寡核苷酸(self-complementaryoligonucleotides)被连接到一端或两端。例如，参见Chang等人(1987)Proc.Natl.Acad.Sci.USA 84:4959-4963；Nehls等人(1996)Science 272:886-889。用于保护外源多核苷酸免于降解的额外的方法包括但不限于，添加末端氨基基团和使用修饰的核苷酸间连接，例如硫代磷酸酯(phosphorothioates)、氨基磷酸酯(phosphoramidates)和O-甲基核糖(O-methyl ribose)或脱氧核糖残基(deoxyribose residues)。作为保护线性供体序列末端的替代，可在同源臂之外包含额外长度的序列，其可以在不影响重组的情况下被降解。供体序列可以作为载体分子的一部分引入到细胞，该载体分子具有额外的序列，例如复制起点、启动子和编码抗生素耐药性的基因。此外，供体序列可以作为裸(如未修饰的)核酸引入，作为与例如脂质体或泊洛沙姆(poloxamer)的试剂形成复合物的核酸引入，或者可以通过病毒(例如腺病毒，AAV)递送，如上针对编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核酸和/或供体多核苷酸所述。

按照上述方法，可离体切割和修饰感兴趣的DNA区域，如“基因修饰”。在一些实施方案中，当可选择的标记物已插入至感兴趣的DNA区域中时，通过将基因修饰的细胞从剩余群体中分离出来，可以对那些包含基因修饰的细胞群体进行富集。在富集之前，“基因修饰”细胞可只占细胞群的约1％或更多(如，2％或更多，3％或更多，4％或更多，5％或更多，6％或更多，7％或更多，8％或更多，9％或更多，10％或更多，15％或更多，或20％或更多)。“基因修饰”细胞的分离可通过适合于所用可选择标记物的任何合适的分离技术来实现。例如，如果已经插入了荧光标记物，则可以通过荧光激活的细胞分选来分离细胞，而如果已经插入了细胞表面标记，则可以通过以下技术从异质群体中分离细胞：亲和分离技术，如磁选(magnetic separation)、亲和层析(affinity chromatography)、用附着在固体基质上的亲和试剂“分选(panning)”或其他合适的技术。提供精确分离的技术包括荧光激活的细胞分选器，它们可能具有不同程度的复杂性。例如多色通道、低角度和钝角光散射检测通道、阻抗通道等。可以通过使用与死细胞相关联的染料(例如碘化丙啶)来选择与死细胞相对的细胞。任何技术都可以使用，只要不对基因修饰的细胞的活力造成不适当的损害。以这种方式获得对包含修饰DNA的细胞高度富集的细胞组合物。所谓“高度富集”，是指基因修饰的细胞将是细胞组合物的70％或更多，75％或更多，80％或更多，85％或更多，90％或更多，例如，细胞组合物的约95％或更多，或98％或更多。换句话说，这种组合物可以是基因修饰细胞的实质上纯的组合物。

通过本文所述方法生产的基因修饰细胞可立即使用。此外或替代地，可将细胞冷冻在液氮温度下，并长期保存，解冻后可重复使用。在这种情况下，通常将细胞冷冻在10％的二甲基亚砜(DMSO)、50％的血清、40％的缓冲培养基(buffered medium)或通常在本领域中使用的其他一些这样的溶液中，以在这种冷冻温度下保存细胞，并以本领域通常已知的解冻冷冻培养细胞的方式解冻。

基因修饰的细胞可在各种培养条件下进行体外培养。细胞可在培养液中扩增，如在促进细胞增殖的条件下生长。培养基可为液体或半固体，如含有琼脂、甲基纤维素等。细胞群可悬浮在适当的营养培养基中，例如lscove改良的DMEM或RPMI 1640，通常添加有胎牛血清(约5-10％)、L-谷氨酰胺、硫醇(特别地2-巯基乙醇)和抗生素(如青霉素和链霉素)。培养物中可含有相应细胞对其有反应的生长因子。生长因子，如本文所定义的，是能够通过对跨膜受体的特定作用，在培养物或完整组织中促进细胞的存活、生长和/或分化的分子。生长因子包括多肽和非多肽因子。以这种方式进行基因修饰的细胞可移植给受试者，用于基因治疗等目的，如治疗疾病或作为抗病毒、抗病原或抗癌疗法；用于农业基因修饰生物体的生产，或用于生物学研究。受试者可以是新生儿、青少年或成年人。尤其值得关注的是哺乳动物。可用本方法治疗的哺乳动物种类包括犬科和猫科动物、马科动物、牛科动物、绵羊科动物等以及灵长类动物，特别是人类。动物模型，特别是小型哺乳动物(如小鼠、大鼠、豚鼠、仓鼠、长尾目动物(如兔子)等)可用于实验研究。

细胞可以单独提供给受试者，也可与合适的培养基或基质一起提供给受试者，如支持细胞在它们被移植的组织中的生长和/或组织(organization)。通常，至少施用1x10³个细胞，例如5x10³个细胞、1x10⁴个细胞、5x10⁴个细胞、1x10⁵个细胞、1x10⁶个细胞或更多。细胞可通过以下任一途径引入至受试者：肠道外(parenteral)、皮下(subcutaneous)、静脉内(intravenous)、颅内(intracranial)、椎管内(intraspinal)、眼内(intraocular)或注入脑脊液(spinal fluid)。细胞可通过注射、导管等方式被引入。用于局部递送，即向损伤部位递送的方法的实例包括，如通过Ommaya囊，如用于囊内递送(参见例如美国专利号5,222,982和5,385,582，通过引用并入本文)；通过弹丸式注射(bolus injection)，如通过注射器，如注射至关节中；通过持续输注，例如通过套管插入术(cannulation)，例如通过对流(参见美国专利号20070254842，通过引用并入本文)；或通过植入可逆性粘附细胞的装置(参见美国申请号20080081064和20090196903，通过引用并入本文)。也可将细胞引入至胚胎(如囊胚)，以用于产生转基因动物(如转基因小鼠)的目的。

在一些实施方案中，编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列可操作地连接至控制元件，如转录控制元件，例如启动子。转录控制元件通常在真核细胞(如哺乳动物细胞(如人类细胞))或原核细胞(如细菌或古细胞)中起作用。在一些实施方案中，编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列可操作地连接至多个控制元件，其允许编码向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列在原核细胞和真核细胞中都能表达。

启动子可以是组成型活性启动子(如，处于活性“开”状态的组成型的启动子)，它可为诱导型启动子(如，其活性/“开”或非活性/“关”的状态受外部刺激控制的启动子，如存在特定温度、化合物或蛋白质)，它可为空间限制性启动子(如，转录控制元件、增强子等)(如组织特异性启动子、细胞类型特异性启动子等)，以及它可为时间限制性启动子(如，在胚胎发育的特定阶段或生物过程的特定阶段，如小鼠的毛囊周期，启动子处于“开”状态或“关”状态)。

合适的启动子可以源自病毒且因此可以称为病毒启动子，或他们也可以源自任何生物体，包括原核生物或真核生物体。合适的启动子可用于驱动任何RNA聚合酶(如pol I、pol II、pol III)的表达。示例性启动子包括但不限于SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复(LTR)启动子、腺病毒主要晚期启动子(Ad MLP)；单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子，如CMV立即早期启动子区(CMVIE)、Rous肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等人,Nature Biotechnology 20,497-500(2002))，增强型U6启动子(如，Xia等人，Nucleic Acids Res.2003年9月1日；31(17))，人H1启动子(H1)等。

诱导型启动子的实例包括，但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代半乳糖苷(IPTG)调控启动子、乳糖诱导型启动子、热休克启动子、四环素调控启动子(如Tet-ON、Tet-OFF等)、类固醇调控启动子、金属调控启动子、雌激素受体调控启动子等。因此，诱导型启动子可由以下分子调控，其包括，但不限于强力霉素；RNA聚合酶(如T7 RNA聚合酶)；雌激素受体；雌激素受体融合蛋白等。

在一些实施方案中，启动子是空间限制性启动子(如，细胞类型特异性启动子、组织特异性启动子等)，使得在多细胞生物体中，启动子在特定细胞亚群中是活跃的(如，“开”)。空间限制性启动子也可称为增强子、转录控制元件、控制序列等。可使用任何合适的空间限制性启动子，且选择合适的启动子(如，脑特异性启动子、驱动在神经元亚群中表达的启动子、驱动在生殖系中表达的启动子、驱动在肺中表达的启动子、驱动在肌肉中表达的启动子、驱动在胰腺的胰岛细胞中表达的启动子等)将取决于生物体。例如，对于植物、苍蝇、蠕虫、哺乳动物、小鼠等，已知各种空间限制性启动子。因此，空间限制性启动子根据生物体可用于调控编码B-GEn.1或B-GEn.2多肽或其变体的核酸在多种不同组织和细胞类型中的表达。一些空间限制性启动子也为时间限制性，使得启动子在胚胎发育的特定阶段或生物过程的特定阶段(如小鼠的毛囊周期)处于“开”状态或“关”状态。

为了说明的目的，空间限制性启动子的实例包括，但不限于，神经元特异性启动子(neuron-specific promoter)、脂肪细胞特异性启动子(adipocyte-specific promoter)、心肌细胞特异性启动子(cardiomyocyte-specific promoter)、平滑肌特异性启动子(smooth muscle-specific promoter)、光感受器特异性启动子(photoreceptor-specificpromoter)等。神经元特异性空间限制性启动子包括但不限于神经元特异性烯醇化酶(neuron-specific enolase，NSE)启动子(参见，如EMBL HSEN02,X51956)；芳香族氨基酸脱羧酶(aromatic amino acid decarboxylase，AADC)启动子；神经丝启动子(neurofilamentpromoter)(参见，如GenBank HUMNFL,L04147)；突触蛋白启动子(synapsin promoter)(参见，如GenBank HUMSYNIB,M55301)；thy-1启动子(参见，如Chen等人(1987)Cell 51:7-19；和Llewellyn等人(2010)Nat.Med.16(10):1161-1166)；血清素受体启动子(serotoninreceptor promoter)(参见，如GenBank S62283)；酪氨酸羟化酶启动子(tyrosinehydroxylase promoter，TH)(参见，如Oh等人(2009)Gene Ther.16:437；Sasaoka等人(1992)Mol.Brain Res.16:274；Boundy等人(1998)J.Neurosci.18:9989；和Kaneda等人(1991)Neuron:583-594)；GnRH启动子(参见，如Radovick等人(1991)Proc.Natl.Acad.Sci.USA 88:3402-3406)；L7启动子(参见，如Oberdick等人(1990)Science248:223-226)；DNMT启动子(参见，如Bartge等人(1988)Proc.Natl.Acad.Sci.USA85:3648-3652)；脑啡肽启动子(enkephalin promoter)(参见，如Comb等人(1988)EMBOJ.17:3793-3805)；髓磷脂碱性蛋白(myelin basic protein，MBP)启动子；Ca2+/钙调蛋白依赖激酶II-α(Ca²⁺-calmodulin-dependent protein kinase II-alpha，CaMKIIa)启动子(参见，如Mayford等人(1996)Proc.Natl.Acad.Sci.USA 93:13250；和Casanova等人(2001)Genesis 31:37)；CMV增强子/血小板源性生长因子-p启动子(CMV enhancer/platelet-derived growth factor-ppromoter)(参见，如Liu等人(2004)Gene Therapy 11:52-60)等。

脂肪细胞特异性空间限制性启动子包括但不限于aP2基因启动子/增强子，如人aP2基因从-5.4kb至+21bp的区域(参见，如Tozzo等人(1997)Endocrinol.138:1604；Ross等人(1990)Proc.Natl.Acad.Sci.USA 87:9590；和Pavjani等人(2005)Nat.Med.11:797)；葡萄糖转运体-4(GLUT4)启动子(参见，如Knight等人(2003)Proc.Nat/.Acad.Sci.USA 100:14725)；脂肪酸转运酶(FAT/CD36)启动子(参见，如Kuriki等人(2002)Biol.Pharm.Bull.25:1476；和Sato等人(2002)J.Biol.Chem.277:15703)；硬脂酰辅酶A去饱和酶(stearoyl-CoA desaturase-1，SCD1)启动子(Tabor等人(1999)J.Biol.Chem.274:20603)；瘦素启动子(参见，如Mason等人(1998)Endocrinol.139:1013；和Chen等人(1999)Biochem.Biophys.Res.Comm.262:187)；脂联素启动子(参见，如Kita等人(2005)Biochem.Biophys.Res.Comm.331:484；和Chakrabarti(2010)Endocrinol.151:2408)；降脂素启动子(参见，如Platt等人(1989)Proc.Nat/.Acad.Sci.USA 86:7490)；抵抗素启动子(参见，如，Seo等人(2003)Malec.Endocrinol.17:1522)等。

心肌细胞特异性空间限制性启动子包括，但不限于来自以下基因的控制序列：肌球蛋白轻链-2、a-肌球蛋白重链、AE3、心肌钙蛋白C、心脏肌动蛋白等。Franz等人(1997)Cardiovasc.Res.35:560-566；Robbins等人(1995)Ann.N.Y.Acad.Sci.752:492-505；Linn等人(1995)Circ.Res.76:584591；Parmacek等人(1994)Mol.Cell.Biol.14:1870-1885；Hunter等人(1993)Hypertension 22:608-617；和Sartorelli等人(1992)Proc.Natl.Acad.Sci.USA 89:4047-4051。

平滑肌特异性空间限制性启动子包括，但不限于SM22a启动子(参见，如Akyilrek等人(2000)Mol.Med.6:983；和美国专利号7,169,874)；平滑肌肌动蛋白启动子(参见，如WO2001/018048)；α-平滑肌肌动蛋白启动子等。例如，SM22a启动子的0.4kb区域，其中具有两个CArG元件，已被证明介导血管平滑肌细胞特异性表达(参见，如Kim等人(1997)Mol.Cell.Biol.17,2266-2278；Li等人，(1996)J.Cell Biol.132,849-859；和Moessler,等人(1996)Development 122,2415-2425)。

光感受器特异性空间限制性启动子包括，但不限于视紫红质(rhodopsin)启动子、视紫红质激酶(rhodopsin kinase)启动子(Young等人(2003)Ophthalmol.Vis.Sci.44:4076)；β磷酸二酯酶基因启动子(Nicoud等人(2007)J.Gene Med.9:1015)；视网膜色素变性基因启动子(Nicoud等人(2007)，同上)；光感受器间视黄醇结合蛋白(IRBP)基因增强子(Nicoud等人(2007)，同上)；IRBP基因启动子(Yokoyama等人(1992)，Exp Eye Res.55:225)等。

含有向导RNA的组合物

在一些实施方案中，本文提供了包含向导RNA的组合物。除向导RNA外，该组合物还可包括以下一种或多种：盐，如NaCl、MgCl₂、KCl、MgSO₄等；缓冲剂，如三羟乙基缓冲液、N-(2-羟乙基)哌嗪-N’-(2-乙烷磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、MES钠盐、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟甲基]甲基-3-氨基丙磺酸(TAPS)等；增溶剂；洗涤剂，例如非离子洗涤剂，如Tween-20等；核酸酶抑制剂等。例如，在一些实施方案中，组合物包含向导RNA和用于稳定核酸的缓冲液。

在一些实施方案中，存在于组合物中的向导RNA是纯的，如，纯度至少75％、至少80％、至少85％、至少90％、至少95％、至少98％、至少99％或超过99％，其中“纯度％”是指向导RNA不含其他大分子或不含在向导RNA生产过程中可能存在的污染物的所述百分比。

包含B-GEn.1或B–GEn.2多肽的组合物

在一些实施方案中，本文提供了一种组合物，该组合物包含由密码子优化的多核苷酸序列表达的B-GEn.1或B-GEn.2多肽或其变体。除B-GEn.1或B-GEn.2多肽或其变体外，该组合物还包含以下一种或多种：盐，如NaCl、MgCl₂、KCl、MgSO₄等；缓冲剂，如Tris缓冲液、HEPES、MES、MES钠盐、MOPS、TAPS等；增溶剂；洗涤剂，例如非离子洗涤剂，如Tween-20等；核酸酶抑制剂；还原剂(如二硫苏糖醇(dithiothreitol))等。

在一些实施方案中，存在于组合物中的B-GEn.1或B-GEn.2多肽或其变体是纯的，例如纯度至少75％、至少80％、至少85％、至少90％、至少95％、至少98％、至少99％或99％以上，其中“纯度％”是指B-GEn.1或B-GEn.2多肽或其变体不含其它蛋白质、不含其它大分子或不含在生产B-GEn.1或B-GEn.2多肽或其变体过程中可能存在的污染物的所述百分比。

包含向导RNA和定点修饰多肽的组合物

在一些实施方案中，本文提供了一种组合物，其包含：(i)向导RNA或编码向导RNA的多核苷酸；和ii)核酸，其包含编码B-GEn.1或B-GEn.2多肽或其变体的密码子优化的多核苷酸序列，或由核酸表达的B-GEn.1或B-GEn.2多肽或其变体。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体展示修饰靶DNA的酶活性。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体展示修饰靶DNA编码的多肽的酶活性。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体可调控靶DNA的转录。

在一些实施方案中，组合物的各组分单独是纯的，如每种组分的纯度至少为75％、至少80％、至少90％、至少95％、至少98％、至少99％或至少99％。在一些实施方案中，组合物的各组分在加入组合物前为纯的。

试剂盒

在一些实施方案中，提供了一种试剂盒，用于实施本文所述的方法。试剂盒可包括以下一种或多种：由例如密码子优化的多核苷酸序列表达的B-GEn.1或B-GEn.2多肽或其变体；向导RNA；包含编码向导RNA的核苷酸序列的核酸。试剂盒可包括一种复合物，其包括以下两种或两种以上：B-GEn.1或B-GEn.2多肽或其变体；包含编码B-GEn.1或B-GEn.2多肽或其变体的核苷酸的核酸；向导RNA；包含编码向导RNA的核苷酸序列的核酸。在一些实施方案中，试剂盒包含B-GEn.1或B-GEn.2多肽或其变体，或编码相同多肽的多核苷酸。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体的活性部分显示出降低或失活的核酸酶活性。在某些实施方案中，B-GEn.1或B-GEn.2多肽或其变体是B-GEn.1或B-GEn.2融合蛋白。

在一些实施方案中，试剂盒包括(a)一种核酸，其包含密码子优化的多核苷酸序列，该核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(b)gRNA或编码gRNA的核酸，其中gRNA能够将B-GEn.1或B-GEn.2多肽或其变体引导至靶多核苷酸序列。在一些实施方案中，试剂盒包括包含密码子优化的多核苷酸序列的核酸。包含由密码子优化的多核苷酸序列表达的B-GEn.1或B-GEn.2多肽或其变体，或包含密码子优化的多核苷酸序列的核酸的试剂盒可进一步包含一种或多种额外的试剂，其中这样的额外的试剂可选自：用于将B-GEn.1或B-GEn.2多肽或其变体引入到细胞的缓冲液；洗涤缓冲液；对照试剂；对照表达载体或多核苷酸；从DNA体外生产B-GEn.1或B-GEn.2多肽或其变体的试剂等。

在本文所述的任何试剂盒的一些实施方案中，试剂盒包括sgRNA。在一些实施方案中，试剂盒包括两个或多个sgRNA。

在本文所述的任何试剂盒的一些实施方案中，gRNA(包括两个或多个向导RNA)可作为阵列(如RNA分子阵列、编码向导RNA的DNA分子阵列等)提供。例如，这种试剂盒可用于与上述包含B-GEn.1或B-GEn.2多肽或其变体的基因修饰的宿主细胞结合使用。

在本文所述的任何试剂盒的一些实施方案中，试剂盒还包括供体多核苷酸，以实现所需的基因修饰。

试剂盒的组分可以装在不同的容器中，也可以组合在单一容器中。

本文所述的任何试剂盒可进一步包括一种或多种额外的试剂，其中这样的额外的试剂可选自：稀释缓冲液；重构溶液；洗涤缓冲液；对照试剂；对照表达载体或多核苷酸；从DNA体外生产B-GEn.1或B-GEn.2多肽或其变体的试剂等。

除上述组分外，试剂盒可以进一步包括使用试剂盒组分以进行所述方法的说明书。用于进行行所方法的说明书通常记录在合适的记录介质上。例如，说明书可印在纸张或塑料等基质上。因此，说明书可以作为包装插页出现在试剂盒中、试剂盒容器或其组件的标签中(如，与包装或子包装相关)等。在一些实施方案中，说明书以电子存储数据文件的形式存在于合适的计算机可读存储介质中，如CD-ROM、光盘、软盘、闪存盘等。而在其他实施方案中，实际说明书不存在于试剂盒中，但提供了从远程来源(如通过互联网)获取指令的方法。这个实施方方案的一个实例是包含网址的试剂盒，在该网址上可以浏览说明书和/或下载说明书。与说明书一样，这种获取说明书的方式也记录在合适的基质上。

本公开内容的方法

修饰靶DNA和/或由靶DNA编码的多肽的方法

在一些实施方案中，本文提供了用于修饰靶DNA和/或由靶DNA编码的多肽的方法。在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:1或其变体的核酸，该变体与SEQID NO:1具有至少90％的序列同一性，SEQ ID NO:1编码B-GEn.1或B-GEn.2多肽或其变体的或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:2或其变体的核酸，该变体与SEQ ID NO:2具有至少90％的序列同一性，SEQ ID NO:2编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:3或其变体的核酸，该变体与SEQ ID NO:3具有至少90％的序列同一性，SEQ ID NO:3编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:4或其变体的核酸，该变体与SEQ ID NO:4具有至少90％的序列同一性，SEQ ID NO:4编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:5或其变体的核酸，该变体与SEQ ID NO:5具有至少90％的序列同一性，SEQ ID NO:5编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:6或其变体的核酸，该变体与SEQ ID NO:6具有至少90％的序列同一性，SEQ ID NO:6编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:7或其变体的核酸，该变体与SEQ ID NO:7具有至少90％的序列同一性，SEQ ID NO:7编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:8或其变体的核酸，该变体与SEQ ID NO:8具有至少90％的序列同一性，SEQ ID NO:8编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:9或其变体的核酸，该变体与SEQ ID NO:9具有至少90％的序列同一性，SEQ ID NO:9编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，该方法涉及提供(i)编码SEQ ID NO:133或其变体的核酸，该变体与SEQ ID NO:133具有至少90％的序列同一性，SEQ ID NO:133编码B-GEn.1或B-GEn.2多肽或其变体或编码由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(ii)gRNA或编码该gRNA的核酸，其中所述gRNA能够引导B-GEn.1或B-GEn.2多肽或其变体至靶多核苷酸序列，从而形成包含B-GEn.1或B-GEn.2多肽或其变体和gRNA的复合物(“靶向复合物”)，并与包含靶多核苷酸序列的靶DNA接触。

在一些实施方案中，本文提供了在细胞或体外环境中一个或多个位置靶向、编辑、修饰或操纵靶DNA的方法，包括向细胞或体外环境中引入(a)核酸，例如，其包含密码子优化的多核苷酸序列，该密码子优化的多核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(b)gRNA或编码所述gRNA的核酸，其中所述gRNA能够将B-GEn.1或B-GEn.2多肽或其变体引导至靶DNA中的靶多核苷酸序列。在一些实施方案中，所述方法包括将包含密码子优化的多核苷酸序列的核酸引入至细胞或体外环境。在一些实施方案中，该方法包括将由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体引入至细胞或体外环境。在一些实施方案中，B-GEn.1或B-GEn.2多肽包含(或由其组成)SEQ ID NOs:1至9或133的氨基酸序列。在一些实施方案中，所述方法包括将gRNA引入至细胞或体外环境。在一些实施方案中，所述方法包括将编码gRNA的核酸引入至细胞或体外环境。在一些实施方案中，gRNA是单向导RNA(sgRNA)。在一些实施方案中，所述方法包括将一个或多个额外的gRNA或编码靶向靶DNA的一个或多个额外的gRNA的核酸引入至细胞或体外环境。在一些实施方案中，所述方法进一步包括将供体模板引入至细胞或体外环境中。

在一些实施方案中，本文提供了在细胞或体外环境中一个或多个位置靶向、编辑、修饰或操纵靶DNA的方法，包括向细胞或体外环境中引入(a)核酸，其编码B-GEn.1或B-GEn.2多肽或其变体，或编码由这样的核酸表达的B-GEn.1或B-GEn.2多肽或其变体；以及(b)gRNA或编码所述gRNA的核酸，其中所述gRNA能够将B-GEn.1或B-GEn.2多肽或其变体引导至靶DNA中的靶多核苷酸序列。在一些实施方案中，该方法包括将由所述核酸表达的B-GEn.1或B-GEn.2多肽或其变体引入到细胞或体外环境。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体包含SEQ ID NOs:1至9或133的氨基酸序列或与这些氨基酸序列具有至少95％的序列同一性的变体。在一些实施方案中，所述方法包括将gRNA引入至细胞或体外环境。在一些实施方案中，所述方法包括将编码gRNA的核酸引入细胞或体外环境。在一些实施方案中，gRNA是单向导RNA(sgRNA)。在一些实施方案中，所述方法包括一个或多个额外的gRNA或编码靶向靶DNA的一个或多个额外的gRNA的核酸引入至细胞或体外环境中。在一些实施方案中，所述方法进一步包括将供体模板引入至细胞或体外环境中。

如上所述，gRNA或sgRNA与B-GEn.1或B-GEn.2多肽或其变体可形成核糖核蛋白复合物。所述向导RNA通过包含与靶DNA序列互补的核苷酸序列，为复合物提供靶向特异性。所述复合物中的B-GEn.1或B-GEn.2多肽或其变体具有核酸内切酶活性。在一些实施方案中，复合物修饰靶DNA，导致DNA切割、DNA甲基化、DNA损伤、DNA修复等。在一些实施方案中，复合物修饰与靶DNA相关的靶多肽(如组蛋白、DNA结合蛋白等)，导致例如组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。例如，靶DNA可以是体外裸(如未被DNA相关蛋白结合)DNA、体外细胞中的染色体DNA、体内细胞中的染色体DNA等。

本文所述的B-GEn.1或B-GEn.2多肽或其变体的核酸酶活性可切割靶DNA，以产生双链断裂。这些断裂随后由细胞通过以下两种方式之一进行修复：非同源末端连接和同源定向修复。在非同源末端连接(NHEJ)中，双链断裂是通过断裂末端直接相互连接来修复的。在此过程中，切割位点可以插入或缺失几个碱基对。在同源定向修复中，与被切割的靶DNA序列具有同源性的供体多核苷酸被用作修复被切割的靶DNA序列的模板，导致遗传信息从供体多核苷酸转移至靶DNA。因此，新的核酸材料可被插入/复制至该位点。在一些实施方案中，靶DNA与供体多核苷酸接触。在一些实施方案中，将供体多核苷酸引入至细胞。由于NHEJ和/或同源定向修复对靶DNA的修饰可导致，例如基因校正、基因置换、基因标记、转基因插入、核苷酸缺失、核苷酸插入、基因破坏、基因突变、序列置换等。因此，通过B-GEn.1或B-GEn.2多肽或其变体对DNA的切割可用于从靶DNA序列中缺失核酸材料(例如，通过切割所述靶DNA序列并允许细胞在没有外源提供的供体多核苷酸的情况下修复序列以干扰使细胞易受感染的基因(如CCRS或CXCR4基因，其使T细胞易受HIV感染，易于去除神经元中致病的三核苷酸重复序列，易于在研究中创建基因敲除和突变作为疾病模型等))。因此，所述方法可用于敲除基因(导致完全缺失转录/翻译或改变转录/翻译)，或用于将遗传物质敲入靶DNA中的选择位基因座。

此外或替代地，如果将向导RNA和B-GEn.1或B-GEn.2多肽或其变体与包含至少与靶DNA序列同源的至少一区段的供体多核苷酸序列向细胞中共同给药时，则该受试方法可用于向靶DNA序列中添加，如，插入或替换核酸材料(如，“敲入”编码蛋白质的核酸、siRNA、miRNA等)、添加标签(如6xHis、荧光蛋白(如绿色荧光蛋白、黄色荧光蛋白等)、血凝素(HA)、FLAG等)、在基因中添加调控序列(如启动子、多腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等)、修饰核酸序列(如引入突变)等。因此，包含向导RNA和B-GEn.1或B-GEn.2多肽或其变体的复合物可用于任何体外或体内应用，其中，期望以位点特定(如“靶向”)的方式修饰DNA，例如基因敲除、基因敲入、基因编辑、基因标记、序列置换等，例如，用于基因治疗，例如治疗疾病或作为抗病毒、抗病原或抗癌疗法，农业中基因修饰生物体的生产、用于治疗、诊断或研究目的的细胞蛋白质的大规模生产，iPS细胞的诱导，生物研究、病原体基因的靶向缺失或替换等。

在一些实施方案中，本文所述的方法采用包含异源序列(如B-GEn.1或B-GEn.2融合多肽)的B-GEn.1或B-GEn.2多肽或其变体。在一些实施方案中，异源序列可提供B-GEn.1或B-GEn.2多肽或其变体的亚细胞定位(例如，靶向细胞核的核定位信号(NLS)；靶向线粒体的线粒体定位信号；靶向叶绿体的叶绿体定位信号；ER保留信号等)。在一些实施方案中，异源序列可提供便于追踪或纯化的标签(如荧光蛋白，如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等；组氨酸标签，如6XHis标签；血凝素(HA)标签；FLAG标签；Myc标签等)。在一些实施方案中，异源序列可增加或降低稳定性。

在一些实施方案中，本文所述的方法采用向导RNA和B-GEn.1或B-GEn.2多肽或其变体，其用作用于关闭靶细胞中的基因表达的可诱导的系统。在一些实施方案中，编码适当的向导RNA和/或适当的B-GEn.1或B-GEn.2多肽或其变体的核酸被整合至靶细胞的染色体中，并受诱导型启动子的控制。当向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体被诱导时，当向导RNA和B-GEn.1或B-GEn.2多肽或其变体都存在并形成复合物时，靶DNA在感兴趣的位置(如单独质粒上的靶基因)被切割(或其他修饰)。因此，在一些实施方案中，靶细胞被工程化以在基因组中包括编码适当的B-GEn.1或B-GEn.2多肽或其变体的核酸序列和/或质粒上的适当的向导RNA(如，在诱导型启动子的控制下)，从而允许其中通过诱导向导RNA和B-GEn.1或B-GEn.2多肽或其变体的表达来控制任何靶基因(由引入到菌株的单独质粒表达)的表达的实验。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体具有引入双链断裂以外的方式修饰靶DNA的酶活性。可用于修饰靶DNA的感兴趣的酶活性(如，通过将具有酶活性的异源多肽与B-GEn.1或B-GEn.2多肽或其变体融合，从而产生B-GEn.1或B-GEn.2融合多肽或其变体)包括，但不限于甲基转移酶活性、去甲基化酶活性、DNA修复活性、DNA损伤活性、脱氨活性、歧化酶活性、烷基化活性、去嘌呤化活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性。甲基化和去甲基化是本领域公认的重要的表观遗传基因调控模式，而DNA损伤修复对于细胞存活以及响应于环境压力的正确基因组维持至关重要。因此，本文的方法可用于靶DNA的表观遗传修饰，并可通过将所需序列引入到向导RNA的间隔区而用于控制靶DNA任何位置的表观遗传修饰。本文的方法还可用于靶DNA内的任何期望的位置对DNA进行有意和可控的损伤。本文所述的方法还可用于对靶DNA内任何期望的位置的DNA进行序列特异性和可控的修复。将DNA修饰酶活性靶向靶DNA中特定位置的方法可用于研究和临床应用。

在一些实施方案中，使用多个向导RNA同时修饰相同靶DNA或不同靶DNA上的不同位置。在一些实施方案中，两个或多个向导RNA靶向相同的基因或转录本或基因座。在一些实施方案中，两种或多种向导RNA靶向不同的不相关的基因座。在一些实施方案中，两个或多个向导RNA靶向不同但相关的基因座。

在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体直接作为蛋白质提供。作为一个非限制性实例，真菌(如酵母)可使用原生质体转化法转化外源蛋白质和/或核酸(参见Kawai等人，Bioeng Bugs.2010Nov-Dec；1(6):395-403,“Transformation ofSaccharomyces cerevisiae and other fungi:methods and possible underlyingmechanism”；和Tanka等人,Nature.2004Mar 18；428(6980):323-8:“Conformationalvariations in an infectious protein determine prion strain differences”；两篇文献通过引用以其整体内容并入本文)。因此，B-GEn.1或B-GEn.2多肽或其变体可被整合至原生质体中(具有或没有编码向导RNA的核酸，具有或没有供体多核苷酸)，且所述原生质体可用来将内容物引入至酵母细胞。B-GEn.1或B-GEn.2多肽或其变体可通过任何合适的方法引入至细胞(提供给细胞)；这些方法是本领域普通技术人员已知的。作为另一个非限制性的例子，B-GEn.1或B-GEn.2多肽或其变体可以直接注射至细胞中(如，具有或没有编码向导RNA的核酸，且具有或没有供体多核苷酸)，如斑马鱼胚胎的细胞、受精小鼠卵母细胞的前核等。

调节转录的方法

在一些实施方案中，本文提供了调节宿主细胞中靶核酸转录的方法。这些方法一般涉及将靶核酸与无酶促活性的B-GEn.1或B-GEn.2多肽和向导RNA接触。所述方法可用于本文提供的各种应用中。

本公开内容的转录调控方法克服了涉及RNAi方法的一些缺点。本公开内容的转录调控方法应用广泛，包括研究应用、药物发现(如高通量筛选)、靶标验证、工业应用(如作物工程、微生物工程等)、诊断应用、治疗应用和成像技术。

在一些实施方案中，本文提供了选择性调节宿主细胞(如人体细胞)中靶DNA转录的方法。该方法通常包括：a)向宿主细胞中引入：i)向导RNA，或包含编码向导RNA的核苷酸序列的核酸；和ii)B-GEn.1或B-GEn.2多肽或其变体，或包含编码B-GEn.1或B-GEn.2多肽或其变体的核苷酸序列的核酸，其中B-GEn.1或B-GEn.2多肽或其变体表现出降低的脱氧核糖核酸内切酶活性。向导RNA和B-GEn.1或B-GEn.2多肽或其变体在宿主细胞中形成复合物；所述复合物选择性地调节宿主细胞中靶DNA的转录。

在一些实施方案中，本文所述的方法采用B-GEn.1或B-GEn.2蛋白的修饰形式。在一些实施方案中，B-GEn.1或B-GEn.2蛋白的修饰形式包括降低B-GEn.1或B-GEn.2蛋白的核酸酶活性的氨基酸变化(如缺失、插入或取代)。例如，在一些实施方案中，B-GEn.1或B-GEn.2蛋白的修饰形式具有相应的未修饰B-GEn.1或B-GEn.2多肽少于50％、少于40％、少于30％、少于20％、少于10％、少于5％或少于1％的核酸酶活性。在一些实施方案中，B-GEn.1或B-GEn.2多肽的修饰形式没有实质的核酸酶活性。当B-GEn.1或B-GEn.2多肽或其变体是没有实质核酸酶活性的B-GEn.1或B-GEn.2多肽的修饰形式时，其可称为“dB-GEn.1或B-GEn.2”。

在一些实施方案中，本文所述的转录调控方法允许选择性地调控(如减少或增加)宿主细胞中的靶核酸。例如，靶核酸转录的“选择性”减少，相比与缺乏向导RNA/B-GEn.1或B-GEn.2多肽或其变体复合物时的靶核酸的转录水平，减少靶核酸转录至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或大于90％。选择性降低靶核酸的转录会降低靶核酸的转录，但不会大幅度降低非靶核酸的转录，如，与没有向导RNA/B-GEn.1或B-GEn.2多肽或其变体复合物时非靶核酸的转录水平相比，非靶核酸的转录降低(如果有的话)小于10％。

在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体具有调节靶DNA转录的活性(如在B-GEn.1或B-GEn.2融合多肽或其变体等情况下)。在一些实施方案中，包含展示增加或减少转录能力的异源多肽(如转录激活剂或转录抑制剂多肽)的B-GEn.1或B-GEn.2融合多肽或其变体，用于增加或减少靶DNA中在特定位置的靶DNA转录，其由向导RNA的间隔区引导。提供具有转录调节活性的B-GEn.1或B-GEn.2融合多肽或其变体的源多肽的实例包括但不限于光诱导转录调节剂、小分子/药物反应性转录调节剂、转录因子、转录抑制剂等。在一些实施方案中，该方法用于控制靶向基因编码的RNA(编码蛋白质的mRNA)和/或靶向非编码RNA(如tRNA、rRNA、snoRNA、siRNA、miRNA、长ncRNA等)的转录。在一些实施方案中，B-GEn.1或B-GEn.2多肽或其变体具有修饰与DNA相关的多肽(如组蛋白)的酶促活性。在一些实施方案中，酶促活性是甲基转移酶活性、去甲基化酶活性、乙酰基转移酶活性、去乙酰化酶活性、激酶活性、磷酸酶活性、泛素连接酶活性(如，泛素化活性)、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性糖基化活性(如来自GlcNAc转移酶)或脱糖基化活性。本文列出的酶促活性可催化蛋白质的共价修饰。本领域所熟知的，此类修饰可改变靶蛋白质的稳定性或活性(如，根据靶蛋白质，激酶活性导致的磷酸化可刺激或沉默蛋白质的活性)。组蛋白是特别值得关注的蛋白质靶标。本领域所熟知的，组蛋白能与DNA结合并形成称为核小体的复合物。组蛋白可被修饰(如通过甲基化、乙酰化、泛素化、磷酸化)，以引起周围DNA的结构变化，从而控制DNA的潜在大部分对相互作用因子(如转录因子、聚合酶等)的可及性。单个组蛋白可以以多种不同的方式和多种不同的组合进行修饰(如，组蛋白3的赖氨酸27(H3K27)的三甲基化与转录受抑制的DNA区域有关，而组蛋白3的赖氨酸4(H3K4)的三甲基化与转录活跃的DNA区域有关)。因此，具有组蛋白修饰活性的B-GEn.1或B-GEn.2融合多肽或其变体可用于染色体结构的特定位点控制，并可用于改变靶DNA选定区域的组蛋白修饰模式。这种方法可用于研究和临床应用。

增加转录

靶DNA的“选择性”转录增加可使靶DNA的转录相比于没有向导RNA/B-GEn.1或B-GEn.2多肽或其变体复合物时靶DNA的转录水平增加至少1.1倍(如至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少15倍或至少20倍)。选择性增加靶DNA的转录可增加靶DNA的转录，但不大幅增加非靶DNA的转录，如，相比于没有向导RNA/B-GEn.1或B-GEn.2多肽或其变体复合物时非靶DNA的转录水平，非靶DNA的转录增加(如果有的话)少于约5倍(如，少于约4倍、少于约3倍、少于约2倍、少于约1.8倍、少于约1.6倍、少于约1.4倍、少于约1.2倍或少于约1.1倍)。

作为非限制性的实例，可以通过将dB-GEn.1或B-GEn.2与异源序列融合以达到增加转录。合适的融合伙伴包括，但不限于通过直接作用于靶DNA或与靶DNA相关的多肽(如组蛋白或其他DNA结合蛋白)来提供间接增加转录的活性的多肽。合适的融合伙伴包括但不限于提供甲基转移酶活性、去甲基化酶活性、乙酰基转移酶活性、去乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、巴豆酰化、去巴豆酰化、丙酰化、去丙酰化、肉豆蔻酰化活性或去肉豆蔻酰化活性的多肽。

其他合适的融合伙伴包括，但不限于直接增加靶核酸转录的多肽(如转录激活剂或其片段、招募转录激活剂的蛋白质或其片段、小分子/药物反应性转录调节剂等)。

使用dB-GEn.1或B-GEn.2融合蛋白提高原核生物转录的方法的非限制性实例包括细菌单杂交(B1H)或双杂交(B2H)系统的改造。在B1H系统中，DNA结合结构域(BD)与细菌转录激活结构域(AD，如大肠杆菌RNA聚合酶(RNAPa)α亚基)融合。因此，dB-GEn.1或B-GEn.2可以与包含AD的异源序列融合。当dB-GEn.1或B-GEn.2融合蛋白到达启动子上游区域(由向导RNA定位)时，dB-GEn.1或B-GEn.2融合蛋白的AD(如RNAPa)会招募RNAP全酶，从而激活转录。在B2H系统中，BD并不直接与AD融合；相反，它们之间的相互作用是由蛋白-蛋白相互作用(如GAL11P-GAL4相互作用)介导的。为了改造这种系统以用于本方法，可将dB-GEn.1或B-GEn.2与提供蛋白质-蛋白质相互作用(例如，酵母GAL11P和/或GAL4蛋白)的第一种蛋白质序列融合，RNAa可以与完成蛋白质-蛋白质相互作用(如，如果GAL11P与dB-GEn.1或B-GEn.2融合，则与GAL4融合；如果GAL4与dB-GEn.1或B-GEn.2融合，则与GAL11P融合等)的第二种蛋白质序列融合。GAL11P和GAL4之间的结合亲和力提高了结合效率和转录触发率。

使用dB-GEn.1或B-GEn.2融合蛋白增加真核生物转录的方法的非限制性实例包括将dB-GEn.1或B-GEn.2与激活结构域(AD)(如GAL4、疱疹病毒激活蛋白VP16或VP64、人核因子NF-KB p65亚基等)融合。为使系统具有诱导性，dB-GEn.1或B-GEn.2融合蛋白的表达可由诱导型启动子(如TetON、Tet-OFF等)控制。向导RNA可以设计成靶向已知的转录反应元件(如启动子、增强子等)、已知的上游激活序列(UAS)、可能能够控制靶DNA的表达的未知或已知功能的序列等。

额外的融合伙伴

实现转录增加或减少的融合伙伴的非限制性实例包括但不限于转录激活剂和转录抑制剂结构域(如Krüppel相关盒(KRAB或SKD)；Mad mSIN3相互作用结构域(SID)；ERF抑制剂结构域(ERD)等)。在一些这样的情况下，dB-GEn.1或B-GEn.2融合蛋白被向导RNA至靶向靶DNA中的特定位置(如序列)，并表现出位点特异性调控，例如阻断RNA聚合酶与启动子的结合(其选择性地抑制转录激活子功能)，和/或改变局部染色质状态(如当使用可修饰靶DNA或修饰与靶DNA相关的多肽的融合序列时)。在一些实施方案中，改变是暂时的(如转录抑制或激活)。在一些实施方案中，改变是可遗传的(如，当对靶DNA或与靶DNA相关的蛋白质，如核糖体组蛋白，进行表观遗传修饰时)。在一些实施方案中，异源序列可与dB-GEn.1或B-GEn.2多肽的C端融合。在一些实施方案中，异源序列可与dB-GEn.1或B-GEn.2多肽的N端融合。在一些实施方案中，异源序列可与dB-GEn.1或B-GEn.2多肽的内部部分(如，N-或C-末端以外的部分)融合。使用dB-GEn.1或B-GEn.2融合蛋白的方法的生物效应可通过任何合适的方法(如基因表达检测；基于染色质的检测，如染色质免疫沉淀(ChIP)、体内染色质检测(CiA)等)进行检测。

在一些实施方案中，方法涉及使用两种或两种以上不同的向导RNA。例如，可在单个宿主细胞中使用两种不同的向导RNA，其中两种不同的向导RNA靶向同一靶核酸中两种不同的靶序列。在一些实施方案中，使用两种靶向同一靶核酸中两种不同的靶序列的不同的向导RNA，提供了用以增加对靶核酸的转录的调节(如减少或增加)。

另一个实例是，可以在单个宿主细胞中使用两种不同的向导RNA，其中两种不同的向导RNA靶向两种不同的靶核酸。因此，例如，转录调控方法可进一步包括向宿主细胞中导入第二向导RNA，或导入包含编码第二向导RNA的核苷酸序列的核酸。

在一些实施方案中，核酸(如向导RNA，如单分子向导RNA；供体多核苷酸；编码B-GEn.1或B-GEn.2多肽或其变体的核酸等)包含提供额外的期望特性的修饰或序列(如，修饰或调控稳定性；亚细胞靶向；跟踪，如荧光标签；蛋白质或蛋白质复合物的结合位点等)。非限制性实例包括：5’帽(如，7-甲基鸟苷酸帽(m7G))；3’多腺苷酸化尾(如，3’poly(A)尾)；核糖开关序列或适配体序列(如用以允许调控稳定性和/或调控蛋白质和/或蛋白质复合物的可及性)；终止序列；形成dsRNA双链体的序列(如发夹)；将RNA靶向亚细胞位置(如细胞核、线粒体、叶绿体等)的修饰或序列；提供追踪功能的修饰或序列(如直接与荧光分子缀合、与有助于荧光检测的部分缀合、允许荧光检测的序列等)；提供蛋白质结合位点的修饰或序列(如作用于DNA的蛋白质，包括转录激活剂、转录抑制剂、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)；改变这种RNA结构的RNA修饰，因此为B-GEn.1或B-GEn.2核糖核蛋白；以及它们的组合。

多个同时向导RNA

在一些实施方案中，在相同细胞中同时使用多个向导RNA，以同时调节同一靶DNA上不同位置或不同靶DNA上的转录。在一些实施方案中，两个或多个向导RNA靶向相同的基因或转录本或基因座。在一些实施方案中，两个或多个向导RNA靶向不同的无关基因座。在一些实施方案中，两个或多个向导RNA靶向不同但相关的基因座。

由于向导RNA小而稳健，它们可以同时出现在相同的表达载体上，如果期望如此，甚至可以处于相同转录控制之下。在一些实施方案中，两个或两个以上(如3个或3个以上、4个或4个以上、5个或5个以上、10个或10个以上、15个或15个以上、20个或20个以上、25个或25个以上、30个或30个以上、35个或35个以上、40个或40个以上、45个或45个以上或50个或50个以上)的向导RNA同时在靶细胞中表达(来自相同或不同的载体/来自相同或不同的启动子)。在一些实施方案中，可以在模仿天然存在的CRISPR靶向RNA阵列中编码多个向导RNA。靶向区段被编码为约30个核苷酸长的序列(可以是约16到约100nt)，并由CRISPR重复序列分隔。该阵列可通过编码RNA的DNA或作为RNA引入至细胞。

为表达多个向导RNA，可以使用由Csy4内切核糖核酸酶介导的人工RNA处理系统。例如，可在前体转录本(如由U6启动子表达)上将多个向导RNA连接成串联阵列，并用Csy4特异性RNA序列将其分开。共表达的Csy4蛋白将前体转录本切割成多个向导RNA。使用RNA处理系统的优点包括：第一，不需要使用多个启动子；第二，由于所有向导RNA都是从一个前体转录本加工而来，它们的浓度会因类似的dB-GEn.1或B-GEn.2结合而归一化。

Csy4是源自铜绿假单胞菌(Pseudomonas aeruginosa)的小内切核糖核酸酶(RNase)蛋白。Csy4能特异性识别最小17-bp RNA发夹，并表现出快速(<1分钟)且高效(>99.9％)地裂解RNA。不同于大多数RNase，切割的RNA片段保持稳定和功能活性。基于Csy4的RNA切割可改变用于人工RNA处理系统。在该系统中，17-bp RNA发夹被插入至多个RNA片段之间，其由单个启动子转录为前体转录本。Csy4的共表达可有效生成单个RNA片段。

宿主细胞

在一些实施方案中，本公开内容的方法可用于体内和/或离体和/或体外诱导有丝分裂或有丝分裂后细胞的转录调节。在一些实施方案中，本公开内容的方法可用于体内和/或离体和/或体外诱导有丝分裂或有丝分裂后细胞中的DNA裂解、DNA修饰和/或转录调节(如，以产生可重新引入到个体的基因修饰的细胞)。

由于向导RNA通过与靶DNA杂交提供特异性，有丝分裂和/或有丝分裂后的细胞可以是各种宿主细胞中的任何一种，其中合适的宿主细胞包括但不限于细菌细胞；古细菌细胞；单细胞真核生物体；植物细胞；藻类细胞，如，葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorela pyrenoidosa)、展枝马尾藻(Sargassum patens(C.Agardh))等；真菌细胞；动物细胞；源自无脊椎动物(如昆虫、刺胞动物、棘皮动物、线虫等)的细胞；真核寄生虫(如疟原虫寄生虫，如疟原虫、蠕虫等)；源自脊椎动物(如鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞；哺乳动物细胞，如啮齿动物细胞、人类细胞、非人灵长类动物细胞等。在一些实施方案中，宿主细胞可以是任何人类细胞。合适的宿主细胞包括天然存在的细胞；基因修饰的细胞(如在实验室中，如通过“人类之手”进行基因修饰的细胞)；和以任何方式在体外操纵的细胞。在一些实施方案中，宿主细胞是分离的。

任何类型的细胞可为感兴趣的(如干细胞，如胚胎干细胞(ES)、诱导多能干细胞(iPS)、生殖细胞；体细胞，如成纤维细胞、造血细胞、神经细胞、肌肉细胞、骨细胞、肝细胞、胰腺细胞；体外或体内的任何阶段胚胎的胚胎细胞，如1-细胞、2-细胞、4-细胞、8-细胞等阶段的斑马鱼胚胎的胚胎细胞等)。细胞可源自已建立的细胞系，或它们可为原代细胞，其中“原代细胞(primary cells)”、“原代细胞系(primary cell lines)”和“原代培养物(primary cultures)”在本文中可以互换使用，是指源自受试者并允许其在体外生长有限传代次数(如培养物的分裂)的细胞和细胞培养物。例如，原代培养物包括经过0次、1次、2次、4次、5次、10次或15次传代，但没有足够次数经历危机阶段(crisis stage)的培养物。原代细胞系可在体外维持少于10次传代。在一些实施方案中，靶细胞是单细胞生物体，或在培养物中生长。

如果细胞是原代细胞，则可通过任何合适的方法从个体收获这样的细胞。例如，白细胞可通过单采术(apheresis)、白细胞单采术(leukocytapheresis)、密度梯度分离等方法收获，而来自组织(例如皮肤、肌肉、骨髓、脾脏、肝脏、胰腺、肺、肠、胃等)的细胞则最适合通过活检收获。可使用适当的溶液分散或悬浮收获的细胞。这种溶液通常是平衡盐溶液，如生理盐水、磷酸盐缓冲盐溶液(PBS)、Hank's平衡盐溶液等，适当补充胎牛血清或其他天然存在的因子，结合可接受的低浓度如5-25mM的缓冲液。合适的缓冲液包括HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。细胞可立即使用，或它们可长期保存，冷冻，其解冻后可重复使用。在这种情况下，通常将细胞冷冻在10％的二甲基亚砜(DMSO)、50％血清、40％缓冲培养基或通常在本领域中使用的其他一些这样的溶液，以在这样的冷冻温度下保存细胞，并按照本领域常用的解冻冷冻培养细胞的方式解冻。

用途

根据本公开内容的用于调节转录的方法，可用于各种应用，其也在本公开内容中提供。所述应用包括研究应用；诊断应用；工业应用和治疗应用。

研究应用包括，如，测定减少或增加靶核酸转录对如，发育、新陈代谢、下游基因表达等的影响。使用转录调制方法可以进行高通量基因组分析，在这种方法中，只需改变向导RNA的间隔区，而蛋白质结合区段和转录终止区段(在某些情况下)可以保持不变。包含在基因组分析中使用的多个核酸的文库包括：与向导RNA编码核苷酸序列可操作连接的启动子，其中每个核酸都包含共同的蛋白质结合区段、不同的间隔区和共同的转录终止区段。芯片可包含超过5x 10⁴个独特的向导RNA。其应用包括大规模表型分析、基因功能图谱以及元基因组分析。

本文所公开的方法可用于代谢工程领域。如本文所公开的，由于转录水平可通过设计适当的向导RNA进行有效和可预测的控制，因此可通过控制感兴趣的代谢途径中特定酶的水平(如通过增加或减少转录)来精确控制和调整代谢途径(如生物合成途径)的活性。感兴趣的代谢途径包括用于化学品(精细化学品、燃料、抗生素、毒素、激动剂、拮抗剂等)和/或药物生产的途径。

感兴趣的生物合成途径包括但不限于(1)甲羟戊酸途径(mevalonate pathway)(如HMG-CoA还原酶途径)(将乙酰基-GoA转化为焦磷酸二甲基烯丙基酯(DMAPP)和焦磷酸异戊烯酯(IPP)，其用于多种生物大分子的生物合成，包括萜类/异戊烯类)，(2)非甲羟戊酸途径(如，“2-C-甲基-D-赤藓糖醇-4-磷酸/1-脱氧-D-木酮糖-5-磷酸途径”或“MEP/DOXP途径”或“DXP途径”)(也产生DMAPP和IPP，而不是通过甲戊酸途径的替代途径将丙酮酸和甘油醛3-磷酸转化为DMAPP和IPP)(3)聚酮合成途径(通过各种聚酮合成酶产生各种聚酮。聚酮类化合物包括用于化疗的天然小分子化合物(如四环素和大环内酯等)和工业上重要的多酮包括雷帕霉素(免疫抑制剂)、红霉素(抗生素)、洛伐他汀(抗胆固醇药物)和艾替隆B(抗癌药物)，(4)脂肪酸合成途径；(5)DAHP(3-脱氧-D-阿拉伯庚酮糖酸？-磷酸)合成途径，(6)生产潜在生物燃料(例如短链醇和烷烃、脂肪酸甲酯和脂肪醇、异戊烯等)的途径等。

网络和级联

本文公开的方法可用于设计集成网络(如一个级联或多个级联)。例如，向导RNA和B-GEn.1或B-GEn.2多肽或其变体可用于控制(如调节，如增加、减少)另一种DNA靶向RNA或另一种B-GEn.1或B-GEn.2多肽或其变体的表达。例如，第一向导RNA可设计为靶向调节第二融合dB-GEn.1或B-GEn.2多肽的转录，其功能不同于第一B-GEn.1或B-GEn.2多肽或其变体(如甲基转移酶活性、去甲基酶活性、乙酰基转移酶活性、去乙酰基酶活性等)。在一些实施方案中，可以选择第二融合dB-GEn.1或B-GEn.2多肽，使其可不与第一向导RNA发生相互作用。在一些实施方案中，可以选择第二融合dB-GEn.1或B-GEn.2多肽，使其与第一向导RNA发生相互作用。在一些这样的情况下，两种(或更多种)dB-GEn.1或B-GEn.2蛋白的活性可产生竞争(如，如果多肽具有相反的活性)或可产生协同(如，如果多肽具有相似或协同的活性)。类似的，如上所述，网络中的任何复合物(如向导RNA/dB-GEn.1或B-GEn.2多肽)可设计成控制其他向导RNA或dB-GEn.1或B-GEn.2多肽。由于向导RNA和B-GEn.1或B-GEn.2多肽或其变体可以靶向至任何所需的DNA序列，因此本文所述方法可用于控制和调节任何所需的靶标的表达。整合网络(如，相互作用的级联)可以被设计为从非常简单到非常复杂，且没有限制。

在网络中，其中两个或更多的组分(如向导RNA和dB-GEn.1或B-GEn.2多肽)各自受另一个向导RNA/dB-GEn.1或B-GEn.2多肽复合物的调控控制，所述网络中一个组分的表达水平可影响网络中另一个元件的表达水平(如可增加或减少表达)。通过这种机制，一个组分的表达可影响相同网络中不同组分的表达，且所述网络可包括增加其他组分表达的组分的混合物和减少其他组分表达的组分。本领域的技术人员很容易理解，上述实例中，凭借一种组分的表达水平可影响一种或多种不同组分的表达水平是以说明为目的，并不具有限制性。当一个或多个组分被修饰(如上所述)为可操纵时(如，在实验控制下，如温度控制；药物控制，如药物诱导控制；光照控制等)，可有选择地将复杂性的额外层可选择地引入到网络。

作为一个非限制性的实例，第一向导RNA可以与第二向导RNA的启动子结合，其控制靶治疗/代谢基因的表达。在这种情况下，第一向导RNA的条件表达会间接激活治疗/代谢基因。这种类型的RNA级联是有用的，例如，用于将阻遏物轻松转化为活化剂，且可用于控制靶基因的逻辑或动态表达。

转录调控方法还可以用于药物发现和靶标验证。

治疗疾病或病况的方法

在本公开内容的一些方面，向导RNA和/或B-GEn.1或B-GEn.2多肽或其变体和/或供体多核苷酸被用于在体内修饰细胞DNA，用于基因治疗，例如治疗疾病或作为抗病毒、抗病原或抗癌疗法，用于农业中基因修饰的生物体的生产，或用于生物学研究。在这些体内实施方案中，CRISPR/B-GEn.1或B-GEn.2系统的组分包括：(i)向导RNA或编码gRNA的核酸；(ii)一种核酸，其包含密码子优化的多核苷酸序列，该多核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由该核酸表达的B-GEn.1或B-GEn.2多肽或其变体；和/或(iii)供体多核苷酸，其施用给个体。施用方法可为本领域中任何众所周知的向受试者施用多肽、小分子和核酸的方法。CRISPR/B-GEn.1或B-GEn.2系统成分可加入各种制剂中。更具体地说，本公开内容的CRISPR/B-GEn.1或B-GEn.2系统成分可通过与适当的药学上可接受的载体或稀释剂结合配制成药物组合物。

在一些实施方案中，本文提供了药物制剂或组合物，其包含CRISPR/B-GEn.1或B-GEn.2系统的组分，该系统包括(i)向导RNA或编码gRNA的核酸；(ii)一种核酸，其包含密码子优化的多核苷酸序列，该多核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由该核酸表达的B-GEn.1或B-GEn.2多肽或其变体；和/或(iii)存在于药学上可接受的载体中的供体多核苷酸。“药学上可接受的载体(vehicle)”可为联邦政府或州政府监管机构批准的载体，或者是《美国药典》(US Pharmacopeia)或其他公认的药典中列出的用于哺乳动物(如人类)的载体。术语“载体”是指稀释剂、佐剂、赋形剂或载体(carrier)，与之配制的本公开内容的化合物可用于哺乳动物。此类药物载体可以是脂质，如脂质体，如脂质体树枝状分子；液体，如水和油，包括石油、动物、植物或合成来源的油，如花生油、大豆油、矿物油、芝麻油等；生理盐水；阿拉伯胶、明胶、淀粉糊、滑石粉、角蛋白、胶体二氧化硅、尿素等。此外，还可使用辅助剂、稳定剂、增稠剂、润滑剂和着色剂。药物组合物可配制成固体、半固体、液体或气体形式的制剂，如片剂、胶囊、粉末、颗粒、软膏、溶液、栓剂、注射剂、吸入剂、凝胶、微球和气雾剂。因此，CRISPR/B-GEn.1或B-GEn.2系统成分的给药可以通过各种方式实现，包括口服、口腔、直肠、肠外、腹膜内、皮内、透皮、气管内、眼内等给药。给药后，活性剂可为全身性的，也可通过区域给药、体内给药或使用植入物将活性剂量保留在植入部位而为局部性的。活性制剂可配制为立即起效的制剂，或可配制成持续释放的制剂。

对于一些病况，特别地中枢神经系统病况，可必要配制药物以穿越血脑屏障(BBB)。通过血脑屏障递送药物的一种策略是破坏BBB，可以通过甘露醇或白三烯等渗透手段，也可以通过使用缓激肽等血管活性物质进行生化破坏。利用BBB开放将特定药物靶向脑肿瘤也是潜在的选择。通过血管内注射施用组合物时，BBB破坏剂可与本公开内容的治疗组合物同时给药。其他通过BBB的策略可需要使用内源性转运系统，包括Caveolin-1介导的转运、载体介导的转运，例如葡萄糖和氨基酸载体、受体介导的胰岛素或转铁蛋白转运以及活性外排转运，例如糖蛋白。活性转运部分也可与本公开内容中使用的治疗化合物缀合，以促进穿过血管内皮壁的转运。此外或替代地，治疗剂在BBB后方的药物递送可为通过局部递送，例如通过鞘内递送，例如通过Ommaya囊(参见美国专利号5,222,982和5385582，通过引用并入本文)；通过栓剂注射，例如通过注射器，例如玻璃体内或颅内注射；通过持续输注，例如通过套管插入术，例如通过对流(参见美国申请号20070254842，通过引用并入本文)；或通过植入可逆性粘贴药剂的装置(参见如美国申请号20080081064和20090196903，通过引用并入本文)。

通常，CRISPR/B-GEn.1或B-GEn.2系统有效量的组分包括：(i)向导RNA或编码gRNA的核酸；(ii)一种核酸，其包含密码子优化的多核苷酸序列，该多核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由该核酸表达的B-GEn.1或B-GEn.2多肽或其变体；和/或(iii)提供的供体多核苷酸。如上文关于离体方法所述，CRISPR/B-GEn.1或B-GEn.2系统成分在体内的有效量或有效剂量是指这样的量，其相对于阴性对照，如与空载体或无关多肽接触的细胞，诱导两个同源序列之间观察到的重组量增加2倍或更多的量。重组量可通过任何合适的方法测量，如上文所述和本领域已知的方法。计算要施用的CRISPR/B-GEn.1或B-GEn.2系统成分的有效量或有效剂量在本领域普通技术人员的能力范围内，且为本领域技术人员惯用方法。要施用的最终量将取决于给药途径和要治疗的疾病或病况的性质。

给特定受试者的有效用量取决于多种因素，其中一些因素因受试者不同而不同。有能力的临床医生能够根据需要确定给受试者施用治疗剂的有效剂量，以阻止或逆转疾病病况的发展。临床医生可以根据给药途径，利用LD50的动物数据和其他有关药剂的信息，确定个体的最大安全剂量。例如，静脉给药的剂量可能比经皮内给药的剂量大，因为治疗组合物被给药到更大体积的液体中。类似地，对于能迅速从体内清除的组合物，可以更大的剂量或以重复剂量施用组合物，以维持治疗浓度。利用通常技能，有能力的临床医生能够在常规临床试验过程中优化特定治疗剂的剂量。

在药物中加入CRISPR/B-GEn.1或B-GEn.2系统成分时，可从合适的商业来源获得。一般来说，每次经肠外给药的CRISPR/B-GEn.1或B-GEn.2系统成分的总药用有效量应在可通过剂量反应曲线测量的范围内。

基于CRISPR/B-GEn.1或B-GEn.2系统成分的疗法，如，包含以下组分的制剂：(i)向导RNA或编码gRNA的核酸；(ii)一种核酸，其包含密码子优化的多核苷酸序列，该多核苷酸序列编码B-GEn.1或B-GEn.2多肽或其变体，或编码由该核酸表达的B-GEn.1或B-GEn.2多肽或其变体；和/或(iii)用于治疗性给药的供体多核苷酸，必须为无菌的。通过无菌滤膜(如0.2微米滤膜)过滤很容易实现无菌。治疗组合物通常放置于具有无菌入口的容器中，例如，具有可被皮下注射针头刺穿的瓶塞的静脉注射液袋或小瓶。基于CRISPR/B-GEn.1或B-GEn.2系统成分的疗法可作为水溶液或用于重构的冻干制剂储存在单位或多剂量容器中，例如密封的安瓿或小瓶。以冻干制剂为例，在10毫升的小瓶中注入5毫升经过无菌过滤的1％(w/v)化合物水溶液，并将所得混合物冻干。使用抑菌注射用水重构冻干化合物，制备输液剂。

药物组合物根据所需的配方可以包括药学上可接受的、无毒的稀释剂载体，其定义为通常用于配制动物或人体给药的药物组合物的载体。选择稀释剂使其不影响组合的生物活性。这种稀释剂的实例为蒸馏水、缓冲水、生理盐水、PBS、林格氏溶液、葡萄糖溶液和汉克氏溶液。此外，药物组合物或制剂还可以包括其他载体、佐剂或无毒、无治疗作用、无免疫原性的稳定剂、赋形剂等。组合物还可以包括接近生理条件的其他物质，例如pH值调节剂和缓冲剂、毒性调节剂、润湿剂和洗涤剂。

组合物还可以包括任何各种稳定剂，例如抗氧化剂。当药物组合物包含多肽时，可将多肽与各种众所周知的化合物形成复合物，以增强多肽在体内的稳定性，或以其他增强其药理性质(如延长多肽的半衰期、降低其毒性、提高溶解度或摄取)的方式。这种修饰或络合剂的实例包括硫酸盐、葡萄糖酸盐、柠檬酸盐和磷酸盐。组合物的核酸或多肽还可以与增强其在体内的属性的分子形成复合物。这种分子包括，例如，碳水化合物、多胺、氨基酸、其他肽、离子(如钠、钾、钙、镁、锰)和脂质等。

有关适合用于各种类型给药方式的制剂的进一步指导记载于Remington'sPharmaceutical Sciences,Mace Publishing Company,Philadelphia,Pa.,20th ed.(2003)和The United States Pharmacopeia:The National Formulary(USP 24NF19)1999出版。有关药物递送的简要综述，参见Langer,Science 249:1527-1533(1990)。

药物组合物给药可用于预防性和/或治疗性治疗。活性成分的毒性和疗效可根据标准制药程序在细胞培养物和/或实验动物中进行测定，包括例如测定LD50(对50％群体致死的剂量)和ED50(对50％群体有效的治疗剂量)。毒性效应和治疗效应之间的剂量比即为治疗指数，可表示为LD50/ED50之比。通常优选地展示较大治疗指数的疗法。

从细胞培养和/或动物研究中获得的数据可用于制定人体用量范围。活性成分的剂量一般在循环浓度范围内，包括低毒性的ED50。剂量可在此范围内变化，具体取决于采用的剂型和利用的给药途径。用于配制药物组合物的组分通常具有较高纯度，实质上不含潜在的有害污染物(如，至少是国家食品(NF)级，通常至少分析级，且更典型的至少制药级)。此外，供体内使用的组合物通常是无菌的。在使用前必须合成给定化合物的情况下，所得到的产品通常实质上不含任何潜在的有毒物质，特别地在合成或纯化过程中可存在的任何内毒素。用于肠外给药的组合物也是无菌的、实质上等渗的，并且是在GMP条件下生产的。

给予特定受试者的治疗组合物的有效量取决于多种因素，其中一些因素因受试者不同而不同。有能力的临床医生能够根据需要确定给受试者施用治疗剂的有效剂量，以阻止或逆转疾病的发展。临床医生可以根据给药途径，利用LD50的动物数据和其他有关药剂的信息，确定个体的最大安全剂量。例如，静脉给药的剂量可能比经皮内给药的剂量大，因为治疗组合物被给药到更大体积的液体中。类似地，对于能迅速从体内清除的组合物，可以更大的剂量或以重复剂量施用组合物，以维持治疗浓度。利用通常技能，有能力的临床医生能够在常规临床试验过程中优化特定治疗剂的剂量。

给药受试者治疗的次数可会改变。将基因修饰的细胞导入受试者可为一次性的事件；但在某些情况下，这种治疗可在有限的时间段内引起改善，且需要持续的一系列重复治疗。在某些情况下，可需要多次给药基因修饰的细胞后才能观察到效果。具体方案取决于疾病或病况、疾病的阶段以及接受治疗的个体的参数。

等同物

所有技术特征可以以这些特征的所有可能组合单独组合。

本发明可在不脱离其精神或本质特征的前提下，以其他具体形式体现出来。因此，上述实施方案在所有方面被认为是说明性的，而不是对本文所述发明的限制。

实施例

以下非限制性实施例进一步说明本文所述发明的实施方案。

实施例1

新型V型核酸酶的实验表征

潜在的效应物序列是从内部微生物数据库的基因组分析中确定的。针对B-GEn.1和B-GEn.2的DNA序列利用NdeI和XhoI合成(Twist)并克隆到基于pET29的定制表达载体(pBLR107)中(SEQ ID NO:7表示B-GEn.1在这个载体中的完整质粒序列，得到的质粒命名为B-GEn.1_full_plasmid_pBLR373；且SEQ ID NO:8表示B-GEn.2在这个载体中的完整质粒序列，产生的质粒被命名为B-GEn.2_full_plasmid_pblr373，针对B-GEn.2质粒)。为了获得含tracr的DNA，将围绕效应物ORF的基因内区域串联并克隆至定制的含ColE1的载体(可选的正向和反向T7方向，分别称为pBLR150和pBLR151)中，用于表达RNA分子。对于基于质粒的筛选中，两个合成的间隔区序列(与PAM文库质粒匹配)的侧翼是CRISPR重复区，并将其排序为ssDNA寡聚体，随后在T7启动子的控制下克隆至pBLR107中。图1也说明了该系统。

为了筛选活性，质粒在使用RTS^TM100 E.coli HY Kit(Biorabbit)的无细胞表达系统中表达。简而言之，根据制造商的说明，以总样品量20μl表达每个质粒250ng，在热循环器@中以30℃的温度持续6小时。进行质粒DNA的PAM依赖性切割，其使用2μl表达样本和50nMPAM库质粒，使用缓冲液为10mM Tris pH 7.5、100mM NaCl和50mM MgCl2，总体积为10μl，在37℃下持续4小时。随后，使用SPRI磁珠(SpeedBeads^TM磁性羧酸盐修饰的颗粒；Sigma)从样品中纯化质粒DNA，并用10μl EB(Qiagen)洗脱。为了对交错切割的线性化质粒进行末端修复，根据制造商的说明，用NEB Next Ultra II End Repair/dA-Tail Module(New EnglandBiolabs)在20℃孵育5μl洗脱液30分钟。随后，使用SPRI磁珠(SpeedBeads^TM羧酸磁性修饰的颗粒；Sigma)再次纯化DNA，并用10μl EB(Qiagen)洗脱。最后，在总体积为12μl的1x BluntTA Ligase Mastermix(NEB)中使用1μM双链体适配体(adapter)进行适配体连接，如Karvelis及其同事的描述(DOI 10.1186/s13059-015-0818-7)。为获得切割的质粒序列，将3μl的适配体连接样本与1.25μl 10uM带有条形码的正向和反向引物以及12.5ul Q5高保真2x Master Mix(NEB)和7.5ul水混合。扩增时使用了以下设置：初始变性(98℃ 30秒)、30个扩增循环(98℃ 10秒、66℃ 30秒和72℃ 30秒)和最终延伸(72℃ 2分钟)。通过将五个额外的核苷酸添加至5’端，对引物进行条形码编码。随后，根据制造商的说明，使用SPRI磁珠按1:1的比例对所有PCR反应进行合并和纯化。对于下一代测序，2ug带有条形码的和纯化的扩增子被用作文库预处理的输入。扩增子池进行末端修复和dA尾(NEBNext Ultra IIRepair/dA-Tail Module，NEB)，然后进行Illumina条形码连接(Blunt/TA Ligase MasterMix)。通过凝胶电泳(E-gel EX 2％，ThermoFisher)检查扩增子大小是否正确。使用dsDNAHS Kit(ThermoFisher)在Qubit(ThermoFisher)上测量文库的浓度。使用MiSeq 300PE v2化学试剂(Illumina)对含有5％ PhiX spike-in的10pM文库作为下一代测序的输入。

生物信息学分析

为了确定PAM序列，分析了所有含有来自适配体序列的基序和来自靶位点上游质粒序列的基序的NGS读段。首先，对于包含两个基序的每一次读段，确定两个基序之间的插入序列(intervening sequence)的长度。然后，分别分析具有最常出现的插入序列长度的读段的子集。对于这个读段子集，确定了在8N-PAM库区段上观察到的所有唯一序列，以及它们的读段计数。使用100个最常出现的序列来创建序列基序。使用结果来创建表2。

实施例2

检测哺乳动物细胞中核酸酶活性的筛选方法

细胞培养

HEK 293T细胞(CRL-3216^TM)在含有10％ FBS和1％Pen/Strep的DMEM中培养。细胞在T75烧瓶中培养，并每2-3天传代(split)一次。

转染

转染前一天，以每孔12,000个细胞的密度将细胞接种在涂有聚-D-赖氨酸的96孔板(Poly-D-Lysine Greiner)上。第二天更换培养基，根据制造商的说明使用LipoD293^TMIn Vitro DNA Transfection Reagent(SignaGen)用140ng核酸酶质粒和60ng sgRNA质粒转染细胞。第二天更换转染混合液并换成标准培养基。转染三天后收获细胞，用于下游DNA提取。

粗DNA提取和扩增

将收获的细胞重悬于100ul PBS中，然后将60ul细胞转移到新的96孔板中，并成沉淀。随后，去除上清液，将补充有25μg/ml蛋白酶K(Thermo Scientific)的含0.05％ SDS的60μl 10mM Tris，pH7.0加入到每个孔中，并充分混合。粗DNA样品在37℃下孵育1小时，然后在80℃下加热30分钟。将3.5μl粗DNA与1.25μl 10uM带有条形码的正向和反向引物以及12.5ul Q5 High-Fidelity 2x Master Mix(NEB)和6.5ul水混合。对于所有扩增子，扩增时使用了以下设置：初始变性(98℃ 30秒)、30个扩增循环(98℃ 10秒、66℃ 30秒和72℃ 30秒)和最终延伸(72℃ 2分钟)。通过将五个额外的核苷酸添加至5’端，对引物进行条形码编码。随后，根据制造商的说明，以1:1的比例使用SPRI磁珠对所有PCR反应进行合并和纯化。

文库准备和下一代测序

2ug带有条形码的和纯化的扩增子被用作文库预处理的输入。扩增子池进行末端修复和dA尾(NEBNext Ultra II Repair/dA-Tailing Module,NEB)，然后进行Illumina条形码连接(Blunt/TA Ligase Master Mix，NEB)。通过凝胶电泳(E-gel EX 2％，ThermoFisher)检查扩增子大小是否正确。使用dsDNA HS Kit(ThermoFisher)在Qubit(ThermoFisher)上测量文库的浓度。使用MiSeq 300PE v2化学试剂(Illumina)对含有5％PhiX spike-in的10pM文库作为下一代测序的输入。

NGS分析

使用cutadapt 1.18版本(http://dx.doi.org/10.14806/ej.17.1.200)对原始fastq读段进行质量修剪，最低质量分数为Q30。过滤后的读段使用fastq-join 1.3.1版本(doi:10.2174/1875036201307010001)进行连接，并使用定制测序文库拆分(demultiplex)脚本进行测序文库拆分，如Nat Commun.2021年7月9日；12(1):4219.doi:10.1038/s41467-021-24454-5,补充材料,章节标题:“Amplicon sequencing(AmpSeq)for on-and off-target analysis and NGS analysis”所述。随后用CRISPResso v 1.0.13(doi:10.1038/nbt.3583)对已被测序文库拆分的fastq文件进行分析。该分析结果如表4所示(而平均活性从三次单独实验及具有B-GEn.1的pBLR709和具有B-GEn.2的pBLR710中获得)。

表4

实施例3

用新的sgRNA设计检测哺乳动物细胞中核酸酶活性的筛选方法

为了测试SEQ ID NOs:40-44的新型sgRNA设计和另外7个活性较低或无活性的设计的活性(使用这些sgRNA序列进行了实施例2的实验)。使用了两个不同的靶基因座：

TCRA_guide1:NCBI Reference Sequence:NC_000014.9 REGION：21724060..21724082(其反向互补物代表靶向特异性向导序列)。

TCRA_guide4:NCBI Reference Sequence:NC_000014.9 REGION:21724157..21724179(其反向互补物代表靶向特异性向导序列)。

两者评估均来自2022年6月8日的https://www.ncbi.nlm.nih.gov/nuccore/568815584。

结果如图2所示。

Claims

1.一种多肽，其选自：SEQ ID NO:1或SEQ ID NO:39的B-GEn.1，和SEQ ID NO:2的B-GEn.2，与上述任何一种具有至少80％同一性的任何多肽序列，或编码其的任何核酸。

2.一种组合物，其包含根权利要求1所述的多肽和sgRNA，所述sgRNA包含选自SEQ IDNOs:40、41、42、43和45的序列。

3.一种组合物，其包含：

(i)根据权利要求1所述的多肽，和

(ii)一个或多个单异源向导RNA(sgRNA)或允许原位产生这样的一个或多个sgRNA的DNA，每个sgRNA或编码所述sgRNA的DNA包含：

a.工程化的DNA靶向区段，其可与多核苷酸基因座上的靶序列杂交；

b.tracr伴侣序列，和

c.tracr RNA序列；

其中，所述tracr伴侣序列可与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列。

4.根据权利要求2或3所述的组合物，其中所述工程化的DNA靶向片段在其3’端直接邻近靶DNA区段上的PAM序列，或者这样的PAM序列是靶DNA序列在其5’部分的一部分，其中PAM序列包含序列基序“DTTN”，其中“D”代表“A”或“T”或“G”且“N”代表任意核苷酸。

5.在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的方法，所述方法包括：

(i)将根据权利要求1所述的多肽或编码其的核酸引入至细胞或引入至体外环境；和

(ii)将一个或多个单异源向导RNA(sgRNA)或编码这样的一个或多个sgRNA的DNA引入至细胞或体外环境，每个sgRNA或编码所述sgRNA的DNA包含：

a.工程化的DNA靶向区段，其包含RNA且能够与多核苷酸基因座上的靶序列杂交；

b.由RNA组成的tracr伴侣序列，和

c.由RNA组成的tracr RNA序列，

其中，所述tracr伴侣序列与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列；和

(iii)在所述靶DNA中产生一个或多个切口、缺口或碱基编辑，其中B-GEn多肽以其加工或未加工形式通过所述sgRNA引导至靶DNA。

6.一种组合物用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶DNA的用途，所述组合物包含：

i.根据权利要求1所述的多肽或编码其的核酸；和/或

ii.一个或多个单异源向导RNA(sgRNA)或适合原位产生这样的一个或多个sgRNA的DNA，每个包含:

a.工程化的DNA靶向区段，其由RNA组成且能够与多核苷酸基因座上的这种靶序列杂交；

b.由RNA组成的tracr伴侣序列，和

c.由RNA组成的tracr RNA序列；

其中所述tracr伴侣序列与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列。

7.一种细胞，其包含：

i.根据权利要求1所述的多肽，或编码其的核酸；和

ii.一个或多个单异源向导RNA(sgRNA)或适合原位产生这样的一个或多个sgRNA的DNA，每个包含：

a.工程化的DNA靶向区段，其可以与多核苷酸基因座上的靶序列杂交；

b.tracr伴侣序列，和

c.tracr RNA序列；

其中所述tracr伴侣序列可与所述tracr序列杂交，且其中(a)、(b)和(c)以5’至3’方向排列。

8.一种试剂盒，其包含：

I.编码根据权利要求1所述的B-GEn多肽的核酸，其中编码B-GEn的核酸可操作地连接至启动子；和

II.一个或多个单异源向导RNA(sgRNA)或适合原位产生这样的一个或多个sgRNA的DNA，每个sgRNA包含：

b.tracr伴侣序列，和

c.tracr RNA序列；

9.一种核酸或任何核酸，其包含选自SEQ ID NO:40-44的核酸。