CN117916373A

CN117916373A - 用于crispr/cas编辑系统的引导rna

Info

Publication number: CN117916373A
Application number: CN202280060813.2A
Authority: CN
Inventors: B·卡弗蒂; 迈克尔·帕克; 伊冯娜·阿拉廷-肖斯; 程洛一
Original assignee: Bim Medical Co ltd
Current assignee: Bim Medical Co ltd
Priority date: 2021-07-23
Filing date: 2022-07-22
Publication date: 2024-04-19

Abstract

本发明尤其提供了一种缀合至NLS序列的引导RNA(NLS‑gRNA)及其制备和使用方法。例如，在一些实施例中，所述gRNA的3'端经由包含化学部分和肽间隔子的接头缀合至核定位序列(NLS)的N末端。

Description

用于CRISPR/CAS编辑系统的引导RNA

相关申请的交叉引用

本申请要求2021年7月23日提交的美国临时专利申请序列号63/225,322和2021年10月14日提交的美国临时专利申请序列号63/255,927的优先权，该美国临时专利申请的内容通过引用整体并入本文用于所有目的。

通过引用并入序列表

创建于2022年7月22日且大小为59.9千字节的名称为“BEM-011WO_ST26.xml”的文件的内容特此通过引用以其整体并入。

背景技术

CRISPR/Cas编辑系统包括将引导RNA分子(gRNA)与Cas核酸内切酶和相关酶联合使用，以用于基因编辑以及相关系统(包括碱基编辑)的应用。简单来说，一个或多个gRNA分子与Cas蛋白组装为复合物，并且将核糖核酸复合物(RNP)引导到特定的DNA(例如，在Cas9和Cas12系统中)和/或RNA(例如，在Cas13系统中)序列。

用于治疗应用的常见形式的gRNA为大约100个核苷酸的单一非天然RNA，该单一非天然RNA与Cas蛋白诸如Cas9形成核糖核蛋白。使CRISPR/Cas编辑系统适应新技术(例如，基因编辑)的能力要求引导RNA(gRNA)在靶细胞内持续足够长的时间以实现期望的编辑。核酸酶对gRNA的降解是实现期望的编辑的重大挑战。另外，gRNA需要组装为核糖核酸(RNP并高效转运至细胞核。

发明内容

本文提供了增强用于CRISPR-Cas系统中的gRNA的效力的方法、组合物和试剂盒。在一些方面，本发明提供了产生用于CRISPR-Cas系统中的具有增加的效力的缀合至NLS序列的gRNA(NLS-gRNA)的方法，例如，增加成功编辑事件的频率。本发明的NLS-gRNA可以提供gRNA到细胞核的更好的运输，以进行保护免受胞质RNA酶的影响并增加用于形成RNP的gRNA的较高局部浓度。与不具有NLS序列的对等gRNA相比，本发明的NLS-gRNA具有显著更高的效力，并且与高度修饰的gRNA相比也显露出更高的效力。

在一个方面，本发明尤其提供了一种引导RNA(gRNA)，其包含通过接头连接至gRNA的核定位信号(NLS)，其中接头包含缀合至gRNA的3'端的半胱氨酸残基。

在一些实施例中，接头包含N末端处的半胱氨酸残基。在一些实施例中，接头包含C末端处的半胱氨酸残基。在一些实施例中，接头包含接头中的内部位点处的半胱氨酸残基。

在一些实施例中，接头缀合至gRNA的3'端。在一些实施例中，接头缀合至gRNA的5'端。在一些实施例中，接头缀合至gRNA中的内部区域。在一些实施例中，接头缀合至gRNA中的第一发夹区域。在一些实施例中，接头缀合至gRNA中的第二发夹区域。在一些实施例中，接头缀合至gRNA中的隆突区域。在一些实施例中，gRNA包含一个或多个修饰。在一些实施例中，一个或多个修饰为2'OMe修饰。在一些实施例中，一个或多个修饰包括2'-氟修饰。在一些实施例中，一个或多个修饰包括硫代磷酸酯键。

在一些实施例中，gRNA不包含骨架修饰。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3、4、5、6、7、8和9个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3、4、5、6、7和8个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3、4、5、6和7个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3、4、5和6个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3、4和5个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2、3和4个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1、2和3个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1和2个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的3'端1个核苷酸处。

在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3、4、5、6、7、8和9个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3、4、5、6、7和8个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3、4、5、6和7个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3、4、5和6个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3、4和5个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2、3和4个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1、2和3个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1和2个核苷酸处。在一些实施例中，一个或多个修饰出现在距gRNA的5'端1个核苷酸处

在一些实施例中，多于10％的gRNA是经修饰的。在一些实施例中，多于20％的gRNA是经修饰的。在一些实施例中，多于30％的gRNA是经修饰的。在一些实施例中，多于35％的gRNA是经修饰的。在一些实施例中，多于40％的gRNA是经修饰的。在一些实施例中，多于45％的gRNA是经修饰的。在一些实施例中，多于50％的gRNA是经修饰的。在一些实施例中，多于55％的gRNA是经修饰的。在一些实施例中，多于60％的gRNA是经修饰的。在一些实施例中，多于65％的gRNA是经修饰的。在一些实施例中，多于70％的gRNA是经修饰的。在一些实施例中，多于75％的gRNA是经修饰的。在一些实施例中，多于80％的gRNA是经修饰的。在一些实施例中，多于85％的gRNA是经修饰的。在一些实施例中，多于88％的gRNA是经修饰的。在一些实施例中，多于90％的gRNA是经修饰的。在一些实施例中，多于95％的gRNA是经修饰的。

在一些实施例中，少于10％的gRNA是经修饰的。在一些实施例中，少于20％的gRNA是经修饰的。在一些实施例中，少于30％的gRNA是经修饰的。在一些实施例中，少于35％的gRNA是经修饰的。在一些实施例中，少于40％的gRNA是经修饰的。在一些实施例中，少于45％的gRNA是经修饰的。在一些实施例中，少于50％的gRNA是经修饰的。在一些实施例中，少于55％的gRNA是经修饰的。在一些实施例中，少于60％的gRNA是经修饰的。在一些实施例中，少于65％的gRNA是经修饰的。在一些实施例中，少于70％的gRNA是经修饰的。在一些实施例中，少于75％的gRNA是经修饰的。在一些实施例中，少于80％的gRNA是经修饰的。在一些实施例中，少于85％的gRNA是经修饰的。在一些实施例中，少于88％的gRNA是经修饰的。在一些实施例中，少于90％的gRNA是经修饰的。在一些实施例中，少于95％的gRNA是经修饰的。

在一些实施例中，gRNA缀合至一个或多个NLS序列。在一些实施例中，gRNA可以包含3'端处或附近的约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS、5'端处或附近的约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS，或这些的组合(例如3'端处的一个或多个NLS和5'端处的一个或多个NLS)。当存在多于一个NLS时，每一个均可以独立于其他而被选择，使得单个NLS可以以多于一个拷贝存在和/或与以一个或多个拷贝存在的一个或多个其他NLS组合存在。

NLS的非限制性示例包括衍生自以下的NLS序列：SV40病毒大T抗原的NLS，具有氨基酸序列PKKKRKV(SEQ ID NO:41)；来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:42)的核质蛋白二分NLS)；c-myc NLS，具有氨基酸序列PAAKRVKLD(SEQ ID NO:43)或RQRRNELKRSP(SEQ ID NO:44)；hRNPA1M9 NLS，具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:45)；来自输入蛋白α(importin-α)的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:46)；肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:47)和PPKKARED(SEQ ID NO:48)；人p53的序列POPKKKPL(SEQ ID NO:49)；小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:50)；流感病毒NS1的序列DRLRR(SEQ ID NO:51)和PKQKKRK(SEQ ID NO:52)；肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:53)；小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:54)；人聚(ADP核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:55)；以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:56)。

在一些实施例中，NLS衍生自猿猴病毒40(SV40)。在一些实施例中，NLS包含KKKRKV(SEQ ID NO:57)的氨基酸序列。在一些实施例中，NLS包括二分NLS。在一些实施例中，NLS包括二分NLS连同SV40 NLS。

在一些实施例中，接头进一步包含肽间隔子。在一些实施例中，肽间隔子包含多于2个氨基酸。在一些实施例中，肽间隔子包含多于3个氨基酸。在一些实施例中，肽间隔子包含多于4个氨基酸。在一些实施例中，肽间隔子包含多于5个氨基酸。在一些实施例中，肽间隔子包含多于6个氨基酸。在一些实施例中，肽间隔子包含多于7个氨基酸。在一些实施例中，肽间隔子包含多于8个氨基酸。在一些实施例中，肽间隔子包含多于9个氨基酸。在一些实施例中，肽间隔子包含多于10个氨基酸。在一些实施例中，肽间隔子包含多于12个氨基酸。在一些实施例中，肽间隔子包含多于15个氨基酸。在一些实施例中，肽间隔子包含多于18个氨基酸。在一些实施例中，肽间隔子包含多于20个氨基酸。在一些实施例中，肽间隔子包含多于25个氨基酸。在一些实施例中，肽间隔子包含多于30个氨基酸。

在一些实施例中，肽间隔子包含2至30个氨基酸。在一些实施例中，肽间隔子包含5至25个氨基酸。在一些实施例中，肽间隔子包含7至20个氨基酸。在一些实施例中，肽间隔子包含7至15个氨基酸。在一些实施例中，肽间隔子包含7至12个氨基酸。

在一些实施例中，肽间隔子包含约5个氨基酸。在一些实施例中，肽间隔子包含约7个氨基酸。在一些实施例中，肽间隔子包含约8个氨基酸。在一些实施例中，肽间隔子包含约9个氨基酸。在一些实施例中，肽间隔子包含约10个氨基酸。在一些实施例中，肽间隔子包含约11个氨基酸。在一些实施例中，肽间隔子包含约12个氨基酸。在一些实施例中，肽间隔子包含约13个氨基酸。在一些实施例中，肽间隔子包含约14个氨基酸。在一些实施例中，肽间隔子包含约15个氨基酸。

在一些实施例中，肽间隔子包含KRTADGSEFESP(SEQ ID NO:58)的氨基酸序列。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列70％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列75％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列80％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列85％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列90％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列92％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列95％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列97％相同。在一些实施例中，肽间隔子与KRTADGSEFESP的氨基酸序列99％相同。

在一些实施例中，接头进一步包含将gRNA缀合至肽间隔子或者至NLS的化学部分。

在实施例中，gRNA经由接头缀合至NLS。在实施例中，所述接头包含化学部分(例如，L)和/或肽部分(例如，肽间隔子)。

在实施例中，gRNA经由化学部分(例如，L)直接缀合至NLS。在实施例中，化学部分(例如，L)是非肽的。在实施例中，化学部分(例如，L)共价附接至gRNA和NLS两者。

在实施例中，gRNA经由肽部分(例如，肽间隔子)缀合至NLS。在实施例中，肽部分(例如，肽间隔子)共价附接至gRNA和NLS两者。

在实施例中，gRNA经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至NLS。在实施例中，此类缀合物可以具有根据式(I)的结构，其中化学部分L(例如，非肽化学部分)共价附接至gRNA和肽间隔子，并且其中肽间隔子共价附接至NLS。

在实施例中，gRNA经由共价附接至肽间隔子或NLS氨基酸序列的C末端的化学部分(例如，L)缀合至NLS。

在实施例中，gRNA经由共价附接至肽间隔子或NLS氨基酸序列的N末端的化学部分(例如，L)缀合至NLS。

在实施例中，gRNA经由共价附接至gRNA的3'端的化学部分(例如，L)缀合至肽间隔子或NLS。

在实施例中，gRNA经由共价附接至gRNA的5'端的化学部分(例如，L)缀合至肽间隔子或NLS。

在实施例中，化学部分(例如，L)共价附接至肽间隔子或NLS的含硫醇残基(例如，半胱氨酸残基)。

在实施例中，化学部分(例如，L)共价附接至肽间隔子或NLS的含硒残基(例如，硒代半胱氨酸残基)。

在实施例中，化学部分(例如，L)共价附接至肽间隔子或NLS的含氨基残基(例如，赖氨酸残基)。

在实施例中，化学部分(例如，L)共价附接至肽间隔子或NLS的含酚残基(例如，酪氨酸残基)。

在实施例中，用于形成接头的氨基酸残基(例如，如本文所描述的含硫醇、硒、氨基或酚的残基)包含化学修饰。

在一些实施例中，引导RNA进一步包含核酸接头序列。在一些实施例中，核酸接头序列为RNA序列。

在一些实施例中，核酸接头序列定位在引导RNA序列的5'端和/或3'端处。

在一些实施例中，核酸接头包含约1至50个核苷酸。在一些实施例中，核酸接头包含约1至45个核苷酸。在一些实施例中，核酸接头包含约1至40个核苷酸。在一些实施例中，核酸接头包含约1至35个核苷酸。在一些实施例中，核酸接头包含约1至30个核苷酸。在一些实施例中，核酸接头包含约1至25个核苷酸。在一些实施例中，核酸接头包含约1至20个核苷酸。在一些实施例中，核酸接头包含约1至15个核苷酸。在一些实施例中，核酸接头包含约1至10个核苷酸。在一些实施例中，核酸接头包含约1至5个核苷酸。

在一些实施例中，核酸接头包含约5个核苷酸、约10个核苷酸、约15个核苷酸、约20个核苷酸、约25个核苷酸、约30个核苷酸、约35个核苷酸、约40个核苷酸、约45个核苷酸或约50个核苷酸。

在一些实施例中，引导RNA不包含核酸接头。在一些实施例中，核酸接头包含约一个核苷酸。在一些实施例中，核酸接头包含约2个核苷酸。在一些实施例中，核酸接头包含约3个核苷酸。在一些实施例中，核酸接头包含约4个核苷酸。在一些实施例中，核酸接头包含约5个核苷酸。在一些实施例中，核酸接头包含约6个核苷酸。在一些实施例中，核酸接头包含约7个核苷酸。在一些实施例中，核酸接头包含约8个核苷酸。在一些实施例中，核酸接头包含约9个核苷酸。在一些实施例中，核酸接头包含约10个核苷酸。在一些实施例中，核酸接头包含约11个核苷酸。在一些实施例中，核酸接头包含约12个核苷酸。在一些实施例中，核酸接头包含约13个核苷酸。在一些实施例中，核酸接头包含约14个核苷酸。在一些实施例中，核酸接头包含约15个核苷酸。在一些实施例中，核酸接头包含约16个核苷酸。在一些实施例中，核酸接头包含约17个核苷酸。在一些实施例中，核酸接头包含约18个核苷酸。在一些实施例中，核酸接头包含约19个核苷酸。在一些实施例中，核酸接头包含约20个核苷酸。在一些实施例中，核酸接头包含约21个核苷酸。在一些实施例中，核酸接头包含约22个核苷酸。在一些实施例中，核酸接头包含约23个核苷酸。在一些实施例中，核酸接头包含约24个核苷酸。在一些实施例中，核酸接头包含约25个核苷酸。

在一些实施例中，核酸接头包含介于约50与100个核苷酸。在一些实施例中，核酸接头包含介于约100与150个核苷酸。在一些实施例中，核酸接头包含介于约150与200个核苷酸。在一些实施例中，核酸接头包含介于约200与500个核苷酸。

在一些实施例中，核酸接头序列为线性接头序列。在一些实施例中，接头序列为非线性序列。在一些实施例中，接头序列包含RNA二级结构。

在一些实施例中，核酸接头序列放置在引导RNA序列的3'端和/或5'端处。

在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA提高碱基编辑效率。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少1.5倍。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少2倍。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少2.5倍。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少3倍。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少4倍。在一些实施例中，与不具有NLS的gRNA相比，包含NLS的gRNA将碱基编辑效率提高至少5倍。

在一些实施例中，引导RNA进一步包含在天然CRISPR系统中发现的同向重复序列。

在一些实施例中，gRNA为单个引导RNA(sgRNA)。在一些实施例中，gRNA为tracrRNA。在一些实施例中，gRNA为crRNA。

在一些实施例中，引导RNA包含成簇规律间隔短回文重复(CRISPR)RNA(crRNA)。在一些实施例中，引导RNA进一步包含反式激活RNA(tracrRNA)。

在一些实施例中，crRNA是经修饰的。在一些实施例中，tracrRNA是经修饰的。在一些实施例中，crRNA和/或包含化学修饰的核苷酸。在一些实施例中，tracrRNA包含维持折叠的附加序列。在一些实施例中，接头包含化学修饰的核苷酸。

在一些实施例中，对crRNA、tracrRNA和/或接头的修饰包括以下中的一者或多者：1)化学修饰；2)保留二级结构的任何核苷酸取代；3)GC含量的改变；4)维持tracrRNA的经预测的折叠的序列的添加。

在一些实施例中，本文提供了一种方法，其中NLS-gRNA为扩展引导RNA，或Cas9引导RNA，或Cas13引导RNA，或Cas12引导RNA诸如Cas12a引导RNA、Cas12b引导RNA、Cas12c引导RNA、Cas12d引导RNA、Cas12e引导RNA、Cas12f引导RNA、Cas12g引导RNA、Cas12h引导RNA、Cas12i引导RNA、Cas12j引导RNA、Cas12k引导RNA。因此，在一些实施例中，NLS-gRNA为扩展引导RNA。在一些实施例中，NLS-gRNA为Cas9引导RNA。在一些实施例中，NLS-gRNA为Cas13引导RNA。在一些实施例中，NLS-gRNA为Cas12引导RNA。在一些实施例中，NLS-gRNA为Cas12a引导RNA。在一些实施例中，NLS-gRNA为Cas12b引导RNA。在一些实施例中，NLS-gRNA为Cas12c引导RNA。在一些实施例中，NLS-gRNA为Cas12d引导RNA。在一些实施例中，NLS-gRNA为Cas12e引导RNA。在一些实施例中，NLS-gRNA为Cas12f引导RNA。在一些实施例中，NLS-gRNA为Cas12g引导RNA。在一些实施例中，NLS-gRNA为Cas12h引导RNA。在一些实施例中，NLS-gRNA为Cas12i引导RNA。在一些实施例中，NLS-gRNA为Cas12j引导RNA。在一些实施例中，NLS-gRNA为Cas12k引导RNA。

在一些实施例中，NLS-gRNA包括以下中的一者或多者：间隔子、下部茎、隆突、上部茎、连结和发夹。

在一些实施例中，茎环包含GC碱基对。

在一些实施例中，本文提供了一种方法，其中NLS-gRNA以约50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更大的产率产生。因此，在一些实施例中，NLS-gRNA以约50％的产率产生。在一些实施例中，NLS-gRNA以约55％的产率产生。在一些实施例中，NLS-gRNA以约60％的产率产生。在一些实施例中，NLS-gRNA以约65％的产率产生。在一些实施例中，NLS-gRNA以约70％的产率产生。在一些实施例中，NLS-gRNA以约75％的产率产生。在一些实施例中，NLS-gRNA以约80％的产率产生。在一些实施例中，NLS-gRNA以约85％的产率产生。在一些实施例中，NLS-gRNA以约90％的产率产生。在一些实施例中，NLS-gRNA以约95％的产率产生。在一些实施例中，NLS-gRNA以大于99％的产率产生。

在一些实施例中，与常规合成方法相比，NLS-gRNA以高50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、99％或更大的产率产生。因此，在一些实施例中，与常规合成方法相比，NLS-gRNA以高50％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高55％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高60％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高65％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高70％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高75％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高80％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高85％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高90％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高95％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高99％的产率产生。在一些实施例中，与常规合成方法相比，NLS-gRNA以高大于99％的产率产生。

在一些实施例中，NLS-gRNA具有约40个核苷酸、约100个核苷酸、约125个核苷酸、约150个核苷酸、约175个核苷酸、约200个核苷酸或大于约200个核苷酸的长度。因此，在一些实施例中，NLS-gRNA具有约40个核苷酸的长度。在一些实施例中，NLS-gRNA具有约100个核苷酸的长度。在一些实施例中，NLS-gRNA具有约125个核苷酸的长度。在一些实施例中，NLS-gRNA具有约150个核苷酸的长度。在一些实施例中，NLS-gRNA具有约175个核苷酸的长度。在一些实施例中，NLS-gRNA具有约200个核苷酸的长度。在一些实施例中，NLS-gRNA具有大于约200个核苷酸的长度。

在一些实施例中，NLS-gRNA长度是Cas依赖性的。例如，在一些实施例中，针对Cas12a的NLS-gRNA长度为大于40个核苷酸。在一些实施例中，针对Cas9的NLS-gRNA长度为大于123个核苷酸。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与200个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与250个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与300个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与350个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与400个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与450个核苷酸之间。在一些实施例中，针对Cas9的NLS-gRNA长度介于125与500个核苷酸之间。

在一些实施例中，NLS-gRNA包含一个或多个骨架修饰。

在一些实施例中，所述一个或多个骨架修饰包括2'O-甲基或硫代磷酸酯修饰。因此，在一些实施例中，所述一个或多个骨架修饰包括2'O-甲基修饰。在一些实施例中，所述一个或多个骨架修饰包括硫代磷酸酯修饰。

在一些实施例中，一个或多个骨架修饰选自3'-硫代磷酸2'-O-甲酯、2'-O-甲基、2'-核糖3'-硫代磷酸酯、2'-氟、2'-O-甲氧乙基吗啉基(PMO)、锁核酸(LNA)、脱氧或5'磷酸酯修饰。因此，在一些实施例中，所述一个或多个骨架修饰包括3'-硫代磷酸2'-O-甲酯修饰。在一些实施例中，一个或多个骨架修饰包括2'-O-甲基修饰。在一些实施例中，所述一个或多个修饰包括2'-核糖3'-硫代磷酸酯修饰。在一些实施例中，一个或多个修饰包括2'-氟修饰。在一些实施例中，一个或多个修饰包括2'-O-甲氧乙基吗啉基(PMO)修饰。在一些实施例中，一个或多个修饰包括锁核酸(LNA)。在一些实施例中，所述一个或多个修饰包括脱氧修饰。在一些实施例中，所述一个或多个修饰包括5'磷酸酯修饰。

各种经修饰的RNA碱基在本领域中是已知的并且包含例如2'-O-甲氧基-乙基碱基(2'-MOE)，如2-甲氧基乙氧基A、2-甲氧基乙氧基MeC、2-甲氧基乙氧基G、2-甲氧基乙氧基T。其它经修饰的碱基包含例如2'-O-甲基RNA碱基和氟基碱基。各种氟代碱基是已知的，并且包含例如氟基C、氟基U、氟基A、氟基G碱基。各种2'-O甲基修饰也可以与本文所描述的方法一起使用。例如，包含以下2'-O甲基修饰中的一者或多者的以下RNA可以与所描述的方法一起使用：2'-OMe-5-甲基-rC、2'-OMe-rT、2'-OMe-rI、2'-OMe-2-氨基-rA、氨基接头-C6-rC、氨基接头-C6-rU、2'-OMe-5-Br-rU、2'-OMe-5-I-rU、2-OMe-7-Deaza-rG。

在一些实施例中，RNA包含以下修饰中的一者或多者：硫代磷酸酯、2'O-甲基、2'氟基(2'F)、脱氧。在一些实施例中，RNA包含3'端处的2'OMe修饰。在一些实施例中，RNA包含5'端处的2'OMe修饰。在一些实施例中，RNA包含3'端和5'端处的2'OMe修饰。在一些实施例中，RNA包含以下修饰中的一者或多者：2'-O-2-甲氧基乙基(MOE)、锁核酸、桥接核酸、解锁核酸、肽核酸、吗啉基核酸。在一些实施例中，RNA包含以下碱基修饰中的一者或多者：2,6-二氨基嘌呤、2-氨基嘌呤、假尿嘧啶、N1-甲基-假尿嘧啶、5'甲基胞嘧啶、2'嘧啶酮(泽布拉林(zebularine))、胸腺嘧啶。其他经修饰的碱基包含例如2-氨基嘌呤、5-溴基dU、脱氧尿苷、2,6-二氨基嘌呤(2-氨基-dA)、双脱氧-C、脱氧肌苷、羟甲基dC、反向dT、Iso-dG、Iso-dC、反向双脱氧-T、5-甲基dC、5-甲基dC、5-硝基吲哚、Super2'-F-r(C,U)、2'-NH2-r(C,U)、2,2'-脱水-U、3'-脱氧-r(A,C,G,U)、3'-O-甲基-r(A,C,G,U)、rT、rI、5-甲基-rC、2-氨基-rA、rSpacer(Abasic)、7-Deaza-rG、7-Deaza-rA、8-氧代-rG、5-卤化-rU、N-烷基化-rN。

本文可以使用其它经化学修饰的RNA。例如，RNA可以包含经修饰的碱基，诸如例如5'Int,3'叠氮化物(NHS酯)；5'己炔基；5'Int,3'5-辛二炔基dU；5',Int生物素(叠氮化物)；5',Int 6-FAM(叠氮化物)；以及5',Int 5-TAMRA(叠氮化物)。可以用于本文所述方法的RNA核苷酸修饰的其它实例包含例如磷酸化修饰，如5'-磷酸化和3'-磷酸化。RNA还可以具有以下修饰中的一个或多个修饰：氨基修饰、生物素化、硫醇修饰、炔烃修饰、腺苷酸化、叠氮化物(NHS酯)、胆固醇-TEG和地高辛(NHS酯)。

在一些实施例中，该方法以约50％、60％、70％、80％、90％或多于90％的纯度产生NLS-gRNA。因此，在一些实施例中，该方法以约50％的纯度产生NLS-gRNA。在一些实施例中，该方法以约60％的纯度产生NLS-gRNA。在一些实施例中，该方法以约70％的纯度产生NLS-gRNA。在一些实施例中，该方法以约80％的纯度产生NLS-gRNA。在一些实施例中，该方法以约90％的纯度产生NLS-gRNA。在一些实施例中，其中该方法以约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或多于约99％的纯度产生NLS-gRNA。在一些实施例中，该方法以约91％的纯度产生NLS-gRNA。在一些实施例中，该方法以约92％的纯度产生NLS-gRNA。在一些实施例中，该方法以约93％的纯度产生NLS-gRNA。在一些实施例中，该方法以约94％的纯度产生NLS-gRNA。在一些实施例中，该方法以约95％的纯度产生NLS-gRNA。在一些实施例中，该方法以约96％的纯度产生NLS-gRNA。在一些实施例中，该方法以约97％的纯度产生NLS-gRNA。在一些实施例中，该方法以约98％的纯度产生NLS-gRNA。在一些实施例中，该方法以约99％的纯度产生NLS-gRNA。在一些实施例中，该方法以大于约99％的纯度产生NLS-gRNA。

在一个方面，本发明尤其提供了一种包含引导RNA(gRNA)的组合物，该引导RNA包含通过接头连接至gRNA的核定位信号(NLS)，其中接头包含缀合至gRNA的3'端的半胱氨酸残基，其中NLS引导RNA封装在脂质纳米颗粒(LNP)中。在一个方面，本发明尤其提供了一种包含引导RNA(gRNA)的组合物，该引导RNA包含通过接头连接至gRNA的核定位信号(NLS)，其中接头包含缀合至gRNA的3'端的半胱氨酸残基，其中NLS引导RNA与脂质纳米颗粒(LNP)相关联。

在一些实施例中，该组合物包含核酸酶。在一些实施例中，该组合物包含编码核酸酶的核酸。在一些实施例中，该组合物包含编码核酸酶的mRNA。

在一些实施例中，核酸酶缀合至NLS。在一些实施例中，Cas蛋白缀合至NLS。在一些实施例中，Cas蛋白不包含NLS。在一些实施例中，Cas蛋白未缀合至NLS。在一些实施例中，Cas9蛋白不包含NLS。在一些实施例中，Cas9蛋白未缀合至NLS。

在一些实施例中，该组合物包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比1:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比2:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比3:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比4:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比5:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比6:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比7:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比8:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比9:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比10:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比12:1包含NLS-gRNA以及编码核酸酶的mRNA。在一些实施例中，该组合物以重量比15:1包含NLS-gRNA以及编码核酸酶的mRNA。

在一些实施例中，核酸酶为CRISPR 2类II型酶。在一些实施例中，核酸酶为CRISPR2类V型酶。在一些实施例中，核酸酶CRISPR 2类VI型酶。在一些实施例中，其中核酸酶为Cas9、Cpf1、SaCas9、Cas12、Cas13或其经修饰的型式。因此，在一些实施例中，核酸酶为Cas9或其经修饰的型式。在一些实施例中，核酸酶为Cpf1或其经修饰的型式。在一些实施例中，核酸酶为金黄色葡萄球菌Cas9(SaCas9)或其经修饰的型式。在一些实施例中，核酸酶为嗜热链球菌1Cas9(St1Cas9)或其经修饰的型式。在一些实施例中，核酸酶为酿脓链球菌Cas9(SpCas9)或其经修饰的型式。在一些实施例中，核酸酶为Cas12或其经修饰的型式。在一些实施例中，核酸酶为Cas13或其经修饰的型式。

在一些实施例中，Cas9包含核酸酶失活Cas9(dCas9)。在一些实施例中，Cas9包含Cas9切口酶(nCas9)。在一些实施例中，Cas9包含核酸酶活性Cas9。

在一些实施例中，核酸酶结构域融合至异源多肽。在一些实施例中，异源多肽包含能够对核酸(例如，DNA)进行修饰的效应子结构域。例如，DNA效应子结构域可以为脱氨酶结构域，诸如胞苷脱氨酶结构域、胞嘧啶结构域或腺苷脱氨酶结构域。在某些实施例中，脱氨酶结构域为胞苷脱氨酶结构域，诸如APOBEC或AID胞苷脱氨酶。对于能够将胞苷脱氨基为尿苷(例如，以诱导DNA分子中的C至T突变)的碱基编辑蛋白，胞苷脱氨酶可以为来自载脂蛋白B mRNA编辑复合物(APOBEC)家族脱氨酶的脱氨酶。在一些实施例中，异源多肽为胞苷或胞嘧啶脱氨酶结构域。在一些实施例中，异源多肽为胞嘧啶脱氨酶结构域。在一些实施例中，异源多肽为胞苷脱氨酶结构域。在一些实施例中，异源多肽为腺苷或腺嘌呤脱氨酶结构域。在一些实施例中，异源多肽为腺苷结构域。在一些实施例中，异源多肽为腺嘌呤结构域。

在一些实施例中，异源多肽为腺苷脱氨酶变体结构域。在一些实施例中，腺苷脱氨酶变体结构域包含关于SEQ ID NO:3的一个或多个突变。在一些实施例中，腺苷脱氨酶变体结构域包含V82G。在一些实施例中，腺苷脱氨酶变体结构域包含Y147T/D。在一些实施例中，腺苷脱氨酶变体结构域包含Q154S。在一些实施例中，腺苷脱氨酶变体结构域包含L36H。在一些实施例中，腺苷脱氨酶变体结构域包含I76Y。在一些实施例中，腺苷脱氨酶变体结构域包含F149Y。在一些实施例中，腺苷脱氨酶变体结构域包含N157K。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D和Q154S。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S和L36H。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S和I76Y。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S和F149Y。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S和N157K。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S和D167N。在一些实施例中，腺苷脱氨酶变体结构域包含V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在一些实施例中，腺苷脱氨酶结构域包含突变I76Y、V82G、Y147T和Q154S。在一些实施例中，腺苷脱氨酶结构域包含突变L36H、V82G、Y147T、Q154S和N157K。在一些实施例中，腺苷脱氨酶结构域包含突变V82G、Y147D、F149Y、Q154S和D167N。在一些实施例中，腺苷脱氨酶结构域包含突变L36H、V82G、Y147D、F149Y、Q154S、N157K和D167N。在一些实施例中，腺苷脱氨酶结构域包含突变L36H、I76Y、V82G、Y147T、Q154S和N157K。在一些实施例中，腺苷脱氨酶结构域包含突变I76Y、V82G、Y147D、F149Y、Q154S和D167N。在一些实施例中，腺苷脱氨酶结构域包含突变Y147D、F149Y和D167N。在一些实施例中，腺苷脱氨酶结构域包含突变L36H、I76Y、V82G、Q154S和N157K。在一些实施例中，腺苷脱氨酶结构域包含突变I76Y、V82G和Q154S。在一些实施例中，腺苷脱氨酶结构域包含突变L36H、I76Y、V82G、Y147D、F149Y、Q154S、N157K和D167N。

在一些实施例中，异源多肽融合至核酸酶结构域的N末端。在一些实施例中，异源多肽融合至核酸酶结构域的C末端。在一些实施例中，异源多肽位于核酸酶结构域内部。在一些实施例中，异源多肽融合至Cas9的N末端。在一些实施例中，异源多肽融合至Cas9的C末端。在一些实施例中，异源多肽位于Cas9内部。在一些实施例中，腺苷脱氨酶变体融合至Cas9的N末端。在一些实施例中，腺苷脱氨酶变体融合至Cas9的C末端。在一些实施例中，腺苷脱氨酶变体位于Cas9内部。

在一些实施例中，NLS-gRNA适合与CRISPR/Cas系统一起使用。在一些实施例中，NLS-gRNA适合与CRISPR 2类II型酶一起使用。在一些实施例中，NLS-gRNA适合与CRISPR 2类V型酶一起使用。在一些实施例中，NLS-gRNA适合与CRISPR 2类VI型酶一起使用。在一些实施例中，其中NLS-gRNA适合与Cas9、Cpf1、SaCas9、Cas12、Cas13或其经修饰的型式一起使用。因此，在一些实施例中，NLS-gRNA适合与Cas9或其经修饰的型式一起使用。在一些实施例中，NLS-gRNA适合与Cpf1或其经修饰的型式一起使用。在一些实施例中，NLS-gRNA适合与SaCas9或其经修饰的型式一起使用。在一些实施例中，NLS-gRNA适合与Cas12或其经修饰的型式一起使用。在一些实施例中，NLS-gRNA适合与Cas13或其经修饰的型式一起使用。在一些实施例中，NLS-gRNA与Cas酶复合。

在一些实施例中，RNA序列被包含在内，其将通过一些Cas(例如Cas12a和Cas13)的核酸内切酶活性进行切割以在与Cas蛋白组装之前或期间将gRNA线性化。

在一些实施例中，与不具有NLS序列的gRNA相比，NLS-gRNA提供增加的稳定性和对细胞核酸外切酶的抗性。在一些实施例中，NLS-gRNA使用CRISPR/Cas编辑系统在靶细胞中提供增加的编辑事件。

在一些实施例中，NLS-gRNA与CRISPR 2类II型酶复合。在一些实施例中，NLS-gRNA与CRISPR 2类V型酶复合。在一些实施例中，NLS-gRNA与CRISPR 2类VI型酶复合。在一些实施例中，NLS-gRNA与Cas9、Cpf1、SaCas9、Cas12、Cas13或其经修饰的型式复合。

在一些方面，提供了一种Cas蛋白复合物，该复合物包含Cas核酸酶和NLS-gRNA。

在一些实施例中，Cas核酸酶为CRISPR 2类II型酶。在一些实施例中，Cas核酸酶为CRISPR 2类V型酶。在一些实施例中，Cas核酸酶为CRISPR 2类VI型酶。在一些实施例中，Cas核酸酶选自Cas9、Cpf1、SaCas9、Cas12、Cas13或其经修饰的型式。

在一些实施例中，本文提供了一种用于靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰的方法，该方法包括向真核细胞中引入：(a)NLS缀合的引导RNA(NLS-gRNA)；(b)至少一种CRISPR/Cas蛋白或编码至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与染色体DNA中的靶序列之间的相互作用引起靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰。

在一些实施例中，本文提供了一种用于靶向RNA修饰的方法，该方法包括向真核细胞中引入：(a)NLS缀合的引导RNA(NLS-gRNA)；以及(b)至少一种CRISPR/Cas蛋白或编码至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与由染色体DNA表达的RNA之间的相互作用引起由染色体DNA表达的RNA的修饰。

在一些实施例中，由所述染色体DNA表达的所述RNA是信使RNA(mRNA)。

在一些方面，本发明提供了一种药物组合物，其包含本发明的NLS-gRNA以及药学上可接受的载剂。

在一个方面，本发明尤其提供了一种组合物，其包含工程化或非天然存在的CRISPR关联Cas(CRISPR-Cas)系统，该系统包含：Cas蛋白；gRNA，其包含通过接头连接至该gRNA的核定位信号(NLS)，其中接头包含缀合至gRNA的3'端的半胱氨酸残基；并且其中gRNA能够与Cas蛋白形成复合物并将Cas9蛋白靶向靶DNA。

在一些实施例中，gRNA包含核酸序列5'-CAGUAUGGACACUGUCCAAA-3'(SEQ ID NO:2)。

在一个方面，本发明尤其提供了一种组合物，其包含工程化或非天然存在的CRISPR关联Cas(CRISPR-Cas)系统，该系统包含：(a)saCas9蛋白；(b)腺苷脱氨酶变体，其融合至Cas9蛋白；以及(c)gRNA，其包含通过接头连接至该gRNA的核定位信号(NLS)；其中接头包含缀合至gRNA的3'端的半胱氨酸残基；并且其中gRNA能够与saCas9蛋白形成复合物并将saCas9蛋白靶向靶DNA；其中腺苷脱氨酶变体包含V82G、Y147T/D、Q154S，以及关于SEQ IDNO:3的L36H、I76Y、F149Y、N157K和D167N中的一者或多者；并且其中gRNA包含SEQ ID NO:2。

在一个方面，本发明尤其提供了一种通过向有此需要的受试者施用本发明的组合物(例如，NLS-gRNA)来治疗受试者的遗传疾病的方法。

在一个方面，本发明尤其提供了一种治疗1a型糖原贮积病(GSD1a)的方法，该方法包括向受试者施用本发明的组合物(例如，NLS-gRNA)。

在一些实施例中，本文提供一种组合物，其包含缀合至NLS的gRNA，其中相对于包含不具有NLS的gRNA的组合物，该组合物的核递送增加至约2至5倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，该组合物的核递送增加至约2倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，该组合物的核递送增加至约3倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，核递送增加至约4倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，核递送增加至约5倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，核递送增加至大于约2倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，核递送增加至1.5至10倍。在一些实施例中，相对于包含不具有NLS的gRNA的组合物，核递送增加至大于约10倍。

在一些实施例中，gRNA包含与表8中的序列中的任一个具有70％、80％、90％、95％、99％或100％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有70％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有75％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有80％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有85％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有90％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有95％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有99％同一性的序列。在一些实施例中，gRNA包含与表8中的序列中的任一个具有100％同一性的序列。

在一些实施例中，本文提供一种组合物，其包含缀合至NLS的gRNA，其中相对于不具有NLS的gRNA，基因编辑效率增加至约2至5倍。在一些实施例中，相对于不具有NLS的gRNA，基因编辑效率增加至约2倍。在一些实施例中，相对于不具有NLS的gRNA，基因编辑效率增加至约3倍。在一些实施例中，相对于不具有NLS的gRNA，基因编辑效率增加至约4倍。在一些实施例中，相对于不具有NLS的gRNA，基因编辑效率增加至约5倍。在一些实施例中，相对于不具有NLS的gRNA，基因编辑效率增加至约1.5至10倍。

在一些实施例中，gRNA靶序列与SEQ ID NO:17具有70％、80％、90％、95％、99％或100％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有70％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有75％同一性。在一些实施例中，gRNA靶序列与SEQ IDNO:17具有70％、80％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有85％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有90％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有95％同一性。在一些实施例中，gRNA靶序列与SEQ ID NO:17具有100％同一性。

在一些实施例中，gRNA靶向选自肝脏、肾脏、大脑和心脏的器官中的一者或多者。在一些实施例中，gRNA靶向肝脏。

定义

为了更容易理解本发明，下面首先定义某些术语。用于以下术语和其它术语的另外的定义在整个说明书中阐述。

一个或一种：冠词“一个”和“一种”在本文中指代冠词的一个/种或多于一个/种(即，至少一个/种)语法宾语。举例来说，“要素”意指一个要素或多于一个要素。

大约或约：如本文中所用的术语“大约”或“约”在应用于所关注的一个或多个值时是指与所述参考值类似的值。在某些实施方案中，术语“大约”或“约”是指处于在任一方向上(大于或小于)所述参考值的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小的值的范围，除非另有说明或从上下文可以明显看出(除非该数字将超过一个可能的值的100％)。

关联：如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式有关，则两个事件或实体彼此“相关”，如该术语在本文所使用。例如，如果特定实体(例如，多肽)的存在、水平和/或形式与疾病、病症或病状的发病率和/或易感性有关(例如，跨相关群体)，则所述特定实体被认为与特定疾病、病症或病状相关。在一些实施例中，如果两个或更多个实体直接或间接相互作用，使得其在物理上彼此接近和保持彼此接近，则其在物理上彼此“缔合”。在一些实施方案中，在物理上彼此相关的两个或更多个实体彼此共价连接；在一些实施方案中，在物理上彼此相关的两个或更多个实体彼此不共价连接，而是非共价关联，例如借助于氢键、凡得瓦尔力相互相用(van der Waalsinteraction)、疏水性相互作用、磁性和其组合相关联。

“腺苷脱氨酶”或“腺嘌呤脱氨酶”意指能够催化腺嘌呤或腺苷的水解脱氨基的多肽或其片段。在一些实施例中，脱氨酶或脱氨酶结构域为催化腺苷水解脱氨基为肌苷或脱氧腺苷水解脱氨基为脱氧肌苷的腺苷脱氨酶。在一些实施例中，腺苷脱氨酶催化脱氧核糖核酸(DNA)中的腺嘌呤或腺苷的水解脱氨基。本文所提供的腺苷脱氨酶(例如工程化的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体(例如，真核生物体、原核生物体)，包括但不限于藻类、细菌、真菌、植物、无脊椎动物(例如，昆虫)和脊椎动物(例如，两栖动物、哺乳动物)。在一些实施例中，腺苷脱氨酶为具有一种或多种改变的腺苷脱氨酶变体，并且能够使靶多核苷酸(例如，DNA、RNA)中的腺嘌呤和胞嘧啶两者脱氨基。在一些实施例中，靶多核苷酸是单链或双链的。在一些实施例中，腺苷脱氨酶变体能够使DNA中的腺嘌呤和胞嘧啶两者脱氨基。在一些实施例中，腺苷脱氨酶变体能够使单链DNA中的腺嘌呤和胞嘧啶两者脱氨基。在一些实施例中，腺苷脱氨酶变体能够使RNA中的腺嘌呤和胞嘧啶两者脱氨基。

“腺苷脱氨酶活性”意指催化多核苷酸中的腺嘌呤或腺苷脱氨基为鸟嘌呤。在一些实施例中，如本文所提供的腺苷脱氨酶变体维持腺苷脱氨酶活性(例如，参考腺苷脱氨酶(例如，TadA*8.20或TadA*8.19)的活性的至少约30％、40％、50％、60％、70％、80％、90％或更多)。

“腺苷碱基编辑器(ABE)”意指包含腺苷脱氨酶的碱基编辑器。

“腺苷碱基编辑器8(ABE8)多肽”或“ABE8”意指如本文所定义的包含腺苷脱氨酶变体的碱基编辑器，该腺苷脱氨酶变体包含以下参考序列的氨基酸位置82和/或166处的改变：MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAH AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)。在一些实施例中，ABE8包含相对于参考序列的进一步改变，如本文所描述。

“腺苷碱基编辑器8(ABE8)多核苷酸”意指编码ABE8多肽的多核苷酸。

“腺苷脱氨酶多核苷酸”意指编码腺苷脱氨酶多肽的多核苷酸。在特定实施例中，腺苷脱氨酶多核苷酸编码包含V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者的腺苷脱氨酶变体。在一些实施例中，腺苷脱氨酶多核苷酸编码包含以下改变组合中的一种的腺苷脱氨酶变体：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；或L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在一些实施例中，脱氨酶或脱氨酶结构域为来自生物体(诸如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠)的天然存在的脱氨酶的变体。在一些实施例中，脱氨酶或脱氨酶结构域不存在于自然界中。例如，在一些实施例中，脱氨酶或脱氨酶结构域与天然存在的脱氨酶至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、至少99.1％、至少99.2％、至少99.3％、至少99.4％、至少99.5％、至少99.6％、至少99.7％、至少99.8％或至少99.9％相同。在一些实施例中，腺苷脱氨酶来自细菌，诸如大肠杆菌、金黄色葡萄球菌、枯草芽孢杆菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或硫还原地杆菌。

在一些实施例中，腺苷脱氨酶为TadA脱氨酶。在一些实施例中，TadA脱氨酶为大肠杆菌TadA(ecTadA)脱氨酶或其片段。在一些实施例中，ecTadA脱氨酶为截短的ecTadA。例如，相对于全长的ecTadA，截短的ecTadA可能缺失一个或多个N末端氨基酸。在一些实施例中，相对于全长的ecTadA，截短的ecTadA可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N末端氨基酸残基。在一些实施例中，相对于全长的ecTadA，截短的ecTadA可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个C末端氨基酸残基。在一些实施例中，ecTadA脱氨酶不包含N末端甲硫氨酸。在一些实施例中，TadA脱氨酶为N末端截短的TadA。在特定实施例中，TadA为PCT/US2017/045381中描述的TadA中的任一者，该专利通过引用以其整体并入本文。

在一些实施例中，TadA脱氨酶为TadA变体。在一些实施例中，TadA变体为包含V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者的TadA*7.10。在一些实施例中，TadA变体为包含选自以下的改变的组合的TadA*7.10：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；或L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。在一些实施例中，TadA变体为MSP605、MSP680、MSP823、MSP824、MSP825、MSP827、MSP828或MSP829。

碱基编辑器：“碱基编辑器(BE)”或“核碱基编辑器(NBE)”意指结合多核苷酸并具有核碱基修饰活性的药剂。在各个实施例中，碱基编辑器包括核碱基修饰多肽(例如，脱氨酶)和多核苷酸可编程核苷酸结合结构域以及引导多核苷酸(例如，引导RNA)。在各个实施例中，药剂是生物分子复合物，该生物分子复合物包括具有碱基编辑活性的蛋白质结构域，即，能够修饰核酸分子(例如，DNA)内的碱基(例如，A、T、C、G或U)的结构域。在一些实施例中，多核苷酸可编程DNA结合结构域融合或连接至脱氨酶结构域。在一个实施例中，药剂是包括一个或多个具有碱基编辑活性的结构域的融合蛋白。在另一个实施例中，具有碱基编辑活性的蛋白质结构域与引导RNA连接(例如，通过引导RNA上的RNA结合基序和与脱氨酶融合的RNA结合结构域)。在一些实施例中，具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施例中，碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施例中，碱基编辑器能够使DNA内的含氮碱基脱氨基。在一些实施例中，碱基编辑器能够使RNA内的含氮碱基脱氨基。在一些实施例中，碱基编辑器能够使核糖核苷脱氨基。在一些实施例中，碱基编辑器能够使脱氧核糖核苷脱氨基。在一些实施例中，碱基编辑器能够使胞嘧啶脱氨基。在一些实施例中，碱基编辑器能够使胞苷脱氨基。在一些实施例中，碱基编辑器能够使腺苷脱氨基。在一些实施例中，碱基编辑器能够使DNA内的胞嘧啶(C)或腺苷(A)脱氨基。在一些实施例中，碱基编辑器能够使DNA内的胞嘧啶(C)和腺苷(A)脱氨基。在一些实施例中，碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中，碱基编辑器是腺苷碱基编辑器(ABE)。在一些实施例中，碱基编辑器是腺苷碱基编辑器(ABE)和胞苷碱基编辑器(CBE)。在一些实施方案中，碱基编辑器为与腺苷脱氨酶融合的无核酸酶活性的Cas9(dCas9)。在一些实施方案中，碱基编辑器与碱基切除修复抑制剂(例如UGI结构域或dISN结构域)融合。在一些实施方案中，融合蛋白包括与脱氨酶融合的Cas9切口酶和碱基切除修复抑制剂，如UGI或dISN结构域。在其他实施例中，碱基编辑器为无碱基碱基编辑器。碱基编辑器的细节在国际PCT申请第PCT/2017/045381号(WO2018/027078)和第PCT/US2016/058344号(WO2017/070632)中进行了描述，这些国际PCT申请中的每一个都通过引用整体并入本文。还参见Komor,A.C.等人,“Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage”Nature 533,420-424(2016)；Gaudelli,N.M.等人,“Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage”Nature 551,464-471(2017)；Komor,A.C.等人,“Improved base excisionrepair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A baseeditors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)和Rees,H.A.等人,“Base editing:precision chemistry on the genome andtranscriptome of living cells”.Nat Rev Genet.2018年12月；19(12):770-788.doi:10.1038/s41576-018-0059-1，该文献的全部内容特此通过引用并入本文。

碱基编辑活性：“碱基编辑活性”意指化学改变多核苷酸内的碱基(例如，通过使碱基脱氨基)。在一个实施例中，第一碱基转化为第二碱基。在一个实施例中，碱基编辑活性为胞苷脱氨酶活性，例如，将靶C·G转化为T·A。在另一个实施例中，碱基编辑活性为腺苷或腺嘌呤脱氨酶活性，例如，将A·T转化为G·C。在另一个实施例中，碱基编辑活性为胞苷脱氨酶活性，例如，将靶C·G转化为T·A，以及腺苷或腺嘌呤脱氨酶活性，例如，将A·T转化为G·C。

碱基编辑器系统：术语“碱基编辑器系统”是指用于编辑靶核苷酸序列的核碱基的系统。在各个实施例中，碱基编辑器(BE)系统包括(1)多核苷酸可编程核苷酸结合结构域(例如，Cas9)、脱氨酶结构域和胞苷脱氨酶结构域，其用于将靶核苷酸序列中的核碱基脱氨基；以及(2)一种或多种引导多核苷酸(例如，引导RNA)与多核苷酸可编程核苷酸结合结构域结合。在各个实施例中，碱基编辑器(BE)系统包括选自腺苷脱氨酶或胞苷脱氨酶的核碱基编辑器结构域，以及具有核酸序列特异性结合活性的结构域。在一些实施例中，碱基编辑器系统包括(1)碱基编辑器(BE)，该碱基编辑器包括多核苷酸可编程DNA结合结构域和脱氨酶结构域，其用于将靶核苷酸序列中的一个或多个核碱基脱氨基；以及(2)一种或多种引导RNA与多核苷酸可编程DNA结合结构域结合。在一些实施例中，多核苷酸可编程核苷酸结合结构域是多核苷酸可编程DNA结合结构域。在一些实施例中，碱基编辑器是胞苷碱基编辑器(CBE)。在一些实施例中，碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)。在一些实施例中，碱基编辑器是腺嘌呤或腺苷碱基编辑器(ABE)或胞苷碱基编辑器(CBE)。

生物活性：如本文所用，短语“生物活性”是指在生物系统中，特别是在生物体中具有活性的任何药剂的特性。例如，当施用于生物体时对所述生物体具有生物效应的药剂被视为是生物活性的。在特定实施例中，当肽具有生物活性时，所述肽的共享肽的至少一种生物活性的部分通常被称为“生物活性”部分。

切割：如本文所用，切割是指由本文所描述的CRISPR系统的核酸酶产生的靶核酸中的断裂。在一些实施例中，切割事件是双链DNA断裂。在一些实施例中，切割事件是单链DNA断裂。在一些实施例中，切割事件是单链RNA断裂。在一些实施例中，切割事件是双链RNA断裂。

互补：“互补”或“互补性”意指核酸可以通过传统的沃森-克里克碱基配对(Watson-Crick base pairing)或霍氏碱基配对(Hoogsteen base pairing)与另一核酸序列形成一个或多个氢键。互补碱基配对不仅包含G-C和A-T碱基配对，而且还包含涉及如肌苷等通用碱基的碱基配对。互补性百分比指示可以与第二核酸序列(例如，与具有10个核苷酸的第二核酸序列碱基配对的第一寡核苷酸中总共10个核苷酸中的5、6、7、8、9或10个核苷酸分别表示50％、60％、70％、80％、90％和100％的互补性)形成氢键(例如，沃森-克里克碱基配对)的核酸分子中的连续残基的百分比。为了确定互补性百分比，计算核酸分子中可以与第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的连续残基的百分比并四舍五入到最接近的整数(例如，与具有23个核苷酸的第二核酸序列碱基配对的第一寡核苷酸中总共23个核苷酸中的12、13、14、15、16或17个核苷酸分别表示52％、57％、61％、65％、70％和74％；并且分别具有至少50％、50％、60％、60％、70％和70％的互补性)。如本文所用，“基本上互补”是指链之间的互补性，使得所述链能够在生物条件下杂交。基本上互补的序列具有60％、70％、80％、90％、95％或甚至100％的互补性。另外，通过检查两条链的核苷酸序列来确定所述两条链是否能够在生物条件下杂交的技术在本领域中是众所周知的。

成簇间隔短回文重复(Clustered Interspaced Short Palindromic Repeat，CRISPR)关联(Cas)系统：如本文所用，CRISPR-Cas9系统是指参与CRISPR效应子的表达或指导CRISPR效应子活性的核酸和/或蛋白质，包含编码CRISPR效应子的序列、RNA引导以及来自CRISPR基因座的其他序列和转录物。在一些实施例中，CRISPR系统是经工程化、非天然存在的CRISPR系统。在一些实施例中，CRISPR系统的组分可以包含编码系统的一种或多种组分的核酸(例如，载体)、蛋白质形式的组分或其组合。

CRISPR阵列：如本文所用，术语“CRISPR阵列”是指包含CRISPR重复和间隔子的核酸(例如，DNA)片段。在一些实施例中，CRISPR阵列包含CRISPR重复和间隔子，从第一CRISPR重复的第一核苷酸开始并且到最后一个(末端)CRISPR重复的最后一个核苷酸结束。通常，CRISPR阵列中的每个间隔子位于两个重复序列之间。如本文所用，术语“CRISPR重复序列”或“CRISPR同向重复序列”或“同向重复序列”是指多个短的同向重复序列，这些短的直接重复序列在CRISPR阵列内显示非常少或无序列变异。

CRISPR关联蛋白(Cas)：如本文所用，术语“CRISPR关联蛋白”、“CRISPR效应子”、“效应子”或“CRISPR酶”是指执行酶活性和/或结合由RNA引导指定的核酸上的靶位点的蛋白质。在不同实施例中，CRISPR效应子具有核酸内切酶活性、切口酶活性、核酸外切酶活性、转座酶活性和/或切除活性。在其它实施例中，CRISPR效应子是核酸酶失活的。

crRNA：如本文所用，术语“CRISPR RNA”或“crRNA”是指包含由CRISPR效应子用于靶向特定核酸序列的引导序列的RNA分子。通常，crRNA含有介导靶识别的序列和与tracrRNA形成双链体的序列。在一些实施例中，crRNA:tracrRNA双链体与CRISPR效应子结合。

双链体：如本文所用，“双链体”是指由两条单链核酸相互作用形成的双螺旋结构。双链体通常由碱基的成对氢键键合，即两个单链核酸之间的“碱基配对”形成，该两个单链核酸彼此反向平行。双链体中的碱基配对通常通过沃森-克里克碱基配对发生，例如，DNA和RNA中鸟嘌呤(G)与胞嘧啶(C)形成碱基对，DNA中腺嘌呤(A)与胸腺嘧啶(T)形成碱基对，以及RNA中腺嘌呤(A)与尿嘧啶(U)形成碱基对。碱基对可以形成的条件包含生理或生物学相关条件(例如，细胞内：pH 7.2、140mM钾离子；细胞外pH 7.4、145mM钠离子)。此外，通过堆叠相邻核苷酸之间的相互作用来稳定双链体。如本文所用，可以通过碱基配对或堆叠相互作用建立或维持双链体。双链体由两条互补的核酸链形成，这些核酸链可以是基本上互补的或完全互补的。在多个碱基上碱基配对的单链核酸被称为“杂交”。

离体：如本文所用，术语“离体”是指在细胞或组织中发生的事件，该细胞或组织在多细胞生物体外而不是在多细胞生物体内生长。

功能等同物或类似物：如本文所用，术语“功能等同物”或“功能类似物”在氨基酸序列的功能衍生物的上下文中表示保留与原始序列的生物活性(功能或结构)基本上类似的生物活性的分子。功能衍生物或等同物可以是天然衍生物或是合成制备的。示例性功能衍生物包含具有一个或多个氨基酸的取代、缺失或添加的氨基酸序列，条件是蛋白质的生物活性是保守的。取代氨基酸理想地具有与所述取代氨基酸相似的化学物理性质。理想的相似化学物理性质包含电荷、体积、疏水性、亲水性等的相似性。

半衰期：如本文所用，术语“半衰期”为量(诸如蛋白浓度或活性)下降到其在时间段开始时测量的值的一半所需的时间。

杂交：“杂交”意指在各种严格条件下在互补多核苷酸序列(例如，本文所描述的基因)或其部分之间形成双链分子。(参见例如Wahl,G.M.和S.L.Berger(1987)MethodsEnzymol.152:399；Kimmel,A.R.(1987)Methods Enzymol.152:507)。杂交通过互补核碱基之间的氢键键合发生，该氢键键合可以是沃森-克里克、霍氏或反向霍氏氢键键合。例如，腺嘌呤和胸腺嘧啶是通过氢键的形成进行配对的互补核碱基。

改善、增加或减少：如本文所用，术语“改善”、“增加”或“减少”或其语法等效物表示相对于基线测量结果的值，该基线测量结果诸如在开始本文所描述的治疗之前在同一个体中的测量结果，或在不存在本文所描述的治疗的情况下在对照受试者(或多个对照受试者)中的测量结果。“对照受试者”是患有与正在治疗的受试者相同形式的疾病的受试者，该受试者与正在接受治疗的受试者的年龄大致相同。

插入缺失：如本文所用，术语“插入缺失”是指核酸序列中碱基的插入或缺失。它通常会导致突变并且是遗传变异的一种常见形式。

抑制：如本文所用，术语“抑制(inhibition)”、“抑制(inhibit)”和“抑制(inhibiting)”是指减少或降低目的蛋白质或基因的活性和/或表达的过程或方法。通常，抑制蛋白质或基因是指将蛋白质或基因的表达或相关活性降低至少10％或更多，例如，20％、30％、40％或50％、60％、70％、80％、90％或更多，或表达或相关活性降低大于1倍、2倍、3倍、4倍、5倍、10倍、50倍、100倍或更多，如通过本文所述或本领域公认的一种或多种方法测量的。

体外：如本文所用，术语“体外”是指发生在人工环境，例如测试管或反映器皿中、细胞培养基等中而不是多细胞生物体内的事件。

体内：如本文所用，术语“体内”是指发生在多细胞生物体如人或非人动物内的事件。在基于细胞的系统的情况下，术语可用于指代在活细胞(与例如体外系统相反)内发生的事件。

接头或间隔子：接头或间隔子为核苷酸或氨基酸序列，其将gRNA序列的末端位置与NSL序列在物理上分开，以使Cas能够结合gRNA并实现gRNA的功能。在一些实施例中，接头为RNA。在一些实施例中，接头为化学部分。在一些实施例中，接头为肽。在一些实施例中，接头为DNA。在一些实施例中，接头为化学接头，例如，PEG9/18。在一些实施例中，接头为DNA接头。

寡核苷酸：如本文所用，术语“寡核苷酸”通常是指单链或双链DNA的介于约5与约100个核苷酸之间的多核苷酸。寡核苷酸也称为“寡聚物(oligomer)”或“寡聚物(oligo)”，并且可以从基因中分离出来，或化学合成。

PAM：术语“PAM”或“原型间隔子相邻基序”是指短核酸序列(长度通常为2至6个碱基对)，该序列位于靶向以供如CRISPR-Cas9等CRISPR系统进行切割的核酸区域之后。Cas核酸酶切割可能需要PAM并且通常在切割位点下游3-4个核苷酸处发现PAM。

多肽：如本文所用，术语“多肽”是指通过肽键连接在一起的顺序氨基酸链。术语用于指任何长度的氨基酸链，但本领域普通技术人员将理解术语不限于长链并且可以指包括通过肽键连接在一起的两个氨基酸的最小链。如本领域技术人员所知，可以加工和/或修饰多肽。如本文所用，术语“多肽”和“肽”可互换使用。

预防：如本文所用，当与疾病、病症和/或病状的发生结合使用时，术语“预防(prevent)”或“预防(prevention)”是指降低发展疾病、病症和/或病状的风险。

蛋白质：如本文所用，术语“蛋白质”是指一种或多种作为离散单元发挥作用的多肽。如果单个多肽为离散功能单元且不需要与其它多肽进行永久或暂时的物理缔合以形成离散功能单元，那么术语“多肽”和“蛋白质”可以互换地使用。如果离散功能单位由多于一种物理上彼此缔合的多肽组成，则术语“蛋白质”是指物理偶联并作为离散单位一起发挥作用的多种多肽。

参考：“参考”实体、系统、数量、条件集合等是与本文所描述的测试实体、系统、数量、条件集合等进行比较的实体、系统、数量、条件集合等。例如，在一些实施例中，“参考”抗体是如本文所述未经工程化的对照抗体。

RNA引导：术语“RNA引导”或“引导RNA”是指促进本文所描述的蛋白质靶向靶核酸的RNA分子。示例性“RNA引导”或“引导RNA”包含但不限于crRNA或crRNA与同源tracrRNA的组合。后者可能是独立的RNA或使用接头(sgRNA)融合为单个RNA。在一些实施例中，RNA引导经工程化以包含化学或生物化学修饰。在一些实施例中，RNA引导可以包含一个或多个核苷酸。术语“RNA引导”或“引导RNA”也指NLS-gRNA。

单链连接酶：如本文所用，术语“单链连接酶”意指不需要寡核苷酸夹板或模板来实现其连接活性的连接酶。

夹板或寡核苷酸夹板：术语“夹板”或“寡核苷酸夹板”是指能够与至少两个、三个或更多个单链RNA核苷酸杂交的单链RNA或DNA或其他聚合物。例如，夹板可以指寡核苷酸夹板。

受试者：如本文所用，术语“受试者”意指需要对其进行诊断、预后或疗法的任何受试者。例如，受试者可以是哺乳动物，例如人或非人灵长类动物(如猿、猴、猩猩或黑猩猩)、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛或奶牛。

sgRNA：术语“sgRNA”、“单引导RNA”或“引导RNA”是指含有(i)引导序列(crRNA序列)和(ii)Cas9核酸酶募集序列(tracrRNA)的单引导RNA。

基本同一性：短语“基本同一性”在本文中用于指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的，如果两个序列在对应位置含有相同残基，则它们通常被认为是“基本上相同的”。如本领域所熟知的，可以使用多种算法中的任何一种来比较氨基酸或核酸序列，所述算法包含商业计算机程序中可用的那些，如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、有空位的BLAST和PSI-BLAST。此类示例性程序在以下中描述：Altschul等人,Basic local alignment search tool,J.Mol.Biol.,215(3):403-410,1990；Altschul等人,Methods in Enzymology；Altschul等人,Nucleic Acids Res.25:3389-3402,1997；Baxevanis等人,Bioinformatics:A Practical Guide to the Analysisof Genes and Proteins,Wiley,1998；以及Misener等人，(编著)，BioinformaticsMethods and Protocols(Methods in Molecular Biology，第132卷),Humana Press,1999。除了鉴定相同序列之外，上述程序通常提供对同一性程度的指示。在一些实施例中，如果在相关延伸段的残基上至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的对应残基相同，则认为两个序列基本上相同。在一些实施例中，所述相关延伸段是完整序列。在一些实施例中，所述相关延伸段为至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或更多个残基。

靶核酸：如本文所用，术语“靶核酸”是指CRISPR-Cas9系统所结合到的任何长度的核苷酸(寡核苷酸或多核苷酸)，脱氧核糖核苷酸、核糖核苷酸或其类似物。靶核酸可以具有三维结构，可以包含编码区域或非编码区域，可以包含外显子、内含子、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、核酶、cDNA、质粒、载体、外源序列、内源序列。靶核酸可以包括经修饰的核苷酸，所述经修饰的核苷酸包含甲基化核苷酸或核苷酸类似物。靶核酸可以散布有非核酸组分。靶核酸不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体或包括嘌呤和嘧啶碱基或其它天然的、经化学或生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。

治疗有效量：如本文所用，术语“治疗有效量”是指以适用于任何医学治疗的合理益处/风险比赋予经治疗受试者治疗效果的治疗性分子(例如，本文所描述的工程化的抗体)的量。疗效可以是客观的(即，可通过某一测试或标记测量)或主观的(即，受试者给出效果的指示或感受到效果)。具体地，“治疗有效量”是指有效治疗、改善或预防特定疾病或病状，或表现出可检测的治疗或预防作用的治疗性分子或组合物的量，如通过改善与疾病相关的症状、预防或延迟疾病发作，和/或还减轻疾病症状的严重性或频率。可以在可以包括多个单位剂量的给药方案中施用的治疗有效量。对于任何特定的治疗性分子，治疗有效量(和/或有效给药方案内的适当单位剂量)可以变化，例如，取决于施用途径，或与其他药剂的组合。此外，任何特定受试者的特定治疗有效量(和/或单位剂量)可能取决于多种因素，包含所治疗的病症和病症的严重程度；所采用的特定药剂的活性；所采用的特定组合物；受试者的年龄、体重、总体健康状况、性别和饮食；施用时间、施用途径和所采用的特定治疗性分子的排泄率或代谢率；治疗的持续时间；以及医学领域众所周知的类似因素。

tracrRNA：如本文所用，术语“tracrRNA”或“反式激活crRNA”是指包含形成CRlSPR关联蛋白结合特定靶核酸所需结构的序列的RNA。

治疗：如本文所用，术语“治疗(treatment)”(还有“治疗(treat/treating)”是指施用治疗性分子(例如，本文所述的CRISPR-Cas治疗性蛋白或系统)，该治疗性分子部分或完全减轻、改善、缓解、抑制疾病、病症和/或病状的一种或多种症状或特征，延迟疾病、病症和/或病状的一种或多种症状或特征的发作，降低疾病、病症和/或病状的一种或多种症状或特征的严重程度和/或降低疾病、病症和/或病状的一种或多种症状或特征的发病率。此类治疗可以是针对未出现相关疾病、病症和/或病状的病征的受试者和/或针对仅出现疾病、病症和/或病状的早期病征的受试者。或者或另外，这种治疗可以是针对出现相关疾病、病症和/或病状的一种或多种确定病征的受试者。

附图说明

附图仅用于说明目的；而非用于限制。

图1为缀合至NLS序列的gRNA的示例性示意图。在此特定设计中，gRNA的3'端缀合至肽间隔子的N末端，接着是衍生自SV40的NLS序列。

图2为示出用包含融合至spCas9的N末端的腺嘌呤脱氨酶的碱基编辑器实现的腺嘌呤至鸟嘌呤碱基(A至G)转化百分比的结果的示例性图表。针对具有或不具有NLS的各种引导RNA绘制了在编码碱基编辑器的mRNA的各种比率(1:1、1:3和1:9)下的A到G转化百分比(轴线y)。“Lipo对照”包含在lipofectamine中编码碱基编辑器gRNA(不具有NLS)的mRNA。“Lipo对照”被配制成充当针对LNP组的转染对照。

图3A为具有不同修饰的gRNA的示例性示意图。“EM”(经端修饰的端)gRNA在3'端和5'端两者处均具有3个核苷酸，具有2'OMe修饰。“HM1”(经重度修饰的1)使47％的gRNA以2'OMe修饰来修饰。“HM2”(经重度修饰的2)使60％的gRNA以2'OMe修饰来修饰。“HM3”(经重度修饰的3)使88％的gRNA以2'OME和2'F修饰来修饰。实例2中使用的NLS-gRNA包含端修饰。图3B为示出用包含融合至spCas9的N末端的腺嘌呤脱氨酶的碱基编辑器在小鼠中实现的腺嘌呤至鸟嘌呤碱基(A至G)转化百分比的结果的示例性图表。针对具有或不具有NLS以及具有或不具有gRNA中的各种修饰的各种引导RNA绘制了A至G转化百分比(轴线y)。

图4A为示出用包含融合至spCas9的N末端的腺嘌呤脱氨酶的碱基编辑器在非人灵长类动物(NHP)中实现的碱基编辑效率的结果的示例性图表。针对具有或不具有NLS以及具有或不具有gRNA中的各种修饰的各种引导RNA绘制了肝脏中碱基编辑效率(轴线y)。图4B为示出毒理学结果的一系列示例性图表。施用后24小时测量AST和ALT水平，并且示出与施用包含不同gRNA的制剂之前的AST/ALT水平相比的倍数变化。

图5为示出用包含融合至saCas9的N末端的腺嘌呤脱氨酶的碱基编辑器在小鼠中实现的腺嘌呤至鸟嘌呤碱基(A至G)转化百分比的结果的示例性图表。针对具有各种纯度和修饰的各种引导RNA绘制了在靶编辑和旁观者编辑两者的A至G转化百分比(轴线y)。

图6A和6B描绘了huG6PC-R83C杂合的转基因小鼠模型的肝脏提取物中GSD1a突变的体内校正。图6A为描绘体内工作流程的示意图。经由IV注射将携带碱基编辑器mRNA和gRNA的脂质纳米颗粒(LNP)在含有R83C突变的huG6PC杂合(huR83C HET)的转基因小鼠中进行给药。图6B为描绘使用MSP828比较在靶编辑和旁观者编辑的GSD1a R83C突变的A至G碱基编辑效率的条形图。

图6C为描绘使用TadA腺苷脱氨酶变体MSP605、MSP824、MSP825、MSP680、MSP828和MSP820对含有R83C突变的huG6PC杂合的转基因小鼠模型中GSD1a R83C突变的校正的条形图。运行体外筛选以选择用于R83C校正的理想碱基编辑器。将gRNA和代表性碱基编辑器的LNP复合制剂在huG6PC-R83C杂合的转基因小鼠中进行体内给药(以1mpk的亚饱和剂量)。图6C中示出在LNP处理的huG6PC-R83C杂合子转基因动物的肝脏中用于R83C校正的变体的碱基编辑效力。在这些条件下，变体MSP828产生高水平的在靶活性。针对在靶编辑和旁观者编辑示出了A至G碱基编辑效率。

图7示出了描述正常和功能丧失的g6pc功能和相关结果的示意图。GSD-Ia(或本文中的GSD1a)为由g6pc基因的突变引起的常染色体隐性病症。位于酶的活性位点的R83C为在高加索GSD-Ia患者中识别的最常见的致病突变，并且与G6P酶失活相关联。G6P酶功能丧失可能导致危及生命的低血糖、癫痫发作以及甚至死亡。为了减轻低血糖，患者必须通过缓慢葡萄糖释放配方日夜维持对葡萄糖补充的严格且频繁的坚持。漏掉或延缓的一个剂量可能导致紧急低血糖。在许多并发症中，肿大的肝脏，尿酸、乳酸和脂质的积累在GSD-Ia患者中很常见。

图8示出了展示如本文所描述的碱基编辑器在编辑窗口中生成永久的、预测的核苷酸取代的示意图。R83C突变在g6pc基因中引入单个G>A转化。腺嘌呤碱基编辑器(ABE)实现基因组DNA中A至G的可编程转化，并且因此可以用于校正这一突变。图8描绘了如本文所描述的ABE和碱基编辑的效用。ABE结合至与引导RNA互补的靶DNA，并暴露一段单链DNA。脱氨酶将靶腺嘌呤转化为肌苷，并且Cas酶在相反的链上产生切口，然后修复该相反的链，完成碱基对转化。点突变的直接修复具有恢复基因功能的潜力。

图9A和9B提供了对靶核苷酸位点以及旁观者核苷酸和PAM核苷酸的描述以及示出用于永生化HEK293细胞中的ABE产生显著的R83C的精确校正率的条形图。针对R83C的校正优化了用于g6pc基因中A至G转化的碱基编辑器。图9A中所示的是靶DNA序列(CCACCAGTATGGACACTGTCCAAAGAGAAT(SEQ ID NO:17))和针对GSD-Ia R83C突变的潜在氨基酸翻译(WWYPCQGFLI；SEQ ID NO:18)。靶编辑在位置12处以双下划线示出。编辑窗口还包括在位置6处通过单下划线示出的可能的旁观者，并且在位置10处示出可能导致同义转化的编辑。为了进行筛选，生成了HEK293细胞系来表达含有R83C突变的g6pc转基因，并利用碱基编辑器mRNA和gRNA使该细胞系转染。通过高通量靶向扩增子下一代测序(NGS)评定等位基因频率。变体1至5表示针对优化的靶校正而工程化的gRNA和碱基编辑器RNA的组合。对于具有有限的旁观者编辑的R83C校正，变体5产生大约60％的靶向碱基编辑效率(图9B)。

图10呈现了摄影图像和条形图，展示3周龄纯合huR83C(Hom huR83C)小鼠表现出GSD-1a的预期的生长损伤和代谢缺陷的特性。对于实验，生成了表达人G6PC-R83C转基因代替小鼠G6PC的GSD-Ia小鼠来验证体内碱基编辑。所示的结果证实，huR83C纯合的小鼠表现出产后致死性——它们要么死产，要么在24小时内死亡。在葡萄糖补充疗法中，与同窝对照相比，动物存活到至少3周龄，并显示出GSD-Ia特有的病理特征：体重减轻、肝脏肿大、对G6P酶的显著抑制以及血清代谢异常，这一表型与临床和已发表的报告一致。

图11A和11B示出了通过本文所描述的碱基编辑器(ABE)实现的体内校正的点图。图11A展示了成年和新生杂合huR83C小鼠的肝脏中高效的脂质纳米颗粒(LNP)介导的碱基编辑(huG6PC-R83C校正)。为了验证体内R83C校正的碱基编辑效率，首先在huR83C杂合的不太脆弱的转基因小鼠中优化LNP介导的递送。图6A中的示意图描绘了这些实验的体内工作流程，其中碱基编辑器mRNA和gRNA的脂质纳米颗粒(LNP)或LNP复合制剂经由IV注射给药。考虑到纯合小鼠的新生致死性，在出生后不久经由杂合huR83C小鼠的颞静脉采用LNP给药，并将活性与已经接受经由尾静脉施用的LNP的成年杂合huR83C小鼠中观察到的活性进行比较。对全肝提取物的NGS分析显示，成年中的碱基编辑效率大约为40％，并且新生鼠中的效率高达约60％，且效率的范围较广。成年和新生鼠中的旁观者编辑仍然较低。图11B示出了肝脏中LNP介导的R83C校正与新生纯合huR83C小鼠和同窝杂合huR83C小鼠的存活相关联。简单地说，利用含有引导RNA和编码ABE的mRNA的LNP来治疗huR83C纯合的新生小鼠。在没有葡萄糖疗法的情况下，经治疗的小鼠正常生长至3周龄，而没有低血糖引起的癫痫发作。与huR83C杂合的同窝对照一致，经治疗的纯合huR83C小鼠在总肝脏提取物中显示出高达约60％的编辑效率(即，约60％ R83C校正)。

图12A和12B示出了条形图和免疫组织化学染色图像，展示了如本文所描述的碱基编辑在huG6PC-R83C纯合的小鼠中恢复接近正常的代谢功能以逆转GSD-Ia病理学。3周时，经验证，经治疗的纯合huR83C小鼠显示出适当的代谢功能，同时恢复接近正常的血清代谢标志物，包括葡萄糖、甘油三酯、胆固醇、乳酸和尿酸，如图12A中的图表中最深色的条形所示。此外，经LNP治疗的纯合huR83C小鼠中对G6PC活性的生化测定(如生化地且经由磷酸铅染色所评定)与同窝对照的生化测定一致。肝肿大(GSD-Ia的另一临床呈现)主要是由过量的糖原和脂质沉积引起的。免疫组织化学分析显示出LNP治疗的小鼠中正常的肝细胞大小和脂质沉积(图12B)。结果证明了碱基编辑纠正与GSD-Ia相关联的R83C突变和代谢缺陷的潜力。

图13示出了条形图，展示了纯合huG6PC-R83C小鼠中单LNP剂量施用在24小时禁食挑战期间经由如本文所描述的碱基编辑维持正常血糖。

图14示出了生成Kaplan-Meier存活曲线以估计huG6PC-R83C纯合的新生转基因小鼠的存活，该新生转基因小鼠是在经由ABE mRNA进行碱基编辑之后的，或者是未经治疗的。使用以下引物经由对基因组尾DNA的PCR分析来对新生小鼠进行基因分型：通用正向引物(5'-ACCTACTGATGATGCACCTTTGATCAATAGAT-3'(SEQ ID NO:61))、小鼠特异性反向引物(5'-CATCACCCCTCGGGATGGTTCTT-3'(SEQ ID NO:62))、人特异性反向引物1(5'-CAGCCCAGAATCCCAACCACAAAAT-3'(SEQ ID NO:63))和人特异性反向引物2(5'-AGACCAGCTCGACTTGGGATGG-3'(SEQ ID NO:64))。针对huG6PC-R83C纯合的转基因小鼠观察到存活。未经治疗的小鼠要么死产(n＝6)，要么在8小时(n＝6)以及24小时(n＝1)时死亡。施用15％葡萄糖注射将存活时间延长至32小时(n＝5)、48小时(n＝2)以及56小时(n＝2)。所有huG6PC-R83C纯合的经ABE治疗的小鼠均存活至研究终止的3周时。

图15A为利用Cy5染料荧光标记的gRNA的示意图。图15B为利用Cy5染料荧光标记的缀合至NLS的gRNA的示意图。图15C示出了利用Nuc Blue进行的核染色。图15D示出了利用Cy5进行的核染色和ALAS1/sg23 gRNA定位。图15E示出了对NLS-gRNA的增强的核定位。

图16为在3'端处结合至saCas9效应子的NLS缀合物的模型。

图17A提供了示例性经5％端修饰的gRNA和示例性经25％重度修饰的saHM03gRNA的序列。图17B为示出示例性NLS缀合的gRNA相对于经端修饰的gRNA和经重度修饰的saHM03gRNA的A至G碱基编辑效率的结果的图表。

具体实施方式

本文提供了增强用于CRISPR-Cas系统中的gRNA的效力的方法、组合物和试剂盒。在一些方面，本发明提供了产生用于CRISPR-Cas系统中的具有增加的效力的缀合至NLS序列的gRNA(NLS-gRNA)的方法，增加成功编辑事件的频率。本发明的NLS-gRNA可以提供gRNA到细胞核的更好的运输，以进行保护免受胞质RNA酶的影响并增加用于形成RNP的gRNA的较高局部浓度。与不具有NLS序列的对等gRNA相比，本发明的NLS-gRNA具有显著更高的效力，并且与高度修饰的gRNA相比也显露出更高的效力。

缀合至NLS序列的gRNA(NLS-gRNA)具有许多潜在的优势，包括例如增强的效力。例如，本发明的NLS-gRNA相对于其不具有NLS序列的对等gRNA提供显著较高的碱基编辑效率。此外，与高度修饰(例如，修饰大于40％、大于60％或大于88％)的gRNA相比，具有端修饰(例如，包含3'端和/或5'端处的2'OMe修饰)的NLS-gRNA提供较高的效力。

在以下部分中详细描述了本发明的各个方面。部分的使用并不旨在限制本发明。每个部分可以适用于本发明的任何方面。在本申请中，除非另外说明，否则“或者”的使用是指“和/或”。

引导RNA(gRNA)

如本文所用，除非另有指出，否则引导RNA(gRNA)还指缀合至NLS序列的引导RNA(NLS-gRNA)。gRNA包括与靶序列互补的多核苷酸序列。gRNA与靶核酸序列杂交并指导CRISPR复合物与靶核酸的序列特异性结合。在一些实施例中，RNA引导与靶核酸序列具有50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的互补性。

在一些实施例中，gRNA介于约50个核苷酸与250个核苷酸之间。在一些实施例中，gRNA介于约50个核苷酸与500个核苷酸之间。在一些实施例中，gRNA介于约50个核苷酸与1,000个核苷酸之间。在一些实施例中，gRNA的长度为约50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245或250个核苷酸。在一些实施例中，所述gRNA的长度介于约50与75个核苷酸之间。在一些实施例中，gRNA的长度介于约75与100个核苷酸之间。在一些实施例中，gRNA的长度介于约100与125个核苷酸之间。在一些实施例中，gRNA的长度介于约125与150个核苷酸之间。在一些实施例中，gRNA的长度介于约150与175个核苷酸之间。在一些实施例中，gRNA的长度介于约175与200个核苷酸之间。在一些实施例中，gRNA的长度介于约200与225个核苷酸之间。在一些实施例中，gRNA的长度介于约225与250个核苷酸之间。

在一些实施例中，gRNA包括连接的crRNA和tracrRNA。各种crRNA和tracrRNA序列是本领域已知的，例如与数种II型CRISPR-Cas9系统(例如，WO2013/176772)、Cpf1、SaCas9、Cas12等相关联的那些。

可以设计gRNA以靶向任何靶序列。使用用于比对序列的任何算法确定最佳比对，该算法包含尼德曼-翁施算法(Needleman-Wunsch algorithm)、史密斯-沃特曼算法(Smith-Waterman algorithm)、伯罗斯-惠勒算法(Burrows-Wheeler algorithm)、ClustlW、ClustlX、BLAST、Novoalign、SOAP、Maq和ELAND。

在一些实施例中，gRNA被设计成靶向细胞基因组内的独特靶序列。在一些实施例中，gRNA被设计成缺少PAM序列。在一些实施例中，使用包含mFold或Geneious在内的折叠算法将gRNA序列设计成具有最佳二级结构。在一些实施例中，gRNA的表达可以在诱导型启动子下进行，例如激素诱导型、四环素或强力霉素诱导型、阿拉伯糖诱导型或光诱导型。

在一些实施例中，gRNA序列为“失活crRNA”、“失活引导”或“失活引导序列”，它们可以与CRISPR相关蛋白形成复合物并结合特定靶标而没有任何实质性核酸酶活性。

在一些实施例中，gRNA在糖磷酸骨架或碱基中被化学修饰。在一些实施例中，gRNA具有以下修饰中的一个或多个修饰：2'O-甲基、2'-F或锁核酸，以提高核酸酶抗性或碱基配对。在一些实施例中，gRNA可以含有经修饰的碱基，诸如2-硫脲二烯或N6-甲基腺苷。

在一些实施例中，gRNA与其它寡核苷酸、肽、蛋白质、标签、染料或聚乙二醇缀合。

在一些实施例中，gRNA包含适体或核糖开关序列，该核糖开关序列由于三维结构而结合特定的靶分子。

在一些实施例中，gRNA具有两个、三个、四个或五个发夹。

在一些实施例中，gRNA包含转录终止序列，该序列包含包括六个核苷酸的polyT序列。

gRNA与核定位(NLS)序列的缀合

在一个方面，本发明提供了一种通过gRNA的3'端缀合至NLS序列的gRNA。在一个方面，本发明提供了一种通过gRNA的5'端缀合至NLS序列的gRNA。在一个方面，本发明提供了一种通过gRNA的内部位点缀合至NLS序列的gRNA。

在一些实施例中，NLS序列的N末端经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至gRNA的3'端。在一些实施例中，NLS序列的C末端经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至gRNA的5'端。在一些实施例中，NLS序列中的内部氨基酸经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至gRNA的3'端。在一些实施例中，NLS序列中的内部氨基酸经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至gRNA的5'端。在一些实施例中，NLS序列中的内部氨基酸经由包含化学部分(例如，L)和肽部分(例如，肽间隔子)两者的接头缀合至gRNA的内部核苷酸。

在一些实施例中，gRNA经由还原胺化缀合至NLS。在一些实施例中，gRNA缀合至NLS天然化学连接。gRNA经由硫醇烯点击缀合至NLS。

本文描述了可用于制备接头的示例性化学物质。本文所描述的化学部分可以进一步包括子结构L¹和/或L²，其中L¹和L²各自独立地为任选取代的基团，该基团为C_1-12亚烷基或C_2-12杂亚烷基。在实施例中，L¹和L²包含氧代(＝O)取代基(例如，1或2个氧代取代基)。

马来酰亚胺-硫醇/马来酰亚胺-硒醇加合物

在实施例中，化学部分(例如，L)包含马来酰亚胺-硫醇加合物。

在实施例中，gRNA使用马来酰亚胺基团与硫醇基团之间的加成反应或者硫醇-烯点击反应来缀合至NLS。

在实施例中，含有马来酰亚胺-硫醇加合物的部分由包含硫醇基团的gRNA和包含马来酰亚胺基团的NLS(或肽间隔子)形成。在实施例中，含有马来酰亚胺-硫醇加合物的部分由包含马来酰亚胺基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含马来酰亚胺-硒醇加合物。在实施例中，gRNA使用马来酰亚胺基团与硒醇基团之间的加成反应来缀合至NLS。在实施例中，含有马来酰亚胺-硒醇加合物的部分由包含硒醇基团的gRNA和包含马来酰亚胺基团的NLS(或肽间隔子)形成。在实施例中，含有马来酰亚胺-硒醇加合物的部分由包含马来酰亚胺基团的gRNA和包含硒醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含其中Y为S或Se。/>

在实施例中，Y为S。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含硫醇基团的gRNA和包含马来酰亚胺基团的NLS(或肽间隔子)形成。在实施例中，含有马来酰亚胺-硫醇加合物的部分由包含马来酰亚胺基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，Y为Se。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含硒醇基团的gRNA和包含马来酰亚胺基团的NLS(或肽间隔子)形成。在实施例中，含有马来酰亚胺-硒醇加合物的部分由包含马来酰亚胺基团的gRNA和包含硒醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分L具有以下结构(A)，其中Y为S或Se，

在实施例中，Y为S。在实施例中，*表示与gRNA的共价附接。在实施例中，**表示与肽间隔子或NLS的共价附接。在实施例中，**表示与肽间隔子的共价附接。

硫醚/硒醚

在实施例中，化学部分(例如，L)包含硫醚基团。

在实施例中，gRNA使用碘乙酰胺基团与硫醇基团之间的缀合反应来缀合至NLS。

在实施例中，含有硫醚基团的部分由包含硫醇基团的gRNA和包含碘乙酰胺基团的NLS(或肽间隔子)形成。在实施例中，含有硫醚基团的部分由包含碘乙酰胺基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含硒醚基团。在实施例中，gRNA使用碘乙酰胺基团与硒醚基团之间的缀合反应来缀合至NLS。在实施例中，含有硒醚基团的部分由包含硒醇基团的gRNA和包含碘乙酰胺基团的NLS(或肽间隔子)形成。在实施例中，含有硒醚基团的部分由包含碘乙酰胺基团的gRNA和包含硒醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含其中Y为S或Se。

在实施例中，Y为S。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含硫醇基团的gRNA和包含碘乙酰胺基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含碘乙酰胺基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，Y为Se。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含硒醇基团的gRNA和包含碘乙酰胺基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含碘乙酰胺基团的gRNA和包含硒醇基团的NLS(或肽间隔子)形成。

二硫化物(硫醇-二硫化物交换化学)

在实施例中，化学部分(例如，L)包含二硫化物基团。在实施例中，gRNA使用含有二硫化物的基团与硫醇基团之间的硫醇-二硫化物交换反应来缀合至NLS。

在实施例中，含有二硫化物的部分由包含硫醇基团的gRNA和包含二硫化物基团的NLS(或肽间隔子)形成。在实施例中，含有二硫化物的部分由包含二硫化物基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含硫醇基团的gRNA和包含二硫化物基团的NLS(或肽间隔子)形成。在实施例中，部分由包含二硫化物基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

噁二唑硫醚

在实施例中，化学部分(例如，L)包含噁二唑硫醚基团。在实施例中，gRNA使用硫醇基团与磺酰噁二唑基团之间的反应来缀合至NLS。

在实施例中，含有噁二唑硫醚的部分由包含磺酰噁二唑基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。在实施例中，含有噁二唑硫醚的部分由包含硫醇基团的gRNA和包含磺酰二唑基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，部分由包含磺酰噁二唑基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含硫醇基团的gRNA和包含磺酰噁二唑基团的NLS(或肽间隔子)形成。/>

脲/硫脲/二硫代氨基甲酸酯(异(硫)氰酸酯化学)

在实施例中，化学部分(例如，L)包含脲基团。在实施例中，gRNA使用氨基(例如，伯胺)基团与异氰酸酯基团之间的反应来缀合至NLS。

在实施例中，含有脲的部分由包含氨基(例如，伯胺)基团的gRNA和包含异氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，含有脲的部分由包含异氰酸酯基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含硫脲基团。在实施例中，gRNA使用氨基(例如，伯胺)基团与异硫氰酸酯基团之间的反应来缀合至NLS。在实施例中，含有硫脲的部分由包含氨基(例如，伯胺)基团的gRNA和包含异硫氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，含有硫脲的部分由包含异硫氰酸酯基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含其中X为S或O。

在实施例中，X为O。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含氨基(例如，伯胺)基团的gRNA和包含异氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含异氰酸酯基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在实施例中，X为S。在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含氨基(例如，伯胺)基团的gRNA和包含异硫氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含异硫氰酸酯基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含二硫代氨基甲酸酯基团。在实施例中，gRNA使用硫醇基团与异硫氰酸酯基团之间的反应来缀合至NLS。

在实施例中，含有二硫代氨基甲酸酯的部分由包含硫醇基团的gRNA和包含异硫氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，含有二硫代氨基甲酸酯的部分由包含异硫氰酸酯基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，部分由包含硫醇基团的gRNA和包含异硫氰酸酯基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含异硫氰酸酯基团的gRNA和包含硫醇基团的NLS(或肽间隔子)形成。

二氮烯基苯酚

在实施例中，化学部分(例如，L)包含二氮烯基苯酚基团。在实施例中，gRNA利用苯酚基团与重氮基团之间的反应来缀合至NLS。

在实施例中，含有二氮烯基苯酚的部分由包含苯酚基团的gRNA和包含重氮基团的NLS(或肽间隔子)形成。在实施例中，含有二氮烯基苯酚的部分由包含重氮基团的gRNA和包含苯酚基团的NLS(或肽间隔子)形成。

在实施例中，在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含苯酚基团的gRNA和包含重氮基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含重氮基团的gRNA和包含苯酚基团的NLS(或肽间隔子)形成。

三唑烷二酮基苯酚

在实施例中，化学部分(例如，L)包含三唑烷二酮基苯酚基团。在实施例中，gRNA使用苯酚基团与环状重氮二甲酰胺基团之间的反应来缀合至NLS。

在实施例中，含有三唑烷二酮基苯酚的部分由包含苯酚基团的gRNA和包含环状重氮二甲酰胺基团的NLS(或肽间隔子)形成。在实施例中，含有三唑烷二酮基苯酚的部分由包含环状重氮二甲酰胺基团的gRNA和包含苯酚基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，部分由包含苯酚基团的gRNA和包含环状重氮二甲酰胺基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含环状重氮二甲酰胺基团的gRNA和包含苯酚基团的NLS(或肽间隔子)形成。

三唑(点击化学)

在实施例中，化学部分(例如，L)包含三唑基团。在实施例中，gRNA使用炔基团与叠氮基团之间的1,3-偶极环加成来缀合至NLS。

在实施例中，含有三唑的部分由包含炔基团的gRNA和包含叠氮基团的NLS(或肽间隔子)形成。在实施例中，含有三唑的部分由包含叠氮基团的gRNA和包含炔基团的NLS(或肽间隔子)形成。在实施例中，1,3-偶极环加成为铜催化的环加成。在实施例中，1,3-偶极环加成为应变促进的环加成。

在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含炔基团的gRNA和包含叠氮基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含叠氮基团的gRNA和包含炔基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含其中环A和环B中的每一者为任选取代的芳基基团。在实施例中，环A存在。在实施例中，环A不存在。在实施例中，环B存在。在实施例中，环B不存在。在实施例中，环A和环B两者均存在。在实施例中，环A和环B两者均不存在。在实施例中，/>部分由包含炔基团的gRNA和包含叠氮基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含叠氮基团的gRNA和包含炔基团的NLS(或肽间隔子)形成。

二氮杂降蒈二烯

在实施例中，化学部分(例如，L)包含二氮杂降蒈二烯基团。在实施例中，gRNA使用环丙烯基团与四嗪基团之间的Diels-Alder反应来缀合至NLS。

在实施例中，含有二氮杂降蒈二烯的部分由包含环丙烯基团的gRNA和包含四嗪基团的NLS(或肽间隔子)形成。在实施例中，含有二氮杂降蒈二烯的部分由包含四嗪基团的gRNA和包含环丙烯基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含其中R为C_1-6烷基。在实施例中，部分由包含环丙烯基团的gRNA和包含四嗪基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含四嗪基团的gRNA和包含环丙烯基团的NLS(或肽间隔子)形成。

酰胺/磺酰胺

在实施例中，化学部分(例如，L)包含酰胺基团。在实施例中，gRNA使用羧基基团与氨基基团(例如，伯胺)之间的缀合反应来缀合至NLS。

在实施例中，含有酰胺的部分由包含羧基基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。在实施例中，含有酰胺的部分由包含氨基基团(例如，伯胺)的gRNA和包含羧基基团的NLS(或肽间隔子)形成。在实施例中，羧基基团为活化的羧基基团。在实施例中，羧基基团通过碳二亚胺(诸如1-乙基-3-(3-二甲基-氨基丙基)碳二亚胺(EDC)或二环己基碳二亚胺(DCC))活化。在实施例中，羧基基团通过N-羟基琥珀酰亚胺(NHS)衍生物(例如，磺基NHS)活化。

在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含羧基基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含氨基基团(例如，伯胺)的gRNA和包含羧基基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含磺酰胺基团。在实施例中，gRNA使用磺酰基基团与氨基(例如，伯胺)基团之间的缀合反应来缀合至NLS。在实施例中，含有磺酰胺的部分由包含磺酰基基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。在实施例中，含有酰胺的部分由包含氨基(例如，伯胺)基团的gRNA和包含磺酰基基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含磺酰基基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含氨基(例如，伯胺)基团的gRNA和包含磺酰基基团的NLS(或肽间隔子)形成。

胺(戊二醛化学)

在实施例中，化学部分(例如，L)包含氨基基团。在实施例中，gRNA使用氨基基团(例如，伯胺)与醛基团之间的缀合反应接着进行还原反应以形成含有胺的部分来缀合至NLS。

在实施例中，含有胺的部分由包含氨基基团(例如，伯胺)的gRNA和包含醛基团的NLS(或肽间隔子)形成。在实施例中，含有胺的部分由包含醛基团的gRNA和包含氨基基团(例如，伯胺)的NLS(或肽间隔子)形成。

在实施例中，含有胺的部分由双官能交联剂(例如，二醛诸如戊二醛)形成。在实施例中，含有胺的部分由包含氨基基团(例如，伯胺)的gRNA、包含氨基基团(例如，伯胺)的NLS(或肽间隔子)和二醛(例如，戊二醛)形成。在实施例中，含有胺的部分由包含醛基团的gRNA、包含醛基团的NLS(或肽间隔子)和二氨基烷烃形成。

在实施例中，化学部分(例如，L)包含其中L³为C_1-6烷基。在实施例中，/>部分由包含氨基基团(例如，伯胺)的gRNA、包含氨基基团(例如，伯胺)的NLS(或肽间隔子)和二醛(例如，戊二醛)形成。在实施例中，部分由包含醛基团的gRNA、包含醛基团的NLS(或肽间隔子)和二氨基烷烃形成。

在实施例中，化学部分(例如，L)包含氨基基团。在实施例中，gRNA使用氨基(例如，伯胺)基团与三氟乙磺酰基(2,2,2-三氟乙磺酰基)基团之间的缀合反应来缀合至NLS。在实施例中，胺部分由包含氨基(例如，伯胺)基团的gRNA和包含三氟乙磺酰基(2,2,2-三氟乙磺酰基)基团的NLS(或肽间隔子)形成。在实施例中，含有胺的部分由包含三氟乙磺酰基(2,2,2-三氟乙磺酰基)基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在实施例中，化学部分(例如，L)包含在实施例中，/>部分由包含氨基(例如，伯胺)基团的gRNA和包含三氟乙磺酰基(2,2,2-三氟乙磺酰基)基团的NLS(或肽间隔子)形成。在实施例中，/>部分由包含三氟乙磺酰基(2,2,2-三氟乙磺酰基)基团的gRNA和包含氨基(例如，伯胺)基团的NLS(或肽间隔子)形成。

在一些实施例中，NLS-gRNA包含crRNA。在一些实施例中，NLS-gRNA包含tracrRNA。在一些实施例中，NLS-gRNA包含crRNA和NLS-gRNA。

在一些实施例中，首先合成线性引导RNA。在此方法中，两个或更多个单独的RNA连接在一起。在一些实施例中，第一RNA包含反式激活RNA(tracrRNA)，并且第二RNA包含成簇规律间隔短回文重复(CRISPR)RNA(crRNA)。

在一些实施例中，合成包含tracrRNA序列的RNA，使得tracrRNA的一部分含有5'末端处的磷酸酯。利用此方法可以实现两种形式的连接，该两种形式均存在于茎环区域内。第一种形式的连接出现在发夹的末端环(其为T4 RNA连接酶1的天然位点)内。第二种形式的连接出现在双链体(其为T4 RNA连接酶2和DNA连接酶的天然)内。这一形式的连接的优点之一是片段杂质可轻易去除，因为融合的gRNA和片段杂质之间的洗脱时间存在显着差异。

经化学修饰的NLS-gRNA

在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含对其骨架或其一个或多个碱基的化学修饰。例如，经化学修饰的RNA可以包含化学合成，该化学合成可以用于安装高度修饰的单体，这些单体包含经修饰的糖、碱基、骨架或不类似于天然核苷酸的官能团。

因此，在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含经修饰的碱基。在一些实施例中，经修饰的RNA包含以下中的一个或多个：2'-O-甲氧基-乙基碱基(2'-MOE)，如2-甲氧基乙氧基A、2-甲氧基乙氧基MeC、2-甲氧基乙氧基G、2-甲氧基乙氧基T。其它经修饰的碱基包含例如2'-O-甲基RNA碱基和氟基碱基。各种氟代碱基是已知的，并且包含例如氟基C、氟基U、氟基A、氟基G碱基。各种2'-O-甲基修饰也可以与本文所描述的方法一起使用。例如，包含以下2'O甲基修饰中的一者或多者的以下RNA可以与所描述的方法一起使用：2'-OMe-5-甲基-rC、2'-OMe-rT、2'-OMe-rI、2'-OMe-2-氨基-rA、氨基接头-C6-rC、氨基接头-C6-rU、2'-OMe-5-Br-rU、2'-OMe-5-I-rU、2-OMe-7-Deaza-rG。

在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含以下修饰中的一个或多个修饰：硫代磷酸酯、2'O-甲基、2'氟基(2'F)、DNA。

在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含3'和5'端处的2'OMe修饰。

在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含以下修饰中的一者或多者：2'-O-2-甲氧基乙基(MOE)、锁核酸、桥接核酸、解锁核酸、肽核酸、吗啉基核酸。

在一些实施例中，引导RNA的第一端和/或引导RNA的第二端包含以下碱基修饰中的一者或多者：2,6-二氨基嘌呤、2-氨基嘌呤、假尿嘧啶、N1-甲基-假尿嘧啶、5'甲基胞嘧啶、2'嘧啶酮(泽布拉林)、胸腺嘧啶。

其它经修饰的碱基包含例如2-氨基嘌呤、5-溴基dU、脱氧尿苷、2,6-二氨基嘌呤(2-氨基-dA)、双脱氧-C、脱氧肌苷、羟甲基dC、反向dT、Iso-dG、Iso-dC、反向双脱氧-T、5-甲基dC、5-甲基dC、5-硝基吲哚、Super2'-F-r(C,U)、2'-NH2-r(C,U)、2,2'-脱水-U、3'-脱氧-r(A,C,G,U)、3'-O-甲基-r(A,C,G,U)、rT、rI、5-甲基-rC、2-氨基-rA、rSpacer(Abasic)、7-Deaza-rG、7-Deaza-rA、8-氧代-rG、5-卤化-rU、N-烷基化-rN。

本文可以使用其它经化学修饰的RNA。例如，引导RNA的第一端和/或引导RNA的第二端可以包含经修饰的碱基，诸如例如5',Int,3'叠氮化物(NHS酯)；5'己炔基；5',Int,3'5-辛二炔基dU；5',Int生物素(叠氮化物)；5',Int 6-FAM(叠氮化物)；以及5',Int 5-TAMRA(叠氮化物)。可以用于本文所述方法的RNA核苷酸修饰的其它实例包含例如磷酸化修饰，如5'-磷酸化和3'-磷酸化。RNA还可以具有以下修饰中的一个或多个修饰：氨基修饰、生物素化、硫醇修饰、炔烃修饰、腺苷酸化、叠氮化物(NHS酯)、胆固醇-TEG和地高辛(NHS酯)。

核碱基编辑器

可用于本文所描述的方法和组合物中的是编辑、修饰或改变多核苷酸的靶核苷酸序列的核碱基编辑器。本文所描述的核碱基编辑器通常包含多核苷酸可编程核苷酸结合结构域和核碱基编辑结构域(例如，腺苷脱氨酶或胞苷脱氨酶)。多核苷酸可编程核苷酸结合结构域连同结合的引导多核苷酸(例如，gRNA)可以特异性结合至靶多核苷酸序列，并且由此将碱基编辑器定位至需要编辑的靶核酸序列。

在某些实施例中，本文所提供的核碱基编辑器包含改善碱基编辑活性的一个或多个特征。例如，本文所提供的任何核碱基编辑器可以包含具有降低的核酸酶活性的Cas9结构域。在一些实施例中，本文提供的任何核碱基编辑器可以具有不具有核酸酶活性的Cas9结构域(dCas9)，或切割双链体DNA分子的一条链的Cas9结构域，称为Cas9切口酶(nCas9)。不受任何特定理论的束缚，催化残基(例如，H840)的存在维持Cas9切割与靶向核碱基相反的未经编辑的(例如，未脱氨基的)链的活性。催化残基(例如，D10至A10)的突变防止对含有靶向残基(例如，A或C)的经编辑的(例如，脱氨基的)链的切割。此类Cas9变体可以基于gRNA定义的靶序列在特定位置产生单链DNA断裂(切口)，从而修复未经编辑的链，最终导致未经编辑的链上的核碱基变化。

多核苷酸可编程核苷酸结合结构域

多核苷酸可编程核苷酸结合结构域结合多核苷酸(例如，RNA、DNA)。碱基编辑器的多核苷酸可编程核苷酸结合结构域本身可以包含一个或多个结构域(例如，一个或多个核酸酶结构域)。在一些实施例中，多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以包含核酸内切酶或核酸外切酶。核酸内切酶可以切割双链核酸的单链或双链核酸分子的两条链。在一些实施例中，多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以切割靶多核苷酸的零条、一条或两条链。

具有内部插入的融合蛋白

本文提供了融合蛋白，其包含融合至核酸可编程核酸结合蛋白例如核酸可编程DNA结合蛋白(napDNAbp)的异源多肽。异源多肽可以为在天然或野生型napDNAbp多肽序列中未发现的多肽。异源多肽可以在napDNAbp的C末端、napDNAbp的N末端处融合至napDNAbp，或在napDNAbp的内部位置处插入。

在一些实施例中，异源多肽是在napDNAbp的内部位置处插入的。在一些实施例中，异源多肽为脱氨酶(例如，腺苷脱氨酶)或其功能片段。例如，融合蛋白可以包含两侧为Cas9多肽的N末端片段和C末端片段的脱氨酶(例如，腺苷脱氨酶)。融合蛋白中的脱氨酶可以为腺苷脱氨酶。在一些实施例中，腺苷脱氨酶为TadA(例如，TadA*7.10或其变体)。

在实施例中，融合蛋白包含以下结构：

NH2-[napDNAbp的N末端片段]-[脱氨酶]-[napDNAbp的C末端片段]-COOH；

NH2-[Cas9的N末端片段]-[腺苷脱氨酶]-[Cas9的C末端片段]-COOH；

其中“]-[”的每个实例为任选的接头。

脱氨酶可以为环状排列脱氨酶。例如，脱氨酶可以为环状排列腺苷脱氨酶。在一些实施例中，脱氨酶为环状排列体TadA，其在如在TadA参考序列中编号的氨基酸残基116处进行环状排列。在一些实施例中，脱氨酶为环状排列体TadA，其在如在TadA参考序列中编号的氨基酸残基136处进行环状排列。在一些实施例中，脱氨酶为环状排列体TadA，其在如在TadA参考序列中编号的氨基酸残基65处进行环状排列。

融合蛋白可以包含多于一种脱氨酶。融合蛋白可以包含例如1、2、3、4、5或更多种脱氨酶。在实施例中，融合蛋白包含一种脱氨酶。在实施例中，融合蛋白包含两种脱氨酶。融合蛋白中的两种或更多种脱氨酶可以为腺苷脱氨酶、胞苷脱氨酶或其组合。两种或更多种脱氨酶可以为同二聚体。两种或更多种脱氨酶可以为异二聚体。两种或更多种脱氨酶可以串联插入napDNAbp中。在一些实施例中，两种或更多种脱氨酶可以不在napDNAbp中串联。

在一些实施例中，融合蛋白中的napDNAbp为Cas9多肽或其片段。Cas9多肽可以为变体Cas9多肽。在一些实施例中，Cas9多肽为Cas9切口酶(nCas9)多肽或其片段。在一些实施例中，Cas9多肽为核酸酶失活Cas9(dCas9)多肽或其片段。融合蛋白中的Cas9多肽可以为全长Cas9多肽。在一些情况下，融合蛋白中的Cas9多肽可以不是全长Cas9多肽。相对于天然存在的Cas9蛋白，Cas9多肽可以例如在N末端或C末端处截短。Cas9多肽可以为环状排列的Cas9蛋白。Cas9多肽可以为Cas9多肽的片段、部分或结构域，其仍能够结合靶多核苷酸和引导核酸序列。

在一些实施例中，Cas9多肽为酿脓链球菌Cas9(SpCas9)、金黄色葡萄球菌Cas9(SaCas9)、嗜热链球菌1Cas9(St1Cas9)或其片段或变体。

包含两侧为Cas9多肽的N末端和C末端片段的异源催化结构域的融合蛋白也可用于本文所描述的方法中进行碱基编辑。包含Cas9和一个或多个脱氨酶结构域(例如，腺苷脱氨酶)或包含两侧为Cas9序列的腺苷脱氨酶结构域的融合蛋白也可用于靶序列的高度特异性和高效的碱基编辑。在实施例中，嵌合Cas9融合蛋白含有插入Cas9多肽内的异源催化结构域(例如，腺苷脱氨酶、胞苷脱氨酶，或腺苷脱氨酶和胞苷脱氨酶)。在一些实施例中，融合蛋白包含插入Cas9内的腺苷脱氨酶结构域和胞苷脱氨酶结构域。在一些实施例中，腺苷脱氨酶融合在Cas9内并且胞苷脱氨酶融合至C末端。在一些实施例中，腺苷脱氨酶融合在Cas9内并且胞苷脱氨酶融合至N末端。在一些实施例中，胞苷脱氨酶融合在Cas9内并且腺苷脱氨酶融合至C末端。在一些实施例中，胞苷脱氨酶融合在Cas9内并且腺苷脱氨酶融合至N末端。

具有腺苷脱氨酶和胞苷脱氨酶以及Cas9的融合蛋白的示例性结构如下：

NH2-[Cas9(腺苷脱氨酶)]-[胞苷脱氨酶]-COOH；

NH2-[胞苷脱氨酶]-[Cas9(腺苷脱氨酶)]-COOH；

NH2-[Cas9(胞苷脱氨酶)]-[腺苷脱氨酶]-COOH；或者

NH2-[腺苷脱氨酶]-[Cas9(胞苷脱氨酶)]-COOH。

在一些实施例中，以上通用架构中使用的“-”指示任选的接头的存在。

在各种实施例中，催化结构域具有DNA修饰活性(例如，脱氨酶活性)，诸如腺苷脱氨酶活性。在一些实施例中，腺苷脱氨酶为TadA(例如，TadA*7.10)。在一些实施例中，TadA为TadA变体。在一些实施例中，TadA变体融合在Cas9内并且胞苷脱氨酶融合至C末端。在一些实施例中，TadA变体融合在Cas9内并且胞苷脱氨酶融合至N末端。在一些实施例中，胞苷脱氨酶融合在Cas9内并且TadA变体融合至C末端。在一些实施例中，胞苷脱氨酶融合在Cas9内并且TadA变体融合至N末端。具有TadA变体和胞苷脱氨酶以及Cas9的融合蛋白的示例性结构提供如下：

NH2-[Cas9(TadA变体)]-[胞苷脱氨酶]-COOH；

NH2-[胞苷脱氨酶]-[Cas9(TadA变体)]-COOH；

NH2-[Cas9(胞苷脱氨酶)]-[TadA变体]-COOH；或者

NH2-[TadA变体]-[Cas9(胞苷脱氨酶)]-COOH。

在其他实施例中，融合蛋白含有核定位信号(例如，二分核定位信号)。在其他实施例中，核定位信号的氨基酸序列为MAPKKKRKVGIHGVPAA(SEQ ID NO:4)。在上述方面的其他实施例中，核定位信号由以下序列编码：

ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC(SEQ ID NO:5)。在其他实施例中，Cas12b多肽含有沉默RuvC结构域的催化活性的突变。在其他实施例中，Cas12b多肽含有D574A、D829A和/或D952A突变。在其他实施例中，融合蛋白进一步含有标记(例如，流感血凝素标记)。

在一些实施例中，融合蛋白包含具有内部融合的核碱基编辑结构域(例如，脱氨酶结构域的全部或一部分，例如，腺苷脱氨酶结构域)的napDNAbp结构域(例如，Cas12衍生的结构域)。在一些实施例中，napDNAbp为Cas12b。

作为非限制性示例，腺苷脱氨酶(例如，TadA*8.13)可以插入BhCas12b中以产生有效编辑核酸序列的融合蛋白(例如，TadA*8.13-BhCas12b)。

使用gRNA进行基因编辑

本文所描述的NLS-gRNA可以与合适的基因编辑系统一起用于靶向基因编辑，这可以导致基因沉默事件或所需靶基因表达中的表达改变(例如，增加或减少)。因此，在一些实施例中，本文所描述的NLS-gRNA可以用于靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰的方法中，该方法包括向真核细胞中引入：(a)如本文定义的NLS-gRNA；(b)至少一种CRISPR/Cas蛋白或编码至少一种CRISPR/Cas蛋白的核酸；其中(a)和(b)与染色体DNA中的靶序列之间的相互作用引起靶向转录激活、靶向转录抑制、靶向表观基因组修饰或靶向基因组修饰。

在一些实施例中，本文所描述的NLS-gRNA可以用于基因编辑系统中，该基因编辑系统包含：本文所描述的NLS-gRNA，其中RNA引导包含同向重复序列和能够与靶核酸杂交的间隔子序列；基因编辑蛋白，并且其中基因编辑酶能够与RNA引导结合并导致与RNA引导互补的靶核酸序列的断裂。

在一些实施例中，本文所描述的NLS-gRNA可以用于基因编辑系统，该基因编辑系统包括：本文所描述的NLS-gRNA，其中RNA引导包含同向重复序列和能够与靶核酸杂交的间隔子序列；和基因编辑蛋白；其中基因编辑蛋白与脱氨酶融合，并且其中基因编辑蛋白融合物能够与RNA引导结合并编辑与RNA引导互补的靶核酸序列。

在一些实施例中，本发明提供了一种改变真核细胞中靶核酸表达的方法，该方法包括：使细胞与基因编辑蛋白和本文所描述的NLS-gRNA接触，其中NLS-gRNA包含同向重复序列和能够与靶核酸杂交的间隔子序列，并且其中基因编辑蛋白能够与NLS-gRNA结合并导致与NLS-gRNA互补的靶核酸序列的断裂。

在一些实施例中，本发明提供了一种改变真核细胞中靶核酸表达的方法，该方法包括：使细胞与基因编辑蛋白和本文所描述的合成NLS-gRNA接触，其中NLS-gRNA包含同向重复序列和能够与靶核酸杂交的间隔子序列，并且其中基因编辑蛋白能够与NLS-gRNA结合并编辑与NLS-gRNA互补的靶核酸序列。

在一些实施例中，本发明提供了一种修饰真核细胞中的靶核酸的方法，该方法包括：使细胞与基因编辑蛋白和本文所描述的NLS-gRNA接触，其中NLS-gRNA包含同向重复序列和能够与靶核酸杂交的间隔子序列，并且其中基因编辑蛋白能够与NLS-gRNA结合并编辑与NLS-gRNA互补的靶核酸序列。

在一些实施例中，基因编辑方法或系统包括具有以位点特异性方式修饰靶DNA的效应子的融合蛋白，其中修饰活性包含甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、去乙酰化酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性或核酸酶活性，其中任何一种都可以修饰DNA或DNA相关多肽(例如，组蛋白或DNA结合蛋白)。

在一些实施例中，基因编辑方法或系统包括融合蛋白与可以通过化学修饰核苷酸碱基来编辑DNA序列的酶，酶包含可以修饰腺苷或胞嘧啶碱基并充当位点特异性碱基编辑器的脱氨酶。例如，通常使用RNA作为底物的APOBEC1胞苷脱氨酶在其与Cas9融合时可以靶向单链和双链DNA，从而将胞苷直接转化为尿苷，并且ADAR酶将腺苷脱氨基为肌苷。因此，使用脱氨酶的“碱基编辑”能够将一个靶DNA碱基可编程转化为另一个。各种碱基编辑器在本领域中是已知的并且可以用于本文所描述的方法和系统中。示例性碱基编辑器描述在以下中：例如，Rees和Liu Nature Review Genetics,2018,19(12):770-788，该文献的内容并入本文。

在一些实施例中，碱基编辑导致引入终止密码子来沉默基因。在一些实施例中，碱基编辑通过改变氨基酸序列来改变蛋白质功能。

在一些实施例中，本文所描述的NLS-gRNA可以用于基因编辑方法或系统以调节靶DNA的转录。在一些实施例中，NLS-gRNA可以用于基因编辑方法或系统以调节靶非编码RNA的表达，该靶非编码RNA包含tRNA、rRNA、snoRNA、siRNA、miRNA和长ncRNA。

在一些实施例中，本文所描述的NLS-gRNA用于使用合适的基因编辑系统对染色质环结构进行靶向工程化。调控基因组区域之间的染色质环的靶向工程化提供了一种用于操纵内源染色质结构并能够形成新的增强子-启动子连接以克服遗传缺陷或抑制异常增强子-启动子连接的手段。

在一些实施例中，本文所描述的NLS-gRNA与基因编辑系统结合使用，以通过插入有益的临床变体或抑制突变来校正致病突变。

A至G编辑

在一些实施例中，本文所描述的碱基编辑器包含腺苷脱氨酶结构域。碱基编辑器的此类腺苷脱氨酶结构域可以通过使腺嘌呤(A)脱氨基为肌苷(I)来促进将A核碱基编辑为鸟嘌呤(G)核碱基，该核碱基表现出G的碱基配对性质。腺苷脱氨酶能够使脱氧核糖核酸(DNA)中的脱氧腺苷残基的腺嘌呤脱氨基(即，去除胺基团)。在一些实施例中，A至G碱基编辑器进一步包含肌苷碱基切除修复的抑制剂，例如尿嘧啶糖基化酶抑制剂(UGI)结构域或催化失活的肌苷特异性核酸酶。不受任何特定理论的束缚，UGI结构域或催化失活的肌苷特异性核酸酶可以抑制或防止脱氨基的腺苷残基(例如，肌苷)的碱基切除修复，这可以提高碱基编辑器的活性或效率。

包含腺苷脱氨酶的碱基编辑器可以作用于任何多核苷酸，包括DNA、RNA和DNA-RNA杂交体。在某些实施例中，包含腺苷脱氨酶的碱基编辑器可以使包含RNA的多核苷酸的靶A脱氨基。例如，碱基编辑器可以包含能够使RNA多核苷酸和/或DNA-RNA杂交多核苷酸的靶A脱氨基的腺苷脱氨酶结构域。在实施例中，并入碱基编辑器中的腺苷脱氨酶包含作用于RNA(ADAR，例如，ADAR1或ADAR2)或tRNA(ADAT)的腺苷脱氨酶的全部或一部分。包含腺苷脱氨酶结构域的碱基编辑器也可以能够使DNA多核苷酸的A核碱基脱氨基。在实施例中，碱基编辑器的腺苷脱氨酶结构域包含ADAT的全部或一部分，该ADAT包含容许ADAT使DNA中的靶A脱氨基的一个或多个突变。例如，碱基编辑器可以包含来自大肠杆菌(EcTadA)的ADAT的全部或一部分，其包含以下突变中的一个或多个：D108N、A106V、D147Y、E155V、L84F、H123Y、I156F，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，本文所描述的碱基编辑器包含含有腺苷脱氨酶结构域(例如，腺苷脱氨酶变体结构域)的融合蛋白。在一些实施例中，腺苷脱氨酶变体结构域含有TadA*7.10氨基酸序列的改变的组合，其中组合为V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在一些实施例中，TadA*7.10氨基酸序列中的改变组合为：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；或L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N或另一腺苷脱氨酶中的对应改变。碱基编辑器的此类腺苷脱氨酶结构域可以通过使腺嘌呤(A)脱氨基为肌苷(I)来促进将A核碱基编辑为鸟嘌呤(G)核碱基，该核碱基表现出G的碱基配对性质。腺苷脱氨酶能够使脱氧核糖核酸(DNA)中的脱氧腺苷残基的腺嘌呤脱氨基(即，去除胺基团)。

在一些实施例中，本文所提供的核碱基编辑器可以通过将一个或多个蛋白质结构域融合在一起来制备，从而产生融合蛋白。在某些实施例中，本文所提供的融合蛋白包含改善融合蛋白的碱基编辑活性(例如，效率、选择性和特异性)的一个或多个特征。例如，本文所提供的融合蛋白可以包含具有降低的核酸酶活性的Cas9结构域。在一些实施例中，本文所提供的融合蛋白可以具有不具有核酸酶活性的Cas9结构域(dCas9)，或切割双链体DNA分子的一条链的Cas9结构域，称为Cas9切口酶(nCas9)。不受任何特定理论的束缚，催化残基(例如，H840)的存在维持Cas9切割含有与靶向A相反的T的未经编辑的(例如，未脱氨基的)链的活性。Cas9的催化残基(例如，D10至A10)的突变防止对含有靶向A残基的经编辑的链的切割。此类Cas9变体能够基于gRNA定义的靶序列在特定位置产生单链DNA断裂(切口)，从而修复未经编辑的链，最终导致未经编辑的链上的T至C变化。在一些实施例中，A至G碱基编辑器进一步包含肌苷碱基切除修复的抑制剂，例如尿嘧啶糖基化酶抑制剂(UGI)结构域或催化失活的肌苷特异性核酸酶。不受任何特定理论的束缚，UGI结构域或催化失活的肌苷特异性核酸酶可以抑制或防止脱氨基的腺苷残基(例如，肌苷)的碱基切除修复，这可以提高碱基编辑器的活性或效率。

包含腺苷脱氨酶的碱基编辑器可以作用于任何多核苷酸，包括DNA、RNA和DNA-RNA杂交体。在某些实施例中，包含腺苷脱氨酶的碱基编辑器可以使包含RNA的多核苷酸的靶A脱氨基。例如，碱基编辑器可以包含能够使RNA多核苷酸和/或DNA-RNA杂交多核苷酸的靶A脱氨基的腺苷脱氨酶结构域。在实施例中，并入碱基编辑器中的腺苷脱氨酶包含作用于RNA(ADAR，例如，ADAR1或ADAR2)的腺苷脱氨酶的全部或一部分。在另一实施例中，并入碱基编辑器中的腺苷脱氨酶包含作用于tRNA(ADAT)的腺苷脱氨酶的全部或一部分。包含腺苷脱氨酶结构域的碱基编辑器也可以能够使DNA多核苷酸的A核碱基脱氨基。在实施例中，碱基编辑器的腺苷脱氨酶结构域包含ADAT的全部或一部分，该ADAT包含容许ADAT使DNA中的靶A脱氨基的一个或多个突变。例如，碱基编辑器可以包含来自大肠杆菌(EcTadA)的ADAT的全部或一部分，其包含以下突变中的一个或多个：D108N、A106V、D147Y、E155V、L84F、H123Y、I156F，或另一腺苷脱氨酶中的对应突变。

腺苷脱氨酶可以衍生自任何合适的生物体(例如，大肠杆菌)。在一些实施例中，腺苷脱氨酶来自原核生物。在一些实施例中，腺苷脱氨酶来自细菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌。在一些实施例中，腺嘌呤脱氨酶是天然存在的腺苷脱氨酶，其包括与本文提供的突变中的任一者(例如，ecTadA中的突变)对应的一个或多个突变。任何同源蛋白中的对应残基可以通过例如序列比对和同源残基的确定来鉴定。任何天然存在的腺苷脱氨酶(例如，与ecTadA具有同源性)中与本文所描述的突变中的任一者(例如，ecTadA中鉴定的突变中的任一者)对应的突变可以相应地生成。

腺苷脱氨酶

在一些实施例中，本文所描述的融合蛋白包含一个或多个腺苷脱氨酶结构域。在一些实施例中，本文所提供的腺苷脱氨酶能够使腺嘌呤脱氨基。在一些实施例中，本文所提供的腺苷脱氨酶能够使DNA的脱氧腺苷残基中的腺嘌呤脱氨基。腺苷脱氨酶可以衍生自任何合适的生物体(例如，大肠杆菌)。在一些实施例中，腺嘌呤脱氨酶是天然存在的腺苷脱氨酶，其包括与本文提供的突变中的任一者(例如，ecTadA中的突变)对应的一个或多个突变。本领域技术人员将能够例如通过序列比对和同源残基的确定来鉴定任何同源蛋白中的对应残基。因此，本领域技术人员将能够产生任何天然存在的腺苷脱氨酶(例如，与ecTadA具有同源性)中与本文所描述的突变中的任一者(例如，ecTadA中鉴定的突变中的任一者)对应的突变。在一些实施例中，腺苷脱氨酶来自原核生物。在一些实施例中，腺苷脱氨酶来自细菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌。

本文提供并描述了具有增加的效率(>50％至60％)和特异性的腺苷脱氨酶变体。特别地，本文所描述的腺苷脱氨酶变体更有可能编辑多核苷酸内的期望碱基，并且不太可能编辑不打算改变的碱基(即，“旁观者”)。

在一些实施例中，腺苷脱氨酶为TadA脱氨酶。在特定实施例中，TadA是PCT/US2017/045381(WO 2018/027078)中描述的TadA中的任一者，其通过引用整体并入本文。

野生型TadA(wt)腺苷脱氨酶具有以下序列(也称为TadA参考序列)：

MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD(SEQ ID NO:6)

在一些实施例中，腺苷脱氨酶为全长大肠杆菌TadA脱氨酶。例如，在某些实施例中，腺苷脱氨酶包含氨基酸序列：

MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD(SEQ ID NO:7)。

在一些实施例中，腺苷脱氨酶来自原核生物。在一些实施例中，腺苷脱氨酶来自细菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌(E.coli)、金黄色葡萄球菌(S.aureus)、鼠伤寒沙门氏菌(S.typhimurium)、腐败希瓦氏菌(S.putrefaciens)、流感嗜血杆菌(H.influenzae)、新月柄杆菌(C.crescentus)、硫还原地杆菌(G.sulfurreducens)或枯草芽孢杆菌。在一些实施例中，腺苷脱氨酶来自大肠杆菌。

然而，应当理解，可用于本申请的另外的腺苷脱氨酶对于本领域技术人员来说是显而易见的并且在本公开的范围内。例如，腺苷脱氨酶可以为作用于tRNA的腺苷脱氨酶(ADAT)的同源物。示例性ADAT同源物的氨基酸序列包括但不限于以下：

金黄色葡萄球菌(S.aureus)TadA：

MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTA HAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCS GSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN(SEQ ID NO:8)枯草芽孢杆菌(B.subtilis)TadA：

MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEM LVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTL MNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE(SEQ ID NO:9)

鼠伤寒沙门氏菌(S.typhimurium)TadA：

MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV(SEQ ID NO:10)

腐败希瓦氏菌(S.putrefaciens)TadA：

MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAE ILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTV VNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE(SEQ ID NO:11)

流感嗜血杆菌F3031(H.influenzae)TadA：

MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK(SEQ ID NO:12)

新月柄杆菌(C.crescentus)TadA：

MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAA HDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDP KGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI(SEQ ID NO:13)

硫还原地杆菌(G.sulfurreducens)TadA：

MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP(SEQ ID NO:14)

大肠杆菌TadA(ecTadA)的实施例包括以下：

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)

在一些实施例中，腺苷脱氨酶包含与本文所提供的任何腺苷脱氨酶中阐述的氨基酸序列中的任一个至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.5％相同。应当认识到，本文所提供的腺苷脱氨酶可以包含一个或多个突变(例如，本文所提供的任何突变)。本公开提供了具有特定百分比同一性的任何脱氨酶结构域以及本文所描述的任何突变或其组合。在一些实施例中，腺苷脱氨酶包含氨基酸序列，该氨基酸序列与参考序列或本文所提供的任何腺苷脱氨酶相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变。在一些实施例中，腺苷脱氨酶包含氨基酸序列，该氨基酸序列与本领域已知或本文所描述的任一氨基酸序列相比具有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个或至少170个相同的连续氨基酸残基。

应当认识到，本文所提供的任何突变(例如，基于TadA参考序列)可以被引入其他腺苷脱氨酶，诸如大肠杆菌TadA(ecTadA)、金黄色葡萄球菌TadA(saTadA)或其他腺苷脱氨酶(例如，细菌腺苷脱氨酶)。对于本领域技术人员显而易见的是，可以类似地比对另外的脱氨酶以鉴定如本文所提供的可以突变的同源氨基酸残基。因此，在TadA参考序列中鉴定的任何突变均可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如，ecTada)中进行。还应当认识到，本文所提供的任何突变可以在TadA参考序列或另一腺苷脱氨酶中单独地或以任何组合进行。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D108X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D108G、D108N、D108V、D108A或D108Y突变，或另一腺苷脱氨酶中的对应突变。然而，应当认识到，可以类似地比对另外的脱氨酶以鉴定如本文所提供的可以突变的同源氨基酸残基。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A106X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A106V突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E155X突变，或另一腺苷脱氨酶中的对应突变，其中X的存在指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E155D、E155G或E155V突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D147X突变，或另一腺苷脱氨酶中的对应突变，其中X的存在指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D147Y突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A106X、E155X或D147X突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含E155D、E155G或E155V突变。在一些实施例中，腺苷脱氨酶包含D147Y。

应当认识到，本文所提供的任何突变(例如，基于TadA参考序列的ecTadA氨基酸序列)可以被引入其他腺苷脱氨酶，诸如金黄色葡萄球菌TadA(saTadA)或其他腺苷脱氨酶(例如，细菌腺苷脱氨酶)。对于本领域技术人员来说，如何与ecTadA中的突变的残基同源是显而易见的。因此，在ecTadA中鉴定的任何突变可以在具有同源氨基酸残基的其他腺苷脱氨酶中进行。还应当认识到，本文所提供的任何突变可以在ecTadA或另一腺苷脱氨酶中单独地或以任何组合进行。

例如，腺苷脱氨酶含有突变的组合(例如，V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；或L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N)，并且可以含有一个或多个另外的突变。另外的突变包括例如TadA参考序列中的D108N、A106V、E155V和/或D147Y突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的以下突变组(突变组由“；”分开)，或另一腺苷脱氨酶中的对应突变：D108N和A106V；D108N和E155V；D108N和D147Y；A106V和E155V；A106V和D147Y；E155V和D147Y；D108N、A106V和E155V；D108N、A106V和D147Y；D108N、E155V和D147Y；A106V、E155V和D147Y；以及D108N、A106V、E155V和D147Y。然而，应当认识到，本文所提供的对应突变的任何组合可以在腺苷脱氨酶(例如，ecTadA)中进行。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X和/或K157X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X的存在指示除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E或A56S、E59G、E85K或E85G、M94L、I95L、V102A、F104L、A106V、R107C或R107H或R107P、D108G或D108N或D108V或D108A或D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D和/或K157R突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8X、D108X和/或N127X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X指示任何氨基酸的存在。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、D108N和/或N127S突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X和/或T166X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154H或Q154R、E155G或E155V或E155D、K161Q、Q163H和/或T166P突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、N127X、D147X、R152X和Q154X组成的组的一、二、三、四、五或六个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、M61X、M70X、D108X、N127X、Q154X、E155X和Q163X组成的组的一、二、三、四、五、六、七或八个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、N127X、E155X和T166X组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含选自由H8X、A106X和D108X组成的组的一、二、三、四、五或六个突变，或另一腺苷脱氨酶中的相应的一个或多个突变，其中X表示存在除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由H8X、R26X、L68X、D108X、N127X、D147X和E155X组成的组的一、二、三、四、五、六、七或八个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X表示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、R126X、L68X、D108X、N127X、D147X和E155X组成的组的一、二、三、四、五、六或七个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、D108X、A109X、N127X和E155X组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、N127S、D147Y、R152C和Q154H组成的组的一、二、三、四、五或六个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、M61I、M70V、D108N、N127S、Q154R、E155G和Q163H组成的组的一、二、三、四、五、六、七或八个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、N127S、E155V和T166P组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、A106T、D108N、N127S、E155D和K161Q组成的组的一、二、三、四、五或六个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、R26W、L68Q、D108N、N127S、D147Y和E155V组成的组的一、二、三、四、五、六、七或八个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、D108N、A109T、N127S和E155G组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含另一腺苷脱氨酶中的或一个或多个对应突变中的一个或多个。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D108N、D108G或D108V突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A106V和D108N突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R107C和D108N突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、D108N、N127S、D147Y和Q154H突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、D108N、N127S、D147Y和E155V突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的D108N、D147Y和E155V突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H8Y、D108N和N127S突变，或另一腺苷脱氨酶中的对应突变。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A106V、D108N、D147Y和E155V突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的S2X、H8X、I49X、L84X、H123X、N127X、I156X和/或K160X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的S2A、H8Y、I49F、L84F、H123Y、N127S、I156F和/或K160S突变中的一者或多者，或另一腺苷脱氨酶(例如，ecTadA)中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含L84X突变腺苷脱氨酶，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的L84F突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H123X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H123Y突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的I156X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的I156F突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的L84X、A106X、D108X、H123X、D147X、E155X和I156X组成的组的一、二、三、四、五、六或七个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的S2X、I49X、A106X、D108X、D147X和E155X组成的组的一、二、三、四、五或六个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8X、A106X、D108X、N127X和K160X组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的L84F、A106V、D108N、H123Y、D147Y、E155V和I156F组成的组的一、二、三、四、五、六或七个突变，或另一腺苷脱氨酶中的对应的一个或多个突变。在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的S2A、I49F、A106V、D108N、D147Y和E155V组成的组的一、二、三、四、五或六个突变。

在一些实施例中，腺苷脱氨酶包含选自由TadA参考序列中的H8Y、A106T、D108N、N127S和K160S组成的组的一、二、三、四或五个突变，或另一腺苷脱氨酶中的对应的一个或多个突变，其中X指示存在除野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E25X、R26X、R107X、A142X和/或A143X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变。在一些实施例中，腺苷脱氨酶包含本文所描述的对应于TadA参考序列的突变中的一个或多个，或另一腺苷脱氨酶中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E25X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的E25M、E25D、E25A、E25R、E25V、E25S或E25Y突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R26X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R26G、R26N、R26Q、R26C、R26L或R26K突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R107X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R107P,R107K、R107A、R107N、R107W、R107H或R107S突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A142X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A142N、A142D、A142G突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A143X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q和/或A143R突变，或另一腺苷脱氨酶(例如，ecTadA)中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X和/或K161X突变中的一者或多者，或另一腺苷脱氨酶中的一个或多个对应突变，其中X的存在指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N和/或K161T突变中的一者或多者，或另一腺苷脱氨酶(例如，ecTadA)中的一个或多个对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H36X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的H36L突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的N37X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的N37T或N37S突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的P48X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的P48T或P48L突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R51X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R51H或R51L突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的S146X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的S146R或S146C突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的K157X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的K157N突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的P48X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的P48S、P48T或P48A突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A142X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的A142N突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的W23X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的W23R或W23L突变，或另一腺苷脱氨酶中的对应突变。

在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R152X突变，或另一腺苷脱氨酶中的对应突变，其中X指示除了野生型腺苷脱氨酶中的对应氨基酸之外的任何氨基酸。在一些实施例中，腺苷脱氨酶包含TadA参考序列中的R152P或R52H突变，或另一腺苷脱氨酶中的对应突变。

在一个实施例中，腺苷脱氨酶可以包含突变H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F和K157N。在一些实施例中，腺苷脱氨酶相对于TadA参考序列包含以下突变组合，其中组合中的每个突变由“_”分开并且每个突变组合在圆括号之间：

(A106V_D108N)、

(R107C_D108N)、

(H8Y_D108N_N127S_D147Y_Q154H)、

(H8Y_D108N_N127S_D147Y_E155V)、

(D108N_D147Y_E155V)、

(H8Y_D108N_N127S)、

(H8Y_D108N_N127S_D147Y_Q154H)、

(A106V_D108N_D147Y_E155V)、

(D108Q_D147Y_E155V)、

(D108M_D147Y_E155V)、

(D108L_D147Y_E155V)、

(D108K_D147Y_E155V)、

(D108I_D147Y_E155V)、

(D108F_D147Y_E155V)、

(A106V_D108N_D147Y)、

(A106V_D108M_D147Y_E155V)、

(E59A_A106V_D108N_D147Y_E155V)、

(E59A cat失活_A106V_D108N_D147Y_E155V)、

(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、

(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(D103A_D104N)、

(G22P_D103A_D104N)、

(D103A_D104N_S138A)、

(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、

(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、

(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F)、(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、

(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I15

6F)、(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、

(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、

(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、

(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F)、

(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、

(A106V_D108N_A142N_D147Y_E155V)、

(R26G_A106V_D108N_A142N_D147Y_E155V)、

(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、

(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、

(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、

(A106V_R107K_D108N_A142N_D147Y_E155V)、

(A106V_D108N_A142N_A143G_D147Y_E155V)、

(A106V_D108N_A142N_A143L_D147Y_E155V)、

(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、

(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、

(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、

(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、

(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、

(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、

(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)

(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、

(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、

(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、

(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、

(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、

(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、

(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、

(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、

(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、

(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、

(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、

(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、

(L84F_A106V_D108N_D147Y_E155V_I156F)、

(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、

(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、

(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、

(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、

(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、

(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、

(P48S_A142N)、

(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、

(P48T_I49V_A142N)、

(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、

(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F)、

(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_156F_K157N)、

(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156

F_K157N)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156

F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、

(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、

(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、

(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、

(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_I156F_K157N)。

在一些实施例中，TadA脱氨酶为TadA变体。在一些实施例中，TadA变体为TadA*7.10。在特定实施例中，融合蛋白包含单个TadA*7.10结构域(例如，作为单体提供)。在其他实施例中，融合蛋白包含能够形成异二聚体的TadA*7.10和TadA(wt)。在一个实施例中，如本文所描述的融合蛋白包含连接至TadA*7.10(其连接至Cas9切口酶)的野生型TadA。

在一些实施例中，TadA*7.10包含至少一种改变。在一些实施例中，腺苷脱氨酶包含以下序列的改变：

TadA*7.10

在一些实施例中，TadA*7.10包含氨基酸82和/或166处的改变。在特定实施例中，TadA*7.10包含以下改变中的一种或多种：Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施例中，TadA*7.10的变体包含选自以下的组的改变组合：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。

在一些实施例中，TadA*7.10的变体包含选自L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K和/或D167N的组的改变中的一者或多者。在一些实施例中，TadA*7.10的变体包含V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在其他实施例中，TadA*7.10的变体包含选以下的组的改变组合：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在一些实施例中，腺苷脱氨酶变体(例如，TadA变体)包含缺失。在一些实施例中，腺苷脱氨酶变体包含C末端的缺失。在特定实施例中，相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变，腺苷脱氨酶变体包含从残基149、150、151、152、153、154、155、156和157开始的C末端的缺失。

在其他实施例中，腺苷脱氨酶变体(例如，TadA*8)为相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者的单体：Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施例中，腺苷脱氨酶变体(TadA*8)为单体，该单体相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。

在其他实施例中，本公开的碱基编辑器包含腺苷脱氨酶变体(例如，TadA*8)单体，该单体相对于TadA*7.10、TadA参考序列或另一个TadA中的对应突变包含以下改变中的一者或多者：R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N。在其他实施例中，腺苷脱氨酶变体(TadA*8)单体相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N；V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；V88A+T111R+D119N+F149Y；以及A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。

在一些实施例中，腺苷脱氨酶变体(例如，MSP828)为单体，该单体相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者：L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K和/或D167N。在一些实施例中，腺苷脱氨酶变体(例如，MSP828)为单体，该单体相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在其他实施例中，腺苷脱氨酶变体(TadA变体)为单体，该单体相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在其他实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶结构域(例如，TadA*8)的同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有以下改变中的一者或多者：Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶结构域(例如，TadA*8)的同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有选自以下的组的改变组合：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。

在其他实施例中，本公开的碱基编辑器包含含有两个腺苷脱氨酶结构域(例如，TadA*8)的腺苷脱氨酶变体(例如，TadA*8)同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有以下改变中的一者或多者的：R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N。在其他实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶结构域(例如，TadA*8)的同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有选自以下的组的改变组合：R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N；V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；V88A+T111R+D119N+F149Y；以及A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。

在一些实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶结构域(例如，TadA*7.10)的同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有以下改变中的一者或多者：L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K和/或D167N。在一些实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶变体结构域(例如，MSP828)的同二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有以下改变：V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在其他实施例中，腺苷脱氨酶变体为包含两个腺苷脱氨酶结构域(例如，TadA*7.10)的同二聚体，该腺苷脱氨酶结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变各自具有选自以下的组的改变组合：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在其他实施例中，腺苷脱氨酶变体为野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者：Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施例中，腺苷脱氨酶变体为野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。

在其他实施例中，碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下改变中的一者或多者：R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N。在其他实施例中，碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N；V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；V88A+T111R+D119N+F149Y；以及A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。

在其他实施例中，腺苷脱氨酶变体为野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*7.10)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者：L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K和/或D167N。在一些实施例中，腺苷脱氨酶变体为包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，MSP828)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变具有以下改变：V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在其他实施例中，腺苷脱氨酶变体为野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如，TadA*7.10)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在其他实施例中，腺苷脱氨酶变体为TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者：Y147T、Y147R、Q154S、Y123H、V82S、T166R和/或Q154R。在其他实施例中，腺苷脱氨酶变体为TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。

在其他实施例中，碱基编辑器包含TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下改变中的一者或多者：R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I和/或D167N。在其他实施例中，碱基编辑器包含TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*8)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N；V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N；V88A+T111R+D119N+F149Y；以及A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。

在其他实施例中，腺苷脱氨酶变体为TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*7.10)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含以下改变中的一者或多者：L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K和/或D167N。在一些实施例中，腺苷脱氨酶变体为包含TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，MSP828)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变具有以下改变：V82G、Y147T/D、Q154S，以及L36H、I76Y、F149Y、N157K和D167N中的一者或多者。在其他实施例中，腺苷脱氨酶变体为TadA*7.10结构域和腺苷脱氨酶变体结构域(例如，TadA*7.10)的异二聚体，该腺苷脱氨酶变体结构域相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含选自以下的组的改变组合：V82G+Y147T+Q154S；I76Y+V82G+Y147T+Q154S；L36H+V82G+Y147T+Q154S+N157K；V82G+Y147D+F149Y+Q154S+D167N；L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；L36H+I76Y+V82G+Y147T+Q154S+N157K；I76Y+V82G+Y147D+F149Y+Q154S+D167N；L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。

在一些实施例中，TadA*8为如表8A、10、11或13中所示的变体。表8A、10、11和13示出了TadA氨基酸序列中的某些氨基酸位置编号以及TadA-7.10腺苷脱氨酶中那些位置存在的氨基酸。表8A、10、11和13还示出了噬菌体辅助非连续进化(PANCE)和噬菌体辅助连续进化(PACE)后TadA变体相对于TadA-7.10的氨基酸变化，如以下中所描述：M.Richter等人，2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-z，其全部内容通过引用并入本文。在一些实施例中，TadA*8为TadA*8a、TadA*8b、TadA*8c、TadA*8d或TadA*8e。在一些实施例中，TadA*8为TadA*8e。

在特定实施例中，腺苷脱氨酶异二聚体可以包含TadA*8结构域和选自以下的腺苷脱氨酶结构域：金黄色葡萄球菌(S.aureus)TadA、枯草芽孢杆菌(B.subtilis)TadA、鼠伤寒沙门氏菌(S.typhimurium)TadA、腐败希瓦氏菌(S.putrefaciens)TadA、流感嗜血杆菌F3031(H.influenzae)TadA、新月柄杆菌(C.crescentus)TadA、硫还原地杆菌(G.sulfurreducens)TadA或TadA*7.10。

在一些实施例中，腺苷脱氨酶为TadA*8。在一个实施例中，腺苷脱氨酶为TadA*8，其包含以下具有腺苷脱氨酶活性的序列或其片段或基本上由以下序列或其片段组成：MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAH AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAA GSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:16)

在一些实施例中，TadA*8是截短的。在一些实施例中，相对于全长的TadA*8，截短的TadA*8缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N末端氨基酸残基。在一些实施例中，相对于全长的TadA*8，截短的TadA*8缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C末端氨基酸残基。在一些实施例中，腺苷脱氨酶变体为全长TadA*8。

在一个实施例中，如本文所描述和/或例示的融合蛋白包含连接至本文所描述的腺苷脱氨酶变体(例如，TadA*8)的野生型TadA，该腺苷脱氨酶变体连接至Cas9切口酶。在特定实施例中，融合蛋白包含单个TadA*8结构域(例如，作为单体提供)。在其他实施例中，碱基编辑器包含能够形成异二聚体的TadA*8和TadA(wt)。

在一些实施例中，TadA*8为TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23或TadA*8.24

表5.另外的TadA*8变体

在一些实施例中，TadA变体为如表6中所示的变体。表6示出了TadA氨基酸序列中的某些氨基酸位置编号以及TadA*7.10腺苷脱氨酶中那些位置存在的氨基酸。在一些实施例中，TadA变体为MSP605、MSP680、MSP823、MSP824、MSP825、MSP827、MSP828或MSP829。在一些实施例中，TadA变体为MSP828。在一些实施例中，TadA变体为MSP829。

表6.TadA变体

在一个实施例中，如本文所描述融合蛋白包含连接至本文所描述的腺苷脱氨酶变体的野生型TadA，该腺苷脱氨酶变体连接至Cas9切口酶。在特定实施例中，融合蛋白包含单个变体TadA结构域(例如，作为单体提供)。在其他实施例中，融合蛋白包含能够形成异二聚体的变体TadA和TadA(wt)。

在一些实施例中，TadA变体是截短的。在一些实施例中，相对于全长的TadA变体，截短的TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N末端氨基酸残基。在一些实施例中，相对于全长的TadA变体，截短的TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C末端氨基酸残基。在一些实施例中，腺苷脱氨酶变体为全长TadA变体。

在特定实施例中，TadA*8包含以粗体显示的以下位置中的任一个处的一个或多个突变。在其他实施例中，TadA*8包含以划线示出的任意位置处的一个或多个突变：MSEVEFSHEY WMRHALTLAK RARDEREVPVGAVLVLNNRV IGEGWNRAIG 50LHDPTAHAEI MALRQGGLVMQNYRLIDATL YVTFEPCVMC AGAMIHSRIG 100RVVFGVRNAK TGAAGSLMDV LHYPGMNHRVEITEGILADE CAALLCYFFR 150MPRQVFNAQK KAQSSTD(SEQ ID NO:3)

例如，TadA*8相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变包含单独的或与以下Y147T、Y147R、Q154S、Y123H和/或Q154R中的任何一者或多者组合的氨基酸位置82和/或166处的改变(例如，V82S、T166R)。

在其他实施例中，相对于TadA*7.10、TadA参考序列或另一TadA中的对应突变，改变组合选自以下的组：Y147T+Q154R；Y147T+Q154S；Y147R+Q154S；V82S+Q154S；V82S+Y147R；V82S+Q154R；V82S+Y123H；I76Y+V82S；V82S+Y123H+Y147T；V82S+Y123H+Y147R；V82S+Y123H+Q154R；Y147R+Q154R+Y123H；Y147R+Q154R+I76Y；Y147R+Q154R+T166R；Y123H+Y147R+Q154R+I76Y；V82S+Y123H+Y147R+Q154R；以及I76Y+V82S+Y123H+Y147R+Q154R。在一些实施例中，腺苷脱氨酶包含以下改变中的一者多者：R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R和A158K。一个或多个改变在上面的序列中以下划线和粗体示出。

在一些实施例中，腺苷脱氨酶包含以下改变组合中的一种或多种：V82S+Q154R+Y147R；V82S+Q154R+Y123H；V82S+Q154R+Y147R+Y123H；Q154R+Y147R+Y123H+I76Y+V82S；V82S+I76Y；V82S+Y147R；V82S+Y147R+Y123H；V82S+Q154R+Y123H；Q154R+Y147R+Y123H+I76Y；V82S+Y147R；V82S+Y147R+Y123H；V82S+Q154R+Y123H；V82S+Q154R+Y147R；V82S+Q154R+Y147R；Q154R+Y147R+Y123H+I76Y；Q154R+Y147R+Y123H+I76Y+V82S；I76Y_V82S_Y123H_Y147R_Q154R；Y147R+Q154R+H123H；以及V82S+Q154R。

在一些实施例中，腺苷脱氨酶包含以下改变组合中的一种或多种：E25F+V82S+Y123H、T133K+Y147R+Q154R；E25F+V82S+Y123H+Y147R+Q154R；L51W+V82S+Y123H+C146R+Y147R+Q154R；Y73S+V82S+Y123H+Y147R+Q154R；P54C+V82S+Y123H+Y147R+Q154R；N38G+V82T+Y123H+Y147R+Q154R；N72K+V82S+Y123H+D139L+Y147R+Q154R；E25F+V82S+Y123H+D139M+Y147R+Q154R；Q71M+V82S+Y123H+Y147R+Q154R；E25F+V82S+Y123H+T133K+Y147R+Q154R；E25F+V82S+Y123H+Y147R+Q154R；V82S+Y123H+P124W+Y147R+Q154R；L51W+V82S+Y123H+C146R+Y147R+Q154R；P54C+V82S+Y123H+Y147R+Q154R；Y73S+V82S+Y123H+Y147R+Q154R；N38G+V82T+Y123H+Y147R+Q154R；R23H+V82S+Y123H+Y147R+Q154R；R21N+V82S+Y123H+Y147R+Q154R；V82S+Y123H+Y147R+Q154R+A158K；N72K+V82S+Y123H+D139L+Y147R+Q154R；E25F+V82S+Y123H+D139M+Y147R+Q154R；以及M70V+V82S+M94V+Y123H+Y147R+Q154R。

在一些实施例中，腺苷脱氨酶包含以下改变组合中的一种或多种：Q71M+V82S+Y123H+Y147R+Q154R；E25F+I76Y+V82S+Y123H+Y147R+Q154R；I76Y+V82T+Y123H+Y147R+Q154R；N38G+I76Y+V82S+Y123H+Y147R+Q154R；R23H+I76Y+V82S+Y123H+Y147R+Q154R；P54C+I76Y+V82S+Y123H+Y147R+Q154R；R21N+I76Y+V82S+Y123H+Y147R+Q154R；I76Y+V82S+Y123H+D139M+Y147R+Q154R；Y73S+I76Y+V82S+Y123H+Y147R+Q154R；E25F+I76Y+V82S+Y123H+Y147R+Q154R；I76Y+V82T+Y123H+Y147R+Q154R；N38G+I76Y+V82S+Y123H+Y147R+Q154R；R23H+I76Y+V82S+Y123H+Y147R+Q154R；P54C+I76Y+V82S+Y123H+Y147R+Q154R；R21N+I76Y+V82S+Y123H+Y147R+Q154R；I76Y+V82S+Y123H+D139M+Y147R+Q154R；Y73S+I76Y+V82S+Y123H+Y147R+Q154R；和V82S+Q154R；N72K_V82S+Y123H+Y147R+Q154R；Q71M_V82S+Y123H+Y147R+Q154R；V82S+Y123H+T133K+Y147R+Q154R；V82S+Y123H+T133K+Y147R+Q154R+A158K；M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R；N72K_V82S+Y123H+Y147R+Q154R；Q71M_V82S+Y123H+Y147R+Q154R；M70V+V82S+M94V+Y123H+Y147R+Q154R；V82S+Y123H+T133K+Y147R+Q154R；V82S+Y123H+T133K+Y147R+Q154R+A158K；以及M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。在一些实施例中，腺苷脱氨酶表达为单体。在其他实施例中，腺苷脱氨酶表达为异二聚体。在一些实施例中，脱氨酶或其它多肽序列缺乏甲硫氨酸，例如当被包含作为融合蛋白的组分时。这可以改变位置的编号。然而，技术人员将理解，此类对应的突变是指相同的突变，例如，Y73S和Y72S以及D139M和D138M。

在一些实施例中，TadA*9变体为单体。在一些实施例中，TadA*9变体为具有野生型TadA腺苷脱氨酶的异二聚体。在一些实施例中，TadA*9变体为与另一TadA变体(例如，TadA*8、TadA*9)的异二聚体。TadA*9腺苷脱氨酶的另外的细节描述于国际PCT申请号PCT/2020/049975中，该申请通过引用以其整体并入本文。在一个实施例中，如本文所描述融合蛋白包含连接至本文所描述的腺苷脱氨酶变体(例如，TadA变体)的野生型TadA，该腺苷脱氨酶变体连接至Cas9切口酶。在特定实施例中，融合蛋白包含单个TadA变体结构域(例如，作为单体提供)。在其他实施例中，碱基编辑器包含能够形成异二聚体的TadA*8和TadA(wt)。

在特定实施例中，融合蛋白包含单个(例如，作为单体提供)TadA变体结构域。在一些实施例中，TadA变体连接至Cas9切口酶。在一些实施例中，本文所描述的融合蛋白包含连接至TadA变体的野生型TadA(TadA(wt))的异二聚体。在其他实施例中，本文所描述的融合蛋白包含连接至TadA变体的TadA*7.10的异二聚体。在一些实施例中，融合蛋白包含TadA变体单体。在一些实施例中，融合蛋白包含TadA变体和TadA(wt)的异二聚体。在一些实施例中，融合蛋白包含TadA变体和TadA*7.10的异二聚体。在一些实施例中，融合蛋白包含两个TadA变体的异二聚体。在一些实施例中，TadA变体选自下文的表5、6或本文所提供的任何其他TadA变体。

在一些实施例中，脱氨酶或其它多肽序列缺乏甲硫氨酸，例如当被包含作为融合蛋白的组分时。这可以改变位置的编号。然而，技术人员将理解，此类对应的突变是指相同的突变。

本文所提供的任何突变和任何另外的突变(例如，基于ecTadA氨基酸序列)可以被引入任何其他腺苷脱氨酶中。本文所提供的任何突变可以在TadA参考序列或另一腺苷脱氨酶(例如，ecTadA)中单独地或以任何组合进行。

A至G核碱基编辑蛋白的细节描述于以下中：国际PCT申请号PCT/2017/045381(WO2018/027078)和Gaudelli,N.M.等人,“Programmable base editing of A·T to G·Cin genomic DNA without DNA cleavage”Nature,551,464-471(2017)，其全部内容特此通过引用并入。

使用核碱基编辑器来靶向G6PC基因中的核苷酸

如本文所描述，评估靶向G6PC基因中的核苷酸的核碱基编辑器的适用性。

如本文所描述，评定核碱基编辑器的活性，即，通过对靶基因进行测序以检测靶序列的改变。对于Sanger测序，将经纯化的PCR扩增子克隆到质粒骨架中，变换、小量制备并利用单一引物进行测序。还可以使用下一代测序技术来进行测序。当使用下一代测序时，扩增子可以为300至500bp，其中预期切割位点不对称放置。PCR之后，可以将下一代测序衔接子和条形码(例如Illumina多重衔接子和索引)添加到扩增子的端部，例如，用于高通量测序中(例如在Illumina MiSeq上)。

在一些实施例中，核碱基编辑器用于靶向目的多核苷酸。在一个实施例中，将如本文所描述的核碱基编辑器与用于靶向核酸序列(例如，含有GSD1a关联突变的G6PC多核苷酸)的引导RNA结合递送至细胞(例如，肝细胞)，从而改变靶标基因，即，G6PC。

在一些实施例中，碱基编辑器被引导RNA靶向以向目的基因(例如G6PC)的序列引入一个或多个编辑。在一些实施例中，将一种或多种改变引入葡萄糖-6-磷酸酶(G6PC)基因中。在一些实施例中，一种或多种改变为R83C。在一些实施例中，一种或多种改变为Q347X。在一些实施例中，将改变引入以NCBI参考序列号AAA16222.1发现的代表性智人G6PC蛋白中。在一些实施例中，将改变引入以GenBank参考序列号U01120.1发现的代表性智人G6PC核酸序列中。

治疗应用

本文所描述的NLS-gRNA以可以在用于各种治疗应用的基因编辑系统中使用。因此，在一些实施例中，提供了一种治疗有需要的受试者的病症或疾病的方法，该方法包括向受试者施用具有基因编辑系统的本文所描述的NLS-gRNA。各种基因编辑系统在本领域中是已知的并且包含例如CRISPR-Cas9、Cpf1、SaCas9、Cas12。本文所描述的NLS-gRNA可以与任何基因编辑系统一起使用。例如，Cas蛋白来自于源自包括以下的属的生物体：链球菌属、弯曲菌属、硝酸盐裂解菌属(Nitratifractor)、葡萄球菌属、细小棒菌属(Parvibaculum)、罗氏菌属(Roseburia)、奈瑟氏球菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、鳞球菌属(Sphaerochaeta)、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、棒杆菌属(Corynebacter)、肉杆菌属(Carnobacterium)、红杆菌属(Rhodobacter)、李斯特菌属(Listeria)、帕鲁迪菌属(Paludibacter)、梭菌属(Clostridium)、毛螺菌属(Lachnospira)、毛螺菌属(Lachnospiraceae)、Clostridiaridium属、纤毛菌属(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团菌属(Legionella)、脂环酸芽孢杆菌属(Alicyclobacillus)、嗜甲烷菌属(Methanomethyophilus)、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属(Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、钩端螺旋体(Leptospira)、脱硫弧菌属(Desulfovibrio)、脱硫嗜盐碱菌属(Desulfonatronum)、丰佑菌属(Opitutaceae)、肿块芽胞杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆菌属(Methylobacterium)、丁酸弧菌属(Butyvibrio)、异域菌属(Perigrinibacterium)、Pareubacterium属、莫拉菌属(Moraxella)、硫微螺菌属(Thiomicrospira)或氨基酸球菌属(Acidaminococcus)。在特定实施例中，Cpfl效应子蛋白选自生物体，该生物体来自选自以下的属：真杆菌属、毛螺菌科、纤毛菌属、弗朗西斯氏菌属、嗜甲烷菌属、卟啉单胞菌属、普雷沃氏菌属、钩端螺旋体属、丁酸弧菌属、异域菌属、Pareubacterium属、莫拉菌属、硫微螺菌属或氨基酸球菌属。

Cas物种的非限制性示例包括酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophiles)、金黄色链球菌(Sterptococcus aureas)、脑膜炎奈瑟菌(Neisseria meningitides)、齿垢密螺旋体(Treponema denticola)、土拉弗朗西斯菌(Francisella tularensis)、空肠弯曲菌(Campylobacter jejuni)、溃疡棒杆菌(Corynebacterium ulcerans)、白喉棒状杆菌(Corynebacterium diphtheria)、黄道蚜蝇螺原体(Spiroplasma syrphidicola)、中间普雷沃氏菌(Prevotella intermedia)、台湾螺原体(Spiroplasma taiwanense)、海豚链球菌(Streptococcus iniae)、波罗的海贝尔氏菌(Belliella baltica)、扭曲冷弯曲菌(Psychroflexus torquis)、嗜热链球菌(Streptococcus thermophilus)、无害李斯特菌(Listeria innocua)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)、星座链球菌(Streptococcus constellatus)、夏普氏菌(Sharpea spp.)分离物RUG017、小韦荣球菌(Veillonella parvula)、秘鲁江崎氏菌(Ezakiella peruensis)、发酵乳杆菌(Lactobacillus fermentum)菌株AF15-40LB和嗜胨菌(Peptoniphilus sp.)马赛-P3761。

在一些实施例中，本文所描述的NLS-gRNA可以与基因编辑系统结合使用以治疗各种疾病和病症，例如，遗传病症(例如，单基因疾病)、可以通过核酸酶活性治疗的疾病和各种癌症等。

在一些实施例中，本文所描述的NLS-gRNA可以与基因编辑系统结合使用以编辑靶核酸，从而修饰靶核酸(例如，通过插入、缺失或突变一个或多个核酸残基)。例如，在一些实施例中，CRISPR系统与本文所描述的NLS-gRNA一起使用并且包括外源供体模板核酸(例如，DNA分子或RNA分子)，该外源供体模板核酸包括所需的核酸序列。在解决用CRISPR系统诱导的切割事件后，细胞的分子机制将利用外源供体模板核酸来修复和/或解决切割事件。可替代地，细胞的分子机制可以利用内源模板来修复和/或解决切割事件。在一些实施例中，本文所描述的NLS-gRNA与基因编辑系统结合使用以改变导致插入、缺失和/或点突变的靶核酸。在一些实施例中，所述插入是无痕插入(即，将预期的核酸序列插入靶核酸中，从而导致在解决切割事件后没有另外的非预期的核酸序列)。供体模板核酸可以是双链或单链核酸分子(例如，DNA或RNA)。

在一个方面，本文所描述的NLS-gRNA可以与基因编辑系统结合使用，以用于治疗由RNA、毒性RNA和/或突变RNA(例如，剪接缺陷或截短)的过表达引起的疾病。

在一些实施例中，本文所描述的NLS-gRNA可以与基因编辑系统结合使用以靶向影响引起各种疾病的RNA依赖性功能的反式作用突变。

在一些实施例中，本文所描述的NLS-gRNA可以与基因编辑系统结合使用，以靶向破坏可以引起剪接缺陷和疾病的顺式作用剪接代码的突变。

本文所描述的NLS-gRNA可以与基因编辑系统结合使用，以实现抗病毒活性，特别是抗RNA病毒。例如，使用合适的NLS-gRNA来靶向病毒RNA，该NLS-gRNA被选择用于靶向病毒RNA序列。

本文所描述的NLS-gRNA可以与基因编辑系统结合使用以治疗受试者(例如，人类受试者)的癌症。例如，通过靶向异常(例如，包括点突变或选择性剪接)并在癌细胞中发现的RNA分子来诱导癌细胞中的细胞死亡(例如，通过细胞凋亡)。

本文所描述的NLS-gRNA可以与基因编辑系统结合使用以治疗受试者的传染病。例如，通过靶向感染原(例如，细菌、病毒、寄生虫或原生动物)表达的RNA分子以靶向并诱导感染原细胞中的细胞死亡。本文所述的合成引导RNA可以与基因编辑系统结合使用以治疗细胞内感染原感染宿主受试者细胞的疾病。

在期望将多核苷酸序列插入靶DNA序列的应用中，还向细胞提供包括待插入的供体序列的多核苷酸。“供体序列”或“供体多核苷酸”意指待插入在由定点修饰多肽诱导的切割位点处的核酸序列。供体多核苷酸将在切割位点处与基因组序列含有足够的同源性，例如与侧接切割位点(例如，在切割位点的约50个碱基或更少以内，例如在约30个碱基内、在约15个碱基内、在约10个碱基内、在约5个碱基内，或紧侧接切割位点)的核苷酸序列具有70％、80％、85％、90％、95％或100％的同源性，以支持其与和其具有同源性的基因组序列之间的同源性定向修复。供体和基因组序列之间具有序列同源性的大约为25、50、100或200个核苷酸或超过200个核苷酸(或介于10与200或更多个核苷酸之间的任何整数值)将支持同源性定向修复。供体序列可以是任意长度，例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。

供体序列通常与其替换的基因组序列不同。相反，供体序列可以含有相对于基因组序列的至少一个或多个单碱基改变、插入、缺失、倒置或重排，只要存在足够的同源性以支持同源性定向修复即可。在一些实施例中，供体序列包括由两个同源区域侧接的非同源序列，使得靶DNA区域与两个侧接序列之间的同源定向修复导致非同源序列在靶区域处的插入。供体序列还可以包括载体骨架，载体骨架含有与所关注的DNA区域不同源并且不打算插入所关注的DNA区域的序列。通常，供体序列的同源区域与需要重组的基因组序列将具有至少50％的序列同一性。在某些实施例中，存在60％、70％、80％、90％、95％、98％、99％或99.9％的序列同一性。根据供体多核苷酸的长度，可以存在介于1％与100％序列同一性之间的任何值。

与基因组序列相比，供体序列可以包括某些序列差异，例如限制性位点、核苷酸多态性、可选择标志物(例如，耐药基因、荧光蛋白、酶等)等，序列差异可以用于评估供体序列在切割位点处的成功插入，或在一些情况下可以用于其它目的(例如，表示在靶向基因组基因座处的表达)。在一些情况下，如果定位于编码区中，则此类核苷酸序列差异将不会改变氨基酸序列，或将使沉默氨基酸发生改变(即，不影响蛋白质的结构或功能的改变)。可替代地，这些序列差异可以包含侧接重组序列，如FLP、loxP序列等，重组序列可以在稍后的时间被激活以去除标志物序列。

供体序列可以作为单链DNA、单链RNA、双链DNA或双链RNA提供给细胞。它可以线性或圆形形式引入细胞中。如果以线性形式引入，可以通过本领域技术人员已知的方法保护供体序列的末端(例如，防止核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加到线性分子的3'末端和/或将自互补寡核苷酸连接到一个或两个末端。用于保护外源多核苷酸免于降解的另外的方法包含但不限于添加末端氨基以及使用经过修饰的核苷酸间键，例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。作为保护线性供体序列末端的替代方案，可以在同源区域之外包含额外长度的序列，所述同源区域可以在不影响重组的情况下被降解。可以将供体序列作为载体分子的一部分引入细胞，所述载体分子具有额外序列，例如复制起点、启动子和编码抗生素抗性的基因。此外，供体序列可以作为裸核酸、作为与如脂质体或泊洛沙姆等药剂复合的核酸引入，或者可以通过病毒(例如，腺病毒、AAV)递送，如上文对于编码靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的核酸所述。

按照上述方法，可以离体切割和修饰，即“基因修饰”所关注的DNA区域。在一些实施例中，当将可选择标志物插入所关注的DNA区域时，通过将经基因修饰的细胞与剩余细胞群分离，可以使细胞群富集包括经基因修饰的细胞。在富集之前，“经基因修饰的”细胞可能仅占细胞群的约1％或更多(例如，2％或更多、3％或更多、4％或更多、5％或更多、6％或更多、7％或更多、8％或更多、9％或更多、10％或更多、15％或更多，或20％或更多)。“经基因修饰的”细胞的分离可以通过适于所使用的可选择标志物的任何方便的分离技术来实现。例如，如果已插入荧光标记物，则可以通过荧光激活细胞分选来使细胞分离，而如果已插入细胞表面标记物，则可以通过亲和分离技术将细胞与异质群体分离，例如磁分离、亲和层析、用附着到固体基质上的亲和试剂进行“淘选”或其它方便的技术。提供精确分离的技术包括荧光激活细胞分选仪，其复杂程度各不相同，如多个颜色通道、低角度和钝角光散射检测通道、阻抗通道等。可以通过使用与失活细胞相关的染料(例如碘化丙啶)来针对失活细胞选择细胞。可以采用不会过度损害经基因修饰的细胞的活力的任何技术。以此方式实现包括经修饰的DNA的细胞高度富集的细胞组合物。“高度富集”是指经过遗传修饰的细胞将为细胞组合物的70％或更多、75％或更多、80％或更多、85％或更多、90％或更多，例如细胞组合物的约95％或更多或98％或更多。换言之，组合物可以是基本上纯的经基因修饰的细胞的组合物。

通过本文所述的方法产生的经基因修饰的细胞可以立即使用。可替代地，细胞可以在液氮温度下冷冻并长期储存，解冻并能够重复使用。在这种情况下，细胞通常会被冷冻在10％二甲亚砜(DMSO)、50％血清、40％缓冲介质或如本领域中常用的其它某种溶液中以将细胞保存在这种冷冻温度下，并且以本领域中已知的用于解冻冷冻培养细胞的方式解冻。

基因修饰的细胞可以在各种培养条件下体外培养。所述细胞可以在培养物中扩增，即在促进其增殖的条件下生长。培养基可以是液体或半固体，例如包含琼脂、甲基纤维素等。细胞群体可以悬浮在适当的营养培养基中，如伊思柯夫(Iscove's)改良的DMEM或RPMI 1640，通常补充有胎牛血清(约5％至10％)、

L-谷氨酰胺、硫醇，特别是2-巯基乙醇和抗生素，例如青霉素和链霉素。培养物可以含有调节性T细胞对其有应答的生长因子。如本文所定义的，生长因子是能够通过对跨膜受体的特定作用促进细胞在培养物或完整组织中存活、生长和/或分化的分子。生长因子包含多肽和非多肽因子。

可以将已经以这种方式进行经基因修饰的细胞移植到受试者体内，用于基因治疗等目的，例如治疗疾病或作为抗病毒、抗病原体或抗癌治疗剂，用于在农业中生产经基因修饰的生物体，或用于生物学研究。受试者可以是新生儿、青少年或成人。特别关注的是哺乳动物受试者。以用本方法处理的哺乳动物物种包含犬和猫；马；牛；绵羊等和灵长类动物，特别是人类。动物模型，特别是小型哺乳动物(例如小鼠、大鼠、豚鼠、仓鼠、兔形目动物(例如兔子)等)可以用于实验研究。

细胞可以单独或与合适的底物或基质一起提供给受试者，例如，以支持它们在被移植的组织中的生长和/或组织。通常，将施用至少1x10³个细胞，例如5x10³个细胞、1x10⁴个细胞、5x10⁴个细胞、1x10⁵个细胞、1x10⁶个细胞或更多。可以通过以下任何途径将细胞引入受试者：肠胃外、皮下、静脉内、颅内、脊髓内、眼内或进入脊髓液。细胞可以通过注射、导管等引入。为了产生转基因动物(例如，转基因小鼠)的目的，也可以将细胞引入胚胎(例如，胚泡)中。

向受试者施用治疗的次数可以变化。将经基因修饰的细胞引入受试者可能是一次性事件；但在某些情况下，这种治疗可能会在有限的时间段内引起改善并且需要进行一系列持续的重复治疗。在其它情况下，在观察到效果之前，可能需要多次施用经基因修饰的细胞。确切的方案取决于疾病或病状、疾病的阶段和正在治疗的个体受试者的参数。

在本发明的其他方面，靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸用于体内修饰细胞DNA，同样用于基因治疗等目的，例如用于治疗疾病或作为抗病毒剂、抗病原体剂或抗癌剂，用于在农业中生产经基因修饰的生物体，或用于生物学研究。在这些体内实施例中，将靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸直接施用于个体。靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以通过本领域中用于将肽、小分子和核酸施用给受试者的许多众所周知的方法中的任一种施用。可以将靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸掺入多种调配物中。更具体地，本发明的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以通过与适当的药学上可接受的载剂或稀释剂组合而调配成药物组合物。

药物制剂是包含一种或多种存在于药学上可接受的载体中的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的组合物。“药学上可接受的媒剂”可以是由联邦或州政府的监管机构批准的或者在美国

药典或其它公认药典中列出的在如人类等哺乳动物中使用的媒剂。术语“媒剂”是指本发明的化合物与其一起调配用于向哺乳动物施用的稀释剂、佐剂、赋形剂或载剂。此类药物媒剂可以是脂质，例如脂质体，例如脂质体树状物；液体，如水和油，包含石油、动物、植物或合成来源的油，如花生油、大豆油、矿物油、芝麻油等，盐水；阿拉伯树胶、明胶、淀粉糊、滑石、角蛋白、胶体二氧化硅、尿素等。另外，可以使用助剂、稳定剂、增稠剂、润滑剂和着色剂。药物组合物可以调配成固体、半固体、液体或气体形式的制剂，如片剂、胶囊、粉末、颗粒、软膏、溶液、栓剂、注射剂、吸入剂、凝胶、微球和气雾剂。因此，DNA靶向RNA和/或定点修饰多肽和/或供体多核苷酸的施用可以多种方式实现，包含口服、口腔、直肠、肠胃外、腹膜内、皮内、经皮、气管内、眼内等施用。活性剂在施用后可以是全身性的，也可以通过使用局部施用、壁内施用或使用植入物来定位，植入物起到在植入部位保留活性剂量的作用。活性剂可以被调配成立即活性或可以被调配成缓释。

对于一些病状，特别是中枢神经系统病状，可能需要调配药剂以穿过血脑屏障(BBB)。一种通过血脑屏障(BBB)递送药物的策略需要通过如甘露醇或白三烯等渗透性手段或生化地通过使用血管活性物质如缓激肽来破坏BBB。使用BBB开放将特定药剂靶向脑肿瘤的潜力也是一种选择。当组合物通过血管内注射施用时，BBB破坏剂可以与本发明的治疗组合物共同施用。其它通过BBB的策略可能需要使用内源性转运系统，包含Caveolin-1介导的转胞吞作用、如葡萄糖和氨基酸载剂等载剂介导的转运蛋白、受体介导的胰岛素或转铁蛋白转胞吞作用以及主动外排转运蛋白，如p-糖蛋白。活性转运部分也可以与用于本发明的治疗化合物缀合以促进穿过血管内皮壁的转运。

可替代地，BBB后面的治疗剂的药物递送可以通过局部递送，例如通过鞘内递送。

通常，提供有效量的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸。如上文关于离体方法所讨论的，体内靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的有效量或有效剂量是诱导两个同源序列之间观察到的重组量相对于阴性对照，例如与空载体或无关多肽接触的细胞增加2倍或更多的量。重组量可以通过任何方便的方法来测量，例如，如上文所描述并且是本领域已知的。待施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的有效量或有效剂量的计算在本领域普通技术人员的技能范围内，并且对于本领域技术人员来说是常规的。待施用的最终量将取决于施用途径和待治疗的病症或病状的性质。在一些实施例中，使用约0.01与1mpk之间的示例性剂量。

给予特定患者的有效量将取决于多种因素，其中一些因素因患者而异。有能力的临床医生将能够确定有效量的治疗剂以施用于患者，以根据需要停止或逆转疾病状况的进展。利用LD50动物数据和所述药剂可用的其它信息，临床医生可以根据施用途径确定个体的最大安全剂量。例如，假设治疗组合物被施用到更大的体液中，静脉内施用的剂量可能大于鞘内施用的剂量。类似地，可以以更高剂量或以重复剂量施用快速从体内清除的组合物，以维持治疗浓度。利用普通技能，有能力的临床医生将能够在常规临床试验过程中优化特定治疗剂的剂量。

为了包含在药物中，靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸可以从合适的商业来源获得。作为一般建议，每剂肠胃外施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的总药学有效量将处于可以通过剂量应答曲线测量的范围内。

基于靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的疗法，即用于治疗性施用的靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的制剂，必须是无菌的。通过无菌过滤膜(例如，0.2μm膜)过滤容易实现无菌。治疗性组合物通常放置在具有无菌进入口的容器中，例如，静脉注射溶液袋或具有可通过皮下注射针刺穿的塞子的小瓶。基于靶向DNA的RNA和/或定点修饰多肽和/或供体多核苷酸的疗法可以作为水溶液或作为冻干调配物储存在单位或多剂量容器(例如，密封的安瓿或小瓶)中用于重组。作为冻干调配物的实例，10-mL小瓶填充有5ml无菌过滤的1％(w/v)化合物水溶液，并将所得混合物冻干。通过使用抑菌注射用水重构冻干化合物来制备输注溶液。

取决于期望的调配物，药物组合物可以包含药学上可接受的、无毒的稀释剂载剂，载剂被定义为通常用于调配用于动物或人类施用的药物组合物的载剂。对稀释剂进行选择以免影响所述组合物的生物活性。此类稀释剂的实例是蒸馏水、缓冲水、生理盐水、PBS、林格氏溶液、葡萄糖溶液和汉克溶液。另外，药物组合物或调配物可以包含其它载剂、佐剂、或无毒的、非治疗性的、非免疫原性的稳定剂、赋形剂等。组合物还可以包含接近生理条件的另外的物质，如pH调节剂和缓冲剂、毒性调节剂、润湿剂和去污剂。

组合物还可以包含多种稳定剂中的任何一种，如抗氧化剂。当药物组合物包含多肽时，多肽可以与增强多肽的体内稳定性或以其它方式增强其药理学性质(例如，增加多肽的半衰期，降低其毒性并提高溶解度或吸收)的各种众所周知的化合物复合。此类修饰剂或络合剂的实例包含硫酸盐、葡萄糖酸盐、柠檬酸盐和磷酸盐。组合物的核酸或多肽也可以与增强其体内属性的分子复合。此类分子包含例如碳水化合物、多胺、氨基酸、其它肽、离子(例如，钠、钾、钙、镁、锰)和脂质。

可以施用药物组合物用于预防和/或治疗性处理。可以根据细胞培养物和/或实验动物中的标准药学程序确定活性成分的毒性和治疗功效，包含例如确定LD50(对50％群体致死的剂量)和ED50(对50％群体治疗有效的剂量)。毒性作用与治疗效果之间的剂量比为治疗指数并且治疗指数可以被表示为比率LD50/ED50。优选展现出大的治疗指数的疗法。

从细胞培养和/或动物研究获得的数据可以用于调配人类使用的一系列剂量。活性成分的剂量通常在包含低毒性ED50在内的循环浓度范围内。根据所采用的剂型和所利用的施用通路，剂量可以在此范围内变化。

用于调配药物组合物的组分优选地具有高纯度并且基本上不含潜在有害污染物(例如，至少是国家食品(NF)级，通常至少是分析级，并且更通常至少是药物级)。此外，用于体内使用的组合物通常是无菌的。就必须在使用前合成给定化合物而言，所得产物通常基本上不含任何潜在的毒性剂，特别是任何可能存在于合成或纯化过程中的内毒素。用于肠胃外施用的组合物也是无菌的、基本上等渗的并且在GMP条件下制备。

递送系统

本文所描述的NLS-gRNA连同期望的基因编辑系统组分可以通过各种递送系统(诸如载剂、载剂等，例如，脂质纳米颗粒)递送到目的细胞。

本文所描述的NLS-gRNA可以通过纳米颗粒递送，该纳米颗粒可以是有机的或无机的。纳米颗粒在本领域中是众所周知的。任何合适的纳米颗粒设计都可以用于递送基因组编辑系统组分或编码此类组分的核酸。例如，有机(例如，脂质和/或聚合物)纳米颗粒可以适合用作本公开的某些实施例中的递送媒剂。用于纳米颗粒调配物和/或基因转移的示例性脂质示于表2(下文)中。

表2

/>

表3列出了用于基因转移和/或纳米颗粒调配物的示例性聚合物。

表3

/>

表4总结了用于编码本文所述Cas9的多核苷酸的递送方法。

表4

在另一方面，包含本文描述的NLS-gRNA的基因组编辑系统的递送可以通过将核糖核蛋白(RNP)递送到细胞来完成。RNP包括与靶向gRNA复合的核酸结合蛋白，例如Cas9。可以使用已知方法将RNP递送到细胞，该方法如电穿孔、核转染或阳离子脂质介导的方法，例如，如Zuris,J.A.等人,2015,Nat.Biotechnology,33(1):73-80所报道。RNP有利于在CRISPR碱基编辑系统中使用，特别是对于难以转染的细胞，例如原代细胞。另外，RNP还可以缓解细胞中蛋白质表达可能出现的困难，特别是当真核启动子(例如，可以用于CRISPR质粒的CMV或EF1A)表达不佳时。有利地，RNP的使用不需要将外源DNA递送到细胞中。此外，由于包括核酸结合蛋白和gRNA复合物的RNP会随着时间的推移而降解，因此使用RNP有可能限制脱靶效应。以与基于质粒的技术类似的方式，RNP可以用于递送结合蛋白(例如，Cas9变体)和指导同源定向修复(HDR)。

用于驱动CRISPR系统的启动子(例如，包含本文所述的合成gRNA)可以包含AAVITR。这对于消除对可能占用载体空间的额外启动子元件的需要是有利的。释放的额外空间可以用于驱动其它元件的表达，如引导核酸或可选择标志物。ITR活性相对较弱，因此可以用于降低因所选核酸酶过度表达而导致的潜在毒性。

任何合适的启动子都可以用于驱动Cas9和适当时引导核酸的表达。对于普遍表达，可以使用的启动子包括CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。对于脑或其它CNS细胞表达，合适的启动子可以包括：用于所有神经元的突触素I(SynapsinI)，用于兴奋性神经元的CaMKIIα，用于GABA能神经元的GAD67或GAD65或VGAT等。对于肝细胞表达，合适的启动子包括白蛋白启动子。对于肺细胞表达，合适的启动子可以包含SP-B。对于内皮细胞，合适的启动子可以包含ICAM。对于造血细胞，合适的启动子可以包含IFNβ或CD45。对于成骨细胞，合适的启动子可以包含OG-2。

在一些情况下，分开的启动子在同一核酸分子内驱动碱基编辑器和相容引导核酸的表达。例如，载体或病毒载体可以包括与编码碱基编辑器的核酸可操作地连接的第一启动子和与引导核酸可操作地连接的第二启动子。

用于驱动引导核酸的表达的启动子可以包括：Pol III启动子，诸如U6或H1，使用Pol II启动子和内含子盒来表达gRNA腺关联病毒(AAV)。

可以使用腺关联病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型来递送Cas9，特别是使用来自例如美国专利号8,454,972的调配物和剂量(腺病毒的调配物、剂量)、美国专利号8,404,658(AAV的调配物、剂量)和美国专利号5,846,946(DNA质粒的调配物、剂量)以及涉及慢病毒、AAV和腺病毒的临床试验的临床试验和出版物。例如，对于AAV，施用途径、调配物和剂量可以如美国专利第8,454,972号中和涉及AAV的临床试验中那样。对于腺病毒，施用途径、调配物和剂量可以如美国专利第8,404,658号和涉及腺病毒的临床试验中那样。对于质粒递送，施用途径、调配物和剂量可以如美国专利第5,846,946号和涉及质粒的临床研究中那样。剂量可以基于或外推到平均70kg的个体(例如，成年男性)，并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率在医疗或兽医从业者(例如，医师、兽医)的范围内，这取决于常见因素，包含年龄、性别、一般健康状况、患者或受试者的其它状况以及正在解决的特定病状或症状。病毒载体可以注射到所关注的组织中。对于细胞类型特异性碱基编辑，碱基编辑器和任选的引导核酸的表达可以由细胞类型特异性启动子驱动。

对于体内递送，AAV可能优于其它病毒载体。在一些情况下，AAV具有低毒性，这可能是由于纯化方法不需要对可以激活免疫反应的细胞颗粒进行超离心。在一些情况下，AAV导致插入诱变的可能性很小，因为它未整合到宿主基因组中。

AAV的包装限制为4.5或4.75Kb。大于4.5或4.75Kb的构建体可以导致病毒产量显著降低。例如，SpCas9相当大，基因本身超过4.1Kb，这使其很难包装到AAV中。因此，本公开的实施例包含使用长度比常规Cas9短的公开的Cas9。

AAV可以是AAV1、AAV2、AAV5或其任何组合。可以根据要靶向的细胞选择AAV的类型；例如，可以选择AAV血清型1、2、5或混合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经元细胞；并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送到肝脏。关于这些细胞的某些AAV血清型的列表可以在Grimm,D.等人,J.Virol.82:5887-5911(2008))中找到。

慢病毒是复杂的逆转录病毒，其能够在有丝分裂和有丝分裂后细胞中感染并表达其基因。最常见的慢病毒是人类免疫缺陷病毒(HIV)，它利用其它病毒的包膜糖蛋白来靶向多种细胞类型。

慢病毒可以如下制备。克隆pCasES10(包含慢病毒转移质粒骨架)后，转染前一天在含有10％胎牛血清且不含抗生素的DMEM中，将低传代(p＝5)的HEK293FT接种到T-75烧瓶中，以达到50％融合。20小时后，将培养基更换为OptiMEM(无血清)培养基，并在4小时后完成转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒转染细胞：5μg pMD2.G(VSV-g假型)和7.5μg psPAX2(gag/pol/rev/tat)。转染可在4mL OptiMEM中使用阳离子脂质递送剂(50μl Lipofectamine 2000和100ul Plus试剂)进行。6小时后，将培养基更换为含有10％胎牛血清的不含抗生素的DMEM。这些方法在细胞培养过程中使用血清，但优选无血清方法。

慢病毒可以如下纯化。48小时后收获病毒上清液。首先清除上清液的碎片，并通过0.45μm低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm的速度旋转2小时。将病毒沉淀在4℃下重悬于50μl DMEM中过夜。然后将它们等分并立即在-80℃下冷冻。

在另一实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体。在另一个实施例中，一种基于马传染性贫血病毒的慢病毒基因治疗载体，其表达血管抑制蛋白内皮抑素和血管抑素，其预期通过视网膜下注射递送。在另一个实施例中，考虑使用自失活慢病毒载体。

系统的任何RNA，例如NLS-gRNA或编码Cas9的mRNA，可以以RNA的形式递送。编码Cas9的mRNA可以使用体外转录来生成。例如，Cas9 mRNA可以使用包含以下元件的PCR盒来合成：T7启动子、任选的kozak序列(GCCACC)、核酸酶序列和3'UTR(如来自β珠蛋白-polyA尾的3'UTR)。该盒可用于T7聚合酶的转录。引导多核苷酸(例如，gRNA)还可以使用包含T7启动子、然后是序列“GG”和引导多核苷酸序列的盒进行体外转录。

为了增强表达并降低可能的毒性，可以修饰Cas9序列和/或引导核酸以包含一种或多种修饰的核苷，例如使用假-U或5-甲基-C。

一些实施例中的公开内容包括修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。通过本公开的碱基编辑器、组合物和方法将修饰引入细胞可以使得细胞和细胞的后代被改变，以改善生物制品(如抗体、淀粉、酒精或其它所需的细胞输出物)的生产。通过本公开的方法将修饰引入细胞可以使得细胞和细胞的后代包括改变所生产的生物制品的改变。

该系统可以包含一种或多种不同的载体。在一方面，Cas9经密码子优化以在期望细胞类型、优选地真核细胞、优选地哺乳动物细胞或人细胞中表达。

通常，密码子优化是指通过用在该宿主细胞的基因中更常用或最常用的密码子替换天然序列的至少一个密码子(例如，约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子)，同时维持天然氨基酸序列，来修饰核酸序列以增强目的宿主细胞中表达的过程。不同的物种对特定氨基酸的某些密码子表现出特定的偏倚。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关，而信使RNA的翻译效率又被认为取决于待翻译密码子的特性以及特定转移RNA(tRNA)分子的可用性等。细胞中所选tRNA的优势通常反映了肽合成中最常用的密码子。因此，可以基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。密码子使用表很容易获得，例如，可在www.kazusa.orjp/codon/(2002年7月9日访问)上的“密码子使用数据库”中获得，并且这些表可以以多种方式进行修改。参见，Nakamura,Y.等人“Codon usage tabulated from the international DNAsequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可用的，如Gene Forge(Aptagen；Jacobus,Pa.)也是可用的。在一些实施例中，编码经工程化的核酸酶的序列中的一个或多个密码子(例如，1、2、3、4、5、10、15、20、25、50或更多个，或所有密码子)与特定氨基酸最常用的密码子对应。

包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293细胞，以及包装逆转录病毒的psi.2细胞或PA317细胞。基因疗法中使用的病毒载体通常由将核酸载体包装到病毒颗粒中的生产者细胞系产生。载体通常含有包装和随后整合到宿主中所需的最小病毒序列，其它病毒序列被待表达的多核苷酸的表达盒所替代。缺失的病毒功能通常由包装细胞系反式提供。例如，用于基因疗法的AAV载体通常仅具有来自AAV基因组的ITR序列，这些序列是包装和整合到宿主基因组中所必需的。病毒DNA可以被包装在细胞系中，该细胞系含有编码其它AAV基因的辅助质粒，即rep和cap，但缺少ITR序列。该细胞系也可以感染腺病毒作为辅助。辅助病毒可以促进AAV载体的复制和来自辅助质粒的AAV基因的表达。在一些情况下，由于缺乏ITR序列，辅助质粒并没有大量包装。可以通过例如热处理来减少腺病毒的污染，腺病毒对热处理比AAV更敏感。

药物组合物

本公开的其他方面涉及包含基因编辑系统(例如，包含本文所描述的NLS-gRNA)的药物组合物。如本文所用，术语“药物组合物”是指调配用于药物用途的组合物。在一些实施例中，药物组合物进一步包含药学上可接受的载剂。在一些实施例中，药物组合物包含另外的药剂(例如，用于特异性递送、增加半衰期或其他治疗化合物)。

如本文所用，术语“药学上可接受的载剂”意指药学上可接受的材料、组合物或媒剂，如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如，润滑剂、滑石粉、硬脂酸镁、硬脂酸钙或硬脂酸锌、或硬脂酸)，或溶剂封装材料，涉及将化合物从身体的一个部位(例如，递送部位)携带或运输到另一部位(例如，器官、组织或身体的一部分)。药学上可接受的载剂在与调配物的其它成分相容并且对受试者的组织无害的意义上是“可接受的”(例如，生理相容的、无菌的、生理pH等)。

可用作药学上可接受的载剂的材料的一些非限制性示例包括：(1)糖，诸如乳糖、葡萄糖和蔗糖；(2)淀粉，诸如玉米淀粉和马铃薯淀粉；(3)纤维素及其衍生物，诸如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素；(4)黄芪胶粉；(5)麦芽；(6)明胶；(7)润滑剂，诸如硬脂酸镁、十二烷基硫酸钠和滑石粉；(8)赋形剂，诸如可可脂和栓剂蜡；(9)油，诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油；(10)二醇，诸如丙二醇；(11)多元醇，诸如甘油、山梨醇、甘露醇和聚乙二醇(PEG)；(12)酯，诸如油酸乙酯和月桂酸乙酯；(13)琼脂；(14)缓冲剂，诸如氢氧化镁和氢氧化铝；(15)海藻酸；(16)无热原水；(17)等渗盐水；(18)林格氏液；(19)乙醇；(20)pH缓冲溶液；(21)聚酯、聚碳酸酯和/或聚酐；(22)膨松剂，诸如多肽和氨基酸(23)血清醇，诸如乙醇；以及(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、涂层剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于调配物中。术语如“赋形剂”、“载剂”、“药学上可接受的载剂”、“媒剂”等在本文中可互换使用。

药物组合物可包含一种或多种pH缓冲化合物以将调配物的pH维持在反映生理pH的预定水平，如在约5.0至约8.0的范围内。用于水性液体调配物中的pH缓冲化合物可以是氨基酸或氨基酸混合物，如组氨酸或氨基酸混合物(如组氨酸和甘氨酸)。替代性地，pH缓冲化合物优选是将调配物的pH维持在预定水平(如在约5.0至约8.0的范围内)且不螯合钙离子的药剂。此类pH缓冲化合物的说明性实例包括但不限于咪唑和乙酸根离子。pH缓冲化合物可以以适合将调配物的pH维持在预定水平的任何量存在。

药物组合物也可以包含一种或多种渗透调节剂，即，将制剂的渗透性质(例如，张力、渗透度和/或渗透压)调节至受体个体的血流和血细胞可接受的水平的化合物。渗透调节剂可以是不螯合钙离子的药剂。渗透调节剂可以是本领域技术人员已知或可获得的调节了调配物的渗透性质的任何化合物。本领域技术人员可以凭经验确定给定渗透调节剂用于本发明调配物的适用性。合适类型的渗透调节剂的说明性实例包括但不限于：盐类，如氯化钠和醋酸钠；糖类，如蔗糖、葡萄糖和甘露醇；氨基酸，如甘氨酸；以及这些药剂和/或药剂类型中的一种或多种的混合物。渗透调节剂可以以足以调节调配物的渗透性质的任何浓度存在。

在一些实施例中，药物组合物被调配用于递送至受试者，例如，用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于：局部、皮下、经皮、皮内、病灶内、关节内、腹膜内、膀胱内、经粘膜、齿龈、牙内、耳蜗内、经鼓膜、器官内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、瘤内、脑内和脑室内施用。

在一些实施例中，将本文所述的药物组合物局部施用至患病部位。在一些实施例中，本文所述的药物组合物通过注射、通过导管、通过栓剂或通过植入物施用于受试者，该植入物是多孔、无孔或凝胶状材料，包括膜(如硅橡胶膜)或纤维。

在其它实施例中，本文所述的药物组合物在控释系统中递送。在一个实施例中，可以使用泵(参见，例如，Langer,1990,Science 249:1527-1533；Sefton,1989,CRCCrit.Ref.Biomed.Eng.14:201；Buchwald等人,1980,Surgery 88:507；Saudek等人,1989,N.Engl.J.Med.321:574)。在另一个实施例中，可以使用聚合材料。(参见，例如，MedicalApplications of Controlled Release(Langer和Wise编，CRC Press,Boca Raton,Fla.,1974)；Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen和Ball编，Wiley,New York,1984)；Ranger和Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61。也参见Levy等人,1985,Science 228:190；During等人,1989,Ann.Neurol.25:351；Howard等人,1989,J.Neurosurg.71:105)。讨论了其他控释系统，例如，在上述的Langer中。

在一些实施例中，根据例程程序将药物组合物调配为适于静脉内或皮下施用于受试者(例如，人)的组合物。在一些实施例中，用于通过注射施用的药物组合物是用作增溶剂和局部麻醉剂(如利多卡因(lignocaine))的无菌等渗溶液，以缓解注射部位的疼痛。一般地，将成分分开或混合在一起以单位剂型提供，例如，作为在气密封容器中的干燥冻干粉或无水浓缩剂，该气密封容器诸如指示活性剂的量的安瓿或小药囊。在通过输注施用药物时，可以用含有无菌药用级水或盐水的输注瓶分配。当通过注射施用药物组合物时，可以提供无菌注射用水或盐水的安瓿，使得可以在施用之前混合成分。

用于全身施用的药物组合物可以为液体，例如无菌盐水、乳酸林格氏溶液或汉克氏溶液。另外，药物组合物可以是固体形式并在使用前立即重新溶解或悬浮。还考虑了冻干形式。药物组合物可以包含在脂质颗粒或囊泡(如脂质体或微晶)内，其也适用于肠胃外施用。该颗粒可以具有任何合适的结构，如单层或多层，只要其中包含组合物即可。化合物可以被包埋在含有融合脂质二油酰基磷脂酰乙醇胺(DOPE)、低水平(5至10mol％)阳离子脂质的“稳定的质粒-脂质颗粒”(SPLP)中，并通过聚乙二醇(PEG)涂层进行稳定化(Zhang Y.P.等人,Gene Ther.1999,6:1438-47)。带正电荷的脂质如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”对于此类颗粒和囊泡是特别优选的。此类脂质颗粒的制备是众所周知的。参见，例如，美国专利号4,880,635；4,906,477；4,911,928；4,917,951；4,920,016；和4,921,757；其中的每一个均通过引用并入本文。

例如，本文所述的药物组合物可以作为单位剂量施用或包装。当涉及本公开的药物组合物使用时，术语“单位剂量”是指适合作为用于受试者的单位剂量的物理离散单位，每个单位含有经计算可产生与所需的稀释剂(即，载剂或媒剂)相关的所需治疗效果的预定量的活性物质。

此外，药物组合物可以作为药物试剂盒提供，其包含(a)含有冻干形式的本发明化合物的容器以及(b)含有药学上可接受的稀释剂(例如，用于复溶或稀释本发明的冻干化合物的无菌稀释剂)的第二容器。任选地，与此类容器相关联的可以是呈监管药品或生物制品的制造、使用或销售的政府机构规定的形式的通知，该通知反映了制造、使用或销售机构获得的用于人类施用的批准。

在另一方面，包括含有可用于治疗上述疾病的材料的制品。在一些实施例中，该制品包含容器和标签。合适的容器包含例如瓶子、小瓶、注射器和试管。容器可以由各种材料如玻璃或塑料形成。在一些实施例中，容器容纳有效治疗本文所述疾病的组合物并且可以具有无菌进入端口。例如，容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。组合物中的活性剂是本发明的化合物。在一些实施例中，容器上的标签或与容器相关的标签表明该组合物用于治疗所选择的疾病。制品可以进一步包括第二容器，该第二容器包括药学上可接受的缓冲液，诸如磷酸盐-缓冲盐水、林格氏溶液或葡萄糖溶液。制品可以进一步包括从商业和用户的观点来看所需的其它材料，包括其它缓冲剂、稀释剂、过滤器、针、注射器和带有使用说明的包装插页。

在一些实施例中，CRISPR系统(例如，包含本文所描述的Cas9)作为药物组合物的一部分提供。在一些实施例中，药物组合物包含本文所提供的任何融合蛋白(例如，包括本文所描述的包含LubCas9的核碱基编辑器)。在一些实施例中，药物组合物包含本文所提供的复合物中的任一者。在一些实施例中，药物组合物包含核糖核蛋白复合物，该核糖核蛋白复合物包含与gRNA和阳离子脂质形成复合物的RNA引导的核酸酶(例如，Cas9)。在一些实施例中，药物组合物包含gRNA、核酸可编程DNA结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种另外的治疗活性物质。

试剂盒

在一个方面，本文所描述的NLS-gRNA可以通过含有公开在上述方法和组合物中的要素中的任何一种或多种的试剂盒来提供和/或产生。例如，试剂盒可以包括NLS-gRNA、连接酶和合适的缓冲试剂。

在一些实施例中，试剂盒还包含核碱基编辑器。

在一些实施例中，试剂盒包含用于在利用本文所述的一种或多种元件的方法中使用的一种或多种试剂。试剂可以在任何合适的容器中提供。例如，试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式提供，或者以需要在使用前加入一种或多种其他组分的形式提供(例如，以浓缩物或冻干形式)。缓冲液可以是任何缓冲液，包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中，缓冲液是碱性的。在一些实施例中，缓冲液的pH为约7至约10。在一些实施例中，试剂盒包含与用于插入到载体中的引导序列对应的一种或多种寡核苷酸，以便可操作地连接引导序列和调节元件。在一些实施例中，试剂盒包含同源重组模板多核苷酸。

本文提及的所有出版物、专利申请、专利和其它参考文献通过引用整体并入本文。另外，材料、方法和实例仅是说明性的并且不旨在进行限制。除非另外定义，否则本文中使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管类似或等效于本文所述的方法和材料的方法和材料可以用于实践或测试本发明，但本文描述了合适的方法和材料。

实例

以下实例描述了制备和实施本发明的优选模式中的一些。然而，应当理解，这些实例仅用于说明性目的，并不意味着限制本发明的范围。

实例1：NLS-gRNA的体外功效

此实例描述了本发明的缀合至NLS的示例性gRNA(NLS-gRNA)及其离体功效。通过固相肽合成来合成包含NLS序列和肽间隔子的肽。将合成的肽经由硫醇基团缀合至gRNA的3'端，如图1所示。如本领域普通技术人员将认识的，在本发明的实践中可以对接头和肽间隔子进行修饰。另外，可以对NLS、gRNA和/或接头的序列进行修饰。

利用编码基于CRISPR-Cas9的编辑器的mRNA来制备NLS-sgRNA并将其配制在脂质纳米颗粒中。将制剂以三种不同的mRNA:sgRNA比率(1:1、3:1和9:1)递送至肝细胞。如图2所示，与不具有NLS序列的gRNA相比，NLS-sgRNA表现出显著较高的碱基编辑效率。

此实例中的数据表明，CRISPR-Cas系统(例如，碱基编辑)可以通过使用缀合至NLS序列的gRNA来改进。不受特定理论的束缚，CRISPR-Cas系统的改进可以部分归因于NLS-gRNA更好地运输到细胞核，这保护gRNA免受胞质RNA酶的影响，增加gRNA的局部浓度，并且因此增加核糖核酸复合物(RNP)形成，并获得较高的细胞核输入率。此外，阳离子NLS序列可能部分地通过促进内体逃逸而发挥作用。

实例2：NLS-gRNA的体内功效

此实例说明，即使与经高度修饰的gRNA相比，NLS-gRNA也会显著改善体内碱基编辑。在此实例中，将spCas9 gRNA与包含spCas9切口酶和腺苷脱氨酶的腺嘌呤碱基编辑器(ABE)一起使用。

制备出具有各种修饰的gRNA。如图3A所示，经端修饰的(EM)gRNA包含6％修饰，重度mod1(HM1)gRNA包含47％修饰，重度mod2(HM2)gRNA包含60％修饰，并且重度mod3(HM3)gRNA包含88％修饰。NLS-gRNA包含缀合至gRNA的3'端的NLS序列以及6％修饰。制备出两种不同的mRNA，两者均编码同一碱基编辑器。与mRNA2相比，mRNA1是经密码子优化的，具有3'和5'UTR序列。将gRNA与mRNA1或者mRNA2的各种组合配制在LNP中，并以0.03mpk或0.01mpk的亚饱和剂量将其递送至小鼠，如图3B所示。

结果表明，与所有EM、HM1、HM2或HM3 gRNA相比，NLS-gRNA表现出较高的碱基编辑功效。特别地，即使在超低剂量(0.01mpk)下，对于NLS-gRNA，碱基编辑也是可见的，并且显著高于经重度修饰的(HM1、HM2和HM3)gRNA。另外，将NLS-gRNA与效力较低的mRNA(mRNA2)结合使mRNA的质量得到补偿，而具有经端修饰的gRNA的mRNA2的碱基编辑效率为约5％，用NLS-gRNA替代gRNA会使碱基编辑效率提高到大于30％。

实例3：NLS-gRNA在非人灵长类动物(NHP)中的功效

此实例说明，在NHP中也观察到通过使用NLS-gRNA提高碱基编辑效率。在此实例中，将spCas9 gRNA与基于spCas9的碱基编辑器(ABE)一起使用。

如图4A所示，将各种gRNA和编码碱基编辑器的mRNA配制在脂质纳米颗粒中。将制剂以1.0mpk递送至NHP，并在肝脏中确定碱基编辑效率。结果表明，具有mRNA1的NLS-gRNA(g5-BVN)和具有mRNA1的HM3 gRNA(g4-BVB)表现出最高的碱基编辑效率，接着是g2-BVI、g3-BVV和g1-BVE。值得注意的是，与不具有NLS的相应的经端修饰的gRNA相比(分别与g1-BVE和g6-BG3IE相比)，具有端修饰的NLS-gRNA(g1-BVN和g7-BG3IN)表现出大于两倍的碱基编辑效率。

接下来，在NHP中进行毒理学研究。为了评估临床病理学，测量丙氨酸转氨酶(ALT)和天冬氨酸转氨酶(AST)水平。较高水平的ALT和AST与肝脏损伤相关。如图4B所示，对于所有测试制品，在给药后24小时观察到AST和/或ALT的最小至轻微增加。值得注意的是，包含具有端修饰的NLS-gRNA的g5-BVN表现出最低的AST和ALT增加。另外，没有观察到临床病理参数的其他显著变化。

总体来说，此实例中的数据说明，NLS-gRNA改善NHP中的CRISPR-Cas系统(例如，碱基编辑效率)，同时降低毒性。

实例4：NLS-gRNA在saCas9中的应用

此实例说明，NLS-gRNA可以应用于各种Cas蛋白。在此特定实例中，使用金黄色葡萄球菌Cas9(saCas9)。值得注意的是，saCas9需要与前面实例中所示的spCas9编辑不相容的独特引导。

1a型糖原贮积病(GSD1a)是由葡萄糖-6-磷酸酶(G6PC)基因的突变引起的，这影响约80％的患有GSD1a的患者。R83C突变每年影响约900个被诊断患有1a型糖原贮积病(GSD1a)的美国患者。此突变为在G6PC蛋白的位置83(R83C)处引入半胱氨酸的单碱基取代。R83C的精确校正可能会恢复G6PC的表达并使葡萄糖代谢正常化。

制备gRNA并确定其纯度。研究中使用具有两种不同骨架化学性质的gRNA(sg029与sg093)。Sg093引导具有针对2'-OMe和硫代磷酸酯修饰的端修饰)。将各种gRNA和编码碱基编辑器mRNA以1:1的gRNA:mRNA比率配制在LNP中。向huG6PC-R83C杂合的成年转基因小鼠以1mpk的亚饱和剂量施用LNP制剂。

图5示出了碱基编辑效率与gRNA纯度之间的相关性，其中80％的纯度产生最大碱基编辑水平。另外，相对于不具有NLS序列的其他sg093引导，NLS-gRNA显示出与spCas9蛋白的效力的改进，说明可以跨多种Cas蛋白应用本发明的NLS-gRNA。

实例5：使用NLS-gRNA进行对GSD1a R83C小鼠的代谢缺陷的体内碱基编辑校正

在此实例中，将腺嘌呤碱基编辑器(ABE)的变体与NLS-gRNA结合使用，以校正GSD1a R83C小鼠的代谢缺陷。R83C突变在g6pc基因中引入单个G>A转化。如本文所描述，ABE与NLS-gRNA的组合实现基因组DNA中A至G的可编程转化，从而支持它们校正这一突变的效用。

G6PC gRNA序列与如下所示的G6PC靶序列的互补序列杂交：

CAGTATGGACACTGTCCAAA GAGAAT(SEQ ID NO:1)

上文对NNGRRT PAM序列(即，金黄色葡萄球菌Cas9(saCas9))标有下划线。gRNA序列如下：CAGUAUGGACACUGUCCAAA(SEQ ID NO:2)。

使用huG6PC杂合的含有针对1a型糖原贮积病(GSD1a)的R83C突变的转基因小鼠模型对以下进行体内评估：使用TadA变体MSP605、MSP824、MSP825、MSP680、MSP828和MSP829(参见表1)以及saCas9n的对腺苷脱氨酶碱基编辑器(ABE)的碱基编辑效率(图6B和图6C)。使用saCas9进行高效体内基因组编辑以及对saCas9 sgRNA支架的示例描述于以下：A.Ran等人(2015,Nature，第520卷，第186-191页)。

表1.腺苷脱氨酶碱基编辑器变体

图6A描绘了用于将碱基编辑器引入转基因小鼠中的体内工作流程。将携带碱基编辑器mRNA和NLS-gRNA的脂质纳米颗粒(LNP)以1mg/kg的剂量经由静脉(IV)注射对转基因小鼠给药。来自全肝脏提取物的下一代测序数据显示出针对R83C的显著校正(图6B和图6C)。TadA变体MSP828表露出对R83C突变的约40％精确校正，同时旁观者编辑较低。这一水平的突变预期将恢复葡萄糖稳态。

实例6：对GSD1a R83C小鼠的代谢缺陷的体内碱基编辑校正

GSD1a概述

如图7所示意性地描绘，(GSD1a)为由G6PC基因的突变引起的常染色体隐性病症。在白种人GSD1a患者中鉴定出的最常见的致病突变为R83C，位于酶的活性位点中并与G6P酶的失活相关联。G6P酶功能丧失可能导致危及生命的低血糖、癫痫发作以及甚至死亡。为了减轻低血糖，患者必须通过缓慢葡萄糖释放配方日夜维持对葡萄糖补充的严格且频繁的坚持。漏掉或延缓的一个剂量可能导致紧急低血糖。在许多并发症中，肿大的肝脏，尿酸、乳酸和脂质的积累在GSD1a患者中很常见。

所描述的碱基编辑器用于生成永久且可预测的单核苷酸取代的效用

R83C突变在g6pc基因中引入单个G>A转化。如本文所描述，腺嘌呤碱基编辑器(ABE)实现基因组DNA中A至G的可编程转化，从而支持它们校正这一突变的效用。如图8示意性所示，腺嘌呤碱基编辑器为融合蛋白，其含有连接至CRISPR-Cas酶的进化的TadA脱氨酶。碱基编辑器结合至与引导RNA互补(叠加在CRISPR-Cas9酶上)的靶DNA，并暴露一段单链DNA。脱氨酶将靶腺嘌呤转化为肌苷，并且Cas酶在相反的链上产生切口，然后修复该相反的链，完成碱基对转化。因此，点突变的直接修复具有恢复基因功能的潜力。

在此实例中，针对R83C的校正优化了用于g6pc基因中A>G转化的碱基编辑器。图9A中所示的是靶DNA序列(CCACCAGTATGGACACTGTCCAAAGAGAAT(SEQ ID NO:17))和针对GSD1aR83C突变的潜在氨基酸翻译(WWYPCQGFLI；SEQ ID NO:18)。要编辑的靶核碱基在位置12处通过双下划线表示。编辑窗口还包括可能的旁观者，在位置6处通过单下划线表示示出。可能导致同义转化的编辑示出在位置10处。

为了进行筛选，生成表达含有R83C突变的G6PC转基因的HEK293细胞系，并利用碱基编辑器mRNA和gRNA使该细胞系转染。通过高通量靶向扩增子下一代测序评定等位基因频率。变体1至5表示针对优化的靶校正而工程化的gRNA和碱基编辑器RNA的组合。对于R83C校正以及有限的旁观者编辑，变体5产生大约60％的靶向碱基编辑效率(图9B)。

小鼠体内疾病模型以及R83C单核苷酸突变的体内校正的演示

R83C碱基编辑的体内校正

为了验证针对体内R83C校正的碱基编辑效率，产生代替小鼠G6pc表达人G6PC-R83C转基因的新型GSD1a小鼠。已证实，huR83C纯合的小鼠表现出产后致死性，并且很少存活到断奶(21天)。在葡萄糖补充疗法中，与同窝对照相比，动物存活到至少3周龄，并显示出GSD1a特有的病理特征，诸如体重减轻、肝脏肿大、对G6P酶的显著抑制以及血清代谢异常(图7)。此表型与已发表的且临床的对人的报告一致。

对于体内实验，由于纯合小鼠的新生致死性，在huR83C杂合的转基因小鼠中测试经LNP介导的递送。图6A中的示意图描绘了体内工作流程，其中碱基编辑器mRNA和gRNA的脂质纳米颗粒或LNP复合制剂经由IV注射来给药。考虑到纯合小鼠的新生致死性，在出生后不久经由颞静脉施用LNP给药，并将活性与成年小鼠的活性进行比较。对全肝提取物的下一代测序(NGS)分析显示，成年中的碱基编辑效率大约为40％，并且新生鼠中的效率高达约60％，且效率的范围较广(图11A)。成年和新生鼠中的旁观者编辑仍然较低。(图11A)。

利用含有引导RNA和编码ABE的mRNA的脂质纳米颗粒(LNP)来治疗huR83C纯合的新生小鼠。发现，在没有葡萄糖疗法的情况下，经治疗的小鼠存活并正常生长至3周龄，而没有低血糖引起的癫痫发作。与huR83C杂合的同窝对照一致，经治疗的纯合huR83C小鼠在总肝脏提取物中显示出高达约60％的编辑效率(图11B)。因此证明，经LNP介导的R83C校正与纯合huR83C小鼠的存活相关联。

经由碱基编辑逆转GSD-1a病理以在体内校正R83C

3周时，经验证并证实，与对照相比，经治疗的纯合huR83C小鼠显示出适当的代谢功能，同时恢复接近正常的血清代谢物，包括葡萄糖、甘油三酯、胆固醇、乳酸和尿酸，如图12A中的较深色条形所示。此外，经LNP治疗的纯合huR83C小鼠中对G6PC活性的生化测定(如生化地且经由磷酸铅染色所评定)的结果与同窝对照的生化测定的结果一致。(图12A)。

肝肿大为GSD1a的另一临床呈现，并且主要是由肝脏中过量的糖原和脂质沉积引起的。为了评估碱基编辑后纯合huG6PC-R83C小鼠中肝肿大的程度，从3周龄新生小鼠收集肝脏切片并经由苏木精和伊红(H&E)以及油红O染色进行免疫组织化学分析(图12B)。在来自表现出可忽略不计的G6P酶活性的纯合小鼠的肝脏切片中显现显著的脂质沉积(重度H&E染色)和增大的肝细胞(图12B，中心图，H&E)，这与GSD-1a一致。在表现恢复的G6PC活性的经碱基编辑的纯合huG6PC-R83C小鼠(“HOM huR83C”，右图，图12B)的情况下，脂质沉积显著减少并且与对照(左图)一致，(图12B，脂质)，并且肝细胞大小的恢复是明显的。因此，免疫组织化学分析显示出LNP治疗的小鼠中正常的肝细胞大小和脂质沉积。(图12B)。总的来说，数据证明了碱基编辑校正R83C突变并逆转与GSD1a相关联的代谢缺陷和病理学的能力。此外，这些数据经由针对GsD-1a的碱基编辑对功能恢复和积极的临床结果增添进一步的支持。

如此实例中所描述，生成并验证在体外和体内实现对R83C的精确校正的新型腺嘌呤碱基编辑器和引导RNA。经LNP介导的对ABE和gRNA的递送产生显著的碱基编辑效率，即，高达约60％的碱基编辑效率，同时肝G6P酶活性和代谢功能的恢复与对照一致。

经由碱基编辑，单LNP剂量施用在24小时禁食挑战期间维持正常血糖

GSD-1a病理的标志性症状为空腹低血糖，其中血糖水平在几分钟内急剧下降。在huG6PC-R83C纯合的GSD-1a转基因小鼠中进行全面的概念验证研究，以测试动物在进行如本文所描述的碱基编辑治疗之后是否能够维持24小时(hr)禁食。在这一研究中，在经LNP治疗(1.5mpk)的GSD-1a动物中和健康对照中在24小时禁食周期后实现100％动物存活。此外，在对照小鼠中和24小时禁食前后的经治疗的小鼠中测量到正常空腹血糖水平，其维持水平高于低血糖治疗阈值(>60mg/dL)(图13)。

G6PC靶序列与碱基编辑器一起使用以校正R83C突变

除了实例1中描述的G6PC靶序列和引导RNA之外，可以与碱基编辑器结合使用以实现碱基编辑以校正如本文所描述的R83C突变的替代性G6PC靶序列包括表7中所示的那些。如图所示，靶序列包括适合使用的PAM和碱基编辑器类型，诸如本文所描述的IBE。在表7中的原型间隔子序列中，靶向“A”核苷酸(即，A8至A15)的位置以粗体/下划线示出。G6PC gRNA序列与表7中所示的G6PC靶序列的互补序列杂交。PAM序列(例如，SpCas9)在表7中标有下划线。

表7中指出的镶嵌式碱基编辑器(IBE)是指Cas9和TadA的结构，其具有其中脱氨酶结构域位于CRISPR-Cas蛋白(例如，Cas9)内部(嵌入其内侧)的架构。与其他碱基编辑器相比，IBE架构允许更广泛的潜在碱基编辑靶标，并且不受经适当定位的Cas9原型间隔子相邻基序序列的要求的限制。此类IBE表现出偏移的编辑窗口并表现出较高的编辑效率，从而允许在规范编辑窗口之外编辑靶标，同时降低DNA和RNA脱靶编辑频率。因此，IBE通过以下扩大潜在碱基编辑靶标的广度：扩展可以为任何用于靶向DNA的给定CRISPR-Cas蛋白创建的编辑窗口范围。通过将脱氨酶在不同策略位置插入CRISPR蛋白，可以重新定位脱氨酶的活性位点，使IBE能够在传统编辑窗口之外进行编辑。IBE架构在上文和以下中进行了描述：S.Haihua Chu等人，The CRISPR Journal，第4卷，第2期；2021年4月20日在线发布(DOI:10.1089/crispr.2020.0144)。

表7.原型间隔子+PAM序列(5'至3')，用于校正R83C突变，其中PAM序列带下划线

与表7中G6PC靶序列的互补序列杂交的gRNA序列如下(5'至3')：CCACCAGUAUGGACACUGUC(SEQ ID NO:19)；CACCAGUAUGGACACUGUCC(SEQ ID NO:20)；ACCAGUAUGGACACUGUCCA(SEQ ID NO:21)；CCAGUAUGGACACUGUCCAA(SEQ ID NO:22)；CAGUAUGGACACUGUCCAAA(SEQ ID NO:23)；AGUAUGGACACUGUCCAAAG(SEQ ID NO:24)；GUAUGGACACUGUCCAAAGA(SEQ ID NO:25)；以及UAUGGACACUGUCCAAAGAG(SEQ ID NO:26)。

用于本文所描述的产品、组合物和方法的原型间隔子和PAM序列为(5'至3')CAGTATGGACACTGTCCAAAGAGAAT(SEQ ID NO:17)，其中PAM序列(GAGAAT)带下划线。如上文所呈现的，与靶序列的互补序列杂交的gRNA序列为CAGUAUGGACACUGUCCAAA(3'PAM序列GAGAAT，如以上序列中所示)(SEQ ID NO:2)。

本文所描述的方法中使用的gRNA序列包含以下或由以下组成：

CACCAGUAUGGACACUGUCCAAAGUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU(SEQ ID NO:27)或

CCACCAGUAUGGACACUGUCCAAAGUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU(SEQ ID NO:28)。

在一些实施例中，本文所描述的方法中使用的gRNA序列包含一种或多种经修饰的核苷。下面提供了两个示例性序列：

sgRNA_096：23nt原型间隔子

mCsmAsmCsCAGUAUGGACACUGUCCAAAGUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAmUsmUsmUsU(SEQ ID NO:29)

sgRNA_097：34nt原型间隔子

mCsmCsmAsCCAGUAUGGACACUGUCCAAAGUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAmUsmUsmUsU(SEQ ID NO:30)。

在RNA修饰的上下文中，“s”指示前面的核苷酸具有3'硫代磷酸酯，并且“m”指示后面的核苷酸为2'OMe。例如，具有硫代磷酸酯和2'OMe的核苷酸具有形式“mNs”。当存在具有硫代磷酸酯和2'OMe两者的两个连续的核苷酸时，它被标示为“mNsmNs”。

实例7：材料和方法

下面阐述如上所描述的实例和实验中使用的材料和方法。

动物护理

所有动物研究均按照Taconic的排除菌群健康标准来进行。为了维持huG6PC-R83C小鼠的存活，葡萄糖疗法由以下组成：对每只小鼠，每日施用100至150ul的15％葡萄糖的皮下注射。利用碱基编辑器mRNA和gRNA进行LNP治疗之后，未对小鼠施用葡萄糖注射。

体内LNP给药工作流程

为了校正huG6PC-R83C纯合小鼠中的p.R83C突变，经由出生后不久的P1龄小鼠的颞静脉以1.5mpk(毫克每千克)剂量施用碱基编辑器mRNA和gRNA的LNP复合制剂。未对经LNP治疗的小鼠施用葡萄糖疗法。经LNP治疗的小鼠继续由相应的生母与同窝对照一起照顾，直至断奶(21天)，此时对它们进行表型分析。对于所有研究，将年龄匹配的野生型和杂合huG6PC-R83C同窝仔用作对照。第21天，对从肝脏采集的基因组DNA、生长特性以及血清和肝脏标志物进行分析。

脂质纳米颗粒(LNP)制剂

将碱基编辑器(编码碱基编辑器的mRNA)和引导RNA以1:1的重量比共同封装在脂质纳米颗粒中。LNP是通过将pH为3.0的RNA的水溶液与含有以下四种脂质成分的乙醇溶液快速混合而产生的：可电离脂质、DSPC、胆固醇和经脂质锚定的PEG。使用来自PrecisionNanosystems的台式微流体装置来混合两种溶液。混合之后，在4℃针对1x TBS(Sigma-Aldrich，目录号94158)将制剂透析过夜。随后使用100K MWCO Amicon Ultra离心管(Millipore Sigma，目录号UFC910096)来将它们浓缩，并利用0.2微米过滤器(Pall公司，目录号4602)将其过滤。使用Quant-iT Ribogreen(ThermoFisher Scientific，目录号R11491)来确定总RNA浓度；通过使用Malvern Panalytical Zetasizer来确定颗粒大小。

下一代测序(NGS)

使用下一代测序(NGS)来确定来自经LNP治疗的动物的全肝脏提取物的基因组DNA中经碱基编辑的等位基因的频率。LNP治疗之后，对小鼠实施安乐死，并取出整个肝脏并在液氮中速冻。使用Geno/Grinder 2010(Ops Diagnostics,Lebanon,NJ,USA)来将冷冻小鼠肝脏研磨为粉末形式，并根据制造商的说明使用快速提取裂解缓冲液从肝脏粉末中分离基因组DNA。将基因组DNA直接用于随后的PCR扩增步骤，以使用以下引物对来产生含有huG6PC外显子2的约170个核苷酸的片段：正向引物GGGCATTAAACTCCTTTGGG(SEQ ID NO:31)和反向引物AGTCTCACAGGTTACAGGGA(SEQ ID NO:32)。添加NGS衔接子，并根据制造商的说明使用Illumina MiSeq仪器对所得扩增子进行测序。

血清代谢物

为了测量血清代谢物，从R83C人源化转基因小鼠收集血液。然后从全血中分开并提取出血清，随后将血清用于代谢物测定。为了相关且全面的研究后评定，对血清葡萄糖、血清胆固醇和血清甘油三酯中的全部进行分析。分别使用ThermoFisher Scientific(Waltham,MA,USA)、Infinity葡萄糖液体稳定试剂(目录号：TR15421)和Infinity胆固醇液体稳定试剂(目录号：TR13421)来测量血清葡萄糖和血清胆固醇。使用来自Sigma-Aldrich(St.Louis,MO,USA)的血清甘油三酯定量试剂盒(目录号：MAK266)来测量血清甘油三酯。根据制造商说明(Thermo Fisher Scientific(Waltham,MA,USA)使用尿酸液体稳定试剂来测量尿酸。使用来自BioAssay Systems(Hayward,CA,USA)的EnzyFluo L-乳酸测定试剂盒来分析血清乳酸。

对小鼠的空腹血糖分析涉及在食物剥夺后的24小时之前和之后经由尾静脉进行血液采样。使用HemoCue Glucose 201系统(HemoCue America,CA,USA)来测量血糖水平。

针对纯合huG6PC-R83C小鼠的Kaplan-Meier存活估计

生成Kaplan-Meier存活曲线以估计huG6PC-R83C纯合的新生转基因小鼠的存活，该新生转基因小鼠是在经由ABE mRNA进行碱基编辑之后的(青绿色)，或者是未经治疗的(灰色，图14)。使用以下引物经由对基因组尾DNA的PCR分析来对新生小鼠进行基因分型：通用正向引物(5'-ACCTACTGATGATGCACCTTTGATCAATAGAT-3'(SEQ ID NO:59))、小鼠特异性反向引物(5'-CATCACCCCTCGGGATGGTTCTT-3'(SEQ ID NO:60))、人特异性反向引物1(5'-CAGCCCAGAATCCCAACCACAAAAT-3'(SEQ ID NO:61))和人特异性反向引物2(5'-AGACCAGCTCGACTTGGGATGG-3'(SEQ ID NO:62))。针对huG6PC-R83C纯合的转基因小鼠观察到存活。未经治疗的小鼠要么死产(n＝6)，要么在8小时(n＝6)以及24小时(n＝1)时死亡。施用15％葡萄糖注射将存活时间延长至32小时(n＝5)、48小时(n＝2)以及56小时(n＝2)。所有huG6PC-R83C纯合的经ABE治疗的小鼠均存活至研究终止的3周时。

葡萄糖-6-磷酸酶-α活性测定

如Lei,K.-J.等人,1996,Nature Genetics,13(2):203-9所述进行肝脏微粒体分离和微粒体磷酸水解酶测定。Arnaotova等人的测定方法(2021,Mol.Therapy.,第29卷，第4期)描述如下：“Glucose-6-phosphatase dependent substrate transport in theglycogen storage disease type-1a mouse.Nat.Genet.13,203-209)。在磷酸水解酶测定中，将含有50mM二甲胂酸钠缓冲液(pH 6.5)、2mM EDTA、10mM 6-磷酸葡萄糖(G6P)和适量微粒体制剂的反应混合物(50uL)在30℃孵育10分钟。通过将完整膜在0.2％脱氧胆酸盐中在4℃孵育20分钟来制备破裂的微粒体膜。通过在37℃预温育pH 5的破碎的微粒体制剂持续10分钟以使酸不稳定的G6P酶-α失活来估计非特异性磷酸酶活性。一个单位的G6P酶-α活性表示每mg微粒体蛋白每分钟水解一nmol的G6P。针对微粒体G6P酶-α测定的定量下级为2个单位”。

对G6P酶-α的酶组织化学分析如以下中所描述来进行：Lee,Y.M.、Jun,H.S.Pan,C.-J.、Lin,S.R.、Wilson,L.H.、Mansfield,B.C.和Chou,J.Y.(2012).通过基因疗法预防肝样腺瘤及纠正Ia型小鼠糖原贮积病的代谢异常(Prevention of hepatocyellularadenoma and correction of metabolic abnormalities in murine glycogen storagedisease type Ia by gene therapy).Hepatology 56,1719-1729。如在Arnaotova等人的(2021,Mol.Therapy.,第29卷，第4期)中所描述，将10μm厚的肝脏组织切片在含有40mMTris-马来酸盐(pH 6.5)、10mM G6P、300mM蔗糖和3.6mM硝酸铅的溶液中在室温孵育10min。冲洗之后，将肝脏切片在0.09％硫化铵溶液中在室温孵育2min，并且所捕获的磷酸铅在转化为棕色硫化铅后视觉化。

免疫组织化学

如以下中所描述来进行免疫组织化学程序：Arnaotova等人,2021,Mol.Therapy.,第29卷，第4期。简单来说，按照标准程序对保存在10％中性缓冲福尔马林中的肝脏切片进行H&E染色，并对冷冻保存的经最佳切割温度化合物(OCT)包埋的肝脏切片进行油红O染色。使用具有Axiocam 506相机的Imager A2m显微镜和Zen 2.6软件(Carl Zeiss,WhitePlains,NY,USA)使经染色的切片视觉化。

实例8：NLS促进引导RNA的核输入

在此实例中，评估核定位信号对引导RNA的核输入的影响。

简单来说，利用Cy5.5染料来荧光标记融合至核定位信号(NLS)肽的gRNA(图15A)和不具有NLS的同源对照gRNA(图15B)。利用未经修饰和经NLS修饰的gRNA来对人肝细胞进行脂质体转染，并在脂质体转染后24和48小时通过显微镜测量荧光。使用NucBlue染色剂将核包膜复染成蓝色以进行定量(图15C)。

结果表明，与未缀合至NLS肽的gRNA(图15D)相比，当缀合至NLS肽(图15E)时，gRNA更高效地定位至细胞核。

如图15F所示对相对平均荧光强度(MFI)进行定量。结果表面，虽然单独利用ABE8.8观察到的MFI与经PBS处理的背景荧光是相当的，但具有gRNA的ABE 8.8表现出荧光增加至约300MFI单位。然而，当将gRNA缀合至NLS时，增加的荧光为约500MFI单位。虽然单独的gRNA表现出约300MFI单位的荧光，但添加NLS缀合的gRNA导致约550MFI单位的增加的荧光。

总体来说，来自这一研究的结果表明，当缀合至NLS时，gRNA有效地定位至细胞核。

实例9：NLS-gRNA在小鼠的肝脏中表现出高效力基因编辑

在此实例中，在被施用低剂量的NLS gRNA的huG6PC-R83C纯合小鼠的肝脏中检查基因编辑的效力。

简单来说，使用如先前在实例7中描述的方法，经由出生后不久的P1龄小鼠的颞静脉，以0.25mpk(毫克每千克)剂量的亚饱和剂量施用具有1型端修饰(EM1)的NLS-gRNA以校正huG6PC-R83C纯合小鼠中的p.R83C突变。发现当缀合至3'末端时，NLS缀合物与saCas9效应子相容(图16)。在此实例中，还并行地测试经5％端修饰的gRNA和/或经25％重度修饰的saHM03 gRNA。下面并且在图17A中提供了序列。

表8.示例性经端修饰和重度修饰的gRNA

如图17B中的结果所示，相对于经端修饰的gRNA或经重度修饰的saHM03的小于5％，NLS-gRNA表现出大于10％的A至G碱基编辑。

总体来说，结果表明，相对于经端修饰的gRNA，NLS-gRNA的效力获得大于2倍的提升。结果证明，NLS-gRNA实现高效力基因编辑。

其他实施例

根据前面的描述，显而易见的是，可以对如本文所描述的实施例进行变化和修改，以适用于各种用途和条件。此类实施例也在以下权利要求的范围内。

在本文中的变量的任何定义中对要素的列表的详述包含作为任何单个要素或所列要素的组合(或子组合)的变量的定义。针对本文的实施例的详述包含作为任何单个实施例或与任何其它实施例或其部分的组合的实施例。

本说明书中所提到的所有公开、专利和专利申请均通过相同的程度引用结合在此，如同特定且单独地指示每个单独的公开、专利或专利申请是通过引用并入的。在没有任何另外指示的情况下，本说明书中提到的出版物、专利和专利申请通过引用以其整体并入本文。

等同物和范围

本领域中的技术人员仅使用常规实验将认识到或能够确定本文所描述的本发明具体实施例的许多等同物。本发明的范围不旨在限于上述说明，而是如随附权利要求书中所述。

Claims

1.一种引导RNA(gRNA)，其包含通过接头连接至所述gRNA的核定位信号(NLS)，其中所述接头包含缀合至所述gRNA的3'端或5'端的半胱氨酸残基。

2.根据权利要求1所述的gRNA，其中所述gRNA包含一个或多个修饰。

3.根据权利要求2所述的gRNA，其中一个或多个修饰为2'-OMe、2'-氟基或硫代磷酸酯键。

4.根据权利要求2或3所述的gRNA，其中所述gRNA包含所述3'端处和/或所述5'端处的一个或多个修饰。

5.根据权利要求4所述的gRNA，其中所述一个或多个修饰出现在距所述gRNA的所述3'端1、2、3、4和/或5个核苷酸处。

6.根据权利要求2至5中任一项所述的gRNA，其中所述一个或多个修饰出现在距所述gRNA的所述5'端1、2、3、4和/或5个核苷酸处。

7.根据权利要求2至6中任一项所述的gRNA，其中gRNA的超过40％、50％、60％、70％或80％的核苷酸是经修饰的。

8.根据前述权利要求中任一项所述的gRNA，其中所述NLS衍生自猿猴病毒40(SV40)。

9.根据权利要求8所述的gRNA，其中所述NLS包含KKKRKV(SEQ ID NO:57)的氨基酸序列。

10.根据前述权利要求中任一项所述的gRNA，其中所述接头进一步包含肽间隔子。

11.根据权利要求10所述的gRNA，其中所述肽间隔子包含KRTADGSEFESP(SEQ ID NO:58)的氨基酸序列。

12.根据前述权利要求中任一项所述的gRNA，其中所述接头进一步包含将所述gRNA缀合至所述肽间隔子或者缀合至所述NLS的化学部分。

13.根据权利要求12所述的gRNA，其中所述化学部分共价附接至所述肽间隔子或所述NLS氨基酸序列的N末端，和/或所述gRNA的所述3'端。

14.根据权利要求12或13所述的gRNA，其中所述化学部分共价附接至所述肽间隔子或所述NLS的半胱氨酸残基。

15.根据权利要求12至14中任一项所述的gRNA，其中所述化学部分包含马来酰亚胺-硫醇加合物。

16.根据前述权利要求中任一项所述的gRNA，其中与不具有所述NLS的gRNA相比，包含所述NLS的所述gRNA提高碱基编辑效率。

17.根据前述权利要求中任一项所述的gRNA，其中所述gRNA为单引导RNA(sgRNA)、tracrRNA或crRNA。

18.根据前述权利要求中任一项所述的gRNA，其中所述gRNA包含SaCas9骨架序列。

19.根据权利要求18所述的gRNA，其中当结合至SaCas9或其变体时，所述gRNA对核酸序列5'-NNGRRT-3'或5'-GAGAAT-3'具有原型间隔子相邻基序(PAM)特异性。

20.根据前述权利要求中任一项所述的gRNA，其中所述gRNA包含核酸序列：5'-CAGUAUGGACACUGUCCAAA-3'(SEQ ID NO:2)。

21.根据前述权利要求中任一项所述的gRNA，其中gRNA包含以下核酸序列中的一个或由以下核酸序列中的一个组成：

CACCAGUAUGGACACUGUCCAAAGUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU(SEQ ID NO:27)，以及

22.一种组合物，其包含与脂质纳米颗粒(LNP)缔合或封装在脂质纳米颗粒中的根据前述权利要求中任一项所述的gRNA。

23.根据权利要求22所述的组合物，其中所述LNP进一步包含编码碱基编辑器的mRNA；

(i)任选地其中所述碱基编辑器包含Cas9结构域和至少一个腺苷脱氨酶变体结构域，其中所述腺苷脱氨酶变体结构域包含以下氨基酸序列的氨基酸位置82处的甘氨酸(G)、氨基酸位置147处的苏氨酸(T)或天冬氨酸(D)、氨基酸位置154处的丝氨酸(S)，以及氨基酸位置36处的组氨酸(H)、氨基酸位置76处的酪氨酸、氨基酸位置149处的酪氨酸、氨基酸位置157处的赖氨酸(K)和氨基酸位置167处的天冬酰胺(N)中的一者或多者，其中腺苷脱氨酶与所述氨基酸序列具有至少约85％、90％、95％或98％同一性

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变；

(ii)任选地其中腺苷脱氨酶变体结构域包含关于SEQ ID NO:3的任何以下改变组合

a)I76Y+V82G+Y147T+Q154S；

b)L36H+V82G+Y147T+Q154S+N157K；

c)V82G+Y147D+F149Y+Q154S+D167N；

d)L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；

e)L36H+I76Y+V82G+Y147T+Q154S+N157K；

f)I76Y+V82G+Y147D+F149Y+Q154S+D167N；

g)Y147D+F149Y+D167N；

h)L36H；I76Y；V82G；Q154S；和N157K；

i)I76Y；V82G；Q154S；或者

j)L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N：

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变组合；

(iii)任选地其中所述腺苷脱氨酶变体包含SEQ ID NO:3的以下改变组合：I76Y+V82G+Y147D+F149Y+Q154S+D167N，或另一腺苷脱氨酶中的对应改变.

(iv)任选地其中所述Cas9结构域为金黄色葡萄球菌Cas9(SaCas9)；

(v)任选地其中所述mRNA编码碱基编辑器，所述碱基编辑器包含以下项、由其组成或基本上由其组成：氨基酸序列

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYGTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCDFYRMPRSVFNAQKKAQSSTNSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKL VPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGEGADKRTADGSEFESPKKKRKV(SEQ ID NO:65)，或与其至少85％、90％、95％或98％相同的氨基酸序列。

24.一种包含根据权利要求1至22中任一项所述的gRNA的组合物，所述组合物进一步包含核酸酶或编码所述核酸酶的mRNA。

25.一种包含根据权利要求1至22中任一项所述的gRNA的组合物，所述组合物进一步包含多核苷酸可编程DNA结合结构域或编码所述多核苷酸可编程DNA结合结构域的mRNA。

26.根据权利要求23至25中任一项所述的组合物，其中所述组合物以介于1:1与10:1之间的比率包含gRNA和编码所述核酸酶的mRNA。

27.根据权利要求26所述的组合物，其中所述组合物以1:1的比率包含gRNA和编码所述核酸酶的mRNA。

28.根据权利要求26所述的组合物，其中所述组合物以3:1的比率包含gRNA和编码所述核酸酶的mRNA。

29.根据权利要求20所述的组合物，其中所述组合物以9:1的比率包含gRNA和编码所述核酸酶的mRNA。

30.根据权利要求24至29中任一项所述的组合物，其中所述核酸酶或所述多核苷酸可编程DNA结合结构域为Cas蛋白。

31.根据权利要求30所述的组合物，其中所述Cas蛋白为Cas9。

32.根据权利要求30所述的组合物，其中所述Cas蛋白为Cpf1、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k或Cas13。

33.根据权利要求24至32中任一项所述的组合物，其中所述核酸酶或所述多核苷酸可编程DNA结合结构域为切口酶。

34.根据权利要求24至33中任一项所述的组合物，其中所述核酸酶或所述多核苷酸可编程DNA结合结构域是经修饰的。

35.根据权利要求24至34中任一项所述的组合物，其中所述核酸酶或所述多核苷酸可编程DNA结合结构域融合至异源多肽。

36.根据权利要求35所述的组合物，其中所述异源多肽为脱氨酶结构域。

37.一种复合物，其包含

(i)多核苷酸可编程DNA结合结构域和至少一个腺苷脱氨酶变体结构域，其中所述腺苷脱氨酶变体结构域包含以下氨基酸序列的氨基酸位置82处的甘氨酸(G)、氨基酸位置147处的苏氨酸(T)或天冬氨酸(D)、氨基酸位置154处的丝氨酸(S)，以及氨基酸位置36处的组氨酸(H)、氨基酸位置76处的酪氨酸、氨基酸位置149处的酪氨酸、氨基酸位置157处的赖氨酸(K)和氨基酸位置167处的天冬酰胺(N)中的一者或多者，其中腺苷脱氨酶与所述氨基酸序列具有至少约85％同一性

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变；以及

(ii)根据权利要求1至21中任一项所述的gRNA。

38.一种复合物，其包含

(i)多核苷酸可编程DNA结合结构域和至少一个腺苷脱氨酶变体结构域，其中所述腺苷脱氨酶变体结构域包含关于SEQ ID NO:3的任何以下改变组合

a)I76Y+V82G+Y147T+Q154S；

b)L36H+V82G+Y147T+Q154S+N157K；

c)V82G+Y147D+F149Y+Q154S+D167N；

d)L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；

e)L36H+I76Y+V82G+Y147T+Q154S+N157K；

f)I76Y+V82G+Y147D+F149Y+Q154S+D167N；

g)Y147D+F149Y+D167N；

h)L36H；I76Y；V82G；Q154S；和N157K；

i)I76Y；V82G；Q154S；或者

j)L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N：

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变组合；以及

(ii)根据权利要求1至21中任一项所述的gRNA。

39.根据权利要求37或38所述的复合物，其中所述腺苷脱氨酶与SEQ ID NO:3具有至少约90％或约95％同一性。

40.根据权利要求37或38所述的复合物，其中所述腺苷脱氨酶包含SEQ ID NO:3或基本上由其组成。

41.根据权利要求37至40中任一项所述的复合物，其中腺苷脱氨酶变体包含SEQ IDNO:3的以下改变组合：I76Y+V82G+Y147D+F149Y+Q154S+D167N，或另一腺苷脱氨酶中的对应改变。

42.根据权利要求37至41中任一项所述的复合物，其中所述多核苷酸可编程DNA结合结构域为Cas9。

43.根据权利要求42所述的复合物，其中所述Cas9包含核酸酶失活Cas9(dCas9)、Cas9切口酶(nCas9)或核酸酶活性Cas9。

44.根据权利要求42或43所述的复合物，其中所述Cas9为金黄色葡萄球菌Cas9(SaCas9)、嗜热链球菌1Cas9(St1Cas9)、酿脓链球菌Cas9(SpCas9)或其变体。

45.根据权利要求37至44中任一项所述的复合物，其中所述腺苷脱氨酶变体结构域位于所述多核苷酸可编程DNA结合结构域的内部。

46.一种药物组合物，其包含根据权利要求1至21中任一项所述的gRNA、根据权利要求22至36中任一项所述的组合物或根据权利要求37至45中任一项所述的复合物以及药学上可接受的载剂。

47.根据权利要求46所述的药物组合物，其用于制备用于治疗疾病或病症的药物。

48.一种包含工程化或非天然存在的CRISPR关联Cas(CRISPR-Cas)系统的组合物，所述组合物包含：

(a)Cas蛋白；

(b)gRNA，其包含通过接头连接至所述gRNA的核定位信号(NLS)；

其中所述接头包含缀合至所述gRNA的3'端的半胱氨酸残基；并且

其中所述gRNA能够与Cas蛋白形成复合物并将所述Cas蛋白靶向靶DNA。

49.根据权利要求48所述的组合物，其中所述Cas蛋白融合至异源多肽。

50.根据权利要求49所述的组合物，其中所述异源多肽为脱氨酶结构域。

51.根据权利要求50所述的组合物，其中脱氨酶变体结构域包含以下氨基酸序列的氨基酸位置82处的甘氨酸(G)、氨基酸位置147处的苏氨酸(T)或天冬氨酸(D)、氨基酸位置154处的丝氨酸(S)，以及氨基酸位置36处的组氨酸(H)、氨基酸位置76处的酪氨酸、氨基酸位置149处的酪氨酸、氨基酸位置157处的赖氨酸(K)和氨基酸位置167处的天冬酰胺(N)中的一者或多者，其中腺苷脱氨酶与所述氨基酸序列具有至少约85％同一性

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变。

52.根据权利要求51所述的组合物，其中所述脱氨酶变体结构域包含关于SEQ ID NO:3的任何以下改变组合

a)I76Y+V82G+Y147T+Q154S；

b)L36H+V82G+Y147T+Q154S+N157K；

c)V82G+Y147D+F149Y+Q154S+D167N；

d)L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N；

e)L36H+I76Y+V82G+Y147T+Q154S+N157K；

f)I76Y+V82G+Y147D+F149Y+Q154S+D167N；

g)Y147D+F149Y+D167N；

h)L36H；I76Y；V82G；Q154S；和N157K；

i)I76Y；V82G；Q154S；或者

j)L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N：

MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(SEQ ID NO:3)，或另一腺苷脱氨酶中的对应改变组合。

53.根据权利要求51或52所述的组合物，其中所述腺苷脱氨酶与SEQ ID NO:3具有至少约90％同一性。

54.根据权利要求51或52所述的组合物，其中所述腺苷脱氨酶与SEQ ID NO:3具有至少约95％同一性。

55.根据权利要求51或52所述的组合物，其中所述腺苷脱氨酶包含SEQ ID NO:3或基本上由其组成。

56.根据权利要求51或52所述的组合物，其中腺苷脱氨酶变体包含SEQ ID NO:3的以下改变组合：I76Y+V82G+Y147D+F149Y+Q154S+D167N，或另一腺苷脱氨酶中的对应改变。

57.根据权利要求51至56中任一项所述的组合物，其中Cas9蛋白为Cas9。

58.根据权利要求57所述的组合物，其中所述Cas9包含核酸酶失活Cas9(dCas9)、Cas9切口酶(nCas9)或核酸酶活性Cas9。

59.根据权利要求57或58所述的组合物，其中所述Cas9为金黄色葡萄球菌Cas9(SaCas9)、嗜热链球菌1Cas9(St1Cas9)、酿脓链球菌Cas9(SpCas9)或其变体。

60.根据权利要求51至59中任一项所述的组合物，其中所述gRNA包含核酸序列：5'-CAGUAUGGACACUGUCCAAA-3'(SEQ ID NO:2)。

61.根据权利要求51至60中任一项所述的组合物，其中所述腺苷脱氨酶变体结构域位于所述Cas蛋白内部。

62.根据权利要求51至61中任一项所述的组合物，其中所述gRNA包含一个或多个修饰。

63.根据权利要求62所述的组合物，其中一个或多个修饰为2'-OMe、2'-氟基或硫代磷酸酯键。

64.根据权利要求40至52中任一项所述的组合物，其中所述gRNA包含3'端处和/或5'端处的一个或多个修饰。

65.根据权利要求64所述的组合物，其中所述一个或多个修饰出现在距所述gRNA的所述3'端1、2、3、4和/或5个核苷酸处。

66.根据权利要求64所述的组合物，其中所述一个或多个修饰出现在距所述gRNA的所述5'端1、2、3、4和/或5个核苷酸处。

67.根据权利要求51至66中任一项所述的组合物，其中gRNA的超过40％、50％、60％、70％或80％的核苷酸是经修饰的。

68.根据权利要求51至67中任一项所述的组合物，其中所述NLS衍生自猿猴病毒40(SV40)。

69.根据权利要求68所述的组合物，其中所述NLS包含KKKRKV(SEQ ID NO:57)的氨基酸序列。

70.根据权利要求51至69中任一项所述的组合物，其中所述接头进一步包含肽间隔子。

71.根据权利要求70所述的组合物，其中所述肽间隔子包含KRTADGSEFESP(SEQ ID NO:58)的氨基酸序列。

72.根据权利要求51至71中任一项所述的组合物，其中所述接头进一步包含将所述gRNA缀合至所述肽间隔子或者至所述NLS的化学部分。

73.根据权利要求51至72中任一项所述的组合物，其中与不具有所述NLS的gRNA相比，包含所述NLS的所述gRNA提高碱基编辑效率。

74.根据权利要求40至73中任一项所述的组合物，其中所述gRNA为单引导RNA(sgRNA)、tracrRNA或crRNA。

75.一种治疗有此需要的受试者的遗传疾病的方法，所述方法包括向所述受试者施用根据权利要求1至21中任一项所述的gRNA、根据权利要求22至36中任一项所述的组合物、根据权利要求37至45中任一项所述的复合物、根据权利要求46至47中任一项所述的药物组合物或根据权利要求48至74中任一项所述的组合物。

76.一种治疗1a型糖原贮积病(GSD1a)的方法，所述方法包括向受试者施用根据权利要求1至21中任一项所述的或与表7中的G6PC靶序列的互补序列杂交的gRNA、根据权利要求22至36中任一项所述的组合物、根据权利要求37至45中任一项所述的复合物、根据权利要求46至47中任一项所述的药物组合物或根据权利要求51至74中任一项所述的组合物。

77.一种包含工程化或非天然存在的CRISPR关联Cas(CRISPR-Cas)系统的组合物，所述组合物包含：

(a)saCas9蛋白；

(b)腺苷脱氨酶变体，其融合至Cas9蛋白；

(c)gRNA，其包含通过接头连接至所述gRNA的核定位信号(NLS)；

其中所述gRNA能够与saCas9蛋白形成复合物并将所述saCas9蛋白靶向靶DNA

其中腺苷脱氨酶变体包含关于SEQ ID NO:3的V82G、Y147T/D、Q154S，以及

L36H、I76Y、F149Y、N157K和D167N中的一者或多者；并且

其中所述gRNA包含SEQ ID NO:2。

78.一种修饰细胞中的靶核酸的方法，所述方法包括：

使所述细胞与核酸酶和根据权利要求1至21中任一项所述的gRNA接触，其中

所述gRNA包含同向重复序列和能够与所述靶核酸杂交的间隔子序列，并且

其中Cas9蛋白能够结合至所述gRNA并引起对与所述gRNA互补的靶核酸序列的修饰。

79.一种改变真核细胞中靶核酸的表达的方法，所述方法包括：

sRNA包含同向重复序列和能够与所述靶核酸杂交的间隔子序列，并且

80.根据权利要求78或79所述的方法，其中所述方法导致基因的碱基编辑。

81.一种工程化的非天然存在的CRISPR-Cas系统，其包含根据权利要求1至21中任一项所述的gRNA。

82.一种制备包含核定位信号(NLS)的引导RNA的方法，所述方法包括：

使包含3'端处的胺基团的gRNA与包含NLS序列和N末端处的半胱氨酸残基的肽接触，使得gRNA缀合至所述NLS。

83.一种包含根据权利要求1至22中任一项所述的gRNA的组合物，其中所述组合物的核递送相对于包含不具有NLS的gRNA的组合物增加至约2至5倍。

84.根据权利要求83所述的组合物，其中所述gRNA包含与表8中的序列中的任一个具有70％、80％、90％、95％、99％或100％同一性的序列。

85.根据权利要求46至74或77中任一项所述的组合物，其中相对于不具有NLS的gRNA，基因编辑效率增加至约2至5倍。

86.根据权利要求76所述的方法，其中gRNA靶序列与SEQ ID NO:17具有70％、80％、90％、95％、99％或100％同一性。

87.根据权利要求76所述的方法，其中所述gRNA靶向选自肝脏、肾脏、大脑和心脏的器官中的一者或多者。

88.根据权利要求87所述的方法，其中所述gRNA靶向肝脏。