具体实施方式
1.概览
本文所述的本发明提供了包含DNA病毒蛋白壳的重组病毒颗粒和包含RNA,如单链RNA(而不是DNA)的“载体基因组”。“载体基因组”可能不是典型的病毒RNA,因为除了下文中描述的RNA包装信号(RPS)之外,它可能具有非常少的(如果有的话)病毒起源的序列。也就是说,DNA病毒通常或自然地将DNA病毒载体基因组衣壳化在蛋白壳内,而如本文所述的DNA病毒病毒颗粒的重组版本代替地衣壳化RNA。“RNA”或“核糖核酸”意指各自由磷酸、核糖、和碱基(A(腺嘌呤)、U(尿嘧啶)、G(鸟嘌呤)、或C(胞嘧啶))组成的一段核糖核苷酸,所述核糖核苷酸中的每一个都可经修饰(例如,碱基修饰、糖基修饰、磷酸修饰,例如,氧修饰、氟修饰、硫修饰、假修饰(例如,假尿苷修饰)、甲基化、封端(例如,5-封端))或未经修饰,以及任选地直接或间接地与各自由磷酸、脱氧核糖、和碱基(A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、或C(胞嘧啶))组成的一段脱氧核苷酸融合,所述脱氧核苷酸中的每一个都可经修饰(例如,碱基修饰、糖基修饰、磷酸修饰,例如,氧修饰、氟修饰、硫修饰、假修饰、甲基化、封端(例如,5-封端))或未经修饰,例如,RNA-DNA嵌合体、DNA-RNA-DNA嵌合体、RNA-DNA-RNA嵌合体。
这种重组DNA病毒病毒颗粒的典型(非限制性)实例是腺相关病毒(AAV),所述腺相关病毒通常/天然衣壳化单链DNA(ssDNA)载体基因组。这种DNA病毒的另一个非限制性实例是溶瘤DNA病毒,如溶瘤疱疹病毒(例如,单纯疱疹病毒或HSV)、溶瘤腺病毒、牛痘病毒(VACV)、水疱性口炎病毒(VSV)等。
本发明部分基于令人惊讶的发现,即以RNA形式的经转录的AAV ITR可以促进将涵盖这样的经转录的AAV ITR的经转录的RNA高效直接包装到传统AAV病毒颗粒中。
本文所述的本发明还部分基于令人惊讶的发现,即除了转录的AAV ITR(RNA),某些人工或异源RNA序列及其同源/对应/天然RNA结合蛋白也可以用作RNA包装信号(RPS)和RPS相互作用蛋白(RPSIP)的对以取代野生型包装信号序列和相互作用蛋白的对DNA病毒包装有用的功能,从而将RNA包装到DNA病毒蛋白壳中,所述DNA病毒蛋白壳通常/天然衣壳化DNA载体基因组。
例如,在野生型AAV中,DNA载体基因组5’和3’末端处的ITR序列包含可与Rep蛋白(如Rep68和Rep78)相互作用的序列元件,如Rep-结合元件(RBE)和RBE’。Rep蛋白结合ITR并促进包含这样的ITR序列元件的AAV ssDNA载体基因组包装到AAV病毒颗粒中。
发明人已经发现,通过将转录的ITR序列和/或人工或异源RNA序列,如MS2序列作为RPS提供给感兴趣的RNA序列(RSI),可以将所得的由RPS和RSI组成的RNA序列在天然结合MS2的MCP-细菌噬菌体来源的MS2外壳蛋白(MCP)的存在下有效地包装到AAV病毒蛋白壳中。人工RPS/RPSIP对-例如MS2/MCP-促进RNA包装到DNA病毒蛋白壳中的能力不依赖于DNA包装的天然ITR包装信号的存在,但可以独立于其起作用。在某种意义上,异源MS2-MCP对构成了RPS和RPSIP对的人工系统,所述系统可以有效地取代天然的ITR-Rep DNA包装系统,前者有效地促进了RNA包装。这种含RNA的DNA病毒,如AAV,在本文中可称为R-DNA病毒颗粒(或AAV情况下为RAAV),或重组R-DNA病毒颗粒(或AAV情况下为rRAAV)。
本发明的R-DNA病毒颗粒和RAAV病毒颗粒可用于将适当长度(例如,在各种DNA病毒或AAV的包装限度内)的任何转基因或感兴趣的基因(GOI)的RNA转录本或任何指导RNA递送到与DNA病毒蛋白壳或AAV病毒衣壳的向性相容的宿主细胞。如本文所用,重组DNA病毒颗粒如重组AAV载体、载体基因组和重组AAV病毒颗粒或重组AAV颗粒在本文中分别称为rRAAV载体(重组RNA腺相关病毒载体)、载体基因组和重组RAAV(rRAAV)病毒颗粒或rRAAV颗粒(“rRAAV载体”和“rRAAV颗粒”在本文中可互换使用)。
特别地,一方面,就像任何正常或传统AAV载体一样,受试的RAAV载体也可以由在携带DNA作为病毒遗传材料的任何野生型AAV中发现的相同衣壳中的任一个构成。因此,受试的RAAV载体具有源自AAV外壳的所有常见优势,如特异性/广泛向性和低免疫原性。
然而,另一方面,受试的RAAV载体的基因组由寿命短的RNA(例如mRNA)构成,从而导致在这样的RNA遗传材料上任何编码的基因产物的瞬时表达。
至少在一些情况下需要这种瞬时表达。例如,本发明的RAAV载体对于体内DNA基因编辑是有利的,因为有时间限制地暴露于RAAV编码的DNA基因编辑器(如CRISPR/Cas系统效应酶Cas9的mRNA编码序列及其融合到碱基编辑器的变体)可以实现有效的基因编辑。与传统的基于DNA的AAV载体表达的相同DNA基因编辑器的持续表达相比,这种瞬时表达的DNA编辑器还通过减少脱靶基因靶向和降低免疫原性来改善基因疗法的安全性谱。
此外,与传统的基于DNA的AAV载体相比,受试的RAAV载体可以携带更长的转基因,因为至少排除了表达由基于DNA的AAV载体编码的GOI所需的启动子(以及可能所需的任何非转录的增强子序列)。
尽管与传统的基于DNA的AAV载体相比,受试的rRAAV载体具有不同的序列元件和组织,但rRAAV病毒颗粒具有与传统的基于DNA的AAV载体相同的进入和细胞内运输过程。然而,进入宿主细胞细胞核后它们具有非常不同的命运。进入细胞核后,将受试的RAAV载体的mRNA基因组释放,随后转运到细胞质,导致翻译。众所周知,mRNA寿命通常很短,从几分钟到几天不等,并且最终经由许多细胞机制降解。然而,有限的mRNA寿命仍然使宿主细胞能够完成蛋白合成,通常不会因基于DNA的AAV载体中的第2链cDNA合成而延迟,并允许编码的蛋白快速发挥作用。
许多这样的RPS/RPSIP对可用于将RNA包装到DNA病毒中。发明人已经证明至少两个额外的这样的对,包括PP7序列和PP7细菌噬菌体外壳蛋白(PCP),以及com序列和噬菌体COM蛋白(COM),它们有效地包装包含异源RPS的RNA(即,分别为PP7和com序列)。所展示的三对RPS/RPSIP涵盖至少两个类别。与天然的病毒包装系统MS2/MCP和PP7/PCP不同,com/COM不是天然的病毒包装系统,而是已知在细菌噬菌体Mu mom基因的转录启动中发挥作用的转录调节因子。许多转录的经修饰的AAV ITR序列也可以用作本发明的RPS。
本文所述的本发明也不限于DNA病毒特定的血清型(例如,特定的AAV血清型)。发明人已经证明在每种情况下结合使用相容的RPSIP,将具有合适RPS的RNA序列高效包装到代表性AAV病毒(包括AAV5、AAV8、AAV9和AAV-DJ)中。
本文所述的本发明还基于以下发现:通过几种独立的方法可以降低将不希望的DNA包装到天然DNA病毒病毒颗粒中的效率。
在某些实施方式中,可通过增加转录感兴趣的RNA的DNA载体的总尺寸来降低不希望的DNA包装效率。例如,在通常用于AAV生产的三重转染方法中,感兴趣的基因(GOI)可以由第一质粒携带,所需的Rep和Cap蛋白由第二质粒上的rep和cap基因编码,而其他AAV包装所需的组分由第三质粒提供。根据本发明的这个实施方式,可以将有待包装到DNA病毒中的RNA序列从第一质粒转录,并且所述第一质粒的总大小可以通过以下人工增加:包括随机填充序列(例如内含子),如长度至少为约1kb、2kb、3kb、4kb、5kb或更长的填充序列,或将第一质粒的总大小增加1kb、2kb、3kb、4kb、5kb或更长的填充序列,例如增加到约6kb、7kb、8kb、9kb、10kb或更长的填充序列等。
在某些其他实施方式中,可通过抑制促进DNA包装的经典元件的功能来降低不希望的DNA包装效率。用于DNA包装的这种经典元件可以包括DNA序列(如促进DNA包装的AAVITR序列的元件,包括trs序列、RBE或RBE’序列或AAV的整个ITR序列);和/或参与DNA包装的蛋白元件,如与DNA序列相互作用的蛋白(如缺乏或具有减弱的trs-核酸内切酶活性的突变型Rep68或Rep 78蛋白)。
因此,本发明的一个方面提供了能够包装到DNA病毒病毒颗粒(如自然地包装DNA的DNA病毒)中的核糖核苷酸(RNA)序列,其中所述RNA序列包含:(1)感兴趣的RNA序列(RSI);和(2)RNA包装信号(RPS),所述RNA包装信号能够直接或间接地与RPS相互作用分子(例如,RPS相互作用蛋白或RPSIP)相互作用,例如结合,所述RPS相互作用分子促进所述RNA序列被包装到所述DNA病毒病毒颗粒中。
这样的RNA序列可以包含任何RSI(RNA),其可以由“感兴趣的基因”或“GOI”(DNA)编码。
如本文所用,“感兴趣的基因”或“GOI”包括蛋白或多肽的任何编码序列,包括内含子和外显子序列,和/或任何非翻译RNA或非编码RNA(ncRNA,如siRNA、piRNA、短发夹RNA或shRNA、微小RNA或miRNA或其前体,包括前体miRNA和初级miRNA、反义序列或寡核苷酸(ASO)、CRISPR/Cas的指导RNA或gRNA、rRNA、tRNA、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR等)的编码序列。
类似地,代表性(非限制性)RSI包括,例如,编码蛋白(例如,治疗性蛋白、抗原蛋白、或基因编辑蛋白如CRISPR/Cas效应酶(简称“Cas蛋白”)、ZFN蛋白、TALEN蛋白)的RNA,如mRNA,或非编码功能性RNA(如转运RNA(tRNA)、核糖体RNA(rRNA)、转移-信使RNA(tmRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、反义RNA或寡核苷酸(ASO)、微小RNA(miRNA)、RNA适配体、或CRISPR-Cas(例如,Cas9、Cas12、Cas13)系统的RNA组分,如单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)和tracr RNA)、或其前体,或RISC复合物或RNAi途径的RNA组分(如shRNA、miRNA、或siRNA)、调节RNA、Piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、长非编码RNA(lncRNA)(包括基因间lincRNA、内含子ncRNA、和有义/反义lncRNA)、长中居间/基因间非编码RNA(lincRNA)、增强子RNA、细菌小RNA(sRNA)、snRNA、exRNA、scaRNA、Xist、和HOTAIR及其前体。
本发明的RNA序列或GOI可以包含一个编码序列或多于一个(例如,2、3、4、5、6、7、8、9、10个或更多个)编码序列。编码序列的长度,或所有编码序列的组合长度,可以不超过可包装到特定或选择的DNA病毒病毒颗粒(例如,AAV病毒颗粒)中的RNA的最大长度,其可在一种特定的DNA病毒(例如,AAV)病毒颗粒和另一种之间不同。
在某些实施方式中,编码或对应于本发明的RNA序列的DNA序列、或所述DNA序列的反向互补序列具有减少的、减弱的、或基本上没有包装到DNA病毒病毒颗粒中的能力。例如,DNA序列可以编码本发明的RNA序列(例如,所述DNA序列具有本发明的RNA序列的反向互补序列)。DNA序列也可以对应于本发明的RNA序列,因为所述DNA序列在其他方面具有与本发明的RNA序列相同的核苷酸序列,除了所述DNA序列具有T而不是本发明的RNA序列中的U。无论如何,DNA序列或其反向互补序列可能缺乏用于包装到DNA病毒病毒颗粒中的功能性DNA包装信号,如用于AAV包装的AAV ITR,使得所述DNA序列或其反向互补序列(DNA)具有减少的、减弱的或基本上没有包装到DNA病毒病毒颗粒中的能力。
在某些实施方式中,本发明的RNA序列从DNA构建体转录,如从编码所述RNA序列的DNA质粒转录,其中所述DNA构建体/质粒在其骨架序列中包含填充序列(例如,内含子序列)以增强本发明的RNA序列的包装,和/或减少不希望的DNA包装到DNA病毒病毒颗粒中。例如,本发明的RNA序列可以从DNA构建体/质粒转录,并且所述DNA构建体/质粒的总大小可以通过以下人工增加:包括随机DNA填充序列,如长度至少为约1kb、2kb、3kb、4kb、5kb或更长的填充序列,或将所述DNA构建体/质粒的总大小增加1kb、2kb、3kb、4kb、5kb或更长的填充序列,例如,增加到约6kb、7kb、8kb、9kb、10kb或更长的填充序列等。填充序列可以位于包含本发明RNA序列编码序列的转录单元的上游(例如,紧邻上游)(参见图9A,其中>3kb的长填充序列紧靠驱动本发明示例性RNA序列转录的CAG启动子的上游插入)。在某些实施方式中,填充序列直接插入启动子的上游,所述启动子可操作地连接到本发明的RNA序列的密码子序列。任选地,在一些实施方式中,本发明的RNA序列的编码序列缺乏DNA病毒病毒颗粒的功能性天然DNA包装信号,如缺乏包装到AAV病毒颗粒中的功能性ITR序列。
在某些实施方式中,本发明的RNA序列能够包装到DNA病毒病毒颗粒中,所述DNA病毒病毒颗粒是AAV病毒颗粒。任何AAV病毒都可以用于包装本发明的RNA序列,包括但不限于AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV 11、AAV 12、AAV13、AAVrh10、AAVrh74、AAVhu32、AAVhu37、AAV-DJ、AAV PHP.eB、Anc80L65、Anc80L65AAP、AAVrh74、或7m8。
在某些实施方式中,本发明的RNA序列能够包装到DNA病毒病毒颗粒中,所述DNA病毒病毒颗粒是溶瘤病毒颗粒。示例性(非限制性)溶瘤病毒颗粒包括:溶瘤疱疹病毒(例如,单纯疱疹病毒或HSV)、溶瘤腺病毒、牛痘病毒(VACV)、水疱性口炎病毒(VSV)等。
本发明的RNA序列中RPS的位置可以是灵活的。在某些实施方式中,RPS位于或靠近本发明的RNA序列的5’末端、位于或靠近本发明的RNA序列的3’末端、或位于本发明的RNA序列的内部。在某些实施方式中,RPS位于或靠近感兴趣的RNA序列(RSI)的5’末端、位于或靠近感兴趣的RNA序列(RSI)的3’末端、或位于感兴趣的RNA序列的内部(mRNA的内含子内)。
在本发明的RNA序列中可以存在一个或多个RPS。在某些实施方式中,本发明的RNA序列包含相同或基本相同的多于一个(例如,1、2、3、或更多个)RPS。在某些实施方式中,本发明的RNA序列包含多于一个(例如,1、2、3、或更多个)RPS,并且其中至少两个彼此不同。
在本发明的RNA序列上存在多于一个RPS的情况下,所述多于一个RPS中的至少两个彼此相邻,如串联,两者之间具有任选的接头序列。任何两个相邻RPS序列之间的接头可以是相同或不同的。接头序列可以是随机化的RNA序列,且没有实质性的二级结构,没有已知的功能性序列或元件,和/或GC含量可以小于50%。接头的长度可以是1-1kb、1-500个碱基、1-200个碱基、1至约100个碱基、1至约60个碱基、约5至约55个碱基、约10至约30个碱基或约15-25个碱基之间的任何长度。
在某些实施方式中,本发明的RNA序列包含彼此相邻的3个RPS序列,由两个接头序列分开,每个接头序列独立地约20或约50个碱基。例如,三个相同的RPS序列中的前两个可以由20个碱基的接头分开,和/或所述RPS序列中的最后两个可以由51个碱基的接头分开。
在某些实施方式中,本发明的RNA序列包含多于一个RPS(例如,1、2、3、4、或5个RPS),其中所述多于一个RPS中的至少两个彼此不相邻。例如,RPS中的一个可以位于本发明的RNA序列的5’末端,而另一个RPS可以位于本发明的RNA序列的3’末端,并且任选的第3个RPS可以位于mRNA的内含子内,作为本发明的RNA序列内的RSI。第4和/或第5个RPS可以靠近或邻近第一、第二或第三个RPS中的任何一个。
在某些实施方式中,本发明的RNA序列包含彼此不相邻(例如,各自位于或靠近感兴趣的RNA序列(RSI)的一个末端)的至少两个(例如,两个或更多个)RPS序列。
在某些实施方式中,RPS包含转录的经修饰的AAV末端反向重复(ITR),其中所述转录的经修饰的AAV ITR(a)包含转录的功能性Rep结合元件(RBE),任选地进一步包含转录的功能性RBE’;并且(b)缺乏转录的末端解离位点(TRS)或转录的反向互补TRS(rcTRS),或两者。在某些实施方式中,转录的经修饰的AAV ITR进一步包含转录的D区序列(D序列或D’序列)。在某些实施方式中,RPS相互作用分子是Rep78、Rep68、Rep52、和/或Rep40。
如本文所用,“AAV病毒颗粒”包括包含腺相关病毒(AAV)(属于依赖性细小病毒属,其又属于细小病毒科)的任何野生型衣壳的病毒颗粒,以及其具有经修饰的序列和/或组织或宿主向性的工程化的或变体。
如本文所用,“内含子”是指DNA或RNA的非编码片段,通常通过剪接将所述非编码片段从转录的RNA中去除。然而,本发明的RNA序列可以包含内含子序列,如来自异源基因(关于感兴趣的基因或GOI的“异源”,其作为通过本发明的rRAAV病毒颗粒递送至宿主细胞的转基因表达)的内含子序列,以增强GOI的表达。本发明RNA序列中的这样的内含子序列可以通过剪接去除,也可以不去除。此外,这样的内含子序列可以进一步包含转录的增强子或其一部分,因为某些增强子可以位于编码DNA的内含子内。
如本文所用,“外显子”是指DNA或RNA的编码片段,外显子翻译成蛋白序列。然而,在某些实施方式中,本发明的RNA序列内的外显子序列可以编码GOI的一部分或全部,所述GOI作为通过本发明的rRAAV病毒颗粒递送至宿主细胞的转基因表达。在其他实施方式中,本发明的RNA序列内的外显子序列可以属于异源基因(关于GOI),并且这样的外显子的存在可以增强GOI的表达。
如本文所用,“编码序列”包括编码产物的DNA或RNA的多核苷酸序列,所述产物可以是(a)蛋白或多肽,或(2)蛋白或多肽以外的产物(例如,ncRNA,如siRNA、piRNA、短发夹RNA或shRNA、微小RNA或miRNA或其前体,包括前体miRNA和初级miRNA、反义序列或寡核苷酸(ASO)、CRISPR/Cas的指导RNA或gRNA、rRNA、tRNA、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR等)。
一旦RAAV病毒颗粒的RNA从AAV衣壳中分离并释放到细胞中,感兴趣的基因的核糖核苷酸编码序列就可以在细胞内进一步加工。处理编码序列可产生一种或多种RNA产物,如siRNA、miRNA和/或mRNA,所述产物可进一步翻译成一种或多种蛋白产物,或并入其它细胞机器,如RISC复合物或CRISPR/Cas效应酶(如2类、II型、V型或VI型效应酶)中。
如本文所用,术语“转录的”及其语法变体是指包含核糖核酸(RNA)核苷酸的核苷酸序列,所述核糖核酸核苷酸从DNA模板(例如,双链DNA和/或单链DNA)转录。转录的RNA分子可以对应于AAV ssDNA的正链或负链,其中转录的正链RNA从DNA模板的负链转录,并且转录的负链RNA从DNA模板的正链转录。在某些实施方式中,转录的RNA分子可以从双链DNA模板的有义或反义链转录。例如,视情况而定,当dsDNA序列仅由一条链的序列(如SEQ ID NO:1)表示时,使用dsDNA作为模板的转录的RNA可以具有与有义或反义链相同的序列。也就是说,由SEQ ID NO:1所示的从双链DNA转录的RNA可能具有与SEQ ID NO:1或其反向互补序列相同的序列,只是RNA中的U取代了DNA中的T。
本发明的转录的经修饰的AAV末端反向重复(ITR)序列是RNA序列(与在AAV病毒颗粒内衣壳化的传统的AAV病毒基因组中的单链DNA序列相反)。作为野生型AAV ITR DNA序列,转录的经修饰的AAV ITR序列(RNA)也支持本发明的RNA序列与AAV Rep蛋白的结合,并且因此能够支持将本发明的RNA序列直接包装到AAV病毒颗粒中。在某些实施方式中,转录的经修饰的ITR序列包含转录的Rep结合元件(RBE)(例如,转录的功能性RBE),和任选地转录的RBE’(例如,转录的功能性RBE’),用于Rep结合。在某些实施方式中,转录的经修饰的ITR序列支持或促进将RNA序列被包装或衣壳化到AAV病毒颗粒中。
在某些实施方式中,经修饰的ITR包含野生型RBE。
在某些实施方式中,经修饰的ITR包含功能性RBE,所述功能性RBE保留野生型RBE支持AAV包装的能力(如Rep结合)的至少约60%、70%、80%、90%、95%、100%或更多。在某些实施方式中,与野生型RBE相比,由于例如RBE的一个或多个核苷酸的插入、缺失、取代、和/或其他突变,功能性RBE包含多达约30%、25%、20%、15%、10%或5%的序列变异。
在某些实施方式中,从其转录出转录的经修饰的AAV ITR的经修饰的AAV ITR DNA模板作为ITR是有缺陷的,因为它缺乏对应的野生型AAV ITR的一个或多个功能,如能够在TRS(转录的末端解离位点,见下文)处切割。这可能是由于例如,缺乏功能性TRS。在一个实施方式中,完全缺失野生型TRS,使得经修饰的ITR没有TRS。在一个实施方式中,通过缺失、插入、取代和/或突变一个或多个核苷酸突变野生型TRS,使得其在AAV复制期间不再被Rep识别和切割。
在某些实施方式中,经修饰的AAV ITR DNA模板保留如本文所述的RBE或其功能变体,以及任选地RBE’或其功能变体。在某些实施方式中,RBE和/或RBE’在结合AAV Rep78/68方面是有功能的。
本发明的转录的经修饰的AAV末端反向重复(ITR)进一步缺乏转录的末端解离位点(TRS)或转录的反向互补TRS(rcTRS),或两者。在某些实施方式中,TRS位于经修饰的AAVITR的5’末端。在某些实施方式中,TRS位于D区序列和RBE之间。
在某些实施方式中,转录的经修饰的AAV ITR缺乏转录的TRS和转录的rcTRS两者。
如本文所用,“末端解离位点”或“TRS”是指在AAV复制期间通过AAV Rep蛋白识别并产生切口的单链AAV载体基因组(正链或负链)中的单链DNA序列。如本文所用,“反向互补TRS(rcTRS)”是指单链AAV载体基因组(正链或负链)中的单链DNA序列,所述单链DNA序列是TRS的反向互补序列。rcTRS与TRS配对以在A区茎的一个末端形成双链DNA区。参见图1A-1C。
在AAV2 ITR中,TRS包含TTGGC的序列,并且Rep切割位点位于两个T’之间;而rcTRS包含GCCAA的序列。一个TRS位于D区和A区序列的交界处,并且位于A区序列的5’最末端(例如,位于D区序列与RBE之间)。对于代表性AAV的5’和3’ITR多序列比对中的TRS和rcTRS,请参见图1B和1C。
如本文所用,“转录的TRS”是由TRS DNA模板转录产生的单链RNA序列。对于包含TTGGC的AAV2 TRS,转录的TRS包含GCCAA。
如本文所用,“转录的rcTRS”是由rcTRS DNA模板转录产生的单链RNA序列。对于包含GCCAA的AAV2 rcTRS,转录的rcTRS包含UUGGC。
因此,如果转录的经修饰的AAV ITR在GCCAA序列通常出现在对应的转录的野生型AAV2 ITR中的位置上没有GCCAA序列,例如,由于GCCAA序列的完全缺失,或由于所述GCCAA序列中的一个或多个核苷酸的插入、缺失、取代和/或其他突变,那么所述转录的经修饰的AAV ITR“缺乏转录的AAV2 TRS”。这可能是由具有TRS(TTGGC)的完全缺失的经修饰AAV ITR的转录引起的,或者由于野生型TRS中的一个或多个核苷酸的插入、缺失、取代和/或其他突变。
因此,在某些实施方式中,本发明的RNA序列或转录的经修饰的AAV ITR缺乏转录的功能性TRS。
类似地,如果转录的经修饰的AAV ITR在UUGGC序列通常出现在对应的转录的野生型AAV2 ITR中的位置上没有UUGGC序列,例如,由于GCCAA序列的完全缺失,或由于所述GCCAA序列中的一个或多个核苷酸的插入、缺失、取代和/或其他突变,那么所述转录的那个修饰的AAV ITR“缺乏转录的AAV2 rcTRS”。这可能是由具有rcTRS的完全缺失的经修饰AAVITR的转录引起的,或者由于野生型rcTRS中的一个或多个核苷酸的插入、缺失、取代和/或其他突变。
在某些实施方式中,转录的经修饰的AAV ITR进一步包含转录的D区序列(野生型AAV ITR中的D或D’序列)或突变体D区序列(例如,具有一个或多个核苷酸插入、缺失、取代、和/或其他突变的序列),所述突变体D区序列基本上保留了野生型D区序列的功能。在其他实施方式中,转录的经修饰的AAV ITR不包含转录的D区序列,或不包含突变体D区序列(例如,具有一个或多个核苷酸插入、缺失、取代、和/或其他突变的序列),所述突变体D区序列基本上保留了野生型D区序列的功能。
在某些实施方式中,转录的经修饰的AAV ITR包含转录的(功能性)D区序列。任选地,经修饰的AAV ITR DNA模板具有SEQ ID NO:3的核苷酸序列。任选地,转录的经修饰的AAV ITR包含SEQ ID NO:3的RNA等价物(即,所述RNA等价物具有与SEQ ID NO:3的DNA序列相同的碱基序列)。任选地,转录的经修饰的AAV ITR包含SEQ ID NO:3的反向互补序列的RNA等价物(即,所述RNA等价物具有与SEQ ID NO:3的反向互补序列的DNA序列相同的碱基序列)。
在某些实施方式中,转录的经修饰的AAV ITR缺乏转录的(功能性)D区序列。任选地,经修饰的AAV ITR DNA模板具有SEQ ID NO:2的核苷酸序列。任选地,转录的经修饰的AAV ITR包含SEQ ID NO:2的RNA等价物(即,所述RNA等价物具有与SEQ ID NO:2的DNA序列相同的碱基序列)。任选地,转录的经修饰的AAV ITR包含SEQ ID NO:2的反向互补序列的RNA等价物(即,所述RNA等价物具有与SEQ ID NO:2的反向互补序列的DNA序列相同的碱基序列)。
如本文所用,“D区序列”是指D序列或其反向互补序列D’序列。D区序列的位置取决于ITR采用“Flip”还是“Flop”构型。参见图1A-1C。例如,在野生型AAV2ITR(参见Srivastava等人,J.Viol.[病毒学杂志]45(2):555-564,1983的图2,通过引用并入本文)中,正链ssDNA序列从5’至3’包含命名为A、B、B’、C、C’、A’、D、...、D’、A、C、C、B、B’、和A’的回文序列片段,其中A:A’、B:B’、C:C’和D:D’是彼此的反向互补序列,并且可以形成碱基配对的茎序列(尽管D和D’序列在ssDNA AAV载体基因组中实际上可能不会彼此碱基配对)。正链的5’ITR的B:B’茎比C:C’茎更靠近序列的一个末端(5’末端),称为Flip ITR。正链的3’ITR的C:C’茎比B:B’茎更靠近序列的一个末端(3’末端),称为Flop ITR。
通过例如对转录的野生型D区序列的一个或多个核苷酸进行缺失、插入、取代和/或其他突变,本发明的转录的经修饰的AAV ITR序列可以缺乏功能性的转录的D区序列(D或D’序列)。
在某些实施方式中,本发明的RNA或转录的经修饰的AAV ITR序列包含突变的转录的D区序列和/或突变的转录的TRS序列。在某些实施方式中,本发明的RNA或转录的经修饰的AAV ITR序列不包含转录的D区序列和/或不包含转录的TRS/rcTRS序列。
在某些实施方式中,基于转录的野生型Flip ITR或野生型Flop ITR修饰转录的经修饰的AAV ITR。
在某些实施方式中,野生型Flip ITR或野生型Flop ITR来自AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV 11、AAV 12、AAV 13、AAVrh10、AAVrh74、AAVhu32、AAVhu37、AAV PHP.eB、Anc80L65、Anc80L65AAP、AAVrh74、或7m8。任选地,野生型Flop ITR具有SEQ ID NO:1的核苷酸序列。
在某些实施方式中,存在转录的D区序列,并且其不在RNA的3’末端50个核苷酸(例如,40nt、30nt、25nt、或20nt)内。
在某些实施方式中,存在转录的D区序列,并且其在RNA的3’末端50个核苷酸(例如,40nt、30nt、25nt、或20nt)内。
在某些实施方式中,转录的经修饰的AAV ITR在RNA的3’末端1000个核苷酸内。在某些实施方式中,转录的经修饰的AAV ITR在RNA的3’末端800个核苷酸内。在某些实施方式中,转录的经修饰的AAV ITR在RNA的3’末端500个核苷酸内。在某些实施方式中,转录的经修饰的AAV ITR在RNA的3’末端300个核苷酸内。在某些实施方式中,转录的经修饰的AAVITR在RNA的3’末端200个核苷酸内。
在某些实施方式中,转录的经修饰的AAV ITR在聚A序列、聚A信号序列(例如,AAUAAA)、或RNA转录终止序列(例如,组蛋白下游元件)的5’。
如本文所用,“聚A序列”或“聚A尾”是指腺嘌呤核糖核苷酸或腺苷一磷酸的串(例如,其中每个碱基是腺嘌呤的RNA的串)。这种聚A尾对于mRNA的核输出、翻译和稳定性很重要。聚A序列的长度可以在本发明的不同mRNA或RNA序列中变化,并且可以是聚A的约250个核苷酸、聚A的约230个核苷酸、聚A的约200个核苷酸、聚A的约180个核苷酸、聚A的约160个核苷酸、聚A的约140个核苷酸、聚A的约120个核苷酸、聚A的约100个核苷酸、或更少。
如本文所用,“聚A信号序列”是指位于最3’外显子下游的RNA序列(如AAUAAA),并由RNA切割复合物识别,所述复合物通过RNA聚合酶(如Pol II)切割新转录的RNA的3’末端序列,从而可以发生多聚腺苷酸化。然后,通过将腺苷一磷酸单元从ATP添加到RNA的新生切割的3’末端,聚腺苷酸聚合酶添加并延伸聚(A)尾。初始RNA切割通常由酶CPSF(切割/聚腺苷酸化特异性因子)催化,并发生在其结合位点-聚A信号序列(通常是转录的RNA上的AAUAAA)下游约10-30个核苷酸。位于/或紧接RNA切割位点5’处的序列经常(但不总是)为CA。由RNA切割复合物识别的聚A信号序列在真核细胞的不同群之间不同,大多数人聚腺苷酸化位点含有AAUAAA序列,尽管这种序列在植物和真菌mRNA中不太常见。此外,还存在与CPSF更弱结合的其他变体。由RNA切割复合物识别以使RNA切割以及随后的聚腺苷酸化的所有这些序列基序都在聚A信号序列的范围内。
还如本文所用,“聚A位点下游的转录的富含GU的区域”是指可以被其他蛋白(如切割刺激因子或CstF)用于增强CPSF与聚A信号序列的结合特异性的序列(例如,AAUAAA)。
在某些实施方式中,本发明的RNA序列进一步包含CFI(切割因子I)的识别序列,如哺乳动物中的一组UGUAA序列,即使AAUAAA聚A信号序列缺失,所述序列也可以募集CPSF。
如本文所用,“用于RNA转录终止的序列”包括存在于或靠近终止转录的转录RNA(如没有聚A尾的转录RNA)的3’末端的RNA序列基序。除后生动物复制依赖性组蛋白mRNA外,将几乎所有的真核mRNA聚腺苷酸化,其中mRNA加工发生在具有高度保守的茎环结构和下游大约20个核苷酸的富嘌呤区域的位点。这些是少数(如果不是唯一的)真核mRNA,它们缺乏聚(A)尾,以茎环结构结尾,随后是富含嘌呤的序列,称为组蛋白下游元件(HDE)或组蛋白3’UTR茎-环。HDE指导RNA在转录期间/之后被切割的位置,从而形成组蛋白mRNA的3′末端。HDE参与组蛋白mRNA的核质转运,以及细胞质中稳定性和翻译效率的调节。
在某些实施方式中,本发明的RNA序列进一步包含本发明的第二转录的经修饰的AAV ITR。在某些实施方式中,第二转录的经修饰的AAV ITR具有转录的功能性RBE序列,但缺乏第二转录的TRS或第二转录的rcTRS或两者;任选地,所述第二转录的经修饰的AAV ITR进一步包含或缺乏第二转录的D区序列。在某些实施方式中,第二转录的经修饰的AAV ITR包含第二转录的突变的D区序列和/或第二转录的突变的TRS序列。
在某些实施方式中,对于具有两个转录的经修饰的AAV ITR的本发明的RNA序列,所述转录的经修饰的AAV ITR和第二转录的经修饰的AAV ITR是相同的。
在某些实施方式中,对于具有两个转录的经修饰的AAV ITR的本发明的RNA序列,所述转录的经修饰的AAV ITR和第二转录修饰的AAV ITR是不同的。
在某些实施方式中,转录的经修饰的AAV ITR、第二转录的经修饰的AAV ITR(如果存在)包含对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的缺失、对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的突变、或对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的插入。
在某些实施方式中,对于具有两个转录的经修饰的AAV ITR的本发明的RNA序列,第二转录的经修饰的AAV ITR在RNA序列的5’末端1000个核苷酸、800个核苷酸、500个核苷酸、250个核苷酸、或150个核苷酸内。
在某些实施方式中,RPS包含MS2序列、PP7结合位点、或com结合位点,并且所述RPS相互作用分子包含能够直接或间接地与所述RPS相互作用,例如识别并结合的RPS相互作用蛋白(RPSIP),如对于MS2序列而言的噬菌体来源的MS2外壳蛋白(MCP)、对于PP7结合位点而言的PP7噬菌体外壳蛋白(PCP)、或对于com结合位点而言的噬菌体COM蛋白(COM)。这些RPS/RPSIP对的序列在说明书的序列部分中描述。
上文所述的一种或多种RPS序列中的任一种,包括转录的经修饰ITR序列种的任一种,以及MS2序列、PP7结合位点、和/或com结合位点中的任一种,单独地或组合地,在合适/相容的同源RPSIP存在下,可以促进将本发明的RNA序列包装到DNA病毒病毒颗粒中。
在某些实施方式中,RPSIP是DNA病毒病毒颗粒的病毒包装系统的蛋白组分,或者直接或间接与其相关联。例如,在一些实施方式中,RPSIP是DNA病毒的病毒包装系统的蛋白组分,如AAV的Rep78、Rep68、Rep52、和/或Rep40。例如,在一些实施方式中,RPSIP可以直接与DNA病毒的病毒包装系统的蛋白组分融合。AAV的病毒包装系统的示例性蛋白组分包括Rep蛋白(如腺相关病毒2(AAV2)的Rep78和/或Rep68)中的任一种、和/或组装激活蛋白(AAP)中的任一种。
在某些实施方式中,融合是N末端融合,其中RPSIP(如MCP、PCP或COM)在Rep68/78蛋白和/或AAP的N末端融合。
在某些实施方式中,融合是N末端融合,其中RPSIP(如MCP、PCP或COM)在Rep68/78蛋白和/或AAP的C末端融合。
在某些实施方式中,融合是直接融合,其间没有接头序列。
在某些实施方式中,融合是通过一个或多个接头序列,如可包括富含Gly和Ser的接头或GS接头的柔性肽接头。代表性GS接头包括Gly或Ser的1、2、3、4、5或更多个重复,如GS、GSS、GSSS、GSSSS及其重复(例如,(GSp)n,其中p是1-5之间的整数,并且n是1-20之间的整数)。一种典型的这样的GS接头是GS3接头或GS4接头。在某些实施方式中,p是3或4,并且n是1。
在某些实施方式中,本发明的RNA序列可以包含,但优选地不包含转录的DNA包装信号,例如,转录的野生型AAV ITR序列。例如,本发明的RNA序列可以包含转录的经修饰的AAV ITR序列,所述转录的经修饰的AAV ITR序列具有对应的转录的野生型AAV ITR序列的核苷酸的添加、缺失、和/或取代以降低所述DNA病毒病毒颗粒的DNA包装能力。
在某些实施方式中,本发明的RNA序列进一步包含以下中的一种或多种:(1)蛋白的编码序列(如mRNA,其编码治疗性蛋白或CRISPR/Cas效应酶(包括下文中描述的Cas效应子中的任一种,例如,Cas9或其变体,任选地与碱基编辑器融合)、非编码RNA(ncRNA)、或功能性RNA(如tRNA、核糖体RNA(rRNA)、RNAi试剂或其前体、siRNA、shRNA、miRNA或其前体,包括前体miRNA和初级miRNA、反义RNA(ASO)、piRNA、CRISPR-Cas系统的RNA组分,如指导RNA(或gRNA)、单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)、或tracr RNA)、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR等);(2)转录的转录增强子;(3)转录的内含子序列或外显子序列(如用于增强蛋白表达的序列);(4)5’UTR序列;(5)3’UTR序列;(6)聚A序列、或(转录的)聚腺苷酸化(聚A)信号序列,以及任选地,转录的聚A位点和所述聚A位点转录的下游富GU区;(7)转录后调控元件或序列,如转录的土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE)序列;和/或(8)转录终止序列(如组蛋白下游元件)。
在某些实施方式中,本发明的RNA序列包含位于转录后调控元件或序列的3’和聚A序列或聚A信号序列的5’的RPS。
例如,在某些实施方式中,本发明的RNA序列在5’至3’方向包含RSI;任选的转录的WPRE序列(可能存在也可能不存在);RPS(例如转录的经修饰的AAV ITR、MS2序列、PP7结合位点、或com结合位点);和聚A序列或聚A信号序列。
在某些实施方式中,本发明的RNA序列编码,或GOI包含蛋白(例如,荧光蛋白、治疗性蛋白、抗原蛋白、或基因编辑蛋白,如Cas蛋白、ZFN蛋白、TALEN蛋白)、酶(如Cre蛋白或CRISPR/Cas效应酶,例如,Cas9、Cas12、Cas13、或其变体)、结构蛋白、mRNA、非编码RNA(ncRNA)、siRNA、piRNA、短发夹RNA或shRNA、微小RNA(miRNA)或其前体(包括前体miRNA和初级miRNA)、核糖体RNA(rRNA)、反义序列或寡核苷酸(ASO)、CRISPR-Cas系统的RNA组分,包括指导RNA(或gRNA),如单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)、和tracr RNA、用于CRISPR/Cas效应酶的指导RNA或gRNA、rRNA、tRNA、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR。
本发明的RNA序列的总长度取决于AAV病毒颗粒的包装能力。大多数AAV病毒颗粒的包装能力为约4,700-5,200个核苷酸,但某些AAV病毒颗粒如AAV5颗粒可包装多达8,900个核苷酸。
因此,在某些实施方式中,要包装到AAV病毒颗粒中的本发明的RNA序列是长度小于约8,900个核苷酸的单链RNA(ssRNA)。
在某些实施方式中,RNA序列是长度小于约8,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约7,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约6,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约5,200个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约4,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约3,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度小于约2,000个核苷酸的ssRNA。
在某些实施方式中,RNA序列是长度为约4,700-5,200个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度为约4,700-5,000个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度为约4,700-4,800个核苷酸的ssRNA。在某些实施方式中,RNA序列是长度为约4,700个核苷酸的ssRNA。
本发明的另一方面提供了多核苷酸,所述多核苷酸包含编码本发明的RNA序列的(转录)盒;任选地,所述多核苷酸是DNA序列(例如,DNA质粒),所述DNA序列任选地在所述DNA质粒的骨架中包含填充序列,和/或任选地不包含功能性DNA包装信号,例如AAV ITR。
在某些实施方式中,包含盒的多核苷酸是编码本发明的RNA序列的DNA载体。这样的DNA载体和/或其盒可用于转录和产生本发明的用于进一步包装到例如AAV病毒颗粒中的RNA序列。
在某些实施方式中,多核苷酸进一步包含启动子,所述启动子可操作地连接到由盒编码的本发明的RNA序列并驱动其转录以产生本发明的RNA序列。
在某些实施方式中,启动子是遍在启动子。
在某些实施方式中,启动子是组织特异性启动子。
在某些实施方式中,启动子是组成型启动子。
在某些实施方式中,启动子是诱导型启动子。
在某些实施方式中,多核苷酸进一步包含增强由启动子驱动的RNA序列的转录的增强子。
本发明的另一方面提供了重组DNA病毒病毒颗粒,所述重组DNA病毒病毒颗粒包含包装在DNA病毒(如AAV病毒、或溶瘤病毒)的蛋白壳(如衣壳)中的RNA基因组(如,本发明的RNA序列或从本发明的多核苷酸转录的RNA序列)。
在某些实施方式中,DNA病毒是AAV,并且重组DNA病毒病毒颗粒是重组RNA腺相关病毒(rRAAV)颗粒,所述重组RNA腺相关病毒颗粒包含:(1)AAV衣壳;和(2)被包装在所述AAV衣壳内的本发明的RNA序列或从本发明的多核苷酸转录的RNA序列。
在某些实施方式中,AAV衣壳包含来自血清型AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、Anc80L65、Anc80L65AAP、或7m8的AAV的衣壳。
本发明的一个相关方面提供了重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体,所述群体包含本发明的多个重组DNA病毒病毒颗粒(例如,rRAAV颗粒),其中所述群体内的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)中的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多具有包装在其中的本发明的衣壳化RNA序列或从本发明的多核苷酸转录的RNA序列。
在某些实施方式中,重组病毒颗粒(例如,rRAAV颗粒)的群体包含至少1×104个病毒颗粒、至少2×104个病毒颗粒、至少5×104个病毒颗粒、至少1×105个病毒颗粒、至少2×105个病毒颗粒、至少5×105个病毒颗粒、至少1×106个病毒颗粒、至少2×106个病毒颗粒、至少5×106个病毒颗粒、至少1×107个病毒颗粒、至少2×107个病毒颗粒、至少5×107个病毒颗粒、至少1×108个病毒颗粒、至少2×108个病毒颗粒、至少5×108个病毒颗粒、至少1×109个病毒颗粒、至少2×109个病毒颗粒、至少5×109个病毒颗粒、至少1×1010个病毒颗粒、至少2×1010个病毒颗粒、至少5×1010个病毒颗粒、至少1×1011个病毒颗粒、至少2×1011个病毒颗粒、至少5×1011个病毒颗粒、至少1×1012个病毒颗粒、至少2×1012个病毒颗粒、至少5×1012个病毒颗粒、至少1×1013个病毒颗粒、至少2×1013个病毒颗粒、至少5×1013个病毒颗粒、至少1×1014个病毒颗粒、至少2×1014个病毒颗粒、至少5×1014个病毒颗粒、至少1×1015个病毒颗粒、至少2×1015个病毒颗粒、至少5×1015个病毒颗粒、至少1×1016个病毒颗粒、至少2×1016个病毒颗粒、或至少5×1016个病毒颗粒。
在某些实施方式中,重组病毒颗粒的群体内的至多50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、3%、2%、1%、0.1%、0.01%或更少将非RNA(例如DNA)衣壳化在病毒颗粒内。
本发明的另一方面提供了宿主细胞,所述宿主细胞包含本发明的RNA序列、本发明的多核苷酸、从本发明的多核苷酸转录的RNA序列、本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)、和/或本发明的重组DNA病毒病毒颗粒(例如,rAAV颗粒)的群体。
在某些实施方式中,宿主细胞进一步包含病毒包装系统,所述病毒包装系统促进本发明的RNA序列或从本发明的多核苷酸转录的RNA序列被包装到DNA病毒病毒颗粒中。
在某些实施方式中,病毒包装系统包含:(1)AAV rep基因(例如,Rep78、Rep68、Rep52、和/或Rep40的编码序列)和AAV cap基因(例如,VP1、VP2、和/或VP3、AAP、和/或MAAP的编码序列)或其表达产物,所述AAV rep和AAV cap基因处于驱动所述rep基因和cap基因的转录的一个或多个启动子的转录控制下;(2)AAV包装所需的一种或多种蛋白的一个或多个编码序列,例如腺病毒E2A、E4、和VA基因,或所述一种或多种蛋白;以及(3)RPS相互作用分子或其编码序列。
在某些实施方式中,病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码本发明的RNA序列的多核苷酸上或本发明的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码本发明的RNA序列的多核苷酸或本发明的多核苷酸的大小。在实施方式中,通过将填充序列(例如内含子)插入多核苷酸(例如DNA质粒)(的例如骨架)中来扩大编码本发明的RNA序列的多核苷酸或本发明的多核苷酸的大小。
在某些实施方式中,AAV rep基因、AAV cap基因和/或AAV包装所需的蛋白包含减弱或减少促进DNA包装到DNA病毒病毒颗粒中的能力的突变。
在某些实施方式中,DNA包装所需的Rep68/Rep 78蛋白包含突变,所述突变损害或减弱其trs-核酸内切酶活性。认为trs-核酸内切酶活性是在trs序列或位点上解离AAV复制(DNA)中间体所需的,这样在包装到AAV衣壳内之前,就可以解离AAV ssDNA的单个单元。
在某些实施方式中,trs-核酸内切酶突变在Rep78和Rep68蛋白的共有序列中包含Y156F突变。
在某些实施方式中,Rep78/Rep68蛋白包含KDE-mu突变(参见下面的序列部分中的序列)。
在某些实施方式中,Rep78/Rep68蛋白包含EKE-mu突变(参见下面的序列部分中的序列)。
在某些实施方式中,Rep78/Rep68蛋白包含选自Y156F突变、KDE-mu突变、和EKE-mu突变的两个或更多个突变。
在某些实施方式中,Rep68/Rep78来自具有血清型AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、Anc80L65、Anc80L65AAP、AAVrh74、或7m8的AAV中的任一种,并且具有Y156F突变、KDE-mu突变、和/或EKE-mu突变的对应的trs-核酸内切酶突变。
在某些实施方式中,宿主细胞进一步包含:(1)AAV rep基因和AAV cap基因的编码序列,所述AAV rep和AAV cap基因处于驱动所述rep基因和cap基因的转录的一个或多个启动子的转录控制下;以及(2)AAV包装所需的蛋白的编码序列,如腺病毒E2A、E4、和VA基因。
在某些实施方式中,宿主细胞是哺乳动物细胞,如HEK293细胞或其变体(例如,HEK293T细胞)、或昆虫细胞,如Sf9或Sf21细胞。
本发明的另一方面提供了生成本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)或重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体的方法,所述方法包括:a)培养本发明的宿主细胞足够的时间,以及b)收获所述重组DNA病毒病毒颗粒或所述重组DNA病毒病毒颗粒的群体。
在某些实施方式中,所述方法进一步包括分离或纯化重组DNA病毒病毒颗粒或重组DNA病毒病毒颗粒的群体。
本发明的另一方面提供了生成重组DNA病毒病毒颗粒(例如,rRAAV颗粒)或重组DNA病毒病毒颗粒的群体的方法,所述方法包括:a)使病毒包装系统(例如,AAV包装系统)与本发明的RNA序列或从本发明的多核苷酸转录的RNA序列接触,持续足以产生本发明的所述重组DNA病毒病毒颗粒或本发明的所述重组DNA病毒病毒颗粒的群体的时间段,以及b)收获本发明的所述重组DNA病毒病毒颗粒或本发明的所述重组DNA病毒病毒颗粒的群体;以及任选地,c)分离或纯化本发明的收获的重组DNA病毒病毒颗粒或本发明的重组DNA病毒病毒颗粒的群体。
在某些实施方式中,病毒包装系统(例如,AAV包装系统)包含:(1)用于组装用以包装所述RNA序列的所述DNA病毒病毒颗粒的蛋白壳的一种或多种蛋白(例如,用于组装AAV衣壳的VP1、VP2、和/或VP3)、或其一个或多个编码序列;(2)用于促进所述蛋白壳的组装和/或所述RNA序列被包装到所述DNA病毒病毒颗粒的蛋白壳中的一种或多种蛋白(例如,用于AAV包装的Rep78、Rep68、Rep52、和/或Rep40)、或其一个或多个编码序列(例如,腺病毒E2a、E4、和VA基因);以及(3)RPS相互作用分子或其编码序列。任选地,病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码本发明的RNA序列的多核苷酸上或本发明的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码本发明的RNA序列的多核苷酸或本发明的多核苷酸的大小。
本发明的另一方面提供了将本发明的RNA序列或从本发明的多核苷酸转录的RNA序列包装到DNA病毒病毒颗粒中的系统,所述系统包含:(1)用于组装用以包装所述RNA序列的所述DNA病毒病毒颗粒的蛋白壳的一种或多种蛋白(例如,用于组装AAV衣壳的VP1、VP2、和/或VP3)、或其一个或多个编码序列;(2)用于促进所述蛋白壳的组装和/或本发明的RNA序列被包装到所述DNA病毒病毒颗粒的蛋白壳中的一种或多种蛋白(例如,用于AAV包装的Rep78、Rep68、Rep52、和/或Rep40)、或其一个或多个编码序列(例如,腺病毒E2a、E4、和VA基因);以及(3)RPS相互作用分子或其编码序列。任选地,病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码本发明的RNA序列的多核苷酸上或本发明的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码本发明的RNA序列的多核苷酸或本发明的多核苷酸的大小。
本发明的另一方面提供了将感兴趣的RNA序列(RSI)递送至细胞、植物、或动物的方法,所述方法包括使所述细胞、植物、或动物与本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)、本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体、或通过本发明的方法产生的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)或重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体接触,其中所述GOI任选地由本发明的RNA序列编码。
本发明的另一方面提供了在有需要的受试者中诊断、预防、或治疗疾病或障碍的方法,所述方法包括向所述受试者施用治疗有效量或剂量的本发明的或通过本发明的方法产生的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体。
本发明的另一方面提供了本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)、本发明的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体、或通过本发明的方法产生的重组DNA病毒病毒颗粒(例如,rRAAV颗粒)或重组DNA病毒病毒颗粒(例如,rRAAV颗粒)的群体在制造用于诊断、预防、或治疗有需要的受试者的疾病或障碍的药物中的用途。
本发明的另一方面提供了融合蛋白或缀合物,所述融合蛋白或缀合物包含与DNA病毒的病毒包装系统的蛋白组分融合或缀合的本发明的RPSIP,其中所述RPSIP与本发明的RNA序列上的RPS相互作用/结合,以促进将所述RNA序列包装到DNA病毒中。
在某些实施方式中,RPS是MS2,并且RPSIP是MCP。
在某些实施方式中,RPS是PP7结合位点,并且RPSIP是PCP。
在某些实施方式中,RPS是com,并且RPSIP是噬菌体COM蛋白。
在某些实施方式中,融合物或缀合物包含多于一个RPSIP,所述RPSIP各自独立地与本发明的RNA序列上的一种或多种RPS结合。在某些实施方式中,多于一个RPSIP中的至少两个是相同的。在某些实施方式中,多于一个RPSIP中的至少两个是不同的。
在某些实施方式中,融合物或缀合物包含串联的两个MCP。
在某些实施方式中,DNA病毒的病毒包装系统的蛋白组分包含AAV的Rep蛋白,如所述AAV的Rep68或Rep78。
在某些实施方式中,Rep蛋白包含一个或多个突变,所述一个或多个突变损害或减弱trs-核酸内切酶活性。在某些实施方式中,突变包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。
在某些实施方式中,DNA病毒的病毒包装系统的蛋白组分包含组装激活蛋白(AAP)。
在某些实施方式中,将RPSIP与DNA病毒的病毒包装系统的蛋白组分(例如,Rep蛋白或AAP)直接融合。
在某些实施方式中,将RPSIP与DNA病毒的病毒包装系统的蛋白组分(例如,Rep蛋白或AAP)通过肽接头融合。
在某些实施方式中,肽接头是柔性接头,如含有Gly和Ser的接头。在某些实施方式中,含有Gly和Ser的接头包含GSn的1-20个重复(例如,1-5或1-3个重复),其中n是1、2、3、4、或5。在某些实施方式中,GSn接头是GS2、GS3、或GS4,具有1-4个(例如,2个)重复。在某些实施方式中,接头是GSSGSS。
在某些实施方式中,融合蛋白包含MCP和Rep,其中所述Rep任选地包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,MCP在Rep的N末端融合(MCP-Rep)。在某些实施方式中,与MCP融合的Rep包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,MCP-Rep融合物通过GSn接头,如GSSGSS连接。在某些实施方式中,MCP-Rep包含串联的两个MCP(例如,在两个MCP部分之间无任何接头)。在某些实施方式中,MCP在另一个GSn接头,如GSSGSS的C末端。
在某些实施方式中,融合蛋白包含PCP和Rep,其中所述Rep任选地包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,PCP在Rep的N末端融合(PCP-Rep)。在某些实施方式中,与PCP融合的Rep包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,PCP-Rep融合物通过GSn接头,如GSSGSS连接。在某些实施方式中,PCP-Rep包含串联的两个PCP(例如,在两个PCP部分之间无任何接头)。在某些实施方式中,PCP在另一个GSn接头,如GSSGSS的C末端。
在某些实施方式中,融合蛋白包含COM和Rep,其中所述Rep任选地包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,COM在Rep的N末端融合(COM-Rep)。在某些实施方式中,与COM融合的Rep包含Y156F突变、KDE-mu突变、和/或EKE-mu突变。在某些实施方式中,COM-Rep融合物通过GSn接头,如GSSGSS连接。在某些实施方式中,COM-Rep包含串联的两个COM(例如,在两个COM部分之间无任何接头)。在某些实施方式中,COM在另一个GSn接头,如GSSGSS的C末端。
在某些实施方式中,融合蛋白包含MCP和AAP。在某些实施方式中,MCP在AAP的N末端融合(MCP-AAP,或MA)。在某些实施方式中,MCP在AAP的C末端融合(AAP-MCP,或AM)。在某些实施方式中,MCP-AAP或AAP-MCP融合物通过GSn接头,如GSSGSS连接。在某些实施方式中,MCP-AAP融合物在另一个GSn接头,如GSSGSS的C末端。在某些实施方式中,AAP-MCP融合物在另一个GSn接头,如GSSGSS的N末端。
本发明的另一方面提供了多核苷酸,所述多核苷酸编码本发明的RPSIP与DNA病毒的病毒包装系统的蛋白组分(例如,AAP或Rep蛋白)之间的融合物中的任一种。
对于上文描述的本发明的一般方面,以下部分提供了本文所述的本发明的特定元件的额外的细节。预期每个特定元件能够与本发明的任何一个或多个额外的元件组合,即使没有明确列举元件的所有可能组合或排列。
2.AAV血清型
包装本发明的核糖多核苷酸的AAV颗粒可包含或衍生自任何天然或重组AAV血清型。
根据本披露,AAV颗粒可以利用或基于选自以下任何血清型及其变体中的任一种的血清型,包括但不限于:AAV1、AAV10、AAV106.1/hu.37、AAV11、AAV114.3/hu.40、AAV 12、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.1/hu.43、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV16.12/hu.l1、AAV16.3、AAV16.8/hu.10、AAV161.10/hu.60、AAV161.6/hu.61、AAVl-7/rh.48、AAVl-8/rh.49、AAV2、AAV2.5T、AAV2-15/rh.62、AAV223.1、AAV223.2、AAV223.4、AAV 223.5、AAV223.6、AAV223.7、AAV2-3/rh.61、AAV24.1、AAV2-4/rh.50、AAV2-5/rh.51、AAV27.3、AAV29.3/bb.l、AAV29.5/bb.2、AAV2G9、AAV-2-前体miRNA-101、AAV3、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-11/rh.53、AAV3-3、AAV33.12/hu.l7、AAV33.4/hu.l5、AAV33.8/hu.l6、AAV3-9/rh.52、AAV3a、AAV3b、AAV4、AAV4-19/rh.55、AAV42.12、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV4-4、AAV44.1、AAV44.2、AAV44.5、AAV46.2/hu.28、AAV46.6/hu.29、AAV4-8/r 11.64、AAV4-8/rh.64、AAV4-9/rh.54、AAV5、AAV52.1/hu.20、AAV52/hu.19、AAV5-22/rh.58、AAV5-3/rh.57、AAV54.1/hu.21、AAV54.2/hu.22、AAV54.4R/hu.27、AAV54.5/hu.23、AAV54.7/hu.24、AAV58.2/hu.25、AAV6、AAV6.1、AAV6.1.2、AAV6.2、AAV7、AAV7.2、AAV7.3/hu.7、AAV8、AAV-8b、AAV-8h、AAV9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAV A3.3、AAV A3.4、AAV A3.5、AAV A3.7、AAV-b、AAVC1、AAVC2、AAVC5、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5Rl、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAV-DJ、AAV-DJ8、AAVF3、AAVF5、AAV-h、AAVH-1/hu.l、AAVH2、AAVH-5/hu.3、AAVH6、AAVhE1.1、AAVhER1.14、AAVhErl.16、AAVhErl.18、AAVhER1.23、AAVhErl.35、AAVhErl.36、AAVhErl.5、AAVhErl.7、AAVhErl.8、AAVhEr2.16、AAVhEr2.29、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhEr2.4、AAVhEr3.1、AAVhu.l、AAVhu.10、AAVhu.ll、AAVhu.l、AAVhu.12、AAVhu.13、AAVhu.14/9、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.19、AAVhu.2、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.3、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.4、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44Rl、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48Rl、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.5、AAVhu.51、AAVhu.52、AAVhu.53、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.6、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.7、AAVhu.8、AAVhu.9、AAVhu.t19、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVLG-9/hu.39、AAV-LK01、AAV-LK02、AAVLK03、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK17、AAV-LK18、AAV-LK19、AAVN721-8/rh.43、AAV-PAEC、AAV-PAEC11、AAV-PAEC12、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAVpi.l、AAVpi.2、AAVpi.3、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.l3R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.2、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.2R、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.43、AAVrh.44、AAVrh.45、AAVrh.46、AAVrh.47、AAVrh.48、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.50、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.55、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.59、AAVrh.60、AAVrh.61、AAVrh.62、AAVrh.64、AAVrh.64Rl、AAVrh.64R2、AAVrh.65、AAVrh.67、AAVrh.68、AAVrh.69、AAVrh.70、AAVrh.72、AAVrh.73、AAVrh.74、AAVrh.8、AAVrh.8R、AAVrh8R、AAVrh8R A586R突变体、AAVrh8R R533A突变体、BAAV、BNP61 AAV、BNP62 AAV、BNP63 AAV、牛AAV、山羊AAV、日本AAV 10、真实型AAV(ttAAV)、UPENN AAV 10、AAV-LK16、AAAV、AAV改组100-1、AAV改组100-2、AAV改组100-3、AAV改组100-7、AAV改组10-2、AAV改组10-6、AAV改组10-8、AAV SM 100-10、AAV SM 100-3、AAV SM 10-1、AAV SM 10-2、和/或AAV SM 10-8。
在某些实施方式中,AAV血清型可包含AAV9序列中的突变,如Pulicherla等人描述的序列(Molecular Therapy[分子疗法]19(6):1070-1078,2011),如AAV9.9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84。
在某些实施方式中,AAV血清型可包含US 6,156,303中描述的序列,如AAV3B(US6,156,303中的SEQ ID NO:1和10)、AAV6(US 6,156,303中的SEQ ID NO:2、7和11)、AAV2(US6,156,303中的SEQ ID NO:3和8)、AAV3A(US 6,156,303中的SEQ ID NO:4和9)、或其衍生物。
在某些实施方式中,血清型可以是AAV-DJ或其变体,如Grimm等人所描述的AAVDJ8(或AAV-DJ8)(Journal of Virology[病毒学杂志]82(12):5887-5911,2008)。AAV-DJ8的氨基酸序列可包含两个或更多个突变以除去肝素结合结构域(HBD)。作为非限制性实例,US7,588,772中描述为SEQ ID NO:1的AAV-DJ序列可包含两个突变:(1)R587Q(氨基酸587处的Arg变为谷氨酰胺Gln),和(2)R590T。作为另一个非限制性实例,AAV-DJ序列可包含三个突变:(1)K406R,(2)R587Q,和(3)R590T。
在某些实施方式中,AAV血清型可包含WO 2015/121501中描述的序列,如真实型AAV(ttAAV)(WO 2015/121501中的SEQ ID NO:2)、所谓的UPenn AAV10(WO 2015/121501中的SEQ ID NO:8)、或所谓的日本AAV10(WO 2015/121501中的SEQ ID NO:9)、或其变体。
AAV衣壳血清型的选择或使用可能来自多种物种。在某些实施方式中,AAV可以是禽类AAV(aAAV)。aAAV血清型可包含US 9,238,800中描述的序列,如aAAV(US 9,238,800中的SEQ ID NO:1、2、4、6、8、10、12、和14)、或其变体。
在某些实施方式中,AAV可以是牛AAV(bAAV)。bAAV血清型可包含US 9,193,769中描述的序列,如bAAV(US 9,193,769中的SEQ ID NO:1和6)、或其变体。bAAV血清型可包含US7,427,396中描述的序列,如bAAV(US 7,427,396中的SEQ ID NO:5和6)、或其变体。
在某些实施方式中,AAV可以是山羊AAV。山羊AAV血清型可包含US 7,427,396中描述的序列,如山羊AAV(US 7,427,396中的SEQ ID NO:3)、或其变体。
在某些实施方式中,可以将AAV工程化为来自两种或更多种亲本血清型的杂合AAV。
在某些实施方式中,AAV可以是AAV2G9,其包含来自AAV2和AAV9的序列。AAV2G9AAV血清型可包含US 2016-0017005 A1中描述的序列。(通过引用并入本文)。
在某些实施方式中,AAV可以是由AAV9衣壳文库生成的血清型,其在氨基酸390-627(VP1编号)中具有突变,如Pulicherla等人(Molecular Therapy[分子疗法]19(6):1070-1078,2011,通过引用并入本文)所述。血清型以及对应的核苷酸和氨基酸取代可以是,但不限于:AAV9.1(G1594C;D532H)、AAV6.2(T1418A和T1436X;V473D和I479K)、AAV9.3(T1238A;F413Y)、AAV9.4(T1250C和A1617T;F417S)、AAV9.5(A1235G、A1314T、A1642G、C1760T;Q412R、T548A、A587V)、AAV9.6(T1231A;F411I)、AAV9.9(G1203A、G1785T、W595C)、AAV9.10(A1500G、T1676C;M559T)、AAV9.11(A1425T、A1702C、A1769T;T568P、Q590L)、AAV9.13(A1369C、A1720T;N457H、T574S)、AAV9.14(T1340A、T1362C、T1560C、G1713A;L447H)、AAV9.16(A1775T;Q592L)、AAV9.24(T1507C、T1521G;W503R)、AAV9.26(A1337G、A1769C;Y446C、Q590P)、AAV9.33(A1667C;D556A)、AAV9.34(A1534G、C1794T;N512D)、AAV9.35(A1289T、T1450A、C1494T、A1515T、C1794A、G1816A;Q430L、Y484N、N98K、V606I)、AAV9.40(A1694T、E565V)、AAV9.41(A1348T、T1362C;T450S)、AAV9.44(A1684C、A1701T、A1737G;N562H、K567N)、AAV9.45(A1492T、C1804T;N498Y、L602F)、AAV9.46(G1441C、T1525C、T1549G;G481R、W509R、L517V)、9.47(G1241A、G1358A、A1669G、C1745T;S414N、G453D、K557E、T582I)、AAV9.48(C1445T、A1736T;P482L、Q579L)、AAV9.50(A1638T、C1683T、T1805A;Q546H、L602H)、AAV9.53(G1301A、A1405C、C1664T、G1811T;R134Q、S469R、A555V、G604V)、AAV9.54(C1531A、T1609A;L511I、L537M)、AAV9.55(T1605A;F535L)、AAV9.58(C1475T、C1579A;T492I、H527N)、AAV.59(T1336C;Y446H)、AAV9.61(A1493T;N498I)、AAV9.64(C1531A、A1617T;L511I)、AAV9.65(C1335T、T1530C、C1568A;A523D)、AAV9.68(C1510A;P504T)、AAV9.80(G1441A,;G481R)、AAV9.83(C1402A、A1500T;P468T、E500D)、AAV9.87(T1464C、T1468C;S490P)、AAV9.90(A1196T;Y399F)、AAV9.91(T1316G、A1583T、C1782G、T1806C;L439R、K528I)、AAV9.93(A1273G、A1421G、A1638C、C1712T、G1732A、A1744T、A1832T;S425G、Q474R、Q546H、P571L、G578R、T582S、D611V)、AAV9.94(A1675T;M559L)和AAV9.95(T1605A;F535L)。
在某些实施方式中,AAV可以是包含至少一个AAV衣壳CD8+T-细胞表位的血清型。作为非限制性实施例,血清型可以是AAV1、AAV2或AAV 8。
在某些实施方式中,AAV可以是变体,如Deverman中描述的PHP.A或PHP.B(NatureBiotechnology.[自然生物技术]34(2):204-209,2016,通过引用并入本文)。
在某些实施方式中,AAV可以是由Deverman等人(Nature Biotechnology[自然生物技术]34(2):204-209,2016,通过引用并入本文)描述的基于Cre重组的AAV靶向进化(CREATE)生成的血清型。在某些实施方式中,与其他AAV血清型相比,以这种方式生成的AAV血清型具有改善的CNS转导和/或神经元和星形细胞向性。
在一些实施方式中,AAV血清型可以是在氨基酸588-589之间具有7个氨基酸插入的AAV9衍生物。这些7个氨基酸插入的非限制性实例包括PHP.A、PHP.B、PHP.B2、PHP.B3、PHP.N、PHP.S、G2A12、G2A15、G2A3、G2B4、和G2B5。
在某些实施方式中,AAV可以是选自SEQ ID NO:4,734-5,302和WO 2018/002719A1的表2中的任何血清型(通过引用并入本文)。在某些实施方式中,AAV可以由如WO 2018/002719 A1的SEQ ID NO:4,734-5,302中所述的序列、片段或变体(通过引用并入本文)编码。
在某些实施方式中,AAV VP1衣壳序列是以下中的一个:AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、Anc80L65、Anc80L65AAP、或7m8。
下面提供了上述代表性VP1衣壳的蛋白序列。
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEEVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDEDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNFQSSSTDPATGDVHAMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKNPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL(AAV1;SEQ ID NO:6)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(AAV2;SEQ ID NO:7)
MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAKTAPGKKGAVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMASGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVRGVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQARNWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFGKEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTGTVNHQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(AAV3A;SEQ ID NO:8)
MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAKTAPGKKRPVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMASGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQARNWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFGKEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTRTVNDQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(AAV3B;SEQ ID NO:9)
MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQQRLQGDTSFGGNLGRAVFQAKKRVLEPLGLVEQAGETAPGKKRPLIESPQQPDSSTGIGKKGKQPAKKKLVFEDETGAGDGPPEGSTSGAMSDDSEMRAAAGGAAVEGGQGADGVGNASGDWHCDSTWSEGHVTTTSTRTWVLPTYNNHLYKRLGESLQSNTYNGFSTPWGYFDFNRFHCHFSPRDWQRLINNNWGMRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYELPYVMDAGQEGSLPPFPNDVFMVPQYGYCGLVTGNTSQQQTDRNAFYCLEYFPSQMLRTGNNFEITYSFEKVPFHSMYAHSQSLDRLMNPLIDQYLWGLQSTTTGTTLNAGTATTNFTKLRPTNFSNFKKNWLPGPSIKQQGFSKTANQNYKIPATGSDSLIKYETHSTLDGRWSALTPGPPMATAGPADSKFSNSQLIFAGPKQNGNTATVPGTLIFTSEEELAATNATDTDMWGNLPGGDQSNSNLPTVDRLTALGAVPGMVWQNRDIYYQGPIWAKIPHTDGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFSSTPVNSFITQYSTGQVSVQIDWEIQKERSKRWNPEVQFTSNYGQQNSLLWAPDAAGKYTEPRAIGTRYLTHHL(AAV4;SEQ ID NO:10)
MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(AAV5;SEQ ID NO:11)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL(AAV6;SEQ ID NO:12)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPAKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSSVGSGTVAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSETAGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLRFKLFNIQVKEVTTNDGVTTIANNLTSTIQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQSVGRSSFYCLEYFPSQMLRTGNNFEFSYSFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLARTQSNPGGTAGNRELQFYQGGPSTMAEQAKNWLPGPCFRQQRVSKTLDQNNNSNFAWTGATKYHLNGRNSLVNPGVAMATHKDDEDRFFPSSGVLIFGKTGATNKTTLENVLMTNEEEIRPTNPVATEEYGIVSSNLQAANTAAQTQVVNNQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPANPPEVFTPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNFEKQTGVDFAVDSQGVYSEPRPIGTRYLTRNL(AAV7;SEQ ID NO:13)
MAADGYLPDWLEDNLSEGIREWWALKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGPNTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGATNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTANTQTLGFSQGGPNTMANQAKNWLPGPCYRQQRVSTTTGQNNNSNFAWTAGTKYHLNGRNSLANPGIAMATHKDDEERFFPSNGILIFGKQNAARDNADYSDVMLTSEEEIKTTNPVATEEYGIVADNLQQQNTAPQIGTVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL(AAV8;SEQ IDNO:14)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL(AAV9;SEQ ID NO:15)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEAAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGESESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTQGTQQLLFSQAGPANMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGRDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQANTGPIVGNVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFSQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL(AAV10;SEQ IDNO:16)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPLESPQEPDSSSGIGKKGKQPARKRLNFEEDTGAGDGPPEGSDTSAMSSDIEMRAAPGGNAVDAGQGSDGVGNASGDWHCDSTWSEGKVTTTSTRTWVLPTYNNHLYLRLGTTSSSNTYNGFSTPWGYFDFNRFHCHFSPRDWQRLINNNWGLRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYELPYVMDAGQEGSLPPFPNDVFMVPQYGYCGIVTGENQNQTDRNAFYCLEYFPSQMLRTGNNFEMAYNFEKVPFHSMYAHSQSLDRLMNPLLDQYLWHLQSTTSGETLNQGNAATTFGKIRSGDFAFYRKNWLPGPCVKQQRFSKTASQNYKIPASGGNALLKYDTHYTLNNRWSNIAPGPPMATAGPSDGDFSNAQLIFPGPSVTGNTTTSANNLLFTSEEEIAATNPRDTDMFGQIADNNQNATTAPITGNVTAMGVLPGMVWQNRDIYYQGPIWAKIPHADGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFTAARVDSFITQYSTGQVAVQIEWEIEKERSKRWNPEVQFTSNYGNQSSMLWAPDTTGKYTEPRVIGSRYLTNHL(AAV11;SEQ ID NO:17)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNGRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDKQLEQGDNPYLKYNHADAEFQQRLATDTSFGGNLGRAVFQAKKRILEPLGLVEEGVKTAPGKKRPLEKTPNRPTNPDSGKAPAKKKQKDGEPADSARRTLDFEDSGAGDGPPEGSSSGEMSHDAEMRAAPGGNAVEAGQGADGVGNASGDWHCDSTWSEGRVTTTSTRTWVLPTYNNHLYLRIGTTANSNTYNGFSTPWGYFDFNRFHCHFSPRDWQRLINNNWGLRPKSMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSTYELPYVMDAGQEGSFPPFPNDVFMVPQYGYCGVVTGKNQNQTDRNAFYCLEYFPSQMLRTGNNFEVSYQFEKVPFHSMYAHSQSLDRMMNPLLDQYLWHLQSTTTGNSLNQGTATTTYGKITTGDFAYYRKNWLPGACIKQQKFSKNANQNYKIPASGGDALLKYDTHTTLNGRWSNMAPGPPMATAGAGDSDFSNSQLIFAGPNPSGNTTTSSNNLLFTSEEEIATTNPRDTDMFGQIADNNQNATTAPHIANLDAMGIVPGMVWQNRDIYYQGPIWAKVPHTDGHFHPSPLMGGFGLKHPPPQIFIKNTPVPANPNTTFSAARINSFLTQYSTGQVAVQIDWEIQKEHSKRWNPEVQFTSNYGTQNSMLWAPDNAGNYHELRAIGSRFLTHHL(AAV12;SEQID NO:18)
MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAKTAPGKKRPVEQSPAEPDSSSGIGKSGQQPARKRLNFGQTGDTESVPDPQPLGQPPAAPSGVGSTTMASGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGATNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQTASGTQQSRLLFSQAGPTSMSLQAKNWLPGPCYRQQRLSKQANDNNNSNFPWTGATKYHLNGRDSLVNPGPAMASHKDDKEKFFPMHGTLIFGKEGTNANNADLENVMITDEEEIRTTNPVATEQYGTVSNNLQNSNAGPTTGTVNHQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTNFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(AAV13;SEQ ID NO:19)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPIGEPPAAPSGVGSLTMAAGGGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTTNTQTLGFSQGGPNTMANQAKNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL(AAV-DJ;SEQ IDNO:20)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSDGTLAVPFKAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL(AAVPHP.eB;SEQ ID NO:21)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAKNWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFGKQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL(Anc80L65;SEQ IDNO:22)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAKNWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFGKQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL(Anc80L65AAP;SEQID NO:23)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVTTTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNLALGETTRPARQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSINVDFTVDTNGVYSEPRPIGTRYLTRNL(7m8;SEQID NO:24)
3.经修饰的AAV ITR
根据本文的披露,任何转录的AAV ITR序列(RNA)都可以通过对编码性的经修饰的AAV ITR DNA模板进行工程化来修饰,以例如消除或灭活TRS或其等价物,和/或消除其D区序列。由转录这种经修饰的AAV ITR DNA模板而得到的转录的经修饰的AAV ITR保留了促进将本发明的RNA序列包装到AAV病毒颗粒中的能力。
在AAV DNA复制期间,ITR在末端解离位点(TRS)处被病毒编码的Rep蛋白产生切口。这种起始功能需要三个DNA序列元件,即Rep结合元件(RBE)、包含末端重复(RBE')内内部发夹单尖端的小回文序列、和TRS。在TRS产生切口期间,Rep以特定方向栓系在RBE(DNA)上。这种方向似乎使Rep对齐在AAV ITR上,允许特定的核苷酸与RBE’接触,并指导对TRS的产生切口。RBE相对于TRS的极性或位置的改变极大地抑制了Rep产生切口。RBE’内的取代也降低了Rep比活性,但程度较小。在TRS产生切口期间,Rep与RBE和RBE’的相互作用在功能上是不同的,因为Rep与RBE的接触对DNA解旋酶活性和TRS切割都是必需的。同时,Rep与RBE’的相互作用主要是ITR解旋和TRS茎环结构的形成所必需的,而不是TRS切割所需的。
在本发明的RNA序列上存在至少一个本发明的转录的经修饰的ITR序列(RNA)。本发明的转录的经修饰的ITR序列优选更靠近本发明的RNA序列的3’末端。
在某些实施方式中,本发明的RNA序列包含两个转录的经修饰的ITR序列。
在某些实施方式中,两个转录的经修饰的ITR序列可能源自相同的AAV血清型。
在另一个实施方式中,两个转录的经修饰的ITR序列可能源自不同血清型的两个不同AAV。
在某些实施方式中,一个或多个转录的经修饰的ITR序列包括插入、缺失、和/或突变。
在一些实施方式中,本发明的rRAAV RNA序列包含一个转录的经修饰/突变的ITR序列和一个转录的野生型ITR序列。
在一些实施方式中,一个或多个转录的经修饰的ITR序列基于Flip方向或Flop方向的野生型ITR。
基于本领域已知的野生型ITR序列,可以容易地制备受试的转录的经修饰的ITR序列或其编码DNA序列。
代表性(非限制性)野生型ITR序列(DNA)至少包括表1中列出的以下序列。图1B和1C分别示出了AAV1-AAV7的5’ITR序列的多序列比对和3’ITR序列的多序列比对,包括共有序列、TRS、RBE和D区序列。
表1:代表性野生型AAV末端反向重复(ITR)序列
如本文所用,“RBE序列”或“RBE”是指A:A’回文茎序列中的AAV ITR序列,当碱基配对时,所述序列形成茎(通常为约21-23或约22bp的双链区)并促进ITR与AAV Rep蛋白(Rep78和Rep68)结合。图1A中在野生型AAV2 ITR的Flip和Flop构型两者中示出了代表性RBE序列。
本领域已知的许多AAV血清型的野生型ITR序列是容易获得的,每一个都可以与其他AAV ITR比对,如图1B和1C所示。比对结果可用于鉴定任何AAV ITR的RBE序列。
“转录的(功能性)RBE”是指对应于RBE DNA模板的转录的RNA,所述对应于RBE DNA模板是野生型RBE或具有一个或多个核苷酸插入、缺失、取代和/或其他突变的其功能变体,只要功能性变体RBE基本上保留与Rep结合的能力(例如,保留至少约60%、70%、80%、90%、95%或增强的与相同血清型Rep的结合)即可。在某些实施方式中,RBE DNA模板或转录的RBE RNA与野生型序列的差异不超过10、9、8、7、6、5、4、3、2、1个核苷酸。在某些实施方式中,与野生型RBE相比,由于例如RBE的一个或多个核苷酸的插入、缺失、取代、和/或其他突变,功能性RBE包含多达约30%、25%、20%、15%、10%或5%的序列变异。
在某些实施方式中,核苷酸序列差异不会导致配对碱基对的丢失(例如,野生型RBE中的GC对可以改变为变体RBE中的CG、AT/AU或TA/UA,而不会丢失原始的配对碱基对)。
在某些实施方式中,转录的经修饰的ITR序列(RNA)保留转录的Rep-结合元件(转录的RBE)或其功能变体,以促进Rep介导的包装。例如,野生型AAV2 ITR的RBE DNA序列是SEQ ID NO:5。
在某些实施方式中,转录的经修饰的ITR序列(RNA)进一步保留转录的Rep-结合元件的(转录的RBE的)序列。例如,在图1A中,在Flip ITR的B:B’片段中形成发夹或环结构的CTTTG DNA序列是RBE’序列。
在某些实施方式中,转录的经修饰的ITR序列缺乏转录的TRS、和/或转录的rcTRS、或两者。
在某些实施方式中,由于其对应的DNA序列缺乏野生型TRS的某些序列元件,本发明的RNA序列缺乏转录的(功能性)TRS序列,使得野生型TRS功能在DNA中丢失(例如,A:A’片段和D区序列之间的野生型TRS序列通常占据的序列或内部链,在AAV复制期间通常被核酸内切酶识别和切割,如果存在于AAV ITR的ssDNA载体基因组中,则不被切割)。
例如,在一些实施方式中,TRS的反向互补序列可以缺失或突变,如在实施例中使用的dITR和dITR-D序列中。
可替代地或另外地,通常在A:A’片段和D区序列之间的TRS可能缺乏一个或多个核苷酸,或者具有一个或多个核苷酸取代或突变(如在实例中使用的dITR序列中缺乏或取代/突变4个核苷酸)。
在某些实施方式中,野生型序列中的全部或几乎全部TRS/rcTRS缺失,使得所得RNA转录本缺乏功能性TRS序列。
在某些实施方式中,通过例如在野生型序列中具有插入、缺失、取代、和/或其他突变来改变/突变野生型TRS/rcTRS序列的一部分,使得突变的TRS/rcTRS产生缺乏转录的功能性TRS的对应的RNA转录本。例如,在某些实施方式中,1、2、3、4或5个连续或非连续的TRS核苷酸和/或rcTRS核苷酸可以在突变的序列中缺失或取代。
在某些实施方式中,转录的经修饰的ITR序列从缺乏D区序列或至少缺乏功能性D区序列(D序列或D’序列,取决于Flip或Flop构型)的经修饰的ITR转录。例如,在一些实施方式中,整个D区序列缺失,使得所得RNA转录本缺乏转录的功能性D区序列。在其他实施方式中,D区序列的至少一部分突变(例如,具有缺失、插入、取代、和/或其他突变),使得所得RNA转录本缺乏转录的功能性D区序列。在某些实施方式中,突变的D区序列具有野生型序列的不超过10、9、8、7、6、5、4、3、2或1个核苷酸。
在某些实施方式中,经修饰的ITR序列(DNA模板)缺乏野生型ITR序列最5’末端的1、2、3、4、5、6、7、8、9或10个核苷酸。例如,与野生型ITR序列(SEQ ID NO:1)相比,dITR序列(SEQ ID NO:2)和dITR-D序列(SEQ ID NO:3)都缺乏最5’末端8个核苷酸。
编码上述转录的RNA编码序列(GOI的DNA编码序列)、转录的经修饰的AAV ITR(修饰的AAV ITR)、转录的功能性RBE(功能性RBE)、转录的功能性D区序列(功能性D区序列)和转录的功能性TRS序列(功能性TRS序列)中的任一种的对应的DNA序列被明确地考虑在本发明的范围内。
4.内含子、外显子、UTR、增强子、和其他元件
待衣壳化在本发明的rRAAV病毒颗粒中的本发明的RNA序列可进一步包含可增强或调节GOI表达的额外任选的序列元件(如表达控制元件)。
存在于本发明的RNA序列中的表达控制元件促进适当的异源多核苷酸(例如,GOI)转录和/或翻译,包括例如内含子的剪接信号、维持基因的正确阅读框以允许mRNA和终止密码子的框内翻译等。
典型地,表达控制元件(一些在本发明的RNA序列中,而其他存在于编码本发明的RNA序列的DNA上)是一个或多个核酸序列,如影响可操作地连接的异源多核苷酸(例如,GOI)表达的启动子和增强子。这些元件典型地以顺式作用,但也可能以反式作用。表达控制可以在转录、翻译、剪接、信息稳定性等水平上进行。典型地,调节转录的表达控制元件并列在转录的多核苷酸的5'末端(即,“上游”)附近。表达控制元件也可以位于转录的序列的3'末端(即“下游”)或转录本内(例如,内含子中)。表达控制元件可以位于远离转录的感兴趣的基因序列的距离处(例如,远离感兴趣的基因多核苷酸100至500、500至1000、2,000至5,000或更多个核苷酸)。然而,由于病毒载体(如AAV载体)的多核苷酸长度的限制,这些表达控制元件典型地将在距转录的感兴趣的基因序列的1-1,000、1-500、1-250或1-100个核苷酸范围内。
一些可能存在于本发明的RNA序列或编码本发明的RNA序列的DNA上的非限制性表达控制元件在下文中进一步详细描述。
内含子
已知内含子具有转录后调控元件,可有效诱导mRNA转运出细胞核并增强mRNA稳定性。
在某些实施方式中,rRAAV可以包括一个或多个内含子或其片段。在一些实施方式中,一个或多个内含子是感兴趣的基因的片段。在一些实施方式中,一个或多个内含子与感兴趣的基因异源。
据报道,内含子影响基因表达水平。这种作用称为基因表达的内含子介导增强(IME)(Lu等人,Mol Genet Genomics[分子遗传学基因组学]279:563-572,2008)。在一些实施方式中,与来自没有一个或多个内含子的序列的基因表达相比,基因表达水平增加约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、约5.5倍、约6倍、约6.5倍、约7倍、约7.5倍、约8倍、约8.5倍、约9倍、约9.5倍或约10倍。
非限制性内含子包括SV40内含子、β球蛋白内含子和短嵌合内含子(CIB)。其他内含子包括Lu等人,Hum Gene Ther.[人类基因治疗]2017;28(1):125-134中描述的ColE2-RNA-OUT、OIPR、和R6K-RNA-OUT内含子(通过引用并入);人血红蛋白亚基β(HBB2)合成内含子(Snyder等人,Hum Gene Ther[人类基因治疗],8(1997),第1891-1900页,通过引用并入)。
在一些实施方式中,一个或多个内含子可以小于25个核苷酸、小于50个核苷酸、小于100个核苷酸、小于150个核苷酸、小于200个核苷酸、小于250个核苷酸、小于300个核苷酸、小于350个核苷酸、小于400个核苷酸、小于450个核苷酸、或小于500个核苷酸。
在一些实施方式中,一个或多个内含子可以大于25个核苷酸、大于50个核苷酸、大于100个核苷酸、大于150个核苷酸、大于200个核苷酸、大于250个核苷酸、大于300个核苷酸、大于350个核苷酸、大于400个核苷酸、大于450个核苷酸、或大于500个核苷酸。
在一些实施方式中,一个或多个内含子可以是约50至约100个核苷酸、约50至约200个核苷酸、约50至约300个核苷酸、约50至约400个核苷酸、约50至约500个核苷酸、约100至约200个核苷酸、约100至约300个核苷酸、约100至约400个核苷酸、约100至约500个核苷酸、约200至约300个核苷酸、约200至约400个核苷酸、约200至约500个核苷酸、约300至约400个核苷酸、约300至约500个核苷酸、或约400至约500个核苷酸。
增强子
如本文所用,术语“增强子”可以是指位于感兴趣的基因附近的序列。增强子元件典型地位于编码本发明的RNA序列的DNA中启动子元件的上游,但也可以位于内含子序列(例如,感兴趣的基因)的下游或内部,并保持功能。因此,增强子或其部分可以存在于本发明的转录的RNA序列中。
合适的增强子的非限制性实例包括CMV增强子。
在某些实施方式中,增强子元件可以位于感兴趣的基因上游或下游的100个碱基对、200个碱基对或300个或更多碱基对(例如,在本发明的RNA序列或其DNA编码序列中)。增强子元件典型地将感兴趣的基因的表达增加至高于由启动子元件提供的增加的表达。
非翻译区(UTR)
如本文所用,“非翻译区”(“UTR”)是指转录后未翻译的RNA。例如,5’UTR位于感兴趣的基因起始密码子的上游,并且3’UTR位于感兴趣的基因终止密码子的下游。在一些实施方式中,5’和/或3’UTR可以具有插入、缺失或修饰以增强转录的感兴趣的基因的稳定性。例如,5′UTR可以包含翻译起始序列,如但不限于科扎克序列和内部核糖体进入位点(IRES)。科扎克序列具有共有的CCR(A/G)CCAUGG,其中R是起始密码子(AUG)上游三个碱基的嘌呤(腺嘌呤或鸟嘌呤),其后是另一个‘G’。
已知3′UTR中嵌入了一段腺苷和尿苷。这些富含AU的特征在高周转率的基因中特别普遍。基于它们的序列特征和功能特性,富含AU的元件(ARE)可以分为三类(Chen等人,1995):I类ARE在富含U的区域内含有AUUUA基序的几个分散的拷贝。C-Myc和MyoD含有I类ARE。II类ARE具有两个或更多个重叠的UUAUUUA(U/A)(U/A)九聚体。含有这类ARE的分子包括GM-CSF和TNF-a。III类ARES的定义不太明确。这些富含U的区域不含有AUUUA基序。c-Jun和肌细胞生成素是这类中两个经过充分研究的实例。已知与ARE结合的大多数蛋白会破坏信使的稳定性,而已经记载ELAV家族的成员,尤其是HuR可以增加mRNA的稳定性。HuR与所有三个类别的ARE结合。将HuR特异性结合位点工程化到核酸分子的3′UTR中,这将导致HuR结合,从而使信使在体内稳定。这些5’和/或3’UTR序列中的任一个都可以存在于本发明的RNA序列中。
在一些实施方式中,5’UTR和/或3’UTR可以包含与感兴趣的基因异源的序列。在一些实施方式中,5’UTR和/或3’UTR对感兴趣的基因是天然的。
在某些实施方式中,来自在特定组织或器官如肺、肝、胰腺、内皮细胞、CNS、神经元、星形胶质细胞、骨骼肌、心肌、平滑肌、血液、造血细胞中正常表达的mRNA的5’UTR和/或3’UTR可用于本发明的RNA序列中,所述RNA序列包含靶向这些组织中的一种或多种的GOI。
聚腺苷酸化序列
在某些实施方式中,本发明的RNA序列包含转录的经修饰的AAV ITR,所述转录的经修饰的AAV ITR在聚A序列、聚A信号序列(例如,AAUAAA)、或RNA转录终止序列(例如,组蛋白下游元件)的5’。
上文定义了“聚A序列”、“聚A尾”、“聚A信号序列”和“用于RNA转录终止的序列”。
在某些实施方式中,本发明的RNA序列包含聚A尾。可以将这种RNA序列包装到本发明的rRAAV病毒颗粒中并直接递送到靶细胞中,并且可以直接翻译由本发明的RNA序列编码的GOI。
在某些实施方式中,本发明的RNA序列包含聚A信号序列和任选地聚A位点下游的转录的富含GU的区域。可以将这种RNA序列包装到本发明的rRAAV病毒颗粒中并直接递送到靶细胞中。一旦进入靶细胞,聚A信号序列可被胞质聚A添加酶识别并进一步加工以产生聚A尾,然后翻译由本发明的RNA序列编码的GOI。
代表性的聚A信号序列和周围序列包括人生长激素(hGH)聚A序列(参见Liu等人,Gene Ther[人类基因治疗]20:308-317,2013,通过引用并入)、牛生长激素聚腺苷酸化信号(bGHpA)(Goodwin和Rottman,J Biol Chem.[生物化学杂志]1992年8月15日;267(23):16330-4,通过引用并入)、SV40早期或晚期聚腺苷酸化信号、以及Choi等人(Mol Brain.[分子脑]2014;7:17,通过引用并入本文)中使用的合成聚A信号。
转录增强子
如本文所用,“转录增强子”是指可以增加感兴趣的基因转录的顺式作用核苷酸序列。在一些实施方式中,转录增强子可以位于本发明的转录的RAAV RNA序列的内含子中或部分位于外显子区域中。
WPRE
在某些实施方式中,本发明的RNA序列包含由编码DNA上的WPRE序列编码的转录的WPRE序列。
土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE)是600bp左右的DNA序列,所述DNA序列在转录时会产生增强表达的三级结构。
WPRE常用于分子生物学,以增加由病毒载体递送的基因的表达。它是具有γ、α和β组分的三联调控元件。α组分长80bp:GCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGT(SEQ ID NO:39)。单独使用时,α组分的活性仅为完整的三联WPRE序列的9%,其与土拨鼠乙型肝炎病毒(WHV8)基因组的碱基对1093-1684具有100%同一性。
在某些实施方式中,转录的WPRE序列或其部分(如γ、α和β元件,优选按给定顺序)存在于衣壳化在本发明rRAAV病毒颗粒中的受试的RNA序列上GOI的3’UTR区域中,以大幅提高本发明的RNA序列的稳定性和蛋白产量。
在某些实施方式中,WPRE序列是含有最小γ元件和部分α-β元件的短WPRE(WPRE2)(参见Kalev-Zylinska,J Neurosci.[神经科学杂志]2007,27:10456-10467,通过引用并入)。
在某些实施方式中,WPRE序列是含有最小γ和α元件的短WPRE(WPRE3)(参见Choi等人,Mol Brain[分子脑]7,17(2014),通过引用并入)。
在某些实施方式中,本发明的RNA序列包含WPRE序列和缺乏内含子的GOI。
启动子
如本文所用,术语“启动子”限定为启动多核苷酸序列的特异性转录所需的由细胞合成机器或引入的合成机器所识别的DNA序列。
因此,本发明的RNA序列不包含启动子。另一方面,编码本发明的RNA序列DNA(如编码本发明的RNA序列的表达盒或表达载体)包含用于转录本发明的RNA序列的启动子。
如本文所用,术语“启动子/调控序列”意指表达与启动子/调控序列可操作地连接的基因产物所需的核酸序列。在一些情况下,这种序列可以是核心启动子序列。在其他情况下,这种序列还可以包括增强子序列和表达基因产物所需的其他调控元件。启动子/调控序列可以是例如以组织或细胞类型特异性方式表达基因产物(例如,本发明的RNA序列)的启动子/调控序列。
如本文所用,术语“可操作的连接”或“可操作地连接”是指如此描述的组分的物理并列或功能性并列以允许它们以其预期方式起作用。在与异源多核苷酸可操作连接的表达控制元件的实例中,这种关系使得控制元件调节异源多核苷酸的表达。更特别地,例如,两个可操作地连接的DNA序列意指两个DNA以这样的关系排列(顺式或反式),使得DNA序列中的至少一个能够对另一个序列发挥生理作用。
在某些实施方式中,启动子是组成型启动子。
如本文所用,“组成型”启动子是当与编码或指定基因产物的多核苷酸可操作地连接时,在细胞的大多数或全部生理条件下致使基因产物在细胞中产生的核苷酸序列。
在某些实施方式中,可用于从编码本发明的RNA序列的DNA组成型地驱动其表达的启动子可包括:β葡糖醛酸糖苷酶(GUSB)启动子、巨细胞病毒(CMV)即时-早期(Ie)增强子和/或启动子、鸡β-肌动蛋白(CBA)启动子或其衍生物,如CAG启动子、CB启动子、(人)延伸因子1α-亚基(EF1α)启动子、和泛素C(UBC)启动子。
在某些实施方式中,启动子是诱导型启动子。
如本文所用,“诱导型”启动子是指当与编码或指定基因产物的多核苷酸可操作地连接时,基本上仅在对应于启动子的诱导物存在于细胞中时才致使基因产物在细胞中产生的核苷酸序列。
在某些实施方式中,启动子是组织特异性启动子、物种特异性启动子、或细胞周期特异性启动子。参见Parr等人,Nat.Med.[自然医学]3:1145-9,1997(全部内容通过引用并入本文)。
如本文所用,“组织或细胞类型特异性”启动子是核苷酸序,当其与编码或由基因指定的多核苷酸可操作地连接时,优选地由于例如细胞/组织是启动子通常在其中具有活性的细胞类型或组织类型,导致基因产物在特定细胞类型或特定细胞中产生。
组织或细胞类型特异性启动子可以包括神经元组织特异性启动子;CNS-或PNS-特异性启动子,如星形胶质细胞、少突胶质细胞、或神经元启动子;造血谱系特异性启动子,如B细胞启动子、T细胞启动子、NK细胞启动子、单核细胞启动子、白细胞启动子、巨噬细胞启动子;内皮细胞启动子;胰腺启动子;肝(liver/hepatic)细胞启动子;肺组织启动子等。
代表性组织特异性启动子包括朊病毒启动子、神经元特异性烯醇化酶(NSE)、神经丝轻链(NFL)启动子、神经丝重链(NFH)启动子、血小板衍生的生长因子(PDGF)、血小板衍生的生长因子B链(PDGF-β)、突触蛋白(Syn)、突触蛋白1(Syn1)、甲基-CpG结合蛋白2(MeCP2)、Ca2+/钙调蛋白依赖性蛋白激酶II(CaMKII)、代谢型谷氨酸受体2(mGluR2)、神经丝轻链(NFL)或神经丝重链(NFH)、β-球蛋白小基因nβ2、前脑啡肽原(PPE)、脑啡肽(Enk)和兴奋性氨基酸转运蛋白2(EAAT2)启动子。
星形胶质细胞特异性启动子包括神经胶质纤维酸性蛋白(GFAP)和EAAT2启动子。
少突胶质细胞特异性启动子包括髓鞘碱性蛋白(MBP)启动子。
在一些实施方式中,启动子与感兴趣的基因异源。在一些实施方式中,启动子是感兴趣的基因的天然启动子。在一些实施方式中,异源启动子包括插入、缺失、取代、和/或其他突变。在一些实施方式中,天然启动子包括插入、缺失、取代、和/或其他突变。
在某些实施方式中,启动子是Pol II启动子。在某些实施方式中,启动子是PolIII启动子,如U6启动子。
5.载体(质粒或杆粒)
如本文所用,“载体”通常是指包含分离的核酸(DNA或RNA)并且可用于向细胞内部递送所述分离的核酸的物质的组合物。
术“表达载体”是指包含重组多核苷酸的载体,所述重组多核苷酸包含与有待表达的核苷酸序列可操作地连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件;用于表达的其他元件可以由宿主细胞提供或在体外表达系统中提供。表达载体包括本领域已知的所有表达载体,如掺入重组多核苷酸的粘粒、质粒、杆粒(例如,裸露的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。
包含GOI的本发明的rRAAV RNA序列是用于通过包裹载体的rRAAV病毒颗粒将所述GOI递送到靶/宿主细胞中的载体。
在某些实施方式中,本发明的rRAAV RNA序列由DNA表达载体编码,如质粒或杆粒(例如,可以像昆虫细胞内的杆状病毒一样维持或复制的载体)。这种DNA表达载体可以在合适的宿主细胞中转录本发明的RNA序列,如哺乳动物包装细胞(例如,HEK293T细胞)或昆虫包装细胞(例如,Sf9细胞),从而可以在rRAAV包装所需的其他元件(如rep和cap编码序列)存在下产生受试的rRAAV病毒颗粒。
许多载体在本领域中是已知的,包括但不限于线性多核苷酸、与离子化合物或两亲化合物相关的多核苷酸、质粒、以及病毒。因此,术语“载体”包括自主复制的质粒或病毒。所述术语还应当解释为包括促进将核酸转移到细胞中的非质粒和非病毒化合物,例如像聚赖氨酸化合物、脂质体等。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体等。
在一些实施方式中,RAAV从质粒或杆粒转录。所述质粒或杆粒可以包括感兴趣的基因序列。在一些实施方式中,启动子与感兴趣的基因可操作地连接并且位于感兴趣的基因的上游。在一些实施方式中,启动子不在转录的RAAV中。
6.AAV颗粒和AAV颗粒的群体
在某些实施方式中,本发明提供了分离的rRAAV病毒颗粒,所述病毒颗粒包含衣壳化在本文所述的AAV衣壳或病毒颗粒中任一种内的本发明的RNA序列中的任一种。
在一些实施方式中,AAV衣壳或病毒颗粒是本文所述的血清型或一种或多种血清型的组合。
在本发明的rRAAV载体或RNA序列中,rRAAV基因组(RNA)可以是单链(ss)核酸或双链(ds)、自身互补(sc)核酸。
本发明的一个相关方面提供了重组病毒颗粒(例如,rRAAV颗粒)的群体,所述群体包含本发明的多个重组病毒颗粒(例如,rRAAV颗粒),其中所述群体内的重组病毒颗粒(例如,rRAAV颗粒)中的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多具有本发明的衣壳化RNA序列。
在一些实施方式中,rRAAV颗粒的群体含有本发明的多个rRAAV病毒颗粒,其中所述群体内的rRAAV颗粒的约40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多具有本发明的衣壳化RNA序列。
在某些实施方式中,重组病毒颗粒(例如,rRAAV颗粒)的群体包含至少1×104个病毒颗粒、至少2×104个病毒颗粒、至少5×104个病毒颗粒、至少1×105个病毒颗粒、至少2×105个病毒颗粒、至少5×105个病毒颗粒、至少1×106个病毒颗粒、至少2×106个病毒颗粒、至少5×106个病毒颗粒、至少1×107个病毒颗粒、至少2×107个病毒颗粒、至少5×107个病毒颗粒、至少1×108个病毒颗粒、至少2×108个病毒颗粒、至少5×108个病毒颗粒、至少1×109个病毒颗粒、至少2×109个病毒颗粒、至少5×109个病毒颗粒、至少1×1010个病毒颗粒、至少2×1010个病毒颗粒、至少5×1010个病毒颗粒、至少1×1011个病毒颗粒、至少2×1011个病毒颗粒、至少5×1011个病毒颗粒、至少1×1012个病毒颗粒、至少2×1012个病毒颗粒、至少5×1012个病毒颗粒、至少1×1013个病毒颗粒、至少2×1013个病毒颗粒、至少5×1013个病毒颗粒、至少1×1014个病毒颗粒、至少2×1014个病毒颗粒、至少5×1014个病毒颗粒、至少1×1015个病毒颗粒、至少2×1015个病毒颗粒、至少5×1015个病毒颗粒、至少1×1016个病毒颗粒、至少2×1016个病毒颗粒、或至少5×1016个病毒颗粒。
在某些实施方式中,重组病毒颗粒的群体内的至多50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、3%、2%、1%、0.1%、0.01%或更少将非RNA(例如DNA)衣壳化在病毒颗粒内。
7.宿主细胞以及AAV生产
rAAV生产的一般原理是本领域已知的。参见以下综述,例如,Carter(CurrentOpinions in Biotechnology[生物技术新见],1533-539,1992);和Muzyczka,Curr.Topicsin Microbial,and Immunol[微生物学和免疫学的当前主题]158:97-129,1992,二者通过引用并入本文)。以下文献中描述了各种方法:Ratschin等人(Mol.Cell.Biol.[分子细胞生物学杂志]4:2072,1984;Hermonat等人(Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:6466,1984);Tratschin等人(Mol.Cell.Biol.[分子细胞生物学杂志]5:3251,1985);McLaughlin等人(J.Virol[病毒学杂志]62:1963,1988);和Lebkowski等人(Mol.Cell.Biol[分子细胞生物学杂志]7:349,1988)、Samulski等人(J.Virol[病毒学杂志]63:3822-3828,1989);U.S.5,173,414;WO 95/13365和U.S.5,658,776;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441;WO 97/08298;WO 97/21825;WO 97/06243;WO 99/11764;Perrin等人(Vaccine[疫苗]13:1244-1250,1995;Paul等人(Human Gene Therapy[人基因疗法]4:609-615,1993);Clark等人(Gene Therapy[基因疗法]3:1124-1132,1996;U.S.5,786,211;U.S.5,871,982;以及U.S.6,258,595。
AAV载体血清型可以与靶细胞类型匹配。例如,WO 2018002719 A1的表2列出了可以被指定的AAV血清型转导的示例性细胞类型(通过引用并入本文)。
包装细胞用于形成能够感染宿主细胞的病毒颗粒。这种细胞包括HEK293和Sf9细胞,其可用于包装AAV和腺病毒。
通常通过将核酸载体包装到病毒颗粒中的生产者细胞系来生成基因疗法中使用的病毒载体。载体通常含有包装并且随后整合到宿主细胞(如果合适的话)中所需的最小病毒序列,其他病毒序列被编码有待表达的蛋白的表达盒替代。缺失的病毒功能可以由包装细胞系以反式形式提供,通常是由于这些病毒功能/蛋白(如AAV的rep和cap基因)作为整合到包装细胞中的转基因或作为引入到所述包装细胞中的第二病毒载体或表达载体上的转基因而表达的结果。
例如,基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的末端反向重复(ITR)序列,所述序列是包装并整合到宿主基因组中所需的。将病毒DNA包装在细胞系中,所述细胞系含有编码其他AAV基因即rep和cap但缺乏ITR序列的辅助质粒。所述细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体复制和来自辅助质粒的AAV基因表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以通过例如进行腺病毒比AAV更敏感的热处理来减少。
在一些实施方式中,可以使用三重转染方法(在美国专利号6,001,650中详细描述)生产重组AAV。典型地,通过用有待包装到AAV颗粒中重组AAV载体(包含感兴趣的基因)、AAV辅助功能载体和辅佐功能载体转染宿主细胞产生重组AAV。AAV辅助功能载体编码“AAV辅助功能”序列(例如,rep和cap),所述序列以反式起作用,用于生产性AAV复制和衣壳化。优选地,AAV辅助功能载体支持有效的AAV载体生产,而不生成任何可检测的野生型AAV病毒粒子(例如,含有功能性rep和cap基因的AAV病毒粒子)。所述辅佐功能载体编码用于AAV依赖于其进行复制的非AAV衍生的病毒和/或细胞功能(例如,“辅佐功能”)的核苷酸序列。辅佐功能包括AAV复制所需的功能,包括但不限于参与激活AAV基因转录、阶段特异性AAVmRNA剪接、AAV DNA复制、cap表达产物合成和AAV衣壳组装的部分。基于病毒的辅佐功能可衍生自已知的辅助病毒的任一种,如腺病毒、疱疹病毒(除了单纯疱疹病毒-1型)和牛痘病毒。
在一些实施方式中,使用包装在昆虫细胞(如Sf9细胞)中的杆状病毒表达系统产生受试的rRAAV。参见,例如WO 2007046703、WO 2007148971、WO 2009014445、WO2009104964、WO 2013036118、WO 2011112089、WO 2016083560、WO 2015137802、和WO2019016349,均通过引用并入本文。
载体滴度通常表示为病毒基因组/ml(vg/ml)。在某些实施方式中,病毒滴度高于1x109、高于5x1010、高于1x1011、高于5x1011、高于1x1012、高于5x1012、或高于1x1013vg/ml。
8.感兴趣的基因(GOI)或感兴趣的RNA序列(RSI)
本发明的rRAAV病毒颗粒可用于将任何感兴趣的基因(GOI)或感兴趣的RNA序列(RSI)递送至宿主细胞,用于任何目的,只要GOI是在所选择的AAV病毒衣壳或AAV病毒颗粒壳的包装限度内的RNA,如对于大多数AAV病毒颗粒而言总长度为约4,700个核苷酸,对于某些大容量AAV病毒颗粒(如AAV5),总长度可达约8,900个核苷酸。
在某些实施方式中,代表性(非限制性)感兴趣的RNA序列(RSI)包括例如,编码蛋白的RNA、mRNA、非编码RNA(ncRNA)、tRNA、核糖体RNA(rRNA)、转移-信使RNA(tmRNA)、反义寡核苷酸(ASO)、RNA适配体、CRISPR-Cas系统的RNA组分如单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)、tracr RNA、或RISC复合物或RNAi途径的RNA组分(如shRNA、miRNA、或siRNA)、调节RNA、Piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、长非编码RNA(lncRNA)(包括基因间lincRNA、内含子ncRNA、和有义/反义lncRNA)、长居间/基因间非编码RNA(lincRNA)、增强子RNA、细菌小RNA(sRNA)、snRNA、exRNA、scaRNA、Xist、和HOTAIR及其前体。
在某些实施方式中,本发明的RNA序列包含蛋白或多肽的编码序列。
在某些实施方式中,蛋白或多肽是可用于替代靶细胞、组织或生物体中的缺陷蛋白的野生型蛋白或其功能等价物或变体(如酶或结构蛋白)。
在某些实施方式中,蛋白或多肽是可用于拮抗靶细胞、组织或生物体中的化合物(小分子化合物或大分子,如脂质、脂肪酸、蛋白、核酸等)的野生型蛋白或其功能等价物或变体(如酶或结构蛋白)。
例如,在某些实施方式中,本发明的RNA序列包含CRISPR/Cas系统的效应酶的编码序列。
在某些实施方式中,CRISPR-Cas系统是1类系统,并且效应酶是I、III、或IV型效应酶。
在某些实施方式中,CRISPR-Cas系统是2类系统,并且效应酶是II、V、或VI型效应酶。
例如,在一些实施方式中,效应酶是2类II型酶,如Cas9,包括化脓性链球菌(Streptococcus pyogenes)(SpCas9)或SaCas9(参见WO 2014/093622(PCT/US 2013/074667),通过引用并入)。
在某些实施方式中,Cas效应酶是2类V型Cas蛋白,包括Cas12a(以前称为Cpf1,如新凶手弗朗西斯菌(Francisella novicida)Cas12a)、C2c1和C2c3。
在某些实施方式中,Cas效应酶是2类VI型Cas蛋白,包括Cas13a(也称为C2c2)、Cas13b、Cas13c、Cas13d、Cas13e和Cas13f。这些Cas蛋白使用它们的crRNA来识别靶RNA序列,而不是Cas9和Cas12a中的靶DNA序列。
在某些实施方式中,Cas效应酶是WO 2020/028555中描述的Cas效应酶中的任一种(全部内容通过引用并入本文),包括Cas9、Cas12(例如,Cas12a、Cas12b、Cas12c、Cas12d等)、Cas13(例如,Cas13a、Cas13b(例如Cas13b-t1、Cas13b-t2、Cas13b-t3)、Cas13c、Cas13d等)、Cas14、CasX、和CasY中的任一个。
在某些实施方式中,Cas效应酶融合至DNA和/或RNA碱基编辑器,如胞嘧啶或腺嘌呤碱基编辑器(CBE或ABE)。在某些实施方式中,碱基编辑器优选地编辑DNA碱基并且任选地具有降低的或基本上没有脱靶RNA碱基编辑能力。在某些实施方式中,碱基编辑器优选地编辑RNA碱基并且任选地具有降低的或基本上没有脱靶DNA碱基编辑能力。在某些实施方式中,碱基编辑器编辑DNA和RNA碱基两者。
在某些实施方式中,碱基编辑器是第一、第二(BE2)、第三(BE3)或第四代(BE4)碱基编辑器。在某些实施方式中,碱基编辑器是双碱基编辑器。
在某些实施方式中,碱基编辑器是RNA腺苷脱氨酶(ADAR),如ADAR1、ADAR2、或包括ADAR2DD(E488Q)的ADARDD。
在上述任何实施方式中,本发明的RNA序列可以进一步包含指导RNA序列,所述指导RNA序列被设计成装载到编码的CRISPR/Cas效应酶中,用于结合与指导RNA互补的靶多核苷酸序列。在本发明的rRAAV病毒颗粒将本发明的RNA序列递送到靶宿主细胞后,这种gRNA序列可以由细胞核酸酶处理并从本发明的RNA序列中释放/分离。例如,gRNA可以存在于作为本发明RNA序列的一部分的初级miRNA发夹结构的未配对的5’或3’侧翼区序列中,并且在所述初级miRNA经细胞酶如Drosha处理后,从初始初级miRNA转录本中释放/分离。
在某些实施方式中,本发明的RNA序列包含CRISPR/Cas系统的效应酶的编码序列,并进一步包含DNA或RNA碱基编辑酶或结构域的编码序列,使得Cas效应酶和DNA/RNA碱基编辑酶/结构域的融合物由RNA序列编码。在某些实施方式中,Cas效应酶的核酸酶活性有缺陷,使得它能够通过其结合的指导RNA结合到靶多核苷酸序列,但不能切割DNA/RNA靶多核苷酸。
在某些实施方式中,本发明的RNA序列包含CRISPR/Cas系统效应酶的变体或衍生物的编码序列,其中所述变体包含野生型CRISPR/Cas系统效应酶的缺失(如N和/或C末端缺失,例如,Cas13e或Cas13f的N末端不超过210个残基缺失,和/或C末端不超过180个残基缺失)、插入或取代,但基本上保留所述野生型效应酶与gRNA结合和/或切割靶多核苷酸的能力。在某些实施方式中,所述变体缺乏切割靶多核苷酸的活性。
在某些实施方式中,由本发明的RNA序列编码的所述RNA碱基编辑结构域是腺苷脱氨酶,如双链RNA特异性腺苷脱氨酶(例如,ADAR1或ADAR2);载脂蛋白B mRNA编辑酶;催化多肽样(APOBEC);或激活诱导的胞苷脱氨酶(AID)。
在某些实施方式中,由本发明的RNA序列编码的所述RNA碱基编辑结构域包含腺苷脱氨酶和/或胞苷脱氨酶,如作用于RNA的胞苷脱氨酶(CDAR),如双链RNA特异性腺苷脱氨酶(ADAR)(例如,ADAR1或ADAR2)、载脂蛋白B mRNA编辑酶、催化多肽样(APOBEC,如APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3E、APOBEC3F、APOBEC3G、APOBEC3H、和APOBEC4)、激活诱导的胞苷脱氨酶(AID)、胞苷脱氨酶1(CDA1)、或其突变体。
在某些实施方式中,ADAR具有E488Q/T375G双突变或者是ADAR2DD。
在某些实施方式中,将所述碱基编辑结构域与RNA结合结构域,如MS2进一步融合。
在某些实施方式中,所述编码的CRISPR/Cas效应酶的变体或衍生物进一步包含RNA甲基转移酶、RNA去甲基化酶、RNA剪接修饰子、定位因子或翻译修饰因子。
在某些实施方式中,所述Cas效应酶、所述变体/其衍生物或功能性片段包含核定位信号(NLS)序列或核输出信号(NES)。
在某些实施方式中,将所述Cas效应酶、变体/其衍生物、或其功能性片段与异源功能性结构域融合。在某些实施方式中,所述异源功能性结构域包含:核定位信号(NLS)、报告蛋白或检测标记(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、定位信号、蛋白靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、具有ssRNA切割活性的多肽、具有dsRNA切割活性的多肽、具有ssDNA切割活性的多肽、具有dsDNA切割活性的多肽、DNA或RNA连接酶、或其任何组合。在某些实施方式中,将所述异源功能性结构域在所述融合蛋白的N-末端、C-末端或内部融合。
在某些实施方式中,本发明的RNA序列包含CasPR(用于第1类前体crRNA处理的CRISPR相关蛋白)融合蛋白的编码序列,所述融合蛋白包含融合到异源功能性结构域的CasPR(或其同源物、直系同源物、旁系同源物、变体、衍生物或功能性片段);或其功能性变体。
在某些实施方式中,CasPR是Cas5d、Cas6、或Csf5。
在某些实施方式中,CasPR是MtCas6(I-A)(序列1)、MmCas6(I-B)(序列2)、SpCas5d(I-C1)(序列3)、BhCas5d(I-C2)(序列4)、SaCas6(I-D)(序列5)、EcCas6e(I-E)(序列6)、PaCas6f(I-F)(序列7)、MtCas6(III-A)(序列8)、PfCas6(III-B)(序列9)、PaCsf5(IV-A1)(序列10)、或MtCsf5(IV-A2)(序列11)。将所有序列通过引用并入本文。
MPLIFKIGYNVIPLQDVILPTPSSKVLKYLIQSGKLIPSLKDLITSRDKYKPIFISHLGFNQRRIFQTNGNLKTITKGSRLSSIIAFSTQANVLSEVADEGIFETVYGKFHIMIESIEIVEVEKLKEEVEKHMNDNIRVRFVSPTLLSSKVLLPPSLSERYKKIHAGYSTLPSVGLIVAYAYNVYCNLIGKKEVEVRAFKFGILSNALSRIIGYDLHPVTVAIGEDSKGNLRKARGVMGWIEFDIPDERLKRRALNYLLTSSYLGIGRSRGIGFGEIRLEFRKIEEKEG(序列1)
MDLEYMHISYPNILLNMRDGSKLRGYFAKKYIDEEIVHNHRDNAFVYKYPQIQFKIIDRSPLIIGIGSLGINFLESKRIFFEKELIISNDTNDITEVNVHKDMDHFGTTDKILKYQFKTPWMALNAKNSEIYKNSDEIDREEFLKRVLIGNILSMSKSLGYTIEEKLKVKINLKEVPVKFKNQNMVGFRGEFYINFDIPQYLGIGRNVSRGFGTVVKV(序列2)
MYRSRDFYVRVSGQRALFTNPATKGGSERSSYSVPTRQALNGIVDAIYYKPTFTNIVTEVKVINQIQTELQGVRALLHDYSADLSYVSYLSDVVYLIKFHFVWNEDRKDLNSDRLPAKHEAIMERSIRKGGRRDVFLGTRECLGLLDDISQEEYETTVSYYNGVNIDLGIMFHSFAYPKDKKTPLKSYFTKTVMKNGVITFKAQSECDIVNTLSSYAFKAPEEIKSVNDECMEYDAMEKGEN(序列3)
MRNEVQFELFGDYALFTDPLTKIGGEKLSYSVPTYQALKGIAESIYWKPTIVFVIDELRVMKPIQMESKGVRPIEYGGGNTLAHYTYLKDVHYQVKAHFEFNLHRPDLAFDRNEGKHYSILQRSLKAGGRRDIFLGARECQGYVAPCEFGSGDGFYDGQGKYHLGTMVHGFNYPDETGQHQLDVRLWSAVMENGYIQFPRPEDCPIVRPVKEMEPKIFNPDNVQSAEQLLHDLGGE(序列4)
MPNDPYSLYSIVIELGAAEKGFPTGILGRSLHSQVLQWFKQDNPFLATELHQSQISPFSISPLMGKRHAKLTKAGDRLFFRICLLRGDLLQPLLNGIEQTVNQSVCLDKFRFRLCQTHILPGSHPLAGASHYSLISQTPVSSKITLDFKSSTSFKVDRKIIQVFPLGEHVFNSLLRRWNNFAPEDLHFSQVDWSIPIAAFDVKTIPIHLKKVEIGAQGWVTYIFPNTEQAKIASVLSEFAFFSGVGRKTTMGMGQVQVRS(序列5)
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATVIKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARVEDVHPISERPQYFSGDGKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL(序列6)
MDHYLDIRLRPDPEFPPAQLMSVLFGKLHQALVAQGGDRIGVSFPDLDESRSRLGERLRIHASADDLRALLARPWLEGLRDHLQFGEPAVVPHPTPYRQVSRVQAKSNPERLRRRLMRRHDLSEEEARKRIPDTVARALDLPFVTLRSQSTGQHFRLFIRHGPLQVTAEEGGFTCYGLSKGGFVPWF(序列7)
MAARRGGIRRTDLLRRSGQPRGRHRASAAESGLTWISPTLILVGFSHRGDRRMTEHLSRLTLTLEVDAPLERARVATLGPHLHGVLMESIPADYVQTLHTVPVNPYSQYALARSTTSLEWKISTLTNEARQQIVGPINDAAFAGFRLRASGIATQVTSRSLEQNPLSQFARIFYARPETRKFRVEFLTPTAFKQSGEYVFWPDPRLVFQSLAQKYGAIVDGEEPDPGLIAEFGQSVRLSAFRVASAPFAVGAARVPGFTGSATFTVRGVDTFASYIAALLWFGEFSGCGIKASMGMGAIRVQPLAPREKCVPKP(序列8)
MRFLIRLVPEDKDRAFKVPYNHQYYLQGLIYNAIKSSNPKLATYLHEVKGPKLFTYSLFMAEKREHPKGLPYFLGYKKGFFYFSTCVPEIAEALVNGLLMNPEVRLWDERFYLHEIKVLREPKKFNGSTFVTLSPIAVTVVRKGKSYDVPPMEKEFYSIIKDDLQDKYVMAYGDKPPSEFEMEVLIAKPKRFRIKPGIYQTAWHLVFRAYGNDDLLKVGYEVGFGEKNSLGFGMVKVEGNKTTKEAEEQEKITFNSREELKTGV(序列9)
MFVTQVIFNIGERTYPDRARAMVAELMDGVQPGLVATLMNYIPGTSTSRTEFPTVQFGGASDGFCLLGFGDGGGAIVRDAVPLIHAALARRMPDRIIQVEHKEHSLSAEARPYVLSYTVPRMVVQKKQRHAERLLHEAEGKAHLEGLFLRSLQRQAAAVGLPLPENLEVEFKGAVGDFAAKHNPNSKVAYRGLRGAVFDVNARLGGIWTAGFMLSKGYGQFNATHQLSGAVNALSE(序列10)
MHQTLIRINWPKGFKCPPAEFREKLAKSEMFPPEFFHYGTELAVWDKQTAEVEGKIKTVSKEKIIKTFDKPIPLNGRAPVRVIGGQAWAGVIADPEMEGMLIPHLGSILKVASSAAGCAVKIELEQRKFGISYTEYPVKYNLRELVLKRRCEDARSTDIESLIADRIWGGVSGESYYGIDGTCAKFGFEPPSREQLELRIFPMKNIGLHMKSSDGLSKEYMSLIDAEVWMNAKLEGVWQVGNLISRGYGRFIKSIGAQS(序列11)
序列12:GATAATCTCTTATAGAATTGAAAG
序列13:CTAAAAGAATAACTTGCAAAATAACAAGCATTGAAAC
序列14:GTCTCACCCTTCATGGGTGAGTGGATTGAAAT
序列15:GTCGCACTCTTCATGGGTGCGTGGATTGAAAT
序列16:GTTTCAGTCCCGTAGTCGGGATTTAGTGGTTGGAAAG
序列17:GAGTTCCCCGCGCCAGCGGGGATAAACCG
序列18:GTTCACTGCCGTATAGGCAGCTAAGAAA
序列19:GTCGTCAGACCCAAAACCCCGAGAGGGGACGGAAAC
序列20:GTTACAATAAGACTAAAATAGAATTGAAAG
序列21:GTATTTCCCGCGTGCGCGGGGGTGAGCGG
序列22:TATTGGATACACCCACTCATTGGTGGGTGGTTAGAAC
序列23:GAUAAUCUCUUAUAGAAUUGAAAG
序列24:CUAAAAGAAUAACUUGCAAAAUAACAAGCAUUGAAAC
序列25:GUCUCACCCUUCAUGGGUGAGUGGAUUGAAAU
序列26:GUCGCACUCUUCAUGGGUGCGUGGAUUGAAAU
序列27:GUUUCAGUCCCGUAGUCGGGAUUUAGUGGUUGGAAAG
序列28:GAGUUCCCCGCGCCAGCGGGGAUAAACCG
序列29:GUUCACUGCCGUAUAGGCAGCUAAGAAA
序列30:GUCGUCAGACCCAAAACCCCGAGAGGGGACGGAAAC
序列31:GUUACAAUAAGACUAAAAUAGAAUUGAAAG
序列32:GUAUUUCCCGCGUGCGCGGGGGUGAGCGG
序列33:UAUUGGAUACACCCACUCAUUGGUGGGUGGUUAGAAC
在某些实施方式中,融合至CasPR的所述异源功能性结构域包含:核定位信号(NLS)、报告蛋白或检测标记(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、定位信号、蛋白靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨基结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶、去甲基化酶、转录释放因子、HDAC、具有ssRNA切割活性的多肽、具有dsRNA切割活性的多肽、具有ssDNA切割活性的多肽、具有dsDNA切割活性的多肽、DNA或RNA连接酶、或其任何组合。在某些实施方式中,异源功能性结构域包含RNA碱基编辑器。在某些实施方式中,所述RNA碱基编辑器编辑A→G单碱基变化。在某些实施方式中,所述RNA碱基编辑器编辑C→U单碱基变化。在某些实施方式中,所述RNA碱基编辑器包含ADAR2DD或其衍生物。在某些实施方式中,ADAR2DD衍生物包含E488Q/T375A双突变。
在某些实施方式中,融合蛋白具有序列45-55中任一个的氨基酸序列。
MtCas6(I-A):
ATGCCCAAGAAGAAGCGGAAGGTGATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列45)
MmCas6(I-B):
ATGCCCAAGAAGAAGCGGAAGGTGATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列46)
SpCas5d(I-C1):
ATGCCCAAGAAGAAGCGGAAGGTGATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列47)
BhCas5d(I-C2):
ATGCCCAAGAAGAAGCGGAAGGTGATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAACCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列48)
SaCas6(I-D):
ATGCCCAAGAAGAAGCGGAAGGTGATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列49)
EcCas6e(I-E):
ATGCCTAAGAAGAAGCGGAAGGTGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列50)
PaCas6f(I-F):
ATGCCTAAGAAGAAGAGAAAGGTGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列51)
MtCas6(III-A):
ATGCCCAAGAAGAAGCGGAAGGTGATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列52)
PfCas6(III-B):
ATGCCCAAGAAGAAGCGGAAGGTGATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列53)
PaCsf5(IV-A1):
ATGCCTAAGAAGAAGCGGAAGGTGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列54)
MtCsf5(IV-A2):
ATGCCCAAGAAGAAGAGAAAGGTGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(序列55)
在某些实施方式中,将所述异源功能性结构域在所述融合蛋白的N-末端、C-末端或内部融合。
在某些实施方式中,CasPR融合物的功能性变体包含蛋白,所述蛋白具有以下的氨基酸序列:(1)序列1-11中的任一个,除了1、2、3、4、5、6、7、8、9或10个氨基酸取代、添加或缺失,其中所述蛋白保持序列1-11中的一个与1类I、III或IV型CRISPR系统的同向重复序列(例如,序列12-33中的任一个)结合的能力;或(2)与序列1-11中的任一个具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述蛋白保持序列1-11的CasPR中的一个与1类I、III或IV型CRISPR系统的同向重复序列(例如,序列12-33中的任一个)结合的能力;任选地,条件是所述蛋白不是序列1-11中的任一个。将所有序列通过引用并入本文。
在某些实施方式中,本发明的RNA序列进一步编码包含能够与靶RNA杂交的指导序列的CasPR指导RNA,以及所述指导序列3’(或5’)的同向重复(DR)序列。在某些实施方式中,所述DR序列具有与序列12-33中的任一个的二级结构基本相同的二级结构。在某些实施方式中,所述DR序列由序列12-33中的任一个或结合同源野生型CasPR的其功能部分编码。在某些实施方式中,所述靶RNA由真核DNA编码。在某些实施方式中,所述真核DNA是非人哺乳动物DNA、非人灵长类动物DNA、人DNA、植物DNA、昆虫DNA、鸟DNA、爬行动物DNA、啮齿动物DNA、鱼DNA、蠕虫/线虫DNA、酵母DNA。在某些实施方式中,所述靶RNA是mRNA。
在某些实施方式中,所述CasPR指导序列在15-120个核苷酸之间、20-100个核苷酸之间、25-80个核苷酸之间、15-55个核苷酸之间、25-35个核苷酸之间、或约30个核苷酸。
在某些实施方式中,所述CasPR指导序列与所述靶RNA是90%-100%互补。在某些实施方式中,所述CasPR指导RNA由CasPR对前crRNA转录本的加工产生,并且其中所述前体crRNA包含两个或更多个指导RNA,所述两个或更多个指导RNA对于不同的靶RNA具有不同的指导序列。
在某些实施方式中,所述CasPR融合物的变体或衍生物包含序列1-11中的任一个的一个或多个残基的保守氨基酸取代;任选地,所述CasPR融合物的变体或衍生物仅包含保守氨基酸取代。在某些实施方式中,所述CasPR融合物的衍生物能够与杂交至所述靶RNA的CasPR指导序列结合,但由于所述CasPR的RNA酶催化位点中突变而不具有RNA酶催化活性。在某些实施方式中,所述CasPR融合物的衍生物具有不超过5、10、15、20、25、30、35、40、45、或50个残基的N末端缺失、和/或不超过5、10、15、20、25、30、35、40、45、或50个残基的C末端缺失。
在某些实施方式中,所述CasPR是Cas5d、Cas6、或Csf5,如MtCas6(I-A)、MmCas6(I-B)、SpCas5d(I-C1)、BhCas5d(I-C2)、SaCas6(I-D)、EcCas6e(I-E)、PaCas6f(I-F)、MtCas6(III-A)、PfCas6(III-B)、PaCsf5(IV-A1)、或MtCsf5(IV-A2)。
在某些实施方式中,所述CasPR融合物的异源功能性结构域包含RNA碱基编辑结构域。在某些实施方式中,所述RNA碱基编辑结构域包含腺苷脱氨酶和/或胞苷脱氨酶,如作用于RNA的胞苷脱氨酶(CDAR),如双链RNA特异性腺苷脱氨酶(ADAR)(例如,ADAR1或ADAR2)、载脂蛋白B mRNA编辑酶、催化多肽样(APOBEC,如APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3E、APOBEC3F、APOBEC3G、APOBEC3H、和APOBEC4)、激活诱导的胞苷脱氨酶(AID)、胞苷脱氨酶1(CDA1)、或其突变体。在某些实施方式中,ADAR包含E488Q/T375G双突变或包含ADAR2DD。在某些实施方式中,将所述碱基编辑结构域与RNA结合结构域,如MS2进一步融合。
在某些实施方式中,所述CasPR融合物的衍生物进一步包含RNA甲基转移酶、RNA去甲基化酶、RNA剪接修饰子、定位因子或翻译修饰因子。
在某些实施方式中,所述Cas、同源物、直系同源物、旁系同源物、变体、衍生物或功能性片段包含核定位信号(NLS)序列或核输出信号(NES)。
在某些实施方式中,靶向所述靶RNA导致对所述靶RNA进行修饰。在某些实施方式中,所述靶RNA修饰是切割所述靶RNA。在某些实施方式中,所述靶RNA修饰是腺苷(A)脱氨基为肌苷(I),和/或胞苷(C)脱氨基为尿嘧啶(U)。
在某些实施方式中,本发明的RNA序列编码经密码子优化的多核苷酸,所述多核苷酸编码野生型CasPR(例如,Cas5d、Cas6或Csf5)、其同源物、其直系同源物、其旁系同源物、其变体或衍生物、或其功能性片段,其中所述多核苷酸针对哺乳动物(例如,人)表达进行密码子优化,任选地,所述野生型CasPR具有序列1-11中任一个的氨基酸序列。在某些实施方式中,所述经密码子优化的多核苷酸具有序列34-44中任一个的氨基酸序列。在某些实施方式中,所述经密码子优化的多核苷酸进一步包含编码异源功能性结构域的序列。在某些实施方式中,异源功能性结构域包含RNA碱基编辑器。
MtCas6(I-A):
ATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGA(序列34)
MmCas6(I-B):
ATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTG(序列35)
SpCas5d(I-C1):
ATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAA(序列36)
BhCas5d(I-C2):
ATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAAC(序列37)
SaCas6(I-D):
ATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCC(序列38)
EcCas6e(I-E):
ATGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTG(序列39)
PaCas6f(I-F):
ATGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTC(序列40)
MtCas6(III-A):
ATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCC(序列41)
PfCas6(III-B):
ATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTG(序列42)
PaCsf5(IV-A1):
ATGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAA(序列43)
MtCsf5(IV-A2):
ATGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCC(序列44)
在某些实施方式中,本发明的RNA序列编码非天然存在的多核苷酸,所述非天然存在的多核苷酸包含序列12-33中的任一个的衍生物,其中所述衍生物(i)与序列12-33中的任一个相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失、取代、和/或其他突变;(ii)与序列12-33中的任一个具有至少20%、30%、40%、50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与序列12-33中的任一个或(i)和(ii)中的任一个杂交;或(iv)是(i)-(iii)中的任一个的互补序列,条件是所述衍生物不是序列12-33中的任一个,并且所述衍生物编码RNA(或者是RNA),所述RNA保持与由序列12-33编码的任一RNA基本相同的二级结构(例如,茎、环、凸起、单链区)。在某些实施方式中,所述衍生物用作本发明的CasPR、其直系同源物、其旁系同源物、其变体、其衍生物、或其功能性片段中的任一个的DR序列。
在某些实施方式中,本发明的RNA序列包含工程化的成簇规律间隔短回文重复序列(CRISPR)-Cas13效应酶的编码序列,其中所述工程化的Cas13:(1)在与对应的野生型Cas13效应酶的核酸内切酶催化结构域空间上接近的区域中包含突变;(2)基本上保留了野生型Cas13对与所述指导序列互补的靶RNA的指导序列特异性核酸内切酶切割活性;并且(3)基本上缺乏野生型Cas13对不与所述指导序列结合的非靶RNA的指导序列非依赖性附带核酸内切酶切割活性。
在某些实施方式中,Cas13是Cas13a、Cas13b、Cas13c、Cas13d(包括CasRx)、Cas13e、或Cas13f。
在某些实施方式中,所述Cas13e具有PCT/CN2020/119559中SEQ ID NO:4的氨基酸序列(通过引用并入本文)。
在某些实施方式中,所述区域包括距离Cas13的一级序列中的核酸内切酶催化结构域(例如,RXXXXH结构域)的任何残基120、110、100、90或80个氨基酸内的残基。
在某些实施方式中,所述区域包括距离Cas13的一级序列中的核酸内切酶催化结构域的任何残基超过100、110、120或130个残基的残基,但在空间上位于所述核酸内切酶催化结构域的残基的1-10或5埃内。
在某些实施方式中,所述核酸内切酶催化结构域是HEPN结构域,任选地包含RXXXXH基序的HEPN结构域。在某些实施方式中,所述RXXXXH基序包含R{N/H/K}X1X2X3H序列。在某些实施方式中,在所述R{N/H/K}X1X2X3H序列中,X1是R、S、D、E、Q、N、G、或Y;X2是I、S、T、V、或L;并且X3是L、F、N、Y、V、I、S、D、E、或A。在某些实施方式中,所述RXXXXH基序是N末端RXXXXH基序,所述N末端RXXXXH基序包含RNXXXH序列,如RN{Y/F}{F/Y}SH序列。在某些实施方式中,所述N末端RXXXXH基序具有RNYFSH序列。在某些实施方式中,所述N末端RXXXXH基序具有RNFYSH序列。在某些实施方式中,所述RXXXXH基序是包含R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H序列的C末端RXXXXH基序。在某些实施方式中,所述C末端RXXXXH基序具有RN(A/K)ALH序列。在某些实施方式中,所述C末端RXXXXH基序具有RAFFHH或RRAFFH序列。
在某些实施方式中,所述区域包含与PCT/CN2020/119559(通过引用并入)的SEQID NO:4的残基2-187、227-242或634-755之间的残基对应的残基、基本上由其组成或由其组成。在某些实施方式中,所述区域包含与PCT/CN2020/119559(通过引用并入)的SEQ IDNO:4的残基35-51、52-67、156-171、666-682、或712-727之间的残基对应的残基、基本上由其组成或由其组成。
在某些实施方式中,所述突变包含以下、基本上由以下组成或由以下组成:在所述区域内的一段15-20个连续氨基酸内的一个或多个带电荷或极性残基到电荷中性短链脂肪族残基(如A)的取代。在某些实施方式中,所述段为约16或17个残基。在某些实施方式中,除了多达1、2或3个之外,将所述段中的基本上所有带电荷和极性残基都取代。在某些实施方式中,将所述段中总共约7、8、9或10个带电荷和极性残基被取代。在某些实施方式中,将所述段的N-和C-末端2个残基取代为其编码序列含有限制性酶识别序列的氨基酸。在某些实施方式中,N末端两个残基是VF,C末端2个残基是ED,并且限制性酶是BpiI。在某些实施方式中,所述一个或多个带电荷或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。在某些实施方式中,所述一个或多个带电荷或极性残基包含R、K、H、N、Y和/或Q残基。在某些实施方式中,将所述段内的一个或多个Y残基取代。在某些实施方式中,所述一个或多个Y残基对应于野生型Cas13e.1的Y672、Y676和/或Y751(PCT/CN2020/119559(通过引用并入)的SEQ ID NO:4)。在某些实施方式中,所述段是PCT/CN2020/119559(通过引用并入)中SEQ ID NO:4的残基35-51、52-67、156-171、666-682或712-727。在某些实施方式中,所述突变包含对应于PCT/CN2020/119559(通过引用并入)中SEQ ID NO:37-39、45、和48中的任何一个或多个的一个或多个Ala取代。在某些实施方式中,所述电荷中性短链脂肪族残基是Ala(A)。在某些实施方式中,所述突变包含以下、基本上由以下组成或由以下组成:在所述区域内的2、3、4或5个具有15-20个连续氨基酸的段内的取代。
在某些实施方式中,工程化的Cas13保留野生型Cas13对靶RNA的指导序列特异性核酸内切酶切割活性的至少约50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%。
在某些实施方式中,工程化的Cas13缺乏野生型Cas13对非靶RNA的指导序列非依赖性附带核酸内切酶切割活性的至少约80%、85%、90%、95%、96%、97%、98%、99%或100%。
在某些实施方式中,工程化的Cas13保留了野生型Cas13对靶RNA的指导序列特异性核酸内切酶切割活性的至少约80%-90%,并且缺乏野生型Cas13对非靶RNA的指导序列非依赖性附带核酸内切酶切割活性的至少约95%-100%。
在某些实施方式中,本发明的工程化的Cas13具有与PCT/CN2020/119559(通过引用并入)中SEQ ID NO:6-10的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.86%同一性的氨基酸序列,不包括PCT/CN2020/119559(通过引用并入)的SEQ ID NO:16、20、24、28和32中定义的任何一个或多个区域。
在某些实施方式中,与PCT/CN2020/119559(通过引用并入)的SEQ ID NO:17、21、25、29和33相比,氨基酸序列在PCT/CN2020/119559(通过引用并入)的SEQ ID NO:16、20、24、28和32所定义的一个或多个区域中的每一个中分别含有多达1、2、3、4或5个差异。
在某些实施方式中,本发明的工程化的Cas13具有PCT/CN2020/119559(通过引用并入)中SEQ ID NO:6-10的任一个的氨基酸序列。在某些实施方式中,本发明的工程化的Cas13具有PCT/CN2020/119559(通过引用并入)中SEQ ID NO:9或10的氨基酸序列。
在某些实施方式中,本发明的工程化的Cas13进一步包含核定位信号(NLS)序列或核输出信号(NES)。在某些实施方式中,工程化的Cas13包含N-和/或C末端NLS。
在某些实施方式中,编码本发明的工程化的CRISPR/Cas13效应酶的本发明的RNA序列经密码子优化,用于在真核生物、哺乳动物(如人或非人哺乳动物)、植物、昆虫、鸟、爬行动物、啮齿动物(如小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
在某些实施方式中,本发明的RNA序列包含工程化的成簇规律间隔短回文重复序列(CRISPR)-Cas13效应酶的编码序列,所述编码序列(i)与野生型序列相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失、取代、和/或其他突变;(ii)与所述野生型序列具有至少50%、60%、70%、80%、90%、95%、或97%序列同一性;(iii)在严格条件下与所述野生型序列或(i)和(ii)中的任一个杂交;或(iv)是(i)-(iii)中任一个的互补序列。
在某些实施方式中,本发明的RNA序列包含以下的编码序列:非编码RNA(ncRNA),如siRNA、piRNA、短发夹RNA或shRNA、微小RNA或miRNA或其前体,包括前体miRNA和初级miRNA、反义序列或寡核苷酸(ASO)、CRISPR/Cas的指导RNA或gRNA、rRNA、tRNA、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR等。
9.使用方法
本发明的rRAAV病毒颗粒和RNA序列可用于将任何GOI/RSI递送到任何合适的靶细胞、组织或生物体,用于任何基因疗法。
在某些实施方式中,本发明的rRAAV病毒颗粒和RNA序列可以用于治疗方法中,其中基因的功能版本可以替代功能缺陷或丧失型疾病基因以恢复丧失的功能。例如,在某些实施方式中,可以将野生型编码序列或编码野生型蛋白的变体蛋白并保留了所述野生型蛋白的至少一种所希望功能的变体编码序列递送至靶细胞/组织/器官,表达其编码的野生型变体,以补偿所述疾病基因的丧失的功能。
在某些其他实施方式中,本发明的rRAAV病毒颗粒和RNA序列可以用于治疗方法中,其中功能缺陷或功能获得性疾病基因可被基因靶向剂敲除、敲低或以其他方式下调,以减轻所述疾病基因的不利影响。所述基因靶向剂可以是CRISPR/Cas效应酶(如本文所述的工程化的Cas9或Cas13效应酶),所述效应酶任选地具有同时(或单独)提供的指导RNA,所述指导RNA共同靶向所述疾病基因。在某些实施方式中,所述基因靶向剂可以是与用于DNA-RNA碱基编辑的DNA或RNA碱基编辑器连接的Cas效应酶。在某些实施方式中,所述基因靶向剂是siRNA、shRNA、微小RNA、或反义RNA。
在某些实施方式中,本发明提供了在靶细胞中修饰靶RNA的方法,所述方法包括使所述靶细胞与编码本文所述的CasPR或工程化的CRISPR/Cas效应酶(或其直系同源物、旁系同源物、变体、衍生物或功能片段)的本发明的rRAAV病毒颗粒或RNA序列接触,其中CasPR/Cas效应酶的指导序列与靶RNA的至少15个核苷酸互补,并且其中所述CasPR/工程化的Cas效应酶与指导序列相关联以形成结合和修饰靶RNA的复合物。
在某些实施方式中,本发明提供了在有需要的受试者中治疗病症或疾病的方法,所述方法包括向受试者施用组合物,所述组合物包含编码本文所述的CasPR或工程化的CRISPR/Cas效应酶(或其直系同源物、旁系同源物、变体、衍生物或功能片段)的本发明的rRAAV病毒颗粒或RNA序列,其中CasPR/Cas效应酶的指导序列与靶RNA的至少15个核苷酸互补,并且其中所述CasPR/工程化的Cas效应酶与指导序列相关联以形成结合和修饰靶RNA的复合物,从而在所述受试者中治疗所述病症或疾病。
在某些实施方式中,通过由CasPR或工程化的Cas效应酶复合物切割来修饰所述靶RNA。在某些实施方式中,通过由包含双链RNA特异性腺苷和/或胞苷脱氨酶的衍生物进行脱氨基来修饰所述靶RNA。在某些实施方式中,所述靶RNA是mRNA、tRNA、rRNA、非编码RNA、lncRNA或核RNA。在某些实施方式中,所述靶RNA在细胞内。在某些实施方式中,所述细胞是癌细胞。在某些实施方式中,所述细胞受感染原感染。在某些实施方式中,所述感染原是病毒、朊病毒、原生动物、真菌或寄生物。在某些实施方式中,所述细胞是神经元细胞(例如,星形胶质细胞、神经胶质细胞(例如,Muller神经胶质细胞、少突胶质细胞、室管膜细胞、许旺(Schwan)细胞、NG2细胞、或卫星细胞))。
在某些实施方式中,所述病症或疾病是癌症或感染性疾病。在某些实施方式中,所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。在某些实施方式中,所述方法是体外方法、体内方法或离体方法。在某些实施方式中,在所述复合物与所述靶RNA结合后,所述工程化的Cas13不会展现出大量的(或可检测的)附带RNA酶活性。
在某些实施方式中,所述病症或疾病是神经病症,如青光眼、与年龄相关的RGC丧失、视神经损伤、视网膜缺血、利伯氏遗传性视神经病变、与RGC神经元退化相关的神经病症、与有需要的受试者的纹状体中功能性神经元退化相关神经病症、帕金森病、阿尔茨海默病、亨廷顿病、精神分裂症、抑郁症、药物成瘾、活动障碍,如舞蹈症、舞蹈手足徐动症和运动障碍、双相障碍、孤独症谱系障碍(ASD)、或功能障碍。
在某些实施方式中,本发明的方法导致以下中的一项或多项:(i)体外或体内诱导细胞衰老;(ii)体外或体内细胞周期停滞;(iii)体外或体内细胞生长抑制和/或细胞生长抑制;(iv)体外或体外诱导无反应性;(v)体外或体外诱导细胞凋亡;以及(vi)体外或体外诱导坏死。
本发明的另外的实施方式
1.一种多核苷酸序列,其包括但不限于核糖核酸(RNA)、脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA,包括具有β-D-核糖构型的LNA、具有α-L-核糖构型的α-LNA(LNA的非对映异构体)、具有2'-氨基官能化的2'-氨基-LNA和具有2'-氨基官能化的2'-氨基-α-LNA)或其杂合体,能够包装到DNA病毒病毒颗粒中,所述多核苷酸序列包含:
(1)感兴趣的多核苷酸序列(PSI),例如,感兴趣的基因(GOI)的RNA编码序列,编码蛋白(例如,治疗性蛋白、抗原蛋白、或基因编辑蛋白如CRISPR/Cas效应酶(简称“Cas蛋白”)、ZFN蛋白、TALEN蛋白)的RNA,例如mRNA,或非编码功能性RNA(例如转运RNA(tRNA)、核糖体RNA(rRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、反义RNA、反义寡核苷酸、微小RNA(miRNA)、或CRISPR-Cas(例如,Cas9、Cas12、Cas13)系统的RNA组分,包括指导RNA(或gRNA),例如单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)、和tracr RNA),或其前体;以及,
(2)多核苷酸包装信号(PPS),所述多核苷酸包装信号能够直接或间接地与PPS相互作用分子相互作用,例如结合,所述RPS相互作用分子促进所述多核苷酸序列包装到所述DNA病毒病毒颗粒中;
任选地,编码或对应于所述多核苷酸序列的DNA序列、或所述DNA序列的反向互补序列具有减少的、减弱的、或基本上没有被包装到所述DNA病毒病毒颗粒中的能力(例如,所述DNA序列或其反向互补序列缺乏DNA包装信号,例如用于AAV包装的功能性AAV ITR)。
2.如任一前述实施方式所述的多核苷酸序列,其中所述DNA病毒病毒颗粒是AAV病毒颗粒或溶瘤病毒颗粒。
3.如任一前述实施方式所述的多核苷酸序列,其中所述PPS位于或靠近所述PSI的5’末端、位于或靠近所述PSI的3’末端、或位于所述PSI的内部(例如,mRNA的内含子内)。
4.如任一前述实施方式所述的多核苷酸序列,其包含相同或不同的多于一个(例如,1、2、3、或更多个)PPS。
5.如任一前述实施方式所述的多核苷酸序列,其中所述多于一个PPS中的两个或更多个(例如,3个)经由相同或不同的接头彼此相邻或串联。
6.如任一前述实施方式所述的多核苷酸序列,其包含彼此不相邻(例如,各自位于或靠近所述感兴趣的多核苷酸序列(PSI)的一个末端)的两个或更多个PPS。
7.如任一前述实施方式所述的多核苷酸序列,其中所述PPS包含转录的经修饰的AAV末端反向重复(ITR),其中所述转录的经修饰的AAV ITR:
(a)包含转录的功能性Rep结合元件(RBE),任选地进一步包含转录的功能性RBE’;以及,
(b)缺乏转录的末端解离位点(TRS)或转录的反向互补TRS(rcTRS),或两者;
任选地,所述转录的经修饰的AAV ITR进一步包含转录的D区序列(D序列或D’序列);和/或
任选地,所述PPS相互作用分子是Rep78、Rep68、Rep52、和/或Rep40。
8.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR在所述RNA的3’末端1000个核苷酸、800个核苷酸、500个核苷酸、300个核苷酸、或200个核苷酸内;任选地,所述转录的经修饰的AAV ITR在聚A序列、聚A信号序列(例如,AAUAAA)、或RNA转录终止序列(例如,组蛋白下游元件)的5’。
9.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR是基于转录的野生型Flip或Flop ITR修饰的;任选地,所述野生型Flip或Flop ITR来自AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、或AAV13(任选地,所述野生型Flop ITR具有SEQ ID NO:1的核苷酸序列)。
10.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR缺乏所述转录的TRS和所述转录的rcTRS两者。
11.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR包含所述转录的D区序列(任选地,所述经修饰的AAV ITR具有SEQ ID NO:3的核苷酸序列)。
12.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR缺乏所述转录的D区序列(任选地,所述经修饰的AAV ITR具有SEQ ID NO:2的核苷酸序列)。
13.如任一前述实施方式所述的多核苷酸序列,其进一步包含第二转录的经修饰的AAV ITR,所述第二转录的经修饰的AAV ITR具有第二转录的功能性RBE序列但缺乏第二转录的TRS或第二转录的rcTRS或两者;任选地,所述第二转录的经修饰的AAV ITR进一步包含第二转录的D区序列。
14.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR和所述第二转录的经修饰的AAV ITR是相同(或不同)的。
15.如任一前述实施方式所述的多核苷酸序列,其中所述转录的经修饰的AAV ITR和所述第二转录的经修饰的AAV ITR(如果存在)包含对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的缺失、对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的突变、或对应的转录的野生型AAV ITR D区序列或对应的转录的野生型TRS/rcTRS中的插入。
16.如任一前述实施方式所述的多核苷酸序列,其中所述第二转录的经修饰的AAVITR在所述多核苷酸序列的5’末端1000个核苷酸、800个核苷酸、500个核苷酸、250个核苷酸、或150个核苷酸内。
17.如任一前述实施方式所述的多核苷酸序列,其中所述PPS包含MS2序列、PP7结合位点、或com结合位点,并且所述PPS相互作用分子包含能够直接或间接地与所述PPS相互作用,例如结合的PPS相互作用蛋白(PPSIP),如对于MS2序列而言的噬菌体衍生的MS2外壳蛋白(MCP)、对于PP7结合位点而言的PP7噬菌体外壳蛋白(PCP)、或对于com结合位点而言的噬菌体COM蛋白(COM)。
18.如任一前述实施方式所述的多核苷酸序列,其中所述PPSIP直接或间接地与以下相关联(例如,融合到以下):所述DNA病毒病毒颗粒的病毒包装系统的蛋白组分(例如腺相关病毒2(AAV2)的Rep78和/或Rep68,或组装激活蛋白(AAP))。
19.如任一前述实施方式所述的多核苷酸序列,其中所述多核苷酸序列包含或优选地不包含转录的DNA包装信号,例如,转录的野生型AAV ITR序列(例如,所述多核苷酸序列包含转录的经修饰的AAV ITR序列,所述转录的经修饰的AAV ITR序列具有对应的转录的野生型AAV ITR序列的核苷酸的添加、缺失、和/或取代以降低所述DNA病毒病毒颗粒的DNA包装能力)。
20.如任一前述实施方式所述的多核苷酸序列,其进一步包含:
(1)转录的转录增强子;
(2)转录的内含子序列或外显子序列(例如用于增强蛋白表达的转录的内含子序列或外显子序列);
(3)5’UTR序列;
(4)3’UTR序列;
(5)聚A序列、或聚腺苷酸化(聚A)信号序列,以及任选地所述聚A信号序列下游的富含GU的区;
(6)转录后调控元件或序列,例如转录的土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE)序列;和/或,
(7)转录终止序列(例如组蛋白下游元件),
任选地,所述多核苷酸序列包含位于所述转录后调控元件或序列的3’和所述聚A序列或聚A信号序列的5’的PPS。
21.如任一前述实施方式所述的多核苷酸序列,其在5’至3’方向包含:所述PSI,任选的转录的WPRE序列;所述PPS(例如所述转录的经修饰的AAV ITR、所述MS2序列、所述PP7结合位点、或所述com结合位点);和所述聚A序列或所述聚A信号序列。
22.如任一前述实施方式所述的多核苷酸序列,其中所述GOI包含蛋白(例如,荧光蛋白、治疗性蛋白、抗原蛋白、或基因编辑蛋白,例如Cas蛋白、ZFN蛋白、TALEN蛋白)、酶(例如Cre蛋白或CRISPR/Cas效应酶,例如,Cas9、Cas12、Cas13、或其变体)、结构蛋白、mRNA、非编码RNA(ncRNA)、siRNA、piRNA、短发夹RNA或shRNA、微小RNA(miRNA)或其前体(包括前体miRNA和初级miRNA)、核糖体RNA(rRNA)、反义序列或寡核苷酸(ASO)、CRISPR-Cas系统的RNA组分,包括指导RNA(或gRNA),例如单指导RNA(或sgRNA、嵌合RNA、RNA嵌合体)、CRISPR RNA(crRNA)和tracr RNA,用于CRISPR/Cas效应酶的指导RNA或gRNA、rRNA、tRNA、snoRNA、snRNA、exRNA、scaRNA、lncRNA、Xist、和HOTAIR。
23.如任一前述实施方式所述的多核苷酸序列,其是长度小于约8,900个核苷酸、长度小于约8,000个核苷酸、长度小于约7,000个核苷酸、长度小于约6,000个核苷酸、长度小于约5,200个核苷酸、长度小于约4,000个核苷酸、长度小于约3,000个核苷酸、长度小于约2,000个核苷酸、长度约4,700-5,200个核苷酸、长度约4,700-5,000个核苷酸、长度约4,700-4,800个核苷酸、或长度约4,700个核苷酸的单链RNA。
24.一种多核苷酸,其包含编码如任一前述实施方式所述的多核苷酸序列的盒;任选地,所述多核苷酸是DNA序列(例如,DNA质粒),所述DNA序列任选地在所述DNA质粒的骨架中包含填充序列,和/或任选地不包含功能性DNA包装信号,例如AAV ITR。
25.如任一前述实施方式所述的多核苷酸,其进一步包含可操作地连接到由所述盒编码的多核苷酸序列并驱动其转录的启动子。
26.如任一前述实施方式所述的多核苷酸,其中所述启动子是遍在启动子。
27.如任一前述实施方式所述的多核苷酸,其中所述启动子是组织特异性启动子。
28.如任一前述实施方式所述的多核苷酸,其中所述启动子是组成型启动子。
29.如任一前述实施方式所述的多核苷酸,其中所述启动子是诱导型启动子。
30.如任一前述实施方式所述的多核苷酸,其进一步包含增强由所述启动子驱动的所述多核苷酸序列的转录的增强子。
31.一种重组DNA病毒病毒颗粒,其包含包装在DNA病毒(如AAV病毒、或溶瘤病毒)的蛋白壳(如衣壳)中的多核苷酸基因组(例如,如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列)。
32.如任一前述实施方式所述的重组DNA病毒病毒颗粒,其中所述DNA病毒是AAV,并且所述重组DNA病毒病毒颗粒是重组多核苷酸腺相关病毒(rPAAV)颗粒,所述重组多核苷酸腺相关病毒颗粒包含:
(1)AAV衣壳;以及,
(2)被包装在所述AAV衣壳内的如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列。
33.如任一前述实施方式所述的重组DNA病毒病毒颗粒,其中所述AAV衣壳包含来自血清型AAV1、AAV2、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV PHP.eB、Anc80L65、Anc80L65AAP、AAVrh74、或7m8的AAV的衣壳。
34.一种重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体,所述群体包含多个如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒),其中所述群体内的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)中的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多具有包装在其中的如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列。
35.一种宿主细胞,其包含如任一前述实施方式所述的多核苷酸序列、如任一前述实施方式所述的多核苷酸、从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列、如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)、和/或如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体。
36.如任一前述实施方式所述的宿主细胞,其进一步包含病毒包装系统,所述病毒包装系统促进如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列被包装到所述DNA病毒病毒颗粒中。
37.如任一前述实施方式所述的宿主细胞,其中所述病毒包装系统包含:
(1)AAV rep基因(例如,Rep78、Rep68、Rep52、和/或Rep40的编码序列)和AAV cap基因(例如,VP1、VP2、VP3、AAP、和/或MAAP的编码序列)或其表达产物,所述AAV rep和AAVcap基因处于驱动所述rep基因和cap基因的转录的一个或多个启动子的转录控制下;
(2)AAV包装所需的一种或多种蛋白的一个或多个编码序列,例如腺病毒E2A、E4、和VA基因,或所述一种或多种蛋白;以及
(3)所述PPS相互作用分子或其编码序列;
任选地,所述病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码如任一前述实施方式所述的多核苷酸序列的多核苷酸上或如任一前述实施方式所述的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码如任一前述实施方式所述的多核苷酸序列的多核苷酸或如任一前述实施方式所述的多核苷酸的大小。
38.如任一前述实施方式所述的宿主细胞,其是哺乳动物细胞(如HEK293细胞)或昆虫细胞(如Sf9或Sf21细胞)。
39.一种生成如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)或如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体的方法,所述方法包括:
a)培养如任一前述实施方式所述的宿主细胞足够的时间,以及
b)收获所述重组DNA病毒病毒颗粒或所述重组DNA病毒病毒颗粒的群体。
40.如任一前述实施方式所述的方法,其进一步包括分离或纯化所述重组DNA病毒病毒颗粒或所述重组DNA病毒病毒颗粒的群体。
41.一种生成重组DNA病毒病毒颗粒(例如,rPAAV颗粒)或重组DNA病毒病毒颗粒的群体的方法,所述方法包括:
a)使病毒包装系统(例如,AAV包装系统)与如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列接触足以产生所述重组DNA病毒病毒颗粒或所述重组DNA病毒病毒颗粒的群体的时间段,以及
b)收获所述重组DNA病毒病毒颗粒或所述重组DNA病毒病毒颗粒的群体;以及任选地,
c)分离或纯化所收获的重组DNA病毒病毒颗粒或重组DNA病毒病毒颗粒的群体。
42.如任一前述实施方式所述的方法,其中所述病毒包装系统(例如,AAV包装系统)包含:
(1)用于组装用以包装所述多核苷酸序列的所述DNA病毒病毒颗粒的蛋白壳的一种或多种蛋白(例如,用于组装AAV衣壳的VP1、VP2、和/或VP3)、或其一个或多个编码序列;
(2)用于促进所述蛋白壳的组装和/或所述多核苷酸序列被包装到所述DNA病毒病毒颗粒的蛋白壳中的一种或多种蛋白(例如,用于AAV包装的Rep78、Rep68、Rep52、和/或Rep40)、或其一个或多个编码序列(例如,腺病毒E2a、E4、和VA基因);以及
(3)所述PPS相互作用分子或其编码序列;
任选地,所述病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码如任一前述实施方式所述的多核苷酸序列的多核苷酸上或如任一前述实施方式所述的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码如任一前述实施方式所述的多核苷酸序列的多核苷酸或如任一前述实施方式所述的多核苷酸的大小。
43.一种将如任一前述实施方式所述的多核苷酸序列或从如任一前述实施方式所述的多核苷酸转录的多核苷酸序列包装到DNA病毒病毒颗粒中的系统,所述系统包含:
(1)用于组装用以包装所述多核苷酸序列的所述DNA病毒病毒颗粒的蛋白壳的一种或多种蛋白(例如,用于组装AAV衣壳的VP1、VP2、和/或VP3)、或其一个或多个编码序列;
(2)用于促进所述蛋白壳的组装和/或所述多核苷酸序列被包装到所述DNA病毒病毒颗粒的蛋白壳中的一种或多种蛋白(例如,用于AAV包装的Rep78、Rep68、Rep52、和/或Rep40)、或其一个或多个编码序列(例如,腺病毒E2a、E4、和VA基因);以及
(3)所述PPS相互作用分子或其编码序列;
任选地,所述病毒包装系统将DNA序列包装到所述DNA病毒病毒颗粒中的能力通过例如以下来减少、减弱、或基本上消除:(1)去除编码如任一前述实施方式所述的多核苷酸序列的多核苷酸上或如任一前述实施方式所述的多核苷酸上的DNA包装信号例如AAV ITR的部分或全部,(2)修饰,例如突变所述AAV rep基因、所述AAV cap基因、和/或AAV包装所需的一种或多种蛋白的所述一个或多个编码序列,以减少、减弱、或基本上消除相应的翻译的蛋白促进所述DNA序列被包装到所述DNA病毒病毒颗粒中的能力(例如,Rep78和Rep68蛋白的共有序列中的Y156F突变、KDE-mu、或EKE-mu);和/或(3)扩大编码如任一前述实施方式所述的多核苷酸序列的多核苷酸或如任一前述实施方式所述的多核苷酸的大小。
44.一种将感兴趣的基因(GOI)递送至细胞、植物、或动物的方法,所述方法包括使所述细胞、植物、或动物与如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)、如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体、或通过如任一前述实施方式所述的方法产生的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)或重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体接触,其中所述GOI由所述多核苷酸序列(如任一前述实施方式所述)编码。
45.一种将感兴趣的多核苷酸序列(PSI)递送至细胞、植物、或动物的方法,所述方法包括使所述细胞、植物、或动物与如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)、如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体、或通过如任一前述实施方式所述的方法产生的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)或重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体接触。
46.一种在有需要的受试者中诊断、预防、或治疗疾病或障碍的方法,所述方法包括向所述受试者施用治疗有效量或剂量的如任一前述实施方式所述的或通过如任一前述实施方式所述的方法产生的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体。
47.如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)、如任一前述实施方式所述的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体、或通过如任一前述实施方式所述的方法产生的重组DNA病毒病毒颗粒(例如,rPAAV颗粒)或重组DNA病毒病毒颗粒(例如,rPAAV颗粒)的群体在制造用于诊断、预防、或治疗有需要的受试者的疾病或障碍的药物中的用途。
实施例
下文提供的实施例用于说明本发明的几个示例性实施方式,并且在任何方面都不是限制性的。
实施例1 RNA高效包装到RAAV病毒颗粒中
这个实施例证明,RNA载体基因组可以高效地包装到AAV病毒衣壳中,特别是使用设计用于直接包装到AAV衣壳内的经修饰/重组RNA。
首先,出人意料地显示,当转录(作为RNA)时,AAV包装信号-ITR(DNA)能够促进本发明的RNA序列(例如,rRAAV载体基因组RNA)包装到AAV颗粒中,尤其是当它以某些构型存在时(例如,当转录的经修饰的AAV ITR序列接近本发明的转录的RNA序列的3’末端时)。
特别地,将来自AAV载体基因组末端的野生型和经修饰的AAV ITR序列(DNA)移动到其各相应的转基因表达盒中,以确保所有转基因转录本(RNA)都含有候选包装信号。为了在RAAV生产过程中阻断具有ssDNA基因组的传统的AAV载体的生产,使用优化的ITR(dITR和dITR-D)代替野生型ITR(表2)。
表2:测试的ITR的核酸序列
特定地,在Flop构型中的野生型AAV2 ITR(ITR2)序列中,TRS(“TTGGC”)位于所述ITR的5’末端,并且其反向互补序列GCCAA加双下划线。这种序列可以以任一方向克隆到编码质粒中(即,SEQ ID NO:1所示的序列或其反向互补序列可以用作模板以转录本发明的RNA序列)。在本文的实验中,野生型AAV2 ITR序列以这样的方向克隆,使得转录的RNA具有与SEQ ID NO:1(或下文的SEQ ID NO:2或3)相同的序列,除了所述转录的RNA中的T被U取代。无论如何,在转录这种序列或其反向转录本后,所得野生型ITR2的转录的RNA包含回文的转录的RBE(灰色阴影)。在本文的实验中,转录的RNA包含与SEQ ID NO:1等效的转录的野生型AAV2ITR,除了所有T被U取代。如果使用SEQ ID NO:1的反向互补序列作为DNA模板,转录的RNA将包含由GCCAA编码的转录的TRS(UUGGC)。所述转录的TRS位于转录的RBE与转录的D序列之间。
经修饰的ITR序列中的一个是“δITR”(或简称“dITR”),其是有缺陷的,因为除了第一个G之外,所述dITR缺乏D区序列(粗体斜体)、5’末端处的TRS和反向互补TRS序列(“GCCAA”)。当这种序列转录后,dITR的转录的RNA还包含回文的转录的RBE(灰色阴影)和缺乏由GCCAA编码的转录的TRS(UUGGC)的转录的缺陷ITR。然而在本实验中,以SEQ ID NO:2的反向互补序列作为DNA模板,使得所述转录的RNA包含与SEQ ID NO:2具有相同序列的转录的经修饰的AAV2 ITR(转录的dITR),除了所有T被U取代。
另一种经修饰的ITR序列是“dITR-D”,其也是有缺陷的,因为它保留了其D序列(“CTCCATCACTAGGGGTTCCT”,SEQ ID NO:4),但缺乏5’末端TRS(TTGGC)。此外,只有反向互补TRS(GCCAA)中的第一个G保留在dITR-D中,并且剩余的CCAA序列被不相关的ACTAG序列替换。在本实验中,以SEQ ID NO:3的反向互补序列作为DNA模板,使得所述转录的RNA包含与SEQ ID NO:3具有相同序列的转录的经修饰的AAV2 ITR(转录的dITR),除了所有T被U取代。
注意dITR和dITR-D序列都保留了阴影回文RBE序列SEQ ID NO:5(CTGCGCGCTCGCTCGCTCACTG...CAGTGAGCGAGCGAGCGCGCAG),并且其相应的转录的经修饰的ITR也具有RBE序列。
将这种优化的ITR编码序列(DNA)插入tdTomato表达盒的两个位置,一个位于启动子和tdTomato编码序列之间,另一个位于土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE)与SV40聚A信号之间。
基于所使用的优化的ITR的序列、数量和位置,构建了一系列不同的基于ITR的RAAV载体(参见图3)。
使用具有ssDNA载体基因组且两个末端没有ITR序列(“CTWS”,代表序列元件CAG启动子、tdTomato转基因、WPRE序列和SV40聚A信号序列)的传统的AAV载体作为对照。对于此实验,选择AAV血清型DJ是因为其在所使用的培养细胞中具有优异的转导效率。AAV-DJ是合成血清型,具有AAV-2、8和9的嵌合衣壳。其衣壳中含有肝素结合结构域,所述衣壳可以高效地转导多种细胞类型并逃避免疫中和(Grimm等人,J.Virol.[病毒学杂志]82:5887-5911,2008)。
各种RAAV-ITR病毒颗粒和对照病毒颗粒均通过使用三质粒转染系统生成(图4)。
特别地,通过将转基因质粒、包装质粒和辅助质粒(重量比为1:1:2)共转染到HEK293T细胞中来生成RAAV载体。将HEK293T细胞在感受态DMEM培养基中培养,并且转染前24小时接种细胞。转染前,将培养基更换为含有2%FBS的新鲜DMEM。将PEI-MAX用作转染试剂。然后在转染后第2天和第5天收集上清液,并在第5天收获转染的细胞。将RAAV载体通过使用碘克沙醇密度梯度超速离心纯化。
病毒滴度(DNA滴度和RNA滴度)分别通过Q-PCR和逆转录-PCR(RT-PCT)使用图5A中的程序确定。
简而言之,将收获和纯化的RAAV病毒颗粒首先在37℃下进行DNA酶I和RNA酶I处理2小时,以去除病毒颗粒蛋白壳外的所有核酸。接下来,将核酸酶在100℃下变性约30min,然后将RAAV病毒颗粒变性并破裂以释放RAAV核酸内容物用于进一步分析。
将Q-PCR用于分析核酸酶抗性产物,以滴定衣壳化在RAAV病毒颗粒内的DNA载体基因组。特别的,在一组Q-PCR中使用对启动子序列特异的引物对来检测/定量任何功能性DNA,并在另一组Q-PCR中使用对WPRE序列特异的引物对来检测/定量衣壳化在RAAV病毒颗粒中的任何DNA载体基因组。参见图5B。
同时,在另一个样品中,首先通过DNA酶I消化去除任何RAAV衣壳化的DNA,然后将剩余的RNA进行逆转录,并且将得到的cDNA用作Q-PCR模板,用于检测/定量转录成RNA的WPRE序列。为了检测/定量不完全DNA去除后可能存在的任何残留DNA,将DNA去除步骤后的样品使用Q-PCR直接扩增,以检测所述样品中可能存在的任何WPRE(DNA)序列。参见图5A。
为了测试CITWS构建体的包装效率(参见图6A),当使用传统的pssDNA构建体(两端具有野生型ITR序列)来生成病毒颗粒时,绝大多数病毒颗粒含有具有启动子序列和WPRE序列的功能性DNA载体基因组。非常偶尔地(两个数量级,或约1%的时间),RNA载体基因组也包装到病毒颗粒中(参见标记为“RNA”的条形,比标记为“DNA”和“功能性DNA”的条形低约2个数量级)。残留DNA比包装后的RNA载体基因组低一个数量级。
同时,从AAV载体基因组两端移除ITR序列基本上取消了包装-图6A中的CTWS构建体(无ITR)产生的包装DNA低2-2.5个数量级,甚至更少的RNA。
与CTWS对照相比,在启动子的3’与GOI编码序列的5’之间仅添加一个优化的ITR序列(dITR或dITR-D序列)似乎不会增强RNA包装,尽管DNA包装似乎略有改善。参见图6A。
有趣的是,在图6B中获得了非常不同的结果,其中测试了CTWIS构建体。特别地,关于包装pssDNA构建体(比较图6A和图6B),获得了基本相同的结果-大多数包装的病毒颗粒含有DNA(99%或更多)和可忽略量(1%或更少)的RNA。然而,在WPRE序列的3’末端与聚A序列的5’末端之间加入优化的ITR序列(dITR)显著降低甚至逆转DNA与RNA之间的包装效率的差异。当使用dITR-D序列时,当绝大多数包装的核酸是RNA(比包装的DNA高1-2个数量级)时,这种作用更加突出。
如果在CITWIS构建体中的启动子与GOI编码序列之间插入一个额外(即第二个)优化的ITR序列,则获得基本上相同的结果。参见图6C。
这些结果表明,优化的ITR(dITR和dITR-D)损害了传统的AAV载体的复制,从而导致包装到RAAV病毒颗粒中的DNA减少。
与对照载体CTWS(无ITR)和RAAV-dITR载体相比,具有dITR-D优化ITR的RAAV载体似乎有更好将转录的mRNA直接衣壳化到RAAV颗粒中的能力,尤其是当dITR-D ITR位于mRNA编码序列和WPRE序列的下游(例如,刚好在聚A信号的5’)。参见图6A-6C。相比之下,位于mRNA编码序列上游的dITR-D序列(例如,刚好在表达构建体中的启动子序列之后)几乎不会促进mRNA直接包装到RAAV病毒颗粒中。同时,如果将另一个dITR-D序列插入mRNA编码序列的下游(例如,刚好在聚A序列的5’),则所得RAAV mRNA的包装类似高度地增加(图6C)。
总之,在其mRNA基因组两端携带dITR-D信号的CITWIS-D具有最好的衣壳化特异性mRNA的能力,尽管其产量(携带mRNA的颗粒)比传统的具有ssDNA载体基因组的AAV载体(pssAAV组)低20倍。与传统的AAV载体不同,RAAV载体CITWIS-D具有受损的DNA包装,其携带DNA的颗粒仅占RAAV载体存量的约20%或更少,并且携带功能性DNA的颗粒的百分比甚至更低(例如,小于10%)(图6A-6C)。
由于AAV包装容量有限(<4700nt),可以通过扩大转基因质粒的大小来减少不希望的RAAV DNA包装,可以通过增加转基因盒的长度,例如,通过将顺式作用元件(如增强子、内含子等)或非功能性填充序列插入盒中来进一步减少功能性DNA包装。
实施例2 RAAV病毒颗粒具有功能性
这个实施例证明,受试的RAAV-dITR-D载体具有感染性,并且可作为基因递送载体。
用相同体积的纯化RAAV-dITR-D(CITWIS-D)载体在体外以约50,000的相同MOI(CITWIS-D载体的MOI由DNA颗粒数和mRNA颗粒数之和计算)感染2×105个HEK293T细胞。
特别地,在感染前约24小时将HEK293T细胞接种于24孔板。然后将RAAV载体与1mLDMEM(含2%FBS)完全混合。然后除去细胞的培养基,并且将细胞与混合的RAAV载体一起孵育过夜。感染后3天和5天拍摄荧光照片。
结果表明,CITWIS-D载体对tdTomato的表达比其他载体快,但表达也迅速下调(参见图7B)。这种快速表达和降解现象可能是由于其mRNA基因组的寿命短(图7B)。
有趣的是,没有任何ITR序列的CTWS构建体显然在某种程度上被包装,尽管这种包装背后的确切机制尚不清楚。当使用CTWS载体时,至少有两种可能性可以解释mRNA载体基因组的包装:过表达的细胞mRNA可以非特异性地包装到RAAV载体中,或者CTWS mRNA可能具有一些与Rep2或Cap-DJ相互作用的RNA结构。同时,CTWS DNA包装可能是由于CTWS质粒的尺寸较小,并且增大CTWS质粒的尺寸可能会减少DNA包装。
实施例3 RNA高效包装到RAAV颗粒中
这个实施例证明,RNA基因组可以高效地包装到AAV衣壳内,特别是使用本文设计的用于直接包装到AAV衣壳内的经修饰/重组RNA,以产生RAAV颗粒。
1.设计
诸位发明人已经设计了一种策略,利用细菌噬菌体衍生的MS2外壳蛋白(MCP)与其识别茎环MS2之间的强相互作用作为将异源RNA包装到DNA病毒病毒颗粒中的新颖包装信号。
首先,为了在RAAV生产过程中抑制/减少具有包装的ssDNA基因组的传统的AAV颗粒的生产,除去传统的AAV包装信号-ITR。相反,将RNA包装信号(RPS),即MS2茎环(或简称“MS2”,其RNA序列在下面的序列表中列出)的一个拷贝或三个拷贝插入tdTomato表达盒中,位于土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE)与SV40聚A信号之间,以确保所有转录的mRNA都具有RPS,从而被结合蛋白,即细菌噬菌体衍生的MS2外壳蛋白(或简称“MCP”,其氨基酸序列示于下表)(对应于MS2)识别(图8A)。
由于AAV Rep蛋白是非结构蛋白,并且它们通常在AAV包装过程中充当ssDNA基因组的ITR与AAV衣壳之间的桥梁,因此将MCP融合到来自AAV2的Rep78蛋白和Rep68蛋白的N末端(Rep 68是Rep 78的C末端截短,两种融合物的氨基酸序列在下面的序列表中列出)。验证了这些MCP-Rep78/68融合物与RNA基因组内的MS2序列相互作用以及促进将RNA基因组包装到AAV衣壳内的能力。
使用传统的AAV载体pssAAV-tdTomato(具有两个野生型功能性ITR)和不具有功能性野生型ITR的CTWS(“CTWS”,代表序列元件CAG启动子、tdTomato转基因、WPRE序列和SV40聚A信号序列)作为对照(图8A)。在本实施例中,由于AAV血清型DJ(“AAV-DJ”或“DJ”)在本实施例中使用的培养细胞HEK293T细胞中具有优异的转导效率,因此选择使用所述AAV血清型DJ。AAV-DJ是合成血清型,具有AAV-2、8和9的嵌合衣壳。
2.RAAV包装与生产
本文使用传统的三质粒转染系统加以必要的变通,将相应的转基因质粒、包装质粒和辅助质粒以1:1:2的质量比共转染到HEK293T细胞,产生了RAAV和对照AAV颗粒。
特别地,将HEK293T细胞在感受态DMEM培养基中培养,并且转染前24小时接种细胞。转染前不久,将培养基更换为含有2%FBS的新鲜DMEM。将PEI-MAX用作转染试剂。在转染到感染细胞后,携带RPS的转基因质粒转录以生成待包装的RNA基因组。然后在转染后第2天和第5天收集上清液,并在第5天收获转染的细胞。将RAAV和对照AAV颗粒通过使用碘克沙醇密度梯度超速离心纯化。
3.包装的基因组的检测
将纯化的RAAV和对照AAV颗粒首先在37℃下进行核酸酶(包括DNA酶I和RNA酶I)处理2小时,以去除病毒颗粒外可能存在的核酸。接下来,将核酸酶和RAAV或对照AAV颗粒通过蛋白酶K/SDS消化在65℃下变性约3小时以使所述病毒颗粒破裂,以释放包装在其中的基因组。然后通过苯酚/氯仿提取,将含有释放的病毒基因组的核酸酶抗性多核苷酸提取和纯化。
为了检测对照AAV和RAAV颗粒的DNA基因组滴度,使用Q-PCR直接分析核酸酶抗性多核苷酸。在Q-PCR中使用一对特异于病毒基因组上的WPRE序列的WPRE引物(如下面的序列表所示)来检测并定量衣壳化在对照AAV或RAAV颗粒中的任何DNA基因组。
为了检测对照AAV和RAAV颗粒的RNA基因组滴度,在衣壳化的RNA基因组进行逆转录之前,通过DNA酶I消化去除DNA来去除任何对照AAV-或RAAV衣壳化的DNA基因组,并且将所得cDNA作为Q-PCR模板,用上述相同的WPRE引物对检测和定量WPRE序列。为了检测和定量由于DNA去除不完全而可能存在的任何潜在残留DNA,在DNA去除步骤后使用Q-PCR直接扩增(无逆转录)样品,用上述相同的WPRE引物对检测WPRE(DNA)序列,所述引物也用于所有其他对WPRE序列特异性的PCR反应。
4.包装效率的比较
当使用含有pssAAV-tdTomato构建体(两端具有野生型ITR)的传统的转基因质粒和用于AAV-DJ的传统的包装质粒来生产对照AAV颗粒时,绝大多数颗粒含有具有WPRE序列的DNA基因组。非常偶尔地,RNA基因组也包装到颗粒中(参见标记为“RNA”的条形,比标记为“DNA”的条形低约5个数量级)。残留DNA的存在与RNA的存在相当,这可能是由于在逆转录之前,DNA酶I对包装的DNA基因组的消化效率低。
有趣的是,当用重组包装质粒DJ-MCP(融合在Rep78和68蛋白N末端的MCP)代替DJ时,DNA基因组的包装略有降低(低约0.5个数量级),但病毒基因组分布的模式几乎相同,其中DNA包装比RNA包装高约5个数量级。这一结果表明,将MCP融合到Rep78/68蛋白的N末端并没有显著地损害它们的自然功能(图8B)。
同时,从pssAAV-tdTomato构建体两端去除ITR,导致产生CTWS构建体,显著消除了DNA包装。无论使用哪种包装质粒(DJ或DJ-MCP),CTWS构建体(无ITR)产生的包装DNA低约4个数量级,甚至更少的包装RNA。
此外,通过在无ITR的病毒基因组上的WPRE的3’与SV40聚A信号的5’之间添加RPS(MS2)的一个或三个拷贝,分别获得了RAAV转基因质粒、CTWMS和CTWM3S。在没有MCP的情况下,CTWMS和CTWM3S构建体几乎不能被作为DNA或RNA基因组衣壳化,就像CTWS的基因组分布模式一样。令人惊讶的是,使用DJ-MCP代替DJ作为包装质粒显著逆转了DNA与RNA基因组之间的包装效率差异,并且绝大多数包装的基因组是RNA。
与CTWS/DJ-MCP相比,CTWMS/DJ-MCP和CTWM3S/DJ-MCP的包装的RNA基因组数目分别高100倍和400倍,而三者的DNA包装数目无明显差异。这一结果表明,MCP-Rep78/68融合物能够特异性地识别嵌在CTWMS和CTWM3S质粒的RNA转录本中的RPS、MS2,并促进它们的RNA包装到RAAV颗粒中,并且在CTWM3S构建体中RPS的三个拷贝比一个拷贝提供了更好的RNA包装效率(图8B)。
总之,将MS2/MCP对引入传统的AAV包装系统能够在MCP-Rep78/68融合物存在下将携带MS2的RNA基因组包装到AAV颗粒中,从而生成RAAV颗粒。不希望的DNA包装仅占使用CTWM3S/DJ-MCP产生的整个病毒颗粒群的约10%。
换句话说,人工/异源RNA包装信号(RPS)-MS2序列-可以与其同源结合蛋白MCP一起使用,以替代天然DNA病毒包装信号对(即ITR和Rep),以显著增强RNA包装到另一种DNA病毒中的效率,同时抑制DNA到相同的DNA病毒中的其固有包装。
实施例4扩大的质粒骨架减少了RAAV的不希望的DNA包装
这个实施例证明,通过将填充序列插入到质粒的骨架中来增加AAV转基因质粒的骨架大小可以减少不希望的DNA包装到RAAV颗粒中。
尽管实施例3中用于RAAV颗粒的CTWMS和CTWM3S构建体没有ITR,并且在RAAV生产中不存在反向包装,但推测RAAV转基因质粒的相对小尺寸(5-6kb)仍然可能导致不希望的DNA包装。
因此,将3266bp的非编码序列(填充序列;见以下序列表)插入到CTWM3S的tdTomato表达盒的上游,以增加CTWM3S转基因质粒的骨架长度,并将所得构建体命名为L-CTWM3S。质粒的示意图如图9A所示。
将实施例3中使用的传统的AAV基因组构建体pssAAV-tdTomato和RAAV基因组构建体CTWM3S用作本文的对照。与实施例3相同,通过将CTWM3S或L-CTWM3S转基因质粒与包装质粒DJ-MCP和辅助质粒共转染到HEK293T细胞来制备RAAV颗粒,并且将所得RAAV颗粒纯化并对病毒基因组定量。将同一对WPRE引物用于检测和定量衣壳化在AAV和RAAV颗粒中的任何DNA和RNA基因组,将另外一对特异于病毒基因组中CAG启动子序列的CAG引物用于Q-PCR中,以检测并定量任何功能性DNA(即含有CAG启动子序列并能够表达功能性转基因蛋白的DNA)。
注意到包装的RNA基因组不能用CAG引物检测到,因为它们不含CAG启动子,并且具有CAG引物的图中的RNA柱代表背景RNA信号(参见图9B)。
令人惊讶的是,无论在Q-PCR中使用哪对引物,L-CTWM3S组的DNA基因组滴度都比CTWM3S组的滴度低约2倍(参见图9B和9C)。CTWM3S和L-CTWM3S组的RNA基因组滴度基本等效(参见图9C)。由于在来自CTWM3S和L-CTWM3S转基因质粒的转录的RNA中没有CAG启动子序列,因此包装的RNA基因组只能用一对WPRE引物检测(图9C)。
总之,增加转基因质粒的骨架长度可以减少RAAV颗粒的不希望的DNA包装而不干扰其RNA包装,这表明AAV颗粒中DNA包装系统的解构和RNA包装系统的建立是两个单独的线,并且将所述长填充序列用于后续实施例中的RAAV转基因质粒。
实施例5使用RAAV-MS2/MCP系统用于额外的转基因
为了验证RAAV-MS2/MCP系统对额外的转基因的普遍适用性,并确保观察到的RNA包装不仅仅是与所使用的报告基因相关的伪影,生成了含有Cre重组酶表达盒的一系列AAV和RAAV转基因质粒。
将传统的pssAAV-Cre(图8A中pssAAV-tdTomato构建体中的tdTomate编码序列替换为Cre编码序列)和对应的L-CCWS构建体(图8A中CTWS中的tdTomate编码序列替换为Cre编码序列,并插入实施例4中的填充序列)作为对照,其中第二个C代表Cre重组酶转基因。在将tdTomate编码序列替换为Cre编码序列后,将实施例4中的L-CTWM3S构建体也重新设计为L-CCWM3S构建体。
将Cre转基因质粒与包装质粒DJ或DJ-MCP以及辅助质粒一起共转染在HEK293T细胞中,分别产生AAV和RAAV颗粒。将所得病毒颗粒纯化,并如实施例3中所述对病毒基因组定量。
对于AAV-Cre和RAAV-Cre,获得了与AAV-tdTomato和RAAV-tdTomato相同的病毒基因组分布结果。对于pssAAV-Cre,大多数病毒颗粒含有DNA基因组,并且DNA基因组滴度比RNA基因组滴度高约4-5个数量级。对于L-CCWS,由于缺乏DNA和RNA包装信号两者,DNA和RNA基因组几乎没有衣壳化。对于L-CCWM3S,与L-CCWS/DJ-MCP相比,DJ-MCP情况下的RNA包装显著提高了约200倍,并且不希望的携带DNA的病毒颗粒仅占整个病毒颗粒群体的约1%(图10A和10B)。
由于DJ-MCP融合物不仅有助于RNA包装,而且保留了DNA包装能力,因此在同时含有DNA包装信号(ITR)和RNA包装信号(MS2的3个拷贝)的构建体中评估了其性能,所述构建体是通过在pssAAV-Cre构建体的WPRE与SV40聚A之间插入MS2的3个拷贝构建而成的,命名为pssAAV-Cre-MS2X3。结果表明,在不存在MCP的情况下,大多数病毒颗粒含有包装的DNA基因组,在有或无RNA包装信号时只有可忽略量的RNA基因组被包装。当使用DJ-MCP代替DJ作为包装质粒与RNA结合信号组合时,RNA包装显著改善,并且令人惊讶的是,增加的RNA包装并没有显著干扰pssAAV-Cre-MS2X3构建体的DNA包装(图11B)。另一种观点也表明,即使不去除DNA包装信号-ITR,MS2/MCP对的引入也能显著增加RNA包装,这表明AAV颗粒中DNA包装系统的解构和RNA包装系统的建立是两个单独的线,并且去除ITR并不是通过引入RPS/RBP对来增加RNA包装的必要基础。
总之,所述受试的RAAV-MS2/MCP系统通常可应用于任何转基因,如上所示的Cre重组酶。有趣的是,RAAV-Cre构建体比RAAV-tdTomato构建体产生了更好的产量。虽然不希望受任何特定理论的束缚,但这可能是由于与tdTomato mRNA相比,Cre mRNA的二级结构更简单,这是基于在线RNA二级结构预测,如在rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi上发现的预测。
实施例6 RAAV生产系统的优化和优化的RAAV颗粒特性的鉴定
Rep68和Rep78蛋白(Rep68/78)的核酸内切酶活性对于AAV颗粒的传统的DNA包装过程中的DNA基因组复制至关重要。如果没有功能性trs-核酸内切酶,就不能释放新合成的病毒ssDNA用于包装。在本实施例中研究了是否可以通过破坏trs-核酸内切酶的活性来进一步减少RAAV颗粒的不希望的DNA包装。
为研究此,构建了三个trs-核酸内切酶阴性突变体,即DJ-MCP(Y156F,其中Y156F突变位于Rep68和Rep78蛋白的共有序列中,即Rep68-Y156F和Rep78-Y156F)、DJ-MCP(KDE-mu)和DJ-MCP(EKE-mu)(参见下面的序列表)。
首先用含有DNA和RNA包装信号两者的转基因质粒pssAAV-Cre-MS2X3(如实施例5中所述)评估DJ-MCP(Y156F)的DNA和RNA包装效率。将DJ和DJ-MCP设置为包装质粒对照。如实施例3所述产生、纯化和滴定病毒颗粒。
结果表明,DJ-MCP中的Y156F突变显著降低了ITR介导的pssAAV-Cre-MS2X3的DNA包装,而不干扰RNA包装。
因此,除了如前面实施例中所示去除DNA包装信号ITR外,还可以修饰例如突变参与DNA包装过程的功能性蛋白(如Rep78/68蛋白),以削弱或消除其与DNA包装相关的功能,这可以作为减少或抑制AAV颗粒的传统的DNA包装的另一种策略(图13A)。
然后,将实施例5中的L-CCWM3S用作RAAV转基因质粒来代替pssAAV-Cre-MS2X3,以提供病毒基因组。将trs-核酸内切酶阳性的DJ-MCP用作针对DJ-MCP(Y156F)的对照。如实施例3所述产生、纯化和滴定病毒颗粒。此处使用两对引物滴定病毒基因组,一对用于靶向上述WPRE序列,另一对(参见下面的序列表)用于靶向Cre编码序列的5’末端。
结果表明,Rep78/68蛋白中的Y156F突变不仅使不希望的DNA包装减少了约10倍,而且使希望的RNA包装增加了约50%。对于Q-PCR中使用的两对引物(即,WPRE引物对和Cre引物对),包装的DNA与RNA基因组之间的包装效率差异模式基本相同(图12A-12B)。
还测试了两种其他的trs-核酸内切酶突变体DJ-MCP(KDE-mu)和DJ-MCP(EKE-mu),并证明其具有与DJ-MCP(Y156F)相同的减少不希望的DNA包装的能力,但只有DJ-MCP(Y156F)显示出改善的RNA包装(图13B)。
进一步证明,将MCP的两个拷贝融合到Rep 78/68蛋白的N末端(MCPx2-Rep78和MCPx2-Rep68)也可以实现减少不希望的DNA包装的结果(图13B)。
通过银染SDS-PAGE分析AAV和RAAV颗粒的组成,RAAV衣壳也由三种VP蛋白(VP1、VP2和VP3)构成,其中VP1/2/3比率与传统的AAV颗粒相似(图12C)。
为了分析RAAV颗粒的形态,将10μL纯化的AAV和RAAV颗粒放置在300μm碳包覆聚乙烯醇缩醛(Pioloform)涂层的铜网上,并在室温下孵育2min。用滤纸将多余的样品吸干,立即用10μL染色剂(3%磷钨酸)代替,静置2min,然后再次吸干。通过使用Talos L120C透射电子显微镜对样品进行可视化。RAAV颗粒在形态上与传统的AAV载体相似,其中包裹基因组的完整病毒颗粒被视为25-nm实心球体,而没有包裹基因组的空病毒颗粒是25-nm甜甜圈状结构(图12D)。
总之,参与AAV生产中DNA包装过程的功能性蛋白(包括Rep蛋白)的突变以削弱或消除其DNA包装相关功能并去除DNA包装信号ITR,这是减少或抑制RAAV颗粒不希望的DNA包装的最佳策略。产生的RAAV颗粒具有与传统的AAV颗粒相似的组成和形态。
实施例7表达功能性蛋白的RAAV载体
这个实施例证明,受试的RAAV载体具有感染性,并且可作为基因递送载体。
Cre-loxP系统是高度敏感的系统,用于研究本发明的RAAV载体的感染性。将从homo-Ai9(携带loxP-tdTomato-报告基因系统)小鼠分离的小鼠胚胎成纤维细胞(MEF)与实施例5中纯化的AAV(pssAAV-Cre/DJ)或RAAV(L-CCWM3S/DJ-MCP(Y156F))载体孵育过夜,并设置感染复数(MOI)(感染期间每个细胞添加的病毒粒子数),包括对于传统的AAV载体的7个MOI和对于RAAV载体的3个MOI。将通过用上述5’末端Cre引物检测Cre编码序列定量的优势基因组滴度用作感染滴度。换句话说,将DNA基因组滴度用于传统的AAV载体,而将RNA基因组滴度用于RAAV载体。
特别地,在感染前约24小时将Ai9-MEF细胞以约5×104个细胞/孔接种于48孔板。然后将AAV载体或RAAV载体与0.5mL含2%FBS的DMEM完全混合。除去接种的细胞的培养基,然后将所述细胞与混合的AAV或RAAV载体一起在37℃下孵育过夜。在不同时间点收集感染的细胞并进行RNA和DNA分析。如前所述,一对靶向Cre编码序列5’末端的引物用于检测衍生自载体的特异性Cre编码DNA和mRNA。感染后(p.i)每天拍摄荧光照片,并在感染后5天通过流式细胞术对荧光阳性细胞进行定量。
mRNA分析结果表明,早在感染后2小时,在感染RAAV的细胞中检测到特异性mRNA,在感染后6小时达到峰值,然后下降。在感染了传统的AAV载体的细胞中,在感染后2小时未检测到明显的转录,但在感染后6小时至20小时观察到转录的mRNA快速增加,在30小时达到平台期。与RAAV载体的结果相反,用传统的AAV载体感染的细胞中的mRNA水平在达到平台期后并没有降低。在所有样品中Cre mRNA的拷贝数与MOI呈正相关(图14A-14B和图15A)。同时,将mGAPDH mRNA作为参考转录物(管家基因)进行测试,正如预期的那样,所有样品中的mGAPDH mRNA水平没有差异(图15C)。
DNA结果与mRNA结果完全不同。传统的AAV和RAAV载体具有基本相同的DNA拷贝数模式,大部分DNA基因组早在感染后2小时就在感染的细胞中检测到,然后从感染后2小时到20小时略有增加,这非常类似于感染RAAV的细胞中mRNA水平的趋势。之后,DNA水平达到平台期或缓慢下降。Cre DNA的拷贝数还与所有样本中的MOI呈正相关,但在感染RAAV的细胞中检测到的Cre DNA数量要低得多(RAAV-CCWM3S MOI=100或300组的DNA拷贝数小于AAV-Cre MOI=1组的DNA拷贝数,并且RAAV-CCWM3S MOI=1000组的DNA拷贝数小于AAV-Cre MOI=3组的DNA拷贝数)(图14C和图15B)。类似地,将另一个管家基因36B4的DNA水平定量为参考基因,并且正如预期的那样,在所有样品之间没有观察到DNA水平的明显差异(图15D)。
成功感染AAV-Cre或RAAV-CCWM3S载体将导致功能性Cre重组酶的表达并拯救Ai9-MEF细胞中的tdTomato表达,因此拍摄并分析感染的细胞的荧光照片以通过计数散发tdTomato红色荧光的细胞来评估病毒载体的感染性。结果显示由RAAV-CCWM3S生成的荧光阳性细胞的数量与由具有低10倍MOI的AAV-Cre生成的数量相当(图14D)。感染RAAV的细胞中tdTomato的较低荧光强度可能是由于递送到其中的Cre mRNA的寿命短,以及有限量的翻译的Cre重组酶无法拯救homo-Ai9-MEF细胞中tdTomato表达盒的两个拷贝(图16)。
通过比较DNA滴度和细胞计数数据的结果,表明RAAV-CCWM3S感染的细胞中的大部分tdTomato红色荧光信号是由携带Cre mRNA的RAAV颗粒生成的。
总之,本发明的RAAV载体可以将功能性Cre mRNA递送到细胞中,并表达功能性Cre重组酶。
实施例8 RAAV颗粒将功能性基因体外瞬时转移到细胞中
为确定如实施例7中经由AAV-Cre或RAAV-CCWM3S递送产生的Cre蛋白的确切寿命,在感染前24小时,以5×104个细胞/孔的细胞汇合度接种Ai9-MEF细胞,然后如上所述,与AAV-Cre(MOI=300)或RAAV-CCWM3S(MOI=10,000)载体孵育过夜。感染后,在几个时间点收集细胞,并在细胞收集前拍摄荧光照片。
对于AAV-Cre,Cre表达在前4天增加,但随后下降。相比之下,早在RAAV-CCWM3S转移后约24小时就检测到少量Cre,并在第2天后消失。这种快速表达和降解现象可能是由于递送的功能性Cre mRNA的即时出现和寿命短(图17A和17B)。
实施例9 RAAV颗粒将功能性基因体内瞬时转移到Ai9小鼠中
这个实施例证明,RAAV颗粒可用作体内基因传递的工具并瞬时表达功能性Cre重组酶。
为研究RAAV颗粒在体内的感染性,将Ai9-小鼠(2.5-4月龄)麻醉并且分别向右侧海马体内(其坐标如下:前后(A/P)=-1.7mm,中外侧(M/L)=-1.0mm,背腹侧(D/V)=-2.1mm)注射1μL AAV-Cre(pssAAV-Cre/DJ)(高剂量:1E9 Vg/小鼠;低剂量:3E6 Vg/小鼠)或1μL RAAV-Cre(L-CCWM3S/DJ-MCP(Y156F))(1E9 Vg/小鼠)。此外,在此测定中使用AAV衣壳-DJ作为对照。
在AAV或RAAV注射后六周,将小鼠麻醉并在室温下用pH 7.4的PBS经心脏灌注,然后用新鲜制备的、在磷酸盐缓冲液(PB)中的冰冷的4%多聚甲醛(PFA)进行灌注。将脑在4%PFA中进行后固定过夜。将固定的脑在脱水后用OCT包埋用于冷冻切片。使用冷冻切片机(Leica CM1950)将脑切成20μm厚,并将切片直接置于载玻片上。载玻片在60℃下烘烤1-2小时,随后用PBS中的5%BSA血清封闭1h。随后,将载玻片与抗Cre的一抗(10536;细胞信号传导技术公司(Cell Signaling Technology);1:800稀释)在PBS(0.1%Triton-X)中的5%BSA中在室温下孵育过夜。用PBS洗涤五次后,将载玻片在PBS中的1%BSA中孵育,所述PBS含有针对一抗和DAPI的二抗(D3571,英杰公司(Invitrogen))。使用的二抗是Alexa Fluor488驴抗兔IgG(711-545-152,杰克逊免疫研究公司(Jackson ImmunoResearch))(以1:1000稀释)。用Nikon C2si+共聚焦显微镜获取图像。
获得的显示来自tdTomato表达系统的荧光的图像表明,RAAV-Cre感染了Ai9-小鼠海马体中的细胞并拯救了tdTomato的表达。相同剂量下RAAV-Cre组中的感染的细胞的数目少于AAV-Cre组。然而,相对于AAV-Cre感染的低剂量组(低30倍的剂量),RAAV-Cre感染生成更多的tdTomato阳性细胞。
非常有趣的是,在AAV-Cre感染的高剂量和低剂量组中均很容易检测到Cre表达,但在RAAV-Cre感染的细胞中没有检测到明显的Cre表达,尽管检测到的tdTomato荧光证明曾经存在Cre。
总体而言,如在相同高剂量1E9 vg/小鼠下两者的荧光照片(阳性细胞计数)所示(图21A对比图21C),RAAV-Cre与传统的AAV-Cre相比具有较差的转导效率,因为可以从一个成功转导的AAV DNA基因组中转录多个用于蛋白翻译的mRNA。为了进一步评估Cre表达水平,通过将1E9 vg/小鼠的高剂量AAV-Cre降低到3E6 vg/小鼠的低剂量,将AAV-Cre的转导效率相对于RAAV-Cre的转导效率归一化(图21B),并且结果表明,尽管如荧光照片(阳性细胞计数)所示,RAAV-Cre的转导效率优于AAV-Cre的低剂量组,但与AAV-Cre组相比,在RAAV-Cre感染细胞中未检测到Cre表达,这表明RAAV-Cre组中的Cre表达是瞬时的但功能性的。
实施例10 RAAV系统的额外的RPS/RBP对
除了实施例3-8中使用的MS2/MCP对之外,还针对RAAV包装测试了额外的两对RNA适配体/适配体-结合蛋白(或RNA包装信号/RNA结合蛋白,本文中的“RPS/RBP”):(1)PP7结合位点/PP7细菌噬菌体外壳蛋白(简写为“PP7/PCP”或“PCP”或“P”,或L-CCWP3S中的“P”)和(2)Com结合位点/噬菌体COM蛋白(简写为“com/COM”或“COM”,或L-CCWC3S中的“C”)。与天然的病毒包装系统MS2/MCP和PP7/PCP不同,com/COM不是天然的病毒包装系统,而是已知在细菌噬菌体Mu mom基因的转录启动中发挥作用的转录调节因子。
构建了携带有RPS的三个拷贝的转基因质粒(L-CCWP3S和L-CCWC3S)及其对应的包装质粒[具有与Rep78-Y156F和Rep68-Y156F的N末端融合的PP7细菌噬菌体外壳蛋白(PCP)的DJ-PCP(Y156F),和具有与Rep78-Y156F和Rep68-Y156F的N末端融合的噬菌体COM蛋白(COM)的DJ-COM(Y156F)]。如实施例3所述产生、纯化和滴定病毒颗粒。
结果表明,与实施例3-8中在各个方面得到很好证明的MS2/MCP对相似,PP7/PCP和com/COM这两对也导致RAAV颗粒的显著RNA包装(图18),从而扩大了各种RAAV包装系统的范围。
实施例11 RAAV系统对各种AAV血清型的应用
为研究本发明RAAV包装系统对除实施例3-9中测试的AAV-DJ之外的各种AAV血清型的应用,在AAV-DJ中检查了两对RPS/RBP(MS2/MCP和com/COM)和另外三种不同的AAV血清型(AAV5、AAV8和AAV9)。如实施例3所述产生、纯化和滴定病毒颗粒。
RAAV-MS2/MCP和RAAV-com/COM系统在所有四种血清型中均运行良好,表明RAAV包装系统对不同AAV血清型(即,不限于AAV-DJ)的普遍适用性。在RBP的存在下,含有对应的RPS的Cre RNA基因组有效地衣壳化到相应的RAAV颗粒中。尽管RNA包装的RAAV颗粒的产量因血清型而异,但RAAV5、RAAV8和RAAV9颗粒中所有都具有高于RAAV-DJ的产量(图19)。
实施例12 AAP和MCP融合蛋白提高RAAV产量
通常,AAV在其天然病毒基因组中编码独特的组装激活蛋白(AAP),所述蛋白对衣壳组装至关重要。特别地,发现AAP对于衣壳蛋白稳定和功能性AAV颗粒生成至关重要。
将AAP-MCP(具有与AAP的C末端融合的MCP)或MCP-AAP(具有与AAP的N末端融合的MCP)融合蛋白表达盒反向插入实施例6-10中使用的包装质粒DJ-MCP(Y156F)的骨架中,并且将所得构建体分别命名为DJ-MCP(Y156F)-AM和DJ-MCP(Y156F)-MA。然后,这些构建体表达MCP-Rep78/68(Y156F)融合物和AAP-MCP或MCP-AAP融合物两者,与单独的MCP-Rep78/68融合物相比,增加了协助RNA包装的RNA结合蛋白(RBP)的量。如实施例3所述产生、纯化和滴定病毒颗粒。
结果表明,与单独的MCP-Rep78/68融合物相比,在DJ-MCP(Y156F)-MA和DJ-MCP(Y156F)-AM中,包装了RNA的RAAV颗粒的产量分别提高了约65%和约35%(图20A和20B),这表明RBP可以与在AAV颗粒的包装或组装中起作用的任何其他蛋白额外融合或相关联,以增强RAAV颗粒的RNA包装。
单独使用AAP-MCP或MCP-AAP,而不使用MCP-Rep78/68,也在本发明的范围内。
序列
下文提供了某些序列,包括在上述实施例中引用的那些序列。
表A:RBP的核酸序列和氨基酸序列
表B:RPS的核酸序列
*序列元件根据格式样式(例如,粗体和/或斜体等)进行匹配表C:Rep蛋白的核酸序列和氨基酸序列
*序列元件根据格式样式(例如,双下划线、粗体和/或斜体等)进行匹配表D:AAP和MCP融合蛋白的核酸序列和氨基酸序列
*序列元件根据格式样式(例如,双下划线、粗体和/或斜体等)进行匹配
表E:引物序列
引物 |
序列 |
WPRE-F |
CCCGTATGGCTTTCATTTTCTCC |
WPRE-R |
GGCAATGCCCCAACCAGTG |
Cre-F |
CCAGTAGATGCCACTAGCGA |
Cre-R |
GCCTGGAGATACAGCAGGTA |
CAG-F |
CTTCTCCTCCGGGCTGTAAT |
CAG-R |
CTTTCACGCAGCCACAGAAA |
*F和R分别代表正向和反向引物。
表F:填充序列
通过援引并入
每个专利文件的全部披露内容,包括专利申请文件、科学文献、政府报告、网站和本文引用的其他参考文献,出于所有目的通过引用以其整体并入本文。在术语冲突的情况下,以本说明书为准。将本文披露的所有序列表或SEQ ID NO以其整体并入本文。
以下参考文献,在它们提供了补充本文所阐述内容的示例性程序或其他细节的意义上来说,明确地通过援引并入本文。
尽管本文已经描述了本发明的说明性实施方式,但应当理解,本发明不限于所描述的那些,并且本领域技术人员可以在不脱离本发明的范围或精神的情况下实现各种其他改变和修改。