CN115777020A

CN115777020A - 使用snrna组分的组合物和方法

Info

Publication number: CN115777020A
Application number: CN202180042856.3A
Authority: CN
Inventors: 苏珊·伯恩
Original assignee: Shape Therapy Co
Current assignee: Shape Therapy Co
Priority date: 2020-04-22
Filing date: 2021-04-22
Publication date: 2023-03-10
Also published as: CA3173012A1; JP2023523237A; US20240011028A9; EP4139453A1; US20230203483A1; WO2021216853A1; AU2021261374A1

Abstract

本文公开了包括工程改造的多核苷酸的组合物、药物组合物和使用方法，所述工程改造的多核苷酸可以用于与可能含有核苷酸错配的靶RNA杂交。本文公开的组合物和方法可以用于编辑RNA以改善或治疗受试者的疾病或病状。

Description

使用SNRNA组分的组合物和方法

相关申请的交叉引用

本申请根据35 U.S.C.§119要求于2020年4月22日提交的临时申请序列号63/013,744、2020年5月26日提交的临时申请序列号63/030,118、2020年10月1日提交的临时申请序列号63/086,434、2020年11月11日提交的临时申请序列号63/112,486、2020年12月1日提交的临时申请序列号63/119,878和2021年2月25日提交的临时申请序列号63/153,817的优先权，所述申请的公开内容通过引用以其整体并入本文中。

背景技术

通过内源性和外源性RNA编辑酶促进RNA编辑的引导RNA具有治疗多种疾病的潜力。然而，需要增强RNA稳定性和保留的组合物和方法，以定量和定性地增加这些引导RNA的效力。

发明内容

通过剪接活性的调节，治疗机会是可能的；然而，这种方法的效率、特异性和递送在临床环境中表现不佳。本公开提供了在剪接活性调节和RNA碱基编辑的效率、特异性和递送方面提供显著改善的工程改造的多核苷酸。

此处，我们对U7 snRNA基因进行改造，以工程改造新的底盘，用于表达引导RNA，以用于将内源性ADAR脱氨酶活性引导至所需的基因靶标。这种RNA碱基编辑可以发生在编码序列、5'或3'非翻译区、内含子、分支点腺苷或剪接受体位点内。此类RNA碱基编辑可以导致改变蛋白质编码序列；去除突变的过早终止密码子；调节RNA的稳定性；或者改变前mRNA的剪接。

本公开提供了一种工程改造的多核苷酸，其包括：靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交并且含有至少一个错配的核苷酸；来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；和来自剪接体snRNA或非剪接体snRNA或其变体的发夹。

本公开还提供了一种工程改造的多核苷酸，其包括：靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交并且含有至少一个腺嘌呤-鸟嘌呤(A-G)错配、至少一个腺嘌呤-腺嘌呤(A-A)错配或至少一个腺嘌呤-胞嘧啶(A-C)错配；来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；来自剪接体snRNA或非剪接体snRNA或其变体的发夹，其中所述工程改造的多核苷酸被配置为促进由RNA编辑实体对所述靶RNA的碱基的编辑。

错配可以是至少一个腺嘌呤-鸟嘌呤(A-G)错配、至少一个腺嘌呤-腺嘌呤(A-A)错配或至少一个腺嘌呤-胞嘧啶(A-C)错配。靶向序列的长度可以是至少30-300个碱基或50-100个碱基。工程改造的多核苷酸可以与RNA聚合酶II型启动子能够操作地连接。RNA聚合酶II型启动子是U1启动子。RNA聚合酶II型启动子是U7启动子。工程改造的多核苷酸与U6启动子能够操作地连接。Sm或Sm样蛋白结合结构域或其变体是SmOPT序列。SmOPT序列与AAUUUUUGGAG或SEQ ID NO:41具有至少80％的序列同一性。SmOPT序列是AAUUUUUGGAG或SEQID NO:41。发夹来自小鼠U7snRNA、人U7 snRNA或人U1 snRNA。发夹是小鼠U7 snRNA、人U7snRNA、人U1snRNA中的一者或多者的嵌合发夹。该发夹与SEQ ID NO:42、SEQ ID NO:43、SEQID NO:45或SEQ ID NO:46中的任一者中的发夹序列具有至少80％、至少85％、至少90％、至少92％、至少95％、至少97％或至少99％的序列同一性。该发夹具有SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:45或SEQ ID NO:46中的任一者的发夹序列。该发夹具有SEQ ID NO:43的序列。工程改造的多核苷酸可以进一步包括在工程改造的多核苷酸的3'端处的U7盒终止子。从5'到3'的靶向序列包括靶向序列、Sm或Sm样蛋白结合结构域或其变体和发夹。工程改造的多核苷酸被配置为促进RNA编辑实体对靶RNA的碱基的编辑。RNA编辑实体包括ADAR蛋白、APOBEC蛋白或两者。RNA编辑实体包括ADAR，并且其中ADAR包括ADAR1或ADAR2。靶向序列至少部分地结合至在疾病或病状中实现的靶RNA。靶RNA可以选自由RAB7A、ABCA4、SERPINA1、SERPINA1E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、ATP7BG1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合组成的组。包括雷特综合征、享廷顿病、帕金森病、阿尔茨海默病、肌营养不良症或泰-萨克斯病(Tay-Sachs Disease)的疾病或病状。工程改造的多核苷酸进一步包括来自snRNA的额外的序列。来自snRNA的额外的序列可以至少部分地包括U1、U2、U4、U5、U6或U7snRNA序列。包括snRNA序列的多核苷酸可以与SEQ ID NO:1至SEQ ID NO:33中的任何一者或其变体具有至少80％的同一性。靶向序列包括相对于靶RNA的序列的错配。错配可以是A/C错配，并且其中靶向序列包括A/C错配的C，并且靶RNA的序列包括A/C错配的A。当在脱氨酶的存在下与前mRNA缔合时，A/C错配可以被配置为促进前mRNA的编辑。错配位于距靶向序列的任一端至少45、46、47、48、49、50、51、52、53、54或55个碱基处。在一些实施例中，错配位于距靶向序列的任一端10至30个碱基处。在一些实施例中，错配位于距靶向序列的任一端约20个碱基处。在一些实施例中，错配位于距靶向序列的任一端正好20个碱基处。在一些实施例中，错配位于距靶向序列的任一端约70至90个碱基处。在一些实施例中，错配位于距靶向序列的任一端约80个碱基处。在一些实施例中，错配位于距靶向序列的任一端正好80个碱基处。snRNA启动子至少部分地包括U1、U2、U4、U5、U6或U7snRNA启动子。

靶向序列可以与靶RNA中外显子附近的剪接信号至少部分互补。靶向序列是：(a)与靶RNA内外显子上游的分支点至少部分互补；或(b)靶向序列与靶RNA内外显子下游的供体剪接位点至少部分互补。

当在体外测量时，与不含Sm或Sm样结合结构域或其变体、不含发夹、或不含Sm或Sm样结合结构域或其变体和发夹的可比外显子跳跃构建体相比，工程改造的多核苷酸可以具有改善的外显子跳跃效率。效率可以通过进行液滴数字PCR测定来确定，以检测在被编辑构建体转染的细胞中，相对于包括没有错配的核苷酸的编辑构建体的细胞，由外显子跳跃引导RNA构建体跳跃的外显子的跳跃百分比。工程改造的多核苷酸可以被配置为促进剪接信号内碱基的编辑。编辑可以被配置为促进外显子的跳跃。工程改造的多核苷酸具有至少1％、至少5％、至少10％、至少20％、至少30％、至少40％或至少50％的增加的外显子跳跃效率，如通过体外测定测量的。在靶向前mRNA的区域内不与前mRNA互补的核苷酸配置工程改造的多核苷酸以在与靶mRNA缔合时募集脱氨酶。靶向序列在与前mRNA结合并与脱氨酶缔合时，促进脱氨酶对前mRNA的多核苷酸的碱基的化学修饰。工程改造的多核苷酸进一步包括脱氨酶募集结构域。

脱氨酶募集结构域可以选自由以下中的至少一部分组成的组：GluR2、Alu、这些中任一者的变体及其任何组合。脱氨酶募集结构域包括茎环。茎环是左旋茎环或右旋茎环。茎环包括与GluR2结构域至少约80％的序列同一性。工程改造的多核苷酸包括至少一个化学修饰的核苷酸。化学修饰包括如表1中提供的工程改造的多核苷酸的磷酸二酯主链键中的非连接磷酸氧原子中的一者或两者的至少一种修饰。

工程改造的多核苷酸当存在于水溶液中并且不与靶RNA结合时缺少发夹、凸起、多核苷酸环、结构化的结构域或其任何组合中的至少一者。例如，前述结构特征——发夹、凸起、多核苷酸环、结构化的结构域或其任何组合——中的一者可以在双链RNA中形成，所述双链RNA通过将本公开的工程改造的多核苷酸结合到靶RNA上而形成。结构特征包括凸起、内环、发夹或其任何组合。结构特征是凸起。凸起是不对称凸起。凸起是对称凸起。结构特征是内环。内环是不对称的环。内环是对称的环。工程改造的多核苷酸包括结构环稳定的支架。结构环稳定的支架进一步包括靶向序列，所述靶向序列与靶RNA缔合，募集RNA编辑酶，其中RNA编辑酶化学修饰靶RNA的核苷酸的碱基；并且其中靶向序列包括多于或等于约4个连续的核苷酸。工程改造的多核苷酸进一步包括位于靶向序列侧翼的第一间隔子结构域和第二间隔子结构域，其中工程改造的多核苷酸被配置为在哺乳动物细胞中转录后自环化。工程改造的多核苷酸在第一间隔子结构域的5'处或在第二间隔子结构域的3'处包括核酶结构域。工程改造的多核苷酸包括在核酶结构域和第一间隔子结构域之间或在核酶结构域和第二间隔子结构域之间的连接结构域。当多核苷酸序列以2维表示时，工程改造的多核苷酸是线性的。当多核苷酸序列以2维表示时，工程改造的多核苷酸是环状的。工程改造的多核苷酸被配置为在哺乳动物细胞中原位环化。靶向序列不包括适体。工程改造的多核苷酸不包括或不编码这样的序列，所述序列编码针对RNA干扰(RNAi)配置的序列。靶向序列被配置为至少部分地与靶RNA的3'或5'非翻译区(UTR)的至少一部分缔合。靶向序列被配置为至少部分地与靶RNA的内含子区域的至少一部分缔合。靶向序列被配置为至少部分地与靶RNA的外显子区域的至少一部分缔合。工程改造的多核苷酸为约80个核苷酸至约600个核苷酸。工程改造的多核苷酸在靶向序列的5'处包括第一间隔子结构域。工程改造的多核苷酸包括与第一间隔子结构域不同或相同的第二间隔子结构域。第一间隔子结构域、第二间隔子结构域或两者包括AUAUA(SEQ ID NO:53)的多核苷酸序列。第一间隔子结构域、第二间隔子结构域或两者包括AUAAU(SEQ ID NO:52)的多核苷酸序列。工程改造的多核苷酸包括在5'端上的第一核酶结构域和在3'端上的第二核酶结构域。第一或第二核酶独立地选自由锤头状核酶、glmS核酶、HDV样核酶、R2元件、肽基转移酶23S rRNA、GIR1分支核酶、前导酶、II组内含子、发夹状核酶、VS核酶、CPEB3核酶、CoTC核酶和I组内含子组成的组。

本文提供了一种载体，其包括或编码本公开的工程改造的多核苷酸。载体包括脂质体、纳米颗粒或树枝状聚合物。载体是病毒载体。病毒载体是腺相关病毒(AAV)载体。AAV载体是AAV2载体、AAV5载体、AAV8载体、AAV9载体或任何这些的杂交体。病毒载体是自互补腺相关病毒(scAAV)载体。病毒载体是单链AAV载体。

本文提供了一种分离的细胞，其包括本公开的工程改造的多核苷酸、编码本公开的工程改造的多核苷酸的多核苷酸、或本公开的载体。分离的细胞可以是T细胞、神经元、肌细胞、肝细胞等。

本文提供了一种单位剂量形式的药物组合物，其包括本公开的工程改造的多核苷酸、编码本公开的工程改造的多核苷酸的多核苷酸、或本公开的载体；和药学上可接受的赋形剂、稀释剂或载剂。

本文提供了一种治疗或预防有此需要的受试者的病状的方法，所述方法包括向所述受试者施用本公开的工程改造的多核苷酸、编码本公开的工程改造的多核苷酸的多核苷酸、本公开的载体或本公开的药物组合物。病状可以是杜兴氏肌营养不良症(DMD)、雷特综合征、夏科-马里-图思病(Charcot-Marie-Tooth disease)、阿尔茨海默病、帕金森病、α-1抗胰蛋白酶缺乏症或斯塔加特病(Stargardt's disease)。该病状与选自由RAB7A、ABCA4、SERPINA1、SERPINA1 E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、ATP7BG1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合的组成的组的蛋白质中的突变相关联。施用可以是亲本的。施用可以是实质内注射、膜内注射、心室内注射、脑池内注射、静脉内注射、肌内注射、脑室内(ICV)施用、皮下注射、口服施用、粘膜施用、舌下施用、颊施用、直肠施用、眼施用、耳施用、鼻施用、局部施用、皮肤施用、经皮施用或其任何组合。

本公开的方法可以进一步包括施用额外的治疗。额外的治疗可以同时或连续施用。施用可以每周至少进行一次。受试者已经在施用前通过体外诊断被诊断出患有该疾病或病状。受试者可以是人类，并且任选地，受试者是男性或女性，并且受试者任选地是成年人，或者受试者任选地小于18岁。

本文提供了一种试剂盒，其包括在容器中的本公开的工程改造的多核苷酸、在容器中的编码本公开的工程改造的多核苷酸的多核苷酸、在容器中的本公开的载体或在容器中的本公开的药物组合物。

本文提供了一种制备药物组合物的方法，其包括使药学上可接受的赋形剂、载剂或稀释剂与本公开的工程改造的多核苷酸、编码本公开的工程改造的多核苷酸的多核苷酸或本公开的载体中的至少一者接触。

本文提供了一种制备试剂盒的方法，其包括将以下至少部分置于容器中：1)本公开的工程改造的多核苷酸；2)编码本公开的工程改造的多核苷酸的多核苷酸；3)本公开的载体；或4)本公开的药物组合物。

附图说明

图1示出了用于评估DMD外显子71和外显子74的外显子跳跃的示例性测定。箭头表示引物并且实线表示探针，用于定量PCR或液滴数字PCR。下板图示出了对来自人类骨骼肌的提取的cDNA进行的液滴数字PCR外显子跳跃测定的代表性数据。

图2A-2B示出了U7/U1启动子与3'发夹一起增强特异性引导RNA编辑。使用带有或不带有相应3'发夹的hU6、mU7、hU7或hU1启动子表达靶向人RAB7A 3'UTR、人DMD外显子71剪接受体或人DMD外显子74剪接受体的100nt引导RNA。38小时后测量RNA。图2A示出具有启动子序列(U7或U1)的工程改造的多核苷酸，与3'发夹(SmOPT U7或hU1)组合，实现RAB7A ADAR编辑和DMD外显子71或74跳跃(通过ddPCR测量)。白色条表示其中用GFP表达载体转染细胞的实验，而实心条表示用ADAR2过表达载体转染。点代表两个独立的实验，其中条形图代表两个实验的平均值。图2B示出了在RAB7A 3'UTR(方框)中靶腺苷处进行特异性编辑的桑格测序色谱图。由于使用反向引物进行测序，因此A>G编辑显示为T>C。

图3A-3D示出了具有3'SmOPT和U7发夹的工程改造的多核苷酸的U7启动子驱动的表达增强了额外基因靶标处的特异性引导RNA编辑，具有最小的非预期外显子跳跃。图3A示出了人RAB7A和SNCA的外显子结构。外显子被显示为灰色区段；编码区域用上面的黑线表示。示出了引导RNA靶向位点的位置；还示出了PCR引物。图3B示出了在每个靶位点的ADAR编辑(通过桑格测序测量)。图3C示出了来自编辑的转录物的cDNA，其使用上述引物进行PCR扩增并在琼脂糖凝胶上分析。PCR扩增子示出了正确剪接的外显子的预测的大小。图3D示出了桑格测序色谱图，其揭示了在指定转录物的靶标腺苷处的特异性编辑(红色框)。

图4示出了在多个时间点在额外的细胞类型中SNCA起始密码子(翻译起始位点)和SNCA 3'UTR的编辑。靶向人SNCA起始密码子或人SNCA 3'UTR的工程改造的多核苷酸使用没有发夹的hU6启动子、具有3'SmOPT mU7发夹的mU7启动子、具有3'SmOPT hU7发夹的hU7启动子或具有3'SmOPT mU7发夹的hU1启动子来表达。图4A示出了桑格测序色谱图，其揭示了在有或没有ADAR2过表达的情况下在HEK 293细胞中，在靶标上位点(红色框)以及额外的脱靶标编辑位点处的碱基编辑。编辑的百分比记录在每个峰的下方。图4B示出了在不同转染条件(核转染，Lonza)下，在指示的时间点，在过表达SNCA的K562细胞中SNCA 3'UTR的编辑百分比。用GFP表达载体(内源性ADAR，空心符号)或ADAR2过表达载体(实心符号)转染细胞。

图5示出了人U1启动子可以与3'SmOPT序列和U7发夹配对，用于引导RNA编辑，具有最小的转录水平敲低。靶向人RAB7A 3'UTR、人DMD外显子71剪接受体或人DMD外显子74剪接受体的引导RNA使用具有3'SmOPT U7发夹和U7终止序列的hU6、mU7、hU7或hU1启动子来表达。可替代地，使用来自Litke和Jaffrey 2019(无SmOPT或U7发夹)的具有环化RtcB核酶位点的hU6、mU7、hU7或hU1启动子来表达这些100nt引导RNA。通过ddPCR在转染后指定的时间点测量RNA。

图6示出了，在与3'SmOPT U7发夹相对的引导RNA的5'端添加hnRNP A1结合结构域[UAGGGW]影响了RAB7A编辑和DMD外显子74跳跃。靶向人RAB7A 3'UTR、人DMD外显子71剪接受体或人DMD外显子74剪接受体的引导RNA使用具有3'SmOPT mU7发夹和mU7终止序列的mU7或hU1启动子来表达。可替代地，使用来自Litke和Jaffrey 2019(无SmOPT或U7发夹)的具有环化RtcB核酶位点的hU6启动子来表达这些100nt引导RNA。添加在引导RNA的5'端的是：无标签；三重hnRNP A1结合结构域(Dickson 2008)；双重hnRNP A1结合结构域；或作为阴性对照的不结合hnRNP A1的突变的结构域。42小时后测量RNA。图6A示出了hnRNP结合结构域当与U7/U1启动子和3'SmOPT U7发夹组合时，增加RAB7A ADAR编辑和DMD外显子74跳跃(通过ddPCR测量)。图6B示出了桑格测序色谱图，其显示在RAB7A 3'UTR(方框)中靶腺苷处的特异性编辑。由于使用反向引物进行测序，因此A>G编辑显示为T>C。

图7显示了SmOPT序列是完全编辑所必需的，但是来自小鼠、人或杂交小鼠/人组合的U7发夹可以足以进行编辑。靶向100nt的人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体的引导RNA使用具有SmOPT结构域的变异或U7发夹的变异以及mU7终止序列的mU7启动子来表达。图7A列出了Sm结构域和U7发夹的序列变异。SmOPT序列被来自U1或U7 snRNA的天然Sm结合结构域或不结合Sm的突变形式替换。可替代地，mU7发夹被hU7发夹或杂交小鼠/人组合替换。图7B示出了，含有SmOPT序列而不是变异的引导RNA可以产生稳健的编辑。图7C示出了桑格测序色谱图，显示了在指定转录物的靶腺苷处的特异性编辑(红色框)。

图8示出了携带具有G2019S突变的LRRK2微小基因和mCherry(在顶部)或携带具有G2019S突变的LRRK2微小基因、mCherry、CMV和ADAR2(在底部)的piggyBac载体的构建体。

图9A示出了在施用两种引导RNA和对照(GFP质粒)后，ADAR1对LRRK2G2019S突变的体外靶标上编辑和脱靶标编辑。图9B示出了在施用两种引导RNA和对照(GFP质粒)后，ADAR1和ADAR2对LRRK2 G2019S突变的体外靶标上编辑和脱靶标编辑。

图10示出了，含有3'SmOPT序列和U7发夹的引导RNA可以被U7或U6启动子环化和表达，以产生ADAR编辑。图10A示出了100nt引导RNA，其具有或不具有侧翼为RtcB环状核酶位点的3'SmOPT U7发夹。用引导特异性引物(黑色)进行的桑格测序显示，核酶位点已经成功地连接在一起，其中引导RNA和3'SmOPT U7发夹存在于环状RNA内。图10B比较了使用mU7或hU6启动子、不同Sm结合结构域和U7发夹以及在U7发夹和P1环状核酶之间的不同长度接头的SmOPT U7环状引导RNA的不同变异(上板图)。如上所述，具有3'SmOPT序列和U7发夹的线性100nt引导RNA可能导致ADAR RNA编辑所有六个基因靶标：人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体(中间板图)。具有3'SmOPT序列和U7发夹的100nt引导RNA的环状变异也可以产生大量编辑，无论是由mU7启动子还是hU6启动子表达。靶转录物敲低或意外的外显子跳跃的副作用最小(下板图)。

图11A示出了编码靶向ABCA4、SmOPT序列和U7发夹中的突变的引导RNA的构建体的RNA编辑百分比，其中表达由U1启动子驱动。图11B示出了图11A所示的各种构建体的桑格测序轨迹。

图12A示出了对于编码靶向ABCA4、SmOPT序列和U7发夹中的突变的引导RNA的构建体的多剂量，通过ADAR1和ADAR2在细胞中的RNA编辑百分比，其中表达由U1启动子驱动。图12B示出了对于编码靶向ABCA4、SmOPT序列和U7发夹中的突变的引导RNA的构建体的多剂量，通过ADAR1在细胞中的RNA编辑百分比，其中表达由U1启动子驱动。

图13示出了在待编辑的靶标A处(在x轴上的“0”)和在脱靶标位置处(在非“0”的位置处表示为黑条)的RNA编辑处，被列为SEQ ID NO:31的引导RNA的RNA编辑的图。

图14示出了在待编辑的靶标A处(在x轴上的“0”)和在脱靶标位置处(在非“0”的位置处表示为黑条)的RNA编辑处，被列为SEQ ID NO:32的引导RNA的RNA编辑的图。

图15示出了在待编辑的靶标A处(在x轴上的“0”)和在脱靶标位置处(在非“0”的位置处表示为黑条)的RNA编辑处，被列为SEQ ID NO:33的引导RNA的RNA编辑的图。

图16示出了人SOD1起始密码子的编辑，其中工程改造的多核苷酸表达构建体通过质粒瞬时转染或作为单拷贝被整合到基因组中而被递送至HEK 293T细胞。靶向人SOD1起始密码子的工程改造的多核苷酸使用具有环化RtcB核酶位点(无SmOPT或U7发夹)的hU6启动子、具有3'SmOPT mU7发夹的mU7启动子、或具有5'双hnRNP A1结合结构域和3'SmOPT hU7发夹的mU7启动子来表达。

图17示出了使用使用具有3'SmOPT hU7发夹的hU1启动子表达的引导RNA在肌肉细胞中编辑RAB7A。

图18示出了使用使用具有3'SmOPT hU7发夹的U6或U7启动子表达的引导RNA编辑SERPINA1微小基因1和2。

图19示出了在待编辑的靶标A处(在x轴上的“0”)和在脱靶标位置处(在非“0”位置处表示为黑条)的RNA编辑处，列为SEQ ID NO:26和SEQ ID NO:27的引导RNA的SERPINA1的RNA编辑的图。

图20示出了使用具有3'SmOPT hU7发夹的引导RNA编辑LHCN肌细胞中的RAB7A。

图21A和图21B示出了使用使用AAV载体表达的引导RNA对Rab7a的编辑作为剂量的函数，如在分化9天后通过ddPCR(图21A)和桑格测序(图21B)确定的。图21C示出了使用使用AAV载体表达的引导RNA对Rab7a的编辑作为剂量的函数，如在分化17天或更多天之后通过ddPCR确定的。

图22A描绘了在分化9天后针对Rab7编辑效率绘制的转导％。图22B描绘了在分化不同天后收获的细胞中针对Rab7编辑效率绘制的转导％。

图23示出了相对于对照的U7 smOPT线性引导序列的脱靶标编辑概况。

具体实施方式

术语“一个”和“一种”是指冠词的语法对象中的一个或多于一个(即，至少一个)。作为实例，“一个元件”意指一个元件或多于一个元件。

如本文所用的术语“约”或“大约”当指可测量的值如量或浓度等时，意指涵盖指定量的20％、10％、5％、1％、0.5％或甚至0.1％的变异。例如，根据本领域的实践，“约”可以意指正或负10％。可替代地，“约”可以意指给定值的正或负20％、正或负10％、正或负5％或正或负1％的范围。可替代地，特别是对于生物系统或过程，术语可以意指在值的数量级内，至多5倍或至多2倍。当在本申请和权利要求中描述特定值时，除非另有说明，否则应当假设术语“约”意指高达特定值的可接受误差范围。此外，在可以提供值的范围、子范围或两者的情况下，范围或子范围可以包含范围或子范围的端点。术语“基本上”、“基本上没有”、“基本上不含”和“大约”可以在描述量值、位置或两者时使用，以指示所描述的值可以达到值的合理的预期范围。例如，数值的值可以具有这样的值，该值可以是规定的值(或值的范围)的+/-0.1％、规定的值(或值的范围)的+/-1％、规定的值(或值的范围)的+/-2％、规定的值(或值的范围)的+/-5％、规定的值(或值的范围)的+/-10％等。本文列举的任何数值范围都可以旨在包含纳入其中的所有子范围。

如本文所用的术语“部分地”、“至少部分地”或可以指接近给定值的100％的值。在一些情况下，该术语可以指可以是总量的至少约60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.9％或99.99％的量。在一些情况下，该术语可以指可以是总量的约100％的量。

本文中如在如“A和/或B”的短语中使用的术语“和/或”旨在包含A和B两者；A或B；A(单独)；和B(单独)。同样，如在如“A、B和/或C”的短语中使用的术语“和/或”旨在涵盖以下实施例中的每一者：A、B和C；A、B或C；A或C；A或B；B或C；A和C；A和B；B和C；A(单独)；B(单独)；和C(单独)。

如本文所用的，术语“包括”旨在意指组合物和方法包含所叙述的元件，但不排除其他元件。当用于定义组合物和方法时，“基本上由……组成”应当意指排除对用于预期用途的组合具有任何重要意义的其他元件。因此，基本上由如本文所定义的元件组成的组合物不会从分离和纯化方法和药学上可接受的载剂(如磷酸盐缓冲盐水、防腐剂等)中排除痕量污染物。“由……组成”应当意指排除多于痕量元件的其他成分和用于施用本公开的组合物的大量方法步骤。由这些过渡术语中的每一个定义的实施例都在本公开的范围内。

术语“受试者”、“宿主”、“个体”和“患者”如在本文中可互换使用，以指代动物，通常是哺乳动物。任何合适的哺乳动物都可以通过本文所述的方法、细胞或组合物进行治疗。哺乳动物可以施用如本文所述的载体、工程改造的多核苷酸、前体引导RNA、核酸或药物组合物。哺乳动物的非限制性实例包含人、非人灵长类动物(例如，猿、长臂猿、黑猩猩、猩猩、猴、猕猴等)、家畜(例如，狗和猫)、农场动物(例如，马、牛、山羊、绵羊、猪)和实验动物(例如，小鼠、大鼠、兔、豚鼠)。在一些实施例中，哺乳动物是人类。哺乳动物可以是任何年龄或处于任何发育阶段(例如，成人、青少年、儿童、婴儿或子宫内的哺乳动物)。哺乳动物可以是雄性或雌性。哺乳动物可以是怀孕的雌性。在一些实施例中，受试者是人类。在一些实施例中，受试者患有或怀疑患有疾病，如神经退行性疾病。在一些实施例中，受试者患有或可能被怀疑患有癌症或肿瘤病症。在其他实施例中，受试者患有或可能被怀疑患有与异常蛋白质表达相关的疾病或病症。在一些情况下，人类可以超过约：1天至约10个月大、约9个月至约24个月大、约1岁至约8岁、约5岁至约25岁、约20岁至约50岁、约1岁至约130岁或约30岁至约100岁。人类可以超过约1、2、5、10、20、30、40、50、60、70、80、90、100、110或120岁。人类的年龄可以小于约1、2、5、10、20、30、40、50、60、70、80、90、100、110、120或130岁。

术语“受试者”、“宿主”、“个体”和“患者”如在本文中可互换使用，以指代动物，通常是哺乳动物。任何合适的哺乳动物都可以被施用如本文所述的组合物(如工程改造的多核苷酸)或通过如本文所述的方法治疗。受试者可以是脊椎动物或无脊椎动物。受试者可以是实验动物。哺乳动物的非限制性实例包含人、非人灵长类动物(例如，猿、长臂猿、黑猩猩、猩猩、猴、猕猴等)、家畜(例如，狗和猫)、农场动物(例如，马、牛、山羊、绵羊、猪)和实验动物(例如，小鼠、大鼠、兔、豚鼠)。在一些实施例中，哺乳动物是人类。哺乳动物可以是任何年龄或处于任何发育阶段(例如，成人、青少年、儿童、婴儿或子宫内的哺乳动物)。哺乳动物可以是雄性或雌性。在一些实施例中，受试者是人类。受试者可以是患者。受试者可能患有疾病。受试者可以表现出疾病的症状。受试者可以不表现出疾病的症状，但仍然患有疾病。受试者可以在护理人员的医疗护理下(例如，受试者住院并由医生治疗)。

“同源性”或“同一性”或“相似性”可以指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比较每个序列中的位置来确定，为了比较的目的，可以对每个序列进行比对。当比较的序列中的位置可以被相同的碱基或氨基酸占据时，那么分子可以在那个位置是同源的。序列之间的同源性程度可以是序列所共有的匹配或同源位置的数量的函数。“不相关的”或“非同源的”序列与本公开的序列中的一者共有少于40％的同一性，或者可替代地少于25％的同一性。序列同源性可以指序列与参考序列的同一性％。作为实际问题，任何特定序列是否可以与本文所述的任何序列(其可以对应于本文所述的特定核酸序列)至少50％、60％、70％、80％、85％、90％、92％、95％、96％、97％、98％或99％相同，此类特定多肽序列可以常规地使用已知的计算机程序如Bestfit程序(威斯康星州序列分析软件包(Wisconsin Sequence Analysis Package)，版本8for Unix，Genetics ComputerGroup，University Research Park，575Science Drive，威斯康星州麦迪逊(Madison，wis)53711)来确定。当使用Bestfit或任何其他序列比对程序来确定特定序列是否与参考序列例如95％相同时，可以设置参数，使得可以在参考序列的全长上计算同一性百分比，并且可以允许总参考序列中高达5％的序列同源性缺口。

在一些情况下，参考序列(查询序列，例如，本公开的序列)和受试者序列之间的同一性也被称为全局序列比对，可以使用FASTDB计算机程序来确定。在一些实施例中，在FASTDB氨基酸比对中使用的其中同一性可以被狭义解释的特定实施例的参数可以包含：评分方案＝PAM(接受的突变百分比)0，k-tuple＝2，错配罚分＝1，加入罚分(JoiningPenalty)＝20，随机化分组长度＝0，截止评分＝1，窗口大小＝序列长度，间隙罚分＝5，间隙大小罚分＝0.05，窗口大小＝500或受试者序列的长度，以较短者为准。根据此实施例，如果由于N末端缺失或C末端缺失而不是由于内部缺失，受试者序列可以比查询序列短，则可以对结果进行手动纠正，以考虑以下事实：在计算全局百分比同一性时，FASTDB程序不考虑受试者序列的N末端截短和C末端截短。对于在N末端和C末端被截短的受试者序列，相对于查询序列，百分比同一性可以通过计算查询序列中可能位于受试者序列的N末端和C末端侧面的残基的数量(这些残基不能与相应的受试者残基匹配/比对)占查询序列的总碱基的百分比来纠正。可以通过FASTDB序列比对的结果来确定残基是否可以匹配/比对的确定。然后可以从由FASTDB程序使用指定参数计算的同一性百分比中减去该百分比，以得到最终的同一性百分比分数。该最终的百分比同一性分数可以用于此实施例的目的。在一些情况下，只有不能与查询序列匹配/比对的受试者序列的N末端和C末端的残基可以被考虑用于手动调整百分比同一性分数的目的。也就是说，只有在受试序列最远的N末端残基和C末端残基之外的查询残基位置可以被考虑用于该手动纠正。例如，90个残基的受试者序列可以与100个残基的查询序列进行比对，以确定同一性百分比。缺失发生在受试者序列的N末端，因此FASTDB比对未示出N末端处的前10个残基的匹配/比对。10个不成对的残基代表序列的10％(在N末端和C末端处不匹配的残基的数量/查询序列中的残基的总数)，因此可以从由FASTDB程序计算的百分比同一性分数中减去10％。如果剩余的90个残基完全匹配，则最终的同一性百分比可以是90％。在另一实例中，90个残基的受试者序列可以与100个残基的查询序列进行比较。这次缺失可以是内部缺失，因此在受试者序列的N末端或C末端处可以没有不能与查询匹配/比对的残基。在这种情况下，由FASTDB计算的同一性百分比不能手动纠正。再次，只有如在FASTDB比对中所显示的在受试者序列的N末端和C末端端部之外的残基位置(其不能与查询序列匹配/比对)可以被手动纠正。

术语“多核苷酸”和“寡核苷酸”可互换使用并且是指任何长度的核苷酸的聚合形式，脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构，并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例：基因或基因片段(例如，探针、引物、EST或SAGE标签)、外显子、内含子、基因间DNA(包含但不限于异染色质DNA)、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、序列的分离的DNA、序列的分离的RNA、sgRNA、引导RNA、核酸探针、引物、snRNA、长的非编码RNA、snoRNA、siRNA、miRNA、tRNA衍生的小RNA(tsRNA)、反义RNA、shRNA或小的rDNA衍生的RNA(srRNA)。多核苷酸可以包括修饰的核苷酸，如甲基化的核苷酸和核苷酸类似物。如果存在，则对核苷酸结构的修饰可以在组装多核苷酸之前或之后进行。核苷酸的序列可以被非核苷酸组分打断。多核苷酸可以在聚合后被进一步修饰，如通过与标记组分缀合。该术语也指双链分子和单链分子两者。核酸(包含例如具有硫代磷酸酯主链的核酸)可以包含一个或多个反应性部分。如本文所用的，术语反应性部分包含能够通过共价、非共价或其他相互作用与另一分子如核酸或多肽反应的任何基团。例如，核酸可以包含通过共价、非共价或其他相互作用与蛋白质或多肽上的氨基酸反应的氨基酸反应性部分。除非另有说明或要求，否则本公开的任何实施例，即多核苷酸，涵盖双链形式和已知或预测构成双链形式的两种互补单链形式中的每一者。

术语“引导RNA”可以与术语“工程改造的多核苷酸”、“多核苷酸”、“寡核苷酸”等互换使用以指代本公开的多核苷酸。

可用于本公开的方法的多核苷酸可以包括天然核酸序列及其变体、人工核酸序列或此类序列的组合。

当多核苷酸是RNA时，多核苷酸由四个核苷酸碱基的特定序列构成：腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和胸腺嘧啶的尿嘧啶(U)。本文所述的任何序列可以是DNA；在序列被转录成RNA的情况下，胸腺嘧啶(T)可以被尿嘧啶(U)替换。在一些情况下，本文所述的RNA序列可以被表示为用T代替U的DNA序列。在一些实施例中，多核苷酸可以包括一个或多个其他核苷酸碱基，如肌苷(I)，一种当次黄嘌呤经由β-N9糖苷键与呋喃核糖连接时形成的核苷，从而产生化学结构：

肌苷被翻译机器解读为鸟嘌呤(G)。

术语“多核苷酸序列”是多核苷酸分子的字母表示。这种字母表示可以被输入到具有中央处理单元的计算机的数据库中，并用于生物信息学应用，如功能基因组学和同源性搜索。

如本文所用的，“表达”是指多核苷酸被转录成mRNA的过程和/或被转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸来源于基因组DNA，则表达可以包含真核细胞中mRNA的剪接。

当涉及特定的分子、生物或细胞材料时，术语“等同物”或“生物等同物”可互换使用，并且旨在具有最小同源性，同时仍保持所需的结构或功能的那些。

“液滴数字PCR”(ddPCR)是指一种数字PCR测定，其通过对封装在支持PCR扩增的离散的、体积定义的油包水液滴分区(droplet partitions)中的核酸分子进行计数来测量绝对量。单个ddPCR反应每孔可以含有至少20,000个分区的液滴。

“液滴”或“油包水液滴”是指液滴数字PCR测定的单独的分区。液滴支持使用同质测定化学和工作流程(类似于广泛用于实时PCR应用的那些)对模板分子进行PCR扩增。

液滴数字PCR可以使用任何执行数字PCR测定的平台来执行，该数字PCR测定通过对封装在支持PCR扩增的离散的、体积定义的油包水液滴分区中的核酸分子进行计数来测量绝对量。液滴数字PCR的策略可以总结如下：将样本稀释并分配到数千至数百万个独立的反应室(油包水液滴)中，使得每个反应室含有感兴趣的核酸分子的一个拷贝或不含有感兴趣的核酸分子的拷贝。检测到的含有靶标扩增子(例如，感兴趣的核酸分子)的“阳性”液滴的数量相对于不含有靶标扩增子(例如，感兴趣的核酸分子)的“阴性”液滴的数量可以用于确定原始样本中感兴趣的核酸分子的拷贝数。液滴数字PCR系统的实例包含Bio-Rad的QX100^TM液滴数字PCR系统，该系统将含有核酸模板的样本分成20,000纳升大小的液滴；以及RainDance的RainDrop^TM数字PCR系统，该系统将含有核酸模板的样本分成1,000,000至10,000,000皮升大小的液滴。

如本文所用的术语“突变”是指编码蛋白质的核酸序列相对于所述蛋白质的共有序列的改变。“错义”突变导致用一个密码子替换另一个密码子；“无义”突变将编码特定氨基酸的密码子变更为终止密码子。无义突变经常导致蛋白质的截短的翻译。“沉默”突变是那些对产生的蛋白质没有影响的突变。如本文所用的，术语“点突变”是指仅影响基因序列中的一个核苷酸的突变。“剪接位点突变”是那些存在于前mRNA(在加工以去除内含子之前)的突变，这些突变导致错误翻译，并且经常由于剪接位点的不正确描绘而截断蛋白质。突变可以包括单核苷酸变异(SNV)。突变可以包括序列变体、序列变异、序列改变或等位基因变体。参考DNA序列可以从参考数据库中获得。突变可以影响功能。突变可能不影响功能。突变可以在一个或多个核苷酸的DNA水平、一个或多个核苷酸的核糖核酸(RNA)水平、一个或多个氨基酸的蛋白质水平、或其任何组合发生。参考序列可以从数据库如NCBI参考序列数据库(RefSeq)数据库获得。可以构成突变的特定变更可以包含一个或多个核苷酸或一个或多个氨基酸中的取代、缺失、插入、倒位或转化。突变可以是点突变。突变可以是融合基因。融合对或融合基因可以由突变(如易位、中间缺失、染色体倒位或其任何组合)产生。突变可以构成重复序列的数量的可变性，如三重化、四重化或其他。例如，突变可以是与给定序列相关的拷贝数的增加或减少(即拷贝数变异，或CNV)。突变可以包含不同等位基因中的两个或更多个序列变更，或一个等位基因中的两个或更多个序列变更。突变可以在一个等位基因中的一个位置处包含两个不同的核苷酸，如镶嵌体(mosaic)。突变可以在一个等位基因中的一个位置处包含两个不同的核苷酸，如嵌合体。突变可以存在于恶性组织中。突变的存在或不存在可以指示发展疾病或病状的增加的风险。突变的存在或不存在可以指示疾病或病状的存在。突变可以存在于良性组织中。突变的不存在可能表明组织或样本是良性的。作为替代方案，突变的不存在可能不表明组织或样本是良性的。如本文所述的方法可以包括鉴定样本中突变的存在。

DNA由RNA聚合酶转录以合成含有对RNA稳定性和调节功能重要的序列的前mRNA转录物。在编码RNA(mRNA)的情况下，对前mRNA进行RNA加工，以便通过外显子的可替代的剪接将前mRNA转化为成熟的mRNA。成熟的mRNA随后被核糖体翻译成蛋白质。在基因组DNA中可以存在突变，引起前mRNA转录物中的突变，影响蛋白质功能或所述蛋白质的表达。这些突变，如果存在于剪接位点，可以通过影响受影响的外显子的选择来阻止正确的可替代的剪接。具体地，前mRNA剪接位点含有保守的剪接受体和剪接供体位点。剪接供体位点通过核苷酸基序N/GT来表征，其中N是任何核苷酸，并且“/”代表外显子-内含子连接。剪接受体位点通过基序NAG/NN来表征，其中N代表任何核苷酸，并且“/”表示外显子-内含子连接。将此基序移除或引入到内含子和外显子连接中的突变可以导致异常的mRNA剪接，从而导致不适当的蛋白质产生。

本文公开了使用能够促进经由脱氨酶编辑靶RNA的多核苷酸外显子跳跃构建体编辑mRNA的组合物和方法。

RNA剪接是高度调控的过程，需要许多蛋白质参与哺乳动物中的RNA加工。RNA剪接是RNA加工的一种形式，其中经由外显子的连接和插入外显子的去除，将前mRNA转录物剪接成成熟的mRNA。成熟的mRNA随后被指定以用于通过核糖体机器翻译。前mRNA转录物中独特的碱基序列限定了外显子和内含子的边界，以促进蛋白质及其同工型的正确剪接和随后的表达。然而，基因组DNA中存在的突变可能存在于前mRNA转录物中，阻止前mRNA正确剪接成功能性蛋白质产物。这些突变导致外显子的不正确连接，导致无功能的蛋白质，潜在地导致疾病。可替代地，基因组DNA中存在的突变可能保留了前mRNA的正确剪接，但替代地可以通过导致外显子的不正确连接的干预来挽救。此类疾病的实例包含杜兴氏肌营养不良症、脊肌萎缩症、囊性纤维化、β地中海贫血(β-珠蛋白)、赫尔勒综合征(Hurler syndrome)和德拉韦综合征(Dravet Syndrome)。

核糖核酸(RNA)是从细胞核中的基因组DNA转录而来的。在运出细胞核后，RNA被核糖体翻译以生成功能性蛋白质，从而进行生物过程。在真核系统中，RNA最初被合成为前mRNA，其中前mRNA经受RNA加工，如可替代的剪接，以便产生为核糖体翻译做好准备的成熟的RNA。

可替代的剪接是其中前mRNA被加工以便产生成熟RNA的过程。前mRNA包括外显子和内含子以及其他非翻译区(3'和5'UTR)。在可替代的剪接期间，区分前mRNA的外显子和内含子的剪接信号使剪接体能够将多个外显子连接在一起以形成功能蛋白，从而去除中间的内含子。

表达载体上“剪接信号”的存在通常导致重组转录物的更高表达水平。剪接信号介导内含子从初级RNA转录物中去除，并且由剪接供体和受体位点组成。

最近的工作强调了利用方法来诱导蛋白质编码转录物的外显子跳跃的可能性。在许多情况下，许多蛋白质如α-突触核蛋白和DMD可以被表达为不同的剪接变体，其中一些可能与疾病有关。据认为，通过促进外显子跳跃事件，可以绕过含有与疾病相关的突变的外显子，或者可以恢复密码子阅读框，从而促进足以纠正疾病或病症或减轻疾病或病症的症状的变体的翻译。

引导RNA可以使用人或小鼠U6 snRNA启动子来表达。RNA聚合酶III型启动子如U6通常转录短的“管家”RNA。U6启动子也可以用于表达Crispr/Cas9核酸酶的单个引导RNA和RNA干扰的短发夹RNA。

SnRNA启动子(除U6外)是RNA聚合酶II型启动子。像用于mRNA表达的那些一样，snRNA转录物可以与mRNA不同地被加工(无聚腺苷酸化，不同的5'加帽)。聚合酶可以与整合子复合物缔合。在一些情况下，可能需要识别启动子和3'终止子中的序列元件。

如果用胸腺嘧啶代替尿嘧啶表示，则SmOPT序列可以被表示为AAUUUUUGGAG(SEQID NO:41)或AATTTTTGGAG。U7 snRNA(其与组蛋白前mRNA的间隔子元件自然杂交)的某些核苷酸已被反义序列代替(例如针对β-珠蛋白前mRNA)。

内源性U7 snRNA可以以低水平表达，大约每个细胞2至15×10³个分子。然而，如本文所述，通过将野生型U7 Sm结合位点(AAUUUGUCUAG)转化为来源于主要剪接体snRNP的共有Sm结合序列(SmOPT，AAUUUUUGGAG)，可以显著地增加U7 snRNA的表达水平和核浓度。此外，如本文所述，U7 snRNA的这种SmOPT修饰可以减少组蛋白前mRNA加工。这潜在地具有两种有益效果：(i)靶RNA可能不被组蛋白3'端加工机制切割，和(ii)RNA可能不与内源性U7snRNP竞争潜在地限制性的U7特异性蛋白。最后，具有如本文所述的SmOPT修饰的引导RNA可以被重定向至前mRNA剪接的位点。

在一些情况下，可以使用在U1启动子下的修饰的U7 snRNA构建体(即在U1启动子和终止子序列的控制下具有修饰的U7 snRNA基因的杂交体)。

修饰的SmOPT U7 snRNA底盘可以与其他基因的反义序列一起使用，以修饰如本文所述的其他疾病的RNA剪接。例如，用于外显子跳跃的U7反义寡核苷酸构建体可以包含hnRNP A1的结合位点。当hnRNP A1被募集到剪接位点时，它可以阻断剪接机制并促进外显子跳跃。

在一些疾病如杜兴氏肌营养不良症(DMD)中，蛋白质的外显子可能具有突变，该突变当被表达时导致疾病。包含具有导致疾病的突变的外显子已经被探索用于治疗干预。外显子跳跃已经被探索作为一种方法，其中防止突变的外显子在可替代的剪接事件期间被选择。框内外显子71和74可以分别含有贝克突变和杜兴氏突变。

跳跃外显子的能力已经被证明是防止使用会导致疾病的外显子的有吸引力的解决方案。以前使用外显子跳跃的尝试利用了掩蔽剪接信号的试剂，以便促进出于治疗目的的外显子排除或外显子包含。

用于RNA编辑的工程改造的多核苷酸构建体

本文公开了使用具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸编辑mRNA的组合物和方法，所述snRNA序列和snRNA发夹能够通过天然存在的脱氨酶介导前mRNA的编辑。在一些情况下，此类工程改造的多核苷酸可以用于在可替代的剪接期间影响外显子的使用。在一些实施例中，本公开描述了可以用于促进RNA编辑的工程改造的多核苷酸。在一些情况下，RNA编辑可以介导外显子跳跃。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸可以是环状的或可以在细胞中被配置为环状的。在一些实施例中，工程改造的多核苷酸是线性的。在一些实施例中，当工程改造的多核苷酸以2维表示时，工程改造的多核苷酸是线性或环状的。工程改造的多核苷酸编码工程改造的引导RNA。工程改造的引导RNA可以包括靶向序列(或“靶向区域”或“靶向结构域”)和募集结构域(或“募集区域”)。在一些实施例中，工程改造的引导RNA只是靶向序列。

小核RNA(snRNA)

本公开的组合物和方法提供了编码引导RNA的工程改造的多核苷酸，所述引导RNA能够操作地连接到小核核糖核酸(snRNA)序列的一部分。工程改造的多核苷酸可以包含小核核糖核酸(snRNA)序列的至少一部分。U7和U1小核RNA(其天然作用是前mRNA的剪接体加工)几十年来已经被重新工程改造以改动所需的疾病靶标处的剪接。用疾病基因的短靶向(或反义)序列替换U7 snRNA的前18nt(其天然地与组蛋白前mRNA的间隔子元件杂交)重定向剪接机制以改动靶位点周围的剪接。此外，将野生型U7 Sm结构域结合位点转化为优化的共有Sm结合序列(SmOPT)可以增加人工反义工程改造的U7 snRNA的表达水平、活性和亚细胞定位。许多后续的小组已经用其他基因的反义序列来适应这种修饰的U7 SmOPT snRNA底盘，以募集剪接体元件并修饰针对额外的疾病靶标的RNA剪接。

snRNA是在真核细胞的细胞核内发现的一类小RNA分子。它们涉及多种重要过程，如RNA剪接(从前mRNA中去除内含子)、转录因子(7SK RNA)或RNA聚合酶II(B2 RNA)的调节以及维持端粒。它们总是与特定的蛋白质缔合，并且产生的RNA-蛋白质复合物被称为小核核糖核蛋白(snRNP)或有时被称为snurps。存在许多snRNA，它们被命名为U1、U2、U3、U4、U5、U6、U7、U8、U9和U10。

U7型的snRNA通常涉及组蛋白mRNA的成熟。这种snRNA已经在大量的真核物种(迄今为止56种)中被鉴定，并且这些物种中的每一者的U7 snRNA应该被认为对本发明同样方便。

野生型U7 snRNA包含茎环结构、U7特异性Sm序列和在组蛋白前mRNA的3'端处的反义序列。

除了SmOPT结构域外，U7包括在组蛋白前mRNA的3'端处的反义序列。当此序列被与另一个靶标前mRNA反义的靶向序列替换时，U7被重定向至新的靶标前mRNA。因此，含有SmOPT结构域和靶向反义序列的修饰的U7 snRNA的稳定的表达导致了mRNA剪接的特异性改变。虽然表达适当修饰的鼠U7基因以及其天然启动子和3'元件的基于AAV-2/1的载体已经通过覆盖和跳跃小鼠Dmd外显子23能够实现向骨骼肌中的高效基因转移和完全的肌营养不良症蛋白拯救，但如本文所述的工程改造的多核苷酸(无论是直接施用还是经由例如AAV载体施用)可以促进脱氨酶对靶RNA的编辑。

工程改造的多核苷酸可以至少部分地包括snRNA序列。snRNA序列可以是U1、U2、U3、U4、U5、U6、U7、U8、U9或U10 snRNA序列。

在一些情况下，包括snRNA序列的至少一部分(例如，snRNA启动子、snRNA发夹等)的工程改造的多核苷酸相对于缺少此类特征的可比多核苷酸可以具有用于治疗或预防疾病或病状的优异性质。例如，如本文所述，包括snRNA序列的至少一部分的工程改造的多核苷酸可以比缺少此类特征的可比多核苷酸以更高的效率促进外显子的外显子跳跃。此外，如本文所述，包括snRNA序列的至少一部分的工程改造的多核苷酸可以比缺少此类特征的可比多核苷酸以更高的效率促进靶RNA(例如，前mRNA或成熟RNA)中核苷酸的碱基的编辑。

snRNA启动子

本公开的组合物和方法提供了编码引导RNA的工程改造的多核苷酸，所述引导RNA也可以包括snRNA启动子。启动子可以促进工程改造的多核苷酸的转录。启动子可以能够操作地连接到工程改造的多核苷酸上。例如，启动子可以连接到工程改造的多核苷酸的靶向序列的5'端或3'端。

启动子是一种非编码基因组DNA序列，通常位于相关编码序列的上游(5')，RNA聚合酶在启动转录之前与该序列结合。这种结合使RNA聚合酶对齐，使得转录将在特定的转录起始位点处开始。启动子包含能够控制另一核酸片段的转录的核酸片段。启动子能够控制编码序列或功能RNA的表达。功能性RNA包含但不限于crRNA、tracrRNA、转移RNA(tRNA)和核糖体RNA(rRNA)。已经表明，某些启动子能够以比其他启动子更高的速率指导RNA合成。这些被称为“强的启动子”。某些其他启动子已经显示仅在特定类型的细胞或组织中以较高水平指导RNA合成，并且如果启动子优选地在某些组织中指导RNA合成，但在其他组织中以降低的水平指导RNA合成，则通常被称为“组织特异性启动子”或“组织优选的启动子”。由于引入到生物体中的嵌合基因(或多种基因)的表达模式是使用启动子控制的，因此人们对分离能够在特定组织类型或特定发育阶段的某些水平上控制嵌合基因(或多种基因)表达的新型启动子一直感兴趣。

某些启动子能够在所有组织中以相对相似的水平指导RNA合成。这些被称为“组成型启动子”或“组织非依赖性”启动子。根据指导RNA合成的有效性，组成型启动子可以被分为强启动子、中度启动子和弱启动子。由于在许多情况下需要在不同组织中同时表达嵌合基因(或多个基因)以获得该基因(或多个基因)的所需功能，因此组成型启动子在这方面尤其有用。

启动子序列可以与选自由U1、U2、U3、U4、U5、U6和U7启动子序列组成的组的启动子序列具有至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。启动子序列可以是U1、U2、U3、U4、U5、U6或U7启动子序列。

snRNA发夹和额外的二级结构

本公开的组合物和方法提供了编码引导RNA的工程改造的多核苷酸，所述引导RNA可以包含发夹或其他二级结构。RNA中存在的发夹和其他二级结构可以增加RNA分子的稳定性。

如本文所公开的，发夹是RNA双链体，其中单个RNA链自身折叠以形成RNA双链体。单个RNA链由于在折叠区的上游和下游具有彼此碱基对的核苷酸序列而自身折叠。发夹在整个双链体结构的长度上可以具有10至500个核苷酸。发夹的茎环结构可以是3至15个核苷酸长。发夹可以存在于本文公开的任何工程改造的引导RNA中。本文公开的工程改造的引导RNA可以具有1至10个发夹。在一些实施例中，本文公开的工程改造的引导RNA具有1个发夹。在一些实施例中，本文公开的工程改造的引导RNA具有2个发夹。如本文所公开的，发夹可以是指募集发夹或发夹或非募集发夹。发夹可以位于本公开的工程改造的引导RNA内的任何位置。在一些实施例中，一个或多个发夹存在于本公开的工程改造的引导RNA的3'端、本公开的工程改造的引导RNA的5'端或本公开的工程改造的引导RNA的靶向序列内，或其任何组合。

如本文所公开的，募集发夹可以募集RNA编辑实体，如ADAR。在一些实施例中，募集发夹是GluR2结构域或其变体。在一些实施例中，募集发夹是Alu结构域或其变体。

如本文所公开的，非募集发夹可以表现出改善工程改造的引导RNA对靶RNA的定位的功能。在一些实施例中，非募集发夹改善了核保留。在一些实施例中，非募集发夹包括来自U7 snRNA的发夹。

通过RNA碱基的分子间相互作用来形成发夹和其他RNA二级结构，以通过Watson-Crick碱基配对来形成碱基配对。

术语“发夹环”是指这样的单链区域，该单链区域环回到自身上并通过结构域的互补结合而闭合。

发夹可以包括来自剪接体snRNA的序列、非剪接体snRNA序列或其任何组合。发夹可以包括与剪接体或非剪接体snRNA序列具有至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的序列。

剪接体或非剪接体snRNA序列可以包含U1、U2、U4、U5、U6、U7或其任何组合的至少一部分。snRNA序列可以与SEQ ID NO:34至SEQ ID NO:39的任何一个启动子序列具有至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸可以包括形成发夹二级结构的序列。在一些情况下，该序列可以与U7发夹的序列具有至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。

其他二级结构可以被附加到工程改造的多核苷酸上。附加的二级结构可以是，但不限于，hnRNPA1及其突变形式、SIRLOIN核标签、MALAT1 MG片段和含有额外的惰性二级结构的Cas9 gRNA。

靶向序列

本公开的具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸包含将所述构建体导向感兴趣的区域的靶向序列。靶向序列可以包括与感兴趣的序列至少部分互补的核苷酸的序列，从而提供了与靶序列杂交的手段。

本文提供了多核苷酸和包括该多核苷酸的组合物。在一个方面中，多核苷酸可以是工程改造的多核苷酸。在一个实施例中，工程改造的多核苷酸可以是工程改造的多核苷酸。在一些实施例中，本公开的工程改造的多核苷酸可以用于RNA编辑，例如用于预防或治疗疾病或病状。在一些情况下，工程改造的多核苷酸可以与受试者RNA编辑实体联合使用，以编辑靶RNA或调节由靶RNA编码的多肽的表达。在一个实施例中，本文公开的组合物可以包含能够促进受试者RNA编辑实体如ADAR或ADAT多肽或其生物学活性片段进行编辑的工程改造的多核苷酸。

工程改造的多核苷酸可以以任何适合于RNA靶向的方式进行工程改造。在一个方面中，工程改造的多核苷酸通常包括至少一个允许其与靶RNA的区域杂交的靶向序列。在一些情况下，靶向序列也可以被称为靶向结构域或靶向区域。

在一个方面中，工程改造的多核苷酸的靶向序列允许工程改造的多核苷酸通过碱基配对(例如Watson Crick碱基配对)靶向RNA序列。在一个实施例中，靶向序列可以位于工程改造的多核苷酸的N末端或C末端。在一些情况下，靶向序列位于两个末端。靶向序列可以是任何长度。在一些情况下，靶向序列的长度为至少约：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或高达约200个核苷酸。在一个实施例中，工程改造的多核苷酸包括长度为约25-200、50-150、75-100、80-110、90-120或95-115个核苷酸的靶向序列。在一个实施例中，工程改造的多核苷酸包括长度为约100个核苷酸的靶向序列。

在一些情况下，受试者的靶向序列包括与至少部分地编码受试者多肽的靶RNA的区域至少部分互补的序列。在一些情况下，靶向序列包括与靶RNA的95％、96％、97％、98％、99％或100％的序列互补性。在一些情况下，靶向序列包括与靶RNA序列小于100％的互补性。例如，靶向序列和可以被靶向序列结合的靶RNA的区域可以具有单个碱基错配。在其他情况下，受试者的工程改造的多核苷酸的靶向序列包括至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、20、30、40或高达约50个碱基错配。在一些方面中，核苷酸错配可以与本文提供的结构特征相关联。在一些方面中，靶向序列包括与受试者靶RNA的野生型RNA在互补性上不同的至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14或高达约15个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的至少50个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的50至150个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的50至200个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的50至250个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的50至300个核苷酸。在一些情况下，靶向序列包括与靶RNA具有互补性的50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299或300个核苷酸。在一些情况下，靶向序列总共包括超过50个核苷酸，并且具有与靶RNA具有互补性的至少50个核苷酸。在一些情况下，靶向序列总共包括50至400个核苷酸，并且具有与靶RNA具有互补性的50至150个核苷酸。在一些情况下，靶向序列总共包括50至400个核苷酸，并且具有与靶RNA具有互补性的50至200个核苷酸。在一些情况下，靶向序列总共包括50至400个核苷酸，并且具有与靶RNA具有互补性的50至250个核苷酸。在一些情况下，靶向序列总共包括50至400个核苷酸，并且具有与靶RNA具有互补性的50至300个核苷酸。在一些情况下，与靶RNA具有互补性的至少50个核苷酸被一个或多个错配、一个或多个凸起、或一个或多个环、或其任何组合分隔。在一些情况下，与靶RNA具有互补性的50至150个核苷酸被一个或多个错配、一个或多个凸起、或一个或多个环、或其任何组合分隔。在一些情况下，与靶RNA具有互补性的50至200个核苷酸被一个或多个错配、一个或多个凸起、或一个或多个环、或其任何组合分隔。在一些情况下，与靶RNA具有互补性的50至250个核苷酸被一个或多个错配、一个或多个凸起、或一个或多个环、或其任何组合分隔。在一些情况下，与靶RNA具有互补性的50至300个核苷酸被一个或多个错配、一个或多个凸起、或一个或多个环、或其任何组合分隔。例如，靶向序列包括总共54个核苷酸，其中依次地，25个核苷酸与靶RNA互补，4个核苷酸形成凸起，并且25个核苷酸与靶RNA互补。又如，靶向序列包括总共118个核苷酸，其中依次地，25个核苷酸与靶RNA互补，4个核苷酸形成凸起，25个核苷酸与靶RNA互补，14个核苷酸形成环，并且50个核苷酸与靶RNA互补。

在一些情况下，与靶RNA结合的本公开的工程改造的多核苷酸形成双链RNA，该双链RNA募集ADAR并且本身是ADAR的底物。

在一些情况下，工程改造的多核苷酸可以包括多个靶向序列。在一些情况下，工程改造的多核苷酸中的一个或多个靶序列结构域可以结合至靶RNA的一个或多个区域。例如，第一靶向序列可以被配置为与靶RNA的第一区域(例如前mRNA的第一外显子)至少部分互补，而第二靶向序列可以被配置为与靶RNA的第二区域(例如前mRNA的第二外显子)至少部分互补。在一些情况下，多个靶序列可以可操作地连接，以提供靶RNA的多个区域的连续杂交。在一些情况下，多个靶序列可以提供靶RNA的多个区域的非连续杂交。“非连续”重叠或杂交可以是指靶RNA的第一区域通过第一靶向序列的杂交，以及靶RNA的第二区域通过第二靶向序列的杂交，其中靶RNA的第一区域和第二区域是不连续的(例如，其中在靶RNA的第一区域和第二区域之间存在中间序列)。例如，靶向序列可以被配置为结合至第一外显子的一部分，并且可以包括第二靶向序列，该第二靶向序列被配置为结合至第二外显子的一部分，而外显子1的该部分和外显子2的该部分之间的中间序列没有被靶向序列或寡栓链杂交。使用如本文所述的被配置为用于非连续杂交的工程改造的多核苷酸可以提供许多益处。例如，这种引导序列可能在转录期间(或其后不久)靶向前mRNA，其然后可以促进使用脱氨酶(例如ADAR)共转录的化学修饰，从而增加化学修饰的总体效率。此外，使用具有非连续杂交的多核苷酸，同时跳跃中间序列，可以产生更短的、更特异性的引导RNA，具有更少的脱靶标编辑。

在一些情况下，被配置用于与靶RNA非连续杂交的工程改造的多核苷酸可以被配置为结合至不同区域或由中间序列分隔的靶RNA。在一些情况下，中间序列可以是至少：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900或10000个碱基。在一些情况下，靶向序列可以靶向同一内含子或外显子的不同非连续区域。在一些情况下，靶向序列可以靶向相邻外显子或内含子的不同非连续区域。在一些情况下，靶向序列可以靶向远端外显子或内含子的不同非连续区域。

募集区域

在一个方面中，受试者工程改造的多核苷酸包括RNA编辑实体募集结构域。RNA编辑实体可以被工程改造的多核苷酸上的RNA编辑实体募集结构域募集。在一些情况下，受试者工程改造的多核苷酸被配置为促进受试者靶RNA的区域的多核苷酸的核苷酸的碱基的编辑、由受试者靶RNA编码的多肽的调节表达、或两者。在一些情况下，工程改造的多核苷酸可以被配置为促进受试者RNA编辑实体对RNA的区域的核苷酸或多核苷酸的碱基的编辑。为了促进编辑，本公开的工程改造的多核苷酸可以募集RNA编辑实体。在某些实施例中，工程改造的多核苷酸缺少RNA编辑实体募集结构域。无论哪种方式，受试者工程改造的多核苷酸能够结合RNA编辑实体，或被其结合，并促进受试者靶RNA的编辑。

在一些实例中，受试者靶向序列包括RNA编辑实体募集结构域。RNA编辑实体可以被工程改造的多核苷酸上的RNA编辑实体募集结构域募集。在一些实例中，受试者工程改造的多核苷酸被配置为促进受试者靶RNA的区域的多核苷酸的核苷酸的碱基的编辑、由受试者靶RNA编码的多肽的调节表达、或两者。在一些情况下，工程改造的多核苷酸可以被配置为促进受试者RNA编辑实体对RNA的区域的核苷酸或多核苷酸的碱基的编辑。为了促进编辑，本公开的工程改造的多核苷酸可以募集RNA编辑实体。

可以使用各种RNA编辑实体募集结构域。在一些实例中，募集结构域包括：谷氨酸离子型受体AMPA 2型亚基(GluR2)、APOBEC、MS2-噬菌体-外壳蛋白-募集结构域、Alu、TALEN募集结构域、Zn指多肽募集结构域、mega-TAL募集结构域、或Cas13募集结构域、其组合，或其修饰形式。在一些实例中，在本公开的工程改造的多核苷酸中可以包含多于一个的募集结构域。在其中存在募集序列的实例中，募集序列可以用于定位RNA编辑实体，以在靶向序列(例如，靶向序列中与靶RNA至少部分互补的部分)与靶RNA杂交后，与受试者靶RNA有效反应。在一些情况下，募集序列可以允许RNA编辑实体与工程改造的多核苷酸的瞬时结合。在一些实例中，募集序列允许RNA编辑实体与工程改造的多核苷酸永久结合。募集序列可以是任何长度。在一些情况下，募集序列的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、高达约80个核苷酸。在一些情况下，募集序列的长度不超过约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或80个核苷酸。在一些情况下，募集序列的长度为约45个核苷酸。在一些情况下，募集序列的至少一部分包括至少1至约75个核苷酸。在一些情况下，募集序列的至少一部分包括约45个核苷酸至约60个核苷酸。

在一个实施例中，RNA编辑实体募集结构域包括GluR2序列、变体或其功能片段。在一些情况下，GluR2序列可以被RNA编辑实体(如ADAR或其生物活性片段)识别。在一些实施例中，GluR2序列可以是非天然存在的序列。在一些情况下，GluR2序列可以被修饰，例如用于增强的募集。在一些实施例中，GluR2序列可以包括天然存在的GluR2序列和合成序列的一部分。

在一些实例中，募集结构域包括GluR2序列，或与GUGGAAUAGUAUAACAAUAUGCUAAAUGUUGUUAUAGUAUCCCAC(SEQ ID NO:49)具有至少约80％、85％、90％、95％、98％、99％或100％同一性的序列。在一些情况下，募集结构域可以包括与SEQ ID NO:49的至少约10、15、20、25或30个核苷酸至少约80％的序列同源性。在一些实例中，募集结构域可以包括与SEQID NO:49至少约90％、95％、96％、97％、98％或99％的序列同源性。

在一些实例中，募集结构域包括CRISPR相关的募集结构域序列。例如，CRISPR相关的募集序列可以包括Cas蛋白序列。在一些情况下，Cas13募集结构域可以包括Cas13a募集结构域、Cas13b募集结构域、Cas13c募集结构域或Cas13d募集结构域。在一些实例中，RNA编辑实体募集结构域可以包括与Cas13b募集结构域的至少约20个核酸的至少约80％的序列同源性。在一些实例中，RNA编辑实体募集结构域可以包括与Cas13b募集结构域至少约80％的序列同源性。在一些情况下，RNA编辑实体募集结构域可以包括与Cas13b结构域的至少约15、20、25、30或35个核酸的至少约80％、85％、90％或95％的序列同源性。在一些实例中，RNA编辑实体募集结构域的至少一部分可以包括与Cas13b结构域编码序列至少约80％的序列同源性。在一些实例中，RNA编辑实体募集结构域的至少一部分可以包括与Cas13b结构域编码序列至少约85％的序列同源性。在一些实例中，RNA编辑实体募集结构域的至少一部分可以包括与Cas13b结构域编码序列至少约90％的序列同源性。在一些实例中，RNA编辑实体募集结构域的至少一部分可以包括与Cas13b结构域编码序列至少约95％的序列同源性。在一些实例中，Cas13b结构域编码序列可以是非天然存在的序列。在一些实例中，Cas13b结构域编码序列可以包括修饰的部分。在一些实例中，Cas13b结构域编码序列可以包括天然存在的Cas13b结构域编码序列的一部分。

在本公开的工程改造的多核苷酸中可以发现任何数量的募集序列。在一些实例中，在工程改造的多核苷酸中包含至少约1、2、3、4、5、6、7、8、9或高达约10个募集序列。募集序列可以位于受试多核苷酸的任何位置。在一些情况下，募集序列位于多核苷酸的N末端、中间或C末端。募集序列可以位于靶向序列的上游或下游。在一些情况下，募集序列位于受试多核苷酸的靶向序列的侧翼。募集序列可以包括所有的核糖核苷酸或脱氧核糖核苷酸，尽管不排除包括核糖核苷酸和脱氧核糖核苷酸两者的募集序列。

在一些实例中，本文公开的工程改造的多核苷酸缺少募集区域，并且RNA编辑实体的募集由工程改造的多核苷酸和靶RNA形成的双链底物实现。在一些实例中，本文公开的工程改造的多核苷酸，当存在于水溶液中并且不与靶RNA分子结合时，不募集RNA编辑实体。在一些实例中，当存在于水溶液中并且不与靶RNA分子结合时，如果其与RNA编辑实体结合，则本文公开的工程改造的多核苷酸以约大于或等于500nM的解离常数结合。在一些实例中，离解常数为约22nM。在一些实例中，本文公开的工程改造的多核苷酸，当存在于水溶液中并且不与靶RNA分子结合时，缺少结构特征。在一些实例中，本文公开的工程改造的多核苷酸，当存在于水溶液中并且不与靶RNA分子结合时，缺少凸起、内环、发夹或其任何组合。在一些实例中，本文公开的工程改造的多核苷酸，当存在于水溶液中并且不与靶RNA分子结合时，是线性的并且不包括任何结构特征。

在其中缺乏募集序列的情况下，工程改造的多核苷酸仍然能够与受试者RNA编辑实体(例如，ADAR)缔合，以促进靶RNA的编辑和/或调节由受试者靶RNA编码的多肽的表达。这可以通过结构特征来实现。结构特征可以包括以下中的任何一者：错配、对称凸起、不对称凸起、对称内环、不对称内环、发夹、摆动碱基对、结构基序、环化的RNA、化学修饰或其任何组合。在一个方面中，双链RNA(dsRNA)底物，例如杂交的多核苷酸链，可以在本公开的工程改造的多核苷酸与靶RNA杂交时形成。本文描述了一种特征，其对应于可能存在于本公开的dsRNA底物中的几个结构特征中的一个。特征的实例包含错配、凸起(对称凸起或不对称凸起)、内环(对称内环或不对称内环)或发夹(募集发夹或包括非靶向结构域的发夹)。本公开的工程改造的多核苷酸可以具有1至50个特征。本公开的工程改造的多核苷酸可以具有1至5、5至10、10至15、15至20、20至25、25至30、30至35、35至40、40至45、45至50、5至20、1至3、4至5、2至10、20至40、10至40、20至50、30至50、4至7或8至10个特征。

如本文所公开的，结构化的基序在dsRNA底物中包括两个或更多个特征。

双链RNA(dsRNA)底物是在本公开的工程改造的引导RNA与靶RNA杂交时形成的。如本文所公开的，错配是指引导RNA中的核苷酸与dsRNA中靶RNA中的相反核苷酸不成对。错配可以包括任何两个不碱基配对、不互补或两者的核苷酸。在一些实施例中，错配是A/C错配。A/C错配可以包括与靶RNA中的A相反的本公开的工程改造的引导RNA中的C。A/C错配可以包括与靶RNA中的C相反的本公开的工程改造的引导RNA中的A。在一个实施例中，G/G错配可以包括与靶RNA中的G相反的本公开的工程改造的引导RNA中的G。在一些实施例中，位于编辑位点5'的错配可以促进待编辑的靶A的碱基翻转。错配也可能有助于赋予序列特异性。在一个实施例中，错配包括G/G错配。在一个实施例中，错配包括A/C错配，其中A在靶RNA中，并且C在工程改造的多核苷酸的靶向序列中。在另一个实施例中，A/C错配中的A是由受试者RNA编辑实体编辑的靶RNA中的核苷酸的碱基。

如本文所述的错配可以位于接近靶向序列的任一端的距离处。在一些情况下，错配可以位于相对于靶向序列的任一端约1个碱基至约200个碱基、约2个碱基至约200个碱基、约3个碱基至约200个碱基、约4个碱基至约200个碱基、约5个碱基至约200个碱基、约6个碱基至约200个碱基、约7个碱基至约200个碱基、约8个碱基至约200个碱基、约9个碱基至约200个碱基、约10个碱基至约200个碱基、约11个碱基至约200个碱基、约12个碱基至约200个碱基、约13个碱基至约200个碱基、约14个碱基至约200个碱基、约15个碱基至约200个碱基、约16个碱基至约200个碱基、约17个碱基至约200个碱基、约18个碱基至约200个碱基、约19个碱基至约200个碱基、约20个碱基至约200个碱基、约21个碱基至约200个碱基、约22个碱基至约200个碱基、约23个碱基至约200个碱基、约24个碱基至约200个碱基、约25个碱基至约200个碱基、约26个碱基至约200个碱基、约27个碱基至约200个碱基、约28个碱基至约200个碱基、约29个碱基至约200个碱基、约30个碱基至约200个碱基、约31个碱基至约200个碱基、约32个碱基至约200个碱基、约33个碱基至约200个碱基、约34个碱基至约200个碱基、约35个碱基至约200个碱基、约36个碱基至约200个碱基、约37个碱基至约200个碱基、约38个碱基至约200个碱基、约39个碱基至约200个碱基、约40个碱基至约200个碱基、约41个碱基至约200个碱基、约42个碱基至约200个碱基、约43个碱基至约200个碱基、约44个碱基至约200个碱基、约45个碱基至约200个碱基、约46个碱基至约200个碱基、约47个碱基至约200个碱基、约48个碱基至约200个碱基、约49个碱基至约200个碱基、约50个碱基至约200个碱基、约51个碱基至约200个碱基、约52个碱基至约200个碱基、约53个碱基至约200个碱基、约54个碱基至约200个碱基、约55个碱基至约200个碱基、约56个碱基至约200个碱基、约57个碱基至约200个碱基、约58个碱基至约200个碱基、约59个碱基至约200个碱基、约60个碱基至约200个碱基、约61个碱基至约200个碱基、约62个碱基至约200个碱基、约63个碱基至约200个碱基、约64个碱基至约200个碱基、约65个碱基至约200个碱基、约66个碱基至约200个碱基、约67个碱基至约200个碱基、约68个碱基至约200个碱基、约69个碱基至约200个碱基、约70个碱基至约200个碱基、约71个碱基至约200个碱基、约72个碱基至约200个碱基、约73个碱基至约200个碱基、约74个碱基至约200个碱基、约75个碱基至约200个碱基、约76个碱基至约200个碱基、约77个碱基至约200个碱基、约78个碱基至约200个碱基、约79个碱基至约200个碱基、约80个碱基至约200个碱基、约81个碱基至约200个碱基、约82个碱基至约200个碱基、约83个碱基至约200个碱基、约84个碱基至约200个碱基、约85个碱基至约200个碱基、约86个碱基至约200个碱基、约87个碱基至约200个碱基、约88个碱基至约200个碱基、约89个碱基至约200个碱基、约90个碱基至约200个碱基、约91个碱基至约200个碱基、约92个碱基至约200个碱基、约93个碱基至约200个碱基、约94个碱基至约200个碱基、约95个碱基至约200个碱基、约96个碱基至约200个碱基、约97个碱基至约200个碱基、约98个碱基至约200个碱基、约99个碱基至约200个碱基、约100个碱基至约200个碱基、约101个碱基至约200个碱基、约102个碱基至约200个碱基、约103个碱基至约200个碱基、约104个碱基至约200个碱基、约105个碱基至约200个碱基、约106个碱基至约200个碱基、约107个碱基至约200个碱基、约108个碱基至约200个碱基、约109个碱基至约200个碱基、约110个碱基至约200个碱基、约111个碱基至约200个碱基、约112个碱基至约200个碱基、约113个碱基至约200个碱基、约114个碱基至约200个碱基、约115个碱基至约200个碱基、约116个碱基至约200个碱基、约117个碱基至约200个碱基、约118个碱基至约200个碱基、约119个碱基至约200个碱基、约120个碱基至约200个碱基、约121个碱基至约200个碱基、约122个碱基至约200个碱基、约123个碱基至约200个碱基、约124个碱基至约200个碱基、约125个碱基至约200个碱基、约126个碱基至约200个碱基、约127个碱基至约200个碱基、约128个碱基至约200个碱基、约129个碱基至约200个碱基、约130个碱基至约200个碱基、约131个碱基至约200个碱基、约132个碱基至约200个碱基、约133个碱基至约200个碱基、约134个碱基至约200个碱基、约135个碱基至约200个碱基、约136个碱基至约200个碱基、约137个碱基至约200个碱基、约138个碱基至约200个碱基、约139个碱基至约200个碱基、约140个碱基至约200个碱基、约141个碱基至约200个碱基、约142个碱基至约200个碱基、约143个碱基至约200个碱基、约144个碱基至约200个碱基、约145个碱基至约200个碱基、约146个碱基至约200个碱基、约147个碱基至约200个碱基、约148个碱基至约200个碱基、约149个碱基至约200个碱基、约150个碱基至约200个碱基、约151个碱基至约200个碱基、约152个碱基至约200个碱基、约153个碱基至约200个碱基、约154个碱基至约200个碱基、约155个碱基至约200个碱基、约156个碱基至约200个碱基、约157个碱基至约200个碱基、约158个碱基至约200个碱基、约159个碱基至约200个碱基、约160个碱基至约200个碱基、约161个碱基至约200个碱基、约162个碱基至约200个碱基、约163个碱基至约200个碱基、约164个碱基至约200个碱基、约165个碱基至约200个碱基、约166个碱基至约200个碱基、约167个碱基至约200个碱基、约168个碱基至约200个碱基、约169个碱基至约200个碱基、约170个碱基至约200个碱基、约171个碱基至约200个碱基、约172个碱基至约200个碱基、约173个碱基至约200个碱基、约174个碱基至约200个碱基、约175个碱基至约200个碱基、约176个碱基至约200个碱基、约177个碱基至约200个碱基、约178个碱基至约200个碱基、约179个碱基至约200个碱基、约180个碱基至约200个碱基、约181个碱基至约200个碱基、约182个碱基至约200个碱基、约183个碱基至约200个碱基、约184个碱基至约200个碱基、约185个碱基至约200个碱基、约186个碱基至约200个碱基、约187个碱基至约200个碱基、约188个碱基至约200个碱基、约189个碱基至约200个碱基、约190个碱基至约200个碱基、约191个碱基至约200个碱基、约192个碱基至约200个碱基、约193个碱基至约200个碱基、约194个碱基至约200个碱基、约195个碱基至约200个碱基、约196个碱基至约200个碱基、约197个碱基至约200个碱基、约198个碱基至约200个碱基或约199个碱基至约200个碱基的距离处。在一些情况下，错配可以位于距靶向序列的任一端至少1个碱基、至少2个碱基、至少3个碱基、至少4个碱基、至少5个碱基、至少6个碱基、至少7个碱基、至少8个碱基、至少9个碱基、至少10个碱基、至少11个碱基、至少12个碱基、至少13个碱基、至少14个碱基、至少15个碱基、至少16个碱基、至少17个碱基、至少18个碱基、至少19个碱基、至少20个碱基、至少21个碱基、至少22个碱基、至少23个碱基、至少24个碱基、至少25个碱基、至少26个碱基、至少27个碱基、至少28个碱基、至少29个碱基、至少30个碱基、至少31个碱基、至少32个碱基、至少33个碱基、至少34个碱基、至少35个碱基、至少36个碱基、至少37个碱基、至少38个碱基、至少39个碱基、至少40个碱基、至少41个碱基、至少42个碱基、至少43个碱基、至少44个碱基、至少45个碱基、至少46个碱基、至少47个碱基、至少48个碱基、至少49个碱基、至少50个碱基、至少51个碱基、至少52个碱基、至少53个碱基、至少54个碱基、至少55个碱基、至少56个碱基、至少57个碱基、至少58个碱基、至少59个碱基、至少60个碱基、至少61个碱基、至少62个碱基、至少63个碱基、至少64个碱基、至少65个碱基、至少66个碱基、至少67个碱基、至少68个碱基、至少69个碱基、至少70个碱基、至少71个碱基、至少72个碱基、至少73个碱基、至少74个碱基、至少75个碱基、至少76个碱基、至少77个碱基、至少78个碱基、至少79个碱基、至少80个碱基、至少81个碱基、至少82个碱基、至少83个碱基、至少84个碱基、至少85个碱基、至少86个碱基、至少87个碱基、至少88个碱基、至少89个碱基、至少90个碱基、至少91个碱基、至少92个碱基、至少93个碱基、至少94个碱基、至少95个碱基、至少96个碱基、至少97个碱基、至少98个碱基、至少99个碱基、至少100个碱基、至少101个碱基、至少102个碱基、至少103个碱基、至少104个碱基、至少105个碱基、至少106个碱基、至少107个碱基、至少108个碱基、至少109个碱基、至少110个碱基、至少111个碱基、至少112个碱基、至少113个碱基、至少114个碱基、至少115个碱基、至少116个碱基、至少117个碱基、至少118个碱基、至少119个碱基、至少120个碱基、至少121个碱基、至少122个碱基、至少123个碱基、至少124个碱基、至少125个碱基、至少126个碱基、至少127个碱基、至少128个碱基、至少129个碱基、至少130个碱基、至少131个碱基、至少132个碱基、至少133个碱基、至少134个碱基、至少135个碱基、至少136个碱基、至少137个碱基、至少138个碱基、至少139个碱基、至少140个碱基、至少141个碱基、至少142个碱基、至少143个碱基、至少144个碱基、至少145个碱基、至少146个碱基、至少147个碱基、至少148个碱基、至少149个碱基、至少150个碱基、至少151个碱基、至少152个碱基、至少153个碱基、至少154个碱基、至少155个碱基、至少156个碱基、至少157个碱基、至少158个碱基、至少159个碱基、至少160个碱基、至少161个碱基、至少162个碱基、至少163个碱基、至少164个碱基、至少165个碱基、至少166个碱基、至少167个碱基、至少168个碱基、至少169个碱基、至少170个碱基、至少171个碱基、至少172个碱基、至少173个碱基、至少174个碱基、至少175个碱基、至少176个碱基、至少177个碱基、至少178个碱基、至少179个碱基、至少180个碱基、至少181个碱基、至少182个碱基、至少183个碱基、至少184个碱基、至少185个碱基、至少186个碱基、至少187个碱基、至少188个碱基、至少189个碱基、至少190个碱基、至少191个碱基、至少192个碱基、至少193个碱基、至少194个碱基、至少195个碱基、至少196个碱基、至少197个碱基、至少198个碱基、至少199个碱基或至少200个碱基的距离处。

在一个方面中，结构特征可以独立地在工程改造的多核苷酸中形成。在其他情况下，当工程改造的多核苷酸与靶RNA结合时，可以形成结构特征。当工程改造的多核苷酸与其他分子如肽、核苷酸或小分子缔合时，也可以形成结构特征。在某些实施例中，工程改造的多核苷酸的结构特征可以独立于靶RNA形成，并且其结构可以由于工程改造的多肽与靶RNA区域杂交而变更。在某些实施例中，当工程改造的多核苷酸与靶RNA缔合时，存在结构特征。

在一些情况下，结构特征是发夹。在一些情况下，工程改造的多核苷酸可能缺少发夹结构域。在其他情况下，工程改造的多核苷酸可以含有发夹结构域或多于一个发夹结构域。发夹可以位于多核苷酸中的任何位置。如本文所公开的，发夹是RNA双链体，其中单个RNA链自身折叠以形成RNA双链体。单个RNA链由于在折叠区的上游和下游具有彼此碱基对的核苷酸序列而自身折叠。发夹在整个双链体结构的长度上可以具有10至500个核苷酸。发夹的茎环结构可以是3至15个核苷酸长。发夹可以存在于本文公开的任何工程改造的多核苷酸中。本文公开的工程改造的多核苷酸可以具有1至10个发夹。在一些实施例中，本文公开的工程改造的多核苷酸具有1个发夹。在一些实施例中，本文公开的工程改造的多核苷酸具有2个发夹。如本文所公开的，发夹可以是指募集发夹或发夹或非募集发夹。发夹可以位于本公开的工程改造的多核苷酸内的任何地方。在一些实施例中，一个或多个发夹存在于本公开的工程改造的多核苷酸的3'端、本公开的工程改造的多核苷酸的5'端或本公开的工程改造的多核苷酸的靶向序列内或其任何组合中。

在一个方面中，结构特征包括如本文公开的募集发夹。募集发夹可以募集RNA编辑实体，如ADAR。在一些实施例中，募集发夹包括GluR2结构域或其变体。在一些实施例中，募集发夹包括Alu结构域或其变体。

在又一方面中，结构特征包括非募集发夹。如本文所公开的，非募集发夹可以表现出改善工程改造的多核苷酸对靶RNA的定位的功能。在一些实施例中，非募集发夹改善了核保留。在一些实施例中，非募集发夹包括来自U7 snRNA的发夹。

在另一方面中，结构特征包括摆动碱基。摆动碱基对是指两个弱配对的碱基。例如，本公开的摆动碱基对可以是指与U配对的G。

本公开的发夹可以是任何长度。在一个方面中，发夹可以是约5-200个或更多个核苷酸。在一些情况下，发夹可以包括约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399或400个或更多个核苷酸。在其他情况下，发夹还可以包括5至10、5至20、5至30、5至40、5至50、5至60、5至70、5至80、5至90、5至100、5至110、5至120、5至130、5至140、5至150、5至160、5至170、5至180、5至190、5至200、5至210、5至220、5至230、5至240、5至250、5至260、5至270、5至280、5至290、5至300、5至310、5至320、5至330、5至340、5至350、5至360、5至370、5至380、5至390或5至400个核苷酸。发夹是由单链RNA形成的结构特征，其自身具有足够的互补性，以与双链RNA基序/结构杂交，该基序/结构由被核苷酸环分隔的双链杂交RNA组成。

在一些情况下，结构特征是凸起。凸起可以包括靶标链和工程改造的多核苷酸链之间的单个(有意的)核酸错配。在其他情况下，链之间多于一个的连续错配构成了凸起，只要该凸起区域(碱基的错配的延伸)在两侧都有杂交的互补dsRNA区域。凸起可以位于多核苷酸的任何位置。在一些情况下，凸起位于距5'羟基或3'羟基约30至约70个核苷酸处。

在一个实施例中，双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。如本文所公开的，凸起是指在形成dsRNA底物时形成的结构，其中工程改造的多核苷酸或靶RNA中的核苷酸与它们在相对链上的位置对应物不互补。凸起可以变更dsRNA底物的二级结构或三级结构。凸起可以在dsRNA底物的工程改造的多核苷酸侧或dsRNA底物的靶RNA侧上具有1至4个核苷酸。在一些实施例中，本公开的工程改造的多核苷酸具有2个凸起。在一些实施例中，本公开的工程改造的多核苷酸具有3个凸起。在一些实施例中，本公开的工程改造的多核苷酸具有4个凸起。在一些实施例中，dsRNA底物中凸起的存在可以定位ADAR以选择性编辑靶RNA中的靶标A并减少非靶标的脱靶标编辑。在一些实施例中，dsRNA底物中凸起的存在可以募集额外的ADAR。本文公开的dsRNA底物中的凸起可以募集其他蛋白质，如其他RNA编辑实体。在一些实施例中，位于编辑位点的5'处的凸起可以促进待编辑的靶标A的碱基翻转。凸起也可以有助于赋予序列特异性。凸起可以通过将它限制在产生靶标A的选择性编辑的方向上来帮助指导ADAR编辑。

在一个方面中，双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。凸起可以是对称凸起或不对称凸起。凸起可以由dsRNA底物的引导RNA侧或靶RNA侧上的1至4个参与核苷酸形成。当在凸起的每一侧存在相同数量的核苷酸时，形成对称凸起。对称凸起可以在dsRNA底物的工程改造的多核苷酸侧或dsRNA底物的靶RNA侧上具有2至4个核苷酸。例如，本公开的dsRNA底物中的对称凸起可以在dsRNA底物的工程改造的多核苷酸侧和靶RNA侧上具有相同数量的核苷酸。本公开的对称凸起可以由dsRNA靶标的工程改造的多核苷酸侧上的2个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的对称凸起可以由dsRNA靶标的工程改造的多核苷酸侧上的3个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的对称凸起可以由dsRNA靶标的工程改造的多核苷酸侧上的4个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。

双链RNA(dsRNA)底物是在本公开的工程改造的引导RNA与靶RNA杂交时形成的。凸起可以是对称凸起或不对称凸起。当在凸起的每一侧上存在不同数量的核苷酸时，形成不对称凸起。不对称凸起在dsRNA底物的引导RNA侧或靶RNA侧上可以具有1至4个参与核苷酸。例如，本公开的dsRNA底物中的不对称凸起在dsRNA底物的工程改造的引导RNA侧和靶RNA侧上可以具有不同数量的核苷酸。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的1个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程改造的引导RNA侧上的1个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程改造的引导RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程改造的引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程改造的引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程改造的引导RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程改造的引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程改造的引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的2个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的2个核苷酸和dsRNA底物的工程改造的引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的2个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的2个核苷酸和dsRNA底物的工程改造的引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程改造的引导RNA侧上的3个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的3个核苷酸和dsRNA底物的工程改造的引导RNA侧上的4个核苷酸形成。

在一个方面中，双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。如本文所公开的，内环是指在形成dsRNA底物时形成的结构，其中工程改造的多核苷酸或靶RNA中的核苷酸与它们在相反链上的位置对应物不互补，并且其中内环的一侧(在dsRNA底物的靶RNA侧或工程改造的多核苷酸侧上)具有大于5个核苷酸。内环可以是对称内环或不对称内环。在编辑位点附近存在的内环可能有助于待编辑的靶RNA中靶标A的碱基翻转。双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。内环可以是对称内环或不对称内环。当在内环的每一侧上存在相同数量的核苷酸时，形成对称内环。例如，本公开的dsRNA底物中的对称内环可以在dsRNA底物的工程改造的多核苷酸侧和靶RNA侧上具有相同数量的核苷酸。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。内环的一侧(在dsRNA底物的靶RNA侧或工程改造的多核苷酸侧上)可以由5至150个核苷酸形成。内环的一侧可以由5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、120、135、140、145、150、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸或其间的任何数量的核苷酸形成。内环的一侧可以由5个核苷酸形成。内环的一侧可以由10个核苷酸形成。内环的一侧可以由15个核苷酸形成。内环的一侧可以由20个核苷酸形成。内环的一侧可以由25个核苷酸形成。内环的一侧可以由30个核苷酸形成。内环的一侧可以由35个核苷酸形成。内环的一侧可以由40个核苷酸形成。内环的一侧可以由45个核苷酸形成。内环的一侧可以由50个核苷酸形成。内环的一侧可以由55个核苷酸形成。内环的一侧可以由60个核苷酸形成。内环的一侧可以由65个核苷酸形成。内环的一侧可以由70个核苷酸形成。内环的一侧可以由75个核苷酸形成。内环的一侧可以由80个核苷酸形成。内环的一侧可以由85个核苷酸形成。内环的一侧可以由90个核苷酸形成。内环的一侧可以由95个核苷酸形成。内环的一侧可以由100个核苷酸形成。内环的一侧可以由110个核苷酸形成。内环的一侧可以由120个核苷酸形成。内环的一侧可以由130个核苷酸形成。内环的一侧可以由140个核苷酸形成。内环的一侧可以由150个核苷酸形成。内环的一侧可以由200个核苷酸形成。内环的一侧可以由250个核苷酸形成。内环的一侧可以由300个核苷酸形成。内环的一侧可以由350个核苷酸形成。内环的一侧可以由400个核苷酸形成。内环的一侧可以由450个核苷酸形成。内环的一侧可以由500个核苷酸形成。内环的一侧可以由600个核苷酸形成。内环的一侧可以由700个核苷酸形成。内环的一侧可以由800个核苷酸形成。内环的一侧可以由900个核苷酸形成。内环的一侧可以由1000个核苷酸形成。内环可以是对称内环或不对称内环。在编辑位点附近存在的内环可能有助于待编辑的靶RNA中靶标A的碱基翻转。双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。内环可以是对称内环或不对称内环。当在内环的每一侧上存在相同数量的核苷酸时，形成对称内环。例如，本公开的dsRNA底物中的对称内环可以在dsRNA底物的工程改造的多核苷酸侧和靶RNA侧上具有相同数量的核苷酸。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的5至150个核苷酸和dsRNA底物的靶RNA侧上的5至150个核苷酸形成，其中在dsRNA靶标的工程改造的侧和dsRNA底物的靶RNA侧上核苷酸的数量相同。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的5至1000个核苷酸和dsRNA底物的靶RNA侧上的5至1000个核苷酸形成，其中在dsRNA靶标的工程改造的侧和dsRNA底物的靶RNA侧上核苷酸的数量相同。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的15个核苷酸和dsRNA底物的靶RNA侧上的15个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的20个核苷酸和dsRNA底物的靶RNA侧上的20个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的30个核苷酸和dsRNA底物的靶RNA侧上的30个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的40个核苷酸和dsRNA底物的靶RNA侧上的40个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的50个核苷酸和dsRNA底物的靶RNA侧上的50个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的60个核苷酸和dsRNA底物的靶RNA侧上的60个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的70个核苷酸和dsRNA底物的靶RNA侧上的70个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的80个核苷酸和dsRNA底物的靶RNA侧上的80个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的90个核苷酸和dsRNA底物的靶RNA侧上的90个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的100个核苷酸和dsRNA底物的靶RNA侧上的100个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的110个核苷酸和dsRNA底物的靶RNA侧上的110个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的120个核苷酸和dsRNA底物的靶RNA侧上的120个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的130个核苷酸和dsRNA底物的靶RNA侧上的130个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的140个核苷酸和dsRNA底物的靶RNA侧上的140个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的150个核苷酸和dsRNA底物的靶RNA侧上的150个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的200个核苷酸和dsRNA底物的靶RNA侧上的200个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的250个核苷酸和dsRNA底物的靶RNA侧上的250个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的300个核苷酸和dsRNA底物的靶RNA侧上的300个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的350个核苷酸和dsRNA底物的靶RNA侧上的350个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的400个核苷酸和dsRNA底物的靶RNA侧上的400个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的450个核苷酸和dsRNA底物的靶RNA侧上的450个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的500个核苷酸和dsRNA底物的靶RNA侧上的500个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的600个核苷酸和dsRNA底物的靶RNA侧上的600个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的700个核苷酸和dsRNA底物的靶RNA侧上的700个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的800个核苷酸和dsRNA底物的靶RNA侧上的800个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的900个核苷酸和dsRNA底物的靶RNA侧上的900个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程改造的多核苷酸侧上的1000个核苷酸和dsRNA底物的靶RNA侧上的1000个核苷酸形成。

在一个方面中，双链RNA(dsRNA)底物在本公开的工程改造的多核苷酸与靶RNA杂交时形成。内环可以是对称内环或不对称内环。当在内环的每一侧上存在不同数量的核苷酸时，形成不对称内环。例如，本公开的dsRNA底物中的不对称内环在dsRNA底物的工程改造的多核苷酸侧和靶RNA侧上可以具有不同数量的核苷酸。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5至150个核苷酸和dsRNA底物的靶RNA侧上的5至150个核苷酸形成，其中在dsRNA靶标的工程改造的侧上的核苷酸数量与dsRNA底物的靶RNA侧上的核苷酸数量不同。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5至1000个核苷酸和dsRNA底物的靶RNA侧上的5至1000个核苷酸形成，其中在dsRNA靶标的工程改造的侧上的核苷酸数量与dsRNA底物的靶RNA侧上的核苷酸数量不同。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的6个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的8个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的8个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程改造的多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的9个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程改造的多核苷酸侧上的500个核苷酸形成。

包括凸起或环的结构特征可以是任何尺寸。在一些情况下，凸起或环包括至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、200、250、300、350、400、450、500、600、700、800、900或1000个碱基。在一些情况下，凸起或环总共包括至少约1-10、5-15、10-20、15-25、20-30、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、1-110、1-120、1-130、1-140、1-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1000、20-50、20-60、20-70、20-80、20-90、20-100、20-110、20-120、20-130、20-140、20-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1000、30-40、30-50、30-60、30-70、30-80、30-90、30-100、30-110、30-120、30-130、30-140、30-150、30-200、30-250、30-300、30-350、30-400、30-450、30-500、30-600、30-700、30-800、30-900、30-1000、40-50、40-60、40-70、40-80、40-90、40-100、40-110、40-120、40-130、40-140、40-150、40-200、40-250、40-300、40-350、40-400、40-450、40-500、40-600、40-700、40-800、40-900、40-1000、50-60、50-70、50-80、50-90、50-100、50-110、50-120、50-130、50-140、50-150、50-200、50-250、50-300、50-350、50-400、50-450、50-500、50-600、50-700、50-800、50-900、50-1000、60-70、60-80、60-90、60-100、60-110、60-120、60-130、60-140、60-150、60-200、60-250、60-300、60-350、60-400、60-450、60-500、60-600、60-700、60-800、60-900、60-1000、70-80、70-90、70-100、70-110、70-120、70-130、70-140、70-150、70-200、70-250、70-300、70-350、70-400、70-450、70-500、70-600、70-700、70-800、70-900、70-1000、80-90、80-100、80-110、80-120、80-130、80-140、80-150、80-200、80-250、80-300、80-350、80-400、80-450、80-500、80-600、80-700、80-800、80-900、80-1000、90-100、90-110、90-120、90-130、90-140、90-150、90-200、90-250、90-300、90-350、90-400、90-450、90-500、90-600、90-700、90-800、90-900、90-1000、100-110、100-120、100-130、100-140、100-150、100-200、100-250、100-300、100-350、100-400、100-450、100-500、100-600、100-700、100-800、100-900、100-1000、110-120、110-130、110-140、110-150、110-200、110-250、110-300、110-350、110-400、110-450、110-500、110-600、110-700、110-800、110-900、110-1000、120-130、120-140、120-150、120-200、120-250、120-300、120-350、120-400、120-450、120-500、120-600、120-700、120-800、120-900、120-1000、130-140、130-150、130-200、130-250、130-300、130-350、130-400、130-450、130-500、130-600、130-700、130-800、130-900、130-1000、140-150、140-200、140-250、140-300、140-350、140-400、140-450、140-500、140-600、140-700、140-800、140-900、140-1000、150-200、150-250、150-300、150-350、150-400、150-450、150-500、150-600、150-700、150-800、150-900、150-1000、200-250、200-300、200-350、200-400、200-450、200-500、200-600、200-700、200-800、200-900、200-1000、250-300、250-350、250-400、250-450、250-500、250-600、250-700、250-800、250-900、250-1000、300-350、300-400、300-450、300-500、300-600、300-700、300-800、300-900、300-1000、350-400、350-450、350-500、350-600、350-700、350-800、350-900、350-1000、400-450、400-500、400-600、400-700、400-800、400-900、400-1000、500-600、500-700、500-800、500-900、500-1000、600-700、600-800、600-900、600-1000、700-800、700-900、700-1000、800-900、800-1000或900-1000个碱基。

在一些情况下，结构特征是结构化的基序。如本文所公开的，结构化的基序包括在dsRNA底物中的两个或更多个结构特征。结构化的基序可以包括结构特征的任何组合，如上述权利要求中所述，以生成用于在精确位置处进行ADAR编辑的理想底物。这些结构基序可以被人工工程改造以使ADAR编辑最大化，并且/或者这些结构基序可以被建模以概括已知的ADAR底物。

在一些情况下，结构特征包括多核苷酸的至少部分环化。在一些情况下，本文提供的多核苷酸可以是环化的或呈环状构型。在一些方面中，至少部分环状的多核苷酸缺少5'羟基或3'羟基。

在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸或前体工程改造的多核苷酸可以不包括编码被配置为用于RNA干扰(RNAi)的序列的序列。在一些实施例中，工程改造的多核苷酸可以不包括被配置为用于RNAi的序列。在一些实施例中，工程改造的多核苷酸可以包括被配置为用于RNAi的序列。在一些情况下，工程改造的多核苷酸可以不包括编码短干扰RNA(siRNA)、微小RNA(miRNA)、短发夹RNA(shRNA)或Dicer底物的序列。在一些情况下，工程改造的多核苷酸可以包括编码短干扰RNA(siRNA)、微小RNA(miRNA)、短发夹RNA(shRNA)或Dicer底物的序列。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸可以从前体工程改造的多核苷酸产生。在一些情况下，前体工程改造的多核苷酸可以是前体工程改造的线性多核苷酸。在一些情况下，前体工程改造的多核苷酸可以是线性的。例如，前体工程改造的多核苷酸可以是从质粒转录的线性RNA。在另一个实例中，前体工程改造的多核苷酸可以被构建为具有允许在细胞中环化的结构域(如核酶结构域和连接结构域)的线性多核苷酸。具有连接结构域和核酶结构域的线性多核苷酸可以被转染到细胞中，在所述细胞中它可以经由内源性细胞酶环化。在一些情况下，前体工程改造的多核苷酸可以是环状的。在一些情况下，前体工程改造的多核苷酸可以包括DNA、RNA或两者。在一些情况下，前体工程改造的多核苷酸可以包括前体工程改造的引导RNA。在一些情况下，前体工程改造的引导RNA可以用于产生工程改造的引导RNA。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸，或本文所述的前体工程改造的多核苷酸可以包括间隔子结构域。在一些情况下，如本文所述的工程改造的多核苷酸或前体工程改造的多核苷酸可以不包括间隔子结构域。在一些情况下，相对于缺少间隔子结构域的相应工程改造的多核苷酸的结合的吉布斯自由能(ΔG)，间隔子结构域降低了工程改造的多核苷酸与靶RNA结合的ΔG，如通过例如开尔文(Kelvin)探针力显微镜(KPFM)确定的。在一些实施例中，当靶向序列至少部分地结合至靶RNA时，间隔子结构域可以与靶向序列分开至少1个核苷酸，并且如果间隔子结构域结合至靶RNA，则间隔子结构域的结合可能不会在靶RNA的结合至间隔子结构域的部分处产生靶RNA的编辑。在一些情况下，当间隔子结构域可能邻近靶向序列的5'端或3'端时，间隔子结构域可能不与靶RNA互补。

在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸或前体工程改造的多核苷酸的长度可以超过约：10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2500或5000个核苷酸。在一些实施例中，工程改造的多核苷酸(例如，工程改造的引导多核苷酸)或前体工程改造的多核苷酸的长度可以小于约：20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2500或5000个核苷酸。在一些情况下，工程改造的多核苷酸(例如，工程改造的引导多核苷酸)或前体工程改造的多核苷酸的长度可以包括约20个核苷酸至约5000个核苷酸、20个核苷酸至约50个核苷酸、40个核苷酸至约80个核苷酸、70个核苷酸至约140个核苷酸、80个核苷酸至约160个核苷酸、90个核苷酸至约200个核苷酸、100个核苷酸至约250个核苷酸、150个核苷酸至约350个核苷酸、200个核苷酸至约500个核苷酸、450个核苷酸至约800个核苷酸、750个核苷酸至约1250个核苷酸、1000个核苷酸至约2000个核苷酸、或约2000个核苷酸至约5000个核苷酸。

在一些实施例中，间隔子结构域可以与靶向序列相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个核苷酸。

在一些实施例中，工程改造的多核苷酸可以不包括能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些情况下，工程改造的多核苷酸可以包括比在人类细胞中天然存在的mRNA更不易水解降解的二级结构。

间隔子结构域可以被配置为促进工程改造的多核苷酸采用促进至少部分结合至靶RNA的构象。在一些情况下，间隔子结构域可以变更多核苷酸的靶向序列的几何结构，使得多核苷酸的靶向序列可以基本上是线性的。在一些实施例中，间隔子结构域可以促进工程改造的多核苷酸的合成。在一些情况下，间隔子结构域可以促进前体工程改造的多核苷酸的暴露于溶剂的端的连接。在一些实施例中，间隔子结构域可以使前体工程改造的多核苷酸的两个连接端比缺少间隔子结构域的那些连接端更近。在一些实施例中，工程改造的多核苷酸中的连接可以是共价的或非共价的。在一些情况下，可以通过连接反应来形成连接。在一些实施例中，可以通过同源重组反应来形成连接。

相对于缺少间隔子结构域的相应多核苷酸的结合特异性，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的包括间隔子结构域的工程改造的多核苷酸在多种其他RNA中可以具有对靶RNA的结合特异性的增加。在一些实施例中，可以通过在与包括间隔子结构域的工程改造的多核苷酸或缺少间隔子结构域的相应多核苷酸接触后，对靶RNA和多种其他RNA进行测序来确定对靶RNA的结合特异性的增加。在一些情况下，间隔子结构域可以被配置为促进工程改造的多核苷酸与靶RNA的结合的较低熵(ΔS)。在一些实施例中，间隔子结构域可以被配置为相对于缺少间隔子结构域的相应多核苷酸的编辑效率，至少维持工程改造的多核苷酸对靶RNA的编辑效率。在一些情况下，可以通过在与具有间隔子结构域的工程改造的多核苷酸或缺少间隔子结构域的相应多核苷酸接触后对靶RNA进行测序来确定编辑效率。在一些实施例中，至少维持可以包括增加。在一些情况下，可以通过在与具有间隔子结构域的工程改造的多核苷酸或缺少间隔子结构域的相应多核苷酸接触后对靶RNA进行质谱分析来确定编辑效率。

工程改造的引导RNA、工程改造的多核苷酸或编码具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸的前体工程改造的线性多核苷酸可以例如经由RNA编辑实体促进靶RNA的编辑。在一些情况下，工程改造的多核苷酸可能不会促进靶RNA的编辑。在一些情况下，相对于可以包括5'还原羟基、3'还原羟基或两者的其他可比多核苷酸，工程改造的多核苷酸对靶RNA的编辑效率可以增加至少约90％。在一些实施例中，编辑效率可以通过以下来确定：(i)将靶RNA转染到原代细胞系中，(ii)将工程改造的多核苷酸和可以包括5'还原羟基、3'还原羟基或两者的其他可比多核苷酸转染到原代细胞系中，和(iii)对靶RNA进行测序。在一些实施例中，编辑效率可以通过以下来确定：(i)将靶RNA转染到原代细胞系中，(ii)将工程改造的多核苷酸和可以包括5'还原羟基、3'还原羟基或两者的其他可比多核苷酸转染到原代细胞系中，和(iii)对靶RNA进行质谱分析。在一些实施例中，RNA编辑实体对靶RNA的核苷酸的碱基的编辑可以在体外测定中确定，所述体外测定包括：(i)将靶RNA直接或间接引入(例如转染)到原代细胞系中，(ii)将工程改造的多核苷酸直接或间接引入(例如转染)到原代细胞系中，和(iii)对靶RNA进行测序。在一些情况下，将靶RNA转染到原代细胞系中可以包括将编码靶RNA的质粒转染到原代细胞系中。在一些情况下，将工程改造的多核苷酸转染到原代细胞系中可以包括将前体工程改造的多核苷酸或编码前体工程改造的多核苷酸的多核苷酸(例如质粒)转染到原代细胞系中。在一些情况下，测序可以包括在靶RNA已经通过逆转录酶被转化为cDNA后对靶RNA进行桑格测序。在一些情况下，原代细胞系可以包括神经元、感光细胞、视网膜色素上皮细胞、神经胶质细胞、成肌细胞、肌管细胞、肝细胞、肺上皮细胞或成纤维细胞。

在一些情况下，间隔子结构域可以具有长度为约1个核苷酸至约1,000个核苷酸、2个核苷酸至约20个核苷酸、10个核苷酸至约100个核苷酸、50个核苷酸至约500个核苷酸或约400个核苷酸至约1000个核苷酸的序列长度。在一些实施例中，间隔子结构域的约80％的核苷酸可以与靶RNA不互补。在一些情况下，间隔子结构域可以具有约5个核苷酸的序列长度。在一些情况下，间隔子结构域可以具有约10个核苷酸的序列长度。在一些情况下，间隔子结构域可以具有约15个核苷酸的序列长度。在一些情况下，间隔子结构域可以具有约20个核苷酸的序列长度。在一些实施例中，间隔子结构域可以包括ATATA(SEQ ID NO:50)、ATAAT(SEQ ID NO:51)或其任何组合的多核苷酸序列。在一些情况下，间隔子结构域可以包括AUAAU(SEQ ID NO:52)、AUAUA(SEQ ID NO:53)或UAAUA(SEQ ID NO:54)的序列。在一些实施例中，间隔子结构域可以是至少单个核苷酸，如A、T、G、C或U。

间隔子结构域可以位于靶向序列的近侧、连接结构域的近侧、核酶结构域的近侧、RNA编辑募集结构域的近侧，或另一个间隔子结构域的近侧，其中近侧可以意指分开至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个核苷酸。

工程改造的多核苷酸或前体工程改造的多核苷酸可以包括单个间隔子结构域。在一些实施例中，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括多个间隔子结构域，例如2、3、4、5、6、7或8个间隔子结构域。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括一个靶向序列。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括多于一个的靶向序列。在一些实施例中，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括两个靶向序列。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括靶向相同靶RNA的两个靶向序列。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括靶向不同靶RNA的两个靶向序列。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括两个靶向序列，这两个靶向序列包括相同的多核苷酸序列同一性。在一些情况下，工程改造的多核苷酸或前体工程改造的多核苷酸可以包括两个靶向序列，这两个靶向序列包括不同的多核苷酸序列同一性。

与缺少间隔子结构域的基本上可比RNA或可比多核苷酸相比，具有间隔子结构域的工程改造的引导RNA、工程改造的多核苷酸或前体工程改造的多核苷酸的体外半衰期可以长至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、5倍、10倍、20倍或更多。与缺少间隔子结构域的基本上可比RNA或可比多核苷酸相比，具有间隔子结构域的工程改造的引导RNA、工程改造的多核苷酸或前体工程改造的多核苷酸的体内半衰期可以长至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、5倍、10倍、20倍或更多。与施用于有此需要的受试者的包括缺少间隔子结构域的基本上可比RNA或可比多核苷酸的组合物相比，施用于有此需要的受试者的包括具有间隔子结构域的工程改造的引导RNA、工程改造的多核苷酸或前体工程改造的多核苷酸的组合物的剂量可以少至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、5倍、10倍或20倍。与作为两次治疗或更多次治疗给予的包括缺少间隔子结构域的基本上可比RNA或可比多核苷酸的组合物相比，施用于有此需要的受试者的包括具有间隔子结构域的工程改造的引导RNA、工程改造的多核苷酸或前体工程改造的多核苷酸的组合物可以作为单次治疗给予。

在一些实施例中，工程改造的多核苷酸可以包括至少一个化学修饰。在一些实施例中，工程改造的多核苷酸可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200个或更多个化学修饰。在一些实施例中，工程改造的多核苷酸包括不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200个化学修饰。在一些实施例中，工程改造的多核苷酸可以在工程改造的多核苷酸的5'端处包括至少1、2、3、4、5、6、7、8、9、10、50、100个或更多个化学修饰的核苷酸。在一些实施例中，工程改造的多核苷酸可以在工程改造的多核苷酸的3'端处包括至少1、2、3、4、5、6、7、8、9、10、50、100个或更多个化学修饰的核苷酸。在一些实施例中，工程改造的多核苷酸可以在工程改造的多核苷酸的5'端和3'端处包括至少1、2、3、4、5、6、7、8、9、10、50、100个或更多个化学修饰的核苷酸。在一些实施例中，工程改造的多核苷酸可以在工程改造的多核苷酸的靶向序列中包括至少一种化学修饰。在一些实施例中，工程改造的多核苷酸可以在邻近靶向序列的核苷酸碱基中包括至少一种化学修饰。在一些实施例中，至少一种化学修饰可以被引入到分子内二级结构中。

在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对工程改造的多核苷酸的磷酸二酯主链键中的一个或两个非连接磷酸氧原子的至少一种化学修饰。在一些实施例中，工程改造的多核苷酸的至少一种化学修饰可以包括对工程改造的多核苷酸的磷酸二酯主链键中的一个或多个连接磷酸氧原子的化学修饰。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对工程改造的多核苷酸的核苷酸的糖的至少一种化学修饰。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对工程改造的多核苷酸的核苷酸的糖的至少一种化学修饰，所述工程改造的多核苷酸包括至少一个锁定的核酸(LNA)。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对工程改造的多核苷酸的核苷酸的糖的至少一种化学修饰，所述工程改造的多核苷酸包括至少一个未锁定的核酸(UNA)。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对糖的至少一种化学修饰，所述化学修饰包括对糖的组分的修饰，其中所述糖是核糖糖。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括对包括2'-O-甲基的工程改造的多核苷酸的核苷酸的核糖糖的组分的至少一种化学修饰。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括至少一种化学修饰，所述至少一种化学修饰包括用去磷酸接头替换工程改造的多核苷酸的磷酸部分。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括工程改造的多核苷酸的磷酸主链的至少一种化学修饰。在一些实施例中，工程改造的多核苷酸可以包括硫代磷酸酯基团。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括至少一种化学修饰，所述至少一种化学修饰包括对工程改造的多核苷酸的核苷酸的碱基的修饰。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括至少一种包括核苷酸的非天然碱基的化学修饰。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括至少一种化学修饰，所述至少一种化学修饰包括吗啉代基团、环丁基、吡咯烷基团或肽核酸(PNA)核苷替代物。在一些实施例中，工程改造的多核苷酸的化学修饰可以包括至少一种化学修饰，所述至少一种化学修饰包括至少一种立体纯核酸。在一些实施例中，所述至少一种化学修饰可以位于工程改造的多核苷酸的5'端附近。在一些实施例中，所述至少一种化学修饰可以位于工程改造的多核苷酸的3'端附近。在一些实施例中，所述至少一种化学修饰可以位于工程改造的多核苷酸的5'端和3'端两者附近。

在一些实施例中，工程改造的多核苷酸可以包括主链，该主链包括多个共价连接在一起的糖和磷酸部分。在一些情况下，工程改造的多核苷酸的主链可以包括在DNA中脱氧核糖或RNA中核糖的5'碳上的磷酸基团中的第一羟基与DNA中脱氧核糖或RNA中核糖的3'碳上的第二羟基之间的磷酸二酯键连接。

在一些实施例中，工程改造的多核苷酸的主链可以缺少能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些实施例中，工程改造的多核苷酸的主链可以缺少能够暴露于核酸酶的5'还原羟基、3'还原羟基或两者。在一些实施例中，工程改造的多核苷酸的主链可以缺少能够暴露于水解酶的5'还原羟基、3'还原羟基或两者。在一些情况下，工程改造的多核苷酸的主链可以被表示为环状2维格式的多核苷酸序列，其中一个核苷酸在另一个核苷酸之后。在一些情况下，工程改造的多核苷酸的主链可以被表示为环2维格式的多核苷酸序列，其中一个核苷酸在另一个核苷酸之后。在一些情况下，5'羟基、3'羟基或两者通过磷-氧键连接。在一些情况下，5'羟基、3'羟基或两者被修饰成具有含磷部分的磷酸酯。

在一些实施例中，本文所述的工程改造的多核苷酸可以包括至少一种化学修饰。化学修饰可以是取代、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任何组合。在一些情况下，修饰是化学修饰。合适的化学修饰包括以下中的任一者：5'腺苷酸、5'鸟苷-三磷酸帽、5'N7-甲基鸟苷-三磷酸帽、5'三磷酸帽、3'磷酸、3'硫代磷酸、5'磷酸、5'硫代磷酸、顺式-Syn胸苷二聚体、三聚体、C12间隔子、C3间隔子、C6间隔子、dSpacer、PC间隔子、rSpacer、间隔子18、间隔子9,3'-3'修饰、5'-5'修饰、无碱基、吖啶、偶氮苯、生物素、生物素BB、生物素TEG、胆固醇TEG、脱硫生物素TEG、DNP TEG、DNP-X、DOTA、dT-生物素、双生物素、PC生物素、补骨脂素C2、补骨脂素C6、TINA、3'DABCYL、黑洞猝灭剂1、黑洞猝灭剂2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、羧基接头、硫醇接头、2'脱氧核糖核苷类似物嘌呤、2'脱氧核糖核苷类似物嘧啶、核糖核苷类似物、2'-O-甲基核糖核苷类似物、糖修饰的类似物、摆动/通用碱基、荧光染料标记、2'氟RNA、2'O-甲基RNA、甲基膦酸酯、磷酸二酯DNA、磷酸二酯RNA、硫代磷酸酯DNA、硫代磷酸酯RNA、UNA、假尿苷-5'-三磷酸、5-甲基胞苷-5'-三磷酸、2-O-甲基3硫代磷酸酯或其任何组合。

可以在工程改造的多核苷酸的任何位置处进行化学修饰。在一些情况下，修饰位于5'端或3'端。在一些情况下，多核苷酸在选自以下的碱基处包括修饰：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150。可以对工程改造的多核苷酸进行多于一种的修饰。在一些情况下，修改可以是永久的。在其他情况下，修改可以是暂时的。在一些情况下，对工程改造的多核苷酸进行多种修饰。工程改造的多核苷酸修饰可以改动核苷酸的理化性质，如其构象、极性、疏水性、化学反应性、碱基配对相互作用或其任何组合。

化学修饰也可以是硫代磷酸酯的代替物。在一些情况下，天然磷酸二酯键可以容易被细胞核酸酶快速降解；并且使用硫代磷酸酯(PS)键代替物的核苷酸间连接的修饰对于通过细胞降解的水解可以更稳定。修饰可以增加多核酸的稳定性。修饰也可以增强生物活性。在一些情况下，硫代磷酸酯增强的RNA多核酸可以抑制RNase A、RNase T1、小牛血清核酸酶或其任何组合。这些性质可以允许PS-RNA多核酸用于体内或体外暴露于核酸酶的可能性高的应用中。例如，硫代磷酸酯(PS)键可以被引入到多核酸的5'端或3'端的最后3-5个核苷酸之间，这可以抑制核酸外切酶的降解。在一些情况下，可以在整个多核酸中加入硫代磷酸酯键，以减少核酸内切酶的攻击。

本文所述的工程改造的多核苷酸可以具有任何频率的碱基。例如，多核苷酸可以具有1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、1-5％、3-8％、5-12％、10-15％、8-20％、15-25％、20-30％、25-35％或高达约30-40％的腺嘌呤百分比。多核苷酸可以具有1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、1-5％、3-8％、5-12％、10-15％、8-20％、15-25％、20-30％、25-35％或高达约30-40％的胞嘧啶百分比。多核苷酸可以具有1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、1-5％、3-8％、5-12％、10-15％、8-20％、15-25％、20-30％、25-35％或高达约30-40％的胸腺嘧啶百分比。多核苷酸可具有1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、1-5％、3-8％、5-12％、10-15％、8-20％、15-25％、20-30％、25-35％或高达约30-40％的鸟嘌呤百分比。多核苷酸可以具有1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、1-5％、3-8％、5-12％、10-15％、8-20％、15-25％、20-30％、25-35％或高达约30-40％的尿嘧啶百分比。

在一些情况下，工程改造的多核苷酸在修饰后可以进行质量控制。在一些情况下，质量控制可以包含PAGE、HPLC、MS或其任何组合。在一些情况下，可以确定多核苷酸的质量。质量可以通过LC-MS测定来确定。质量可以是30,000amu、50,000amu、70,000amu、90,000amu、100,000amu、120,000amu、150,000amu、175,000amu、200,000amu、250,000amu、300,000amu、350,000amu、400,000amu至约500,000amu。质量可以是多核苷酸的钠盐的质量。

在一些情况下，可以确定多核苷酸的内毒素水平。内毒素的临床上/治疗上可接受的水平可以低于3EU/mL。内毒素的临床上/治疗上可接受的水平可以低于10EU/mL。内毒素的临床上/治疗上可接受的水平可以低于8EU/mL。内毒素的临床上/治疗上可接受的水平可以低于5EU/mL。内毒素的临床上/治疗上可接受的水平可以低于4EU/mL。内毒素的临床上/治疗上可接受的水平可以低于3EU/mL。内毒素的临床上/治疗上可接受的水平可以低于2EU/mL。内毒素的临床上/治疗上可接受的水平可以低于1EU/mL。内毒素的临床上/治疗上可接受的水平可以低于0.5EU/mL。

在一些实施例中，本文所述的工程改造的多核苷酸可以包括至少一种化学修饰。在一些实施例中，工程改造的多核苷酸包括至少一、二、三、四、五、六、七、八、九、十、11、12、13、14、15、16、17、18、19、20、30、50、100种或更多种化学修饰。

在一些实施例中，化学修饰可以发生在3'OΗ基团、5'OΗ基团、主链、糖组分或核苷酸碱基处。化学修饰可以包含非天然存在的链间或链内交联的接头分子。在一个方面中，化学修饰的核酸包括3'OΗ或5'OΗ基团、主链、糖组分或核苷酸碱基中的一者或多者的修饰，或者非天然存在的接头分子的添加。在一些实施例中，化学修饰的主链包括除磷酸二酯主链以外的主链。在一些实施例中，修饰的糖包括除脱氧核糖(在修饰的DNA中)之外或除核糖(修饰的RNA)之外的糖。在一些实施例中，修饰的碱基包括除腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶之外的碱基。在一些实施例中，工程改造的多核苷酸包括至少一个化学修饰的碱基。在一些情况下，工程改造的多核苷酸包括2、3、4、5、6、7、8、9、10、15、20个或更多个修饰的碱基。在一些情况下，对碱基部分的化学修饰包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶以及嘌呤或嘧啶碱基的天然和合成修饰。

在一些实施例中，工程改造的多核苷酸的化学修饰可以包括以下中的任一者或任何组合的修饰：磷酸二酯主链键中一个或两个非连接磷酸氧的修饰；磷酸二酯主链键中的一个或多个连接磷酸氧的修饰；核糖糖的组分的修饰；用“去磷酸”接头替换磷酸部分；天然存在的核碱基的修饰或替换；核糖-磷酸主链的修饰；多核苷酸的5'端的修饰；多核苷酸的3'端的修饰；脱氧核糖磷酸主链的修饰；磷酸基团的取代；磷酸核糖主链的修饰；对核苷酸的糖的修饰；对核苷酸的碱基的修饰；或核苷酸的立体纯。对工程改造的多核苷酸的示例性化学修饰可以见于表1。

表1：示例性化学修饰

在一些实施例中，化学修饰包括磷酸二酯主链键中的一个或两个非连接磷酸氧的修饰，或磷酸二酯主链键中的一个或多个连接磷酸氧的修饰。如本文所用的，“烷基”意指直链或支链的饱和烃基团。示例性烷基包含甲基(Me)、乙基(Et)、丙基(例如正丙基或异丙基)、丁基(例如正丁基、异丁基或叔丁基)或戊基(例如正戊基、异戊基或新戊基)。烷基可以含有1至约20、2至约20、1至约12、1至约8、1至约6、1至约4或1至约3个碳原子。如本文所用的，“芳基”是指单环或多环(例如，具有2、3或4个稠环)芳香烃，如例如苯基、萘基、蒽基、菲基、茚满基或茚基。在一些实施例中，芳基具有6至约20个碳原子。如本文所用的，“烯基”是指含有至少一个双键的脂肪族基团。如本文所用的，“炔基”是指含有2-12个碳原子并且特征在于具有一个或多个三键的直链或支链烃链。炔基的实例可以包含乙炔基、炔丙基或3-己炔基。“芳基烷基”或“芳烷基”是指其中烷基氢原子被芳基替换的烷基部分。芳烷基包含其中多于一个的氢原子已经被芳基替换的基团。“芳基烷基”或“芳烷基”的实例包含苄基、2-苯乙基、3-苯丙基、9-芴基、二苯甲基和三苯甲基。“环烷基”是指具有3至12个碳的环状、双环、三环或多环非芳香族烃基团。环烷基部分的实例包含但不限于环丙基、环戊基和环己基。“杂环基”是指杂环体系的单价自由基。代表性的杂环基包含但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二氧杂环基、二氧戊环基、二氮杂环基、氧杂氮杂环基、硫氮杂卓基和吗啉基。“杂芳基”是指杂芳香族环体系的单价自由基。杂芳基部分的实例可以包含咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、噻吩基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、中氮茚基、嘌呤基、萘啶基、喹啉基和蝶啶基。

在一些实施例中，化学修饰的核苷酸的磷酸基团可以通过用不同的取代基替换一个或多个氧来修饰。在一些实施例中，化学修饰的核苷酸可以包含用如本文所述的修饰的磷酸盐替换未修饰的磷酸部分。在一些实施例中，磷酸主链的修饰可以包含导致不带电荷的接头或带有不对称电荷分布的带电荷的接头的改变。修饰的磷酸基团的实例可以包含硫代磷酸酯、膦酰基硫代乙酸酯、硒代磷酸酯、硼代磷酸酯、硼代磷酸酯、膦酸氢酯、磷酰胺、烷基或芳基膦酸酯或磷酸三酯。在一些实施例中，磷酸主链部分中的非桥接的磷酸盐氧原子中的一个可以被下列基团中的任一者替换：硫(S)、硒(Se)、BR₃(其中R可以是例如氢、烷基或芳基)、C(例如烷基、芳基等)、H、NR₂(其中R可以是例如氢、烷基或芳基)或(其中R可以是例如烷基或芳基)。未经修饰的磷酸基团中的磷原子可以是非手性的。然而，用上述原子或原子基团中的一者替代非桥氧中的一个可以使磷原子手性。以这种方式修饰的磷酸基团中的磷原子是立体中心。立构磷原子可以具有“R”构型(本文为Rp)或“S”构型(本文为Sp)。在一些情况下，工程改造的多核苷酸可以包括立体纯的核苷酸，其包括硫代磷酸酯的S构象或硫代磷酸酯的R构象。在一些实施例中，手性磷酸酯产物以50％、60％、70％、80％、90％或更多的非对映异构体过量存在。在一些实施例中，手性磷酸酯产物以95％的非对映异构体过量存在。在一些实施例中，手性磷酸酯产物以96％的非对映异构体过量存在。在一些实施例中，手性磷酸酯产物以97％的非对映异构体过量存在。在一些实施例中，手性磷酸酯产物以98％的非对映异构体过量存在。在一些实施例中，手性磷酸酯产物以99％的非对映异构体过量存在。在一些实施例中，二硫代磷酸酯的两个非桥接的氧都可以被硫替换。二硫代磷酸酯中的磷中心可以是非手性的，这排除了寡核糖核苷酸非对映异构体的形成。在一些实施例中，对一个或两个非桥接的氧的修饰也可以包含用独立地选自S、Se、B、C、H、N和OR(R可以是例如烷基或芳基)的基团替换非桥接的氧。在一些实施例中，磷酸盐接头还可以通过用氮(桥接的磷酰胺酯)、硫(桥接的硫代磷酸酯)和碳(桥接的亚甲基膦酸酯)替换桥接氧(例如，连接磷酸酯和核苷的氧)来修饰。替换可以发生在连接氧的任一个或两个处。

工程改造的多核苷酸可以包含前mRNA靶向序列。前mRNA靶向序列可能与靶标前mRNA不完全互补。靶向序列可以与前mRNA种类至少部分互补。靶向序列可以与前mRNA内的外显子附近的剪接信号至少部分互补。靶向序列可以包括至少一个、至少两个、至少三个、至少四个、至少五个、至少十个、至少二十个与前mRNA不互补的核苷酸。

靶向序列可以与前mRNA内的外显子上游的分支点至少部分互补。靶向序列可以与前mRNA内的外显子下游的供体剪接位点至少部分互补。

在一些实施例中，二级结构包括发夹。在一些实施例中，发夹与小鼠或人U7 snRNA的茎环发夹包括至少约80％、至少约85％、至少约90％、至少约92％、至少约95％、至少约97％或至少约99％的序列同一性。在一些实施例中，发夹是小鼠或人U7 snRNA的茎环发夹。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:1包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:1。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:2包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:2。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:3包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:3。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:5包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:5。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:6包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:6。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:7包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:7。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:8包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:8。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:9包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:9。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:10包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:10。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:11包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:11。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:12包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:12。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:13包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:13。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:14包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:14。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:15包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:15。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:16包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:16。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:17包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:17。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:18包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:18。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:19包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:19。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:20包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:20。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:21包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:21。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:22包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:22。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:23包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:23。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:24包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:24。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:25包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:25。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:26包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:26。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:27包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:27。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:29包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:29。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:30包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:30。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:31包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:31。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:32包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:32。

在一些实施例中，工程改造的多核苷酸序列与SEQ ID NO:33包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些实施例中，工程改造的多核苷酸是SEQ ID NO:33。

通过靶向包括靶向序列的工程改造的多核苷酸来促进前mRNA的RNA编辑。靶向序列可以能够与前mRNA的至少部分互补的靶标区域结合。

靶标区域可以包括剪接信号。靶标区域可以靠近外显子、内含子或启动子。

在一些实施例中，工程改造的多核苷酸靶向与疾病或病状有关的基因的区域。该区域是外显子。在一些实施例中，该区域是内含子。如本文所述的具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸可以被施用于受试者以治疗疾病或病状。这类疾病或病状可以包括神经退行性疾病、肌肉病症、代谢病症、眼部病症(例如眼部疾病)、癌症、肝病(α-1抗胰蛋白酶(AAT)缺乏症)或其任何组合。疾病或病状可以包括囊性纤维化、白化病、α-1-抗胰蛋白酶缺乏症、阿尔茨海默病、肌萎缩性侧索硬化症、哮喘、β-地中海贫血、Cadasil综合征、夏科-马里-图思病、慢性阻塞性肺病(COPD)、痴呆、远端脊髓性肌萎缩症(DSMA)、杜兴/贝克肌营养不良症、营养不良性大疱性表皮松解症、大疱性表皮松解症、法布里病、因子V莱顿相关病症、家族性腺瘤、息肉病、半乳糖血症、戈谢病、葡萄糖-6-磷酸脱氢酶、血友病、遗传性血色病、亨特(Hunter)综合征、亨廷顿氏病、赫尔勒综合征、炎症性肠病(IBD)、遗传性多凝集综合征、莱伯氏(Leber)先天性黑蒙、莱施-奈恩(Lesch-Nyhan)综合征、林奇(Lynch)综合征、马方(Marfan)综合征、粘多糖沉积症、肌营养不良症、I型和II型强直性肌营养不良症、神经纤维瘤病、A型、B型和C型尼曼-匹克病、NY-eso1相关的癌症、帕金森病、波伊茨-耶格(Peutz-Jeghers)综合征、苯丙酮尿症、蓬佩(Pompe)病、原发性睫状病、凝血酶原突变相关的病症(如凝血酶原G20210A突变)、肺动脉高血压、色素性视网膜炎、桑德霍夫(Sandhoff)病、严重联合免疫缺陷综合征(SCID)、镰状细胞贫血、脊髓性肌萎缩症、斯塔加特病、泰-萨克斯病、厄舍(Usher)综合征、X-连锁免疫缺陷、各种形式的癌症(例如，BRCA1和2连锁的乳腺癌和卵巢癌)。在一些情况下，疾病或病状如神经退行性疾病(例如阿尔茨海默病、帕金森病)的治疗可以包括产生淀粉样前体蛋白(APP)、tau、α-突触核蛋白或其任何组合的编辑、敲低或两者。在一些情况下，APP、tau和α-突触核蛋白可以包括致病性变体。在一些情况下，APP可以包括致病性变体，如A673V突变或A673T突变。在一些情况下，疾病或病状如神经退行性疾病(帕金森病)的治疗可以包括产生LRRK2的致病性变体的编辑、敲低或两者。在一些情况下，LRRK的致病性变体可以包括G2019S突变。疾病或病状可以包括肌营养不良症、鸟氨酸氨甲酰转移酶缺乏症、色素性视网膜炎、乳腺癌、卵巢癌、阿尔茨海默病、疼痛、斯塔加特黄斑营养不良(Stargardt maculardystrophy)、夏科-马里-图思病、雷特综合征或其任何组合。在一些情况下，工程改造的多核苷酸可以纠正患有雷特综合征的患者的错义突变(例如，使终止密码子突变以编码Trp)。在一些情况下，工程改造的多核苷酸可以纠正患有帕金森病的患者的错义突变或诱导敲低。在一些情况下，工程改造的多核苷酸可以在患有阿尔茨海默病的患者中诱导突变，这可以减少APP中的切割位点处的蛋白质切割。在一些情况下，工程改造的多核苷酸可以在患有肌营养不良症的患者中产生外显子跳跃。在一些情况下，工程改造的多核苷酸可以纠正患有泰-萨克斯病的患者的HexA中的突变。在一些情况下，工程改造的多核苷酸可以纠正患有泰-萨克斯病的患者的HexA中的突变。在一些情况下，工程改造的多核苷酸可以纠正患有AAT缺乏症的患者中的突变(例如，编辑SERPINA1)。在一些情况下，组合物的施用可以足以：(a)相对于施用前基因的表达，降低基因的表达；(b)编辑受试者(如有此需要的受试者)中的至少一个点突变；(c)编辑受试者中的至少一个终止密码子以产生终止密码子的通读；(d)在受试者中产生外显子跳跃，或(e)其任何组合。疾病或病状可以包括肌营养不良症。肌营养不良症可以包含肌强直性肌营养不良症、杜兴氏肌营养不良症、贝克肌营养不良症、四肢带肌营养不良症、面肩胛肱型肌营养不良症、先天性肌营养不良症、眼咽型肌营养不良症、远端型肌营养不良症、埃默里-德赖弗斯(Emery-Dreifuss)型肌营养不良症或其任何组合。疾病或病状可以包括疼痛，如慢性疼痛。疼痛可以包含神经性疼痛、伤害性疼痛或其组合。伤害性疼痛可以包含内脏疼痛、躯体疼痛或其组合。靶向序列可以包括与SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17中的任何一者具有至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％或100％序列同一性的序列。

在一些实施例中，工程改造的多核苷酸与SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQID NO:17的靶序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％或100％互补。

RNA编辑

本公开提供了具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的工程改造的多核苷酸的组合物，所述组合物促进感兴趣的靶RNA中碱基的RNA编辑。例如，本公开的工程改造的多核苷酸促进RNA编辑，所述RNA编辑包括碱基的化学修饰，如将腺苷(A)脱氨基为肌苷(I)。肌苷被读作鸟苷(G)。因此，本文公开的RNA编辑的工程改造的多核苷酸及其使用方法可以用于纠正可能与疾病或疾病途径有关的基因中的G至A点突变。因此，本文公开的工程改造的多核苷酸可以在治疗方法中用作治疗剂。

在一些实施例中，dsRNA底物中凸起的存在可以定位ADAR以选择性编辑靶RNA中的靶标A，并减少靶RNA中非靶标A的脱靶标编辑。在一些实施例中，dsRNA底物中凸起的存在可以募集额外的ADAR。本文公开的dsRNA底物中的凸起可以募集其他蛋白质，如其他RNA编辑实体。在一些实施例中，位于编辑位点的5'处的凸起可以促进待编辑的靶标A的碱基翻转。凸起也可以有助于赋予序列特异性。凸起可以通过将它限制在产生靶标A的选择性编辑的方向上来帮助指导ADAR编辑。

RNA编辑实体可以是以下中的任一者：ADAR蛋白(如ADAR1、ADAR2、ADAR3或其任何组合)、任何APOBEC蛋白(如APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4或其任何组合)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、大范围核酸酶或其组合。在一些情况下，募集的ADAR或APOBEC蛋白可以是哺乳动物的。在一些情况下，募集的ADAR或APOBEC蛋白可以是人类的。在一些情况下，募集的ADAR或APOBEC蛋白可以是重组的(如外源递送的ADAR或APOBEC)、修饰的(如外源递送的ADAR或APOBEC)、内源的(如内源ADAR或APOBEC)或其任何组合。在一些情况下，RNA编辑实体可以是融合蛋白，如本文提供的任何RNA编辑实体。在一些情况下，RNA编辑实体可以是RNA编辑实体的功能部分，如本文提供的任何RNA编辑蛋白。任何上述RNA编辑实体可以适用于本文提供的组合物和/或方法。

作用于RNA的腺苷脱氨酶(ADAR)及其生物活性片段可以是在双链RNA(dsRNA)底物中催化腺苷化学转化为肌苷的酶。因为肌苷的性质类似鸟苷的性质(例如，肌苷将与胞嘧啶形成两个氢键)，肌苷可以被翻译细胞机制识别为鸟苷。因此，腺苷到肌苷(A到I)RNA编辑有效地变更了RNA靶标的一级序列。ADAR酶共享共同的结构域结构，包括可变数量的氨基末端dsRNA结合结构域(dsRBD)和羧基末端催化脱氨酶结构域。人类ADAR具有两个或三个dsRBD。

已经鉴定了三种人类ADAR基因(ADAR 1–3)，其中ADAR1(官方符号ADAR)和ADAR2(ADARB1)蛋白质具有充分表征的腺苷脱氨活性。ADAR具有典型的模块化结构域组织，在其N末端区域中包含dsRNA结合结构域的至少两个拷贝(dsRBD；具有三个dsRBD的ADAR1；具有两个拷贝的ADAR2和ADAR3)、随后是C末端脱氨酶结构域。

ADAR1和ADAR2是涉及体内mRNA编辑的ADAR的两个示例性种类。ADAR1的非限制性的示例性序列可以在以下参考数字：HGNC:225、Entrez Gene:103、Ensembl:ENSG00000160710、OMIM:146920、UniProtKB:P55265和GeneCards:GC01M154554以及其生物学等同物下找到。ADAR2的非限制性的示例性序列可以在以下参考数字：HGNC:226、EntrezGene:104、Ensembl:ENSG00000197381、OMIM:601218、UniProtKB:P78563和GeneCards:GC21P045073以及其生物学等同物下找到。本文还提供了ADAR的生物活性片段，并且当提及ADAR时所述生物活性片段可以被包含。

本公开预期使用干扰素α作为增加内源性ADAR1表达的手段。分离的或重组的干扰素α的商业来源包含但不限于西格玛-奥尔德里奇(Sigma-Aldrich)、R&D Systems、Abcam和赛默飞世尔科技(Thermo Fisher Scientific)。可替代地，干扰素α可以使用已知的载体和给定的蛋白质序列产生，例如Q6QNB6(人IFNA)。

APOBEC及其生物活性片段可以指任何蛋白质，如属于涉及mRNA编辑(催化C到U转化)的进化上保守的胞苷脱氨酶家族的示例性RNA编辑实体及其等同物。在一些方面中，术语APOBEC是指APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4或其各自的等同物中的任一者。本文提供了包括一个或多个APOBEC结构域的融合蛋白的非限制性的示例性序列，其与ADAR结构域融合或与可替代的结构域融合，以使它们适用于RNA编辑系统。为此，APOBEC可以被视为ADAR的等同物——催化编辑，尽管是通过不同的转换。因此，不受理论的束缚，本文预期的用于基于ADAR的编辑系统的实施例可以适用于基于APOBEC的RNA编辑系统。

在一些情况下，RNA编辑实体不形成包括茎环的第二结构。在一些情况下，RNA编辑实体的至少一部分形成包括茎环的第二结构。在一些情况下，RNA编辑实体的部分形成不包括茎环的第二结构。在一些情况下，RNA编辑实体的部分形成包括线性部分的二级结构。在一些情况下，RNA编辑实体的部分形成包括十字形或其部分的二级结构。

在一些实施例中，RNA的编辑影响基因表达。在一些实施例中，RNA变得不稳定。在一些实施例中，基因未被表达。在一些实施例中，可替代的剪接受到影响。在一些实施例中，该基因的不同的同工型被表达。

ADAR蛋白向靶序列的募集可以涉及接触由工程改造的多核苷酸和靶序列组成的RNA双链体，其中靶向序列与靶向序列不是100％互补，因此是至少一个。在一些实施例中，当与前mRNA结合时，靶向序列包括至少一个与前mRNA不互补的核苷酸，产生凸起。在一些实施例中，至少1个、至少2个、至少3个、至少4个、至少5个核苷酸与前mRNA不互补，产生凸起。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸可以被配置为当在脱氨酶的存在下与前mRNA缔合时，促进前mRNA中的编辑，从而形成脱氨酶募集结构域。在一些情况下，如本文所述的具有snRNA序列和snRNA发夹的工程改造的多核苷酸可以包括非互补核苷酸，其可以改善脱氨酶与靶mRNA的亲和力。脱氨酶可以促进前mRNA的多核苷酸的碱基的化学修饰。在一些情况下，由至少一个与前mRNA不互补的核苷酸产生的至少一个错配至少部分地与脱氨酶相关联。

在一些情况下，脱氨酶募集结构域可以包括至少一个茎环。茎环可以是右旋的或左旋的。茎环可以与GluR2结构域包括至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。

靶向前mRNA的区域内的与前mRNA非互补的一个核苷酸位于距靶向序列的任一端的45、46、47、48、49、50、51、52、53、54或55个碱基处。

编辑可以被配置为在前mRNA内发生。编辑可以被配置为在内含子或外显子中发生。编辑被配置为在剪接信号中发生。编辑可以被配置为在未翻译的区域中发生。编辑可以被配置为促进外显子的跳跃。

可以测量通过工程改造的多核苷酸的RNA编辑的活性，以便确定所需的活性的成功。在一些实施例中，所需的活性是外显子跳跃。

具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹或其变体)的工程改造的多核苷酸的编辑效率可以通过体外测定(如液滴数字PCR脱落测定)来测量，以检测相对于参考样本的编辑(多个序列插入、缺失或突变)。在此测定中，使用至少两种探针以便评估样本中的突变热点。探针与突变热点至少部分互补。可以设计荧光团缀合的脱落探针，使得它退火到未编辑的靶序列上，但不退火到与碱基编辑的靶序列上。与不同荧光团缀合的第二参考探针可以被设计成紧接着脱落探针靶序列退火，并且检测靶转录物，而不考虑编辑。两个探针侧翼的引物将在液滴数字PCR反应中扩增靶转录物。然后，与对于参考探针呈阳性的总转录物相比，编辑百分比可以被报告为对于脱落探针呈阴性但对于参考探针呈阳性的转录物。

外显子跳跃

在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的工程改造的多核苷酸促进导致外显子跳跃的RNA编辑(例如，通过ADAR)。与不含有snRNA元件和/或错配的多核苷酸构建体相比，本公开的工程改造的多核苷酸可以改善外显子跳跃。外显子可能含有改变其功能的突变。当在体外测量时，与不含有snRNA元件和/或错配的多核苷酸构建体相比，工程改造的多核苷酸可以具有改善的外显子跳跃。外显子跳跃的效率可以通过定量PCR、液滴数字PCR或RNA测序来测量。

工程改造的多核苷酸的外显子跳跃效率可以通过体外测定(如定量PCR测定或液滴数字PCR测定)来测量，以检测外显子跳跃的转录物的比例相对于未跳跃的转录物的比例。在此测定中，使用至少两种荧光团缀合的探针，一种探针特异性地退火到外显子跳跃的转录物上，并且另一种探针特异性地退火到未跳跃的转录物上。进行ddPCR扩增。

本公开的工程改造的多核苷酸可以将外显子跳跃的效率增加至少1％、至少5％、至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或高达100％，如通过ddPCR测量的。本公开的工程改造的多核苷酸可以将外显子跳跃的效率增加约1％至约50％。本公开的工程改造的多核苷酸可以将外显子跳跃的效率增加至少约1％。本公开的工程改造的多核苷酸可以将外显子跳跃的效率增加至多约50％。本公开的工程改造的多核苷酸可以将外显子跳跃的效率增加约1％至约5％、约1％至约10％、约1％至约20％、约1％至约30％、约1％至约40％、约1％至约50％、约5％至约10％、约5％至约20％、约5％至约30％、约5％至约40％、约5％至约50％、约10％至约20％、约10％至约30％、约10％至约40％、约10％至约50％、约20％至约30％、约20％至约40％、约20％至约50％、约30％至约40％、约30％至约50％或约40％至约50％。

治疗应用

本文提供的具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的工程改造的多核苷酸可以用作治疗剂。在一个方面中，本文是一种治疗或预防病状的方法，包括施用促进RNA的编辑的治疗剂。在一些实施例中，RNA的编辑可以促进突变的纠正。突变可以是错义突变或无义突变。在一些实施例中，RNA编辑可以涉及将突变引入到感兴趣的靶RNA中。在一些实施例中，本公开的引导序列促进对靶RNA进行多次RNA编辑。

APP.在一些实施例中，本公开提供了具有能够促进淀粉样前体蛋白(APP)的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。例如，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA可以促进编辑APP中的切割位点，使得β/γ分泌酶表现出对APP的减少的切割或不再切割APP，因此可以产生降低水平的Aβ40/42或不产生Aβ。在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以靶向APP中用于RNA编辑的以下位点中的任一者或任何组合：K670E、K670R、K670G、M671V、A673V、A673T、D672G、E682G、H684R、K687R、K687E或K687G、I712X或T714X。具有靶向APP中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类，并且可能处于发展或已经发展阿尔茨海默病的风险中。受试者可以是人类，并且可能处于发展或已经发展其中APP影响疾病病理学的神经疾病的风险中。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗神经疾病(例如，阿尔茨海默病)的方法中。

α-突触核蛋白(SNCA)

α-突触核蛋白基因由5个外显子组成，并且编码140个氨基酸的蛋白质，其中预测的分子量为约14.5kDa。编码的产物是一种具有未知功能的固有无序蛋白质。通常，α-突触核蛋白是单体。在某些应激条件下或其他未知原因下，α-突触核蛋白自聚集成寡聚体。路易(Lewy)相关病理学(LRP)主要由尸检证实的阿尔茨海默病患者大脑中超过50％的α-突触核蛋白组成。虽然α-突触核蛋白如何影响阿尔茨海默病的发展的分子机制尚不清楚，但实验证据表明，α-突触核蛋白与Tau-p相互作用，并且可能导致Tau-p的细胞内聚集。此外，α-突触核蛋白可以调节GSK3β的活性，所述GSK3β可以介导Tau过度磷酸化。α-突触核蛋白也可以自组装成致病聚集体(路易体)。Tau和α-突触核蛋白都可以释放到细胞外空间中并扩散到其他细胞。血管异常损害营养物质的供应和代谢副产物的去除，引起微梗塞，并促进神经胶质细胞的活化。因此，显著减少Tau形成、α-突触核蛋白形成或其组合的多重策略在有效治疗神经退行性疾病中可能是重要的。

α-突触核蛋白的结构域结构包括N末端A2脂质结合α-螺旋结构域、非淀粉样β组分(NAC)结构域和C末端酸性结构域。脂质结合结构域由五个KXKEGV(SEQ ID NO:76)不完全重复序列组成。NAC结构域由具有VGGAVVTGV(SEQ ID NO:59)共有序列的GAV基序和三个GXXX亚基序组成，其中X是Gly、Ala、Val、Ile、Leu、Phe、Tyr、Trp、Thr、Ser或Met中的任一者。C末端酸性结构域含有具有DPDNEA(SEQ ID NO:60)共有序列的铜结合基序。在分子水平上，α-突触核蛋白被认为在神经元传递和DNA修复中起作用。

在一些情况下，可以利用本文提供的组合物靶向α-突触核蛋白的区域。在一些情况下，α-突触核蛋白mRNA的区域可以用本文公开的工程改造的多核苷酸靶向以进行敲低。在一些情况下，可以靶向α-突触核蛋白mRNA的外显子或内含子的区域。在一些实施例中，可以靶向α-突触核蛋白mRNA的非编码序列的区域，如5'UTR和3'UTR。在其他情况下，可以靶向α-突触核蛋白mRNA的编码序列的区域。合适的区域包含但不限于N末端A2脂质结合α-螺旋结构域、非淀粉样β组分(NAC)结构域或C末端酸性结构域。

在一些方面中，α-突触核蛋白mRNA序列被靶向。在一些情况下，可以利用本文提供的组合物和方法靶向序列的3,177个残基中的任一个。在一些情况下，靶标残基可以位于残基1-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-1100、1101-1200、1201-1300、1301-1400、1401-1500、1501-1600、1601-1700、1701-1800、1801-1900、1901-2000、2001-2100、2101-2200、2201-2300、2301-2400、2401-2500、2501-2600、2601-2700、2701-2800、2801-2900、2901-3000、3001-3100和/或3101-3177中。

在一些实施例中，本公开提供了具有能够促进SNCA的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以敲低SNCA的表达，例如，通过促进SNCA基因的3'UTR处的编辑。具有靶向SNCA中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以用于靶向SNCA基因的工程改造的多核苷酸的示例性序列包含SEQ IDNO:7和SEQ ID NO:8，而可以靶向SNCA基因的示例性靶向序列包含SEQ ID NO:15、SEQ IDNO:16和SEQ ID NO:17。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类，并且可能处于发展或已经发展阿尔茨海默病或帕金森病的风险中。受试者可以是人类，并且可能处于发展或已经发展其中SNCA的过表达影响疾病病理学的神经疾病的风险中。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗神经疾病(例如，阿尔茨海默病)的方法中。

SERPINA1.在一些实施例中，本公开提供了具有能够促进丝氨酸蛋白酶抑制剂家族A成员1(SERPINA1)的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。例如，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA可以促进SERPINA1基因的核苷酸位置9989处的G至A突变的纠正。在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以靶向例如SERPINA1的E342。具有靶向SERPINA1中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以靶向SERPINA1基因的示例性靶向序列包括SEQ ID NO:26或SEQ ID NO:27。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类并且可能处于发展或已经发展α-1抗胰蛋白酶缺乏症的风险中。这种α-1抗胰蛋白酶缺乏症可能至少部分地是由SERPINA1的突变引起的，对于该突变，本文所述的工程改造的多核苷酸序列可以促进编辑，从而纠正SERPINA1中的突变并降低受试者中α-1抗胰蛋白酶缺乏症的发生率。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗α-1抗胰蛋白酶缺乏症的方法中。

ABCA4.在一些实施例中，本公开提供了具有能够促进ATP结合盒亚家族A成员4(ABCA4)的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。例如，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA可以促进ABCA4基因的核苷酸位置5714、5882或6320处的G至A突变的纠正。具有靶向ABCA4中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ IDNO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以靶向ABCA4基因的示例性靶向序列包含SEQ IDNO:20、SEQ ID NO:21和SEQ ID NO:22。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类并且可能处于发展或已经发展斯塔加特黄斑变性(或斯塔加特病)的风险中。这种斯塔加特黄斑变性可能至少部分地是由ABCA4的突变引起的，对于该突变，本文所述的工程改造的多核苷酸序列可以促进编辑，从而纠正ABCA4中的突变并降低受试者中斯塔加特黄斑变性的发生率。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗斯塔加特黄斑变性的方法中。

LRRK2.富含亮氨酸的重复激酶2(LRRK2)与帕金森病的家族性和散发性病例以及如克罗恩病的免疫相关病症相关联。它的别名包含LRRK2、AURA17、DARDARIN、PARK8、RIPK7、ROCO2或富含亮氨酸的重复激酶2。LRRK2基因由51个外显子组成，并且编码2527个氨基酸的蛋白质，其中预测的分子量为约286kDa。编码的产物是具有激酶和GTP酶活性的多结构域蛋白。LRRK2可以在各种组织和器官中发现，包含但不限于肾上腺、阑尾、骨髓、脑、结肠、十二指肠、子宫内膜、食道、脂肪、胆囊、心脏、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、胎盘、前列腺、唾液腺、皮肤、小肠、脾、胃、睾丸、甲状腺和膀胱。LRRK2可以无处不在地表达，但通常在脑、肾和肺组织中更丰富。在细胞内，LRRK2已经在星形胶质细胞、内皮细胞、小胶质细胞、神经元和外周免疫细胞中发现。

在LRRK2中已经鉴定了超过100个突变；其中六个突变——G2019S、R1441C/G/H、Y1699C和I2020T——已经通过分离分析被显示导致帕金森病。G2019S和R1441C是遗传性病例中最常见的致病突变。在散发性病例中，这些突变已经表现出年龄依赖性外显率：当年龄从50岁增加至70岁时，携带发展疾病的G2019S突变的个体的百分比从17％跃升至85％。在一些情况下，携带突变的个体永远不会发展疾病。

在其催化核心，LRRK2含有复合蛋白的Ras(Roc)、ROC的C末端(COR)和激酶结构域。多个蛋白质-蛋白质相互作用结构域位于此核心两侧：在N-末端中发现犰狳重复序列(ARM)区域、锚蛋白重复序列(ANK)区域和富含亮氨酸的重复序列(LRR)结构域，通过C末端WD40结构域连接。G2019S突变位于激酶结构域内。它已经显示增加激酶活性；对于R1441C/G/H和Y1699C，这些突变可以降低Roc结构域的GTP酶活性。全基因组关联研究已经发现，LRRK2中的常见变异增加了发展散发性帕金森病的风险。虽然这些变异中的一些是影响蛋白质的结合或催化活性的非保守突变，但其他变异调节其表达。这些结果表明，特定的等位基因或单倍型可以调节LRRK2的表达。

促炎信号上调各种免疫细胞类型中LRRK2的表达，表明LRRK2是免疫应答中的关键调节因子。研究已经发现，全身和中枢神经系统(CNS)炎症都涉及帕金森病的症状。此外，与帕金森病相关联的LRRK2突变调节其对炎症刺激的应答的表达水平。LRRK2中的许多突变与免疫相关病症(如炎性肠病，如克罗恩病)相关联。例如，G2019S和N2081D两者都增加LRRK2的激酶活性，并且在特定人群的克罗恩病患者中过表达。由于其在这些病症中的关键作用，LRRK2是帕金森病和克罗恩病的重要治疗靶点。特别是，许多突变(如包含G2019S的点突变)在这些疾病的发展中起作用，使LRRK2对如RNA编辑的治疗策略具有吸引力。

在一些实施例中，本公开提供了具有能够促进LRRK2的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以靶向LRRK2中的以下突变：E10L、A30P、S52F、E46K、A53T、L119P、A211V、C228S、E334K、N363S、V366M、A419V、R506Q、N544E、N551K、A716V、M712V、I723V、P755L、R793M、I810V、K871E、Q923H、Q930R、R1067Q、S1096C、Q1111H、I1122V、A1151T、L1165P、I1192V、H1216R、S1228T、P1262A、R1325Q、I1371V、R1398H、T1410M、D1420N、R1441G、R1441H、A1442P、P1446L、V1450I、K1468E、R1483Q、R1514Q、P1542S、V1613A、R1628P、M1646T、S1647T、Y1699C、R1728H、R1728L、L1795F、M1869V、M1869T、L1870F、E1874X、R1941H、Y2006H、I2012T、G2019S、I2020T、T2031S、N2081D、T2141M、R2143H、Y2189C、T2356I、G2385R、V2390M、E2395K、M2397T、L2466H或Q2490NfsX3。具有靶向LRRK2中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以靶向LRRK2基因的示例性靶向序列包含SEQ ID NO:18和SEQ ID NO:19。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类并且可能处于发展或已经发展与LRRK2中的突变相关联的疾病或病状(例如，中枢神经系统(CNS)或胃肠(GI)道的疾病)的风险中。例如，此类疾病或病状可以包含克罗恩病或帕金森病。此类CNS或GI道疾病(例如，克罗恩病或帕金森病)可以至少部分地由LRRK2的突变引起，对于该突变，本文所述的工程改造的多核苷酸序列可以促进编辑，从而纠正LRRK2中的突变并降低受试者的CNS或GI道疾病的发病率。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗疾病如克罗恩病或帕金森病的方法中。

DMD.在一些实施例中，本公开提供了具有能够促进杜兴氏肌营养不良症(DMD)基因的RNA编辑的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的引导RNA的组合物及其使用方法。在一些实施例中，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以靶向DMD基因的外显子，如至少部分地编码肌营养不良蛋白的DMD基因前mRNA中的外显子51、45、53、44、46、52、50、43、6、7、8、55、2、11、17、19、21、57、59、62、63、65、66、69、74和/或75。具有靶向DMD基因中的位点的snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的所述引导RNA可以由本公开的工程改造的多核苷酸构建体编码。所述引导RNA中的snRNA序列和snRNA发夹的序列可以与SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者具有至少80％的序列同一性。所述引导RNA中的snRNA序列和snRNA发夹的序列可以具有SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45或SEQ ID NO:46中的任一者的序列。可以靶向DMD基因的示例性靶向序列包含SEQ ID NO:13和SEQ ID NO:14。可以并入本文公开的任何启动子(例如，U1、U6或U7)以驱动所述引导RNA的表达。所述工程改造的多核苷酸可以经由如本文公开的病毒载体(例如，经由AAV编码并通过其递送)递送，并且可以经由本文公开的任何施用途径被施用于有需要的受试者。受试者可以是人类并且可能处于发展或已经发展与DMD基因中的突变相关联的疾病或病状如DMD的风险中。DMD可以至少部分由DMD基因的突变引起，对于该突变，本文所述的工程改造的多核苷酸序列可以促进编辑，从而纠正DMD基因中的突变并降低受试者中DMD的发生率。因此，具有snRNA序列和snRNA发夹(例如，SmOPT序列和U7发夹)的本公开的引导RNA可以用于治疗疾病如DMD的方法中。

在一些实施例中，引导RNA可以靶向具有突变的外显子，其中突变是插入、缺失、错义或无义突变。突变可以存在于编码本文所述的任何靶标的基因中。编辑的RNA包括编辑的剪接信号，与没有改进的多核苷酸构建体的治疗相比，导致增加的外显子跳跃。在另一方面中，本文是一种治疗或预防病状的方法，其包括施用治疗剂，所述治疗剂进一步包括snRNA发夹(例如，本公开的U7发夹)、snRNA序列(例如，本公开的SmOPT序列)或两者，其增强如本文所述的至少部分编码靶标的RNA的编辑，其中所编辑的RNA包括编辑的剪接信号，与用不含发夹的可比反义外显子跳跃构建体的治疗相比，导致增加的外显子跳跃。

方法可以包含使用工程改造的多核苷酸来编辑靶序列，所述靶序列编码与疾病有关的多肽的至少一部分。该疾病包含但不限于杜兴氏肌营养不良症(DMD)、雷特综合征、夏科-马里-图思病、帕金森病或其任何组合。在一些情况下，所述疾病或病状与编码ABCA4、AAT、SERPINA1、SERPINA1 E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、GBA、PINK1、RAB7A、CFTR、ALAS1、ATP7B、ATP7B G1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点的DNA分子或RNA分子、任何这些的片段或其任何组合中的突变相关联。在一些实施例中，由编码ABCA4、AAT、SERPINA1、SERPINA1 E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、GBA、PINK1、RAB7A、CFTR、ALAS1、ATP7B、ATP7B G1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点、任何这些的片段或其任何组合的突变的DNA分子或RNA分子编码的蛋白质至少部分有助于疾病的发病机理或进展。在一些实例中，DNA或RNA分子中的突变与其他方面相同的参考DNA或RNA分子有关。

多重

在一些情况下，本公开涵盖多重疗法，包含多个靶RNA的靶向的多重编辑、靶RNA内多个靶位点的靶向的编辑、RNA的靶向的编辑和敲低，或其任何组合。因此，具有如本文所述的snRNA序列和snRNA发夹(例如，SmOPT和U7)的工程改造的多核苷酸可以被多重以进行多重疗法。同时靶向多于一个的靶RNA可能是重要的，并且Tau敲低和APP中的切割位点(例如，β-切割位点)的编辑的组合可以协同工作。在一些情况下，使用mRNA碱基编辑来敲低(如相对于仅仅编辑切割位点)APP的表达可以是减少Aβ产生的另一种方法。由于组合物可以用于基因表达敲低，因此它们也可以包含减少表达的起始位点编辑、空间阻碍(因为引导序列可以阻断核糖体活性)、靶向的mRNA的增加的降解或其任何组合的组合。因此，本文公开的组合物和方法可以以ADAR依赖性和ADAR非依赖性方式抑制表达。

多个有效载荷的递送

在一些实施例中，本公开的载体可以是可以含有工程改造的引导多核苷酸的载体的多个拷贝，所述工程改造的引导多核苷酸具有如本文所述的靶向多个靶RNA的snRNA序列和snRNA发夹(例如，SmOPT和U7)。例如，载体可以含有具有如本文所述的snRNA序列和snRNA发夹(例如，SmOPT和U7)的工程改造的多核苷酸的至少2、3、4、5、6、7、8、9或10个拷贝。在一些情况下，载体可以含有具有如本文所述的snRNA序列和snRNA发夹(例如，SmOPT和U7)的全部相同的工程改造的多核苷酸的拷贝。在一些情况下，载体可以含有具有如本文所述的snRNA序列和snRNA发夹(例如，SmOPT和U7)的不同的工程改造的多核苷酸的拷贝。可以构建此类载体，使得多个拷贝可操作地多顺反子偶联到如本文所述的单个启动子上。在一些情况下，多个拷贝可以独立地连接到如本文所述的启动子上。

载体

本公开还提供了包括或编码本文公开的工程改造的多核苷酸的载体。

本文提供的组合物可以通过任何合适的手段递送。在一些情况下，合适的手段包括载体。可以使用任何载体系统，包含但不限于：质粒载体、小环状载体、线性DNA载体、狗骨载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体；疱疹病毒载体和腺相关病毒载体、脂质体、纳米颗粒、外泌体、细胞外囊泡、纳米网、其修饰形式、其良好生产实践形式、其嵌合体及其任何组合。在一些情况下，载体可以用于引入本文提供的多核苷酸。在一些情况下，多核苷酸包括与本文提供的RNA的区域杂交的靶向序列。在一些实施例中，纳米颗粒载体可以包括基于聚合物的纳米颗粒、基于氨基脂质的纳米颗粒、金属纳米颗粒(如基于金的纳米颗粒)、任何这些的一部分或其任何组合。

本文提供的载体可以用于递送本文提供的多核苷酸组合物。在一些情况下，使用单个载体递送至少约2、3、4种或高达5种不同的多核苷酸。在一些情况下，多种载体被递送。在一些情况下，多种载体递送可以是并行的或顺序的。在一些情况下，在单个载体中递送至少两种工程改造的多核苷酸。在其他情况下，在单独的载体上递送至少两种工程改造的多核苷酸。工程改造的多核苷酸也可以作为裸多核苷酸被递送。可以采用载体和/或非载体方法的任何组合。

载体可以用于递送核酸。载体可以包括DNA，如双链DNA或单链DNA。载体可以包括RNA。在一些情况下，RNA可以包括碱基修饰。载体可以包括重组载体。载体可以是由天然存在的载体修饰的载体。载体可以包括非天然存在的载体的至少一部分。可以使用任何载体。病毒载体可以包括腺病毒载体、腺相关病毒载体(AAV)、慢病毒载体、逆转录病毒载体、任何这些的一部分或其任何组合。在一些情况下，载体可以包含AAV载体。载体可以被修饰以包括修饰的VP1蛋白(如被修饰以包含VP1蛋白的AAV载体)。在一个方面中，AAV载体是重组AAV(rAAV)载体。rAAV可以由与如在野生型AAV(wtAAV)中发现的基本相似的衣壳序列和结构组成。然而，rAAV包裹基本上没有AAV蛋白编码序列并且具有在其位置中设计的治疗性基因表达盒(如受试多核苷酸)的基因组。在一些情况下，病毒来源的序列可以是ITR，它可能需要在载体生产期间引导基因组复制和包装。合适的AAV载体可以选自任何AAV血清型或血清型的组合。例如，AAV载体可以是以下中的任一者：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV 10、AAV11、AAV12或其任何组合。在一些情况下，载体是基于其自然取向来选择的。在一些情况下，基于其穿过血脑屏障的能力来选择载体血清型。AAV9和AAV10已经被显示穿过血脑屏障来转导神经元和神经胶质细胞。在一个方面中，AAV载体是AAV2、AAV5、AAV6、AAV8或AAV9。在一些情况下，AAV载体是至少两种血清型的嵌合体。在一个方面中，AAV载体是血清型AAV2、AAV5和AAV9。在一些情况下，嵌合AAV载体包括来自AAV2的rep和ITR序列和来自AAV5的帽序列。在一些情况下，rep、帽和ITR序列可以与本文提供的所有不同AAV血清型混合和匹配。

在一些实施例中，载体是病毒载体。在一些实施例中，病毒载体是AAV载体，并且其中AAV载体具有选自包括以下的组的血清型：AAV2、AAV5、AAV6、AAV8、AAV9、其一部分、其融合产物及其任何组合。在一些实施例中，AAV载体包括来自AAV2的rep和ITR序列和来自AAV5的帽序列。在一些实施例中，AAV载体包括自我互补ITR的ITR序列。在一些实施例中，编码工程改造的多核苷酸的AAV载体是自我互补的。

在一些情况下，合适的AAV载体可以被进一步修饰以涵盖如在衣壳或rep蛋白中的修饰。修饰还可以包含缺失、插入、突变及其组合。在一些情况下，对载体进行修饰以降低免疫原性，从而允许重复给药。在一些情况下，当进行重复给药以降低和/或消除免疫原性时，所使用的载体的血清型发生变更。

逆转录病毒载体可用作介导逆转录病毒介导的基因转移到真核细胞中的药剂。逆转录病毒载体通常被构建成使得编码病毒的结构基因的大部分序列被缺失并被感兴趣的基因替换。最常见的是，使用本领域中已知的基因工程技术从逆转录病毒主链中去除结构基因(例如gag、pol和env)。这可以包含用合适的限制性核酸内切酶消化，或者在一些情况下，用Bal 31核酸外切酶消化，以产生含有包装信号的合适部分的片段。

这些新基因已经以几种通用的方式被并入到前病毒主链中。最直接的构建是这样的构建，其中逆转录病毒的结构基因被单个基因替换，然后该基因在长末端重复序列(LTR)内的病毒调节序列的控制下被转录。还构建了可以将多于一个基因引入到靶细胞中的逆转录病毒载体。通常，在此类载体中，一个基因处于病毒LTR的调节控制之下，而第二个基因通过剪接的信息表达，或者处于其自身的内部启动子的调节之下。

在特定的实施例中，病毒载体是腺相关病毒(AAV)。AAV是微小的无包膜病毒，其具有25nm的衣壳。没有已知或已经显示与野生型病毒相关联的疾病。AAV具有单链DNA(ssDNA)基因组。AAV已经被显示表现出长期的游离转基因表达，并且AAV已经被证明在脑中(特别是在神经元中)优异的转基因表达。含有少至300个碱基对的AAV的载体可以被包装并且可以整合。外源性DNA的空间被限制为约4.7kb。AAV载体可以用于将DNA引入到细胞中。已经使用AAV载体将多种核酸引入到不同的细胞类型中。存在许多可替代的AAV变体(超过100种已经被克隆)，并且已经基于期望的特征鉴定了AAV变体。例如，AAV9已经被显示有效地穿过血脑屏障。此外，可以对AAV衣壳进行基因工程改造以增加转导效率和选择性，例如生物素化的AAV载体、定向分子进化、自互补的AAV基因组等。修饰的AAV也被描述，包含基于祖先序列的AAV。已经描述的其他修饰的AAV包含嵌合纳米颗粒(ChNP)，其具有表达转基因的AAV核心，该AAV核心被嵌入的反义寡核苷酸的酸不稳定聚合物层包围。本文公开的组合物和方法是一种平台技术，因此本文公开的组合物和方法可以用于所有已知的AAV，包含文献中描述的修饰的AAV，如ChNP。

在另一个实施例中，病毒载体是腺病毒衍生的载体。可以操纵腺病毒的基因组，使得它编码并表达感兴趣的基因产物，但就其在正常裂解性病毒生命周期中复制的能力而言是失活的。来源于腺病毒株Ad 5型dl324或其他腺病毒株(如Ad2、Ad3或Ad7等)的合适腺病毒载体是本领域技术人员已知的。重组腺病毒在某些情况下可能是有利的，因为它们不能感染非分裂细胞，并且可以用于感染多种细胞类型，包含上皮细胞。此外，病毒颗粒相对稳定并且易于纯化和浓缩，并且如上所述，可以被修饰以便影响传染性谱。此外，引入的腺病毒DNA(和其中含有的外来DNA)未被整合到宿主细胞的基因组中，而是保持游离状态，从而避免了由于原位插入突变形成而可能发生的潜在问题，其中引入的DNA变得整合到宿主基因组(例如，逆转录病毒DNA)中。此外，相对于其他基因递送载体，腺病毒基因组对外来DNA的携带能力较大(高达8千碱基)。也可以使用甲病毒。甲病毒是包膜的单链RNA病毒，其具有广泛的宿主范围，并且当用于病毒基因疗法方案时，甲病毒可以提供高水平的瞬时基因表达。示例性甲病毒包含塞姆利基森林病毒(SFV)、辛德比斯病毒(SIN)和委内瑞拉马脑炎(VEE)病毒，所有这些病毒都已经被基因工程改造以提供有效的复制缺陷型表达载体和有复制能力的表达载体。甲病毒表现出显著的向神经性，因此可用于CNS相关疾病。

载体可以用于递送本文提供的工程改造的多核苷酸和靶向治疗靶点的额外多核苷酸，如第二多核苷酸。在一些情况下，载体包括或编码与第二多核苷酸(例如，额外的治疗靶点)缔合的额外的RNA多核苷酸。此类载体可以用于递送多重治疗剂，该多重治疗剂同时靶向多个治疗靶点，如在阿尔茨海默病和其他神经退行性疾病的情况下，淀粉样前体蛋白和与疾病有关的额外靶标，如Tau蛋白(例如，由MAPT基因编码的微管相关蛋白Tau(MAPT))，或α-突触核蛋白。可替代地或另外，额外的靶标可以是编码淀粉样前体蛋白的多核苷酸上的另外的编辑位点(例如，在相同的多核苷酸上)。编码工程改造的多核苷酸的载体多核苷酸和编码额外的RNA多核苷酸的第二载体多核苷酸可以是连续的或不连续的。当第一载体多核苷酸和第二载体多核苷酸彼此邻接时，它们可以可操作地连接到相同的启动子序列。

非病毒载体方法

在一些情况下，载体可以不是病毒载体。非病毒方法可以包括裸递送包括多核苷酸等的组合物。在一些情况下，本文提供的修饰可以被并入到多核苷酸中，以在作为裸多核苷酸递送时增加稳定性并对抗降解。在其他情况下，非病毒方法可以利用纳米颗粒、脂质体等。

药物组合物

组合物可以包含本文描述的任何编辑实体。药物组合物可以包括第一活性成分。第一活性成分可以包括如本文所述的病毒载体、如本文所述的非天然存在的RNA或如本文所述的核酸。药物组合物可以被配制成单位剂量形式。药物组合物可以包括药学上可接受的赋形剂、稀释剂或载剂。药物组合物可以包括第二、第三或第四活性成分，如以促进与疾病或病状有关的基因的增强的外显子跳跃。

本文所述的组合物可以包含赋形剂。赋形剂可包括低温防腐剂，如DMSO、甘油(glycerol)、聚乙烯吡咯烷酮(PVP)或其任何组合。赋形剂可以包括低温防腐剂，如蔗糖、海藻糖、淀粉、任何这些的盐、任何这些的衍生物或其任何组合。赋形剂可以包括pH剂(以使组合物的组分的氧化或降解最小化)、稳定剂(以防止组合物的组分的改性或降解)、缓冲剂(以增强温度稳定性)、增溶剂(以增加蛋白质溶解度)或其任何组合。赋形剂可以包括表面活性剂、糖、氨基酸、抗氧化剂、盐、非离子表面活性剂、增溶剂、甘油三酯、醇或其任何组合。赋形剂可以包括碳酸钠、乙酸盐、柠檬酸盐、磷酸盐、聚乙二醇(PEG)、人血清白蛋白(HSA)、山梨醇、蔗糖、海藻糖、聚山梨醇酯80、磷酸钠、蔗糖、磷酸二钠、甘露醇、聚山梨醇酯20、组氨酸、柠檬酸盐、白蛋白、氢氧化钠、甘氨酸、柠檬酸钠、海藻糖、精氨酸、乙酸钠、乙酸盐、HCl、乙二胺四乙酸二钠、卵磷脂、甘油(glycerine)、黄原胶、大豆异黄酮、聚山梨醇酯80、乙醇、水、替普瑞酮或其任何组合。

本文公开的组合物和方法可以包含经由mRNA碱基编辑方法进行靶向。这些载体可以编码靶向SNCA或Rab7A(以促进编辑的剪接信号的外显子跳跃)的工程改造的多核苷酸和一种或多种额外的工程改造的多核苷酸或本文公开的靶向与神经变性疾病或病状相关联的一种或多种额外的蛋白质的其他治疗剂。

组合物可以包含mRNA碱基编辑以编辑前mRNA，ii)编辑剪接信号，诱导外显子跳跃，或其任何组合。编辑可能导致外显子跳跃(如可以含有起始位点的外显子)。

本公开的组合物可以包含用于编辑靶RNA多核苷酸序列中的核苷酸的工程改造的多核苷酸。组合物可以采用ADAR依赖或ADAR独立的方式进行编辑。组合物可以包括经由RNA编辑实体促进靶RNA的编辑的募集结构域。

本文提供的组合物和方法可以利用药物组合物。全文所述的组合物可以被配制成药物并且用于治疗被诊断患有疾病的有此需要的人或哺乳动物。在一些情况下，药物组合物可以预防性使用。

本文提供的组合物可以用于本文提供的方法中。本文提供的任何组合物可以用于本文提供的方法中。在一些情况下，方法包括至少部分地预防、减轻、改善和/或治疗疾病或病状，或疾病或病状的症状。受试者可以是人类或非人类。受试者可以是哺乳动物(例如，大鼠、小鼠、牛、狗、猪、绵羊、马)。受试者可以是脊椎动物或无脊椎动物。受试者可以是实验动物。受试者可以是患者。受试者可能患有疾病。受试者可以表现出疾病的症状。受试者可以不表现出疾病的症状，但仍然患有疾病。受试者可以在护理人员的医疗护理下(例如，受试者住院并由医生治疗)。

施用途径和剂量

本文所述的组合物可以采用AAV(IV/CNS)载体来递送至受试者。AAV载体递送可以通过单剂量获得长期益处，并且可以为多重靶向提供机会。方法可以包含鉴定可以通过CNS/IV给药促进中枢神经元趋性和生物分布的AAV血清型。

在一些情况下，施用可以是指可以用于能够将化合物或组合物递送至期望的生物作用位点的方法。递送可以包含直接应用于中枢神经系统(CNS)。递送可以包含允许穿过血脑屏障的递送。递送可以包含直接应用于身体的受影响的组织或区域。本文提供的组合物可以通过任何方法施用。施用方法可以通过吸入、耳、颊、结膜、牙、子宫颈内、鼻窦内、气管内、肠内、硬膜外、羊膜外、体外、血液透析、浸润、间质、腹腔内、羊膜内、动脉内、关节内、胆管内、支气管内、囊内、心内、软骨内、尾内、海绵体内、腔内、侧脑室内、脑池内、角膜内、冠内、冠状动脉内、体内海绵体内、真皮内、椎间盘内、导管内、十二指肠内、硬膜内、表皮内、食管内、胃内、牙龈内、海马内、回肠内、病灶内、管腔内、淋巴内、髓内、脑膜内、肌内、眼内、卵巢内、心包内、腹膜内、胸膜内、前列腺内、肺内、窦内、椎管内、滑膜内、腱内、睾丸内、胸腔内、小管内、肿瘤内、鼓室内、子宫内、血管内、静脉内、静脉团注、静脉滴注、膀胱内、玻璃体内、离子电渗疗法、冲洗、喉、鼻、鼻饲、眼、口、口咽、肠胃外、经皮、关节周围、硬膜外、神经周、牙周、直肠、眼球后、蛛网膜下、结膜下、皮下、舌下、粘膜下、局部、经皮、经粘膜、经胎盘、经气管、经鼓膜、输尿管、尿道、阴道、眼眶下、实质内、鞘内、心室内、立体定向或其任何组合。递送可以包含肠胃外施用(包含静脉内、皮下、鞘内、腹膜内、肌内、血管内或输注)、口服施用、吸入施用、十二指肠内施用、直肠施用。递送可以包含对表面(如皮肤)的外表面的局部施用(如洗剂、乳膏、软膏)。在一些情况下，施用是通过实质注射、鞘内注射、心室内注射、脑池内注射、静脉内注射或鼻内施用或其任何组合。在一些情况下，受试者可以在没有监督的情况下施用组合物。在一些情况下，受试者可以在医学专业人员(例如，医师、护士、医师助理、护工、临终关怀工作者等)的监督下施用组合物。医学专业人员可以施用该组合物。在一些情况下，美容专业人员可以施用该组合物。

包含本文公开的任何工程改造的多核苷酸的组合物的施用或应用可以进行持续至少约至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100天连续或非连续天的治疗持续时间。治疗持续时间可以是约1天至约30天、约2天至约30天、约3天至约30天、约4天至约30天、约5天至约30天、约6天至约30天、约7天至约30天、约8天至约30天、约9天至约30天、约10天至约30天、约11天至约30天、约12天至约30天、约13天至约30天、约14天至约30天、约15天至约30天、约16天至约30天、约17天至约30天、约18天至约30天、约19天至约30天、约20天至约30天、约21天至约30天、约22天至约30天、约23天至约30天、约24天至约30天、约25天至约30天、约26天至约30天、约27天至约30天、约28天至约30天或约29天至约30天。

包含本文公开的任何工程改造的多核苷酸外显子跳跃构建体的组合物的施用或应用可以进行持续至少约1周、至少约1个月、至少约1年、至少约2年、至少约3年、至少约4年、至少约5年、至少约6年、至少约7年、至少约8年、至少约9年、至少约10年、至少约15年、至少约20年或更长的治疗持续时间。施用可以在受试者一生中重复进行，如在受试者的一生中每月一次或每年一次。施用可以在受试者生命的大部分时间内重复进行，如每月一次或每年一次，持续至少约1年、5年、10年、15年、20年、25年、30年或更长时间。

在一些情况下，本文提供的任何组合物(包含药物组合物)的施用可以是有效量的，例如以减少疾病或病状的症状和/或减少疾病或病状。有效量可以足以达到期望的效果。在治疗或预防应用的上下文中，有效量将取决于所讨论病状的类型和严重程度以及个体受试者的特征，如总体健康状况、年龄、性别、体重和对药物组合物的耐受性。在免疫原性组合物的上下文中，在一些实施例中，有效量是足以导致针对病原体的保护性应答的量。在其他实施例中，免疫原性组合物的有效量是足以导致针对抗原的抗体产生的量。在一些实施例中，有效量是赋予有需要的受试者被动免疫力所需的量。关于免疫原性组合物，在一些实施例中，除了上述因素之外，有效量将取决于预期用途、特定抗原性化合物的免疫原性程度和受试者免疫系统的健康/应答性。

本文公开的组合物(包含任何工程改造的多核苷酸)的施用或应用可以每天进行至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24次。在一些情况下，本文公开的组合物的施用或应用可以每周进行至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21次。在一些情况下，本文公开的组合物的施用或应用可以每月进行至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90次。

本公开的组合物(包含任何工程改造的多核苷酸)可以作为单剂量或作为分剂量被施用/应用。在一些情况下，本文所述的组合物可以在第一时间点和第二时间点施用。在一些情况下，可以施用组合物，使得第一次施用在另一次施用之前被施用，其中施用时间的差异为1小时、2小时、4小时、8小时、12小时、16小时、20小时、1天、2天、4天、7天、2周、4周、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、1年或更长。

本公开的载体可以以任何合适的剂量施用于受试者。合适的剂量可以是至少约5x10⁷至50×10¹³基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5x10⁷、6x10⁷、7x10⁷、8x10⁷、9x10⁷、10x10⁷、11x10⁷、15x10⁷、20x10⁷、25x10⁷、30x10⁷或50x10⁷基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5x10⁷至6x10⁷、6x10⁷至7x10⁷、7x10⁷至8x10⁷、8x10⁷至9x10⁷、9x10⁷至10x10⁷、10x10⁷至11x10⁷、11x10⁷至15x10⁷、15x10⁷至20x10⁷、20x10⁷至25x10⁷、25x10⁷至30x10⁷、30x10⁷至50x10⁷或50x10⁷至100x10⁷基因组拷贝/mL。在一些情况下，合适的剂量可以是约5x10⁷至10x10⁷、10x10⁷至25x10⁷或25x10⁷至50x10⁷基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5x10⁸、6x10⁸、7x10⁸、8x10⁸、9x10⁸、10x10⁸、11x10⁸、15x10⁸、20x10⁸、25x10⁸、30x10⁸或50x10⁸基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5x10⁸至6x10⁸、6x10⁸至7x10⁸、7x10⁸至8x10⁸、8x10⁸至9x10⁸、9x10⁸至10x10⁸、10x10⁸至11x10⁸、11x10⁸至15x10⁸、15x10⁸至20x10⁸、20x10⁸至25x10⁸、25x10⁸至30x10⁸、30x10⁸至50x10⁸或50x10⁸至100x10⁸基因组拷贝/mL。在一些情况下，合适的剂量可以是约5x10⁸至10x10⁸、10x10⁸至25x10⁸或25x10⁸至50x10⁸基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5×10⁹、6×10⁹、7×10⁹、8×10⁹、9×10⁹、10×10⁹、11×10⁹、15×10⁹、20×10⁹、25×10⁹、30×10⁹或50×10⁹基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5×10⁹至6×10⁹、6×10⁹至7×10⁹、7×10⁹至8×10⁹、8×10⁹至9×10⁹、9×10⁹至10×10⁹、10×10⁹至11×10⁹、11×10⁹至15×10⁹、15×10⁹至20×10⁹、20×10⁹至25×10⁹、25×10⁹至30×10⁹、30×10⁹至50×10⁹或50×10⁹至100×10⁹基因组拷贝/mL。在一些情况下，合适的剂量可以是约5×10⁹至10×10⁹、10×10⁹至25×10⁹或25×10⁹至50×10⁹基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5x10¹⁰、6x10¹⁰、7x10¹⁰、8x10¹⁰、9x10¹⁰、10x10¹⁰、11x10¹⁰、15x10¹⁰、20x10¹⁰、25x10¹⁰、30x10¹⁰或50x10¹⁰基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5x10¹⁰至6x10¹⁰、6x10¹⁰至7x10¹⁰、7x10¹⁰至8x10¹⁰、8x10¹⁰至9x10¹⁰、9x10¹⁰至10x10¹⁰、10x10¹⁰至11x10¹⁰、10x10¹⁰至15x10¹⁰、15x10¹⁰至20x10¹⁰、20x10¹⁰至25x10¹⁰、25x10¹⁰至30x10¹⁰、30x10¹⁰至50x10¹⁰或50x10¹⁰至100x10¹⁰基因组拷贝/mL。在一些情况下，合适的剂量可以是约5x10¹⁰至10x10¹⁰、10x10¹⁰至25x10¹⁰或25x10¹⁰至50x10¹⁰基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5×10¹¹、6×10¹¹、7×10¹¹、8×10¹¹、9×10¹¹、10×10¹¹、11×10¹¹、15×10¹¹、20×10¹¹、25×10¹¹、30×10¹¹或50×10¹¹基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5×10¹¹至6×10¹¹、6×10¹¹至7×10¹¹、7×10¹¹至8×10¹¹、8×10¹¹至9×10¹¹、9×10¹¹至10×10¹¹、10×10¹¹至11×10¹¹、11×10¹¹至15×10¹¹、15×10¹¹至20×10¹¹、20×10¹¹至25×10¹¹、25×10¹¹至30×10¹¹、30×10¹¹至50×10¹¹或50×10¹¹至100×10¹¹基因组拷贝/mL。在一些情况下，合适的剂量可以是约5×10¹¹至10×10¹¹、10×10¹¹至25×10¹¹或25×10¹¹至50×10¹¹基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5×10¹²、6×10¹²、7×10¹²、8×10¹²、9×10¹²、10×10¹²、11×10¹²、15×10¹²、20×10¹²、25×10¹²、30×10¹²或50×10¹²基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5×10¹²至6×10¹²、6×10¹²至7×10¹²、7×10¹²至8×10¹²、8×10¹²至9×10¹²、9×10¹²至10×10¹²、10×10¹²至11×10¹²、11×10¹²至15×10¹²、15×10¹²至20×10¹²、20×10¹²至25×10¹²、25×10¹²至30×10¹²、30×10¹²至50×10¹²或50×10¹²至100×10¹²基因组拷贝/mL。在一些情况下，合适的剂量可以是约5×10¹²至10×10¹²、10×10¹²至25×10¹²或25×10¹²至50×10¹²基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5×10¹³、6×10¹³、7×10¹³、8×10¹³、9×10¹³、10×10¹³、11×10¹³、15×10¹³、20×10¹³、25×10¹³、30×10¹³或50×10¹³基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5×10¹³至6×10¹³、6×10¹³至7×10¹³、7×10¹³至8×10¹³、8×10¹³至9×10¹³、9×10¹³至10×10¹³、10×10¹³至11×10¹³、11×10¹³至15×10¹³、15×10¹³至20×10¹³、20×10¹³至25×10¹³、25×10¹³至30×10¹³、30×10¹³至50×10¹³或50×10¹³至100×10¹³基因组拷贝/mL。在一些情况下，合适的剂量可以是约5×10¹³至10×10¹³、10×10¹³至25×10¹³或25×10¹³至50×10¹³基因组拷贝/mL。在一些情况下，合适的剂量可以是至少约5×10¹³、6×10¹³、7×10¹³、8×10¹³、9×10¹³、10×10¹³、11×10¹³、15×10¹³、20×10¹³、25×10¹³、30×10¹³或50×10¹³基因组拷贝/mL。在一些实施例中，合适的剂量可以是约5×10¹³至6×10¹³、6×10¹³至7×10¹³、7×10¹³至8×10¹³、8×10¹³至9×10¹³、9×10¹³至10×10¹³、10×10¹³至11×10¹³、11×10¹³至15×10¹³、15×10¹³至20×10¹³、20×10¹³至25×10¹³、25×10¹³至30×10¹³、30×10¹³至50×10¹³或50×10¹³至100×10¹³基因组拷贝/mL。在一些情况下，合适的剂量可以是约5×10¹³至10×10¹³、10×10¹³至25×10¹³或25×10¹³至50×10¹³基因组拷贝/mL。

在一些情况下，施用于个体的病毒颗粒的剂量可以是任何至少约1×10⁷至约1×10¹³基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1x10⁷、2x10⁷、3x10⁷、4x10⁷、5x10⁷、6x10⁷、7x10⁷、8x10⁷或9x10⁷基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1x10⁸、2x10⁸、3x10⁸、4x10⁸、5x10⁸、6x10⁸、7x10⁸、8x10⁸或9x10⁸基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1×10⁹、2×10⁹、3×10⁹、4×10⁹、5×10⁹、6×10⁹、7×10⁹、8×10⁹或9×10⁹基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1x10¹⁰、2x10¹⁰、3x10¹⁰、4x10¹⁰、5x10¹⁰、6x10¹⁰、7x10¹⁰、8x10¹⁰或9x10¹⁰基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1×10¹¹、2×10¹¹、3×10¹¹、4×10¹¹、5×10¹¹、6×10¹¹、7×10¹¹、8×10¹¹或9×10¹¹基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1×10¹²、2×10¹²、3×10¹²、4×10¹²、5×10¹²、6×10¹²、7×10¹²、8×10¹²或9×10¹²基因组拷贝/kg体重。在一些实施例中，施用于个体的病毒颗粒的剂量可以是1×10¹³、2×10¹³、3×10¹³、4×10¹³、5×10¹³、6×10¹³、7×10¹³、8×10¹³或9×10¹³基因组拷贝/kg体重。

试剂盒

本文还公开了一种试剂盒，其包括本公开的工程改造的多核苷酸、编码本公开的工程改造的多核苷酸的分离的多核苷酸、表达本公开的工程改造的多核苷酸的载体、表达本公开的工程改造的多核苷酸的重组细胞、或本文公开的组合物和使用说明书，或者可替代地基本上由其组成，或者还进一步由其组成。在一个方面中，说明书列举了使用本文公开的工程改造的多核苷酸的方法。

试剂盒可以包括病毒载体。病毒载体可以被包装在容器中。该试剂盒可以包括非天然存在的RNA。非天然存在的RNA可以被包装在容器中。试剂盒可以包括注射器。试剂盒可包括如本文所述的药物组合物。试剂盒可以包括用于施用病毒载体、非天然存在的RNA、如本文所述的药物组合物的说明书。

编号的实施例

本文公开了许多组合物和方法。下面公开了这些组合物和方法的具体示例性实施例。以下实施例叙述了本文公开的特征的组合的非限制性排列。特征的组合的其他排列也是预期的。特别地，这些编号的实施例中的每一个都被认为是从属于或涉及每一个前面或后面的编号的实施例，而与它们所列出的顺序无关。

实施例1.一种工程改造的多核苷酸，其包括：靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交，并且当至少部分地与所述靶RNA的所述部分杂交时含有至少一个错配；来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；来自剪接体snRNA或非剪接体snRNA或这些中任一者的变体的发夹；其中所述工程改造的多核苷酸被配置为促进由RNA编辑实体对所述靶RNA的碱基的编辑。

实施例2.一种工程改造的多核苷酸，其包括：靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交并且含有至少一个错配的核苷酸，其中所述靶RNA包括与疾病或病状有关的外显子中的突变；来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；和来自剪接体snRNA、非剪接体snRNA或这些中任一者的变体的发夹；其中所述工程改造的多核苷酸被配置为促进所述靶RNA中所述外显子的外显子跳跃。

实施例3.根据实施例1或2所述的工程改造的多核苷酸，其中所述错配包括至少一个腺嘌呤-鸟嘌呤(A-G)错配、至少一个腺嘌呤-腺嘌呤(A-A)错配或至少一个腺嘌呤-胞嘧啶(A-C)。

实施例4.根据实施例3所述的工程改造的多核苷酸，其中所述错配包括A-C错配。

实施例5.根据实施例4所述的工程改造的多核苷酸，其中所述A-C错配被配置为当在脱氨酶的存在下与所述靶RNA缔合时，通过所述脱氨酶促进所述靶RNA中的编辑。

实施例6.根据实施例1至5中任一者所述的工程改造的多核苷酸，其中所述Sm或Sm样蛋白结合结构域或其变体和发夹位于所述工程改造的多核苷酸的3'端。

实施例7.根据实施例1至6中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括多个Sm或Sm样蛋白结合结构域或其变体和多个发夹。

实施例8.根据实施例1至7中任一者所述的工程改造的多核苷酸，其中所述靶向序列的长度为约25个碱基至约200个碱基。

实施例9.根据实施例1至7中任一者所述的工程改造的多核苷酸，其中所述靶向序列的长度为至少约30个碱基。

实施例10.根据实施例1至9中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸可操作地连接至RNA聚合酶II型启动子。

实施例11.根据实施例10所述的工程改造的多核苷酸，其中所述RNA聚合酶II型启动子包括U1启动子。

实施例12.根据实施例10所述的工程改造的多核苷酸，其中所述RNA聚合酶II型启动子包括U7启动子。

实施例13.根据实施例1至12中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸可操作地连接至U6启动子。

实施例14.根据实施例1至13中任一者所述的工程改造的多核苷酸，其中Sm或Sm样蛋白结合结构域或其变体是SmOPT序列。

实施例15.根据实施例14所述的工程改造的多核苷酸，其中所述SmOPT序列包括与AAUUUUUGG或SEQ ID NO:41具有至少约80％序列同一性的序列。

实施例16.根据实施例14所述的工程改造的多核苷酸，其中所述SmOPT序列包括AAUUUUUGG或SEQ ID NO:41。

实施例17.根据实施例1至16中任一者所述的工程改造的多核苷酸，其中所述发夹来自小鼠U7 snRNA、人U7 snRNA或人U1 snRNA。

实施例18.根据实施例1至17中任一者所述的工程改造的多核苷酸，其中所述发夹是小鼠U7 snRNA、人U7 snRNA、人U1 snRNA中的一者或多者的嵌合发夹。

实施例19.根据实施例1至18中任一者所述的工程改造的多核苷酸，其中所述发夹包括与SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:45或SEQ ID NO:46中任一者的发夹序列具有至少80％、至少85％、至少90％、至少92％、至少95％、至少97％或至少99％序列同一性的序列。

实施例20.根据实施例19中任一者所述的工程改造的多核苷酸，其中所述发夹包括SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:45或SEQ ID NO:46中任一者的发夹序列。

实施例21.根据实施例1至20中任一者所述的工程改造的多核苷酸，其中所述发夹包括SEQ ID NO:43的发夹序列。

实施例22.根据实施例1至21中任一者所述的工程改造的多核苷酸，其进一步包括在所述工程改造的多核苷酸的3'端处的U7盒终止子。

实施例23.根据实施例1至22中任一者所述的工程改造的多核苷酸，其中从5'至3'的靶向序列包括所述靶向序列、所述Sm或Sm样蛋白结合结构域或其变体以及所述发夹。

实施例24.根据实施例2所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸被配置为促进由RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。

实施例25.根据实施例1至24中任一者所述的工程改造的多核苷酸，其中所述RNA编辑实体包括ADAR蛋白、APOBEC蛋白或两者。

实施例26.根据实施例1至24中任一者所述的工程改造的多核苷酸，其中所述RNA编辑实体包括ADAR，并且其中所述ADAR包括ADAR1或ADAR2。

实施例27.根据实施例1至26中任一者所述的工程改造的多核苷酸，其中所述靶向序列至少部分地结合至在疾病或病状中实施的靶RNA。

实施例28.根据实施例27所述的工程改造的多核苷酸，其中所述靶RNA选自由RAB7A、ABCA4、SERPINA1、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、HFE、LIPA、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合组成的组。

实施例29.根据实施例28所述的工程改造的多核苷酸，其中所述靶RNA是SERPINA1，并且其中所述SERPINA1包括E342K突变。

实施例30.根据实施例28所述的工程改造的多核苷酸，其中所述靶RNA是LRRK2，并且其中所述LRRK2包括G2019S突变。

实施例31.根据实施例1至30中任一者所述的工程改造的多核苷酸，其中所述疾病或病状包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良症或泰-萨克斯病。

实施例32.根据实施例1至31中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸进一步包括来自snRNA的额外的序列。

实施例33.根据实施例1至32所述的工程改造的多核苷酸，其中所述snRNA序列至少部分地包括U1、U2、U4、U5、U6或U7 snRNA序列。

实施例34.根据实施例1至33中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括与SEQ ID NO:1-SEQ ID NO:33中任一者或其变体具有至少80％同一性的序列。

实施例35.根据实施例34所述的工程改造的多核苷酸，其中所述snRNA序列包括与SEQ ID NO:1-SEQ ID NO:33中任一者或其变体具有至少90％同一性的序列。

实施例36.根据实施例4所述的工程改造的多核苷酸，其中所述snRNA启动子至少部分地包括U1、U2、U4、U5、U6或U7 snRNA启动子。

实施例37.根据实施例1至36中任一者所述的工程改造的多核苷酸，其中所述靶向序列与所述靶RNA内的外显子近侧的剪接信号至少部分互补。

实施例38.根据实施例37所述的工程改造的多核苷酸，其中靶向序列是：

(a)与所述靶RNA内的外显子上游的分支点至少部分互补；或者

(b)所述靶向序列与所述靶RNA中的外显子下游的供体剪接位点至少部分互补。

实施例39.根据实施例1所述的工程改造的多核苷酸，其中当在体外测量时，与不含所述Sm或Sm样结合结构域或其变体、不含所述发夹、或不含所述Sm或Sm样结合结构域或其变体和所述发夹的可比外显子跳跃构建体相比，所述工程改造的多核苷酸具有改善的外显子跳跃效率。

实施例40.根据实施例39所述的工程改造的多核苷酸，其中相对于包括不含所述至少一个错配的核苷酸的可比外显子跳跃构建体的细胞，通过进行数字液滴PCR脱落测定以检测被所述工程改造的多核苷酸转染的细胞中由所述工程改造的多核苷酸跳跃的外显子的跳跃百分比来确定效率。

实施例41.根据实施例37至40中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸被配置为促进剪接信号内碱基的编辑。

实施例42.根据实施例41所述的工程改造的多核苷酸，其中所述编辑被配置为促进外显子的至少部分跳跃。

实施例43.根据实施例39至42中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸具有至少1％、至少5％、至少10％、至少20％、至少30％、至少40％或至少50％的增加的外显子跳跃的效率，如通过体外测定测量的。

实施例44.根据实施例1至43中任一者所述的工程改造的多核苷酸，其中所述至少一个错配的核苷酸至少部分地配置所述工程改造的多核苷酸，当与所述靶RNA缔合时，以促进经由脱氨酶对所述靶RNA的碱基的编辑。

实施例45.根据实施例44所述的工程改造的多核苷酸，其中所述靶向序列当与所述靶RNA结合并与脱氨酶缔合时促进通过所述脱氨酶对所述靶RNA的多核苷酸的碱基的化学修饰。

实施例46.根据实施例1至45中任一者所述的工程改造的多核苷酸，其中所述错配位于距所述靶向序列的任一端的约1至约200个碱基处。

实施例47.根据实施例1至45中任一者所述的工程改造的多核苷酸，其中所述错配位于距所述靶向序列的任一端的至少45、46、47、48、49、50、51、52、53、54或55个碱基处。

实施例48.根据实施例1至47中任一者所述的工程改造的多核苷酸，其进一步包括脱氨酶募集结构域。

实施例49.根据实施例47所述的工程改造的多核苷酸，其中所述脱氨酶募集结构域选自由以下组成的组：GluR2、Alu、这些中任一者的一部分、这些中任一者的变体及其任何组合。

实施例50.根据实施例47或48所述的工程改造的多核苷酸，其中所述脱氨酶募集结构域包括茎环。

实施例51.根据实施例49所述的工程改造的多核苷酸，其中所述茎环是左旋茎环或右旋茎环。

实施例52.根据实施例50所述的工程改造的多核苷酸，其中所述茎环包括与GluR2结构域至少约80％的序列同一性。

实施例53.根据实施例1至51中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括至少一个化学修饰的核苷酸或核苷。

实施例54.根据实施例1至52中任一者所述的工程改造的多核苷酸，其中所述至少一种化学修饰包括如表1中提供的所述工程改造的多核苷酸的磷酸二酯主链键中的一个或两个非连接磷酸氧原子的修饰。

实施例55.根据实施例1至53中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸当存在于水溶液中并且不与所述靶RNA结合时，缺少凸起、多核苷酸环、结构化的结构域或其任何组合中的至少一者。

实施例56.根据实施例1至54中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸当与所述靶RNA至少部分杂交时包括凸起、内环、发夹或其任何组合。

实施例57.根据实施例1至55中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸当与所述靶RNA至少部分杂交时包括凸起。

实施例58.根据实施例56所述的工程改造的多核苷酸，其中所述凸起是不对称凸起。

实施例59.根据实施例56所述的工程改造的多核苷酸，其中所述凸起是对称凸起。

实施例60.根据实施例55至58中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸当与所述靶RNA至少部分杂交时包括内环。

实施例61.根据实施例59所述的工程改造的多核苷酸，其中所述内环是不对称环。

实施例62.根据实施例59所述的工程改造的多核苷酸，其中所述内环是对称环。

实施例63.根据实施例1至53中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括结构环稳定的支架。

实施例64.根据实施例62所述的工程改造的多核苷酸，其中所述结构环稳定的支架进一步包括靶向序列，所述靶向序列当与所述靶RNA至少部分杂交时，促进经由RNA编辑酶对所述靶RNA的核苷酸的碱基的化学修饰；并且其中所述靶向序列包括至少约4个连续的核苷酸。

实施例65.根据实施例1至63中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸进一步包括位于所述靶向序列侧翼的第一间隔子结构域和第二间隔子结构域，其中所述工程改造的多核苷酸被配置为在哺乳动物细胞中转录后经历环化。

实施例66.根据实施例64所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括在第一间隔子结构域的5'端、在第二间隔子结构域的3'端或两者的核酶结构域。

实施例67.根据实施例65所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括在所述核酶结构域和所述第一间隔子结构域之间或在所述核酶结构域和所述第二间隔子结构域之间的连接结构域。

实施例68.根据实施例1至66中任一者所述的工程改造的多核苷酸，其中当所述多核苷酸序列以2维表示时，所述工程改造的多核苷酸是线性的。

实施例69.根据实施例1至66中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸缺少暴露于溶剂的3'还原羟基。

实施例70.根据实施例1至66中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸被配置为在转化到哺乳动物细胞中时经历化学变更，使得在所述化学变更之后，所述工程改造的化学修饰的缺少暴露于溶剂的3'还原羟基。

实施例71.根据实施例64至69中任一者所述的工程改造的多核苷酸，其中所述靶向序列不包括适体。

实施例72.根据实施例1至66中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸不包括或不编码被配置为用于RNA干扰(RNAi)的序列。

实施例73.根据实施例1至72中任一者所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的3'或5'非翻译区(UTR)的至少一部分相关联。

实施例74.根据实施例1至72中任一者所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与翻译起始位点的至少一部分相关联。

实施例75.根据实施例1至72中任一者所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的内含子区域的至少一部分相关联。

实施例76.根据实施例1至72中任一者所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的外显子区域的至少一部分相关联。

实施例77.根据实施例1至76中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸为约80个核苷酸至约600个核苷酸。

实施例78.根据实施例1至77中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括与SEQ ID NO:1-SEQ ID NO:33中任一者或其变体具有至少80％同一性的序列。

实施例79.根据实施例78所述的工程改造的多核苷酸，其中所述snRNA序列包括与SEQ ID NO:1-SEQ ID NO:33中任一者或其变体具有至少90％同一性的序列。d

实施例80.根据实施例1至79中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括在靶向序列的5'处的第一间隔子结构域。

实施例81.根据实施例80所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括与所述第一间隔子结构域不同或相同的第二间隔子结构域。

实施例82.根据实施例80或81所述的工程改造的多核苷酸，其中所述第一间隔子结构域、所述第二间隔子结构域或两者包括以下的多核苷酸序列：5'AUAUA 3'。

实施例83.根据实施例80或81所述的工程改造的多核苷酸，其中所述第一间隔子结构域、所述第二间隔子结构域或两者包括以下的多核苷酸序列：5'AUAAU 3'。

实施例84.根据实施例70至83中任一者所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸包括位于5'端的第一核酶结构域和位于3'端的第二核酶结构域。

实施例85.根据实施例84所述的工程改造的多核苷酸，其中第一核酶或第二核酶独立地选自由锤头状核酶、glmS核酶、HDV样核酶、R2元件、肽基转移酶23S rRNA、GIR1分支核酶、前导酶、II组内含子、发夹状核酶、VS核酶、CPEB3核酶、CoTC核酶和I组内含子组成的组。

实施例86.一种载体，其包括或编码根据实施例1至85中任一者所述的工程改造的多核苷酸。

实施例87.根据实施例86所述的载体，其中所述载体包括脂质体、纳米颗粒或树枝状聚合物。

实施例88.根据实施例86所述的载体，其中所述载体是病毒载体。

实施例89.根据实施例88所述的载体，其中所述病毒载体是腺相关病毒(AAV)载体。

实施例90.根据实施例89所述的载体，其中所述AAV载体是AAV2载体、AAV5载体、AAV8载体、AAV9载体或任何这些的杂交体。

实施例91.根据实施例89或90所述的载体，其中所述病毒载体是自我互补腺相关病毒(scAAV)载体

实施例92.根据实施例89至90中任一者所述的载体，其中所述病毒载体是单链AAV载体。

实施例93.一种分离的细胞，其包括根据实施例1至85中任一者所述的工程改造的多核苷酸、编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸、或根据实施例86至92中任一者所述的载体。

实施例94.根据实施例93所述的分离的细胞，其中所述分离的细胞是T细胞。

实施例95.一种单位剂量形式的药物组合物，其包括根据实施例1至85中任一者所述的工程改造的多核苷酸、编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸、或根据实施例86至92中任一者所述的载体；和药学上可接受的赋形剂、稀释剂或载剂。

实施例96.一种治疗或预防有此需要的受试者的病状的方法，其包括向所述受试者施用有效量的根据实施例1至85中任一者所述的工程改造的多核苷酸、编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸、根据实施例86至92中任一者所述的载体或根据实施例95所述的药物组合物。

实施例97.根据实施例96所述的方法，其中所述病状是杜兴氏肌营养不良症(DMD)、雷特综合征、夏科-马里-图思病、阿尔茨海默病、Tau蛋白病、帕金森病、α-1抗胰蛋白酶缺乏症或斯塔加特病。

实施例98.根据实施例96所述的方法，其中所述病状与选自由RAB7A、ABCA4、SERPINA1、SERPINA1 E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、ATP7BG1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合组成的组的基因中的突变相关联。

实施例99.根据实施例96至98中任一者所述的方法，其中所述施用是吸入、耳、颊、结膜、牙、子宫颈内、鼻窦内、气管内、肠内、硬膜外、羊膜外、体外、血液透析、浸润、间质、腹腔内、羊膜内、动脉内、关节内、胆管内、支气管内、囊内、心内、软骨内、尾内、海绵体内、腔内、侧脑室内、脑池内、角膜内、冠内、冠状动脉内、体内海绵体内、真皮内、椎间盘内、导管内、十二指肠内、硬膜内、表皮内、食管内、胃内、牙龈内、海马内、回肠内、病灶内、管腔内、淋巴内、髓内、脑膜内、肌内、眼内、卵巢内、心包内、腹膜内、胸膜内、前列腺内、肺内、窦内、椎管内、滑膜内、腱内、睾丸内、胸腔内、小管内、肿瘤内、鼓室内、子宫内、血管内、静脉内、静脉团注、静脉滴注、膀胱内、玻璃体内、离子电渗疗法、冲洗、喉、鼻、鼻饲、眼、口、口咽、肠胃外、经皮、关节周围、硬膜外、神经周、牙周、直肠、眼球后、蛛网膜下、结膜下、皮下、舌下、粘膜下、局部、经皮、经粘膜、经胎盘、经气管、经鼓膜、输尿管、尿道、阴道、眼眶下、实质内、鞘内、心室内、立体定向或其任何组合。递送可以包含肠胃外施用(包含静脉内、皮下、鞘内、腹膜内、肌内、血管内或输注)、口服施用、吸入施用、十二指肠内施用、直肠施用。递送可以包含对表面(如皮肤)的外表面的局部施用(如洗剂、乳膏、软膏)。在一些情况下，施用是通过实质注射、鞘内注射、心室内注射、脑池内注射、静脉内注射或鼻内施用或其任何组合。

实施例100.根据实施例96至99中任一者所述的方法，其进一步包括施用额外的治疗。

实施例101.根据实施例100所述的方法，其中所述额外的治疗同时或连续施用。

实施例102.根据实施例96至101中任一者所述的方法，其中所述施用至少每周进行一次。

实施例103.根据实施例96至102中任一者所述的方法，其中所述受试者在施用前已经通过体外诊断被诊断患有所述疾病或病状。

实施例104.根据实施例96至103中任一者所述的方法，其中所述受试者是人。

实施例105.一种试剂盒，其包括在容器中的根据实施例1至85中任一者所述的工程改造的多核苷酸、在容器中的编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸、在容器中的根据实施例86至92中任一者所述的载体、或在容器中的根据实施例95所述的药物组合物。

实施例106.一种制备药物组合物的方法，其包括使药学上可接受的赋形剂、载剂或稀释剂与根据实施例1至85中任一者所述的工程改造的多核苷酸、编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸或根据实施例86至92中任一者所述的载体中的至少一者接触。

实施例107.一种制备试剂盒的方法，其包括将以下至少部分置于容器中：

(a)根据实施例1至85中任一者所述的工程改造的多核苷酸；

(b)编码根据实施例1至85中任一者所述的工程改造的多核苷酸的多核苷酸；

(c)根据实施例86至92中任一者所述的载体；或

(d)根据实施例95所述的药物组合物。

实例

以下实例旨在说明而非限制本公开。虽然它们是可以使用的典型程序，但是可替代地可以使用本领域技术人员已知的其他程序。

实例1：评估snRNA启动子和3'发夹对特异性引导RNA编辑的影响

在本实例中，测试了添加到引导RNA中的额外特征在影响引导RNA编辑或执行外显子跳跃的能力方面的能力。图1示出了用于评估外显子跳跃活性的存在的示例性外显子跳跃ddPCR测定。

向引导RNA的3'端添加U7和U1发夹

在这项研究中，测试了在不同snRNA启动子下表达的引导RNA的特异性引导RNA编辑。

为了测试snRNA启动子驱动的引导RNA表达是否会影响编辑，使用带有或不带有相应3'发夹(SmOPT mU7、SmOPT hU7或hU1发夹)的hU6、hU7或hU1启动子来表达靶向人RAB7A3'UTR、人DMD外显子71的剪接受体或人DMD外显子74的剪接受体的100个核苷酸引导RNA。所使用的终止序列与启动子的终止序列相匹配。在有或没有人ADAR2过表达的情况下，用1μg表达引导RNA构建体的质粒转染293T细胞。

在图2A中，与3'发夹组合的U7或U1启动子增强RAB7A ADAR编辑和DMD外显子71或外显子74跳跃(如通过ddPCR测量的)。即使在不存在ADAR2过表达的情况下，这些构建体也表现出相似的编辑。图2B示出了桑格测序色谱图，以证明RAB7A3'UTR中腺苷的编辑特异性，如框中注明的。使用反向引物进行桑格测序；因此，A至G的编辑表现为T至C的突变。

实例2：用含有引导RNA的U7启动子编辑RAB7A和SNCA

在本实例中，使用不同的引导RNA构建体来编辑沿着RAB7A和α-突触核蛋白(SNCA)的不同区域。对于RAB7A，外显子1、3和3'UTR被靶向以进行编辑，而对于SNCA，起始密码子和3'UTR被靶向。图3A示出了人RAB7A和SNCA的外显子结构的示意图。外显子被显示为灰色区段；编码区域用上面的黑线表示。示出了引导RNA靶向位点的位置；还示出了PCR引物。

使用没有3'发夹的hU6启动子或具有3'SmOPT U7发夹的mU7或hU7启动子来表达靶向人RAB7A外显子1、外显子3或3'UTR，或人SNCA起始密码子或3'UTR的100nt引导RNA。图3B总结了在存在或不存在ADAR2过表达的情况下，使用不同的引导RNA构建体进行编辑的结果。与3'SmOPT U7发夹组合的U7启动子增强了每个靶位点处的ADAR编辑(通过桑格测序测量)。虽然靶向3'UTR的构建体在内源性ADAR水平相对于过表达的ADAR水平下同样有效，但靶向其他区域的构建体仍然受益于ADAR2过表达。

为了证实是否发生了差异外显子跳跃，分离来自编辑的转录物的cDNA，并且使用表示的引物进行PCR扩增。如果外显子结构被保持，则跨越RAB7A的编码决定序列的一部分的RAB7A引物产生437bp扩增子。如果RAB7A的外显子3被跳跃，则预期310bp的扩增子。使用SNCA引物，预期323bp的PCR扩增子。图3C示出了从靶向RAB7A外显子1或SNCA起始密码子的引导RNA中最小的RAB7A外显子3的跳跃并且没有可检测到的外显子跳跃。

图3D示出了桑格测序色谱图，其显示在指定的转录物的靶标腺苷处的特异性编辑。框指示靶标上的编辑位点。

实例3：HEK 293和K562细胞中人SNCA起始密码子和3'UTR的靶标上和脱靶标编辑

在本实例中，使用不同的细胞系和转染方法来编辑SNCA的不同区域。使用不含发夹的hU6启动子、含有3'SmOPT mU7发夹的mU7启动子、含有3'SmOPT hU7发夹的hU7启动子或含有3'SmOPT mU7发夹的hU1启动子来表达靶向人SNCA起始密码子或人SNCA 3'UTR的100nt引导RNA。本文公开了在U7或U1启动子下并且还包括SmOPT U7发夹序列的工程改造的多核苷酸的组合物。所述工程改造的多核苷酸可以与对应于SNCA的靶RNA序列杂交，以促进ADAR介导的腺苷的编辑。

图4A示出了分析SNCA的不同位点和测量ADAR介导的编辑效率的效果。用含有引导序列的质粒转染HEK293细胞，并且两天后通过桑格测序来测量RNA编辑。在一些情况下，ADAR2被过表达。评价了A/C不匹配位点的评估(红色框)，以确定在每种情况下的编辑效率。在一些情况下，低于5％的编辑效率可能低于背景水平。

图4B通过在过表达SNCA的K562细胞中转染工程改造的多核苷酸来评估SNCA 3'UTR的编辑。经由核转染(Lonza)将1.5μg的表达引导RNA的质粒转染到2×10⁵SNCA过表达的K562细胞中。转染后40小时和72小时测量RNA编辑。空心符号表示其中用GFP表达载体转染细胞的实验；实心符号表示用ADAR2过表达载体的转染。

实例4：使用线性和环状引导RNA进行RNA编辑

本文公开了在不同哺乳动物snRNA启动子控制下的工程改造的多核苷酸的组合物。这些构建体是含有3'SmOPT U7发夹的线性工程改造的多核苷酸构建体或缺少发夹的环状引导RNA构建体。图5证明了人U1启动子也可以与3'SmOPT序列和U7发夹配对，用于引导RNA编辑，其中转录水平的敲低最小。

使用含有3'SmOPT U7发夹和U7终止序列的hU6、mU7、hU7或hU1启动子来表达靶向人RAB7A 3'UTR、人DMD外显子71剪接受体或人DMD外显子74剪接受体的100nt引导RNA。可替代地，使用具有环化RtcB核酶位点(无SmOPT或U7发夹)的hU6、mU7、hU7或hU1启动子来表达这些100nt引导RNA。用1ug的表达引导RNA构建体的质粒转染293T细胞(内源性ADAR水平)；在转染后的指定时间点通过ddPCR测量RNA。

表达含有3'SmOPT U7发夹的引导RNA的U7或U1启动子导致高水平的RAB7A编辑和DMD外显子跳跃；然而，当表达这些相同的引导RNA构建体时，U6启动子明显较弱。相比之下，表达环状引导RNA(无发夹)的U6启动子导致最高水平的RAB7A编辑，但导致更适度水平的DMD外显子跳跃。

实例5：将hnRNP A1结合结构域添加到工程改造的多核苷酸的5'端

在与3'SmOPT U7发夹相对的引导RNA的5'端处添加hnRNP A1结合结构域[UAGGGW](其中W是A/U)进一步增加RAB7A编辑和DMD外显子74跳跃。

使用具有3'SmOPT mU7发夹和mU7终止序列的mU7或hU1启动子来表达靶向人RAB7A3'UTR、人DMD外显子71剪接受体或人DMD外显子74剪接受体的100nt引导RNA。可替代地，使用来自Litke和Jaffrey 2019(无SmOPT或U7发夹)的具有环化RtcB核酶位点的hU6启动子来表达这些100nt引导RNA。在引导RNA的5'端添加的是：无标签；三重hnRNP A1结合结构域；双重hnRNP A1结合结构域；或作为阴性对照的不结合hnRNP A1的突变的结构域。用1ug的表达引导RNA构建体的质粒来转染293T细胞(内源性ADAR水平)；42小时后测量RNA。图6A示出了hnRNP结合结构域当与U7/U1启动子和3'SmOPT U7发夹组合时，增加RAB7A ADAR编辑和DMD外显子74跳跃(通过ddPCR测量)。不幸的是，hnRNP结构域没有改善U6环状引导RNA。RAB7A编辑不改动相对于HPRT1管家基因的转录表达水平。DMD外显子71跳跃也没有改善，可能是因为这些条件已经使外显子71跳跃的量最大化(给定转染效率和转录物周转)。图6B示出了桑格测序色谱图，其显示在RAB7A 3'UTR(方框)中靶腺苷处的特异性编辑。由于使用反向引物进行测序，因此A>G编辑显示为T>C。

实例6：用具有SmOPT序列和U7茎环发夹的引导序列进行RNA编辑

为了剖析3'SmOPT U7发夹的哪些特征是增强的编辑所必需的，比较了SmOPT序列的变异和U7茎环发夹的变异。使用mU7启动子和mU7终止序列以及3'SmOPT mU7茎环发夹序列的变异来表达靶向人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体的100nt引导RNA。用1ug的表达引导RNA构建体的质粒来转染293T细胞(内源性ADAR水平)；42小时后测量RNA。图7A列出了测试的序列变异。图7B显示了SmOPT序列，但不是任何天然或突变的变异，对于靶转录物的完全编辑是必需的。图7B还显示，小鼠或人U7茎环发夹或杂交小鼠/人U7茎环发夹可以满足编辑。图7C示出了示例性桑格测序色谱图，其显示了在指示的转录物的靶腺苷处的特异性编辑。框指示靶标上的编辑位点。

实例7：在SmOPT和U7发夹的情况下，针对LRRK2的引导RNA

该实例描述了本公开的构建体，其编码在U1启动子、SmOPT序列和U7发夹控制下的引导RNA，其中引导RNA被设计成靶向LRRK2(一种与帕金森病有关的基因)。在SmOPT和U7发夹的情况下，测试了两种靶向LRRK2 G2019S突变的引导RNA设计。第一引导序列是SEQ IDNO:18。第二引导序列是SEQ ID NO:19。在用携带LRRK2微小基因的piggyBac载体转染的WTHEK293细胞中，测试了引导RNA促进ADAR介导的G2019S LRRK2突变的RNA编辑的能力。WTHEK293细胞天然表达ADAR1。在其中测试经由ADAR1和ADAR2介导的RNA编辑的实验中，ADAR2经由携带LRRK2微小基因的相同piggyBac载体在细胞中过表达。在图8中示出了piggyBac构建体的示意图。实验仅在ADAR1(图9A)或ADAR1和ADAR2(图9B)的存在下进行。GFP质粒用作对照。图9A和图9B显示含有SmOPT和U7发夹的引导RNA在仅ADAR1的存在下促进8％的靶标上编辑效率，并且在ADAR1和ADAR2的存在下促进28％的靶标上编辑效率。图9A和图9B显示含有SmOPT和U7发夹的引导RNA在仅ADAR1的存在下促进19％的靶标上编辑效率，并且在ADAR1和ADAR2的存在下促进58％的靶标上编辑效率。另外的实验证明，第一引导序列(SEQ IDNO:18)的吉布斯自由能(ΔG)为-161.98kcal/mol，并且第二引导序列(SEQ ID NO:19)的ΔG为-169.44kcal/mol。两种引导RNA的结构显示在图9A至图9B的图表下方。如结构图所见，第二个引导序列(SEQ ID NO:18)与靶RNA形成一段更长的连续双链RNA。

实例8：含有3'SmOPT序列和U7发夹的引导RNA可以被U7或U6启动子环化和表达，以产生ADAR编辑

将具有3'SmOPT序列和U7发夹的100nt反义(靶向)引导RNA插入到P3和P1RtcB环状核酶位点之间，并且用mU7或hU6启动子表达。用1μg的表达引导RNA构建体的质粒转染293T细胞(内源性ADAR水平)；41小时后测量RNA。图10A说明了环状RNA的形式；用引导特异性引物(黑色)进行的桑格测序显示，核酶位点已经精确地连接在一起，其中反义引导序列和3'SmOPT U7发夹位于环状RNA内。

图10B列出了在P3和P1 RtcB环状核酶位点之间克隆的Sm结合结构域、U7茎环发夹和RNA接头序列的几种序列变异(上板图)。在Sm结合结构域之前，在环状RNA中包含100nt反义引导RNA，其靶向人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体。使用mU7或hU6启动子来表达引导RNA，每个启动子具有其相应的终止子序列。除了线性SmOPT U7发夹引导RNA之外，含有Sm结合结构域和U7茎环发夹的环化的引导RNA也可以编辑靶转录物，如通过桑格测序所测量的(中板图)。作为阴性对照，使用靶向不同基因的线性SmOPT U7发夹引导RNA。此外，与HPRT1管家基因相比，线性或环状形式的SmOPT U7发夹引导RNA均不改动RAB7A 3'UTR或SNCA 3'UTR靶转录物的基因表达水平，并且通过ddPCR进行测量(左下板图)。线性SmOPT U7发夹引导RNA仅引起RAB7A外显子4的最小无意跳跃，而环状SmOPT U7发夹引导RNA显示没有可检测的外显子跳跃，如通过PCR和凝胶电泳所测量的(右下板图)。

实例9：在SmOPT和U7发夹的情况下，针对ABCA4的引导RNA

本实例描述了编码在启动子、SmOPT序列和U7发夹控制下的引导RNA的本公开的构建体，其中引导RNA被设计为靶向与斯塔加特病有关的ABCA4错义突变。

最初的一组实验证明了在并入SmOPT序列和U7发夹的引导序列中观察到的ABCA4的RNA编辑的改善。用携带具有5882G->A突变和ADAR2的ABCA4微小基因的piggyBac载体来转染天然表达ADAR1的HEK293细胞。测试了各种引导序列，包含两个U6驱动的引导RNA(SEQID NO:20和SEQ ID NO:21)和含有SmOPT序列和U7发夹的U1驱动的引导RNA(SEQ ID NO:22)。阴性对照包含针对不同基因(Rab7A)的环状引导RNA、单独的GFP质粒和无转染。如图11A和图11B所示，U7 SmOPT序列和U7发夹的包含增加了RNA编辑。

随后的实验评价了靶向ABCA4 5882G->A突变的引导RNA，其中编码引导RNA的工程改造的多核苷酸也编码SmOPT序列和U7发夹。图12A示出了对于编码靶向ABCA4、SmOPT序列和U7发夹中的突变的引导RNA的构建体的多剂量，通过ADAR1和ADAR2在细胞中的RNA编辑百分比，其中表达由U1启动子驱动。如上所述，HEK293细胞天然表达ADAR1。对于图12A，用携带具有5882G->A突变和ADAR2的ABCA4微小基因的piggyBac载体来转染HEK293细胞。图12B示出了对于编码靶向ABCA4、SmOPT序列和U7发夹中的突变的引导RNA的构建体的多剂量，通过ADAR1在细胞中的RNA编辑百分比，其中表达由U1启动子驱动。用仅携带具有5882G->A突变的ABCA4微小基因的piggyBac载体来转染HEK293细胞。在图12A和图12B两者中，编码引导RNA、SmOPT序列和U7发夹的质粒的剂量为250ng、500ng、750ng或1000ng。GFP质粒和无转染被用作阴性对照。结果显示ABCA4 5882G->A突变的RNA编辑百分比的剂量依赖性。靶向ABCA4的序列包含SEQ ID NO:20、SEQ ID NO:21和SEQ ID NO:22。

实例10：在SmOPT序列和U7发夹的情况下，针对SNCA的引导RNA

本实例描述了编码在U1启动子、SmOPT序列和U7发夹控制下的引导RNA的本公开的构建体，其中引导RNA被设计为靶向SNCA基因中的起始位点或翻译起始位点(translationinitiation site)(TIS)(也被称为翻译起始位点(translation start site)(TSS))。引导构建体被设计成靶向外显子2的核苷酸位置26(对应于大多数SNCA变体的核苷酸位置264，包含外显子1和外显子2)的SNCA TIS腺苷。用编码感兴趣的引导RNA的质粒来转染HEK293细胞，并在转染后48小时评估RNA编辑。仅评估了ADAR1(其由HEK293细胞天然表达)以及ADAR1和ADAR2的RNA编辑。在后一个实验中，用编码ADAR2的piggybac载体共转染HEK293细胞。RNA编辑的水平通过桑格测序进行量化，并使用测序分析脚本(EditADAR)进行分析。

图13至图15示出了待编辑的靶标A处的RNA编辑(x轴上的“0”)和脱靶标位置处的RNA编辑(表示为非“0”的位置处的黑条)的图。在每一列中均示出了生物复制品。在几个引导RNA构建体中观察到SNCA的高水平的RNA编辑。阴性对照运行包含未靶向靶SNCA序列的引导RNA。虽然未观察到通过qPCR进行的mRNA敲低，但仍有可能实现蛋白质敲低。图13、图14和图15所示的引导构建体显示了高水平的RNA编辑和高的靶标上编辑与脱靶标编辑的比率。图14中所示的引导序列包括寡栓链，它是与靶向序列相邻的引导序列的一段，其与靶链具有非连续互补性。

图13至图15所示的引导序列在下面的表2中描述。下面的表2还描述了在给定的引导序列与靶RNA杂交后形成的特征、观察到的靶标上RNA编辑百分比、作为靶标上RNA编辑的总RNA编辑百分比的靶标上编辑，以及作为起始位点中靶标处和编码区域中起始位点下游RNA编辑的百分比的靶标上编辑。

表2–引导RNA序列

实例11：在来自质粒瞬时转染或构建体的单拷贝整合的SmOPT和U7发夹的情况下，针对人类SOD1起始密码子的引导RNA

使用具有环化RtcB核酶位点的hU6启动子(无SmOPT或U7发夹)、具有3'SmOPT mU7发夹的mU7启动子或具有5'双hnRNP A1结合结构域和3'SmOPT hU7发夹的mU7启动子来表达靶向人SOD1起始密码子的100nt引导RNA。所述工程改造的多核苷酸可以与对应于SOD1的靶RNA序列杂交，以促进腺苷的ADAR介导的编辑。图16示出了人SOD1起始密码子的编辑，其中工程改造的多核苷酸通过质粒瞬时转染或作为单拷贝整合到基因组中而被递送至HEK293T细胞。对于瞬时递送，将1ug的质粒转染到HEK 293T细胞(内源性ADAR)中，并在2天后测量编辑的百分比。对于整合的递送，将引导RNA表达构建体的单个拷贝插入到基因组中，并在一周后的抗生素选择后测量编辑的百分比。

实例12：在SmOPT和U7发夹的情况下，针对SERPINA1的引导RNA

本实例描述了编码在启动子、SmOPT序列和U7发夹的控制下的引导RNA的本公开的构建体，其中引导RNA被设计成靶向与α-1抗胰蛋白酶缺乏症有关的SERPINA1错义突变(SERPINA1，在位置9989处的G至A突变，产生SERPINA1 E342K突变)。

简而言之，经由piggyBac载体将SERPINA1微小基因转染到表达内源性ADAR1的K562细胞中，并且经由嘌呤霉素选择来选择细胞。整合到K562细胞中的SERPINA1微小基因包含具有全长3'UTR的SERPINA1微小基因1或具有截短的3'UTR的SERPINA1微小基因2。两个微小基因都携带感兴趣的G至A 9989突变。K562细胞(2x10^5个细胞)用质粒电穿孔，所述质粒编码与U7发夹和SmOPT序列可操作连接的引导RNA。表达由小鼠U7启动子驱动。电穿孔后24小时，分离RNA，经由RT-PCR合成cDNA，并且经由桑格测序对RT-PCR产物进行测序，以量化RNA编辑百分比。对照引导RNA缺少U7发夹和SmOPT序列，并且表达在U6启动子下驱动。图18和图19显示了使用引导RNA序列编辑SERPINA1。所使用的引导RNA序列包括SEQ ID NO:26和SEQ ID NO:27。

实例13：在SmOPT和U7发夹的情况下，针对RAB7A的引导RNA

本实例描述了编码在具有5'双hnRNP A1结合结构域、SmOPT序列和3'SmOPT hU7发夹的hU1启动子的控制下的引导RNA的本公开的构建体，其中引导RNA被设计为靶向RAB7A的3'UTR，以促进在紧接翻译终止密码子之后的3'UTR处的腺苷的ADAR介导的编辑。所使用的引导序列是SEQ ID NO:28–SEQ ID NO:30的引导序列。编辑是在肌肉细胞中评估的。横纹肌肉瘤细胞(RD WT)、2D9细胞(具有固定到外显子51剪接位点中的突变的RD细胞)和4H6细胞(具有固定到外显子53剪接位点中的突变的RD细胞)用piggyBac载体中编码RAB7A 3'UTR的引导RNA稳定转染。引导RNA在下表中描述，并且表达在人U1启动子的控制下驱动。无质粒被用作阴性对照。图20示出了使用SEQ ID NO:28–SEQ ID NO:30的引导RNA编辑RAB7A。在平板培养后48小时和细胞分化后10天，在未分化的细胞中评估RNA编辑百分比。

在所有细胞中以及在两个时间点，长度为100个碱基的线性引导RNA以及与U7发夹和SmOPT序列的A/C错配促进了内源性ADAR对RAB7A 3'UTR的最高水平编辑。

然后在永生化的骨骼肌成肌细胞系LHCN-M2中筛选每一个引导序列。如图17所描绘，与上述RD细胞相似，测试的引导序列显示了通过7天的分化的持续编辑。

实例14：使用引导RNA的RAB7A编辑

本实例描述了在iPSC衍生的神经细胞中使用本公开的引导RNA的RAB7A编辑，其中引导RNA经由AAV递送。在用表达AAV2/2的GFP(对照)或Rab7引导序列(有或没有3'SmOPThU7发夹)感染前，使用双SMAD抑制将iPSC诱导为神经谱系持续至少6天。细胞通常以每孔1*10^5个细胞铺板在24孔板中，并以指定的vg/细胞感染。感染后48小时、72小时或7天分离mRNA，并且通过ddPCR和桑格测序来评估Rab7编辑。通过使用ImageJ量化图像来评估转导效率。简而言之，拍摄捕获GFP+信号的每个孔的图像以及同一视野的明视野图像。将GFP+信号阈值化，并且测量阳性信号的面积。类似地，将含细胞的明视野图像的面积阈值化，并且测量阳性信号的面积。GFP+面积除以细胞面积以得到转导百分比。

iPSC用不同的vg/细胞转导持续48小时或72小时，并且在分化的第8天或第9天收获。通过ddPCR来测量Rab7编辑。如图21A所示，随着vg/细胞增加，存在Rab7编辑的剂量依赖性增加。数据代表生物复制品，平均值+/-SEM。Rab7编辑也通过桑格测序来测量。如图21B所示，随着vg/细胞增加，存在Rab7编辑的剂量依赖性增加。定量测序的ddPCR和桑格测序方法产生非常相似的结果。数据代表生物复制品，平均值+/-SEM。对于图21C，iPSC用不同的vg/细胞转导持续72小时或7天，并且在分化的17天或更多天时收获。通过ddPCR来测量Rab7编辑。数据代表生物复制品，平均值+/-SEM。

图22A描绘了在分化9天后、感染后72小时收获的细胞中针对Rab7编辑效率绘制的转导％。圆点的颜色代表处理细胞的病毒的滴度。病毒滴度与转导效率直接相关。图22B描绘了在分化不同天后收获的细胞中针对Rab7编辑效率绘制的转导％。点的颜色代表分化的天数，并且点的大小代表处理细胞的病毒的滴度。

下面的表3示出了本公开的各种序列。序列中元件的格式与表3第二列中的格式一致。

表3：根据本文的一些实施例的工程改造的核苷酸的序列和工程改造的核苷酸的组分

Claims

1.一种工程改造的多核苷酸，其包括：

靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交，并且当至少部分地与所述靶RNA的所述部分杂交时含有至少一个错配；

来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；

来自剪接体snRNA或非剪接体snRNA或这些中任一者的变体的发夹；

其中所述工程改造的多核苷酸被配置为促进由RNA编辑实体对所述靶RNA的碱基的编辑。

2.一种工程改造的多核苷酸，其包括：

靶向序列，所述靶向序列至少部分地与靶RNA的至少一部分杂交并且含有至少一个错配的核苷酸，其中所述靶RNA包括与疾病或病状有关的外显子中的突变；

来自剪接体snRNA或非剪接体小核RNA(snRNA)的Sm或Sm样蛋白结合结构域或其变体；和

来自剪接体snRNA、非剪接体snRNA或这些中任一者的变体的发夹；

其中所述工程改造的多核苷酸被配置为促进所述靶RNA中外显子的外显子跳跃。

3.根据权利要求1或2所述的工程改造的多核苷酸，其中所述错配包括至少一个腺嘌呤-鸟嘌呤(A-G)错配、至少一个腺嘌呤-腺嘌呤(A-A)错配或至少一个腺嘌呤-胞嘧啶(A-C)。

4.根据权利要求3所述的工程改造的多核苷酸，其中所述错配包括A-C错配。

5.根据权利要求1至4中任一项所述的工程改造的多核苷酸，其中所述Sm或Sm样蛋白结合结构域或其变体和所述发夹位于所述工程改造的多核苷酸的3'端。

6.根据权利要求1至5中任一项所述的工程改造的多核苷酸，其中所述靶向序列的长度为约25个碱基至约200个碱基。

7.根据权利要求1至5中任一项所述的工程改造的多核苷酸，其中所述靶向序列的长度为至少约30个碱基。

8.根据权利要求1至9中任一项所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸能够操作地连接至RNA聚合酶II型启动子。

9.根据权利要求10所述的工程改造的多核苷酸，其中所述RNA聚合酶II型启动子包括U7启动子。

10.根据权利要求1至12中任一项所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸能够操作地连接至U6启动子。

11.根据权利要求1至10中任一项所述的工程改造的多核苷酸，其中Sm或Sm样蛋白结合结构域或其变体是SmOPT序列。

12.根据权利要求11所述的工程改造的多核苷酸，其中所述SmOPT序列与SEQ IDNO:41包括至少约80％的序列同一性。

13.根据权利要求11所述的工程改造的多核苷酸，其中所述SmOPT序列包括SEQ ID NO:41的序列。

14.根据权利要求1至13中任一项所述的工程改造的多核苷酸，其中所述发夹来自小鼠U7 snRNA、人U7 snRNA或人U1 snRNA。

15.根据权利要求1至14中任一项所述的工程改造的多核苷酸，其中所述发夹包括与SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:45或SEQ ID NO:46中任一者的发夹序列具有至少80％、至少85％、至少90％、至少92％、至少95％、至少97％或至少99％序列同一性的序列。

16.根据权利要求15中任一项所述的工程改造的多核苷酸，其中所述发夹包括SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:45或SEQ ID NO:46中任一者的所述发夹序列。

17.根据权利要求1至16中任一项所述的工程改造的多核苷酸，其中所述发夹包括SEQID NO:43的所述发夹序列。

18.根据权利要求1至17中任一项所述的工程改造的多核苷酸，其进一步包括在所述工程改造的多核苷酸的3'端处的U7盒终止子。

19.根据权利要求1至18中任一项所述的工程改造的多核苷酸，其中从5'至3'的所述靶向序列包括所述靶向序列、所述Sm或Sm样蛋白结合结构域或其变体以及所述发夹。

20.根据权利要求2所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸被配置为促进由RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。

21.根据权利要求1至20中任一项所述的工程改造的多核苷酸，其中所述RNA编辑实体包括ADAR蛋白、APOBEC蛋白或两者。

22.根据权利要求1至20中任一项所述的工程改造的多核苷酸，其中所述RNA编辑实体包括ADAR，并且其中所述ADAR包括ADAR1或ADAR2。

23.根据权利要求1至22中任一项所述的工程改造的多核苷酸，其中所述靶向序列至少部分地结合至在疾病或病状中实施的靶RNA。

24.根据权利要求23所述的工程改造的多核苷酸，其中所述靶RNA选自由RAB7A、ABCA4、SERPINA1、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、HFE、LIPA、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合组成的组。

25.根据权利要求24所述的工程改造的多核苷酸，其中所述靶RNA是SERPINA1，并且其中所述SERPINA1包括E342K突变。

26.根据权利要求24所述的工程改造的多核苷酸，其中所述靶RNA是LRRK2，并且其中所述LRRK2包括G2019S突变。

27.根据权利要求1至26中任一项所述的工程改造的多核苷酸，其中所述疾病或病状包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良症或泰-萨克斯病。

28.根据权利要求1至27中任一项所述的工程改造的多核苷酸，其中所述靶向序列与所述靶RNA内的外显子近侧的剪接信号至少部分互补。

29.根据权利要求28所述的工程改造的多核苷酸，其中所述靶向序列是：

(a)与所述靶RNA内的外显子上游的分支点至少部分互补；或者

30.根据权利要求1至29中任一项所述的工程改造的多核苷酸，其中所述错配位于距所述靶向序列的任一端的约1个碱基至约200个碱基处。

31.根据权利要求1至29中任一项所述的工程改造的多核苷酸，其中所述错配位于距所述靶向序列的任一端的至少45、46、47、48、49、50、51、52、53、54或55个碱基处。

32.根据权利要求1至31中任一项所述的工程改造的多核苷酸，其进一步包括脱氨酶募集结构域。

33.根据权利要求32所述的工程改造的多核苷酸，其中所述脱氨酶募集结构域选自由以下组成的组：GluR2、Alu、这些中任一者的一部分、这些中任一者的变体及其任何组合。

34.根据权利要求32或33所述的工程改造的多核苷酸，其中所述脱氨酶募集结构域包括茎环。

35.根据权利要求34所述的工程改造的多核苷酸，其中所述茎环包括与GluR2结构域至少约80％的序列同一性。

36.根据权利要求1至35中任一项所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的3'或5'非翻译区(UTR)的至少一部分相关联。

37.根据权利要求1至35中任一项所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与翻译起始位点的至少一部分相关联。

38.根据权利要求1至35中任一项所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的内含子区域的至少一部分相关联。

39.根据权利要求1至35中任一项所述的工程改造的多核苷酸，其中所述靶向序列被配置为至少部分地与所述靶RNA的外显子区域的至少一部分相关联。

40.根据权利要求1至39中任一项所述的工程改造的多核苷酸，其中所述工程改造的多核苷酸为约80个核苷酸至约600个核苷酸。

41.一种载体，其包括或编码权利要求1至40中任一项所述的工程改造的多核苷酸。

42.根据权利要求41所述的载体，其中所述载体包括脂质体、纳米颗粒或树枝状聚合物。

43.根据权利要求41所述的载体，其中所述载体是病毒载体。

44.根据权利要求43所述的载体，其中所述病毒载体是腺相关病毒(AAV)载体。

45.根据权利要求44所述的载体，其中所述AAV载体是AAV2载体、AAV5载体、AAV8载体、AAV9载体或任何这些的杂交体。

46.一种单位剂量形式的药物组合物，其包括权利要求1至40中任一项所述的工程改造的多核苷酸、编码权利要求1至40中任一项所述的工程改造的多核苷酸的多核苷酸、或权利要求41至45中任一项所述的载体；和药学上可接受的赋形剂、稀释剂或载剂。

47.一种治疗或预防有此需要的受试者的病状的方法，其包括向所述受试者施用有效量的权利要求1至40中任一项所述的工程改造的多核苷酸、编码权利要求1至40中任一项所述的工程改造的多核苷酸的多核苷酸、或权利要求41至45中任一项所述的载体或权利要求46所述的药物组合物。

48.根据权利要求47所述的方法，其中所述病状是杜兴氏肌营养不良症(DMD)、雷特综合征、夏科-马里-图思病、阿尔茨海默病、Tau蛋白病、帕金森病、α-1抗胰蛋白酶缺乏症或斯塔加特病。

49.根据权利要求47所述的方法，其中所述病状与选自由RAB7A、ABCA4、SERPINA1、SERPINA1 E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、CFTR、ALAS1、ATP7B、ATP7B G1226R、HFEC282Y、LIPAc.894G>A、PCSK9起始位点或SCNN1A起始位点、任何这些的片段及其任何组合组成的组的基因中的突变相关联。

50.根据权利要求47至49中任一项所述的方法，其中所述施用是吸入、耳、颊、结膜、牙、子宫颈内、鼻窦内、气管内、肠内、硬膜外、羊膜外、体外、血液透析、浸润、间质、腹腔内、羊膜内、动脉内、关节内、胆管内、支气管内、囊内、心内、软骨内、尾内、海绵体内、腔内、侧脑室内、脑池内、角膜内、冠内、冠状动脉内、体内海绵体内、真皮内、椎间盘内、导管内、十二指肠内、硬膜内、表皮内、食管内、胃内、牙龈内、海马内、回肠内、病灶内、管腔内、淋巴内、髓内、脑膜内、肌内、眼内、卵巢内、心包内、腹膜内、胸膜内、前列腺内、肺内、窦内、椎管内、滑膜内、腱内、睾丸内、胸腔内、小管内、肿瘤内、鼓室内、子宫内、血管内、静脉内、静脉团注、静脉滴注、膀胱内、玻璃体内、离子电渗疗法、冲洗、喉、鼻、鼻饲、眼、口、口咽、肠胃外、经皮、关节周围、硬膜外、神经周、牙周、直肠、眼球后、蛛网膜下、结膜下、皮下、舌下、粘膜下、局部、经皮、经粘膜、经胎盘、经气管、经鼓膜、输尿管、尿道、阴道、眼眶下、实质内、鞘内、心室内、立体定向或其任何组合。递送可以包含肠胃外施用(包含静脉内、皮下、鞘内、腹膜内、肌内、血管内或输注)、口服施用、吸入施用、十二指肠内施用、直肠施用。递送可以包含对表面(如皮肤)的外表面的局部施用(如洗剂、乳膏、软膏)。在一些情况下，施用是通过实质注射、鞘内注射、心室内注射、脑池内注射、静脉内注射或鼻内施用或其任何组合。

51.根据权利要求47至50中任一项所述的方法，其中所述受试者是人。