CN116568804A - 工程化环状多核苷酸 - Google Patents
工程化环状多核苷酸 Download PDFInfo
- Publication number
- CN116568804A CN116568804A CN202180049338.4A CN202180049338A CN116568804A CN 116568804 A CN116568804 A CN 116568804A CN 202180049338 A CN202180049338 A CN 202180049338A CN 116568804 A CN116568804 A CN 116568804A
- Authority
- CN
- China
- Prior art keywords
- engineered
- polynucleotide
- nucleotides
- rna
- target rna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本文公开了工程化引导RNA、工程化多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸的载体、工程化多核苷酸的核酸、它们的药物组合物、制备所述工程化多核苷酸的方法和通过施用上述各项来治疗或预防疾病或疾患的方法。
Description
相关申请的交叉引用
根据35 U.S.C.§119,本申请要求保护2020年5月26日提交的临时申请序列号63/029,996、2020年11月11日提交的临时申请序列号63/112,488、2020年12月1日提交的临时申请序列号63/119,902和2021年4月22日提交的临时申请序列号63/178,056的优先权,这些临时申请的公开内容以引用方式并入本文。
以引用的方式并入
本说明书中提及的所有出版物、专利和专利申在此通过引用并入本文,就如每个单独的出版物、专利或专利申请被具体地和单独地指出通过引用并入的程度一样。
发明内容
本文公开了前体工程化线性多核苷酸,其包含:第一间隔子结构域;靶向结构域,该靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及第二间隔子结构域,其中第一间隔子结构域或第二间隔子结构域与靶RNA基本上不互补,其中前体工程化线性多核苷酸的转录物在前体工程化线性多核苷酸插入哺乳动物细胞中后环化,从而形成环化的工程化多核苷酸;并且其中靶向结构域与靶RNA的杂交促进RNA编辑酶对靶RNA的核苷酸的碱基的编辑。在一些实施方案中,前体工程化线性多核苷酸可以按5'至3'的顺序包含:第一间隔子结构域、靶向结构域和第二间隔子结构域。在一些实施方案中,前体工程化线性多核苷酸可以包含至第一间隔子结构域的核酶结构域5'或至第二间隔子结构域的3'。在一些实施方案中,前体工程化线性多核苷酸可以包含位于核酶结构域与第一间隔子结构域之间或位于核酶结构域与第二间隔子结构域之间的连接结构域。在一些实施方案中,在自环化后,第一间隔子结构域和第二间隔子结构域是填充序列,该填充序列可以是环化的工程化多核苷酸的总长度的约40%至约70%。在一些实施方案中,在自环化后,第一间隔子结构域和第二间隔子结构域可以是填充序列,该填充序列可以是环化的工程化多核苷酸的总序列的约50%至约67%。在一些实施方案中,相对于缺乏填充序列的在其他方面可比较的环化多核苷酸,该填充序列可以增加靶向结构域与靶RNA的杂交。在一些实施方案中,在自环化后,环化的工程化多核苷酸的总长度可以包含约150个核苷酸至约400个核苷酸。在一些实施方案中,在自环化后,环化的工程化多核苷酸的总长度可以包含约200个核苷酸至约300个核苷酸。在一些实施方案中,靶向结构域可以包含与靶RNA至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的互补性。在一些实施方案中,靶RNA可以是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。在一些实施方案中,靶向结构域可以与靶RNA的3'或5'非翻译区(UTR)基本上互补。在一些实施方案中,靶向结构域可以与靶RNA的内含子区基本上互补。在一些实施方案中,靶向结构域可以与翻译起始位点(TIS)基本上互补。在一些实施方案中,靶向结构域可以与靶RNA的上游开放阅读框(uORF)基本上互补。在一些实施方案中,靶向结构域可以包含可以与靶RNA错配的至少单个核苷酸。在一些实施方案中,相对于缺乏编辑的在其他方面可比较的靶RNA的翻译蛋白质,在翻译具有对碱基的编辑的靶RNA后,对碱基的编辑导可以增加蛋白质或其片段的水平、可以增加蛋白质或其片段的长度、可以增加蛋白质或其片段的功能性、可以增加蛋白质或其片段的稳定性、或它们的任何组合。在一些实施方案中,对碱基的编辑可以将有义密码子转化为终止密码子。在一些实施方案中,有义密码子可能与疾病致病途径有关。在一些实施方案中,将有义密码子转化为终止密码子可以减少疾病致病途径。在一些实施方案中,对碱基的编辑可以将终止密码子转化为有义密码子。在一些实施方案中,终止密码子可能与疾病致病途径有关。在一些实施方案中,将终止密码子转化为有义密码子可以减少疾病致病途径。在一些实施方案中,对碱基的编辑将第一有义密码子转化为第二有义密码子。在一些实施方案中,第一有义密码子可能与疾病致病途径有关。在一些实施方案中,将第一有义密码子转化为第二有义密码子可以减少疾病致病途径。在一些实施方案中,靶向结构域可以为约20个核苷酸至约150个核苷酸;或约100个核苷酸至约200个核苷酸。在一些实施方案中,RNA编辑酶可以包含ADAR蛋白或APOBEC蛋白。在一些实施方案中,RNA编辑酶可以包含ADAR并且ADAR可以是ADAR1。在一些实施方案中,RNA编辑酶可以包含ADAR并且ADAR可以是ADAR2。在一些实施方案中,RNA编辑酶可以包含ADAR并且ADAR可以是ADAR3。在一些实施方案中,靶向结构域可以不包含适体。在一些实施方案中,疾病或疾患可以包括雷特综合征(Rett syndrome)、亨廷顿病(Huntington's disease)、帕金森病(Parkinson’s Disease)、阿尔茨海默病(Alzheimer’s disease)、肌营养不良、泰-萨克斯病(Tay-Sachs Disease)、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病(Stargardt disease)、髓鞘形成不足伴基底神经节和小脑萎缩(H-ABC)或囊性纤维化。在一些实施方案中,靶RNA可以包含TUBB4A,并且TUBB4A可以包含D249N突变。在一些实施方案中,靶向结构域可以包含与SEQ ID NO:32、SEQ ID NO:33或SEQ ID NO:34至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶RNA可以包含LRRK2,并且LRRK2可以包含G2019S突变。在一些实施方案中,靶向结构域可以包含与SEQ ID NO:39、SEQ ID NO:53或SEQ ID NO:54至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶RNA可以包含SERPINA1,并且SERPINA1可以包含E342K突变。在一些实施方案中,靶向结构域可以包含与SEQ ID NO:64或SEQ ID NO:65至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶RNA可以包含SNCA。在一些实施方案中,靶向结构域可以包含与SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶向结构域可以被设计成靶向翻译起始位点(TIS)。在一些实施方案中,靶RNA可以包含APP。在一些实施方案中,靶向结构域可以包含与SEQ IDNO:61、SEQ ID NO:62或SEQ ID NO:63至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶RNA可以包含ABCA4。在一些实施方案中,靶向结构域可以包含与SEQ IDNO:58、SEQ ID NO:59或SEQ ID NO:60至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。在一些实施方案中,靶RNA可以包含DMD。在一些实施方案中,靶向结构域可以包含与SEQ ID NO:56或SEQ ID NO:57至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
本文还公开了前体工程化多核苷酸,其按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;靶向结构域,该靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;第二连接结构域;以及第二核酶结构域。在一些实施方案中,第一间隔子结构域可以与靶RNA基本上不互补。在一些实施方案中,前体工程化线性多核苷酸的转录物可以在前体工程化线性多核苷酸插入哺乳动物细胞中后环化,从而形成环化的工程化多核苷酸。在一些实施方案中,靶向结构域与靶RNA的杂交可以促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
本文还公开了工程化环状多核苷酸,其包含:靶向结构域,该靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及间隔子结构域,该间隔子结构域与靶RNA基本上不互补,其中该间隔子结构域通过增加一个或多个核苷酸来扩大工程化环状多核苷酸,其中靶向结构域与靶RNA的杂交促进RNA编辑酶对靶RNA的核苷酸的碱基的编辑。在一些实施方案中,RNA编辑实体对靶RNA的核苷酸的碱基的编辑可以在体外测定中确定,该体外测定包括:(i)将靶RNA直接或间接引入到原代细胞系中,(ii)将工程化多核苷酸直接或间接引入到原代细胞系中,以及(iii)对靶RNA进行测序。在一些实施方案中,工程化环状多核苷酸可以不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些实施方案中,工程化环状多核苷酸还可以包含RNA编辑酶募集结构域。在一些实施方案中,RNA编辑酶募集结构域可以募集RNA编辑酶,该RNA编辑酶在与工程化多核苷酸缔合时可以对靶RNA中的核苷酸的碱基进行化学转化。在一些实施方案中,靶向结构域可以为约20个核苷酸至约150个核苷酸。在一些实施方案中,靶RNA可以包含无义突变。在一些实施方案中,靶向结构域可以包含可以与靶RNA错配的至少单个核苷酸。在一些实施方案中,疾病或疾患可以包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病、髓鞘形成不足伴基底神经节和小脑萎缩(H-ABC)或囊性纤维化。
本文还公开了包含本文公开的前体工程化线性多核苷酸或本文公开的工程化环状多核苷酸的载体。在一些实施方案中,载体可以包含腺相关病毒(AAV)载体。在一些实施方案中,AAV载体可以是AAV1载体、AAV2载体、AAV3载体、AAV4载体、AAV5载体、AAV6载体、AAV7载体、AAV8载体、AAV9载体、这些中的任一种的嵌合体或这些中的任一种的变体。在一些实施方案中,病毒载体可以是自身互补的腺相关病毒(scAAV)载体。在一些实施方案中,病毒载体可以是单链AAV载体。
本文还公开了单位剂型的药物组合物,其包含本文公开的前体工程化线性多核苷酸、本文公开的工程化环状多核苷酸或本文公开的载体;以及药学上可接受的赋形剂、稀释剂或载剂。
本文还公开了治疗或预防有需要的受试者中的疾病或疾患的方法,其包括:施用治疗有效量的:本文公开的前体工程化线性多核苷酸,本文公开的工程化的环状多核苷酸,本文公开的载体或本文公开的药物组合物。
附图说明
本发明的新型特征在所附权利要求中具体阐述。通过参考以下阐述说明性实施方案的详细描述和附图将获得对本发明的特征和优点的更好理解,在这些说明性实施方案中利用了本发明的原理,在附图中:
图1A是在293T(人胚胎肾)、RD(人胚胎横纹肌肉瘤)未分化细胞、LHCN(人骨骼肌成肌细胞)未分化细胞和LHCN分化细胞中的引导RNA设计1(线性引导)、设计2(线性引导)和设计3(环状引导)转染后48小时,如通过Sanger测序所测量的,RNA编辑百分比的条形图。对照示出为“无转染”。图1B是在293T(人胚胎肾)、RD(人胚胎横纹肌肉瘤)未分化细胞、LHCN(人骨骼肌成肌细胞)未分化细胞和LHCN分化细胞中的引导RNA设计1(线性引导)、设计2(线性引导)和设计3(环状引导)转染后96小时,如通过Sanger测序所测量的,RNA编辑百分比的条形图。对照示出为“无转染”。
图2是工程化引导RNA的示例性示意图。引导RNA包含2个核酶结构域、2个连接序列结构域、2个间隔子结构域和靶向结构域“100.50”。
图3A是确认工程化引导RNA的环化的示例性基于RT-PCR的策略。图3B示出了逆转录酶(RT)-PCR产物的凝胶电泳图像。结果显示工程化引导RNA设计5和设计3的环化的确认。
图4示出了来自设计3(环状引导)的RAB7A 3'UTR和对照GFP质粒中不同腺苷核苷酸的RNA编辑百分比的条形图。RNA编辑可以发生在靶RNA上的几个腺苷上。
图5示出了与环状引导RNA设计5和设计3相比,来自线性引导RNA设计1和设计4的RAB7A 3'UTR中核苷酸的RNA编辑百分比的条形图。与细胞中的线性引导RNA相比,环状引导RNA随时间的推移具有增加的RNA编辑。
图6A是使用线性引导RNA(引导1-7)和环状引导RNA(引导8、引导9和Rab7)在40和72小时后3'UTRα突触核蛋白(SNCA)mRNA(右图)的编辑百分比的图解示意图。图6B是线性引导RNA(引导1-7)和环状引导RNA(引导8、引导9和Rab7)转染后40和72小时后如通过qPCR所测量的与对照相比的SNCA mRNA的敲低百分比的图解示意图。环状和线性引导RNA均可以通过靶向3'UTR来编辑和敲低α突触核蛋白(SNCA)RNA。
图7示出了作为成功转导环状和线性引导RNA载体的读数的GFP阳性细胞百分比的条形图。
图8示出了通过环状和线性工程化引导的RNA编辑百分比的条形图。环状工程化引导设计持续编辑至少72小时。
图9示出了琼脂糖凝胶和来自设计用于检测引导RNA环化的PCR测定的PCR产物。在转导后24小时、48小时和72小时检测环状引导RNA。
图10示出了用反向剪接制备环化引导RNA的方法的示意图。
图11A示出了用包裹GFP(对照)或Rab7引导(Rab7U6线性、Rab7 U7 smOPT线性或Rab7 U6环状)的AAV2/2病毒体转导后神经细胞中通过ddPCR确定的Rab7编辑百分比的图。图11B示出了用包裹GFP(对照)或Rab7引导(Rab7U6线性、Rab7 U7 smOPT线性或Rab7 U6环状)的AAV2/2病毒体转导后神经细胞中通过Sanger测序确定的Rab7编辑百分比的图。图11C示出了用包裹GFP的AAV2/2病毒体(对照)或Rab7引导(Rab7U6线性、Rab7 U7 smOPT线性或Rab7 U6环状)转导后成熟神经细胞中通过ddPCR确定的Rab7编辑百分比的图。
图12A示出了神经细胞中通过Rab7 U6环状引导的Rab7编辑百分比和基于用于转导细胞的病毒滴度的转导百分比的图。图12B示出了通过RAB7 U6环状引导的Rab7编辑百分比和基于病毒滴度和神经细胞分化天数的转导百分比的图。
图13A示出了用包裹GFP的AAV2/2病毒体(对照)或Rab7引导(U6线性、U7 smOPT线性)以不同病毒滴度转导后神经细胞中通过ddPCR确定的Rab7编辑百分比的图。图13B示出了用包裹GFP的AAV2/2病毒体(对照)或Rab7引导(U6线性、U7 smOPT线性)以不同病毒滴度转导后神经细胞中通过Sanger测序确定的Rab7编辑百分比图。图13C示出了用包裹GFP的AAV2/2病毒体(对照)或Rab7引导(U6线性、U7 smOPT线性)以不同病毒滴度转导后神经细胞中通过ddPCR确定的Rab7编辑百分比的图。
图14A示出了在神经细胞中通过U7 smOPT环状引导的Rab7编辑百分比和基于用于转导细胞的病毒滴度的转导百分比的图。图14B示出了通过U7 smOPT环状引导的Rab7编辑百分比和基于病毒滴度和神经细胞分化天数的转导百分比的图。
图15示出了GFP对照、未感染细胞、U6环状引导和U7smOPT线性引导的脱靶编辑概况。
图16示出了piggyBAC TUBB4A D249N小基因的图和实验设计的概述。
图17在左侧示出了具有环状引导(0_100_50_环状)和线性引导(0_20_6,0_100_50)的TUBB4A D249N的编辑百分比的图,并且在右侧示出了具有PCR产物以确认环形引导的存在的琼脂糖凝胶。
图18示出了具有线性控制引导(设计A)的RAB7和具有不同间隔子序列长度的环状引导(设计B、设计C、设计D和设计E)的RNA编辑百分比。
图19左侧示出了LRRK2的中靶和脱靶ADAR1和ADAR1+AD AR2编辑的图,并且描绘了在实验中使用的环状LRRK2引导(0.100.80)。
图20示出了用于靶SNCA的Exb75环状引导的脱靶编辑概况的图和引导的描述。
图21示出了用于靶SNCA的Exb76环状引导的脱靶编辑概况的图和引导的描述。
图22示出了用于靶SNCA的Exb77环状引导的脱靶编辑概况的图和引导的描述。
图23示出了用于靶SNCA的Exb78环状引导的脱靶编辑概况的图和引导的描述。
图24示出了用于靶SNCA的Exb79环状引导的脱靶编辑概况的图和引导的描述。
图25示出了含有3'SmOPT序列和U7发夹的引导RNA可以被环化并由U7或U6启动子表达以产生ADAR编辑。图25A示出了具有或不具有侧接RtcB环状核酶位点(橙色)的3'SmOPTU7发夹(青色)的100nt引导RNA(紫色)。用引导特异性引物(黑色)的Sanger测序显示核酶位点已经成功地连接在一起,引导RNA和3'SmOPT U7发夹存在于环状RNA中。图25B比较了使用mU7或hU6启动子、不同的Sm结合结构域和U7发夹以及U7发夹与P1环状核酶之间的各种长度接头的SmOPT U7环状引导RNA的不同变体(上图)。如上所述,具有3'SmOPT序列和U7发夹的线性100nt引导RNA可以引起ADAR RNA编辑所有六个基因靶标:人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体(中间图)。具有3'SmOPT序列和U7发夹的100nt引导RNA的环状变体也可以产生大量编辑,无论是由mU7还是hU6启动子表达。靶转录物敲低或无意的外显子跳读的副作用最小(下图)。
图26示出了由AAV2载体递送和在不存在AAV2载体的情况下递送的Rab7靶向环状引导对细胞的RNA编辑百分比的图。
图27示出了在不同感染复数下由AAV2载体递送和在不存在AAV2载体的情况下递送的Rab7靶向环状引导在不同细胞类型中的RNA编辑百分比的图。
图28示出了在感染后48小时AAV2递送的靶向HepG2细胞中RAB7A的环状引导RNA。
图29在左侧示出了不同大小的各种环状引导RNA的RAB7A3'UTR编辑百分比的条形图,并且其中整个环状框架的不同百分比是引导RNA。右侧是环状引导RNA PCR产物的凝胶。
图30示出了用线性和环状引导RNA编辑的LRRK2。
具体实施方式
综述
RNA编辑可以提供改变遗传信息的治疗机会。RNA编辑空间中的一个主要障碍可能是低效编辑。提高RNA编辑效率的方法可以包括增加引导RNA(gRNA)或工程化多核苷酸的合成、稳定性、靶向效率或定位。可以对工程化多核苷酸进行修饰以提高RNA编辑效率。
在一些实施方案中,工程化引导RNA(gRNA)和工程化多核苷酸可以在本文中公开并且可以包含靶向结构域和间隔子结构域。这种工程化多核苷酸可以提高靶RNA相对于RNA编辑实体的编辑效率。
在一些实施方案中,前体工程化引导多核苷酸可以在本文中公开。前体工程化多核苷酸或前体工程化线性多核苷酸可用于产生如本文所述的工程化引导RNA或工程化引导多核苷酸。
在一些实施方案中,载体可以在本文中公开并且可以包含工程化多核苷酸、工程化引导RNA或前体工程化引导RNA。
在一些实施方案中,核酸可以在本文中公开并且可以包含工程化多核苷酸、工程化引导RNA或前体工程化引导RNA。
在一些实施方案中,药物组合物可以在本文中公开并且可以包含工程化多核苷酸、工程化引导RNA、前体工程化引导RNA、载体或核酸;以及药学上可接受的赋形剂、稀释剂或载剂。
在一些实施方案中,试剂盒可以在本文中公开并且可以包括包含工程化多核苷酸、工程化引导RNA、前体工程化引导RNA、载剂、核酸、药物组合物;以及容器。
在一些实施方案中,治疗有需要的受试者的疾病或疾患或预防有需要的受试者的疾病或疾患的方法可以在本文中公开。这种方法可以包括向受试者施用工程化多核苷酸、前体工程化多核苷酸、前体工程化线性多核苷酸、载体、核酸或药物组合物。
在一些实施方案中,形成工程化多核苷酸的方法可以在本文中公开。这种方法可以包括用连接实体将前体工程化线性多核苷酸的3'端上的第一核苷酸直接或间接连接至前体工程化线性多核苷酸的5'端上的第二核苷酸,从而形成工程化多核苷酸。
本文使用的章节标题可以用于组织目的,并且不应被解释为限制所描述的主题。在一些情况下,章节标题可以不被构造为限制所描述的主题。
如在说明书和权利要求书中所使用的,单数形式“一个”、“一种”和“该/所述”包括复数引用,除非上下文另外清楚地指明。例如,术语“多肽”包括多种多肽,包括它们的混合物。
如本文所用,术语“约”或“大约”在指可测量的值诸如量或浓度等时,在一些情况下,可以意指涵盖指定量的约20%、10%、5%、1%、0.5%或甚至0.1%的变化。在一些情况下,如本文所用,术语“约”或“大约”在指可测量的值诸如量或浓度等时,意指涵盖指定量的20%、10%、5%、1%、0.5%或甚至0.1%的变化。例如,根据本领域的实践,“约”可以意指加或减10%。替代性地,“约”可以意指给定值的加或减20%、加或减10%、加或减5%或加或减1%的范围。替代性地,特别是关于生物系统或方法,该术语可以意指值的数量级内、5倍内或2倍内。在本申请和权利要求中可以描述特定值的情况下,除非另有说明,否则应假定术语“约”意指在特定值的可接受误差范围内。此外,在可以提供值的范围、子范围或两者的情况下,范围或子范围可以包括范围或子范围的端点。当描述量值、位置或两者时,可以使用术语“基本上”、“基本上没有”、“基本上不含”和“大约”来指示所描述的值可以在值的合理预期范围内。例如,数值可具有这样的值,该值可为所述值(或值的范围)的+/-0.1%、所述值(或值的范围)的+/-1%、所述值(或值的范围)的+/-2%、所述值(或值的范围)的+/-5%、所述值(或值的范围)的+/-10%等。本文所述的任何数值范围可以旨在包括其中包含的所有子范围。
如本文所用,术语“包括”可以旨在表示组合物和方法包括所述要素,但不排除其他要素。“基本上由……组成”在用于定义组合物和方法时将意味着排除对于针对预定用途的组合具有任何重要意义的其他要素。因此,基本由本文定义的要素构成的组合物应当不排除来自分离和纯化方法的痕量杂质和药物上可接受的载剂,如磷酸盐缓冲盐水、防腐剂等等。“由……组成”意味着排除对于施用本公开组合物的其他超过微量成分的元素,及实质性的方法步骤。由这些过渡术语各自定义的实施方案在本发明的范围内。
术语“受试者”、“宿主”、“个体”和“患者”在本文中可以互换使用以指代动物,通常是哺乳动物。在一些情况下,受试者或宿主可以包括原核生物。在一些情况下,本文所述的工程化多核苷酸或前体工程化多核苷酸可以施用于原核生物。例如,对原核生物的施用可以包括通过噬菌体或通过多核苷酸的电穿孔施用工程化多核苷酸或前体工程化多核苷酸。可以通过本文所述的方法、细胞或组合物治疗任何合适的哺乳动物。可以向哺乳动物施用载体、工程化引导RNA、前体引导RNA、工程化多核苷酸、核酸或药物组合物,如本文所述。哺乳动物的非限制性示例包括人、非人灵长类动物(例如,猿、长臂猿、黑猩猩、猩猩、猴子、猕猴等)、家畜(例如,狗和猫)、农场动物(例如,马、牛、山羊、绵羊、猪)和实验动物(例如小鼠、大鼠、兔、豚鼠)。在一些实施方案中,哺乳动物可以是人。哺乳动物可以是任何年龄或者处于任何发育阶段(例如,成人、青少年、儿童、婴儿或子宫内哺乳动物)。哺乳动物可以是雄性或雌性。哺乳动物可以是怀孕的雌性。在一些实施方案中,受试者可以是人。在一些实施方案中,受试者患有或可能疑似患有疾病诸如神经退行性疾病。在一些实施方案中,受试者患有或可能疑似患有癌症或肿瘤性病症。在其他实施方案中,受试者患有或可能疑似患有与异常蛋白质表达相关的疾病或病症。在一些情况下,人可以大于约:1天至约10个月、约9个月至约24个月、约1岁至约8岁、约5岁至约25岁、约20岁至约50岁、约1岁至约130岁或约30岁至约100岁。人可以大于约:1、2、5、10、20、30、40、50、60、70、80、90、100、110或120岁。人可以小于约:1、2、5、10、20、30、40、50、60、70、80、90、100、110、120或130岁。
术语“治疗”在本文中可用于意指获得所需的药理效果、生理效果或它们的任何组合。在一些情况下,治疗可以逆转可归因于疾病或病症的副作用。在一些情况下,治疗可以稳定疾病或病症。在一些情况下,治疗可以延迟疾病或病症的进展。在一些情况下,治疗可以引起疾病或病症的消退。在一些情况下,治疗可以预防疾病或病症的发生。在一些实施方案中,可以测量治疗效果。在一些情况下,可以在施用组合物之前和之后比较测量值。例如,与治疗后的图像相比,受试者可以具有治疗前的医学图像以显示癌症消退。在一些情况下,与治疗前的血液检查相比,受试者在治疗后的血液检查结果可能有所改善。在一些情况下,可以将测量值与标准值进行比较。
如本文所用,术语“样品”通常可以指受试者的任何样品(例如血液样品或组织样品)。样品或其部分可以包含细胞,诸如干细胞。在一些情况下,样品的一部分可以富集细胞,诸如癌细胞。样品可以包括组织、细胞、血清、血浆、外来体、体液或它们的任何组合。体液可以包括尿液、血液、血清、血浆、唾液、粘液、脊髓液、泪液、精液、胆汁、羊水或它们的任何组合。样品或其部分可以包括从受试者获得的细胞外液。样品或其部分可以包含无细胞核酸、DNA或RNA。可以分析样品或其部分的存在或不存在或一个或多个突变。可以从样品或其部分获得基因组数据。样品可以是怀疑或确认患有疾病或疾患的样品。样品可以是通过非创伤性技术、微创技术或创伤性技术从受试者取出的样品。样品或其部分可以通过组织刷洗、拭子、组织活检、切除组织、细针抽吸、组织洗涤、细胞学样本、手术切除或它们的任何组合获得。样品或其部分可以包含来自组织类型的组织或细胞。例如,样品可以包含鼻组织、气管组织、肺组织、咽组织、喉组织、支气管组织、胸膜组织、肺泡组织、乳腺组织、膀胱组织、肾组织、肝组织、结肠组织、甲状腺组织、宫颈组织、前列腺组织、心脏组织、肌肉组织、胰腺组织、肛门组织、胆管组织、骨组织、脑组织、脊柱组织、肾组织、子宫组织、卵巢组织、子宫内膜组织、阴道组织、外阴组织、子宫组织、胃组织、眼组织、窦组织、阴茎组织、唾液腺组织、肠组织、胆囊组织、胃肠组织、膀胱组织、脑组织、脊柱组织、血液样品或它们的任何组合。
“真核细胞”包括除原核生物界之外的所有生命界。它们可以容易地通过膜结合的细胞核来区分。动物、植物、真菌和原生生物可以是真核生物或生物体,其细胞可以通过内膜和细胞骨架组织成复杂结构。特征性的膜结合结构可以是细胞核。术语“宿主”可以包括真核宿主,包括例如酵母、高等植物、昆虫和哺乳动物细胞。真核细胞或宿主的非限制性示例包括猿、牛、猪、鼠、大鼠、鸟类、爬行动物和人。
术语“蛋白质”、“肽”和“多肽”可以互换使用并且在其最广义的意义上是指两个或更多个亚基氨基酸、氨基酸类似物或肽模拟物的化合物。亚基可通过肽键连接。在另一个实施方案中,亚基可以通过其他键连接,例如酯、醚等。蛋白质或肽可以含有至少两个氨基酸,并且可以对可能构成蛋白质序列或肽序列的氨基酸的最大数目没有限制。如本文所用,术语“氨基酸”可以指天然的、非天然的或合成的氨基酸。天然的、非天然的或合成的氨基酸可以包括甘氨酸以及D和L旋光异构体、氨基酸类似物和肽模拟物。如本文所用,术语“融合蛋白”可以指由来自多于一种天然存在或重组产生的蛋白质的结构域组成的蛋白质,其中通常每个结构域发挥不同的功能。在这方面,接头可以指可用于将这些结构域连接在一起的蛋白质片段,任选地用于保持融合蛋白质结构域的构象和/或防止可能损害它们各自的功能的融合蛋白质结构域之间的不利相互作用。
“同源性”或“同一性”或“相似性”可以指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比较每个序列中的位置来确定,该位置可以为了比较而进行比对。当比较序列中的位置可以被相同的碱基或氨基酸占据时,则分子在该位置可以是同源的。序列之间的同源性程度可以是序列共享的匹配或同源位置的数量的函数。“无关”或“非同源”序列与本公开的序列之一共享小于40%的同一性,或替代性地小于25%的同一性。序列同源性可以指序列与参考序列的同一性%。实际上,任何特定序列是否可以与本文所述的任何序列(其可以对应于本文所述的特定核酸序列)至少50%、60%、70%、80%、85%、90%、92%、95%、96%、97%、98%或99%同一,这种特定多肽序列可以常规地使用已知的计算机程序诸如Bestfit程序(Wisconsin Sequence Analysis Package,Unix第8版,Genetics Computer Group,University Research Park,575Science Drive,Madison,Wis.53711)来确定。当使用Bestfit或任何其他序列比对程序来确定特定序列是否与参考序列例如95%相同时,可以设置参数,使得可以在参考序列的全长上计算同一性百分比,并且可以允许高达总参考序列的5%的序列同源性的空位。
在一些情况下,参考序列(查询序列,例如,本公开的序列)与主题序列之间的同一性(也称为全局序列比对)可以使用基于Brutlag等人(Comp.App.Biosci.6:237-245(1990))的算法的FASTDB计算机程序来确定。在一些实施方案中,在FASTDB氨基酸比对中使用的同一性可以被狭义解释的特定实施方案的参数可以包括:评分方案=PAM(接受突变的百分比)0,k-元组=2,错配罚分=1,连接罚分=20,随机化组长度=0,截止值评分=1,窗口大小=序列长度,空位罚分=5,空位大小罚分=0.05,窗口大小=500或主题序列的长度,以较短者为准。根据该实施方案,如果主题序列可能由于N端或C端缺失而不是由于内部缺失而比查询序列短,则可以对结果进行手动校正,以在计算全局同一性百分比时考虑FASTDB程序没有考虑主题序列的N端和C端截短的事实。对于在N端和C端截短的主题序列,相对于查询序列,可以通过计算查询序列的残基数目来校正,这些残基可能位于主题序列的N端和C端(其可能不与相应的主题残基匹配/比对)的侧面,作为查询序列总碱基的百分比。残基是否可以匹配/比对的确定可以通过FASTDB序列比对的结果来确定。然后可以从由FASTDB程序使用指定参数计算的同一性百分比中减去该百分比,以获得最终的同一性百分比评分。该最终同一性百分比评分可用于该实施方案的目的。在一些情况下,出于手动调整同一性百分比评分的目的,仅考虑主题序列的N端和C端的残基(其可能不与查询序列匹配/比对)。也就是说,只有在主题序列的最远N端和C端残基之外的查询残基位置可以被考虑用于该手动校正。例如,可以将90个残基的主题序列与100个残基的查询序列进行比对以确定同一性百分比。缺失发生在主题序列的N端,因此,FASTDB比对没有显示N端前10个残基的匹配/比对。10个未配对的残基代表序列的10%(在N端和C端不匹配的残基数目/在查询序列中的残基总数),因此可以从由FASTDB程序计算的同一性百分比评分中减去10%。如果剩余的90个残基完全匹配,则最终的同一性百分比可以是90%。在另一个实例中,可以将90个残基的主题序列与100个残基的查询序列进行比较。这次缺失可以是内部缺失,因此在主题序列的N端或C端可以没有与查询不匹配/比对的残基。在这种情况下,由FASTDB计算的同一性百分比不能手动校正。再一次地,如在FASTDB比对中所显示的,仅在主题序列的N端和C端之外的残基位置(其可能与查询序列不匹配/比对)可以手动校正。
术语“多核苷酸”和“寡核苷酸”可以互换使用,并且是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸或它们的类似物)的聚合形式。多核苷酸可以具有任何三维结构并且可以执行任何已知或未知的功能。以下可以是多核苷酸的非限制性示例:基因或基因片段(例如,探针、引物、EST或SAGE标签)、外显子、内含子、基因间DNA(包括但不限于异染色质DNA)、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、序列的分离DNA、序列的分离RNA、sgRNA、引导RNA、核酸探针、引物、snRNA、长非编码RNA、snoRNA、siRNA、miRNA、tRNA来源的小RNA(tsRNA)、反义RNA、小RNA、shRNA或小rDNA来源的RNA(srRNA)。多核苷酸可以包含修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。如果存在,可以在多核苷酸组装之前或之后对核苷酸结构进行修饰。核苷酸序列可以被非核苷酸组分中断。多核苷酸可以在聚合后进一步修饰,诸如通过与标记组分缀合。该术语还可以指双链和单链分子。核酸,包括例如具有硫代磷酸酯主链的核酸,可以包括一个或多个反应性部分。如本文所用,术语反应性部分可以包括能够通过共价、非共价或其他相互作用与另一分子(例如,核酸或多肽)反应的任何基团。例如,核酸可以包括可以通过共价、非共价或其他相互作用与蛋白质或多肽上的氨基酸反应的氨基酸反应性部分。除非另有说明或要求,本公开的可以是多核苷酸的任何实施方案包括双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。
可用于本公开的方法的多核苷酸可以包含天然核酸序列及其变体、人工核酸序列或此类序列的组合。
多核苷酸可以由四个核苷酸碱基的特定序列组成:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);胸腺嘧啶(T);当多核苷酸可以是RNA时,尿嘧啶(U)取代胸腺嘧啶。本文提供的任何DNA序列也指其中胸腺嘧啶取代尿嘧啶的RNA序列。本文提供的任何RNA序列也指其中尿嘧啶取代胸腺嘧啶的DNA序列。在一些实施方案中,多核苷酸可以包含一个或多个其他核苷酸碱基,诸如肌苷(I),当次黄嘌呤可以经由β-N9-糖苷键连接至呋喃核糖时形成的核苷,产生以下化学结构:
肌苷可以被翻译机器读取为鸟嘌呤(G)。
术语“多核苷酸序列”可以是多核苷酸分子的字母表示。该字母表示可以输入到具有中央处理单元的计算机中的数据库中,并用于生物信息学应用,诸如功能基因组学和同源性检索。
如本文所用,“表达”可以指多核苷酸可转录成mRNA的过程和/或转录的mRNA可随后翻译成肽、多肽或蛋白质的过程。如果多核苷酸可以来源于基因组DNA,则表达可以包括真核细胞中mRNA的剪接。
如本文所用,术语“测序”可以包括毛细管测序、无亚硫酸氢盐测序、亚硫酸氢盐测序、TET辅助亚硫酸氢盐(TAB)测序、ACE测序、高通量测序、Maxam-Gilbert测序、大规模平行签名测序、Polony测序、454焦磷酸测序、Sanger测序、Illumina测序、SOLiD测序、IonTorrent半导体测序、DNA纳米球测序、Heliscope单分子测序、单分子实时(SMRT)测序、纳米孔测序、鸟枪法测序、RNA测序、Enigma测序或它们的任何组合。
术语“等同物”或“生物等同物”在涉及特定分子、生物或细胞物质时可以互换使用,并且意指具有最小同源性同时仍保持所需结构或功能的那些。
可以应用于多核苷酸的术语“编码”可以指这样的多核苷酸,如果在其天然状态下或当通过本领域技术人员熟知的方法操作时,其可以被转录、翻译或转录和翻译以产生多肽或其片段的mRNA,则其可以被称为“编码”多肽。反义链可以是这种核酸的互补链,并且可以从中推导出编码序列。
如本文所用,术语“功能性”可用于修饰任何分子、生物或细胞物质,以意指其实现特定的、具体的效果。
术语“有效量”可以指足以实现所需效果的量。在治疗或预防应用的情况下,有效量可以取决于所讨论的疾患的类型和严重程度以及个体受试者的特征,诸如总体健康状况、年龄、性别、体重和对药物组合物的耐受性。在免疫原性组合物的情况下,在一些实施方案中,有效量可以是足以产生针对病原体的保护性反应的量。在其他实施方案中,免疫原性组合物的有效量可以是足以产生针对抗原的抗体的量。在一些实施方案中,有效量可以是赋予有需要的受试者被动免疫所需的量。关于免疫原性组合物,在一些实施方案中,除上述因素之外,有效量将取决于预期用途、特定抗原化合物的免疫原性程度和受试者免疫系统的健康状况/响应性。在一些情况下,技术人员将能够根据这些和其他因素确定合适的量。
在体外应用的情况下,在一些实施方案中,有效量将取决于所讨论的应用的大小和性质。它还取决于体外靶标的性质和敏感性以及使用的方法。在一些情况下,技术人员将能够基于这些和其他考虑来确定有效量。根据实施方案,有效量可以包括一次或多次施用组合物。
如本文所用,与蛋白质表达相关的术语“恢复”可以指建立全长蛋白质表达的能力,其中先前的蛋白质表达由于突变而被截短。
如本文所用,术语“突变”可以指编码蛋白质的核酸序列相对于所述蛋白质的共有序列的改变。“错义”突变可导致一个密码子被另一个密码子取代;“无义”突变可以将密码子从编码特定氨基酸的密码子改变为终止密码子。无义突变通常可导致蛋白质的翻译被截短。“沉默”突变可以是对所得蛋白质没有影响的突变。如本文所用,术语“点突变”可以指只影响基因序列中的一个核苷酸的突变。“剪接位点突变”可以是前mRNA中存在的那些突变(在加工以去除内含子之前),其导致错误翻译,并且常常由于剪接位点的不正确描绘而截短蛋白质。突变可以包括单核苷酸变异(SNV)。突变可以包括序列变体、序列变异、序列改变或等位基因变体。参考DNA序列可以从参考数据库中获得。突变可能影响功能。突变可能不会影响功能。突变可以在一个或多个核苷酸的DNA水平、一个或多个核苷酸的核糖核酸(RNA)水平、一个或多个氨基酸的蛋白质水平或它们的任何组合中发生。参考序列可以从数据库(诸如NCBI参考序列数据库(RefSeq)数据库)中获得。可以构成突变的特定变化可以包括在一个或多个核苷酸或一个或多个氨基酸中的取代、缺失、插入、倒位或转换。突变可以是点突变。突变可以是融合基因。融合对或融合基因可以由突变产生,诸如易位、间质缺失、染色体倒位或它们的任何组合。突变可以构成重复序列数目的可变性,诸如三倍、四倍或其他。例如,突变可以是与给定序列相关的拷贝数的增加或减少(例如,拷贝数变化或CNV)。突变可以包括不同等位基因中的两个或更多个序列改变或一个等位基因中的两个或更多个序列改变。突变可以包括在一个等位基因中的一个位置处的两个不同核苷酸,诸如嵌合体(mosaic)。突变可以包括在一个等位基因中的一个位置处的两个不同核苷酸,诸如嵌合体(chimeric)。突变可以存在于恶性组织中。突变的存在或不存在可能指示发展疾病或疾患的风险增加。突变的存在或不存在可以指示疾病或疾患的存在。突变可以存在于良性组织中。没有突变可能指示组织或样品可能是良性的。替代性地,没有突变可能并不指示组织或样品可能是良性的。如本文所述的方法可以包括鉴定样品中突变的存在。
“信使RNA”或“mRNA”可以是这样的核酸分子,其可以从DNA转录,然后加工以除去称为内含子的非编码部分。所得mRNA可以从细胞核(或可以存在DNA的另一基因座)输出并翻译成蛋白质。术语“前mRNA”可以指在加工以除去非编码部分之前的链。
“规范氨基酸”是指如下表1中所示的在人体中天然存在的20种氨基酸,它们各自具有三个字母缩写、一个字母缩写、结构和相应的密码子:
表1:典型氨基酸
/>
/>
术语“非规范氨基酸”可以指不属于该组的那些合成的或以其他方式修饰的氨基酸,通常通过化学合成或修饰规范氨基酸(例如,氨基酸类似物)产生。本公开在本文公开的一些方法和载体中使用蛋白质原性非规范氨基酸。非限制性示例性非规范氨基酸可以是吡咯赖氨酸(Pyl或O),其化学结构提供如下:
肌苷(I)可以是另一种示例性的非规范氨基酸,其通常存在于tRNA中,并且可以是根据“摆动碱基配对”进行正确翻译所必不可少的。上面提供了肌苷的结构。
如本文所用,术语“ADAR”可以指能够将RNA序列中的腺苷(A)转化为肌苷(I)的腺苷脱氨酶。ADAR1和ADAR2可以是可在体内参与mRNA编辑的ADAR的两种示例性酶。ADAR1的非限制性示例性序列可以在以下参考编号下找到:HGNC:225;Entrez Gene:103;Ensembl:ENSG 00000160710;OMIM:146920;UniProtKB:P55265;以及GeneCards:GC01M154554,以及它们的生物等同物。ADAR2的非限制性示例性序列可以在以下参考编号下找到:HGN C:226;Entrez Gene:104;Ensembl:ENSG00000197381;OMI M:601218:UniProtKB:P78563;以及GeneCards:GC21P045073,以及它们的生物等同物。
如本文所用,术语“缺乏”可以指低于特定药剂的正常(生理上可接受的)水平。在蛋白质的情况下,缺乏可以指低于正常水平的全长蛋白质。
术语“互补的”或“互补性”可以指核酸通过传统Watson-Crick或其他非传统类型与另一个核酸序列形成氢键的能力。例如,序列A-G-T可以与序列T-C-A互补。互补性百分比表示核酸分子中可以与第二核酸序列形成氢键(例如,Watson-Crick碱基配对)的残基的百分比(例如,10个中的5个、6个、7个、8个、9个、10个分别为50%、60%、70%、80%、90%和100%互补)。“完全互补”可以意指核酸序列的所有连续残基将与第二核酸序列中相同数目的连续残基氢键结合。如本文所用,“基本上互补”可以指在10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸的区域上可以是至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补性程度,或者可以指在严格条件(例如,严格的杂交条件)下杂交的两种核酸。在一些实施方案中,杂交可以指单链核酸与至少部分互补的单链核酸退火以形成双链核酸。在一些情况下,杂交可以包括核酸与互补核酸的结合。例如,两个RNA序列的杂交可以形成双链双链体(例如dsRNA)。核酸可以包括非特异性序列。如本文所用,术语“非特异性序列”或“非特异性”可以指含有一系列残基的核酸序列,这些残基可以被设计成不与任何其他核酸序列互补或仅部分与任何其他核酸序列互补。
如本文所用,术语“鸟氨酸氨甲酰基转移酶”或“OTC”可以指与该名称相对应并由基因Otc编码的蛋白质;其非限制性示例可见于UniProt参考号P00480(对于人)和P11725(对于小鼠)。OTC缺乏症可能是一种导致血液中高浓度氨的X-连锁遗传病。在一些情况下,OTC缺乏症可能由外显子4的供体剪接位点中的G->A剪接位点突变引起,其导致前mRNA的错误剪接。这种突变导致形成可以被拉长或具有点突变的蛋白质。OTC蛋白水平可能降低15-20倍。参见例如Hodges,P.E.&Rosenberg,L.E.The spfash mouse:a missense mutationin the ornithine transcarbamylase gene also causes aberrant mRNA splicing.Proc.Natl.Acad.Sci.U.S.A.86,4142–4146(1989))(显示产生的OTC的替代形式)。其序列提供如下:
OTC前mRNA(野生型)
SEQ ID NO:1.....CTCACAGACACCGCTCGGTTTGTAAAACTTTTCTTC.....
OTC前mRNA(突变体)
SEQ ID NO:2.....CTCACAGACACCGCTCAGTTTGTAAAACTTTTCTTC.....
OTC mRNA(错误剪接,突变体)
SEQ ID NO:3.....CTCACAGACACCGCTCAGTTTGTAAAACTTTTCTTC.....
OTC mRNA(正确剪接,突变体)
SEQ ID NO:4.....CTCACAGACACCGCTCATGTCTTATCTAGCATGACA.....
OTC mRNA(正确剪接,野生型)
SEQ ID NO:5....CTCACAGACACCGCTCGTGTCTTATCTAGCATGACA.....
如上所示,当可能存在突变时,可能会产生正确的剪接变体;然而,这种产生会导致错义突变,这也可能导致OTC缺乏症。
单独使用或与“基序”组合使用的术语“发夹”、“发夹环”、“茎-环”和/或“环”可以在寡核苷酸的情况下用于指当单链内的序列在以相反方向读取时可以互补碱基对以形成构象类似发夹或环的区域时在单链寡核苷酸中形成的结构。
如本文所用,术语“结构域”可以指蛋白质或多肽的特定区域并且可以与特定功能相关。例如,“与RNA发夹基序相关的结构域”可以指结合一个或多个RNA发夹的蛋白质的结构域。这种结合可以任选地特异于特定的发夹。
如本文所用,术语“APOBEC”可以指属于参与mRNA编辑(催化C到U转化)的进化上保守的胞苷脱氨酶家族的任何蛋白质以及它们的等同物。在一些方面,术语APOBEC可以指APOBEC1、APOBE C2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3E、APOB EC3F、APOBEC3G、APOBEC3H、APOBEC4中的任一个或它们各自的等同物。本文可以提供包含一个或多个APOBEC结构域的融合蛋白的非限制性示例性序列,其与ADAR结构域融合或与替代结构域融合以使它们适用于RNA编辑系统。为此,APOBEC可以被认为是ADAR催化编辑的等同物,尽管通过不同的转换。
如本文所用,术语“Glur2 mRNA”可以指编码离子型AMPA谷氨酸受体2(“Glur2”)的mRNA,其经历腺苷至肌苷(A->I)编辑。该mRNA可以以位点特异性方式募集ADAR。
如本文所用,术语“干扰素”可以指一组已知与免疫响应相关的信号蛋白。在本申请的上下文中,感兴趣的干扰素可以是导致ADAR表达增强的干扰素。干扰素α与ADAR1之间的相关性可能是已知的,因此,本公开考虑使用干扰素α作为增加内源性ADAR1表达的手段。分离的或重组的干扰素α的商业来源包括但不限于Sigma-Aldrich、R&D Systems、Abcam和Thermo Fisher Scientific。替代性地,干扰素α可以使用已知载体和给定蛋白质序列(例如Q6QNB6(人IFNA))产生。
可以在没有明确叙述的情况下推断,并且除非另有说明,否则当本公开涉及多肽、蛋白质、多核苷酸或抗体时,其等同物或生物等同物可以在本公开的范围内。如本文所用,术语“其生物等同物”在涉及参考蛋白质、抗体、多肽或核酸时可以旨在与“其等同物”同义,意指具有最小同源性同时仍维持所需结构或功能性的那些。除非在本文中特别提及,否则可以预期在本文中提及的任何多核苷酸、多肽或蛋白质也包括其等同物。例如,等同物意指至少约70%同源性或同一性、或至少80%同源性或同一性,并且替代性地,或至少约85%、或替代性地至少约90%、或替代性地至少约95%、或替代性地98%同源性或同一性百分比,并表现出与蛋白质、多肽或核酸基本上等同的生物活性。替代性地,当提及多核苷酸时,其等同物可以是在严格条件下与参考多核苷酸或其互补物杂交的多核苷酸。
工程化引导多核苷酸
本文公开了工程化多核苷酸(也可称为“工程化引导”或“工程化引导RNA”或“引导RNA”),其用于通过编辑与疾病或疾患有关的靶多核苷酸(例如,前RNA或mRNA)来治疗受试者的疾病或疾患。这种工程化多核苷酸被构建成经由与靶多核苷酸互补的部分结合靶多核苷酸。工程化多核苷酸与靶多核苷酸的结合有助于经由RNA编辑实体编辑靶多核苷酸的碱基,从而治疗受试者的疾病或疾患。在一些情况下,工程化多核苷酸可以包含DNA、RNA或两者。
如本文所述的工程化引导RNA或工程化多核苷酸可以包括各种结构域。“结构域”可以指工程化多核苷酸的区域。在一些情况下,可以根据结构域的功能来描述结构域。例如,“靶向结构域”可以指可以与靶RNA至少部分互补的工程化多核苷酸的区域;“RNA编辑实体募集结构域”可以指能够与如本文所述的RNA编辑实体相关或募集如本文所述的RNA编辑实体的结构域;“间隔子结构域”可以指在其他结构域之间提供空间的结构域。在一些情况下,结构域的引用并不将该结构域限制为特定功能。例如,可以与靶RNA至少部分互补的“靶向结构域”在一些情况下可以募集RNA编辑实体。
环状引导RNA
如本文所述,工程化引导可以包括环状或环形结构。工程化多核苷酸可以由前体工程化多核苷酸环化。这种前体工程化多核苷酸可以是前体工程化线性多核苷酸。在一些情况下,前体工程化线性多核苷酸可以是环状工程化多核苷酸的前体。例如,前体工程化线性多核苷酸可以是从质粒转录的线性mRNA,其可以在细胞内环化。在另一个示例中,可以将前体工程化线性多核苷酸构建为具有结构域诸如核酶结构域和连接结构域的线性多核苷酸,所述结构域在插入细胞中时允许环化。核酶结构域可以包括能够在特定位点(例如,邻近连接结构域)切割线性前体RNA的结构域。其中前体结构域从5'到3'包含:5'核酶结构域、5'连接结构域、环化区域、3'连接结构域和3'核酶结构域,前体多核苷酸可以分别在两个位点被5'和3'核酶特异性加工,以在5'和3'连接结构域上游离暴露末端。游离暴露的末端可以是有连接能力的,使得末端可以被环化以形成成熟的环化结构。例如,自由端可以包括5'-OH和2',3'-环磷酸盐,它们在细胞中通过RNA连接而连接。具有连接结构域和核酶结构域的线性多核苷酸可以转染到可以通过内源性细胞酶环化的细胞中。
在一些情况下,前体工程化多核苷酸可以是环化的。在一些情况下,前体工程化多核苷酸可以与前体线性工程化多核苷酸一样是线性的。在一些情况下,前体工程化多核苷酸可以包含DNA、RNA或两者。在一些情况下,前体工程化多核苷酸可以包含前体工程化引导RNA。在一些情况下,前体工程化引导RNA可用于产生工程化引导RNA。
在一些实施方案中,工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的长度可以大于约:10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2500或5000个核苷酸。在一些实施方案中,工程化多核苷酸(例如工程化引导多核苷酸)、前体工程化线性多核苷酸或前体工程化多核苷酸的长度可以小于约:20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2500或5000个核苷酸。在一些情况下,工程化多核苷酸(例如工程化引导多核苷酸)、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含约:20个核苷酸至约5000个核苷酸、20个核苷酸至约50个核苷酸、20个核苷酸至约150个核苷酸、40个核苷酸至约80个核苷酸、40个核苷酸至约100个核苷酸、40个核苷酸至约200个核苷酸、70个核苷酸至约140个核苷酸、80个核苷酸至约160个核苷酸、80个核苷酸至约150个核苷酸、80个核苷酸至约300个核苷酸、80个核苷酸至约600个核苷酸、90个核苷酸至约200个核苷酸、100个核苷酸至约250个核苷酸、140个核苷酸至约200个核苷酸、150个核苷酸至约350个核苷酸、200个核苷酸至约400个核苷酸、200个核苷酸至约500个核苷酸、400个核苷酸至约600个核苷酸、450个核苷酸至约800个核苷酸、750个核苷酸至约1250个核苷酸、1000个核苷酸至约2000个核苷酸、或约2000个核苷酸至约5000个核苷酸。
在一些实施方案中,工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以不包含编码被构造用于RNA干扰(RNAi)的序列的序列。在一些实施方案中,工程化多核苷酸可以不包含被构造用于RNAi的序列。在一些情况下,工程化多核苷酸可以不包含编码短干扰RNA(siRNA)、微RNA(miRNA)、短发夹RNA(shRNA)或Dicer底物的序列。
在一些实施方案中,工程化多核苷酸诸如工程化引导RNA可以是环化的。在一些情况下,工程化多核苷酸可以是环。在一些情况下,环状可以包括环形。在一些情况下,环形可以包括环状。环形成或环化可以防止多核苷酸的暴露末端被降解,并且可以显著增加多核苷酸在体内或体外的半衰期。在一些实施方案中,环状或环形工程化多核苷酸可以防止一个或多个暴露末端水解降解。在一些实施方案中,工程化多核苷酸诸如工程化环状引导RNA可以不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些情况下,工程化多核苷酸可以包含比人类细胞中天然存在的mRNA更不易受水解降解影响的二级结构。
在一些情况下,环状或环形工程化引导与线性工程化多核苷酸相比可以包含不同的品质。在一些情况下,与可能不是环状或可能不是环的可比较的多核苷酸相比,环状或环形工程化多核苷酸可以显著增加多核苷酸的半衰期。在一些实施方案中,与可以不是环状或不是环的可比较的工程化多核苷酸(例如引导RNA)相比,形成环状或环形工程化多核苷酸可以显著增加工程化多核苷酸(例如引导RNA)在体内诸如递送至受试者时的半衰期。在一些情况下,与可以不是环状或不是环的可比较的工程化多核苷酸相比,形成环状或环形工程化多核苷酸可以显著减少施用于受试者的工程化多核苷酸的量(诸如治疗有效量)。在一些情况下,与可以不是环状或不是环的可比较的工程化多核苷酸相比,环状或环形工程化多核苷酸可以增加靶RNA的敲低。在一些实施方案中,与可能不是环状或可能不是环的可比较的工程化多核苷酸相比,形成环状或环形工程化多核苷酸可以显著提高编辑效率,可以显著减少脱靶编辑,提高募集RNA编辑实体的效率或它们的组合。图1A和图1B示出了与线性引导RNA相比,环状引导RNA可以增加多个细胞系中的RNA编辑。在一些情况下,与可以不是环状或不是环的可比较的工程化多核苷酸相比,环状或环形工程化多核苷酸可以显著增加工程化多核苷酸的合成。在一些实施方案中,与可以不是环状或不是环的可比较的工程化多核苷酸相比,环状或环形工程化多核苷酸可以显著增加工程化多核苷酸向细胞中的转运。在一些情况下,与可以不是环状或不是环的可比较的工程化多核苷酸相比,环状或环形工程化多核苷酸可以显著增加工程化多核苷酸的细胞内滞留。
与非环形或非环状引导多核苷酸相比,环状或环形工程化引导多核苷酸诸如工程化引导RNA可以提供多种益处。与可以不是环状或不是环的可比较的工程化多核苷酸相比,环形或环状工程化多核苷酸可以提供更大的稳定性、改善的RNA编辑实体(诸如内源性RNA编辑酶)募集、更长的半衰期、改善的RNA编辑效率或它们的任何组合。环形或环状工程化引导多核苷酸可以提供一种或多种这些改进中的一种或多种,并且与包含被设计成提高引导稳定性的其他类型的修饰(诸如化学修饰或糖添加)的引导多核苷酸相比,可以保留遗传可编码能力。环形或环状工程化引导多核苷酸能够被遗传编码,能够被载体递送,并保持改善的稳定性。
在一些实施方案中,与线性引导RNA相比,环状工程化引导RNA在细胞中可以具有提高的稳定性。在一些实施方案中,与线性多核苷酸相比,环状工程化多核苷酸在细胞中可以具有提高的稳定性。RNA的提高的稳定性可以通过测量在一段时间内用环状工程化引导RNA或线性引导RNA、或编码环状引导RNA或线性引导RNA的载体转染的细胞中RNA编辑的百分比来确定。例如,测定可以在48小时、96小时和144小时测量编辑百分比。提高的稳定性可以通过在稍后的时间点增加的RNA编辑百分比来指示。提高的稳定性还可以通过测定在一段时间(例如48小时、96小时和144小时)内细胞中的环状引导RNA和线性引导RNA的拷贝数来测量,如在引导RNA构建体逆转录后通过数字液滴PCR测定。稳定性的增加可以在图5中展示。图5示出了与细胞中的环状引导RNA相比,RAB7A 3'UTR中来自线性引导RNA的核苷酸的RNA编辑百分比。与线性引导RNA相比,环状引导RNA示出在48小时和96小时时具有更高水平的RNA编辑。编辑的增加可能是由于环状引导RNA与线性引导RNA相比稳定性增加。
递送至细胞或受试者的工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸在细胞或受试者中的半衰期可以包括至少约:40分钟、50分钟、60分钟、1.5小时(h)、2h、4h、6h、8h、10h、12h、16h、18h、20h、24h、1.25天、1.5天、2天、3天、4天、5天、6天、7天、10天、14天或更多。递送至细胞或受试者的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的半衰期可为约1小时(h)至约6h。递送至细胞或受试者的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的半衰期可为约1h至约24h。递送至细胞或受试者的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的半衰期可为约1h至约2天。递送至细胞或受试者的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的半衰期可为约6h至约24h。递送至细胞或受试者的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的半衰期可为约6h至约5天。
递送至细胞或受试者的工程化多核苷酸(诸如工程化引导RNA)可以募集RNA编辑实体,诸如内源性RNA编辑实体。在一些情况下,工程化引导多核苷酸可以与RNA编辑实体共同递送。与可能不是环状的工程化多核苷酸相比,环状多核苷酸诸如环状引导RNA可以募集更大量的RNA编辑实体。在一些实施方案中,工程化多核苷酸可以被配置为募集足够量的内源性RNA编辑实体以进行编辑,诸如将工程化多核苷酸递送至可以包含少量内源性RNA编辑酶的组织位置。
环状引导结构
在一些实施方案中,环状或环形工程化引导多核苷酸可以不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些情况下,每个5'羟基和每个3'羟基可以通过共价氧磷键独立地与磷键合。在一些情况下,磷可以包含在磷酸二酯基团中。在一些情况下,5'羟基、3'羟基或两者均可以通过磷-氧键连接。在一些情况下,5'羟基、3'羟基或两者都可以被修饰成具有含磷部分的磷酸酯。
在一些情况下,5'端可以是在末端核苷酸的糖的5'碳上具有末端的、暴露的、未结合的或未连接的磷酸根基团的多核苷酸的末端核苷酸。在一些实施方案中,3'端可以是在末端核苷酸的糖的3'碳上具有末端的、暴露的、未结合的或未连接的羟基的多核苷酸的末端核苷酸。在一些情况下,如果多核苷酸可以被转录或当多核苷酸可以被转录时,5'端可以是待转录的多核苷酸的第一个核苷酸。在一些实施方案中,如果多核苷酸可以被转录或当多核苷酸可以被转录时,3'端可以是待转录的多核苷酸的最后一个核苷酸。在一些情况下,通过磷酸二酯键连接的二核苷酸的5'端可以是在糖的3'碳上提供羟基的核苷酸。在一些情况下,通过磷酸二酯键连接的二核苷酸的3'端可以是在糖的5'碳上提供磷酸中的羟基的核苷酸。
在一些实施方案中,本文公开的工程化多核苷酸可以包含或编码式(I)的结构。
在一些情况下,式(I)的前体工程化多核苷酸可以由多核苷酸(例如病毒多核苷酸)编码。在一些情况下,式(I)可以包含可以与靶RNA至少部分互补的靶向结构域,并且式(I)可以包含如本文所述的间隔子结构域。在一些情况下,式(I)可以包含能够与靶RNA的序列杂交的靶向结构域。在一些情况下,至少部分互补可以包含靶向结构域,该靶向结构域包含与靶RNA的反向互补序列具有至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%的序列同源性的多核苷酸序列。在一些情况下,每个X可以独立地为O、S或NR;每个Y可以独立地为P或S;每个Z可以独立地为OM、SM或NRM;每个A可以独立地为H、D、卤素、OM、SM、NRM或NRR';每个B可以独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、这些中的任一种的盐或这些中的任一种的衍生物;m可以独立地为0-1,000的整数。在一些情况下,每个X可以为O。在一些情况下,每个Z可以为O、S或两者。在一些情况下,每个Y可以为P。在一些情况下,M可以为至少1。在一些情况下,每个单元m可以独立地为(D)-或(L)-构型。在一些情况下,m可以为约5至约250、30至约600、100至约500、400至约800、600至约1200、800至约2000、1500至约4000或约300至约10000的独立整数。在一些情况下,每个M可以独立地为无机或有机阳离子、H或D,并且每个R和R'可以独立地为H、D、卤素或C1-C6烷基。在一些情况下,每个Z可以为OM,每个R可以为H,并且每个Y可以为P。
在一些情况下,靶向结构域与靶RNA序列的缔合可以促进RNA编辑实体对靶RNA的核苷酸碱基的编辑。在一些情况下,靶向结构域可以与靶RNA至少部分互补。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的编码区缔合。在一些情况下,靶向结构域与靶RNA的编码区的缔合可以促进RNA编辑实体对靶RNA的核苷酸碱基的编辑。在一些情况下,RNA编辑实体可以包含ADAR蛋白(例如ADAR1、ADAR2)、APOBEC、它们的生物活性片段或它们的任何组合。在一些情况下,RNA编辑实体可以是人蛋白质。在一些情况下,RNA编辑实体可以是内源性蛋白质。在一些情况下,RNA编辑实体可以是外源性蛋白质。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的非翻译区缔合。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的3'或5'非翻译区(UTR)的至少一部分缔合。在一些情况下,靶向结构域与靶RNA的非翻译区的缔合可以促进由靶RNA编码的多肽的表达水平相对于在不存在工程化多核苷酸的情况下由靶RNA编码的多肽的水平降低,如通过包括以下的体外测定所确定的:(i)将靶RNA直接或间接引入原代细胞系的第一细胞和第二细胞中,(ii)将工程化多核苷酸直接或间接引入原代细胞系的第一细胞中,以及(iii)比较第一细胞和第二细胞中由靶RNA表达的多肽的量。
间隔子结构域
如本文所述的工程化多核苷酸(或当插入细胞中时环化的前体工程化线性多核苷酸)可以包括间隔子结构域。如本文所述,间隔子结构域可以指在其他结构域之间提供空间的结构域。间隔子结构域可用于待环化区域与侧翼连接序列之间以增加成熟环化多核苷酸的总大小。在待环化的区域包括如本文所述的被构建成与靶多核苷酸缔合的靶向结构域的情况下,相对于缺乏间隔子结构域的可比较的工程化多核苷酸,增加间隔子可以提供工程化多核苷酸对靶多核苷酸的改善(例如增加的特异性、增强的编辑效率等)。在一些情况下,间隔子结构域可以包含填充序列。在一些情况下,填充序列可以包含间隔子结构域。填充序列或填充结构域可以是环状引导框架中与靶序列至少部分不互补的序列。在一些情况下,填充序列可以包括环状引导框架的一部分。在一些情况下,间隔子结构域被构建成不以与靶多核苷酸连续的方式与靶RNA杂交。在这种构型中,间隔子结构域不只是增加工程化多核苷酸的靶结构域与靶多核苷酸之间的重叠量。相反,间隔子结构域可用于在靶向结构域与靶多核苷酸之间的重叠区之外延长环化多核苷酸(例如增加环状框架的大小)。通过在重叠区之外增加该环状多核苷酸的大小,本申请证明了靶向结构域与靶多核苷酸之间的总体结合效率得到改善的令人惊讶的发现。在一些情况下,这种改善可能是由于提供了环化多核苷酸的靶向结构域与靶多核苷酸结合的更优化的几何形状。
在一些情况下,相对于缺乏间隔子结构域的相应多核苷酸与靶RNA结合的吉布斯自由能(ΔG),包含间隔子结构域的工程化多核苷酸可以具有较低的工程化多核苷酸与靶RNA结合的ΔG,如通过KPFM所确定的。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的非翻译区缔合,其中靶向结构域与靶RNA的非翻译区的缔合促进由靶RNA编码的多肽的表达水平的降低,并且其中靶向结构域与靶RNA的序列的缔合促进RNA编辑实体对靶RNA的核苷酸的碱基的编辑。
在一些实施方案中,工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸或两者可以包含可以与靶RNA至少部分互补的靶向结构域、RNA编辑实体募集结构域和间隔子结构域。在一些情况下,工程化多核苷酸可以表示为环状二维格式的多核苷酸序列,其中一个核苷酸在另一个之后。在一些情况下,工程化多核苷酸可以表示为环形二维格式的多核苷酸序列,其中一个核苷酸在另一个之后。在一些情况下,工程化多核苷酸的间隔子结构域可以通过增加一个或多个核苷酸来扩大工程化多核苷酸。在一些情况下,工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的编码区缔合。在一些情况下,靶向结构域与靶RNA的编码区的缔合可以促进RNA编辑实体对靶RNA的核苷酸碱基的编辑。
在一些情况下,间隔子结构域的序列长度可以为约:1个核苷酸至约1,000个核苷酸、2个核苷酸至约20个核苷酸、10个核苷酸至约100个核苷酸、50个核苷酸至约500个核苷酸或约400个核苷酸至约1000个核苷酸长度。在一些情况下,间隔子结构域的序列长度可以为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199、1200、1201、1202、1203、1204、1205、1206、1207、1208、1209、1210、1211、1212、1213、1214、1215、1216、1217、1218、1219、1220、1221、1222、1223、1224、1225、1226、1227、1228、1229、1230、1231、1232、1233、1234、1235、1236、1237、1238、1239、1240、1241、1242、1243、1244、1245、1246、1247、1248、1249、1250、1251、1252、1253、1254、1255、1256、1257、1258、1259、1260、1261、1262、1263、1264、1265、1266、1267、1268、1269、1270、1271、1272、1273、1274、1275、1276、1277、1278、1279、1280、1281、1282、1283、1284、1285、1286、1287、1288、1289、1290、1291、1292、1293、1294、1295、1296、1297、1298、1299、1300、1301、1302、1303、1304、1305、1306、1307、1308、1309、1310、1311、1312、1313、1314、1315、1316、1317、1318、1319、1320、1321、1322、1323、1324、1325、1326、1327、1328、1329、1330、1331、1332、1333、1334、1335、1336、1337、1338、1339、1340、1341、1342、1343、1344、1345、1346、1347、1348、1349、1350、1351、1352、1353、1354、1355、1356、1357、1358、1359、1360、1361、1362、1363、1364、1365、1366、1367、1368、1369、1370、1371、1372、1373、1374、1375、1376、1377、1378、1379、1380、1381、1382、1383、1384、1385、1386、1387、1388、1389、1390、1391、1392、1393、1394、1395、1396、1397、1398、1399、1400、1401、1402、1403、1404、1405、1406、1407、1408、1409、1410、1411、1412、1413、1414、1415、1416、1417、1418、1419、1420、1421、1422、1423、1424、1425、1426、1427、1428、1429、1430、1431、1432、1433、1434、1435、1436、1437、1438、1439、1440、1441、1442、1443、1444、1445、1446、1447、1448、1449、1450、1451、1452、1453、1454、1455、1456、1457、1458、1459、1460、1461、1462、1463、1464、1465、1466、1467、1468、1469、1470、1471、1472、1473、1474、1475、1476、1477、1478、1479、1480、1481、1482、1483、1484、1485、1486、1487、1488、1489、1490、1491、1492、1493、1494、1495、1496、1497、1498、1499、1500、1501、1502、1503、1504、1505、1506、1507、1508、1509、1510、1511、1512、1513、1514、1515、1516、1517、1518、1519、1520、1521、1522、1523、1524、1525、1526、1527、1528、1529、1530、1531、1532、1533、1534、1535、1536、1537、1538、1539、1540、1541、1542、1543、1544、1545、1546、1547、1548、1549、1550、1551、1552、1553、1554、1555、1556、1557、1558、1559、1560、1561、1562、1563、1564、1565、1566、1567、1568、1569、1570、1571、1572、1573、1574、1575、1576、1577、1578、1579、1580、1581、1582、1583、1584、1585、1586、1587、1588、1589、1590、1591、1592、1593、1594、1595、1596、1597、1598、1599、1600、1601、1602、1603、1604、1605、1606、1607、1608、1609、1610、1611、1612、1613、1614、1615、1616、1617、1618、1619、1620、1621、1622、1623、1624、1625、1626、1627、1628、1629、1630、1631、1632、1633、1634、1635、1636、1637、1638、1639、1640、1641、1642、1643、1644、1645、1646、1647、1648、1649、1650、1651、1652、1653、1654、1655、1656、1657、1658、1659、1660、1661、1662、1663、1664、1665、1666、1667、1668、1669、1670、1671、1672、1673、1674、1675、1676、1677、1678、1679、1680、1681、1682、1683、1684、1685、1686、1687、1688、1689、1690、1691、1692、1693、1694、1695、1696、1697、1698、1699、1700、1701、1702、1703、1704、1705、1706、1707、1708、1709、1710、1711、1712、1713、1714、1715、1716、1717、1718、1719、1720、1721、1722、1723、1724、1725、1726、1727、1728、1729、1730、1731、1732、1733、1734、1735、1736、1737、1738、1739、1740、1741、1742、1743、1744、1745、1746、1747、1748、1749、1750、1751、1752、1753、1754、1755、1756、1757、1758、1759、1760、1761、1762、1763、1764、1765、1766、1767、1768、1769、1770、1771、1772、1773、1774、1775、1776、1777、1778、1779、1780、1781、1782、1783、1784、1785、1786、1787、1788、1789、1790、1791、1792、1793、1794、1795、1796、1797、1798、1799、1800、1801、1802、1803、1804、1805、1806、1807、1808、1809、1810、1811、1812、1813、1814、1815、1816、1817、1818、1819、1820、1821、1822、1823、1824、1825、1826、1827、1828、1829、1830、1831、1832、1833、1834、1835、1836、1837、1838、1839、1840、1841、1842、1843、1844、1845、1846、1847、1848、1849、1850、1851、1852、1853、1854、1855、1856、1857、1858、1859、1860、1861、1862、1863、1864、1865、1866、1867、1868、1869、1870、1871、1872、1873、1874、1875、1876、1877、1878、1879、1880、1881、1882、1883、1884、1885、1886、1887、1888、1889、1890、1891、1892、1893、1894、1895、1896、1897、1898、1899、1900、1901、1902、1903、1904、1905、1906、1907、1908、1909、1910、1911、1912、1913、1914、1915、1916、1917、1918、1919、1920、1921、1922、1923、1924、1925、1926、1927、1928、1929、1930、1931、1932、1933、1934、1935、1936、1937、1938、1939、1940、1941、1942、1943、1944、1945、1946、1947、1948、1949、1950、1951、1952、1953、1954、1955、1956、1957、1958、1959、1960、1961、1962、1963、1964、1965、1966、1967、1968、1969、1970、1971、1972、1973、1974、1975、1976、1977、1978、1979、1980、1981、1982、1983、1984、1985、1986、1987、1988、1989、1990、1991、1992、1993、1994、1995、1996、1997、1998、1999或2000个核苷酸。
在一些实施方案中,间隔子结构域的约80%的核苷酸可以与靶RNA不互补。在一些情况下,间隔子结构域的序列长度可以为约5个核苷酸。在一些情况下,间隔子结构域的序列长度可以为约10个核苷酸。在一些情况下,间隔子结构域的序列长度可以为约15个核苷酸。在一些情况下,间隔子结构域的序列长度可以为约20个核苷酸。在一些实施方案中,间隔子结构域可以包含5'ATATA 3'(SEQ ID 6)、5'ATAAT 3'(SEQ ID 7)或它们的任何组合的多核苷酸序列。在一些情况下,间隔子结构域可以包含5'AUAAU 3'(SEQ ID 8)、5'AUAUA 3'(SEQ ID 9)、3'AUAUA 5'(SEQ ID 32)或3'AUAAU 5'(SEQ ID 33)的序列。在一些实施方案中,间隔子结构域可以是至少单个核苷酸,诸如A、T、G、C或U。
间隔子结构域可以位于靶向结构域的近侧、连接结构域的近侧、核酶结构域的近侧、RNA编辑募集结构域的近侧或另一个间隔子结构域的近侧,其中近侧可以意指间隔子至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个核苷酸。
在一些实施方案中,间隔子结构域可以与靶向结构域间隔子1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个核苷酸。
工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含单个间隔子结构域。在一些情况下,工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含第二间隔子结构域。在一些情况下,第一间隔子结构域、第二间隔子结构域或两者可以被构建成在靶向结构域与靶RNA结合时不与靶RNA结合。在一些实施方案中,工程化多核苷酸或前体工程化多核苷酸可以包含多个间隔子结构域,例如2、3、4、5、6、7或8个间隔子结构域。
工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含填充序列。在一些情况下,填充序列可以包含与靶RNA基本上不互补的核酸序列。在一些情况下,填充序列被构建成不以与靶多核苷酸连续的方式与靶RNA杂交。在一些情况下,环状引导框架可以包含本文公开的工程化线性多核苷酸(例如引导RNA)中的任一种,并且剩余的序列可以包含填充序列。在一些情况下,填充序列可以包含约:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或98%的环状引导框架的总序列。在一些情况下,引导RNA可以包含约:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或98%的环状引导框架的总序列。在一些情况下,包含约34%至约72%、40%至约75%、或50%至约67%的环状引导框架序列的填充序列可以产生最高水平的RNA编辑。在一些情况下,包含约28%或约66%、25%至约60%、或33%至约50%的环状引导框架序列的填充序列可以产生最高水平的编辑。在一些情况下,环状引导框架可以包含约50个核苷酸至约2000个核苷酸、150个核苷酸至约400个核苷酸、100个核苷酸至约450个核苷酸、500个核苷酸至约900个核苷酸、900个核苷酸至约1500个核苷酸、1400个核苷酸至约2000个核苷酸或200个核苷酸至约300个核苷酸的总序列长度。在一些情况下,环状引导框架可以包含1、2、3、4或更多个填充序列。
间隔子结构域可以被构建成促进工程化多核苷酸采用有利于与靶RNA至少部分结合的构象。在一些情况下,间隔子结构域可以改变多核苷酸的靶向结构域的几何形状,使得多核苷酸的靶向结构域可以是基本上线性的。在一些实施方案中,间隔子结构域可以促进工程化多核苷酸的合成。在一些情况下,间隔子结构域可以促进前体工程化线性多核苷酸的暴露于溶剂的末端的键连。在一些实施方案中,间隔子结构域可以使前体工程化多核苷酸的两个连接末端比缺乏间隔子结构域的那些更接近。在一些实施方案中,工程化多核苷酸中的键连可以是共价的或非共价的。在一些情况下,可以通过连接反应形成键连。在一些实施方案中,可以通过同源重组反应形成键连。
相对于缺乏间隔子结构域的相应多核苷酸的结合特异性,包含间隔子结构域的工程化多核苷酸可以具有与多种其他RNA中的靶RNA的结合特异性的增加。在一些实施方案中,与靶RNA的结合特异性的增加可以通过在与包含间隔子结构域的工程化多核苷酸或缺乏间隔子结构域的相应多核苷酸接触后对靶RNA和多种其他RNA测序来确定。在一些情况下,间隔子结构域可以被构建成促进工程化多核苷酸与靶RNA结合的较低熵(ΔS)。在一些实施方案中,相对于缺乏间隔子结构域的相应多核苷酸的编辑效率,间隔子结构域可以被构建成至少维持工程化多核苷酸对靶RNA的编辑效率。在一些情况下,编辑效率可以通过在与具有间隔子结构域的工程化多核苷酸或缺乏间隔子结构域的相应多核苷酸接触后对靶RNA进行测序来确定。在一些实施方案中,至少维持可以包括增加。在一些情况下,编辑效率可以通过在与具有间隔子结构域的工程化多核苷酸或缺乏间隔子结构域的相应多核苷酸接触后对靶RNA进行质谱法来确定。
在一些实施方案中,具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化引导RNA的编辑效率可以是缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸的约2倍至约5倍。在一些情况下,递送至细胞或受试者的具有间隔子的工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的编辑效率可以是缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸的约3倍至约6倍。在一些情况下,由具有间隔子的工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸对靶RNA的编辑百分比可以是缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸的约:5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或约100%。
在一些情况下,相对于缺乏间隔子结构域的相应工程化引导RNA或工程化多核苷酸与靶RNA结合的吉布斯自由能(ΔG),开尔文探针力显微镜(KPFM)可用于确定具有间隔子结构域的工程化引导RNA或工程化多核苷酸与靶RNA结合的ΔG:靶RNA可以固定在裸露的金纳米颗粒上。可以增加具有或不具有间隔子结构域的工程化引导RNA或工程化多核苷酸,并使其与固定在金颗粒上的靶RNA结合。然后可以用KPFM测量形貌和表面电势图像,并用于计算工程化引导RNA或工程化多核苷酸(具有或不具有间隔子结构域)与靶RNA之间的结合的ΔG。
与缺乏间隔子结构域的基本上可比较的RNA或可比较的多核苷酸相比,具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的体外半衰期可以为至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、5倍、10倍、20倍或更长。与缺乏间隔子结构域的基本上可比较的RNA或可比较的多核苷酸相比,具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的体内半衰期可以为至少约:1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、5倍、10倍、20倍或更长。与施用于有需要的受试者的包含缺乏间隔子结构域的基本上可比较的RNA或可比较的多核苷酸的组合物相比,施用于有需要的受试者的包含具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的组合物的剂量可以为至少约:1、1/1.5、1/2、1/2.5、1/3、1/3.5、1/4、1/5、1/10或1/20。与作为两次或更多次治疗给予的包含缺乏间隔子结构域的基本上可比较的RNA或可比较的多核苷酸的组合物相比,可以给予施用于有需要的受试者的包含具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的组合物作为单次治疗。
与缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸相比,具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化引导RNA可以包含至少约:2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍的半衰期。具有间隔子结构域的工程化引导RNA、工程化多核苷酸或前体工程化引导RNA的半衰期可以是缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸的约2倍至约5倍。在一些情况下,递送至细胞或受试者的具有间隔子的工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的半衰期可以是缺乏间隔子的可比较的引导RNA或可比较的工程化多核苷酸的约3倍至约6倍。
在一些情况下,式(I)可以根据式(II)
在一些实施方案中,本文公开的工程化引导多核苷酸可以包含或编码式(IV)的结构。
/>
在一些情况下,每个X可以为包含碱基的核苷酸,该碱基可以独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、这些中的任一种的盐或这些中的任一种的衍生物。在一些情况下,每个核苷酸可以通过磷酸酯、硫代磷酸酯、硫代磷酸酯或亚磷酰胺键独立地与两个相邻核苷酸连接。在一些情况下,n可以独立地为0-1,000的整数。在一些情况下,n可以为约:5至约250、100至约500、400至约800、600至约1200、800至约2000、1500至约4000或约300至约10000的独立整数。在一些情况下,式(IV)可以包含可以与靶RNA至少部分互补的靶向结构域,并且式(IV)可以包含间隔子结构域。在一些情况下,靶向结构域物理上不包含间隔子结构域。例如,靶向结构域可以与靶RNA至少部分互补,而间隔子结构域可以不与靶RNA互补。在一些情况下,至少部分互补可以包含靶向结构域(在工程化多核苷酸或前体工程化多核苷酸中),该靶向结构域可以包含与靶RNA的反向互补序列具有至少约70%、75%、80%、85%、90%、95%或100%序列同源性的多核苷酸序列。在一些情况下,至少部分互补可以包含靶向结构域,该靶向结构域包含与靶RNA的反向互补序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%或至少约95%序列同源性的多核苷酸序列。在一些情况下,靶向结构域可以与至少约80%的靶RNA进行碱基配对。在一些情况下,间隔子结构域可以与小于约60%、50%、40%、30%、20%或10%的靶RNA进行碱基配对。
在一些实施方案中,工程化多核苷酸可以包含手性。在一些实施方案中,可以为手性的任何中心原子可以独立地处于(R)或(S)构型。在一些情况下,手性可以包含分子中可以与四种不同类型的原子或原子链键合的原子。在一些情况下,工程化多核苷酸,诸如引导RNA可以是单一非对映异构体或可以主要是一种非对映异构体。在一些情况下,工程化多核苷酸可以具有约51%至约100%、51%至约60%、60%至约75%、70%至约90%或约80%至约99%的非对映体过量。非对映体过量可以是用于手性物质的纯度的量度。在某些情况下,它可以反映样品中一种非对映异构体的含量高于另一种非对映异构体的程度。在一些情况下,单一纯非对映异构体可以具有100%的非对映异构体过量。具有70%的一种非对映异构体和30%的另一种非对映异构体的样品可以具有40%(70%-30%)的非对映异构体过量。
在一些实施方案中,工程化多核苷酸可以包含:与靶RNA至少部分互补的靶向结构域;RNA编辑实体募集结构域,其中该RNA编辑实体募集结构域被构建成至少瞬时地与RNA编辑实体缔合;以及间隔子结构域。在一些情况下,靶向结构域或RNA编辑募集结构域可以不包含间隔子结构域。在一些情况下,相对于缺乏间隔子结构域的相应多核苷酸与靶RNA结合的吉布斯自由能(ΔG),包含间隔子结构域的工程化多核苷酸可以具有较低的工程化多核苷酸与靶RNA结合的ΔG,如通过开尔文探针力显微镜所确定的。在一些情况下,工程化多核苷酸可以包含主链,该主链包含共价连接在一起的多个糖和磷酸酯部分。在一些情况下,主链可以不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的编码区缔合。在一些情况下,靶向结构域与靶RNA的编码区的缔合可以促进RNA编辑实体对靶RNA的核苷酸碱基的编辑。
形成环状引导RNA
如上所述,环状或环形工程化引导多核苷酸诸如工程化引导RNA可以通过在RNA序列的多于一个末端(诸如5'末端和3'末端)之间形成键连(诸如共价键连)而直接或间接形成。RNA序列可以包含工程化引导RNA(诸如募集结构域、靶向结构域或两者)。可以通过使用酶诸如连接酶形成键连。合适的连接酶(或合成酶)可以包括形成共价键的连接酶。共价键可以包括碳-氧键、碳-硫键、碳-氮键、碳-碳键、磷酸酯键或它们的任何组合。通过使用重组酶也可以形成键连。可以将酶募集到RNA序列以形成键连。环状或环形RNA可以通过使用键连元件连接RNA序列的多于一个末端而形成。在一些实施方案中,可以通过连接反应形成键连。在一些情况下,可以通过同源重组反应形成键连。键连元件可以采用点击化学形成环状或环形RNA。键连元件可以是基于叠氮化物的键连。环状或环形RNA可以通过遗传编码或化学合成环状或环形RNA来形成。
环状或环形RNA可以通过使用自切割实体诸如核酶、tRNA、适体、这些中的任一种的催化活性片段或它们的任何组合来形成。例如,可以将核酶、tRNA、适体、这些中的任一种的催化活性片段或它们的任何组合增加到前体工程化RNA的3'端、5'端或两者。在另一个示例中,可以将核酶、tRNA、适体、这些中的任一种的催化活性片段或它们的任何组合增加到前体工程化RNA的3'末端、5'末端或两者。自切割核酶可以包括例如RNA酶P RNA、Hammerhead核酶(例如曼氏血吸虫核酶)、glmS核酶、HDV样核酶、R2元件、肽基转移酶23SrRNA、GIR1分支核酶、leadzyme、II组内含子、发夹核酶、VS核酶、CPEB3核酶、CoTC核酶或I组内含子。在一些情况下,自切割核酶可以是反式作用核酶,其将其上存在的一个RNA末端连接到单独的RNA末端。在一些实施方案中,可以将适体添加到工程化引导RNA的每个末端。连接酶可以在工程化引导RNA的每个末端与适体接触以在适体之间形成共价键连,从而形成环状工程化引导RNA。在一些情况下,自切割元件或适体可被构建成在细胞中转录后促进工程化多核苷酸或前多核苷酸(例如来自前体工程化多肽)的自环化。例如,图3B示出了通过PCR测定确认工程化引导RNA设计3和设计5的环化。在一些情况下,引导RNA的环化可以通过PCR显示。例如,可以开发与引导RNA末端结合并向外定向的引物,使得只有当引导环化时才形成产物。
在一些情况下,环化可以通过外显子的反向剪接和连接而发生。例如,RNA可以从5'至3'工程化以包含正向互补序列内含子、外显子(其可以包含引导序列),随后是反向互补序列内含子。一旦转录,互补序列内含子可以杂交并形成dsRNA。含有引导序列的内部外显子可以通过剪接除去并通过内源连接酶连接以形成环状引导。在一个实施方案中,工程化引导RNA可以通过编码的核酶的自催化反应在细胞中引发环化。在被一种或多种核酶切割后,线性多核苷酸将通过内源连接酶进行连接序列的5'端和3'端的细胞内RNA连接,以将引导RNA环化。
合适的自切割分子可以包括核酶。例如,核酶结构域可以产生自催化RNA。核酶可包括RNA酶P、rRNA(诸如肽基转移酶23SrRNA)、Leadzyme、I组内含子核酶、II组内含子核酶、GIR1分支核酶、glmS核酶、发夹核酶、Hammerhead核酶、HDV核酶、Twister核酶、Twister姐妹核酶、VS核酶、Pistol核酶、Hatchet核酶、类病毒或它们的任何组合。核酶可以包括P3twister U2A核酶。核酶可以包含5'GCCATCAGTCGCCGGTCCCAAGCCCGGATAAAATGGGAGGGGGCGGGAAACCGCCT 3'(SEQ ID NO:14)。核酶可以包含5'GCCAUCAGUCGCCGGUCCCAAGCCCGGAUAAAAUGGGAGGGGGCGGGAAACCGCCU 3'(SEQ ID NO:15)。核酶可以包含:与5'GCCATCAGTCGCCGGTCCCAAGCCCGGATAAAATGGGAGGGGGCGGGAAACCGCCT 3'(SEQ ID NO:14)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。核酶可以包含:与5'GCCAUCAGUCGCCGGUCCCAAGCCCGGAUAAAAUGGGAGGGGGCGGGAAACCGCCU 3'(SEQ ID NO:15)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。核酶可以包括P1Twister核酶。核酶可以包含5'AACACTGCCAATGCCGGTCCCAAGCCCGGATAAAAGTGGAGGGTACAGTCCACGC 3'(SEQ ID NO:16)。核酶可以包含5'AACACUGCCAAUGCCGGUCCCAAGCCCGGAUAAAAGUGGAGGGUACAGUCCACGC 3'(SEQ ID NO:17)。核酶可以包含:与5'AACACTGCCAATGCCGGTCCCAAGCCCGGATAAAAGTGGAGGGTACAGTCCACGC 3'(SEQ ID NO:16)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。核酶可以包含:与5'AACACUGCCAAUGCCGGUCCCAAGCCCGGAUAAAAGUGGAGGGUACAGUCCACGC 3'(SEQ IDNO:17)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
连接结构域可以促进第一核苷酸与第二核苷酸共价或非共价键连。在一些实施方案中,连接结构域可以募集连接实体以促进连接反应。在一些情况下,连接结构域可以募集重组实体以促进同源重组。在一些情况下,第一连接结构域可以促进与第二连接结构域的共价或非共价键连。在一些实施方案中,第一连接结构域可以促进第二连接结构域的互补配对。在一些情况下,连接结构域可以包含5'AACCATGCCGACTGATGGCAG 3'(SEQ ID NO:10)。在一些实施方案中,连接结构域可以包含5'GATGTCAGGTGCGGCTGACTACCGTC 3'(SEQ ID NO:11)。在一些情况下,连接结构域可以包含5'AACCAUGCCGACUGAUGGCAG 3'(SEQ ID NO:12)。在一些情况下,连接结构域可以包含5'GAUGUCAGGUGCGGCUGACUACCGUC 3'(SEQ ID NO:13)。在一些情况下,连接结构域可以包含:与5'AACCATGCCGACTGATGGCAG 3'(SEQ ID NO:10)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,连接结构域可以包含:与5'GATGTCAGGTGCGGCTGACTAC CGTC 3'(SEQ ID NO:11)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,连接结构域可以包含:与5'AACCAUGCCGACUGAUGGCAG 3'(SEQ ID NO:12)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,连接结构域可以包含:与5'GAUGUCAGGUGCGGCUGACUACCGUC 3'(SEQ ID NO:13)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
在一些实施方案中,前体工程化线性多核苷酸、前体工程化多核苷酸或环状工程化引导可以包含与U7或U1启动子序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%序列同源性的序列。
在一些实施方案中,前体工程化多核苷酸或环状工程化引导可以按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;可以与靶RNA至少部分互补的靶向结构域、第二间隔子结构域、第二连接结构域和第二核酶结构域。在一些情况下,第一间隔子结构域、第二间隔子结构域或两者被构建成在靶向结构域与靶RNA结合时不与靶RNA结合。在一些情况下,前体工程化多核苷酸可以包含前体工程化线性多核苷酸。在一些情况下,前体工程化线性多核苷酸可以按5'至3'的顺序包含:第一间隔子结构域;可以与靶RNA至少部分互补的靶向结构域,以及第二间隔子结构域。在一些情况下,靶向结构域可以包含与靶RNA的反向互补序列具有至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%序列同源性的多核苷酸序列。在一些情况下,来自前体工程化线性多核苷酸的前多核苷酸被构建成在哺乳动物细胞中转录后自环化。在一些情况下,前体工程化线性多核苷酸可以包含至第一间隔子结构域的核酶结构域5'或至第二间隔子结构域的3'。在一些情况下,前体工程化线性多核苷酸可以包含位于核酶结构域与第一间隔子结构域之间或位于核酶结构域与第二间隔子结构域之间的连接结构域。在一些情况下,前体工程化线性多核苷酸的间隔子结构域可以被构建成当前体工程化线性多核苷酸的靶向结构域与靶RNA结合时不与靶RNA结合。参考图2,工程化引导RNA被示出包含2个核酶结构域、2个连接序列结构域、2个间隔子结构域和靶向结构域(100.50)。
在一些情况下,形成工程化多核苷酸的方法可以包括用连接实体将前体工程化线性多核苷酸的3'端上的核苷酸直接或间接连接至前体工程化线性多核苷酸的5'端上的核苷酸,从而形成工程化多核苷酸。在一些情况下,工程化多核苷酸可以包含(a)可以与靶RNA至少部分互补的靶向结构域和(b)间隔子结构域,其中工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基,其中相对于缺乏间隔子结构域的相应多核苷酸与靶RNA结合的吉布斯自由能(ΔG),包含间隔子结构域的工程化多核苷酸具有较低的工程化多核苷酸与靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的。在一些情况下,以下中的至少一项适用:(i)当靶向结构域与靶RNA至少部分结合时,间隔子结构域可以被构建成不与靶RNA结合;(ii)当靶向结构域与靶RNA至少部分结合时,间隔子结构域可以与靶向结构域间隔子至少1个核苷酸,并且如果间隔子结构域与靶RNA结合,则间隔子结构域的结合不会在靶RNA与间隔子结构域结合的部分产生靶RNA的编辑;或(iii)当间隔子结构域可以邻近靶向结构域的5'端或3'端时,间隔子结构域可以不与靶RNA互补。在一些情况下,当间隔子结构域可能不与靶RNA互补时,这可能意味着间隔子结构域可能不与靶RNA 100%同源。在一些情况下,当间隔子结构域可能不与靶RNA互补时,间隔子结构域可以包含一个或多个与靶RNA不互补的碱基。
在一些情况下,病毒基因组可以包含本文所述的工程化多核苷酸或前体工程化多核苷酸。在一些情况下,病毒基因组可以包含工程化引导RNA。在一些情况下,病毒基因组可以包含scAAV。表2提供了本文所述的基因序列和引导RNA组分序列。
表2:基因和引导RNA组分的序列
/>
/>
/>
/>
/>
/>
/>
在一些情况下,病毒基因组可以包含或编码scITR序列,其可以包含与5'TCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGA 3'(SEQ ID NO:18)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码草莓1序列,其可以包含:与5'TCTACGCCATATTATCCACAGTCCAACGGCCAGGCGGAGGCTAGTAACAAGGTTATCCTCGGCATCCTCCGCA 3'(SEQID NO:19)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码U6启动子序列,其可以包含与5'GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACC 3'(SEQ ID NO:20)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码P3 twister U2A核酶序列,其可以包含:与5'GGCCATCAGTCGCCGGTCCCAAGCCCGGATAAAATGGGAGGGGGCGGGAAACCGCCT 3'(SEQ ID NO:21)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码左接头和间隔子序列,其可以包含:与5'AACCATGCCGACTGATGGCAGATAATATAAT 3'(SEQID NO:22)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码Rab7a 3'UTR 0.100.50引导序列,其可以包含:与5'GATAAAAGGCGTACATAATTCTTGTGTCTACTGTACAGAATACTGCCGCCAGCTGGATTTCCCAATTCTGAGTAACACTCTGCAATCCAAACAGGGTTCA 3'(SEQ ID NO:23)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码右接头和间隔子序列,其可以包含:与5'ATATAAATATCTGCCATCAGTCGGCGTGGACTGTAG 3'(SEQ ID NO:24)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码P1 twister核酶,其可以包含:与5'AACACTGCCAATGCCGGTCCCAAGCCCGGATAAAAGTGGAGGGTACAGTCCACGC 3'(SEQ ID NO:25)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码CMV启动子,其可以包含:与5'ATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGTAGACACCGGGACCGATCCAGCCTCCGGACTCTAGAGGATCGAACC 3'(SEQ ID NO:26)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码eGFP,其可以包含:与5'ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTACTCAGATCTCGAGCTCAAGTGA 3'(SEQ ID NO:27)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码SV40STOP,其可以包含:与5'CAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAA 3'(SEQ IDNO:28)至少约70%、75%、80%、85%、90%、95%或100%同源性。在一些情况下,病毒基因组可以包含或编码草莓2,其可以包含:与5'CTCACGGACCAGTGCAACATATTCCCAACATCCCGTTGCAGCCTATCATTAAACCTTGGCCGGTCGCGG 3'(SEQ ID NO:29)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码AAV2 ITR,其可以包含:与5'AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA 3'(SEQ ID NO:30)至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,病毒基因组可以包含或编码全基因组序列,其:与5'TCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGGATCCTCTACGCCATATTATCCACAGTCCAACGGCCAGGCGGAGGCTAGTAACAAGGTTATCCTCGGCATCCTCCGCAGGTACCGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGCCATCAGTCGCCGGTCCCAAGCCCGGATAAAATGGGAGGGGGCGGGAAACCGCCTAACCATGCCGACTGATGGCAGATAATATAATGATAAAAGGCGTACATAATTCTTGTGTCTACTGTACAGAATACTGCCGCCAGCTGGATTTCCCAATTCTGAGTAACACTCTGCAATCCAAACAGGGTTCAATATAAATATCTGCCATCAGTCGGCGTGGACTGTAGAACACTGCCAATGCCGGTCCCAAGCCCGGATAAAAGTGGAGGGTACAGTCCACGCTTTTTTTACATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGTAGACACCGGGACCGATCCAGCCTCCGGACTCTAGAGGATCGAACCCTTAAGCCGCCACCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTACTCAGATCTCGAGCTCAAGTGAACCGGTCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGAGCTCCTCACGGACCAGTGCAACATATTCCCAACATCCCGTTGCAGCCTATCATTAAACCTTGGCCGGTCGCGGCTGCAGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA3'(SEQ ID NO:31)具有至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
工程化多核苷酸结构域
A.环状框架
本公开提供了促进感兴趣的靶RNA中碱基的RNA编辑的环化工程化多核苷酸的组合物。如本文所述,环化多核苷酸可以包括用于与靶RNA结合并促进靶多核苷酸编辑的结构域。例如,本公开的工程化多核苷酸促进RNA编辑,该RNA编辑包括碱基的化学修饰,诸如腺苷(A)脱氨基为肌苷(I)。肌苷读作鸟苷(G)。因此,本文公开的RNA编辑的工程化多核苷酸及其使用方法可用于校正基因中可能与疾病或疾病途径有关的G点突变至A点突变。因此,本文公开的工程化多核苷酸可用作治疗方法中的治疗剂。
非功能性区域(例如,不直接与靶多核苷酸结合或不直接促进靶多核苷酸编辑的环化引导的区域)可以形成环化框架。这样的框架可以包括如本文所述的间隔子结构域。环化框架可用作载体以结合任何设计的功能性部分以靶向任何工程化多核苷酸。例如,环化框架可以包含工程化线性多核苷酸。因此,被构建成与不同靶多核苷酸缔合的工程化多核苷酸可以共享单个框架或者可以具有不同的框架。
B.靶向结构域
如上所述,环化的工程化多核苷酸可以包括负责与靶多核苷酸缔合并促进工程化多核苷酸编辑的“功能性”部分。在一些情况下,该部分可以包括靶向结构域或下文描述的其他结构域,其可以包括用于与RNA编辑实体缔合的结构特征。
工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含负责靶多核苷酸的结合和/或促进靶多核苷酸的编辑的一个或多个结构域,诸如1、2、3、4、5个或更多个结构域。在一些情况下,工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含RNA编辑实体募集结构域、靶向结构域、它们中的多于一种或它们的组合。在一些实施方案中,工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含靶向结构域和RNA编辑实体募集结构域。在一些情况下,工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含靶向结构域和两个募集结构域。
靶向结构域可以邻近RNA编辑实体募集结构域定位,包括紧邻或邻近但被多个核苷酸隔开。在一些实施方案中,靶向结构域可以侧接两个RNA编辑实体募集结构域。在一些情况下,两个或更多个RNA编辑实体募集结构域可以彼此相邻。
工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以包含靶向结构域,该靶向结构域用于靶向核酸序列中的特定序列区或碱基以供RNA编辑实体进行化学转化。在一些情况下,靶向结构域可以包含可以与靶RNA错配的至少单个核苷酸。在一些情况下,靶向结构域中的错配核苷酸可以与两个可以与靶RNA互补的核苷酸相邻。在一些情况下,靶向结构域中的错配核苷酸可以与两个核苷酸相邻,错配核苷酸的每一侧各一个,其可以与靶RNA互补。靶向结构域可以包含比反义RNA、短发夹RNA、siRNA、miRNA或snoRNA更长的序列长度。靶向结构域可以包含足以使工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸形成二级结构的序列长度。靶向结构域可以包含长度为约20个碱基至约1,000个碱基的序列长度。靶向结构域可以包含长度为约50个碱基至约1,000个碱基的序列长度。靶向结构域可以包含长度为约100个碱基至约1,000个碱基的序列长度。靶向结构域可以包含长度为约200个碱基至约1,000个碱基的序列长度。靶向结构域可以包含长度为约500个碱基至约1,000个碱基的序列长度。靶向结构域可以包含长度为至少约50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200个碱基的序列长度。
在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含一个靶向结构域。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含多于一个靶向结构域。在一些实施方案中,工程化多核苷酸或前体工程化多核苷酸可以包含两个靶向结构域。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含靶向同一靶RNA的两个靶向结构域。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含靶向不同靶RNA的两个靶向结构域。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含具有相同多核苷酸序列同一性的两个靶向结构域。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含具有不同多核苷酸序列同一性的两个靶向结构域。
C.RNA编辑实体募集结构域
如本文所述的工程化多核苷酸的功能性部分可以包括RNA编辑实体募集结构域。RNA编辑实体募集结构域可以是包含由RNA编辑实体识别的二级结构的结构域。当存在于RNA编辑实体募集结构域上时,这种结构可以在不与靶多核苷酸缔合的情况下存在。替代性地,这样的结构可以在不存在与靶多核苷酸缔合的情况下不存在,并且可以在与靶多核苷酸杂交时形成。在这种情况下,工程化多核苷酸可以不包含不同于靶向结构域的RNA编辑实体募集结构域。相反,当与靶多核苷酸结合时,RNA编辑实体募集结构域可以是靶向结构域本身。
RNA编辑实体募集结构域可以包含与以下各项的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%、99%或100%的序列同源性:Alu结构域、APOBEC募集结构域、GluR2结构域、TALEN募集结构域、Zn-finger多肽募集结构域、mega-TAL募集结构域或Cas13募集结构域。在一些实施方案中,RNA编辑实体募集结构域可以包含与Alu结构域的至少约20个核苷酸的至少约80%序列同源性。在一些情况下,RNA编辑实体募集结构域可以包含与Alu募集结构域至少约80%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域可以包含:与Alu结构域的至少约15、20、25、30或35个核酸至少约70%、75%、80%、85%、90%或95%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与Alu结构域编码序列至少约80%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与Alu结构域编码序列至少约85%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与Alu结构域编码序列至少约90%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与Alu结构域编码序列至少约95%的序列同源性。在一些情况下,Alu结构域编码序列可以是非天然存在的序列。在一些实施方案中,Alu结构域编码序列可以包含修饰部分。在一些情况下,Alu结构域编码序列可以包含天然存在的Alu结构域编码序列的一部分。
在一些实施方案中,RNA编辑实体募集结构域可以包含:与APOBEC结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,RNA编辑实体募集结构域可以包含:与APOBEC募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域可以包含:与APOBEC结构域的至少约15、20、25、30或35个核酸至少约70%、75%、80%、85%、90%或95%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与APOBEC结构域编码序列至少约80%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与APOBEC结构域编码序列至少约85%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与APOBEC结构域编码序列至少约90%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与APOBEC结构域编码序列至少约95%的序列同源性。在一些情况下,APOBEC结构域编码序列可以是非天然存在的序列。在一些实施方案中,APOBEC结构域编码序列可以包含修饰部分。在一些情况下,APOBEC结构域编码序列可以包含天然存在的APOBEC结构域编码序列的一部分。
在一些实施方案中,募集结构域包含CRISPR相关的募集结构域序列。例如,CRISPR相关的募集序列可以包含Cas蛋白序列。在一些情况下,Cas13募集结构域可以包含Cas13a募集结构域、Cas13b募集结构域、Cas13c募集结构域或Cas13d募集结构域。在一些情况下,RNA编辑实体募集结构域可以包含:与Cas13b募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域可以包含与Cas13b募集结构域至少约80%的序列同源性。在一些情况下,RNA编辑实体募集结构域可以包含:与Cas13b结构域的至少约15、20、25、30或35个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与Cas13b结构域编码序列至少约80%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与Cas13b结构域编码序列至少约85%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与Cas13b结构域编码序列至少约90%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与Cas13b结构域编码序列至少约95%的序列同源性。在一些实施方案中,Cas13b结构域编码序列可以是非天然存在的序列。在一些情况下,Cas13b结构域编码序列可以包含修饰部分。在一些实施方案中,Cas13b结构域编码序列可以包含天然存在的Cas13b结构域编码序列的一部分。
在一些情况下,RNA编辑实体募集结构域可以包含:与GluR2结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域可以包含:与GluR2募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,RNA编辑实体募集结构域可以包含:与GluR2结构域的至少约15、20、25、30或35个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与GluR2结构域编码序列至少约80%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与GluR2结构域编码序列至少约85%的序列同源性。在一些实施方案中,RNA编辑实体募集结构域的至少一部分可以包含与GluR2结构域编码序列至少约90%的序列同源性。在一些情况下,RNA编辑实体募集结构域的至少一部分可以包含与GluR2结构域编码序列至少约95%的序列同源性。在一些实施方案中,GluR2结构域编码序列可以是非天然存在的序列。在一些情况下,GluR2结构域编码序列可以包含修饰部分。在一些实施方案中,GluR2结构域编码序列可以包含天然存在的GluR2结构域编码序列的一部分。在一些情况下,募集结构域的至少一部分可以包含:与募集ADAR的编码序列至少约70%、75%、80%、85%、90%、95%或100%序列同源性。在一些情况下,RNA编辑实体募集结构域可以包含:与MS2-噬菌体-外壳-蛋白质-募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
在可能不存在募集结构域的情况下,工程化多核苷酸仍然能够与主题RNA编辑实体(例如,ADAR)缔合以促进靶RNA的编辑和/或调节由主题靶RNA编码的多肽的表达。这可以通过结构特征来实现。结构特征可以包括以下中的任一项:错配、对称凸起、不对称凸起、对称内环、不对称内环、发夹、摆动碱基对、结构化基序、环化RNA、化学修饰或它们的任何组合。在一个方面,双链RNA(dsRNA)底物(例如杂交的多核苷酸链)可以在本公开的工程化多核苷酸与靶RNA杂交时形成。本文描述的可以是对应于可能存在于本公开的dsRNA底物中的若干结构特征之一的特征。特征的示例包括错配、凸起(对称凸起或不对称凸起)、内环(对称内环或不对称内环)或发夹(包含非靶向结构域的发夹)。本公开的工程化多核苷酸可以具有1至50个特征。本公开的工程化多核苷酸可以具有1至5、5至10、10至15、15至20、20至25、25至30、30至35、35至40、40至45、45至50、5至20、1至3、4至5、2至10、20至40、10至40、20至50、30至50、4至7或8至10个特征。
如本文所公开的,结构化基序在dsRNA底物中包含两个或更多个特征。
双链RNA(dsRNA)底物可以在本公开的工程化引导RNA与靶RNA杂交时形成。如本文所公开的,错配是指引导RNA中的核苷酸可以与dsRNA内的靶RNA中的相对核苷酸不配对。错配可以包含不碱基配对、不互补或两者兼有的任何两个核苷酸。在一些实施方案中,错配可以是A/C错配。A/C错配可以包含与靶RNA中的A相对的本公开的工程化引导RNA中的C。A/C错配可以包含与靶RNA中的C相对的本公开的工程化引导RNA中的A。在一个实施方案中,G/G错配可以包含与靶RNA中的G相对的本公开的工程化引导RNA中的G。在一些实施方案中,位于编辑位点5'的错配可以促进待编辑的目标A的碱基翻转。错配也可能有助于赋予序列特异性。在一个实施方案中,错配包括G/G错配。在一个实施方案中,错配包括A/C错配,其中A可以在靶RNA中,并且C可以在工程化多核苷酸的靶向序列中。在另一个实施方案中,A/C错配中的A可以是靶RNA中由主题RNA编辑实体编辑的核苷酸的碱基。
在一些情况下,主题靶向序列包含与至少部分编码主题多肽的靶RNA的区域至少部分序列互补性。在一些情况下,靶向序列可以包含靶向结构域。在一些情况下,靶向序列包含与靶RNA 95%、96%、97%、98%、99%或100%的序列互补性。在一些情况下,靶向序列包含与靶RNA序列小于100%的互补性。例如,靶向序列和可以被靶向序列结合的靶RNA区域可以具有单个碱基错配。在其他情况下,主题工程化多核苷酸的靶向序列包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、20、30、40或至多约50个碱基错配。在一些方面,核苷酸错配可以与本文提供的结构特征相关联。在一些方面,靶向序列包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14个或至多约15个在互补性方面与主题靶RNA的野生型RNA不同的核苷酸。在一些情况下,靶向序列包含至少50个与靶RNA具有互补性的核苷酸。在一些情况下,靶向序列包含与靶RNA具有互补性的50至150个核苷酸。在一些情况下,靶向序列包含与靶RNA具有互补性的50至200个核苷酸。在一些情况下,靶向序列包含与靶RNA具有互补性的50至250个核苷酸。在一些情况下,靶向序列包含与靶RNA具有互补性的50至300个核苷酸。在一些情况下,靶向序列包含与靶RNA具有互补性的50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299或300个核苷酸。在一些情况下,靶向序列总共包含超过50个核苷酸并且具有与靶RNA具有互补性的至少50个核苷酸。在一些情况下,靶向序列总共包含50至400个核苷酸并且具有与靶RNA具有互补性的50至150个核苷酸。在一些情况下,靶向序列总共包含50至400个核苷酸并且具有与靶RNA具有互补性的50至200个核苷酸。在一些情况下,靶向序列总共包含50至400个核苷酸并且具有与靶RNA具有互补性的50至250个核苷酸。在一些情况下,靶向序列总共包含50至400个核苷酸并且具有与靶RNA具有互补性的50至300个核苷酸。在一些情况下,与靶RNA具有互补性的至少50个核苷酸被一个或多个错配、一个或多个凸起或一个或多个环或它们的任何组合隔开。在一些情况下,与靶RNA具有互补性的50至150个核苷酸被一个或多个错配、一个或多个凸起或一个或多个环或它们的任何组合隔开。在一些情况下,与靶RNA具有互补性的50至200个核苷酸被一个或多个错配、一个或多个凸起或一个或多个环或它们的任何组合隔开。在一些情况下,与靶RNA具有互补性的50至250个核苷酸被一个或多个错配、一个或多个凸起或一个或多个环或它们的任何组合隔开。在一些情况下,与靶RNA具有互补性的50至300个核苷酸被一个或多个错配、一个或多个凸起或一个或多个环或它们的任何组合隔开。例如,靶向序列包含总共54个核苷酸,其中依次有25个核苷酸与靶RNA互补,4个核苷酸形成凸起,并且25个核苷酸与靶RNA互补。又如,靶向序列包含总共118个核苷酸,其中依次有25个核苷酸与靶RNA互补,4个核苷酸形成凸起,25个核苷酸与靶RNA互补,14个核苷酸形成环,并且50个核苷酸与靶RNA互补。
在一个方面,结构特征可以独立地在工程化多核苷酸中形成。在其他情况下,当工程化多核苷酸与靶RNA结合时,可以形成结构特征。当工程化多核苷酸与其他分子诸如肽、核苷酸或小分子结合时,也可以形成结构特征。在某些实施方案中,工程化多核苷酸的结构特征可以不依赖于靶RNA形成,并且其结构可以由于工程化多肽与靶RNA区域杂交而改变。在某些实施方案中,当工程化多核苷酸可以与靶RNA结合时,可以存在结构特征。
在一些情况下,结构特征可以是发夹。在一些情况下,工程化多核苷酸可能缺乏发夹结构域。在其他情况下,工程化多核苷酸可以含有一个发夹结构域或多于一个发夹结构域。发夹可以位于多核苷酸中的任何位置。如本文所公开的,发夹可以是RNA双链体,其中单条RNA链自身折叠形成RNA双链体。由于在折叠区碱基对的上游和下游具有核苷酸序列,因此单条RNA链自身折叠。发夹可以具有整个双链结构的10至500个核苷酸的长度。发夹的茎环结构可以是3至15个核苷酸长。发夹可以存在于本文公开的任何工程化多核苷酸中。本文公开的工程化多核苷酸可以具有1至10个发夹。在一些实施方案中,本文公开的工程化多核苷酸具有1个发夹。在一些实施方案中,本文公开的工程化多核苷酸具有2个发夹。如本文所公开的,发夹可以指募集发夹或发夹或非募集发夹。发夹可以位于本公开的工程化多核苷酸内的任何位置。在一些实施方案中,一个或多个发夹可以存在于本公开的工程化多核苷酸的3'端、本公开的工程化多核苷酸的5'端或本公开的工程化多核苷酸的靶向序列内,或它们的任何组合。
在一个方面,结构特征包含如本文所公开的募集发夹。募集发夹可以募集RNA编辑实体,诸如ADAR。在一些实施方案中,募集发夹包含GluR2结构域。在一些实施方案中,募集发夹包含Alu结构域。
在另一方面,结构特征包括非募集发夹。如本文所公开的,非募集发夹可以表现出改善工程化多核苷酸定位至靶RNA的功能性。在一些实施方案中,非募集发夹改善核保留。在一些实施方案中,非募集发夹包含来自U7 snRNA的发夹。
在另一方面,结构特征包括摆动碱基。摆动碱基对是指弱配对的两个碱基。例如,本公开的摆动碱基对可以指与U配对的G。
本公开的发夹可以具有任何长度。在一个方面,发夹可以是约5-200个或更多个核苷酸。在一些情况下,发夹可以包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399或400个或更多个核苷酸。在其他情况下,发夹还可以包含5至10、5至20、5至30、5至40、5至50、5至60、5至70、5至80、5至90、5至100、5至110、5至120、5至130、5至140、5至150、5至160、5至170、5至180、5至190、5至200、5至210、5至220、5至230、5至240、5至250、5至260、5至270、5至280、5至290、5至300、5至310、5至320、5至330、5至340、5至350、5至360、5至370、5至380、5至390或5至400个核苷酸。发夹可以是由单链RNA形成的结构特征,该单链RNA与其自身具有足够的互补性以杂交成双链RNA基序/结构,该双链RNA基序/结构由通过核苷酸环隔开的双链杂交RNA组成。
在一些情况下,结构特征可以是凸起。凸起可以包含靶链与工程化多核苷酸链之间的单个(有意的)核酸错配。在其他情况下,链之间的多于一个连续错配构成凸起,只要凸起区域(碱基的错配延伸)可以在两侧与杂交的互补dsRNA区域侧接。凸起可以位于多核苷酸的任何位置。在一些情况下,凸起可以位于距5'羟基或3'羟基约30至约70个核苷酸处。
在一个实施方案中,双链RNA(dsRNA)底物可以在本公开的工程化多核苷酸与靶RNA杂交时形成。如本文所公开的,凸起是指在dsRNA底物形成时形成的结构,其中工程化多核苷酸或靶RNA中的核苷酸与它们在相反链上的位置对应物不互补。凸起可能会改变dsRNA底物的二级或三级结构。凸起可以在dsRNA底物的工程化多核苷酸侧或dsRNA底物的靶RNA侧具有1至4个核苷酸。在一些实施方案中,本公开的工程化多核苷酸具有2个凸起。在一些实施方案中,本公开的工程化多核苷酸具有3个凸起。在一些实施方案中,本公开的工程化多核苷酸具有4个凸起。在一些实施方案中,dsRNA底物中凸起的存在可以定位ADAR以选择性地编辑靶RNA中的靶A并减少非靶的脱靶编辑。在一些实施方案中,dsRNA底物中凸起的存在可以募集另外的ADAR。本文公开的dsRNA底物中的凸起可能会募集其他蛋白质,诸如其他RNA编辑实体。在一些实施方案中,位于编辑位点5'的凸起可以促进待编辑的目标A的碱基翻转。凸起也可能有助于赋予序列特异性。凸起可以通过将ADAR编辑限制在产生对靶A的选择性编辑的方向来帮助引导ADAR编辑。在一些实施方案中,对靶A的选择性编辑通过将靶A定位在两个凸起之间(例如,基于工程化多核苷酸,定位在5'端凸起与3'端凸起之间)来实现。在一些实施方案中,这两个凸起都是对称的凸起。在一些实施方案中,两个凸起各自由dsRNA靶标的工程化多核苷酸侧上的2个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。在一些实施方案中,两个凸起各自由dsRNA靶标的工程化多核苷酸侧上的3个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。在一些实施方案中,两个凸起各自由dsRNA靶标的工程化多核苷酸侧上的4个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。在一些实施方案中,靶A是在两个凸起之间的位置,并且距凸起至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399或400个核苷酸(例如,距5'端凸起或3'端凸起)。在一些实施方案中,另外的结构特征位于凸起之间(例如,在5'端凸起与3'端凸起之间)。在一些实施方案中,凸起中的错配包含用于在靶RNA中编辑的核苷酸碱基(例如,凸起中的A/C错配,其中工程化多核苷酸中的凸起的一部分包含与靶RNA中的凸起的一部分中的A错配的C,并且A被编辑)。
在一个方面,双链RNA(dsRNA)底物可以在本公开的工程化多核苷酸与靶RNA杂交时形成。凸起可以是对称凸起或不对称凸起。凸起可以由dsRNA底物的引导RNA侧或靶RNA侧上的1至4个参与核苷酸形成。当在凸起的每一侧上可以存在相同数目的核苷酸时,可以形成对称的凸起。对称凸起可以在dsRNA底物的工程化多核苷酸侧或dsRNA底物的靶RNA侧具有2至4个核苷酸。例如,本公开的dsRNA底物中的对称凸起可以在dsRNA底物的工程化多核苷酸侧和靶RNA侧上具有相同数目的核苷酸。本公开的对称凸起可以由dsRNA靶标的工程化多核苷酸侧上的2个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的对称凸起可以由dsRNA靶标的工程化多核苷酸侧上的3个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的对称凸起可以由dsRNA靶标的工程化多核苷酸侧上的4个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。
双链RNA(dsRNA)底物可以在本公开的工程化引导RNA与靶RNA杂交时形成。凸起可以是对称凸起或不对称凸起。当在凸起的每一侧上可以存在不同数目的核苷酸时,可以形成不对称的凸起。不对称凸起可能在dsRNA底物的引导RNA侧或靶RNA侧具有1至4个参与核苷酸。例如,本公开的dsRNA底物中的不对称凸起可以在dsRNA底物的工程化引导RNA侧和靶RNA侧上具有不同数目的核苷酸。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的1个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程化引导RNA侧上的1个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程化引导RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程化引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的0个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的0个核苷酸和dsRNA底物的工程化引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程化引导RNA侧上的2个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程化引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的1个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的1个核苷酸和dsRNA底物的工程化引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的2个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的2个核苷酸和dsRNA底物的工程化引导RNA侧上的3个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的2个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的2个核苷酸和dsRNA底物的工程化引导RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的工程化引导RNA侧上的3个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成。本公开的不对称凸起可以由dsRNA底物的靶RNA侧上的3个核苷酸和dsRNA底物的工程化引导RNA侧上的4个核苷酸形成。在一些实施方案中,不对称凸起提高了编辑靶A的效率。在一些实施方案中,提高编辑靶A的效率的不对称凸起是为了减少工程化多核苷酸的序列中腺苷的数目而形成的不对称凸起。提高编辑靶A的效率的不对称凸起的非限制性示例是由dsRNA底物的工程化多核苷酸侧上的0个核苷酸和dsRNA底物的靶RNA侧上的1个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的0个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的0个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的0个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的1个核苷酸和dsRNA底物的靶RNA侧上的2个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的1个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的1个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的2个核苷酸和dsRNA底物的靶RNA侧上的3个核苷酸形成的不对称凸起;由dsRNA底物的工程化多核苷酸侧上的2个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成的不对称凸起;以及由dsRNA底物的工程化多核苷酸侧上的3个核苷酸和dsRNA底物的靶RNA侧上的4个核苷酸形成的不对称凸起。
在一个方面,双链RNA(dsRNA)底物可以在本公开的工程化多核苷酸与靶RNA杂交时形成。在一些情况下,结构特征可以是环。如本文所公开的,内环是指在dsRNA底物形成时形成的结构,其中工程化多核苷酸或靶RNA中的核苷酸与它们在相反链上的位置对应物不互补,并且其中内环的一侧,在dsRNA底物的靶RNA侧或工程化多核苷酸侧,具有大于5个核苷酸。内环可以是对称的内环或不对称的内环。存在于编辑位点附近的内环可以帮助待编辑的靶RNA中的靶A的碱基翻转。双链RNA(dsRNA)底物可以在本公开的工程化多核苷酸与靶RNA杂交时形成。内环可以是对称的内环或不对称的内环。在一些实施方案中,对靶A的选择性编辑通过将靶A定位在两个环之间(例如,基于工程化多核苷酸,定位在5'端环与3'端环之间)来实现。在一些实施方案中,这两个环都是对称的环。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。在一些实施方案中,两个环各自由dsRNA靶标的工程化多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。在一些实施方案中,靶A是在两个环之间的位置,并且距环至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399或400个核苷酸(例如,距5'端环或3'端环)。在一些实施方案中,另外的结构特征位于环之间(例如,在5'端环与3'端环之间)。在一些实施方案中,环中的错配包含用于在靶RNA中编辑的核苷酸碱基(例如,环中的A/C错配,其中工程化多核苷酸中的凸起的一部分包含与靶RNA中的环的一部分中的A错配的C,并且A被编辑)。
当在内环的每一侧上可以存在相同数目的核苷酸时,可以形成对称的内环。例如,本公开的dsRNA底物中的对称内环可以在dsRNA底物的工程化多核苷酸侧和靶RNA侧上具有相同数目的核苷酸。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。
在一个方面,双链RNA(dsRNA)底物可以在本公开的工程化多核苷酸与靶RNA杂交时形成。内环可以是对称的内环或不对称的内环。存在于编辑位点附近的内环可以帮助待编辑的靶RNA中的靶A的碱基翻转。双链RNA(dsRNA)底物在本公开的工程化多核苷酸与靶RNA杂交时形成。内环可以是对称的内环或不对称的内环。当在内环的每一侧上存在相同数目的核苷酸时,形成对称的内环。例如,本公开的dsRNA底物中的对称内环可以在dsRNA底物的工程化多核苷酸侧和靶RNA侧上具有相同数目的核苷酸。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。内环的一侧,在dsRNA底物的靶RNA侧或工程化多核苷酸侧,可以由5至150个核苷酸形成。内环的一侧可以由5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、120、135、140、145、150、200、250、300、350、400、450、500、600、700、800、900或1000个核苷酸或它们之间的任何数目的核苷酸形成。内环的一侧可以由5个核苷酸形成。内环的一侧可以由10个核苷酸形成。内环的一侧可以由15个核苷酸形成。内环的一侧可以由20个核苷酸形成。内环的一侧可以由25个核苷酸形成。内环的一侧可以由30个核苷酸形成。内环的一侧可以由35个核苷酸形成。内环的一侧可以由40个核苷酸形成。内环的一侧可以由45个核苷酸形成。内环的一侧可以由50个核苷酸形成。内环的一侧可以由55个核苷酸形成。内环的一侧可以由60个核苷酸形成。内环的一侧可以由65个核苷酸形成。内环的一侧可以由70个核苷酸形成。内环的一侧可以由75个核苷酸形成。内环的一侧可以由80个核苷酸形成。内环的一侧可以由85个核苷酸形成。内环的一侧可以由90个核苷酸形成。内环的一侧可以由95个核苷酸形成。内环的一侧可以由100个核苷酸形成。内环的一侧可以由110个核苷酸形成。内环的一侧可以由120个核苷酸形成。内环的一侧可以由130个核苷酸形成。内环的一侧可以由140个核苷酸形成。内环的一侧可以由150个核苷酸形成。内环的一侧可以由200个核苷酸形成。内环的一侧可以由250个核苷酸形成。内环的一侧可以由300个核苷酸形成。内环的一侧可以由350个核苷酸形成。内环的一侧可以由400个核苷酸形成。内环的一侧可以由450个核苷酸形成。内环的一侧可以由500个核苷酸形成。内环的一侧可以由600个核苷酸形成。内环的一侧可以由700个核苷酸形成。内环的一侧可以由800个核苷酸形成。内环的一侧可以由900个核苷酸形成。内环的一侧可以由1000个核苷酸形成。内环可以是对称的内环或不对称的内环。存在于编辑位点附近的内环可以帮助待编辑的靶RNA中的靶A的碱基翻转。双链RNA(dsRNA)底物在本公开的工程化多核苷酸与靶RNA杂交时形成。内环可以是对称的内环或不对称的内环。当在内环的每一侧上存在相同数目的核苷酸时,形成对称的内环。例如,本公开的dsRNA底物中的对称内环可以在dsRNA底物的工程化多核苷酸侧和靶RNA侧上具有相同数目的核苷酸。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的5至150个核苷酸和dsRNA底物的靶RNA侧上的5至150个核苷酸形成,其中dsRNA靶标的工程化侧和dsRNA底物的靶RNA侧上的核苷酸数目相同。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的5至1000个核苷酸和dsRNA底物的靶RNA侧上的5至1000个核苷酸形成,其中dsRNA靶标的工程化侧和dsRNA底物的靶RNA侧上的核苷酸数目相同。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的5个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的15个核苷酸和dsRNA底物的靶RNA侧上的15个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的20个核苷酸和dsRNA底物的靶RNA侧上的20个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的30个核苷酸和dsRNA底物的靶RNA侧上的30个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的40个核苷酸和dsRNA底物的靶RNA侧上的40个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的50个核苷酸和dsRNA底物的靶RNA侧上的50个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的60个核苷酸和dsRNA底物的靶RNA侧上的60个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的70个核苷酸和dsRNA底物的靶RNA侧上的70个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的80个核苷酸和dsRNA底物的靶RNA侧上的80个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的90个核苷酸和dsRNA底物的靶RNA侧上的90个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的100个核苷酸和dsRNA底物的靶RNA侧上的100个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的110个核苷酸和dsRNA底物的靶RNA侧上的110个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的120个核苷酸和dsRNA底物的靶RNA侧上的120个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的130个核苷酸和dsRNA底物的靶RNA侧上的130个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的140个核苷酸和dsRNA底物的靶RNA侧上的140个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的150个核苷酸和dsRNA底物的靶RNA侧上的150个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的200个核苷酸和dsRNA底物的靶RNA侧上的200个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的250个核苷酸和dsRNA底物的靶RNA侧上的250个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的300个核苷酸和dsRNA底物的靶RNA侧上的300个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的350个核苷酸和dsRNA底物的靶RNA侧上的350个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的400个核苷酸和dsRNA底物的靶RNA侧上的400个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的450个核苷酸和dsRNA底物的靶RNA侧上的450个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的500个核苷酸和dsRNA底物的靶RNA侧上的500个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的600个核苷酸和dsRNA底物的靶RNA侧上的600个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的700个核苷酸和dsRNA底物的靶RNA侧上的700个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的800个核苷酸和dsRNA底物的靶RNA侧上的800个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的900个核苷酸和dsRNA底物的靶RNA侧上的900个核苷酸形成。本公开的对称内环可以由dsRNA靶标的工程化多核苷酸侧上的1000个核苷酸和dsRNA底物的靶RNA侧上的1000个核苷酸形成。
在一个方面,双链RNA(dsRNA)底物在本公开的工程化多核苷酸与靶RNA杂交时形成。内环可以是对称的内环或不对称的内环。当在内环的每一侧上存在不同数目的核苷酸时,形成不对称的内环。例如,本公开的dsRNA底物中的不对称内环可以在dsRNA底物的工程化多核苷酸侧和靶RNA侧上具有不同数目的核苷酸。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5至150个核苷酸和dsRNA底物的靶RNA侧上的5至150个核苷酸形成,其中dsRNA靶标的工程化侧上的核苷酸的数目不同于dsRNA底物的靶RNA侧上的核苷酸的数目。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5至1000个核苷酸和dsRNA底物的靶RNA侧上的5至1000个核苷酸形成,其中dsRNA靶标的工程化侧上的核苷酸的数目不同于dsRNA底物的靶RNA侧上的核苷酸的数目。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的6个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的6个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的7个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程化多核苷酸侧上的7个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程化多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程化多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的6个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的6个核苷酸和dsRNA底物的工程化多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的8个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程化多核苷酸侧上的8个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程化多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的7个核苷酸和dsRNA底物的工程化多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的9个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的8个核苷酸和dsRNA底物的工程化多核苷酸侧上的9个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的8个核苷酸和dsRNA底物的工程化多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的工程化多核苷酸侧上的9个核苷酸和dsRNA底物的靶RNA侧上的10个核苷酸内环形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的9个核苷酸和dsRNA底物的工程化多核苷酸侧上的10个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的5个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的50个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的50个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的100个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的100个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的150个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的5个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的150个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的200个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的200个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的300个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的300个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的400个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的400个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的500个核苷酸和dsRNA底物的工程化多核苷酸侧上的1000个核苷酸形成。本公开的不对称内环可以由dsRNA底物的靶RNA侧上的1000个核苷酸和dsRNA底物的工程化多核苷酸侧上的500个核苷酸形成。在一些实施方案中,不对称环提高了编辑靶A的效率。在一些实施方案中,提高编辑靶A的效率的不对称环是为了减少工程化多核苷酸的序列中腺苷的数目而形成的不对称凸起。提高编辑靶A的效率的不对称环的非限制性示例是由dsRNA底物的工程化多核苷酸侧上的5个核苷酸和dsRNA底物的靶RNA侧上的20个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的10个核苷酸和dsRNA底物的靶RNA侧上的50个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的60个核苷酸和dsRNA底物的靶RNA侧上的80个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的18个核苷酸和dsRNA底物的靶RNA侧上的24个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的100个核苷酸和dsRNA底物的靶RNA侧上的150个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的70个核苷酸和dsRNA底物的靶RNA侧上的75个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的8个核苷酸和dsRNA底物的靶RNA侧上的15个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的45个核苷酸和dsRNA底物的靶RNA侧上的46个核苷酸形成的不对称环;由dsRNA底物的工程化多核苷酸侧上的45个核苷酸和dsRNA底物的靶RNA侧上的50个核苷酸形成的不对称环;以及由dsRNA底物的工程化多核苷酸侧上的7个核苷酸和dsRNA底物的靶RNA侧上的15个核苷酸形成的不对称环。
包括凸起或环的结构特征可以具有任何尺寸。在一些情况下,凸起或环包含至少:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、200、250、300、350、400、450、500、600、700、800、900或1000个碱基。在一些情况下,凸起或环总共包含至少约1-10、5-15、10-20、15-25、20-30、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、1-110、1-120、1-130、1-140、1-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1000、20-50、20-60、20-70、20-80、20-90、20-100、20-110、20-120、20-130、20-140、20-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1000、30-40、30-50、30-60、30-70、30-80、30-90、30-100、30-110、30-120、30-130、30-140、30-150、30-200、30-250、30-300、30-350、30-400、30-450、30-500、30-600、30-700、30-800、30-900、30-1000、40-50、40-60、40-70、40-80、40-90、40-100、40-110、40-120、40-130、40-140、40-150、40-200、40-250、40-300、40-350、40-400、40-450、40-500、40-600、40-700、40-800、40-900、40-1000、50-60、50-70、50-80、50-90、50-100、50-110、50-120、50-130、50-140、50-150、50-200、50-250、50-300、50-350、50-400、50-450、50-500、50-600、50-700、50-800、50-900、50-1000、60-70、60-80、60-90、60-100、60-110、60-120、60-130、60-140、60-150、60-200、60-250、60-300、60-350、60-400、60-450、60-500、60-600、60-700、60-800、60-900、60-1000、70-80、70-90、70-100、70-110、70-120、70-130、70-140、70-150、70-200、70-250、70-300、70-350、70-400、70-450、70-500、70-600、70-700、70-800、70-900、70-1000、80-90、80-100、80-110、80-120、80-130、80-140、80-150、80-200、80-250、80-300、80-350、80-400、80-450、80-500、80-600、80-700、80-800、80-900、80-1000、90-100、90-110、90-120、90-130、90-140、90-150、90-200、90-250、90-300、90-350、90-400、90-450、90-500、90-600、90-700、90-800、90-900、90-1000、100-110、100-120、100-130、100-140、100-150、100-200、100-250、100-300、100-350、100-400、100-450、100-500、100-600、100-700、100-800、100-900、100-1000、110-120、110-130、110-140、110-150、110-200、110-250、110-300、110-350、110-400、110-450、110-500、110-600、110-700、110-800、110-900、110-1000、120-130、120-140、120-150、120-200、120-250、120-300、120-350、120-400、120-450、120-500、120-600、120-700、120-800、120-900、120-1000、130-140、130-150、130-200、130-250、130-300、130-350、130-400、130-450、130-500、130-600、130-700、130-800、130-900、130-1000、140-150、140-200、140-250、140-300、140-350、140-400、140-450、140-500、140-600、140-700、140-800、140-900、140-1000、150-200、150-250、150-300、150-350、150-400、150-450、150-500、150-600、150-700、150-800、150-900、150-1000、200-250、200-300、200-350、200-400、200-450、200-500、200-600、200-700、200-800、200-900、200-1000、250-300、250-350、250-400、250-450、250-500、250-600、250-700、250-800、250-900、250-1000、300-350、300-400、300-450、300-500、300-600、300-700、300-800、300-900、300-1000、350-400、350-450、350-500、350-600、350-700、350-800、350-900、350-1000、400-450、400-500、400-600、400-700、400-800、400-900、400-1000、500-600、500-700、500-800、500-900、500-1000、600-700、600-800、600-900、600-1000、700-800、700-900、700-1000、800-900、800-1000或900-1000个碱基。
在一些情况下,结构特征可以是结构化基序。如本文所公开的,结构化基序在dsRNA底物中包含两个或更多个结构特征。结构化基序可以包括结构特征的任何组合,诸如在上述权利要求中,以产生用于在精确位置进行ADAR编辑的理想底物。这些结构化基序可以被人工设计以最大化ADAR编辑,和/或这些结构化基序可以被建模以概括已知的ADAR底物。
在一些情况下,本文提供的多核苷酸可以是环化的或呈环状构型。在一些方面,至少部分环状的多核苷酸缺乏5'羟基或3'羟基。
在一些情况下,靶RNA可以包括核RNA、细胞质RNA或线粒体RNA。在一些实施方案中,靶RNA可以包括基因间DNA(包括但不限于异染色质DNA)、信使RNA(mRNA)、前信使RNA、转移RNA(tRNA)、核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、序列的分离DNA、序列的分离RNA、sgRNA、引导RNA、核酸探针、引物、snRNA、长非编码RNA、小RNA、snoRNA、siRNA、miRNA、tRNA来源的小RNA(tsRNA)、反义RNA、shRNA或小rDNA来源的RNA(srRNA)。
在一些实施方案中,工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以形成包括茎环、十字形、趾固、错配凸起或它们的任何组合的二级结构。在一些情况下,二级结构可以包括茎、发夹环、假结、凸起、内环、多环、G-四链体或它们的任何组合。在一些实施方案中,工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以采用A-型、B-型、Z-型或它们的任何组合。
与可比较的引导RNA或缺乏二级结构的可比较的多核苷酸相比,包含二级结构的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以显著增强与靶RNA结合的亲和力、增强与靶RNA结合的特异性、提高对靶RNA的编辑效率、减少脱靶编辑、减少对非靶RNA的编辑、提高募集RNA编辑实体的效率或它们的组合。与可比较的引导RNA或缺乏凸起的可比较的多核苷酸相比,包含凸起的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以显著增强与靶RNA结合的亲和力、增强与靶RNA结合的特异性、提高对靶RNA的编辑效率、减少脱靶编辑、减少对非靶RNA的编辑、提高募集RNA编辑实体的效率或它们的组合。与缺乏茎环、十字形、趾固、错配凸起、茎、发夹环、假结、内环、多环、G-四链体或它们的任何组合的可比较的引导RNA或可比较的多核苷酸相比,包含茎环、十字形、趾固、错配凸起、茎、发夹环、假结、内环、多环、G-四链体或它们的任何组合的工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以显著增强与靶RNA结合的亲和力、增强与靶RNA结合的特异性、提高对靶RNA的编辑效率、减少脱靶编辑、减少对非靶RNA的编辑、提高募集RNA编辑实体的效率或它们的组合。
工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以包含RNA聚合酶III启动子的序列。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含与U7、U1、U6、H1、7SK启动子序列或它们的任何组合具有至少约70%、75%、80%、85%、90%、95%或100%同源性的序列。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含PolII启动子,诸如CMV启动子、EF1α启动子、MCK启动子或Spc5-12启动子。在一些情况下,工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以包含RNA序列基序。在一些情况下,工程化多核苷酸或前体工程化多核苷酸可以包含与本文所述的RNA序列基序具有至少约70%、75%、80%、85%、90%、95%或100%同源性的序列。在一些情况下,RNA序列基序可以包含SmOPT序列、hnRNPA1序列、MALAT1序列、SIRLOIN序列、GluR2序列、G-四链体加帽、Alu序列、Cas9gRNA或它们的组合。在一些情况下,RNA序列基序可以包含二级RNA结构,诸如发夹结构。在一些情况下,RNA序列基序可以包含一个或多个RNA序列基序、一个或多个启动子序列或两者。例如,工程化多核苷酸可以包含与SmOPT序列融合的U7启动子序列。
结构域可以形成二维形状或二级结构。例如,靶向结构域、RNA编辑实体募集结构域或它们的组合可以形成二级结构,该二级结构可以包含线性区域、十字形、趾固、茎环、或它们的部分、或它们的任何组合。结构域本身可以形成基本上线性的二维结构。结构域可以形成可以包括十字形的二级结构。结构域可以形成可以包括茎环的二级结构。结构域可以形成可以包括趾固的二级结构。在一些情况下,结构域可以是单个核苷酸。在一些情况下,结构域可以是至少单个核苷酸。在一些情况下,结构域可以包含多核苷酸的序列。在一些实施方案中,结构域可以包含多核苷酸的特异性序列。在一些情况下,结构域可以包含多核苷酸的非特异性序列。在一些实施方案中,序列结构域可以与另一个结构域的序列重叠。在其他情况下,结构域的序列可以不与另一个结构域的序列重叠。
工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以进一步包含RNA编辑实体募集结构域。在一些实施方案中,靶向结构域可以在RNA编辑实体募集结构域的约5、10、15、20、25、30、35、40、45或50个核苷酸内。
工程化引导多核苷酸的靶向结构域与靶RNA的编码区的缔合可以促进RNA编辑实体诸如ADAR1、ADAR2、APOBEC或它们的任何组合对靶RNA中的碱基的编辑。在一些情况下,对碱基的编辑可以是碱基的化学转化。在一些情况下,靶向结构域可以至少部分结合或能够至少部分结合在疾病或疾患中实施的靶RNA。在一些情况下,RNA编辑可以在体外测定中通过将靶RNA和设计用于靶向靶RNA的工程化引导多核苷酸直接或间接引入(例如转染)到同一细胞中来确定。在一些情况下,可以通过载体诸如AAV2载体将工程化引导引入到细胞中。在一些情况下,可以通过转染诸如转染编码工程化引导RNA的质粒来将工程化引导引入到细胞中。可以对靶RNA进行测序以鉴定由工程化引导多核苷酸进行的编辑。在一些情况下,细胞可以是原代细胞。在一些情况下,原代细胞或细胞可以是神经元、感光细胞(例如S视锥细胞、L视锥细胞、M视锥细胞、视杆细胞)、视网膜色素上皮细胞、神经胶质细胞(例如星形胶质细胞、少突胶质细胞、小胶质细胞)、肌细胞(例如成肌细胞、肌管)、肝细胞、肺上皮细胞或成纤维细胞(例如真皮成纤维细胞)。在一些情况下,细胞可以是水平细胞、神经节细胞或双极细胞。在一些情况下,细胞系可以是哺乳动物细胞系,诸如HEK293T、NCI-60、MCF-7、HL-60、293T(人胚胎肾)、RD(人胚胎横纹肌肉瘤)、LHCN(人骨骼肌成肌细胞)分化细胞、LHCN未分化细胞、Saos-2、CHO或HeLa细胞。在一些情况下,细胞可以是分化细胞。在一些情况下,细胞可以是未分化细胞。在一些情况下,细胞系可以是昆虫细胞系,诸如Sf9。
工程化引导RNA、工程化多核苷酸或编码工程化多核苷酸的前体工程化线性多核苷酸可以促进例如经由RNA编辑实体对靶RNA的编辑。在一些情况下,工程化多核苷酸可能不促进对靶RNA的编辑。在一些情况下,相对于可以包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的多核苷酸,工程化多核苷酸对靶RNA的编辑效率可以提高至少约90%。在一些实施方案中,编辑效率可以通过以下方式来确定:(i)将靶RNA转染到原代细胞系中,(ii)将工程化多核苷酸和可以包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的多核苷酸转染到原代细胞系中,以及(iii)对靶RNA进行测序。在一些实施方案中,编辑效率可以通过以下方式来确定:(i)将靶RNA转染到原代细胞系中,(ii)将工程化多核苷酸和可以包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的多核苷酸转染到原代细胞系中,以及(iii)对靶RNA进行质谱分析。在一些实施方案中,RNA编辑实体对靶RNA的核苷酸碱基的编辑可以在体外测定中确定,该体外测定包括:(i)将靶RNA直接或间接引入(例如转染)到原代细胞系中,(ii)将工程化多核苷酸直接或间接引入(例如转染)到原代细胞系中,以及(iii)对靶RNA进行测序。在一些情况下,将靶RNA转染到原代细胞系中可以包括将编码靶RNA的质粒转染到原代细胞系中。在一些情况下,将工程化多核苷酸转染到原代细胞系中可以包括将前体工程化多核苷酸或编码前体工程化线性多核苷酸的多核苷酸(例如质粒)转染到原代细胞系中。在一些情况下,测序可以包括在靶RNA被逆转录酶转化成cDNA后对靶RNA进行Sanger测序。在一些情况下,原代细胞系可以包括神经元、感光细胞、视网膜色素上皮细胞、神经胶质细胞、成肌细胞、肌管细胞、肝细胞、肺上皮细胞或成纤维细胞。
RNA编辑实体可以包含内源酶。在一些情况下,RNA编辑实体可以包含重组酶。在一些情况下,RNA编辑实体可以包含融合多肽。在一些实施方案中,RNA编辑实体可以包含APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(“APOBEC3E”现在可以指代此)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、活化诱导的(胞苷)脱氨酶(AID)、ADAR1、ADAR1p110、ADAR1p150、ADAR2、ADAR3或它们的任何组合。在一些情况下,RNA编辑实体可以包含:与APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(“APOBEC3E”现在可以指代此)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、活化诱导的(胞苷)脱氨酶(AID)、ADAR1、ADAR1p110、ADAR1p150、ADAR2、ADAR3或它们的任何组合至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。在一些情况下,RNA编辑实体可以包含人类酶,诸如hADAR1、hADAR2或hADAR3。在一些情况下,RNA编辑实体可以是病毒编码的RNA依赖性RNA聚合酶。在一些情况下,RNA编辑实体可以是来自麻疹、腮腺炎或副流感病毒的病毒编码的RNA依赖性RNA聚合酶。在一些情况下,RNA编辑实体可以是来自布氏锥虫(Trypanosomabrucei)的能够添加或缺失靶RNA中的一个或多个核苷酸的酶。在一些情况下,RNA编辑实体可以是来自布氏锥虫的能够在靶RNA中添加或缺失一个尿嘧啶或多于一个尿嘧啶的酶。
工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸可以募集RNA编辑实体,当与工程化引导RNA和靶RNA结合时,该RNA编辑实体对靶RNA中的核苷酸碱基进行化学转化。在一些情况下,化学转化可以包括对碱基的编辑。在一些实施方案中,相对于缺乏化学转化的在其他方面可比较的靶RNA,化学转化(诸如对碱基的编辑)可以导致在翻译具有化学转化的靶RNA后蛋白质或其片段的水平增加。在一些情况下,增加的水平可以为约5%至约100%、10%至约50%、25%至约75%或约40%至约90%。在一些实施方案中,相对于缺乏化学转化的在其他方面可比较的靶RNA,化学转化可以导致在翻译具有化学转化的靶RNA后蛋白质或其片段的水平降低。在一些情况下,降低的水平可以为约:5%至约99%、10%至约50%、25%至约75%或约40%至约90%。在一些实施方案中,相对于缺乏编辑的在其他方面可比较的靶RNA的翻译蛋白质,化学转化可以导致在翻译具有对碱基的编辑的靶RNA后蛋白质或其片段的长度增加、蛋白质或其片段的功能性增加、蛋白质或其片段的稳定性增加或它们的任何组合。在一些情况下,增加的长度可以为约:5%至约100%、2%至约10%、10%至约25%、25%至约50%、40%至约80%或约75%至约150%。在一些情况下,增加的蛋白质长度可以超过100%。在一些情况下,增加的稳定性可以是增加的蛋白质或其片段的半衰期。在一些情况下,增加的半衰期可以是缺乏编辑的在其他方面可比较的靶RNA的翻译蛋白的至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍。在一些情况下,增加的功能性可以包括可以增加反应速度、增加Vmax或两者的蛋白质或其片段,诸如酶。在一些情况下,增加的功能性可以包括由具有对碱基的编辑的靶RNA编码的蛋白质(例如酶)或其片段,与缺乏编辑的在其他方面可比较的靶RNA的翻译蛋白质相比包含较低的活化能。在一些情况下,对多核苷酸的碱基的编辑可以包括化学转化。在一些实施方案中,化学转化可以将有义密码子转化为终止密码子。在一些情况下,终止密码子可能与疾病致病途径有关,并将终止密码子转化为有义密码子可以减少疾病致病途径。在一些情况下,化学转化可以将终止密码子转化为有义密码子。在一些实施方案中,化学转化可以将第一有义密码子转化为第二有义密码子。例如,在错义突变中。在一些情况下,第一有义密码子可能与疾病致病途径有关,并将第一有义密码子转化为第二有义密码子可以减少疾病致病途径。在一些情况下,化学转化可以将第一终止密码子转化为第二终止密码子。在一些情况下,化学转化可以将指定第一氨基酸的有义密码子转化为指定第二氨基酸的第二有义密码子。在一些情况下,第一氨基酸可以是蛋白酶切割位点。在一些实施方案中,相对于缺乏化学转化的在其他方面可比较的靶RNA,化学转化可以改变在翻译具有化学转化的靶RNA后蛋白质或其片段的定位、折叠或合成。在一些情况下,相对于缺乏化学转化的在其他方面可比较的靶RNA,化学转化可以改变具有化学转化的靶RNA的定位、折叠或合成。在一些实施方案中,靶RNA可以包含编码或非编码RNA。在一些情况下,RNA编辑可以发生在靶RNA的多个位置,如图4所示。图4示出了与对照相比,来自环状引导RNA的RAB7A 3'UTR中不同腺苷核苷酸的RNA编辑百分比。环状引导RNA被示出在Rab7a 3'UTR序列中不同位置编辑多个核苷酸。最高百分比的RNA编辑发生在Rab7a 3'UTR序列的-3位置处。
在一些实施方案中,RNA编辑可以通过确定靶RNA的RNA编辑百分比来评估。在一些情况下,RNA编辑可以通过蛋白质水平的变化来确定。在一些情况下,蛋白质的水平可以通过蛋白质印迹来测量。在一些情况下,蛋白质的水平可以通过密度测定法用定量蛋白质凝胶来测量。在一些情况下,靶RNA的RNA编辑百分比可以在用工程化多核苷酸转染后的不同时间点(例如24小时、48小时、96小时)通过将靶RNA逆转录为cDNA,然后使用Sanger测序来确定靶RNA的RNA编辑百分比来确定。在一些情况下,可以在测序前通过聚合酶链式反应扩增cDNA。可以分析来自Sanger测序的Sanger迹线以评估引导RNA的编辑效率。在一些情况下,可以使用微滴数字PCR来评估引导RNA的编辑效率。在一些情况下,可以使用定量实时PCR来评估引导RNA的编辑效率。在一些情况下,可以使用下一代测序技术(例如合成测序)来确定靶RNA的RNA编辑百分比。例如,可以使用RNA测序来确定在用引导RNA或引导多核苷酸转染后靶RNA的RNA编辑百分比。在一些情况下,可以分析各个测序读数以确定RNA编辑百分比。
在一些实施方案中,工程化引导多核苷酸的靶向结构域与靶RNA的非翻译区的缔合可以促进靶RNA编码的多肽的水平的降低。在一些情况下,由靶RNA编码的多肽的表达水平的降低可能不依赖于RNA指导的RNA内切核酸酶。在一些情况下,由靶RNA编码的多肽的表达水平的降低可能不是Dicer依赖性的、RISC依赖性的或Argonaute依赖性的。在一些情况下,由靶RNA编码的多肽的表达水平的降低可以至少部分独立于Dicer、RISC、Argonaute或它们的任何组合。在一些情况下,由靶RNA编码的多肽的水平的降低可以在体外测定中通过将靶RNA直接或间接引入(例如转染)到细胞系的第一细胞和第二细胞中,然后将靶向靶RNA的工程化多核苷酸直接或间接引入(例如转染)到细胞系的第一细胞中,并比较第一细胞和第二细胞中由靶RNA编码的多肽的量来确定。在一些情况下,细胞可以是原代细胞。在一些情况下,原代细胞或细胞可以是神经元、感光细胞(例如S视锥细胞、L视锥细胞、M视锥细胞、视杆细胞)、视网膜色素上皮细胞、神经胶质细胞(例如星形胶质细胞、少突胶质细胞、小胶质细胞)、肌细胞(例如成肌细胞、肌管)、肝细胞、肺上皮细胞或成纤维细胞(例如真皮成纤维细胞)。在一些情况下,细胞可以是水平细胞、神经节细胞或双极细胞。在一些情况下,细胞系可以是哺乳动物细胞系,诸如HEK293T、NCI-60、MCF-7、HL-60、RD、LHCN分化细胞、LHCN未分化细胞、Saos-2、CHO或HeLa细胞。在一些情况下,细胞系可以是昆虫细胞系,诸如Sf9。
在一些情况下,靶向结构域可以与靶RNA中的编码区、非编码区或两者缔合。在一些情况下,非编码区可以包含靶RNA的内含子区。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的内含子区的至少一部分缔合。在一些情况下,非编码区可以包含非翻译区(UTR),诸如3'UTR、5'UTR或两者。在一些情况下,靶向结构域可以通过靶向UTR而引起对碱基的编辑。在一些情况下,靶向结构域可以通过靶向UTR而导致几乎没有对mRNA的编辑。在一些情况下,靶向结构域可以通过靶向非编码区而引起mRNA水平、蛋白质水平或两者的敲低。在一些情况下,靶向结构域可以被构建成至少部分地与靶RNA的上游开放阅读框(uORF)的至少一部分缔合。在一些情况下,靶向结构域可以不被构建成至少部分地与靶RNA的上游开放阅读框(uORF)缔合。
在一些情况下,靶向结构域可以不包含适体。适体可以是通过形状互补性而不是核苷酸碱基互补性与靶诸如靶RNA结合的多核苷酸序列。在一些实施方案中,适体不包括募集结构域。在一些实施方案中,适体是募集结构域。
在一些情况下,在本文中描述的工程化引导可以促进敲低。敲低可以减少靶RNA的表达、减少蛋白质表达或两者。在一些情况下,敲低可以伴随对mRNA的编辑。在一些情况下,敲低可以由RNA编辑酶(例如ADAR)介导。在一些情况下,RNA编辑酶可以通过RNA中的多个腺苷的水解脱氨基来引起敲低。RNA中多个腺苷的水解脱氨基可以称为超编辑。在一些情况下,超编辑可以顺式(例如在Alu元件中)或反式(例如通过工程化多核苷酸在靶RNA中)发生。在一些情况下,敲低可以在几乎没有或没有对mRNA的编辑的情况下发生。在一些情况下,敲低可以通过靶向靶RNA的非翻译区(诸如3'UTR、5'UTR或两者)发生。在一些情况下,敲低可以通过靶向靶RNA的编码区发生。图6A示出了图6B中来自线性引导RNA和环状引导RNA的核苷酸的RNA编辑百分比和3'UTRα突触核蛋白(SNCA)mRNA的敲低百分比。与用于编辑SNCA 3'UTR的线性引导相比,环状引导RNA显示出较低的编辑水平。然而,与线性引导RNA相比,环状引导RNA显示出SNCA mRNA的敲低增加。环状引导的敲低效率增加可以不依赖于ADAR。对SNCA mRNA的编辑可以依赖于ADAR。
化学修饰
在一些情况下,工程化引导RNA、工程化多核苷酸和前体工程化多核苷酸可以包含修饰。工程化引导RNA、工程化多核苷酸和前体工程化多核苷酸可以包含多于一个修饰。修饰可以包括修饰的碱基。修饰可以包括糖修饰,诸如将葡萄糖或其他糖基部分添加到工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的一个或多个碱基。修饰可以包括在工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的至少一部分上的蛋白质外壳。在一些情况下,工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸可以包含核苷酸上的糖修饰。在一些情况下,工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的核苷酸的糖修饰可以包含甲基、氟基、甲氧基乙基、乙基、磷酸基、酰胺基、酯基或它们的任何组合。工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的核苷酸的糖修饰可以包括2'-O-甲基化。与没有修饰的基本上相似的工程化引导RNA或工程化多核苷酸相比,修饰可以增加工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的稳定性或半衰期、提高编辑效率、显著减少脱靶编辑、提高募集RNA编辑实体的效率或它们的组合。
在一些情况下,提高引导稳定性、合成、定位、细胞内保留或延长半衰期的化学修饰可能不是遗传可编码的。工程化多核苷酸可以是环状的、基本上环状的或以连续方式连接的(例如,可以排列为环),并且还可以保留与可以不是环状的或可以不是环的基本上类似的工程化多核苷酸基本上类似的二级结构。环状或环形工程化多核苷酸可以是预应变的。
本公开的一个方面提供了工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸的载体、组合物和用于RNA编辑的药物组合物。上文或如本文所述的任一项可被构建用于A(腺苷)至I(肌苷)编辑、C(胞嘧啶)至U(尿嘧啶)编辑、U至C编辑或它们的组合。在一些情况下,RNA编辑可以是靶RNA中一个核苷酸和/或多个核苷酸的添加和缺失。在一些情况下,RNA编辑可以是靶RNA中U核苷酸的添加和缺失。在一些情况下,A到I编辑可以被解释或解读为C到U突变。在一些实施方案中,A到I编辑可以被解释或解读为A到G突变。在一些情况下,靶RNA可以包含突变,诸如错义突变或无义突变。在一些情况下,靶RNA可以包含错义突变。在一些情况下,靶RNA可以包含无义突变。在一些情况下,靶向结构域可以至少部分地与靶RNA结合。在一些情况下,靶RNA可以在疾病或疾患诸如雷特综合征、亨廷顿病、肌营养不良、镰状细胞性贫血或泰-萨克斯病中实现。与天然系统相比,如本文所述的工程化多核苷酸、包含工程化多核苷酸的载体、组合物和药物组合物可以提供增强的编辑效率、减少的脱靶编辑、增强的稳定性、增强的合成、增强的细胞内保留、或增强的半衰期、或它们的任何组合。
递送
本文所述的任何工程化多核苷酸(例如环化多核苷酸)或如本文所述的能够在细胞中环化的工程化前体多核苷酸可以经由载体递送至细胞。这样的载体可以包括如下所述的遗传可编码载体(例如病毒载体)以及下文所述的其他载体诸如脂质体或纳米颗粒。这样的载体可以被设计成将本文所述的工程化多核苷酸(例如环化多核苷酸)或如本文所述的工程化前体多核苷酸靶向递送至细胞。具体地,这样的载体可以将本文所述的工程化多核苷酸(例如环化多核苷酸)或如本文所述的工程化前体多核苷酸递送至患有如本文所述的疾病或疾患的受试者的细胞。这样的疾病或疾患可以包括其中工程化多核苷酸(例如前RNA或mRNA)的突变与疾病或疾患的进展有关的疾病或疾患。因此,将本文所述的工程化多核苷酸(例如环化多核苷酸)或如本文所述的工程化前体多核苷酸递送至受试者的细胞可用于治疗疾病或疾患,或甚至预防在预防性地进行施用的情况下的疾病或疾患。
本公开的一个方面提供了用于工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸和含有多核苷酸的药物组合物的载体和施用方法。本文所述的环状或环形引导RNA可以使用多种方法诸如AAV载体递送至细胞或受试者。
可以使用载体来递送核酸,诸如工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸。在一些情况下,载体可以包含多肽外壳,其中工程化引导RNA、工程化多核苷酸或前体工程化多核苷酸的至少一部分可以存在于多肽外壳内。在一些情况下,载体可以包含前体工程化线性多核苷酸、工程化多核苷酸或两者。载体可以包含DNA,诸如双链DNA或单链DNA。载体可以包含RNA。在一些实施方案中,RNA可以包含碱基修饰。载体可以包含重组载体。载体可以从天然存在的载体修饰。载体可以包含非天然存在的载体的至少一部分。可以使用任何载体。在一些实施方案中,载体可以包括病毒载体、脂质体、纳米颗粒、外来体、细胞外囊泡、纳米网或它们的任何组合。在一些情况下,病毒载体可以包含腺病毒载体、腺相关病毒载体(AAV)、慢病毒载体、逆转录病毒载体、这些中的任一种的一部分或它们的任何组合。在一些实施方案中,纳米颗粒载体可以包含基于聚合物的纳米颗粒、基于氨基脂质的纳米颗粒、金属纳米颗粒(例如基于金的纳米颗粒)、这些中的任一种的一部分或它们的任何组合。在一些情况下,载体可以包含AAV载体。在一些情况下,载体可以是单链AAV载体。可以修饰载体以包括修饰的VP1蛋白(诸如修饰的AAV载体以包括VP1蛋白)。AAV可以包含血清型,诸如AAV1血清型、AAV2血清型、AAV3血清型、AAV4血清型、AAV5血清型、AAV6血清型、AAV7血清型、AAV8血清型、AAV9血清型、这些中的任一种的衍生物或它们的任何组合。在一些情况下,AAV载体可以是一种或多种血清型的嵌合体(例如,具有来自AAV2的Rep和ITR以及来自AAV5的衣壳多肽的AAV2/5病毒)。在一些情况下,AAV载体可以是血清型的变体。在一些情况下,病毒载体可以是自身互补的腺相关病毒(scAAV)载体。
核酸可以至少部分地编码工程化引导RNA、工程化多核苷酸或前体工程化引导RNA。核酸可以是双链的、单链的或它们的组合。核酸可以是DNA、RNA、锁核酸(LNA)或肽核酸(PNA)。在一些情况下,核酸可以包含靶向标签。在一些情况下,靶向标签可以至少部分地将核酸引导至体内的特定器官或区域。在一些情况下,靶向标签可以包含N-乙酰半乳糖胺(GlaNac)。
在一些实施方案中,工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸可以包含在药物组合物中。在一些情况下,环状或环形工程化引导或其前体可以包含在药物组合物中。在一些实施方案中,单位剂型的药物组合物可以包含工程化引导RNA、工程化多核苷酸(例如工程化引导多核苷酸)、前体工程化多核苷酸、包含工程化多核苷酸或前体工程化多核苷酸的载体、或工程化多核苷酸或前体工程化多核苷酸的核酸;以及药学上可接受的赋形剂、稀释剂或载剂。药物组合物可以包含第一活性成分。第一活性成分可以包含工程化多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸或前体工程化多核苷酸的载体、或工程化多核苷酸或前体工程化多核苷酸的核酸。药物组合物可以配制成单位剂型。药物组合物可以包含药学上可接受的赋形剂、稀释剂或载剂。药物组合物可以包含第二活性成分、第三活性成分或第四活性成分。在一些情况下,药物组合物可以包含药物制剂。
在一些情况下,工程化多核苷酸可以与RNA编辑实体共同递送。在一些实施方案中,RNA编辑实体可以单独递送至细胞或受试者。在一些情况下,工程化多核苷酸可以与RNA编辑实体缔合或直接连接,并且缔合或直接连接的组合物可以递送至细胞或受试者。在一些情况下,组合物可以包含编码编辑实体的序列。组合物可以包含多于一个编辑实体,诸如1、2、3、4、5个或更多个。组合物可以包含多于一个编辑实体,每个编辑实体可以独立地编辑目标序列。
在一些实施方案中,本文公开的组合物可以是单位剂型或多剂量形式。例如,本文所述的药物组合物可以是单位剂型。如本文所用,单位剂型可以指适合施用于人或非人受试者(例如,动物)的物理离散单位。在一些情况下,单位剂型可以单独包装。每个单位剂量可以含有预定量的活性成分,其可以足以与药物载体、稀释剂、赋形剂或它们的任何组合结合产生期望的治疗效果。单位剂型的示例可以包括安瓿、注射器和单独包装的片剂和胶囊。在一些情况下,单位剂型可以包含在一次性注射器中。在一些情况下,单位剂型可以分次或多次施用。多剂量形式可以是包装在单个容器中的多个相同的单位剂型,其可以以分开的单位剂型施用。多剂量形式的示例可以包括小瓶、瓶装片剂或胶囊、或瓶装品脱或加仑。在一些情况下,多剂量形式可以包含相同的药物活性剂。在一些情况下,多剂量形式可以包含不同的药物活性剂。
组合物可以包含活性剂的组合,该活性剂例如工程化引导RNA、工程化多核苷酸、前体工程化多核苷酸、或含有本公开的工程化多核苷酸或前体工程化多核苷酸的载体或核酸、化合物或组合物,以及天然存在的或非天然存在的载剂,惰性的(例如,可检测的试剂或标记)或活性的,诸如佐剂、稀释剂、粘合剂、稳定剂、缓冲剂、盐、亲脂性溶剂、防腐剂、佐剂等,并且包括药学上可接受的载剂。载剂还包括药物赋形剂和添加剂蛋白质、肽、氨基酸、脂质和碳水化合物(例如,糖,包括单糖、二-、三-、四-寡糖和寡糖;衍生糖,诸如糖醇、醛糖酸、酯化糖等;以及多糖或糖聚合物),它们可以单独或组合存在,单独或组合按重量或体积计占1%-99.99%。示例性蛋白质赋形剂包括血清白蛋白,诸如人血清白蛋白(HSA)、重组人白蛋白(rHA)、明胶、酪蛋白等。也可发挥缓冲能力的代表性氨基酸组分、抗体组分或两者包括丙氨酸、精氨酸、甘氨酸、精氨酸、甜菜碱、组氨酸、谷氨酸、天冬氨酸、半胱氨酸、赖氨酸、亮氨酸、异亮氨酸、缬氨酸、甲硫氨酸、苯丙氨酸、阿斯巴甜等。糖类赋形剂也可以包括在本技术的范围内,其示例包括但不限于单糖,诸如果糖、麦芽糖、半乳糖、葡萄糖、D-甘露糖、山梨糖等;二糖,诸如乳糖、蔗糖、海藻糖、纤维二糖等;多糖,诸如棉子糖、松三糖、麦芽糖糊精、葡聚糖、淀粉等;以及糖醇,诸如甘露醇、木糖醇、麦芽糖醇、乳糖醇、木糖醇山梨糖醇(葡萄糖醇)和肌醇。
本文所述的组合物可以包含赋形剂。赋形剂可以包含低温保存剂,诸如DMSO、甘油、聚乙烯吡咯烷酮(PVP)或它们的任何组合。赋形剂可以包含低温保存剂,诸如蔗糖、海藻糖、淀粉、这些中的任一种的盐、这些中的任一种的衍生物或它们的任何组合。赋形剂可以包含pH剂(以最大限度减少组合物的组分的氧化或降解)、稳定剂(以防止组合物的组分的改性或降解)、缓冲剂(以提高温度稳定性)、增溶剂(以增加蛋白质溶解度)或它们的任何组合。赋形剂可以包含表面活性剂、糖、氨基酸、抗氧化剂、盐、非离子表面活性剂、增溶剂、甘油三酯、醇或它们的任何组合。赋形剂可以包含碳酸钠、乙酸盐、柠檬酸盐、磷酸盐、聚乙二醇(PEG)、人血清白蛋白(HSA)、山梨醇、蔗糖、海藻糖、聚山梨酯80、磷酸钠、蔗糖、磷酸氢二钠、甘露醇、聚山梨酯20、组氨酸、柠檬酸盐、白蛋白、氢氧化钠、甘氨酸、柠檬酸钠、海藻糖、精氨酸、乙酸钠、乙酸盐、HCl、依地酸二钠、卵磷脂、甘油、黄原胶、大豆异黄酮、聚山梨酯80、乙醇、水、替普瑞酮或它们的任何组合。赋形剂可以是在Handbook of PharmaceuticalExcipients,American Pharmaceutical Association(1986)中描述的赋形剂。
合适的赋形剂的非限制性示例可以包括缓冲剂、防腐剂、稳定剂、粘合剂、压缩剂、润滑剂、螯合剂、分散增强剂、崩解剂、调味剂、甜味剂、着色剂。在一些情况下,赋形剂可以是缓冲剂。合适的缓冲剂的非限制性示例可以包括柠檬酸钠、碳酸镁、碳酸氢镁、碳酸钙和碳酸氢钙。作为缓冲剂,碳酸氢钠、碳酸氢钾、氢氧化镁、乳酸镁、葡糖酸镁、氢氧化铝、柠檬酸钠、酒石酸钠、乙酸钠、碳酸钠、多磷酸钠、多磷酸钾、焦磷酸钠、焦磷酸钾、磷酸氢二钠、磷酸氢二钾、磷酸三钠、磷酸三钾、偏磷酸钾、氧化镁、氢氧化镁、碳酸镁、硅酸镁、乙酸钙、甘油磷酸钙、氯化钙、氢氧化钙和其他钙盐、或它们的组合可用于药物制剂中。
赋形剂可以包含防腐剂。合适的防腐剂的非限制性示例可以包括抗氧化剂,诸如α-生育酚和抗坏血酸盐,以及抗微生物剂,诸如对羟基苯甲酸酯、氯丁醇和苯酚。抗氧化剂还可以包括但不限于EDTA、柠檬酸、抗坏血酸、丁基化羟基甲苯(BHT)、丁基化羟基甲苯(BHA)、亚硫酸钠、对氨基苯甲酸、谷胱甘肽、没食子酸丙酯、半胱氨酸、甲硫氨酸、乙醇和N-乙酰基半胱氨酸。在一些情况下,防腐剂可以包括有效霉素A、TL-3、原钒酸钠、氟化钠、N-a-甲苯磺酰基-Phe-氯甲基酮、N-a-甲苯磺酰基-Lys-氯甲基酮、抑肽酶、苯甲基磺酰氟、二异丙基氟磷酸盐、激酶抑制剂、磷酸酶抑制剂、半胱天冬酶抑制剂、粒酶抑制剂、细胞粘附抑制剂、细胞分裂抑制剂、细胞周期抑制剂、脂质信号传导抑制剂、蛋白酶抑制剂、还原剂、烷化剂、抗微生物剂、氧化酶抑制剂或其他抑制剂。
药物制剂可以包含粘合剂作为赋形剂。合适的粘合剂的非限制性示例可以包括淀粉、预胶化淀粉、明胶、聚乙烯吡咯烷酮、纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、聚丙烯酰胺、聚乙烯噁唑烷酮、聚乙烯醇、C12-C18脂肪酸醇、聚乙二醇、多元醇、糖类、寡糖以及它们的组合。
可用于药物制剂中的粘合剂可以选自淀粉,诸如马铃薯淀粉、玉米淀粉、小麦淀粉;糖,诸如蔗糖、葡萄糖、右旋糖、乳糖、麦芽糖糊精;天然和合成树胶;明胶;纤维素衍生物,诸如微晶纤维素、羟丙基纤维素、羟乙基纤维素、羟丙基甲基纤维素、羧甲基纤维素、甲基纤维素、乙基纤维素;聚乙烯吡咯烷酮(聚维酮);聚乙二醇(PEG);蜡;碳酸钙;磷酸钙;醇诸如山梨醇、木糖醇、甘露醇、水或它们的组合。
药物制剂可以包含润滑剂作为赋形剂。合适的润滑剂的非限制性示例可以包括硬脂酸镁、硬脂酸钙、硬脂酸锌、氢化植物油、sterotex、聚氧乙烯单硬脂酸酯、滑石、聚乙二醇、苯甲酸钠、月桂基硫酸钠、月桂基硫酸镁和轻质矿物油。可用于药物制剂中的润滑剂可以选自金属硬脂酸盐(诸如硬脂酸镁、硬脂酸钙、硬脂酸铝)、脂肪酸酯(诸如硬脂酰富马酸钠)、脂肪酸(诸如硬脂酸)、脂肪醇、甘油二十二烷酸酯、矿物油、石蜡、氢化植物油、亮氨酸、聚乙二醇(PEG)、金属十二烷基硫酸盐(诸如十二烷基硫酸钠、十二烷基硫酸镁)、氯化钠、苯甲酸钠、乙酸钠和滑石或它们的组合。
在一些情况下,药物制剂可以包含分散增强剂作为赋形剂。合适的分散剂的非限制性示例可以包括淀粉、藻酸、聚乙烯吡咯烷酮、瓜尔胶、高岭土、膨润土、纯化木纤维素、淀粉羟基乙酸钠、同晶硅酸盐和微晶纤维素作为高HLB乳化剂表面活性剂。
在一些实施方案中,药物制剂可以包含崩解剂作为赋形剂。在一些情况下,崩解剂可以是非泡腾崩解剂。合适的非泡腾崩解剂的非限制性示例可以包括淀粉诸如玉米淀粉、马铃薯淀粉、其预糊化和改性淀粉、甜味剂、粘土诸如膨润土、微晶纤维素、藻酸盐、淀粉羟基乙酸钠、树胶诸如琼脂、瓜尔豆、刺槐豆胶、刺梧桐树胶、果胶和黄芪胶。在一些实施方案中,崩解剂可以是泡腾崩解剂。合适的泡腾崩解剂的非限制性示例可以包括碳酸氢钠与柠檬酸的组合,以及碳酸氢钠与酒石酸的组合。
在一些情况下,赋形剂可以包含甜味剂、调味剂或两者。合适的甜味剂的非限制性示例可以包括葡萄糖(玉米糖浆)、右旋糖、转化糖、果糖以及它们的混合物(当不用作载剂时);糖精及其各种盐,诸如钠盐;二肽甜味剂,诸如阿斯巴甜;二氢查耳酮化合物、甘草甜素;甜叶菊(甜菊苷);蔗糖的氯代衍生物,诸如三氯蔗糖;以及糖醇,诸如山梨醇、甘露醇、木糖醇(sylitol)等。在一些情况下,掺入组合物中的调味剂可以选自合成调味油和调味芳香剂;天然油;植物、叶、花和果实的提取物;以及它们的组合。在一些实施方案中,调味剂可以选自由以下各项组成的组:肉桂油;冬青油;薄荷油;苜蓿油;干草油;茴香油;桉树;香草;柑橘类油诸如柠檬油、橙子油、葡萄油和葡萄柚油;以及水果香精,包括苹果、桃、梨、草莓、覆盆子、樱桃、李子、菠萝和杏。
药物组合物可以包含稀释剂。稀释剂的非限制性示例可以包括水、甘油、甲醇、乙醇和其他类似的生物相容性稀释剂。在一些情况下,稀释剂可以是酸的水溶液,诸如乙酸、柠檬酸、马来酸、盐酸、磷酸、硝酸、硫酸等。在其他情况下,稀释剂可以选自包括以下各项的组:碱金属碳酸盐,诸如碳酸钙;碱金属磷酸盐,诸如磷酸钙;碱金属硫酸盐,诸如硫酸钙;纤维素衍生物,诸如纤维素、微晶纤维素、醋酸纤维素;氧化镁、糊精、果糖、右旋糖、棕榈酰硬脂酸甘油酯、乳糖醇、胆碱、乳糖、麦芽糖、甘露醇、二甲硅油、山梨醇、淀粉、预胶化淀粉、滑石、木糖醇和/或它们的无水物、水合物和/或药学上可接受的衍生物或它们的组合。
试剂盒
在一些实施方案中,试剂盒可以包括工程化引导RNA、工程化多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸或前体工程化多核苷酸的载体、工程化多核苷酸或前体工程化多核苷酸的核酸、或药物组合物和容器。在一些情况下,容器可以是塑料、玻璃、金属或它们的任何组合。在一些情况下,试剂盒可以包括使用说明书,诸如向有需要的受试者施用的说明书。
在一些情况下,包括本文所述的组合物的包装产品可以被适当地贴上标签。在一些情况下,本文所述的药物组合物可以根据药品生产质量管理规范(cGMP)和标签条例来制造。在一些情况下,本文公开的药物组合物可以是无菌的。
治疗方法
在一些实施方案中,治疗或预防有需要的受试者的疾病或疾患的方法可以包括施用工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的载体、工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的核酸、包含工程化多核苷酸、前体工程化线性多核苷酸或前体工程化多核苷酸的药物组合物,以及药学上可接受的赋形剂、稀释剂或载剂。在一些情况下,该方法可以包括施用第二疗法。在一些情况下,第二疗法可以包括抗生素、抗病毒药、癌症治疗(例如放射疗法、化学疗法、检查点抑制剂、CAR-T细胞治疗)、神经治疗、类固醇、抗炎治疗或它们的任何组合。在一些情况下,第二疗法可以包括抗体。在一些情况下,第二疗法可以包括巴匹珠单抗、苏兰珠单抗、盖坦德单抗、克雷内治单抗、拍珠单抗、阿杜卡玛单抗、BAN2401或它们的任何组合。施用可以进行至少约:每天1次、每天2次、每天3次、每天4次、每天5次或每天6次。该方法可以进行约:1天至约8天、1周至约5周、1个月至约12个月、1年至约3年、3年至约10年、10年至约50年、25年至约100年或约50年至约130年。在一些情况下,该方法可以包括诊断受试者患有疾病。在一些情况下,受试者可能在治疗之前已经被诊断。在一些情况下,诊断受试者患有疾病或疾患可以包括通过身体检查、活组织检查、放射图像、基因测试、血液测试、尿液测试、抗体测试或它们的任何组合进行诊断。在一些情况下,放射图像可以包括放射图像,其中放射图像包括计算机断层扫描(CT)图像、核扫描、X射线图像、磁共振图像(MRI)、超声图像或它们的任何组合。
在一些实施方案中,治疗有需要的受试者的疾病或疾患或预防有需要的受试者的疾病或疾患的方法可以包括向受试者、细胞或两者分别施用或预防性地施用工程化引导RNA、工程化多核苷酸、前体工程化线性多核苷酸、前体工程化多核苷酸、包含工程化多核苷酸或前体工程化多核苷酸、前体工程化线性多核苷酸的载体、或工程化多核苷酸或前体工程化多核苷酸、前体工程化线性多核苷酸的核酸、或包含工程化多核苷酸或前体工程化多核苷酸的药物组合物。在一些实施方案中,细胞可以包括哺乳动物细胞。在一些情况下,细胞可以来自任何组织或器官,例如皮肤细胞、肺细胞、心脏细胞、上皮细胞、生殖细胞、眼细胞、肾细胞、肝细胞、胰腺细胞、肠细胞、肌肉细胞、腺细胞、眼细胞、脑细胞或血细胞。在一些情况下,细胞可以包括神经元、感光细胞、视网膜色素上皮细胞、神经胶质细胞、成肌细胞、肌管细胞、肝细胞、肺上皮细胞或成纤维细胞。在一些情况下,细胞可以是干细胞,诸如胚胎干细胞、多能干细胞或全能干细胞。在一些情况下,细胞可以包括人类细胞。在一些情况下,细胞可以包括白细胞。在一些实施方案中,细胞可以包括淋巴细胞。在一些情况下,细胞可以包括T细胞。在一些情况下,细胞可以包括辅助性CD4+T细胞、细胞毒性CD8+T细胞、记忆T细胞、调节性CD4+T细胞、自然杀伤T细胞、粘膜相关T细胞、γδT细胞或它们的任何组合。在一些实施方案中,细胞可以包括B细胞。在一些情况下,细胞可以包括浆母细胞、浆细胞、淋巴浆细胞样细胞、记忆B细胞、滤泡B细胞、边缘区B细胞、B-1细胞、调节性B细胞或它们的任何组合。
工程化引导多核苷酸诸如工程化引导RNA的施用可以在整个治疗过程中以一个剂量连续地或间歇地实现。确定最有效的施用方式和剂量的方法可以是本领域技术人员已知的,并且可以随用于治疗的组合物、治疗目的、被治疗的靶细胞和被治疗的受试者而变化。单次或多次施用可根据由治疗医师选择的剂量水平和模式来执行。合适的剂量制剂和施用试剂的方法可以是本领域已知的。还可以确定施用途径,并且确定最有效的施用途径的方法可以是本领域技术人员已知的,并且可以随用于治疗的组合物、治疗目的、接受治疗的受试者的健康状况或疾病阶段以及靶细胞或组织而变化。施用途径的非限制性示例包括口服施用、鼻腔施用、注射和局部应用。
本文公开的组合物的施用或应用可以进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、150、200、300、400、500、600、700、800、900、1000天连续或非连续天的持续时间。在一些情况下,组合物可以终生施用。在一些实施方案中,本文所述的组合物的施用或应用可以为约1至约30天、约1至约60天、约1至约90天、约1至约300天、约1至约3000天、约30天至约90天、约60天至约900天、约30天至约900天或约90天至约1500天。在一些实施方案中,本文所述的组合物的施用或应用可以为约1周至约5周、1个月至约12个月、1年至约3年、2年至约8年、3年至约10年、10年至约50年、15年至约40年、25年至约100年、30年至约75年、60年至约110年或约50年至约130年。
本文公开的组合物的施用或应用可以进行至少约1周、至少约1个月、至少约1年、至少约2年、至少约3年、至少约4年、至少约5年、至少约6年、至少约7年、至少约8年、至少约9年、至少约10年、至少约15年、至少约20年的持续时间或终生。施用可以在受试者的一生中重复进行,诸如在受试者的一生中每天一次、每周一次或每月一次。施用可以在受试者生命的大部分时间重复进行,诸如每天一次、每周一次或每月一次,持续至少约1年、5年、10年、15年、20年、25年、30年或更长时间。
本文公开的组合物的施用或应用可以在24小时的时间段内进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24次。在一些情况下,本文公开的组合物的施用或应用可以在整个24小时的时间段内连续进行。在一些实施方案中,本文公开的组合物的施用或应用可以每周进行至少约:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21次。在一些情况下,本文公开的组合物的施用或应用可以每月进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90次或更多次。在一些实施方案中,组合物可以作为单一剂量或作为分开的剂量施用。例如,施用胶囊或片剂包括施用多于一种胶囊或片剂。在一些情况下,本文所述的组合物可以在第一时间点和第二时间点施用。在一些实施方案中,可以施用组合物,使得第一次施用可以在另一次施用之前施用,施用时间相差约:1小时、2小时、4小时、8小时、12小时、16小时、20小时、1天、2天、4天、7天、2周、4周、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、1年或更长时间。
施用
施用可以指可用于将本文所述的药物组合物(例如工程化多核苷酸)递送至所需生物作用位点的方法。例如,工程化引导RNA可以包含在DNA构建体、病毒载体或两者中,并通过静脉内施用来施用。本文公开的向需要治疗或疗法的区域的施用可以通过例如但不限于口服施用、局部施用、静脉内施用、吸入施用或它们的任何组合来实现。在一些实施方案中,递送可以包括吸入、耳、颊、结膜、牙、子宫颈内、窦内、气管内、肠内、硬膜外、羊膜外、体外、血液透析、渗透、间质、腹腔内、羊膜内、动脉内、关节内、胆内、支气管内、囊内、心内、软骨内、尾内、海绵体内、腔内、脑室内、脑池内、角膜内、冠状内、冠状动脉内、阴茎海绵体内、皮内、椎间盘内、导管内、十二指肠内、硬膜内、表皮内、食管内、胃内、牙龈内、海马内、回肠内、病灶内、管腔内、淋巴管内、髓内、脑膜内、肌内、眼内、卵巢内、心包内、腹膜内、胸膜内、前列腺内、肺内、窦内、脊柱内、滑膜内、腱内、睾丸内、胸内、小管内、肿瘤内、鼓室内、子宫内、血管内、静脉内、静脉内推注、静脉内滴注、膀胱内、玻璃体内、离子导入、灌洗、喉、鼻、鼻胃管、眼、口、口咽、肠胃外、经皮、关节周围、硬膜外、神经周围、牙周、直肠、眼球后、蛛网膜下、结膜下、皮下、舌下、粘膜下、局部、经皮、经粘膜、经胎盘、经气管、经鼓膜、输尿管、尿道、阴道、眶下、实质内、鞘内、心室内、立体定向或它们的任何组合。递送可以包括肠胃外施用(包括静脉内、皮下、鞘内、腹膜内、肌内、血管内或输注)、口服施用、吸入施用、十二指肠内施用、直肠施用或它们的组合。递送可以包括直接应用于身体的受影响组织或区域。在一些情况下,局部施用可以包括将洗剂、溶液、乳剂、霜剂、香膏、油、糊剂、棒剂、气雾剂、泡沫、胶冻剂、泡沫、面膜、垫、粉剂、固体、酊剂、黄油、贴剂、凝胶、喷雾剂、滴剂、液体制剂、软膏剂施用至表面诸如皮肤的外表面。递送可以包括实质内注射、鞘内注射、心室内注射或脑池内注射。本文提供的组合物可以通过任何方法施用。施用方法可以是动脉内注射、脑池内注射、肌内注射、实质内注射、腹膜内注射、脊柱内注射、鞘内注射、静脉内注射、心室内注射、立体定向注射、皮下注射、硬膜外注射或它们的任何组合。递送可以包括肠胃外施用(包括静脉内、皮下、鞘内、腹膜内、肌内、血管内或输注施用)。在一些实施方案中,递送可以包括纳米颗粒、脂质体、外来体、细胞外囊泡、植入物或它们的组合。在一些情况下,递送可以来自装置。在一些情况下,递送可以通过泵、输液泵或它们的组合进行。在一些实施方案中,递送可以通过灌肠剂、滴眼剂、喷鼻剂或它们的任何组合进行。在一些情况下,受试者可以在没有监督的情况下施用组合物。在一些情况下,受试者可以在医学专业人员(例如,医师、护士、医师助手、护理员、临终关怀工作者等)的监督下施用组合物。在一些实施方案中,医疗专业人员可以施用组合物。
在一些情况下,施用可以是口服摄取。在一些情况下,递送可以是胶囊或片剂。口服摄取递送可以包括茶、酏剂、食物、饮料、饮品、糖浆、液体、凝胶、胶囊、片剂、油、酊剂或它们的任何组合。在一些实施方案中,食物可以是医疗食物。在一些情况下,胶囊可以包含羟甲基纤维素。在一些实施方案中,胶囊可以包含明胶、羟丙基甲基纤维素、支链淀粉或它们的任何组合。在一些情况下,胶囊可以包含包衣,例如肠溶包衣。在一些实施方案中,胶囊可以包含素食产品或纯素产品诸如羟丙基甲基纤维素胶囊。在一些实施方案中,递送可以包括通过吸入器、扩散器、喷雾器、蒸发器或它们的组合吸入。
在一些实施方案中,本文公开的可以是一种方法,该方法包括向有需要的受试者(例如,人)施用本文公开的组合物。在一些情况下,该方法可以治疗或预防受试者的疾病。
疾病应用和目标
如本文所述,工程化多核苷酸(例如环化的工程化多核苷酸)或能够在细胞中环化的前体工程化多核苷酸(例如前体工程化线性多核苷酸)可用于治疗受试者的疾病或疾患。疾病或疾患可以包括神经退行性疾病、肌肉病症、代谢病症、眼部病症(例如眼部疾病)、癌症、肝病(α-1抗胰蛋白酶(AAT)缺乏症)或它们的任何组合。疾病或疾患可以包括囊性纤维化、白化病、α-1-抗胰蛋白酶缺乏症、阿尔茨海默病、肌萎缩侧索硬化、哮喘、β-地中海贫血、Cadasil综合征、腓骨肌萎缩症、慢性阻塞性肺病(COPD)、痴呆、远端脊髓性肌萎缩症(DSMA)、Duchenne/Becker肌营养不良、营养不良性大疱性表皮松解症、大疱性表皮松解症、法布里病、因子V Leiden相关病症、家族性腺瘤、息肉病、半乳糖血症、戈谢病、葡萄糖-6-磷酸脱氢酶、血友病、遗传性血色素沉着症、亨特综合征、亨廷顿氏舞蹈病、赫勒综合征、炎性肠病(IBD)、遗传性多凝集综合征、Leber先天性黑蒙、Lesch-Nyhan综合征、Lynch综合征、马凡综合征、黏多糖病、肌营养不良、肌强直性营养不良I型和II型、神经纤维瘤病、尼曼-皮克病A、B和C型、NY-eso1相关癌症、帕金森病、Peutz-Jeghers综合征、苯丙酮尿症、庞贝氏病、原发性纤毛疾病、凝血酶原突变相关病症诸如凝血酶原G20210A突变、肺动脉高压、色素性视网膜炎、Sandhoff病、τ蛋白病、突触核蛋白病、重度联合免疫缺陷综合征(SCID)、镰状细胞性贫血、脊髓性肌萎缩、斯塔加特病、泰-萨克斯病、Usher综合征、X连锁免疫缺陷、各种形式的癌症(例如BRCA1和2连锁乳腺癌和卵巢癌)。在一些情况下,疾病或疾患诸如神经退行性疾病(例如阿尔茨海默病、帕金森病)的治疗可以包括产生对淀粉样前体蛋白(APP)、tau、α-突触核蛋白或它们的任何组合的编辑、敲低或两者。在一些情况下,APP、tau和α-突触核蛋白可以包含致病性变体。在一些情况下,APP可以包含致病性变体诸如A673V突变或A673T突变。在一些情况下,疾病或疾患诸如神经退行性疾病(帕金森病)的治疗可以包括产生对LRRK2的致病性变体的编辑、敲低或两者。在一些情况下,LRRK的致病性变体可以包含G2019S突变。疾病或疾患可以包括肌营养不良、鸟氨酸氨甲酰基转移酶缺乏症、色素性视网膜炎、乳腺癌、卵巢癌、阿尔茨海默病、疼痛、斯塔加特黄斑营养不良、腓骨肌萎缩症、雷特综合征、τ蛋白病、突触核蛋白病或它们的任何组合。在一些情况下,工程化多核苷酸可以校正雷特综合征患者的错义突变(例如突变终止密码子以编码Trp)。在一些情况下,工程化多核苷酸可以校正帕金森病患者的错义突变或诱导敲低。在一些情况下,工程化多核苷酸可以在阿尔茨海默病患者中诱导突变,这可以减少蛋白质在APP的切割位点处的切割。在一些情况下,工程化多核苷酸可以在肌营养不良患者中产生外显子跳跃。在一些情况下,工程化多核苷酸可以校正泰-萨克斯病患者的HexA的突变。在一些情况下,工程化多核苷酸可以校正泰-萨克斯病患者的HexA的突变。在一些情况下,工程化多核苷酸可以校正AAT缺陷患者的突变(例如编辑SERPINA1)。在一些情况下,组合物的施用可以足以:(a)相对于施用前基因的表达降低基因的表达;(b)编辑受试者诸如有需要的受试者的至少一个点突变;(c)编辑受试者的至少一个终止密码子以产生终止密码子的通读;(d)在受试者中产生外显子跳跃,或(e)它们的任何组合。疾病或疾患可以包括肌营养不良。肌营养不良可以包括强直性肌营养不良、杜氏肌营养不良、贝克尔肌营养不良、肢带型肌营养不良、面肩肱型肌营养不良、先天性肌营养不良、眼咽型肌营养不良、远端型肌营养不良、Emery-Dreifuss型肌营养不良或它们的任何组合。疾病或疾患可以包括疼痛,诸如慢性疼痛。疼痛可以包括神经性疼痛、伤害性疼痛或它们的组合。伤害性疼痛可以包括内脏疼痛、躯体疼痛或它们的组合。某些特定的疾病或疾患以及相关的靶标参考如下。
APP.在一些实施方案中,本公开提供了能够促进淀粉样前体蛋白(APP)的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。例如,环化的工程化多核苷酸可以促进APP中切割位点的编辑,使得β/γ分泌酶表现出减少的APP切割或可以不再切割APP,并且因此可以产生降低水平的Aβ40/42或没有Aβ。在一些实施方案中,本公开的环化的工程化多核苷酸可以靶向APP中的以下位点中的任一个或任何组合以进行RNA编辑:K670E、K670R、K670G、M671V、A673V、A673T、D672G、E682G、H684R、K687R、K687E或K687G、I712X或T714X。靶向APP中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如前体多核苷酸)编码。靶向APP基因的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:61、SEQ ID NO:62或SEQ ID NO:63具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上阿尔茨海默病的风险中或者已经患上阿尔茨海默病。受试者可以是人并且可以处于患上其中APP影响疾病病理的神经疾病的风险中或者已经患上该神经疾病。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗神经疾病(例如阿尔茨海默病)的方法。
ABCA4.在一些实施方案中,本公开提供了能够促进ATP结合盒亚家族A成员4(ABCA4)的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。例如,环化的工程化多核苷酸可以促进以下校正:ABCA4基因中核苷酸位置6320处的G与A;ABCA4基因中核苷酸位置5714处的G与A;和/或ABCA4基因中核苷酸位置5714处的G与A。靶向ABCA4中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如前体多核苷酸)编码。靶向ABCA4基因的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:58、SEQID NO:59或SEQ IDNO:60具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上斯塔加特黄斑变性的风险中或者已经患上斯塔加特黄斑变性。这样的斯塔加特黄斑变性可以至少部分地由ABCA4的突变引起,为此本文所述的工程化多核苷酸序列可以促进编辑,从而校正ABCA4中的突变并降低受试者的斯塔加特黄斑变性的发生率。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗斯塔加特黄斑变性的方法。
α-突触核蛋白(SNCA).α-突触核蛋白基因由5个外显子组成并且编码预测分子量为~14.5kDa的140个氨基酸的蛋白质。编码产物是一种具有未知功能的本质上无序的蛋白质。通常,α-突触核蛋白是单体。在某些应激条件或其他未知原因下,α-突触核蛋白自聚集成寡聚体。路易相关病变(LRP),主要由超过50%的尸检证实的阿尔茨海默病患者脑中的α-突触核蛋白组成。虽然α-突触核蛋白如何影响阿尔茨海默病发展的分子机制尚不清楚,但实验证据已表明α-突触核蛋白与Tau-p相互作用并可能引起Tau-p的细胞内聚集。此外,α-突触核蛋白可以调节GSK3β的活性,GSK3β可以介导Tau过度磷酸化。α-突触核蛋白也可以自组装成致病性聚集体(路易体)。Tau和α-突触核蛋白均可以释放至细胞外空间并扩散至其他细胞。血管异常会损害营养物质的供应和代谢副产物的清除,引起微梗塞,并促进神经胶质细胞的活化。因此,显著减少Tau形成、α-突触核蛋白形成或它们的组合的多重策略对于有效治疗神经退行性疾病可能很重要。
α-突触核蛋白的结构域结构包含N端A2脂质结合α-螺旋结构域、非淀粉样β组分(NAC)结构域和C端酸性结构域。脂质结合结构域由五个KXKEGV不完全重复组成。NAC结构域由具有VGGAVVTGV共有序列的GAV基序和三个GXXX亚基序组成,其中X是Gly、Ala、Val、Ile、Leu、Phe、Tyr、Trp、Thr、Ser或Met中的任一个。C端酸性结构域含有具有DPDNEA共有序列的铜结合基序。在分子水平上,α-突触核蛋白被认为在神经元传递和DNA修复中起作用。
在一些情况下,可以使用本文提供的组合物靶向α-突触核蛋白的区域。在一些情况下,α-突触核蛋白mRNA的区域可以用本文公开的工程化多核苷酸靶向以进行敲低。在一些情况下,可以靶向α-突触核蛋白mRNA的外显子或内含子的区域。在一些实施方案中,可以靶向α-突触核蛋白mRNA的非编码序列的区域,诸如5'UTR和3'UTR。在其他情况下,可以靶向α-突触核蛋白mRNA的编码序列的区域。合适的区域包括但不限于N端A2脂质结合α-螺旋结构域、非淀粉样β组分(NAC)结构域或C端酸性结构域。
在一些方面,靶向α-突触核蛋白mRNA序列。在一些情况下,可以利用本文提供的组合物和方法靶向该序列的3,177个残基中的任一个。在一些情况下,靶残基可以位于残基1-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-1100、1101-1200、1201-1300、1301-1400、1401-1500、1501-1600、1601-1700、1701-1800、1801-1900、1901-2000、2001-2100、2101-2200、2201-2300、2301-2400、2401-2500、2501-2600、2601-2700、2701-2800、2801-2900、2901-3000、3001-3100和/或3101-3177中。
在一些实施方案中,本公开提供了能够促进SNCA的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。在一些实施方案中,环化的工程化多核苷酸可以敲低SNCA的表达,例如,通过促进在SNCA基因的3'UTR处的编辑。靶向SNCA中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体编码。靶向SNCA基因的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上阿尔茨海默病或帕金森病的风险中或者已经患上阿尔茨海默病或帕金森病。受试者可以是人并且可以处于患上其中SNCA的过表达影响疾病病理的神经疾病的风险中或者已经患上该神经疾病。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗神经疾病(例如阿尔茨海默病)的方法。
SERPINA1.在一些实施方案中,本公开提供了能够促进丝氨酸蛋白酶抑制剂家族A成员1(SERPINA1)的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。例如,环化的工程化多核苷酸可以促进在SERPINA1基因的核苷酸位置9989处将G突变校正为A突变。在一些实施方案中,环化的工程化多核苷酸可以靶向例如SERPINA1的E342。靶向SERPINA1中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如工程化前体多核苷酸)编码。构建成靶向SERPINA1的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:64或SEQ ID NO:65具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上α-1抗胰蛋白酶缺乏症的风险中或者已经患上α-1抗胰蛋白酶缺乏症。这种α-1抗胰蛋白酶缺乏症可以至少部分地由SERPINA1的突变引起,为此,本文所述的工程化多核苷酸序列可以促进编辑,从而校正SERPINA1中的突变并降低受试者中α-1抗胰蛋白酶缺乏症的发生率。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗α-1抗胰蛋白酶缺乏症的方法。
LRRK2.富亮氨酸重复激酶2(LRRK2)与帕金森病以及免疫相关病症如克罗恩病的家族性和散发性病例相关。其别名包括LRRK2、AURA17、DARDARIN、PARK8、RIPK7、ROCO2或富亮氨酸重复激酶2。LRRK2基因由51个外显子组成并且编码预测分子量为约286kDa的2527个氨基酸的蛋白质。编码产物是一种具有激酶和GTP酶活性的多结构域蛋白。LRRK2可以在多种组织和器官中发现,包括但不限于肾上腺、阑尾、骨髓、脑、结肠、十二指肠、子宫内膜、食道、脂肪、胆囊、心脏、肾、肝、肺、淋巴结、卵巢、胰腺、胎盘、前列腺、唾液腺、皮肤、小肠、脾、胃、睾丸、甲状腺和膀胱。LRRK2可以普遍表达,但通常在脑、肾和肺组织中更为丰富。在细胞方面,已在星形胶质细胞、内皮细胞、小胶质细胞、神经元和外周免疫细胞中发现LRRK2。
在LRRK2中已鉴定了超过100个突变;其中六种(G2019S、R1441C/G/H、Y1699C和I2020T)已通过分离分析显示会引起帕金森病。G2019S和R1441C是遗传病例中最常见的致病突变。在散发性病例中,这些突变已显示出年龄依赖性外显率:当年龄从50岁增加到70岁时,患上该疾病的携带G2019S突变的个体的百分比从17%跃升到85%。在一些情况下,携带突变的个体永远不会患上该疾病。
在其催化核心,LRRK2含有复合蛋白的Ras(Roc)、ROC的C端(COR)和激酶结构域。多个蛋白质-蛋白质相互作用结构域侧接该核心:在由C端WD40结构域连接的N端发现了犰狳重复(ARM)区、锚蛋白重复(ANK)区、富亮氨酸重复(LRR)结构域。G2019S突变位于激酶结构域内。它已被证明可以增加激酶活性;对于R1441C/G/H和Y1699C,这些突变可以降低Roc结构域的GTPase活性。全基因组关联研究已发现,LRRK2中的常见变异会增加患上散发性帕金森病的风险。虽然这些变异中的一些是影响蛋白质的结合或催化活性的非保守突变,但其他变异会调节其表达。这些结果表明特异性等位基因或单体型可以调节LRRK2表达。
促炎信号上调各种免疫细胞类型中的LRRK2表达,表明LRRK2是免疫响应中的关键调节因子。研究发现,全身性和中枢神经系统(CNS)炎症都与帕金森病的症状有关。此外,与帕金森病相关的LRRK2突变响应于炎性刺激而调节其表达水平。LRRK2中的许多突变与免疫相关病症诸如炎性肠病诸如克罗恩病相关。例如,G2019S和N2081D都会增加LRRK2的激酶活性,并且在特定人群的克罗恩病患者中表现过高。由于其在这些病症中的关键作用,LRRK2是帕金森病和克罗恩病的重要治疗靶标。具体地讲,许多突变,诸如包括G2019S的点突变,在患上这些疾病中起作用,使得LRRK2成为治疗策略诸如RNA编辑的一个有吸引力的因素。
在一些实施方案中,本公开提供了能够促进LRRK2的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。在一些实施方案中,环化的工程化多核苷酸可以靶向LRRK2中的以下突变:E10L、A30P、S52F、E46K、A53T、L119P、A211V、C228S、E334K、N363S、V366M、A419V、R506Q、N544E、N551K、A716V、M712V、I723V、P755L、R793M、I810V、K871E、Q923H、Q930R、R1067Q、S1096C、Q1111H、I1122V、A1151T、L1165P、I1192V、H1216R、S1228T、P1262A、R1325Q、I1371V、R1398H、T1410M、D1420N、R1441G、R1441H、A1442P、P1446L、V1450I、K1468E、R1483Q、R1514Q、P1542S、V1613A、R1628P、M1646T、S1647T、Y1699C、R1728H、R1728L、L1795F、M1869V、M1869T、L1870F、E1874X、R1941H、Y2006H、I2012T、G2019S、I2020T、T2031S、N2081D、T2141M、R2143H、Y2189C、T2356I、G2385R、V2390M、E2395K、M2397T、L2466H或Q2490NfsX3。靶向LRRK2中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如前体工程化多核苷酸)编码。构建成靶向LRRK2的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:39、SEQ ID NO:53或SEQ ID NO:54具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上与LRRK2中的突变相关的疾病或疾患(例如中枢神经系统(CNS)或胃肠(GI)道的疾病)的风险中或者已经患上该疾病或疾患。例如,这中疾患可以包括克罗恩病或帕金森病。这种CNS或GI道疾病(例如克罗恩病或帕金森病)可以至少部分地由LRRK2的突变引起,为此,本文所述的工程化多核苷酸序列可以促进编辑,从而校正LRRK2中的突变并降低受试者中CNS或GI道疾病的发生率。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗疾病诸如克罗恩病或帕金森病的方法。
DMD.在一些实施方案中,本公开提供了能够促进杜氏肌营养不良(DMD)基因的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。在一些实施方案中,环化的工程化多核苷酸可以靶向DMD基因的外显子,诸如至少部分编码抗肌萎缩蛋白的DMD基因前mRNA中的外显子51、45、53、44、46、52、50、43、6、7、8、55、2、11、17、19、21、57、59、62、63、65、66、69、74和/或75。靶向DMD基因中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如前体工程化多核苷酸)编码。构建成靶向DMD的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQ ID NO:56或SEQ ID NO:57具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上与DMD基因中的突变相关的疾病或疾患诸如DMD的风险中或者已经患上该疾病或疾患。DMD可以至少部分地由DMD基因的突变引起,为此,本文所述的工程化多核苷酸序列可以促进编辑,从而校正DMD基因中的突变并降低受试者中DMD的发生率。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗疾病诸如DMD的方法。
TUBB4A.在一些实施方案中,本公开提供了能够促进TUBB4A基因的RNA编辑的环化的工程化多核苷酸(或被构建成在细胞中环化的前体工程化多核苷酸)的组合物及其使用方法。在一些实施方案中,环化的工程化多核苷酸可以靶向TUBB4A中的D249N突变,这可以由745G>A核苷酸突变引起。靶向TUBB4A基因中位点的所述环化的工程化多核苷酸可以由本公开的工程化多核苷酸构建体(例如前体工程化多核苷酸)编码。构建成靶向TUBB4A的环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)的序列可以包含与SEQID NO:32、SEQ ID NO:33或SEQ ID NO:34具有至少约70%、75%、80%、85%、90%、95%或100%序列同一性的靶向结构域。所述环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可以经由如本文公开的病毒载体递送(例如,编码并经由AAV递送)并且可以经由本文公开的任何施用途径施用至有需要的受试者。受试者可以是人并且可以处于患上与TUBB4A基因突变相关的疾病或疾患(诸如髓鞘形成不足伴基底神经节和小脑萎缩(H-ABC))的风险中或者已经患上该疾病或疾患。H-ABC可以至少部分地由TUBB4A基因的突变引起,为此,本文所述的工程化多核苷酸序列可以促进编辑,从而校正TUBB4A基因中的突变并降低受试者中H-ABC的发生率。因此,环化的工程化多核苷酸(或构建成在细胞中环化的前体工程化多核苷酸)可用于治疗疾病诸如H-ABC的方法。
编号的实施方案
本文公开了许多组合物和方法。这些组合物和方法的具体示例性实施方案在下文公开。以下实施方案列举了本文公开的特征组合的非限制性排列。还设想了特征组合的其他排列。具体地,这些编号的实施方案中的每一个被设想为取决于或涉及每个先前或随后编号的实施方案,而与它们列出的顺序无关。
实施方案1.一种工程化多核苷酸,其包含:
a)靶向结构域,所述靶向结构域与靶RNA至少部分互补;以及
b)间隔子结构域,
其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,其中:
(i)所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者,
(ii)所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,
(iii)所述工程化多核苷酸比包含5'还原羟基、3'还原羟基或两者的可比较的线性多核苷酸更不易受水解降解影响,
(iv)所述工程化多核苷酸在人类细胞中包含与包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的线性多核苷酸相比更长的半衰期,
(v)所述工程化多核苷酸为环状,或
(vi)i-v的任何组合。
实施方案2.如实施方案1所述的工程化多核苷酸,其中所述间隔子结构域被构建成在所述靶向结构域与所述靶RNA结合时不与所述靶RNA结合。
实施方案3.如实施方案1或2所述的工程化多核苷酸,其中当所述靶向结构域与所述靶RNA结合时,所述间隔子结构域与所述靶向结构域隔开至少1个核苷酸,并且如果所述间隔子结构域与所述靶RNA结合,则所述间隔子结构域的结合不在与所述间隔子结构域结合的所述靶RNA的部分处产生对所述靶RNA的编辑。
实施方案4.如实施方案1-3中任一项所述的工程化多核苷酸,其中当所述间隔子结构域邻近所述靶向结构域的5'端或3'端时,所述间隔子结构域不与所述靶RNA互补。
实施方案5.一种工程化多核苷酸,其包含:与靶RNA至少部分互补的靶向结构域、RNA编辑实体募集结构域和间隔子结构域,其中间隔子包含多核苷酸,并且间隔子多核苷酸不位于所述靶向结构域中并且不位于所述RNA编辑实体募集结构域中,并且其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中:
(i)所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者;
(ii)所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,
(iii)所述工程化多核苷酸比包含5'还原羟基、3'还原羟基或两者的可比较的线性多核苷酸更不易受水解降解影响,
(iv)所述工程化多核苷酸在人类细胞中包含与包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的线性多核苷酸相比更长的半衰期,
(v)所述工程化多核苷酸为环状,或
(vi)i-v的任何组合。
实施方案6.如实施方案1-5中任一项所述的工程化多核苷酸,其中所述间隔子结构域被构建成促进所述工程化RNA采用促进至少部分与所述靶RNA结合的构象。
实施方案7.如实施方案6所述的工程化多核苷酸,其中所述间隔子结构域被构建成促进所述工程化多核苷酸与多个其他RNA中的所述靶RNA的结合特异性相对于缺乏所述间隔子结构域的相应多核苷酸的结合特异性的增加,如通过在与缺乏所述间隔子结构域的所述工程化多核苷酸或所述相应多核苷酸接触后对所述靶RNA和多个其他RNA进行测序所确定的。
实施方案8.如实施方案1-7中任一项所述的工程化多核苷酸,其中所述间隔子结构域被构建成促进所述工程化多核苷酸相对于缺乏所述间隔子结构域的所述相应工程化多核苷酸与所述靶RNA的结合的较低熵(ΔS),如通过开尔文探针力显微镜(KPFM)确定的。
实施方案9.如实施方案1-8中任一项所述的工程化多核苷酸,其中所述间隔子结构域被构建成相对于缺乏所述间隔子结构域的所述相应工程化多核苷酸的编辑效率至少维持所述工程化多核苷酸对所述靶RNA的编辑效率,如通过在与缺乏所述间隔子结构域的所述工程化多核苷酸或所述相应工程化多核苷酸接触后对所述靶RNA进行测序所确定的。
实施方案10.如实施方案9所述的工程化多核苷酸,其中所述至少维持包括增加。
实施方案11.如实施方案1所述的工程化引导,其中相对于包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的多核苷酸,所述工程化多核苷酸对所述靶RNA的编辑效率增加至少约90%,其中所述编辑效率通过以下方法确定:(i)将所述靶RNA转染到细胞系293T中,(ii)将所述工程化多核苷酸和所述包含5'还原羟基、3'还原羟基或两者的在其他方面可比较的工程化多核苷酸转染到细胞系293T中,以及(iii)对所述靶RNA进行测序。
实施方案12.如实施方案1-11中任一项所述的工程化多核苷酸,其中所述主链包含多核苷酸,其中所述多核苷酸的每个核苷酸通过共价连接至所述核苷酸的糖的3'和5'碳的两个不同含磷基团中的两个不同磷-氧键直接连接至两个相邻核苷酸。
实施方案13.如实施方案12所述的工程化多核苷酸,其中包含在子部分中的所述核苷酸的至少一些糖包含2'羟基。
实施方案14.如实施方案1-13中任一项所述的工程化多核苷酸,其中所述间隔子结构域具有约1个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案15.如实施方案1-14中任一项所述的工程化多核苷酸,其中所述间隔子结构域的所述核苷酸的至少约80%与所述靶RNA不互补。
实施方案16.如实施方案1-15中任一项所述的工程化多核苷酸,其中所述靶向结构域具有约20个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案17.如实施方案1-16中任一项所述的工程化多核苷酸,其中所述靶RNA是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。
实施方案18.如实施方案1-17中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含与5'GATAAAAGGCGTACATAATTCTTGTGTCTACTGTACAGAATACTGCCGCCAGCTGGATTTCCCAATTCTGAGTAACACTCTGCAATCCAAACAGGGTTCA 3'(SEQ ID NO:23)具有至少约70%、75%、80%、85%、90%、95%或100%序列同源性的多核苷酸序列。
实施方案19.如实施方案5所述的工程化多核苷酸,其中所述靶向结构域在所述RNA编辑实体募集结构域的约5个核苷酸内。
实施方案20.如实施方案5所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域募集RNA编辑实体,所述RNA编辑实体在与所述工程化多核苷酸和所述靶RNA缔合时对所述靶RNA中的核苷酸的碱基进行化学转化。
实施方案21.如实施方案20所述的工程化多核苷酸,其中相对于缺乏所述化学转化的在其他方面可比较的靶RNA,所述化学转化导致在翻译具有所述化学转化的所述靶RNA后蛋白质或其片段的水平增加。
实施方案22.如实施方案21所述的工程化多核苷酸,其中增加的水平为约5%至约100%。
实施方案23.如实施方案20所述的工程化多核苷酸,其中相对于缺乏所述化学转化的在其他方面可比较的靶RNA,所述化学转化导致在翻译具有所述化学转化的所述靶RNA后蛋白质或其片段的水平降低。
实施方案24.如实施方案23所述的工程化多核苷酸,其中降低的水平为约5%至约100%。
实施方案25.如实施方案20-24中任一项所述的工程化多核苷酸,其中所述化学转化将有义密码子转化为终止密码子。
实施方案26.如实施方案20-24中任一项所述的工程化多核苷酸,其中所述化学转化将终止密码子转化为有义密码子。
实施方案27.如实施方案20-24中任一项所述的工程化多核苷酸,其中所述化学转化将第一有义密码子转化为第二有义密码子。
实施方案28.如实施方案20-24中任一项所述的工程化多核苷酸,其中所述化学转化将第一终止密码子转化为第二终止密码子。
实施方案29.如实施方案20-28中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸形成二级结构,所述二级结构包含:茎环、十字形、趾固、错配凸起或它们的任何组合。
实施方案30.如实施方案20所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与Alu结构域、APOBEC募集结构域、GluR2结构域或Cas13募集结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案31.如实施方案30所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案32.如实施方案31所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案33.如实施方案30所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案34.如实施方案33所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案35.如实施方案30所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Cas13募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性,其中所述Cas13募集结构域包含Cas13a募集结构域、Cas13b募集结构域、Cas13c募集结构域或Cas13d募集结构域。
实施方案36.如实施方案35所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Cas13b募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案37.如实施方案36所述的工程化多核苷酸,其中所述序列包含:与所述Cas13b募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案38.如实施方案5-37中任一项所述的工程化多核苷酸,其中所述RNA编辑实体募集结构域被构建成至少暂时地与RNA编辑实体缔合。
实施方案39.如实施方案38所述的工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白、APOBEC蛋白或两者。
实施方案40.如实施方案38所述的工程化多核苷酸,包含所述ADAR蛋白,其包含ADAR1或ADAR2。
实施方案41.如实施方案38-40中任一项所述的工程化多核苷酸,其中当所述RNA编辑实体募集结构域至少暂时地与所述RNA编辑实体缔合时,并且当所述靶向结构域至少暂时地与所述靶RNA缔合时,所述工程化多核苷酸被构建成促进对所述靶RNA的碱基的编辑。
实施方案42.如实施方案38或40所述的工程化多核苷酸,其中所述RNA编辑实体是内源酶。
实施方案43.如实施方案38或40所述的工程化多核苷酸,其中所述RNA编辑实体是重组酶。
实施方案44.如实施方案1-43中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含修饰。
实施方案45.如实施方案44所述的工程化多核苷酸,其中所述修饰包括核苷酸上的糖修饰。
实施方案46.如实施方案45所述的工程化多核苷酸,其中所述工程化多核苷酸的核苷酸包含甲基、氟基、甲氧基乙基、乙基、磷酸基、酰胺基、酯基或它们的任何组合。
实施方案47.如实施方案1-46中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸是至少部分地遗传可编码的。
实施方案48.如实施方案2-47中任一项所述的工程化多核苷酸,其中所述RNA编辑实体通过键连而连接至所述工程化多核苷酸。
实施方案49.如实施方案48所述的工程化多核苷酸,其中所述键连是直接或间接共价键连。
实施方案50.如实施方案2-49中任一项所述的工程化多核苷酸,其中所述RNA编辑实体包含融合多肽。
实施方案51.如实施方案1-50中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸在生理pH的水溶液中保持的半衰期是天然存在于人类细胞中的mRNA的至少约4倍。
实施方案52.如实施方案1-51中任一项所述的工程化多核苷酸,其中所述间隔子结构域包含以下的多核苷酸序列:5'AUAUA3'。
实施方案53.如实施方案1-51中任一项所述的工程化多核苷酸,其中所述间隔子结构域包含以下的多核苷酸序列:5'AUAAU3'。
实施方案54.如实施方案1-53中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含与U7或U1启动子序列具有至少约80%同源性的序列。
实施方案55.一种工程化多核苷酸,其包含:与靶RNA至少部分互补的靶向结构域、RNA编辑实体募集结构域和间隔子结构域,其中当所述工程化多核苷酸表示为环状二维格式的多核苷酸序列,其中一个核苷酸在另一个之后,所述间隔子结构域通过增加一个或多个核苷酸来扩大所述工程化多核苷酸,其中所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案56.一种前体工程化多核苷酸,其在加工之前按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;靶向结构域,所述靶向结构域与靶RNA至少部分互补;第二间隔子结构域;第二连接结构域;以及第二核酶结构域,并且其中所述间隔子结构域被构建成当所述靶向结构域与所述靶RNA结合时不与所述靶RNA结合。
实施方案57.如实施方案56所述的前体工程化多核苷酸,还包含RNA编辑实体募集结构域。
实施方案58.如实施方案56或57所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者包含以下的多核苷酸序列:5'AUAUA 3'。
实施方案59.如实施方案56或57所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者包含以下的多核苷酸序列:5'AUAAU 3'。
实施方案60.如实施方案56-59中任一项所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸还包含与U7或U1启动子序列具有至少约80%同源性的序列。
实施方案61.如实施方案56-60中任一项所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者具有约1个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案62.如实施方案56-61中任一项所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者的所述核苷酸的至少约80%与所述靶RNA不互补。
实施方案63.如实施方案56-62中任一项所述的前体工程化多核苷酸,其中所述靶向结构域具有约20个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案64.如实施方案57-63中任一项所述的前体工程化多核苷酸,其中所述靶向结构域或所述RNA编辑募集结构域不包含所述第一间隔子结构域或所述第二间隔子结构域。
实施方案65.如实施方案57-64中任一项所述的前体工程化多核苷酸,其中所述靶向结构域在所述RNA编辑实体募集结构域的5个核苷酸内。
实施方案66.如实施方案57-65中任一项所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与Alu结构域、APOBEC募集结构域、GluR2结构域或Cas13募集结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案67.如实施方案66所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域的至少约20个核苷酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案68.如实施方案67所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案69.如实施方案66所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案70.如实施方案68所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案71.如实施方案66所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Cas13募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性,其中所述Cas13募集结构域包含Cas13a募集结构域、Cas13b募集结构域、Cas13c募集结构域或Cas13d募集结构域。
实施方案72.如实施方案71所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域包含:与所述Cas13b募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案73.如实施方案72所述的前体工程化多核苷酸,其中所述序列包含:与所述Cas13b募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案74.如实施方案57-73中任一项所述的前体工程化多核苷酸,其中所述RNA编辑实体募集结构域被构建成至少暂时地与RNA编辑实体缔合。
实施方案75.如实施方案74所述的前体工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白、APOBEC蛋白或两者。
实施方案76.如实施方案75所述的前体工程化多核苷酸,包含所述ADAR蛋白,其包含ADAR1或ADAR2。
实施方案77.如实施方案74-76中任一项所述的前体工程化多核苷酸,其中当所述RNA编辑实体募集结构域至少暂时地与所述RNA编辑实体缔合时,并且当所述靶向结构域至少暂时地与所述靶RNA缔合时,所述工程化多核苷酸被构建成促进对所述靶RNA的碱基的编辑。
实施方案78.如实施方案57-77中任一项所述的前体工程化多核苷酸,其中所述RNA编辑实体是天然存在于人类细胞中的分离的酶。
实施方案79.如实施方案57-77中任一项所述的前体工程化多核苷酸,其中所述RNA编辑实体是重组酶。
实施方案80.如实施方案56-79中任一项所述的前体工程化多核苷酸,还包含修饰。
实施方案81.如实施方案80所述的前体工程化多核苷酸,其中所述修饰包括糖修饰。
实施方案82.如实施方案80所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸的核苷酸包含甲基、氟基、甲氧基乙基、乙基、磷酸基、酰胺基、酯基或它们的任何组合。
实施方案83.如实施方案56-82中任一项所述的前体工程化多核苷酸,其中所述工程化多核苷酸是至少部分地遗传可编码的。
实施方案84.如实施方案57-83中任一项所述的前体工程化多核苷酸,其中所述RNA编辑实体通过键连而连接至所述前体工程化多核苷酸。
实施方案85.如实施方案84所述的前体工程化多核苷酸,其中所述键连是直接或间接共价键连。
实施方案86.一种载体,其包含如实施方案1-55中任一项所述的工程化多核苷酸或如实施方案56-85中任一项所述的前体工程化多核苷酸。
实施方案87.如实施方案86所述的载体,其中所述载体包含多肽外壳,其中所述工程化多核苷酸的至少一部分存在于所述多肽外壳内部。
实施方案88.如实施方案86或87所述的载体,其中所述载体包含脂质体、病毒载体、纳米颗粒或它们的任何组合。
实施方案89.一种核酸,其至少部分编码如实施方案1-55中任一项所述的工程化多核苷酸或如实施方案56-85中任一项所述的前体工程化多核苷酸。
实施方案90.如实施方案89所述的核酸,其中所述核酸是双链的。
实施方案91.如实施方案89所述的核酸,其中所述核酸包含靶向标签。
实施方案92.如实施方案91所述的核酸,包含具有N-乙酰半乳糖胺(GlaNAc)的所述靶向标签。
实施方案93.一种单位剂型的药物组合物,其包含如实施方案1-55中任一项所述的工程化多核苷酸、如实施方案56-85中任一项所述的前体工程化多核苷酸、如实施方案86-88中任一项所述的载体或如实施方案89-92中任一项所述的核酸;以及药学上可接受的赋形剂、稀释剂或载剂。
实施方案94.一种试剂盒,其包括如实施方案1-55中任一项所述的工程化多核苷酸、如实施方案56-85中任一项所述的前体工程化多核苷酸、如实施方案86-88中任一项所述的载体、如实施方案89-92中任一项所述的核酸或如实施方案93所述的药物组合物,以及容器。
实施方案95.一种治疗有需要的受试者的疾病或疾患的方法,其包括:施用如实施方案1-55中任一项所述的工程化多核苷酸、如实施方案56-85中任一项所述的前体工程化多核苷酸、如实施方案86-88中任一项所述的载体、如实施方案89-92中任一项所述的核酸或如实施方案93所述的药物组合物。
实施方案96.如实施方案95所述的方法,其中所述方法包括施用第二疗法。
实施方案97.如实施方案95所述的方法,其中所述施用是进行至少约:每天1次、每天2次、每天3次、每天4次、每天5次或每天6次。
实施方案98.如实施方案95所述的方法,其中所述施用是进行约:1天至约8天、1周至约5周、1个月至约12个月、1年至约3年、3年至约10年、10年至约50年、25年至约100年或约50年至约130年。
实施方案99.如实施方案95所述的方法,其中所述施用是向细胞施用。
实施方案100.如实施方案99所述的方法,其中所述细胞是T细胞。
实施方案101.如实施方案95所述的方法,还包括诊断所述受试者患有疾病。
实施方案102.根据实施方案95所述的方法,其中所述受试者是人。
实施方案103.一种预防有需要的受试者的疾病或疾患的方法,其包括:预防性地施用如实施方案1-55中任一项所述的工程化多核苷酸、如实施方案56-85中任一项所述的前体工程化多核苷酸、如实施方案86-88中任一项所述的载体、如实施方案89-92中任一项所述的核酸或如实施方案93所述的药物组合物。
实施方案104.如实施方案103所述的方法,其中所述方法包括施用第二疗法。
实施方案105.如实施方案103所述的方法,其中所述施用是进行至少约:每天1次、每天2次、每天3次、每天4次、每天5次或每天6次。
实施方案106.如实施方案103所述的方法,其中所述施用是进行约:1天至约8天、1周至约5周、1个月至约12个月、1年至约3年、3年至约10年、10年至约50年、25年至约100年或约50年至约130年。
实施方案107.如实施方案103所述的方法,其中所述施用是向细胞施用。
实施方案108.如实施方案107所述的方法,其中所述细胞是T细胞。
实施方案109.根据实施方案103所述的方法,其中所述受试者是人。
实施方案110.一种形成工程化多核苷酸的方法,所述方法包括:
用连接实体将前体工程化多核苷酸的3'端上的核苷酸直接或间接连接至所述前体工程化多核苷酸的5'端上的核苷酸,从而形成所述工程化多核苷酸,其中所述工程化多核苷酸包含:
(a)靶向结构域,所述靶向结构域与靶RNA至少部分互补,以及
(b)间隔子结构域,其中所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基,其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中以下中的至少一项适用:
(i)所述间隔子结构域被构建成在所述靶向结构域与所述靶RNA结合时不与所述靶RNA结合;
(ii)当所述靶向结构域与所述靶RNA结合时,所述间隔子结构域与所述靶向结构域隔开至少1个核苷酸,并且如果所述间隔子结构域与所述靶RNA结合,则所述间隔子结构域的结合不在与所述间隔子结构域结合的所述靶RNA的部分处产生对所述靶RNA的编辑;或者
(iii)当所述间隔子结构域邻近所述靶向结构域的5'端或3'端时,所述间隔子结构域不与所述靶RNA互补。
实施方案111.如实施方案110所述的方法,其中所述工程化多核苷酸被构建成促进与多个其他RNA中的所述靶RNA的结合特异性与缺乏所述间隔子结构域的相应工程化多核苷酸相比的结合特异性的增加,如通过在与所述工程化多核苷酸或所述相应工程化多核苷酸接触后对所述靶RNA和多个其他RNA进行测序所确定的。
实施方案112.如实施方案110或111所述的方法,其中所述间隔子结构域被构建成促进所述工程化多核苷酸相对于缺乏所述间隔子结构域的所述相应工程化多核苷酸与所述靶RNA的结合的较低熵(ΔS),如通过开尔文探针力显微镜(KPFM)确定的。
实施方案113.如实施方案110-112中任一项所述的方法,其中所述间隔子结构域被构建成促进所述工程化RNA采用促进至少部分与所述靶RNA结合的构象。
实施方案114.如实施方案113所述的方法,其中所述间隔子结构域被构建成相对于缺乏所述间隔子结构域的所述相应工程化多核苷酸的编辑效率至少维持所述工程化多核苷酸对所述靶RNA的编辑效率,如通过在与缺乏所述间隔子结构域的所述工程化多核苷酸或所述相应工程化多核苷酸接触后对所述靶RNA进行测序所确定的。
实施方案115.如实施方案114所述的方法,其中所述至少维持包括增加。
实施方案116.如实施方案110-115中任一项所述的方法,其中所述前体工程化多核苷酸按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;所述靶向结构域;第二间隔子结构域;第二连接结构域;以及第二核酶结构域。
实施方案117.如实施方案110-116中任一项所述的方法,其中所述间隔子结构域包含以下的多核苷酸序列:5'AUAUA 3'。
实施方案118.如实施方案110-116中任一项所述的方法,其中所述间隔子结构域包含以下的多核苷酸序列:5'AUAAU 3'。
实施方案119.如实施方案110-118中任一项所述的方法,其中所述间隔子结构域具有约1个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案120.如实施方案110-119中任一项所述的方法,其中所述间隔子结构域的所述核苷酸的至少约80%与所述靶RNA不互补。
实施方案121.如实施方案110-120中任一项所述的方法,其中所述靶向结构域具有约20个核苷酸至约1,000个核苷酸长度的序列长度。
实施方案122.如实施方案110-121中任一项所述的方法,其中所述工程化多核苷酸还包含RNA编辑实体募集结构域。
实施方案123.如实施方案122所述的方法,其中所述靶向结构域或所述RNA编辑募集结构域不包含所述间隔子结构域。
实施方案124.如实施方案122所述的方法,其中所述靶向结构域在所述RNA编辑实体募集结构域的5个核苷酸内。
实施方案125.如实施方案122所述的方法,其中所述RNA编辑实体募集结构域募集RNA编辑实体,所述RNA编辑实体在与所述工程化多核苷酸缔合时对所述靶RNA中的核苷酸的碱基进行化学转化。
实施方案126.如实施方案125所述的方法,其中所述RNA编辑实体包含ADAR蛋白、APOBEC蛋白或两者。
实施方案127.如实施方案126所述的方法,包含所述ADAR蛋白,其包含ADAR1或ADAR2。
实施方案128.如实施方案125所述的方法,其中相对于缺乏所述化学转化的在其他方面可比较的靶RNA,所述化学转化导致在翻译具有所述化学转化的所述靶RNA后蛋白质或其片段的水平增加。
实施方案129.如实施方案128所述的方法,其中增加的水平为约5%至100%。
实施方案130.如实施方案125所述的方法,其中相对于缺乏所述化学转化的在其他方面可比较的靶RNA,所述化学转化导致在翻译具有所述化学转化的所述靶RNA后蛋白质或其片段的水平降低。
实施方案131.如实施方案130所述的方法,其中降低的水平为约5%至100%。
实施方案132.如实施方案125-131中任一项所述的方法,其中所述化学转化将有义密码子转化为终止密码子。
实施方案133.如实施方案125-131中任一项所述的方法,其中所述化学转化将终止密码子转化为有义密码子。
实施方案134.如实施方案125-131中任一项所述的方法,其中所述化学转化将第一有义密码子转化为第二有义密码子。
实施方案135.如实施方案125-131中任一项所述的方法,其中所述化学转化将第一终止密码子转化为第二终止密码子。
实施方案136.如实施方案125-135中任一项所述的方法,其中所述工程化多核苷酸形成二级结构,所述二级结构包含:茎环、十字形、趾固、错配凸起或它们的任何组合。
实施方案137.如实施方案125所述的方法,其中所述RNA编辑实体募集结构域包含:与Alu结构域、APOBEC募集结构域、GluR2结构域或Cas13募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案138.如实施方案137所述的方法,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案139.如实施方案138所述的方法,其中所述RNA编辑实体募集结构域包含:与所述Alu结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案140.如实施方案137所述的方法,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案141.如实施方案140所述的方法,其中所述RNA编辑实体募集结构域包含:与所述APOBEC募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案142.如实施方案137所述的方法,其中所述RNA编辑实体募集结构域包含:与所述Cas13募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性,其中所述Cas13募集结构域包含Cas13a募集结构域、Cas13b募集结构域、Cas13c募集结构域或Cas13d募集结构域。
实施方案143.如实施方案142所述的方法,其中所述RNA编辑实体募集结构域包含:与所述Cas13b募集结构域的至少约20个核酸至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案144.如实施方案143所述的方法,其中所述序列包含:与所述Cas13b募集结构域至少约70%、75%、80%、85%、90%、95%或100%的序列同源性。
实施方案145.如实施方案122-144中任一项所述的方法,其中所述RNA编辑实体是天然存在于哺乳动物细胞中的分离的酶。
实施方案146.如实施方案122-144中任一项所述的方法,其中所述RNA编辑实体是重组酶。
实施方案147.如实施方案122-146中任一项所述的方法,其中所述工程化多核苷酸包含修饰。
实施方案148.如实施方案147所述的方法,其中所述修饰包括在所述工程化多核苷酸的核苷酸的碱基上的糖修饰。
实施方案149.如实施方案148所述的方法,其中所述工程化多核苷酸的核苷酸包含甲基、氟基、甲氧基乙基、乙基、磷酸基、酰胺基、酯基或它们的任何组合。
实施方案150.如实施方案110-149中任一项所述的方法,其中所述工程化多核苷酸是遗传可编码的。
实施方案151.如实施方案122-150中任一项所述的方法,其中所述RNA编辑实体通过键连而连接至所述工程化多核苷酸。
实施方案152.如实施方案151所述的方法,其中所述工程化多核苷酸与所述RNA编辑实体之间的键连是直接或间接共价键连。
实施方案153.如实施方案110-152中任一项所述的方法,其中所述连接实体包含RNA连接酶。
实施方案154.如实施方案110-153中任一项所述的方法,其中所述工程化多核苷酸在生理pH的水溶液中保持的半衰期是可比较的多核苷酸的至少约4倍。
实施方案155.如实施方案110-154中任一项所述的方法,其中向有需要的受试者给予的所述工程化多核苷酸的治疗有效量是所述可比较的工程化多核苷酸的至少约1/4。
实施方案158.一种工程化多核苷酸,其包含:靶向结构域,所述靶向结构域与靶RNA至少部分互补;RNA编辑实体募集结构域,其中所述RNA编辑实体募集结构域被构建成至少暂时地与RNA编辑实体缔合;以及间隔子结构域,其中所述靶向结构域或所述RNA编辑募集结构域不包含所述间隔子结构域;其中所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,并且其中所述主链不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案159.一种工程化多核苷酸,其包含:靶向结构域,所述靶向结构域与靶RNA至少部分互补;以及间隔子结构域,其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的;其中所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,并且其中所述主链不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案160.一种前体工程化线性多核苷酸,其按5'至3'的顺序包含:第一间隔子结构域;靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及第二间隔子结构域,其中所述第一间隔子结构域或所述第二间隔子结构域与所述靶RNA不互补,其中所述前体工程化线性多核苷酸的转录物在所述前体工程化线性多核苷酸插入哺乳动物细胞中时自环化,从而形成环化的工程化多核苷酸;并且其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
实施方案161.如实施方案160所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸包含至所述第一间隔子结构域的核酶结构域5'或至所述第二间隔子结构域的3'。
实施方案162.如实施方案161所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸包含位于所述核酶结构域与所述第一间隔子结构域之间或位于所述核酶结构域与所述第二间隔子结构域之间的连接结构域。
实施方案163.如实施方案160-162中任一项所述的前体工程化线性多核苷酸,其中在自环化后,所述第一间隔子结构域和所述第二间隔子结构域包含填充序列,所述填充序列是所述环化的工程化多核苷酸的总长度的约40%至约70%。
实施方案164.如实施方案163所述的前体工程化线性多核苷酸,其中在自环化后,所述第一间隔子结构域和所述第二间隔子结构域包含填充序列,所述填充序列是所述环化的工程化多核苷酸的总序列的约50%至约67%。
实施方案165.如实施方案163或164所述的前体工程化线性多核苷酸,其中相对于缺乏所述填充序列的在其他方面可比较的环化多核苷酸,所述填充序列增加了所述靶向结构域与所述靶RNA的杂交。
实施方案166.如实施方案160-165中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与所述靶RNA至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的互补性。
实施方案167.如实施方案160-166中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。
实施方案168.如实施方案160-167中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的3'或5'非翻译区(UTR)基本上互补。
实施方案169.如实施方案160-168中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的内含子区基本上互补。
实施方案170.如实施方案160-169中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)基本上互补。
实施方案171.如实施方案160-169中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域不与所述靶RNA的上游开放阅读框(uORF)的一部分至少部分互补。
实施方案172.如实施方案160-171中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
实施方案173.如实施方案172所述的前体工程化线性多核苷酸,其中错配核苷酸与跟所述靶RNA互补的两个核苷酸相邻,所述两个核苷酸在所述错配核苷酸的每一侧各一个。
实施方案174.如实施方案160-173中任一项所述的前体工程化线性多核苷酸,其中相对于缺乏所述编辑的在其他方面可比较的靶RNA的翻译蛋白质,在翻译具有对所述碱基的所述编辑的所述靶RNA后,对所述碱基的所述编辑增加蛋白质或其片段的水平、增加蛋白质或其片段的长度、增加蛋白质或其片段的功能性、增加蛋白质或其片段的稳定性、或它们的任何组合。
实施方案175.如实施方案174所述的前体工程化线性多核苷酸,其中增加的水平为约5%至约100%。
实施方案176.如实施方案174所述的前体工程化线性多核苷酸,其中所述增加的长度为所述蛋白质或其片段的约5%至约100%。
实施方案177.如实施方案174所述的前体工程化线性多核苷酸,其中所述增加的稳定性是所述蛋白质或其片段的增加的半衰期。
实施方案178.如实施方案160-177中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将有义密码子转化为终止密码子。
实施方案179.如实施方案178所述的前体工程化线性多核苷酸,其中所述有义密码子与疾病致病途径有关,并且其中将所述有义密码子转化为所述终止密码子减少了所述疾病致病途径。
实施方案180.如实施方案160-177中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将终止密码子转化为有义密码子。
实施方案181.如实施方案180所述的前体工程化线性多核苷酸,其中所述终止密码子与疾病致病途径有关,并且其中将所述终止密码子转化为所述有义密码子减少了所述疾病致病途径。
实施方案182.如实施方案160-177中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将第一有义密码子转化为第二有义密码子。
实施方案183.如实施方案182所述的前体工程化线性多核苷酸,其中所述第一有义密码子与疾病致病途径有关,并且其中将所述第一有义密码子转化为所述第二有义密码子减少了所述疾病致病途径。
实施方案184.如实施方案160-183中任一项所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸为约80个核苷酸至约600个核苷酸;约80个核苷酸至约300个核苷酸;约400个核苷酸至约600个核苷酸;或约200个核苷酸至约400个核苷酸。
实施方案185.如实施方案184所述的前体工程化线性多核苷酸,其中所述靶向结构域为约20个核苷酸至约150个核苷酸;或约100个核苷酸至约200个核苷酸。
实施方案186.如实施方案1-185中任一项所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR蛋白或APOBEC蛋白。
实施方案187.如实施方案186所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR,并且其中所述ADAR是ADAR1。
实施方案188.如实施方案187所述的前体工程化线性多核苷酸,其中所述ADAR1是hADAR1。
实施方案189.如实施方案186所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR,并且其中所述ADAR是ADAR2。
实施方案190.如实施方案189所述的前体工程化线性多核苷酸,其中所述ADAR2是hADAR2。
实施方案191.如实施方案186所述的前体工程化线性多核苷酸,其中所述RNA编辑实体包含ADAR,并且其中所述ADAR是ADAR3。
实施方案192.如实施方案191所述的前体工程化线性多核苷酸,其中所述ADAR3是hADAR3。
实施方案193.如实施方案160-192所述的前体工程化线性多核苷酸,其中所述靶向结构域不包含适体。
实施方案194.如实施方案160-193中任一项所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸不包含或编码编码被构建用于RNA干扰(RNAi)的序列的序列。
实施方案195.如实施方案160-194中任一项所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸不包含或编码编码短干扰RNA(siRNA)、microRNA(miRNA)、短发夹RNA(shRNA)或dicer底物的序列。
实施方案196.如实施方案160所述的前体工程化线性多核苷酸,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化。
实施方案197.一种前体工程化多核苷酸,其按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;第二连接结构域;以及第二核酶结构域,其中所述第一间隔子结构域与所述靶RNA不互补,其中所述前体工程化线性多核苷酸的转录物在所述前体工程化线性多核苷酸插入哺乳动物细胞中时自环化,从而形成环化的工程化多核苷酸;并且其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
实施方案198.如实施方案197所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸是线性的。
实施方案199.如实施方案197或198所述的前体工程化多核苷酸,其中所述第一间隔子结构域是包含约50个核苷酸至约400个核苷酸或约200个核苷酸至约100个核苷酸的长度的填充序列。
实施方案200.如实施方案199所述的前体工程化多核苷酸,其中相对于缺乏所述填充序列的在其他方面可比较的环化多核苷酸,所述填充序列增加了所述靶向结构域与所述靶RNA的杂交。
实施方案201.如实施方案197-200中任一项所述的前体工程化多核苷酸,其中所述靶向结构域包含与所述靶RNA至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的互补性。
实施方案202.如实施方案197-201中任一项所述的前体工程化多核苷酸,还包含RNA编辑酶募集结构域。
实施方案203.如实施方案197-202中任一项所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者包含以下的多核苷酸序列:5'AUAUA3'。
实施方案204.如实施方案197-202中任一项所述的前体工程化多核苷酸,其中所述第一间隔子结构域、所述第二间隔子结构域或两者包含以下的多核苷酸序列:5'AUAAU3'。
实施方案205.如实施方案197-204中任一项所述的前体工程化线性多核苷酸,其中相对于缺乏所述第一间隔子结构域的环化的工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),所述环化的工程化多核苷酸具有较低的与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的。
实施方案206.如实施方案197-205中任一项所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸还包含与U7或U1启动子序列具有至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%序列同一性的序列。
实施方案207.如实施方案197-206中任一项所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸还包含RNA序列基序。
实施方案208.如实施方案207所述的前体工程化多核苷酸,其中所述RNA序列基序包含SmOPT序列、hnRNPA1序列、MALAT1序列、SIRLOIN序列或它们的组合。
实施方案209.如实施方案197-208中任一项所述的前体工程化多核苷酸,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
实施方案210.如实施方案209所述的前体工程化多核苷酸,其中错配核苷酸与跟所述靶RNA互补的两个核苷酸相邻,所述两个核苷酸在所述错配核苷酸的每一侧各一个。
实施方案211.如实施方案197-210中任一项所述的前体工程化多核苷酸,其中所述前体多核苷酸为约80个核苷酸至约600个核苷酸;约80个核苷酸至约300个核苷酸;约400个核苷酸至约600个核苷酸;约200个核苷酸至约400个核苷酸或约20个核苷酸至约150个核苷酸。
实施方案212.如实施方案197所述的前体工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白或APOBEC蛋白。
实施方案213.如实施方案212所述的前体工程化多核苷酸,其中所述RNA编辑实体包含ADAR,并且其中所述ADAR包含ADAR1、ADAR2或ADAR3。
实施方案214.如实施方案197所述的前体工程化多核苷酸,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、或泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化。
实施方案215.如实施方案197-214中任一项所述的前体工程化多核苷酸,其中所述靶RNA是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。
实施方案216.如实施方案197-215中任一项所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸不包含或编码编码被构建用于RNA干扰(RNAi)的序列的序列。
实施方案217.如实施方案197-216中任一项所述的前体工程化多核苷酸,其中所述前体工程化多核苷酸不包含或编码编码短干扰RNA(siRNA)、microRNA(miRNA)、短发夹RNA(shRNA)或dicer底物的序列。
实施方案218.如实施方案197-217中任一项所述的前体工程化多核苷酸,其中所述靶向结构域与所述靶RNA的3'或5'非翻译区(UTR)的至少一部分基本上互补。
实施方案219.如实施方案197-218中任一项所述的前体工程化多核苷酸,其中所述靶向结构域与所述靶RNA的内含子区的至少一部分基本上互补。
实施方案220.如实施方案197-219中任一项所述的前体工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分基本上互补。
实施方案221.如实施方案197-214中任一项所述的前体工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分基本上互补。
实施方案222.一种工程化多核苷酸,其编码或包含:a)靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;
以及b)间隔子结构域,其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸的靶向结构域与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述靶向结构域与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中所述工程化多核苷酸包含式(I)的结构:
(I)
其中每个X为O;每个Y为P;每个Z为O或S;每个A独立地为H、D、卤素、OM、SM、NRM或NRR';每个B独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、这些中的任一种的盐或这些中的任一种的衍生物;m独立地为0-1,000的整数;并且其中:每个M独立地为无机或有机阳离子、H或D;并且每个R和R'独立地为H、D、卤素或C1-C6烷基,其中所述靶向结构域与所述靶RNA的序列的缔合促进RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。
实施方案223.如实施方案222所述的工程化多核苷酸,其中每个单元m独立地呈(D)-或(L)-构型。
实施方案224.如实施方案222所述的工程化多核苷酸,其中所述靶向结构域包含与所述靶RNA至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的互补性。
实施方案225.如实施方案222-224中任一项所述的工程化多核苷酸,其中式(I)根据式(II)
(式II)。
实施方案226.如实施方案222-225中任一项所述的工程化多核苷酸,其中每个Z为O并且每个R为H。
实施方案227.如实施方案222-226中任一项所述的工程化多核苷酸,其中每个m为约30-600的独立整数。
实施方案228.如实施方案222-227中任一项所述的工程化多核苷酸,其中所述RNA编辑酶对所述靶RNA的所述核苷酸的所述碱基的编辑在体外测定中确定,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系中,(ii)将所述工程化多核苷酸直接或间接引入到所述原代细胞系中,以及(iii)对所述靶RNA进行测序。
实施方案229.如实施方案222-228中任一项所述的工程化多核苷酸,其中相对于缺乏所述编辑的在其他方面可比较的靶RNA的翻译蛋白质,在翻译具有对所述碱基的所述编辑的所述靶RNA后,对所述碱基的所述编辑导致增加的蛋白质或其片段的水平、增加的蛋白质或其片段的长度、增加的蛋白质或其片段的功能性、增加的蛋白质或其片段的稳定性、或它们的任何组合。
实施方案230.如实施方案229所述的工程化多核苷酸,其中增加的水平为约5%至约100%。
实施方案231.如实施方案229所述的工程化多核苷酸,其中所述增加的长度为所述蛋白质或其片段的约5%至约100%。
实施方案232.如实施方案229所述的工程化多核苷酸,其中所述增加的稳定性是所述蛋白质或其片段的增加的半衰期。
实施方案233.如实施方案222-232中任一项所述的工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白、APOBEC蛋白或两者。
实施方案234.如实施方案222-233中任一项所述的工程化多核苷酸,其中所述RNA编辑实体包含ADAR,并且其中ADAR包含ADAR1或ADAR2。
实施方案235.如实施方案222-234中任一项所述的工程化多核苷酸,其中对碱基的所述编辑将有义密码子转化为终止密码子。
实施方案236.如实施方案235所述的工程化多核苷酸,其中所述有义密码子与疾病致病途径有关,并且其中将所述有义密码子转化为所述终止密码子减少了所述疾病致病途径。
实施方案237.如实施方案222-234中任一项所述的工程化多核苷酸,其中对碱基的所述编辑将终止密码子转化为有义密码子。
实施方案238.如实施方案222-234中任一项所述的工程化多核苷酸,其中对碱基的所述编辑将第一有义密码子转化为第二有义密码子。
实施方案239.如实施方案238所述的工程化多核苷酸,其中所述第一有义密码子与疾病致病途径有关,并且其中将所述第一有义密码子转化为所述第二有义密码子减少了所述疾病致病途径。
实施方案240.如实施方案222-238中任一项所述的工程化多核苷酸,其中对碱基的所述编辑将指定第一氨基酸的有义密码子转化为指定第二氨基酸的第二有义密码子。
实施方案241.如实施方案240所述的工程化多核苷酸,其中所述第一氨基酸是蛋白酶切割位点。
实施方案242.如实施方案222-241中任一项所述的工程化多核苷酸,其中所述疾病或疾患为雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化。
实施方案243.一种工程化多核苷酸,其编码或包含:a)靶向结构域,所述靶向结构域能够与靶RNA的序列杂交;以及b)间隔子结构域,其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中所述工程化多核苷酸包含式(I)的结构:
(I)
其中每个X为O;每个Y为P;每个Z为O或S;每个A独立地为H、D、卤素、OM、SM、NRM或NRR';每个B独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、
这些中的任一种的盐或这些中的任一种的衍生物;m独立地为0-1,000的整数;并且其中:每个M独立地为无机或有机阳离子、H或D;并且每个R和R'独立地为H、D、卤素或C1-C6烷基,其中所述靶向结构域被构建成至少部分地与所述靶RNA的非翻译区缔合,其中所述靶向结构域与所述靶RNA的所述非翻译区的缔合促进由所述靶RNA编码的多肽的表达水平的降低。
实施方案244.一种工程化多核苷酸,其编码或包含:a)靶向结构域,所述靶向结构域能够与靶RNA的序列杂交;以及b)间隔子结构域,其中相对于缺乏所述间隔子结构域的相应工程化多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中
所述工程化多核苷酸包含式(I)的结构:
(I)
其中每个X为O;每个Y为P;每个Z为O或S;每个A独立地为H、D、卤素、OM、SM、NRM或NRR';每个B独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、这些中的任一种的盐或这些中的任一种的衍生物;m独立地为0-1,000的整数;并且其中:每个M独立地为无机或有机阳离子、H或D;并且每个R和R'独立地为H、D、卤素或C1-C6烷基,其中所述靶向结构域被构建成至少部分地与所述靶RNA的非翻译区缔合,其中所述靶向结构域与所述靶RNA的所述非翻译区的缔合促进由所述靶RNA编码的多肽的表达水平的降低,并且其中所述靶向结构域与所述靶RNA的序列的缔合促进RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。
实施方案245.如实施方案243或244所述的工程化多核苷酸,其中相对于在不存在所述工程化多核苷酸的情况下由所述靶RNA编码的多肽的水平,所述靶向结构域与所述靶RNA的所述非翻译区的缔合促进由所述靶RNA编码的所述多肽的表达水平的降低,如通过体外测定所确定的,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系的第一细胞和第二细胞中,(ii)将所述工程化多核苷酸直接或间接引入到所述原代细胞系的所述第一细胞中,以及(iii)比较所述第一细胞和所述第二细胞中由所述靶RNA表达的所述多肽的量。
实施方案246.如实施方案243-245中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA至少部分互补。
实施方案247.如实施方案246所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA至少部分互补,包含与所述靶RNA的反向互补序列具有至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%序列同源性的多核苷酸序列。
实施方案248.如实施方案243-247中任一项所述的工程化多核苷酸,其中每个单元m独立地呈(D)-或(L)-构型。
实施方案249.如实施方案243-248中任一项所述的工程化多核苷酸,其中式(I)根据式(II)
实施方案250.如实施方案243-249中任一项所述的工程化多核苷酸,其中降低的水平为约5%至约100%。
实施方案251.如实施方案243-250中任一项所述的工程化多核苷酸,其中所述原代细胞系包括神经元细胞、感光细胞、视网膜色素上皮细胞、神经胶质细胞、成肌细胞、肌管细胞、肝细胞、肺上皮细胞或成纤维细胞。
实施方案252.如实施方案243-251中任一项所述的工程化多核苷酸,其中所述靶RNA是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。
实施方案253.如实施方案243-252中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含或编码编码被构建用于RNA干扰(RNAi)的序列的序列。
实施方案254.如实施方案243-253中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含或编码编码短干扰RNA(siRNA)、microRNA(miRNA)、短发夹RNA(shRNA)或dicer底物的序列。
实施方案255.如实施方案243-254中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于RNA指导的RNA内切核酸酶。
实施方案256.如实施方案243-255中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于RISC或Dicer。
实施方案257.如实施方案243-256中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于Argonaute。
实施方案258.如实施方案243-257中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的3'或5'非翻译区(UTR)的至少一部分至少部分互补。
实施方案259.如实施方案243-258中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的内含子区的至少一部分至少部分互补。
实施方案260.如实施方案243-259中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分至少部分互补。
实施方案261.如实施方案243-259中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分不至少部分互补。
实施方案262.如实施方案243-261中任一项所述的工程化多核苷酸,其中所述靶RNA与雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化相关。
实施方案263.如实施方案244-262中任一项所述的工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白、APOBEC蛋白或两者。
实施方案264.如实施方案244-262中任一项所述的工程化多核苷酸,其中所述RNA编辑实体包含ADAR蛋白。
实施方案265.一种工程化多核苷酸,其编码或包含:a)靶向结构域,所述靶向结构域与靶RNA至少部分互补;以及b)间隔子结构域,其中所述靶向结构域物理上不包含所述间隔子结构域;其中所述工程化多核苷酸包含式(IV)的结构:
(IV)其中在所述工程化多核苷酸中,每个X为包含独立地为尿嘧啶、胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤、这些中的任一种的盐或这些中的任一种的衍生物的碱基的核苷酸,n独立地为0-1,000的整数;并且其中对于每个连接,每个核苷酸通过磷酸酯、硫代磷酸酯、硫代磷酸酯或亚磷酰胺键连独立地与两个相邻核苷酸连接;并且其中:(i)所述靶向结构域被构建成至少部分地与所述靶RNA的编码区缔合,其中所述靶向结构域与所述靶RNA的所述编码区的缔合促进RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑,(ii)所述靶向结构域被构建成至少部分地与所述靶RNA的非翻译区缔合,其中所述靶向结构域与所述靶RNA的所述非翻译区的缔合促进由所述靶RNA产生的多肽的水平的降低,或(iii)它们的任何组合。
实施方案266.如实施方案265所述的工程化多核苷酸,其中所述RNA编辑实体对所述靶RNA的所述核苷酸的所述碱基的编辑在体外测定中确定,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系中,(ii)将所述工程化多核苷酸直接或间接引入到所述原代细胞系中,以及(iii)对所述靶RNA进行测序。
实施方案267.如实施方案265或266所述的工程化多核苷酸,其中相对于在不存在所述工程化多核苷酸的情况下由所述靶RNA编码的多肽的水平,所述靶向结构域与所述靶RNA的所述非翻译区的缔合促进由所述靶RNA编码的所述多肽的表达水平的降低,如通过体外测定所确定的,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系的第一细胞和第二细胞中,(ii)将所述工程化多核苷酸直接或间接引入到所述原代细胞系的所述第一细胞中,以及(iii)比较所述第一细胞和所述第二细胞中由所述靶RNA表达的所述多肽的量。
实施方案268.如实施方案265-267中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案269.如实施方案265-268中任一项所述的工程化多核苷酸,其中每个5'羟基和每个3'羟基通过共价氧磷键独立地与磷键合。
实施方案270.如实施方案269所述的工程化多核苷酸,其中所述磷包含在磷酸二酯基团中。
实施方案271.如实施方案265-270中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含RNA编辑实体募集结构域。
实施方案272.如实施方案265-271中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含或编码编码被构建用于RNA干扰(RNAi)的序列的序列。
实施方案273.如实施方案265-272中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含或编码编码短干扰RNA(siRNA)、microRNA(miRNA)、短发夹RNA(shRNA)或dicer底物的序列。
实施方案274.如实施方案265-273中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于RNA指导的RNA内切核酸酶。
实施方案275.如实施方案265-274中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于Dicer或RISC。
实施方案276.如实施方案265-275中任一项所述的工程化多核苷酸,其中由所述靶RNA编码的所述多肽的所述表达水平的降低至少部分地不依赖于Argonaute。
实施方案277.如实施方案265-276中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的3'或5'非翻译区(UTR)的至少一部分至少部分互补。
实施方案278.如实施方案265-277中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的内含子区的至少一部分至少部分互补。
实施方案279.如实施方案265-278中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分至少部分互补。
实施方案280.如实施方案265-278中任一项所述的工程化多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)的至少一部分不至少部分互补。
实施方案281.如实施方案265-280中任一项所述的工程化多核苷酸,其中所述靶RNA与雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化相关。
实施方案282.一种工程化环状多核苷酸,其编码或包含:靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及间隔子结构域,所述间隔子结构域与所述靶RNA不互补,其中所述间隔子结构域通过增加一个或多个核苷酸来扩大所述工程化环状多核苷酸,
其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
实施方案283.如实施方案282所述的工程化环状多核苷酸,其中所述RNA编辑实体对所述靶RNA的核苷酸的所述碱基的编辑在体外测定中确定,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系中,(ii)将所述工程化多核苷酸直接或间接引入到原代细胞系中,以及(iii)对所述靶RNA进行测序。
实施方案284.如实施方案282或283所述的工程化环状多核苷酸,其中所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案285.如实施方案284所述的工程化环状多核苷酸,其中每个5'羟基和每个3'羟基通过共价氧磷键独立地与磷键合。
实施方案286.如实施方案285所述的工程化环状多核苷酸,其中所述磷包含在磷酸二酯基团中。
实施方案287.如实施方案282-286中任一项所述的工程化环状多核苷酸,还包含RNA编辑酶募集结构域,其中所述RNA编辑酶募集结构域募集RNA编辑酶,所述RNA编辑酶在与所述工程化多核苷酸缔合时对所述靶RNA中的核苷酸的碱基进行化学转化。
实施方案288.如实施方案282-287中任一项所述的工程化环状多核苷酸,其中所述工程化多核苷酸为约40个核苷酸至约200个核苷酸。
实施方案289.如实施方案288所述的工程化环状多核苷酸,其中所述工程化多核苷酸为约40个核苷酸至约100个核苷酸。
实施方案290.如实施方案288所述的工程化环状多核苷酸,其中所述工程化多核苷酸为约140个核苷酸至约200个核苷酸。
实施方案291.如实施方案288所述的工程化环状多核苷酸,其中所述工程化多核苷酸为约80个核苷酸至约150个核苷酸。
实施方案292.如实施方案282-291中任一项所述的工程化环状多核苷酸,其中所述靶向结构域为约20个核苷酸至约150个核苷酸。
实施方案293.如实施方案282-292中任一项所述的工程化环状多核苷酸,其中所述靶RNA包含无义突变。
实施方案294.如实施方案282-293中任一项所述的工程化环状多核苷酸,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
实施方案295.如实施方案294所述的工程化环状多核苷酸,其中错配核苷酸与跟所述靶RNA互补的两个核苷酸相邻,所述两个核苷酸在所述错配核苷酸的每一侧各一个。
实施方案296.如实施方案282-295中任一项所述的工程化环状多核苷酸,其中所述工程化多核苷酸还包含与U7或U1启动子序列具有至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%序列同一性的序列。
实施方案297.如实施方案282-296中任一项所述的工程化环状多核苷酸,其中所述工程化多核苷酸还包含RNA序列基序。
实施方案298.如实施方案297所述的工程化环状多核苷酸,其包含SmOPT序列、hnRNPA1序列、MALAT1序列、SIRLOIN序列或它们的组合。
实施方案299.如实施方案282所述的工程化环状多核苷酸,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化。
实施方案300.一种载体,其包含如实施方案160-196中任一项所述的前体工程化线性多核苷酸、如实施方案197-221中任一项所述的前体工程化多核苷酸或如实施方案222-299中任一项所述的工程化环状多核苷酸。
实施方案301.如实施方案300所述的载体,其中所述载体包含多肽外壳,其中所述工程化多核苷酸的至少一部分存在于所述多肽外壳内部。
实施方案302.如实施方案300或301所述的载体,其中所述载体包含脂质体、病毒载体、纳米颗粒或它们的任何组合。
实施方案303.如实施方案302所述的载体,其中所述载体包含腺相关病毒(AAV)载体。
实施方案304.如实施方案303所述的载体,其中所述AAV载体是AAV1载体、AAV2载体、AAV3载体、AAV4载体、AAV5载体、AAV6载体、AAV7载体、AAV8载体、AAV9载体、这些中的任一种的嵌合体或这些中的任一种的变体。
实施方案305.如实施方案303或304所述的载体,其中所述病毒载体是自身互补的腺相关病毒(scAAV)载体。
实施方案306.如实施方案303或304所述的载体,其中所述病毒载体是单链AAV载体。
实施方案307.一种核酸,其至少部分编码如实施方案160-196中任一项所述的前体工程化线性多核苷酸、如实施方案197-221中任一项所述的前体工程化多核苷酸或如实施方案222-299中任一项所述的工程化环状多核苷酸。
实施方案308.如实施方案307所述的核酸,其中所述核酸是双链的。
实施方案309.如实施方案307所述的核酸,其中所述核酸包含靶向标签。
实施方案310.如实施方案307所述的核酸,包含具有N-乙酰半乳糖胺(GlaNAc)的所述靶向标签。
实施方案311.一种单位剂型的药物组合物,其包含如实施方案160-196中任一项所述的前体工程化线性多核苷酸、如实施方案222-299中任一项所述的工程化环状多核苷酸或如实施方案300-306中任一项所述的载体;以及药学上可接受的赋形剂、稀释剂或载剂。
实施方案312.一种试剂盒,其包括如实施方案160-196中任一项所述的前体工程化线性多核苷酸、如实施方案197-221中任一项所述的前体工程化多核苷酸、如实施方案222-299中任一项所述的工程化多核苷酸、如实施方案300-306中任一项所述的载体、如实施方案307-310中任一项所述的核酸或如实施方案311所述的药物组合物,以及容器。
实施方案313.一种治疗或预防有需要的受试者的疾病或疾患的方法,其包括:施用治疗有效量的:如实施方案160-196中任一项所述的前体工程化线性多核苷酸、如实施方案222-299中任一项所述的工程化环状多核苷酸、如实施方案300-306中任一项所述的载体或如实施方案311所述的药物组合物。
实施方案314.如实施方案313所述的方法,其中所述方法包括施用第二疗法。
实施方案315.如实施方案313所述的方法,其中所述施用是向细胞施用。
实施方案316.如实施方案315所述的方法,其中所述细胞是T细胞。
实施方案317.如实施方案313所述的方法,还包括诊断所述受试者患有疾病。
实施方案318.根据实施方案313所述的方法,其中所述受试者是人。
实施方案319.一种形成工程化环状多核苷酸的方法,所述方法包括:用连接实体将前体工程化多核苷酸的3'端上的核苷酸直接或间接连接至所述前体工程化多核苷酸的5'端上的核苷酸,从而形成所述工程化环状多核苷酸,其中所述工程化环状多核苷酸包含:a)靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补,以及b)间隔子结构域,其中相对于缺乏所述间隔子结构域的相应环状多核苷酸的靶向结构域与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化环状多核苷酸的所述靶向结构域具有较低的所述靶向结构域与所述靶RNA的结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的,并且其中以下中的至少一项适用:(i)所述间隔子结构域不与所述靶RNA互补;(ii)当所述靶向结构域与所述靶RNA杂交时,所述间隔子结构域与所述靶向结构域隔开至少1个核苷酸,并且如果所述间隔子结构域与所述靶RNA杂交,则所述间隔子结构域的杂交不在与所述间隔子结构域结合的所述靶RNA的部分处产生对所述靶RNA的编辑;或(iii)当所述间隔子结构域邻近所述靶向结构域的5'端或3'端时,所述间隔子结构域不与所述靶RNA互补,其中所述靶向结构域与所述靶RNA的编码区杂交,其中所述靶向结构域与所述靶RNA的所述编码区的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
实施方案320.如实施方案319所述的方法,其中RNA编辑酶对所述靶RNA的核苷酸的所述碱基的编辑在体外测定中确定,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系中,(ii)将所述工程化环状多核苷酸直接或间接引入到原代细胞系中,以及(iii)对所述靶RNA进行测序。
实施方案321.如实施方案319或320所述的方法,其中所述工程化环状多核苷酸促进与多个其他RNA中的所述靶RNA的结合特异性与缺乏所述间隔子结构域的相应多核苷酸相比的结合特异性的增加,如通过在与所述工程化多核苷酸或所述相应多核苷酸接触后对所述靶RNA和多个其他RNA进行测序所确定的。
实施方案322.如实施方案319-321中任一项所述的方法,其中所述间隔子结构域促进所述工程化环状多核苷酸相对于缺乏所述间隔子结构域的所述相应环状多核苷酸与所述靶RNA的结合的较低熵(ΔS),如通过开尔文探针力显微镜(KPFM)确定的。
实施方案323.如实施方案319-322中任一项所述的方法,其中相对于缺乏所述间隔子结构域的在其他方面可比较的环化多核苷酸,所述间隔子结构域增加了所述靶向结构域与所述靶RNA的杂交。
实施方案324.如实施方案323所述的方法,其中所述间隔子结构域相对于缺乏所述间隔子结构域的所述相应多核苷酸的编辑效率增加所述工程化环状多核苷酸对所述靶RNA的编辑效率,如通过在与缺乏所述间隔子结构域的所述工程化多核苷酸或所述相应多核苷酸接触后对所述靶RNA进行测序所确定的。
实施方案325.如实施方案319-324中任一项所述的方法,其中所述工程化多核苷酸还包含RNA编辑酶募集结构域。
实施方案326.如实施方案325所述的方法,其中所述RNA编辑酶包含ADAR蛋白、APOBEC蛋白或两者。
实施方案327.如实施方案326所述的方法,包含所述ADAR蛋白,其包含ADAR1、ADAR2或ADAR3。
实施方案328.如实施方案319-327中任一项所述的方法,其中所述工程化多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
实施方案329.如实施方案328所述的方法,其中每个5'羟基和每个3'羟基通过共价氧磷键独立地与磷键合。
实施方案330.如实施方案329所述的方法,其中所述磷包含在磷酸二酯基团中。
实施方案331.如实施方案319-330中任一项所述的方法,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
实施方案332.如实施方案331所述的方法,其中错配核苷酸与跟所述靶RNA互补的两个核苷酸相邻,所述两个核苷酸在所述错配核苷酸的每一侧各一个。
实施方案333.如实施方案319-332中任一项所述的方法,其中所述靶向结构域为约20个核苷酸至约150个核苷酸。
实施方案334.如实施方案319-332中任一项所述的方法,其中所述工程化多核苷酸为约40个核苷酸至约200个核苷酸。
实施方案335.如实施方案334所述的方法,其中所述工程化多核苷酸为约40个核苷酸至约100个核苷酸。
实施方案336.如实施方案334所述的方法,其中所述工程化多核苷酸为约140个核苷酸至约200个核苷酸。
实施方案337.如实施方案334所述的方法,其中所述工程化多核苷酸为约80个核苷酸至约150个核苷酸。
实施方案338.如实施方案319所述的方法,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病或囊性纤维化。
实施方案339.一种工程化多核苷酸,其包含:靶向结构域,所述靶向结构域与靶RNA至少部分互补;RNA编辑实体募集结构域,其中所述RNA编辑实体募集结构域被构建成至少暂时地与RNA编辑实体缔合;以及间隔子结构域,其中所述靶向结构域或所述RNA编辑募集结构域不包含所述间隔子结构域;其中所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,并且其中所述主链不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者,其中所述靶向结构域被构建成至少部分地与所述靶RNA的编码区缔合,其中所述靶向结构域与所述靶RNA的所述编码区的缔合促进RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。
实施方案340.一种工程化多核苷酸,其包含:靶向结构域,所述靶向结构域与靶RNA至少部分互补;以及间隔子结构域,其中相对于缺乏所述间隔子结构域的相应多核苷酸与所述靶RNA结合的吉布斯自由能(ΔG),包含所述间隔子结构域的所述工程化多核苷酸具有较低的所述工程化多核苷酸与所述靶RNA的结合的ΔG,如通过开尔文探针力显微镜(KPFM)所确定的;其中所述工程化多核苷酸包含主链,所述主链包含共价连接在一起的多个糖和磷酸酯部分,并且其中所述主链不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者,其中所述靶向结构域被构建成至少部分地与所述靶RNA的编码区缔合,其中所述靶向结构域与所述靶RNA的所述编码区的缔合促进RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑。
实施方案341.如实施方案340所述的工程化多核苷酸,其中RNA编辑实体对所述靶RNA的核苷酸的所述碱基的编辑在体外测定中确定,所述体外测定包括:(i)将所述靶RNA直接或间接引入到原代细胞系中,(ii)将所述工程化多核苷酸直接或间接引入到原代细胞系中,以及(iii)对所述靶RNA进行测序。
实施例
实施例1
环状引导RNA可以在多个细胞系中将RNA编辑增加2-4倍
在该实施例中,将编码环状和线性引导RNA的质粒转染到不同的细胞系中以确定RAB7A 3'UTR区的RNA编辑百分比。在引入线性和环状引导RNA后,通过对靶RNA进行Sanger测序来确定RNA编辑。在测序之前通过逆转录酶将靶RNA转化为cDNA。分析Sanger迹线以评估编辑效率。图1A和图1B示出了设计1(线性引导)、设计2(线性引导)和设计3(环状引导)在不同细胞系背景中的RAB7A 3'UTR编辑效率。细胞系背景包括293T(人胚胎肾)、RD未分化(人胚胎横纹肌肉瘤)、LHCN(人骨骼肌成肌细胞)未分化和LHCN分化。对照示出为“无转染”。图1A示出了转染后48小时后RAB7A 3'UTR的RNA编辑百分比,并且图1B示出了转染后96小时后RAB7A 3'UTR的RNA编辑百分比。在图1A-B中,在所有测试细胞系中,与线性设计1相比,环状引导设计3显示出约2倍-4倍的编辑百分比增加。
实施例2
工程化引导RNA可包含间隔子结构域、连接序列结构域、核酶序列结构域和靶向结构域。
参考图2,工程化引导RNA被示出包含2个核酶结构域、2个连接序列结构域、2个间隔子结构域和靶向结构域(100.50)。在该实施例中,工程化引导RNA将通过经编码核酶的自催化反应在细胞中环化。工程化引导RNA将通过内源性连接酶进行连接序列的5'端和3'端的细胞内RNA连接,以将引导RNA环化。环状引导RNA可以执行本文所述的功能(例如在靶RNA中进行编辑)。
实施例3
环状工程化引导RNA可以通过在细胞内环化形成
在该实施例中,将编码环状和线性引导RNA的质粒转染到细胞中以确定细胞中是否发生环化。从细胞中提取RNA并将RNA逆转录为cDNA。用与引导RNA的100.50区域退火的引物进行PCR。引物被设计成扩增至3'端和5'端,因此如果发生环化则生成产物。图3B示出了工程化引导RNA设计3和设计5的环化的逆转录酶(RT)-PCR确认。线性引导RNA设计1和设计4不产生环状引导RNA,因为它们不使用经设计以用于检测引导RNA的环化的引物来扩增。线性引导RNA缺乏允许在细胞中环化的连接序列。环状工程化引导RNA可以被设计成用于RNA编辑或产生RNA敲低。
实施例4
RNA编辑可以发生在靶RNA的多个位置处
将编码环状引导RNA的质粒转染到细胞中以确定Rab7a 3'UTR区上不同位置处环状引导RNA的RNA编辑百分比。每20,000个WT HEK293细胞用1μg质粒转染。RNA编辑百分比通过在将靶RNA逆转录为cDNA后对靶RNA进行Sanger测序来确定。分析Sanger迹线以评估编辑效率。图4示出了来自设计3(环状引导)和对照GFP质粒的RAB7A 3'UTR中不同腺苷核苷酸的RNA编辑百分比。编辑的核苷酸位置在Rab7a 3'UTR序列中指示。设计3引导RNA被示出编辑在Rab7a 3'UTR序列中的-3、-2、-1和+1位置处的核苷酸。最高百分比的RNA编辑发生在Rab7a 3'UTR序列的-3位置处。
实施例5
与细胞中的线性引导RNA相比,环状引导RNA具有随时间的推移增加的RNA编辑
将编码靶向Rab7a UTR的环状和线性引导RNA的质粒引入导HEK 293细胞中。将1微克质粒转染到约20,000个WT HEK293细胞中以测定随时间(48小时和96小时)推移的RNA编辑百分比。靶RNA被逆转录酶转化为cDNA后,通过Sanger测序确定靶RNA的RNA编辑百分比。分析Sanger迹线以评估编辑效率。图5示出了与环状引导RNA设计5和设计3相比,来自线性引导RNA设计1和设计4的RAB7A 3'UTR中的核苷酸的RNA编辑百分比。实验中包括对照GFP质粒。与线性引导RNA相比,设计5和设计3引导RNA示出在48小时和96小时时具有更高水平的RNA编辑。编辑的增加可能是由于环状引导RNA与线性引导RNA相比稳定性增加。
实施例6
环状和线性引导RNA可以通过靶向3'UTR来编辑和敲低α突触核蛋白(SNCA)RNA
将编码线性和环状引导RNA的质粒转染到细胞中。引导RNA被设计成靶向3'UTRSNCA mRNA。通过逆转录酶将靶mRNA转化为cDNA,并在40和72小时后用Sanger测序进行测序,以确定编辑的SNCA RNA的百分比,并在40和72小时时通过定量逆转录酶PCR确定SNCAmRNA的敲低。分析Sanger迹线以评估编辑效率。图6A示出了线性引导RNA(引导1-7)和环状引导RNA(引导8、引导9和Rab7)在40和72小时后的RNA编辑百分比,并且图6B示出了3'UTRSNCA mRNA的敲低百分比。Rab7环状RNA靶向SNCA的编码区,并且被包括作为对照以显示如果靶向编码区,则通过环状引导以高百分比发生的RNA编辑。图的底部表示存在或不存在外源添加的ADAR1或ADAR2。与用于编辑SNCA 3'UTR的线性引导1-4相比,环状引导RNA显示出更低的编辑水平。然而,与线性引导RNA相比,环状引导RNA显示出SNCA mRNA的敲低增加。环状引导的敲低效率增加可以不依赖于ADAR。
实施例7
使用scAAV2观察到环状和线性引导的高水平转导。载体(scAAV GOI质粒)用eGFP报告基因和hU6驱动的环状引导或靶向Rab7a的3'UTR的线性引导构建。scAAV2病毒经由GOI质粒、pRC2(Rep2/Cap2)和腺病毒辅助质粒的三重转染产生。将病毒纯化并定量。图7示出了以1X 10^5vgs/细胞(病毒基因组/细胞)感染并在感染后24小时、48小时和72小时收获的细胞。用于实验的细胞系是HEK293T(WT(ADAR1))细胞和HEK293T(ADAR1敲除+ADAR2)细胞,其在图的顶部示出。GFP阳性细胞表明编码线性和环状引导RNA的载体的成功转导。转导后,通过流式细胞术测量GFP阳性,并且在所有时间点在所有细胞系中检测到超过97%的GFP阳性细胞。
实施例8
环状引导RNA可以在细胞中编辑靶标持续延长的时间段
用环状引导观察编辑超过72小时。图8示出了用编码线性和环状工程化引导RNA的载体转导的细胞中Rab7a 3'UTR的RNA编辑百分比。载体(scAAV GOI质粒)用eGFP报告基因和hU6驱动的环状引导或靶向Rab7a的3'UTR的线性引导构建。scAAV2病毒经由GOI质粒、pRC2(Rep2/Cap2)和腺病毒辅助质粒的三重转染产生。将病毒纯化并定量。细胞以1X 10^5vgs/细胞感染并在感染后24小时、48小时和72小时收获。用于实验的细胞系是HEK293T(WT(ADAR1))细胞和HEK293(ADAR1敲除+ADAR2)细胞,其在图的顶部示出。HEK293(ADAR1敲除+ADAR2)细胞已经被工程化以表达ADAR2,但不表达ADAR1。对于用编码线性和环状引导RNA的载体转导的细胞,在24小时、48小时和72小时时测量Rab7a 3'UTR mRNA的编辑百分比。为了确定编辑,从细胞收获RNA并通过逆转录产生Rab7a 3'UTR cDNA,其包括以下步骤:将RNA与寡dT引物在95℃下孵育3分钟,在48℃进行合成1小时,然后在80℃变性5分钟。通过PCR扩增cDNA,并对Rab7的3'UTR的PCR扩增子进行Sanger测序,并通过痕量分析进行分析以测量编辑。65%-69%的Rab7a转录物在具有环状引导的WT HEK293T细胞中被A-G编辑,而在线性引导的情况下几乎没有观察到编辑。此外,与WT ADAR1表达细胞相比,仅表达ADAR2的细胞具有在有环情况下的较少编辑。
实施例9
环状引导RNA的环化发生一段延长的时间
观察环状RNA引导的环化72小时。图9示出了具有PCR产物的琼脂糖凝胶,表明线性引导RNA、环状引导RNA和对照(未感染的)细胞系的环化存在或不存在。载体(scAAV GOI质粒)用eGFP报告基因和hU6驱动的环状引导或靶向Rab7a的3'UTR的线性引导构建。scAAV2病毒经由GOI质粒、pRC2(Rep2/Cap2)和腺病毒辅助质粒的三重转染产生。将病毒纯化并定量。细胞以1X 10^5vgs/细胞感染并在感染后24小时、48小时和72小时收获。用于实验的细胞系是HEK293T。在用携带GOI质粒的scAAV2病毒转导后,从WT HEK293T细胞收获RNA并逆转录为cDNA。通过PCR评估环状引导的形成,该PCR使用与引导RNA的末端结合并向外定向的引物进行,使得在引导被环化时形成产物。如凝胶中所示,在所有时间点检测环状引导感染的细胞中的环状引导RNA。
实施例10
环状引导可以通过反向剪接制备。
图10示出了制备环状引导RNA的方法的说明。RNA从5'至3'工程化以包含正向互补序列内含子、外显子(其包含引导序列),随后是反向互补序列内含子。一旦转录,互补序列内含子将杂交并形成dsRNA。含有引导序列的外显子将通过剪接去除并通过内源连接酶连接以形成环状引导。在一些情况下,引导通过反向剪接反应环化。
实施例11
环状引导RNA的药物组合物和受试者的治疗
受试者将被诊断为患有疾病。受试者将被开具药物组合物的给药方案。药物组合物将包含环状工程化引导RNA。环状工程化引导RNA将包含靶向结构域、间隔子结构域和能够募集进行核苷酸编辑的RNA编辑实体的RNA编辑实体募集结构域。药物组合物将通过注射与重组RNA编辑酶共同施用给受试者。药物组合物将包含纳米颗粒,该纳米颗粒包含环状工程化引导RNA和重组RNA编辑酶。给药方案将包括治疗疾病的有效量。
实施例12
具有适体的环状引导RNA
通过获得工程化引导RNA将形成环状工程化引导RNA。工程化引导RNA将包含靶向结构域、间隔子结构域和能够募集进行核苷酸编辑的RNA编辑实体的RNA编辑实体募集结构域。将适体添加到工程化引导RNA的每个末端。连接酶将在工程化引导RNA的每个末端处与适体接触以在适体之间形成共价键连,从而形成环状工程化引导RNA。与可比较的非环状工程化引导RNA的二级结构相比,环状工程化引导RNA将基本上保留二级结构。
实施例13
受试者将被诊断为患有疾病。受试者将被开具药物组合物的给药方案。药物组合物将包含环状工程化引导RNA。环状工程化引导RNA将包含靶向结构域、间隔子结构域和能够募集进行核苷酸编辑的RNA编辑实体的RNA编辑实体募集结构域。药物组合物将通过注射施用于受试者。环状工程化引导RNA的给药方案将是通过注射接受可比较的非环状工程化引导RNA的受试者频率的1/2。给药方案将包括治疗疾病的有效量。
实施例14
用于治疗受试者的AAV递送的环状引导RNA
受试者将被诊断为患有疾病。受试者将被开具药物组合物的给药方案。药物组合物将包含病毒载体,该病毒载体包含编码环状工程化引导RNA的质粒。环状工程化引导RNA将包含核酶结构域、连接序列结构域、间隔子结构域、靶向结构域和能够募集进行核苷酸编辑的RNA编辑实体的RNA编辑实体募集结构域。药物组合物将通过注射施用于受试者。包含编码环状工程化引导RNA的质粒的病毒载体的给药方案将是通过注射接受可比较的非环状工程化引导RNA的受试者频率的1/2。给药方案将包括治疗疾病的有效量。
实施例15
用环状引导RNA进行的RAB7A编辑
该实施例描述了在iPSC来源的神经细胞中使用本公开的环状引导RNA进行RAB7A编辑,其中环状引导RNA经由AAV递送。在用表达AAV2/2的GFP(对照)或Rab7引导(Rab7U6线性、Rab7 U7 smOPT和Rab7 U6环状)感染之前,使用双重SMAD抑制将iPSC诱导为神经谱系持续至少6天。在这些构建体的每一个中的引导RNA的序列为GATAAAAGGCGTACATAATTCTTGTGTCTACTGTACAGAATACTGCCGCCAGCTGGATTTCCCAATTCTGAGTAACACTCTGCAATCCAAACAGGGTTCA(SEQID NO:23)。通常将细胞以1*10^5个细胞/孔铺板在24孔板中并以指定的vg/细胞进行感染。我们在感染后48小时、72小时或7天分离出mRNA并通过ddPCR和Sa nger测序评估Rab7编辑。对于图12和图15,通过使用ImageJ量化图像来评估转导效率。简言之,拍摄了捕获GFP+信号的每个孔的图像以及相同视野的明场图像。对GFP+信号进行阈值处理并测量阳性信号的面积。类似地,对含有细胞的明场图像的面积进行阈值处理,并测量阳性信号的面积。GFP+面积除以细胞面积得到转导百分比。
iPSC用不同vg/细胞转导48或72小时,并在分化8或9天时收获。通过ddPCR测量Rab7编辑。来自环状引导RNA的PCR产物的凝胶表明,环状引导RNA PCR产物在iPSC来演的神经元中可检测到长达转导后至少7天。
如图11A所示,随着vg/细胞增加,Rab7编辑存在剂量依赖性增加。数据表示生物重复试验,平均值+/-SEM。也通过Sanger测序测量了Rab7编辑。如图11B所示,随着vg/细胞增加,Rab7编辑存在剂量依赖性增加。对编辑进行定量的ddPCR和Sanger测序方法产生非常相似的结果。数据表示生物重复试验,平均值+/-SEM。iPSC用不同vg/细胞转导72小时或7天,并在分化17天或更多天时收获。通过ddPCR测量Rab7编辑。如图11C所示,在完全成熟的神经元中,在72小时时编辑比在较不成熟的培养物中低得多,但在感染后7天编辑达到与较不成熟培养物相同的水平。该数据可能意味着更成熟的神经元需要更长的时间来产生环状引导RNA。数据表示生物重复试验,平均值+/-SEM。
图12A描绘了在感染后72小时分化9天后收获的细胞中转导%对Rab7编辑效率的图。点的灰度表示处理细胞的病毒的滴度。病毒滴度与转导效率直接相关。图12B描绘了转导%对在不同的分化天数和感染时间点后收获的细胞中的Rab7编辑效率的图。点和形状表示分化的天数,并且点的大小表示处理细胞的病毒的滴度。与较不成熟的培养物相比,在完全成熟的神经元中进行编辑和转导可能需要更长的时间。
iPSC用不同vg/细胞转导48或72小时,并在分化8或9天时收获。通过ddPCR测量Rab7编辑。如图13A所示,随着vg/细胞增加,Rab7编辑存在剂量依赖性增加。数据表示生物重复试验,平均值+/-SEM。也通过Sanger测序测量了Rab7编辑。如图13B所示,随着vg/细胞增加,Rab7编辑存在剂量依赖性增加。对编辑进行定量的ddPCR和Sanger测序方法产生非常相似的结果。数据表示生物重复试验,平均值+/-SEM。对于图13C,iPSC用不同vg/细胞转导72小时或7天,并在分化17天或更多天时收获。通过ddPCR测量Rab7编辑。数据表示生物重复试验,平均值+/-SEM。
图14A描绘了在感染后72小时分化9天后收获的细胞中转导%对Rab7编辑效率的图。点的灰度表示处理细胞的病毒的滴度。病毒滴度与转导效率直接相关。图14B描绘了在分化不同天后收获的细胞中转导%对Rab7编辑效率的图。点和形状表示分化的天数,并且点的大小表示处理细胞的病毒的滴度。
图15示出了脱靶编辑概况。Rab7 U6环状引导比U7 smOPT线性引导产生更多的脱靶编辑。
实施例16
TUBB4A D249N编辑
本实施例描述了使用线性和环状引导RNA进行的TUBB4AD249N编辑。使用Piggybac骨架载体设计了TUBB4A D249N小基因构建体。图16示出了piggyBac TUBB4A D249N小基因的图并总结了实验设计。WT或adar1敲除(adar1 KO)的K562细胞用Piggybac骨架载体进行转化。经由嘌呤霉素药物选择来选择克隆群体。设计了针对TUBB4A D249N小基因的线性和环状引导RNA,并在下表3中进行了描述。
表3
约500K细胞(WT和adar1 KO)用1ug引导RNA进行核转染。核转染后18小时,从核转染细胞中纯化总RNA,制备cDNA,并进行PCR反应以扩增TUBB4A D249N区域。使用Sanger测序对TUBB4A D249N靶腺苷处的WT、adar1 KO和模拟转染的编辑效率进行定量。进行PCR反应以验证环状RNA的存在。
如图17左侧所示,TUBB4A D249N小基因中的编辑百分比在仅表达环状引导的K562WT细胞中是显著的。图17右侧示出了具有对环状引导RNA具有特异性的引物的PCR产物。注意,仅样品5和9示出了正确大小的PCR片段。
实施例16
用具有不同间隔子长度的环状引导RNA进行Rab7A编辑
该实施例描述了用本公开的具有不同间隔子长度的环状引导RNA进行的Rab7A编辑。用100ng编码引导RNA或对照的质粒转染WT HEK293细胞(30,000个细胞)。转染后48小时分离RNA并将其转化为cDNA文库。进行PCR和Sanger测序。使用EditR软件确定编辑百分比。测试的引导RNA和间隔子的序列如下表4所示。如图18所示,具有较长间隔子的环状引导促进了更高水平的RNA编辑。
表4
实施例16
用环状引导RNA进行LRRK2编辑
该实施例描述了用本公开的环状引导RNA进行LRRK2编辑。20,000个细胞被500ng编码引导的质粒转染。测试的细胞包括用携带载有G2019S突变的LRRK2小基因的piggyBac载体转染的表达内源性ADAR1的HEK293细胞(图19顶部的相应数据)和用携带ADAR2和携带G2019S突变的LRRK2小基因的piggyBac载体转染的表达内源性ADAR1的HEK293细胞。
转染后48小时分离RNA并转化为cDNA文库。进行PCR和Sanger测序分析。使用EditR程序确定编辑百分比。引导RNA为100个碱基长,其中A/C错配从引导的5'端工程化80个碱基。引导RNA具有5'-CTGGCAACTTCAGGTGCACGAAACCCTGGTGTGCCCTCTGATGTTCTTATCCCCATTCTACAGCAGTACTGAGCAATGCCGTAGTCAGCAATCTTTGCAA-3'(SEQ ID NO:39)的序列。图19示出了G2019S突变的中靶和脱靶ADAR1编辑和ADAR1+ADAR2编辑的图。
实施例17
用环状引导RNA进行的SNCA编辑
该实施例描述了编码在U6启动子控制下的环状引导RNA的本公开的构建体,其中该引导RNA被设计成靶向SNCA基因中的起始位点或翻译起始位点(TIS)(也称为翻译起始位点(TSS))。引导构建体被设计成靶向外显子2的核苷酸位置26处的SNCA TIS腺苷(对应于大多数SNCA变体的核苷酸位置264,包括外显子1和外显子2)。HEK293细胞用编码感兴趣的引导RNA的质粒转染,并在转染后48小时评估RNA编辑(除非另有说明)。仅对HEK293细胞天然表达的ADAR1以及ADAR1和ADAR2评估RNA编辑。在后一实验中,HEK293细胞用编码ADAR2的piggybac载体共转染。通过测序定量RNA编辑的水平并使用软件程序分析。
图20-图24示出了在待编辑的靶A处(x轴上的“0”)的RNA编辑和在脱靶位置处(在不是“0”的位置处表示为黑条)的RNA编辑的图。各柱示出生物重复试验。
下面在表5中描述了图20-图24中所示的引导序列。下表5还描述了观察到的中靶RNA编辑的百分比。
表5—引导RNA序列
/>
实施例18
含有3'SmOPT序列和U7发夹的环化引导RNA
将具有3'SmOPT序列和U7发夹的100nt反义(靶向)引导RNA插入P3与P1 RtcB环状核酶位点之间,并使用mU7或hU6启动子表达。用1ug表达引导RNA构建体的质粒转染293T细胞(内源性ADAR水平);41小时后测量RNA。图25A示出了环状RNA形式;用引导特异性引物的Sanger测序显示核酶位点已经与反义引导和环状RNA内的3'SmOPT U7发夹精确连接在一起。
图25B列出了克隆在P3与P1 RtcB环状核酶位点之间的Sm-结合结构域、U7茎环发夹和RNA接头序列的几种序列变异(上图)。在Sm-结合结构域之前,环状RNA中包括靶向人RAB7A外显子4、RAB7A 3'UTR、SNCA外显子4、SNCA 3'UTR、DMD外显子71剪接受体或DMD外显子74剪接受体的100nt反义引导RNA。使用mU7或hU6启动子表达引导RNA,每个具有其相应的终止子序列。除了线性SmOPT U7发夹引导RNA之外,含有Sm-结合结构域和U7茎环发夹的环化引导RNA也可以编辑靶转录物,如通过Sanger测序所测量的(中图)。作为阴性对照,使用靶向不同基因的线性SmOPT U7发夹引导RNA。此外,与HPRT1管家基因相比并通过ddPCR测量,SmOPT U7发夹引导RNA的线性或环状形式均未改变RAB7A 3'UTR或SNCA 3'UTR靶转录物的基因表达水平(左下图)。线性SmOPT U7发夹引导RNA仅引起RAB7A外显子4的最小无意跳读,而环状SmOPT U7发夹引导RNA未显示可检测到的外显子跳读,如通过PCR和凝胶电泳所测量的(右下图)。
实施例19
环状引导的AAV递送
Rab7a靶向环状引导(0.100.50)经由AAV2递送到肌肉和293T细胞中。图26示出了在LHCN未分化细胞和LHCN分化细胞(5天分化)中,用携带Rab7a靶向环状引导(AAV2-561)的AAV2载体转导的细胞和用不含AAV2载体的Rab7a靶向环(无AAV)接触的细胞的Sanger测序确定的RNA编辑百分比图。与不在AAV2载体中的引导相比,AAV2载体中的引导具有增加的编辑。图27示出了通过Rab7靶向环状引导在HEK293T细胞、RD未分化细胞和LHCN未分化细胞中如通过Sanger测序所确定的RNA编辑百分比的图,所述Rab7靶向环状引导以不同感染复数(MOI)由AAV2载体递送并在不存在AAV2载体的情况下递送。转染后48小时显示RNA编辑百分比。用较高MOI转导导致RNA编辑增加。
实施例20
环状引导的AAV递送
本实施例描述了工程化以表达SERPINA1 E342K突变的HepG2细胞中靶向RAB7A的环状引导RNA的AAV递送。具有GATAAAAGGCGTACATAATTCTTGTGTCTACTGTACAGAATAC TGCCGCCAGCTGGATTTCCCAATTCTGAGTAACACTCTGCAATC CAAACAGGGTTCA(SEQ ID NO:23)的序列的RAB7A靶向环状引导RNA经由AAV2以为100,000的MOI递送至50,000个细胞中,包括亲本HepG2细胞和携带SERPINA1 E342K突变的三个HepG2克隆(克隆1、克隆2和克隆3)。在感染后48小时,经由ddPCR脱落测定对RAB7A编辑进行定量。如图28所示,引导RNA显示在亲本细胞系和所有3个克隆中成功编辑了RAB7A。
实施例21
具有填充序列的环状框架
该实施例描述了用本公开的具有不同填充序列长度的环状引导RNA编辑RAB7A。用500ng编码引导RNA或对照的质粒转染WT HEK293细胞(20,000个细胞)。转染后48小时分离RNA并将其转化为cDNA文库。进行PCR和Sanger测序。使用EditR软件确定编辑百分比。仅对HEK293细胞天然表达的ADAR1以及ADAR1和ADAR2评估RNA编辑。在后一实验中,HEK293细胞用编码ADAR2的piggybac载体共转染以过表达ADAR2。
图29在左侧显示了RAB7A 3'UTR编辑百分比的条形图,针对不同大小的各种环状引导RNA并且具有与靶标互补的整个环状框架的不同百分比(例如,环状框架的作为靶向结构域的部分通过改变填充序列的量来调节)。令人惊奇的是,RNA编辑的水平可以通过改变引导RNA与整个环状框架的比率来调节。也就是说,无论是低比率还是比率的引导RNA:整个环状框架都没有表现出最高的编辑。其中引导RNA占整个环状框架的约28%至约66%的环状框架提供最高水平的RNA编辑。这些结果对于单独的ADAR1和ADAR1+ADAR2过表达是一致的。在图右侧的凝胶显示了测试的环状引导RNA的环化的确认。
下表6中提供了引导的序列。引导RNA加粗体,并且填充序列加下划线。
表6—引导序列
/>
/>
实施例22
具有填充序列的环状框架
该实施例描述了用本公开的具有填充序列的环状引导RNA进行LRRK2编辑。该实施例描述了用本公开的环状引导RNA进行LRRK2编辑。实验设置和引导的细节在以上实施例16中提供。简言之,用500ng编码引导的质粒转染20,000个细胞。测试的细胞包括用携带载有G2019S突变的LRRK2小基因的piggyBac载体转染的表达内源性ADAR1的HEK293细胞和用携带ADAR2和携带G2019S突变的LRRK2小基因的piggyBac载体转染的表达内源性ADAR1的HEK293细胞。序列提供于下表7中。引导RNA加粗体,并且填充序列用加下划线。
表7
虽然本发明的优选实施方案已在本文显示和描述,此类实施方案仅以举例的方式提供,这对本领域的技术人员将是显而易见的。在不偏离本发明的情况下本领域技术人员现将进行各种变型、变化和替换。应理解,本文所述的本发明实施方案的各种替代方案可用于实施本发明。这意味着以下权利要求书限定本发明的范围并且这些权利要求及其等同物范围内的方法和结构因此被涵盖。
Claims (60)
1.一种前体工程化线性多核苷酸,其包含:
第一间隔子结构域;
靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及
第二间隔子结构域,
其中所述第一间隔子结构域或所述第二间隔子结构域与所述靶RNA基本上不互补,
其中所述前体工程化线性多核苷酸的转录物在所述前体工程化线性多核苷酸插入哺乳动物细胞中后环化,从而形成环化的工程化多核苷酸;并且
其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
2.如权利要求1所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸按5'至3'的顺序包含:所述第一间隔子结构域、所述靶向结构域,以及所述第二间隔子结构域。
3.如权利要求1或2所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸包含至所述第一间隔子结构域的核酶结构域5'或至所述第二间隔子结构域的3'。
4.如权利要求3所述的前体工程化线性多核苷酸,其中所述前体工程化线性多核苷酸包含位于所述核酶结构域与所述第一间隔子结构域之间或位于所述核酶结构域与所述第二间隔子结构域之间的连接结构域。
5.如权利要求1-4中任一项所述的前体工程化线性多核苷酸,其中在自环化后,所述第一间隔子结构域和所述第二间隔子结构域是填充序列,所述填充序列是所述环化的工程化多核苷酸的总长度的约40%至约70%。
6.如权利要求5所述的前体工程化线性多核苷酸,其中在自环化后,所述第一间隔子结构域和所述第二间隔子结构域是填充序列,所述填充序列是所述环化的工程化多核苷酸的总序列的约50%至约67%。
7.如权利要求5或6所述的前体工程化线性多核苷酸,其中相对于缺乏所述填充序列的在其他方面可比较的多核苷酸,所述填充序列增加了所述靶向结构域与所述靶RNA的杂交。
8.如权利要求5-7中任一项所述的前体工程化线性多核苷酸,其中在自环化后,所述环化的工程化多核苷酸的总长度包含约150个核苷酸至约400个核苷酸。
9.如权利要求8所述的前体工程化线性多核苷酸,其中在自环化后,所述环化的工程化多核苷酸的总长度包含约200个核苷酸至约300个核苷酸。
10.如权利要求1-9中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与所述靶RNA至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的互补性。
11.如权利要求1-10中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA是选自由以下各项组成的组的RNA:前信使RNA、信使RNA、核糖体RNA、转移RNA、长非编码RNA和小RNA。
12.如权利要求1-11中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的3'或5'非翻译区(UTR)基本上互补。
13.如权利要求1-12中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的内含子区基本上互补。
14.如权利要求1-13中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与翻译起始位点(TIS)基本上互补。
15.如权利要求1-14中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域与所述靶RNA的上游开放阅读框(uORF)基本上互补。
16.如权利要求1-15中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
17.如权利要求1-16中任一项所述的前体工程化线性多核苷酸,其中相对于缺乏所述编辑的在其他方面可比较的靶RNA的翻译蛋白质,在翻译具有对所述碱基的编辑的所述靶RNA后,对所述碱基的所述编辑增加了蛋白质或其片段的水平、增加蛋白质或其片段的长度、增加蛋白质或其片段的功能性、增加蛋白质或其片段的稳定性、或它们的任何组合。
18.如权利要求1-17中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将有义密码子转化为终止密码子。
19.如权利要求18所述的前体工程化线性多核苷酸,其中所述有义密码子与疾病致病途径有关,并且其中将所述有义密码子转化为所述终止密码子减少了所述疾病致病途径。
20.如权利要求1-17中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将终止密码子转化为有义密码子。
21.如权利要求20所述的前体工程化线性多核苷酸,其中所述终止密码子与疾病致病途径有关,并且其中将所述终止密码子转化为所述有义密码子减少了所述疾病致病途径。
22.如权利要求1-17中任一项所述的前体工程化线性多核苷酸,其中对碱基的所述编辑将第一有义密码子转化为第二有义密码子。
23.如权利要求22所述的前体工程化线性多核苷酸,其中所述第一有义密码子与疾病致病途径有关,并且其中将所述第一有义密码子转化为所述第二有义密码子减少了所述疾病致病途径。
24.如权利要求1-23中任一项所述的前体工程化线性多核苷酸,其中所述靶向结构域为约20个核苷酸至约150个核苷酸;或约100个核苷酸至约200个核苷酸。
25.如权利要求1-24中任一项所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR蛋白或APOBEC蛋白。
26.如权利要求25所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR,并且其中所述ADAR是ADAR1。
27.如权利要求25所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR,并且其中所述ADAR是ADAR2。
28.如权利要求25所述的前体工程化线性多核苷酸,其中所述RNA编辑酶包含ADAR,并且其中所述ADAR是ADAR3。
29.如权利要求1-28中任一项所述的前体工程化线性多核苷酸,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病、髓鞘形成不足伴基底神经节和小脑萎缩(H-ABC)或囊性纤维化。
30.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含TUBB4A,并且其中TUBB4A包含D249N突变。
31.如权利要求30所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:32、SEQ ID NO:33或SEQ ID NO:34至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
32.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含LRRK2,并且其中LRRK2包含G2019S突变。
33.如权利要求32所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:39、SEQ ID NO:53或SEQ ID NO:54至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
34.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含SERPINA1,并且其中SERPINA1包含E342K突变。
35.如权利要求34所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:64或SEQ ID NO:65至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
36.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含SNCA。
37.如权利要求36所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
38.如权利要求37所述的前体工程化线性多核苷酸,其中所述靶向结构域被设计成靶向所述翻译起始位点(TIS)。
39.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含APP。
40.如权利要求39所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:61、SEQ ID NO:62或SEQ ID NO:63至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
41.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含ABCA4。
42.如权利要求41所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:58、SEQ ID NO:59或SEQ ID NO:60至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
43.如权利要求1-29中任一项所述的前体工程化线性多核苷酸,其中所述靶RNA包含DMD。
44.如权利要求43所述的前体工程化线性多核苷酸,其中所述靶向结构域包含与SEQID NO:56或SEQ ID NO:57至少约80%、至少约85%、至少约90%、至少约92%、至少约95%、至少约97%、至少约99%或100%的序列同源性。
45.一种前体工程化多核苷酸,其按5'至3'的顺序包含:第一核酶结构域;第一连接结构域;第一间隔子结构域;靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;第二连接结构域;以及第二核酶结构域,其中所述第一间隔子结构域与所述靶RNA基本上不互补,其中所述前体工程化线性多核苷酸的转录物在所述前体工程化线性多核苷酸插入哺乳动物细胞中后环化,从而形成环化的工程化多核苷酸;并且其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
46.一种工程化环状多核苷酸,其包含:靶向结构域,所述靶向结构域与跟疾病或疾患有关的靶RNA基本上互补;以及间隔子结构域,所述间隔子结构域与所述靶RNA基本上不互补,其中所述间隔子结构域通过增加一个或多个核苷酸来扩大所述工程化环状多核苷酸,
其中所述靶向结构域与所述靶RNA的杂交促进RNA编辑酶对所述靶RNA的核苷酸的碱基的编辑。
47.如权利要求46所述的工程化环状多核苷酸,其中RNA编辑实体对所述靶RNA的核苷酸的碱基的编辑在体外测定中确定,所述体外测定包括:
(i)将所述靶RNA直接或间接引入到原代细胞系中,
(ii)将所述工程化多核苷酸直接或间接引入到原代细胞系中,以及
(iii)对所述靶RNA进行测序。
48.如权利要求46或47所述的工程化环状多核苷酸,其中所述工程化环状多核苷酸不包含能够暴露于溶剂的5'还原羟基、3'还原羟基或两者。
49.如权利要求46-48中任一项所述的工程化环状多核苷酸,其还包含RNA编辑酶募集结构域,其中所述RNA编辑酶募集结构域募集RNA编辑酶,所述RNA编辑酶在与所述工程化多核苷酸缔合时对所述靶RNA中的核苷酸的碱基进行化学转化。
50.如权利要求46-49中任一项所述的工程化环状多核苷酸,其中所述靶向结构域为约20个核苷酸至约150个核苷酸。
51.如权利要求46-50中任一项所述的工程化环状多核苷酸,其中所述靶RNA包含无义突变。
52.如权利要求46-51中任一项所述的工程化环状多核苷酸,其中所述靶向结构域包含与所述靶RNA错配的至少单个核苷酸。
53.如权利要求46所述的工程化环状多核苷酸,其中所述疾病或疾患包括雷特综合征、亨廷顿病、帕金森病、阿尔茨海默病、肌营养不良、泰-萨克斯病、α-1抗胰蛋白酶缺乏症(AATD)、痴呆、τ蛋白病、突触核蛋白病、斯塔加特病、髓鞘形成不足伴基底神经节和小脑萎缩(H-ABC)或囊性纤维化。
54.一种载体,其包含如权利要求1-45中任一项所述的前体工程化线性多核苷酸或如权利要求46-53中任一项所述的工程化环状多核苷酸。
55.如权利要求54所述的载体,其中所述载体包含腺相关病毒(AAV)载体。
56.如权利要求55所述的载体,其中所述AAV载体是AAV1载体、AAV2载体、AAV3载体、AAV4载体、AAV5载体、AAV6载体、AAV7载体、AAV8载体、AAV9载体、这些中的任一种的嵌合体或这些中的任一种的变体。
57.如权利要求55或56所述的载体,其中所述病毒载体是自身互补的腺相关病毒(scAAV)载体。
58.如权利要求55或56所述的载体,其中所述病毒载体是单链AAV载体。
59.一种呈单位剂型的药物组合物,其包含如权利要求1-45中任一项所述的前体工程化线性多核苷酸、如权利要求45-53中任一项所述的工程化环状多核苷酸或如权利要求54-58中任一项所述的载体;以及药学上可接受的赋形剂、稀释剂或载剂。
60.一种治疗或预防有需要的受试者的疾病或疾患的方法,其包括:施用治疗有效量的:如权利要求1-45中任一项所述的前体工程化线性多核苷酸、如权利要求46-53中任一项所述的工程化环状多核苷酸、如权利要求54-58中任一项所述的载体或如权利要求59所述的药物组合物。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/029,996 | 2020-05-26 | ||
US63/112,488 | 2020-11-11 | ||
US63/119,902 | 2020-12-01 | ||
US202163178056P | 2021-04-22 | 2021-04-22 | |
US63/178,056 | 2021-04-22 | ||
PCT/US2021/034301 WO2021242889A1 (en) | 2020-05-26 | 2021-05-26 | Engineered circular polynucleotides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116568804A true CN116568804A (zh) | 2023-08-08 |
Family
ID=87488405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180049338.4A Pending CN116568804A (zh) | 2020-05-26 | 2021-05-26 | 工程化环状多核苷酸 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116568804A (zh) |
-
2021
- 2021-05-26 CN CN202180049338.4A patent/CN116568804A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230174977A1 (en) | Engineered circular polynucleotides | |
US11542506B2 (en) | Compositions and methods of treating amyotrophic lateral sclerosis (ALS) | |
CN107207556B (zh) | 调节性多核苷酸 | |
US20240011028A9 (en) | Compositions and Methods Using SNRNA Components | |
US20230193279A1 (en) | Compositions and Methods for Modifying Target RNAs | |
US20230399635A1 (en) | RNA-Editing Compositions and Methods of Use | |
CN116568804A (zh) | 工程化环状多核苷酸 | |
AU2022301997A1 (en) | Engineered guide rnas and polynucleotides | |
CN116547384A (zh) | 用于修饰靶rna的组合物和方法 | |
CN117980480A (zh) | 工程化引导rna和多核苷酸 | |
JP2023513188A (ja) | 遺伝子の発現増加のためのmirna-485阻害剤 | |
JP2024506869A (ja) | Nlrp3発現の異常に関連する疾患または障害を治療するためのmirna-485阻害剤の使用 | |
WO2024044282A1 (en) | Engineered constructs for increased transcription of rna payloads |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |