CN118076741A - 修饰的mRNA、修饰的非编码RNA及其用途 - Google Patents

修饰的mRNA、修饰的非编码RNA及其用途 Download PDF

Info

Publication number
CN118076741A
CN118076741A CN202280049567.0A CN202280049567A CN118076741A CN 118076741 A CN118076741 A CN 118076741A CN 202280049567 A CN202280049567 A CN 202280049567A CN 118076741 A CN118076741 A CN 118076741A
Authority
CN
China
Prior art keywords
modified
mrna
nucleotides
nucleotide
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280049567.0A
Other languages
English (en)
Inventor
王潇
H·史
A·阿迪瑟姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology, Broad Institute Inc filed Critical Massachusetts Institute of Technology
Priority claimed from PCT/US2022/028849 external-priority patent/WO2022241045A1/en
Publication of CN118076741A publication Critical patent/CN118076741A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Saccharide Compounds (AREA)

Abstract

本文公开了具有包含修饰的核苷酸和/或二级结构的多聚(A)尾的修饰的mRNA和修饰的非编码RNA,其可以通过将加尾核酸连接到RNA的3’末端上来制备。还提供了组合物,其包含本文提供的一种或多种修饰的mRNA或修饰的非编码RNA,以及将所述组合物用于治疗或农业应用的方法。

Description

修饰的mRNA、修饰的非编码RNA及其用途
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求享有2021年5月12日提交的名称为“修饰的mRNA及其用途”的美国临时申请号63/187,752,以及2021年12月10日提交的名称为“修饰的mRNA及其用途”的美国临时申请号63/288,522的权益,其中每一个的全部公开内容均通过引用整体并入本文。
对经由EFS-WEB以文本文件形式提交的序列表的引用
本申请含有已经由EFS-Web以ASCII格式递交并通过引用整体并入本文的序列表。所述ASCII副本于2022年5月10日创建,被命名为B119570130WO00-SEQ-JQM,并且大小为9,854字节。
背景技术
信使RNA (mRNA)技术是传统小分子疗法和疫苗方法的新兴替代方案,因为它有效、可编程、并且能够快速生产具有期望序列的mRNA。mRNA疗法是快速发展的领域,并且已用于表达治疗蛋白,范围从血管再生因子到用于COVID-19、流感和寨卡病毒的疫苗。尽管有最近临床的成功,但mRNA疗法仍然面临不稳定、毒性、短期功效和潜在过敏反应的挑战。提高mRNA的稳定性以增强其体内功效仍然是必须解决的重要问题,以提高mRNA疗法对临床应用的可行性。
概述
本文提供了具有修饰的核苷酸和/或结构特征的修饰的mRNA,以改善细胞中的稳定性,从而增强蛋白质的产生,以及制备和使用此类修饰的mRNA的方法。常规mRNA包含3’末端带有多个腺苷核苷酸的多聚-A尾,其可被细胞核酸外切酶降解,从而去除3’核苷酸。一旦核酸外切酶去除多聚-A尾并开始去除开放阅读框的核苷酸,该mRNA就不能翻译成编码的蛋白质。对3’核酸外切酶活性更具抗性的mRNA降解得更慢,因此更稳定,在细胞中具有增加的半衰期,并且可以从给定的mRNA分子产生更多的蛋白质。含有对mRNA的核碱基、糖或磷酸键的一种或多种结构修饰的修饰的核苷酸可以干扰3’核酸外切酶活性,使mRNA更加稳定。然而,抑制3’核酸外切酶的相同结构修饰也会阻碍聚腺苷酸化酶将其并入多聚-A尾的能力,从而使其难以将修饰的核苷酸并入多聚-A尾。令人惊讶的是,与没有修饰的核苷酸的寡核苷酸的连接相比(除了阻断3’末端核苷酸以防止寡核苷酸自连接(图5)),将含有至少三个修饰的核苷酸的寡核苷酸连接到含有预先存在的多聚-A尾的mRNA的3’末端,可以显著改善mRNA的稳定性。通过连接含有能够形成二级结构(如G-四链体或适体)的结构序列的寡核苷酸,可以观察到稳定性的类似改善。这种结构序列被认为可以防止核酸外切酶接近3’末端核苷酸。多种类型的修饰的核苷酸和结构序列,无论是单独的还是相互组合,当添加到3’末端时,都会提高mRNA的稳定性,使修饰的mRNA更能抵抗RNase介导的降解,从而导致这些修饰的mRNA相对于对照mRNA的蛋白质产量增加。这些结果表明,这种修饰的mRNA的多聚-A尾以阻碍核酸外切酶活性的方法在修饰的mRNA的生产中提供了广泛的用途。另外,通过本文提供的方法产生的修饰的mRNA可以通过连接线性mRNA的末端环化以产生环状mRNA。本文描述的用于提高mRNA稳定性的技术也可能适合于提高非编码RNA的稳定性,因为非编码RNA也容易受到3’核酸外切酶活性的影响。
因此,在一些方面,本公开提供了修饰的mRNA,其包含:
(i)编码蛋白质的开放阅读框(ORF);和
(ii)多聚-A区,
其中该多聚-A区位于开放阅读框的3’并且包含10个或更多个核苷酸,其中该多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中多聚-A区的最后10个核苷酸中的3个或更多个是修饰的核苷酸。
在一些实施方案中,该多聚-A区包含25个或更多个腺苷核苷酸,其中该多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且该多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的4个或更多个是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的2个或更多个连续核苷酸通过修饰的核苷酸间键连接。
在一些实施方案中,多聚-A区的最后25个核苷酸中的3个或更多个连续核苷酸是独立地选自脱氧核糖核苷酸、2’-修饰的核苷酸和硫代磷酸酯连接的核苷酸的修饰的核苷酸。
在一些实施方案中,3个或更多个修饰的核苷酸是位于多聚-A区3’末端的连续核苷酸。
在一些实施方案中,多聚-A区最后25个核苷酸中的6个或更多个连续核苷酸包含相同类型的核苷酸或核苷间修饰。
在一些实施方案中,多聚-A区的最后10个核苷酸中的3个或更多个是修饰的核苷酸。
在一些实施方案中,至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的多聚-A区的核苷酸是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
在一些实施方案中,修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中ORF位于5’UTR和3’UTR之间,其中3’UTR位于ORF和多聚-A区之间。
在一些实施例中,修饰的mRNA是环状mRNA,其中多聚-A区位于3’UTR和5’UTR之间。
在一些方面,本公开提供了修饰的mRNA,其包含:
(i)编码蛋白质的开放阅读框(ORF);
(ii)多聚-A区;
(iii)包含能够形成二级结构的至少两个核苷酸的结构序列的一个或多个拷贝,
其中多聚-A区位于开放阅读框的3’处并且包含10个或更多个核苷酸,其中结构序列的一个或多个拷贝位于多聚A区的3’处,并且其中修饰的mRNA包含二级结构,其中二级结构包含结构序列的一个或多个拷贝。
在一些实施方案中,多聚-A区位于开放阅读框的3’处并且包含25个或更多个核苷酸,其中结构序列的一个或多个拷贝位于多聚-A区的3’处,并且其中修饰的mRNA包含二级结构,其中二级结构包含结构序列的一个或多个拷贝。
在一些实施方案中,修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中ORF位于5’UTR和3’UTR之间,其中3’UTR位于ORF和多聚-A区之间。
在一些实施方案中,修饰的mRNA是环状mRNA,其中结构序列的一个或多个拷贝位于多聚-A区和5’UTR之间。
在一些实施方案中,结构序列是G-四链体序列。
在一些实施方案中,G-四链体是RNAG-四链体序列。
在一些实施方案中,RNA G-四链体序列包含SEQ ID NO:2的核酸序列。
在一些实施方案中,修饰的mRNA包含SEQ ID NO:2的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是DNAG-四链体序列。
在一些实施方案中,DNAG-四链体序列包含SEQ ID NO:3的核酸序列。
在一些实施方案中,修饰的mRNA包含SEQ ID NO:3的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是端粒重复序列。
在一些实施方案中,端粒重复序列包含SEQ ID NO:4的核酸序列。
在一些实施方案中,修饰的mRNA包含SEQ ID NO:4的核酸序列的至少3个拷贝。
在一些实施方案中,mRNA的二级结构是能够结合靶分子的适体。
在一些实施方案中,修饰的mRNA的多聚-A区包含至少一个修饰的核苷酸。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。
在一些实施方案中,修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫代尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。
在一些实施方案中,修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。
在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。
在一些实施方案中,修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼磷酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在一些实施方案中,多聚-A区包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少6个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少6个包含2’修饰的核苷酸。
在一些实施方案中,多聚-A区包含至少3个脱氧核糖糖。
在一些实施方案中,多聚-A区包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖糖。
在一些实施方案中,多聚-A区包含至少23个脱氧核糖糖。
在一些实施方案中,mRNA的3’末端核苷酸在3’末端核苷酸的3’位置处不包含羟基。
在一些实施方案中,mRNA的3’末端核苷酸包含反向核苷酸。
在一些实施方案中,mRNA的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
在一些实施方案中,mRNA的3’末端核苷酸包含双脱氧胞苷。
在一些实施方案中,mRNA包含肽结合序列。在一些实施方案中,肽结合序列是多聚-A结合蛋白(PABP)结合序列
在一些实施方案中,修饰的mRNA包含第一修饰的核苷酸和第二修饰的核苷酸,其中第一和第二修饰的核苷包含不同的结构。
在一些实施方案中,多聚-A区包含至少25-500个核苷酸。
在一些实施方案中,多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
在一些实施方案中,多聚-A区至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸是腺苷核苷酸。
在一些实施方案中,修饰的mRNA是线性mRNA,其中线性mRNA包含5’帽。
在一些实施方案中,5’帽包含7-甲基鸟苷。
在一些实施方案中,5’帽还包含将7-甲基鸟苷连接至修饰的mRNA的相邻核苷酸的一种或多种磷酸酯。
在一些实施方案中,5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
在一些实施方案中,5’帽的一种或多种磷酸酯是选自硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)的修饰的磷酸酯。
在一些实施方案中,修饰的mRNA包含含有1个或多个修饰的核苷酸的5’UTR。在一些实施方案中,修饰的mRNA包含含有1个或多个修饰的核苷酸的ORF。
在一些方面,本公开提供了修饰的非编码RNA,其包含:
(i)非编码RNA序列;和
(ii)多聚-A区,
其中多聚-A区位于非编码RNA序列的3’并且包含10个或更多个核苷酸,其中多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中多聚-A区最后10个核苷酸中的3个或更多个是修饰的核苷酸。
在一些实施方案中,多聚-A区位于开放阅读框的3’并且包含25个或更多个腺苷核苷酸,其中多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中多聚-A区最后25个核苷酸中的3个或更多个是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的4个或更多个是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的2个或更多个连续核苷酸通过修饰的核苷酸间键连接。
在一些实施方案中,多聚-A区的最后25个核苷酸中的3个或更多个连续核苷酸是独立地选自脱氧核糖核苷酸、2’-修饰的核苷酸和硫代磷酸酯连接的核苷酸的修饰的核苷酸。
在一些实施方案中,3个或更多个修饰的核苷酸是位于多聚-A区3’末端的连续核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的6个或更多个连续核苷酸包含相同类型的核苷酸或核苷间修饰。
在一些实施方案中,多聚-A区至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
在一些实施方案中,多聚-A区的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
在一些实施方案中,修饰的非编码RNA是环状非编码RNA,其中多聚-A区位于非编码RNA序列的5’。
在一些实施方案中,修饰的非编码RNA还包含结构序列的一个或多个拷贝,该结构序列包含至少两个能够形成二级结构的核苷酸,其中该结构序列的一个或多个拷贝位于多聚-A区的3’,并且其中修饰的非编码RNA包含二级结构,并且其中该二级结构包含结构序列的一个或多个拷贝。
在一些实施方案中,修饰的非编码RNA是环状mRNA,其中结构序列的一个或多个拷贝位于多聚-A区和非编码RNA序列之间。
在一些实施方案中,结构序列是G-四链体序列。
在一些实施方案中,G-四链体是RNAG-四链体序列。
在一些实施方案中,RNA G-四链体序列包含SEQ ID NO:2的核酸序列。
在一些实施方案中,修饰的非编码RNA包含SEQ ID NO:2的核酸序列的至少3个拷贝。
在一些实施方案中,G-四链体是DNAG-四链体序列。
在一些实施方案中,DNAG-四链体序列包含SEQ ID NO:3的核酸序列。
在一些实施方案中,修饰的非编码RNA包含SEQ ID NO:3的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是端粒重复序列。
在一些实施方案中,端粒重复序列包含SEQ ID NO:4的核酸序列。
在一些实施方案中,修饰的非编码RNA包含SEQ ID NO:4的核酸序列的至少3个拷贝。
在一些实施方案中,非编码RNA的二级结构是能够结合靶分子的适体。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。
在一些实施方案中,修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。
在一些实施方案中,修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。
在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。
在一些实施方案中,修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼磷酸酯(BP)、甲基膦酸酯和胍基丙基氨基膦酸酯。
在一些实施方案中,多聚-A区包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少6个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
在一些实施方案中,多聚-A区包含至少6个包含2’修饰的核苷酸。
在一些实施方案中,多聚-A区包含至少3个脱氧核糖糖。
在一些实施方案中,多聚-A区包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖糖。
在一些实施方案中,多聚-A区包含至少23个脱氧核糖糖。
在一些实施方案中,非编码RNA的3’末端核苷酸在3’末端核苷酸的3’位置处不包含羟基。
在一些实施方案中,非编码RNA的3’末端核苷酸包含反向核苷酸。
在一些实施方案中,mRNA的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
在一些实施方案中,mRNA的3’末端核苷酸包含双脱氧胞苷。
在一些实施方案中,修饰的非编码RNA包含第一修饰的核苷酸和第二修饰的核苷酸,其中第一和第二修饰的核苷包含不同的结构。
在一些实施方案中,多聚-A区包含至少25-500个核苷酸。
在一些实施方案中,多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
在一些实施方案中,多聚-A区至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸是腺苷核苷酸。
在一些方面,本公开提供了产生修饰的mRNA的方法,该方法包括在RNA连接酶存在的情况下,将包含编码蛋白质的开放阅读框的第一RNA与包含一个或多个修饰的核苷酸的加尾核酸连接,由此RNA连接酶在RNA的3’核苷酸和加尾核酸的5’核苷酸之间形成共价键以产生修饰的mRNA。
在一些实施方案中,修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中ORF位于5’UTR和3’UTR之间,其中3’UTR位于ORF和多聚-A区之间。
在一些实施方案中,该方法还包括在核酶存在下环化修饰的mRNA,其中修饰的mRNA包含3’内含子和5’内含子,其中3’内含子位于5’UTR的5’处,其中5’内含子位于多聚-A区的3’处,由此核酶在3’内含子的3’处的核苷酸和5’内含子的5’处的核苷酸之间形成共价键以产生不包含5’内含子或3’内含子的环状mRNA,其中多聚-A区位于环状mRNA的3’UTR和5’UTR之间。
在一些实施方案中,该方法还包括以下步骤:
(i)将5’末端磷酸基团引入到修饰的mRNA的第一个核苷酸上;
(ii)切割修饰的mRNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的mRNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的修饰的mRNA;
由此环化连接酶在修饰的mRNA的3’核苷酸和修饰的mRNA的5’核苷酸之间形成共价键以产生环状修饰的mRNA,其中多聚-A区位于3’UTR和5’UTR之间。
在一些方面,本公开提供了产生修饰的mRNA的方法,该方法包括在RNA连接酶存在的情况下,将包含编码蛋白质的开放阅读框的RNA与包含结构序列的一个或多个拷贝的加尾核酸连接,由此连接酶在RNA的3’核苷酸和加尾核酸的5’核苷酸之间形成共价键以产生修饰的mRNA。
在一些实施方案中,修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中ORF位于5’UTR和3’UTR之间,其中3’UTR位于ORF与多聚-A区之间,其中多聚-A区位于3’UTR与结构序列的一个或多个拷贝之间。
在一些实施方案中,该方法还包括在核酶存在下环化修饰的mRNA,其中修饰的mRNA包含3’内含子和5’内含子,其中3’内含子位于5’UTR的5’处,其中5’内含子位于结构序列的一个或多个拷贝的3’处,由此核酶在3’内含子的3’处的核苷酸和5’内含子的5’处的核苷酸之间形成共价键以产生不包含5’内含子或3’内含子的环状mRNA,其中结构序列的一个或多个拷贝位于环状mRNA的多聚-A区和5’UTR之间。
在一些实施方案中,该方法还包括以下步骤:
(i)将5’末端磷酸基团引入到修饰的mRNA的第一个核苷酸上;
(ii)切割修饰的mRNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的mRNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的修饰的mRNA;
由此环化连接酶在修饰的mRNA的3’核苷酸和修饰的mRNA的5’核苷酸之间形成共价键以产生环状修饰的mRNA,其中结构序列的一个或多个拷贝位于3’UTR和5’UTR之间。
在一些实施方案中,修饰的mRNA在支架核酸存在下环化,其中支架核酸是能够与修饰的mRNA杂交的核酸,其中与支架核酸结合时,修饰的mRNA形成环状二级结构,
在一些实施方案中,支架核酸包含:
(a)包含5个或更多个核苷酸的第一杂交序列,其中该第一杂交序列与修饰的mRNA的至少前五(5)个核苷酸互补;和
(b)包含5个或更多个核苷酸的第二杂交序列,其中该第二杂交序列与修饰的mRNA的至少后五(5)个核苷酸互补;
其中修饰的mRNA的至少前五(5)个核苷酸与第一杂交序列杂交,并且修饰的mRNA的至少后五(5)个核苷酸与第二杂交序列杂交。
在一些实施方案中,第一杂交序列的最后一个核苷酸和第二杂交序列的第一个核苷酸在支架核酸中相邻并且不被任何其他核苷酸分开。
在一些实施方案中,修饰的mRNA包含:
(i)位于开放阅读框5’的第一自杂交序列;
(ii)位于开放阅读框3’的第二自杂交序列;
(iii)位于第一自杂交序列5’的第一非杂交序列;和
(iv)位于第二自杂交序列3’的第二非杂交序列,
其中第一和第二自杂交序列能够彼此杂交,
其中第一和第二自杂交序列不能彼此杂交。
在一些实施方案中,第一和第二自杂交序列的杂交形成二级结构,其中修饰的mRNA的5’末端核苷酸和3’末端核苷酸分开的距离小于
在一些实施方案中,5’末端核苷酸和3’末端核苷酸分开的距离小于 小于小于/>小于/>小于/>小于/>小于/> 小于/>或小于/>
在一些实施方案中,环化连接酶是T4 RNA连接酶。
在一些实施方案中,结构序列是G-四链体序列。
在一些实施方案中,G-四链体是RNAG-四链体序列。
在一些实施方案中,RNA G-四链体序列包含SEQ ID NO:2的核酸序列。
在一些实施方案中,加尾核酸包含SEQ ID NO:2的核酸序列的至少3个拷贝。
在一些实施方案中,G-四链体是DNAG-四链体序列。
在一些实施方案中,DNAG-四链体序列包含SEQ ID NO:3的核酸序列。
在一些实施方案中,加尾核酸包含SEQ ID NO:3的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是端粒重复序列。
在一些实施方案中,端粒重复序列包含SEQ ID NO:4的核酸序列。
在一些实施方案中,加尾核酸包含SEQ ID NO:4的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是包含至少两个能够相互作用以形成适体的核苷酸的适体序列,其中适体是能够结合靶分子的二级结构。
在一些实施方案中,加尾核酸包含至少一个修饰的核苷酸。
在一些实施方案中,RNA的5’核苷酸不包含5’末端磷酸基团;
其中RNA的3’核苷酸包含3’末端羟基;
其中加尾核酸的5’核苷酸包含5’末端磷酸基团;和
其中加尾核酸的3’核苷酸不包含3’末端羟基。
在一些实施方案中,RNA的5’核苷酸不包含5’末端羟基;
其中RNA的3’核苷酸包含3’末端磷酸基团;
其中加尾核酸的5’核苷酸包含5’末端羟基;
其中加尾核酸的3’核苷酸不包含3’末端磷酸基团;和
其中RNA连接酶是RtcB连接酶。
在一些实施方案中,加尾核酸至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或50%的核苷酸是修饰的核苷酸。
在一些实施方案中,加尾核酸的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。
在一些实施方案中,修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。
在一些实施方案中,修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。
在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。
在一些实施方案中,修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在一些实施方案中,加尾核酸包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少6个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少6个包含2’修饰的核苷酸。
在一些实施方案中,加尾核酸包含至少3个脱氧核糖糖。
在一些实施方案中,加尾核酸包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖。
在一些实施方案中,加尾核酸包含至少23个脱氧核糖糖。
在一些实施方案中,加尾核酸的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
在一些实施方案中,加尾核酸包含第一修饰的核苷酸和第二修饰的核苷酸,其中第一和第二修饰的核苷酸包含不同的结构。
在一些实施方案中,修饰的mRNA的多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。
在一些实施方案中,修饰的mRNA的多聚-A区包含至少25-500个核苷酸。
在一些实施方案中,修饰的mRNA的多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
在一些实施方案中,修饰的mRNA是线性mRNA,其中线性mRNA包含5’帽。
在一些实施方案中,5’帽包含7-甲基鸟苷。
在一些实施方案中,5’帽还包含将7-甲基鸟苷连接至修饰的mRNA的相邻核苷酸的一种或多种磷酸酯。
在一些实施方案中,5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
在一些实施方案中,5’帽的一种或多种磷酸酯是选自硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)的修饰的磷酸酯。
在一些实施方案中,RNA连接酶是T4RNA连接酶。
在一些方面,本公开提供了产生修饰的非编码RNA的方法,该方法包括将包含非编码RNA序列的第一RNA连接至包含一个或多个修饰的核苷酸的加尾核酸,在RNA连接酶存在的情况下,由此RNA连接酶在RNA的3’核苷酸和加尾核酸的5’核苷酸之间形成共价键以产生修饰的非编码RNA。
在一些实施方案中,修饰的非编码RNA包含位于非编码RNA序列3’的多聚-A区。
在一些实施方案中,该方法还包括在核酶存在下环化修饰的非编码RNA,其中修饰的非编码RNA包含3’内含子和5’内含子,其中3’内含子位于非编码RNA序列的5’,其中5’内含子位于多聚-A区的3’,由此核酶在3’内含子的3’处的核苷酸与5’内含子的5’处的核苷酸之间形成共价键,以产生不包含5’内含子或3’内含子的环状非编码RNA,其中多聚-A区位于非编码RNA的3’和5’核苷酸之间。
在一些实施方案中,该方法还包括以下步骤:
(i)将5’末端磷酸基团引入到修饰的非编码RNA的第一个核苷酸上;
(ii)切割修饰的非编码RNA的一个或多个3’末端核苷酸,以产生具有3’末端羟基的修饰的非编码RNA;和
(iii)在环化连接酶存在下环化步骤(ii)中产生的修饰的非编码RNA;
由此环化连接酶在修饰的非编码RNA的3’核苷酸和修饰的非编码RNA的5’核苷酸之间形成共价键以产生环状修饰的非编码RNA,其中多聚-A区位于非编码RNA的3’和5’核苷酸之间。
在一些实施方案中,加尾核酸进一步包含结构序列的一个或多个拷贝。
在一些实施方案中,修饰的非编码RNA包含位于非编码RNA序列和结构序列的一个或多个拷贝之间的多聚-A区。
在一些实施方案中,该方法还包括在核酶存在下环化修饰的非编码RNA,其中修饰的非编码RNA包含3’内含子和5’内含子,其中3’内含子位于非编码RNA的5’处,其中5’内含子位于结构序列的一个或多个拷贝的3’处,由此核酶在3’内含子的3’处的核苷酸与5’内含子的5’处的核苷酸之间形成共价键,以产生不包含5’内含子或3’内含子的环状非编码RNA,其中结构序列的一个或多个拷贝位于多聚-A区和环状非编码RNA的非编码RNA序列之间。
在一些实施方案中,该方法还包括以下步骤:
(i)将5’末端磷酸基团引入到修饰的非编码RNA的第一个核苷酸上;
(ii)切割修饰的非编码RNA的一个或多个3’末端核苷酸,以产生具有3’末端羟基的修饰的非编码RNA;和
(iii)在环化连接酶存在下环化步骤(ii)中产生的修饰的非编码RNA;
由此环化连接酶在修饰的非编码RNA的3’核苷酸和修饰的非编码RNA的5’核苷酸之间形成共价键以产生环状修饰的非编码RNA,其中结构序列的一个或多个拷贝位于多聚-A区和非编码RNA序列之间。
在一些实施方案中,修饰的非编码RNA在支架核酸存在下环化,其中支架核酸是能够与修饰的非编码RNA杂交的核酸,其中当修饰的非编码RNA与支架核酸结合时,形成环状二级结构。
在一些实施方案中,支架核酸包含:
(a)包含5个或更多个核苷酸的第一杂交序列,其中第一杂交序列与修饰的非编码RNA的至少前五(5)个核苷酸互补;和
(b)包含5个或更多个核苷酸的第二杂交序列,其中第二杂交序列与修饰的非编码RNA的至少后五(5)个核苷酸互补;
其中修饰的非编码RNA的至少前五(5)个核苷酸与第一杂交序列杂交,并且修饰的非编码RNA的至少后五(5)个核苷酸与第二杂交序列杂交。
在一些实施方案中,第一杂交序列的最后一个核苷酸和第二杂交序列的第一个核苷酸在支架核酸中相邻并且不被任何其他核苷酸分开。
在一些实施方案中,修饰的非编码RNA包含:
(i)位于开放阅读框5’的第一自杂交序列;
(ii)位于开放阅读框3’的第二自杂交序列;
(iii)第一非杂交序列,其位于第一自杂交序列的5’;和
(iv)第二非杂交序列,其位于第二自杂交序列的3’,
其中第一和第二自杂交序列能够彼此杂交,并且其中第一和第二自杂交序列不能彼此杂交。
在一些实施方案中,第一和第二自杂交序列的杂交形成二级结构,其中修饰的非编码RNA的5’末端核苷酸和3’末端核苷酸间隔的距离小于
在一些实施方案中,5’末端核苷酸和3’末端核苷酸间隔的距离小于 小于小于/>小于/>小于/>小于/>小于/> 小于/>或小于/>
在一些实施方案中,环化连接酶是T4 RNA连接酶。
在一些实施例中,结构序列是G-四链体序列。
在一些实施方案中,G-四链体是RNAG-四链体序列。
在一些实施方案中,RNA G四链体序列包含SEQ ID NO:2的核酸序列。
在一些实施方案中,尾部核酸包含SEQ ID NO:2的核酸序列的至少3个拷贝。
在一些实施方案中,G-四链体是DNA G-四链体序列。
在一些实施方案中,DNA G-四链体序列包含SEQ ID NO:3的核酸序列。
在一些实施方案中,尾部核酸包含SEQ ID NO:3的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是端粒重复序列。
在一些实施方案中,端粒重复序列包含SEQ ID NO:4的核酸序列。
在一些实施方案中,加尾核酸包含SEQ ID NO:4的核酸序列的至少3个拷贝。
在一些实施方案中,结构序列是包含至少两个能够相互作用形成适体的核苷酸的适体序列,其中适体是能够结合靶分子的二级结构。
在一些实施方案中,RNA的5’核苷酸不包含5’末端磷酸基团;
其中RNA的3’核苷酸包含3’末端羟基;
其中加尾核酸的5’核苷酸包含5’末端磷酸基团;和
其中加尾核酸的3’核苷酸不包含3’末端羟基。
在一些实施方案中,RNA的5’核苷酸不包含5’末端羟基;
其中RNA的3’核苷酸包含3’末端磷酸基团;
其中加尾核酸的5’核苷酸包含5’末端羟基;
其中加尾核酸的3’核苷酸不包含3’末端磷酸基团;和
其中RNA连接酶是RtcB连接酶。
在一些实施方案中,加尾核酸至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
在一些实施方案中,加尾核酸的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。
在一些实施方案中,修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。
在一些实施方案中,修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。
在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。
在一些实施方案中,修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在一些实施方案中,加尾核酸包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少6个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
在一些实施方案中,加尾核酸包含至少6个包含2’修饰的核苷酸。
在一些实施方案中,加尾核酸包含至少3个脱氧核糖。
在一些实施方案中,加尾核酸包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖。
在一些实施方案中,加尾核酸包含至少23个脱氧核糖。
在一些实施方案中,加尾核酸的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
在一些实施方案中,加尾核酸包含第一修饰的核苷酸和第二修饰的核苷酸,其中第一和第二修饰的核苷酸包含不同的结构。
在一些实施方案中,修饰的非编码RNA的多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。
在一些实施方案中,修饰的非编码RNA的多聚-A区包含至少25-500个核苷酸。
在一些实施方案中,修饰的非编码RNA的多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
在一些实施方案中,RNA连接酶是T4 RNA连接酶。
在一些方面,本公开提供了通过本文提供的任何一种方法产生的修饰的mRNA。
在一些实施方案中,mRNA编码抗原或治疗蛋白。
在一些实施方案中,抗原是病毒抗原、细菌抗原、原生动物抗原或真菌抗原。
在一些实施方案中,治疗蛋白是酶、转录因子、细胞表面受体、生长因子或凝血因子。
在一些实施方案中,开放阅读框是密码子优化的用于在细胞中表达。
在一些实施方案中,修饰的mRNA是密码子优化的用于在哺乳动物中表达。
在一些实施方案中,修饰的mRNA是密码子优化的用于在人细胞中表达。
在一些方面,本公开提供了通过本文提供的任何一种方法产生的修饰的非编码RNA。
在一些实施方案中,修饰的非编码RNA是指导RNA (gRNA)、引物编辑指导RNA(pegRNA)或长非编码RNA (lncRNA)。
在一些方面,本公开提供了包含本文提供的修饰的mRNA或修饰的非编码RNA中的任一种的脂质纳米颗粒。
在一些方面,本公开提供了包含本文提供的修饰的mRNA或修饰的非编码RNA中的任一种的细胞。
在一些实施方案中,该细胞是哺乳动物细胞。
在一些实施方案中,该细胞是人细胞。
在一些方面,本公开提供了包含本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒或细胞的组合物。
在一些方面,本公开提供了包含本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒或细胞以及药学上可接受的赋形剂的药物组合物。
在一些方面,本公开提供了包括将本文提供的任何修饰的mRNA、修饰的非编码RNA或脂质纳米颗粒引入细胞中的方法。
在一些方面,本公开提供了包括将本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒、细胞或组合物侵入受试者体内的方法。
在一些方面,本公开提供了对受试者进行疫苗接种的方法,该方法包括将本文提供的任何修饰的mRNA、脂质纳米颗粒、细胞或组合物侵入受试者体内,其中mRNA的开放阅读框编码抗原。
在一些方面,本公开提供了替换受试者体内酶的方法,该方法包括将本文提供的任何修饰的mRNA、脂质纳米颗粒、细胞或组合物侵入受试者体内,其中mRNA的开放阅读框编码酶。
在一些方面,本公开提供了修饰受试者的基因组的方法,该方法包括将本文提供的任何修饰的非编码RNA或组合物引入受试者体内。
在一些实施方案中,受试者是哺乳动物。
在一些实施方案中,受试者是人。
在一些方面,本公开提供了本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒、细胞或组合物,用作药物。
在一些方面,本公开提供了包含本文提供的任何方法的RNA和加尾核酸的试剂盒。
在一些实施方案中,试剂盒还包含RNA连接酶。
在一些方面,本公开提供了包含本文提供的任何药物组合物和递送装置的试剂盒。
在一些方面,本公开提供了用于纯化修饰的mRNA或修饰的非编码RNA的方法,包括使包含修饰的mRNA或修饰的非编码RNA的混合物与纯化介质接触,其中修饰的mRNA或修饰的非编码RNA与纯化介质相互作用以形成修饰的RNA-纯化介质缀合物,从混合物中分离修饰的RNA-纯化介质缀合物,并用溶剂从修饰的RNA-纯化介质缀合物中洗脱修饰的mRNA或修饰的非编码RNA。
在一些实施方案中,纯化介质包含顺磁珠。
附图说明
图1显示了天然存在的修饰核苷的结构,包括m6Am、m1A、假尿苷、m6A、m7G、ac4C、Nm和m5C,其可用于本文提供的修饰的mRNA或制备修饰的mRNA的方法。
图2A显示了修饰的线性mRNA(设计A)和修饰的环状mRNA(设计B)的设计。实心圆代表开放阅读框中修饰的核苷酸,其可提高蛋白质产量。空心圆代表多聚(A)区中修饰的核苷酸,其可提高RNA稳定性。图2B显示了典型mRNA中元件的排列,其按5’至3’顺序含有5’UTR、开放阅读框、3’UTR和多聚-A尾。
图3显示了相对于未修饰的mRNA,修饰的mRNA的蛋白质产生的相对效率相关的数据。合成编码绿色荧光蛋白(GFP)的修饰的mRNA,并聚腺苷酸化以添加多聚(A)尾,其中聚腺苷酸化反应包括有限量(5%或25%)的修饰的腺苷三磷酸,如所示。合成编码mCherry的未修饰的mRNA,并使用典型核苷酸聚腺苷酸化。将修饰的和未修饰的mRNA的混合物转染到细胞中,并在转染后1-3天测量GFP/mCherry的比率。
图4A显示了用于保持编码序列不变的特定多聚(A)尾修饰的实验方案的概述。细胞核酸外切酶使多聚(A)尾去腺苷酸化,但通过多聚(A)聚合酶的修饰的核苷三磷酸(NTP)的随机并入可能会减缓mRNA 3’末端的降解。(SEQ ID NO:1)图4B显示了用于在mRNA的3’末端安装化学界定结构的实验方案的概述。将具有确定组合物的化学合成的寡核苷酸连接到含有模板编码的多聚(A)序列的GFP编码的mRNA的3’末端。化学合成的寡核苷酸的连接允许产生非天然的核苷酸间键,并将确定数量的修饰核苷酸并入每个mRNA的末端。
图5显示了两种mRNA转染HeLa细胞后24、48和72小时的由修饰的mRNA编码的GFP丰度的条形图,其归一化至由未修饰的mRNA编码的mCherry的丰度。平均值+/-SD.P值是通过Graphpad Prism 7.01使用不假设一致SD的非配对t检验计算的。*P<0.01,**P<0.001,***P<0.0001,****P<0.00001。
图6A显示了代表性的RNase H测定,其显示了对连接至一些RNA或DNA核苷酸的mRNA的RNase H活性。对体外转录的mRNA进行连接,然后通过方法部分中所述的AMPure珠净化进行纯化。所有样品均在单独的凝胶上进行完整性表征。凝胶中显示的样品均使用方法部分中描述的RNase H测定方案进行处理。显示的梯子是400ng的Century-Plus RNA标记。图6B显示了在连接中用作底物的选定的RNA/DNA寡核苷酸上进行的E.coli RNase R消化测定。链终止核苷酸不会阻止RNase R消化,但含有23个脱氧腺苷核苷酸和末端双脱氧胞苷的mRNA对RNase R降解表现出强大的稳定性。梯子含有ssDNA引物,其长度列于左侧。
图7A显示了信使-寡核苷酸缀合的RNA(mocRNA)合成的示意图,其中概述了用于连接的合成寡核苷酸的化学修饰和结构。将具有确定组合物的化学合成寡核苷酸连接到含有模板编码的60nt多聚(A)序列(GFP-60A)的人源化Monster Green荧光蛋白(GFP)mRNA的3’末端,以产生可翻译的mocRNA。图7B显示了用于量化mocRNA的连接反应效率的RNase H测定的示意图。用于连接的寡核苷酸为30nt。DNA探针靶向mRNA的3’
UTR,使得探针的5’末端位于多聚(A)尾上游106nt处。这会生成5’mRNA片段(824nt)和3’mRNA片段(166nt,包括60nt多聚(A)尾,用于未连接的mRNA;~200nt用于连接的mRNA)。连接后,3’裂解产物在变性凝胶上显示带移动。M,标记,Century-Plus RNA标记。
图8A显示了转染后24小时、48小时和72小时归一化至mCherry荧光信号和模拟连接对照的GFP荧光信号的条形图。灰色虚线,y=1。平均值±s.d,n视场(FOV)在相应条形下方指示。每个条件有至少3个生物学重复,其中每个重复都有4个FOV成像。P值通过普通双因素方差分析(Dunnett多重比较检验,跨时间点的平均值比较)计算,并与样品29rA_ddC进行多重比较。***P<0.001,****P<0.0001。图8B显示了在相同共焦成像设置下所示RNA构建体转染后48小时HeLa细胞中mCherry荧光、GFP荧光和Hoechst核染色的代表性单独图像和重叠图像。比例尺,25μm。图8C显示了转染后48小时批量GFP/mCherry RNA比率(RT-qPCR,平均值±s.e.m.,也参见表7)和批量GFP/mCherry荧光比率(平均值±s.d.)的平均值的相关性。图8D显示了在相同共焦成像设置下取得的,代表了用指定mRNA载体转染后48小时固定的HeLa细胞中的原位GFP RNA和mCherry RNA的STARmap扩增子的代表性图像。细胞核用DAPI染色表示。共定位的GFP和mCherry扩增子(如插图所示;右栏)可能是脂质转染囊泡(白色箭头),因此被排除在RNA种类的下游STARmap定量之外。
图9A显示了与未标记的萤光素酶相比,萤火虫萤光素酶-降解决定子的动力学特征。将编码每种蛋白质的mRNA转染到HeLa细胞中,并在时间=0时用放线菌酮(CHX)处理。在CHX处理后每隔2hr测量细胞中产生的相对发光单元(RLU),以估计蛋白质的衰变半衰期。图9B显示了归一化至模拟连接信号的萤火虫萤光素酶-降解决定子RLU(转染后8hr)。与每个时间点的模拟连接相比,使用普通单因素方差分析测试测试每个时间点对应的归一化萤火虫RLU值的显著性。*P<0.05,**P<0.01,***P<0.001,
****P<0.0001。图9C显示了在24、48和72hr时间点来自mocRNA转染的HeLa细胞的代表性STARmap图像(通道叠加)。图像是从每个视场获得的Z堆栈中作为单个切片拍摄的。模拟连接、24hr样品中的白色箭头显示了代表性转染囊泡(大尺寸区域和重叠GFP/mCherry信号)。灰色点表示GFP mRNA或mCherry mRNA。通过DAPI染色指示细胞核。图像对比度在ImageJ中的图像之间进行了同等调整。图9D显示了mocRNA转染的HeLa细胞中STARmap mRNA计数和定量的时间过程。对GFP和mCherry mRNA种类进行计数,排除大聚集体(即转染囊泡)。每个实验条件进行3个生物学重复,从每个样品获取4个FOV。小提琴图元素:线条,下/上相邻值;条形图,四分位距;白点,中位数。单细胞数量列于相应的分布上方。使用Welch的t检验进行统计测试,并在每个相应时间点与29rA_ddC进行比较。*P<0.05,**P<0.01,***P<0.001,****P<0.0001。
图10A显示了通过并入修饰的核苷酸三磷酸(NTP)来增加mRNA核酸外切酶和核酸内切酶抗性的一般化学策略的示意图。X,修饰的核苷。图10B显示了E-PAP和IVT掺入反应中使用的腺苷-5’-O(1-硫代三磷酸)(S-ATP)的化学结构。当并入RNA时,α磷酸的硫修饰与硫代磷酸酯(PS)连接相同(如图7B所示)。图10C显示了描述将硫代磷酸酯(PS)连接并入mRNA的不同策略的示意图。腺苷-5’-O-(1-硫代三磷酸)(S-ATP)的RNA聚合酶(即共转录)和多聚A聚合酶并入用于将核酸酶抗性的PS连接安装到mRNA中。插图:变性凝胶显示了每种修饰策略对mRNA长度分布的影响。灰色A:化学修饰的腺苷,黑色A:未修饰的腺苷。M,标记,Century-Plus RNA标记。图10D显示了来自各种策略生成的修饰的GFP mRNA的GFP蛋白丰度的条形图,归一化至mCherry以及转染入HeLa细胞后每个时间点(24小时、48小时和72小时)的未处理的mRNA对照的平均值。平均值±s.d.;n,各自条形下方指示的FOV数量。每种条件包含至少3个生物学重复,其中每个重复成像4个FOV。虚线:y=1。P值通过普通双因素方差分析(Dunnett的多重比较检验,跨时间点的平均值比较)计算,除非图中指定,否则与未处理的mRNA进行多重比较。**P<0.01,****P<0.0001。
图11A显示了转染后24小时和48小时神经元中归一化至mCherry和“未处理”对照的GFP蛋白丰度的条形图。平均值±s.d.,n(FOV)=18。每个条件由至少3个生物学重复组成,其中每个重复成像6个FOV/堆栈。灰色虚线:y=1。与每个单独时间点的未处理样品相比,使用普通双因素方差分析(Dunnett的多重比较检验)计算P值。****P<0.0001。图11B显示了转染后24小时在相同共焦显微镜设置下成像的神经元中的GFP和mCherry荧光的代表性图像。通过Hoechst染色指示细胞核。比例尺,25μm。
图12显示了代表性的RNase H测定,其显示了通过IVT GFP-60AmRNA和合成寡核苷酸的连接制备的mocRNA载体。DNA探针靶向mRNA的3’UTR,使得探针的5’末端位于多聚(A)尾上游106nt处。这会生成5’mRNA片段(824nt)和3’mRNA片段(166nt,包括60nt多聚(A),泳道1和2)。连接后,3’裂解产物在变性凝胶上显示带移动。M,标记,其是Century-Plus RNA标记。连接和未连接的尾部均进行相应标记。
图13A显示了用所示mRNA载体转染24小时、48小时和72小时后HeLa细胞中GFP和mCherry荧光比率(ln[1+比率])的单细胞定量的小提琴图。小提琴图元素,线条,下/上相邻值;条形图,四分位距;白点,中位数。n在括号中表示。P值通过Welch的t检验(未配对、双尾)计算,并与作为对照的样品29rA_ddC进行比较。**P<0.01,***P<0.001,****P<0.0001。图13B显示了脂质体转染胺介导的转染后48小时HeLa细胞中GFP和mCherry RNA的STARmap表征的代表性图像堆栈最大投影。困在脂质体介导的囊泡中的GFP和mCherry mRNA种类似乎重叠并形成大的合并焦点。从囊泡释放的mRNA种类在细胞质中以单个点的形式出现,每个点代表单个mRNA分子。比例尺,20μm。图13C显示了通过STARmap定量的GFP/mCherry mRNA拷贝数(扩增子)的单细胞分析。小提琴图元素:线条,下/上相邻值;条形图,四分位距;白点,中位数。括号中的细胞数量。灰色虚线,样品29rA_ddC的中值。P值通过Welch的t检验(未配对、双尾)计算,并与作为对照的样品29rA_ddC进行比较。*P<0.05,**P<0.01,***P<0.001,****P<0.0001。图13D显示了转染后48小时单细胞GFP/mCherry RNA比率和单细胞GFP/mCherry荧光比率的中位数的相关性。
图14A显示了连接至长度调整的PS+G4寡核苷酸(26rA_G4_C9orf72_RNA_6xSrG、26rA_G4_C9orf72_DNA_6xSG和26rA_G4_telo_DNA_6xSG)的GFP-60A mocRNA。将GFP mocRNA以及mCherry mRNA内部对照转染至HeLa细胞后,进行荧光时程测量。每个样品得到的GFP/mCherry荧光值进一步归一化至每个时间点6xSr(AG)的平均值。使用普通双因素方差分析(Dunnett的多重比较检验,跨时间点的平均值比较)进行统计测试,并与6xSr(AG)进行比较。****P<0.0001。图14B显示了萤火虫-PEST mocRNA构建体的体外翻译。兔网织红细胞裂解物与未经修饰的内部海肾(Renilla)萤光素酶对照一起用作萤火虫-PEST mocRNA构建体的体外翻译系统。从每个反应中测量萤火虫RLU/海肾RLU,以比较不同mocRNA提供的可能的翻译增强模式。使用单因素方差分析(非参数、Kruskal-Wallis、Dunn的多重比较检验)进行统计测试,并与“模拟连接”样品进行比较。*P<0.05。图14C显示了编码mocRNA构建体的萤火虫降解决定子的的动力学特征。海肾(内部对照)RLU在转染后8小时归一化至模拟连接值。与模拟连接相比,使用单因素方差分析(Kruskal-Wallis检验,Dunn的多重比较检验)测试每个时间点对应的mocRNA值的显著性。不同样品之间的内部对照信号似乎是一致的。
图15显示了通过E.coli多聚(A)聚合酶(E-PAP)对GFP mRNA进行多聚(A)加尾,其中掺入了不同量的化学修饰的ATP衍生物。尾部修饰的GFP mRNA与尾部未修饰的mCherry转染对照(E-PAP加尾,100% ATP)一起转染到HeLa细胞中。条形代表GFP/mCherry荧光,通过每个相应时间点的100% ATP、E-PAP加尾GFP mRNA样品的平均值进行归一化。百分比表示每个反应中修饰的和未修饰的ATP之间使用的相对摩尔比。将化学修饰的GFP mRNA与未修饰的mCherry mRNA共转染,并在转染后24、48和72小时在HeLa细胞培养物中测量所得的GFP/mCherry荧光比率。ATP:腺苷5’三磷酸;m6ATP:N6-甲基腺苷5’三磷酸;2’-O-me ATP:2’O-甲基腺苷-5’-三磷酸;S-ATP:腺苷-5’-O-(1-硫代三磷酸);dATP:2’-脱氧腺苷5’-三磷酸;氨基-dATP:2’-氨基-2’-脱氧腺苷-5’-三磷酸。平均值±s.d.n=4。灰色虚线:y=1。P值通过普通双因素方差分析(Dunnett的多重比较检验,跨时间点的平均值比较)计算,并与E-PAP加尾(100% ATP)进行比较。****P<0.0001。
图16A显示了来自图8中的共焦显微图像的HeLa细胞数量的量化。在CellProfiler中对Hoechst染色的细胞核进行分割,并对每个mocRNA条件和时间点计算每个视场(FOV)中的细胞数量。细胞数量归一化至平均细胞数量用于每个时间点的模拟连接条件。使用普通双因素方差分析(Dunnett的多重比较检验,跨时间点的平均值比较)对“无连接”样品进行比较。*P<0.05,**P<0.01。图16B显示了转染的HeLa细胞中先天免疫应答的RT-qPCR定量。用每种GFP-60A连接构建体转染的样品中的IFNB1 mRNA的RT-qPCR,归一化至人ACTB mRNA并再次归一化至模拟连接样品。在显著性测试和绘图之前,将值进一步进行log10转换。每个条件由至少3个生物学重复组成,其中每个生物样品有3个技术重复。3个技术重复(用于每个生物条件)的平均值显示为单独的点,以便每个数据点对应于特定的生物学重复(生物学重复的平均值+s.e.m)。未修饰的GFP mRNA指没有N1-甲基假尿苷取代的IVT hMGFP mRNA(E-PAP多聚(A)加尾的)(即含有100%尿苷)。使用Welch的t检验(未配对、双尾、参数)分析Log10归一化的样品的显著性。样品参考29rA_ddC mocRNA用于成对比较。用于每个条件的生物学重复数(n)在相应样品上方的括号中标明。*P<0.05,**P<0.01,***P<0.001,****P<0.0001。图16C显示了由mocRNA转染确定的死亡大鼠皮层神经元的分数。原代大鼠皮质神经元培养物用250ng GFP-60AmocRNA和250ng mCherry mRNA内部对照转染。然后在转染后24或48小时对细胞进行成像,使用Hoechst对活细胞核和死细胞核进行染色,并使用NucRedDead(647)对死细胞核进行染色。计算死亡细胞核与总细胞核的相对数量,以提供每种转染条件下死亡细胞的百分比。50ng的多聚(I:C)用作毒性的阳性对照。使用普通双因素方差分析(Dunnett的多重比较检验,跨时间点的平均值比较)进行比较,并与仅转染的样品进行比较。**P<0.01。
图17显示了72小时萤火虫RLU/海肾RLU,归一化至“模拟连接”样品值的平均值。对于每个条件,n=9,除了对于29rA_ddC,n=18。这对应于3个生物学重复x 3个技术重复(每个生物学重复),或对于29rA_ddC的6个生物学重复x 3个技术重复。MocRNA构建体是使用萤火虫萤光素酶编码的mRNA制备的。根据制造商的方案,使用Lipofectamine MessengerMax(LMRNA001)将萤火虫萤光素酶mRNA(250ng)和未连接的海肾萤光素酶mRNA (250ng)共转染到HeLa细胞中。孵育6小时后重新接种HeLa细胞,并在转染后72小时使用Promega Dual-Glo萤光素酶测定系统(E2920)测量发光。
图18A显示了体内生物发光成像的实验程序。根据制造商的方案,使用in vivo-jetRNA (Polyplus:101000013)将未处理的或6xSr(AG)_invdT缀合的萤火虫萤光素酶mRNA(2μg)肌肉注射到左大腿或右大腿中。注射mRNA后6小时腹膜内注射萤光素(150mg/kg,VivoGloTM)。15分钟后,进行体内生物发光成像。“ug”指的是μg。图18B示出了在3分钟的暴露时间下测量的体内生物发光。未处理的和6xSr(AG)_invdT缀合的萤火虫荧光素酶mRNA的注射侧显示在图像底部。图18C显示了由未处理的或6xSr(AG)_invdT缀合的萤火虫萤光素酶mRNA产生的体内生物发光的统计结果。*p<0.05。配对T检验。
发明详述
本文提供了修饰的mRNA,其在mRNA的多聚A尾中或下游具有修饰的核苷酸和/或结构特征以改善细胞中的稳定性,从而增强蛋白质产生。还提供了通过连接mRNA的3’末端上的加尾核酸以在通过连接产生的修饰的mRNA的3’处引入确定数量的修饰的核酸或结构序列来制备修饰的mRNA的方法。另外,本公开提供了包含本文提供的一种或多种修饰的mRNA的药物组合物,以及含有试剂的试剂盒以产生本文所述的修饰的mRNA。常规mRNA包含3’末端带有多个腺苷核苷酸的多聚-A尾,其可被细胞核酸外切酶降解,从而去除3’核苷酸。一旦核酸外切酶去除多聚-A尾并开始去除开放阅读框的核苷酸,mRNA就不能翻译成编码的蛋白质。由于细胞中mRNA稳定性的主要决定因素之一是降解多聚-A尾所需的时间,因此对3’核酸外切酶活性更具抗性的mRNA降解速度更慢。本公开的修饰的mRNA在细胞中具有更长的半衰期,因此更稳定。mRNA在细胞中越稳定,降解所需的时间就越长,因此更多的蛋白质可以从半衰期较长的给定RNA分子中翻译出来。含有mRNA核碱基、糖和/或磷酸键的一种或多种结构变化的修饰的核苷酸可以干扰3’核酸外切酶活性,使mRNA更加稳定。然而,抑制3’核酸外切酶的相同结构修饰也会干扰聚腺苷酸化酶将其并入多聚-A尾中的能力,从而阻碍通过常规聚腺苷酸化方法将修饰的核苷酸添加到多聚-A尾中。令人惊讶的是,将含有少至三个修饰核苷酸的寡核苷酸连接到含有预先存在的多聚-A尾的mRNA的3’末端上,导致mRNA稳定性显著改善。含有能够形成二级结构的结构序列的寡核苷酸的连接,例如G-四链体或适体,其防止核酸外切酶接近3’末端核苷酸,相对于没有此类二级结构的RNA,也显著改善了mRNA稳定性。多类修饰的核苷酸和结构序列,无论是单独的还是彼此组合,当添加到3’末端时,都会增加mRNA的稳定性,这表明修饰mRNA的多聚-A尾以阻碍核酸外切酶活性在修饰的mRNA的产生中提供了广泛的用途。修饰的mRNA在细胞中具有提高的稳定性,从而有能力从给定的RNA分子中产生更多编码的蛋白质,其可用于疫苗和其他基于RNA的疗法,例如编码必需酶、凝血因子、转录因子或细胞表面受体的mRNA的递送。
定义
如本文所用,“信使RNA”(“mRNA”)是指包含编码蛋白质的开放阅读框和多聚-A区的核酸。mRNA还可以包含位于开放阅读框5’(上游)的5’非翻译区(5’UTR)和位于开放阅读框3’(下游)的3’非翻译区。
如本文所用,“编码蛋白质的开放阅读框”是指包含编码序列的核酸序列,当开放阅读框被翻译时,其导致蛋白质的产生。核酸序列可以是RNA序列,在这种情况下RNA序列的翻译产生具有蛋白质的氨基酸序列的多肽。核酸序列可以是DNA序列,在这种情况下,当RNA聚合酶使用DNA序列转录包含与DNA序列互补的RNA序列的RNA分子时,产生蛋白质,并且RNA序列的翻译产生具有蛋白质氨基酸序列的多肽。开放阅读框通常以起始密码子开始,例如RNA序列中的AUG(DNA序列中的ATG),并以终止密码子结束,例如RNA序列中的UAG、UAA或UGA(DNA序列中的TAG、TAA或TGA),其中起始密码子的G和终止密码子的T或U之间的碱基数是3的倍数(例如3、6、9)。
可翻译的RNA分子称为信使RNA或mRNA。DNA或RNA序列通过密码子编码基因。密码子指核酸(例如DNA或RNA)序列内的一组三个核苷酸。反密码子是指核酸内的一组三个核苷酸,例如转运RNA (tRNA),其与密码子互补,使得第一核酸的密码子通过密码子和反密码子碱基之间的氢键与第二核酸的反密码子缔合。例如,mRNA上的密码子5’-AUG-3’在tRNA上具有相应的反密码子3’-UAC-5’。在翻译过程中,具有与待翻译密码子互补的反密码子的tRNA与mRNA上的密码子缔合,通常来传递与待翻译密码子相对应的氨基酸,或促进翻译终止和从核糖体释放翻译多肽。
翻译是使用RNA编码序列指导多肽产生的过程。翻译的第一步是起始,其中核糖体与mRNA缔合,携带第一个氨基酸的第一转运RNA(tRNA)与第一个密码子或起始密码子缔合。翻译的下一阶段,即延伸,涉及三个步骤。首先,带有反密码子并携带第二个氨基酸的第二tRNA与mRNA缔合,该反密码子与起始密码子之后的密码子或第二个密码子互补。其次,第一个氨基酸的末端非侧链羧酸部分的碳原子与所携带的第二个氨基酸的末端非侧链氨基部分的氮反应,在两个氨基酸之间形成肽键,其中第二个氨基酸与第二tRNA结合,第一个氨基酸与第二个氨基酸结合,但不与第一tRNA结合。第三,第一tRNA从mRNA上解离,核糖体沿着mRNA前进,使得与核糖体缔合的第一tRNA的位置现在被第二tRNA占据,而先前由第二tRNA占据的位置现在对另一个携带额外氨基酸的tRNA开放以与mRNA缔合。这三个步骤为1)携带氨基酸的tRNA的缔合,2)形成肽键,其将额外的氨基酸添加至生长的多肽,和3)核糖体沿着mRNA前进,持续进行,直到核糖体到达终止密码子,这导致翻译终止。通常,与终止密码子缔合的tRNA不携带氨基酸,因此在延伸步骤中不携带氨基酸的tRNA的缔合会导致多肽与携带多肽中最后一个氨基酸的tRNA之间的键断裂,使得多肽从核糖体中释放。或者,如果没有tRNA与终止密码子缔合,核糖体可能会从mRNA中解离并释放多肽。
如本文所用,“核酸”或“多核苷酸”是指包含两个或更多个共价键合的核苷酸的有机分子。如本文所用,“核苷酸”是指包含以下的有机分子:1)核苷,其包含共价键合至含氮碱基(核碱基)的糖;和2)与核苷的糖共价键合的磷酸基团。多核苷酸中的核苷酸通常通过磷酸二酯键连接,其中第一个核苷酸的糖的3’碳通过桥接磷酸基团与第二个核酸的糖的5’碳连接。通常,桥接磷酸酯包含两个非桥接氧原子,其仅与磷酸酯的磷原子键合,以及两个桥接氧原子,其各自将磷原子连接至第一个核苷酸的3’碳或第二个核苷酸的5’碳。在描述核酸中核苷酸顺序的核酸序列中,如果第一个核苷酸的3’碳连接到第二个核苷酸的5’碳,则称第一个核苷酸位于第二个核苷酸的5’(上游)。类似地,如果第二个核苷酸的5’碳连接至第一个核苷酸的3’碳,则称第二个核苷酸位于第一个核苷酸的3’(下游)。核酸序列通常按5’->3’顺序读取,从5’核苷酸开始,以3’核苷酸结束。
如本文所用,“修饰的核苷酸”是指具有不是腺苷核苷酸、胞苷核苷酸、鸟嘌呤核苷酸或尿嘧啶核苷酸的典型结构的结构的核苷酸。分子的典型结构是指本领域通常已知的分子名称所指的结构。如本文所用,“修饰的核苷酸”还可以指包含非典型的核碱基或糖(核糖或脱氧核糖)的核苷酸。
“修饰的核苷酸”还可以指通过不是典型的核苷间键的核苷间键(即,不是磷酸二酯核苷间键,例如硫代磷酸酯核苷间键)共价连接至第二个核苷酸的核苷酸。包含腺嘌呤碱基、核糖糖和一个或多个磷酸基团的腺苷核糖核苷酸的典型结构如下所示,以腺苷单磷酸的形式:
AMP的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,以及其中磷酸酯的氧原子和/或糖的3’氧原子与核酸序列中相邻的核苷酸结合的结构。
包含胞嘧啶碱基、核糖和一个或多个磷酸基团的胞嘧啶核苷酸的典型结构如下所示,以胞苷单磷酸的形式:
CMP的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,以及其中磷酸酯的氧原子和/或糖的3’氧原子与核酸序列中相邻的核苷酸结合的结构。
包含鸟嘌呤碱基、核糖和一个或多个磷酸基团的鸟嘌呤核苷酸的典型结构如下所示,以鸟苷单磷酸的形式:
GMP的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,以及其中磷酸酯的氧原子和/或糖的3’氧原子与核酸序列中相邻的核苷酸结合结构。
包含尿嘧啶碱基、核糖和一个或多个磷酸基团的尿嘧啶核苷酸的典型结构如下所示,以尿苷单磷酸的形式:
UMP的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,以及其中磷酸酯的氧原子和/或糖的3’氧原子与核酸序列中相邻的核苷酸结合的结构。
由于核苷酸的糖、含氮碱基或磷酸酯中的一种或多种修饰,修饰的核苷酸的结构可能不同于典型核苷酸的结构。在一些实施方案中,修饰的核苷酸包含不是腺嘌呤核苷、胞嘧啶核苷、鸟嘌呤核苷或尿嘧啶核苷的典型结构的修饰核苷。如本文所用
腺苷(腺嘌呤核苷)的典型结构的实例如下:
腺苷的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,其中5’碳与核酸序列中的5’磷酸酯结合的结构,以及其中3’氧原子与核酸序列中相邻核苷酸的5’磷酸基团结合的结构。
胞苷(胞嘧啶核苷)的典型结构的实例如下:
胞苷的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,其中5’碳与核酸序列中的5’磷酸酯结合的结构,以及其中3’氧原子与核酸序列中相邻核苷酸的5’磷酸基团结合的结构。
鸟苷(鸟嘌呤核苷)的典型结构的实例如下:
鸟苷的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,其中5’碳与核酸序列中的5’磷酸酯结合的结构,以及其中3’氧原子与核酸序列中相邻核苷酸的5’磷酸基团结合的结构。
尿苷(尿嘧啶核苷)的典型结构的实例如下:
尿苷的典型结构还指其中磷酸酯的一个或多个羟基和/或糖的一个或多个羟基去质子化的结构,其中5’碳与核酸序列中的5’磷酸酯结合的结构,以及其中3’氧原子与核酸序列中相邻核苷酸的5’磷酸基团结合的结构。
如本文所用,“结构序列”是指包含能够彼此相互作用以在包含该结构序列的核酸中形成二级结构的至少两个核苷酸的核酸序列。
如本文所用,“适体”是指包含能够结合靶分子的二级结构的核酸。
如本文所用,“连接酶”是指能够在两个核苷酸之间形成共价键的酶,并且“连接”的过程是指在两个核苷酸之间形成共价键。
如本文所用,“加尾核酸”是指连接到另一个核酸的3’末端上的核酸。
修饰的mRNA
在一些方面,本公开提供了修饰的mRNA,其包含i)一个或多个修饰的核苷酸;和/或ii)结构序列的一个或多个拷贝(重复单位),其中修饰的核苷酸和/或结构序列是mRNA的多聚-A区的一部分或在3’端。mRNA的多聚-A区,也称为多聚(A)区或多聚(A)尾,是位于开放阅读框3’(下游)的mRNA区域,其包含多个连续的腺苷核苷酸,通常是50-300个连续的腺苷核苷酸,并且可以涵盖连续腺苷核苷酸下游的多个非腺苷核苷酸。在细胞中,DNA序列转录后会产生前体信使RNA(pre-mRNA),多聚-A尾通过多聚腺苷化酶例如多聚-A聚合酶(PAP)添加,从而在RNA的3’末端产生多个连续的腺苷核苷酸的长序列。多聚-A区在mRNA编码的蛋白质的产生中发挥着重要的多种作用。首先,多聚-A区为多聚-A结合蛋白(PABP)提供附着位点,其与细胞核中的mRNA缔合并促进输出到细胞质中(参见,例如,Tudek et al.PhilosTrans R Soc Lond B Biol Sci.2018.373(1762):20180169)。此外,mRNA中多聚-A尾的存在促进翻译的起始(参见,例如,Gallie.Genes&Dev.1991.5:2108–2116以及Munroe etal.Mol Cell Biol.1990.10(7):3441–3455)。最后,多聚-A尾通过保护开放阅读框免受核酸外切酶(例如可从mRNA中去除3’核苷酸的多核苷酸磷酸化酶(PNPase))活性的影响来稳定mRNA。随着核酸外切酶去除核苷酸,mRNA逐渐变短,一旦开放阅读框下游的所有核苷酸都被去除,则核酸外切酶去除的核苷酸将是开放阅读框的核苷酸。从开放阅读框中去除核苷酸可以防止编码蛋白质的翻译。此外,核酸外切酶与开放阅读框附近的mRNA的缔合可以通过空间阻碍核糖体和tRNA与mRNA的缔合来抑制翻译。多聚-A尾的去除通常被认为是mRNA降解的限速步骤,细胞中mRNA的寿命由去除其多聚-A尾所需的时间决定(参见,例如,Dreyfuset al.,Cell.2002.111(5):611–613)。mRNA的多聚-A尾的组成不同,但在酵母细胞中含有大约75个腺苷核苷酸并且在哺乳动物细胞中含有大约250个腺苷核苷酸。
在本文提供的修饰的mRNA的一些实施方案中,修饰的mRNA在mRNA的多聚-A区或多聚-A区的3’(下游)包含一个或多个修饰的核苷酸。在一些实施方案中,多聚-A区包括不是典型腺苷核苷酸的一个或多个核苷酸。在一些实施方案中,多聚-A区包括不是腺苷核苷酸的一个或多个核苷酸。在一些实施方案中,多聚-A区包含位于包含含有多个连续腺苷核苷酸的核酸序列的3’(下游)的一个或多个核苷酸。在一些实施方案中,多聚-A区包含至少25个连续的腺苷核苷酸,其可以是典型的腺苷核苷酸或修饰的腺苷核苷酸。在一些实施方案中,多聚-A区包含25-500个连续的腺苷核苷酸,其可以是典型的腺苷核苷酸或修饰的腺苷核苷酸。在一些实施方案中,多聚-A区包含25-300个连续的腺苷核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个或至少200个连续的腺苷核苷酸。
在一些实施方案中,修饰的mRNA的一个或多个修饰的核苷酸包含修饰的磷酸基团。修饰的磷酸基团是不同于磷酸酯的典型结构的磷酸基团。磷酸酯的典型结构的实例如下所示:
其中R5和R3是与典型磷酸酯键合的原子或分子。例如,对于核酸序列中的磷酸酯,R5可以指核酸的上游核苷酸,并且R3可以指核酸的下游核苷酸。磷酸酯的典型结构还指其中磷酸酯的一个或多个羟基去质子化的结构,或者其中磷酸酯的氧原子与核酸序列中的相邻核苷酸键合的结构。可以取代核酸中的典型磷酸酯的修饰的磷酸基团的非限制性实例包括硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基磷酸酯、3’-O-甲基磷酸酯、5’-羟基磷酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳磷酸酯、甲基磷酸酯、苯基磷酸酯、乙基磷酸酯、H-磷酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在本文提供的包含修饰的核苷酸的修饰的mRNA的一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的核糖、2’-O,4’-C-氨基连接的和2’-O,4’-C-硫代连接的核糖。在某些实施方案中,至少一个修饰的核碱基是2’-O-(未取代的C1-6烷氧基)-(未取代的C1-6烷基)核碱基(例如,2’-O-(未取代的C1-6烷氧基)-(未取代的C1-6烷基)RNA核碱基)。在某些实施方案中,至少一个修饰的核碱基是2’-O-甲氧基-乙基核碱基(例如,2’-O-甲氧基-乙基RNA核碱基)。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,该2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含选自选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在一些实施方案中,修饰的mRNA包含多于一种类型的修饰的核苷酸。在一些实施方案中,修饰的mRNA包含至少第一修饰的核苷酸和具有与第一修饰的核苷酸不同的结构的第二修饰的核苷酸。由于核碱基、糖和/或磷酸基团的差异,核苷酸的结构可能有所不同。在一些实施方案中,修饰的mRNA包含至少第一修饰的磷酸酯和具有与第一修饰的磷酸酯不同的结构的第二修饰的磷酸酯。在一些实施方案中,修饰的mRNA包含第一修饰核苷和第二修饰核苷。
本公开的方面涉及包含具有25个或更多个腺嘌呤核苷酸的多聚-A区的修饰的mRNA。在某些实施方案中,多聚-A区位于开放阅读框的3’并且包含10个或更多个、15个或更多个、20个或更多个、30个或更多个、40个或更多个、或者50个或更多个腺苷核苷酸。在某些实施方案中,多聚-A区位于开放阅读框的3’并且包含10个至15个之间、15个至20个之间、20个至25个之间、25个至35个之间、35个至50个之间、50个至70个之间、或70个至100个之间的腺苷核苷酸,包括端值。腺嘌呤核苷酸是包含腺嘌呤核苷和磷酸基团的核苷酸。腺嘌呤核苷包含糖和腺嘌呤碱基。在一些实施方案中,多聚-A区包含25个或更多个典型腺嘌呤核苷酸。典型的腺苷核苷酸包含腺嘌呤碱基、核糖和磷酸基团,如下腺苷单磷酸(AMP)结构排列:
在一些实施方案中,磷酸酯的一个或多个羟基和/或核糖的3’羟基去质子化,其包含氧离子而不是-OH基团,结构如下所示:
当存在于mRNA的核酸序列中时,典型腺苷包含以下结构并以以下方式连接至相邻核苷酸:
其中R5是mRNA中腺苷核苷酸5’(上游)的相邻核苷酸,R3是mRNA中腺苷核苷酸3’(下游)的相邻核苷酸。在一些实施方案中,典型腺苷核苷酸是线性mRNA的3’末端核苷酸(最后一个核苷酸),R3是氢,并且3’末端核苷酸包含3’末端羟基(-OH)基团。在一些实施方案中,典型腺苷核苷酸是线性mRNA的3’末端核苷酸(最后一个核苷酸),并且R3是电子。
在本文提供的修饰的mRNA的一些实施方案中,mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR)。5’和3’UTR是mRNA内的序列,不编码由mRNA编码的蛋白质的氨基酸,因此不是开放阅读框的一部分。5’UTR位于开放阅读框的5’(上游)。3’UTR位于开放阅读框的3’(下游)。在一些实施方案中,3’UTR包含位于mRNA的开放阅读框的3’和多聚-A区的5’(上游)的一个或多个核苷酸。
在本文提供的mRNA的一些实施方案中,mRNA以5’至3’的顺序包含:1)5’UTR;2)开放阅读框;3)3’UTR;4)多聚-A区(图2B)。在一些实施方案中,5’UTR的最后一个核苷酸位于开放阅读框的第一个核苷酸的5’(上游)。在一些实施方案中,开放阅读框的第一个核苷酸位于5’UTR的最后一个核苷酸的3’(下游),并且开放阅读框的最后一个核苷酸位于3’UTR的第一个碱基的5’(上游)。在一些实施方案中,开放阅读框位于5’UTR的最后一个核苷酸和3’UTR的第一个核苷酸之间。在一些实施方案中,3’UTR的第一个核苷酸位于开放阅读框的最后一个核苷酸的3’(下游),并且3’UTR的最后一个核苷酸位于多聚A-区的第一个碱基的5’(上游)。在一些实施方案中,3’UTR位于开放阅读框的最后一个核苷酸和多聚A-区的第一个核苷酸之间。在一些实施方案中,多聚-A区的第一个核苷酸位于3’UTR的最后一个核苷酸的3’(下游)。
在一些实施方案中,mRNA是线性mRNA。线性mRNA是具有5’末端核苷酸和3’末端核苷酸的mRNA。线性mRNA的5’末端核苷酸仅与mRNA的一个相邻核苷酸共价键合,其中相邻核苷酸出现在mRNA的核酸序列中5’末端核苷酸的3’。线性mRNA的3’末端核苷酸仅与mRNA的一个相邻核苷酸共价键合,其中相邻核苷酸出现在mRNA的核酸序列中3’末端核苷酸的5’。在以5’至3’的顺序包含线性mRNA的每个核苷酸的核酸序列中,5’末端核苷酸是序列中的第一个核苷酸,并且3’末端核苷酸是序列中的最后一个核苷酸。
在本文提供的线性mRNA的一些实施方案中,mRNA包含5’帽。真核细胞中产生的大多数mRNA都包含5’帽,该帽是在前mRNA变为成熟mRNA的过程中添加的。5’帽在mRNA产生、输出和翻译过程中发挥多种作用。首先,剪接体(介导从前mRNA中去除内含子)的组装需要核帽结合复合物(CBC)与5’帽结合。此外,CBC和核孔之间的相互作用介导mRNA从5’末端开始输出到细胞质中。最后,与5’帽结合的CBC介导多种因子的募集,例如CBP80、CTIF、eIF3g、eIF4III、Met-tRNAi和核糖体亚基,这些因子是翻译起始所需的(参见,例如,Ramanathanet al.Nucleic Acids Res.2016.44(16):7511–7526)。在一些实施方案中,5’帽包含7-甲基鸟苷。在一些实施方案中,7-甲基鸟苷包含以下结构:
在一些实施方案中,5’帽包含将7-甲基鸟苷连接至修饰的mRNA的相邻核苷酸的一种或多种磷酸酯。在一些实施方案中,5’帽的一种或多种磷酸酯是选自硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)的修饰的磷酸酯。在一些实施方案中,7-甲基鸟苷通过5’至5’三磷酸桥连接至mRNA的相邻核苷酸。在一些实施方案中,5’帽包含以下结构:
其中R是mRNA第一个转录核苷酸的5’碳。在一些实施方案中,5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
在一些实施方案中,mRNA是环状mRNA。环状mRNA是没有5’末端核苷酸或3’末端核苷酸的mRNA。环状mRNA中的每个核苷酸均与1)5’相邻核苷酸;和2)3’相邻核苷酸共价键合。在具有包含按5’至3’顺序的环状mRNA的每个核苷酸的核酸序列的环状mRNA中,核酸序列的最后一个核苷酸与核酸序列的第一个核苷酸共价键合。在具有5’UTR、3’UTR和多聚-A区的环状mRNA的一些实施方案中,多聚-A区位于3’UTR的3’(下游)和5’UTR的5’(上游)。
在本文提供的修饰的mRNA的一些实施方案中,修饰的mRNA包含位于mRNA的多聚-A区3’的结构序列的一个或多个拷贝。在一些实施方案中,二级结构的核苷酸通过氢键相互作用。在一些实施方案中,二级结构是G-四链体。G-四链体或G-quadruplex是由富含鸟嘌呤的核酸序列形成的二级结构。富含鸟嘌呤的核酸序列包含多个鸟嘌呤核苷酸。通常,富含鸟嘌呤的核酸序列中至少50%的核苷酸是鸟嘌呤核苷酸。G-四链体包含至少一个含有四个鸟嘌呤(G-四联体)的平面,其中每个鸟嘌呤通过Hoogsteen氢键与其他两个鸟嘌呤结合。Hoogsteen氢键是指除典型碱基配对(A:T、A:U和G:C)之外的核苷酸或核苷的含氮碱基之间的氢键。G-四联体的鸟嘌呤围绕空白空间,其可包含正阳离子,例如钾离子,以稳定G-四联体。G-四链体包含至少两个以平行方向排列的G-四联体。
在包含一种或多种结构序列的修饰的mRNA的一些实施方案中,结构序列是G-四链体序列。包含G-四链体序列的核酸能够形成包含G-四链体序列的一个或多个核苷酸的G-四链体。在一些实施方案中,G-四链体序列包含不是鸟嘌呤核苷酸的一个或多个间隔核苷酸。在一些实施方案中,G-四链体序列是RNAG-四链体序列。在一些实施方案中,RNAG四链体序列包含核酸序列GGGGCC(SEQ ID NO:2)。在一些实施方案中,修饰的mRNA包含SEQ ID NO:2的核苷酸序列的至少3个拷贝。在一些实施方案中,G-四链体序列是DNA G-四链体序列。在一些实施方案中,DNA G-四链体序列包含核酸序列GGGGCC(SEQ ID NO:3)。在一些实施方案中,修饰的mRNA包含SEQ ID NO:3的核苷酸序列的至少3个拷贝。在一些实施方案中,结构序列包含端粒重复序列。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4或5之一所示的核酸序列。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4所示的核酸序列。在一些实施方案中,修饰的mRNA包含SEQ ID NO:4的核苷酸序列的至少3个拷贝。
在一些实施方案中,结构序列是包含能够相互作用以形成适体的至少两个核苷酸的适体序列。可以被适体结合的靶分子的非限制性实例包括细胞因子、细胞表面受体和转录因子。在一些实施方案中,由结构序列的一个或多个拷贝形成的二级结构是能够结合靶分子的适体。示例性适体是本领域已知的并且包括能够结合细胞表面受体例如CD4、CTLA-4、TGF-β受体和受体酪氨酸激酶的多种RNA结构。参见,例如,Germer et al.Int JBiochemMol Biol.,2013.4(1):27–40。
在一些实施方案中,修饰的mRNA包含结构序列的1-20个拷贝。在一些实施方案中,修饰的mRNA包含结构序列的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个拷贝。在一些实施方案中,修饰的mRNA包含约4个拷贝的结构序列。在一些实施方案中,修饰的mRNA包含多个不同的结构序列。在一些实施方案中,修饰的mRNA包含至少第一结构序列和包含与第一结构序列不同的核酸序列的第二结构序列。在一些实施方案中,修饰的mRNA包含至少一个G-四链体序列和至少一个端粒重复序列。
在包含本文提供的结构序列的一个或多个拷贝的修饰的mRNA的一些实施方案中,修饰的mRNA的多聚-A区包含至少一个修饰的核苷酸。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含选自选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。在一些实施方案中,mRNA的多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
在一些实施方案中,修饰的mRNA包含多于一种类型的修饰的核苷酸。在一些实施方案中,修饰的mRNA包含至少第一修饰核苷和具有与第一修饰核苷不同的结构的第二修饰核苷。在一些实施方案中,修饰的mRNA包含至少第一修饰磷酸酯和具有与第一修饰磷酸酯不同的结构的第二修饰磷酸酯。在一些实施方案中,修饰的mRNA包含修饰的核苷和修饰的核苷。
在本文提供的包含二级结构的修饰的mRNA的一些实施方案中,mRNA包含5’UTR和3’UTR。在一些实施方案中,5’UTR位于开放阅读框的5’(上游)。在一些实施方案中,mRNA以5’至3’的顺序包含1)5’UTR;2)开放阅读框;3)3’UTR;4)多聚-A区;和5)结构序列的一个或多个拷贝。在一些实施方案中,3’UTR位于开放阅读框的3’(下游)。在一些实施方案中,多聚-A区位于3’UTR的3’(下游)。在一些实施方案中,结构序列的一个或多个拷贝,以及由结构序列形成的二级结构位于多聚-A区的3’(下游)。在一些实施方案中,mRNA是线性mRNA。在一些实施方案中,线性mRNA包含5’帽。在一些实施方案中,5’帽包含7-甲基鸟苷。在一些实施方案中,5’帽包含将7-甲基鸟苷连接至修饰的mRNA的相邻核苷酸的一种或多种磷酸酯。在一些实施方案中,7-甲基鸟苷通过5’至5’三磷酸桥连接至mRNA的相邻核苷酸。在一些实施方案中,5’帽的一种或多种磷酸酯是选自下组的修饰的磷酸酯:硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)。在一些实施方案中,mRNA的多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的端粒重复序列,和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
在本文提供的包含二级结构的修饰的mRNA的一些实施方案中,修饰的mRNA以5’至3’的顺序包含1)5’UTR;2)开放阅读框;3)3’UTR;4)多聚-A区;和5)结构序列的一个或多个拷贝。在一些实施方案中,修饰的mRNA是环状mRNA。在环状mRNA的一些实施方案中,结构序列的一个或多个拷贝位于多聚-A区和5’UTR之间。在一些实施方案中,二级结构位于多聚-A区和5’UTR之间。
在本文提供的修饰的mRNA的一些实施方案中,多聚-A区的核苷酸的1%至90%是修饰的核苷酸。在一些实施方案中,多聚-A区的核苷酸的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%是修饰的核苷酸。
在本文提供的修饰的mRNA的一些实施方案中,多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。在一些实施方案中,多聚-A区的最后25个核苷酸中至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个或25个是修饰的核苷酸。
在本文提供的修饰的mRNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。多聚-A区的一个或多个腺苷核苷酸可以是典型腺苷核苷酸或包含与典型腺苷核苷酸不同的结构的修饰的腺苷核苷酸。修饰的腺苷核苷酸的非限制性实例包括N6-异戊烯基腺苷(i6A)、2-甲基-硫基-N6-异戊烯基腺苷(ms2i6A)、2-甲硫基-N6-甲基腺苷(ms2m6A)、N6-(顺式-羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷(ms2io6A)、N6-甘氨酰氨甲酰腺苷(g6A)、N6-苏氨酰氨甲酰腺苷(t6A)、2-甲硫基-N6-苏氨酰氨甲酰腺苷(ms2t6A)、N6-甲基-N6-苏氨酰氨甲酰腺苷(m6t6A)、N6-羟基正缬氨酰氨甲酰腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨甲酰腺苷(ms2hn6A)、2’-O-核糖基腺苷(磷酸)(Ar(p))、N6,N6-二甲基腺苷(m62A)、N6,2’-O-二甲基腺苷(m6Am)、N6,N6,O-2’-三甲基腺苷(m62Am)、1,2’-O-二甲基腺苷(m1Am)、N6-乙酰腺苷(ac6A)、2’-硫代腺苷(2’SA)、5’-硫代腺苷(5’SA)、2’-O-(2-叠氮基乙基)-腺苷、2’-叠氮基-腺苷、脱氧腺苷(dA)、双脱氧腺苷(ddA)和氨基脱氧腺苷(氨基-dA)。
在本文提供的修饰的mRNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%是典型的腺苷核苷酸。在一些实施方案中,多聚-A区还包含1个或多个不是腺苷核苷酸(例如,典型或非典型腺苷核苷酸)的核苷酸。在一些实施方案中,多聚-A区的核苷酸的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少80%或至少90%是不是腺苷核苷酸的核苷酸。
在本文提供的修饰的mRNA的一些实施方案中,多聚-A区包含至少25-500个核苷酸。在一些实施方案中,多聚-A区包含至少25个、至少30个、至少50个、至少100个、至少150个或至少200个核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、至少210个、至少220个、至少230个、至少240个、至少250个、至少260个、至少270个、至少280个、至少290个或至少300个核苷酸。在一些实施方案中,多聚-A区包含约200至约300个核苷酸。在一些实施方案中,多聚-A区包含约250个核苷酸。
在一些实施例中,多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
修饰的非编码RNA
相关领域的普通技术人员将容易地认识到,本文公开的用于改善细胞中mRNA的稳定性(例如,通过改善mRNA对3’核酸酶外切活性的抗性)的任何技术也可适合于改善细胞中不编码蛋白质的RNA(“非编码”RNA)的稳定性。因此,在一些方面,本公开提供了修饰的非编码RNA,其包含i)一种或多种修饰的核苷酸;和/或ii)结构序列的一个或多个拷贝(重复单位),其中修饰的核苷酸和/或结构序列是RNA的一部分或在3’端。本文所述的非编码RNA不包含开放阅读框(ORF)。非编码RNA可以包含或不包含3’多聚-A区。不包含3’多聚-A区的非编码RNA可被修饰以包含3’多聚-A区(例如,通过用本文公开的方法或本领域已知的其他方法将非编码RNA连接至包含多聚-A区的寡核苷酸)。非编码RNA可以是包含与细胞的mRNA转录物或基因组序列的一部分互补的区域的RNA。非编码RNA可以是适合于基因组编辑的非编码RNA。非编码RNA的实例包括但不限于小干扰RNA (siRNA)、短发夹RNA (shRNA)、长非编码RNA(lncRNA)、用于成簇的规律间隔短回文重复序列(CRISPR)/Cas9基因组编辑的指导RNA(gRNA)、非CRISPR/Cas9 gRNA (例如,作用于RNA (ADAR)-募集gRNA的腺苷脱氨酶)或引物编辑的指导RNA (pegRNA)。参见,例如,Chen,et al.,Acta Pharm Sin B.2021;11(2):340-354;Chen,et al.,Adv Drug Deliv Rev.2021;168:246-258.;Hendel,et al.,NatBiotechnol.2015;33:985–989;Qu,et al.,Nat Biotechnol.2019;37(9):1059-1069;Yi,et al.,Nat Biotechnol.2022.Epub ahead of print;以及Nelson,et al.,NatBiotechnol.2022;40(3):402-410。除非另有具体说明,否则本文描述的用于生成修饰的mRNA的任何技术也可用于生成修饰的非编码RNA。
在一些实施方案中,本文提供的修饰的非编码RNA包含含有3’多聚-A区的非编码RNA。在一些实施方案中,本文提供的修饰的非编码RNA包含通常不包含3'聚A区的非编码RNA (例如,gRNA)。在一些实施方案中,本文提供的修饰的非编码RNA包含在其3’末端与包含多聚-A区的寡核苷酸的5’末端连接的非编码RNA,从而产生包含本文所述的多聚-A区的修饰的非编码RNA。非编码RNA可以通过本文公开的方法或本领域已知的其他方法连接至包含多聚-A区的寡核苷酸。
在本文提供的修饰的非编码RNA的一些实施方案中,修饰的非编码RNA包含存在于非编码RNA的多聚-A区中或多聚-A区的3’(下游)的一个或多个修饰的核苷酸。在一些实施方案中,多聚-A区包括不是典型腺苷核苷酸的一个或多个核苷酸。在一些实施方案中,多聚-A区包括不是腺苷核苷酸的一个或多个核苷酸。在一些实施方案中,多聚-A区包含位于包含多个连续腺苷核苷酸的核酸序列的3’(下游)的一个或多个核苷酸。在一些实施方案中,多聚-A区包含至少25个连续的腺苷核苷酸,其可以是典型的腺苷核苷酸或修饰的腺苷核苷酸。在一些实施方案中,多聚-A区包含25-500个连续的腺苷核苷酸,其可以是典型的腺苷核苷酸或修饰的腺苷核苷酸。在一些实施方案中,多聚-A区包含25-300个连续的腺苷核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个或至少200个连续的腺苷核苷酸。
在一些实施方案中,修饰的非编码RNA的一个或多个修饰的核苷酸包含修饰的磷酸基团。修饰的磷酸基团是不同于磷酸酯的典型结构的磷酸基团。磷酸酯的典型结构的示例如下所示:
其中R5和R3是与典型磷酸酯键合的原子或分子。例如,对于核酸序列中的磷酸酯,R5可以指核酸的上游核苷酸,并且R3可以指核酸的下游核苷酸。磷酸酯的典型结构还指其中磷酸酯的一个或多个羟基去质子化的结构,或者其中磷酸酯的氧原子与核酸序列中的相邻核苷酸键合的结构。可以取代核酸中的典型磷酸酯的修饰的磷酸基团的非限制性实例包括硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在本文提供的包含修饰的核苷酸的修饰的非编码RNA的一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。在某些实施方案中,至少一个修饰的核碱基是2’-O-(未取代的C1-6烷氧基)-(未取代的C1-6烷基)核碱基(例如,2’-O-(未取代的C1-6烷氧基)-(未取代的C1-6烷基)RNA核碱基)。在某些实施方案中,至少一个修饰的核碱基是2’-O-甲氧基-乙基核碱基(例如,2’-O-甲氧基-乙基RNA核碱基)。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在一些实施方案中,修饰的非编码RNA包含多于一种类型的修饰的核苷酸。在一些实施方案中,修饰的非编码RNA包含至少第一修饰的核苷酸和具有与第一修饰的核苷酸不同的结构的第二修饰的核苷酸。由于核碱基、糖和/或磷酸基团的差异,核苷酸的结构可能有所不同。在一些实施方案中,修饰的非编码RNA包含至少第一修饰的磷酸酯和具有与第一修饰的磷酸酯不同的结构的第二修饰的磷酸酯。在一些实施方案中,修饰的非编码RNA包含第一修饰的核苷和第二修饰的核苷。
本公开的方面涉及包含具有25个或更多个腺嘌呤核苷酸的多聚-A区的修饰的非编码RNA。在某些实施方案中,多聚-A区位于非编码RNA的3’末端并且包含10个或更多个、15个或更多个、20个或更多个、30个或更多个、40个或更多个、或者50个或更多个腺苷核苷酸。在某些实施方案中,多聚-A区位于非编码RNA的3’末端并且包含10个至15个之间、15个至20个之间、20个至25个之间、25个至35个之间、35个至50个之间、50个至70个之间、或70个至100个之间的腺苷核苷酸,包括端值。腺嘌呤核苷酸是包含腺嘌呤核苷和磷酸基团的核苷酸。腺嘌呤核苷包含糖和腺嘌呤碱基。在一些实施方案中,多聚-A区包含25个或更多个典型的腺嘌呤核苷酸。典型的腺苷核苷酸包含腺嘌呤碱基、核糖糖和磷酸基团,如下腺苷单磷酸(AMP)的结构排列:
在一些实施方案中,磷酸酯的一个或多个羟基和/或核糖的3’羟基去质子化,其包含氧离子而不是-OH基团,结构如下:
当存在于非编码RNA的核酸序列中时,典型的腺苷包含以下结构并以以下方式连接至相邻核苷酸:
其中R5是非编码RNA中腺苷核苷酸5’(上游)的相邻核苷酸,R3是非编码RNA中腺苷核苷酸3’(下游)的相邻核苷酸。在一些实施方案中,典型的腺苷核苷酸是线性非编码RNA的3’末端核苷酸(最后一个核苷酸),R3是氢,并且3’末端核苷酸包含3’末端羟基(-OH)基团。在一些实施方案中,典型的腺苷核苷酸是线性非编码RNA的3’末端核苷酸(最后一个核苷酸),并且R3是电子。
在本文提供的非编码RNA的一些实施方案中,非编码RNA以5’至3’的顺序包含:1)非编码RNA;和2)存在于或连接至非编码RNA l的3’末端的多聚-A区。在一些实施方案中,与非编码RNA连接的多聚-A区的第一个核苷酸位于非编码RNA的最后一个核苷酸的3’(下游)。
在一些实施方案中,非编码RNA是线性非编码RNA。线性非编码RNA是具有5’末端核苷酸和3’末端核苷酸的非编码RNA。线性非编码RNA的5’末端核苷酸与非编码RNA的仅一个相邻核苷酸共价键合,其中相邻核苷酸出现在非编码RNA的核酸序列中5’末端核苷酸的3’端。线性非编码RNA的3’末端核苷酸与非编码RNA的仅一个相邻核苷酸共价键合,其中相邻核苷酸出现在非编码RNA的核酸序列中3’末端核苷酸的5’端。在以5’至3’顺序包含线性非编码RNA的每个核苷酸的核酸序列中,5’末端核苷酸是序列中的第一个核苷酸,3’末端核苷酸是序列中的最后一个核苷酸。
在本文提供的线性非编码RNA的一些实施方案中,非编码RNA包含5’帽。在一些实施方案中,5’帽包含将7-甲基鸟苷连接至修饰的非编码RNA的相邻核苷酸的一个或多个磷酸酯。在一些实施方案中,5’帽的一个或多个磷酸酯是选自下组的修饰的磷酸酯:硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)。在一些实施方案中,7-甲基鸟苷通过5’至5’三磷酸桥连接至非编码RNA的相邻核苷酸。在一些实施方案中,5’帽包含以下结构:
其中R是非编码RNA的第一个转录核苷酸的5’碳。在一些实施方案中,5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
在一些实施方案中,线性非编码RNA不包含5’帽。
在一些实施方案中,非编码RNA是环状非编码RNA。环状非编码RNA是没有5’末端核苷酸或3’末端核苷酸的非编码RNA。环状非编码RNA中的每个核苷酸均与1)5’相邻核苷酸;2)3’相邻核苷酸共价键合。在具有以5’至3’顺序包含环状非编码RNA的每个核苷酸的核酸序列的环状非编码RNA中,核酸序列的最后一个核苷酸与核酸序列的第一个核苷酸共价键合。在环状非编码RNA的一些实施方案中,非编码RNA3’末端内或与之相连的多聚-A区的最后一个核苷酸位于非编码RNA的第一个核苷酸的5’。
在本文提供的修饰的非编码RNA的一些实施方案中,修饰的非编码RNA包含结构序列的一个或多个拷贝,该结构序列位于非编码RNA内或与之相连的多聚-A区的3’。在一些实施方案中,二级结构的核苷酸通过氢键相互作用。在一些实施方案中,二级结构是G-四链体。G-四链体或G-quadruplex是由富含鸟嘌呤的核酸序列形成的二级结构。
在包含一个或多个结构序列的修饰的非编码RNA的一些实施方案中,结构序列是G-四链体序列。包含G-四链体序列的核酸能够形成包含G-四链体序列的一个或多个核苷酸的G-四链体。在一些实施方案中,G-四链体序列包含不是鸟嘌呤核苷酸的一个或多个间隔核苷酸。在一些实施方案中,G-四链体序列是RNA G-四链体序列。在一些实施方案中,RNA G四链体序列包含核酸序列GGGGCC(SEQ ID NO:2)。在一些实施方案中,修饰的非编码RNA包含SEQ ID NO:2的核苷酸序列的至少3个拷贝。在一些实施方案中,G-四链体序列是DNA G-四链体序列。在一些实施方案中,DNA G-四链体序列包含核酸序列GGGGCC(SEQ ID NO:3)。在一些实施方案中,修饰的非编码RNA包含SEQ ID NO:3的核苷酸序列的至少3个拷贝。在一些实施方案中,结构序列包含端粒重复序列。在一些实施方案中,端粒重复序列包含如SEQID NO:4或5之一所示的核酸序列。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4所示的核酸序列。在实施方案中,修饰的非编码RNA包含SEQ ID NO:4的核苷酸序列的至少3个拷贝。
在一些实施方案中,结构序列是包含至少两个能够相互作用以形成适体的核苷酸的适体序列。可以被适体结合的靶分子的非限制性实例包括细胞因子、细胞表面受体和转录因子。在一些实施方案中,由结构序列的一个或多个拷贝形成的二级结构是能够结合靶分子的适体。示例性适体是本领域已知的并且包括能够结合细胞表面受体例如CD4、CTLA-4、TGF-β受体和受体酪氨酸激酶的多种RNA结构。参见,例如,Germer et al.Int JBiochemMol Biol.,2013.4(1):27–40。
在一些实施方案中,修饰的非编码RNA包含结构序列的1-20个拷贝。在一些实施方案中,修饰的非编码RNA包含结构序列的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个拷贝。在一些实施方案中,修饰的非编码RNA包含结构序列的约4个拷贝。在一些实施方案中,修饰的非编码RNA包含多个不同的结构序列。在一些实施方案中,修饰的非编码RNA包含至少第一结构序列和包含与第一结构序列不同的核酸序列的第二结构序列。在一些实施方案中,修饰的非编码RNA包含至少一个G-四链体序列和至少一个端粒重复序列。
在包含本文提供的结构序列的一个或多个拷贝的修饰的非编码RNA的一些实施方案中,修饰的非编码RNA的多聚-A区包含至少一个修饰的核苷酸。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。在一些实施方案中,非编码RNA的多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
在一些实施方案中,修饰的非编码RNA包含多于一种类型的修饰的核苷酸。在一些实施方案中,修饰的非编码RNA包含至少第一修饰核苷和具有与第一修饰核苷不同的结构的第二修饰核苷。在一些实施方案中,修饰的非编码RNA包含至少第一修饰的磷酸酯和具有与第一修饰的磷酸酯不同的结构的第二修饰的磷酸酯。在一些实施方案中,修饰的非编码RNA包含修饰的核苷和修饰的核苷。
在本文提供的包含二级结构的修饰的非编码RNA的一些实施方案中,修饰的非编码RNA以5’至3’的顺序包含:1)5’非编码RNA;2)位于非编码RNA 3’端内或与之相连的多聚-A区;和3)结构序列的一个或多个拷贝。在一些实施方案中,结构序列的一个或多个拷贝以及由结构序列形成的二级结构位于多聚-A区的3’(下游)。在一些实施方案中,非编码RNA是线性非编码RNA。在一些实施方案中,线性非编码RNA包含5’帽。在一些实施方案中,5’帽包含7-甲基鸟苷。在一些实施方案中,5’帽包含将7-甲基鸟苷连接至修饰的非编码RNA的相邻核苷酸的一个或多个磷酸酯。在一些实施方案中,7-甲基鸟苷通过5’至5’三磷酸桥连接至非编码RNA的相邻核苷酸。在一些实施方案中,5’帽的一种或多种磷酸酯是选自下组的修饰的磷酸酯:硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)。在一些实施方案中,5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。在一些实施方案中,线性非编码RNA不包含5’帽。在一些实施方案中,非编码RNA的多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
在本文提供的包含二级结构的修饰的非编码RNA的一些实施方案中,修饰的非编码RNA以5’至3’的顺序包含:1)非编码RNA;2)非编码RNA内或与之相连的多聚-A区;和3)结构序列的一个或多个拷贝。在一些实施方案中,修饰的非编码RNA是环状非编码RNA。在环状非编码RNA的一些实施方案中,结构序列的一个或多个拷贝位于非编码RNA内或与之相连的多聚-A区与非编码RNA的5’核苷酸之间。
在本文提供的修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的1%至90%是修饰的核苷酸。在一些实施方案中,多聚-A区的核苷酸的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%是修饰的核苷酸。
在本文提供的修饰的非编码RNA的一些实施方案中,多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。在一些实施方案中,多聚-A区的最后25个核苷酸中至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个或25个是修饰的核苷酸。
在本文提供的修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。多聚-A区的一个或多个腺苷核苷酸可以是典型的腺苷核苷酸或包含与典型的腺苷核苷酸不同的结构的修饰的腺苷核苷酸。修饰的腺苷核苷酸的非限制性实例包括N6-异戊烯基腺苷(i6A)、2-甲基-硫基-N6-异戊烯基腺苷(ms2i6A)、2-甲硫基-N6-甲基腺苷(ms2m6A)、N6-(顺式-羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷(ms2io6A)、N6-甘氨酰氨甲酰腺苷(g6A)、N6-苏氨酰氨甲酰腺苷(t6A)、2-甲硫基-N6-苏氨酰氨甲酰腺苷(ms2t6A)、N6-甲基-N6-苏氨酰氨甲酰腺苷(m6t6A)、N6-羟基正缬氨酰氨甲酰腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨甲酰腺苷(ms2hn6A)、2’-O-核糖基腺苷(磷酸)(Ar(p))、N6,N6-二甲基腺苷(m62A)、N6,2’-O-二甲基腺苷(m6Am)、N6,N6,O-2’-三甲基腺苷(m62Am)、1,2’-O-二甲基腺苷(m1Am)、N6-乙酰腺苷(ac6A)、2’-硫代腺苷(2’SA)、5’-硫代腺苷(5’SA)、2’-O-(2-叠氮基乙基)-腺苷、2’-叠氮基-腺苷、脱氧腺苷(dA)、双脱氧腺苷(ddA)和氨基脱氧腺苷(氨基-dA)。
在本文提供的修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%是典型的腺苷核苷酸。在一些实施方案中,多聚-A区还包含不是腺苷核苷酸(例如,典型或典型的腺苷核苷酸)的1个或多个核苷酸。在一些实施方案中,多聚-A区的核苷酸的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少80%或至少90%是不是腺苷核苷酸的核苷酸。
在本文提供的修饰的非编码RNA的一些实施方案中,多聚-A区包含至少25-500个核苷酸。在一些实施方案中,多聚-A区包含至少25个、至少30个、至少50个、至少100个、至少150个或至少200个核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、至少210个、至少220个、至少230个、至少240个、至少250个、至少260个、至少270个、至少280个、至少290个或至少300个核苷酸。在一些实施方案中,多聚-A区包含约200至约300个核苷酸。在一些实施方案中,多聚-A区包含约250个核苷酸。
在一些实施例中,多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,非编码RNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
产生修饰的mRNA和修饰的非编码RNA的方法
在一些方面,本公开提供了产生修饰的mRNA的方法,该方法包括在连接酶的存在下,将RNA (例如包含编码蛋白质的开放阅读框的RNA或非编码RNA)与包含一个或多个修饰的核苷酸的加尾核酸连接,由此连接酶在RNA的3’核苷酸和加尾核酸的5’核苷酸之间形成共价键以产生修饰的RNA (例如,修饰的mRNA或修饰的非编码RNA)。当连接酶在两个线性核酸之间形成共价键时,产生新的核酸,其中产生的核酸包含两种核酸的核酸序列。第一核酸的3’末端核苷酸与第二核酸的5’末端核苷酸连接产生第三核酸,其中第三核酸包含第一核酸和第二核酸的序列,并且第二核酸序列位于第一核酸序列的3’(下游)。RNA连接酶的连接分几个步骤进行。首先,连接酶的氨基酸(例如赖氨酸)的氨基(–NH2)基团与腺苷三磷酸(ATP)的磷酸基团键合,使得腺苷单磷酸(AMP)基团与RNA连接酶结合。其次,第二核酸的5’末端磷酸取代RNA连接酶结合的AMP的磷酸。最后,第一核酸的3’末端羟基的氧与第二核酸的5’末端磷酸的磷原子结合。该最后步骤在核酸的末端核苷酸之间形成磷酸二酯键,从而形成具有连续糖-磷酸主链的单个核酸。在一些实施方案中,连接酶是RNA连接酶。在一些实施方案中,RNA连接酶是T4 RNA连接酶。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,与加尾核酸连接的RNA通过体外转录(IVT)合成。IVT是通过RNA聚合酶转录DNA模板生成RNA,例如前体mRNA(前mRNA)、mRNA或非编码RNA的过程。一般而言,DNA模板包含启动子,例如噬菌体启动子,其位于待转录的DNA序列的上游。RNA聚合酶与启动子结合,并开始DNA序列的转录,产生具有模板中存在的核酸序列的RNA转录本(除了DNA序列中的胸苷(T)核苷酸在RNA序列中被尿嘧啶(U)取代)。由IVT产生的RNA转录本可以在连接加尾核酸之前进行修饰,例如通过添加5’帽、从RNA中切割一个或多个核苷酸、或多腺苷酸化以延伸多聚-A区。在一些实施方案中,DNA模板包含多聚-A区,使得IVT产生具有多聚-A区的mRNA或非编码RNA。参见,例如,Becker et al.Methods Mol Biol.,2011.703:29–41。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,RNA的3’核苷酸包含3’末端羟基,并且加尾核酸的5’核苷酸包含5’末端磷酸基团。RNA上的3’末端羟基和加尾核酸上的5’末端磷酸基团的组合允许两个核酸的有效连接。在一些实施方案中,RNA不包含5’末端磷酸基团。由于添加5’帽或其他化学修饰,RNA可能缺少5’末端磷酸基团。5’末端磷酸也可以通过磷酸酶从RNA中去除以产生缺少5’末端磷酸的RNA。RNA上5’末端磷酸基团的缺少会阻止RNA连接酶将mRNA或非编码RNA的多个拷贝连接在一起。在一些实施方案中,加尾核酸不包含3’末端羟基。如果加尾核酸的最后一个核苷酸包含不含3’羟基的修饰的核苷酸,例如双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷或反向脱氧胸苷,则RNA可能缺少3’末端羟基。加尾核酸上3’末端羟基的缺少会阻止RNA连接酶将多个加尾核酸连接在一起。在一些实施方案中,RNA的5’核苷酸不包含5’末端磷酸基团;RNA的3’核苷酸包含3’末端羟基;加尾核酸的5’核苷酸包含5’末端磷酸基团;并且加尾核酸的3’核苷酸不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,加尾核酸包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。在一些实施方案中,用于将加尾核酸连接至RNA的连接酶是RNA连接酶。在一些实施方案中,RNA连接酶是T4 RNA连接酶。在一些实施方案中,T4 RNA连接酶是T4 RNA连接酶1。在一些实施方案中,T4 RNA连接酶是T4 RNA连接酶2。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,RNA的5’核苷酸不包含5’末端羟基,RNA的3’核苷酸包含3’末端磷酸基团,加尾核酸的5’核苷酸包含5’末端羟基,加尾核酸的3’核苷酸不包含3’末端磷酸基,且RNA连接酶为RtcB连接酶,其将包含3’末端磷酸基团的第一核苷酸连接至包含5’末端羟基基团的第二核苷酸。
本文提供的制备修饰的mRNA或修饰的非编码RNA的方法的一些实施方案还包括产生环状mRNA或环状非编码RNA。在通过连接RNA和加尾核酸产生线性修饰的mRNA或修饰的非编码RNA之后,修饰的mRNA或修饰的非编码RNA的环化包括几个额外的步骤。首先,将5’末端磷酸引入到修饰的mRNA或修饰的非编码RNA的第一个核苷酸上,这一过程称为磷酸化。在一些实施方案中,5’末端磷酸通过激酶引入。“激酶”是指在称为“磷酸化”的过程中将磷酸基团引入分子、在磷酸基团和分子之间形成共价键的酶。其次,对修饰的mRNA或修饰的非编码RNA进行操作以产生具有3’末端羟基的修饰的mRNA或修饰的非编码RNA。在一些实施方案中,通过切割修饰的RNA的一个或多个最后的核苷酸来操作修饰的mRNA或修饰的非编码RNA,以产生具有3’末端羟基的修饰的mRNA或修饰的非编码RNA。在一些实施方案中,修饰的mRNA或修饰的非编码RNA被限制性酶、核酶或内切核糖核酸酶切割。在一些实施方案中,修饰的mRNA或修饰的非编码RNA的一个或多个最后的核苷酸的切割发生在修饰的RNA的第一个核苷酸的磷酸化之前。在一些实施方案中,裂解发生在磷酸化之后。一端包含末端磷酸基团且另一端包含末端羟基的修饰的mRNA或修饰的非编码RNA可通过连接两个末端核苷酸而环化。连接线性核酸的末端核苷酸以产生环状核酸的RNA连接酶可称为“环化连接酶”。
在一些实施方案中,环化连接酶是RNA连接酶。在一些实施方案中,环化连接酶是SplintR连接酶。在一些实施方案中,环化连接酶是T4 RNA连接酶。在一些实施方案中,环化连接酶是T4 RNA连接酶1。在一些实施方案中,环化连接酶是T4 RNA连接酶2。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含5’末端羟基和3’末端磷酸基团,并且环化连接酶是RtcB连接酶,其能够将核苷酸与3’末端磷酸基团和5’末端羟基连接。为了发生连接,修饰的mRNA或修饰的非编码RNA的5’和3’末端核苷酸必须足够接近,以便RNA连接酶在两个核苷酸之间形成键。将线性核酸的两个核苷酸放置得足够接近以发生连接,以及将RNA环化的方法是本领域公知的(参见,例如,Petkovic et al.,Nucleic Acids Res.,2015.43(4):2454–
2465)。在一些实施方案中,将修饰的mRNA或修饰的非编码RNA与支架核酸一起孵育,该支架核酸能够与修饰的RNA杂交(氢键键合),使得修饰的mRNA或修饰的非编码RNA在与支架核酸杂交(结合)时形成环状二级结构。
当RNA形成环状二级结构时,5’和3’末端核苷酸在物理上非常接近,这是RNA连接酶在它们之间形成共价键所必需的。在环化mRNA或非编码RNA的方法的一些实施方案中,RNA的一个或多个最后的核苷酸结合至支架核酸中的第一杂交序列,并且mRNA或非编码RNA的一个或多个第一核苷酸结合至位于第一杂交序列3’(下游)的支架核酸中的第二杂交序列。在一些实施方案中,第一杂交序列包含5个或更多个核苷酸,并且第一杂交序列与修饰的mRNA或修饰的非编码RNA的至少前五(5)个核苷酸互补。在一些实施方案中,第一杂交序列包含10个或更多个、15个或更多个、20个或更多个、25个或更多个、30个或更多个、35个或更多个、40个或更多个、45个或更多个、或50个或更多个核苷酸,并且第一杂交序列的核苷酸的至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或最高达100%是互补的,与修饰的mRNA或修饰的非编码RNA的最后N个核苷酸互补,其中N是第一杂交序列的长度。在一些实施方案中,第二杂交序列包含5个或更多个核苷酸,并且第二杂交序列与修饰的mRNA或修饰的非编码RNA的至少最后五(5)个核苷酸互补。在一些实施方案中,第二杂交序列包含10个或更多个、15个或更多个、20个或更多个、25个或更多个、30个或更多个、35个或更多个、40个或更多个、45个或更多个、或50个或更多个核苷酸,并且第二杂交序列的核苷酸的至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或最高达100%是互补的,与修饰的mRNA或修饰的非编码RNA的最后N个核苷酸互补,其中N是第二杂交序列的长度。在一些实施方案中,修饰的mRNA或修饰的非编码RNA的至少前五(5)个核苷酸与第一杂交序列杂交。在一些实施方案中,修饰的mRNA或修饰的非编码RNA的至少后五(5)个核苷酸与第二杂交序列杂交。在一些实施方案中,修饰的mRNA或修饰的非编码RNA的至少前五(5)个核苷酸与第一杂交序列杂交,并且修饰的mRNA或修饰的非编码RNA的至少后五(5)个核苷酸与第二杂交序列杂交。在一些实施方案中,第一杂交序列的最后一个核苷酸和第二杂交序列的第一个核苷酸在支架核酸中相邻,并且不被任何其他核苷酸分开。
在本文提供的产生环状RNA的方法的一些实施方案中,支架核酸不用于促进通过修饰的mRNA或修饰的非编码RNA形成环状二级结构。相反,修饰的mRNA或修饰的非编码RNA在5’末端包含与3’末端的第二杂交序列互补的第一杂交序列。在一些实施方案中,每个杂交序列包含至少五(5)个核苷酸。在一些实施方案中,每个杂交序列包含至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个或至少50个核苷酸。
在本文提供的产生环状RNA的方法的一些实施方案中,修饰的mRNA或修饰的非编码RNA不通过使用支架核酸和环化连接酶环化,而是通过核酶(催化反应的核酸)环化,例如两个核苷酸之间共价键的形成。在一些实施方案中,在环化之前,修饰的mRNA或修饰的非编码RNA包含位于mRNA的5’UTR或非编码mRNA的第一个核苷酸的5’(上游)的3’内含子,和位于mRNA或非编码RNA的多聚-A区和/或一个或多个结构序列的3’(下游)的5’内含子。核酶和其他催化前体mRNA剪接以去除内含子的酶可以催化5’到5’内含子的核苷酸和3’到3’内含子的核苷酸之间共价键的形成,从而形成环状mRNA或非编码RNA。参见,例如,Wesselhoeft etal.,Nat Commun.2018.9:2629。
在本文提供的产生环状RNA的方法的一些实施方案中,修饰的mRNA或修饰的非编码RNA不通过使用支架核酸环化,而是通过使用促进二级结构形成的互补序列环化,通过非编码RNA的mRNA将mRNA或非编码RNA的5’和3’端核苷酸靠近。在一些实施方案中,在环化之前,修饰的mRNA包含(i)位于开放阅读框5’或非编码RNA5’的第一自杂交序列;(ii)位于开放阅读框3’或非编码RNA3’的第二自杂交序列;(iii)位于第一自杂交序列5’的第一非杂交序列;和(iv)位于第二自杂交序列3’的第二非杂交序列。第一自杂交序列和第二自杂交序列能够彼此杂交,但是第一自杂交序列和第二自杂交序列不能彼此杂交。在一些实施方案中,第一和第二自杂交序列的杂交形成二级结构,其中修饰的mRNA或修饰的非编码RNA的5’末端核苷酸和3’末端核苷酸间隔距离小于在一些实施方案中,5’末端核苷酸和3’末端核苷酸间隔距离小于/>小于/>小于/>小于/>小于/> 小于/>小于/>小于/>或小于/>参见,例如,Carmona,Ellese Marie.2019.Circular RNA:DesignCriteria for Optimal Therapeutical Utility.Doctoral dissertation,HarvardUniversity,Graduate School of Arts&Sciences;Petkovic et al.Nucleic AcidsRes.,2015.43(4):2454–2465;以及WO 2020/237227。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,通过该方法产生的修饰的mRNA或修饰的非编码RNA包含位于mRNA或非编码RNA的多聚-A区的3’的结构序列的一个或多个拷贝。在一些实施方案中,加尾核酸包含结构序列的一个或多个拷贝。在一些实施方案中,结构序列的核苷酸通过氢键相互作用。在一些实施方案中,二级结构是G-四链体。在一些实施方案中,结构序列是G-四链体序列。在一些实施方案中,G-四链体序列包含不是鸟嘌呤核苷酸的一个或多个间隔核苷酸。在一些实施方案中,G-四链体序列是RNAG-四链体序列。在一些实施方案中,RNA G四链体序列包含核酸序列GGGGCC(SEQ ID NO:2)。在一些实施方案中,加尾核酸包含SEQ ID NO:2的核酸序列的至少3个拷贝。在一些实施方案中,G-四链体序列是DNAG-四链体序列。在一些实施方案中,DNAG-四链体序列包含核酸序列GGGGCC(SEQ ID NO:3)。在一些实施方案中,加尾核酸包含SEQ ID NO:3的G-四链体序列的至少3个拷贝。在一些实施方案中,结构序列包含端粒重复序列。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4或5(分别为TAGGGT或TACCCT)之一所示的核酸序列。在一些实施方案中,端粒重复序列包含SEQ ID NO:4所示的核酸序列。在一些实施方案中,加尾核酸包含SEQ ID NO:4的核酸序列的至少3个拷贝。在一些实施方案中,结构序列是包含能够相互作用以形成适体的至少两个核苷酸的适体序列。在一些实施方案中,由结构序列的一个或多个拷贝形成的二级结构是能够结合靶分子的适体。由mRNA或非编码RNA形成适体允许mRNA或非编码RNA定位于含有靶分子(例如受体)的细胞的给定区域。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,修饰的mRNA或修饰的非编码RNA包含结构序列的1-20个拷贝。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含结构序列的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个拷贝。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含结构序列的约4个拷贝。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含多个不同的结构序列。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含至少第一结构序列和包含与第一结构序列不同的核酸序列的第二结构序列。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,修饰的mRNA或修饰的非编码RNA的多聚-A区包含至少一个修饰的核苷酸。在一些实施方案中,加尾核酸包含至少一个修饰的核苷酸。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个、至少4个或至少5个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个脱氧核糖,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少20个脱氧核糖糖,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少6个包含2’修饰的核苷酸,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少6个包含2’修饰的连续核苷酸,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少6个连续的硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少6个硫代磷酸酯和3个鸟嘌呤核苷,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个拷贝的G-四链体序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,mRNA或非编码RNA的多聚-A区包含至少3个拷贝的端粒重复序列和至少6个硫代磷酸酯,并且不包含3’末端羟基。在一些实施方案中,不包含3’末端羟基的3’末端核苷酸是双脱氧胞苷或反向脱氧胸苷。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,修饰的mRNA或修饰的非编码RNA包含多于一种类型的修饰的核苷酸。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含至少第一修饰核苷和具有与第一修饰核苷不同的结构的第二修饰核苷。在一些实施方案中,修饰的mRNA或修饰的非编码RNA至少包含第一修饰的磷酸酯和具有与第一修饰的磷酸酯不同的结构的第二修饰的磷酸酯。在一些实施方案中,修饰的mRNA或修饰的非编码RNA包含修饰的核苷和修饰的核苷。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的1%至90%是修饰的核苷酸。在一些实施方案中,多聚-A区的核苷酸的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%是修饰的核苷酸。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。在一些实施方案中,多聚-A区的最后25个核苷酸中的至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个或25个是修饰的核苷酸。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或者至少99%是腺苷核苷酸。多聚-A区的一个或多个腺苷核苷酸可以是典型的腺苷核苷酸或包含与典型的腺苷核苷酸不同的结构的修饰的腺苷核苷酸。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,多聚-A区的核苷酸的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%是典型的腺苷核苷酸。
在通过本文提供的方法产生的修饰的mRNA或修饰的非编码RNA的一些实施方案中,多聚-A区包含至少25-500个核苷酸。在一些实施方案中,多聚-A区包含至少25个、至少30个、至少50个、至少100个、至少150个或至少200个核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、至少210个、至少220个、至少230个、至少240个、至少250个、至少260个、至少270个、至少280个、至少290个或至少300个核苷酸。在一些实施方案中,多聚-A区包含约200个至约300个核苷酸。在一些实施方案中,多聚-A区包含约250个核苷酸。
在本文提供的产生修饰的mRNA的方法的一些实施方案中,在连接加尾核酸之前,RNA在连接加尾核酸之前包含开放阅读框和多聚-A区。在本文提供的产生修饰的非编码RNA的方法的一些实施方案中,在连接加尾核酸之前,RNA在连接加尾核酸之前包含非编码RNA并且可以包含或不包含多聚-A区。在一些实施方案中,在连接加尾核酸之前,RNA的多聚-A区包含至少25-500个核苷酸。在一些实施方案中,多聚-A区包含至少25个、至少30个、至少50个、至少100个、至少150个或至少200个核苷酸。在一些实施方案中,多聚-A区包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、至少210个、至少220个、至少230个、至少240个、至少250个、至少260个、至少270个、至少280个、至少290个或至少300个核苷酸。在一些实施方案中,多聚-A区包含约200个至约300个核苷酸。在一些实施方案中,多聚-A区包含约250个核苷酸。
在一些实施方案中,在连接加尾核酸之前,加尾核酸包含至少10-500个核苷酸。在一些实施方案中,加尾核酸包含至少10个、至少15个、至少20个、至少25个、至少30个、至少50个、至少100个、至少150个或至少200个核苷酸。在一些实施方案中,加尾核酸包含至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个或至少200个核苷酸。在一些实施方案中,多聚-A区包含约10个至约50个核苷酸。
在本文提供的产生修饰的mRNA的方法的一些实施方案中,在连接加尾核酸之前,RNA按5’至3’的顺序包含5’UTR、开放阅读框、3’UTR和多聚-A区。在一些实施方案中,开放阅读框位于5’UTR和3’UTR之间。在一些实施方案中,3’UTR位于开放阅读框和多聚腺苷酸区域之间。
在本文提供的产生修饰的非编码RNA的方法的一些实施方案中,在连接加尾核酸之前,RNA按5’至3’的顺序包含非编码RNA和任选地多聚-A区。在一些实施方案中,多聚-A区的第一个核苷酸位于非编码RNA的最后一个核苷酸的3’处。在一些实施方案中,在连接加尾核酸之前,非编码RNA不包含多聚-A尾。因此,在一些实施方案中,加尾核酸包含本文所述的多聚-A区,其通过将加尾核酸连接至非编码RNA的3’末端而添加至非编码RNA的3’末端,从而产生包含多聚-A区的修饰的非编码RNA。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,在连接加尾核酸之前,RNA包含5’帽。在一些实施方案中,5’帽包含7-甲基鸟苷。在一些实施方案中,5’帽包含将7-甲基鸟苷连接至RNA的相邻核苷酸的一种或多种磷酸酯。在一些实施方案中,在连接加尾核酸后添加5’帽。在一些实施方案中,在连接加尾核酸之前,RNA不包含5’帽(例如,RNA是不包含5’帽的mRNA或非编码RNA)。
在本文提供的包括将加尾核酸连接至mRNA或非编码RNA,产生修饰的mRNA或修饰的非编码RNA的方法的一些方面,加尾核酸包含一个或多个修饰的核苷酸。在一些实施方案中,加尾核酸包含至少一个包含修饰核苷的修饰核苷酸。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核苷,该修饰的核苷包含修饰的核碱基和/或修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核苷,该修饰的核苷包含修饰的核碱基和修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的核碱基。在一些实施方案中,至少一个修饰的核苷酸包含修饰的糖。在一些实施方案中,至少一个修饰的核苷酸包含修饰的磷酸酯。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的核碱基:黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的糖:2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。在一些实施方案中,至少一个修饰的核苷酸包含2’修饰。在一些实施方案中,2’修饰选自锁核酸(LNA)修饰(即,包含与核糖的2’氧和4’碳结合的额外碳原子的核苷酸)、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。在一些实施方案中,至少一个修饰的核苷酸包含选自下组的修饰的磷酸酯:硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,加尾核酸包含多于一种类型的修饰的核苷酸。在一些实施方案中,加尾核酸包含至少第一修饰核苷和具有与第一修饰核苷不同的结构的第二修饰核苷。在一些实施方案中,加尾核酸包含至少第一修饰的磷酸酯和具有与第一修饰的磷酸酯不同的结构的第二修饰的磷酸酯。在一些实施方案中,加尾核酸包含修饰的核苷和修饰的核苷。
在一些实施方案中,加尾核酸的核苷酸的1%至90%是修饰的核苷酸。在一些实施方案中,加尾核酸的核苷酸的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或者至少50%是修饰的核苷酸。在一些实施方案中,加尾核酸的最后25个核苷酸中的3个或更多个是修饰的核苷酸。在一些实施方案中,加尾核酸的最后25个核苷酸中的至少4个、5个、6个、7个、8个、9个、10个、15个、20个或25个是修饰的核苷酸。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,加尾核酸包含一种或多种结构序列。在一些实施方案中,加尾核酸包含G-四链体序列的一个或多个拷贝。在一些实施方案中,G-四链体序列是RNAG-四链体序列。在一些实施方案中,RNAG四链体序列包含核酸序列GGGGCC(SEQ ID NO:2)。在一些实施方案中,G-四链体序列是DNA G-四链体序列。在一些实施方案中,DNA G-四链体序列包含核酸序列GGGGCC(SEQ IDNO:3)。在一些实施方案中,加尾核酸包含端粒重复序列的一个或多个拷贝。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4或5(分别为TAGGGT或TACCCT)之一所示的核酸序列。在一些实施方案中,端粒重复序列包含如SEQ ID NO:4所示的核酸序列。在一些实施方案中,结构序列是包含能够相互作用以形成适体的至少两个核苷酸的适体序列。在一些实施方案中,由结构序列的一个或多个拷贝形成的二级结构是能够结合靶分子的适体。
在本文提供的产生修饰的mRNA或修饰的非编码RNA的方法的一些实施方案中,加尾核酸包含结构序列的1-20个拷贝。在一些实施方案中,加尾核酸包含结构序列的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个拷贝。在一些实施方案中,加尾核酸包含结构序列的约4个拷贝。在一些实施方案中,加尾核酸包含多个不同的结构序列。在一些实施方案中,加尾核酸包含至少第一结构序列和包含与第一结构序列不同的核酸序列的第二结构序列。不同的第一和第二结构序列中的每一个可以是本文提供的任何结构序列,或不同的序列。在进一步的实施方案中,产生修饰的mRNA或修饰的非编码RNA的方法还涉及用于分离(例如,纯化、富集)本文提供的修饰的mRNA或修饰的非编码RNA的方法。在一些实施方案中,分离(例如,纯化、富集)修饰的mRNA或修饰的非编码RNA的方法包括使包含修饰的mRNA或修饰的非编码RNA的混合物(例如,连接混合物)与纯化介质接触,其中修饰的mRNA或修饰的非编码RNA与纯化介质相互作用以形成修饰的RNA-纯化介质缀合物。在一些实施方案中,通过一种或多种物理或化学性质,例如但不限于大小(质量)或电荷,将已形成修饰的RNA-纯化介质缀合物的纯化介质从混合物中分离。在一些实施方案中,通过用溶剂处理修饰的RNA-纯化介质缀合物,将修饰的mRNA或修饰的非编码RNA从纯化介质中洗脱(即,与纯化介质分离)。在一些实施例中,溶剂是水性溶剂(例如,水)。在某些实施方案中,溶剂是两种或更多种(例如,三种)溶剂的混合物。在某些实施方案中,溶剂是水和有机溶剂(例如,乙腈、甲醇、乙醇、四氢呋喃)的混合物。在某些实施方案中,溶剂还包含流动相改性物质。在某些实施方案中,流动相改性物质是酸(例如,三氟乙酸、乙酸、甲酸、磷酸)、碱(氨、氢氧化铵、碳酸氢铵)或盐(磷酸盐、乙酸盐、柠檬酸盐、甲酸铵或硼酸盐)。在一些实施方案中,纯化介质是固体纯化介质。在一些实施方案中,纯化介质包含珠子。在一些实施方案中,纯化介质包含树脂。在一些实施方案中,纯化介质包含顺磁珠。适合纯化RNA的纯化介质的实例是本领域技术人员众所周知的,并且包括例如各种可商购得到的纯化介质(参见,例如,Beckman Coulter Life Sciences#A63987)。在某些实施方案中,本段中描述的步骤在0℃至20℃之间、20℃至25℃之间、25℃至36℃之间、36℃至38℃之间(包括端值)的温度下进行。在某些实施方案中,本段中描述的步骤在0.9atm至1.1atm之间(包括端值)的压力下进行。
包含修饰的mRNA或修饰的非编码RNA的组合物及其使用方法
在一些方面,本公开提供了包含本文提供的修饰的mRNA或修饰的非编码RNA中任一个的组合物。在一些实施方案中,修饰的mRNA或修饰的非编码RNA通过本文提供的任何方法制备,包括将加尾核酸连接到RNA上。包含修饰的mRNA的组合物可用于将修饰的mRNA递送至细胞,以便针对外来抗原对受试者进行疫苗接种,或表达治疗蛋白以治疗病况或病症。包含修饰的非编码RNA的组合物可用于调节细胞或受试者中的基因表达,或用于编辑细胞或受试者的基因组,并且可用于治疗病况或病症。包含修饰的mRNA或修饰的非编码RNA的组合物还可用于在不存在疾病的受试者中发挥期望的效果,例如用于农业用途。例如,编码生物农药或生长增强因子的mRNA或用于基因组编辑的非编码RNA可分别用于增加植物对害虫的耐受性,或以增加作物产量的方式调节生长。本文所述的任何修饰的mRNA或修饰的非编码RNA或其组合物可用于增强mRNA或修饰的非编码RNA向植物或植物细胞的递送和/或稳定性,并且可用于增强本领域已很好建立的植物基因组工程的技术。参见,例如,Stoddard,etal.PLoS One.2016;11(5):e0154634。
在一些实施方案中,mRNA的开放阅读框进行了密码子优化用于在受试者细胞中的表达。如本文所用,“密码子优化”是指在细胞中更有效翻译的密码子的优先使用。多个密码子可以编码相同的氨基酸,其中每个密码子的翻译速率和效率由多个因素决定,例如包含互补反密码子的氨酰基-tRNA的细胞内浓度。核酸序列的密码子优化可以包括用编码与被替换(replace)的密码子相同的氨基酸,但比被替换的密码子更有效地翻译的密码子替换一个或多个密码子。例如,氨基酸苏氨酸(Thr)可以由ACA、ACC、ACG或ACT(RNA中的ACU)编码,但在哺乳动物宿主细胞中ACC是最常用的密码子;在其他物种中,不同的Thr密码子可优选用于密码子优化。因此,与具有未经密码子优化的开放阅读框的mRNA相比,具有密码子优化的开放阅读框的mRNA预计会更有效地翻译,并在给定的时间内产生更多的多肽。在一些实施方案中,开放阅读框进行了密码子优化用于在人细胞中的表达。
在本文提供的修饰的mRNA的一些实施方案中,开放阅读框编码抗原或治疗性蛋白质。如本文所用,“治疗性蛋白质”是指当在受试者(例如患有或有风险发展为疾病或病症的人类受试者)中表达时,预防、减少或减轻疾病的一种或多种体征或症状的蛋白质。治疗性蛋白质可以是由受试者中突变的基因编码的必需酶或转录因子。例如,人类IPEX综合征是由FOXP3基因突变引起的,该突变阻碍了FOXP3+调节性T细胞的发育,导致自身免疫和炎症性病症的易感性增加。因此,来自mRNA的必需酶或转录因子的表达可以补偿受试者中编码酶或转录因子的基因中的突变。如本文所用,“抗原”是指当在受试者中表达时引发受试者中与抗原结合的抗体的产生的分子(例如,蛋白质)。在一些实施方案中,抗原是衍生自病毒的蛋白质(病毒抗原)或其片段。在一些实施方案中,抗原是衍生自细菌的蛋白质(细菌抗原)或其片段。在一些实施方案中,抗原是衍生自原生动物的蛋白质(原生动物抗原)或其片段。在一些实施方案中,抗原是衍生自真菌的蛋白质(真菌抗原)或其片段。全长蛋白质的片段是指具有存在于全长蛋白质的氨基酸序列中但比全长蛋白质的氨基酸序列短的氨基酸序列的蛋白质。
在一些方面,本公开提供了包含本文提供的任何修饰的mRNA或修饰的非编码RNA的脂质纳米颗粒。脂质纳米颗粒是指包含一种或多种脂质的组合物,其形成脂质聚集体或具有内表面和外表面的封闭结构。用于递送mRNA或非编码RNA的脂质纳米颗粒制剂中使用的脂质是本领域公知的,并且包括可电离的氨基脂质、非阳离子脂质、甾醇和聚乙二醇修饰的脂质。参见,例如,Buschmann et al.Vaccines.2021.9(1):65。在一些实施方案中,修饰的mRNA或修饰的非编码RNA被脂质纳米颗粒的脂质包围并存在于脂质纳米颗粒的内部。在一些实施方案中,mRNA或非编码RNA分散在脂质纳米颗粒的整个脂质中。在一些实施方案中,脂质纳米颗粒包含可电离的氨基脂质、非阳离子脂质、甾醇和/或聚乙二醇(PEG)修饰的脂质。
在一些方面,本公开提供了包含本文提供的任何修饰的mRNA或修饰的非编码RNA的细胞。在一些实施方案中,细胞是包含本文提供的修饰的mRNA或修饰的非编码RNA中的任一个的人细胞。“细胞”是所有已知独立生物体的基本结构和功能单位。它是被归类为生物体的最小生命单位。一些生物体,例如大多数细菌,是单细胞的(由单个细胞组成)。其他生物体,例如植物、真菌和动物,包括牛、马、鸡、火鸡、羊、猪、狗、猫和人,是多细胞的。在一些实施方案中,修饰的mRNA或修饰的非编码RNA在细胞中的半衰期是15-900分钟。在一些实施方案中,修饰的mRNA或修饰的非编码RNA在细胞中的半衰期是30-600分钟。在一些实施方案中,修饰的mRNA或修饰的非编码RNA在细胞中的半衰期是60-300分钟。在一些实施方案中,修饰的mRNA或修饰的非编码RNA的半衰期为至少15分钟、至少20分钟、至少25分钟、至少30分钟、至少35分钟、至少40分钟、至少45分钟、至少50分钟、至少55分钟、至少60分钟。在一些实施方案中,修饰的mRNA或修饰的非编码RNA在细胞中的半衰期为至少30分钟、至少60分钟、至少90分钟、至少120分钟、至少150分钟、至少180分钟、至少210分钟、至少240分钟、至少270分钟、至少300分钟、至少330分钟、至少360分钟、至少390分钟、至少420分钟、至少450分钟、至少480分钟、至少510分钟、至少540分钟、至少570分钟、至少600分钟、至少630分钟、至少660分钟、至少690分钟、至少720分钟、至少750分钟、至少780分钟、至少810分钟、至少840分钟或至少870分钟。
在一些方面,本公开提供了包含本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒或细胞的组合物。在一些实施方案中,组合物是药物组合物,其包含本文提供的修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒或细胞中的任一个,以及药学上可接受的赋形剂。药学上可接受的赋形剂、载剂、缓冲剂、稳定剂、等渗剂、防腐剂或抗氧化剂、或本领域技术人员熟知的其他材料。此类材料应该是无毒的并且不应该干扰活性成分的功效。载剂或其他材料的精确性质可以取决于施用途径,例如,肠胃外、肌内、皮内、舌下、经颊、经眼、鼻内、皮下、鞘内、瘤内、经口、经阴道或经直肠。
在一些方面,本公开提供了向受试者施用本文提供的任何修饰的mRNA、修饰的非编码RNA、脂质纳米颗粒、细胞、组合物或药物组合物的方法。在一些实施方案中,本文所述的任何修饰的mRNA或修饰的非编码RNA可以与多种试剂或材料(例如,一种或多种脂质纳米颗粒、细胞、组合物或药物组合物)或与本领域已知的某些生产、纯化、配制和递送过程和技术结合使用,例如但不限于美国专利号9950065、10576146、11045418、8754062、10808242、9957499、10155785、11059841、10876104、10975369、9580711、9670152、9850202、9896413、10399937、10052284、10959953和10961184,其中每一个均通过引用并入本文。
在一些实施方案中,受试者是人。在一些实施方案中,施用是肠胃外、肌内、皮内、舌下、经颊、经眼、鼻内、皮下、鞘内、瘤内、经口、经阴道或经直肠。
在一些实施方案中,组合物将在低于50℃、低于40℃、低于30℃、低于20℃、低于10℃、低于0℃、低于-10℃、低于-20℃、低于-30℃、低于-40℃、低于-50℃、低于-60℃、低于-70℃或低于-80℃储存,使得核酸随着时间的推移相对稳定。
在一些实施方案中,通过体内电穿孔将修饰的mRNA或修饰的非编码RNA引入受试者的细胞中。体内电穿孔是使用电脉冲将核酸或其他分子引入受试者细胞的过程,其促进核酸或其他分子穿过细胞膜和/或细胞壁。参见,例如,Somiari et al.MolecularTherapy.,2000.2(3):178–187。将待递送的核酸或分子施用给受试者,例如通过注射,并将电脉冲施加到注射部位,由此电促进核酸进入施用部位的细胞。在一些实施方案中,将核酸与提高电穿孔效率的其他元素一起施用,例如缓冲剂和/或赋形剂。
在一些方面,本公开提供了包含本文提供的任何RNA和任何加尾核酸的试剂盒。RNA和加尾核酸可以在RNA连接酶存在下组合以产生修饰的mRNA或修饰的非编码RNA,例如本文提供的修饰的mRNA或修饰的非编码RNA之一。在一些实施方案中,试剂盒包含连接酶。在一些实施方案中,试剂盒包含RNA连接酶。在一些实施方案中,试剂盒包含T4 RNA连接酶。在一些实施方案中,试剂盒包含T4 RNA连接酶1。在一些实施方案中,试剂盒包含T4 RNA连接酶2。在一些实施方案中,试剂盒包含RtcB RNA连接酶。在一些实施方案中,试剂盒还包含用于进行连接的缓冲液。在一些实施方案中,试剂盒还包含核苷酸三磷酸,例如ATP,以提供连接酶所需的能量。在一些实施方案中,试剂盒将在低于50℃、低于40℃、低于30℃、低于20℃、低于10℃、低于0℃、低于-10℃、低于-20℃、低于-30℃、低于-40℃、低于-50℃、低于-60℃、低于-70℃或低于-80℃储存,使得核酸随着时间的推移相对稳定。
在一些方面,本公开提供了包含本文提供的任何药物组合物和递送装置的试剂盒。递送装置是指适合于向受试者施用组合物的机器或设备,例如注射器或针头。在一些实施方案中,试剂盒将在低于50℃、低于40℃、低于30℃、低于20℃、低于10℃、低于0℃、低于-10℃、低于-20℃、低于-30℃、低于-40℃、低于-50℃、低于-60℃、低于-70℃或低于-80℃储存,使得药物组合物的核酸随着时间的推移相对稳定。
实施例
为了可以更全面地理解本公开,给出以下实施例。提供实施例是为了说明本文提供的修饰的mRNA、药物组合物、试剂盒和方法,并且不应以任何方式解释为限制它们的范围。
实施例1:修饰的mRNA的产生。
修饰的mRNA通过编码5’非翻译区(UTR)、编码期望蛋白质的开放阅读框和3’UTR的DNA模板的体外转录(IVT)来产生。DNA模板还可以包含在编码3’UTR的模板下游含有重复胸苷碱基(多聚(T)序列)的核酸序列。当从多聚(T)DNA序列转录RNA时,RNA聚合酶会断断续续,将多个腺苷碱基添加到转录的RNA中,而不总是沿着DNA模板前进。这导致在RNA的3’末端添加仅含有腺苷碱基的长RNA序列(称为多聚(A)尾)(图1)。
或者,可以通过体外转录不含多聚(T)序列的DNA模板来产生没有多聚(A)尾的RNA转录本,并且可以在加尾反应中将多聚(A)尾单独添加到这些转录本中。在能够将核苷酸添加到RNA分子3’末端的酶(例如多聚(A)聚合酶(PAP))的存在下,将RNA分子与腺苷三磷酸(ATP)或修饰的ATP一起孵育。将RNA和聚腺苷酸化酶与ATP和一种或多种修饰的ATP的混合物一起孵育,导致多聚(A)尾的添加。通过上述任一方法产生的修饰的mRNA是线性mRNA,其具有5’和3’末端核苷酸。
修饰的mRNA可以是环状mRNA,其是没有5’或3’末端的单链mRNA分子(图2A)。环状mRNA是通过将待环化的线性mRNA与另一种单链核酸(例如DNA寡核苷酸)一起孵育而产生的,该单链核酸包含i)与mRNA3’末端的序列互补的核苷酸序列(3’DNA补体),和ii)与mRNA5’末端的序列互补的核苷酸序列(5’DNA补体),其中在DNA寡核苷酸上3’DNA补体紧邻5’DNA补体的下游(3’)。mRNA与互补寡核苷酸杂交,使得mRNA的3’末端核苷酸位于mRNA的5’末端核苷酸的5’处。连接酶,例如SplintR连接酶,在mRNA的两个末端碱基之间形成磷酸二酯键,从而形成没有末端核苷酸的环状mRNA分子。
实施例2:修饰的碱基对mRNA的蛋白质产生效率的影响。
编码GFP或mCherry且缺乏多聚(A)尾的RNA通过体外转录产生。如实施例1中所述,使用不同的核苷酸组合物对RNA进行聚腺苷酸化,以产生具有不同多聚(A)尾的mRNA。编码GFP的RNA用a)ATP,b)95% ATP和5%修饰的ATP的混合物,c)75% ATP和25%修饰的ATP的混合物,或d)无ATP(不加尾)作为阴性对照进行聚腺苷酸化。测试的修饰的ATP包括m6ATP、2’OMeATP、硫代-ATP、dATP和氨基-dATP。编码mCherry的RNA用ATP进行聚腺苷酸化,以产生具有典型多聚(A)尾的对照mRNA。将GFP编码的mRNA和对照mCherry编码的mRNA的混合物转染到HeLa细胞中。转染后1、2和3天,通过荧光显微镜定量每个细胞群中产生的GFP和mCherry蛋白的量,并计算产生的GFP/mCherry的比率。相对于仅用ATP进行聚腺苷酸化产生的GFP编码的mRNA,在多聚(A)尾部含有修饰的ATP的每个GFP编码的mRNA产生更大的GFP/mCherry比率(图3)。一般来说,在聚腺苷酸化反应中使用25%修饰的ATP比仅使用5%修饰的ATP导致GFP/mCherry比率更显著增加,这表明修饰的腺苷更频繁地包含到多聚(A)尾中,进一步提高了修饰的mRNA的蛋白质产生效率。
实施例3:修饰的mRNA的生化和功能表征。
修饰的mRNA根据多个生化参数进行表征,包括纯度和mRNA给定区域(例如多聚(A)尾)中的碱基是修饰的碱基的比例。NMR光谱用于评估组合物中mRNA的身份。凝胶电泳用于评估含有mRNA的组合物的纯度,其中含有单一mRNA种类的纯组合物在凝胶上产生单个条带,含有不同大小的多个mRNA分子的不纯组合物在凝胶上产生多个条带,或弥散条带。液柱质谱(LC/MS)用于评估修饰核苷酸的掺入情况。修饰的核苷酸具有与典型核苷酸不同的、通常更大的分子量,因此将更多修饰的核苷酸掺入到mRNA中将导致mRNA分子的质量发生更大的变化,通常是增加。
基于细胞的筛选用于评估修饰的碱基对蛋白质翻译的影响。修饰的mRNA与包含典型碱基的未修饰的mRNA并行,被转染到分开的人类细胞群中。转染后,通过本领域已知的多种方法之一评估蛋白质产生速率,包括流式细胞术和ELISA。通过在转染后期望时间点裂解转染细胞,分离核酸,通过逆转录从裂解物中的mRNA制备cDNA,并使用定量PCR定量与转染mRNA相对应的cDNA量,评估转染细胞内修饰或未修饰mRNA的稳定性。使用本领域已知的多种方法之一对转染的mRNA诱导的先天免疫应答进行定量,例如针对Toll样受体或适体蛋白的磷酸化信号传导结构域的ELISA,或通过检测外源RNA激活的基因(如OAS1)的基于qRT-PCR的定量。
在治疗方法中,将修饰的mRNA施用于人类或动物受试者,使得受试者的细胞核糖体产生由mRNA编码的一种或多种蛋白质。mRNA可以编码生物发光蛋白,例如萤光素酶,使得可以使用萤光素酶成像系统来测量受试者中蛋白质产生的效率。mRNA可以编码抗原,使得受试者细胞中抗原的产生导致受试者产生对该抗原具有特异性的抗体和/或T细胞。通过本领域已知的方法评估受试者针对抗原产生的免疫应答,包括定量对抗原具有特异性的抗体的ELISA、定量中和抗体的中和测定、以及定量多种类型的免疫细胞(包括T细胞或抗原特异性T细胞)的流式细胞术。
实施例4:通过连接产生修饰的mRNA。
介绍
信使RNA(mRNA)疗法和疫苗正在迅速成为一类新型药物,如针对SARS-CoV-2的近期临床试验和mRNA疫苗的批准所证明的1,2。mRNA载体因其可编程性、体内蛋白质的快速产生、制造成本相对较低以及同时靶向多种蛋白质的潜在可扩展性,被视为基于常规蛋白质的药物的有前途的替代品3-5。虽然mRNA已被证明可以在体内稳健地产生转基因蛋白质,但mRNA相对较短的半衰期可能会限制该治疗平台的临床应用3,6。此前,在动物研究中,通过多次注射RNA(例如“加强”剂量)就可以避免这个问题,如在一些疫苗研究的情况中7-9,但这种策略可能会限制治疗应用和广泛分布。
化学修饰是在体内应用中增强翻译潜力并降低mRNA毒性的有效策略。掺入修饰的UTP衍生物(例如假尿苷和N1-甲基假尿苷)已被广泛用于降低RNA转染时的先天免疫毒性1012。据报道,环状mRNA比其线性对应物具有增强的半衰期,可能是由于它们缺乏可降解的5’和3’RNA末端1315。然而,环状mRNA由于依赖于不能强烈耐受修饰的核苷酸的掺入的IRES元件而总体表达水平较低15。此外,核酸外切酶-抗性的核苷酸已被掺入mRNA体和mRNA多聚(A)尾中,据报道RNA半衰期有不同程度的增加16,17。虽然RNA聚合酶将修饰的核苷三磷酸(NTP)随机掺入mRNA体中显示出了希望,但该策略极大地减少了可测试的NTP的化学空间,因为许多修饰的NTP不能被核糖体机制很好地耐受,从而降低了整体翻译效率1820。另一种策略是在酶促多聚(A)尾期间选择性地掺入修饰的NTP16,17。虽然是有希望的,但该策略依赖于多聚(A)聚合酶,该酶面临酶耐受的小化学库的限制,并且无法以位点特异性方式掺入修饰的核苷酸。
本文提出了通过合成修饰的RNA寡核苷酸的3’末端连接来创建具有增强的蛋白质产生能力的mRNA载体的替代策略。真核生物中典型的mRNA降解途径被认为通常从3’脱腺苷酸化开始,随后募集脱帽复合物并将mRNA暴露于5’和3’细胞核酸外切酶21。测试了具有核酸外切酶-抗性的多聚(A)尾的mRNA在细胞中相对于具有未修饰多聚(A)尾的mRNA抵抗脱腺苷化和产生更多蛋白质的能力。
结果
多聚(A)加尾期间初步修饰的ATP掺入
筛选了多种化学修饰的ATP衍生物的多聚(A)稳定活性。具体来说,使用之前描述的类似加尾方案使用GFP mRNA模板将修饰的ATP添加到多聚(A)加尾反应中(图4A)17。将具有修饰的多聚(A)尾的GFP编码的mRNA和具有未修饰的多聚(A)尾的mCherry编码的mRNA共转染至HeLa细胞中。每次转染仅包含一种类型的修饰的GFP编码的mRNA和对照mCherry编码的mRNA。通过测量三天时间过程中的相对GFP/mCherry荧光比率,观察到mRNA翻译半衰期中的微小差异是由于修饰的NTP掺入多聚(A)尾。
三天内监测HeLa细胞中的荧光显示,由于与修饰的ATP掺入物(特别是对于dATP(2’-脱氧腺苷)和α-硫醇ATP(腺苷-5’-O-(1-硫代三磷酸酯))的多聚(A)加尾反应,荧光蛋白产量增加(图1)。E.coli多聚(A)聚合酶可能偶尔并以亚化学计量水平掺入修饰的ATP。也有可能E.coli多聚(A)聚合酶完全排除了一些修饰的核苷酸,从而产生未修饰的多聚(A)尾,尽管聚腺苷酸化反应中存在修饰的ATP。
化学修饰的寡核苷酸连接增强翻译寿命
为了测试位点特异性化学修饰的不同设计并掺入替代的核苷酸间键,采用了替代的修饰策略,其中将合成的寡核苷酸连接到含有预先存在的多聚(A)尾的mRNA的3’末端上(图4B)。使用含有GFP编码序列和多聚(A)尾编码序列的DNA模板进行体外转录,以产生具有均质长度的GFP编码的mRNA群体。使用靶向3’UTR的RNase H反应测定3’寡核苷酸连接的效率,这导致凝胶上连接的和未连接的mRNA 3’末端的清晰分离(图6A)。观察到使用T4 RNA连接酶I(Promega)的连接接近100%效率,如RNase H反应所证明的(图6A)。
为了比较不同化学修饰的功效,所有寡核苷酸都设计为29个核苷酸长。每个寡核苷酸含有5’磷酸酯,以促进与mRNA 3’末端的连接,以及缺少3’羟基的3’封闭基团(双脱氧C[ddC]或反向dT[InvdT]),以防止寡核苷酸的自身连接。这确保了连接将寡核苷酸的一个且仅一个拷贝附着到mRNA上。此外,寡核苷酸5’末端至少有6-8个核苷酸是未修饰的rA核苷酸,为T4 RNA连接酶I反应提供非结构化柄。修饰的RNA和DNA寡核苷酸序列可见于表1。寡核苷酸被连接到前一段所描述的GFP编码的mRNA的3’末端,其中包含约60个核苷酸模板编码的多聚(A)尾,以便于使用先前描述的RNase H方案的表征。
表1:加尾寡核苷酸的序列。
/>
将连接的、修饰的GFP编码的mRNA与未连接的mCherry mRNA(E-PAP多聚(A)加尾)一起转染到HeLa细胞中,作为内部转染对照。对细胞样品进行成像,以量化转染后24hr、48hr和72hr的相对GFP/mCherry荧光强度比率,以估计特定3’末端修饰对翻译寿命的影响。
与未连接的和模拟连接的对照相比,含有29个未修饰的rA连接和3’ddC(29xrA_ddC)的对照寡核苷酸的连接使HeLa细胞培养物中的GFP荧光略有增加(50-55%之间,表2)。这可能是由于多聚(A)尾延长了28个核苷酸,并且可能部分是由于链终止ddC核苷酸的存在。此外,含有3个连续硫代磷酸酯(PS)键的寡核苷酸的连接产物(3xSrA_ddC、3xSrA_InvdT和3xSrG_InvdT)显示,与29nt多聚(rA)对照寡核苷酸相比,每个时间点的GFP产量增加了140%–210%(图5)。这一观察与具有核酸酶抗性活性的硫代磷酸酯键基本一致,如反义寡核苷酸治疗中所使用的22
表2:如图5所示的GFP/mCherry荧光比率的统计。
/>
/>
详细的P值以样品1v.s.样品2:72hr比较的格式列出。模拟连接v.s.29rA_ddC:4e-7;29rA_ddC v.s.3XSrA_ddC:2e-6;29rA_ddC v.s.3XSrA_InvdT:0.005;29rA_ddCv.s.3XSrG_InvdT:1e-5;29rA_ddC v.s.6XSr(AG):<1e-15;29rA_ddC v.s.G4_telo_DNA_WT:9e-6.29rA_ddC v.s.G4_C9orf72_RNA_6xSrG:0.003;29rA_ddC v.s.G4_C9orf72_DNA_6xSrG:8e-5;29rA_ddC v.s.G4_telo_DNA_6xSG:0.002。
令人惊讶的是,3xthio-rG_invdT连接在每个时间点都表现出比3xthio-rA_invdT稍强的GFP荧光(170%–200%vs.140%–180%归一化GFP/mCherry),尽管这种差异相对较小(表2;图5)。这一结果可能与mRNA去腺苷酸化酶对腺嘌呤相对于鸟苷的特异性有关23,24。然而,这些短的、非结构化的序列差异在改变mRNA翻译寿命方面发挥的作用相对较小。此外,3xSrA_ddC和3xSrA_InvdT分别表现出170%–210%和140%–180%归一化的GFP/mCherry产量(考虑所有时间点;表2)。这表明改变连接中使用的小链终止核苷酸的身份(3’双脱氧-C和3’反向dT)可能会导致mRNA稳定性的轻微增强。
鉴于RNase-抗性的硫代磷酸酯键的成功,寡核苷酸中的RNA核苷酸被RNase-抗性的DNA核苷酸取代,以确定它们对蛋白质翻译产量的影响。出乎意料的是,含有23个脱氧腺苷的寡核苷酸(23xdA_ddC)并不显著提高翻译半衰期(图5),尽管该寡核苷酸对体外RNaseR消化具有抗性(图6B)。然而,DNA四链体(端粒衍生的)ssDNA序列显示出稳定的效果,该效果始终大于非结构化的23脱氧腺苷和“G到C”ssDNA寡核苷酸对照连接(图5)。据推测,具有非结构化的3’ssDNA末端的mRNA可能对细胞ssDNA核酸外切酶敏感,或者如果它们与mRNA具有同源性,则会触发RNase H活性25–27
最后,探索了与具有增加的数量的硫代磷酸酯修饰的寡核苷酸的连接,以及与四链体(G4)二级结构的组合,以确定这些修饰是否可以协同作用以稳定修饰的mRNA。非结构化ssRNA寡核苷酸(6xSr(AG))中的6个连续硫代磷酸酯键提供了最一致的稳定水平,其中所有时间点的标准偏差为0.26–0.6(表2;图5)。含有6个连续硫代磷酸酯键的ssDNA和ssRNAG4寡核苷酸(G4_C9orf72_RNA_6xSrG,G4_C9orf72_DNA_6xSrG和G4_telo_DNA_6xSG)也导致比对照寡核苷酸增强的翻译,但这些构建体的性能在不同的重复中变化较大,显示S.D.范围分别为0.7–1;0.8–1.1;1.0-1.3(表2;图5)。
HeLa细胞时间过程实验表明,随着时间的推移,掺入硫代磷酸酯键的mRNA增加了GFP/mCherry信号(图5)。这些化学修饰可能通过增加每个mRNA的翻译效率直接发挥作用,或者通过降低相对于mCherry编码的内部对照mRNA的RNA降解率间接发挥作用,从而增加观察到的GFP/mCherry信号。
讨论
先前对细胞质mRNA衰变的研究已确定多聚(A)尾缩短是主要mRNA降解途径(如,脱腺苷酸依赖性衰变)的限速步骤。根据该模型,研究了多聚(A)尾的缩短作为mRNA载体失活的限速步骤。
在6xSr(AG)构建体的情况下,将含有核酸酶-抗性的化学键的寡核苷酸连接到mRNA的3’末端足以在几天的过程内(24-72hr)增加mRNA翻译活性,从而使细胞培养物中的蛋白质表达量增加最高达170%–220%。该策略可以扩展mRNA载体中修饰的核苷酸衍生物的化学空间用于多种目的。
这些结果表明,多聚(A)缩短是治疗性mRNA翻译功效的主要决定因素,与之前的细胞质mRNA降解模型一致。这些结果表明用核酸酶-抗性、多聚(A)结合的蛋白(PABP)结合的适体/寡核苷酸替换mRNA尾,用于增强的mRNA稳定性。本文详述的策略还与其他类型的修饰兼容,例如水解-抗性的7-甲基鸟苷5’帽28,29、修饰的5’UTR区域30、或mRNA体内的核酸内切酶/水解-抗性的修饰的核苷酸。这种连接策略通常适合将mRNA疗法与易于合成的化学修饰的适体(例如肽核酸31、锁核酸32、或其他化学基团)结合。
方法
质粒的克隆、表征和纯化
获得了pCS2载体中hMGFP和mCherry编码的质粒(分别为WX28和WX26)。这些质粒含有(按5’-3’顺序):SP6启动子序列、5’UTR、荧光蛋白编码的序列(CDS)、3’UTR和NotI限制位点。
定点诱变试剂盒(NEB)用于使用编码正向引物上的多聚(A)&反向引物上的多聚(T)的引物对质粒进行PCR。随后进行KLD酶处理,然后转化至NEB Stabl细胞中,使用ZymoPURE质粒miniprep试剂盒进行分离,并通过Genewiz进行Sanger测序。
mRNA合成和表征
GFP mRNA由WX28xEsp3i质粒合成,该质粒含有SP6启动子,随后是hMGFPCDS和模板编码的多聚(A)尾。质粒通过紧邻多聚(A)区3’的单个Esp3i位点进行线性化。然后使用ZymoResearch的DNA Clean&Concentrator-25试剂盒纯化线性化质粒。
使用mMESSAGE mMACHINETM SP6转录试剂盒中的SP6酶和反应缓冲液制备5’加帽、修饰的mRNA。试剂盒提供的2X NTP/Cap溶液替换为2XNTP/Cap制剂,该制剂含有:10mM ATP、10mM CTP、2mM GTP、8mM 3’-O-Me-m7G(5’)ppp(5’)G RNA帽结构类似物和10mM N1-甲基假尿苷-5’-三磷酸。添加Superase-In RNase抑制剂至终浓度为1:20(v/v)。IVT反应组装后,在37℃下孵育2-4小时,,用1-2μl TURBO DNase在37℃下处理反应1hr,然后使用MEGAclearTM Transcription Clean-Up试剂盒进行反应纯化。
将Superase-In RNase抑制剂添加到纯化的mRNA样品中至终浓度为1:50(v/v),并将样品保存在-80℃下进行长期保存。在连接前通过Nanodrop测量纯化的mRNA以估计浓度,但在转染之前立即使用Qubit RNAHS测定测量mRNA进行归一化,以进行基于细胞的测试。
为了制备未修饰的多聚(A)聚合酶加尾的mRNA,通过使用NotI-HF对WX28和WX26质粒进行线性化来生成dsDNA模板,并使用Zymo DNA Clean&Concentrator-25对消化产物进行柱纯化。使用上述方案进行体外转录,除了在TURBO DNase消化后,还包括使用E-PAP多聚(A)加尾试剂盒进行多聚(A)加尾的额外步骤。mRNA的纯化和储存如上所述(例如,使用MEGAclear transcription cleanup试剂盒)。
修饰的E.coli多聚(A)聚合酶加尾
对于修饰的E-PAP加尾实验,底物是线性化WX28模板上的IVT生成的无尾GFPmRNA。该方案使用E-PAP多聚(A)加尾试剂盒中的酶和缓冲液。为每个修饰的ATP掺入制备“总10mM”ATP储备液,以便特定百分比的ATP被修饰的ATP衍生物(XATP)取代。例如,25%dATP样品需要组装2.5mM dATP、7.5mM ATP储备液。加尾反应组装如下:
使用核酸酶游离水最高达25μl总体积
反应在37℃下孵育1小时,然后添加0.5μl 500mM EDTA淬灭。然后使用MonarchRNA cleanup试剂盒(50μg)对这些加尾的mRNA进行柱纯化。将Superase-In RNase抑制剂添加到纯化的mRNA中,最终稀释为1:50(v/v),转染前将mRNA储存于-80℃。
以下修饰的ATP衍生物(XATP)用于聚腺苷酸化实验:腺苷5’-三磷酸(ATP);N6-甲基腺苷-5’-三磷酸(m6A);2’-O-甲基腺苷-5’-三磷酸;腺苷-5’-O-(1-硫代三磷酸);脱氧腺苷三磷酸(dATP);2’-氨基-2’-脱氧腺苷-5’-三磷酸。
修饰的寡核苷酸3’末端连接
使用T4 RNA连接酶I进行连接反应。反应组装如下:
最高达50μl的总体积(含无核酸酶水)
将反应物在37℃下孵育30分钟,然后经由添加1μl 500mM EDTA,pH 8.0灭活反应物。通过添加1体积的无核酸酶水(例如50μl)来稀释反应液,然后添加0.5体积(例如25μl)的含有1μl Superase-In的AMPure XP。根据制造商的方案纯化反应物,并使用含有Superase-In的无核酸酶水以1:50(v/v)的比例从AMPure珠子中洗脱mRNA。
对于根据基于RNase H凝胶测定不完全的连接,使用修改的条件进行连接,其中从反应中省略DMSO。必要时,这通常会导致更有效的连接。
RNase H测定
在RNase H测定之前,制备氯化钾(KCl)储备液并用于将ssDNA寡核苷酸退火至mRNA。KCl储备液含有:50mM KCl、2.5mM EDTA、1:200(v/v)Superase-In RNase抑制剂,使用无核酸酶水调至最终体积。ssDNA探针从IDT订购并具有序列GCATCACAAATTTCACAAATAAAAGCATTTTTTTCAC(SEQ ID NO:18)。
制备以下反应以使mRNA退火至上述ssDNA探针:
200ng mRNA样品(纯化)
2pmol ssDNA探针
2μl储备液:50mM KCl、2.5mM EDTA、1:200Superase-In
使用无核酸酶水最高达10μl体积
反应物在70℃下变性5分钟,然后在台式热循环仪中以0.2℃/sec的速率冷却至室温(25℃)。探针退火后,向每个反应中添加1μl耐热RNase H和1μl 10X缓冲液,其在50℃下孵育30分钟。反应孵育后,添加1μl蛋白酶K消化样品,并在室温下孵育5分钟。随后,将样品与1体积的凝胶上样缓冲液II混合,其中已补充EDTA至终浓度50mM。
在6% NovexTM TBE-尿素凝胶上进行上样和解析前,1X上样缓冲液中的样品在70℃下变性3-5分钟。
寡核苷酸的RNase R消化
将200ng寡核苷酸在含有1X RNase R反应缓冲液和10单位RNase R的10μl总反应体积中孵育。反应在37℃下孵育1小时,然后用1μl蛋白酶K消化并在1X凝胶上样缓冲液II中变性。其在15% Novex TBE-尿素凝胶上运行。
哺乳动物细胞培养和mRNA转染
HeLa细胞(CCL-2、ATCC)在37℃、5% CO2培养箱中维持在含有10%FBS的Dulbecco’s Modified Eagle’s Medium(DMEM)培养基中,并每3天以1:8的比例传代。定期通过Hoechst染色和显微镜成像确认细胞培养物没有支原体污染。
在mRNA转染前一天,将细胞以75%汇合度接种到12孔板的各个孔中。第二天,使用3uL Lipofectamine MessengerMAX转染试剂将500ng mCherry(内部对照)mRNA和500ng带有合成尾部的GFP mRNA(浓度由Qubit测定)转染到每个孔中。还包括仅含有mCherry mRNA、或仅含有转染试剂、或仅含有未转染细胞的其他对照。孵育6小时后,除去lipofectamine/mRNA转染混合物,用DPBS冲洗细胞一次,并胰酶化,以6:4:3的比例重新接种到三个玻璃底24孔板(聚-D-赖氨酸包被)中,分别用于转染后24小时、48小时和72小时的荧光蛋白定量。
荧光蛋白的共焦成像和定量
在荧光蛋白成像之前,除去培养基,并用DPBS冲洗细胞一次,然后在细胞核染色培养基(含有1:2000稀释的Hoechst 33342的FluoroBrite DMEM)中于37℃孵育10分钟。
细胞核(Hoechst)、GFP和mCherry的共焦图像由Leica Stellaris 8使用10X空气物镜以900nm*900nm的像素大小拍摄。每个孔取四个代表性视野,每个象限一个。所有要比较的样品都使用相同的成像设置。激发/检测波长采用“激发波长/~[检测波长范围]”格式:Hoechst:二极管405nm/~[430-480]nm;GFP:WLL 489nm/~[500-576]nm;mCherry:WLL587nm/~[602-676]nm。
使用STARmap对转染细胞培养物进行mRNA定量
使用STARmap测量转染细胞中的mCherry和GFP mRNA数量33,STARmap是将单个mRNA分子检测为带条形码的DNA集落的基于成像的方法。遵循Wang等人描述的用于细胞培养的STARmap程序33
简而言之,荧光蛋白成像后,细胞在室温下用1.6%PFA/1XPBS固定10分钟,然后在下一步之前用预冷的甲醇在-20℃下进一步固定和透化(最多一周)。随后,除去甲醇,并用PBSSTR/甘氨酸/tRNA(含0.1%Tween-20、0.5%SUPERaseIn、100mM甘氨酸、1%酵母tRNA的PBS)在室温下将细胞再水化15分钟,然后用PBSTR洗涤。然后将样品与靶向mCherry和GFPmRNA序列的SNAIL探针在杂交缓冲液(2XSSC、10%甲酰胺、1% Tween-20、20mM RVC、0.5%SUPERaseIn、1%酵母tRNA、每个探针100nM)中40℃下过夜杂交。然后在37℃下用PBSTR洗涤细胞两次(每次洗涤20分钟),并在37℃下用高盐洗涤缓冲液(含4XSSC的PBSTR)洗涤细胞一次,然后在室温下用PBSTR漂洗一次。连接反应在室温下进行2小时,以环化与引物相邻的挂锁探针。用PBSTR洗涤两次后,使用Phi29在30℃下从引物开始滚环扩增,并掺入氨基dUTP,持续2小时。再用PBSTR洗涤两次后,通过PBST缓冲液中的20mM MA-NHS在室温下2小时修饰DNA扩增子以使其可聚合。然后将样品转化为水凝胶-细胞杂交体,然后用蛋白酶K在室温下消化荧光蛋白过夜。将样品用PBST洗涤3次,然后用洗涤和成像缓冲液(2XSSC,10%甲酰胺)中的荧光检测寡核苷酸在37℃下染色1小时。最后,在室温下用洗涤和成像缓冲液洗涤样品3次,并用DAPI染色,然后在洗涤和成像缓冲液中成像。
共焦成像堆栈由Leica Stellaris 8使用40X油镜拍摄,像素尺寸为283nm*283nm。14-um的堆栈以1um/step的速度拍摄15个步骤。每个孔取四个代表性视野,每个象限一个。
表3:SNAIL探针序列
荧光检测探针序列
mCherry扩增子检测探针:/5Alexa647N/CATACACTAAAGATAACAT(SEQ ID NO:31)
hMGFP扩增子检测探针:/5Alex546N/TCGTAGACTAAGATAACAT(SEQ ID NO:32)
参考文献
1.Polack,F.P.et al.Safety and Efficacy of the BNT162b2 mRNA Covid-19Vaccine.N.Engl.J.Med.383,2603–2615(2020).
2.Lombardi,A.et al.Mini Review Immunological Consequences ofImmunization With COVID-19mRNA Vaccines:Preliminary Results.Front.Immunol.12,657711(2021).
3.Sahin,U.,Karikó,K.&Türeci,mRNA-based therapeutics--developing anew class of drugs.Nat.Rev.Drug Discov.13,759–780(2014).
4.Dammes,N.&Peer,D.Paving the Road for RNA Therapeutics.TrendsPharmacol.Sci.41,755–775(2020).
5.Weng,Y.et al.The challenge and prospect of mRNA therapeuticslandscape.Biotechnol.Adv.40,107534(2020).
6.Chen,C.-Y.A.,Ezzeddine,N.&Shyu,A.-B.Messenger RNA half-lifemeasurements in mammalian cells.Methods Enzymol.448,335–357(2008).
7.Petsch,B.et al.Protective efficacy of in vitro synthesized,specificmRNA vaccines against influenza A virus infection.Nat.Biotechnol.30,1210–1216(2012).
8.Richner,J.M.et al.Vaccine Mediated Protection Against Zika Virus-Induced Congenital Disease.Cell 170,273–283.e12(2017).
9.Tai,W.et al.A novel receptor-binding domain(RBD)-based mRNA vaccineagainst SARS-CoV-2.Cell Res.30,932–935(2020).
10.Karikó,K.et al.Incorporation of pseudouridine into mRNA yieldssuperior nonimmunogenic vector with increased translational capacity andbiological stability.Mol.Ther.16,1833–1840(2008).
11.Karikó,K.,Buckstein,M.,Ni,H.&Weissman,D.Suppression of RNArecognition by Toll-like receptors:the impact of nucleoside modification andthe evolutionary origin of RNA.Immunity 23,165–175(2005).
12.Andries,O.et al.N(1)-methylpseudouridine-incorporated mRNAoutperforms pseudouridine-incorporated mRNA by providing enhanced proteinexpression and reduced immunogenicity in mammalian cell lines andmice.J.Control.Release 217,337–344(2015).
13.Wesselhoeft,R.A.,Kowalski,P.S.&Anderson,D.G.Engineering circularRNA for potent and stable translation in eukaryotic cells.Nat.Commun.9,2629(2018).
14.Wesselhoeft,R.A.et al.RNA Circularization DiminishesImmunogenicity and Can Extend Translation Duration In Vivo.Mol.Cell 74,508–520.e4(2019).
15.Carmona,E.M.Circular RNA:Design Criteria for Optimal TherapeuticalUtility.(Harvard University,2019).
16.L.,Hüwel,S.,Zobel,T.&Rentmeister,A.Multiple covalentfluorescence labeling of eukaryotic mRNA at the poly(A)tail enhancestranslation and can be performed in living cells.Nucleic Acids Res.47,e42(2019).
17.Strzelecka,D.et al.Phosphodiester modifications in mRNA poly(A)tail prevent deadenylation without compromising protein expression.RNA 26,1815–1837(2020).
18.Li,B.,Luo,X.&Dong,Y.Effects of Chemically Modified Messenger RNAon Protein Expression.Bioconjug.Chem.27,849–853(2016).
19.Aurup,H.,Siebert,A.,Benseler,F.,Williams,D.&Eckstein,F.Translationof 2′-modified mRNA in vitro and in vivo.Nucleic Acids Res.22,4963–4968(1994).
20.Choi,J.et al.2′-O-methylation in mRNA disrupts tRNA decodingduring translation elongation.Nat.Struct.Mol.Biol.25,208–216(2018).
21.A.,Tomecki,R.&Dziembowski,A.Cytoplasmic RNA decay pathways -Enzymes and mechanisms.Biochim.Biophys.Acta 1863,3125–3147(2016).
22.Eckstein,F.Phosphorothioates,essential components of therapeuticoligonucleotides.Nucleic Acid Ther.24,374–387(2014).
23.Stowell,J.A.W.et al.Reconstitution of Targeted Deadenylation bythe Ccr4-Not Complex and the YTH Domain Protein Mmi1.Cell Rep.17,1978–1989(2016).
24.Chen,J.,Chiang,Y.-C.&Denis,C.L.CCR4,a 3′-5′poly(A)RNA and ssDNAexonuclease,is the catalytic component of the cytoplasmic deadenylase.EMBOJ.21,1414–1426(2002).
25.Cerritelli,S.M.&Crouch,R.J.Ribonuclease H:the enzymes ineukaryotes.FEBS J.276,1494–1505(2009).
26.Yang,Y.-G.,Lindahl,T.&Barnes,D.E.Trex1 exonuclease degrades ssDNAto prevent chronic checkpoint activation and autoimmune disease.Cell 131,873–886(2007).
27.Takahashi,A.et al.Downregulation of cytoplasmic DNases isimplicated in cytoplasmic DNA accumulation and SASP in senescentcells.Nat.Commun.9,1249(2018).
28.Rydzik,A.M.et al.mRNA cap analogues substituted in thetetraphosphate chain with CX2:identification of O-to-CCl2 as the firstbridging modification that confers resistance to decapping without impairingtranslation.Nucleic Acids Res.45,8661–8675(2017).
29.Strenkowska,M.et al.Towards mRNA with superior translationalactivity:synthesis and properties of ARCA tetraphosphates with singlephosphorothioate modifications.New J.Chem.34,993–1007(2010).
30.Kawaguchi,D.et al.Phosphorothioate Modification of mRNAAccelerates the Rate of Translation Initiation to Provide More EfficientProtein Synthesis.Angew.Chem.Int.Ed Engl.59,17403–17407(2020).
31.Wu,J.-C.et al.Recent advances in peptide nucleic acid for cancerbionanotechnology.Acta Pharmacol.Sin.38,798–805(2017).
32.Doessing,H.&Vester,B.Locked and unlocked nucleosides in functionalnucleic acids.Molecules 16,4511–4526(2011).
33.Wang,X.et al.Three-dimensional intact-tissue sequencing of single-cell transcriptional states.Science 361,(2018).
34.Zangi,Lior,et al."Modified mRNA directs the fate of heartprogenitor cells and induces vascular regeneration after myocardialinfarction."Nature Biotechnology.31.10(2013):898.
35.Bahl,Kapil,et al."Preclinical and clinical demonstration ofimmunogenicity by mRNA vaccines against H10N8 and H7N9 influenza viruses."Molecular Therapy.25.6(2017):1316-1327.
36.Richner,Justin M.,et al."Modified mRNA vaccines protect againstZika virus infection."Cell.168.6(2017):1114-1125.
实施例5:化学修饰的mocRNA用于在哺乳动物细胞中高效表达蛋白质。
如针对SARS-CoV-2的信使RNA(mRNA)疫苗的近期临床试验和批准1,2所证明的,mRNA是传统基于蛋白质的药物的新兴且有前景的替代品。这主要是由于其可编程性、体内蛋白质的快速生产、相对低成本的制造以及同时生产多种蛋白质的潜在可扩展性3-5。然而,虽然mRNA已被证明能够在体内稳健地产生治疗性蛋白质3,6-8,但它们相对较短的寿命可能会限制其需要大量蛋白质生产的临床应用3,9。根据治疗性蛋白质的预期功能,mRNA药物的剂量和治疗持续时间可能会有几个数量级的变化。对于疫苗来说,纳克到微克范围的抗原表达可能足以引发免疫应答3。然而,对于生长因子、激素或抗体,治疗剂量的范围可以从微克到毫克,或者可能最高达克数量的蛋白质3。由于mRNA转染固有的先天免疫刺激,简单地扩大mRNA数量以实现高蛋白产量可能会导致剂量依赖性毒性3。这些因素的结合推动了对mRNA载体进行工程改造的需求,以在不增加剂量的情况下提高转基因蛋白的产量,特别是通过增强mRNA寿命和/或翻译效率。
化学修饰是增强mRNA载体性能的有效途径。通过体外转录(IVT)制备的外源mRNA由“未修饰的”腺苷(A)、鸟苷(G)、胞苷(C)和尿苷(U)组成,会强烈触发先天免疫毒性,从而抑制蛋白质表达10-12。掺入修饰的U衍生物,例如假尿苷和N1-甲基假尿苷,已被广泛用于增加翻译,特别是通过阻断Toll样受体识别来降低先天免疫毒性10-14。然而,这种策略目前限制了可用于掺入的mRNA修饰的化学空间,因为许多修饰的核苷三磷酸(NTP)不被RNA聚合酶或核糖体机制所耐受。此外,mRNA蛋白质编码区的某些化学修饰可能会导致翻译受损14-16。在不修饰编码区的情况下增加mRNA稳定性的另一种策略是在mRNA多聚(A)尾的酶促延伸过程中选择性地掺入修饰的NTP,这对细胞中的核酸外切酶特别敏感17,18。虽然有前景,但该策略依赖于多聚(A)聚合酶,该多聚(A)聚合酶又面临着有限的化学库、酶促掺入的可变效率以及多聚(A)尾长度的可变分布的生成18
为了克服上述限制,开发了基于连接的策略来有效构建信使寡核苷酸缀合的RNA(mocRNA),这是基于mRNA的表达系统,具有增强的蛋白质产生能力。在该方法中,合成的寡核苷酸(oligos)与含有模板编码的多聚(A)尾的mRNA的3’末端连接(图7A和7B)。这使得能够将化学修饰精确且模块化地编码到RNA载体中,这是使用RNA聚合酶介导的掺入不可能实现的。多聚(A)尾的缩短被认为是细胞mRNA衰变的关键步骤,并且多聚(A)尾对于帽依赖性翻译是不可或缺的19,20。因此,作为mocRNA系统的概念验证,在合成寡核苷酸中设计并测试了各种核酸酶抗性基序21以保护多聚(A)尾,与mRNA载体的替代变体相比,其表现出优异的蛋白质表达。
结果和讨论
通过连接高效合成mocRNA
为了实现体外转录(IVT)mRNA和合成寡核苷酸之间的缀合,每个寡核苷酸均设计有以下元件(图7A,表4):(1)在寡核苷酸的5’末端有5’磷酸酯和至少6个非结构化RNA核苷酸,以通过T4 RNA连接酶I与IVT mRNA的3’末端连接;(2)3’阻断基团(2’-3’-二脱氧胞苷[ddC]或反向2’-脱氧胸苷[InvdT]),以防止寡核苷酸自连接;(3)可比长度的多聚(A)区以实现翻译增强的可靠比较。寡核苷酸的3’阻断基团使得反应中的寡核苷酸有较大的摩尔过量,以确保IVT mRNA几乎100%转化为mocRNA产物(图7A和7B,表4)。
表4:用于mocRNA合成的寡核苷酸序列。
/>
RNA碱基:r_;RNA硫代磷酸酯碱基:r_*;DNA硫代磷酸酯碱基:_*;5’磷酸酯修饰:/5Phos/;2’-3’-二脱氧胞苷[ddC]修饰:/3ddC/;反向2’-脱氧胸苷[InvdT]修饰:/3InvdT/。
为了演示mocRNA表达系统,克隆了含有人源化Monster Green荧光蛋白(GFP)的质粒模板,随后是模板编码的多聚(A)尾(质粒:pCS2_GFP-60A),这确保了可翻译的具有均质聚(A)长度的mRNA。GFP编码的mRNA(GFP-60A)通过SP6聚合酶使用IVT合成,具有5’抗反向帽类似物(ARCA)并用N1-甲基假尿苷100%替换尿苷。使用T4 RNA连接酶I通过3’寡核苷酸连接将IVT mRNA进一步修饰为mocRNA。使用RNase H和靶向3’非翻译区(UTR)的DNA寡核苷酸经由序列特异性RNA切割确定缀合效率,然后凝胶电泳可解析缀合和未缀合的mRNA 3’末端。RNase H测定显示了使用前述GFP-60A mRNA的所有mocRNA构建体的几乎100%的缀合效率(图7B、12A),这表明了该缀合策略的普遍适用性。
核酸酶抗性的mocRNA增加人类细胞中的蛋白质产量和RNA稳定性
鉴于内源性去腺苷化机制是3’至5’核酸外切酶复合物,并且去腺苷化是细胞内典型RNA衰变的限速步骤,因此假设在多聚(A)尾后的3’末端引入核酸酶抗性的元件将是通过保持多聚(A)尾完整来提高RNA翻译能力的有效方法。为此,使用合成寡核苷酸(3xSrA_ddC、3xSrA_InvdT、3xSrG_InvdT和6xSr(AG),表4)合成mocRNA构建体,合成寡核苷酸含有3’末端脱腺苷酶抗性的修饰,例如硫代磷酸酯PS连接18和A-至-G取代22。将编码GFP的mocRNA构建体与E-PAP多聚(A)尾mCherry mRNA一起转染到HeLa细胞中,作为内部转染对照。使用共聚焦显微镜在转染后24hr、48hr和72hr时间点对GFP/mCherry荧光强度比进行定量。荧光定量显示了对照mocRNA构建体,其含有29nt长的多聚(A)束后接3’ddC(29rA_ddC),与模拟连接对照(用连接酶处理但没有修饰的寡核苷酸的GFP-60A mRNA)相比,增加的GFP荧光最高达69%。这种增加可能是由于多聚(A)尾的延伸以及链终止核苷酸的存在。在所有含有末端PS连接的寡核苷酸中,与测试的其他修饰的寡核苷酸相比,具有六个连续硫代磷酸酯(6xSr(AG),表4中的序列)的非结构化单链(ss)RNA寡核苷酸始终提供最高的GFP表达(24-72hr290%-377%,归一化至“模拟连接”)(图8A-8B;表6)。
表6:来自图8A的GFP/mCherry荧光比率数据的统计(归一化至“模拟连接”样品)。
鉴于PS修饰的mocRNA的成功,推测3’末端RNase抗性的DNA连接同样可以增加蛋白质翻译。与非结构化“G至C”DNA寡核苷酸对照连接相比,端粒衍生的DNA四链体(G4_telo_DNA_WT)序列显著增强了蛋白质翻译(24-72hr 150%-170%)(图8A和8B;表6)。这些结果表明,在其3’末端含有非结构化ssDNA的mocRNA可能仍然对细胞核酸酶敏感,例如ssDNA特异性的核酸酶23,24和CCR4(去腺苷酸化复合物的组成部分)(其含有一些ssDNase活性25)。另一种可能性是,如果非结构化ssDNA与mRNA序列部分互补,则它们可能会经由RNase H触发mRNA降解26。总的来说,这些结果表明,在3’末端含有结构化DNA四链体的mocRNA可以最有效地增加蛋白质表达,而非结构化ssDNA尾可以在较小程度上增强表达。
进一步探讨了PS修饰与G4二级结构相结合是否可以协同稳定mocRNA。含有六个连续PS连接的ssDNA和ssRNA G4寡核苷酸(G4_C9orf72_RNA_6xSrG、G4_C9orf72_DNA_6xSrG和G4_telo_DNA_6xSrG)导致与含有非结构化6xSr(AG)寡核苷酸的mocRNA类似的增强的翻译水平(图8A和8B;表6)。
mocRNA翻译的增强可能是由于RNA降解率降低或每个mRNA翻译效率的直接增加,而不影响mRNA降解动力学。为了验证翻译增强的机制,在转染后48小时对用各种mocRNA连接构建体转染的HeLa细胞进行RT-qPCR定量(表7)。发现相对GFP/mCherry RNA比率与每个构建体观察到的大量GFP/mCherry蛋白荧光比率密切相关(图8C,Pearson r=0.84,P=2e-4;图13B和13C),这表明了修饰的寡核苷酸主要通过稳定细胞中mRNA的数量来增强蛋白质翻译。
表7:RT-qPCR数据的统计(48hr时间点),来自图8C和16B
鉴于脂质介导的转染和内体破裂的随机性,单个细胞中转染的mRNA数量可能存在很大差异27。为了表征观察到的mocRNA翻译增强是否代表整个细胞群中翻译的普遍增加,或者是否由一小部分高表达细胞引起,对GFP/mCherry蛋白荧光的比率和RNA拷贝数在单细胞水平上进行了定量。GFP/mCherry荧光比率的单细胞荧光分析(图13A)概括了在批量测量中观察到的趋势(图8A)。使用STARmap28进一步量化转染细胞中的mRNA丰度,STARmap是一种原位转录组学方法,能够以亚细胞分辨率鉴定固定细胞或组织样品中靶mRNA序列的拷贝数(图8D、13B)。在STARmap图像中,荧光点分别对应于游离的“胞质”GFP-mocRNA或mCherrymRNA。大的细胞内颗粒可能对应于含有许多GFP-mocRNA和mCherry mRNA拷贝的脂质转染囊泡(图8D)。RT-qPCR提供了mRNA(细胞质的和转染试剂中所含的)的大量测量,而STARmap可以实现这两个信号的空间分离,从而通过滤除大聚集体中的信号来直接定量单个细胞质mRNA。重要的是,单细胞水平的胞质RNA部分的定量表明了mocRNA的稳定作用也发生在整个细胞群中(图13C和13D)。
蛋白质和RNA动力学显示细胞中mocRNA的稳定性增加
从PS+G4寡核苷酸的初始筛选中观察到的翻译可能会因不同长度的多聚(A)尾延伸(6xSr(AG)中的26个A和G4_C9orf72_RNA_6xSrG、G4_C9orf72_DNA_6xSrG和G4_telo_DNA_6xSrG中的6个A)而受到混淆,这似乎是合理的。为了直接解决这一问题,对6xSr(AG)和含有相似数量的A的重新设计的更长的PS+G4寡核苷酸进行了比较:26rA_G4_C9orf72_RNA_6xSrG、26rA_G4_C9orf72_DNA_6xSrG和26rA_G4_telo_DNA_6xSrG。HeLa表达时间过程表明,6xSr(AG)在表达增强方面优于包含26A的C9orf72寡核苷酸。然而,26rA_G4_telo_DNA_6xSrG表现出比6xSr(AG)适度的翻译增强(24-72hr之间17%-24%,图14A)。这些数据表明,特定的端粒结构可能会增加相对较低水平的额外稳定性,超出PS连接提供的稳定性。由于6xSr(AG)和26rA_G4_telo_DNA_6xSrG mocRNA之间的表达水平相似,因此在蛋白质表达的下游动力学分析中检测了这两种寡核苷酸。
为了表征不同时间点的mocRNA翻译动力学,生成了编码降解决定子标记的萤火虫萤光素酶的mocRNA。降解决定子(衍生自小鼠鸟氨酸脱羧酶的PEST29)将HeLa细胞中的萤光素酶半衰期从20.4hr减少至估计的0.92hr(图9A)。生成的萤光素酶-PEST mocRNA含有两种性能最佳的寡核苷酸6xSr(AG)和26rA_G4_telo_DNA_6xSrG中的任一种,并且mRNA转染到HeLa细胞后将发光记录为时间的函数。转染后8小时,6xSr(AG)和26rA_G4_telo_DNA_6xSrGmocRNA(编码萤光素酶降解决定子)表现出比模拟连接略高的翻译水平(信号分别高44%和39%),然而,到了48小时和72小时,两种mocRNA的表现均显著优于模拟连接,其中6xSr(AG)分别表现出10倍和15倍的信号,26rA_G4_telo_DNA_6xSrG表现出15倍和25倍的信号(图9B)。这种翻译增强不是由于样品之间转染效率的差异,因为在共转染的海肾萤光素酶mRNA内部对照的翻译中没有观察到可比较的显著差异(图14C)。与模拟连接相比,观察到的mocRNA翻译动力学与在这些时间点(启动翻译)拥有完整的多聚(A)尾的6xSr(AG)和26rA_G4_telo_DNA_6xSrG一致。此外,对mocRNA进行的体外翻译实验没有显示mocRNA和对照之间翻译效率的显著差异(图14B)。这表明增加的mocRNA蛋白表达主要归因于增强的mRNA寿命,而不是提高的翻译起始效率。
通过在转染至HeLa细胞后24、48和72小时使用STARmap进行原位mRNA可视化,进一步验证了细胞中mocRNA衰变的动力学(图9C)。将含有29rA_ddC、6xSr(AG)或26rA_G4_telo_DNA_6xSrG的GFP-60AmocRNA转染到HeLa细胞中,并随着时间的推移对相对mRNA丰度进行定量。6xSr(AG)mocRNA样品在每个时间点显示的GFP/mCherry mRNA计数比(从单细胞平均)相较于29rA_ddC高1.7-2.5倍。另外,与29rA_ddC对照相比,26rA_G4_telo_DNA_6xSrG在每个时间点具有1.7-3.1倍高的GFP/mCherry mRNA计数比(图9D)。
mocRNA优于mRNA修饰的替代策略
先前的工作报道,通过E.coli多聚(A)聚合酶(E-PAP)将PS连接整合到多聚(A)尾中可以增强mRNA稳定性18。因此,还探索了多聚(A)尾的E-PAP修饰策略。通过将XATP掺入引入到含有N1-甲基假尿苷而不是尿苷的加帽GFP mRNA上的多聚(A)加尾反应中来筛选一组化学修饰的ATP衍生物(XATP)(图15)。HeLa细胞与各种尾部修饰的GFP mRNA以及内部转染对照尾部未修饰的mCherry mRNA(100% ATP,E-PAP加尾)共转染,并在三天的时间内监测GFP/mCherry荧光比率。HeLa细胞实验的初步筛选表明,与未修饰的多聚(A)构建体相比,通过XATP掺入的多聚(A)修饰增加了归一化GFP产量,特别是对于dATP(2’-脱氧腺苷三磷酸,归一化GFP/mCherry增加了25%-62%)和S-ATP(腺苷-5’-O-(1-硫代三磷酸),增加了42%-91%)(图15)。S-ATP掺入导致GFP表达的最大增强(与之前报道的工作18一致),因此用于比较不同的mRNA修饰策略(图10A)。
经由IVT或E-PAP掺入(图10A至10C)比较由S-ATP功能化的6xSr(AG)至GFP-60AmRNA的RNA长度同质性和蛋白质产量。mocRNA和IVT修饰的构建体显示出均匀的长度分布,而E-PAP加尾的mRNA具有广泛的加尾长度分布,其中随着S-ATP掺入百分比的增加,长度变短(图10C)。使用mCherry mRNA(使用100% A的E-PAP加尾)作为内部转染对照,在HeLa细胞中转染后24、48和72小时对GFP/mCherry荧光比率进行定量。归一化至未处理的GFP-60A对照后,6xSr(AG)mocRNA在转染后的不同时间导致GFP表达的最高增强(24hr:214%±45%;48hr:289%±68%;72hr:286%±32%;平均值±s.d.)(图10D)。在所有E-PAP加尾mRNA构建体中,与未处理的GFP-60A对照相比,25% S-ATP掺入具有GFP表达的最高增强(24hr,增加93%±21%)。IVT介导的S-ATP掺入证明对于小比例的修饰的ATP是有益的(24hr,5% S-ATP:160%±7%)。与未处理的GFP-60AmRNA相比,观察到25% S-ATP下报告基因的翻译减少(54%±5%)。总体而言,mRNA尾部的不同修饰方法之间的这种系统比较证明了mocRNA的性能优于E-PAP和IVT修饰的mRNA(图10D)。
mocRNA构建体增强原代大鼠皮质神经元培养物中的蛋白质表达
神经元是多种大脑和神经系统相关疾病的主要治疗靶点30,31。虽然化学/脂质介导的DNA质粒转染在有丝分裂后细胞(例如神经元)中表现出有限的表达效率,但mRNA转染是在神经元中高效引入转基因蛋白表达的替代方法32。为了探索mocRNA是否可以增加原代细胞培养物中的蛋白质产量,在大鼠皮层神经元的原代培养物中测试了修饰的构建体。
将由6xSr(AG)寡核苷酸制备的GFP mocRNA和未连接的对照与mCherry mRNA(使用100%rA的E-PAP加尾,转染对照)共转染以在转染后24小时和48小时进行比较(图11A)。与未连接的GFP样品相比,6xSr(AG)mocRNA样品的GFP表达在两个时间点(24小时:1015±190%;48小时:1061±210)显示出高一个数量级的表达(图11A-11B,表8)。这些结果表明,与传统的mRNA载体相比,mocRNA可以显著增强神经元细胞培养物中的蛋白质表达。
表8:来自图11A的GFP/mCherry荧光比率数据的统计(归一化至“模拟连接”样品)。
24小时数据 仅mCherry 未处理的mRNA 6xSr(AG)
Mean 0.24 1.00 10.15
s.d. 0.19 0.19 1.90
s.e.m. 0.04 0.04 0.45
样品大小 12 12 12
48hr数据 仅mCherry 未处理的mRNA 6xSr(AG)
平均数 0.47 1.00 10.61
s.d. 0.32 0.26 2.10
s.e.m. 0.07 0.06 0.49
样品大小 12 12 12
s.d.:标准差;s.e.m:平均值的标准误差。
mocRNA保留与治疗性mRNA相似的毒性特征
未修饰的IVT mRNA在转染后会引发强烈的免疫应答,从而抑制其蛋白质产生10-12。虽然在治疗性mRNA(和mocRNA)制剂中使用了N1-甲基假尿苷100%替换尿苷以最小化免疫毒性12,但进一步评估了通过合成寡核苷酸将链终止核苷酸、PS连接或共价DNA-RNA键引入mocRNA是否会引发额外的细胞毒性。首先,根据图8中显示的成像数据对细胞数量进行量化,以检查细胞增殖和活力是否大幅下降。在任何mocRNA条件和未连接的mRNA对照之间没有观察到HeLa细胞数量的显著减少(图16A)。另外,通过RT-qPCR测量如图8所示的转染后48小时样品上的IFNB1 mRNA来测量HeLa细胞中的先天免疫刺激。IFNB1上调是RIG-I和MDA5激活的结果,它们是识别外来RNA种类的先天免疫传感器33-35。与29rA_ddC mocRNA对照(Welch的t检验)相比,未修饰的GFP mRNA (100%尿苷)和多聚(I:C)转染(有效的RIG-I激动剂36)的阳性对照诱导了统计学上显著的IFNB1 mRNA上调。然而,在任何mocRNA、未连接的mRNA和仅转染的对照之间没有观察到显著差异(图16B)。这些结果表明,mocRNA本身并不会增加未经处理的mRNA之外的先天免疫应答,至少对于本研究中探索的构建体来说是这样。
最后,使用活-死细胞染色在转染的大鼠皮质神经元培养物上来分析神经元中mocRNA介导的毒性(使用Hoechst染色和NucRed Dead 647)。计算每种培养条件中的死亡神经元的百分比,以测试mocRNA和常规mRNA转染之间的细胞毒性中的差异。如与转染对照相比,未观察到由6xSr(AG)连接引起的神经元毒性中的显著差异(图16C)。总而言之,这些结果表明,本研究中鉴定的修饰基本上没有改变所测试的细胞培养物中的mRNA的毒性特征。
总结和结论
现有的利用多聚(A)聚合酶来合成化学修饰的多聚(A)尾的方法通常导致宽的尾部长度分布,这可能使批次间的同质性变得复杂,并且无法精确控制修饰位点。相比之下,mocRNA合成证明了接近100%的产量,并且可以完全保持mRNA同质性,这使其与现有的mRNA治疗药物的开发的流程兼容。更重要的是,mocRNA表达系统可以引入无法由RNA聚合酶掺入的化学修饰,并能够精确控制修饰位点,以最大化RNA修饰的效果。作为第一个证明,在3’末端具有成簇的核酸酶抗性基序的mocRNA通过保护mRNA载体的多聚(A)尾部来增强蛋白质表达。荧光蛋白测量表明,含有3’末端PS连接的mocRNA将人HeLa细胞系中的蛋白产量增加了2-4的系数(图8A),并在原代大鼠皮质神经元培养物中增加了10倍(图11A)。结合批量RT-qPCR测量和单细胞分辨的原位STARmap测量表明,含有3’末端PS修饰和特定端粒序列的mocRNA主要通过稳定RNA来改善蛋白质表达(图8A、14A)37。这些mocRNA构建体比现有的依赖于IVT和聚腺苷酸化期间随机掺入修饰的NTP的mRNA载体变体具有更高的翻译能力14,15,18(图10D)。
总之,开发了模块化、可编程且有效的合成mocRNA的策略,其能够对RNA载体进行多样化和精确的化学修饰,以增强蛋白质翻译能力和RNA稳定性。mocRNA可以与其他类型的修饰策略,诸如多聚(A)结合蛋白(PABP)结合性寡核苷酸(参见,例如Barragan-Iglesias,et al.Nat Commun,9(1):10)38、水解-抗性的7-甲基鸟苷5’帽39,40、修饰的5’UTR区域41以及mRNA体中其他类型的修饰核苷酸42潜在地进行组合。mocRNA设计可以充当整合有机合成与酶促合成的通用平台,以使化学部分多样化并增强基于RNA的蛋白质表达系统的功能功效。
方法
质粒克隆、表征和纯化
hMGFP和mCherry编码质粒(分别为pCS2_hMGFP和pCS2_mCherry)获自Xiao Wang。这些质粒(按顺序)含有SP6启动子序列、5’UTR、荧光蛋白编码序列(CDS)、3’UTR和NotI限制性酶切位点。序列可以在原始参考文献43中找到。
定点诱变试剂盒(NEB:E0554S)用于使用含有位点特异性修饰的引物(表4)对模板质粒进行PCR。随后进行KLD酶处理,然后转化至NEB Stabl细胞(NEB:C3040H)中,以使用ZymoPURE质粒miniprep试剂盒进行分离,并通过Genewiz进行Sanger测序。
为了在Esp3I位点前面位点特异性地安装60xA模板编码的多聚(A)尾,使用Q5定点诱变进行了两轮连续克隆。第一轮克隆在前一个NotI限制位点的5’处安装了Esp3I限制位点((Esp3i_insert_F和Esp3i_insert_R)。将所得的经Sanger测序验证的质粒用作安装60xA多聚(A)尾的模板(60A_insert_F和60A_insert_R)。使用Sanger测序验证从第二轮克隆中选择的克隆。引物序列见补充表4。在Esp3I位点之前含有约60nt长模板编码的尾部的构建体的名称是pCS2_hMGFP-60A。
首先,通过使用PCR从pCS2_hMGFP-60A载体缺失hMGFP编码区来生成萤火虫萤光素酶构建体。接下来,从pmirGLO双萤光素酶miRNA靶标表达载体(Promega:E1330)PCR扩增萤火虫萤光素酶构建体,其中PCR引物经设计以含有与感兴趣的载体互补的15-20个核苷酸互补突出区。使用NEBuilder HiFi DNAAssembly Master Mix(NEB:E2621S),将质粒和插入物组装,转化到Stabl细胞中,并通过Sanger测序进行序列验证。除了使用来自pmirGLO载体的海肾萤光素酶编码序列,海肾萤光素酶构建体通过类似于萤火虫萤光素酶的过程进行克隆。
不稳定的萤火虫萤光素酶构建体(即萤火虫-PEST)含有衍生自小鼠鸟氨酸脱羧酶的降解决定子29。上述萤火虫萤光素酶载体在终止密码子周围进行PCR线性化,使用NEBuilder HiFi方法将编码PEST序列的GeneBlock(IDT,人密码子优化的)插入其中。
mRNA合成和表征
GFP mRNA从pCS2_hMGFP-60A质粒合成,该质粒含有SP6启动子,随后是hMGFPCDS和模板编码的多聚(A)尾。质粒通过位于紧邻多聚(A)区的3’的单个Esp3I位点进行线性化,该位点在克隆期间进行安装。然后使用来自Zymo Research的DNAClean&Concentrator-25试剂盒(D4033)纯化线性化质粒,并经由琼脂糖凝胶电泳检查纯度。使用mMESSAGE mMACHINETMSP6转录试剂盒(ThermoFisher Scientific:AM1340)中的SP6酶和反应缓冲液制备加帽、修饰的mRNA。试剂盒提供的2X NTP/Cap溶液替换为2X NTP/Cap制剂,该制剂含有:10mM ATP(NEB:N0451AVIAL)、10mM CTP(NEB:N0454AVIAL)、2mM GTP(NEB:N0452AVIAL)、8mM 3’-O-Me-m7G(5’)ppp(5’)G RNA帽结构类似物(NEB:S1411S)和10mM N1-甲基假尿苷-5’-三磷酸(TriLink Biotechnologies:N-1081-1)。添加Superase-In RNase抑制剂(ThermoFisherScientific:AM2694)至终浓度为1:20(v/v)。IVT反应组装并在37℃下孵育2-4小时后,用1-2μl TURBO DNase(以AM1340提供)在37℃下处理反应1hr,然后使用MEGAclearTM转录Clean-Up试剂盒(ThermoFisher Scientific:AM1908)进行反应纯化。将Superase-In RNase抑制剂添加到纯化的mRNA样品中至终浓度为1:50(v/v),并将样品保存在-80℃下进行长期保存。在连接前通过Nanodrop测量纯化的mRNA以估计浓度,并在转染之前立即使用Qubit RNAHS测定(ThermoFisher Scientific:Q32852)测量mRNA进行归一化,以进行基于细胞的测试。
为了制备多聚(A)聚合酶加尾的mRNA(图15),通过使用NotI-HF(NEB:R3189S)对pCS2_hMGFP和pCS2_mCherry质粒进行线性化来生成dsDNA模板,并使用Zymo DNA Clean&Concentrator-25对消化产物进行柱纯化。使用上述方案进行体外转录,除了在TURBODNase消化后,还包括使用E-PAP多聚(A)加尾试剂盒(ThermoFisher Scientific:AM1350)进行多聚(A)加尾的额外步骤。mRNA的纯化和储存如上所述(例如,使用MEGAclear转录cleanup试剂盒)。
对于图10,使用对上面列出的方案进行修改的方案合成了腺苷-5’-O-(1-硫代三磷酸)掺入的mRNA。腺苷-5’-O-(1-硫代三磷酸)(S-ATP)用于共转录掺入实验。当使用先前已经打开的储存管时,观察到S-ATP掺入的性质差异,这可能是由于氧化。因此,在每次加尾实验之前都使用新管,以限制可能的氧化作为这些实验中的混杂因素的影响。使用与以上所列相同的设置进行S-ATP体外转录反应,但反应中最终的5mM ATP替换为4.75mM ATP+0.25mM S-ATP(5% S-ATP掺入)或3.75mM ATP+1.25mM S-ATP(25% S-ATP)。使用含有GFP编码序列和60xA模板编码的多聚(A)尾的IVT模板。
修饰的E.coli多聚(A)聚合酶加尾
对于图15中的修饰的E-PAP加尾实验,底物是从NotI-HF线性化pCS2_hMGFP模板上的IVT生成的无尾GFPmRNA(参见以上IVT方案)。该方案利用来自E-PAP多聚(A)加尾试剂盒(ThermoFisher Scientific:AM1350)的酶和缓冲液。为每个修饰的ATP掺入制备“总10mM”ATP储备液,以便特定百分比的ATP被修饰的ATP衍生物(XATP)取代。例如,25%dATP样品需要组装2.5mM dATP、7.5mM ATP储备液。加尾反应组装如下:1.5μg的无尾GFP mRNA;5μl的5XE-PAP缓冲液;2.5μl的10mM XATP:ATP储备液(每个样品不同);2.5μl的25mM MnCl2;1μl的Superase-In RNase抑制剂;1μl的E-PAP酶;和最高达25μl的总体积的无核酸酶水。反应在37℃下孵育1小时,然后添加0.5μl 500mM EDTA淬灭。然后使用Monarch RNA cleanup试剂盒(50μg)(NEB:T2040S)对这些带尾的mRNA进行柱纯化。将Superase-In RNase抑制剂添加到纯化的mRNA中至1:50(v/v)的最终稀释度,并在转染前将mRNA储存于-80℃。
以下修饰的ATP衍生物(XATP)用于聚腺苷酸化实验:腺苷5’-三磷酸(ATP)(NEB:P0756S);N6-甲基腺苷-5’-三磷酸(m6A)(TriLink Biotechnologies:N-1013-1);2’-O-甲基腺苷-5’-三磷酸(TriLink Biotechnologies:N-1015-1);腺苷-5’-O-(1-硫代三磷酸)(TriLink Biotechnologies:N-8005-1);dATP溶液(NEB:N0440S);2’-氨基-2’-脱氧腺苷-5’-三磷酸(TriLink Biotechnologies:N-1046-1)。
对于图10所示的修饰的E-PAP加尾(方法比较),使用含有模板编码的60A尾部的hMGFP编码mRNA进行E-PAP加尾(与图15相反)。腺苷-5’-O-(1-硫代三磷酸)(S-ATP)用于共转录或修饰的多聚(A)加尾实验。当使用先前已经打开的储存管时,观察到S-ATP掺入的性质差异,这可能是由于氧化。因此,在每次加尾实验之前都使用新管,以限制可能的氧化作为这些实验中的混杂因素的影响。除此之外,EPAP加尾反应(使用S-ATP掺入)与上述方案一致地进行设置。
修饰的寡核苷酸3’末端连接
使用T4 RNA连接酶I(Promega:M1051)进行连接反应。反应组装如下:2μg的GFPmRNA;200pmol的合成寡核苷酸;2μl的Superase-In RNase抑制剂;20μl的50% PEG-8000;5μl的100% DMSO;5μl的10X T4 RNA连接酶缓冲液;5-7.5μl的T4 RNA连接酶(Promega);和至50μl的总反应体积的无核酸酶水。将反应物在37℃下孵育30分钟,然后经由添加1μl的500mM EDTA,pH 8.0灭活反应物。通过添加1体积(例如50μl)的无核酸酶水来稀释反应物,然后添加0.5体积(例如25μl)的含有1μl Superase-In的AMPure XP(Beckman Coulter:A63880)。根据制造商的方案纯化反应物,并使用含有Superase-In的无核酸酶水以1:50(v/v)的比例从AMPure珠子中洗脱mRNA。使用AMPureXP珠子对凝胶上似乎含有残留寡核苷酸的mRNA样品进行第二次纯化。
对于根据基于RNase H凝胶测定的不完全的连接,使用修改的条件进行连接,其中从反应中省略DMSO。这通常会导致更有效的连接。对于图9至11中所示的连接制备的样品,使用修改后的方案进行连接,因为这通常更有效。对于萤火虫萤光素酶和萤火虫PEST mRNA连接,使用2x系列Ampure XP珠子clean-up、使用1:1的珠子体积与mRNA体积进行纯化。例如,使用50μl的Ampure XP珠子清理50μl连接反应液。洗脱产物mRNA后,使用与洗脱的mRNA产物等体积的珠子进行第二次清理。
RNase H测定
在RNaseH测定之前,将氯化钾(KCl)储备液用于将ssDNA寡核苷酸退火至mRNA。退火储备液含有:50mM KCl、2.5mM EDTA、1:200(v/v)Superase-In RNase抑制剂,使用无核酸酶水调至最终体积。ssDNA探针(RNaseH_probe_GFP)从Integrated DNA Technologies(IDT)订购。序列列于表5中。
表5:用于克隆、RT-qPCR、RNase H测定和STARmap表征的寡核苷酸。
/>
/>
制备以下反应以使mRNA退火至上述ssDNA探针:200ng的纯化的mRNA样品(连接的或未连接的);2pmol的RNaseH_probe_GFP;2μl的退火储备液(50mM KCl、2.5mM EDTA、1:200Superase-In);和最高达10μl总体积的无核酸酶水。反应物在70℃下变性5分钟,然后在台式热循环仪中以0.2℃/sec的速率冷却至室温。探针退火后,向每个反应中添加1μl耐热RNase H(NEB:M0523S)和1μl的10X缓冲液,其在50℃下孵育30分钟。反应孵育后,通过添加1μl蛋白酶K(ThermoFisher Scientific:25530049)消化样品,并在室温下孵育5分钟。随后,将样品与1体积的凝胶上样缓冲液II(ThermoFisher Scientific:AM8546G)混合,其中已补充EDTA至终50mM的浓度。在6% NovexTM TBE-尿素凝胶上进行上样和解析前,1X上样缓冲液中的样品在70℃下变性3-5分钟,在1x Tris-硼酸盐-EDTA(TBE)缓冲液中运行。用于凝胶的梯子是Century-Plus RNA标记(ThermoFisher Scientific:AM7145)。所有凝胶均用1xSYBR金(ThermoFisher Scientific:S11494)在1xTBE缓冲液中染色5-15分钟,然后使用BioRad ChemiDoc MP成像系统(12003154)或MP成像仪(Universal Hood III)进行可视化,并使用相应的Image Lab软件导出图像。
哺乳动物细胞培养和mRNA转染
HeLa细胞(CCL-2、ATCC)在37℃、5% CO2培养箱中维持在含有10%FBS的DMEM培养基(ThermoFisher 11995)中,并每3天以1:8的比例传代。定期通过Hoechst染色和显微镜成像确认细胞培养物没有支原体污染。
在mRNA转染前一天,将细胞以75%汇合度接种到12孔板的各个孔中。第二天,使用3μL LipofectamineTM MessengerMAXTM转染试剂(ThermoFisher,LMRNA003)将500ngmCherry(内部对照)mRNA和500ng带有合成尾部的或其他修饰的GFP mRNA(浓度由Qubit测定)转染到每个孔中。还包括仅含有mCherry mRNA、或仅含有转染试剂、或仅含有未转染细胞的其他对照。孵育6小时后,除去lipofectamine/mRNA转染混合物,用DPBS冲洗细胞一次,并用胰蛋白酶消化,以按6:4:3的比例重新接种到三个玻璃底24孔板中(MatTek,P24G-1.5-13-F,聚-D-赖氨酸包被),分别用于转染后24小时、48小时和72小时的荧光蛋白定量。
新鲜解离的大鼠原代皮质神经元由Broad研究所Sheng Lab惠赠。简而言之,大鼠皮质神经元培养物是从CO2安乐死的怀孕Sprague Dawley大鼠(Charles RiverLaboratories)的18天胚胎(E18)胚胎中制备的。在补充有100U/mL青霉素/链霉素(Gibco,15140-122)的冰冷Hank’s平衡盐溶液(HBSS,Gibco,14175-095)中解剖胚胎皮质。用4℃PBS(Sigma,D8537)洗涤皮质组织3次,在37℃下,在0.25%胰蛋白酶-EDTA(Gibco,25200-056)中消化20分钟,并然后用室温PBS再次洗涤3次。将皮质组织在37℃ NBActiv4培养基(Brainbits,NB4-500)中轻轻解离,并以300xg离心5分钟。将沉淀重悬在新鲜的NBActiv4中并通过70μm过滤器(Corning,352350)。
神经元以1×105/cm2的密度接种在聚D-赖氨酸包被(Sigma,A-003-E,50μg/mL,在室温下至少包被一小时,然后用无菌蒸馏H2O冲洗3次并空气干燥)的24孔玻璃底板(MatTek,P24G-1.5-13-F)上的0.5mL NbActiv4培养基中,并每四天更换一半培养基。在5DIV上,用与1.5μL LipofectamineTM MessengerMAXTM转染试剂(ThermoFisher,LMRNA003)混合的250ng mCherry(内部对照)mRNA和250ng带有合成尾部的GFP mRNA (浓度由Qubit测定)转染24孔板中的神经元。将神经元与转染混合物一起孵育2小时,然后换回正常培养基(一半旧的,一半新鲜的)。大鼠神经元培养程序经Broad Institutional Animal Care andUse Committee审查并批准使用。所有涉及动物的程序均符合美国国立卫生研究院实验动物护理和使用指南。
荧光蛋白的共焦成像和定量
在荧光蛋白成像之前,除去培养基,并用DPBS冲洗细胞一次,然后在细胞核染色培养基(含有1:2000稀释的Hoechst 33342[ThermoFisher,62249]的FluoroBriteTM DMEM[ThermoFisher,A1896701])中于37℃孵育10分钟。
对于HeLa细胞,细胞核(Hoechst)、GFP和mCherry的共焦图像通过LeicaStellaris 8用10X空气物镜以900nm×900nm的像素尺寸拍摄。每个孔取四个代表性视野,每个象限一个。对于神经元,细胞核(Hoechst)、GFP和mCherry的共焦图像堆栈通过LeicaStellaris8用25X水浸物镜以450nm*450nm的像素尺寸、1μm的步长拍摄了9步。每个孔取六个代表性视野(图11)。对于神经元中的毒性测量,在成像前将NucRedDead647(Invitrogen:R37113)添加到Fluorobrite染色培养基中,并使用相应的通道获得死细胞细胞核的图像。所有要比较的样品都使用相同的成像设置。激发/检测波长如下:Hoechst:二极管405nm/~[430-480]nm;GFP:WLL 489nm/~[500-576]nm;mCherry:WLL 587nm/~[602-676]nm。将CellProfiler 4.0.744用于计算Hoechst(例如,细胞核的总数)与NucRed Dead通道(例如,死细胞核)中的对象数量,以得出每个视野中死亡神经元的分数。
对于培养神经元的批量分析(图8A),首先,测量每个图像中的mCherry强度和GFP强度。将“仅转染”样品中mCherry通道和GFP通道中的平均荧光信号视为背景信号。从每个图中减去背景信号。最后,计算出每幅图像中的GFP强度和mCherry强度之间的比率。并去除通过GraphPad Prism 9确定的每个样品中的异常值。计算所有“未处理的mRNA”样品中的GFP强度和mCherry强度之间的比率平均值,并将其归一化为1。
对原始图像堆栈的最大投影图像进行分析。将CellProfiler 4.0.7用于单细胞蛋白定量(图13A)。对于HeLa细胞中的单细胞分析,首先,将Hoechst染色的细胞核鉴定为主要对象。然后,将Hoechst通道、mCherry通道和GFP通道合并并随后转换为灰度图像。将细胞鉴定为该灰度图像上的次要对象。在细胞分割后,测量每个细胞中的mCherry强度和GFP强度。最后,计算出每个细胞中的GFP强度和mCherry强度之间的比率。为了消除批次效应,计算了不同批次中所有“模拟连接”样品中的GFP强度和mCherry强度之间的平均比率,并将其归一化为1。假设所有“模拟连接”样品中的GFP强度和mCherry强度之间的平均比率是相同的。将含有与对照样品(仅转染试剂的或未转染的细胞)的强度相似的强度的细胞认为是转染不成功的,并因此从该分析中将其排除。
萤火虫萤光素酶降解决定子表征
使用上述用于GFPmRNA转染的方案,用萤火虫-60A或萤火虫-降解决定子-60AmRNA转染HeLa细胞。对于萤光素酶衰变测量,使细胞生长24小时,然后将其转移到含有100ug/mL放线菌酮(CHX)的培养基中以停止翻译。在CHX添加后的不同时间点,裂解细胞并使用Promega Dual-Glo萤光素酶测定系统(Promega:E2920)测量其萤光素梅活性。对于萤光素酶降解决定子mocRNA时间进程,如前所述生成mocRNA。将250ng萤火虫-PEST mocRNA与250ng海肾萤光素酶mRNA (E-PAP加尾)共转染到24孔板中的HeLa细胞中以作为内部对照。转染后六小时,将细胞重新接种到4个单独的不透明白色板中,用于按照规定在不同的时间点进行裂解。
对于体外翻译实验,将100ng的每种萤火虫-PEST mocRNA与200ng海肾mRNA(E-PAP加尾)混合以充当内部对照。将这些在65℃下变性5分钟,放在冰上,并将其加入,以作为50μl兔网织红细胞裂解反应(Promega:L4960)的模板,将其根据制造商的方案组装和孵育。孵育1.5hr后,将2μl每个反应稀释在20μl 1xPBS中,并使用Promega Dual-Glo测定进行测量。对于每个测试的条件,对三个生物学重复中的每个进行三个技术重复。
RNA分离和cDNA制备
将HeLa细胞在12孔塑料板上接种至约75%汇合度,并使用前述方案用mRNA进行转染。为了制备阳性对照,使用3μl Lipofectamine MessengerMax(Thermo FisherScientific)将200ng多聚(I:C)、500ng多聚(I:C)(InvivoGen:tlrl-picw)或500ng未修饰的GFP mRNA (含有用尿苷对N1-甲基假尿苷进行的100%替代,并使用100%rATP对E-PAPpoly(A)进行加尾)转染到细胞中。转染和细胞重新接种后,在转染后48小时收集细胞,去除培养基,并将350μl Trizol移液至每孔中,用于在-80℃下储存RNA。从pCS2_hMGFP模板制备未修饰的GFP mRNA,该模板不包含60A模板编码的尾部。未修饰的GFP mRNA含有100% UTP而不是N1-甲基假尿苷,并使用E-PAP加尾进行多聚(A)加尾。
根据制造商的方案,使用Direct-zol RNA Miniprep试剂盒(Zymo Research:R2051)从Trizol保存的样品中提取总RNA。还根据制造商的方案进行任选的DNase消化。然后使用RNAClean&Concentrator-5(Zymo Research:R1013)浓缩并在含有1:100Superase-In的无核酸酶水中洗脱。然后使用Nanodrop对RNA进行定量,然后将其储存在-80℃下。
使用SuperScript IV逆转录酶(ThermoFisher Scientific:18090200)逆转录总RNA。将500ng总RNA与1μl的随机引物混合物(NEB:S1330S)混合并加至13μl的总体积。将该混合物在65℃下加热5分钟,然后在下一步的反应组装期间立即置于冰上。然后将以下试剂和体积添加到该13μl的退火混合物中:4μl的5X SSIV反应缓冲液;1μl(最终0.5mM)的10mMdNTP混合物(ThermoFisher Scientific:18427013);1μl的100mM DTT;0.5μl的SuperaseRNase-In;和1μl的SuperScript IV RT酶(200U/μl)。
混合反应物,然后将其在23℃孵育10分钟,随后在50℃孵育10分钟,并通过在80℃孵育10分钟终止。保存一部分选定的cDNA反应物,以用作校准/稀释曲线的标准品。然而,对于待通过RT-qPCR定量的所有样品,通过添加无核酸酶水从这些cDNA反应物制备5x稀释液,并在使用前储存在-80℃。
RT-qPCR
RT-qPCR在透明的LightCycler 384孔板(Roche:04729749001)中,使用PowerSYBR Green PCR Master Mix(ThermoFisher Scientific:4367659)进行。每个反应含有1μl的cDNA模板(此前稀释5倍);正向和反向引物(序列见表5)各500nM(终浓度);和10μl的2xPower SYBR Green Master Mix。在Bio-Rad CFX384 Touch实时PCR检测系统上处理之前,将反应总体积加到最高20μl。用于hMGFP、mCherry和hActb的循环设置为:95℃ 10分钟(x1);95℃ 10秒,60℃ 30秒,[板读数](x40),然后进行熔解曲线分析(65.0℃至95.0℃,增量0.5℃+[板读数])。对于IFNB1 qPCR,使用的循环设置为:95℃ 10分钟(x1);95℃ 10秒,57℃ 15秒,60℃ 30秒,[板读数](x40),然后进行熔解曲线分析(65.0℃至95.0℃,增量0.5℃+[板读数])。
使用相对定量方法计算相对mRNA数量,该方法需要标准曲线。选择“阳性对照”样品作为标准品,并进行2倍稀释系列以产生标准曲线,从中计算出每个测量的基因的反应效率(E)(使用双对数刻度上的线性拟合)。对于GFP和mCherry定量,选择对应于未连接的GFP-60mRNA +mCherry转染的生物学重复之一的cDNA储备液作为标准品。对于IFNB1定量,使用500ng多聚(I:C)转染条件的生物学重复之一作为标准品。对于hActb定量,使用“仅转染条件”样品之一的cDNA作为标准品。为了确保未知样品的所有cDNA测量结果将在由标准曲线确定的线性的范围内,所有cDNA储备液在通过RT-qPCR测量之前均稀释5倍(如前所述)。
对标准曲线进行线性拟合(每个稀释3次技术重复)后,计算了PCR反应效率(GFP:2.05;mCherry:2.24;IFNB1:2.11;hActb:2.09)。每个待测cDNA样品进行3次技术重复,对技术重复Cq值进行平均,以获得每个生物学重复对应的值。为了对特定样品(例如,“模拟连接”)进行归一化,对归一化标准品的生物学重复的Cq值进行平均以给出“标准Cq”。然后,从该“标准Cq”中减去每个测试样品的Cq值,以给出dCq值。反应效率(E)提高到这些dCq值的幂,以给出每个生物测试样品的个体“倍数变化”。为了通过mCherry和hActb两者来归一化GFP,对此前计算的mCherry和hActb“倍数变化”取几何平均值。然后将GFP“倍数变化”除以这些归一化因子,以产生用于GFP定量的最终值(图8C,表7)。对于IFNB1的归一化,直接(不进行几何平均值计算)使用每个样品的hActb值(表7)。每个图中显示的数据点对应于对每个生物学重复进行的三次技术重复的平均值。当特定条件的阴性对照(例如,N.T.C.和仅转染)不产生Cq值时,将其从计算中省略。
使用STARmap的转染细胞培养物中的mRNA定量
使用STARmap28在转染细胞中测量mCherry和GFPmRNA数量,STARmap是将单个mRNA分子读出为带条形码的DNA集落(colony)的基于成像的方法。遵循已公布的用于细胞培养的STARmap程序28。简而言之,在荧光蛋白成像后,将细胞用1.6%PFA PFA (ElectronMicroscope Sciences,15710-S)/1XPBS(Gibco,10010-023)在室温下固定10分钟,然后在下一个步骤之前,在-20℃用预冷的甲醇进一步固定和透化(最多一周)。随后,除去甲醇,并用PBSSTR/甘氨酸/tRNA(含0.1%Tween-20[TEKNOVAINC,100216-360]、0.5%SUPERaseIn[InvitrogenTM,AM2696]、100mM甘氨酸、1%酵母tRNA的PBS)在室温下将细胞再水化15分钟,然后用PBSTR洗涤一次。然后在40℃下,将样品与靶向mCherry和GFP mRNA序列的SNAIL探针在杂交缓冲液(2XSSC[Sigma-Aldrich,S6639]、10%甲酰胺[Calbiochem,655206]、1%Tween-20、20mM RVC[Ribonucleoside vanadyl complex,New England Biolabs,S1402S]、0.5% SUPERaseIn、1%酵母tRNA、每个探针100nM)中杂交过夜(“SNAIL探针”序列参见表5)。然后在37℃下用PBSTR洗涤细胞两次(每次洗涤20分钟),并在37℃下用高盐洗涤缓冲液(含4XSSC的PBSTR)洗涤细胞一次,然后在室温下用PBSTR漂洗一次。连接反应在室温下进行2小时,以环化与引物相邻的挂锁探针。用PBSTR洗涤两次后,使用Phi29(ThermoFisher,EP0094)在30℃下从引物开始滚环扩增,并掺入氨基dUTP(InvitrogenTM,AM8439),持续2小时。在用PBSTR洗涤两次后,通过PBST缓冲液中的20mM MA-NHS在室温下2小时修饰DNA扩增子以使其可聚合。然后将样品转化为水凝胶-细胞杂交体,然后用蛋白酶K(InvitrogenTM,25530049)在室温下清除荧光蛋白过夜。将样品用PBST洗涤3次,然后用洗涤和成像缓冲液(2XSSC,10%甲酰胺)中的荧光检测寡核苷酸在37℃下染色1hr(“荧光检测探针”序列,参见表5)。最后,在室温下用洗涤和成像缓冲液洗涤样品3次,并用DAPI染色,然后在洗涤和成像缓冲液中成像。共焦成像堆栈由LeicaStellaris8或SP8用40X油镜在283nm*283nm像素尺寸下拍摄。14μm堆栈以1μm/步*15步进行成像。每个孔取四个代表性视野,每个象限一个。所有要比较的样品都使用相同的成像设置。激发/检测波长如下:DAPI:二极管405nm/~[420-489]nm;Alexa546:WLL 557nm/~[569-612]nm;Alexa647:WLL 653nm/~[668-738]nm。
使用MATLAB 2021a和CellProfiler 4.0.7进行基于扩增子计数的STARmap荧光图像分析(图8C)。首先,通过寻找图像上的扩展最大值来鉴定每个荧光通道(GFP、mCherry)中扩增子的质心(centroid)。然后定义以每个荧光点的质心为中心的3*3*3体素体积。在每个体素体积内,计算mCherry和GFP通道中的积分强度,并使用mCherry强度和GFP强度之间的比率进行扩增子分类。在已经对一批中的所有图像进行了这些测量后,将所有测量结果合并在一起,并绘制log(mCherry/GFP)值的分布。将分布图上的最低点(局部最小值)处的相应比率值确定为截止值。第一个小于0的截止值记为截止1,第一个大于0的截止值记为截止2。将具有小于截止1的log(mCherry/GFP)值的任何扩增子鉴定为GFP扩增子。将具有大于截止2的log(mCherry/GFP)值的任何扩增子鉴定为mCherry扩增子。将具有截止1和截止2之间的log(mCherry/GFP)值的任何扩增子鉴定为颗粒。扩增子分类信息以及每个扩增子的位置保存在文件中。在批量STARmap定量中,在每张图中,计算GFP扩增子的数量与mCherry扩增子的数量之间的比率,并将其用于反映GFP mRNA的量。在单细胞STARmap定量中,使用与单细胞蛋白质定量中的细胞分割相同的方法进行细胞分割,并将分割掩膜保存为uint16图像。根据扩增子在掩膜上位于何处将其分配给细胞。计算每个细胞中的GFP扩增子的数量与mCherry扩增子的数量之间的比率,并将其用于反映单个细胞中GFP mRNA的量。将没有GFP扩增子或没有mCherry扩增子的细胞考虑为转染不成功的,并因此将其排除在这些分析之外。
参考文献
1.Polack,F.P.,Thomas,S.J.,Kitchin,N.,Absalon,J.,Gurtman,A.,Lockhart,S.,Perez,J.L.,Pérez,M.G.,Moreira,E.D.,Zerbini,C.,et al.(2020)Safety andEfficacy of the BNT162b2 mRNA Covid-19 Vaccine.N.Engl.J.Med.383,2603–2615.
2.Lombardi,A.,Bozzi,G.,Ungaro,R.,Villa,S.,Castelli,V.,Mangioni,D.,Muscatello,A.,Gori,A.,and Bandera,A.(2021)Mini Review ImmunologicalConsequences of Immunization With COVID-19 mRNA Vaccines:PreliminaryResults.Front.Immunol.12,657711.
3.Sahin,U.,Karikó,K.,and Türeci,(2014)mRNA-based therapeutics--developing a new class of drugs.Nat.Rev.Drug Discov.13,759–780.
4.Dammes,N.,and Peer,D.Paving the Road for RNA Therapeutics.(2020)Trends Pharmacol.Sci.41,755–775.
5.Weng,Y.,Li,C.,Yang,T.,Hu,B.,Zhang,M.,Guo,S.,Xiao,H.,Liang,X.J.andHuang,Y.(2020)The challenge and prospect of mRNA therapeuticslandscape.Biotechnol.Adv.40,107534.
6.Petsch,B.,Schnee,M.,Vogel,A.B.,Lange,E.,Hoffmann,B.,Voss,D.,Schlake,T.,Thess,A.,Kallen,K.J.,Stitz,L.,et al.(2012)Protective efficacy ofin vitro synthesized,specific mRNA vaccines against influenza A virusinfection.Nat.Biotechnol.30,1210–1216.
7.Richner,J.M.,Jagger,B.W.,Shan,C.,Fontes,C.R.,Dowd,K.A.,Cao,B.,Himansu,S.,Caine,E.A.,Nunes,B.T.D.,Medeiros,D.B.A.,et al.(2017)VaccineMediated Protection Against Zika Virus-Induced Congenital Disease.Cell 170,273–283.e12.
8.Tai,W.,Zhang,X.,Drelich,A.,Shi,J.,Hsu,J.C.,Luchsinger,L.,Hillyer,C.D.,Tseng,C.T.K.,Jiang,S.and Du,L.(2020)A novel receptor-binding domain(RBD)-based mRNA vaccine against SARS-CoV-2.Cell Res.30,932–935.
9.Chen,C.,Ezzeddine,N.,and Shyu,A.(2008)Messenger RNA half-lifemeasurements in mammalian cells.Methods Enzymol.448,335–357.
10.Karikó,K.,Muramatsu,H.,Welsh,F.A.,Ludwig,J.,Kato,H.,Akira,S.andWeissman,D.(2008)Incorporation of pseudouridine into mRNA yields superiornonimmunogenic vector with increased translational capacity and biologicalstability.Mol.Ther.16,1833–1840.
11.Karikó,K.,Buckstein,M.,Ni,H.,and Weissman,D.Suppression of RNArecognition by Toll-like receptors:the impact of nucleoside modification andthe evolutionary origin of RNA.(2005)Immunity 23,165–175.
12.Andries,O.,McCafferty,S.,De Smedt,S.C.,Weiss,R.,Sanders,N.N.andKitada,T.(2015)N1-methylpseudouridine-incorporated mRNAoutperformspseudouridine-incorporated mRNA by providing enhanced proteinexpression andreduced immunogenicity in mammalian cell lines andmice.J.Control.Release217,337–344.
13.Kormann,M.S.,Hasenpusch,G.,Aneja,M.K.,Nica,G.,Flemmer,A.W.,Herber-Jonat,S.,Huppmann,M.,Mays,L.E.,Illenyi,M.,Schams,A.,et al.(2011)Expression oftherapeutic proteins after delivery of chemically modifiedmRNA in mice.NatureBiotechnology 29,154-157.
14.Li,B.,Luo,X.,and Dong,Y.(2016)Effects of ChemicallyModifiedMessenger RNA on Protein Expression.Bioconjug.Chem.27,849–853.
15.Aurup,H.,Siebert,A.,Benseler,F.,Williams,D.,and Eckstein,F.(1994)Translation of 2’-modified mRNA in vitro and in vivo.Nucleic Acids Res.22,4963–4968.
16.Choi,J.,Indrisiunaite,G.,DeMirci,H.,Ieong,K.W.,Wang,J.,Petrov,A.,Prabhakar,A.,Rechavi,G.,Dominissini,D.,He,C.,et al.(2018)2’-O-methylation inmRNA disrupts tRNA decoding during translation elongation.Nat.Struct.Mol.Biol.25,208–216.
17.L.,Hüwel,S.,Zobel,T.,and Rentmeister,A.(2019)Multiplecovalent fluorescence labeling of eukaryotic mRNA at the poly(A)tailenhancestranslation and can be performed in living cells.Nucleic AcidsRes.47,e42.
18.Strzelecka,D.,Smietanski,M.,Sikorski,P.J.,Warminski,M.,Kowalska,J.and Jemielity,J.(2020)Phosphodiester modifications in mRNApoly(A)tailprevent deadenylation without compromising protein expression.RNA 26,1815–1837.
19.A.,Tomecki,R.,and Dziembowski,A.(2016)CytoplasmicRNA decaypathways-Enzymes and mechanisms.Biochim.Biophys.Acta 1863,3125–3147.
20.Garneau,N.L.,Wilusz,J.,and Wilusz,C.J.(2007)The highways andbywaysof mRNA decay.Nature Reviews Molecular Cell Biology 8,113-126.
21.Eckstein,F.(2014)Phosphorothioates,essential componentsoftherapeutic oligonucleotides.Nucleic Acid Ther.24,374–387.
22.Stowell,J.A.,Webster,M.W.,A.,Wolf,J.,Shelley,K.L.,andPassmore,L.A.(2016)Reconstitution of Targeted Deadenylation by the Ccr4-NotComplex and the YTH Domain Protein Mmi1.Cell Rep.17,1978–1989.
23.Yang,Y,Lindahl,T.,and Barnes,D.(2007)Trex1 exonucleasedegradesssDNA to prevent chronic checkpoint activation and autoimmune disease.Cell131,873–886.
24.Takahashi,A.,Loo,T.M.,Okada,R.,Kamachi,F.,Watanabe,Y.,Wakita,M.,Watanabe,S.,Kawamoto,S.,Miyata,K.,Barber,G.N.,et al.(2018)Downregulation ofcytoplasmic DNases is implicated in cytoplasmic DNAaccumulation and SASP insenescent cells.Nat.Commun.9,1249.
25.Chen,J.,Chiang,Y.,and Denis,C.(2002)CCR4,a 3’-5'poly(A)RNAandssDNA exonuclease,is the catalytic component of thecytoplasmicdeadenylase.EMBO J.21,1414–1426.
26.Cerritelli,S.and Crouch,R.Ribonuclease H:the enzymes ineukaryotes.(2009)FEBS J.276,1494–1505.
27.Leonhardt,C.,Schwake,G.,T.R.,Rappl,S.,Kuhr,J.T.,Ligon,T.S.,and />J.O.(2014)Single-cell mRNA transfection studies:delivery,kinetics and statistics by numbers.Nanomedicine:Nanotechnology,Biology andMedicine 10,679-688.
28.Wang,X.,Allen,W.,Wright,M.,Sylwestrak,E.,Samusik,N.,Vesuna,S.,Evans,K.,Liu,C.,Ramakrishnan,C.,Liu,J.,et al.(2018)Three-dimensionalintact-tissue sequencing of single-cell transcriptional states.Science 361,eaat5691.
29.Li,X.,Zhao,X.,Fang,Y.,Jiang,X.,Duong,T.,Fan,C.,Huang,C.C.,andKain,S.R.(1998)Generation of destabilized green fluorescent protein asatranscription reporter.Journal of Biological Chemistry 273.52,34970-34975.
30.Lin,C.Y.,Perche,F.,Ikegami,M.,Uchida,S.,Kataoka,K.,and Itaka,K.(2016)Messenger RNA-based therapeutics for brain diseases:An animal studyforaugmenting clearance of beta-amyloid by intracerebral administrationofneprilysin mRNA loaded in polyplex nanomicelles.Journal of ControlledRelease 235,268-275.
31.Williams,D.J.,Puhl,H.L.,and Ikeda,S.R.(2010)A simple,highlyefficient method for heterologous expression in mammalian primary neuronsusing cationic lipid-mediated mRNA transfection.Frontiers in Neuroscience 4,181.
32.Ingusci,S.,Verlengia,G.,Soukupova,M.,Zucchini,S.,and Simonato,M.(2019)Gene therapy tools for brain diseases.Frontiers in Pharmacology 10,724.
33.Honda,K.,Yanai,H.,Takaoka,A.,and Taniguchi,T.(2005)Regulation ofthe type I IFN induction:a current view.International Immunology 17,1367-1378.
34.Wienert,B.,Shin,J.,Zelin,E.,Pestal,K.,and Corn,J.E.(2018)In vitro–transcribed guide RNAs trigger an innate immune response via the RIG-Ipathway.PLoS biology 16,e2005840.
35.Linehan,M.M.,Dickey,T.H.,Molinari,E.S.,Fitzgerald,M.E.,Potapova,O.,Iwasaki,A.,and Pyle,A.M.(2018)A minimal RNA ligand for potent RIG-Iactivation in living mice.Science Advances 4,e1701854.
36.Hausmann,S.,Marq,J.B.,Tapparel,C.,Kolakofsky,D.,and Garcin,D.(2008)RIG-I and dsRNA-induced IFNβactivation.PLoS One 3,e3965.
37.Cao Z.,Huang,C.C.,and Tan,W.(2006)Nuclease resistance of telomere-like oligonucleotides monitored in live cells by fluorescence anisotropyimaging.Analytical Chemistry 78,1478-1484.
38.Barragán-Iglesias,P.,Lou,T.F.,Bhat,V.D.,Megat,S.,Burton,M.D.,Price,T.J.,and Campbell,Z.T.(2018)Inhibition of Poly(A)-binding protein witha synthetic RNA mimic reduces pain sensitization in mice.NatureCommunications 9,1-17.
39.Rydzik,A.M.,Warminski,M.,Sikorski,P.J.,Baranowski,M.R.,Walczak,S.,Kowalska,J.,Zuberek,J.,Lukaszewicz,M.,Nowak,E.,Claridge,T.D.,et al.(2017)mRNAcap analogues substituted in the tetraphosphate chain with CX2:identificationof O-to-CCl2 as the first bridging modification that confers resistance todecapping without impairing translation.Nucleic Acids Res.45,8661–8675.
40.Strenkowska,M.,Kowalska,J.,Lukaszewicz,M.,Zuberek,J.,Su,W.,Rhoads,R.E.,Darzynkiewicz,E.,and Jemielity,J.(2010)Towards mRNA with superiortranslational activity:synthesis and properties of ARCA tetraphosphates withsingle phosphorothioate modifications.New J.Chem.34,993–1007.
41.Kawaguchi,D.,Kodama,A.,Abe,N.,Takebuchi,K.,Hashiya,F.,Tomoike,F.,Nakamoto,K.,Kimura,Y,Shimizu,Y.,and Abe,H.(2020)Phosphorothioate Modificationof mRNA Accelerates the Rate of Translation Initiation to Provide MoreEfficient Protein Synthesis.Angew.Chem.Int.Ed Engl.59,17403–17407.
42.Boo,S.and Kim,Y.(2020)The emerging role of RNA modifications inthe regulation of mRNA stability.Experimental&molecular medicine 52,400-408.
43.Zhao,B.S.,Wang,X.,Beadell,A.V.,Lu,Z.,Shi,H.,Kuuspalu,A.,Ho,R.K.,and He,C.(2017)m6A-dependent maternal mRNA clearance facilitates zebrafishmaternal-to-zygotic transition.Nature 542,475-478.
44.Carpenter,A.E.,Jones,T.R.,Lamprecht,M.R.,Clarke,C.,Kang,I.H.,Friman,O.,Guertin,D.A.,Chang,J.H.,Lindquist,R.A.,Moffat,J.,et al.(2006)CellProfiler:image analysis software for identifying and quantifying cellphenotypes.Genome biology 7,1-11.
实施例6:化学修饰的mocRNA在体内提供有效的蛋白质表达。
描述了信使寡核苷酸缀合的RNA(mocRNA),其为与化学修饰的寡核苷酸连接的治疗性mRNA,如所述。该治疗性mRNA含有(从5’到3’):(1)mRNA帽类似物(NEB:S1411);(2)5’非翻译区(UTR);(3)蛋白质编码区(萤光素酶报告基因);(4)3’UTR;和(5)多聚(A)尾(20至200nt)。该mRNA含有用N1-甲基假尿苷(Trilink Biotechnologies:N1081)对尿苷进行的100%替换以增加表达。
mocRNA通过将化学合成的寡核苷酸(表9)连接至治疗性mRNA的3’末端来合成。含有核酸酶抗性基团的寡核苷酸保护多聚(A)尾部免于脱腺苷化,并增加在HeLa细胞培养物中较长时间点处的表达(图17)。此外,与未处理的mRNA相比,将mocRNA注射到小鼠中增加萤光素酶报告基因的表达(图18A-18C)。
可以将这些寡核苷酸类似地连接至非蛋白质编码RNA的3’末端,以增强此类RNA在细胞中的稳定性。
表4:用于mocRNA合成的额外的寡核苷酸的序列。
RNA碱基:rN;RNA硫代磷酸酯碱基:rN*;DNA硫代磷酸酯碱基:N*;2’-O-甲基硫代磷酸酯碱基:mN*;锁核酸[LNA]碱基:+N;内部2’-O-甲氧基-乙基RNA碱基:/i2MOErN/;5’磷酸酯修饰:/5Phos/;2’-3’-二脱氧胞苷[ddC]修饰:/3ddC/;反向2’-脱氧胸苷[InvdT]修饰:/3InvdT/。
等同物和范围
本领域技术人员将认识到或能够仅仅使用常规实验来确定本文描述的本发明的具体实施方案的许多等同物。本发明的范围并不旨在限于以上描述,而是如所附权利要求中所示。
在权利要求中,除非有相反指示或从上下文中明显看出,否则冠词诸如“一个(a、an)”、“该(the)”可以意指一个或多于一个。除非有相反指示或从上下文中明显看出,如果一个、多余一个或所有的组成员出现在、应用于、或以其他方式相关于给定产品或过程,那么将在组的一个或多个成员之间包含“或”的权利要求或描述考虑为得到满足。本发明包括以下实施方案:其中该组中确切地一个成员存在于、应用于以其他方式相关于给定产品或过程。本发明还包括以下实施方案:其中多于一个或所有的组成员存在于、应用于或以其他方式相关于给定产品或过程。
此外,应当理解,本发明涵盖所有变化、组合和排列,其中将来自一项或多项权利要求或来自说明书的相关部分的一种或多种限制、元素、从句、描述性术语等引入到另一项权利要求中。例如,可以将从属于另一权利要求的任何权利要求修改为包括在从属于同一基础权利要求的任何其他权利要求中发现的一个或多个限制。此外,除非另有指示或者除非对于本领域普通技术人员来说明显将出现矛盾或不一致,否则当权利要求提及组合物时,应当理解,包括了将组合物用于本文公开的任何目的的方法,以及根据本文公开的任何制备方法或本领域已知的其他方法制备组合物的方法。
当元素被呈现为列表(例如,以马库什组格式)时,应当理解,还公开了元素的每个子组,并且可以从该组中移除任何元素。还应当注意,术语“包含、包括(comprising)”旨在是开放的并且允许包括额外的元素或步骤。应当理解,一般来说,当将本发明或本发明的方面称为包含特定元素、特征、步骤等时,本发明的某些实施方案或本发明的方面由或基本上由此类元素、特征、步骤等组成。为了简洁起见,这些实施方案没有在本文中具体阐述。因此,对于包含一个或多个元素、特征、步骤等的本发明的每个实施方案,本发明还提供由这些元素、特征、步骤等组成或基本上由这些元素、特征、步骤等组成的实施方案。
在给出范围之处,包括了端点。此外,应当理解,除非另有指示或从上下文和/或本领域普通技术人员的理解中明显看出,否则表达为范围的值可以在本发明不同实施方案中的所述范围内假定任何特定值,直至该范围下限单位的十分之一(除非上下文明确另有清楚指示)。还应当理解,除非另有指示或从上下文和/或本领域普通技术人员的理解中明显看出,否则表达为范围的值可以假定给定范围内的任何子范围,其中该子范围的端点以与该范围的下限单位的十分之一精确度相同的度(degree)表示。
此外,应当理解,本发明的任何特定实施方案可以明确地从任何一项或多项权利要求中排除。当给出范围时,该范围内的任何值可以明确地从任何一项或多项权利要求中排除。本发明的组合物和/或方法的任何实施方案、元素、特征、应用或方面可以从任何一项或多项权利要求中排除。为了简洁的目的,本文未明确阐述所有的以下实施方案:其中排除一个或多个元素、特征、目的或方面。

Claims (241)

1.修饰的mRNA,其包含:
(i)编码蛋白质的开放阅读框(ORF);和
(ii)多聚-A区,
其中所述多聚-A区位于所述开放阅读框的3’并且包含10个或更多个核苷酸,其中所述多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中所述多聚-A区的最后10个核苷酸中的3个或更多个是修饰的核苷酸。
2.权利要求1所述的修饰的mRNA,其中所述多聚-A区位于所述开放阅读框的3’并且包含25个或更多个腺苷核苷酸,其中所述多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且所述多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。
3.权利要求1或权利要求2所述的修饰的mRNA,其中所述多聚-A区的最后25个核苷酸中的4个或更多个是修饰的核苷酸。
4.权利要求1-3中任一项所述的修饰的mRNA,其中所述多聚-A区的最后25个核苷酸中的2个或更多个连续核苷酸通过修饰的核苷酸间键连接。
5.权利要求1-4中任一项所述的修饰的mRNA,其中所述多聚-A区的最后25个核苷酸中的3个或更多个连续核苷酸是独立地选自脱氧核糖核苷酸、2’-修饰的核苷酸和硫代磷酸酯连接的核苷酸的修饰的核苷酸。
6.权利要求1-5中任一项所述的修饰的mRNA,其中所述3个或更多个修饰的核苷酸是位于所述多聚-A区3’末端的连续核苷酸。
7.权利要求1-6中任一项所述的修饰的mRNA,其中所述多聚-A区的最后25个核苷酸中的6个或更多个连续核苷酸包含相同类型的核苷酸或核苷间修饰。
8.权利要求1-7中任一项所述的修饰的mRNA,其中所述多聚-A区的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
9.权利要求1-8中任一项所述的修饰的mRNA,其中所述多聚-A区的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
10.权利要求1-9中任一项所述的修饰的mRNA,其中所述修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中所述ORF位于所述5’UTR和所述3’UTR之间,其中所述3’UTR位于所述ORF和所述多聚-A区之间。
11.权利要求1-10中任一项所述的修饰的mRNA,其中所述修饰的mRNA是环状mRNA,其中所述多聚-A区位于所述3’UTR和所述5’UTR之间。
12.修饰的mRNA,其包含:
(i)编码蛋白质的开放阅读框(ORF);
(ii)多聚-A区;
(iii)包含能够形成二级结构的至少两个核苷酸的结构序列的一个或多个拷贝,
其中所述多聚-A区位于所述开放阅读框的3’并且包含10个或更多个核苷酸,其中所述结构序列的一个或多个拷贝位于所述多聚-A区的3’,并且其中所述修饰的mRNA包含二级结构,其中所述二级结构包含所述结构序列的一个或多个拷贝。
13.权利要求12所述的修饰的mRNA,其中所述多聚-A区包含25个或更多个腺苷核苷酸。
14.权利要求12或权利要求13所述的修饰的mRNA,其中所述修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中所述ORF位于所述5’UTR和所述3’UTR之间,其中所述3’UTR位于所述ORF和所述多聚-A区之间。
15.权利要求14所述的修饰的mRNA,其中所述修饰的mRNA是环状mRNA,其中所述结构序列的一个或多个拷贝位于所述多聚-A区和所述5’UTR之间。
16.权利要求12-15中任一项所述的修饰的mRNA,其中所述结构序列是G-四链体序列。
17.权利要求16所述的修饰的mRNA,其中所述G-四链体是RNA G-四链体序列。
18.权利要求17所述的修饰的mRNA,其中所述RNAG-四链体序列包含SEQ ID NO:2的核酸序列。
19.权利要求18所述的修饰的mRNA,其中所述修饰的mRNA包含SEQ ID NO:2的核酸序列的至少3个拷贝。
20.权利要求16所述的修饰的mRNA,其中所述G-四链体是DNA G-四链体序列。
21.权利要求20所述的修饰的mRNA,其中所述DNA G-四链体序列包含SEQ ID NO:3的核酸序列。
22.权利要求21所述的修饰的mRNA,其中所述修饰的mRNA包含SEQ ID NO:3的核酸序列的至少3个拷贝。
23.权利要求12-15中任一项所述的修饰的mRNA,其中所述结构序列是端粒重复序列。
24.权利要求23所述的修饰的mRNA,其中所述端粒重复序列包含SEQ ID NO:4的核酸序列。
25.权利要求24所述的修饰的mRNA,其中所述修饰的mRNA包含SEQ ID NO:4的核酸序列的至少3个拷贝。
26.权利要求12-15中任一项所述的修饰的mRNA,其中所述mRNA的二级结构是能够结合靶分子的适体。
27.权利要求12-26中任一项所述的修饰的mRNA,其中所述修饰的mRNA的所述多聚A区包含至少一个修饰的核苷酸。
28.权利要求1-11或27中任一项所述的修饰的mRNA,其中至少一个修饰的核苷酸包含修饰的核碱基。
29.权利要求28所述的修饰的mRNA,其中所述修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
30.权利要求28或29所述的修饰的mRNA,其中至少一个修饰的核苷酸包含修饰的糖。
31.权利要求30所述的修饰的mRNA,其中所述修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2,-氨基-2,-脱氧核糖、2,脱氧核糖、2’-叠氮基-2’-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2,-O,4,-C-硫代连接的核糖。
32.权利要求27-31中任一项所述的修饰的mRNA,其中至少一个修饰的核苷酸包含2’修饰。
33.权利要求32所述的修饰的mRNA,其中所述2’修饰选自锁核酸(LNA)修饰、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
34.权利要求27-33中任一项所述的修饰的mRNA,其中至少一个修饰的核苷酸包含修饰的磷酸酯。
35.权利要求34所述的修饰的mRNA,其中所述修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
36.权利要求27-35中任一项所述的修饰的mRNA,其中所述多聚-A区包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
37.权利要求36所述的修饰的mRNA,其中所述多聚-A区包含至少6个硫代磷酸酯。
38.权利要求27-35中任一项所述的修饰的mRNA,其中所述多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
39.权利要求27-38中任一项所述的修饰的mRNA,其中所述多聚-A区域包含至少6个包含2’修饰的核苷酸。
40.权利要求27-39中任一项所述的修饰的mRNA,其中所述多聚-A区包含至少3个脱氧核糖糖。
41.权利要求40所述的修饰的mRNA,其中所述多聚-A区包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖糖。
42.权利要求41所述的修饰的mRNA,其中所述多聚-A区包含至少23个脱氧核糖糖。
43.权利要求1-42中任一项所述的修饰的mRNA,其中所述mRNA的3’末端核苷酸在所述3’末端核苷酸的3’位置处不包含羟基。
44.权利要求1-43中任一项所述的修饰的mRNA,其中所述mRNA的3’末端核苷酸包含反向核苷酸。
45.权利要求1-44中任一项所述的修饰的mRNA,其中所述mRNA的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
46.权利要求45所述的修饰的mRNA,其中所述mRNA的3’末端核苷酸包含双脱氧胞苷。
47.权利要求1-46中任一项所述的修饰的mRNA,其中所述mRNA包含肽结合序列。
48.权利要求47所述的修饰的mRNA,其中所述肽结合序列是多聚-A结合蛋白(PABP)结合序列。
49.权利要求1-11或27-48中任一项所述的修饰的mRNA,其中所述修饰的mRNA包含第一修饰的核苷酸和第二修饰的核苷酸,其中所述第一修饰的核苷和第二修饰的核苷包含不同的结构。
50.权利要求1-46中任一项所述的修饰的mRNA,其中所述多聚-A区包含至少25-500个核苷酸。
51.权利要求50所述的修饰的mRNA,其中所述多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
52.权利要求1-51中任一项所述的修饰的mRNA,其中所述多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸是腺苷核苷酸。
53.权利要求1-10、12、14或16-52中任一项所述的修饰的mRNA,其中所述修饰的mRNA是线性mRNA,其中所述线性mRNA包含5’帽。
54.权利要求53所述的修饰的mRNA,其中所述5’帽包含7-甲基鸟苷。
55.权利要求54所述的修饰的mRNA,其中所述5’帽还包含将所述7-甲基鸟苷连接至所述修饰的mRNA的相邻核苷酸的一个或多个磷酸酯。
56.权利要求53所述的修饰的mRNA,其中所述5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
57.权利要求55或56所述的修饰的mRNA,其中所述5’帽的一个或多个磷酸酯是选自硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)的修饰的磷酸酯。
58.1-57所述的修饰的mRNA,其中所述修饰的mRNA包含含有1个或多个修饰的核苷酸的5’UTR。
59.1-58所述的修饰的mRNA,其中所述修饰的mRNA包含含有1个或多个修饰的核苷酸的ORF。
60.修饰的非编码RNA,其包含:
(i)非编码RNA序列;和
(ii)多聚-A区,
其中所述多聚-A区位于所述非编码RNA序列的3’并且包含10个或更多个核苷酸,其中所述多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中所述多聚-A区最后10个核苷酸中的3个或更多个是修饰的核苷酸。
61.权利要求60所述的修饰的非编码RNA,其中所述多聚-A区位于所述开放阅读框的3’并且包含25个或更多个腺苷核苷酸,其中所述多聚-A区的1%至90%的核苷酸是修饰的核苷酸,并且其中所述多聚-A区的最后25个核苷酸中的3个或更多个是修饰的核苷酸。
62.权利要求60或权利要求61所述的修饰的非编码RNA,其中所述多聚-A区的最后25个核苷酸中的4个或更多个是修饰的核苷酸。
63.权利要求60-62中任一项所述的修饰的非编码RNA,其中所述多聚-A区的最后25个核苷酸中的2个或更多个连续核苷酸通过修饰的核苷酸间键连接。
64.权利要求60-63中任一项所述的修饰的非编码RNA,其中所述多聚-A区的最后25个核苷酸中的3个或更多个连续核苷酸是独立地选自脱氧核糖核苷酸、2’-修饰的核苷酸和硫代磷酸酯连接的核苷酸的修饰的核苷酸。
65.权利要求60-64中任一项所述的修饰的非编码RNA,其中所述3个或更多个修饰的核苷酸是位于所述多聚-A区3’末端的连续核苷酸。
66.权利要求60-65中任一项所述的修饰的非编码RNA,其中所述多聚-A区最后25个核苷酸中的6个或更多个连续核苷酸包含相同类型的核苷酸或核苷间修饰。
67.权利要求60-66中任一项所述的修饰的非编码RNA,其中所述多聚-A区的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
68.权利要求60-67中任一项所述的修饰的非编码RNA,其中所述多聚-A区的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
69.权利要求60-68中任一项所述的修饰的非编码RNA,其中所述修饰的非编码RNA是环状非编码RNA,其中所述多聚-A区位于所述非编码RNA序列的5’。
70.权利要求60-69中任一项所述的修饰的非编码RNA,其中所述修饰的非编码RNA还包含结构序列的一个或多个拷贝,所述结构序列包含能够形成二级结构的至少两个核苷酸,
其中所述结构序列的一个或多个拷贝位于所述多聚-A区的3’,并且其中所述修饰的非编码RNA包含二级结构,并且
其中所述二级结构包含所述结构序列的一个或多个拷贝。
71.权利要求70所述的修饰的非编码RNA,其中所述修饰的非编码RNA是环状mRNA,其中所述结构序列的一个或多个拷贝位于所述多聚-A区和所述非编码RNA序列之间。
72.权利要求70或71所述的修饰的非编码RNA,其中所述结构序列是G-四链体序列。
73.权利要求72所述的修饰的非编码RNA,其中所述G-四链体是RNA G-四链体序列。
74.权利要求73所述的修饰的非编码RNA,其中所述RNA G-四链体序列包含SEQ ID NO:2的核酸序列。
75.权利要求74所述的修饰的非编码RNA,其中所述修饰的非编码RNA包含SEQ ID NO:2的核酸序列的至少3个拷贝。
76.权利要求72所述的修饰的非编码RNA,其中所述G-四链体是DNA G-四链体序列。
77.权利要求76所述的修饰的非编码RNA,其中所述DNAG-四链体序列包含SEQ ID NO:3的核酸序列。
78.权利要求77所述的修饰的非编码RNA,其中所述修饰的非编码RNA包含SEQ ID NO:3的核酸序列的至少3个拷贝。
79.权利要求70或71所述的修饰的非编码RNA,其中所述结构序列是端粒重复序列。
80.权利要求79所述的修饰的非编码RNA,其中所述端粒重复序列包含SEQ ID NO:4的核酸序列。
81.权利要求80所述的修饰的非编码RNA,其中所述修饰的非编码RNA包含SEQ ID NO:4的核酸序列的至少3个拷贝。
82.权利要求70或71所述的修饰的非编码RNA,其中所述非编码RNA的二级结构是能够结合靶分子的适体。
83.权利要求60-82中任一项所述的修饰的非编码RNA,其中至少一个修饰的核苷酸包含修饰的核碱基。
84.权利要求83所述的修饰的非编码RNA,其中所述修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
85.权利要求60-84中任一项所述的修饰的非编码RNA,其中至少一个修饰的核苷酸包含修饰的糖。
86.权利要求85所述的修饰的非编码RNA,其中所述修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-2’-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
87.权利要求60-86中任一项所述的修饰的非编码RNA,其中至少一个修饰的核苷酸包含2’修饰。
88.权利要求87所述的修饰的非编码RNA,其中所述2’修饰选自锁核酸(LNA)修饰、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
89.权利要求57-88中任一项所述的修饰的非编码RNA,其中至少一个修饰的核苷酸包含修饰的磷酸酯。
90.权利要求89所述的修饰的非编码RNA,其中所述修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
91.权利要求60-90中任一项所述的修饰的非编码RNA,其中所述多聚-A区包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
92.权利要求91所述的修饰的非编码RNA,其中所述多聚-A区包含至少6个硫代磷酸酯。
93.权利要求60-92中任一项所述的修饰的非编码RNA,其中所述多聚-A区包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
94.权利要求60-93中任一项所述的修饰的非编码RNA,其中所述多聚-A区域包含至少6个包含2’修饰的核苷酸。
95.权利要求60-94中任一项所述的修饰的非编码RNA,其中所述多聚-A区包含至少3个脱氧核糖糖。
96.权利要求95所述的修饰的非编码RNA,其中所述多聚-A区包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖糖。
97.权利要求96所述的修饰的非编码RNA,其中所述多聚-A区包含至少23个脱氧核糖糖。
98.权利要求60-97中任一项所述的修饰的非编码RNA,其中所述非编码RNA的3’末端核苷酸在所述3’末端核苷酸的3’位置处不包含羟基。
99.权利要求60-98中任一项所述的修饰的非编码RNA,其中所述非编码RNA的3’末端核苷酸包含反向核苷酸。
100.权利要求98或99所述的修饰的非编码RNA,其中所述mRNA的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
101.权利要求100所述的修饰的非编码RNA,其中所述mRNA的3’末端核苷酸包含双脱氧胞苷。
102.权利要求60-101中任一项所述的修饰的非编码RNA,其中所述修饰的非编码RNA包含第一修饰的核苷酸和第二修饰的核苷酸,其中所述第一修饰的核苷和第二修饰的核苷包含不同的结构。
103.权利要求60-102中任一项所述的修饰的非编码RNA,其中所述多聚-A区包含至少25-500个核苷酸。
104.权利要求103所述的修饰的非编码RNA,其中所述多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
105.权利要求60-104中任一项所述的修饰的非编码RNA,其中所述多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸是腺苷核苷酸。
106.产生权利要求1-11和27-59中任一项所述的修饰的mRNA的方法,所述方法包括在RNA连接酶存在的情况下,将包含编码蛋白质的开放阅读框的第一RNA与包含一个或多个修饰的核苷酸的加尾核酸连接,由此所述RNA连接酶在所述RNA的3’核苷酸和所述加尾核酸的5’核苷酸之间形成共价键以产生所述修饰的mRNA。
107.权利要求106所述的方法,其中所述修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中所述ORF位于所述5’UTR和所述3’UTR之间,其中所述3’UTR位于所述ORF和所述多聚-A区之间。
108.权利要求107所述的方法,其进一步包括在核酶存在下环化所述修饰的mRNA,其中所述修饰的mRNA包含3’内含子和5’内含子,其中所述3’内含子位于所述5’UTR的5’,其中所述5’内含子位于所述多聚-A区的3’,由此所述核酶在所述3’内含子的3’的核苷酸和所述5’内含子的5’的核苷酸之间形成共价键以产生不包含所述5’内含子或所述3’内含子的环状mRNA,其中所述多聚-A区位于所述环状mRNA的3’UTR和5’UTR之间。
109.权利要求107所述的方法,其进一步包括以下步骤:
(i)将5’末端磷酸基团引入到所述修饰的mRNA的第一个核苷酸上;
(ii)切割所述修饰的mRNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的mRNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的所述修饰的mRNA;
由此所述环化连接酶在所述修饰的mRNA的3’核苷酸和所述修饰的mRNA的5’核苷酸之间形成共价键以产生环状修饰的mRNA,其中所述多聚-A区位于所述3’UTR和所述5’UTR之间。
110.产生权利要求12-59中任一项所述的修饰的mRNA的方法,所述方法包括在RNA连接酶存在的情况下,将包含编码蛋白质的开放阅读框的RNA与包含结构序列的一个或多个拷贝的加尾核酸连接,由此所述连接酶在所述RNA的3’核苷酸和所述加尾核酸的5’核苷酸之间形成共价键以产生所述修饰的mRNA。
111.权利要求110所述的方法,其中所述修饰的mRNA包含5’非翻译区(5’UTR)和3’非翻译区(3’UTR),其中所述ORF位于所述5’UTR和所述3’UTR之间,其中所述3’UTR位于所述ORF与所述多聚-A区之间,其中所述多聚-A区位于所述3’UTR与所述结构序列的一个或多个拷贝之间。
112.权利要求111所述的方法,其进一步包括在核酶存在下环化所述修饰的mRNA,其中所述修饰的mRNA包含3’内含子和5’内含子,其中所述3’内含子位于所述5’UTR的5’,其中所述5’内含子位于所述结构序列的一个或多个拷贝的3’,由此所述核酶在所述3’内含子的3’的核苷酸和所述5’内含子的5’的核苷酸之间形成共价键以产生不包含所述5’内含子或所述3’内含子的环状mRNA,其中所述结构序列的一个或多个拷贝位于所述多聚-A区和所述环状mRNA的5’UTR之间。
113.权利要求111所述的方法,其进一步包括以下步骤:
(i)将5’末端磷酸基团引入到所述修饰的mRNA的第一个核苷酸上;
(ii)切割所述修饰的mRNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的mRNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的所述修饰的mRNA;
由此所述环化连接酶在所述修饰的mRNA的3’核苷酸和所述修饰的mRNA的5’核苷酸之间形成共价键以产生环状修饰的mRNA,其中所述结构序列的一个或多个拷贝位于所述3’UTR和所述5’UTR之间。
114.权利要求109或113所述的方法,其中所述修饰的mRNA在支架核酸存在下环化,其中所述支架核酸是能够与所述修饰的mRNA杂交的核酸,其中与所述支架核酸结合时,所述修饰的mRNA形成环状二级结构。
115.权利要求114所述的方法,其中所述支架核酸包含:
(a)包含5个或更多个核苷酸的第一杂交序列,其中所述第一杂交序列与所述修饰的mRNA的至少前五(5)个核苷酸互补;和
(b)包含5个或更多个核苷酸的第二杂交序列,其中所述第二杂交序列与所述修饰的mRNA的至少后五(5)个核苷酸互补;
其中所述修饰的mRNA的至少前五(5)个核苷酸与所述第一杂交序列杂交,并且所述修饰的mRNA的至少后五(5)个核苷酸与所述第二杂交序列杂交。
116.权利要求114或115所述的方法,其中所述第一杂交序列的最后一个核苷酸和所述第二杂交序列的第一个核苷酸在所述支架核酸中相邻并且不被任何其他核苷酸分开。
117.权利要求109或113所述的方法,其中所述修饰的mRNA包含:
(i)位于所述开放阅读框5’的第一自杂交序列;
(ii)位于所述开放阅读框3’的第二自杂交序列;
(iii)位于所述第一自杂交序列5’的第一非杂交序列;和
(iv)位于所述第二自杂交序列3’的第二非杂交序列,
其中所述第一自杂交序列和第二自杂交序列能够彼此杂交,
其中所述第一自杂交序列和第二自杂交序列不能彼此杂交。
118.权利要求117所述的方法,其中所述第一自杂交序列和第二自杂交序列的杂交形成二级结构,其中所述修饰的mRNA的5’末端核苷酸和3’末端核苷酸分开的距离小于
119.权利要求118所述的方法,其中所述5’末端核苷酸和所述3’末端核苷酸分开的距离小于小于/>小于/>小于/>小于/> 小于/>小于/>小于/>或小于
120.权利要求109或113-119中任一项所述的方法,其中所述环化连接酶是T4 RNA连接酶。
121.权利要求110-120中任一项所述的方法,其中所述结构序列是G-四链体序列。
122.权利要求121所述的方法,其中所述G-四链体是RNAG-四链体序列。
123.权利要求122所述的方法,其中所述RNAG-四链体序列包含SEQ ID NO:2的核酸序列。
124.权利要求123所述的方法,其中所述加尾核酸包含SEQ ID NO:2的核酸序列的至少3个拷贝。
125.权利要求121所述的方法,其中所述G-四链体是DNAG-四链体序列。
126.权利要求125所述的方法,其中所述DNA G-四链体序列包含SEQ ID NO:3的核酸序列。
127.权利要求126所述的方法,其中所述加尾核酸包含SEQ ID NO:3的核酸序列的至少3个拷贝。
128.权利要求110-120中任一项所述的方法,其中所述结构序列是端粒重复序列。
129.权利要求128所述的方法,其中所述端粒重复序列包含SEQ ID NO:4的核酸序列。
130.权利要求129所述的方法,其中所述加尾核酸包含SEQ ID NO:4的核酸序列的至少3个拷贝。
131.权利要求110-120中任一项所述的方法,其中所述结构序列是包含能够相互作用以形成适体的至少两个核苷酸的适体序列,其中所述适体是能够结合靶分子的二级结构。
132.权利要求110-131中任一项所述的方法,其中所述加尾核酸包含至少一个修饰的核苷酸。
133.权利要求106、107或132中任一项所述的方法,其中所述RNA的5’核苷酸不包含5’末端磷酸基团;
其中所述RNA的3’核苷酸包含3’末端羟基;
其中所述加尾核酸的5’核苷酸包含5’末端磷酸基团;并且
其中所述加尾核酸的3’核苷酸不包含3’末端羟基。
134.权利要求106、107或132中任一项所述的方法,其中所述RNA的5’核苷酸不包含5’末端羟基;
其中所述RNA的3’核苷酸包含3’末端磷酸基团;
其中所述加尾核酸的5’核苷酸包含5’末端羟基;
其中所述加尾核酸的3’核苷酸不包含3’末端磷酸基团;并且
其中所述RNA连接酶是RtcB连接酶。
135.权利要求106、107或132-134中任一项所述的方法,其中所述加尾核酸的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
136.权利要求106、107或132-135中任一项的方法,其中所述加尾核酸的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
137.权利要求106、107或132-136中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的核碱基。
138.权利要求137所述的方法,其中所述修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
139.权利要求106、107或132-138中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的糖。
140.权利要求139所述的方法,其中所述修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-2’-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
141.权利要求106、107或132-140中任一项所述的方法,其中至少一个修饰的核苷酸包含2’修饰。
142.权利要求141所述的方法,其中所述2’修饰选自锁核酸(LNA)修饰、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
143.权利要求106、107或132-142中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的磷酸酯。
144.权利要求143所述的方法,其中所述修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
145.权利要求106、107或132-144中任一项所述的方法,其中所述加尾核酸包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
146.权利要求145所述的方法,其中所述加尾核酸包含至少6个硫代磷酸酯。
147.权利要求106、107或132-145中任一项所述的方法,其中所述加尾核酸包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
148.权利要求106、107或132-147中任一项所述的方法,其中所述加尾核酸包含至少6个包含2’修饰的核苷酸。
149.权利要求106、107或132-148中任一项所述的方法,其中所述加尾核酸包含至少3个脱氧核糖糖。
150.权利要求149所述的方法,其中所述加尾核酸包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖。
151.权利要求140所述的方法,其中所述加尾核酸包含至少23个脱氧核糖糖。
152.权利要求106、107、110、111或132-151中任一项所述的方法,其中所述加尾核酸的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
153.权利要求106-152中任一项所述的方法,其中所述加尾核酸包含第一修饰的核苷酸和第二修饰的核苷酸,其中所述第一修饰的核苷酸和第二修饰的核苷酸包含不同的结构。
154.权利要求106-153中任一项所述的方法,其中所述修饰的mRNA的多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。
155.权利要求106-154中任一项所述的方法,其中所述修饰的mRNA的多聚-A区包含至少25-500个核苷酸。
156.权利要求155所述的方法,其中所述修饰的mRNA的多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
157.权利要求106、107、110、111或121-156中任一项所述的方法,其中所述修饰的mRNA是线性mRNA,其中所述线性mRNA包含5’帽。
158.权利要求157所述的修饰的mRNA,其中所述5’帽包含7-甲基鸟苷。
159.权利要求158所述的修饰的mRNA,其中所述5’帽还包含将所述7-甲基鸟苷连接至所述修饰的mRNA的相邻核苷酸的一个或多个磷酸酯。
160.权利要求157所述的修饰的mRNA,其中所述5’帽包含3’-O-Me-m7G(5’)ppp(5’)G。
161.权利要求159或160所述的修饰的mRNA,其中所述5’帽的一个或多个磷酸酯是选自硫代磷酸酯、三唑环、二卤亚甲基二膦酸酯、亚氨基二磷酸酯和亚甲基双(膦酸酯)的修饰的磷酸酯。
162.权利要求106-161中任一项所述的方法,其中所述RNA连接酶是T4 RNA连接酶。
163.产生权利要求60-105中任一项所述的修饰的非编码RNA的方法,所述方法包括在RNA连接酶存在的情况下,将包含非编码RNA序列的第一RNA与包含一个或多个修饰的核苷酸的加尾核酸连接,由此所述RNA连接酶在所述RNA的3’核苷酸和所述加尾核酸的5’核苷酸之间形成共价键以产生所述修饰的非编码RNA。
164.权利要求163所述的方法,其中所述修饰的非编码RNA包含位于所述非编码RNA序列的3’的多聚-A区。
165.权利要求164所述的方法,其进一步包括在核酶存在下环化所述修饰的非编码RNA,其中所述修饰的非编码RNA包含3’内含子和5’内含子,其中所述3’内含子位于所述非编码RNA序列的5’,其中所述5’内含子位于所述多聚-A区的3’,由此所述核酶在所述3’内含子的3’的核苷酸和所述5’内含子的5’的核苷酸之间形成共价键以产生不包含所述5’内含子或所述3’内含子的环状非编码RNA,其中所述多聚-A区位于所述非编码RNA的3’和5’核苷酸之间。
166.权利要求164所述的方法,其进一步包括以下步骤:
(i)将5’末端磷酸基团引入到所述修饰的非编码RNA的第一个核苷酸上;
(ii)切割所述修饰的非编码RNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的非编码RNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的所述修饰的非编码RNA;
由此所述环化连接酶在所述修饰的非编码RNA的3’核苷酸和所述修饰的非编码RNA的5’核苷酸之间形成共价键以产生环状修饰的非编码RNA,其中所述多聚-A区位于所述非编码RNA的3’和5’核苷酸之间。
167.权利要求163-166中任一项所述的方法,其中所述加尾核酸进一步包含结构序列的一个或多个拷贝。
168.权利要求167所述的方法,其中所述修饰的非编码RNA包含位于所述非编码RNA序列和所述结构序列的一个或多个拷贝之间的多聚-A区。
169.权利要求168所述的方法,其进一步包括在核酶存在下环化所述修饰的非编码RNA,其中所述修饰的非编码RNA包含3’内含子和5’内含子,其中所述3’内含子位于所述非编码RNA的5’,其中所述5’内含子位于所述结构序列的一个或多个拷贝的3’,由此所述核酶在所述3’内含子的3’处的核苷酸和所述5’内含子的5’处的核苷酸之间形成共价键以产生不包含所述5’内含子或所述3’内含子的环状非编码RNA,其中所述结构序列的一个或多个拷贝位于所述多聚-A区和所述环状非编码RNA的非编码序列之间。
170.权利要求168所述的方法,其进一步包括以下步骤:
(i)将5’末端磷酸基团引入到所述修饰的非编码RNA的第一个核苷酸上;
(ii)切割所述修饰的非编码RNA的一个或多个3’末端核苷酸以产生具有3’末端羟基的修饰的非编码RNA;和
(iii)在环化连接酶的存在下环化步骤(ii)中产生的所述修饰的非编码RNA;
由此所述环化连接酶在所述修饰的非编码RNA的3’核苷酸和所述修饰的非编码RNA的5’核苷酸之间形成共价键以产生环状修饰的非编码RNA,其中所述结构序列的一个或多个拷贝位于所述多聚-A区和所述非编码RNA序列之间。
171.权利要求166或170所述的方法,其中所述修饰的非编码RNA在支架核酸存在下环化,其中所述支架核酸是能够与所述修饰的非编码RNA杂交的核酸,其中与所述支架核酸结合时,所述修饰的非编码RNA形成环状二级结构。
172.权利要求171所述的方法,其中所述支架核酸包含:
(a)包含5个或更多个核苷酸的第一杂交序列,其中所述第一杂交序列与所述修饰的非编码RNA的至少前五(5)个核苷酸互补;和
(b)包含5个或更多个核苷酸的第二杂交序列,其中所述第二杂交序列与所述修饰的非编码RNA的至少后五(5)个核苷酸互补;
其中所述修饰的非编码RNA的至少前五(5)个核苷酸与所述第一杂交序列杂交,并且所述修饰的非编码RNA的至少后五(5)个核苷酸与所述第二杂交序列杂交。
173.权利要求171或172所述的方法,其中所述第一杂交序列的最后一个核苷酸和所述第二杂交序列的第一个核苷酸在所述支架核酸中相邻并且不被任何其他核苷酸分开。
174.权利要求166或170所述的方法,其中所述修饰的非编码RNA包含:
(i)位于所述开放阅读框5’的第一自杂交序列;
(ii)位于所述开放阅读框3’的第二自杂交序列;
(iii)位于所述第一自杂交序列5’的第一非杂交序列;和
(iv)位于所述第二自杂交序列3’的第二非杂交序列,
其中所述第一自杂交序列和第二自杂交序列能够彼此杂交,
其中所述第一自杂交序列和第二自杂交序列不能彼此杂交。
175.权利要求174所述的方法,其中所述第一自杂交序列和第二自杂交序列的杂交形成二级结构,其中所述修饰的非编码RNA的5’末端核苷酸和3’末端核苷酸分开的距离小于
176.权利要求175所述的方法,其中所述5’末端核苷酸和所述3’末端核苷酸分开的距离小于小于/>小于/>小于/>小于/> 小于/>小于/>小于/>或小于
177.权利要求166或170-176中任一项所述的方法,其中所述环化连接酶是T4 RNA连接酶。
178.权利要求168-177中任一项所述的方法,其中所述结构序列是G-四链体序列。
179.权利要求178所述的方法,其中所述G-四链体是RNA G-四链体序列。
180.权利要求179所述的方法,其中所述RNA G-四链体序列包含SEQ ID NO:2的核酸序列。
181.权利要求180所述的方法,其中所述加尾核酸包含SEQ ID NO:2的核酸序列的至少3个拷贝。
182.权利要求178所述的方法,其中所述G-四链体是DNA G-四链体序列。
183.权利要求182所述的方法,其中所述DNA G-四链体序列包含SEQ ID NO:3的核酸序列。
184.权利要求183所述的方法,其中所述加尾核酸包含SEQ ID NO:3的核酸序列的至少3个拷贝。
185.权利要求168-177中任一项所述的方法,其中所述结构序列是端粒重复序列。
186.权利要求185所述的方法,其中所述端粒重复序列包含SEQ IDNO:4的核酸序列。
187.权利要求186所述的方法,其中所述加尾核酸包含SEQ ID NO:4的核酸序列的至少3个拷贝。
188.权利要求168-177中任一项的方法,其中所述结构序列是包含能够相互作用以形成适体的至少两个核苷酸的适体序列,其中所述适体是能够结合靶分子的二级结构。
189.权利要求163-188中任一项所述的方法,其中所述RNA的5’核苷酸不包含5’末端磷酸基团;
其中所述RNA的3’核苷酸包含3’末端羟基;
其中所述加尾核酸的5’核苷酸包含5’末端磷酸基团;和
其中所述加尾核酸的3’核苷酸不包含3’末端羟基。
190.权利要求163-188中任一项所述的方法,其中所述RNA的5’核苷酸不包含5’末端羟基;
其中所述RNA的3’核苷酸包含3’末端磷酸基团;
其中所述加尾核酸的5’核苷酸包含5’末端羟基;
其中所述加尾核酸的3’核苷酸不包含3’末端磷酸基团;并且
其中所述RNA连接酶是RtcB连接酶。
191.权利要求163-190中任一项所述的修饰的mRNA,其中所述加尾核酸的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少14%、至少16%、至少18%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的核苷酸是修饰的核苷酸。
192.权利要求163-191中任一项的方法,其中所述加尾核酸的最后25个核苷酸中的至少4、5、6、7、8、9、10、15、20或25个是修饰的核苷酸。
193.权利要求163-192中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的核碱基。
194.权利要求193所述的方法,其中所述修饰的核碱基选自黄嘌呤、烯丙氨基尿嘧啶、烯丙氨基胸苷、次黄嘌呤、地高辛化腺嘌呤、地高辛化胞嘧啶、地高辛化鸟嘌呤、地高辛化尿嘧啶、6-氯嘌呤核苷、N6-甲基腺嘌呤、甲基假尿嘧啶、2-巯基胞嘧啶、2-硫尿嘧啶、5-甲基尿嘧啶、4-硫代胸苷、4-硫尿嘧啶、5,6-二氢-5-甲基尿嘧啶、5,6-二氢尿嘧啶、5-[(3-吲哚基)丙酰胺-N-烯丙基]尿嘧啶、5-氨基烯丙基胞嘧啶、5-氨基烯丙基尿嘧啶、5-溴尿嘧啶、5-溴胞嘧啶、5-羧基胞嘧啶、5-羧甲基酯尿嘧啶、5-羧基尿嘧啶、5-氟尿嘧啶、5-甲酰胞嘧啶、5-甲酰尿嘧啶、5-羟基胞嘧啶、5-羟甲基胞嘧啶、5-羟甲基尿嘧啶、5-羟基尿嘧啶、5-碘胞嘧啶、5-碘尿嘧啶、5-甲氧基胞嘧啶、5-甲氧基尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶、5-炔丙基氨基胞嘧啶、5-炔丙基氨基尿嘧啶、5-丙炔基胞嘧啶、5-丙炔基尿嘧啶、6-氮杂胞嘧啶、6-氮杂尿嘧啶、6-氯嘌呤、6-硫鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、7-脱氮-7-炔丙基氨基腺嘌呤、7-脱氮-7-炔丙基氨基鸟嘌呤、8-氮杂腺嘌呤、8-叠氮腺嘌呤、8-氯腺嘌呤、8-氧代腺嘌呤、8-氧代鸟嘌呤、阿糖腺嘌呤、阿糖胞嘧啶、阿糖鸟嘌呤、阿糖尿嘧啶、生物素-16-7-脱氮-7-炔丙基氨基鸟嘌呤、生物素-16-氨基烯丙基胞嘧啶、生物素-16-氨基烯丙基尿嘧啶、花青3-5-炔丙基氨基胞嘧啶、花青3-6-炔丙基氨基尿嘧啶、花青3-氨基烯丙基胞嘧啶、花青3-氨基烯丙基尿嘧啶、花青5-6-炔丙基氨基胞嘧啶、花青5-6-炔丙基氨基尿嘧啶、花青5-氨基烯丙基胞嘧啶、花青5-氨基烯丙基尿嘧啶、花青7-氨基烯丙基尿嘧啶、dabcyl-5-3-氨基烯丙基尿嘧啶、脱硫生物素-16-氨基烯丙基-尿嘧啶、脱硫生物素-6-氨基烯丙基胞嘧啶、异鸟嘌呤、N1-乙基假尿嘧啶、N1-甲氧基甲基假尿嘧啶、N1-甲基腺嘌呤、N1-甲基假尿嘧啶、N1-丙基假尿嘧啶、N2-甲基鸟嘌呤、N4-生物素-OBEA-胞嘧啶、N4-甲基胞嘧啶、N6-甲基腺嘌呤、O6-甲基鸟嘌呤、假异胞嘧啶、假尿嘧啶、噻吩胞嘧啶、噻吩鸟嘌呤、噻吩尿嘧啶、黄苷、3-脱氮腺嘌呤、2,6-二氨基腺嘌呤、2,6-达氨基鸟嘌呤、5-甲酰胺-尿嘧啶、5-乙炔基尿嘧啶、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-(顺式羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰腺嘌呤(g6A)、N6-苏氨酰氨基甲酰腺嘌呤(t6A)、2-甲硫基-N6-苏氨酰氨基甲酰腺嘌呤(ms2t6A)、N6-甲基-N6-苏氨酰氨基甲酰腺嘌呤(m6t6A)、N6-羟基正缬氨酰氨基甲酰腺嘌呤(hn6A)、2-甲硫基-N6-羟基正缬氨酰氨基甲酰腺嘌呤(ms2hn6A)、N6,N6-二甲基腺嘌呤(m62A)和N6-乙酰腺嘌呤(ac6A)。
195.权利要求163-194中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的糖。
196.权利要求195所述的方法,其中所述修饰的糖选自2’-硫代核糖、2’,3’-二脱氧核糖、2’-氨基-2’-脱氧核糖、2’-脱氧核糖、2’-叠氮基-2’-脱氧核糖、2’-氟-2’-脱氧核糖、2’-O-甲基核糖、2’-O-甲基脱氧核糖、3’-氨基-2’,3’-二脱氧核糖、3’-叠氮基-2’,3’-二脱氧核糖、3’-脱氧核糖、3’-O-(2-硝基苄基)-2’-脱氧核糖、3’-O-甲基核糖、5’-氨基核糖、5’-硫代核糖、5-硝基-1-吲哚基-2’-脱氧核糖、5’-生物素-核糖、2’-O,4’-C-亚甲基连接的、2’-O,4’-C-氨基连接的核糖和2’-O,4’-C-硫代连接的核糖。
197.权利要求163-196中任一项所述的方法,其中至少一个修饰的核苷酸包含2’修饰。
198.权利要求197所述的方法,其中所述2’修饰选自锁核酸(LNA)修饰、2’-氟(2’-F)、2’-O-甲氧基-乙基(2’-MOE)和2’-O-甲基化(2’-OMe)。
199.权利要求163-198中任一项所述的方法,其中至少一个修饰的核苷酸包含修饰的磷酸酯。
200.权利要求199所述的方法,其中所述修饰的磷酸酯选自硫代磷酸酯(PS)、二硫代磷酸酯、硫代磷酸盐、5’-O-甲基膦酸酯、3’-O-甲基膦酸酯、5’-羟基膦酸酯、羟基磷酸酯、硒代磷酸酯、硒代磷酸盐、氨基磷酸酯、碳膦酸酯、甲基膦酸酯、苯基膦酸酯、乙基膦酸酯、H-膦酸酯、胍环、三唑环、硼膦酸酯(BP)、甲基膦酸酯和胍基丙基氨基磷酸酯。
201.权利要求163-200中任一项所述的方法,其中所述加尾核酸包含至少3个、至少4个、至少5个或至少6个硫代磷酸酯。
202.权利要求201所述的方法,其中所述加尾核酸包含至少6个硫代磷酸酯。
203.权利要求163-201中任一项所述的方法,其中所述加尾核酸包含至少3个鸟嘌呤核苷酸和至少3个硫代磷酸酯。
204.权利要求163-203中任一项所述的方法,其中所述加尾核酸包含至少6个包含2’修饰的核苷酸。
205.权利要求163-204中任一项所述的方法,其中所述加尾核酸包含至少3个脱氧核糖糖。
206.权利要求205所述的方法,其中所述加尾核酸包含至少5个、至少10个、至少15个、至少20个或至少23个脱氧核糖糖。
207.权利要求206所述的方法,其中所述加尾核酸包含至少23个脱氧核糖糖。
208.权利要求163-168或178-207中任一项所述的方法,其中所述加尾核酸的3’末端核苷酸包含双脱氧腺苷、双脱氧胞苷、双脱氧鸟苷、双脱氧胸苷、双脱氧尿苷或反向脱氧胸苷。
209.权利要求163-208中任一项所述的方法,其中所述加尾核酸包含第一修饰的核苷酸和第二修饰的核苷酸,其中所述第一修饰的核苷酸和第二修饰的核苷酸包含不同的结构。
210.权利要求163-209中任一项所述的方法,其中所述修饰的非编码RNA的多聚-A区的至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%是腺苷核苷酸。
211.权利要求163-210中任一项所述的方法,其中所述修饰的非编码RNA的多聚-A区包含至少25-500个核苷酸。
212.权利要求211所述的方法,其中所述修饰的非编码RNA的多聚-A区包含至少50个、至少100个、至少150个或至少200个核苷酸。
213.权利要求163-212中任一项所述的方法,其中所述RNA连接酶是T4 RNA连接酶。
214.通过权利要求106-162中任一项所述的方法产生的修饰的mRNA。
215.权利要求1-59或214中任一项所述的修饰的mRNA,其中所述mRNA编码抗原或治疗性蛋白。
216.权利要求215所述的修饰的mRNA,其中所述抗原是病毒抗原、细菌抗原、原生动物抗原或真菌抗原。
217.权利要求215所述的修饰的mRNA,其中所述治疗性蛋白是酶、转录因子、细胞表面受体、生长因子或凝血因子。
218.权利要求1-59或215-217中任一项所述的修饰的mRNA,其中对所述开放阅读框进行密码子优化以用于在细胞中表达。
219.权利要求218所述的修饰的mRNA,其中对所述修饰的mRNA进行密码子优化以用于在哺乳动物中表达。
220.权利要求219所述的修饰的mRNA,其中对所述修饰的mRNA进行密码子优化以用于在人细胞中表达。
221.通过权利要求163-213中任一项所述的方法产生的修饰的非编码RNA。
222.权利要求60-105或221中任一项所述的修饰的非编码RNA,其中所述修饰的非编码RNA是指导RNA(gRNA)、引物编辑指导RNA(pegRNA)或长非编码RNA (lncRNA)。
223.脂质纳米颗粒,其包含权利要求1-59或214-220中任一项所述的修饰的mRNA或权利要求60-105、221或222中任一项所述的修饰的非编码RNA。
224.细胞,其包含权利要求1-59或214-220中任一项所述的修饰的mRNA或权利要求60-105、221或222中任一项所述的修饰的非编码RNA。
225.权利要求224所述的细胞,其中所述细胞是哺乳动物细胞。
226.权利要求225所述的细胞,其中所述细胞是人细胞。
227.组合物,其包含权利要求1-59或214-220中任一项所述的修饰的mRNA、权利要求60-105、221或222中任一项所述的修饰的非编码RNA、权利要求223所述的脂质纳米颗粒、或权利要求224-226中任一项所述的细胞。
228.药物组合物,其包含权利要求227所述的组合物和药学上可接受的赋形剂。
229.方法,其包括将权利要求1-59或214-220中任一项所述的mRNA、权利要求60-105、221或222中任一项所述的修饰的非编码RNA或权利要求223所述的脂质纳米颗粒引入到细胞中。
230.方法,其包括将权利要求1-59或214-220中任一项所述的mRNA、权利要求60-105、221或222中任一项所述的修饰的非编码RNA、权利要求223所述的脂质纳米颗粒、权利要求224-226中任一项所述的细胞或权利要求227或228所述的组合物引入到受试者中。
231.对受试者进行疫苗接种的方法,其包括将权利要求1-59或214-220中任一项所述的修饰的mRNA、权利要求223所述的脂质纳米颗粒、权利要求224-226中任一项所述的细胞或权利要求227或228所述的组合物引入到所述受试者中,其中所述修饰的mRNA的开放阅读框编码抗原。
232.替代受试者中的酶的方法,其包括将权利要求1-59或214-220中任一项所述的修饰的mRNA、权利要求223所述的脂质纳米颗粒、权利要求224-226中任一项所述的细胞或权利要求227或228所述的组合物引入到所述受试者中,其中所述修饰的mRNA的开放阅读框编码酶。
233.修饰受试者的基因组的方法,其包括将权利要求60-105、221或222中任一项所述的修饰的非编码RNA、权利要求223所述的脂质纳米颗粒或权利要求227或228所述的组合物引入到受试者中。
234.权利要求230-233中任一项所述的方法,其中所述受试者是哺乳动物。
235.权利要求234所述的方法,其中所述受试者是人。
236.权利要求1-59或214-220中任一项所述的修饰的mRNA,权利要求60-105、221或222中任一项所述的修饰的非编码RNA,权利要求223所述的脂质纳米颗粒,权利要求224-226中任一项所述的细胞,或权利要求227或228所述的组合物,其用作药物。
237.试剂盒,其包含权利要求106-213中任一项所述的RNA和所述加尾核酸。
238.权利要求237所述的试剂盒,其进一步包含RNA连接酶。
239.试剂盒,其包含权利要求228所述的药物组合物和递送装置。
240.用于纯化修饰的mRNA或修饰的非编码RNA的方法,其包括:
使包含权利要求1-59中任一项所述的修饰的mRNA或权利要求60-105中任一项所述的修饰的非编码RNA的混合物与纯化介质接触,其中所述修饰的mRNA或修饰的非编码RNA与所述纯化介质相互作用以形成修饰的RNA-纯化介质缀合物;
从所述混合物中分离所述修饰的RNA-纯化介质缀合物;和
用溶剂从所述修饰的RNA-纯化介质缀合物中洗脱所述修饰的mRNA或所述修饰的非编码RNA。
241.权利要求240所述的方法,其中所述纯化介质包含顺磁珠。
CN202280049567.0A 2021-05-12 2022-05-11 修饰的mRNA、修饰的非编码RNA及其用途 Pending CN118076741A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/187,752 2021-05-12
US202163288522P 2021-12-10 2021-12-10
US63/288,522 2021-12-10
PCT/US2022/028849 WO2022241045A1 (en) 2021-05-12 2022-05-11 Modified mrna, modified non-coding rna, and uses thereof

Publications (1)

Publication Number Publication Date
CN118076741A true CN118076741A (zh) 2024-05-24

Family

ID=91109566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280049567.0A Pending CN118076741A (zh) 2021-05-12 2022-05-11 修饰的mRNA、修饰的非编码RNA及其用途

Country Status (1)

Country Link
CN (1) CN118076741A (zh)

Similar Documents

Publication Publication Date Title
AU2022201266B2 (en) Targeted rna editing
CN111819185A (zh) 包含环状多核糖核苷酸的组合物及其用途
CN113544269A (zh) 环状多核糖核苷酸及其药物组合物
JP2024518546A (ja) 修飾されたmRNA、修飾された非コードRNA、およびその使用
CN113661242A (zh) 包含经修饰的环状多核糖核苷酸的组合物及其用途
CN112567038A (zh) 包含环状多核糖核苷酸的组合物及其用途
EP2488641B1 (en) Supercoiled minicircle dna for gene therapy applications
KR20220123398A (ko) 합성 가이드 rna, 이의 조성물, 방법 및 용도
EP4085931A1 (en) New method for targeted editing of rna
EP4214321A1 (en) Self-targeting expression vector
WO2023141474A9 (en) Poly-tailed and poly-capped mrna and uses thereof
CN118076741A (zh) 修饰的mRNA、修饰的非编码RNA及其用途
JP2022546302A (ja) ダンベル型dnaベクターを作出するための方法
Wei et al. Functional XNA and Biomedical Application
EP2770054A1 (en) Activation of functional nucleic acid by specific modification
EP4019088A1 (en) Rna action inhibitor and use thereof
WO2022256578A2 (en) Circular guide rnas for crispr/cas editing systems
JP2024521304A (ja) 環状ポリリボヌクレオチドを濃縮する方法
WO2024137392A1 (en) Method of preparing self-circularized rna
Kumari et al. Nanoparticles for locked nucleic acid delivery
WO2023250528A1 (en) Compositions and methods for preparing capped circular rna molecules
Kumari et al. 1Central University of Rajasthan, Ajmer, India; 2The IIS University, Jaipur, India
NZ732182B2 (en) Targeted rna editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination