CN116917475A - 用于增加合成核糖核酸(rna)的蛋白质表达的工程化表达构建体 - Google Patents

用于增加合成核糖核酸(rna)的蛋白质表达的工程化表达构建体 Download PDF

Info

Publication number
CN116917475A
CN116917475A CN202280016860.7A CN202280016860A CN116917475A CN 116917475 A CN116917475 A CN 116917475A CN 202280016860 A CN202280016860 A CN 202280016860A CN 116917475 A CN116917475 A CN 116917475A
Authority
CN
China
Prior art keywords
utr
sequence
eec
seq
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280016860.7A
Other languages
English (en)
Inventor
K·穆萨维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ribozi LLC
Original Assignee
Ribozi LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ribozi LLC filed Critical Ribozi LLC
Publication of CN116917475A publication Critical patent/CN116917475A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本公开涉及通过利用合成mRNA的5’和/或3’非翻译区(UTR)中的翻译增强元件增强细胞中的蛋白质表达。所述5’UTR包括启动子、微型增强子序列和Kozak序列,而所述3’UTR包括间隔区、茎环结构和任选的聚腺嘌呤尾。所述人工5’和3’UTR增加蛋白质表达,并且在某些实例中,不包括经修饰的核苷、微RNA位点或免疫逃避因子。

Description

用于增加合成核糖核酸(RNA)的蛋白质表达的工程化表达构 建体
相关申请的交叉引用
本申请要求2021年2月25日提交的美国临时专利申请号63/153,877的优先权,所述临时专利申请以引用方式整体并入本文。
关于序列表的引用
与本申请相关的序列表以文本格式代替纸质副本提供,并且特此以引用的方式并入本说明书中。含有序列表的文本文件的名称是P183-0010PCT_ST25.txt。该文本文件是26.9KB,于2022年2月24日创建,并且经由EFS-Web以电子方式提交。
技术领域
本公开提供了具有位于编码序列侧翼的人工5'和/或3'非翻译区(UTR)的工程化表达构建体。所述5’UTR包括启动子、微型增强子序列和Kozak序列,而所述3’UTR包括间隔区、茎环结构和任选的聚腺嘌呤尾。所述人工5’和3’UTR增加蛋白质表达,并且在某些实例中,不包括经修饰的核苷、微RNA位点或免疫逃避因子。
背景技术
用于影响蛋白质表达的现有方法充满了问题。例如,外源引入的脱氧核糖核酸(DNA)可能以一定频率整合到宿主细胞基因组DNA中。这种整合导致宿主细胞基因组DNA的改变和/或损伤。可替代地,引入到细胞中的这种外源DNA可以被子细胞(无论外源DNA是否已整合到染色体中)或后代遗传。进一步地,即使正确递送并且没有损伤或整合到宿主基因组中,在从DNA链产生编码的蛋白质之前也必须进行多个步骤。一旦处于细胞内,DNA就必须转运到细胞核中,在细胞核中该DNA转录成RNA。然后,从DNA转录的RNA必须进入细胞质,在细胞质中该RNA翻译成蛋白质。从经转染的DNA到产生的蛋白质的这些多个加工步骤导致最终产生功能性蛋白质之前存在滞后时间,每个步骤均代表着错误和细胞损伤的机会。进一步地,通常难以获得细胞中所需的蛋白质表达水平,因为经转染的DNA可能不表达或者不以所需用途必需的合理速率或浓度表达。当DNA被引入到原代细胞或经修饰的细胞系中时,这可能是一个特殊问题。
信使RNA(mRNA)也因可能允许对细胞进行短期修饰而被检查。使用mRNA作为一种可逆基因疗法的优点包括瞬时表达和非转化特征。mRNA不需要进入细胞核中以便被表达,而且不能整合到宿主基因组中,从而消除了肿瘤发生的风险。mRNA可达到的转染率相对较高,对于许多细胞类型甚至>90%,因此无需选择经转染的细胞。
尽管mRNA作为治疗剂和mRNA作为疫苗领域最近取得重大发展,但本领域仍然需要进一步研究使用mRNA来增加蛋白质表达水平。
发明内容
技术问题。
本公开的一个目的是提供增加所编码的蛋白质的表达水平的工程化核糖核酸(例如,mRNA)。
本公开的另一个目的是提供增加所编码的蛋白质的表达水平的最小序列。
问题的解决方案。
为此,本公开提出了某些工程化表达构建体(EEC)增加所编码的蛋白质的表达水平。EEC具有位于编码序列侧翼的人工5'和/或3'非翻译区(UTR)。所述5’UTR包括启动子、微型增强子序列(本文中为CAUACUCA)和Kozak序列,而所述3’UTR包括间隔区、茎环结构和任选的聚腺嘌呤尾(聚A尾)。在某些实例中,5'UTR可操作地连接至起始密码子以产生可操作区段。在本文的某些实例中,3'UTR还被描绘为包括终止密码子。
关于工程化的5'UTR,在某些实例中,启动子源自噬菌体T7启动子并且具有序列GGGAGA。在某些实例中,Kozak序列包括GCCRCC,其中R是A或G。Kozak序列还可以可操作地连接至起始密码子以产生序列GCCRCC-起始(例如,GCCRCCAUG)。
5’UTR的具体实施方案从5'至3'包括:微型T7启动子、微型增强子序列(本文中为CAUACUCA)和Kozak序列,从而产生GGGAGACAUACUCAGCCACC(SEQ ID NO:2)或GGGAGACAUACUCAGCCGCC(SEQ ID NO:3)。起始密码子的添加提供了GGGAGACAUACUCAGCCACCAUG(SEQ ID NO:38)和GGGAGACAUACUCAGCCGCCAUG(SEQ ID NO:39)。
在某些实例中,这些最小5’UTR具有少于30个核苷酸。在某些实例中,这些最小5’UTR具有20或23个核苷酸。
关于工程化的3’UTR,在某些实例中,间隔区包括[N1-3]AUA或[N1-3]AAA。在更具体的实例中,间隔区包括UGCAUA或UGCAAA。示例性的茎环结构是通过杂交诸如CCUC和GAGG的序列形成。在某些实例中,杂交序列之间形成的环结构的长度为7至15个核苷酸。环区段的示例性序列包括UAACGGUCUU(SEQ ID NO:34)。当被包含作为3’UTR序列的一部分时,示例性的终止密码子包括UAA、UAG和UGA。
在某些实例中,这些最小3’UTR具有少于30个核苷酸。
关于茎环,无论茎环序列的顺序如何,在本文公开的EEC情况下都观察到增加的蛋白质表达,这表明二级结构可能很重要,不一定是处于5'至3'取向的序列。工程化的3'UTR可另外包含聚A(polyA)尾。
在一方面,本公开提供了EEC,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的目标蛋白质的编码序列,其中所述体外合成的RNA包含含有序列CAUACUCA的5’UTR。
在一方面,本公开提供了EEC,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的目标蛋白质的编码序列,其中所述体外合成的RNA包含含有SEQ ID NO:2或SEQ ID NO:3的5’UTR。该5’UTR也可与起始密码子一起呈现以提供SEQ IDNO:38和SEQ ID NO:39。
在一方面,本公开提供了EEC,其包含3’UTR,所述3’UTR包含SEQ ID NO:4、5、6、7、8或9。
在一方面,本公开提供了EEC,其包含3’UTR,所述3’UTR包含SEQ ID NO:10、11或12。
在一方面,本公开提供了EEC,其包含3’UTR,所述3’UTR包含SEQ ID NO:13、14、15、16、17、18、19、20或21。
SEQ ID NO:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20和21中的每一者均可被构建为包括聚A尾。
在一方面,本公开提供了EEC,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的目标蛋白质的编码序列,其中所述体外合成的RNA包含含有序列CAUACUCA的5’UTR和包含SEQ ID NO:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20和/或21的3’UTR。
在一方面,本公开提供了EEC,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的目标蛋白质的编码序列,其中所述体外合成的RNA包含含有SEQ ID NO:2或SEQ ID NO:3的5’UTR和包含SEQ ID NO:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20和/或21的3’UTR。
在一方面,本公开提供了EEC,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的目标蛋白质的编码序列,其中所述体外合成的RNA包含含有SEQ ID NO:38或SEQ ID NO:39的5’UTR和包含SEQ ID NO:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20和/或21的3’UTR。
在具体实施方案中,本文公开的EEC不包含任何经修饰的核苷。在具体实施方案中,本文公开的EEC不包含任何微RNA结合位点。在具体实施方案中,本文公开的EEC不包含任何经修饰的核苷并且不包含任何微RNA结合位点。
在公开的EEC中,工程化的5'和3’UTR位于开放阅读框内的编码序列的侧翼。本公开中提供的数据显示,无论转染方式如何,绿色荧光蛋白(GFP)、白细胞介素-2(IL-2)和POU5F1(OCT3/4)在多种细胞类型(例如,淋巴样及贴壁和悬浮胚胎肾细胞)中的表达增加。
本文公开的EEC可用于增加多种蛋白质的表达以用于多种不同的目的。示例性的目的包括在治疗剂和疫苗中的用途。
附图说明
一些附图可能在彩色情况下更好理解。申请人将附图的彩色版本视为原始提交文件的一部分,并且保留在以后的诉讼中呈递彩色版本的权利。
图1示出了设计用于增加体内蛋白质表达的EEC的示意图。EEC在其内含有多个模块以增加蛋白质表达。位于5'UTR内的模块分为三个模块:模块1(“M1”),其代表启动子(例如,T7启动子六聚体);模块2(“M2”),其代表独特的翻译增强子(CAUACUCA,本文所述);和模块3(“M3”),其为Kozak共有序列。所描绘的示例性3'UTR也分为包括终止密码子、间隔区和茎环区段的三个区段。还可以包括聚A尾。
图2示出了在x轴上展示GFP强度(FL1-H)并且在y轴上展示细胞计数的流式细胞术直方图。用增加量的EEC转染EXPI293细胞,该EEC携有如本文所述的本发明的5’UTR(SEQ IDNO:2)和3’UTR(SEQ ID NO:10)序列,并且具有位于它的开放阅读框内的GFP编码序列(参见SEQ ID NO:55和56)。如图所示,转染后24小时,在0.4皮摩尔(100ng)的EEC下达到GFP信号饱和。
图3A和图3B示出了编码GFP的EEC 5’UTR变体在转染后三小时(3A)和转染后24小时(3B)的流式细胞术图,该图在x轴上展示GFP强度(FL1-H)并且在y轴上展示细胞计数。来自流式细胞术实验的结果也以条形图形式提供。用等摩尔量的编码GFP的EEC 5’UTR变体、无RNA(阴性对照)、无5’UTR mRNA、M1和M3模块仅5'UTR,以及M1、M2和M3模块5'UTR(SEQ IDNO:2)转染EXPI293细胞。
图4A和图4B示出了编码GFP的EEC 5’UTR和3’UTR变体在转染后三小时(4A)和转染后24小时(4B)的流式细胞术图,该图在x轴上展示GFP强度(FL1-H)并且在y轴上展示细胞计数。来自流式细胞术实验的结果也以条形图形式提供。用等摩尔量的编码GFP的EEC 5’UTR和3'UTR变体转染的EXPI293细胞:
(i)无RNA(阴性对照);
(ii)对于没有5'UTR的3'UTR,仅3’UTR的mRNA(UGCAUACCUCUAACGGUCUUGAGG(SEQID NO:10)或UAAUGCAUACCUCUAACGGUCUUGAGG(SEQ ID NO:13),除了用于允许转录的UTR的基本形式GGGAGAAUG(ORF)外);
(iii)仅5'UTR加上3’UTR的M3(作为5'UTR的UAAUGCAUACCUCUAACGGUCUUGAGG(SEQID NO:13)和作为3'UTR的GGGAGAGCCACCAUG(ORF)(SEQ ID NO:63));以及
(iv)M1、M2和M3 5’UTR(SEQ ID NO:2)加上3’UTR(SEQ ID NO:10)。注意接受具有全长5’(SEQ ID NO:2)+3’(SEQ ID NO:10)UTR的EEC的细胞表现出最高的GFP强度。
图5例示了使用本文公开的EEC表达的三种不同类型的蛋白质:在细胞质、细胞器(即核区室)和细胞外区室(即分泌性蛋白质)中的蛋白质的靶向表达。
图6A-图6C图示了表达GFP蛋白的HEK293细胞。(6A)描绘了流式细胞术图,该流式细胞术图展示了GFP强度(x轴)和随着转染到HEK293细胞中的编码GFP的EEC的量增加而发生的检测偏移(在标记为“无mRNA”的图中不存在编码GFP的EEC mRNA;其它图示出0.2皮摩尔的编码GFP的EEC mRNA;0.4皮摩尔的编码GFP的EEC mRNA、1.0皮摩尔的编码GFP的EECmRNA、2.0皮摩尔的编码GFP的EEC mRNA和4.0皮摩尔的编码GFP的EEC mRNA,如图的标题所指示)。(6B)示出了解释来自6A中的流式细胞术图的关于GFP阳性细胞的百分比相对于编码GFP的EEC的施用的增加而增加的结果的图表。为了制作6B中的图表,y轴示出GFP阳性HEK293细胞的百分比,x轴示出编码GFP的EEC mRNA的量。因而,6B描绘了GFP阳性细胞的百分比随着编码GFP的EEC mRNA的增加而增加。(6C)解释了来自6A中的流式细胞术图的关于中位GFP强度随着GFP表达阳性的细胞中转染的编码GFP的EEC的水平的增加而成比例增加的结果。为了制作6C中的图表,y轴示出表达GFP的细胞的中位GFP强度(FLI-H),x轴示出编码GFP的EEC mRNA的量。因而,6C说明了随着编码GFP的EEC mRNA增加,中位GFP强度成比例增加。
图7A-图7C示出用编码GFP的EEC变体转染后表达GFP蛋白的HEK293细胞。(7A)例示了使利用0.4皮摩尔的编码GFP的EEC变体转染的细胞的GFP强度(x轴)叠加的直方图。(7B)与(7A)类似,不同之处在于细胞是用1皮摩尔的编码GFP的EEC变体转染的。(7C)示出条形图,该条形图显示出用等摩尔水平的编码GFP的EEC变体转染的HEK293细胞的中位GFP强度(n=2)。该变体包含仅5’UTR(SEQ ID NO:2);仅3'UTR(如图4B的描述中更详细描述的);5'和3’UTR(SEQ ID NO:2和SEQ ID NO:10,如图4B的描述中更详细描述的);仅Kozak;以及Kozak和3’UTR(SEQ ID NO:10)。
图8A和图8B示出了在用编码GFP的EEC变体转染后表达GFP蛋白的Jurkat(T)淋巴细胞。(8A)展示出流式细胞术图,该图指示出用各种编码GFP的EEC(全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR转染的每个细胞组中存在的GFP阳性Jurkat细胞的量。(8B)示出流式细胞术直方图,该图指示出用各种编码GFP的EEC 5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR EEC构建体转染的每个细胞组中GFP阳性Jurkat细胞的量。来自(8A)中流式细胞术图的结果以线图形式提供,该线图展示了用增加量的具有全长5’(SEQ ID NO:2)和3’(SEQ IDNO:10)UTR的编码GFP的EEC转染的GFP阳性Jurkat细胞的百分比。来自(8B)的流式细胞术实验的结果以条形图形式提供,该条形图展示了用8皮摩尔的编码GFP的EEC变体转染的Jurkat细胞的GFP强度和百分比(n=2)。呈现了没有UTR;仅Kozak;仅5';仅3';5'和3';及Kozak和3'的变体的数据。关于这些变体中使用的序列的详情可以在图4B和图7C的描述中找到。
图9A-图9C示出了在用携有UTR变体的编码GFP的EEC对淋巴细胞进行电穿孔后24小时Jurkat(T)淋巴细胞中GFP表达的量。(9A)展示了具有使用4皮摩尔的每种编码GFP的EEC变体转染的Jurkat细胞的GFP强度和百分比的直方图的代表性实例。(9B)示出了展示用8皮摩尔的每种编码GFP的EEC变体转染的Jurkat细胞的GFP强度和百分比的直方图的代表性实例。(9C)是展示如(9A)和(9B)中所示,用4皮摩尔和8皮摩尔的编码GFP的EEC变体的淋巴细胞的中位GFP强度{实验次数=2}的条形图。
图10A-图10C示出了代表性实验,在该实验中在用携有UTR变体的编码GFP的EEC对表达GFP蛋白的Raji淋巴细胞进行电穿孔后24小时,使该淋巴细胞经受流式细胞术分析。(10A)示出用4皮摩尔的编码GFP的EEC变体转染的Raji淋巴细胞的GFP强度和百分比的图。(10B)展示了用8皮摩尔的编码GFP的EEC变体转染的细胞的GFP强度和百分比的代表性图。(10C)展示了代表如(10A)和(10B)中所示的实验的中位GFP强度{实验次数=2}的条形图,该图示出分别用4皮摩尔和8皮摩尔的编码GFP的EEC变体转染的Raji淋巴细胞的GFP强度。呈现了没有UTR;仅Kozak;仅5'(SEQ ID NO:2);仅3'(SEQ ID NO:10);5'和3'((SEQ ID NO:2)和(SEQ ID NO:10));及Kozak和3’(SEQ ID NO:10)的变体的数据。
图11A和图11B示出在用携有本文公开的5’-3’UTR变体的编码hOCT3/4的EEC转染后24小时HEK293细胞中hOCT3/4蛋白的表达。(11A)示出代表性流式细胞术实验的结果,该结果指示出用增加量的编码hOCT3/4的EEC(具有全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR)转染的hOCT3/4阳性HEK293细胞的hOCT3/4强度量和百分比。(11B)示出了来自代表性流式细胞术实验的结果,该结果展示了用1.2皮摩尔具有UTR变体的hOCT3/4转染的hOCT3/4+细胞的hOCT3/4强度量和百分比。来自(11A)中流式细胞术实验的结果也以线图形式提供。来自如(11B)中所示{实验次数=2}的实验的中位结果也以条形图的形式提供,该结果示出与无RNA的情况相比较的使用UTR变体时具有UTR变体的hOCT3/4的水平。
图12A和图12B示出在用具有本文公开的5’-3’UTR变体的编码hIL2的EEC转染后24小时来自HEK293细胞的hIL2蛋白的表达(如通过ELISA测量的)。(12A)展示的图显示ELISA信号的吸光度(在450nm下)随着编码hIL2的EEC{具有全长5’(SEQ ID NO:2)UTR和3’UTR(SEQ ID NO:10)}的施用增加而增加。(12B)展示的条形图显示用0.5皮摩尔具有UTR变体((SEQ ID NO:2)和(SEQ ID NO:10))的编码hIL2的EEC转染的HEK293细胞的hIL2相对水平。
图13A-图13C示出用全长5’(SEQ ID NO:2)UTR和3'UTR变体(SEQ ID NO:10、11和12)对编码GFP的EEC进行转染后HEK293细胞中GFP蛋白的表达。(13A)示出3'UTR变体的序列。(13B)展示出在用1-2皮摩尔的各种EEC转染后24小时的GFP阳性HEK293细胞百分比(基于10,000个事件/细胞,根据流式细胞术测量)。(13C)是展示用1-2皮摩尔具有如(13A)中所描绘的3'UTR变体A、B和C的编码GFP的EEC转染的HEK293细胞(来自两个单独的实验)的中位GFP强度的条形图。
图14.工程化Oct4 mRNA构建体转染后人包皮成纤维细胞中的Oct4表达(UO:未修饰的mRNA Oct4,UMD:未修饰的mRNA MyoD-Oct4,PUO:经修饰的mRNA Oct4,PUMD:经修饰的mRNA MyoD-Oct4)。
图15.支持本公开的另外的序列包括用于产生体外合成的RNA的cDNA构建体以及所得的用于EGFP、Oct4和IL2的合成RNA构建体(SEQ ID NO:55-60)。
具体实施方式
在使用RNA作为治疗剂、疫苗和/或以其它方式改变体外和体内细胞中的蛋白质表达方面已经取得了重大的科学进展。需要克服的最大问题之一是实现足够高水平的蛋白质表达以允许给定结果。已经进行了几种尝试以解决这个问题并增加靶蛋白的表达以使mRNA在各种临床环境中可用。这些研究公开于例如2006年6月8日提交、转让给RibostemLimited的现已放弃的US20060247195;2011年5月12日提交、转让给Moderna的已发布的美国专利10,772,975;2008年12月12日提交、作为WO2009077134公布、转让给BioNTech AG的PCT/EP2008/01059;2008年4月16日提交、作为WO2009127230公布、转让给Curevac GMBH的PCT/EP2008/03033;2016年12月29日提交、转让给Cellular Reprogramming,Inc.的PCT/US2016/069079;以及2019年6月13日提交、转让给Cellular Reprogramming,Inc.的PCT/US2019/037069。
基因的非翻译区(UTR)被转录但不被翻译。通常,5’UTR从转录启动位点开始,并延续到启动密码子,但不包括启动密码子;3'UTR从终止密码子之后开始,并延续到转录终止信号。信使RNA(mRNA)包括UTR,UTR被证明可募集核糖体、启动翻译并从而增加蛋白质表达。虽然根据前面的描述,起始密码子和终止密码子通常不被认为是UTR的一部分,但在本公开中,这些区段有时被包括在指定为UTR的序列内以产生操作区段。
关于UTR在核酸分子稳定性和由此引起的翻译/蛋白质表达方面发挥调控作用的证据越来越多。原核生物和真核生物中UTR内的序列不同。例如,Shine-Dalgarno共有序列(5'-AGGAGGU-3')在细菌中募集核糖体,而RNA Kozak共有序列(5’-GCCRCCRUGG-3’)包含启动密码子(AUG)并加强哺乳动物细胞中的翻译启动事件。
Kozak共有序列中的“R”表示腺苷或鸟苷。Kozak共有序列的-3位置增强翻译启动,并且作为一个整体,据信Kozak序列会阻止翻译启动复合物正确识别启动密码子。虽然Kozak共有序列本身可以驱动核糖体扫描和翻译启动,但分析了与人类转录组中高丰度蛋白质相关的另外的UTR。研究揭示与遗传信息加工相关的蛋白质(包括染色体和核糖体相关蛋白质)相对丰富(Beck等人,The quantitative proteome of a human cellline.Mol.Syst.Biol.(2011),doi:10.1038/msb.2011.82;Liebermeister等人,Visualaccount of protein investment in cellular functions.Proc.Natl.Acad.Sci.U.S.A.(2014),doi:10.1073/pnas.1314810111)。例如,高表达核糖体相关蛋白(RPL/RPS)的5'UTR的比对说明了出现5'端寡聚嘧啶轨迹(即5'TOP)或C/U(Lavallee-Adam等人,Functional5’UTR motif discovery with LESMoN:Local enrichment of sequence motifs inbiological networks.Nucleic Acids Res.(2017),doi:10.1093/nar/gkx751;Yoshihama等人,The human ribosomal protein genes:Sequencing and comparative analysis of73genes.Genome Res.(2002),doi:10.1101/gr.214202;Cardinali等人,La protein isassociated with terminal oligopyrimidine mRNAs in actively translatingpolysomes.J.Biol.Chem.(2003),doi:10.1074/jbc.M300722200;Pichon等人,RNABinding Protein/RNA Element Interactions and the Control ofTranslation.Curr.Protein Pept.Sci.(2012),doi:10.2174/13892031280161947)。通常,5'TOP序列位于起始密码子附近并且对于转录(即RNA合成)和转录物的翻译很重要。
通过工程化特定靶器官的丰富表达的基因中常见的特征,可以增加编码序列的蛋白质表达。例如,肝脏表达的mRNA(诸如白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、甲胎蛋白、促红细胞生成素或因子VIII)的5'UTR的引入可用于增强肝细胞系或肝脏中编码序列的表达。同样,使用其它组织特异性mRNA的5'UTR来改善该组织中的表达对于肌肉(MyoD、肌球蛋白、肌红蛋白、肌细胞生成素、棒状花椒酰胺)、内皮细胞(Tie-1、CD36),对于骨髓样细胞(C/EBP、AML1、G-CSF、GM-CSF、CD11b、MSR、Fr-1、i-NOS),对于白细胞(CD45、CD18),对于脂肪组织(CD36、GLUT4、ACRP30、脂联素)以及对于肺上皮细胞(SP-A/B/C/D)是可能的。
然而,UTR的长度可以是数百到数千个核苷酸(nt)。鉴于mRNA在治疗剂和疫苗中的用途,寻找最小/最佳UTR有利于增加和靶向的蛋白质在细胞中的表达。在某些实例中,本文公开的工程化表达构建体(EEC)被设计为具有最小UTR(minUT)。也就是说,EEC被设计为具有尽可能小的5'和/或3'UTR,但仍允许在预期用途中高水平表达。
因此,根据某些方面,本公开提供了明显增加蛋白质表达的最小UTR。在某些实例中,本公开提供了具有20-23个核苷酸的5'UTR。在某些实例中,本公开提供具有27个核苷酸或67个核苷酸的3’UTR,这取决于是否包括任选的聚A尾。则总的来说,5'和3’UTR组合的某些实例包括47-50个核苷酸或87-90个核苷酸。这些大小分布是有益的,特别是在治疗剂和/或疫苗应用中。
根据某些方面,为了构建minUT,本公开整合了体外mRNA和体内蛋白质的产生所必需的元件。为了体外产生mRNA,本公开采用来自T7噬菌体(T7P)的RNA聚合酶的用途。T7P与特定的DNA双螺旋序列(5’-TAATACGACTCACTATAG-3’(SEQ ID NO:45))结合并且通过掺入鸟苷(启动子中的最后一个G;加下划线)作为第一个核糖核苷酸来启动RNA合成。该结合序列后面通常是五聚体(5’-GGAGA-3’),该五聚体起到稳定转录复合物,促进T7P清除和RNA聚合物延伸的作用。
在具体实施方案中,5’UTR包括启动子、微型增强子序列(本文中为CAUACUCA)和Kozak序列,诸如Kozak序列的截短形式(GCCRCC)。在具体实施方案中,5’UTR被描述为也可操作地连接至起始密码子以产生可操作区段。
在具体实施方案中,选择最小启动子用于5’UTR内。最小启动子本身没有驱动基因表达的活性,但当连接到近端增强子元件时可以被激活以驱动基因表达。示例性的最小启动子包括minBglobin、minCMV、去除了SacI限制性位点的minCMV、minRho、去除了SacI限制性位点的minRho以及Hsp68最小启动子(proHSP68)。在具体实施方案中,最小启动子包括最小T7启动子(微型T7启动子)。
公开的5’UTR的某些实例包括独特的微型增强子序列(CAUACUCA)。微型增强子序列可以位于最小启动子(例如,T7)和Kozak共有序列之间,以产生具有20-23个核苷酸的最小5’UTR(取决于是否将起始密码子指定为UTR的一部分)。真核翻译通常以AUG密码子开始,然而也可以包括其它起始密码子。哺乳动物细胞还可以在对CUG密码子进行解码的亮氨酰-tRNA的帮助下以氨基酸亮氨酸开始进行翻译,而在人类中线粒体基因组则使用AUA和AUU。表1中提供了这些组分和示例性5'UTR。
表1.5'UTR组分和构建体。。
在某些实例中,5’UTR被加帽。例如,通过将反向7-甲基鸟苷添加到5'三磷酸酯(即m7GpppN,其中N表示mRNA的第一个碱基),使真核mRNA鸟苷酸化。mRNA的m7GpppN或5'帽结构参与核输出并结合mRNA帽结合蛋白(CBP),后者负责mRNA翻译能力。
mRNA的第一个核苷酸和第二个核苷酸的核糖也可以任选地在2'-氧(即2'O)位置被甲基化(即添加CH3基团)。第一个核苷酸和第二个核苷酸处的非甲基化mRNA表示为Cap0(即m7GpppN),而第一个核苷酸和第二个核苷酸上的2'O处的甲基化分别表示为Cap1(即m7GpppNm)和Cap2(即m7GpppNmNm)。此外,如果第一个5'核苷酸是腺苷,则其可以在第6个氮(6N)位置处进一步甲基化(即m7Gpppm6A)或形成经修饰的Cap0(即m7Gpppm6A)或经修饰的Cap1(即m7Gpppm6Am)或经修饰的Cap2(即m7Gpppm6AmNm)。
RNA鸟苷酸化或添加Cap0(即m7GpppN)可以通过牛痘病毒加帽酶(VCE)在体外(即RNA合成后)以酶促方式实现。Cap1和Cap2结构的产生可以进一步通过添加mRNA 2’-O-甲基转移酶和S-腺苷甲硫氨酸(即SAM)以酶促方式实现。可替代地,可以通过掺入抗反向帽类似物(即ARCA)在体外共转录添加帽结构。ARCA在帽(m73’OmGpppN)上的3'-氧(3'O)处被甲基化,以确保帽结构以正确的取向掺入。在本申请中,任何上述帽结构均可用于最终的EECmRNA产物。
在具体实施方案中,5’UTR可操作地连接至编码序列。如本文所用,术语“可操作地连接”是指核苷酸表达控制序列(例如,启动子序列或UTR)和另一核苷酸序列之间的功能性连接,由此控制序列允许并导致另一核苷酸序列的转录和/或翻译。
本公开还提供了3'UTR,以用于任选地与所公开的5'UTR一起使用。如本文所示,所公开的5’UTR与所公开的3’UTR的组合导致与仅使用公开的5’UTR或仅使用公开的3’UTR相比EEC具有大大增强的蛋白质表达。
已知3'UTR中嵌入有腺苷和尿苷链段。这些富AU的特征在具有高周转率的基因中尤其普遍。根据其序列特征和功能特性,富AU元件(ARE)可分为三类:I类ARE在富U区域内含有AUUUA基序的数个分散拷贝。C-Myc和MyoD含有I类ARE。II类ARE具有两个或更多个重叠的UUAUUUA(U/A)(U/A)九聚体。
如前所指示,所公开的3’UTR包括间隔区、茎环结构和任选的聚腺嘌呤尾(聚A尾)。在本文的某些实例中,3’UTR还被描绘为可操作地连接至终止密码子。
示例性的终止密码子包括UAA、UGA和UAG。
示例性的间隔区包括[N1-3]AUA和[N1-3]AAA(例如,UGCAUA、UGCAAA、UGAAA、GCAUA、UAAA和GAUA),其中N是任何核苷酸,包括A、G、C、T或U。下标数字指示核苷酸的数量。例如[N1-3]包括如N、NN或NNN所示的1、2或3个核苷酸。
茎环(SL)或发夹或发夹环是3’UTR内高表达转录物的特征。SL是不同的二级结构,其中互补核苷酸配对为双螺旋(或茎),该双螺旋(或茎)通常被形成环的序列中断。SL表示的特定二级结构包括连续的核酸序列,该核酸序列包括茎和(末端)环(也称为发夹环),其中茎由两个相邻的完全互补或部分互补的序列元件形成;该序列元件由形成SL结构的环的短序列(例如3-10个核苷酸)分隔开。该两个相邻的完全互补或部分互补的序列可以定义为例如SL元件茎1和茎2。当这两个相邻的完全或部分反向互补序列(例如SL元件茎1和茎2)彼此形成碱基对时形成SL,导致双链核酸序列在其末端包含由位于SL元件茎1和茎2之间的短序列形成的不配对环。因此,SL包括两个茎(茎1和茎2),这两个茎在核酸分子的二级结构水平上彼此之间形成碱基对,并且这两个茎在核酸分子的一级结构水平上被不属于茎1或茎2的一部分的短序列分隔开。为了说明,SL的二维表示类似于棒棒糖形状的结构。茎环结构的形成需要存在可以自身折回以形成配对的双链的序列;配对的双链由茎1和茎2形成。配对的SL元件的稳定性通常由能够与茎2的核苷酸形成碱基对(优选规范碱基对,更优选沃森-克里克碱基对)的茎1的长度(即核苷酸数目)与不能与茎2的核苷酸形成此类碱基对(错配或凸出)的茎1的核苷酸的数目的对比决定。根据本发明,最佳环长度为3-10个核苷酸,更优选4至7个核苷酸,诸如4个核苷酸、5个核苷酸、6个核苷酸或7个核苷酸。如果给定的核酸序列是由SL表征,则相应的互补核酸序列通常也由SL表征。SL通常由单链RNA分子形成。在具体实施方案中,SL长度为至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸或至少20个核苷酸的长度。
SL存在于高表达转录物(例如那些编码丰富细胞蛋白(如组蛋白)的转录物)的3’UTR内,在这里无论聚腺嘌呤尾如何,SL都会加强翻译(Gallie等人,The histone 3′-terminal stem-loop is necessary for translation in Chinese hamster ovarycells.Nucleic Acids Res.(1996),doi:10.1093/nar/24.10.1954)。组蛋白3'UTR茎共有序列被表征为具有六个碱基对,其中两个是GC对、三个是嘧啶-嘌呤(YR)对以及一个是AU对,并且此外,该环包含4个核糖核苷酸,其中有两个尿苷(U)、一个嘌呤(Y)和一个核糖核苷酸(N)(Gallie等人,The histone 3′-terminal stem-loop is necessary fortranslation in Chinese hamster ovary cells.(Nucleic Acids Res.(1996),doi:10.1093/nar/24.10.1954;Tan等人,Structure of histone mRNA stem-loop,humanstem-loop binding protein,and 3′hExo ternary complex.Science(80).(2013),doi:10.1126/science.1228705;Battle和Doudna,The stem-loop binding protein forms ahighly stable and specific complex with the 3′stem-loop of histone mRNAs.RNA(2001),doi:10.1017/S1355838201001820)。
SL与茎环结合蛋白(SLBP)缔合,以实现复制依赖性mRNA稳定性/加工/代谢/翻译。结构证据表明SLBP与SL的直接接触发生在SL(G7)碱基的鸟苷核苷酸处(Tan等人,Structure of histone mRNA stem-loop,human stem-loop binding protein,and 3′hExo ternary complex.Science(80).(2013),doi:10.1126/science.1228705;Battle和Doudna,The stem-loop binding protein forms a highly stable and specificcomplex with the 3′stem-loop of histone mRNAs.RNA(2001),doi:10.1017/S1355838201001820)。此外,茎附近的腺苷,或更具体地说,上游AAA,会影响SLBP结合和功能(Battle和Doudna,The stem-loop binding protein forms a highly stable andspecific complex with the 3′stem-loop of histone mRNAs.RNA(2001),doi:10.1017/S1355838201001820;William和Marzluff,The sequence of the stem and flankingsequences at the 3′end of histone mRNA are critical determinants for thebinding of the stem-loop binding protein.Nucleic Acids Res.(1995),doi:10.1093/nar/23.4.654)。3'UTR还起到使编码蛋白质的转录物稳定化,同时提高其翻译能力的作用。根据某些实施方案,本公开提供了用于掺入以下SL特征的针对合成的SL的设计:三组GC对被具有相邻的间隔序列(诸如腺苷)的序列(UAACGGUCUU(SEQ ID NO:34))中断以增加SLBP结合和mRNA翻译。
重要的是,EEC中使用的茎环不依赖于序列取向,并且可以包括a)CCUC和GAGG,b)GAGG和CCUC,c)AAACCUC和GAGG,以及d)AAAGAGG和CCUC。进一步地,茎的两条臂之间的距离(其中CCUC和GAGG碱基配对)需要足够长才能形成环。在具体实施方案中,茎环可包括互补序列,诸如a)RRRR和YYYY,b)RYRR和YRYY,c)RRYR和YYRY,d)RRRY和YYYR,e)RYYR和YRRY,f)RRYY和YYRR,g)YYRR和RRYY,h)YYYR和RRRY,或i)RYYY和YRRR,其中R是嘌呤(A或G)并且Y是嘧啶(例如U或C)。
根据某些实施方案,两条臂之间的核苷酸数目可以是七个、八个、九个、十个或更长的核苷酸。茎环的两条臂之间的长度的优选实施方案不短于七个核苷酸。在某些实例中,SL的环区段包括UAACGGUCUU(SEQ ID NO:34)。在具体实施方案中,SL序列包括GAUGCCCCAUUCACGAGUAGUGGGUAUU(SEQ ID NO:64)、GGCACCCUGCGCAGGUGAUGCAGGUGCC(SEQID NO:65)、GUUCGCUCGGUCAGGAGAGCUGACGGAC(SEQ ID NO:66)、UCUUACAGUGGCAUGUGACCGUUUAAGG(SEQ ID NO:67)、CGCGGCGCAUGCACGUGACAUGCCUGCG(SEQID NO:68)、CGGUCCCGUGGCAAGAGUCUAUGGAUUG(SEQ ID NO:69)、AUGUUCGGCUCCAAGAGCGAGUUGAUAU(SEQ ID NO:70)、CGAUUCGGGCACAUGUGCUGUCUGAUUG(SEQID NO:71)、GUAUUCUGAUGCACGUGCCAUCAAGUAC(SEQ ID NO:72)或UUGAGCAGGAUCAAGUGCAUUCUUUCAA(SEQ ID NO:73)。在具体实施方案中,SL序列包括RRYRYYYYRYYYRYRRRYRRYRRRYRYY(SEQ ID NO:74)、RRYRYYYYRYRYRRRYRRYRYRRRYRYY(SEQID NO:75)、RYYYRYYYRRYYRRRRRRRYYRRYRRRY(SEQ ID NO:76)、YYYYRYRRYRRYRYRYRRYYRYYYRRRR(SEQ ID NO:77)、YRYRRYRYRYRYRYRYRRYRYRYYYRYR(SEQID NO:78)、YRRYYYYRYRRYRRRRRYYYRYRRRYYR(SEQ ID NO:79)、RYRYYYRRYYYYRRRRRYRRRYYRRYRY(SEQ ID NO:80)、YRRYYYRRRYRYRYRYRYYRYYYRRYYR(SEQID NO:81)、RYRYYYYRRYRYRYRYRYYRYYRRRYRY(SEQ ID NO:82)或YYRRRYRRRRYYRRRYRYRYYYYYYYRR(SEQ ID NO:83),其中R是嘌呤(A或G)并且Y是嘧啶(例如U或C)。对于另外的示例性SL基序,参见Gorodkin等人,(Nucleic Acids Research 29(10):2135-2144,2001)。
任选的聚A尾。在天然RNA加工期间,可以将长的腺嘌呤核苷酸链(聚A尾)添加到多核苷酸(诸如mRNA分子)中以便增加稳定性。转录后,转录物的3'末端可能会立即被切割以释放3'羟基。然后,聚A聚合酶将腺嘌呤核苷酸链添加到RNA中。这个过程(称为聚腺苷酸化)添加了长度可以在例如100至250个残基之间的聚A尾。在体外RNA合成中,聚A尾可能是在DNA模板上被编码,并且因此在体外转录过程期间被掺入。
在某些实例中,聚A尾的长度范围为0至500个核苷酸(例如,0、10、20、30、40、50、60、70、80、90、120、140、160、180、200、250、300、350、400、450或500个核苷酸)。某些实例利用40个核苷酸的聚A尾。长度也可以以聚A结合蛋白结合的单位或作为聚A结合蛋白结合的函数来确定。在这些实施方案中,聚A尾足够长以结合4个聚A结合蛋白单体、3个聚A结合蛋白单体、2个聚A结合蛋白单体或1个聚A结合蛋白单体。聚A结合蛋白单体与38个核苷酸的链段结合。
基于前面对3’UTR的讨论,本文公开的3’UTR构建体包括以下的一种或多种:间隔区(例如,[N1-3]AUA、[N1-3]AAA、UGCAUA或UGCAAA)、茎环杂交序列(例如CCUC、GAGG);茎环环区段(例如,[N7-15]、UAACGGUCUU(SEQ ID NO:34))和/或任选的聚A尾。当指定终止密码子为3’UTR的一部分时,示例性的终止密码子包括UAA、UGA和UAG。表2中呈现了基于这些组分的示例性3'UTR构建体。
表2. 3’UTR构建体
在特定实施方案中,其它非UTR序列可被掺入到5'(或3’UTR)UTR中。例如,内含子或内含子序列的部分可以被掺入到这些区域中。内含子序列的掺入可以进一步增加蛋白质表达以及mRNA水平。
利用所公开的5'和3'UTR的EEC架构。所公开的5’UTR和3’UTR的工程化序列可用于产生EEC,该EEC在本文被证明可用于在多种蛋白质被用在给定编码序列的侧翼时增加该多种蛋白质的蛋白质表达。这些多种蛋白质包括绿色荧光蛋白(GFP)、白细胞介素-2(IL-2)和如本文所公开的POU5F1(OCT3/4)。此外,这些本发明的5’UTR和3’UTR序列被证明在不同细胞类型(包括淋巴样及贴壁和悬浮胚胎肾细胞)中类似地起作用,而与转染方式无关。
图1示出了本公开的代表性EEC。在某些实例中,“EEC”是指具有在编码序列侧翼的本文公开的5'和/或3'UTR的多核苷酸转录物,该编码序列编码一种或多种蛋白质并且保留了足够的结构和/或化学特征以使其中编码的蛋白质能够被翻译。
返回到图1,所描绘的EEC包含位于开放阅读框内的被连接的核苷酸的编码序列,该编码序列的侧翼为第一侧翼区和第二侧翼区。此编码序列包含编码蛋白质的RNA序列。该蛋白质可以在其5'端包含由信号序列区编码的一个或多个信号序列。第一侧翼区可以包含含有一个或多个完整或不完整的5’UTR序列的被连接的核苷酸区域。第一侧翼区还可以包含5'端帽。桥接编码序列的5'端与第一侧翼区的是第一操作区段。传统上,此操作区段包含起始密码子。该操作区段可以可替代地包含任何翻译启动序列或信号(包括启动密码子)。
第一侧翼区可以包含位于5'UTR内的模块。此第一侧翼区可以分为三个模块:模块1(“M1”),其代表最小启动子(例如,T7启动子六聚体);模块2(“M2”),其是独特的翻译增强子(CAUACUCA,本文所述);和模块3(“M3”),其为Kozak共有序列。T7启动子六聚体是T7聚合酶启动子的一部分,T7聚合酶启动子又是T7 III类启动子的一部分,T7 III类启动子是本领域众所周知的与T7噬菌体的某些启动子的转录相关并负责诱导T7噬菌体的某些启动子的转录的特定类别的启动子。更具体地,T7启动子和六聚体具有全序列(5’-TAATACGACTCACTATAGGGAGA-3’(SEQ ID NO:31)并且通过掺入鸟苷作为第一个核糖核苷酸来启动RNA合成。Kozak共有序列是指其中“R”表示腺苷或鸟苷的Kozak共有序列(5’-GCCRCCATGG-3’(SEQ ID NO:30))。
第二侧翼区可以包含含有一个或多个完整或不完整的3’UTR的被连接的核苷酸区域。侧翼区还可以包含3'加尾序列(例如聚A尾)。3'UTR也可分为包括终止密码子、间隔区和茎环区段的三个区段。
桥接编码序列的3'端与第二侧翼区的是第二操作区段。传统上,该操作区段包含终止密码子。该操作区段可以可替代地包含任何翻译启动序列或信号(包括终止密码子)。根据本公开,还可以使用多个连续终止密码子。
通常,EEC的编码序列的最短长度可以是足以编码二肽、三肽、四肽、五肽、六肽、七肽、八肽、九肽或十肽的核酸序列的长度。在另一个实施方案中,该长度可以足以编码2-30个氨基酸,例如5-30、10-30、2-25、5-25、10-25或10-20个氨基酸的肽。该长度可足以编码至少11、12、13、14、15、17、20、25或30个氨基酸的肽,或不长于40个氨基酸,例如不长于35、30、25、20、17、15、14、13、12、11或10个氨基酸的肽。多核苷酸序列可以编码的二肽的实例包括肌肽和鹅肌肽。
通常,编码序列的长度大于30个核苷酸(例如,至少或大于35、40、45、50、55、60、70、80、90、100、120、140、160、180、200、250、300、350、400、450、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、2,500,和3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000个核苷酸或最多且包括100,000个核苷酸)的长度。
在一些实施方案中,EEC包含30至100,000个核苷酸(例如,30至50、30至100、30至250、30至500、30至1,000、30至1,500、30至3,000、30至5,000、30至7,000、30至10,000、30至25,000、30至50,000、30至70,000、100至250、100至500、100至1,000、100至1,500、100至3,000、100至5,000、100至7,000、100至10,000、100至25,000、100至50,000、100至70,000、100至100,000、500至1,000、500至1,500、500至2,000、500至3,000、500至5,000、500至7,000、500至10,000、500至25,000、500至50,000、500至70,000、500至100,000、1,000至1,500、1,000至2,000、1,000至3,000、1,000至5,000、1,000至7,000、1,000至10,000、1,000至25,000、1,000至50,000、1,000至70,000、1,000至100,000、1,500至3,000、1,500至5,000、1,500至7,000、1,500至10,000、1,500至25,000、1,500至50,000、1,500至70,000、1,500至100,000、2,000至3,000、2,000至5,000、2,000至7,000、2,000至10,000、2,000至25,000、2,000至50,000、2,000至70,000和2,000至100,000个核苷酸)。
根据本公开,第一侧翼区和第二侧翼区的长度可独立地在5-100个核苷酸(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸)的范围内。
根据本公开,加帽区可包含单个帽或形成该帽的一系列核苷酸。在此实施方案中,加帽区的长度可为1至10个,例如2-9、3-8、4-7、1-5、5-10个或至少2个,或10个或更少的核苷酸。在一些实施方案中,该帽不存在。
根据本公开,第一操作区段和第二操作区段的长度范围可为3至40个,例如5-30、10-20、15个或至少4个或30个或更少的核苷酸,并且第一操作区段和第二操作区段除了包含起始密码子和/或终止密码子以外,还可包含一个或多个信号序列和/或限制序列。
先前已经尝试通过各种修饰使IVT-RNA稳定化以便实现所转移的IVT-RNA的更高和延长的表达。然而,尽管基于RNA转染的策略在细胞中成功表达肽和蛋白质,但仍存在与RNA稳定性、编码的肽或蛋白质的持续表达以及RNA的细胞毒性相关的问题。例如,已知外源单链RNA激活哺乳动物细胞中的防御机制。
几个小组已经提出,由于激活的防御机制,为了从转染到细胞中的IVT-RNA达到足够高的蛋白质表达水平,mRNA转录物必须含有某些经修饰的核苷酸(参见,例如2012年8月4日提交的转让给宾夕法尼亚大学的已授权的美国专利9,750,824)或呈包含免疫逃避因子的蛋白质或IVT-RNA形式的另外的试剂(参见,例如2015年5月7日提交的转让给BioNTech.的已授权的美国专利10,207,009)。这些免疫逃避因子包含编码蛋白质的病毒基因,该蛋白质通过例如防止IFN受体被细胞外IFN接合(例如,来自痘苗病毒的B18R),通过抑制细胞内IFN信号传导(例如,均来自痘苗病毒的E3和K3)或通过以这两种能力起作用(例如,来自流感的NS1)来减弱细胞免疫应答(Liu等人,Sci Rep 9:11972,2019)。在具体实施方案中,免疫逃避蛋白包含B18R、E3、K3、NS1或ORF8(来自SARS-CoV2)。
本公开的方面被设计成通过向mRNA转录物中引入二级和三级结构,而不是使用经修饰的核苷酸、微RNA或免疫逃避因子来克服激活的防御机制。根据进一步的实施方案,具体实施方案不使用经修饰的核苷酸或微RNA来增加蛋白质表达。还有进一步的实施方案不使用经修饰的核苷酸或微RNA来延长从转染到细胞中的IVT-RNA的翻译或用于任何其它目的。
在某些实例中,EEC在5’UTR、3’UTR、5’UTR和3’UTR中或在整个EEC中不包含微RNA结合位点和/或经修饰的NTP
微RNA(或miRNA)是19-25个核苷酸长的非编码RNA,其与核酸分子的3′UTR结合并通过降低核酸分子的稳定性或通过抑制翻译来下调基因表达。在某些实例中,EEC不包含任何已知的微RNA靶序列、微RNA序列或微RNA种子。
微RNA种子是处于成熟微RNA的位置2-8的区域中的序列,该序列与微RNA靶序列具有完美的沃森-克里克互补性。
在某些实例中,本公开的EEC被设计成明确地不包含经修饰的NTP。经修饰的NTP是这样的NTP,该NTP具有附接于其上以修饰其化学结构的另外的化学基团。这些经修饰的NTP的实例包括假尿苷、甲基假尿苷、N1-甲基-假尿苷、甲基假尿苷(m5U)、5-甲氧基尿苷(mo5U)和2-硫代尿苷(s2U)。5’帽不是经修饰的NTP。
在某些实例中,EEC包含信使RNA(mRNA)。如本文所用,“信使RNA”(mRNA)是指编码蛋白质并且能够在体外、体内、原位或离体被翻译以产生所编码的蛋白质的任何多核苷酸。
EEC编码蛋白质或其片段。“蛋白质”是指最常通过肽键连接在一起的氨基酸残基聚合物(天然的或非天然的)。该术语包括任何大小、结构或功能的多肽和肽。在一些情况下,编码的蛋白质小于50个核苷酸并且该蛋白质因此被称为肽。如果该蛋白质是肽,则它将包含至少2个被连接的氨基酸。蛋白质包括天然存在的蛋白质,合成蛋白质,同源物,直系同源物,旁系同源物,它们的片段、重组蛋白、融合蛋白和其它等效物、变体和类似物。蛋白质可以是单一蛋白质或者可以是多分子复合物诸如二聚体、三聚体或四聚体。它们还可包括单链或多链蛋白质,诸如抗体或胰岛素并且可以是经缔合或连接的。最常在多链蛋白质中发现二硫连键。术语蛋白质也可适用于氨基酸聚合物,其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学类似物。
术语“蛋白质变体”是指这样的蛋白质,该蛋白质在它们的氨基酸序列上不同于原生序列或参考序列。与原生序列或参考序列相比,氨基酸序列变体可以在氨基酸序列内的某些位置处具有取代、缺失和/或插入。一般地,变体将与原生序列或参考序列具有至少50%的序列同一性,并且优选地,它们将与原生序列或参考序列具有至少80%或更优选地至少90%同一的序列同一性。
EEC可编码选自包括以下的几个目标类别中的任一类别的蛋白质:生物制剂、抗体、疫苗、治疗性蛋白质或肽、细胞穿透肽、分泌型蛋白质、质膜蛋白质、细胞质或细胞骨架蛋白质、细胞内膜结合蛋白质、核蛋白质、与人类疾病相关的蛋白质、靶向部分或由尚未鉴定治疗适应症但在研究和发现领域具有效用的人类基因组编码的那些蛋白质。特定的蛋白质可能属于这些类别中的超过一个类别。
在一些实施方案中,使用编码特定蛋白质的特定序列。这些特定蛋白质包括绿色荧光蛋白(GFP)、白细胞介素-2(IL-2)和POU5F1或OCT3/4(参见图15)。GFP是当暴露于光时表现出亮绿色荧光的蛋白质。人POU5F1或OCT3/4(本文中的hOCT4)是干细胞重编程和维持中重要的关键核转录因子。IL-2是白细胞介素,其是免疫系统中一种类型的细胞因子信号传导分子。它是15.5–16kDa的蛋白质,其调控白细胞的活动。IL-2是身体的针对微生物感染的以及区分外来(“非自身”)和“自身”的免疫应答的一部分。IL-2通过与淋巴细胞表达的IL-2受体结合来介导它的作用。IL-2的主要来源是激活的CD4+T细胞和激活的CD8+T细胞。
本文公开的EEC可以编码一种或多种生物制剂。“生物制剂”包括用于治疗、治愈、减轻、预防或诊断疾病或医学疾患的蛋白质。示例性的生物制剂包括变应原性提取物(例如用于过敏注射和测试)、血液组分、基因疗法产品、移植中使用的人类组织或细胞产品、疫苗、单克隆抗体、细胞因子、生长因子、酶、溶栓剂和免疫调节剂等。
抗体。本文公开的EEC可以编码一种或多种抗体或其片段。术语“抗体”包括单克隆抗体(包括具有免疫球蛋白Fc区的全长抗体)、具有多表位特异性的抗体组合物、多特异性抗体(例如,双特异性抗体、双链抗体和单链分子)以及抗体片段。术语“免疫球蛋白”(Ig)在本文中与“抗体”可互换使用。如本文所用,术语“单克隆抗体”是指从基本上同源的抗体的群体获得的抗体,即,除了可能以微量存在的可能的天然存在的突变和/或翻译后修饰(例如,异构化、酰胺化)以外,包含该群体的各个抗体是同一的。单克隆抗体具有高度特异性(针对单一抗原位点)。
本文中的单克隆抗体具体包括“嵌合”抗体(免疫球蛋白),其中重链和/或轻链的一部分与源自特定物种或属于特定抗体类别或亚类的抗体中的相应序列是同一或同源的,而链的其余部分与源自另一物种或属于另一抗体类别或亚类的抗体中的相应序列是同一或同源的;以及此类抗体的片段,只要它们表现出所需的生物学活性即可。本文中的嵌合抗体包含“灵长类化(primatized)”抗体,其包含源自非人灵长类(例如,旧世纪猴(old worldMonkey)、猿等)的可变结构域抗原结合序列和人恒定区序列。
“抗体片段”包括完好抗体的一部分,优选完好抗体的抗原结合区和/或可变区。抗体片段的实例包括Fab、Fab′、F(ab′)2和Fv片段;双链抗体;线性抗体;纳米抗体;单链抗体分子和由抗体片段形成的多特异性抗体。
五个类别的免疫球蛋白IgA、IgD、IgE、IgG和IgM中的任何类别可以分别由包含指定为α、δ、ε、γ和μ的重链的编码序列编码。还包括编码亚类γ和μ的多核苷酸序列。因此任何亚类的抗体可以被部分或整体编码并且包括以下亚类:IgG1、IgG2、IgG3、IgG4、IgA1和IgA2。
在特定实施方案中,本文公开的EEC可以编码单克隆抗体和/或其变体。抗体的变体也可包括取代变体、保守性氨基酸取代、插入变体、缺失变体和/或共价衍生物。在具体实施方案中,本文公开的EEC可以编码免疫球蛋白Fc区。在另一个实施方案中,EEC可以编码变体免疫球蛋白Fc区。作为非限制性实例,EEC可以编码具有变体免疫球蛋白Fc区的抗体。
具体实施方案编码抗SARS-Cov2抗体、抗SARS抗体、抗RSV抗体、抗HIV抗体、抗登革病毒抗体、抗百日咳博德特氏杆菌抗体、抗丙型肝炎抗体、抗流感病毒抗体、抗副流感病毒抗体、抗偏肺病毒(MPV)抗体、抗巨细胞病毒抗体、抗爱泼斯坦-巴尔病毒抗体、抗单纯疱疹病毒抗体、抗艰难梭状芽胞杆菌细菌毒素抗体或抗肿瘤坏死因子(TNF)抗体。
已知的抗RSV抗体包括帕利珠单抗(palivizumab);美国专利号9,403,900中描述的那些;AB1128(可从MILLIPORE获得)和ab20745(可从ABCAM获得)。
已知的抗HIV抗体的实例是10E8,其是与gp41结合的广泛中和性抗体。VRC01,是与gp120的CD4结合位点结合的广泛中和性抗体。其它示例性的抗HIV抗体包括ab18633和39/5.4A(可从ABCAM获得);和H81E(可从THERMOFISHER获得)。
抗登革病毒抗体的实例包括抗体55(在U.S.20170233460中有描述);抗体DB2-3(在美国专利号8,637,035中有描述);及ab155042和ab80914(两者均可从ABCAM获得)。
抗百日咳抗体在美国专利号9,512,204中有描述。
抗丙型肝炎抗体的实例包括MAB8694(可从MILLIPORE获得)和C7-50(可从ABCAM获得)。
抗流感病毒抗体在美国专利号9,469,685中有描述并且还包括C102(可从THERMOFISHER获得)。
示例性的抗MPV抗体包括MPE8。
示例性的抗CMV抗体包括MCMV5322A、MCMV3068A、LJP538和LJP539。还参见,例如,Deng等人,Antimicrobial Agents and Chemotherapy 62(2)e01108-17(2018年2月);及Dole等人,Antimicrobial Agents and Chemotherapy 60(5)2881-2887(2016年5月)。
抗HSV抗体的实例包括HSV8-N和MB66。
示例性的抗艰难梭状芽胞杆菌抗体包括阿克托舒单抗(actoxumab)和贝洛托单抗(bezlotoxumab)。还参见,例如,Wilcox等人,N Engl J Med 376(4)305-317(2017)。
许多另外的抗体序列是可获得的并且是本领域普通技术人员已知的,可以在本公开的教导内使用。可商购获得的抗体的序列信息可在药物库数据库、CAS登记和/或RSCB蛋白质数据库中找到。
疫苗。本文公开的EEC可以编码一种或多种疫苗。如本文所用,“疫苗”是通过刺激免疫应答以产生针对引起特定疾病或感染和/或发展为特定疾病或感染所必需的因子的获得性免疫力来提高对该疾病或感染因子的免疫力的组合物。例如,疫苗是通过预先使免疫系统暴露于特定抗原而产生针对该抗原的免疫系统应答的配制物。病原体抗原可以是病原体的完好的但非感染性形式(例如,经热灭杀的)。抗原也可以是病原体的蛋白质或蛋白质片段,或由异常细胞类型(例如,受感染的细胞或癌细胞)表达的蛋白质或蛋白质片段。当免疫系统在预先暴露后识别出抗原时,它可以导致长期的免疫记忆,使得如果再次遇到该抗原,则免疫系统可以快速有效地发起有效应答。
示例性的病毒疫苗抗原可以源自腺病毒、沙粒病毒、布尼亚病毒、冠状病毒、虫媒病毒、汉坦病毒、嗜肝DNA病毒、疱疹病毒、乳头瘤病毒、副粘病毒、细小病毒、小核糖核酸病毒、痘病毒、正粘病毒、逆转录病毒、呼肠孤病毒、棒状病毒、轮状病毒、海绵状病毒或披膜病毒。在具体实施方案中,疫苗抗原包括由病毒表达的肽,该病毒包括CMV、EBV、流感病毒、甲型肝炎病毒、乙型肝炎病毒或丙型肝炎病毒、单纯疱疹病毒、HIV、流感、日本脑炎、麻疹、脊髓灰质炎、狂犬病、呼吸道合胞体病毒、风疹、天花、水痘带状疱疹、西尼罗病毒和/或寨卡病毒。
源自整个病原体的疫苗抗原的实例包括用于OPV脊髓灰质炎疫苗的经减毒脊髓灰质炎病毒和用于IPV脊髓灰质炎疫苗的经灭杀脊髓灰质炎病毒。
作为进一步的具体实例,SARS-CoV-02疫苗抗原包括刺突蛋白或其片段(例如,受体结合结构域(RBD));CMV疫苗抗原包括包膜糖蛋白B和CMV pp65;EBV疫苗抗原包括EBVEBNAI、EBV P18和EBV P23;肝炎疫苗抗原包括乙型肝炎病毒的S、M和L蛋白,乙型肝炎病毒的前S抗原(pre-S antigen),HBCAG DELTA,HBV HBE,丙型肝炎病毒RNA,HCV NS3和HCVNS4;单纯疱疹病毒疫苗抗原包括立即早期蛋白和糖蛋白D;人免疫缺陷病毒(HIV)疫苗抗原包括gag、pol和env基因的基因产物,诸如HIV gp32、HIV gp41、HIV gp120、HIV gp160、HIVP17/24、HIV P24、HIV P55 GAG、HIV P66POL、HIV TAT、HIV GP36,Nef蛋白和逆转录酶;人乳头瘤病毒(HPV)病毒抗原包括L1蛋白;流感疫苗抗原包括血凝素和神经氨酸酶;日本脑炎疫苗抗原包括蛋白E、M-E、M-E-NS1、NS1、NS1-NS2A和80% E;疟疾疫苗抗原包括疟原虫蛋白环子孢子蛋白(CSP)、谷氨酸脱氢酶、乳酸脱氢酶和果糖-二磷酸酯醛缩酶;麻疹疫苗抗原包括麻疹病毒融合蛋白;狂犬疫苗抗原包括狂犬病毒糖蛋白和狂犬病毒核蛋白;呼吸道合胞疫苗抗原包括RSV融合蛋白和M2蛋白;轮状病毒疫苗抗原包括VP7sc;风疹疫苗抗原包括蛋白E1和E2;水痘带状疱疹疫苗抗原包括gpl和gpll;并且寨卡疫苗抗原包括前膜、包膜(E)、E蛋白的结构域III和非结构蛋白1-5。
另外的特定示例性病毒抗原序列包括Nef(66-97):(VGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGL(SEQ ID NO:48));Nef(116-145):(HTQGYFPDWQNYTPGPGVRYPLTFGWLYKL(SEQ IDNO:49));Gag p17(17-35):(EKIRLRPGGKKKYKLKHIV(SEQ ID NO:50));Gag p17-p24(253-284):(NPPIPVGEIYKRWIILGLNKIVRMYSPTSILD(SEQ ID NO:51));Pol325-355(RT 158-188):(AIFQSSMTKILEPFRKQNPDIVIYQYMDDLY(SEQ ID NO:52));CSP中心重复区:(NANPNANPNANPNANPNANP(SEQ ID NO:53));及E蛋白结构域III:(AFTFTKIPAETLHTVTEVQYAGTDGPCKVPAQMAVDMQTLTPVG RLITANPVITEGTENSKMMLELDPPFGDSYIVIGVGE(SEQ ID NO:54))。对于另外的病毒抗原实例,参见Fundamental Virology,第二版,Fields,B.N.和Knipe,D.M.编辑(Raven Press,New York,1991)。
在具体实施方案,疫苗抗原是由与细菌感染相关的细胞表达。示例性的细菌包括炭疽、革兰氏阴性杆菌、衣原体、白喉、流感嗜血杆菌、幽门螺杆菌(Helicobacter pylori)、结核分枝杆菌(Mycobacterium tuberculosis)、百日咳毒素、肺炎球菌(pneumococcus)、立克次氏体(rickettsiae)、葡萄球菌(staphylococcus)、链球菌(streptococcus)和破伤风。
作为细菌疫苗抗原的具体实例,炭疽疫苗抗原包括炭疽保护性抗原;革兰氏阴性杆菌疫苗抗原包括脂多糖;流感嗜血杆菌疫苗抗原包括荚膜多糖;白喉疫苗抗原包括白喉毒素;结核分枝杆菌疫苗抗原包括分枝菌酸、热休克蛋白65(HSP65)、30kDa主要分泌型蛋白质和抗原85A;百日咳毒素疫苗抗原包括血凝素、百日咳杆菌粘附素、FIM2、FIM3和腺苷酸环化酶;肺炎球菌疫苗抗原包括肺炎球菌溶血素和肺炎球菌荚膜多糖;立克次氏体疫苗抗原包括rompA;链球菌疫苗抗原包括M蛋白;以及破伤风疫苗抗原包括破伤风毒素。
在具体实施方案中,疫苗抗原源自多重耐药的“超级细菌(superbug)”。超级细菌的实例包括粪肠球菌(Enterococcus faecium)、艰难梭状芽胞杆菌(Clostridiumdifficile)、鲍曼不动杆菌(Acinetobacter baumannii)、铜绿假单胞菌(Pseudomonasaeruginosa)和肠杆菌科(Enterobacteriaceae)(包括大肠杆菌(Escherichia coli)、肺炎克雷伯氏菌(Klebsiella pneumoniae)、肠杆菌属种(Enterobacter spp.))。
疫苗抗原还可包括由癌细胞特异性或优先表达以便激活免疫系统对抗癌症的蛋白质。癌抗原的实例包括A33;BAGE;B细胞成熟抗原(BCMA);Bcl-2;β-连环蛋白;CA19-9;CA125;羧基脱水酶-IX(CAIX);CD5;CD19;CD20;CD21;CD22;CD24;CD33;CD37;CD45;CD123;CD133;CEA;c-Met;CS-1;细胞周期蛋白B1;DAGE;EBNA;EGFR;肝配蛋白B2(ephrinB2);雌激素受体;FAP;铁蛋白;叶酸结合蛋白;GAGE;G250;GD-2;GM2;gp75、gp100(Pmel 17);HER-2/neu;HPV E6;HPV E7;Ki-67;L1-CAM;LRP;MAGE;MART;间皮素;MUC;MUM-1-B;myc;NYESO-1;p53、PRAME;孕激素受体;PSA;PSCA;PSMA;ras;RORl;存活蛋白(survivin);SV40 T;腱生蛋白(tenascin);TSTA酪氨酸酶;VEGF;和WT1。
RNA疫苗的使用提供了一个用于规避基于DNA的疫苗的潜在风险的有吸引力的替代方案。与DNA一样,将RNA转移到细胞中也可以在体内诱导细胞和体液免疫应答。具体而言,已经推行了两种不同的策略用于使用体外转录的RNA(IVT-RNA)的免疫疗法,这两种策略都在各种动物模型中成功地进行了测试。通过不同的免疫途径将RNA直接注射到患者中,或在体外使用常规的转染方法将细胞用IVT-RNA转染,然后将经转染的细胞施用于患者。例如RNA可以被翻译,并且表达的蛋白质呈递在细胞表面上的MHC分子上以引起免疫应答。
治疗性蛋白质是指当被细胞表达时治疗现有的医学疾患或病症的蛋白质。“治疗”意指该蛋白质的表达会减少现有医学疾患或病症的原因以及/或者减少该医学疾患或病症的副作用(例如,疼痛、炎症、充血、疲劳、发烧、发冷)。
细胞穿透蛋白。本文公开的EEC可以编码一种或多种细胞穿透蛋白(CPP,也称为细胞穿透肽)。CPP是指可以促进细胞摄入和摄取分子的蛋白质。一般而言,细胞穿透肽是能够将不同类型的货物分子转运穿过细胞膜,并且因此促进细胞对各种分子货物(从纳米级颗粒到小的化学分子和大的DNA片段)的摄取的(短)肽。通常,该货物通过经由共价键的化学连接或通过非共价相互作用与肽缔合。细胞穿透肽具有不同大小、氨基酸序列和电荷,但所有CPP具有共同特征,该共同特征是能够使质膜易位并促进各种分子货物递送到细胞质或细胞的细胞器中。目前,CPP易位理论区分了三种主要的进入机制:在该膜中直接穿透、内吞作用介导的进入以及通过形成暂时性结构易位(Jafari S,Solmaz MD,Khosro A,201 5,Bioimpacts 5(2):103-1 1 1;Madani F,Lindberg S,Langel LI,Futaki S,Graslund A,201 1,JBiophys:414729)。
CPP的实例包括穿透肽(Derossi,D.等人,J Biol Chem,1994.269(14):p.1 0444-50);蛋白质转导所需的TAT的最小结构域(Vives,E.,P.Brodin和B.Lebleu,J Biol Chem,1997.272(25):p.16010-7);病毒蛋白,例如VP22(Elliott,C.和P.O'Hare,Cell,1 997.88(2):p.223-33)和ZEBRA(Rothe,R.等人,J Biol Chem,2010.285(26):p.20224-33);来自毒液,例如蜂毒肽(Dempsey,C.E.,Biochim Biophys Acta,1 990.1031(2):p.143-61)、肥大细胞脱粒肽(mastoporan)(Konno,K.等人,Toxicon,2000.38(11):p.1 505-1 5)、毛柔钙素(maurocalcin)(Esteve,E.等人,J Biol Chem,2005.280(13):p.12833-9)、响尾蛇胺(crotamine)(Nascimento,F.D.等人,J Biol Chem,2007.282(29):p.21 349-60)或抗菌肽(buforin)(Kobayashi,S.等人,Biochemistry,2004.43(49):p.1 561 0-6);或合成CPP,例如聚精氨酸(R8、R9、R10和R12)(Futaki,S.等人,J Biol Chem,2001.276(8):p.5836-40)或转运肽(transportan)(Pooga,M.等人,FASEB J,1 998.1 2(1):p.67-77)。
CPP可含有一种或多种可检测标记。该蛋白质可以是经部分标记的或经整个完全标记的。EEC可以完全、部分编码或根本不编码可检测标记。细胞穿透肽也可包含信号序列。如本文所用,“信号序列”是指在蛋白质翻译期间结合在新生蛋白质的氨基端处的氨基酸残基序列。该信号序列可用于发出细胞穿透多肽的分泌的信号。
EEC编码的CPP可以在被翻译后形成复合物。该复合物可包含连接至细胞穿透多肽的带电荷的蛋白质。
在具体实施方案中,CPP可包含第一结构域和第二结构域。第一结构域可包含超电荷的多肽。第二结构域可包含蛋白质结合伴侣。如在此上下文中使用的,“蛋白质结合伴侣”包含抗体及其功能片段、支架蛋白或肽。CPP还可包含蛋白质结合伴侣的细胞内结合伴侣。CPP可能能够从其中引入了EEC的细胞中分泌。CPP也可能能够穿透其中引入了EEC的细胞。
在进一步的实施方案中,CPP能够穿透第二细胞。第二细胞可以来自与第一细胞相同的区域,或者它可以来自不同的区域。该区域可包含组织和器官。第二细胞也可以靠近或远离第一细胞。
在具体实施方案中,EEC也可以编码融合蛋白。融合蛋白包含至少两个不一起存在于天然存在的蛋白质中的结构域。该结构域可以直接融合或者可以通过间插接头序列连接。在某些实例中,融合蛋白包含连接至治疗性蛋白质的带电荷的蛋白质。“带电荷的蛋白质”是指携带正电荷、负电荷或总体中性电荷的蛋白质。优选地,在融合蛋白的形成中,治疗性蛋白质可共价连接至带电荷的蛋白质。表面电荷与总氨基酸或表面氨基酸的比率可为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。融合蛋白的其它实例包括双特异性抗体、嵌合抗原受体和工程化T细胞受体(TCR)。
分泌型蛋白质。人类和其他真核细胞被膜细分为许多功能不同的区室。每个膜结合的区室或细胞器含有细胞器功能所必需的不同蛋白质。该细胞使用“分选信号”(即位于蛋白质内部的氨基酸基序)将蛋白质靶向到特定细胞的细胞器。
一种类型的被称为信号序列、信号肽或先导序列的分选信号将一类蛋白质引导到称为内质网(ER)的细胞器。被信号序列靶向到ER的蛋白质可以作为分泌型蛋白质释放到细胞外空间中。类似地,驻留在细胞膜上的蛋白质也可以通过将蛋白质固定到细胞膜上的“接头”的蛋白水解切割而分泌到细胞外空间中。
在一些实施方案中,EEC可用于制造大量的人类基因产物。
在一些实施方案中,EEC可用于表达质膜的蛋白质。
在一些实施方案中,EEC可用于表达细胞质蛋白或细胞骨架蛋白。
在一些实施方案中,EEC可用于表达细胞内膜结合蛋白。
在一些实施方案中,EEC可用于表达细胞核蛋白。
在一些实施方案中,EEC可用于表达与人类疾病相关的蛋白质。
在一些实施方案中,EEC可用于表达具有目前未知的治疗功能的蛋白质。
在某些实例中,EEC编码一种或多种当前正在销售或正处于开发中的蛋白质。将当前正在销售或正处于开发中的蛋白质的编码多核苷酸掺入到EEC中可导致如本文所述的蛋白质表达增加。
EEC可以通过在编码序列内包含自切割肽的编码序列或通过包含核糖体跳跃元件来编码超过一种的蛋白质。
EEC编码的蛋白质可用于治疗许多治疗领域的疾患或疾病,该治疗领域诸如血液、心血管、CNS、中毒(包括抗毒液素)、皮肤病学、内分泌学、胃肠道、医学成像、肌肉骨骼、肿瘤学、免疫学、呼吸、感觉和抗感染领域。
当用于治疗受试者时,EEC可被配制用于施用。
EEC的配制物可以通过药理学领域已知的或以后开发的任何方法制备。一般而言,此类准备方法包括将EEC与赋形剂和/或一种或多种其它辅助成分相结合,以及然后,如果必需和/或期望,则将配制物分割、成型和/或包装成期望的单剂量或多剂量单位。
根据本公开的配制物中EEC、药学上可接受的赋形剂和/或任何另外的成分的相对量将会变化,这取决于所治疗的受试者的身份(identity)、大小和/或状况并且进一步取决于要施用该配制物的途径。举例而言,该配制物可包含0.1%至100%,例如0.5%至50%、1%-30%、5%-80%,至少80%(w/w)的活性成分。
EEC配制物可包含一种或多种赋形剂以:(1)增加稳定性;(2)增加细胞转染;(3)容许持续或延迟的释放(例如,从贮库配制物释放);(4)改变生物分布(例如,靶向至特定组织或细胞类型);以及/或者(5)改变体内编码的蛋白质的释放特性。除了传统赋形剂,诸如任何和所有溶剂、分散介质、稀释剂或其它液体媒介物、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂外,赋形剂还可以包括类脂、脂质体、脂质纳米颗粒、聚合物、脂质复合物(lipoplex)、核-壳纳米颗粒、肽、蛋白质、用EEC转染的细胞(例如,用于移植到受试者中)、透明质酸酶、纳米颗粒模拟物及它们的组合。
EEC的体外合成。
mRNA产生的过程可包括体外转录、cDNA模板去除和RNA清理,以及mRNA加帽和/或加尾反应。
在体外转录期间,根据本领域熟知的技术产生来自期望构建体的cDNA。这种给定的cDNA可以使用体外转录(IVT)系统进行转录。此IVT可允许体外合成所公开的EEC的mRNA。该系统通常包含转录缓冲液、核苷酸三磷酸酯(NTP)、RNA酶抑制剂和聚合酶。NTP可在内部制造,可从供应商选择,或者可如本领域已知那样合成。NTP选自天然存在的NTP。聚合酶可选自T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶和突变型聚合酶(诸如能够掺入经修饰的核酸的聚合酶)。
EEC向哺乳动物细胞中的转染。然后可以将如本文所述那样设计和合成的EEC转染到多种细胞类型中,其中开放阅读框内编码的蛋白质将被翻译成目标蛋白质。转染可以使用本领域的任何已知方法,例如,电穿孔和脂质转染进行。该多种细胞类型包括本领域已知或可能变得已知的任何哺乳动物细胞。可以使用的哺乳动物细胞的实例包括Jurkat、Raji、HEK293、原代成纤维细胞、原代血细胞(包括多种白细胞)、原代肾细胞、原代肝细胞、原代胰腺细胞和原代神经元。
本公开提供了EEC,该EEC包含体外合成的RNA,该体外合成的RNA包含用于在哺乳动物细胞中翻译的开放阅读框内的编码序列。该蛋白质可以选自多种多样的蛋白质,包括将驻留在细胞质中、将被转运到细胞器中以及将被分泌的那些蛋白质。这些EEC可包含:5’UTR,其包含序列CAUACUCA、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:38或SEQ ID NO:39中的任一者;或3’UTR,其包含SEQ ID NO:4、5、6或7。5’UTR还可包含T7聚合酶启动子、最小增强子序列(CAUACUCA)或Kozak序列。进一步地,噬菌体T7启动子可以选自在工程化序列中的T7III类启动子(SEQ ID NO:2)。
本公开还提供了用于体外合成的RNA的EEC,该体外合成的RNA包含用于在哺乳动物细胞中翻译的开放阅读框内的编码序列,其中EEC还可包含含有SEQ ID NO:4、5、6或7的3’UTR连同任一终止密码子(UAA/UAG/UGA)。进一步地,该体外合成的mRNA还可包含含有a)CCUC和GAGG或b)GAGG和CCUC的3’UTR。3’UTR序列的序列(a)CCUC和GAGG或b)GAGG和CCUC)的任一集合可以被不少于七个核苷酸分隔开或者可以大于七个核苷酸。优先地,3’UTR序列中核苷酸的总数目可以不超过五十个核苷酸。
本公开提供了用于工程化的体外合成的mRNA的EEC和方法,该工程化的体外合成的mRNA可包含:5’UTR,其包含微型增强子序列(CAUACUCA)SEQ ID NO:2、SEQ ID NO:3、SEQID NO:38或SEQ ID NO:39中的任一者;和3’UTR,其包含SEQ ID NO:4、5、6或7中的一者。进一步地,工程化的体外合成的mRNA可包含:5’UTR,其包含微型增强子序列(CAUACUCA)、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:38或SEQ ID NO:39;和3’UTR,其包含SEQ ID NO:4、5、6或7中的一者。而且,工程化的体外合成的mRNA可包含微型增强子序列(CAUACUCA)SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:38或SEQ ID NO:39中的任一者和SEQ ID NO:4、5、6或7中的一者。此外,本公开的EEC可包含具有编码序列的工程化mRNA,该编码序列编码绿色荧光蛋白(GFP)、人白细胞介素-2(IL2)和人POU5F1(或OCT3/4)中的任一者。本公开还提供了EEC,其中体外合成的RNA增加编码的蛋白质的表达水平。进一步地,在某些实例中,本公开的EEC不包含任何经修饰的核苷并且/或者不包含任何微RNA结合位点。在另外的实例中,本公开的EEC不包含任何经修饰的核苷,不包含任何微RNA结合位点,并且不包含任何免疫逃避剂。
如本文所述,EEC增加蛋白质的表达。这种增加在与5'UTR中不包含微型增强子序列的编码序列相比时,在与3'UTR中不包含茎-环序列的编码序列相比时,在与5'UTR中不包含微型增强子序列且3'UTR中不包含茎-环序列的编码序列相比时,在与含有经修饰的核苷酸、但不含本文公开的EEC的编码序列相比时可与蛋白质的天然表达水平有关,并且/或者与蛋白质在历史上或传统上是如何表达的有关。在某些实例中,增加的蛋白质表达是与相关对照系统或条件相比多至少10%的蛋白质表达,多至少20%的蛋白质表达,多至少30%的蛋白质表达,多至少40%的蛋白质表达,多至少50%的蛋白质表达,多至少60%的蛋白质表达,多至少70%的蛋白质表达,多至少80%的蛋白质表达,多至少90%的蛋白质表达,多至少100%的蛋白质表达,多至少200%的蛋白质表达,多至少300%的蛋白质表达。
包括以下示例性实施方案和实施例以说明本公开的特定实施方案。鉴于本公开,本领域普通技术人员应认识到,在不脱离本公开的精神和范围的情况下可对本文所公开的特定实施方案作出许多改变并且仍获得相似或类似结果。
示例性实施方案。
1.一种工程化表达构建体(EEC),其具有可操作地连接至编码序列的5’非翻译区(UTR),其中所述5’UTR在最小启动子与Kozak序列之间具有如CAUACUCA所示的序列。
2.如实施方案1所述的EEC,其中所述最小启动子为T7启动子。
3.如实施方案2所述的EEC,其中所述T7启动子具有如GGGAGA所示的序列。
4.如实施方案1-3中任一项所述的EEC,其中所述Kozak序列具有如GCCRCCAUG所示的序列,其中R为A或G。
5.如实施方案1-4中任一项所述的EEC,其中所述5’UTR具有(i)可操作地连接至起始密码子的如SEQ ID NO:2所示的序列或(ii)可操作地连接至起始密码子的如SEQ ID NO:3所示的序列。
6.如实施方案5所述的EEC,其中所述可操作地连接至起始密码子的如SEQ ID NO:2所示的序列具有如SEQ ID NO:38所示的序列。
7.如实施方案5所述的EEC,其中所述可操作地连接至起始密码子的如SEQ ID NO:3所示的序列具有如SEQ ID NO:39所示的序列。
8.如实施方案1-7中任一项所述的EEC,其中所述5’UTR小于30个核苷酸。
9.如实施方案1-8中任一项所述的EEC,其还包含3’UTR。
10.如实施方案9所述的EEC,其中所述3’UTR包含间隔区和可操作地连接至终止密码子的茎环结构。
11.如实施方案10所述的EEC,其中所述终止密码子具有序列UAA、UGA或UAG。
12.如实施方案10或实施方案11所述的EEC,其中所述间隔区具有序列[N1-3]AUA或[N1-3]AAA。
13.如实施方案10或实施方案11所述的EEC,其中所述间隔区具有序列UGCAUA或UGCAAA。
14.如实施方案10-13中任一项所述的EEC,其中所述茎环结构具有如CCUC和GAGG所示的杂交序列。
15.如实施方案10-13中任一项所述的EEC,其中所述茎环结构具有如AAACCUC和GAGG所示或如AAAGAGG和CCUC所示的杂交序列。
16.如实施方案10-15中任一项所述的EEC,其中所述茎环结构具有具有至少7个核苷酸的环区段。
17.如实施方案10-16中任一项所述的EEC,其中所述茎环结构具有具有7-15个核苷酸的环区段。
18.如实施方案10-17中任一项所述的EEC,其中所述茎环结构具有具有如UAACGGUCUU(SEQ ID NO:34)所示的序列的环区段。
19.如实施方案9-18中任一项所述的EEC,其中所述3’UTR小于30个核苷酸。
20.如实施方案9-19中任一项所述的EEC,其中所述3’UTR还包含聚腺嘌呤(聚A)尾。
21.如实施方案20所述的EEC,其中所述聚A尾具有60个残基或更少的残基。
22.如实施方案20或实施方案21所述的EEC,其中所述聚A尾具有40个残基。
23.如实施方案9-22中任一项所述的EEC,其中所述3’UTR具有如SEQ ID NO:4、5、6、7、8或9所示的序列。
24.如实施方案9-22中任一项所述的EEC,其中所述3’UTR具有如SEQ ID NO:10、11或12所示的序列。
25.如实施方案9-24中任一项所述的EEC,其中所述3’UTR具有如SEQ ID NO:13、14、15、16、17、18、19、20或21所示的序列。
26.如实施方案1-25中任一项所述的EEC,其中所述EEC包含体外合成的信使RNA(mRNA)。
27.如实施方案1-26中任一项所述的EEC,其中所述编码序列编码绿色荧光蛋白(GFP)、人白细胞介素-2(IL2)或人POU5F1(或OCT3/4)。
28.如实施方案1-27中任一项所述的EEC,其具有如SEQ ID NO:56、58或60所示的序列。
29.如实施方案1-26中任一项所述的EEC,其中所述编码序列编码治疗性蛋白质。
30.如实施方案29所述的EEC,其中所述治疗性蛋白质包含抗体或其结合片段。
31.如实施方案30所述的EEC,其中所述抗体或其结合片段包含抗SARS-Cov2抗体或其结合片段、抗SARS抗体或其结合片段、抗RSV抗体或其结合片段、抗HIV抗体或其结合片段、抗登革病毒抗体或其结合片段、抗百日咳博德特氏杆菌抗体或其结合片段、抗丙型肝炎抗体或其结合片段、抗流感病毒抗体或其结合片段、抗副流感病毒抗体或其结合片段、抗偏肺病毒(MPV)抗体或其结合片段、抗巨细胞病毒抗体或其结合片段、抗爱泼斯坦-巴尔病毒抗体、抗单纯疱疹病毒抗体或其结合片段、抗艰难梭状芽胞杆菌细菌毒素抗体或其结合片段,或抗肿瘤坏死因子(TNF)抗体或其结合片段。
32.如实施方案1-26中任一项所述的EEC,其中所述编码序列编码疫苗抗原。
33.如实施方案32所述的EEC,其中所述疫苗抗原包括SARS-CoV-02疫苗抗原、CMV疫苗抗原、EBV疫苗抗原、肝炎疫苗抗原、单纯疱疹疫苗抗原、人免疫缺陷病毒(HIV)疫苗抗原、人乳头瘤病毒(HPV)病毒抗原、流感疫苗抗原、日本脑炎疫苗抗原、疟疾疫苗抗原、麻疹疫苗抗原、狂犬病疫苗抗原、呼吸道合胞疫苗抗原、轮状病毒疫苗抗原、水痘-带状疱疹病毒疫苗抗原或寨卡疫苗抗原。
34.如实施方案1-26中任一项所述的EEC,其中所述编码序列编码细胞因子。
35.如实施方案1-26中任一项所述的EEC,其中所述编码序列编码细胞穿透蛋白。
36.如实施方案35所述的EEC,其中所述细胞穿透蛋白包括穿透肽、TAT的最小结构域、VP22、ZEBRA、蜂毒肽、肥大细胞脱粒肽、毛柔钙素、响尾蛇胺、抗菌肽、聚精氨酸或转运肽。
37.如实施方案1-36中任一项所述的EEC,其中所述EEC不包括经修饰的核苷。
38.如实施方案1-37中任一项所述的EEC,其中所述EEC不包括微RNA结合位点。
39.如实施方案1-38中任一项所述的EEC,其中所述编码序列编码免疫逃避因子。
40.如实施方案40所述的EEC,其中所述免疫逃避因子包括B18R、E3、K3、NS1或ORF8。
41.如实施方案1-38中任一项所述的EEC,其中所述EEC不包括免疫逃避因子。
42.如实施方案1-41中任一项所述的EEC,其被配制用于施用于受试者。
43.一种工程化表达构建体(EEC),其具有编码序列,所述编码序列可操作地连接至包含如SEQ ID NO:38所示的序列的5’非翻译区(UTR)和包含如SEQ ID NO:13、14或15所示的序列的3’UTR。
44.一种增强子序列,其包含如CAUACUCA所示的序列。
45.一种工程化表达构建体(EEC),其具有如CAUACUCA所示的序列的1、2、3、4或5个拷贝。
46.如实施方案44所述的EEC,其中所述增强子序列可操作地连接至启动子。
47.如实施方案46所述的EEC,其中所述启动子是最小启动子。
48.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框内的编码序列,其中所述体外合成的RNA还包含以下之一:包含CAUACUCA的5’非翻译区和包含SEQ ID NO:4、5、6或7中的一者的3’非翻译区。
49.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框内的编码序列,其中所述体外合成的RNA还包含以下之一:包含SEQ ID NO:2或SEQ ID NO:3的5’非翻译区和包含SEQ ID NO:4、5、6或7的3’非翻译区。
50.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA还包含:包含T7聚合酶启动子的的5’非翻译区、如CAUACUCA所示的序列和Kozak序列。
51.如实施方案1-42中任一项所述的工程化表达构建体,其中所述T7启动子选自T7 III类启动子。
52.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含:包含SEQ ID NO:4、5、6或7的3’非翻译区和终止密码子。
53.如实施方案52所述的工程化表达构建体,其中所述终止密码子是UAA、UAG或UGA。
54.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含含有a)CCUC和GAGG或b)GAGG和CCUC的3’非翻译区,其中所述3’非翻译区序列的任一集合被不少于七个核苷酸分隔开。
55.一种工程化表达构建体(EEC),其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含含有a)AAACCUC和GAGG或b)AAAGAGG和CCUC的3’非翻译区,其中所述3’非翻译区序列的任一集合被不少于七个核苷酸分隔开。
56.一种5’非翻译区(UTR),其包含介于最小启动子与Kozak序列之间的如CAUACUCA中所示的序列。
57.如实施方案56所述的5’UTR,其中所述最小启动子为T7启动子。
58.如实施方案57所述的5’UTR,其中所述T7启动子具有如GGGAGA所示的序列。
59.如实施方案56-58中任一项所述的5’UTR,其中所述Kozak序列具有如GCCRCCAUG所示的序列,其中R为腺苷或鸟嘌呤。
60.如实施方案56-59中任一项所述的5’UTR,其包含可操作地连接至起始密码子的如SEQ ID NO:2所示的序列。
61.如实施方案56-60中任一项所述的5’UTR,其包含可操作地连接至起始密码子的如SEQ ID NO:3所示的序列。
62.如实施方案60所述的5’UTR,其中所述可操作地连接至起始密码子的如SEQ IDNO:2所示的序列具有如SEQ ID NO:38所示的序列。
63.如实施方案61所述的5’UTR,其中所述可操作地连接至起始密码子的如SEQ IDNO:3所示的序列具有如SEQ ID NO:39所示的序列。
64.如实施方案56-63中任一项所述的5’UTR,其中所述5’UTR小于30个核苷酸。
65.一种3’UTR,其包含间隔区和可操作地连接至终止密码子的茎环结构,其中所述终止密码子具有序列UAA、UGA或UAG并且所述间隔区具有序列[N1-3]AUA或[N1-3]AAA。
66.如实施方案65所述的3’UTR,其中所述间隔区具有序列UGCAUA或UGCAAA。
67.如实施方案65或实施方案66所述的3’UTR,其中所述茎环结构包含如CCUC和GAGG所示的杂交序列。
68.如实施方案65-67中任一项所述的3’UTR,其中所述茎环结构包含如AAACCUC和GAGG所示或如AAAGAGG和CCUC所示的杂交序列。
69.如实施方案65-68中任一项所述的3’UTR,其中所述茎环结构具有具有至少7个核苷酸的环区段。
70.如实施方案65-69中任一项所述的3’UTR,其中所述茎环结构具有具有7-15个核苷酸的环区段。
71.如实施方案65-70中任一项所述的3’UTR,其中所述茎环结构具有具有如UAACGGUCUU(SEQ ID NO:34)所示的序列的环区段。
72.如实施方案65-71中任一项所述的3’UTR,其中所述3’UTR小于30个核苷酸。
73.如实施方案65-72中任一项所述的3’UTR,其中所述3’UTR还包含聚腺嘌呤(聚A)尾。
74.如实施方案73所述的3’UTR,其中所述聚A尾具有60个残基或更少的残基。
75.如实施方案73或实施方案74所述的3’UTR,其中所述聚A尾具有40个残基。
76.如实施方案65-75中任一项所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:4、5、6、7、8或9所示的序列。
77.如实施方案65-75中任一项所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:10、11或12所示的序列。
78.如实施方案65-77中任一项所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:13、14、15、16、17、18、19、20或21所示的序列。
79.如实施方案65-78中任一项所述的3’UTR,其中所述3’UTR可操作地连接至编码序列。
80.如实施方案79所述的3’UTR,其中所述编码序列编码治疗性蛋白质、疫苗抗原、细胞因子或荧光蛋白。
81.如实施方案79或实施方案80所述的3’UTR,其中所述编码序列编码免疫逃避因子。
82.如实施方案81所述的3’UTR,其中所述免疫逃避因子包含B18R、E3、K3、NS1或ORF8。
83.如实施方案79-80中任一项所述的3’UTR,其中所述编码序列不包含免疫逃避因子。
84.如实施方案79-83中任一项所述的3’UTR,其中所述编码序列编码细胞穿透蛋白。
85.如实施方案84所述的3’UTR,其中所述细胞穿透蛋白包括穿透肽、TAT的最小结构域、VP22、ZEBRA、蜂毒肽、肥大细胞脱粒肽、毛柔钙素、响尾蛇胺、抗菌肽、聚精氨酸或转运肽。
86.一种如本文所公开的5’UTR和/或3’UTR序列。
87.一种如本文所公开的5’UTR和/或3’UTR序列,其可操作地连接至编码序列。
实验性实施例。实施例1.材料和方法。UTR设计和结构预测。将长度为4至10个核苷酸的最小转录和翻译元件(例如,独特的5'UTR增强子、T7六聚体和Kozak序列,全部在本文中描述)组装以构建本公开的UTR。基于茎环特征,组装合成3’序列以进行测试。以默认参数利用二级结构预测web服务器(rna.urmc.rochester.edu/RNAstructureWeb/)来检查由各种UTR序列形成茎环二级结构的可能性。
表1:PCR引物列表
mRNA合成。来自Integrated DNA Technologies Inc.(IDT)的DNA片段被用于聚合酶链反应(PCR)以通过表1所示的寡核苷酸构建T7启动子、UTR和聚腺苷(40个腺苷)序列。然后使用模板与T7 RNA聚合酶Anti-Reverse Cap Analog(ARCA)进行转录反应,以合成mRNA(HiScribeTMT7 ARCA mRNA试剂盒,NEB)。在DNA酶I处理后,对mRNA进行量化并相应储存。
细胞培养。从美国模式培养物保藏中心(American Type Culture Collection)获得HEK293(CRL-1573TM)、Jurkat克隆E6-1(/>TIB-152TM)和Raji(/>CCL-86TM)细胞。将所有细胞维持在37℃与5% CO2下。HEK293培养基包括具有10%胎牛血清(FBS)的伊格尔最小基本培养基(EMEM)(/>30-2003TM)。将Jurkat细胞和Raji细胞维持在补充有10% FBS的RPMI-1640培养基(/>30-2001TM)中。根据制造商的说明使用Expi293TM表达系统试剂盒(ThermoFisher)。
转染和电穿孔。为了获得最佳转染参数,以增加水平的包括全长UTR的EEC转染细胞。为了进行比较研究,用0.4-1皮摩尔与MessengerMax lipofectamine(Thermo FisherScientific,Inc.)混合的mRNA转染HEK293细胞。将Jurkat细胞和Raji细胞用0-16皮摩尔的与jetMessenger(PolyPlus)混合的编码GFP的EEC转染。为了进行电穿孔,根据制造商的手册使用Neon转染系统(Thermo Fisher Scientific,Inc.)。参考数据库获得最佳电穿孔参数(电压、持续时间和脉冲数)。
流式细胞术。将细胞用4%多聚甲醛固定30-60分钟并储存在磷酸盐缓冲盐水(PBS)中。为了进行hOCT3/4染色,将细胞透化,与抗体(BioLegend)一起孵育,洗涤两次并储存在PBS中直至使用。将细胞在FACSCalibur(BD)和CytoFlex(Beckman Coulter)流式细胞仪上分析并在FlowJo软件上分析。
ELISA。在转染后24小时,收集细胞培养基,将其离心并相应地稀释。使用人IL2ELISA(BioLegend)来根据制造商的方案对表达进行定量。简言之,将板(Costar)用捕获抗体包被,接着与稀释的细胞培养基、检测抗体和抗生物素蛋白-HRP一起孵育。读取并分析吸光度(450nm)。
实施例2.含有所公开的独特5'UTR序列的EEC与无5'UTR序列相比时导致蛋白表达增加。为了测试EEC序列增加蛋白表达的能力,将含有经修饰的5'UTR和3'UTR序列以及作为报告蛋白的GFP的EEC转染到EXPI293悬浮细胞(Thermo Fisher Scientific,Inc.)中。最初利用源自HEK293细胞系的EXPI293悬浮细胞,因为它们被设计用于高蛋白质表达。为了确定在实验中使用的mRNA的适当的量,使用EXPIfectamine转染试剂,以范围为0-2皮摩尔(0-500ng)的增加水平的编码GFP的EEC转染EXPI293细胞。24小时后,如上所述使细胞经受流式细胞术。在这些实验中,GFP荧光信号被认为与其在细胞中的蛋白质水平成比例。如图2所示,流式细胞术数据表明,GFP中位强度在每6.0x105个细胞0.4皮摩尔(100ng)mRNA下达到饱和。
接下来,用等摩尔的具有各种5'UTR序列的mRNA转染细胞,并在转染后3小时和24小时的时间点分析GFP表达。该各种5'UTR序列是具有Kozak共有序列(M3)的(M1)(T7启动子));(M1,M2((CAUACUCA)和M3),或者除了5'甲基帽和T7六聚体之外,没有任何另外的5’UTR。重要的是,每个构建体均含有5'甲基帽和T7六聚体。图3A和图3B示出了来自此实验的结果。这里,图3A和图3B示出了编码GFP的EEC 5’UTR变体在转染后三小时(3A)和转染后24小时(3B)的流式细胞术图,该图在x轴上展示GFP强度(FL1-H)并且在y轴上展示细胞计数;并且示出了描绘该数据的条形图。正如预期的那样,用不含utr的转录物(那些只含有T7六聚体GGGAGA的构建体)转染的细胞在转染后的所有时间点都显示出最低的中位GFP信号强度(图3A、图3B)。添加在R位置具有A的Kozak共有序列使蛋白质表达增加了200%,而进一步添加独特翻译增强子(CAUACUCA)使GFP表达在3小时和24小时的时间点分别增加到635%和240%,高于在用无5'UTR转录物处理的细胞中检测到的GFP信号。
因此,这些实验证明,独特的工程化5’UTR,特别是携有独特翻译增强子的那些,对于明显增加蛋白质表达至关重要。
实施例3.在具有各种5'UTR序列的EEC中纳入独特的3'UTR序列导致蛋白质表达增加。接下来,检查添加独特的3'UTR对GFP表达的影响。此实验的结果示于图4A和图4B中。图4A和图4B示出了含有5’UTR和3’UTR变体的编码GFP的EEC在转染后三小时(4A)和转染后24小时(4B)的流式细胞术图,该图在x轴上展示GFP强度(FL1-H)并且在y轴上展示细胞计数;并且示出了描绘该数据的条形图。用等摩尔量的编码GFP的EEC 5’UTR和3’UTR变体,无RNA(阴性对照),仅3’UTR的mRNA(无5’UTR),仅5’UTR加上3’UTR的M3,以及M1、M2和M3 5’UTR加上3’UTR转染EXPI293细胞。如图4A和图4B中可见,用仅含3’UTR的转录物转染的细胞在所检查的所有时间点都展示出低水平的GFP表达。将Kozak共有序列连同3’UTR一起添加导致GFP中位强度适度增加。然而,将全长5’(SEQ ID NO:2)UTR连同3’UTR(SEQ ID NO:10)一起添加使GFP表达在3小时和24小时的时间点分别增加了660%和925%。与用仅含全长5’(SEQ IDNO:2)UTR的转录物处理的细胞相比时,3’(SEQ ID NO:10)UTR的添加进一步使GFP信号增加了137%。重要的是,接受具有全长5’(SEQ ID NO:2)+3’(SEQ ID NO:10)UTR的mRNA的细胞表现出最高的GFP强度。
因此,此实验证明了在期望时向mRNA中纳入本发明3’茎环以进一步增加蛋白质表达水平的重要性。
实施例4.具有独特的5’UTR和3’UTR序列的EEC导致使用多种蛋白质类型的蛋白质表达增加。为确保工程化UTR可用于增加多种蛋白质的表达,证明了它们在编码具有不同特性的蛋白质方面的优越性。图5例示了在本文公开的EEC中测试的三种不同类型的蛋白质:在细胞质(GFP)、细胞器(即核区室;在这里为人POU5F1或OCT3/4)和细胞外区室(即分泌性蛋白质;在这里为IL2)中的蛋白质的靶向表达。为了检查独特的5’UTR和3’UTR序列如何影响细胞质蛋白质表达(GFP),参见实施例2和实施例3;图3A-图4B。
干细胞重编程中的关键核转录因子人POU5F1或OCT3/4(在这里为hOCT4)(Yu等人,Induced pluripotent stem cell lines derived from human somatic cells.Science(80).(2007),doi:10.1126/science.1151526)被用于确定本发明UTR对细胞器结合的蛋白质的表达的影响。类似于GFP,用增加量(0-4.8皮摩尔)的编码hOCT4的mRNA处理HEK293细胞导致24小时后它在细胞内的蛋白质的水平升高(图11A和图11C)。hOCT4+细胞的百分比在每2.0x105个细胞1.2皮摩尔mRNA时达到最大(75%)。通过用具有5’和3’变体的等摩尔hOCT4转录物转染HEK293细胞,只有具有全长5’(SEQ ID NO:2)+3’(SEQ ID NO:10)UTR的那些展示出显著百分比的hOCT4+细胞(40%)。进一步地,在用具有全长5'(SEQ ID NO:2)+3'(SEQID NO:10)UTR的hOCT4mRNA处理的那些细胞中,中位{实验次数=2}hOCT4强度高4倍(图11A、11B)。
最后,检查本发明的UTR对分泌性蛋白质(即人白细胞介素-2(hIL2))表达的影响。hIL2激活T淋巴细胞并且当前是自身免疫性病症和癌症的治疗靶标(Spolski,Li和Leonard,Biology and regulation of IL-2:from molecular mechanisms to humantherapy.Nat.Rev.Immunol.(2018),doi:10.1038/s41577-018-0046-y)。与上述实验类似,将HEK293细胞用增加水平的编码hIL2的mRNA(包括全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR)转染。转染后24小时通过ELISA观察到hIL2蛋白质水平成比例增加(图11A)。进一步地,用UTR变体转染hIL2mRNA导致hIL2蛋白质的表达在全长5’(SEQ ID NO:2)和3’(SEQ IDNO:10)UTR都存在时被观察到具有最高水平(图11B)。
因此本实验表明,携有这两种本发明的工程化UTR的mRNA对于增加使用多种蛋白质类型的蛋白质表达有益。
实施例5.具有本发明5’UTR和3’UTR序列的EEC导致多种细胞类型中的蛋白质表达增加。
为了探索蛋白质表达的增加是否可以在其他细胞类型中复制,在以下细胞系中重复上述实验:HEK293(CRL1573TM)、Jurkat(克隆E6-1;/>TIB-152)和Raji(CCL-86)淋巴细胞。贴壁HEK293细胞源自用腺病毒5型DNA的剪切片段转化的人胚肾。将接种的HEK293细胞用增加量的新批次的含有5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR的编码GFP的EEC处理。这些实验如实施例1中所述使用MessengerMax Lipofectamine试剂(ThermoFisher)作为mRNA转染进行。如图6A、图6B和图6C所示,接近90%的细胞展示出GFP信号,其中信号在1皮摩尔(250ng)的编码GFP的EEC下饱和。用较高量的mRNA处理细胞仅使GFP阳性细胞的百分比略微增加。在表示蛋白质表达的量的中位GFP强度方面,在2皮摩尔(500ng)下达到饱和。
随后,将HEK293细胞用0.4-1皮摩尔含有所公开的5’(SEQ ID NO:2)和3’(SEQ IDNO:10)UTR的各种EEC处理(图7A和图7B)。虽然所有mRNA变体在60-80%细胞中都诱导了GFP的表达,但仅用全长UTR处理的细胞显示出与其他细胞相比5倍的GFP中值强度(图7C)。从两个实验计算中位强度。
接下来,在淋巴细胞系Jurkat和Raji中重复上述实验。Jurkat是从患有急性T细胞白血病的14岁男孩的外周血建立的T淋巴细胞(Schneider,Schwenk和Bornkamm,Characterization of EBV-genome negative“null”and“T”cell lines derived fromchildren with acute lymphoblastic leukemia and leukemic transformed non-Hodgkin lymphoma.Int.J.Cancer(1977),doi:10.1002/ijc.2910190505)。Raji细胞是来自患有伯基特淋巴瘤(Burkitt's lymphoma)的11岁男性患者的B淋巴细胞(Osunkoya,Thepreservation of burkitt tumour cells at moderately lowtemperature.Br.J.Cancer(1965),doi:10.1038/bjc.1965.87;Pulvertaft,A Study ofMalignant Tumours In Nigeria by Short-Term Tissue Culture.J.Clin.Pathol.(1965),doi:10.1136/jcp.18.3.261)。在这些实验中,用jetMessenger试剂进行mRNA转染。与具有90%转染效率的HEK293细胞(即GFP阳性细胞)完全不同,仅10%Jurkat细胞在最高的mRNA量(16皮摩尔)下展示出GFP信号(图7A)。进一步地,尽管用等摩尔的各种构建体处理的细胞仅适度地展示出GFP信号,但是用含有全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR的转录物转染的那些细胞展示出最高的GFP阳性细胞数目(14%;图7B)。用Raji细胞观察到类似结果(数据未示出)。
因此本实验表明,本发明的工程化UTR有助于增加多种细胞类型中的蛋白质表达。
实施例6.转染方法对于本文公开的EEC的蛋白质表达增加效果并不重要。为了检查转染方法是否对用本文公开的EEC所看到的表达增加效果重要,用增加量的具有编码GFP的编码序列的EEC对Jurkat细胞进行电穿孔。
电穿孔已被证明可以改善核酸向淋巴样细胞系中的递送(Ohtani等人,Electroporation:Application to human lympboid cell lines for stableintroduction of a transactivator gene of human T-cell leukemia virus typeI.Nucleic Acids Res.(1989),doi:10.1093/nar/17.4.1589)。首先,为确定实验中使用的mRNA的最佳量,用增加量的编码GFP的EEC如实施例1中所述用Neon电穿孔系统(ThermoFisher Scientific,Inc.)对Jurkat细胞进行电穿孔。这导致GFP信号成比例增加。接下来,使Jurkat细胞经受用4皮摩尔和8皮摩尔的具有UTR变体的编码GFP的EEC进行的电穿孔。在每6-8x105个细胞4皮摩尔(1μg)编码GFP的EEC下,最多10%的细胞为GFP阳性,其中用携有全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR的mRNA处理的那些细胞展示出最高的GFP+细胞百分比(图9A)。在8皮摩尔(2μg)下,接近90%的Jurkat细胞为GFP阳性,其中用携有全长5’(SEQ ID NO:2)和3’(SEQ ID NO:10)UTR的mRNA处理的那些细胞展示出最高的中位GFP强度(图9B和图9C)。当使用Raji细胞时获得了类似结果,不同之处在于GFP阳性细胞的数目在使用的最高mRNA水平下较低(图10A、图10B和图10C)。
因为在实施例7中使用独特的工程化EEC观察到与实施例2、3和4中的结果相比类似的蛋白质表达水平,所以转染方法不影响EEC的有效性。
实施例7.逆转3’UTR上茎环的序列对蛋白质表达的增加没有影响。为了检查在保持茎-环配对保守的同时3’UTR序列组成对蛋白质表达的影响,编辑原始3’UTR序列(图13A,3’UTR-A)以将CCUC与GAGG互换;图13A,3’UTR-B)。将编码GFP的EEC构建为包含3’UTR-A或3’UTR-B并且测试该EEC在HEK293细胞中的GFP表达(通过用MessengerMax lipofectamine转染)。使用1-2皮摩尔时,60-70%细胞表现出GFP表达{实验次数=2-3},在携有任一3’UTR的构建体之间没有差异(图13B)。而且,GFP中位强度{实验次数=2-3}在具有3’UTR-A或3’UTR-B的EEC之间类似(图13C)。还使用具有另外的3’UTR的EEC检查GFP表达,其中在3’UTR-B中的GGAG之前的-2位置处出现单个核苷酸取代(U至A)(图13A,3’UTR-C)。此序列类似于组蛋白茎-环,其中茎区前面有一连串的腺苷,这些腺苷对于mRNA与茎-环结合蛋白(SLBP)的缔合和翻译很重要(Battle和Doudna,The stem-loop binding protein forms a highlystable and specific complex with the 3′stem-loop of histone mRNAs.RNA(2001),doi:10.1017/S1355838201001820;William和Marzluff,The sequence of the stem andflanking sequences at the 3′end of histone mRNA are critical determinants forthe binding of the stem-loop binding protein.Nucleic Acids Res.(1995),doi:10.1093/nar/23.4.654)。虽然与先前的3’UTR相比,添加3’UTR-C并未增加GFP阳性细胞的百分比,但的确使经转染的细胞中的GFP中位强度增加了60%(图13B、图13C)。
因此,正如先前的实例所观察到的,包含具有独特侧翼序列的茎环的工程化3’UTR增加了人类细胞中的GFP表达。
实施例8.当转染至成纤维细胞中时,与使用经修饰的核苷酸的mRNA相比,含有独特5'UTR序列的工程化mRNA导致蛋白质表达增加。
为了比较从公开的工程化mRNA产生的蛋白质水平与使用经修饰的核苷酸(N1-甲基-假尿苷)的mRNA的蛋白质水平,将几种表达Oct4的mRNA构建体转染到人包皮成纤维细胞中,包括未修饰的mRNA Oct4(UO)、未修饰的mRNA MyoD-Oct4(UMD)、经修饰的mRNA Oct4(PUO)和经修饰的mRNA MyoD-Oct4(PUMD)。如图14所示,使用未修饰的mRNA(UO)时,OCT4表达最强。使用800ng mRNA的未修饰的工程化转录物产生50.7%最高百分比的OCT4阳性细胞。进一步地,如图14所示,使用经修饰的核苷假尿苷(PUO和PUMD)时OCT4阳性细胞的百分比显著低于当前公开的工程化mRNA(36.9%相比于50.7%)。这些结果表明,公开的5’和3’UTR比用经修饰的核苷酸(如N1-甲基-假尿苷)产生的转录物引起更高水平的蛋白质表达。
对于实验性实施例中使用的序列,参见图15。
结尾段落。如本领域普通技术人员将理解的,本文所公开的每个实施方案可包括以下项、基本上由或由以下项组成:该实施方案的特定的陈述的要素、步骤、成分或组分。因此,术语“包括(include)”或“包括(including)”应解释为叙述:“包含(comprise)、由……组成或基本上由……组成”。如本文所用,过渡术语“包含/包括(comprise)”或“包含/包括(comprises)”意指具有但不限于,并且允许包括甚至呈较大的量的未指定的要素、步骤、成分或组分。过渡短语“由……组成”不包括未指定的任何要素、步骤、成分或组分。过渡短语“基本上由……组成”将实施方案的范围限制于指定的要素、步骤、成分或组分以及不会实质上影响该实施方案的那些要素、步骤、成分或组分。如本文所用,实质性影响将会导致用在5’UTR中含有SEQ ID NO:2并且在3’UTR中含有SEQ ID NO:10的EEC所观察到的增加的蛋白质表达的统计显著性降低。
除非另外指示,否则说明书和权利要求书中使用的所有数字应当理解为在所有情况下都由术语“约”修饰。因此,除非有相反的指示,否则说明书和所附权利要求中所陈述的数值参数都是近似值,该近似值可根据本发明要寻求获得的所期望的特性而变化。在最低限度上,并且不试图将等同原则的应用局限于权利要求的范围,每个数值参数均应当至少根据所报告的有效数字的数目并通过应用普通四舍五入技术来解释。更确切地说,当与所陈述的数值或范围结合使用时,术语“约”具有本领域技术人员合理地归于它的含义,即,表示略大于或略小于所陈述的值或范围,在所陈述值的±20%范围内;在所陈述值的±19%范围内;在所陈述值的±18%范围内;在所陈述值的±17%范围内;在所陈述值的±16%范围内;在所陈述值的±15%范围内;在所陈述值的±14%范围内;在所陈述值的±13%范围内;在所陈述值的±12%范围内;在所陈述值的±11%范围内;在所陈述值的±10%范围内;在所陈述值的±9%范围内;在所陈述值的±8%范围内;在所陈述值的±7%范围内;在所陈述值的±6%范围内;在所陈述值的±5%范围内;在所陈述值的±4%范围内;在所陈述值的±3%范围内;在所陈述值的±2%范围内;或在所陈述值的±1%范围内。
尽管陈述本发明的宽泛范围的数值范围和参数是近似值,但在具体实施例中所陈述的数值尽可能精确地报告。然而,任何数值固有地含有必然由它们各自测试测量值中发现的标准偏差所产生的某些误差。
本文所公开的蛋白质和EEC(包括5’和3’UTR)的变体还包括与参考序列具有至少70%序列同一性、80%序列同一性、85%序列同一性、90%序列同一性、95%序列同一性、96%序列同一性、97%序列同一性、98%序列同一性或99%序列同一性的序列。
“序列同一性%”是指如通过比较序列所确定的两个或更多个序列之间的关系。在本领域中,“同一性”还意指通过此类序列串之间的匹配所确定的蛋白质、核酸或基因序列之间的序列相关性程度。“同一性”(经常称为“相似性”)可通过已知方法来容易地计算,该方法包括在以下中描述的那些:Computational Molecular Biology(Lesk,A.M.编辑)Oxford University Press,NY(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press,NY(1994);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.编辑)Humana Press,NJ(1994);SequenceAnalysis in Molecular Biology(Von Heijne,G.编辑)Academic Press(1987);以及Sequence Analysis Primer(Gribskov,M.and Devereux,J.编辑)Oxford UniversityPress,NY(1992)。用于确定同一性的优选方法被设计为给出在所测试序列之间的最佳匹配。确定同一性和相似性的方法被编写于可公开获得的计算机程序中。序列比对和同一性百分比计算可使用LASERGENE生物信息学计算套件(DNASTAR,Inc.,Madison,Wisconsin)中的Megalign程序来执行。序列的多重比对还可使用Clustal比对方法(Higgins和SharpCABIOS,5,151-153(1989)以默认参数(空位罚分=10,空位长度罚分=10)来执行。相关程序还包括GCG程序套件(Wisconsin软件包版本9.0,Genetics Computer Group(GCG),Madison,Wisconsin);BLASTP、BLASTN、BLASTX(Altschul等人,J.Mol.Biol.215:403-410(1990);DNASTAR(DNASTAR,Inc.,Madison,Wisconsin);以及纳入Smith-Waterman算法的FASTA程序(Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),MeetingDate1992,111-20.编辑:Suhai,Sandor.出版商:Plenum,New York,N.Y.。在本公开的上下文内,将了解在将序列分析软件用于分析的情况下,分析的结果是基于所引用的程序的“默认值”。如本文所用,“默认值”将意指在首次初始化时用软件最初加载的值或参数的任何集合。
除非本文另外指示或者与上下文明显矛盾,否则在描述本发明的上下文中(尤其是在所附权利要求书的上下文中)使用的术语“一个/种”、“该/所述”以及类似指代语应解读为涵盖单数和复数指代语。本文中列举的值的范围仅意图充当个别地提到在该范围内的每个独立值的速记方法。除非本文另外指示,否则每一个别值都被并入本说明书中,就如同在本文中个别地叙述该值一样。除非本文另外指示或另外明显与上下文矛盾,否则本文中所描述的所有方法都可以按任何适合的次序执行。本文所提供的任何和所有实施例或示例性语言(例如,“如”)的使用仅旨在更好地说明本发明,而不会对原本要求保护的本发明的范围构成限制。说明书中的任何语言都不应解读为指示任何未要求保护的要素是实施本发明所必需的。
本文所公开的本发明的替代性要素或实施方案的分组不应解读为是限制性的。每个群组成员都可个别地或与该群组其他成员或本文中发现的其他要素以任何组合形式被提到和要求保护。可预见的是,出于简便和/或可专利性的原因,一个群组的一个或多个成员可包括在所述组内,或从所述组中删除。当出现任何这种包括或删除时,认为本说明书含有如此修改的组,因此满足关于所附权利要求中使用的所有马库什组(Markush group)的书面描述。
本文描述了本发明的某些实施方案,包括本发明人所知的用于实施本发明的最佳模式。当然,本领域普通技术人员在阅读前面的描述后将容易了解这些所描述的实施方案的变化形式。发明人希望熟练的技术人员在适当时可使用这些变化形式,而且发明人意图以除本文具体描述的方式以外的方式实践本发明。因此,本发明包括适用法律所容许的对所附权利要求中所述主题的所有修改和等效内容。而且,除非本文另外指示或另外明显与上下文矛盾,否则本发明涵盖上述要素的所有可能变化形式的任何组合。
此外,在本说明书全篇,对出版物、专利和/或专利申请(统称为“参考文献”)进行了大量引用。所引用的参考文献中的每篇参考文献因它们的特定引用的教导内容而以引用的方式单独地并入本文。
最后,应当理解,本文所公开的本发明的实施方案是对本发明原理的说明。可采用的其他修改也在本发明的范围内。因此,例如但不限于,可根据本文的教义利用本发明的替代配置。因而,本发明不限于明确显示和描述的实施方案。
本文示出的细节是作为举例并且仅出于说明性讨论本发明的优选实施方案的目的,并且呈现这些细节旨在提供被认为是本发明各个实施方案的原理和概念方面的最有用和最易理解的描述的内容。就此而言,除对于本发明的基本理解所必需的之外,没有企图更详细地示出本发明的结构细节,借助于附图和/或实施例所作的描述使得本领域技术人员明了如何可以在实践中体现本发明的若干形式。
在本公开中使用的定义和解释意欲并且旨在控制任何未来构建,除非在实施例中被明确且毫无疑问地修改或者当该含义的应用使得任何构建无意义或基本上无意义。在术语的构建将使它无意义或基本上无意义的情况下,定义应该从《韦氏字典》(Webster'sDictionary)第3版或本领域普通技术人员已知的字典诸如《生物化学和分子生物学牛津字典》(Anthony Smith编辑,Oxford University Press,Oxford,2004)中取得。
序列表
<110> 普鲁斯蒂克斯公司(Pluristyx, Inc.)
<120> 用于增加合成核糖核酸(RNA)的蛋白质表达的工程化表达构建体
<130> P183-0010PCT
<150> US 63/153,877
<151> 2021-02-25
<160> 83
<170> PatentIn version 3.5
<210> 1
<400> 1
000
<210> 2
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有“A” Kozak序列的5’ UTR构建体(无起始密码子)
<400> 2
gggagacaua cucagccacc 20
<210> 3
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有“G” Kozak序列的5’ UTR构建体(无起始密码子)
<400> 3
gggagacaua cucagccgcc 20
<210> 4
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3' UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (11)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 4
nnnauaccuc nnnnnnnnnn nnnnngagg 29
<210> 5
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (11)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 5
nnnaaaccuc nnnnnnnnnn nnnnngagg 29
<210> 6
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (11)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 6
nnnauaggag nnnnnnnnnn nnnnncucc 29
<210> 7
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (11)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 7
nnnaaaggag nnnnnnnnnn nnnnncucc 29
<210> 8
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (10)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 8
nnnauagagn nnnnnnnnnn nnnnccuc 28
<210> 9
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (3)..(3)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (11)..(17)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (19)..(19)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (20)..(20)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (21)..(21)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (22)..(22)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (23)..(23)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (24)..(24)
<223> n可以存在或不存在
<220>
<221> misc_feature
<222> (25)..(25)
<223> n可以存在或不存在
<400> 9
nnnaaagagg nnnnnnnnnn nnnnnccuc 29
<210> 10
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 10
ugcauaccuc uaacggucuu gagg 24
<210> 11
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 11
ugcauaggag uaacggucuu cucc 24
<210> 12
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 12
ugcaaaggag uaacggucuu cucc 24
<210> 13
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 13
uaaugcauac cucuaacggu cuugagg 27
<210> 14
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 14
ugaugcauac cucuaacggu cuugagg 27
<210> 15
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 15
uagugcauac cucuaacggu cuugagg 27
<210> 16
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 16
uaaugcauag agguaacggu cuuccuc 27
<210> 17
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 17
ugaugcauag agguaacggu cuuccuc 27
<210> 18
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 18
uagugcauag agguaacggu cuuccuc 27
<210> 19
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 19
uaaugcaaag agguaacggu cuuccuc 27
<210> 20
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 20
ugaugcaaag agguaacggu cuuccuc 27
<210> 21
<211> 27
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3'UTR构建体
<400> 21
uagugcaaag agguaacggu cuuccuc 27
<210> 22
<400> 22
000
<210> 23
<400> 23
000
<210> 24
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 正向引物(无UTR)
<400> 24
gactcctaat acgactcact atagggagaa tg 32
<210> 25
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 正向引物(Kozak)
<400> 25
gactcctaat acgactcact atagggagag ccaccatg 38
<210> 26
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 正向引物(5'UTR)
<400> 26
gactcctaat acgactcact atagggagac atactcagcc accatg 46
<210> 27
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反向(3'UTR-A)
<400> 27
tttttttttt tttttttttt tttttttttt tttttttttt cctcaagacc gttagaggta 60
tgca 64
<210> 28
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反向(3'UTR-B)
<400> 28
tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactccta 60
tgca 64
<210> 29
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反向(3'UTR-C)
<400> 29
tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactcctt 60
tgca 64
<210> 30
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Kozak序列
<400> 30
gccrccatgg 10
<210> 31
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> T7启动子和六聚体
<400> 31
taatacgact cactataggg aga 23
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<211> 10
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 34
uaacggucuu 10
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<211> 23
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有“A” Kozak序列的5’ UTR构建体(含起始密码子)
<400> 38
gggagacaua cucagccacc aug 23
<210> 39
<211> 23
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有“G” Kozak序列的5' UTR构建体(含起始密码子)
<400> 39
gggagacaua cucagccgcc aug 23
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA双螺旋序列
<400> 45
taatacgact cactatag 18
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<211> 32
<212> PRT
<213> 人免疫缺陷病毒1型(Human immunodeficiency virus type 1)
<400> 48
Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr
1 5 10 15
Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu
20 25 30
<210> 49
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA双螺旋
<400> 49
His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro
1 5 10 15
Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu
20 25 30
<210> 50
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA双螺旋
<400> 50
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
1 5 10 15
His Ile Val
<210> 51
<211> 32
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA双螺旋
<400> 51
Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu
1 5 10 15
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp
20 25 30
<210> 52
<211> 31
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA双螺旋
<400> 52
Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys
1 5 10 15
Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr
20 25 30
<210> 53
<211> 20
<212> PRT
<213> 恶性疟原虫(Plasmodium falciparum)
<400> 53
Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro
1 5 10 15
Asn Ala Asn Pro
20
<210> 54
<211> 81
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> E蛋白结构域III
<400> 54
Ala Phe Thr Phe Thr Lys Ile Pro Ala Glu Thr Leu His Thr Val Thr
1 5 10 15
Glu Val Gln Tyr Ala Gly Thr Asp Gly Pro Cys Lys Val Pro Ala Gln
20 25 30
Met Ala Val Asp Met Gln Thr Leu Thr Pro Val Gly Arg Leu Ile Thr
35 40 45
Ala Asn Pro Val Ile Thr Glu Gly Thr Glu Asn Ser Lys Met Met Leu
50 55 60
Glu Leu Asp Pro Pro Phe Gly Asp Ser Tyr Ile Val Ile Gly Val Gly
65 70 75 80
Glu
<210> 55
<211> 827
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EGFP
<400> 55
gactcctaat acgactcact atagggagac atactcagcc accatggtga gcaagggcga 60
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 120
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 180
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 240
ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 300
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 360
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 420
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 480
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 540
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 600
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 660
cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 720
cgccgccggg atcactctcg gcatggacga gctgtacaag taatgcatac ctctaacggt 780
cttgaggaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 827
<210> 56
<211> 804
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EGFP
<400> 56
gggagacaua cucagccacc auggugagca agggcgagga gcuguucacc gggguggugc 60
ccauccuggu cgagcuggac ggcgacguaa acggccacaa guucagcgug uccggcgagg 120
gcgagggcga ugccaccuac ggcaagcuga cccugaaguu caucugcacc accggcaagc 180
ugcccgugcc cuggcccacc cucgugacca cccugaccua cggcgugcag ugcuucagcc 240
gcuaccccga ccacaugaag cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg 300
uccaggagcg caccaucuuc uucaaggacg acggcaacua caagacccgc gccgagguga 360
aguucgaggg cgacacccug gugaaccgca ucgagcugaa gggcaucgac uucaaggagg 420
acggcaacau ccuggggcac aagcuggagu acaacuacaa cagccacaac gucuauauca 480
uggccgacaa gcagaagaac ggcaucaagg ugaacuucaa gauccgccac aacaucgagg 540
acggcagcgu gcagcucgcc gaccacuacc agcagaacac ccccaucggc gacggccccg 600
ugcugcugcc cgacaaccac uaccugagca cccaguccgc ccugagcaaa gaccccaacg 660
agaagcgcga ucacaugguc cugcuggagu ucgugaccgc cgccgggauc acucucggca 720
uggacgagcu guacaaguaa ugcauaccuc uaacggucuu gaggaaaaaa aaaaaaaaaa 780
aaaaaaaaaa aaaaaaaaaa aaaa 804
<210> 57
<211> 1190
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
gactcctaat acgactcact atagggagac atactcagcc accatggcgg gacacctggc 60
ttcggatttc gccttctcgc cccctccagg tggtggaggt gatgggccag gggggccgga 120
gccgggctgg gttgatcctc ggacctggct aagcttccaa ggccctcctg gagggccagg 180
aatcgggccg ggggttgggc caggctctga ggtgtggggg attcccccat gccccccgcc 240
gtatgagttc tgtgggggga tggcgtactg tgggccccag gttggagtgg ggctagtgcc 300
ccaaggcggc ttggagacct ctcagcctga gggcgaagca ggagtcgggg tggagagcaa 360
ctccgatggg gcctccccgg agccctgcac cgtcacccct ggtgccgtga agctggagaa 420
ggagaagctg gagcaaaacc cggaggagtc ccaggacatc aaagctctgc agaaagaact 480
cgagcaattt gccaagctcc tgaagcagaa gaggatcacc ctgggatata cacaggccga 540
tgtggggctc accctggggg ttctatttgg gaaggtattc agccaaacga ccatctgccg 600
ctttgaggct ctgcagctta gcttcaagaa catgtgtaag ctgcggccct tgctgcagaa 660
gtgggtggag gaagctgaca acaatgaaaa tcttcaggag atatgcaaag cagaaaccct 720
cgtgcaggcc cgaaagagaa agcgaaccag tatcgagaac cgagtgagag gcaacctgga 780
gaatttgttc ctgcagtgcc cgaaacccac actgcagcag atcagccaca tcgcccagca 840
gcttgggctc gagaaggatg tggtccgagt gtggttctgt aaccggcgcc agaagggcaa 900
gcgatcaagc agcgactatg cacaacgaga ggattttgag gctgctgggt ctcctttctc 960
agggggacca gtgtcctttc ctctggcccc agggccccat tttggtaccc caggctatgg 1020
gagccctcac ttcactgcac tgtactcctc ggtccctttc cctgaggggg aagcctttcc 1080
ccctgtctcc gtcaccactc tgggctctcc catgcattca aactgatgca tacctctaac 1140
ggtcttgagg aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1190
<210> 58
<211> 1167
<212> RNA
<213> 智人(Homo sapiens)
<400> 58
gggagacaua cucagccacc auggcgggac accuggcuuc ggauuucgcc uucucgcccc 60
cuccaggugg uggaggugau gggccagggg ggccggagcc gggcuggguu gauccucgga 120
ccuggcuaag cuuccaaggc ccuccuggag ggccaggaau cgggccgggg guugggccag 180
gcucugaggu gugggggauu cccccaugcc ccccgccgua ugaguucugu ggggggaugg 240
cguacugugg gccccagguu ggaguggggc uagugcccca aggcggcuug gagaccucuc 300
agccugaggg cgaagcagga gucggggugg agagcaacuc cgauggggcc uccccggagc 360
ccugcaccgu caccccuggu gccgugaagc uggagaagga gaagcuggag caaaacccgg 420
aggaguccca ggacaucaaa gcucugcaga aagaacucga gcaauuugcc aagcuccuga 480
agcagaagag gaucacccug ggauauacac aggccgaugu ggggcucacc cuggggguuc 540
uauuugggaa gguauucagc caaacgacca ucugccgcuu ugaggcucug cagcuuagcu 600
ucaagaacau guguaagcug cggcccuugc ugcagaagug gguggaggaa gcugacaaca 660
augaaaaucu ucaggagaua ugcaaagcag aaacccucgu gcaggcccga aagagaaagc 720
gaaccaguau cgagaaccga gugagaggca accuggagaa uuuguuccug cagugcccga 780
aacccacacu gcagcagauc agccacaucg cccagcagcu ugggcucgag aaggaugugg 840
uccgagugug guucuguaac cggcgccaga agggcaagcg aucaagcagc gacuaugcac 900
aacgagagga uuuugaggcu gcugggucuc cuuucucagg gggaccagug uccuuuccuc 960
uggccccagg gccccauuuu gguaccccag gcuaugggag cccucacuuc acugcacugu 1020
acuccucggu cccuuucccu gagggggaag ccuuuccccc ugucuccguc accacucugg 1080
gcucucccau gcauucaaac ugaugcauac cucuaacggu cuugaggaaa aaaaaaaaaa 1140
aaaaaaaaaa aaaaaaaaaa aaaaaaa 1167
<210> 59
<211> 569
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> IL2全DNA序列(含Riboz UTR和聚A尾)
<400> 59
gactcctaat acgactcact atagggagac atactcagcc accatgtaca ggatgcaact 60
cctgtcttgc attgcactaa gtcttgcact tgtcacaaac agtgcaccta cttcaagttc 120
tacaaagaaa acacagctac aactggagca tttactgctg gatttacaga tgattttgaa 180
tggaattaat aattacaaga atcccaaact caccaggatg ctcacattta agttttacat 240
gcccaagaag gccacagaac tgaaacatct tcagtgtcta gaagaagaac tcaaacctct 300
ggaggaagtg ctaaatttag ctcaaagcaa aaactttcac ttaagaccca gggacttaat 360
cagcaatatc aacgtaatag ttctggaact aaagggatct gaaacaacat tcatgtgtga 420
atatgctgat gagacagcaa ccattgtaga atttctgaac agatggatta ccttttgtca 480
aagcatcatc tcaacactga cttgatgcat acctctaacg gtcttgagga aaaaaaaaaa 540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 569
<210> 60
<211> 546
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 全RNA序列(含Riboz UTR和聚A尾)
<400> 60
gggagacaua cucagccacc auguacagga ugcaacuccu gucuugcauu gcacuaaguc 60
uugcacuugu cacaaacagu gcaccuacuu caaguucuac aaagaaaaca cagcuacaac 120
uggagcauuu acugcuggau uuacagauga uuuugaaugg aauuaauaau uacaagaauc 180
ccaaacucac caggaugcuc acauuuaagu uuuacaugcc caagaaggcc acagaacuga 240
aacaucuuca gugucuagaa gaagaacuca aaccucugga ggaagugcua aauuuagcuc 300
aaagcaaaaa cuuucacuua agacccaggg acuuaaucag caauaucaac guaauaguuc 360
uggaacuaaa gggaucugaa acaacauuca ugugugaaua ugcugaugag acagcaacca 420
uuguagaauu ucugaacaga uggauuaccu uuugucaaag caucaucuca acacugacuu 480
gaugcauacc ucuaacgguc uugaggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540
aaaaaa 546
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<211> 15
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' UTR构建体
<400> 63
gggagagcca ccaug 15
<210> 64
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 64
gaugccccau ucacgaguag uggguauu 28
<210> 65
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 65
ggcacccugc gcaggugaug caggugcc 28
<210> 66
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 66
guucgcucgg ucaggagagc ugacggac 28
<210> 67
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 67
ucuuacagug gcaugugacc guuuaagg 28
<210> 68
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 68
cgcggcgcau gcacgugaca ugccugcg 28
<210> 69
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 69
cggucccgug gcaagagucu auggauug 28
<210> 70
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 70
auguucggcu ccaagagcga guugauau 28
<210> 71
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 71
cgauucgggc acaugugcug ucugauug 28
<210> 72
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 72
guauucugau gcacgugcca ucaaguac 28
<210> 73
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 73
uugagcagga ucaagugcau ucuuucaa 28
<210> 74
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 74
rryryyyyry yyryrrryrr yrrryryy 28
<210> 75
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 75
rryryyyyry ryrrryrryr yrrryryy 28
<210> 76
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 76
ryyyryyyrr yyrrrrrrry yrryrrry 28
<210> 77
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 77
yyyyryrryr ryryryrryy ryyyrrrr 28
<210> 78
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 78
yryrryryry ryryryrryr yryyyryr 28
<210> 79
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 79
yrryyyyryr ryrrrrryyy ryrrryyr 28
<210> 80
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 80
ryryyyrryy yyrrrrryrr ryyrryry 28
<210> 81
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 81
yrryyyrrry ryryryryyr yyyrryyr 28
<210> 82
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 82
ryryyyyrry ryryryryyr yyrrryry 28
<210> 83
<211> 28
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 茎环的环区段
<400> 83
yyrrryrrrr yyrrryryry yyyyyyrr 28

Claims (85)

1.一种工程化表达构建体(EEC),其具有编码序列,所述编码序列可操作地连接至由如SEQ ID NO:38所示的序列组成的5’非翻译区(UTR)和由如SEQ ID NO:13、14或15所示的序列组成的3’UTR。
2.一种工程化表达构建体(EEC),其具有可操作地连接至编码序列的5’非翻译区(UTR),其中所述5’UTR在最小启动子与Kozak序列之间具有如CAUACUCA所示的序列。
3.如权利要求2所述的EEC,其中所述最小启动子为T7启动子。
4.如权利要求3所述的EEC,其中所述T7启动子具有如GGGAGA所示的序列。
5.如权利要求2所述的EEC,其中所述Kozak序列具有如GCCRCCAUG所示的序列,其中R为A或G。
6.如权利要求2所述的EEC,其中所述5’UTR具有
(i)可操作地连接至起始密码子的如SEQ ID NO:2所示的序列或
(ii)可操作地连接至起始密码子的如SEQ ID NO:3所示的序列。
7.如权利要求6所述的EEC,其中所述可操作地连接至起始密码子的如SEQ ID NO:2所示的序列具有如SEQ ID NO:38所示的序列。
8.如权利要求6所述的EEC,其中所述可操作地连接至起始密码子的如SEQ ID NO:3所示的序列具有如SEQ ID NO:39所示的序列。
9.如权利要求2所述的EEC,其中所述5’UTR小于30个核苷酸。
10.如权利要求2所述的EEC,其还包含3’UTR。
11.如权利要求10所述的EEC,其中所述3’UTR包含间隔区和可操作地连接至终止密码子的茎环结构。
12.如权利要求11所述的EEC,其中所述终止密码子具有序列UAA、UGA或UAG。
13.如权利要求11所述的EEC,其中所述间隔区具有序列[N1-3]AUA或[N1-3]AAA。
14.如权利要求11所述的EEC,其中所述间隔区具有序列UGCAUA或UGCAAA。
15.如权利要求11所述的EEC,其中所述茎环结构具有如CCUC和GAGG所示的杂交序列。
16.如权利要求11所述的EEC,其中所述茎环结构具有如AAACCUC和GAGG所示或如AAAGAGG和CCUC所示的杂交序列。
17.如权利要求11所述的EEC,其中所述茎环结构具有具有至少7个核苷酸的环区段。
18.如权利要求11所述的EEC,其中所述茎环结构具有具有7-15个核苷酸的环区段。
19.如权利要求11所述的EEC,其中所述茎环结构具有具有如UAACGGUCUU(SEQ ID NO:34)所示的序列的环区段。
20.如权利要求10所述的EEC,其中所述3’UTR小于30个核苷酸。
21.如权利要求10所述的EEC,其中所述3’UTR还包含聚腺嘌呤(聚A)尾。
22.如权利要求21所述的EEC,其中所述聚A尾具有60个残基或更少的残基。
23.如权利要求21所述的EEC,其中所述聚A尾具有40个残基。
24.如权利要求10所述的EEC,其中所述3’UTR具有如SEQ ID NO:4、5、6、7、8或9所示的序列。
25.如权利要求10所述的EEC,其中所述3’UTR具有如SEQ ID NO:10、11或12所示的序列。
26.如权利要求10所述的EEC,其中所述3’UTR具有如SEQ ID NO:13、14、15、16、17、18、19、20或21所示的序列。
27.如权利要求2所述的EEC,其中所述EEC包含体外合成的信使RNA(mRNA)。
28.如权利要求2所述的EEC,其中所述编码序列编码绿色荧光蛋白(GFP)、人白细胞介素-2(IL2)或人POU5F1(或OCT3/4)。
29.如权利要求2所述的EEC,其具有如SEQ ID NO:56、58或60所示的序列。
30.如权利要求2所述的EEC,其中所述编码序列编码治疗性蛋白质。
31.如权利要求30所述的EEC,其中所述治疗性蛋白质包含抗体或其结合片段。
32.如权利要求31所述的EEC,其中所述抗体或其结合片段包含抗SARS-Cov2抗体或其结合片段、抗SARS抗体或其结合片段、抗RSV抗体或其结合片段、抗HIV抗体或其结合片段、抗登革病毒抗体或其结合片段、抗百日咳博德特氏杆菌抗体或其结合片段、抗丙型肝炎抗体或其结合片段、抗流感病毒抗体或其结合片段、抗副流感病毒抗体或其结合片段、抗偏肺病毒(MPV)抗体或其结合片段、抗巨细胞病毒抗体或其结合片段、抗爱泼斯坦-巴尔病毒抗体、抗单纯疱疹病毒抗体或其结合片段、抗艰难梭状芽胞杆菌细菌毒素抗体或其结合片段,或抗肿瘤坏死因子(TNF)抗体或其结合片段。
33.如权利要求2所述的EEC,其中所述编码序列编码疫苗抗原。
34.如权利要求33所述的EEC,其中所述疫苗抗原包括SARS-CoV-02疫苗抗原、CMV疫苗抗原、EBV疫苗抗原、肝炎疫苗抗原、单纯疱疹疫苗抗原、人免疫缺陷病毒(HIV)疫苗抗原、人乳头瘤病毒(HPV)病毒抗原、流感疫苗抗原、日本脑炎疫苗抗原、疟疾疫苗抗原、麻疹疫苗抗原、狂犬病疫苗抗原、呼吸道合胞疫苗抗原、轮状病毒疫苗抗原、水痘-带状疱疹病毒疫苗抗原或寨卡疫苗抗原。
35.如权利要求2所述的EEC,其中所述编码序列编码细胞因子。
36.如权利要求2所述的EEC,其中所述编码序列编码细胞穿透蛋白。
37.如权利要求36所述的EEC,其中所述细胞穿透蛋白包括穿透肽、TAT的最小结构域、VP22、ZEBRA、蜂毒肽、肥大细胞脱粒肽、毛柔钙素、响尾蛇胺、抗菌肽、聚精氨酸或转运肽。
38.如权利要求2所述的EEC,其中所述EEC不包含经修饰的核苷。
39.如权利要求2所述的EEC,其中所述EEC不包含微RNA结合位点。
40.如权利要求2所述的EEC,其中所述编码序列编码免疫逃避因子。
41.如权利要求41所述的EEC,其中所述免疫逃避因子包括B18R、E3、K3、NS1或ORF8。
42.如权利要求2所述的EEC,其中所述EEC不包含免疫逃避因子。
43.如权利要求2所述的EEC,其被配制用于施用于受试者。
44.一种增强子序列,其由如CAUACUCA所示的序列组成。
45.一种工程化表达构建体(EEC),其具有如CAUACUCA所示的序列的1、2、3、4或5个拷贝。
46.如权利要求44所述的EEC,其中所述增强子序列可操作地连接至启动子。
47.如权利要求46所述的EEC,其中所述启动子是最小启动子。
48.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框内的编码序列,其中所述体外合成的RNA还包含以下之一:包含CAUACUCA的5’非翻译区和包含SEQ ID NO:4、5、6或7中的一者的3’非翻译区。
49.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框内的编码序列,其中所述体外合成的RNA还包含以下之一:包含SEQ ID NO:2或SEQ ID NO:3的5’非翻译区和包含SEQ ID NO:4、5、6或7的3’非翻译区。
50.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA还包含:包含T7聚合酶启动子的的5’非翻译区、如CAUACUCA所示的序列和Kozak序列。
51.如权利要求2所述的工程化表达构建体,其中所述T7启动子选自T7 III类启动子。
52.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含:包含SEQ IDNO:4、5、6或7的3’非翻译区和终止密码子。
53.如权利要求52所述的工程化表达构建体,其中所述终止密码子是UAA、UAG或UGA。
54.一种工程化表达构建体,其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含含有a)CCUC和GAGG或b)GAGG和CCUC的3’非翻译区,其中所述3’非翻译区序列的任一集合被不少于七个核苷酸分隔开。
55.一种工程化表达构建体(EEC),其包含体外合成的RNA,所述体外合成的RNA包含编码用于在哺乳动物细胞中翻译的蛋白质的开放阅读框,其中所述体外合成的RNA包含含有a)AAACCUC和GAGG或b)AAAGAGG和CCUC的3’非翻译区,其中所述3’非翻译区序列的任一集合被不少于七个核苷酸分隔开。
56.一种5’非翻译区(UTR),其包含介于最小启动子与Kozak序列之间的如CAUACUCA中所示的序列。
57.如权利要求56所述的5’UTR,其中所述最小启动子为T7启动子。
58.如权利要求57所述的5’UTR,其中所述T7启动子具有如GGGAGA所示的序列。
59.如权利要求56所述的5’UTR,其中所述Kozak序列具有如GCCRCCAUG所示的序列,其中R为腺苷或鸟嘌呤。
60.如权利要求56所述的5’UTR,其包含可操作地连接至起始密码子的如SEQ ID NO:2所示的序列。
61.如权利要求56所述的5’UTR,其包含可操作地连接至起始密码子的如SEQ ID NO:3所示的序列。
62.如权利要求60所述的5’UTR,其中所述可操作地连接至起始密码子的如SEQ ID NO:2所示的序列具有如SEQ ID NO:38所示的序列。
63.如权利要求61所述的5’UTR,其中所述可操作地连接至起始密码子的如SEQ ID NO:3所示的序列具有如SEQ ID NO:39所示的序列。
64.如权利要求56所述的5’UTR,其中所述5’UTR小于30个核苷酸。
65.一种3’UTR,其包含间隔区和可操作地连接至终止密码子的茎环结构,其中所述终止密码子具有序列UAA、UGA或UAG并且所述间隔区具有序列[N1-3]AUA或[N1-3]AAA。
66.如权利要求65所述的3’UTR,其中所述间隔区具有序列UGCAUA或UGCAAA。
67.如权利要求65所述的3’UTR,其中所述茎环结构包含如CCUC和GAGG所示的杂交序列。
68.如权利要求65所述的3’UTR,其中所述茎环结构包含如AAACCUC和GAGG所示或如AAAGAGG和CCUC所示的杂交序列。
69.如权利要求65所述的3’UTR,其中所述茎环结构具有具有至少7个核苷酸的环区段。
70.如权利要求65所述的3’UTR,其中所述茎环结构具有具有7-15个核苷酸的环区段。
71.如权利要求65所述的3’UTR,其中所述茎环结构具有具有如UAACGGUCUU(SEQ IDNO:34)所示的序列的环区段。
72.如权利要求65所述的3’UTR,其中所述3’UTR小于30个核苷酸。
73.如权利要求65所述的3’UTR,其中所述3’UTR还包含聚腺嘌呤(聚A)尾。
74.如权利要求73所述的3’UTR,其中所述聚A尾具有60个残基或更少的残基。
75.如权利要求73所述的3’UTR,其中所述聚A尾具有40个残基。
76.如权利要求65所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:4、5、6、7、8或9所示的序列。
77.如权利要求65所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:10、11或12所示的序列。
78.如权利要求65所述的3’UTR,其中所述3’UTR具有如SEQ ID NO:13、14、15、16、17、18、19、20或21所示的序列。
79.如权利要求65所述的3’UTR,其中所述3’UTR可操作地连接至编码序列。
80.如权利要求79所述的3’UTR,其中所述编码序列编码治疗性蛋白质、疫苗抗原、细胞因子或荧光蛋白。
81.如权利要求79所述的3’UTR,其中所述编码序列编码免疫逃避因子。
82.如权利要求81所述的3’UTR,其中所述免疫逃避因子包括B18R、E3、K3、NS1或ORF8。
83.如权利要求79所述的3’UTR,其中所述编码序列不包含免疫逃避因子。
84.如权利要求79所述的3’UTR,其中所述编码序列编码细胞穿透蛋白。
85.如权利要求84所述的3’UTR,其中所述细胞穿透蛋白包括穿透肽、TAT的最小结构域、VP22、ZEBRA、蜂毒肽、肥大细胞脱粒肽、毛柔钙素、响尾蛇胺、抗菌肽、聚精氨酸或转运肽。
CN202280016860.7A 2021-02-25 2022-02-25 用于增加合成核糖核酸(rna)的蛋白质表达的工程化表达构建体 Pending CN116917475A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163153877P 2021-02-25 2021-02-25
US63/153,877 2021-02-25
PCT/US2022/017880 WO2022182976A1 (en) 2021-02-25 2022-02-25 Engineered expression constructs to increase protein expression from synthetic ribonucleic acid (rna)

Publications (1)

Publication Number Publication Date
CN116917475A true CN116917475A (zh) 2023-10-20

Family

ID=83049540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280016860.7A Pending CN116917475A (zh) 2021-02-25 2022-02-25 用于增加合成核糖核酸(rna)的蛋白质表达的工程化表达构建体

Country Status (9)

Country Link
US (1) US20240175048A1 (zh)
EP (1) EP4298216A1 (zh)
JP (1) JP2024509123A (zh)
KR (1) KR20230153418A (zh)
CN (1) CN116917475A (zh)
AU (1) AU2022227003A1 (zh)
CA (1) CA3209374A1 (zh)
IL (1) IL305421A (zh)
WO (1) WO2022182976A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117568338A (zh) * 2024-01-17 2024-02-20 艾斯拓康医药科技(北京)有限公司 一种优化的polyA序列及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023164499A2 (en) * 2022-02-22 2023-08-31 Pluristyx, Inc. Methods of making induced pluripotent stem cells
EP4349990A1 (en) * 2022-10-07 2024-04-10 Certest Biotec, S.L. Artificial polynucleotides for expressing proteins

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004261002A (ja) * 2003-01-08 2004-09-24 Tsutomu Suzuki siRNAの製造方法
WO2009155950A1 (en) * 2008-06-27 2009-12-30 King Faisal Specialist Hospital And Research Centre Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs
US20180201937A1 (en) * 2015-08-04 2018-07-19 The University Of Chicago Inhibitors of cacna1a/alpha1a subunit internal ribosomal entry site (ires) and methods of treating spinocerebellar ataxia type 6
CN107759701B (zh) * 2017-10-27 2021-07-02 杭州优善生物科技有限公司 嵌合抗原受体、其修饰的NK细胞、编码DNA、mRNA、表达载体、制备方法和应用
RU2020117787A (ru) * 2017-11-02 2021-12-02 Юниверсити Оф Айова Рисерч Фаундейшн СПОСОБЫ СПАСЕНИЯ СТОП-КОДОНОВ ПОСРЕДСТВОМ ГЕНЕТИЧЕСКОГО ПЕРЕНАЗНАЧЕНИЯ С ПОМОЩЬЮ АСЕ-тРНК
US20210301305A1 (en) * 2018-06-13 2021-09-30 Voyager Therapeutics, Inc. Engineered untranslated regions (utr) for aav production

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117568338A (zh) * 2024-01-17 2024-02-20 艾斯拓康医药科技(北京)有限公司 一种优化的polyA序列及其应用

Also Published As

Publication number Publication date
CA3209374A1 (en) 2022-09-01
KR20230153418A (ko) 2023-11-06
EP4298216A1 (en) 2024-01-03
US20240175048A1 (en) 2024-05-30
AU2022227003A1 (en) 2023-09-28
AU2022227003A9 (en) 2024-01-25
IL305421A (en) 2023-10-01
WO2022182976A1 (en) 2022-09-01
JP2024509123A (ja) 2024-02-29

Similar Documents

Publication Publication Date Title
JP7089003B2 (ja) Rnaの免疫原性を低減するための方法
CN116917475A (zh) 用于增加合成核糖核酸(rna)的蛋白质表达的工程化表达构建体
EP2996697B1 (en) Intracellular translation of circular rna
CN107090436B (zh) 用于重编程细胞的包含纯化的经修饰的rna的rna制剂
Hambidge et al. Translational enhancement of the poliovirus 5'noncoding region mediated by virus-encoded polypeptide 2A.
Trepotec et al. Maximizing the translational yield of mRNA therapeutics by minimizing 5′-UTRs
AU2013242403A1 (en) Artificial nucleic acid molecules
CA3125567A1 (en) Trem compositions and uses thereof
Saadatmand et al. Aspects of HIV-1 assembly that promote primer tRNALys3 annealing to viral RNA
WO2023109975A2 (zh) 提高基因表达的rna复制子及其应用
CN112567046A (zh) 信使rna 5’端引入的两个rna序列取代信使rna帽
Rhoads Synthetic mRNA: production, introduction into cells, and physiological consequences
WO2024002269A1 (zh) 蛋白质介导的mRNA靶向分子及其制备方法和应用
WO2023193616A1 (zh) 单碱基编辑修复hba2基因突变的方法及其应用
EP3502258A1 (en) Click-modified in vitro transcribed mrna for gene expression
CN111778279B (zh) 一种HTLV-1 Env介导的细胞-细胞融合模型、制备方法及应用
WO2024055272A1 (zh) 能高效表达目的基因的mRNA载体系统、其构建及应用
KR20230127069A (ko) 세포질에서 자가 전사가 가능한 mRNA를 제공하는 RNA/DNA 시스템
KR20220055399A (ko) 세포질에서 자가 전사가 가능한 mRNA를 제공하는 RNA/DNA 시스템
EP4219723A1 (en) Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna
KR20230028860A (ko) 세포질에서 자가 전사가 가능하고 cDdRp mRNA를 제공하는 RNA/DNA 시스템
KR20220067468A (ko) 세포질에서 자가 전사가 가능하고 발현억제 rna를 제공하는 rna/dna 시스템
CN117721129A (zh) 能高效表达目的基因的mRNA载体系统、其构建及应用
CN116917309A (zh) 表达构建体及其用途
JP2023518734A (ja) インビトロトランスクリプトmrna及びこれを含有する薬学組成物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination