CN115960180A - 2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物 - Google Patents

2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物 Download PDF

Info

Publication number
CN115960180A
CN115960180A CN202210623377.7A CN202210623377A CN115960180A CN 115960180 A CN115960180 A CN 115960180A CN 202210623377 A CN202210623377 A CN 202210623377A CN 115960180 A CN115960180 A CN 115960180A
Authority
CN
China
Prior art keywords
protein
mrna
leu
ncov
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210623377.7A
Other languages
English (en)
Inventor
蒋俊
王茜婷
林耀新
栗世铀
王浩
乌磊
辛琪
王利娜
罗晓敏
张欣月
白雪皎
张建民
徐依
蔡梦华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tricision Biotherapeutics Inc
Original Assignee
Beijing Tricision Biotherapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tricision Biotherapeutics Inc filed Critical Beijing Tricision Biotherapeutics Inc
Publication of CN115960180A publication Critical patent/CN115960180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

本发明在2019‑nCoV的刺突蛋白(S蛋白)的胞外结构域的C端氨基酸中进行多个氨基酸残基突变为脯氨酸的突变,提供了具有稳定构象三聚体的S蛋白突变体,并构建了编码上述S蛋白突变体的mRNA,以及能够在体外转录制备所述mRNA的载体。这些S蛋白突变体,以及编码它们的mRNA(包括进一步优化的mRNA),能够用于在受试者中诱导针对2019‑nCoV的免疫应答,从而预防和/或治疗与2019‑nCoV感染相关的疾病或病症。

Description

2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物
本申请要求2021年10月9日向中国国家知识产权局提交的专利申请号为202111176258.3,发明名称为“2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物”的在先申请的优先权。该在先申请的全文通过引用的方式结合于本申请中。
技术领域
本发明属于生物医药和疫苗技术领域,尤其涉及用于制备针对2019-nCoV的疫苗的重组抗原及其基因工程化的mRNA和载体,以及其mRNA疫苗组合物。
背景技术
冠状病毒(Coronavirus)是一种有囊膜的正义RNA病毒,是一个成员众多的大家族,仅感染脊椎动物,可引起人和动物呼吸道、消化道和神经系统疾病。新型冠状病毒(2019-nCoV,也称SARS-CoV-2)呈现球形椭球形,直径在80-120nm。在电子显微镜下,病毒粒表面有球棒状的突出部分,由三聚体刺突糖蛋白(Spike,S)组成。病毒的包膜由膜糖蛋白(membrane glycoprotein,M)构成,通过三个跨膜结构域嵌入病毒包膜里中。此外,少量的小的跨膜蛋白-包膜(envelope,E)蛋白也出现在包膜中。最后,核衣壳(nucleocapsid,N)蛋白以串珠的形式结合到RNA基因组上,形成螺旋对称的核衣壳。研究结果显示,S、M、E和N蛋白是冠状病毒引起机体免疫反应的主要成分。此外,S蛋白中的受体结合域(receptorbinding domain,RBD)通过与人的ACE2蛋白相互作用从而感染人的呼吸道上皮细胞。
mRNA疫苗在安全性、快速制备和免疫原性方面具有颠覆性的优势。传统的灭活疫苗、减毒疫苗以及多肽疫苗,研发周期长、生产工艺复杂,但是mRNA疫苗基于mRNA修饰和递送工具的发展,一旦获得病毒抗原序列,可在数周内迅速设计和制造具有临床规模的mRNA疫苗,可以实现标准化生产,使其在应对大流行暴发方面非常具有吸引力。且mRNA疫苗不存在减毒疫苗潜在的逆转危险;不存在灭活疫苗的恢复突变问题。在免疫原性上,mRNA疫苗能够诱导B细胞和T细胞免疫应答,能引起免疫记忆效果,传递更多有效抗原,并且能一次表达多个抗原。此外,mRNA只需要穿过细胞膜在细胞质中就可以高效表达抗原蛋白;mRNA没有基因整合到基因组中的风险。再次,mRNA被翻译成蛋白质后易被降解,其瞬时表达的特性不仅确保了mRNA药物的安全性,而且使其剂量可控,避免了疫苗药物长期暴露引起的抗原免疫耐受(对特定抗原无反应的状态)。并且,由于不需要动物来源的病毒参与到疫苗研发过程中,规避了病毒和动物使用风险。
mRNA是经由DNA模板链转录而来,其序列与编码链相同,与模板链互补。与原核生物不同,真核生物中携带遗传信息的mRNA由编码蛋白的外显子和无编码功能的内含子间隔排列组成。只有经过正确修饰、剪接的成熟mRNA才能作为信息模板转运到细胞质中进一步翻译产生蛋白质。
发明内容
本发明在2019-nCoV的刺突蛋白(S蛋白)的胞外结构域的C端氨基酸中进行多个氨基酸残基突变为脯氨酸的突变,提供了具有稳定构象三聚体的S蛋白突变体,并构建了编码上述S蛋白突变体的mRNA,以及能够在体外转录制备所述mRNA的载体。这些S蛋白突变体,以及编码它们的mRNA(包括进一步优化的mRNA),能够用于在受试者中诱导针对2019-nCoV的免疫应答,从而预防和/或治疗与2019-nCoV感染相关的疾病或病症。目前已知2019-nCoV病毒颗粒的主要结构包括单股正链核酸(ssRNA)、刺突蛋白(spike protein,S)、膜蛋白(membrane protein,M)、包膜蛋白(envelop protein,E)和核衣壳蛋白(nucelocapsidprotein,N)。如图1所示,S蛋白可分为受体结合亚基S1和膜融合亚基S2。2019-nCoV病毒对细胞的吸附入侵过程主要依赖于S蛋白,在该过程中,S蛋白以同源三聚体的形式装配,其胞质尾和跨膜域将S蛋白锚定到病毒膜中。如图1所示,通过对S蛋白预融合结构进行解析,发现S1亚基的RBD经历铰链类似的构象移动来隐藏或暴露受体结合的关键位点,“向下(down)”为受体不可结合状态,“向上(up)”为受体可结合状态,处于较为不稳定的状态。这种构象使得S蛋白能够容易地与宿主受体血管紧张素转换酶2(ACE2)结合。当RBD与受体结合后,S2亚基通过将FP插入宿主细胞膜而改变为融合后构象,HR1和HR2形成一个反平行的六螺旋束(6HB),共同组成一个融合核心,最终导致病毒膜与细胞膜融合。使用冷冻电镜实验,在预融合构象中确定了大量的三聚体S蛋白结构域,预融合S蛋白上存在大量中和抗体敏感表位,而融合后构象使仅存在于预融合构象上的中和敏感表位的暴露量降至最低。
因此,如果要作为疫苗的抗原使用,优化的S蛋白突变体应当能够保留存在于S蛋白预融合构象形式中的表位,并诱导能够抑制病毒融合的抗体。
本发明的第一个方面是提供S蛋白突变体。
S蛋白突变体是亲本S蛋白发生氨基酸突变产生的,所述突变可以是氨基酸的取代、缺失、和/或插入。亲本S蛋白可以是2019-nCoV野生株的S蛋白,2019-nCoV任一突变株的S蛋白(所述2019-nCoV任一突变株的突变可以是发生在S蛋白区域,也可以是发生在非S蛋白的区域),在本发明的一个实施方式中,所述亲本S蛋白是2019-nCoV B.1.351突变毒株的S蛋白,2019-nCoV B.1.351突变毒株的S蛋白与2019-nCoV野生株的S蛋白相比具有以下突变:L18F,D80A,D215G,L242_244L del,R246I,K417N,E484K,N501Y,D614G,A701V(所述位点以SEQ ID NO:1所示氨基酸序列的位置来定位描述)。亲本S蛋白可以是全长S蛋白,或者全长S蛋白的片段(例如,比全长S蛋白截短的序列(例如删除胞质尾和/或跨膜域)等)。
在本发明中,S蛋白突变体和亲本S蛋白的氨基酸位置均以野生型S蛋白的氨基酸序列为描述依据,野生型S蛋白的氨基酸序列可以在NCBI GeneID:43740568获得,共有1273个氨基酸,其序列如下所示,在本发明中标示为SEQ ID NO:1。
根据本发明,所述S蛋白突变体至少包含胞外域,其胞外域相对于亲本S蛋白的胞外域包含如下位置的氨基酸突变:F817P、A892P、A899P、A942P、和KV986_987PP,所述位点以SEQ ID NO:1所示氨基酸序列的位置来定位描述。所述氨基酸突变可以提高S蛋白突变体的稳定性。
在本发明的一些实施方案中,所述S蛋白突变体相对于亲本S蛋白还具有以下突变:L18F,D80A,D215G,L242_244L del,R246I,K417N,E484K,N501Y,D614G,A701V,所述位点以SEQ ID NO:1所示氨基酸序列的位置来定位描述。
根据本发明,在一些实施方案中,所述S蛋白突变体相对于亲本S蛋白具有对Furin酶酶切位点的突变,将682-685位氨基酸(所述位点以SEQ ID NO:1所示氨基酸序列的位置来定位描述)RRAR经突变以失去被弗林样(Furinlike)蛋白酶切割的能力。在本发明的一个实施方式中将RRAR突变为GSAS。通过对S蛋白中的酶切位点进行突变,可以避免S蛋白突变体被蛋白酶切割,进一步提高其稳定性。
根据本发明,在一些实施方案中,所述S蛋白突变体不包含S蛋白的跨膜域和/或胞质尾。
根据本发明,在一些实施方案中,所述S蛋白突变体还可以相对于亲本S蛋白在融合肽结构域具有氨基酸突变。在该区域通过一个或多个氨基酸残基的取代、缺失和/或插入,使得融合肽结构域失去其天然功能,即,失去介导病毒与宿主细胞膜进行融合的功能。在一些实施方案中,所述S蛋白突变体不包含融合肽结构域。通过在S蛋白突变体中引起融合肽结构域突变使其失去功能,能够提高S蛋白突变体预融合构象的稳定性,使得保留和暴露S蛋白的预融合构象上存在的大量中和抗体敏感表位。
在本发明的一些优选实施方案中,以SEQ ID NO:1所示氨基酸序列的位置来定位描述,本发明的S蛋白突变体在S蛋白胞外结构域中具有6个脯氨酸突变:F817P、A892P、A899P、A942P、和KV986_987PP;以及如下突变:L18F,D80A,D215G,L242_244L del,R246I,K417N,E484K,N501Y,D614G,A701V;以及将682-685位氨基酸RRAR突变为GSAS;以及不包含S蛋白的跨膜域和胞质尾。在本发明的一个实施方式中,所述S蛋白突变体包含如SEQ ID NO:2所示的氨基酸序列。
根据本发明,在一些实施方案中,所述S蛋白突变体在胞外区(1-1209氨基酸,所述位点以SEQ ID NO:1所示氨基酸序列的位置来定位描述)的C端直接融合辅助形成三聚体的结构域。“辅助形成三聚体的结构域”是指当表达时,能够自发或诱导形成三聚体的蛋白质或多肽结构域。所述辅助形成三聚体的结构域当表达时促进所述重组S蛋白突变体形成三聚体。本领域已知多种此类结构域。通过在S蛋白突变体中包括辅助形成三聚体的结构域(例如通过构建融合蛋白),能够促进S蛋白突变体形成三聚体构象,和/或稳定S蛋白突变体的三聚体构象。在本发明的一个实施方式中,所述辅助形成三聚体的结构域是T4 FibritinFoldon Trimerization Motif。在本发明的一个具体实施方式中,T4 Fibritin FoldonTrimerization Motif的氨基酸序列如SEQ ID NO:3所示。
在本发明的一些优选实施方案中,以SEQ ID NO:1所示氨基酸序列的位置来定位描述,本发明的S蛋白突变体在S蛋白胞外结构域中具有6个脯氨酸突变:F817P、A892P、A899P、A942P、和KV986_987PP;以及如下突变:L18F,D80A,D215G,L242_244L del,R246I,K417N,E484K,N501Y,D614G,A701V;以及将682-685位氨基酸RRAR突变为GSAS;以及不包含S蛋白的跨膜域和胞质尾;在胞外区的C端直接融合辅助形成三聚体的结构域T4 FibritinFoldon Trimerization Motif。在本发明的一个实施方式中,所述S蛋白突变体包含从N端向C端直接连接的SEQ ID NO:2的氨基酸序列和SEQ ID NO:3的氨基酸序列。在本发明的一个实施方式中,所述S蛋白突变体的氨基酸序列是从N端向C端直接连接的SEQ ID NO:2的氨基酸序列和SEQ ID NO:3的氨基酸序列。
本发明的第二个方面是提供一种DNA分子、含有所述DNA分子的表达载体或者细胞,所述DNA分子用于编码本发明第一个方面所述的S蛋白突变体。
根据本发明,所述DNA分子可以存在于表达载体中,例如质粒载体或病毒载体中,转染到工程细胞中进行表达而得到本发明所述的S蛋白突变体。或者所述DNA分子可以被重组到工程细胞的基因组中,在工程细胞中进行表达而得到本发明所述的S蛋白突变体。
在本发明的一些实施方式中,所述DNA分子的核苷酸序列包含与SEQ ID NO:4所示的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列,所述SEQ ID NO:4所示的核苷酸序列编码SEQ ID NO:2所述氨基酸序列。
在本发明的一些实施方式中,所述DNA分子的核苷酸序列包含与SEQ ID NO:5所示的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列,所述SEQ ID NO:5所示的核苷酸序列编码SEQ ID NO:3所述氨基酸序列。
在本发明的一些实施方式中,所述DNA分子的核苷酸序列包含从5’端向3’端直接连接的与SEQ ID NO:4的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列,和与SEQ ID NO:5的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。在本发明的一个具体实施方式中,所述DNA分子的核苷酸序列包含从5’端向3’端直接连接的SEQ ID NO:4的核苷酸序列和SEQ ID NO:5的核苷酸序列。
一种表达载体,其含有所述DNA分子。根据本发明,所述表达载体可以是原核细胞表达载体或真核细胞表达载体。
一种细胞,其含有所述DNA分子。根据本发明,所述DNA分子可以存在于所述细胞的基因组之外,也可以被重组到所述细胞的基因组之内。
本发明的第三个方面是提供一种mRNA,其编码本发明第一方面所述的S蛋白突变体。
根据本发明,所述mRNA包含编码S蛋白突变体的开放阅读框(ORF)。
根据本发明,所述mRNA从5’端至3’端可以包含5’帽结构、5’UTR,编码S蛋白突变体的开放阅读框(ORF),3’UTR和poly-A尾。
5’帽结构:5’帽典型地是添加在mRNA分子的5’端的修饰的核苷酸(特别是鸟嘌呤核苷酸),也包括非典型的帽类似物。优选地,5’帽使用5’-5’-三磷酸酯键(也称为m7GpppN)添加。5’帽结构的另外实例包括甘油基,反向脱氧脱碱基残基(部分),4’,5’-亚甲基核苷酸,1-(β-D-赤式呋喃糖基)核苷酸,4’-硫代核苷酸,碳环核苷酸,1,5-脱水己糖醇核苷酸,L-核苷酸,α-核苷酸,修饰的碱基核苷酸,苏式戊呋喃糖基核苷酸,无环3’,4’-闭联核苷酸,无环3,4-二羟基丁基核苷酸,无环3,5-二羟基戊基核苷酸,3’-3’-反向核苷酸部分,3’-3’-反向脱碱基部分,3’-2’-反向核苷酸部分,3’-2’-反向脱碱基部分,1,4-丁二醇磷酸酯,3’-氨基磷酸酯,己基磷酸酯,氨基己基磷酸酯,3’-磷酸酯,3’硫代磷酸酯,二硫代磷酸酯或桥接或非桥接甲基膦酸酯部分。这些修饰的5’帽结构可用于本发明的情形中以修饰本发明的mRNA序列。在本发明的一些实施方式中,5’帽结构是CAP1(m7GpppN的相邻核苷酸的核糖的额外甲基化),CAP2(m7GpppN下游的第二核苷酸的核糖的额外甲基化),CAP3(m7GpppN下游的第三核苷酸的核糖的额外甲基化),CAP4(m7GpppN下游的第四核苷酸的核糖的额外甲基化)。
帽类似物:帽类似物是指具有帽功能的不可聚合二核苷酸,因为其促进翻译或定位,和/或当在RNA分子的5’端并入时阻止RNA分子的降解。不可聚合意为帽类似物将仅在5’端并入,因为其不具有5’三磷酸酯且因此无法通过模板依赖性RNA聚合酶在3’方向上延伸。帽类似物包括但不限于选自由以下组成的组的化学结构:m7GpppG、m7GpppA、m7GpppC;未甲基化帽类似物(例如,GpppG);二甲基化帽类似物(例如,m2,7GpppG)、三甲基化帽类似物(例如m2,2,7GpppG)、二甲基化对称帽类似物(例如,m7Gpppm7G)或抗反向帽类似物(例如,ARCA;m7,2’OmeGpppG、m7,2’dGpppG、m7,3’OmeGpppG、m7,3’dGpppG及它们的四磷酸酯衍生物)(Stepinski等,2001.RNA 7(10):1486-95)。
5’帽结构可使用帽类似物在化学RNA合成,或RNA体外转录(共同转录加帽)中形成,或可使用加帽酶(例如,可商购的加帽试剂盒)在体外形成。
在本发明的一个实施方式中,所述5’帽结构是Cap1结构。
根据本发明,所述5’UTR可以包含β-珠蛋白或α-珠蛋白的5’UTR或其同源物、片段。在本发明的一些实施方式中,所述5’UTR包含β-珠蛋白的5’UTR或其同源物、片段。在本发明的一些实施方式中,所述5’UTR包含与SEQ ID NO:6所示的β-珠蛋白的5’UTR核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。在本发明的一个具体实施方式中,所述5’UTR包含SEQ ID NO:6所示的β-珠蛋白的5’UTR核苷酸序列。
在本发明的一些实施方案中,所述5'UTR还包含Kozak序列。在本发明的一个实施方式中,所述Kozak序列为GCCACC。
根据本发明,所述3’UTR可以包含β-珠蛋白或α-珠蛋白的3’UTR或其同源物、片段,或片段的组合。在本发明的一些实施方式中,所述3’UTR包含与SEQ ID NO:7所示α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。在本发明的另一些实施方式中,所述3’UTR包含2个首尾相连的与SEQ ID NO:7所示的α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。在本发明的一个具体实施方式中,所述3’UTR包含2个首尾相连的SEQ ID NO:7所示的核苷酸序列。
根据本发明,所述poly-A尾的长度可以为50-200个核苷酸,优选为100-150个核苷酸,例如110-120个核苷酸,例如约110个核苷酸,约120个核苷酸,约130个核苷酸,约140个核苷酸,约150个核苷酸。
在本发明的一个实施方案中,所述S蛋白突变体的开放阅读框(ORF)的核苷酸序列是与SEQ ID NO:8所示核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。该ORF翻译后的S蛋白突变体的氨基酸序列是由从N端向C端直接连接的SEQ ID NO:2所示氨基酸序列和SEQ ID NO:3所示氨基酸序列组成。在本发明的一个具体实施方式中,所述S蛋白突变体的开放阅读框(ORF)的核苷酸序列如SEQ ID NO:8所示。
在本发明的一个实施方案中,所述mRNA包含与SEQ ID NO:9所示的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。在本发明的一个具体实施方式中,所述mRNA包含SEQ ID NO:9所示的核苷酸序列。
根据本发明,所述mRNA中的一个或多个核苷酸可以是经修饰的。例如,所述mRNA中的一个或多个核苷酸(例如所有核苷酸)可以各自独立替换为天然存在的核苷酸类似物或人工合成的核苷酸类似物,例如选自假尿苷(pseudouridine)、2-硫尿苷(2-thiouridine)、5-甲基尿苷(5-methyluridine)、5-甲基胞苷(5-methylcytidine)、N6-甲基腺苷(N6-methyladenosine)、N1-甲基假尿苷(N1-methylpseudouridine)、5-乙炔基尿苷(5-ethynyluridine)、假尿苷三磷酸(pseudo-UTP)、1-甲基-假尿苷三磷酸(N1-methyl-pseudo-UTP)、5-乙炔基尿苷三磷酸(5-ethynyl-UTP)、5-甲基胞苷三磷酸(5-methyl-CTP)等。
本发明的第四个方面是提供一种核酸分子,其编码本发明第三方面所述的mRNA。所述核酸分子例如可以是载体例如质粒载体或病毒载体的形式。在一些实施方案中,所述核酸分子可以用于在体外通过转录制备本发明的mRNA。
在本发明的一个实施方式中,所述核酸分子是体外转录用载体,其包含可操作性连接的编码5’UTR,3’UTR和poly-A尾的核苷酸序列。所述5’UTR包含与SEQ ID NO:6所示的β-珠蛋白的5’UTR核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。所述3’UTR包含2个首尾相连的与SEQ ID NO:7所示的α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。所述poly-A尾的长度可以为50-200个核苷酸,优选为100-150个核苷酸,例如110-120个核苷酸,例如约110个核苷酸,约120个核苷酸,约130个核苷酸,约140个核苷酸,约150个核苷酸。
根据本发明,所述体外转录用载体,进一步包含编码S蛋白突变体的ORF的核苷酸序列。所述S蛋白突变体的开放阅读框(ORF)的核苷酸序列是与SEQ ID NO:8所示核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。
在本发明的一个具体实施方式中,所述体外转录用载体,其包含可操作性连接的编码5’UTR,S蛋白突变体的ORF,3’UTR和poly-A尾的核苷酸序列;所述5’UTR包含SEQ IDNO:6所示的β-珠蛋白的5’UTR核苷酸序列;所述3’UTR包含2个首尾相连的SEQ ID NO:7所示的核苷酸序列;所述poly-A尾的长度为50-200个核苷酸;所述S蛋白突变体的开放阅读框(ORF)的核苷酸序列如SEQ ID NO:8所示。
根据本发明,可使用常用的质粒作为载体。在本发明的一些实施方式中,质粒是psp73或pUC57-kana。
可采用本领域已知的方法制备本发明的mRNA,包括但不限于化学合成或体外转录等。在本发明的一些实施方式中,可以人工合成编码mRNA的核酸分子,将该核酸分子克隆到载体中,构建体外转录用质粒。将构建的质粒转化到宿主菌中培养扩增,提取质粒。将提取的质粒使用紧邻着polyA尾后面的限制性内切酶酶切消化成线性分子。以制备的线性化质粒分子为模板,使用体外转录法制备mRNA。体外转录(IVT)系统通常包含转录缓冲液、三磷酸核苷酸(NTP)、RNase抑制剂和聚合酶。NTP可以选自但不限于天然和非天然(修饰的)NTP。聚合酶可以选自但不限于T7 RNA聚合酶、T3RNA聚合酶和突变体聚合酶。可以在体外转录过程中添加帽结构类似物,直接得到具有帽结构的mRNA;也可以在体外转录结束后,使用加帽酶和二甲基转移酶给mRNA添加上帽结构。可采用本领域常规的方法纯化得到的mRNA,例如化学沉淀法、磁珠法、亲和层析法等。
本发明第一方面的S蛋白突变体可以直接作为抗原制备疫苗。
本发明第三方面所述的mRNA可以与脂质化合物一同制备成包封了mRNA的脂质体或者脂质纳米颗粒等,再制备成疫苗。
因此,本发明的第五个方面是提供一种疫苗组合物,其含有本发明第一方面所述的S蛋白突变体,或者含有本发明第三方面所述的mRNA。
根据本发明,所述疫苗或疫苗组合物中除了含有S蛋白突变体或mRNA,用于形成脂质体或脂质纳米颗粒的脂质化合物之外,还可以含有药学上可接受的赋形剂,和/或免疫佐剂。
根据本发明,所述疫苗或疫苗组合物中,当以脂质纳米颗粒为载体时,mRNA位于脂质纳米颗粒中,脂质纳米颗粒含有占其总体脂质分子30-60mol%的式C的可电离阳离子脂质分子,5-30mol%的中性脂质分子,30-50mol%的胆固醇类脂质分子,0.4-10mol%的PEG化的脂质分子;优选含有32-55mol%的式C的可电离阳离子脂质分子,8-20mol%中性脂质分子,35-50mol%的胆固醇类脂质分子,0.5-5mol%的PEG化的脂质分子;更优选含有34-46mol%的式C的可电离阳离子脂质分子,9-16mol%中性脂质分子,37-49mol%的胆固醇类脂质分子,1.3-2.7mol%的PEG化的脂质分子。
式C
Figure BDA0003675470430000091
其中每个n3都彼此独立,可以相同或不同,每个n3选自1~8的整数,每个m3都彼此独立,可以相同或不同,每个m3选自0~8的整数;优选,每个n3选自4~8的整数,每个m3选自4~8的整数;优选,每个n3都彼此相同,每个m3都彼此相同。式C化合物优选如下所示化合物。
Figure BDA0003675470430000092
Figure BDA0003675470430000101
Figure BDA0003675470430000111
Figure BDA0003675470430000121
Figure BDA0003675470430000131
中性脂质分子选自式E所示的磷脂酰胆碱类化合物
Figure BDA0003675470430000132
E,式F所示的磷脂酰乙醇胺类化合物
Figure BDA0003675470430000133
F,其中Ra、Rb、Rc、Rd独立的选自直链或支链的C10-30烷基,直链或支链的C10-30烯基,优选为CH3(CH2)17CH2-、CH3(CH2)15CH2-、CH3(CH2)13CH2-、CH3(CH2)11CH2-、CH3(CH2)9CH2-、CH3(CH2)7CH2-、CH3(CH2)7-CH=CH-(CH2)7-、CH3(CH2)4CH=CHCH2CH=CH(CH2)7-、CH3(CH2)7-CH=CH-(CH2)9-。
胆固醇类脂质分子选自胆固醇、5-十七基间苯二酚和胆固醇半琥珀酸酯。
PEG化的脂质分子包含脂质部分和基于PEG的聚合物部分,表示为“脂质部分-PEG-数均分子量”,所述脂质部分是二酰基甘油或二酰基甘油酰胺,选自二月桂酰甘油、二肉豆蔻酰甘油、二棕榈酰甘油、二硬脂酰甘油、二月桂基甘油酰胺、二肉豆蔻基甘油酰胺、二棕榈酰甘油酰胺、二硬脂酰甘油酰胺、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺;PEG的数均分子量为约130至约50,000,例如约150至约30,000,约150至约20,000,为约150至约15,000,为约150至约10,000,为约150至约6,000,为约150至约5,000,为约150至约4,000,为约150至约3,000,为约300至约3,000,为约1,000至约3,000,为约1,500至约2,500,例如约2000。
所述疫苗组合物中,脂质分子总质量和mRNA的质量比为5-20:1。
本发明第一方面所述的S蛋白突变体,或者本发明第三方面所述的mRNA,在制备疫苗中的应用。
根据本发明,所述疫苗或疫苗组合物可用于预防和/或治疗2019-nCoV感染或与2019-nCoV感染相关的疾病或病症,所述2019-nCoV可以是野生株或其任一的突变株。在本发明的一个实施方式中,所述2019-nCoV是B.1.351突变株。
所述2019-nCoV感染相关的疾病或病症包括但不限于,2019-nCoV感染所致肺炎,2019-nCoV感染所致头疼、鼻塞、流涕、咳嗽或/和气管炎,2019-nCoV感染所致弥漫性血管内凝血,2019-nCoV感染所致的脓毒血症。
本发明的第六个方面是提供本发明第二方面所述的DNA分子在制备S蛋白突变体中的应用,本发明第四方面所述的核酸分子在制备本发明第三方面所述mRNA中的用途。
本发明序列列表:
Figure BDA0003675470430000141
Figure BDA0003675470430000151
Figure BDA0003675470430000161
Figure BDA0003675470430000171
Figure BDA0003675470430000181
Figure BDA0003675470430000191
Figure BDA0003675470430000201
本发明的可电离脂质化合物可以采用本领域已有的方法进行合成,例如,使一当量或一当量以上的胺与一当量或一当量以上的环氧基封端化合物在合适的条件下反应形成。可电离脂质化合物的合成是在有或无溶剂的情况下进行,并且所述合成可在25-100℃范围内的较高温度下进行。可任选纯化制得的可电离脂质化合物。
在本发明的一些实施方式中,本发明的可电离脂质化合物可以采用如下的一般制备方法进行制备。
Figure BDA0003675470430000211
步骤1:还原
在还原剂的存在下,将化合物A1的羧基还原成羟基以获得化合物A2。还原剂的实例包括但不限于氢化铝锂、二异丁基氢化铝等。反应所用溶剂的实例包括但不限于醚类(如乙醚、四氢呋喃和二氧六环等),卤代烃(如氯仿、二氯甲烷和二氯乙烷等),烃类(如正戊烷、正己烷、苯和甲苯等),及这些溶剂的两种或以上形成的混合溶剂。
步骤2:氧化
在氧化剂的存在下,将化合物A2的羟基氧化成醛基以获得化合物A3。氧化剂的实例包括但不限于2-碘酰基苯甲酸(IBX)、氯铬酸吡啶(PCC)、二氯铬酸吡啶盐(PDC)、戴斯-马丁氧化剂、二氧化锰等。反应所用溶剂的实例包括但不限于卤代烃(如氯仿、二氯甲烷和二氯乙烷等),烃类(如正戊烷、正己烷、苯和甲苯等),腈类(例如乙腈等),及这些溶剂的两种或以上形成的混合溶剂。
步骤3:卤代-还原
首先在酸性条件下,将化合物A3的醛α-氢与卤代试剂发生卤代反应以获得α-卤代醛中间体,然后在还原剂存在下,将α-卤代醛的醛基还原成羟基以获得化合物A4。提供酸性条件的实例包括但不限于DL-脯氨酸。卤代试剂的实例包括但不限于N-氯代丁二酰亚胺(NCS)和N-溴代丁二酰亚胺(NBS)。还原剂的实例包括但不限于硼氢化钠、氰基硼氢化钠和三乙酰氧基硼氢化钠。
步骤4:环氧化
将化合物A4在碱的存在下进行分子内的亲核取代反应以获得环氧化合物A5。碱的实例包括但不限于碱金属的氢氧化物或氢化物,例如氢氧化钠、氢氧化钾和氢化钠。反应所用溶剂的实例包括但不限于二氧六环和水的混合物。
步骤5:开环反应
使化合物A5与胺(例如N,N-二(2-氨基乙基)甲胺)发生开环反应以获得最终化合物。反应用溶剂的实例包括但不限于乙醇、甲醇、异丙醇、四氢呋喃、三氯甲烷、己烷、甲苯、乙醚等。
所述制备方法中的原料A1可以商购也可以采用常规方法合成。
可以采用本领域已知的方法制备脂质纳米颗粒。例如:将各脂质分子按摩尔比用有机溶剂溶解制成混合脂质的溶液,以混合脂质的溶液为有机相,以被递送物(例如核酸)的水溶液为水相,混合有机相和水相,制备脂质纳米颗粒。可以采用包括但不限于喷雾干燥、单一和双重乳液溶剂蒸发、溶剂萃取、相分离、纳米沉淀、微流控、简单和复杂凝聚以及所属领域的普通技术人员熟知的其它方法来制备脂质纳米颗粒。所述制备方法还可进一步包括,分离和纯化得到所述脂质纳米颗粒的步骤。所述制备方法还可进一步包括,冻干所述脂质纳米颗粒的步骤。
术语说明:
在本发明中,新型冠状病毒,2019-nCoV和SARS-CoV-2的含义相同。
“和/或”将被视为具有或不具有另一个的两个指定特征或组件中的每一个的具体公开。因此,在诸如“A和/或B”之类的短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独)和“B”(单独)。同样地,在诸如“A、B和/或C”的短语中使用的术语“和/或”旨在涵盖以下方面中的每一个:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独);B(单独);和C(单独)。
“包括”和“包含”具有相同的含义,旨在是开放的并且允许但不要求包括额外的元件或步骤。当在本文中使用术语“包括”或“包含”时,因此也包括和公开了术语“由......组成”和/或“基本上由……组成”。
在本说明书和权利要求书中,核苷酸通过其通常接受的单字母代码来指代。除非另有说明,否则核苷酸序列以5'至3'方向从左向右书写。核碱基在本文中由IUPAC-IUB生物化学命名委员会推荐的通常已知的单字母符号表示。因此,A代表腺嘌呤,C代表胞嘧啶,G代表鸟嘌呤,T代表胸腺嘧啶,U代表尿嘧啶。技术人员将理解,本文公开的密码子中的T碱基存在于DNA中,而T碱基在相应RNA中将被U碱基取代。例如,本文公开的DNA形式的密码子-核苷酸序列,例如载体或体外翻译(IVT)模板,其T碱基在其相应的转录mRNA中转录为U碱基。在这一方面,密码子优化的DNA序列(包含T)和它们相应的mRNA序列(包含U)都被认为是本公开的密码子优化的核苷酸序列。本领域技术人员还将理解,可以通过用非天然碱基替换一个或多个碱基来产生等同的密码子图谱。
术语“核酸序列”、“核苷酸序列”或“多核苷酸序列”可互换使用,并且是指连续的核酸序列。序列可以是单链或双链的DNA或RNA,例如mRNA。
“编码…的核苷酸序列”是指编码多肽的核酸(例如,mRNA或DNA分子)编码序列。编码序列可以进一步包括与调控元件可操作地连接的起始和终止信号,所述调控元件包括能够指导在施用核酸的个体或哺乳动物的细胞中的表达的启动子和多腺苷酸化信号。
在本说明书和权利要求书中,使用氨基酸残基的常规单字母或三字母代码。除非另有说明,氨基酸序列以氨基至羧基取向从左至右书写。
“约”:在整个说明书和权利要求中与数值结合使用的术语“约”表示本领域技术人员熟悉和可接受的准确度区间。通常,这种精确度的区间为±10%。
为了便于参照,本发明的S蛋白突变体使用如下命名规则描述:原始氨基酸:位置:取代氨基酸。根据该命名规则,例如在第30位天冬酰胺被丙氨酸取代表示为:Asn30Ala或N30A;在相同位置缺失天冬酰胺表示为:Asn30*或N30*;插入另一氨基酸残基,例如赖氨酸,表示为:Asn30AsnLys或N30NK;缺失连续的一段氨基酸残基,例如缺失氨基酸残基242-244,表示为(242-244)*或Δ(242-244)或242_244del;如果与其它S蛋白亲本相比,S蛋白突变体含有“缺失”且在该位置含有插入,则表示为:*36Asp或*36D,表示在第36位缺失同时插入天冬氨酸。当在给定位置可插入一个或多个可选择的氨基酸残基时,表示为:N30A,E,或N30A或N30E。另外,当本文鉴定了适合于修饰的位置而没有建议任何具体的修饰时,应理解为任意氨基酸残基都可取代该位置的氨基酸残基。因此,例如,当提及修饰第30位的天冬酰胺,但没有指定时,应理解为该天冬酰胺可缺失或用任何其它氨基酸,即R,D,A,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V中的任一个取代。此外,“N30X”是指下列取代中的任一个:N30R,N30D,N30C,N30Q,N30E,N30G,N30H,N30I,N30L,N30K,N30M,N30F,N30P,N30S,N30T,N30W,N30Y,或N30V;或简写为:N30R,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V。
同源性:如本文所用,术语“同源性”是指聚合物分子之间的总体相关性,例如,在核酸分子(例如DNA分子和/或RNA分子)之间和/或在多肽分子之间。通常,术语“同源性”意味着两个分子之间的进化关系。因此,两个同源的分子将具有共同的进化祖先。在本公开的背景下,术语同源性包括同一性和相似性。
在一些实施方案中,如果分子中至少25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或100%的单体是相同的(完全相同的单体)或相似(保守置换),聚合物分子被认为是彼此“同源的”。术语“同源的”必然是指至少两个序列(多核苷酸或多肽序列)之间的比较。
同一性:如本文所用,术语“同一性”是指聚合物分子之间,例如多核苷酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间的整体单体保守性。例如,可以通过以进行最佳比较目的比对两个序列来进行两个多核苷酸序列的百分同一性的计算(例如,可以在第一和第二核酸序列之一或两个中引入空位用于最佳比对和非相同的序列可以对于比较目的放弃。在某些实施方案中,为了比较目的而比对的序列的长度是参考序列长度的至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%。然后比较相应核苷酸位置的核苷酸。当第一序列中的位置被与第二序列中的相应位置相同的核苷酸占据时,那么分子在该位置是相同的。两个序列之间的百分同一性是序列共有的相同位置的数目的函数,考虑到需要引入以实现两个序列的最佳比对的空位的数量和每个空位的长度。可以使用数学算法完成序列的比较和两个序列之间的百分同一性的确定。当比较DNA和RNA时,胸腺嘧啶(T)和尿嘧啶(U)可被认为是等同的。
合适的软件程序可从各种来源获得,并用于蛋白质和核苷酸序列两者的比对。例如,确定百分序列同一性的一个合适的程序是Bl2seq,其是可从美国政府的国家生物技术信息中心BLAST网站(blast.ncbi.nlm.nih.gov)获得的BLAST程序套件的部分。Bl2seq使用BLASTN或BLASTP算法在两个序列之间进行比较。BLASTN用于比较核酸序列,而BLASTP用于比较氨基酸序列。其他合适的程序是例如Needle,Stretcher,Water或Matcher,生物信息学EMBOSS程序套件的部分,且也可从www.ebi.ac.uk/Tools/psa的欧洲生物信息学研究所(EBI)获得。序列比对可以使用本领域已知的方法进行,例如MAFFT,Clustal(ClustalW,Clustal X或Clustal Omega),MUSCLE等。
术语“编码区”和“编码区域”是指多核苷酸中的开放阅读框(ORF),其在表达时产生多肽或蛋白质。
“可操作地连接”是指两个或更多个分子,构建体,转录物,实体,部分等之间的功能性连接。
结构域:如本文所用,当提及多肽时,术语“结构域”是指具有一个或多个可识别的结构或功能特征或性质(例如,结合能力,用作蛋白质-蛋白质相互作用的位点)的多肽的基序。
表达:如本文所用,核酸序列的“表达”是指一个或多个以下事件:(1)从DNA序列产生mRNA模板(例如,通过转录);(2)mRNA转录物的加工(例如,通过剪接,编辑,5'帽形成和/或3'末端加工);(3)将mRNA翻译成多肽或蛋白质;和(4)多肽或蛋白质的翻译后修饰。
术语“蛋白突变体”或“多肽突变体”是指其氨基酸序列与天然或参考序列不同的分子。与天然或参考序列相比,氨基酸序列突变体可在氨基酸序列内的某些位置具有置换、缺失和/或插入等。通常,突变体与天然或参考序列将具有至少约50%的同一性,至少约60%的同一性,至少约70%的同一性,至少约80%的同一性,至少约90%的同一性,至少约95%的同一性,至少约99%的同一性。
“烷基”是指从含有1到30个碳原子的烃部分通过去除单个氢原子得到的饱和烃基。烷基的实例包括(但不限于)甲基、乙基、丙基、异丙基、正丁基、仲丁基、叔丁基、正戊基、异戊基、新戊基、正己基、正庚基、正辛基、正癸基、正十一烷基和正十二烷基。
“烯基”表示从具有至少一个碳-碳双键的烃部分通过去除单个氢原子得到的单价基团。烯基包括例如例如乙烯基、丙烯基、丁烯基、1-甲基-2-丁烯-1-基等。
“药学上可接受的赋形剂”是指除本文所述S蛋白突变体或mRNA之外的任何成分,并且在患者中具有基本上无毒和非炎性的性质,包括但不限于任何和所有溶剂、分散介质或其他液体载体、分散或悬浮助剂、稀释剂、制粒和/或分散剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、粘合剂、润滑剂、着色剂、甜味剂或调味剂、稳定剂、抗氧化剂、抗微生物剂或抗真菌剂、摩尔渗透压浓度调节剂、pH调节剂、缓冲剂、螯合剂、冷冻保护剂和/或填充剂,如适合于所需的特定剂型的。用于配制药物组合物的各种赋形剂和用于制备组合物的技术是本领域已知的。示例性抗微生物剂或抗真菌剂包括但不限于苯扎氯铵,苄索氯铵,对羟基苯甲酸甲酯,对羟基苯甲酸乙酯,对羟基苯甲酸丙酯,对羟基苯甲酸丁酯,苯甲酸,羟基苯甲酸,苯甲酸钾或苯甲酸钠,山梨酸钾或钠,丙酸钠,山梨酸等,以及它们的组合。示例性防腐剂包括但不限于,维生素A,维生素C,维生素E,β-胡萝卜素,柠檬酸,抗坏血酸,丁基化羟基苯甲醚,乙二胺,十二烷基硫酸钠(SLS),十二烷基醚硫酸钠(SLES)等,以及它们的组合。控制pH的示例性缓冲液可包括但不限于磷酸钠,柠檬酸钠,琥珀酸钠,组氨酸(或组氨酸-HCl),苹果酸钠,碳酸钠等,和/或其组合。示例性的冷冻保护剂包括但不限于甘露醇,蔗糖,海藻糖,乳糖,甘油,右旋糖等,以及它们的组合。示例性填充剂可包括但不限于蔗糖,海藻糖,甘露糖醇,甘氨酸,乳糖,棉子糖及其组合。
附图说明
图1:2019-nCoV S蛋白的一级结构示意图和预融合前的构象结构。图中A部分为S蛋白的一级结构示意图,SS(signal sequence)-信号肽序列,NTD(N-terminal domain)-N端区域,RBD(receptor binding domain)-受体结合域,S2’-S2’蛋白酶切位点,FP(fusionpeptide)-融合肽,HR1(heptad repeat 1)-7肽重复序列1,CH(central helix)-中心螺旋,CD(connector domain)-连接域,HR2(heptad repeat 2)-7肽重复序列2,TM(transmembrane domain)-跨膜域,CT(cytoplasmic tail)-胞质尾,箭头为蛋白酶切位点。S1/S2之前为S1亚基,之后为S2亚基;图中B部分为S蛋白预融合前结构的侧视图和顶视图。
图2:以Firefly Luc为报告蛋白,不同的体外转录载体制备的mRNA在细胞内蛋白表达量的统计图。
图3:使用RNA 6000nano chip在2100生物分析仪上分析B.1.351mRNA完整性结果。
图4:ELISA法检测核酸转染CHO-K1细胞后上清中S蛋白突变体表达水平。
图5:本发明S蛋白突变体的3D结构图。
图6:本发明S蛋白突变体免疫BALB/c鼠后体内结合抗体的产生情况统计图。图中a为野生型S蛋白三聚体结果,b为B.1.351mRNA翻译出的S蛋白的三聚体结果,c为空白对照。
图7:编码所述S蛋白突变体的mRNA的脂质纳米颗粒免疫BALB/c鼠后,体内结合抗体和中和抗体的产生情况统计图。图中d、e、f分别为5μg、1μg、0.2μg mRNA的脂质纳米颗粒(LNP)免疫后的结合抗体检测结果,图中纵坐标为浓度(μg/ml);图中g、h、i分别为5μg、1μg、0.2μg mRNA的脂质纳米颗粒(LNP)免疫后的中和抗体检测结果,图中横坐标为血清稀释倍数的log转换值,纵坐标为抑制率%。
图8:II-37和MC3制备的脂质纳米颗粒包封本发明mRNA转染细胞后上清中S蛋白表达水平。
图9:mRNA疫苗在BALB/c小鼠体内免疫原性试验的免疫策略示意图。
图10免疫mRNA疫苗后BALB/c小鼠特异性IgG结合抗体检测结果。BALB/c小鼠(n=4)在第0天和第21天肌肉注射不同剂量的mRNA疫苗或磷酸盐缓冲盐水(PBS,对照组,n=4)。第28天采血,并通过酶联免疫吸附试验(ELISA)测定血样中SARS-CoV-2B.1.351特异性的IgG结合抗体浓度。水平线代表中位数;每个点代表单独一只动物,相同数值的点被覆盖。图中所示数字为中位值。P-values采用单因素方差分析进行分析(ns,p>0.05;*p<0.05;**p<0.01;***p<0.001;****p<0.0001)。
图11免疫mRNA疫苗后BALB/c小鼠ACE2竞争性抑制检测结果。第28天采集血样,并测定血样中与血管紧张素转化酶2(ACE2)竞争性结合B.1.351蛋白的中和抗体滴度,结果以抑制率表示。图中所示数字为中位值,20%为检测下限值。
图12免疫mRNA疫苗后BALB/c小鼠血中中和抗体水平。BALB/c小鼠(n=4)在第0天和第21天肌肉注射不同剂量的mRNA疫苗或磷酸盐缓冲盐水(PBS,对照组,n=4)。第42天采集血样,并通过报告基因法(Vazyme)测定基于VSV-SARS-CoV-2的B.1.351假病毒50%中和滴度(pVNT50)。图中所示数字为中位值。
图13免疫mRNA疫苗后BALB/c小鼠血中中和抗体水平。BALB/c小鼠(n=4)在第0天和第21天肌肉注射不同剂量的mRNA疫苗或磷酸盐缓冲盐水(PBS,对照组,n=4)。第42天采集血样,并测定血样中对于B.1.351活毒毒株的中和抗体滴度。图中所示数字为中位值。
图14H11 K18-hACE2转基因小鼠免疫策略示意图。
图15mRNA疫苗免疫K18-hACE2小鼠后特异性IgG结合抗体表达。小鼠(n=12)在第0天和第25天肌肉注射不同剂量的mRNA疫苗或生理盐水(对照组,n=12);攻毒对照组不进行注射(n=8)。第32天采血,并通过ELISA法测定血样中SARS-CoV-2B.1.351特异性的IgG结合抗体浓度。每个点代表单只动物,相同数值的点被覆盖,图中所示数字为中位值。P-values采用单因素方差分析进行分析(ns,p>0.05;*p<0.05;**p<0.01;***p<0.001;****p<0.0001)。
图16mRNA疫苗免疫K18-hACE2小鼠后ACE2竞争性结合抑制结果。第32天采血,并测定血中与ACE2竞争性结合B.1.351蛋白的中和抗体滴度,结果以抑制率(%)表示。图中所示数字为中位值,20%为抑制率cut-off值。。
图17恒河猴免疫策略示意图。
图18mRNA疫苗免疫恒河猴后ACE2竞争性抑制检测结果。雄性恒河猴(8岁)在第0天和第28天肌肉注射10μg、30μg或者100μg mRNA疫苗(n=5),对照组注射生理盐水(n=5)。在第35天采血,并测定血中与ACE2竞争性结合B.1.351蛋白的中和抗体滴度,结果以抑制率(%)表示。图中所示数字为中位值,20%为抑制率cut-off值。
图19mRNA疫苗3批中试样本(tri02101-1、tri02101-2、tri02101-3)的批间稳定性。左上图:采用ELISA法检测三批次制剂侵染A549细胞的Spike蛋白表达情况;右上图:免疫三批mRNA疫苗后的小鼠在第28天采集血样,测定血中与ACE2竞争性结合B.1.351蛋白的中和抗体滴度,结果以抑制率(%)表示,20%为cut-off值;下图:mRNA疫苗在低温冰箱(-80℃)贮存2天和2月后,按照标准SOP复融后侵染A549细胞,48h后采用ELISA法检测Spike蛋白表达情况。EC50采用PRISM软件log(agonist)vs.response--Variable slope(fourparameters)分析。
图20B.1.351毒株小鼠攻毒实验中组织病毒载量结果统计图
具体实施方式
下文将结合具体实施例对本发明的技术方案做更进一步的详细说明。应当理解,下列实施例仅为示例性地说明和解释本发明,而不应被解释为对本发明保护范围的限制。凡基于本发明上述内容所实现的技术均涵盖在本发明旨在保护的范围内。
除非另有说明,以下实施例中使用的原料和试剂均为市售商品,或者可以通过已知方法制备。所述实验方法是本领域常规的分子生物学方法,可以参照本领域的分子生物学实验手册或试剂盒产品说明书的指引进行操作。
实施例1本发明IVT载体的效率对比实验
本实施例以Firefly Luc为报告蛋白,构建了不同的IVT载体用于在体外转录合成能够翻译Firefly Luc的mRNA,对比合成的不同序列特征的mRNA的翻译效率。
采用本领域常规的质粒载体构建技术,将Firefly Luc的编码序列克隆到相应载体的多克隆位点上,得到编号分别为IVT1,IVT2,IVT3和IVT4的载体,之后使用AM1344试剂盒依据前述载体体外转录制备得到对应的Firefly Luc mRNA样品。
载体IVT1~IVT4均为在商业化载体psp73的基础上改造而来,以下序列在载体psp73酶切位点XhoI/NdeI处插入,其中IVT1中没有添加UTR序列,polyA尾长度为64个A;IVT2中使用了SEQ ID NO:6所示的5’UTR和GCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACTGGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAATAAAAAACATTTATTTTCATTGC的3’UTR序列(β珠蛋白的3’UTR序列),polyA长度为120个A;IVT3中使用了SEQ ID NO:6所示的5’UTR和SEQ ID NO:7所示的3’UTR序列,polyA长度为120个A;IVT4中使用了SEQ ID NO:6所示的5’UTR和2个串联重复的SEQ ID NO:7所示的3’UTR序列,polyA长度为120个A。在上述5’UTR和3’UTR的序列中间插入包含常见酶切位点HindIII和EcoRI的多克隆位点,再将Firefly Luc的编码序列克隆到HindIII和EcoRI的多克隆位点中。所有载体均为金斯瑞公司使用基因合成的方法构建得到。
将每种Firefly Luc mRNA样品以Lipofectamine2000(cat#11668030,购自赛默飞世尔公司)为转染试剂,转染到CHO细胞中,使用Dual-LumiTM双萤光素酶报告基因检测试剂盒(at#RG088S,购自上海碧云天生物技术有限公司)检测荧光素酶。将Firefly Luc的DNA转入psicheck2质粒作为阳性对照(psicheck2质粒,cat#60908-6151,购自北京天恩泽基因科技有限公司)。具体如下:第一天,将CHO细胞种到96孔板,每孔1.5×104个细胞,使用F12K+10%FBS培养过夜;第二天,转染前将培养基换成无血清的F12K培养基,使用Lipofectamine2000,将mRNA或DNA转染到CHO细胞中;每孔使用的核酸量为100ng,脂质体用量为0.3μl,每孔总体积为100μl,过夜培养;第三天,将无血清培养基换成完全培养基(F12K+10%FBS),继续培养24小时;第四天(转染后48小时),检测Firefly Luc荧光值。
结果如图2所示。图中“DNA”是阳性对照(携带有Firefly Luc的DNA的psicheck2质粒),“IVT1-Luc”、“IVT2-Luc”、“IVT3-Luc”、“IVT4-Luc”分别代表由IVT1,IVT2,IVT3和IVT4的载体体外转录得到的对应Firefly Luc mRNA,“Nagative control”为阴性对照。由图2可见,在相同mRNA的转染量下,IVT4-Luc的蛋白表达量远远高于其他三个mRNA,为其2-3倍,说明IVT4-Luc的稳定性好且翻译效率高。
实施例2 B.1.351mRNA的制备及其翻译
1.人工合成能够编码前述SEQ ID No.8所示mRNA的核酸序列,将该序列克隆到pUC57-kana载体的T7启动子后面,所述载体在之前经过改造,已含有能够编码SEQ ID NO:6、Kozak序列、2个首尾相连的SEQ ID NO:7、polyA尾的序列。编码前述SEQ ID NO:8所示mRNA的核酸序列克隆在Kozak序列和2个首尾相连SEQ ID NO:7之间的多克隆位点上,构建体外转录用质粒。
2.将构建的质粒转化到大肠杆菌Dh5a中,培养扩增,提取质粒。
3.将提取的质粒使用紧邻着polyA尾后面的限制性内切酶SpeI酶切消化成线性分子。
4.以制备的线性化质粒分子为模板,使用体外转录法(Thermo公司的体外转录试剂盒A45975)制备mRNA,所述mRNA的序列如SEQ ID NO:9所示,以下将所述mRNA简称为B.1.351mRNA,由该mRNA翻译后获得的是本发明S蛋白突变体,其氨基酸序列从N端向C端为直接连接的SEQ ID NO:2的氨基酸序列和SEQ ID NO:3的氨基酸序列。在体外转录结束后,使用加帽酶和二甲基转移酶给mRNA添加上CAP1的帽结构。
5.mRNA的纯化:得到的mRNA原液使用亲和层析法纯化。
6.mRNA的质控:将制备出来的mRNA,使用RNA 6000nano chip在2100生物分析仪上分析mRNA完整性,结果如图3所示,转录mRNA条带单一,无明显降解。
另外,通过限制性内切酶HindIII和EcoRI从商品化的质粒pCMV3-spike上切下Spike片段,插入到实施例1的IVT1载体的HindIII和EcoRI位点之间,得到IVT1-spike质粒。再对该质粒进行点突变,得到IVT1-spike-D614G质粒,以该质粒为模板,体外转录得到spike-D614G mRNA,表达包含D614G突变的全长S蛋白。
7.B.1.351mRNA细胞水平表达检测:以CHO-K1细胞系为表达体系,使用Lipofectamine Messenger MAX Reagent(Invitrogen,Cat#1168-027)将mRNA转染,培养48h后,收集细胞培养上清,采用检测S蛋白的酶联免疫法检测试剂盒,检测S蛋白表达水平,以评判mRNA可否翻译成蛋白。结果如图4所示。图4中,“spike DNA”为商品化的质粒pCMV3-spike(采购自义翘神州公司),表达全长野生型S蛋白;“spike-D614G mRNA”为前述表达包含D614G突变的全长S蛋白的mRNA,“spike B.1.351mRNA”为前述B.1.351mRNA,表达的是本发明所述的S蛋白突变体,结果表明本发明的mRNA可以在细胞内高表达出S蛋白突变体。
将得到的S蛋白突变体纯化后,采用冷冻电镜进行结构解析,该S蛋白的3D结构如图5所示,S蛋白突变体为预融合(prefusion spike structure)的稳定结构。B.1.351突变毒株的序列和野生毒株的序列有9个突变位点的差异,其中3个在RBD区域。已经报道的野生毒株的预融合S蛋白的RBD区域状态主要为1个OPEN、2个CLOSE的结构。本发明的S蛋白突变体的结构主要为2个OPEN和1个CLOSE的柔性状态。这种结构差异,是病毒与受体ACE2结合能力增强和传染性增强的结构基础,并且该结构差异,也会导致S蛋白的免疫原性表位的显著差异,从而基于不同结构诱导的抗体尤其是中和抗体的显著不同。
实施例3.S蛋白突变体免疫原性的测定
使用BALB/c鼠评价S蛋白突变体诱导结合抗体和中和抗体的产生:6周龄雌性BALB/c鼠,初次免疫及二次免疫间隔2周;免疫14天后采血。ELISA法检测针对S蛋白突变体的结合抗体的表达,化学发光检测针对S蛋白突变体的中和抗体滴度。
ELISA方法检测结合抗体:通过在酶标板上包被商业化S蛋白捕获免疫小鼠血浆中针对S蛋白突变体的结合抗体,再用生物素标记的检测抗体进行吸光度检测。化学发光检测针对S蛋白突变体的中和抗体滴度:免疫后小鼠血浆与携带荧光素酶报告基因的SPIKE慢病毒(中吉当康;商品名称:SRAS-CoV-2假病毒(B.1.351)-LUC;商品编号:DZPSC-L-0;批次:K05202102)中和后去感染高表达ACE-2的293T细胞(中吉当康;商品名称:“YJ1B09”hACE2-293T cell lines;商品编号:YJ293T-01;批次:A23202001),用化学发光(Bright-Lumi II萤火虫萤光素酶报告基因检测试剂盒,品牌:碧云天;商品编号:RG052M)评定血浆的中和抗体滴度。
对照组共9只小鼠,每只小鼠皮下注射2ug蛋白。其中,3只注射的蛋白为实施例2的B.1.351mRNA翻译出的S蛋白的三聚体纯化物,3只注射的蛋白为野生型的S蛋白的三聚体,3只注射的是空白脂质纳米颗粒,脂质纳米颗粒的脂质配方是II-37:DSPC:CHOL:DMG-PEG2000的摩尔比为35:15:48.5:1.5。
实验组共18只小鼠,皮下注射mRNA的脂质纳米颗粒;其中1-6号注射0.2μg mRNA的脂质纳米颗粒(LNP),7-12号注射1μg mRNA的脂质纳米颗粒(LNP),13-18号注射5μg mRNA的脂质纳米颗粒(LNP),其中的mRNA是实施例2的B.1.351mRNA,脂质纳米颗粒的脂质配方是II-37:DSPC:CHOL:DMG-PEG2000的摩尔比为35:15:48.5:1.5。
初次免疫及二次免疫后小鼠结合抗体表达水平以及中和抗体水平如图6-7所示。
由图6中的a、b、c可见,实施例2的B.1.351mRNA翻译出的S蛋白三聚体纯化物及野生型的S蛋白三聚体在小鼠体内均可以诱导出抗S蛋白的结合抗体:在实验小鼠中第二次免疫时已经能产生较高浓度的结合抗体,在二次免疫后8周,所述结合抗体的浓度仍保持较高水平,经计算,二次免疫后结合抗体浓度在2.2μg/ml左右,二次免疫后8周,仍能维持1.6μg/ml左右。
由图7中的d、e、f可见,二次免疫LNP包裹的mRNA制剂后的小鼠,即使是低剂量(0.2μg)注射组也可在小鼠体内诱导出抗S蛋白的结合抗体,经计算,结合抗体水平约为0.1-0.3μg/ml。由图7中的g、h、i可见,二次免疫LNP包裹的mRNA制剂后的小鼠体内诱导出了较好的中和抗体,中和抗体的GMT值分别为78.69,21.9和72.19。
实施例4可电离脂质II-37的合成
Figure BDA0003675470430000311
亚麻油醇(a2)的合成:在0℃下,向950mL四氢呋喃中加入LiAlH4(7.20g)、亚麻油酸(50g,a1),之后混合物在25℃下搅拌2h。薄层色谱法(TLC)显示反应完成后,向反应液依次加入水(7.2mL),NaOH水溶液(7.2mL,质量分数为15%)和水(21.6mL)淬灭,并加入适量Na2SO4搅拌15分钟后通过布氏漏斗过滤并用乙酸乙酯洗涤滤饼,收集滤液并蒸发浓缩,得到目标产物亚麻油醇(a2)47.4g。
1H NMR(400MHz,CDCl3):δ5.27-5.44(m,4H),3.63(t,J=6.63Hz,2H),2.77(t,J=6.44Hz,2H),1.97-2.12(m,4H),1.57-1.63(m,1H),1.20-1.46(m,18H),0.83-0.95(m,3H)
(9Z,12Z)-十八碳-9,12-二烯醛(a3)的合成:在室温下,向170mL乙腈中加入亚麻油醇(25.0g,a2)和2-碘酰基苯甲酸(39.4g),之后混合物在85℃下搅拌4h。反应液通过布氏漏斗过滤并用二氯甲烷洗涤滤饼,收集滤液并蒸发浓缩,得到目标产物(9Z,12Z)-十八碳-9,12-二烯醛(a3)24.0g。
1H NMR(400MHz,CDCl3):δ9.76(t,J=1.76Hz,1H),5.25-5.43(m,4H),2.76(t,J=6.17Hz,2H),2.41(td,J=7.33,1.87Hz,2H),2.04(q,J=6.84Hz,4H),1.56-1.68(m,2H),1.22-1.36(m,14H),0.88(t,J=6.73Hz,3H)
(9Z,12Z)-2-氯代-十八碳-9,12-二烯-1-醇(a4)的合成:在0℃下,向246mL乙腈中加入(9Z,12Z)-十八碳-9,12-二烯醛(43.0g,a3),DL-脯氨酸(5.62g)和N-氯代丁二酰亚胺,然后在0℃下搅拌2h。反应完成后,用无水乙醇(246mL)稀释反应液,再加入硼氢化钠(8.8g),之后在0℃下搅拌4h。向反应混合物中加水(120mL)淬灭,并用甲基叔丁基醚萃取,合并有机相后用饱和食盐水洗涤,硫酸钠干燥之后过滤、蒸发浓缩,得到目标产物(9Z,12Z)-2-氯代-十八碳-9,12-二烯-1-醇(a4,46g),直接用于下一步。
1H NMR(400MHz,CDCl3):δ5.25-5.51(m,4H),3.97-4.07(m,1H),3.79(dd,J=12.01,3.63Hz,1H),3.59-3.70(m,1H),2.67-2.90(m,2H),1.96-2.15(m,5H),1.64-1.82(m,1H),1.20-1.49(m,15H),0.89(br t,J=6.75Hz,3H)
2-[(7Z,10Z)-十六碳烷-7,10-二烯]环氧乙烷(a5)的合成:在室温下,向450mL1,4-二氧六环中加入(9Z,12Z)-2-氯代-十八碳-9,12-二烯-1-醇(45g,a4)和氢氧化钠水溶液(120g氢氧化钠溶于585mL水),滴加完毕后混合物在35℃下搅拌2h。TLC显示反应完成后,反应液通过分液漏斗分离,并用饱和食盐水洗涤,硫酸钠干燥后过滤并蒸发浓缩,然后通过快速过柱法用石油醚/乙酸乙酯洗脱来纯化残余物,得到目标产物2-[(7Z,10Z)-十六碳烷-7,10-二烯]环氧乙烷(a5)29.11g。
1H NMR(400MHz,CDCl3):δ5.27-5.46(m,4H),2.87-2.98(m,1H),2.70-2.85(m,3H),2.46(dd,J=5.00,2.75Hz,1H),1.94-2.21(m,4H),1.24-1.58(m,17H),0.78-1.00(m,3H)
II-37的合成:在室温下,向10mL乙醇中加入2-[(7Z,10Z)-十六碳烷-7,10-二烯]环氧乙烷(5g)和N,N-二(2-氨基乙基)甲胺(739mg),之后混合物在90℃下搅拌36h。反应液蒸发浓缩,然后通过快速过柱法用二氯甲烷/甲醇洗脱来纯化残余物,得到粗产物II-37(4g)。再次通过快速过柱法用二氯甲烷/甲醇纯化目标产物,得到II-37(2.2g)。
1H NMR(400MHz,CDCl3):δ5.27-5.44(m,12H),3.48-3.79(m,3H),2.63-3.00(m,12H),2.16-2.61(m,12H),2.05(q,J=6.80Hz,12H),1.18-1.57(m,51H),0.89(t,J=6.88Hz,9H)
ESI-MS:m/z 910.8[M+H]+,911.8[M+2H]+,912.8[M+3H]+
实施例5 II-37和商业化可电离阳离子脂质分子MC3的效果对比
MC3为:4-(N,N-二甲基氨基)丁酸(6Z,9Z,28Z,31Z)-庚三十碳-6,9,28,31-四稀-19-基脂。
准确称取化合物II-37、MC3、DSPC、CHOL、DMG-PEG2000,将每种脂质于适当容器中,无水乙醇充分溶解备用。分别使用II-37和MC3制备脂质纳米颗粒,具体摩尔配比为:II-37:DSPC:CHOL:DMG-PEG2000=45:15:38.5:1.5;MC3:DSPC:CHOL:DMG-PEG2000=45:15:38.5:1.5;将脂质溶液按比例混合均匀,作为有机相,将实施例2的B.1.351mRNA配置成水溶液(以纯水为溶剂)为水相pH=4。
有机相与水相体积比例为3:1混合,在微流控平台(如,PNI Ignite)上制备得到脂质纳米颗粒混悬液。将得到的脂质纳米颗粒悬浮液经100KDa超滤离心管离心过滤,纯化浓缩,将浓缩后的液体进行分装。
将制备所得脂质纳米颗粒用激光纳米粒度仪测粒径、PDI、电位,用紫外分光光度计结合RiboGreen RNA试剂盒测包封率(EE%),部分样本按照实施例2的方式转染细胞CHO,并通过Elisa检测细胞转染率。
制备得到的脂质纳米颗粒理化质控数据如下表所示:
样本信息 粒径(nm) PDI Zeta电位 包封率
mRNA-LNP(II-37) 154.58±27.75 0.1068 22.07 90.5
mRNA-LNP(MC3) 234.08±40.11 0.1259 2.44 40.7
由上表可见,II-37制备的脂质纳米颗粒包封率高达90.5%,远高于MC3的脂质纳米颗粒,并且粒径更小更均一,电位更高。
上述脂质纳米颗粒转染细胞,结果如图8所示,II-37(图中以C2表示)制备的脂质纳米颗粒携带mRNA转染细胞之后,细胞中蛋白表达量远远高于MC3的,说明II-37制成的脂质纳米颗粒的细胞转染效率很高。
实施例6更全面的免疫原性实验结果
所采用的mRNA疫苗同实施例3中制备的包载mRNA的LNP脂质颗粒,脂质成分II-37:DSPC:CHOL:DMG-PEG2000的摩尔比为35:15:48.5:1.5。
BALB/c小鼠购自北京维通利华实验动物技术有限公司(动物生产许可证:SCXK(京)2021-0006),6-8周龄,BALB/c雌性小鼠(SPF级)进行实验。H11-K18-hACE2转基因鼠购自江苏集萃药康生物科技股份有限公司(生产动物许可证:SCXK(苏)2018-0008),6周龄,SPG级;该ACE2人源化小鼠模型是在C57BL/6JGpt背景鼠上做ACE2人源化小鼠,通过人类细胞角蛋白18(Cytokeratin 18,K18)启动子调控启动子驱动hACE2在安全岛H11位点过表达,用于模拟人类重度COVID-19表型。恒河猴年龄范围为9-22岁,雌雄均有,健康,在环境适应与检疫期间,经检查其外观、精神状况、姿态、呼吸、粪尿情况、摄食与饮水状况均未见异常,符合实验要求。
特异性IgG结合抗体检测(ELISA法),主要用于检测外周血中结合免疫原的总抗体浓度。采用间接ELISA法检测免疫动物血浆中SARS-CoV-2特异性IgG抗体含量。将0.05μgSARS-CoV-2-B.1.351的Spike抗原蛋白包被在酶标板(Thermo,Catalog Number.#442404),2-8℃条件下包被过夜。室温下用3%BSA(SIGMA,Catalog Number.#A7030)封闭1h,加入稀释后的小鼠血浆(1:50),猴血浆(1:500)孵育2h,PBST洗涤5次。然后加入HRP偶联山羊抗鼠/猴的二抗在室温条件下孵育30-45min,PBST洗涤5次。用TMB(Thermofisher,Catalog Number.#34029)显色,室温孵育7min,加入终止液(Solarbio,Catalog Number.#C1058)终止反应,在450nm波长下测量吸光度确定抗体含量。选择阳性抗体(小鼠组:义翘神州Cat#40591-MM43,恒河猴组:ACRO Cat#SPD-M201)多项式法拟合标准曲线,标定抗体总量。
受体蛋白血管紧张素转化酶2(Angiotensin converting enzyme 2,ACE2)竞争性结合实验(ELISA法),主要用于评估抗体抑制ACE2与B.1.351Spike蛋白结合能力,用“抑制率”表示。使用ELISA Anti-SARS-CoV-2Neutralizing Antibody Titer Serologic AssayKit(ACRO,Catalog Number.#RAS-N031/RAS-N040/RAS-N056),在已预包被Human ACE2Protein的孔板上,将小鼠/猴血浆稀释后加入微孔板,血浆中的SARS-CoV-2-B.1.351中和抗体(Spike RBD)与微孔板上预包被的Human ACE2 Protein特异性竞争HRP-SARS-CoV-2Spike.37℃恒温孵育1h后,用底物37℃恒温孵育显色20min,随后用终止液终止。使用酶标仪(BioTek,SLXFATS)在450nm/630nm处测定样本吸光度值(OD450 nm/OD 630nm)。各孔OD450 nm扣除OD630 nm读数降低背景干扰。抑制率计算方法:OD450nm抑制率=(1-样品OD450 nm/Negative Control OD450 nm)×100%。
假病毒法检测中和抗体水平(报告基因法),用于评估中和含有B.1.351Spike蛋白的假病毒的抗体水平,通过检测其侵染过表达ACE2细胞系的程度判定。中和抗体可以阻断新冠假病毒表面S蛋白和ACE2的结合,从而阻止假病毒对宿主细胞的感染。通过检测报告基因荧光素酶的表达量,能推断出病毒被阻断的程度。取疫苗注射前后不同时间点的小鼠/猴的血浆/血清样本,所有样本在使用前56℃水浴30min热灭活。用无血清的DMEM(GibcoCatalog Number.#C11995500CP)培养基稀释20倍后用0.22μm的滤膜进行过滤除菌,然后在含10%FBS(Gibco Catalog Number.#10099-141C)的DMEM培养基中制备3倍连续稀释液,共6个梯度。提前将SARS-CoV-2-Fluc假病毒(Vazyme)从-80℃转至4℃冰箱或者冰上待融化,使用前用含10%FBS血清的DMEM培养基稀释病毒至1-2×104TCID50/ml。将病毒悬液与等量的血浆在96孔板中混合,37℃孵育1h.每孔加入50μL密度为2×104cells/well的过表达ACE2的293细胞,培养48h后,取出96孔板,从孔板中吸出100μL培养基,加入100μL室温平衡后的Bio-Lite报告基因(Vazyme,Catalog Number.#DD1201)检测试剂,震板2min,室温静置5min后用多功能酶标仪(TECAN,Spark)检测化学发光值(RLU)。
活病毒中和法检测中和抗体水平,采用活病毒感染后细胞病变法,评估血样中抗体中和活病毒的能力。
mRNA疫苗在BALB/c小鼠体内免疫原性试验及其结果
BALB/c小鼠免疫策略见图9,2次免疫间间隔21天,常规取血,用于抗体检测。实验设置了6个疫苗剂量组,另单独设立PBS对照组。6个剂量组探索范围从最低剂量0.02μg依次按4倍递增,即0.02,0.08,0.3,1.25,5至最高剂量组20μg。
特异性IgG结合抗体检测结果如图10所见,与PBS对照组相比,所有剂量组均可显著诱导出针对B.1.351毒株的S蛋白特异性IgG抗体的产生。20μg最高剂量组抗体浓度中位值为38534ng/mL,5μg组和1.25μg组抗体浓度中位值分别为13698,10987ng/mL,与20μg组之间无统计学差异,其它各组也诱导出高滴度结合抗体,且各组呈量效关系。
ACE2竞争性结合B.1.351毒株的S蛋白抑制结果如图11,用抑制率表示。结果表明:从0.3μg组至20μg组,抑制率中位数分别为66%、77%和85%。
假病毒中和抗体水平结果如图12,0.3,1.25,5,20μg组几何平均滴度(Geometricmean titer,GMT)分别为211,183,149,3689,从0.3μg组起,均可诱导高水平的中和抗体产生。
活病毒中和抗体B.1.351毒株的S蛋白结果如图13。5μg和20μg组GMT分别为120和1280,与假病毒实验的GMT一致。
抗体水平显示剂量依赖效应,本发明的mRNA疫苗可诱导剂量依赖的特异体液免疫。
随后,发明人在BALB/c小鼠中进行了多次免疫原性评价和产品稳定性考察,采用3批次中试样品(组成与实施例3的LNP一样,II-37:DSPC:CHOL:DMG-PEG2000的摩尔比为35:15:48.5:1.5)进行重复体外抗原蛋白表达量检测,以及ACE2竞争抑制率实验。3批中试样本在A549细胞系中进行蛋白表达,3批蛋白表达量的CV值为9.5%,表明所得Spike蛋白量均一性好。3批中试样本在小鼠体内诱导抗体水平一致也很好。表明本发明的mRNA疫苗具有良好的批间稳定性。此外,发明人还将所述3批中试样品的mRNA疫苗分别在低温冰箱(-80℃)贮存2天和2月后,按照标准SOP复融后侵染A549细胞,48h后采用ELISA法检测Spike蛋白表达情况,蛋白表达情况稳定,说明长期冻存后活性保持良好。结果见图19。
mRNA疫苗在H11 K18-hACE2转基因小鼠体内药效及攻毒试验
H11 K18-hACE2转基因小鼠免疫策略见图14,2次免疫间间隔25天,常规取血,用于抗体检测,并于二次免疫后14天后转运至P3实验室进行攻毒实验。实验设置了3个剂量组,另单独设立生理盐水对照组和空白小鼠对照组。0.8μg,4μg,20μg分别为低中高剂量组。
特异性IgG结合抗体检测如图15可见,与生理盐水攻毒对照组和空白对照组相比,所有剂量组均可显著诱导出针对B.1.351毒株的S蛋白特异性IgG抗体。20μg最高剂量组抗体浓度中位值为15679ng/mL,4μg组,0.8μg组抗体浓度中位值分别为22280,8595ng/mL,与20μg组之间无统计学差异。
ACE2竞争性结合B.1.351毒株的S蛋白抑制结果如图16。用抑制率表示。结果表明,不同剂量组组下因个体差异,表现不同的抑制效应。
同时,在二次免疫后14天转运至P3实验室进行攻毒实验,攻毒(B.1.351毒株)病毒滴度100TCID50/20μl,采用滴鼻攻毒,攻毒三天后,处死小鼠,收集小鼠的肺、脑、心脏、脾、肾脏和小肠,检测组织中病毒载量。结果如图20所示。在接受PBS对照品的小鼠肺部和脑部,可以检测到高滴度的新冠病毒,而接受了不同剂量疫苗免疫小鼠的肺部和脑部组织,病毒滴度均显著降低。
mRNA疫苗在恒河猴体内免疫原性试验
恒河猴免疫策略见图17,2次免疫间间隔28天,常规取血,用于抗体检测。实验设置了3个剂量组,另单独设立生理盐水对照组。10,30,100μg分别为低,中,高剂量组。
ACE2竞争性结合B.1.351毒株的S蛋白抑制结果如图18,用抑制率表示。结果表明,10μg,30μg,100μg剂量组,抑制率中位值分别为52%,86%和94%。
本发明的发明人将进行的上述各项实验的多次结果进行相关性分析,结果证明ACE2竞争抑制法与假病毒中和法在小鼠实验和恒河猴实验中均可很好的表征相应物种的活病毒中和程度。
以上,对本发明的实施方式进行了说明。但是,本发明不限定于上述实施方式。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 北京启辰生生物科技有限公司
<120> 2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物
<130> CPCN21411052a
<150> 202111176258.3
<151> 2021-10-09
<160> 9
<170> PatentIn version 3.5
<210> 1
<211> 1273
<212> PRT
<213> Unknown
<220>
<223> 2019-nCoV野生型S蛋白
<400> 1
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65                  70                  75                  80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
                85                  90                  95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
            100                 105                 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
        115                 120                 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
    130                 135                 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145                 150                 155                 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
                165                 170                 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
            180                 185                 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
        195                 200                 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
    210                 215                 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225                 230                 235                 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
                245                 250                 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
            260                 265                 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
        275                 280                 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
    290                 295                 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305                 310                 315                 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
                325                 330                 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
            340                 345                 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
        355                 360                 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
    370                 375                 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385                 390                 395                 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
                405                 410                 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
            420                 425                 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
        435                 440                 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
    450                 455                 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465                 470                 475                 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
                485                 490                 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
            500                 505                 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
        515                 520                 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
    530                 535                 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545                 550                 555                 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
                565                 570                 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
            580                 585                 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
        595                 600                 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
    610                 615                 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625                 630                 635                 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
                645                 650                 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
            660                 665                 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
        675                 680                 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
    690                 695                 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705                 710                 715                 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
                725                 730                 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
            740                 745                 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
        755                 760                 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
    770                 775                 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785                 790                 795                 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
                805                 810                 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
            820                 825                 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
        835                 840                 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
    850                 855                 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865                 870                 875                 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
                885                 890                 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
            900                 905                 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
        915                 920                 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
    930                 935                 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945                 950                 955                 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
                965                 970                 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
            980                 985                 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
        995                 1000                1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
    1010                1015                1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
    1025                1030                1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
    1040                1045                1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
    1055                1060                1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
    1070                1075                1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
    1085                1090                1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
    1100                1105                1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
    1115                1120                1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
    1130                1135                1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
    1145                1150                1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
    1160                1165                1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
    1175                1180                1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
    1190                1195                1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
    1205                1210                1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
    1220                1225                1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
    1235                1240                1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
    1250                1255                1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
    1265                1270
<210> 2
<211> 1205
<212> PRT
<213> Artificial Sequence
<220>
<223> 2019-nCoV S蛋白突变体
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65                  70                  75                  80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
                85                  90                  95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
            100                 105                 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
        115                 120                 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
    130                 135                 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145                 150                 155                 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
                165                 170                 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
            180                 185                 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
        195                 200                 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
    210                 215                 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225                 230                 235                 240
Leu His Ile Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
                245                 250                 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
            260                 265                 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
        275                 280                 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
    290                 295                 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305                 310                 315                 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
                325                 330                 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
            340                 345                 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
        355                 360                 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
    370                 375                 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385                 390                 395                 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
                405                 410                 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
            420                 425                 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
        435                 440                 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
    450                 455                 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465                 470                 475                 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
                485                 490                 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
            500                 505                 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
        515                 520                 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
    530                 535                 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545                 550                 555                 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
                565                 570                 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
            580                 585                 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
        595                 600                 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
    610                 615                 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625                 630                 635                 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
                645                 650                 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
            660                 665                 670
Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
        675                 680                 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
    690                 695                 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705                 710                 715                 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
                725                 730                 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
            740                 745                 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
        755                 760                 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
    770                 775                 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785                 790                 795                 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu
                805                 810                 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
            820                 825                 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
        835                 840                 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
    850                 855                 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865                 870                 875                 880
Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro
                885                 890                 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
            900                 905                 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
        915                 920                 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys
    930                 935                 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945                 950                 955                 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
                965                 970                 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
            980                 985                 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
        995                 1000                1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
    1010                1015                1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
    1025                1030                1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
    1040                1045                1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
    1055                1060                1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
    1070                1075                1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
    1085                1090                1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
    1100                1105                1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
    1115                1120                1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
    1130                1135                1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
    1145                1150                1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
    1160                1165                1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
    1175                1180                1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
    1190                1195                1200
Glu Gln
    1205
<210> 3
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> 辅助形成三聚体的结构域
<400> 3
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1               5                   10                  15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly
            20                  25
<210> 4
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 4
atgttcgtgt tcctggtgct gcttcccctg gtctctagcc agtgcgtgaa cttcacgacc 60
cggacccaac tgccccccgc gtacacaaac tccttcacca gaggcgtgta ctaccctgac 120
aaggtgttcc gcagcagcgt gctgcacagc acccaggacc tgttcctccc attcttcagc 180
aacgtgacct ggttccacgc catccacgtg tccggcacca atggaacaaa gagatttgcg 240
aaccccgtgc tacctttcaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gactctaaaa cccagagcct gctgatcgtg 360
aataatgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa cgaccctttc 420
ctgggcgtct actaccacaa gaacaacaag agttggatgg aaagcgagtt cagagtgtac 480
tcttctgcta acaactgcac cttcgagtac gtgtcccagc ctttcctgat ggacctggaa 540
ggcaagcagg ggaacttcaa gaacctgcgg gagttcgtgt tcaagaacat cgacgggtat 600
ttcaagatct actccaagca cacacctatc aatctggtga gaggcctgcc ccagggcttc 660
agcgccctgg aacctctggt cgacctgcca atcggcatca acatcacccg gttccaaaca 720
ctgcatatca gctacctgac acctggcgat agctcctccg gctggaccgc cggcgctgcc 780
gcttattacg tcggctacct gcagcctaga acgttcctgc tgaagtacaa cgagaacggc 840
accatcaccg acgccgtcga ctgcgccctg gaccccctct ccgagacaaa atgcaccctg 900
aagagcttca ctgttgaaaa gggcatctac cagaccagca actttagagt gcagcctaca 960
gagtctatcg tgagattccc taacattacc aacctgtgtc cttttggaga agtgttcaac 1020
gccacaagat tcgcttctgt gtatgcctgg aaccggaaga gaatctcgaa ctgcgtggct 1080
gattacagcg tgctgtacaa cagcgctagc tttagcacat ttaagtgcta cggcgtgagc 1140
cccaccaagc tgaatgattt gtgcttcaca aatgtgtacg ccgactcttt cgtgataaga 1200
ggggacgagg tgcggcagat agctccaggc cagaccggca acatcgccga ttacaattac 1260
aagctgcctg acgactttac cggatgtgtg atcgcctgga acagcaacaa cctggatagc 1320
aaggtgggcg gaaactacaa ctacctgtac agactgttcc ggaaatctaa ccttaagcct 1380
tttgagcggg atatcagcac cgagatctac caagctggct ctacaccctg caacggcgtg 1440
aaggggttta attgttactt ccccctgcag agctacggct tccaaccgac ctacggagtg 1500
ggctaccagc cctaccgggt cgtggtgctg agctttgagc tgctgcacgc ccctgctaca 1560
gtgtgcggcc ccaagaagtc tacgaacctg gtgaagaaca agtgtgtgaa ttttaatttc 1620
aacggactga ccggcacagg cgtcctgacc gaatctaaca agaaattcct ccctttccag 1680
cagttcggga gagatatcgc cgacaccacc gacgccgtgc gggaccctca aacactggaa 1740
atcctggata tcaccccttg ttctttcgga ggcgtgtccg tgatcacccc aggtacgaac 1800
acatctaacc aggtggctgt gctgtaccag ggcgtgaact gcaccgaggt gcctgtggcc 1860
attcacgccg accagctgac tcctacctgg cgggtgtaca gcacgggctc caacgtgttt 1920
cagaccagag ctggctgtct gatcggagcc gagcacgtga acaactctta tgagtgcgat 1980
atccccatcg gcgctggaat ctgtgcctcc taccagactc aaaccaacag ccctggcagc 2040
gctagcagcg tggccagcca gagcatcatc gcctacacca tgagcctggg agtcgaaaac 2100
agcgtggcct actcaaacaa ctccatcgct atccctacca acttcaccat cagcgtaacg 2160
accgaaatcc tgcccgtgag catgaccaag accagcgtgg actgcacaat gtacatctgc 2220
ggcgatagca cagaatgcag caatctgcta ctgcagtacg gtagcttttg cacccaactg 2280
aatagagccc tgaccggcat cgccgtggaa caggataaaa acacccaaga ggtcttcgct 2340
caggtgaagc agatctacaa gacacctccc atcaaggact tcggaggatt caactttagc 2400
cagatcctgc ctgatccaag caaacctagc aagcggagtc ctatcgagga cctgctgttt 2460
aacaaggtga cactggccga cgccggcttc atcaagcagt atggcgactg tctgggcgac 2520
atcgccgcca gggatctgat ctgtgcccaa aaattcaacg gcctgacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac accagcgccc tcctcgccgg cacgatcacc 2640
agcggctgga cattcggcgc cggccctgcc ctccagatcc ctttccctat gcagatggcc 2700
tacagattca acggcatcgg cgtgacacaa aacgtgctgt acgaaaacca gaagctgatc 2760
gccaatcagt ttaatagcgc catcgggaag atccaggata gcctgtcatc taccccttct 2820
gccctgggaa agctgcagga cgtggtgaac cagaacgccc aggccctgaa caccctggtg 2880
aaacagctgt ctagcaactt cggcgctatc agcagcgtgc tgaatgatat cctgagcaga 2940
ctggatcctc ctgaggccga ggtgcagatc gacagattga tcaccggccg gctgcagagc 3000
ctgcaaacct acgttacaca gcagctgatc agagccgctg aaatcagagc ctctgccaac 3060
ctggccgcca ccaaaatgag cgagtgcgtg ctgggacaga gcaaaagggt ggacttctgc 3120
gggaagggct accacctcat gagttttccc cagagcgccc cccacggcgt ggtgttcctg 3180
cacgtgacat atgtcccggc ccaggagaaa aactttacaa cagcccctgc catttgccat 3240
gacggaaagg cccacttccc tcgggaaggt gtgttcgtga gcaacggcac acactggttc 3300
gtgacccaga gaaacttcta cgagcctcaa atcatcacca cagacaacac cttcgttagt 3360
ggaaattgcg acgtggttat cggcatcgtg aacaacaccg tctacgaccc actgcagcct 3420
gaactggata gcttcaagga ggaactggat aagtatttca agaaccacac ctcccccgac 3480
gtggatctgg gcgacattag cggcatcaac gccagcgtgg tgaacatcca gaaagagatc 3540
gatagactta atgaggtggc caagaacctg aacgagagcc tgatcgacct gcaggagctc 3600
ggcaaatacg agcag 3615
<210> 5
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 5
ggctatatcc cagaggcccc tagagatggc caggcctacg ttagaaagga cggcgagtgg 60
gtcctgctga gcacattcct gggc 84
<210> 6
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 6
acauuugcuu cugacacaac uguguucacu agcaaccuca aacagacacc 50
<210> 7
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 7
gcuggagccu cgguagccgu uccuccugcc cgcugggccu cccaacgggc ccuccucccc 60
uccuugcacc ggcccuuccu ggucuuug 88
<210> 8
<211> 3702
<212> RNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 8
auguucgugu uccuggugcu gcuuccccug gucucuagcc agugcgugaa cuucacgacc 60
cggacccaac ugccccccgc guacacaaac uccuucacca gaggcgugua cuacccugac 120
aagguguucc gcagcagcgu gcugcacagc acccaggacc uguuccuccc auucuucagc 180
aacgugaccu gguuccacgc cauccacgug uccggcacca auggaacaaa gagauuugcg 240
aaccccgugc uaccuuucaa cgacggcgug uacuucgccu ccaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacucuaaaa cccagagccu gcugaucgug 360
aauaaugcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgacccuuuc 420
cugggcgucu acuaccacaa gaacaacaag aguuggaugg aaagcgaguu cagaguguac 480
ucuucugcua acaacugcac cuucgaguac gugucccagc cuuuccugau ggaccuggaa 540
ggcaagcagg ggaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggguau 600
uucaagaucu acuccaagca cacaccuauc aaucugguga gaggccugcc ccagggcuuc 660
agcgcccugg aaccucuggu cgaccugcca aucggcauca acaucacccg guuccaaaca 720
cugcauauca gcuaccugac accuggcgau agcuccuccg gcuggaccgc cggcgcugcc 780
gcuuauuacg ucggcuaccu gcagccuaga acguuccugc ugaaguacaa cgagaacggc 840
accaucaccg acgccgucga cugcgcccug gacccccucu ccgagacaaa augcacccug 900
aagagcuuca cuguugaaaa gggcaucuac cagaccagca acuuuagagu gcagccuaca 960
gagucuaucg ugagauuccc uaacauuacc aaccuguguc cuuuuggaga aguguucaac 1020
gccacaagau ucgcuucugu guaugccugg aaccggaaga gaaucucgaa cugcguggcu 1080
gauuacagcg ugcuguacaa cagcgcuagc uuuagcacau uuaagugcua cggcgugagc 1140
cccaccaagc ugaaugauuu gugcuucaca aauguguacg ccgacucuuu cgugauaaga 1200
ggggacgagg ugcggcagau agcuccaggc cagaccggca acaucgccga uuacaauuac 1260
aagcugccug acgacuuuac cggaugugug aucgccugga acagcaacaa ccuggauagc 1320
aaggugggcg gaaacuacaa cuaccuguac agacuguucc ggaaaucuaa ccuuaagccu 1380
uuugagcggg auaucagcac cgagaucuac caagcuggcu cuacacccug caacggcgug 1440
aagggguuua auuguuacuu cccccugcag agcuacggcu uccaaccgac cuacggagug 1500
ggcuaccagc ccuaccgggu cguggugcug agcuuugagc ugcugcacgc cccugcuaca 1560
gugugcggcc ccaagaaguc uacgaaccug gugaagaaca agugugugaa uuuuaauuuc 1620
aacggacuga ccggcacagg cguccugacc gaaucuaaca agaaauuccu cccuuuccag 1680
caguucggga gagauaucgc cgacaccacc gacgccgugc gggacccuca aacacuggaa 1740
auccuggaua ucaccccuug uucuuucgga ggcguguccg ugaucacccc agguacgaac 1800
acaucuaacc agguggcugu gcuguaccag ggcgugaacu gcaccgaggu gccuguggcc 1860
auucacgccg accagcugac uccuaccugg cggguguaca gcacgggcuc caacguguuu 1920
cagaccagag cuggcugucu gaucggagcc gagcacguga acaacucuua ugagugcgau 1980
auccccaucg gcgcuggaau cugugccucc uaccagacuc aaaccaacag cccuggcagc 2040
gcuagcagcg uggccagcca gagcaucauc gccuacacca ugagccuggg agucgaaaac 2100
agcguggccu acucaaacaa cuccaucgcu aucccuacca acuucaccau cagcguaacg 2160
accgaaaucc ugcccgugag caugaccaag accagcgugg acugcacaau guacaucugc 2220
ggcgauagca cagaaugcag caaucugcua cugcaguacg guagcuuuug cacccaacug 2280
aauagagccc ugaccggcau cgccguggaa caggauaaaa acacccaaga ggucuucgcu 2340
caggugaagc agaucuacaa gacaccuccc aucaaggacu ucggaggauu caacuuuagc 2400
cagauccugc cugauccaag caaaccuagc aagcggaguc cuaucgagga ccugcuguuu 2460
aacaagguga cacuggccga cgccggcuuc aucaagcagu auggcgacug ucugggcgac 2520
aucgccgcca gggaucugau cugugcccaa aaauucaacg gccugacagu gcugccaccu 2580
cugcugaccg acgagaugau cgcucaauac accagcgccc uccucgccgg cacgaucacc 2640
agcggcugga cauucggcgc cggcccugcc cuccagaucc cuuucccuau gcagauggcc 2700
uacagauuca acggcaucgg cgugacacaa aacgugcugu acgaaaacca gaagcugauc 2760
gccaaucagu uuaauagcgc caucgggaag auccaggaua gccugucauc uaccccuucu 2820
gcccugggaa agcugcagga cguggugaac cagaacgccc aggcccugaa cacccuggug 2880
aaacagcugu cuagcaacuu cggcgcuauc agcagcgugc ugaaugauau ccugagcaga 2940
cuggauccuc cugaggccga ggugcagauc gacagauuga ucaccggccg gcugcagagc 3000
cugcaaaccu acguuacaca gcagcugauc agagccgcug aaaucagagc cucugccaac 3060
cuggccgcca ccaaaaugag cgagugcgug cugggacaga gcaaaagggu ggacuucugc 3120
gggaagggcu accaccucau gaguuuuccc cagagcgccc cccacggcgu gguguuccug 3180
cacgugacau augucccggc ccaggagaaa aacuuuacaa cagccccugc cauuugccau 3240
gacggaaagg cccacuuccc ucgggaaggu guguucguga gcaacggcac acacugguuc 3300
gugacccaga gaaacuucua cgagccucaa aucaucacca cagacaacac cuucguuagu 3360
ggaaauugcg acgugguuau cggcaucgug aacaacaccg ucuacgaccc acugcagccu 3420
gaacuggaua gcuucaagga ggaacuggau aaguauuuca agaaccacac cucccccgac 3480
guggaucugg gcgacauuag cggcaucaac gccagcgugg ugaacaucca gaaagagauc 3540
gauagacuua augagguggc caagaaccug aacgagagcc ugaucgaccu gcaggagcuc 3600
ggcaaauacg agcagggcua uaucccagag gccccuagag auggccaggc cuacguuaga 3660
aaggacggcg aguggguccu gcugagcaca uuccugggcu ga 3702
<210> 9
<211> 4093
<212> RNA
<213> Artificial Sequence
<220>
<223> 人工序列
<400> 9
gggagaccgg ccucgagaca uuugcuucug acacaacugu guucacuagc aaccucaaac 60
agacaccaag cuugccacca uguucguguu ccuggugcug cuuccccugg ucucuagcca 120
gugcgugaac uucacgaccc ggacccaacu gccccccgcg uacacaaacu ccuucaccag 180
aggcguguac uacccugaca agguguuccg cagcagcgug cugcacagca cccaggaccu 240
guuccuccca uucuucagca acgugaccug guuccacgcc auccacgugu ccggcaccaa 300
uggaacaaag agauuugcga accccgugcu accuuucaac gacggcgugu acuucgccuc 360
caccgagaag agcaacauca uccggggcug gaucuucggc accacccugg acucuaaaac 420
ccagagccug cugaucguga auaaugccac caacguggug aucaaggugu gcgaguucca 480
guucugcaac gacccuuucc ugggcgucua cuaccacaag aacaacaaga guuggaugga 540
aagcgaguuc agaguguacu cuucugcuaa caacugcacc uucgaguacg ugucccagcc 600
uuuccugaug gaccuggaag gcaagcaggg gaacuucaag aaccugcggg aguucguguu 660
caagaacauc gacggguauu ucaagaucua cuccaagcac acaccuauca aucuggugag 720
aggccugccc cagggcuuca gcgcccugga accucugguc gaccugccaa ucggcaucaa 780
caucacccgg uuccaaacac ugcauaucag cuaccugaca ccuggcgaua gcuccuccgg 840
cuggaccgcc ggcgcugccg cuuauuacgu cggcuaccug cagccuagaa cguuccugcu 900
gaaguacaac gagaacggca ccaucaccga cgccgucgac ugcgcccugg acccccucuc 960
cgagacaaaa ugcacccuga agagcuucac uguugaaaag ggcaucuacc agaccagcaa 1020
cuuuagagug cagccuacag agucuaucgu gagauucccu aacauuacca accugugucc 1080
uuuuggagaa guguucaacg ccacaagauu cgcuucugug uaugccugga accggaagag 1140
aaucucgaac ugcguggcug auuacagcgu gcuguacaac agcgcuagcu uuagcacauu 1200
uaagugcuac ggcgugagcc ccaccaagcu gaaugauuug ugcuucacaa auguguacgc 1260
cgacucuuuc gugauaagag gggacgaggu gcggcagaua gcuccaggcc agaccggcaa 1320
caucgccgau uacaauuaca agcugccuga cgacuuuacc ggauguguga ucgccuggaa 1380
cagcaacaac cuggauagca aggugggcgg aaacuacaac uaccuguaca gacuguuccg 1440
gaaaucuaac cuuaagccuu uugagcggga uaucagcacc gagaucuacc aagcuggcuc 1500
uacacccugc aacggcguga agggguuuaa uuguuacuuc ccccugcaga gcuacggcuu 1560
ccaaccgacc uacggagugg gcuaccagcc cuaccggguc guggugcuga gcuuugagcu 1620
gcugcacgcc ccugcuacag ugugcggccc caagaagucu acgaaccugg ugaagaacaa 1680
gugugugaau uuuaauuuca acggacugac cggcacaggc guccugaccg aaucuaacaa 1740
gaaauuccuc ccuuuccagc aguucgggag agauaucgcc gacaccaccg acgccgugcg 1800
ggacccucaa acacuggaaa uccuggauau caccccuugu ucuuucggag gcguguccgu 1860
gaucacccca gguacgaaca caucuaacca gguggcugug cuguaccagg gcgugaacug 1920
caccgaggug ccuguggcca uucacgccga ccagcugacu ccuaccuggc ggguguacag 1980
cacgggcucc aacguguuuc agaccagagc uggcugucug aucggagccg agcacgugaa 2040
caacucuuau gagugcgaua uccccaucgg cgcuggaauc ugugccuccu accagacuca 2100
aaccaacagc ccuggcagcg cuagcagcgu ggccagccag agcaucaucg ccuacaccau 2160
gagccuggga gucgaaaaca gcguggccua cucaaacaac uccaucgcua ucccuaccaa 2220
cuucaccauc agcguaacga ccgaaauccu gcccgugagc augaccaaga ccagcgugga 2280
cugcacaaug uacaucugcg gcgauagcac agaaugcagc aaucugcuac ugcaguacgg 2340
uagcuuuugc acccaacuga auagagcccu gaccggcauc gccguggaac aggauaaaaa 2400
cacccaagag gucuucgcuc aggugaagca gaucuacaag acaccuccca ucaaggacuu 2460
cggaggauuc aacuuuagcc agauccugcc ugauccaagc aaaccuagca agcggagucc 2520
uaucgaggac cugcuguuua acaaggugac acuggccgac gccggcuuca ucaagcagua 2580
uggcgacugu cugggcgaca ucgccgccag ggaucugauc ugugcccaaa aauucaacgg 2640
ccugacagug cugccaccuc ugcugaccga cgagaugauc gcucaauaca ccagcgcccu 2700
ccucgccggc acgaucacca gcggcuggac auucggcgcc ggcccugccc uccagauccc 2760
uuucccuaug cagauggccu acagauucaa cggcaucggc gugacacaaa acgugcugua 2820
cgaaaaccag aagcugaucg ccaaucaguu uaauagcgcc aucgggaaga uccaggauag 2880
ccugucaucu accccuucug cccugggaaa gcugcaggac guggugaacc agaacgccca 2940
ggcccugaac acccugguga aacagcuguc uagcaacuuc ggcgcuauca gcagcgugcu 3000
gaaugauauc cugagcagac uggauccucc ugaggccgag gugcagaucg acagauugau 3060
caccggccgg cugcagagcc ugcaaaccua cguuacacag cagcugauca gagccgcuga 3120
aaucagagcc ucugccaacc uggccgccac caaaaugagc gagugcgugc ugggacagag 3180
caaaagggug gacuucugcg ggaagggcua ccaccucaug aguuuucccc agagcgcccc 3240
ccacggcgug guguuccugc acgugacaua ugucccggcc caggagaaaa acuuuacaac 3300
agccccugcc auuugccaug acggaaaggc ccacuucccu cgggaaggug uguucgugag 3360
caacggcaca cacugguucg ugacccagag aaacuucuac gagccucaaa ucaucaccac 3420
agacaacacc uucguuagug gaaauugcga cgugguuauc ggcaucguga acaacaccgu 3480
cuacgaccca cugcagccug aacuggauag cuucaaggag gaacuggaua aguauuucaa 3540
gaaccacacc ucccccgacg uggaucuggg cgacauuagc ggcaucaacg ccagcguggu 3600
gaacauccag aaagagaucg auagacuuaa ugagguggcc aagaaccuga acgagagccu 3660
gaucgaccug caggagcucg gcaaauacga gcagggcuau aucccagagg ccccuagaga 3720
uggccaggcc uacguuagaa aggacggcga guggguccug cugagcacau uccugggcug 3780
agaauucgcu ggagccucgg uagccguucc uccugcccgc ugggccuccc aacgggcccu 3840
ccuccccucc uugcaccggc ccuuccuggu cuuuggcugg agccucggua gccguuccuc 3900
cugcccgcug ggccucccaa cgggcccucc uccccuccuu gcaccggccc uuccuggucu 3960
uuguuaauua aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4020
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4080
aaaaaaaaac uag 4093

Claims (13)

1.一种2019-nCoV的S蛋白突变体,其特征在于,其至少包含胞外域,其胞外域相对于亲本S蛋白的胞外域包含如下位置的氨基酸突变:F817P、A892P、A899P、A942P和KV986_987PP,以及L18F,D80A,D215G,L242_244L del,R246I,K417N,E484K,N501Y,D614G,A701V,所述氨基酸位置以SEQ ID NO:1所示氨基酸序列来定位描述。
2.如权利要求1所述的2019-nCoV的S蛋白突变体,其特征在于,进一步包含相对于SEQID NO:1所示氨基酸序列的682-685位氨基酸RRAR的突变,以失去被弗林样蛋白酶切割的能力;优选,将RRAR突变为GSAS;
优选,所述2019-nCoV的S蛋白突变体不包含S蛋白的跨膜域和/或胞质尾;
优选,所述2019-nCoV的S蛋白突变体在胞外域的C端直接融合辅助形成三聚体的结构域;优选,所述辅助形成三聚体的结构域是T4 Fibritin Foldon Trimerization Motif。
3.如权利要求1或2所述的2019-nCoV的S蛋白突变体,其特征在于,其包含如SEQ IDNO:2所示的氨基酸序列;
优选,所述2019-nCoV的S蛋白突变体,其氨基酸序列包含从N端向C端直接连接的SEQID NO:2的氨基酸序列和SEQ ID NO:3的氨基酸序列。
4.一种DNA分子,其特征在于,所述DNA分子编码权利要求1-3任一项所述的2019-nCoV的S蛋白突变体;
优选,所述DNA分子的核苷酸序列包括从5’端向3’端直接连接的与SEQ ID NO:4核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列,和与SEQ ID NO:5核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或100%约同源性的核苷酸序列。
5.一种表达载体,其特征在于,包含权利要求4所述的DNA分子。
6.一种细胞,其特征在在于,包含权利要求4所述的DNA分子或权利要求5所述的表达载体。
7.一种mRNA分子,其特征在于,包含编码权利要求1-3任一项所述2019-nCoV的S蛋白突变体的开放阅读框;
优选,所述开放阅读框的核苷酸序列是与SEQ ID NO:8所示核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。
8.如权利要求7所述的mRNA分子,其特征在于,所述mRNA从5’端至3’端包含5’UTR,编码2019-nCoV的S蛋白突变体的开放阅读框,3’UTR和poly-A尾;
优选,所述5’UTR包含β-珠蛋白或α-珠蛋白的5’UTR或其同源物或片段;优选,所述5’UTR包含与SEQ ID NO:6所示的β-珠蛋白的5’UTR核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列;
优选,所述3’UTR包含β-珠蛋白或α-珠蛋白的3’UTR或其同源物或片段或片段的组合;优选,所述3’UTR包含1个与SEQ ID NO:7所示α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列;或者,2个及以上首尾相连的、与SEQ ID NO:7所示的α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列;
优选,所述poly-A尾的长度为50-200个核苷酸,优选为100-150个核苷酸;
优选,所述mRNA进一步含有Kozak序列,优选所述Kozak序列为GCCACC;
优选,所述mRNA进一步包含5’帽,优选,所述5’帽为CAP1。
9.如权利要求7或8所述的mRNA分子,其特征在于,其包含与SEQ ID NO:9所示的核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。
10.一种核酸分子,其特征在于,其编码权利要求7-9任一项所述的mRNA分子。
11.一种体外转录载体,其特征在于,其包含可操作性连接的编码5’UTR,3’UTR和poly-A尾的核苷酸序列;所述5’UTR包含与SEQ ID NO:6所示的β-珠蛋白的5’UTR核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列;所述3’UTR包含2个首尾相连的、与SEQID NO:7所示的α2-珠蛋白3’UTR的片段至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列;所述poly-A尾的长度为50-200个核苷酸;
优选,所述体外转录载体,进一步包含编码2019-nCoV的S蛋白突变体的ORF的核苷酸序列,所述2019-nCoV的S蛋白突变体的ORF的核苷酸序列是与SEQ ID NO:8所示核苷酸序列至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或约100%同源性的核苷酸序列。
12.一种疫苗组合物,其特征在于,包含权利要求1-3任一项所述的2019-nCoV的S蛋白突变体,或权利要求7-9任一项所述的mRNA分子;优选,所述疫苗组合物还含有药学上可接受的赋形剂,和/或免疫佐剂;优选,所述疫苗或疫苗组合物用于预防和/或治疗2019-nCoV感染或与2019-nCoV感染相关的疾病或病症;优选,所述2019-nCoV感染相关的疾病或病症选自2019-nCoV感染所致肺炎,2019-nCoV感染所致头疼、鼻塞、流涕、咳嗽或/和气管炎,2019-nCoV感染所致弥漫性血管内凝血,2019-nCoV感染所致的脓毒血症。
13.如权利要求12所述的疫苗组合物,其还含有脂质纳米颗粒,mRNA位于脂质纳米颗粒中,脂质纳米颗粒含有占其总体脂质分子30-60mol%的式C的可电离阳离子脂质分子,5-30mol%的中性脂质分子,30-50mol%的胆固醇类脂质分子,0.4-10mol%的PEG化的脂质分子;优选含有32-55mol%的式C的可电离阳离子脂质分子,8-20mol%中性脂质分子,35-50mol%的胆固醇类脂质分子,0.5-5mol%的PEG化的脂质分子;更优选含有34-46mol%的式C的可电离阳离子脂质分子,9-16mol%中性脂质分子,37-49mol%的胆固醇类脂质分子,1.3-2.7mol%的PEG化的脂质分子;
式C
Figure FDA0003675470420000031
其中每个n3都彼此独立,可以相同或不同,每个n3选自1~8的整数,每个m3都彼此独立,可以相同或不同,每个m3选自0~8的整数;优选,每个n3选自4~8的整数,每个m3选自4~8的整数;优选,每个n3都彼此相同,每个m3都彼此相同;优选式C为
Figure FDA0003675470420000032
中性脂质分子选自式E所示的磷脂酰胆碱类化合物
Figure FDA0003675470420000033
E,式F所示的磷脂酰乙醇胺类化合物
Figure FDA0003675470420000041
F,其中Ra、Rb、Rc、Rd独立的选自直链或支链的C10-30烷基,直链或支链的C10-30烯基,优选为CH3(CH2)17CH2-、CH3(CH2)15CH2-、CH3(CH2)13CH2-、CH3(CH2)11CH2-、CH3(CH2)9CH2-、CH3(CH2)7CH2-、CH3(CH2)7-CH=CH-(CH2)7-、CH3(CH2)4CH=CHCH2CH=CH(CH2)7-、CH3(CH2)7-CH=CH-(CH2)9-;
胆固醇类脂质分子选自胆固醇、5-十七基间苯二酚和胆固醇半琥珀酸酯;
PEG化的脂质分子包含脂质部分和基于PEG的聚合物部分,表示为“脂质部分-PEG-数均分子量”,所述脂质部分是二酰基甘油或二酰基甘油酰胺,选自二月桂酰甘油、二肉豆蔻酰甘油、二棕榈酰甘油、二硬脂酰甘油、二月桂基甘油酰胺、二肉豆蔻基甘油酰胺、二棕榈酰甘油酰胺、二硬脂酰甘油酰胺、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺;PEG的数均分子量为130~50,000,优选150~30,000,进一步优选150~10,000,更优选300~3,000,特别优选1,500~2,500;
优选,脂质分子总质量和mRNA的质量比为5-20:1。
CN202210623377.7A 2021-10-09 2022-06-01 2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物 Pending CN115960180A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021111762583 2021-10-09
CN202111176258 2021-10-09

Publications (1)

Publication Number Publication Date
CN115960180A true CN115960180A (zh) 2023-04-14

Family

ID=87351625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210623377.7A Pending CN115960180A (zh) 2021-10-09 2022-06-01 2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物

Country Status (1)

Country Link
CN (1) CN115960180A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116370437A (zh) * 2023-05-26 2023-07-04 北京因诺惟康医药科技有限公司 包含胆固醇琥珀酸单酯的核酸脂质纳米颗粒组合物及其用途

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116370437A (zh) * 2023-05-26 2023-07-04 北京因诺惟康医药科技有限公司 包含胆固醇琥珀酸单酯的核酸脂质纳米颗粒组合物及其用途

Similar Documents

Publication Publication Date Title
CN112480217B (zh) 基于SARS-CoV-2的S抗原蛋白的疫苗和组合物
US20210101940A1 (en) Stabilized Soluble Pre-Fusion RSV F Polypeptides
CN111560074B (zh) 一种基于幽门螺旋杆菌铁蛋白的新型冠状病毒s蛋白单区域亚单位纳米疫苗
CN111217918A (zh) 一种基于2,4-二氧四氢喋啶合酶的新型冠状病毒s蛋白双区域亚单位纳米疫苗
BE1023087A1 (fr) Antigenes du cytomegalovirus et leurs utilisations
US8372963B2 (en) RSV F-protein and its use
CN113943375B (zh) 一类来源于新型冠状病毒s2蛋白hr区域的重组融合蛋白及其应用
CN113151184A (zh) 基于细胞膜展示冠状病毒免疫原以诱导中和抗体的方法
CN113736801A (zh) mRNA及包含其的新冠病毒mRNA疫苗
CA3207878A1 (en) Coronavirus spike protein designs, compositions and methods for their use
CN115960180A (zh) 2019-nCoV S蛋白的突变体及其基因工程化的mRNA和疫苗组合物
US20230174588A1 (en) A vaccine against sars-cov-2 and preparation thereof
EP4114986A2 (en) Expression of sars-cov proteins, nucleic acid constructs, virus like proteins (vlps) and methods relevant thereto
WO2023098679A1 (zh) 预防突变株的新型冠状病毒mRNA疫苗
WO2023056872A1 (zh) 一种脂质纳米颗粒组合物以及由其制备的药物递送系统
WO2023064993A1 (en) Chimeric betacoronavirus spike polypeptides
KR20230008707A (ko) 코로나바이러스 치료용 백신 조성물
CN113801206A (zh) 利用受体识别域诱导抗新冠病毒中和抗体的方法
CN117229371A (zh) 新型冠状病毒变异毒株的S蛋白突变体及其基因工程化mRNA和疫苗组合物
KR20210005090A (ko) 키메라 벡터
EP2230246A1 (en) Arterivirus glycoprotein 5 virus-like particles
US11111275B2 (en) Compositions and methods for making and using virus-like particles (VLPs)
US20240000920A1 (en) Recombinant vectors encoding chimeric coronavirus spike proteins and use thereof
JP2023520038A (ja) ウイルス様粒子を作製するためのベクターおよびその使用
CN116685347A (zh) 编码嵌合冠状病毒刺突蛋白的重组载体及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination