CN113874507A

CN113874507A - 冠状病毒的核酸疫苗

Info

Publication number: CN113874507A
Application number: CN202180001814.5A
Authority: CN
Inventors: 英博
Original assignee: Suzhou Aibo Biotechnology Co ltd
Current assignee: Suzhou Aibo Biotechnology Co ltd
Priority date: 2020-04-09
Filing date: 2021-04-08
Publication date: 2021-12-31
Also published as: US11510977B2; US20220218816A1; WO2021204179A1; US20230277652A1; EP4132576A1; US20240042010A1; TW202204622A

Abstract

本文提供了用于控制、预防和/或治疗由冠状病毒引起的传染病的治疗性核酸分子。本文还提供了治疗组合物，包括疫苗和脂质纳米颗粒，其包含治疗核酸以及相关的治疗方法和用途。

Description

冠状病毒的核酸疫苗

1.相关申请的交叉引用

本申请要求2020年4月9日提交的中国专利申请号202010276288.0、2020年4月16日提交的美国临时申请号63/011,116、2021年3月19日提交的中国专利申请号202110293284.8的优先权，上述每个文件全文通过引用整体并入。

2.技术领域

本发明总体上涉及可用于控制、预防和治疗冠状病毒感染的核酸分子。本发明还涉及所述核酸分子的脂质组合物，包括疫苗，以及相关的递送方法。

3.背景

冠状病毒对人类和其他动物构成了严重的健康威胁。2002年到2003年，严重的急性呼吸系统综合症冠状病毒(SARS-CoV)感染了8,000人，死亡率约为9％。自2012年以来，中东呼吸综合征冠状病毒(MERS-CoV)感染了1,700多人，致死率约为36％。自2013年以来，猪流行性腹泻冠状病毒(PEDV)席卷了整个美国，导致仔猪的死亡率几乎达到100％，并在不到一年的时间里消灭了超过10％的美国猪群。该疾病是由新发现的新型冠状病毒SARS-CoV-2引起的，患病的人类和其他动物显示广泛的呼吸道、胃肠道和中枢神经系统疾病的症状，威胁到人类健康并造成经济损失。因此，亟需用于抑制冠状病毒感染的有效疗法，包括疫苗等。本发明满足了所述需求。

4.发明概述

一方面，本发明提供了可用于预防、控制和治疗传染病的非天然存在的核酸分子。在一些实施方案中，非天然存在的核酸分子编码衍生自冠状病毒SARS-CoV-2的病毒肽或蛋白质。在一些实施方案中，可编码衍生自包含基因组的冠状病毒的病毒肽或蛋白质的非天然存在的核酸分子包括基因组，所述基因组包含如SEQ ID NO：1所示的核酸序列。

在一些实施方案中，非天然存在的核酸分子包含编码区，其中所述编码区包含一个或多个开放阅读框(ORF)，且其中至少一个ORF编码病毒肽或蛋白质。在一些实施方案中，至少一种ORF编码异源肽或多肽。在一些实施方案中，异源肽或多肽是免疫刺激肽或蛋白质。在一些实施方案中，ORF编码融合蛋白，所述融合蛋白包含异源肽或多肽与病毒肽或蛋白的融合。在一些实施方案中，异源肽或多肽选自人免疫球蛋白的Fc区、信号肽和促进融合蛋白多聚化的肽。

在一些实施方案中，一个或多个ORF包括表1至表4所列的编码序列。在一些实施方案中，一个或多个ORF由选自包含SEQ ID NO：3、5、7、9、11、13、15、17、19、27、29、31、33、35、37、39、41、43和45的编码序列，或其转录的RNA序列。在一些实施方案中，一个或多个ORF编码选自SEQ ID NO：2、4、6、8、10、12、14、16 18、20-26、28、30、32、34、36、38、40、42和44的肽或蛋白质。

在一些实施方案中，非天然存在的核酸分子还包含5′非翻译区(5′-UTR)，其中5′-UTR包含SEQ ID NOS：46-51所示的序列。在一些实施方案中，非天然存在的核酸分子还包含3′非翻译区(3′-UTR)，其中3′-UTR包含SEQ ID NO：52-57所示的序列。在一些实施方案中，3′-UTR进一步包含聚A尾(poly-A tail)或聚腺苷酸化信号。

在一些实施方案中，非天然存在的核酸分子还包含一种或多种选自假尿苷、1-甲基-假尿苷和5-甲基胞嘧啶的功能性核苷酸类似物。在一些实施方案中，非天然存在的核酸分子进一步包含的核酸是DNA或mRNA。

在一些实施方案中，本发明公开了包含本文所述天然存在的核酸分子的载体或细胞。在一些实施方案中，本发明公开了包含本文所述天然存在的核酸分子的组合物。在一些实施方案中，组合物是通过将核酸包封在脂质壳形成脂质纳米颗粒来配制。在一些实施方案中，该组合物是药物组合物。

一方面，本文提供了包含至少一种编码新型冠状病毒SARS-CoV-2的肽或蛋白质的核酸的药物组合物。在一些实施方案中，本文提供了药物组合物，其包含至少一种编码源自冠状病毒的病毒肽或蛋白质的核酸，所述核酸包含基因组，其中所述基因组包含SEQ IDNO：1所示的核酸序列。

本文描述的药物组合物的一些实施方案中，病毒肽或蛋白质选自：(a),冠状病毒的刺突(S)蛋白；(b),冠状病毒的基质(M)蛋白；(c),冠状病毒核衣壳(N)蛋白；(d),冠状病毒的包膜蛋白(E)；(e),血凝素酯酶(HE)蛋白；(f),(a)至(e)中任一项的免疫原性片段；(g),(a)至(f)中任一项的功能衍生物。

在一些实施方案中，病毒肽或蛋白质是S蛋白、S蛋白的免疫原性片段，S蛋白的功能性衍生物或其免疫原性片段。在一些实施方案中，S蛋白的免疫原性片段选自胞外域(ECD)、S1亚基、受体结合域(RBD)和受体结合基序(RBM)。

本文描述的药物组合物的一些实施方案中，病毒肽或蛋白质是RBD的功能衍生物。在一些实施方案中，RBD的功能衍生物包括能够增加RBD对宿主细胞受体的结合亲和力的一个或多个氨基酸取代的情况。在一些实施方案中，受体是ACE2。在一些实施方案中，氨基酸取代包含N501T。

本文描述的药物组合物的一些实施方案中，病毒肽或蛋白质包含SEQ ID NO：2、4、6、8、10、12、14、16、18、20-26、32，34、40、42和44所示的氨基酸序列。在一些实施方案中，核酸包含SEQ ID NO：3、5、7、9、11、13、15、17、19、27、29、31、33、35、37、39、41、43、45、46、48、50、52、54、56所示的序列，或其转录的RNA序列。

本文描述的药物组合物的一些实施方案中，RBD的功能性衍生物包含与人免疫球蛋白Fc区融合的RBD。在一些实施方案中，免疫球蛋白是IgG1。

本文描述的药物组合物的一些实施方案中，RBD的功能性衍生物包含与肽融合的RBD，所述肽促进融合蛋白的多聚化。在一些实施方案中，S-RBD的功能衍生物形成三聚体复合物形式。

本文描述的药物组合物的一些实施方案中，病毒肽或蛋白质是N蛋白。在一些实施方案中，N蛋白包含SEQ ID NO：18所示的氨基酸序列。在一些实施方案中，核酸包含SEQ IDNO：19所示的序列或从其转录的RNA序列。

在本文描述的药物组合物的一些实施方案中，核酸进一步包含5'非翻译区和/或3'非翻译区。在一些实施方案中，5′非翻译区包含选自SEQ ID NOS：46-51的序列。在一些实施方案中，3′非翻译区包含聚-A(poly-A)尾或聚腺苷酸化信号。在一些实施方案中，3′非翻译区包含选自SEQ ID NO：52-57的序列。

本文描述的药物组合物的一些实施方案中，核酸包含一种或多种选自假尿苷、1-甲基-假尿苷和5-甲基胞嘧啶的功能核苷酸类似物。

本文所述的药物组合物的一些实施方案中，所述组合物还包含至少一种脂质。在一些实施方案中，脂质是根据式(I)至(IV)的化合物。在一些实施方案中，脂质是根据式(I-A)、(I-B)、(IB’)、(I-B”)、(I-C)、(I-D)、(I-E)、(I-F)、(I-F’)、(I-F”)、(I-G)、(I-H)、(I-I)、(I-J)、(I-J’)、(I-J”)、(I-K)、(I-L)、(I-M)、(I-N)、(I-N’)、(I-N”)、(I-O)、(I-P)、(I-Q)、(I-R)、(I-R’)、(I-R”)、(I-S)、(I-T)、(I-U)，(II-A)、(II-B)、(II-B’)、(II-B”)、(II-C)、(II-D)、(II-E)、(II-F)、(II-F’)、(II-F”)、(II-G)、(II-H)、(II-I)、(II-J)、(II-J’)、(II-J”)、(II-K)、(II-L)、(II-M)、(II-N)、(II-N’)、(II-N”)、(II-O)、(II-P)、(II-Q)、(II-R)、(II–R’)、(II–R”)、(II-S)、(II-T)、(II-U)，(III-A)、(III-B)、(III-B’)、(III-B”)、(III-C)、(III-D)、(III-E)、(III-F)、(III-F’)、(III-F”)、(III-G)、(III-H)、(III-I)、(III-J)、(III-J’)、(III-J”)、(III-K)、(III-L)、(III-M)、(III-N)、(III-N’)、(III-N”)、(III-O)、(III-P)、(III-Q)、(III-R)、(III-R’)、(III-R”)、(III-S)、(III-T)、(III-U),(IV-A)、(IV-B)、(IV-B’),(IV-B”),(IV-C)、(IV-D)、(IV-E)、(IV-F)、(IV-F’)、(IV-F”)、(IV-G)、(IV-H)、(IV-I)、(IV-J)、(IV-J’)、(IV-J”)、(IV-K)、(IV-L)、(IV-M)、(IV-N)、(IV-N’)、(IV-N”)、(IV-O)、(IV-P)、(IV-Q)、(IV-R)、(IV-R’)、(IV-R”)、(IV-S)、(IV-T)或(IV-U)的化合物。在一些实施方案中，脂质是表1中列出的化合物。在一些实施方案中，组合物是通过将核酸包裹在脂质壳中配制成的脂质纳米颗粒形式。在一些实施方案中，该组合物是疫苗。

一方面，本文提供了用于在施用对象中控制、预防或治疗由冠状病毒引起的感染性疾病的方法，其包括向施用对象施用治疗有效量的本文所述的非天然存在的核酸、或治疗有效量的本文所述的非天然核酸或本文所述的药物组合物。

本文描述的方法的一些实施方案中，施用对象是人类或非人类哺乳动物。在一些实施方案中，所述施用对象是成人、人类儿童或人类幼儿。在一些实施方案中，所述施用对象患有传染病。在一些实施方案中，所述施用对象处于冠状病毒感染的风险中或对其有易感性。在一些实施方案中，施用对象是老年人。在一些实施方案中，施用对象已经被诊断冠状病毒感染阳性。在一些实施方案中，该施用对象是无症状的。

本文描述的方法的一些实施方案中，该方法包括向施用对象施用封装核酸的脂质纳米颗粒，并且其中脂质纳米颗粒被施用对象的细胞内吞。在一些实施方案中，核酸由施用对象的细胞表达。

本文所述方法的一些实施方案中，在施用对象中引起针对冠状病毒的免疫应答反应。在一些实施方案中，免疫应答反应包括产生与核酸编码的病毒肽或蛋白质特异性结合的抗体。在一些实施方案中，抗体是针对冠状病毒或被冠状病毒感染的细胞的中和抗体。在一些实施方案中，在施用对象中抗体的血清滴度增加。

在一些实施方案中，抗体特异性结合S蛋白的一个或多个表位。本文描述的方法的一些实施方案中，S蛋白的一种或多种功能或活性被减弱。在一些实施方案中，通过以下方式测量S蛋白功能或活性的减弱：(a)S蛋白与宿主细胞受体的结合降低；(b)冠状病毒对宿主细胞的附着减少；(c)由冠状病毒引起的宿主细胞膜融合减少；(d)施用对象中被冠状病毒感染的细胞数量减少。在一些实施方案中，宿主受体选自血管紧张素转化酶2(ACE2)、氨基肽酶N(APN)、二肽基肽酶4(DPP4)、癌胚抗原相关细胞粘附分子1(CEACAM1)和糖。在一些实施方案中，S蛋白功能或活性降低10％、20％，30％、40％、50％、60％、70％、80％、90％、95％或100％。

在本文描述的方法的一些实施方案中，抗体特异性结合N蛋白的一个或多个表位。在一些实施方案中，N蛋白的一种或多种功能或活性被减弱。在一些实施方案中，通过以下方式来测量N蛋白功能或活性的减弱：(a)N蛋白与冠状病毒的复制基因组序列的结合降低(b)冠状病毒的复制基因组序列整合到功能性病毒衣壳中的减少；(c)施用对象中复制的病毒颗粒的数量的减少。在一些实施方案中，N蛋白功能或活性降低了10％、20％、30％、40％、50％、60％、70％、80％、90％、95％或100％。

在本文描述的方法的一些实施方案中，抗体结合到病毒颗粒或被感染的细胞，并标记被感染细胞，以被施用对象的免疫系统破坏。在一些实施方案中，诱导或增强抗体结合的病毒颗粒的内吞作用。在一些实施方案中，诱导或增强针对施用对象中针对感染细胞的抗体依赖的细胞介导的细胞毒性(ADCC)。在一些实施方案中，诱导或增强针对受试者中被感染细胞的抗体依赖的细胞吞噬作用(ADCP)。在一些实施方案中，诱导或增强针对受试者中感染细胞的补体依赖的细胞毒性(CDC)。

在本文描述的方法的一些实施方案中，感染性疾病是呼吸道感染、肺部感染、肾感染、肝感染、肠感染、神经系统感染、呼吸综合征、支气管炎、肺炎、肠胃炎、脑脊髓炎、脑炎、结节病、腹泻、肝炎和脱髓鞘疾病。在一些实施方案中，感染性疾病是呼吸道感染。在一些实施方案中，感染性疾病是肺部感染。在一些实施方案中，感染性疾病是呼吸综合症。在一些实施方案中，感染性疾病是肺炎。

5.附图说明

图1示本发明的体外转录的mRNA构建体的示例性HPLC分析和纯化。主峰(b)代表体外转录的mRNA分子，次峰(a)代表杂质。

图2示用本发明的mRNA构建体转染的Hela细胞的共聚焦荧光显微镜图像。RBD-FITC通道显示使用3种不同单克隆抗体(H014，mh001和mh219)分别识别SARS-CoV-2S蛋白RBD的细胞染色；DAPI通道显示用蓝色荧光DNA染色剂DAPI(4’,6-diamidino-2-phenylindole)的细胞染色；明亮通道显示细胞的明场图像。未转染的Hela细胞(Mock)作为阴性对照。比例尺为50mm。

图3示用编码SARS-CoV-2S蛋白抗原的mRNA构建体转染的Hela细胞的培养上清液的蛋白质印迹分析。特别地，分析包括编码SARS-CoV-2S蛋白RBD的三种不同抗原片段(RBD样品-1，RBD样品2和rRBD-His)的不同mRNA构建体。同时，也包括无关的mRNA对照。印迹中显示了编码的RBD片段的单体和二聚体。

图4示通过ELISA测定细胞培养上清液中mRNA编码的SARS-CoV-2S蛋白抗原浓度(ng/mL)的定量示例。

图5示用含有编码SARS-CoV-2抗原的mRNA的脂质纳米颗粒(LNP)接种的小鼠收集血清中的中和抗体滴度。特别地，中和抗体滴度通过PRNT50值量度。

图6示五组分别接受1ug–5ug给药剂量的实验检测鼠血清中RBD表达水平。

图7示被免疫小鼠在第14，21和29天用ELISA检测RBD特异性的IgG抗体滴度的检测结果.

6.发明详述

本发明提供了可用于预防、管理和治疗冠状病毒引起的传染病或病症的治疗性核酸分子。本发明还提供了包含治疗性核酸分子的药物组合物，包括配制为脂质纳米颗粒的药物组合物，以及相关的治疗方法和用途，以用于预防、管理和治疗冠状病毒(包括流行性传染病的COVID-19)引起的感染性疾病或状况。基于以下的详细描述和具体实施例，本发明的附加特征对于本领域技术人员将变得显而易见。

6.1通用技术

本文描述或引用的技术和方法包括本领域技术人员通常使用的常规方法和很好理解或通常采用的那些，例如Sambrook et al.,Molecular Cloning:A LaboratoryManual(3d ed.2001)；Current Protocols in Molecular Biology(Ausubel et al.eds.,2003)中所述的。

6.2术语解释

除非另有描述，否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常所理解的相同的含义。出于解释本说明书的目的，将使用以下术语描述，并且在适当的情形下以单数形式使用的术语还将包括复数，反之亦然。所有专利、申请、公开的申请和其他出版物均通过引用的方式将全文纳入本文。在术语的任何描述与通过引用并入本文的任何文件相冲突的情况下，以以下述术语的描述为准。

除非本文另有说明，术语“脂质”是指一组有机化合物，其包括，但不限于，脂肪酸的酯，并且以通常在水中有较差的溶解性、但可溶于许多非极性有机物中为特征。尽管脂质通常在水中具有较差的溶解度，但是某些类别的脂质(例如，被极性基团修饰的脂质如DMG-PEG2000)具有有限的水溶性，并且在某些条件下可以溶解于水中。脂质的已知类型包括生物分子，例如脂肪酸、蜡、固醇、脂溶性维生素、甘油单酸酯、甘油二酸酯、甘油三酸酯和磷脂。脂质通常至少可分为三类：(1)“简单脂质”，包括脂肪和油以及蜡；(2)“化合物脂质”，包括磷脂和糖脂(如DMPE-PEG2000)；(3)“衍生脂质”，如类固醇等。此外，如本文所用，脂质也包括类脂质化合物。术语“类脂质化合物”，也简称为“类脂质”，是指具有类脂质物理性质的两亲性化合物等类脂质化合物。

术语“脂质纳米颗粒”或“LNP”是指具有纳米量级(nm)(例如1nm至1,000nm)的颗粒，其包含一种或多种类型的脂质分子。本文提供的LNP可以进一步包含至少一种非脂质有效载荷分子(例如，一种或多种核酸分子)。在一些实施方案中，LNP包含部分或完全包封在脂质壳内部的非脂质有效载荷分子。特别地，在一些实施方案中，其中有效载荷是带负电荷的分子(例如，编码病毒蛋白的mRNA)，并且LNP的脂质组分包含至少一种阳离子脂质。可以预期的是，阳离子脂质可以与带负电荷的有效负载分子相互作用，并在LNP形成过程中促进有效负载掺入和/或封装到LNP中。如本文提供的，可以形成LNP的一部分的其他脂质包括但不限于中性脂质和带电荷的脂质，例如类固醇、聚合物缀合的脂质和各种两性离子脂质。在某些实施方案中，根据本发明的LNP包含一种或多种本文所述的式(I)至式(IV)的脂质及其子式。

术语“阳离子脂质”是指在其所处环境的任何pH值或氢离子活性下带正电荷的脂质，或能够响应其所处环境(例如其预期使用环境)的pH值或氢离子活性而带正电荷的脂质。因此，术语“阳离子”涵盖“永久阳离子”和“可阳离子化的”的范围。在某些实施方案中，阳离子脂质中的正电荷源自季氮原子的存在。在某些实施方案中，阳离子脂质包括两性离子脂质，该两性离子脂质在其预期施用的环境中(例如，在生理pH下)带正电荷。在某些实施方案中，阳离子脂质是本文所述的一种或多种式(I)至式(IV)及其子式的脂质。

术语“聚合物缀合脂质”或“聚合物共轭脂质”是指既包含脂质部分又包含聚合物部分的分子。聚合物缀合脂质的实例是聚乙二醇化脂质(PEG-脂质)，其中聚合物部分包含聚乙二醇。

术语“中性脂质”涵盖在选定的pH下以不带电荷形式或中性两性离子形式存在的任何脂质分子。在一些实施方案中，选定的有用的pH值或范围对应于脂质的预期使用的环境的pH条件，例如生理pH。作为非限制性实例，可以与本文公开结合使用的中性脂质包括但不限于磷脂酰胆碱，例如1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DSPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸胆碱(DMPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1 1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)，磷脂酰乙醇胺如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)，2-(((2,3-双(油酰氧基)丙基))磷酸二甲基铵)乙基氢(DOCP)，鞘磷脂(SM)，神经酰胺，类固醇如甾醇及其衍生物。中性脂质可以是合成的或衍生(分离或修饰)自天然来源或化合物。

术语“带电脂质”涵盖在选定pH值或范围内以带正电或带负电形式存在的任何脂质分子。在一些实施方案中，选定的pH值或范围对应于脂质的预期使用环境的pH条件，例如生理pH。作为非限制性实例，可以与本文公开结合使用的中性脂质包括但不限于磷脂酰丝氨酸、磷脂酸、磷脂酰甘油、磷脂酰肌醇、固醇半琥珀酸酯、二烷基三甲基铵-丙烷(例如DOTAP、DOTMA)、二烷基二甲基氨基丙烷、乙基磷胆碱、二甲基氨基乙烷氨基甲酰基甾醇(例如DC-Chol)、1,2-二油酰基-sn-甘油-3-磷酸-L-丝氨酸钠盐(DOPS-Na)、1,2-二油酰基-sn-甘油-3-磷酸-(1'-rac-甘油)钠盐(DOPG-Na)和1,2-二油酰基-sn-甘油-3-磷酸钠盐(DOPA-Na)。本文提供的带电脂质可以是合成的或衍生(分离或修饰)自天然来源或化合物。

如本文所述的，除非另有说明，术语“烷基”是指仅由饱和的碳和氢原子组成的直链或支链烃链基团。在一个实施方案中，烷基具有例如1至24个碳原子(C₁-C₂₄烷基)、4至20个碳原子(C₄-C₂₀烷基)、6至16个碳原子(C₆-C₁₆烷基)、六至九个碳原子(C₆-C₉烷基)、一至十五个碳原子(C₁-C₁₅烷基)、1至12个碳原子(C₁-C₁₂烷基)、1至8个碳原子(C₁-C₈烷基)或1至6个碳原子(C₁-C₆烷基)，并通过单键与分子的其余部分相连。烷基的实例包括但不限于甲基、乙基、丙基、1-甲基乙基(异丙基)、正丁基、正戊基、1,1-二甲基乙基(叔丁基)、3-甲基己基、2-甲基己基等。除非另有说明，否则烷基是任选取代的。

如本文所述的，除非另有说明，术语“烯基”是指仅由碳和氢原子组成的直链或支链烃链基团，其含有一个或多个碳-碳双键。如本领域普通技术人员所理解的，术语“烯基”还包括具有“顺式”和“反式”构型，或者“E”和“Z”构型的基团。在一个实施方案中，烯基具有例如2至24个碳原子(C₂-C₂₄烯基)、4至20个碳原子(C₄-C₂₀烯基)、6至16个碳原子(C₆-C₁₆烯基、6至9个碳原子(C₆-C₉链烯基)、2至15个碳原子(C₂-C₁₅链烯基)、2至12个碳原子(C₂-C₁₂链烯基)、2至8个碳原子(C₂-C₈链烯基)或2至6个碳原子(C₂-C₆烯基)，并通过单键与分子的其余部分相连。烯基的实例包括但不限于乙烯基、丙-1-烯基、丁-1-烯基、戊-1-烯基、戊-1,4-二烯基等。除非另有说明，否则烯基是任选取代的。

如本文所述的，除非另有说明，术语“炔基”是指仅由碳和氢原子组成的直链或支链烃链基团，其含有一个或多个碳-碳三键。在一个实施方案中，炔基具有例如2至24个碳原子(C₂-C₂₄炔基)、4至20个碳原子(C₄-C₂₀炔基)、6至16个碳原子(C₆-C₁₆炔基)、6至9个碳原子(C₆-C₉炔基)、2至15个碳原子(C₂-C₁₅炔基)、2至12个碳原子(C₂-C₁₂炔基)、2至8个碳原子(C₂-C₈炔基)或2至6个碳原子(C₂-C₆炔基)，并通过单键与分子的其余部分相连。炔基的实例包括但不限于乙炔基、丙炔基、丁炔基、戊炔基等。除非另有说明，否则炔基是任选取代的。

如本文所述的，除非另有说明，术语“亚烷基”或“亚烷基链”是指将分子的其余部分连接至仅由饱和的碳和氢组成的基团的直链或支链二价烃链。在一个实施方案中，亚烷基具有例如1至24个碳原子(C₁-C₂₄亚烷基)、1至15个碳原子(C₁-C₁₅亚烷基)、1至12个碳原子(C₁-C₁₂亚烷基)、1至8个碳原子(C₁-C₈亚烷基)、1至6个碳原子(C₁-C₆亚烷基)、2至4个碳原子(C₂-C₄亚烷基)、1至2个碳原子(C₁-C₂亚烷基)。亚烷基的实例包括但不限于亚甲基、亚乙基、亚丙基、正丁烯等。亚烷基链通过单键连接至分子的其余部分，并通过单键连接至自由基基团。亚烷基链与分子其余部分和与自由基基团的连接可以通过链中的一个碳或任何两个碳。除非另有说明，否则亚烷基链是任选取代的。

如本文所述的，除非另有说明，术语“亚烯基”是指将分子的其余部分连接至仅由碳和氢组成的自由基基团的直链或支链二价烃链，该自由基基团包含一个或多个碳-碳双键。在一个实施方案中，亚烯基具有例如2至24个碳原子(C₂-C₂₄亚烯基)、2至15个碳原子(C₂-C₁₅亚烯基)、2至12个碳原子(C₂-C₁₂亚烯基)、2至8个碳原子(C₂-C₈亚烯基)、2至6个碳原子(C₂-C₆亚烯基)或2至4个碳原子(C₂-C₄亚烯基)。亚烯基的实例包括但不限于亚乙烯基、亚丙烯基、正丁烯基等。亚烯基通过单键或双键连接至分子的其余部分，并通过单键或双键连接至自由基基团。亚烯基与分子的其余部分和与自由基基团的连接可以通过链中的一个碳或任何两个碳。除非另有说明，亚烯基是任选取代的。

如本文所述的，除非另有说明，术语“环烷基”是指仅由碳和氢原子组成且为饱和的非芳族单环或多环烃基。环烷基可以包括稠环或桥环系统。在一个实施方案中，环烷基具有例如3至15个环碳原子(C₃-C₁₅环烷基)，3至10个环碳原子(C₃-C₁₀环烷基)或3至8个环碳原子(C₃-C₈环烷基)。环烷基通过单键连接至分子的其余部分。单环环烷基的实例包括但不限于环丙基、环丁基、环戊基、环己基、环庚基和环辛基。多环环烷基基团的实例包括但不限于金刚烷基、降冰片基、十氢烷基、7,7-二甲基-双环[2.2.1]庚基等。除非另有说明，否则环烷基是任选取代的。

如本文所述的，除非另有说明，术语“亚环烷基”是二价环烷基。除非另有说明，亚环烷基任选地被取代。

如本文所述的，除非另有说明，术语“环烯基”是指仅由碳和氢原子组成且包括一个或多个碳-碳双键的非芳族单环或多环烃基。环烯基可包括稠环或桥环系统。在一个实施方案中，环烯基具有例如3至15个环碳原子(C₃-C₁₅环烯基)、3至10个环碳原子(C₃-C₁₀环烯基)或3至8个环碳原子(C₃-C₈环烯基)。环烯基通过单键连接至分子的其余部分。单环环烯基基团的实例包括但不限于环丙烯基、环丁烯基、环戊烯基、环己烯基、环庚烯基、环辛烯基等。除非另有说明，环烯基基团是任选取代的。

如本文所述的，除非另有说明，否则术语“亚环烯基”是二价环烯基。除非另有说明，亚环烯基基团是任选取代的。

如本文所述的，除非另有说明，术语“杂芳基”是指含有至少一个芳香环的单环芳香族基团和/或多环芳香族基团，其中至少一个芳香族环含有一个或多个独立地选自O，S和N的一个至三个或一个至四个杂原子。杂芳基中杂原子可以在任何碳原子处连接至主结构。在某些实施方案中，杂芳基具有5至20、5至15或5至10个环原子。术语“杂芳基”还指双环，三环或其他多环，其中至少一个环是芳族的，并且其他环可以是饱和的，部分不饱和的或芳族的，其中至少一个芳族环包含一个或多个单环杂芳基的实例，包括但不限于，吡咯基，吡唑基，吡唑啉基，咪唑基，恶唑基，异恶唑基，噻唑基，噻二唑基，异噻唑基，呋喃基，噻吩基，恶二唑基，吡嗪基，嘧啶基，哒嗪基和三嗪基。双环杂芳基的实例包括但不限于吲哚基，苯并噻唑基，苯并恶唑基，苯并噻吩基，喹啉基，四氢异喹啉基，异喹啉基，苯并咪唑基，苯并吡喃基，吲哚嗪基，苯并呋喃基，异苯并呋喃基，氧萘基，呋喃吡啶基，噻吩并吡啶基，二氢异吲哚基和四氢喹啉基。三环杂芳基的实例,包括但不限于,咔唑基，苯并吲哚基，菲咯啉基，吖啶基，菲啶基和黄嘌呤。除非另有说明，否则杂芳基是任选取代的。

如本文所述的，除非另有说明，术语“亚杂芳基”是二价杂芳基。除非另有说明，否则亚杂芳基是任选取代的。

如本文所述的，除非另有说明，术语“芳基”是指包含至少一个芳族烃环的单环芳族基团和/或多环一价芳族基团。在某些实施方案中，芳基具有6至18个环碳原子(C₆-C₁₈芳基)、6至14个环碳原子(C₆-C₁₄芳基)或6至10个环碳原子(C₆-C₁₀芳基)。芳基的实例包括但不限于苯基、萘基、芴基、azulenyl、蒽基、菲基，pyrenyl、联苯基和三联苯基。术语“芳基”还指双环、三环或其他多环烃环，其中至少一个环是芳族的，并且其他环可以是饱和的、部分不饱和的或芳族的，例如二氢萘基、茚基、茚满基或四氢萘基(四氢萘基)。除非另有说明，否则芳基是任选取代的。

如本文所用，除非另有说明，否则术语“亚芳基”是二价芳基。除非另有说明，亚芳基是任选取代的。

如本文所述的，除非另有说明，术语“杂芳基”是指含有至少一个芳香环的单环芳香族基团和/或多环芳香族基团，其中至少一个芳香族环含有一个或多个独立地选自O，S和N的一个至三个或一个至四个杂原子。杂芳基中杂原子可以在任何碳原子处连接至主结构。在某些实施方案中，杂芳基具有5至20、5至15或5至10个环原子。术语“杂芳基”还指双环，三环或其他多环，其中至少一个环是芳族的，并且其他环可以是饱和的，部分不饱和的或芳族的，其中至少一个芳族环包含一个或多个单环杂芳基的实例，包括但不限于、吡咯基、吡唑基、吡唑啉基、咪唑基、恶唑基、异恶唑基、噻唑基、噻二唑基、异噻唑基、呋喃基、噻吩基、恶二唑基、吡嗪基、嘧啶基、哒嗪基和三嗪基。双环杂芳基的实例包括但不限于吲哚基、苯并噻唑基、苯并恶唑基、苯并噻吩基、喹啉基、四氢异喹啉基、异喹啉基、苯并咪唑基、苯并吡喃基、吲哚嗪基、苯并呋喃基、异苯并呋喃基、氧萘基、呋喃吡啶基、噻吩并吡啶基、二氢异吲哚基和四氢喹啉基。三环杂芳基的实例，包括但不限于，咔唑基、苯并吲哚基、菲咯啉基、吖啶基、菲啶基和黄嘌呤。除非另有说明，否则杂芳基是任选取代的。

如本文所述的，除非另有说明，术语“亚杂芳基”(heteroarylene)是二价杂芳基。除非另有说明，否则亚杂芳基是任选取代的。

本文所述的基团被“取代的”时，它们可以被任何合适的一个或多个取代基取代。取代基的说明性实例，包括但不限于在本文提供的示例性化合物和实施方案中展示的那些，以及：例如F、C、Br或I等卤素原子；氰基；氧代基团(＝O)；羟基(-OH)；烷基；烯基炔基环烷基芳基-(C＝O)OR’；-O(C＝O)R’；-C(＝O)R’；-S(O)xR’；-S-SR’；-C(＝O)SR’；-SC(＝O)R’；-NR’R’；-NR’C(＝O)R’；-C(＝O)NR’R’；-NR’C(＝O)NR’R’；-OC(＝O)NR’R’；-NR’C(＝O)OR’；-NR’S(O)_xNR’R’；-NR’S(O)_xR’和-S(O)_xNR'R'。其中R'在每次出现时独立地为H、C₁-C₁₅烷基或环烷基，并且x为0、1或2。在一些实施方案中，取代基为C₁-C₁₂烷基。在其他实施方案中，取代基是环烷基。在其他实施方案中，取代基是卤素基团，例如氟代。在其他实施方案中，取代基是氧代基团。在其他实施方案中，取代基是羟基。在其他实施方案中，取代基是烷氧基(-OR’)。在其他实施方案中，取代基是羧基。在其他实施方案中，取代基是氨基(-NR’R’)。

如本文所述的，除非另有说明，术语“任选的”或“任选地”(例如，任选取代的)是指随后描述的情况事件可能发生或不发生，并且描述包括所述事件或情况发生的实例以及所述事件或情况不发生的实例。例如，“任选取代的烷基”是指烷基可以被取代或可以不被取代，并且描述包括取代的烷基和无取代的烷基。

“前药”是指可以在生理条件下或通过溶剂分解而转化为生物活性化合物的化合物。因此，术语“前药”是指药学上可接受的生物活性化合物的代谢前体。当向有需要的受试者施用时，前药可以是无活性的，但是在体内被转化为本发明的生物活性化合物。前药通常在体内快速转化得到本发明的母体生物活性化合物，例如，通过在血液中水解。前药化合物通常提供在哺乳动物生物体内的溶解性、组织相容性或延迟释放的优点(参见Bundgard,H.,Design of Prodrugs(1985),pp.7-9,21-24(Elsevier,Amsterdam))。在Higuchi,T.,etal.,A.C.S.Symposium Series,Vol.14,和Bioreversible Carriers in Drug Design,Ed.Edward B.Roche,American Pharmaceutical Association and Pergamon Press,1987.中提供了对前药的讨论。

在一些实施方案中，术语“前药”还意味着包括任何通过共价键合的载体，当这种前药对哺乳动物对象施用时，它们在体内释放本发明的活性化合物。本发明化合物的前药可以通过修饰化合物中存在的官能团来制备，通过这种方式，所述修饰通过常规操作或在体内裂解成为本发明的母体化合物。前药包括以下本发明化合物：其中羟基、氨基或巯基与以下任何基团键合，当本发明化合物的前药对哺乳动物对象施用时，所述基团裂解分别形成游离羟基，游离氨基或游离巯基。

“前药”的实例包括，但不限于，本文提供的化合物中的醇或胺官能团的酰胺衍生物的乙酸酯、甲酸酯和苯甲酸酯衍生物等。

如本文所述的，除非另有说明，术语“药学上可接受的盐”包括酸加成盐和碱加成盐。

“药学上可接受的酸加成盐”的实例包括但不限于盐酸、氢溴酸、硫酸、硝酸、磷酸等，以及有机酸，例如但不限于乙酸、2,2-二氯乙酸、己二酸、海藻酸、抗坏血酸、天冬氨酸、苯磺酸、苯甲酸、4-乙酰氨基苯甲酸、樟脑酸、樟脑-10-磺酸、癸酸、己酸、辛酸、碳酸、肉桂酸，柠檬酸、环酰胺酸、十二烷基硫酸、乙烷-1,2-二磺酸、乙烷磺酸、2-羟基乙磺酸、甲酸、富马酸、半乳糖酸、龙胆酸、葡庚酸、葡糖酸、葡糖醛酸、谷氨酸、戊二酸、2-氧代戊二酸、甘油磷酸、乙醇酸、马尿酸、异丁酸、乳酸、乳糖酸、月桂酸、马来酸、苹果酸、丙二酸、扁桃酸、甲磺酸、粘酸、萘-1,5二甲酸、萘-2-磺酸、1-羟基-2-萘甲酸、烟酸、油酸、乳清酸、草酸、棕榈酸、棕榈酸、丙酸、焦谷氨酸、丙酮酸、水杨酸、4-氨基水杨酸、癸二酸、硬脂酸、琥珀酸、酒石酸、硫氰酸、对甲苯磺酸、三氟乙酸、十一碳烯酸等。

“药学上可接受的碱加成盐”的实例包括，但不限于，通过将无机碱或有机碱加成至游离酸化合物而制备的盐。衍生自无机碱的盐包括但不限于钠盐、钾盐、锂盐、铵盐、钙盐、镁盐、铁盐，锌盐、铜盐、锰盐、铝盐等。优选的，无机盐是铵盐、钠盐、钾盐、钙盐和镁盐。衍生自有机碱的盐包括，但不限于，下列伯胺、仲胺和叔胺、取代胺(包括天然存在的取代胺)、环胺和碱性离子交换树脂的盐：例如氨、异丙胺、三甲胺、二乙胺、三乙胺、三丙胺、二乙醇胺、乙醇胺、脱醇、2-二甲基氨基乙醇、2-二乙基氨基乙醇、赖氨酸、精氨酸、组氨酸、咖啡因、普鲁卡因、肼苯胺、胆碱、甜菜碱、苯那敏(benethamine)、苄星青霉素(benzathine)、乙二胺、葡糖胺、甲基葡糖胺、可可碱、三乙醇胺、嘌呤、哌嗪、哌啶、N-乙基哌啶、聚胺树脂等。优选的，有机碱是异丙胺、二乙胺、乙醇胺、三甲胺、二环己胺、胆碱和咖啡因。

本文提供的化合物可包含一个或多个不对称中心，并因此可产生对映异构体、非对映异构体和其他立体异构形式，对于氨基酸，其可以根据绝对立体化学的方式定义为(R)-或(S)-，或定义为(D)-或(L)-。除非另有说明，否则本文提供的化合物旨在包括所有这些可能的异构体，以及它们的外消旋和光学纯形式。光学活性的(+)和(-)、(R)-和(S)-或(D)-和(L)-异构体可以使用手性合成子或手性试剂制备，或使用常规技术，例如，色谱法和分步结晶来拆分。用于制备/分离单个对映异构体的常规技术包括由合适的光学纯前体进行手性合成或使用例如手性高压液相色谱法(HPLC)的外消旋体(或盐或衍生物的外消旋体)的拆分。当本文所述的化合物包含烯烃双键或其他几何不对称中心时，除非另有说明，该化合物意指包括E和Z型几何异构体。同样地，也意在包括所有互变异构形式。

如本文所述的，除非另有说明，术语“异构体”是指具有相同分子式的不同化合物。“立体异构体”是仅原子在空间中排列方式不同的异构体。“阻转异构体”是由于原子绕单键旋转受阻的立体异构体。“对映异构体”是一对彼此互不重叠的镜像的立体异构体。一对对映异构体的任何比例的混合物都可以称为“外消旋”混合物。“非对映异构体”是具有至少两个不对称原子，但彼此不是镜像的立体异构体。

“立体异构体”还可以包括E和Z型异构体或其混合物，和顺式和反式异构体或其混合物。在某些实施方案中，本文所述的化合物被分离为E或Z型异构体。在其他实施方案中，本文所述的化合物是E和Z型异构体的混合物。

“互变异构体”是指彼此平衡的化合物的异构形式。异构体形式的浓度的不同将取决于该化合物所处的环境，并且可以取决于该化合物是否是固体还是在有机溶液或水溶液中存在的状态。

文所述的化合物可在一个或多个原子上包含非自然部分的原子同位素。例如，化合物可以用放射性同位素进行放射性标记，例如氚3(³H)，碘-125(¹²⁵I)，硫35(³⁵S)或碳14(¹⁴C)，或者可以是氘(²H)，碳13(¹³C)或氮15(¹⁵N)同位素富集的。如本文所用，“同位素”是同位素富集的化合物。术语“同位素富集”是指具有不同于该原子的天然同位素组成的同位素组成的原子。“同位素富集的”还可以指含有至少一个原子的化合物，该原子的同位素组成不同于该原子的天然同位素组成。术语“同位素组成”是指给定原子存在的每种同位素的量。放射性标记的和同位素富集的化合物可用作治疗剂，例如癌症治疗剂，研究试剂(例如结合测定试剂)和诊断剂(例如体内显像剂)。本文所描述的化合物的所有同位素变体，无论是否具有放射性，都旨在被包含在本文所提供的实施方案的范围内。在一些实施方案中，提供了本文描述的化合物的同位素，例如，同位素是富含氘，碳-13和/或氮15的。如本文所用，“氘代”是指其中至少一个氢(H)被氘(以D或²H表示)取代的化合物，即，该化合物在至少一个位置上富含氘。

应当注意的是，若本文所描述的结构与该结构的名称之间存在差异，则所本文描述的结构应具有更大的权重。

如本文所述的，除非另有说明，术语“药学上可接受的载体，稀释剂或赋形剂”包括但不限于任何已被美国食品和药物管理局批准的，可用于人类或家畜的佐剂、载体、赋形剂、助流剂、甜味剂、稀释剂、防腐剂、染料/着色剂、增香剂、表面活性剂、润湿剂、分散剂、助悬剂、稳定剂、等渗剂、溶剂或乳化剂。

术语“组合物”旨在涵盖含有任选地以指定量的指定成分(例如mRNA分子)的产品。

术语“多核苷酸”或“核酸”在本文中可互换使用，其是指任何长度的核苷酸的聚合物，包括例如DNA和RNA。核苷酸可以是脱氧核糖核苷酸，核糖核苷酸，修饰的核苷酸或碱基和/或其类似物，或可以是通过DNA聚合酶或RNA聚合酶或通过合成反应掺入聚合物的任何底物。多核苷酸可包含修饰的核苷酸，例如甲基化的核苷酸及其类似物。核酸可以是单链或双链形式。如本文所述的且除非另有说明，“核酸”还包括核酸模拟物，例如锁核酸(LNA)，肽核酸(PNA)和吗啉环寡聚核苷酸。如本文所用，“寡核苷酸”是指短的合成多核苷酸，其长度通常但非必须小于约200个核苷酸。术语“寡核苷酸”和“多核苷酸”不是互相排斥的。上面对多核苷酸的描述同样且完全适用于寡核苷酸。除非另有说明，否则本文公开的任何单链多核苷酸序列的左端均为5'端；双链多核苷酸序列的左侧方向称为5'方向。新生RNA转录本从5'到3'的添加方向称为转录方向；具有与RNA转录物相同的序列的DNA链上位于RNA转录物的5'至5'末端的序列区域被称为“上游序列”；DNA链上具有与RNA转录物相同的序列的3'到3'末端的序列区域称为“下游序列”。

如本文所述的，术语“非天然存在”在提及本文中描述的核酸分子使用时意图指所述核酸分子未在自然界被发现。一个非天然存在的编码一种病毒肽段或蛋白的核酸具有至少一个在所提及病毒的野生型毒株中通常未发现的遗传改变或化学修饰。遗传改变包括例如引入编码对所提及病毒的异源的肽段或多肽的可表达核酸序列，其它核酸添加，核酸缺失，核酸替代，和/或对病毒遗传物质的其他功能性破坏。此类修饰包括例如对所提及病毒的异源，同源或异源与同源多肽的编码区域和其功能片段的修饰。其它修饰包括例如对非编码调节区域的修饰来改变基因或操纵子的表达。其他修饰还包括例如将核酸序列掺入如质粒或人工染色体等载体。化学修饰包括例如一个或多个如本文所述的功能核苷酸类似物。

“分离的核酸”是指核酸，例如其可以是RNA，DNA或混合核酸，它们与其他基因组DNA序列以及蛋白质或复合物(如核糖体和聚合酶)基本自然分离，包含天然序列。“分离的”核酸分子是与天然来源中的其他核酸分子分离的核酸分子。此外，当通过重组技术生产时，“分离的”核酸分子(例如mRNA分子)可以基本上不含其他细胞材料或培养基，或者当化学合成时可以基本上不含化学前体或其他化学品。在一个具体的实施方案中，编码本文所述抗原的一种或多种核酸分子是分离或纯化的。该术语包括已经从其天然存在的环境中除去的核酸序列，并且包括重组或克隆的DNA或RNA分离物以及化学合成的类似物或通过异源系统生物合成的类似物。基本上纯的分子可以包括分子的分离形式。

术语“编码核酸”或其语法上的等同物包括：(a)处于天然状态或通过本领域技术人员众所周知的方法操作时，可以转录产生能够翻译成肽和/或多肽的mRNA的核酸分子，以及(b)mRNA分子本身。反义链是核酸分子的互补序列，并且可以由此推断出编码序列。术语“编码区”是指编码核酸序列中可翻译成肽或多肽的部分。术语“非翻译区”或“UTR”是指编码核酸中未翻译成肽或多肽的部分。这取决于UTR相对于核酸分子的编码区的取向，如果UTR位于编码区的5'末端，则将该UTR称为5'-UTR；如果位于编码区域的3'端，则将该UTR称为3'-UTR。

如本文所述的，术语“mRNA”是指包含一个或多个开放阅读框(ORF)的信使RNA分子，其可以被细胞或有机体翻译以产生一种或多种肽或蛋白质产物。包含一个或多个ORF的区域被称为mRNA分子的编码区域。在某些实施方案中，mRNA分子还包含一个或多个非翻译区(UTR)。

在某些实施方案中，mRNA是仅包含一个ORF的单顺反子mRNA。在某些实施方案中，单顺反子mRNA编码包含所选抗原(例如，病原性抗原或肿瘤相关抗原)的至少一个表位的肽或蛋白质。在其他实施方案中，mRNA是包含两个或更多个ORF的多顺反子mRNA。在某些实施方案中，多顺反子mRNA编码两个或多个彼此相同或不同的肽或蛋白质。在某些实施方案中，由多顺反子mRNA编码的每种肽或蛋白质包含所选抗原的至少一个表位。在某些实施方案中，由多顺反子mRNA编码的不同肽或蛋白质各自包含不同抗原的至少一个表位。在本文所述的任何实施方案中，至少一个表位可以是至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个抗原的表位。

术语“核碱基”涵盖嘌呤和嘧啶，包括天然化合物腺嘌呤，胸腺嘧啶，鸟嘌呤，胞嘧啶，尿嘧啶，肌苷及其天然或合成类似物或衍生物。

如本文所用，术语“功能核苷酸类似物”是指标准核苷酸A，G，C，U或T的修饰形式，其(a)保留相应规范核苷酸的碱基配对性质，并且(b)包含(i)核碱基，(ii)糖基，(iii)磷酸基或(iv)相应天然核苷酸的(i)至(iii)的任何组合的至少一种化学修饰。如本文所述的，碱基对不仅涵盖标准的沃森-克里克A-T，A-U或C-G碱基对，而且还包括在规范核苷酸与功能核苷酸类似物之间或在一对功能核苷酸类似物之间形成的碱基对，其中氢键供体和氢键受体的排列允许修饰的核碱基与标准核碱基之间或两个互补的修饰的核碱基结构之间形成氢键。例如，鸟苷(G)的功能类似物保留了与胞嘧啶(C)或胞嘧啶的功能类似物碱基配对的能力。这种非规范碱基配对的一个例子是修饰的核苷酸肌苷和腺嘌呤，胞嘧啶或尿嘧啶之间的碱基配对。如本文所述，功能核苷酸类似物可以是天然存在的或非天然存在的。因此，包含功能性核苷酸类似物的核酸分子可具有至少一个修饰的核碱基、糖基或核苷键。本文提供了对核酸分子的核碱基、糖基或核苷键的示例性化学修饰。

如本文所述的，术语“翻译增强元件”、“TEE”和“翻译增强子”是指核酸分子中的一个区域，其功能是促进核酸的编码序列翻译成蛋白质或肽产物，例如通过cap依赖或非cap依赖的翻译。TEE通常位于核酸分子(如mRNA)的UTR区域中，能够增强位于上游或下游的编码序列的翻译水平。例如，核酸分子的5'-UTR中的TEE可以位于核酸分子的启动子和起始密码子之间。各种TEE序列在本领域中是已知的(Wellensiek et al.Genome-wide profilingof human cap-independent translation-enhancing elements,Nature Methods,2013Aug；10(8):747–750；Chappell et al.PNAS June 29,2004 101(26)9590-9594)。已知某些TEE在多种物种中是保守的(Pánek et al.Nucleic Acids Research,Volume 41,Issue 16,1September 2013,Pages 7625–7634)。

如本文所述的，术语“茎环序列”是指具有至少两个区域的单链多核苷酸序列，当以相反的方向阅读时，所述两个区域彼此互补或基本互补，以形成至少一个双螺旋和不互补的环，所得的环结构称为茎环结构、发夹或发夹环，这也是存在于许多RNA分子的二级结构。

如本文所述的，术语“肽”是指含有2-50个被一个或多个共价肽键所连接的氨基酸残基的聚合物。该术语适用于天然存在的氨基酸聚合物以及其中一个或多个氨基酸残基是非天然存在的氨基酸(例如，氨基酸类似物或非天然氨基酸)的氨基酸聚合物。

术语“多肽”和“蛋白质”在本文可互换使用，是指通过共价肽键连接的具有超过五十个氨基酸残基的聚合物。即，针对多肽的描述同样适用于蛋白质的描述，反之亦然。该术语适用于天然存在的氨基酸聚合物以及其中一个或多个氨基酸残基是非天然存在的氨基酸(例如，氨基酸类似物)的氨基酸聚合物。如本文所用，该术语涵盖任何长度的氨基酸链，包括全长蛋白质(例如抗原)。

在肽或多肽的上下文中，本文所用的术语“衍生物”是指包含病毒肽或蛋白质的氨基酸序列的，或所述病毒肽或蛋白质的片段的肽或多肽；其通过引入氨基酸残基的替代，缺失或添加加以改变。如本文所用，术语“衍生物”还指已经通过将任何类型的分子共价连接至多肽而进行化学修饰的病毒肽或蛋白质，或病毒肽或蛋白质的片段。例如但不限于，病毒肽或蛋白质，或病毒肽或蛋白质的片段，可以被化学修饰，例如通过糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化、通过已知的保护/封闭基团衍生化、蛋白水解切割、化学切割、制剂衣霉素的代谢合成，与细胞配体或其他蛋白质连接等。衍生物以与天然存在或原始的肽或多肽不同的方式进行修饰，无论是其附着分子连接的类型还是位置。衍生物进一步包括缺失病毒肽或蛋白质上天然存在的一个或多个化学基团。此外，病毒肽或蛋白质的衍生物，或病毒肽或蛋白质的片段的衍生物，可包含一个或多个非标准氨基酸。在特定的实施方案中，衍生物是衍生自天然或未修饰的肽或多肽的功能性衍生物。

术语“功能性衍生物”是指保留了天然存在的或衍生起始的肽或多肽的一种或多种功能或活性的衍生物。例如，冠状病毒S蛋白的功能性衍生物可以保留其结合宿主细胞上一个或多个受体的能力。例如，冠状病毒N蛋白的功能性衍生物可以保留其结合RNA或包装病毒基因组的能力。

术语“同一性”是指通过序列比对确定的两个或更多个多肽分子的序列，或两个或更多个核酸分子的序列之间的关系。“氨基酸序列同一性百分比(％)”被定义为相对于参考的多肽序列，在序列比对并引入间隔(gap)因素之后，候选序列与参考多肽序列中相同的氨基酸残基和参考序列氨基酸残基的百分比。如果有必要的话可以达到最大的序列同一性百分比和不考虑将任何保守取代作为序列同一性的一部分。用于确定氨基酸序列同一性百分比的比对可以以本领域技术范围内的多种方式实现，例如使用公开可用的计算机软件，例如BLAST，BLAST-2，ALIGN或MEGALIGN(DNAStar，Inc.)软件。本领域技术人员可以确定用于比对序列的合适参数，包括在所比较的序列的全长上实现最大比对所需的任何算法。

氨基酸残基/位置的“修饰”是指与起始氨基酸序列相比，一级氨基酸序列的改变，其中该改变是由涉及所述氨基酸残基/位置的序列改变引起的。例如，典型的修饰包括用另一个氨基酸取代残基(例如，保守或非保守取代)、在所述残基附近插入一个或多个(例如，通常少于5、4或3个)氨基酸/位置和/或缺失所述残基/位置。

在肽或多肽的语境中，术语“片段”是指包含少于全长氨基酸序列的肽或多肽。这样的片段可以来自N端的截短，C端的截短和/或氨基酸序列内部残基的缺失。片段可以由替代的RNA剪接或体内蛋白酶产生。在某些实施方案中，片段是指包含至少5个连续的氨基酸残基、至少10个连续的氨基酸残基、至少15个连续的氨基酸残基、至少20个连续的氨基酸残基、至少25个连续的氨基酸序列、至少30个连续氨基酸残基，至少40个连续氨基酸残基、至少50个连续氨基酸残基、至少60个连续氨基酸残基、至少70个连续氨基酸残基、至少80个连续氨基酸残基、至少90个连续氨基酸残基、至少连续100个氨基酸残基、至少125个连续氨基酸残基、至少150个连续氨基酸残基、至少175个连续氨基酸残基、至少200个连续氨基酸残基至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900或至少950个连续氨基酸残基序列的多肽。在一个具体的实施方案中，多肽的片段保留了该多肽的至少1个、至少2个、至少3个或更多个功能。

如本文在肽或多肽(例如蛋白质)的上下文中所使用的，术语“免疫原性片段”是指在与肽或多肽接触时保留肽或多肽引发哺乳动物免疫应答(包括先天免疫应答和/或适应性免疫应答)的能力的肽或多肽的片段。在一些实施方案中，肽或多肽的免疫原性片段可以是表位。

术语“抗原”是指能够被受试者的免疫系统(包括适应性免疫系统)识别，并能够在施用后能够引发免疫反应(包括抗原-特异性免疫反应)的物质。在某些实施方案中，抗原是与患病细胞(例如病原体或赘生性细胞感染的细胞)相关的蛋白质(例如，肿瘤相关抗原(TAA))。

“表位”是抗原分子表面的特异性抗体分子结合的位点，例如是能够结合至抗体的一个或多个抗原结合区的抗原表面上的局部区域，在动物例如哺乳动物(例如人)中具有抗原或免疫原活性，并且能够引发免疫反应。具有免疫原性活性的表位是在动物中引发抗体应答的多肽的一部分。具有抗原活性的表位是抗体结合的多肽的一部分，如通过本领域公知的任何方法所确定的，包括例如通过免疫测定法。抗原表位不必一定是免疫原性的。表位通常由分子的化学活性表面基团集合组成，例如氨基酸或糖侧链，并且通常具有特定的三维结构特征，以及特定的电荷特征。抗体表位可以是线性表位或构象表位。线性表位由蛋白质中氨基酸的连续序列形成。构象性表位由蛋白质序列中不连续的氨基酸形成，但是在蛋白质折叠成其三维结构时会结合在一起。当蛋白质的三维结构处于改变的构型时，如在另一蛋白质或配体激活或结合之后，形成诱导的表位。在某些实施方案中，表位是多肽的三维表面特征。在其他实施方案中，表位是多肽的线性特征。通常情况下，抗原具有几个或许多不同的表位，并且可以与许多不同的抗体反应。

术语“严重急性呼吸系统综合症冠状病毒2”或“SARS-CoV-2”或“2019-nCoV”在本文中可互换使用，是指引起传染病大流行的冠状病毒。GenBank TM登录号MN908947提供了SARS-CoV-2的示例性基因组序列(SEQ ID NO：1)。

术语“异源”是指在自然界中未发现的与自然存在的冠状病毒相关(例如由其编码和/或由其表达)的实体。术语“同源的”是指在自然界发现与自然存在的冠状病毒相关(例如由其编码和/或由其表达)的实体。

如本文所用，术语“基因疫苗”是指包含至少一种编码与靶标疾病(如传染病或肿瘤性疾病)相关抗原的核酸分子的治疗或预防性组合物。通过向受试者施用疫苗(疫苗接种)来编码产生肽或蛋白质，从而在受试者中引发针对靶标疾病的免疫应答。在某些实施方案中，免疫应答包括适应性免疫应答，例如产生针对所编码的抗原的抗体，和/或能够活化和增殖用于特异性消除表达抗原的患病细胞的免疫细胞。在某些实施方案中，免疫应答还包括先天免疫应答。根据本发明，可以在目标疾病的临床症状发作之前或之后将疫苗给予施用对象。在一些实施方案中，健康或非典型对象的疫苗接种使接种的对象对目标疾病进程具有免疫性或较不敏感。在一些实施方案中，具有疾病症状的对象的疫苗接种可改善接种对象的疾病状况或治疗该疾病。

术语“载体”是指用于携带或包括核酸序列的物质，所述核酸序列包括例如编码本文所述的病毒肽或蛋白质的核酸序列，以便将核酸序列引入宿主细胞，或用作转录模板以在无细胞系统中进行体外转录反应以产生mRNA。适用的载体包括，例如表达载体、质粒、噬菌体载体、病毒载体、附加体和人工染色体等，其可以包括用于稳定整合进宿主细胞染色体的选择序列或标记。另外，载体可以包括一种或多种选择性标记基因和适当的转录或翻译控制序列。包括的选择标记基因例如可以提供对抗生素或毒素的抗性、补充营养缺陷型营养素或提供培养基中没有的关键营养素。转录或翻译控制序列可以包括本领域众所周知的组成型和诱导型启动子、转录增强子、转录终止子等。当两个或更多个核酸分子(例如编码两个或更多个不同病毒肽或蛋白质的核酸分子)被共转录或共翻译时，这两个核酸分子可被插入同一个表达载体或在单独的表达载体中。对于单个载体转录和/或翻译，可将编码核酸可操作地连接至一个共同的转录或翻译控制序列，或连接至不同的转录或翻译控制序列，如一种诱导型启动子和一种组成型启动子。可以使用本领域周知的方法确认将核酸分子引入了宿主细胞。此类方法包括：利用如RNA印迹或聚合酶链式反应(PCR)扩增的核酸分析、用于基因产物表达的免疫印迹或其他合适的分析方法，来检测导入的核酸序列或其对应的表达基因产物。本领域技术人员应理解的是，核酸分子以足以产生所需产物(如本文所述的核酸的mRNA转录物)的量表达，并且还应理解，可以通过本领域熟知的方法优化表达水平以获得足够的表达产物。

术语“先天免疫应答”和“先天免疫”在本领域中是公知的，是指人体免疫系统在识别病原体相关分子时启动的非特异性防御机制，其涉及不同形式的细胞活动，包括各种途径的细胞因子产生和细胞死亡。如本发明所述的，先天免疫应答包括但不限于炎症细胞因子(例如，I型干扰素或IL-10产生)的产生增加，NFκB途径的活化，免疫细胞的增殖、成熟、分化和/或存活增加，在某些情况下诱导的细胞凋亡。可以使用本领域已知的方法来检测先天免疫的激活情况，例如通过测量(NF)-κB的激活。

术语“适应性免疫应答”和“适应性免疫”在本领域中是公知的，是指人体的免疫系统在识别出特定抗原后启动的抗原特异性防御机制，包括体液应答和细胞介导的应答。如本发明所述的，适应性免疫应答包括由疫苗组合物(如本文所述的基因性组合物)触发和/或增强的细胞应答。在一些实施方案中，疫苗组合物包含抗原，该抗原是抗原特异性适应性免疫应答的靶标。在其他实施方案中，疫苗组合物在给药后允许在免疫对象中产生抗原，该抗原是抗原特异性适应性免疫应答的靶标。可以使用本领域已知的方法来检测适应性免疫应答的激活，如通过监测抗原特异性抗体的产生情况或监测抗原特异性细胞介导的细胞毒性水平。

“抗体依赖的细胞介导的细胞毒性”或“ADCC”是指细胞毒性的一种形式，其中分泌的免疫球蛋白结合到某些细胞毒性细胞(例如，自然杀伤细胞(NK细胞)、嗜中性粒细胞和巨噬细胞)上的Fc受体(FcR)上使这些细胞毒性效应细胞能特异性结合到带有抗原的靶细胞上，并随后用细胞毒素杀死靶细胞。抗体“武装”细胞毒性细胞，是这种杀伤所绝对需要的。NK细胞是介导ADCC的主要细胞，仅表达FcγRIII，而单核细胞表达FcγRI、FcγRII和FcγRIII。造血细胞上的FcR表达是已知的(参见，例如，Ravetch and Kinet,1991,Annu.Rev.Immunol.9:457-92)。为了评估目的分子的ADCC活性，可以进行体外ADCC测定(参见，例如，美国专利号5,500,362和5,821,337)。用于此类测定的有用的效应细胞包括外周血单核细胞(PBMC)和自然杀伤(NK)细胞。替代地或另外地，可以例如在动物模型体内评估目的分子的ADCC活性(参见，例如，Clynes et al.,1998,Proc.Natl.Acad.Sci.USA 95:652-56)。可以选择具有很少或没有ADCC活性的抗体。

“抗体依赖的细胞介导的吞噬作用”或“ADCP”是指当免疫球蛋白结合到某些吞噬细胞(例如嗜中性粒细胞、单核细胞和巨噬细胞)上存在的Fc受体(FcR)上时，通过单核细胞或巨噬细胞介导的吞噬作用破坏靶细胞，这些吞噬细胞可特异性结合至带有抗原的靶细胞，并随后杀死该靶细胞。为了评估目标分子的ADCP活性，可以进行体外ADCP测定(参见，例如，Bracher et al.,2007,J.Immunol.Methods 323:160-71)。用于此类测定的有用吞噬细胞包括外周血单核细胞(PBMC)，来自PBMC的纯化单核细胞或分化为单核类型的U937细胞。替代地或另外地，可以在例如动物模型体内评估目的分子的ADCP活性(参见，例如，Wallaceet al.,2001,J.Immunol.Methods 248:167-82)。可以选择具有很少或没有ADCP活性的抗体。

“Fc受体”或“FcR”描述与抗体的Fc区结合的受体。示例性的FcR是天然序列人FcR。此外，示例性的FcR是结合IgG抗体(例如，γ受体)的FcR，并且包括FcγRI、FcγRII和FcγRIII亚类的受体，包括这些受体的等位基因变体和剪接形式。FcγRII受体包括FcγRIIA(“活化受体”)和FcγRIIB(“抑制受体”)，其具有相似的氨基酸序列，其主要区别在于其胞质结构域(参见，例如

1997,Annu.Rev.Immunol.15:203-34)。多种FcR是已知的(参见，例如Ravetch and Kinet,1991,Annu.Rev.Immunol.9:457-92；Capel et al.,1994,Immunomethods 4:25-34；and de Haas et al.,1995,J.Lab.Clin.Med.126:330-41)。本文中的术语“FcR”涵盖其他FcR，包括将来将鉴定的那些。该术语还包括新生儿受体FcRn，它负责将母体IgGs转移至胎儿(参见例如Guyer et al.,1976,J.Immunol.117:587-93；and Kimet al.,1994,Eu.J.Immunol.24:2429-34)。已经描述了具有改善的或减少的与FcR的结合的抗体变体参见，例如，WO 2000/42072；U.S.Pat.Nos.7,183,387；7,332,581；and 7.335,742；Shields et al.2001,J.Biol.Chem.9(2):6591-604。

“补体依赖的细胞毒性”或“CDC”是指在补体存在下靶细胞的裂解。经典补体途径的激活通过补体系统(C1q)的第一个组件与(与其适当的亚类的)抗体结合而启动，该抗体与其同源抗原结合。为了评估补体激活，可以进行CDC测定(参见，例如，Gazzano-Santoroet al.,1996,J.Immunol.Methods 202:163)。现有技术中已经描述了具有改变的Fc区氨基酸序列的多肽变体(具有变异的Fc区的多肽)和增加或减少的C1q结合能力(参见，例如，USPat.No.6,194,551；WO 1999/51642；Idusogie et al.,2000,J.Immunol.164:4178-84)。可以选择具有很少或没有CDC活性的抗体。

术语“抗体”旨在包括由效应b细胞分泌的多肽产物，其由两对相同的多肽链组成，其中每对多肽链具有一条重链(约50-70kDa)和一条轻链(约25kDa)，每条链的N端部分包含约100至约130或更多个氨基酸组成的的可变区，每条链的C端部分包括一个恒定区域，其能够与特定分子抗原结合，免疫球蛋白不仅仅只是抗体。例如可参见Antibody Engineering(Borrebaeck ed.,2d ed.1995)和Kuby,Immunology(3d ed.1997)。在特定的实施方案中，特定的分子抗原包括多肽，其片段或表位，其可以与本文所述的抗体结合。抗体还包括，但不限于合成抗体，通过重组产生的抗体，骆驼化抗体，细胞内抗体(intracelluarantibodies)，anti-Id抗体和这些抗体的功能片段，抗体的功能片段指从前述抗体重链或轻链分离出来的能够保留一部分货全部结合活性的功能性多肽片段。功能片段的一些非限制性实例包括单链抗体(scFv)(包括单特异性，双特异性等)，Fab片段，F(ab’)片段，F(ab)2片段，F(ab’)2片段，二硫键稳定性抗体(dsFv)，Fd片段，Fv片段，双抗，三抗，四抗和微型抗体。特别地，本文所述的抗体包括免疫球蛋白分子和免疫球蛋白分子的免疫学活性部分，例如可以是抗原结合结构域或含有抗原结合位点(如抗体的一个或多个CDR)的分子。这样的抗体片段可以是在Harlow and Lane,Antibodies:A Laboratory Manual(1989)；Mol.Biology and Biotechnology:A Comprehensive Desk Reference(Myers ed.,1995)；Huston et al.,1993,Cell Biophysics 22:189-224；Plückthun and Skerra,1989,Meth.Enzymol.178:497-515；and Day,Advanced Immunochemistry(2d ed.1990)中所述的。本发明提供的抗体可以是免疫球蛋白分子的任何类型(如IgG，IgE，IgM，IgD和IgA型等)或任何亚类(如IgG1，IgG2，IgG3，IgG4，IgA1和IgA2型等)。

术语“施用”是指例如通过粘膜，肌内/皮下注射，静脉注射或以本领域已知的其他物理方式将体外物质(如本文所述的脂质纳米颗粒组合物)递送至患者的行为。当用于治疗疾病、病症、病状或其症状时，通常在疾病、病症、病状或其症状发作后进行物质的施用。当用于预防疾病、病症、病状或症状时，通常在疾病、病症、病状或症状发作之前进行物质的施用。

“慢性”给药是指与急性给药模式相反的，以连续模式(如持续一段时间如几天、几周、几个月或几年)给药，以在延长的一段时间维持初始治疗效果(活性)。“间歇性”给药不是连续进行而是周期性的，不会中断治疗。

术语“靶向递送”或动词形式的“靶”是指促进递送的试剂(例如本文所述的脂质纳米颗粒组合物中的治疗有效载荷分子)到达特定器官，组织，细胞和/或细胞内区室(称为目标位置)的过程，使的目标位置比任何其他的器官，组织，细胞或细胞内区室(称为非目标位置)递送的更多。靶向递送可以通过本领域已知的方法来检测，例如通过比较全身给药后靶细胞群体中递送的试剂的浓度与非靶细胞群体中递送的试剂的浓度。在某些实施方案中，与非靶标位置相比，靶向递送导致在靶标位置的浓度高至少2倍。

“有效量”通常是足以降低症状的严重性和/或频率，消除症状和/或根本病因，防止症状和/或其病因的发生，和/或改善或补救损害的量。由疾病，病症或病状引起或与之相关的疾病包括感染和瘤的形成等。在一些实施方案中，有效量是治疗有效量或预防有效量。

如本文所述的，术语“治疗有效量”是指足以降低和/或改善给定疾病、病症或病状相关症状(如由病毒感染引起的传染性疾病，或癌症的肿瘤性疾病等)的严重性和/或持续时间的试剂(如疫苗组合物)的量。本公开内容的物质/分子/试剂(如本文所述的脂质纳米颗粒组合物)的“治疗有效量”可以根据诸如个体的疾病状态、年龄、性别和体重等因素，以及物质/分子/试剂在个体中引起所需反应的能力等而变化。治疗有效量包括该物质/分子/试剂的任何毒性或有害作用均被治疗的有益作用所抵消的量。在某些实施方案中，术语“治疗有效量”是指在受试者或哺乳动物中，能够有效“治疗”疾病、病症或病状的脂质纳米颗粒组合物或其中包含的治疗或预防剂(如治疗性mRNA)的量。

“预防有效量”是当给予受试者时将具有预期的预防作用的量，例如，预防、延迟或减少疾病、病症以及相关症状(如由病毒感染引起的传染性疾病或诸如癌症的肿瘤性疾病)的发作(或复发)可能性的药物组合物的量。状况或相关症状。通常但不是必须的，因为在疾病、病症或病状之前或较早阶段在受试者中使用预防剂量，所以预防有效量可以小于治疗有效量。完全的治疗或预防作用不一定通过给药一个剂量而发生，而可能仅在给药一系列剂量后才发生。因此，可以一次或多次施用来施用治疗或预防有效量。

术语“预防”是指降低患疾病、病症、病状或相关症状(例如传染病，例如由病毒感染或肿瘤性疾病，例如癌症)的可能性。

术语“管理”，是指受试者从治疗(例如预防剂或治疗剂)中获得的有益效果，其不会导致疾病的治愈。在某些实施方案中，向受试者施用一种或多种疗法(例如预防或治疗剂，例如本文所述的脂质纳米颗粒组合物)以“管理”感染性或赘生性疾病的一种或多种症状，从而预防疾病的进展或恶化。

术语“预防剂”是指可以在受试者中完全或部分抑制疾病和/或与其相关的症状的发展、复发、发作或扩散的任何药剂。

术语“治疗剂”是指可用于治疗、预防或减轻疾病、病症或病状，包括用于治疗、预防或减轻疾病、病症或病状及相关症状的一种或多种症状的任何药物。

术语“疗法”是指可用于预防、控制、治疗和/或改善疾病、病症或病状的任何方案、方法和/或药剂。在某些实施方案中，术语““疗法”是指可用于预防、控制、治疗和/或改善已知的疾病、病症或病状的生物疗法、支持疗法和/或其他疗法等本领域技术人员如医务人员已知的疗法。

“预防有效的血清滴度”是受试者(例如人)中抗体的血清滴度，其完全或部分抑制疾病、病症或病状及与之有关的症状的发展、复发、发作或扩散。

在某些实施方案中，“治疗有效的血清滴度”是受试者(例如人)中抗体的血清滴度，其降低了与疾病、病症或病状相关的严重性、持续时间和/或症状。

术语“血清滴度”是指来自多个样品(例如在多个时间节点)的受试者或至少10，至少20，至少40个受试者，至多约100、1000或者更多的受试者人群中的平均血清滴度。

术语“副作用”涵盖疗法(如预防剂或治疗剂)的不希望的和/或不利的作用。有害的影响不一定是不利的。治疗(例如预防剂或治疗剂)的不利影响可能是有害的、不舒服的或有风险的。副作用的例子包括腹泻、咳嗽、肠胃炎、喘息、恶心、呕吐、厌食、腹部绞痛、发烧、疼痛、体重减轻、脱水、脱发、呼吸困难、失眠、头晕、粘膜炎、神经和肌肉效应、疲劳、口干、食欲不振、给药部位出现皮疹或肿胀，类似流感的症状如发烧、发冷、疲倦、消化道问题和过敏反应等。患者经历的其他不期望的作用在本领域中是已知的，在Physician’s DeskReference(68th ed.2014)中进行了相关介绍。

术语“受试者”和“患者”可以互换使用。如本文所述的，在某些实施方案中，受试者是哺乳动物，例如非灵长类动物(如牛、猪、马、猫、狗、大鼠等)或灵长类动物(如猴和人)。在特定的实施方案中，受试者是人。在一个实施方案中，受试者是患有传染病或赘生性疾病的哺乳动物(例如人)。在另一个实施方案中，所述受试者是处于发生传染病或赘生性疾病风险的哺乳动物(例如人)。

术语“老年人”是指65岁以上的人。术语“成人”或“成年人”是指18岁以上的人。术语“人类儿童”是指1岁至18岁的人类。术语“人类幼儿”是指1岁至3岁的人类。术语“人类婴儿”是指新生儿至1岁的人类。

术语“可检测探针”是指提供可检测信号的组合物。该术语包括但不限于通过其活性提供可检测信号的任何荧光团、发色团、放射性标记、酶、抗体或抗体片段等。

术语“可检测剂”是指可用于确定样品或受试者中所需分子的存在的物质，如由本文所述的mRNA分子编码的抗原。可检测剂可以是能够被可视化的物质，或者是可被确定和/或测量(如通过定量)的物质。

“基本上全部”是指至少约60％，至少约65％，至少约70％，至少约75％，至少约80％，至少约85％，至少约90％，至少约95％，至少约98％，至少约99％或约100％。

如本文所述的，除非另有说明，否则术语“大约”或“近似”是指对于由本领域的普通技术人员确定的特定值的可接受的误差，其部分取决于该值的测量或确定方式。在某些实施例中，术语“大约”或“大约”是指在1、2、3或4个标准偏差之内。在某些实施例中，术语“大约”或“近似”是指在给定值或范围的20％，15％，10％，9％，8％，7％，6％，5％，4％，3％，2％，1％，0.5％，0.05％之内或更少。

除非上下文另外明确指出，否则本文所用的单数术语“一个”，“一种”和“该”包括其复数形式。

本说明书中引用的所有出版物、专利申请、登录号和其他参考文献均通过引用全文的方式并入本文，每个单独的出版物或专利申请均被明确地并单独地通过引用并入。本文讨论的公开的出版物是在本申请的提交日期之前公开的出版物。本文中的任何内容均不得解释为承认本发明无权凭借在先发明而早于此类出版物。此外，本文提供的发布日期可能与实际发布日期不同，实际的发布日期可能需要独立确认。

本发明了已经描述了多个实施例。然而，将理解的是，在不脱离本发明的主旨构思和范围的情况下可以做出各种修改。因此，实验部分和实施例中的描述旨在说明而非限制权利要求中描述的发明范围。

6.3治疗性核酸

一方面，本文提供用于控制、预防和治疗冠状病毒感染的治疗性核酸分子。在一些实施方案中，治疗性核酸编码肽或多肽，其在施用于需要其的施用对象时，由受试者中的细胞表达以产生编码的肽或多肽。在一些实施方案中，治疗性核酸分子是DNA分子。在其他实施方案中，治疗性核酸分子是RNA分子。在特定的实施方案中，治疗性核酸分子是mRNA分子。

在一些实施方案中，将治疗性核酸分子配制在疫苗组合物中。在一些实施方案中，疫苗组合物是本文所述的基因疫苗。在一些实施方案中，疫苗组合物包含本文所述的mRNA分子。

在一些实施方案中，本公开的mRNA分子编码目的肽或多肽，包括任何天然或非天然存在的或另外修饰的多肽。由mRNA编码的肽或多肽可以具有任何大小，并且可以具有任何二级结构或活性。在一些实施方案中，当在细胞中表达时，由mRNA有效载荷编码的多肽可以具有治疗作用。

在一些实施方案中，本公开的mRNA分子包含至少一个编码目的肽或多肽的编码区(如开放阅读框(ORF))。在一些实施方案中，核酸分子进一步包含至少一个非翻译区(UTR)。在特定实施例中，非翻译区(UTR)位于编码区的上游(5'端)，在本文中称为5'-UTR。在特定实施例中，非翻译区(UTR)位于编码区的下游(3'端)，在本文中称为3'-UTR。在特定的实施方案中，核酸分子同时包含5'-UTR和3'-UTR。在一些实施例中，5’-UTR包括5’-帽结构。在一些实施方案中，核酸分子包含Kozak序列(例如，在5'-UTR中)。在一些实施方案中，核酸分子包含poly-A区域(例如在3'-UTR中)。在一些实施方案中，核酸分子包含聚腺苷酸信号(例如在3'-UTR中)。在一些实施方案中，核酸分子包含保守区(如在3'-UTR中)。在一些实施方案中，核酸分子包含二级结构。在一些实施方案中，二级结构是茎环。在一些实施方案中，核酸分子包含茎环序列(如，在5’-UTR和/或3’-UTR中)。在一些实施方案中，核酸分子包含一个或多个能够在剪接过程中被切除的内含子区域。在一个具体的实施方案中，核酸分子包含一个或多个选自5'-UTR和编码区的区域。在一个具体的实施方案中，核酸分子包含一个或多个选自编码区和3'-UTR的区域。在一个具体的实施方案中，核酸分子包含一个或多个选自5'-UTR、编码区和3'-UTR的区域。

6.3.1编码区

在一些实施方案中，本公开的核酸分子包含至少一个编码区。在一些实施方案中，编码区是编码单个肽或蛋白质的开放阅读框(ORF)。在一些实施方案中，编码区包含至少两个ORF，每个ORF编码肽或蛋白质。在编码区包含一个以上ORF的实施方案中，所述ORF编码的肽和/或蛋白质可以彼此相同或不同。在一些实施例中，编码区域中的多个ORF被非编码序列分开。在特定的实施方案中，分开两个ORF的非编码序列包含内部核糖体进入位点(IRES)。

可以预期的是，内部核糖体进入位点(IRES)可以充当唯一的核糖体结合位点，或充当mRNA的多个核糖体结合位点之一。含有一个以上功能性核糖体结合位点的mRNA分子，可以编码由核糖体独立翻译的几种肽或多肽(如多顺反子mRNA)。因此，在一些实施方案中，本公开的核酸分子(如mRNA)包含一个或多个内部核糖体进入位点(IRES)。可以结合本公开使用的IRES序列的实例，包括但不限于，来自微瘤病毒(如FMDV)、害虫病毒(CFFV)、脊髓灰质炎病毒(PV)、脑心肌炎病毒(ECMV)、手足口病毒(FMDV)、丙型肝炎病毒(HCV)、经典猪瘟病毒(CSFV)、鼠白血病病毒(MLV)、猿猴免疫缺陷病毒(SIV)或麻痹病毒(CrPV)的序列。

在各种实施方案中，本发明的核酸分子编码至少1、2、3、4、5、6、7、8、9、10或超过10个肽或蛋白质。核酸分子编码的肽和蛋白质可以相同或不同。在一些实施方案中，本公开的核酸分子编码二肽(如肌肽和鹅肌肽)。在一些实施方案中，核酸分子编码三肽。在一些实施方案中，核酸分子编码四肽。在一些实施方案中，核酸分子编码五肽。在一些实施方案中，核酸分子编码六肽。在一些实施方案中，核酸分子编码七肽。在一些实施方案中，核酸分子编码八肽。在一些实施方案中，核酸分子编码九肽。在一些实施方案中，核酸分子编码十肽。在一些实施方案中，核酸分子编码具有至少约15个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约50个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约100个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约150个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约300个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约500个氨基酸的肽或多肽。在一些实施方案中，核酸分子编码具有至少约1000个氨基酸的肽或多肽。

在一些实施方案中，本公开的核酸分子的长度为至少约30个核苷酸(nt)。在一些实施方案中，核酸分子的长度为至少约35nt。在一些实施方案中，核酸分子的长度为至少约40nt。在一些实施方案中，核酸分子的长度为至少约45nt。在一些实施方案中，核酸分子的长度为至少约50nt。在一些实施方案中，核酸分子的长度为至少约55nt。在一些实施方案中，核酸分子的长度为至少约60nt。在一些实施方案中，核酸分子的长度为至少约65nt。在一些实施方案中，核酸分子的长度为至少约70nt。在一些实施方案中，核酸分子的长度为至少约75nt。在一些实施方案中，核酸分子的长度为至少约80nt。在一些实施方案中，核酸分子的长度为至少约85nt。在一些实施方案中，核酸分子的长度为至少约90nt。在一些实施方案中，核酸分子的长度为至少约95nt。在一些实施方案中，核酸分子的长度为至少约100nt。在一些实施方案中，核酸分子的长度为至少约120nt。在一些实施方案中，核酸分子的长度为至少约140nt。在一些实施方案中，核酸分子的长度为至少约160nt。在一些实施方案中，核酸分子的长度为至少约180nt。在一些实施方案中，核酸分子的长度为至少约200nt。在一些实施方案中，核酸分子的长度为至少约250nt。在一些实施方案中，核酸分子的长度为至少约300nt。在一些实施方案中，核酸分子的长度为至少约400nt。在一些实施方案中，核酸分子的长度为至少约500nt。在一些实施方案中，核酸分子的长度为至少约600nt。在一些实施方案中，核酸分子的长度为至少约700nt。在一些实施方案中，核酸分子的长度为至少约800nt。在一些实施方案中，核酸分子的长度为至少约900nt。在一些实施方案中，核酸分子的长度为至少约1000nt。在一些实施方案中，核酸分子的长度为至少约1100nt。在一些实施方案中，核酸分子的长度为至少约1200nt。在一些实施方案中，核酸分子的长度为至少约1300nt。在一些实施方案中，核酸分子的长度为至少约1400nt。在一些实施方案中，核酸分子的长度为至少约1500nt。在一些实施方案中，核酸分子的长度为至少约1600nt。在一些实施方案中，核酸分子的长度为至少约1700nt。在一些实施方案中，核酸分子的长度为至少约1800nt。在一些实施方案中，核酸分子的长度为至少约1900nt。在一些实施方案中，核酸分子的长度为至少约2000nt。在一些实施方案中，核酸分子的长度为至少约2500nt。在一些实施方案中，核酸分子的长度为至少约3000nt。在一些实施方案中，核酸分子的长度为至少约3500nt。在一些实施方案中，核酸分子的长度为至少约4000nt。在一些实施方案中，核酸分子的长度为至少约4500nt。在一些实施方案中，核酸分子的长度为至少约5000nt。

在特定的实施方案中，本发明的治疗性核酸被制备成本文所述的疫苗组合物(如基因疫苗)。在一些实施方案中，治疗性核酸包含编码能够引发针对一种或多种靶病症或疾病免疫力的肽或蛋白的核酸。在一些实施方案中，目标症状与例如冠状病毒(例如COVID-19)、流感、麻疹、人乳头瘤病毒(HPV)、狂犬病、脑膜炎、百日咳、破伤风、鼠疫、肝炎和肺结核等病原体或其引发的感染相关。在一些实施方案中，治疗性核酸包含编码病原体特征性病原蛋白或其抗原性片段或表位的核酸序列(如mRNA)。疫苗在接种给受试者后，表达编码的病原蛋白(或其抗原性片段或表位)，从而在受试者中引发针对病原体的免疫力。

在特定的实施方案中，本文提供了用于控制、预防和治疗由冠状病毒引起的感染性疾病或病症的治疗性组合物(例如疫苗组合物)。冠状病毒属于套式病毒目(Nidoviralesn)冠状病毒科(Coronaviridae)，冠状病毒科分为四个属：α-冠状病毒，β-冠状病毒，γ-冠状病毒和δ-冠状病毒。其中，α-和β-冠状病毒感染哺乳动物，γ-冠状病毒感染禽类，而δ-冠状病毒感染哺乳动物和禽类。代表性的α冠状病毒包括人冠状病毒NL63(HCoV-NL63)、猪传染性胃肠炎冠状病毒(TGEV)、PEDV和猪呼吸道冠状病毒(PRCV)。代表性的β冠状病毒包括SARS-CoV、MERS-CoV、蝙蝠冠状病毒HKU4，小鼠肝炎冠状病毒(MHV)、牛冠状病毒(BCoV)和人冠状病毒OC43。代表性的γ-和δ-冠状病毒分别包括禽传染性支气管炎冠状病毒(IBV)和猪δ-冠状病毒(PdCV)。Li et al.Annu Rev Virol.2016 3(1):237-261.

冠状病毒是被包膜的正链RNA病毒。它们具有大的基因组，通常范围从27到32kb。基因组堆积在由核衣壳(N)蛋白形成的螺旋衣壳内部，并进一步被核衣壳包围。与病毒衣壳相关的是至少三种结构蛋白：膜(M)蛋白和包膜(E)蛋白参与病毒装配，而刺突(S)蛋白介导病毒进入宿主细胞。一些冠状病毒还编码与衣壳相关血凝素酯酶(HE)蛋白。在这些结构蛋白中，刺突蛋白从病毒表面形成较大的突起，使冠状病毒看起来像冠状。除了介导病毒进入外，刺突蛋白还可以在确定病毒宿主范围和组织嗜性方面发挥作用，并且是宿主免疫应答的主要诱导剂。Li et al.Annu Rev Virol.2016 3(1):237-261.

因此，在一些实施方案中，本文提供了编码源自冠状病毒的病毒肽或蛋白质的治疗性核酸。在一些实施方案中，核酸编码衍生自冠状病毒的病毒肽或蛋白质，其中病毒肽或蛋白质选自以下的一种或多种：(a),N蛋白；(b),M蛋白；(c),E蛋白；(d),S蛋白；(e),HE蛋白；(f),(a)至(e)中任一项的免疫原性片段；和(g),(a)至(f)中任一项的功能衍生物。

冠状病毒S蛋白包含三个区段：胞外域，跨膜结构域和胞质域。进一步预期胞外域包含受体结合亚基S1和膜融合亚基S2。S1亚基还包含两个主要结构域：N端结构域(S1-NTD)和C端结构域(S1-CTD)。进一步考虑到，S1亚基中的这些结构域中的一个或两个可以与宿主细胞上的受体结合，并起受体结合结构域(RBD)的作用。特别是，进一步考虑被S1亚基中任一域识别的宿主受体包括血管紧张素转化酶2(ACE2)、氨肽酶N(APN)、二肽基肽酶4(DPP4)、癌胚抗原相关细胞粘附分子1(CEACAM1)和糖。进一步考虑到S1-CTD包含两个亚结构域：核心结构和受体结合基序(RBM)。RBM与宿主细胞上的ACE2受体结合。

因此，在一些实施方案中，本公开的治疗性核酸编码冠状病毒S蛋白、或S蛋白的免疫原性片段、或S蛋白的功能性衍生物或其免疫原性片段。在特定的实施方案中，S蛋白的免疫原性片段选自胞外域、S1亚基、受体结合域(RBD)和受体结合基序(RBM)。在其他实施方案中，S蛋白的免疫原性片段选自跨膜结构域，胞质域、S2亚基、S1-NTD结构域和S1-CTD结构域。表1显示了示例性的SARS-CoV-2天然抗原序列。

表1.SARS-CoV-2天然抗原序列示例

在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白，其中所述S蛋白具有SEQ ID NO：2所示的氨基酸序列。在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白，并且其中治疗性核酸包含SEQ ID NO：3所示的DNA编码序列。在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白，并且其中治疗性核酸包含从SEQ ID NO：3所示的DNA编码序列转录的RNA序列。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的胞外域(ECD)，并且其中胞外域具有SEQ ID NO：4所示的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的ECD，并且其中治疗性核酸包含SEQ ID NO：5所示的DNA编码序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的ECD，并且其中治疗性核酸包含从SEQ ID NO：5所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的S1亚基，并且其中所述S1亚基具有SEQ ID NO：6所示的氨基酸序列。在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的S1亚基，并且其中治疗性核酸包含SEQ ID NO：7所示的DNA编码序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的S1亚基，并且其中治疗性核酸包含从SEQ ID NO：7所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的免疫原性片段。在一些实施方案中，免疫原性片段是冠状病毒SARS-CoV-2的S蛋白的受体结合结构域(RBD)。在一些实施方案中，本公开的治疗性核酸编码位于S蛋白的残基319-541的RBD序列，并且具有SEQ ID NO：8所示的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含SEQ ID NO：9所示的DNA编码序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含从SEQ ID NO：9所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码位于冠状病毒SARS-CoV-2的S蛋白的残基331-529的RBD序列，并具有SEQ ID NO：10所示的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含SEQ ID NO：11所示的DNA编码序列。在特定实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含从SEQ ID NO：11所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中RBD序列位于S蛋白的残基331-524处，并具有SEQ ID NO：12所示的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含SEQ ID NO：13所示的DNA编码序列。在特定实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含从SEQ ID NO：13所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中RBD结构域位于S蛋白的残基319-529，并具有SEQ ID NO：14所示的氨基酸序列。在特定实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含SEQ ID NO：15所示的的DNA编码序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBD序列，并且其中治疗性核酸包含从SEQ ID NO：15所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的受体结合基序(RBM)序列，并且其中RBM具有SEQ ID NO：16所示的氨基酸序列。在特定实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBM，并且其中治疗性核酸包含SEQ ID NO：17所示的DNA编码序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的RBM，并且其中治疗性核酸包含从SEQ ID NO：17所示的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在一些实施方案中，本公开的治疗性核酸编码RBD的功能衍生物。在特定的实施方案中，RBD的功能衍生物包含一种或多种突变，与没有这种突变的RBD相比，其增加了RBD对宿主受体的结合亲和力。在特定的实施方案中，冠状病毒是SARS-CoV，并且其中突变是K479N和/或S487T。

在特定实施方案中，冠状病毒是SARS-CoV-2，并且其中突变是N501T。表2显示具有N501T突变的冠状病毒SARS-CoV-2的S蛋白或其抗原片段的示例性序列。

表2突变的冠状病毒SARS-CoV-2抗原序列示例

在特定的实施方案中，治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的功能衍生物。在特定的实施方案中，S蛋白的功能衍生物包含氨基酸取代N501T。在特定实施方案中，S蛋白的功能衍生物包含SEQ ID NO：20所示的氨基酸序列。

在特定的实施方案中，治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的胞外域的功能性衍生物。在特定的实施方案中，S蛋白胞外域的功能衍生物包含氨基酸取代N501T。在特定实施方案中，S蛋白胞外域的功能衍生物包含SEQ ID NO：21所示的氨基酸序列。

在特定的实施方案中，治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的S1亚基的功能衍生物。在特定的实施方案中，S蛋白S1亚基的功能衍生物包含氨基酸取代N501T。在特定的实施方案中，S蛋白S1亚基的功能衍生物包含SEQ ID NO：22所示的氨基酸序列。

在特定的实施方案中，治疗性核酸编码冠状病毒SARS-CoV-2的S蛋白的受体结合结构域(RBD)序列的功能衍生物。在特定实施方案中，S蛋白RBD序列的功能衍生物包含氨基酸取代N501T。在特定实施方案中，S蛋白RBD序列的功能衍生物包含氨基酸序列SEQ ID NO：23，SEQ ID NO：24，SEQ ID NO：25或SEQ ID NO：26。在特定实施方案中，编码冠状病毒SARS-CoV-2的S蛋白的RBD序列的功能衍生物的治疗性核酸包含SEQ ID NO：27所示的DNA编码序列。在特定实施方案中，编码冠状病毒SARS-CoV-2的S蛋白的RBD序列的功能衍生物的治疗性核酸包含从SEQ ID NO：27所示的DNA编码序列转录的RNA序列。在特定的实施方案中，RNA序列是体外转录的。在特定的实施方案中，治疗性核酸是mRNA分子。

在冠状病毒刺突结构中，三个S1头位于三聚S2茎的顶部。在两个主要的S1域之间，S1-CTD位于尖峰的顶部，而S1-NTD直接接触并在结构上约束S2。因此，在一些实施方案中，本公开的治疗性核酸编码S蛋白的功能衍生物。在一些实施方案中，治疗性核酸编码包含与三聚化肽融合的S蛋白或其片段的融合蛋白，使得该融合蛋白能够形成包含三拷贝的S蛋白或其片段的三聚体复合物。在一些实施方案中，治疗性核酸编码包含与三聚化肽融合的S蛋白的胞外域的融合蛋白，其中所述融合蛋白能够形成包含三拷贝的胞外域的三聚体复合物。在一些实施方案中，治疗性核酸编码包含与三聚化肽融合的S蛋白的RBD的融合蛋白，其中所述融合蛋白能够形成包含三个拷贝的RBD的三聚体复合物。在一些实施方案中，治疗性核酸编码包含与三聚化肽融合的S1-CTD的融合蛋白，其中所述融合蛋白能够形成包含三拷贝的S1-CTD的三聚体复合物。在一些实施方案中，S蛋白或其片段通过肽接头与三聚化肽融合。表3显示了可与本公开结合使用的示例性三聚化肽和接头肽，以及融合蛋白的序列。

表3示例性接头肽，三聚化肽，以及冠状病毒SARS-CoV-2抗原序列。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含冠状病毒SARS-CoV-2的S蛋白或其功能衍生物与三聚体化肽(三聚肽)融合。在一些实施方案中，S蛋白和三聚肽之间的融合是通过肽接头。在特定的实施方案中，S蛋白或其功能衍生物包含氨基酸序列SEQ ID NO：2或SEQ ID NO：20。在具体的实施方案中，肽接头包含SEQ ID NO：28的氨基酸序列。在一些实施方案中，三聚肽包含SEQ ID NO：30的氨基酸序列。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的冠状病毒SARS-CoV-2的S蛋白的胞外域(ECD)或其功能性衍生物。在一些实施方案中，S蛋白的胞外域与三聚化肽之间的融合是通过肽接头。在特定的实施方案中，S蛋白胞外域或其功能衍生物包含SEQ ID NO：4或SEQ ID NO：21的氨基酸序列。在具体的实施方案中，肽接头包含SEQ ID NO：28的氨基酸序列。在一些实施方案中，三聚化肽包含SEQ ID NO：30的氨基酸序列。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的冠状病毒SARS-CoV-2的S蛋白的胞外域或其功能性衍生物。在特定的实施方案中，融合蛋白具有SEQ ID NO：32的氨基酸序列。在特定的实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的SARS-CoV-2的S蛋白的胞外域，其中所述核酸包含SEQ ID NO：33的DNA编码序列。在特定实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的SARS-CoV-2的S蛋白的胞外域，其中所述核酸包含从SEQ IDNO：33的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的冠状病毒SARS-CoV-2的S蛋白的S1亚基或其功能性衍生物。在一些实施方案中，S蛋白的胞外域与三聚化肽之间的融合是通过肽接头。在特定的实施方案中，S蛋白的S1亚基或其功能衍生物包含氨基酸序列SEQ ID NO：6或SEQ ID NO：22。在具体的实施方案中，肽接头包含SEQ ID NO：28的氨基酸序列。在一些实施方案中，三聚化肽包含SEQ ID NO：30的氨基酸序列。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的冠状病毒SARS-CoV-2的S蛋白的受体结合结构域(RBD)序列或其功能性衍生物。在一些实施方案中，S蛋白的RBD序列和三聚化肽之间的融合是通过肽接头。在特定的实施方案中，S蛋白或其功能衍生物的RBD序列包含选自SEQ ID NOS：8、10、12、14、23、24、25和26的氨基酸序列。在特定的实施方案中，肽接头包含SEQ ID NO：28的氨基酸序列。在一些实施方案中，三聚化肽包含SEQ ID NO：30的氨基酸序列。

在特定的实施方案中，治疗性核酸编码包含与三聚体化肽融合的SARS-CoV-2的S蛋白的RBD序列的融合蛋白，其中所述融合蛋白具有SEQ ID NO：34的氨基酸序列。在特定的实施方案中，治疗性核酸编码包含与三聚体化肽融合的SARS-CoV-2的S蛋白的RBD的融合蛋白，其中所述核酸包含SEQ ID NO：35的DNA编码序列。在特定的实施方案中，治疗性核酸编码包含与三聚体化肽融合的SARS-CoV-2的S蛋白的RBD的融合蛋白，其中所述核酸包含从SEQ ID NO：35的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在一些实施方案中，治疗性核酸编码融合蛋白，所述融合蛋白包含与三聚体化肽融合的冠状病毒SARS-CoV-2的S蛋白的受体结合基序(RBM)序列或其功能性衍生物。在一些实施方案中，S蛋白的RBM序列和三聚化肽之间的融合是通过肽接头。在特定的实施方案中，S蛋白或其功能衍生物的RBM序列包含SEQ ID NO：16的氨基酸序列。在具体的实施方案中，肽接头包含SEQ ID NO：28的氨基酸序列。在一些实施方案中，三聚化肽包含SEQ ID NO：30的氨基酸序列。

可以预期的是冠状病毒的N蛋白包含N端结构域(N-NTD)和C端结构域(N-CTD)，其间散布有几个固有无序区(intrinsically disordered regions，IDR)。例如，SARS-CoV N蛋白分别在残基1-44、182-247和366-422处具有三个IDR，在残基45-181处具有N-NTD，在残基248-365处具有N-CTD。

因此，在一些实施方案中，本发明的治疗性核酸编码冠状病毒N蛋白、或N蛋白的免疫原性片段、或N蛋白的功能性衍生物或其免疫原性片段。在特定的实施方案中，治疗性核酸编码全长N蛋白。在特定的实施方案中，治疗性核酸编码选自N-NTD、N-CTD和IDR的N蛋白的一个或多个免疫原性片段。

在特定的实施方案中，本公开的治疗性核酸编码冠状病毒SARS-CoV-2的核衣壳(N)蛋白，并且其中N蛋白具有SEQ ID NO：18的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的N蛋白，并且其中治疗性核酸包含SEQ ID NO：19的DNA编码序列。在特定实施方案中，本发明的治疗性核酸编码冠状病毒SARS-CoV-2的N蛋白，并且其中治疗性核酸包含从SEQ ID NO：19的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

可以预期的是包含与免疫球蛋白Fc区融合的病毒肽或多肽的融合蛋白可以增强病毒肽或多肽的免疫原性。因此，在一些实施方案中，本公开的治疗性核酸分子编码融合蛋白，所述融合蛋白包含冠状病毒的病毒肽或衍生自冠状病毒的病毒肽与免疫球蛋白的Fc区融合的蛋白。在特定实施方案中，病毒肽或蛋白质是选自以下的一种或多种：(a)N蛋白，(b)M蛋白，(c)E蛋白，(d)S蛋白，(e)HE蛋白，(f)(a)至(e)中任一项的免疫原性片段，和(g)(a)至(f)中任一项的功能衍生物。在特定的实施方案中，免疫球蛋白是人免疫球蛋白(Ig)。在特定的实施方案中，免疫球蛋白是人IgG、IgA、IgD、IgE或IgM。在特定的实施方案中，免疫球蛋白是人IgG1、IgG2、IgG3或IgG4。在一些实施方案中，免疫球蛋白Fc融合至病毒肽或多肽的N末端。在其他实施方案中，免疫球蛋白Fc融合至病毒肽或多肽的C末端。

可以预期的是信号肽可以介导与其融合的多肽向细胞特定位置的运输。因此，在一些实施方案中，本公开的治疗性核酸分子编码包含病毒肽或与信号肽融合的融合蛋白。在特定实施方案中，病毒肽或蛋白质是选自以下的一种或多种：(a)N蛋白，(b)M蛋白，(c)E蛋白，(d)S蛋白，(e)HE蛋白，(f)(a)至(e)中任一项的免疫原性片段，和(g)(a)至(f)中任一项的功能衍生物。在一些实施方案中，信号肽与病毒肽或多肽的N末端融合。在其他实施方案中，信号肽与病毒肽或多肽的C末端融合。表4显示了可与本公开结合使用的信号肽的示例性序列，以及包含信号肽的示例性SARS-CoV-2抗原序列。

表4信号肽和SARS-CoV-2抗原序列

在特定的实施方案中，信号肽是由冠状病毒的病毒肽或多肽的编码基因所编码的。在特定的实施方案中，由冠状病毒的基因编码的信号肽与由冠状病毒的不同基因编码的病毒肽或多肽融合。在其他实施方案中，由冠状病毒的基因编码的信号肽与由冠状病毒的相同基因编码的病毒肽或多肽融合。例如，在一些实施方案中，将具有MFVFLVLLPLVSS的氨基酸序列(SEQ ID NO：36)的信号肽融合至由本公开的核酸分子编码的病毒肽或多肽。在各种实施方案中，病毒肽或蛋白质选自以下的一种或多种：(a)N蛋白，(b)M蛋白，(c)E蛋白，(d)S蛋白，(e)HE蛋白，(f)(a)至(e)中任一项的免疫原性片段，和(g)(a)至(f)中任一项的功能衍生物。

在特定的实施方案中，本公开的治疗性核酸编码无天然信号肽的冠状病毒SARS-CoV-2的S蛋白。在特定的实施方案中，编码的S蛋白包含SEQ ID NO：40的氨基酸序列。在特定的实施方案中，本公开的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白，并且其中治疗性核酸包含SEQ ID NO：41的DNA编码序列。在特定的实施方案中，本公开的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白，并且其中治疗性核酸包含从SEQID NO：41的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的胞外域(ECD)。在特定的实施方案中，编码的S蛋白的胞外域包含SEQ IDNO：42的氨基酸序列。在特定实施方案中，本公开的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的胞外域，并且其中治疗性核酸包含SEQ ID NO：43的DNA编码序列。在特定实施方案中，本发明的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的胞外域，并且其中治疗性核酸包含从SEQ ID NO：43的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在特定的实施方案中，本发明的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的S1亚基。在特定的实施方案中，编码的S蛋白的S1亚基包含SEQ ID NO：44的氨基酸序列。在特定的实施方案中，本发明的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的S1亚基，并且其中治疗性核酸包含SEQ ID NO：45的DNA编码序列。在特定实施方案中，本公开的治疗性核酸编码具有信号肽的冠状病毒SARS-CoV-2的S蛋白的S1亚基，并且其中治疗性核酸包含从SEQ ID NO：45的DNA编码序列转录的RNA序列。在一些实施方案中，RNA序列是体外转录的。在特定的实施方案中，核酸分子是mRNA分子。

在其他实施方案中，信号肽由不存在于病毒肽或多肽来源的冠状病毒的外源基因序列编码。在一些实施方案中，异源信号肽替换由本发明的核酸分子编码的融合蛋白中的同源信号肽。在特定的实施方案中，信号肽由哺乳动物基因编码。在特定的实施方案中，信号肽由人免疫球蛋白基因编码。在特定的实施方案中，信号肽由人IgE基因编码。例如，在一些实施方案中，将具有MDWTWILFLVAAATRVHS的氨基酸序列(SEQ ID NO：38)的信号肽融合至由本公开的核酸分子编码的病毒肽或多肽。在各种实施方案中，病毒肽或蛋白质是选自以下的一种或多种：(a)N蛋白，(b)M蛋白，(c)E蛋白，(d)S蛋白，(e)HE蛋白，(f)(a)至(e)中任一项的免疫原性片段，和(g)(a)至(f)中任一项的功能衍生物。

6.3.2 5'-帽结构

可以预期的是，多核苷酸的5'-帽结构参与核输出并提高多核苷酸稳定性，并结合细胞中负责多核苷酸稳定性的mRNA帽结合蛋白(CBP)。通过CBP与poly-A结合蛋白的结合形成成熟的环状mRNA，从而获得翻译能力。5'-帽结构在mRNA剪接过程中进一步协助去除5'端内含子。因此，在一些实施方案中，本公开的核酸分子包含5'-帽。

核酸分子可能被细胞的内源性转录机制5'端封端，从而在鸟嘌呤帽末端残基与多核苷酸的5'端转录有义核苷酸之间产生5'-ppp-5'-三磷酸键。然后这个5'-鸟苷酸帽甲基化以生成N7-甲基-鸟苷酸残基。多核苷酸5’末端的末端和/或前末端转录的核苷酸的核糖也可以任选地被2’-O-甲基化。通过鸟苷酸帽结构的水解和裂解进行的5'-脱帽可以靶向核酸分子，例如mRNA分子，以进行降解。

在一些实施方案中，本公开的核酸分子包含由内源过程产生的天然5'-帽结构的一个或多个改变。对5’-帽的修饰可以增加多核苷酸的稳定性，增加多核苷酸的半衰期，并且可以提高多核苷酸的翻译效率。

对天然5’-Cap结构的示例性改变包括产生不可水解的帽结构，从而防止脱帽而增加多核苷酸的半衰期。在一些实施方案中，由于帽结构水解需要裂解5'-ppp-5'磷酸二酯键，因此在一些实施方案中，可以在封端反应期间使用修饰的核苷酸。例如，在一些实施方案中，可以根据制造商的说明书将来自New England Biolabs的牛痘菌封顶酶与α-硫代鸟苷核苷酸一起使用以在5'-ppp-5'中产生硫代磷酸酯键。也可以使用其他修饰的鸟苷核苷酸，例如α-甲基膦酸酯和硒代磷酸核苷酸。

天然5'-Cap结构的其他示例性改变还包括在封端的鸟苷三磷酸(GTP)的2'-和/或3'-位进行修饰，将糖环氧(参与碳环的氧)替换为亚甲基部分(CH₂)，帽结构的三磷酸桥部分的修饰或核碱基(G)部分的修饰。

天然5'-帽结构的其他示例性改变包括但不限于多核苷酸的5'-末端和/或5'-末端核酸的在核糖的2'-羟基上的2'-O-甲基化，可生成多核苷酸(例如mRNA分子)的多个不同的5'-帽结构。可以与本公开结合使用的另外的示例性5’-帽结构还包括在国际专利公开号WO2008127688，WO 2008016473和WO 2011015347中描述的那些，其全部内容通过引用并入本文。

在各种实施例中，5’-帽可以包括帽类似物。帽类似物，在本文中也称为合成帽类似物、化学帽、化学帽类似物或结构或功能帽类似物，在化学上不同于天然(即内源，野生型或生理学上的)5'-帽结构，同时保留帽的功能。帽类似物可以化学(即非酶促地)或酶促合成和/或连接至多核苷酸。

例如，反反向帽类似物(ARCA)帽包含两个通过5'-5'-三磷酸基团连接的鸟苷，其中一个鸟苷包含N7-甲基以及3'-O-甲基(即，N7,3'-O-二甲基-鸟苷-5'-三磷酸-5'-鸟苷，m7G-3'mppp-G，可以等效地称为3'O-Me-m7G(5')ppp(5')G)。另一个未改变的鸟苷的3'-O原子与封端的多核苷酸(例如，mRNA)的5'-末端核苷酸连接。N7-和3’-O-甲基化鸟苷提供了封端的多核苷酸(例如，mRNA)的末端部分。另一个示例性的帽结构是mCAP，其类似于ARCA，但是在鸟苷上具有2'-O-甲基(即，N7,2’-O-dimethyl-guanosine-5’-triphosphate-5’-guanosine,m.sup.7Gm-ppp-G)。

在一些实施方案中，帽类似物可以是二核苷酸帽类似物。作为非限制性实例，二核苷酸帽类似物可以在不同的磷酸位置被硼酸磷酸酯基团或磷酸硒酸酯基团修饰，例如在美国专利号：8,519,110中描述的二核苷酸帽类似物，其全部内容通过引用并入本文。

在一些实施方案中，帽类似物可以是本领域已知和/或本文描述的N7-(4-氯苯氧基乙基)取代的二核苷酸帽类似物。N7-(4-氯苯氧基乙基)取代的二核苷酸帽类似物的非限制性实例包括N7-(4-氯苯氧基乙基)-G(5')ppp(5')G和N7-(4-氯苯氧基乙基)-m3'-OG(5')ppp(5')G帽类似物(例如参见Kore et al.Bioorganic&Medicinal Chemistry 2013 21:4570-4574中所述的各种帽类似物和合成帽类似物的方法，其通过引用并入本文)。在其他实施方案中，可用于本公开内容的核酸分子的帽类似物是4-氯/溴苯氧基乙基类似物。

在各种实施方案中，帽类似物可包括鸟苷类似物。可用的鸟苷类似物包括但不限于肌苷，N1-甲基-鸟苷，2'-氟-鸟苷，7-脱氮-鸟苷，8-氧代-鸟苷，2-氨基-鸟苷，LNA-鸟苷和2-叠氮基。

可以预期的是，尽管帽类似物允许在体外转录反应中同时封端多核苷酸，但高达20％的转录物保持未封端。这与从细胞内源转录机制产生的多核苷酸的天然5'-cap结构的cap类似物的结构差异，可能导致翻译能力降低和细胞稳定性降低。

因此，在一些实施方案中，本公开内容的核酸分子也可以使用酶在转录后加帽，以产生更真实的5'-帽结构。如本文所用，短语“更真实”是指在结构上或功能上紧密反映或模仿内源或野生型特征的特征。也就是说，与现有技术的合成的或其类似物相比，“更真实”的特征代表了更好地内源性、野生型、天然或生理细胞功能和/或结构，或者其表现优于相应的内源性、野生型一种或多种方面的自然类型、自然或生理特征。与本公开内容的核酸分子结合使用的更真实的5'-帽结构的非限制性实例是那些具有增强的帽结合蛋白的结合，增加的半衰期，降低的对5'的敏感性的。与本领域已知的合成5'-帽结构(或与野生型、天然或生理学5'-帽结构)相比，β-内切核酸酶减少的5'-脱帽。例如，在一些实施方案中，重组痘苗病毒加帽酶和重组2'-O-甲基转移酶可在多核苷酸的5'-末端核苷酸和鸟苷帽核苷酸之间产生规范的5'-5'-三磷酸键。帽鸟嘌呤含有N7-甲基化，而多核苷酸的5'-末端核苷酸含有2'-O-甲基。这种结构称为Cap1结构。与例如本领域已知的其他5’帽类似物结构相比，该帽导致更高的翻译能力、细胞稳定性和减少细胞促炎细胞因子的活化。其他示例性盖帽结构包括7mG(5’)ppp(5’)N,pN2p(Cap 0),7mG(5’)ppp(5’)NlmpNp(Cap 1),7mG(5’)-ppp(5’)NlmpN2mp(Cap 2),和m(7)Gpppm(3)(6,6,2’)Apm(2’)Apm(2’)Cpm(2)(3,2’)Up(Cap 4)。

可以预期的是，本公开内容的核酸分子可以在转录后被封端，并且因为该过程更有效，所以可以把近100％的核酸分子进行封端。

6.3.3非翻译区(UTRs)

在一些实施方案中，本公开的核酸分子包含一个或多个非翻译区(UTR)。在一些实施方案中，UTR位于核酸分子编码区的上游，称为5'-UTR。在一些实施方案中，UTR位于核酸分子编码区的下游，称为3’-UTR。UTR的序列可以与核酸分子中编码区的序列同源或异源。核酸分子可包含多个UTR可，它们并且可以具有相同或不同的序列和/或遗传起源。根据本公开，可以对核酸分子中UTR的任何部分(包括没有的情况)进行密码子优化，并且可以独立地包含一个或多个不同的结构或化学修饰，在密码子优化之前和/或之后。

在一些实施方案中，本公开内容的核酸分子(如mRNA)包含彼此同源的UTR和编码区。在其他实施方案中，本公开的核酸分子(如mRNA)包含相对于彼此异源的UTR和编码区。在一些实施方案中，为了检测UTR序列的活性，可以在体外(例如细胞或组织培养物)或在体内(例如向受试者)施用包含UTR和可检测探针编码序列的核酸分子。并可以使用本领域已知的方法检测UTR序列的作用(如对表达水平的调节、编码产物的细胞定位或编码产物的半衰期)。

在一些实施方案中，本公开内容的核酸分子(如mRNA)的UTR包含至少一种翻译增强子元件(TEE)，其起增加从该核酸分子产生的多肽或蛋白质产量的作用。在一些实施方案中，TEE位于核酸分子的5'-UTR中。在其他实施方案中，TEE位于核酸分子的3'-UTR处。在其他实施方案中，至少两个TEE分别位于核酸分子的5'-UTR和3'-UTR。在一些实施方案中，本公开的核酸分子(如mRNA)可包含TEE序列的一个或多个拷贝或包含多于一个的不同TEE序列。在一些实施方案中，核酸分子中的不同TEE序列可以彼此是同源的或异源的。

本领域已知存在可以结合本公开使用的各种TEE序列。例如，在一些实施方案中，TEE可以是内部核糖体进入位点(IRES)、HCV-IRES或IRES元件。Chappell etal.Proc.Natl.Acad.Sci.USA 101:9590-9594,2004；Zhou etal.Proc.Natl.Acad.Sci.102:6273-6278,2005.。可结合本公开使用的另外的内部核糖体进入位点(IRES)，包括但不限于，美国专利号7,468,275，美国专利公开号2007/0048776和美国专利公开号2011/0124100和国际专利公开号WO2007/025008以及国际专利公开号WO2001/055369中记载的，其全部内容通过引用方式整体并入本文。在一些实施方案中，TEE可以是在Wellensiek et al Genome-wide profiling of human cap-independenttranslation-enhancing elements,Nature Methods,2013Aug；10(8):747–750的补充表1和补充表2中描述的那些，其内容通过引用的方式整体并入本文。

可以结合本公开使用的另外的示例性TEE，包括但不限于，在美国专利号6,310,197，美国专利号6,849,405，美国专利号7,456,273，美国专利号7,183,395，美国专利公开号2009/0226470，美国专利公开号2013/0177581，美国专利公开号2007/0048776，美国专利公开号2011/0124100，美国专利公开号2009/0093049，国际专利公开号WO2009/075886，国际专利公开号WO2012/009644和国际专利公开号WO1999/024595，国际专利公开号WO2007/025008，国际专利公开号WO2001/055371，欧洲专利号2610341，欧洲专利号2610340中公开的TEE序列，其全部内容通过引用的方式整体并入本文。

在各种实施方案中，本公开的核酸分子(如mRNA)包含至少一个UTR，其包含至少1，至少2，至少3，至少4，至少5，至少6，至少6 7，至少8，至少9，至少10，至少11，至少12，至少13，至少14，至少15，至少16，至少17，至少18，至少19，至少20，至少21，至少22，至少23，至少24，至少25，至少30，至少35，至少40，至少45，至少50，至少55或大于60个TEE序列的情况。在一些实施方案中，核酸分子的UTR中的TEE序列是相同TEE序列的拷贝。在其他实施方案中，核酸分子的UTR中的至少两个TEE序列具有不同的序列。在一些实施方案中，多个不同的TEE序列以一种或多种重复模式排列在核酸分子的UTR区域中。仅出于说明目的，重复模式可以是例如ABABAB，ABABBAABBAABB，ABCABCABC等，其中在这些示例性模式中，每个大写字母(A，B或C)代表不同的TEE序列。在一些实施方案中，至少两个TEE序列在核酸分子的UTR中彼此连续(即，在它们之间没有间隔序列)。在其他实施方案中，至少两个TEE序列由间隔子序列隔开。在一些实施方案中，UTR可以包含TEE序列-间隔子序列模块，其重复至少一次，至少两次，至少3次，至少4次，至少5次，至少6次，至少7次，至少8次，至少9次或9次以上。在该段落中描述的任何实施方案中，UTR可以是核酸分子的5’-UTR，3’-UTR，或5’-UTR和3’-UTR两者。

在一些实施方案中，本公开内容的核酸分子(如mRNA)的UTR包含至少一种翻译抑制元件，其功能是减少从该核酸分子产生的多肽或蛋白质的量。在一些实施方案中，核酸分子的UTR包含一种或多种被一种或多种微RNA识别的miR序列或其片段(如miR种子序列)。在一些实施方案中，核酸分子的UTR包含下调核酸分子的翻译活性的一个或多个茎环结构。抑制与核酸分子相关的翻译活性的其他机制是本领域已知的。在该段落中描述的任何实施方案中，UTR可以是核酸分子的5’-UTR，3’-UTR，或5’-UTR和3’-UTR两者。

表5非翻译区序列示例

在特定的实施方案中，本发明的核酸分子包含选自SEQ ID NO：46-51的5′-UTR。在特定的实施方案中，本发明的核酸分子包含选自SEQ ID NO：52-57的3′-UTR。在特定的实施方案中，本发明的核酸分子包含选自SEQ ID NO：46-51的5′-UTR和选自SEQ ID NO：52-57的3′-UTR。在该段落中描述的任何实施方案中，核酸分子可以进一步包含具有如第5.3.1节中所述的序列的编码区、如表1-4中的任何DNA编码序列或其等效RNA序列。在特定的实施方案中，该段中描述的核酸分子可以是体外转录的RNA分子。

6.3.4聚腺苷酸化(Poly-A)区

在天然RNA加工过程中，通常将长链腺苷核苷酸(poly-A)区添加到信使RNA(mRNA)分子中，以增加分子的稳定性。转录后，立即将转录本的3'-末端裂解以释放3'-羟基。然后，poly-A聚合酶将腺苷核苷酸链添加到RNA。该过程称为聚腺苷酸化，添加了一个长度为100至250个残基的poly-A区。可以预期的是，poly-A区可以赋予本发明的核酸分子多种优点。

因此，在一些实施方案中，本公开的核酸分子(如mRNA)包含聚腺苷酸化信号。在一些实施方案中，本公开的核酸分子(如mRNA)包含一个或多个聚腺苷酸化(poly-A)区域。在一些实施方案中，poly-A区完全由腺嘌呤核苷酸或其功能类似物组成。在一些实施方案中，核酸分子在其3’末端包含至少一个poly-A区。在一些实施方案中，核酸分子在其5’末端包含至少一个poly-A区。在一些实施方案中，核酸分子在其5'末端包含至少一个poly-A区域，在其3'末端包含至少一个poly-A区域。

根据本公开，在不同的实施例中，poly-A区域可以具有变化的长度。特别地，在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少30个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少35个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少40个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少45个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少50个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少55个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少60个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少65个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少70个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少75个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少80个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少85个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少90个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少95个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少100个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少110个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少120个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少130个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少140个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少150个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少160个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少170个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少180个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少190个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少200个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少225个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少250个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少275个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少300个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少350个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少400个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少450个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少500个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少600个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少700个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少800个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少900个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1000个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1100个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1200个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1300个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1400个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1500个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1600个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1700个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1800个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少1900个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少2000个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少2250个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少2500个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少2570个核苷酸。在一些实施方案中，本公开内容的核酸分子的poly-A区的长度为至少3000个核苷酸。

在一些实施方案中，可以基于核酸分子或其部分的总长度(如编码区的长度或开放阅读框的长度)选择核酸分子中的poly-A区的长度。例如，在一些实施例中，poly-A区域占含有多poly-A区的核酸分子的总长度的约5％，10％，15％，20％，25％，30％，35％，40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％或更多。

可以预期某些RNA结合蛋白可以结合位于mRNA分子3'端的poly-A区域。这些poly-A结合蛋白(PABP)可以调节mRNA表达，例如与细胞中的翻译起始机制相互作用和/或保护3'-poly-A尾免于降解。因此，在一些实施方案中，本公开的核酸分子(如mRNA)包含poly-A结合蛋白(PABP)的至少一个结合位点。在其他实施方案中，在将核酸分子装载到递送载体(例如脂质纳米颗粒)中之前使其与PABP缀合或复合。

在一些实施方案中，本公开的核酸分子(如mRNA)包含poly-A-G四聚体。G四聚体是四个鸟苷核苷酸的环状氢键阵列，可以由DNA和RNA中的富G序列形成。在该实施例中，将G四聚体结合在poly-A区域的末端。可以测定所得的多核苷酸(如mRNA)的稳定性、蛋白质产生和其他参数，包括在不同时间点的半衰期。研究表明，polyA-G四聚体结构产生的蛋白质产量至少等于单独使用120个核苷酸的poly-A区域产生蛋白质产量的75％。

在一些实施方案中，本公开的核酸分子(如mRNA)可以包括poly-A区，并且可以通过添加3'稳定区来稳定。在一些实施方案中，可用于稳定核酸分子(如mRNA)的3'稳定区，包括poly-A或poly-A-G四聚体结构，记载于国际专利公开号WO2013/103659中，其通过引用方式全部并入本文。

在其他实施方案中，可与本公开内容的核酸分子结合使用的3'稳定区包括链终止核苷，例如但不限于，3'-脱氧腺苷(cordycepin)、3'-脱氧尿苷，3'-脱氧胞嘧啶、3'-脱氧鸟苷、3'-脱氧胸腺嘧啶、2'，3'-二脱氧核苷、2'，3'-二脱氧腺苷、2'，3'-二脱氧尿苷、2'，3'-二脱氧胞嘧啶、2'，3'-二脱氧鸟苷、2'，3'-二脱氧胸腺嘧啶、2'-脱氧核苷或O-甲基核苷、3'-脱氧核苷、2'，3'-二脱氧核苷3'-O-甲基核苷、3'-O-乙基核苷、3'-阿拉伯糖苷，本文所述的或本领域已知的其他替代核苷。

6.3.5二级结构

茎环结构可以指导RNA折叠，保护核酸分子(如mRNA)的结构稳定性，提供RNA结合蛋白的识别位点，并用作酶促反应底物。例如，整合加入miR序列和/或TEE序列会改变茎环区域的形状，这可能会增加和/或减少翻译(Kedde et al.A Pumilio-induced RNAstructure switch in p27-3’UTR controls miR-221and miR-222accessibility.NatCell Biol.,2010Oct；12(10):1014-20，其内容通过引用整体并入本文)。

因此，在一些实施方案中，本文所述的核酸分子(如mRNA)或其一部分可采取茎环结构，例如但不限于组蛋白茎环。在一些实施方案中，茎环结构由长度为约25或约26个核苷酸的茎环序列形成，可以是但不限于如国际专利公开号WO2013/103659中所述的那些，其通过引用方式将其全部内容并入本文。茎-环序列的其他实例包括国际专利公开号WO2012/019780和国际专利公开号WO201502667中描述的那些，其内容通过引用并入本文。在一些实施例中，茎-环序列包括如本文所述的TEE。在一些实施方案中，茎-环序列包含如本文所述的miR序列。在特定的实施方案中，茎环序列可以包括miR-122种子序列。在特定的实施方案中，核酸分子包含茎环序列CAAAGGCTCTTTTCAGAGCCACCA(SEQ ID NO：58)。在其他实施方案中，核酸分子包含茎环序列CAAAGGCUCUUUUCAGAGCCACCA(SEQ ID NO：59)。

在一些实施方案中，本公开的核酸分子(如mRNA)包含位于核酸分子编码区上游(5'端)的茎环序列。在一些实施方案中，茎环序列位于核酸分子的5'-UTR内。在一些实施方案中，本公开的核酸分子(如mRNA)包含位于核酸分子编码区下游(3'端)的茎环序列。在一些实施方案中，茎环序列位于核酸分子的3'-UTR内。在某些情况下，核酸分子可包含一个以上的茎环序列。在一些实施方案中，核酸分子在5'-UTR中包含至少一个茎环序列，在3'-UTR中包含至少一个茎环序列。

在一些实施方案中，包含茎环结构的核酸分子进一步包含稳定化区域。在一些实施方案中，稳定区包含至少一个链终止核苷，其起减缓降解的作用并因此增加了核酸分子的半衰期。可以结合本公开使用的示例性的链终止核苷，包括但不限于，3'-脱氧腺苷(cordycepin)、3'-脱氧尿苷、3'-脱氧胞嘧啶、3'-脱氧鸟苷、3'-脱氧胸腺嘧啶、2',3'-二脱氧核苷、2'，3'-二脱氧腺苷、2'，3'-二脱氧尿苷、2'，3'-二脱氧胞嘧啶、2'，3'-二脱氧鸟苷、2'，3'-二脱氧胸腺嘧啶、2'-脱氧核苷或O-甲基核苷、3'-脱氧核苷、2'，3'-二脱氧核苷3'-O-甲基核苷、3'-O-乙基核苷、3'-阿拉伯糖苷，本文所述的或本领域已知的其他替代核苷。在其他实施方案中，可以通过改变多核苷酸的3'区域来稳定茎环结构，该改变可以防止和/或抑制oligio(U)的添加(国际专利公开号WO2013/103659，其全文通过引用方式并入本文)。

在一些实施方案中，本公开的核酸分子包含至少一个茎环序列和poly-A区或聚腺苷酸化信号。包含至少一个茎环序列和poly-A区或聚腺苷酸化信号的多核苷酸序列的非限制性实例，包括在国际专利公布号WO2013/120497，国际专利公布号WO2013/120629，国际专利公布号WO2013/120500号，第WO2013/120627号国际专利，第WO2013/120498号国际专利，国际专利公布号WO2013/120626，国际专利公布号WO2013/120499和国际专利公布号WO2013/120628中所述，其全部内容通过引用整体并入本文。

在一些实施方案中，包含茎环序列和poly-A区或聚腺苷酸化信号的核酸分子可编码病原体抗原或其片段，如国际专利公开号WO2013/120499和国际专利公开号WO2013/120628中所述的，其内容通过引用整体并入本文。

在一些实施方案中，包含茎环序列和poly-A区或聚腺苷酸化信号的核酸分子可编码治疗性蛋白质，如国际专利公开号WO2013/120497和国际专利公开号No.WO2013/120629所述的，其内容通过引用整体并入本文。

在一些实施方案中，包含茎环序列和poly-A区或聚腺苷酸化信号的核酸分子可编码肿瘤抗原或其片段，如国际专利公开号WO2013/120500和国际专利公开号WO2013/120627中所述的，其内容通过引用整体并入本文。在一些实施方案中，包含茎环序列和poly-A区或聚腺苷酸化信号的核酸分子可编码变应原性抗原或自身免疫自身抗原，如国际专利公开号WO2013/120498和国际专利公开号WO2013/120626中所述的，其内容通过引用整体并入本文。

6.3.6功能性核苷酸类似物

在一些实施方案中，包含茎环序列和poly-A区或聚腺苷酸化信号的核酸分子可编码变应原性抗原或自身免疫自身抗原，如国际专利公开号WO2013/120498和国际专利公开号WO2013/120626中所述的，其内容通过引用整体并入本文。

因此，在一些实施方案中，有效载荷核酸分子包含至少一种本文所述的功能核苷酸类似物。在一些实施方案中，功能核苷酸类似物包含对核碱基、糖基和/或磷酸基的至少一种化学修饰。因此，包含至少一种功能性核苷酸类似物的有效载荷核酸分子含有对核碱基、糖基和/或核苷键的至少一种化学修饰。本文提供了对核酸分子的核碱基、糖基或核苷键的示例性化学修饰。

如本文所述，有效载荷核酸分子中所有核苷酸在0％至100％范围可以是如本文所述的功能性核苷酸类似物。例如，在各种实施例中，从约1％至约20％，从约1％至约25％，从约1％至约50％，从约1％至约60％，从约1％至约70百分比，约1％至约80％，约1％至约90％，约1％至约95％，约10％至约20％，约10％至约25％，约10％％至约50％，约10％至约60％，约10％至约70％，约10％至约80％，约10％至约90％，约10％至约95％，约10％至约100％，约20％至约25％，约20％至约50％，约20％至约60％，约20％至约70％，约20％至约80％，约20％至约90％，约20％至约95％，约20％至约100％，约50％至约60％，约50％至约70％，约50％至约80％，约50％至约90％，约50％至约95％，约50％至约100％，约70％至约80％，约70％至约90％，约70％至约95％，约70％至约100％，约80％至约90％，约80％至约95％，约80％至约100％，约90％至约95％，约90％至约100％或约95％至约100％是本文所述的功能核苷酸类似物。在这些实施方案的任一个中，功能性核苷酸类似物可以存在于核酸分子的任何位置，包括5’-末端，3’-末端和/或一个或多个内部位置。在一些实施方案中，单个核酸分子可包含不同的糖修饰，不同的核碱基修饰和/或不同类型的核苷键(如骨架结构)。

如本文所述，在一种类型的所有核苷酸的0％至100％(例如，一种类型的所有含嘌呤的核苷酸，或一种类型的所有含嘧啶的核苷酸，或所有A，G，C，T或U的范围从0％到100％有效载荷核酸分子中的“作为一种”)可以是本文所述的功能核苷酸类似物。例如，在各种实施例中，从约1％至约20％，从约1％至约25％，从约1％至约50％，从约1％至约60％，从约1％至约70％，约1％至约80％，约1％至约90％，约1％至约95％，约10％至约20％，约10％至约25％，约10％％至约50％，约10％至约60％，约10％至约70％，约10％至约80％，约10％至约90％，约10％至约95％，约10％至约100％，约20％至约25％，约20％至约50％，约20％至约60％，约20％至约70％，约20％至约80％，约20％至约90％，约20％至约95％，约20％至约100％，约50％至约60％，约50％至约70％，约50％至约80％，约50％至约90％，约50％至约95％，约50％至约100％，约70％至约80％，约70％至约90％，约70％至约95％，约70％至约100％，约80％至约90％，约80％至约95％，约80％至约100％，约90％至约95％，约90％至大约100％或约95％至约100％是本文所述的功能核苷酸类似物。在这些实施方案的任一个中，功能性核苷酸类似物可以存在于核酸分子的任何位置，包括5’-末端，3’-末端和/或一个或多个内部位置。在一些实施方案中，单个核酸分子可包含不同的糖修饰、不同的核碱基修饰和/或不同类型的核苷键(如骨架结构)。

6.3.7碱基的修饰

在一些实施方案中，功能性核苷酸类似物包含非标准核碱基。在一些实施方案中，可以修饰或替换核苷酸中的标准核碱基(例如，腺嘌呤，鸟嘌呤，尿嘧啶，胸腺嘧啶和胞嘧啶)以提供该核苷酸的一种或多种功能类似物。核碱基的示例性修饰，包括但不限于，一个或多个取代或修饰，包括但不限于烷基、芳基、卤素、氧代、羟基、烷氧基和/或硫代取代；一个或多个稠环或开环，氧化和/或还原。

在一些实施方案中，非标准核碱基是修饰的尿嘧啶。具有修饰的尿嘧啶的示例性核碱基和核苷包括假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮杂尿嘧啶、6-氮杂尿嘧啶、2-硫-5-氮杂尿嘧啶、2-硫尿嘧啶(s²U)、4-硫-尿嘧啶(s⁴U)、4-硫-假尿苷、2-硫-假尿苷、5-羟基-尿嘧啶(ho⁵U)、5-氨基烯丙基-尿嘧啶、5-卤-尿嘧啶(例如5-碘-尿嘧啶或5-溴尿嘧啶)、3-甲基尿嘧啶(m³U)、5-甲氧基尿嘧啶(mo⁵U)、尿嘧啶5-氧乙酸(cmo⁵U)、尿嘧啶5-氧乙酸甲酯(mcmo⁵U)、5-羧甲基-尿嘧啶(cm⁵U)、1-羧甲基-假尿苷、5-羧基羟甲基-尿嘧啶(chm⁵U)、5-羧羟甲基-尿嘧啶甲酯(mchm⁵U)、5-甲氧羰基甲基尿嘧啶(mcm⁵U)、5-甲氧羰基甲基-2-硫尿嘧啶(mcm⁵s²U)、5-氨基甲基-2-硫代尿嘧啶(nm⁵s²U)、5-甲基氨基甲基-2-尿嘧啶(mnm⁵U)、5-甲基氨基甲基-2-硫代尿嘧啶(mnm⁵s²U)、5-甲基氨基甲基-2-硒代尿嘧啶(mnm⁵se²U)、5-氨基甲酰基甲基尿嘧啶(ncm5U)、5-羧甲基氨基甲基尿嘧啶(cmnm⁵U)、5-羧甲基氨基甲基-2-硫代尿嘧啶(cmnm⁵s²U)、5-丙炔基尿嘧啶、1-丙炔基-伪尿嘧啶，5-牛磺酸甲基尿嘧啶(τm⁵U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫尿嘧啶(τm⁵s²U)、1-牛磺基甲基-4-硫代-假尿苷、5-甲基-尿嘧啶(m⁵U，即具有核碱基脱氧胸腺嘧啶)、1-甲基-伪神经苷(m¹ψ)、1-乙基-伪神经苷(Et¹ψ)、5-甲基-2-硫-尿嘧啶(m⁵s²U)、1-甲基-4-硫代-古杜里定(m¹s⁴ψ)、4-硫-1-甲基-古杜里定、3-甲基-古杜里定(m³ψ)、2-硫-1-甲基-杜杜里定、1-甲基-1-去氮杂-假尿苷、2-硫-1-甲基-1-去氮杂-假尿苷、二氢尿嘧啶(D)、二氢假尿苷、5,6-二氢尿嘧啶、5-甲基-二氢尿嘧啶(m⁵D)、2-硫代-二氢尿嘧啶、2-硫代-二氢假尿苷、2-甲氧基-尿嘧啶、2-甲氧基-4-硫代尿嘧啶、4-甲氧基-假尿苷、4-甲氧基-2-硫代假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧丙基)尿嘧啶(acp³U)、1-甲基-3-(3-氨基-3-羧丙基)假尿苷(acp³ψ)、5-(异戊烯基氨基甲基)尿嘧啶(m⁵U)、5-(异戊烯基)氨基甲基)-2-硫尿嘧啶(m⁵s²U)、5,2'-O-二甲基尿苷(m⁵Um)、2-硫基-2'-O-甲基尿苷(s²Um)、5-甲氧羰基甲基-2'-O-甲基尿苷(mcm⁵Um)、5-氨基甲酰基甲基-2'-O-甲基尿苷(ncm⁵Um)、5-羧甲基氨基甲基-2'-O-甲基尿苷(cmnm⁵Um)、3,2'-O-二甲基尿苷(m³Um)和5-(异戊烯基氨基甲基)-2'-O-甲基-尿苷(inm⁵Um)、1-硫-尿嘧啶、脱氧胸苷、5-(2-羰甲氧基乙烯基)-尿嘧啶、5-(氨基甲酰基羟甲基)-尿嘧啶、5-氨基甲酰基甲基-2-硫尿嘧啶、5-羧甲基-2-硫尿嘧啶、5-氰基甲基尿嘧啶、5-甲氧基-2-硫尿嘧啶和5-3-(1-E-丙烯氨基)尿嘧啶。

在一些实施方案中，非标准核碱基是修饰的胞嘧啶。具有修饰的胞嘧啶的示例性核碱基和核苷包括5-氮杂胞嘧啶、6-氮杂胞嘧啶、假异胞苷、3-甲基胞嘧啶(m3C)、N4-乙酰基胞嘧啶(ac4C)、5-甲酰基胞嘧啶(f5C)、N4-甲基-胞嘧啶(m4C)、5-甲基-胞嘧啶(m5C)、5-卤代-胞嘧啶(例如5-碘-胞嘧啶)、5-羟甲基-胞嘧啶(hm5C)、1-甲基-伪异胞苷、吡咯并胞嘧啶、吡咯并假异胞嘧啶核苷、2-硫代胞嘧啶核苷(s2C)、2-硫代-5-甲基胞嘧啶核苷、4-硫代-伪异胞嘧啶核苷、4-硫代-1-甲基-伪异胞嘧啶核苷、4-硫基-1-甲基-1-deaza-pseudoisocytidine、1-甲基-1-deaza-pseudoisocytidine、zebularine、5-aza-zebularine、5-methyl-zebularine、5-aza-2-thio-zebularine、2-thio-zebularine、2-甲氧基-胞嘧啶、2-甲氧基-5-甲基胞嘧啶、4-甲氧基-伪异胞嘧啶核苷、4-甲氧基-1-甲基-伪异胞嘧啶核苷、赖氨酸(k2C)、5,2'-O-二甲基胞嘧啶核苷(m5Cm)、N4-乙酰基-2'-O-甲基胞苷(ac4Cm)、N4,2'-O-二甲基胞苷(m4Cm)、5-甲酰基-2'-O-甲基胞苷(fSCm)、N4，N4,2'-O-三甲基胞苷(m42Cm)、1-硫代胞嘧啶、5-羟基-胞嘧啶、5-(3-叠氮基丙基)-胞嘧啶和5-(2-叠氮基乙基)-胞嘧啶。

在一些实施方案中，非标准核碱基是修饰的腺嘌呤。具有替代腺嘌呤的示例性核碱基和核苷包括2-氨基嘌呤、2，6-二氨基嘌呤、2-氨基-6-卤代嘌呤(例如2-氨基-6-氯嘌呤)、6-卤代嘌呤(例如6-氯嘌呤)、2-氨基-6-甲基嘌呤、8-叠氮基腺嘌呤、7-脱氮基腺嘌呤、7-脱氮基-8-氮杂腺嘌呤、7-脱氮基-2-氨基嘌呤、7-deaza-8-aza-2-氨基嘌呤、7-deaza-2,6-二氨基嘌呤、7-deaza-8-aza-2,6-二氨基嘌呤、1-甲基腺嘌呤(m1A)、2-甲基腺嘌呤(m2A)、N6-甲基腺嘌呤(m6A)、2-甲硫基-N6-甲基腺嘌呤(ms2m6A)、N6-异戊烯基腺嘌呤(i6A)、2-甲硫基-N6-异戊烯基腺嘌呤(ms2i6A)、N6-(顺式-羟基异戊烯基)腺嘌呤(io6A)、2-甲硫基-N6-(顺式-羟基异戊烯基)腺嘌呤(ms2io6A)、N6-甘氨酰氨基甲酰基-腺嘌呤(g6A)、N6-苏氨甲氨基甲酰基-腺嘌呤(t6A)、N6-甲基-N6-苏氨甲氨基甲酰基-腺嘌呤(m6t6A)、2-甲硫基-N6-苏氨甲氨基甲酰基-腺嘌呤(ms2g6A)、N6，N6-二甲基-腺嘌呤(m62A)、N6-羟基-正戊基氨基甲酰基-腺嘌呤(hn6A)、2-甲硫基-N6-羟基-正戊基氨基甲酰基-腺嘌呤(ms2hn6A)、N6-乙酰基腺嘌呤(ac6A)、7-甲基腺嘌呤、2-甲硫基腺嘌呤、2-甲氧基腺嘌呤、N6,2'-O-二甲基腺苷(m6Am)、N6，N6,2'-O-三甲基腺苷(m62Am)、1,2'-O-二甲基腺苷(m1Am)、2-氨基-N6-甲基嘌呤、1-硫代腺嘌呤，8-叠氮腺嘌呤、N6-(19-氨基-五氧杂十二烷)-腺嘌呤、2,8-二甲基-腺嘌呤、N6-甲酰基-腺嘌呤和N6-羟甲基-腺嘌呤。

在一些实施方案中，非标准核碱基是修饰的鸟嘌呤。具有修饰的鸟嘌呤的示例性核碱基和核苷包括肌苷(I)、1-甲基肌苷(m1I)、肌苷(imG)、甲基肌苷(mimG)、4-脱甲基肌苷(imG-14)、异代酪氨酸(imG2)、wybutosine(yW)、过氧代酪氨酸(o2yW)，羟基代酪氨酸(OHyW)、改性不足的羟基代酪氨酸(OHyW*)、7-脱氮鸟嘌呤、奎松碱(Q)、环氧奎松碱(oQ)、半乳糖基奎松碱(galQ)、甘露糖基奎奴松、7-氰基-7-脱氮鸟嘌呤(preQO)、7-氨基甲基-7-脱氮鸟嘌呤(preQ1)、古生物碱(G+)、7-脱氮8-氮杂鸟嘌呤、6-硫代鸟嘌呤、6-硫代-7-脱氮-鸟嘌呤、6-硫代-7-脱氮-8-氮杂-鸟嘌呤、7-甲基-鸟嘌呤(m7G)、6-硫代-7-甲基鸟嘌呤、7-甲基-肌苷、6-甲氧基-鸟嘌呤、1-甲基鸟嘌呤(m1G)、N2-甲基鸟嘌呤(m2G)、N2，N2-二甲基鸟嘌呤(m22G)、N2,7-二甲基鸟嘌呤(m2,7G)、N2，N2,7-二甲基鸟嘌呤(m2,2,7G)、8-氧代鸟嘌呤、7-甲基-8-氧代鸟嘌呤、1-甲基-6-硫代鸟嘌呤、N2-甲基-6-硫代鸟嘌呤、N2，N2-二甲基-6-硫代鸟嘌呤、N2-甲基-2'-O-甲基-鸟嘌呤(m2Gm)、N2，N2-di甲基-2'-O-甲基鸟苷(m22Gm)、1-甲基-2'-O-甲基鸟苷(m1Gm)、N2,7-二甲基-2'-O-甲基鸟苷(m2,7Gm)、2'-O-甲基肌苷(Im)、1,2'-O-二甲基肌苷(mIm)、1-硫代鸟嘌呤和O-6-甲基鸟嘌呤。

在一些实施方案中，功能核苷酸类似物的非标准核碱基可以独立地是嘌呤、嘧啶、嘌呤或嘧啶类似物。例如，在一些实施方案中，非规范核碱基可以是修饰的腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶或次黄嘌呤。在其他实施方案中，非规范核碱基还可以包括例如碱基的天然存在和合成的衍生物，包括吡唑并[3,4-d]嘧啶、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶，8-卤代(例如8-溴)、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤，5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶，7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、脱氮鸟嘌呤、7-脱氮鸟嘌呤、3-deazaguanine、deazaadenine、7-deazaadenine、3-deazaadenine、吡唑并[3,4-d]嘧啶、咪唑并[1,5-a]1,3,5三嗪酮、9-去氮杂嘌呤、咪唑并[4,5-d]吡嗪、噻唑并[4,5-d]嘧啶、吡嗪-2-酮、1,2,4-三嗪、哒嗪，或1,3,5三嗪。

6.3.8糖的修饰

在一些实施方案中，功能核苷酸类似物包含非标准糖基。在各种实施方案中，非标准糖基团可以是具有一个或多个取代基的5-碳或6-碳糖(例如戊糖、核糖、阿拉伯糖、木糖、葡萄糖、半乳糖或其脱氧衍生物)，所述取代基可以是卤素、羟基、硫醇基、烷基、烷氧基、烯基氧基、炔基氧基、环烷基、氨基烷氧基、烷氧基烷氧基、羟基烷氧基、氨基、叠氮基基团、芳基、氨基烷基、氨基烯基、氨基炔基等。

通常，RNA分子包含核糖基团，其是具有氧的五元环。示例性的非限制性替代核苷酸包括核糖中的氧置换(例如用S，Se或亚烷基，如亚甲基或亚乙基)取代；双键的加成(例如用环戊烯基或环己烯基取代核糖)；核糖的环收环(例如形成环丁烷或氧杂环丁烷的四元环)；核糖的扩环(例如形成具有额外碳原子或杂原子的6或7元环，例如脱水己糖醇，阿糖醇，甘露糖醇，环己基，环己烯基和吗啉代(也具有氨基磷酸酯主链))；多环形式(例如三环和“解锁”形式，例如乙二醇核酸(GNA)(如R-GNA或S-GNA，其中核糖被附着在磷酸二酯键上的乙二醇单元取代)，苏糖核酸(TNA，其中核糖被α-L-苏呋喃呋喃糖基-(3'→2')取代)和肽核酸(PNA，其中2-氨基-乙基-甘氨酸键取代了核糖和磷酸二酯主链)。

在一些实施方案中，糖基团包含一个或多个碳，其具有与核糖中相应碳相反的立体化学构型。因此，核酸分子可包括含有例如阿拉伯糖或L-核糖作为糖的核苷酸。在一些实施方案中，核酸分子包括至少一个核苷，其中糖是L-核糖，2'-O-甲基核糖，2'-氟核糖，阿拉伯糖，己糖醇，LNA或PNA。

6.3.9核苷键的修饰

在一些实施方案中，本公开的有效载荷核酸分子可包含一个或多个修饰的核苷键(如磷酸骨架)。可以通过用不同的取代基取代一个或多个氧原子来改变骨架的磷酸基团。

在一些实施方案中，功能性核苷酸类似物可包括另一个核苷键取代未改变的磷酸部分。替代的磷酸酯基团的实例包括但不限于硫代磷酸酯，亚磷酸硒酸酯，硼酸磷酸酯，硼酸磷酸酯，膦酸氢根，氨基磷酸酯，二氨基磷酸酯，烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫取代。也可以通过用氮(桥连的氨基磷酸酯)，硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)代替氧来连接改变的磷酸酯键。

可替代的核苷和核苷酸包括硼烷部分(BH 3)，硫(thio)，甲基，乙基和/或甲氧基代替一个或多个非桥连的氧。作为非限制性实例，在相同位置(如α，β或γ位置)的两个非桥连的氧可以被硫(thio)和甲氧基取代。通过在磷酸部分(如α-硫代磷酸酯)的位置上的一个或多个氧原子的取代，以非天然硫代磷酸酯主链连接增强RNA和DNA的稳定性(例如针对核酸外切酶和核酸内切酶时)。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性，因此在细胞环境中具有更长的半衰期。

根据本公开使用的其他核苷键包括不包含磷原子的核苷键。

可以结合本公开使用的核酸分子(如mRNA)、组合物、制剂和/或与其相关的方法的其他实例，进一步包括在WO2002/098443，WO2003/051401，WO2008/052770，WO2009127230，WO2006122828，WO2008/083949，WO2010088927，WO2010/037539，WO2004/004743，WO2005/016376，WO2006/024518，WO2007/095976，WO2008/014979，WO2008/077592，WO2009/030481，WO2009/095226，WO2011069586，WO2011026641，WO2011/144358，WO2012019780，WO2012013326，WO2012089338，WO2012113513，WO2012116811，WO2012116810，WO2013113502，WO2013113501，WO2013113736，WO2013143698，WO2013143699，WO2013143700，WO2013/120626，WO2013120627，WO2013120628，WO2013120629，WO2013174409/WO2015127917，WO2015 024667，WO2015/024665，WO2015/024666，WO2015/024664，WO2015101415，WO2015101414，WO2015024667，WO2015062738，WO2015101416中，其每一个的内容整体并入本文。

如本文所述的治疗性核酸分子可以通过使用本领域已知的方法分离或合成。在一些实施方案中，与本公开结合使用的DNA或RNA分子是化学合成的。在其他实施方案中，与本公开内容结合使用的DNA或RNA分子是从天然来源分离的。

在一些实施方案中，与本公开结合使用的mRNA分子是使用宿主细胞生物合成的。在特定的实施方案中，mRNA是通过使用宿主细胞转录相应的DNA来产生。在一些实施方案中，使用本领域已知的方法将编码mRNA序列的DNA序列整合入表达载体中，然后将该载体引入宿主细胞(例如大肠杆菌)。然后在合适的条件下培养宿主细胞以产生mRNA转录物。从DNA产生mRNA分子的其他方法是本领域已知的。例如，在一些实施方案中，可以使用包含宿主细胞的转录机制的酶的无细胞(体外)转录系统来产生mRNA转录物。在本发明的实施例1中描述了示例性的无细胞转录反应系统。

6.4纳米颗粒组合物

一方面，本文所述的核酸分子被配制用于体外和体内递送。特别地，在一些实施方案中，将核酸分子配制成含脂质的组合物。在一些实施方案中，含脂质的组合物形成将核酸分子封闭在脂质壳内的脂质纳米颗粒。在一些实施方案中，脂质壳保护核酸分子免于降解。在一些实施方案中，脂质纳米颗粒还有助于将封闭的核酸分子运输到细胞内区室和/或机制中以发挥预期的预防功能。在某些实施方案中，当存在于脂质纳米颗粒中时，核酸能在水溶液中抵抗核酸酶的降解。包含核酸的脂质纳米颗粒及其制备方法是本领域已知的，例如在美国专利公开号2004/0142025，美国专利公开号2007/0042031，PCT公开号WO 2017/004143中公开的那些。，PCT公开号WO 2015/199952，PCT公开号WO 2013/016058和PCT公开号WO 2013/086373公开的方法，其全部公开内容通过引用整体的方式并入本文。

在一些实施方案中，本文提供的纳米颗粒组合物的最大尺寸为1μm或更小(例如≤1μm、≤900nm、≤800nm、≤700nm、≤600nm、≤500nm、≤400nm、≤300nm、≤200nm、≤175nm、≤150nm、≤125nm、≤100nm、≤75nm、≤50nm或更小)，例如通过动态光散射(DLS)、透射电子显微镜、扫描电子显微镜或其他方法进行检测时。在一实施方案中，本文提供的脂质纳米颗粒至少一个维度在约40至约200nm范围内。在一实施例中，至少一个维度在约40至约100nm的范围内。

可以结合本公开使用的纳米颗粒组合物包括例如脂质纳米颗粒(LNP)、纳米脂蛋白颗粒、脂质体、脂质囊泡和脂质复合物。在一些实施方案中，纳米颗粒组合物是包含一个或多个脂质双层的囊泡。在一些实施方案中，纳米颗粒组合物包含两个或更多个被水性隔室隔开的同心双层。脂质双层可以被官能化和/或彼此交联。脂质双层可以包括一种或多种配体、蛋白质或通道。

在一些实施方案中，所述的纳米颗粒组合物包含脂质组分，所述脂质组分包含至少一种脂质，例如本文所述的根据式(I)至(IV)之一的化合物及其子式。例如，在一些实施方案中，纳米颗粒组合物可以包括脂质组分，该脂质组分包括本文提供的化合物之一。纳米颗粒组合物还可包含一种或多种如下所述的其他脂质或非脂质组分。

6.4.1阳离子脂质

在一个实施方案中，本文提供式(I)的化合物：

或其药学上可接受的盐、前药或立体异构体，其中：

G¹和G²各自独立地为化学键，C₂-C₁₂亚烷基或C₂-C₁₂亚烯基，其中亚烷基或亚烯基中的一个或多个-CH₂-被-O-任选地取代；

L¹是-OC(＝O)R¹，-C(＝O)OR¹，-OC(＝O)OR¹，-C(＝O)R¹，-OR¹，-S(O)_xR¹，-S-SR¹，-C(＝O)SR¹，-SC(＝O)R¹，-NR^aC(＝O)R¹，-C(＝O)NR^bR^c，-NR^aC(＝O)NR^bR^c，-OC(＝O)NR^bR^c，-NR^aC(＝O)OR¹，-SC(＝S)R¹，-C(＝S)SR¹，-C(＝S)R¹，-CH(OH)R¹，-P(＝O)(OR^b)(OR^c)，-(C₆-C₁₀亚芳基)-R¹，-(6-10元亚杂芳基)-R¹或R¹；

L²是-OC(＝O)R²，-C(＝O)OR²，-OC(＝O)OR²，-C(＝O)R²，-OR²，-S(O)_xR²，-S-SR²，-C(＝O)SR²，-SC(＝O)R²，-NR^dC(＝O)R²，-C(＝O)NR^eR^f，-NR^dC(＝O)NR^eR^f，-OC(＝O)NR^eR^f，-NR^dC(＝O)OR²，-SC(＝S)R²，-C(＝S)SR²，-C(＝S)R²，-CH(OH)R²，-P(＝O)(OR^e)(OR^f)，-(C₆-C₁₀亚芳基)-R²，-(6-10元亚杂芳基)-R²或R²；

R¹和R²各自独立地为C₆-C₃₂烷基或C₆-C₃₂烯基；

R^a，R^b，R^d和R^e分别独立地为H，C₁-C₂₄烷基或C₂-C₂₄烯基；

R^c和R^f分别独立地为C₁-C₃₂烷基或C₂-C₃₂烯基；

G³是C₂-C₂₄亚烷基，C₂-C₂₄亚烯基，C₃-C₈亚环烷基或C₃-C₈亚环烯基；

R³是-N(R⁴)R⁵；

R⁴是C₃-C₈环烷基，C₃-C₈环烯基，4-8元杂芳基或C₆-C₁₀芳基；或R⁴，G³或G³的一部分，与它们所连接的氮一起形成一个环状部分；

R⁵是C₁-C₁₂烷基或C₃-C₈环烷基；或R⁴，R⁵，与它们所连接的氮一起形成一个环状部分；

x为0、1或2；和

其中每个烷基、烯基、环烷基、环烯基、杂芳基、芳基、亚烷基、亚烯基、亚环烷基、亚环烯基、亚芳基、亚杂芳基和环状部分独立地任选地被取代。

在一个实施方案中，本文提供式(I)的化合物：

或其药学上可接受的盐、前药或立体异构体，其中：

G¹和G²各自独立地为化学键、C₂-C₁₂亚烷基或C₂-C₁₂亚烯基；

R¹和R²各自独立地为C₆-C₂₄烷基或C₆-C₂₄烯基；

R^a，R^b，R^d和R^e分别独立为H，C₁-C₁₂烷基或C₂-C₁₂烯基；

R^c和R^f分别独立地为C₁-C₁₂烷基或C₂-C₁₂烯基；

R³是-N(R⁴)R⁵；

R⁴是C₃-C₈环烷基，C₃-C₈环烯基或C₆-C₁₀芳基；

R⁵是C₁-C₁₂烷基；

x为0、1或2；和

其中每个烷基，烯基，环烷基，环烯基，芳基，亚烷基，亚烯基，亚环烷基，亚环烯基，亚芳基和亚杂芳基独立地任选地被取代。

在一个实施方案中，本文提供式(II)的化合物:

或其药学上可接受的盐、前药或立体异构体，其中：

是单键或双键；

L¹是-OC(＝O)R¹，-C(＝O)OR¹，-OC(＝O)OR¹，-C(＝O)R¹，-OR¹，-S(O)_xR¹，-S-SR¹，-C(＝O)SR¹，-SC(＝O)R¹，-NR^aC(＝O)R¹，-C(＝O)NR^bR^c，-NR^aC(＝O)NR^bR^c，-OC(＝O)NR^bR^c，-NR^aC(＝O)OR¹，-SC(＝S)R¹，-C(＝S)SR¹，-C(＝S)R¹，-CH(OH)R¹，-P(＝O)(OR^b)(OR^c)，-(C₆-C₁₀亚芳基)-R¹，-(6-10元杂亚芳基)-R¹或R¹；

L²是-OC(＝O)R²，-C(＝O)OR²，-OC(＝O)OR²，-C(＝O)R²，-OR²，-S(O)_xR²，-S-SR²，-C(＝O)SR²，-SC(＝O)R²，-NR^dC(＝O)R²，-C(＝O)NR^eR^f，-NR^dC(＝O)NR^eR^f，-OC(＝O)NR^eR^f，-NR^dC(＝O)OR²，-SC(＝S)R²，-C(＝S)SR²，-C(＝S)R²，-CH(OH)R²，-P(＝O)(OR^e)(OR^f)，-(C6-C10亚芳基)-R²，-(6-10元亚杂芳基)-R²或R²；

R¹和R²各自独立地为C₆-C₃₂烷基或C₆-C₃₂烯基；

R^c和R^f分别独立地为C₁-C₃₂烷基或C₂-C₃₂烯基；

G⁴为化学键，C₁-C₂₃亚烷基，C₂-C₂₃亚烯基，C₃-C₈亚环烷基或C₃-C₈亚环烯基；

R³是-N(R⁴)R⁵；

R⁴是C₁-C₁₂烷基，C₃-C₈环烷基，C₃-C₈环烯基，4-8元杂芳基或C₆-C₁₀芳基；或R⁴，G³或G³的一部分，与它们所连接的氮一起形成一个环状部分；

x为0、1或2；和

在一个实施方案中，本文提供式(II)的化合物:

或其药学上可接受的盐、前药或立体异构体，其中:

是单键或双键；

G¹和G²各自独立地为化学键，C₂-C₁₂亚烷基或C₂-C₁₂亚烯基；

R¹和R²各自独立地为C₆-C₂₄烷基或C₆-C₂₄烯基；

R^c和R^f分别独立地为C₁-C₁₂烷基或C₂-C₁₂烯基；

R³是-N(R⁴)R⁵；

R⁴是C₁-C₁₂烷基，C₃-C₈环烷基，C₃-C₈环烯基或C₆-C₁₀芳基；

R⁵是C₁-C₁₂烷基；

x为0、1或2；和

其中每个烷基、烯基、环烷基、环烯基、芳基、亚烷基、亚烯基、亚环烷基、亚环烯基、亚芳基和亚杂芳基独立地任选地被取代。

在一个实施方案中，

为单键。在一个实施方案中，

是双键。在一个实施方案中，

是一个双键，并且该化合物具有(Z)-构型。在一个实施方案中，

是一个双键，并且该化合物具有(E)-构型。

在一个实施方案中，本文提供式(III)的化合物：

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，本文提供式(IV)的化合物：

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，G¹为化学键。在一个实施方案中，G²为化学键。在一个实施方案中，G¹和G²均为化学键。

在一个实施方案中，G¹和G²各自独立地为C₂-C₁₂亚烷基或C₂-C₁₂亚烯基。在一个实施方案中，G¹和G²各自独立地为C₂-C₁₂亚烷基。在一个实施方案中，G¹和G²各自独立地为C₂-C₁₂亚烯基。在一个实施方案中，G¹和G²各自独立地为C₃-C₇亚烷基。在一个实施方案中G¹和G²各自独立地为C₅亚烷基。

在一个实施方案中，G¹是未取代的。在一个实施方案中，G¹被取代。在一个实施方案中，G¹被-OH取代。在一个实施例中，G¹被(第二个)L¹取代(即，G¹连接到两个L¹)。在一个实施方案中，G¹被-O-(C₆-C₂₄烷基)取代。在一个实施方案中，G¹被-O-(C₆-C₂₄烯基)取代。在一个实施方案中，G¹被-C(＝O)-(C₆-C₂₄烷基)取代。在一个实施方案中，G¹被-C(＝O)-(C₆-C₂₄烯基)取代。

在一个实施方案中，G²是未取代的。在一个实施方案中，G²被取代。在一个实施方案中，G²被-OH取代。在一个实施例中，G²被(第二个)L²取代(即，G²连接到两个L²)。在一个实施方案中，G²被-O-(C₆-C₂₄烷基)取代。在一个实施方案中，G²被-O-(C₆-C₂₄烯基)取代。在一个实施方案中，G²被-C(＝O)-(C₆-C₂₄烷基)取代。在一个实施方案中，G²被-C(＝O)-(C₆-C₂₄烯基)取代。

在一个实施方案中，在G¹和/或G²中的亚烷基或亚烯基中的一个或多个-CH₂-任选地被-O-取代。在一个实施方案中，G¹和G²各自独立地为C₅-C₉亚烷基，其中亚烷基中的一个或多个-CH₂-任选地被-O-取代。在一个实施方案中，G¹和G²各自独立地为C₅-C₇亚烷基，其中亚烷基中的一个或多个-CH₂-任选地被-O-取代。在一个实施方案中，G¹和G²均为-CH₂-CH₂-O-CH₂-CH₂-。在一个实施方案中，G¹和G²均为-CH₂-CH₂-O-CH₂-CH₂-O-CH₂-。

在一个实施方案中，该化合物是式(I-A)的化合物：

其中y和z各自独立地是2至12的整数；

或其药学上可接受的盐、前药或立体异构体。

在一个实施方案中，该化合物是式(II-A)的化合物：

其中y和z各自独立地是2至12的整数；

或其药学上可接受的盐、前药或立体异构体。

在一个实施方案中，该化合物是式(III-A)的化合物：

其中y和z各自独立地是2至12的整数；

或其药学上可接受的盐、前药或立体异构体。

在一个实施方案中，该化合物是式(IV-A)的化合物：

其中y和z各自独立地是2至12的整数；

或其药学上可接受的盐、前药或立体异构体。

在一个实施方案中，y和z各自独立地为2至10的整数。在一个实施方案中，y和z各自独立地为2至6的整数。在一个实施方案中，y和z各自独立地为4至10的整数。

在一实施例中，y和z不同。在一实施例中，y和z相同。在一个实施例中，y和z相同，并且选自4、5、6、7、8和9。在一个实施例中，y是5并且z是5。

在一个实施方案中，L¹为–OC(＝O)R¹,-C(＝O)OR¹,-OC(＝O)OR¹,-C(＝O)R¹,-OR¹,-S(O)_xR¹,-S-SR¹,-C(＝O)SR¹,-SC(＝O)R¹,-NR^aC(＝O)R¹,-C(＝O)NR^bR^c,-NR^aC(＝O)NR^bR^c,-OC(＝O)NR^bR^c,-NR^aC(＝O)OR¹,-SC(＝S)R¹,-C(＝S)SR¹,-C(＝S)R¹,-CH(OH)R¹,或-P(＝O)(OR^b)(OR^c)。在一个实施方案中，L¹为-(C₆-C₁₀亚芳基)-R¹。在一个实施方案中，L¹为-(6-10元亚杂芳基)-R¹。在一个实施例中，L¹是R¹。

在一个实施方案中，L¹是-OC(＝O)R¹，-C(＝O)OR¹，-C(＝O)SR¹，-SC(＝O)R¹，-NRaC(＝O)R¹或-C(＝O)NR^bR^c。在一个实施方案中，L¹是–OC(＝O)R¹，-C(＝O)OR¹，-NR^aC(＝O)R¹或-C(＝O)NR^bR^c。在一实施例中，L¹为–OC(＝O)R¹。在一实施例中，L¹为-C(＝O)OR¹。在一个实施方案中，L¹是-NR^aC(＝O)R¹。在一个实施方案中，L¹是-C(＝O)NR^bR^c。在一个实施方案中，L¹是-NR^aC(＝O)NR^bR^c。在一个实施方案中，L¹是-OC(＝O)NR^bR^c。在一个实施方案中，L¹是-NR^aC(＝O)OR¹。

在一个实施方案中，L²是-OC(＝O)R²，-C(＝O)OR²，-OC(＝O)OR²，-C(＝O)R²，-OR²，-S(O)_xR²，-S-SR²，-C(＝O)SR²，-SC(＝O)R²，-NR^dC(＝O)R²，-C(＝O)NR^eR^f，-NR^dC(＝O)NR^eR^f，-OC(＝O)NR^eR^f,-NR^dC(＝O)OR²，-SC(＝S)R²，-C(＝S)SR²，-C(＝S)R²，-CH(OH)R²或-P(＝O)(OR^e)(OR^f)。在一个实施方案中，L²为-(C₆-C₁₀亚芳基)-R²。在一实施方案中，L²为-(6-至10-元亚杂芳基)-R²。在一个实施方案中，L²是R²。

在一个实施方案中，L²是-OC(＝O)R²，-C(＝O)OR²，-C(＝O)SR²，-SC(＝O)R²，-NR^dC(＝O)R²或-C(＝O)NR^eR^f。在一个实施方案中，L²是-OC(＝O)R²，-C(＝O)OR²，-NR^dC(＝O)R²或-C(＝O)NR^eR^f。在一实施例中，L²为–OC(＝O)R²。在一实施例中，L²为-C(＝O)OR²。在一实施方案中，L²为-NRdC(＝O)R²。在一实施例中，L²为-C(＝O)NR^eR^f。在一个实施方案中，L²是-NR^dC(＝O)NR^eR^f。在一个实施方案中，L²是-OC(＝O)NR^eR^f。在一个实施方案中，L²是-NR^dC(＝O)OR²。

在一个实施方案中，L¹是–OC(＝O)R¹,-NR^aC(＝O)R¹,-C(＝O)OR¹或-C(＝O)NR^bR^c，而且L²是–OC(＝O)R²,-NR^dC(＝O)R²,-C(＝O)OR²或-C(＝O)NR^eR^f。在一个实施方案中，L¹是–OC(＝O)R¹,-C(＝O)OR¹或-C(＝O)NR^bR^c，而且L²是–OC(＝O)R²,-C(＝O)OR²或-C(＝O)NR^eR^f。在一个实施方案中，L¹是–OC(＝O)R¹,而且L²是–OC(＝O)R²。在一个实施方案中，L¹是–OC(＝O)R¹，而且L²是-NR^dC(＝O)R²。在一个实施方案中，L¹是-NR^aC(＝O)R¹，而且L²是-NR^dC(＝O)R²。在一个实施方案中，L¹是-C(＝O)OR¹，而且L²是-C(＝O)OR²。在一个实施方案中，L¹是-C(＝O)OR¹，而且L²是-C(＝O)NR^eR^f。在一个实施方案中，L¹是-C(＝O)NR^bR^c，而且L²是-C(＝O)NR^eR^f。

在一个实施方案中，L¹是-NR^aC(＝O)NR^bR^c，而且L²是-NR^dC(＝O)NR^eR^f。在一个实施方案中，L¹是-OC(＝O)NR^bR^c，而且L²是-OC(＝O)NR^eR^f。在一个实施方案中，L¹是-NR^aC(＝O)OR¹，而且L²是-NR^dC(＝O)OR²。

在一个实施方案中，该化合物是式(I-B)，(I-B’),(I-B”),(I-C)，(I-D)或(I-E)的化合物：

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(II-B)，(II-B’),(II-B”),(II-C)，(II-D)或(II-E)的化合物：

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(III-B)，(III-B’),(III-B”),(III-C)，(III-D)或(III-E)的化合物：

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(IV-B)，(IV-B’),(IV-B”),(IV-C)，(IV-D)或(IV-E)的化合物:

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(I-F)，(I-F’),(I-F”),(I-G)，(I-H)或(I-I)的化合物:

其中y和z各自独立地是2至12的整数。

或其药学上可接受的盐，前药或立体异构体

在一个实施方案中，该化合物是式(II-F)，(II-F’),(II-F”),(II-G)，(II-H)或(II-I)的化合物：

其中y和z各自独立地是2至12的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(III-F)，(III-F’),(III-F”),(III-G)，(III-H)或(III-I)的化合物：

其中y和z各自独立地是2至12的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(IV-F)，(IV-F’),(IV-F”),(IV-G)，(IV-H)或(IV-1)的化合物：

其中y和z各自独立地是2至12的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，G³为C₂-C₂₄亚烷基。在一个实施方案中，G³为C₂-C₁₂亚烷基。在一个实施方案中，G³为C₂-C₈亚烷基。在一个实施方案中，G³为C₂-C₆亚烷基。在一个实施方案中，G³为C₂-C₄亚烷基。在一个实施方案中，G³为C₂亚烷基。在一个实施方案中，G³为C₄亚烷基。

在一个实施方案中，G³被一种或多种氧代取代。在一个实施方案中，G³为-(C₁-C₂₃亚烷基)-C(＝O)-。在一个实施方案中，G³为-(C₁-C₁₁亚烷基)-C(＝O)-。在一个实施方案中，G³是-(C₁-C₇亚烷基)-C(＝O)-。在一个实施方案中，G³为-(C₁-C₅亚烷基)-C(＝O)-。在一个实施方案中，G³是-(C₁-C₃亚烷基)-C(＝O)-。在一个实施方案中，G³为–CH₂-C(＝O)-。在一个实施方案中，G³为–CH₂-CH₂-CH₂-C(＝O)-。在一个实施方案中，-C(＝O)-连接至氮原子，并且亚烷基连接至R³。

在一个实施方案中，该化合物是式(I-J)，(I-J’),(I-J”),(I-K)，(I-L)或(I-M)的化合物：

其中y和z各自独立地是2至12的整数，和

s是2到24之间的整数，

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，s是2至12的整数。在一个实施方案中，s是2至8的整数。在一个实施方案中，s是2至6的整数。在一个实施方案中，s是2至4的整数。在一个实施例中，s是2。在一个实施例中，s是4。

在一实施例中，y为5，z为5，且s为2。

在一实施例中，y为5，z为5，且s为4。

在一个实施方案中，G³为C₂-C₂₄亚烯基。在一个实施方案中，G³为C₂-C₁₂亚烯基。在一个实施方案中，G³为C₂-C₈亚烯基。在一个实施方案中，G³为C₂-C₆亚烯基。在一个实施方案中，G³为C₂-C₄亚烯基。

在一个实施方案中，G³为C₃-C₈亚环烷基。在一个实施方案中，G³为C₅-C₆亚环烷基。

在一个实施方案中，G³为C₃-C₈亚环烯基。在一个实施方案中，G³为C₅-C₆亚环烯基。

在一个实施方案中，G⁴是化学键。

在一个实施方案中，G⁴为C₁-C₂₃亚烷基。在一个实施方案中，G⁴为C₁-C₁₁亚烷基。在一个实施方案中，G⁴为C₁-C₇亚烷基。在一个实施方案中，G⁴为C₁-C ₅亚烷基。在一个实施方案中，G⁴为C₁-C₃亚烷基。在一个实施方案中，G⁴为C₁亚烷基。在一个实施方案中，G⁴为C₂亚烷基。在一个实施方案中，G⁴为C₃亚烷基。在一个实施方案中，G⁴为C₄亚烷基。

在一个实施方案中，该化合物是式(II-J)，(II-J’),(II-J”),(II-K)，(II-L)或(II-M)的化合物：

其中y和z各自独立地是2至12的整数，和

u是0到23之间的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(III-J)，(III-J’),(III-J”),(III-K)，(III-L)或(III-M)的化合物：

其中y和z各自独立地是2至12的整数，和

u是0到23之间的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(IV-J)，(IV-J’),(IV-J”),(IV-K)，(IV-L)或(IV-M)的化合物：

其中y和z各自独立地是2至12的整数，和

u是0到23之间的整数。

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，u是0至12的整数。在一个实施方案中，u是0至8的整数。在一个实施方案中，u是0至6的整数。在一个实施方案中，u是0至4的整数。在一个实施例中，u为0。在一个实施例中，u为1。在一个实施例中，u为2。在一个实施例中，u为3。在一个实施例中，u为4。

在一实施例中，y为5，z为5，且u为0。

在一实施例中，y为5，z为5，且u为2。

在一个实施方案中，G⁴为C₂-C₂₃亚烯基。在一个实施方案中，G⁴为C₂-C₁₂亚烯基。在一个实施方案中，G⁴为C₂-C₈亚烯基。在一个实施方案中，G⁴为C₂-C₆亚烯基。在一个实施方案中，G⁴为C₂-C₄亚烯基。

在一个实施方案中，G⁴为C₃-C₈亚环烷基。在一个实施方案中，G⁴为C₅-C₆亚环烷基。

在一个实施方案中，G⁴为C₃-C₈亚环烯基。在一个实施方案中，G⁴为C₅-C₆亚环烯基

在一个实施方案中，R⁵为C₁-C₁₂烷基。在一个实施方案中，R⁵为C₁-C₁₀烷基。在一个实施方案中，R⁵为C₁-C₈烷基。在一个实施方案中，R⁵为C₁-C₆烷基。在一个实施方案中，R⁵为C₁-C₄烷基。在一个实施方案中，R⁵为C₁-C₂烷基。在一个实施方案中，R⁵是甲基。在一实施方案中，R⁵为乙基。在一实施方案中，R⁵为丙基。在一实施方案中，R⁵为正丁基。在一个实施方案中，R⁵为正己基。在一个实施方案中，R⁵为正辛基。在一个实施方案中，R⁵为正壬基。

在一个实施方案中，R⁵为C₃-C₈环烷基。在一个实施方案中，R⁵为环丙基。在一个实施方案中，R⁵为环丁基。在一个实施方案中，R⁵为环戊基。在一个实施方案中，R⁵为环己基。在一个实施方案中，R⁵为环庚基。在一个实施方案中，R⁵为环辛基。

在一个实施方案中，R⁴，R⁵，与它们所连接的氮一起形成一个环状部分。

在一个实施方案中，环状部分(由R⁴，R⁵，与它们所连接的氮一起形成)是杂环基。在一个实施方案中，环状部分是杂环烷基。在一个实施方案中，环状部分是4至8元杂环烷基。在一个实施方案中，环状部分是4元杂环烷基。在一个实施方案中，环状部分是5元杂环烷基。在一个实施方案中，环状部分是6元杂环烷基。在一个实施方案中，环状部分是7元杂环烷基。在一个实施方案中，环状部分是8元杂环烷基。

在一个实施方案中，环状部分(由R⁴，R⁵，与它们所连接的氮一起形成)是azetidin-1-yl。在一个实施方案中，环状部分是pyrrolidin-1-yl。在一个实施方案中，环状部分是piperidin-1-yl。在一个实施方案中，环状部分是azepan-1-yl。在一个实施方案中，环状部分是azocan-1-yl。在一个实施方案中，环状部分是morpholinyl。在一个实施方案中，环状部分是piperazin-1-yl。这些基团的连接点是到G³。

如本文所述，除非另有说明，否则R⁵的取代模式也适用于R⁴和R⁵与它们所连接的氮一起形成的环状部分。

在一个实施方案中，R⁵是未取代的。

在一个实施方案中，R⁵被一个或多个选自氧代，-OR^g，-NR^gC(＝O)R^h，-C(＝O)NR^gR^h，-C(＝O)R^h，-OC(＝O)R^h，-C(＝O)OR^h和–O-Rⁱ-OH，其中：

R^g在每次出现时独立地为H或C₁-C₆烷基；

R^h在每种情况下独立地为C₁-C₆烷基；和

Rⁱ在每次出现时独立地为C₁-C₆亚烷基。

在一个实施方案中，R⁵被一个或多个羟基取代。在一实施方案中，R⁵被一个羟基取代。

在一个实施方案中，R⁵被一个或多个羟基和一种或多种氧代取代。在一个实施方案中，R⁵被一个羟基和一个氧代取代。在一个实施方案中，R⁵是-CH₂CH₂OH。

在一个实施方案中，R⁵是-(CH₂)_pQ、-(CH₂)_pCHQR、-CHQR或-CQ(R)₂，其中Q为C₃-C₈环烷基、C₃-C₈环烯基、C₃-C₈环炔基、4-至8-元杂环基、C₆-C₁₀芳基、5-至10-元杂芳基、-OR、-O(CH₂)_pN(R)₂、-C(O)OR、-OC(O)R、-CX₃、-CX₂H、-CXH₂、-CN、-N(R)₂、-C(O)N(R)₂、-N(R)C(O)R、-N(R)S(O)₂R、-N(R)C(O)N(R)₂、-N(R)C(S)N(R)₂、-N(R)R²²、-O(CH₂)_pOR、-N(R)C(＝NR²³)N(R)₂、-N(R)C(＝CHR²³)N(R)₂、-OC(O)N(R)₂、-N(R)C(O)OR、-N(OR)C(O)R、-N(OR)S(O)₂R、-N(OR)C(O)OR、-N(OR)C(O)N(R)₂、-N(OR)C(S)N(R)₂、-N(OR)C(＝NR²³)N(R)₂、-N(OR)C(＝CHR²³)N(R)₂、-C(＝NR²³)N(R)₂、-C(＝NR²³)R、-C(O)N(R)OR或-C(R)N(R)₂C(O)OR，并且每个p独立地为1、2、3、4或5；

R²²为C₃-C₈环烷基、C₃-C₈环烯基、C₃-C₈环炔基、4-至8-元杂环基、C₆-C₁₀芳基或5-至10-元杂芳基；

R²³是H、-CN、-NO₂、C₁-C₆烷基、-OR、-S(O)₂R、-S(O)₂N(R)₂、C₂-C₆烯基、C₃-C₈环烷基、C₃-C₈环烯基、C₃-C₈环炔基、4-至8-元杂环基、C₆-C₁₀芳基或5-至10-元杂芳基；

每个R独立地为H、C₁-C₃烷基或C₂-C₃烯基；或者N(R)₂部分中的两个R与它们所附接的氮一起形成了环部分；和

每个X独立地为F、CI、Br或I。

在一个实施方案中，该化合物是式(I-N)，(I-N’),(I-N”),(I-O)，(I-P)或(I-Q)的化合物：

其中y和z各自独立地是2至12的整数；

s是2到24之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(II-N)，(II-N’),(II-N”),(II-O)，(II-P)或(II-Q)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(III-N)，(III-N’),(III-N”),(III-O)，(III-P)或(III-Q)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体

在一个实施方案中，该化合物是式(IV-N)，(IV-N’),(IV-N”),(IV-O)，(IV-P)或(IV-Q)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(I-R)，(I-R’),(I-R”),(I-S)，(I-T)或(I-U)的化合物：

其中y和z各自独立地是2至12的整数；

s是2到24之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(II-R)，(II-R’),(II-R”),(II-S)，(II-T)或(II-U)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(III-R)，(III-R’),(III-R”),(III-S)，(III-T)或(III-U)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一个实施方案中，该化合物是式(IV-R)，(IV-R’),(IV-R”),(IV-S)，(IV-T)或(IV-U)的化合物：

其中y和z各自独立地是2至12的整数；

u是0到23之间的整数；

t是1到12的整数，并且

R⁶是氢或羟基；

或其药学上可接受的盐，前药或立体异构体。

在一实施例中，y为5，z为5，且s为2。

在一实施例中，y为5，z为5，且s为4。

在一实施例中，y为5，z为5，且u为0。

在一实施例中，y为5，z为5，且u为2。

在一个实施方案中，t为1至10的整数。在一个实施方案中，t为1至8的整数。在一个实施方案中，t为1至6的整数。在一个实施方案中，t为1至4的整数。在一个实施方案中，t为1至3的整数。在一个实施方案中，t为1至2的整数。在一个实施方案中，t为1。在一个实施方案中，t为2。在一个实施方案中，t为3。在一实施例中，t为4。在一实施例中，t为5。在一实施例中，t为6。在一实施例中，t为7。

在一个实施方案中，R⁴为C₁-C₁₂烷基。在一个实施方案中，R⁴为C₁-C₈烷基。在一个实施方案中，R⁴为C₁-C₆烷基。在一个实施方案中，R⁴为C₁-C₄烷基。在一实施方案中，R⁴为甲基。在一个实施方案中，R⁴为乙基。在一个实施方案中，R⁴为正丙基。在一实施方案中，R⁴为正丁基。在一个实施方案中，R⁴为正戊基。在一个实施方案中，R⁴为正己基。在一个实施方案中，R⁴为正辛基。在一个实施方案中，R⁴为正壬基。

在一个实施方案中，R⁴为C₃-C₈环烷基。在一实施方案中，R⁴为环丙基。在一实施方案中，R⁴为环丁基。在一实施方案中，R⁴为环戊基。在一实施方案中，R⁴为环己基。在一实施方案中，R⁴为环庚基。在一实施方案中，R⁴为环辛基。

在一实施方案中，R⁴为C₃-C₈环烯基。在一实施方案中，R⁴为环丙烯基。在一实施方案中，R⁴为环丁烯基。在一实施方案中，R⁴为环戊烯基。在一实施方案中，R⁴为环己烯基。在一实施方案中，R⁴为环庚烯基。在一实施方案中，R⁴为环辛烯基。

在一个实施方案中，R⁴为C₆-C₁₀芳基。在一实施方案中，R⁴为苯基。

在一个实施方案中，R⁴为4至8元杂环基。在一个实施方案中，R⁴为4至8元杂环烷基。在一个实施方案中，R⁴为氧杂环丁烷基。在一个实施方案中，R⁴为四氢呋喃基。在一个实施方案中，R⁴为四氢吡喃基。在一个实施方案中，R⁴为四氢硫代吡喃基。在一个实施方案中，R⁴为N-甲基哌啶基。

在一个实施方案中，R⁴，G³或G³的一部分，与它们所连接的氮一起形成一个环状部分。

在一个实施方案中，环状部分(由R⁴，G³或G³的一部分，与它们所连接的氮一起形成)是杂环基。在一个实施方案中，环状部分是杂环烷基。在一个实施方案中，环状部分是4至8元杂环烷基。在一个实施方案中，环状部分是4元杂环烷基。在一个实施方案中，环状部分是5元杂环烷基。在一个实施方案中，环状部分是6元杂环烷基。在一个实施方案中，环状部分是7元杂环烷基。在一个实施方案中，环状部分是8元杂环烷基。

在一个实施方案中，环状部分(由R⁴，G³或G³的一部分，与它们所连接的氮一起形成)是azetidin-3-yl。在一个实施方案中，环状部分是pyrrolidin-3-yl。在一个实施方案中，环状部分是piperidin-4-yl。在一个实施方案中，环状部分是azepan-4-yl。在一个实施方案中，环状部分是azocan-5-yl。在一个实施方案中，环状部分是piperazin-1-yl。这些基团的连接点是这些基团的连接点是连接到G¹和G²的氮的方向。

如本文所述，除非另有说明，否则R⁴的取代模式也适用于R⁴，G³或G³的一部分，与它们所连接的氮一起形成的环状部分。

在一个实施方案中，R⁴是未取代的。

在一个实施方案中，R⁴被一个或多个选自氧代，-OR^g，-NR^gC(＝O)R^h，-C(＝O)NR^gR^h，-C(＝O)R^h，-OC(＝O)R^h，-C(＝O)OR^h和–O-Rⁱ-OH，其中：

R^g在每次出现时独立地为H或C₁-C₆烷基；

R^h在每种情况下独立地为C₁-C₆烷基；和

Rⁱ在每次出现时独立地为C₁-C₆亚烷基。

在一实施方案中，R⁴被一个或多个羟基取代。在一实施方案中，R⁴被一个羟基取代。

在一实施方案中，R⁴被一个或多个羟基和一种或多种氧代取代。在一个实施方案中，R⁴被一个羟基和一个氧代取代。

在一个实施方案中，R³具有以下结构之一：

在一个实施方案中，R³具有

的结构。

在一个实施方案中，R³具有

的结构。

在一个实施方案中，R¹和R²各自独立地为支链C₆-C₃₂烷基或支链C₆-C₃₂烯基。在一个实施方案中，R¹和R²各自独立地为支链C₆-C₂₄烷基或支链C₆-C₂₄烯基。

在一个实施方案中，R¹和R²各自独立地是-R⁷-CH(R⁸)(R⁹)，其中R⁷是C₁-C₅亚烷基，并且R⁸和R⁹独立地是C₂-C₁₀烷基或C₂-C₁₀烯基。

在一个实施方式中，R¹是直链C₆-C₃₂烷基。在一个实施方式中，R¹是直链C₆-C₂₄烷基。在一个实施方式中，R¹是直链C₇-C₁₅烷基。在一个实施方式中，R¹是直链C₇烷基。在一个实施方式中，R¹是直链C₈烷基。在一个实施方式中，R¹是直链C₉烷基。在一个实施方式中，R¹是直链C₁₀烷基。在一个实施方式中，R¹是直链C₁₁烷基。在一个实施方式中，R¹是直链C₁₂烷基。在一个实施方式中，R¹是直链C₁₃烷基。在一个实施方式中，R¹是直链C₁₄烷基。在一个实施方式中，R¹是直链C₁₅烷基。

在一个实施方式中，R¹是直链C₆-C₃₂烯基。在一个实施方式中，R¹是直链C₆-C₂₄烯基。在一个实施方式中，R¹是直链C₇-C₁₇烯基。在一个实施方式中，R¹是直链C₇烯基。在一个实施方式中，R¹是直链C₈烯基。在一个实施方式中，R¹是直链C₉烯基。在一个实施方式中，R¹是直链C₁₀烯基。在一个实施方式中，R¹是直链C₁₁烯基。在一个实施方式中，R¹是直链C₁₂烯基。在一个实施方式中，R¹是直链C₁₃烯基。在一个实施方式中，R¹是直链C₁₄烯基。在一个实施方式中，R¹是直链C₁₅烯基。在一个实施方式中，R¹是直链C₁₆烯基。在一个实施方式中，R¹是直链C₁₇烯基。

在一个实施方式中，R¹是支链C₆-C₃₂烷基。在一个实施方式中，R¹是支链C₆-C₂₄烷基。在一个实施方式中，R¹是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烷基，并且R⁸和R⁹独立地为C₂-C₁₀烷基。在一个实施方式中，R¹是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₄-C₈烷基。

在一个实施方式中，R¹是支链C₆-C₃₂烯基。在一个实施方式中，R¹是支链C₆-C₂₄烯基。在一个实施方式中，R¹是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烯基，并且R⁸和R⁹独立地为C₂-C₁₀烯基。在一个实施方式中，R¹是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₆-C₁₀烯基。

在一个实施方式中，R²为直链C₆-C₃₂烷基。在一个实施方式中，R²为直链C₆-C₂₄烷基。在一个实施方式中，R²是直链C₇-C₁₅烷基。在一个实施方式中，R²是直链C₇烷基。在一个实施方式中，R²是直链C₈烷基。在一个实施方式中，R²是直链C₉烷基。在一个实施方式中，R²是直链C₁₀烷基。在一个实施方式中，R²是直链C₁₁烷基。在一个实施方式中，R²是直链C₁₂烷基。在一个实施方式中，R²是直链C₁₃烷基。在一个实施方式中，R²是直链C₁₄烷基。在一个实施方式中，R²是直链C₁₅烷基。

在一个实施方式中，R²为直链C₆-C₃₂烯基。在一个实施方式中，R²为直链C₆-C₂₄烯基。在一个实施方式中，R²是直链C₇-C₁₇烯基。在一个实施方式中，R²是直链C₇烯基。在一个实施方式中，R²是直链C₈烯基。在一个实施方式中，R²是直链C₉烯基。在一个实施方式中，R²是直链C₁₀烯基。在一个实施方式中，R²是直链C₁₁烯基。在一个实施方式中，R²是直链C₁₂烯基。在一个实施方式中，R²是直链C₁₃烯基。在一个实施方式中，R²是直链C₁₄烯基。在一个实施方式中，R²是直链C₁₅烯基。在一个实施方式中，R²是直链C₁₆烯基。在一个实施方式中，R²是直链C₁₇烯基。

在一个实施方式中，R²是支链C₆-C₃₂烷基。在一个实施方式中，R²是支链C₆-C₂₄烷基。在一个实施方式中，R²是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烷基，并且R⁸和R⁹独立地为C₂-C₁₀烷基。在一个实施方式中，R²是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₄-C₈烷基。

在一个实施方式中，R²是支链C₆-C₃₂烯基。在一个实施方式中，R²是支链C₆-C₂₄烯基。在一个实施方式中，R²是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烯基，并且R⁸和R⁹独立地为C₂-C₁₀烯基。在一个实施方式中，R²是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₆-C₁₀烯基。

在一个实施方式中，R^c是直链C₆-C₃₂烷基。在一个实施方式中，R^c是直链C₆-C₂₄烷基。在一个实施方式中，R^c是直链C₇-C₁₅烷基。在一个实施方式中，R^c是直链C₇烷基。在一个实施方式中，R^c是直链C₈烷基。在一个实施方式中，R^c是直链C₉烷基。在一个实施方式中，R^c是直链C₁₀烷基。在一个实施方式中，R^c是直链C₁₁烷基。在一个实施方式中，R^c是直链C₁₂烷基。在一个实施方式中，R^c是直链C₁₃烷基。在一个实施方式中，R^c是直链C₁₄烷基。在一个实施方式中，R^c是直链C₁₅烷基。

在一个实施方式中，R^c是直链C₆-C₃₂烯基。在一个实施方式中，R^c是直链C₆-C₂₄烯基。在一个实施方式中，R^c是直链C₇-C₁₇烯基。在一个实施方式中，R^c是直链C₇烯基。在一个实施方式中，R^c是直链C₈烯基。在一个实施方式中，R^c是直链C₉烯基。在一个实施方式中，R^c是直链C₁₀烯基。在一个实施方式中，R^c是直链C₁₁烯基。在一个实施方式中，R^c是直链C₁₂烯基。在一个实施方式中，R^c是直链C₁₃烯基。在一个实施方式中，R^c是直链C₁₄烯基。在一个实施方式中，R^c是直链C₁₅烯基。在一个实施方式中，R^c是直链C₁₆烯基。在一个实施方式中，R^c是直链C₁₇烯基。

在一个实施方式中，R^c是支链C₆-C₃₂烷基。在一个实施方式中，R^c是支链C₆-C₂₄烷基。在一个实施方式中，R^c是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烷基，并且R⁸和R⁹独立地为C₂-C₁₀烷基。在一个实施方式中，R^c是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₄-C₈烷基。

在一个实施方式中，R^c是支链C₆-C₃₂烯基。在一个实施方式中，R^c是支链C₆-C₂₄烯基。在一个实施方式中，R^c是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烯基，并且R⁸和R⁹独立地为C₂-C₁₀烯基。在一个实施方式中，R^c是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₆-C₁₀烯基。

在一个实施方式中，R^f为直链C₆-C₃₂烷基。在一个实施方式中，R^f为直链C₆-C₂₄烷基。在一个实施方式中，R^f是直链C₇-C₁₅烷基。在一个实施方式中，R^f是直链C₇烷基。在一个实施方式中，R^f是直链C₈烷基。在一个实施方式中，R^f是直链C₉烷基。在一个实施方式中，R^f是直链C₁₀烷基。在一个实施方式中，R^f是直链C₁₁烷基。在一个实施方式中，R^f是直链C₁₂烷基。在一个实施方式中，R^f是直链C₁₃烷基。在一个实施方式中，R^f是直链C₁₄烷基。在一个实施方式中，R^f是直链C₁₅烷基。

在一个实施方式中，R^f为直链C₆-C₃₂烯基。在一个实施方式中，R^f为直链C₆-C₂₄烯基。在一个实施方式中，R^f为直链C₇-C₁₇烯基。在一个实施方式中，R^f为直链C₇烯基。在一个实施方式中，R^f为直链C₈烯基。在一个实施方式中，R^f为直链C₉烯基。在一个实施方式中，R^f为直链C₁₀烯基。在一个实施方式中，R^f为直链C₁₁烯基。在一个实施方式中，R^f为直链C₁₂烯基。在一个实施方式中，R^f为直链C₁₃烯基。在一个实施方式中，R^f为直链C₁₄烯基。在一个实施方式中，R^f为直链C₁₅烯基。在一个实施方式中，R^f为直链C₁₆烯基。在一个实施方式中，R^f为直链C₁₇烯基。

在一个实施方式中，R^f是支链C₆-C₃₂烷基。在一个实施方式中，R^f是支链C₆-C₂₄烷基。在一个实施方式中，R^f是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烷基，并且R⁸和R⁹独立地为C₂-C₁₀烷基。在一个实施方式中，R^f是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₄-C₈烷基。

在一个实施方式中，R^f是支链C₆-C₃₂烯基。在一个实施方式中，R^f是支链C₆-C₂₄烯基。在一个实施方式中，R^f是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烯基，并且R⁸和R⁹独立地为C₂-C₁₀烯基。在一个实施方式中，R^f是-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基，并且R⁸和R⁹独立地为C₆-C₁₀烯基。

在一个实施方式中，R¹、R²、R^c和R^f分别独立地为直链C₆-C₁₈烯基、直链C₆-C₁₈烯基或者-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₅亚烯基，并且R⁸和R⁹独立地为C₂-C₁₀烷基或C₂-C₁₀烯基。

在一个实施方式中，R¹、R²、R^c和R^f分别独立地为直链C₇-C₁₅烷基、直链C₇-C₁₅烯基或-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₀-C₁亚烷基并且R⁸和R⁹独立地为C₄-C₈烷基或C₆-C₁₀烯基。

在一个实施方式中，R¹、R²、R^c和R^f分别独立地为以下结构之一：

在一个实施方案中，R¹，R²，R^c和R^f各自独立地任选地被取代。在一个实施方案中，任选的取代基是-O-(C₆-C₂₄烷基)。在一个实施方案中，任选的取代基是-O-(C₆-C₂₄烯基)。在一个实施方案中，任选的取代基是-C(＝O)-(C₆-C₂₄烷基)。在一个实施方案中，任选的取代基是-C(＝O)-(C₆-C₂₄烯基)。

在一个实施方案中，R^a和R^d各自独立地为H。在一个实施方案中，R^a、R^b、R^d和R^e分别独立地为H。在一个实施方案中，R^a和R^d各自独立地为C₁-C₂₄烷基。在一个实施方案中，R^a和R^d各自独立地为C₁-C₁₈烷基。在一个实施方案中，R^a和R^d各自独立地为C₁-C₁₂烷基。在一个实施方案中，R^a和R^d各自独立地为C₁-C₆烷基。

在一个实施方案中，R^b，R^c，R^e和R^f分别独立地为正己基或正辛基。

在一个实施方式中，R^c和R^f分别独立地为支链C₆-C₂₄烷基或支链C₆-C₂₄烯基。在一个实施方式中，R^c和R^f分别独立地为-R⁷-CH(R⁸)(R⁹)，其中R⁷为C₁-C₅亚烷基并且R⁸和R⁹独立地为C₂-C₁₀烷基或C₂-C₁₀烯基。

在一个实施方案中，该化合物是表1中的化合物或其药学上可接受的盐，前药或立体异构体。

表1

应当理解的是，如上所述的本文提供的化合物的任何实施方案，以及如上所述的本文提供的化合物的任何具体的取代基和/或变量可以独立地与其他实施方案和/或取代基和/或化合物的各种变量以形成未具体阐述的实施方案。另外，在为任何特定基团或变量列出取代基和/或变量的列表的情况下，应理解，可以从特定实施方案和/或权利要求中删除每个单独的取代基和/或变量，并且其余的取代基和/或变量的列表将被认为在本文提供的实施方案的范围内。

应当理解的是，在本说明书中，仅当所描述的化学式的取代基和/或变量的组合使得化合物是稳定的情况下才是允许的。

6.4.2其他可电离脂质

如本文所述，在一些实施方案中，本文提供的纳米颗粒组合物除了包含根据式(I)至(IV)的脂质(及其子式)以外，还包含一种或多种带电或可电离的脂质。可以预期的是，纳米颗粒组合物的某些带电或两性离子脂质组分类似于细胞膜中的脂质组分，从而可以改善纳米颗粒的细胞摄取。可以形成本发明纳米颗粒组合物的一部分的示例性带电或可电离的脂质，包括但不限于，3-(二十二烷基氨基)-N1，N1,4-三十二烷基-1-哌嗪乙胺(KL10)，N1-[2-(二十二烷基氨基)乙基]-N1,N4,N4-三十二烷基-1,4-哌嗪二烯酰胺(KL22)，14,25-二十三烷基-15,18,21,24-四氮杂八孔烷(KL25)，1,2-二亚油酰氧基-N，N-二甲基氨基丙烷(DLinDMA)，2,2-二亚油基-4-二甲基氨基甲基-[1,3]-二氧戊环(DLin-K-DMA)，heptatriaconta-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(DLin-MC3-DMA)，2,2-二亚油酰基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-KC2-DMA)，1,2-二醇氧基-N，N-二甲基氨基丙烷(DODMA)，2-({8-[(3β)-cholest-5-en-3-yloxy]octyl}oxy)-N，N-dimethyl-3[(9Z，12Z)-octadeca-9,12-二烯-1-基氧基]丙-1-胺(辛基-CLinDMA)，(2R)-2-({8-[(3β)-胆甾-5-烯-3-基氧基]辛基}氧基)-N,N-二甲基-3-[[(9Z,12Z)-octadeca-9,12-dien-1-yloxy]propan-1-amine(Octyl-CLinDMA(2R))，(2S)-2-({8-[(3β)-胆甾-5-烯-3-基氧基]辛基}氧基)-N，N-二甲基乙基-3-[((9Z-,12Z)-octadeca-9,12-dien-1-yloxy]propan-1-amine(Octyl-CLinDMA(2S))，(12Z，15Z)-N，N-dimethyl-2-壬基二十二烷基12，15-den-1-胺，N，N-二甲基-1-{((1S，2R)-2-辛基环丙基}十七烷-8-胺。可以形成本发明纳米颗粒组合物的一部分的另外的示例性的带电或可电离的脂质(如lipid 5)，包括Sabniset al.“A Novel Amino Lipid Series for mRNA Delivery:Improved Endosomal Escapeand Sustained Pharmacology and Safety in Non-human Primates”,MolecularTherapy Vol.26No 6,2018中所描述的，其全部内容通过引用的方式并入本文。

在一些实施方式中，适合的阳离子脂质包括N-[1-(2,3-二油烯基氧基)丙基]-N,N,N-三甲基氯化氨(DOTMA)；N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基氯化氨(DOTAP)；1,2-二油酰基-sn-甘油基-3-乙基胆碱磷酸(DOEPC)；1,2-二月桂酰-sn-甘油基-3-乙基胆碱磷酸(DLEPC)；1,2-二肉豆蔻酰-sn-甘油基-3-乙基胆碱磷酸(DMEPC)；1,2-二肉豆蔻油酰基-sn-甘油基-3-乙基胆碱磷酸(14:1)；N1-[2-((1S)-1-[(3-氨基丙基)氨基]-4-[二(3-氨基-丙基)氨基]丁基甲酰胺基)乙基]-3,4-二[油烯基氧基]-苯甲酰胺(MVL5)；双十八基氨基-甘氨酰基精胺(DOGS)；3b-[N-(N',N'-二甲基氨基乙基)氨基甲酰基]胆固醇(DC-Chol)；双十八基二甲基溴化铵(DDAB)；SAINT-2、N-甲基-4-(二油烯基)甲基吡啶；1,2-二肉豆蔻基氧基丙基-3-二甲基羟乙基溴化铵(DMRIE)；1,2-二油酰基-3-二甲基-羟乙基溴化铵(DORIE)；1,2-二油酰基氧基丙基-3-二甲基羟乙基氯化铵(DORI)；二-烷基化氨基酸(DILA²)(例如，C18:1-norArg-C16)；二油烯基二甲基氯化铵(DODAC)；1-棕榈酰-2-油酰基-sn-甘油基-3-乙基胆碱磷酸(POEPC)；1,2-二肉豆蔻油酰基-sn-甘油基-3-乙基胆碱磷酸(MOEPC)；(R)-5-(二甲基氨)戊烷-1,2-二基二油酸脂盐酸盐(DODAPen-Cl)；(R)-5-胍基戊烷-1,2-二基二油酸脂盐酸盐(DOPen-G)；和(R)-N,N,N-三甲基-4,5-双(油酰基氧基)戊-1-氯化铵(DOTAPen)。具有在生理学pH带电的头部基团，如伯胺(例如，DODAG N',N'-双十八基-N-4,8-二氮杂-10-氨基癸酰基甘氨酸酰胺)和胍盐头部基团(例如，双-胍盐-亚精胺-胆固醇(BGSC)、双-胍三氨乙基胺-胆固醇(BGTC)、PONA和(R)-5-胍基戊烷-1,2-二基二油酸脂盐酸盐(DOPen-G))的阳离子脂质也是适合的。另一种适合的阳离子脂质是(R)-5-(二甲基氨)戊烷-1,2-二基二油酸脂盐酸盐(DODAPen-Cl)。在某些实施方式中，所述阳离子脂质是特定对映异构体或消旋形式，并且包括如上的阳离子脂质的多种盐形式(例如，氯化物或硫酸盐)。例如，在一些实施方式中，所述阳离子脂质是N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基氯化氨(DOTAP-Cl)或者N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基硫酸氨(DOTAP-硫酸盐)。在一些实施方式中，所述阳离子脂质是可离子化的阳离子脂质，如(例如)双十八基二甲基溴化铵(DDAB)；1,2-二亚油醇基氧基-3-二甲基氨基丙烷(DLinDMA)；2,2-二亚油醇基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-KC2-DMA)；七-三十烷-6,9,28,31-四烯-19-基4-(二甲基氨)丁酸酯(DLin-MC3-DMA)；1,2-二油酰基氧基-3-二甲基氨基丙烷(DODAP)；1,2-二油烯基氧基-3-二甲基氨基丙烷(DODMA)；和吗啉代胆固醇(Mo-CHOL)。在某些实施方式中，脂质纳米颗粒包括两种或更多种阳离子脂质(例如，如上的两种或更多种阳离子脂质)的组合。

另外，在一些实施方案中，可以形成本纳米颗粒组合物的一部分的带电或可电离的脂质是包括环胺基的脂质。适用于本文公开的制剂和方法的另外的阳离子脂质包括WO2015199952，WO2016176330和WO2015011633中描述的那些，其全部内容通过引用整体并入本文。

6.4.3聚合物缀合的脂质

在一些实施方案中，纳米颗粒组合物的脂质组分可包括一种或多种聚合物缀合的脂质(聚合物共轭脂质)，例如PEG化脂质(PEG脂质)。可以预期的是，纳米颗粒组合物中的聚合物共轭脂质组分可以改善胶体稳定性和/或减少纳米颗粒的蛋白质吸收。可以结合本公开使用的示例性阳离子脂质包括但不限于PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油及其混合物。例如，PEG脂质可以是PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC、PEG-DSPE、神经酰胺-PEG2000或Chol-PEG2000。

在一个实施方案中，聚合物缀合的脂质是聚乙二醇化的脂质。一些实施方案包括聚乙二醇化二酰基甘油(PEG-DAG)，如1-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻基甘油(PEG-DMG)、聚乙二醇化磷脂酰乙醇胺(PEG-PE)、PEG琥珀酸二酰基甘油(PEG-S-DAG)，如4-O-(2'，3'-二(十四烷酰氧基)丙基-1-O-(ω-甲氧基(聚乙氧基)乙基)丁二酸酯(PEG-S-DMG)、聚乙二醇化神经酰胺(PEG-cer)，或PEG二烷氧基丙基氨基甲酸酯，如ω-甲氧基(聚乙氧基)乙基-N-(2,3-二(十四烷氧基)丙基)氨基甲酸酯或2,3-二(四癸氧基)丙基-N-(ω-甲氧基)(聚乙氧基)乙基)氨基甲酸酯。

在一个实施方案中，聚合物缀合的脂质以1.0至2.5％的摩尔浓度存在。在一个实施方案中，聚合物缀合的脂质以约1.7％的摩尔浓度存在。在一个实施方案中，聚合物缀合的脂质的存在的摩尔浓度为约1.5％。

在一实施方案中，阳离子脂质与聚合物缀合脂质的摩尔比为约35∶1至约25∶1。在一个实施方案中，阳离子脂质与聚合物缀合的脂质的摩尔比为约100∶1至约20∶1。

在一个实施方案中，聚乙二醇化脂质具有下式：

或其药学上可接受的盐，互变异构体或立体异构体，其中：

R¹²和R¹³各自独立地为含有10至30个碳原子的直链或支链的饱和或不饱和烷基链，其中烷基链任选地被一个或多个酯键中断；和

w的平均值在30到60之间。

在一个实施方案中，R¹²和R¹³各自独立地为含有12至16个碳原子的直链饱和烷基链。在其他实施例中，w平均在42至55的范围内，例如，w平均为42、43、44、45、46、47、48、49、50、51、52、53、54或55。在特定实施例中，w平均约为49。

在一个实施方案中，聚乙二醇化脂质具有下式：

其中w的平均值约为49。

6.4.4结构脂质

在一些实施方案中，纳米颗粒组合物的脂质组分可包括一种或多种结构脂质。可以预期的是结构脂质可以稳定纳米颗粒的两亲结构，例如但不限于，纳米颗粒的脂质双层结构。可以结合本公开使用的示例性结构脂质包括但不限于胆固醇、非甾甾醇、谷固醇、麦角固醇、菜油甾醇、豆甾醇、芸苔甾醇、番茄碱、番茄碱、熊果酸、α-生育酚及其混合物。在某些实施方案中，结构脂质是胆固醇。在一些实施方案中，结构脂质包括胆固醇和皮质类固醇(例如泼尼松龙、地塞米松、泼尼松和氢化可的松)或其组合。

在一实施方案中，本文提供的脂质纳米颗粒包含类固醇或类固醇类似物。在一实施方案中，类固醇或类固醇类似物是胆固醇。在一个实施方案中，类固醇的存在的摩尔浓度范围为39-49％，40-46％，40-44％，40-42％，42-44％或44-46％。在一实施方案中，类固醇以40、41、42、43、44、45或46％的摩尔浓度存在。

在一个实施方案中，阳离子脂质与类固醇的摩尔比为1.0：0.9至1.0：1.2，或1.0：1.0至1.0：1.2。在一个实施方案中，阳离子脂质与胆固醇的摩尔比为约5∶1至1∶1。在一实施方案中，类固醇以类固醇的32-40％的摩尔浓度存在。

6.4.5磷脂

在一些实施方案中，纳米颗粒组合物的脂质组分可包括一种或多种磷脂，例如一种或多种(多)不饱和脂质。可以预期的是，磷脂可以组装成一个或多个脂质双层结构。可以形成本纳米颗粒组合物的一部分的示例性磷脂，包括但不限于，1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DSPC)、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DLPC)、1,2-二肉豆蔻酰基-sn-甘油磷酸胆碱(DMPC)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二十一烷酰基-sn-甘油磷酸胆碱(DUPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1,2-二-O-十八碳烯基-sn-甘油-3-磷酸胆碱(18：0Diether PC)、1-油基-2-胆甾醇基半琥珀酰-sn-甘油-3-磷酸胆碱(OChemsPC)、1-十六烷基-sn-甘油-3-磷酸胆碱(C16 Lyso PC)、1,2-二亚油酰基-sn-甘油-3-磷酸胆碱、1,2-二花生四烯酰基-sn-甘油-3-磷酸胆碱、1,2-二十二碳六烯酰基-sn-甘油-3-磷酸胆碱、1,2-二植烷酰基-sn-甘油-3-磷酸乙醇胺(ME 16.0PE)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺、1,2-二亚油酰基1-sn-甘油-3-磷酸乙醇胺、1,2-二亚油酰基-sn-甘油-3-磷酸乙醇胺、1,2-二花生四烯酰基-sn-甘油-3-磷酸乙醇胺、1,2-二十二碳六烯酰基-sn-甘油-3-磷酸乙醇胺、1,2-二油酰基-sn-甘油-3-磷酸-rac-(1-甘油)钠盐(DOPG)和鞘磷脂。在某些实施方案中，纳米颗粒组合物包括DSPC。在某些实施方案中，纳米颗粒组合物包含DOPE。在一些实施方案中，纳米颗粒组合物包括DSPC和DOPE。

另外的示例性中性脂质包括二棕榈酰基磷脂酰甘油甘油(DPPG)、棕榈酰基油酰基-磷脂酰乙醇胺(POPE)和二油酰基-磷脂酰乙醇胺4-(N-马来酰亚胺基甲基)-环己烷-1羧酸酯(DOPE-mal)、二棕榈酰基磷脂酰磷脂酰乙醇胺(DPPE)、二硬脂酰基-磷脂酰乙醇胺(DSPE)、16-O-单甲基PE、16-O-二甲基PE、18-1-反式PE、1-硬脂酰基-2-油酰基磷脂酰乙醇胺(SOPE)和1,2-二戊酰-sn-甘油-3-磷酸乙醇胺(transDOPE)。在一个实施方案中，中性脂质是1，2-二硬脂酰基-sn-甘油-3磷酸胆碱(DSPC)。在一个实施方案中，中性脂质选自DSPC，DPPC，DMPC，DOPC，POPC，DOPE和SM。

在一个实施方案中，中性脂质是磷脂酰胆碱(PC)，磷脂酰乙醇胺(PE)，磷脂酰丝氨酸(PS)，磷脂酸(PA)或磷脂酰甘油(PG)。

可以形成本发明纳米颗粒组合物的一部分的另外的磷脂也包括在WO2017/112865中描述的那些，其全部内容通过引用整体并入本文。

6.4.6剂型

根据本公开，本文所述的纳米颗粒组合物可包含至少一种脂质组分和一种或多种其他组分，例如治疗剂和/或预防剂(如本文所述的治疗性核酸)。可以将纳米颗粒组合物设计用于一种或多种特定应用或目标。可以基于特定的应用或目标和/或基于一种或多种元素的功效、毒性、费用、易用性、可用性或其他特征来选择纳米颗粒组合物的元素。类似地，可以根据元素的特定组合的功效和毒性，为特定的应用或目标选择纳米颗粒组合物的特定制剂。

纳米颗粒组合物的脂质组分可包括如本文所述的式(I)至(IV)之一(及其子式)的脂质、磷脂(例如不饱和脂质，如DOPE或DSPC等)、PEG脂质和结构脂质。脂质组分的元素可以特定的比例提供。

在一个实施方案中，本文提供了纳米颗粒组合物，其包含本文提供的阳离子或可电离的脂质化合物、治疗剂和一种或多种赋形剂。在一个实施方案中，阳离子或可电离的脂质化合物包含如本文所述的式(I)至(IV)之一及其子式的化合物，以及任选地一种或多种其他可电离的脂质化合物。在一个实施方案中，一种或多种赋形剂选自中性脂质、类固醇和聚合物缀合的脂质。在一实施方案中，治疗剂被包封在脂质纳米颗粒内或与脂质纳米颗粒缔合。

在一个实施方案中，本文提供了一种纳米颗粒组合物(脂质纳米颗粒)，其包含：

i)40至50摩尔百分数的阳离子脂质；

ii)中性脂质；

iii)类固醇；

iv)聚合物共轭脂质；和

v)治疗剂。

如本文所述的，“摩尔百分数”是指某组分相对于LNP中所有脂质组分总摩尔数(即阳离子脂质、中性脂质、类固醇和聚合物共轭脂质的总摩尔数)的摩尔百分数。

在一个实施方案中，脂质纳米颗粒占41至49摩尔百分数，41至48摩尔百分数，42至48摩尔百分数，43至48摩尔百分数，44至48摩尔百分数，45至48摩尔百分数，阳离子脂质的含量为46-48摩尔百分数，或47.2-47.8摩尔百分数。在一个实施方案中，脂质纳米颗粒占阳离子脂质的约47.0、47.1、47.2、47.3、47.4、47.5、47.6、47.7、47.8、47.9或48.0摩尔百分数。

在一个实施方案中，中性脂质以5至15摩尔百分数，7至13摩尔百分数或9至11摩尔百分数的浓度存在。在一个实施方案中，中性脂质以约9.5、10或10.5摩尔百分数的浓度存在。在一个实施方案中，阳离子脂质与中性脂质的摩尔比为约4.1：1.0至约4.9：1.0，约4.5：1.0至约4.8：1.0，或约4.7：1.0至4.8：1.0。

在一个实施方案中，类固醇的存在浓度范围为39-49摩尔百分数，40-46摩尔百分数，40-44摩尔百分数，40-42摩尔百分数，42-44摩尔百分数或44-46摩尔百分数％。在一实施方案中，类固醇以40、41、42、43、44、45或46摩尔百分数的浓度存在。在一个实施方案中，阳离子脂质与类固醇的摩尔比为1.0：0.9至1.0：1.2，或1.0：1.0至1.0：1.2。在一实施方案中，类固醇是胆固醇。

在一个实施方案中，LNP中治疗剂与脂质的比率(即，N/P，N代表阳离子脂质的摩尔，P代表作为核酸主链的一部分存在的磷酸盐的摩尔)为2：1至2。30：1，例如3：1到22：1。在一个实施方案中，N/P为6∶1至20∶1或2∶1至12∶1。示例性N/P范围包括约3：1。大约6：1，大约12：1和大约22：1。

在一个实施方案中，本文提供一种脂质纳米颗粒，其包含：

i)有效pKa大于6.0的阳离子脂质；

ii)5至15摩尔百分数的中性脂质；

iv)30至45摩尔百分数的类固醇；

v)聚合物共轭脂质；和

vi)治疗剂或其药学上可接受的盐或前药，

其中，摩尔百分数是基于脂质纳米颗粒中存在的脂质的总摩尔确定的。

在一个实施方案中，阳离子脂质可以是在选定的pH(如生理pH)下带有净正电荷的多种脂质中的任何一种。示例性的阳离子脂质在下文描述。在一个实施方案中，阳离子脂质的pKa大于6.25。在一实施方案中，阳离子脂质的pKa大于6.5。在一个实施方案中，阳离子脂质具有大于6.1，大于6.2，大于6.3，大于6.35，大于6.4，大于6.45，大于6.55，大于6.6，大于6.65或大于6.7的pKa。

在一实施方案中，脂质纳米颗粒占阳离子脂质的40至45摩尔百分数。在一实施方案中，脂质纳米颗粒占阳离子脂质的45至50摩尔百分数。

在一个实施方案中，阳离子脂质与中性脂质的摩尔比为约2∶1至约8∶1。在一个实施方案中，中兴脂质占脂质纳米颗粒中脂质的5至10摩尔百分数。

示例性的阴离子脂质包括但不限于磷脂酰甘油、二油酰磷脂酰甘油(DOPG)、二棕榈酰磷脂酰甘油(DPPG)或1,2-二硬脂酰基-sn-甘油-3-磷酸-(1'-rac-甘油)(DSPG)。

在一个实施方案中，脂质纳米颗粒含有1至10摩尔％的阴离子脂质。在一个实施方案中，脂脂质纳米颗粒含有1至5摩尔％的阴离子脂质。在一个实施方案中，脂质纳米颗粒中含有1至9摩尔％，1至8摩尔％，1至7摩尔％或1至6摩尔％的阴离子脂质。在一个实施方案中，阴离子脂质与中性脂质的摩尔比为1：1至1:10。

在一实施方案中，类固醇胆固醇。在一个实施方案中，阳离子脂质与胆固醇的摩尔比为约5∶1至1∶1。在一实施方案中，脂质纳米颗粒含有32至40摩尔％的类固醇。

在一个实施方案中，中性脂质的摩尔百分比与阴离子脂质的摩尔百分比之和为5至15摩尔百分比。在一个实施方案中，其中中性脂质的摩尔百分比和阴离子脂质的摩尔百分比的总和为7至12摩尔百分比。

在一个实施方案中，阴离子脂质与中性脂质的摩尔比为1：1至1:10。在一个实施方案中，中性脂质和类固醇的摩尔百分数的总和为35至45摩尔百分比。

在一实施方案中，脂质纳米颗粒包括：

i)45-55摩尔百分数的阳离子脂质；

ii)5-10摩尔百分数的中性脂质；

iii)1-5摩尔百分数的的阴离子脂质；和

iv)32-40摩尔百分数的的类固醇。

在一实施方案中，脂质纳米颗粒含有1.0至2.5摩尔百分数的聚合物缀合的脂质。在一个实施方案中，聚合物缀合的脂质以约1.5摩尔百分数的浓度存在。

在一实施方案中，类固醇是胆固醇。在一些实施方案中，类固醇的存在浓度范围为39至49摩尔百分数，40至46摩尔百分数，40至44摩尔百分数，40至42摩尔百分数，42至44摩尔百分数或44至46摩尔百分数。在一实施方案中，类固醇以40、41、42、43、44、45或46摩尔百分数的浓度存在。在某些实施方案中，阳离子脂质与类固醇的摩尔比为1.0：0.9至1.0：1.2，或1.0：1.0至1.0：1.2。

在一个实施方案中，阳离子脂质与类固醇的摩尔比为5∶1至1∶1。

在一实施方案中，脂质纳米颗粒中含有1.0至2.5摩尔百分数的聚合物缀合的脂质。在一个实施方案中，聚合物缀合的脂质以约1.5摩尔百分数的浓度存在。

在一个实施方案中，阳离子脂质与聚合物缀合的脂质的摩尔比为约100∶1至约20∶1。在一实施方案中，阳离子脂质与聚合物缀合脂质的摩尔比为约35∶1至约25∶1。

在一实施方案中，脂质纳米颗粒的平均直径为50nm至100nm，或60nm至85nm。

在一个实施方案中，该组合物包含本文提供的阳离子脂质，DSPC，胆固醇和PEG-脂质以及mRNA。在一个实施方案中，本文提供的阳离子脂质，DSPC，胆固醇和PEG-脂质的摩尔比为约50：10：38.5：1.5。

可以将纳米颗粒组合物设计用于一种或多种特定应用或目标。例如，可以设计纳米颗粒组合物以将治疗剂和/或预防剂(例如RNA)输送到哺乳动物体内的特定细胞、组织、器官或其系统等。可以改变纳米颗粒组合物的物理化学性质，以增加对特定身体靶标的选择性。例如，可以基于不同器官的开窗尺寸(fenestration size)来调节粒径。纳米颗粒组合物中包含的治疗剂和/或预防剂也可以基于所需的一个或多个递送靶标进行选择。例如，可以选择治疗剂和/或预防剂用于特定适应症、状况、疾病或病症和/或递送至特定细胞、组织、器官或系统等(例如，局部或特异性递送)。在某些实施方案中，纳米颗粒组合物可包含编码能够在细胞内翻译产生目的多肽的mRNA。可以专门设计这种组合物以递送至特定器官。在某些实施方案中，可以将组合物设计为特异性递送至哺乳动物肝脏。

纳米颗粒组合物中治疗剂和/或预防剂的量可以取决于纳米颗粒组合物的大小、组成、目期望靶标和/或其他性质以及治疗剂和/或预防剂的性质。例如，可用于纳米颗粒组合物中的RNA的量可取决于RNA的大小、序列和其他特征。纳米颗粒组合物中治疗剂和/或预防剂和其他元素(例如脂质)的相对量也可以调整。在一些实施方案中，纳米颗粒组合物中脂质组分与治疗剂和/或预防剂的wt/wt比可以为约5：1至约60：1，例如5：1、6：1、7：1、8：1、9：1、10：1、11：1、12：1、13：1、14：1、15：1、16：1、17：1、18：1、19：1、20：1、22：1、25：1、30：1、35：1、40：1、45：1、50：1和60：1。脂质组分与治疗剂和/或预防剂的wt/wt比可以为约10∶1至约40∶1。在某些实施方案中，重量/重量比为约20∶1。纳米颗粒组合物中治疗剂和/或预防剂的量可以通过吸收光谱法(如紫外线-可见光谱法)来测量。

在一些实施方案中，纳米颗粒组合物包含一种或多种RNA，并且可以选择一种或多种RNA、脂质及其用量以提供特定的N：P比。组合物的N：P比是指一种或多种脂质中的氮原子与RNA中磷酸基团数目的摩尔比。在一些实施例中，选择较低的N：P比。可以选择一种或多种RNA、脂质及其用量以使N：P比为约2：1至约30：1，例如2：1、3：1、4：1、5：1，6：1、7：1、8：1、9：1、10：1、12：1、14：1、16：1、18：1、20：1、22：1、24：1、26：1、28：1或30：1。在某些实施方案中，N∶P比可为约2∶1至约8∶1。在其他实施方案中，N∶P比为约5∶1至约8∶1。例如，N：P比可以为约5.0：1，约5.5：1，约5.67：1，约6.0：1，约6.5：1或约7.0：1。例如，N∶P比可以是大约5.67∶1。

纳米颗粒组合物的物理性质可以取决于其组分。例如，与包括不同的结构脂质的纳米颗粒组合物相比，包含胆固醇作为结构脂质的纳米颗粒组合物可以具有不同的特性。类似地，纳米颗粒组合物的特性可以取决于其组分的绝对或相对量。例如，包含较高摩尔分数的磷脂的纳米颗粒组合物具有与包含较低摩尔分数的磷脂的纳米颗粒组合物不同的特性。特性也可以根据纳米颗粒组合物的制备方法和条件而变化。

纳米颗粒组合物可以通过多种方法表征。例如，可以使用显微镜(如透射电子显微镜或扫描电子显微镜)来检查纳米颗粒组合物的形态和尺寸分布。动态光散射或电位测定法(如电位滴定法)可用于测量ζ电位。动态光散射也可以用于确定粒度。Zetasizer NanoZS(Malvem Instruments Ltd,Malvem,Worcestershire,UK)也可以用于测量纳米颗粒组合物的多个特征，例如粒度、多分散指数和Zeta电位。

在各种实施方案中，纳米颗粒组合物的平均尺寸可以在10snm至100snm之间。例如，平均尺寸可以为约40nm至约150nm，例如约40nm，45nm，50nm，55nm，60nm，65nm，70nm，75nm，80nm，85nm，90nm，95nm，100nm，105nm，110nm，115nm，120nm，125nm，130nm，135nm，140nm，145nm或150nm。在一些实施方案中，纳米颗粒组合物的平均尺寸可以为约50nm至约100nm，约50nm至约90nm，约50nm至约80nm，约50nm至约70nm，约50nm至约60nm，约60nm至约100nm，约60nm至约90nm，约60nm至约80nm，约60nm至约70nm，约70nm至约70nm 100nm，约70nm至约90nm，约70nm至约80nm，约80nm至约100nm，约80nm至约90nm，或约90nm至约100nm。在某些实施方案中，纳米颗粒组合物的平均尺寸可以为约70nm至约100nm。在一些实施方案中，平均尺寸可以为约80nm。在其他实施方式中，平均尺寸可以为约100nm。

纳米颗粒组合物可以是相对均匀的。可以使用多分散指数来指示纳米颗粒组合物的均匀性，例如，纳米颗粒组合物的粒度分布。小的(例如小于0.3)多分散指数通常表明窄的粒度分布。纳米颗粒组合物可以具有约0至约0.25的多分散指数，如0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.20、0.21、0.22、0.23、0.24或0.25。在一些实施方案中，纳米颗粒组合物的多分散指数可以为约0.10至约0.20。

纳米颗粒组合物的ζ电势可用于指示该组合物的电动势。例如，ζ电位可以表征纳米颗粒组合物的表面电荷。通常期望具有相对较低的带正电荷或负电荷的纳米颗粒组合物，因为带更高电荷的物质会与人体的细胞，组织和其他元素发生不良相互作用。在一些实施方案中，纳米颗粒组合物的ζ电势可以为约-10mV至约+20mV，约-10mV至约+15mV，约-10mV至约+10mV，约-10。mV至约+5mV，约-10mV至约0mV，约-10mV至约-5mV，约-5mV至约+20mV，约-5mV至约+15mV，约-5mV至约+10mV，约-5mV至约+5mV，约-5mV至约0mV，约0mV至约+20mV，约0mV至约+15mV，约0mV至约+10mV，约0mV到约+5mV，约+5mV到约+20mV，约+5mV到约+15mV，或约+5mV至约+10mV。

治疗剂和/或预防剂的包封效率描述了相对于所提供的初始量，在制备后被囊封或与纳米颗粒组合物缔合的治疗剂和/或预防剂的量。期望包封效率高(例如接近100％)。包封效率可以例如通过比较在用一种或多种有机溶剂或去污剂分解纳米颗粒组合物之前和在包含纳米颗粒组合物的溶液中处理之后的治疗剂和/或预防剂的量来测量。荧光可用于测量溶液中游离治疗剂和/或预防剂(例如，RNA)的量。对于本文所述的纳米颗粒组合物，治疗剂和/或预防剂的包封效率可以为至少50％，例如50％，55％，60％，65％，70％，75％，80％，85％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％或100％。在一些实施例中，封装效率可以是至少80％。在某些实施例中，封装效率可以是至少90％。

纳米颗粒组合物可以任选地包含一种或多种涂层。例如，可以将纳米颗粒组合物配制成具有涂层的胶囊、薄膜或片剂。本文所述的组合物的胶囊、薄膜或片剂可具有任何有用的尺寸、抗张强度、硬度或密度。

6.4.7药物组合物

根据本公开，纳米颗粒组合物可以配制成药物组合物部分或全部。药物组合物可以包括一种或多种纳米颗粒组合物。例如，药物组合物可以包括一种或多种纳米颗粒组合物，和一种或多种不同的治疗剂和/或预防剂。药物组合物可进一步包含一种或多种药学上可接受的赋形剂或辅助成分，例如本文所述的那些。药物组合物和制剂的配制和生产的一般准则，在例如Remington’s The Science and Practice of Pharmacy,21st Edition,A.R.Gennaro；Lippincott,Williams&Wilkins,Baltimore,Md.,2006等中即有相关描述。常规赋形剂和辅助成分可用于任何药物组合物中，除非其与纳米颗粒组合物的一种或多种组分不相容。如果赋形剂或辅助成分与纳米颗粒组合物的组分不相容，则其组合会导致不良的生物学作用或有害作用。

在一些实施方案中，一种或多种赋形剂或辅助成分可占包括纳米颗粒组合物的药物组合物的总质量或体积的大于50％。例如，通常一种或多种赋形剂或辅助成分可占药学的50％，60％，70％，80％，90％或更多。在一些实施方案中，药学上可接受的赋形剂为至少95％，至少96％，至少97％，至少98％，至少99％或100％纯。在一些实施方案中，赋形剂是被批准用于人类和兽医用途的。在一些实施方案中，赋形剂是由美国食品和药物管理局批准的。在一些实施方案中，赋形剂是药物级的。在一些实施方案中，赋形剂符合美国药典(USP)、欧洲药典(EP)、英国药典和/或国际药典的标准的。

根据本公开内容的药物组合物中的一种或多种纳米颗粒组合物，一种或多种药学上可接受的赋形剂和/或任何其他成分的相对量的变化调整，取决于其特征、大小等相关状况，并进一步取决于组合物的施用对象和施用途径。举例来说，药物组合物可包含0.1％至100％(wt/wt)的一种或多种纳米颗粒组合物。

在某些实施方案中，将本公开内容的纳米颗粒组合物和/或药物组合物冷藏或冷冻以用于存储和运输。例如，在4℃或更低的温度下，在约-150℃和0℃之间或在大约-80℃到大约-20℃的温度下存储，如大约-5℃，-10℃，-15℃，-20℃，-25℃，-30℃，-40℃，-50，C，-60℃，-70℃，-80℃，-90℃，-130℃或-150℃的温度下存储)。溶液形式的包含式(I)至(IV)的化合物及其子式的药物组合物是在如约-20℃，-30℃，-40℃，-50℃，-60℃，-70℃或-80℃的条件下冷藏以进行存储或运输。在一些实施方案中，本公开还涉及提高包含式(I)至(IV)中任一个的化合物及其子式的纳米颗粒组合物和/或药物组合物的稳定性的方法。通过将纳米颗粒组合物和/或药物组合物储存在4℃或更低的温度下，如在约-150℃与约0℃之间或约-80℃与约-20℃之间，如约-5℃，-10℃，-15℃，-20℃，-25℃，-30℃，-40℃，-50℃，-60℃，-70℃，-80℃，-90℃，-130℃或-150℃温度下。本文公开的纳米颗粒组合物和/或药物组合物在4℃或更低的温度下(如约4℃和-20℃之间)稳定约至少1周，至少2周，至少3周，至少4周，至少5周，至少6周，至少一个月，至少2个月，至少4个月，至少6个月，至少8个月，至少10个月，至少12个月，至少14个月，至少16个月，至少18个月，至少20一个月，至少22个月或至少24个月。在一个实施方案中，制剂在约4℃下稳定至少4周。在某些实施方案中，本公开的药物组合物包含本文公开的纳米颗粒组合物和选自Tris、乙酸盐(例如乙酸)、柠檬酸盐(如柠檬酸钠)、盐水、PBS和蔗糖中的一种或多种的药学上可接受的载体。在某些实施方案中，本公开的药物组合物的pH值在约7和8之间(如6.8、6.9、7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9或8.0，或在7.5和8或7和7.8之间)。本公开内容的药物组合物包含本文公开的纳米颗粒组合物、Tris、盐水和蔗糖，并且具有约7.5-8的pH，其适于在约-20℃下储存或运输。例如，本公开的药物组合物包含本文公开的纳米颗粒组合物和PBS，并且具有约7-7.8的pH，适合于在如约4℃或更低的温度下存储或运输。在本公开的上下文中，“稳定的”和“稳定性”是指本文公开的纳米颗粒组合物或药物组合物，在给定的制造、制备、运输、存储和/或使用条件下(如施加应力(剪切力、冻结/融化应力等))，对化学或物理变化(如降解、粒度变化、聚集变化)的抵抗力。

可以将纳米颗粒组合物和/或包含一种或多种纳米颗粒组合物的药物组合物施用于任何患者或受试者，包括可以通过将治疗剂和/或预防剂递送至患者或受试者特定的细胞、组织、器官或其系统，例如肾脏系统而提供有益治疗效果。尽管本文对纳米颗粒组合物和包括纳米颗粒组合物的药物组合物的描述主要是针对适合于对人给药的组合物，但是本领域技术人员应理解，此类组合物通常适合于对任何其他哺乳动物给药。为了使该组合物适于对各种动物给药而对适于对人给药的组合物进行修饰是众所周知的，并且普通技术的兽医药理师可以仅通过普通的实验来设计和/或进行这种修饰。预期给予该组合物的受试者包括但不限于人、其他灵长类动物和其他哺乳动物，包括与商业相关的哺乳动物，例如牛、猪、马、绵羊、猫、狗、小鼠和大鼠。

包含一种或多种纳米颗粒组合物的药物组合物，可以通过药理学领域中已知或以后开发的任何方法来制备。通常情况下，这样的制备方法包括使活性成分与赋形剂和/或一种或多种其他辅助成分结合，如果必要的话，也可以将产品分开成形和/或包装成所需的多剂量单位的单一或混合形式。

根据本公开的药物组合物可以作为单个单位剂量和/或作为多个单个单位剂量散装制备、包装和/或出售。“单位剂量”是包含预定量的活性成分(例如纳米颗粒组合物)的药物组合物的离散量。活性成分的量通常等于将被施用于受试者的活性成分的剂量和/或该剂量的方便分数，例如该剂量的一半或三分之一。

药物组合物可以制备成适合各种途径和给药方法的各种形式。例如，药物组合物可以制备成液体剂型(如乳剂、微乳剂、纳米乳剂、溶液，混悬剂、糖浆和酏剂)，可注射剂型，固体剂型(例如胶囊剂、片剂、丸剂、粉剂和颗粒剂)，用于局部和/或经皮给药的剂型(例如软膏、糊剂、乳膏、洗剂、凝胶、粉剂、溶液、喷雾剂、吸入剂和贴剂)，混悬剂，粉剂和其他形式。

用于口服和肠胃外给药的液体剂型包括但不限于药学上可接受的乳剂，微乳剂，纳米乳剂，溶液剂，混悬剂，糖浆剂和/或酏剂。除活性成分外，液体剂型还可以包含本领域常用的惰性稀释剂，例如水或其他溶剂，增溶剂和乳化剂，例如乙醇、异丙醇、碳酸乙酯、乙酸乙酯、苄醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺，油类(特别是棉籽、花生、玉米、胚芽、橄榄油，蓖麻和芝麻油)、甘油、四氢糠醇、聚乙二醇和脱水山梨糖醇的脂肪酸酯及其混合物。除惰性稀释剂外，口服组合物可包含其他治疗剂和/或预防剂，如湿润剂、乳化和悬浮剂、甜味剂、调味剂和/或加香剂等其他制剂。在用于肠胃外施用的某些实施方案中，将组合物与增溶剂例如CremophorTM、醇、油、改性油、二醇、聚山梨酯、环糊精聚合物和/或其组合混合。

可以根据已知技术使用合适的分散剂、湿润剂和/或悬浮剂来配制可注射制剂，例如可无菌注射的水性或油性悬浮液。无菌注射制剂可以是在无毒的肠胃外可接受的稀释剂和/或溶剂中的无菌注射溶液，悬浮液和/或乳剂，例如在1，3-丁二醇中的溶液。可使用的可接受的媒介物和溶剂包括水，美国林格溶液和等渗氯化钠溶液。无菌的不挥发性油通常用作溶剂或悬浮介质。为此，可以使用任何温和的不挥发性油，包括合成的甘油单酯或甘油二酯。脂肪酸如油酸可用于制备注射剂。

可注射制剂可通过细菌保留过滤器过滤和/或通过掺入无菌固体组合物形式的灭菌剂灭菌，在使用前溶解或分散在无菌水或其他无菌可注射介质中。

本发明公开了向哺乳动物细胞或器官递送治疗剂和/或预防剂，在哺乳动物细胞中产生目标多肽，以及包括对哺乳动物和/或给予使哺乳动物细胞与包含治疗剂和/或预防剂的纳米颗粒组合物接触在以哺乳动物中治疗疾病或病症的方法。

6.5方法

一方面，本文还提供了用于控制、预防和治疗受试者中由冠状病毒感染引起的感染性疾病的方法。在一些实施方案中，用本文所述方法治疗，预防或治疗的传染病是由感染冠状病毒引起的，所述冠状病毒选自SARS-CoV-2，严重急性呼吸综合征冠状病毒(SARS-CoV)，中东呼吸综合征冠状病毒(MERS-CoV)，人冠状病毒NL63(HCoV-NL63)，人冠状病毒OC43，猪流行性腹泻冠状病毒(PEDV)，猪传染性胃肠炎冠状病毒(TGEV)，猪呼吸道冠状病毒(PRCV)，蝙蝠冠状病毒HKU4，小鼠肝炎冠状病毒(MHV)，牛冠状病毒(BCoV)，禽传染性支气管炎冠状病毒(IBV)，猪三角洲冠状病毒(PdCV)。

在特定的实施方案中，用本文所述方法控制、预防或治疗的传染病是由冠状病毒感染受试者的呼吸系统，神经系统，免疫系统，消化系统和/或主要器官引起的。(人类或非人类哺乳动物)。在特定的实施方案中，用本文描述的方法治疗，预防或治疗的传染病是呼吸道感染，肺部感染，肾感染，肝脏感染，肠感染，神经系统感染，呼吸综合征，支气管炎，肺炎，胃肠炎，脑脊髓炎，脑炎，结节病，腹泻，肝炎或脱髓鞘疾病。在特定的实施方案中，传染病是由SARS-CoV-2感染引起的呼吸道感染，肺部感染，肺炎或呼吸综合征。

在一些实施方案中，用于在受试者中控制、预防和治疗由冠状病毒感染引起的感染性疾病的本方法包括向受试者施用治疗有效量的本文所述的治疗性核酸。在特定的实施方案中，治疗性核酸是如本文所述的mRNA分子。

在一些实施方案中，用于在受试者中控制、预防和治疗由冠状病毒感染引起的感染性疾病的本方法包括向受试者施用治疗有效量的包含本文所述的治疗性核酸的治疗性组合物。在特定的实施方案中，治疗性核酸是如本文所述的mRNA分子。

在一些实施方案中，用于在受试者中控制、预防和治疗由冠状病毒感染引起的传染性疾病的本方法包括向受试者施用治疗有效量的包含本文所述的治疗性核酸的疫苗组合物。在特定的实施方案中，治疗性核酸是如本文所述的mRNA分子。

在一些实施方案中，用于在受试者中控制、预防和治疗由冠状病毒感染引起的感染性疾病的本方法包括向受试者施用治疗有效量的包含本文所述的治疗性核酸的含脂质组合物。在特定的实施方案中，治疗性核酸是如本文所述的mRNA分子。

在一些实施方案中，用于在受试者中控制、预防和治疗由冠状病毒感染引起的传染病的本方法包括向受试者施用治疗有效量的包含本文所述的治疗性核酸的含脂质组合物，其中脂质含脂质的组合物被配制为将治疗性核酸封装在脂质壳中的脂质纳米颗粒。在特定的实施方案中，治疗性核酸是如本文所述的mRNA分子。在特定的实施方案中，受试者中的细胞在给药后有效摄取本文所述的含脂质的组合物(例如脂质纳米颗粒)。在具体的实施方案中，本文所述的含脂质的组合物(例如脂质纳米颗粒)被受试者的细胞内吞。

在一些实施方案中，在向需要其的受试者施用如本文所述的治疗性核酸后，包含本文所述的治疗性核酸的疫苗组合物，包含本文所述的治疗性核酸的含脂质的组合物(例如脂质纳米颗粒)因此，受试者中的细胞摄取并表达所施用的治疗性核酸以产生由该核酸编码的肽或多肽。在一些实施方案中，编码的肽或多肽衍生自冠状病毒，引起通过该方法管理，预防或治疗的感染性疾病。

6.5.1免疫反应

在一些实施方案中，在向需要其的受试者施用如本文所述的治疗性核酸后，包含本文所述的治疗性核酸的疫苗组合物，包含本文所述的治疗性核酸的含脂质的组合物(例如脂质纳米颗粒)在受试者中引起针对冠状病毒的一种或多种免疫应答。在一些实施方案中，引起的免疫应答包括针对冠状病毒的一种或多种适应性免疫应答。在一些实施方案中，引起的免疫应答包括针对冠状病毒的一种或多种先天免疫应答。一种或多种免疫应答可以采取例如抗体应答(体液应答)或细胞免疫应答例如细胞因子分泌(例如干扰素-γ)，辅助活性或细胞毒性的形式。在一些实施方案中，活化标记物在免疫细胞上的表达，共刺激受体在免疫细胞上的表达，共刺激受体的配体的表达，细胞因子的分泌，免疫细胞(例如，T淋巴细胞，B的浸润)淋巴细胞和/或NK细胞)，产生特异性识别一种或多种病毒蛋白(例如，治疗性核酸编码的病毒肽或蛋白)的抗体，效应子功能，T细胞活化，T细胞分化，T细胞增殖，B细胞分化，B细胞增殖和/或NK细胞增殖被诱导，激活和/或增强。在一些实施方案中，抑制了骨髓来源的抑制细胞(MDSC)和Treg细胞的活化和增殖。

在一些实施方案中，在向需要其的受试者施用如本文所述的治疗性核酸后，包含本文所述的治疗性核酸的疫苗组合物，包含本文所述的治疗性核酸的含脂质的组合物(例如脂质纳米颗粒)在受试者中产生一种或多种针对冠状病毒或被冠状病毒感染的细胞的中和抗体。

在具体的实施方案中，中和抗体特异性结合冠状病毒S蛋白的一个或多个表位，并抑制或降低一种或多种S蛋白的功能或活性。在特定的实施方案中，S蛋白与其细胞受体的结合被减少或抑制。在特定的实施方案中，冠状病毒S蛋白与血管紧张素转化酶2(ACE2)，氨基肽酶N(APN)，二肽基肽酶4(DPP4)，癌胚抗原相关细胞粘附分子1(CEACAM1)和/或糖的结合。宿主细胞表面被减少或抑制。在特定的实施方案中，减少或抑制了冠状病毒与宿主细胞在宿主中的附着。在特定的实施方案中，冠状病毒诱导的宿主细胞膜融合被减少或抑制。在具体的实施方案中，减少或抑制了冠状病毒对受试者宿主细胞的感染(例如进入)。在一些实施方案中，中和抗体使S蛋白功能或活性降低10％，20％，30％，40％，50％，60％，70％，80％，90％，95％或100％。

在另一个实施方案中，在受试者中产生针对冠状病毒或被冠状病毒感染的细胞的中和抗体。在特定的实施方案中，中和抗体特异性结合冠状病毒N蛋白的一个或多个表位，并抑制或降低一种或多种N蛋白的功能或活性。在特定的实施方案中，减少或抑制了冠状病毒N蛋白与复制的病毒基因组序列的结合。在具体的实施方案中，减少或抑制了将复制的病毒基因组序列包装入功能性病毒衣壳中。在特定的实施方案中，冠状病毒的存活子代的繁殖被减少或抑制。在一些实施方案中，中和抗体使S蛋白功能或活性降低10％，20％，30％，40％，50％，60％，70％，80％，90％，95％或100％。

在特定的实施方案中，中和抗体与病毒颗粒或被感染细胞表面上存在的一种或多种病毒蛋白结合，并标记病毒颗粒或被感染细胞以被受试者的免疫系统破坏。在一些实施方案中，诱导或增强了白细胞(例如巨噬细胞)对病毒颗粒的内吞作用。在一些实施方案中，诱导或增强了针对受试者中针对感染细胞的抗体依赖性细胞介导的细胞毒性(ADCC)。在一些实施方案中，诱导或增强了针对受试者中被感染细胞的抗体依赖性细胞吞噬作用(ADCP)。在一些实施方案中，诱导或增强了针对受试者中感染细胞的补体依赖性细胞毒性(CDC)。

6.5.2联合疗法

在一些实施方案中，本公开的组合物可进一步包含一种或多种其他治疗剂。在一些实施方案中，其他治疗剂是能够增强组合物的免疫原性的佐剂(例如基因性疫苗)。在一些实施方案中，其他治疗剂是增强施用对象中免疫应答的免疫调节剂。在一些实施方案中，组合物中的佐剂和治疗性核酸可在引发施用对象的免疫应答中具有协同作用。

在一些实施方案中，本公开的其他治疗剂和治疗性核酸可以共配制在一种组合物中。例如，可以将其他治疗剂配制为包含本公开的治疗性核酸的组合物的一部分。备选地，在一些实施方案中，本公开的其他治疗剂和治疗性核酸可以被配制成单独的组合物或剂量单位，用于相继或同时向施用对象施用。

在特定的实施方案中，将本公开的治疗性核酸配制为如第5.4节所述的含脂质组合物的一部分，并且将其他治疗剂配制为单独的组合物。在特定的实施方案中，本发明的治疗性核酸被配制为如第5.4节所述的含脂质的组合物的一部分，其中其他治疗剂也被配制为含脂质的组合物的一部分。

在特定的实施方案中，将本发明的治疗性核酸通过包封配制在如5.4节所述的脂质纳米颗粒的脂质壳中，并且将其他治疗剂配制为单独的组合物。在特定的实施方案中，将本发明的治疗性核酸通过包封配制在如5.4节所述的脂质纳米颗粒的脂质壳中，其中脂质纳米颗粒还包封其他治疗剂分子或编码其他治疗剂分子的核酸。在特定的实施方案中，将本发明的治疗性核酸通过包封配制在如5.4节所述的脂质纳米颗粒的脂质壳中，其中脂质纳米颗粒和其他治疗剂配制为单独的组合物。

在特定的实施方案中，其他治疗剂是佐剂。在一些实施方案中，佐剂包含在施用对象中促进树突细胞(DC)成熟的试剂，例如但不限于，脂多糖、TNF-α或CD40配体。在一些实施方案中，佐剂是被施用对象的免疫系统识别为“危险信号”的试剂，例如LPS、GP96等。

在一些实施方案中，佐剂包含免疫刺激性细胞因子，例如但不限于IL-1，IL-2，IL-3，IL-4，IL-5，IL-6，IL-7，IL-8，IL-9，IL-10，IL-12，IL-13，IL-14，IL-15，IL-16，IL-17，IL-18，IL-19，IL-20，IL-21，IL-22，IL-23，IL-24，IL-25，IL-26，IL-27，IL-28，IL-29，IL-30，IL-31，IL-32，IL-33，INF-α，IFN-β，INF-γ，GM-CSF，G-CSF，M-CSF，LT-β或TNF-α，生长因子，如hGH。

在一些实施方案中，佐剂包含已知的能够引发先天免疫应答的化合物。此类化合物的一类示例是Toll样受体配体，例如人Toll样受体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10，和鼠Toll样受体的配体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、TLR11、TLR12或TLR13。这类化合物的另一类示例是免疫刺激性核酸，例如含有CpG基序的寡核苷酸。包含CpG的核酸可以是DNA(CpG-DNA)或RNA(CpG-RNA)分子。CpG-RNA或CpG-DNA可以是单链CpG-DNA(ss CpG-DNA)、双链CpG-DNA(dsDNA)、单链CpG-RNA(ss CpG-RNA)或双链CpG-RNA(ds CpG-RNA)。在一些实施方案中，CpG核酸为CpG-RNA的形式。在特定的实施方案中，CpG核酸为单链CpG-RNA(ss CpG-RNA)的形式。在一些实施方案中，CpG核酸包含至少一个或多个(促有丝分裂的)胞嘧啶/鸟嘌呤二核苷酸序列(CpG基序)。在一些实施方案中，包含在这些序列中的至少一个CpG基序(即形成CpG基序的C(胞嘧啶)和/或G(鸟嘌呤))未被甲基化。

在一些实施方案中，其他治疗剂是激活、增强或恢复正常免疫功能的免疫调节剂。在特定的实施方案中，免疫调节剂是免疫细胞，例如T淋巴细胞、NK细胞或抗原呈递细胞(例如树突细胞或巨噬细胞)的共刺激信号的激动剂。在具体的实施方案中，免疫调节剂是免疫细胞，例如T淋巴细胞、NK细胞或抗原呈递细胞(例如树突细胞或巨噬细胞)的抑制信号的拮抗剂。

本领域技术人员已知的各种免疫细胞刺激剂可以与本公开结合使用。在某些实施方案中，共刺激信号的激动剂是在免疫细胞如T淋巴细胞(例如CD4+或CD8+T淋巴细胞)、NK细胞和/或抗原呈递细胞(例如树突状细胞或巨噬细胞)上发现的共刺激分子(例如共刺激受体)的激动剂。共刺激分子的具体实例包括糖皮质激素诱导的肿瘤坏死因子受体(GITR)、诱导型T细胞共刺激物(ICOS或CD278)、OX40(CD134)、CD27、CD28、4-IBB(CD137)、CD40、淋巴毒素α(LT alpha)、LIGHT(lymphotoxin-like,exhibits inducible expression,andcompetes with herpes simplex virus glycoprotein D for HVEM,a receptorexpressed by T lymphocytes，T细胞上可诱导表达的与HSV的糖蛋白D竞争结合HVEM的淋巴毒素类似物)、CD226、细胞毒性和调节性T细胞分子(CRT AM)、死亡受体3(DR3)、淋巴毒素β受体(LTBR)、穿膜蛋白活化物(TACI)、B细胞激活因子受体(BAFFR)和B细胞成熟蛋白(BCMA)。

在具体的实施方案中，共刺激受体的激动剂是特异性结合该共刺激受体的抗体或其抗原结合片段。共刺激受体的具体实例包括GITR、ICOS、OX40、CD27、CD28、4-1BB、CD40、LTα、LIGHT、CD226、CRT AM、DR3、LTBR、TACI、BAFFR和BCMA。在某些特定的实施方案中，抗体是单克隆抗体。在其他具体的实施方案中，抗体是sc-Fv。在一个具体的实施方案中，该抗体是与免疫细胞上的两个受体结合的双特异性抗体。在其他实施方案中，双特异性抗体结合免疫细胞上的受体和病毒感染的患病细胞上的另一受体。在具体的实施方案中，抗体是人抗体或人源化抗体。

在另一个实施方案中，共刺激受体的激动剂是共刺激受体的配体或其功能衍生物。在某些实施方案中，配体是天然配体的片段。天然配体的具体实例包括ICOSL、B7RP1、CD137L、OX40L、CD70、疱疹病毒侵入介体(HVEM)、CD80和CD86。编码天然配体的核苷酸序列以及天然配体的氨基酸序列是本领域已知的。

在特定的实施方案中，拮抗剂是在免疫细胞例如T淋巴细胞(如CD4+或CD8+T淋巴细胞)、NK细胞和/或抗原呈递细胞(例如树突状细胞或巨噬细胞)上发现的抑制分子(例如抑制受体)的拮抗剂。抑制分子的具体例子包括细胞毒性T淋巴细胞相关抗原4(CTLA-4或CD52)、程序性细胞死亡蛋白1(PD1或CD279)、B和T淋巴细胞减毒剂(BTLA)、杀伤细胞免疫球蛋白样受体(KIR)、淋巴细胞激活基因3(lymphocyte activation gene 3，LAG3)、T细胞膜蛋白3(TIM3)、CD 160、腺苷A2a受体(A2aR)、带有免疫球蛋白和ITIM结构域的T细胞免疫受体(TIGIT)、白细胞相关的免疫球蛋白样受体1(LAIR1)和CD 160。

在另一个实施方案中，抑制受体的拮抗剂是与抑制受体的天然配体特异性结合并阻止天然配体与抑制受体结合并转导抑制信号的抗体(或抗原结合片段)。在某些特定的实施方案中，抗体是单克隆抗体。在其他具体的实施方案中，抗体是sc-Fv。在一个具体的实施方案中，该抗体是与免疫细胞上的两个受体结合的双特异性抗体。在其他实施方案中，双特异性抗体结合免疫细胞上的受体和病毒感染的患病细胞上的另一受体。在具体的实施方案中，抗体是人或人源化抗体。

在另一个实施方案中，抑制性受体的拮抗剂是可溶受体或其功能性衍生物，其与抑制性受体的天然配体特异性结合，并阻止天然配体与抑制性受体结合并转导抑制信号。用于抑制性受体的天然配体的具体实例包括PDL-1、PDL-2、B7-H3、B7-H4、HVEM、Gal9和腺苷。结合天然配体的抑制性受体的具体实例包括CTLA-4、PD-1、BTLA、KIR、LAG3、TIM3和A2aR。

在另一个实施方案中，抑制受体的拮抗剂是与抑制受体结合但不转导抑制信号的抗体(或抗原结合片段)或配体。抑制性受体的具体实例包括CTLA-4、PD1、BTLA、KIR、LAG3、TIM3和A2aR。在某些特定的实施方案中，抗体是单克隆抗体。在其他具体的实施方案中，抗体是scFv。在特定的实施方案中，抗体是人抗体或人源化抗体。抑制受体的抗体的具体实例是抗CTLA-4抗体(Leach DR，et al.Science 1996；271：1734-1736)。抗抑制受体的抗体的另一个实例是抗PD-1抗体(Topalian SL，NEJM 2012；28：3167-75)。

6.5.3患者人群

在一些实施方案中，将本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物，包含本文所述治疗性核酸的含脂质的组合物(例如脂质纳米颗粒)或本文所述的组合疗法施用至有需要的对象。

在一些实施方案中，将本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法施用至人类对象。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是老人。在一些实施方案中，本文所述的治疗性核酸，包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是成人。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是人类儿童。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述的治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是人类的人类幼儿。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述的治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是人类婴儿。

在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象是非人类哺乳动物。

在一些实施方案中，施用本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的对象，其是表现出至少一种与冠状病毒感染有关的症状的。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象，其是表现出上呼吸道感染、下呼吸道感染、肺部感染、肾感染、肝感染、肠感染、肝感染、神经系统感染、呼吸综合征、肺炎、肠胃炎、脑脊髓炎、脑炎、结节病、腹泻、肝炎和脱髓鞘疾病的一种或多种症状的。

在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法的施用对象，其是无冠状病毒感染症状的。

在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的联合疗法，施用至对冠状病毒易感或有感染风险的施用对象。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象是老年人。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象是成人。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象人类儿童。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象人类幼儿。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象是人类成年婴儿。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象，是现有影响免疫系统的健康问题的人。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象，是现有影响主要器官功能的健康问题的人。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象，是现有影响肺功能的健康问题的人。在一些实施方案中，对冠状病毒易感或有感染风险的施用对象，是现有影响到免疫系统或主要器官(如肺)功能的健康问题的老年人。在该段落中描述的各种实施方案中，对冠状病毒易感或有感染风险的施用对象，可以是表现出冠状病毒感染的症状的或无冠状病毒感染症状的。

在一些实施方案中，将本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法施用至被诊断出冠状病毒感染阳性的施用对象。在一些实施方案中，被诊断为冠状病毒感染阳性的施用对象是无冠状病毒感染症状的，并且该诊断是基于从来自其的样品中检测到病毒核酸或蛋白质的存在。在一些实施方案中，诊断是基于患者所表现出的临床症状。可以作为诊断依据的典型症状，包括但不限于，上呼吸道感染、下呼吸道感染、肺部感染、肾感染、肝感染、肠感染、肝感染、神经系统感染、呼吸综合征、肺炎、肠胃炎、脑脊髓炎、脑炎、结节病、腹泻、肝炎和脱髓鞘疾病。在一些实施方案中，诊断是基于所表现出的临床症状，结合与具有携带冠状病毒高风险的地理位置、人群和/或个人的接触史(如与另外一个被诊断冠状病毒感染阳性的人接触)。

在一些实施方案中，将本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法施用至先前未接受过治疗性核酸、疫苗组合物、含脂质的组合物(例如脂质纳米颗粒)或组合疗法给药的施用对象。

在一些实施方案中，将本文所述治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法施用至先前已经接受过治疗性核酸、疫苗组合物、含脂质的组合物(例如脂质纳米颗粒)或组合疗法给药的受试者。在特定的实施方案中，施用对象先前已被给予本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或组合疗法，一次、两次、三次或更多次。

在一些实施方案中，将本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法，施用至在给予治疗性核酸，疫苗组合物，含脂质的组合物(例如脂质纳米颗粒)或组合疗法之前接受过治疗的施用对象。在一些实施方案中，本文所述的治疗性核酸、包含本文所述治疗性核酸的疫苗组合物、包含本文所述治疗性核酸的含脂质组合物(例如脂质纳米颗粒)或本文所述的组合疗法的施用对象，是经历了先前疗法的副作用或由于毒性水平不可接受而终止治疗的。

6.5.4给药剂量和频率

在治疗、预防和/或治疗传染性疾病中有效的治疗性核酸或其组合物的量将取决于所治疗疾病的性质、给药途径、施用对象的总体健康状况等。并且应根据医生的判断决定。可以可选地采用标准临床技术，例如体外测定法，以帮助确定最佳剂量范围。然而，本文所述用于治疗的治疗性核酸的合适剂量范围通常为约0.001mg、0.005mg、0.01mg、0.05mg、0.1mg、0.5mg、1.0mg、2.0mg、3.0mg、4.0mg、5.0mg、10.0mg，0.001mg至10.0mg，0.01mg至1.0mg，0.1mg至1mg和0.1mg至5.0mg。可以根据需要，将所述治疗性核酸或其组合物分一次，两次，三次，四次或更多次地给予对象。有效剂量可以从源自体外或动物模型测试系统的剂量反应曲线中推断出来。

在某些实施方案中，将治疗性核酸或其组合物以单剂量，随后在1至6周、1至5周、1至4周、1至3周、1至2周后给以第二剂量的方式的施用于施用对象。根据这些实施方案，可以在第二次接种后以6至12个月的间隔向施用对象施用来加强接种。

在某些实施方案中，可以重复施用治疗性核酸或其组合物，所述施用间隔至少1天、2天、3天、5天、6秒、7天、10天、14天、15天、21天、28天、30天、45天、2个月、75天、3个月或至少6个月。在其他实施方案中，可重复施用治疗性核酸或其组合物，所述施用间隔1至14天、1至7天、7至14天、1至30天、15至30天、15至45天、15到75天、15到90天、1到3个月、3到6个月、3到12个月或6到12个月。在一些实施方案中，将第一治疗性核酸或其组合物给予受试者，随后给予第二治疗性核酸或其组合物。在某些实施方案中，第一治疗核酸和第二治疗核酸或其组合物可以相隔至少1天、2天、3天、5天、6天、7天、10天、14天、15天、21天、28天、30天、45天、2个月、75天、3个月或至少6个月。在其他实施方案中，第一治疗核酸和第二治疗核酸或其组合物可以间隔1至14天、1至7天、7至14天、1至30天、15至30天、15至45天、15至75天、15至90天、1至3个月、3至6个月、3至12个月或6至12个月。

在某些实施方案中，将治疗性核酸或其组合物与一种或多种另外的疗法(例如下文第5.5.2节中描述的疗法)组合给予受试者。其他一种或多种另外的疗法的剂量取决于包括例如传染病的性质、给药途径、施用对象的总体健康状况等多种因素，且应根据医生的判断来决定。在特定的实施方案中，另一种疗法用于治疗的推荐剂量和/或频率是根据本文公开的方法推荐用于该疗法的单一剂量和/或给药频率。在其他实施方案中，根据本文公开的方法，与推荐作为单一药剂使用的疗法相比，另一疗法的剂量是该疗法的剂量更低和/或频率更低。有关批准的疗法的推荐剂量，请参见《内科医师参考手册》(Physician’s DeskReference)。

在某些实施方案中，将治疗性核酸或其组合物与一种或多种其他疗法同时施用于施用对象。在其他实施方案中，每3至7天、1至6周、1至5周、1至4周、2至4周、1至3周或1至2周向对象施用治疗性核酸或其组合物，每3到7天、1到6周、1到5周、1到4周、1到3周或1到2周使用一种或多种其他疗法(如本文第5.5.2节中所述)。在某些实施方案中，每1-2周将治疗性核酸或其组合物施用于施用对象，并且每2-4周施用一种或多种另外的疗法(例如本文第5.5.2节中所述)。在一些实施方案中，每周向施用对象施用治疗性核酸或其组合物，并且每2周施用一种或多种另外的疗法(例如本文第5.5.2节中所述)。

7.实施例

本节中的实施例(即第6节)仅作为示例提供而并非是对本发明的限制。

7.1实施例1：mRNA的合成与纯化

DNA线性化。将包含编码S1亚基、几种不同版本的受体结合域(RBD)目标序列、或冠状病毒SARS-CoV-2Spike(S)蛋白的受体结合基序(RBM)、5’-UTR和3’-UTR和polyA信号的DNA质粒模板，使用限制性酶消化进行性化。用每10μg质粒与10U Esp3I/BsmBI混合，在37℃下孵育4小时以确保完全线性化。加入1/10体积的3M乙酸钠(pH 5.5)和2.5倍体积的乙醇终止反应，充分混合并在–20℃冷却1h。在4℃条件下，13800g离心15分钟沉淀线性化的DNA，用70％乙醇洗涤两次，重悬于无核酸酶的水中。

mRNA的体外转录。下表示典型的20μL反应混合物的体系：

将反应混合物在37℃下孵育6小时，然后添加1μl DNase I(无RNase，1U/μL)以除去DNA模板，在37℃下孵育30分钟。合成的RNA通过添加0.5倍体积的7.5M LiCl，7.5M LiCl，50mM EDTA并在–20℃下孵育45分钟，然后在4℃下以13800g离心15分钟以沉淀mRNA来进行纯化。然后除去上清液，并用500μL冷70％乙醇冲洗沉淀物两次，将mRNA重悬于无核酸酶的H2O中，将浓度调节至1mg/mL，并保存于–20℃。

mRNA加帽。将每份10μg未封端的mRNA在65℃加热10分钟，在冰上放置5分钟，然后与10U Vaccinia Capping Enzyme、50U mRNA Cap 2′-O-甲基转移酶、0.2mM SAM、0.5mMGTP和1U RNase抑制剂混合，并在37℃下孵育60分钟以生成cap1修饰结构。如前所述，修饰的mRNA由LiCl沉淀，并将RNA重悬于无核酸酶的H2O中，并保存于–20℃。

HPLC纯化。使用C4柱(5μm)(10mm×250mm column)，通过高效液相色谱(HPLC)纯化RNA。缓冲液A含有0.1M乙酸三乙铵(TEAA)，(pH＝)7.0；缓冲液B含有0.1MTEAA(pH＝7.0)和25％乙腈。

图1示体外转录的mRNA的示例性HPLC纯化。如图1所示，mRNA分子是通过上述体外转录和成熟过程获得，并使用HPLC从反应体系中纯化出来。

7.2实施例2：体外转染和抗原表达分析

将实施例1中产生的编码SARS-CoV-2S蛋白抗原的不同mRNA分子转染到表达细胞系(如HEK293F和Hela培养的细胞)中，以评估mRNA分子的体外表达效率。

为了组装mRNA-脂质复合物，在两个单独的试管中分别加入1μL脂质体(Lipofectamine)与30μL Opti-MEM混合液，1μg mRNA与30μL Opti-MEM混合液。将两个样品混合并在室温下孵育5分钟。将50μL的这种复合物用于转染24孔板的单孔中存在的细胞，并将细胞在合适湿度的37℃/5％CO2培养箱中孵育直至用于分析。

表达分析。转染后24小时转移细胞，并在室温下以200RCF离心5分钟。接下来，将细胞用4％(v/v)多聚甲醛处理30分钟，并用PBS洗涤。其后，将细胞用0.2％(v/v)Triton X-100处理10分钟，并用PBS洗涤。然后，将细胞用5％(w/v)牛血清白蛋白封闭1小时，并用PBS洗涤。接下来，将细胞与几种兔抗SARS-CoV-2S蛋白抗体在4℃孵育1小时，并用FITC标记的抗兔抗体(1：200)作为二抗进行标记30分钟，然后用PBS洗涤和DAPI染色进行计数。通过共聚焦激光扫描显微镜检测信号。

特别地，图2显示了用编码SARS-CoV-2S蛋白RBD序列的mRNA构建体转染的Hela细胞的示例性共聚焦荧光显微图像(RBD样品1)。将细胞分别与三种识别SARS-CoV-2的S蛋白RBD的单克隆抗体，即SARS-2-H014，SARS-2-mh001和SARS-2-mh219一起孵育。

如图2所示，体外转录的编码SARS-CoV-2S蛋白RBD的mRNA分子有效转染了Hela细胞系。转染的Hela细胞系以预期水平表达了编码的病毒抗原，这可以通过本研究中使用的三种单克隆抗体来识别。转染的Hela细胞系保持了正常的细胞形态，表明编码的病毒抗原的表达不会引起细胞毒性。

蛋白质印迹。对于分泌的蛋白质，例如SARS-CoV-2S蛋白质或其片段，收集用实施例1中的mRNA分子转染的细胞培养物，在转染后24小时通过Western印迹进行分析。然后行SDS-PAGE，将蛋白质转移到印迹膜上。用PBS短暂漂洗印迹，然后在室温下与添加的兔抗Spike RBD抗体孵育2小时。将印迹在PBS中充分洗涤。加入缀合有HRP的抗兔抗体，并在室温下轻轻搅拌孵育1小时。用PBS洗涤膜，并与添加的合适的酶底物溶液一起温育以显现蛋白条带。

图3显示了用编码SARS-CoV-2S蛋白RBD序列的mRNA分子转染的Hela细胞的培养上清液的示例性蛋白质印迹分析。特别地，标记为“RBD样品1”和“RBD样品2”的泳道分别装载了用编码本文所述的不同SARS-CoV-2S蛋白RBD序列的mRNA构建体转染的Hela细胞的培养上清液。标记为“rRBD-His”的泳道装载有C端融合His标签的重组SARS-CoV-2S蛋白RBD序列。标记为“NT”的泳道装载用无关mRNA构建体转染的Hela细胞的细胞培养上清液，作为阴性对照组。

如图3所示，编码SARS-CoV-2S蛋白RBD的体外转录的mRNA构建体有效转染了Hela细胞系。转染的Hela细胞系以预期水平表达和分泌编码的病毒抗原。约30kD附近的条带对应于以单体形式分泌的病毒抗原。大约60kD附近的条带对应于以二聚体形式分泌的病毒抗原。可以预期的是，与单体形式相比，多聚化形式的分泌型病毒抗原的在施予疫苗施用对象时可以更具免疫原性和更有效地诱导体液免疫应答。如图3所示，由mRNA构建体编码的病毒抗原可以在表达后进行多聚化，表明在施用于受试者后mRNA构建体在引发针对病毒的免疫应答中的有效性。

ELISA。通过ELISA确定细胞培养上清液中mRNA编码的病毒肽或蛋白质的表达量。特别地，为了进行ELISA分析，将微量滴定板孔用100μl含5μg/ml SARS-CoV-2S蛋白RBD的溶液包被，并用板膜封闭在4℃下孵育12小时。然后，将微量滴定板在洗涤缓冲液中洗涤3次。接下来，将300μl 5％BSA的PBST加到每个孔中，并在37℃下孵育60分钟。接下来，将微量滴定板在洗涤缓冲液中洗涤4次。接下来，将培养上清液样品和SARS-CoV-2S蛋白RBD标准品在洗涤缓冲液中稀释，并一式三份将100μl适当稀释的样品和标准品添加到相关孔中。接下来，将所述孔在37℃下孵育60分钟，并在洗涤缓冲液中洗涤3次。接下来，将100μL兔抗SARS-CoV-2S蛋白抗体添加到平板的每个孔中。接下来，将微量滴定板覆盖并在37℃下孵育60分钟，在洗涤缓冲液中洗涤3次。接下来，将100μl稀释的HRP缀合的抗兔抗体添加至每个孔，并在37℃下孵育1小时，并在洗涤缓冲液中洗涤3次。接下来，将100μl TMB底物溶液添加到每个孔中，在室温下(如果需要，在黑暗中)孵育大约10分钟。接下来，将100μL终止液添加到每个孔中，并轻轻地彻底地混合。接下来，使用Molecular Devices读板仪读取450/620nm处的OD值以进行检测。

图4显示了一种示例性ELISA分析，该方法分别测量了用两种mRNA构建体转染细胞的培养上清液中mRNA编码的SARS-CoV-2SRBD蛋白(分别称为“RBD样品1”和“RBD样品2”)的蛋白浓度(ng/mL)。BSA用作ELISA的阴性对照。这项研究进一步证明，用ELISA定量后，转染了mRNA构建体的细胞以预期水平表达和分泌了所编码的病毒抗原。

7.3实施例3：用含mRNA的LNP接种小鼠产生中和抗体

通过肌肉注射100μL的LNP制剂为BALB/c小鼠接种疫苗，该制剂含有10μg编码SARS-CoV-2S RBD蛋白的mRNA(RBD样品1)，并分别在接种后第7、14、21和28天从尾静脉采血。一组小鼠在第一次注射后14天，第二次肌肉注射相同剂量的含mRNA的LNP制剂，以加强免疫力，第二次注射后的第7、14、21和28天从尾静脉采血。测定收集的小鼠血清的50％空斑减少中和试验效价值(PRNT 50)，以评估接种动物中和抗体的产生情况。

PRNT分析。进行空斑减少中和试验效价(PRNT)测定时，将待测抗体的血清样品或抗体溶液稀释并与病毒悬浮液混合。然后将混合物孵育以使抗体与病毒反应。接下来，将混合物倒在宿主细胞的培殖单层上。细胞层的表面覆盖有一层琼脂糖或羧甲基纤维素，以防止病毒肆意传播。空斑形成单位(PFU)的浓度可以通过几天后形成的空斑(受感染细胞的区域)的数量来估计。根据病毒，可以通过显微镜观察与被感染细胞反应的荧光抗体或特定染料来测量噬斑形成单位。与无病毒血清相比，空斑数量减少50％的血清浓度可以衡量存在抗体量和有效性。该测量值表示为PRNT 50值。

特别地，在此项研究中，将如上所述收集的小鼠血清在55℃下热灭活30分钟，然后在PBS中连续稀释至1:50、1:100、1:200、1:400和1:800。向每种血清稀释液中加入等体积的含有100PFU SARS-CoV-2假病毒的PBS。将每种混合物在37℃下孵育30分钟后，添加到VeroE6单层的连续培养物中，并使其在37℃下孵育60分钟。用在标准Vero E6细胞培养基中融化的4ml 0.8％琼脂糖覆盖细胞单层，并在2天后用中性红染色将噬菌斑溶解。然后计算PRNT50值并将其绘制在图5中。特别地，Y轴显示PRNT 50值的倒数(即1/PRNT 50)。X轴显示如下的动物组：“RBD”表示仅接受第一次注射的小鼠；“RBD-B”表示接受第一次注射和加强注射的小鼠；“对照”表示一组小鼠肌肉注射100μl不含mRNA的LNP制剂，并在14天后用相同剂量的空白LNP加强免疫。

如图5所示，接种了含治疗性mRNA的LNP的动物产生中和抗体，该抗体显着降低了SARS-CoV-2对细胞的感染。这表明，本发明的含治疗性mRNA的LNP组合物可以用于治疗、控制或预防冠状病毒SARS-CoV-2的感染。

7.4实施例4：mRNA-LNP样品小鼠体内RBD表达量与mRNA含量相关性研究

以下实验是为了建立冠状病毒SARS-CoV-2mRNA疫苗成品动物体内RBD表达量检测方法，探索RBD表达量与成品中mRNA含量的相关性。

动物分组及给药信息如下：

实验动物ICH小鼠分别按照上述表格以静脉注射方式给予不同的受试物，于给药后6h，二氧化碳深度麻醉后心脏采集血液，室温静置30min左右后分离血清(4℃，8000rpm(5724g)，10min)，血清分装(一式3份，每份大于110ul；如果不能保证3份均满足，至少2份满足，并标注每管的血量)保存于-80℃冰箱，剩余10只空白小鼠全部收集血清，将其混匀后小管分装。

血清中RBD表达量使用如下ELISA方法检测：

使用前将所有样本和试剂恢复至室温。

向酶标板中加入100μL ACE2包被储存液，封闭板膜封上，在4℃下孵育15小时；

弃去孔内液体，用清洗缓冲液洗板3次，300μL/孔，每次浸泡2min；

3)加入300μL/孔封闭液，用封闭板膜封上，并在37℃下孵育1小时；

将100μL稀释后待测样品和标准品加入酶标板中，用封闭板膜封上，在37℃下孵育1小时；

向板的每个孔中加入100μL一抗储存液，用封板覆膜覆盖，37℃孵育1小时；

向板的每个孔加入100μL HRP二抗储存液，用封板覆膜覆盖，37℃孵育1小时；

向各微孔中加入100μL TMB底物溶液，在室温下避光孵育约5min；

向各微孔中加入100μL ELISA终止液；

结果测定方法为用多功能酶标仪上设置检测波长450nm和620nm，Standard Curve里设置Curve Fit/5-参数回归；待测样品Dilution Factor设置为2；标准曲线和样品设置，进行(模板设置可以在读数开始前设置)，并测定其吸收值；

结果计算方法为使用软件自动计算,以蛋白标准品的蛋白浓度(X)对其相应荧光值(Y)作5-参数回归，计算得出样品中蛋白浓度(Unk-dilution/AdjResult)

实验动物中血清中RBD的含量检测结果如图6及表6所示：所有小鼠血清中“空白血清“样品未检出RBD浓度。观察到1ug至5ug mRNA之间存在明显的剂量依赖性，表达出来的RBD含量为0.14-2.18ng/mL。

表6

7.5实施例5：抗原免疫原性分析

以下实验目的是评价本发明所述的装载了编码SARS-CoV-2冠状病毒S-RBD蛋白的mRNA分子脂质体(RBD mRNA-LNP)的免疫原性。

每组的动物数及详细的免疫途径、剂量和方案见下表。实验动物BALB/c小鼠于第0天右后肢单点肌肉注射受试抗原(10μg/50μL/只鼠)。第14天再次接种相同剂量的受试疫苗。详细的给药方法、给药剂量和给药途径如下：

注：a：第1次免疫当天定义为第0天。

第一次免疫前，随机挑选4只小鼠采血制备血清(150μL以上)，并收集血清不加抗凝剂用于监测，如下表。

样品总共为52份，分别为：一免前4份血清；一免后14天16份血清；一免后21天16份血清；一免后28天16份血清。血清收集完毕后一起进行冠状病毒RBD IgG滴度检测.本实验采用万泰生物开发的“小鼠抗新冠病毒(2019-nCoV)S-RBD蛋白IgG抗体检测试剂盒”进行IgG滴度检测。将待测血清用样品稀释液从1：10开始进行10倍梯度稀释，轻轻震荡混匀，每孔加入稀释好的样品或者阴性，阳性对照各100μL；封板膜封板，37度30min，截掉封板膜，洗涤5次，每次300μL,最后一次扣干。每孔加入酶标试剂100μL，空白孔除外。37度30min，截掉封板膜，洗涤5次，每次300μL，每孔分别加入显色剂A和B各50mL，轻轻振荡混匀，37度避光显色15min。每孔加终止液50μL,轻轻混匀，10分钟内测定结果。设定酶标仪波长于450nm处。选取检测结果为阳性的最大稀释倍数，Titer结果为最大阳性稀释倍数的OD值/0.1*对应稀释倍数。

具体的，在第0天以单剂量(10μg)的mRNA疫苗免疫小鼠，并在第14天给予加强剂量(10μg)。在免疫后第14、21和29天分别检测小鼠血清中抗S-RBD IgG抗体的水平，结果如图7所示。接种mRNA-LNP组小鼠在第二针加免后一周特异性IgG滴度由14天的约1/900提高到第21天的1/70000，并在29天时维持相同的水平。与之相比，空脂质体及PBS对照组均没有RBD特异性IgG表达。这个结果清楚的表明本发明所描述的疫苗产品具有很强的免疫原性，可以特异性诱导相关抗体的产生以达到控制或预防冠状病毒SARS-CoV-2的感染的效果。

8.序列表

本说明书与序列表的计算机可读形式(CRF)的副本一起提交。所述CRF的标题为14639-009-228_Sequence_Listing.txt，创建于2021年4月2日，大小为199,381字节，在此通过引用整体并入。

序列表

<110> 苏州艾博生物科技有限公司(SUZHOU ABOGEN BIOSCIENCES CO., LTD.)

<120> 冠状病毒的核酸疫苗(NUCLEIC ACID VACCINES FOR CORONAVIRUS)

<130> 14639-009-228

<140> TBA

<141>

<150> 202010276288.0

<151> 2020-04-09

<150> 63/011,116

<151> 2020-04-16

<150> 202110293284.8

<151> 2021-03-19

<160> 59

<170> PatentIn version 3.5

<210> 1

<211> 29903

<212> DNA

<213> 严重的急性呼吸系统综合症冠状病毒 2(SARS-CoV-2)

<220>

<223> 严重的急性呼吸系统综合症冠状病毒 2 分离武汉-沪-1(Wuhan-Hu-1), 全基因组

<300>

<308> GenBank/MN908947.3

<309> 2020-03-18

<313> (1)..(29903)

<400> 1

attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60

gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120

cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180

ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240

cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300

acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360

agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420

cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480

acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540

cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600

cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660

tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720

tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780

actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840

ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900

atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960

tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020

gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080

ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140

gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200

caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260

gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320

aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380

atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440

cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500

ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560

ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620

aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680

gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740

aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800

aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860

tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920

tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980

aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040

taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100

gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160

agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220

ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280

ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340

tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400

ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460

tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520

aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580

agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640

aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700

cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760

agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820

acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880

ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940

actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000

tgagtttaaa ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060

agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120

agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180

agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240

cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300

agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360

aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420

aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480

aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540

tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600

acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660

gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720

tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780

tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840

aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900

gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960

caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020

cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080

tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140

agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200

gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260

gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320

cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380

ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440

tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500

agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560

gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620

tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680

agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740

ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800

agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860

taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920

ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980

aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040

acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100

acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160

tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220

cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280

caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340

acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400

acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460

gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520

taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580

cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640

agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700

tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760

gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820

acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880

ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940

tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000

tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060

tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120

aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180

taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240

gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300

tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360

cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420

ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480

aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540

cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600

attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660

tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720

aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780

ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840

atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900

ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960

gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020

tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080

ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140

tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200

atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260

tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320

ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380

acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440

tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500

ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560

gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620

tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680

cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740

tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800

ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860

taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920

atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980

agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040

tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100

agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160

ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220

tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280

ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340

tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400

atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460

tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520

tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580

gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640

tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700

tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760

tgattttgac acatggttta gccagcgtgg tggtagttat actaatgaca aagcttgccc 8820

attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880

gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940

tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000

ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060

ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120

acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180

tgttagagtg gtaacaactt ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240

agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300

atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360

accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420

tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480

tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540

ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600

gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660

cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720

tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780

tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840

gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900

taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960

tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020

accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080

atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140

tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200

gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260

ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320

taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380

acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440

tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500

ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560

tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620

aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680

cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740

ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800

actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860

agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920

tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980

gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040

agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100

accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160

gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220

ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280

tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340

aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400

gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460

catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520

gtttttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580

tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640

ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700

ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760

gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820

tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880

actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940

ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000

ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060

agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120

atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180

ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240

ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300

gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360

gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420

aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480

tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540

atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600

tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660

ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720

gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780

caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840

atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900

ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960

aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020

acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080

tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140

taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200

ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260

ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320

acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380

ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440

gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500

ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560

aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620

gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680

caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740

ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800

aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860

acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920

gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980

cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040

attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100

gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160

ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220

ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280

aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340

tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400

ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460

gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520

ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580

cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640

cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700

gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760

ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820

ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880

gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940

tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000

tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060

caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120

tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180

gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240

atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300

aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360

aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420

caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480

tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540

acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600

cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660

tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720

gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780

aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840

actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900

aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960

ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020

tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080

tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140

gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200

tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260

aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320

tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380

gtttgcaatg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440

agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500

gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560

attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620

agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680

tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740

gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800

aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860

gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920

tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980

attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040

tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100

agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160

tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220

aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280

aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340

gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400

gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460

cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520

atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580

gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640

gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700

aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760

gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820

ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880

accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940

aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000

agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactc 18060

tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120

agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180

gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240

ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300

ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360

cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420

cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480

cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540

caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600

catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660

tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720

catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780

ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840

catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900

aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960

gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020

gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080

tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140

tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200

aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260

aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320

acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380

tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440

ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500

gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560

ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620

agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680

gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740

gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800

cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860

gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920

gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980

gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040

gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100

agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160

aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220

caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280

ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340

agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400

tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460

acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520

gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580

actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640

ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700

tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760

acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820

aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880

gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940

cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000

tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060

aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120

gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180

tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240

actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300

ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360

aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420

aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480

cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540

cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600

tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660

acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720

cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780

caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840

ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900

gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960

tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020

ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080

gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140

gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200

gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260

taacatcact aggtttcaaa ctttacttgc tttacataga agttatttga ctcctggtga 22320

ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380

gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440

tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500

tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560

aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620

gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680

attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740

taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800

gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860

tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920

tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980

tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040

atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100

ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160

ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220

tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280

tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340

tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400

ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460

gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520

tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580

ttatcagact cagactaatt ctcctcggcg ggcacgtagt gtagctagtc aatccatcat 23640

tgcctacact atgtcacttg gtgcagaaaa ttcagttgct tactctaata actctattgc 23700

catacccaca aattttacta ttagtgttac cacagaaatt ctaccagtgt ctatgaccaa 23760

gacatcagta gattgtacaa tgtacatttg tggtgattca actgaatgca gcaatctttt 23820

gttgcaatat ggcagttttt gtacacaatt aaaccgtgct ttaactggaa tagctgttga 23880

acaagacaaa aacacccaag aagtttttgc acaagtcaaa caaatttaca aaacaccacc 23940

aattaaagat tttggtggtt ttaatttttc acaaatatta ccagatccat caaaaccaag 24000

caagaggtca tttattgaag atctactttt caacaaagtg acacttgcag atgctggctt 24060

catcaaacaa tatggtgatt gccttggtga tattgctgct agagacctca tttgtgcaca 24120

aaagtttaac ggccttactg ttttgccacc tttgctcaca gatgaaatga ttgctcaata 24180

cacttctgca ctgttagcgg gtacaatcac ttctggttgg acctttggtg caggtgctgc 24240

attacaaata ccatttgcta tgcaaatggc ttataggttt aatggtattg gagttacaca 24300

gaatgttctc tatgagaacc aaaaattgat tgccaaccaa tttaatagtg ctattggcaa 24360

aattcaagac tcactttctt ccacagcaag tgcacttgga aaacttcaag atgtggtcaa 24420

ccaaaatgca caagctttaa acacgcttgt taaacaactt agctccaatt ttggtgcaat 24480

ttcaagtgtt ttaaatgata tcctttcacg tcttgacaaa gttgaggctg aagtgcaaat 24540

tgataggttg atcacaggca gacttcaaag tttgcagaca tatgtgactc aacaattaat 24600

tagagctgca gaaatcagag cttctgctaa tcttgctgct actaaaatgt cagagtgtgt 24660

acttggacaa tcaaaaagag ttgatttttg tggaaagggc tatcatctta tgtccttccc 24720

tcagtcagca cctcatggtg tagtcttctt gcatgtgact tatgtccctg cacaagaaaa 24780

gaacttcaca actgctcctg ccatttgtca tgatggaaaa gcacactttc ctcgtgaagg 24840

tgtctttgtt tcaaatggca cacactggtt tgtaacacaa aggaattttt atgaaccaca 24900

aatcattact acagacaaca catttgtgtc tggtaactgt gatgttgtaa taggaattgt 24960

caacaacaca gtttatgatc ctttgcaacc tgaattagac tcattcaagg aggagttaga 25020

taaatatttt aagaatcata catcaccaga tgttgattta ggtgacatct ctggcattaa 25080

tgcttcagtt gtaaacattc aaaaagaaat tgaccgcctc aatgaggttg ccaagaattt 25140

aaatgaatct ctcatcgatc tccaagaact tggaaagtat gagcagtata taaaatggcc 25200

atggtacatt tggctaggtt ttatagctgg cttgattgcc atagtaatgg tgacaattat 25260

gctttgctgt atgaccagtt gctgtagttg tctcaagggc tgttgttctt gtggatcctg 25320

ctgcaaattt gatgaagacg actctgagcc agtgctcaaa ggagtcaaat tacattacac 25380

ataaacgaac ttatggattt gtttatgaga atcttcacaa ttggaactgt aactttgaag 25440

caaggtgaaa tcaaggatgc tactccttca gattttgttc gcgctactgc aacgataccg 25500

atacaagcct cactcccttt cggatggctt attgttggcg ttgcacttct tgctgttttt 25560

cagagcgctt ccaaaatcat aaccctcaaa aagagatggc aactagcact ctccaagggt 25620

gttcactttg tttgcaactt gctgttgttg tttgtaacag tttactcaca ccttttgctc 25680

gttgctgctg gccttgaagc cccttttctc tatctttatg ctttagtcta cttcttgcag 25740

agtataaact ttgtaagaat aataatgagg ctttggcttt gctggaaatg ccgttccaaa 25800

aacccattac tttatgatgc caactatttt ctttgctggc atactaattg ttacgactat 25860

tgtatacctt acaatagtgt aacttcttca attgtcatta cttcaggtga tggcacaaca 25920

agtcctattt ctgaacatga ctaccagatt ggtggttata ctgaaaaatg ggaatctgga 25980

gtaaaagact gtgttgtatt acacagttac ttcacttcag actattacca gctgtactca 26040

actcaattga gtacagacac tggtgttgaa catgttacct tcttcatcta caataaaatt 26100

gttgatgagc ctgaagaaca tgtccaaatt cacacaatcg acggttcatc cggagttgtt 26160

aatccagtaa tggaaccaat ttatgatgaa ccgacgacga ctactagcgt gcctttgtaa 26220

gcacaagctg atgagtacga acttatgtac tcattcgttt cggaagagac aggtacgtta 26280

atagttaata gcgtacttct ttttcttgct ttcgtggtat tcttgctagt tacactagcc 26340

atccttactg cgcttcgatt gtgtgcgtac tgctgcaata ttgttaacgt gagtcttgta 26400

aaaccttctt tttacgttta ctctcgtgtt aaaaatctga attcttctag agttcctgat 26460

cttctggtct aaacgaacta aatattatat tagtttttct gtttggaact ttaattttag 26520

ccatggcaga ttccaacggt actattaccg ttgaagagct taaaaagctc cttgaacaat 26580

ggaacctagt aataggtttc ctattcctta catggatttg tcttctacaa tttgcctatg 26640

ccaacaggaa taggtttttg tatataatta agttaatttt cctctggctg ttatggccag 26700

taactttagc ttgttttgtg cttgctgctg tttacagaat aaattggatc accggtggaa 26760

ttgctatcgc aatggcttgt cttgtaggct tgatgtggct cagctacttc attgcttctt 26820

tcagactgtt tgcgcgtacg cgttccatgt ggtcattcaa tccagaaact aacattcttc 26880

tcaacgtgcc actccatggc actattctga ccagaccgct tctagaaagt gaactcgtaa 26940

tcggagctgt gatccttcgt ggacatcttc gtattgctgg acaccatcta ggacgctgtg 27000

acatcaagga cctgcctaaa gaaatcactg ttgctacatc acgaacgctt tcttattaca 27060

aattgggagc ttcgcagcgt gtagcaggtg actcaggttt tgctgcatac agtcgctaca 27120

ggattggcaa ctataaatta aacacagacc attccagtag cagtgacaat attgctttgc 27180

ttgtacagta agtgacaaca gatgtttcat ctcgttgact ttcaggttac tatagcagag 27240

atattactaa ttattatgag gacttttaaa gtttccattt ggaatcttga ttacatcata 27300

aacctcataa ttaaaaattt atctaagtca ctaactgaga ataaatattc tcaattagat 27360

gaagagcaac caatggagat tgattaaacg aacatgaaaa ttattctttt cttggcactg 27420

ataacactcg ctacttgtga gctttatcac taccaagagt gtgttagagg tacaacagta 27480

cttttaaaag aaccttgctc ttctggaaca tacgagggca attcaccatt tcatcctcta 27540

gctgataaca aatttgcact gacttgcttt agcactcaat ttgcttttgc ttgtcctgac 27600

ggcgtaaaac acgtctatca gttacgtgcc agatcagttt cacctaaact gttcatcaga 27660

caagaggaag ttcaagaact ttactctcca atttttctta ttgttgcggc aatagtgttt 27720

ataacacttt gcttcacact caaaagaaag acagaatgat tgaactttca ttaattgact 27780

tctatttgtg ctttttagcc tttctgctat tccttgtttt aattatgctt attatctttt 27840

ggttctcact tgaactgcaa gatcataatg aaacttgtca cgcctaaacg aacatgaaat 27900

ttcttgtttt cttaggaatc atcacaactg tagctgcatt tcaccaagaa tgtagtttac 27960

agtcatgtac tcaacatcaa ccatatgtag ttgatgaccc gtgtcctatt cacttctatt 28020

ctaaatggta tattagagta ggagctagaa aatcagcacc tttaattgaa ttgtgcgtgg 28080

atgaggctgg ttctaaatca cccattcagt acatcgatat cggtaattat acagtttcct 28140

gtttaccttt tacaattaat tgccaggaac ctaaattggg tagtcttgta gtgcgttgtt 28200

cgttctatga agacttttta gagtatcatg acgttcgtgt tgttttagat ttcatctaaa 28260

cgaacaaact aaaatgtctg ataatggacc ccaaaatcag cgaaatgcac cccgcattac 28320

gtttggtgga ccctcagatt caactggcag taaccagaat ggagaacgca gtggggcgcg 28380

atcaaaacaa cgtcggcccc aaggtttacc caataatact gcgtcttggt tcaccgctct 28440

cactcaacat ggcaaggaag accttaaatt ccctcgagga caaggcgttc caattaacac 28500

caatagcagt ccagatgacc aaattggcta ctaccgaaga gctaccagac gaattcgtgg 28560

tggtgacggt aaaatgaaag atctcagtcc aagatggtat ttctactacc taggaactgg 28620

gccagaagct ggacttccct atggtgctaa caaagacggc atcatatggg ttgcaactga 28680

gggagccttg aatacaccaa aagatcacat tggcacccgc aatcctgcta acaatgctgc 28740

aatcgtgcta caacttcctc aaggaacaac attgccaaaa ggcttctacg cagaagggag 28800

cagaggcggc agtcaagcct cttctcgttc ctcatcacgt agtcgcaaca gttcaagaaa 28860

ttcaactcca ggcagcagta ggggaacttc tcctgctaga atggctggca atggcggtga 28920

tgctgctctt gctttgctgc tgcttgacag attgaaccag cttgagagca aaatgtctgg 28980

taaaggccaa caacaacaag gccaaactgt cactaagaaa tctgctgctg aggcttctaa 29040

gaagcctcgg caaaaacgta ctgccactaa agcatacaat gtaacacaag ctttcggcag 29100

acgtggtcca gaacaaaccc aaggaaattt tggggaccag gaactaatca gacaaggaac 29160

tgattacaaa cattggccgc aaattgcaca atttgccccc agcgcttcag cgttcttcgg 29220

aatgtcgcgc attggcatgg aagtcacacc ttcgggaacg tggttgacct acacaggtgc 29280

catcaaattg gatgacaaag atccaaattt caaagatcaa gtcattttgc tgaataagca 29340

tattgacgca tacaaaacat tcccaccaac agagcctaaa aaggacaaaa agaagaaggc 29400

tgatgaaact caagccttac cgcagagaca gaagaaacag caaactgtga ctcttcttcc 29460

tgctgcagat ttggatgatt tctccaaaca attgcaacaa tccatgagca gtgctgactc 29520

aactcaggcc taaactcatg cagaccacac aaggcagatg ggctatataa acgttttcgc 29580

ttttccgttt acgatatata gtctactctt gtgcagaatg aattctcgta actacatagc 29640

acaagtagat gtagttaact ttaatctcac atagcaatct ttaatcagtg tgtaacatta 29700

gggaggactt gaaagagcca ccacattttc accgaggcca cgcggagtac gatcgagtgt 29760

acagtgaaca atgctaggga gagctgccta tatggaagag ccctaatgtg taaaattaat 29820

tttagtagtg ctatccccat gtgattttaa tagcttctta ggagaatgac aaaaaaaaaa 29880

aaaaaaaaaa aaaaaaaaaa aaa 29903

<210> 2

<211> 1273

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽(SARS-CoV-2 spike protein withnative signal peptide)

<400> 2

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 3

<211> 3819

<212> DNA

<213> SARS-CoV-2

<220>

<400> 3

atgtttgttt ttcttgtttt attgccatta gtctctagtc agtgtgttaa tcttacaacc 60

agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120

aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180

aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240

aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300

ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360

aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420

ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480

tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540

ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600

tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660

tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720

ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780

ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840

gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900

tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960

caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020

gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080

tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140

ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200

gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260

tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320

cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380

ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440

aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500

aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560

ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620

ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680

cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740

acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800

ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860

cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920

aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980

gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040

cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100

gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160

agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220

tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280

acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340

gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400

aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460

ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520

cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580

ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640

acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700

caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760

aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820

acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880

acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940

ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000

cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060

tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120

gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180

gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240

atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300

cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360

tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420

ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480

tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540

aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600

caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660

atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720

tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780

tctgagccag tgctcaaagg agtcaaatta cattacaca 3819

<210> 4

<211> 1198

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白胞外域(ECD)(SARS-CoV-2 spike protein ectodomain(ECD) )

<400> 4

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala

675 680 685

Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn

690 695 700

Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys

705 710 715 720

Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys

725 730 735

Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg

740 745 750

Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val

755 760 765

Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe

770 775 780

Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser

785 790 795 800

Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala

805 810 815

Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala

820 825 830

Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu

835 840 845

Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu

850 855 860

Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala

865 870 875 880

Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile

885 890 895

Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn

900 905 910

Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr

915 920 925

Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln

930 935 940

Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile

945 950 955 960

Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala

965 970 975

Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln

980 985 990

Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser

995 1000 1005

Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln

1010 1015 1020

Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser

1025 1030 1035

Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr

1040 1045 1050

Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile

1055 1060 1065

Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val

1070 1075 1080

Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu

1085 1090 1095

Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys

1100 1105 1110

Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu

1115 1120 1125

Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe

1130 1135 1140

Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly

1145 1150 1155

Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu

1160 1165 1170

Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln

1175 1180 1185

Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys

1190 1195

<210> 5

<211> 3594

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白胞外域(ECD)的编码序列 (SARS-CoV-2 spike proteinECD coding sequence)

<400> 5

cagtgtgtta atcttacaac cagaactcaa ttaccccctg catacactaa ttctttcaca 60

cgtggtgttt attaccctga caaagttttc agatcctcag ttttacattc aactcaggac 120

ttgttcttac ctttcttttc caatgttact tggttccatg ctatacatgt ctctgggacc 180

aatggtacta agaggtttga taaccctgtc ctaccattta atgatggtgt ttattttgct 240

tccactgaga agtctaacat aataagaggc tggatttttg gtactacttt agattcgaag 300

acccagtccc tacttattgt taataacgct actaatgttg ttattaaagt ctgtgaattt 360

caattttgta atgatccatt tttgggtgtt tattaccaca aaaacaacaa aagttggatg 420

gaaagtgagt tcagagttta ttctagtgcg aataattgca cttttgaata tgtctctcag 480

ccttttctta tggaccttga aggaaaacag ggtaatttca aaaatcttag ggaatttgtg 540

tttaagaata ttgatggtta ttttaaaata tattctaagc acacgcctat taatttagtg 600

cgtgatctcc ctcagggttt ttcggcttta gaaccattgg tagatttgcc aataggtatt 660

aacatcacta ggtttcaaac tttacttgct ttacatagaa gttatttgac tcctggtgat 720

tcttcttcag gttggacagc tggtgctgca gcttattatg tgggttatct tcaacctagg 780

acttttctat taaaatataa tgaaaatgga accattacag atgctgtaga ctgtgcactt 840

gaccctctct cagaaacaaa gtgtacgttg aaatccttca ctgtagaaaa aggaatctat 900

caaacttcta actttagagt ccaaccaaca gaatctattg ttagatttcc taatattaca 960

aacttgtgcc cttttggtga agtttttaac gccaccagat ttgcatctgt ttatgcttgg 1020

aacaggaaga gaatcagcaa ctgtgttgct gattattctg tcctatataa ttccgcatca 1080

ttttccactt ttaagtgtta tggagtgtct cctactaaat taaatgatct ctgctttact 1140

aatgtctatg cagattcatt tgtaattaga ggtgatgaag tcagacaaat cgctccaggg 1200

caaactggaa agattgctga ttataattat aaattaccag atgattttac aggctgcgtt 1260

atagcttgga actctaacaa tcttgattct aaggttggtg gtaattataa ttacctgtat 1320

agattgttta ggaagtctaa tctcaaacct tttgagagag atatttcaac tgaaatctat 1380

caggccggta gcacaccttg taatggtgtt gaaggtttta attgttactt tcctttacaa 1440

tcatatggtt tccaacccac taatggtgtt ggttaccaac catacagagt agtagtactt 1500

tcttttgaac ttctacatgc accagcaact gtttgtggac ctaaaaagtc tactaatttg 1560

gttaaaaaca aatgtgtcaa tttcaacttc aatggtttaa caggcacagg tgttcttact 1620

gagtctaaca aaaagtttct gcctttccaa caatttggca gagacattgc tgacactact 1680

gatgctgtcc gtgatccaca gacacttgag attcttgaca ttacaccatg ttcttttggt 1740

ggtgtcagtg ttataacacc aggaacaaat acttctaacc aggttgctgt tctttatcag 1800

gatgttaact gcacagaagt ccctgttgct attcatgcag atcaacttac tcctacttgg 1860

cgtgtttatt ctacaggttc taatgttttt caaacacgtg caggctgttt aataggggct 1920

gaacatgtca acaactcata tgagtgtgac atacccattg gtgcaggtat atgcgctagt 1980

tatcagactc agactaattc tcctcggcgg gcacgtagtg tagctagtca atccatcatt 2040

gcctacacta tgtcacttgg tgcagaaaat tcagttgctt actctaataa ctctattgcc 2100

atacccacaa attttactat tagtgttacc acagaaattc taccagtgtc tatgaccaag 2160

acatcagtag attgtacaat gtacatttgt ggtgattcaa ctgaatgcag caatcttttg 2220

ttgcaatatg gcagtttttg tacacaatta aaccgtgctt taactggaat agctgttgaa 2280

caagacaaaa acacccaaga agtttttgca caagtcaaac aaatttacaa aacaccacca 2340

attaaagatt ttggtggttt taatttttca caaatattac cagatccatc aaaaccaagc 2400

aagaggtcat ttattgaaga tctacttttc aacaaagtga cacttgcaga tgctggcttc 2460

atcaaacaat atggtgattg ccttggtgat attgctgcta gagacctcat ttgtgcacaa 2520

aagtttaacg gccttactgt tttgccacct ttgctcacag atgaaatgat tgctcaatac 2580

acttctgcac tgttagcggg tacaatcact tctggttgga cctttggtgc aggtgctgca 2640

ttacaaatac catttgctat gcaaatggct tataggttta atggtattgg agttacacag 2700

aatgttctct atgagaacca aaaattgatt gccaaccaat ttaatagtgc tattggcaaa 2760

attcaagact cactttcttc cacagcaagt gcacttggaa aacttcaaga tgtggtcaac 2820

caaaatgcac aagctttaaa cacgcttgtt aaacaactta gctccaattt tggtgcaatt 2880

tcaagtgttt taaatgatat cctttcacgt cttgacaaag ttgaggctga agtgcaaatt 2940

gataggttga tcacaggcag acttcaaagt ttgcagacat atgtgactca acaattaatt 3000

agagctgcag aaatcagagc ttctgctaat cttgctgcta ctaaaatgtc agagtgtgta 3060

cttggacaat caaaaagagt tgatttttgt ggaaagggct atcatcttat gtccttccct 3120

cagtcagcac ctcatggtgt agtcttcttg catgtgactt atgtccctgc acaagaaaag 3180

aacttcacaa ctgctcctgc catttgtcat gatggaaaag cacactttcc tcgtgaaggt 3240

gtctttgttt caaatggcac acactggttt gtaacacaaa ggaattttta tgaaccacaa 3300

atcattacta cagacaacac atttgtgtct ggtaactgtg atgttgtaat aggaattgtc 3360

aacaacacag tttatgatcc tttgcaacct gaattagact cattcaagga ggagttagat 3420

aaatatttta agaatcatac atcaccagat gttgatttag gtgacatctc tggcattaat 3480

gcttcagttg taaacattca aaaagaaatt gaccgcctca atgaggttgc caagaattta 3540

aatgaatctc tcatcgatct ccaagaactt ggaaagtatg agcagtatat aaaa 3594

<210> 6

<211> 672

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白S1 亚基 (SARS-CoV-2 spike protein S1 subunit)

<400> 6

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

<210> 7

<211> 2016

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白S1亚基的编码序列 (SARS-CoV-2 spike protein S1subunit coding sequence)

<400> 7

cagtgtgtta atcttacaac cagaactcaa ttaccccctg catacactaa ttctttcaca 60

cgtggtgttt attaccctga caaagttttc agatcctcag ttttacattc aactcaggac 120

ttgttcttac ctttcttttc caatgttact tggttccatg ctatacatgt ctctgggacc 180

aatggtacta agaggtttga taaccctgtc ctaccattta atgatggtgt ttattttgct 240

tccactgaga agtctaacat aataagaggc tggatttttg gtactacttt agattcgaag 300

acccagtccc tacttattgt taataacgct actaatgttg ttattaaagt ctgtgaattt 360

caattttgta atgatccatt tttgggtgtt tattaccaca aaaacaacaa aagttggatg 420

gaaagtgagt tcagagttta ttctagtgcg aataattgca cttttgaata tgtctctcag 480

ccttttctta tggaccttga aggaaaacag ggtaatttca aaaatcttag ggaatttgtg 540

tttaagaata ttgatggtta ttttaaaata tattctaagc acacgcctat taatttagtg 600

cgtgatctcc ctcagggttt ttcggcttta gaaccattgg tagatttgcc aataggtatt 660

aacatcacta ggtttcaaac tttacttgct ttacatagaa gttatttgac tcctggtgat 720

tcttcttcag gttggacagc tggtgctgca gcttattatg tgggttatct tcaacctagg 780

acttttctat taaaatataa tgaaaatgga accattacag atgctgtaga ctgtgcactt 840

gaccctctct cagaaacaaa gtgtacgttg aaatccttca ctgtagaaaa aggaatctat 900

caaacttcta actttagagt ccaaccaaca gaatctattg ttagatttcc taatattaca 960

aacttgtgcc cttttggtga agtttttaac gccaccagat ttgcatctgt ttatgcttgg 1020

aacaggaaga gaatcagcaa ctgtgttgct gattattctg tcctatataa ttccgcatca 1080

ttttccactt ttaagtgtta tggagtgtct cctactaaat taaatgatct ctgctttact 1140

aatgtctatg cagattcatt tgtaattaga ggtgatgaag tcagacaaat cgctccaggg 1200

caaactggaa agattgctga ttataattat aaattaccag atgattttac aggctgcgtt 1260

atagcttgga attctaacaa tcttgattct aaggttggtg gtaattataa ttacctgtat 1320

agattgttta ggaagtctaa tctcaaacct tttgagagag atatttcaac tgaaatctat 1380

caggccggta gcacaccttg taatggtgtt gaaggtttta attgttactt tcctttacaa 1440

tcatatggtt tccaacccac taatggtgtt ggttaccaac catacagagt agtagtactt 1500

tcttttgaac ttctacatgc accagcaact gtttgtggac ctaaaaagtc tactaatttg 1560

gttaaaaaca aatgtgtcaa tttcaacttc aatggtttaa caggcacagg tgttcttact 1620

gagtctaaca aaaagtttct gcctttccaa caatttggca gagacattgc tgacactact 1680

gatgctgtcc gtgatccaca gacacttgag attcttgaca ttacaccatg ttcttttggt 1740

ggtgtcagtg ttataacacc aggaacaaat acttctaacc aggttgctgt tctttatcag 1800

gatgttaact gcacagaagt ccctgttgct attcatgcag atcaacttac tcctacttgg 1860

cgtgtttatt ctacaggttc taatgttttt caaacacgtg caggctgttt aataggggct 1920

gaacatgtca acaactcata tgagtgtgac atacccattg gtgcaggtat atgcgctagt 1980

tatcagactc agactaattc tcctcggcgg gcacgt 2016

<210> 8

<211> 223

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白位于位点319-541 之间的受体结合域(RBD-1) (SARS-CoV-2 spike protein receptor binding domain (RBD) spanning positions 319-541(RBD-1))

<400> 8

Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn

1 5 10 15

Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val

20 25 30

Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser

35 40 45

Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val

50 55 60

Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp

65 70 75 80

Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln

85 90 95

Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr

100 105 110

Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly

115 120 125

Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys

130 135 140

Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr

145 150 155 160

Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser

165 170 175

Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val

180 185 190

Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly

195 200 205

Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

210 215 220

<210> 9

<211> 669

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白受体结合域RBD-1 的编码序列 (SARS-CoV-2 spikeprotein RBD-1 coding sequence)

<400> 9

agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 60

ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 120

agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 180

tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 240

tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 300

gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaactct 360

aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 420

tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 480

ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 540

cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 600

catgcaccag caactgtttg tggacctaaa aagtctacta atttggttaa aaacaaatgt 660

gtcaatttc 669

<210> 10

<211> 199

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白位于位点331-529 之间的受体结合域(RBD-2) (SARS-CoV-2 spike protein RBD spanning positions 331-529 (RBD-2))

<400> 10

Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg

1 5 10 15

Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val

20 25 30

Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys

35 40 45

Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn

50 55 60

Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile

65 70 75 80

Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro

85 90 95

Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp

100 105 110

Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys

115 120 125

Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln

130 135 140

Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe

145 150 155 160

Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln

165 170 175

Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala

180 185 190

Thr Val Cys Gly Pro Lys Lys

195

<210> 11

<211> 597

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白受体结合域RBD-2 的编码序列 (SARS-CoV-2 spikeprotein RBD-2 coding sequence)

<400> 11

aatattacaa acttgtgccc ttttggtgaa gtttttaacg ccaccagatt tgcatctgtt 60

tatgcttgga acaggaagag aatcagcaac tgtgttgctg attattctgt cctatataat 120

tccgcatcat tttccacttt taagtgttat ggagtgtctc ctactaaatt aaatgatctc 180

tgctttacta atgtctatgc agattcattt gtaattagag gtgatgaagt cagacaaatc 240

gctccagggc aaactggaaa gattgctgat tataattata aattaccaga tgattttaca 300

ggctgcgtta tagcttggaa ctctaacaat cttgattcta aggttggtgg taattataat 360

tacctgtata gattgtttag gaagtctaat ctcaaacctt ttgagagaga tatttcaact 420

gaaatctatc aggccggtag cacaccttgt aatggtgttg aaggttttaa ttgttacttt 480

cctttacaat catatggttt ccaacccact aatggtgttg gttaccaacc atacagagta 540

gtagtacttt cttttgaact tctacatgca ccagcaactg tttgtggacc taaaaag 597

<210> 12

<211> 194

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白位于位点331-524 之间的受体结合域(RBD-3) (SARS-CoV-2 spike protein RBD spanning positions 331-524 (RBD-3))

<400> 12

Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg

1 5 10 15

Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val

20 25 30

Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys

35 40 45

Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn

50 55 60

Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile

65 70 75 80

Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro

85 90 95

Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp

100 105 110

Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys

115 120 125

Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln

130 135 140

Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe

145 150 155 160

Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln

165 170 175

Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala

180 185 190

Thr Val

<210> 13

<211> 582

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白受体结合域RBD-3 的编码序列 (SARS-CoV-2 spikeprotein RBD-3 coding sequence)

<400> 13

aatattacaa acttgtgccc ttttggtgaa gtttttaacg ccaccagatt tgcatctgtt 60

tatgcttgga acaggaagag aatcagcaac tgtgttgctg attattctgt cctatataat 120

tccgcatcat tttccacttt taagtgttat ggagtgtctc ctactaaatt aaatgatctc 180

tgctttacta atgtctatgc agattcattt gtaattagag gtgatgaagt cagacaaatc 240

gctccagggc aaactggaaa gattgctgat tataattata aattaccaga tgattttaca 300

ggctgcgtta tagcttggaa ctctaacaat cttgattcta aggttggtgg taattataat 360

tacctgtata gattgtttag gaagtctaat ctcaaacctt ttgagagaga tatttcaact 420

gaaatctatc aggccggtag cacaccttgt aatggtgttg aaggttttaa ttgttacttt 480

cctttacaat catatggttt ccaacccact aatggtgttg gttaccaacc atacagagta 540

gtagtacttt cttttgaact tctacatgca ccagcaactg tt 582

<210> 14

<211> 211

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白位于位点319-529 之间的受体结合域(RBD-4) (SARS-CoV-2 spike protein RBD spanning positions 319-529 (RBD-4))

<400> 14

Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn

1 5 10 15

Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val

20 25 30

Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser

35 40 45

Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val

50 55 60

Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp

65 70 75 80

Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln

85 90 95

Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr

100 105 110

Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly

115 120 125

Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys

130 135 140

Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr

145 150 155 160

Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser

165 170 175

Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val

180 185 190

Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly

195 200 205

Pro Lys Lys

210

<210> 15

<211> 633

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白受体结合域RBD-4 的编码序列 (SARS-CoV-2 spikeprotein RBD-4 coding sequence)

<400> 15

agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 60

ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 120

agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 180

tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 240

tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 300

gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaactct 360

aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 420

tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 480

ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 540

cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 600

catgcaccag caactgtttg tggacctaaa aag 633

<210> 16

<211> 56

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白受体结合基序(RBM) (SARS-CoV-2 spike proteinreceptor binding motif (RBM))

<400> 16

Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn

1 5 10 15

Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly

20 25 30

Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu

35 40 45

Gln Ser Tyr Gly Phe Gln Pro Thr

50 55

<210> 17

<211> 168

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白RBM的编码序列 (SARS-CoV-2 spike protein RBMcoding sequence)

<400> 17

gttggtggta attataatta cctgtataga ttgtttagga agtctaatct caaacctttt 60

gagagagata tttcaactga aatctatcag gccggtagca caccttgtaa tggtgttgaa 120

ggttttaatt gttactttcc tttacaatca tatggtttcc aacccact 168

<210> 18

<211> 419

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 核衣壳蛋白(SARS-CoV-2 nucleocapsid protein)

<400> 18

Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr

1 5 10 15

Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg

20 25 30

Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn

35 40 45

Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu

50 55 60

Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro

65 70 75 80

Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly

85 90 95

Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr

100 105 110

Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp

115 120 125

Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp

130 135 140

His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln

145 150 155 160

Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser

165 170 175

Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn

180 185 190

Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala

195 200 205

Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu

210 215 220

Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln

225 230 235 240

Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys

245 250 255

Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln

260 265 270

Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp

275 280 285

Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile

290 295 300

Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile

305 310 315 320

Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Ala Ala

325 330 335

Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu

340 345 350

Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro

355 360 365

Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln

370 375 380

Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu

385 390 395 400

Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser

405 410 415

Thr Gln Ala

<210> 19

<211> 1257

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 核衣壳蛋白的编码序列 (SARS-CoV-2 nucleocapsid proteincoding sequence)

<400> 19

atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60

tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120

cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180

aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240

gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300

atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360

cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420

acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480

cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540

caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600

agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660

ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720

caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780

aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840

caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900

tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960

ggcatggaag tcacaccttc gggaacgtgg ttgacctaca cagctgccat caaattggat 1020

gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080

aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140

gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200

gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcc 1257

<210> 20

<211> 1273

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽和N501T取代 (SARS-CoV-2 spikeprotein with native signal peptide and an N501T substitution)

<400> 20

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 21

<211> 1198

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代突变的ECD (SARS-CoV-2 spike proteinECD with an N501T substitution)

<400> 21

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala

675 680 685

Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn

690 695 700

Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys

705 710 715 720

Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys

725 730 735

Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg

740 745 750

Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val

755 760 765

Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe

770 775 780

Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser

785 790 795 800

Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala

805 810 815

Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala

820 825 830

Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu

835 840 845

Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu

850 855 860

Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala

865 870 875 880

Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile

885 890 895

Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn

900 905 910

Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr

915 920 925

Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln

930 935 940

Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile

945 950 955 960

Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala

965 970 975

Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln

980 985 990

Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser

995 1000 1005

Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln

1010 1015 1020

Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser

1025 1030 1035

Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr

1040 1045 1050

Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile

1055 1060 1065

Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val

1070 1075 1080

Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu

1085 1090 1095

Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys

1100 1105 1110

Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu

1115 1120 1125

Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe

1130 1135 1140

Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly

1145 1150 1155

Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu

1160 1165 1170

Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln

1175 1180 1185

Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys

1190 1195

<210> 22

<211> 672

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代突变的S1 亚基 (SARS-CoV-2 spikeprotein S1 subunit with an N501T substitution)

<400> 22

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

<210> 23

<211> 223

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代的RBD-1 (SARS-CoV-2 spike proteinRBD-1 with an N501T substitution)

<400> 23

Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn

1 5 10 15

Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val

20 25 30

Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser

35 40 45

Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val

50 55 60

Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp

65 70 75 80

Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln

85 90 95

Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr

100 105 110

Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly

115 120 125

Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys

130 135 140

Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr

145 150 155 160

Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser

165 170 175

Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro Tyr Arg Val

180 185 190

Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly

195 200 205

Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

210 215 220

<210> 24

<211> 198

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代突变的RBD-2（RBD-6）(SARS-CoV-2 spikeprotein RBD-2 with an N501T substitution (RBD-6))

<400> 24

Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

1 5 10 15

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

20 25 30

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

35 40 45

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

50 55 60

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

65 70 75 80

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

85 90 95

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

100 105 110

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

115 120 125

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

130 135 140

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

145 150 155 160

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro

165 170 175

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

180 185 190

Val Cys Gly Pro Lys Lys

195

<210> 25

<211> 194

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代突变的RBD-3（RBD-7）(SARS-CoV-2 spikeprotein RBD-3 with an N501T substitution (RBD-7) )

<400> 25

Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg

1 5 10 15

Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val

20 25 30

Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys

35 40 45

Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn

50 55 60

Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile

65 70 75 80

Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro

85 90 95

Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp

100 105 110

Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys

115 120 125

Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln

130 135 140

Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe

145 150 155 160

Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln

165 170 175

Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala

180 185 190

Thr Val

<210> 26

<211> 211

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白包含N501T取代突变的RBD-4（RBD-8）(SARS-CoV-2 spikeprotein RBD-4 with an N501T substitution (RBD-8))

<400> 26

Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn

1 5 10 15

Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val

20 25 30

Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser

35 40 45

Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val

50 55 60

Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp

65 70 75 80

Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln

85 90 95

Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr

100 105 110

Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly

115 120 125

Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys

130 135 140

Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr

145 150 155 160

Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser

165 170 175

Tyr Gly Phe Gln Pro Thr Thr Gly Val Gly Tyr Gln Pro Tyr Arg Val

180 185 190

Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly

195 200 205

Pro Lys Lys

210

<210> 27

<211> 633

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白RBD-8的编码序列 (SARS-CoV-2 spike protein RBD-8coding sequence)

<400> 27

agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 60

ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 120

agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 180

tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 240

tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 300

gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaactct 360

aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 420

tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 480

ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 540

cccactactg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 600

catgcaccag caactgtttg tggacctaaa aag 633

<210> 28

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> (G3S)2 接头肽 ((G3S)2 linker peptide)

<400> 28

Gly Gly Gly Ser Gly Gly Gly Ser

1 5

<210> 29

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> (G3S)2 接头肽编码序列 ((G3S)2 linker peptide coding sequence)

<400> 29

ggaggaggaa gtggaggagg aagt 24

<210> 30

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 三聚化肽(Trimmerization peptide)

<400> 30

Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys

1 5 10 15

Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly

20 25

<210> 31

<211> 84

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 三聚化肽编码序列(Trimmerization peptide coding sequence)

<400> 31

ggctatattc cggaagcgcc gcgcgatggc caggcgtatg tgcgcaaaga tggcgaatgg 60

gtgctgctga gcacctttct gggc 84

<210> 32

<211> 1234

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白胞外域（ECD）含有(G3S)2 接头肽和三聚化肽的C 端融合蛋白 (SARS-CoV-2 spike protein ECD with C terminal fusion of a (G3S)2 linkerand a trimmerization peptide)

<400> 32

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala

675 680 685

Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn

690 695 700

Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys

705 710 715 720

Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys

725 730 735

Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg

740 745 750

Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val

755 760 765

Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe

770 775 780

Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser

785 790 795 800

Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala

805 810 815

Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala

820 825 830

Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu

835 840 845

Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu

850 855 860

Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala

865 870 875 880

Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile

885 890 895

Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn

900 905 910

Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr

915 920 925

Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln

930 935 940

Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile

945 950 955 960

Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala

965 970 975

Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln

980 985 990

Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser

995 1000 1005

Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln

1010 1015 1020

Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser

1025 1030 1035

Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr

1040 1045 1050

Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile

1055 1060 1065

Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val

1070 1075 1080

Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu

1085 1090 1095

Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys

1100 1105 1110

Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu

1115 1120 1125

Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe

1130 1135 1140

Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly

1145 1150 1155

Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu

1160 1165 1170

Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln

1175 1180 1185

Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Gly Gly Gly Ser Gly

1190 1195 1200

Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala

1205 1210 1215

Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu

1220 1225 1230

Gly

<210> 33

<211> 3702

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白胞外域（ECD）含有(G3S)2 接头肽和三聚化肽的C 端融合蛋白的编码序列 (SARS-CoV-2 spike protein ECD with C terminal fusion of a(G3S)2 linker and a trimmerization peptide coding sequence)

<400> 33

cagtgtgtta atcttacaac cagaactcaa ttaccccctg catacactaa ttctttcaca 60

cgtggtgttt attaccctga caaagttttc agatcctcag ttttacattc aactcaggac 120

ttgttcttac ctttcttttc caatgttact tggttccatg ctatacatgt ctctgggacc 180

aatggtacta agaggtttga taaccctgtc ctaccattta atgatggtgt ttattttgct 240

tccactgaga agtctaacat aataagaggc tggatttttg gtactacttt agattcgaag 300

acccagtccc tacttattgt taataacgct actaatgttg ttattaaagt ctgtgaattt 360

caattttgta atgatccatt tttgggtgtt tattaccaca aaaacaacaa aagttggatg 420

gaaagtgagt tcagagttta ttctagtgcg aataattgca cttttgaata tgtctctcag 480

ccttttctta tggaccttga aggaaaacag ggtaatttca aaaatcttag ggaatttgtg 540

tttaagaata ttgatggtta ttttaaaata tattctaagc acacgcctat taatttagtg 600

cgtgatctcc ctcagggttt ttcggcttta gaaccattgg tagatttgcc aataggtatt 660

aacatcacta ggtttcaaac tttacttgct ttacatagaa gttatttgac tcctggtgat 720

tcttcttcag gttggacagc tggtgctgca gcttattatg tgggttatct tcaacctagg 780

acttttctat taaaatataa tgaaaatgga accattacag atgctgtaga ctgtgcactt 840

gaccctctct cagaaacaaa gtgtacgttg aaatccttca ctgtagaaaa aggaatctat 900

caaacttcta actttagagt ccaaccaaca gaatctattg ttagatttcc taatattaca 960

aacttgtgcc cttttggtga agtttttaac gccaccagat ttgcatctgt ttatgcttgg 1020

aacaggaaga gaatcagcaa ctgtgttgct gattattctg tcctatataa ttccgcatca 1080

ttttccactt ttaagtgtta tggagtgtct cctactaaat taaatgatct ctgctttact 1140

aatgtctatg cagattcatt tgtaattaga ggtgatgaag tcagacaaat cgctccaggg 1200

caaactggaa agattgctga ttataattat aaattaccag atgattttac aggctgcgtt 1260

atagcttgga actctaacaa tcttgattct aaggttggtg gtaattataa ttacctgtat 1320

agattgttta ggaagtctaa tctcaaacct tttgagagag atatttcaac tgaaatctat 1380

caggccggta gcacaccttg taatggtgtt gaaggtttta attgttactt tcctttacaa 1440

tcatatggtt tccaacccac taatggtgtt ggttaccaac catacagagt agtagtactt 1500

tcttttgaac ttctacatgc accagcaact gtttgtggac ctaaaaagtc tactaatttg 1560

gttaaaaaca aatgtgtcaa tttcaacttc aatggtttaa caggcacagg tgttcttact 1620

gagtctaaca aaaagtttct gcctttccaa caatttggca gagacattgc tgacactact 1680

gatgctgtcc gtgatccaca gacacttgag attcttgaca ttacaccatg ttcttttggt 1740

ggtgtcagtg ttataacacc aggaacaaat acttctaacc aggttgctgt tctttatcag 1800

gatgttaact gcacagaagt ccctgttgct attcatgcag atcaacttac tcctacttgg 1860

cgtgtttatt ctacaggttc taatgttttt caaacacgtg caggctgttt aataggggct 1920

gaacatgtca acaactcata tgagtgtgac atacccattg gtgcaggtat atgcgctagt 1980

tatcagactc agactaattc tcctcggcgg gcacgtagtg tagctagtca atccatcatt 2040

gcctacacta tgtcacttgg tgcagaaaat tcagttgctt actctaataa ctctattgcc 2100

atacccacaa attttactat tagtgttacc acagaaattc taccagtgtc tatgaccaag 2160

acatcagtag attgtacaat gtacatttgt ggtgattcaa ctgaatgcag caatcttttg 2220

ttgcaatatg gcagtttttg tacacaatta aaccgtgctt taactggaat agctgttgaa 2280

caagacaaaa acacccaaga agtttttgca caagtcaaac aaatttacaa aacaccacca 2340

attaaagatt ttggtggttt taatttttca caaatattac cagatccatc aaaaccaagc 2400

aagaggtcat ttattgaaga tctacttttc aacaaagtga cacttgcaga tgctggcttc 2460

atcaaacaat atggtgattg ccttggtgat attgctgcta gagacctcat ttgtgcacaa 2520

aagtttaacg gccttactgt tttgccacct ttgctcacag atgaaatgat tgctcaatac 2580

acttctgcac tgttagcggg tacaatcact tctggttgga cctttggtgc aggtgctgca 2640

ttacaaatac catttgctat gcaaatggct tataggttta atggtattgg agttacacag 2700

aatgttctct atgagaacca aaaattgatt gccaaccaat ttaatagtgc tattggcaaa 2760

attcaagact cactttcttc cacagcaagt gcacttggaa aacttcaaga tgtggtcaac 2820

caaaatgcac aagctttaaa cacgcttgtt aaacaactta gctccaattt tggtgcaatt 2880

tcaagtgttt taaatgatat cctttcacgt cttgacaaag ttgaggctga agtgcaaatt 2940

gataggttga tcacaggcag acttcaaagt ttgcagacat atgtgactca acaattaatt 3000

agagctgcag aaatcagagc ttctgctaat cttgctgcta ctaaaatgtc agagtgtgta 3060

cttggacaat caaaaagagt tgatttttgt ggaaagggct atcatcttat gtccttccct 3120

cagtcagcac ctcatggtgt agtcttcttg catgtgactt atgtccctgc acaagaaaag 3180

aacttcacaa ctgctcctgc catttgtcat gatggaaaag cacactttcc tcgtgaaggt 3240

gtctttgttt caaatggcac acactggttt gtaacacaaa ggaattttta tgaaccacaa 3300

atcattacta cagacaacac atttgtgtct ggtaactgtg atgttgtaat aggaattgtc 3360

aacaacacag tttatgatcc tttgcaacct gaattagact cattcaagga ggagttagat 3420

aaatatttta agaatcatac atcaccagat gttgatttag gtgacatctc tggcattaat 3480

gcttcagttg taaacattca aaaagaaatt gaccgcctca atgaggttgc caagaattta 3540

aatgaatctc tcatcgatct ccaagaactt ggaaagtatg agcagtatat aaaaggagga 3600

ggaagtggag gaggaagtgg ctatattccg gaagcgccgc gcgatggcca ggcgtatgtg 3660

cgcaaagatg gcgaatgggt gctgctgagc acctttctgg gc 3702

<210> 34

<211> 235

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白RBD-2含有(G3S)2 接头肽和三聚化肽的C 端融合蛋白(SARS-CoV-2 spike protein RBD-2 with C-terminal fusion of a (G3S)2 linker anda trimmerization peptide)

<400> 34

Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg

1 5 10 15

Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val

20 25 30

Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys

35 40 45

Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn

50 55 60

Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile

65 70 75 80

Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro

85 90 95

Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp

100 105 110

Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys

115 120 125

Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln

130 135 140

Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe

145 150 155 160

Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln

165 170 175

Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala

180 185 190

Thr Val Cys Gly Pro Lys Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly

195 200 205

Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp

210 215 220

Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly

225 230 235

<210> 35

<211> 705

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白RBD-2含有(G3S)2 接头肽和三聚化肽的C 端融合

蛋白的编码序列 (SARS-CoV-2 spike protein RBD-2 with C-terminal fusion ofa

(G3S)2 linker and a trimmerization peptide coding sequence)

<400> 35

aatattacaa acttgtgccc ttttggtgaa gtttttaacg ccaccagatt tgcatctgtt 60

tatgcttgga acaggaagag aatcagcaac tgtgttgctg attattctgt cctatataat 120

tccgcatcat tttccacttt taagtgttat ggagtgtctc ctactaaatt aaatgatctc 180

tgctttacta atgtctatgc agattcattt gtaattagag gtgatgaagt cagacaaatc 240

gctccagggc aaactggaaa gattgctgat tataattata aattaccaga tgattttaca 300

ggctgcgtta tagcttggaa ctctaacaat cttgattcta aggttggtgg taattataat 360

tacctgtata gattgtttag gaagtctaat ctcaaacctt ttgagagaga tatttcaact 420

gaaatctatc aggccggtag cacaccttgt aatggtgttg aaggttttaa ttgttacttt 480

cctttacaat catatggttt ccaacccact aatggtgttg gttaccaacc atacagagta 540

gtagtacttt cttttgaact tctacatgca ccagcaactg tttgtggacc taaaaaggga 600

ggaggaagtg gaggaggaag tggctatatt ccggaagcgc cgcgcgatgg ccaggcgtat 660

gtgcgcaaag atggcgaatg ggtgctgctg agcacctttc tgggc 705

<210> 36

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白天然信号肽 (SARS-CoV-2 spike protein nativesignal peptide)

<400> 36

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser

1 5 10

<210> 37

<211> 39

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白天然信号肽的编码序列 (SARS-CoV-2 spike proteinnative signal peptide coding sequence)

<400> 37

atgtttgttt ttcttgtttt attgccatta gtctctagt 39

<210> 38

<211> 18

<212> PRT

<213> SARS-CoV-2

<220>

<400> 38

Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val

1 5 10 15

His Ser

<210> 39

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人源IgE 信号肽的氨基酸序列 (Human IgE signal peptide amino acidsequence)

<400> 39

atggactgga cctggattct cttcttggtg gcagcagcca cgcgagtcca ctcc 54

<210> 40

<211> 1260

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白不包含天然信号肽 (SARS-CoV-2 spike proteinwithout native signal peptide)

<400> 40

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly

645 650 655

Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

660 665 670

Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala

675 680 685

Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn

690 695 700

Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys

705 710 715 720

Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys

725 730 735

Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg

740 745 750

Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val

755 760 765

Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe

770 775 780

Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser

785 790 795 800

Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala

805 810 815

Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala

820 825 830

Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu

835 840 845

Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu

850 855 860

Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala

865 870 875 880

Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile

885 890 895

Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn

900 905 910

Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr

915 920 925

Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln

930 935 940

Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile

945 950 955 960

Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala

965 970 975

Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln

980 985 990

Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser

995 1000 1005

Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln

1010 1015 1020

Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser

1025 1030 1035

Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr

1040 1045 1050

Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile

1055 1060 1065

Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val

1070 1075 1080

Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu

1085 1090 1095

Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys

1100 1105 1110

Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu

1115 1120 1125

Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe

1130 1135 1140

Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly

1145 1150 1155

Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu

1160 1165 1170

Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln

1175 1180 1185

Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile

1190 1195 1200

Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr

1205 1210 1215

Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly

1220 1225 1230

Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser

1235 1240 1245

Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr

1250 1255 1260

<210> 41

<211> 3633

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SARS-CoV-2 刺突蛋白不包含天然信号肽的编码序列 (SARS-CoV-2 spikeprotein without native signal peptide coding sequence)

<400> 41

atgtttgttt ttcttgtttt attgccatta gtctctagtc agtgtgttaa tcttacaacc 60

agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120

aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180

aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240

aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300

ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360

aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420

ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480

tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540

ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600

tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660

tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720

ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780

ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840

gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900

tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960

caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020

gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080

tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140

ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200

gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260

tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ctctaacaat 1320

cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380

ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440

aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500

aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560

ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620

ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680

cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740

acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800

ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860

cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920

aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980

gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040

cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100

gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160

agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220

tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280

acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340

gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400

aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460

ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520

cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580

ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640

acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700

caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760

aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820

acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880

acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940

ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000

cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060

tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120

gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180

gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240

atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300

cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360

tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420

ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480

tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540

aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600

caagaacttg gaaagtatga gcagtatata aaa 3633

<210> 42

<211> 1211

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽的胞外域（ECD）(SARS-CoV-2 spikeprotein ectodomain (ECD) with native signal peptide)

<400> 42

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys

1205 1210

<210> 43

<211> 3633

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽的胞外域（ECD）编码序列 (SARS-CoV-2spike protein ectodomain (ECD) with native signal peptide coding sequence)

<400> 43

atgtttgttt ttcttgtttt attgccatta gtctctagtc agtgtgttaa tcttacaacc 60

agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120

aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180

aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240

aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300

ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360

aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420

ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480

tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540

ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600

tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660

tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720

ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780

ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840

gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900

tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960

caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020

gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080

tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140

ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200

gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260

tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ctctaacaat 1320

cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380

ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440

aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500

aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560

ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620

ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680

cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740

acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800

ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860

cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920

aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980

gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040

cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100

gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160

agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220

tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280

acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340

gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400

aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460

ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520

cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580

ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640

acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700

caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760

aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820

acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880

acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940

ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000

cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060

tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120

gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180

gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240

atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300

cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360

tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420

ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480

tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540

aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600

caagaacttg gaaagtatga gcagtatata aaa 3633

<210> 44

<211> 685

<212> PRT

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽的S1 亚基 (SARS-CoV-2 spikeprotein S1 subunit with native signal peptide)

<400> 44

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg

675 680 685

<210> 45

<211> 2055

<212> DNA

<213> SARS-CoV-2

<220>

<223> SARS-CoV-2 刺突蛋白包含天然信号肽的S1 亚基的编码序列 (SARS-CoV-2spike protein S1 subunit with native signal peptide coding sequence)

<400> 45

atgtttgttt ttcttgtttt attgccatta gtctctagtc agtgtgttaa tcttacaacc 60

agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120

aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180

aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240

aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300

ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360

aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420

ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480

tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540

ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600

tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660

tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720

ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780

ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840

gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900

tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960

caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020

gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080

tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140

ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200

gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260

tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320

cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380

ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440

aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500

aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560

ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620

ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680

cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740

acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800

ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860

cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920

aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980

gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040

cctcggcggg cacgt 2055

<210> 46

<211> 39

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR DNA 序列 (Exemplary 5-Prime-UTR DNA Sequence)

<400> 46

gaaataagag agaaaagaag agtaagaaga aatataaga 39

<210> 47

<211> 39

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR RNA 序列(Exemplary 5-Prime-UTR RNA Sequence)

<400> 47

gaaauaagag agaaaagaag aguaagaaga aauauaaga 39

<210> 48

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR DNA 序列(Exemplary 5-Prime-UTR DNA Sequence)

<400> 48

cttgttcttt ttgcagaagc tcagaataaa cgctcaactt tgg 43

<210> 49

<211> 43

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR RNA 序列 (Exemplary 5-Prime-UTR RNA Sequence )

<400> 49

cuuguucuuu uugcagaagc ucagaauaaa cgcucaacuu ugg 43

<210> 50

<211> 100

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR DNA 序列(Exemplary 5-Prime-UTR DNA Sequence )

<400> 50

gcaggagcca gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt 60

ctgacacaac tgtgttcact agcaacctca aacagacacc 100

<210> 51

<211> 100

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性5’-UTR RNA 序列 (Exemplary 5-Prime-UTR RNA Sequence )

<400> 51

gcaggagcca gggcugggca uaaaagucag ggcagagcca ucuauugcuu acauuugcuu 60

cugacacaac uguguucacu agcaaccuca aacagacacc 100

<210> 52

<211> 113

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR DNA 序列(Exemplary 3-Prime-UTR DNA Sequence )

<400> 52

taggctggag cctcggtggc catgcttctt gccccttggg cctcccccca gcccctcctc 60

cccttcctgc acccgtaccc ccgtggtctt tgaataaagt ctgagtgggc ggc 113

<210> 53

<211> 113

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR RNA 序列 (Exemplary 3-Prime-UTR RNA Sequence )

<400> 53

uaggcuggag ccucgguggc caugcuucuu gccccuuggg ccucccccca gccccuccuc 60

cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 113

<210> 54

<211> 132

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR DNA 序列(Exemplary 3-Prime-UTR DNA Sequence )

<400> 54

gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60

taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120

tattttcatt gc 132

<210> 55

<211> 132

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR RNA 序列 (Exemplary 3-Prime-UTR RNA Sequence )

<400> 55

gcucgcuuuc uugcugucca auuucuauua aagguuccuu uguucccuaa guccaacuac 60

uaaacugggg gauauuauga agggccuuga gcaucuggau ucugccuaau aaaaaacauu 120

uauuuucauu gc 132

<210> 56

<211> 278

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR DNA 序列(Exemplary 3-Prime-UTR DNA Sequence )

<400> 56

ctggtactgc atgcacgcaa tgctagctgc ccctttcccg tcctgggtac cccgagtctc 60

ccccgacctc gggtcccagg tatgctccca cctccacctg ccccactcac cacctctgct 120

agttccagac acctcccaag cacgcagcaa tgcagctcaa aacgcttagc ctagccacac 180

ccccacggga aacagcagtg attaaccttt agcaataaac gaaagtttaa ctaagctata 240

ctaaccccag ggttggtcaa tttcgtgcca gccacacc 278

<210> 57

<211> 278

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 示例性3’-UTR RNA 序列 (Exemplary 3-Prime-UTR RNA Sequence )

<400> 57

cugguacugc augcacgcaa ugcuagcugc cccuuucccg uccuggguac cccgagucuc 60

ccccgaccuc gggucccagg uaugcuccca ccuccaccug ccccacucac caccucugcu 120

aguuccagac accucccaag cacgcagcaa ugcagcucaa aacgcuuagc cuagccacac 180

ccccacggga aacagcagug auuaaccuuu agcaauaaac gaaaguuuaa cuaagcuaua 240

cuaaccccag gguuggucaa uuucgugcca gccacacc 278

<210> 58

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 茎环序列(stem-loop sequence)

<400> 58

caaaggctct tttcagagcc acca 24

<210> 59

<211> 24

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 茎环序列(stem-loop sequence)

<400> 59

caaaggcucu uuucagagcc acca 24

Claims

1.一种非天然存在的核酸，其编码源自冠状病毒SARS-CoV-2的病毒肽或蛋白质。

2.一种非天然存在的核酸，其编码来源于冠状病毒的包含基因组的病毒肽或蛋白质，其中所述基因组包含SEQ ID NO：1所示的核酸序列。

3.权利要求1或2的非天然存在的核酸，其包含编码区，其中所述编码区包含一个或多个开放阅读框(ORF)，并且其中至少一个ORF编码病毒肽或蛋白质。

4.根据权利要求3所述的非天然存在的核酸，其中至少一个ORF编码异源肽或异源多肽。

5.权利要求4所述的非天然存在的核酸，其中所述异源肽或异源多肽是免疫刺激肽或蛋白。

6.权利要求3所述的非天然存在的核酸，其中所述ORF编码包含病毒肽或蛋白融合至异源肽或多肽的融合蛋白。

7.根据权利要求6所述的非天然存在的核酸，其中所述异源肽或多肽选自人免疫球蛋白的Fc区、信号肽和促进融合蛋白多聚化的肽。

8.根据权利要求3至7中任一项所述的非天然存在的核酸，其中所述一个或多个ORF含有表1至表4所列的编码序列。

9.根据权利要求3至8中任一项所述的非天然存在的核酸，其中所述一个或多个ORF含有选自SEQ ID NOS：3、5、7、9、11、13、15、17、17、19、27、29、31、33、35、37、39、41、43和45的编码序列，或其转录的RNA序列。

10.根据权利要求3至9中任一项所述的非天然存在的核酸，其中所述一个或多个ORF编码选自SEQ ID NO：2、4、6、8、10、12、14、16、18、20-26、28、30、32、34、36、38、40、42和44的肽或蛋白质。

11.根据权利要求1至10中任一项所述的非天然存在的核酸，其还包含5'非翻译区(5'-UTR)，其中所述5'-UTR包含SEQ ID NO：46-51所示的序列。

12.根据权利要求1至11中任一项所述的非天然存在的核酸，其还包含3'非翻译区(3'-UTR)，其中所述3'-UTR包含SEQ ID NO：52-57所示的序列。

13.权利要求12的非天然存在的核酸，其中3′-UTR进一步包含聚A尾(poly-A tail)或聚腺苷酸化信号。

14.权利要求1至13中任一项所述的非天然存在的核酸，其包含一种或多种选自假尿苷、1-甲基-假尿苷和5-甲基胞嘧啶的功能性核苷酸类似物。

15.根据权利要求1至14中任一项所述的非天然存在的核酸，其中所述核酸是DNA或mRNA。

16.一种载体，其包含权利要求1至15中任一项所述的非天然存在的核酸。

17.包含权利要求1至15中任一项的非天然存在的核酸的细胞。

18.包含权利要求16所述的载体的细胞。

19.一种组合物，其包含权利要求1至15中任一项所述的非天然存在的核酸和至少一种脂质。

20.根据权利要求19所述的组合物，其被配制为将核酸包封在脂质壳中的脂质纳米颗粒。

21.根据权利要求19或20所述的组合物，其中所述组合物是药物组合物。

22.药物组合物，其包含至少一种编码源自冠状病毒SARS-CoV-2的病毒肽或蛋白质的核酸。

23.药物组合物，其包含至少一种核酸，其编码源自冠状病毒的病毒肽或蛋白质，所述核酸包含基因组，其中所述基因组包含SEQ ID NO：1所示的核酸序列。

24.根据权利要求22或23所述的药物组合物，其中所述病毒肽或蛋白质选自：

(a)冠状病毒的刺突(S)蛋白，

(b)冠状病毒的基质(M)蛋白，

(c)冠状病毒的核衣壳(N)蛋白，

(d)冠状病毒的包膜蛋白，

(e)血凝素酯酶(HE)蛋白，

(f)(a)至(e)中任一项的免疫原性片段；和

(g)(a)至(f)中任一项的功能衍生物。

25.根据权利要求22至24中任一项所述的药物组合物，其中，所述病毒肽或蛋白质是所述S蛋白、所述S蛋白的免疫原性片段、或所述S蛋白的功能性衍生物或其免疫原性片段。

26.根据权利要求25所述的药物组合物，其中所述S蛋白的免疫原性片段选自胞外域(ECD)、S1亚基、受体结合域(RBD)和受体结合基序(RBM)。

27.根据权利要求26所述的药物组合物，其中所述病毒肽或蛋白质是RBD的功能性衍生物。

28.权利要求27的药物组合物，其中RBD的功能衍生物在RBD中包含一个或多个氨基酸取代，其能够增加RBD对宿主细胞受体的结合亲和力。

29.根据权利要求28所述的药物组合物，其中，所述受体是ACE2。

30.根据权利要求28或29所述的药物组合物，其中所述氨基酸取代为N501T。

31.根据权利要求25至30中任一项所述的药物组合物，其中所述病毒肽或蛋白质包含SEQ ID NO：2、4、6、8、10、12、14、16、20-26、32、34、40、42和44所示的氨基酸序列。

32.权利要求25至30中任一项所述的药物组合物，其中所述核酸包含SEQ ID NO：3、5、7、9、11、13、15、17、27、29、31、33、35、37、39、41、43、45、46、48、50、52、54、56所示的序列，或其转录的RNA序列。

33.根据权利要求27所述的药物组合物，其中，所述RBD的功能性衍生物包括与人免疫球蛋白的Fc区融合的RBD。

34.权利要求33的药物组合物，其中所述免疫球蛋白是IgG1。

35.根据权利要求27所述的药物组合物，其中，所述RBD的功能性衍生物包括与促进融合蛋白多聚化的肽融合的RBD。

36.权利要求35的药物组合物，其中S-RBD的功能衍生物形成三聚体复合物。

37.根据权利要求22至24中任一项所述的药物组合物，其中所述病毒肽或蛋白质是N蛋白。

38.根据权利要求37所述的药物组合物，其中，所述N蛋白包含SEQ ID NO：18所示的氨基酸序列。

39.根据权利要求38所述的药物组合物，其中，所述核酸包含SEQ ID NO：19所示的序列，或从其转录的RNA序列。

40.根据权利要求22至39中任一项所述的药物组合物，其中所述核酸还包含5′非翻译区和/或3′非翻译区。

41.权利要求40的药物组合物，其中5'非翻译区包含选自SEQ ID NO：46-51的序列。

42.根据权利要求40或41所述的药物组合物，其中所述3′非翻译区包含聚A尾(poly-Atail)或聚腺苷酸化信号。

43.权利要求40至42中任一项的药物组合物，其中3′非翻译区包含选自SEQ ID NO：52-57的序列。

44.根据权利要求22至43中任一项所述的药物组合物，其中所述核酸包含一种或多种选自假尿苷、1-甲基-假尿苷和5-甲基胞嘧啶的功能性核苷酸类似物。

45.根据权利要求22至44中任一项所述的药物组合物，其进一步包含至少一种脂质。

46.根据权利要求45所述的药物组合物，其中所述脂质是根据式(I)至(IV)的化合物。

47.根据权利要求45或46所述的药物组合物，其中所述脂质是根据式(I-A)、(I-B)、(IB’)、(I-B”)、(I-C)、(I-D)、(I-E)、(I-F)、(I-F’)、(I-F”)、(I-G)、(I-H)、(I-I)、(I-J)、(I-J’)、(I-J”)、(I-K)、(I-L)、(I-M)、(I-N)、(I-N’)、(I-N”)、(I-O)、(I-P)、(I-Q)、(I-R)、(I-R’)、(I-R”)、(I-S)、(I-T)、(I-U)，(II-A)、(II-B)、(II-B’)、(II-B”)、(II-C)、(II-D)、(II-E)、(II-F)、(II-F’)、(II-F”)、(II-G)、(II-H)、(II-I)、(II-J)、(II-J’)、(II-J”)、(II-K)、(II-L)、(II-M)、(II-N)、(II-N’)、(II-N”)、(II-O)、(II-P)、(II-Q)、(II-R)、(II–R’)、(II–R”)、(II-S)、(II-T)、(II-U)，(III-A)、(III-B)、(III-B’)、(III-B”)、(III-C)、(III-D)、(III-E)、(III-F)、(III-F’)、(III-F”)、(III-G)、(III-H)、(III-I)、(III-J)、(III-J’)、(III-J”)、(III-K)、(III-L)、(III-M)、(III-N)、(III-N’)、(III-N”)、(III-O)、(III-P)、(III-Q)、(III-R)、(III-R’)、(III-R”)、(III-S)、(III-T)、(III-U),(IV-A)、(IV-B)、(IV-B’),(IV-B”),(IV-C)、(IV-D)、(IV-E)、(IV-F)、(IV-F’)、(IV-F”)、(IV-G)、(IV-H)、(IV-I)、(IV-J)、(IV-J’)、(IV-J”)、(IV-K)、(IV-L)、(IV-M)、(IV-N)、(IV-N’)、(IV-N”)、(IV-O)、(IV-P)、(IV-Q)、(IV-R)、(IV-R’)、(IV-R”)、(IV-S)、(IV-T)或(IV-U)的化合物。

48.根据权利要求45至47中任一项所述的药物组合物，其中所述脂质是表1中所列的化合物。

49.根据权利要求45至48中任一项所述的药物组合物，其中所述组合物被配制为将核酸包裹在脂质壳中的脂质纳米颗粒。

50.根据权利要求22至49中任一项所述的药物组合物，其中所述组合物是疫苗。

51.一种在施用对象中治控制、预防或治疗由冠状病毒引起的感染性疾病的方法，其包括向施用对象施用治疗有效量的权利要求1至15中任一项所述的非天然存在的核酸，或权利要求21至50中的任一项所述的药物组合物。

52.根据权利要求51所述的方法，其中所述施用对象是人类或非人类哺乳动物。

53.根据权利要求52所述的方法，其中，所述施用对象是成人、儿童或幼儿。

54.权利要求51至53中任一项所述的方法，其中所述施用对象患有感染性疾病。

55.根据权利要求51至53中任一项所述的方法，其中所述施用对象对冠状病毒易感或处于冠状病毒感染的风险中。

56.根据权利要求55所述的方法，其中所述施用对象是老年人。

57.根据权利要求51至54中任一项所述的方法，其中，所述施用对象被诊断为冠状病毒感染阳性。

58.权利要求51至57中任一项所述的方法，其中所述施用对象是无症状的。

59.根据权利要求51至58所述的方法，其中所述方法包括向所述施用对象施用包裹所述核酸的脂质纳米颗粒，并且其中所述脂质纳米颗粒被所述施用对象的细胞内吞。

60.根据权利要求51至59所述的方法，其中所述核酸由所述施用对象的细胞表达。

61.根据权利要求51至60中任一项所述的方法，其中在所述施用对象中引起针对冠状病毒的免疫应答。

62.根据权利要求61所述的方法，其中，所述免疫应答包括与所述核酸编码的病毒肽或蛋白质特异性结合的抗体的产生。

63.权利要求62的方法，其中所述抗体是针对冠状病毒或被冠状病毒感染的细胞的中和抗体。

64.权利要求62或63的方法，其中所述抗体的血清滴度在所述施用对象中增加。

65.权利要求62至64中任一项的方法，其中所述抗体特异性结合S蛋白的一个或多个表位。

66.权利要求65的方法，其中所述S蛋白的一种或多种功能或活性被减弱。

67.如权利要求66所述的方法，其中所述S蛋白功能或活性的减弱通过以下方法测量：

(a)S蛋白与宿主细胞受体的结合减少；

(b)冠状病毒对宿主细胞的附着减少；

(c)由冠状病毒引起的宿主细胞膜融合减少；或者

(d)受试者中被冠状病毒感染的细胞数量减少。

68.根据权利要求67所述的方法，其中所述宿主细胞受体选自血管紧张素转化酶2(ACE2)、氨基肽酶N(APN)、二肽基肽酶4(DPP4)、癌胚抗原相关细胞粘附分子1(CEACAM1)和糖。

69.权利要求66至68中任一项所述的方法，其中所述S蛋白功能或活性降低10％、20％、30％、40％、50％、60％、70％、80％、90％、95％或100％。

70.根据权利要求62至64所述的方法，其中所述抗体特异性结合N蛋白的一个或多个表位。

71.根据权利要求70所述的方法，其中所述N蛋白的一种或多种功能或活性被减弱。

72.根据权利要求71的方法，其中N蛋白功能或活性的减弱通过以下方法测量：

(a)N蛋白与冠状病毒复制基因组序列的结合减少；

(b)将冠状病毒的复制的基因组序列包装到功能性病毒衣壳中减少；或

(c)施用对象中复制的病毒颗粒的数量减少。

73.根据权利要求72所述的方法，其中所述N蛋白的功能或活性降低了10％、20％、30％、40％、50％、60％、70％、80％、90％、95％或100％。

74.根据权利要求62至73中任一项所述的方法，其中所述抗体与病毒颗粒或被感染的细胞结合，并标记被感染的细胞的病毒颗粒，以被所述施用对象的免疫系统破坏。

75.权利要求74的方法，其中抗体结合的病毒颗粒的内吞作用被诱导或增强。

76.根据权利要求74或75所述的方法，其中，施用对象中所述受感染细胞的抗体依赖的细胞介导的细胞毒性作用(ADCC)被诱导或增强。

77.根据权利要求74至76中任一项所述的方法，其中，施用对象中所述感染细胞的抗体依赖的细胞吞噬作用(ADCP)被诱导或增强。

78.根据权利要求74至77中任一项所述的方法，其中，施用对象中所述感染细胞的补体依赖的细胞毒性(CDC)被诱导或增强。

79.根据权利要求51至78任一项所述的方法，其中所述感染性疾病是呼吸道感染、肺部感染、肾感染、肝脏感染、肠感染、神经系统感染、呼吸综合征、支气管炎、肺炎、肠胃炎、脑脊髓炎、脑炎、结节病、腹泻、肝炎和脱髓鞘疾病。

80.根据权利要求79所述的方法，其中所述感染性疾病是呼吸道感染。

81.根据权利要求79所述的方法，其中所述感染性疾病是肺部感染。

82.根据权利要求79所述的方法，其中所述感染性疾病是呼吸综合症。

83.根据权利要求79所述的方法，其中所述感染性疾病是肺炎。