CN114934056A

CN114934056A - 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

Info

Publication number: CN114934056A
Application number: CN202210724687.8A
Authority: CN
Inventors: 岑山; 王静; 张永欣; 马铃; 董翊洁
Original assignee: Renjing Suzhou Biotechnology Co ltd
Current assignee: Renjing Suzhou Biotechnology Co ltd
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2022-08-23
Anticipated expiration: 2042-06-24
Also published as: CN114934056B

Abstract

本发明公开了一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。本发明提供了一种RNA分子，包括编码SARS‑CoV‑2的抗原性多肽或者免疫原性片段的核酸序列；其中，所述抗原性多肽或所述免疫原性片段选自SARS‑CoV‑2的S蛋白或其变体、SARS‑CoV‑2的受体结合结构域或其变体；所述SARS‑CoV‑2的S蛋白的变体与所述SARS‑CoV‑2的S蛋白的原始序列相比，存在如下突变位点：K983P和V984P。本发明所提供的RNA疫苗能够有效的诱导冠状病毒抗原特异性免疫应答，产生针对SARS‑CoV‑2病毒的中和抗体滴度，本发明对于预防或治疗冠状病毒感染，特别是预防或治疗SARS‑CoV‑2Omicron变异病毒的感染具有重要意义。

Description

一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

技术领域

本发明涉及生物技术领域，具体涉及一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。

背景技术

2019新型冠状病毒(SARS-CoV-2)是以前从未在人体中发现的冠状病毒新毒株，该病毒为第七个可以感染人的冠状病毒(CoV)。人感染SARS-CoV-2的潜伏期一般为 1～14天，感染后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等。在较严重病例中，感染可导致肺炎、严重急性呼吸综合征、肾衰竭，甚至死亡。

新冠病毒是正义单链RNA((+)ssRNA)包膜病毒，编码4种结构蛋白：刺突蛋白 (S)、包膜蛋白(E)、膜蛋白(M)和核壳蛋白(N)。S蛋白分为S1和S2两个子结构域，S1结构域负责识别病毒特异性受体并结合至宿主细胞，S2具有跨膜结构域，负责膜融合。SARS-CoV-2Omicron变异病毒株于2021年11月在南非被首次报告，后已传播至少159个国家和地区，成为全球主要流行的病毒变异株，而基于早期流行株研发的新冠疫苗针对SARS-CoV-2Omicron变异病毒株的中和能力均存在显著下降。

目前上市和在研的新型冠状病毒疫苗主要包括mRNA疫苗、灭活疫苗、腺病毒载体疫苗、DNA疫苗、重组蛋白疫苗等。mRNA疫苗是将体外转录的mRNA递送至细胞，翻译产生蛋白，进而激发机体的特异免疫应答。mRNA疫苗不同于其他的核酸疫苗，不需要入核仅在细胞质中完成表达，因此没有造成宿主基因组插入突变的风险。此外， mRNA的快速、简易制备方法和低成本也是作为疫苗的优势之一，大大缩短了应对突发感染性疾病的反应时间，降低了防控成本。

发明内容

本发明的目的是提供一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。

鉴于S蛋白在宿主细胞识别和进入以及宿主免疫系统诱导病毒中和抗体中的重要性，本发明将SARS-CoV-2的S蛋白用于疫苗开发。S蛋白的融合前构象对建立有效的免疫系统至关重要，因此为开发更有针对性的mRNA疫苗，本发明选取了Omicron 病毒株的S蛋白以及在此基础上进行的特定脯氨酸位点的替代变体，分别得到 Omicron S，Omicron S-2P(K983P，V984P)和Omicron S-6P(F814P，A889P，A896P，A939P，K983P，V984P)的抗原序列。

第一方面，本发明提供一种RNA分子。

本发明提供的RNA分子，包括编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列(如可为开放阅读框)；其中，所述抗原性多肽或所述免疫原性片段选自 SARS-CoV-2的S蛋白或其变体、SARS-CoV-2的受体结合结构域(RBD)或其变体。

所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比，存在如下突变位点：K983P和V984P。以K983P为例，表示将所述SARS-CoV-2的S蛋白的原始序列的第983位(对应SEQ ID No.1的第983位)的氨基酸残基由K突变为 P。其余突变位点表示法同理。

进一步地，所述SARS-CoV-2是SARS-CoV-2Omicron变异病毒株。

在本发明的一些案例中，所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的 S蛋白的原始序列相比，还存在如下突变位点中的全部或部分：F814P、A889P、A896P、 A939P。

在所述抗原性多肽或者所述免疫原性片段中，可包含一个或多个免疫原性表位。例如，至少2个，至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个，至少10个或更多个免疫原性表位。

进一步地，所述抗原性多肽或者所述免疫原性片段可为如下任一：

(A1)SARS-CoV-2Omicron变异病毒株的S蛋白；

(A2)SARS-CoV-2Omicron变异病毒株的S蛋白变体Omicron S-2P,其氨基酸序列与所述SARS-CoV-2Omicron变异病毒株的S蛋白的原始序列相比，仅存在K983P 和V984P两个突变位点；

(A3)SARS-CoV-2Omicron变异病毒株的S蛋白变体Omicron S-6P，其氨基酸序列与所述SARS-CoV-2Omicron变异病毒株的S蛋白的原始序列相比，仅存在F814P、 A889P、A896P、A939P、K983P和V984P六个突变位点。

在(A2)-(A3)中，所述SARS-CoV-2Omicron变异病毒株的S蛋白变体的突变位置相对应的原始序列为含有信号肽的序列(如SEQ ID No.1)。

(A4)SEQ ID No.1的第17-1270位或SEQ ID No.2的第17-1270位或SEQ ID No.3的第17-1270位所示多肽；

(A5)与(A4)所限定的氨基酸序列相比具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性的多肽。

相应地，编码所述抗原性多肽或者所述免疫原性片段的RNA序列为如下任一：

(B1)将SEQ ID No.4的第49-3810位或SEQ ID No.5的第49-3810位或SEQ ID No.6的第49-3810位核苷酸中的T替换为U后所得核苷酸序列；

(B2)与(B1)所限定的核苷酸序列相比具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性。

其中，SEQ ID No.1的第17-1270位所示多肽为不含信号肽的SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列(由SEQ ID No.4的第49-3810位编码得到)；SEQ ID No.2的第17-1270位所示多肽为不含信号肽的Omicron S-2P(由SEQ ID No.5 的第49-3810位编码得到)；SEQ ID No.3的第17-1270位所示多肽为不含信号肽的 Omicron S-6P(由SEQ IDNo.6的第49-3810位编码得到)。

在一些实施方案中，编码所述抗原性多肽或者所述免疫原性片段的核酸序列还包含用于编码分泌信号肽的核酸序列。

进一步地，编码所述分泌信号肽的核酸序列位于编码所述抗原性多肽或者所述免疫原性片段的核酸序列的5’端。

进一步地，所述分泌信号肽可为如下任一：

(C1)SARS-CoV-2(如SARS-CoV-2Omicron变异病毒株)的S蛋白的分泌信号肽；

(C2)SEQ ID No.1的第1-16位或SEQ ID No.2的第1-16位或SEQ ID No.3的第1-16位所示多肽；

(C3)与(C2)所限定的氨基酸序列相比具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性的多肽。

相应地，编码所述分泌信号肽的RNA序列可选自如下任一：

(D1)将SEQ ID No.4的第1-48位或SEQ ID No.5的第1-48位或SEQ ID No.6 的第1-48位核苷酸中的T替换为U后所得核苷酸序列；

(D2)与(D1)所限定的核苷酸序列相比具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性。

在一些实施方案中，所述RNA分子可为mRNA、环状RNA(cRNA)或自复制RNA(saRNA)。其中，所述RNA分子适合多肽的细胞内表达。

在一些实施方案中，所述RNA分子为经过修饰的RNA分子。进一步地，所述修饰是通过用修饰的尿苷残基取代一些或全部尿苷残基。更进一步地，所述修饰的尿苷可以是N1-甲基-假尿苷。

在一些实施方案中，所述RNA分子还可包括一个或多个能够促进稳定性和/或翻译效率的结构元件。进一步地，所述结构元件可包括：5’帽、5’UTR、3’UTR和/ 或polyA尾。

更进一步地，所述5’帽可以是或包含cap1结构；更加具体地，所述5’帽是 m7G(5’)ppp(5’)(2’-OMeA)pG。

更进一步地，所述5'-UTR可以是人β-珠蛋白mRNA的5'-UTR序列；所述5'-UTR 可以具有Kozak序列。更加具体地，所述5’UTR可包含或为SEQ ID No.7所示核苷酸序列，或与SEQID No.7所示核苷酸序列具有至少99％、98％、97％、96％、95％、90％、 85％或80％同源性的核苷酸序列。

更进一步地，所述3'-UTR可以是人β-珠蛋白mRNA的两个重复的3'-UTR。更加具体地，所述3’UTR可以包含或为SEQ ID No.8所示核苷酸序列，或与SEQ ID No.8 所示核苷酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性的核苷酸序列。

更进一步地，所述polyA尾可以包含至少50、至少60或至少100个腺嘌呤核糖核苷酸；更加具体地，所述polyA尾可以包含或为SEQ ID No.9所示核苷酸序列，或由SEQ IDNo.9所示核苷酸序列组成。

在本发明的具体实施方式中，所述RNA分子的序列为如下任一：

(E1)SEQ ID No.10或SEQ ID No.11SEQ ID No.12；

(E2)与(E1)所限定的核苷酸序列相比具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性。

第二方面，本发明要求保护如下任一生物材料：

(F1)能够转录得到前文第一方面所述RNA分子的DNA分子；

(F2)含有(F1)中所述DNA分子的表达盒或重组载体或重组菌或重组细胞系。

第三方面，本发明要求保护一种用于预防和/或治疗新冠病毒感染的组合物。

本发明要求保护的组合物包含前文第一方面所述的RNA分子。

在一些实施方案中，所述组合物可配制为或待配制为液体、固体或其组合。进一步地，所述组合物配制为或待配制为用于注射或其他给药方式。更进一步地，所述组合物配制为或待配制为用于肌肉内注射。

进一步地，所述组合物可为将所述RNA分子与蛋白和/或脂质复合而成的RNA-颗粒。

更进一步地，所述组合物可为将所述RNA分子负载于脂质纳米颗粒中后得到。所述脂质纳米颗粒可为如下任一：

(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇(PEG)-脂质，或者由这四者组合而成。

(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基) 辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇，或者由这四者组合而成。

其中，十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)即为SM-102；二肉豆蔻酰甘油-聚乙二醇2000即为DMG-PEG2000；1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱即为DSPC。

在一些实施方案中，所述脂质纳米颗粒中包载的所述RNA分子的量在200μg/mL 以上(如350μg/mL-640μg/mL)。

在一些实施方案中，SM-102、DSPC、胆固醇和DMG-PEG2000以274.64:61.12:115.14:29.11的质量比混合。

在一些实施方案中，将所述RNA分子配制为或待配制为胶体。进一步地，所述 RNA配制为颗粒，在形成的胶体分散相中存在50％或更多、75％或更多或者85％或更多的RNA。更进一步地，所述颗粒通过使溶于水相中的RNA暴露于溶于有机相中的脂质形成，其中所述有机相可包含乙醇。或者，所述颗粒通过使溶于水相中的RNA暴露于分散于水相中的脂质形成，其中所述分散于水相中的脂质形成脂质体。

在一些实施方案中，所述RNA分子可以1μg-100μg每剂量的范围的量存在于所述组合物中。

第四方面，本发明要求保护前文第一方面所述RNA分子或前文第二方面所述生物材料或前文第三方面所述组合物在制备用于预防和/或治疗新冠病毒感染药物中的用途。所述药物可为疫苗(如RNA疫苗)。

进一步地，所述药物可包含一种或多种药学上可接受的载剂、稀释剂和/或赋形剂。

第五方面，本发明要求保护一种用于预防和/或治疗新冠病毒感染的药物。

本发明要求保护的用于预防和/或治疗新冠病毒感染的药物，其有效成分包括或为前文第一方面所述的RNA分子。

进一步地，所述药物还可包含一种或多种药学上可接受的载体、稀释剂和/或赋形剂。

在一些实施方案中，所述药物用于在受试者中诱导针对冠状病毒的免疫应答；进一步地，所述针对冠状病毒的免疫应答为针对冠状病毒抗原的特异性免疫应答。

在一些实施方案中，所述药物用于冠状病毒感染的治疗和/或预防。

在第四和第五方面中，所述冠状病毒为β冠状病毒。所述冠状病毒为沙贝病毒(sarbecovirus)。所述冠状病毒为SARS-CoV-2，进一步地所述冠状病毒为 SARS-CoV-2Omicron变异病毒株。

在一些实施方案中，当所述RNA分子、所述组合物或所述药物给予人源细胞时，实现能够被检测的所述抗原性多肽或者所述免疫原性片段的表达；进一步地，所述表达持续至少24小时或更长的时间段。

在一些实施方案中，施用所述RNA分子、所述组合物或所述药物能够在所述受试者中产生免疫效果，所述免疫效果包括产生SARS-CoV-2中和抗体和/或T细胞应答；进一步地，所述T细胞应答为TH1型T细胞应答；更进一步地，所述TH1型T细胞应答为CD4⁺和/或CD8⁺T细胞应答。

在一些实施方案中，施用所述RNA分子、所述组合物或所述药物在所述受试者中产生免疫应答，所述免疫应答包括产生针对SARS-CoV-2刺突蛋白的S1亚基的结合抗体滴度；进一步地，所述免疫应答包括产生针对SARS-CoV-2病毒的中和抗体滴度。

在一些实施方案中，将所述RNA分子、所述组合物或所述药物施用给所述受试者之后7天，所述受试者(如小鼠)的血清显示针对所述抗原性多肽或者所述免疫原性片段的抗体的产生。

在一些实施方案中，将所述RNA分子、所述组合物或所述药物施用给所述受试者之后14天，所述受试者(如小鼠)的血清显示病毒中和活性。

进一步地，所述受试者为哺乳动物；更进一步地，所述受试者为小鼠；更加具体地，所述受试者为人类。

第六方面，本发明要求保护一种制备用于预防和/或治疗新冠病毒感染RNA疫苗的方法。

本发明要求保护的制备用于预防和/或治疗新冠病毒感染RNA疫苗的方法，可包括将前文第一方面所述的RNA分子负载于脂质纳米颗粒中的步骤。

所述脂质纳米颗粒可为如下任一：

本发明还要求保护在受试者中诱导针对冠状病毒的免疫应答，进一步地针对冠状病毒抗原的特异性免疫应答的方法。在另一方面，本发明还要求保护用于冠状病毒感染的治疗或预防性治疗的方法。所述方法包括向受试者施用本文所述的RNA分子、所述组合物或所述药物。所述受试者为哺乳动物，进一步地所述受试者为小鼠，更进一步地所述受试者为人类。在本发明所述方法的一些实施方案中，所述冠状病毒为β冠状病毒，或所述冠状病毒为沙贝病毒，或所述冠状病毒为SARS-CoV-2，进一步地所述冠状病毒为SARS-CoV-2Omicron变异病毒株。

实验证明，本发明所提供的RNA疫苗能够有效的诱导冠状病毒抗原特异性免疫应答，产生针对SARS-CoV-2病毒的中和抗体滴度。假病毒实验显示Omicron S组， Omicron S-2P组，Omicron S-6P组28天免疫血清对SARS-CoV-2假型病毒中和抗体几何平均效价分别为895，4300，5760。真病毒实验显示：Omicron S组，Omicron S-2P 组，Omicron S-6P组28天免疫血清对SARS-CoV-2流行株、南非株、印度株和奥米克戎株均具有中和活性，其中以对奥米克戎株的中和活性(NT50)最高，分别为512、 768和512。本发明对于预防或治疗冠状病毒感染，特别是预防或治疗SARS-CoV-2 Omicron变异病毒的感染具有重要意义。

附图说明

图1为LNP-mRNA在293T细胞中的表达。阴性对照为LNP(未包载mRNA脂质颗粒的对照)。

图2为mRNA疫苗免疫小鼠血清IgG抗体检测。

图3为免疫后28天各组mRNA疫苗诱导的体液免疫应答。

图4为ELISpot检测免疫小鼠脾细胞分泌IFN-γ水平。

图5为ELISpot检测免疫小鼠脾细胞分泌IL-2水平。

图6为mRNA疫苗免疫小鼠血清针对Omicron假型病毒的中和抗体检测。

具体实施方式

除非另外指出，否则本发明实验将采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和合成生物学等等的常规技术，其在本领域技术范围内。这样的技术在文献中有充分的解释：“Molecular Cloning:A Laboratory Manual,”第二版(Sambrook等人，1989)；“Oligonucleotide Synthesis”(M.J.Gait 编,1984)；“Animal Cell Culture”(R.I.Freshney编,1987)；“Methods in Enzymology”(Academic Press,Inc.)；“CurrentProtocols in Molecular Biology”(F.M.Ausubel等人编，1987，以及定期更新)；“PCR:ThePolymerase Chain Reaction,”(Mullis等人编,1994)；Singleton等人，Dictionary ofMicrobiology and Molecular Biology第二版，J.Wiley&Sons(New York，N.Y.1994)和March’s Advanced Organic Chemistry Reactions,Mechanisms and Structure第四版，John Wiley&Sons(New York，N.Y.1992)，为本领域技术人员提供了本申请中使用的许多术语的通用指南。

除非另有定义，否则本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。为了本发明的目的，下文定义了下述术语。

冠词“一个/一种”和“该/所述”在本文中用于指一个/一种；超过一个/一种即至少一个/一种。替代(例如“或”)的使用应理解为意指替代方案中任一、两者或其任何组合。术语“和/或”应理解为意指替代方案中任一或两者。

如本文使用的，术语“约”或“大约”是指与参考数量、水平、值、数量、频率、百分比、尺度、大小、量、重量或长度相比较，改变多达15％、10％、9％、8％、 7％、6％、5％、4％、3％、2％或1％的数量、水平、值、数量、频率、百分比、尺度、大小、量、重量或长度。

在本说明书全文，除非上下文另有要求，否则术语“包含”，“包括”、“含有”和“具有”应理解为暗示包括所述步骤或要素或者步骤组或要素组，但不排除任何其他步骤或要素或者步骤组或要素组。在特定实施方式中，术语“包含”，“包括”、“含有”和“具有”同义使用。

“由……组成”意指包括但限于在短语“由……组成”中的任何。因此，短语“由……组成”是指示所列出的要素是需要的或强制性的，并且没有其他要素是可以存在的。

“基本上由……组成”意指包括在短语“基本上由……组成”中列出的任何要素，并且限于不干扰或贡献于所列出的要素的公开内容中指定的活动或动作的其他要素。因此，短语“基本上由……组成”是指示所列出的要素是需要的或强制性的，但没有其他要素是任选的，并且取决于它们是否影响所列出的要素的活动或动作而可以存在或不存在。

在本说明书全文，提到“一个实施方案”、“一些实施方案”、“一个具体的实施方案”等类似表述意指与所述实施方式结合描述的特定特征、结构或特性被包括在本发明的至少一个实施方式中。因此，前述短语在本说明书全文的各个地方的出现不一定全部指相同实施方式。此外，特定特征、结构或特性可以以任何合适方式在一个或多个实施方式中组合。

如本文所用的，“突变体”和“变体”是指保留与原始序列的生物学活性相同或基本上相同的生物学活性的分子。该突变体或变体可以来自相同或不同的物种，或者可以是基于天然的分子或现有的分子的合成序列。在一些实施方式中，术语“突变体”和“变体”是指多肽具有的氨基酸序列与对应的野生型多肽至少相差一个氨基酸。例如，突变体和变体可以包含保守氨基酸取代：即用具有相似性质的氨基酸取代原有的对应氨基酸。保守取代可以是极性对极性氨基酸，如甘氨酸(G，Gly)、丝氨酸(S，Ser)、苏氨酸(T，Thr)、酪氨酸(Y，Tyr)、半胱氨酸(C，Cys)、天冬酰胺(N，Asn)和谷氨酰胺(Q，Gln)；非极性对非极性氨基酸，如丙氨酸(A， Ala)、缬氨酸(V，Val)、色氨酸(W，Trp)、亮氨酸(L，Leu)、脯氨酸(P，Pro)、甲硫氨酸(Μ，Met)、苯丙氨酸(F，Phe)；酸性对酸性氨基酸，如天冬氨酸(D， Asp)、谷氨酸(E，Glu)；碱性对碱性氨基酸，如精氨酸(R，Arg)、组氨酸(H， His)、赖氨酸(K，Lys)；带电荷氨基酸对带电荷氨基酸，如天冬氨酸(D，Asp)、谷氨酸(E，Glu)、组氨酸(H，His)、赖氨酸(K，Lys)和精氨酸(R，Arg))；疏水对疏水性氨基酸，如丙氨酸(A，Ala)、亮氨酸(U，Leu)、异亮氨酸(I，Ile)、缬氨酸(V，Val)、脯氨酸(P，Pro)、苯丙氨酸(F，Phe)、色氨酸(W，Trp)和甲硫氨酸(M，Met)。在一些其他实施方式中，突变体或变体也可以包含非保守性取代。

在一些实施方式中，突变体或变体多肽可以具有约1、2、3、4、5、6、7、8、 9、10、15、20、30、40、50、60、70、80、90、100个或更多个或前述数值中的任意两者构成的范围的氨基酸的置换、添加、插入或缺失。与未改变的多肽相比，突变体或变体可以具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、 90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％或前述数值中的任意两者构成的范围的活性。

多核苷酸或多肽与另一个多核苷酸或多肽具有一定的“序列同一性”或“相同性”百分比，意味着当比对两条序列时，该百分比的碱基或氨基酸相同并且在相同的相对位置。确定两个氨基酸序列或两个核苷酸序列的百分比相同性可以包括比对和比较两个序列中相应位置处的氨基酸残基或核苷酸。如果两个序列中的所有位置被相同的氨基酸残基或核苷酸占据，那么所述序列被认为是100％相同的。序列相同性可以以多种不同方式确定，例如，可以使用各种方法和计算机程序(例如， BLAST、T-COFFEE、MUSCLE、MAFFT等)对序列进行比对。

本发明一般包括受试者的免疫治疗，包括施用RNA，即疫苗RNA，其编码氨基酸即疫苗抗原，包含SARS-CoV-2S蛋白或其免疫原性片段或变体。因此，疫苗抗原包含SARS-CoV-2S蛋白的表位，用于在受试者中诱导针对冠状病毒S蛋白，特别是SARS-CoV-2S蛋白的免疫应答。施用编码疫苗抗原的RNA以提供抗原(在通过适当的靶细胞表达多核苷酸之后)，用于诱导，即刺激、引发和/或扩大免疫应答，例如，抗体和/或免疫效应细胞，其靶向靶抗原(冠状病毒S蛋白，特别是SARS-CoV -2S蛋白)或其加工产物。根据本公开诱导的免疫应答是B细胞介导的免疫应答，即抗体介导的免疫应答，特别是抗SARS-CoV-2免疫应答。

本文描述的疫苗包含作为有效成分的单链RNA，其可以在进入接受者细胞后翻译为相应的蛋白。除了编码抗原序列的野生型、突变型或密码子优化的序列，RNA 还可以包含一个或多个结构元件，这些结构元件针对RNA在稳定性和翻译效率方面的最大效力进行优化(5'帽、5'UTR、3'UTR、polyA尾)。CleanCap形成的 m7G(5’)ppp(5’)(2’-OMeA)pG可以用作RNA药物物质5'-端的特定加帽结构。作为5'-UTR序列，可以使用人β-珠蛋白mRNA的5'-UTR序列，任选地具有优化的“Kozak序列”以提高翻译效率。3'-UTR可以是人β-珠蛋白mRNA的两个重复的 3'-UTR。此外，可以使用长度为50-120个核苷酸的polyA尾序列。

此外，可以将分泌信号肽(sec)以sec翻译为N末端标签的方式融合至抗原编码区。在一个实施方案中，sec对应于S蛋白的分泌信号肽。

本文描述的疫苗RNA可以与蛋白和/或脂质复合，以产生用于施用的RNA-颗粒。如果使用不同RNA的组合，可以将RNA一起或分别与蛋白和/或脂质复合以产生用于施用的RNA-颗粒。

在一方面，本发明涉及一种组合物或药物制品(medical preparation)，其包含编码氨基酸序列的RNA，所述氨基酸序列包含SARS-CoV-2S蛋白或其免疫原性片段或变体。

在一个实施方案中，包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列能够形成多聚体复合物，特别是三聚体复合物。为此，包含SARS-CoV-2S 蛋白或其免疫原性片段或变体的氨基酸序列可以包含允许形成多聚体复合物的结构域，特别是包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的三聚体复合物。在一个实施方案中，允许形成多聚体复合物的结构域包含三聚结构域，例如，本文描述的三聚结构域。

在一个实施方案中，包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列由编码序列编码，与野生型编码序列相比，所述编码序列是密码子优化的和 /或G/C含量增加，其中所述密码子优化和/或G/C含量增加不改变编码的氨基酸序列的序列。

在一个实施方案中，(ⅰ)编码SARS-CoV-2S蛋白或其免疫原性片段或变体的 RNA包含SEQ ID No.4、SEQ ID No.5或SEQ ID No.6的核苷酸49-3810的核苷酸序列(T替换为U)，与SEQ ID No.4、SEQ ID No.5或SEQ ID No.6的核苷酸49-3810 的核苷酸序列(T替换为U)具有至少99％、98％、97％、96％、95％、90％、85％或80％相同性的核苷酸序列。(ⅱ)SARS-CoV-2S蛋白或其免疫原性片段或变体包含SEQ ID No.1、SEQ ID No.2或SEQ ID No.3的氨基酸17-1270的氨基酸序列，与SEQ ID No.1、 SEQ ID No.2或SEQ ID No.3的氨基酸17-1270的氨基酸序列具有至少99％、98％、 97％、96％、95％、90％、85％或80％相同性的氨基酸序列。

在一个实施方案中，所述RNA还包含用于编码分泌信号肽的RNA序列。

在一个实施方案中，所述分泌信号肽融合，通过N-末端融合至SARS-CoV-2S 蛋白或其免疫原性片段或变体。

在一个实施方案中，(ⅰ)编码所述分泌信号肽的RNA包含SEQ ID No.4、SEQ IDNo.5或SEQ ID No.6的核苷酸1-48的核苷酸序列(T替换为U)，与SEQ ID No.4、 SEQ IDNo.5或SEQ ID No.6的核苷酸1-48的核苷酸序列(T替换为U)具有至少 99％、98％、97％、96％、95％、90％、85％或80％相同性的核苷酸序列。(ⅱ)所述分泌信号肽包含SEQ IDNo.1、SEQ ID No.2或SEQ ID No.3的氨基酸1-16的氨基酸序列，与SEQ ID No.1、SEQ IDNo.2或SEQ ID No.3的氨基酸1-16的氨基酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％相同性的氨基酸序列。

在一个实施方案中，所述RNA是修饰的RNA，特别是稳定的mRNA。在一个实施方案中，所述RNA包含修饰的核苷，以代替尿苷。在一个实施方案中，所述修饰的核苷是N1-甲基-假尿苷(m1ψ)。

在一个实施方案中，编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含5’UTR，其包含SEQ ID No.7的核苷酸序列，或与SEQ ID No.7 的核苷酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％相同性的核苷酸序列。

在一个实施方案中，编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含3’UTR，其包含SEQ ID No.8的核苷酸序列，或与SEQ ID No.8 的核苷酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％相同性的核苷酸序列。

在一个实施方案中，编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含polyA尾序列。在一个实施方案中，所述polyA尾序列包含至少100个核苷酸。在一个实施方案中，所述polyA尾序列包含SEQ ID No.9的核苷酸序列，或由SEQ IDNo.9的核苷酸序列组成。

在一个实施方案中，所述RNA或组合物配制为或待配制为液体、固体或其组合。在一个实施方案中，所述RNA或组合物配制为或待配制为用于注射。在一个实施方案中，所述RNA或组合物配制为或待配制为用于肌肉内注射。

在一个实施方案中，所述RNA配制为或待配制为颗粒。在一个实施方案中，所述颗粒为脂质纳米颗粒(LNP)。

在一个实施方案中，所述LNP颗粒包含十七烷-9-基8-((2-羟乙基)(6-氧代 -6-((癸氧基)己基)氨基)辛酸酯)(heptadecan-9-yl 8-((2-hydroxyethyl)(6-oxo-6-(undecyloxy)hexyl)amino)octanoate)、二肉豆蔻酰甘油-聚乙二醇2000(1,2-Dimyristoyl-sn-glycero-3-methoxypolyethylene glycol)、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(1,2-Distearoyl-sn-glycero-3 -phosphocholine)和胆固醇。

在一个实施方案中，所述RNA配制为或待配制为胶体。在一个实施方案中，所述RNA配制为或待配制为颗粒，形成胶体的分散相。在一个实施方案中，所述分散相中存在50％或更多、75％或更多或者85％或更多的RNA。在一个实施方案中，所述 RNA配制或待配制为包含RNA和脂质的颗粒。在一个实施方案中，所述颗粒通过使溶于水相中的RNA暴露于溶于有机相中的脂质形成。在一个实施方案中，所述有机相包含乙醇。在一个实施方案中，所述颗粒通过使溶于水相中的RNA暴露于分散于水相中的脂质形成。在一个实施方案中，所述分散于水相中的脂质形成脂质体。

在一个实施方案中，所述RNA为mRNA、环状RNA(cRNA)和自复制RNA(saRNA)。

在一个实施方案中，所述组合物或药物制品为药物组合物。在一个实施方案中，所述组合物或药物制品为疫苗。在一个实施方案中，所述药物组合物进一步包含一种或多种药学上可接受的载体、稀释剂和/或赋形剂。

在一方面，本发明涉及本文描述的组合物或药物制品，其用于制药用途。在一个实施方案中，所述制药用途包括在受试者中诱导针对冠状病毒的免疫应答。在一个实施方案中，所述制药用途包括冠状病毒感染的治疗或预防性治疗。

在一个实施方案中，所述冠状病毒为β冠状病毒。在一个实施方案中，所述冠状病毒为沙贝病毒(sarbecovirus)。在一个实施方案中，所述冠状病毒为SARS-CoV -2。

在一方面，本发明涉及一种在受试者中诱导针对冠状病毒的免疫应答的方法，所述方法包括向受试者施用包含编码氨基酸序列的RNA的组合物，所述氨基酸序列包含SARS-CoV-2S蛋白或其免疫原性片段或变体。

在一个实施方案中，所述方法为针对冠状病毒进行疫苗接种的方法。在一个实施方案中，所述方法为用于冠状病毒感染的治疗或预防性治疗的方法。

在一个实施方案中，所述受试者为小鼠。在一个实施方案中，所述冠状病毒为β冠状病毒。在一个实施方案中，所述冠状病毒为沙贝病毒(sarbecovirus)。在一个实施方案中，所述冠状病毒为SARS-CoV-2。

在一方面，本发明涉及本文描述的组合物或药物制品，其用于本文描述的方法。

其中，本公开证实包含脂质纳米颗粒包裹的mRNA的组合物可以在根据方案(包括施用至少一个剂量的疫苗组合物)向小鼠施用之后7天内实现血清中针对表位的可检测的抗体滴度，所述mRNA编码SARS-CoV-2多肽(例如，SARS-CoV-2的S蛋白)的至少一部分(例如，是或包含表位)。

本公开记录了其中mRNA内的核苷酸经修饰的组合物(例如，包含脂质纳米颗粒包裹的mRNA的组合物，所述mRNA编码SARS-CoV-2多肽(例如，SARS-CoV-2的 S蛋白)的至少一部分(例如，是或包含表位))和/或涉及这类组合物的方法，其特征在于：不存在内在佐剂作用，或者与具有未修饰的其他可比组合物(或方法) 相比减少的内在佐剂作用。可选地或额外地，在一些实施方案中，这类组合物(或方法)诱导抗体应答和/或CD4⁺T细胞应答。在涉及修饰的核苷酸的一些实施方案中，这类修饰的核苷酸可以存在于例如3’UTR序列、抗原编码序列和/或5’UTR 序列中。在一些实施方案中，修饰的核苷酸是或包括一个或多个修饰的尿嘧啶残基。

其中，本公开记录了提供的组合物(例如，包含脂质纳米颗粒包裹的mRNA的组合物，所述mRNA编码SARS-CoV-2的多肽(例如，SARS-CoV-2的S蛋白)的至少一部分(例如，是或包含表位))和/或方法，其特征在于：编码的多肽(例如， SARS-CoV-2的蛋白(如S蛋白))。在一些实施方案中，所述多肽持续表达。例如，在一些实施方案中，这类组合物和/或方法的特征在于，当给予人源细胞时，它们实现可检测的多肽表达，并且在一些实施方案中，这种表达持续至少24小时或更长的时间段。

阅读本公开的本领域技术人员会进一步理解它描述了各种mRNA构建体，其包含全长SARS-CoV-2刺突蛋白的核酸序列(例如，包括其中这样的编码的SARS-CoV -2刺突蛋白可以包含至少一个或多个氨基酸取代的实施方案，例如，如本文描述的脯氨酸取代，和/或其中mRNA序列针对受试者(例如，哺乳动物，例如，人)进行密码子优化的实施方案)。更进一步，阅读本公开的这样的普通技术人员会理解它描述了包含编码全长SARS-CoV-2刺突蛋白的核酸序列的某些mRNA构建体的特定特征和/或优点。不希望受任何特定理论的束缚。在一些实施方案中，阅读本公开的普通技术人员会理解提供的编码全长SARS-CoV-2S蛋白的mRNA构建体，可以对于用作或用于免疫原性组合物(例如，疫苗)实现如本文描述的免疫效果(例如，产生SARS-CoV-2中和抗体，和/或T细胞应答(例如，CD4⁺和/或CD8⁺T细胞应答)) 特别有用和/或有效。

在一些实施方案中，本公开提供包含编码全长SARS-CoV-2S蛋白(例如，具有一个或多个氨基酸取代的全长SARS-CoV-2S蛋白)的RNA(例如，mRNA)，所述RNA适合多肽的细胞内表达。在一些实施方案中，这样的RNA可以配制于脂质纳米颗粒(例如，本文描述的脂质纳米颗粒)中。

在一些实施方案中，本文提供的免疫原性组合物可以包含SARS-CoV-2多肽或其变体的多个(例如，至少2个或更多个，包括，例如，至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个，至少10个等)免疫原性表位。在一些这样的实施方案中，这样的多个免疫原性表位可以由单一RNA(例如， mRNA)编码。不希望受任何特定理论的束缚，在一些实施方案中，当考虑SARS-CoV -2变体的遗传多样性时，提供的多表位免疫原性组合物(包括，例如，编码全长 SARS-CoV-2刺突蛋白的组合物)可以特别用于提供针对多种病毒变体的保护和/或可以提供更大的机会来开发多样化和/或稳健的中和抗体和/或T细胞应答，特别是特别稳健的TH1型T细胞(例如，CD4⁺和/或CD8⁺T细胞)应答。

在一些实施方案中，本公开记录了提供的组合物和/或方法的特征在于它们用单一施用实现一种或多种特定治疗结果(例如，如本文描述的有效免疫应答和/或编码的SARS-CoV-2S蛋白的可检测表达)。

在一些实施方案中，免疫应答可以包括产生针对SARS-CoV-2刺突蛋白的S1 亚基的结合抗体滴度。在一些实施方案中，免疫应答可以包括产生针对SARS-CoV- 2病毒的中和抗体滴度。

在一些实施方案中，中和抗体滴度是(例如，已建立为)相对于适当对照(例如，未疫苗接种的对照小鼠)所观察到的足以减少或阻断病毒与疫苗接种的小鼠血清结合的滴度。

实施例

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例1、新型冠状病毒mRNA疫苗的制备

一、S蛋白基因合成和载体构建

1、S蛋白基因合成及优化

本实施例中新型冠状病毒mRNA疫苗的目标抗原为Omicron变异病毒株的S蛋白全长(如SEQ ID No.1所示)，并在此基础上进行不同位点的组合突变，分别获得Omicron S-2P(K983P、V984P)和Omicron S-6P(F814P、A889P、A896P、A939P、 K983P、V984P)。根据氨基酸序列，反推编码的核苷酸，由基因合成公司经过人源密码子优化及相关酶切位点排除后进行合成。

SEQ ID No.1为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白原始序列。其中，第1-16位为分泌信号肽，第17-1270位为Omicron变异病毒株的S蛋白原始序列。

SEQ ID No.2为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白变体Omicron S-2P(K983P、V984P)序列。其中，第1-16位为分泌信号肽，第17-1270 位为Omicron变异病毒株的S蛋白变体Omicron S-2P序列，与SEQ ID No.1相比，具有K983P和V984P这两个突变位点。以K983P为例，表示将SEQ ID No.1的第983 位的氨基酸残基由K突变为P。其余突变位点表示法同理。

SEQ ID No.3为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白变体Omicron S-6P(F814P、A889P、A896P、A939P、K983P、V984P)序列。其中，第1-16 位为分泌信号肽，第17-1270位为Omicron变异病毒株的S蛋白变体Omicron S-6P 序列，与SEQ ID No.1相比，具有F814P、A889P、A896P、A939P、K983P和V984P这六个突变位点。

SEQ ID No.4为经过人源密码子优化的SEQ ID No.1对应的编码核苷酸序列。SEQID No.5为经过人源密码子优化的SEQ ID No.2对应的编码核苷酸序列。SEQ ID No.6 为经过人源密码子优化的SEQ ID No.3对应的编码核苷酸序列。

2、重组载体构建

将合成的序列[自5’端到3’端依次为：5’端带有XbaI的T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白或其变体的编码核苷酸序列(两端分别带有酶切位点BamHI和AscI的SEQ ID No.4、SEQ ID No.5和SEQ ID No.6)、3’UTR(SEQ ID No.8)及polyA尾(5’端带有EcoRI，3’端带有SapI及NotI的SEQ ID No.9)] 进行XbaI和NotI双酶切，与经过XbaI和NotI酶切的pUC57-GW-Kan(金维智,载体全序列如SEQ ID No.14所示)载体骨架片段进行连接反应，构建重组质粒。利用卡那抗生素进行单克隆平板初筛后，小提质粒并通过BamHI和AscI限制性内切酶酶切法和DNA测序进行阳性克隆验证。

重组质粒pUC57-S的结构描述为：在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括：T7启动子(SEQ ID No.13)、 5’UTR(SEQ ID No.7)、S蛋白编码核酸(SEQ ID No.4)、3’UTR(SEQ ID No.8) 及polyA尾(SEQ IDNo.9)]的重组质粒。

重组质粒pUC57-S-2P的结构描述为：在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括：T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白变体2P编码核酸(SEQ ID No.5)、3’UTR (SEQ ID No.8)及polyA尾(SEQ ID No.9)]的重组质粒。

重组质粒pUC57-S-6P的结构描述为：在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括：T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白变体6P编码核酸(SEQ ID No.6)、3’UTR (SEQ ID No.8)及polyA尾(SEQ ID No.9)]的重组质粒。

二、mRNA的制备

1、质粒线性化

步骤一构建的重组质粒pUC57-S、pUC57-S-2P和pUC57-S-6P，包含T7启动子、 5’UTR(SEQ ID No.7)、目的基因(即SEQ ID No.4、SEQ ID No.5和SEQ ID No.6)、 3’UTR(SEQID No.8)以及polyA尾序列(SEQ ID No.9)，在polyA尾序列最后一个A后面有一个SapⅠ酶切位点。用限制性内切酶SapⅠ线性化含有目的基因的质粒，反应体系如表1所示，37℃酶切3h。

表1、质粒线性化酶切体系

10×Cutsmart缓冲液	5μL
		SapI酶(10000U/mL)	1μL
质粒	10μg
		ddH<sub>2</sub>O	补齐至50μL

取2μL酶切产物进行1％琼脂糖凝胶电泳，检测质粒的线性化情况。利用PCR 产物回收试剂盒(康维世纪)纯化线性化质粒。

2、体外转录

以步骤1获得的线性化重组质粒为模板进行体外转录，利用高产量T7 RNA转录试剂盒进行体外转录。高产量T7 RNA转录试剂盒，产品名称为High Yield T7 RNA SynthesisKit，上海兆维科技发展有限公司，产品目录号为ON-040；5×Reaction Buffer、100mM ATPSolution、100mM CTP Solution、100mM GTP Solution、Enzyme mix、DNase I、AmmoniumAcetate Stop Solution、Lithium Chloride(LiCl) Precipitation Solution均为高产量T7 RNA转录试剂盒中的组件。100mMΨUTP Solution，全称为N1-Me-pUTP，100mM，上海兆维科技发展有限公司，产品目录号为 R5-027。按如下体系(表2)加入各组分(以20μL反应体系为例)，混匀后37℃反应3h。

表2、体外转录体系

5×Reaction Buffer	4μL
		ATP(100mM)	2μL
ΨTP(100mM)	2μL
		CTP(100mM)	2μL
GTP(100mM)	2μL
		Enzyme mix	1μL
线性化DNA模板	500ng-1μg
		CleanCap AG(100mM)	1μL
无核酸酶H<sub>2</sub>O	补齐至20μL

其中，CleanCap AG为m7G(5’)ppp(5’)(2’-OMeA)pG，货号为ON-134，上海兆维。

转录反应结束后，加入1μL DNase I，37℃反应15min，加入15μL AmmoniumAcetate Stop Solution，混匀。

3、RNA纯化

向步骤2的体外转录反应体系中加入1/3体积的7.5M Lithium Chloride(LiCl)Precipitation Solution(使其终浓度为2.5M)，-20℃放置30min。12000g离心 15min，RNA沉淀在底部，弃掉上清。加入1mL 70％乙醇清洗RNA，12000g离心5min，弃掉上清。晾干后加入50μL无RNA酶的水溶解沉淀，并使用紫外分光光度计进行 mRNA定量，得到加帽的体外转录mRNA。其中，对应于Omicron S蛋白的体外转录mRNA 的具体序列如SEQ ID No.10所示；对应于Omicron S-2P突变蛋白的体外转录mRNA 的具体序列如SEQ ID No.11所示；对应于Omicron S-6P突变蛋白的体外转录mRNA 的具体序列如SEQ ID No.12所示。

三、脂质纳米颗粒(LNP)包载

将步骤二得到的三种mRNA原液分别分散于20mM醋酸溶液(pH 5.0)，得到mRNA 浓度为200μg/mL的RNA溶液。设置注射泵流速(mRNA溶液的流速为9ml/min，脂质混合物的流速为3ml/min)，同时启动注射泵，使mRNA溶液与脂质混合物(配方见表 3)按3:1的体积比进行混合。然后用278mM蔗糖水溶液进行10倍稀释，经过超滤管 (Millipore，UFC910096)离心浓缩后进行三次溶液置换(置换液：含2mM醋酸和 250mM蔗糖，余量为水)。

将上述得到的溶液，加入1/24体积的Tris水溶液(500mM,pH 7.0)，得到LNP 包载的mRNA溶液。LNP即脂质纳米颗粒。

用Ribogreen RNA定量试剂盒(Invitrogen，R11490)测定LNP包载的mRNA浓度。游离RNA直接取样测定，总RNA用终浓度为1％Triton X-100裂解后测定，计算三种LNP包载的mRNA浓度分别为350μg/mL，500μg/mL和640μg/mL,包封率均在90％以上。用马尔文ZetaSizer粒径仪测量LNP包载的mRNA的粒径，三种LNP包载的mRNA均为60nm左右。实验同时设置没有包载任何物质的LNP作为对照。

表3、脂质混合物配方

物料名称	母液浓度	用量
			SM-102	25mg/mL	274.64μL
DSPC	25mg/mL	61.12μL
			胆固醇	25mg/mL	115.14μL
DMG-PEG2000	25mg/mL	29.11μL
			无水乙醇		520μL

四、S目标抗原的表达鉴定

将293T细胞接种到六孔板中，24h后在细胞培养基中加入2μg步骤三获得的 LNP包载的mRNA(按LNP包载的mRNA中mRNA的质量计算)，进行细胞内表达。24h 后收集细胞，每孔细胞沉淀加入100μL 1×蛋白上样缓冲液于100℃金属浴中裂解变性30min。蛋白样品储存于-20℃或者-80℃。通过免疫印迹检测S蛋白的表达：取8μL蛋白裂解液进行10％SDS-PAGE电泳，分离蛋白样品。使用PVDF膜75V恒压湿法转膜1.2h后，5％脱脂牛奶室温封闭1h。先后与一抗(抗SARS-CoV-2S蛋白兔抗(义翘神州，货号40591-T62，1:1000)和二抗(山羊抗兔，1:5000)进行孵育，最后ECL显色。结果如图1所示，Omicron S、Omicron S-2P和Omicron S-6P三个mRNA疫苗在细胞水平均能检测到S蛋白的表达，大小约为110-150KD，与预期一致。

实施例2、不同新型冠状病毒mRNA疫苗在小鼠模型上的免疫学评价

一、疫苗体液免疫反应检测

20只SPF级雌性BALB/c小鼠(6-8周龄)，随机分成4组，每组5只。根据表4 所示分组情况对小鼠进行mRNA疫苗的免疫，免疫途径为肌肉注射。

表4、疫苗体液免疫反应检测小鼠分组情况

候选疫苗	剂量	免疫方式	小鼠数量
				Omicron S	5μg	肌肉注射	5
Omicron S-2P	5μg	肌肉注射	5
				Omicron S-6P	5μg	肌肉注射	5
LNP	5μg	肌肉注射	5

注：候选疫苗Omicron S、Omicron S-2P和Omicron S-6P分别为实施例1制备得到的LNP包载的Omicron S mRNA、Omicron S-2P mRNA和Omicron S-6P mRNA。LNP 为没有包载任何物质的空载LNP。“剂量”一栏均是以LNP包载的mRNA中mRNA的质量计算。

初次免疫时每只小鼠后大腿内侧注射50μL体积的5μg mRNA(以LNP包载的mRNA 中mRNA的质量计算)，初次免疫后第14天加强免疫一次，剂量同初次免疫。眼眶取血时间分别为初次免疫后第7天，第14天，第21天和第28天。血样先置37℃灭活 1小时，4℃静置2小时，然后3000rpm离心10分钟分离血清，使用ELISA试剂盒 (义翘神州，货号KIT022)检测血清中的针对新型冠状病毒Omicron株S1蛋白的IgG 抗体滴度(图2)。

小鼠肌肉注射LNP包载的mRNA后第7天即可产生血清IgG抗体，其中Omicron S 组的抗体几何平均滴度(GMT)为31251，Omicron S-2P组的抗体几何平均滴度为3356，OmicronS-6P组的抗体几何平均滴度为40272。从免疫后第7天至免疫后第28天，血清抗体水平逐渐升高。对免疫后第28天3组RNA疫苗注射诱导的血清IgG总抗体滴度进行比较分析，如图3结果显示各组之间均无显著性差异(ns,P≥0.05)。

二、疫苗细胞免疫反应检测

免疫后28天处死小鼠，取脾置于70μm细胞尼龙滤网上，在2ml RPMI-1640完全培养基中充分研磨制成细胞悬液，计数后用培养基进行稀释，按每孔10⁵或5×10⁴个细胞接种到ELISpot板中，加入S蛋白重叠肽库(义翘神州，PP003)刺激培养20 小时，阳性对照孔加入佛波酯(PMA)和Ionomycin(离子霉素)阳性刺激剂，阴性对照孔不加刺激剂。使用不同抗体预包被的ELISpot板分别检测免疫小鼠的脾细胞经特异性肽刺激后表达IFN-γ和IL-2的水平。

各组mRNA疫苗免疫小鼠后诱导的细胞免疫水平如图4和图5所示，其中LNP组为注射未包载mRNA脂质颗粒的对照组。结果显示Omicron S、Omicron S-2P和Omicron S-6P均可诱导其免疫小鼠产生明显的细胞免疫反应，三组疫苗之间没有显著性差异。

三、疫苗中和抗体检测

1、假型病毒的方法和结果

在稳定过表达SARS-CoV-2主要受体ACE2的Hela-ACE2细胞系(记载于“Liu X, WeiL,Xu F,Zhao F,Huang Y,Fan Z,Mei S,Hu Y,Zhai L,Guo J,Zheng A,Cen S,Liang C,GuoF.SARS-CoV-2spike protein-induced cell fusion activates the cGAS-STINGpathway and the interferon response.Sci Signal.2022Apr 12；15(729):eabg8744.doi:10.1126/scisignal.abg8744.Epub 2022Apr 12.PMID: 35412852.”一文，公众可从申请人处获得，仅可用于重复本发明实验使用，不得他用)中检测免疫小鼠血清(步骤一得到的初次免疫后第28天的小鼠血清)针对 SARS-CoV-2Omicron毒株假病毒的中和活性。假型病毒是以慢病毒为核心，萤火虫荧光素酶报告基因的BA.2株(诺唯赞，货号DD1796-02的产品“SARS-Cov2-Fluc BA.2”)。将待检测的血清用DMEM培养基进行2倍系列稀释，共稀释8个梯度，从1:128 起稀释至1:16384。在P2实验室中用DMEM培养基将假病毒稀释至1×10⁴TCID50/mL。取各梯度的血清与稀释好的病毒液混合，37℃，5％CO₂温箱中孵育1小时。将孵育好的病毒血清混合物按每孔100μl加入到预先接种的Hela-ACE2细胞板中，置于37℃， 5％CO₂温箱中培养。48小时后，测定萤火虫荧光素酶活性，计算假病毒感染性，以抑制50％荧光素酶活性的血清最高稀释度的倒数为终点效价。结果如图6所示，Omicron S组，Omicron S-2P组，Omicron S-6P组28天免疫血清对假型病毒中和抗体几何平均效价分别为895，4300，5760。

2、对新冠病毒活毒的中和能力

在Vero-E6细胞上检测免疫小鼠血清(步骤一得到的初次免疫后第28天的小鼠血清)针对SARS-CoV-2的4个毒株(流行株，即新冠原始毒株GD108)、南非株、印度株和奥米克戎株)的中和抗体效价。将待检测的血清56℃灭活30分钟。用DMEM 培养基进行2倍系列稀释，从1:8开始稀释。在P3实验室中根据病毒的原始滴度，用DMEM培养基将病毒稀释至工作浓度。取稀释好的病毒液等倍体积与各稀释梯度的血清混合，37℃，5％CO₂温箱中孵育1小时。将孵育好的病毒血清混合物按每孔100μl 加入到悬浮Vero-E6细胞板中，置于37℃，5％CO₂温箱中培养，每天观察CPE，5天后判定最终结果。以抑制50％细胞病变的血清最高稀释度的倒数为终点效价。该实验是在中国医学科学院医学生物学研究所的P3实验室进行的。

各疫苗免疫血清针对流行株(GD108)、南非株、印度株和奥米克戎株的中和效价如表5所示。

表5、疫苗的广谱中和活性(NT50)

	流行株	南非株	印度株	奥米克戎株
					LNP	32	<8	24	<8
Omicron S	128	96	64	512
					Omicron S-2P	64	16	32	768
Omicron S-6P	256	96	32	512

综上所述，Omicron S、Omicron S-2P和Omicron S-6P三个mRNA疫苗均具有良好的免疫原性，可诱导小鼠产生高水平的血清IgG抗体和特异性细胞免疫反应，并且产生的中和抗体对多种毒株具有交叉保护作用。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

<110> 仁景（苏州）生物科技有限公司

<120> 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

<130> GNCLN221808

<160> 14

<170> PatentIn version 3.5

<210> 1

<211> 1270

<212> PRT

<213> Artificial sequence

<400> 1

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro

65 70 75 80

Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser

85 90 95

Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr

100 105 110

Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val

115 120 125

Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn

130 135 140

Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn

145 150 155 160

Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly

165 170 175

Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile

180 185 190

Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg

195 200 205

Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val

210 215 220

Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala

225 230 235 240

Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr

245 250 255

Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe

260 265 270

Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys

275 280 285

Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr

290 295 300

Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr

305 310 315 320

Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp

325 330 335

Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg

340 345 350

Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu

355 360 365

Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu

370 375 380

Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg

385 390 395 400

Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala

405 410 415

Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala

420 425 430

Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr

435 440 445

Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp

450 455 460

Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val

465 470 475 480

Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro

485 490 495

Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe

500 505 510

Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr

515 520 525

Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys

530 535 540

Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln

545 550 555 560

Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro

565 570 575

Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val

580 585 590

Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu

595 600 605

Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp

610 615 620

Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe

625 630 635 640

Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser

645 650 655

Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln

660 665 670

Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser

675 680 685

Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr

690 695 700

Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr

705 710 715 720

Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr

725 730 735

Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln

740 745 750

Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala

755 760 765

Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln

770 775 780

Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser

785 790 795 800

Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu

805 810 815

Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys

820 825 830

Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys

835 840 845

Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp

850 855 860

Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr

865 870 875 880

Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala

885 890 895

Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val

900 905 910

Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile

915 920 925

Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys

930 935 940

Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val

945 950 955 960

Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp

965 970 975

Ile Phe Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg

980 985 990

Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln

995 1000 1005

Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala

1010 1015 1020

Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp

1025 1030 1035

Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala

1040 1045 1050

Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln

1055 1060 1065

Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys

1070 1075 1080

Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His

1085 1090 1095

Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr

1100 1105 1110

Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly

1115 1120 1125

Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp

1130 1135 1140

Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser

1145 1150 1155

Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val

1160 1165 1170

Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys

1175 1180 1185

Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr

1190 1195 1200

Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile

1205 1210 1215

Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys

1220 1225 1230

Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly

1235 1240 1245

Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys

1250 1255 1260

Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 2

<211> 1270

<212> PRT

<213> Artificial sequence

<400> 2

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro

65 70 75 80

Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser

85 90 95

Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr

100 105 110

Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val

115 120 125

Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn

130 135 140

Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn

145 150 155 160

Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly

165 170 175

Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile

180 185 190

Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg

195 200 205

Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val

210 215 220

Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala

225 230 235 240

Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr

245 250 255

Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe

260 265 270

Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys

275 280 285

Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr

290 295 300

Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr

305 310 315 320

Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp

325 330 335

Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg

340 345 350

Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu

355 360 365

Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu

370 375 380

Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg

385 390 395 400

Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala

405 410 415

Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala

420 425 430

Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr

435 440 445

Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp

450 455 460

Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val

465 470 475 480

Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro

485 490 495

Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe

500 505 510

Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr

515 520 525

Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys

530 535 540

Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln

545 550 555 560

Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro

565 570 575

Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val

580 585 590

Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu

595 600 605

Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp

610 615 620

Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe

625 630 635 640

Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser

645 650 655

Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln

660 665 670

Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser

675 680 685

Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr

690 695 700

Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr

705 710 715 720

Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr

725 730 735

Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln

740 745 750

Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala

755 760 765

Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln

770 775 780

Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser

785 790 795 800

Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu

805 810 815

Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys

820 825 830

Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys

835 840 845

Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp

850 855 860

Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr

865 870 875 880

Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala

885 890 895

Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val

900 905 910

Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile

915 920 925

Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys

930 935 940

Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val

945 950 955 960

Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp

965 970 975

Ile Phe Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg

980 985 990

Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln

995 1000 1005

Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala

1010 1015 1020

Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp

1025 1030 1035

Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala

1040 1045 1050

Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln

1055 1060 1065

Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys

1070 1075 1080

Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His

1085 1090 1095

Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr

1100 1105 1110

Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly

1115 1120 1125

Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp

1130 1135 1140

Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser

1145 1150 1155

Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val

1160 1165 1170

Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys

1175 1180 1185

Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr

1190 1195 1200

Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile

1205 1210 1215

Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys

1220 1225 1230

Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly

1235 1240 1245

Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys

1250 1255 1260

Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 3

<211> 1270

<212> PRT

<213> Artificial sequence

<400> 3

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro

65 70 75 80

Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser

85 90 95

Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr

100 105 110

Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val

115 120 125

Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn

130 135 140

Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn

145 150 155 160

Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly

165 170 175

Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile

180 185 190

Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg

195 200 205

Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val

210 215 220

Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala

225 230 235 240

Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr

245 250 255

Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe

260 265 270

Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys

275 280 285

Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr

290 295 300

Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr

305 310 315 320

Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp

325 330 335

Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg

340 345 350

Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu

355 360 365

Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu

370 375 380

Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg

385 390 395 400

Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala

405 410 415

Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala

420 425 430

Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr

435 440 445

Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp

450 455 460

Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val

465 470 475 480

Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro

485 490 495

Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe

500 505 510

Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr

515 520 525

Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys

530 535 540

Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln

545 550 555 560

Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro

565 570 575

Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val

580 585 590

Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu

595 600 605

Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp

610 615 620

Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe

625 630 635 640

Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser

645 650 655

Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln

660 665 670

Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser

675 680 685

Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr

690 695 700

Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr

705 710 715 720

Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr

725 730 735

Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln

740 745 750

Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala

755 760 765

Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln

770 775 780

Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser

785 790 795 800

Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu

805 810 815

Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys

820 825 830

Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys

835 840 845

Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp

850 855 860

Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr

865 870 875 880

Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro

885 890 895

Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val

900 905 910

Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile

915 920 925

Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys

930 935 940

Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val

945 950 955 960

Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp

965 970 975

Ile Phe Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg

980 985 990

Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln

995 1000 1005

Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala

1010 1015 1020

Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp

1025 1030 1035

Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala

1040 1045 1050

Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln

1055 1060 1065

Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys

1070 1075 1080

Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His

1085 1090 1095

Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr

1100 1105 1110

Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly

1115 1120 1125

Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp

1130 1135 1140

Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser

1145 1150 1155

Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val

1160 1165 1170

Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys

1175 1180 1185

Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr

1190 1195 1200

Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile

1205 1210 1215

Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys

1220 1225 1230

Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly

1235 1240 1245

Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys

1250 1255 1260

Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 4

<211> 3816

<212> DNA

<213> Artificial sequence

<400> 4

atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60

agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120

aaggtgttca gaagcagcgt cctccacagc acccaagacc tgttcctgcc tttcttcagc 180

aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240

gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300

ggctggatct tcggcaccac cctcgattcc aagacccaaa gcctgctgat cgtcaacaac 360

gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420

cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480

tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540

ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600

aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660

gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac cctgctggcc 720

ctgcacagat cctacctgac acctggggac agcagcagcg gctggaccgc tggcgccgct 780

gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840

acaatcaccg atgccgtcga ctgcgccctg gaccccctga gcgagaccaa gtgcaccctc 900

aagagcttca cagtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960

gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020

gccacaagat tcgctagcgt gtacgcttgg aacagaaaga gaatcagcaa ctgcgtggcc 1080

gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgcta cggggtcagc 1140

cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200

ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260

aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaacaa gctggattcc 1320

aaggtgtccg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380

ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440

gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500

ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccaca 1560

gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620

aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct cccctttcag 1680

cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740

atcctggaca tcacaccttg cagcttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800

acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860

atccacgccg atcagctgac ccccacctgg cgggtgtaca gcaccggcag caacgtgttt 1920

cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980

atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040

gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100

agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160

accgagatcc tgcctgtgag catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220

ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280

aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340

caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400

caaatcctgc ccgatcctag caagcctagc aagagaagct tcatcgagga cctgctgttc 2460

aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctgggcgat 2520

attgccgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580

ctgctgaccg acgagatgat cgctcagtac acaagcgccc tgctcgctgg caccatcacc 2640

tccggctgga cctttggggc tggcgccgct ctgcagatcc ccttcgccat gcagatggcc 2700

tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760

gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag caccgctagc 2820

gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880

aagcagctga gcagcaagtt cggcgccatc agcagcgtgc tcaacgacat cttcagcaga 2940

ctggacaagg tggaggccga ggtgcaaatc gacagactga ttaccggcag actgcagagc 3000

ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060

ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120

ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180

cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc tatctgccac 3240

gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300

gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360

ggcaactgcg acgtggtgat cggcattgtg aacaacaccg tgtacgaccc cctgcagccc 3420

gagctggaca gcttcaagga ggagctggac aagtacttta agaaccacac aagccccgac 3480

gtggacctgg gggacattag cgggatcaac gctagcgtgg tgaacattca gaaggagatt 3540

gacagactga acgaggtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600

ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660

ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgctcctgt 3720

ctcaagggct gctgcagctg cgggagctgc tgcaagttcg acgaggacga cagcgagccc 3780

gtgctgaagg gcgtgaagct gcactacacc tgatga 3816

<210> 5

<211> 3816

<212> DNA

<213> Artificial sequence

<400> 5

atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60

agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120

aaggtgttca gaagcagcgt cctccacagc acccaagacc tgttcctgcc tttcttcagc 180

aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240

gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300

ggctggatct tcggcaccac cctcgattcc aagacccaaa gcctgctgat cgtcaacaac 360

gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420

cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480

tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540

ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600

aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660

gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac cctgctggcc 720

ctgcacagat cctacctgac acctggggac agcagcagcg gctggaccgc tggcgccgct 780

gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840

acaatcaccg atgccgtcga ctgcgccctg gaccccctga gcgagaccaa gtgcaccctc 900

aagagcttca cagtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960

gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020

gccacaagat tcgctagcgt gtacgcttgg aacagaaaga gaatcagcaa ctgcgtggcc 1080

gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgcta cggggtcagc 1140

cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200

ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260

aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaacaa gctggattcc 1320

aaggtgtccg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380

ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440

gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500

ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccaca 1560

gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620

aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct cccctttcag 1680

cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740

atcctggaca tcacaccttg cagcttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800

acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860

atccacgccg atcagctgac ccccacctgg cgggtgtaca gcaccggcag caacgtgttt 1920

cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980

atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040

gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100

agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160

accgagatcc tgcctgtgag catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220

ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280

aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340

caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400

caaatcctgc ccgatcctag caagcctagc aagagaagct tcatcgagga cctgctgttc 2460

aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctgggcgat 2520

attgccgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580

ctgctgaccg acgagatgat cgctcagtac acaagcgccc tgctcgctgg caccatcacc 2640

tccggctgga cctttggggc tggcgccgct ctgcagatcc ccttcgccat gcagatggcc 2700

tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760

gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag caccgctagc 2820

gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880

aagcagctga gcagcaagtt cggcgccatc agcagcgtgc tcaacgacat cttcagcaga 2940

ctggaccccc ccgaggccga ggtgcaaatc gacagactga ttaccggcag actgcagagc 3000

ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060

ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120

ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180

cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc tatctgccac 3240

gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300

gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360

ggcaactgcg acgtggtgat cggcattgtg aacaacaccg tgtacgaccc cctgcagccc 3420

gagctggaca gcttcaagga ggagctggac aagtacttta agaaccacac aagccccgac 3480

gtggacctgg gggacattag cgggatcaac gctagcgtgg tgaacattca gaaggagatt 3540

gacagactga acgaggtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600

ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660

ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgctcctgt 3720

ctcaagggct gctgcagctg cgggagctgc tgcaagttcg acgaggacga cagcgagccc 3780

gtgctgaagg gcgtgaagct gcactacacc tgatga 3816

<210> 6

<211> 3816

<212> DNA

<213> Artificial sequence

<400> 6

atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60

agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120

aaggtgttca gaagctccgt cctccacagc acccaagacc tgttcctccc cttcttcagc 180

aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240

gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300

ggctggatct tcggcaccac cctggacagc aagacacaga gcctgctgat cgtcaacaac 360

gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420

cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480

tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540

ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600

aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660

gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac actcctcgcc 720

ctgcaccgga gctacctcac ccctggggat agcagcagcg gctggaccgc cggcgctgcc 780

gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840

accatcacag acgccgtcga ctgtgccctg gaccccctga gcgagaccaa gtgcaccctg 900

aagtccttca ccgtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960

gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020

gccacaagat tcgctagcgt gtacgcttgg aaccggaaga gaatcagcaa ctgcgtggcc 1080

gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgtta cggggtgagc 1140

cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200

ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260

aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaataa gctcgacagc 1320

aaggtgagcg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380

ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440

gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500

ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccacc 1560

gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620

aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct gccttttcag 1680

cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740

atcctggaca tcaccccctg ttccttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800

acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860

atccacgccg atcagctgac ccccacctgg agagtgtata gcaccggcag caacgtgttt 1920

cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980

atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040

gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100

agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160

accgaaatcc tgcccgtgtc catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220

ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280

aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340

caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400

caaatcctgc ccgaccctag caagcctagc aagagaagcc ccatcgagga cctgctgttc 2460

aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctcggcgac 2520

atcgctgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580

ctgctgaccg acgagatgat tgctcagtac acaagcgccc tgctggccgg gacaatcaca 2640

agcgggtgga cctttggcgc tggccccgcc ctgcagatcc ccttccccat gcagatggcc 2700

tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760

gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag cacccctagc 2820

gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880

aagcagctga gcagcaagtt cggcgccatc agcagcgtcc tgaatgacat cttcagcaga 2940

ctggaccccc ccgaggccga ggtgcaaatc gacagactga tcaccggcag actgcagagc 3000

ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060

ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120

ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180

cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc catctgccac 3240

gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300

gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360

ggcaattgcg acgtggtgat cggcatcgtg aacaacaccg tgtacgaccc cctgcagccc 3420

gagctggaca gcttcaagga ggagctggac aagtacttca agaaccacac aagccccgac 3480

gtggacctcg gggatatcag cggcatcaac gctagcgtgg tgaacattca gaaggagatc 3540

gatagactga atgaagtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600

ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660

ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgcagctgc 3720

ctgaagggct gctgctcctg cggcagctgc tgcaagttcg acgaggacga cagcgagccc 3780

gtgctgaagg gcgtgaagct gcactacacc tgatga 3816

<210> 7

<211> 50

<212> DNA

<213> Artificial sequence

<400> 7

acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc 50

<210> 8

<211> 214

<212> DNA

<213> Artificial sequence

<400> 8

gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60

taaactgggg gatattatga agggccttga gcatctggat tctgcctgct cgctttcttg 120

ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 180

attatgaagg gccttgagca tctggattct gcct 214

<210> 9

<211> 120

<212> DNA

<213> Artificial sequence

<400> 9

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120

<210> 10

<211> 4229

<212> RNA

<213> Artificial sequence

<400> 10

aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60

ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120

ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180

ccgacaaggu guucagaagc agcguccucc acagcaccca agaccuguuc cugccuuucu 240

ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300

accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360

ucagaggcug gaucuucggc accacccucg auuccaagac ccaaagccug cugaucguca 420

acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480

uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540

acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600

gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660

acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720

cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacccugc 780

uggcccugca cagauccuac cugacaccug gggacagcag cagcggcugg accgcuggcg 840

ccgcugccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900

acggcacaau caccgaugcc gucgacugcg cccuggaccc ccugagcgag accaagugca 960

cccucaagag cuucacagug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020

ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080

ucaacgccac aagauucgcu agcguguacg cuuggaacag aaagagaauc agcaacugcg 1140

uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag ugcuacgggg 1200

ucagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260

ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320

acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aacaagcugg 1380

auuccaaggu guccggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440

agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500

gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560

gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620

ccacagugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680

acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccuccccu 1740

uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800

uggagauccu ggacaucaca ccuugcagcu ucggcggcgu gagcgugauc acccccggca 1860

ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920

uggccaucca cgccgaucag cugaccccca ccuggcgggu guacagcacc ggcagcaacg 1980

uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040

gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100

ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160

agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220

ugaccaccga gauccugccu gugagcauga ccaagacaag cguggacugc accauguaca 2280

ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340

agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400

ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460

ucagccaaau ccugcccgau ccuagcaagc cuagcaagag aagcuucauc gaggaccugc 2520

uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccugg 2580

gcgauauugc cgcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640

ccccccugcu gaccgacgag augaucgcuc aguacacaag cgcccugcuc gcuggcacca 2700

ucaccuccgg cuggaccuuu ggggcuggcg ccgcucugca gauccccuuc gccaugcaga 2760

uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820

ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccg 2880

cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940

uggugaagca gcugagcagc aaguucggcg ccaucagcag cgugcucaac gacaucuuca 3000

gcagacugga caagguggag gccgaggugc aaaucgacag acugauuacc ggcagacugc 3060

agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120

ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180

ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240

uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugcuaucu 3300

gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360

gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420

ugagcggcaa cugcgacgug gugaucggca uugugaacaa caccguguac gacccccugc 3480

agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuuuaagaac cacacaagcc 3540

ccgacgugga ccugggggac auuagcggga ucaacgcuag cguggugaac auucagaagg 3600

agauugacag acugaacgag guggccaaga accugaacga gagccugauc gaccugcaag 3660

agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720

ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugcu 3780

ccugucucaa gggcugcugc agcugcggga gcugcugcaa guucgacgag gacgacagcg 3840

agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900

ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960

auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020

cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080

ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200

aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229

<210> 11

<211> 4229

<212> RNA

<213> Artificial sequence

<400> 11

aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60

ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120

ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180

ccgacaaggu guucagaagc agcguccucc acagcaccca agaccuguuc cugccuuucu 240

ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300

accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360

ucagaggcug gaucuucggc accacccucg auuccaagac ccaaagccug cugaucguca 420

acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480

uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540

acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600

gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660

acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720

cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacccugc 780

uggcccugca cagauccuac cugacaccug gggacagcag cagcggcugg accgcuggcg 840

ccgcugccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900

acggcacaau caccgaugcc gucgacugcg cccuggaccc ccugagcgag accaagugca 960

cccucaagag cuucacagug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020

ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080

ucaacgccac aagauucgcu agcguguacg cuuggaacag aaagagaauc agcaacugcg 1140

uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag ugcuacgggg 1200

ucagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260

ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320

acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aacaagcugg 1380

auuccaaggu guccggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440

agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500

gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560

gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620

ccacagugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680

acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccuccccu 1740

uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800

uggagauccu ggacaucaca ccuugcagcu ucggcggcgu gagcgugauc acccccggca 1860

ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920

uggccaucca cgccgaucag cugaccccca ccuggcgggu guacagcacc ggcagcaacg 1980

uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040

gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100

ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160

agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220

ugaccaccga gauccugccu gugagcauga ccaagacaag cguggacugc accauguaca 2280

ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340

agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400

ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460

ucagccaaau ccugcccgau ccuagcaagc cuagcaagag aagcuucauc gaggaccugc 2520

uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccugg 2580

gcgauauugc cgcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640

ccccccugcu gaccgacgag augaucgcuc aguacacaag cgcccugcuc gcuggcacca 2700

ucaccuccgg cuggaccuuu ggggcuggcg ccgcucugca gauccccuuc gccaugcaga 2760

uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820

ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccg 2880

cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940

uggugaagca gcugagcagc aaguucggcg ccaucagcag cgugcucaac gacaucuuca 3000

gcagacugga cccccccgag gccgaggugc aaaucgacag acugauuacc ggcagacugc 3060

agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120

ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180

ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240

uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugcuaucu 3300

gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360

gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420

ugagcggcaa cugcgacgug gugaucggca uugugaacaa caccguguac gacccccugc 3480

agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuuuaagaac cacacaagcc 3540

ccgacgugga ccugggggac auuagcggga ucaacgcuag cguggugaac auucagaagg 3600

agauugacag acugaacgag guggccaaga accugaacga gagccugauc gaccugcaag 3660

agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720

ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugcu 3780

ccugucucaa gggcugcugc agcugcggga gcugcugcaa guucgacgag gacgacagcg 3840

agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900

ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960

auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020

cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080

ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200

aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229

<210> 12

<211> 4229

<212> RNA

<213> Artificial sequence

<400> 12

aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60

ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120

ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180

ccgacaaggu guucagaagc uccguccucc acagcaccca agaccuguuc cuccccuucu 240

ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300

accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360

ucagaggcug gaucuucggc accacccugg acagcaagac acagagccug cugaucguca 420

acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480

uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540

acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600

gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660

acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720

cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacacucc 780

ucgcccugca ccggagcuac cucaccccug gggauagcag cagcggcugg accgccggcg 840

cugccgccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900

acggcaccau cacagacgcc gucgacugug cccuggaccc ccugagcgag accaagugca 960

cccugaaguc cuucaccgug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020

ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080

ucaacgccac aagauucgcu agcguguacg cuuggaaccg gaagagaauc agcaacugcg 1140

uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag uguuacgggg 1200

ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260

ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320

acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aauaagcucg 1380

acagcaaggu gagcggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440

agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500

gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560

gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620

ccaccgugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680

acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccugccuu 1740

uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800

uggagauccu ggacaucacc cccuguuccu ucggcggcgu gagcgugauc acccccggca 1860

ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920

uggccaucca cgccgaucag cugaccccca ccuggagagu guauagcacc ggcagcaacg 1980

uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040

gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100

ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160

agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220

ugaccaccga aauccugccc guguccauga ccaagacaag cguggacugc accauguaca 2280

ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340

agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400

ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460

ucagccaaau ccugcccgac ccuagcaagc cuagcaagag aagccccauc gaggaccugc 2520

uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccucg 2580

gcgacaucgc ugcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640

ccccccugcu gaccgacgag augauugcuc aguacacaag cgcccugcug gccgggacaa 2700

ucacaagcgg guggaccuuu ggcgcuggcc ccgcccugca gauccccuuc cccaugcaga 2760

uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820

ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccc 2880

cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940

uggugaagca gcugagcagc aaguucggcg ccaucagcag cguccugaau gacaucuuca 3000

gcagacugga cccccccgag gccgaggugc aaaucgacag acugaucacc ggcagacugc 3060

agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120

ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180

ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240

uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugccaucu 3300

gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360

gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420

ugagcggcaa uugcgacgug gugaucggca ucgugaacaa caccguguac gacccccugc 3480

agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaac cacacaagcc 3540

ccgacgugga ccucggggau aucagcggca ucaacgcuag cguggugaac auucagaagg 3600

agaucgauag acugaaugaa guggccaaga accugaacga gagccugauc gaccugcaag 3660

agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720

ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugca 3780

gcugccugaa gggcugcugc uccugcggca gcugcugcaa guucgacgag gacgacagcg 3840

agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900

ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960

auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020

cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080

ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200

aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229

<210> 13

<211> 20

<212> DNA

<213> Artificial sequence

<400> 13

taatacgact cactataagg 20

<210> 14

<211> 2640

<212> DNA

<213> Artificial sequence

<400> 14

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagactgtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggattctag 420

agcggccgca tcccaatggc gcgccgagct tggctcgagc atggtcatag ctgtttcctg 480

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 540

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 600

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 660

gaggcggttt gcgtattggg cgctgttccg cttcctcgct cactgactcg ctgcgctcgg 720

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 780

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 840

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 900

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 960

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1020

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 1080

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 1140

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 1200

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 1260

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 1320

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 1380

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 1440

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 1500

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 1560

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 1620

acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 1680

caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 1740

tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 1800

aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1860

cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1920

gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1980

attgcgcctg agcgaaacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 2040

tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 2100

gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 2160

catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 2220

agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 2280

gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 2340

cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 2400

gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 2460

attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 2520

aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 2580

aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg cccttttgtc 2640

Claims

1.RNA分子，其特征在于：所述RNA分子包括编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列；其中，所述抗原性多肽或所述免疫原性片段选自SARS-CoV-2的S蛋白或其变体、SARS-CoV-2的受体结合结构域或其变体；

所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比，存在如下突变位点：K983P和V984P；

进一步地，所述SARS-CoV-2是SARS-CoV-2 Omicron变异病毒株。

2.根据权利要求1所述的RNA分子，其特征在于：所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比，还存在如下突变位点中的全部或部分：F814P、A889P、A896P、A939P。

3.根据权利要求1或2所述的RNA分子，其特征在于：所述抗原性多肽或者所述免疫原性片段为如下任一：

(A1)SARS-CoV-2 Omicron变异病毒株的S蛋白；

(A2)SARS-CoV-2 Omicron变异病毒株的S蛋白变体Omicron S-2P,其氨基酸序列与所述SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列相比，仅存在K983P和V984P两个突变位点；

(A3)SARS-CoV-2 Omicron变异病毒株的S蛋白变体Omicron S-6P，其氨基酸序列与所述SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列相比，仅存在F814P、A889P、A896P、A939P、K983P和V984P六个突变位点；

4.根据权利要求1-3中任一所述的RNA分子，其特征在于：所述编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列为如下任一：

5.根据权利要求1-4中任一所述的RNA分子，其特征在于：所述RNA分子还包含用于编码分泌信号肽的核酸序列；

进一步地，编码所述分泌信号肽的核酸序列位于编码所述抗原性多肽或者所述免疫原性片段的核酸序列的5’端；和/或

进一步地，所述分泌信号肽为如下任一：

(C1)SARS-CoV-2的S蛋白的分泌信号肽；

6.根据权利要求5所述的RNA分子，其特征在于：编码所述分泌信号肽的核酸序列为如下任一：

(D1)将SEQ ID No.4的第1-48位或SEQ ID No.5的第1-48位或SEQ ID No.6的第1-48位核苷酸中的T替换为U后所得核苷酸序列；

7.根据权利要求1-6中任一所述的RNA分子，其特征在于：所述RNA分子为mRNA、环状RNA或自复制RNA。

8.根据权利要求1-7中任一所述的RNA分子，其特征在于：所述RNA分子为经过修饰的RNA分子；

进一步地，所述修饰是通过用修饰的尿苷残基取代一些或全部原始尿苷残基；

更进一步地，所述修饰的尿苷为N1-甲基-假尿苷；

和/或

所述RNA分子还包括一个或多个能够促进稳定性和/或翻译效率的结构元件；

进一步地，所述结构元件包括：5’帽、5’UTR、3’UTR和/或polyA尾；

更进一步地，所述5’帽是或包含cap1结构；更加具体地，所述5’帽是m7G(5’)ppp(5’)(2’-OMeA)pG；和/或

更进一步地，所述5'-UTR是人β-珠蛋白mRNA的5'-UTR序列；和/或，所述5'-UTR具有Kozak序列；更加具体地，所述5’UTR包含或为SEQ ID No.7所示核苷酸序列，或与SEQ IDNo.7所示核苷酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性的核苷酸序列；和/或

更进一步地，所述3'-UTR是人β-珠蛋白mRNA的两个重复的3'-UTR；更加具体地，所述3’UTR包含或为SEQ ID No.8所示核苷酸序列，或与SEQ ID No.8所示核苷酸序列具有至少99％、98％、97％、96％、95％、90％、85％或80％同源性的核苷酸序列；和/或

更进一步地，所述polyA尾包含至少50、至少60或至少100个腺嘌呤核糖核苷酸；更加具体地，所述polyA尾包含或为SEQ ID No.9所示核苷酸序列，或由SEQ ID No.9所示核苷酸序列组成。

9.根据权利要求1-8中任一所述的RNA分子，其特征在于：所述RNA分子的序列为如下任一：

(E1)SEQ ID No.10或SEQ ID No.11SEQ ID No.12；

10.如下任一生物材料：

(F1)能够转录得到权利要求1-9中任一所述RNA分子的DNA分子；

(F2)含有(F2)中所述DNA分子的表达盒或重组载体或重组菌或重组细胞系。

11.用于预防和/或治疗新冠病毒感染的组合物，其包含权利要求1-9中任一所述的RNA分子。

12.根据权利要求11所述的组合物，其特征在于：所述组合物为将所述RNA分子与蛋白和/或脂质复合而成的RNA-颗粒；

进一步地，所述组合物为将所述RNA分子负载于脂质纳米颗粒中后得到；所述脂质纳米颗粒为如下任一：

(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇-脂质；

(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇。

13.权利要求1-9中任一所述RNA分子或权利要求10所述生物材料或权利要求11或12所述组合物在制备用于预防和/或治疗新冠病毒感染的药物中的用途。

14.一种用于预防和/或治疗新冠病毒感染的药物，其有效成分包括权利要求1-7中任一所述的RNA分子。

15.根据权利要求13所述的用途或权利要求14所述的药物，其特征在于：所述冠状病毒为β冠状病毒；和/或

所述冠状病毒为沙贝病毒；和/或

所述冠状病毒为SARS-CoV-2；

进一步地，所述冠状病毒为SARS-CoV-2Omicron变异病毒株。

16.一种制备用于预防和/或治疗新冠病毒感染的RNA疫苗的方法，包括将权利要求1-9中任一所述RNA分子负载于脂质纳米颗粒中的步骤；

所述脂质纳米颗粒为如下任一：