CN116113431A - 冠状病毒疫苗 - Google Patents

冠状病毒疫苗 Download PDF

Info

Publication number
CN116113431A
CN116113431A CN202180039232.6A CN202180039232A CN116113431A CN 116113431 A CN116113431 A CN 116113431A CN 202180039232 A CN202180039232 A CN 202180039232A CN 116113431 A CN116113431 A CN 116113431A
Authority
CN
China
Prior art keywords
amino acid
seq
polypeptide
acid sequence
acid residue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180039232.6A
Other languages
English (en)
Inventor
乔纳森·卢克·希尼
斯内哈·维什瓦纳特
乔治·卡内尔
大卫·韦尔斯
马泰奥·弗拉里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dioxinvax Ltd
University of Cambridge
Original Assignee
Dioxinvax Ltd
University of Cambridge
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB2004826.0A external-priority patent/GB202004826D0/en
Priority claimed from GBGB2010672.0A external-priority patent/GB202010672D0/en
Priority claimed from GBGB2015775.6A external-priority patent/GB202015775D0/en
Priority claimed from GBGB2101824.7A external-priority patent/GB202101824D0/en
Priority claimed from GBGB2103214.9A external-priority patent/GB202103214D0/en
Application filed by Dioxinvax Ltd, University of Cambridge filed Critical Dioxinvax Ltd
Publication of CN116113431A publication Critical patent/CN116113431A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Abstract

本发明描述了设计的冠状病毒多肽序列,以及它们作为针对冠状病毒家族的病毒的疫苗的用途。所述设计的序列包括设计的冠状病毒刺突(S)蛋白及其片段,包括设计的S蛋白受体结合结构域(RBD)序列SEQ IDNO:17、设计的截短S蛋白序列SEQ ID NO:15和设计的全长S蛋白序列SEQ ID NO:13。还描述了设计的冠状病毒包膜(E)、膜(M)和核衣壳(N)蛋白序列,以及它们作为疫苗的用途。还描述了编码所述多肽的核酸分子、载体、融合蛋白、药物组合物、细胞,以及它们作为针对所述冠状病毒家族的病毒的疫苗的用途。

Description

冠状病毒疫苗
本发明涉及核酸分子、多肽、载体、细胞、融合蛋白、药物组合物,以及它们作为针对冠状病毒家族的病毒的疫苗的用途。
冠状病毒(CoV)导致各种动物和人类疾病。由CoV导致的值得注意的人类疾病是人畜共患感染,诸如严重急性呼吸综合征(SARS)和中东呼吸综合征(MERS)。该家族内的病毒通常在免疫正常人类中导致轻微的自限性呼吸道感染,但也可能导致严重的致命疾病,其特征在于出现发烧、极度疲劳、呼吸困难、缺氧和肺炎。CoV经由感染受试者的呼吸道飞沫通过密切接触来传播,每种菌株具有不同程度的传染性。
CoV属于冠状病毒科(Coronaviridae)家族病毒,所有这些病毒都有包膜。CoV包含单链正义RNA基因组,长度在25至31千碱基之间(Siddell S.G.1995,The Coronaviridae),这是迄今为止在RNA病毒中发现的最大基因组。冠状病毒科家族基于系统发育聚类按亚型分为四个属:α、β、γ和δ冠状病毒,每个属根据病毒的菌株再次细分为簇。例如,在β-CoV属(第2组CoV)内,通常识别出四个谱系(a、b、c和d):
·谱系A(Embecovirus亚属)包括HCoV-OC43和HCoV-HKU1(不同种类)
·谱系B(Sarbecovirus亚属)包括SARSr-CoV(其包括所有其菌株,诸如SARS-CoV、SARS-CoV-2和蝙蝠SL-CoV-WIV1)
·谱系C(Merbecovirus亚属)包括扁颅蝠冠状病毒HKU4(BtCoV-HKU4)、伏翼蝠冠状病毒HKU5(BtCoV-HKU5)和MERS-CoV(不同种类)
·谱系D(Nobecovirus亚属)包括果蝠冠状病毒HKU9(BtCoV-HKU9)
CoV病毒体呈球形,具有从病毒体表面发出的特征性棒状刺突突起。病毒体包含四种主要结构蛋白:刺突(S)蛋白、膜(M)蛋白、包膜(E)蛋白和核衣壳(N)蛋白,所有这些蛋白均由病毒基因组编码。β-CoV的一些子集还包括第五结构蛋白:血凝素酯酶(HE),它经由其乙酰酯酶活性增强S蛋白介导的细胞进入和病毒通过粘膜的扩散。S糖蛋白的同源三聚体构成病毒表面上独特的刺突结构。这些三聚体是I类融合蛋白,通过S蛋白与其受体的相互作用介导病毒与宿主受体的附着。在大多数CoV中,S被宿主细胞蛋白酶裂解成两条独立的多肽–S1和S2。S1包含S蛋白的受体结合结构域(RBD)(RBD的确切定位根据病毒菌株而变化),而S2形成刺突分子的茎。
图1示出了SARS S蛋白架构。N末端序列负责在细胞内传递细胞外信号。研究表明,S蛋白的N末端区域比高度保守的C末端区域更具变异性(Dong等人,Genomic and proteinstructure modelling analysis depicts the origin and infectivity of 2019-nCoV,a new coronavirus which caused a pneumonia outbreak in Wuhan,China.2020)。该图示出了S结构域,其包括分别负责受体结合和细胞膜融合的S1结构域和S2结构域。
与DNA病毒相比,RNA病毒通常具有非常高的突变率,因为病毒RNA聚合酶缺少DNA聚合酶的校正能力。这是病毒能够从其自然宿主储池传播到其他物种并且从人类传播到人类的一个原因,也是很难制造出有效的疫苗来预防由RNA病毒导致的疾病的一个原因。在大多数情况下,当前针对RNA病毒的疫苗候选物受到用作疫苗插入片段的病毒菌株的限制,该病毒菌株是基于野生型菌株的可用性而不是知情设计来选择的。开发用于包膜RNA病毒的疫苗的技术挑战包括:i)野生型野外分离株糖蛋白(GP)的病毒变异提供作为疫苗抗原的有限保护广度;ii)选择由疫苗插入片段表达的疫苗抗原是高度经验性的;免疫原选择是缓慢的试误法过程;iii)在进化中或未预料到的病毒流行病中,开发新的疫苗候选物是耗时的并且可能延误疫苗部署。
在2002年前,人们认为CoV仅导致轻微的呼吸道问题,并且在人群中流行,每年引起15%至30%的人体呼吸道感染。自20世纪60年代首次发现以来,CoV家族已大规模扩张,并且已在人类和动物两者中导致多次爆发。2002年至2003年在中国广东省出现的SARS大流行是迄今为止已知由任何冠状病毒导致的最严重的疾病。在此期间,出现了大约8098个病例,死亡774人(总体死亡率约为9.6%)。90岁以上个体的死亡率约为50%。该病毒被鉴定为SARS-CoV,为第2b组β-CoV,起源于蝙蝠。来自蝙蝠的两种新型病毒分离株与迄今为止鉴定的任何其他病毒相比表现出与人类SARS-CoV更多的相似性,并作为人类衍生的SARS-CoV与相同的细胞受体–血管紧张素转化酶2(ACE2)结合。
虽然SARS-CoV流行病在2003年得到控制,但是在2012年在中东出现了新型人CoV,为第2c组β-CoV。MERS是中东的一系列高致病性人体呼吸道感染的致病物,初始死亡率为50%。自其出现以来,已经报道了由MERS导致的估计2,494个病例和858例死亡,世界卫生组织(WHO)给出的总估计致死率为34.4%。连同SARS-CoV,这种新型CoV起源于蝙蝠,可能具有中间宿主,诸如促进爆发扩散的单峰骆驼。该病毒利用二肽基肽酶(DPP4)作为其受体,二肽基肽酶是另一种肽酶受体。目前尚不清楚为什么CoV利用宿主肽酶作为其结合受体,因为即使在缺少酶活性的情况下也会发生进入。
在2020年伊始,出现了另一种新型CoV;严重急性呼吸综合征冠状病毒2(SARS-CoV-2)。在2020年1月30日前,WHO宣告了这一全球健康紧急情况,因为病毒在其出现的一个月内扩散至超过25个国家。在撰写本文时,SARS-CoV-2感染的数量在世界各地的许多国家中呈指数不断增加,接近800,000个感染病例,并且导致超过40,000例总确认死亡。
由冠状病毒导致的出血热的人类病例或爆发以偶发且无规律的方式出现。无法容易地预测爆发的出现。除了几个例外,不存在针对CoV感染的治愈或既定的药物治疗。仅批准了针对一些CoV的疫苗,但是并不总是使用这些疫苗,因为它们要么不是非常有效,要么在某些情况下已被报道经由循环菌株的重组来促进新型致病性CoV的选择。在2020年4月前,已经针对SARS-CoV开发了若干潜在疫苗,但是没有已经批准使用的。随后一年,若干新型疫苗已获得监管批准,并且正在进行大规模疫苗接种程序。第一次大规模疫苗接种程序开始于2020年12月初,并且截至2021年2月15日,WHO估计已施用了1.753亿剂疫苗。全球正在使用至少7种不同的疫苗。WHO在2020年12月31日发布将Pfizer-BioNTech COVID-19疫苗(BNT162b2)列入紧急使用清单(EUL)。在2021年2月15日,WHO发布将AstraZeneca/OxfordCOVID-19疫苗(AZD1222)的两个版本列入EUL。截至2021年2月18日,英国(UK)已为1.2千万人施用第一剂的Pfizer-BioNTech或AstraZeneca/Oxford疫苗中的任一者。Pfizer和AstraZeneca疫苗都使用编码S蛋白的mRNA平台。Pfizer使用纳米颗粒载体进行核酸递送,而AstraZeneca使用腺病毒载体。
在开发针对CoV的有效疫苗时,需要克服诸多难关。首先,免疫(无论是天然的还是人工的)不一定防止后续感染(Fehr等人,Methods Mol Biol.2015,1282:1-23)。其次,病毒再结合的倾向可能通过增加病毒的遗传多样性使疫苗无用而造成问题。另外,已经证明,利用病毒S蛋白进行疫苗接种在FIPV(猫传染性腹膜炎病毒,一种猫科CoV高毒力菌株)的情况下导致增强型疾病。这种疾病的增强致病性是由非中和抗体导致的,所述非中和抗体在称为抗体依赖增强作用(ADE)的过程中促进病毒进入宿主细胞。在一种病毒菌株的原发性感染之后,针对同一病毒菌株产生中和抗体。然而,如果不同菌株在继发性感染中感染宿主,则在第一感染期间产生的非中和抗体(其不中和病毒)替代地与病毒结合并且然后与免疫细胞上的IgG Fc受体结合并且介导病毒进入这些细胞(Wan等人,Journal ofVirology.2020,94(5):1-13)。
当开发针对能够进行ADE(或能够触发ADE样促炎反应)的病毒的疫苗时,鉴定负责引发非中和抗体的表位并且将这些表位通过修饰来掩蔽或从疫苗中移除是至关重要的。S蛋白上的这些非中和表位也可能导致免疫转换,其中非中和表位胜过中和表位以与抗体结合。中和表位被免疫系统忽略,免疫系统未能中和抗原。在重组RBD疫苗的情况下,先前掩埋的含有非中和免疫显性表位的表面可能重新变得暴露,这些非中和免疫显性表位胜过负责由免疫系统进行中和的表位。
因此,需要提供有效的疫苗,其诱导广泛中和免疫应答以防止由CoV导致的新兴疾病和再发疾病,尤其是β-CoV,诸如SARS-CoV和最近的SARS-CoV-2。特别地,需要提供缺少可能由ADE(或ADE样促炎反应)导致病毒免疫逃避和疾病恶化的非中和表位的疫苗。
设计的冠状病毒刺突(S)蛋白序列(全长、截短和受体结合结构域(RBD))
图2示出了S蛋白(裂解位点1周围区域)的多序列对比,比较了SARS-CoV分离株(SARS-CoV-1)和密切相关的蝙蝠β冠状病毒(RaTG13)分离株与四个SARS-CoV-2分离株。SARS-CoV S蛋白(1269个氨基酸残基)与SARS-CoV-2S蛋白(1273个氨基酸残基)共享高序列同一性(约73%)。迄今为止在所有SARS-CoV-2菌株中观察到裂解位点一(在图中示出为加框区域)的扩增。与SARS-CoV-1相比,在亚基1中观察到大部分插入/取代,在亚基S2中观察到的取代最少。C末端包含引发非中和抗体并且负责抗体依赖增强作用的表位。
申请人已生成S蛋白的新型氨基酸序列,称为CoV_T2_1(以下也称为Wuhan-Node-1),其具有改善的免疫原性(其允许蛋白质及其衍生物引发广泛中和免疫应答)。
在下面实施例中提供了全长S蛋白的氨基酸序列(SEQ ID NO:13)(CoV_T2_1;Wuhan-Node-1)、截短S蛋白(tr、缺失S2序列的C末端部分)的氨基酸序列(SEQ ID NO:15)(CoV_T2_4;Wuhan_Node1_tr),和受体结合结构域(RBD)的氨基酸序列(SEQ ID NO:17)(CoV_T2_7;Wuhan_Node1_RBD)(及其相应的编码核酸序列,SEQ ID NO:14、16、18)。
根据本发明,提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
SEQ ID NO:17是申请人设计的新型S蛋白RBD的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:15,或其整个长度与氨基酸序列SEQ ID NO:15具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:13,或其整个长度与氨基酸序列SEQ ID NO:13具有至少83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
下面实施例6和7分别提供了新型S蛋白RBD氨基酸序列(Wuhan_Node1_RBD(CoV_T2_7)(SEQ ID NO:17))与SARS-TOR2分离株AY274119的RBD氨基酸序列(AY274119_RBD(CoV_T2_5)(SEQ ID NO:5))和SARS_CoV_2分离株hCov-19/武汉/LVDC-HB-01/2019(EPI_ISL_402119)的RBD氨基酸序列(EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11))的氨基酸序列对比。
如下面实施例9中所解释的,图4示出了Wuhan_Node1_RBD(CoV_T2_7)氨基酸序列(SEQ ID NO:17),其中氨基酸残基差异以粗体和下划线从与AY274119_RBD(CoV_T2_5)(SEQID NO:5)和EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11)的相应对比(分别为实施例6和7)中突出显示。下表中列出了来自两个对比的氨基酸残基差异(残基位置的编号对应于Wuhan_Node1_RBD(CoV_T2_7)(SEQ ID NO:17)氨基酸序列的位置)。来自两个对比的常见差异位于以下氨基酸残基处:3、6、7、21、22、38、42、48、67、70、76、81、83、86、87、92、121、122、123、125、126、128、134、137、138、141、150、152、153、154、155、167、171、178、180、181、183、185、187、188、189、191、194、195、219(在图4中以灰色突出显示示出并且在下表中示出)。
表1
氨基酸插入位于位置167-172(与AY274119_RBD相比)和163-167(与EPI_ISL_402119_RBD相比)(在图4中以加框示出)。
任选地,本发明的分离的多肽在对应于如下表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表2
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十五个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十五个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十五个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少四十个。
任选地,本发明的分离的多肽在对应于如表2中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
任选地,本发明的分离的多肽在对应于如下表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表3
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少四十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少四十五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五十五个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少六十个。
任选地,本发明的分离的多肽在对应于如表3中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
任选地,本发明的分离的多肽在对应于如下表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表4
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少二十五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少三十五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少四十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少四十五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五十五个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少六十个。
任选地,本发明的分离的多肽在对应于如表4中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表5中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
表5
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表6中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
表6
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表7中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
表7
任选地,包括冠状病毒S蛋白RBD结构域的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:5具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括冠状病毒S蛋白RBD结构域的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:11具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
此外,新型S蛋白RBD序列在本文中称为CoV_S_T2_13-CoV_S_T2_18(分别为SEQ IDNO:27-32)。CoV_S_T2_13是我们的设计算法的直接输出,并且CoV_S_T2_14-CoV_S_T2_18是CoV_S_T2_13的表位富集版本。在下面并且在实施例12中提供了这些设计序列的氨基酸序列:
>COV_S_T2_13(SEQ ID NO:27)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_14(SEQ ID NO:28)
RVAPTKEVVR FPNITNLCPF GEVFNATKFP SVYAWERKKI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNIDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_15(SEQ ID NO:29)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTFFSTFKCYGVSPTKLN DLCFSNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FMGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_16(SEQ ID NO:30)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNT NNLDSTTGGNYNYLYRLFRK SNLKPFERDI SSDIYQAGST PCSGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_17(SEQ ID NO:31)
RVAPTKEVVR FPNITNLCPF GEVFNATKFP SVYAWERKKI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNIDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGTGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_18(SEQ ID NO:32)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTFFSTFKCYGVSPTKLN DLCFSNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FMGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGTGYQPY RVVVLSFELLNAPATVCGPK LSTD
在下面实施例12中示出了这些序列与SARS2参考序列(EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11))的对比。
设计序列与SARS2参考序列的氨基酸差异示出在下表8.1中(其中与参考序列的差异以粗体突出显示,并且所有设计序列共同的差异加下划线):
表8.1
所有设计序列共同的氨基酸变化总结在下表8.2中:
表8.2
任选的另外变化总结在下表8.3中:
表8.3
表8.3中列出的另外变化见于SEQ ID No:27-29、31和32中。
其他任选的另外变化总结在下表8.4-8.6中:
表8.4
表8.5
表8.6
根据本发明,提供了一种分离的多肽,其包括根据SEQ ID NO:27-32中任一项的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:27(COV_S_T2_13),或其整个长度与氨基酸序列SEQ ID NO:27具有至少88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:28(COV_S_T2_14),或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:29(COV_S_T2_15),或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:30(COV_S_T2_16),或其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:31(COV_S_T2_17),或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:32(COV_S_T2_18),或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:27(COV_S_T2_13)或其整个长度与氨基酸序列SEQ ID NO:27具有至少88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如上表8.2中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:28(COV_S_T2_14)或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如上表8.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:29(COV_S_T2_15)或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽在对应于如上表8.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:30(COV_S_T2_16)或其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如上表8.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:31(COV_S_T2_17)或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如上表8.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:32(COV_S_T2_18)或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如上表8.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:27(COV_S_T2_13)或其整个长度与氨基酸序列SEQ ID NO:27具有至少88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:28(COV_S_T2_14)或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:29(COV_S_T2_15)或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:31(COV_S_T2_17)或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:32(COV_S_T2_18)或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。任选地,包括氨基酸序列SEQ ID NO:28(COV_S_T2_14)或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.4中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:29(COV_S_T2_15)或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽还在对应于如上表8.5中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:31(COV_S_T2_17)或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.4中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:31(COV_S_T2_17)或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.6中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:32(COV_S_T2_18)或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.5中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括氨基酸序列SEQ ID NO:32(COV_S_T2_18)或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽还在对应于如上表8.6中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
根据本发明,还提供了一种分离的多肽,其包括在对应于如上表8.2中所示的SEQID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域的本发明的分离的多肽在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括至少五个氨基酸残基。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域的本发明的分离的多肽在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括至少十个氨基酸残基。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域的本发明的分离的多肽在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括至少十五个氨基酸残基。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域的本发明的分离的多肽在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个、五个、十个、十五个或全部的冠状病毒S蛋白RBD结构域的本发明的分离的多肽还在对应于如上表8.3中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括在对应于如上表8.2中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个、五个、十个、十五个或全部和在对应于如上表8.3中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒S蛋白RBD结构域的本发明的分离的多肽还在对应于如上表8.4至8.6中的任一者中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括冠状病毒S蛋白RBD结构域的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:5具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括冠状病毒S蛋白RBD结构域的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:11具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
设计的S蛋白RBD序列COV_S_T2_14-18(SEQ ID NO:28-32)的不连续表位序列
下面的序列对比示出了进行对比的设计的S蛋白RBD序列COV_S_T2_13-18。着色框示出了以不同颜色示出的在序列COV_S_T2_14-18中存在的不连续表位的残基。以加框区域示出相对于COV_S_T2_13序列进行以提供引发更广泛或更强效的免疫应答的不连续表位的变化:
在COV_S_T2_14和COV_S_T2_17中存在的不连续表位的残基(以黑色标记)如下:
i)NITNLCPFGEVFNATK(SEQ ID NO:57)-残基13-28;
ii)KKISN(SEQ ID NO:58)-残基38-42;
iii)NI(SEQ ID NO:59)-残基122-123
在COV_S_T2_15和COV_S_T2_18中存在的不连续表位的残基(以紫色标记)如下:
i)YNSTFFSTFKCYGVSPTKLNDLCFS(SEQ ID NO:60)-残基51-75;
ii)DDFM(SEQ ID NO:61)-残基109-112
iii)FELLN(SEQ ID NO:62)-残基197-201
在COV_S_T2_16中存在的不连续表位的残基(以橙色标记)如下:
i)RGDEVRQ(SEQ ID NO:63)-残基85-91;
ii)TGKIADY(SEQ ID NO:64)-残基97-103;
iii)YRLFRKSN(SEQ ID NO:65)-残基135-142;
iv)YQAGST(SEQ ID NO:66)-残基155-160
v)FNCYFPLQSYGFQPTNGVGY(SEQ ID NO:67)-残基168-187
在COV_S_T2_13、COV_S_T2_15、COV_S_T2_16和COV_S_T2_18中存在的不连续表位的残基(垂直相邻于以黑色标记的表位)如下:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68)-残基13-28;
(ii)KRISN(SEQ ID NO:69)-残基38-42;
(iii)NL(SEQ ID NO:70)-残基122-123
在COV_S_T2_13、COV_S_T2_14、COV_S_T2_16和COV_S_T2_17中存在的不连续表位的残基(垂直相邻于以紫色标记的表位)如下:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71)-残基51-75;
(ii)DDFT(SEQ ID NO:72)-残基109-112
(iii)FELLN(SEQ ID NO:62)-残基197-201
在COV_S_T2_13、COV_S_T2_14和COV_S_T2_15中存在的不连续表位的残基(垂直相邻于以橙色标记的表位)如下:
(i)RGDEVRQ(SEQ ID NO:63)-残基85-91;
(ii)TGVIADY(SEQ ID NO:73)-残基97-103;
(iii)YRSLRKSK(SEQ ID NO:74)-残基135-142;
(iv)YSPGGK(SEQ ID NO:75)-残基155-160
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)-残基168-187
在COV_S_T2_17和COV_S_T2_18中存在的不连续表位的残基(垂直相邻于以橙色标记的表位)如下:
(i)RGDEVRQ(SEQ ID NO:63)-残基85-91;
(ii)TGVIADY(SEQ ID NO:73)-残基97-103;
(iii)YRSLRKSK(SEQ ID NO:74)-残基135-142;
(iv)YSPGGK(SEQ ID NO:75)-残基155-160
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)-残基168-187
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
i)NITNLCPFGEVFNATK(SEQ ID NO:57);
ii)KKISN(SEQ ID NO:58);
iii)NI(SEQ ID NO:59)。
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
i)YNSTFFSTFKCYGVSPTKLN DLCFS(SEQ ID NO:60);
ii)DDFM(SEQ ID NO:61);
iii)FELLN(SEQ ID NO:62)。
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
i)RGDEVRQ(SEQ ID NO:63);
ii)TGKIADY(SEQ ID NO:64);
iii)YRLFRKSN(SEQ ID NO:65);
iv)YQAGST(SEQ ID NO:66);
v)FNCYFPLQSYGFQPTNGVGY(SEQ ID NO:67)。
任选地,包括不连续氨基酸序列SEQ ID NO:63-67的本发明的多肽中的SEQ IDNO:63-67的氨基酸残基中的一个或多个残基可被改变(例如,通过取代或删除)以提供糖基化位点。
根据本发明,还提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
根据本发明,提供了一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
任选地,本发明的每条多肽的不连续氨基酸序列以所列举的顺序存在。
任选地,每个不连续氨基酸序列与相邻的不连续氨基酸序列分开至少3个氨基酸残基。
任选地,每个不连续氨基酸序列与相邻的不连续氨基酸序列分开至多100个氨基酸残基。
任选地,包括所列举的不连续氨基酸序列的本发明的多肽的长度为至多250、500、750、1,000、1,250或1,500个氨基酸残基。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
i)NITNLCPFGEVFNATK(SEQ ID NO:57);
ii)KKISN(SEQ ID NO:58);
iii)NI(SEQ ID NO:59)。
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
i)YNSTFFSTFKCYGVSPTKLNDLCFS(SEQ ID NO:60);
ii)DDFM(SEQ ID NO:61);
iii)FELLN(SEQ ID NO:62)。
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
i)RGDEVRQ(SEQ ID NO:63);
ii)TGKIADY(SEQ ID NO:64);
iii)YRLFRKSN(SEQ ID NO:65);
iv)YQAGST(SEQ ID NO:66);
v)FNCYFPLQSYGFQPTNGVGY(SEQ ID NO:67)。
任选地,不连续氨基酸序列(i)、(ii)、(iii)、(iv)和(v)分别位于对应于SEQ IDNO:30的(i)残基85-91、(ii)残基97-103、(iii)残基135-142、(iv)残基155-160和(v)残基168-187的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
i)NITNLCPFGEVFNATK(SEQ ID NO:57);
ii)KKISN(SEQ ID NO:58);
iii)NI(SEQ ID NO:59)。
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
i)YNSTFFSTFKCYGVSPTKLNDLCFS(SEQ ID NO:60);
ii)DDFM(SEQ ID NO:61);
iii)FELLN(SEQ ID NO:62)。
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:30的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:30的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
任选地,包括其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
任选地,不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
具有改变的糖基化位点的设计的冠状病毒S蛋白RBD序列
已经证明,表位的掩蔽/去掩蔽在MERS中通过掩蔽非中和表位或通过去掩蔽重要表位来改变免疫应答(Du L等人,Nat.Comm,卷7,文献编号:13473(2016))。我们已经制备了另外的设计的S蛋白RBD序列(SARS2 RBD设计M7、M8、M9和M10),其中我们已经删除了SARS2RBD序列的糖基化位点,或者已经向SARS2 RBD序列引入了糖基化位点。做出的变化在图13中示出,并且在下面实施例14中讨论。设计M7和M9包括在图13中由圆圈编号4指示的位置(残基位置203)处引入的糖基化位点。设计M8和M10包括在图13中由圆圈编号1和2指示的位置(分别为残基位置13和25)中的每个位置处删除的糖基化位点。M8设计还包括在由圆圈编号3指示的位置(残基位置54)处引入的糖基化位点。
在下面并且在实施例14中示出了SARS2 RBD设计M7、M8、M9和M10的氨基酸序列:
>M7(SEQ ID NO:33)
RVQPTESIVR FPNITNLCPF GEVFNATRFA SVYAWNRKRI SNCVADYSVL YNSASFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNS NNLDSKVGGNYNYLYRLFRK SNLKPFERDI STEIYQAGST PCNGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLHANATVCGPK KSTN
>M8(SEQ ID NO:34)
RVQPTESIVR FPQITNLCPF GEVFQATRFA SVYAWNRKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNS NNLDSKVGGNYNYLYRLFRK SNLKPFERDI STEIYQAGST PCNGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLHAPATVCGPK KSTN
>M9(SEQ ID NO:35)
RVSPTQEVVR FPNITNLCPF DKVFNATRFP SVYAWERTKI SDCVADYTVL YNSTSFSTFKCYGVSPSKLI DLCFTSVYAD TFLIRCSEVR QVAPGQTGVI ADYNYKLPDD FTGCVIAWNT AKQDTGSSGNYNYYYRSHRK TKLKPFERDL SSDECSPDGK PCTPPAFNGV RGFNCYFTLS TYDFNPNVPV EYQATRVVVLSFELLNANAT VCGPKLSTQ
>M10(SEQ ID NO:36)
RVSPTQEVVR FPQITNLCPF DKVFQATRFP SVYAWERTKI SDCVADYTVL YNSTSFSTFKCYGVSPSKLI DLCFTSVYAD TFLIRCSEVR QVAPGQTGVI ADYNYKLPDD FTGCVIAWNT AKQDTGSSGNYNYYYRSHRK TKLKPFERDL SSDECSPDGK PCTPPAFNGV RGFNCYFTLS TYDFNPNVPV EYQATRVVVLSFELLNAPAT VCGPKLSTQ
在下面实施例14中示出了这些序列与SARS2参考序列(EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11))的对比。
设计序列与SARS2参考序列的氨基酸差异示出在下表9中(其中与参考序列的差异以粗体突出显示):
表9
*插入SEQ ID NO:11的氨基酸残基位置162与163之间的残基。
根据本发明,提供了一种分离的多肽,其包括根据SEQ ID NO:33、34、35或36的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:34(M8),或其整个长度与氨基酸序列SEQ ID NO:34具有至少99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:34(M8)或其整个长度与氨基酸序列SEQ IDNO:34具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQ ID NO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:13Q、25Q、54T。
根据本发明,还提供了一种分离的多肽,其包括在对应于SEQ ID NO:11的氨基酸残基位置的位置处具有以下氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域:13Q、25Q、54T、203N。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:35(M9),或其整个长度与氨基酸序列SEQ ID NO:35具有至少70%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:35(M9)或其整个长度与氨基酸序列SEQ IDNO:35具有至少70%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表9.1中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
表9.1
*用于插入SEQ ID NO:11的氨基酸残基位置162与163之间的残基。
任选地,包括氨基酸序列SEQ ID NO:35(M9)或其整个长度与氨基酸序列SEQ IDNO:35具有至少70%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQ IDNO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或两个:54T、203N。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:36(M10),或其整个长度与氨基酸序列SEQ ID NO:36具有至少69%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:36(M10)或其整个长度与氨基酸序列SEQ IDNO:36具有至少69%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表9.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
表9.2
*用于插入SEQ ID NO:11的氨基酸残基位置162与163之间的残基。
任选地,包括氨基酸序列SEQ ID NO:36(M10)或其整个长度与氨基酸序列SEQ IDNO:36具有至少69%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQ IDNO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:13Q、25Q、54T。
RBD蛋白的糖基化的影响被认为是重要的。我们已经发现,M7和野生型SARS2 RBDDNA(被认为导致糖基化RBD蛋白表达)在诱导对SARS2的中和反应中优于重组SARS2 RBD蛋白(非糖基化的,或稀疏糖基化的)。下面实施例28描述了为了研究SARS-CoV-2(SARS2)RBD蛋白与重组SARS-CoV-2 RBD蛋白相比在来源于用编码SARS-CoV-2 RBD序列的pEVAC质粒转染的HEK细胞的上清液中的糖基化而获得的质谱数据(参见图21和图22)。从结果得出的结论是,与纯化(重组)蛋白相比,存在从上清液获得的两种主要糖基化形式的蛋白。纯化蛋白是非糖基化的或稀疏糖基化的。这种糖基化差异被认为是重要的,因为糖基化位点围绕表位区域并且在大多数sarbecovirus中是保守的。这些糖基化位点对于与一些抗体的相互作用也是重要的。
任选地,包括设计的冠状病毒刺突(S)蛋白(全长、截短或RBD)的氨基酸序列的本发明的多肽在RBD序列中包括至少一个糖基化位点。
任选地,包括设计的冠状病毒刺突(S)蛋白(全长、截短或RBD)的氨基酸序列的本发明的多肽在RBD序列中包括至少两个糖基化位点。
任选地,包括设计的冠状病毒刺突(S)蛋白(全长、截短或RBD)的氨基酸序列的本发明的多肽在RBD序列中包括至少三个糖基化位点。
任选地,包括设计的冠状病毒刺突(S)蛋白(全长、截短或RBD)的氨基酸序列的本发明的多肽包括定位在RBD序列的最后10个氨基酸内的糖基化位点,优选地位于对应于RBD序列的残基位置203的残基位置处。
根据本发明,还提供了一种分离的多肽,其包括SARS2 RBD的氨基酸序列,具有定位在SARS2 RBD序列的最后10个氨基酸内的糖基化位点,优选地位于对应于RBD序列的残基位置203的残基位置处。
我们还已经发现,用野生型SARS1 S蛋白或RBD蛋白或野生型SARS2 S蛋白或RBD蛋白免疫小鼠诱导结合SARS2 RBD的抗体。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:5。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:11。
产生交叉反应性抗原的常规方法是基于天然多样性生成共有序列。本文描述的由本发明的核酸序列编码的抗原序列考虑位点之间的取样偏差和共进化。结果是诱导对一系列病毒的免疫应答的现实分子。作为进一步的细化,我们富集了针对已知和预测的表位的抗原序列。我们已经开发了一种用于选择最大化针对一系列目标病毒的群体保护的表位的组合的算法。该算法鉴定保守表位,同时对冗余进行罚分,并确保所选择的表位由一系列常见MHC等位基因结合。
为了避免疾病增强,我们修饰抗原,删除了与免疫病理学相关联的区域,通常称为抗体依赖增强作用(ADE)和/或补体触发的,或病毒触发的促炎反应。为了验证这些修饰,我们已经开发了针对此类ADE样作用进行筛选的测定。使用根据Yip等人(Yip等人,“Antibody-dependent infection of human macrophages by severe acuterespiratory syndrome coronavirus”,Virol J.2014;11:82;Jaume等人,“Anti-SevereAcute Respiratory Syndrome Coronavirus Spike Antibodies Trigger Infection ofHuman Immune Cells via a pH-and Cysteine Protease-Independent FcγR Pathway”Journal Of Virology,2011年10月,第10582–10597页)修改的测定,可以鉴定针对S蛋白的非RBD位点的非中和抗体,这些非中和抗体允许SARS-CoV-1进入承载Fc--RII的非ACE2表达免疫细胞。
在设计抗原之后,对其进行编码的DNA序列进行优化以在哺乳动物细胞中表达。在该DNA形式中,将目标抗原的多个合成基因插入DNA质粒载体(例如,pEVAC,参见图3)中,其用于体外和体内免疫筛选两种。
用于防止COVID-19变体的设计的冠状病毒全长S蛋白序列
全球正在循环多种SARS-CoV-2变体。在2020秋天出现了若干新的变体,最值得注意的是:
在英国(UK),出现了一种新的SARS-CoV-2变体(称为20I/501Y.V1、VOC 202012/01或B.1.1.7),具有大量的突变。已在世界各地的众多国家中检测到这种变体,包括美国(US)。在2021年1月,来自英国的科学家报道了表明B.1.1.7变体与其他变体相比可能与死亡风险增加相关联的证据,但是需要更多研究来确认此发现。在2020年12月结束时,在美国报道了该变体。
在南非,出现了与B.1.1.7不相关的另一种SARS-CoV-2变体(称为20H/501Y.V2或B.1.351)。该变体与B.1.1.7共享一些突变。已经在南非之外的多个国家中检测到归因于该变体的病例。在2021年1月结束时,在美国报道了该变体。
在巴西,出现了一种SARS-CoV-2变体(称为P.1),该变体首次在来自巴西的四名旅客中鉴定到,这些旅客在日本东京郊外的羽田机场进行了例行筛查测试。该变体具有17个独特突变,包括在刺突蛋白的受体结合结构域中的三个。在2021年1月结束时,在美国检测到该变体。
科学家们正在努力更多地了解这些变体,以更好地了解它们可能传播的容易程度以及目前授权的疫苗针对它们的有效性。关于这些变体的病毒学、流行病学和临床特征的新信息正在快速出现。
如下面实施例30中更详细描述的,我们已经设计了一种新的全长S蛋白序列(称为“VOC嵌合体”或COV_S_T2_29),用作COVID-19疫苗插入片段以防止变体B.1.1.7、P.1和B.1.351。在下面并且在实施例30中给出了设计的全长S蛋白序列的氨基酸序列:
>COV_S_T2_29(VOC嵌合体)(SEQ ID NO:53)
在下面实施例30中示出了该序列与SARS2参考序列(EPI_ISL_402130(武汉菌株)(SEQ ID NO:52))的对比。
设计序列COV_S_T2_29(SEQ ID NO:53)与SARS2参考序列(SEQ ID NO:52)的氨基酸差异示出在下表9.3中:
表9.3
根据本发明,提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:53。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:53,或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:53或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如下表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
表9.4
任选地,包括氨基酸序列SEQ ID NO:53或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:53或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少十个。
任选地,包括氨基酸序列SEQ ID NO:53或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQ ID NO:52的氨基酸残基位置的位置986处包括氨基酸残基P并且在位置987处包括氨基酸残基P,并且在对应于如下表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
表9.5
根据本发明,还提供了一种分离的多肽,其包括在对应于如上表9.4中所示的SEQID NO:52的氨基酸残基位置的位置处具有所示氨基酸残基或缺失中的至少一个或全部的冠状病毒S蛋白。
任选地,在对应于如上表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在对应于如上表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个。
任选地,在对应于如上表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在对应于如上表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少十个。
任选地,冠状病毒S蛋白包括其整个长度与氨基酸序列SEQ ID NO:52具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,在对应于如上表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在对应于SEQ ID NO:52的氨基酸残基位置的位置986处包括氨基酸残基P并且在位置987处包括氨基酸残基P,并且在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部。
处于关闭状态以防止COVID-19变体和预测的未来变体的设计的冠状病毒S蛋白序
在使用中或在高级临床开发中的大多数SARS-CoV-2疫苗是基于病毒刺突蛋白(S)作为其免疫原。S作为预融合三聚体存在于病毒体上,其中受体结合结构域(RBD)随机打开或关闭。已经描述了作用于打开和关闭构象两者的中和抗体。疫苗接种策略的长期成功将取决于诱导提供针对进化、循环的SARS-CoV-2菌株的持久的广泛免疫同时避免如用其他冠状病毒疫苗观察到的抗体依赖增强作用的风险的抗体。
Carnell等人(“SARS-CoV-2spike protein arrested in the closed stateinduces potent neutralizing responses”;https://doi.org/10.1101/2021.01.14.426695,于2021年1月14日发布)已经评估了在小鼠模型中使用S蛋白三聚体的免疫结果,该S蛋白三聚体被阻断处于关闭状态以防止暴露受体结合位点并因此防止与受体的相互作用。作者将此与一系列其他修饰的S蛋白构建体(包括当前疫苗中使用的代表)进行比较。他们发现所有三聚体S蛋白都诱导长寿命、强烈中和的抗体应答以及T细胞应答。值得注意的是,由关闭刺突诱导的血清的蛋白结合特性不同于由标准S蛋白构建体诱导的那些。基于其抑制RBD与ACE2之间的相互作用的程度,关闭S蛋白诱导比预期更强效的中和反应。作者得出的结论是,这些观察结果表明,关闭刺突与打开刺突相比募集不同但同样强效的病毒抑制免疫应答,并且这很可能包括针对存在于关闭构象中的构象表位的中和抗体。
我们已经认识到,本文公开的设计的S蛋白序列(并且尤其是如实施例30中所述的SEQ ID NO:53)的氨基酸变化可任选地存在于被阻断处于关闭状态的设计的S蛋白中,并由此进一步改善设计序列的抗体应答。特别地,使用此类结构限制可减少对关键区域的免疫干扰,并且扩散抗体应答以聚焦于其他或更少的免疫显性位点。
下面实施例31描述了可以对设计的S蛋白序列进行以允许其形成关闭结构的任选的另外氨基酸变化。
任选地,本发明的设计的S蛋白序列可在对应于全长S蛋白序列的位置413和位置987的位置处包括半胱氨酸残基。例如,G413C和V987C。
例如,本发明的设计的S蛋白序列可包括以下氨基酸序列(SEQ ID NO:54)(在分别对应于SEQ ID NO:52的位置413和位置987的位置410和位置984处具有半胱氨酸残基):
根据本发明,提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:54。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:54,或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:54或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如下表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
表9.4
任选地,包括氨基酸序列SEQ ID NO:54或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:54或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如表9.4中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少十个。
任选地,包括氨基酸序列SEQ ID NO:54或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于如下表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
任选地,包括氨基酸序列SEQ ID NO:54或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQ ID NO:52的氨基酸残基位置的位置986处包括氨基酸残基P,并且在对应于如下表9.5中所示的SEQ IDNO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
表9.5
根据本发明,还提供了一种分离的多肽,其包括在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基并且在对应于如上表9.5中所示的SEQ IDNO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部的冠状病毒S蛋白。
任选地,在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基并且在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个。
任选地,在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基并且在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少十个。
任选地,在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基并且在对应于如上表9.5中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个的本发明的分离的多肽在位置986处包括氨基酸残基P。
我们还已经认识到,任何SARS-CoV-2刺突蛋白可以被修饰成在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸残基,以允许其根据Carnell等人(同上)形成被阻断处于关闭状态的刺突蛋白,并由此引发与对应的未修饰蛋白相比更强效的中和反应。例如,Jeong等人(https://virological.org/t/assemblies-of-putative-sars-cov2-spike-encoding-mrna-sequences-for-vaccines-bnt-162b2-and-mrna-1273/663-版本0.2Beta03/30/21)最近已经报道了针对初期Moderna(https://pubmed.ncbi.nlm.nih.gov/32756549/)和Pfizer/BioNTech(https://pubmed.ncbi.nlm.nih.gov/33301246/)COVID-19疫苗的RNA组分的实验序列信息,允许了前者的工作组装和先前报道的后者RNA的序列信息的确认(参见文件的图1和图2中提供的序列)。可以修饰由此类序列编码的刺突蛋白以在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸残基。
根据本发明,还提供了一种分离的多肽,其包括在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基的冠状病毒S蛋白。
任选地,冠状病毒S蛋白包括其整个长度与氨基酸序列SEQ ID NO:52具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
SARS-CoV-2正在不断地进化,更具接触传染性的突变迅速扩散。Zahradník等人在2021年(“SARS-CoV-2 RBD in vitro evolution follows contagious mutation spread,yet generates an able infection inhibitor”;doi:https://doi.org/10.1101/2021.01.06.425392,于2021年1月29日发布)最近报道了使用体外进化使刺突蛋白的受体结合域(RBD)对ACE2的亲和力成熟,导致更具接触传染性的突变S477N、E484K和N501Y成为最先选择的突变之一,这解释了“欧洲”(20E-EU1)、“英国”(501.V1)、“南非”(501.V2)和“巴西”(501.V3)变体的趋同进化。作者报道进一步的体外进化将结合增强600倍为具有甚至更高传染性的潜在新进化突变提供了指导。例如,Q498R上位至N501Y。
我们还已经认识到,本文(并且尤其是在上面标题为“用于防止COVID-19变体的设计的冠状病毒全长S蛋白序列”和“处于关闭状态以防止COVID-19变体和预测的未来变体的设计的冠状病毒S蛋白序列”的部分和下面实施例30和31中)公开的设计的S蛋白序列(RBD、截短或全长)还可任选地在预测在具有疫苗逃逸应答的未来COVID-19变体中突变的一个或多个残基位置处包括氨基酸取代,例如在位置446、452、477和498中的一个或多个(或全部)处(例如,G446R、S477N、Q498R,尤其是Q498R)。
任选地,本发明的分离的多肽在以下位置(对应于SEQ ID NO:52的氨基酸残基位置)中的一个或多个(或全部)处包括氨基酸变化:446、452、477和498(例如,G446R、S477N、Q498R,尤其是Q498R)。
任选地,本发明的分离的多肽在以下位置(对应于SEQ ID NO:52的氨基酸残基位置)处包括氨基酸变化:Q498R和N501Y。
设计的冠状病毒包膜(E)蛋白序列
我们还已经生成了冠状病毒包膜(E)蛋白的新型氨基酸序列。图6示出了SARS包膜(E)蛋白的氨基酸序列(SEQ ID NO:21),并且示出了序列的关键特征。如下面实施例10中所述,图7示出了冠状病毒E蛋白序列的多序列对比,比较了NL63和229E(α-冠状病毒)和HKU1、MERS、SARS和SARS2(β-冠状病毒)的分离株的序列。对比表明,与其他序列相比,SARS2和SARS序列(亚属Sarbeco的β-冠状病毒)的E蛋白的C末端包括缺失,并且与SARS序列相比,SARS2 E蛋白序列包括缺失,和精氨酸(带正电的)氨基酸残基。
冠状病毒E蛋白的新型氨基酸序列称为COV_E_T2_1(设计的Sarbecovirus序列)(SEQ ID NO:22)和COV_E_T2_2(设计的SARS2序列)(SEQ ID NO:23):
>COV_E_T2_1
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSQG VPDLLV(SEQ ID NO:22)
>COV_E_T2_2
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSR-VPDLLV(SEQ ID NO:23)
图7中的SARS2参考E蛋白序列与这些设计序列的对比突出显示了SARS2参考E蛋白序列与COV_E_T2_1设计序列(SEQ ID NO:22)之间存在四个氨基酸差异,并且SARS2参考E蛋白序列与COV_E_T2_2设计序列(SEQ ID NO:23)之间存在两个氨基酸差异:
COV_E_T2_2序列的C末端序列与SARS2参考序列相同。E蛋白的C末端是E蛋白的鉴定表位之一,因此在SARS2参考序列中存在的氨基酸缺失和精氨酸残基取代(在图6中与SARS参考序列相比)已经保留在COV_E_T2_2设计序列中。在其他位置处的氨基酸差异被优化以最大化对识别所有Sarbeco病毒的免疫应答的诱导。
氨基酸差异总结在下表中:
表10.1
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:22或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括所示一个或两个氨基酸残基:
表10.2
任选地,包括氨基酸序列SEQ ID NO:22或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括所示氨基酸残基中的任何一个、至少两个、至少三个或全部:
表10.3
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:23或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:23的氨基酸残基位置的位置处包括所示一个或两个氨基酸残基:
表10.4
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的一个或两个的冠状病毒E蛋白:
表10.5
E蛋白残基位置 氨基酸残基
36 A
55 T
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何一个、至少两个、至少三个或全部的冠状病毒E蛋白:
表10.6
E蛋白残基位置 氨基酸残基
36 A
55 T
69 Q
70 G
任选地,包括冠状病毒E蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:21具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
在上述对比中,SARS2参考序列的残基36被示出为V,但实际上为A(如图7和SEQ IDNO:21中正确示出的)。SEQ ID NO:21与设计序列的对比突出显示了另选的SARS2参考E蛋白序列与COV_E_T2_1设计序列(SEQ ID NO:22)之间存在三个氨基酸差异,并且SARS2参考E蛋白序列与COV_E_T2_2设计序列(SEQ ID NO:23)之间存在一个氨基酸差异:
氨基酸差异总结在下表中:
表10.7
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:22(COV_E_T2_1),或其整个长度与氨基酸序列SEQ ID NO:22具有至少97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:22或其整个长度与氨基酸序列SEQ ID NO:22具有至少97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括所示氨基酸残基:
表10.8
任选地,包括氨基酸序列SEQ ID NO:22或其整个长度与氨基酸序列SEQ ID NO:22具有至少97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括所示氨基酸残基中的任何一个、至少两个或全部:
表10.9
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:23或其整个长度与氨基酸序列SEQ ID NO:23具有至少99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:23的氨基酸残基位置的位置处包括所示氨基酸残基:
表10.10
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基的冠状病毒E蛋白:
表10.11
E蛋白残基位置 氨基酸残基
55 T
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何一个、至少两个或全部的冠状病毒E蛋白:
表10.12
E蛋白残基位置 氨基酸残基
55 T
69 Q
70 G
任选地,包括冠状病毒E蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:21具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
SARS-CoV包膜(E)基因编码具有离子通道(IC)活性(病毒-宿主相互作用中的一种重要功能)的76氨基酸跨膜蛋白。用缺少或表现E蛋白IC活性的病毒感染小鼠显示出,在离子通道缺陷型病毒感染中,炎症小体通路的激活以及SARS-CoV诱导的加剧的炎症反应有所降低(Nieto-Torres等人,2014,Severe Acute Respiratory Syndrome CoronavirusEnvelope Protein Ion Channel Activity Promotes Virus Fitness andPathogenesis.PLoS Pathog10(5):e1004077)。
我们已经进行了新E蛋白设计Cov_E_T2_3、CoV_E_T2_4和CoV_E_T2_5,其分别对应于SARS2参考(SEQ ID NO:41)、CoV_E_T2_1(SEQ ID NO:22)和CoV_E_T2_2(SEQ ID NO:23)的新设计(参见实施例10)。这些新设计具有点突变N15A,其消除了离子通道活性,但不影响结构的稳定性。Nieto-Torres等人(同上)讨论了这种突变以及SARS E在宿主细胞上的毒性和炎症作用。
SARS2包膜蛋白参考的氨基酸序列(SEQ ID NO:41)为:
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPSFYVYSRVKNLNSSRV PDLLV(SEQ ID NO:41)
在下面并且在实施例25中示出了新E蛋白设计的氨基酸序列:
>COV_E_T2_3(SARS2_突变体)(SEQ ID NO:42)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPSFYVYSRVKNLNSSR-VPDLLV
>COV_E_T2_4(Env1_突变体)(SEQ ID NO:43)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSQG VPDLLV
>COV_E_T2_5(Env2_突变体)(SEQ ID NO:44)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSR-VPDLLV
在下面示出了E蛋白设计与SARS2 E蛋白参考序列的对比:
设计序列与SARS2参考序列(SEQ ID NO:41)的氨基酸差异示出在下表中(其中与参考序列的差异以粗体突出显示):
表10.13
根据本发明,提供了一种分离的多肽,其包括根据SEQ ID NO:36-38中任一项的氨基酸序列。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:42(COV_E_T2_3),或其整个长度与氨基酸序列SEQ ID NO:42具有至少99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:42(COV_E_T2_3)或其整个长度与氨基酸序列SEQ ID NO:42具有至少99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQID NO:41的氨基酸残基位置15的位置处包括氨基酸残基A。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:43(COV_E_T2_4),或其整个长度与氨基酸序列SEQ ID NO:43具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:43(COV_E_T2_4)或其整个长度与氨基酸序列SEQ ID NO:43具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:15A、55T、69Q、70G。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:44(COV_E_T2_5),或其整个长度与氨基酸序列SEQ ID NO:44具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:44(COV_E_T2_5)或其整个长度与氨基酸序列SEQ ID NO:44具有至少98%或99%的氨基酸同一性的氨基酸序列的本发明的多肽在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:15A、55T。
根据本发明,还提供了一种分离的多肽,其包括在对应于SEQ ID NO:41的氨基酸残基位置的位置处具有以下氨基酸残基中的至少一个的冠状病毒E蛋白:15A、55T、69Q、70G。
任选地,包括冠状病毒E蛋白的本发明的分离的多肽在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基:15A、55T。
任选地,包括冠状病毒E蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:21具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
设计的冠状病毒膜(M)蛋白序列
申请人还已经生成了冠状病毒膜(M)蛋白的新型氨基酸序列:
●COV_M_T2_1Sarbecovirus根祖先(SEQ ID NO:24);
●COV_M_T2_2表位优化版本的SARS2进化枝祖先节点88b(移除D4)、从开始和结束添加B细胞表位的SARS2等效物,并且然后添加T细胞表位,同时观察共进化位点限制(SEQID NO:25)。
这些设计序列的氨基酸序列为:
>COV_M_T2_1/1-221Sarbeco_M_根:
MADNGTITVE ELKQLLEQWN LVIGFLFLAW IMLLQFAYSN RNRFLYIIKL VFLWLLWPVTLACFVLAAVY RINWVTGGIA IAMACIVGLM WLSYFVASFR LFARTRSMWS FNPETNILLN VPLRGTILTRPLMESELVIG AVIIRGHLRM AGHSLGRCDI KDLPKEITVA TSRTLSYYKL GASQRVGTDS GFAAYNRYRIGNYKLNTDHA GSNDNIALLV Q(SEQ ID NO:24)
>COV_M_T2_2/1-222Sarbeco_M_节点88b_表位_优化:
MADSNGTITV EELKKLLEQW NLVIGFLFLT WICLLQFAYS NRNRFLYIIK LIFLWLLWPVTLACFVLAAV YRINWVTGGI AIAMACIVGL MWLSYFVASF RLFARTRSMW SFNPETNILL NVPLRGSIITRPLMESELVI GAVILRGHLR MAGHSLGRCD IKDLPKEITV ATSRTLSYYK LGASQRVASD SGFAVYNRYRIGNYKLNTDH SSSSDNIALL VQ(SEQ ID NO:25)
如下面实施例11中所述,图8示出了SARS2参考M蛋白序列(SEQ ID NO:26)与设计序列的对比。图8中所示的对比突出显示了SARS2参考M蛋白序列与COV_M_T2_1和COV_M_T2_2设计序列之间的氨基酸差异,如下表中所示:
表11.1
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表11.2
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.2中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.2中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表11.3
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.3中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.3中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.3中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十五个。
任选地,包括氨基酸序列SEQ ID NO:24或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.3中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表11.4
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.4中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.4中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
表11.5
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.5中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.5中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,包括氨基酸序列SEQ ID NO:25或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如表11.5中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括所示氨基酸残基中的全部。
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.6
M蛋白残基位置 氨基酸残基
40 S
76 V
87 I
97 V
125 R
134 M
151 M
155 S
197 N
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.7
M蛋白残基位置 氨基酸残基
4 -(缺失)
15 Q
30 A
33 M
40 S
52 V
76 V
87 I
97 V
125 R
134 M
145 I
151 M
155 S
188 G
189 T
197 N
211 A
212 G
214 N
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.8
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.9
M蛋白残基位置 氨基酸残基
40 S
76 V
87 I
97 V
125 R
127 S
134 M
151 M
155 S
189 S
195 V
197 N
任选地,包括冠状病毒M蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:26具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
我们已经进行了其他的新M蛋白设计(COV_M_T2_3、COV_M_T2_4、COV_M_T2_5)。在这些设计中,我们已经删除了膜蛋白的第一跨膜区和第二跨膜区,以消除其与S蛋白的相互作用:
·具有S、M和E的串构建体示出较高阶聚集体。
·消除S与M之间的相互作用可减少聚集。
·M-del构建体(Cov_M_T2_(3-5))设计用于消除与S的相互作用。
图20示出了M蛋白的图示。M、E和N蛋白之间的相互作用对于病毒组装是重要的。M蛋白也与核衣壳结合,并且这种相互作用促进了病毒体组装的完成。这些相互作用已经映射到M蛋白的内型结构域的C末端和N蛋白的C末端结构域。在图20中,*表示对严重急性呼吸综合征相关联冠状病毒的膜蛋白上的免疫显性表位的鉴定,并且**表示与刺突蛋白的相互作用所涉及的冠状病毒膜蛋白结构域的映射。
在下面给出了新M蛋白设计的氨基酸序列:
>COV_M_T2_3(SEQ ID NO:48)
MADSNGTITV EELKKLLEQI TGGIAIAMAC LVGLMWLSYFIASFRLFART RSMWSFNPETNILLNVPLHG TILTRPLLES ELVIGAVILRGHLRIAGHHL GRCDIKDLPK EITVATSRTLSYYKLGASQRVAGDSGFAAY SRYRIGNGKL NTDHSSSSDN IALLVQ
>COV_M_T2_4(SEQ ID NO:49)
MADNGTITVE ELKQLLEQVT GGIAIAMACI VGLMWLSYFVASFRLFARTR SMWSFNPETNILLNVPLRGT ILTRPLMESE LVIGAVIIRGHLRMAGHSLG RCDIKDLPKE ITVATSRTLSYYKLGASQRVGTDSGFAAYN RYRIGNGKLN TDHAGSNDNI ALLVQ
>COV_M_T2_5(SEQ ID NO:50)
MADSNGTITV EELKKLLEQV TGGIAIAMAC IVGLMWLSYFVASFRLFART RSMWSFNPETNILLNVPLRG SIITRPLMES ELVIGAVILRGHLRMAGHSL GRCDIKDLPK EITVATSRTLSYYKLGASQRVASDSGFAVY NRYRIGNGKL NTDHSSSSDN IALLVQ
在下面示出了新M蛋白设计(COV_M_T2_3、COV_M_T2_4、COV_M_T2_5)与先前M蛋白设计(COV_M_T1_1、COV_M_T2_1、COV_M_T2_2)的序列对比:
设计序列与SARS2 M蛋白参考序列的氨基酸差异示出在下表中(其中与参考序列的差异以粗体突出显示):
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:48,或其整个长度与氨基酸序列SEQ ID NO:48具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:48或其整个长度与氨基酸序列SEQ ID NO:48具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQ ID NO:26的位置20-75的位置处包括氨基酸残基的缺失。
任选地,包括氨基酸序列SEQ ID NO:48或其整个长度与氨基酸序列SEQ ID NO:48具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQ ID NO:26的氨基酸残基位置204的位置处包括氨基酸残基G。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:49,或其整个长度与氨基酸序列SEQ ID NO:49具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:49或其整个长度与氨基酸序列SEQ ID NO:49具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQID NO:26的位置20-75的位置处包括氨基酸残基的缺失。
任选地,包括氨基酸序列SEQ ID NO:49或其整个长度与氨基酸序列SEQ ID NO:49具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
表11.11
任选地,包括氨基酸序列SEQ ID NO:49或其整个长度与氨基酸序列SEQ ID NO:49具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
表11.12
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:50,或其整个长度与氨基酸序列SEQ ID NO:50具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,包括氨基酸序列SEQ ID NO:50或其整个长度与氨基酸序列SEQ ID NO:50具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于SEQ IDNO:26的位置20-75的位置处包括氨基酸残基的缺失。
任选地,包括氨基酸序列SEQ ID NO:50或其整个长度与氨基酸序列SEQ ID NO:50具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
表11.11
任选地,包括氨基酸序列SEQ ID NO:50或其整个长度与氨基酸序列SEQ ID NO:50具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列的本发明的分离的多肽在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
表11.13
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.11
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.12
根据本发明,还提供了一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
表11.13
任选地,包括冠状病毒M蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:26具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
设计的冠状病毒核蛋白(N)序列
我们已经进行了新N蛋白质设计:COV_N_T2_1(SEQ ID NO:46)和COV_N_T2_2(SEQID NO:47)。在下面并且在实施例15中示出了这些设计的氨基酸序列。序列COV_N_T2_2是使用方法和算法设计的,该方法和算法选择预测表位以基于其跨sarbecovirus的保守性(同时最小化冗余)来包括MHC等位基因的频率和数量,表位受到预测表位质量和少数用户指定的权重的限制。
>YP_009724397.2/1-419核衣壳磷蛋白[SARS-CoV-2](参考序列)(SEQ ID NO:45)
MSDNGPQ-NQ RNAPRITFGG PSDSTGSNQN GERSGARSKQ RRPQGLPNNT ASWFTALTQHGKEDLKFPRG QGVPINTNSS PDDQIGYYRR ATRRIRGGDG KMKDLSPRWY FYYLGTGPEA GLPYGANKDGIIWVATEGAL NTPKDHIGTR NPANNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRNSSRNSTPGSSRGTSPAR MAGNGGDAAL ALLLLDRLNQ LESKMSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKAYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK HWPQIAQFAP SASAFFGMSR IGMEVTPSGT WLTYTGAIKLDDKDPNFKDQ VILLNKHIDA YKTFPPTEPKKDKKKKADET QALPQRQKKQ QTVTLLPAAD LDDFSKQLQQSMSSA--DST QA
>COV_N_T2_1/1-418节点1b 321-323删除(SEQ ID NO:46)
MSDNGPQ-NQ RSAPRITFGG PSDSTDNNQN GERSGARPKQ RRPQGLPNNT ASWFTALTQHGKEDLRFPRG QGVPINTNSG KDDQIGYYRR ATRRVRGGDG KMKELSPRWY FYYLGTGPEA ALPYGANKEGIVWVATEGAL NTPKDHIGTR NPNNNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRGNSRNSTPGSSRGTSPAR MASGGGDTAL ALLLLDRLNQ LESKVSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKQYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK HWPQIAQFAP SASAFFGMSR---EVTPSGT WLTYHGAIKLDDKDPQFKDN VILLNKHIDA YKTFPPTEPK KDKKKKADEA QPLPQRQKKQ PTVTLLPAAD LDDFSKQLQNSMSGASADST QA
>COV_N_T2_2/1-417表位优化321-323删除(SEQ ID NO:47)
MTDNGQQ-GP RNAPRITF-G VSDNFDNNQD GGRSGARPKQ RRPQGLPNNT ASWFTALTQHGKEDLRFPRG QGVPINTNSS PDDQIGYYRR ATRRIRGGDG KMKDLSPRWY FYYLGTGPEA ALPYGANKEGIVWVATEGAL NTPKDHIGTR NPNNNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRNSSRNSTPGSSRGTSPAR NLQAGGDTAL ALLLLDRLNQ LESKMSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKQYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK QWPQIAQFAP SASAFFGMSR---EVTPSGT WLTYTGAIKLDDKDPQFKDN VILLNKHIDA YKTFPPTEPK KDKKKKADEA QPLPQRQKKQ QTVTLLPAAD LDDFSRQLQNSMSGASADST QA
在下面示出了N蛋白设计与SARS2 N蛋白参考序列的对比:
设计序列与SARS2参考序列的氨基酸差异示出在下表12.1中(其中与参考序列的差异以粗体突出显示,并且所有设计序列共同的差异加下划线):
表12.1
SARS2 N蛋白参考残基位置列的位置415和位置416是斜体的,因为它们不是参考序列的残基,而是包括在N_T2_1和N_T2_2序列中的插入。
两种设计序列共同的氨基酸变化总结在下表中:
表12.2
任选的另外变化总结在下表中:
表12.3
另选的任选的另外变化总结在下表中:
表12.4
根据本发明,提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:46(COV_N_T2_1),或其整个长度与氨基酸序列SEQ ID NO:46具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:46或其整个长度与氨基酸序列SEQ ID NO:46具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽还在对应于如上表12.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:46或其整个长度与氨基酸序列SEQ ID NO:46具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽还在对应于如上表12.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
根据本发明,还提供了一种分离的多肽,其包括氨基酸序列SEQ ID NO:47(COV_N_T2_2),或其整个长度与氨基酸序列SEQ ID NO:47具有至少92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:47或其整个长度与氨基酸序列SEQ ID NO:47具有至少92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽还在对应于如上表12.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,本发明的多肽包括分离的多肽,所述分离的多肽包括氨基酸序列SEQ IDNO:47或其整个长度与氨基酸序列SEQ ID NO:47具有至少92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,本发明的多肽还在对应于如上表12.4中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
根据本发明,还提供了一种分离的多肽,其包括在对应于如上表12.2中所示的SEQID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括至少五个氨基酸残基。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括至少十个氨基酸残基。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括至少十五个氨基酸残基。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.3中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.3中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.3中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.4中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.4中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.4中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十个。
任选地,包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白的本发明的分离的多肽在对应于如上表12.4中所示的SEQ ID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少十五个。
任选地,包括冠状病毒N蛋白的本发明的分离的多肽包括其整个长度与氨基酸序列SEQ ID NO:45具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
本发明的多肽是特别有利的,因为它们可以引发对若干不同类型的冠状病毒的广泛中和免疫应答,特别是若干不同类型的冠状病毒β-冠状病毒。包括氨基酸序列SEQ IDNO:15(或其整个长度与氨基酸序列SEQ ID NO:15具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列)或SEQ ID NO:17(或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列)的本发明的多肽也是有利的,因为它们缺少可能由ADE(或ADE样促炎反应)导致病毒免疫逃避和疾病恶化的非中和表位。
类似地,包括新型设计的冠状病毒E蛋白氨基酸序列(例如,氨基酸序列SEQ IDNO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列)或冠状病毒M蛋白氨基酸序列(例如,氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列)的本发明的多肽是有利的,因为它们缺少可能由ADE(或ADE样促炎反应)导致病毒免疫逃避和疾病恶化的非中和表位。
本发明的多肽可包括一个或多个保守氨基酸取代。保守氨基酸取代是当进行时最少地干扰原始多肽的特性的那些取代,即,蛋白的结构并且尤其是功能是保守的,并且不会因此类取代而显著改变。在下面示出了保守取代的示例:
保守取代通常维持:(a)在取代区域中多肽主链的结构,例如,作为片层或螺旋构象,(b)分子在目标位点处的电荷或疏水性,或(c)侧链的大部分。
通常预期产生蛋白特性的最大变化的取代将是非保守的,例如以下变化,其中:(a)亲水性残基(例如,丝氨酸或苏氨酸)取代成(或被取代为)疏水性残基(例如,亮氨酸、异亮氨酸、苯丙氨酸、缬氨酸或丙氨酸);(b)半胱氨酸或脯氨酸取代成(或被取代为)任何其他残基;(c)具有正电性侧链的残基(例如,赖氨酸、精氨酸或组氨酸)取代成(或被取代为)负电性残基(例如,谷氨酸或天冬氨酸);或(d)具有庞大侧链的残基(例如,苯丙氨酸)取代成(或被取代为)不具有侧链的残基(例如,甘氨酸)。
术语“广泛中和免疫应答”在本文中用于意指在受试者中引发的足以抑制(即,减少)、中和或预防冠状病毒家族内病毒的感染和/或感染恶化的免疫应答。任选地,广泛中和免疫应答足以抑制、中和或预防超过一种类型的β-冠状病毒(例如,SARS-CoV和SARS-CoV-2)的感染和/或感染恶化。任选地,广泛中和免疫应答足以抑制、中和或预防同一β-冠状病毒谱系内的超过一种类型的β-冠状病毒(例如,Sarbecovirus亚属内超过一种类型的β-冠状病毒,诸如SARS-CoV、SARS-CoV-2和蝙蝠SL-CoV-WIV1)的感染和/或感染恶化。任选地,广泛中和免疫应答足以抑制、中和或预防不同β-冠状病毒谱系的冠状病毒(诸如,谱系B(例如,SARS-CoV和SARS-CoV-2)和谱系C(例如,MERS-CoV))的感染和/或感染恶化。任选地,广泛中和免疫应答足以抑制、中和或预防大多数或全部不同β-冠状病毒的感染和/或感染恶化。任选地,广泛中和免疫应答足以抑制、中和或预防冠状病毒家族的大多数或全部不同病毒的感染和/或感染感染恶化。
免疫应答可以是体液和/或细胞免疫应答。细胞免疫应答是免疫系统的细胞(诸如,B细胞、T细胞、巨噬细胞或多形核细胞)对刺激(诸如,抗原或疫苗)的应答。免疫应答可包括宿主防御应答所涉及的任何身体细胞,包括例如分泌干扰素或细胞因子的上皮细胞。免疫应答包括但不限于先天性免疫应答或炎症。
任选地,本发明的多肽诱导保护性免疫应答。保护性免疫应答是指保护受试者免于感染或疾病(即,防止感染或防止与感染相关联的疾病的发展)的免疫应答。测量免疫应答的方法是本领域众所周知的,并且包括例如测量淋巴细胞(诸如,B细胞或T细胞)的增殖和/或活性、细胞因子或趋化因子的分泌、炎症或抗体产生。
任选地,本发明的多肽能够诱导在已经施用多肽(作为多肽或例如由施用的核酸表达载体表达)的人类或非人类动物中诱导抗体产生和/或T细胞应答。
任选地,本发明的多肽是糖基化多肽。
核酸分子
根据本发明,还提供了编码本发明的多肽的分离的核酸分子或其互补序列。
根据本发明,还提供了分离的核酸分子,所述分离的核酸分子包括其整个长度与编码本发明的多肽的本发明的核酸分子为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列或其互补序列。
任选地,本发明的分离的核酸分子包括核苷酸序列SEQ ID NO:18、16或14或其整个长度与核苷酸序列SEQ ID NO:18、16或14为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列或其互补序列。
根据本发明,还提供了一种分离的核酸分子,其包括编码包括氨基酸序列SEQ IDNO:33、34、35或36的本发明的多肽的核苷酸序列。
任选地,编码包括氨基酸序列SEQ ID NO:33、34、35或36的多肽的核苷酸序列分别包括SEQ ID NO:37、38、39或40的核苷酸序列。
根据本发明,还提供了一种分离的核酸分子,其包括编码本发明的分离的多肽的核苷酸序列,所述本发明的分离的多肽包括氨基酸序列SEQ ID NO:34(M8),或其整个长度与氨基酸序列SEQ ID NO:34具有至少99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的核酸分子,其包括编码分离的多肽的核苷酸序列,所述分离的多肽包括在对应于SEQ ID NO:11的氨基酸残基位置的位置处具有以下氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域:13Q、25Q、54T、203N。
根据本发明,还提供了一种分离的核酸分子,其包括编码分离的多肽的核苷酸序列,所述分离的多肽包括氨基酸序列SEQ ID NO:35(M9),或其整个长度与氨基酸序列SEQID NO:35具有至少70%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种分离的核酸分子,其包括编码分离的多肽的核苷酸序列,所述分离的多肽包括氨基酸序列SEQ ID NO:36(M10),或其整个长度与氨基酸序列SEQID NO:36具有至少69%的氨基酸同一性的氨基酸序列。
我们已经发现,用编码SARS2截短S蛋白的核酸(特别地,DNA)免疫小鼠诱导产生能够结合SARS2刺突蛋白的抗体(参见实施例17,图10)。
根据本发明,提供了一种分离的核酸分子,其编码氨基酸序列SEQ ID NO:9的SARS2截短S蛋白(CoV_T2_3)。
任选地,编码氨基酸序列SEQ ID NO:9的SARS2截短S蛋白(CoV_T2_3)的分离的核酸分子包括核苷酸序列SEQ ID NO:10。
我们还已经发现,用编码SARS2 S蛋白RBD的核酸(特别地,DNA)免疫小鼠诱导产生能够中和SARS2假型病毒的抗体(参见实施例18,图11)。
我们还已经发现,M7和野生型SARS2 RBD DNA(被认为导致糖基化RBD蛋白表达)在诱导对SARS2的中和反应中优于重组SARS2 RBD蛋白(非糖基化的,或稀疏糖基化的)。
根据本发明,提供了一种分离的核酸分子,其编码氨基酸序列SEQ ID NO:11的SARS2 S蛋白RBD(CoV_T2_6)。
任选地,编码氨基酸序列SEQ ID NO:11的SARS2 S蛋白RBD(CoV_T2_6)的分离的核酸分子包括核苷酸序列SEQ ID NO:12。
我们还已经发现,编码设计的M7 SARS2 S蛋白RBD的核酸(特别地,DNA)具有尤其有利的作用。特别地,我们已经发现:
·用包括编码M7 SARS2 RBD(SEQ ID NO:33)的核酸的DNA疫苗免疫小鼠诱导与野生型SARS2 RBD相比具有与SARS2 RBD的更强结合的免疫应答(参见实施例20和图14);
·用编码M7 SARS2 RBD(SEQ ID NO:33)的DNA疫苗免疫小鼠与编码野生型SARS2RBD的DNA疫苗相比更快速地引发中和免疫应答(参见实施例21和图15);
·用编码M7 SARS2 RBD(SEQ ID NO:33)的DNA疫苗免疫小鼠与编码野生型SARS2RBD的DNA疫苗相比在第1周和第2周从渗血收集的血清中引发更多的中和反应(参见实施例22和图16、图17);
·包括M7 SARS2 RBD的上清液与三种ACE2结合病毒有效地竞争ACE2细胞进入(参见实施例23和图18);并且
·通过编码M7 SARS2 RBD(SEQ ID NO:33)的DNA疫苗诱导T细胞应答,其对RBD肽池的肽具有反应性,但对全长RBD或培养基不具有反应性(参见实施例24和图19)。
根据本发明,还提供了一种分离的核酸分子,其包括核苷酸序列SEQ ID NO:37。
序列同一性
氨基酸或核酸序列之间的相似性根据序列之间的相似性(另外称为序列同一性)来表达。通常根据百分比同一性(或相似性或同源性)来测量序列同一性;百分比越高,两个序列越相似。当使用标准方法对比时,给定基因或蛋白的同源物或变体将具有相对较高程度的序列同一性。用于比较的序列对比方法是本领域众所周知的。在以下文献中描述了各种程序和对比算法:Smith and Waterman,Adv.Appl.Math.2:482,1981;Needleman和Wunsch,J.Mol.Biol.48:443,1970;Pearson和Lipman,Proc.Natl.Acad.Sci.U.S.A.85:2444,1988;Higgins和Sharp,Gene 73:237-244,1988;Higgins和Sharp,CABIOS 5:151-153,1989;Corpet等人,Nucleic Acids’Research16:10881-10890,1988;以及Pearson和Lipman,Proc.Natl.Acad.Sci.U.S.A.85:2444,1988。Altschul等人,Nature Genet.6:119-129,1994。NCBI基本局部对比搜索工具(BLASTTM)(Altschul等人,J.Mol.Biol.215:403-410,1990)可从若干来源获得,包括美国国家生物技术信息中心(NCBI,贝塞斯达,马里兰州)和互联网,用于与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。
核酸序列之间或氨基酸序列之间的序列同一性可以通过比较序列的对比来确定。当比较序列中的等效位置被相同核苷酸或氨基酸占据时,则分子在该位置处是相同的。将对比评分为同一性百分比是在比较序列共享的位置处的相同核苷酸或氨基酸的函数。当比较序列时,最佳对比可能需要将空位引入到这些序列中的一个或多个序列中以考虑序列中可能的插入和缺失。序列比较方法可以采用空位罚分,使得对于正在比较的序列中的相同数量的相同分子,具有尽可能少的空位的序列对比(反映两个比较序列之间的较高相关性)将实现比具有许多空位的序列对比更高的得分。最大百分比同一性的计算涉及在考虑空位罚分的情况下产生最佳对比。
用于执行序列比较的合适计算机程序在商业和公共领域中广泛可用。示例包括MatGat(Campanella等人,2003,BMC Bioinformatics 4:29;可从http://bitincka.com/ledion/matgat获得的程序),Gap(Needleman&Wunsch,1970,J.Mol.Biol.48:443-453),FASTA(Altschul等人,1990,J.Mol.Biol.215:403-410;可从http://www.ebi.ac.uk/fasta获得的程序),Clustal W 2.0和X 2.0(Larkin等人,2007,Bioinformatics 23:2947-2948;可从http://www.ebi.ac.uk/tools/clustalw2获得的程序)和EMBOSS逐对对比算法(Needleman&Wunsch,1970,同上;Kruskal,1983,在:Time warps,string edits andmacromolecules:the theory and practice of sequence comparison,Sankoff&Kruskal(编辑),页码1-44,Addison Wesley;可从http://www.ebi.ac.uk/tools/emboss/align获得的程序)。所有程序可使用默认参数运行。
例如,可以使用EMBOSS逐对对比算法的“needle”方法进行序列比较,该方法确定两个序列在考虑其整个长度时的最佳对比(包括空位)并提供百分比同一性得分。氨基酸序列比较的默认参数(“蛋白质分子”选项)可以为:空位延伸罚分:0.5、空位开放罚分:10.0、Matrix:Blosum62。
可以在参考序列的全长上执行序列比较。
对应位置
本文所述的序列包括参考“在对应于另一序列的氨基酸残基位置的位置处”包括氨基酸残基的氨基酸序列。此类对应位置可以例如根据使用本文所述的序列对比方法或本领域普通技术人员已知的另一序列对比方法进行的序列对比来鉴定。
载体
根据本发明,还提供了一种载体,其包括本发明的核酸分子。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:15,或其整个长度与氨基酸序列SEQ ID NO:15具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:13,或其整个长度与氨基酸序列SEQ ID NO:13具有至少83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:27(COV_S_T2_13),或其整个长度与氨基酸序列SEQ ID NO:27具有至少88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:28(COV_S_T2_14),或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:29(COV_S_T2_15),或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:30(COV_S_T2_16),或其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:31(COV_S_T2_17),或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:32(COV_S_T2_18),或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:33。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:34,或其整个长度与氨基酸序列SEQ ID NO:34具有至少99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:42(COV_E_T2_3),或其整个长度与氨基酸序列SEQ ID NO:42具有至少99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:43(COV_E_T2_4),或其整个长度与氨基酸序列SEQ ID NO:43具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:44(COV_E_T2_5),或其整个长度与氨基酸序列SEQ ID NO:44具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:46(COV_N_T2_1),或其整个长度与氨基酸序列SEQ ID NO:46具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:47(COV_N_T2_2),或其整个长度与氨基酸序列SEQ ID NO:47具有至少92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体还包括可操作地连接到核酸的启动子。
任选地,启动子用于在哺乳动物细胞中表达由核酸编码的多肽。
任选地,启动子用于在酵母或昆虫细胞中表达由核酸编码的多肽。
任选地,本发明的载体包括编码本发明的不同多肽的超过一种核酸分子。有利地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和/或编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的不同多肽的超过一种核酸分子。有利地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和/或编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的载体包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%
或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的载体针对编码多肽的载体的每个核酸分子包括可操作地连接到该核酸分子的单独启动子。
任选地,所述启动子或每个启动子用于在哺乳动物细胞中表达由核酸分子编码的多肽。
任选地,所述启动子或每个启动子用于在酵母或昆虫细胞中表达由核酸分子编码的多肽。
任选地,载体为疫苗载体。
任选地,载体为病毒疫苗载体、细菌疫苗载体、RNA疫苗载体或DNA疫苗载体。
本发明的核酸分子可包括DNA或RNA分子。对于其中核酸分子包括RNA分子的实施方案,应当理解,所述分子可包括与SEQ ID NO:18、16或14中的任一者为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性或同一性的RNA序列或其互补序列,其中每个“T”核苷酸被“U”替代。
例如,应当理解,在提供包括本发明的核酸的RNA疫苗载体的情况下,本发明的核酸的核酸序列将是RNA序列,因此可包括例如与SEQ ID NO:18、16或14中的任一者为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性或同一性的RNA序列或其互补序列,其中每个“T”核苷酸被“U”替代。
病毒疫苗载体使用活病毒将核酸(例如,DNA或RNA)递送到人类或非人类动物细胞中。病毒中包含的核酸编码一种或多种抗原,一旦在感染的人类或非人类动物细胞中表达,所述一种或多种抗原就引发免疫应答。体液和细胞介导的免疫应答两者都可以由病毒疫苗载体诱导。病毒疫苗载体将核酸疫苗的许多优点与减毒活疫苗的许多优点相结合。与核酸疫苗一样,病毒疫苗载体将核酸携带到宿主细胞中以产生抗原蛋白,这些抗原蛋白可被定制成刺激一系列免疫应答,包括抗体、T辅助细胞(CD4+T细胞)和细胞毒性T淋巴细胞(CTL、CD8+T细胞)介导的免疫。与核酸疫苗不同,病毒疫苗载体还具有主动侵扰宿主细胞和复制的潜力,更像是减毒活疫苗,如佐剂一样进一步激活免疫系统。因此,病毒疫苗载体通常包括减毒活病毒,其被基因工程化以携带编码来自不相关生物体的蛋白抗原的核酸(例如,DNA或RNA)。尽管病毒疫苗载体通常能够产生比核酸疫苗更强的免疫应答,但是对于一些疾病,病毒载体在称为异源初免-加强的策略中与其他疫苗技术结合使用。在该系统中,作为初免步骤给出一种疫苗,之后使用另选疫苗作为加强针进行疫苗接种。异源初免-加强策略旨在提供更强的整体免疫应答。病毒疫苗载体可以用作初免和加强疫苗,作为该策略的一部分。Ura等人在2014年(Vaccines 2014,2,624-641)以及Choi和Chang在2013年(Clinicaland Experimental Vaccine Research 2013;2:97-105)回顾了病毒疫苗载体。
任选地,病毒疫苗载体基于:病毒递送载体,诸如基于痘病毒(例如,改良型安卡拉牛痘(MVA)、NYVAC、AVIPOX)、疱疹病毒(例如,HSV、CMV、任何宿主物种的腺病毒)、麻疹病毒(例如,麻疹)、甲病毒(例如,SFV、仙台)、黄病毒(例如,黄热病)或弹状病毒(例如,VSV)的病毒递送载体;细菌递送载体(例如,沙门氏菌、大肠杆菌);RNA表达载体或DNA表达载体。
任选地,核酸表达载体为核酸表达载体和病毒假型载体。
任选地,核酸表达载体为疫苗载体。
任选地,核酸表达载体在从5’到3’的方向上包括:启动子;剪接供体位点(SD);剪接受体位点(SA);和终止子信号,其中多克隆位点位于剪接受体位点与终止子信号之间。
任选地,启动子包括CMV即刻早期1增强子/启动子(CMV-IE-E/P)和/或终止子信号包括缺少KpnI限制性内切酶位点的牛生长激素基因的终止子信号(Tbgh)。
任选地,核酸表达载体还包括复制起点和编码对抗生素的抗性的核酸。任选地,复制起点包括pUC-质粒复制起点和/或核酸编码对卡那霉素的抗性。
任选地,载体为基于pEVAC的表达载体。
任选地,核酸表达载体包括核酸序列SEQ ID NO:20(pEVAC)。pEVAC载体已被证实是用于生成病毒假型以及动物和人类的直接DNA疫苗接种的高度灵活表达载体。在下面实施例8中更详细地描述了pEVAC表达载体。图3示出了pEVAC的质粒图谱。
根据本发明,还提供了一种分离的细胞,其包括本发明的载体或用其转染。
根据本发明,还提供了一种融合蛋白,其包括本发明的多肽。
药物组合物
根据本发明,还提供了一种药物组合物,其包括本发明的多肽和药学上可接受的载体、赋形剂或稀释剂。
任选地,本发明的药物组合物包括超过一种不同的本发明的多肽。
有利地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和/或本发明的设计的冠状病毒E蛋白和/或本发明的设计的冠状病毒M蛋白。
有利地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和/或本发明的设计的冠状病毒E蛋白和/或本发明的设计的冠状病毒M蛋白和/或本发明的设计的冠状病毒N蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和本发明的设计的冠状病毒E蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和本发明的设计的冠状病毒M蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和本发明的设计的冠状病毒N蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒E蛋白和本发明的设计的冠状病毒M蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒E蛋白和本发明的设计的冠状病毒N蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和本发明的设计的冠状病毒E蛋白和本发明的设计的冠状病毒M蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒S蛋白(全长、截短或RBD)和本发明的设计的冠状病毒E蛋白和本发明的设计的冠状病毒N蛋白。
任选地,本发明的药物组合物包括本发明的设计的冠状病毒E蛋白和本发明的设计的冠状病毒M蛋白和本发明的设计的冠状病毒N蛋白。
任选地,本发明的药物组合物包括:
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列;和
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列;和
本发明的多肽,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或本发明的多肽,所述本发明的多肽包括氨基酸序列SEQID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种药物组合物,其包括本发明的核酸和药学上可接受的载体、赋形剂或稀释剂。
任选地,本发明的药物组合物包括编码本发明的不同多肽的超过一种本发明的核酸分子。
有利地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和/或编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
有利地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和/或编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子和/或编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒S蛋白(全长、截短或RBD)的本发明的核酸分子和编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括编码本发明的设计的冠状病毒E蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒M蛋白的本发明的核酸分子和编码本发明的设计的冠状病毒N蛋白的本发明的核酸分子。
任选地,本发明的药物组合物包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
任选地,本发明的药物组合物包括:
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQ ID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列;和
编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列,或编码本发明的多肽的核酸分子,所述本发明的多肽包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
根据本发明,还提供了一种药物组合物,其包括本发明的载体和药学上可接受的载体、赋形剂或稀释剂。
任选地,本发明的药物组合物还包括用于在受试者中增强对组合物的一种多肽或对由组合物的一种核酸编码的一种多肽的免疫应答的佐剂。
任选地,本发明的药物组合物还包括用于在受试者中增强对组合物的多种多肽或对由组合物的多种核酸编码的多种多肽的免疫应答的佐剂。
根据本发明,还提供了一种假型病毒,其包括本发明的多肽。
治疗方法和用途
根据本发明,还提供了一种在受试者中诱导对冠状病毒的免疫应答的方法,其包括向受试者施用有效量的本发明的多肽、本发明的核酸、本发明的载体或本发明的药物组合物。
根据本发明,还提供了一种使受试者对冠状病毒免疫的方法,其包括向受试者施用有效量的本发明的多肽、本发明的核酸、本发明的载体或本发明的药物组合物。
根据本发明,还提供了本发明的多肽、本发明的核酸、本发明的载体或本发明的药物组合物作为药剂的用途。
根据本发明,还提供了本发明的多肽、本发明的核酸、本发明的载体或本发明的药物组合物在预防、治疗或改善冠状病毒感染中的用途。
根据本发明,还提供了本发明的多肽、本发明的核酸、本发明的载体或本发明的药物组合物在制造用于预防、治疗或改善冠状病毒感染的药剂中的用途。
任选地,冠状病毒是β-冠状病毒。
任选地,β-冠状病毒是谱系B或C的β-冠状病毒。
任选地,β-冠状病毒是谱系B的β-冠状病毒。
任选地,谱系B的β-冠状病毒是SARS-CoV或SARS-CoV-2。
任选地,谱系C的β-冠状病毒是MERS-CoV。
施用
可使用任何合适的施用途径。施用方法包括但不限于真皮内、肌内、腹膜内、肠胃外、静脉内、皮下、阴道、直肠、鼻内、吸入或口服。肠胃外施用诸如皮下、静脉内或肌内施用一般通过注射实现。可以常规形式作为液体溶液或混悬剂、适合在注射前溶解或混悬在液体中的固体形式或作为乳剂来制备注射剂。注射溶液和混悬剂可以由先前描述类型的无菌散剂、颗粒和片剂制备。施用可以是全身的或局部的。
组合物可以任何合适的方式施用,诸如利用药学上可接受的载体。药学上可接受的载体部分地由所施用的特定组合物以及用于施用组合物的特定方法确定。用于肠胃外施用的制剂包括无菌水性或非水性溶液、混悬剂和乳剂。非水性溶剂的示例是丙二醇、聚乙二醇、植物油(诸如,橄榄油)和可注射有机酯(诸如,油酸乙酯)。水性载体包括水、酒精/水溶液、乳剂或混悬剂,包括盐水和缓冲介质。肠胃外媒剂包括氯化钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏或固定油。静脉内媒剂包括流体和营养补充剂、电解质补充剂(诸如,基于林格氏右旋糖的那些)等。也可以存在防腐剂和其他添加剂,诸如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
这些组合物中的一些组合物可潜在地作为药学上可接受的酸或碱加成盐施用,通过与无机酸(诸如,氢氯酸、氢溴酸、高氯酸、硝酸、硫氰酸、硫酸和磷酸)和有机酸(诸如,甲酸、乙酸、丙酸、乙醇酸、乳酸、丙酮酸、草酸、缩苹果酸、琥珀酸、马来酸和富马酸)反应形成,或通过与无机碱(诸如,氢氧化钠、氢氧化铵、氢氧化钾)和有机碱(诸如,单、二、三烷基和芳基胺和取代的乙醇胺)反应形成。
施用可以通过单个或多个剂量来实现。在本公开的上下文中,向受试者施用的剂量应足以在受试者中随着时间诱导有益的治疗应答,或足以抑制或预防感染。所需剂量将因受试者而异,这取决于受试者的物种、年龄、体重和一般状况、所治疗感染的严重程度、所使用的特定组合物和其施用模式。可通过本领域普通技术人员仅使用例行实验来确定适当的剂量。
学上可接受的载体
药学上可接受的载体包括但不限于盐水、缓冲盐水、右旋糖、水、甘油、乙醇以及它们的组合。载体和组合物可以是无菌的,并且配制物适合施用模式。组合物还可包含微量润湿剂或乳化剂或pH缓冲剂。组合物可以是液体溶液、混悬液、乳剂、片剂、丸剂、胶囊、缓释配制物或散剂。组合物可以配制为栓剂,具有传统的粘结剂和载体诸如甘油三酯。口服配制物可包括标准载体,诸如药品等级的甘露糖醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素和碳酸镁。可使用任何常见的药物载体,诸如无菌盐水溶液或芝麻油。培养基还可包含常规药学附属材料,诸如药学上可接受的盐,以调节渗透压、缓冲液、防腐剂等。可与本文提供的组合物和方法一起使用的其他培养基是生理盐水和芝麻油。
在一些实施方案中,组合物包括药学上可接受的载体和/或佐剂。例如,佐剂可以是矾、弗氏完全佐剂、生物佐剂或免疫刺激寡核苷酸(诸如,CpG寡核苷酸)。
可用于本公开的药学上可接受的载体(媒剂)是常规的。《雷明顿药物科学》(Remington’s Pharmaceutical Sciences,E.W.Martin所著,Mack Publishing Co.,Easton,PA,第15版(1975))描述了适合于一种或多种治疗组合物(诸如,一种或多种流感疫苗)的药物递送的组合物和配制物,以及另外的药剂。
一般来讲,载体的性质将取决于所采用的特定施用模式。例如,肠胃外配制物通常包括可注射流体,所述可注射流体包括药学上和生理学上可接受的流体,诸如水、生理盐水、平衡盐溶液、右旋糖水溶液、甘油等作为媒剂。对于固体组合物(例如,散剂、丸剂、片剂或胶囊形式),常规的无毒固体载体可包括例如药品等级的甘露糖醇、乳糖、淀粉或硬脂酸镁。除了生物上中性载体之外,待施用的药物组合物可包含微量无毒辅助物质,诸如润湿剂或乳化剂、防腐剂和pH缓冲剂等,例如,乙酸钠或脱水山梨糖醇单月桂酸酯。
任选地,本发明的多肽、核酸或组合物进行肌内施用。
任选地,本发明的多肽、核酸或组合物通过针或基因枪或电穿孔进行肌内、皮内、皮下施用。
现在仅以举例的方式参考附图来描述本发明的实施方案,其中:
图1示出了SARS S蛋白架构;
图2示出了S蛋白(S1裂解位点周围区域)的多序列对比,比较了SARS-CoV-1分离株和密切相关的蝙蝠β冠状病毒分离株与四个SARS-CoV-2分离株;
图3示出了pEVAC DNA载体的质粒图谱;
图4示出了Wuhan_Node1_RBD(CoV_T2_7)氨基酸序列(SEQ ID NO:17),其中氨基酸残基差异以粗体和下划线从与AY274119_RBD(CoV_T2_5)(SEQ ID NO:5)和EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11)的相应对比中突出显示。以灰色突出显示示出了来自两个对比的常见差异。氨基酸插入以加框示出;
图5示出了抗体与在HEK293T细胞上表达的SARS-CoV-1或SARS-CoV-2的全长刺突蛋白结合的剂量反应曲线。以MFI(中值荧光强度)报道基于流式细胞术的细胞显示测定。在左手图中,从上至下的曲线是SARS-CoV-1、DIOS-panSCoV、SARS-CoV2;在右手图中,从上至下的曲线是DIOS-panSCoV、SARS-CoV-1、SARS-CoV2;
图6示出了冠状病毒SARS包膜蛋白序列及其显著要素;
图7示出了冠状病毒包膜蛋白序列的多序列对比,比较了NL63、229E、HKU1、MERS、SARS和SARS2的分离株的序列;
图8示出了冠状病毒膜(M)蛋白序列的多序列对比,比较了SARS2参考序列(分离株NC_045512.2)针对CoV_M_T2_1(Sarbeco_M_根)和CoV_M_T2_2(Sarbeco_M_节点88b_表位_优化)的序列;
图9示出了在用不同的全长S蛋白基因免疫小鼠后收集的小鼠血清与SARS2 RBD的结合(通过ELISA);
图10示出了在用不同的DNA疫苗免疫小鼠后收集的小鼠血清与SARS1刺突蛋白和SARS2刺突蛋白的结合(通过FACS);
图11示出了编码野生型SARS1或SARS2刺突蛋白(全长、截短或RBD)的DNA疫苗诱导对SARS1和SARS2假型的中和反应的能力–诱导SARS2假型中和抗体的唯一SARS2免疫原是编码SARS2 RBD的DNA;
图12示出了SARS1和SARS2 RBD蛋白疫苗诱导抗体对SARS2 RBD的抗体的能力;
图13示出了新RBD抗原设计;
图14示出了不同的S蛋白RBD DNA疫苗诱导对SARS2 RBD的抗体的能力–M7 DNA疫苗与野生型SARS2 RBD DNA疫苗相比诱导对SARS2RBD更强的结合应答(通过ELISA)(来自图的左手端的最上面曲线是SARS_2RBD_mut1(M7),往下的下一曲线是SARS_2RBD);
图15示出了由在用M7和野生型SARS2 RBD DNA疫苗免疫后收集的血清抑制RBD-ACE2相互作用的竞争测定结果–结果表明M7 RBD DNA疫苗与野生型RBD DNA疫苗相比引发更快的中和反应;
图16示出了由M7和野生型SARS2 RBD DNA疫苗诱导的SARS2假型中和反应:图16(a)为免疫小鼠在第2周的渗血,图16(b)为免疫小鼠在第3周的渗血,并且图16(c)为免疫小鼠在第4周的渗血–在早期阶段,M7是更中和的(来自图16(a)、(b)、(c)的左手端的最上面曲线是SARS2RBD_mut1(M7),往下的下一曲线是SARS_2RBD);
图17示出了从用野生型SARS2 RBD DNA疫苗和M7 SARS2 RBD DNA疫苗免疫的小鼠收集的血清的SARS2假型中和IC50值。图17中的点示出了各个小鼠的IC50,并且水平交叉条形图示出了基于所有小鼠以95%置信区间进行的估计;
图18示出了表达M7的细胞的上清液与其他ACE2结合病毒竞争ACE2细胞进入;
图19示出了ELISPOT测定的结果,示出了对M7 SARS2 RBD DNA疫苗的T细胞应答;
图20示出了M蛋白的图示及其显著要素;
图21示出了来源于用编码S蛋白RBD序列的pEVAC质粒转染的HEK细胞的上清液的光谱重叠(MALDI MS);
图22示出了重组RBD蛋白的光谱;
图23提供了对S蛋白的糖基化的参考;
图24示出了冠状病毒疫苗pan-Sarbecovirus疫苗覆盖率。Pan-Sarbecovirus保护:β-冠状病毒,包括威胁可能外流到人类中的SARS-CoV-2(SARS2)、-1(SARS1)和许多使用ACE2受体的蝙蝠SARSr-CoV。通过通用Sarbecovirus B细胞和T细胞抗原靶标获得的抗原覆盖率:部分1.具有SARS1和SARS2进化枝的Sarbecovirus与人类或蝙蝠宿主物种一起突出显示。部分2.机器学习预测插入片段内预测表位的MHC II类结合(越高表示结合越强)。浅灰色针对在SARS2内保守的表位,深灰色是从其他Sarbecovirus(诸如SARS1)接枝的表位;
图25示出了不同SARS-CoV-2变体的映射:
包括所有重要变体的列表:粉色=暴露突变;黑色=插入;黄色=部分掩埋或完全掩埋;紫色=处于细胞质尾;蓝色=RBD;小麦色=NTD;
图26示出了SARS-CoV-2的免疫显性和中和线性表位:
研究限于中国人群体。表达肽为VSV。
*针对G614变体
图27包含描述令人担忧的变体(英国、南非和巴西)中的突变的表,以及使免疫显性表位着青色并且突变以红色示出的结构图。RBD–蓝色;NTD–小麦色;
图28解释了根据本发明的实施方案的超级刺突蛋白的嵌合设计;
图29示出了突变在刺突蛋白的结构图像上的位置;
图30示出了从文献获取的数据,示出了最大限度的当前变体在RBM区域中具有突变,并且RBD中的其他表位是保守的并且针对它们的抗体会交叉反应;加框的是RBM。图D–顶部是熵的分布。扩散越低,在表示的sarbecovirus中更好地保守。靶向该区域的所有抗体均表现出交叉中和(白色框)。黑色或灰色框指示无中和;
图31和图32示出了使用结构信息来鉴定表位,并将其包括在本发明的S蛋白的设计中,并通过糖基化来转移免疫应答。在图32中,N1–系统发育的优化设计(CoV_S_T2_13);
图33总结了根据本发明的实施方案的设计;
图34总结了针对根据本发明的实施方案的设计获得的数据;
图35计算机模拟了根据本发明的实施方案的疫苗的设计:
A.使用刺突蛋白的受体结合结构域(RBD)的蛋白序列为sarbecovirus生成的系统发育树。使用IQ-Tree来生成树。人类病毒以绿色表示,果子狸病毒以粉红色表示,并且蝙蝠病毒以深灰色表示。
B.抗体-RBD复合物的结构模型。抗体表示为卡通,并且着色为绿色和橙色,并且RBD表示为卡通和表面并且着色为粉色。不同的表位区域标记为A、B和C。
C.SARS-1和SARS-2的序列对比。仅示出了非保守氨基酸。表位C以黑色加框。
图36(A)示出了来自用实施例32的疫苗设计(COV_S_T2_13–20)免疫的小鼠的血清的蛋白质印记。图36(B)示出了细胞表面表达渗血2的抗体结合应答。
图37中和数据:
A.疫苗设计(COV_S_T2_13–18)的序列对比。表位突出显示为着色块。设计之间不同的氨基酸残基以黑色加框。
B.疫苗设计、SARS-1RBD和SARS-2RBD针对SARS1假型(上部分图)和SARS2假型(下部分图)的中和曲线。X轴表示血清的稀释度,并且Y轴表示观察到的中和的百分比。图中的每条曲线表示单个小鼠。
图38表示COV_S_T2_17(SEQ ID NO:31)的剂量发现研究的研究方案,
图39示出了ELISA确定对SARS-CoV-2和SARS的RBD的抗体水平的结果。分图A(左)板涂覆有SARS-CoV-2RBD。分图B(右)板涂覆有SARS RBD;
图40示出了1次免疫后第28天的病毒中和(假型微中和或pMN测定)。分图A(左)1剂量后28天SARS-CoV-2的抗体中和。分图B(右)1剂量后28天SARS的抗体中和。
图41示出了(对于第1、2和3组)第一次到第二次免疫后病毒中和反应的比较。分图A(左SARS-CoV-2)比较第二次免疫(加强)的渗血2(前)和3(后)。分图B(右SARS)比较第二次免疫(加强)的渗血2(前)和3(后)。
图42示出了(对于第4、5和6组)第一次到第二次免疫后病毒中和反应的比较。分图A(左SARS-CoV-2)比较第二次免疫(加强)的渗血2(前)和3(后)。分图B(右SARS)比较第二次免疫(加强)的渗血2(前)和3(后);并且
图43示出了令人担忧的变体的中和(B1.351(SA)和B1.248(P1BZ)利用T2_17优于利用T2_8)。
我们已经开发了防止冠状病毒(诸如,SARS-CoV-2和SARS-CoV-1)的疫苗,这些冠状病毒有可能导致来自人畜共患储池的未来爆发。我们已经设计了抗原以诱导针对Sarbecovirus(即,β-冠状病毒,谱系B)的免疫应答,以便防止相关冠状病毒的当前大流行和未来爆发。
冠状病毒疫苗的主要担忧是疾病增强(Tseng等人,(2012)“Immunization withSARS Coronavirus Vaccines Leads to Pulmonary Immunopathology on Challengewith the SARS Virus”。PLoS ONE 7(4):e35421)。我们已经修饰了我们的抗原以避免抗体依赖增强作用(ADE)(或ADE样促炎反应)和补体途径的过度激活。
将编码抗原的DNA序列优化用于在插入DNA质粒表达载体(诸如,pEVAC)中之前在哺乳动物细胞中表达。pEVAC载体是灵活的疫苗平台,并且可插入任何抗原组合以产生不同的疫苗。在SARS-1临床试验中使用先前的版本(Martin等人,Vaccine 2008 25:633)。该平台是临床证实的和GMP兼容的,允许快速扩大。DNA疫苗可以使用无痛的无针技术来施用,使患者细胞产生抗原,这些抗原被免疫系统识别以诱导针对SARS-CoV-2和相关冠状病毒的未来爆发的持久防护。
虽然高亲和力单克隆抗体能够保护动物免于SARS病毒感染(Traggiai等人,“Anefficient method to make human monoclonal antibodies from memory B cells:potent neutralization of SARS coronavirus”.Nat Med 10,871–875(2004)),但是人类早期感染中的稳健抗体应答与COVID-19疾病恶化相关联(Zhao等人,medRxiv:https://doi.org/10.1101/2020.03.02.20030189)。重要的是,在灵长类动物从感染中恢复并再次感染SARS后,尽管病毒复制有限,但在二次暴露时肺部病理变得更加严重(Clay等人,“Primary Severe Acute Respiratory Syndrome Coronavirus Infection LimitsReplication but Not Lung Inflammation upon Homologous Rechallenge”,JVirol.2012年4月;86(8):4234–4244)。越来越多的证据表明,由于疫苗接种后感染,疫苗诱导的抗体依赖增强作用(ADE)会产生不利影响(Peeples,Avoiding pitfalls in thepursuit of a COVID-19vaccine,PNAS 4月14,2020 117(15)8218-8221)。针对S蛋白的非中和抗体可经由Fc受体介导的摄取实现另选的感染途径(Wan等人,Journal ofVirology.2020,94(5):1-13)。这些报道和其他报道强调了区分诱导保护性抗病毒作用的病毒抗原结构与触发促炎反应的病毒抗原结构的重要性。因此,仔细选择和修饰疫苗抗原和诱导保护性抗病毒作用的疫苗载体类型而不增强肺部病理学是首要的。
本文描述的疫苗序列提供了对ADE(或ADE样促炎反应)的安全性,并且还增加了可扩展到代表未来大流行威胁的SARS-CoV-2、SARS和相关的蝙蝠Sarbecovirus冠状病毒的免疫应答的广度。
由本文描述的疫苗序列编码的抗原具有精确免疫原性,缺乏ADE位点,并且灵活且与大量疫苗载体技术兼容。DNA分子可通过在其他病毒和癌症的高级临床试验中证明具有免疫原性的PharmaJet无针递送装置递送,或通过其他DNA递送诸如电穿孔或直接注射来递送。另选地,可以将疫苗插入片段方便地交换到其他病毒载体或RNA递送平台,其可以容易地缩放以实现更大的容量产生或诱导具有不同特性的免疫应答。
我们已经设计了冠状病毒抗原以诱导高度特异性免疫应答,其不仅避免了病毒诱导的有害免疫应答,而且将提供针对SARS-CoV-2、SARS-1和其他人畜共患Sarbeco-冠状病毒的更广泛防护。通过使用多种抗原的文库,我们能够通过针对多个目标募集B和T细胞应答来向下选择每个类别(例如,RBD、E和M蛋白)的最佳抗原结构并且将类别中的最佳选项组合以最大化对冠状病毒的防护广度。
SEQ ID NO表
实施例1-疫苗序列
CoV S蛋白是病毒颗粒进入宿主细胞所必需的三聚体跨膜糖蛋白。S蛋白包括两个结构域:负责ACE-2受体结合的S1结构域,和负责病毒和细胞膜的融合的S2结构域。S蛋白是免疫的主要靶标。然而,证据已表明,SARS-CoV感染(特别是S蛋白)的抗体依赖增强作用(ADE)导致感染增强和免疫逃避和/或导致促炎反应。S蛋白包含由抗体结合的非中和表位。由于免疫系统无法中和病原体,这种免疫转移导致增强的疾病恶化。ADE还可增加病原体对宿主细胞的感染性。在SARS-CoV的初始感染之后产生的中和抗体可能对经不同的SARS-CoV菌株的第二次感染是非中和的。
SARS-CoV与SARS-CoV-2之间的高遗传相似性意味着将S1和S2结构域以及RBD的边界映射到新型设计支架上是可能的。申请人已经生成了针对S蛋白的新型序列,称为CoV_T2_1(也称为Wuhan-Node-1),其包括改善其免疫原性以及移除或掩蔽负责ADE(或ADE样促炎反应)的表位的修饰。
本实施例提供了针对以下的全长S蛋白、截短S蛋白(tr、缺失S2序列的C末端部分)和受体结合结构域(RBD)的氨基酸和核酸序列:
·SARS-TOR2分离株AY274119;
·SARS_CoV_2分离株-hCov-19/武汉/LVDC-HB-01/2019(EPI_ISL_402119);和
·本发明的实施方案,称作“CoV_T2_1”(或“Wuhan_Node1”)。
CoV_T2_1(Wuhan_Node1)序列包括提供诱导广泛中和免疫应答以防止由CoV导致的疾病的修饰,尤其是β-CoV,诸如SARS-CoV和SARS-CoV-2。这些疫苗还缺少可能由ADE(或ADE样促炎反应)导致病毒免疫逃避和疾病恶化的非中和表位。
在该实施例中提供了以下氨基酸和核酸序列:
SARS-TOR2分离株AY274119
>AY274119(CoV_T1_1):
全长S蛋白(SEQ ID NO:1)和编码全长S蛋白的核酸(SEQ ID NO:2)
>AY274119_tr(CoV_T2_2):
截短S蛋白(SEQ ID NO:3)和编码截短S蛋白的核酸(SEQ ID NO:4)
>AY274119_RBD(CoV_T2_5):
RBD(SEQ ID NO:5)和编码RBD的核酸(SEQ ID NO:6)
SARS_CoV_2分离株-hCov-19/武汉/LVDC-HB-01/2019(EPI_ISL_402119):
>EPI_ISL_402119(CoV_T1_2):
全长S蛋白(SEQ ID NO:7)和编码全长S蛋白的核酸(SEQ ID NO:8)
>EPI_ISL_402119_tr(CoV_T2_3):
截短S蛋白(SEQ ID NO:9)和编码截短S蛋白的核酸(SEQ ID NO:10)
>EPI_ISL_402119_RBD(CoV_T2_6):
RBD(SEQ ID NO:11)和编码RBD的核酸(SEQ ID NO:12)
根据本发明的实施方案的序列:CoV_T2_1(Wuhan_Node1)、CoV_T2_4(Wuhan_ Node1_tr)或CoV_T2_7(Wuhan_Node1_RBD):
>Wuhan_Node1(CoV_T2_1):
全长S蛋白(SEQ ID NO:13)和编码全长S蛋白的核酸(SEQ ID NO:14)
>Wuhan_Node1_tr(CoV_T2_4):
截短S蛋白(SEQ ID NO:15)和编码截短S蛋白的核酸(SEQ ID NO:16)
>Wuhan_Node1_RBD(CoV_T2_7):
RBD(SEQ ID NO:17)和编码RBD的核酸(SEQ ID NO:18)
>AY274119(CoV_T1_1)(SEQ ID NO:1)
氨基酸序列:
MFIFLLFLTLTSGSDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYLTQDLFLPFYSNVTGFHTINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLPSGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTTFMLKYDENGTITDAVDCSQNPLAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTDLIKNQCVNFNFNGLTGTGVLTPSSKRFQPFQQFGRDVSDFTDSVRDPKTSEILDISPCAFGGVSVITPGTNASSEVAVLYQDVNCTDVSTAIHADQLTPAWRIYSTGNNVFQTQAGCLIGAEHVDTSYECDIPIGAGICASYHTVSLLRSTSQKSIVAYTMSLGADSSIAYSNNTIAIPTNFSISITTEVMPVSMAKTSVDCNMYICGDSTECANLLLQYGSFCTQLNRALSGIAAEQDRNTREVFAQVKQMYKTPTLKYFGGFNFSQILPDPLKPTKRSFIEDLLFNKVTLADAGFMKQYGECLGDINARDLICAQKFNGLTVLPPLLTDDMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVFNGTSWFITQRNFFSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYVWLGFIAGLIAIVMVTILLCCMTSCCSCLKGACSCGSCCKFDEDDSEPVLKGVKLHYT
>AY274119(CoV_T1_1)(SEQ ID NO:2)
核酸序列:
atgtttatctttctgctgtttctgaccctgaccagcggcagcgacctggatagatgcaccaccttcgacgatgtgcaggcccctaactacacccagcacaccagctctatgcggggcgtgtactaccccgacgagattttcagaagcgacaccctgtatctgacccaggacctgttcctgcctttctacagcaacgtgaccggcttccacaccatcaaccacaccttcggcaaccctgtgatccccttcaaggacggcatctactttgccgccaccgagaagtccaacgtcgtcagaggatgggtgttcggcagcaccatgaacaacaagagccagagcgtgatcatcatcaacaacagcaccaacgtggtcatccgggcctgcaacttcgagctgtgcgacaacccattcttcgccgtgtccaagcctatgggcacccagacacacaccatgatcttcgacaacgccttcaactgcaccttcgagtacatcagcgacgccttcagcctggacgtgtccgaaaagagcggcaacttcaagcacctgagggaattcgtgttcaagaacaaggatggcttcctgtacgtgtacaagggctaccagcctatcgacgtcgtgcgggatctgcccagcggcttcaataccctgaagcctatcttcaagctgcccctgggcatcaacatcaccaacttcagagccatcctgaccgctttcagccccgctcaggatatctggggaacaagcgccgctgcctacttcgtgggctacctgaagccaaccaccttcatgctgaagtacgacgagaacggcaccatcaccgacgccgtggactgtagccaaaatcctctggccgagctgaagtgcagcgtgaagtccttcgagatcgacaagggcatctaccagaccagcaatttcagagtggtgccctccggggatgtcgtgcggttccccaacatcacaaatctgtgccccttcggcgaggtgttcaacgccaccaagtttccctctgtgtacgcctgggagcgcaaaaagatcagcaactgcgtggccgactacagcgtgctgtacaactccaccttcttcagcaccttcaagtgctacggcgtgtccgccacaaagctgaacgacctgtgcttctccaacgtgtacgccgacagcttcgtggtcaaaggcgacgacgttcggcagattgcccctggacaaacaggcgtgatcgccgattacaactacaagctgcctgacgacttcatgggctgcgtgctggcctggaacaccagaaacatcgatgccacctccaccggcaactacaattacaagtacagatacctgcggcacggcaagctgcggcctttcgagagggatatcagcaatgtgccttttagccccgacggcaagccctgcacacctcctgctctgaattgctactggcccctgaacgactacggcttttacaccaccacaggcatcggctatcagccctatagagtggtggtcctgtcctttgagctgctgaatgcccctgccacagtgtgcggacctaagctgtctaccgacctgatcaagaaccagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtgctgacaccaagcagcaagagattccagcctttccagcagttcggccgggatgtgtccgacttcacagacagcgtcagagatcccaagaccagcgagatcctggacatcagcccttgtgcctttggcggagtgtccgtgatcacccctggcacaaatgcctctagcgaagtggccgtgctgtatcaggacgtgaactgcaccgatgtgtccaccgccattcacgccgatcagctgactcccgcttggcggatctatagcacaggcaacaacgtgttccagacacaagccggctgtctgatcggagccgagcatgtggataccagctacgagtgcgacatccctatcggcgctggcatctgtgcctcttaccacaccgtgtctctgctgcggagcaccagccagaaatccatcgtggcctacaccatgagcctgggcgccgattcttctatcgcctactccaacaacacaatcgctatccccaccaatttcagcatctccatcaccaccgaagtgatgcccgtgtccatggccaagacctccgtggattgcaacatgtacatctgcggcgacagcaccgagtgcgccaatctgctgctccagtacggcagcttctgcacccagctgaatagagccctgtctggaattgccgccgagcaggacagaaacaccagagaagtgttcgcccaagtgaagcagatgtataagaccccgacactcaagtacttcggcgggttcaacttctcccagatcctgcctgatcctctgaagcccaccaagcggagcttcatcgaggacctgctgttcaacaaagtgaccctggccgacgccggctttatgaagcagtatggcgagtgcctgggcgacatcaacgccagggatctgatttgcgcccagaagtttaacggactgaccgtgctgcctcctctgctgaccgatgatatgatcgccgcctacacagccgctctggtgtctggtacagctaccgccggatggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccggttcaacggcatcggagtgacccagaatgtgctgtacgagaatcagaagcagatcgccaatcagttcaacaaggccatcagccagatccaagagagcctgaccaccacaagcacagccctgggaaagctccaggacgtggtcaaccagaatgctcaggccctgaacaccctggtcaagcagctgagcagcaacttcggcgccatcagctccgtgctgaatgacatcctgagccggctggacaaggtggaagcagaggtgcagatcgaccggctgatcacaggcagactccagagcctccagacctacgtgacacagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaaaatgagcgagtgtgtcctgggccagagcaagagagtggacttttgcggcaagggctatcacctgatgagcttcccacaggccgctcctcatggcgtggtctttctgcacgtgacatacgtgcccagccaagagagaaacttcaccaccgctccagccatctgccacgagggcaaagcctactttcccagagaaggcgtgttcgtgtttaacggcacctcctggtttatcacccagcggaatttcttcagcccgcaaatcatcaccacagacaacaccttcgtgtccggcaactgtgacgtcgtgatcggcatcattaacaataccgtgtacgaccctctccagcctgagctggacagcttcaaagaggaactggataagtacttcaagaatcacacgagccccgatgtggacctgggcgatatctctggcatcaatgccagcgtcgtgaacatccagaaagagattgacaggctgaacgaggtggccaagaacctgaacgagtccctgatcgacctgcaagagctggggaagtacgagcagtacatcaagtggccttggtacgtgtggctgggctttatcgccggactgatcgccatcgtgatggtcaccatcctgctgtgctgcatgaccagctgttgcagctgtctgaagggcgcctgtagctgtggctcctgctgcaagttcgatgaggacgactctgagccagtgctgaaaggcgtgaagctgcactacacc
>AY274119_tr(CoV_T2_2)(SEQ ID NO:3)
氨基酸序列:
MFIFLLFLTLTSGSDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYLTQDLFLPFYSNVTGFHTINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLPSGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTTFMLKYDENGTITDAVDCSQNPLAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTDLIKNQCVNFNFNGLTGTGVLTPSSKRFQPFQQFGRDVSDFTDSVRDPKTSEILDISPCAFGGVSVITPGTNASSEVAVLYQDVNCTDVSTAIHADQLTPAWRIYSTGNNVFQTQAGCLIGAEHVDTSYECDIPIGAGICASYHTVSLLRSTSQKSIVAYTMSLGADSSIAYSNNTIAIPTNFSISITTEVMPVSMAKTSVDCNMYICGDSTECANLLLQYGSFCTQLNRALSGIAAEQDRNTREVFAQVKQMYKTPTLKYFGGFNFSQILPDPLKPTKRSFIEDLLFNKVTLADAGFMKQYGECLGDINARDLICAQKFNGLTVLPPLLTDDMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVFNGTSWFITQRNFFSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDIS
>AY274119_tr(CoV_T2_2)(SEQ ID NO:4)
核酸序列:
atgtttatctttctgctgtttctgaccctgaccagcggcagcgacctggatagatgcaccaccttcgacgatgtgcaggcccctaactacacccagcacaccagctctatgcggggcgtgtactaccccgacgagattttcagaagcgacaccctgtatctgacccaggacctgttcctgcctttctacagcaacgtgaccggcttccacaccatcaaccacaccttcggcaaccctgtgatccccttcaaggacggcatctactttgccgccaccgagaagtccaacgtcgtcagaggatgggtgttcggcagcaccatgaacaacaagagccagagcgtgatcatcatcaacaacagcaccaacgtggtcatccgggcctgcaacttcgagctgtgcgacaacccattcttcgccgtgtccaagcctatgggcacccagacacacaccatgatcttcgacaacgccttcaactgcaccttcgagtacatcagcgacgccttcagcctggacgtgtccgaaaagagcggcaacttcaagcacctgagggaattcgtgttcaagaacaaggatggcttcctgtacgtgtacaagggctaccagcctatcgacgtcgtgcgggatctgcccagcggcttcaataccctgaagcctatcttcaagctgcccctgggcatcaacatcaccaacttcagagccatcctgaccgctttcagccccgctcaggatatctggggaacaagcgccgctgcctacttcgtgggctacctgaagccaaccaccttcatgctgaagtacgacgagaacggcaccatcaccgacgccgtggactgtagccaaaatcctctggccgagctgaagtgcagcgtgaagtccttcgagatcgacaagggcatctaccagaccagcaatttcagagtggtgccctccggggatgtcgtgcggttccccaacatcacaaatctgtgccccttcggcgaggtgttcaacgccaccaagtttccctctgtgtacgcctgggagcgcaaaaagatcagcaactgcgtggccgactacagcgtgctgtacaactccaccttcttcagcaccttcaagtgctacggcgtgtccgccacaaagctgaacgacctgtgcttctccaacgtgtacgccgacagcttcgtggtcaaaggcgacgacgttcggcagattgcccctggacaaacaggcgtgatcgccgattacaactacaagctgcctgacgacttcatgggctgcgtgctggcctggaacaccagaaacatcgatgccacctccaccggcaactacaattacaagtacagatacctgcggcacggcaagctgcggcctttcgagagggatatcagcaatgtgccttttagccccgacggcaagccctgcacacctcctgctctgaattgctactggcccctgaacgactacggcttttacaccaccacaggcatcggctatcagccctatagagtggtggtcctgtcctttgagctgctgaatgcccctgccacagtgtgcggacctaagctgtctaccgacctgatcaagaaccagtgcgtgaacttcaacttcaacggcctgaccggcaccggcgtgctgacaccaagcagcaagagattccagcctttccagcagttcggccgggatgtgtccgacttcacagacagcgtcagagatcccaagaccagcgagatcctggacatcagcccttgtgcctttggcggagtgtccgtgatcacccctggcacaaatgcctctagcgaagtggccgtgctgtatcaggacgtgaactgcaccgatgtgtccaccgccattcacgccgatcagctgactcccgcttggcggatctatagcacaggcaacaacgtgttccagacacaagccggctgtctgatcggagccgagcatgtggataccagctacgagtgcgacatccctatcggcgctggcatctgtgcctcttaccacaccgtgtctctgctgcggagcaccagccagaaatccatcgtggcctacaccatgagcctgggcgccgattcttctatcgcctactccaacaacacaatcgctatccccaccaatttcagcatctccatcaccaccgaagtgatgcccgtgtccatggccaagacctccgtggattgcaacatgtacatctgcggcgacagcaccgagtgcgccaatctgctgctccagtacggcagcttctgcacccagctgaatagagccctgtctggaattgccgccgagcaggacagaaacaccagagaagtgttcgcccaagtgaagcagatgtataagaccccgacactcaagtacttcggcgggttcaacttctcccagatcctgcctgatcctctgaagcccaccaagcggagcttcatcgaggacctgctgttcaacaaagtgaccctggccgacgccggctttatgaagcagtatggcgagtgcctgggcgacatcaacgccagggatctgatttgcgcccagaagtttaacggactgaccgtgctgcctcctctgctgaccgatgatatgatcgccgcctacacagccgctctggtgtctggtacagctaccgccggatggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccggttcaacggcatcggagtgacccagaatgtgctgtacgagaatcagaagcagatcgccaatcagttcaacaaggccatcagccagatccaagagagcctgaccaccacaagcacagccctgggaaagctccaggacgtggtcaaccagaatgctcaggccctgaacaccctggtcaagcagctgagcagcaacttcggcgccatcagctccgtgctgaatgacatcctgagccggctggacaaggtggaagcagaggtgcagatcgaccggctgatcacaggcagactccagagcctccagacctacgtgacacagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaaaatgagcgagtgtgtcctgggccagagcaagagagtggacttttgcggcaagggctatcacctgatgagcttcccacaggccgctcctcatggcgtggtctttctgcacgtgacatacgtgcccagccaagagagaaacttcaccaccgctccagccatctgccacgagggcaaagcctactttcccagagaaggcgtgttcgtgtttaacggcacctcctggtttatcacccagcggaatttcttcagcccgcaaatcatcaccacagacaacaccttcgtgtccggcaactgtgacgtcgtgatcggcatcattaacaataccgtgtacgaccctctccagcctgagctggacagcttcaaagaggaactggataagtacttcaagaatcacacgagccccgatgtggacctgggcgatatctct
>AY274119_RBD(CoV_T2_5)(SEQ ID NO:5)
氨基酸序列:
RVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTD
>AY274119_RBD(CoV_T2_5)(SEQ ID NO:6)
核酸序列:
agagtggtgccctccggggatgtcgtgcggttccccaacatcacaaatctgtgccccttcggcgaggtgttcaacgccaccaagtttccctctgtgtacgcctgggagcgcaaaaagatcagcaactgcgtggccgactacagcgtgctgtacaactccaccttcttcagcaccttcaagtgctacggcgtgtccgccacaaagctgaacgacctgtgcttctccaacgtgtacgccgacagcttcgtggtcaaaggcgacgacgttcggcagattgcccctggacaaacaggcgtgatcgccgattacaactacaagctgcctgacgacttcatgggctgcgtgctggcctggaacaccagaaacatcgatgccacctccaccggcaactacaattacaagtacagatacctgcggcacggcaagctgcggcctttcgagagggatatcagcaatgtgccttttagccccgacggcaagccctgcacacctcctgctctgaattgctactggcccctgaacgactacggcttttacaccaccacaggcatcggctatcagccctatagagtggtggtcctgtcctttgagctgctgaatgcccctgccacagtgtgcggacctaagctgtctaccgac
AY274119(全长S蛋白氨基酸序列,其中RBD残基以粗体示出,并且截短S蛋白中不 存在的残基以下划线示出)
>EPI_ISL_402119(CoV_T1_2)(SEQ ID NO:7)
氨基酸序列:
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT
>EPI_ISL_402119(CoV_T1_2)(SEQ ID NO:8)
核酸序列:
atgttcgtgtttctggtgctgctgcctctggtgtccagccagtgtgtgaacctgaccaccagaacacagctgcctccagcctacaccaacagctttaccagaggcgtgtactaccccgacaaggtgttcagatccagcgtgctgcactctacccaggacctgttcctgcctttcttcagcaacgtgacctggttccacgccatccacgtgtccggcaccaatggcaccaagagattcgacaaccccgtgctgcccttcaacgacggggtgtactttgccagcaccgagaagtccaacatcatcagaggctggatcttcggcaccacactggacagcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtcatcaaagtgtgcgagttccagttctgcaacgaccccttcctgggcgtctactaccacaagaacaacaagagctggatggaaagcgagttccgggtgtacagcagcgccaacaactgcaccttcgagtacgtgtcccagcctttcctgatggacctggaaggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctacttcaaaatctacagcaagcacacccctatcaacctcgtgcgggatctgcctcagggcttctctgctctggaacccctggtggatctgcccatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacctggcgatagcagcagcggatggacagctggtgccgccgcttactacgtgggatacctccagccaagaaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggattgtgctctggaccctctgagcgagacaaagtgcaccctgaagtccttcaccgtggaaaagggcatctaccagaccagcaacttccgggtgcagcccaccgaatccatcgtgcggttccccaatatcaccaatctgtgccccttcggcgaggtgttcaatgccaccagattcgcctctgtgtacgcctggaaccggaagcggatcagcaattgcgtggccgactactccgtgctgtacaactccgccagcttcagcaccttcaagtgctacggcgtgtcccctaccaagctgaacgacctgtgcttcacaaacgtgtacgccgacagcttcgtgatccggggagatgaagtgcggcagattgcccctggacagacaggcaagatcgccgactacaactacaagctgcccgacgacttcaccggctgtgtgattgcctggaacagcaacaacctggactccaaagtcggcggcaactacaattacctgtaccggctgttccggaagtccaatctgaagcccttcgagcgggacatcagcaccgaaatctatcaggccggcagcaccccttgcaacggcgtggaaggcttcaactgctacttcccactgcaaagctacggctttcagcccacaaatggcgtgggctaccagccttacagagtggtggtgctgagcttcgagctgctgcatgctcctgccacagtgtgcggccctaagaaatccaccaatctcgtgaagaacaaatgcgtgaacttcaacttcaacggcctgaccggcaccggcgtgctgacagagagcaacaagaagttcctgccattccagcagttcggccgggatatcgccgataccacagatgccgtcagagatccccagacactggaaatcctggacatcaccccatgcagcttcggcggagtgtctgtgatcacccctggcaccaacaccagcaatcaggtggcagtgctgtaccaggacgtgaactgtaccgaagtgcccgtggccattcacgccgatcagctgacacctacatggcgggtgtactccaccggcagcaatgtgtttcagaccagagccggctgtctgatcggagccgagcacgtgaacaatagctacgagtgcgacatccccatcggcgctggcatctgcgcctcttaccagacacagacaaacagccccagacgggctagaagcgtggccagccagagcatcattgcctacacaatgtctctgggcgccgagaacagcgtggcctactccaacaactctatcgctatccccaccaacttcaccatcagcgtgaccaccgagatcctgcctgtgtccatgaccaagaccagcgtggactgcaccatgtacatctgcggcgattccaccgagtgctccaacctgctgctccagtacggcagcttctgcacccagctgaatagagccctgacagggatcgccgtggaacaggacaagaacacccaagaggtgttcgcccaagtgaagcaaatctacaagacccctcctatcaaggacttcggcggcttcaatttcagccagattctgcccgatcctagcaagcccagcaagcggagcttcatcgaggacctgctgttcaacaaagtgacactggccgacgccggcttcatcaagcagtacggcgattgtctgggcgacattgccgccagggatctgatttgcgcccagaagtttaacggactgacagtgctgcctcctctgctgaccgatgagatgatcgcccagtacacatctgccctgctggccggcacaatcacaagcggctggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccggttcaacggcatcggagtgacccagaatgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagcacagcaagcgccctgggaaagctccaggacgtcgtgaaccagaatgcccaggcactgaacaccctggtcaagcagctgtcctccaacttcggcgccatcagctctgtgctgaacgatatcctgagcagactggacaaggtggaagccgaggtgcagatcgacagactgatcaccggcagactccagtctctccagacctacgtgacccagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagagcaagagagtggacttttgcggcaagggctaccacctgatgagcttccctcagtctgcccctcacggcgtggtgtttctgcacgtgacatacgtgcccgctcaagagaagaatttcaccaccgctccagccatctgccacgacggcaaagcccactttcctagagaaggcgtgttcgtgtccaacggcacccattggttcgtgacacagcggaacttctacgagccccagatcatcaccaccgacaacaccttcgtgtctggcaactgcgacgttgtgatcggcattgtgaacaataccgtgtacgaccctctccagcctgaactggactccttcaaagaggaactcgacaagtactttaagaaccacacaagccccgacgtggacctgggcgatatcagcggaatcaatgccagcgtggtcaacatccagaaagagatcgaccggctgaacgaggtggccaagaatctgaacgagagcctgatcgacctgcaagaactggggaagtacgagcagtacatcaagtggccctggtacatctggctgggctttatcgccggactgattgccatcgtgatggtcacaatcatgctgtgttgcatgaccagctgctgtagctgcctgaagggctgttgtagctgtggctcctgctgcaagttcgacgaggacgattctgagcccgtgctgaagggcgtgaaactgcactacacc
>EPI_ISL_402119_tr(CoV_T2_3)(SEQ ID NO:9)
氨基酸序列:
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDIS
>EPI_ISL_402119_tr(CoV_T2_3)(SEQ ID NO:10)
核酸序列:
atgttcgtgtttctggtgctgctgcctctggtgtccagccagtgtgtgaacctgaccaccagaacacagctgcctccagcctacaccaacagctttaccagaggcgtgtactaccccgacaaggtgttcagatccagcgtgctgcactctacccaggacctgttcctgcctttcttcagcaacgtgacctggttccacgccatccacgtgtccggcaccaatggcaccaagagattcgacaaccccgtgctgcccttcaacgacggggtgtactttgccagcaccgagaagtccaacatcatcagaggctggatcttcggcaccacactggacagcaagacccagagcctgctgatcgtgaacaacgccaccaacgtggtcatcaaagtgtgcgagttccagttctgcaacgaccccttcctgggcgtctactaccacaagaacaacaagagctggatggaaagcgagttccgggtgtacagcagcgccaacaactgcaccttcgagtacgtgtcccagcctttcctgatggacctggaaggcaagcagggcaacttcaagaacctgcgcgagttcgtgttcaagaacatcgacggctacttcaaaatctacagcaagcacacccctatcaacctcgtgcgggatctgcctcagggcttctctgctctggaacccctggtggatctgcccatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacctggcgatagcagcagcggatggacagctggtgccgccgcttactacgtgggatacctccagccaagaaccttcctgctgaagtacaacgagaacggcaccatcaccgacgccgtggattgtgctctggaccctctgagcgagacaaagtgcaccctgaagtccttcaccgtggaaaagggcatctaccagaccagcaacttccgggtgcagcccaccgaatccatcgtgcggttccccaatatcaccaatctgtgccccttcggcgaggtgttcaatgccaccagattcgcctctgtgtacgcctggaaccggaagcggatcagcaattgcgtggccgactactccgtgctgtacaactccgccagcttcagcaccttcaagtgctacggcgtgtcccctaccaagctgaacgacctgtgcttcacaaacgtgtacgccgacagcttcgtgatccggggagatgaagtgcggcagattgcccctggacagacaggcaagatcgccgactacaactacaagctgcccgacgacttcaccggctgtgtgattgcctggaacagcaacaacctggactccaaagtcggcggcaactacaattacctgtaccggctgttccggaagtccaatctgaagcccttcgagcgggacatcagcaccgaaatctatcaggccggcagcaccccttgcaacggcgtggaaggcttcaactgctacttcccactgcaaagctacggctttcagcccacaaatggcgtgggctaccagccttacagagtggtggtgctgagcttcgagctgctgcatgctcctgccacagtgtgcggccctaagaaatccaccaatctcgtgaagaacaaatgcgtgaacttcaacttcaacggcctgaccggcaccggcgtgctgacagagagcaacaagaagttcctgccattccagcagttcggccgggatatcgccgataccacagatgccgtcagagatccccagacactggaaatcctggacatcaccccatgcagcttcggcggagtgtctgtgatcacccctggcaccaacaccagcaatcaggtggcagtgctgtaccaggacgtgaactgtaccgaagtgcccgtggccattcacgccgatcagctgacacctacatggcgggtgtactccaccggcagcaatgtgtttcagaccagagccggctgtctgatcggagccgagcacgtgaacaatagctacgagtgcgacatccccatcggcgctggcatctgcgcctcttaccagacacagacaaacagccccagacgggctagaagcgtggccagccagagcatcattgcctacacaatgtctctgggcgccgagaacagcgtggcctactccaacaactctatcgctatccccaccaacttcaccatcagcgtgaccaccgagatcctgcctgtgtccatgaccaagaccagcgtggactgcaccatgtacatctgcggcgattccaccgagtgctccaacctgctgctccagtacggcagcttctgcacccagctgaatagagccctgacagggatcgccgtggaacaggacaagaacacccaagaggtgttcgcccaagtgaagcaaatctacaagacccctcctatcaaggacttcggcggcttcaatttcagccagattctgcccgatcctagcaagcccagcaagcggagcttcatcgaggacctgctgttcaacaaagtgacactggccgacgccggcttcatcaagcagtacggcgattgtctgggcgacattgccgccagggatctgatttgcgcccagaagtttaacggactgacagtgctgcctcctctgctgaccgatgagatgatcgcccagtacacatctgccctgctggccggcacaatcacaagcggctggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccggttcaacggcatcggagtgacccagaatgtgctgtacgagaaccagaagctgatcgccaaccagttcaacagcgccatcggcaagatccaggacagcctgagcagcacagcaagcgccctgggaaagctccaggacgtcgtgaaccagaatgcccaggcactgaacaccctggtcaagcagctgtcctccaacttcggcgccatcagctctgtgctgaacgatatcctgagcagactggacaaggtggaagccgaggtgcagatcgacagactgatcaccggcagactccagtctctccagacctacgtgacccagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagagcaagagagtggacttttgcggcaagggctaccacctgatgagcttccctcagtctgcccctcacggcgtggtgtttctgcacgtgacatacgtgcccgctcaagagaagaatttcaccaccgctccagccatctgccacgacggcaaagcccactttcctagagaaggcgtgttcgtgtccaacggcacccattggttcgtgacacagcggaacttctacgagccccagatcatcaccaccgacaacaccttcgtgtctggcaactgcgacgttgtgatcggcattgtgaacaataccgtgtacgaccctctccagcctgaactggactccttcaaagaggaactcgacaagtactttaagaaccacacaagccccgacgtggacctgggcgatatcagt
>EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11)
氨基酸序列:
RVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTN
>EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:12)
核酸序列:
cgggtgcagcccaccgaatccatcgtgcggttccccaatatcaccaatctgtgccccttcggcgaggtgttcaatgccaccagattcgcctctgtgtacgcctggaaccggaagcggatcagcaattgcgtggccgactactccgtgctgtacaactccgccagcttcagcaccttcaagtgctacggcgtgtcccctaccaagctgaacgacctgtgcttcacaaacgtgtacgccgacagcttcgtgatccggggagatgaagtgcggcagattgcccctggacagacaggcaagatcgccgactacaactacaagctgcccgacgacttcaccggctgtgtgattgcctggaacagcaacaacctggactccaaagtcggcggcaactacaattacctgtaccggctgttccggaagtccaatctgaagcccttcgagcgggacatcagcaccgaaatctatcaggccggcagcaccccttgcaacggcgtggaaggcttcaactgctacttcccactgcaaagctacggctttcagcccacaaatggcgtgggctaccagccttacagagtggtggtgctgagcttcgagctgctgcatgctcctgccacagtgtgcggccctaagaaatccaccaat
EPI_ISL_402119(全长S蛋白氨基酸序列,其中RBD残基以粗体示出,并且截短S蛋 白中不存在的残基以下划线示出)
>Wuhan_Node1(CoV_T2_1)(SEQ ID NO:13)
氨基酸序列:
MFLFLFIIIFAFFLLSAKANERCGIFTSKPQPKLAQVSSSRRGVYYPDDIFRSDVLHLTQDYFLPFDSNVTRYFSLNANGPDRIVYFDNPIIPFKDGVYFAATEKSNVIRGWIFGSTLDNTSQSVIIVNNSTNVIIRVCNFDLCNDPFFTVSRPTDKHIKTWSIREFAVYQSAFNCTFEYVSKSFLLDVAEKPGNFKHLREFVFKNVDGFLNVYSTYKPINVVSGLPTGFSVLKPILKLPLGINITSFRVLLTMFRGDPTPGHTTANWLTAAAAYYVGYLKPTTFMLKYNENGTITDAVDCSQNPLAELKCTLKNFNVDKGIYQTSNFRVSPTQEVVRFPNITNLCPFDKVFNATRFPSVYAWERTKISDCVADYTVLYNSTSFSTFKCYGVSPSKLIDLCFTSVYADTFLIRCSEVRQVAPGQTGVIADYNYKLPDDFTGCVIAWNTAKQDTGSSGNYNYYYRSHRKTKLKPFERDLSSDECSPDGKPCTPPAFNGVRGFNCYFTLSTYDFNPNVPVEYQATRVVVLSFELLNAPATVCGPKLSTQLVKNQCVNFNFNGLKGTGVLTASSKRFQSFQQFGRDASDFTDSVRDPQTLEILDISPCSFGGVSVITPGTNTSSEVAVLYQDVNCTDVPTAIHADQLTPAWRVYSTGVNVFQTQAGCLIGAEHVNASYECDIPIGAGICASYHTASNSPRILRSTGQKSIVAYTMSLGAENSIAYANNSIAIPTNFSISVTTEVMPVSMAKTSVDCTMYICGDSLECSNLLLQYGSFCTQLNRALTGIAIEQDKNTQEVFAQVKQMYKTPAIKDFGGFNFSQILPDPSKPTKRSFIEDLLFNKVTLADAGFMKQYGECLGDISARDLICAQKFNGLTVLPPLLTDEMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVSNGTSWFITQRNFYSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYVWLGFIAGLIAIVMATILLCCMTSCCSCLKGACSCGSCCKFDEDDSEPVLKGVKLHYT
>Wuhan_Node1(CoV_T2_1)(SEQ ID NO:14)
核酸序列:
atgtttctgttcctcttcattattatcttcgcattcttcctgctgagcgccaaggccaacgagagatgcggcatcttcaccagcaagccccagcctaagctggcccaggtgtccagttctagacggggcgtgtactaccccgacgacatcttcagatccgacgtgctgcatctgacccaggactacttcctgcctttcgacagcaacgtgacccggtacttcagcctgaacgccaacggacccgaccggatcgtgtacttcgacaaccctatcatccccttcaaggacggggtgtactttgccgccaccgagaagtccaacgtgatcagaggctggatcttcggcagcaccctggacaataccagccagagcgtgatcatcgtgaacaacagcaccaacgtcatcatccgcgtgtgcaacttcgacctgtgcaacgacccattcttcaccgtgtccagaccaaccgacaagcacatcaagacctggtccatccgcgagttcgccgtgtaccagagcgccttcaattgcaccttcgagtacgtgtccaagagctttctgctggacgtggccgagaagcccggcaactttaagcacctgagagaattcgtgttcaagaacgtggacggcttcctgaacgtgtacagcacctacaagcccatcaacgtggtgtccggcctgcctacaggattcagcgtgctgaagcccatcctgaagctgcccctgggcatcaacatcaccagcttcagagtgctgctgaccatgttcagaggcgaccctacacctggccacaccaccgctaattggctgacagccgccgctgcctactacgtgggatacctgaagcctaccaccttcatgctcaagtacaacgagaacggcaccatcaccgacgccgtggactgtagccaaaatcctctggccgagctgaagtgcaccctgaagaacttcaacgtggacaagggcatctaccagaccagcaacttccgggtgtcccctacacaagaggtcgtgcggttccccaatatcaccaatctgtgccccttcgacaaggtgttcaacgccaccagatttcccagcgtgtacgcctgggagcgcaccaagatttccgattgcgtggccgactacaccgtgctgtataactccacctccttcagcaccttcaagtgctacggcgtgtccccaagcaagctgatcgatctgtgcttcacctctgtgtacgccgacaccttcctgatccggtgtagcgaagtgcgacaggtggcacctggacagacaggcgtgatcgccgattacaactacaagctgcccgacgacttcaccggctgtgtgatcgcctggaataccgccaagcaggatacaggcagcagcggcaactacaactactactacagaagccaccgcaagaccaagctgaagcctttcgagagggacctgagcagcgacgagtgtagccctgatggcaagccttgtacacctcctgccttcaatggcgtgcggggcttcaactgctacttcaccctgagcacctacgacttcaaccccaacgtgcccgtggaataccaggccacaagagtggtggtgctgagcttcgagctgctgaatgcccctgccacagtgtgtggccctaagctgtctacccagctggtcaagaaccagtgcgtgaacttcaatttcaacggcctgaaaggcaccggcgtgctgaccgccagcagcaagagattccagagcttccagcagttcggcagggacgccagcgatttcacagatagcgtcagagatccccagacactggaaatcctggacatcagcccttgcagcttcggcggagtgtctgtgatcacccctggcaccaatacctctagcgaggtggcagtgctgtaccaggacgtgaactgcaccgatgtgcctacagccatccacgccgatcagctgacaccagcttggagagtgtactctaccggtgtcaacgtgttccagacacaagccggctgtctgattggagccgaacacgtgaacgccagctacgagtgcgacatccctatcggagccggcatctgtgcctcttaccacaccgcctctaacagccccagaatcctgagaagcaccggccagaaatccatcgtggcctacacaatgtctctgggcgccgagaactctatcgcctacgccaacaactccattgctatccccaccaacttcagcatctccgtgaccaccgaagtgatgcctgtgtccatggccaagaccagcgtggactgcacaatgtacatctgcggcgacagcctggaatgcagcaacctgctgctccagtacggcagcttctgcacccagctgaatagagccctgaccggaatcgccatcgagcaggacaagaacacccaagaggtgttcgcccaagtgaagcagatgtataagacccctgccatcaaggacttcggcggctttaacttcagccagatcctgcctgatcctagcaagcccaccaagcggagcttcatcgaggacctgctgttcaacaaagtgaccctggccgacgccggctttatgaagcagtatggcgagtgcctgggcgacatctctgccagggatctgatttgcgcccagaagttcaacggactgaccgtgctgcctcctctgctgaccgatgagatgatcgccgcctatacagccgctctggtgtctggcacagctaccgccggatggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccagaagcagatcgccaaccagttcaacaaggccatcagtcagatccaagagagcctgaccacaaccagcacagccctgggaaagctccaggacgtcgtgaaccagaatgcccaggctctgaacaccctggtcaagcagctgagcagcaatttcggcgccatcagctccgtgctgaacgacatcctgagccggctggataaggtggaagccgaggtgcagatcgaccggctgattacaggcagactccagtctctccagacctacgtgacacagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagtctaagagagtggacttctgcggcaagggctaccacctgatgagcttccctcaggctgctcctcacggcgtggtgtttctgcacgtgacatacgtgcccagccaagagcggaacttcacaactgccccagccatctgccacgagggcaaagcctactttcccagagaaggcgtgttcgtgtccaacggcacctcctggttcatcacccagagaaacttctacagccctcagatcatcaccaccgacaacaccttcgtgtccggcaactgcgacgtggtcatcggcatcatcaacaataccgtgtacgaccctctccagccagaactggatagcttcaaagaggaactcgacaagtacttcaagaatcacacaagccccgacgtggacctgggcgatatcagcggaatcaatgccagcgtggtcaacatccagaaagagatcgacagactgaacgaggtggccaagaacctgaacgagtccctgatcgacctgcaagagctggggaagtacgagcagtacatcaagtggccttggtacgtgtggctgggctttatcgccggactgatcgccattgtgatggccaccatcctgctgtgctgcatgacaagctgctgtagctgcctgaagggcgcctgtagctgtggcagctgctgcaagttcgacgaggacgattctgagcctgtgctgaaaggcgtgaagctgcactacacc
>Wuhan_Node1_tr(CoV_T2_4)(SEQ ID NO:15)
氨基酸序列:
MFLFLFIIIFAFFLLSAKANERCGIFTSKPQPKLAQVSSSRRGVYYPDDIFRSDVLHLTQDYFLPFDSNVTRYFSLNANGPDRIVYFDNPIIPFKDGVYFAATEKSNVIRGWIFGSTLDNTSQSVIIVNNSTNVIIRVCNFDLCNDPFFTVSRPTDKHIKTWSIREFAVYQSAFNCTFEYVSKSFLLDVAEKPGNFKHLREFVFKNVDGFLNVYSTYKPINVVSGLPTGFSVLKPILKLPLGINITSFRVLLTMFRGDPTPGHTTANWLTAAAAYYVGYLKPTTFMLKYNENGTITDAVDCSQNPLAELKCTLKNFNVDKGIYQTSNFRVSPTQEVVRFPNITNLCPFDKVFNATRFPSVYAWERTKISDCVADYTVLYNSTSFSTFKCYGVSPSKLIDLCFTSVYADTFLIRCSEVRQVAPGQTGVIADYNYKLPDDFTGCVIAWNTAKQDTGSSGNYNYYYRSHRKTKLKPFERDLSSDECSPDGKPCTPPAFNGVRGFNCYFTLSTYDFNPNVPVEYQATRVVVLSFELLNAPATVCGPKLSTQLVKNQCVNFNFNGLKGTGVLTASSKRFQSFQQFGRDASDFTDSVRDPQTLEILDISPCSFGGVSVITPGTNTSSEVAVLYQDVNCTDVPTAIHADQLTPAWRVYSTGVNVFQTQAGCLIGAEHVNASYECDIPIGAGICASYHTASNSPRILRSTGQKSIVAYTMSLGAENSIAYANNSIAIPTNFSISVTTEVMPVSMAKTSVDCTMYICGDSLECSNLLLQYGSFCTQLNRALTGIAIEQDKNTQEVFAQVKQMYKTPAIKDFGGFNFSQILPDPSKPTKRSFIEDLLFNKVTLADAGFMKQYGECLGDISARDLICAQKFNGLTVLPPLLTDEMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVSNGTSWFITQRNFYSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDIS
>Wuhan_Node1_tr(CoV_T2_4)(SEQ ID NO:16)
核酸序列:
atgtttctgttcctcttcattattatcttcgcattcttcctgctgagcgccaaggccaacgagagatgcggcatcttcaccagcaagccccagcctaagctggcccaggtgtccagttctagacggggcgtgtactaccccgacgacatcttcagatccgacgtgctgcatctgacccaggactacttcctgcctttcgacagcaacgtgacccggtacttcagcctgaacgccaacggacccgaccggatcgtgtacttcgacaaccctatcatccccttcaaggacggggtgtactttgccgccaccgagaagtccaacgtgatcagaggctggatcttcggcagcaccctggacaataccagccagagcgtgatcatcgtgaacaacagcaccaacgtcatcatccgcgtgtgcaacttcgacctgtgcaacgacccattcttcaccgtgtccagaccaaccgacaagcacatcaagacctggtccatccgcgagttcgccgtgtaccagagcgccttcaattgcaccttcgagtacgtgtccaagagctttctgctggacgtggccgagaagcccggcaactttaagcacctgagagaattcgtgttcaagaacgtggacggcttcctgaacgtgtacagcacctacaagcccatcaacgtggtgtccggcctgcctacaggattcagcgtgctgaagcccatcctgaagctgcccctgggcatcaacatcaccagcttcagagtgctgctgaccatgttcagaggcgaccctacacctggccacaccaccgctaattggctgacagccgccgctgcctactacgtgggatacctgaagcctaccaccttcatgctcaagtacaacgagaacggcaccatcaccgacgccgtggactgtagccaaaatcctctggccgagctgaagtgcaccctgaagaacttcaacgtggacaagggcatctaccagaccagcaacttccgggtgtcccctacacaagaggtcgtgcggttccccaatatcaccaatctgtgccccttcgacaaggtgttcaacgccaccagatttcccagcgtgtacgcctgggagcgcaccaagatttccgattgcgtggccgactacaccgtgctgtataactccacctccttcagcaccttcaagtgctacggcgtgtccccaagcaagctgatcgatctgtgcttcacctctgtgtacgccgacaccttcctgatccggtgtagcgaagtgcgacaggtggcacctggacagacaggcgtgatcgccgattacaactacaagctgcccgacgacttcaccggctgtgtgatcgcctggaataccgccaagcaggatacaggcagcagcggcaactacaactactactacagaagccaccgcaagaccaagctgaagcctttcgagagggacctgagcagcgacgagtgtagccctgatggcaagccttgtacacctcctgccttcaatggcgtgcggggcttcaactgctacttcaccctgagcacctacgacttcaaccccaacgtgcccgtggaataccaggccacaagagtggtggtgctgagcttcgagctgctgaatgcccctgccacagtgtgtggccctaagctgtctacccagctggtcaagaaccagtgcgtgaacttcaatttcaacggcctgaaaggcaccggcgtgctgaccgccagcagcaagagattccagagcttccagcagttcggcagggacgccagcgatttcacagatagcgtcagagatccccagacactggaaatcctggacatcagcccttgcagcttcggcggagtgtctgtgatcacccctggcaccaatacctctagcgaggtggcagtgctgtaccaggacgtgaactgcaccgatgtgcctacagccatccacgccgatcagctgacaccagcttggagagtgtactctaccggtgtcaacgtgttccagacacaagccggctgtctgattggagccgaacacgtgaacgccagctacgagtgcgacatccctatcggagccggcatctgtgcctcttaccacaccgcctctaacagccccagaatcctgagaagcaccggccagaaatccatcgtggcctacacaatgtctctgggcgccgagaactctatcgcctacgccaacaactccattgctatccccaccaacttcagcatctccgtgaccaccgaagtgatgcctgtgtccatggccaagaccagcgtggactgcacaatgtacatctgcggcgacagcctggaatgcagcaacctgctgctccagtacggcagcttctgcacccagctgaatagagccctgaccggaatcgccatcgagcaggacaagaacacccaagaggtgttcgcccaagtgaagcagatgtataagacccctgccatcaaggacttcggcggctttaacttcagccagatcctgcctgatcctagcaagcccaccaagcggagcttcatcgaggacctgctgttcaacaaagtgaccctggccgacgccggctttatgaagcagtatggcgagtgcctgggcgacatctctgccagggatctgatttgcgcccagaagttcaacggactgaccgtgctgcctcctctgctgaccgatgagatgatcgccgcctatacagccgctctggtgtctggcacagctaccgccggatggacatttggagctggcgccgctctccagattccattcgctatgcagatggcctaccgcttcaacggcatcggcgtgacccagaacgtgctgtacgagaaccagaagcagatcgccaaccagttcaacaaggccatcagtcagatccaagagagcctgaccacaaccagcacagccctgggaaagctccaggacgtcgtgaaccagaatgcccaggctctgaacaccctggtcaagcagctgagcagcaatttcggcgccatcagctccgtgctgaacgacatcctgagccggctggataaggtggaagccgaggtgcagatcgaccggctgattacaggcagactccagtctctccagacctacgtgacacagcagctgatcagagccgccgagattagagcctctgccaatctggccgccaccaagatgtctgagtgtgtgctgggccagtctaagagagtggacttctgcggcaagggctaccacctgatgagcttccctcaggctgctcctcacggcgtggtgtttctgcacgtgacatacgtgcccagccaagagcggaacttcacaactgccccagccatctgccacgagggcaaagcctactttcccagagaaggcgtgttcgtgtccaacggcacctcctggttcatcacccagagaaacttctacagccctcagatcatcaccaccgacaacaccttcgtgtccggcaactgcgacgtggtcatcggcatcatcaacaataccgtgtacgaccctctccagccagaactggatagcttcaaagaggaactcgacaagtacttcaagaatcacacaagccccgacgtggacctgggcgatatcagt
>Wuhan_Node1_RBD(CoV_T2_7)(SEQ ID NO:17)
氨基酸序列:
RVSPTQEVVRFPNITNLCPFDKVFNATRFPSVYAWERTKISDCVADYTVLYNSTSFSTFKCYGVSPSKLIDLCFTSVYADTFLIRCSEVRQVAPGQTGVIADYNYKLPDDFTGCVIAWNTAKQDTGSSGNYNYYYRSHRKTKLKPFERDLSSDECSPDGKPCTPPAFNGVRGFNCYFTLSTYDFNPNVPVEYQATRVVVLSFELLNAPATVCGPKLSTQ
>Wuhan_Node1_RBD(CoV_T2_7)(SEQ ID NO:18)
核酸序列:
cgggtgtcccctacacaagaggtcgtgcggttccccaatatcaccaatctgtgccccttcgacaaggtgttcaacgccaccagatttcccagcgtgtacgcctgggagcgcaccaagatttccgattgcgtggccgactacaccgtgctgtataactccacctccttcagcaccttcaagtgctacggcgtgtccccaagcaagctgatcgatctgtgcttcacctctgtgtacgccgacaccttcctgatccggtgtagcgaagtgcgacaggtggcacctggacagacaggcgtgatcgccgattacaactacaagctgcccgacgacttcaccggctgtgtgatcgcctggaataccgccaagcaggatacaggcagcagcggcaactacaactactactacagaagccaccgcaagaccaagctgaagcctttcgagagggacctgagcagcgacgagtgtagccctgatggcaagccttgtacacctcctgccttcaatggcgtgcggggcttcaactgctacttcaccctgagcacctacgacttcaaccccaacgtgcccgtggaataccaggccacaagagtggtggtgctgagcttcgagctgctgaatgcccctgccacagtgtgtggccctaagctgtctacccag
Wuhan_Node1(CoV_T2_1)(全长S蛋白氨基酸序列,其中RBD残基以粗体示出,并且 截短S蛋白中不存在的残基以下划线示出)
实施例2
全长S蛋白氨基酸序列CoV_T2_1(Wuhan_Node1)与AY274119的对比
得分=55060.0
对比长度=1284
序列Wuhan_Node1/5-1288(序列长度=1288)
序列AY274119/1-1255(序列长度=1255)
百分比ID=82.32
实施例3
全长S蛋白氨基酸序列CoV_T2_1(Wuhan_Node1)与EPI_ISL_402119的对比
得分=53960.0
对比长度=1280
序列Wuhan_Node1/9-1288(序列长度=1288)
序列EPI_ISL_402119/1-1273(序列长度=1273)
百分比ID=78.98
实施例4
截短S蛋白氨基酸序列CoV_T2_4(Wuhan_Node1_tr)与AY274119的对比
得分=49480.0
对比长度=1181
序列Wuhan_Node1_tr/5-1185(序列长度=1185)
序列AY274119_tr(CoV_T2_2)/1-1152(序列长度=1152)
百分比ID=80.86
实施例5
截短S蛋白氨基酸序列CoV_T2_4(Wuhan_Node1_tr)与EPI_ISL_402119的对比
得分=48450.0
对比长度=1177
序列Wuhan_Node1_tr/9-1185(序列长度=1185)
序列EPI_ISL_402119_tr/1-1170(序列长度=1170)
百分比ID=77.49
实施例6
S蛋白RBD氨基酸序列CoV_T2_7(Wuhan_Node1_RBD)与AY274119的对比
得分=8170.0
对比长度=219
序列Wuhan_Node1_RBD/1-219(序列长度=219)
序列AY274119_RBD/1-213(序列长度=213)
百分比ID=70.32
实施例7
S蛋白RBD氨基酸序列CoV_T2_7(Wuhan_Node1_RBD)与EPI_ISL_402119的对比
得分=8150.0
对比长度=219
序列Wuhan_Node1_RBD/1-219(序列长度=219)
序列EPI_ISL_402119_RBD/1-214(序列长度=214)
百分比ID=70.32
实施例8
pEVAC表达载体
图3示出了pEVAC表达载体的图谱。在下面给出了载体的多克隆位点的序列,随后是其整个核苷酸序列。
pEVAC多克隆位点(MCS)的序列(SEQ ID NO:19)
pEVAC的整个序列(SEQ ID NO:20):
实施例9
Wuhan_Node1_RBD(CoV_T2_7)氨基酸序列(SEQ ID NO:17)与AY274119_RBD(CoV_ T2_5)(SEQ ID NO:5)和EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11)氨基酸序列的常 见氨基酸差异
图4示出了Wuhan_Node1_RBD(CoV_T2_7)氨基酸序列(SEQ ID NO:17),其中氨基酸残基差异以粗体和下划线从与AY274119_RBD(CoV_T2_5)(SEQ ID NO:5)和EPI_ISL_402119_RBD(CoV_T2_6)(SEQ ID NO:11)的相应对比(分别为实施例6和7)中突出显示。
下表中列出了来自两个对比的氨基酸残基差异(残基位置的编号对应于Wuhan_Node1_RBD(CoV_T2_7)(SEQ ID NO:17)氨基酸序列的位置)。来自两个对比的常见差异位于以下氨基酸残基处:3、6、7、21、22、38、42、48、67、70、76、81、83、86、87、92、121、122、123、125、126、128、134、137、138、141、150、152、153、154、155、167、171、178、180、181、183、185、187、188、189、191、194、195、219(在图4中以灰色突出显示示出并且在下表中示出)。
氨基酸插入位于位置167-172(与AY274119_RBD相比)和163-167(与EPI_ISL_402119_RBD相比)(在图4中以加框示出)。
实施例9
由编码“panS”抗原的DNA疫苗诱导的免疫应答
用编码根据本发明的实施方案的“panS”抗原的DNA(Wuhan_Node1(CoV_T2_1),核酸SEQ ID NO:13,编码全长S蛋白氨基酸SEQ ID NO:14)、来自SARS-Cov-1的全长S基因或来自SARS-CoV-2的全长S基因免疫小鼠(n=6)。
通过FACS对从小鼠获得的血清中的抗体比较其结合野生型抗原的能力。
图5示出了抗体与在HEK293T细胞上表达的SARS-CoV-1(A)或SARS-CoV-2(B)全长刺突蛋白结合的剂量反应曲线。以MFI(中值荧光强度)报道基于流式细胞术的细胞显示测定。
来自用野生型S基因免疫的小鼠的血清表现出与异源蛋白的弱结合。相比之下,来自用“panS”抗原免疫的小鼠的血清与SARS-CoV-1和SARS-CoV-2刺突蛋白两者结合。
得出的结论是,“panS”抗原与野生型抗原相比诱导更具交叉反应性的免疫应答,指示通过使用天然存在的抗原无法赋予对未来的Sarbecovirus爆发的防护。
实施例10
包膜(E)蛋白疫苗序列
图6示出了SARS包膜蛋白的氨基酸序列(SEQ ID NO:21),并且示出了序列的关键特征:
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTVYVYSRVKNLNSSEG VPDLLV(SEQ ID NO:21)
图7示出了冠状病毒包膜(E)蛋白序列的多序列对比,比较了NL63和229E(α-冠状病毒)和HKU1、MERS、SARS和SARS2(β-冠状病毒)的分离株的序列。对比表明,与其他序列相比,SARS2和SARS序列(亚属Sarbeco的β-冠状病毒)的E蛋白的C末端包括缺失,并且与SARS序列相比,SARS2 E蛋白序列包括缺失,和精氨酸(带正电的)氨基酸残基。
我们已经生成了包膜(E)蛋白的新型序列,称为COV_E_T2_1(设计的Sarbecovirus序列)(SEQ ID NO:22)和COV_E_T2_2(设计的SARS2序列)(SEQ ID NO:23):
>COV_E_T2_1
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSQG VPDLLV(SEQ ID NO:22)
>COV_E_T2_2
MYSFVSEETG TLIVNSVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSR-VPDLLV(SEQ ID NO:23)
图7中的SARS2参考E蛋白序列与这些设计序列的对比突出显示了SARS2参考E蛋白序列与COV_E_T2_1设计序列(SEQ ID NO:22)之间存在四个氨基酸差异,并且SARS2参考E蛋白序列与COV_E_T2_2设计序列(SEQ ID NO:23)之间存在两个氨基酸差异(参见在下面的氨基酸序列对比中的加框氨基酸残基):
COV_E_T2_2序列的C末端序列与SARS2参考序列相同。E蛋白的C末端是E蛋白的鉴定表位之一,因此在SARS2参考序列中存在的氨基酸缺失和精氨酸残基取代(在图6中与SARS参考序列相比)已经保留在COV_E_T2_2设计序列中。在其他位置处的氨基酸差异被优化以最大化对识别所有Sarbeco病毒的免疫应答的诱导。
氨基酸差异总结在下表中
在上述对比中,SARS2参考序列的残基36被示出为V,但实际上为A(如图7和SEQ IDNO:21中正确示出的)。SEQ ID NO:21与设计序列的对比突出显示了另选的SARS2参考E蛋白序列与COV_E_T2_1设计序列(SEQ ID NO:22)之间存在三个氨基酸差异,并且SARS2参考E蛋白序列与COV_E_T2_2设计序列(SEQ ID NO:23)之间存在一个氨基酸差异:
氨基酸差异总结在下表中
实施例11
膜(M)蛋白疫苗序列
我们已经生成了冠状病毒膜(M)蛋白的新型序列:
·COV_M_T2_1Sarbecovirus根祖先(SEQ ID NO:24);
·COV_M_T2_2表位优化版本的SARS2进化枝祖先节点88b(移除D4)、从开始和结束添加B细胞表位的SARS2等效物,并且然后添加T细胞表位,同时观察共进化位点限制(SEQID NO:25)。
这些设计序列的氨基酸序列为:
>COV_M_T2_1/1-221Sarbeco_M_根:
MADNGTITVE ELKQLLEQWN LVIGFLFLAW IMLLQFAYSN RNRFLYIIKL VFLWLLWPVTLACFVLAAVY RINWVTGGIA IAMACIVGLM WLSYFVASFR LFARTRSMWS FNPETNILLN VPLRGTILTRPLMESELVIG AVIIRGHLRM AGHSLGRCDI KDLPKEITVA TSRTLSYYKL GASQRVGTDS GFAAYNRYRIGNYKLNTDHA GSNDNIALLV Q(SEQ ID NO:24)
>COV_M_T2_2/1-222Sarbeco_M_节点88b_表位_优化:
MADSNGTITV EELKKLLEQW NLVIGFLFLT WICLLQFAYS NRNRFLYIIK LIFLWLLWPVTLACFVLAAV YRINWVTGGI AIAMACIVGL MWLSYFVASF RLFARTRSMW SFNPETNILL NVPLRGSIITRPLMESELVI GAVILRGHLR MAGHSLGRCD IKDLPKEITV ATSRTLSYYK LGASQRVASD SGFAVYNRYRIGNYKLNTDH SSSSDNIALL VQ(SEQ ID NO:25)
在图8中示出了以下SARS2参考M蛋白序列(SEQ ID NO:26)与设计序列的对比。参考M蛋白序列为:
>COV_M_T1_1/1-222NC_045512.2SARS2参考序列:
MADSNGTITV EELKKLLEQW NLVIGFLFLT WICLLQFAYA NRNRFLYIIK LIFLWLLWPVTLACFVLAAV YRINWITGGI AIAMACLVGL MWLSYFIASF RLFARTRSMW SFNPETNILL NVPLHGTILTRPLLESELVI GAVILRGHLR IAGHHLGRCD IKDLPKEITV ATSRTLSYYK LGASQRVAGD SGFAAYSRYRIGNYKLNTDH SSSSDNIALL VQ(SEQ ID NO:26)
图8中所示的对比突出显示了SARS2参考M蛋白序列与COV_M_T2_1和COV_M_T2_2设计序列之间的氨基酸差异,如下表中所示:
实施例12
临床试验设计
该研究将由登记参加试验的30名SARS-CoV-2PCR、抗体和T细胞阴性的健康人类志愿者组成,他们同意在三次免疫接种期间自我隔离并报告,以便证明安全性和免疫原性。
3个研究组首先将由以下组成:
·第1组;n=6剂量递增;
·第2组;12名健康人类志愿者,进行无针PharmaJet递送;
·第3组;12名健康人类志愿者,接受DNA的直接肌内(IM)施用以根据Martin等人(Vaccine,2008)为基准来评估结果。
试验的PharmaJet臂使用剂量节约无针递送系统,其最小化人们接种疫苗的障碍。使用来自SARS临床试验的ELISA数据基于0.27log10单位的估计标准偏差来进行功效计算(Martin等人,Vaccine,2008)。
由于大流行的紧急情况,将在最后一名患者完成初次免疫后3个月时分析主要和次要终点(完整的安全性数据为28天,并且免疫原性主要和关键次要终点为3个月)。
评估疫苗免疫原性的次要目标/终点
在3个月时待分析和报道的关键免疫原性终点:血清(t=0、14天、28天、2个月、3个月)。除了抗原特异性IgM和IgG ELISA之外,将在所有时间点执行ADE和ADCC测定。标准化微量中和测定用于在免疫前和免疫后在限定的时间点处收集的血清中测量疫苗抗原特异性抗体的中和能力。
将在t=0、14天、28天、2个月、3个月时测量抗原特异性T细胞免疫应答。将通过增殖测定(CFSE)和IFNγELISPOT在来自疫苗接种者的冷冻保存的PBMC中评估抗原特异性T细胞免疫应答,作为对阳性应答者的初步筛选。随后将通过流式细胞术对疫苗诱导的T细胞应答执行详细的表型分析,以确定疫苗候选物的亚群[中央记忆T细胞(TCM)、效应记忆T细胞(TEM)和调节性T细胞(Treg)],结合通过不同细胞因子(IFNγ、TNF-α、IL-17、IL-2和IL-10)的细胞内染色进行对T细胞的功能分析。将使用荧光染料标记的右旋体通过多参数流式细胞术来鉴定体外nCoV特异性CD8+和CD4+T细胞子集,测试了它们的CD3、CD4、CD8、CD45RA/RO、CD62L、CCR7、CD127、CD25和核FoxP3表达。如有必要,右旋体分析将结合用跨越刺突(S)蛋白的疫苗特异性合成肽(20个氨基酸被12个氨基酸重叠)进行12-15天的体外重新刺激。此外,还将针对一大批细胞因子(IFN-γIL-4、IL-5、IL-2、IL-10、IL-13、IL-17、IL-21和TNF-α)评估次级培养基的上清液以便精确地定义T细胞极化,从而允许通过使用Bio-PlexProTM Human Cytokine plex Assay(Biorad)来鉴定T辅助细胞子集和多功能性。
实施例13
进一步设计的S蛋白RBD序列
我们已经通过修改我们的设计算法的先前输入对比来生成另外的新型S蛋白RBD序列:CoV_S_T2_13-CoV_S_T2_18。CoV_S_T2_13是设计算法的直接输出,并且CoV_S_T2_14-CoV_S_T2_18是CoV_S_T2_13的表位富集版本。
这些设计序列的氨基酸序列为
>COV_S_T2_13(SEQ ID NO:27)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_14(SEQ ID NO:28)
RVAPTKEVVR FPNITNLCPF GEVFNATKFP SVYAWERKKI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNIDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_15(SEQ ID NO:29)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTFFSTFKCYGVSPTKLN DLCFSNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FMGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_16(SEQ ID NO:30)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNT NNLDSTTGGNYNYLYRLFRK SNLKPFERDI SSDIYQAGST PCSGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_17(SEQ ID NO:31)
RVAPTKEVVR FPNITNLCPF GEVFNATKFP SVYAWERKKI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FTGCVIAWNT NNIDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGTGYQPY RVVVLSFELLNAPATVCGPK LSTD
>COV_S_T2_18(SEQ ID NO:32)
RVAPTKEVVR FPNITNLCPF GEVFNATRFP SVYAWERKRI SNCVADYSVL YNSTFFSTFKCYGVSPTKLN DLCFSNVYAD SFVIRGDEVR QIAPGQTGVI ADYNYKLPDD FMGCVIAWNT NNLDSTTGGNYNYLYRSLRK SKLKPFERDI SSDIYSPGGK PCSGVEGFNC YYPLRSYGFF PTNGTGYQPY RVVVLSFELLNAPATVCGPK LSTD
在下面示出了这些序列与SARS2参考序列(EPI_ISL_402119_RBD(CoV_T2_6)(SEQID NO:11))的对比(加框区域突出显示了对比中的序列差异):
实施例14
进一步设计的S蛋白RBD序列(具有改变的糖基化位点)
已经证明,表位的掩蔽/去掩蔽在MERS中通过掩蔽非中和表位或通过去掩蔽重要表位来改变免疫应答(Du L等人,Nat.Comm,2016)。
我们已经制备了另外的设计的S蛋白RBD序列,其中我们已经删除了SARS2 RBD序列的糖基化位点,或者已经向所述序列引入了糖基化位点。在图13中示出了做出的改变。该图示出了RBD区域的氨基酸序列。圆圈编号示出已删除或引入糖基化位点的位置。浅灰色圆圈编号表示糖基化位点的缺失。深灰色圆圈编号表示糖基化位点的引入。在由圆圈编号3标记的位置处,在SARS野生型序列中存在糖基化位点,但在SARS-2野生型序列中不存在糖基化位点。这对于非中和表位掩蔽可能是重要的。引入的糖基化位点仅存在于M8设计中。
RBD中的修饰
·设计M7和M9包括在圆圈编号4指示的位置(残基位置203)处引入的糖基化位点;
·设计M8和M10包括在由圆圈编号1和2指示的位置(分别为残基位置13和25)中的每个位置处删除的糖基化位点。M8设计还包括在由圆圈编号3指示的位置(残基位置54)处引入的糖基化位点。
在下面示出了SARS2 RBD设计M7、M8、M9和M10的氨基酸序列:
>M7(SEQ ID NO:33)
RVQPTESIVR FPNITNLCPF GEVFNATRFA SVYAWNRKRI SNCVADYSVL YNSASFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNS NNLDSKVGGNYNYLYRLFRK SNLKPFERDI STEIYQAGST PCNGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLHANATVCGPK KSTN
>M8(SEQ ID NO:34)
RVQPTESIVR FPQITNLCPF GEVFQATRFA SVYAWNRKRI SNCVADYSVL YNSTSFSTFKCYGVSPTKLN DLCFTNVYAD SFVIRGDEVR QIAPGQTGKI ADYNYKLPDD FTGCVIAWNS NNLDSKVGGNYNYLYRLFRK SNLKPFERDI STEIYQAGST PCNGVEGFNC YFPLQSYGFQ PTNGVGYQPY RVVVLSFELLHAPATVCGPK KSTN
>M9(SEQ ID NO:35)
RVSPTQEVVR FPNITNLCPF DKVFNATRFP SVYAWERTKI SDCVADYTVL YNSTSFSTFKCYGVSPSKLI DLCFTSVYAD TFLIRCSEVR QVAPGQTGVI ADYNYKLPDD FTGCVIAWNT AKQDTGSSGNYNYYYRSHRK TKLKPFERDL SSDECSPDGK PCTPPAFNGV RGFNCYFTLS TYDFNPNVPV EYQATRVVVLSFELLNANAT VCGPKLSTQ
>M10(SEQ ID NO:36)
RVSPTQEVVR FPQITNLCPF DKVFQATRFP SVYAWERTKI SDCVADYTVL YNSTSFSTFKCYGVSPSKLI DLCFTSVYAD TFLIRCSEVR QVAPGQTGVI ADYNYKLPDD FTGCVIAWNT AKQDTGSSGNYNYYYRSHRK TKLKPFERDL SSDECSPDGK PCTPPAFNGV RGFNCYFTLS TYDFNPNVPV EYQATRVVVLSFELLNAPAT VCGPKLSTQ
在下面示出了这些序列与SARS2参考序列(EPI_ISL_402119_RBD(CoV_T2_6)(SEQID NO:11))的对比(其中点表示没有与参考序列的氨基酸残基差异,并且连字符表示已经在M9和M10序列中插入氨基酸残基的位置):
设计序列与SARS2参考序列的氨基酸差异总结在下表中(其中与参考序列的差异以粗体突出显示):
实施例15
进一步设计的S蛋白RBD序列的核苷酸序列
在下面示出了编码在实施例14中讨论的M7、M8、M9和M10 SARS2 RBD设计的核苷酸序列:
>M7(SEQ ID NO:37)
>M8(SEQ ID NO:38)
>M9(SEQ ID NO:39)
>M10(SEQ ID NO:40)
在下面的对比中突出显示了这些序列之间的差异(其中点指示核苷酸残基与对应的M7核苷酸残基相同):
实施例16
不同的全长S蛋白基因诱导对SARS2RBD的抗体的能力
用不同的全长冠状病毒S蛋白基因(来自SARS-1和SARS-2)免疫小鼠,并且收集血清并在不同稀释度下测试与SARS2 RBD的结合(通过ELISA)。将血清热灭活(HI)以检查ELISA中的非特异性相互作用。
结果示于图9中。
使用ELISA测试血清与SARS-2RBD的结合。ELISA方案如下:
材料和试剂
·F96 Nunc Maxisorp平底板(目录号:44-2404-21,Thermo Scientific)
·板密封件(目录号:676001,Greiner Bio-one)
·振荡器(目录号:544-11200-00,Heidolph Instruments Titramax 100)
·50mL和100mL储液槽(目录号4870Corning和目录号B3110-100Argos)
·U型底稀释板(目录号:650201,Greiner bio-one)
·1xPBS(-Ca/-Mg):
向1L的milliQ水中添加2粒PBS片剂(目录号:18912-014,Gibco)
·1xPBS(-Ca/-Mg)+0.1%吐温-20(PBST):
向2L的milliQ水中添加4粒PBS片剂(目录号:18912-014,Gibco)和2mL吐温-20(目录号:P1379-500ML,Sigma Aldrich)
·1xPBST中的3%(w/v)脱脂奶(阻断溶液):
向50mL的PBST中添加1.5g半脱脂奶粉(目录号:70166-500G,Sigma Aldrich)
·1xPBST中的1%(w/v)脱脂奶(血清稀释溶液):
向50mL的PBST中添加0.5g奶粉(目录号:70166-500G,Sigma Aldrich)
·HRP缀合的二级抗体:
ο抗小鼠IgG-辣根过氧化物酶(HRP)缀合的二级抗体(目录号:715-035-150,Jackson ImmunoResearch)
ο抗人IgG/IgM/IgA-辣根过氧化物酶(HRP)缀合的二级抗体(目录号:109-035-064,Jackson ImmunoResearch)
·1-StepTM Ultra TMB(目录号34029,Thermo Scientific)
·H2SO4终止液(向472mL的milliQ水中添加28mL的1.84kg/L H2SO4)
·血清样本(运行一式两份需要约4ul,从1:50稀释开始,连续稀释10倍;运行一式两份需要约5.5ul,从1:50稀释开始,连续稀释2倍)。
·人阳性对照:来自Covid-19患者的强抗体阳性血浆(目录号:20/130,NIBSC)
·人阴性对照:WHO参考抗EBOV阴性人血浆(目录号:15/288,NIBSC)
方法
第0天
1.用50μl(每孔)1μg/mL在PBS-/-中稀释的蛋白质涂抹九十六孔Nunc Maxisorp板。抵靠柜台轻轻拍打板以确保液体已经完全覆盖板的底部。
2.用板密封件紧紧密封板。将板储存在-4℃冰箱中过夜,最多4天。确保液体在使用时尚未蒸发。
3.制备3%和1%的脱脂奶,在室温下以1350rpm在振荡器上涡旋并使其溶解。使其溶解至少一小时。储存在-4℃冰箱中过夜。
第1天
4.制备阴性和阳性对照
ο小鼠阴性对照:在1%脱脂奶的PBST溶液中以1:50的最终稀释从对应渗血中制备来自PBS免疫组(通常是第1组)的所有六只小鼠的池
ο小鼠阳性对照:在1%脱脂奶的PBST溶液中制备已知强阳性的1:500稀释液
ο人阴性对照:在1%脱脂奶的PBST溶液中制备所需量的抗EBOV血浆的1:50稀释液
ο人阳性对照:在1%脱脂奶的PBST溶液中制备所需量的20/130的1:500稀释液
5.从96孔板上滗析蛋白质,并且每个孔添加100μl的3%脱脂奶。在室温下以200rpm-400rpm在振荡器上孵育1小时。
6.在阻断步骤期间,使用U型底稀释板在1%脱脂奶的PBST溶液中制备血清的连续稀释液。
ο对于从1:50开始的两倍连续稀释–在第一行添加130μl的1%脱脂奶和2.6μl的血清(一式两份)。向剩余行添加65ul的1%脱脂奶。转移65ul用于连续稀释。
ο对于从1:50开始的十倍连续稀释–在第一行添加75μl的1%脱脂奶和1.5μl的血清(一式两份)。向剩余行添加63μl的1%脱脂奶。转移7μl用于连续稀释。
7.在1小时阻断之后,滗析阻断溶液并向对应板中添加50μl的连续稀释液。在室温下以200rpm-400rpm在振荡器上孵育两小时。
8.在孵育期间,在PBST中以1:3000稀释HRP缀合的抗小鼠IgG二级抗体。每个96孔板补充5mL的稀释二级。
9.在2小时初级抗体孵育后,用200μl(每孔)的PBST洗涤板三次。最后一次洗涤后拍打干燥。然后添加50μl(每孔)的稀释二级抗体。在室温下以200rpm-400rpm在振荡器上孵育1小时。
10.在添加二级抗体后,取适量的TMB,放在柜台上以达到室温。每个96孔板取5mL的TMB。
11.在1小时二级抗体孵育后,用200μl(每孔)的PBST洗涤板三次。最后一次洗涤后拍打干燥。
12.添加50μl(每孔)的室温TMB。轻轻搅拌板。保持大约2-3分钟。监测板以确保颜色变化不会变得饱和。一次向最多5个板添加TMB。
13.添加50μl(每孔)的室温终止液。轻轻搅拌板。立即读取。
14.读取450nm处的终点光密度。
使用以下DNA疫苗:
热灭活(HI)
·SARS-1(编码全长SARS-1S蛋白的DNA)
·SARS-2(编码全长SARS-2S蛋白的DNA)
·DIOS-祖先(Wuhan Node 1全长)
非HI
·SARS-1
·SARS-2
·DIOS-祖先
针对SARS-2的人血清和抗SARS1刺突单克隆抗体用作阳性对照,并且抗MERS人血清用作阴性对照。
该图表明经测试的所有全长S蛋白基因诱导对SARS2 RBD的相对较差或可忽略的结合应答。
实施例17
编码SARS1和SARS2截短刺突(S)蛋白和RBD的DNA疫苗诱导对SARS1和SARS2 S蛋白的抗体的能力
用不同的DNA疫苗免疫小鼠,并且使用从小鼠收集的血清来通过FACS测试与SARS1和SARS2刺突蛋白的结合。
1–试剂和耗材
·HEK293T/17细胞
·具有10%的FBS和1%的青霉素/链霉素的DMEM
·OptiMEM
·1x PBS
·FuGENE-HD
οpEVAC表达质粒
2-方案
第1天–接种细胞
1.以每个孔约150,000个细胞对6孔板进行接种,以用于第二天的转染(2个六孔板对于一个96孔板是足够的)
2.在37℃、5% CO2下孵育过夜。
第2天–细胞转染
1.解冻生产细胞质粒DNA并将DMEM和OptiMEM预热至37°C。
2.以600μl的OptiMEM(每个板的量;参见表1)在带标记的1.5ml管中制备DNA混合物
3.在室温下孵育DNA混合物5分钟
4.在转染复合物中每3μg的DNA添加9μl的FuGENE-HD转染试剂(参见下表)
5.在室温下孵育20分钟;轻弹管进行混合。
6.在孵育期间,从6孔板的每个孔中移除耗尽的培养基并用每孔2ml的DMEM进行替换。
7.孵育后,以逐滴方式将转染复合物添加到细胞中,并旋转以确保均匀分布。
8.将细胞返回到组织培养培养箱(37°C、5% CO2)
第3天–抗体/血清稀释
1.在冷PBS 1% FBS中执行对血清或抗体的1:2连续稀释(例如,在300μl的缓冲液中加入6μl血清,等分150μl以实现一式两份)。(6孔U型板是优选的)
2.必须在实验计划中包括人血清或IgG同种型对照
第4天–流式细胞术
3.移除培养基并在falcon中收集细胞
4.以300×g离心5’
5.在10ml的PBS(每板)中重悬细胞沉淀
6.使用P100多通道和储液槽,在96孔板V型底中每孔等分100μl细胞混悬剂。
7.以300×g离心板2’(R2转子处于227)
8.在水槽中轻弹板
9.通过使用多通道,将75μl的稀释血清或抗体从稀释板转移至FCAS板并重悬细胞
10.RT下孵育40’
11.通过添加100μl的PBS来洗涤板
12.以300×g离心板2’
13.在水槽中轻弹板
14.通过添加180μl的PBS来洗涤板并重悬细胞沉淀
15.轻弹板
16.添加60μl/孔的二级抗体(20μl/ml)并重悬细胞
17.RT下孵育40’
18.通过添加100μl的PBS来洗涤板
19.以300×g离心板2’
20.在水槽中轻弹板
21.通过添加180μl的PBS来洗涤板并重悬细胞
22.轻弹板
23.在200μl的PBS中重悬细胞
使用的DNA疫苗为:
COV_S_T2_2 AY274119_tr(CoV_T2_2):编码截短S蛋白的核酸(SEQ ID NO:4)
COV_S_T2_3 EPI_ISL_402119_tr(CoV_T2_3):编码截短S蛋白的核酸(SEQ ID NO:10)
COV_S_T2_5 AY274119_RBD(CoV_T2_5):编码RBD的核酸(SEQ ID NO:6)
COV_S_T2_6 EPI_ISL_402119_RBD(CoV_T2_6):编码RBD的核酸(SEQ ID NO:12)
COV_S_T2_7 Wuhan_Node1_RBD(CoV_T2_7):编码RBD的核酸(SEQ ID NO:18)
COV_S_T2_8 “SARS_2RBD_mut1”(M7构建体,SEQ ID NO:37)
COV_S_T2_10 “SARS_an RBD_mut1”(M9构建体,SEQ ID NO:39)
通过FACS评估免疫后获得的血清与不同稀释度下的SARS1刺突蛋白和SARS2刺突蛋白的结合。结果示于图10中。
结果表明,用编码截短刺突蛋白和RBD结构域的DNA免疫后收集的血清与相应SARS蛋白结合。M7构建体诱导的血清比对应的野生型SARS2RBD具有更好的结合。
实施例18
编码野生型SARS1或SARS2刺突蛋白(全长、截短或RBD)的DNA疫苗诱导对SARS1和 SARS2假型的中和反应的能力
用编码野生型全长SARS1或SARS2刺突蛋白的DNA疫苗、编码野生型截短SARS1或SARS2刺突蛋白的DNA疫苗、编码野生型SARS1或SARS2刺突RBD蛋白的DNA疫苗或野生型SARS1或SARS2 RBD蛋白免疫小鼠。在不同稀释度下对从免疫小鼠收集的血清测试其中和SARS1或SARS2假型的能力。
使用的疫苗为:
·编码全长SARS1或SARS2刺突蛋白的DNA;
·编码截短SARS1或SARS2刺突蛋白的DNA;
·编码SARS1或SARS2刺突RBD的DNA;和
·SARS1或SARS2 RBD蛋白。
将PBS用作阴性对照,并且将20/130(英国国家生物制品检定所(NIBSC)标准)和来自患者4(具有强中和抗体的COVID-19患者)的血清用作阳性对照。
结果示于图11中。
结果表明,用SARS1免疫原(DNA或蛋白质)免疫的小鼠诱导中和SARS1假型的抗体。然而,诱导SARS2假型中和抗体的唯一SARS2免疫原是编码SARS2 RBD的DNA。
实施例19
SARS1和SARS2 RBD蛋白疫苗诱导对SARS2 RBD的抗体的能力
用不同的蛋白疫苗免疫小鼠。收集血清并测试在不同稀释度下与SARS2 RBD的结合。
使用的疫苗为:
·P-RBD-CoV1(野生型SARS1 RBD蛋白)
·P-RBD-CoV2(野生型SARS2 RBD蛋白)
·P-S_Stab_CoV2(通过两个脯氨酸突变和跨膜区的移除而稳定的全长刺突蛋白)
结果示于图12中。
结果表明,经测试的所有蛋白疫苗都诱导了SARS2 RBD结合抗体,包括SARS1 RBD(P-RBD-CoV1)。
实施例20
不同的S蛋白RBD DNA疫苗诱导对SARS2 RBD的抗体的能力
用不同的S蛋白(截短或RBD)DNA疫苗免疫小鼠,然后收集血清并通过ELISA测试与SARS2 RBD的结合(使用实施例16中描述的方案)。
使用的疫苗为:
·祖先RBD
·Conv373(阳性对照-来自Covid阳性患者的血清;数据未示出)
·Human_s(阴性对照,来自Sigma的pre-Covid血清)
·SARS_1RBD
·SARS_1trunc
·SARS_2RBD
·SARS_2RBD_mut1(M7)
·SARS_2trunc
·SARS_anc RBD_mut1(M9)
结果示于图14中。
结果表明,M7 SARS2 RBD DNA疫苗在早期渗血中与野生型SARS2 RBD DNA相比诱导了更强地结合SARS2 RBD的免疫应答。
实施例21
在用M7和野生型SARS2 RBD DNA疫苗免疫后收集的血清对RBD-ACE2相互作用的抑
使用竞争测定来示出:在用M7和野生型RBD DNA疫苗免疫小鼠后,小鼠血清在多大程度上阻止SARS2假型与ACE2受体的结合(使用免疫后2周和8周收集的血清)。
使用的DNA疫苗为:
·D-RBD-CoV2(编码野生型SARS2 RBD的DNA);
·D-RBD-M7_CoV2(编码M7 SARS2 RBD的DNA)
·D-RBD-TM_CoV2(编码具有跨膜结构域的野生型RBD的DNA,使得其保持拴系至细胞膜而不是像其他RBD构建体一样作为可溶性蛋白释放)
结果示于图15中。
左手图(a)(第2周)中呈现的结果表明,用编码野生型RBD和拴系的野生型RBD的DNA免疫2周后收集的血清对SARS2假型与ACE2受体的结合没有影响,但是用编码M7 RBD的DNA免疫2周后收集的血清确实会抑制SARS2假型与ACE2受体的结合。
右手图(b)(第8周)中呈现的结果表明,用编码野生型RBD和M7 RBD的DNA免疫8周后收集的血清均表现出强中和。
从这些结果得出的结论是,编码野生型RBD和M7 RBD的DNA疫苗在免疫后8周引发中和免疫应答,但是编码M7 SARS2 RBD的DNA疫苗比编码野生型SARS2 RBD的DNA疫苗更快地引发中和免疫应答。
方法
根据制造商方案,使用GenScript SARS-CoV-2替代病毒中和试验(sVNT)试剂盒进行竞争测定。该试剂盒可以检测针对SARS-CoV-2的循环中和抗体,其阻断病毒刺突糖蛋白的受体结合结构域(RBD)与ACE2细胞表面受体之间的相互作用。该测定检测中和RBD-ACE2相互作用的血清和血浆中的任何抗体。该试验与物种和同种型均不相关。
首先,将样本和对照与HRP-RBD预孵育以允许循环中和抗体与HRP-RBD结合。然后将混合物添加到预涂覆有hACE2蛋白的捕获板中。未结合的HRP-RBD以及结合至非中和抗体的任何HRP-RBD将被捕获在板上,而循环中和抗体-HRP-RBD复合物则保留在上清液中并在洗涤期间被移除。洗涤步骤后,添加TMB溶液,使颜色变蓝。通过添加终止液,淬灭反应,并且颜色转黄。用酶标仪在450nm下测定最终溶液。样本的吸光度与抗SARS-CoV-2中和抗体的滴度成反比。
实施例22
由M7和野生型SARS2 RBD DNA疫苗诱导的SARS2假型的中和
用下面列出的不同RBD DNA疫苗免疫小鼠,然后收集血清并测试SARS2假型中和。进行两项研究(COV002.1和COV002.2)。
使用的DNA疫苗为
·祖先RBD(编码祖先RBD的DNA);
·SARS_1RBD(编码野生型SARS1 RBD的DNA);
·SARS_1trunc(编码野生型SARS1截短S蛋白的DNA);
·SARS_2RBD(编码野生型SARS2 RBD的DNA);
·SARS_2RBD_mut1(M7)(编码M7 SARS2 RBD的DNA)
·SARS_2trunc(编码野生型SARS2截短S蛋白的DNA);
·SARS_anc RBD_mut1(M9)(编码M9 SARS祖先RBD的DNA)
结果示于图16和图17中。
研究COV002.1和COV002.2的结果示于图16(a)(免疫小鼠在第2周的渗血)中,并且研究COV002.1和COV002.2的结果示于图16(b)(免疫小鼠在第3周的渗血)和图16(c)(免疫小鼠在第4周的渗血)中。
图17示出了从用野生型SARS2 RBD DNA疫苗和M7 SARS2 RBD DNA疫苗免疫的小鼠收集的血清的SARS2假型中和IC50值。图17中的点示出了各个小鼠的IC50值,并且水平交叉条形图示出了基于所有小鼠以95%置信区间进行的估计。图17(a)中所示的结果来自研究COV002.1和COV002.2。图17(b)中所示的结果来自研究COV002.2。
图16和图17中的结果表明,在从第1周和第2周的渗血中收集的血清中,M7 SARS2RBD DNA疫苗比野生型SARS2 RBD DNA疫苗诱导更多的中和反应,但是通过随后的渗血,这两种疫苗之间的差异似乎很小。
实施例23
表达M7 SARS2 RBD的细胞的上清液与其他ACE2结合病毒竞争ACE2细胞进入
细胞的上清液用于与三种冠状病毒假型(NL63、SARS1、SARS2)中的一者竞争ACE2受体。上清液来自表达M7的细胞或用空白pEVAC转染的细胞。结果示于图18中。
结果表明,M7上清液与三种ACE2结合病毒有效地竞争,尽管可能与SARS1竞争程度较低。
实施例24
M7 SARS2 RBD DNA疫苗诱导T细胞应答
针对RBD肽池的酶联免疫斑点(ELISPOT)测定用于确定由M7 SARS2 RBD DNA疫苗诱导的T细胞应答(与作为阴性对照的PBS进行比较)。结果示于图19中。结果表明,T细胞应答由针对RBD肽池中的肽具有反应性的M7 DNA疫苗诱导。培养基用作阴性对照。
ELISPOT测定是一种高灵敏度的免疫测定,其在单细胞水平上测量细胞因子分泌细胞(在这种情况下,为分泌IFN-γ的鼠T细胞)的频率。在该测定中,在存在或不存在刺激的情况下,在涂覆有特异性捕获抗体的表面上培养细胞。由细胞分泌的蛋白质,诸如细胞因子,将由表面上的特异性抗体捕获。在适当的孵育时间后,移除细胞并且使用检测抗体以与酶联免疫测定(ELISA)所采用的类似程序检测分泌的分子。检测抗体是生物素酰化的,然后是链霉亲和素-酶偶合物,或者抗体直接与酶缀合。通过使用具有沉淀而不是可溶产物的基底,最终结果为在表面上的可见斑点。每个斑点对应于单独的细胞因子分泌细胞。
根据以下所述的制造商方案(Cellular Technology Limited,CTL)进行ELISPOT测定:
鼠IFN-γ单色酶促ELISPOT测定
程序(如果使用预涂覆板,则在第1天开始)
第0天–无菌条件
·制备鼠IFN-γ捕获溶液(参见溶液)。
·移液80μl/孔鼠IFN-γ捕获溶液。用石蜡膜密封板并在4℃下孵育过夜。(不需要用乙醇预湿润板,但是在预期有较大反应的一些情况下,移除废液可有利于测定,添加15μl的70%乙醇/孔持续少于一分钟,用150μl的PBS/孔洗涤三次,更换废液,并且立即[在板干燥之前]添加捕获溶液。如果使用条带板,则不存在要在预润湿之前移除的废液。作为另选方案,可以购买CTL预涂覆板。)注意:用乙醇来激活膜是瞬时的,并且可以在视觉上观察到为膜变灰。在激活后应尽可能快地洗掉乙醇。
第1天–无菌条件
·制备CTL-TestTM培养基(参见溶液)。
·在CTL-TestTM培养基中制备两倍最终浓度的抗原/丝裂原溶液。
·从第0天开始滗析包含捕获溶液的板,并用150μl的PBS洗涤一次。
·板抗原/丝裂原溶液,100μl/孔。在铺板细胞之前,将包含抗原的板置于37℃培养箱中10-20分钟,确保pH和温度对细胞来说是理想的。
·在CTL-TestTM培养基中调整细胞至期望浓度,例如:对应于300,000个细胞/孔的3百万/ml(细胞数量可根据预期的斑点数进行调整,因为100,000-800,000个细胞/孔将提供线性结果)。将细胞置于37℃加湿培养箱中,9% CO2,同时处理细胞直至铺板。
·使用大孔口吸头以100μl/孔铺板细胞。完成后,轻轻拍打板的侧面,并且将板立即放入37℃加湿培养箱中,9% CO2
·孵育24小时。请勿堆叠板。小心打开和关闭培养箱门,避免摇晃板。
孵育期间不要触摸板。
第2天
·制备缓冲液溶液:PBS、蒸馏水和吐温-PBS(参见洗涤缓冲液)。
·制备抗鼠IFN-γ检测溶液(参见溶液)。
·用PBS洗涤板两次,然后用0.05%的吐温-PBS洗涤两次,每次200μl/孔。
·添加80μl/孔抗鼠IFN-γ检测溶液。在室温下孵育两小时。
·制备三级溶液(参阅溶液)。
·用0.05%的吐温-PBS洗涤板三次,200μl/孔。
·添加80μl/孔的三级溶液。在室温下孵育30分钟。
·在孵育期间,制备蓝色显色剂溶液(参见溶液)。
·用0.05%的吐温-PBS洗涤板两次,然后用蒸馏水洗涤两次,每次200μl/孔。
·添加蓝色显色剂溶液,80μl/孔。在室温下孵育15分钟。
·通过用自来水轻轻冲洗膜来终止反应,滗析,然后重复三次。
·从板上移除保护性废液,并用自来水冲洗板背面。
·在运行的层流罩中风干板两小时或使板在工作台上的纸巾上面朝下风干24小时。
·扫描并计数板。(CTL具有可用的扫描和分析服务,并提供了购买任何试剂盒的软件的试验版本。发送邮件至kitscanningservices@immunospot.com了解更多信息。)
溶液
所有溶液均应在使用前新鲜制作。重要的是在使用之前快速旋转小瓶以确保内容体积。
·70%乙醇(如果不包括预润湿):稀释190-200标准乙醇。对于10ml,将7ml乙醇添加到3ml蒸馏水中。
·CTL-TestTM培养基:通过添加1%新鲜L-谷氨酰胺制备培养基。所需培养基的量取决于变量诸如细胞产量和测试样本数量,但对于一个完整的板,培养基的量将不少于20ml。
·捕获溶液:在稀释剂A中稀释鼠IFN-γ捕获抗体。对于一个板,将60μl鼠IFN-γ捕获抗体添加到10ml稀释剂A中。
·检测溶液:在稀释剂B中稀释抗鼠IFN-γ(生物素)检测抗体。对于一个板,将10μl抗鼠IFN-γ(生物素)检测抗体添加到10ml稀释剂B中。
·三级溶液:在稀释剂C中以1:1000稀释Strep-AP溶液。对于一个板,将10μl的Strep-AP添加到10ml稀释剂C中。
·蓝色显色剂溶液:在连续步骤中将底物溶液添加到10ml稀释剂Blue中。
对于一个板:
步骤1–将160μl的S1添加到10ml稀释剂Blue中。充分混合!
步骤2–添加160μl的S2。充分混合!
步骤3–添加92μl的S3。充分混合!
建议在使用后十分钟内制作蓝色显色剂溶液并使其免受直射光的影响。
洗涤缓冲液(不包括)
对于每个板,制备:
·0.05%吐温-PBS:100μl的吐温-20溶于200ml的PBS中
·PBS,无菌,100ml
·蒸馏水,100ml
小鼠脾细胞的冷冻保存
这是根据CELLULAR TECHNOLOGY LIMITED的方案进行的,如下所述:
冷冻时,必须考虑每种细胞类型的细胞渗透性、试剂毒性和冷却速率。由DMSO引起的渗透压(超过DMSO的内在毒性)是成功冷冻和解冻脾细胞需要控制的主要因素之一。为了维持细胞的代谢活性和它们的膜脂质流动性(因此它们可以补偿渗透压),所有试剂都应该处于室温(优选地在37℃)下。
制备
1.通过将CTL-CryoTM B缓慢添加到CTL-CryoTM A中,将CTL-CryoTM A与CTL-CryoTMB以80%至20%(v/v)的比例(4+1)混合。(CTL-CryoTMB包含DMSO作为组分。请参阅随附MSDS。)
2.在37℃的CO2培养箱中温热所得CTL-CryoTM A-B混合物和CTL-CryoTM C。(建议在计数细胞时从这一步骤开始)。
3.每个冷冻管应包含大约10×106个细胞(1000万-1500万)。每个管冷冻更多的细胞可能导致细胞损失。
洗涤后:
1.计数后,将细胞混悬液在室温下以330g快速加速离心10分钟,并在高速下制动。
2.滗析上清液,用手指轻轻拍打管,使细胞混合。请勿使用移液器,避免泡沫形成!
3.在约2分钟的时间段内,将等体积的温热CTL-CryoTM A-B混合物缓慢添加到包含脾细胞的CTL-CryoTM C中。(逐滴添加CTL-CryoTM A-B混合物,同时轻轻旋动管以确保两种溶液完全混合。
4.将所得的包含脾细胞的CTL-CryoTM A-B-C混悬液等分到预标记的1.8ml冷冻小瓶中,每个小瓶1ml。
轻轻地缓慢移液以最小化剪切力;不要尝试用移液器进行额外的混合。细胞可以在完成的CTL-CryoTM A-B-C培养基中保留10分钟-20分钟,而不会丧失活力或功能。
5.将冷冻管放入装有丙醇的室温冷冻容器(Mr.FrostyTM)中,然后转移到-80℃冷冻器中至少12小时。在该时间段内不要打开冷冻器。使用专用的-80℃冷冻器,以防止由于打开和关闭冷冻器门导致样本摇晃和冷冻器温度波动。
6.在至少12小时后且不超过48小时,将冷冻管转移到蒸气/液氮罐中进行储存。
实施例25
进一步设计的E蛋白序列(具有消除的离子通道活性)
SARS-CoV包膜(E)基因编码具有离子通道(IC)活性(病毒-宿主相互作用中的一种重要功能)的76氨基酸跨膜蛋白。用缺少或表现E蛋白IC活性的病毒感染小鼠显示出,在离子通道缺陷型病毒感染中,炎症小体通路的激活以及SARS-CoV诱导的加剧的炎症反应有所降低(Nieto-Torres等人,2014,Severe Acute Respiratory Syndrome CoronavirusEnvelope Protein Ion Channel Activity Promotes Virus Fitness andPathogenesis.PLoS Pathog 10(5):e1004077)。
我们已经进行了新E蛋白设计Cov_E_T2_3、CoV_E_T2_4和CoV_E_T2_5,其分别对应于SARS2、CoV_E_T2_1和CoV_E_T2_2(参见实施例10)。该新设计具有点突变N15A,其消除了离子通道活性,但不影响结构的稳定性。Nieto-Torres等人(同上)讨论了这种突变以及SARS E在宿主细胞上的毒性和炎症作用。
在下面示出了新E蛋白设计的氨基酸序列:
>COV_E_T2_3(SARS2_突变体)(SEQ ID NO:42)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPSFYVYSRVKNLNSSR-VPDLLV
>COV_E_T2_4(Env1_突变体)(SEQ ID NO:43)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSQG VPDLLV
>COV_E_T2_5(Env2_突变体)(SEQ ID NO:44)
MYSFVSEETG TLIVASVLLF LAFVVFLLVT LAILTALRLC AYCCNIVNVS LVKPTFYVYSRVKNLNSSR-VPDLLV
在下面示出了E蛋白设计与SARS2 E蛋白参考序列的对比:
设计序列与SARS2参考序列的氨基酸差异示出在下表中(其中与参考序列的差异以粗体突出显示):
实施例26
核蛋白(N)蛋白疫苗序列
我们已经进行了新N蛋白设计:COV_N_T2_1和COV_N_T2_2。在下面示出了这些设计的氨基酸序列。序列COV_N_T2_2是使用方法和算法设计的,该方法和算法选择预测表位以基于其跨sarbecovirus的保守性(同时最小化冗余)来包括MHC等位基因的频率和数量,表位受到预测表位质量和少数用户指定的权重的限制。
>YP_009724397.2/1-419核衣壳磷蛋白[SARS-CoV-2](参考序列)(SEQ ID NO:45)
MSDNGPQ-NQ RNAPRITFGG PSDSTGSNQN GERSGARSKQ RRPQGLPNNT ASWFTALTQHGKEDLKFPRG QGVPINTNSS PDDQIGYYRR ATRRIRGGDG KMKDLSPRWY FYYLGTGPEA GLPYGANKDGIIWVATEGAL NTPKDHIGTR NPANNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRNSSRNSTPGSSRGTSPAR MAGNGGDAAL ALLLLDRLNQ LESKMSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKAYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK HWPQIAQFAP SASAFFGMSR IGMEVTPSGT WLTYTGAIKLDDKDPNFKDQ VILLNKHIDA YKTFPPTEPK KDKKKKADET QALPQRQKKQ QTVTLLPAAD LDDFSKQLQQSMSSA--DST QA
>COV_N_T2_1/1-418节点1b 321-323删除(SEQ ID NO:46)
MSDNGPQ-NQ RSAPRITFGG PSDSTDNNQN GERSGARPKQ RRPQGLPNNT ASWFTALTQHGKEDLRFPRG QGVPINTNSG KDDQIGYYRR ATRRVRGGDG KMKELSPRWY FYYLGTGPEA ALPYGANKEGIVWVATEGAL NTPKDHIGTR NPNNNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRGNSRNSTPGSSRGTSPAR MASGGGDTAL ALLLLDRLNQ LESKVSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKQYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK HWPQIAQFAP SASAFFGMSR---EVTPSGT WLTYHGAIKLDDKDPQFKDN VILLNKHIDA YKTFPPTEPKKDKKKKADEA QPLPQRQKKQ PTVTLLPAADLDDFSKQLQNSMSGASADST QA
>COV_N_T2_2/1-417表位优化321-323删除(SEQ ID NO:47)
MTDNGQQ-GP RNAPRITF-G VSDNFDNNQD GGRSGARPKQ RRPQGLPNNT ASWFTALTQHGKEDLRFPRG QGVPINTNSS PDDQIGYYRR ATRRIRGGDG KMKDLSPRWY FYYLGTGPEA ALPYGANKEGIVWVATEGAL NTPKDHIGTR NPNNNAAIVL QLPQGTTLPK GFYAEGSRGG SQASSRSSSR SRNSSRNSTPGSSRGTSPAR NLQAGGDTAL ALLLLDRLNQ LESKMSGKGQ QQQGQTVTKK SAAEASKKPR QKRTATKQYNVTQAFGRRGP EQTQGNFGDQ ELIRQGTDYK QWPQIAQFAP SASAFFGMSR---EVTPSGT WLTYTGAIKLDDKDPQFKDN VILLNKHIDA YKTFPPTEPK KDKKKKADEA QPLPQRQKKQ QTVTLLPAAD LDDFSRQLQNSMSGASADST QA
在下面示出了N蛋白设计与SARS2 N蛋白参考序列的对比:
设计序列与SARS2参考序列的氨基酸差异示出在下表中(其中与参考序列的差异以粗体突出显示,并且所有设计序列共同的差异加下划线):
位置415和位置416是斜体的,因为它们不是参考序列的残基,而是包括在N_T2_1和N_T2_2序列中的插入。
实施例27
膜(M)蛋白疫苗序列
我们已经进行了其他的新M蛋白设计。在这些设计中,我们已经删除了膜蛋白的第1跨膜区和第2跨膜区,以消除其与S蛋白的相互作用:
·具有S、M和E的串构建体示出较高阶聚集体。
·消除S与M之间的相互作用可减少聚集。
·M-del构建体(Cov_M_T2_(3-5))设计用于消除与S的相互作用。
图20示出了M蛋白的图示。M、E和N蛋白之间的相互作用对于病毒组装是重要的。M蛋白也与核衣壳结合,并且这种相互作用促进了病毒体组装的完成。这些相互作用已经映射到M蛋白的内型结构域的C末端和N蛋白的C末端结构域。在图20中,*表示对严重急性呼吸综合征相关联冠状病毒的膜蛋白上的免疫显性表位的鉴定,并且**表示与刺突蛋白的相互作用所涉及的冠状病毒膜蛋白结构域的映射。
在下面给出了新M蛋白设计的氨基酸序列:
>COV_M_T2_3(SEQ ID NO:48)
MADSNGTITV EELKKLLEQI TGGIAIAMAC LVGLMWLSYF IASFRLFART RSMWSFNPETNILLNVPLHG TILTRPLLES ELVIGAVILR GHLRIAGHHL GRCDIKDLPK EITVATSRTL SYYKLGASQRVAGDSGFAAY SRYRIGNGKL NTDHSSSSDN IALLVQ
>COV_M_T2_4(SEQ ID NO:49)
MADNGTITVE ELKQLLEQVT GGIAIAMACI VGLMWLSYFV ASFRLFARTR SMWSFNPETNILLNVPLRGT ILTRPLMESE LVIGAVIIRG HLRMAGHSLG RCDIKDLPKE ITVATSRTLS YYKLGASQRVGTDSGFAAYN RYRIGNGKLN TDHAGSNDNI ALLVQ
>COV_M_T2_5(SEQ ID NO:50)
MADSNGTITV EELKKLLEQV TGGIAIAMAC IVGLMWLSYF VASFRLFART RSMWSFNPETNILLNVPLRG SIITRPLMES ELVIGAVILR GHLRMAGHSL GRCDIKDLPK EITVATSRTL SYYKLGASQRVASDSGFAVY NRYRIGNGKL NTDHSSSSDN IALLVQ
在下面示出了新M蛋白设计(COV_M_T2_3、COV_M_T2_4、COV_M_T2_5)与先前M蛋白设计(COV_M_T1_1、COV_M_T2_1、COV_M_T2_2)的序列对比:
设计序列与SARS2 M蛋白参考序列的氨基酸差异示出在下表中(其中与参考序列的差异以粗体突出显示):
实施例28
S蛋白RBD蛋白的糖基化
图21示出了来源于用编码以下S蛋白RBD序列的pEVAC质粒转染的HEK细胞的上清液的光谱重叠(MALDI MS):
·COV_S_T2_5(野生型SARS1 RBD)
·COV_S_T2_6(野生型SARS2 RBD)
·COV_S_T2_13
·COV_S_T2_14
·COV_S_T2_15
·COV_S_T2_16
·COV_S_T2_17
·COV_S_T2_18
·COV_S_T2_19
·COV_S_T2_20
·M7 RBD
·TM RBD
结果表明,RBD在25KDa-26KDa下达到峰,并且第二峰出现在29KDa。
图22示出了重组RBD蛋白的以下示例的光谱:
·RBD(一个标记为“LMB”的样本);
·His标签RBD;
·标记为“Ralph”的另一RBD蛋白样本。
COV_S_T2_19的氨基酸序列如下:
>COV_S_T2_19(SEQ ID NO:55)
RVAPTKEVVRFPNITNLCPFGEVFNATRFPSVYAWERKRISNCVADYSVLYNSTSFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGVIADYNYKLPDDFTGCVIAWNTNNLDSTTGGNYNYLYRSLRKSKLKPFERDISSDIYSPGGKPCSGVEGFNCYYPLRSYGFFPTNGVGYQPYRVVVLSFELLNAPATVCGPKLSTDGGGGSGGGGSGGGGSGGGGSKSSIASFFFIIGLIIGLFLVLRVGIHLCIKLKHTKKRQIYTDIEMNRLGK
COV_S_T2_20的氨基酸序列如下:
>COV_S_T2_20(SEQ ID NO:56)
RVAPTKEVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTSFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGVIADYNYKLPDDFTGCVIAWNTNNIDSTTGGNYNYLYRSLRKSKLKPFERDISSDIYSPGGKPCSGVEGFNCYYPLRSYGFFPTNGTGYQPYRVVVLSFELLNAPATVCGPKLSTDGGGGSGGGGSGGGGSGGGGSKSSIASFFFIIGLIIGLFLVLRVGIHLCIKLKHTKKRQIYTDIEMNRLGK
COV_S_T2_19基本上是具有跨膜结构域的COV_S_T2_13,并且COV_S_T2_20是具有跨膜结构域的COV_S_T2_17。
RBD蛋白的氨基酸序列(前导序列-RBD–标签)如下:MKRGLCCVLLLCGAVFVSPSAARVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNGGSGLNDIFEAQKIEWHEGSHHHHHH(SEQ ID NO:51)
图22示出了LMB和His标签RBD蛋白在约26KDa处达到峰(图中LMB的峰较高),并且Ralph RBD样本在约31KDa-32KDa处达到峰。在约52KDa处也能看到“LMB”和“his RBD”的峰(LMB的峰较高),并且在约62KDa-64KDa处也能看到Ralph RBD样本的峰。
从这些结果得出的结论是,与纯化(重组)蛋白相比,存在从上清液获得的两种主要糖基化形式的蛋白。纯化蛋白是非糖基化的或稀疏糖基化的。这种糖基化差异被认为是重要的,因为糖基化位点围绕表位区域并且在大多数sarbecovirus中是保守的。这些糖基化位点对于与一些抗体的相互作用也是重要的。
图23提供了对“S”刺突蛋白的糖基化的参考。从光谱中可以看出,刺突蛋白的糖基化模式是混合的。平均而言,每个聚糖的质量为约2kDa。S蛋白RBD设计中的四个S蛋白RBD设计(COV_T2_13、COV_T2_14、COV_T2_15和COV_T2_16)和野生型SARS1 RBD存在三个糖基化位点,野生型SARS2 RBD存在两个糖基化位点,并且S蛋白RBD设计COV_T2_17、COV_T2_18存在四个糖基化位点。
“Ralf RBD蛋白”的质量为29.2kDa。所设计的RBD蛋白和野生型RBD的质量为约24kDa。
实施例29
Pan-Sarbecovirus疫苗覆盖率
Pan-SarbeCoVirus保护:β-冠状病毒,包括威胁可能外流到人类中的SARS-CoV-2(SARS2)、-1(SARS1)和许多蝙蝠SARSr-CoV(使用ACE2受体)。
图24示出了通过通用Sarbecovirus B细胞和T细胞抗原靶标获得的抗原覆盖率。部分1示出了具有SARS1和SARS2进化枝的Sarbecovirus与人类或蝙蝠宿主物种一起突出显示。部分2示出了机器学习预测插入片段内预测表位的MHC II类结合(越高表示结合越强)。浅灰色针对在SARS2内保守的表位,深灰色是从其他Sarbecovirus(诸如SARS1)接枝的表位。
实施例30
用于防止COVID-19变体的设计的S蛋白序列
全球正在循环多种SARS-CoV-2变体。在2020秋天出现了若干新的变体,最值得注意的是:
在英国(UK),出现了一种新的SARS-CoV-2变体(称为20I/501Y.V1、VOC 202012/01或B.1.1.7),具有大量的突变。已在世界各地的众多国家中检测到这种变体,包括美国(US)。在2021年1月,来自英国的科学家报道了表明B.1.1.7变体与其他变体相比可能与死亡风险增加相关联的证据,但是需要更多研究来确认此发现。在2020年12月结束时,在美国报道了该变体。
在南非,出现了与B.1.1.7不相关的另一种SARS-CoV-2变体(称为20H/501Y.V2或B.1.351)。该变体与B.1.1.7共享一些突变。已经在南非之外的多个国家中检测到归因于该变体的病例。在2021年1月结束时,在美国报道了该变体。
在巴西,出现了一种SARS-CoV-2变体(称为P.1),该变体首次在来自巴西的四名旅客中鉴定到,这些旅客在日本东京郊外的羽田机场进行了例行筛查测试。该变体具有17个独特突变,包括在刺突蛋白的受体结合结构域中的三个。在2021年1月结束时,在美国检测到该变体。
科学家们正在努力更多地了解这些变体,以更好地了解它们可能传播的容易程度以及目前授权的疫苗针对它们的有效性。关于这些变体的病毒学、流行病学和临床特征的新信息正在快速出现。
B.1.1.7谱系(又称为20I/501Y.V1令人担忧的变体(VOC)202012/01)
这种变体在位置501处在刺突蛋白的受体结合结构域(RBD)中具有突变,其中氨基酸天冬酰胺(N)已被酪氨酸(Y)替代。该突变的简写是N501Y。该变体还具有若干其他突变,包括:
·69/70缺失:自发地发生多次并且可能导致刺突蛋白发生构象变化
·P681H:靠近S1/S2弗林蛋白酶裂解位点,这是冠状病毒中具有高度变异性的位点。这种突变也会自发地发生多次。
据估计,这种变体于2020年9月在英国首次出现。
自2020年12月20日以来,包括美国在内的多个国家报道了B.1.1.7谱系病例。
这种变体与增加的传播性有关(即,更有效和更快速的传播)。
在2021年1月,来自英国的科学家报道了表明(Horby P,Huntley C,Davies N等人,NERVTAG note on B.1.1.7severity.SAGE meeting report.2021年1月21日)B.1.1.7变体与其他变体相比可能与死亡风险增加相关联的证据。
早期报道找不到证据表明该变体对疾病的严重程度或疫苗功效有任何影响(WuK,Werner AP,Moliva JI等人,mRNA-1273vaccine induces neutralizing antibodiesagainst spike mutants from global SARS-CoV-2variants.bioRxiv.于2021年1月25日发布;Xie X,Zou J,Fontes-Garfias CR等人,Neutralization of N501Y mutant SARS-CoV-2by BNT162b2 vaccine-elicited sera.bioRxiv.于2021年1月7日发布;Greaney AJ,Loes AN,Crawford KHD等人,Comprehensive mapping of mutations to the SARS-CoV-2receptor-binding domain that affect recognition by polyclonal human serumantibodies.bioRxiv.[预印本于2021年1月4日在线发布];Weisblum Y,Schmidt F,ZhangF等人,Escape from neutralizing antibodies by SARS-CoV-2spike proteinvariants.eLife 2020;9:e61312)。
B.1.351谱系(又称为20H/501Y.V2)
这种变体在刺突蛋白中具有多个突变,包括K417N、E484K、N501Y。与英国检测到的B.1.1.7谱系不同,这种变体不包含69/70处的缺失。
这种变体最初在南非纳尔逊·曼德拉湾的样本中鉴定到,可追溯到2020年10月初,此后在包括美国在内的南非以外地区也发现了病例。
该变体也于2020年12月下旬在赞比亚鉴定到,当时该变体似乎是该国的主要变体。
目前没有证据表明该变体对疾病严重程度有任何影响。
有一些证据表明,刺突蛋白突变中的一个突变,E484K可能会影响一些多克隆和单克隆抗体的中和作用(Weisblum Y,Schmidt F,Zhang F等人,Escape from neutralizingantibodies by SARS-CoV-2 spike protein variants.eLife 2020;9:e61312;ResendePC,Bezerra JF,de Vasconcelos RHT等人,Spike E484K mutation in the first SARS-CoV-2reinfection case confirmed in Brazil,2020.[于2021年1月10日发布于www.virological.org上])。
P.1谱系(又称为20J/501Y.V3)
P.1变体是B.1.1.28谱系的一个分支,该变体由日本国家传染病研究所(NIID)在来自巴西的四名旅客中首次报道,并在东京郊外的羽田机场进行例行筛查时取样。
P.1谱系在刺突蛋白受体结合结构域中包含三个突变:K417T、E484K和N501Y。
有证据表明,P.1变体中的一些突变可能会影响其传播性和抗原谱,这可能会影响通过先前的自然感染或通过疫苗接种而生成的抗体来识别和中和病毒的能力。-最近的一项研究报道了亚马逊地区最大城市玛瑙斯的一组病例,其中在从12月下旬开始测序的42%的样本中鉴定到了P.1变体(Resende PC,Bezerra JF,de Vasconcelos RHT等人,SpikeE484K mutation in the first SARS-CoV-2reinfection case confirmed in Brazil,2020.[于2021年1月10日发布于www.virological.org上])。据估计,截至2020年10月,该地区约有75%的人口感染了SARS-CoV2。然而,自12月中旬以来,该地区的病例激增。这种变体的出现引发了对个体SARS-CoV-2再感染的传播性或倾向性潜在增加的担忧。
在2021年1月结束时,在美国鉴定到该变体。
这三个变体共享一个特定突变,称为D614G。如未经同行评审的预印本文章所述,该特定突变使变体能够比主要病毒扩散得更快(1Bin Zhou,Tran Thi Nhu Thao,DonataHoffmann等人,SARS-CoV-2spike D614G variant confers enhanced replication andtransmissibility bioRxiv 2020.10.27doi:https://doi.org/10.1101/2020.10.27.357558;Volz E,Hill V,McCrone J等人,Evaluating the Effects of SARS-CoV-2Spike Mutation D614G on Transmissibility and Pathogenicity.Cell 2021;184(64-75).doi:https://doi.org/10.1016/j.cell.2020.11.020)。还有流行病学证据表明,具有这种特定突变的变体比没有这种突变的病毒扩散得更快(Korber B,Fischer WM,Gnanakaran S等人,Tracking Changes in SARS-CoV-2Spike:Evidence that D614GIncreases Infectivity of the COVID-19Virus.Cell 2021;182(812-7).doi:https://doi.org/10.1016/j.cell.2020.06.043)。最初在欧洲传播之后,这种突变是大流行病初期在美国首次记录的突变之一(Yurkovetskiy L,Wang X,Pascal KE等人,Structural andFunctional Analysis of the D614G SARS-CoV-2Spike Protein Variant.Cell 2020;183(3):739-1.doi:https://doi.org/10.1016/j.cell.2020.09.032)。
变体总结在下表中(https://www.cdc.gov/coronavirus/2019-ncov/cases-updates/variant-surveillance/variant-info.html):
我们已经设计了一种新的全长S蛋白序列(称为“VOC嵌合体”或COV_S_T2_29),用作COVID-19疫苗插入片段以防止变体B.1.1.7、P.1和B.1.351。
在下面给出了SARS_CoV_2分离株EPI_ISL_402130(参考序列)的全长S蛋白氨基酸序列:
>EPI_ISL_402130(武汉菌株)(SEQ ID NO:52)
在下面给出了设计的全长S蛋白序列的氨基酸序列:
>COV_S_T2_29(VOC嵌合体)(SEQ ID NO:53)
在下面示出了这两个序列的对比。序列之间的氨基酸差异以加框示出,其中进行了两个氨基酸变化(以阴影框示出)以提供结构稳定性。
设计序列COV_S_T2_29与SARS2 S蛋白参照序列(EPI_ISL_402130_武汉菌株)的氨基酸差异总结在下表中:
实施例31
处于关闭状态以防止已知COVID-19变体和预测的未来变体的设计的S蛋白序列
在使用中或在高级临床开发中的大多数SARS-CoV-2疫苗是基于病毒刺突蛋白(S)作为其免疫原。S作为预融合三聚体存在于病毒体上,其中受体结合结构域(RBD)随机打开或关闭。已经描述了作用于打开和关闭构象两者的中和抗体。疫苗接种策略的长期成功将取决于诱导提供针对进化、循环的SARS-CoV-2菌株的持久的广泛免疫同时避免如用其他冠状病毒疫苗观察到的抗体依赖增强作用的风险的抗体。
Carnell等人(“SARS-CoV-2spike protein arrested in the closed stateinduces potent neutralizing responses”;https://doi.org/10.1101/2021.01.14.426695,于2021年1月14日发布)已经评估了在小鼠模型中使用S蛋白三聚体的免疫结果,该S蛋白三聚体被阻断处于关闭状态以防止暴露受体结合位点并因此防止与受体的相互作用。作者将此与一系列其他修饰的S蛋白构建体(包括当前疫苗中使用的代表)进行比较。他们发现所有三聚体S蛋白都诱导长寿命、强烈中和的抗体应答以及T细胞应答。值得注意的是,由关闭刺突诱导的血清的蛋白结合特性不同于由标准S蛋白构建体诱导的那些。基于其抑制RBD与ACE2之间的相互作用的程度,关闭S蛋白诱导比预期更强效的中和反应。作者得出的结论是,这些观察结果表明,关闭刺突与打开刺突相比募集不同但同样强效的病毒抑制免疫应答,并且这很可能包括针对存在于关闭构象中的构象表位的中和抗体。
我们已经认识到,本文(并且尤其是在上面实施例30中)公开的设计的S蛋白序列的氨基酸变化可任选地存在于被阻断处于关闭状态的设计的S蛋白中,并由此进一步改善设计序列的抗体应答。特别地,使用此类结构限制可减少对关键区域的免疫干扰,并且扩散抗体应答以聚焦于其他或更少的免疫显性位点。
SARS-CoV-2正在不断地进化,更具接触传染性的突变迅速扩散。Zahradník等人在2021年(“SARS-CoV-2RBD in vitro evolution follows contagious mutation spread,yet generates an able infection inhibitor”;doi:https://doi.org/10.1101/2021.01.06.425392,于2021年1月29日发布)最近报道了使用体外进化使刺突蛋白的受体结合域(RBD)对ACE2的亲和力成熟,导致更具接触传染性的突变S477N、E484K和N501Y成为最先选择的突变之一,这解释了“欧洲”(20E-EU1)、“英国”(501.V1)、“南非”(501.V2)和“巴西”(501.V3)变体的趋同进化。作者报道进一步的体外进化将结合增强600倍为具有甚至更高传染性的潜在新进化突变提供了指导。例如,Q498R上位至N501Y。
我们还认识到,本文(尤其是上述实施例30)公开的设计的S蛋白序列(RBD、截短或全长)还可任选地在预测在具有疫苗逃逸应答的未来COVID-19变体中突变的残基位置处包括氨基酸取代。
下面的氨基酸序列对比示出了SARS_CoV_2分离株EPI_ISL_402130(参考序列;SEQID NO:52)的全长S蛋白氨基酸序列,具有针对上面实施例30中描述的设计的S蛋白序列(“VOC嵌合体”或COV_S_T2_29;SEQ ID NO:53)进行的氨基酸变化,显示在分离株序列下方(在称为“Super_spike”的线中)。这种设计的(“Super_spike”)S蛋白序列还可任选地在预测在具有疫苗逃逸应答的未来COVID-19变体中突变的残基位置中的一个或多个残基位置处包括一个或多个氨基酸变化(取代或缺失)。
“Super_spike”序列对比下方的线示出了可取代成半胱氨酸残基以允许形成二硫桥以形成“关闭S蛋白”的残基。这些半胱氨酸取代可与“Super_spike”序列(COV_S_T2_29;SEQ ID NO:53)的设计的S蛋白序列中进行的一个或多个(或全部)氨基酸变化组合,并且任选地在预测在具有疫苗逃逸应答的未来COVID-19变体中突变的残基位置处具有一个或多个(或全部)氨基酸变化(尤其是包括例如Q498R)。
下表的对比总结了氨基酸变化。
对比(和表)中的阴影残基如下:
·灰色–在“Super_spike”设计中已经改变的氨基酸残基;
·深灰色–可以取代成半胱氨酸残基以允许形成“关闭S蛋白”的氨基酸残基;
·浅灰色–预计在未来COVID-19变体中突变并可能生成疫苗逃逸应答的氨基酸残基。
任选地,G413C和V987C与下表中所列的氨基酸变化中的一个或多个(或全部)组合:
可任选地包括的其他氨基酸变化是K986P。
实施例32
表位优化的针对Sarbecovirus的广泛覆盖疫苗设计
概述
为了增加基于受体结合结构域(RBD)的疫苗设计对所有现存的β-冠状病毒的sarbecovirus亚属的覆盖率,构建了系统发育的优化疫苗设计。这种设计进一步用作设计表位优化设计和免疫再聚焦设计的主链。表位信息主要来源于刺突蛋白-抗体复合物的已知高分辨率结构数据。这些表位中的少数表位被报道为交叉保护SARS-1和SARS-2,并且包括在设计中以增加疫苗设计的覆盖率。在进一步分析表位的序列趋异时,观察到表位中的一个表位比RBD的其他区域/表位在sarbecovirus中表现出最大趋异。为了增强针对更保守表位的免疫应答,在该表位处引入翻译后修饰-糖基化。
结果
·广泛覆盖疫苗抗原的设计
为了实现对sarbecovirus的更广泛应答,我们首先生成了系统发育的优化设计(COV_S_T2_13)(SEQ ID NO:27),其中针对图35A中所示的所有现存序列优化了RBD的氨基酸序列。预期此类设计与来自现存物种的单个抗原相比生成更广泛的抗体应答。为了进一步理解每个表位对抗体应答的贡献,我们修饰了COV_S_T2_13的表位序列以匹配来自SARS-1和SARS-2的表位序列。通过RBD-抗体复合物的结构分析鉴定了三个构象表位(在本文中也称为“不连续表位”)(图35B)。据报道这些表位中的两个表位(下文称为A和B)结合中和SARS-1和SARS-2的抗体。对COV_S_T2_13设计上的这些表位进行修饰以匹配SARS-1表位序列(COV_S_T2_14(SEQ ID NO:28)和COV_S_T2_15(SEQ ID NO:29)),以了解这些表位对生成针对SARS-1和SARS-2的中和抗体应答的贡献。第三表位(下文称为C)在受体结合区域内和周围。该表位表现出最大趋异(图35C)并预期生成病毒特异性抗体应答。为了理解该表位的氨基酸组成在生成中和抗体应答中的重要性,修饰该表位以匹配来自SARS-2的表位(COV_S_T2_16)(SEQ ID NO:30)。进一步为了拓宽对SARS-1和SARS-2的抗体应答,在COV_S_T2_14和COV_S_T2_15的第三表位(分别为COV_S_T2_17(SEQ ID NO:31)和COV_S_T2_18(SEQ IDNO:32))上引入糖基化位点。为了比较以可溶或膜结合形式生成中和抗体应答的效力,设计了针对COV_S_T2_13和COV_S_T2_17(分别为COV_S_T2_19(SEQ ID NO:55)和COV_S_T2_20(SEQ ID NO:56))的膜结合形式。所有设计均列于下表中。所有疫苗设计的序列对比示于图37A中。疫苗设计之间不同的残基以黑色加框。
表|研究中使用的疫苗设计的描述
图36(A)示出了来自用疫苗设计免疫的小鼠的血清的蛋白质印记。
图36(B)示出了细胞表面表达渗血2的抗体结合应答。
·中和数据
检查来自用疫苗设计(COV_S_T2-13–20)、SARS-1RBD和SARS-2RBD注射的小鼠的血清对SARS-1和SARS-2假型的中和。作为阳性对照,使用来自感染个体的人血清。中和曲线示于图37B中。系统发育的优化设计(COV_S_T2_13)可以生成针对SARS-2的中和抗体但不能生成针对SARS-1的中和抗体。通过比较COV_S_T2_13与SARS-1和SARS-2的序列,观察到相比于系统发育树中呈现的其他sarbecovirus,表位C富集了来自SARS-2的氨基酸(图35A)。来自接种COV_S_T2_14、COV_S_T2_15和COV_S_T2_16的小鼠的血清示出了如针对SARS-1的COV_S_T2_13的数据,这强烈表明表位C是免疫显性表位,而表位A和表位B是免疫亚显性表位。相比于COV_S_T2_13,COV_S_T2_16对SARS-2的更好中和表明表位C处的突变可导致对SARS-2的较低中和。在COV_S_T2_15中进行的取代增强了对SARS-2的免疫原性应答。免疫原性应答的差异可能是由于小的氨基酸丝氨酸被大体积的苯丙氨酸基团取代。
来自COV_T2_S_17和COV_T2_S_18设计的血清可以中和SARS-1和SARS-2,表明在表位C处引入糖基化成功地将免疫应答聚焦于表位A和表位B。因此,验证了我们的设计策略。对COV_T2_S_13和COV_T2_S_17与COV_S_T2_19和COV_S_T2_20的中和数据的比较分别表明膜结合和可溶在小鼠中形成类似的免疫原性应答。
蝙蝠病毒的中和数据(未示出)示出了更广泛的覆盖率。这合理化了系统发育的优化序列作为模板用于进一步设计的用途。
竞争数据(未示出)表明所有设计都生成阻断受体结合的抗体。
讨论
期望可生成针对不同sarbecovirus的抗体应答的疫苗设计。为了实现这一点,我们首先通过使用所有已知的现存的sarbecovirus的序列信息来生成针对刺突蛋白的受体结合结构域的新蛋白序列(COV_S_T2_13)。序列中的每个氨基酸位置是基于输入序列的系统发育相关性来选择的。该新型序列生成了针对SARS-2的中和反应,但针对SARS-1的中和反应不多。比较COV_S_T2_13、SARS-1和SARS-2中的表位,观察到相比于SARS-1,表位更偏向SARS-2。为了扩展针对SARS-1的反应性,突变表位中的两个表位(在SARS-1和SARS-2之间也是保守的)以匹配来自SARS-1的序列(COV_S_T2_14和COV_S_T2_15),并且突变第三表位以匹配SARS-2(COV_S_T2_16)。与这些设计的中和比较表明,与第三表位相比,两个保守表位在性质上是亚显性的。此外,COV_S_T2_16与COV_S_T2_13的比较表明第三表位中的保守突变可能导致免疫逃逸。为了将免疫应答聚焦于保守表位,在更趋异的第三表位(COV_S_T2_17和COV_S_T2_18)处引入了糖基化位点。糖基化位点的引入确实扩展了针对SARS-1和SARS-2的免疫应答,其中在两种设计中均观察到交叉中和。这里呈现的数据强烈地支持了通过在更趋异的表位中引入修饰而将免疫应答再聚焦于更好的保守表位来拓宽疫苗设计的覆盖率的设计策略。
方法
·系统发育分析
针对所有已知的sarbecovirus从NCBI病毒数据库下载刺突蛋白的蛋白序列。使用MUSCLE算法生成多序列对比(MSA)。将所得MSA修剪至RBD区域并用作系统发育树重建的输入。使用具有最佳AIC得分的蛋白质模型并使用IQTREE算法生成系统发育树。使用FASTML算法将所得的树用于生成系统发育的优化设计。
·表位鉴定
从蛋白质数据库(PDB)下载SARS-1和SARS-2的刺突蛋白-抗体复合物的可用结构数据。将这些结构数据进一步修剪为抗原-抗体复合物,其中表位区域在RBD中。在抗体的至少一个氨基酸原子的5半径内具有至少一个原子的抗原的氨基酸残基被定义为表位残基。表位区域被定义为至少5个氨基酸的连续片段。
·分子建模
使用MODELLER算法生成针对COV_S_T2_13的结构模型。选择具有最高DOPE得分的结构模型作为进一步分子建模的工作模型。使用SCWRL文库进一步优化模型的侧链,并使用GROMACS包最小化能量。使用COV_S_T2_13的优化结构模型,并使用FOLDX算法的POSSCAN和BUILD模块检查COV_S_T2_14-COV_S_T2_18设计的结构稳定性。
实施例33
无针皮内施用递送的pan-Sarbeco冠状病毒疫苗DNA候选物COV_S_T2_17(SEQ ID  NO:31)的剂量发现研究
简要研究方案(图38)
为了确定DNA的最佳剂量,在成熟的Hartley豚鼠中进行临床前疫苗研究。将动物随机分成六组,每组八只,并预先放血以确定不存在抗SARS-CoV-2抗体。
第1(对照)组经皮下接受高剂量的400ug(2mg/ml)的经修饰的SARS-CoV-2RBDCOV_S_T2_8DNA,以与第二组由PharmaJet Tropis装置经皮内(ID)施用400ug相同的对照COV_S_T2_8DNA以进行比较。其余四组在第0天和第28天皮内接受100ug(0.5mg/ml)、200ug(1mg/ml)(其中两组,一组接受2剂,另一组接受3剂)或400ug(400ug/ml)的pan-Sarbeco疫苗候选物COV_S_T2_17。在第14天、第28天、第42天、第56天和第70天对动物进行放血。
ELISA确定对SARS-CoV-2和SARS的RBD的抗体水平(图39)
分图A(左)板涂覆有SARS-CoV-2RBD。
第一次免疫后28天,进行ELISA测定以确定抗SARS-CoV-2RBD的滴度,或一次DNA免疫后28天诱导的抗SARS RBD抗体的滴度。相比于右下分图(T2_8由Tropis Pharmajet经ID施用400ug DNA)中的8只动物中的7只动物对SARS-CoV-2RBD强烈应答,左上分图(T2_8经sc施用400ug)证明了8只动物中的5只动物对SARS-CoV-2的抗体应答。通过PharmaJet递送接受COV_S_T2_17ID的4个剩余组表现出与以最大剂量施用400ug SARS-CoV-2RBD DNA的类似抗SARS-CoV-2应答。
分图B(右)板涂覆有SARS RBD。
测试连续稀释的相同28天血清样本与SARS RBD的结合。
左上分图(T2_8经sc施用400ug)证明了低滴度抗体,其中8只动物中仅2只动物达到0.5的OD值。由PharmaJet装置给予相同剂量的SARS-CoV-2RBD疫苗(右下分图)证明了与其对SARS-CoV-2RBD的同型应答相比,对SARS RBD的交叉反应性应答略有改善但较弱(分图A,左)。相比之下,所有pan-Sarbeco T2_17组以剂量依赖性方式强烈应答SARS RBD,其中所有高剂量(400ug)组(分图B左下行)和中剂量(200ug)组(分图B中间行)的动物强烈应答,并且在最低剂量(100ug)T2_17组(分图B,右上)中的所有8只动物中有更易变但不同的应答。
1次免疫后第28天的病毒中和(假型微中和或pMN测定)(图40)
分图A(左)1剂量后28天SARS-CoV-2的抗体中和。
类似于RBD抗体应答,鉴定了针对SARS-CoV-2的中和抗体。在第一次免疫后28天的所有组中。左上分图(T2_8经sc施用400ug)与由Tropis Pharmajet装置经ID施用的相同疫苗候选物(T2_8施用400ug DNA)(其是所有组中应答最强烈的)相比具有低水平的应答。由PharmaJe递送经ID的T2_17表现出对SARS-CoV-2较低但显著的应答。
分图B(右)1剂量后28天SARS的抗体中和。
测试连续稀释的相同28天血清样本对SARS假型病毒的中和。在此时间点,在1次施用之后,T2_8组中不存在应答(分图B(右)的左上方和右下方)。
pan-Sarbeco T2_17组在1剂量的疫苗之后以较低且可变的水平应答,其中在最高剂量组(400ug)中再次表现出最好但较弱的应答(分图B左下行)。
第1组至第3组,比较第一次免疫与第二次免疫后病毒中和反应(图41)
分图A(左SARS-CoV-2)比较第二次免疫(加强)的渗血2(前)和3(后)
所有组对SARS-CoV-2的中和反应都有显著的加强作用,尽管并非第1组中的皮下施用的所有动物(400ug的T2_8)均有显著的中和反应。第2组和第3组(左分图A的中间行和下行)的中和反应更加均匀,并且对SARS-CoV-2的中和滴度也有相当的加强。
分图B(右SARS)比较第二次免疫(加强)的渗血2(前)和3(后)
第1组中8只动物中的5只动物对SARS有微弱且可变的加强作用(T2_8施用400ug)。第2组和第3组(左分图A的中间行和下行)的中和反应均匀,并且对SARS的显著中和滴度也有相当高的加强。
第4组、第5组和第6组,比较第一次免疫与第二次免疫后病毒中和反应(图42):
分图A(左SARS-CoV-2)比较第二次免疫(加强)的渗血2(前)和3(后)
比较第4组、第5组和第6组的左手列,在第4组由Tropis递送200ug的T_17、第5组由Tropis递送400ug的T_17和也由Tropis递送的SARS-CoV-2特异性400ug的T2_8中,对SARS-CoV-2的中和反应增加有显著的加强作用。
分图B(右SARS)比较第二次免疫(加强)的渗血2(前)和3(后)
比较第4组、第5组和第6组的左手列至右手列,在所有3组中,对SARS的中和反应都有明显的加强作用,但在接受200ug(分图B上行)和400ug T2_17(分图B中间行)的两个T2_17免疫组(第4组和第5组,右上曲线图)中中和反应最显著,其中在400ug剂量组中可能具有剂量效应。相比之下,400ug的T2_8组被加强到很低且可变的作用。
令人担忧的变体的中和(图43)
测试来自T2_8和T2_17豚鼠组的所选高、中以及低中和抗体应答者对原始武汉菌株(对照)以及令人担忧的变体(VOC)谱系B1.248(巴西P1谱系)和B1.351(南非)的基于假型的病毒中和。这两种VOC均包含E484K突变,该突变赋予对当前使用的疫苗(AstraZeneca、Pfizer、Moderna)的抗性。高应答的T2_8豚鼠(8和11)抗血清不中和VOC,而来自T2_17组(31和34)的高应答者仍然强烈中和。
实施例34
编码COV_S_T2_13-20的核酸序列
>COV_S_T2_13编码核酸(SEQ ID NO:78)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAGATTTCCCTCTGTGTACGCCTGGGAGAGAAAGCGGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACCTGGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCGTGGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_14编码核酸(SEQ ID NO:79)AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAAGTTTCCCTCTGTGTACGCCTGGGAGCGCAAAAAGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACATCGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCGTGGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_15编码核酸(SEQ ID NO:80)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAGATTTCCCTCTGTGTACGCCTGGGAGAGAAAGCGGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCTTCTTCAGCACCTTTAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCAGCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCATGGGCTGTGTGATCGCCTGGAACACCAACAACCTGGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCGTGGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_16编码核酸(SEQ ID NO:81)AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAGATTTCCCTCTGTGTACGCCTGGGAGAGAAAGCGGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAGACAGGCAAGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACCTGGACAGCACCACCGGCGGCAACTACAACTACCTGTACCGGCTGTTCCGGAAGTCCAACCTGAAGCCTTTCGAGCGGGACATCAGCAGCGACATCTATCAGGCCGGCAGCACACCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTTCCCACTGCAAAGCTACGGCTTCCAGCCTACCAACGGCGTGGGCTACCAGCCTTATAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_17编码核酸(SEQ ID NO:82)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAAGTTTCCCTCTGTGTACGCCTGGGAGCGCAAAAAGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACATCGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCACAGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_18编码核酸(SEQ ID NO:83)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAGATTTCCCTCTGTGTACGCCTGGGAGAGAAAGCGGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCTTCTTCAGCACCTTTAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCAGCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCATGGGCTGTGTGATCGCCTGGAACACCAACAACCTGGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCACAGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACCGAC
>COV_S_T2_19编码核酸(SEQ ID NO:84)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAGATTTCCCTCTGTGTACGCCTGGGAGAGAAAGCGGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACCTGGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCGTGGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACAGATGGCGGCGGAGGATCTGGCGGAGGTGGAAGCGGAGGCGGAGGAAGCGGTGGCGGCGGATCTAAATCTTCTATCGCCAGCTTCTTCTTCATCATCGGCCTGATTATCGGCCTGTTCCTGGTGCTGAGAGTGGGCATCCACCTGTGCATCAAGCTGAAACACACCAAGAAGCGGCAAATCTACACCGACATCGAGATGAACCGGCTGGGCAAA
>COV_S_T2_20编码核酸(SEQ ID NO:85)
AGAGTGGCCCCTACCAAAGAAGTCGTGCGGTTCCCCAACATCACCAATCTGTGCCCTTTCGGCGAGGTGTTCAACGCCACCAAGTTTCCCTCTGTGTACGCCTGGGAGCGCAAAAAGATCAGCAACTGCGTGGCCGACTACAGCGTGCTGTACAACAGCACCAGCTTCAGCACCTTCAAGTGCTACGGCGTGTCACCCACCAAGCTGAACGACCTGTGCTTCACCAACGTGTACGCCGACAGCTTCGTGATCAGAGGCGACGAAGTGCGGCAGATTGCCCCTGGACAAACAGGCGTGATCGCCGATTACAACTACAAGCTGCCCGACGACTTCACCGGCTGTGTGATCGCCTGGAACACCAACAACATCGACAGCACCACCGGCGGCAACTACAACTACCTGTACAGAAGCCTGCGGAAGTCTAAGCTGAAGCCCTTCGAGCGGGACATCAGCAGCGACATCTATAGCCCTGGCGGCAAGCCTTGTTCTGGCGTGGAAGGCTTCAACTGCTACTACCCTCTGCGGAGCTACGGCTTCTTCCCCACAAATGGCACAGGCTACCAGCCTTACAGAGTGGTGGTCCTGAGCTTCGAGCTGCTGAATGCCCCTGCCACAGTGTGTGGCCCTAAGCTGTCTACAGATGGCGGCGGAGGATCTGGCGGAGGTGGAAGCGGAGGCGGAGGAAGCGGTGGCGGCGGATCTAAATCTTCTATCGCCAGCTTCTTCTTCATCATCGGCCTGATTATCGGCCTGTTCCTGGTGCTGAGAGTGGGCATCCACCTGTGCATCAAGCTGAAACACACCAAGAAGCGGCAAATCTACACCGACATCGAGATGAACCGGCTGGGCAAA
 序列表
<110>  DIOSynVax Ltd
       The Chancellor, Masters and Scholars of the University of
       Cambridge
<120>  冠状病毒疫苗
<130>  P/82043.WO01
<150>  2004826.0
<151>  2020-04-01
<150>  2010672.0
<151>  2020-07-10
<150>  2015775.6
<151>  2020-10-05
<150>  2101824.7
<151>  2021-02-10
<150>  2103214.9
<151>  2021-03-08
<160>  85
<170>  PatentIn version 3.5
<210>  1
<211>  1255
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein sequence
<400>  1
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1               5                   10                  15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
            20                  25                  30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
        35                  40                  45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
    50                  55                  60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65                  70                  75                  80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
                85                  90                  95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
            100                 105                 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
        115                 120                 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
    130                 135                 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145                 150                 155                 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
                165                 170                 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
            180                 185                 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
        195                 200                 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
    210                 215                 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225                 230                 235                 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
                245                 250                 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
            260                 265                 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
        275                 280                 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
    290                 295                 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305                 310                 315                 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
                325                 330                 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
            340                 345                 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
        355                 360                 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
    370                 375                 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385                 390                 395                 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
                405                 410                 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
            420                 425                 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
        435                 440                 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
    450                 455                 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465                 470                 475                 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
                485                 490                 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
            500                 505                 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
        515                 520                 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
    530                 535                 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545                 550                 555                 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
                565                 570                 575
Ala Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
            580                 585                 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
        595                 600                 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
    610                 615                 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625                 630                 635                 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
                645                 650                 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
            660                 665                 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
        675                 680                 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
    690                 695                 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705                 710                 715                 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
                725                 730                 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
            740                 745                 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
        755                 760                 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
    770                 775                 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785                 790                 795                 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
                805                 810                 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
            820                 825                 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
        835                 840                 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
    850                 855                 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865                 870                 875                 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
                885                 890                 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
            900                 905                 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
        915                 920                 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
    930                 935                 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945                 950                 955                 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
                965                 970                 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
            980                 985                 990
Gln Leu Ile Arg Ala Ala Glu Ile  Arg Ala Ser Ala Asn  Leu Ala Ala
        995                 1000                 1005
Thr Lys  Met Ser Glu Cys Val  Leu Gly Gln Ser Lys  Arg Val Asp
    1010                 1015                 1020
Phe Cys  Gly Lys Gly Tyr His  Leu Met Ser Phe Pro  Gln Ala Ala
    1025                 1030                 1035
Pro His  Gly Val Val Phe Leu  His Val Thr Tyr Val  Pro Ser Gln
    1040                 1045                 1050
Glu Arg  Asn Phe Thr Thr Ala  Pro Ala Ile Cys His  Glu Gly Lys
    1055                 1060                 1065
Ala Tyr  Phe Pro Arg Glu Gly  Val Phe Val Phe Asn  Gly Thr Ser
    1070                 1075                 1080
Trp Phe  Ile Thr Gln Arg Asn  Phe Phe Ser Pro Gln  Ile Ile Thr
    1085                 1090                 1095
Thr Asp  Asn Thr Phe Val Ser  Gly Asn Cys Asp Val  Val Ile Gly
    1100                 1105                 1110
Ile Ile  Asn Asn Thr Val Tyr  Asp Pro Leu Gln Pro  Glu Leu Asp
    1115                 1120                 1125
Ser Phe  Lys Glu Glu Leu Asp  Lys Tyr Phe Lys Asn  His Thr Ser
    1130                 1135                 1140
Pro Asp  Val Asp Leu Gly Asp  Ile Ser Gly Ile Asn  Ala Ser Val
    1145                 1150                 1155
Val Asn  Ile Gln Lys Glu Ile  Asp Arg Leu Asn Glu  Val Ala Lys
    1160                 1165                 1170
Asn Leu  Asn Glu Ser Leu Ile  Asp Leu Gln Glu Leu  Gly Lys Tyr
    1175                 1180                 1185
Glu Gln  Tyr Ile Lys Trp Pro  Trp Tyr Val Trp Leu  Gly Phe Ile
    1190                 1195                 1200
Ala Gly  Leu Ile Ala Ile Val  Met Val Thr Ile Leu  Leu Cys Cys
    1205                 1210                 1215
Met Thr  Ser Cys Cys Ser Cys  Leu Lys Gly Ala Cys  Ser Cys Gly
    1220                 1225                 1230
Ser Cys  Cys Lys Phe Asp Glu  Asp Asp Ser Glu Pro  Val Leu Lys
    1235                 1240                 1245
Gly Val  Lys Leu His Tyr Thr
    1250                 1255
<210>  2
<211>  3765
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein sequence
<400>  2
atgtttatct ttctgctgtt tctgaccctg accagcggca gcgacctgga tagatgcacc      60
accttcgacg atgtgcaggc ccctaactac acccagcaca ccagctctat gcggggcgtg     120
tactaccccg acgagatttt cagaagcgac accctgtatc tgacccagga cctgttcctg     180
cctttctaca gcaacgtgac cggcttccac accatcaacc acaccttcgg caaccctgtg     240
atccccttca aggacggcat ctactttgcc gccaccgaga agtccaacgt cgtcagagga     300
tgggtgttcg gcagcaccat gaacaacaag agccagagcg tgatcatcat caacaacagc     360
accaacgtgg tcatccgggc ctgcaacttc gagctgtgcg acaacccatt cttcgccgtg     420
tccaagccta tgggcaccca gacacacacc atgatcttcg acaacgcctt caactgcacc     480
ttcgagtaca tcagcgacgc cttcagcctg gacgtgtccg aaaagagcgg caacttcaag     540
cacctgaggg aattcgtgtt caagaacaag gatggcttcc tgtacgtgta caagggctac     600
cagcctatcg acgtcgtgcg ggatctgccc agcggcttca ataccctgaa gcctatcttc     660
aagctgcccc tgggcatcaa catcaccaac ttcagagcca tcctgaccgc tttcagcccc     720
gctcaggata tctggggaac aagcgccgct gcctacttcg tgggctacct gaagccaacc     780
accttcatgc tgaagtacga cgagaacggc accatcaccg acgccgtgga ctgtagccaa     840
aatcctctgg ccgagctgaa gtgcagcgtg aagtccttcg agatcgacaa gggcatctac     900
cagaccagca atttcagagt ggtgccctcc ggggatgtcg tgcggttccc caacatcaca     960
aatctgtgcc ccttcggcga ggtgttcaac gccaccaagt ttccctctgt gtacgcctgg    1020
gagcgcaaaa agatcagcaa ctgcgtggcc gactacagcg tgctgtacaa ctccaccttc    1080
ttcagcacct tcaagtgcta cggcgtgtcc gccacaaagc tgaacgacct gtgcttctcc    1140
aacgtgtacg ccgacagctt cgtggtcaaa ggcgacgacg ttcggcagat tgcccctgga    1200
caaacaggcg tgatcgccga ttacaactac aagctgcctg acgacttcat gggctgcgtg    1260
ctggcctgga acaccagaaa catcgatgcc acctccaccg gcaactacaa ttacaagtac    1320
agatacctgc ggcacggcaa gctgcggcct ttcgagaggg atatcagcaa tgtgcctttt    1380
agccccgacg gcaagccctg cacacctcct gctctgaatt gctactggcc cctgaacgac    1440
tacggctttt acaccaccac aggcatcggc tatcagccct atagagtggt ggtcctgtcc    1500
tttgagctgc tgaatgcccc tgccacagtg tgcggaccta agctgtctac cgacctgatc    1560
aagaaccagt gcgtgaactt caacttcaac ggcctgaccg gcaccggcgt gctgacacca    1620
agcagcaaga gattccagcc tttccagcag ttcggccggg atgtgtccga cttcacagac    1680
agcgtcagag atcccaagac cagcgagatc ctggacatca gcccttgtgc ctttggcgga    1740
gtgtccgtga tcacccctgg cacaaatgcc tctagcgaag tggccgtgct gtatcaggac    1800
gtgaactgca ccgatgtgtc caccgccatt cacgccgatc agctgactcc cgcttggcgg    1860
atctatagca caggcaacaa cgtgttccag acacaagccg gctgtctgat cggagccgag    1920
catgtggata ccagctacga gtgcgacatc cctatcggcg ctggcatctg tgcctcttac    1980
cacaccgtgt ctctgctgcg gagcaccagc cagaaatcca tcgtggccta caccatgagc    2040
ctgggcgccg attcttctat cgcctactcc aacaacacaa tcgctatccc caccaatttc    2100
agcatctcca tcaccaccga agtgatgccc gtgtccatgg ccaagacctc cgtggattgc    2160
aacatgtaca tctgcggcga cagcaccgag tgcgccaatc tgctgctcca gtacggcagc    2220
ttctgcaccc agctgaatag agccctgtct ggaattgccg ccgagcagga cagaaacacc    2280
agagaagtgt tcgcccaagt gaagcagatg tataagaccc cgacactcaa gtacttcggc    2340
gggttcaact tctcccagat cctgcctgat cctctgaagc ccaccaagcg gagcttcatc    2400
gaggacctgc tgttcaacaa agtgaccctg gccgacgccg gctttatgaa gcagtatggc    2460
gagtgcctgg gcgacatcaa cgccagggat ctgatttgcg cccagaagtt taacggactg    2520
accgtgctgc ctcctctgct gaccgatgat atgatcgccg cctacacagc cgctctggtg    2580
tctggtacag ctaccgccgg atggacattt ggagctggcg ccgctctcca gattccattc    2640
gctatgcaga tggcctaccg gttcaacggc atcggagtga cccagaatgt gctgtacgag    2700
aatcagaagc agatcgccaa tcagttcaac aaggccatca gccagatcca agagagcctg    2760
accaccacaa gcacagccct gggaaagctc caggacgtgg tcaaccagaa tgctcaggcc    2820
ctgaacaccc tggtcaagca gctgagcagc aacttcggcg ccatcagctc cgtgctgaat    2880
gacatcctga gccggctgga caaggtggaa gcagaggtgc agatcgaccg gctgatcaca    2940
ggcagactcc agagcctcca gacctacgtg acacagcagc tgatcagagc cgccgagatt    3000
agagcctctg ccaatctggc cgccaccaaa atgagcgagt gtgtcctggg ccagagcaag    3060
agagtggact tttgcggcaa gggctatcac ctgatgagct tcccacaggc cgctcctcat    3120
ggcgtggtct ttctgcacgt gacatacgtg cccagccaag agagaaactt caccaccgct    3180
ccagccatct gccacgaggg caaagcctac tttcccagag aaggcgtgtt cgtgtttaac    3240
ggcacctcct ggtttatcac ccagcggaat ttcttcagcc cgcaaatcat caccacagac    3300
aacaccttcg tgtccggcaa ctgtgacgtc gtgatcggca tcattaacaa taccgtgtac    3360
gaccctctcc agcctgagct ggacagcttc aaagaggaac tggataagta cttcaagaat    3420
cacacgagcc ccgatgtgga cctgggcgat atctctggca tcaatgccag cgtcgtgaac    3480
atccagaaag agattgacag gctgaacgag gtggccaaga acctgaacga gtccctgatc    3540
gacctgcaag agctggggaa gtacgagcag tacatcaagt ggccttggta cgtgtggctg    3600
ggctttatcg ccggactgat cgccatcgtg atggtcacca tcctgctgtg ctgcatgacc    3660
agctgttgca gctgtctgaa gggcgcctgt agctgtggct cctgctgcaa gttcgatgag    3720
gacgactctg agccagtgct gaaaggcgtg aagctgcact acacc                    3765
<210>  3
<211>  1152
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type trS-protein sequence
<400>  3
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1               5                   10                  15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
            20                  25                  30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
        35                  40                  45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
    50                  55                  60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65                  70                  75                  80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
                85                  90                  95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
            100                 105                 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
        115                 120                 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
    130                 135                 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145                 150                 155                 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
                165                 170                 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
            180                 185                 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
        195                 200                 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
    210                 215                 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225                 230                 235                 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
                245                 250                 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
            260                 265                 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
        275                 280                 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
    290                 295                 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305                 310                 315                 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
                325                 330                 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
            340                 345                 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
        355                 360                 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
    370                 375                 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385                 390                 395                 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
                405                 410                 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
            420                 425                 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
        435                 440                 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
    450                 455                 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465                 470                 475                 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
                485                 490                 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
            500                 505                 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
        515                 520                 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
    530                 535                 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545                 550                 555                 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
                565                 570                 575
Ala Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
            580                 585                 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
        595                 600                 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
    610                 615                 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625                 630                 635                 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
                645                 650                 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
            660                 665                 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
        675                 680                 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
    690                 695                 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705                 710                 715                 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
                725                 730                 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
            740                 745                 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
        755                 760                 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
    770                 775                 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785                 790                 795                 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
                805                 810                 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
            820                 825                 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
        835                 840                 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
    850                 855                 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865                 870                 875                 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
                885                 890                 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
            900                 905                 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
        915                 920                 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
    930                 935                 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945                 950                 955                 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
                965                 970                 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
            980                 985                 990
Gln Leu Ile Arg Ala Ala Glu Ile  Arg Ala Ser Ala Asn  Leu Ala Ala
        995                 1000                 1005
Thr Lys  Met Ser Glu Cys Val  Leu Gly Gln Ser Lys  Arg Val Asp
    1010                 1015                 1020
Phe Cys  Gly Lys Gly Tyr His  Leu Met Ser Phe Pro  Gln Ala Ala
    1025                 1030                 1035
Pro His  Gly Val Val Phe Leu  His Val Thr Tyr Val  Pro Ser Gln
    1040                 1045                 1050
Glu Arg  Asn Phe Thr Thr Ala  Pro Ala Ile Cys His  Glu Gly Lys
    1055                 1060                 1065
Ala Tyr  Phe Pro Arg Glu Gly  Val Phe Val Phe Asn  Gly Thr Ser
    1070                 1075                 1080
Trp Phe  Ile Thr Gln Arg Asn  Phe Phe Ser Pro Gln  Ile Ile Thr
    1085                 1090                 1095
Thr Asp  Asn Thr Phe Val Ser  Gly Asn Cys Asp Val  Val Ile Gly
    1100                 1105                 1110
Ile Ile  Asn Asn Thr Val Tyr  Asp Pro Leu Gln Pro  Glu Leu Asp
    1115                 1120                 1125
Ser Phe  Lys Glu Glu Leu Asp  Lys Tyr Phe Lys Asn  His Thr Ser
    1130                 1135                 1140
Pro Asp  Val Asp Leu Gly Asp  Ile Ser
    1145                 1150
<210>  4
<211>  3456
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type tr-S-protein sequence
<400>  4
atgtttatct ttctgctgtt tctgaccctg accagcggca gcgacctgga tagatgcacc      60
accttcgacg atgtgcaggc ccctaactac acccagcaca ccagctctat gcggggcgtg     120
tactaccccg acgagatttt cagaagcgac accctgtatc tgacccagga cctgttcctg     180
cctttctaca gcaacgtgac cggcttccac accatcaacc acaccttcgg caaccctgtg     240
atccccttca aggacggcat ctactttgcc gccaccgaga agtccaacgt cgtcagagga     300
tgggtgttcg gcagcaccat gaacaacaag agccagagcg tgatcatcat caacaacagc     360
accaacgtgg tcatccgggc ctgcaacttc gagctgtgcg acaacccatt cttcgccgtg     420
tccaagccta tgggcaccca gacacacacc atgatcttcg acaacgcctt caactgcacc     480
ttcgagtaca tcagcgacgc cttcagcctg gacgtgtccg aaaagagcgg caacttcaag     540
cacctgaggg aattcgtgtt caagaacaag gatggcttcc tgtacgtgta caagggctac     600
cagcctatcg acgtcgtgcg ggatctgccc agcggcttca ataccctgaa gcctatcttc     660
aagctgcccc tgggcatcaa catcaccaac ttcagagcca tcctgaccgc tttcagcccc     720
gctcaggata tctggggaac aagcgccgct gcctacttcg tgggctacct gaagccaacc     780
accttcatgc tgaagtacga cgagaacggc accatcaccg acgccgtgga ctgtagccaa     840
aatcctctgg ccgagctgaa gtgcagcgtg aagtccttcg agatcgacaa gggcatctac     900
cagaccagca atttcagagt ggtgccctcc ggggatgtcg tgcggttccc caacatcaca     960
aatctgtgcc ccttcggcga ggtgttcaac gccaccaagt ttccctctgt gtacgcctgg    1020
gagcgcaaaa agatcagcaa ctgcgtggcc gactacagcg tgctgtacaa ctccaccttc    1080
ttcagcacct tcaagtgcta cggcgtgtcc gccacaaagc tgaacgacct gtgcttctcc    1140
aacgtgtacg ccgacagctt cgtggtcaaa ggcgacgacg ttcggcagat tgcccctgga    1200
caaacaggcg tgatcgccga ttacaactac aagctgcctg acgacttcat gggctgcgtg    1260
ctggcctgga acaccagaaa catcgatgcc acctccaccg gcaactacaa ttacaagtac    1320
agatacctgc ggcacggcaa gctgcggcct ttcgagaggg atatcagcaa tgtgcctttt    1380
agccccgacg gcaagccctg cacacctcct gctctgaatt gctactggcc cctgaacgac    1440
tacggctttt acaccaccac aggcatcggc tatcagccct atagagtggt ggtcctgtcc    1500
tttgagctgc tgaatgcccc tgccacagtg tgcggaccta agctgtctac cgacctgatc    1560
aagaaccagt gcgtgaactt caacttcaac ggcctgaccg gcaccggcgt gctgacacca    1620
agcagcaaga gattccagcc tttccagcag ttcggccggg atgtgtccga cttcacagac    1680
agcgtcagag atcccaagac cagcgagatc ctggacatca gcccttgtgc ctttggcgga    1740
gtgtccgtga tcacccctgg cacaaatgcc tctagcgaag tggccgtgct gtatcaggac    1800
gtgaactgca ccgatgtgtc caccgccatt cacgccgatc agctgactcc cgcttggcgg    1860
atctatagca caggcaacaa cgtgttccag acacaagccg gctgtctgat cggagccgag    1920
catgtggata ccagctacga gtgcgacatc cctatcggcg ctggcatctg tgcctcttac    1980
cacaccgtgt ctctgctgcg gagcaccagc cagaaatcca tcgtggccta caccatgagc    2040
ctgggcgccg attcttctat cgcctactcc aacaacacaa tcgctatccc caccaatttc    2100
agcatctcca tcaccaccga agtgatgccc gtgtccatgg ccaagacctc cgtggattgc    2160
aacatgtaca tctgcggcga cagcaccgag tgcgccaatc tgctgctcca gtacggcagc    2220
ttctgcaccc agctgaatag agccctgtct ggaattgccg ccgagcagga cagaaacacc    2280
agagaagtgt tcgcccaagt gaagcagatg tataagaccc cgacactcaa gtacttcggc    2340
gggttcaact tctcccagat cctgcctgat cctctgaagc ccaccaagcg gagcttcatc    2400
gaggacctgc tgttcaacaa agtgaccctg gccgacgccg gctttatgaa gcagtatggc    2460
gagtgcctgg gcgacatcaa cgccagggat ctgatttgcg cccagaagtt taacggactg    2520
accgtgctgc ctcctctgct gaccgatgat atgatcgccg cctacacagc cgctctggtg    2580
tctggtacag ctaccgccgg atggacattt ggagctggcg ccgctctcca gattccattc    2640
gctatgcaga tggcctaccg gttcaacggc atcggagtga cccagaatgt gctgtacgag    2700
aatcagaagc agatcgccaa tcagttcaac aaggccatca gccagatcca agagagcctg    2760
accaccacaa gcacagccct gggaaagctc caggacgtgg tcaaccagaa tgctcaggcc    2820
ctgaacaccc tggtcaagca gctgagcagc aacttcggcg ccatcagctc cgtgctgaat    2880
gacatcctga gccggctgga caaggtggaa gcagaggtgc agatcgaccg gctgatcaca    2940
ggcagactcc agagcctcca gacctacgtg acacagcagc tgatcagagc cgccgagatt    3000
agagcctctg ccaatctggc cgccaccaaa atgagcgagt gtgtcctggg ccagagcaag    3060
agagtggact tttgcggcaa gggctatcac ctgatgagct tcccacaggc cgctcctcat    3120
ggcgtggtct ttctgcacgt gacatacgtg cccagccaag agagaaactt caccaccgct    3180
ccagccatct gccacgaggg caaagcctac tttcccagag aaggcgtgtt cgtgtttaac    3240
ggcacctcct ggtttatcac ccagcggaat ttcttcagcc cgcaaatcat caccacagac    3300
aacaccttcg tgtccggcaa ctgtgacgtc gtgatcggca tcattaacaa taccgtgtac    3360
gaccctctcc agcctgagct ggacagcttc aaagaggaac tggataagta cttcaagaat    3420
cacacgagcc ccgatgtgga cctgggcgat atctct                              3456
<210>  5
<211>  213
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein RBD sequence
<400>  5
Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met
            100                 105                 110
Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser Thr
        115                 120                 125
Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu Arg
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly Lys
145                 150                 155                 160
Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp Tyr
                165                 170                 175
Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val Val
            180                 185                 190
Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly Pro
        195                 200                 205
Lys Leu Ser Thr Asp
    210
<210>  6
<211>  639
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein RBD sequence
<400>  6
agagtggtgc cctccgggga tgtcgtgcgg ttccccaaca tcacaaatct gtgccccttc      60
ggcgaggtgt tcaacgccac caagtttccc tctgtgtacg cctgggagcg caaaaagatc     120
agcaactgcg tggccgacta cagcgtgctg tacaactcca ccttcttcag caccttcaag     180
tgctacggcg tgtccgccac aaagctgaac gacctgtgct tctccaacgt gtacgccgac     240
agcttcgtgg tcaaaggcga cgacgttcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcctgacgac ttcatgggct gcgtgctggc ctggaacacc     360
agaaacatcg atgccacctc caccggcaac tacaattaca agtacagata cctgcggcac     420
ggcaagctgc ggcctttcga gagggatatc agcaatgtgc cttttagccc cgacggcaag     480
ccctgcacac ctcctgctct gaattgctac tggcccctga acgactacgg cttttacacc     540
accacaggca tcggctatca gccctataga gtggtggtcc tgtcctttga gctgctgaat     600
gcccctgcca cagtgtgcgg acctaagctg tctaccgac                            639
<210>  7
<211>  1273
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein sequence
<400>  7
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65                  70                  75                  80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
                85                  90                  95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
            100                 105                 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
        115                 120                 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
    130                 135                 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145                 150                 155                 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
                165                 170                 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
            180                 185                 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
        195                 200                 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
    210                 215                 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225                 230                 235                 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
                245                 250                 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
            260                 265                 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
        275                 280                 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
    290                 295                 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305                 310                 315                 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
                325                 330                 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
            340                 345                 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
        355                 360                 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
    370                 375                 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385                 390                 395                 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
                405                 410                 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
            420                 425                 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
        435                 440                 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
    450                 455                 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465                 470                 475                 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
                485                 490                 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
            500                 505                 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
        515                 520                 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
    530                 535                 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545                 550                 555                 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
                565                 570                 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
            580                 585                 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
        595                 600                 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
    610                 615                 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625                 630                 635                 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
                645                 650                 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
            660                 665                 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
        675                 680                 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
    690                 695                 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705                 710                 715                 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
                725                 730                 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
            740                 745                 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
        755                 760                 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
    770                 775                 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785                 790                 795                 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
                805                 810                 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
            820                 825                 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
        835                 840                 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
    850                 855                 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865                 870                 875                 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
                885                 890                 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
            900                 905                 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
        915                 920                 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
    930                 935                 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945                 950                 955                 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
                965                 970                 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
            980                 985                 990
Ile Asp Arg Leu Ile Thr Gly Arg  Leu Gln Ser Leu Gln  Thr Tyr Val
        995                 1000                 1005
Thr Gln  Gln Leu Ile Arg Ala  Ala Glu Ile Arg Ala  Ser Ala Asn
    1010                 1015                 1020
Leu Ala  Ala Thr Lys Met Ser  Glu Cys Val Leu Gly  Gln Ser Lys
    1025                 1030                 1035
Arg Val  Asp Phe Cys Gly Lys  Gly Tyr His Leu Met  Ser Phe Pro
    1040                 1045                 1050
Gln Ser  Ala Pro His Gly Val  Val Phe Leu His Val  Thr Tyr Val
    1055                 1060                 1065
Pro Ala  Gln Glu Lys Asn Phe  Thr Thr Ala Pro Ala  Ile Cys His
    1070                 1075                 1080
Asp Gly  Lys Ala His Phe Pro  Arg Glu Gly Val Phe  Val Ser Asn
    1085                 1090                 1095
Gly Thr  His Trp Phe Val Thr  Gln Arg Asn Phe Tyr  Glu Pro Gln
    1100                 1105                 1110
Ile Ile  Thr Thr Asp Asn Thr  Phe Val Ser Gly Asn  Cys Asp Val
    1115                 1120                 1125
Val Ile  Gly Ile Val Asn Asn  Thr Val Tyr Asp Pro  Leu Gln Pro
    1130                 1135                 1140
Glu Leu  Asp Ser Phe Lys Glu  Glu Leu Asp Lys Tyr  Phe Lys Asn
    1145                 1150                 1155
His Thr  Ser Pro Asp Val Asp  Leu Gly Asp Ile Ser  Gly Ile Asn
    1160                 1165                 1170
Ala Ser  Val Val Asn Ile Gln  Lys Glu Ile Asp Arg  Leu Asn Glu
    1175                 1180                 1185
Val Ala  Lys Asn Leu Asn Glu  Ser Leu Ile Asp Leu  Gln Glu Leu
    1190                 1195                 1200
Gly Lys  Tyr Glu Gln Tyr Ile  Lys Trp Pro Trp Tyr  Ile Trp Leu
    1205                 1210                 1215
Gly Phe  Ile Ala Gly Leu Ile  Ala Ile Val Met Val  Thr Ile Met
    1220                 1225                 1230
Leu Cys  Cys Met Thr Ser Cys  Cys Ser Cys Leu Lys  Gly Cys Cys
    1235                 1240                 1245
Ser Cys  Gly Ser Cys Cys Lys  Phe Asp Glu Asp Asp  Ser Glu Pro
    1250                 1255                 1260
Val Leu  Lys Gly Val Lys Leu  His Tyr Thr
    1265                 1270
<210>  8
<211>  3819
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein sequence
<400>  8
atgttcgtgt ttctggtgct gctgcctctg gtgtccagcc agtgtgtgaa cctgaccacc      60
agaacacagc tgcctccagc ctacaccaac agctttacca gaggcgtgta ctaccccgac     120
aaggtgttca gatccagcgt gctgcactct acccaggacc tgttcctgcc tttcttcagc     180
aacgtgacct ggttccacgc catccacgtg tccggcacca atggcaccaa gagattcgac     240
aaccccgtgc tgcccttcaa cgacggggtg tactttgcca gcaccgagaa gtccaacatc     300
atcagaggct ggatcttcgg caccacactg gacagcaaga cccagagcct gctgatcgtg     360
aacaacgcca ccaacgtggt catcaaagtg tgcgagttcc agttctgcaa cgaccccttc     420
ctgggcgtct actaccacaa gaacaacaag agctggatgg aaagcgagtt ccgggtgtac     480
agcagcgcca acaactgcac cttcgagtac gtgtcccagc ctttcctgat ggacctggaa     540
ggcaagcagg gcaacttcaa gaacctgcgc gagttcgtgt tcaagaacat cgacggctac     600
ttcaaaatct acagcaagca cacccctatc aacctcgtgc gggatctgcc tcagggcttc     660
tctgctctgg aacccctggt ggatctgccc atcggcatca acatcacccg gtttcagaca     720
ctgctggccc tgcacagaag ctacctgaca cctggcgata gcagcagcgg atggacagct     780
ggtgccgccg cttactacgt gggatacctc cagccaagaa ccttcctgct gaagtacaac     840
gagaacggca ccatcaccga cgccgtggat tgtgctctgg accctctgag cgagacaaag     900
tgcaccctga agtccttcac cgtggaaaag ggcatctacc agaccagcaa cttccgggtg     960
cagcccaccg aatccatcgt gcggttcccc aatatcacca atctgtgccc cttcggcgag    1020
gtgttcaatg ccaccagatt cgcctctgtg tacgcctgga accggaagcg gatcagcaat    1080
tgcgtggccg actactccgt gctgtacaac tccgccagct tcagcacctt caagtgctac    1140
ggcgtgtccc ctaccaagct gaacgacctg tgcttcacaa acgtgtacgc cgacagcttc    1200
gtgatccggg gagatgaagt gcggcagatt gcccctggac agacaggcaa gatcgccgac    1260
tacaactaca agctgcccga cgacttcacc ggctgtgtga ttgcctggaa cagcaacaac    1320
ctggactcca aagtcggcgg caactacaat tacctgtacc ggctgttccg gaagtccaat    1380
ctgaagccct tcgagcggga catcagcacc gaaatctatc aggccggcag caccccttgc    1440
aacggcgtgg aaggcttcaa ctgctacttc ccactgcaaa gctacggctt tcagcccaca    1500
aatggcgtgg gctaccagcc ttacagagtg gtggtgctga gcttcgagct gctgcatgct    1560
cctgccacag tgtgcggccc taagaaatcc accaatctcg tgaagaacaa atgcgtgaac    1620
ttcaacttca acggcctgac cggcaccggc gtgctgacag agagcaacaa gaagttcctg    1680
ccattccagc agttcggccg ggatatcgcc gataccacag atgccgtcag agatccccag    1740
acactggaaa tcctggacat caccccatgc agcttcggcg gagtgtctgt gatcacccct    1800
ggcaccaaca ccagcaatca ggtggcagtg ctgtaccagg acgtgaactg taccgaagtg    1860
cccgtggcca ttcacgccga tcagctgaca cctacatggc gggtgtactc caccggcagc    1920
aatgtgtttc agaccagagc cggctgtctg atcggagccg agcacgtgaa caatagctac    1980
gagtgcgaca tccccatcgg cgctggcatc tgcgcctctt accagacaca gacaaacagc    2040
cccagacggg ctagaagcgt ggccagccag agcatcattg cctacacaat gtctctgggc    2100
gccgagaaca gcgtggccta ctccaacaac tctatcgcta tccccaccaa cttcaccatc    2160
agcgtgacca ccgagatcct gcctgtgtcc atgaccaaga ccagcgtgga ctgcaccatg    2220
tacatctgcg gcgattccac cgagtgctcc aacctgctgc tccagtacgg cagcttctgc    2280
acccagctga atagagccct gacagggatc gccgtggaac aggacaagaa cacccaagag    2340
gtgttcgccc aagtgaagca aatctacaag acccctccta tcaaggactt cggcggcttc    2400
aatttcagcc agattctgcc cgatcctagc aagcccagca agcggagctt catcgaggac    2460
ctgctgttca acaaagtgac actggccgac gccggcttca tcaagcagta cggcgattgt    2520
ctgggcgaca ttgccgccag ggatctgatt tgcgcccaga agtttaacgg actgacagtg    2580
ctgcctcctc tgctgaccga tgagatgatc gcccagtaca catctgccct gctggccggc    2640
acaatcacaa gcggctggac atttggagct ggcgccgctc tccagattcc attcgctatg    2700
cagatggcct accggttcaa cggcatcgga gtgacccaga atgtgctgta cgagaaccag    2760
aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc    2820
acagcaagcg ccctgggaaa gctccaggac gtcgtgaacc agaatgccca ggcactgaac    2880
accctggtca agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaacgatatc    2940
ctgagcagac tggacaaggt ggaagccgag gtgcagatcg acagactgat caccggcaga    3000
ctccagtctc tccagaccta cgtgacccag cagctgatca gagccgccga gattagagcc    3060
tctgccaatc tggccgccac caagatgtct gagtgtgtgc tgggccagag caagagagtg    3120
gacttttgcg gcaagggcta ccacctgatg agcttccctc agtctgcccc tcacggcgtg    3180
gtgtttctgc acgtgacata cgtgcccgct caagagaaga atttcaccac cgctccagcc    3240
atctgccacg acggcaaagc ccactttcct agagaaggcg tgttcgtgtc caacggcacc    3300
cattggttcg tgacacagcg gaacttctac gagccccaga tcatcaccac cgacaacacc    3360
ttcgtgtctg gcaactgcga cgttgtgatc ggcattgtga acaataccgt gtacgaccct    3420
ctccagcctg aactggactc cttcaaagag gaactcgaca agtactttaa gaaccacaca    3480
agccccgacg tggacctggg cgatatcagc ggaatcaatg ccagcgtggt caacatccag    3540
aaagagatcg accggctgaa cgaggtggcc aagaatctga acgagagcct gatcgacctg    3600
caagaactgg ggaagtacga gcagtacatc aagtggccct ggtacatctg gctgggcttt    3660
atcgccggac tgattgccat cgtgatggtc acaatcatgc tgtgttgcat gaccagctgc    3720
tgtagctgcc tgaagggctg ttgtagctgt ggctcctgct gcaagttcga cgaggacgat    3780
tctgagcccg tgctgaaggg cgtgaaactg cactacacc                           3819
<210>  9
<211>  1170
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type trS-protein sequence
<400>  9
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65                  70                  75                  80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
                85                  90                  95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
            100                 105                 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
        115                 120                 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
    130                 135                 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145                 150                 155                 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
                165                 170                 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
            180                 185                 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
        195                 200                 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
    210                 215                 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225                 230                 235                 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
                245                 250                 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
            260                 265                 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
        275                 280                 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
    290                 295                 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305                 310                 315                 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
                325                 330                 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
            340                 345                 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
        355                 360                 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
    370                 375                 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385                 390                 395                 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
                405                 410                 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
            420                 425                 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
        435                 440                 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
    450                 455                 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465                 470                 475                 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
                485                 490                 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
            500                 505                 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
        515                 520                 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
    530                 535                 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545                 550                 555                 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
                565                 570                 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
            580                 585                 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
        595                 600                 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
    610                 615                 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625                 630                 635                 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
                645                 650                 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
            660                 665                 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
        675                 680                 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
    690                 695                 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705                 710                 715                 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
                725                 730                 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
            740                 745                 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
        755                 760                 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
    770                 775                 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785                 790                 795                 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
                805                 810                 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
            820                 825                 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
        835                 840                 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
    850                 855                 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865                 870                 875                 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
                885                 890                 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
            900                 905                 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
        915                 920                 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
    930                 935                 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945                 950                 955                 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
                965                 970                 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
            980                 985                 990
Ile Asp Arg Leu Ile Thr Gly Arg  Leu Gln Ser Leu Gln  Thr Tyr Val
        995                 1000                 1005
Thr Gln  Gln Leu Ile Arg Ala  Ala Glu Ile Arg Ala  Ser Ala Asn
    1010                 1015                 1020
Leu Ala  Ala Thr Lys Met Ser  Glu Cys Val Leu Gly  Gln Ser Lys
    1025                 1030                 1035
Arg Val  Asp Phe Cys Gly Lys  Gly Tyr His Leu Met  Ser Phe Pro
    1040                 1045                 1050
Gln Ser  Ala Pro His Gly Val  Val Phe Leu His Val  Thr Tyr Val
    1055                 1060                 1065
Pro Ala  Gln Glu Lys Asn Phe  Thr Thr Ala Pro Ala  Ile Cys His
    1070                 1075                 1080
Asp Gly  Lys Ala His Phe Pro  Arg Glu Gly Val Phe  Val Ser Asn
    1085                 1090                 1095
Gly Thr  His Trp Phe Val Thr  Gln Arg Asn Phe Tyr  Glu Pro Gln
    1100                 1105                 1110
Ile Ile  Thr Thr Asp Asn Thr  Phe Val Ser Gly Asn  Cys Asp Val
    1115                 1120                 1125
Val Ile  Gly Ile Val Asn Asn  Thr Val Tyr Asp Pro  Leu Gln Pro
    1130                 1135                 1140
Glu Leu  Asp Ser Phe Lys Glu  Glu Leu Asp Lys Tyr  Phe Lys Asn
    1145                 1150                 1155
His Thr  Ser Pro Asp Val Asp  Leu Gly Asp Ile Ser
    1160                 1165                 1170
<210>  10
<211>  3510
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type trS-protein sequence
<400>  10
atgttcgtgt ttctggtgct gctgcctctg gtgtccagcc agtgtgtgaa cctgaccacc      60
agaacacagc tgcctccagc ctacaccaac agctttacca gaggcgtgta ctaccccgac     120
aaggtgttca gatccagcgt gctgcactct acccaggacc tgttcctgcc tttcttcagc     180
aacgtgacct ggttccacgc catccacgtg tccggcacca atggcaccaa gagattcgac     240
aaccccgtgc tgcccttcaa cgacggggtg tactttgcca gcaccgagaa gtccaacatc     300
atcagaggct ggatcttcgg caccacactg gacagcaaga cccagagcct gctgatcgtg     360
aacaacgcca ccaacgtggt catcaaagtg tgcgagttcc agttctgcaa cgaccccttc     420
ctgggcgtct actaccacaa gaacaacaag agctggatgg aaagcgagtt ccgggtgtac     480
agcagcgcca acaactgcac cttcgagtac gtgtcccagc ctttcctgat ggacctggaa     540
ggcaagcagg gcaacttcaa gaacctgcgc gagttcgtgt tcaagaacat cgacggctac     600
ttcaaaatct acagcaagca cacccctatc aacctcgtgc gggatctgcc tcagggcttc     660
tctgctctgg aacccctggt ggatctgccc atcggcatca acatcacccg gtttcagaca     720
ctgctggccc tgcacagaag ctacctgaca cctggcgata gcagcagcgg atggacagct     780
ggtgccgccg cttactacgt gggatacctc cagccaagaa ccttcctgct gaagtacaac     840
gagaacggca ccatcaccga cgccgtggat tgtgctctgg accctctgag cgagacaaag     900
tgcaccctga agtccttcac cgtggaaaag ggcatctacc agaccagcaa cttccgggtg     960
cagcccaccg aatccatcgt gcggttcccc aatatcacca atctgtgccc cttcggcgag    1020
gtgttcaatg ccaccagatt cgcctctgtg tacgcctgga accggaagcg gatcagcaat    1080
tgcgtggccg actactccgt gctgtacaac tccgccagct tcagcacctt caagtgctac    1140
ggcgtgtccc ctaccaagct gaacgacctg tgcttcacaa acgtgtacgc cgacagcttc    1200
gtgatccggg gagatgaagt gcggcagatt gcccctggac agacaggcaa gatcgccgac    1260
tacaactaca agctgcccga cgacttcacc ggctgtgtga ttgcctggaa cagcaacaac    1320
ctggactcca aagtcggcgg caactacaat tacctgtacc ggctgttccg gaagtccaat    1380
ctgaagccct tcgagcggga catcagcacc gaaatctatc aggccggcag caccccttgc    1440
aacggcgtgg aaggcttcaa ctgctacttc ccactgcaaa gctacggctt tcagcccaca    1500
aatggcgtgg gctaccagcc ttacagagtg gtggtgctga gcttcgagct gctgcatgct    1560
cctgccacag tgtgcggccc taagaaatcc accaatctcg tgaagaacaa atgcgtgaac    1620
ttcaacttca acggcctgac cggcaccggc gtgctgacag agagcaacaa gaagttcctg    1680
ccattccagc agttcggccg ggatatcgcc gataccacag atgccgtcag agatccccag    1740
acactggaaa tcctggacat caccccatgc agcttcggcg gagtgtctgt gatcacccct    1800
ggcaccaaca ccagcaatca ggtggcagtg ctgtaccagg acgtgaactg taccgaagtg    1860
cccgtggcca ttcacgccga tcagctgaca cctacatggc gggtgtactc caccggcagc    1920
aatgtgtttc agaccagagc cggctgtctg atcggagccg agcacgtgaa caatagctac    1980
gagtgcgaca tccccatcgg cgctggcatc tgcgcctctt accagacaca gacaaacagc    2040
cccagacggg ctagaagcgt ggccagccag agcatcattg cctacacaat gtctctgggc    2100
gccgagaaca gcgtggccta ctccaacaac tctatcgcta tccccaccaa cttcaccatc    2160
agcgtgacca ccgagatcct gcctgtgtcc atgaccaaga ccagcgtgga ctgcaccatg    2220
tacatctgcg gcgattccac cgagtgctcc aacctgctgc tccagtacgg cagcttctgc    2280
acccagctga atagagccct gacagggatc gccgtggaac aggacaagaa cacccaagag    2340
gtgttcgccc aagtgaagca aatctacaag acccctccta tcaaggactt cggcggcttc    2400
aatttcagcc agattctgcc cgatcctagc aagcccagca agcggagctt catcgaggac    2460
ctgctgttca acaaagtgac actggccgac gccggcttca tcaagcagta cggcgattgt    2520
ctgggcgaca ttgccgccag ggatctgatt tgcgcccaga agtttaacgg actgacagtg    2580
ctgcctcctc tgctgaccga tgagatgatc gcccagtaca catctgccct gctggccggc    2640
acaatcacaa gcggctggac atttggagct ggcgccgctc tccagattcc attcgctatg    2700
cagatggcct accggttcaa cggcatcgga gtgacccaga atgtgctgta cgagaaccag    2760
aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc    2820
acagcaagcg ccctgggaaa gctccaggac gtcgtgaacc agaatgccca ggcactgaac    2880
accctggtca agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaacgatatc    2940
ctgagcagac tggacaaggt ggaagccgag gtgcagatcg acagactgat caccggcaga    3000
ctccagtctc tccagaccta cgtgacccag cagctgatca gagccgccga gattagagcc    3060
tctgccaatc tggccgccac caagatgtct gagtgtgtgc tgggccagag caagagagtg    3120
gacttttgcg gcaagggcta ccacctgatg agcttccctc agtctgcccc tcacggcgtg    3180
gtgtttctgc acgtgacata cgtgcccgct caagagaaga atttcaccac cgctccagcc    3240
atctgccacg acggcaaagc ccactttcct agagaaggcg tgttcgtgtc caacggcacc    3300
cattggttcg tgacacagcg gaacttctac gagccccaga tcatcaccac cgacaacacc    3360
ttcgtgtctg gcaactgcga cgttgtgatc ggcattgtga acaataccgt gtacgaccct    3420
ctccagcctg aactggactc cttcaaagag gaactcgaca agtactttaa gaaccacaca    3480
agccccgacg tggacctggg cgatatcagt                                     3510
<210>  11
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus wild-type S-protein RBD sequence
<400>  11
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
            20                  25                  30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145                 150                 155                 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
                165                 170                 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Lys Ser Thr Asn
    210
<210>  12
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD sequence
<400>  12
cgggtgcagc ccaccgaatc catcgtgcgg ttccccaata tcaccaatct gtgccccttc      60
ggcgaggtgt tcaatgccac cagattcgcc tctgtgtacg cctggaaccg gaagcggatc     120
agcaattgcg tggccgacta ctccgtgctg tacaactccg ccagcttcag caccttcaag     180
tgctacggcg tgtcccctac caagctgaac gacctgtgct tcacaaacgt gtacgccgac     240
agcttcgtga tccggggaga tgaagtgcgg cagattgccc ctggacagac aggcaagatc     300
gccgactaca actacaagct gcccgacgac ttcaccggct gtgtgattgc ctggaacagc     360
aacaacctgg actccaaagt cggcggcaac tacaattacc tgtaccggct gttccggaag     420
tccaatctga agcccttcga gcgggacatc agcaccgaaa tctatcaggc cggcagcacc     480
ccttgcaacg gcgtggaagg cttcaactgc tacttcccac tgcaaagcta cggctttcag     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tgctgagctt cgagctgctg     600
catgctcctg ccacagtgtg cggccctaag aaatccacca at                        642
<210>  13
<211>  1288
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein designed sequence
<400>  13
Met Phe Leu Phe Leu Phe Ile Ile Ile Phe Ala Phe Phe Leu Leu Ser
1               5                   10                  15
Ala Lys Ala Asn Glu Arg Cys Gly Ile Phe Thr Ser Lys Pro Gln Pro
            20                  25                  30
Lys Leu Ala Gln Val Ser Ser Ser Arg Arg Gly Val Tyr Tyr Pro Asp
        35                  40                  45
Asp Ile Phe Arg Ser Asp Val Leu His Leu Thr Gln Asp Tyr Phe Leu
    50                  55                  60
Pro Phe Asp Ser Asn Val Thr Arg Tyr Phe Ser Leu Asn Ala Asn Gly
65                  70                  75                  80
Pro Asp Arg Ile Val Tyr Phe Asp Asn Pro Ile Ile Pro Phe Lys Asp
                85                  90                  95
Gly Val Tyr Phe Ala Ala Thr Glu Lys Ser Asn Val Ile Arg Gly Trp
            100                 105                 110
Ile Phe Gly Ser Thr Leu Asp Asn Thr Ser Gln Ser Val Ile Ile Val
        115                 120                 125
Asn Asn Ser Thr Asn Val Ile Ile Arg Val Cys Asn Phe Asp Leu Cys
    130                 135                 140
Asn Asp Pro Phe Phe Thr Val Ser Arg Pro Thr Asp Lys His Ile Lys
145                 150                 155                 160
Thr Trp Ser Ile Arg Glu Phe Ala Val Tyr Gln Ser Ala Phe Asn Cys
                165                 170                 175
Thr Phe Glu Tyr Val Ser Lys Ser Phe Leu Leu Asp Val Ala Glu Lys
            180                 185                 190
Pro Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Val Asp
        195                 200                 205
Gly Phe Leu Asn Val Tyr Ser Thr Tyr Lys Pro Ile Asn Val Val Ser
    210                 215                 220
Gly Leu Pro Thr Gly Phe Ser Val Leu Lys Pro Ile Leu Lys Leu Pro
225                 230                 235                 240
Leu Gly Ile Asn Ile Thr Ser Phe Arg Val Leu Leu Thr Met Phe Arg
                245                 250                 255
Gly Asp Pro Thr Pro Gly His Thr Thr Ala Asn Trp Leu Thr Ala Ala
            260                 265                 270
Ala Ala Tyr Tyr Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu Lys
        275                 280                 285
Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ser Gln Asn
    290                 295                 300
Pro Leu Ala Glu Leu Lys Cys Thr Leu Lys Asn Phe Asn Val Asp Lys
305                 310                 315                 320
Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Ser Pro Thr Gln Glu Val
                325                 330                 335
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp Lys Val Phe
            340                 345                 350
Asn Ala Thr Arg Phe Pro Ser Val Tyr Ala Trp Glu Arg Thr Lys Ile
        355                 360                 365
Ser Asp Cys Val Ala Asp Tyr Thr Val Leu Tyr Asn Ser Thr Ser Phe
    370                 375                 380
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Ser Lys Leu Ile Asp Leu
385                 390                 395                 400
Cys Phe Thr Ser Val Tyr Ala Asp Thr Phe Leu Ile Arg Cys Ser Glu
                405                 410                 415
Val Arg Gln Val Ala Pro Gly Gln Thr Gly Val Ile Ala Asp Tyr Asn
            420                 425                 430
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Thr
        435                 440                 445
Ala Lys Gln Asp Thr Gly Ser Ser Gly Asn Tyr Asn Tyr Tyr Tyr Arg
    450                 455                 460
Ser His Arg Lys Thr Lys Leu Lys Pro Phe Glu Arg Asp Leu Ser Ser
465                 470                 475                 480
Asp Glu Cys Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro Ala Phe Asn
                485                 490                 495
Gly Val Arg Gly Phe Asn Cys Tyr Phe Thr Leu Ser Thr Tyr Asp Phe
            500                 505                 510
Asn Pro Asn Val Pro Val Glu Tyr Gln Ala Thr Arg Val Val Val Leu
        515                 520                 525
Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu
    530                 535                 540
Ser Thr Gln Leu Val Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly
545                 550                 555                 560
Leu Lys Gly Thr Gly Val Leu Thr Ala Ser Ser Lys Arg Phe Gln Ser
                565                 570                 575
Phe Gln Gln Phe Gly Arg Asp Ala Ser Asp Phe Thr Asp Ser Val Arg
            580                 585                 590
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Ser Pro Cys Ser Phe Gly
        595                 600                 605
Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Ser Glu Val Ala
    610                 615                 620
Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Pro Thr Ala Ile His
625                 630                 635                 640
Ala Asp Gln Leu Thr Pro Ala Trp Arg Val Tyr Ser Thr Gly Val Asn
                645                 650                 655
Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn
            660                 665                 670
Ala Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser
        675                 680                 685
Tyr His Thr Ala Ser Asn Ser Pro Arg Ile Leu Arg Ser Thr Gly Gln
    690                 695                 700
Lys Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Ile
705                 710                 715                 720
Ala Tyr Ala Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser
                725                 730                 735
Val Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp
            740                 745                 750
Cys Thr Met Tyr Ile Cys Gly Asp Ser Leu Glu Cys Ser Asn Leu Leu
        755                 760                 765
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
    770                 775                 780
Ile Ala Ile Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
785                 790                 795                 800
Lys Gln Met Tyr Lys Thr Pro Ala Ile Lys Asp Phe Gly Gly Phe Asn
                805                 810                 815
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Thr Lys Arg Ser Phe
            820                 825                 830
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
        835                 840                 845
Met Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Ser Ala Arg Asp Leu
    850                 855                 860
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu
865                 870                 875                 880
Thr Asp Glu Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr
                885                 890                 895
Ala Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro
            900                 905                 910
Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln
        915                 920                 925
Asn Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys
    930                 935                 940
Ala Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu
945                 950                 955                 960
Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr
                965                 970                 975
Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu
            980                 985                 990
Asn Asp Ile Leu Ser Arg Leu Asp  Lys Val Glu Ala Glu  Val Gln Ile
        995                 1000                 1005
Asp Arg  Leu Ile Thr Gly Arg  Leu Gln Ser Leu Gln  Thr Tyr Val
    1010                 1015                 1020
Thr Gln  Gln Leu Ile Arg Ala  Ala Glu Ile Arg Ala  Ser Ala Asn
    1025                 1030                 1035
Leu Ala  Ala Thr Lys Met Ser  Glu Cys Val Leu Gly  Gln Ser Lys
    1040                 1045                 1050
Arg Val  Asp Phe Cys Gly Lys  Gly Tyr His Leu Met  Ser Phe Pro
    1055                 1060                 1065
Gln Ala  Ala Pro His Gly Val  Val Phe Leu His Val  Thr Tyr Val
    1070                 1075                 1080
Pro Ser  Gln Glu Arg Asn Phe  Thr Thr Ala Pro Ala  Ile Cys His
    1085                 1090                 1095
Glu Gly  Lys Ala Tyr Phe Pro  Arg Glu Gly Val Phe  Val Ser Asn
    1100                 1105                 1110
Gly Thr  Ser Trp Phe Ile Thr  Gln Arg Asn Phe Tyr  Ser Pro Gln
    1115                 1120                 1125
Ile Ile  Thr Thr Asp Asn Thr  Phe Val Ser Gly Asn  Cys Asp Val
    1130                 1135                 1140
Val Ile  Gly Ile Ile Asn Asn  Thr Val Tyr Asp Pro  Leu Gln Pro
    1145                 1150                 1155
Glu Leu  Asp Ser Phe Lys Glu  Glu Leu Asp Lys Tyr  Phe Lys Asn
    1160                 1165                 1170
His Thr  Ser Pro Asp Val Asp  Leu Gly Asp Ile Ser  Gly Ile Asn
    1175                 1180                 1185
Ala Ser  Val Val Asn Ile Gln  Lys Glu Ile Asp Arg  Leu Asn Glu
    1190                 1195                 1200
Val Ala  Lys Asn Leu Asn Glu  Ser Leu Ile Asp Leu  Gln Glu Leu
    1205                 1210                 1215
Gly Lys  Tyr Glu Gln Tyr Ile  Lys Trp Pro Trp Tyr  Val Trp Leu
    1220                 1225                 1230
Gly Phe  Ile Ala Gly Leu Ile  Ala Ile Val Met Ala  Thr Ile Leu
    1235                 1240                 1245
Leu Cys  Cys Met Thr Ser Cys  Cys Ser Cys Leu Lys  Gly Ala Cys
    1250                 1255                 1260
Ser Cys  Gly Ser Cys Cys Lys  Phe Asp Glu Asp Asp  Ser Glu Pro
    1265                 1270                 1275
Val Leu  Lys Gly Val Lys Leu  His Tyr Thr
    1280                 1285
<210>  14
<211>  3864
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein designed sequence
<400>  14
atgtttctgt tcctcttcat tattatcttc gcattcttcc tgctgagcgc caaggccaac      60
gagagatgcg gcatcttcac cagcaagccc cagcctaagc tggcccaggt gtccagttct     120
agacggggcg tgtactaccc cgacgacatc ttcagatccg acgtgctgca tctgacccag     180
gactacttcc tgcctttcga cagcaacgtg acccggtact tcagcctgaa cgccaacgga     240
cccgaccgga tcgtgtactt cgacaaccct atcatcccct tcaaggacgg ggtgtacttt     300
gccgccaccg agaagtccaa cgtgatcaga ggctggatct tcggcagcac cctggacaat     360
accagccaga gcgtgatcat cgtgaacaac agcaccaacg tcatcatccg cgtgtgcaac     420
ttcgacctgt gcaacgaccc attcttcacc gtgtccagac caaccgacaa gcacatcaag     480
acctggtcca tccgcgagtt cgccgtgtac cagagcgcct tcaattgcac cttcgagtac     540
gtgtccaaga gctttctgct ggacgtggcc gagaagcccg gcaactttaa gcacctgaga     600
gaattcgtgt tcaagaacgt ggacggcttc ctgaacgtgt acagcaccta caagcccatc     660
aacgtggtgt ccggcctgcc tacaggattc agcgtgctga agcccatcct gaagctgccc     720
ctgggcatca acatcaccag cttcagagtg ctgctgacca tgttcagagg cgaccctaca     780
cctggccaca ccaccgctaa ttggctgaca gccgccgctg cctactacgt gggatacctg     840
aagcctacca ccttcatgct caagtacaac gagaacggca ccatcaccga cgccgtggac     900
tgtagccaaa atcctctggc cgagctgaag tgcaccctga agaacttcaa cgtggacaag     960
ggcatctacc agaccagcaa cttccgggtg tcccctacac aagaggtcgt gcggttcccc    1020
aatatcacca atctgtgccc cttcgacaag gtgttcaacg ccaccagatt tcccagcgtg    1080
tacgcctggg agcgcaccaa gatttccgat tgcgtggccg actacaccgt gctgtataac    1140
tccacctcct tcagcacctt caagtgctac ggcgtgtccc caagcaagct gatcgatctg    1200
tgcttcacct ctgtgtacgc cgacaccttc ctgatccggt gtagcgaagt gcgacaggtg    1260
gcacctggac agacaggcgt gatcgccgat tacaactaca agctgcccga cgacttcacc    1320
ggctgtgtga tcgcctggaa taccgccaag caggatacag gcagcagcgg caactacaac    1380
tactactaca gaagccaccg caagaccaag ctgaagcctt tcgagaggga cctgagcagc    1440
gacgagtgta gccctgatgg caagccttgt acacctcctg ccttcaatgg cgtgcggggc    1500
ttcaactgct acttcaccct gagcacctac gacttcaacc ccaacgtgcc cgtggaatac    1560
caggccacaa gagtggtggt gctgagcttc gagctgctga atgcccctgc cacagtgtgt    1620
ggccctaagc tgtctaccca gctggtcaag aaccagtgcg tgaacttcaa tttcaacggc    1680
ctgaaaggca ccggcgtgct gaccgccagc agcaagagat tccagagctt ccagcagttc    1740
ggcagggacg ccagcgattt cacagatagc gtcagagatc cccagacact ggaaatcctg    1800
gacatcagcc cttgcagctt cggcggagtg tctgtgatca cccctggcac caatacctct    1860
agcgaggtgg cagtgctgta ccaggacgtg aactgcaccg atgtgcctac agccatccac    1920
gccgatcagc tgacaccagc ttggagagtg tactctaccg gtgtcaacgt gttccagaca    1980
caagccggct gtctgattgg agccgaacac gtgaacgcca gctacgagtg cgacatccct    2040
atcggagccg gcatctgtgc ctcttaccac accgcctcta acagccccag aatcctgaga    2100
agcaccggcc agaaatccat cgtggcctac acaatgtctc tgggcgccga gaactctatc    2160
gcctacgcca acaactccat tgctatcccc accaacttca gcatctccgt gaccaccgaa    2220
gtgatgcctg tgtccatggc caagaccagc gtggactgca caatgtacat ctgcggcgac    2280
agcctggaat gcagcaacct gctgctccag tacggcagct tctgcaccca gctgaataga    2340
gccctgaccg gaatcgccat cgagcaggac aagaacaccc aagaggtgtt cgcccaagtg    2400
aagcagatgt ataagacccc tgccatcaag gacttcggcg gctttaactt cagccagatc    2460
ctgcctgatc ctagcaagcc caccaagcgg agcttcatcg aggacctgct gttcaacaaa    2520
gtgaccctgg ccgacgccgg ctttatgaag cagtatggcg agtgcctggg cgacatctct    2580
gccagggatc tgatttgcgc ccagaagttc aacggactga ccgtgctgcc tcctctgctg    2640
accgatgaga tgatcgccgc ctatacagcc gctctggtgt ctggcacagc taccgccgga    2700
tggacatttg gagctggcgc cgctctccag attccattcg ctatgcagat ggcctaccgc    2760
ttcaacggca tcggcgtgac ccagaacgtg ctgtacgaga accagaagca gatcgccaac    2820
cagttcaaca aggccatcag tcagatccaa gagagcctga ccacaaccag cacagccctg    2880
ggaaagctcc aggacgtcgt gaaccagaat gcccaggctc tgaacaccct ggtcaagcag    2940
ctgagcagca atttcggcgc catcagctcc gtgctgaacg acatcctgag ccggctggat    3000
aaggtggaag ccgaggtgca gatcgaccgg ctgattacag gcagactcca gtctctccag    3060
acctacgtga cacagcagct gatcagagcc gccgagatta gagcctctgc caatctggcc    3120
gccaccaaga tgtctgagtg tgtgctgggc cagtctaaga gagtggactt ctgcggcaag    3180
ggctaccacc tgatgagctt ccctcaggct gctcctcacg gcgtggtgtt tctgcacgtg    3240
acatacgtgc ccagccaaga gcggaacttc acaactgccc cagccatctg ccacgagggc    3300
aaagcctact ttcccagaga aggcgtgttc gtgtccaacg gcacctcctg gttcatcacc    3360
cagagaaact tctacagccc tcagatcatc accaccgaca acaccttcgt gtccggcaac    3420
tgcgacgtgg tcatcggcat catcaacaat accgtgtacg accctctcca gccagaactg    3480
gatagcttca aagaggaact cgacaagtac ttcaagaatc acacaagccc cgacgtggac    3540
ctgggcgata tcagcggaat caatgccagc gtggtcaaca tccagaaaga gatcgacaga    3600
ctgaacgagg tggccaagaa cctgaacgag tccctgatcg acctgcaaga gctggggaag    3660
tacgagcagt acatcaagtg gccttggtac gtgtggctgg gctttatcgc cggactgatc    3720
gccattgtga tggccaccat cctgctgtgc tgcatgacaa gctgctgtag ctgcctgaag    3780
ggcgcctgta gctgtggcag ctgctgcaag ttcgacgagg acgattctga gcctgtgctg    3840
aaaggcgtga agctgcacta cacc                                           3864
<210>  15
<211>  1185
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus trS-protein designed sequence
<400>  15
Met Phe Leu Phe Leu Phe Ile Ile Ile Phe Ala Phe Phe Leu Leu Ser
1               5                   10                  15
Ala Lys Ala Asn Glu Arg Cys Gly Ile Phe Thr Ser Lys Pro Gln Pro
            20                  25                  30
Lys Leu Ala Gln Val Ser Ser Ser Arg Arg Gly Val Tyr Tyr Pro Asp
        35                  40                  45
Asp Ile Phe Arg Ser Asp Val Leu His Leu Thr Gln Asp Tyr Phe Leu
    50                  55                  60
Pro Phe Asp Ser Asn Val Thr Arg Tyr Phe Ser Leu Asn Ala Asn Gly
65                  70                  75                  80
Pro Asp Arg Ile Val Tyr Phe Asp Asn Pro Ile Ile Pro Phe Lys Asp
                85                  90                  95
Gly Val Tyr Phe Ala Ala Thr Glu Lys Ser Asn Val Ile Arg Gly Trp
            100                 105                 110
Ile Phe Gly Ser Thr Leu Asp Asn Thr Ser Gln Ser Val Ile Ile Val
        115                 120                 125
Asn Asn Ser Thr Asn Val Ile Ile Arg Val Cys Asn Phe Asp Leu Cys
    130                 135                 140
Asn Asp Pro Phe Phe Thr Val Ser Arg Pro Thr Asp Lys His Ile Lys
145                 150                 155                 160
Thr Trp Ser Ile Arg Glu Phe Ala Val Tyr Gln Ser Ala Phe Asn Cys
                165                 170                 175
Thr Phe Glu Tyr Val Ser Lys Ser Phe Leu Leu Asp Val Ala Glu Lys
            180                 185                 190
Pro Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Val Asp
        195                 200                 205
Gly Phe Leu Asn Val Tyr Ser Thr Tyr Lys Pro Ile Asn Val Val Ser
    210                 215                 220
Gly Leu Pro Thr Gly Phe Ser Val Leu Lys Pro Ile Leu Lys Leu Pro
225                 230                 235                 240
Leu Gly Ile Asn Ile Thr Ser Phe Arg Val Leu Leu Thr Met Phe Arg
                245                 250                 255
Gly Asp Pro Thr Pro Gly His Thr Thr Ala Asn Trp Leu Thr Ala Ala
            260                 265                 270
Ala Ala Tyr Tyr Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu Lys
        275                 280                 285
Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ser Gln Asn
    290                 295                 300
Pro Leu Ala Glu Leu Lys Cys Thr Leu Lys Asn Phe Asn Val Asp Lys
305                 310                 315                 320
Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Ser Pro Thr Gln Glu Val
                325                 330                 335
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp Lys Val Phe
            340                 345                 350
Asn Ala Thr Arg Phe Pro Ser Val Tyr Ala Trp Glu Arg Thr Lys Ile
        355                 360                 365
Ser Asp Cys Val Ala Asp Tyr Thr Val Leu Tyr Asn Ser Thr Ser Phe
    370                 375                 380
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Ser Lys Leu Ile Asp Leu
385                 390                 395                 400
Cys Phe Thr Ser Val Tyr Ala Asp Thr Phe Leu Ile Arg Cys Ser Glu
                405                 410                 415
Val Arg Gln Val Ala Pro Gly Gln Thr Gly Val Ile Ala Asp Tyr Asn
            420                 425                 430
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Thr
        435                 440                 445
Ala Lys Gln Asp Thr Gly Ser Ser Gly Asn Tyr Asn Tyr Tyr Tyr Arg
    450                 455                 460
Ser His Arg Lys Thr Lys Leu Lys Pro Phe Glu Arg Asp Leu Ser Ser
465                 470                 475                 480
Asp Glu Cys Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro Ala Phe Asn
                485                 490                 495
Gly Val Arg Gly Phe Asn Cys Tyr Phe Thr Leu Ser Thr Tyr Asp Phe
            500                 505                 510
Asn Pro Asn Val Pro Val Glu Tyr Gln Ala Thr Arg Val Val Val Leu
        515                 520                 525
Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu
    530                 535                 540
Ser Thr Gln Leu Val Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly
545                 550                 555                 560
Leu Lys Gly Thr Gly Val Leu Thr Ala Ser Ser Lys Arg Phe Gln Ser
                565                 570                 575
Phe Gln Gln Phe Gly Arg Asp Ala Ser Asp Phe Thr Asp Ser Val Arg
            580                 585                 590
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Ser Pro Cys Ser Phe Gly
        595                 600                 605
Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Ser Glu Val Ala
    610                 615                 620
Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Pro Thr Ala Ile His
625                 630                 635                 640
Ala Asp Gln Leu Thr Pro Ala Trp Arg Val Tyr Ser Thr Gly Val Asn
                645                 650                 655
Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn
            660                 665                 670
Ala Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser
        675                 680                 685
Tyr His Thr Ala Ser Asn Ser Pro Arg Ile Leu Arg Ser Thr Gly Gln
    690                 695                 700
Lys Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Ile
705                 710                 715                 720
Ala Tyr Ala Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser
                725                 730                 735
Val Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp
            740                 745                 750
Cys Thr Met Tyr Ile Cys Gly Asp Ser Leu Glu Cys Ser Asn Leu Leu
        755                 760                 765
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
    770                 775                 780
Ile Ala Ile Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
785                 790                 795                 800
Lys Gln Met Tyr Lys Thr Pro Ala Ile Lys Asp Phe Gly Gly Phe Asn
                805                 810                 815
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Thr Lys Arg Ser Phe
            820                 825                 830
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
        835                 840                 845
Met Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Ser Ala Arg Asp Leu
    850                 855                 860
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu
865                 870                 875                 880
Thr Asp Glu Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr
                885                 890                 895
Ala Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro
            900                 905                 910
Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln
        915                 920                 925
Asn Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys
    930                 935                 940
Ala Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu
945                 950                 955                 960
Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr
                965                 970                 975
Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu
            980                 985                 990
Asn Asp Ile Leu Ser Arg Leu Asp  Lys Val Glu Ala Glu  Val Gln Ile
        995                 1000                 1005
Asp Arg  Leu Ile Thr Gly Arg  Leu Gln Ser Leu Gln  Thr Tyr Val
    1010                 1015                 1020
Thr Gln  Gln Leu Ile Arg Ala  Ala Glu Ile Arg Ala  Ser Ala Asn
    1025                 1030                 1035
Leu Ala  Ala Thr Lys Met Ser  Glu Cys Val Leu Gly  Gln Ser Lys
    1040                 1045                 1050
Arg Val  Asp Phe Cys Gly Lys  Gly Tyr His Leu Met  Ser Phe Pro
    1055                 1060                 1065
Gln Ala  Ala Pro His Gly Val  Val Phe Leu His Val  Thr Tyr Val
    1070                 1075                 1080
Pro Ser  Gln Glu Arg Asn Phe  Thr Thr Ala Pro Ala  Ile Cys His
    1085                 1090                 1095
Glu Gly  Lys Ala Tyr Phe Pro  Arg Glu Gly Val Phe  Val Ser Asn
    1100                 1105                 1110
Gly Thr  Ser Trp Phe Ile Thr  Gln Arg Asn Phe Tyr  Ser Pro Gln
    1115                 1120                 1125
Ile Ile  Thr Thr Asp Asn Thr  Phe Val Ser Gly Asn  Cys Asp Val
    1130                 1135                 1140
Val Ile  Gly Ile Ile Asn Asn  Thr Val Tyr Asp Pro  Leu Gln Pro
    1145                 1150                 1155
Glu Leu  Asp Ser Phe Lys Glu  Glu Leu Asp Lys Tyr  Phe Lys Asn
    1160                 1165                 1170
His Thr  Ser Pro Asp Val Asp  Leu Gly Asp Ile Ser
    1175                 1180                 1185
<210>  16
<211>  3555
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus trS-protein designed sequence
<400>  16
atgtttctgt tcctcttcat tattatcttc gcattcttcc tgctgagcgc caaggccaac      60
gagagatgcg gcatcttcac cagcaagccc cagcctaagc tggcccaggt gtccagttct     120
agacggggcg tgtactaccc cgacgacatc ttcagatccg acgtgctgca tctgacccag     180
gactacttcc tgcctttcga cagcaacgtg acccggtact tcagcctgaa cgccaacgga     240
cccgaccgga tcgtgtactt cgacaaccct atcatcccct tcaaggacgg ggtgtacttt     300
gccgccaccg agaagtccaa cgtgatcaga ggctggatct tcggcagcac cctggacaat     360
accagccaga gcgtgatcat cgtgaacaac agcaccaacg tcatcatccg cgtgtgcaac     420
ttcgacctgt gcaacgaccc attcttcacc gtgtccagac caaccgacaa gcacatcaag     480
acctggtcca tccgcgagtt cgccgtgtac cagagcgcct tcaattgcac cttcgagtac     540
gtgtccaaga gctttctgct ggacgtggcc gagaagcccg gcaactttaa gcacctgaga     600
gaattcgtgt tcaagaacgt ggacggcttc ctgaacgtgt acagcaccta caagcccatc     660
aacgtggtgt ccggcctgcc tacaggattc agcgtgctga agcccatcct gaagctgccc     720
ctgggcatca acatcaccag cttcagagtg ctgctgacca tgttcagagg cgaccctaca     780
cctggccaca ccaccgctaa ttggctgaca gccgccgctg cctactacgt gggatacctg     840
aagcctacca ccttcatgct caagtacaac gagaacggca ccatcaccga cgccgtggac     900
tgtagccaaa atcctctggc cgagctgaag tgcaccctga agaacttcaa cgtggacaag     960
ggcatctacc agaccagcaa cttccgggtg tcccctacac aagaggtcgt gcggttcccc    1020
aatatcacca atctgtgccc cttcgacaag gtgttcaacg ccaccagatt tcccagcgtg    1080
tacgcctggg agcgcaccaa gatttccgat tgcgtggccg actacaccgt gctgtataac    1140
tccacctcct tcagcacctt caagtgctac ggcgtgtccc caagcaagct gatcgatctg    1200
tgcttcacct ctgtgtacgc cgacaccttc ctgatccggt gtagcgaagt gcgacaggtg    1260
gcacctggac agacaggcgt gatcgccgat tacaactaca agctgcccga cgacttcacc    1320
ggctgtgtga tcgcctggaa taccgccaag caggatacag gcagcagcgg caactacaac    1380
tactactaca gaagccaccg caagaccaag ctgaagcctt tcgagaggga cctgagcagc    1440
gacgagtgta gccctgatgg caagccttgt acacctcctg ccttcaatgg cgtgcggggc    1500
ttcaactgct acttcaccct gagcacctac gacttcaacc ccaacgtgcc cgtggaatac    1560
caggccacaa gagtggtggt gctgagcttc gagctgctga atgcccctgc cacagtgtgt    1620
ggccctaagc tgtctaccca gctggtcaag aaccagtgcg tgaacttcaa tttcaacggc    1680
ctgaaaggca ccggcgtgct gaccgccagc agcaagagat tccagagctt ccagcagttc    1740
ggcagggacg ccagcgattt cacagatagc gtcagagatc cccagacact ggaaatcctg    1800
gacatcagcc cttgcagctt cggcggagtg tctgtgatca cccctggcac caatacctct    1860
agcgaggtgg cagtgctgta ccaggacgtg aactgcaccg atgtgcctac agccatccac    1920
gccgatcagc tgacaccagc ttggagagtg tactctaccg gtgtcaacgt gttccagaca    1980
caagccggct gtctgattgg agccgaacac gtgaacgcca gctacgagtg cgacatccct    2040
atcggagccg gcatctgtgc ctcttaccac accgcctcta acagccccag aatcctgaga    2100
agcaccggcc agaaatccat cgtggcctac acaatgtctc tgggcgccga gaactctatc    2160
gcctacgcca acaactccat tgctatcccc accaacttca gcatctccgt gaccaccgaa    2220
gtgatgcctg tgtccatggc caagaccagc gtggactgca caatgtacat ctgcggcgac    2280
agcctggaat gcagcaacct gctgctccag tacggcagct tctgcaccca gctgaataga    2340
gccctgaccg gaatcgccat cgagcaggac aagaacaccc aagaggtgtt cgcccaagtg    2400
aagcagatgt ataagacccc tgccatcaag gacttcggcg gctttaactt cagccagatc    2460
ctgcctgatc ctagcaagcc caccaagcgg agcttcatcg aggacctgct gttcaacaaa    2520
gtgaccctgg ccgacgccgg ctttatgaag cagtatggcg agtgcctggg cgacatctct    2580
gccagggatc tgatttgcgc ccagaagttc aacggactga ccgtgctgcc tcctctgctg    2640
accgatgaga tgatcgccgc ctatacagcc gctctggtgt ctggcacagc taccgccgga    2700
tggacatttg gagctggcgc cgctctccag attccattcg ctatgcagat ggcctaccgc    2760
ttcaacggca tcggcgtgac ccagaacgtg ctgtacgaga accagaagca gatcgccaac    2820
cagttcaaca aggccatcag tcagatccaa gagagcctga ccacaaccag cacagccctg    2880
ggaaagctcc aggacgtcgt gaaccagaat gcccaggctc tgaacaccct ggtcaagcag    2940
ctgagcagca atttcggcgc catcagctcc gtgctgaacg acatcctgag ccggctggat    3000
aaggtggaag ccgaggtgca gatcgaccgg ctgattacag gcagactcca gtctctccag    3060
acctacgtga cacagcagct gatcagagcc gccgagatta gagcctctgc caatctggcc    3120
gccaccaaga tgtctgagtg tgtgctgggc cagtctaaga gagtggactt ctgcggcaag    3180
ggctaccacc tgatgagctt ccctcaggct gctcctcacg gcgtggtgtt tctgcacgtg    3240
acatacgtgc ccagccaaga gcggaacttc acaactgccc cagccatctg ccacgagggc    3300
aaagcctact ttcccagaga aggcgtgttc gtgtccaacg gcacctcctg gttcatcacc    3360
cagagaaact tctacagccc tcagatcatc accaccgaca acaccttcgt gtccggcaac    3420
tgcgacgtgg tcatcggcat catcaacaat accgtgtacg accctctcca gccagaactg    3480
gatagcttca aagaggaact cgacaagtac ttcaagaatc acacaagccc cgacgtggac    3540
ctgggcgata tcagt                                                     3555
<210>  17
<211>  219
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  17
Arg Val Ser Pro Thr Gln Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Asp Lys Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Thr Lys Ile Ser Asp Cys Val Ala Asp Tyr Thr
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Ser Lys Leu Ile Asp Leu Cys Phe Thr Ser Val Tyr Ala Asp
65                  70                  75                  80
Thr Phe Leu Ile Arg Cys Ser Glu Val Arg Gln Val Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Ala Lys Gln Asp Thr Gly Ser Ser
        115                 120                 125
Gly Asn Tyr Asn Tyr Tyr Tyr Arg Ser His Arg Lys Thr Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Leu Ser Ser Asp Glu Cys Ser Pro Asp Gly Lys
145                 150                 155                 160
Pro Cys Thr Pro Pro Ala Phe Asn Gly Val Arg Gly Phe Asn Cys Tyr
                165                 170                 175
Phe Thr Leu Ser Thr Tyr Asp Phe Asn Pro Asn Val Pro Val Glu Tyr
            180                 185                 190
Gln Ala Thr Arg Val Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro
        195                 200                 205
Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Gln
    210                 215
<210>  18
<211>  657
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  18
cgggtgtccc ctacacaaga ggtcgtgcgg ttccccaata tcaccaatct gtgccccttc      60
gacaaggtgt tcaacgccac cagatttccc agcgtgtacg cctgggagcg caccaagatt     120
tccgattgcg tggccgacta caccgtgctg tataactcca cctccttcag caccttcaag     180
tgctacggcg tgtccccaag caagctgatc gatctgtgct tcacctctgt gtacgccgac     240
accttcctga tccggtgtag cgaagtgcga caggtggcac ctggacagac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaatacc     360
gccaagcagg atacaggcag cagcggcaac tacaactact actacagaag ccaccgcaag     420
accaagctga agcctttcga gagggacctg agcagcgacg agtgtagccc tgatggcaag     480
ccttgtacac ctcctgcctt caatggcgtg cggggcttca actgctactt caccctgagc     540
acctacgact tcaaccccaa cgtgcccgtg gaataccagg ccacaagagt ggtggtgctg     600
agcttcgagc tgctgaatgc ccctgccaca gtgtgtggcc ctaagctgtc tacccag        657
<210>  19
<211>  91
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  pEVAC Multiple Cloning Site sequence
<400>  19
acagactgtt cctttccatg ggtcttttct gcagtcaccg tcggtaccgt cgacacgtgt      60
gatcatctag aggatccgcg gccgcagatc t                                     91
<210>  20
<211>  4405
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  pEVAC sequence
<400>  20
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca      60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg     120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc     180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcagattgg     240
ctattggcca ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg     300
tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac     360
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg     420
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc     480
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac     540
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa     600
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac     660
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta     720
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga     780
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa     840
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag     900
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca     960
tagaagacac cgggaccgat ccagcctcca tcggctcgca tctctccttc acgcgcccgc    1020
cgccctacct gaggccgcca tccacgccgg ttgagtcgcg ttctgccgcc tcccgcctgt    1080
ggtgcctcct gaactgcgtc cgccgtctag gtaagtttaa agctcaggtc gagaccgggc    1140
ctttgtccgg cgctcccttg gagcctacct agactcagcc ggctctccac gctttgcctg    1200
accctgcttg ctcaactcta gttaacggtg gagggcagtg tagtctgagc agtactcgtt    1260
gctgccgcgc gcgccaccag acataatagc tgacagacta acagactgtt cctttccatg    1320
ggtcttttct gcagtcaccg tcggtaccgt cgacacgtgt gatcatctag aggatccgcg    1380
gccgcagatc tgctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc    1440
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg    1500
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca    1560
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggcta    1620
cccaggtgct gaagaattga cccggttcct cctgggccag aaagaagcag gcacatcccc    1680
ttctctgtga cacaccctgt ccacgcccct ggttcttagt tccagcccca ctcataggac    1740
actcatagct caggagggct ccgccttcaa tcccacccgc taaagtactt ggagcggtct    1800
ctccctccct catcagccca ccaaaccaaa cctagcctcc aagagtggga agaaattaaa    1860
gcaagatagg ctattaagtg cagagggaga gaaaatgcct ccaacatgtg aggaagtaat    1920
gagagaaatc atagaatttt aaggccatga tttaaggcca tcatggcctt aatcttccgc    1980
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca    2040
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg    2100
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca    2160
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa    2220
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc    2280
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc    2340
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct    2400
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg    2460
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag    2520
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta    2580
cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg    2640
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt    2700
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt    2760
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag    2820
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat    2880
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc    2940
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactcgggg ggggggggcg    3000
ctgaggtctg cctcgtgaag aaggtgttgc tgactcatac caggcctgaa tcgccccatc    3060
atccagccag aaagtgaggg agccacggtt gatgagagct ttgttgtagg tggaccagtt    3120
ggtgattttg aacttttgct ttgccacgga acggtctgcg ttgtcgggaa gatgcgtgat    3180
ctgatccttc aactcagcaa aagttcgatt tattcaacaa agccgccgtc ccgtcaagtc    3240
agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg    3300
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa    3360
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc    3420
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg    3480
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat    3540
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca    3600
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga    3660
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg    3720
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg    3780
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata    3840
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca    3900
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg    3960
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat    4020
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt    4080
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacagtttt    4140
attgttcatg atgatatatt tttatcttgt gcaatgtaac atcagagatt ttgagacaca    4200
acgtggcttt cccccccccc ccattattga agcatttatc agggttattg tctcatgagc    4260
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc    4320
cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat    4380
aggcgtatca cgaggccctt tcgtc                                          4405
<210>  21
<211>  76
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  SARS envelope protein sequence
<400>  21
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu Val
65                  70                  75
<210>  22
<211>  76
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus envelope protein designed sequence
<400>  22
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Thr Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Gln Gly Val Pro Asp Leu Leu Val
65                  70                  75
<210>  23
<211>  75
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus envelope protein designed sequence
<400>  23
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Thr Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65                  70                  75
<210>  24
<211>  221
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus M protein designed sequence
<400>  24
Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu
1               5                   10                  15
Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met
            20                  25                  30
Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile
        35                  40                  45
Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe
    50                  55                  60
Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala
65                  70                  75                  80
Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val
                85                  90                  95
Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn
            100                 105                 110
Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Leu
        115                 120                 125
Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile
    130                 135                 140
Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile
145                 150                 155                 160
Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser
                165                 170                 175
Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe
            180                 185                 190
Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp
        195                 200                 205
His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Gln
    210                 215                 220
<210>  25
<211>  222
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus M protein designed sequence
<400>  25
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1               5                   10                  15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
            20                  25                  30
Cys Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile
        35                  40                  45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
    50                  55                  60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile
65                  70                  75                  80
Ala Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe
                85                  90                  95
Val Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
            100                 105                 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Ser Ile
        115                 120                 125
Ile Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile
    130                 135                 140
Leu Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp
145                 150                 155                 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
                165                 170                 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Ser Asp Ser Gly
            180                 185                 190
Phe Ala Val Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
        195                 200                 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
    210                 215                 220
<210>  26
<211>  222
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus M protein reference sequence
<400>  26
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1               5                   10                  15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
            20                  25                  30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
        35                  40                  45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
    50                  55                  60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65                  70                  75                  80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
                85                  90                  95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
            100                 105                 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
        115                 120                 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
    130                 135                 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145                 150                 155                 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
                165                 170                 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
            180                 185                 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
        195                 200                 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
    210                 215                 220
<210>  27
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  27
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Leu Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  28
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  28
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Ile Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  29
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  29
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Leu Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  30
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  30
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Leu Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Gln Ala Gly Ser Thr
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
                165                 170                 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  31
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  31
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Ile Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Thr Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  32
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  32
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Leu Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Thr Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp
    210
<210>  33
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<220>
<221>  MISC_FEATURE
<222>  (203)..(203)
<223>  Glycosylation site introduced at this residue
<400>  33
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
            20                  25                  30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145                 150                 155                 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
                165                 170                 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Asn Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Lys Ser Thr Asn
    210
<210>  34
<211>  214
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<220>
<221>  MISC_FEATURE
<222>  (13)..(13)
<223>  Glycosylation site deleted at this residue
<220>
<221>  MISC_FEATURE
<222>  (25)..(25)
<223>  Glycosylation site deleted at this residue
<220>
<221>  MISC_FEATURE
<222>  (54)..(54)
<223>  Glycosylation site introduced at this residue
<400>  34
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Gln Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val
            20                  25                  30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145                 150                 155                 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
                165                 170                 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Lys Ser Thr Asn
    210
<210>  35
<211>  219
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<220>
<221>  MISC_FEATURE
<222>  (203)..(203)
<223>  Glycosylation site introduced at this residue
<400>  35
Arg Val Ser Pro Thr Gln Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Asp Lys Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Thr Lys Ile Ser Asp Cys Val Ala Asp Tyr Thr
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Ser Lys Leu Ile Asp Leu Cys Phe Thr Ser Val Tyr Ala Asp
65                  70                  75                  80
Thr Phe Leu Ile Arg Cys Ser Glu Val Arg Gln Val Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Ala Lys Gln Asp Thr Gly Ser Ser
        115                 120                 125
Gly Asn Tyr Asn Tyr Tyr Tyr Arg Ser His Arg Lys Thr Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Leu Ser Ser Asp Glu Cys Ser Pro Asp Gly Lys
145                 150                 155                 160
Pro Cys Thr Pro Pro Ala Phe Asn Gly Val Arg Gly Phe Asn Cys Tyr
                165                 170                 175
Phe Thr Leu Ser Thr Tyr Asp Phe Asn Pro Asn Val Pro Val Glu Tyr
            180                 185                 190
Gln Ala Thr Arg Val Val Val Leu Ser Phe Glu Leu Leu Asn Ala Asn
        195                 200                 205
Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Gln
    210                 215
<210>  36
<211>  219
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<220>
<221>  MISC_FEATURE
<222>  (13)..(13)
<223>  Glycosylation site deleted at this residue
<220>
<221>  MISC_FEATURE
<222>  (25)..(25)
<223>  Glycosylation site deleted at this residue
<400>  36
Arg Val Ser Pro Thr Gln Glu Val Val Arg Phe Pro Gln Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Asp Lys Val Phe Gln Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Thr Lys Ile Ser Asp Cys Val Ala Asp Tyr Thr
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Ser Lys Leu Ile Asp Leu Cys Phe Thr Ser Val Tyr Ala Asp
65                  70                  75                  80
Thr Phe Leu Ile Arg Cys Ser Glu Val Arg Gln Val Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Ala Lys Gln Asp Thr Gly Ser Ser
        115                 120                 125
Gly Asn Tyr Asn Tyr Tyr Tyr Arg Ser His Arg Lys Thr Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Leu Ser Ser Asp Glu Cys Ser Pro Asp Gly Lys
145                 150                 155                 160
Pro Cys Thr Pro Pro Ala Phe Asn Gly Val Arg Gly Phe Asn Cys Tyr
                165                 170                 175
Phe Thr Leu Ser Thr Tyr Asp Phe Asn Pro Asn Val Pro Val Glu Tyr
            180                 185                 190
Gln Ala Thr Arg Val Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro
        195                 200                 205
Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Gln
    210                 215
<210>  37
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  37
cgggtgcagc ccaccgaatc catcgtgcgg ttccccaata tcaccaatct gtgccccttc      60
ggcgaggtgt tcaatgccac cagattcgcc tctgtgtacg cctggaaccg gaagcggatc     120
agcaattgcg tggccgacta ctccgtgctg tacaactccg ccagcttcag caccttcaag     180
tgctacggcg tgtcccctac caagctgaac gacctgtgct tcacaaacgt gtacgccgac     240
agcttcgtga tccggggaga tgaagtgcgg cagattgccc ctggacagac aggcaagatc     300
gccgactaca actacaagct gcccgacgac ttcaccggct gtgtgattgc ctggaacagc     360
aacaacctgg actccaaagt cggcggcaac tacaattacc tgtaccggct gttccggaag     420
tccaatctga agcccttcga gcgggacatc agcaccgaaa tctatcaggc cggcagcacc     480
ccttgcaacg gcgtggaagg cttcaactgc tacttcccac tgcaaagcta cggctttcag     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tgctgagctt cgagctgctg     600
catgctaacg ccacagtgtg cggccctaag aaatccacca at                        642
<210>  38
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  38
cgggtgcagc ccaccgaatc catcgtgcgg ttcccccaga tcaccaatct gtgccccttc      60
ggcgaggtgt tccaggccac cagattcgcc tctgtgtacg cctggaaccg gaagcggatc     120
agcaattgcg tggccgacta ctccgtgctg tacaactcca ccagcttcag caccttcaag     180
tgctacggcg tgtcccctac caagctgaac gacctgtgct tcacaaacgt gtacgccgac     240
agcttcgtga tccggggaga tgaagtgcgg cagattgccc ctggacagac aggcaagatc     300
gccgactaca actacaagct gcccgacgac ttcaccggct gtgtgattgc ctggaacagc     360
aacaacctgg actccaaagt cggcggcaac tacaattacc tgtaccggct gttccggaag     420
tccaatctga agcccttcga gcgggacatc agcaccgaaa tctatcaggc cggcagcacc     480
ccttgcaacg gcgtggaagg cttcaactgc tacttcccac tgcaaagcta cggctttcag     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tgctgagctt cgagctgctg     600
catgctcctg ccacagtgtg cggccctaag aaatccacca at                        642
<210>  39
<211>  657
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  39
cgggtgtccc ctacacaaga ggtcgtgcgg ttccccaata tcaccaatct gtgccccttc      60
gacaaggtgt tcaacgccac cagatttccc agcgtgtacg cctgggagcg caccaagatt     120
tccgattgcg tggccgacta caccgtgctg tataactcca cctccttcag caccttcaag     180
tgctacggcg tgtccccaag caagctgatc gatctgtgct tcacctctgt gtacgccgac     240
accttcctga tccggtgtag cgaagtgcga caggtggcac ctggacagac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaatacc     360
gccaagcagg atacaggcag cagcggcaac tacaactact actacagaag ccaccgcaag     420
accaagctga agcctttcga gagggacctg agcagcgacg agtgtagccc tgatggcaag     480
ccttgtacac ctcctgcctt caatggcgtg cggggcttca actgctactt caccctgagc     540
acctacgact tcaaccccaa cgtgcccgtg gaataccagg ccacaagagt ggtggtgctg     600
agcttcgagc tgctgaatgc caacgccaca gtgtgtggcc ctaagctgtc tacccag        657
<210>  40
<211>  657
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed sequence
<400>  40
cgggtgtccc ctacacaaga ggtcgtgcgg ttcccccaga tcaccaatct gtgccccttc      60
gacaaggtgt tccaggccac cagatttccc agcgtgtacg cctgggagcg caccaagatt     120
tccgattgcg tggccgacta caccgtgctg tataactcca cctccttcag caccttcaag     180
tgctacggcg tgtccccaag caagctgatc gatctgtgct tcacctctgt gtacgccgac     240
accttcctga tccggtgtag cgaagtgcga caggtggcac ctggacagac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaatacc     360
gccaagcagg atacaggcag cagcggcaac tacaactact actacagaag ccaccgcaag     420
accaagctga agcctttcga gagggacctg agcagcgacg agtgtagccc tgatggcaag     480
ccttgtacac ctcctgcctt caatggcgtg cggggcttca actgctactt caccctgagc     540
acctacgact tcaaccccaa cgtgcccgtg gaataccagg ccacaagagt ggtggtgctg     600
agcttcgagc tgctgaatgc ccctgccaca gtgtgtggcc ctaagctgtc tacccag        657
<210>  41
<211>  75
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  SARS2 envelope protein reference sequence
<400>  41
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65                  70                  75
<210>  42
<211>  75
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus envelope protein designed sequence
<400>  42
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Ala Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65                  70                  75
<210>  43
<211>  76
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus envelope protein designed sequence
<400>  43
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Ala Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Thr Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Gln Gly Val Pro Asp Leu Leu Val
65                  70                  75
<210>  44
<211>  75
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus envelope protein designed sequence
<400>  44
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Ala Ser
1               5                   10                  15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
            20                  25                  30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
        35                  40                  45
Val Ser Leu Val Lys Pro Thr Phe Tyr Val Tyr Ser Arg Val Lys Asn
    50                  55                  60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65                  70                  75
<210>  45
<211>  419
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus nucleoprotein reference sequence
<400>  45
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1               5                   10                  15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
            20                  25                  30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
        35                  40                  45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
    50                  55                  60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65                  70                  75                  80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
                85                  90                  95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
            100                 105                 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
        115                 120                 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
    130                 135                 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145                 150                 155                 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
                165                 170                 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
            180                 185                 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
        195                 200                 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
    210                 215                 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225                 230                 235                 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
                245                 250                 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
            260                 265                 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
        275                 280                 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
    290                 295                 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305                 310                 315                 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
                325                 330                 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
            340                 345                 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
        355                 360                 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
    370                 375                 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385                 390                 395                 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
                405                 410                 415
Thr Gln Ala
<210>  46
<211>  418
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus nucleoprotein designed sequence
<400>  46
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Ser Ala Pro Arg Ile Thr
1               5                   10                  15
Phe Gly Gly Pro Ser Asp Ser Thr Asp Asn Asn Gln Asn Gly Glu Arg
            20                  25                  30
Ser Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
        35                  40                  45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
    50                  55                  60
Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly Lys
65                  70                  75                  80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg Gly
                85                  90                  95
Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
            100                 105                 110
Leu Gly Thr Gly Pro Glu Ala Ala Leu Pro Tyr Gly Ala Asn Lys Glu
        115                 120                 125
Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
    130                 135                 140
His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Ile Val Leu Gln
145                 150                 155                 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
                165                 170                 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Gly
            180                 185                 190
Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
        195                 200                 205
Arg Met Ala Ser Gly Gly Gly Asp Thr Ala Leu Ala Leu Leu Leu Leu
    210                 215                 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln Gln
225                 230                 235                 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
                245                 250                 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr Gln
            260                 265                 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
        275                 280                 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
    290                 295                 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Glu
305                 310                 315                 320
Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly Ala Ile Lys Leu
                325                 330                 335
Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile Leu Leu Asn Lys
            340                 345                 350
His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp
        355                 360                 365
Lys Lys Lys Lys Ala Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln Lys
    370                 375                 380
Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe
385                 390                 395                 400
Ser Lys Gln Leu Gln Asn Ser Met Ser Gly Ala Ser Ala Asp Ser Thr
                405                 410                 415
Gln Ala
<210>  47
<211>  417
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus nucleoprotein designed sequence
<400>  47
Met Thr Asp Asn Gly Gln Gln Gly Pro Arg Asn Ala Pro Arg Ile Thr
1               5                   10                  15
Phe Gly Val Ser Asp Asn Phe Asp Asn Asn Gln Asp Gly Gly Arg Ser
            20                  25                  30
Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr
        35                  40                  45
Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Arg
    50                  55                  60
Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp
65                  70                  75                  80
Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly
                85                  90                  95
Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu
            100                 105                 110
Gly Thr Gly Pro Glu Ala Ala Leu Pro Tyr Gly Ala Asn Lys Glu Gly
        115                 120                 125
Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His
    130                 135                 140
Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Ile Val Leu Gln Leu
145                 150                 155                 160
Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg
                165                 170                 175
Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser
            180                 185                 190
Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg
        195                 200                 205
Asn Leu Gln Ala Gly Gly Asp Thr Ala Leu Ala Leu Leu Leu Leu Asp
    210                 215                 220
Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln
225                 230                 235                 240
Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys
                245                 250                 255
Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr Gln Ala
            260                 265                 270
Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln
        275                 280                 285
Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys Gln Trp Pro Gln Ile Ala
    290                 295                 300
Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Glu Val
305                 310                 315                 320
Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp
                325                 330                 335
Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile Leu Leu Asn Lys His
            340                 345                 350
Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys
        355                 360                 365
Lys Lys Lys Ala Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln Lys Lys
    370                 375                 380
Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser
385                 390                 395                 400
Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser Ala Asp Ser Thr Gln
                405                 410                 415
Ala
<210>  48
<211>  166
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus membrane protein designed sequence
<400>  48
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1               5                   10                  15
Leu Glu Gln Ile Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Leu Val
            20                  25                  30
Gly Leu Met Trp Leu Ser Tyr Phe Ile Ala Ser Phe Arg Leu Phe Ala
        35                  40                  45
Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu
    50                  55                  60
Asn Val Pro Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu Glu Ser
65                  70                  75                  80
Glu Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile Ala
                85                  90                  95
Gly His His Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile
            100                 105                 110
Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser
        115                 120                 125
Gln Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr Arg
    130                 135                 140
Ile Gly Asn Gly Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp Asn
145                 150                 155                 160
Ile Ala Leu Leu Val Gln
                165
<210>  49
<211>  165
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus membrane protein designed sequence
<400>  49
Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu
1               5                   10                  15
Glu Gln Val Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Ile Val Gly
            20                  25                  30
Leu Met Trp Leu Ser Tyr Phe Val Ala Ser Phe Arg Leu Phe Ala Arg
        35                  40                  45
Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu Asn
    50                  55                  60
Val Pro Leu Arg Gly Thr Ile Leu Thr Arg Pro Leu Met Glu Ser Glu
65                  70                  75                  80
Leu Val Ile Gly Ala Val Ile Ile Arg Gly His Leu Arg Met Ala Gly
                85                  90                  95
His Ser Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile Thr
            100                 105                 110
Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln
        115                 120                 125
Arg Val Gly Thr Asp Ser Gly Phe Ala Ala Tyr Asn Arg Tyr Arg Ile
    130                 135                 140
Gly Asn Gly Lys Leu Asn Thr Asp His Ala Gly Ser Asn Asp Asn Ile
145                 150                 155                 160
Ala Leu Leu Val Gln
                165
<210>  50
<211>  166
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus membrane protein designed sequence
<400>  50
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1               5                   10                  15
Leu Glu Gln Val Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Ile Val
            20                  25                  30
Gly Leu Met Trp Leu Ser Tyr Phe Val Ala Ser Phe Arg Leu Phe Ala
        35                  40                  45
Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu
    50                  55                  60
Asn Val Pro Leu Arg Gly Ser Ile Ile Thr Arg Pro Leu Met Glu Ser
65                  70                  75                  80
Glu Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Met Ala
                85                  90                  95
Gly His Ser Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile
            100                 105                 110
Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser
        115                 120                 125
Gln Arg Val Ala Ser Asp Ser Gly Phe Ala Val Tyr Asn Arg Tyr Arg
    130                 135                 140
Ile Gly Asn Gly Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp Asn
145                 150                 155                 160
Ile Ala Leu Leu Val Gln
                165
<210>  51
<211>  262
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein RBD designed protein
<400>  51
Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly Ala Val Phe
1               5                   10                  15
Val Ser Pro Ser Ala Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg
            20                  25                  30
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
        35                  40                  45
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
    50                  55                  60
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
65                  70                  75                  80
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
                85                  90                  95
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
            100                 105                 110
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
        115                 120                 125
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
    130                 135                 140
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
145                 150                 155                 160
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
                165                 170                 175
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys
            180                 185                 190
Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly
        195                 200                 205
Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala
    210                 215                 220
Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Gly Gly Ser Gly
225                 230                 235                 240
Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly Ser
                245                 250                 255
His His His His His His
            260
<210>  52
<211>  1273
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein mutant sequence
<400>  52
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65                  70                  75                  80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
                85                  90                  95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
            100                 105                 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
        115                 120                 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
    130                 135                 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145                 150                 155                 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
                165                 170                 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
            180                 185                 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
        195                 200                 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
    210                 215                 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225                 230                 235                 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
                245                 250                 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
            260                 265                 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
        275                 280                 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
    290                 295                 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305                 310                 315                 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
                325                 330                 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
            340                 345                 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
        355                 360                 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
    370                 375                 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385                 390                 395                 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
                405                 410                 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
            420                 425                 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
        435                 440                 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
    450                 455                 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465                 470                 475                 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
                485                 490                 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
            500                 505                 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
        515                 520                 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
    530                 535                 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545                 550                 555                 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
                565                 570                 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
            580                 585                 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
        595                 600                 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
    610                 615                 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625                 630                 635                 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
                645                 650                 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
            660                 665                 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
        675                 680                 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
    690                 695                 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705                 710                 715                 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
                725                 730                 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
            740                 745                 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
        755                 760                 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
    770                 775                 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785                 790                 795                 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
                805                 810                 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
            820                 825                 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
        835                 840                 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
    850                 855                 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865                 870                 875                 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
                885                 890                 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
            900                 905                 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
        915                 920                 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
    930                 935                 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945                 950                 955                 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
                965                 970                 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
            980                 985                 990
Ile Asp Arg Leu Ile Thr Gly Arg  Leu Gln Ser Leu Gln  Thr Tyr Val
        995                 1000                 1005
Thr Gln  Gln Leu Ile Arg Ala  Ala Glu Ile Arg Ala  Ser Ala Asn
    1010                 1015                 1020
Leu Ala  Ala Thr Lys Met Ser  Glu Cys Val Leu Gly  Gln Ser Lys
    1025                 1030                 1035
Arg Val  Asp Phe Cys Gly Lys  Gly Tyr His Leu Met  Ser Phe Pro
    1040                 1045                 1050
Gln Ser  Ala Pro His Gly Val  Val Phe Leu His Val  Thr Tyr Val
    1055                 1060                 1065
Pro Ala  Gln Glu Lys Asn Phe  Thr Thr Ala Pro Ala  Ile Cys His
    1070                 1075                 1080
Asp Gly  Lys Ala His Phe Pro  Arg Glu Gly Val Phe  Val Ser Asn
    1085                 1090                 1095
Gly Thr  His Trp Phe Val Thr  Gln Arg Asn Phe Tyr  Glu Pro Gln
    1100                 1105                 1110
Ile Ile  Thr Thr Asp Asn Thr  Phe Val Ser Gly Asn  Cys Asp Val
    1115                 1120                 1125
Val Ile  Gly Ile Val Asn Asn  Thr Val Tyr Asp Pro  Leu Gln Pro
    1130                 1135                 1140
Glu Leu  Asp Ser Phe Lys Glu  Glu Leu Asp Lys Tyr  Phe Lys Asn
    1145                 1150                 1155
His Thr  Ser Pro Asp Val Asp  Leu Gly Asp Ile Ser  Gly Ile Asn
    1160                 1165                 1170
Ala Ser  Val Val Asn Ile Gln  Lys Glu Ile Asp Arg  Leu Asn Glu
    1175                 1180                 1185
Val Ala  Lys Asn Leu Asn Glu  Ser Leu Ile Asp Leu  Gln Glu Leu
    1190                 1195                 1200
Gly Lys  Tyr Glu Gln Tyr Ile  Lys Trp Pro Trp Tyr  Ile Trp Leu
    1205                 1210                 1215
Gly Phe  Ile Ala Gly Leu Ile  Ala Ile Val Met Val  Thr Ile Met
    1220                 1225                 1230
Leu Cys  Cys Met Thr Ser Cys  Cys Ser Cys Leu Lys  Gly Cys Cys
    1235                 1240                 1245
Ser Cys  Gly Ser Cys Cys Lys  Phe Asp Glu Asp Asp  Ser Glu Pro
    1250                 1255                 1260
Val Leu  Lys Gly Val Lys Leu  His Tyr Thr
    1265                 1270
<210>  53
<211>  1270
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein designed sequence
<400>  53
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65                  70                  75                  80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
                85                  90                  95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
            100                 105                 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
        115                 120                 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
    130                 135                 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145                 150                 155                 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
                165                 170                 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
            180                 185                 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
        195                 200                 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
    210                 215                 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225                 230                 235                 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
                245                 250                 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
            260                 265                 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
        275                 280                 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
    290                 295                 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305                 310                 315                 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
                325                 330                 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
            340                 345                 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
        355                 360                 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
    370                 375                 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385                 390                 395                 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
                405                 410                 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
            420                 425                 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
        435                 440                 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
    450                 455                 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465                 470                 475                 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
                485                 490                 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
            500                 505                 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
        515                 520                 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
    530                 535                 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545                 550                 555                 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
                565                 570                 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
            580                 585                 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
        595                 600                 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
    610                 615                 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625                 630                 635                 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
                645                 650                 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
            660                 665                 670
Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
        675                 680                 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
    690                 695                 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705                 710                 715                 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
                725                 730                 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
            740                 745                 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
        755                 760                 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
    770                 775                 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785                 790                 795                 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
                805                 810                 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
            820                 825                 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
        835                 840                 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
    850                 855                 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865                 870                 875                 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
                885                 890                 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
            900                 905                 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
        915                 920                 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
    930                 935                 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945                 950                 955                 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
                965                 970                 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
            980                 985                 990
Leu Ile Thr Gly Arg Leu Gln Ser  Leu Gln Thr Tyr Val  Thr Gln Gln
        995                 1000                 1005
Leu Ile  Arg Ala Ala Glu Ile  Arg Ala Ser Ala Asn  Leu Ala Ala
    1010                 1015                 1020
Thr Lys  Met Ser Glu Cys Val  Leu Gly Gln Ser Lys  Arg Val Asp
    1025                 1030                 1035
Phe Cys  Gly Lys Gly Tyr His  Leu Met Ser Phe Pro  Gln Ser Ala
    1040                 1045                 1050
Pro His  Gly Val Val Phe Leu  His Val Thr Tyr Val  Pro Ala Gln
    1055                 1060                 1065
Glu Lys  Asn Phe Thr Thr Ala  Pro Ala Ile Cys His  Asp Gly Lys
    1070                 1075                 1080
Ala His  Phe Pro Arg Glu Gly  Val Phe Val Ser Asn  Gly Thr His
    1085                 1090                 1095
Trp Phe  Val Thr Gln Arg Asn  Phe Tyr Glu Pro Gln  Ile Ile Thr
    1100                 1105                 1110
Thr Asp  Asn Thr Phe Val Ser  Gly Asn Cys Asp Val  Val Ile Gly
    1115                 1120                 1125
Ile Val  Asn Asn Thr Val Tyr  Asp Pro Leu Gln Pro  Glu Leu Asp
    1130                 1135                 1140
Ser Phe  Lys Glu Glu Leu Asp  Lys Tyr Phe Lys Asn  His Thr Ser
    1145                 1150                 1155
Pro Asp  Val Asp Leu Gly Asp  Ile Ser Gly Ile Asn  Ala Ser Val
    1160                 1165                 1170
Val Asn  Ile Gln Lys Glu Ile  Asp Arg Leu Asn Glu  Val Ala Lys
    1175                 1180                 1185
Asn Leu  Asn Glu Ser Leu Ile  Asp Leu Gln Glu Leu  Gly Lys Tyr
    1190                 1195                 1200
Glu Gln  Tyr Ile Lys Trp Pro  Trp Tyr Ile Trp Leu  Gly Phe Ile
    1205                 1210                 1215
Ala Gly  Leu Ile Ala Ile Val  Met Val Thr Ile Met  Leu Cys Cys
    1220                 1225                 1230
Met Thr  Ser Cys Cys Ser Cys  Leu Lys Gly Cys Cys  Ser Cys Gly
    1235                 1240                 1245
Ser Cys  Cys Lys Phe Asp Glu  Asp Asp Ser Glu Pro  Val Leu Lys
    1250                 1255                 1260
Gly Val  Lys Leu His Tyr Thr
    1265                 1270
<210>  54
<211>  1270
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Coronavirus S-protein designed sequence
<400>  54
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1               5                   10                  15
Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe
            20                  25                  30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
        35                  40                  45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
    50                  55                  60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65                  70                  75                  80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
                85                  90                  95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
            100                 105                 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
        115                 120                 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
    130                 135                 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145                 150                 155                 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
                165                 170                 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
            180                 185                 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
        195                 200                 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
    210                 215                 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225                 230                 235                 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
                245                 250                 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
            260                 265                 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
        275                 280                 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
    290                 295                 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305                 310                 315                 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
                325                 330                 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
            340                 345                 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
        355                 360                 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
    370                 375                 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385                 390                 395                 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Cys Gln Thr Gly Asn Ile Ala
                405                 410                 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
            420                 425                 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
        435                 440                 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
    450                 455                 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465                 470                 475                 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
                485                 490                 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
            500                 505                 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
        515                 520                 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
    530                 535                 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545                 550                 555                 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
                565                 570                 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
            580                 585                 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
        595                 600                 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
    610                 615                 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625                 630                 635                 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
                645                 650                 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
            660                 665                 670
Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
        675                 680                 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
    690                 695                 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705                 710                 715                 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
                725                 730                 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
            740                 745                 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
        755                 760                 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
    770                 775                 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785                 790                 795                 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
                805                 810                 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
            820                 825                 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
        835                 840                 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
    850                 855                 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865                 870                 875                 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
                885                 890                 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
            900                 905                 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
        915                 920                 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
    930                 935                 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945                 950                 955                 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
                965                 970                 975
Ile Leu Ser Arg Leu Asp Pro Cys Glu Ala Glu Val Gln Ile Asp Arg
            980                 985                 990
Leu Ile Thr Gly Arg Leu Gln Ser  Leu Gln Thr Tyr Val  Thr Gln Gln
        995                 1000                 1005
Leu Ile  Arg Ala Ala Glu Ile  Arg Ala Ser Ala Asn  Leu Ala Ala
    1010                 1015                 1020
Thr Lys  Met Ser Glu Cys Val  Leu Gly Gln Ser Lys  Arg Val Asp
    1025                 1030                 1035
Phe Cys  Gly Lys Gly Tyr His  Leu Met Ser Phe Pro  Gln Ser Ala
    1040                 1045                 1050
Pro His  Gly Val Val Phe Leu  His Val Thr Tyr Val  Pro Ala Gln
    1055                 1060                 1065
Glu Lys  Asn Phe Thr Thr Ala  Pro Ala Ile Cys His  Asp Gly Lys
    1070                 1075                 1080
Ala His  Phe Pro Arg Glu Gly  Val Phe Val Ser Asn  Gly Thr His
    1085                 1090                 1095
Trp Phe  Val Thr Gln Arg Asn  Phe Tyr Glu Pro Gln  Ile Ile Thr
    1100                 1105                 1110
Thr Asp  Asn Thr Phe Val Ser  Gly Asn Cys Asp Val  Val Ile Gly
    1115                 1120                 1125
Ile Val  Asn Asn Thr Val Tyr  Asp Pro Leu Gln Pro  Glu Leu Asp
    1130                 1135                 1140
Ser Phe  Lys Glu Glu Leu Asp  Lys Tyr Phe Lys Asn  His Thr Ser
    1145                 1150                 1155
Pro Asp  Val Asp Leu Gly Asp  Ile Ser Gly Ile Asn  Ala Ser Val
    1160                 1165                 1170
Val Asn  Ile Gln Lys Glu Ile  Asp Arg Leu Asn Glu  Val Ala Lys
    1175                 1180                 1185
Asn Leu  Asn Glu Ser Leu Ile  Asp Leu Gln Glu Leu  Gly Lys Tyr
    1190                 1195                 1200
Glu Gln  Tyr Ile Lys Trp Pro  Trp Tyr Ile Trp Leu  Gly Phe Ile
    1205                 1210                 1215
Ala Gly  Leu Ile Ala Ile Val  Met Val Thr Ile Met  Leu Cys Cys
    1220                 1225                 1230
Met Thr  Ser Cys Cys Ser Cys  Leu Lys Gly Cys Cys  Ser Cys Gly
    1235                 1240                 1245
Ser Cys  Cys Lys Phe Asp Glu  Asp Asp Ser Glu Pro  Val Leu Lys
    1250                 1255                 1260
Gly Val  Lys Leu His Tyr Thr
    1265                 1270
<210>  55
<211>  284
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Designed S protein RBD sequence COV_S_T2_19
<400>  55
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Leu Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
    210                 215                 220
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Lys Ser Ser Ile Ala Ser
225                 230                 235                 240
Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu Val Leu Arg
                245                 250                 255
Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln
            260                 265                 270
Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
        275                 280
<210>  56
<211>  284
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Designed S protein RBD sequence COV_S_T2_20
<400>  56
Arg Val Ala Pro Thr Lys Glu Val Val Arg Phe Pro Asn Ile Thr Asn
1               5                   10                  15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val
            20                  25                  30
Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser
        35                  40                  45
Val Leu Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
    50                  55                  60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65                  70                  75                  80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
                85                  90                  95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
            100                 105                 110
Gly Cys Val Ile Ala Trp Asn Thr Asn Asn Ile Asp Ser Thr Thr Gly
        115                 120                 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Ser Leu Arg Lys Ser Lys Leu Lys
    130                 135                 140
Pro Phe Glu Arg Asp Ile Ser Ser Asp Ile Tyr Ser Pro Gly Gly Lys
145                 150                 155                 160
Pro Cys Ser Gly Val Glu Gly Phe Asn Cys Tyr Tyr Pro Leu Arg Ser
                165                 170                 175
Tyr Gly Phe Phe Pro Thr Asn Gly Thr Gly Tyr Gln Pro Tyr Arg Val
            180                 185                 190
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
        195                 200                 205
Pro Lys Leu Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
    210                 215                 220
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Lys Ser Ser Ile Ala Ser
225                 230                 235                 240
Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu Val Leu Arg
                245                 250                 255
Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln
            260                 265                 270
Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
        275                 280
<210>  57
<211>  16
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_14 and Part of
       discontinuous epitope of COV_S_T2_17
<400>  57
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys
1               5                   10                  15
<210>  58
<211>  5
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_14 and COV_S_T2_17
<400>  58
Lys Lys Ile Ser Asn
1               5
<210>  59
<211>  2
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_14 and COV_S_T2_17
<400>  59
Asn Ile
1
<210>  60
<211>  25
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_15 and COV_S_T2_18
<400>  60
Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
1               5                   10                  15
Thr Lys Leu Asn Asp Leu Cys Phe Ser
            20                  25
<210>  61
<211>  4
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_15 and COV_S_T2_18
<400>  61
Asp Asp Phe Met
1
<210>  62
<211>  5
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_15 and COV_S_T2_18
<400>  62
Phe Glu Leu Leu Asn
1               5
<210>  63
<211>  7
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_16
<400>  63
Arg Gly Asp Glu Val Arg Gln
1               5
<210>  64
<211>  7
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_16
<400>  64
Thr Gly Lys Ile Ala Asp Tyr
1               5
<210>  65
<211>  8
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_16
<400>  65
Tyr Arg Leu Phe Arg Lys Ser Asn
1               5
<210>  66
<211>  6
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_16
<400>  66
Tyr Gln Ala Gly Ser Thr
1               5
<210>  67
<211>  20
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope of COV_S_T2_16
<400>  67
Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn
1               5                   10                  15
Gly Val Gly Tyr
            20
<210>  68
<211>  16
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  68
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
1               5                   10                  15
<210>  69
<211>  5
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  69
Lys Arg Ile Ser Asn
1               5
<210>  70
<211>  2
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  70
Asn Leu
1
<210>  71
<211>  25
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  71
Tyr Asn Ser Thr Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
1               5                   10                  15
Thr Lys Leu Asn Asp Leu Cys Phe Thr
            20                  25
<210>  72
<211>  4
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  72
Asp Asp Phe Thr
1
<210>  73
<211>  7
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  73
Thr Gly Val Ile Ala Asp Tyr
1               5
<210>  74
<211>  8
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  74
Tyr Arg Ser Leu Arg Lys Ser Lys
1               5
<210>  75
<211>  6
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  75
Tyr Ser Pro Gly Gly Lys
1               5
<210>  76
<211>  20
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  76
Phe Asn Cys Tyr Tyr Pro Leu Arg Ser Tyr Gly Phe Phe Pro Thr Asn
1               5                   10                  15
Gly Val Gly Tyr
            20
<210>  77
<211>  20
<212>  PRT
<213>  Artificial Sequence
<220>
<223>  Part of discontinuous epitope present in COV_S_T2_13
<400>  77
Phe Asn Cys Tyr Tyr Pro Leu Arg Ser Tyr Gly Phe Phe Pro Thr Asn
1               5                   10                  15
Gly Thr Gly Tyr
            20
<210>  78
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_13 encoding nucleic acid
<400>  78
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac cagatttccc tctgtgtacg cctgggagag aaagcggatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacctgg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  79
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_14 encoding nucleic acid
<400>  79
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac caagtttccc tctgtgtacg cctgggagcg caaaaagatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacatcg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  80
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_15 encoding nucleic acid
<400>  80
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac cagatttccc tctgtgtacg cctgggagag aaagcggatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccttcttcag cacctttaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcagcaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcatgggct gtgtgatcgc ctggaacacc     360
aacaacctgg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  81
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_16 encoding nucleic acid
<400>  81
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac cagatttccc tctgtgtacg cctgggagag aaagcggatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacagac aggcaagatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacctgg acagcaccac cggcggcaac tacaactacc tgtaccggct gttccggaag     420
tccaacctga agcctttcga gcgggacatc agcagcgaca tctatcaggc cggcagcaca     480
ccttgttctg gcgtggaagg cttcaactgc tacttcccac tgcaaagcta cggcttccag     540
cctaccaacg gcgtgggcta ccagccttat agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  82
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_17 encoding nucleic acid
<400>  82
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac caagtttccc tctgtgtacg cctgggagcg caaaaagatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacatcg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcacaggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  83
<211>  642
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_18 encoding nucleic acid
<400>  83
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac cagatttccc tctgtgtacg cctgggagag aaagcggatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccttcttcag cacctttaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcagcaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcatgggct gtgtgatcgc ctggaacacc     360
aacaacctgg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcacaggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctaccg ac                        642
<210>  84
<211>  852
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_19 encoding nucleic acid
<400>  84
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac cagatttccc tctgtgtacg cctgggagag aaagcggatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacctgg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcgtgggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctacag atggcggcgg aggatctggc     660
ggaggtggaa gcggaggcgg aggaagcggt ggcggcggat ctaaatcttc tatcgccagc     720
ttcttcttca tcatcggcct gattatcggc ctgttcctgg tgctgagagt gggcatccac     780
ctgtgcatca agctgaaaca caccaagaag cggcaaatct acaccgacat cgagatgaac     840
cggctgggca aa                                                         852
<210>  85
<211>  852
<212>  DNA
<213>  Artificial Sequence
<220>
<223>  COV_S_T2_20 encoding nucleic acid
<400>  85
agagtggccc ctaccaaaga agtcgtgcgg ttccccaaca tcaccaatct gtgccctttc      60
ggcgaggtgt tcaacgccac caagtttccc tctgtgtacg cctgggagcg caaaaagatc     120
agcaactgcg tggccgacta cagcgtgctg tacaacagca ccagcttcag caccttcaag     180
tgctacggcg tgtcacccac caagctgaac gacctgtgct tcaccaacgt gtacgccgac     240
agcttcgtga tcagaggcga cgaagtgcgg cagattgccc ctggacaaac aggcgtgatc     300
gccgattaca actacaagct gcccgacgac ttcaccggct gtgtgatcgc ctggaacacc     360
aacaacatcg acagcaccac cggcggcaac tacaactacc tgtacagaag cctgcggaag     420
tctaagctga agcccttcga gcgggacatc agcagcgaca tctatagccc tggcggcaag     480
ccttgttctg gcgtggaagg cttcaactgc tactaccctc tgcggagcta cggcttcttc     540
cccacaaatg gcacaggcta ccagccttac agagtggtgg tcctgagctt cgagctgctg     600
aatgcccctg ccacagtgtg tggccctaag ctgtctacag atggcggcgg aggatctggc     660
ggaggtggaa gcggaggcgg aggaagcggt ggcggcggat ctaaatcttc tatcgccagc     720
ttcttcttca tcatcggcct gattatcggc ctgttcctgg tgctgagagt gggcatccac     780
ctgtgcatca agctgaaaca caccaagaag cggcaaatct acaccgacat cgagatgaac     840
cggctgggca aa                                                         852

Claims (226)

1.一种分离的多肽,其包括氨基酸序列SEQ ID NO:17,或其整个长度与氨基酸序列SEQID NO:17具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
2.一种分离的多肽,其包括氨基酸序列SEQ ID NO:15,或其整个长度与氨基酸序列SEQID NO:15具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
3.一种分离的多肽,其包括氨基酸序列SEQ ID NO:13,或其整个长度与氨基酸序列SEQID NO:13具有至少83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
4.根据前述权利要求中任一项所述的分离的多肽,其在对应于如下表中所示的SEQ IDNO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个:
Figure FDA0003972005850000011
Figure FDA0003972005850000021
5.根据权利要求4所述的分离的多肽,其在对应于如所述表中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个、至少十五个、至少二十个、至少二十五个、至少三十个、至少三十五个或至少四十个。
6.根据前述权利要求中任一项所述的分离的多肽,其在对应于如下表中所示的SEQ IDNO:17的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000022
Figure FDA0003972005850000031
7.根据权利要求6所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000041
Figure FDA0003972005850000051
8.根据权利要求6所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:17的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000052
Figure FDA0003972005850000061
9.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
Figure FDA0003972005850000071
Figure FDA0003972005850000081
10.根据权利要求9所述的分离的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个、至少十五个、至少二十个、至少二十五个、至少三十个、至少三十五个或至少四十个。
11.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
Figure FDA0003972005850000082
Figure FDA0003972005850000091
12.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒S蛋白RBD结构域:
Figure FDA0003972005850000101
Figure FDA0003972005850000111
13.一种分离的多肽,其包括氨基酸序列SEQ ID NO:27(COV_S_T2_13),或其整个长度与氨基酸序列SEQ ID NO:27具有至少88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
14.根据权利要求13所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000112
Figure FDA0003972005850000121
15.根据权利要求14所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
16.根据权利要求13至15中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000122
17.一种分离的多肽,其包括氨基酸序列SEQ ID NO:28(COV_S_T2_14),或其整个长度与氨基酸序列SEQ ID NO:28具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
18.根据权利要求17所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000131
19.根据权利要求18所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
20.根据权利要求17至19中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000132
Figure FDA0003972005850000141
21.根据权利要求17至20中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000142
22.一种分离的多肽,其包括氨基酸序列SEQ ID NO:29(COV_S_T2_15),或其整个长度与氨基酸序列SEQ ID NO:29具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
23.根据权利要求22所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000143
Figure FDA0003972005850000151
24.根据权利要求23所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
25.根据权利要求22至24中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000152
26.根据权利要求22至25中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000153
27.一种分离的多肽,其包括氨基酸序列SEQ ID NO:30(COV_S_T2_16),或其整个长度与氨基酸序列SEQ ID NO:30具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
28.根据权利要求27所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000161
29.根据权利要求28所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
30.一种分离的多肽,其包括氨基酸序列SEQ ID NO:31(COV_S_T2_17),或其整个长度与氨基酸序列SEQ ID NO:31具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
31.根据权利要求30所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000171
32.根据权利要求31所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
33.根据权利要求30至32中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000172
34.根据权利要求30至33中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000181
35.根据权利要求30至34中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000182
36.一种分离的多肽,其包括氨基酸序列SEQ ID NO:32(COV_S_T2_18),或其整个长度与氨基酸序列SEQ ID NO:32具有至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
37.根据权利要求36所述的多肽,其在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000183
Figure FDA0003972005850000191
38.根据权利要求37所述的多肽,其在对应于如所述表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
39.根据权利要求36至38中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000192
40.根据权利要求36至39中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000201
41.根据权利要求36至40中任一项所述的多肽,其在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000202
42.一种分离的多肽,其包括在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个、至少五个、至少十个、至少十五个或全部的冠状病毒S蛋白RBD结构域:
Figure FDA0003972005850000203
Figure FDA0003972005850000211
43.根据权利要求42所述的分离的多肽,其还在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000212
44.根据权利要求42或43所述的分离的多肽,其还在对应于如下表中所示的SEQ IDNO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000213
45.根据权利要求42至44中任一项所述的分离的多肽,其还在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000221
46.根据权利要求42至45中任一项所述的分离的多肽,其还在对应于如下表中所示的SEQ ID NO:11的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000222
47.一种分离的多肽,其包括氨基酸序列SEQ ID NO:33。
48.一种分离的多肽,其包括SARS2 RBD的氨基酸序列,具有定位在SARS2 RBD序列的最后10个氨基酸内的糖基化位点,优选地位于残基位置203处。
49.一种分离的多肽,其包括氨基酸序列SEQ ID NO:34,或其整个长度与氨基酸序列SEQ ID NO:34具有至少99%的氨基酸同一性的氨基酸序列。
50.根据权利要求49所述的多肽,其在对应于SEQ ID NO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:13Q、25Q、54T。
51.一种分离的多肽,其包括在对应于SEQ ID NO:11的氨基酸残基位置的位置处具有以下氨基酸残基中的至少一个的冠状病毒S蛋白RBD结构域:13Q、25Q、54T、203N。
52.一种分离的多肽,其包括氨基酸序列SEQ ID NO:35(M9),或其整个长度与氨基酸序列SEQ ID NO:35具有至少70%的氨基酸同一性的氨基酸序列。
53.根据权利要求52所述的多肽,其在对应于如下表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000231
Figure FDA0003972005850000241
*用于插入SEQ ID NO:11的氨基酸残基位置162与163之间的残基。
54.根据权利要求53所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个、至少十五个、至少二十个、至少二十五个、至少三十个、至少三十五个、至少四十个、至少四十五个、至少五十个、至少五十五个、至少六十个或至少六十五个。
55.根据权利要求52至54中任一项所述的多肽,其在对应于SEQ ID NO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或两个:54T、203N。
56.一种分离的多肽,其包括氨基酸序列SEQ ID NO:36(M10),或其整个长度与氨基酸序列SEQ ID NO:36具有至少69%的氨基酸同一性的氨基酸序列。
57.根据权利要求56所述的多肽,其在对应于如下表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000251
Figure FDA0003972005850000261
*用于插入SEQ ID NO:11的氨基酸残基位置162与163之间的残基。
58.根据权利要求57所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个、至少十五个、至少二十个、至少二十五个、至少三十个、至少三十五个、至少四十个、至少四十五个、至少五十个、至少五十五个、至少六十个或至少六十五个。
59.根据权利要求56至58中任一项所述的多肽,其在对应于SEQ ID NO:11的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:13Q、25Q、54T。
60.根据前述权利要求中任一项所述的多肽,其在所述受体结合结构域(RBD)的氨基酸序列内包括至少一个糖基化位点。
61.根据前述权利要求中任一项所述的多肽,其包括定位在所述RBD的氨基酸序列的最后10个氨基酸内的糖基化位点,优选地位于对应于所述RBD序列的残基位置203的残基位置处。
62.一种分离的多肽,其包括氨基酸序列SEQ ID NO:22,或其整个长度与氨基酸序列SEQ ID NO:22具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
63.根据权利要求62所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000271
64.根据权利要求63所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:22的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000272
65.一种分离的多肽,其包括氨基酸序列SEQ ID NO:23,或其整个长度与氨基酸序列SEQ ID NO:23具有至少98%或99%的氨基酸同一性的氨基酸序列。
66.根据权利要求65所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:23的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000281
67.一种分离的多肽,其包括氨基酸序列SEQ ID NO:42(COV_E_T2_3),或其整个长度与氨基酸序列SEQ ID NO:42具有至少99%的氨基酸同一性的氨基酸序列。
68.根据权利要求67所述的多肽,其在对应于SEQ ID NO:41的氨基酸残基位置15的位置处包括氨基酸残基A。
69.一种分离的多肽,其包括氨基酸序列SEQ ID NO:43(COV_E_T2_4),或其整个长度与氨基酸序列SEQ ID NO:43具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
70.根据权利要求69所述的多肽,其在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:15A、55T、69Q、70G。
71.一种分离的多肽,其包括氨基酸序列SEQ ID NO:44(COV_E_T2_5),或其整个长度与氨基酸序列SEQ ID NO:44具有至少98%或99%的氨基酸同一性的氨基酸序列。
72.根据权利要求71所述的多肽,其在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:15T、55T。
73.一种分离的多肽,其包括在对应于SEQ ID NO:41的氨基酸残基位置的位置处具有以下氨基酸残基中的至少一个的冠状病毒E蛋白:15A、55T、69Q、70G。
74.根据权利要求73所述的分离的多肽,其在对应于SEQ ID NO:41的氨基酸残基位置的位置处包括以下氨基酸残基中的至少一个或全部:15T、55T。
75.一种分离的多肽,其包括氨基酸序列SEQ ID NO:24,或其整个长度与氨基酸序列SEQ ID NO:24具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
76.根据权利要求75所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000291
77.根据权利要求75所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000292
78.一种分离的多肽,其包括氨基酸序列SEQ ID NO:25,或其整个长度与氨基酸序列SEQ ID NO:25具有至少95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
79.根据权利要求78所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000301
80.根据权利要求78所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:25的氨基酸残基位置的位置处包括氨基酸残基:
Figure FDA0003972005850000302
81.一种分离的多肽,其包括氨基酸序列SEQ ID NO:48,或其整个长度与氨基酸序列SEQ ID NO:48具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
82.根据权利要求81所述的多肽,其在对应于SEQ ID NO:26的位置20-75的位置处包括氨基酸残基的缺失。
83.根据权利要求81或82所述的多肽,其在对应于SEQ ID NO:26的氨基酸残基位置204的位置处包括氨基酸残基G。
84.一种分离的多肽,其包括氨基酸序列SEQ ID NO:49,或其整个长度与氨基酸序列SEQ ID NO:49具有至少68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
85.根据权利要求84所述的多肽,其在对应于SEQ ID NO:26的位置20-75的位置处包括氨基酸残基的缺失。
86.根据权利要求84或85所述的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000311
87.根据权利要求86所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
88.根据权利要求84或85所述的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000321
89.根据权利要求88所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
90.一种分离的多肽,其包括氨基酸序列SEQ ID NO:50,或其整个长度与氨基酸序列SEQ ID NO:50具有至少69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
91.根据权利要求90所述的多肽,其在对应于SEQ ID NO:26的位置20-75的位置处包括氨基酸残基的缺失。
92.根据权利要求90或91所述的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000331
93.根据权利要求92所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
94.根据权利要求90或91所述的多肽,其在对应于如下表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部:
Figure FDA0003972005850000332
Figure FDA0003972005850000341
95.根据权利要求94所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个或至少十个。
96.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
Figure FDA0003972005850000342
97.根据权利要求96所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个。
98.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
Figure FDA0003972005850000351
99.根据权利要求98所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
100.一种分离的多肽,其包括在对应于如下表中所示的氨基酸残基位置的位置处具有所示氨基酸残基中的任何或全部的冠状病毒M蛋白:
Figure FDA0003972005850000352
Figure FDA0003972005850000361
101.根据权利要求100所述的多肽,其在对应于如所述表中所示的SEQ ID NO:26的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个或至少十个。
102.一种分离的多肽,其包括氨基酸序列SEQ ID NO:46(COV_N_T2_1),或其整个长度与氨基酸序列SEQ ID NO:46具有至少93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
103.根据权利要求102所述的多肽,其还在对应于如上表12.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
104.根据权利要求103所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
105.根据权利要求102至104中任一项所述的多肽,其还在对应于如上表12.3中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
106.根据权利要求105所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个或至少十个。
107.一种分离的多肽,其包括氨基酸序列SEQ ID NO:47(COV_N_T2_2),或其整个长度与氨基酸序列SEQ ID NO:47具有至少92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
108.根据权利要求107所述的多肽,其还在对应于如上表12.2中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
109.根据权利要求108所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
110.根据权利要求107至109中任一项所述的多肽,其还在对应于如上表12.4中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
111.根据权利要求110所述的多肽,其在对应于如所述表中所示的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
112.一种分离的多肽,其包括在对应于如上表12.2中所示的SEQ ID NO:45的氨基酸残基位置的位置处具有所示氨基酸残基中的至少一个或全部的冠状病毒N蛋白。
113.根据权利要求112所述的分离的多肽,其在对应于如上表12.2中所示的SEQ IDNO:45的氨基酸残基位置的位置处包括至少五个、至少十个或至少十五个氨基酸残基。
114.根据权利要求112或113所述的分离的多肽,其在对应于如上表12.3中所示的SEQID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
115.根据权利要求114所述的分离的多肽,其在对应于如上表12.3中所示的SEQ IDNO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个或至少十个。
116.根据权利要求114或115所述的分离的多肽,其在对应于如上表12.4中所示的SEQID NO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少一个或全部。
117.根据权利要求116所述的分离的多肽,其在对应于如上表12.4中所示的SEQ IDNO:45的氨基酸残基位置的位置处包括所示氨基酸残基中的至少五个、至少十个或至少十五个。
118.一种分离的多肽,其包括氨基酸序列SEQ ID NO:5。
119.一种分离的多肽,其包括氨基酸序列SEQ ID NO:11。
120.一种分离的多肽,其包括氨基酸序列SEQ ID NO:53,或其整个长度与氨基酸序列SEQ ID NO:53具有至少99%的氨基酸同一性的氨基酸序列。
121.根据权利要求120所述的分离的多肽,其在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
Figure FDA0003972005850000381
122.根据权利要求121所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
123.根据权利要求120至122中任一项所述的分离的多肽,其在对应于SEQ ID NO:52的氨基酸残基位置的位置986处包括氨基酸残基P并且在位置987处包括氨基酸残基P,并且在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
Figure FDA0003972005850000391
124.根据权利要求123所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
125.一种分离的多肽,其包括在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处具有所示氨基酸残基或缺失中的至少一个或全部的冠状病毒S蛋白:
Figure FDA0003972005850000392
Figure FDA0003972005850000401
126.根据权利要求125所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
127.根据权利要求125或126所述的分离的多肽,其在对应于SEQ ID NO:52的氨基酸残基位置的位置986处包括氨基酸残基P并且在位置987处包括氨基酸残基P,并且在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
Figure FDA0003972005850000402
128.根据权利要求127所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
129.根据权利要求125至128中任一项所述的分离的多肽,其中所述冠状病毒S蛋白包括其整个长度与氨基酸序列SEQ ID NO:52具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
130.一种分离的多肽,其包括氨基酸序列SEQ ID NO:54,或其整个长度与氨基酸序列SEQ ID NO:54具有至少99%的氨基酸同一性的氨基酸序列。
131.根据权利要求130所述的分离的多肽,其在对应于SEQ ID NO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基,并且在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
Figure FDA0003972005850000411
132.根据权利要求131所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
133.根据权利要求130至132中任一项所述的分离的多肽,其在对应于SEQ ID NO:52的位置986的位置处包括氨基酸残基P。
134.一种分离的多肽,其包括冠状病毒S蛋白,所述冠状病毒S蛋白在对应于SEQ IDNO:52的位置413和位置987的位置处包括半胱氨酸氨基酸残基,并且在对应于如下表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少一个或全部:
Figure FDA0003972005850000421
135.根据权利要求134所述的多肽,其在对应于如所述表中所示的SEQ ID NO:52的氨基酸残基位置的位置处包括所示氨基酸残基或缺失中的至少五个或至少十个。
136.根据权利要求134或135所述的分离的多肽,其在对应于SEQ ID NO:52的位置986的位置处包括氨基酸残基残基P。
137.根据权利要求134至136中任一项所述的分离的多肽,其中所述冠状病毒S蛋白包括其整个长度与氨基酸序列SEQ ID NO:52具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸同一性的氨基酸序列。
138.根据权利要求1至61或118至137中任一项所述的分离的多肽,其在对应于SEQ IDNO:52的以下氨基酸残基位置的一个或多个(或全部)位置处包括氨基酸变化:G446、L452、S477和Q498。
139.根据权利要求138所述的分离的多肽,其在对应于SEQ ID NO:52的氨基酸残基位置的位置处包括以下氨基酸残基中的一个或多个(或全部):446R、477N和498R。
140.根据权利要求138或139所述的分离的多肽,其在对应于SEQ ID NO:52的氨基酸残基位置的位置处包括以下氨基酸残基:498R和501Y。
141.根据权利要求17至21中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATK(SEQ ID NO:57);
(ii)KKISN(SEQ ID NO:58);
(iii)NI(SEQ ID NO:59)。
142.根据权利要求141所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
143.根据权利要求22至26中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)YNSTFFSTFKCYGVSPTKLNDLCFS(SEQ ID NO:60);
(ii)DDFM(SEQ ID NO:61);
(iii)FELLN(SEQ ID NO:62)。
144.根据权利要求143所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
145.根据权利要求27至29中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGKIADY(SEQ ID NO:64);
(iii)YRLFRKSN(SEQ ID NO:65);
(iv)YQAGST(SEQ ID NO:66);
(v)FNCYFPLQSYGFQPTNGVGY(SEQ ID NO:67)。
146.根据权利要求145所述的多肽,其中所述不连续氨基酸序列(i)、(ii)、(iii)、(iv)和(v)分别位于对应于SEQ ID NO:30的(i)残基85-91、(ii)残基97-103、(iii)残基135-142、(iv)残基155-160和(v)残基168-187的氨基酸残基位置处。
147.根据权利要求30至35中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATK(SEQ ID NO:57);
(ii)KKISN(SEQ ID NO:58);
(iii)NI(SEQ ID NO:59)。
148.根据权利要求147所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
149.根据权利要求36至41中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)YNSTFFSTFKCYGVSPTKLNDLCFS(SEQ ID NO:60);
(ii)DDFM(SEQ ID NO:61);
(iii)FELLN(SEQ ID NO:62)。
150.根据权利要求149所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
151.根据权利要求22至26中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
152.根据权利要求151所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
153.根据权利要求27至29中任一项所述的多肽,其包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
154.根据权利要求153所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:30的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
155.根据权利要求36至41中任一项所述的分离,其包括以下不连续氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
156.根据权利要求155所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基13-28;(ii)残基38-42;和(iii)残基122-123的氨基酸残基位置处。
157.根据权利要求17至21中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
158.根据权利要求157所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
159.根据权利要求27至29中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
160.根据权利要求159所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:30的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
161.根据权利要求30至35中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
162.根据权利要求161所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
163.根据权利要求17至21中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
164.根据权利要求163所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:28的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
165.根据权利要求22至26中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
166.根据权利要求165所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:29的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
167.根据权利要求30至35中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
168.根据权利要求167所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:31的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
169.根据权利要求36至41中任一项所述的分离的多肽,其包括以下不连续氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
170.根据权利要求169所述的多肽,其中所述不连续氨基酸序列(i)、(ii)和(iii)分别位于对应于SEQ ID NO:32的(i)残基51-75;(ii)残基109-112;和(iii)残基197-201的氨基酸残基位置处。
171.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
i)NITNLCPFGEVFNATK(SEQ ID NO:57);
ii)KKISN(SEQ ID NO:58);
iii)NI(SEQ ID NO:59)。
172.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)YNSTFFSTFKCYGVSPTKLN DLCFS(SEQ ID NO:60);
(ii)DDFM(SEQ ID NO:61);
(iii)FELLN(SEQ ID NO:62)。
173.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGKIADY(SEQ ID NO:64);
(iii)YRLFRKSN(SEQ ID NO:65);
(iv)YQAGST(SEQ ID NO:66);
(v)FNCYFPLQSYGFQPTNGVGY(SEQ ID NO:67)。
174.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)NITNLCPFGEVFNATR(SEQ ID NO:68);
(ii)KRISN(SEQ ID NO:69);
(iii)NL(SEQ ID NO:70)
175.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)YNSTSFSTFKCYGVSPTKLNDLCFT(SEQ ID NO:71);
(ii)DDFT(SEQ ID NO:72)
(iii)FELLN(SEQ ID NO:62)
176.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGVGY(SEQ ID NO:76)
177.一种分离的多肽,其包括具有以下不连续氨基酸序列的氨基酸序列:
(i)RGDEVRQ(SEQ ID NO:63);
(ii)TGVIADY(SEQ ID NO:73);
(iii)YRSLRKSK(SEQ ID NO:74);
(iv)YSPGGK(SEQ ID NO:75)
(v)FNCYYPLRSYGFFPTNGTGY(SEQ ID NO:77)
178.根据权利要求141至177中任一项所述的多肽,其中所述不连续氨基酸序列以所列举的顺序存在。
179.根据权利要求141至178中任一项所述的多肽,其中每个不连续氨基酸序列与相邻的不连续氨基酸序列分开至少3个氨基酸残基。
180.根据权利要求141至179中任一项所述的多肽,其中每个不连续氨基酸序列与相邻的不连续氨基酸序列分开至多100个氨基酸残基。
181.根据权利要求141至180中任一项所述的多肽,其长度为至多250、500、750、1,000、1,250或1,500个氨基酸残基。
182.一种分离的核酸分子,其编码根据权利要求1至181中任一项所述的多肽或其互补序列。
183.根据权利要求182所述的分离的核酸分子,其包括核苷酸序列SEQ ID NO:18、16或14或其整个长度与核苷酸序列SEQ ID NO:18、16或14为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列或其互补序列。
184.根据权利要求182所述的分离的核酸分子,其包括核苷酸序列SEQ ID NO:37、38、39或40或其互补序列。
185.一种分离的核酸分子,其包括编码氨基酸序列SEQ ID NO:9的SARS2截短S蛋白(CoV_T2_3)的核苷酸序列或其互补序列。
186.根据权利要求185所述的核酸分子,其包括核苷酸序列SEQ ID NO:10或其互补序列。
187.一种分离的核酸分子,其包括编码氨基酸序列SEQ ID NO:11的SARS2 S蛋白RBD(CoV_T2_6)的核苷酸序列或其互补序列。
188.根据权利要求187所述的核酸分子,其包括核苷酸序列SEQ ID NO:12或其互补序列。
189.一种载体,其包括根据权利要求182至188中任一项所述的核酸分子。
190.根据权利要求189所述的载体,其包括编码根据权利要求1至61或118至181中任一项所述的多肽的核酸分子。
191.根据权利要求189或190所述的载体,其包括编码根据权利要求62至74中任一项所述的多肽的核酸分子。
192.根据权利要求189至191中任一项所述的载体,其包括编码根据权利要求75至101中任一项所述的多肽的核酸分子。
193.根据权利要求189至192中任一项所述的载体,其包括编码根据权利要求102至117中任一项所述的多肽的核酸分子。
194.根据权利要求189所述的载体,其还包括可操作地连接到所述核酸的启动子。
195.根据权利要求190至194中任一项所述的载体,其还针对编码多肽的所述载体的每个核酸分子包括可操作地连接到所述核酸分子的单独启动子。
196.根据权利要求194所述的载体,其中所述启动子用于在哺乳动物细胞中表达由所述核酸编码的多肽。
197.根据权利要求195所述的载体,其中所述启动子或每个启动子用于在哺乳动物细胞中表达由所述核酸分子编码的多肽。
198.根据权利要求194所述的载体,其中所述启动子用于在酵母或昆虫细胞中表达由所述核酸编码的多肽。
199.根据权利要求195所述的载体,其中所述启动子或每个启动子用于在酵母或昆虫细胞中表达由所述核酸分子编码的多肽。
200.根据权利要求189至199中任一项所述的载体,其为疫苗载体。
201.根据权利要求200所述的载体,其为病毒疫苗载体、细菌疫苗载体、RNA疫苗载体或DNA疫苗载体。
202.一种分离的细胞,其包括根据权利要求189至201中任一项所述的载体。
203.一种融合蛋白,其包括根据权利要求1至181中任一项所述的多肽。
204.一种药物组合物,其包括根据权利要求1至181中任一项所述的多肽和药学上可接受的载体、赋形剂或稀释剂。
205.根据权利要求204所述的药物组合物,其包括根据权利要求1至61或118至181中任一项所述的多肽。
206.根据权利要求204或205所述的药物组合物,其包括根据权利要求62至74中任一项所述的多肽。
207.根据权利要求204至206中任一项所述的药物组合物,其包括根据权利要求75至101中任一项所述的多肽。
208.根据权利要求204至207中任一项所述的药物组合物,其包括根据权利要求102至117中任一项所述的多肽。
209.一种药物组合物,其包括根据权利要求182至188中任一项所述的核酸和药学上可接受的载体、赋形剂或稀释剂。
210.根据权利要求209所述的药物组合物,其包括编码根据权利要求1至61或118至181中任一项所述的多肽的核酸分子。
211.根据权利要求209或210所述的药物组合物,其包括编码根据权利要求62至74中任一项所述的多肽的核酸分子。
212.根据权利要求209至211中任一项所述的药物组合物,其包括编码根据权利要求75至101中任一项所述的多肽的核酸分子。
213.根据权利要求209至212中任一项所述的药物组合物,其包括编码根据权利要求102至117中任一项所述的多肽的核酸分子。
214.一种药物组合物,其包括根据权利要求189至201中任一项所述的载体和药学上可接受的载体、赋形剂或稀释剂。
215.根据权利要求204至214中任一项所述的药物组合物,其还包括用于在受试者中增强对所述组合物的所述多肽或对由所述组合物的所述核酸编码的多肽的免疫应答的佐剂。
216.一种假型病毒,其包括根据权利要求1至181中任一项所述的多肽。
217.一种在受试者中诱导对冠状病毒的免疫应答的方法,其包括向所述受试者施用有效量的根据权利要求1至181中任一项所述的多肽、根据权利要求182至188中任一项所述的核酸、根据权利要求189至201中任一项所述的载体或根据权利要求204至215中任一项所述的药物组合物。
218.一种使受试者对冠状病毒免疫的方法,其包括向所述受试者施用有效量的根据权利要求1至181中任一项所述的多肽、根据权利要求182至188中任一项所述的核酸、根据权利要求189至201中任一项所述的载体或根据权利要求204至215中任一项所述的药物组合物。
219.根据权利要求1至181中任一项所述的多肽、根据权利要求182至188中任一项所述的核酸、根据权利要求189至201中任一项所述的载体或根据权利要求204至215中任一项所述的药物组合物作为药剂的用途。
220.根据权利要求1至181中任一项所述的多肽、根据权利要求182至188中任一项所述的核酸、根据权利要求189至201中任一项所述的载体或根据权利要求204至215中任一项所述的药物组合物在预防、治疗或改善冠状病毒感染中的用途。
221.根据权利要求1至181中任一项所述的多肽、根据权利要求182至188中任一项所述的核酸、根据权利要求189至201中任一项所述的载体或根据权利要求204至215中任一项所述的药物组合物在制造用于预防、治疗或改善冠状病毒感染的药剂中的用途。
222.根据权利要求217或218所述的方法、根据权利要求219或220所述的用于所述用途的多肽、核酸、载体或药物组合物或根据权利要求221所述的用途,其中所述冠状病毒是β-冠状病毒。
223.根据权利要求222所述的方法或用于所述用途的多肽、核酸、载体或药物组合物或用途,其中所述β-冠状病毒是谱系B或C的β-冠状病毒。
224.根据权利要求222所述的方法或用于所述用途的多肽、核酸、载体或药物组合物或用途,其中所述β-冠状病毒是谱系B的β-冠状病毒。
225.根据权利要求223或224所述的方法或用于所述用途的多肽、核酸、载体或药物组合物或用途,其中所述谱系B的β-冠状病毒是SARS-CoV或SARS-CoV-2。
226.根据223所述的方法或用于所述用途的多肽、核酸、载体或药物组合物或用途,其中所述谱系C的β-冠状病毒是MERS-CoV。
CN202180039232.6A 2020-04-01 2021-04-01 冠状病毒疫苗 Pending CN116113431A (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
GBGB2004826.0A GB202004826D0 (en) 2020-04-01 2020-04-01 Coronavirus vaccines
GB2004826.0 2020-04-01
GB2010672.0 2020-07-10
GBGB2010672.0A GB202010672D0 (en) 2020-07-10 2020-07-10 Coronovirus vaccines
GB2015775.6 2020-10-05
GBGB2015775.6A GB202015775D0 (en) 2020-10-05 2020-10-05 Coronavirus vaccines
GBGB2101824.7A GB202101824D0 (en) 2021-02-10 2021-02-10 Coronavirus vaccines
GB2101824.7 2021-02-10
GBGB2103214.9A GB202103214D0 (en) 2021-03-08 2021-03-08 Coronavirus vaccines
GB2103214.9 2021-03-08
PCT/GB2021/050830 WO2021198706A2 (en) 2020-04-01 2021-04-01 Coronavirus vaccines

Publications (1)

Publication Number Publication Date
CN116113431A true CN116113431A (zh) 2023-05-12

Family

ID=75426636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180039232.6A Pending CN116113431A (zh) 2020-04-01 2021-04-01 冠状病毒疫苗

Country Status (6)

Country Link
EP (1) EP4126033A2 (zh)
JP (1) JP2023522156A (zh)
CN (1) CN116113431A (zh)
AU (1) AU2021249525A1 (zh)
CA (1) CA3179038A1 (zh)
WO (1) WO2021198706A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113527444B (zh) * 2020-04-13 2022-12-27 中国科学院微生物研究所 与新型冠状病毒的抗体有效结合的表位
CN113521268A (zh) 2020-04-22 2021-10-22 生物技术Rna制药有限公司 冠状病毒疫苗
WO2021249116A1 (en) 2020-06-10 2021-12-16 Sichuan Clover Biopharmaceuticals, Inc. Coronavirus vaccine compositions, methods, and uses thereof
EP4355891A1 (en) * 2021-06-14 2024-04-24 ModernaTX, Inc. Coronavirus glycosylation variant vaccines
EP4183409A1 (en) 2021-11-17 2023-05-24 Charité - Universitätsmedizin Berlin Vaccine with improved immunogenicity against mutant coronaviruses
US11878055B1 (en) 2022-06-26 2024-01-23 BioNTech SE Coronavirus vaccine

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102690336A (zh) * 2012-06-11 2012-09-26 中国科学院武汉病毒研究所 蝙蝠sars样冠状病毒刺突蛋白免疫决定区及制备方法和用途
US20170096455A1 (en) * 2014-03-20 2017-04-06 The University Of North Carolina At Chapel Hill Methods and compositions for chimeric coronavirus spike proteins
CN106928326A (zh) * 2015-12-31 2017-07-07 中国科学院动物研究所 一种基于二聚化的受体结合区亚单位的冠状病毒疫苗

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102690336A (zh) * 2012-06-11 2012-09-26 中国科学院武汉病毒研究所 蝙蝠sars样冠状病毒刺突蛋白免疫决定区及制备方法和用途
US20170096455A1 (en) * 2014-03-20 2017-04-06 The University Of North Carolina At Chapel Hill Methods and compositions for chimeric coronavirus spike proteins
CN106928326A (zh) * 2015-12-31 2017-07-07 中国科学院动物研究所 一种基于二聚化的受体结合区亚单位的冠状病毒疫苗

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JINYONG ZHANG等: "Progress and Prospects on Vaccine Development against SARS-CoV-2", 《VACCINES》, vol. 8, no. 2, 29 March 2020 (2020-03-29), pages 1 - 12, XP055822811, DOI: 10.3390/vaccines8020153 *

Also Published As

Publication number Publication date
EP4126033A2 (en) 2023-02-08
JP2023522156A (ja) 2023-05-29
WO2021198706A3 (en) 2021-12-02
WO2021198706A2 (en) 2021-10-07
AU2021249525A1 (en) 2022-12-08
CA3179038A1 (en) 2021-10-07

Similar Documents

Publication Publication Date Title
CN116113431A (zh) 冠状病毒疫苗
US9650422B2 (en) Localization and characterization of flavivirus envelope glycoprotein cross-reactive epitopes and methods for their use
US6200959B1 (en) Genetic induction of anti-viral immune response and genetic vaccine for filovirus
US8586056B2 (en) HIV-1 envelope glycoprotein
NO311807B1 (no) HIV-peptider, antigener, vaksinepreparater, immunoassay- testsett og en metode for påvisning av antistoffer fremkalt av HIV
KR20230005962A (ko) 베타코로나바이러스 예방 및 치료요법
CN108329379A (zh) H7亚型流感病毒h7n9的普通型/嵌合型病毒样颗粒及制备方法、应用和疫苗
CN109641044A (zh) 用于产生对乙型肝炎病毒的免疫应答的组合物和方法
US20220040284A1 (en) Vaccines and methods
CN101591379B (zh) 基于eiav减毒活疫苗的氨基酸突变而构建的抗hiv疫苗
US9534020B2 (en) Immunogenic polypeptides comprising a modified loop peptide presenting the HIV-1 GP120 3074 mAb epitope and scaffold proteins containing said peptide
US20230149530A1 (en) Influenza vaccines
Naylor et al. Preclinical and clinical studies on immunogenicity and safety of the HIV-1 p17-based synthetic peptide AIDS vaccine—HGP-30-KLH
US20150174239A1 (en) Membrane proximal region of hiv gp41 anchored to the lipid layer of a virus-like particle vaccine
WO2023057769A1 (en) Coronavirus vaccines
US9562078B2 (en) Methods for identifying broadly neutralizing antibodies utilizing recombinant HIV-1 envelope glycoproteins comprising stabilizing mutations
WO2023275538A1 (en) Beta-coronavirus vaccines
Wang et al. A novel multi-variant epitope ensemble vaccine against avian leukosis virus subgroup J
JP2018515074A (ja) インフルエンザa/上海/2/2013 h7配列の改変h7赤血球凝集素糖タンパク質
JP2018515074A5 (zh)
CN115044562B (zh) 一种嵌合表达分子佐剂的重组狂犬病病毒及其制备方法与应用
WO2023092023A2 (en) Methods of preventing, treating, or reducing the severity of coronavirus disease 2019 (covid-19)
JP3940676B2 (ja) 日本脳炎ウイルスに対するキメラtヘルパー細胞−b細胞ペプチドワクチン
WO2023057766A1 (en) Influenza vaccines
CN113227360A (zh) 具有新型流感病毒来源的血凝素蛋白基因的DIs株来源的重组牛痘病毒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination