CN116390750A - SARS-CoV-2疫苗和抗体 - Google Patents

SARS-CoV-2疫苗和抗体 Download PDF

Info

Publication number
CN116390750A
CN116390750A CN202180073094.3A CN202180073094A CN116390750A CN 116390750 A CN116390750 A CN 116390750A CN 202180073094 A CN202180073094 A CN 202180073094A CN 116390750 A CN116390750 A CN 116390750A
Authority
CN
China
Prior art keywords
cov
sars
leu
protein
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180073094.3A
Other languages
English (en)
Inventor
S·安德森
E·坎贝尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rutgers State University of New Jersey
Original Assignee
Rutgers State University of New Jersey
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rutgers State University of New Jersey filed Critical Rutgers State University of New Jersey
Publication of CN116390750A publication Critical patent/CN116390750A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • C07K16/1002Coronaviridae
    • C07K16/1003Severe acute respiratory syndrome coronavirus 2 [SARS‐CoV‐2 or Covid-19]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/33Crossreactivity, e.g. for species or epitope, or lack of said crossreactivity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20071Demonstrated in vivo effect

Abstract

本发明描述了一种产生针对SARS‑CoV‑2肽源性蛋白或编码SARS‑CoV‑2肽源性蛋白的多核苷酸的混合物的抗体的方法,其中所述SARS‑CoV‑2肽源性蛋白与SARS‑CoV‑2起始蛋白相比具有改变的构象动力学,并且其中所述SARS‑CoV‑2肽源性蛋白具有与所述SARS‑CoV‑2起始蛋白类似的构象。所述SARS‑CoV‑2肽源性蛋白能够用于诱导免疫应答,其能够导致抗体的产生;和/或能够用于对哺乳动物进行疫苗接种。

Description

SARS-CoV-2疫苗和抗体
相关申请的交叉引用
本申请要求2020年9月4日提交的美国临时申请号63/075,043、2020年12月31日提交的美国临时申请号63/132,943和2021年6月16日提交的美国临时申请号63/211,397的优先权权益,将所述美国临时申请出于任何目的通过引用以其整体并入本文。
序列表
本申请是连同电子格式的序列表一起提交的。序列表以2021年9月2日创建的标题为“2021-09-02_01308-0003-0PCT_Seq_List_ST25.txt”的文件提供,其大小为300,679字节。将在电子格式的序列表中的信息通过引用以其整体并入本文。
背景技术
用于制备抗体的方法已经有100多年了,并且是本领域技术人员常规使用的。参见例如,Morrison等人,Science 229:1202(1985);Oi等人,BioTechniques 4:214(1986);Cabilly等人,美国专利号4,816,567;Taniguchi等人,EP 171496;Morrison等人,EP173494;Neuberger等人,WO 8601533;Robinson等人,WO 8702671;Boulianne等人,Nature312:643(1984);Neuberger等人,Nature 314:268(1985)。用于产生抗体的改善方法已经扩展了这些初始方法,并且已经用于产生许多现在商业上出售的治疗性抗体。例如,诸如噬菌体展示和转基因小鼠(即含有人免疫球蛋白基因的小鼠)的技术已经用于产生完全人抗体。然而,某些抗原继续挑战研究人员制造抗体的能力,即使是在使用最新的技术时。
为了在人体内诱导细胞介导的免疫应答,外源蛋白被分解成较小的肽,通常长度在8-24个氨基酸之间,并且结合至MHC分子,以在抗原呈递细胞的表面上展示。将MHC结合肽呈递给T细胞以触发细胞介导的免疫应答。
蛋白质的三维(3D)结构已作为一个因素参与蛋白水解加工和表位的呈递(参见Carmicle等人,Molecular Immunology(2007)第44卷:1159-1168)。此外,Ohkuri等人(参见Okhuri等人,J.Immunol.,(2010),第185卷:4199-4205)认为蛋白质的构象稳定性是免疫学上的主要因素。然而,关于3D结构如何精确影响免疫应答,还没有共识。
Delamarre等人(参见Delamarre等人,JEM,(2006),第203卷:2049-2055)发现不易消化形式的蛋白质更具免疫原性,所述不易消化形式的蛋白质不易经由溶酶体蛋白水解进行消化,因此断定,增加蛋白质稳定性改善了免疫应答。例如,Delarmare等人表明通过降低对蛋白水解的敏感性,可以改善蛋白抗原的免疫原性。类似地,Mirano-Bascos等人(参见Mirano-Bascos等人,J.of Virology,(2010),第84卷:3303-3311)使半胱氨酸残基突变以阻止形成三个二硫键中的每一个,并且确定对于所有三种变体的CD4+T细胞应答都广泛降低。Mirano-Bascos等人类似地断定,蛋白质的3D结构的整体失稳降低了抗原呈递并导致免疫应答被抑制。在其他研究中,诸如例如Nguyen等人,Vaccine,(2015),第33卷:2887-2896,缺失了外部结构域二硫键,预期此类缺失将改善抗原呈递。相反,观察到表位优势的典型模式,并且作者断定不可能产生显著更强的免疫应答。
其他组类似地断定,蛋白质稳定化是免疫应答所需的。例如,Deressa等人(参见Deressa等人,PLOS,(2014),第9卷:1-12)断定,即使抗原的氨基酸序列中的微小修饰也会引起免疫应答的基本定量和定性的变化。同样,Porta等人(参见Porta等人,PLOS,(2013),第9卷:1-8)报道了稳定性是诱导免疫应答所需的。其他组(诸如Thomas(参见Thomas等人,Vaccines&Immunotherapeutics,(2013),第9卷:744-752))类似地断定,增加肽的热稳定性引发更好的免疫应答。
相比之下,其他组(诸如So(参见So等人,Immunology,(2001),第104卷:259-268))报道了相互矛盾的结果。So等人研究了交联(例如,去除交联和增加交联)对体内T细胞应答大小的影响,并且发现去除此类交联导致更好的抗原加工和改善的免疫应答。类似地,Thai等人,J.Biol.Chem.(2004)第279卷:50257-50266报道了使表面可及残基突变以降低稳定性和增加构象动力学从而增加蛋白抗原的免疫原性。Thai等人还涉及单一抗原的施用。
对于去除或增加交联是否改善或抑制抗原加工没有共识。因此,本领域不清楚增加或降低蛋白质稳定性是否会导致包含广泛多样的抗体阵列的改善的免疫应答。
因此,仍然需要开发新的和改善的产生抗体的方法,其可以提供与先前获得的抗体不同的和更广泛的抗体库。
发明内容
提供本发明内容以便以简化的形式介绍将在以下具体实施方式中进一步描述的概念选择。本发明内容并非旨在鉴定要求保护的主题的关键特征或基本特征,也并非旨在用于帮助确定所要求保护的主题的范围。如本文所述,本发明涉及一种组合物,所述组合物包含:(a)SARS-CoV-2肽源性(peptidogenic)蛋白,其中所述肽源性蛋白与SARS-CoV-2起始蛋白相比具有改变的构象动力学,并且其中所述SARS-CoV-2肽源性蛋白在构象上与所述SARS-CoV-2起始蛋白类似,并且其中所述SARS-CoV-2起始蛋白选自表2所列的蛋白质中的至少一种;或(b)刺突片段;或(c)编码(a)或(b)的多核苷酸;或(d)(a)、(b)和/或(c)的任何组合。这种组合物可以用于触发免疫应答的方法中。例如,这种方法包括设计源自SARS-CoV-2起始蛋白的SARS-CoV-2肽源性蛋白的混合物,其中所述SARS-CoV-2肽源性蛋白与所述SARS-CoV-2起始蛋白相比具有改变的构象动力学,并且其中所述SARS-CoV-2肽源性蛋白在构象上与所述SARS-CoV-2起始蛋白类似;将所述SARS-CoV-2肽源性蛋白引入动物并产生免疫应答。所述SARS-CoV-2肽源性蛋白、所述刺突片段和/或所述多核苷酸可以被直接引入所述动物(通过例如接种或免疫)或者可以通过已经引入所述动物并且编码所述SARS-CoV-2肽源性蛋白的多核苷酸在体内表达。在表达这些SARS-CoV-2肽源性蛋白和/或所述刺突片段后,触发所述免疫应答以产生针对所述SARS-CoV-2肽源性蛋白和所述原始SARS-CoV-2起始蛋白两者的抗体。
在优选的实施方案中,在所述SARS-CoV-2起始蛋白中,非表面氨基酸残基被较小的氨基酸残基替代。在进一步优选的实施方案中,所述较小的氨基酸是丙氨酸或甘氨酸。在其他优选的实施方案中,在所述SARS-CoV-2起始蛋白中,至少2、3、4、5、6、7、8、9或10个氨基酸被替代。在仍其他优选的实施方案中,在所述SARS-CoV-2起始蛋白中,至少10个氨基酸、至少20个氨基酸、至少30个氨基酸、至少40个氨基酸或至少50个氨基酸被替代。在仍其他优选的实施方案中,多个氨基酸替代分布在蛋白质混合物中。例如,在一个实施方案中,为了使10个不同的残基突变,使所述SARS-CoV-2起始蛋白不同地突变10次,以产生10种不同的SARS-CoV-2肽源性蛋白,其各自具有单个氨基酸替代。将所述十种蛋白质(或编码所述十种蛋白质的多核苷酸)中的每一种混合在一起以接种所述动物。在一些情况下,野生型SARS-CoV-2起始蛋白或蛋白质片段(即没有突变的蛋白质或蛋白质片段)是混合物的一部分。在进一步优选的实施方案中,在所述SARS-CoV-2起始蛋白中消除了至少一个二硫键,诸如例如用丙氨酸、丝氨酸和/或甘氨酸等替代半胱氨酸。在进一步优选的实施方案中,参与所述SARS-CoV-2起始蛋白中的至少一个二硫键形成的两个半胱氨酸都被丙氨酸、丝氨酸和/或甘氨酸替代,或者优选地被丙氨酸或甘氨酸等替代。在进一步优选的实施方案中,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(b)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(c)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(d)用丙氨酸、缬氨酸、甘氨酸或异亮氨酸替代至少一个亮氨酸;或(e)用丙氨酸、缬氨酸、亮氨酸或甘氨酸替代至少一个异亮氨酸;或(f)用丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个脯氨酸、甲硫氨酸、苯丙氨酸、酪氨酸或色氨酸;或(g)用甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个天冬氨酸或天冬酰胺;或(h)用天冬氨酸、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸或谷氨酰胺;或(i)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(j)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(k)用赖氨酸、精氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、谷氨酰胺、天冬酰胺、亮氨酸或异亮氨酸替代至少一个组氨酸;或(l)用甘氨酸替代至少一个丙氨酸;或(m)用非天然氨基酸替代至少一个残基;和/或(n)上述组合中的任一种。
在仍进一步优选的实施方案中,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用酪氨酸、苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个色氨酸;或(b)用苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个酪氨酸;或(c)用酪氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个苯丙氨酸;或(d)用甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个脯氨酸;或(e)用苯丙氨酸、酪氨酸、甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸、甘氨酸、赖氨酸、精氨酸、丝氨酸、苏氨酸、天冬酰胺或谷氨酰胺替代至少一个组氨酸;或(f)用异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个甲硫氨酸;或(g)用亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个异亮氨酸;或(h)用异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个亮氨酸;或(i)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(j)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(k)用谷氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个天冬氨酸;或(l)用天冬氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸;或(m)用甘氨酸或脯氨酸替代至少一个丙氨酸;或(n)用丙氨酸或甘氨酸替代至少一个丝氨酸;或(o)用丙氨酸或脯氨酸替代至少一个甘氨酸;或(p)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(q)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸或谷氨酸替代至少一个天冬酰胺;或(r)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸、谷氨酸或组氨酸替代至少一个谷氨酰胺;或(s)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(t)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(u)用较小的类似疏水性残基替代疏水性残基;或(v)用非天然氨基酸替代至少一个残基;或(w)上述组合中的任一种。可以使用组合方法来确定增加肽源性的最佳取代。
在优选的实施方案中,所述SARS-CoV-2肽源性蛋白选自刺突糖蛋白SPIKE_SARS2(P0DTC2)(SEQ ID NO:15)或SPIKE_SARS(P59594)(SEQ ID NO:16)。在进一步优选的实施方案中,所述刺突蛋白在以下位置中的任一个处突变:(A)SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)SEQ ID NO:15的Val308、Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)SEQ ID NO:15的Ala 363、Ala 397和/或Ala 575;(D)SEQ ID NO:15的Cys 336Ala/Cys 361Ala和/或Cys379Ala/Cys 432Ala;和/或(E)SEQID NO:15的Ala 419、Ile 980、Ala 903、Leu 916、Ala575、Phe 1095、Cys 1032、Val 576、Tyr 365、Ile 1115、Ile 418、Leu 387、Cys 649、Leu650、Leu 585、Ala 1080、Ile 410、Tyr423、Ala 1087、Tyr 695、Ala 653、Phe 201、Ile 1081、Phe 497、Ala 989、Leu 552、Val1104和/或Cys 671;和/或(F)或在SEQ ID NO:15-16或SEQ ID NO:43-110中的等同位置。
此外,并且在进一步优选的实施方案中,所述组合物包含以下项中的任一种或由以下项中的任一种组成:(1)SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580;(2)SEQ ID NO:15的氨基酸316-594以及在以下位点中的任一个处的至少一个突变:(A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;(E)Ala 419、Ala 575、Val 576、Tyr 365、Ile418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe 497和/或Leu 552;(3)SEQ ID NO:15的氨基酸319-591以及在以下位点中的任一个处的至少一个突变:(A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys 336Ala/Cys 361Ala和/或Cys379Ala/Cys 432Ala;和/或(E)Ala 419、Ala 575、Val 576、Tyr 365、Ile 418、Leu 387、Leu585、Ile 410、Tyr 423、Phe 497和/或Leu 552;(3)SEQ ID NO:15的氨基酸319-541以及在以下位点中的任一个处的至少一个突变:(A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423和/或Phe 497;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524和/或Val539;(C)Ala 363和/或Ala 397;(D)Cys 336Ala/Cys361Ala和/或Cys 379Ala/Cys 432Ala;和/或(E)Ala 419、Tyr 365、Ile 418、Leu 387、Ile410、Tyr 423和/或Phe 497;(4)SEQ ID NO:15的氨基酸319-541、319-591或316-594以及至少一个选自Y365、I402和/或V511的突变;(5)SEQ ID NO:15的氨基酸319-541、319-591或316-594以及至少一个选自Y365L、I402V和/或V511A的突变;或(6)SEQ ID NO:15-16或SEQID NO:43-110中的等同片段和/或突变。
在优选的实施方案中,所述SARS-CoV-2肽源性蛋白的构象动力学的变化通过与所述SARS-CoV-2起始蛋白相比熔解温度的变化和/或通过测量稳定化的吉布斯自由能的变化来测量。测量吉布斯自由能的优选方法包括但不限于变性剂调节的平衡解折叠。优选的变性剂是尿素和/或盐酸胍。可替代地,构象动力学的变化可以通过检测蛋白水解敏感性测定中的变化来测定,诸如例如通过测量用组织蛋白酶和/或其他蛋白酶进行的消化,然后通过质谱法(MS)或十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)分析混合物来测定。
在优选的实施方案中,确定SARS-CoV-2肽源性蛋白是否具有与所述SARS-CoV-2起始蛋白类似的构象可以通过交叉反应抗体来测量,所述交叉反应抗体结合至在所述SARS-CoV-2肽源性蛋白和所述SARS-CoV-2起始蛋白两者上的3D构象表位(通常是不连续的表位)。用于测量抗体结合的方法包括但不限于免疫沉淀测定、表面等离子体共振、等温滴定量热法、斜入射反射差(OI-RD)、蛋白质印迹、放射免疫测定、ELISA(酶联免疫吸附测定)、“夹心”免疫测定、凝胶扩散沉淀素反应、免疫扩散测定、凝集测定、补体结合测定、免疫放射测定、荧光免疫测定和/或蛋白A免疫测定。
在进一步优选的实施方案中,用于测量交叉反应性的测试是通过结合测定进行的。在进一步优选的实施方案中,与SARS-CoV-2肽源性蛋白的抗体结合(包括交叉反应抗体)具有小于或等于10-9M、小于或等于10-8M、小于或等于10-7M和/或小于或等于10-6M的解离常数(KD)。
在优选的实施方案中,所述SARS-CoV-2起始蛋白选自表2中列出的以下SARS-CoV-2蛋白,其在以下位置中的一个或多个处具有优选的突变:
Figure BDA0004199120910000061
Figure BDA0004199120910000071
Figure BDA0004199120910000081
Figure BDA0004199120910000091
Figure BDA0004199120910000101
/>
Figure BDA0004199120910000111
/>
Figure BDA0004199120910000121
/>
Figure BDA0004199120910000131
/>
Figure BDA0004199120910000141
/>
Figure BDA0004199120910000151
/>
Figure BDA0004199120910000161
/>
Figure BDA0004199120910000171
/>
Figure BDA0004199120910000181
/>
Figure BDA0004199120910000191
/>
Figure BDA0004199120910000201
/>
Figure BDA0004199120910000211
/>
Figure BDA0004199120910000221
/>
Figure BDA0004199120910000231
/>
Figure BDA0004199120910000241
/>
Figure BDA0004199120910000251
/>
Figure BDA0004199120910000261
/>
Figure BDA0004199120910000271
/>
Figure BDA0004199120910000281
/>
Figure BDA0004199120910000291
/>
Figure BDA0004199120910000301
/>
Figure BDA0004199120910000311
/>
Figure BDA0004199120910000321
/>
Figure BDA0004199120910000331
/>
Figure BDA0004199120910000341
如本文所用,“靶标”是表2中公开的特定选择的蛋白质,其可以被修饰以具有如本文所述的改善的肽源性。第1列列出了对应于序列表中提供的序列的SEQ ID NO.。第2列列出了每个靶标的“蛋白质名称”,并且第3列提供了“UniProt参考号”,它是本领域使用的独特的“编目”号(UniProt参考号提供了蛋白质组至参考基因组组装的映射,例如,如由基因组参考联盟(Genome Reference Consortium,GRC)产生的),其提供了第2列列出的每个靶标的功能、表达和序列信息的公开已知和确立的描述。包括对应于每个靶标的序列信息的这种公开信息(从2020年4月的UniProt数据库(uniprot.org)中检索)通过引用以其整体并入本文。表2描述了每个靶蛋白中特定残基的位置,其中可以进行突变以产生相应的SARS-CoV-2肽源性蛋白;以及可以在各自位置被取代的特定氨基酸。在优选的实施方案中,可以在序列表中的所述位置处并且如表2所示在每个靶蛋白中进行多个取代。在进一步优选的实施方案中,如实施例1的最后两段所述,可以使用表2中指定的氨基酸在第2列中列出的相应起始靶蛋白中改变表2所示的对于每个靶蛋白的以任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个残基。通过将突变散布在多个位置和/或靶蛋白上,并通过将这些突变的分子混合在一起,可以产生免疫混合物。
例如,在评价用于工程化SARS-CoV-2的刺突蛋白(如表2中所公开的)以增加免疫原性的方式中,我们应用如本文所公开的方法来开发可以测试的取代的优先化短列表。
A.芳族残基突变。在核心中存在许多芳族残基。为了产生没有严重空间冲突的中等大小的空腔(约3个碳的体积),我们提出用Leu取代Tyr和Phe,以及用Phe取代Trp,如表2中所示。优选的突变包括但不限于位于所述SARS-CoV-2刺突蛋白中以下位置处的突变:SEQID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543。
B.脂肪族残基(排除Ala、Cys和Pro)突变。在核心中或在核心周围还存在掩埋的Met、Leu、Ile和Val氨基酸残基。我们提出在如表2所示的位置处将这些突变成Ala,这与上述突变一样,由于去除了3-4个碳原子而产生了包装缺陷。SARS-CoV-2刺突蛋白中优选的突变包括但不限于位于以下位置处的突变:SEQ ID NO:15的Val308、Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585。
C.丙氨酸突变。存在相当数量的掩埋丙氨酸。在此优选的取代是Gly,其增加展开状态的构象熵,从而不利于折叠状态。通常,此类突变典型地在球状蛋白质的稳定化自由能方面仅提供约1.5±1.0kcal的减量,但当残基在二级结构元件(诸如α螺旋)中时,该效应可以被放大。这一类的前瞻性突变也示于表2中。优选的突变包括但不限于在SARS-CoV-2刺突蛋白中位于以下位置处的突变:SEQ ID NO:15的Ala 363、Ala 397和/或Ala 575。
D.半胱氨酸突变。因为表面二硫键通常促进还原性解折叠,我们优选使溶剂可及的二硫键保持完整。因此,我们提出半胱氨酸至丙氨酸的双突变体以去除掩埋的或部分掩埋的二硫键。例如,在SARS-CoV-2刺突蛋白中,我们提出了以下突变:SEQ ID NO:15的Cys336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala。
对候选突变进一步优先化的一般考虑:
A.T细胞表位产生。目的是增加抗原的级分,所述抗原的级分将以适当的动力学在吞噬体/溶酶体中展开,以将其置于允许彻底蛋白水解加工和抗原肽装载到APC中的MHCII受体上的时间窗内。
B.具有相对低的特定接触顺序的残基(即,仅在3D结构中接触在一级氨基酸序列中邻近的其他残基的残基)的突变和避免使过渡状态不稳定的高值突变。接触顺序是蛋白质的总体拓扑学特性,其可以通过以下方法来计算:确定蛋白质中的所有残基-残基接触(使用适当的约束),记录多肽链中所有接触残基对之间的线性分离(针对总蛋白质链长度归一化),并且将这些分量距离求和。高接触顺序蛋白质在氨基酸对之间展现出更长程相互作用,并且通常折叠更慢(Plaxco等人,J.Mol.Biol.277:985[1998];Shi等人,BMCBioinformatics 9:255[2008])。
作为我们建议用于突变的残基列表(上述)的优先化过滤器,可以对每个候选残基在3D结构中的特定接触信息进行排序,并且选择对接触顺序贡献最低的那些残基。本质上,这种排序鉴定了在突变的残基与其在3D结构中接触的其他残基之间倾向于具有更小环大小(在一级氨基酸序列中)的那些残基。这样做的基本原理如下:(i)稳定折叠过渡状态的残基的突变倾向于降低折叠速率以及不利于解折叠速率的增加(即,“高值”残基-参见Fersht和Daggett,Cell 108:573[2002];Chiti等人,Nature Struct.Biol.6:1005[1999]);和(ii)涉及在折叠过渡状态中确立天然折叠拓扑结构的残基倾向于展现出更长程相互作用。我们的优先化程序旨在削弱那些主要具有非局部接触的残基,如高值残基。
因此,将我们的初始诱变努力集中在与多肽序列中邻近的其他残基通常局部接触的残基上将有利于增加解折叠速率(并因此促进溶酶体抗原加工)同时避免过度增加折叠速率的突变。抗原中的局部有效突变也可以通过促进表面延展性而在免疫原性方面获得另外的好处。我们假设这可能促进在B细胞成熟期间抗原斑块变宽,或甚至在初级B细胞选择阶段,暴露抗原蛋白表面区域中迄今为止对幼稚B细胞无反应的新B细胞表位。
下面是SARS-CoV-2刺突蛋白中优先化突变的短列表,所有这些突变都展现出40个氨基酸或更少的平均特定残基间接触环大小:SEQ ID NO:15的Ala 419、Ile 980、Ala903、Leu 916、Ala 575、Phe 1095、Cys 1032、Val 576、Tyr 365、Ile 1115、Ile 418、Leu387、Cys649、Leu 650、Leu 585、Ala 1080、Ile 410、Tyr 423、Ala 1087、Tyr 695、Ala653、Phe 201、Ile 1081、Phe 497、Ala 989、Leu 552、Val 1104和/或Cys 671。
此外,尽管表2特别列出了掩埋的半胱氨酸残基,但技术人员应理解,还特别考虑了使与表2中鉴定的半胱氨酸处于二硫键对中的溶剂可及的半胱氨酸突变。使通常与掩埋的半胱氨酸处于二硫键对中的溶剂可及的半胱氨酸突变避免了留下未配对的半胱氨酸残基,然后这将防止异常的二硫键形成、加扰和寡聚化。
特别考虑了上述突变中的任一个和/或表2中公开的那些突变的组合。例如,可以将产生核心疏水性空腔的突变置于二硫化物突变体背景中。一旦确立了突变体集合的解折叠特征并选择了适当的亚组,就可以在动物中单独测试每种突变体抗原的免疫原性。然后可以组装含有最有希望的突变体抗原的不同组合的混合物,并且还测试其免疫原性。
在甚至进一步优选的实施方案中,在所述SARS-CoV-2刺突蛋白中优选在以下位点处的突变:
A.SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;
B.SEQ ID NO:15的Val308、Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;
C.SEQ ID NO:15的Ala 363、Ala 397和/或Ala 575;
D.SEQ ID NO:15的Cys 336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;和/或
E.SEQ ID NO:15的Ala 419、Ile 980、Ala 903、Leu 916、Ala 575、Phe 1095、Cys1032、Val 576、Tyr 365、Ile 1115、Ile 418、Leu 387、Cys 649、Leu 650、Leu585、Ala1080、Ile 410、Tyr 423、Ala 1087、Tyr 695、Ala 653、Phe 201、Ile 1081、Phe 497、Ala989、Leu 552、Val 1104和/或Cys 671。
在甚至进一步优选的实施方案中,所述SARS-CoV-2肽源性蛋白是所述刺突糖蛋白的片段。优选地,所述片段由SEQ ID NO:15的氨基酸316-594、SEQ ID NO:16的氨基酸303-580、或如图3所示的冠状病毒的其他已知刺突糖蛋白中的等同片段(SEQ ID NO:15-16和43-110)组成。这种截短的片段本身可以如本文所述用作疫苗,或者可以与以下位点中的任一个处的突变组合:(A)SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe400、Tyr 423、Phe497和/或Phe 543;(B)SEQ ID NO:15的Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)SEQ ID NO:15的Ala 363、Ala 397和/或Ala 575;(D)SEQ ID NO:15的Cys 336Ala/Cys361Ala和/或Cys 379Ala/Cys 432Ala;(E)SEQ ID NO:15的Ala 419、Ala 575、Val 576、Tyr365、Ile 418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe497和/或Leu 552。在最优选的实施方案中,所述片段包含突变,诸如SEQ ID NO:15的Y365、I402和/或V511。在甚至更优选的实施方案中,所述片段包含以下突变:SEQ ID NO:15的Y365L、I402V和/或V511A。
在进一步优选的实施方案中,所述截短的刺突蛋白包含SEQ ID NO:15的氨基酸319-591或由其组成,所述截短的刺突蛋白与以下位点处的优选突变组合:(A)SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)SEQ ID NO:15的Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)SEQ ID NO:15的Ala 363、Ala397和/或Ala 575;(D)SEQ ID NO:15的Cys 336Ala/Cys 361Ala和/或Cys379Ala/Cys432Ala;和/或(E)SEQ ID NO:15的Ala 419、Ala 575、Val 576、Tyr 365、Ile418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe 497和/或Leu 552。在最优选的实施方案中,所述片段包含突变,诸如SEQ ID NO:15的Y365、I402和/或V511。在甚至更优选的实施方案中,所述片段包含以下突变:SEQ ID NO:15的Y365L、I402V和/或V511A。
在进一步优选的实施方案中,所述截短的刺突蛋白包含SEQ ID NO:15的氨基酸319-541或由其组成,所述截短的刺突蛋白与以下位点处的优选突变组合:(A)SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423和/或Phe 497;(B)SEQ ID NO:15的Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524和/或Val539;(C)SEQ ID NO:15的Ala 363和/或Ala 397;(D)SEQ ID NO:15的Cys 336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;和/或(E)SEQ ID NO:15的Ala419、Tyr 365、Ile418、Leu 387、Ile 410、Tyr 423和/或Phe 497。在最优选的实施方案中,所述片段包含突变,诸如SEQ ID NO:15的Y365、I402和/或V511。在甚至更优选的实施方案中,所述片段包含以下突变:SEQ ID NO:15的Y365L、I402V和/或V511A。
在一个优选的实施方案中,可以在体外合成编码所述SARS-CoV-2肽源性蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段的多核苷酸的混合物。所述多核苷酸还可以优选地包含DNA或mRNA。在优选的实施方案中,所述多核苷酸是体外转录(IVT)mRNA。包括所述IVT mRNA的mRNA可以进一步包含多聚(A)尾和/或5'帽。在另一个优选的实施方案中,所述mRNA可以在体外翻译以产生所述SARS-CoV-2肽源性蛋白,包括通过使用偶联的体外转录/翻译(IVTT)。
所述多核苷酸的混合物可以包含编码不同的SARS-CoV-2肽源性蛋白的序列,所述肽源性蛋白源自同一种SARS-CoV-2起始蛋白或多种SARS-CoV-2起始蛋白或多种相关SARS-CoV-2起始蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段。在进一步的实施方案中,所述多核苷酸编码SARS-CoV-2蛋白的混合物,其中所述混合物的蛋白质组分之一是SARS-CoV-2起始蛋白,并且其他组分是SARS-CoV-2肽源性蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段。在进一步优选的实施方案中,所述多核苷酸可以与将所述多核苷酸靶向细胞或器官的靶向组分缔合。可替代地,所述多核苷酸可以不与靶向组分缔合。编码所述SARS-CoV-2肽源性蛋白的多核苷酸还可以包含载体序列。
还考虑了这些多核苷酸的混合物以及表达多核苷酸混合物的动物(遗传修饰的或未遗传修饰的)。在优选的实施方案中,所述动物是哺乳动物,并且在进一步优选的实施方案中,所述哺乳动物是人、小鼠、兔、美洲驼或牛。
在进一步优选的实施方案中,所述方法诱导免疫应答。所述免疫应答可以在体内、离体和/或体外发生。
可以将编码所述SARS-CoV-2肽源性蛋白和/或所述刺突片段的多核苷酸(包括但不限于多核苷酸的混合物或编码的蛋白质的混合物)通过注射递送至所述动物。在优选的实施方案中,所述注射在所述动物的肌肉中发生。将所述多核苷酸/编码的蛋白质递送至所述动物可以用于疫苗接种目的、用于研究或抗体开发。
在进一步优选的实施方案中,回收并分离通过所述方法产生的抗体。在优选的实施方案中,所述抗体是完全人抗体、嵌合抗体、单链抗体、骆驼抗体、人源化抗体、多克隆抗体或单克隆抗体。在优选的实施方案中,所述多克隆抗体被进一步分级分离成单一的、分离的抗体种类。在其他优选的实施方案中,所产生的抗体是诸如例如通过噬菌体展示、酵母展示、核糖体展示或通过淘选技术而亲和力成熟的。
还考虑了编码通过本文所述的方法产生的抗体的多核苷酸。这些编码抗体的多核苷酸还可以包含异源启动子和/或载体序列。
如本文所述,所述SARS-CoV-2肽源性蛋白的混合物和/或编码所述SARS-CoV-2肽源性蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段的多核苷酸的混合物可以用于对动物进行疫苗接种。
在进一步优选的实施方案中,本发明是一种加工SARS-CoV-2肽源性蛋白和/或片段的方法,其中所述方法包括向抗原呈递细胞中引入SARS-CoV-2肽源性蛋白和/或由SEQID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段,其中所述SARS-CoV-2肽源性蛋白与SARS-CoV-2起始蛋白相比具有改变的构象动力学,并且其中所述SARS-CoV-2肽源性蛋白具有与所述SARS-CoV-2起始蛋白类似的构象;以及允许所述抗原呈递细胞加工和展示源自所述SARS-CoV-2肽源性蛋白的T细胞表位。
在优选的实施方案中,所述抗原呈递细胞是树突细胞、B细胞、单核细胞或巨噬细胞。在进一步优选的实施方案中,所述方法在体外或离体进行。在进一步优选的实施方案中,将所述抗原呈递细胞用编码所述一种或多种SARS-CoV-2肽源性蛋白的多核苷酸转染,和/或使其与所述一种或多种SARS-CoV-2肽源性蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段接触。在进一步优选的实施方案中,所述抗原呈递细胞经历所述一种或多种SARS-CoV-2肽源性蛋白或一种或多种编码所述SARS-CoV-2肽源性蛋白和/或由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段的多核苷酸的吞噬或胞饮。
附图说明
图1示出了来自如下BALB/C小鼠的血清的抗刺突片段IgG的半最大ELISA滴度(几何平均值),所述小鼠是用在初免/加强方案中与标准明矾佐剂一起施用的源自SEQ ID NO:15的刺突片段(空心圆)相比于这种相同片段与另外的突变体Y365L和V511A的混合物(实心圆)进行免疫的。
图2示出了来自加强免疫后55天的免疫的BALB/c小鼠的刺突片段特异性B细胞(CD3-、CD19+、IgM-、IgG1+)的流式细胞术,表明与源自单独用野生型(起始蛋白)(空心圆)免疫的小鼠或源自来自模拟免疫小鼠的幼稚B细胞(空心方形)的分泌抗刺突片段特异性IgG的记忆B细胞相比,在BALB/C小鼠的初免/加强免疫方案中施用的刺突片段加这种相同片段与另外的突变体Y365L和V511A的混合物(实心圆)增加了分泌抗刺突片段特异性IgG的记忆B细胞。
图3是已知冠状病毒的刺突片段的比对。箭头指示可以在已知刺突蛋白中的每一种中进行的关键突变。
具体实施方式
概述
我们在此描述了一种产生免疫应答的新颖方法,所述方法包括通过使用蛋白质的“肽源性潜力”经由改变SARS-CoV-2起始蛋白的构象动力学,同时保持蛋白质的3-D构象来增强抗体的产生。可替代地,由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成的片段(“刺突片段”的例子)也可以用于产生抗体,诸如当用作疫苗时。这些SARS-CoV-2肽源性蛋白和/或刺突片段然后可以用于建立免疫应答,用作疫苗和/或产生抗体。
因此,在一个实施方案中,本发明涉及一种触发免疫应答的方法,其中所述方法包括设计源自SARS-CoV-2起始蛋白的SARS-CoV-2肽源性蛋白和/或刺突片段的混合物,其中所述SARS-CoV-2肽源性蛋白与所述SARS-CoV-2起始蛋白相比具有改变的构象动力学,并且其中所述SARS-CoV-2肽源性蛋白在构象上与所述SARS-CoV-2起始蛋白类似,将所述SARS-CoV-2肽源性蛋白和/或刺突片段引入动物并产生免疫应答。所述SARS-CoV-2肽源性蛋白和/或刺突片段可以被直接引入动物(通过例如接种或免疫)或者可以通过已经引入动物并且编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸在体内表达。在表达这些SARS-CoV-2肽源性蛋白和/或刺突片段后,触发免疫应答以产生优选针对SARS-CoV-2肽源性蛋白和原始SARS-CoV-2起始蛋白两者的抗体。
多核苷酸的引入可以例如直接进行或在首先进行树突细胞的离体转染之后进行。此外,可以产生编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸并且将其引入动物。然后可以在动物中产生SARS-CoV-2肽源性蛋白和/或刺突片段,以产生针对SARS-CoV-2肽源性蛋白的抗体。本文所述的方法具有深刻影响蛋白质的免疫原性的潜力。在蛋白质中改变的优选生物物理和生物化学特性包括但不限于蛋白质的构象动力学,SARS-CoV-2起始蛋白的热力学稳定性、MHC-II结合和/或蛋白酶敏感性。本文所述的方法还可以用于同时产生针对不同SARS-CoV-2肽源性蛋白(源自同一种或不同的SARS-CoV-2起始蛋白)的交叉反应抗体,其具有深刻改变目前产生抗体的方式的潜力,因为可以通过在动物中单次注射获得的抗体库具有精简抗体开发和疫苗接种功效的潜力。
我们已经认识到,蛋白质的构象动力学对于蛋白质建立免疫应答的能力是关键的。我们将抗原在免疫后在体内有效产生肽片段的倾向称为“肽源性”。具有改变SARS-CoV-2起始蛋白的构象动力学以设计SARS-CoV-2肽源性蛋白的混合物的能力具有通过单次注射以成本有效的方式产生广泛的抗体库的潜力,所述混合物可以作为蛋白质混合物直接施用或通过多核苷酸混合物在动物中同时表达。
因此,如本文所公开的,用SARS-CoV-2肽源性蛋白和/或刺突片段的混合物免疫动物可以强烈地刺激免疫系统,当与抗原呈递细胞接触时产生更强的和/或更好的免疫应答。
用SARS-CoV-2肽源性蛋白和/或刺突片段的混合物(或组合的混合物)免疫是有利的,这归因于蛋白水解攻击产生肽的一种或多种蛋白抗原的复杂性。例如,提供具有不同氨基酸序列的多种不同的SARS-CoV-2肽源性蛋白产生了这样的环境,其中在正确的时间框架内产生给定肽(T细胞表位)的一种或多种最佳“调谐突变”可能不同于产生另一种肽的最佳突变。例如,一些细胞(诸如树突细胞)在激活期期间介导T细胞反应。如果这些细胞在这个激活窗之外(例如,在激活之前或之后)呈递抗原,则T细胞应答可能不会被触发。因此,T细胞需要在适当的时间呈递抗原,以触发免疫应答,所述适当的时间受抗原呈递细胞中蛋白降解(例如,蛋白水解)速率的控制。通过给出以混合物形式的抗原,多种不同的SARS-CoV-2肽源性蛋白可以被单个细胞胞吞,这在理论上使由该细胞产生和展示的肽的多样性最大化。此外,构象动力学增加的SARS-CoV-2肽源性蛋白可以导致MHC II类结合的改善,预期这使得免疫应答最大化。例如,对于相对无免疫原性的和/或由于太稳定而不是良好疫苗组分的蛋白质,并因此蛋白酶降解被抑制并且由此缺乏随后的肽呈递,从而导致适应性免疫中的免疫应答减弱,可以如本文所述改变此类蛋白质以产生具有改变的构象动力学、同时保持与SARS-CoV-2起始蛋白类似的构象的SARS-CoV-2肽源性蛋白的混合物。
在优选的实施方案中,SARS-CoV-2起始蛋白(也称为测试SARS-CoV-2起始蛋白)可以系统性地突变以改变SARS-CoV-2起始蛋白的热力学稳定性,而不显著改变相应折叠蛋白的三维结构,以产生具有增加的肽源性、同时展示与SARS-CoV-2起始蛋白基本上相同的3D(构象)表面表位的SARS-CoV-2肽源性蛋白。
因此,通过改变SARS-CoV-2起始蛋白的构象动力学以产生许多SARS-CoV-2肽源性蛋白增加SARS-CoV-2起始蛋白的免疫原性,然后可以将所述肽源性蛋白同时引入动物,将产生强烈的免疫应答,并且具有产生更广泛的多克隆抗体库的潜力,所述多克隆抗体可以进一步被分级分离(例如,经由它们各自的编码mRNA进行分子克隆)成单个分离物种。
定义
除非另有定义,否则本文所用的所有技术和科学术语具有与本领域中(诸如肽化学、细胞培养和噬菌体展示、核酸化学和生物化学领域中)普通技术人员通常理解的相同的含义。对于分子生物学、遗传学和生物化学方法使用标准技术(参见Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,2001,Cold Spring HarborLaboratory Press,Cold Spring Harbor;Ausubel等人,Short Protocols in MolecularBiology(1999)第4版,John Wiley&Sons,Inc.),将其通过引入并入本文。
如本文所用,“肽源性”是指蛋白质有效地产生稳健的一组各种各样的可用于产生免疫应答的肽的倾向。存在多种测量肽源性的测定(参见例如,So等人,图2c-图2d;Thai等,图7c-图7f;以及Delamarre等人,图1b-图1c、图4b-图4c和图5a-5b)。
如本文所用,“SARS-CoV-2肽源性蛋白”是指突变的SARS-CoV-2编码的蛋白质,其氨基酸序列已经被修饰,以与SARS-CoV-2起始蛋白序列相比改变其构象动力学,同时保持与SARS-CoV-2起始蛋白类似的构象。此类SARS-CoV-2起始蛋白的例子示于表2中。优选地,SARS-CoV-2起始蛋白是刺突蛋白。
如本文所用,受体结合结构域(“RBD”)包括本领域公认的负责病毒与其细胞进入受体结合的结构域,并且其也在刺突蛋白内见到,并且被鉴定为SEQ ID NO:15的氨基酸319-541和SEQ ID NO:16的氨基酸306-527。
如本文所用,“刺突片段”意指刺突蛋白的氨基酸片段,其包含由冠状病毒编码的刺突蛋白内所含的RBD结构域,并且其对应于SEQ ID NO:15的氨基酸316-594和/或SEQ IDNO:16的氨基酸303-580。图3示出了在其他已知的冠状病毒编码的刺突蛋白中这种等同片段的起始和终止处的氨基酸。特别考虑到,当发现新鉴定的冠状病毒时,通过重复图3中的比对,可以容易地鉴定这种相同的刺突片段。在进一步优选的实施方案中,如本文所述使用源自不同冠状病毒的刺突片段或编码此类片段的多核苷酸的混合物。
如本文所用,“非表面残基”是对于SARS-CoV-2蛋白的3D结构而言表面不可及的残基,例如掩埋在天然SARS-CoV-2蛋白的3D结构的内部的残基。在优选的实施方案中,“非表面”残基由Lee和Richards的方法定义(参见例如,Lee B等人,J.Mol.Biol.(1971);55(3):379-IN4.dx.doi.org/10.1016/0022-2836(71)90324-X.),其中天然蛋白质中残基的相对溶剂可及性小于50%、小于40%、小于30%、小于25%、小于20%、小于10%、小于5%或为0%,或者通过这样的方法定义,其中绝对溶剂可及表面积与完全延伸的Ala-X-Ala三肽的表面积之间的差异(参见例如,Gready JE等人,Protein Science.(1997);6(5):983-98.doi:10.1002/pro.5560060504.)大于
Figure BDA0004199120910000411
大于/>
Figure BDA0004199120910000412
大于/>
Figure BDA0004199120910000413
大于/>
Figure BDA0004199120910000414
大于
Figure BDA0004199120910000415
大于/>
Figure BDA0004199120910000416
大于/>
Figure BDA0004199120910000417
大于/>
Figure BDA0004199120910000418
或大于/>
Figure BDA0004199120910000419
在进一步优选的实施方案中,“非表面”残基定义为溶剂可及表面积小于/>
Figure BDA00041991209100004110
小于/>
Figure BDA00041991209100004111
小于/>
Figure BDA00041991209100004112
或小于/>
Figure BDA00041991209100004113
的残基,如通过本领域技术人员熟悉的结构分析软件包(例如UCSF Chimera(参见例如,Pettersen EF等人,J.Comput.Chem.(2004);25(13):1605-12.Epub 2004/07/21.)、PyMol(参见例如,Schrodinger,LLC.The PyMOL Molecular Graphics System,1.8版.2015.)等计算。
如本文所用,“SARS-CoV-2起始蛋白”或“测试SARS-CoV-2起始蛋白”是指用于衍生出SARS-CoV-2肽源性蛋白的“原始”或“参考”SARS-CoV-2蛋白的氨基酸序列。在一些例子中,“SARS-CoV-2起始蛋白”可以是已经被进一步修饰并且可以包括SARS-CoV-2起始蛋白的N和/或C末端缺失的SARS-CoV-2肽源性蛋白。
如本文所用,“免疫应答”是指体液免疫应答和/或细胞介导的免疫应答,后者是在加工蛋白质之后由抗原呈递细胞触发的。在体液免疫应答中,B淋巴细胞产生与天然的未加工抗原反应的抗体。这些抗原-抗体反应在一些情况下可以涉及激活补体级联的细胞-表面抗原,这引起带有那些抗原的细胞的裂解。在细胞介导的免疫应答中,T淋巴细胞在存在被识别为外来物的加工的肽抗原的情况下动员巨噬细胞。激活的T淋巴细胞也可以直接攻击带有外来抗原的细胞。
如本文所用,“抗原呈递细胞”是指可以将蛋白质分解(“加工”)成肽并与细胞表面上的MHC等位基因(优选主要HLA复合物I类或II类分子)相结合呈递肽的细胞。抗原呈递细胞的例子包括但不限于树突细胞、巨噬细胞、B细胞和单核细胞。
如本文所用,“构象动力学”定义为与在蛋白质分子中的原子或原子团相对于彼此的空间排列中蛋白质结构的构象变化和灵活性有关的现象。构象动力学包括“呼吸”运动,并且涉及由蛋白质分子中的共价键连接的原子的振动、弯曲、扭曲、旋转和其他允许的运动模式,其由内在恢复力控制,但由非共价相互作用(诸如氢键、范德华力和静电相互作用)调节。这些运动可以在亚皮秒时间尺度上巧妙地改变蛋白质的几何形状,并且可以在微秒至毫秒的时间尺度上产生广泛多样的构象状态。通常使用计算机模拟研究蛋白质的构象分子动力学。参见例如,Shaw等人(2010)Science 330,341。同样如本文所用,SARS-CoV-2起始蛋白的构象动力学可以通过化学修饰、氨基酸取代和其他突变(诸如缺失、插入、截短或其任何组合等)而改变。通过陈述SARS-CoV-2肽源性蛋白的构象动力学相对于野生型蛋白是不同的,意味着SARS-CoV-2肽源性蛋白的一个或多个氨基酸取代产生与野生型蛋白相比改变的构象动力学。
如本文所用,“热力学稳定性”根据化学系统定义,其中没有或有最少的能量被释放或消耗,因此不存在或存在最少的热能变化,并且在一组给定的实验条件下,系统处于其最低能量状态。同样如本文所用,“热力学稳定性降低”或“降低的热力学稳定性”意指与SARS-CoV-2肽源性蛋白的热力学稳定性有关的参数与在相同条件下测量的SARS-CoV-2起始蛋白的那些相比减弱,并且这种降低可以通过但不限于经由化学修饰、氨基酸取代和其他遗传突变改变SARS-CoV-2起始蛋白的分子结构而在SARS-CoV-2肽源性蛋白中实现。测量热力学稳定性降低的方法是本领域已知的并且在本文中描述,并且包括并入参数测量的方案,所述参数诸如熔解温度和尿素-或盐酸胍-诱导的平衡解折叠(变性)。这些参数典型地通过监测在平衡或准平衡条件下作为温度或变性剂浓度的函数的蛋白质解折叠反应来获得。通过测量解折叠状态相对于折叠状态的浓度来监测解折叠反应的方法包括但不限于UV吸收、荧光和圆二色性。这种方法允许相对于在相同条件下测量的SARS-CoV-2起始蛋白的稳定自由能计算突变体蛋白的稳定自由能(吉布斯自由能)。自由能的差异典型地由ΔΔG=ΔG突变体–ΔG标准(例如,wt)表示,其中ΔG突变体和ΔG标准(例如wt)分别是突变体蛋白和“标准”(例如,wt或野生型)蛋白的稳定自由能,并且ΔΔG是差异。ΔΔG>0指示突变体蛋白不如标准蛋白稳定,并且ΔΔG<0指示突变体蛋白比标准蛋白更稳定。
如本文所用,如果在使蛋白质的非表面残基突变(并且,因此,潜在地改变其总体构象动力学)之后充分保持3-D结构以允许抗体与SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者交叉反应,则SARS-CoV-2肽源性蛋白具有与SARS-CoV-2起始蛋白“类似的构象”。“交叉反应性”可以通过如本文所述的或如本领域熟知的结合测定来测量,并且测量为基于解离常数(KD)、解离速率(koff)和/或结合速率(kon)的“结合亲和力”。SARS-CoV-2肽源性蛋白不需要具有与SARS-CoV-2起始蛋白相同的3-D结构;仅足够类似的结构展示类似的3D构象表位(包括不连续的表位),这将允许抗体识别两种蛋白,即使结合亲和力可能不同。
在本发明中,术语“抗体”是指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即含有免疫特异性结合SARS-CoV-2肽源性蛋白、刺突片段和/或SARS-CoV-2起始蛋白的抗原结合位点的分子。因此,术语抗体不仅涵盖完整的抗体分子,而且涵盖抗体片段以及抗体和抗体片段的变体(包括衍生物,诸如融合蛋白)。在本申请中由术语“抗体”描述的分子的例子包括但不限于:单链Fv(scFv)、Fab片段、Fab'片段、F(ab')2、二硫键连接的Fv(sdFv)、Fv和包含VL结构域或VH结构域或可替代地由VL结构域或VH结构域组成的片段。如本文所用的术语“单链Fv”或“scFv”是指包含与抗体的VH结构域连接的抗体的VL结构域的多肽。参见Carter(2006)Nature Rev.Immunol.6:243。
此外,本发明的抗体包括但不限于单克隆、多特异性、双特异性、人、人源化、小鼠或嵌合抗体、单链抗体、驼源化抗体、Fab片段、F(ab')片段、抗独特型(抗Id)抗体(包括,例如,针对本发明抗体的抗Id抗体)、结构域抗体和上述中的任一种的表位结合片段。本发明的免疫球蛋白分子可以是免疫球蛋白分子的任何类型(例如,IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如,IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)或子类。
最优选地,所述抗体是人抗体。如本文所用,“人”抗体包括具有人免疫球蛋白的氨基酸序列的抗体,并且包括从人免疫球蛋白文库和异种小鼠或经基因工程化以产生人抗体的其他生物体中分离的抗体。对于用于生产人抗体和人单克隆抗体的几种技术以及用于生产此类抗体的方案的详细论述,参见例如,PCT公开案WO 98/24893;WO 92/01047;WO 96/34096;WO 96/33735;欧洲专利号0 598 877;美国专利号5,413,923;5,625,126;5,633,425;5,569,825;5,661,016;5,545,806;5,814,318;5,885,793;5,916,771;和5,939,598;以及Lonberg和Huszar,Int.Rev.Immunol.13:65-93(1995)。
人抗体或“人源化”嵌合单克隆抗体可以使用本文所述的技术或本领域原本已知的技术来产生。例如,用于生产嵌合抗体的方法是本领域中已知的。参见,查看以下参考文献:Morrison,Science 229:1202(1985);Oi等人,BioTechniques 4:214(1986);Cabilly等人,美国专利号4,816,567;Taniguchi等人,EP 171496;Morrison等人,EP 173494;Neuberger等人,WO 8601533;Robinson等人,WO 8702671;Boulianne等人,Nature 312:643(1984);Neuberger等人,Nature 314:268(1985)。
本发明的抗体可以是单价的、二价的、三价的或多价的。例如,单价scFv可以化学多聚化或通过与另一种蛋白质或物质结合而多聚化。可以使用Ni-NTA琼脂糖(Qiagen)或使用抗Flag抗体(Stratagene,Inc.)将融合至六组氨酸标签或Flag标签的scFv多聚化。
本发明的抗体可以是单特异性的、双特异性的、三特异性的或具有更大的多特异性。多特异性抗体可以对于SARS-CoV-2肽源性蛋白、对于多于一种SARS-CoV-2肽源性蛋白、对于SARS-CoV-2起始蛋白和/或对于刺突片段具有特异性,或者它们可以对于SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白和异源表位(诸如异源多肽或固体支持物材料)两者具有特异性。参见例如,PCT公开案WO 93/17715;WO 92/08802;WO 91/00360;WO 92/05793;Tutt等人,J.Immunol.147:60-69(1991);美国专利号4,474,893;4,714,681;4,925,648;5,573,920;5,601,819;Kostelny等人,J.Immunol.148:1547-1553(1992)。如本文所用的术语“片段”是指这样的多肽,其包含SARS-CoV-2肽源性蛋白和/或SARS-CoV-2起始蛋白的氨基酸序列的至少5个氨基酸残基、至少10个氨基酸残基、至少15个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基、至少35个氨基酸残基、至少40个氨基酸残基、至少45个氨基酸残基、至少50个氨基酸残基、至少60个氨基酸残基、至少70个氨基酸残基、至少80个氨基酸残基、至少90个氨基酸残基、至少100个氨基酸残基、至少125个氨基酸残基、至少150个氨基酸残基、至少175个氨基酸残基、至少200个氨基酸残基或至少250个氨基酸残基的氨基酸序列。在一些实施方案中,片段也可以指包含约8至24个氨基酸残基或约5至30个氨基酸残基的氨基酸序列的多肽。在优选的实施方案中,所述刺突片段由SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580组成。
如本文所用的术语“融合蛋白”是指这样的多肽,其包含SARS-CoV-2肽源性蛋白和/或刺突片段、SARS-CoV-2起始蛋白和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的氨基酸序列以及一种或多种异源肽和/或多肽的氨基酸序列,或可替代地由所述两种氨基酸序列组成。对于疫苗应用,融合至SARS-CoV-2肽源性蛋白和/或刺突片段的异源多肽序列优选来自病毒蛋白。
如本文所用的术语“宿主细胞”是指用核酸分子转染的特定受试细胞和这种细胞的后代或潜在后代。由于突变或环境影响或在随后的世代中可能发生的发育步骤或核酸分子整合到宿主细胞基因组中,因此后代可能与用核酸分子转染的亲本细胞不同。
“保守氨基酸取代”是这样的取代,其中氨基酸残基被具有类似化学性质(例如,大小、电荷、空间特征[例如,β-分支相对于非β-分支]、极性[亲水性相对于疏水性]、芳香族相对于非芳香族等)的含侧链的氨基酸残基替代。特定取代是否被认为是“保守的”还也可以取决于发生取代的折叠蛋白的结构背景。氨基酸侧链可以在一个方面是化学类似的,但在另一个方面是化学不类似的,并且背景可以决定这些特性中的哪些控制着特定取代有多“保守”(即,破坏性最小)。本领域已经定义了具有化学类似侧链的氨基酸残基家族。这些家族包括具有以下项的氨基酸:碱性侧链(例如,赖氨酸、精氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如,天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸)、非极性侧链(例如,甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)、以及芳族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。一些侧链具有在生理相关pH范围内具有pH依赖性的杂合特征。例如,组氨酸(pKa约6)在低于pH 6时变得带更多正电荷(碱性),而在pH 7.5和更高时是极性的但基本不带电荷。半胱氨酸(pKa约8.5)在低于pH 8时基本不带电荷(不是特别极性的),但在pH 9下带负电荷(并且是酸性的)。酪氨酸酚侧链在较高pH下也部分离子化并且带负电荷。此外,蛋白质的其余部分的局部静电环境(背景)可以显著改变这些有效pH值。此外,酸性蛋白质半胱氨酸硫醇酸酯侧链可以经由涉及中间体含二硫键化合物(诸如氧化型谷胱甘肽)的巯基-二硫键交换与另一蛋白质半胱氨酸硫醇反应以形成分子内二硫键;此类键是高度疏水的(非极性的)。此外,天然存在的氨基酸和/或非天然存在的氨基酸都可以用于SARS-CoV-2肽源性蛋白和/或刺突片段中。
突变可以以定点方式或沿着编码序列的全部或部分随机引入。突变体文库可以设计成在给定的残基位点引入单个氨基酸取代、两个氨基酸取代、三个氨基酸取代、四个氨基酸取代等,最多十九个氨基酸取代。在还其他实施方案中,突变体文库可以设计成在给定的残基位点引入超过十九个氨基酸取代(包括天然和非天然氨基酸)。此外,文库可以组合地设计成在两个位点、三个位点、四个位点等同时产生多个突变。诱变后,编码的蛋白质可以被常规地表达,并且编码的蛋白质的构象动力学和/或肽源性可以使用本文描述的技术或通过本领域已知的常规修饰技术来确定。可以筛选所得突变体蛋白,并且评价其热力学稳定性的改变或肽源性或与SARS-CoV-2起始蛋白和/或刺突片段类似的构象。可替代地,来自设计的文库的表达的蛋白质“输出”可以用于免疫动物而无需预先针对蛋白质特性进行筛选。
如本文所用,“患者”或“适于治疗的受试者”可以是哺乳动物,诸如啮齿动物(例如豚鼠、仓鼠、大鼠、小鼠)、鼠科(例如小鼠)、犬科(例如狗)、猫科(例如猫)、马科(例如马)、灵长类动物、猿(simian)(例如猴或猿(ape))、猴(例如狨猴、狒狒、恒河猴)、猿(ape)(例如大猩猩、黑猩猩、长臂猿)或人。在其他实施方案中,可以采用非人哺乳动物,尤其是常规用作用于证明在人类中的治疗功效的模型的哺乳动物(例如鼠科、灵长类动物、猪科、犬科、骆驼、美洲驼或兔)。
本发明的其他方面和实施方案提供了其中术语“包含”被术语“由......组成”替代的本文所述的方面和实施方案以及其中术语“包含”被术语“基本上由......组成”替代的上面描述的方面和实施方案。
如本文使用,“和/或”将被视为两个或更多个指定特征或组分中的每个在有或没有另一个特征或组分的情况下的具体公开。例如,“A、B和/或C”将被视为(i)A、(ii)B、(iii)C、(iv)A和B、(v)A和C、(vi)B和C以及(vii)A和B和C中的每个的具体公开,就像每个在本文中单独阐述一样。
改变蛋白质的构象动力学的方法
可以使用本领域熟知的标准分子生物学诱变技术产生SARS-CoV-2肽源性蛋白和/或刺突片段。例如,可以通过本领域熟知的随机诱变,诸如例如通过易错PCR、随机核苷酸插入或缺失或重组前的其他方法产生SARS-CoV-2肽源性蛋白和/或刺突片段。
为了产生SARS-CoV-2肽源性蛋白和/或刺突片段,可以采用蛋白质工程化。可以使用本领域技术人员已知的重组DNA技术来产生包括单个或多个氨基酸取代、缺失、插入或融合蛋白的SARS-CoV-2肽源性蛋白和/或刺突片段。可以筛选此类SARS-CoV-2肽源性蛋白,以寻找具有改变的构象动力学、同时保持与如本文所述的SARS-CoV-2起始蛋白类似的构象的那些。
例如,为了增加SARS-CoV-2肽源性蛋白和/或刺突片段的构象动力学,下表,表1,示出了在源自Loladze等人,J.Mol.Biol.320,343-357(2002)的表1和表2的一系列蛋白质中的示例性氨基酸取代的吉布斯自由能的平均变化[注:此论文在表示突变体蛋白与野生型蛋白质之间的吉布斯自由能时使用了非标准惯例,即使用负值来指明不稳定(ΔΔG=ΔG(突变体)-ΔG(WT));标准惯例是正变化指明不稳定(ΔΔG=ΔG(WT)-ΔG(突变体),见上文)]。例如,Val和Leu(和其他较大的非极性氨基酸残基)可以被较小的残基(诸如Ala、Thr、Asn和/或Gly)取代。此外,天然蛋白质结构中Glu的掩埋位点可以被Leu、Val、Asn、Thr、Ser、Ala和/或Gly取代。所示的单一位点氨基酸取代的类型通常对SARS-CoV-2起始蛋白的总体构象几乎没有影响。
Figure BDA0004199120910000451
描述增加构象动力学的蛋白质核心中的失稳突变的另一说明性论文是Kim等人(1993)Protein Sci.2:588-596。在此项工作中,作者表明突变Phe22->Ala(2.1kcal/mol)、Tyr23->Ala(7.0kcal/mol)、Tyr35->Gly(5.7kcal/mol)、Asn43->Gly(6.0kcal/mol)和Phe45->Ala(7.2kcal/mol)使牛胰腺胰蛋白酶抑制剂(BPTI)在pH 3.5下以括号中所示的相应量失稳,而不会严重破坏BPTI的总体3D结构。
此外,根据本领域已知的一般规则选择的遗传缺失、插入、倒位、重复和类型取代对活性几乎没有影响。例如,关于如何进行表型沉默氨基酸取代的指导提供在Bowie,J.U.等人,"Deciphering the Message in Protein Sequences:Tolerance to Amino AcidSubstitutions,"Science 247:1306-1310(1990)中,其中作者指明存在两种用于研究氨基酸序列对变化的耐受性的主要方法。第一种方法依赖于进化过程,其中突变通过自然选择而被接受或拒绝。第二种方法使用基因工程化以在克隆基因的特定位置引入氨基酸变化,以及选择或筛选以鉴定保持功能性的序列。
如作者陈述,这些研究揭示了蛋白质对氨基酸取代具有出人意料的耐受性。作者进一步指明在蛋白质的特定位置哪些氨基酸改变可能是允许的。例如,大多数掩埋的氨基酸残基需要非极性侧链,而表面侧链的少数特征通常是保守的。其他此类表型沉默取代描述于Bowie,J.U.等人,同上,以及其中引用的参考文献中。被典型地认为保守取代的是在脂肪族氨基酸Ala、Val、Leu和Ile中一个替代另一个;带有羟基的残基Ser和Thr的互换;酸性残基Asp和Glu的交换;在侧链带有酰胺的残基Asn和Gln之间的取代;碱性氨基酸Lys和Arg的交换;以及在芳族残基Phe和Tyr之间的替代。
在优选的实施方案中,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(b)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(c)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(d)用丙氨酸、缬氨酸、甘氨酸或异亮氨酸替代至少一个亮氨酸;或(e)用丙氨酸、缬氨酸、异亮氨酸或甘氨酸替代至少一个异亮氨酸;或(f)用丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个脯氨酸、甲硫氨酸、苯丙氨酸、酪氨酸或色氨酸;或(g)用谷氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸替代至少一个天冬氨酸;或(h)用天冬氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸;或(i)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(j)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(k)用赖氨酸、精氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸或谷氨酰胺替代至少一个组氨酸;或(l)用甘氨酸或脯氨酸替代至少一个丙氨酸;或(m)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、谷氨酰胺、天冬氨酸或谷氨酸替代至少一个天冬酰胺;或(n)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、天冬酰胺、天冬氨酸、谷氨酸或组氨酸替代至少一个谷氨酰胺;或(o)用丙氨酸或脯氨酸替代至少一个甘氨酸;或(p)用非天然氨基酸替代至少一个残基;或(q)(a)-(p)的任何组合。在仍进一步优选的实施方案中,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用酪氨酸、苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个色氨酸;或(b)用苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个酪氨酸;或(c)用酪氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个苯丙氨酸;或(d)用甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个脯氨酸;或(e)用苯丙氨酸、酪氨酸、甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸、甘氨酸、赖氨酸、精氨酸、丝氨酸、苏氨酸、天冬酰胺或谷氨酰胺替代至少一个组氨酸;或(f)用异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个甲硫氨酸;或(g)用亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个异亮氨酸;或(h)用异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个亮氨酸;或(i)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(j)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(k)用谷氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个天冬氨酸;或(l)用天冬氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸;或(m)用甘氨酸或脯氨酸替代至少一个丙氨酸;或(n)用丙氨酸或甘氨酸替代至少一个丝氨酸;或(o)用丙氨酸或脯氨酸替代至少一个甘氨酸;或(p)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(q)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸或谷氨酸替代至少一个天冬酰胺;或(r)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸、谷氨酸或组氨酸替代至少一个谷氨酰胺;或(s)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(t)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(u)用较小的类似疏水性残基替代疏水性残基;或(v)用非天然氨基酸替代至少一个残基;或(w)上述组合中的任一种。在一些实施方案中,疏水性残基是替代的目标。
SARS-CoV-2起始蛋白中对于功能、构象和/或结构所需的并且位于蛋白质表面相对于内部的氨基酸可以通过本领域已知的方法,诸如定点诱变或丙氨酸扫描诱变来鉴定(Cunningham和Wells,Science 244:1081-1085(1989))。后一种程序在分子中的每个残基处引入了单个丙氨酸突变。然后测试所得突变体分子,以得到具有改变的构象动力学、同时保持与SARS-CoV-2起始蛋白类似的构象的那些突变体分子。
在另一个实施方案中,SARS-CoV-2起始蛋白的氨基酸序列的一个或多个氨基酸(例如,1、2、3、4、5、6、7、8、9、10、15、20、30或50个氨基酸)被如上所述的取代的氨基酸替代(保守取代或非保守取代),以产生SARS-CoV-2肽源性蛋白和/或刺突片段。例如,可以在不涉及SARS-CoV-2起始蛋白活性的位置和/或在蛋白结构内部容易地进行取代。对于配体-受体结合而言关键的位点也可以通过结构分析(诸如结晶、核磁共振或光亲和标记)来确定(Smith等人,J.Mol.Biol.224:899-904(1992);以及de Vos等人Science 255:306-312(1992))。
采用本领域技术人员已知的组合诱变和合成DNA合成方法的重组DNA技术也可以用于产生包括单个或多个氨基酸取代、缺失、添加或融合蛋白的SARS-CoV-2肽源性蛋白和/或刺突片段。然后可以针对改变的构象动力学、同时保持与SARS-CoV-2起始蛋白类似的构象来筛选此类修饰的多肽。
因此,可以制备SARS-CoV-2肽源性蛋白和/或刺突片段,其中缺失、添加或取代一个或多个氨基酸残基以产生具有改变的构象动力学的SARS-CoV-2肽源性蛋白。例如,蛋白质的疏水“核心”中的残基可以被具有较小侧链的非极性残基取代(同上),以便在核心中产生空腔并破坏包装,并且半胱氨酸残基可以缺失或被其他氨基酸残基取代,以便消除二硫桥(其通常在蛋白质核心中见到)。在一些实施方案中,在SARS-CoV-2起始蛋白中消除了至少一个二硫键,诸如例如半胱氨酸被丙氨酸、丝氨酸和/或甘氨酸等替代。在进一步优选的实施方案中,参与形成至少一个二硫键的两个半胱氨酸都被丙氨酸、丝氨酸和/或甘氨酸替代,或优选被丙氨酸或甘氨酸等替代。
SARS-CoV-2肽源性蛋白优选以分离的形式提供,并且优选基本上是纯化的。此外,SARS-CoV-2肽源性蛋白将展示出用于B细胞激活的稳定的3D构象表位,同时合成的肽(诸如通过化学合成)可以被共施用,这可以优化用于MHC-II呈递的表位。可替代地,SARS-CoV-2肽源性蛋白和肽可以由多核苷酸的混合物表达。在还其他实施方案中,SARS-CoV-2肽源性蛋白和/或刺突片段可以与野生型SARS-CoV-2起始蛋白和一种或多种合成肽组合,以引发免疫应答。
在一些实施方案中,可以调节多肽降解的速率以便产生最佳肽混合物,并且在正确的时间框架内,以允许在抗原呈递细胞上展示的肽的最大多样性。
由于蛋白水解攻击产生用于展示的肽的一种或多种蛋白抗原的复杂性,用抗原混合物(诸如组合混合物)免疫是有利的。因此,在正确的时间框架内产生给定肽(T细胞表位)的一种或多种最佳“调谐突变”可能不同于产生另一种肽的最佳突变。通过给出以混合物形式的SARS-CoV-2肽源性蛋白和/或刺突片段,多种不同的突变体SARS-CoV-2蛋白可以被单个细胞或多个细胞胞吞,这使得由该细胞产生和展示的肽的多样性最大化。可替代地,刺突片段可以作为疫苗单独施用。
组合免疫丰富了T细胞表位的多样性,在所述组合免疫中用两种或更多种不同的SARS-CoV-2肽源性蛋白对受试者进行免疫,所述肽源性蛋白具有相同的总体表面特征(即交叉反应的B细胞表位),但具有不同的构象动力学。包括在单次接种中的数百或甚至数千种不同的SARS-CoV-2肽源性蛋白(基于蛋白和基于核苷酸两者)的这种组合方法可以极大地增加B细胞表位库,因为混合物中的每个分子可以促成一个或多个独特的T细胞表位,同时保持野生型样构象。在一些方面,因为保持了野生型构象,但B细胞表位库偏向于总体中最稳定(和推测为野生型样)的分子。
肽源性蛋白具有与SARS-CoV-2起始蛋白类似的构象
SARS-CoV-2肽源性蛋白是否具有“与SARS-CoV-2起始蛋白类似的构象”的操作测试是交叉反应抗体,尤其是识别构象(3D)表位的抗体是否特异性结合至SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者。在本发明中,“交叉反应性”或“交叉反应抗体”根据“结合亲和力”定义,其可以基于解离常数(KD)、解离速率(koff)和/或结合速率(kon)来测量。
例如,交叉反应抗体以小于或等于5×10-6M、10-6M、5×10-7M、10-7M、5×10-8M或10- 8M的解离常数或KD结合至SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者。甚至更优选地,交叉反应抗体以小于或等于5×10-9M、10-9M、5×10-10M、10-10M、5×10-11M、10-11M、5×10-12M、10-12M、5×10-13M、10-13M、5×10-14M或10-14M的解离常数KD结合至SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者。本发明涵盖在单独所述值中的每个之间的范围中的任一个内的对于SARS-CoV-2肽源性蛋白和/或SARS-CoV-2起始蛋白的解离常数或KD。此外,特别考虑了抗体结合SARS-CoV-2肽源性蛋白的KD可能与其对于SARS-CoV-2起始蛋白的KD不同,并且在优选的实施方案中,抗体结合SARS-CoV-2肽源性蛋白的KD低于其结合SARS-CoV-2起始蛋白的KD。应理解,在操作上,KD在这种情况下是指抗体对抗原的功能性亲和力。在含有多个可以结合至抗原的相互作用位点(例如,Fab臂)的多价抗体中,可以增强功能性或“表观”亲和力(“亲合力效应”)。
此外,交叉反应抗体以小于或等于5×10-2sec-1、10-2sec-1、5×10-3sec-1或10-3sec-1的解离速率(koff)结合至SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者。更优选地,交叉反应抗体以小于或等于5×10-4sec-1、10-4sec-1、5×10-5sec-1或10-5sec-1、5×10-6sec-1、10-6sec-1、5×10-7sec-1或10-7sec-1的解离速率(koff)结合至SARS-CoV-2肽源性蛋白和SARS-CoV-2起始蛋白两者。本发明涵盖在单独所述值中的每个之间的范围中的任一个内的对于SARS-CoV-2肽源性蛋白和/或SARS-CoV-2起始蛋白的解离速率(koff)。此外,特别考虑了抗体对于SARS-CoV-2肽源性蛋白的koff可能与SARS-CoV-2起始蛋白的koff不同,并且在优选的实施方案中,抗体与SARS-CoV-2肽源性蛋白结合的(koff)大于抗体与SARS-CoV-2起始蛋白结合的(koff)。
测试交叉反应性的测定在本文中描述或在本领域中已知。例如,结合测定可以在溶液中(例如,Houghten,Bio/Techniques 13:412-421(1992))、在珠粒上(例如,Lam,Nature 354:82-84(1991))、在芯片上(例如,Fodor,Nature 364:555-556(1993))、在细菌上(例如,美国专利号5,223,409)、在孢子上(例如,专利号5,571,698;5,403,484;和5,223,409)、在质粒上(例如,Cull等人,Proc.Natl.Acad.Sci.USA 89:1865-1869(1992))或在噬菌体上(例如,Scott和Smith,Science 249:386-390(1990);Devlin,Science249:404-406(1990);Cwirla等人,Proc.Natl.Acad.Sci.USA 87:6378-6382(1990);以及Felici,J.Mol.Biol.222:301-310(1991))进行。此类测定的例子在下面的实施例中进一步描述。
作为疫苗的用途
SARS-CoV-2肽源性蛋白和/或刺突片段和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸的混合物可以用于对动物进行疫苗接种。这种疫苗接种可能导致产生针对刺突片段和/或SARS-CoV-2肽源性蛋白的抗体。如上所述的适于治疗的受试者可以是哺乳动物,诸如啮齿动物(例如豚鼠、仓鼠、大鼠、小鼠)、鼠科(例如小鼠)、犬科(例如狗)、猫科(例如猫)、马科(例如马)、灵长类动物、猿(simian)(例如猴或猿(ape))、猴(例如狨猴、狒狒、恒河猴)、猿(ape)(例如大猩猩、黑猩猩、长臂猿)或人。在优选的实施方案中,所述受试者是人。在其他实施方案中,可以采用非人哺乳动物,尤其是常规用作证明在人类中的治疗功效的模型的哺乳动物(例如鼠科、灵长类动物、猪科、犬科或兔类动物)。
在一些实施方案中,SARS-CoV-2肽源性蛋白和/或刺突片段是用于疫苗的嵌合融合蛋白,例如已经融合至另一种蛋白(例如病毒外壳蛋白)的蛋白。可以用于递送融合至作为疫苗组分的一部分的病毒外壳蛋白的肽源性蛋白的病毒的例子包括慢病毒载体、腺病毒载体(例如腺病毒血清型5(Ad5))、痘苗病毒、甲病毒载体、水疱性口炎病毒(VsV)载体、金丝雀痘病毒载体和麻疹病毒载体,其中这些已被最广泛使用和研究。
疫苗接种策略可以基于向如本文所述的受试者一次或多次施用SARS-CoV-2肽源性蛋白和/或刺突片段和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸,以使得能够产生针对SARS-CoV-2肽源性蛋白和/或刺突片段的记忆B细胞和记忆T细胞。可以预防性或治疗性地进行疫苗接种。SARS-CoV-2肽源性蛋白可以源自同一种SARS-CoV-2起始蛋白或源自多种SARS-CoV-2起始蛋白。尽管预防性疫苗接种策略旨在刺激受试者的免疫系统以产生针对病原体的预防性适应性免疫,但治疗性疫苗接种策略的目标是在疾病已经确立之后进行或改善受试者中存在的临床情况。
蛋白水解加工涉及在胞吞和内体与溶酶体融合之后在抗原呈递细胞中加工抗原,诸如SARS-CoV-2肽源性蛋白和/或刺突片段。然后内体与来自含有II类MHC分子的高尔基体的细胞外泡合并,所得肽与所述II类MHC分子结合。然后MHC-肽复合物运输至质膜,在那里抗原可用于展示给CD4+T细胞。SARS-CoV-2肽源性蛋白和/或刺突片段的蛋白水解加工的任何限制都可以促进肽产物多样性变窄,这将使II类MHC分子在选择稳定的结合配偶体时选择更少,并且这可能加剧免疫显性决定簇的现象。提高的免疫显性反过来会增加群体中无应答者的比例,因为免疫应答受II类MHC等位基因的遗传学控制。因此,使用本文所述的SARS-CoV-2肽源性蛋白和/或刺突片段和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸的混合物的疫苗应该增加由内体内蛋白水解加工产生的抗原肽的种类,并且因此预期将增加疫苗的有效性。
例如,也可以将编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸直接引入动物。参见例如,美国专利号5,676,954;6,875,748;5,661,133;Sahin等人,Nat Rev DrugDiscov,2014年10月;13(10):759-80;Kariko等人,Mol Ther,2008年11月;16(11):1833-40;Kariko等人,Nucleic Acid Res,2011年11月;39(21):e142;美国专利号6,511,832。在一个例子中,将多核苷酸(诸如编码SARS-CoV-2肽源性蛋白和/或刺突片段的混合物的DNA序列)直接注射到宿主动物中,并且多核苷酸进入细胞核,转录成mRNA,以便产生SARS-CoV-2肽源性蛋白和/或刺突片段。多核苷酸可以作为包含表达载体(例如质粒)或重组病毒载体的DNA疫苗提供,其中,例如,编码SARS-CoV-2肽源性蛋白和/或刺突片段的混合物的DNA序列包含在构建体中,所述构建体具有用于其表达的适当转录和翻译控制信号。本领域技术人员熟知用于DNA疫苗的合适的表达载体和病毒载体。此类载体在例如Kutzler等人Nat.Rev.Genet.9(10):776-788(2008)中详细讨论。DNA疫苗可以用合适的佐剂配制和/或可以并入各种递送媒介物,诸如脂质体(例如阳离子脂质体)、脂质无机纳米颗粒(LION)和脂质-核酸纳米颗粒(LNP)复合物中(Bruun等人,Int.J.Nanomedicine 10:5995-6008(2015))。在其他情况下,DNA疫苗可以是“裸”DNA疫苗。
类似地,所述多核苷酸也可以是mRNA序列,诸如体外转录mRNA(IVT mRNA)。基本上,合成的mRNA可以被工程化以表达SARS-CoV-2肽源性蛋白和/或刺突片段,并且理想地,所述mRNA在细胞质中翻译而不进入细胞核。在细胞质中,mRNA由核糖体解码并被翻译成SARS-CoV-2肽源性蛋白和/或刺突片段。所述多核苷酸可以作为包含表达载体或重组病毒载体的RNA疫苗提供。在一些实施方案中,所述多核苷酸可以作为编码完整病毒RNA聚合酶复合物(典型地来自甲病毒)的病毒衍生复制子(repRNA)疫苗提供,但是其中结构蛋白基因将被编码SARS-CoV-2肽源性蛋白和/或刺突片段的mRNA序列替代(Xiong等人,Science243:1188-1191(1989))。与DNA疫苗一样,包含例如编码SARS-CoV-2肽源性蛋白和/或刺突片段的混合物的mRNA序列的疫苗可以用合适的佐剂配制和/或将其并入各种递送媒介物(诸如脂质体和LNP)中,或以裸露形式施用。
在任一方法中,SARS-CoV-2肽源性蛋白和/或刺突片段从多核苷酸表达,然后加工并用于产生抗体,非常像用蛋白免疫。编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸可以使用遗传密码子简并和标准DNA合成技术合成。可以使用编码同一种肽源性蛋白、源自同一种SARS-CoV-2起始蛋白的不同SARS-CoV-2肽源性蛋白和/或源自不同SARS-CoV-2起始蛋白的不同SARS-CoV-2肽源性蛋白的不同多核苷酸的混合物。
特别关注的是在老年患者中可以获得强保护性免疫应答的疫苗,所述老年患者是对严重和威胁生命的SARS-CoV-2感染特别敏感的患者群体(Erasmus等人,Sci.Transl.Med.12:555(2020);Pfizer Press release:"Pfizer and BioNTech ChooseLead mRNA Vaccine Candidate Against COVID-19and Commence Pivotal Phase 2/3Global Study",2020年7月27日;Walsh等人,medRxiv preprint doi:https://doi.org/10.1101/2020.08.17.20176651 2020年8月20日发布的版本;Koff和Williams,NewEngl.J.Med.383:805(2020))。液泡ATP酶的功能障碍和随之发生的溶酶体pH升高在老年个体中是常见的(Colacurcio和Nixon,Ageing Res.Rev.32:75)。由于酸性pH是溶酶体中的主要蛋白质变性剂,并且由于降解性溶酶体蛋白酶(组织蛋白酶)具有酸性pH活性最佳值,所以溶酶体内pH的升高阻碍了蛋白水解加工。底物蛋白的肽源性增加抵消了这种趋势,并且将导致老年个体的抗原呈递细胞(APC)更有效的抗原加工,从而增强免疫应答。使用某些佐剂(例如基于脂质体的AS01B佐剂系统)和其他策略以实现强效CD4+和CD8+T细胞应答,也可以用于在老年患者中实现强的和保护性的免疫应答(Weinberger,Immunity&Ageing 15:3(2018))。
SARS-CoV-2肽源性蛋白产生抗体的用途
SARS-CoV-2肽源性蛋白和/或刺突片段也可以用于通过本领域技术人员熟知的方法(诸如例如本领域描述的方法)产生抗体。参见例如,Sutcliffe等人,同上;Wilson等人,同上;Chow等人,Proc.Natl.Acad.Sci.USA 82:910-914(1985);以及Bittle等人,J.Gen.Virol.66:2347-2354(1985)。如果使用体内免疫,可以用本文所述的SARS-CoV-2肽源性蛋白和/或刺突片段、和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的SARS-CoV-2多核苷酸免疫动物。
可以用SARS-CoV-2肽源性蛋白和/或刺突片段和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸免疫动物,诸如兔、大鼠、小鼠、美洲驼、骆驼和/或牛。例如,可以使用腹膜内和/或皮内注射含有约100微克SARS-CoV-2肽源性蛋白和/或刺突片段或载体蛋白和弗氏佐剂或任何其他已知用于刺激免疫应答的佐剂的乳剂。可能需要例如以约两周的间隔进行若干次加强注射,以提供可以例如通过ELISA测定使用直接或间接(例如,经由生物素化AviTag)吸附到固体表面的游离肽源性蛋白来检测的抗肽源性蛋白抗体的有用效价。来自免疫动物的血清中的抗肽源性蛋白抗体的效价可以通过选择抗肽源性蛋白抗体来增加,例如,根据本领域熟知的方法通过将SARS-CoV-2肽源性蛋白和/或刺突片段吸附至固体支持物上并洗脱所选择的抗体来进行选择。此类选择也可以使用SARS-CoV-2起始蛋白进行。
此外,通过所公开的方法产生的抗体可以使用展示技术,诸如例如噬菌体展示、酵母展示或核糖体展示进行亲和力成熟。在一个例子中,筛选展示在噬菌体颗粒表面上的单链抗体分子(“scFv”)以鉴定那些免疫特异性结合至SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的scFv。本发明涵盖scFv与其部分两者,它们被鉴定为免疫特异性结合至SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白。通过将例如编码scFv的VH和/或VL结构域的核苷酸序列插入含有恒定结构域序列的表达载体中并对其进行工程化以指导免疫球蛋白分子的表达,可以将此类scFv常规地“转化”成免疫球蛋白分子。
表达系统
本领域技术人员熟知的方法可以用于构建含有抗体编码序列和SARS-CoV-2肽源性蛋白和/或刺突片段的编码序列以及适当的转录和翻译控制信号的表达载体。这些方法包括例如体外重组DNA技术、合成技术和体内遗传重组。因此,本发明提供了可复制的载体,其包含可操作地连接至启动子的编码SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体(例如,完整抗体、抗体的重链或轻链、抗体的重链或轻链可变结构域、或其部分、或重链或轻链CDR、单链Fv、或其片段或变体)的多核苷酸序列。此类载体可以包括编码抗体分子的恒定区的核苷酸序列(参见例如,PCT公开案WO86/05807;PCT公开案WO 89/01036;和美国专利号5,122,464),并且可以将抗体的可变结构域克隆到这种载体中以表达整个重链、整个轻链、或整个重链和整个轻链两者。
一种或多种表达载体可以通过常规技术转移到宿主细胞中,并且转染的细胞然后通过常规技术培养,以产生SARS-CoV-2肽源性蛋白和/或刺突片段或针对抗SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体。因此,本发明包括宿主细胞,其含有可操作地连接至异源启动子的一种或多种编码SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体(例如,完整抗体、其重链或轻链、或其部分、或本发明的单链抗体、或其片段或变体)的多核苷酸。在优选的实施方案中,对于完整抗体分子的表达,可以在宿主细胞中共表达编码重链和轻链两者的载体以表达整个免疫球蛋白分子,如下面详述。
可以利用多种宿主表达载体系统来表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体。此类宿主表达系统代表了可以用来产生目的编码序列并随后纯化的媒介物,而且还代表了当用适当的核苷酸编码序列转化或转染时可以表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的细胞。这些包括但不限于微生物,诸如用含有序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的细菌(例如,大肠杆菌、枯草芽孢杆菌);用含有编码序列的重组酵母表达载体转化的酵母(例如,酵母属、毕赤酵母属);用含有编码序列的重组病毒表达载体(例如,杆状病毒)感染的昆虫细胞系统;用重组病毒表达载体(例如,花椰菜花叶病毒CaMV;烟草花叶病毒TMV)感染的或用含有编码序列的重组质粒表达载体(例如,Ti质粒)转化的植物细胞系统;或具有重组表达构建体的哺乳动物细胞系统(例如,COS、CHO、BHK、293、3T3细胞),所述重组表达构建体含有源自哺乳动物细胞的基因组的启动子(例如,金属硫蛋白启动子)或源自哺乳动物病毒的启动子(例如,腺病毒晚期启动子;痘苗病毒7.5K启动子)。优选地,细菌细胞,诸如大肠杆菌,且更优选真核细胞,用于表达SARS-CoV-2肽源性蛋白和/或刺突片段或重组抗体分子。例如,与载体(诸如来自人巨细胞病毒的主要中间早期基因启动子元件)结合使用的哺乳动物细胞(诸如中国仓鼠卵巢细胞(CHO))是有效的表达系统(Foecking等人,Gene 45:101(1986);Cockett等人,Bio/Technology 8:2(1990))。
在细菌系统中,根据预期的用途,可以有利地选择许多表达载体。例如,当要生产大量蛋白质(SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体)时,可能期望指导大量容易纯化的融合蛋白产物的表达的载体。此类载体包括但不限于大肠杆菌表达载体pUR278(Ruther等人,EMBO 1.2:1791(1983)),其中编码序列可以单独连接至具有lac Z编码区的框内载体中,从而产生融合蛋白;pIN载体(Inouye和Inouye,Nucleic Acids Res.13:3101-3109(1985);Van Heeke和Schuster,J.Biol.Chem.24:5503-5509(1989));等等。pGEX载体也可以用于表达外源多肽,作为与谷胱甘肽5-转移酶(GST)的融合蛋白。通常,此类融合蛋白是可溶的,并且可以通过吸附和结合至基质谷胱甘肽琼脂糖珠粒,随后在存在游离谷胱甘肽的情况下洗脱而容易地从裂解的细胞中纯化。pGEX载体被设计成包括凝血酶或Xa因子蛋白酶切割位点,使得克隆的靶基因产物可以从GST部分释放。
在昆虫系统中,苜蓿银纹夜蛾核型多角体病毒(AcNPV)可以用作载体以表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体。所述病毒在草地夜蛾细胞中生长。编码序列可以单独地克隆到病毒的非必需区(例如,多角体蛋白基因)中,并处于AcNPV启动子(例如,多角体蛋白启动子)的控制之下。
在哺乳动物宿主细胞中,可以利用许多基于病毒的表达系统。在腺病毒用作表达载体的情况下,目的编码序列可以连接至腺病毒转录/翻译控制复合体,例如晚期启动子和三联前导序列。然后,通过体外或体内重组将这种嵌合基因插入腺病毒基因组中。
插入病毒基因组的非必需区(例如,区域El或E3)将产生活的并能够在感染的宿主中表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的重组病毒(例如,参见Logan和Shenk,Proc.Natl.Acad.Sci.USA 81:355-359(1984))。
为了有效翻译插入的编码序列,也可能需要特定的起始信号。这些信号包括ATG起始密码子和相邻序列。此外,起始密码子必须与所需编码序列的阅读框同相,以确保整个插入物的翻译。这些外源翻译控制信号和起始密码子可以是天然和合成的多种来源。可以通过包含适当的转录增强子元件、转录终止子等来增强表达效率(参见例如,Bittner等人,Methods in Enzymol.153:51-544(1987))。
此外,可以选择调节插入序列的表达或以所需具体方式修饰并加工基因产物的宿主细胞株。对蛋白质产物的此类修饰(例如,糖基化)和加工(例如,切割)可能对蛋白质功能而言是重要的。不同宿主细胞具有翻译后加工和修饰蛋白质和基因产物的特征和特定机制。可以选择适当的细胞系或宿主系统以确保对所表达的外源蛋白的正确修饰和加工,为此,可以使用具有用于正确加工基因产物的初级转录物、糖基化和磷酸化的细胞机制的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERY、BHK、Hela、COS、NSO、MDCK、293、3T3、W138,且特别是乳腺癌细胞系,诸如例如BT483、Hs578T、HTB2、BT2O和T47D,以及正常乳腺细胞系,诸如例如CRL7O3O和HsS78Bst。
对于重组蛋白的长期高产率产生,稳定表达是优选的。例如,可以工程化稳定表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的细胞系。不是使用含有病毒复制起点的表达载体,而是可以用由适当的表达控制元件(例如,启动子、增强子、序列、转录终止子、多腺苷酸化位点等)控制的多核苷酸和选择性标记物转化宿主细胞。在引入外源多核苷酸后,可以使工程化的细胞在富集培养基中生长1-2天,然后将其移到选择性培养基。重组质粒中的选择性标记物赋予对选择的抗性,并且允许细胞将质粒稳定地整合到它们的染色体中并生长以形成集落,进而可以克隆并扩增成细胞系。这种方法可以有利地用于工程化表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的细胞系。
可以使用许多选择系统,包括但不限于,单纯疱疹病毒胸苷激酶(Wigler等人,Cell 11:223(1977))、次黄嘌呤鸟嘌呤磷酸核糖基转移酶(Szybalska和Szybalski,Proc.Natl.Acad.Sci.USA 48:202(1992))和腺嘌呤磷酸核糖基转移酶(Lowy等人,Cell22:8 17(1980))基因可以分别用于tk-、hgprt-或aprt-细胞。此外,抗代谢物抗性可以用作选择以下基因的基础:dhfr,其赋予对甲氨蝶呤的抗性(Wigler等人,Natl.Acad.Sci.USA77:357(1980);O'Hare等人,Proc.Natl.Acad.Sci.USA 78:1527(1981));gpt,其赋予对霉酚酸的抗性(Mulligan和Berg,Proc.Natl.Acad.Sci.USA 78:2072(1981));neo,其赋予对氨基糖苷G-418的抗性(Goldspel等人,Clinical Pharmacy,12:488-505(1993);Wu和Wu,Biotherapy3:87-95(1991);Tolstoshev,Ann.Rev.Pharmacol.Toxicol.32:573-596(1993);Mulligan,Science 260:926-932(1993);以及Morgan和Anderson,Ann.Rev.Biochem.62:191-217(1993);TIB TECH 11(5):155-2 15(1993年5月));和hygro,其赋予对潮霉素的抗性(Santerre等人,Gene 30:147(1984))。重组DNA技术领域中通常已知的方法可以常规地应用于选择所需的重组克隆体,并且此类方法例如描述于Ausubel等人(编辑),Current Protocols in Molecular Biology,John Wiley&Sons,NY(1993);Kriegler,Gene Transfer and Expression,A Laboratory Manual,Stockton Press,NY(1990);以及第12和13章,Dracopoli等人(编辑),Current Protocols in HumanGenetics,John Wiley&Sons,NY(1994);Colberre-Garapin等人,J.Mol.Biol.150:1(1981)中。
SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的表达水平可以通过载体扩增来增加(综述参见Bebbington和Hentschel,The use of vectors based on gene amplification for the expression of clonedgenes in mammalian cells in DNA cloning,第3卷.(Academic Press,New York,1987))。当表达SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的载体系统中的标记物可扩增时,宿主细胞培养物中存在的抑制剂水平的增加将增加标记基因的拷贝数。由于扩增区与编码序列结合,SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的产量也将增加(Crouse等人,Mol.Cell.Biol.3:257(1983))。
可以包含在载体序列中的其他元件包括异源信号肽(分泌信号)、膜锚定序列、内含子、选择性剪接位点、翻译起始和终止信号、内含肽、生物素化位点和促进翻译后修饰的其他位点、纯化标签、编码与其他蛋白质或肽的融合物的序列、由内部核糖体再进入位点隔开的单独编码区、编码例如赋予选择能力(例如,抗生素抗性)或分选能力(例如,荧光)的“标记”蛋白的序列、修饰的核苷酸和不限于这些例子的其他已知的多核苷酸顺式作用特征。
在抗体的情况下,宿主细胞可以用本发明的两种表达载体共转染,第一种载体编码重链衍生的多肽,并且第二种载体编码轻链衍生的多肽。这两种载体可以含有相同的选择性标记物,其能够使得重链多肽和轻链多肽的表达相同。可替代地,可以使用编码并能够表达重链多肽和轻链多肽两者的单一载体。在此类情况下,优选将轻链置于重链之前以避免过量的无毒性重链(Proudfoot,Nature 322:52(1986);Kohler,Proc.Natl.Acad.Sci.USA 77:2 197(1980))。重链和轻链的编码序列可以包含cDNA或基因组DNA或合成DNA序列。
例如,使用SARS-CoV-2肽源性蛋白和/或刺突片段(包括scFv和包含抗体片段或其变体(例如,本发明的抗体的重链或轻链或其部分或本发明的单链抗体)或可替代地由其组成的其他分子)产生的抗体的重组表达需要构建含有编码所述抗体或其片段或变体的多核苷酸的一种或多种表达载体。一旦获得了编码本发明的抗体分子(例如,完整抗体、抗体的重链或轻链、或其变体或部分(优选地但非必需地,含有重链或轻链可变结构域))的多核苷酸,就可以使用本领域熟知的技术通过重组DNA技术产生用于产生抗体分子的一种或多种载体。因此,本文描述了通过表达含有抗体编码核苷酸序列的多核苷酸来制备抗体的方法。
一旦通过重组表达产生了SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体,就可以通过本领域已知的纯化蛋白质的任何方法进行纯化,例如通过色谱法(例如,离子交换色谱法、亲和色谱法(特别是通过蛋白A对特定抗原的亲和力和免疫亲和力)和大小柱色谱法)、离心、差异溶解或通过任何其他纯化蛋白的标准技术进行纯化。此外,可以将SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体融合至本文所述或本领域原本已知的异源多肽序列,以促进纯化。
在一个例子中,本文所述的SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体可以与免疫球蛋白(IgA、IgE、IgG、IgM)的恒定结构域或其部分(CH1、CH2、CH3或其任何组合及其部分)或白蛋白(包括但不限于重组人白蛋白或其片段或变体(参见例如,美国专利号5,876,969,1999年3月2日授权;欧洲专利0413 622;以及美国专利号5,766,883,1998年6月16日授权)融合,产生嵌合多肽。此类融合蛋白可以促进纯化并且可以增加体内半衰期。对于由人CD4多肽的前两个结构域和哺乳动物免疫球蛋白的重链或轻链的恒定区的各种结构域组成的嵌合蛋白,已经证明了这一点。参见例如,EP 394,827;Traunecker等人,Nature,331:84-86(1988)。对于缀合至FcRn结合配偶体(诸如IgG或Fe片段)的抗原(例如,胰岛素),已经证实了抗原穿过上皮屏障向免疫系统的增强递送(参见例如,PCT公开案WO 96/22024和WO 99/04813)。还发现由于IgG部分二硫键而具有二硫键连接的二聚体结构的IgG融合蛋白在结合和中和其他分子方面比单独的单体多肽或其片段更有效。参见例如,Fountoulakis等人,J.Biochem.,270:3958-3964(1995)。编码本文所述的SARS-CoV-2肽源性蛋白和/或刺突片段或抗体的核酸也可以与作为表位标签(例如,血凝素(“HA”)标签或flag标签)的目的基因重组,以帮助检测和纯化表达的多肽。例如,Janknecht等描述的系统允许在人细胞系中表达的非变性融合蛋白的快速纯化(Janknecht等人,1991,Proc.Natl.Acad.Sci.USA 88:8972-897)。在此系统中,将目的基因亚克隆到牛痘重组质粒中,使得基因的开放阅读框翻译融合至由六个组氨酸残基组成的氨基末端标签。所述标签充当融合蛋白的基质结合结构域。将来自感染重组痘苗病毒的细胞的提取物装载到Ni2+次氮基乙酸-琼脂糖柱上,并且组氨酸标记的蛋白可以用含咪唑的缓冲液选择性地洗脱。
配制品
药物组合物可以包含本文所述的SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体以及一种或多种药学上可接受的载体、佐剂、赋形剂、稀释剂、填充剂、缓冲剂、稳定剂、防腐剂、润滑剂或本领域技术人员熟知的其他材料。合适的材料将是无菌的和无热原的,具有合适的等渗性和稳定性。例子包括无菌盐水(例如0.9%NaCl)、水、右旋糖、甘油、乙醇等或其组合。此类材料应为无毒的并且不应干扰活性化合物的功效。载体或其他材料的精确性质将取决于施用途径,其可以通过推注、输注、注射或任何其他合适的途径进行,如下面讨论的。所述组合物可以进一步含有辅助物质,诸如润湿剂、乳化剂、pH缓冲剂等。合适的载体、赋形剂等可见于标准药物文本,例如Remington's PharmaceuticalSciences,第18版,Mack Publishing Company,Easton,Pa.,1990中。
如本文所用的术语“药学上可接受的”涉及在合理的医学判断范围内适合用于与受试者(例如,人)的组织接触而没有过多毒性、刺激、过敏反应或者其他问题或并发症,与合理的益处/风险比相称的化合物、材料、组合物和/或剂型。在与配制品的其他成分相容的意义上,每种载体、赋形剂等也必须是“可接受的”。
在一些实施方案中,SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体可以以冻干的形式提供,用于在施用前重构。例如,冻干试剂可以在无菌水中重构,并且在施用于受试者前与盐水混合。
此外,特别考虑了SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的“混合物”。例如,不同的SARS-CoV-2肽源性蛋白和/或刺突片段或编码源自同一种SARS-CoV-2起始蛋白的不同SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸的混合物可以用于建立免疫应答。可替代地,不同的SARS-CoV-2肽源性蛋白和/或刺突片段或编码源自不同起始材料的不同SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸的混合物也可以用于建立免疫应答。最后,可以施用单一肽源性蛋白和/或刺突片段和/或编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体。
配制品可以方便地以单位剂型存在,并且可以通过药学领域中熟知的任何方法制备。此类方法包括使活性化合物与构成一种或多种辅助成分的载体结合的步骤。通常,配制品通过以下方式制备:将活性化合物与液体载体或细碎的固体载体或两者均一且紧密地结合,并且然后(如果必要的话)使产品成形。
配制品可以呈如下形式:液体、溶液、混悬液、乳剂、酏剂、糖浆剂、片剂、锭剂、颗粒剂、粉剂、胶囊剂、扁囊剂、丸剂、安瓿、栓剂、阴道栓、软膏剂、凝胶剂、糊剂、乳膏剂、喷雾剂、雾剂、泡沫剂、洗剂、油、大丸剂、糖饵剂或气溶胶。
任选地,其他治疗或预防剂可以包含在药物组合物或配制品中。
治疗可以是任何治疗和疗法,无论是人还是动物(例如在兽医应用中),在所述治疗和疗法中实现了一定的所需治疗效果,例如,病症进展的抑制或延迟,并且包括进展速率的降低、进展速率的停止、病症的改善、病症的治愈或缓解(无论部分或全部)、预防、延迟、减轻或阻止病症的一种或多种症状和/或体征或者延长受试者或患者的存活期使其超过在没有治疗的情况下所预期的存活期。
还包括作为预防措施的治疗(即,预防)。例如,可以如本文所述治疗易患疾病或有疾病发生或复发的风险的受试者。这种治疗可以预防或延迟受试者中疾病的发生或复发。
如本文所用的术语“治疗有效量”涉及有效产生一定的所需治疗效果、与合理的效益/风险比相称的SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的量。
应理解,SARS-CoV-2肽源性蛋白和/或刺突片段或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的适当剂量可以随患者的不同而变化。确定最佳剂量通常将涉及平衡诊断益处水平与施用的任何风险或有害副作用。所选择的剂量水平将取决于多种因素,包括但不限于施用途径,施用时间,活性化合物的排泄速率,组合使用的其他药物、化合物和/或材料,以及患者的年龄、性别、体重、病症、一般健康状况和既往病史。肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的量以及施用途径最终将由医师判断,但通常剂量将在治疗部位达到活性化合物的浓度,而不引起显著的危害性或有害的副作用。
通常,SARS-CoV-2肽源性蛋白和/或刺突片段的合适剂量在约1至100ug的范围内。在优选的实施方案中,这些蛋白质或编码这些蛋白质的多核苷酸以初次接种的免疫方案施用,随后优选在三至四周后给予第二剂量。如果需要,可以在另外三至四周之后施用第三剂量。还可以需要实施加强免疫方案,其中按照确定的每年方案来进行注射。
可替代地,针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的施用量应该相对于人的体重计算,并且优选在500-1500mg/40kg体重之间的范围内。
可以按一种剂量连续地或间歇地(例如,以适当的间隔以分剂量)实现体内施用。确定最有效的施用方式和剂量的方法是本领域技术人员熟知的,并且将随用于疗法的配制品、疗法的目的、所治疗的靶细胞和正治疗的受试者而变化。可以用由医师选择的剂量水平和模式来进行单次或多次施用。
“同时”施用意指SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体通过相同的施用途径以单剂量施用于受试者。
“分开”施用意指通过同时发生的两种不同的施用途径将SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体施用于受试者。这可能在以下情况下发生,例如将一种药剂通过输注或肠胃外施用,而将另一种药剂在输注或肠胃外施用过程中口服给予。
“顺序”意指SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体在不同的时间点施用,条件是在施用第二种药剂时,第一种施用的药剂的活性在受试者中存在并持续。优选地,将存在顺序剂量,使得两种药剂中的第二种在第一种药剂的48小时内,在优选24小时内,诸如在12、6、4、2或1小时内施用。
可以施用多剂量的SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体。例如,在施用SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体之后,可以施用2、3、4、5或超过5个剂量。SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的施用可以在初次施用之后持续一段时间。例如,用SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体进行的治疗可以持续至少1周、至少2周、至少3周、至少1个月或至少2个月。用SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体进行的治疗可以持续长达实现治疗反应所需的时间。
可以将SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体以及包含这些分子的组合物通过任何方便的施用途径施用于受试者,无论全身性/外周性施用或在所需作用的位点施用,包括但不限于口服(例如通过摄入);和肠胃外,例如,通过注射,包括皮下、皮内、肌内、静脉内、动脉内、心内、鞘内、脊柱内、囊内、囊下、眶内、腹膜内、气管内、表皮下、关节内、蛛网膜下和胸骨内注射;通过例如皮下或肌内植入贮库。通常将通过静脉内途径施用,但不排除其他途径,诸如腹膜内、皮下、经皮、口服、鼻、肌内或其他方便的途径。
包含SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的药物组合物可以配制成适合预期的施用途径的合适剂量单位配制品。
适于口服施用(例如,通过摄入)的配制品可以提供为离散单元(诸如胶囊剂、扁囊剂或片剂),每个单元均含有预定量的活性化合物;提供为粉剂或颗粒剂;提供为在水性或非水性液体中的溶液或混悬液;或提供为水包油液体乳剂或油包水液体乳剂;提供为大丸剂;提供为冲剂;或提供为糊剂。
可以通过常规手段制备片剂,例如压制或模制(任选地与一种或多种辅助成分一起)。可以通过以下方式来制备压制片剂:在合适的机器中压制自由流动形式的活性化合物(诸如粉末或颗粒),其任选地与以下混合:一种或多种粘合剂(例如聚维酮、明胶、阿拉伯树胶、山梨糖醇、黄芪胶、羟丙基甲基纤维素);填充剂或稀释剂(例如乳糖、微晶纤维素、磷酸氢钙);润滑剂(例如硬脂酸镁、滑石、二氧化硅);崩解剂(例如羟基乙酸淀粉钠、交联聚维酮、交联羧甲基纤维素钠);表面活性剂或分散剂或润湿剂(例如十二烷基硫酸钠);以及防腐剂(例如对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、山梨酸)。模制片剂可以通过在合适的机器中将用惰性液体稀释剂润湿的粉末状化合物的混合物模制来制备。片剂可以任选地包衣或刻痕,并且可以使用例如不同比例的羟丙基甲基纤维素配制以便提供其中活性化合物的缓慢或控制释放以提供所需的释放曲线。片剂可以任选地提供有肠溶衣,以提供在除胃之外的肠道部分中的释放。
适于肠胃外施用(例如通过注射,包括皮肤、皮下、肌内、静脉内和皮内)的配制品包括水性和非水性的等渗的无热原的无菌注射溶液,其可以含有抗氧化剂、缓冲液、防腐剂、稳定剂、抑菌剂和使配制品与预期接受者的血液等渗的溶质;以及水性和非水性的无菌混悬液,其可以包含悬浮剂和增稠剂以及设计为将化合物靶向细胞组分或一个或多个器官的脂质体或其他微粒系统。用于此类配制品的合适等渗媒介物的例子包括氯化钠注射液、林格氏溶液或乳酸林格氏注射液。典型地,溶液中活性化合物的浓度为约1ng/ml至约10μg/ml,例如约10ng/ml至约1μg/ml、约1μg/ml至约10mg/ml、约10μg/ml至约1mg/ml、约1mg/ml至约20mg/ml、约10mg/ml至约120mg/ml,或适合施用生物药物(例如,蛋白质、抗体等)的任何其他浓度。可以将配制品提供在单位剂量或多剂量密封的容器(例如,安瓿和小瓶)中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在即将使用前添加无菌液体载体(例如注射用水)。临时注射溶液和混悬液可以由无菌粉剂、颗粒剂和片剂制备。配制品可以呈脂质体或其他微粒系统的形式,其被设计成将活性化合物靶向血液组分或一个或多个器官。
包含SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的组合物可以制备成用于随后稀释的浓缩物的形式,或者可以呈准备用于施用的分剂量的形式。可替代地,试剂可以在试剂盒中单独地提供,以用于在施用于人或动物受试者前混合。
可以将SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、和/或针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体单独施用或与其他治疗组合同时或依序施用,这取决于个体情况。例如,可以将SARS-CoV-2肽源性蛋白和/或刺突片段、编码SARS-CoV-2肽源性蛋白和/或刺突片段的多核苷酸、或如本文所述的针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体与一种或多种另外的活性化合物组合施用。
鉴于本公开文本,本发明的各种其他方面和实施方案对本领域技术人员将是清楚的。
应当理解,除非上下文另外要求,否则本申请公开了上面描述的上述方面和实施方案中的任一个与彼此的所有组合。类似地,除非上下文另外要求,否则本申请公开了单独地或与其他方面中的任一个一起的优选特征和/或任选特征的所有组合。
在阅读本公开文本时,以上实施方案的修改、进一步的实施方案及其修改对本领域技术人员将是显而易见的,并且因此它们在本发明的范围内。出于所有目的将本说明书中提及的所有文件和序列数据库条目通过引用以其整体并入本文。下面参考以下实施例来进一步描述本发明。
实施例
实施例1:产生肽源性抗原
为了产生SARS-CoV-2肽源性蛋白,可以在其核心残基处修饰SARS-CoV-2起始蛋白(例如,一个或多个突变)以改变其构象动力学。可以设计和表达多种不同的SARS-CoV-2肽源性蛋白来免疫动物(诸如兔),以产生多克隆抗体应答。可替代地,可以将编码SARS-CoV-2肽源性蛋白的多核苷酸直接施用于动物以在体内产生SARS-CoV-2肽源性蛋白。通过两种互补且相互加强的方法监测应答(Georgiou等人,2014;图2):(a)从免疫动物的血液、脾脏和骨髓中纯化B细胞,从编码重链和轻链的可变区的mRNA中分离cDNA,并经由深度DNA测序分析这个库;和(b)使用附着到固体支持物的抗原从免疫血清中免疫亲和纯化多克隆Fab或(Fab')2片段,用蛋白酶消化洗脱的Fab/(Fab')2,并使用LC/MS/MS对所得肽进行测序。
具体地,可以用多种SARS-CoV-2肽源性蛋白(或编码SARS-CoV-2肽源性蛋白的多核苷酸)对测试动物(兔)进行激发,其中SARS-CoV-2肽源性蛋白的构象与SARS-CoV-2起始蛋白类似,但SARS-CoV-2肽源性蛋白的构象动力学是不同的。使用下一代DNA测序技术,可以全面地表征动物体内的体液应答。可以克隆来自B淋巴细胞的免疫球蛋白V区并对其进行大规模平行深度测序(5-8)。与此相结合,来自同一测试动物的多克隆抗体可以通过免疫亲和色谱法纯化,然后进行蛋白酶消化并进行LC-MS/MS以确定肽序列(9、10)。这两个数据集的比较说明了包含多克隆应答的单独抗体的库(9)。
例如,已经在生物物理学上非常充分地表征的小哺乳动物蛋白可以用作测试抗原。优选的例子包括但不限于牛胰腺胰蛋白酶抑制剂和/或阿尔茨海默氏淀粉样前体蛋白Kunitz结构域。可替代地,还可以产生并在此方法中测试与未满足的疫苗需要相关的抗原,诸如例如恶性疟原虫孢子体抗原。此外,还可以产生合成疫苗关于组分蛋白的构象动力学的优化(或再优化)(可能用具有不同核心失稳突变的相同抗原的若干形式的组合混合物替代单个组分)。在临床试验中测试这些新疫苗可以包括类似于上述程序,使用血液衍生B细胞V区库的类似DNA序列分析和免疫亲和纯化的多克隆抗体肽的蛋白质组学表征来监测疫苗接种的个体。
可以根据本文所述的本发明的实施方案使用的抗原的其他优选例子包括但不限于抗原或源自严重急性呼吸综合征冠状病毒(SARS-CoV-2)的抗原,优选表2中所述的那些抗原,以及来自感染猿、猴、鸟、猪、骆驼和其他动物的相关病毒的抗原。
在优选的实施方案中,表2中列出的蛋白抗原中的任一种都可以用作SARS-CoV-2起始蛋白,以衍生出SARS-CoV-2肽源性蛋白。此外,表2中列出的多种抗原可以用作SARS-CoV-2起始蛋白以衍生出多种将用作疫苗的不同SARS-CoV-2肽源性蛋白,产生免疫应答,包括产生抗体。
此外,不同蛋白抗原的组合可以用作SARS-CoV-2起始蛋白。
为了改变SARS-CoV-2起始蛋白的构象动力学,可以考虑下表3中所示的吉布斯自由能的以下变化:
Figure BDA0004199120910000581
如在Loladze等人(J.Mol.Biol.320,343-357(2002))中讨论的,以下氨基酸取代可以降低热力学稳定性(例如,在吉布斯自由能中反映的)并改变SARS-CoV-2起始蛋白的构象动力学。例如,Val和Leu(和其他较大的非极性氨基酸残基)可以被较小的残基(诸如Ala、Thr、Asn和/或Gly)取代。此外,SARS-CoV-2起始蛋白中Glu的掩埋位点可以被Leu、Val、Asn、Thr、Ser、Ala和/或Gly取代。预期这些单位点氨基酸取代产生稳定性较低但构象与SARS-CoV-2起始蛋白类似的SARS-CoV-2肽源性蛋白。
可替代地,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(b)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(c)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(d)用丙氨酸、缬氨酸、甘氨酸或异亮氨酸替代至少一个亮氨酸;或(e)用丙氨酸、缬氨酸、亮氨酸或甘氨酸替代至少一个异亮氨酸;或(f)用丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个脯氨酸、甲硫氨酸、苯丙氨酸、酪氨酸或色氨酸;或(g)用甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸替代至少一个天冬氨酸或天冬酰胺;或(h)用天冬氨酸、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸或谷氨酰胺;或(i)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(j)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(k)用赖氨酸、精氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、谷氨酰胺、天冬酰胺、亮氨酸或异亮氨酸替代至少一个组氨酸;或(l)用甘氨酸替代至少一个丙氨酸;或(m)用非天然氨基酸替代至少一个残基;和/或(n)上述组合中的任一种。
在仍进一步优选的实施方案中,通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:(a)用酪氨酸、苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个色氨酸;或(b)用苯丙氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个酪氨酸;或(c)用酪氨酸、甲硫氨酸、组氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个苯丙氨酸;或(d)用甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个脯氨酸;或(e)用苯丙氨酸、酪氨酸、甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、丙氨酸、甘氨酸、赖氨酸、精氨酸、丝氨酸、苏氨酸、天冬酰胺或谷氨酰胺替代至少一个组氨酸;或(f)用异亮氨酸、亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个甲硫氨酸;或(g)用亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个异亮氨酸;或(h)用异亮氨酸、缬氨酸、丙氨酸或甘氨酸替代至少一个亮氨酸;或(i)用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或(j)用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或(k)用谷氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个天冬氨酸;或(l)用天冬氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸;或(m)用甘氨酸或脯氨酸替代至少一个丙氨酸;或(n)用丙氨酸或甘氨酸替代至少一个丝氨酸;或(o)用丙氨酸或脯氨酸替代至少一个甘氨酸;或(p)用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或(q)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸或谷氨酸替代至少一个天冬酰胺;或(r)用甘氨酸、丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、天冬氨酸、谷氨酸或组氨酸替代至少一个谷氨酰胺;或(s)用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或(t)用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或(u)用较小的类似疏水性残基替代疏水性残基;或(v)用非天然氨基酸替代至少一个残基;或(w)上述组合中的任一种。可以使用组合方法来确定用于增加免疫原性的最佳取代。
实施例2:优选的刺突蛋白疫苗。
在优选的实施方案中,鉴定出刺突蛋白的特定片段提供了当与公布的其他COVID-19疫苗的功效结果相比时出乎意料地改善的疫苗接种结果,甚至在其他疫苗包含RBD结构域的不同区的情况下也是如此。此外,如图1和图2中所示,当刺突片段的混合物与如本文所述的突变组合时,获得甚至更好的结果。具体地,包含SEQ ID NO:15的氨基酸316-594或由其组成的片段提供了出乎意料且显著改善的结果。此片段发现于所述刺突蛋白内,并且包括负责SARS-CoV-2与其细胞进入受体ACE2结合的RBD结构域(Lan等人,Nature 581:215-220(2020);Hurlburt等人,Nat.Commun.11:5413(2020))。已经发现RBD是SARS-CoV和MERS-CoV的刺突蛋白的最具免疫原性的区域(Du等人,Nat.Rev.MicroBiol.7:226-236(2009)),并且在疫苗中包含RBD可以引发靶向病毒的RBD的免疫应答,以防止或中和病毒进入宿主细胞中(Du等人,Nat.Commun.7:13473(2016))。此外,已经认识到尽管RBD不如刺突蛋白的非RBD区保守,但是在SARS-CoV-2与SARS之间发现了相同氨基酸,并且所述相同氨基酸提供了引发靶向RBD中的保守表位的抗体的潜力,所述抗体可以提供针对包括SARS-CoV-2突变体的不同冠状病毒的交叉反应性(Du等人,同上)。
如本文公开的特定刺突片段被鉴定为具有比利用RBD的其他疫苗出乎意料地更好的活性。SARS-CoV-2的刺突片段显示为涵盖以下片段:
>sp|P0DTC2|SEQ ID NO:15的氨基酸316-594
SNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFK
CYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNL
DSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVG
YQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGG(SEQ ID NO:39)
此外,这种相同片段可以用特定突变进行工程化。显示出甚至更好的活性的三个优选突变包括Y365L、I402V和V511A。
SARS-CoV-2Y365L刺突片段
SNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADLSVLYNSASFSTFK
CYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNL
DSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVG
YQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGG(SEQ ID NO:40)
SARS-CoV-2I402V刺突片段
SNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFK
CYGVSPTKLNDLCFTNVYADSFVVRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNL
DSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVG
YQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGG(SEQ ID NO:41)
SARS-CoV-2V511A刺突片段
SNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFK
CYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNL
DSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVG
YQPYRVAVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGG(SEQ ID NO:42)
此刺突片段可以直接用作疫苗,或者可以与突变(诸如上面显示的那些)组合以改变蛋白质的稳定性和构象动力学。认为此特定片段(连同突变)可以导致多克隆抗体库多样性增加和掩埋或部分闭合的B细胞表位的暴露。
预期与全长wt刺突蛋白相比,截短的构建体可能导致T细胞表位的组多样性较低,这是由于消除了包含刺突蛋白的其余部分的N和C末端延伸。然而,经由在核心疏水残基(hydrophobic)中产生微腔的氨基酸取代来增加所得抗原片段的构象灵活性的方法应该通过增强由APC实现的抗原片段T细胞表位肽的产生和呈递来补偿,从而加强此结构域的免疫原性。
尽管其他人已经提出了刺突蛋白的类似片段(例如,如以下文献中所述的刺突构建体319-591:Wrapp D,Wang N,Corbett KS,Goldsmith JA,Hsieh C-L,Abiona O,GrahamBS,McLellan JS.Cryo-EM structure of the 2019-nCoV spike in the prefusionconformation.Science.2020;367(6483):1260-3.doi:10.1126/science.abb2507;和如以下文献中所述的刺突构建体319-541:Amanat F,Stadlbauer D,Strohmeier S,NguyenTHO,Chromikova V,McMahon M,Jiang K,Arunkumar GA,Jurczyszak D,Polanco J,Bermudez-Gonzalez M,Kleiner G,Aydillo T,Miorin L,Fierer DS,Lugo LA,Kojic EM,Stoever J,Liu STH,Cunningham-Rundles C,Felgner PL,Moran T,García-Sastre A,Caplivski D,Cheng AC,Kedzierska K,Vapalahti O,Hepojoki JM,Simon V,Krammer F.Aserological assay to detect SARS-CoV-2seroconversion in humans.NatureMedicine.2020;26(7):1033-6.doi:10.1038/s41591-020-0913-5),但预期本文提出的片段具有改善的特性。
可以与氨基酸316-594的优选截短的刺突蛋白组合的优选突变位点选自:SEQ IDNO:15的A)Trp353、Tyr 365、Phe392、Phe400、Tyr 423、Phe497和/或Phe543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys336Ala/Cys361Ala和/或Cys379Ala/Cys432Ala;(E)Ala 419、Ala 575、Val 576、Tyr365、Ile 418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe497和/或Leu 552,或SEQ ID NO:16中的相应突变。
在进一步优选的实施方案中,包含氨基酸319-591或由其组成的截短的刺突蛋白与以下优选位点处的突变组合:SEQ ID NO:15的(A)Trp 353、Tyr 365、Phe 392、Phe400、Tyr 423、Phe 497和/或Phe 543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys 336Ala/Cys 361Ala和/或Cys 379Ala/Cys432Ala;和/或(E)Ala 419、Ala 575、Val 576、Tyr 365、Ile 418、Leu 387、Leu585、Ile410、Tyr 423、Phe 497和/或Leu 552,或SEQ ID NO:16中的相应突变。
在进一步优选的实施方案中,包含氨基酸319-541或由其组成的截短的刺突蛋白与以下优选位点处的突变组合:SEQ ID NO:15的(A)Trp 353、Tyr 365、Phe 392、Phe400、Tyr 423和/或Phe 497;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524和/或Val539;(C)Ala 363和/或Ala 397;(D)Cys336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;和/或(E)Ala 419、Tyr 365、Ile 418、Leu 387、Ile 410、Tyr 423和/或Phe 497,或SEQ ID NO:16中的相应突变。
在一个这样的实验中,使用明矾作为佐剂,用3μg野生型抗原或野生型抗原和两种突变体抗原等比例的3μg混合物(即,1μg wt抗原加每种突变体抗原各1μg)免疫BALB/c小鼠两次(初免+2次加强)。对于ELISA,将天然野生型RBD 316-594片段经由C末端标签固定在孔中,允许激发的多克隆抗体结合至野生型RBD构象表位。计算来自加强之后的不同时间点小鼠抗血清重复(n次)ELISA的半最大滴定的几何平均值。如图1中所示,与单独用刺突片段免疫相比,用刺突片段与两种突变体Y365L和V511A(如上所述)的蛋白混合物免疫引起RBD特异性抗IgG抗体滴度显著增加。
类似地,图2表明,与用等摩尔浓度的单独刺突片段免疫或模拟免疫的小鼠相比,用抗原片段的混合物(刺突片段+2种突变体[上述])进行免疫还导致增加的刺突片段特异性记忆B细胞产生。
实施例3:测量构象动力学改变的测定
构象动力学的改变可以通过本领域已知的标准方法测量。在优选的实施方案中,与SARS-CoV-2起始蛋白相比,构象动力学的改变可以通过测量熔解温度的变化、尿素诱导的平衡解折叠研究的变化和/或吉布斯自由能的变化来显示。
熔解温度的变化可以由以下方案显示。例如,在0.1cm石英比色皿中,以由Jasco可编程Peltier元件控制的1度x min-1的加热速率,将SARS-CoV-2肽源性蛋白(0.20mg/ml)和SARS-CoV-2起始蛋白(作为对照)从10℃加热至72℃。每0.5℃连续平行监测209nm处的二色性活性和光电倍增管电压(PMTV)。针对不同温度下的溶剂贡献,对所有热扫描进行校正。通过取209nm处的椭圆率相对于温度的一阶导数来计算熔解温度(Tm)值。所有变性实验都一式三份地进行(参见Lori等人,PLoS One,5;8(6):e64824(2013))。
尿素诱导的平衡解折叠的变化可以通过以下方案显示。在存在0.2M NaCl和2mMDTT(对于不含二硫键的蛋白质)的情况下,在25mM Tris/HCl(pH 7.5)中的递增浓度的尿素(0-8M)中在10℃下孵育SARS-CoV-2肽源性蛋白(最终浓度40ug/ml)和SARS-CoV-2起始蛋白(作为对照)。在10min之后,达到平衡,并且在10℃下平行记录固有荧光发射、287nm处的吸光度和/或远UV CD光谱(0.5-cm比色皿)。为了测试解折叠的可逆性,在存在2mM DTT和0.2MNaCl的情况下,在25mM Tris/HCl(pH 7.5)、7.0M尿素中以0.4mg/ml蛋白质浓度在10℃下解折叠SARS-CoV-2肽源性蛋白。在10min之后,通过在10℃下将解折叠混合物10倍稀释到用于解折叠的含有渐减浓度的尿素的相同缓冲液的溶液中,开始重折叠。最终的蛋白质浓度是40ug/ml。在15min至24h的孵育期之后,记录在10℃下随尿素浓度变化的固有荧光发射、287nm处的吸光度和/或CD光谱(参见Lori等人,PLoS One,5;8(6):e64824(2013))。
吉布斯自由能的改变可以通过以下方案显示。为了测量吉布斯自由能,在VP-DSC(Microcal Inc.,马萨诸塞州北安普顿)仪器上以1.5度/分钟的扫描速率进行差示扫描量热法(DSC)实验。在可能的情况下,通过比较第一次DSC扫描和第二次DSC扫描来检查SARS-CoV-2肽源性蛋白的温度诱导的解折叠的可逆性。应理解,折叠和解折叠的可逆性不是本文所述的SARS-CoV-2肽源性蛋白所必需的。蛋白质的部分摩尔热容Cp,pr(T)是从样品池(含蛋白质溶液)与参考池(含相应缓冲溶液)之间的实验测量的表观热容差ΔCp app(T)获得的。使用已知的摩尔消光系数,通过分光光度法测量蛋白质浓度。根据双态模型的热容曲线的分析是使用非线性回归程序NLREG和内部书面脚本进行的。在参考条件下的标准热力学函数计算如下:
Figure BDA0004199120910000621
ΔG(T)=(Tm-T)(ΔHcal(Tm)/Tm–ΔCp)–TΔCp ln(T/Tm)
其中ΔH(T)、ΔS(T)和ΔG(T)分别是SARS-CoV-2肽源性蛋白的焓、熵和吉布斯能量函数,ΔHcal是在转变温度Tm下解折叠的焓,并且ΔCp是解折叠的热容(参见Loladze等人,J.Mol.Biol.320,343-357(2002))。
实施例4:测量肽源性的测定
可以参与如本文所述的SARS-CoV-2肽源性蛋白的加工的细胞内条件之一是蛋白水解。SARS-CoV-2肽源性蛋白的不同稳定性对蛋白水解的影响可以使用几种体外或离体测定之一来确定。
(a)组织蛋白酶L蛋白水解
在一个实施方案中,对于SARS-CoV-2肽源性蛋白对蛋白水解的行为的检查通过使其经受组织蛋白酶L的作用来测量,所述组织蛋白酶L是已知在蛋白抗原加工中起关键作用的酶之一(Hsieh,C.S.,deRoos,P.,Honey,K.,Beers,C.和Rudensky,A.Y.(2002)J.Immunol.168,2618–2625)。SARS-CoV-2肽源性蛋白对蛋白水解的敏感性使用溶酶体组织蛋白酶L进行评估。将SARS-CoV-2肽源性蛋白(0.5ug/ul)与不同量(例如,1.5微单位)的酶一起在50mM乙酸钠缓冲液(pH 4.5)中在37℃下孵育不同的时长。使用0.1% TFA停止消化,并且通过在C18反相柱(Vydac,加利福尼亚州赫斯帕瑞亚)上进行的反相HPLC监测蛋白水解。用含有0.1% TFA的乙腈/水的线性梯度进行蛋白水解产物的洗脱。
(b)使用α-胰凝乳蛋白酶和羧肽酶Y的蛋白水解
在另一个实施方案中,对于SARS-CoV-2肽源性蛋白对蛋白水解的行为的检查通过使其经受α-胰凝乳蛋白酶和羧肽酶Y的作用来测量。α-胰凝乳蛋白酶是在芳香族氨基酸的羧基末端切割的内肽酶;羧肽酶Y是从羧基末端顺序去除氨基酸的外肽酶。用这些酶进行的蛋白水解消化对不稳定的构象具有特异性,因此,SARS-CoV-2肽源性蛋白的构象稳定性决定了它们对蛋白水解消化的抗性/敏感性。将在0.5ml的20mM HEPES缓冲盐水(pH 7.5)中的1mg/ml SARS-CoV-2肽源性蛋白在37℃下与100ug来自牛胰腺的α-胰凝乳蛋白酶和来自酵母的羧肽酶Y一起孵育。在不同的时间点终止每次孵育,并且将消化的样品在-20℃下储存直到分析。将样品通过以下方法分析:通过15%丙烯酰胺凝胶以及在还原条件下进行十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE),然后用考马斯亮蓝(Coomassie BrilliantBlue)染色以供观察。
(c)使用溶酶体提取物的蛋白水解
在另一个实施方案中,对于SARS-CoV-2肽源性蛋白对蛋白水解的行为的检查通过使其经受骨髓来源的树突细胞的溶酶体提取物的作用来测量。在存在等量的来自骨髓来源的树突细胞的粗溶酶体提取物的蛋白质的情况下,孵育各种浓度的SARS-CoV-2肽源性蛋白。将混合物在0.1M柠檬酸钠缓冲液、0.5% Triton X-100和2mM二硫苏糖醇(pH4.5)中孵育。在不同的时间点终止每次孵育,并且将消化的样品在-20℃下储存直到分析。通过SDS-PAGE分析样品。在有和没有SARS-CoV-2肽源性蛋白预先吸附到佐剂(诸如氢氧化铝)上的情况下重复实验。使用抗CD11c微珠从在粒细胞巨噬细胞集落刺激因子中培养的骨髓纯化骨髓来源的树突细胞。参见例如,Delamarre等人,图4。
(d)在骨髓来源的树突细胞内化之后的蛋白水解
在另一个实施方案中,对于SARS-CoV-2肽源性蛋白对蛋白水解的行为的检查通过以下方法来测量:按照制造商的方案用FITC对其进行标记,将用骨髓来源的树突细胞与FITC-蛋白质一起孵育,并测量FITC+、CD11c+细胞随时间的百分比。将骨髓来源的树突细胞用0.5mg/ml FITC标记的SARS-CoV-2肽源性蛋白装载1小时,将其洗涤,然后在37℃下培养不同的时间量。然后使用FACS确定减去0小时处的FITC+、CD11c+细胞的百分比的每个时间点处的FITC+、CD11c+细胞的百分比。这代表SARS-CoV-2肽源性蛋白的蛋白水解百分比。在有和没有FITC标记的SARS-CoV-2肽源性蛋白预先吸附到佐剂(诸如氢氧化铝)上的情况下重复实验。
实施例5:抗体产生和测序
抗体库的Ig-seq可以遵循先前描述的方案(10、29),其中有较小的修改。B细胞可以从超免疫兔的血清、脾脏或其他组织中分离。为了降低测序文库的复杂性,可以将此群体分选以富集CD19+CD3-CD27+CD38int记忆B细胞或识别靶抗原的B细胞(5、30、31)。然后,裂解这些细胞,并且使用标准方法分离mRNA,并且使用对IgH或IgL恒定区具有特异性的3'引物利用5'RACE,将mRNA反转录成cDNA(9、32)。然后用含有所需的配对末端衔接子序列和任选的条形码的引物扩增cDNA文库,以便能够通过对多个读数取平均值来量化模板和误差校正(8、9)。
抗体序列的完全确定需要鉴定天然VH-VL对。由于每个VH和VL序列由单独的mRNA编码,因此可以通过在亚纳升体积孔(5)或微乳液(9)中分离单一B细胞,然后进行mRNA分离、反转录和重叠延伸或连锁PCR来进行克隆测序。作为替代方案,可以通过在LC-MS/MS前使纯化的Fab部分交联来鉴定内源VH-VL对。在适当的条件下,这将导致一部分的Fab重链和轻链形成链间交联,并且将使用所得肽质量来确定天然配对。
为了鉴定响应于SARS-CoV-2肽源性蛋白和/或刺突片段的混合物而产生的抗体,可以将序列信息与来自高分辨率质谱法的数据组合。可以用木瓜蛋白酶消化蛋白A纯化的IgG以从Fc结构域释放两个Fab。然后,可以在使用固定在固体支持物上的SARS-CoV-2肽源性或刺突片段或野生型蛋白制备的定制柱上对这些进行免疫亲和纯化,将洗脱的Fab进行蛋白水解消化并使肽产物经受质谱法。将所得肽质量与完整的抗体测序数据进行比较,以鉴定识别抗原的CDR序列。IgG VH和VL序列的配对可以通过在蛋白水解消化前化学交联免疫亲和纯化的Fab来完成;Young等人已经证明了这种方法的可行性(33)。
实施例6:使用SARS-CoV-2肽源性蛋白的混合物进行免疫
在哺乳动物中产生抗体(包括作为疫苗接种方案的一部分)的方法是本领域中熟知的。在一个实施例中,通过用总共500μg SARS-CoV-2肽源性蛋白的混合物免疫无病原体的兔两个月的时间来产生抗SARS-CoV-2肽源性蛋白的多克隆抗血清。例如,可以将SARS-CoV-2肽源性蛋白溶解在PBS中,并且用等体积的弗氏佐剂乳化。在最后的加强免疫之后,可以分离兔的血清以确定多克隆抗血清的滴度。为了获得单克隆抗体,可以用SARS-CoV-2肽源性蛋白免疫4-6周龄的Balb/c小鼠(例如4次,间隔2周,第一次注射用溶解在弗氏完全佐剂中的10-100μg/注射剂,并且对于随后的免疫用弗氏不完全佐剂)。将脾细胞分离并且与融合细胞系(诸如Sp2/0骨髓瘤细胞)融合,随后进行有限稀释。使用例如酶联免疫吸附测定(ELISA)筛选生长中的克隆。将96池板用SARS-CoV-2肽源性蛋白或用对照蛋白包被。添加培养上清液,随后洗涤并添加标记的抗小鼠抗体用于检测。在有限稀释克隆产生SARS-CoV-2肽源性蛋白特异性抗体的杂交瘤之后,获得了稳定的杂交瘤。从每个池中收集上清液,并且通过使用蛋白A琼脂糖柱的亲和色谱法,可以纯化单克隆抗体。
为了在人体中产生抗体,特别是作为疫苗接种方案的一部分,可以采取与上述产生多克隆抗血清的方法类似的方法。然而,本领域技术人员将认识到需要利用可替代的佐剂系统代替弗氏佐剂。例如,合适的可替代的佐剂可以包括但不限于铝化合物,诸如氢氧化铝、磷酸铝、无定形羟基磷酸铝(AAHS)和硫酸铝钾(明矾)、基于单磷酰脂质A(MPL)的佐剂、包含角鲨烯的水包油(O/W)乳液和免疫刺激性核酸(诸如胞嘧啶磷酸鸟嘌呤(CpG)寡核苷酸)。此外,也可以采用易感患者群体(诸如例如老年和/或免疫受损群体)、使用某些佐剂(例如基于脂质体的AS01B佐剂系统)和其他实现甚至更强效的CD4+和CD8+T细胞应答的策略在这些易感患者中实现强的和保护性的免疫应答(Weinberger,Immunity&Ageing 15:3(2018))。
实施例7:使用SARS-CoV-2肽源性蛋白混合物进行免疫的另一个实施例
在另外的动物模型中,可以用在明矾(其是最常用于人疫苗中的佐剂)中乳化的无内毒素SARS-CoV-2肽源性蛋白和野生型起始蛋白的5μg混合物皮下免疫(初免)5只小鼠的组(C57BL/6J;Jackson Labs)。三周后或任选地在一次或多次随后的加强(二次)免疫之后三周,对小鼠采血,并且通过经由ELISA滴定血清来确定肽源性和/或野生型蛋白抗原特异性抗体的存在(血清中的抗体与孔上直接或间接(经由生物素化标签和链霉亲和素)包被的野生型SARS-CoV-2蛋白抗原的直接结合)。为了证实SARS-CoV-2肽源性蛋白具有与SARS-CoV-2起始蛋白类似的构象,进行竞争性抑制测定,其中在添加到SARS-CoV-2起始蛋白包被的板中之前,将滴定量的SARS-CoV-2起始蛋白和SARS-CoV-2肽源性蛋白与血清一起预孵育。在采用免疫探针的情况下这提供了另外的证据,即SARS-CoV-2肽源性蛋白的3D结构没有受到工程化突变的影响。
为了确定SARS-CoV-2肽源性蛋白和/或刺突片段是否产生更好的二抗应答,可以如上所述对小鼠的组进行免疫,并且在初次免疫之后6周,可以对它们进行第二次免疫。在二次免疫后一周,对小鼠采血,并且通过如上所述的ELISA确定抗原特异性抗体应答。用可以产生强抗体应答的SARS-CoV-2肽源性蛋白和/或刺突片段体外脉冲标记小鼠树突细胞,并且24小时后分离由MHCII呈递的SARS-CoV-2肽源性蛋白衍生肽,并且通过液相色谱法和质谱法(LC/MS)分析它们的质量。这些研究需要大量(>107)的树突细胞,这些树突细胞是从预先注射表达FLT-3L的小鼠肿瘤系的小鼠中纯化的,FLT-3L是体内驱动树突细胞发育的细胞因子(这些小鼠的脾充满了树突细胞;Segura等人,2009)。为了允许通过质谱法进行峰鉴定和MHCII-肽的量化,可以在饲喂给DC前用稳定的同位素(诸如13C和15N)(在重组蛋白的生产期间-见上文)生物合成地标记SARS-CoV-2肽源性蛋白和/或刺突片段(Hoedt等人,2014)。
实施例8:使用编码SARS-CoV-2肽源性蛋白混合物的序列进行免疫
将多核苷酸直接注射到动物中的方法在本领域中有充分描述。参见例如,美国专利号5,676,954;6,875,748;5,661,133。简言之,使用已知的遗传密码简并性,编码本文所述的SARS-CoV-2肽源性蛋白混合物的多核苷酸可以使用标准DNA合成技术合成。然后可以将一种或多种多核苷酸直接注射到动物(诸如例如小鼠)中。具体地,可以将编码SARS-CoV-2肽源性蛋白混合物的多核苷酸混合物注射到受约束的清醒小鼠(雌性6-12周龄BALB/c或Nude,nu/nu,来自Harlan Sprague Dawley,印第安纳州印第安纳波利斯市)的股四头肌中。在一个实施方案中,使用一次性无菌塑料胰岛素注射器和配有从微量移液管尖端切割的塑料套环的28G1/2针头(Becton-Dickinson,新泽西州富兰克林湖,目录号329430),将在50μl溶液中的50μg多核苷酸用于注射小鼠,如Hartikka,J.等人,Hum.Gene Ther.7:1205-1217(1996))中所述。
可替代地,在注射前24小时开始,可以对6周龄的Sprague Dawley雌性小鼠(体重20-25克)在其饮用水中给予5000ppm ZnOSO4。已经显示此锌量能够激活金属硫蛋白促进剂。然后用25号针头通过尾静脉穿刺对每只小鼠静脉内注射与150μg脂质体(LipofectionTM)复合的30μg编码SARS-CoV-2肽源性蛋白混合物的多核苷酸,总体积为30μl。在一个实施方案中,注射到小鼠中的多核苷酸混合物编码与同一种SARS-CoV-2起始蛋白相关的不同SARS-CoV-2肽源性蛋白。可替代地,SARS-CoV-2肽源性蛋白的文库可以由多核苷酸的混合物编码,其中所述文库涉及不同的SARS-CoV-2起始蛋白。在整个研究中应当保持动物护理,并且应当遵照国家科学院出版社(National Academy Press)出版的国家研究委员会的生命科学委员会的实验室动物资源研究所(Institute of Laboratory Animal Resources,Commission on Life Sciences,National Research Council)的“实验室动物使用和护理指南(Guide for the Use and Care of Laboratory Animals)”进行。
在将所注射的编码SARS-CoV-2肽源性蛋白的多核苷酸递送至动物中的细胞中之后,然后在体内表达SARS-CoV-2肽源性蛋白。然后SARS-CoV-2肽源性蛋白可以刺激产生对SARS-CoV-2肽源性蛋白具有特异性的抗体。这些抗体可以被分离出并作为多克隆混合物使用,或进一步被分离成单一种类或单克隆。免疫应答和体内产生抗外源抗原的抗体的过程是本领域熟知的。与传统的抗体产生方案不同,本文所述的平台发明允许同时产生一组抗多种SARS-CoV-2肽源性蛋白(无论它们是否依赖于同一种SARS-CoV-2起始蛋白)的抗体。使用多核苷酸混合物同时产生针对多种蛋白的抗体具有改变目前进行抗体产生的方式的潜力。
实施例9:使用编码SARS-CoV-2肽源性蛋白的mRNA进行免疫
直接将体外转录(IVT)mRNA注射到动物中的方法也是本领域熟知的。参见Sahin等人,Nat Rev Drug Discov.2014年10月;13(10):759-80;Kariko等人,Mol Ther,2008年11月;16(11):1833-40;Kariko等人,Nucleic Acid Res,2011年11月;39(21):e142;美国专利号6,511,832。例如,可以使用编码SARS-CoV-2肽源性蛋白混合物的线性化DNA质粒模板。所有mRNA都可以设计成含有5'和3'非翻译区、开放阅读框和长多聚(A)尾,这可以帮助确定mRNA分子在转移到细胞中之后的翻译活性和稳定性。
例如,编码SARS-CoV-2肽源性蛋白的mRNA(包含多聚(A)尾)可以使用假尿苷和5-甲基胞苷(m5C)的三磷酸衍生物(TriLink)合成,以产生含修饰的核苷的RNA。通过用6mmol/l 3'-O-Me-m7GpppG(不可逆的帽类似物,New England Biolabs,马萨诸塞州贝弗利)补充转录反应并降低三磷酸鸟苷的浓度(3.75mmol/l),可以将5'-帽添加到mRNA上。转录物的纯化可以通过Turbo DNA酶(Ambion,得克萨斯州奥斯汀)消化,随后LiCl沉淀和75%乙醇洗涤来进行。在水中重构的RNA的浓度可以通过测量260nm处的光密度来确定。修饰的核苷酸向转录物的有效并入可以通过HPLC分析来确定。所有RNA样品都可以通过变性琼脂糖凝胶电泳进行分析,以保证质量。然后将脂质转染试剂(Invitrogen,加利福尼亚州卡尔斯巴德)和mRNA在磷酸盐缓冲液中复合以便增强转染。为了组装50μl RNA-脂质转染试剂复合物,首先将含有10μg/μl牛血清白蛋白(Sigma,密苏里州圣路易斯)的0.4μl磷酸钾缓冲液(0.4mol/l,pH 6.2)添加到6.7μl DMEM中,然后将0.8μl脂质转染试剂混入并且将样品孵育10分钟。在单独的试管中,将0.25-3μg RNA添加到DMEM中,使最终体积为3.3μl。将稀释的RNA添加到脂质转染试剂混合物中并孵育10分钟。最后,通过添加38.8μl DMEM进一步稀释RNA-脂质转染试剂复合物。
然后可以将编码SARS-CoV-2肽源性蛋白的RNA注射到本文所述的小鼠模型中。通常,使用具有27G1/2针头的1-ml注射器(Becton Dickinson,加利福尼亚州圣地亚哥),将包含1μl脂质转染试剂以及不同量的编码SARS-CoV-2肽源性蛋白的多核苷酸的60μl终体积的组合物注射到侧静脉中。可替代地,可以经由肌内、皮内、鼻内、皮下、静脉内、气管内和鞘内递送来注射多核苷酸。在将多核苷酸递送至细胞中之后,体内合成SARS-CoV-2肽源性蛋白。本文描述了由SARS-CoV-2肽源性蛋白触发的免疫应答和随后在动物中产生抗体。
实施例10:使用噬菌体展示对针对肽源性蛋白的抗体进行亲和力成熟
通过经由抗原呈递细胞呈递SARS-CoV-2肽源性蛋白并使其经历加工而产生针对SARS-CoV-2肽源性蛋白的抗体(诸如本文实施例中所述)后,可以使用展示方法使所得抗体成熟。例如,可以在测定中筛选展示源自编码靶特异性抗体的B细胞mRNA的scFv或Fab的噬菌体文库以鉴定那些展示scFv或Fab的噬菌体,所述scFv或Fab免疫特异性地结合至SARS-CoV-2肽源性蛋白或SARS-CoV-2起始蛋白。在淘选固定化的肽源性蛋白或SARS-CoV-2起始蛋白并通过ELISA评估与固定化的SARS-CoV-2肽源性蛋白或SARS-CoV-2起始蛋白的结合之后,可以鉴定展示结合至固定化的肽源性蛋白或SARS-CoV-2起始蛋白的scFv或Fab的噬菌体。固定在板上用于这些测定的SARS-CoV-2肽源性蛋白或SARS-CoV-2起始蛋白可以从感染杆状病毒表达构建体的Sf9细胞的上清液(如Moore等人,Science 285:260-263中所述)或从来自HEK293细胞的上清液中纯化。然后可以对鉴定的scFv或Fab中的每一种进行测序。
为了确定独特scFv或Fab中的每一种的特异性,可以对于针对SARS-CoV-2肽源性蛋白或SARS-CoV-2起始蛋白的每种scFv或Fab和对照孔进行噬菌体ELISA。可以将含有代表独特scFv或Fab之一的噬菌粒的单独大肠杆菌菌落接种到每孔含有100μl 2TYAG培养基(补充有氨苄青霉素和葡萄糖的胰蛋白胨+酵母肉汤)的96孔板中。将板在37℃下在振荡下孵育4小时。然后将M13K07辅助噬菌体添加到每个孔中,达到MOI为10,并且将板在37℃下再孵育1小时。将板在台式离心机中以2000rpm离心10分钟。去除上清液,并且将细胞沉淀重悬于100μl 2TYAK(补充有氨苄青霉素和卡那霉素的胰蛋白胨+酵母肉汤)中,并且在30℃下在振荡下孵育过夜。
第二天,将板以2000rpm离心10min,并且将来自每个孔的100μl含噬菌体的上清液小心转移到新的96孔板中。向每个孔中添加20μl 6xMPBS(溶解于PBS中的乳粉),并且在室温下孵育1小时以在ELISA前预封闭噬菌体。
在4℃下用在PBS中的SARS-CoV-2肽源性蛋白(直接或间接地,1mg/ml)、在PBS中的BSA(1g/ml)或单独的PBS包被柔性96孔板(Falcon)过夜。包被之后,从孔中移出溶液,并且在室温下在MPBS中将板封闭1小时。将板用PBS洗涤3次,然后向每个孔中添加50μl预封闭的噬菌体。将板在室温下孵育1小时,然后用更换3次的PBST(PBS加吐温)洗涤,随后用更换3次的PBS洗涤。向每个孔中添加50μl在MPBS中以1比5000稀释的抗基因VIII-HRP缀合物(Pharmacia),并且将板在室温下孵育1小时。将每个板用PBST洗涤三次,随后用PBS洗涤三次。然后添加50μl在3% MPBS以1/50稀释的HRP标记的抗小鼠抗体(DAKO EnVision),并且在室温下孵育1小时。然后将每个板用PBST洗涤三次,随后用PBS洗涤三次。然后将50μl TMB底物添加到每个孔中,并且在室温下孵育30分钟或直到显色。通过添加25μl 0.5M H2SO4停止反应。通过使用微量滴定板读数器(Bio-Rad 3550)读取450nm处的吸光度(A450)来测量产生的信号。
scFv或Fab向IgG1形式的转化可以如下进行。可以将我们希望转化成IgG分子的scFv或Fab的VH结构域和VL结构域克隆到含有适当重链(人IgG1、IgG2等)或轻链(人κ或人λ)恒定区的核苷酸序列的载体中,使得当转染到适当宿主细胞中时,可以从这些载体表达完整的重链或轻链分子。此外,当克隆的重链和轻链都在一个细胞系中表达(来自一种或两种载体)时,它们可以组装成完整功能性抗体分子,从而分泌到细胞培养基中。用于将scFv或Fab转化成常规抗体分子的方法是本领域内熟知的。
使用通常用于抗体产生的常规技术的组合从发酵液中纯化IgG。典型地,在开始纯化方案前,使培养收获物澄清以去除细胞和细胞碎片。这通常通过使用离心或收获物过滤来实现。澄清后,典型地捕获抗体并使用亲和色谱法在蛋白A琼脂糖上显著纯化。在碱性pH下,抗体结合至蛋白A琼脂糖,并且在洗涤基质后,通过降低pH洗脱。然后通过凝胶过滤实现抗体的进一步纯化。除了从抗体中去除具有不同分子量的组分之外,此步骤还可以用于缓冲交换到所需的最终配制品缓冲液中。
实施例11:用于表征抗体和测量交叉反应性的测定
可以在多种测定中筛选抗体(无论是交叉反应抗体还是针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体)(包括scFv或Fab和包含抗体片段或其变体或可替代地由抗体片段或其变体组成的其他分子),其中一些测定在下文中描述,以鉴定结合至SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的那些抗体。
在一种具体的测定中,可以在链霉亲和素包被的磁珠上捕获结合至生物素化蛋白(SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白)的抗体(无论是交叉反应抗体还是针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体)。此测定可以用于鉴定中和和/或结合至SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的抗体(无论是交叉反应抗体还是针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体)。此外,可以在本文所述或本领域中以其他方式已知的中和测定中测定抗体。例如,可以测试抗体抑制SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白结合IM9细胞的能力。在此测定中,将标记的肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白(例如,生物素化的)与抗体一起孵育,以允许形成蛋白质-抗体复合物。孵育后,将蛋白质-抗体样品的等分试样添加到IM9细胞中。可以使用本领域已知的技术来测定结合。例如,生物素化蛋白(SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白)与IM9细胞的结合可以在添加链霉亲和素-delfia后使用荧光计检测。如果生物素化蛋白不被中和所述蛋白质的抗体结合,则它将结合至细胞并且可以被检测到。因此,降低结合至IM9细胞的生物素化蛋白的量的抗体(相对于其中蛋白质已与无关抗体一起预孵育或在完全没有抗体的情况下预孵育的对照样品)被鉴定为结合并中和所述蛋白质的抗体。
可以用于分析交叉反应性和/或表征针对SARS-CoV-2肽源性蛋白和/或刺突片段产生的抗体的其他免疫测定包括但不限于使用诸如蛋白质印迹等技术的竞争性和非竞争性测定系统、放射免疫测定、ELISA(酶联免疫吸附测定)、“夹心”免疫测定、免疫沉淀测定、沉淀素反应、凝胶扩散沉淀素反应、免疫扩散测定、凝集测定、补体结合测定、免疫放射测定、荧光免疫测定和蛋白A免疫测定,仅举几例。此类测定是常规的并且是本领域熟知的(参见例如,Ausubel等人编辑,1994,Current Protocols in Molecular Biology,第1卷,JohnWiley&Sons,Inc.,New York)。
下面简要描述示例性免疫测定(但目的不在于加以限制)。免疫沉淀方案通常包括在裂解缓冲液(诸如RIPA缓冲液(1% NP-40或Triton X-100,1%脱氧胆酸钠,0.1%SDS,0.15M NaCl,0.01M磷酸钠(pH 7.2),1% Trasylol))中裂解细胞群,所述缓冲液补充有蛋白磷酸酶和/或蛋白酶抑制剂(例如,EDTA、PMSF、抑肽酶、钒酸钠),将目的交叉反应抗体添加至细胞裂解物中,在4℃下孵育一段时间(例如,1至4小时),将蛋白A和/或蛋白G琼脂糖珠粒添加至细胞裂解物中,在4℃下孵育约1小时或更长时间,在裂解缓冲液中洗涤珠粒并将珠粒重悬浮于SDS/样品缓冲液中。目的抗体免疫沉淀SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的能力可以通过例如蛋白质印迹分析或质谱法来评估。本领域技术人员会知道可以经修饰以增加抗体与SARS-CoV-2肽源性蛋白和/或SARS-CoV-2起始蛋白的结合并降低背景的参数(例如,用琼脂糖珠粒预先清除细胞裂解物)。对于关于免疫沉淀方案的进一步讨论,参见例如,Ausubel等人编,1994,Current Protocols inMolecular Biology,第1卷,John Wiley&Sons,Inc.,New York,10.16.1。
蛋白质印迹分析通常包括制备蛋白质样品,在聚丙烯酰胺凝胶(例如,8%-20%SDS-PAGE,取决于抗原的分子量)中使蛋白质样品电泳,将蛋白质样品自聚丙烯酰胺凝胶转移至诸如硝酸纤维素、PVDF或尼龙等的膜中,在封闭溶液(例如,具有3% BSA或脱脂奶的PBS)中封闭膜,在洗涤缓冲液(例如,PBS-吐温20)中洗涤膜,用在封闭缓冲液中稀释的一抗(目的抗体)封闭膜,在洗涤缓冲液中洗涤膜,用在封闭缓冲液中稀释的缀合到酶底物(例如,辣根过氧化物酶或碱性磷酸酶)或放射性分子(例如,32P或1211)的二抗(其识别一抗,例如抗人抗体)封闭膜,在洗涤缓冲液中洗涤膜,以及检测抗原的存在。本领域技术人员会知道可以经修饰以增加检测的信号并降低背景噪声的参数。对于关于蛋白质印迹方案的进一步讨论,参见例如,Ausubel等人编,1994,Current Protocols in Molecular Biology,第1卷,John Wiley&Sons,Inc.,New York,10.8.1。
在另一个实施例中,ELISA包括制备肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白,用SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白(直接或间接)包被96孔微量滴定板的孔,洗去未结合孔的SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白,向孔中添加缀合至可检测的化合物如酶(例如辣根过氧化物酶或碱性磷酸酶)的目的抗体并孵育一段时间,洗去未结合的抗体或非特异性结合的抗体,以及检测特异性结合至包被孔的SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的抗体的存在。在ELISA中,目的抗体并非必须缀合至可检测的化合物;而是,可以向孔中添加缀合至可检测的化合物的二抗(其识别目的抗体)。
此外,可以将抗体包被到孔中,而非用抗原包被孔。在这种情况下,可检测的分子可以是SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白,其缀合至可检测的化合物如酶(例如辣根过氧化物酶或碱性磷酸酶)。本领域技术人员会知道可以经修饰以增加检测到的信号的参数以及本领域中已知的其他ELISA变体。对于关于ELISA的进一步讨论,参见例如,Ausubel等人编,1994,Current Protocols in Molecular Biology,第1卷,John Wiley&Sons,Inc.,New York,11.2.1。抗体对SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的结合亲和力和抗体-蛋白质相互作用的解离速率可以通过竞争性结合测定来确定。竞争性结合测定的一个例子是放射免疫测定,其包括在存在增加量的未标记的SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的情况下,将标记的SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白(例如,3H或125I)与目的抗体一起孵育,以及检测结合至标记的SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的抗体。本发明的抗体对SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的亲和力和结合解离速率可以通过Scatchard曲线分析由数据确定。与二抗的竞争也可以使用放射免疫测定来确定。在这种情况下,在存在增加量的未标记的第二抗肽源性蛋白抗体的情况下,将SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白与缀合至标记的化合物(例如,3H或125I)的目的抗体一起孵育。
在一个优选的实施方案中,可以使用BIAcore动力学分析来确定抗体与SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白的结合速率和解离速率。BIAcore动力学分析包括分析SARS-CoV-2肽源性蛋白和/或刺突片段和/或SARS-CoV-2起始蛋白与在其表面具有固定化的抗体的芯片的结合和解离。
实施例12:疫苗接种
此外,如本文所述的SARS-CoV-2肽源性蛋白的混合物可以用作疫苗。例如,用等体积Montanide ISA 51无菌乳化浓度为320ug/mL的SARS-CoV-2肽源性蛋白在磷酸盐缓冲盐水(PBS,155mM NaCl,1mM KH2PO4,3mM Na2HPO3)中的溶液,得到160ug/mL的最终疫苗浓度。通过使用Omni Mixer-ES均化器(Omni International,弗吉尼亚州沃伦顿)在室温下将400-mL容器中的体积为200mL的混合物以6000rpm均化6min来获得乳液。对每种疫苗进行全面质量控制分析,以确保总体安全性、纯度、身份、完整性和均匀的油包水液滴大小。使用小鼠免疫原性测试以及物理和生物化学测定定期评价在2℃-8℃下储存的疫苗的稳定性,以验证疫苗安全性、效力、均一性、纯度和完整性,直到人免疫终止之后4-10个月。在免疫前,将160ug/mL肽源性蛋白疫苗用PBS/ISA 51(佐剂对照疫苗)稀释至10ug/mL或40ug/mL的最终剂量形式。由于不同的稀释度,这些疫苗含有两种不同比率的含疫苗组合物与无疫苗组合物,即对于10ug/mL配制品和40ug/mL配制品,比率分别为1:15和1:3。测试疫苗和对照疫苗可能是高粘性的,并且在操作之前和之后需要涡旋以确保同质性。可以通过针和注射器肌内施用疫苗。通过合格的细胞内细胞因子染色测定进一步评价疫苗诱导的T细胞应答。量化外周血单个核细胞以确定产生白细胞介素-2、干扰素-γ或肿瘤坏死因子(TNF)的总体和记忆CD4和CD8 T细胞的比例。
通过对患者施用本文所述的多核苷酸,也可以使用编码SARS-CoV-2肽源性蛋白混合物的多核苷酸作为疫苗。
参考文献
1.Starner N,et al.,The Protein Capture Reagents Program Data Portal.(Submitted).2014.
2.Paduch M,et al.,Methods.2013;60(1):3-14.doi:10.1016/j.ymeth.2012.12.010.
3.Acton TB,et al.,Methods in Enzymology:Academic Press;2005.p.210-43.
4.Xiao R,et al.,Journal of structural biology.2010;172(1):21-33.
5.DeKosky BJ,Nat Biotech.2013;31(2):166-9.doi:10.1038/nbt.2492.
6.Naso and Panavas,Current drug discovery technologies.2014;11(1):85-95.Epub2013/09/12.PubMed PMID:24020911.
7.Reddy ST et al.Current Opinion in Biotechnology.2011;22(4):584-9.
8.Vollmers C,et al.,Proceedings of the National Academy ofSciences.2013;110(33):13463-8.doi:10.1073/pnas.1312146110.
9.Georgiou G,et al.,Nat Biotech.2014;32(2):158-68.doi:10.1038/nbt.2782.
10.Sato S,et al.,Nat Biotechnol.2012;30(11):1039-43.Epub 2012/11/10.doi:10.1038/nbt.2406.PubMed PMID:23138294.
11.Dobson CM.Nature.2003;426(6968):884-90.
12.Bowie,and Sauer Biochemistry.1989;28(18):7139-43.doi:10.1021/bi00444a001.
13.Milla ME,et al.,Nat Struct Mol Biol.1994;1(8):518-23.
14.Waldburger CD,et al.,Nat Struct Mol Biol.1995;2(2):122-8.
15.Ascenzi P,et al.,Current Protein and Peptide Science.2003;4(3):231-51.doi:10.2174/1389203033487180.
16.Marks C,et al.,Science.1987;235(4794):1370-3.doi:10.1126/science.2435002.
17.Nilsson B et al.,Journal of Biological Chemistry.1991;266(5):2970-7.
18.Betz SF,Protein Science.1993;2(10):1551-8.doi:10.1002/pro.5560021002.
19.Eigenbrot and Kossiakoff,Protein Engineering.1990;3(7):591-8.doi:10.1093/protein/3.7.591.
20.Hurle et al.,Biochemistry.1990;29(18):4410-9.doi:10.1021/bi00470a021.
21.Krokoszynska I,et al.,Journal of Molecular Biology.1998;275(3):503-13.doi:10.1006/jmbi.1997.1460.
22.Staley JP et al.,Proceedings of the National Academy ofSciences.1992;89(5):1519-23.doi:10.1073/pnas.89.5.1519.
23.Castro MJM et al.,Biochemistry.1996;35(35):11435-46.doi:10.1021/bi960515w.
24.Altman JD,et al.,Protein Engineering.1991;4(5):593-600.doi:10.1093/protein/4.5.593.
25.Cull and Schatz,Methods Enzymol.2000;326:430-40.Epub 2000/10/19.PubMed PMID:11036656.
26.Fiorucci L et al.,Histochem J.1989;21(12):721-30.doi:10.1007/BF01002838.
27.Nori SL,et al.,Peptides.1992;13(2):365-71.doi:http://dx.doi.org/10.1016/0196-9781(92)90122-J.
28.Savage MJ,et al.,Amyloid.1995;2(4):234-40.doi:doi:10.3109/13506129508999005.
29.Cheung WC et al.,Nat Biotechnol.2012;30(5):447-52.Epub 2012/03/27.doi:10.1038/nbt.2167.PubMed PMID:22446692.
30.Kaminski DA et al.,Frontiers in immunology.2012;3:302.Epub 2012/10/23.doi:10.3389/fimmu.2012.00302.PubMed PMID:23087687;PubMed Central PMCID:PMCPmc3467643.
31.Maecker HT et al.,Nature reviews Rheumatology.2012;8(6):317-28.Epub 2012/06/01.doi:10.1038/nrrheum.2012.66.PubMed PMID:22647780;PubMedCentral PMCID:PMCPmc3409841.
32.Toung JM et al.,Genome research.2011;21(6):991-8.doi:10.1101/gr.116335.110.
33.Young MM et al.,Proceedings of the National Academy ofSciences.2000;97(11):5802-6.doi:10.1073/pnas.090099097.
34.Goh CS et al.,Nucleic Acids Research.2003;31(11):2833-8.doi:10.1093/nar/gkg397.
35.Glanville J,et al.,Proceedings of the National Academy ofSciences.2009;106(48):20216-21.doi:10.1073/pnas.0909775106.
36.Brochet X et al.,Nucleic Acids Res.2008;36(Web Server issue):W503-8.Epub2008/05/27.doi:10.1093/nar/gkn316.PubMed PMID:18503082;PubMed CentralPMCID:PMCPmc2447746.
37.D'Angelo S.,et al.,mAbs.2014;6(1):160-72.Epub 2014/01/16.doi:10.4161/mabs.27105.PubMed PMID:24423623;PubMed Central PMCID:PMCPmc3929439.
38.Eng JK et al.,Journal of the American Society for MassSpectrometry.1994;5(11):976-89.doi:http://dx.doi.org/10.1016/1044-0305(94)80016-2.
39.Van Regenmortel MHV.Journal of Molecular Recognition.2011;24(5):741-53.doi:10.1002/jmr.1116.
40.Hurlburt et al.,Nat.Commun.11:5413(2020).
SEQUENCE LISTING
<110> 罗格斯新泽西州立大学
<120> SARS-CoV-2疫苗和抗体
<130> 01308-0003-00PCT
<150> US 63/075,043
<151> 2020-09-04
<150> US 63/132,943
<151> 2020-12-31
<150> US 63/211,397
<151> 2021-06-16
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 492
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> O15393 TMPS2_Human
<400> 1
Met Ala Leu Asn Ser Gly Ser Pro Pro Ala Ile Gly Pro Tyr Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Pro Glu Asn Pro Tyr Pro Ala Gln Pro Thr Val
20 25 30
Val Pro Thr Val Tyr Glu Val His Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Val Leu Thr Gln Ala Ser Asn Pro Val
50 55 60
Val Cys Thr Gln Pro Lys Ser Pro Ser Gly Thr Val Cys Thr Ser Lys
65 70 75 80
Thr Lys Lys Ala Leu Cys Ile Thr Leu Thr Leu Gly Thr Phe Leu Val
85 90 95
Gly Ala Ala Leu Ala Ala Gly Leu Leu Trp Lys Phe Met Gly Ser Lys
100 105 110
Cys Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn
115 120 125
Pro Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp
130 135 140
Glu Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val
145 150 155 160
Tyr Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp
165 170 175
Asn Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn
180 185 190
Asn Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser
195 200 205
Phe Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys
210 215 220
Leu Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg
225 230 235 240
Cys Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile
245 250 255
Val Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser
260 265 270
Leu His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro
275 280 285
Glu Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn
290 295 300
Pro Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met
305 310 315 320
Phe Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn
325 330 335
Tyr Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln
340 345 350
Lys Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn
355 360 365
Pro Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp
370 375 380
Gly Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala
385 390 395 400
Lys Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr
405 410 415
Asp Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly
420 425 430
Asn Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser
435 440 445
Lys Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly
450 455 460
Cys Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe
465 470 475 480
Thr Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly
485 490
<210> 2
<211> 794
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P09958 FURIN_HUMAN
<400> 2
Met Glu Leu Arg Pro Trp Leu Leu Trp Val Val Ala Ala Thr Gly Thr
1 5 10 15
Leu Val Leu Leu Ala Ala Asp Ala Gln Gly Gln Lys Val Phe Thr Asn
20 25 30
Thr Trp Ala Val Arg Ile Pro Gly Gly Pro Ala Val Ala Asn Ser Val
35 40 45
Ala Arg Lys His Gly Phe Leu Asn Leu Gly Gln Ile Phe Gly Asp Tyr
50 55 60
Tyr His Phe Trp His Arg Gly Val Thr Lys Arg Ser Leu Ser Pro His
65 70 75 80
Arg Pro Arg His Ser Arg Leu Gln Arg Glu Pro Gln Val Gln Trp Leu
85 90 95
Glu Gln Gln Val Ala Lys Arg Arg Thr Lys Arg Asp Val Tyr Gln Glu
100 105 110
Pro Thr Asp Pro Lys Phe Pro Gln Gln Trp Tyr Leu Ser Gly Val Thr
115 120 125
Gln Arg Asp Leu Asn Val Lys Ala Ala Trp Ala Gln Gly Tyr Thr Gly
130 135 140
His Gly Ile Val Val Ser Ile Leu Asp Asp Gly Ile Glu Lys Asn His
145 150 155 160
Pro Asp Leu Ala Gly Asn Tyr Asp Pro Gly Ala Ser Phe Asp Val Asn
165 170 175
Asp Gln Asp Pro Asp Pro Gln Pro Arg Tyr Thr Gln Met Asn Asp Asn
180 185 190
Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala Ala Val Ala Asn Asn
195 200 205
Gly Val Cys Gly Val Gly Val Ala Tyr Asn Ala Arg Ile Gly Gly Val
210 215 220
Arg Met Leu Asp Gly Glu Val Thr Asp Ala Val Glu Ala Arg Ser Leu
225 230 235 240
Gly Leu Asn Pro Asn His Ile His Ile Tyr Ser Ala Ser Trp Gly Pro
245 250 255
Glu Asp Asp Gly Lys Thr Val Asp Gly Pro Ala Arg Leu Ala Glu Glu
260 265 270
Ala Phe Phe Arg Gly Val Ser Gln Gly Arg Gly Gly Leu Gly Ser Ile
275 280 285
Phe Val Trp Ala Ser Gly Asn Gly Gly Arg Glu His Asp Ser Cys Asn
290 295 300
Cys Asp Gly Tyr Thr Asn Ser Ile Tyr Thr Leu Ser Ile Ser Ser Ala
305 310 315 320
Thr Gln Phe Gly Asn Val Pro Trp Tyr Ser Glu Ala Cys Ser Ser Thr
325 330 335
Leu Ala Thr Thr Tyr Ser Ser Gly Asn Gln Asn Glu Lys Gln Ile Val
340 345 350
Thr Thr Asp Leu Arg Gln Lys Cys Thr Glu Ser His Thr Gly Thr Ser
355 360 365
Ala Ser Ala Pro Leu Ala Ala Gly Ile Ile Ala Leu Thr Leu Glu Ala
370 375 380
Asn Lys Asn Leu Thr Trp Arg Asp Met Gln His Leu Val Val Gln Thr
385 390 395 400
Ser Lys Pro Ala His Leu Asn Ala Asn Asp Trp Ala Thr Asn Gly Val
405 410 415
Gly Arg Lys Val Ser His Ser Tyr Gly Tyr Gly Leu Leu Asp Ala Gly
420 425 430
Ala Met Val Ala Leu Ala Gln Asn Trp Thr Thr Val Ala Pro Gln Arg
435 440 445
Lys Cys Ile Ile Asp Ile Leu Thr Glu Pro Lys Asp Ile Gly Lys Arg
450 455 460
Leu Glu Val Arg Lys Thr Val Thr Ala Cys Leu Gly Glu Pro Asn His
465 470 475 480
Ile Thr Arg Leu Glu His Ala Gln Ala Arg Leu Thr Leu Ser Tyr Asn
485 490 495
Arg Arg Gly Asp Leu Ala Ile His Leu Val Ser Pro Met Gly Thr Arg
500 505 510
Ser Thr Leu Leu Ala Ala Arg Pro His Asp Tyr Ser Ala Asp Gly Phe
515 520 525
Asn Asp Trp Ala Phe Met Thr Thr His Ser Trp Asp Glu Asp Pro Ser
530 535 540
Gly Glu Trp Val Leu Glu Ile Glu Asn Thr Ser Glu Ala Asn Asn Tyr
545 550 555 560
Gly Thr Leu Thr Lys Phe Thr Leu Val Leu Tyr Gly Thr Ala Pro Glu
565 570 575
Gly Leu Pro Val Pro Pro Glu Ser Ser Gly Cys Lys Thr Leu Thr Ser
580 585 590
Ser Gln Ala Cys Val Val Cys Glu Glu Gly Phe Ser Leu His Gln Lys
595 600 605
Ser Cys Val Gln His Cys Pro Pro Gly Phe Ala Pro Gln Val Leu Asp
610 615 620
Thr His Tyr Ser Thr Glu Asn Asp Val Glu Thr Ile Arg Ala Ser Val
625 630 635 640
Cys Ala Pro Cys His Ala Ser Cys Ala Thr Cys Gln Gly Pro Ala Leu
645 650 655
Thr Asp Cys Leu Ser Cys Pro Ser His Ala Ser Leu Asp Pro Val Glu
660 665 670
Gln Thr Cys Ser Arg Gln Ser Gln Ser Ser Arg Glu Ser Pro Pro Gln
675 680 685
Gln Gln Pro Pro Arg Leu Pro Pro Glu Val Glu Ala Gly Gln Arg Leu
690 695 700
Arg Ala Gly Leu Leu Pro Ser His Leu Pro Glu Val Val Ala Gly Leu
705 710 715 720
Ser Cys Ala Phe Ile Val Leu Val Phe Val Thr Val Phe Leu Val Leu
725 730 735
Gln Leu Arg Ser Gly Phe Ser Phe Arg Gly Val Lys Val Tyr Thr Met
740 745 750
Asp Arg Gly Leu Ile Ser Tyr Lys Gly Leu Pro Pro Glu Ala Trp Gln
755 760 765
Glu Glu Cys Pro Ser Asp Ser Glu Glu Asp Glu Gly Arg Gly Glu Arg
770 775 780
Thr Ala Phe Ile Lys Asp Gln Ser Ala Leu
785 790
<210> 3
<211> 740
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q92499 DDX1_HUMAN
<400> 3
Met Ala Ala Phe Ser Glu Met Gly Val Met Pro Glu Ile Ala Gln Ala
1 5 10 15
Val Glu Glu Met Asp Trp Leu Leu Pro Thr Asp Ile Gln Ala Glu Ser
20 25 30
Ile Pro Leu Ile Leu Gly Gly Gly Asp Val Leu Met Ala Ala Glu Thr
35 40 45
Gly Ser Gly Lys Thr Gly Ala Phe Ser Ile Pro Val Ile Gln Ile Val
50 55 60
Tyr Glu Thr Leu Lys Asp Gln Gln Glu Gly Lys Lys Gly Lys Thr Thr
65 70 75 80
Ile Lys Thr Gly Ala Ser Val Leu Asn Lys Trp Gln Met Asn Pro Tyr
85 90 95
Asp Arg Gly Ser Ala Phe Ala Ile Gly Ser Asp Gly Leu Cys Cys Gln
100 105 110
Ser Arg Glu Val Lys Glu Trp His Gly Cys Arg Ala Thr Lys Gly Leu
115 120 125
Met Lys Gly Lys His Tyr Tyr Glu Val Ser Cys His Asp Gln Gly Leu
130 135 140
Cys Arg Val Gly Trp Ser Thr Met Gln Ala Ser Leu Asp Leu Gly Thr
145 150 155 160
Asp Lys Phe Gly Phe Gly Phe Gly Gly Thr Gly Lys Lys Ser His Asn
165 170 175
Lys Gln Phe Asp Asn Tyr Gly Glu Glu Phe Thr Met His Asp Thr Ile
180 185 190
Gly Cys Tyr Leu Asp Ile Asp Lys Gly His Val Lys Phe Ser Lys Asn
195 200 205
Gly Lys Asp Leu Gly Leu Ala Phe Glu Ile Pro Pro His Met Lys Asn
210 215 220
Gln Ala Leu Phe Pro Ala Cys Val Leu Lys Asn Ala Glu Leu Lys Phe
225 230 235 240
Asn Phe Gly Glu Glu Glu Phe Lys Phe Pro Pro Lys Asp Gly Phe Val
245 250 255
Ala Leu Ser Lys Ala Pro Asp Gly Tyr Ile Val Lys Ser Gln His Ser
260 265 270
Gly Asn Ala Gln Val Thr Gln Thr Lys Phe Leu Pro Asn Ala Pro Lys
275 280 285
Ala Leu Ile Val Glu Pro Ser Arg Glu Leu Ala Glu Gln Thr Leu Asn
290 295 300
Asn Ile Lys Gln Phe Lys Lys Tyr Ile Asp Asn Pro Lys Leu Arg Glu
305 310 315 320
Leu Leu Ile Ile Gly Gly Val Ala Ala Arg Asp Gln Leu Ser Val Leu
325 330 335
Glu Asn Gly Val Asp Ile Val Val Gly Thr Pro Gly Arg Leu Asp Asp
340 345 350
Leu Val Ser Thr Gly Lys Leu Asn Leu Ser Gln Val Arg Phe Leu Val
355 360 365
Leu Asp Glu Ala Asp Gly Leu Leu Ser Gln Gly Tyr Ser Asp Phe Ile
370 375 380
Asn Arg Met His Asn Gln Ile Pro Gln Val Thr Ser Asp Gly Lys Arg
385 390 395 400
Leu Gln Val Ile Val Cys Ser Ala Thr Leu His Ser Phe Asp Val Lys
405 410 415
Lys Leu Ser Glu Lys Ile Met His Phe Pro Thr Trp Val Asp Leu Lys
420 425 430
Gly Glu Asp Ser Val Pro Asp Thr Val His His Val Val Val Pro Val
435 440 445
Asn Pro Lys Thr Asp Arg Leu Trp Glu Arg Leu Gly Lys Ser His Ile
450 455 460
Arg Thr Asp Asp Val His Ala Lys Asp Asn Thr Arg Pro Gly Ala Asn
465 470 475 480
Ser Pro Glu Met Trp Ser Glu Ala Ile Lys Ile Leu Lys Gly Glu Tyr
485 490 495
Ala Val Arg Ala Ile Lys Glu His Lys Met Asp Gln Ala Ile Ile Phe
500 505 510
Cys Arg Thr Lys Ile Asp Cys Asp Asn Leu Glu Gln Tyr Phe Ile Gln
515 520 525
Gln Gly Gly Gly Pro Asp Lys Lys Gly His Gln Phe Ser Cys Val Cys
530 535 540
Leu His Gly Asp Arg Lys Pro His Glu Arg Lys Gln Asn Leu Glu Arg
545 550 555 560
Phe Lys Lys Gly Asp Val Arg Phe Leu Ile Cys Thr Asp Val Ala Ala
565 570 575
Arg Gly Ile Asp Ile His Gly Val Pro Tyr Val Ile Asn Val Thr Leu
580 585 590
Pro Asp Glu Lys Gln Asn Tyr Val His Arg Ile Gly Arg Val Gly Arg
595 600 605
Ala Glu Arg Met Gly Leu Ala Ile Ser Leu Val Ala Thr Glu Lys Glu
610 615 620
Lys Val Trp Tyr His Val Cys Ser Ser Arg Gly Lys Gly Cys Tyr Asn
625 630 635 640
Thr Arg Leu Lys Glu Asp Gly Gly Cys Thr Ile Trp Tyr Asn Glu Met
645 650 655
Gln Leu Leu Ser Glu Ile Glu Glu His Leu Asn Cys Thr Ile Ser Gln
660 665 670
Val Glu Pro Asp Ile Lys Val Pro Val Asp Glu Phe Asp Gly Lys Val
675 680 685
Thr Tyr Gly Gln Lys Arg Ala Ala Gly Gly Gly Ser Tyr Lys Gly His
690 695 700
Val Asp Ile Leu Ala Pro Thr Val Gln Glu Leu Ala Ala Leu Glu Lys
705 710 715 720
Glu Ala Gln Thr Ser Phe Leu His Leu Gly Tyr Leu Pro Asn Gln Leu
725 730 735
Phe Arg Thr Phe
740
<210> 4
<211> 805
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q9BYF1 ACE2_HUMAN
<400> 4
Met Ser Ser Ser Ser Trp Leu Leu Leu Ser Leu Val Ala Val Thr Ala
1 5 10 15
Ala Gln Ser Thr Ile Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe
20 25 30
Asn His Glu Ala Glu Asp Leu Phe Tyr Gln Ser Ser Leu Ala Ser Trp
35 40 45
Asn Tyr Asn Thr Asn Ile Thr Glu Glu Asn Val Gln Asn Met Asn Asn
50 55 60
Ala Gly Asp Lys Trp Ser Ala Phe Leu Lys Glu Gln Ser Thr Leu Ala
65 70 75 80
Gln Met Tyr Pro Leu Gln Glu Ile Gln Asn Leu Thr Val Lys Leu Gln
85 90 95
Leu Gln Ala Leu Gln Gln Asn Gly Ser Ser Val Leu Ser Glu Asp Lys
100 105 110
Ser Lys Arg Leu Asn Thr Ile Leu Asn Thr Met Ser Thr Ile Tyr Ser
115 120 125
Thr Gly Lys Val Cys Asn Pro Asp Asn Pro Gln Glu Cys Leu Leu Leu
130 135 140
Glu Pro Gly Leu Asn Glu Ile Met Ala Asn Ser Leu Asp Tyr Asn Glu
145 150 155 160
Arg Leu Trp Ala Trp Glu Ser Trp Arg Ser Glu Val Gly Lys Gln Leu
165 170 175
Arg Pro Leu Tyr Glu Glu Tyr Val Val Leu Lys Asn Glu Met Ala Arg
180 185 190
Ala Asn His Tyr Glu Asp Tyr Gly Asp Tyr Trp Arg Gly Asp Tyr Glu
195 200 205
Val Asn Gly Val Asp Gly Tyr Asp Tyr Ser Arg Gly Gln Leu Ile Glu
210 215 220
Asp Val Glu His Thr Phe Glu Glu Ile Lys Pro Leu Tyr Glu His Leu
225 230 235 240
His Ala Tyr Val Arg Ala Lys Leu Met Asn Ala Tyr Pro Ser Tyr Ile
245 250 255
Ser Pro Ile Gly Cys Leu Pro Ala His Leu Leu Gly Asp Met Trp Gly
260 265 270
Arg Phe Trp Thr Asn Leu Tyr Ser Leu Thr Val Pro Phe Gly Gln Lys
275 280 285
Pro Asn Ile Asp Val Thr Asp Ala Met Val Asp Gln Ala Trp Asp Ala
290 295 300
Gln Arg Ile Phe Lys Glu Ala Glu Lys Phe Phe Val Ser Val Gly Leu
305 310 315 320
Pro Asn Met Thr Gln Gly Phe Trp Glu Asn Ser Met Leu Thr Asp Pro
325 330 335
Gly Asn Val Gln Lys Ala Val Cys His Pro Thr Ala Trp Asp Leu Gly
340 345 350
Lys Gly Asp Phe Arg Ile Leu Met Cys Thr Lys Val Thr Met Asp Asp
355 360 365
Phe Leu Thr Ala His His Glu Met Gly His Ile Gln Tyr Asp Met Ala
370 375 380
Tyr Ala Ala Gln Pro Phe Leu Leu Arg Asn Gly Ala Asn Glu Gly Phe
385 390 395 400
His Glu Ala Val Gly Glu Ile Met Ser Leu Ser Ala Ala Thr Pro Lys
405 410 415
His Leu Lys Ser Ile Gly Leu Leu Ser Pro Asp Phe Gln Glu Asp Asn
420 425 430
Glu Thr Glu Ile Asn Phe Leu Leu Lys Gln Ala Leu Thr Ile Val Gly
435 440 445
Thr Leu Pro Phe Thr Tyr Met Leu Glu Lys Trp Arg Trp Met Val Phe
450 455 460
Lys Gly Glu Ile Pro Lys Asp Gln Trp Met Lys Lys Trp Trp Glu Met
465 470 475 480
Lys Arg Glu Ile Val Gly Val Val Glu Pro Val Pro His Asp Glu Thr
485 490 495
Tyr Cys Asp Pro Ala Ser Leu Phe His Val Ser Asn Asp Tyr Ser Phe
500 505 510
Ile Arg Tyr Tyr Thr Arg Thr Leu Tyr Gln Phe Gln Phe Gln Glu Ala
515 520 525
Leu Cys Gln Ala Ala Lys His Glu Gly Pro Leu His Lys Cys Asp Ile
530 535 540
Ser Asn Ser Thr Glu Ala Gly Gln Lys Leu Phe Asn Met Leu Arg Leu
545 550 555 560
Gly Lys Ser Glu Pro Trp Thr Leu Ala Leu Glu Asn Val Val Gly Ala
565 570 575
Lys Asn Met Asn Val Arg Pro Leu Leu Asn Tyr Phe Glu Pro Leu Phe
580 585 590
Thr Trp Leu Lys Asp Gln Asn Lys Asn Ser Phe Val Gly Trp Ser Thr
595 600 605
Asp Trp Ser Pro Tyr Ala Asp Gln Ser Ile Lys Val Arg Ile Ser Leu
610 615 620
Lys Ser Ala Leu Gly Asp Lys Ala Tyr Glu Trp Asn Asp Asn Glu Met
625 630 635 640
Tyr Leu Phe Arg Ser Ser Val Ala Tyr Ala Met Arg Gln Tyr Phe Leu
645 650 655
Lys Val Lys Asn Gln Met Ile Leu Phe Gly Glu Glu Asp Val Arg Val
660 665 670
Ala Asn Leu Lys Pro Arg Ile Ser Phe Asn Phe Phe Val Thr Ala Pro
675 680 685
Lys Asn Val Ser Asp Ile Ile Pro Arg Thr Glu Val Glu Lys Ala Ile
690 695 700
Arg Met Ser Arg Ser Arg Ile Asn Asp Ala Phe Arg Leu Asn Asp Asn
705 710 715 720
Ser Leu Glu Phe Leu Gly Ile Gln Pro Thr Leu Gly Pro Pro Asn Gln
725 730 735
Pro Pro Val Ser Ile Trp Leu Ile Val Phe Gly Val Val Met Gly Val
740 745 750
Ile Val Val Gly Ile Val Ile Leu Ile Phe Thr Gly Ile Arg Asp Arg
755 760 765
Lys Lys Lys Asn Lys Ala Arg Ser Gly Glu Asn Pro Tyr Ala Ser Ile
770 775 780
Asp Ile Ser Lys Gly Glu Asn Asn Pro Gly Phe Gln Asn Thr Asp Asp
785 790 795 800
Val Gln Thr Ser Phe
805
<210> 5
<211> 313
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> O43765 SGTA_HUMAN
<400> 5
Met Asp Asn Lys Lys Arg Leu Ala Tyr Ala Ile Ile Gln Phe Leu His
1 5 10 15
Asp Gln Leu Arg His Gly Gly Leu Ser Ser Asp Ala Gln Glu Ser Leu
20 25 30
Glu Val Ala Ile Gln Cys Leu Glu Thr Ala Phe Gly Val Thr Val Glu
35 40 45
Asp Ser Asp Leu Ala Leu Pro Gln Thr Leu Pro Glu Ile Phe Glu Ala
50 55 60
Ala Ala Thr Gly Lys Glu Met Pro Gln Asp Leu Arg Ser Pro Ala Arg
65 70 75 80
Thr Pro Pro Ser Glu Glu Asp Ser Ala Glu Ala Glu Arg Leu Lys Thr
85 90 95
Glu Gly Asn Glu Gln Met Lys Val Glu Asn Phe Glu Ala Ala Val His
100 105 110
Phe Tyr Gly Lys Ala Ile Glu Leu Asn Pro Ala Asn Ala Val Tyr Phe
115 120 125
Cys Asn Arg Ala Ala Ala Tyr Ser Lys Leu Gly Asn Tyr Ala Gly Ala
130 135 140
Val Gln Asp Cys Glu Arg Ala Ile Cys Ile Asp Pro Ala Tyr Ser Lys
145 150 155 160
Ala Tyr Gly Arg Met Gly Leu Ala Leu Ser Ser Leu Asn Lys His Val
165 170 175
Glu Ala Val Ala Tyr Tyr Lys Lys Ala Leu Glu Leu Asp Pro Asp Asn
180 185 190
Glu Thr Tyr Lys Ser Asn Leu Lys Ile Ala Glu Leu Lys Leu Arg Glu
195 200 205
Ala Pro Ser Pro Thr Gly Gly Val Gly Ser Phe Asp Ile Ala Gly Leu
210 215 220
Leu Asn Asn Pro Gly Phe Met Ser Met Ala Ser Asn Leu Met Asn Asn
225 230 235 240
Pro Gln Ile Gln Gln Leu Met Ser Gly Met Ile Ser Gly Gly Asn Asn
245 250 255
Pro Leu Gly Thr Pro Gly Thr Ser Pro Ser Gln Asn Asp Leu Ala Ser
260 265 270
Leu Ile Gln Ala Gly Gln Gln Phe Ala Gln Gln Met Gln Gln Gln Asn
275 280 285
Pro Glu Leu Ile Glu Gln Leu Arg Ser Gln Ile Arg Ser Arg Thr Pro
290 295 300
Ser Ala Ser Asn Asp Asp Gln Gln Glu
305 310
<210> 6
<211> 272
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P35232 PHB_HUMAN
<400> 6
Met Ala Ala Lys Val Phe Glu Ser Ile Gly Lys Phe Gly Leu Ala Leu
1 5 10 15
Ala Val Ala Gly Gly Val Val Asn Ser Ala Leu Tyr Asn Val Asp Ala
20 25 30
Gly His Arg Ala Val Ile Phe Asp Arg Phe Arg Gly Val Gln Asp Ile
35 40 45
Val Val Gly Glu Gly Thr His Phe Leu Ile Pro Trp Val Gln Lys Pro
50 55 60
Ile Ile Phe Asp Cys Arg Ser Arg Pro Arg Asn Val Pro Val Ile Thr
65 70 75 80
Gly Ser Lys Asp Leu Gln Asn Val Asn Ile Thr Leu Arg Ile Leu Phe
85 90 95
Arg Pro Val Ala Ser Gln Leu Pro Arg Ile Phe Thr Ser Ile Gly Glu
100 105 110
Asp Tyr Asp Glu Arg Val Leu Pro Ser Ile Thr Thr Glu Ile Leu Lys
115 120 125
Ser Val Val Ala Arg Phe Asp Ala Gly Glu Leu Ile Thr Gln Arg Glu
130 135 140
Leu Val Ser Arg Gln Val Ser Asp Asp Leu Thr Glu Arg Ala Ala Thr
145 150 155 160
Phe Gly Leu Ile Leu Asp Asp Val Ser Leu Thr His Leu Thr Phe Gly
165 170 175
Lys Glu Phe Thr Glu Ala Val Glu Ala Lys Gln Val Ala Gln Gln Glu
180 185 190
Ala Glu Arg Ala Arg Phe Val Val Glu Lys Ala Glu Gln Gln Lys Lys
195 200 205
Ala Ala Ile Ile Ser Ala Glu Gly Asp Ser Lys Ala Ala Glu Leu Ile
210 215 220
Ala Asn Ser Leu Ala Thr Ala Gly Asp Gly Leu Ile Glu Leu Arg Lys
225 230 235 240
Leu Glu Ala Ala Glu Asp Ile Ala Tyr Gln Leu Ser Arg Ser Arg Asn
245 250 255
Ile Thr Tyr Leu Pro Ala Gly Gln Ser Val Leu Leu Gln Leu Pro Gln
260 265 270
<210> 7
<211> 529
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P52292 IMA1_HUMAN
<400> 7
Met Ser Thr Asn Glu Asn Ala Asn Thr Pro Ala Ala Arg Leu His Arg
1 5 10 15
Phe Lys Asn Lys Gly Lys Asp Ser Thr Glu Met Arg Arg Arg Arg Ile
20 25 30
Glu Val Asn Val Glu Leu Arg Lys Ala Lys Lys Asp Asp Gln Met Leu
35 40 45
Lys Arg Arg Asn Val Ser Ser Phe Pro Asp Asp Ala Thr Ser Pro Leu
50 55 60
Gln Glu Asn Arg Asn Asn Gln Gly Thr Val Asn Trp Ser Val Asp Asp
65 70 75 80
Ile Val Lys Gly Ile Asn Ser Ser Asn Val Glu Asn Gln Leu Gln Ala
85 90 95
Thr Gln Ala Ala Arg Lys Leu Leu Ser Arg Glu Lys Gln Pro Pro Ile
100 105 110
Asp Asn Ile Ile Arg Ala Gly Leu Ile Pro Lys Phe Val Ser Phe Leu
115 120 125
Gly Arg Thr Asp Cys Ser Pro Ile Gln Phe Glu Ser Ala Trp Ala Leu
130 135 140
Thr Asn Ile Ala Ser Gly Thr Ser Glu Gln Thr Lys Ala Val Val Asp
145 150 155 160
Gly Gly Ala Ile Pro Ala Phe Ile Ser Leu Leu Ala Ser Pro His Ala
165 170 175
His Ile Ser Glu Gln Ala Val Trp Ala Leu Gly Asn Ile Ala Gly Asp
180 185 190
Gly Ser Val Phe Arg Asp Leu Val Ile Lys Tyr Gly Ala Val Asp Pro
195 200 205
Leu Leu Ala Leu Leu Ala Val Pro Asp Met Ser Ser Leu Ala Cys Gly
210 215 220
Tyr Leu Arg Asn Leu Thr Trp Thr Leu Ser Asn Leu Cys Arg Asn Lys
225 230 235 240
Asn Pro Ala Pro Pro Ile Asp Ala Val Glu Gln Ile Leu Pro Thr Leu
245 250 255
Val Arg Leu Leu His His Asp Asp Pro Glu Val Leu Ala Asp Thr Cys
260 265 270
Trp Ala Ile Ser Tyr Leu Thr Asp Gly Pro Asn Glu Arg Ile Gly Met
275 280 285
Val Val Lys Thr Gly Val Val Pro Gln Leu Val Lys Leu Leu Gly Ala
290 295 300
Ser Glu Leu Pro Ile Val Thr Pro Ala Leu Arg Ala Ile Gly Asn Ile
305 310 315 320
Val Thr Gly Thr Asp Glu Gln Thr Gln Val Val Ile Asp Ala Gly Ala
325 330 335
Leu Ala Val Phe Pro Ser Leu Leu Thr Asn Pro Lys Thr Asn Ile Gln
340 345 350
Lys Glu Ala Thr Trp Thr Met Ser Asn Ile Thr Ala Gly Arg Gln Asp
355 360 365
Gln Ile Gln Gln Val Val Asn His Gly Leu Val Pro Phe Leu Val Ser
370 375 380
Val Leu Ser Lys Ala Asp Phe Lys Thr Gln Lys Glu Ala Val Trp Ala
385 390 395 400
Val Thr Asn Tyr Thr Ser Gly Gly Thr Val Glu Gln Ile Val Tyr Leu
405 410 415
Val His Cys Gly Ile Ile Glu Pro Leu Met Asn Leu Leu Thr Ala Lys
420 425 430
Asp Thr Lys Ile Ile Leu Val Ile Leu Asp Ala Ile Ser Asn Ile Phe
435 440 445
Gln Ala Ala Glu Lys Leu Gly Glu Thr Glu Lys Leu Ser Ile Met Ile
450 455 460
Glu Glu Cys Gly Gly Leu Asp Lys Ile Glu Ala Leu Gln Asn His Glu
465 470 475 480
Asn Glu Ser Val Tyr Lys Ala Ser Leu Ser Leu Ile Glu Lys Tyr Phe
485 490 495
Ser Val Glu Glu Glu Glu Asp Gln Asn Val Val Pro Glu Thr Thr Ser
500 505 510
Glu Gly Tyr Thr Phe Gln Val Gln Asp Gly Ala Pro Gly Thr Phe Asn
515 520 525
Phe
<210> 8
<211> 180
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q10589 BST2_HUMAN
<400> 8
Met Ala Ser Thr Ser Tyr Asp Tyr Cys Arg Val Pro Met Glu Asp Gly
1 5 10 15
Asp Lys Arg Cys Lys Leu Leu Leu Gly Ile Gly Ile Leu Val Leu Leu
20 25 30
Ile Ile Val Ile Leu Gly Val Pro Leu Ile Ile Phe Thr Ile Lys Ala
35 40 45
Asn Ser Glu Ala Cys Arg Asp Gly Leu Arg Ala Val Met Glu Cys Arg
50 55 60
Asn Val Thr His Leu Leu Gln Gln Glu Leu Thr Glu Ala Gln Lys Gly
65 70 75 80
Phe Gln Asp Val Glu Ala Gln Ala Ala Thr Cys Asn His Thr Val Met
85 90 95
Ala Leu Met Ala Ser Leu Asp Ala Glu Lys Ala Gln Gly Gln Lys Lys
100 105 110
Val Glu Glu Leu Glu Gly Glu Ile Thr Thr Leu Asn His Lys Leu Gln
115 120 125
Asp Ala Ser Ala Glu Val Glu Arg Leu Arg Arg Glu Asn Gln Val Leu
130 135 140
Ser Val Arg Ile Ala Asp Lys Lys Tyr Tyr Pro Ser Ser Gln Asp Ser
145 150 155 160
Ser Ser Ala Ala Ala Pro Gln Leu Leu Ile Val Leu Leu Gly Leu Ser
165 170 175
Ala Leu Leu Gln
180
<210> 9
<211> 675
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q8N3R9 MPP5_HUMAN
<400> 9
Met Thr Thr Ser His Met Asn Gly His Val Thr Glu Glu Ser Asp Ser
1 5 10 15
Glu Val Lys Asn Val Asp Leu Ala Ser Pro Glu Glu His Gln Lys His
20 25 30
Arg Glu Met Ala Val Asp Cys Pro Gly Asp Leu Gly Thr Arg Met Met
35 40 45
Pro Ile Arg Arg Ser Ala Gln Leu Glu Arg Ile Arg Gln Gln Gln Glu
50 55 60
Asp Met Arg Arg Arg Arg Glu Glu Glu Gly Lys Lys Gln Glu Leu Asp
65 70 75 80
Leu Asn Ser Ser Met Arg Leu Lys Lys Leu Ala Gln Ile Pro Pro Lys
85 90 95
Thr Gly Ile Asp Asn Pro Met Phe Asp Thr Glu Glu Gly Ile Val Leu
100 105 110
Glu Ser Pro His Tyr Ala Val Lys Ile Leu Glu Ile Glu Asp Leu Phe
115 120 125
Ser Ser Leu Lys His Ile Gln His Thr Leu Val Asp Ser Gln Ser Gln
130 135 140
Glu Asp Ile Ser Leu Leu Leu Gln Leu Val Gln Asn Lys Asp Phe Gln
145 150 155 160
Asn Ala Phe Lys Ile His Asn Ala Ile Thr Val His Met Asn Lys Ala
165 170 175
Ser Pro Pro Phe Pro Leu Ile Ser Asn Ala Gln Asp Leu Ala Gln Glu
180 185 190
Val Gln Thr Val Leu Lys Pro Val His His Lys Glu Gly Gln Glu Leu
195 200 205
Thr Ala Leu Leu Asn Thr Pro His Ile Gln Ala Leu Leu Leu Ala His
210 215 220
Asp Lys Val Ala Glu Gln Glu Met Gln Leu Glu Pro Ile Thr Asp Glu
225 230 235 240
Arg Val Tyr Glu Ser Ile Gly Gln Tyr Gly Gly Glu Thr Val Lys Ile
245 250 255
Val Arg Ile Glu Lys Ala Arg Asp Ile Pro Leu Gly Ala Thr Val Arg
260 265 270
Asn Glu Met Asp Ser Val Ile Ile Ser Arg Ile Val Lys Gly Gly Ala
275 280 285
Ala Glu Lys Ser Gly Leu Leu His Glu Gly Asp Glu Val Leu Glu Ile
290 295 300
Asn Gly Ile Glu Ile Arg Gly Lys Asp Val Asn Glu Val Phe Asp Leu
305 310 315 320
Leu Ser Asp Met His Gly Thr Leu Thr Phe Val Leu Ile Pro Ser Gln
325 330 335
Gln Ile Lys Pro Pro Pro Ala Lys Glu Thr Val Ile His Val Lys Ala
340 345 350
His Phe Asp Tyr Asp Pro Ser Asp Asp Pro Tyr Val Pro Cys Arg Glu
355 360 365
Leu Gly Leu Ser Phe Gln Lys Gly Asp Ile Leu His Val Ile Ser Gln
370 375 380
Glu Asp Pro Asn Trp Trp Gln Ala Tyr Arg Glu Gly Asp Glu Asp Asn
385 390 395 400
Gln Pro Leu Ala Gly Leu Val Pro Gly Lys Ser Phe Gln Gln Gln Arg
405 410 415
Glu Ala Met Lys Gln Thr Ile Glu Glu Asp Lys Glu Pro Glu Lys Ser
420 425 430
Gly Lys Leu Trp Cys Ala Lys Lys Asn Lys Lys Lys Arg Lys Lys Val
435 440 445
Leu Tyr Asn Ala Asn Lys Asn Asp Asp Tyr Asp Asn Glu Glu Ile Leu
450 455 460
Thr Tyr Glu Glu Met Ser Leu Tyr His Gln Pro Ala Asn Arg Lys Arg
465 470 475 480
Pro Ile Ile Leu Ile Gly Pro Gln Asn Cys Gly Gln Asn Glu Leu Arg
485 490 495
Gln Arg Leu Met Asn Lys Glu Lys Asp Arg Phe Ala Ser Ala Val Pro
500 505 510
His Thr Thr Arg Ser Arg Arg Asp Gln Glu Val Ala Gly Arg Asp Tyr
515 520 525
His Phe Val Ser Arg Gln Ala Phe Glu Ala Asp Ile Ala Ala Gly Lys
530 535 540
Phe Ile Glu His Gly Glu Phe Glu Lys Asn Leu Tyr Gly Thr Ser Ile
545 550 555 560
Asp Ser Val Arg Gln Val Ile Asn Ser Gly Lys Ile Cys Leu Leu Ser
565 570 575
Leu Arg Thr Gln Ser Leu Lys Thr Leu Arg Asn Ser Asp Leu Lys Pro
580 585 590
Tyr Ile Ile Phe Ile Ala Pro Pro Ser Gln Glu Arg Leu Arg Ala Leu
595 600 605
Leu Ala Lys Glu Gly Lys Asn Pro Lys Pro Glu Glu Leu Arg Glu Ile
610 615 620
Ile Glu Lys Thr Arg Glu Met Glu Gln Asn Asn Gly His Tyr Phe Asp
625 630 635 640
Thr Ala Ile Val Asn Ser Asp Leu Asp Lys Ala Tyr Gln Glu Leu Leu
645 650 655
Arg Leu Ile Asn Lys Leu Asp Thr Glu Pro Gln Trp Val Pro Ser Thr
660 665 670
Trp Leu Arg
675
<210> 10
<211> 299
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q99623 PHB2_HUMAN
<400> 10
Met Ala Gln Asn Leu Lys Asp Leu Ala Gly Arg Leu Pro Ala Gly Pro
1 5 10 15
Arg Gly Met Gly Thr Ala Leu Lys Leu Leu Leu Gly Ala Gly Ala Val
20 25 30
Ala Tyr Gly Val Arg Glu Ser Val Phe Thr Val Glu Gly Gly His Arg
35 40 45
Ala Ile Phe Phe Asn Arg Ile Gly Gly Val Gln Gln Asp Thr Ile Leu
50 55 60
Ala Glu Gly Leu His Phe Arg Ile Pro Trp Phe Gln Tyr Pro Ile Ile
65 70 75 80
Tyr Asp Ile Arg Ala Arg Pro Arg Lys Ile Ser Ser Pro Thr Gly Ser
85 90 95
Lys Asp Leu Gln Met Val Asn Ile Ser Leu Arg Val Leu Ser Arg Pro
100 105 110
Asn Ala Gln Glu Leu Pro Ser Met Tyr Gln Arg Leu Gly Leu Asp Tyr
115 120 125
Glu Glu Arg Val Leu Pro Ser Ile Val Asn Glu Val Leu Lys Ser Val
130 135 140
Val Ala Lys Phe Asn Ala Ser Gln Leu Ile Thr Gln Arg Ala Gln Val
145 150 155 160
Ser Leu Leu Ile Arg Arg Glu Leu Thr Glu Arg Ala Lys Asp Phe Ser
165 170 175
Leu Ile Leu Asp Asp Val Ala Ile Thr Glu Leu Ser Phe Ser Arg Glu
180 185 190
Tyr Thr Ala Ala Val Glu Ala Lys Gln Val Ala Gln Gln Glu Ala Gln
195 200 205
Arg Ala Gln Phe Leu Val Glu Lys Ala Lys Gln Glu Gln Arg Gln Lys
210 215 220
Ile Val Gln Ala Glu Gly Glu Ala Glu Ala Ala Lys Met Leu Gly Glu
225 230 235 240
Ala Leu Ser Lys Asn Pro Gly Tyr Ile Lys Leu Arg Lys Ile Arg Ala
245 250 255
Ala Gln Asn Ile Ser Lys Thr Ile Ala Thr Ser Gln Asn Arg Ile Tyr
260 265 270
Leu Thr Ala Asp Asn Leu Val Leu Asn Leu Gln Asp Glu Ser Phe Thr
275 280 285
Arg Gly Ser Asp Ser Leu Ile Lys Gly Lys Lys
290 295
<210> 11
<211> 4382
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0C6U8 R1A_CVHSA
<400> 11
Met Glu Ser Leu Val Leu Gly Val Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Ala Leu Ser Glu Ala Arg Glu His Leu Lys Asn
35 40 45
Gly Thr Cys Gly Leu Val Glu Leu Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Leu Ser Thr Asn
65 70 75 80
His Gly His Lys Val Val Glu Leu Val Ala Glu Met Asp Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Ile Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Thr Pro Ile Ala Tyr Arg Asn Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ile Asp Leu Lys Ser Tyr Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Ile Glu Asp Tyr Glu Gln Asn
145 150 155 160
Trp Asn Thr Lys His Gly Ser Gly Ala Leu Arg Glu Leu Thr Arg Glu
165 170 175
Leu Asn Gly Gly Ala Val Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Asp Cys Ile Lys Asp Phe Leu Ala Arg Ala
195 200 205
Gly Lys Ser Met Cys Thr Leu Ser Glu Gln Leu Asp Tyr Ile Glu Ser
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Asp His Glu His Glu Ile Ala Trp
225 230 235 240
Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gln Thr Pro Phe Glu
245 250 255
Ile Lys Ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu Cys Pro Lys
260 265 270
Phe Val Phe Pro Leu Asn Ser Lys Val Lys Val Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Gln Glu Cys Asn Asn Met His Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asn His Cys Asp Glu Val Ser Trp Gln Thr Cys Asp Phe
325 330 335
Leu Lys Ala Thr Cys Glu His Cys Gly Thr Glu Asn Leu Val Ile Glu
340 345 350
Gly Pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn Ala Val Val Lys Met
355 360 365
Pro Cys Pro Ala Cys Gln Asp Pro Glu Ile Gly Pro Glu His Ser Val
370 375 380
Ala Asp Tyr His Asn His Ser Asn Ile Glu Thr Arg Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Arg Cys Phe Gly Gly Cys Val Phe Ala Tyr Val Gly Cys
405 410 415
Tyr Asn Lys Arg Ala Tyr Trp Val Pro Arg Ala Ser Ala Asp Ile Gly
420 425 430
Ser Gly His Thr Gly Ile Thr Gly Asp Asn Val Glu Thr Leu Asn Glu
435 440 445
Asp Leu Leu Glu Ile Leu Ser Arg Glu Arg Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe His Leu Asn Glu Glu Val Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Ile Asp Thr Ile Lys Ser Leu Asp Tyr
485 490 495
Lys Ser Phe Lys Thr Ile Val Glu Ser Cys Gly Asn Tyr Lys Val Thr
500 505 510
Lys Gly Lys Pro Val Lys Gly Ala Trp Asn Ile Gly Gln Gln Arg Ser
515 520 525
Val Leu Thr Pro Leu Cys Gly Phe Pro Ser Gln Ala Ala Gly Val Ile
530 535 540
Arg Ser Ile Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser Ile Pro
545 550 555 560
Asp Leu Gln Arg Ala Ala Val Thr Ile Leu Asp Gly Ile Ser Glu Gln
565 570 575
Ser Leu Arg Leu Val Asp Ala Met Val Tyr Thr Ser Asp Leu Leu Thr
580 585 590
Asn Ser Val Ile Ile Met Ala Tyr Val Thr Gly Gly Leu Val Gln Gln
595 600 605
Thr Ser Gln Trp Leu Ser Asn Leu Leu Gly Thr Thr Val Glu Lys Leu
610 615 620
Arg Pro Ile Phe Glu Trp Ile Glu Ala Lys Leu Ser Ala Gly Val Glu
625 630 635 640
Phe Leu Lys Asp Ala Trp Glu Ile Leu Lys Phe Leu Ile Thr Gly Val
645 650 655
Phe Asp Ile Val Lys Gly Gln Ile Gln Val Ala Ser Asp Asn Ile Lys
660 665 670
Asp Cys Val Lys Cys Phe Ile Asp Val Val Asn Lys Ala Leu Glu Met
675 680 685
Cys Ile Asp Gln Val Thr Ile Ala Gly Ala Lys Leu Arg Ser Leu Asn
690 695 700
Leu Gly Glu Val Phe Ile Ala Gln Ser Lys Gly Leu Tyr Arg Gln Cys
705 710 715 720
Ile Arg Gly Lys Glu Gln Leu Gln Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Val Thr Phe Leu Glu Gly Asp Ser His Asp Thr Val Leu Thr
740 745 750
Ser Glu Glu Val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr
755 760 765
Pro Val Asp Ser Phe Thr Asn Gly Ala Ile Val Gly Thr Pro Val Cys
770 775 780
Val Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Lys Glu Gln Tyr Cys
785 790 795 800
Ala Leu Ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe Arg Leu Lys
805 810 815
Gly Gly Ala Pro Ile Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp
820 825 830
Glu Val Gln Gly Tyr Lys Asn Val Arg Ile Thr Phe Glu Leu Asp Glu
835 840 845
Arg Val Asp Lys Val Leu Asn Glu Lys Cys Ser Val Tyr Thr Val Glu
850 855 860
Ser Gly Thr Glu Val Thr Glu Phe Ala Cys Val Val Ala Glu Ala Val
865 870 875 880
Val Lys Thr Leu Gln Pro Val Ser Asp Leu Leu Thr Asn Met Gly Ile
885 890 895
Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala
900 905 910
Gly Glu Glu Asn Phe Ser Ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro
915 920 925
Asp Glu Glu Glu Glu Asp Asp Ala Glu Cys Glu Glu Glu Glu Ile Asp
930 935 940
Glu Thr Cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Leu
945 950 955 960
Pro Leu Glu Phe Gly Ala Ser Ala Glu Thr Val Arg Val Glu Glu Glu
965 970 975
Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gln Ser Glu Ile Glu
980 985 990
Pro Glu Pro Glu Pro Thr Pro Glu Glu Pro Val Asn Gln Phe Thr Gly
995 1000 1005
Tyr Leu Lys Leu Thr Asp Asn Val Ala Ile Lys Cys Val Asp Ile
1010 1015 1020
Val Lys Glu Ala Gln Ser Ala Asn Pro Met Val Ile Val Asn Ala
1025 1030 1035
Ala Asn Ile His Leu Lys His Gly Gly Gly Val Ala Gly Ala Leu
1040 1045 1050
Asn Lys Ala Thr Asn Gly Ala Met Gln Lys Glu Ser Asp Asp Tyr
1055 1060 1065
Ile Lys Leu Asn Gly Pro Leu Thr Val Gly Gly Ser Cys Leu Leu
1070 1075 1080
Ser Gly His Asn Leu Ala Lys Lys Cys Leu His Val Val Gly Pro
1085 1090 1095
Asn Leu Asn Ala Gly Glu Asp Ile Gln Leu Leu Lys Ala Ala Tyr
1100 1105 1110
Glu Asn Phe Asn Ser Gln Asp Ile Leu Leu Ala Pro Leu Leu Ser
1115 1120 1125
Ala Gly Ile Phe Gly Ala Lys Pro Leu Gln Ser Leu Gln Val Cys
1130 1135 1140
Val Gln Thr Val Arg Thr Gln Val Tyr Ile Ala Val Asn Asp Lys
1145 1150 1155
Ala Leu Tyr Glu Gln Val Val Met Asp Tyr Leu Asp Asn Leu Lys
1160 1165 1170
Pro Arg Val Glu Ala Pro Lys Gln Glu Glu Pro Pro Asn Thr Glu
1175 1180 1185
Asp Ser Lys Thr Glu Glu Lys Ser Val Val Gln Lys Pro Val Asp
1190 1195 1200
Val Lys Pro Lys Ile Lys Ala Cys Ile Asp Glu Val Thr Thr Thr
1205 1210 1215
Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala
1220 1225 1230
Asp Ile Asn Gly Lys Leu Tyr His Asp Ser Gln Asn Met Leu Arg
1235 1240 1245
Gly Glu Asp Met Ser Phe Leu Glu Lys Asp Ala Pro Tyr Met Val
1250 1255 1260
Gly Asp Val Ile Thr Ser Gly Asp Ile Thr Cys Val Val Ile Pro
1265 1270 1275
Ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Ser Arg Ala Leu
1280 1285 1290
Lys Lys Val Pro Val Asp Glu Tyr Ile Thr Thr Tyr Pro Gly Gln
1295 1300 1305
Gly Cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys
1310 1315 1320
Lys Cys Lys Ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn
1325 1330 1335
Ala Lys Glu Glu Ile Leu Gly Thr Val Ser Trp Asn Leu Arg Glu
1340 1345 1350
Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro Ile Cys
1355 1360 1365
Met Asp Val Arg Ala Ile Met Ala Thr Ile Gln Arg Lys Tyr Lys
1370 1375 1380
Gly Ile Lys Ile Gln Glu Gly Ile Val Asp Tyr Gly Val Arg Phe
1385 1390 1395
Phe Phe Tyr Thr Ser Lys Glu Pro Val Ala Ser Ile Ile Thr Lys
1400 1405 1410
Leu Asn Ser Leu Asn Glu Pro Leu Val Thr Met Pro Ile Gly Tyr
1415 1420 1425
Val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg
1430 1435 1440
Ser Leu Lys Ala Pro Ala Val Val Ser Val Ser Ser Pro Asp Ala
1445 1450 1455
Val Thr Thr Tyr Asn Gly Tyr Leu Thr Ser Ser Ser Lys Thr Ser
1460 1465 1470
Glu Glu His Phe Val Glu Thr Val Ser Leu Ala Gly Ser Tyr Arg
1475 1480 1485
Asp Trp Ser Tyr Ser Gly Gln Arg Thr Glu Leu Gly Val Glu Phe
1490 1495 1500
Leu Lys Arg Gly Asp Lys Ile Val Tyr His Thr Leu Glu Ser Pro
1505 1510 1515
Val Glu Phe His Leu Asp Gly Glu Val Leu Ser Leu Asp Lys Leu
1520 1525 1530
Lys Ser Leu Leu Ser Leu Arg Glu Val Lys Thr Ile Lys Val Phe
1535 1540 1545
Thr Thr Val Asp Asn Thr Asn Leu His Thr Gln Leu Val Asp Met
1550 1555 1560
Ser Met Thr Tyr Gly Gln Gln Phe Gly Pro Thr Tyr Leu Asp Gly
1565 1570 1575
Ala Asp Val Thr Lys Ile Lys Pro His Val Asn His Glu Gly Lys
1580 1585 1590
Thr Phe Phe Val Leu Pro Ser Asp Asp Thr Leu Arg Ser Glu Ala
1595 1600 1605
Phe Glu Tyr Tyr His Thr Leu Asp Glu Ser Phe Leu Gly Arg Tyr
1610 1615 1620
Met Ser Ala Leu Asn His Thr Lys Lys Trp Lys Phe Pro Gln Val
1625 1630 1635
Gly Gly Leu Thr Ser Ile Lys Trp Ala Asp Asn Asn Cys Tyr Leu
1640 1645 1650
Ser Ser Val Leu Leu Ala Leu Gln Gln Leu Glu Val Lys Phe Asn
1655 1660 1665
Ala Pro Ala Leu Gln Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp
1670 1675 1680
Ala Ala Asn Phe Cys Ala Leu Ile Leu Ala Tyr Ser Asn Lys Thr
1685 1690 1695
Val Gly Glu Leu Gly Asp Val Arg Glu Thr Met Thr His Leu Leu
1700 1705 1710
Gln His Ala Asn Leu Glu Ser Ala Lys Arg Val Leu Asn Val Val
1715 1720 1725
Cys Lys His Cys Gly Gln Lys Thr Thr Thr Leu Thr Gly Val Glu
1730 1735 1740
Ala Val Met Tyr Met Gly Thr Leu Ser Tyr Asp Asn Leu Lys Thr
1745 1750 1755
Gly Val Ser Ile Pro Cys Val Cys Gly Arg Asp Ala Thr Gln Tyr
1760 1765 1770
Leu Val Gln Gln Glu Ser Ser Phe Val Met Met Ser Ala Pro Pro
1775 1780 1785
Ala Glu Tyr Lys Leu Gln Gln Gly Thr Phe Leu Cys Ala Asn Glu
1790 1795 1800
Tyr Thr Gly Asn Tyr Gln Cys Gly His Tyr Thr His Ile Thr Ala
1805 1810 1815
Lys Glu Thr Leu Tyr Arg Ile Asp Gly Ala His Leu Thr Lys Met
1820 1825 1830
Ser Glu Tyr Lys Gly Pro Val Thr Asp Val Phe Tyr Lys Glu Thr
1835 1840 1845
Ser Tyr Thr Thr Thr Ile Lys Pro Val Ser Tyr Lys Leu Asp Gly
1850 1855 1860
Val Thr Tyr Thr Glu Ile Glu Pro Lys Leu Asp Gly Tyr Tyr Lys
1865 1870 1875
Lys Asp Asn Ala Tyr Tyr Thr Glu Gln Pro Ile Asp Leu Val Pro
1880 1885 1890
Thr Gln Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr
1895 1900 1905
Cys Ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gln Met Thr Gly
1910 1915 1920
Phe Thr Lys Pro Ala Ser Arg Glu Leu Ser Val Thr Phe Phe Pro
1925 1930 1935
Asp Leu Asn Gly Asp Val Val Ala Ile Asp Tyr Arg His Tyr Ser
1940 1945 1950
Ala Ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro Ile Val
1955 1960 1965
Trp His Ile Asn Gln Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn
1970 1975 1980
Thr Trp Cys Leu Arg Cys Leu Trp Ser Thr Lys Pro Val Asp Thr
1985 1990 1995
Ser Asn Ser Phe Glu Val Leu Ala Val Glu Asp Thr Gln Gly Met
2000 2005 2010
Asp Asn Leu Ala Cys Glu Ser Gln Gln Pro Thr Ser Glu Glu Val
2015 2020 2025
Val Glu Asn Pro Thr Ile Gln Lys Glu Val Ile Glu Cys Asp Val
2030 2035 2040
Lys Thr Thr Glu Val Val Gly Asn Val Ile Leu Lys Pro Ser Asp
2045 2050 2055
Glu Gly Val Lys Val Thr Gln Glu Leu Gly His Glu Asp Leu Met
2060 2065 2070
Ala Ala Tyr Val Glu Asn Thr Ser Ile Thr Ile Lys Lys Pro Asn
2075 2080 2085
Glu Leu Ser Leu Ala Leu Gly Leu Lys Thr Ile Ala Thr His Gly
2090 2095 2100
Ile Ala Ala Ile Asn Ser Val Pro Trp Ser Lys Ile Leu Ala Tyr
2105 2110 2115
Val Lys Pro Phe Leu Gly Gln Ala Ala Ile Thr Thr Ser Asn Cys
2120 2125 2130
Ala Lys Arg Leu Ala Gln Arg Val Phe Asn Asn Tyr Met Pro Tyr
2135 2140 2145
Val Phe Thr Leu Leu Phe Gln Leu Cys Thr Phe Thr Lys Ser Thr
2150 2155 2160
Asn Ser Arg Ile Arg Ala Ser Leu Pro Thr Thr Ile Ala Lys Asn
2165 2170 2175
Ser Val Lys Ser Val Ala Lys Leu Cys Leu Asp Ala Gly Ile Asn
2180 2185 2190
Tyr Val Lys Ser Pro Lys Phe Ser Lys Leu Phe Thr Ile Ala Met
2195 2200 2205
Trp Leu Leu Leu Leu Ser Ile Cys Leu Gly Ser Leu Ile Cys Val
2210 2215 2220
Thr Ala Ala Phe Gly Val Leu Leu Ser Asn Phe Gly Ala Pro Ser
2225 2230 2235
Tyr Cys Asn Gly Val Arg Glu Leu Tyr Leu Asn Ser Ser Asn Val
2240 2245 2250
Thr Thr Met Asp Phe Cys Glu Gly Ser Phe Pro Cys Ser Ile Cys
2255 2260 2265
Leu Ser Gly Leu Asp Ser Leu Asp Ser Tyr Pro Ala Leu Glu Thr
2270 2275 2280
Ile Gln Val Thr Ile Ser Ser Tyr Lys Leu Asp Leu Thr Ile Leu
2285 2290 2295
Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys
2300 2305 2310
Phe Phe Tyr Leu Leu Gly Leu Ser Ala Ile Met Gln Val Phe Phe
2315 2320 2325
Gly Tyr Phe Ala Ser His Phe Ile Ser Asn Ser Trp Leu Met Trp
2330 2335 2340
Phe Ile Ile Ser Ile Val Gln Met Ala Pro Val Ser Ala Met Val
2345 2350 2355
Arg Met Tyr Ile Phe Phe Ala Ser Phe Tyr Tyr Ile Trp Lys Ser
2360 2365 2370
Tyr Val His Ile Met Asp Gly Cys Thr Ser Ser Thr Cys Met Met
2375 2380 2385
Cys Tyr Lys Arg Asn Arg Ala Thr Arg Val Glu Cys Thr Thr Ile
2390 2395 2400
Val Asn Gly Met Lys Arg Ser Phe Tyr Val Tyr Ala Asn Gly Gly
2405 2410 2415
Arg Gly Phe Cys Lys Thr His Asn Trp Asn Cys Leu Asn Cys Asp
2420 2425 2430
Thr Phe Cys Thr Gly Ser Thr Phe Ile Ser Asp Glu Val Ala Arg
2435 2440 2445
Asp Leu Ser Leu Gln Phe Lys Arg Pro Ile Asn Pro Thr Asp Gln
2450 2455 2460
Ser Ser Tyr Ile Val Asp Ser Val Ala Val Lys Asn Gly Ala Leu
2465 2470 2475
His Leu Tyr Phe Asp Lys Ala Gly Gln Lys Thr Tyr Glu Arg His
2480 2485 2490
Pro Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg Ala Asn Asn
2495 2500 2505
Thr Lys Gly Ser Leu Pro Ile Asn Val Ile Val Phe Asp Gly Lys
2510 2515 2520
Ser Lys Cys Asp Glu Ser Ala Ser Lys Ser Ala Ser Val Tyr Tyr
2525 2530 2535
Ser Gln Leu Met Cys Gln Pro Ile Leu Leu Leu Asp Gln Ala Leu
2540 2545 2550
Val Ser Asp Val Gly Asp Ser Thr Glu Val Ser Val Lys Met Phe
2555 2560 2565
Asp Ala Tyr Val Asp Thr Phe Ser Ala Thr Phe Ser Val Pro Met
2570 2575 2580
Glu Lys Leu Lys Ala Leu Val Ala Thr Ala His Ser Glu Leu Ala
2585 2590 2595
Lys Gly Val Ala Leu Asp Gly Val Leu Ser Thr Phe Val Ser Ala
2600 2605 2610
Ala Arg Gln Gly Val Val Asp Thr Asp Val Asp Thr Lys Asp Val
2615 2620 2625
Ile Glu Cys Leu Lys Leu Ser His His Ser Asp Leu Glu Val Thr
2630 2635 2640
Gly Asp Ser Cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu
2645 2650 2655
Asn Met Thr Pro Arg Asp Leu Gly Ala Cys Ile Asp Cys Asn Ala
2660 2665 2670
Arg His Ile Asn Ala Gln Val Ala Lys Ser His Asn Val Ser Leu
2675 2680 2685
Ile Trp Asn Val Lys Asp Tyr Met Ser Leu Ser Glu Gln Leu Arg
2690 2695 2700
Lys Gln Ile Arg Ser Ala Ala Lys Lys Asn Asn Ile Pro Phe Arg
2705 2710 2715
Leu Thr Cys Ala Thr Thr Arg Gln Val Val Asn Val Ile Thr Thr
2720 2725 2730
Lys Ile Ser Leu Lys Gly Gly Lys Ile Val Ser Thr Cys Phe Lys
2735 2740 2745
Leu Met Leu Lys Ala Thr Leu Leu Cys Val Leu Ala Ala Leu Val
2750 2755 2760
Cys Tyr Ile Val Met Pro Val His Thr Leu Ser Ile His Asp Gly
2765 2770 2775
Tyr Thr Asn Glu Ile Ile Gly Tyr Lys Ala Ile Gln Asp Gly Val
2780 2785 2790
Thr Arg Asp Ile Ile Ser Thr Asp Asp Cys Phe Ala Asn Lys His
2795 2800 2805
Ala Gly Phe Asp Ala Trp Phe Ser Gln Arg Gly Gly Ser Tyr Lys
2810 2815 2820
Asn Asp Lys Ser Cys Pro Val Val Ala Ala Ile Ile Thr Arg Glu
2825 2830 2835
Ile Gly Phe Ile Val Pro Gly Leu Pro Gly Thr Val Leu Arg Ala
2840 2845 2850
Ile Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala
2855 2860 2865
Val Gly Asn Ile Cys Tyr Thr Pro Ser Lys Leu Ile Glu Tyr Ser
2870 2875 2880
Asp Phe Ala Thr Ser Ala Cys Val Leu Ala Ala Glu Cys Thr Ile
2885 2890 2895
Phe Lys Asp Ala Met Gly Lys Pro Val Pro Tyr Cys Tyr Asp Thr
2900 2905 2910
Asn Leu Leu Glu Gly Ser Ile Ser Tyr Ser Glu Leu Arg Pro Asp
2915 2920 2925
Thr Arg Tyr Val Leu Met Asp Gly Ser Ile Ile Gln Phe Pro Asn
2930 2935 2940
Thr Tyr Leu Glu Gly Ser Val Arg Val Val Thr Thr Phe Asp Ala
2945 2950 2955
Glu Tyr Cys Arg His Gly Thr Cys Glu Arg Ser Glu Val Gly Ile
2960 2965 2970
Cys Leu Ser Thr Ser Gly Arg Trp Val Leu Asn Asn Glu His Tyr
2975 2980 2985
Arg Ala Leu Ser Gly Val Phe Cys Gly Val Asp Ala Met Asn Leu
2990 2995 3000
Ile Ala Asn Ile Phe Thr Pro Leu Val Gln Pro Val Gly Ala Leu
3005 3010 3015
Asp Val Ser Ala Ser Val Val Ala Gly Gly Ile Ile Ala Ile Leu
3020 3025 3030
Val Thr Cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe
3035 3040 3045
Gly Glu Tyr Asn His Val Val Ala Ala Asn Ala Leu Leu Phe Leu
3050 3055 3060
Met Ser Phe Thr Ile Leu Cys Leu Val Pro Ala Tyr Ser Phe Leu
3065 3070 3075
Pro Gly Val Tyr Ser Val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe
3080 3085 3090
Thr Asn Asp Val Ser Phe Leu Ala His Leu Gln Trp Phe Ala Met
3095 3100 3105
Phe Ser Pro Ile Val Pro Phe Trp Ile Thr Ala Ile Tyr Val Phe
3110 3115 3120
Cys Ile Ser Leu Lys His Cys His Trp Phe Phe Asn Asn Tyr Leu
3125 3130 3135
Arg Lys Arg Val Met Phe Asn Gly Val Thr Phe Ser Thr Phe Glu
3140 3145 3150
Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu
3155 3160 3165
Lys Leu Arg Ser Glu Thr Leu Leu Pro Leu Thr Gln Tyr Asn Arg
3170 3175 3180
Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe Ser Gly Ala Leu
3185 3190 3195
Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys His Leu Ala Lys
3200 3205 3210
Ala Leu Asn Asp Phe Ser Asn Ser Gly Ala Asp Val Leu Tyr Gln
3215 3220 3225
Pro Pro Gln Thr Ser Ile Thr Ser Ala Val Leu Gln Ser Gly Phe
3230 3235 3240
Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met Val
3245 3250 3255
Gln Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp
3260 3265 3270
Asp Thr Val Tyr Cys Pro Arg His Val Ile Cys Thr Ala Glu Asp
3275 3280 3285
Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu Ile Arg Lys Ser Asn
3290 3295 3300
His Ser Phe Leu Val Gln Ala Gly Asn Val Gln Leu Arg Val Ile
3305 3310 3315
Gly His Ser Met Gln Asn Cys Leu Leu Arg Leu Lys Val Asp Thr
3320 3325 3330
Ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe Val Arg Ile Gln Pro
3335 3340 3345
Gly Gln Thr Phe Ser Val Leu Ala Cys Tyr Asn Gly Ser Pro Ser
3350 3355 3360
Gly Val Tyr Gln Cys Ala Met Arg Pro Asn His Thr Ile Lys Gly
3365 3370 3375
Ser Phe Leu Asn Gly Ser Cys Gly Ser Val Gly Phe Asn Ile Asp
3380 3385 3390
Tyr Asp Cys Val Ser Phe Cys Tyr Met His His Met Glu Leu Pro
3395 3400 3405
Thr Gly Val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly
3410 3415 3420
Pro Phe Val Asp Arg Gln Thr Ala Gln Ala Ala Gly Thr Asp Thr
3425 3430 3435
Thr Ile Thr Leu Asn Val Leu Ala Trp Leu Tyr Ala Ala Val Ile
3440 3445 3450
Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn
3455 3460 3465
Asp Phe Asn Leu Val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr
3470 3475 3480
Gln Asp His Val Asp Ile Leu Gly Pro Leu Ser Ala Gln Thr Gly
3485 3490 3495
Ile Ala Val Leu Asp Met Cys Ala Ala Leu Lys Glu Leu Leu Gln
3500 3505 3510
Asn Gly Met Asn Gly Arg Thr Ile Leu Gly Ser Thr Ile Leu Glu
3515 3520 3525
Asp Glu Phe Thr Pro Phe Asp Val Val Arg Gln Cys Ser Gly Val
3530 3535 3540
Thr Phe Gln Gly Lys Phe Lys Lys Ile Val Lys Gly Thr His His
3545 3550 3555
Trp Met Leu Leu Thr Phe Leu Thr Ser Leu Leu Ile Leu Val Gln
3560 3565 3570
Ser Thr Gln Trp Ser Leu Phe Phe Phe Val Tyr Glu Asn Ala Phe
3575 3580 3585
Leu Pro Phe Thr Leu Gly Ile Met Ala Ile Ala Ala Cys Ala Met
3590 3595 3600
Leu Leu Val Lys His Lys His Ala Phe Leu Cys Leu Phe Leu Leu
3605 3610 3615
Pro Ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro
3620 3625 3630
Ala Ser Trp Val Met Arg Ile Met Thr Trp Leu Glu Leu Ala Asp
3635 3640 3645
Thr Ser Leu Ser Gly Tyr Arg Leu Lys Asp Cys Val Met Tyr Ala
3650 3655 3660
Ser Ala Leu Val Leu Leu Ile Leu Met Thr Ala Arg Thr Val Tyr
3665 3670 3675
Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn Val Ile Thr
3680 3685 3690
Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp Gln Ala Ile
3695 3700 3705
Ser Met Trp Ala Leu Val Ile Ser Val Thr Ser Asn Tyr Ser Gly
3710 3715 3720
Val Val Thr Thr Ile Met Phe Leu Ala Arg Ala Ile Val Phe Val
3725 3730 3735
Cys Val Glu Tyr Tyr Pro Leu Leu Phe Ile Thr Gly Asn Thr Leu
3740 3745 3750
Gln Cys Ile Met Leu Val Tyr Cys Phe Leu Gly Tyr Cys Cys Cys
3755 3760 3765
Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu
3770 3775 3780
Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser Thr Gln Glu Phe Arg
3785 3790 3795
Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro Lys Ser Ser Ile Asp
3800 3805 3810
Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly Ile Gly Gly Lys Pro
3815 3820 3825
Cys Ile Lys Val Ala Thr Val Gln Ser Lys Met Ser Asp Val Lys
3830 3835 3840
Cys Thr Ser Val Val Leu Leu Ser Val Leu Gln Gln Leu Arg Val
3845 3850 3855
Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn
3860 3865 3870
Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met
3875 3880 3885
Val Ser Leu Leu Ser Val Leu Leu Ser Met Gln Gly Ala Val Asp
3890 3895 3900
Ile Asn Arg Leu Cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu
3905 3910 3915
Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu Pro Ser Tyr Ala Ala
3920 3925 3930
Tyr Ala Thr Ala Gln Glu Ala Tyr Glu Gln Ala Val Ala Asn Gly
3935 3940 3945
Asp Ser Glu Val Val Leu Lys Lys Leu Lys Lys Ser Leu Asn Val
3950 3955 3960
Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala Met Gln Arg Lys Leu
3965 3970 3975
Glu Lys Met Ala Asp Gln Ala Met Thr Gln Met Tyr Lys Gln Ala
3980 3985 3990
Arg Ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gln Thr
3995 4000 4005
Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn
4010 4015 4020
Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn Ile
4025 4030 4035
Ile Pro Leu Thr Thr Ala Ala Lys Leu Met Val Val Val Pro Asp
4040 4045 4050
Tyr Gly Thr Tyr Lys Asn Thr Cys Asp Gly Asn Thr Phe Thr Tyr
4055 4060 4065
Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp Ser
4070 4075 4080
Lys Ile Val Gln Leu Ser Glu Ile Asn Met Asp Asn Ser Pro Asn
4085 4090 4095
Leu Ala Trp Pro Leu Ile Val Thr Ala Leu Arg Ala Asn Ser Ala
4100 4105 4110
Val Lys Leu Gln Asn Asn Glu Leu Ser Pro Val Ala Leu Arg Gln
4115 4120 4125
Met Ser Cys Ala Ala Gly Thr Thr Gln Thr Ala Cys Thr Asp Asp
4130 4135 4140
Asn Ala Leu Ala Tyr Tyr Asn Asn Ser Lys Gly Gly Arg Phe Val
4145 4150 4155
Leu Ala Leu Leu Ser Asp His Gln Asp Leu Lys Trp Ala Arg Phe
4160 4165 4170
Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu Leu Glu Pro
4175 4180 4185
Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys
4190 4195 4200
Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn Leu Asn Arg Gly Met
4205 4210 4215
Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gln Ala Gly Asn
4220 4225 4230
Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu Ser Phe Cys Ala
4235 4240 4245
Phe Ala Val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser
4250 4255 4260
Gly Gly Gln Pro Ile Thr Asn Cys Val Lys Met Leu Cys Thr His
4265 4270 4275
Thr Gly Thr Gly Gln Ala Ile Thr Val Thr Pro Glu Ala Asn Met
4280 4285 4290
Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg
4295 4300 4305
Cys His Ile Asp His Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys
4310 4315 4320
Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys Ala Asn Asp Pro Val
4325 4330 4335
Gly Phe Thr Leu Arg Asn Thr Val Cys Thr Val Cys Gly Met Trp
4340 4345 4350
Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu Arg Glu Pro Leu Met
4355 4360 4365
Gln Ser Ala Asp Ala Ser Thr Phe Leu Asn Gly Phe Ala Val
4370 4375 4380
<210> 12
<211> 7073
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0C6X7 R1AB_CVHSA
<400> 12
Met Glu Ser Leu Val Leu Gly Val Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Ala Leu Ser Glu Ala Arg Glu His Leu Lys Asn
35 40 45
Gly Thr Cys Gly Leu Val Glu Leu Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Leu Ser Thr Asn
65 70 75 80
His Gly His Lys Val Val Glu Leu Val Ala Glu Met Asp Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Ile Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Thr Pro Ile Ala Tyr Arg Asn Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ile Asp Leu Lys Ser Tyr Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Ile Glu Asp Tyr Glu Gln Asn
145 150 155 160
Trp Asn Thr Lys His Gly Ser Gly Ala Leu Arg Glu Leu Thr Arg Glu
165 170 175
Leu Asn Gly Gly Ala Val Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Asp Cys Ile Lys Asp Phe Leu Ala Arg Ala
195 200 205
Gly Lys Ser Met Cys Thr Leu Ser Glu Gln Leu Asp Tyr Ile Glu Ser
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Asp His Glu His Glu Ile Ala Trp
225 230 235 240
Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gln Thr Pro Phe Glu
245 250 255
Ile Lys Ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu Cys Pro Lys
260 265 270
Phe Val Phe Pro Leu Asn Ser Lys Val Lys Val Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Gln Glu Cys Asn Asn Met His Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asn His Cys Asp Glu Val Ser Trp Gln Thr Cys Asp Phe
325 330 335
Leu Lys Ala Thr Cys Glu His Cys Gly Thr Glu Asn Leu Val Ile Glu
340 345 350
Gly Pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn Ala Val Val Lys Met
355 360 365
Pro Cys Pro Ala Cys Gln Asp Pro Glu Ile Gly Pro Glu His Ser Val
370 375 380
Ala Asp Tyr His Asn His Ser Asn Ile Glu Thr Arg Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Arg Cys Phe Gly Gly Cys Val Phe Ala Tyr Val Gly Cys
405 410 415
Tyr Asn Lys Arg Ala Tyr Trp Val Pro Arg Ala Ser Ala Asp Ile Gly
420 425 430
Ser Gly His Thr Gly Ile Thr Gly Asp Asn Val Glu Thr Leu Asn Glu
435 440 445
Asp Leu Leu Glu Ile Leu Ser Arg Glu Arg Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe His Leu Asn Glu Glu Val Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Ile Asp Thr Ile Lys Ser Leu Asp Tyr
485 490 495
Lys Ser Phe Lys Thr Ile Val Glu Ser Cys Gly Asn Tyr Lys Val Thr
500 505 510
Lys Gly Lys Pro Val Lys Gly Ala Trp Asn Ile Gly Gln Gln Arg Ser
515 520 525
Val Leu Thr Pro Leu Cys Gly Phe Pro Ser Gln Ala Ala Gly Val Ile
530 535 540
Arg Ser Ile Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser Ile Pro
545 550 555 560
Asp Leu Gln Arg Ala Ala Val Thr Ile Leu Asp Gly Ile Ser Glu Gln
565 570 575
Ser Leu Arg Leu Val Asp Ala Met Val Tyr Thr Ser Asp Leu Leu Thr
580 585 590
Asn Ser Val Ile Ile Met Ala Tyr Val Thr Gly Gly Leu Val Gln Gln
595 600 605
Thr Ser Gln Trp Leu Ser Asn Leu Leu Gly Thr Thr Val Glu Lys Leu
610 615 620
Arg Pro Ile Phe Glu Trp Ile Glu Ala Lys Leu Ser Ala Gly Val Glu
625 630 635 640
Phe Leu Lys Asp Ala Trp Glu Ile Leu Lys Phe Leu Ile Thr Gly Val
645 650 655
Phe Asp Ile Val Lys Gly Gln Ile Gln Val Ala Ser Asp Asn Ile Lys
660 665 670
Asp Cys Val Lys Cys Phe Ile Asp Val Val Asn Lys Ala Leu Glu Met
675 680 685
Cys Ile Asp Gln Val Thr Ile Ala Gly Ala Lys Leu Arg Ser Leu Asn
690 695 700
Leu Gly Glu Val Phe Ile Ala Gln Ser Lys Gly Leu Tyr Arg Gln Cys
705 710 715 720
Ile Arg Gly Lys Glu Gln Leu Gln Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Val Thr Phe Leu Glu Gly Asp Ser His Asp Thr Val Leu Thr
740 745 750
Ser Glu Glu Val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr
755 760 765
Pro Val Asp Ser Phe Thr Asn Gly Ala Ile Val Gly Thr Pro Val Cys
770 775 780
Val Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Lys Glu Gln Tyr Cys
785 790 795 800
Ala Leu Ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe Arg Leu Lys
805 810 815
Gly Gly Ala Pro Ile Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp
820 825 830
Glu Val Gln Gly Tyr Lys Asn Val Arg Ile Thr Phe Glu Leu Asp Glu
835 840 845
Arg Val Asp Lys Val Leu Asn Glu Lys Cys Ser Val Tyr Thr Val Glu
850 855 860
Ser Gly Thr Glu Val Thr Glu Phe Ala Cys Val Val Ala Glu Ala Val
865 870 875 880
Val Lys Thr Leu Gln Pro Val Ser Asp Leu Leu Thr Asn Met Gly Ile
885 890 895
Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala
900 905 910
Gly Glu Glu Asn Phe Ser Ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro
915 920 925
Asp Glu Glu Glu Glu Asp Asp Ala Glu Cys Glu Glu Glu Glu Ile Asp
930 935 940
Glu Thr Cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Leu
945 950 955 960
Pro Leu Glu Phe Gly Ala Ser Ala Glu Thr Val Arg Val Glu Glu Glu
965 970 975
Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gln Ser Glu Ile Glu
980 985 990
Pro Glu Pro Glu Pro Thr Pro Glu Glu Pro Val Asn Gln Phe Thr Gly
995 1000 1005
Tyr Leu Lys Leu Thr Asp Asn Val Ala Ile Lys Cys Val Asp Ile
1010 1015 1020
Val Lys Glu Ala Gln Ser Ala Asn Pro Met Val Ile Val Asn Ala
1025 1030 1035
Ala Asn Ile His Leu Lys His Gly Gly Gly Val Ala Gly Ala Leu
1040 1045 1050
Asn Lys Ala Thr Asn Gly Ala Met Gln Lys Glu Ser Asp Asp Tyr
1055 1060 1065
Ile Lys Leu Asn Gly Pro Leu Thr Val Gly Gly Ser Cys Leu Leu
1070 1075 1080
Ser Gly His Asn Leu Ala Lys Lys Cys Leu His Val Val Gly Pro
1085 1090 1095
Asn Leu Asn Ala Gly Glu Asp Ile Gln Leu Leu Lys Ala Ala Tyr
1100 1105 1110
Glu Asn Phe Asn Ser Gln Asp Ile Leu Leu Ala Pro Leu Leu Ser
1115 1120 1125
Ala Gly Ile Phe Gly Ala Lys Pro Leu Gln Ser Leu Gln Val Cys
1130 1135 1140
Val Gln Thr Val Arg Thr Gln Val Tyr Ile Ala Val Asn Asp Lys
1145 1150 1155
Ala Leu Tyr Glu Gln Val Val Met Asp Tyr Leu Asp Asn Leu Lys
1160 1165 1170
Pro Arg Val Glu Ala Pro Lys Gln Glu Glu Pro Pro Asn Thr Glu
1175 1180 1185
Asp Ser Lys Thr Glu Glu Lys Ser Val Val Gln Lys Pro Val Asp
1190 1195 1200
Val Lys Pro Lys Ile Lys Ala Cys Ile Asp Glu Val Thr Thr Thr
1205 1210 1215
Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala
1220 1225 1230
Asp Ile Asn Gly Lys Leu Tyr His Asp Ser Gln Asn Met Leu Arg
1235 1240 1245
Gly Glu Asp Met Ser Phe Leu Glu Lys Asp Ala Pro Tyr Met Val
1250 1255 1260
Gly Asp Val Ile Thr Ser Gly Asp Ile Thr Cys Val Val Ile Pro
1265 1270 1275
Ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Ser Arg Ala Leu
1280 1285 1290
Lys Lys Val Pro Val Asp Glu Tyr Ile Thr Thr Tyr Pro Gly Gln
1295 1300 1305
Gly Cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys
1310 1315 1320
Lys Cys Lys Ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn
1325 1330 1335
Ala Lys Glu Glu Ile Leu Gly Thr Val Ser Trp Asn Leu Arg Glu
1340 1345 1350
Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro Ile Cys
1355 1360 1365
Met Asp Val Arg Ala Ile Met Ala Thr Ile Gln Arg Lys Tyr Lys
1370 1375 1380
Gly Ile Lys Ile Gln Glu Gly Ile Val Asp Tyr Gly Val Arg Phe
1385 1390 1395
Phe Phe Tyr Thr Ser Lys Glu Pro Val Ala Ser Ile Ile Thr Lys
1400 1405 1410
Leu Asn Ser Leu Asn Glu Pro Leu Val Thr Met Pro Ile Gly Tyr
1415 1420 1425
Val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg
1430 1435 1440
Ser Leu Lys Ala Pro Ala Val Val Ser Val Ser Ser Pro Asp Ala
1445 1450 1455
Val Thr Thr Tyr Asn Gly Tyr Leu Thr Ser Ser Ser Lys Thr Ser
1460 1465 1470
Glu Glu His Phe Val Glu Thr Val Ser Leu Ala Gly Ser Tyr Arg
1475 1480 1485
Asp Trp Ser Tyr Ser Gly Gln Arg Thr Glu Leu Gly Val Glu Phe
1490 1495 1500
Leu Lys Arg Gly Asp Lys Ile Val Tyr His Thr Leu Glu Ser Pro
1505 1510 1515
Val Glu Phe His Leu Asp Gly Glu Val Leu Ser Leu Asp Lys Leu
1520 1525 1530
Lys Ser Leu Leu Ser Leu Arg Glu Val Lys Thr Ile Lys Val Phe
1535 1540 1545
Thr Thr Val Asp Asn Thr Asn Leu His Thr Gln Leu Val Asp Met
1550 1555 1560
Ser Met Thr Tyr Gly Gln Gln Phe Gly Pro Thr Tyr Leu Asp Gly
1565 1570 1575
Ala Asp Val Thr Lys Ile Lys Pro His Val Asn His Glu Gly Lys
1580 1585 1590
Thr Phe Phe Val Leu Pro Ser Asp Asp Thr Leu Arg Ser Glu Ala
1595 1600 1605
Phe Glu Tyr Tyr His Thr Leu Asp Glu Ser Phe Leu Gly Arg Tyr
1610 1615 1620
Met Ser Ala Leu Asn His Thr Lys Lys Trp Lys Phe Pro Gln Val
1625 1630 1635
Gly Gly Leu Thr Ser Ile Lys Trp Ala Asp Asn Asn Cys Tyr Leu
1640 1645 1650
Ser Ser Val Leu Leu Ala Leu Gln Gln Leu Glu Val Lys Phe Asn
1655 1660 1665
Ala Pro Ala Leu Gln Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp
1670 1675 1680
Ala Ala Asn Phe Cys Ala Leu Ile Leu Ala Tyr Ser Asn Lys Thr
1685 1690 1695
Val Gly Glu Leu Gly Asp Val Arg Glu Thr Met Thr His Leu Leu
1700 1705 1710
Gln His Ala Asn Leu Glu Ser Ala Lys Arg Val Leu Asn Val Val
1715 1720 1725
Cys Lys His Cys Gly Gln Lys Thr Thr Thr Leu Thr Gly Val Glu
1730 1735 1740
Ala Val Met Tyr Met Gly Thr Leu Ser Tyr Asp Asn Leu Lys Thr
1745 1750 1755
Gly Val Ser Ile Pro Cys Val Cys Gly Arg Asp Ala Thr Gln Tyr
1760 1765 1770
Leu Val Gln Gln Glu Ser Ser Phe Val Met Met Ser Ala Pro Pro
1775 1780 1785
Ala Glu Tyr Lys Leu Gln Gln Gly Thr Phe Leu Cys Ala Asn Glu
1790 1795 1800
Tyr Thr Gly Asn Tyr Gln Cys Gly His Tyr Thr His Ile Thr Ala
1805 1810 1815
Lys Glu Thr Leu Tyr Arg Ile Asp Gly Ala His Leu Thr Lys Met
1820 1825 1830
Ser Glu Tyr Lys Gly Pro Val Thr Asp Val Phe Tyr Lys Glu Thr
1835 1840 1845
Ser Tyr Thr Thr Thr Ile Lys Pro Val Ser Tyr Lys Leu Asp Gly
1850 1855 1860
Val Thr Tyr Thr Glu Ile Glu Pro Lys Leu Asp Gly Tyr Tyr Lys
1865 1870 1875
Lys Asp Asn Ala Tyr Tyr Thr Glu Gln Pro Ile Asp Leu Val Pro
1880 1885 1890
Thr Gln Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr
1895 1900 1905
Cys Ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gln Met Thr Gly
1910 1915 1920
Phe Thr Lys Pro Ala Ser Arg Glu Leu Ser Val Thr Phe Phe Pro
1925 1930 1935
Asp Leu Asn Gly Asp Val Val Ala Ile Asp Tyr Arg His Tyr Ser
1940 1945 1950
Ala Ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro Ile Val
1955 1960 1965
Trp His Ile Asn Gln Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn
1970 1975 1980
Thr Trp Cys Leu Arg Cys Leu Trp Ser Thr Lys Pro Val Asp Thr
1985 1990 1995
Ser Asn Ser Phe Glu Val Leu Ala Val Glu Asp Thr Gln Gly Met
2000 2005 2010
Asp Asn Leu Ala Cys Glu Ser Gln Gln Pro Thr Ser Glu Glu Val
2015 2020 2025
Val Glu Asn Pro Thr Ile Gln Lys Glu Val Ile Glu Cys Asp Val
2030 2035 2040
Lys Thr Thr Glu Val Val Gly Asn Val Ile Leu Lys Pro Ser Asp
2045 2050 2055
Glu Gly Val Lys Val Thr Gln Glu Leu Gly His Glu Asp Leu Met
2060 2065 2070
Ala Ala Tyr Val Glu Asn Thr Ser Ile Thr Ile Lys Lys Pro Asn
2075 2080 2085
Glu Leu Ser Leu Ala Leu Gly Leu Lys Thr Ile Ala Thr His Gly
2090 2095 2100
Ile Ala Ala Ile Asn Ser Val Pro Trp Ser Lys Ile Leu Ala Tyr
2105 2110 2115
Val Lys Pro Phe Leu Gly Gln Ala Ala Ile Thr Thr Ser Asn Cys
2120 2125 2130
Ala Lys Arg Leu Ala Gln Arg Val Phe Asn Asn Tyr Met Pro Tyr
2135 2140 2145
Val Phe Thr Leu Leu Phe Gln Leu Cys Thr Phe Thr Lys Ser Thr
2150 2155 2160
Asn Ser Arg Ile Arg Ala Ser Leu Pro Thr Thr Ile Ala Lys Asn
2165 2170 2175
Ser Val Lys Ser Val Ala Lys Leu Cys Leu Asp Ala Gly Ile Asn
2180 2185 2190
Tyr Val Lys Ser Pro Lys Phe Ser Lys Leu Phe Thr Ile Ala Met
2195 2200 2205
Trp Leu Leu Leu Leu Ser Ile Cys Leu Gly Ser Leu Ile Cys Val
2210 2215 2220
Thr Ala Ala Phe Gly Val Leu Leu Ser Asn Phe Gly Ala Pro Ser
2225 2230 2235
Tyr Cys Asn Gly Val Arg Glu Leu Tyr Leu Asn Ser Ser Asn Val
2240 2245 2250
Thr Thr Met Asp Phe Cys Glu Gly Ser Phe Pro Cys Ser Ile Cys
2255 2260 2265
Leu Ser Gly Leu Asp Ser Leu Asp Ser Tyr Pro Ala Leu Glu Thr
2270 2275 2280
Ile Gln Val Thr Ile Ser Ser Tyr Lys Leu Asp Leu Thr Ile Leu
2285 2290 2295
Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys
2300 2305 2310
Phe Phe Tyr Leu Leu Gly Leu Ser Ala Ile Met Gln Val Phe Phe
2315 2320 2325
Gly Tyr Phe Ala Ser His Phe Ile Ser Asn Ser Trp Leu Met Trp
2330 2335 2340
Phe Ile Ile Ser Ile Val Gln Met Ala Pro Val Ser Ala Met Val
2345 2350 2355
Arg Met Tyr Ile Phe Phe Ala Ser Phe Tyr Tyr Ile Trp Lys Ser
2360 2365 2370
Tyr Val His Ile Met Asp Gly Cys Thr Ser Ser Thr Cys Met Met
2375 2380 2385
Cys Tyr Lys Arg Asn Arg Ala Thr Arg Val Glu Cys Thr Thr Ile
2390 2395 2400
Val Asn Gly Met Lys Arg Ser Phe Tyr Val Tyr Ala Asn Gly Gly
2405 2410 2415
Arg Gly Phe Cys Lys Thr His Asn Trp Asn Cys Leu Asn Cys Asp
2420 2425 2430
Thr Phe Cys Thr Gly Ser Thr Phe Ile Ser Asp Glu Val Ala Arg
2435 2440 2445
Asp Leu Ser Leu Gln Phe Lys Arg Pro Ile Asn Pro Thr Asp Gln
2450 2455 2460
Ser Ser Tyr Ile Val Asp Ser Val Ala Val Lys Asn Gly Ala Leu
2465 2470 2475
His Leu Tyr Phe Asp Lys Ala Gly Gln Lys Thr Tyr Glu Arg His
2480 2485 2490
Pro Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg Ala Asn Asn
2495 2500 2505
Thr Lys Gly Ser Leu Pro Ile Asn Val Ile Val Phe Asp Gly Lys
2510 2515 2520
Ser Lys Cys Asp Glu Ser Ala Ser Lys Ser Ala Ser Val Tyr Tyr
2525 2530 2535
Ser Gln Leu Met Cys Gln Pro Ile Leu Leu Leu Asp Gln Ala Leu
2540 2545 2550
Val Ser Asp Val Gly Asp Ser Thr Glu Val Ser Val Lys Met Phe
2555 2560 2565
Asp Ala Tyr Val Asp Thr Phe Ser Ala Thr Phe Ser Val Pro Met
2570 2575 2580
Glu Lys Leu Lys Ala Leu Val Ala Thr Ala His Ser Glu Leu Ala
2585 2590 2595
Lys Gly Val Ala Leu Asp Gly Val Leu Ser Thr Phe Val Ser Ala
2600 2605 2610
Ala Arg Gln Gly Val Val Asp Thr Asp Val Asp Thr Lys Asp Val
2615 2620 2625
Ile Glu Cys Leu Lys Leu Ser His His Ser Asp Leu Glu Val Thr
2630 2635 2640
Gly Asp Ser Cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu
2645 2650 2655
Asn Met Thr Pro Arg Asp Leu Gly Ala Cys Ile Asp Cys Asn Ala
2660 2665 2670
Arg His Ile Asn Ala Gln Val Ala Lys Ser His Asn Val Ser Leu
2675 2680 2685
Ile Trp Asn Val Lys Asp Tyr Met Ser Leu Ser Glu Gln Leu Arg
2690 2695 2700
Lys Gln Ile Arg Ser Ala Ala Lys Lys Asn Asn Ile Pro Phe Arg
2705 2710 2715
Leu Thr Cys Ala Thr Thr Arg Gln Val Val Asn Val Ile Thr Thr
2720 2725 2730
Lys Ile Ser Leu Lys Gly Gly Lys Ile Val Ser Thr Cys Phe Lys
2735 2740 2745
Leu Met Leu Lys Ala Thr Leu Leu Cys Val Leu Ala Ala Leu Val
2750 2755 2760
Cys Tyr Ile Val Met Pro Val His Thr Leu Ser Ile His Asp Gly
2765 2770 2775
Tyr Thr Asn Glu Ile Ile Gly Tyr Lys Ala Ile Gln Asp Gly Val
2780 2785 2790
Thr Arg Asp Ile Ile Ser Thr Asp Asp Cys Phe Ala Asn Lys His
2795 2800 2805
Ala Gly Phe Asp Ala Trp Phe Ser Gln Arg Gly Gly Ser Tyr Lys
2810 2815 2820
Asn Asp Lys Ser Cys Pro Val Val Ala Ala Ile Ile Thr Arg Glu
2825 2830 2835
Ile Gly Phe Ile Val Pro Gly Leu Pro Gly Thr Val Leu Arg Ala
2840 2845 2850
Ile Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala
2855 2860 2865
Val Gly Asn Ile Cys Tyr Thr Pro Ser Lys Leu Ile Glu Tyr Ser
2870 2875 2880
Asp Phe Ala Thr Ser Ala Cys Val Leu Ala Ala Glu Cys Thr Ile
2885 2890 2895
Phe Lys Asp Ala Met Gly Lys Pro Val Pro Tyr Cys Tyr Asp Thr
2900 2905 2910
Asn Leu Leu Glu Gly Ser Ile Ser Tyr Ser Glu Leu Arg Pro Asp
2915 2920 2925
Thr Arg Tyr Val Leu Met Asp Gly Ser Ile Ile Gln Phe Pro Asn
2930 2935 2940
Thr Tyr Leu Glu Gly Ser Val Arg Val Val Thr Thr Phe Asp Ala
2945 2950 2955
Glu Tyr Cys Arg His Gly Thr Cys Glu Arg Ser Glu Val Gly Ile
2960 2965 2970
Cys Leu Ser Thr Ser Gly Arg Trp Val Leu Asn Asn Glu His Tyr
2975 2980 2985
Arg Ala Leu Ser Gly Val Phe Cys Gly Val Asp Ala Met Asn Leu
2990 2995 3000
Ile Ala Asn Ile Phe Thr Pro Leu Val Gln Pro Val Gly Ala Leu
3005 3010 3015
Asp Val Ser Ala Ser Val Val Ala Gly Gly Ile Ile Ala Ile Leu
3020 3025 3030
Val Thr Cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe
3035 3040 3045
Gly Glu Tyr Asn His Val Val Ala Ala Asn Ala Leu Leu Phe Leu
3050 3055 3060
Met Ser Phe Thr Ile Leu Cys Leu Val Pro Ala Tyr Ser Phe Leu
3065 3070 3075
Pro Gly Val Tyr Ser Val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe
3080 3085 3090
Thr Asn Asp Val Ser Phe Leu Ala His Leu Gln Trp Phe Ala Met
3095 3100 3105
Phe Ser Pro Ile Val Pro Phe Trp Ile Thr Ala Ile Tyr Val Phe
3110 3115 3120
Cys Ile Ser Leu Lys His Cys His Trp Phe Phe Asn Asn Tyr Leu
3125 3130 3135
Arg Lys Arg Val Met Phe Asn Gly Val Thr Phe Ser Thr Phe Glu
3140 3145 3150
Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu
3155 3160 3165
Lys Leu Arg Ser Glu Thr Leu Leu Pro Leu Thr Gln Tyr Asn Arg
3170 3175 3180
Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe Ser Gly Ala Leu
3185 3190 3195
Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys His Leu Ala Lys
3200 3205 3210
Ala Leu Asn Asp Phe Ser Asn Ser Gly Ala Asp Val Leu Tyr Gln
3215 3220 3225
Pro Pro Gln Thr Ser Ile Thr Ser Ala Val Leu Gln Ser Gly Phe
3230 3235 3240
Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met Val
3245 3250 3255
Gln Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp
3260 3265 3270
Asp Thr Val Tyr Cys Pro Arg His Val Ile Cys Thr Ala Glu Asp
3275 3280 3285
Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu Ile Arg Lys Ser Asn
3290 3295 3300
His Ser Phe Leu Val Gln Ala Gly Asn Val Gln Leu Arg Val Ile
3305 3310 3315
Gly His Ser Met Gln Asn Cys Leu Leu Arg Leu Lys Val Asp Thr
3320 3325 3330
Ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe Val Arg Ile Gln Pro
3335 3340 3345
Gly Gln Thr Phe Ser Val Leu Ala Cys Tyr Asn Gly Ser Pro Ser
3350 3355 3360
Gly Val Tyr Gln Cys Ala Met Arg Pro Asn His Thr Ile Lys Gly
3365 3370 3375
Ser Phe Leu Asn Gly Ser Cys Gly Ser Val Gly Phe Asn Ile Asp
3380 3385 3390
Tyr Asp Cys Val Ser Phe Cys Tyr Met His His Met Glu Leu Pro
3395 3400 3405
Thr Gly Val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly
3410 3415 3420
Pro Phe Val Asp Arg Gln Thr Ala Gln Ala Ala Gly Thr Asp Thr
3425 3430 3435
Thr Ile Thr Leu Asn Val Leu Ala Trp Leu Tyr Ala Ala Val Ile
3440 3445 3450
Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn
3455 3460 3465
Asp Phe Asn Leu Val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr
3470 3475 3480
Gln Asp His Val Asp Ile Leu Gly Pro Leu Ser Ala Gln Thr Gly
3485 3490 3495
Ile Ala Val Leu Asp Met Cys Ala Ala Leu Lys Glu Leu Leu Gln
3500 3505 3510
Asn Gly Met Asn Gly Arg Thr Ile Leu Gly Ser Thr Ile Leu Glu
3515 3520 3525
Asp Glu Phe Thr Pro Phe Asp Val Val Arg Gln Cys Ser Gly Val
3530 3535 3540
Thr Phe Gln Gly Lys Phe Lys Lys Ile Val Lys Gly Thr His His
3545 3550 3555
Trp Met Leu Leu Thr Phe Leu Thr Ser Leu Leu Ile Leu Val Gln
3560 3565 3570
Ser Thr Gln Trp Ser Leu Phe Phe Phe Val Tyr Glu Asn Ala Phe
3575 3580 3585
Leu Pro Phe Thr Leu Gly Ile Met Ala Ile Ala Ala Cys Ala Met
3590 3595 3600
Leu Leu Val Lys His Lys His Ala Phe Leu Cys Leu Phe Leu Leu
3605 3610 3615
Pro Ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro
3620 3625 3630
Ala Ser Trp Val Met Arg Ile Met Thr Trp Leu Glu Leu Ala Asp
3635 3640 3645
Thr Ser Leu Ser Gly Tyr Arg Leu Lys Asp Cys Val Met Tyr Ala
3650 3655 3660
Ser Ala Leu Val Leu Leu Ile Leu Met Thr Ala Arg Thr Val Tyr
3665 3670 3675
Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn Val Ile Thr
3680 3685 3690
Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp Gln Ala Ile
3695 3700 3705
Ser Met Trp Ala Leu Val Ile Ser Val Thr Ser Asn Tyr Ser Gly
3710 3715 3720
Val Val Thr Thr Ile Met Phe Leu Ala Arg Ala Ile Val Phe Val
3725 3730 3735
Cys Val Glu Tyr Tyr Pro Leu Leu Phe Ile Thr Gly Asn Thr Leu
3740 3745 3750
Gln Cys Ile Met Leu Val Tyr Cys Phe Leu Gly Tyr Cys Cys Cys
3755 3760 3765
Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu
3770 3775 3780
Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser Thr Gln Glu Phe Arg
3785 3790 3795
Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro Lys Ser Ser Ile Asp
3800 3805 3810
Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly Ile Gly Gly Lys Pro
3815 3820 3825
Cys Ile Lys Val Ala Thr Val Gln Ser Lys Met Ser Asp Val Lys
3830 3835 3840
Cys Thr Ser Val Val Leu Leu Ser Val Leu Gln Gln Leu Arg Val
3845 3850 3855
Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn
3860 3865 3870
Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met
3875 3880 3885
Val Ser Leu Leu Ser Val Leu Leu Ser Met Gln Gly Ala Val Asp
3890 3895 3900
Ile Asn Arg Leu Cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu
3905 3910 3915
Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu Pro Ser Tyr Ala Ala
3920 3925 3930
Tyr Ala Thr Ala Gln Glu Ala Tyr Glu Gln Ala Val Ala Asn Gly
3935 3940 3945
Asp Ser Glu Val Val Leu Lys Lys Leu Lys Lys Ser Leu Asn Val
3950 3955 3960
Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala Met Gln Arg Lys Leu
3965 3970 3975
Glu Lys Met Ala Asp Gln Ala Met Thr Gln Met Tyr Lys Gln Ala
3980 3985 3990
Arg Ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gln Thr
3995 4000 4005
Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn
4010 4015 4020
Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn Ile
4025 4030 4035
Ile Pro Leu Thr Thr Ala Ala Lys Leu Met Val Val Val Pro Asp
4040 4045 4050
Tyr Gly Thr Tyr Lys Asn Thr Cys Asp Gly Asn Thr Phe Thr Tyr
4055 4060 4065
Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp Ser
4070 4075 4080
Lys Ile Val Gln Leu Ser Glu Ile Asn Met Asp Asn Ser Pro Asn
4085 4090 4095
Leu Ala Trp Pro Leu Ile Val Thr Ala Leu Arg Ala Asn Ser Ala
4100 4105 4110
Val Lys Leu Gln Asn Asn Glu Leu Ser Pro Val Ala Leu Arg Gln
4115 4120 4125
Met Ser Cys Ala Ala Gly Thr Thr Gln Thr Ala Cys Thr Asp Asp
4130 4135 4140
Asn Ala Leu Ala Tyr Tyr Asn Asn Ser Lys Gly Gly Arg Phe Val
4145 4150 4155
Leu Ala Leu Leu Ser Asp His Gln Asp Leu Lys Trp Ala Arg Phe
4160 4165 4170
Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu Leu Glu Pro
4175 4180 4185
Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys
4190 4195 4200
Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn Leu Asn Arg Gly Met
4205 4210 4215
Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gln Ala Gly Asn
4220 4225 4230
Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu Ser Phe Cys Ala
4235 4240 4245
Phe Ala Val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser
4250 4255 4260
Gly Gly Gln Pro Ile Thr Asn Cys Val Lys Met Leu Cys Thr His
4265 4270 4275
Thr Gly Thr Gly Gln Ala Ile Thr Val Thr Pro Glu Ala Asn Met
4280 4285 4290
Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg
4295 4300 4305
Cys His Ile Asp His Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys
4310 4315 4320
Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys Ala Asn Asp Pro Val
4325 4330 4335
Gly Phe Thr Leu Arg Asn Thr Val Cys Thr Val Cys Gly Met Trp
4340 4345 4350
Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu Arg Glu Pro Leu Met
4355 4360 4365
Gln Ser Ala Asp Ala Ser Thr Phe Leu Asn Arg Val Cys Gly Val
4370 4375 4380
Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr Gly Thr Ser Thr Asp
4385 4390 4395
Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn Glu Lys Val Ala Gly
4400 4405 4410
Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe Gln Glu Lys
4415 4420 4425
Asp Glu Glu Gly Asn Leu Leu Asp Ser Tyr Phe Val Val Lys Arg
4430 4435 4440
His Thr Met Ser Asn Tyr Gln His Glu Glu Thr Ile Tyr Asn Leu
4445 4450 4455
Val Lys Asp Cys Pro Ala Val Ala Val His Asp Phe Phe Lys Phe
4460 4465 4470
Arg Val Asp Gly Asp Met Val Pro His Ile Ser Arg Gln Arg Leu
4475 4480 4485
Thr Lys Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe
4490 4495 4500
Asp Glu Gly Asn Cys Asp Thr Leu Lys Glu Ile Leu Val Thr Tyr
4505 4510 4515
Asn Cys Cys Asp Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp
4520 4525 4530
Phe Val Glu Asn Pro Asp Ile Leu Arg Val Tyr Ala Asn Leu Gly
4535 4540 4545
Glu Arg Val Arg Gln Ser Leu Leu Lys Thr Val Gln Phe Cys Asp
4550 4555 4560
Ala Met Arg Asp Ala Gly Ile Val Gly Val Leu Thr Leu Asp Asn
4565 4570 4575
Gln Asp Leu Asn Gly Asn Trp Tyr Asp Phe Gly Asp Phe Val Gln
4580 4585 4590
Val Ala Pro Gly Cys Gly Val Pro Ile Val Asp Ser Tyr Tyr Ser
4595 4600 4605
Leu Leu Met Pro Ile Leu Thr Leu Thr Arg Ala Leu Ala Ala Glu
4610 4615 4620
Ser His Met Asp Ala Asp Leu Ala Lys Pro Leu Ile Lys Trp Asp
4625 4630 4635
Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu Cys Leu Phe Asp
4640 4645 4650
Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr His Pro Asn Cys Ile
4655 4660 4665
Asn Cys Leu Asp Asp Arg Cys Ile Leu His Cys Ala Asn Phe Asn
4670 4675 4680
Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro Leu
4685 4690 4695
Val Arg Lys Ile Phe Val Asp Gly Val Pro Phe Val Val Ser Thr
4700 4705 4710
Gly Tyr His Phe Arg Glu Leu Gly Val Val His Asn Gln Asp Val
4715 4720 4725
Asn Leu His Ser Ser Arg Leu Ser Phe Lys Glu Leu Leu Val Tyr
4730 4735 4740
Ala Ala Asp Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu
4745 4750 4755
Asp Lys Arg Thr Thr Cys Phe Ser Val Ala Ala Leu Thr Asn Asn
4760 4765 4770
Val Ala Phe Gln Thr Val Lys Pro Gly Asn Phe Asn Lys Asp Phe
4775 4780 4785
Tyr Asp Phe Ala Val Ser Lys Gly Phe Phe Lys Glu Gly Ser Ser
4790 4795 4800
Val Glu Leu Lys His Phe Phe Phe Ala Gln Asp Gly Asn Ala Ala
4805 4810 4815
Ile Ser Asp Tyr Asp Tyr Tyr Arg Tyr Asn Leu Pro Thr Met Cys
4820 4825 4830
Asp Ile Arg Gln Leu Leu Phe Val Val Glu Val Val Asp Lys Tyr
4835 4840 4845
Phe Asp Cys Tyr Asp Gly Gly Cys Ile Asn Ala Asn Gln Val Ile
4850 4855 4860
Val Asn Asn Leu Asp Lys Ser Ala Gly Phe Pro Phe Asn Lys Trp
4865 4870 4875
Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met Ser Tyr Glu Asp Gln
4880 4885 4890
Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val Ile Pro Thr Ile
4895 4900 4905
Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn Arg Ala
4910 4915 4920
Arg Thr Val Ala Gly Val Ser Ile Cys Ser Thr Met Thr Asn Arg
4925 4930 4935
Gln Phe His Gln Lys Leu Leu Lys Ser Ile Ala Ala Thr Arg Gly
4940 4945 4950
Ala Thr Val Val Ile Gly Thr Ser Lys Phe Tyr Gly Gly Trp His
4955 4960 4965
Asn Met Leu Lys Thr Val Tyr Ser Asp Val Glu Thr Pro His Leu
4970 4975 4980
Met Gly Trp Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Met
4985 4990 4995
Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg Lys His Asn Thr
5000 5005 5010
Cys Cys Asn Leu Ser His Arg Phe Tyr Arg Leu Ala Asn Glu Cys
5015 5020 5025
Ala Gln Val Leu Ser Glu Met Val Met Cys Gly Gly Ser Leu Tyr
5030 5035 5040
Val Lys Pro Gly Gly Thr Ser Ser Gly Asp Ala Thr Thr Ala Tyr
5045 5050 5055
Ala Asn Ser Val Phe Asn Ile Cys Gln Ala Val Thr Ala Asn Val
5060 5065 5070
Asn Ala Leu Leu Ser Thr Asp Gly Asn Lys Ile Ala Asp Lys Tyr
5075 5080 5085
Val Arg Asn Leu Gln His Arg Leu Tyr Glu Cys Leu Tyr Arg Asn
5090 5095 5100
Arg Asp Val Asp His Glu Phe Val Asp Glu Phe Tyr Ala Tyr Leu
5105 5110 5115
Arg Lys His Phe Ser Met Met Ile Leu Ser Asp Asp Ala Val Val
5120 5125 5130
Cys Tyr Asn Ser Asn Tyr Ala Ala Gln Gly Leu Val Ala Ser Ile
5135 5140 5145
Lys Asn Phe Lys Ala Val Leu Tyr Tyr Gln Asn Asn Val Phe Met
5150 5155 5160
Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro
5165 5170 5175
His Glu Phe Cys Ser Gln His Thr Met Leu Val Lys Gln Gly Asp
5180 5185 5190
Asp Tyr Val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly
5195 5200 5205
Ala Gly Cys Phe Val Asp Asp Ile Val Lys Thr Asp Gly Thr Leu
5210 5215 5220
Met Ile Glu Arg Phe Val Ser Leu Ala Ile Asp Ala Tyr Pro Leu
5225 5230 5235
Thr Lys His Pro Asn Gln Glu Tyr Ala Asp Val Phe His Leu Tyr
5240 5245 5250
Leu Gln Tyr Ile Arg Lys Leu His Asp Glu Leu Thr Gly His Met
5255 5260 5265
Leu Asp Met Tyr Ser Val Met Leu Thr Asn Asp Asn Thr Ser Arg
5270 5275 5280
Tyr Trp Glu Pro Glu Phe Tyr Glu Ala Met Tyr Thr Pro His Thr
5285 5290 5295
Val Leu Gln Ala Val Gly Ala Cys Val Leu Cys Asn Ser Gln Thr
5300 5305 5310
Ser Leu Arg Cys Gly Ala Cys Ile Arg Arg Pro Phe Leu Cys Cys
5315 5320 5325
Lys Cys Cys Tyr Asp His Val Ile Ser Thr Ser His Lys Leu Val
5330 5335 5340
Leu Ser Val Asn Pro Tyr Val Cys Asn Ala Pro Gly Cys Asp Val
5345 5350 5355
Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly Met Ser Tyr Tyr Cys
5360 5365 5370
Lys Ser His Lys Pro Pro Ile Ser Phe Pro Leu Cys Ala Asn Gly
5375 5380 5385
Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys Val Gly Ser Asp Asn
5390 5395 5400
Val Thr Asp Phe Asn Ala Ile Ala Thr Cys Asp Trp Thr Asn Ala
5405 5410 5415
Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr Glu Arg Leu Lys Leu
5420 5425 5430
Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe Lys Leu
5435 5440 5445
Ser Tyr Gly Ile Ala Thr Val Arg Glu Val Leu Ser Asp Arg Glu
5450 5455 5460
Leu His Leu Ser Trp Glu Val Gly Lys Pro Arg Pro Pro Leu Asn
5465 5470 5475
Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val Thr Lys Asn Ser Lys
5480 5485 5490
Val Gln Ile Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr Gly Asp
5495 5500 5505
Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn Val Gly
5510 5515 5520
Asp Tyr Phe Val Leu Thr Ser His Thr Val Met Pro Leu Ser Ala
5525 5530 5535
Pro Thr Leu Val Pro Gln Glu His Tyr Val Arg Ile Thr Gly Leu
5540 5545 5550
Tyr Pro Thr Leu Asn Ile Ser Asp Glu Phe Ser Ser Asn Val Ala
5555 5560 5565
Asn Tyr Gln Lys Val Gly Met Gln Lys Tyr Ser Thr Leu Gln Gly
5570 5575 5580
Pro Pro Gly Thr Gly Lys Ser His Phe Ala Ile Gly Leu Ala Leu
5585 5590 5595
Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr Ala Cys Ser His Ala
5600 5605 5610
Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu Pro Ile
5615 5620 5625
Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg Ala Arg Val Glu Cys
5630 5635 5640
Phe Asp Lys Phe Lys Val Asn Ser Thr Leu Glu Gln Tyr Val Phe
5645 5650 5655
Cys Thr Val Asn Ala Leu Pro Glu Thr Thr Ala Asp Ile Val Val
5660 5665 5670
Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr Asp Leu Ser Val Val
5675 5680 5685
Asn Ala Arg Leu Arg Ala Lys His Tyr Val Tyr Ile Gly Asp Pro
5690 5695 5700
Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly Thr Leu
5705 5710 5715
Glu Pro Glu Tyr Phe Asn Ser Val Cys Arg Leu Met Lys Thr Ile
5720 5725 5730
Gly Pro Asp Met Phe Leu Gly Thr Cys Arg Arg Cys Pro Ala Glu
5735 5740 5745
Ile Val Asp Thr Val Ser Ala Leu Val Tyr Asp Asn Lys Leu Lys
5750 5755 5760
Ala His Lys Asp Lys Ser Ala Gln Cys Phe Lys Met Phe Tyr Lys
5765 5770 5775
Gly Val Ile Thr His Asp Val Ser Ser Ala Ile Asn Arg Pro Gln
5780 5785 5790
Ile Gly Val Val Arg Glu Phe Leu Thr Arg Asn Pro Ala Trp Arg
5795 5800 5805
Lys Ala Val Phe Ile Ser Pro Tyr Asn Ser Gln Asn Ala Val Ala
5810 5815 5820
Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr Val Asp Ser Ser Gln
5825 5830 5835
Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr Gln Thr Thr Glu Thr
5840 5845 5850
Ala His Ser Cys Asn Val Asn Arg Phe Asn Val Ala Ile Thr Arg
5855 5860 5865
Ala Lys Ile Gly Ile Leu Cys Ile Met Ser Asp Arg Asp Leu Tyr
5870 5875 5880
Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile Pro Arg Arg Asn Val
5885 5890 5895
Ala Thr Leu Gln Ala Glu Asn Val Thr Gly Leu Phe Lys Asp Cys
5900 5905 5910
Ser Lys Ile Ile Thr Gly Leu His Pro Thr Gln Ala Pro Thr His
5915 5920 5925
Leu Ser Val Asp Ile Lys Phe Lys Thr Glu Gly Leu Cys Val Asp
5930 5935 5940
Ile Pro Gly Ile Pro Lys Asp Met Thr Tyr Arg Arg Leu Ile Ser
5945 5950 5955
Met Met Gly Phe Lys Met Asn Tyr Gln Val Asn Gly Tyr Pro Asn
5960 5965 5970
Met Phe Ile Thr Arg Glu Glu Ala Ile Arg His Val Arg Ala Trp
5975 5980 5985
Ile Gly Phe Asp Val Glu Gly Cys His Ala Thr Arg Asp Ala Val
5990 5995 6000
Gly Thr Asn Leu Pro Leu Gln Leu Gly Phe Ser Thr Gly Val Asn
6005 6010 6015
Leu Val Ala Val Pro Thr Gly Tyr Val Asp Thr Glu Asn Asn Thr
6020 6025 6030
Glu Phe Thr Arg Val Asn Ala Lys Pro Pro Pro Gly Asp Gln Phe
6035 6040 6045
Lys His Leu Ile Pro Leu Met Tyr Lys Gly Leu Pro Trp Asn Val
6050 6055 6060
Val Arg Ile Lys Ile Val Gln Met Leu Ser Asp Thr Leu Lys Gly
6065 6070 6075
Leu Ser Asp Arg Val Val Phe Val Leu Trp Ala His Gly Phe Glu
6080 6085 6090
Leu Thr Ser Met Lys Tyr Phe Val Lys Ile Gly Pro Glu Arg Thr
6095 6100 6105
Cys Cys Leu Cys Asp Lys Arg Ala Thr Cys Phe Ser Thr Ser Ser
6110 6115 6120
Asp Thr Tyr Ala Cys Trp Asn His Ser Val Gly Phe Asp Tyr Val
6125 6130 6135
Tyr Asn Pro Phe Met Ile Asp Val Gln Gln Trp Gly Phe Thr Gly
6140 6145 6150
Asn Leu Gln Ser Asn His Asp Gln His Cys Gln Val His Gly Asn
6155 6160 6165
Ala His Val Ala Ser Cys Asp Ala Ile Met Thr Arg Cys Leu Ala
6170 6175 6180
Val His Glu Cys Phe Val Lys Arg Val Asp Trp Ser Val Glu Tyr
6185 6190 6195
Pro Ile Ile Gly Asp Glu Leu Arg Val Asn Ser Ala Cys Arg Lys
6200 6205 6210
Val Gln His Met Val Val Lys Ser Ala Leu Leu Ala Asp Lys Phe
6215 6220 6225
Pro Val Leu His Asp Ile Gly Asn Pro Lys Ala Ile Lys Cys Val
6230 6235 6240
Pro Gln Ala Glu Val Glu Trp Lys Phe Tyr Asp Ala Gln Pro Cys
6245 6250 6255
Ser Asp Lys Ala Tyr Lys Ile Glu Glu Leu Phe Tyr Ser Tyr Ala
6260 6265 6270
Thr His His Asp Lys Phe Thr Asp Gly Val Cys Leu Phe Trp Asn
6275 6280 6285
Cys Asn Val Asp Arg Tyr Pro Ala Asn Ala Ile Val Cys Arg Phe
6290 6295 6300
Asp Thr Arg Val Leu Ser Asn Leu Asn Leu Pro Gly Cys Asp Gly
6305 6310 6315
Gly Ser Leu Tyr Val Asn Lys His Ala Phe His Thr Pro Ala Phe
6320 6325 6330
Asp Lys Ser Ala Phe Thr Asn Leu Lys Gln Leu Pro Phe Phe Tyr
6335 6340 6345
Tyr Ser Asp Ser Pro Cys Glu Ser His Gly Lys Gln Val Val Ser
6350 6355 6360
Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala Thr Cys Ile Thr Arg
6365 6370 6375
Cys Asn Leu Gly Gly Ala Val Cys Arg His His Ala Asn Glu Tyr
6380 6385 6390
Arg Gln Tyr Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe
6395 6400 6405
Ser Leu Trp Ile Tyr Lys Gln Phe Asp Thr Tyr Asn Leu Trp Asn
6410 6415 6420
Thr Phe Thr Arg Leu Gln Ser Leu Glu Asn Val Ala Tyr Asn Val
6425 6430 6435
Val Asn Lys Gly His Phe Asp Gly His Ala Gly Glu Ala Pro Val
6440 6445 6450
Ser Ile Ile Asn Asn Ala Val Tyr Thr Lys Val Asp Gly Ile Asp
6455 6460 6465
Val Glu Ile Phe Glu Asn Lys Thr Thr Leu Pro Val Asn Val Ala
6470 6475 6480
Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys Pro Val Pro Glu Ile
6485 6490 6495
Lys Ile Leu Asn Asn Leu Gly Val Asp Ile Ala Ala Asn Thr Val
6500 6505 6510
Ile Trp Asp Tyr Lys Arg Glu Ala Pro Ala His Val Ser Thr Ile
6515 6520 6525
Gly Val Cys Thr Met Thr Asp Ile Ala Lys Lys Pro Thr Glu Ser
6530 6535 6540
Ala Cys Ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val Glu Gly
6545 6550 6555
Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu Ile Thr
6560 6565 6570
Glu Gly Ser Val Lys Gly Leu Thr Pro Ser Lys Gly Pro Ala Gln
6575 6580 6585
Ala Ser Val Asn Gly Val Thr Leu Ile Gly Glu Ser Val Lys Thr
6590 6595 6600
Gln Phe Asn Tyr Phe Lys Lys Val Asp Gly Ile Ile Gln Gln Leu
6605 6610 6615
Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asp Leu Glu Asp Phe Lys
6620 6625 6630
Pro Arg Ser Gln Met Glu Thr Asp Phe Leu Glu Leu Ala Met Asp
6635 6640 6645
Glu Phe Ile Gln Arg Tyr Lys Leu Glu Gly Tyr Ala Phe Glu His
6650 6655 6660
Ile Val Tyr Gly Asp Phe Ser His Gly Gln Leu Gly Gly Leu His
6665 6670 6675
Leu Met Ile Gly Leu Ala Lys Arg Ser Gln Asp Ser Pro Leu Lys
6680 6685 6690
Leu Glu Asp Phe Ile Pro Met Asp Ser Thr Val Lys Asn Tyr Phe
6695 6700 6705
Ile Thr Asp Ala Gln Thr Gly Ser Ser Lys Cys Val Cys Ser Val
6710 6715 6720
Ile Asp Leu Leu Leu Asp Asp Phe Val Glu Ile Ile Lys Ser Gln
6725 6730 6735
Asp Leu Ser Val Ile Ser Lys Val Val Lys Val Thr Ile Asp Tyr
6740 6745 6750
Ala Glu Ile Ser Phe Met Leu Trp Cys Lys Asp Gly His Val Glu
6755 6760 6765
Thr Phe Tyr Pro Lys Leu Gln Ala Ser Gln Ala Trp Gln Pro Gly
6770 6775 6780
Val Ala Met Pro Asn Leu Tyr Lys Met Gln Arg Met Leu Leu Glu
6785 6790 6795
Lys Cys Asp Leu Gln Asn Tyr Gly Glu Asn Ala Val Ile Pro Lys
6800 6805 6810
Gly Ile Met Met Asn Val Ala Lys Tyr Thr Gln Leu Cys Gln Tyr
6815 6820 6825
Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg Val Ile
6830 6835 6840
His Phe Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly Thr Ala
6845 6850 6855
Val Leu Arg Gln Trp Leu Pro Thr Gly Thr Leu Leu Val Asp Ser
6860 6865 6870
Asp Leu Asn Asp Phe Val Ser Asp Ala Asp Ser Thr Leu Ile Gly
6875 6880 6885
Asp Cys Ala Thr Val His Thr Ala Asn Lys Trp Asp Leu Ile Ile
6890 6895 6900
Ser Asp Met Tyr Asp Pro Arg Thr Lys His Val Thr Lys Glu Asn
6905 6910 6915
Asp Ser Lys Glu Gly Phe Phe Thr Tyr Leu Cys Gly Phe Ile Lys
6920 6925 6930
Gln Lys Leu Ala Leu Gly Gly Ser Ile Ala Val Lys Ile Thr Glu
6935 6940 6945
His Ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His Phe Ser
6950 6955 6960
Trp Trp Thr Ala Phe Val Thr Asn Val Asn Ala Ser Ser Ser Glu
6965 6970 6975
Ala Phe Leu Ile Gly Ala Asn Tyr Leu Gly Lys Pro Lys Glu Gln
6980 6985 6990
Ile Asp Gly Tyr Thr Met His Ala Asn Tyr Ile Phe Trp Arg Asn
6995 7000 7005
Thr Asn Pro Ile Gln Leu Ser Ser Tyr Ser Leu Phe Asp Met Ser
7010 7015 7020
Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala Val Met Ser Leu Lys
7025 7030 7035
Glu Asn Gln Ile Asn Asp Met Ile Tyr Ser Leu Leu Glu Lys Gly
7040 7045 7050
Arg Leu Ile Ile Arg Glu Asn Asn Arg Val Val Val Ser Ser Asp
7055 7060 7065
Ile Leu Val Asn Asn
7070
<210> 13
<211> 4405
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC1 R1A_SARS2
<400> 13
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Gly Phe Ala Val
4400 4405
<210> 14
<211> 7096
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTD1 R1AB_SARS2
<400> 14
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro
4400 4405 4410
Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp
4415 4420 4425
Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr
4430 4435 4440
Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile
4445 4450 4455
Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln
4460 4465 4470
His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val
4475 4480 4485
Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val
4490 4495 4500
Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp
4505 4510 4515
Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr
4520 4525 4530
Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr
4535 4540 4545
Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile
4550 4555 4560
Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu
4565 4570 4575
Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile
4580 4585 4590
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val
4610 4615 4620
Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr
4625 4630 4635
Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu
4640 4645 4650
Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr
4655 4660 4665
Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp
4670 4675 4680
Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys
4685 4690 4695
Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe
4700 4705 4710
Pro Pro Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp
4715 4720 4725
Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu
4730 4735 4740
Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu
4745 4750 4755
Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His
4760 4765 4770
Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe
4775 4780 4785
Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys
4790 4795 4800
Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys
4805 4810 4815
Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
4820 4825 4830
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe
4850 4855 4860
Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly
4865 4870 4875
Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser
4880 4885 4890
Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr
4895 4900 4905
Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr
4910 4915 4920
Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr
4925 4930 4935
Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser
4940 4945 4950
Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu
4955 4960 4965
Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr
4970 4975 4980
Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr
4985 4990 4995
Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys
5000 5005 5010
Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu
5015 5020 5025
Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg
5030 5035 5040
Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met
5045 5050 5055
Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
5060 5065 5070
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp
5090 5095 5100
Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg
5105 5110 5115
Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe
5120 5125 5130
Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met
5135 5140 5145
Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala
5150 5155 5160
Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu
5165 5170 5175
Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr
5180 5185 5190
Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His
5195 5200 5205
Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr
5210 5215 5220
Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp
5225 5230 5235
Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser
5240 5245 5250
Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu
5255 5260 5265
Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu
5270 5275 5280
His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met
5285 5290 5295
Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
5300 5305 5310
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys
5330 5335 5340
Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val
5345 5350 5355
Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val
5360 5365 5370
Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr
5375 5380 5385
Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile
5390 5395 5400
Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys
5405 5410 5415
Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile
5420 5425 5430
Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn
5435 5440 5445
Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys
5450 5455 5460
Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val
5465 5470 5475
Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val
5480 5485 5490
Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly
5495 5500 5505
Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr
5510 5515 5520
Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr
5525 5530 5535
Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser
5540 5545 5550
His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser
5570 5575 5580
Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met
5585 5590 5595
Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser
5600 5605 5610
His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile
5615 5620 5625
Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu
5630 5635 5640
Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile
5645 5650 5655
Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn
5660 5665 5670
Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro
5675 5680 5685
Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala
5690 5695 5700
Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys
5705 5710 5715
His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg
5720 5725 5730
Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser
5735 5740 5745
Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly
5750 5755 5760
Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala
5765 5770 5775
Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala
5780 5785 5790
Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe
5810 5815 5820
Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro
5825 5830 5835
Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro
5840 5845 5850
Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val
5855 5860 5865
Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn
5870 5875 5880
Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys
5885 5890 5895
Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser
5900 5905 5910
Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn
5915 5920 5925
Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu
5930 5935 5940
His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe
5945 5950 5955
Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp
5960 5965 5970
Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn
5975 5980 5985
Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu
5990 5995 6000
Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly
6005 6010 6015
Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln
6020 6025 6030
Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala
6050 6055 6060
Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met
6065 6070 6075
Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln
6080 6085 6090
Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe
6095 6100 6105
Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe
6110 6115 6120
Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg
6125 6130 6135
Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His
6140 6145 6150
His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp
6155 6160 6165
Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp
6170 6175 6180
Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp
6185 6190 6195
Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys
6200 6205 6210
Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu
6215 6220 6225
Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys
6230 6235 6240
Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly
6245 6250 6255
Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp
6260 6265 6270
Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr
6290 6295 6300
Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro
6305 6310 6315
Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn
6320 6325 6330
Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys
6335 6340 6345
His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn
6350 6355 6360
Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu
6365 6370 6375
Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu
6380 6385 6390
Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val
6395 6400 6405
Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr
6410 6415 6420
Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln
6425 6430 6435
Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser
6440 6445 6450
Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp
6455 6460 6465
Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val
6470 6475 6480
Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys
6485 6490 6495
Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg
6500 6505 6510
Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp
6530 6535 6540
Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp
6545 6550 6555
Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val
6560 6565 6570
Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn
6575 6580 6585
Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu
6590 6595 6600
Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr
6605 6610 6615
Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys
6620 6625 6630
Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln
6635 6640 6645
Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile
6650 6655 6660
Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys
6665 6670 6675
Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser
6680 6685 6690
His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys
6695 6700 6705
Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met
6710 6715 6720
Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly
6725 6730 6735
Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp
6740 6745 6750
Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu
6770 6775 6780
Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln
6785 6790 6795
Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr
6800 6805 6810
Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr
6815 6820 6825
Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala
6830 6835 6840
Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala
6845 6850 6855
Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp
6860 6865 6870
Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro
6875 6880 6885
Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser
6890 6895 6900
Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr
6905 6910 6915
Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys
6920 6925 6930
Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe
6935 6940 6945
Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly
6950 6955 6960
Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu
6965 6970 6975
Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr
6980 6985 6990
Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn
6995 7000 7005
Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His
7010 7015 7020
Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser
7025 7030 7035
Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg
7040 7045 7050
Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met
7055 7060 7065
Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn
7070 7075 7080
Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090 7095
<210> 15
<211> 1273
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC2 SPIKE_SARS2
<400> 15
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 16
<211> 1255
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59594 SPIKE_CVHSA
<400> 16
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
20 25 30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
35 40 45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
50 55 60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65 70 75 80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
85 90 95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
100 105 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
115 120 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
130 135 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145 150 155 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
165 170 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
180 185 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
195 200 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
210 215 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225 230 235 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
245 250 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
275 280 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
325 330 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
435 440 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
450 455 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465 470 475 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
530 535 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545 550 555 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
580 585 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
610 615 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
660 665 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
675 680 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
690 695 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705 710 715 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
725 730 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
740 745 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
755 760 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
770 775 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785 790 795 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
805 810 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
820 825 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
835 840 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
850 855 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865 870 875 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
885 890 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
900 905 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
915 920 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
930 935 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945 950 955 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
965 970 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
980 985 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
995 1000 1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1010 1015 1020
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala
1025 1030 1035
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln
1040 1045 1050
Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys
1055 1060 1065
Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser
1070 1075 1080
Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr
1085 1090 1095
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1100 1105 1110
Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1115 1120 1125
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1130 1135 1140
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1145 1150 1155
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1160 1165 1170
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1175 1180 1185
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile
1190 1195 1200
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys
1205 1210 1215
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly
1220 1225 1230
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1235 1240 1245
Gly Val Lys Leu His Tyr Thr
1250 1255
<210> 17
<211> 422
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59595 NCAP_CVHSA
<400> 17
Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile
1 5 10 15
Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly
20 25 30
Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn
35 40 45
Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu
50 55 60
Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly
65 70 75 80
Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg
85 90 95
Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr
100 105 110
Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys
115 120 125
Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys
130 135 140
Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu
145 150 155 160
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly
165 170 175
Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg
180 185 190
Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro
195 200 205
Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu
210 215 220
Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln
225 230 235 240
Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser
245 250 255
Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr
260 265 270
Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly
275 280 285
Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln
290 295 300
Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg
305 310 315 320
Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly
325 330 335
Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile
340 345 350
Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu
355 360 365
Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro
370 375 380
Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp
385 390 395 400
Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser
405 410 415
Ala Asp Ser Thr Gln Ala
420
<210> 18
<211> 274
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59632 AP3A_CVHSA
<400> 18
Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser Ile Thr Ala Gln
1 5 10 15
Pro Val Lys Ile Asp Asn Ala Ser Pro Ala Ser Thr Val His Ala Thr
20 25 30
Ala Thr Ile Pro Leu Gln Ala Ser Leu Pro Phe Gly Trp Leu Val Ile
35 40 45
Gly Val Ala Phe Leu Ala Val Phe Gln Ser Ala Thr Lys Ile Ile Ala
50 55 60
Leu Asn Lys Arg Trp Gln Leu Ala Leu Tyr Lys Gly Phe Gln Phe Ile
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Ile Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Met Glu Ala Gln Phe Leu Tyr Leu Tyr Ala Leu Ile
100 105 110
Tyr Phe Leu Gln Cys Ile Asn Ala Cys Arg Ile Ile Met Arg Cys Trp
115 120 125
Leu Cys Trp Lys Cys Lys Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Val Cys Trp His Thr His Asn Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Asp Thr Ile Val Val Thr Glu Gly Asp Gly Ile Ser
165 170 175
Thr Pro Lys Leu Lys Glu Asp Tyr Gln Ile Gly Gly Tyr Ser Glu Asp
180 185 190
Arg His Ser Gly Val Lys Asp Tyr Val Val Val His Gly Tyr Phe Thr
195 200 205
Glu Val Tyr Tyr Gln Leu Glu Ser Thr Gln Ile Thr Thr Asp Thr Gly
210 215 220
Ile Glu Asn Ala Thr Phe Phe Ile Phe Asn Lys Leu Val Lys Asp Pro
225 230 235 240
Pro Asn Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Ala Asn
245 250 255
Pro Ala Met Asp Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser Val
260 265 270
Pro Leu
<210> 19
<211> 122
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59635 NS7A_CVHSA
<400> 19
Met Lys Ile Ile Leu Phe Leu Thr Leu Ile Val Phe Thr Ser Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Pro Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala
50 55 60
Phe Ala Cys Ala Asp Gly Thr Arg His Thr Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Gln Glu
85 90 95
Leu Tyr Ser Pro Leu Phe Leu Ile Val Ala Ala Leu Val Phe Leu Ile
100 105 110
Leu Cys Phe Thr Ile Lys Arg Lys Thr Glu
115 120
<210> 20
<211> 76
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59637 VEMP_CVHSA
<400> 20
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu Val
65 70 75
<210> 21
<211> 221
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59596 VME1_CVHSA
<400> 21
Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu
1 5 10 15
Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met
20 25 30
Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile
35 40 45
Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe
50 55 60
Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala
65 70 75 80
Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val
85 90 95
Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn
100 105 110
Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Val
115 120 125
Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile
130 135 140
Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile
145 150 155 160
Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser
165 170 175
Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe
180 185 190
Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp
195 200 205
His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 22
<211> 154
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59633 NS3B_CVHSA
<400> 22
Met Met Pro Thr Thr Leu Phe Ala Gly Thr His Ile Thr Met Thr Thr
1 5 10 15
Val Tyr His Ile Thr Val Ser Gln Ile Gln Leu Ser Leu Leu Lys Val
20 25 30
Thr Ala Phe Gln His Gln Asn Ser Lys Lys Thr Thr Lys Leu Val Val
35 40 45
Ile Leu Arg Ile Gly Thr Gln Val Leu Lys Thr Met Ser Leu Tyr Met
50 55 60
Ala Ile Ser Pro Lys Phe Thr Thr Ser Leu Ser Leu His Lys Leu Leu
65 70 75 80
Gln Thr Leu Val Leu Lys Met Leu His Ser Ser Ser Leu Thr Ser Leu
85 90 95
Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gln Ser Thr Ala Leu Gln
100 105 110
Glu Leu Leu Ile Gln Gln Trp Ile Gln Phe Met Met Ser Arg Arg Arg
115 120 125
Leu Leu Ala Cys Leu Cys Lys His Lys Lys Val Ser Thr Asn Leu Cys
130 135 140
Thr His Ser Phe Arg Lys Lys Gln Val Arg
145 150
<210> 23
<211> 63
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59634 NS6_CVHSA
<400> 23
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Ile
1 5 10 15
Ile Ile Met Arg Thr Phe Arg Ile Ala Ile Trp Asn Leu Asp Val Ile
20 25 30
Ile Ser Ser Ile Val Arg Gln Leu Phe Lys Pro Leu Thr Lys Lys Asn
35 40 45
Tyr Ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro
50 55 60
<210> 24
<211> 275
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC3 AP3A_SARS2
<400> 24
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 25
<211> 222
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC5 VME1_SARS2
<400> 25
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 26
<211> 121
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC7 NS7A_SARS2
<400> 26
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 27
<211> 419
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC9 NCAP_SARS2
<400> 27
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 28
<211> 98
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P59636 ORF9B_CVHSA
<400> 28
Met Asp Pro Asn Gln Thr Asn Val Val Pro Pro Ala Leu His Leu Val
1 5 10 15
Asp Pro Gln Ile Gln Leu Thr Ile Thr Arg Met Glu Asp Ala Met Gly
20 25 30
Gln Gly Gln Asn Ser Ala Asp Pro Lys Val Tyr Pro Ile Ile Leu Arg
35 40 45
Leu Gly Ser Gln Leu Ser Leu Ser Met Ala Arg Arg Asn Leu Asp Ser
50 55 60
Leu Glu Ala Arg Ala Phe Gln Ser Thr Pro Ile Val Val Gln Met Thr
65 70 75 80
Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr
85 90 95
Ala Lys
<210> 29
<211> 75
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC4 VEMP_SARS2
<400> 29
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 30
<211> 61
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC6 NS6_SARS2
<400> 30
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 31
<211> 121
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTC8 NS8_SARS2
<400> 31
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 32
<211> 97
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTD2 ORF9B_SARS2
<400> 32
Met Asp Pro Lys Ile Ser Glu Met His Pro Ala Leu Arg Leu Val Asp
1 5 10 15
Pro Gln Ile Gln Leu Ala Val Thr Arg Met Glu Asn Ala Val Gly Arg
20 25 30
Asp Gln Asn Asn Val Gly Pro Lys Val Tyr Pro Ile Ile Leu Arg Leu
35 40 45
Gly Ser Pro Leu Ser Leu Asn Met Ala Arg Lys Thr Leu Asn Ser Leu
50 55 60
Glu Asp Lys Ala Phe Gln Leu Thr Pro Ile Ala Val Gln Met Thr Lys
65 70 75 80
Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr Val
85 90 95
Lys
<210> 33
<211> 44
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q7TFA1 NS7B_CVHSA
<400> 33
Met Asn Glu Leu Thr Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Ile Gln Asp Leu Glu Glu Pro Cys Thr Lys Val
35 40
<210> 34
<211> 84
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q80H93 NS8B_CVHSA
<400> 34
Met Cys Leu Lys Ile Leu Val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr
1 5 10 15
Ser Thr Ala Trp Leu Cys Ala Leu Gly Lys Val Leu Pro Phe His Arg
20 25 30
Trp His Thr Met Val Gln Thr Cys Thr Pro Asn Val Thr Ile Asn Cys
35 40 45
Gln Asp Pro Ala Gly Gly Ala Leu Ile Ala Arg Cys Trp Tyr Leu His
50 55 60
Glu Gly His Gln Thr Ala Ala Phe Arg Asp Val Leu Val Val Leu Asn
65 70 75 80
Lys Arg Thr Asn
<210> 35
<211> 73
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTD3 Y14_SARS2
<400> 35
Met Leu Gln Ser Cys Tyr Asn Phe Leu Lys Glu Gln His Cys Gln Lys
1 5 10 15
Ala Ser Thr Gln Lys Gly Ala Glu Ala Ala Val Lys Pro Leu Leu Val
20 25 30
Pro His His Val Val Ala Thr Val Gln Glu Ile Gln Leu Gln Ala Ala
35 40 45
Val Gly Glu Leu Leu Leu Leu Glu Trp Leu Ala Met Ala Val Met Leu
50 55 60
Leu Leu Leu Cys Cys Cys Leu Thr Asp
65 70
<210> 36
<211> 43
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> P0DTD8 NS7B_SARS2
<400> 36
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 37
<211> 39
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q7TFA0 NS8A_CVHSA
<400> 37
Met Lys Leu Leu Ile Val Leu Thr Cys Ile Ser Leu Cys Ser Cys Ile
1 5 10 15
Cys Thr Val Val Gln Arg Cys Ala Ser Asn Lys Pro His Val Leu Glu
20 25 30
Asp Pro Cys Lys Val Gln His
35
<210> 38
<211> 70
<212> PRT
<213> SARS-COV-2
<220>
<221> misc_feature
<223> Q7TLC7 Y14_CVHSA
<400> 38
Met Leu Pro Pro Cys Tyr Asn Phe Leu Lys Glu Gln His Cys Gln Lys
1 5 10 15
Ala Ser Thr Gln Arg Glu Ala Glu Ala Ala Val Lys Pro Leu Leu Ala
20 25 30
Pro His His Val Val Ala Val Ile Gln Glu Ile Gln Leu Leu Ala Ala
35 40 45
Val Gly Glu Ile Leu Leu Leu Glu Trp Leu Ala Glu Val Val Lys Leu
50 55 60
Pro Ser Arg Tyr Cys Cys
65 70

Claims (36)

1.一种组合物,所述组合物包含:
a.SARS-CoV-2肽源性蛋白,其中所述肽源性蛋白与SARS-CoV-2起始蛋白相比具有改变的构象动力学,并且其中所述SARS-CoV-2肽源性蛋白在构象上与所述SARS-CoV-2起始蛋白类似,并且其中所述SARS-CoV-2起始蛋白选自表2所列的蛋白质中的至少一种;或
b.刺突片段;或
c.编码(a)或(b)的多核苷酸;或
d.(a)、(b)和/或(c)的任何组合。
2.根据权利要求1所述的组合物,其中通过以下方式获得所述改变的构象动力学:
a.检查所述SARS-CoV-2起始蛋白的3D结构,鉴定所述SARS-CoV-2起始蛋白的非表面氨基酸残基,并替代所述SARS-CoV-2起始蛋白中的至少一个非表面氨基酸残基,以产生所述SARS-CoV-2肽源性蛋白;或
b.检查所述SARS-CoV-2起始蛋白的3D结构的模型,鉴定所述SARS-CoV-2起始蛋白的非表面氨基酸残基,并替代所述SARS-CoV-2起始蛋白中的至少一个非表面氨基酸残基,以产生所述SARS-CoV-2肽源性蛋白;或
c.比较在来自不同物种的与所述SARS-CoV-2起始蛋白直向同源的蛋白质上的保守氨基酸同源性模式,以鉴定所述SARS-CoV-2起始蛋白的非表面氨基酸残基,并替代所述SARS-CoV-2起始蛋白中的至少一个非表面氨基酸残基,
以产生所述SARS-CoV-2肽源性蛋白;或
d.替代所述SARS-CoV-2起始蛋白的至少一个非表面氨基酸残基,以产生所述SARS-CoV-2肽源性蛋白;或
e.用较小的氨基酸残基替代至少一个非表面氨基酸残基;或
f.用丙氨酸或甘氨酸替代至少一个非表面氨基酸残基;或
g.消除所述SARS-CoV-2起始蛋白中的至少一个二硫键。
3.根据权利要求1或2所述的组合物,其中在所述SARS-CoV-2起始蛋白中替代至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。
4.根据前述权利要求中任一项所述的组合物,其中通过以下方式改变所述SARS-CoV-2起始蛋白的构象动力学:
a.用缬氨酸、丙氨酸、甘氨酸或丝氨酸替代至少一个苏氨酸;或
b.用丙氨酸、缬氨酸、甘氨酸、丝氨酸或苏氨酸替代至少一个半胱氨酸;或
c.用丙氨酸、甘氨酸、亮氨酸或异亮氨酸替代至少一个缬氨酸;或
d.用丙氨酸、缬氨酸、甘氨酸或异亮氨酸替代至少一个亮氨酸;或
e.用丙氨酸、缬氨酸、亮氨酸或甘氨酸替代至少一个异亮氨酸;或
f.用甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个脯氨酸;或
g.用丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个甲硫氨酸;或
h.用酪氨酸、甲硫氨酸、组氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个苯丙氨酸;或
i.用苯丙氨酸、甲硫氨酸、组氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个酪氨酸;或
j.用酪氨酸、苯丙氨酸、甲硫氨酸、组氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸或甘氨酸替代至少一个色氨酸;或
k.用谷氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个天冬氨酸;或
l.用甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、谷氨酰胺、谷氨酸或天冬氨酸替代至少一个天冬酰胺;或
m.用天冬氨酸、天冬酰胺、谷氨酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酸;或
n.用谷氨酸、天冬氨酸、天冬酰胺、谷氨酰胺、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸替代至少一个谷氨酰胺;或
o.用精氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个赖氨酸;或
p.用赖氨酸、组氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、甲硫氨酸、亮氨酸或异亮氨酸替代至少一个精氨酸;或
q.用苯丙氨酸、酪氨酸、赖氨酸、精氨酸、甘氨酸、丝氨酸、苏氨酸、丙氨酸、缬氨酸、谷氨酰胺、天冬酰胺、亮氨酸、甲硫氨酸或异亮氨酸替代至少一个组氨酸;或
r.用甘氨酸或脯氨酸替代至少一个丙氨酸;或
s.用丙氨酸或脯氨酸替代至少一个甘氨酸;或
t.用丙氨酸或甘氨酸替代至少一个丝氨酸;或
u.用非天然氨基酸替代至少一个残基;或
v.上述组合中的任一种。
5.根据前述权利要求中任一项所述的组合物,其中所述SARS-CoV-2肽源性蛋白选自刺突糖蛋白P0DTC2 Spike_SARS2(SEQ ID NO:15)或P59594 Spike_CVHSA(SEQ ID NO:16)。
6.根据权利要求5所述的组合物,其中所述刺突蛋白在以下位置中的任一个处突变:
(A)SEQ ID NO:15的Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe543;
(B)SEQ ID NO:15的Val308、Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;
(C)SEQ ID NO:15的Ala 363、Ala 397和/或Ala 575;
(D)SEQ ID NO:15的Cys 336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;
(E)SEQ ID NO:15的Ala 419、Ile 980、Ala 903、Leu 916、Ala 575、Phe 1095、Cys1032、Val 576、Tyr 365、Ile 1115、Ile 418、Leu 387、Cys 649、Leu 650、Leu 585、Ala1080、Ile 410、Tyr 423、Ala 1087、Tyr 695、Ala 653、Phe 201、Ile 1081、Phe 497、Ala989、Leu 552、Val 1104和/或Cys 671;或
(F)或SEQ ID NO:15-16或SEQ ID NO:43-110中的等同位置。
7.根据前述权利要求中任一项所述的组合物,其中所述组合物包含以下项中的任一种或由以下项中的任一种组成:
a.SEQ ID NO:15的氨基酸316-594或SEQ ID NO:16的氨基酸303-580;
b.SEQ ID NO:15的氨基酸316-594以及在以下位点中的任一个处的至少一个突变:A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys 336 Ala/Cys361Ala和/或Cys 379Ala/Cys 432Ala;(E)Ala 419、Ala 575、Val 576、Tyr 365、Ile 418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe 497和/或Leu 552;
c.SEQ ID NO:15的氨基酸319-591以及在以下位点中的任一个处的至少一个突变:(A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423、Phe 497和/或Phe 543;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524、Val539、Leu552、Ala575、Val576和/或Leu585;(C)Ala 363、Ala 397和/或Ala 575;(D)Cys 336Ala/Cys361Ala和/或Cys 379Ala/Cys 432Ala;和/或(E)Ala 419、Ala 575、Val 576、Tyr 365、Ile418、Leu 387、Leu 585、Ile 410、Tyr 423、Phe 497和/或Leu 552;
d.SEQ ID NO:15的氨基酸319-541以及在以下位点中的任一个处的至少一个突变:(A)Trp 353、Tyr 365、Phe 392、Phe 400、Tyr 423和/或Phe 497;(B)Ile326、Val350、Ile358、Ala363、Leu387、Val395、Ala397、Val401、Ile402、Ile410、Ile418、Ala419、Leu425、Val433、Ile434、Ala435、Leu492、Val510、Val511、Val512、Leu513、Val524和/或Val539;(C)Ala 363和/或Ala 397;(D)Cys 336Ala/Cys 361Ala和/或Cys 379Ala/Cys 432Ala;和/或(E)Ala419、Tyr 365、Ile 418、Leu 387、Ile 410、Tyr 423和/或Phe 497;
e.SEQ ID NO:15的氨基酸319-541、319-591或316-594以及在氨基酸Y365、I402和/或V511处的至少一个突变;
f.SEQ ID NO:15的氨基酸319-541、319-591或316-594以及选自Y365L、I402V和/或V511A的至少一个突变;或
g.SEQ ID NO:15-16或SEQ ID NO:43-110中的等同片段和/或突变。
8.根据前述权利要求中任一项所述的组合物,其中通过以下变化测量所述SARS-CoV-2肽源性蛋白的构象动力学变化:
a.与所述SARS-CoV-2起始蛋白相比熔解温度的变化;或
b.稳定化的吉布斯自由能或蛋白水解敏感性测定的变化;或
c.吉布斯自由能的变化,其中稳定化的吉布斯自由能的变化通过变性剂调节的平衡解折叠,诸如尿素或盐酸胍解折叠来测量。
9.根据前述权利要求中任一项所述的组合物,其中通过以下抗体测量所述类似的构象:
a.结合至所述SARS-CoV-2肽源性蛋白和所述SARS-CoV-2起始蛋白两者的交叉反应抗体;或
b.(a)的所述交叉反应抗体,其中通过免疫沉淀测定、表面等离子体共振、等温滴定量热法、斜入射反射差(OI-RD)、蛋白质印迹、放射免疫测定、ELISA(酶联免疫吸附测定)、“夹心”免疫测定、凝胶扩散沉淀素反应、免疫扩散测定、凝集测定、补体结合测定、免疫放射测定、荧光免疫测定和/或蛋白A免疫测定测量交叉反应性;或
c.(a)的所述交叉反应抗体,其中通过结合测定测量交叉反应性;或
d.(a)的所述交叉反应抗体,其中所述交叉反应抗体具有小于或等于10-9M的解离常数(KD);或
e.(a)的所述交叉反应抗体,其中所述交叉反应抗体具有小于或等于10-8M、小于或等于10-7M、或小于或等于10-6M的解离常数(KD)。
10.根据前述权利要求中任一项所述的组合物,其中所述突变选自表2中列出的突变中的至少一种。
11.根据前述权利要求中任一项所述的组合物,其中将所述组合物直接施用于动物。
12.根据前述权利要求中任一项所述的组合物,其中所述SARS-CoV-2肽源性蛋白源自:
a.同一种SARS-CoV-2起始蛋白;或
b.多种SARS-CoV-2起始蛋白;或
c.多种相关SARS-CoV-2起始蛋白。
13.一种向受试者施用根据前述权利要求中任一项所述的组合物的方法。
14.根据权利要求13所述的方法,其中所述方法进一步包括向所述受试者施用编码所述SARS-CoV-2肽源性蛋白的多核苷酸的混合物,以及将所述多核苷酸的混合物引入动物中,其中所述SARS-CoV-2肽源性蛋白由所述多核苷酸表达。
15.根据权利要求14所述的方法,其中所述多核苷酸是:
a.体外合成的;或
b.DNA;或
c.体外转录(IVT)mRNA;或
d.包含多聚(A)尾的IVT mRNA;或
e.包含5'帽的IVT mRNA。
16.根据权利要求14或15所述的方法,其中所述多核苷酸:
a.不与任何靶向组分缔合;或
b.与能够将所述多核苷酸靶向细胞或器官的靶向组分缔合;或
c.与能够将所述多核苷酸靶向细胞或器官的靶向组分缔合,其中所述靶向组分是载体。
17.一种动物,所述动物包含根据权利要求1-12中任一项所述的组合物。
18.根据权利要求17所述的动物,其中所述动物是哺乳动物、人、小鼠、兔、美洲驼或牛。
19.根据权利要求13-16中任一项所述的方法或根据权利要求17或18所述的动物,其中向所述动物注射所述组合物。
20.根据权利要求13-16中任一项所述的方法或根据权利要求17或18所述的动物,其中将所述组合物:
a.直接注射至所述动物的肌肉中;
b.多次注射至所述动物中。
21.根据权利要求13-16或19-20中任一项所述的方法,其中所述方法产生免疫应答。
22.根据权利要求21所述的方法,其中所述免疫应答包括抗体的产生。
23.根据权利要求22所述的方法,其中所述方法进一步包括分离所述抗体。
24.根据权利要求23所述的方法,其中所述抗体是完全人抗体、嵌合抗体、人源化抗体、单克隆抗体和/或多克隆抗体。
25.一种通过根据权利要求22-24中任一项所述的方法产生的抗体。
26.根据权利要求25所述的方法,其中将所述多克隆抗体进一步分级分离以获得单一的、分离的抗体种类。
27.一种通过根据权利要求26所述的方法产生的分离的抗体。
28.根据权利要求13-16和19-26中任一项所述的方法或根据权利要求27所述的抗体,其中所述抗体是亲和力成熟的。
29.根据权利要求28所述的方法或抗体,其中所述亲和力成熟通过以下技术发生:
a.噬菌体展示、酵母展示或核糖体展示;或
b.淘选技术。
30.一种通过根据权利要求28或29中任一项所述的方法产生的抗体。
31.一种多核苷酸,所述多核苷酸编码根据权利要求25、27或30中任一项所述的抗体。
32.根据权利要求31所述的多核苷酸,所述多核苷酸进一步包含异源启动子。
33.根据权利要求31或32所述的多核苷酸,所述多核苷酸进一步包含载体序列。
34.一种宿主细胞,所述宿主细胞包含根据权利要求1-12或31-33中任一项所述的多核苷酸。
35.一种肽源性蛋白或编码SARS-CoV-2肽源性蛋白混合物的多核苷酸的混合物,其中所述肽源性蛋白选自表2中所示的蛋白质。
36.根据权利要求35所述的肽源性蛋白或多核苷酸的混合物,其中编码所述肽源性蛋白的多核苷酸:
a.编码源自同一种SARS-CoV-2起始蛋白的SARS-CoV-2肽源性蛋白的混合物;或
b.编码源自多种SARS-CoV-2起始蛋白的SARS-CoV-2肽源性蛋白的混合物;或
c.编码源自多种相关SARS-CoV-2起始蛋白的SARS-CoV-2肽源性蛋白的混合物;或
d.是体外合成的;或
e.是DNA;或
f.是体外转录(IVT)mRNA;或
g.是包含多聚(A)尾的IVT mRNA;或
h.是包含5'帽的IVT mRNA。
CN202180073094.3A 2020-09-04 2021-09-02 SARS-CoV-2疫苗和抗体 Pending CN116390750A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063075043P 2020-09-04 2020-09-04
US63/075,043 2020-09-04
US202063132943P 2020-12-31 2020-12-31
US63/132,943 2020-12-31
US202163211397P 2021-06-16 2021-06-16
US63/211,397 2021-06-16
PCT/US2021/048932 WO2022051549A1 (en) 2020-09-04 2021-09-02 Sars-cov-2 vaccines and antibodies

Publications (1)

Publication Number Publication Date
CN116390750A true CN116390750A (zh) 2023-07-04

Family

ID=78078367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180073094.3A Pending CN116390750A (zh) 2020-09-04 2021-09-02 SARS-CoV-2疫苗和抗体

Country Status (7)

Country Link
US (1) US20230212232A1 (zh)
EP (1) EP4208197A1 (zh)
JP (1) JP2023540082A (zh)
CN (1) CN116390750A (zh)
CA (1) CA3192526A1 (zh)
IL (1) IL300917A (zh)
WO (1) WO2022051549A1 (zh)

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4714681A (en) 1981-07-01 1987-12-22 The Board Of Reagents, The University Of Texas System Cancer Center Quadroma cells and trioma cells and methods for the production of same
US4474893A (en) 1981-07-01 1984-10-02 The University of Texas System Cancer Center Recombinant monoclonal antibodies
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
JPS6147500A (ja) 1984-08-15 1986-03-07 Res Dev Corp Of Japan キメラモノクロ−ナル抗体及びその製造法
EP0173494A3 (en) 1984-08-27 1987-11-25 The Board Of Trustees Of The Leland Stanford Junior University Chimeric receptors by dna splicing and expression
GB8422238D0 (en) 1984-09-03 1984-10-10 Neuberger M S Chimeric proteins
EP0216846B2 (en) 1985-04-01 1995-04-26 Celltech Limited Transformed myeloma cell-line and a process for the expression of a gene coding for a eukaryotic polypeptide employing same
DE3689123T2 (de) 1985-11-01 1994-03-03 Xoma Corp Modulare einheit von antikörpergenen, daraus hergestellte antikörper und verwendung.
GB8601597D0 (en) 1986-01-23 1986-02-26 Wilson R H Nucleotide sequences
GB8717430D0 (en) 1987-07-23 1987-08-26 Celltech Ltd Recombinant dna product
US4925648A (en) 1988-07-29 1990-05-15 Immunomedics, Inc. Detection and treatment of infectious and inflammatory lesions
US5601819A (en) 1988-08-11 1997-02-11 The General Hospital Corporation Bispecific antibodies for selective immune regulation and for selective immune cell binding
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
EP0394827A1 (en) 1989-04-26 1990-10-31 F. Hoffmann-La Roche Ag Chimaeric CD4-immunoglobulin polypeptides
US5766883A (en) 1989-04-29 1998-06-16 Delta Biotechnology Limited Polypeptides
EP0739904A1 (en) 1989-06-29 1996-10-30 Medarex, Inc. Bispecific reagents for aids therapy
US5413923A (en) 1989-07-25 1995-05-09 Cell Genesys, Inc. Homologous recombination for universal donor cells and chimeric mammalian hosts
FR2650598B1 (fr) 1989-08-03 1994-06-03 Rhone Poulenc Sante Derives de l'albumine a fonction therapeutique
US5676954A (en) 1989-11-03 1997-10-14 Vanderbilt University Method of in vivo delivery of functioning foreign genes
DE69133566T2 (de) 1990-01-12 2007-12-06 Amgen Fremont Inc. Bildung von xenogenen Antikörpern
GB9015198D0 (en) 1990-07-10 1990-08-29 Brien Caroline J O Binding substance
US5545806A (en) 1990-08-29 1996-08-13 Genpharm International, Inc. Ransgenic non-human animals for producing heterologous antibodies
US5633425A (en) 1990-08-29 1997-05-27 Genpharm International, Inc. Transgenic non-human animals capable of producing heterologous antibodies
DK0814159T3 (da) 1990-08-29 2005-10-24 Genpharm Int Transgene, ikke-humane dyr, der er i stand til at danne heterologe antistoffer
US5814318A (en) 1990-08-29 1998-09-29 Genpharm International Inc. Transgenic non-human animals for producing heterologous antibodies
US5625126A (en) 1990-08-29 1997-04-29 Genpharm International, Inc. Transgenic non-human animals for producing heterologous antibodies
US5661016A (en) 1990-08-29 1997-08-26 Genpharm International Inc. Transgenic non-human animals capable of producing heterologous antibodies of various isotypes
JP3583420B2 (ja) 1990-10-05 2004-11-04 メダレツクス・インコーポレーテツド 二特異的試薬を用いた標的免疫化
AU8727291A (en) 1990-10-29 1992-06-11 Cetus Oncology Corporation Bispecific antibodies, method of production, and uses thereof
ES2093778T3 (es) 1991-04-26 1997-01-01 Surface Active Ltd Nuevos anticuerpos y metodos para su uso.
US5661133B1 (en) 1991-11-12 1999-06-01 Univ Michigan Collateral blood vessel formation in cardiac muscle by injecting a dna sequence encoding an angiogenic protein
ATE463573T1 (de) 1991-12-02 2010-04-15 Medimmune Ltd Herstellung von autoantikörpern auf phagenoberflächen ausgehend von antikörpersegmentbibliotheken
FR2686899B1 (fr) 1992-01-31 1995-09-01 Rhone Poulenc Rorer Sa Nouveaux polypeptides biologiquement actifs, leur preparation et compositions pharmaceutiques les contenant.
DK0627940T3 (da) 1992-03-05 2003-09-01 Univ Texas Anvendelse af immunokonjugater til diagnose og/eller terapi af vaskulariserede tumorer
CA2102401A1 (en) 1992-06-09 1993-12-10 Friedrich Hoppe Latch and lockset system
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
ATE238668T1 (de) 1995-01-17 2003-05-15 Brigham & Womens Hospital Rezeptorspezifischer transepithelialer transport von immunogenen
EP0822830B1 (en) 1995-04-27 2008-04-02 Amgen Fremont Inc. Human anti-IL-8 antibodies, derived from immunized xenomice
AU2466895A (en) 1995-04-28 1996-11-18 Abgenix, Inc. Human antibodies derived from immunized xenomice
US5916771A (en) 1996-10-11 1999-06-29 Abgenix, Inc. Production of a multimeric protein by cell fusion method
CA2722378C (en) 1996-12-03 2015-02-03 Amgen Fremont Inc. Human antibodies that bind tnf.alpha.
US6511832B1 (en) 1999-10-06 2003-01-28 Texas A&M University System In vitro synthesis of capped and polyadenylated mRNAs using baculovirus RNA polymerase
EP1278551A2 (en) 2000-04-21 2003-01-29 Vical Incorporated Compositions and methods for (in vivo) delivery of polynucleotide-based therapeutics
EP3337822A1 (en) * 2015-08-19 2018-06-27 Rutgers, The State University of New Jersey Novel methods of generating antibodies

Also Published As

Publication number Publication date
IL300917A (en) 2023-04-01
EP4208197A1 (en) 2023-07-12
JP2023540082A (ja) 2023-09-21
WO2022051549A1 (en) 2022-03-10
CA3192526A1 (en) 2022-03-10
US20230212232A1 (en) 2023-07-06

Similar Documents

Publication Publication Date Title
JP2022123088A (ja) 抗体を生成する新規な方法
JP2002507544A (ja) 抗イディオタイプ応答を引き出す能力が増強された改変型の抗体
KR20170082545A (ko) Cmv의 변형된 바이러스-유사 입자
US7604955B2 (en) Immunoglobulin E vaccines and methods of use thereof
JP6876682B2 (ja) ネコアレルギーに対する組成物
CN1541266A (zh) 用于治疗过敏症及哮喘病的Fcε融合蛋白
RU2322260C2 (ru) Пассивная иммунизационная терапия на основе пептидов для лечения атеросклероза
TW200418980A (en) Optimized multi-epitope constructs and uses thereof
Wholey et al. Synthetic liposomal mimics of biological viruses for the study of immune responses to infection and vaccination
US10286057B2 (en) Cyclic HIV-1 Env V3 glycopeptide immunogens
US20220152194A1 (en) Glycan-masked engineered outer domains of hiv-1 gp120 and their use
EP2834263B9 (en) Epitope-scaffold immunogens against respiratory syncytial virusm (rsv)
US20220073946A1 (en) Virus-like particles of cmv modified by fusion
CN116390750A (zh) SARS-CoV-2疫苗和抗体
US20060140982A1 (en) Tuberculosis nucleic acids, polypeptides and immunogenic compositions
KR20020073149A (ko) 핵산 백신접종
WO2016192788A1 (en) Methods and compositions for preventing and treating cat or dog dander allergy
Karbanowicz et al. Extracellular expression of the HT1 neurotoxin from the Australian paralysis tick in two Saccharomyces cerevisiae strains
EP4328236A1 (en) Glycosylated rbd and use thereof
AU2003243443B2 (en) Method for generating monoclonal antibodies
US20040018568A1 (en) Methods for detecting deantigenized T cell epitopes and uses thereof
JP2002539818A (ja) イヌのアレルギーを治療するための特異的結合蛋白
EP4192498A1 (en) Immunogenic compositions
US20080254041A1 (en) Method for Selecting an Immunotherapeutic Preparation
Jiang Structure-Guided Design and Biophysical Characterization of Novel Anti-HIV Reagents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination