CN101801409A - 包含肺炎球菌抗原的组合物 - Google Patents

包含肺炎球菌抗原的组合物 Download PDF

Info

Publication number
CN101801409A
CN101801409A CN200880108017A CN200880108017A CN101801409A CN 101801409 A CN101801409 A CN 101801409A CN 200880108017 A CN200880108017 A CN 200880108017A CN 200880108017 A CN200880108017 A CN 200880108017A CN 101801409 A CN101801409 A CN 101801409A
Authority
CN
China
Prior art keywords
antigen
seq
aminoacid
references
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880108017A
Other languages
English (en)
Inventor
C·多纳蒂
A·穆兹
V·马西格纳尼
F·巴格诺利
P·鲁格洛
M·巴罗奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novartis Vaccines and Diagnostics AG
Original Assignee
Novartis Vaccines and Diagnostics AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novartis Vaccines and Diagnostics AG filed Critical Novartis Vaccines and Diagnostics AG
Priority to CN201410192895.3A priority Critical patent/CN104001165B/zh
Publication of CN101801409A publication Critical patent/CN101801409A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/09Lactobacillales, e.g. aerococcus, enterococcus, lactobacillus, lactococcus, streptococcus
    • A61K39/092Streptococcus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • A61K47/646Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent the entire peptide or protein drug conjugate elicits an immune response, e.g. conjugate vaccines
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • C07K14/3156Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci from Streptococcus pneumoniae (Pneumococcus)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pulmonology (AREA)
  • Biotechnology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

本发明者相信,有效的肺炎链球菌疫苗可能需要若干抗原性组分,因此他们鉴定了用于免疫的各种肺炎球菌多肽组合。他们也鉴定了可用作单一抗原的一些肺炎球菌多肽。这些多肽任选与肺炎球菌糖联用。该抗原可用于肺炎球菌疫苗,但也可用作对多种病原体进行免疫的疫苗的组分。

Description

包含肺炎球菌抗原的组合物
技术领域
本发明涉及衍生自肺炎链球菌(S.pneumoniae)的抗原及其在免疫接种中的应用。
背景技术
肺炎链球菌(Streptococcus pneumoniae)也称为肺炎球菌,是革兰阳性球状细菌。它是成年人和五岁以上儿童的急性细菌性脑膜炎的最常见病因。
现有的肺炎球菌疫苗均基于荚膜糖。唯一一种儿科疫苗是PREVNARTM,它是来自7种不同血清型的偶联糖的混合物。也能够获得基于23种不同血清型的偶联糖的混合物的成人疫苗。但这两类疫苗难以生产,并且总共存在超过90种肺炎球菌血清型。因此,仍然需要鉴定用于肺炎球菌疫苗的其他改良抗原。
发明内容
类似于参考文献1和2,本发明者认为有效的肺炎链球菌疫苗可能需要几种抗原性组分,因此他们鉴定了用于免疫接种的多种肺炎球菌多肽的组合。他们也鉴定了可用作单一抗原的一些肺炎球菌多肽。任选地,这些多肽可与肺炎球菌糖或其他肺炎球菌多肽联用。该抗原可用于肺炎球菌疫苗,但也可用作对多种病原体进行免疫的疫苗的组分。
本发明者已鉴定到以下7种肺炎球菌多肽:spr0057;spr0286;spr0565;spr1098;spr1345;spr1416;spr1418。这组抗原在本文中称为‘第一抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4、5、6或所有7种)抗原:(1)spr0057抗原;(2)spr0286抗原;(3)spr0565抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;和/或(7)spr1418抗原。
本发明者已鉴定到以下4种肺炎球菌多肽:spr0867;spr1431;spr1739;spr2021。这组抗原在本文中称为‘第二抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3或所有4种)抗原:(1)spr0867抗原;(2)spr1431抗原;(3)spr1739抗原;和/或(4)spr2021抗原。
本发明者已鉴定到以下3种肺炎球菌多肽:spr0096;spr1433;spr1707。这组抗原在本文中称为‘第三抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或三种抗原:(1)spr0096抗原;(2)spr1433抗原;和/或(3)spr1707抗原。
第一和第二抗原组中11种肺炎球菌多肽的组合在本文中称为‘第四抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4、5、6、7、8、9、10或所有11种)抗原:(1)spr0057抗原;(2)spr0286抗原;(3)spr0565抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;和/或(11)spr2021抗原。
第一和第三抗原组中10种肺炎球菌多肽的组合在本文中称为‘第五抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4、5、6、7、8、9或所有10种)抗原:(1)spr0057抗原;(2)spr0286抗原;(3)spr0565抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0096抗原;(9)spr1433抗原;和/或(10)spr1707抗原。
第二和第三抗原组中7种肺炎球菌多肽的组合在本文中称为‘第六抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4、5、6或所有7种)抗原:(1)spr0867抗原;(2)spr1431抗原;(3)spr1739抗原;(4)spr2021抗原;(5)spr0096抗原;(6)spr1433抗原;和/或(7)spr1707抗原。
第一、第二和第三抗原组中14种肺炎球菌多肽的组合在本文中称为‘第七抗原组’。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4、5、6、7、8、9、10、11、12、13或所有14种)抗原:(1)spr0057抗原;(2)spr0286抗原;(3)spr0565抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr2021抗原;(12)spr0096抗原;(13)spr1433抗原;和/或(14)spr1707抗原。
在第七抗原组内,优选的四种抗原的亚组是‘第八抗原组’,其包括来自第一、第二和第三组的抗原,即spr0057、spr0096、spr0565和spr2021。因此,本发明提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3或所有4种)抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;和/或(4)spr2021抗原。在第八组中,组成可包括:(1)、(2)和(3);(1)、(2)和(4);(1)、(3)和(4);(2)、(3)和(4);或(1)、(2)、(3)和(4)。在血清型不同的32种肺炎球菌菌株上,通过免疫学方法确认这四种抗原的表达。
‘第九抗原组’是第八抗原组加RrgB菌毛抗原。因此,本发明还提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括一种或多种RrgB菌毛抗原和选自下组的两种或多种(即2、3或所有4种)抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;和/或(4)spr2021抗原。
‘第十抗原组’是第八抗原组加Pmp多肽。因此,本发明也提供包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种(即2、3、4或所有5种)抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;和/或(5)Pmp多肽。
感兴趣的特定组合包括:(i)spr0057抗原和spr0096抗原;(ii)spr0057抗原和spr2021抗原;(iii)spr0057抗原、spr0096抗原和spr2021抗原;(iv)spr0057抗原和spr0565抗原;(v)spr0565抗原和spr2021抗原;(vi)spr0057抗原、spr0565抗原和spr2021抗原;(vii)spr0565抗原、spr2021抗原和spr1739抗原,如脱毒抗原;以及(viii)spr0565抗原、spr2021抗原和Pmp多肽。
本发明还提供包含两种或多种不同的肺炎球菌外切糖苷酶的免疫原性组合物。
本发明还提供包含至少一种肺炎球菌外切糖苷酶和至少一种肺炎球菌肽聚糖水解酶的免疫原性组合物。
本发明还提供包含两种或多种不同的肽聚糖水解酶的免疫原性组合物。
本发明的优选组合是两种或多种抗原协同作用的组合。因此,通过联合给药保护免遭肺炎球菌疾病侵扰的效果超过了只加入单独保护功效的预期效果。
其他多肽抗原
除来自本发明各个抗原组的抗原外,免疫原性组合物可包含一种或多种以下多肽,以提高该组合物引发的抗-肺炎球菌免疫应答:
●肺炎球菌菌毛的一个或多个亚基,如RrgA、RrgB和/或RrgC。
●ClpP多肽。
●LytA多肽。
●CPL1多肽。
●PhtA多肽。
●PhtB多肽。
●PhtD多肽。
●PhtE多肽。
●CbpD多肽
●CbpG多肽
●PvaA多肽。
●Hic多肽。
●Pmp多肽。
●ZmpB多肽。
●PspA多肽
●PsaA多肽
●PspC多肽。
●PrtA多肽。
●Sp91多肽。
●Sp133多肽。
●PiuA多肽和/或PiaA多肽。
●spr0222多肽。
●选自下组的抗原:·IC1;IC2;IC3;IC4;IC5;IC6;IC7;IC8;IC9;IC10;IC11;IC12;IC13;IC14;IC15;IC16;IC17;IC18;IC19;IC20;IC21;IC22;IC23;IC24;IC25;IC26;IC27;IC28;IC29;IC30;IC31;IC32;IC33;IC34;IC35;IC36;IC37;IC38;IC39;IC40;IC41;IC42;IC43;IC44;IC45;IC46;IC47;IC48;IC49;IC50;IC51;IC52;IC53;IC54;IC55;IC56;IC57;IC58;IC59;IC60;IC61;IC62;IC63;IC64;IC65;IC66;IC67;IC68;IC69;IC70;IC71;IC72;IC73;IC74;IC75;IC76;IC77;IC78;IC79;IC80;IC81;IC82;IC83;IC84;IC85;IC86;IC88;IC89;IC90;IC91;IC92;IC93;IC94;IC95;IC96;IC97;IC98;IC99;IC100;IC101;IC102;IC103;IC104;IC105;IC106;IC107;IC108;IC109;IC110;IC111;IC112;IC113;IC114;IC115;IC116;IC117;IC118;IC119;IC120;IC121;IC122;IC123;IC124;IC125;IC126;IC127;IC128;IC129;IC130;和IC131。
●选自下组的抗原:ID-204、ID-212、ID-213、ID-214、ID-215、ID-216、ID-217、ID-219、ID-220、ID-225、ID-301、ID-302、ID-303、ID-304、ID-305、ID-306,如参考文献3所述。
●选自下组的抗原:Sit1A、Sit1B、Sit1C、Sit2B、Sit2C、Sit2D、Sit3A、Sit3B、Sit3C、Sit3D、ORF1、ORF2、ORF3、ORF4、ORF5、ORF6、ORF6、ORF7、ORF8、ORF9、ORF10、ORF11、ORF12、ORF13、ORF14、MS1、MS2、MS3、MS4、MS5、MS6、MS7、MS8、MS9、MS10或MS11,如参考文献4所述。
●如参考文献5所述的抗原。
●参考文献6的表1-3所述的抗原,如CbiO。
●参考文献7所述的抗原,如30S核糖体蛋白S8。
●选自下组的抗原:磷酸烯丙醇丙酮酸蛋白磷酸转移酶;磷酸甘露糖变位酶;触发因子(trigger factor);延伸因子G;四环素抗性蛋白(tetO);DNA-指导的RNA聚合酶α-链;NADH氧化酶;谷氨酰-tRNA酰胺转移酶亚基A;N利用物质蛋白A同源物(N uti1ization substance protein A homo1og);Xaa-His二肽酶;细胞分裂蛋白ftsz;锌金属蛋白酶;L-乳酸脱氢酶;甘油醛3-磷酸脱氢酶(GAPDH);果糖-磷酸氢盐醛缩酶;UDP-葡萄糖4-差向异构酶;GTP结合蛋白typA/BipA;GMP合酶;谷氨酰-tRNA合成酶;NADP-特异性谷氨酸脱氢酶;延伸因子TS;磷酸甘油酸激酶;吡啶核苷酸-二硫化物氧化还原酶;40S核糖体蛋白S1;6-磷酸葡糖酸脱氢酶;氨基肽酶C;氨甲酰基磷酸合酶(大亚基);PTS系统甘露糖-特异性IIAB组件;核糖体蛋白S2;二氢乳清酸脱氢酶;天冬氨酸氨甲酰基转移酶;延伸因子Tu;肺炎球菌表面免疫原性蛋白A(PsipA);磷酸甘油酸激酶;ABC转运蛋白底物结合蛋白内肽酶O;肺炎球菌表面免疫原性蛋白B(PsipB);或肺炎球菌表面免疫原性蛋白C(PsipC)[8]。
菌毛
许多肺炎链球菌菌株都具有致病性岛(rlrA)内编码的菌毛。该岛编码三种表面蛋白(RrgA、RrgB和RrgC)和三种分选酶。在本发明一些实施方式中,除来自本发明抗原组之一的抗原外,组合物包括以下一种或多种物质:RrgA;RrgB;RrgC;SrtB;SrtC;和/或SrtD。在这六种蛋白质中,优选包括RrgA、RrgB和/或RrgC中的一种或多种。RrgB是最好包含的菌毛蛋白。
一些菌株具有不同的菌毛类型[9],‘PI-2’。PI-2操纵子编码PitA、SipA、PitB、SrtG1和SrtG2。在本发明一些实施方式中,除来自本发明抗原组之一的抗原外,组合物包括以下一种或多种物质:PitA、SipA、PitB、SrtG1和/或SrtG2。
IC1-IC131
如上所述,在本发明一些实施方式中,除来自本发明抗原组之一的抗原外,组合物包括选自IC1-IC131的一种或多种物质。这131种多肽参见参考文献10,即其中表3所列的144种多肽,除了SP0117、SP0641、SP0664、SP1003、SP1004、SP1174、SP1175、SP1573、SP1687、SP1693、SP1937和SP2190。在132种多肽IC1-IC131中,可从其中选择一种或多种多肽的优选亚组是:IC1;IC8;IC16;IC23;IC31;IC34;IC40;IC45;IC47;IC57;IC58;IC60和IC69。
与肺炎球菌偶联物联用
本发明抗原组中鉴定的单独抗原可与肺炎球菌偶联物联用。因此,本发明提供一种包含以下组合的免疫原性组合物:
(1)选自第一、第二、第三、第四、第五、第六、第七、第八、第九和第十抗原组(如上所述)的一种或多种抗原;和
(2)一种或多种肺炎球菌荚膜糖和载体蛋白的偶联物。
该组合组分(2)中所用的偶联物包括糖部分和载体部分。糖部分来自肺炎球菌的荚膜糖。糖可以是多糖,其大小是由细菌纯化该糖时产生的大小,或者可以是这种多糖片段化产生的寡糖。例如,在7价PREVNARTM产品中,6种糖是完整多糖,而一种(18C血清型)是寡糖。
一种组合物可包含来自以下一种或多种肺炎球菌血清型的荚膜糖:1、2、3、4、5、6A、6B、7F、8、9N、9V、10A、11A、12F、14、15B、17F、18C、19A、19F、20、22F、23F和/或33F。一种组合物可包含多种血清型,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或多种血清型。本领域已知7价、9价、10价、11价和13价偶联物组合,也了解23价非偶联组合。
例如,10价组合可包含来自血清型1、4、5、6B、7F、9V、14、18C、19F和23F的糖。11价组合还可包含来自血清型3的糖。可以在10价混合物中加入以下组合形成12价组合:血清型6A和19A;6A和22F;19A和22F;6A和15B;19A和15B;r22F和15B;可以在11价混合物中加入以下组合形成13价组合:血清型19A和22F;8和12F;8和15B;8和19A;8和22F;12F和15B;12F和19A;12F和22F;15B和19A;15B和22F;等等。
载体部分通常是蛋白质,但优选不是(1)中的抗原之一。典型的载体蛋白是细菌毒素,如白喉或破伤风毒素,或者其类毒素或突变体。可使用CRM197白喉毒素突变体[11],它是PREVNARTM产品中的载体。其他合适的载体蛋白包括脑膜炎奈瑟球菌(N.meningitidis)外膜蛋白复合物[12]、合成肽[13,14]、热激蛋白[15,16]、百日咳蛋白[17,18]、细胞因子[19]、淋巴因子[19]、激素[19]、生长因子[19]、包含多种来自各种病原体衍生抗原的人CD4+T细胞表位的人工蛋白[20]例如N19[21]、来自流感嗜血杆菌(H.influenzae)的蛋白D[22-24]、肺炎球菌溶血素[25]或其无毒衍生物[26]、肺炎球菌表面蛋白PspA[27]、摄铁蛋白[28]、来自艰难梭菌(C.difficile)的毒素A或B[29]、重组绿脓假单胞菌(P.aeruginosa)胞外蛋白A(rEPA)[30]等等。
当组合物包含一种以上偶联物时,每种偶联物可使用相同的载体蛋白或不同的载体蛋白。参考文献31描述了在多价肺炎球菌偶联物疫苗中使用不同载体蛋白的潜在优点。
在一些实施方式中,一种偶联物可携带来自多种血清型的糖[32]。然而,每种偶联物通常包含来自一种血清型的糖。
偶联物可包含过量载体(w/w)或过量糖(w/w)。在一些实施方式中,偶联物可包含相同重量的载体和糖。
载体分子可直接与载体共价偶联,或通过接头偶联。可通过(例如)糖和载体之间的还原性胺化(如参考文献33和34所述),实现与蛋白质的直接连接。首先需要通过,例如氧化激活糖。可用任何已知方法,如参考文献35和36所述的方法通过接头基团进行连接。优选的连接类型是己二酸接头,这种连接可通过以下方式形成:将游离-NH2基团与己二酸偶联(如通过胺化引入葡聚糖中)(例如,利用二酰亚胺活化),然后将蛋白质偶联于所得的糖-己二酸中间体[37,38]。另一种优选连接形式是羰基接头,这种连接可通过以下方式形成:使糖CDI的游离羟基发生反应[39,40],然后与蛋白质反应形成氨基甲酸酯连接。其它接头包括β-丙酰胺基[41]、硝基苯基-乙胺[42]、卤代酰基卤化物[43]、配糖键[44]、6-氨基己酸[45]、ADH[46]、C4-C12部分[47]等。也可使用碳二亚胺缩合反应[48]。
本发明抗原组中鉴定的单独抗原可用作肺炎球菌荚膜糖的载体蛋白,以形成共价偶联物。因此,本发明提供一种免疫原性组合物,其包含(1)选自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原组的抗原和(2)肺炎球菌荚膜糖。这类偶联物的其他特征如上所述。本领域已知可将肺炎球菌蛋白质用作偶联物中的载体[例如,参考文献25、27和67]。这些偶联物可与本文所述的任何其他抗原联用。
与非肺炎球菌抗原联用
本发明抗原组中鉴定的单独抗原可与非肺炎球菌抗原联用。因此,本发明提供一种包含以下组合的免疫原性组合物:
(1)选自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原组(如上所述)的一种或多种抗原;和
(2)一种或多种选自下组的抗原:白喉类毒素;破伤风类毒素;乙型肝炎病毒表面抗原;灭活的脊髓灰质炎病毒抗原;一种或多种非细胞百日咳抗原;B型流感嗜血杆菌(Haemophilus influenzae)荚膜糖抗原的偶联物;脑膜炎奈瑟球菌(Neisseria meningitidis)血清组C荚膜糖抗原的偶联物;脑膜炎奈瑟球菌血清组Y荚膜糖抗原的偶联物;脑膜炎奈瑟球菌血清组W135荚膜糖抗原的偶联物;和脑膜炎奈瑟球菌血清组A荚膜糖抗原的偶联物。
可通过处理(例如用甲醛)来自白喉棒状杆菌(Corynebacteriumdiphtheriae)的白喉毒素获得白喉类毒素。参考文献49的第13章更详细地公开了白喉类毒素。
可通过处理(例如用甲醛)来自破伤风梭菌(Clostridium tetani)的破伤风毒素获得破伤风类毒素。参考文献49的第27章更详细地公开了破伤风类毒素。
乙型肝炎病毒表面抗原(HBsAg)是乙型肝炎病毒衣壳的主要组分。可通过在酵母,如酿酒酵母(Saccharomyces cerevisiae)中重组表达,方便地产生这种抗原。
灭活的脊髓灰质炎病毒抗原由细胞培养物上培养的病毒制备并灭活(例如用甲醛)。因为脊髓灰质炎可由三类脊髓灰质炎病毒之一引起(如参考文献49的第24章所述),所以组合物可包含以下三类脊髓灰质炎病毒抗原:1型脊髓灰质炎病毒(例如Mahoney毒株)、2型脊髓灰质炎病毒(例如MEF-1毒株)和3型脊髓灰质炎病毒(例如Saukett毒株)。
非细胞百日咳抗原包含特定的纯化百日咳博德特菌(B.pertussis)抗原,它们或者是由天然细菌纯化的,或者是在重组宿主中表达后纯化的。通常使用一种以上非细胞抗原,因此组合物可包含以下熟知和已良好鉴定的百日咳博德特菌抗原中的一种、两种或三种:(1)脱毒的百日咳毒素(百日咳类毒素或“PT”);(2)丝状血细胞凝集素(“FHA”);(3)百日咳杆菌粘附素(也称为“69千道尔顿外膜蛋白”)。在用于本发明之前,可用甲醛处理FHA和百日咳杆菌粘附素。可通过甲醛和/或戊二醛处理对PT脱毒,但是,作为此种化学脱毒方法的替代方案,它可以是酶活性经诱变降低的突变PT[50]。可以使用的其他非细胞百日咳抗原包括菌毛(如凝集原2和3)。
组合物的组分(2)中包含白喉类毒素、破伤风类毒素或非细胞百日咳抗原之一时,它通常包含所有这三种抗原,即组分(2)包含D-T-Pa组合。
第一抗原组
(1)spr0057
参考文献84中将原始′spr0057′序列标注为′B-N-乙酰基-己糖胺酶前体′(参见GI:15902101)。出于参比目的,R6菌株中发现的全长spr0057的氨基酸序列在本文中列为SEQ ID NO:1。
本发明所用的优选spr0057多肽包含某氨基酸序列,该序列:(a)与SEQID NO:1具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:1的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr0057蛋白包括SEQID NO:1的变体。(b)的优选片段包含来自SEQ ID NO:1的表位。其他优选片段缺少SEQ ID NO:1C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:1N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:1的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:180,其缺少天然前导肽和分选酶识别序列。
spr0057与其他肺炎球菌抗原的组合显示出良好的协同作用。
(2)spr0286
参考文献84中将原始′spr0286′序列标注为′透明质酸裂解酶前体′(参见GI:15902330)。出于参比目的,R6菌株中发现的全长spr0286的氨基酸序列在本文中列为SEQ ID NO:2。
本发明所用的优选spr0286多肽包含某氨基酸序列,该序列:(a)与SEQID NO:2具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:2的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr0286蛋白包括SEQID NO:2的变体。(b)的优选片段包含来自SEQ ID NO:2的表位。其他优选片段缺少SEQ ID NO:2C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:2N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:2的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:181,其缺少天然前导肽和分选酶识别序列。其他合适片段是SEQ ID NO:182和183。
(3)spr0565
参考文献84中将原始′spr0565′序列标注为′β-半乳糖苷酶前体′(参见GI:15902609)。出于参比目的,R6菌株中发现的全长spr0565的氨基酸序列在本文中列为SEQ ID NO:3。
本发明所用的优选spr0565多肽包含某氨基酸序列,该序列:(a)与SEQID NO:3具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:3的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr0565蛋白包括SEQID NO:3的变体(如SEQ ID NO:66;见下)。(b)的优选片段包含来自SEQ IDNO:3的表位。其他优选片段缺少SEQ ID NO:3C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ IDNO:3N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:3的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:184,其缺少天然前导肽和分选酶识别序列。其他合适片段是SEQ ID NO:177和178。
本文中spr0565的变体形式是SEQ ID NO:66。参考文献10中报道将此种变体形式(其中的SEQ ID NO:178)用于免疫。有用的spr0565多肽可包含某氨基酸序列,该序列:(a)与SEQ ID NO:66具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:66的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些多肽包括SEQ ID NO:66的变体。(b)的优选片段包含来自SEQID NO:66的表位。其他优选片段缺少SEQ ID NO:66C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:66N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:66的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献10的表1中鉴定了SEQ ID NO:66的免疫原性片段。
由于spr0565在天然情况下是长多肽(>2000aa),所以表达片段可能更方便。因此,本发明所用spr0565合适形式的长度可小于1500个氨基酸(例如<1400、<1300、<1200、<1100等)。spr0565的这种短形式包括‘spr0565A’(SEQ ID NO:177)和‘spr0565B’(SEQ ID NO:178)。
spr0565与其他肺炎球菌抗原的组合显示出良好的协同作用。
(4)spr1098
参考文献84中将原始′spr1098′序列标注为′分选酶′(参见GI:15903141)。出于参比目的,R6菌株中发现的全长spr1098的氨基酸序列在本文中列为SEQ ID NO:4。
本发明所用的优选spr1098多肽包含某氨基酸序列,该序列:(a)与SEQID NO:4具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:4的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1098蛋白包括SEQID NO:4的变体。(b)的优选片段包含来自SEQ ID NO:4的表位。其他优选片段缺少SEQ ID NO:4C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:4N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:4的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:187,其缺少天然前导肽序列。
(5)spr1345
参考文献84中将原始′spr1345′序列标注为′假拟蛋白′(参见GI:15903388)。出于参比目的,R6菌株中发现的全长spr1345的氨基酸序列在本文中列为SEQ ID NO:5。
本发明所用的优选spr1345多肽包含某氨基酸序列,该序列:(a)与SEQID NO:5具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:5的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1345蛋白包括SEQID NO:5的变体。(b)的优选片段包含来自SEQ ID NO:5的表位。其他优选片段缺少SEQ ID NO:5C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:5N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:5的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:188,其缺少天然前导肽和分选酶识别序列。
(6)spr1416
参考文献84中将原始′spr1416′序列标注为′假拟蛋白′(参见GI:15903459)。出于参比目的,R6菌株中发现的全长spr1416的氨基酸序列在本文中列为SEQ ID NO:6。
本发明所用的优选spr1416多肽包含某氨基酸序列,该序列:(a)与SEQID NO:6具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:6的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1416蛋白包括SEQID NO:6的变体。(b)的优选片段包含来自SEQ ID NO:6的表位。其他优选片段缺少SEQ ID NO:6C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:6N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:6的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
(7)spr1418
参考文献84中将原始′spr1418′序列标注为′假拟蛋白′(参见GI:15903461)。出于参比目的,R6菌株中发现的全长spr1418的氨基酸序列在本文中列为SEQ ID NO:7。
本发明所用的优选spr1418多肽包含某氨基酸序列,该序列:(a)与SEQID NO:7具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:7的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1418蛋白包括SEQID NO:7的变体。(b)的优选片段包含来自SEQ ID NO:7的表位。其他优选片段缺少SEQ ID NO:7C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:7N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:7的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
第二抗原组
(1)spr0867
参考文献84中将原始′spr0867′序列标注为′内切-β-N-乙酰氨基葡糖苷酶′(参见GI:15902911)。出于参比目的,R6菌株中发现的全长spr0867的氨基酸序列在本文中列为SEQ ID NO:8。
本发明所用的优选spr0867多肽包含某氨基酸序列,该序列:(a)与SEQID NO:8具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:8的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr0867蛋白包括SEQID NO:8的变体。(b)的优选片段包含来自SEQ ID NO:8的表位。其他优选片段缺少SEQ ID NO:8C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:8N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:8的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:185,其缺少天然前导肽序列。
(2)spr1431
参考文献84中将原始′spr1431′序列标注为′1,4-β-N-乙酰溶菌酶′(参见GI:15903474)。它也称为‘LytC’,参考文献67中报道了它的免疫应用。出于参比目的,R6菌株中发现的全长spr1431的氨基酸序列在本文中列为SEQID NO:9。
本发明所用的优选spr1431多肽包含某氨基酸序列,该序列:(a)与SEQID NO:9具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:9的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1431蛋白包括SEQID NO:9的变体。(b)的优选片段包含来自SEQ ID NO:9的表位。其他优选片段缺少SEQ ID NO:9C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:9N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:9的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:189,其缺少天然前导肽序列。
(3)spr1739
′spr1739′多肽是肺炎链球菌溶血素(例如,参见GI:15903781)。出于参比目的,R6菌株中发现的全长spr1739的氨基酸序列在本文中列为SEQ IDNO:10。
本发明所用的优选spr1739多肽包含某氨基酸序列,该序列:(a)与SEQID NO:10具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:10的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1739蛋白包括SEQ ID NO:10的变体。(b)的优选片段包含来自SEQ ID NO:10的表位。其他优选片段缺少SEQ ID NO:10C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:10N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:10的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
本领域已知用于疫苗接种应用的肺炎链球菌溶血素的多种形式[26,51-56],这些突变形式可用于本发明。可通过C-末端截短(例如参见,参考文献57),例如缺失34个氨基酸、45个氨基酸、7个氨基酸[58]等实现脱毒。根据SEQ ID NO:20编号,其他突变包括Pro325→Leu(如SEQ ID NO:169)和/或Trp433→Phe(如SEQ ID NO:171)。可将这些突变与C末端截短联用,以便将Pro325→Leu突变与7-聚体截短组合(如SEQ ID NO:170)。
(4)spr2021
参考文献84中将原始′spr2021′序列标注为′全身应激蛋白GSP-781′(参见GI:15904062)。出于参比目的,R6菌株中发现的全长spr2021的氨基酸序列在本文中列为SEQ ID NO:11。
本发明所用的优选spr2021多肽包含某氨基酸序列,该序列:(a)与SEQID NO:11具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:11的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr2021蛋白包括SEQ ID NO:11的变体。(b)的优选片段包含来自SEQ ID NO:11的表位。其他优选片段缺少SEQ ID NO:11C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:11N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:11的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:190,其缺少天然前导肽序列。
spr2021与其他肺炎球菌抗原的组合显示出良好的协同作用。
参考文献10将spr2021标注为与GbpB具有同源性的分泌型45kDa蛋白,还公开了它作为免疫原的应用(其中的SEQ ID NO:243;SP2216)。参考文献10的表1中鉴定了spr2021的免疫原性片段(第73页)。参考文献59的SEQ ID NO:1是spr2021的另一有用片段(本文SEQ ID NO:11的氨基酸28-278)。
第三抗原组
(1)spr0096
参考文献84中将原始′spr0096′序列标注为′假拟蛋白′(参见GI:15902140)。出于参比目的,R6菌株中发现的全长spr0096的氨基酸序列在本文中列为SEQ ID NO:12。
本发明所用的优选spr0096多肽包含某氨基酸序列,该序列:(a)与SEQID NO:12具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:12的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr0096蛋白包括SEQ ID NO:12的变体(如SEQ ID NO:40;见下)。(b)的优选片段包含来自SEQ ID NO:12的表位。其他优选片段缺少SEQ ID NO:12C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:12N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:12的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
spr0096与其他肺炎球菌抗原的组合显示出良好的协同作用。
相对于SEQ ID NO:12在C末端附近有插入物的spr0096的变体形式是本文所述的SEQ ID NO:40。参考文献10中报道将此种变体(其中的SEQID NO:150)用于免疫,在其中标注为LysM结构域蛋白。因此,本发明所用的spr0096可包含某氨基酸序列,该序列:(a)与SEQ ID NO:40具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:40的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些多肽包括SEQ ID NO:40的变体。(b)的优选片段包含来自SEQ ID NO:40的表位。其他优选片段缺少SEQ ID NO:40C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:40N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:40的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了SEQ ID NO:40的免疫原性片段。
spr0096多肽可以二聚体,如同源二聚体的形式使用。
(2)spr1433
参考文献84中将原始′spr1433′序列标注为′假拟蛋白′(参见GI:15903476)。出于参比目的,R6菌株中发现的全长spr1433的氨基酸序列在本文中列为SEQ ID NO:13。
本发明所用的优选spr1433多肽包含某氨基酸序列,该序列:(a)与SEQID NO:13具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:13的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1433蛋白包括SEQ ID NO:13的变体。(b)的优选片段包含来自SEQ ID NO:13的表位。其他优选片段缺少SEQ ID NO:13C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:13N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:13的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
(3)spr1707
参考文献84中将原始′spr1707′序列标注为′ABC转运蛋白底物结合蛋白-寡肽转运′(参见GI:15903749)。出于参比目的,R6菌株中发现的全长spr1707的氨基酸序列在本文中列为SEQ ID NO:14。
本发明所用的优选spr1707多肽包含某氨基酸序列,该序列:(a)与SEQID NO:14具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:14的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1707蛋白包括SEQ ID NO:14的变体(如SEQ ID NO:100;见下)。(b)的优选片段包含来自SEQ ID NO:14的表位。其他优选片段缺少SEQ ID NO:14C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:14N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:14的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
与SEQ ID NO:14相比4个氨基酸不同的spr1707的变体形式是本文所述的SEQ ID NO:100。参考文献10报道了SEQ ID NO:100的免疫应用(其中的SEQ ID NO:220)。因此,本发明所用的spr1707多肽可包含某氨基酸序列,该序列:(a)与SEQ ID NO:100具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:100的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些多肽包括SEQ ID NO:100的变体。(b)的优选片段包含来自SEQ IDNO:100的表位。其他优选片段缺少SEQ ID NO:100C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:100N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:100的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献10的表1中鉴定了SEQ ID NO:100的免疫原性片段。
其他肺炎球菌抗原
ClpP
ClpP是ATP依赖性Clp蛋白酶的蛋白水解亚基。出于参比目的,全长ClpP的氨基酸序列是本文所述的SEQ ID NO:16。在R6基因组中,ClpP是spr0656[84]。
本发明所用的优选ClpP多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:16具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:16的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些ClpP蛋白包括SEQID NO:16的变体。(b)的优选片段包含来自SEQ ID NO:16的表位。其他优选片段缺少SEQ ID NO:16C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:16N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:16的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献60和61报道了ClpP的免疫应用。它优选与PspA和PsaA和/或PspC联用[60]。
LytA
LytA是N-乙酰基胞壁酰-L-丙氨酸酰胺酶(自溶素)。出于参比目的,全长LytA的氨基酸序列是本文所述的SEQ ID NO:17。在R6基因组中,LytA是spr1754[84]。
本发明所用的优选LytA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:17具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:17的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些LytA蛋白包括SEQID NO:17的变体(如GI:18568354)。(b)的优选片段包含来自SEQ ID NO:17的表位。其他优选片段缺少SEQ ID NO:17C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:17N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:17的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献62报道了LytA的免疫应用,特别是含有与异源混杂T辅助细胞表位融合的LytA胆碱结合域的形式的应用。
PhtA
PhtA是肺炎球菌组氨酸三聚体(triad)蛋白A。出于参比目的,全长PhtA前体的氨基酸序列是本文所述的SEQ ID NO:18。在R6基因组中,PhtA是spr1061[84]。
本发明所用的优选PhtA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:18具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:18的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PhtA蛋白包括SEQID NO:18的变体。(b)的优选片段包含来自SEQ ID NO:18的表位。其他优选片段缺少SEQ ID NO:18C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:18N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:18的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献63和64报道了PhtA的免疫应用。
PhtB
PhtB是肺炎球菌组氨酸三聚体(triad)蛋白B。出于参比目的,全长PhtB前体的氨基酸序列是本文所述的SEQ ID NO:19。残基578处的Xaa可以是赖氨酸。
本发明所用的优选PhtB多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:19具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:19的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PhtB蛋白包括SEQID NO:19的变体。(b)的优选片段包含来自SEQ ID NO:19的表位。其他优选片段缺少SEQ ID NO:19C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:19N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:19的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献2、63和64报道了PhtB的免疫应用。
PhtD
PhtD是肺炎球菌组氨酸三聚体蛋白D。出于参比目的,全长PhtD前体的氨基酸序列是本文所述的SEQ ID NO:20。在R6基因组中,PhtD是spr0907[84]。
本发明所用的优选PhtD多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:20具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:20的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PhtD蛋白包括SEQID NO:20的变体。(b)的优选片段包含来自SEQ ID NO:20的表位。其他优选片段缺少SEQ ID NO:20C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:20N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:20的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献63、64和65报道了PhtD的免疫应用。
PhtE
PhtE是肺炎球菌组氨酸三聚体(triad)蛋白E。出于参比目的,全长PhtE前体的氨基酸序列是本文所述的SEQ ID NO:21。在R6基因组中,PhtE是spr0908[84]。
本发明所用的优选PhtE多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:21具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:21的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PhtE蛋白包括SEQID NO:21的变体。(b)的优选片段包含来自SEQ ID NO:21的表位。其他优选片段缺少SEQ ID NO:21C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:21N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:21的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献63和64报道了PhtE的免疫应用。
ZmpB
ZmpB是锌金属蛋白酶。出于参比目的,全长ZmpB的氨基酸序列是本文所述的SEQ ID NO:22。在R6基因组中,ZmpB是spr0581[84]。
本发明所用的优选ZmpB多肽包含某氨基酸序列,该序列:(a)与SEQID NO:22具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:22的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些ZmpB蛋白包括SEQ ID NO:22的变体。(b)的优选片段包含来自SEQ ID NO:22的表位。其他优选片段缺少SEQ ID NO:22C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:22N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:22的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
CbpD
CbpD是胆碱结合蛋白D。出于参比目的,全长CbpD的氨基酸序列是本文所述的SEQ ID NO:23。在R6基因组中,CbpD是spr2006[84]。
本发明所用的优选CbpD多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:23具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:23的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些CbpD蛋白包括SEQID NO:23的变体(如SEQ ID NO:119;见下)。(b)的优选片段包含来自SEQID NO:23的表位。其他优选片段缺少SEQ ID NO:23C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:23N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:23的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献67报道了CbpD的免疫应用。
在本文中,SEQ ID NO:23的变体是SEQ ID NO:119。参考文献10报道了SEQ ID NO:119的免疫应用(其中的SEQ ID NO:241)。因此,本发明所用的CbpD多肽可包含某氨基酸序列,该序列:(a)与SEQ ID NO:119具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:119的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些CbpD蛋白包括SEQ ID NO:119的变体。(b)的优选片段包含来自SEQ ID NO:119的表位。其他优选片段缺少SEQ ID NO:119C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:119N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:119的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献10的表1中鉴定了SEQ ID NO:119的免疫原性片段。
CbpG
CbpG是胆碱结合蛋白G。出于参比目的,全长CbpG的氨基酸序列是本文所述的SEQ ID NO:24。在R6基因组中,CbpG是spr0350[84]。
本发明所用的优选CbpG多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:24具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:24的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些CbpG蛋白包括SEQID NO:24的变体。(b)的优选片段包含来自SEQ ID NO:24的表位。其他优选片段缺少SEQ ID NO:24C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:24N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:24的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献67报道了CbpG的免疫应用。
PvaA
PvaA(肺炎链球菌肺炎球菌疫苗抗原A)也称为sp101。出于参比目的,全长PvaA的氨基酸序列是本文所述的SEQ ID NO:25。在R6基因组中,PvaA是spr0930[84]。
本发明所用的优选PvaA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:25具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:25的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PvaA蛋白包括SEQID NO:25的变体。(b)的优选片段包含来自SEQ ID NO:25的表位。其他优选片段缺少SEQ ID NO:25C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:25N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:25的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献1和318报道了PvaA的免疫应用。
CPL1
CPL1是肺炎球菌噬菌体CP1溶菌酶。出于参比目的,全长CPL1的氨基酸序列是本文所述的SEQ ID NO:26。
本发明所用的优选CPL1多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:26具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:26的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些CPL1蛋白包括SEQID NO:26的变体。(b)的优选片段包含来自SEQ ID NO:26的表位。其他优选片段缺少SEQ ID NO:26C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:26N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:26的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献62报道了CPL1的免疫应用,特别是含有与异源混杂T辅助细胞表位融合的CPL1胆碱结合域的形式的应用。
PspC
PspC是肺炎球菌表面蛋白C[66],也称为胆碱结合蛋白A(CbpA)。参考文献1和67报道了它的免疫应用。在R6菌株中它是spr1995,出于参比目的,在本文中全长spr1995的氨基酸序列是SEQ ID NO:15。
本发明所用的优选PspC多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:15具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:15的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr1995蛋白包括SEQ ID NO:15的变体(如SEQ ID NO:27;见下)。(b)的优选片段包含来自SEQ ID NO:15的表位。其他优选片段缺少SEQ ID NO:15C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:15N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:15的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
一种PspC变体称为‘Hic’。它类似于PspC,如参考文献68图1所示,该参考文献中报道它能结合于因子H(fH)。出于参比目的,全长Hic的氨基酸序列是本文所述的SEQ ID NO:27。Hic蛋白可用于本发明,以便与PspC多肽一起使用或替代PspC多肽。
本发明所用的优选Hic多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:27具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:27的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些Hic蛋白包括SEQID NO:27的变体。(b)的优选片段包含来自SEQ ID NO:27的表位。其他优选片段缺少SEQ ID NO:27C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:27N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:27的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
PspC和/或Hic宜与PspA和/或PsaA联用。
Pmp
Pmp是肽酰脯氨酰异构酶,也称为蛋白酶成熟蛋白。出于参比目的,全长Pmp的氨基酸序列是本文所述的SEQ ID NO:28。在R6基因组中,Pmp是spr0884[84]。
本发明所用的优选Pmp多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:28具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:28的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些Pmp蛋白包括SEQID NO:28的变体。(b)的优选片段包含来自SEQ ID NO:28的表位。其他优选片段缺少SEQ ID NO:28C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:28N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:28的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:186,其缺少天然前导肽序列。
参考文献69报道了Pmp的免疫应用。
PspA
PspA是肺炎球菌表面蛋白A。出于参比目的,全长PspA的氨基酸序列是本文所述的SEQ ID NO:29。在R6基因组中,PspA是spr0121[84]。
本发明所用的优选PspA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:29具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:29的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PspA蛋白包括SEQID NO:29的变体。(b)的优选片段包含来自SEQ ID NO:29的表位。其他优选片段缺少SEQ ID NO:29C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:29N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:29的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献70报道了PspA的免疫应用等。它宜与PspC联合给药。
PsaA
PsaA是肺炎球菌表面粘附素。出于参比目的,全长PsaA的氨基酸序列是本文所述的SEQ ID NO:30。
本发明所用的优选PsaA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:30具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:30的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PsaA蛋白包括SEQID NO:30的变体。(b)的优选片段包含来自SEQ ID NO:30的表位。其他优选片段缺少SEQ ID NO:30C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:30N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:30的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献59中的SEQ ID NO:3是PsaA的有用片段(对应于本文SEQID NO:30的氨基酸21-309)。
参考文献71报道了PsaA的免疫应用。它可与PspA和/或PspC联用。
PrtA
PrtA是细胞壁-相关性丝氨酸蛋白酶。它也称为sp128和sp130,属于枯草杆菌蛋白酶-样丝氨酸蛋白酶。出于参比目的,全长PrtA前体的氨基酸序列是本文所述的SEQ ID NO:31。在R6基因组中,PrtA是spr0561[84]。
本发明所用的优选PrtA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:31具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:31的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PrtA蛋白包括SEQID NO:31的变体。(b)的优选片段包含来自SEQ ID NO:31的表位。其他优选片段缺少SEQ ID NO:31C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:31N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:31的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献72和73,以及参考文献1报道了PrtA的免疫应用。
Sp133
Sp133是保守性肺炎球菌抗原。出于参比目的,全长Sp133的氨基酸序列是本文所述的SEQ ID NO:32。在R6基因组中,Sp133是spr0931[84]。
本发明所用的优选Sp133多肽包含某氨基酸序列,该序列:(a)与SEQID NO:32具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:32的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些Sp133蛋白包括SEQ ID NO:32的变体。(b)的优选片段包含来自SEQ ID NO:32的表位。其他优选片段缺少SEQ ID NO:32C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:32N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:32的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献74报道了Sp133的免疫应用。
PiaA
PiaA是参与肺炎球菌铁获取的膜通透酶。出于参比目的,全长PiaA的氨基酸序列是本文所述的SEQ ID NO:33。在R6基因组中,PiaA是spr0935[84]。
本发明所用的优选PiaA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:33具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:33的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PiaA蛋白包括SEQID NO:33的变体。(b)的优选片段包含来自SEQ ID NO:33的表位。其他优选片段缺少SEQ ID NO:33C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:33N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:33的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献75、76和77报道了PiaA的免疫应用,特别是与PiuA联用。
PiuA
PiuA是用于转运三价铁的ABC转运蛋白底物结合蛋白。它也称为FatB。出于参比目的,全长PiuA的氨基酸序列是本文所述的SEQ ID NO:34。在R6基因组中,PiuA是spr1687[84]。
本发明所用的优选PiuA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:34具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:34的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些PiuA蛋白包括SEQID NO:34的变体。(b)的优选片段包含来自SEQ ID NO:34的表位。其他优选片段缺少SEQ ID NO:34C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:34N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:34的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
参考文献75-77报道了PiuA的免疫应用,特别是与PiaA联用。
IC1
在参考文献10中,将IC1标注为假拟蛋白。出于参比目的,全长IC1的氨基酸序列是本文所述的SEQ ID NO:35。在R6基因组中,IC1是spr0008[84]。参考文献10中报道了IC1的免疫应用(其中的SEQ ID NO:145)。
本发明所用的优选IC1多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:35具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:35的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC1蛋白包括SEQID NO:35的变体。(b)的优选片段包含来自SEQ ID NO:35的表位。其他优选片段缺少SEQ ID NO:35C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:35N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:35的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC1的免疫原性片段。
IC2
IC2是po1A DNA聚合酶I。出于参比目的,全长IC2的氨基酸序列是本文所述的SEQ ID NO:36。在R6基因组中,IC2是spr0032[84]。参考文献10中报道了IC2的免疫应用(其中的SEQ ID NO:146)。
本发明所用的优选IC2多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:36具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:36的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC2蛋白包括SEQID NO:36的变体。(b)的优选片段包含来自SEQ ID NO:36的表位。其他优选片段缺少SEQ ID NO:36C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:36N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:36的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC2的免疫原性片段。
IC3
IC3是胆碱结合蛋白。出于参比目的,全长IC3的氨基酸序列是本文所述的SEQ ID NO:37。在R6基因组中,IC3是spr1945[84]。参考文献10中报道了IC3的免疫应用(其中的SEQ ID NO:147)。
本发明所用的优选IC3多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:37具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:37的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC3蛋白包括SEQID NO:37的变体。(b)的优选片段包含来自SEQ ID NO:37的表位。其他优选片段缺少SEQ ID NO:37C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:37N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:37的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC3的免疫原性片段。
IC4
IC4是IgA1蛋白酶。出于参比目的,全长IC4的氨基酸序列是本文所述的SEQ ID NO:38。在R6基因组中,IC4是spr1042[84]。参考文献10中报道了IC4的免疫应用(其中的SEQ ID NO:148)。
本发明所用的优选IC4多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:38具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:38的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC4蛋白包括SEQ ID NO:38的变体。(b)的优选片段包含来自SEQ ID NO:38的表位。其他优选片段缺少SEQ IDNO:38C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:38N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:38的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC4的免疫原性片段。
IC5
IC5标注为假拟蛋白,但它可能是细胞壁表面锚定蛋白。出于参比目的,全长IC5的氨基酸序列是本文所述的SEQ ID NO:39。在R6基因组中,IC5是spr0075[84]。参考文献10中报道了IC5的免疫应用(其中的SEQ ID NO:149)。
本发明所用的优选IC5多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:39具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:39的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC5蛋白包括SEQ ID NO:39的变体。(b)的优选片段包含来自SEQ ID NO:39的表位。其他优选片段缺少SEQ IDNO:39C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:39N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:39的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC5的免疫原性片段。
IC6
IC6是spr0096的变体形式,如上所述(本文中的SEQ ID NO:40)。可用于本发明的IC6多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:40具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQID NO:40的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC6蛋白包括SEQ ID NO:40的变体。(b)的优选片段包含来自SEQ ID NO:40的表位。其他优选片段缺少SEQ ID NO:40C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:40N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:40的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
IC7
在参考文献10中将IC7标注为假拟蛋白。出于参比目的,全长IC7的氨基酸序列是本文所述的SEQ ID NO:41。在R6基因组中,IC7是spr0174[84]。参考文献10中报道了IC7的免疫应用(其中的SEQ ID NO:152)。
本发明所用的优选IC7多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:41具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:41的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC7蛋白包括SEQ ID NO:41的变体。(b)的优选片段包含来自SEQ ID NO:41的表位。其他优选片段缺少SEQ IDNO:41C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:41N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:41的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC7的免疫原性片段。
IC8
IC8是二氢叶酸:叶酰聚谷氨酸合成酶。出于参比目的,全长IC8的氨基酸序列是本文所述的SEQ ID NO:42。在R6基因组中,IC8是spr0178[84]。参考文献10中报道了IC8的免疫应用(其中的SEQ ID NO:153)。
本发明所用的优选IC8多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:42具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:42的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC8蛋白包括SEQ ID NO:42的变体。(b)的优选片段包含来自SEQ ID NO:42的表位。其他优选片段缺少SEQ IDNO:42C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:42N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:42的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC8的免疫原性片段。
IC9
IC9是50S核糖体蛋白L2。出于参比目的,全长IC9的氨基酸序列是本文所述的SEQ ID NO:43。在R6基因组中,IC9是spr0191[84]。参考文献10中报道了IC9的免疫应用(其中的SEQ ID NO:154)。
本发明所用的优选IC9多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:43具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:43的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC9蛋白包括SEQ ID NO:43的变体。(b)的优选片段包含来自SEQ ID NO:43的表位。其他优选片段缺少SEQ IDNO:43C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:43N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:43的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC9的免疫原性片段。
IC10
IC10是30S核糖体蛋白S14。出于参比目的,全长IC10的氨基酸序列是本文所述的SEQ ID NO:44。在R6基因组中,IC10是spr0202[84]。参考文献10中报道了IC10的免疫应用(其中的SEQ ID NO:155)。
本发明所用的优选IC10多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:44具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:44的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC10蛋白包括SEQ ID NO:44的变体。(b)的优选片段包含来自SEQ ID NO:44的表位。其他优选片段缺少SEQID NO:44C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:44N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:44的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC10的免疫原性片段。
IC11
在参考文献10中将IC11标注为假拟蛋白。出于参比目的,全长IC11的氨基酸序列是本文所述的SEQ ID NO:45。在R6基因组中,IC11是spr0218[84]。参考文献10中报道了IC11的免疫应用(其中的SEQ ID NO:156)。
本发明所用的优选IC11多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:45具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:45的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC11蛋白包括SEQ ID NO:45的变体。(b)的优选片段包含来自SEQ ID NO:45的表位。其他优选片段缺少SEQID NO:45C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:45N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:45的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC11的免疫原性片段。
IC12
IC12是甲酸乙酰基转移酶3。出于参比目的,全长IC12的氨基酸序列是本文所述的SEQ ID NO:46。在R6基因组中,IC12是spr0232[84]。参考文献10中报道了IC12的免疫应用(其中的SEQ ID NO:157)。
本发明所用的优选IC12多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:46具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:46的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC12蛋白包括SEQ ID NO:46的变体。(b)的优选片段包含来自SEQ ID NO:46的表位。其他优选片段缺少SEQID NO:46C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:46N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:46的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC12的免疫原性片段。
IC13
IC13是30S核糖体蛋白S9。出于参比目的,全长IC13的氨基酸序列是本文所述的SEQ ID NO:47。在R6基因组中,IC13是spr0272[84]。参考文献10中报道了IC13的免疫应用(其中的SEQ ID NO:158)。
本发明所用的优选IC13多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:47具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:47的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC13蛋白包括SEQ ID NO:47的变体。(b)的优选片段包含来自SEQ ID NO:47的表位。其他优选片段缺少SEQID NO:47C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:47N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:47的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC13的免疫原性片段。
IC14
IC14是转录调节物。出于参比目的,全长IC14的氨基酸序列是本文所述的SEQ ID NO:48。在R6基因组中,IC14是spr0298[84]。参考文献10中报道了IC14的免疫应用(其中的SEQ ID NO:159)。
本发明所用的优选IC14多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:48具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:48的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC14蛋白包括SEQ ID NO:48的变体。(b)的优选片段包含来自SEQ ID NO:48的表位。其他优选片段缺少SEQID NO:48C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:48N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:48的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC14的免疫原性片段。
IC15
在参考文献10中将IC15标注为细胞壁表面锚定蛋白家族的蛋白质。出于参比目的,全长IC15的氨基酸序列是本文所述的SEQ ID NO:49。在R6基因组中,IC15是spr0328[84]。参考文献10中报道了IC15的免疫应用(其中的SEQ ID NO:160),参考文献78证明它具有保护作用(抗原SP0368)。
本发明所用的优选IC15多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:49具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:49的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC15蛋白包括SEQ ID NO:49的变体。(b)的优选片段包含来自SEQ ID NO:49的表位。其他优选片段缺少SEQID NO:49C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:49N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:49的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC15的免疫原性片段。
IC16
IC16是青霉素结合蛋白1A。出于参比目的,全长IC16的氨基酸序列是本文所述的SEQ ID NO:50。在R6基因组中,IC16是spr0329[84]。参考文献10中报道了IC16的免疫应用(其中的SEQ ID NO:161)。
本发明所用的优选IC16多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:50具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:50的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC16蛋白包括SEQ ID NO:50的变体。(b)的优选片段包含来自SEQ ID NO:50的表位。其他优选片段缺少SEQID NO:50C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:50N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:50的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC16的免疫原性片段。
IC17
在参考文献10中将IC17标注为假拟蛋白。出于参比目的,全长IC17的氨基酸序列是本文所述的SEQ ID NO:51。在R6基因组中,IC17是spr0334[84]。参考文献10中报道了IC17的免疫应用(其中的SEQ ID NO:162)。
本发明所用的优选IC17多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:51具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:51的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC17蛋白包括SEQ ID NO:51的变体。(b)的优选片段包含来自SEQ ID NO:51的表位。其他优选片段缺少SEQID NO:51C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:51N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:51的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC17的免疫原性片段。
IC18
在参考文献10中将IC18标注为胆碱结合蛋白F。出于参比目的,全长IC18的氨基酸序列是本文所述的SEQ ID NO:52。在R6基因组中,IC18是spr0337[84]。参考文献10中报道了IC18的免疫应用(其中的SEQ ID NO:163)。
本发明所用的优选IC18多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:52具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:52的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC18蛋白包括SEQ ID NO:52的变体。(b)的优选片段包含来自SEQ ID NO:52的表位。其他优选片段缺少SEQID NO:52C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:52N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:52的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC18的免疫原性片段。
IC19
在参考文献10中将IC19标注为胆碱结合蛋白J(cbpJ)。出于参比目的,全长IC19的氨基酸序列是本文所述的SEQ ID NO:53。参考文献10中报道了IC19的免疫应用(其中的SEQ ID NO:164)。
本发明所用的优选IC19多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:53具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:53的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC19蛋白包括SEQ ID NO:53的变体。(b)的优选片段包含来自SEQ ID NO:53的表位。其他优选片段缺少SEQID NO:53C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:53N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:53的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC19的免疫原性片段。
IC20
IC20是胆碱结合蛋白G。出于参比目的,全长IC20的氨基酸序列是本文所述的SEQ ID NO:54。在R6基因组中,IC20是spr0349[84]。参考文献10中报道了IC20的免疫应用(其中的SEQ ID NO:165)。
本发明所用的优选IC20多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:54具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:54的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC20蛋白包括SEQ ID NO:54的变体。(b)的优选片段包含来自SEQ ID NO:54的表位。其他优选片段缺少SEQID NO:54C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:54N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:54的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC20的免疫原性片段。
IC21
在参考文献10中将IC21标注为假拟蛋白。出于参比目的,全长IC21的氨基酸序列是本文所述的SEQ ID NO:55。在R6基因组中,IC21是spr0410[84]。参考文献10中报道了IC21的免疫应用(其中的SEQ ID NO:166)。
本发明所用的优选IC21多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:55具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:55的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC21蛋白包括SEQ ID NO:55的变体。(b)的优选片段包含来自SEQ ID NO:55的表位。其他优选片段缺少SEQID NO:55C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:55N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:55的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC21的免疫原性片段。
IC22
在参考文献10中将IC22标注为细胞壁表面锚定蛋白家族的蛋白质。出于参比目的,全长IC22的氨基酸序列是本文所述的SEQ ID NO:56。在R6基因组中,IC22是spr0051[84]。参考文献10中报道了IC22的免疫应用(其中的SEQ ID NO:167)。
本发明所用的优选IC22多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:56具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:56的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC22蛋白包括SEQ ID NO:56的变体。(b)的优选片段包含来自SEQ ID NO:56的表位。其他优选片段缺少SEQID NO:56C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:56N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:56的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC22的免疫原性片段。
IC23
IC23是分选酶(cf.spr1098)。出于参比目的,全长IC23的氨基酸序列是本文所述的SEQ ID NO:57。参考文献10中报道了IC23的免疫应用(其中的SEQID NO:168)。
本发明所用的优选IC23多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:57具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:57的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC23蛋白包括SEQ ID NO:57的变体。(b)的优选片段包含来自SEQ ID NO:57的表位。其他优选片段缺少SEQID NO:57C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:57N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:57的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC23的免疫原性片段。
IC24
IC24是分选酶(cf.spr1098)。出于参比目的,全长IC24的氨基酸序列是本文所述的SEQ ID NO:58。参考文献10中报道了IC24的免疫应用(其中的SEQID NO:169)。
本发明所用的优选IC24多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:58具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:58的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC24蛋白包括SEQ ID NO:58的变体。(b)的优选片段包含来自SEQ ID NO:58的表位。其他优选片段缺少SEQID NO:58C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:58N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:58的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC24的免疫原性片段。
IC25
在参考文献10中将IC25标注为推定的内切-β-N-乙酰氨基葡糖苷酶。出于参比目的,全长IC25的氨基酸序列是本文所述的SEQ ID NO:59。在R6基因组中,IC25是spr0440[84]。参考文献10中报道了IC25的免疫应用(其中的SEQ ID NO:170)。
本发明所用的优选IC25多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:59具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:59的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC25蛋白包括SEQ ID NO:59的变体。(b)的优选片段包含来自SEQ ID NO:59的表位。其他优选片段缺少SEQID NO:59C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:59N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:59的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC25的免疫原性片段。
IC26
IC26是EcoE I型限制性修饰酶。出于参比目的,全长IC26的氨基酸序列是本文所述的SEQ ID NO:60。在R6基因组中,IC26是spr0449[84]。参考文献10中报道了IC26的免疫应用(其中的SEQ ID NO:171)。
本发明所用的优选IC26多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:60具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:60的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC26蛋白包括SEQ ID NO:60的变体。(b)的优选片段包含来自SEQ ID NO:60的表位。其他优选片段缺少SEQID NO:60C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:60N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:60的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC26的免疫原性片段。
IC27
在参考文献10中将IC27标注为dnaJ蛋白。出于参比目的,全长IC27的氨基酸序列是本文所述的SEQ ID NO:61。在R6基因组中,IC27是spr0456[84]。参考文献10中报道了IC27的免疫应用(其中的SEQ ID NO:172)。
本发明所用的优选IC27多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:61具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:61的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC27蛋白包括SEQ ID NO:61的变体。(b)的优选片段包含来自SEQ ID NO:61的表位。其他优选片段缺少SEQID NO:61C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:61N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:61的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC27的免疫原性片段。
IC28
在参考文献10中将IC28标注为BlpC ABC转运蛋白(blpB)。出于参比目的,全长IC28的氨基酸序列是本文所述的SEQ ID NO:62。在R6基因组中,IC28是spr0466[84]。参考文献10中报道了IC28的免疫应用(其中的SEQ IDNO:173)。
本发明所用的优选IC28多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:62具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:62的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC28蛋白包括SEQ ID NO:62的变体。(b)的优选片段包含来自SEQ ID NO:62的表位。其他优选片段缺少SEQID NO:62C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:62N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:62的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC28的免疫原性片段。
IC29
在参考文献10中将IC29标注为假拟蛋白。出于参比目的,全长IC29的氨基酸序列是本文所述的SEQ ID NO:63。在R6基因组中,IC29是spr0488[84]。参考文献10中报道了IC29的免疫应用(其中的SEQ ID NO:174)。
本发明所用的优选IC29多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:63具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:63的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC29蛋白包括SEQ ID NO:63的变体。(b)的优选片段包含来自SEQ ID NO:63的表位。其他优选片段缺少SEQID NO:63C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:63N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:63的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC29的免疫原性片段。
IC30
IC30是ABC转运蛋白底物结合蛋白。出于参比目的,全长IC30的氨基酸序列是本文所述的SEQ ID NO:64。在R6基因组中,IC30是spr0534[84]。参考文献10中报道了IC30的免疫应用(其中的SEQ ID NO:175)。
本发明所用的优选IC30多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:64具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:64的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC30蛋白包括SEQ ID NO:64的变体。(b)的优选片段包含来自SEQ ID NO:64的表位。其他优选片段缺少SEQID NO:64C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:64N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:64的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC30的免疫原性片段。
IC31
在参考文献10中将IC31标注为金属-β-内酰胺酶超家族的蛋白质。出于参比目的,全长IC31的氨基酸序列是本文所述的SEQ ID NO:65。在R6基因组中,IC31是spr0538[84]。参考文献10中报道了IC31的免疫应用(其中的SEQ ID NO:176)。
本发明所用的优选IC31多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:65具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:65的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC31蛋白包括SEQ ID NO:65的变体。(b)的优选片段包含来自SEQ ID NO:65的表位。其他优选片段缺少SEQID NO:65C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:65N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:65的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC31的免疫原性片段。
IC32
IC32是spr0565的变体形式,如上所述(本文中的SEQ ID NO:66)。有用的IC32多肽可包含某氨基酸序列,该序列:(a)与SEQ ID NO:66具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:66的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC32多肽包括SEQ ID NO:66的变体。(b)的优选片段包含来自SEQ ID NO:66的表位。其他优选片段缺少SEQ ID NO:66C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:66N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:66的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了SEQ IDNO:66的免疫原性片段。
IC33
在参考文献10中将IC33标注为推定的肺炎球菌表面蛋白。出于参比目的,全长IC33的氨基酸序列是本文所述的SEQ ID NO:67。在R6基因组中,IC33是spr0583[84]。参考文献10中报道了IC33的免疫应用(其中的SEQ ID NO:180),参考文献78证明它具有保护作用(抗原SP0667)。
本发明所用的优选IC33多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:67具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:67的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC33蛋白包括SEQ ID NO:67的变体。(b)的优选片段包含来自SEQ ID NO:67的表位。其他优选片段缺少SEQID NO:67C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:67N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:67的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC33的免疫原性片段。
IC34
IC34是UDP-N-乙酰基胞壁酰-L-丙氨酰-D-谷氨酸合成酶。出于参比目的,全长IC34的氨基酸序列是本文所述的SEQ ID NO:68。在R6基因组中,IC34是spr0603[84]。参考文献10中报道了IC34的免疫应用(其中的SEQ IDNO:181)。
本发明所用的优选IC34多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:68具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:68的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC34蛋白包括SEQ ID NO:68的变体。(b)的优选片段包含来自SEQ ID NO:68的表位。其他优选片段缺少SEQID NO:68C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:68N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:68的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC34的免疫原性片段。
IC35
IC35是ABC转运蛋白底物结合蛋白。出于参比目的,全长IC35的氨基酸序列是本文所述的SEQ ID NO:69。在R6基因组中,IC35是spr0659[84]。参考文献10中报道了IC35的免疫应用(其中的SEQ ID NO:182)。
本发明所用的优选IC35多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:69具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:69的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC35蛋白包括SEQ ID NO:69的变体。(b)的优选片段包含来自SEQ ID NO:69的表位。其他优选片段缺少SEQID NO:69C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:69N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:69的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC35的免疫原性片段。
IC36
IC36是ABC转运蛋白ATP-结合蛋白。出于参比目的,全长IC36的氨基酸序列是本文所述的SEQ ID NO:70。在R6基因组中,IC36是spr0678[84]。参考文献10中报道了IC36的免疫应用(其中的SEQ ID NO:183)。
本发明所用的优选IC36多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:70具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:70的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC36蛋白包括SEQ ID NO:70的变体。(b)的优选片段包含来自SEQ ID NO:70的表位。其他优选片段缺少SEQID NO:70C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:70N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:70的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC36的免疫原性片段。
IC37
在参考文献10中将IC37标注为假拟蛋白。出于参比目的,全长IC37的氨基酸序列是本文所述的SEQ ID NO:71。在R6基因组中,IC37是spr0693[84]。参考文献10中报道了IC37的免疫应用(其中的SEQ ID NO:184)。
本发明所用的优选IC37多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:71具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:71的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC37蛋白包括SEQ ID NO:71的变体。(b)的优选片段包含来自SEQ ID NO:71的表位。其他优选片段缺少SEQID NO:71C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:71N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:71的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC37的免疫原性片段。
IC38
在参考文献10中将IC38标注为被截短的根瘤素相关蛋白。出于参比目的,全长IC38的氨基酸序列是本文所述的SEQ ID NO:72。在R6基因组中,IC38是spr0814[84]。参考文献10中报道了IC38的免疫应用(其中的SEQ ID NO:185)。
本发明所用的优选IC38多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:72具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:72的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC38蛋白包括SEQ ID NO:72的变体。(b)的优选片段包含来自SEQ ID NO:72的表位。其他优选片段缺少SEQID NO:72C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:72N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:72的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC38的免疫原性片段。
IC39
IC39是磷壁酸磷酸胆碱酯酶/胆碱结合蛋白E(cbpE)。它也可称为‘LytD’。出于参比目的,全长IC39的氨基酸序列是本文所述的SEQ ID NO:73。在R6基因组中,IC39是spr0831[84]。参考文献10中报道了IC39的免疫应用(其中的SEQ ID NO:186)。
本发明所用的优选IC39多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:73具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:73的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC39蛋白包括SEQ ID NO:73的变体。(b)的优选片段包含来自SEQ ID NO:73的表位。其他优选片段缺少SEQID NO:73C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:73N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:73的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC39的免疫原性片段。
IC40
IC40是葡萄糖抑制的分裂蛋白A。出于参比目的,全长IC40的氨基酸序列是本文所述的SEQ ID NO:74。在R6基因组中,IC40是spr0844[84]。参考文献10中报道了IC40的免疫应用(其中的SEQ ID NO:187)。
本发明所用的优选IC40多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:74具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:74的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC40蛋白包括SEQ ID NO:74的变体。(b)的优选片段包含来自SEQ ID NO:74的表位。其他优选片段缺少SEQID NO:74C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:74N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:74的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC40的免疫原性片段。
IC41
IC41是截短的丙氨酸脱氢酶。出于参比目的,全长IC41的氨基酸序列是本文所述的SEQ ID NO:75。在R6基因组中,IC41是spr0854[84]。参考文献10中报道了IC41的免疫应用(其中的SEQ ID NO:188)。
本发明所用的优选IC41多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:75具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:75的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC41蛋白包括SEQ ID NO:75的变体。(b)的优选片段包含来自SEQ ID NO:75的表位。其他优选片段缺少SEQID NO:75C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:75N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:75的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC41的免疫原性片段。
IC42
IC42是糖原合酶。出于参比目的,全长IC42的氨基酸序列是本文所述的SEQ ID NO:76。在R6基因组中,IC42是spr1032[84]。参考文献10中报道了IC42的免疫应用(其中的SEQ ID NO:191)。
本发明所用的优选IC42多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:76具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:76的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC42蛋白包括SEQ ID NO:76的变体。(b)的优选片段包含来自SEQ ID NO:76的表位。其他优选片段缺少SEQID NO:76C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:76N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:76的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC42的免疫原性片段。
IC43
IC43是免疫球蛋白A1蛋白酶。出于参比目的,全长IC43的氨基酸序列是本文所述的SEQ ID NO:77。参考文献10中报道了IC43的免疫应用(其中的SEQ ID NO:192)。
本发明所用的优选IC43多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:77具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:77的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC43蛋白包括SEQ ID NO:77的变体。(b)的优选片段包含来自SEQ ID NO:77的表位。其他优选片段缺少SEQID NO:77C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:77N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:77的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC43的免疫原性片段。
IC44
IC44是未鉴定的限制性酶。出于参比目的,全长IC44的氨基酸序列是本文所述的SEQ ID NO:78。在R6基因组中,IC44是spr1101[84]。参考文献10中报道了IC44的免疫应用(其中的SEQ ID NO:195)。
本发明所用的优选IC44多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:78具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:78的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC44蛋白包括SEQ ID NO:78的变体。(b)的优选片段包含来自SEQ ID NO:78的表位。其他优选片段缺少SEQID NO:78C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:78N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:78的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC44的免疫原性片段。
IC45
IC45是反应调节蛋白。出于参比目的,全长IC45的氨基酸序列是本文所述的SEQ ID NO:79。在R6基因组中,IC45是spr1107[84]。参考文献10中报道了IC45的免疫应用(其中的SEQ ID NO:196)。
本发明所用的优选IC45多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:79具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:79的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC45蛋白包括SEQ ID NO:79的变体。(b)的优选片段包含来自SEQ ID NO:79的表位。其他优选片段缺少SEQID NO:79C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:79N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:79的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC45的免疫原性片段。
IC46
IC46是ABC转运蛋白跨膜通透酶。出于参比目的,全长IC46的氨基酸序列是本文所述的SEQ ID NO:80。在R6基因组中,IC46是spr1120[84]。参考文献10中报道了IC46的免疫应用(其中的SEQ ID NO:197)。
本发明所用的优选IC46多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:80具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:80的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC46蛋白包括SEQ ID NO:80的变体。(b)的优选片段包含来自SEQ ID NO:80的表位。其他优选片段缺少SEQID NO:80C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:80N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:80的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC46的免疫原性片段。
IC47
IC47是信号识别颗粒。出于参比目的,全长IC47的氨基酸序列是本文所述的SEQ ID NO:81。在R6基因组中,IC47是spr1166[84]。参考文献10中报道了IC47的免疫应用(其中的SEQ ID NO:198)。
本发明所用的优选IC47多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:81具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:81的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC47蛋白包括SEQ ID NO:81的变体。(b)的优选片段包含来自SEQ ID NO:81的表位。其他优选片段缺少SEQID NO:81C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:81N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:81的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC47的免疫原性片段。
IC48
IC48是N-乙酰基甘露糖胺-6-磷酸2-差向异构酶。出于参比目的,全长IC48的氨基酸序列是本文所述的SEQ ID NO:82。在R6基因组中,IC48是spr1529[84]。参考文献10中报道了IC48的免疫应用(其中的SEQ ID NO:199)。
本发明所用的优选IC48多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:82具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:82的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC48蛋白包括SEQ ID NO:82的变体。(b)的优选片段包含来自SEQ ID NO:82的表位。其他优选片段缺少SEQID NO:82C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:82N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:82的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC48的免疫原性片段。
IC49
IC49是分支酸合酶。出于参比目的,全长IC49的氨基酸序列是本文所述的SEQ ID NO:83。在R6基因组中,IC49是spr1232[84]。参考文献10中报道了IC49的免疫应用(其中的SEQ ID NO:200)。
本发明所用的优选IC49多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:83具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:83的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC49蛋白包括SEQ ID NO:83的变体。(b)的优选片段包含来自SEQ ID NO:83的表位。其他优选片段缺少SEQID NO:83C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:83N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:83的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC49的免疫原性片段。
IC50
在参考文献10中将IC50标注为假拟蛋白。出于参比目的,全长IC50的氨基酸序列是本文所述的SEQ ID NO:84。在R6基因组中,IC50是spr1236[84]。参考文献10中报道了IC50的免疫应用(其中的SEQ ID NO:201)。
本发明所用的优选IC50多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:84具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:84的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC50蛋白包括SEQ ID NO:84的变体。(b)的优选片段包含来自SEQ ID NO:84的表位。其他优选片段缺少SEQID NO:84C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:84N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:84的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC50的免疫原性片段。
IC51
IC51是蛋白酶。出于参比目的,全长IC51的氨基酸序列是本文所述的SEQID NO:85。在R6基因组中,IC51是spr1284[84]。参考文献10中报道了IC51的免疫应用(其中的SEQ ID NO:202)。
本发明所用的优选IC51多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:85具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:85的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC51蛋白包括SEQ ID NO:85的变体。(b)的优选片段包含来自SEQ ID NO:85的表位。其他优选片段缺少SEQID NO:85C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:85N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:85的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC51的免疫原性片段。
IC52
在参考文献10中,将IC52标注为氧化还原酶或醛/酮还原酶。出于参比目的,全长IC52的氨基酸序列是本文所述的SEQ ID NO:86。在R6基因组中,IC52是spr1332[84]。参考文献10中报道了IC52的免疫应用(其中的SEQID NO:203)。
本发明所用的优选IC52多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:86具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:86的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC52蛋白包括SEQ ID NO:86的变体。(b)的优选片段包含来自SEQ ID NO:86的表位。其他优选片段缺少SEQID NO:86C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:86N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:86的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC52的免疫原性片段。
IC53
在参考文献10中将IC53标注为假拟蛋白。出于参比目的,全长IC53的氨基酸序列是本文所述的SEQ ID NO:87。在R6基因组中,IC53是spr1370[84]。参考文献10中报道了IC53的免疫应用(其中的SEQ ID NO:204)。
本发明所用的优选IC53多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:87具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:87的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC53蛋白包括SEQ ID NO:87的变体。(b)的优选片段包含来自SEQ ID NO:87的表位。其他优选片段缺少SEQID NO:87C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:87N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:87的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC53的免疫原性片段。
IC54
IC54标注为保守性结构域蛋白。出于参比目的,全长IC54的氨基酸序列是本文所述的SEQ ID NO:88。在R6基因组中,IC54是spr1374[84]。参考文献10中报道了IC54的免疫应用(其中的SEQ ID NO:205)。
本发明所用的优选IC54多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:88具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:88的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC54蛋白包括SEQ ID NO:88的变体。(b)的优选片段包含来自SEQ ID NO:88的表位。其他优选片段缺少SEQID NO:88C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:88N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:88的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC54的免疫原性片段。
IC55
IC55是ABC转运蛋白底物结合蛋白。出于参比目的,全长IC55的氨基酸序列是本文所述的SEQ ID NO:89。在R6基因组中,IC55是spr1382[84]。参考文献10中报道了IC55的免疫应用(其中的SEQ ID NO:206)。
本发明所用的优选IC55多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:89具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:89的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC55蛋白包括SEQ ID NO:89的变体。(b)的优选片段包含来自SEQ ID NO:89的表位。其他优选片段缺少SEQID NO:89C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:89N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:89的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC55的免疫原性片段。
IC56
在参考文献10中将IC56标注为假拟蛋白。出于参比目的,全长IC56的氨基酸序列是本文所述的SEQ ID NO:90。在R6基因组中,IC56是spr1457[84]。参考文献10中报道了IC56的免疫应用(其中的SEQ ID NO:208)。
本发明所用的优选IC56多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:90具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:90的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC56蛋白包括SEQ ID NO:90的变体。(b)的优选片段包含来自SEQ ID NO:90的表位。其他优选片段缺少SEQID NO:90C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:90N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:90的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC56的免疫原性片段。
IC57
IC57是细胞分裂启动蛋白。出于参比目的,全长IC57的氨基酸序列是本文所述的SEQ ID NO:91。在R6基因组中,IC57是spr1505[84]。参考文献10中报道了IC57的免疫应用(其中的SEQ ID NO:209)。
本发明所用的优选IC57多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:91具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:91的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC57蛋白包括SEQ ID NO:91的变体。(b)的优选片段包含来自SEQ ID NO:91的表位。其他优选片段缺少SEQID NO:91C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:91N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:91的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC57的免疫原性片段。
IC58
在参考文献10中将IC58标注为ylmF蛋白。出于参比目的,全长IC58的氨基酸序列是本文所述的SEQ ID NO:92。在R6基因组中,IC58是spr1508[84]。参考文献10中报道了IC58的免疫应用(其中的SEQ ID NO:210)。
本发明所用的优选IC58多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:92具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:92的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC58蛋白包括SEQ ID NO:92的变体。(b)的优选片段包含来自SEQ ID NO:92的表位。其他优选片段缺少SEQID NO:92C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:92N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:92的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC58的免疫原性片段。
IC59
IC59是N-乙酰基神经氨酸裂合酶亚基。出于参比目的,全长IC59的氨基酸序列是本文所述的SEQ ID NO:93。在R6基因组中,IC59是spr1186[84]。参考文献10中报道了IC59的免疫应用(其中的SEQ ID NO:211)。
本发明所用的优选IC59多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:93具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:93的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC59蛋白包括SEQ ID NO:93的变体。(b)的优选片段包含来自SEQ ID NO:93的表位。其他优选片段缺少SEQID NO:93C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:93N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:93的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC59的免疫原性片段。
IC60
IC60是真核型丝氨酸/苏氨酸激酶(StkP)。出于参比目的,全长IC60的氨基酸序列是本文所述的SEQ ID NO:94。在R6基因组中,IC60是spr1577[84]。参考文献10中报道了IC60的免疫应用(其中的SEQ ID NO:214),参考文献78中报道它是先导候选疫苗。
本发明所用的优选IC60多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:94具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:94的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC60蛋白包括SEQ ID NO:94的变体。(b)的优选片段包含来自SEQ ID NO:94的表位。其他优选片段缺少SEQIDNO:94C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:94N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:94的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC60的免疫原性片段。另一有用片段是参考文献59公开的SEQID NO:2(对应于本文SEQ ID NO:94的氨基酸345-659)。
IC61
IC61是甲硫氨酰基-tRNA甲酰基转移酶。出于参比目的,全长IC61的氨基酸序列是本文所述的SEQ ID NO:95。在R6基因组中,IC61是spr1580[84]。参考文献10中报道了IC61的免疫应用(其中的SEQ ID N0:215)。
本发明所用的优选IC61多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:95具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:95的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC61蛋白包括SEQ ID NO:95的变体。(b)的优选片段包含来自SEQ ID NO:95的表位。其他优选片段缺少SEQID NO:95C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:95N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:95的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC61的免疫原性片段。
IC62
IC62是易位酶。出于参比目的,全长IC62的氨基酸序列是本文所述的SEQID NO:96。在R6基因组中,IC62是spr1544[84]。参考文献10中报道了IC62的免疫应用(其中的SEQ ID NO:216)。
本发明所用的优选IC62多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:96具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:96的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC62蛋白包括SEQ ID NO:96的变体。(b)的优选片段包含来自SEQ ID NO:96的表位。其他优选片段缺少SEQID NO:96C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:96N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:96的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC62的免疫原性片段。
IC63
在参考文献10中将IC63标注为细胞壁表面锚定蛋白家族的蛋白质。出于参比目的,全长IC63的氨基酸序列是本文所述的SEQ ID NO:97。在R6基因组中,IC63是spr1403[84]。参考文献10中报道了IC63的免疫应用(其中的SEQ ID NO:217)。
本发明所用的优选IC63多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:97具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:97的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC63蛋白包括SEQ ID NO:97的变体。(b)的优选片段包含来自SEQ ID NO:97的表位。其他优选片段缺少SEQID NO:97C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:97N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:97的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC63的免疫原性片段。
IC64
在参考文献10中将IC64标注为推定的全身应激蛋白24。出于参比目的,全长IC64的氨基酸序列是本文所述的SEQ ID NO:98。在R6基因组中,IC64是spr1625[84]。参考文献10中报道了IC64的免疫应用(其中的SEQ ID NO:218)。
本发明所用的优选IC64多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:98具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:98的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC64蛋白包括SEQ ID NO:98的变体。(b)的优选片段包含来自SEQ ID NO:98的表位。其他优选片段缺少SEQID NO:98C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:98N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:98的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC64的免疫原性片段。
IC65
IC65是ABC转运蛋白ATP-结合蛋白。出于参比目的,全长IC65的氨基酸序列是本文所述的SEQ ID NO:99。在R6基因组中,IC65是spr1704[84]。参考文献10中报道了IC65的免疫应用(其中的SEQ ID NO:219)。
本发明所用的优选IC65多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:99具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:99的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC65蛋白包括SEQ ID NO:99的变体。(b)的优选片段包含来自SEQ ID NO:99的表位。其他优选片段缺少SEQID NO:99C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:99N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:99的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC65的免疫原性片段。
IC66
如上所述,IC66是spr1707的变体形式。可用于本发明的IC66多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:100具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:100的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC66蛋白包括SEQ ID NO:100的变体。(b)的优选片段包含来自SEQID NO:100的表位。其他优选片段缺少SEQ ID NO:100C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQID NO:100N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:100的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
IC67
IC67是枯草杆菌蛋白酶-样丝氨酸蛋白酶。出于参比目的,全长IC67的氨基酸序列是本文所述的SEQ ID NO:101。在R6基因组中,IC67是spr1771[84]。参考文献10中报道了IC67的免疫应用(其中的SEQ ID NO:222)。
本发明所用的优选IC67多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:101具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:101的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC67蛋白包括SEQ ID NO:101的变体。(b)的优选片段包含来自SEQ ID NO:101的表位。其他优选片段缺少SEQ ID NO:101C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:101N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:101的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC67的免疫原性片段。
IC68
IC68是Cmp-结合因子1。出于参比目的,全长IC68的氨基酸序列是本文所述的SEQ ID NO:102。在R6基因组中,IC68是spr1794[84]。参考文献10中报道了IC68的免疫应用(其中的SEQ ID NO:223)。
本发明所用的优选IC68多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:102具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:102的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC68蛋白包括SEQ ID NO:102的变体。(b)的优选片段包含来自SEQ ID NO:102的表位。其他优选片段缺少SEQ ID NO:102C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:102N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:102的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC68的免疫原性片段。
IC69
在参考文献10中将IC69标注为细胞壁表面锚定蛋白家族的蛋白质。出于参比目的,全长IC69的氨基酸序列是本文所述的SEQ ID NO:103。在R6基因组中,IC69是spr1806[84]。参考文献10中报道了IC69的免疫应用(其中的SEQ ID NO:224)。
本发明所用的优选IC69多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:103具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:103的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC69蛋白包括SEQ ID NO:103的变体。(b)的优选片段包含来自SEQ ID NO:103的表位。其他优选片段缺少SEQ ID NO:103C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:103N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:103的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC69的免疫原性片段。
IC70
IC70是分解代谢物控制蛋白A。出于参比目的,全长IC70的氨基酸序列是本文所述的SEQ ID NO:104。在R6基因组中,IC70是spr1813[84]。参考文献10中报道了IC70的免疫应用(其中的SEQ ID NO:225)。
本发明所用的优选IC70多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:104具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:104的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC70蛋白包括SEQ ID NO:104的变体。(b)的优选片段包含来自SEQ ID NO:104的表位。其他优选片段缺少SEQ ID NO:104C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:104N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:104的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC70的免疫原性片段。
IC71
IC71是β-葡糖苷酶。出于参比目的,全长IC71的氨基酸序列是本文所述的SEQ ID NO:105。在R6基因组中,IC71是spr1833[84]。参考文献10中报道了IC71的免疫应用(其中的SEQ ID NO:226)。
本发明所用的优选IC71多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:105具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:105的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC71蛋白包括SEQ ID NO:105的变体。(b)的优选片段包含来自SEQ ID NO:105的表位。其他优选片段缺少SEQ ID NO:105C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:105N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:105的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC71的免疫原性片段。
IC72
在参考文献10中将IC72标注为假拟蛋白。出于参比目的,全长IC72的氨基酸序列是本文所述的SEQ ID NO:106。在R6基因组中,IC72是spr1838[84]。参考文献10中报道了IC72的免疫应用(其中的SEQ ID NO:227)。
本发明所用的优选IC72多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:106具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:106的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC72蛋白包括SEQ ID NO:106的变体。(b)的优选片段包含来自SEQ ID NO:106的表位。其他优选片段缺少SEQ ID NO:106C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:106N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:106的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC72的免疫原性片段。
IC73
在参考文献10中将IC73标注为假拟蛋白。出于参比目的,全长IC73的氨基酸序列是本文所述的SEQ ID NO:107。在R6基因组中,IC73是spr1850[84]。参考文献10中报道了IC73的免疫应用(其中的SEQ ID NO:228)。
本发明所用的优选IC73多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:107具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:107的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC73蛋白包括SEQ IDNO:107的变体。(b)的优选片段包含来自SEQ ID NO:107的表位。其他优选片段缺少SEQ ID NO:107C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:107N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:107的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC73的免疫原性片段。
IC74
在参考文献10中将IC74标注为假拟蛋白。出于参比目的,全长IC74的氨基酸序列是本文所述的SEQ ID NO:108。在R6基因组中,IC74是spr1859[84]。参考文献10中报道了IC74的免疫应用(其中的SEQ ID NO:229)。
本发明所用的优选IC74多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:108具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:108的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC74蛋白包括SEQ ID NO:108的变体。(b)的优选片段包含来自SEQ ID NO:108的表位。其他优选片段缺少SEQ ID NO:108C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:108N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:108的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC74的免疫原性片段。
IC75
IC75是感受态蛋白。出于参比目的,全长IC75的氨基酸序列是本文所述的SEQ ID NO:109。在R6基因组中,IC75是spr1862[84]。参考文献10中报道了IC75的免疫应用(其中的SEQ ID NO:230)。
本发明所用的优选IC75多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:109具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:109的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC75蛋白包括SEQ ID NO:109的变体。(b)的优选片段包含来自SEQ ID NO:109的表位。其他优选片段缺少SEQ ID NO:109C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:109N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:109的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC75的免疫原性片段。
IC76
IC76是UTP-葡萄糖-1-磷酸尿苷基转移酶。出于参比目的,全长IC76的氨基酸序列是本文所述的SEQ ID NO:110。在R6基因组中,IC76是spr1903[84]。参考文献10中报道了IC76的免疫应用(其中的SEQ ID NO:231)。
本发明所用的优选IC76多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:110具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:110的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC76蛋白包括SEQ ID NO:110的变体。(b)的优选片段包含来自SEQ ID NO:110的表位。其他优选片段缺少SEQ ID NO:110C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:110N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:110的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC76的免疫原性片段。
IC77
IC77是青霉素结合蛋白1b。出于参比目的,全长IC77的氨基酸序列是本文所述的SEQ ID NO:111。在R6基因组中,IC77是spr1909[84]。参考文献10中报道了IC77的免疫应用(其中的SEQ ID NO:232)。
本发明所用的优选IC77多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:111具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:111的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC77蛋白包括SEQ ID NO:111的变体。(b)的优选片段包含来自SEQ ID NO:111的表位。其他优选片段缺少SEQ ID NO:111C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:111N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:111的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC77的免疫原性片段。
IC78
IC78是ABC转运蛋白底物结合蛋白-麦芽糖/麦芽糊精。出于参比目的,全长IC78的氨基酸序列是本文所述的SEQ ID NO:112。在R6基因组中,IC78是spr1918[84]。参考文献10中报道了IC78的免疫应用(其中的SEQ ID NO:233)。
本发明所用的优选IC78多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:112具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:112的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC78蛋白包括SEQ ID NO:112的变体。(b)的优选片段包含来自SEQ ID NO:112的表位。其他优选片段缺少SEQ ID NO:112C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:112N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:112的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC78的免疫原性片段。
IC79
在参考文献10中将IC79标注为假拟蛋白。出于参比目的,全长IC79的氨基酸序列是本文所述的SEQ ID NO:113。在R6基因组中,IC79是spr2120[84]。参考文献10中报道了IC79的免疫应用(其中的SEQ ID NO:234)。
本发明所用的优选IC79多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:113具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:113的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC79蛋白包括SEQ ID NO:113的变体。(b)的优选片段包含来自SEQ ID NO:113的表位。其他优选片段缺少SEQ ID NO:113C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:113N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:113的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC79的免疫原性片段。
IC80
IC80是推定的转酮酶n-末端部分。出于参比目的,全长IC80的氨基酸序列是本文所述的SEQ ID NO:114。在R6基因组中,IC80是spr1937[84]。参考文献10中报道了IC80的免疫应用(其中的SEQ ID NO:235)。
本发明所用的优选IC80多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:114具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:114的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC80蛋白包括SEQ ID NO:114的变体。(b)的优选片段包含来自SEQ ID NO:114的表位。其他优选片段缺少SEQ ID NO:114C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:114N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:114的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC80的免疫原性片段。
IC81
IC81是胆碱结合蛋白。出于参比目的,全长IC81的氨基酸序列是本文所述的SEQ ID NO:115。其C-末端与IC3有关。参考文献10中报道了IC81的免疫应用(其中的SEQ ID NO:236)。
本发明所用的优选IC81多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:115具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:115的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC81蛋白包括SEQ ID NO:115的变体。(b)的优选片段包含来自SEQ ID NO:115的表位。其他优选片段缺少SEQ ID NO:115C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:115N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:115的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC81的免疫原性片段。
IC82
IC82是.糖基水解酶相关蛋白。出于参比目的,全长IC82的氨基酸序列是本文所述的SEQ ID NO:116。在R6基因组中,IC82是spr2141[84]。参考文献10中报道了IC82的免疫应用(其中的SEQ ID NO:237)。
本发明所用的优选IC82多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:116具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:116的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC82蛋白包括SEQ ID NO:116的变体。(b)的优选片段包含来自SEQ ID NO:116的表位。其他优选片段缺少SEQ ID NO:116C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:116N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:116的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC82的免疫原性片段。
IC83
在参考文献10中将IC83标注为假拟蛋白。出于参比目的,全长IC83的氨基酸序列是本文所述的SEQ ID NO:117。在R6基因组中,IC83是spr1983[84]。参考文献10中报道了IC83的免疫应用(其中的SEQ ID NO:238)。
本发明所用的优选IC83多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:117具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:117的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC83蛋白包括SEQ ID NO:117的变体。(b)的优选片段包含来自SEQ ID NO:117的表位。其他优选片段缺少SEQ ID NO:117C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:117N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:117的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC83的免疫原性片段。
IC84
IC84是III类应激反应相关性ATP酶。出于参比目的,全长IC84的氨基酸序列是本文所述的SEQ ID NO:118。在R6基因组中,IC84是spr2000[84]。参考文献10中报道了IC84的免疫应用(其中的SEQ ID NO:240)。
本发明所用的优选IC84多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:118具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:118的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC84蛋白包括SEQ ID NO:118的变体。(b)的优选片段包含来自SEQ ID NO:118的表位。其他优选片段缺少SEQ ID NO:118C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:118N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:118的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC84的免疫原性片段。
IC85
IC85是SEQ ID NO:23的变体,如上所述(SEQ ID NO:119)。可用于本发明的IC85多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:119具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQID NO:119的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC85蛋白包括SEQ ID NO:119的变体。(b)的优选片段包含来自SEQ ID NO:119的表位。其他优选片段缺少SEQ ID NO:119C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:119N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:119的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
IC86
IC86是50S核糖体蛋白L9。出于参比目的,全长IC86的氨基酸序列是本文所述的SEQ ID NO:120。在R6基因组中,IC86是spr2009[84]。参考文献10中报道了IC86的免疫应用(其中的SEQ ID NO:242)。
本发明所用的优选IC86多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:120具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:120的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC86蛋白包括SEQ ID NO:120的变体。(b)的优选片段包含来自SEQ ID NO:120的表位。其他优选片段缺少SEQ ID NO:120C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:120N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:120的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC86的免疫原性片段。
IC87
在参考文献10中将IC87标注为假拟蛋白。出于参比目的,全长IC87的氨基酸序列是本文所述的SEQ ID NO:166。在R6基因组中,IC87是spr0987[84]。参考文献10中报道了IC87的免疫应用(其中的SEQ ID NO:288)。
本发明所用的优选IC87多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:166具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:166的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC87蛋白包括SEQ ID NO:166的变体。(b)的优选片段包含来自SEQ ID NO:166的表位。其他优选片段缺少SEQ ID NO:166C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:166N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:166的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC87的免疫原性片段。
IC88
IC88是胆碱结合蛋白。出于参比目的,全长IC88的氨基酸序列是本文所述的SEQ ID NO:122。在R6基因组中,IC88是spr1274[84]。参考文献10中报道了IC88的免疫应用(其中的SEQ ID NO:244)。
本发明所用的优选IC88多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:122具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:122的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC88蛋白包括SEQ ID NO:122的变体。(b)的优选片段包含来自SEQ ID NO:122的表位。其他优选片段缺少SEQ ID NO:122C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:122N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:122的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC88的免疫原性片段。
IC89
在参考文献10中将IC89标注为假拟蛋白。出于参比目的,全长IC89的氨基酸序列是本文所述的SEQ ID NO:123。参考文献10中报道了IC89的免疫应用(其中的SEQ ID NO:245)。
本发明所用的优选IC89多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:123具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:123的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC89蛋白包括SEQ ID NO:123的变体。(b)的优选片段包含来自SEQ ID NO:123的表位。其他优选片段缺少SEQ ID NO:123C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:123N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:123的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC89的免疫原性片段。
IC90
在参考文献10中将IC90标注为假拟蛋白。出于参比目的,全长IC90的氨基酸序列是本文所述的SEQ ID NO:124。参考文献10中报道了IC90的免疫应用(其中的SEQ ID NO:246)。
本发明所用的优选IC90多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:124具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:124的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC90蛋白包括SEQ ID NO:124的变体。(b)的优选片段包含来自SEQ ID NO:124的表位。其他优选片段缺少SEQ ID NO:124C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:124N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:124的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC90的免疫原性片段。
IC91
在参考文献10中将IC91标注为假拟蛋白。出于参比目的,全长IC91的氨基酸序列是本文所述的SEQ ID NO:125。在R6基因组中,IC91是spr0415[84]。参考文献10中报道了IC91的免疫应用(其中的SEQ ID NO:247)。
本发明所用的优选IC91多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:125具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:125的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC91蛋白包括SEQ ID NO:125的变体。(b)的优选片段包含来自SEQ ID NO:125的表位。其他优选片段缺少SEQ ID NO:125C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:125N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:125的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC91的免疫原性片段。
IC92
在参考文献10中将IC92标注为假拟蛋白。出于参比目的,全长IC92的氨基酸序列是本文所述的SEQ ID NO:126。在R6基因组中,IC92是spr0695[84]。参考文献10中报道了IC92的免疫应用(其中的SEQ ID NO:248)。
本发明所用的优选IC92多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:126具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:126的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC92蛋白包括SEQ ID NO:126的变体。(b)的优选片段包含来自SEQ ID NO:126的表位。其他优选片段缺少SEQ ID NO:126C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:126N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:126的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC92的免疫原性片段。
IC93
在参考文献10中将IC93标注为假拟蛋白。出于参比目的,全长IC93的氨基酸序列是本文所述的SEQ ID NO:127。在R6基因组中,IC93是spr1334[84]。参考文献10中报道了IC93的免疫应用(其中的SEQ ID NO:249)。
本发明所用的优选IC93多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:127具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:127的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC93蛋白包括SEQ ID NO:127的变体。(b)的优选片段包含来自SEQ ID NO:127的表位。其他优选片段缺少SEQ ID NO:127C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:127N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:127的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC93的免疫原性片段。
IC94
在参考文献10中将IC94标注为假拟蛋白。出于参比目的,全长IC94的氨基酸序列是本文所述的SEQ ID NO:128。在R6基因组中,IC94是spr0242[84]。参考文献10中报道了IC94的免疫应用(其中的SEQ ID NO:250)。
本发明所用的优选IC94多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:128具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:128的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC94蛋白包括SEQ ID NO:128的变体。(b)的优选片段包含来自SEQ ID NO:128的表位。其他优选片段缺少SEQ ID NO:128C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:128N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:128的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC94的免疫原性片段。
IC95
在参考文献10中将IC95标注为假拟蛋白。出于参比目的,全长IC95的氨基酸序列是本文所述的SEQ ID NO:129。在R6基因组中,IC95是spr1367[84]。参考文献10中报道了IC95的免疫应用(其中的SEQ ID NO:251)。
本发明所用的优选IC95多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:129具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:129的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC95蛋白包括SEQ ID NO:129的变体。(b)的优选片段包含来自SEQ ID NO:129的表位。其他优选片段缺少SEQ ID NO:129C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:129N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:129的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC95的免疫原性片段。
IC96
在参考文献10中将IC96标注为假拟蛋白。出于参比目的,全长IC96的氨基酸序列是本文所述的SEQ ID NO:130。参考文献10中报道了IC96的免疫应用(其中的SEQ ID NO:252)。
本发明所用的优选IC96多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:130具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:130的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC96蛋白包括SEQ ID NO:130的变体。(b)的优选片段包含来自SEQ ID NO:130的表位。其他优选片段缺少SEQ ID NO:130C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:130N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:130的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC96的免疫原性片段。
IC97
在参考文献10中将IC97标注为假拟蛋白。出于参比目的,全长IC97的氨基酸序列是本文所述的SEQ ID NO:131。在R6基因组中,IC97是spr1502[84]。参考文献10中报道了IC97的免疫应用(其中的SEQ ID NO:253)。
本发明所用的优选IC97多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:131具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:131的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC97蛋白包括SEQ ID NO:131的变体。(b)的优选片段包含来自SEQ ID NO:131的表位。其他优选片段缺少SEQ ID NO:131C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:131N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:131的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC97的免疫原性片段。
IC98
在参考文献10中将IC98标注为假拟蛋白。出于参比目的,全长IC98的氨基酸序列是本文所述的SEQ ID NO:132。在R6基因组中,IC98是spr0730[84]。参考文献10中报道了IC98的免疫应用(其中的SEQ ID NO:254)。
本发明所用的优选IC98多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:132具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:132的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC98蛋白包括SEQ ID NO:132的变体。(b)的优选片段包含来自SEQ ID NO:132的表位。其他优选片段缺少SEQ ID NO:132C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:132N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:132的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC98的免疫原性片段。
IC99
在参考文献10中将IC99标注为假拟蛋白。出于参比目的,全长IC99的氨基酸序列是本文所述的SEQ ID NO:133。在R6基因组中,IC99是spr1961[84]。参考文献10中报道了IC99的免疫应用(其中的SEQ ID NO:255)。
本发明所用的优选IC99多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:133具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:133的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC99蛋白包括SEQ ID NO:133的变体。(b)的优选片段包含来自SEQ ID NO:133的表位。其他优选片段缺少SEQ ID NO:133C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:133N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:133的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC99的免疫原性片段。
IC100
在参考文献10中将IC100标注为假拟蛋白。出于参比目的,全长IC100的氨基酸序列是本文所述的SEQ ID NO:134。参考文献10中报道了IC100的免疫应用(其中的SEQ ID NO:256)。
本发明所用的优选IC100多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:134具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:134的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC100蛋白包括SEQ ID NO:134的变体。(b)的优选片段包含来自SEQ ID NO:134的表位。其他优选片段缺少SEQ ID NO:134C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:134N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:134的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC100的免疫原性片段。
IC101
在参考文献10中将IC101标注为假拟蛋白。出于参比目的,全长IC101的氨基酸序列是本文所述的SEQ ID NO:135。在R6基因组中,IC101是spr0516[84]。参考文献10中报道了IC101的免疫应用(其中的SEQ ID NO:257)。
本发明所用的优选IC101多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:135具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:135的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC101蛋白包括SEQ ID NO:135的变体。(b)的优选片段包含来自SEQ ID NO:135的表位。其他优选片段缺少SEQ ID NO:135C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:135N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:135的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC101的免疫原性片段。
IC102
在参考文献10中将IC102标注为假拟蛋白。出于参比目的,全长IC102的氨基酸序列是本文所述的SEQ ID NO:136。在R6基因组中,IC102是spr1785[84]。参考文献10中报道了IC102的免疫应用(其中的SEQ ID NO:258)。
本发明所用的优选IC102多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:136具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:136的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC102蛋白包括SEQ ID NO:136的变体。(b)的优选片段包含来自SEQ ID NO:136的表位。其他优选片段缺少SEQ ID NO:136C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:136N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:136的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC102的免疫原性片段。
IC103
在参考文献10中将IC103标注为假拟蛋白。出于参比目的,全长IC103的氨基酸序列是本文所述的SEQ ID NO:137。在R6基因组中,IC103是spr0215[84]。参考文献10中报道了IC103的免疫应用(其中的SEQ ID NO:259)。
本发明所用的优选IC103多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:137具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:137的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC103蛋白包括SEQ ID NO:137的变体。(b)的优选片段包含来自SEQ ID NO:137的表位。其他优选片段缺少SEQ ID NO:137C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:137N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:137的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC103的免疫原性片段。
IC104
在参考文献10中将IC104标注为假拟蛋白。出于参比目的,全长IC104的氨基酸序列是本文所述的SEQ ID NO:138。在R6基因组中,IC104是spr1815[84]。参考文献10中报道了IC104的免疫应用(其中的SEQ ID NO:260)。
本发明所用的优选IC104多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:138具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:138的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC104蛋白包括SEQ ID NO:138的变体。(b)的优选片段包含来自SEQ ID NO:138的表位。其他优选片段缺少SEQ ID NO:138C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:138N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:138的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC104的免疫原性片段。
IC105
在参考文献10中将IC105标注为假拟蛋白。出于参比目的,全长IC105的氨基酸序列是本文所述的SEQ ID NO:139。在R6基因组中,IC105是spr0102[84]。参考文献10中报道了IC105的免疫应用(其中的SEQ ID NO:261)。
本发明所用的优选IC105多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:139具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:139的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC105蛋白包括SEQ ID NO:139的变体。(b)的优选片段包含来自SEQ ID NO:139的表位。其他优选片段缺少SEQ ID NO:139C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:139N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:139的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC105的免疫原性片段。
IC106
在参考文献10中将IC106标注为假拟蛋白。出于参比目的,全长IC106的氨基酸序列是本文所述的SEQ ID NO:140。在R6基因组中,IC106是spr1994[84]。参考文献10中报道了IC106的免疫应用(其中的SEQ ID NO:262)。
本发明所用的优选IC106多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:140具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:140的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC106蛋白包括SEQ ID NO:140的变体。(b)的优选片段包含来自SEQ ID NO:140的表位。其他优选片段缺少SEQ ID NO:140C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:140N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:140的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC106的免疫原性片段。
IC107
在参考文献10中将IC107标注为假拟蛋白。出于参比目的,全长IC107的氨基酸序列是本文所述的SEQ ID NO:141。参考文献10中报道了IC107的免疫应用(其中的SEQ ID NO:263)。
本发明所用的优选IC107多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:141具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:141的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC107蛋白包括SEQ ID NO:141的变体。(b)的优选片段包含来自SEQ ID NO:141的表位。其他优选片段缺少SEQ ID NO:141C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:141N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:141的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC107的免疫原性片段。
IC108
在参考文献10中将IC108标注为假拟蛋白。出于参比目的,全长IC108的氨基酸序列是本文所述的SEQ ID NO:142。参考文献10中报道了IC108的免疫应用(其中的SEQ ID NO:264)。
本发明所用的优选IC108多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:142具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:142的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC108蛋白包括SEQ ID NO:142的变体。(b)的优选片段包含来自SEQ ID NO:142的表位。其他优选片段缺少SEQ ID NO:142C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:142N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:142的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC108的免疫原性片段。
IC109
在参考文献10中将IC109标注为假拟蛋白。出于参比目的,全长IC109的氨基酸序列是本文所述的SEQ ID NO:143。在R6基因组中,IC109是spr0309[84]。参考文献10中报道了IC109的免疫应用(其中的SEQ ID NO:265)。
本发明所用的优选IC109多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:143具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:143的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC109蛋白包括SEQ ID NO:143的变体。(b)的优选片段包含来自SEQ ID NO:143的表位。其他优选片段缺少SEQ ID NO:143C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:143N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:143的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC109的免疫原性片段。
IC110
在参考文献10中将IC110标注为假拟蛋白。出于参比目的,全长IC110的氨基酸序列是本文所述的SEQ ID NO:144。在R6基因组中,IC110是spr1070[84]。参考文献10中报道了IC110的免疫应用(其中的SEQ ID NO:266)。
本发明所用的优选IC110多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:144具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:144的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC110蛋白包括SEQ ID NO:144的变体。(b)的优选片段包含来自SEQ ID NO:144的表位。其他优选片段缺少SEQ ID NO:144C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:144N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:144的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC110的免疫原性片段。
IC111
在参考文献10中将IC111标注为假拟蛋白。出于参比目的,全长IC111的氨基酸序列是本文所述的SEQ ID NO:145。在R6基因组中,IC111是spr0258[84]。参考文献10中报道了IC111的免疫应用(其中的SEQ ID NO:267)。
本发明所用的优选IC111多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:145具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:145的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC111蛋白包括SEQ ID NO:145的变体。(b)的优选片段包含来自SEQ ID NO:145的表位。其他优选片段缺少SEQ ID NO:145C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:145N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:145的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC111的免疫原性片段。
IC112
在参考文献10中将IC112标注为假拟蛋白。出于参比目的,全长IC112的氨基酸序列是本文所述的SEQ ID NO;146。在R6基因组中,IC112是spr0254[84]。参考文献10中报道了IC112的免疫应用(其中的SEQ ID NO:268)。
本发明所用的优选IC112多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:146具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:146的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC112蛋白包括SEQ ID NO:146的变体。(b)的优选片段包含来自SEQ ID NO:146的表位。其他优选片段缺少SEQ ID NO:146C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:146N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:146的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC112的免疫原性片段。
IC113
在参考文献10中将IC113标注为假拟蛋白。出于参比目的,全长IC113的氨基酸序列是本文所述的SEQ ID NO:147。在R6基因组中,IC113是spr0171[84]。参考文献10中报道了IC113的免疫应用(其中的SEQ ID NO:269)。
本发明所用的优选IC113多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:147具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:147的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC113蛋白包括SEQ ID NO:147的变体。(b)的优选片段包含来自SEQ ID NO:147的表位。其他优选片段缺少SEQ ID NO:147C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:147N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:147的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC113的免疫原性片段。
IC114
在参考文献10中将IC114标注为假拟蛋白。出于参比目的,全长IC114的氨基酸序列是本文所述的SEQ ID NO:148。参考文献10中报道了IC114的免疫应用(其中的SEQ ID NO:270)。
本发明所用的优选IC114多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:148具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:148的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC114蛋白包括SEQ ID NO:148的变体。(b)的优选片段包含来自SEQ ID NO:148的表位。其他优选片段缺少SEQ ID NO:148C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:148N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:148的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC114的免疫原性片段。
IC115
在参考文献10中将IC115标注为假拟蛋白。出于参比目的,全长IC115的氨基酸序列是本文所述的SEQ ID NO:149。在R6基因组中,IC115是spr0464[84]。参考文献10中报道了IC115的免疫应用(其中的SEQ ID NO:271)。
本发明所用的优选IC115多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:149具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:149的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC115蛋白包括SEQ ID NO:149的变体。(b)的优选片段包含来自SEQ ID NO:149的表位。其他优选片段缺少SEQ ID NO:149C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:149N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:149的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC115的免疫原性片段。
IC116
在参考文献10中将IC116标注为假拟蛋白。出于参比目的,全长IC116的氨基酸序列是本文所述的SEQ ID NO:150。在R6基因组中,IC116是spr0026[84]。参考文献10中报道了IC116的免疫应用(其中的SEQ ID NO:272)。
本发明所用的优选IC116多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:150具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:150的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC116蛋白包括SEQ ID NO:150的变体。(b)的优选片段包含来自SEQ ID NO:150的表位。其他优选片段缺少SEQ ID NO:150C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:150N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:150的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC116的免疫原性片段。
IC117
在参考文献10中将IC117标注为假拟蛋白。出于参比目的,全长IC117的氨基酸序列是本文所述的SEQ ID NO:151。在R6基因组中,IC117是spr1652[84]。参考文献10中报道了IC117的免疫应用(其中的SEQ ID NO:273)。
本发明所用的优选IC117多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:151具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:151的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC117蛋白包括SEQ ID NO:151的变体。(b)的优选片段包含来自SEQ ID NO:151的表位。其他优选片段缺少SEQ ID NO:151C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:151N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:151的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC117的免疫原性片段。
IC118
在参考文献10中将IC118标注为假拟蛋白。出于参比目的,全长IC118的氨基酸序列是本文所述的SEQ ID NO:152。在R6基因组中,IC118是spr1783[84]。参考文献10中报道了IC118的免疫应用(其中的SEQ ID NO:274)。
本发明所用的优选IC118多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:152具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:152的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC118蛋白包括SEQ ID NO:152的变体。(b)的优选片段包含来自SEQ ID NO:152的表位。其他优选片段缺少SEQ ID NO:152C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:152N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:152的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC118的免疫原性片段。
IC119
在参考文献10中将IC119标注为假拟蛋白。出于参比目的,全长IC119的氨基酸序列是本文所述的SEQ ID NO:153。参考文献10中报道了IC119的免疫应用(其中的SEQ ID NO:275)。
本发明所用的优选IC119多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:153具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:153的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC119蛋白包括SEQ ID NO:153的变体。(b)的优选片段包含来自SEQ ID NO:153的表位。其他优选片段缺少SEQ ID NO:153C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:153N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:153的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC119的免疫原性片段。
IC120
在参考文献10中将IC120标注为假拟蛋白。出于参比目的,全长IC120的氨基酸序列是本文所述的SEQ ID NO:154。在R6基因组中,IC120是spr1153[84]。参考文献10中报道了IC120的免疫应用(其中的SEQ ID NO:276)。
本发明所用的优选IC120多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:154具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:154的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC120蛋白包括SEQ ID NO:154的变体。(b)的优选片段包含来自SEQ ID NO:154的表位。其他优选片段缺少SEQ ID NO:154C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:154N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:154的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC120的免疫原性片段。
IC121
在参考文献10中将IC121标注为假拟蛋白。出于参比目的,全长IC121的氨基酸序列是本文所述的SEQ ID NO:155。在R6基因组中,IC121是spr1977[84]。参考文献10中报道了IC121的免疫应用(其中的SEQ ID NO:277)。
本发明所用的优选IC121多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:155具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:155的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC121蛋白包括SEQ ID NO:155的变体。(b)的优选片段包含来自SEQ ID NO:155的表位。其他优选片段缺少SEQ ID NO:155C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:155N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:155的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC121的免疫原性片段。
IC122
在参考文献10中将IC122标注为假拟蛋白。出于参比目的,全长IC122的氨基酸序列是本文所述的SEQ ID NO:156。参考文献10中报道了IC122的免疫应用(其中的SEQ ID NO:278)。
本发明所用的优选IC122多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:156具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:156的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC122蛋白包括SEQ ID NO:156的变体。(b)的优选片段包含来自SEQ ID NO:156的表位。其他优选片段缺少SEQ ID NO:156C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:156N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:156的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC122的免疫原性片段。
IC123
在参考文献10中将IC123标注为假拟蛋白。出于参比目的,全长IC123的氨基酸序列是本文所述的SEQ ID NO:157。在R6基因组中,IC123是spr1049[84]。参考文献10中报道了IC123的免疫应用(其中的SEQ ID NO:279)。
本发明所用的优选IC123多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:157具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:157的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC123蛋白包括SEQ ID NO:157的变体。(b)的优选片段包含来自SEQ ID NO:157的表位。其他优选片段缺少SEQ ID NO:157C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:157N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:157的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC123的免疫原性片段。
IC124
在参考文献10中将IC124标注为假拟蛋白。出于参比目的,全长IC124的氨基酸序列是本文所述的SEQ ID NO:158。在R6基因组中,IC124是spr1811[84]。参考文献10中报道了IC124的免疫应用(其中的SEQ ID NO:280)。
本发明所用的优选IC124多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:158具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:158的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC124蛋白包括SEQ ID NO:158的变体。(b)的优选片段包含来自SEQ ID NO:158的表位。其他优选片段缺少SEQ ID NO:158C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:158N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:158的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC124的免疫原性片段。
IC125
在参考文献10中将IC125标注为假拟蛋白。出于参比目的,全长IC125的氨基酸序列是本文所述的SEQ ID NO:159。在R6基因组中,IC125是spr0381[84]。参考文献10中报道了IC125的免疫应用(其中的SEQ ID NO:281)。
本发明所用的优选IC125多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:159具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:159的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC125蛋白包括SEQ ID NO:159的变体。(b)的优选片段包含来自SEQ ID NO:159的表位。其他优选片段缺少SEQ ID NO:159C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:159N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:159的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC125的免疫原性片段。
IC126
在参考文献10中将IC126标注为假拟蛋白。出于参比目的,全长IC126的氨基酸序列是本文所述的SEQ ID NO:160。参考文献10中报道了IC126的免疫应用(其中的SEQ ID NO:282)。
本发明所用的优选IC126多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:160具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:160的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC126蛋白包括SEQ ID NO:160的变体。(b)的优选片段包含来自SEQ ID NO:160的表位。其他优选片段缺少SEQ ID NO:160C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:160N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:160的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC126的免疫原性片段。
IC127
在参考文献10中将IC127标注为假拟蛋白。出于参比目的,全长IC127的氨基酸序列是本文所述的SEQ ID NO:161。在R6基因组中,IC127是spr0061[84]。参考文献10中报道了IC127的免疫应用(其中的SEQ ID NO:283)。
本发明所用的优选IC127多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:161具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:161的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC127蛋白包括SEQ ID NO:161的变体。(b)的优选片段包含来自SEQ ID NO:161的表位。其他优选片段缺少SEQ ID NO:161C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:161N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:161的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC127的免疫原性片段。
IC128
在参考文献10中将IC128标注为假拟蛋白。出于参比目的,全长IC128的氨基酸序列是本文所述的SEQ ID NO:162。在R6基因组中,IC128是spr0641[84]。参考文献10中报道了IC128的免疫应用(其中的SEQ ID NO:284)。
本发明所用的优选IC128多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:162具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:162的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、 90、100、150、200、250或更多个)。这些IC128蛋白包括SEQ ID NO:162的变体。(b)的优选片段包含来自SEQ ID NO:162的表位。其他优选片段缺少SEQ ID NO:162C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:162N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:162的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC128的免疫原性片段。
IC129
在参考文献10中将IC129标注为假拟蛋白。出于参比目的,全长IC129的氨基酸序列是本文所述的SEQ ID NO:163。在R6基因组中,IC129是spr1205[84]。参考文献10中报道了IC129的免疫应用(其中的SEQ ID NO:285)。
本发明所用的优选IC129多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:163具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:163的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC129蛋白包括SEQ ID NO:163的变体。(b)的优选片段包含来自SEQ ID NO:163的表位。其他优选片段缺少SEQ ID NO:163C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:163N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:163的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC129的免疫原性片段。
IC130
在参考文献10中将IC130标注为假拟蛋白。出于参比目的,全长IC130的氨基酸序列是本文所述的SEQ ID NO:164。在R6基因组中,IC130是spr1841[84]。参考文献10中报道了IC130的免疫应用(其中的SEQ ID NO:286)。
本发明所用的优选IC130多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:164具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:164的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC130蛋白包括SEQ ID NO:164的变体。(b)的优选片段包含来自SEQ ID NO:164的表位。其他优选片段缺少SEQ ID NO:164C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:164N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:164的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC130的免疫原性片段。
IC131
在参考文献10中将IC131标注为假拟蛋白。出于参比目的,全长IC131的氨基酸序列是本文所述的SEQ ID NO:165。在R6基因组中,IC131是spr1777[84]。参考文献10中报道了IC131的免疫应用(其中的SEQ ID NO:287)。
本发明所用的优选IC131多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:165具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:165的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些IC131蛋白包括SEQ ID NO:165的变体。(b)的优选片段包含来自SEQ ID NO:165的表位。其他优选片段缺少SEQ ID NO:165C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:165N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:165的至少一个表位。其他片段缺少一个或多个蛋白质结构域。参考文献10的表1中鉴定了IC131的免疫原性片段。
spr0222
参考文献228中将原始′spr0222′序列标注为′ABC转运蛋白ATP结合蛋白-铁转运′(参见GI:15457768)。出于参比目的,R6菌株中发现的全长spr0222的氨基酸序列在本文中列为SEQ ID NO:121。参考文献5中提示其免疫应用。
本发明所用的优选spr0222多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:121具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:121的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些spr022蛋白包括SEQ ID NO:121的变体。(b)的优选片段包含来自SEQ ID NO:121的表位。其他优选片段缺少SEQ ID NO:121C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:121N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:121的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
CbiO
CbiO被标注为钴转运蛋白ATP-结合亚基。出于参比目的,全长CbiO的氨基酸序列是本文所述的SEQ ID NO:167。在R6基因组中,CbiO是spr2025[84]。参考文献6报道了CbiO的免疫应用(其中的‘ID2’)。
本发明所用的优选CbiO多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:167具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:167的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些CbiO蛋白包括SEQ ID NO:167的变体。(b)的优选片段包含来自SEQ ID NO:167的表位。其他优选片段缺少SEQ ID NO:167C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:167N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:167的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
30S核糖体蛋白S8
出于参比目的,30S核糖体蛋白S8的氨基酸序列是本文所述的SEQ IDNO:168。在R6基因组中,S8亚基是spr0203[84]。
本发明所用的优选S8多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:168具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:168的至少’n’个连续氨基酸的片段,其中’n’是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些S8蛋白包括SEQ ID NO:168的变体。(b)的优选片段包含来自SEQ ID NO:168的表位。其他优选片段缺少SEQID NO:168C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个)和/或SEQ ID NO:168N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个),而保留SEQ ID NO:168的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
RrgA
RrgA是肺炎球菌菌毛的表面亚基之一[79,80],并且是重要的粘附素[81]。RrgA有至少两种等位基因形式,出于参比目的,其氨基酸序列是本文所述的SEQ ID NO:172和179。这两种等位基因在其N末端和C末端非常保守,但之间的部分有差异。
本发明所用的优选RrgA多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:172具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:172的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgA蛋白包括SEQID NO:172的变体。(b)的优选片段包含来自SEQ ID NO:172的表位。其他优选片段缺少SEQ ID NO:172C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:172N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:172的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:192,其缺少天然前导肽和分选酶识别序列。
本发明所用的其他优选RrgA多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:179具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:179的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgA蛋白包括SEQ ID NO:179的变体。(b)的优选片段包含来自SEQ ID NO:179的表位。其他优选片段缺少SEQ ID NO:179C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:179N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:179的至少一个表位。其他片段缺少一个或多个蛋白质结构域。一个合适的片段是SEQ ID NO:191,其缺少天然前导肽和分选酶识别序列。
RrgB
RrgB是肺炎球菌菌毛的表面亚基之一[79,80]。RrgB有至少三种等位基因形式,出于参比目的,其氨基酸序列是本文所述的SEQ ID NO:173、174和175。这三种等位基因在其N末端和C末端非常保守,但之间的部分有差异。
本发明所用的优选RrgB多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:173具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:173的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgB蛋白包括SEQID NO:173的变体。(b)的优选片段包含来自SEQ ID NO:173的表位。其他优选片段缺少SEQ ID NO:173C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:173N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:173的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
本发明所用的其他优选RrgB多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:174具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:174的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgB蛋白包括SEQ ID NO:174的变体。(b)的优选片段包含来自SEQ ID NO:174的表位。其他优选片段缺少SEQ ID NO:174C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:174N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:174的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
本发明所用的其他优选RrgB多肽包含某氨基酸序列,该序列:(a)与SEQ ID NO:175具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:175的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgB蛋白包括SEQ ID NO:175的变体。(b)的优选片段包含来自SEQ ID NO:175的表位。其他优选片段缺少SEQ ID NO:175C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:175N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:175的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
RrgC
RrgC是肺炎球菌菌毛的表面亚基之一[79,80]。出于参比目的,RrgC的氨基酸序列是本文所述的SEQ ID NO:176。
本发明所用的优选RrgC多肽包含某氨基酸序列,该序列:(a)与SEQ IDNO:176具有50%或更高的相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和/或(b)包含SEQ ID NO:176的至少′n′个连续氨基酸的片段,其中′n′是7个或更多个(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多个)。这些RrgC蛋白包括SEQID NO:176的变体。(b)的优选片段包含来自SEQ ID NO:176的表位。其他优选片段缺少SEQ ID NO:176C末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个)和/或SEQ ID NO:176N末端的一个或多个氨基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多个),而保留SEQ ID NO:176的至少一个表位。其他片段缺少一个或多个蛋白质结构域。
杂交多肽
本发明所用的肺炎球菌抗原可以单独多肽的形式存在于组合物中。然而,使用一种以上抗原时,它们不一定以单独多肽的形式存在。取而代之的是,至少两种(如2、3、4、5或更多种)抗原可表达成一条多肽链(‘杂交’多肽)。杂交多肽主要提供以下两个优点:首先,本身不稳定或者表达较差的多肽可以通过加入能够克服该问题的合适的杂交伴侣得到改善,其次,商业生产得到简化,因为只需利用一次表达和纯化即可生产可作抗原应用的两种多肽。
杂交多肽可包含来自第一抗原组的两种或多种多肽序列。杂交多肽可包含来自第一抗原组的一种或多种多肽序列,和来自第二抗原组的一种或多种多肽序列。杂交多肽可包含来自第一抗原组的一种或多种多肽序列,和来自第三抗原组的一种或多种多肽序列。杂交多肽可包含来自第二抗原组的一种或多种多肽序列,和来自第三抗原组的一种或多种多肽序列。杂交多肽可包含来自第七抗原组的两种或多种多肽序列。杂交多肽可包含来自第八抗原组的两种或多种多肽序列。杂交多肽可包含来自第九抗原组的两种或多种多肽序列。杂交多肽可包含来自第十抗原组的两种或多种多肽序列。而且,杂交多肽可包含来自上述各抗原的两种或多种多肽序列,或在该序列在菌株之间有部分变化的情况下,可包含相同抗原的两种或多种变体。
可使用由两种、三种、四种、五种、六种、七种、八种、九种或十种肺炎球菌抗原的氨基酸序列组成的杂交体。具体说,优选由两种、三种、四种或五种肺炎球菌抗原,如两种或三种肺炎球菌抗原的氨基酸序列组成的杂交体。
不同的杂交多肽可以在单一制剂中混合在一起。杂交体可与选自第一、第二或第三抗原组的非杂交抗原组合。在这类组合中,肺炎球菌抗原可以一种以上杂交多肽和/或非杂交多肽的形式存在。然而,抗原优选以杂交形式或者作为非杂交多肽存在,但不同时以两种形式存在。
杂交多肽也可与上述偶联物或非肺炎球菌抗原组合。
杂交多肽可以通式NH2-A-{-X-L-}n-B-COOH表示,其中:X是肺炎球菌抗原的氨基酸序列,如上所述;L是任选接头的氨基酸序列;A是任选的N末端氨基酸序列;B是任选的C末端氨基酸序列;n是2或更大的整数(如2、3、4、5、6等)。n通常是2或3。
如果野生型形式中-X-部分具有前导肽序列,那么在杂交蛋白中可以包含或者略去该序列。在一些实施方式中,前导肽可缺失,除非-X-部分位于杂交蛋白的N-末端,即保留X1的前导肽,但略去X2...Xn的前导肽。这相当于删除所有前导肽并使用X1的前导肽作为-A-部分。
在{-X-L-}的各个n值的情况下,接头氨基酸序列-L-可存在或不存在。例如,当n=2时,杂交体可以是NH2-X1-L1-X2-L2-COOH、NH2-X1-X2-COOH、NH2-X1-L1-X2-COOH、NH2-X1-X2-L2-COOH等。接头氨基酸序列-L-一般较短(如20个或更少的氨基酸,即20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括有利于克隆的短肽序列,聚-甘氨酸接头(即包含Glyn,其中n=2、3、4、5、6、7、8、9、10或更高),组氨酸标签(即Hisn,其中n=3、4、5、6、7、8、9、10或更高)。本领域技术人员显然了解其它合适的接头氨基酸序列。有用的接头是GSGGGG(SEQ ID NO:232)或GSGSGGGG(SEQ ID NO:233),Gly-Ser二肽由BamHI限制位点形成,因而有助于克隆和操作,(Gly)4四肽是常用的多聚甘氨酸接头。其他合适接头,尤其用作最后一个Ln的接头是Leu-Glu二肽或SEQ ID NO:235。
-A-是任选的N末端氨基酸序列。它通常较短(如40个或更少的氨基酸,即40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括指导蛋白质运输的前导序列,或有利于克隆或纯化的短肽序列(如组氨酸标签,即Hisn,其中n=3、4、5、6、7、8、9、10或更多)。本领域技术人员显然了解其它合适的N-末端氨基酸序列。如果X1缺少其自身的N-末端甲硫氨酸,-A-优选是提供N-末端甲硫氨酸的寡肽(例如,具有1、2、3、4、5、6、7或8个氨基酸),如Met-Ala-Ser或单个Met残基。
-B-是任选的C末端氨基酸序列。它一般较短(例如,40个或更少的氨基酸,即39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括指导蛋白质运输的序列,有利于克隆或纯化的短肽序列(如包含组氨酸标签,即Hisn,其中n=3、4、5、6、7、8、9、10或更多,如SEQ ID NO:234),或能提高蛋白质稳定性的序列。本领域技术人员显然了解其它合适的C-末端氨基酸序列。
杂交体的例子包括包含选自下组的氨基酸序列的多肽:spr2021-spr0057(如SEQ ID NO:193);spr2021-spr0096(如SEQ ID NO:194);spr2021-spr0565(如SEQ ID NO:195或SEQ ID NO:196或SEQ IDNO:197);spr2021-RrgA(如SEQ ID NO:198);spr0057-spr2021(如SEQ IDNO:199);spr0057-spr0096(如SEQ ID NO:200);spr0057-RrgA(如SEQ IDNO:201);spr0057-spr0565(如SEQ ID NO:202或SEQ ID NO:203或SEQID NO:204);spr0096-spr2021(如SEQ ID NO:205);spr0096-spr0057(如SEQ ID NO:206);spr0096-RrgA(如SEQ ID NO:207);spr0096-spr0565(如SEQ ID NO:208或SEQ ID NO:209或SEQ ID NO:210);RrgA-spr2021(如SEQ ID NO:211);RrgA-spr0565(如SEQ ID NO:212或SEQ ID NO:213或SEQ ID NO:214);RrgA-spr0057(如SEQ ID NO:215);RrgA-spr0096(如SEQ ID NO:216);spr0565-spr0057(如SEQ ID NO:217或SEQ ID NO:218或SEQ ID NO:219);spr0565-spr0096(如SEQ ID NO:220或SEQ IDNO:221或SEQ ID NO:222);spr0565-spr2021(如SEQ ID NO:223或SEQID NO:224或SEQ ID NO:225);或spr0565-RrgA(如SEQ ID NO:226或SEQ ID NO:227或SEQ ID NO:228)。
本发明所用多肽
本发明所用多肽可采取各种形式(如天然多肽、融合多肽、糖基化多肽、非糖基化多肽、脂化多肽、非脂化多肽、磷酸化多肽、非磷酸化多肽、肉豆蔻酰化多肽、非肉豆蔻酰化多肽、单体、多聚体、颗粒、变性多肽等)。
本发明所用多肽可通过各种方式(如重组表达、由细胞培养物纯化、化学合成等)制备。优选重组表达的蛋白质,特别是杂交多肽。
本发明所用多肽优选以纯化或基本纯化,即基本不含其它多肽(如不含天然产生的多肽)、特别是不含其它链球菌或宿主细胞多肽的形式提供,本发明多肽的纯度通常为至少约50重量%,通常至少约90%,即组成中少于约50%,更优选少于约10%(如5%)是其它表达的多肽。因此,组合物中的抗原是与表达该分子的完整生物体分离的。
本发明所用多肽优选是肺炎球菌多肽。
术语“多肽”指任何长度的氨基酸聚合物。该聚合物可以是线性或支链聚合物,可包含修饰的氨基酸,可被非氨基酸打断。该术语也包括天然或通过人工介入修饰的氨基酸聚合物;这些修饰包括例如:二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其它操作或修饰,如与标记组分偶联。也包括,例如,含有一个或多个氨基酸类似物(包括例如,非天然氨基酸等),以及本领域已知的其它修饰的多肽。多肽可以是单链或结合的链。
本发明提供含有序列-P-Q-或-Q-P-的多肽,其中:-P-是上述氨基酸序列,-Q-不是上述序列,即本发明提供融合蛋白。-P-的N-末端密码子不是ATG且此密码子未出现在多肽的N末端时,它将被翻译成该密码子的标准氨基酸,而不是Met。然而,当该密码子位于多肽N末端时,它将被翻译成Met。-Q-部分的例子包括但不限于:组氨酸标签(即Hisn,其中n=3、4、5、6、7、8、9、10或更高)、麦芽糖结合蛋白或谷胱甘肽-S-转移酶(GST)。
本发明还提供产生本发明多肽的方法,该方法包括在诱导多肽表达的条件下培养用本发明核酸转化的宿主细胞的步骤。
虽然可以在链球菌(Streptococcus)中表达本发明多肽,但本发明通常使用异源宿主进行表达(重组表达)。异源宿主可以是原核(例如细菌)或真核生物。可以是大肠杆菌(E.coli),其他合适的宿主包括枯草杆菌(Bacillussubtilis)、霍乱弧菌(Vibrio cholerae)、伤寒沙门菌(Salmonella typhi)、鼠伤寒沙门菌(Salmonella typhimurium)、乳酰胺奈瑟菌(Neisseria lactamica)、灰色奈瑟菌(Neisseria cinerea)、分枝杆菌(Mycobacteria)(例如结核分支杆菌(Mtuberculosis))、酵母等。与编码本发明多肽的野生型肺炎球菌基因相比,改变密码子以优化在这类宿主中的表达效率而不影响编码氨基酸是有帮助的。
本发明提供一种产生本发明多肽的方法,所述方法包括通过化学方式合成所述多肽的至少一部分的步骤。
核酸
本发明也提供编码本发明多肽和杂交多肽的核酸。还提供包含编码一种或多种本发明多肽或杂交多肽的核苷酸序列的核酸。
本发明也提供包含与这种核苷酸序列有序列相同性的核苷酸序列的核酸。序列之间的相同性优选通过Smith-Waterman同源性搜索算法(如上所述)确定。这类核酸包括使用替代密码子编码相同氨基酸的那些核酸。
本发明也提供可与这些核酸杂交的核酸。可以在不同“严谨性”的条件下进行杂交反应。提高杂交反应严谨性的条件是本领域众所周知的,且已公开过[如参考文献288的第7.52页]。相关条件的例子包括(严谨性逐渐提高的顺序):培育温度25℃、37℃、50℃、55℃和68℃;缓冲液浓度10xSSC、6xSSC、1xSSC、0.1xSSC(其中SSC是0.15M NaCl和15mM柠檬酸盐缓冲液)和使用其它缓冲液体系的等同条件;甲酰胺浓度0%、25%、50%和75%;培育时间5分钟-24小时;1个、2个或多个洗涤步骤;洗涤培育时间1、2或15分钟;洗涤溶液6xSSC、1xSSC、0.1xSSC或去离子水。杂交技术和其优化方法是本领域众所周知的[例如,参见参考文献82、83、288、290等]。
在一些实施方式中,本发明核酸与本发明靶标在低严谨条件下杂交;在其它实施方式中,它们在中等严谨条件下杂交;在优选实施方式中,它们在高严谨条件下杂交。一组示范性的低严谨杂交条件是50℃和10xSSC。一组示范性的中等严谨杂交条件是55℃和1xSSC。一组示范性的高严谨杂交条件是68℃和0.1xSSC。
本发明包括含有这些序列的互补序列的核酸(例如,用于反义或检测,或用作引物)。
本发明核酸可用于杂交反应(如Northern或Southern印迹,或核酸微阵列或‘基因芯片’)和扩增反应(如PCR、SDA、SSSR、LCR、TMA、NASBA等)和其它核酸技术。
本发明核酸可采取各种形式(如单链、双链、载体、引物、探针、标记形式等)。本发明核酸可以是环状或分枝状核酸,但通常是线性核酸。除非另有说明或要求,利用核酸的本发明任何实施方式可利用双链形式和构成该双链形式的两条互补单链形式的每条链。引物、探针以及反义核酸通常是单链。
本发明核酸优选以纯化或基本纯化的形式提供,即基本不含其它核酸(如不含天然产生的核酸),特别是不含其它肺炎球菌或宿主细胞核酸,通常其纯度至少为约50重量%,通常至少为约90%。本发明核酸优选为肺炎球菌核酸。
可以多种方式制备本发明核酸,这些方式包括例如,完全或部分化学合成(如DNA的亚磷酰胺合成),用核酸酶(如限制性酶)消化较长核酸、连接较短核酸或核苷酸(如使用连接酶或聚合酶),由基因组或cDNA文库制备等。
本发明核酸可连接于固体支持物(如珠、平板、滤纸、膜、玻片、微阵列支持物、树脂等)。可用,例如放射性或荧光标记、或生物素标记标记本发明核酸。在准备将核酸用于检测技术时,例如核酸是引物或探针时,这特别有用。
总的来看,术语“核酸”包括任何长度的核苷酸聚合形式,其包含脱氧核糖核苷酸、核糖核苷酸和/或其类似物。它包括DNA、RNA、DNA/RNA杂交体。它也包括DNA或RNA类似物,如含有修饰主链(如肽核酸(PNA)或硫代磷酸酯)或修饰碱基的类似物。因此,本发明包括mRNA、tRNA、rRNA、核酶、DNA、cDNA、重组核酸、分枝核酸、质粒、载体、探针、引物等。本发明核酸采取RNA形式时,它可能具有或不具有5′帽。
本发明核酸可以是载体的一部分,即设计用于转导/转染一种或多种细胞类型的核酸构建物的一部分。载体可以是,例如,设计用于分离、增殖和复制插入的核苷酸的“克隆载体”,设计用于在宿主细胞中表达核苷酸序列的“表达载体”,设计用于产生重组病毒或病毒样颗粒的“病毒载体”,或具有一种以上载体类型的属性的“穿梭载体”。优选的载体是质粒。“宿主细胞”包括单个细胞或细胞培养物,它可能是或已经是外源核酸的接受者。宿主细胞包括单个宿主细胞的后代,由于天然、偶然或有意的突变和/或改变,这些后代与原始亲本细胞不一定完全相同(形态或总DNA互补物方面)。宿主细胞包括用本发明核酸体内或体外转染或感染的细胞。
应理解,核酸是DNA时,RNA序列中的“U”被DNA中的“T”所替代。相似地,应理解,核酸是RNA时,DNA中的“T”被RNA序列中的“U”所替代。
用于核酸时,术语“互补物”或“互补”指沃森克里克碱基配对。因此,C的互补物是G,G的互补物是C,A的互补物是T(或U),T(或U)的互补物是A。也可能使用诸如I(嘌呤肌苷)等碱基,与嘧啶(C或T)互补。
例如,可使用本发明核酸产生多肽;作为检测生物样品中的核酸的杂交探针;产生额外的核酸拷贝;产生核酶或反义寡核苷酸;作为单链DNA引物或探针;或作为形成三链体的寡核苷酸。
本发明提供产生本发明核酸的方法,其中所述核酸部分或完全用化学方式合成。
本发明提供包含本发明核苷酸序列的载体(如克隆或表达载体)和用这种载体转化的宿主细胞。
本发明核酸扩增可以是定量扩增和/或实时扩增。
在本发明的某些实施方式中,核酸的长度优选为至少7个核苷酸(如8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300个核苷酸或更长)。
在本发明的某些实施方式中,核酸长度优选为至多500个核苷酸(例如450、400、350、300、250、200、150、140、130、120、110、100、90、80、75、70、65、60、55、50、45、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15个核苷酸或更短)。
本发明的引物和探针,以及用于杂交的其它核酸的长度优选为10-30个核苷酸(如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)。
菌株和变体
上述抗原根据“spr”命名法定义。该命名法是根据参考文献84所用的编号系统,以便对肺炎链球菌R6菌株中的开放阅读框作唯一标注。不难在公共基因数据库中找到任何“spr”编号对应的基本参考序列。例如,GenBank登录号NC_003098(GI:15902044)是完整的R6基因组序列(2,038,615bp),单独的spr序列在基因组序列的“特征”部分作为“基因座标签”条目给出。因此,对菌株R6而言,可毫无疑问地确定任何给定spr编号对应的氨基酸序列和其天然编码序列。数据库中也给出功能标注。
本发明不限于来自R6菌株的序列。可获得肺炎链球菌的若干其他菌株的基因组序列,包括23F[85]、670[86]和TIGR4[87,88,89]。可使用标准的搜索和比对技术在这些(或其他)基因组序列中鉴定来自R6的任何特定spr序列的同源物。而且,可利用可获得的R6(和其他)序列设计引物扩增来自其他菌株的同源序列。因此,本发明不限于R6序列,可包括来自其他肺炎链球菌菌株的这类变体和同源物,以及非天然变体。通常,特定SEQ ID NO的合适变体包括其等位基因变体、其多态性形式、其同源物、其直向同源物、其旁系同源物、其突变体等。
因此,例如,与R6参比序列相比,本发明所用多肽可包括一个或多个(如1、2、3、4、5、6、7、8、9个等)氨基酸取代,如保守取代(即用具有侧链相关的另一氨基酸取代某氨基酸)。遗传编码的氨基酸通常分为四类:(1)酸性,即天冬氨酸、谷氨酸;(2)碱性,即赖氨酸、精氨酸、组氨酸;(3)非极性,即丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;和(4)不带电的极性氨基酸,即甘氨酸、天冬酰胺、谷胺酰胺、胱氨酸、丝氨酸、苏氨酸、酪氨酸。有时将苯丙氨酸、色氨酸和酪氨酸一起称为芳族氨基酸。通常,这些家族中单个氨基酸的替换不会对生物活性产生重要影响。相对于R6序列,该多肽也可包含一个或多个(如1、2、3、4、5、6、7、8、9等)单个氨基酸的缺失。相对于R6序列,该多肽也可包含一个或多个(如1、2、3、4、5、6、7、8、9个等)插入(如1、2、3、4或5个氨基酸)。
类似地,本发明所用多肽可包含某氨基酸序列,该序列:
(a)与序列表公开的某一序列相同(即100%相同);
(b)与序列表公开的某一序列具有序列相同性(如60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);
(c)与(a)或(b)的序列相比,含有1、2、3、4、5、6、7、8、9或10个(或更多个)单氨基酸改变(缺失、插入、取代)的序列,这些改变可以位于不同位置或连续出现;和
(d)用逐对比对算法与序列表中的特定序列比对时,每个从N-末端向C-末端移动的x个氨基酸的窗口(使得在p(p>x)个氨基酸上比对时,存在p-x+1个这种窗口)具有至少x·y个相同的比对氨基酸,其中:x选自20、25、30、35、40、45、50、60、70、80、90、100、150、200;y选自0.50、0.60、0.70、0.75、0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99;如果x·y不是整数,则四舍五入至整数。优选的逐对比对算法是Needleman-Wunsch全局比对算法[90],使用默认参数(如缺口开放罚分=10.0,缺口延伸罚分=0.5,使用EBLOSUM62积分矩阵)。用EMBOSS软件包中的needle工具能方便地实施这种算法[91]。
使用杂交多肽时,杂交体内的单个抗原(即单个-X-部分)可来自一种或多种菌株。例如,n=2时,X2可来自与X1相同的菌株,或来自不同菌株。当n=3时,该菌株可以是(i)X1=X2=X3 (ii)X1=X2≠X3 (iii)X1≠X2=X3 (iv)X1≠X2≠X3或(v)X1=X3≠X2等。
在(c)组内,缺失或取代可发生在N末端和/或C末端,或者可以出现在两末端之间。因此,截短是缺失的一个例子。截短可包括在N末端和/或C末端缺失多达40个(或更多)氨基酸。
通常,当本发明多肽包括与序列表所示完整肺炎球菌序列不同的序列时(例如,当它包含序列相同性<100%的序列,或包含其片段时),在各种单独情况下,该多肽优选可引发识别完整肺炎球菌序列的抗体。
突变细菌
本发明也提供来自本发明各种抗原组的一种或多种抗原被敲除的肺炎球菌。产生敲除细菌的技术是本领域熟知的,曾报道过敲除的肺炎球菌。敲除突变可位于基因的编码区,或者可位于转录控制区内(如启动子内)。敲除突变会将编码抗原的mRNA水平降低至野生型细菌产量水平的<1%,优选降低至<0.5%,更优选降低至<0.1%,最优选降低至0%。
本发明也提供其中来自本发明各种抗原组的一种或多种抗原具有抑制其活性的突变的肺炎球菌。编码该抗原的基因将具有改变所编码氨基酸序列的突变。突变可包括缺失、取代和/或插入,其中任何一种均可涉及一个或多个氨基酸。
免疫原性组合物和药物
本发明免疫原性组合物可用作疫苗。本发明疫苗可以是预防性(即预防感染)或治疗性(即治疗感染)疫苗,但一般是预防性疫苗。
因此,组合物可以是药学上可接受的。除抗原外,它们通常还包含其它组分,例如它们一般包含一种或多种药物载体和/或赋形剂。对这类组分的充分讨论参见参考文献285。
组合物通常以水性形式给予哺乳动物。然而在给药前,该组合物可以是非水性形式。例如,虽然一些疫苗制备成水性形式后以水性形式填装、分销和给药,但其他疫苗在制备过程中冻干,并在使用时重建成水性形式。因此,本发明组合物可以是干燥制剂,例如冻干制剂。
该组合物可含有防腐剂,如硫柳汞或2-苯氧乙醇。然而,疫苗优选应基本不含(即小于5μg/ml)含汞物质,如不含硫柳汞。更优选无汞的疫苗。特别优选不含防腐剂的疫苗。
为了提高热稳定性,组合物可包含温度保护剂。这种物质的详情如下所述。
为了控制张力,优选包含生理性盐如钠盐。优选氯化钠(NaCl),它的浓度可以是1-20mg/ml,例如约10±2mg/ml NaCl。可以存在的其它盐包括氯化钾、磷酸二氢钾、二水合磷酸氢二钠、氯化镁、氯化钙等。
组合物的渗透压通常为200mOsm/kg-400mOsm/kg,优选为240-360mOsm/kg,更优选为290-310mOsm/kg。
组合物可含有一种或多种缓冲剂。缓冲剂一般包括:磷酸盐缓冲剂;Tris缓冲剂;硼酸盐缓冲剂;琥珀酸盐缓冲剂;组氨酸缓冲剂(特别是与氢氧化铝佐剂联用时);或柠檬酸缓冲剂。包含的缓冲剂的浓度一般是5-20mM。
组合物的pH通常为5.0-8.1,更一般为6.0-8.0,例如6.5-7.5,或者7.0-7.8。
该组合物优选无菌。该组合物优选无热原,如每剂量含有<1EU(内毒素单位,标准量度),优选每剂量<0.1EU。该组合物优选不含谷蛋白。
该组合物可含有一次免疫的物质,或者可含有多次免疫的物质(即‘多剂量’药盒)。多剂量配置优选含有防腐剂。作为多剂量组合物中包含防腐剂的替代方案(或除此之外),该组合物可包含在装有用于取出物质的无菌接头的容器中。
人疫苗的给药剂量体积一般为约0.5ml,但可将一半剂量(即约0.25ml)给予儿童。
本发明免疫原性组合物也可包含一种或多种免疫调节剂。优选地,一种或多种免疫调节剂包括一种或多种佐剂。佐剂可包括TH1佐剂和/或TH2佐剂,详述见下。
可用于本发明组合物的佐剂包括但不限于:
A.含矿物质的组合物
本发明中适合用作佐剂的含有矿物质的组合物包括矿物盐,例如铝盐和钙盐(或其混合物)。钙盐包括磷酸钙(如参考文献92公开的“CAP”颗粒)。铝盐包括氢氧化铝、磷酸铝、硫酸铝等,所述盐取任何合适形式(如凝胶、晶体、无定形态等)。优选吸附于这些盐。也可将含有矿物质的组合物制成金属盐的颗粒[93]。
可使称为氢氧化铝和磷酸铝的佐剂。这些名称是常规名称,仅为方便使用,因为它们都不是所代表的实际化合物的准确描述[例如参见参考文献94的第9章]。本发明可采用通常用作佐剂的任何″氢氧化物″或″磷酸盐″佐剂。称为″氢氧化铝″的佐剂一般是羟基氧化铝盐(通常至少部分为晶体)。称为″磷酸铝″的佐剂一般是羟基磷酸铝,也常常含有少量硫酸盐(即羟基磷酸硫酸铝)。可通过沉淀获得这些佐剂,沉淀期间的反应条件和浓度影响磷酸根取代该盐中羟基的程度。
氢氧化铝佐剂呈典型的纤维形态(例如,电子透射显微照片所见的)。氢氧化铝佐剂的pI通常约11,即在生理pH下佐剂本身具有表面正电荷。据报道,pH 7.4时,氢氧化铝佐剂的吸附能力在每mg Al+++1.8-2.6mg蛋白质之间。
磷酸铝佐剂的PO4/Al摩尔比通常为0.3-1.2,优选0.8-1.2,更优选0.95±0.1。磷酸铝通常是无定形的,尤其是羟基磷酸盐。典型的佐剂是PO4/Al摩尔比为0.84-0.92的无定形的羟基磷酸铝,包含0.6mg Al3+/ml。磷酸铝通常是颗粒(如在透射电子显微镜照片上观察到的板状形态)。抗原吸附后颗粒直径一般是0.5-20μm(如约5-10μm)。据报道,pH 7.4时磷酸铝佐剂的吸附容量为0.7-1.5毫克蛋白质/毫克Al+++
磷酸铝的零点电荷(PZC)与磷酸对羟基的取代程度逆相关,这种取代程度可能取决于用于通过沉淀制备盐的反应条件和反应物浓度。也通过改变溶液中游离磷酸根离子的浓度(更多磷酸根=更多酸性PZC)或加入缓冲剂如组氨酸缓冲剂(使PZC碱性更强)改变PZC。本发明所用的磷酸铝的PZC通常为4.0-7.0,更优选为5.0-6.5,例如约为5.7。
用于制备本发明组合物的铝盐悬浮液可以,但不一定含有缓冲液(如磷酸盐或组氨酸或Tris缓冲液)。该悬浮液优选无菌且无热原。该悬浮液可含有游离的水性磷酸根离子,如浓度为1.0-20mM,优选5-15mM,更优选约10mM的磷酸根离子。该悬浮液也可含有氯化钠。
本发明可使用氢氧化铝和磷酸铝的混合物。在这种情况下,磷酸铝比氢氧化铝多,例如重量比为至少2∶1,例如≥5∶1、≥6∶1、≥7∶1、≥8∶1、≥9∶1等。
给予患者的组合物中Al+++的浓度优选小于10mg/ml,例如≤5mg/ml、≤4mg/ml、≤3mg/ml、≤2mg/ml、≤1mg/ml等。优选范围是0.3-1mg/ml。最大值优选为0.85毫克/剂量。
特别优选磷酸铝,尤其是在包含流感嗜血杆菌(H.influenzae)糖抗原的组合物中,典型的佐剂是PO4/Al摩尔比在0.84和0.92之间的无定形羟基磷酸铝,含量为0.6mg Al3+/ml。可采用低剂量磷酸铝吸附,如50-100μg Al3+/偶联物/剂。当组合物中含有一种以上偶联物时,不需要吸附所有偶联物。
B.油乳剂
适合用作本发明佐剂的油乳剂组合物包含鲨烯-水乳剂,如MF59[参考文献94第10章;也参见参考文献95](5%鲨烯、0.5%吐温80和0.5%司盘85,用微流化床配制成亚微米颗粒)。也可用完全弗氏佐剂(CFA)和不完全弗氏佐剂(IFA)。
已知各种水包油乳剂,它们通常包括至少一种油和至少一种表面活性剂,所述油和表面活性剂是可生物降解(可代谢)和生物相容的。乳剂中的油滴直径通常小于5μm,理想情况下具有亚微米直径,通过微流化床实现这种小尺寸以提供稳定乳剂。优选小于220nm的液滴,因为它们可进行过滤除菌。
乳剂可包含诸如动物(如鱼)或植物来源的油。植物油的来源包括坚果、种籽和谷物。坚果油中最常见的是花生油、大豆油、可可油和橄榄油。也可使用获自(例如)霍霍巴豆的霍霍巴油。种籽油包括红花油、棉花籽油、葵花籽油、芝麻油等。在谷物油中,最常见的是玉米油,但也可采用其它谷类如小麦、燕麦、裸麦、稻、画眉草(teff)、黑小麦(triticale)等的油。可从坚果和种籽油开始,通过水解、分离和酯化合适物质制备甘油和1,2-丙二醇的6-10碳脂肪酸酯(不是种籽油中天然产生的)。来自哺乳动物乳汁的脂肪和油是可代谢的,因此可用于实施本发明。由动物来源获得纯油的过程中必需的分离、纯化、皂化和其它步骤是本领域众所周知的。大多数鱼类含有容易回收的可代谢油。例如,鳕鱼肝油、鲨鱼肝油和鲸油如鲸蜡代表了可用于本发明的几种鱼油的例子。通过生化途径用5-碳异戊二烯单位合成许多支链油,它们总称为萜类。鲨鱼肝油含有称为鲨烯的支链不饱和类萜,2,6,10,15,19,23-六甲基-2,6,10,14,18,22-二十四碳六烯,本文特别优选此类萜。鲨烯的饱和类似物鲨烷也是优选的油。鱼油,包括鲨烯和鲨烷易于从商业来源购得,或可通过本领域已知方法获得。其它优选油是生育酚(见下)。可采用油的混合物。
可通过′HLB′(亲水/亲脂平衡)对表面活性剂分类。本发明优选的表面活性剂的HLB为至少10,优选至少15,更优选至少16。可用于本发明的表面活性剂包括但不限于:聚氧乙烯去水山梨糖醇酯表面活性剂(通常称为吐温),特别是聚山梨酯20和聚山梨酯80;以商品名DOWF AX出售的环氧乙烷(EO)、环氧丙烷(PO)和/或环氧丁烷(BO)的共聚物,如直链EP/PO嵌段共聚物;重复的乙氧基(氧-1,2-乙二基)数量不同的辛苯聚醇,特别感兴趣的是辛苯聚醇9(曲通(Triton)X-100,或叔辛基苯氧基聚乙氧基乙醇);(辛基苯氧基)聚乙氧基乙醇(IGEPAL CA-630/NP-40);磷脂如磷脂酰胆碱(卵磷脂);壬酚乙醇酯,如TergitolTM NP系列;衍生自十二烷醇、十六烷醇、十八烷醇和油醇的聚氧乙烯脂肪醚(称为苄泽表面活性剂),如三乙二醇单月桂基醚(苄泽30);以及去水山梨糖醇酯(通常称为司盘),如去水山梨糖醇三油酸酯(司盘85)和去水山梨糖醇单月桂酸酯。优选非离子型表面活性剂。乳液中包含的优选表面活性剂是吐温80(聚氧乙烯去水山梨糖醇单油酸酯)、司盘85(去水山梨糖醇三油酸酯)、卵磷脂和曲通X-100。
可使用表面活性剂的混合物,如吐温80/司盘85混合物。也适合采用聚氧乙烯去水山梨糖醇酯如聚氧乙烯去水山梨糖醇单油酸酯(吐温80)和辛苯聚醇如叔辛基苯氧基聚乙氧基乙醇(曲通X-100)的混合物。另一种有用的混合物包含聚乙二醇单月桂醚9和聚氧乙烯去水山梨糖醇酯和/或辛苯聚醇。
表面活性剂的含量(重量%)优选为:聚氧乙烯去水山梨糖醇酯(如吐温80)0.01-1%,特别是约0.1%;辛基-或壬基苯氧基聚氧乙醇(如曲通X-100或曲通系列的其它去污剂)0.001-0.1%,特别是0.005-0.02%;聚氧乙烯醚(如月桂醇聚醚9)0.1-20%,优选0.1-10%,特别是0.1-1%或约0.5%。
优选乳液佐剂的平均液滴大小为<1μm,例如≤750nm、≤500nm、≤400nm、≤300nm、≤250nm、≤220nm、≤200nm或更小。可通过诸如微流化等技术方便地获得这种液滴大小。
本发明所用的具体水包油乳液佐剂包括但不限于:
●鲨烯、吐温80和司盘85的亚微米乳液。该乳液的体积组成可以是约5%鲨烯、约0.5%聚山梨酯80和约0.5%司盘85。以重量计,这些比例变为4.3%鲨烯、0.5%聚山梨酯80和0.48%司盘85。这种佐剂称为‘MF59’[96-98],参考文献99的第10章和参考文献100的第12章更详细地描述了该佐剂。MF59乳液宜包含柠檬酸根离子,如10mM柠檬酸钠缓冲液。
●鲨烯、生育酚和聚山梨酯80(吐温80)的乳液。该乳液可包含磷酸盐缓冲盐水。它也可含有司盘85(如1%)和/或卵磷脂。这些乳液可含有2-10%鲨烯、2-10%生育酚和0.3-3%吐温80,鲨烯∶生育酚的重量比优选≤1,因为这能使乳液更稳定。角鲨烯和吐温80的体积比可以约为5∶2,或者重量比约为11∶5。可通过下述方法制备一种这样的乳液:将吐温80溶解于PBS得到2%溶液,然后将90ml该溶液与5g DL-α-生育酚和5ml鲨烯的混合物混合,然后使该混合物微流体化。得到的乳液可含有(如)平均直径为100-250nm,优选约180nm的亚微米油滴。该乳液也可含有3-脱-O-酰化单磷酰脂质A(‘3d-MPL’)。此种类型的另一种有用乳液可包含(每个人用剂量)0.5-10mg鲨烯、0.5-11mg生育酚和0.1-4mg聚山梨酯80[101]。
●鲨烯、生育酚和曲通去污剂(如曲通X-100)的乳液。该乳液也可包含3d-MPL(见下)。该乳液可含有磷酸盐缓冲液。
●含有聚山梨酯(如聚山梨酯80)、曲通去污剂(如曲通X-100)和生育酚(如琥珀酸α-生育酚)。该乳液可包含这三种组分,其质量比约为75∶11∶10(如750μg/ml聚山梨酯80、110μg/ml曲通X-100和100μg/ml琥珀酸α-生育酚),这些浓度应包括抗原中这些组分的贡献。该乳液还可包含鲨烯。该乳液也可包含3d-MPL(见下)。水相可含有磷酸盐缓冲液。
●鲨烯、聚山梨酯80和泊洛沙姆401(″普流罗尼克TM L121″)的乳液。可以用磷酸盐缓冲盐水,pH 7.4配制该乳液。该乳液是一种有用的胞壁酰二肽递送载体,已与用″SAF-I″佐剂(0.05-1%Thr-MDP、5%鲨烯、2.5%普流罗尼克L121和0.2%聚山梨酸酯80)配的苏氨酰基-MDP[102]一起使用。也可不与Thr-MDP一起使用,例如用″AF″佐剂(5%鲨烯、1.25%普流罗尼克L121和0.2%聚山梨酸酯80)[103]。优选微流体化。
●含有鲨烯、水性溶剂、聚氧乙烯烷基醚亲水性非离子型表面活性剂(如聚氧乙烯(12)十六十八醚)和疏水性非离子型表面活性剂(如去水山梨糖醇酯或二缩甘露醇酯,如去水山梨糖醇单油酸酯或‘司盘80’)的乳液。该乳剂优选为热可逆的和/或其中至少90%油滴(以体积计)小于200nm[104]。该乳剂也可含有以下一种或多种物质:糖醇;低温保护剂(例如,糖,如十二烷基麦芽苷和/或蔗糖);和/或烷基聚糖苷(alkylpolyglycoside)。该乳液可包含TLR4激动剂[105]。这类乳液可以被冻干。
●角鲨烯、泊洛沙姆-105和Abil-Care的乳液[106]。含佐剂疫苗中这些组分的终浓度(重量)是5%鲨烯、4%泊洛沙姆-105(普流罗尼克多元醇)和2%Abil-Care 85(双-PEG/PPG-16/16PEG/PPG-16/16二甲硅油;辛酸/癸酸甘油三酯)。
●含有0.5-50%油、0.1-10%磷脂和0.05-5%非离子型表面活性剂的乳液。如参考文献107述,优选的磷脂组分是磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酰甘油、磷脂酸、鞘磷脂和心磷脂。优选亚微米液滴尺寸。
●不可代谢油(如轻质矿物油)和至少一种表面活性剂(如卵磷脂、吐温80或司盘80)的亚微米水包油乳液。可包含添加剂,例如QuilA皂苷、胆固醇、皂苷-亲脂体偶联物(如通过葡糖醛酸的羧基将脂族胺加到脱酰基皂苷上而产生的GPI-0100,参见参考文献108、二甲基二-十八烷基溴化铵和/或N,N-二-十八烷基-N,N-双(2-羟乙基)丙二胺。
●皂苷(如QuilA或QS21)和固醇(如胆固醇)结合成螺旋胶束的乳液[109]。
●包含矿物油、非离子亲脂性乙氧基化脂肪醇和非离子亲水性表面活性剂(例如,乙氧基化脂肪醇和/或聚氧乙烯-聚氧丙烯嵌段共聚物)的乳液[110]。
●包含矿物油、非离子亲脂水性乙氧基化脂肪醇和非离子亲脂性表面活性剂(例如,乙氧基化脂肪醇和/或聚氧乙烯-聚氧丙烯嵌段共聚物)的乳液[110]。
在一些实施方式中,可在递送时即时将乳液与抗原混合,因此佐剂和抗原可单独地保存在包装或分销的疫苗中,以便在使用时配制成最终制剂。在其它实施方式中,在生产过程中将乳液与抗原混合,因此组合物以含佐剂液体形式包装。抗原通常是水性形式,以便最终通过混合两种液体制备疫苗。混合的两种液体的体积比可变(例如5∶1-1∶5),但通常约为1∶1。上述对具体乳液的说明给出组分浓度时,这些浓度通常是非稀释组合物,因此与抗原溶液混合后浓度降低。
当组合物包含生育酚时,可采用α、β、γ、δ、ε或ξ生育酚中的任何一种,但优选α-生育酚。生育酚可取不同形式,例如不同的盐和/或异构体。盐包括有机盐,例如琥珀酸盐、乙酸盐、烟酸盐等。可同时采用D-α-生育酚和DL-α-生育酚。用于老年患者(如年龄大于60岁或更大的患者)的疫苗中宜包含生育酚,因为据报道维生素E在此患者群体中对免疫应答有正面作用[111]。它们也具有抗氧化特性,这种特性有助于稳定该乳液[112]。优选的α-生育酚是DL-α-生育酚,此种生育酚的优选盐是琥珀酸盐。发现琥珀酸盐在体内能与TNF相关配体协作。
C.皂苷制剂[参考文献94的第22章]
皂苷制剂也可用作本发明的佐剂。皂苷是在许多种类植物的树皮、叶、茎干、根甚至花中发现的甾醇糖苷和三萜糖苷的异质群体。已广泛研究了作为佐剂的来自皂树(Quillaia saponaria)Molina树皮的皂苷。皂苷也可购自丽花菝葜(Smilax ornata)(墨西哥菝葜)、满天星(Gypsophilla paniculata)(婚纱花)和肥皂草(Saponaria officianalis)(皂根)。皂苷佐剂制剂包括纯化制剂如QS21以及脂质制剂如ISCOM。QS21以商标StimulonTM出售。
已采用HPLC和RP-HPLC纯化皂苷组合物。已鉴定了用这些技术纯化的特定组分,包括QS7、QS17、QS18、QS21、QH-A、QH-B和QH-C。制备QS21的方法参见参考文献113。皂苷制剂也可包含甾醇,如胆固醇[114]。
皂苷和胆固醇的组合可用于形成称为免疫刺激复合物(ISCOM)的独特颗粒[参考文献94的第23章]。ISCOM通常也含有磷脂如磷脂酰乙醇胺或磷脂酰胆碱。ISCOM中可采用任何已知的皂苷。ISCOM优选包含QuilA、QHA和QHC中的一种或多种。参考文献114-116中进一步描述了ISCOM。任选地,ISCOM可不含其它去污剂[117]。
开发基于皂苷的佐剂的综述可参见参考文献118和119。
D.病毒体和病毒样颗粒
病毒体和病毒样颗粒(VLP)也可用作本发明的佐剂。这些结构通常包含一种或多种任选地与磷脂组合或一起配制的病毒蛋白。病毒体和颗粒通常无病原性、不能复制,通常不含任何天然病毒基因组。可用重组方法产生或从全病毒分离得到这种病毒蛋白。这些适用于病毒体或VLP中的病毒蛋白包括来源于流感病毒(例如HA或NA)、乙肝病毒(例如核心蛋白或包膜蛋白)、戊肝病毒、麻疹病毒、辛德比斯病毒、轮状病毒、口蹄疫病毒、逆转录病毒、诺瓦克病毒、人乳头状瘤病毒、HIV、RNA-噬菌体、Qβ-噬菌体(例如外壳蛋白)、GA-噬菌体、fr-噬菌体、AP205噬菌体和Ty(例如反转录转座子Ty蛋白p1)的蛋白。VLP在参考文献120-125中有进一步描述。病毒体在(例如)参考文献126中有进一步描述。
E.细菌或微生物衍生物
适用于本发明的佐剂包括细菌或微生物衍生物,例如肠细菌的脂多糖(LPS)的无毒衍生物、脂质A衍生物、免疫刺激性寡核苷酸和ADP-核糖基化毒素及其脱毒衍生物。
LPS的无毒衍生物包括单磷酰脂质A(MPL)和3-O-脱酰基MPL(3dMPL)。3dMPL是3脱-O-酰基单磷酰脂质A与4、5或6酰化链的混合物。3脱-O-酰基单磷酰脂质A的优选“小颗粒”形式见参考文献127中所述。3dMPL的这种“小颗粒”小到足以在过滤除菌时通过0.22μm膜[127]。其它无毒LPS衍生物包括单磷酰脂质A模拟物,例如氨基烷基氨基葡萄糖苷磷酸盐衍生物如RC529[128,129]。
脂质A衍生物包括大肠杆菌(Escherichia coli),如OM-174的脂质A衍生物。(例如)参考文献130和131中描述了OM-174。
适合用作本发明佐剂的免疫刺激性寡核苷酸包括含CpG基序的核苷酸序列(含有通过磷酯键与鸟嘌呤连接的非甲基化胞嘧啶的二核苷酸序列)。含回文结构或聚(dG)序列的双链RNA和寡核苷酸也显示具有免疫刺激作用。
CpG可包含核苷酸修饰/类似物,如硫代磷酸酯修饰,可以是双链或单链。参考文献132、133和134公开了可能的类似取代,例如用2’-脱氧-7-脱氮鸟苷取代鸟苷。参考文献135-140中进一步讨论了CpG寡核苷酸的佐剂作用。
CpG序列可能导向TLR9,例如基序GTCGTT或TTCGTT[141]。CpG序列可特异性诱导Th1免疫应答,例如CpG-A ODN,或更特异地诱导B细胞应答,例如CpG-B ODN。参考文献142-144中讨论了CpG-A和CpG-BODN。CpG优选是CpG-A ODN。
优选构建CpG寡核苷酸时使其5’端可为受体所识别。任选将两个CpG寡核苷酸序列的3’端相连接形成“免疫聚体”。参见例如,参考文献141和145-147。
有用的CpG佐剂是CpG7909,也称为ProMuneTM(科雷制药集团公司(Coley Pharmaceutical Group,Inc.))。另一种是CpG1826。或者或此外,为了使用CpG序列,可使用TpG序列[148],这些寡核苷酸可不含非甲基化CpG基序。免疫刺激性寡核苷酸可能富含嘧啶。例如,它可能含有一个以上连续的胸腺嘧啶核苷酸(例如,参考文献148所公开的TTTT),和/或它的核苷酸组成中可能含有>25%胸腺嘧啶(例如>35%、>40%、>50%、>60%、>80%等)。例如,它可能含有一个以上连续的胞嘧啶核苷酸(例如,参考文献148所公开的CCCC),和/或它的核苷酸组成中可能含有>25%胞嘧啶(例如>35%、>40%、>50%、>60%、>80%等)。这些寡核苷酸可以不含未甲基化的CpG基序。免疫刺激性寡核苷酸一般含有至少20个核苷酸。它们可含有少于100个核苷酸。
基于免疫刺激性寡核苷酸的特别有用的佐剂被称为IC-31TM[149]。因此,本发明佐剂可包含(i)和(ii)的混合物:(i)包含至少一个(优选多个)CpI基序(即胞嘧啶与肌苷相连形成的二核苷酸)的寡核苷酸(例如15-40个核苷酸),和(ii)聚阳离子聚合物,如包含至少一个(优选多个)Lys-Arg-Lys三肽序列的寡肽(如5-20个氨基酸)。寡核苷酸可以是含有26-聚体序列5′-(IC)13-3′(SEQ ID NO:230)的脱氧核苷酸。聚阳离子聚合物可以是含有11-聚体氨基酸序列KLKLLLLLKLK(SEQ ID NO:231)的肽。寡核苷酸和聚合物可形成复合物,如参考文献150和151所述。
细菌ADP-核糖基化毒素及其脱毒衍生物可用作本发明的佐剂。优选该蛋白获自大肠杆菌(大肠杆菌不耐热肠毒素“LT”)、霍乱(“CT”)或百日咳(“PT”)菌。参考文献152中描述了将脱毒的ADP-核糖基化毒素用作粘膜佐剂,参考文献153中描述了将其用作胃肠道外佐剂。毒素和类毒素优选包含A和B亚单位的全毒素形式。优选A亚单位含有脱毒突变;B亚单位优选不突变。佐剂优选脱毒的LT突变体如LT-K63、LT-R72和LT-G192。参考文献154-161中描述了将ADP-核糖基化毒素及其脱毒衍生物,尤其是LT-K63和LT-R72用作佐剂。有用的CT突变体是CT-E29H[162]。优选根据参考文献163中提出的ADP-核糖基化毒素的A和B亚单位的排列对比对氨基酸取代基编号,该参考文献的全部内容特别纳入本文作为参考。
F.人免疫调节剂
适合用作本发明佐剂的人免疫调节剂包括细胞因子,如白介素(如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12[164]等)[165]、干扰素(如干扰素-γ)、巨噬细胞集落刺激因子和肿瘤坏死因子。优选的免疫调节剂是IL-12。
G.生物粘着剂和粘膜粘着剂
生物粘着剂和粘膜粘着剂也可用作本发明的佐剂。合适的生物粘着剂包括酯化透明质酸微球[166]或粘膜粘着剂如聚(丙烯酸)交联衍生物、聚乙烯醇、聚乙烯吡咯烷酮、多糖和羧甲基纤维素。壳聚糖及其衍生物也可用作本发明的佐剂[167]。
H.微粒
微粒也可用作本发明的佐剂。微粒(即直径~100nm至~150μm,优选~200nm至~30μm,最优选~500nm至~10μm的颗粒)由无毒材料(例如聚(α-羟酸)、聚羟基丁酸、聚正酯、聚酐、聚己酸内酯等),优选聚(丙交酯-乙交酯共聚物)形成,并任选经处理而具有带负电荷表面(例如用SDS处理)或带正电荷表面(例如用阳离子去污剂如CTAB处理)。
I.脂质体(参考文献94的第13和14章)。
适合用作佐剂的脂质体制剂的例子见参考文献168-170所述。
J.聚氧乙烯醚和聚氧乙烯酯制剂
适合用于本发明的佐剂包括聚氧乙烯醚和聚氧乙烯酯[171]。这种制剂还包括聚氧乙烯去水山梨糖醇酯表面活性剂和辛苯糖醇[172]以及聚氧乙烯烷基醚或酯表面活性剂和至少一种其它非离子表面活性剂如辛苯糖醇[173]的混合物。优选的聚氧乙烯醚选自:优选的聚氧乙烯醚选自下组:聚氧乙烯-9-月桂醚(月桂醇聚醚9)、聚氧乙烯-9-硬脂酰基(steoryl)醚、聚氧乙烯-8-硬脂酰基醚、聚氧乙烯-4-月桂醚、聚氧乙烯-35-月桂醚和聚氧乙烯-23-月桂醚。
K.磷腈
可使用磷腈,如参考文献174和175中所述的聚[二(羧基苯氧基)磷腈](poly[di(carboxylatophenoxy)phosphazene],“PCPP”)。
L.胞壁酰肽
适合用作本发明佐剂的胞壁酰肽的例子包括N-乙酰基-胞壁酰-L-苏氨酰-D-异谷酰胺(thr-MDP)、N-乙酰基-正胞壁酰-L-丙氨酰-D-异谷酰胺(正-MDP)和N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰胺酰-L-丙氨酸-2-(1’-2’-二棕榈酰-sn-甘油-3-羟基磷酰氧基)-乙胺MTP-PE)。
M.咪唑并喹诺酮化合物。
适合用作本发明佐剂的咪唑并喹诺酮化合物的例子包括咪喹莫特(″R-837″)[176,177]、瑞喹莫德(“R-848”)[178],以及它们的类似物和盐(如盐酸盐)。有关免疫刺激性咪唑喹啉的其它细节可参见参考文献179-183。
N.取代的脲
用作佐剂的取代的脲包括式I、II或III的化合物,或其盐:
Figure GPA00001064434701291
如参考文献184所述,例如‘ER803058’、‘ER803732’‘ER804053’、ER804058’、‘ER804059’、‘ER804442’、‘ER804680’、‘ER804764’、ER803022或‘ER804057’,如:
Figure GPA00001064434701301
O.其他佐剂
可用于本发明的其他佐剂包括:
●氨烷基氨基葡糖苷磷酸衍生物,如RC529[185,186]。
●缩氨基硫脲化合物,如参考文献187所述的化合物。参考文献187中也描述了配制、制备和筛选活性化合物的方法。缩氨基硫脲在刺激人外周血单核细胞产生细胞因子如TNF-α方面特别有效。
●色胺酮化合物,如参考文献188所述的化合物。参考文献188中也描述了配制、制备和筛选活性化合物的方法。缩氨基硫脲在刺激人外周血单核细胞产生细胞因子如TNF-α方面特别有效。
●核苷类似物,如(a)埃索他宾(Isatorabine)(ANA-245;7-硫杂-8-氧代鸟苷)及其前药:
(b)ANA975;(c)ANA-025-1;(d)ANA380;(e)参考文献189-191所公开的化合物。
●洛索立宾(Loxoribine)(7-烯丙基-8-氧代鸟苷)[192]。
●·参考文献193所述化合物,包括:酰基哌嗪化合物、吲哚二酮化合物、四氢异喹啉(THIQ)化合物、苯并环二酮化合物、氨基氮杂乙烯基化合物、氨基苯并咪唑喹啉酮(ABIQ)化合物[194,195]、水合酞酰胺(hydrapthalamide)化合物、苯并苯基酮化合物、异噁唑化合物、固醇化合物、喹唑啉酮(quinazilinone)化合物、吡咯化合物[196]、蒽醌化合物、喹喔啉化合物、三嗪化合物、吡唑嘧啶化合物和吲哚化合物[197]。
●含有连接于含磷酸无环主链的脂质的化合物,如TLR4拮抗剂E5564[198,199]:
●聚氧鎓(polyoxidonium)聚合物[200,201]或其它N-氧化的聚乙烯-哌嗪衍生物。
●甲基肌苷5′-单磷酸酯(″MIMP″)[202]。
●多聚羟化吡咯双烷类化合物[203],如下式化合物:
Figure GPA00001064434701312
式中,R选自:氢,直链或支链、未取代或取代、饱和或不饱和的酰基、烷基(如环烷基)、烯基、炔基和芳基,或其药学上可接受的盐或衍生物。例子包括但不限于:木麻黄(casuarine)、木麻黄-6-α-D-吡喃葡萄糖、3-表-木麻黄、7-表-木麻黄、3,7-二表-木麻黄等。
●CD1配体,如α-糖基神经酰胺[116-123](如α-半乳糖基神经酰胺)、含植物鞘氨醇的α-糖基神经酰胺、OCH、KRN7000[(2S,3S,4R)-1-O-(α-D-吡喃半乳糖基)-2-(N-二十六烷酰氨基)-1,3,4-十八烷三醇、CRONY-101、3″-O-硫代-半乳糖基神经酰胺等等。
●γ菊糖[212]或其衍生物,如阿尔加穆林(algammulin)。
Figure GPA00001064434701321
佐剂组合
本发明也可包括以上鉴定的一种或多种佐剂各方面的组合。例如,以下佐剂组合物可用于本发明:(1)皂苷和水包油乳剂[213];(2)皂苷(如QS21)+无毒LPS衍生物(如3dMPL)[214];(3)皂苷(如QS21)+无毒LPS衍生物(如3dMPL)+胆固醇;(4)皂苷(如QS21)+3dMPL+IL12(任选+固醇)[215];(5)3dMPL与(例如)QS21和/或水包油乳剂的组合[216];(6)SAF,含有10%鲨烯、0.4%吐温80TM、5%普流罗尼克-嵌段聚合物L121和thr-MDP,或微流体化成为亚微米乳液或涡旋振荡产生粒度较大的乳液。(7)RibiTM佐剂系统(RAS)(力必免疫化学公司(Ribi Immunochem)),含有2%鲨烯、0.2%吐温80和一种或多种细菌细胞壁组分,所述组分选自单磷酰脂质A(MPL)、海藻糖二霉菌酸酯(TDM)或细胞壁骨架(CWS),优选MPL+CWS(DetoxTM);和(8)一种或多种无机盐(如铝盐)+LPS的无毒衍生物(如3dMPL)。
用作免疫刺激剂的其它物质可参见参考文献94的第7章。
特别优选使用氢氧化铝和/或磷酸铝佐剂,抗原通常吸附于这些盐。磷酸钙是另一种优选佐剂。其他优选的佐剂组合包括Th1和Th2佐剂的组合,如CpG和明矾或瑞喹莫德和明矾。可使用磷酸铝和3dMPL的组合,已报道这种组合在肺炎球菌免疫中有效[325]。
本发明组合物可引起细胞介导的免疫应答以及体液免疫应答。此种免疫应答优选诱导长期(如中和性)抗体和细胞介导的免疫,以便在接触肺炎球菌时迅速作出反应。
通常认为,有两种类型的T细胞,即CD4和CD8细胞是启动和/或增强细胞介导的免疫和体液免疫所必需的。CD8T细胞可表达CD8共同受体,通常称为细胞毒性T淋巴细胞(CTL)。CD8T细胞能够识别或与MHC I类分子上展示的抗原相互作用。
CD4T细胞可表达CD4共同受体,通常称为T辅助细胞。CD4T细胞能够识别结合于MHC II类分子的抗原性肽。与MHC II类分子相互作用时,CD4细胞可分泌诸如细胞因子等因子。这些分泌的细胞因子可激活B细胞、细胞毒性T细胞、巨噬细胞和参与免疫应答的其他细胞。辅助T细胞或CD4+细胞可进一步分成两个功能不同的亚组:即细胞因子和效应功能不同的TH1表型和TH2表型。
活化的TH1细胞能增强细胞免疫(包括抗原特异性CTL产量增加),因而在应对胞内感染时具有特殊价值。活化的TH1细胞可分泌IL-2、IFN-γ和TNF-β中的一种或多种。TH1免疫应答可通过激活巨噬细胞、NK(自然杀伤)细胞和CD8细胞毒性T细胞(CTL)导致局部炎症反应。通过用IL-12刺激B和T细胞的生长,TH1免疫应答也可用于放大免疫应答。TH1刺激的B细胞可分泌IgG2a。
活化的TH2细胞提高抗体产量,因而在应对胞外感染时有价值。活化的TH2细胞可分泌IL-4、IL-5、IL-6和IL-10中的一种或多种。TH2免疫应答可导致产生IgG1、IgE、IgA和记忆B细胞,用于将来的保护作用。
增强的免疫应答可包括增强的TH1免疫应答和TH2免疫应答中的一种或多种。
TH1免疫应答可包括CTL增加、与TH1免疫应答相关的一种或多种细胞因子(例如IL-2、IFN-γ和TNF-β)增加、活化的巨噬细胞增加、NK活性增加或者IgG2a产量增加中的一种或多种现象。优选地,增强的TH1免疫应答将包括IgG2a产量的增加。
可利用TH1佐剂引发TH1免疫应答。相对于不用佐剂的抗原免疫,TH1佐剂通常引起IgG2a产量增加。适用于本发明的TH1佐剂可包括例如,皂苷制剂、病毒体和病毒样颗粒、肠细菌脂多糖(LPS)的无毒衍生物、免疫刺激性寡核苷酸。免疫刺激性寡核苷酸,如含有CpG基序的寡核苷酸是本发明所用的优选TH1佐剂。
TH2免疫应答可包括与TH2免疫应答相关的一种或多种细胞因子(例如IL-4、IL-5、IL-6和IL-10)增加,或者IgG1、IgE、IgA和记忆B细胞产量增加中的一种或多种现象。优选地,增强的TH2免疫应答将包括IgG1产量的增加。
可利用TH2佐剂引发TH2免疫应答。相对于不用佐剂的抗原免疫,TH2佐剂通常引起IgG1产量增加。适用于本发明的TH2佐剂包括例如,含矿物质组合物、油乳剂和ADP-核糖基化毒素和其脱毒衍生物。含矿物质组合物,如铝盐是本发明所用的优选TH2佐剂。
本发明优选包括包含TH1佐剂和TH2佐剂的组合的组合物。这种组合物优选引起增强的TH1和增强的TH2应答,即相对于不用佐剂的免疫IgG1和IgG2a产量均有增加。更优选地,相对于用单一佐剂的免疫(即,相对于只用TH1佐剂的免疫或只用TH2佐剂的免疫),包含TH1和TH2佐剂组合的组合物引起TH1和/或TH2免疫应答增强。
免疫应答可以是TH1免疫应答和TH2免疫应答之一或两者。优选地,免疫应答提供增强的TH1应答和增强的TH2应答之一或两者。
增强的免疫应答可以是全身免疫应答和粘膜免疫应答之一或两者。优选地,该免疫应答提供增强的全身免疫应答和增强的粘膜免疫应答之一或两者。粘膜免疫应答优选是TH2免疫应答。粘膜免疫应答优选包括IgA产量增加。
肺炎球菌感染可影响躯体的各个部分,因此可将本发明组合物制备成各种形式。例如,可将该组合物制备成液体溶液或悬浮液形式的注射剂。也可制备适合在注射前溶解或悬浮于液体运载体的固体形式(如冻干组合物或喷雾冻干组合物)。该组合物可制备成外用制剂,如油膏剂、乳膏剂或粉末剂。该组合物可制备成口服给药制剂,如片剂或胶囊,喷雾剂,或糖浆剂(任选调味)。该组合物可制备成使用细粉或喷雾的肺部给药制剂,如吸入剂。该组合物可制备成栓剂或子宫托。组合物可制成鼻内、耳内或眼内给药,例如滴剂。组合物可以是药盒形式,设计成刚好在给予患者之前重建合并的组合物。这种药盒可包含一种或多种液体形式的抗原以及一种或多种冻干抗原。
临用前制备组合物(例如,以冻干形式提供组分时)和以药盒形式提供时,该药盒可包括两个药瓶,或者可包括一个填充好的注射器和一个药瓶,注射器内容物用于在临用前再次激活药瓶内容物。
用作疫苗的免疫原性组合物包含免疫有效量的抗原,以及需要的任何其它组分。‘免疫有效量’指以一次剂量或一系列剂量的一部分,将某剂量给予个体能有效治疗或预防。此量取决于所治疗个体的健康和身体状况、年龄、所治疗个体的分类地位(如非人灵长动物、灵长动物等)、个体的免疫系统合成抗体的能力、所需的保护程度、疫苗配方、治疗医生对医学情况的评估和其它相关因素。预计该量将落入可通过常规试验测定的相对较宽的范围内。组合物中包含一种以上抗原时,两种抗原的剂量可以相同或不同。
如上所述,一种组合物可包含温度保护剂,此种组分可能在含佐剂组合物(特别是含有矿物质佐剂,如铝盐的组合物)中特别有用。如参考文献217所述,可将液体温度保护剂加入水性疫苗组合物中,以降低其凝固点,例如将凝固点降低至0℃以下。因此,该组合物可以储存于0℃以下和其凝固点以上,以抑制热降解。温度保护剂也允许冷冻该组合物,同时保护矿物盐佐剂在冻融后不发生团聚或沉降,还可在较高温度,例如40℃以上保护该组合物。可将初始的水性疫苗与液体温度保护剂混合,以使液体温度保护剂占混合物终体积的1-80%。合适的温度保护剂应该是对人安全的、易于混溶/可溶于水的、并且不应损害组合物的其他成分(如抗原和佐剂)。例子包括甘油、丙二醇和/或聚乙二醇(PEG)。合适的PEG的平均分子量可以是200-20,000Da。在优选实施方式中,聚乙二醇的平均分子量可以约为300Da(‘PEG-300’)。
本发明提供一种免疫原性组合物,其包含:(1)选自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原组的一种或多种抗原;和(ii)温度保护剂。该组合物可通过混合以下组分形成:(i)包含选自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原组的一种或多种抗原的水性组合物;和(ii)温度保护剂。然后,该混合物可储存于,例如0℃以下、0-20℃、20-35℃、35-55℃或更高温度。它可以液体或冻结形式储存。该混合物可以是冻干的混合物。或者,该组合物可通过混合以下组分形成:(i)包含选自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原组的一种或多种抗原的干燥组合物;和(ii)包含温度保护剂的液体组合物。因此,可利用组分(ii)重建组分(i)。
治疗方法和疫苗的给药
本发明还提供了使哺乳动物产生免疫应答的方法,包括给予有效量的本发明组合物的步骤。免疫应答优选为保护性,并优选涉及抗体和/或细胞介导的免疫。该方法可以引起加强的应答。
本发明还提供联合用作(例如)使哺乳动物产生免疫应答的药物的至少两种本发明抗原。
本发明也提供至少两种本发明抗原在制备使哺乳动物产生免疫应答的药物中的应用。
借助这些应用和方法在哺乳动物中产生免疫应答后,则能保护该哺乳动物免遭肺炎球菌感染。更具体说,可保护哺乳动物对抗肺炎球菌脑膜炎。本发明有效对抗各种不同血清型的肺炎球菌,但尤其可用于保护血清型1、5、6和19A的菌株引起的肺炎球菌感染导致的疾病。
本发明还提供了包含第一种组分和第二种组分的药盒,其中第一种组分和第二种组分均非如上所述本发明的组合物,但其中可将第一种组分和第二种组分组合以提供如上所述本发明的组合物。所述药盒还可以包括含有下列一种或多种的第三种组分:说明书、注射器或其它递送装置、辅料或药学上可接受的制剂溶液。
本发明还提供了一种预充本发明免疫原性组合物的递送装置。
哺乳动物优选人。当预防性使用疫苗时,人优选为儿童(如幼童或婴儿);当疫苗用于治疗用途时,人优选为青少年或成人。准备给予儿童的疫苗也可给予成年人,以评估(例如)其安全性、剂量、免疫原性等。
检测治疗性治疗的功效的一种方式包括在给予本发明组合物后监测肺炎球菌感染。一种检查预防性治疗疗效的途径包括给予组合物后监测对抗本发明组合物中抗原的全身免疫应答(如监测IgG1和IgG2a产生水平)和/或粘膜免疫应答(如监测IgA产生水平)。通常,在免疫后刺激前测定抗原特异性血清抗体应答,而在免疫后刺激后测定抗原特异性粘膜抗体应答。
另一评价本发明组合物免疫原性的途径是重组表达蛋白,通过免疫印迹和/或微阵列筛查病人血清或粘膜分泌物。蛋白质和病人样品的阳性反应表明病人已经产生对受试蛋白的免疫应答。该方法也可用于鉴定优势免疫抗原和/或抗原中的表位。
通过用疫苗组合物刺激肺炎球菌感染动物模型如豚鼠或小鼠可在体内测定疫苗组合物的效果。参考文献218中描述了一种此类模型。
本发明组合物通常直接给予患者。可通过胃肠道外注射(如皮下、腹膜内、静脉内、肌肉内或组织间隙),或通过粘膜,如通过直肠、口腔(如片剂、喷雾)、阴道、局部、透皮或经皮、鼻内、眼、耳、肺或其它粘膜途径完成直接递送。
本发明可用于引起全身和/或粘膜免疫,优选引起增强的全身和/或粘膜免疫。
增强的全身和/或粘膜免疫优先表现为提高的TH1和/或TH2免疫应答。增强的免疫应答优选包括IgG1和/或IgG2a和/或IgA的产量升高。
可以通过单剂量方案或多剂量方案进行给药。多剂量可用于初免方案和/或加强免疫方案。在多剂量方案中,可通过相同或不同的途径如胃肠道外起始、粘膜加强,粘膜起始、胃肠道外加强等给予多个剂量。通常给予多个剂量的间隔是至少一周(如约2、3、4、6、8、10、12、16周等)。
可利用按照本发明制备的疫苗治疗儿童和成年人。因此,人患者可以小于1岁、1-5岁、5-15岁、15-55岁或至少55岁。接受疫苗的病人优选老年人(如≥50岁,≥60岁并优选≥65岁),幼年人(如≤5岁),住院病人、保健护理人员、武装人员和军人、孕妇、慢性病人或免疫缺陷病人。然而该疫苗不只适用于这些人群,可以在更广泛的人群中使用。
可将本发明产生的疫苗与其它疫苗基本上同时(在健康护理专业人员或疫苗接种中心的同一用药咨询或访问期间)给予患者,例如与麻疹疫苗、腮腺炎疫苗、风疹疫苗、MMR疫苗、水痘疫苗、MMRV疫苗、白喉疫苗、破伤风疫苗、百日咳疫苗、DTP疫苗、偶联的B型流感嗜血杆菌疫苗、脊髓灰质炎病毒灭活疫苗、乙型肝炎病毒疫苗、脑膜炎球菌偶联疫苗(如四价A-C-W135-Y疫苗)、呼吸道合胞病毒疫苗等基本上同时给药。
粘膜免疫
本发明提供一种免疫原性组合物,其包含(i)本发明的多肽抗原,和(ii)细菌ADP-核糖基化毒素和或其脱毒衍生物。本发明还提供一种使哺乳动物产生免疫应答的方法,包括给予哺乳动物有效量的这种免疫原性组合物的步骤。优选将该组合物给予粘膜(到粘膜表面),如可进行鼻内给药。
多肽抗原可以是,例如第七抗原组的一部分。多肽抗原可以是菌毛抗原,如RrgA或RrgB多肽。
毒素组分(i)可以,例如,源于大肠杆菌(E.coli)不耐热肠毒素(“LT”)。衍生物可在其A亚基中具有脱毒突变,例如可为LT-K63或LT-R72。
优选鼻内给予RrgB多肽和LT-K63佐剂。小鼠中已证实这样可减少鼻咽、肺和血液中侵入性肺炎球菌菌株的细菌载量,并使生存率提高5倍。
核酸免疫
上述免疫原性组合物包括来自肺炎球菌的多肽抗原。然而,在所有情况下,可用编码这些多肽的核酸(通常是DNA)替换多肽抗原,以得到基于核酸免疫的组合物、方法和用途。现在,核酸免疫是一个成熟的领域(参见参考文献219-226等),并已应用于肺炎球菌疫苗(如参考文献227)。
递送给病人后编码免疫原的核酸进行表达,然后所表达的免疫原刺激免疫系统。活性成分通常是核酸载体形式,其包含:(i)启动子;(ii)可操作地连接于启动子的免疫原编码序列;以及任选(iii)选择性标记物。优选的载体还可包含(iv)复制起点;以及(v)位于(ii)下游并与其可操作连接的转录终止子。通常,(i)和(v)为真核,(iii)和(iv)为原核。
优选的启动子是病毒启动子,如来自巨细胞病毒(CMV)的启动子。除了启动子,载体还可以包含转录调节序列(如增强子)与启动子功能性相互作用。优选的载体包含立即早期CMV增强子/启动子,更优选的载体还包含CMV内含子A。将该启动子可操作地连接于编码免疫原的下游序列,从而使免疫原编码序列的表达在该启动子的控制之下。
当使用标记物时,优选其在微生物宿主中(如原核生物中,细菌、酵母中)具有功能。标记物优选原核选择性标记物(如在原核启动子控制之下转录)。方便起见,典型的标记物为抗生素抗性基因。
本发明的载体优选自主复制附加型或染色体外载体,如质粒。
本发明的载体优选包含复制起点。该复制起点优选在原核体系中有活性而在真核体系中无活性。
因此优选的载体包含用于选择载体的原核标记物、原核复制起点以及驱动免疫原编码序列转录的真核启动子。因此载体(a)在原核宿主中扩增并选择,但不进行多肽表达,但(b)在真核宿主中表达,但不进行扩增。这种安排对于核酸免疫载体来说是理想的。
本发明的载体可以在编码序列下游包含真核转录终止序列。这样能增强转录水平。当编码序列本身不包含聚腺苷酸化序列时,本发明的载体优选包含聚腺苷酸化序列。优选的聚腺苷酸化序列来自于牛生长激素。
本发明的载体可以包含多克隆位点。
除免疫原和标记物的编码序列外,载体可以包含第二个真核编码序列。载体在所述第二序列上游还可以包含IRES,从而从与该免疫原相同的转录物翻译第二条真核多肽。或者,免疫原编码序列可以在IRES的下游。
本发明的载体可以包含非甲基化CpG基序,如非甲基化DNA序列,它们都在鸟苷之前有一个胞嘧啶,与两个2′嘌呤和两个3′嘧啶侧接。在其非甲基化形式中,已证明这些DNA基序是多种类型免疫细胞的强效刺激因子。
载体可以靶向方式进行递送。例如在参考文献218、219、220、221、222、223中描述了受体介导的DNA递送技术。在基因治疗方案中,以约100ng-200mgDNA的范围局部给予包含核酸的治疗性组合物。在基因治疗方案中也能使用浓度范围是约500ng-50mg,约1μg-2mg,约5μg-500μg以及约20μg-100μg DNA。诸如作用方法(如增强或抑制编码基因产物的水平)以及转化和表达效率等因素是影响最终效果所需剂量的考虑因素。当需要在更大面积的组织上进行更强的表达时,可能需要更大量的载体或在连续给药方案中重复给予相同量,或多次对不同相邻或接近组织部分给药,以达到阳性治疗效果。在所有情况下,使用临床试验中的常规实验方法确定最优治疗效果的具体范围。
可用基因递送运载体递送载体。基因递送运载体可以是病毒或非病毒来源(通常参见参考文献234-237)。
本领域熟知用于递送所需核酸并在所需细胞中表达的基于病毒的载体。示例性基于病毒的载体包括但不限于:重组逆转录病毒(例如参考文献238-248),基于α病毒的载体(如辛德毕斯病毒载体、西门利克森林病毒(ATCC VR-67;ATCC VR-1247)、罗斯河病毒(ATCC VR-373;ATCCVR-1246)和委内瑞拉马脑炎病毒(ATCC VR-923;ATCC VR-1250;ATCCVR 1249;ATCC VR-532);还可以使用这些病毒的杂交体或嵌合体)、痘病毒载体(如牛痘、鸟痘、金丝雀痘、改性的安卡拉牛痘等)、腺病毒载体和腺伴随病毒(AAV)载体(例如参见参考文献249-254)。还能给予与杀死的腺病毒连接的DNA[255]。
还能使用非病毒递送运载体和方法,包括但不限于:连接或不连接于杀死的腺病毒的聚阳离子凝集DNA[如255],配体连接的DNA[256],真核细胞递送运载体细胞[如参考文献257-261]和核电荷中和或与细胞膜融合。还能使用裸露DNA。参考文献262和263中描述了引入裸露DNA的示例性方法。参考文献264-268中描述了可作为基因递送运载体的脂质体(如免疫脂质体)。参考文献269和270中描述了其它方法。
其它适用的非病毒递送包括机械递送系统,如参考文献270所述。而且,通过光聚合水凝胶材料沉积或使用离子辐射可对此编码序列和其表达产物进行递送[如参考文献271和272].其它可用于递送编码序列的常规基因递送方法包括例如,使用手持式基因传递颗粒枪[273]或使用离子辐射激活转移的基因[271和272]。
使用PLG(乙丙交酯共聚物)微粒递送DNA是一个尤其优选的方法,如通过吸附于微粒上,微粒经任选处理表面带负电(如用SDS处理)或带正电(如用阳离子去垢剂如CTAB处理)。
抗体
肺炎球菌抗原的抗体可用于被动免疫[274]。因此本发明提供对第一、第二或第三抗原组的抗原具有特异性的抗体。本发明还提供对第四、第五、第六、第七、第八、第九或第十抗原组的抗原具有特异性的抗体。本发明还提供此类抗体在治疗中的应用。本发明还提供此类抗体在药物制造中的应用。本发明还提供一种治疗哺乳动物的方法,其包括给予有效量的本发明抗体的步骤。如上所述免疫原性组合物,这些方法和应用能够保护哺乳动物对抗肺炎球菌感染。
术语“抗体”包括完整的免疫球蛋白分子,及其能结合抗原的片段。它们包括杂交(嵌合)抗体分子[275,276];F(ab′)2和F(ab)片段和Fv分子;非共价异源二聚体[277,278];单链Fv分子(sFv)[279];二聚和三聚抗体片段构建物;微型抗体[280,281];人源化抗体分子[282-284];任何获自此类分子的功能片段,以及通过非常规工艺,如噬菌体展示获得的抗体。抗体优选为单克隆抗体。本领域熟知获取单克隆抗体的方法。优选人源化或完全人抗体。
概述
除非另有说明,本发明的实施将采用本领域技术范围内的化学、生物化学、分子生物学、免疫学和药理学的常规方法。文献中充分记载过此类技术。参见例如,参考文献285-292等。
上文使用“GI”编号。GI号码,或者“基因信息识别号”(GenInfo Identifier)是NCBI将序列加入其数据库时,连续对每一序列记录指定的一串数字。GI编号与序列记录登录号没有相似之处。序列更新(如纠正或加入更多注释或信息)后,将接受新GI编号。因此与给定GI编号相关的序列是不变的。
当本发明涉及“表位”时,该表位可以是B细胞表位和/或T细胞表位.可凭经验鉴定此类表位(如使用PEPSCAN[293,294]或相似方法),或可对其进行预测(如使用詹姆森-沃尔夫抗原性指数(Jameson-Wolf antigenicindex)[295]、基于矩阵的方法[296]、MAPITOPE[297]、TEPITOPE[298,299]、神经网络[300]、OptiMer和EpiMer[301,302]、ADEPT[303]、T位点[304]、亲水性[305]、抗原性指数[306]或307-311等参考文献中公开的方法)。表位是抗体或T细胞受体的抗原结合位点识别并结合的抗原的某部分,它们也称作“抗原决定簇”。
当抗原“结构域”被省略时,可以包括省略信号肽、胞质结构域、跨膜结构域、胞外结构域等。
术语“含有”包括“包含”以及“由…组成”,例如“含有”X的组合物可仅由X组成或可包含其它物质,例如X+Y。
与数值x相关的术语“约”表示,例如x±10%。
两个氨基酸序列间的序列相同性百分数表示进行比对时所比较的两条序列中相同氨基酸的百分数。利用本领域所知软件程序,例如参考文献312的7.7.18部分所描述的软件程序,可进行比对并确定同源性百分数或序列相同性百分数。优选通过史密斯-沃特曼(Smith-Waterman)同源性搜索算法进行比对,该算法使用仿射缺口搜索,其中缺口开放罚12分,缺口延伸罚2分,BLOSUM矩阵计62分。参考文献313中公开了史密斯-沃特曼同源性搜索算法。
附图简述
图1显示与对照组小鼠死亡过程相比,用spr0565或spr1431免疫后的小鼠经细菌刺激后10天的小鼠死亡过程。图2显示组合抗原的相似数据。
图3显示对比测试组和对照(ctrl)组小鼠血液中细菌数目(CFU/ml)。圆圈是单独动物,横线则为几何平均数。数据来组动物组:(3A)0;(3B)1;(3C)4;(3D)6。图4显示相同组的存活数据(天)。菱形是单独动物,横线为中位数。
图5显示如图2所示的死亡过程,但是使用不同的抗原组合。
图6显示菌血实验的结果。Y轴显示CFU/ml,X轴下方的数字显示U检验计算的P值。
图7显示了死亡实验的结果。Y轴显示存活时间(天),X轴下方的数字显示U检验计算的P值。
图8-25和28-31和33-36与图6和7具有相似模式。
图26显示了两个血清稀释度(1/12或1/36)的OPKA实验的结果。每一三联体中表示用PBS对照(左)、组合-1(中)或组合-2(右)获得的数据。Y轴显示%杀伤。
图27显示使用稀释血清的OPKA实验的结果。
图32显示了spr2021和spr0096杂交体的纯化凝胶。左手边条带是杂交蛋白,右手边则是BSA标准品(64kDa)。图32A显示spr2021-spr0096,图32B显示spr0096-spr2021。
本发明实施方式
抗原鉴定
选择十二种肺炎球菌多肽用免疫学研究。根据R6基因组[84]进行编号,这十二个是:spr0057、spr0286、spr0565、spr0867、spr1098、spr1345、spr1416、spr1418、spr1431、spr1739和spr2021。
spr0057抗原注释为β-N-乙酰基己糖胺酶(strH),它对人糖蛋白上的N-乙酰基葡糖胺进行切割[314]。因此该酶可利于人体的发病/建群,阻断它则可用于疫苗接种目的。而且,该蛋白质定位于表面,为LPxTG-铆定的,并且在处于康复期的肺炎合脑膜炎病人体内发现免疫反应性血清[315]。spr0057序列在22种不同的肺炎球菌菌株间具有98.6%保守性,因此可提供广泛的保护。轻链球菌(S.mitis)和变异链球菌(S.mutans)中缺少(该抗原)。没有关于spr0057作为免疫原的保护效果的研究发表。野生型spr0057基因长为3939个核苷酸,但为了进行免疫使用3741-聚体片段(编码SEQ ID NO:180)。当作为His-标记的重组蛋白质表达时,在体外使用4-硝基苯基-N-乙酰基-β-D-氨基葡糖苷作为底物可以观察到酶活性,但使用2-硝基苯基-β-D-吡喃半乳糖苷作为底物时观察不到活性。可在鼻和肺洗液中监测肺炎球菌的spr0057体内表达,其强烈上调。
spr0096抗原注释为含LysM基序的假拟蛋白。spr0096序列在22种不同的肺炎球菌菌株间具有99%保守性,因此可提供广泛的保护。野生型spr0096基因长为504个核苷酸,但为了进行免疫使用423聚体片段(编码SEQ ID NO:229)。
spr0286抗原注释为透明质酸酶(Hyl),它降解胞外基质组分之一透明质酸。该蛋白质定位于表面,为LPxTG-铆定。spr0286序列在22种不同的肺炎球菌菌株间具有98.8%保守性,因此可提供广泛的保护。尽管透明质酸酶是毒力因子,但参考文献316报道透明质酸酶既不影响疾病临床进程,也不对作者疾病模型的全身性细菌传播产生任何影响。野生型spr0286基因长为3201个核苷酸,但为了进行免疫使用1884聚体片段(编码SEQ ID NO:182)或1356聚体片段(编码SEQ ID NO:183)。
spr0565抗原注释为β-半乳糖苷酶(BgaA),它对人糖蛋白上的半乳糖进行切割[314]。因此该酶可利于人体的发病/建群,阻断它则可用于疫苗接种目的。而且,该蛋白质定位于表面,为LPxTG-铆定的,并且在处于康复期的肺炎和脑膜炎病人体内发现免疫反应性血清。spr0565序列在22种不同的肺炎球菌菌株间具有97.9%保守性,因此可提供广泛的保护。未有关于spr0565作为免疫原具有保护效果的研究发表。野生型spr0565基因长为6687个核苷酸,但为了进行免疫使用6444聚体片段(编码SEQ ID NO:184)。184).当作为His-标记的重组蛋白质表达时,在体外使用2-硝基苯基-β-D-吡喃半乳糖苷作为底物可以观察到酶活性,但使用4-硝基苯基-N-乙酰基-β-D-氨基葡糖苷作为底物时未观察到到活性。可在鼻和肺洗液中监测肺炎链球菌的spr0565体内表达,其强烈上调。
spr0867抗原注释为内切-β-N-乙酰基氨基葡糖苷酶(LytB),它介导细菌复制时的细胞分离。该蛋白定位于表面,是胆碱结合蛋白[317],并且可在处于康复期的病人体内观察到免疫反应性血清[317]。spr0867序列在22种不同的肺炎球菌菌株间具有98.8%保守性,因此可提供广泛的保护。已有关于它单独使用时作为保护性免疫原的报道[318].参考文献319中讨论了等位基因变异。野生型spr0867基因长为2109个核苷酸,但为了进行免疫使用2040聚体片段(编码SEQ ID NO:185)。
spr1098抗原注释为分选酶A(srtA),它将LPXTG基序蛋白质铆定于肺炎球菌表面。该蛋白质定位于膜。Spr1098序列在22种不同的肺炎球菌菌株间具有100%保守性,因此可提供广泛的保护。参考文献320和321给出了关于该多肽的更多细节。未有关于spr1098作为免疫原具有保护效果的研究发表。野生型spr1098基因长为744个核苷酸,但为了进行免疫使用654聚体片段(编码SEQ ID NO:187)。
spr1345抗原注释为细胞壁表面铆定家族蛋白,它是一种与粘蛋白结合的粘附素。该蛋白质定位于表面,为LPxTG-铆定。尽管不同菌株具有不同数量的重复序列,但spr1345序列在22种不同的肺炎球菌菌株间100%保守,因此可以提供广泛保护。参考文献322给出了关于该多肽的更多细节。未有关于spr1345作为免疫原具有保护效果的研究发表。野生型spr1345基因长为609个核苷酸,但为了进行免疫使用495聚体片段(编码SEQ ID NO:188)。
spr1416抗原注释为假拟蛋白,似乎位于胞质。其功能未知,但spr1416序列在22种不同肺炎球菌菌株种100%保守,因此可提供广泛保护。没有关于spr1416的研究发表。野生型spr1416基因长为387个核苷酸,但为了进行免疫使用381聚体片段
spr1418抗原注释为保守的假拟蛋白。基于前导肽的存在,该蛋白质定位于表面。其功能未知,但在处于康复期的肺炎和脑膜炎病人中观察到免疫反应性血清。Spr1418序列在22种不同的肺炎球菌菌株间具有99.8%保守性,因此可提供广泛的保护。没有关于spr1418的研究发表。野生型spr1418基因长为780个核苷酸,但为了进行免疫使用705聚体片段
spr1431抗原注释为溶菌酶(LytC),其介导自溶。该蛋白质定位于表面,为LPxTG-铆定的,并且在处于康复期的肺炎和脑膜炎病人中发现免疫反应性血清。Spr1431序列在22种不同的肺炎球菌菌株间具有98%保守性,因此可提供广泛的保护。参考文献323和324给出了关于该多肽的更多细节。参考文献318中报道了LytC的一些保护数据。野生型spr1431基因长为1506个核苷酸,但为了进行免疫使用1407聚体片段(编码SEQ ID NO:189)。
spr1739抗原是肺炎链球菌溶血素,即一种分泌的胞质成孔毒素。在处于康复期的肺炎和脑膜炎病人中观察到免疫反应性血清。Spr1739序列在22种不同的肺炎球菌菌株间具有100%保守性,因此可提供广泛的保护。之前将肺炎链球菌溶血素与CbpA(PspC)[325]或其它抗原[2]联合用于免疫。
spr2021抗原注释为分泌的45kDa蛋白质(PcsB)。它是参与分裂细胞分离的必需水解酶,最初因为在康复期肺炎和脑膜炎病人中观察到免疫反应性而被鉴定。Spr2021序列在22种不同的肺炎球菌菌株间具有100%保守性,因此可提供广泛的保护。参考文件78中将其确认为先导候选疫苗。参考文献326和327给出了关于PcsB多肽的更多细节。野生型spr2021基因长为1179个核苷酸,但为了进行免疫使用1098聚体片段(编码SEQ ID NO:190)。
选择这些基因的一个标准是在包括来自不同病原血清组的代表性菌株的22株肺炎球菌菌株板块中的高保守性。在目前发表的所有基因组序列中存在数种肺炎球菌基因,它们具有高水平的序列相同性,但该板块的至少一种菌株中没有这些基因。因此目前基因组能给人以特定基因是保守的误导印象。例如,二羧酸/氨基酸:阳离子(Na+或H+)同向转运体(DAACS)家族蛋白质出现于菌株SP3-BS71、SP6-BS73、SP9-BS68、SP11-BS70、SP14-BS69、SP18-BS74、SP19-BS75、SP23-BS72、CGSP14、D39、R6和TIGR4的基因组中,但不出现于菌株JJA和P1031中。
spr0057和spr0565均为表面暴露的外切糖苷酶,使宿主蛋白质去糖基化。当以His-标签形式表达时两个抗原均具有体外酶活性,如使用(如)4-硝基苯基-N-乙酰基-β-D-氨基葡糖苷作为底物时所示。
spr0096、spr0867、spr1431和spr2021抗原均为肽聚糖水解酶。
功效测试
使用各种肺炎球菌疾病模型系统测试免疫原的功效。
在腹膜内感染的小鼠模型中,腹膜内给予抗原,并且进行腹膜内刺激。在第0、14和28天对无特定病原体的6周龄雌性BALB/c小鼠进行腹膜内免疫。使用单一重组蛋白质(20μg/小鼠)或其组合(每种10μg/小鼠),与氢氧化铝或福氏佐剂一起进行免疫。对照组接受相同疗程的盐水加佐剂。然后,用致死剂量的同源或异源菌株(D39、TIGR4、SP-PD、PT131、Strep-5、35Bsme15)腹膜内刺激小鼠。所用细菌剂量一般为:D395x105CFU/小鼠,TIGR4约102CFU/小鼠或SP-PD约5.4x104CFU/小鼠。在某些情况下,在CD1小鼠中进行相似实验,调整刺激剂量以达到感染和致死。通过评价疫苗接种对菌血症的影响(感染后5和/或24小时)以及死亡(在细菌刺激后监测10天或更长时间,取决于感染菌株)测试免疫的效果。
在一个被动转移模型中,在腹膜内给予重组蛋白质抗血清,并进行腹膜内刺激。在如上所述腹膜内免疫小鼠中产生抗血清。10周龄BALB/c小鼠在刺激前15分钟腹膜内接受50μl免疫血清。对照组接受相同疗程的盐水加佐剂。然后对小鼠进行腹膜内刺激。
在静脉内感染的模型中,腹膜内给予抗原,静脉内进行刺激。在第0、14、28天对5周龄CD-1小鼠进行腹膜内免疫。使用单一重组蛋白质(20μg/小鼠)或其组合(每种10μg/小鼠),与福氏佐剂一起进行免疫。对照组接受相同疗程的盐水加佐剂。然后用致死剂量的同源或异源菌株(D39或TIGR-4)对小鼠进行静脉内刺激。细菌剂量一般为:D39约105CFU/小鼠,TIGR-42x106CFU/小鼠,PT131约107CFU/小鼠,Strep-5约104CFU/小鼠,35Bsme15约2x107CFU/小鼠。通过疫苗接种对菌血症的影响(感染后48小时)以及死亡(细菌刺激后监测10天或更长时间,取决于感染菌株)测试候选疫苗的功效。
在鼻内感染的模型中,鼻内给予抗原,鼻内进行刺激。在第0、16、32天对6周龄C57BL/6小鼠进行鼻内免疫。用重组蛋白质(20μg/小鼠)和LTK63佐剂一起进行免疫。对照组接受相同疗程的LTK63或PBS。用106CFU的TIGR4刺激小鼠。通过评价疫苗接种对死亡(细菌刺激后监测2-3周)以及鼻咽内建群和肺部感染的影响测试候选疫苗的效果。用不同小鼠或细菌菌株进行其它实验,并通过粘膜或全身途径给予抗原。
单独抗原的免疫原性和保护作用的研究
在小鼠模型中分别测试下列抗原:spr0057、spr0286、spr0565、spr0867、spr1098、spr1345、spr1416、spr1418、spr1431和spr2021。将spr2086抗原分为两个结构域,作为spr2086A和spr2086B进行测试。抗原辅以福氏佐剂在CD1和/或BALB/c小鼠中进行测试。用D39或TIGR4肺炎球菌菌株,通过静脉内(i.v.)或腹膜内(i.p.)途径进行刺激。每组包含至少8只小鼠。对照组接受磷酸缓冲盐水配制的佐剂。TIGR4菌株毒性很高,因此对于这种菌株刺激的保护作用表明高水平的功效。
关于菌血症,在刺激后24小时,测量免疫和对照动物血液中的CFU/ml从而确定结果。此外,使用单尾秩和U检验对两组中感染动物数目进行比较。结果如下:
Figure GPA00001064434701481
关于存活,通过测量每一组的中位生存期(天)确定结果。此外,用单尾秩和U检验对两组中存活动物数进行比较。结果如下表所示。此外,随时间对存活小鼠数目进行跟踪,图1显示此类数据的实例。
Figure GPA00001064434701482
因此,对于所有受试抗原,菌血症显著减少和/或存活率增加。
概括起来,四种优选抗原能有效对抗血清型2、3、4和35B菌株,如下所示:
  OPKA   2型   3型   4型   35型
  spr0057   +/-   ++   -   +   -
  spr0096   +   +   ++   +   ++
  spr0565   +   ++   ++   ++   -
  spr2021   ++   +/-   -   +/-   ?
尽管血清型4为当前偶联疫苗所涵盖,但是血清型2、3和35B未被涵盖。
组合抗原的免疫原性和保护作用的研究
下列抗原组合在与单独抗原相同的小鼠模型中进行测试:(1)spr0057+spr0096+spr2021;(2)spr0057+spr0096+spr2021;(3)spr0057+spr0096+spr2021;(4)spr0057+spr2021;(5)spr0057+spr0565+spr2021。此外,对照组(0)使用PspC和脱毒肺炎链球菌溶血素(‘Ply-detox’)的组合进行免疫[325],组(6)接受spr0565+spr2021+Ply-detox的组合。结果如下:
图3显示0、1、4和6组的菌血症数据。图4显示相同组的存活数据。图2显示1、5组的存活数据。
在进一步的实验中,小鼠接受(7)spr0565+spr2021或(8)spr2021+Ply-detox。图5显示6、7和8组的存活数据。
在进一步的实验中,小鼠接受spr0565、PmP和spr2021的组合。在调理吞噬细胞杀伤实验(OPKA)中测试血清。图27显示结果。在免疫血清活性降至对照水平前需要进行10,000-倍稀释。
组合-1至组合-4
制备四种不同抗原组合物:
组合-1:spr0057+spr0096+spr2021.
组合-2:spr0057+spr0565+spr2021.
组合-3:spr0057+spr0096+spr0565.
组合-4:spr0057+spr0096+spr0565+spr2021.
对兔进行免疫并将其免疫血清转移进BALB/c小鼠体内以检测对抗TIGR4菌株的被动保护。
也对小鼠进行免疫,然后在使用包括TIGR4(i.p.刺激)以及D39、PT131和TREP6A(i.v.刺激)在内的菌株的刺激模型中进行测试。TIGR4菌株为血清型4,被PrevnarTM所涵盖(‘VT’菌株),但是其它3种菌株为血清型2、3和6A,未被PrevnarTM所涵盖(‘NVT’菌株)。血清型3、4和6A被提出的13价糖疫苗[328]所涵盖,但是血清型2菌株未被涵盖。
图6和7显示了被动转移测试所获结果。组合-1和组合-2引起菌血症减少至少一个对数值(图6),并且使存活时间为至少10天(图7)。将每一抗原剂量升至50μg时,功效未见提高。
图8和9显示在使用PT131菌株的刺激模型中所获结果。组合-1和组合-2再次有效,其中组合-2具有优势。
图10和11显示使用组合-1免疫后在使用1.1x104CFU的STREP-5菌株的刺激模型中所获结果。
图12显示用OREP-3刺激后24小时CFU/ml的降低。组合-1和组合-2均有效。
图13和14显示用TREP-6A刺激组合-2免疫的小鼠后所获结果。
如图17所示,组合-1减少了高剂量TIGR4(1.1x107cfu)鼻内刺激后的菌血症,但对鼻内建群和肺感染没有影响。图18-22显示在感染晚期使用亚致死(剂量)鼻内刺激时,组合-1是有效的。
图23(鼻洗液,48小时)和图24(肺洗液,48小时)显示对抗14-Spain-15菌株鼻内刺激的效果。
图25总结了用组合-2免疫后,TIGR-4刺激(i.p.刺激;图25A)或者D39、PT131或TREP6A刺激(i.v.刺激;图25B)后的致死情况。
因此用组合-1或组合-2免疫能有效对抗多种肺炎球菌菌株引起的感染。
图26显示了使用来自对照动物或来自组合-1或组合-2免疫动物的血清所获的OPKA结果。以1/12和1/36稀释度使用组合2时均见OPKA活性大大升高。
加入spr1416、spr1418或spr1431对组合-1进行修饰。如图15和16所示,当加入这三种抗原时组合-1保持对抗TIGR4刺激的效果。
使用鼻内免疫和鼻内刺激对含有三种抗原的组合-1与三种抗原中两种的组合(spr0057+spr2021)进行比较。当使用TIGR4作为刺激菌株时,尽管两种组合在死亡或菌血症方面差异很小(在24小时和10天后),但是10天后鼻和肺洗液显示显著降低(图33和34)。当使用14-Spain-15作为刺激菌株时也观察到理想结果(图35和36)。
还将组合-1与单独的spr0565进行比较。尽管spr0565在24小时后减少菌血症,但48小时后未观察到这种效果。相比之下,组合-1的效果仅在48小时后变得明显。未观察到对鼻内建群或肺感染的影响。
概括起来,组合-1的最佳代表性结果如下:
Figure GPA00001064434701511
概括起来,组合-2的最佳代表性结果如下:
Figure GPA00001064434701521
概括起来,组合-4的最佳代表性结果如下:
Figure GPA00001064434701522
因此,这些组合提供了对菌血症的良好保护并且增加了存活期。
用菌毛抗原鼻内免疫小鼠
使用小鼠模型表征肺炎球菌菌毛RrgA、RrgB和RrgC蛋白的保护潜能。用重组菌毛蛋白和作为佐剂的无毒大肠杆菌不耐热肠毒素突变体LTK63进行鼻内免疫引起血清中IgA和IgG-应答。而且,用主要菌毛组分(RrgB)免疫引起侵入性TIGR4菌株在鼻咽、肺和血液中细菌载量降低,并使存活率提高5倍。对于无症状的鼻咽携带非侵入性菌株没有效果,表明观察到的保护效果限于爆发性感染。
用含有20μg重组RrgA、RrgB或RrgC之一或每种各含10μg的10μlPBS对6周龄雌性C57BL/6小鼠鼻内免疫3次(间隔2周)。蛋白质具有亲和标签并使用来自TIGR4的序列。所有蛋白质溶液与2μg LTK63共同给予。对照组接受含2μg LTK63的PBS,或仅PBS。最后一次免疫后一周取血清样品以通过ELISA确定抗体滴度。用0.5-1x107cfu/小鼠的侵入性TIGR4肺炎球菌或建群血清型19F菌株鼻内刺激小鼠。当超过当地动物实验委员会批准的预定临床评分后处死小鼠。感染后7-9天处死存活小鼠。获取血液样品、肺和鼻咽气管冲洗样品。通过血液样品的连续铺板对活细菌进行定量。对肺称重,在含有蛋白酶抑制剂混合物的PBS中匀浆,用于定量测定活细菌。为了测定上呼吸道中细菌的数量,在死亡后通过在进端气管插入20号导管用30μl PBS灌洗鼻咽腔-气管并从鼻孔收集灌洗液,然后进行连续铺板。利用照相机测定麻醉小鼠鼻咽、肺、耳和血流中发光强度,从而以非侵入方式确定建群情况。认为鼻区达到300p/sec/cm2/sr的阈值足以表明成功建群。
用菌毛蛋白鼻内免疫引起全身IgA和IgG应答。IgA的血清滴度显示用单独的菌毛蛋白免疫的小鼠对各抗原产生IgA应答。未观察到对其它两种蛋白的应答,表明单独菌毛蛋白不引起交叉反应抗体。用所有3种蛋白质免疫的小鼠具有与单一免疫相当的血清IgA水平,但对RrgA的抗体水平较低。在IgG血清水平所获结果类似。简要说,用三种菌毛蛋白中任何一种鼻内免疫后产生包含IgA和IgG的免疫应答,但用对照免疫时没有这种作用。
免疫后用高剂量的侵入性TIGR4菌株鼻内感染小鼠。对不同组的生存率进行分析显示出显著性差异。仅有10%PBS免疫的小鼠和20%LTK63-免疫的小鼠在刺激后存活。小鼠每毫升血液中细菌计数为1x105-109,并且大多数小鼠在感染后96小时内患上肺炎球菌病。用RrgB加上LTK63免疫使生存率从10%(PBS免疫小鼠的对照组)升至55%(p=0.0001)。同样与仅接受佐剂的对照组相比,存活率也有显著性增加(p=0.016)。RrgA、RrgB和RrgC疫苗混合物显示了与RrgB单独疫苗接种相同的保护作用(p=0.002,与PBS免疫小鼠相比,生存率从10%升至45%)。此外,与对照组相比,RrgB免疫小鼠的血流、肺和鼻咽中的细菌计数显著降低。与PBS免疫小鼠相比,血流中中位细菌数从1.5x106cfu/ml降至1.0x100cfu/ml(p=0.067),肺中从5x104cfu/mg组织降至1.5x101cfu/mg组织(p=0.001),鼻咽中从7x103降至4.5x102(p=0.0002)。因此,与非疫苗接种对照小鼠相比,用基于TIGR4的RrgB蛋白以及粘膜佐剂LTK63免疫的小鼠在用TIGR进行鼻内刺激后存活显著增加。
免疫不引起鼻咽中建群肺炎球菌的清除增强。已显示与TIGR4不同,序列类型162的血清型19F菌株即便在高剂量鼻内刺激后也是非侵入性的。该超建群菌株表达的菌毛与TIGR4同属一个进化支。两种菌株的RrgB蛋白仅1个氨基酸不同(A645V)。RrgB-免疫小鼠也接受此19F菌株的刺激,该菌株也工程改造以表达萤光素酶。对照组仅接受LTK63或PBS。用ELISA确定抗RrgB的血清IgG和IgA,其值与之前实验中所见相似。在小鼠中建群后,通常产生间歇性的亚临床中耳炎或肺炎。感染后24-216小时测定建群情况。对于PBS-治疗对照组,建群小鼠百分比介于25%(48h p.i)和70%(96h p.i.)之间。起始低建群率随时间增加,最终清除事件在96小时后产生效果。对LTK63-和RrgB-免疫小鼠的观察结果相似,但清除前移~24小时。对照和RrgB免疫小鼠间未能观察到建群和/或清除事件的显著性差异。中耳炎和肺炎发病率一般较低,每组中最多10%发病。组间无显著性差异。最后,感染后9天处死动物并确定鼻咽细菌计数。所有三组小鼠的鼻咽细菌数量相似(每份洗液2.8-4.4x103)。在感染后约96小时观察到建群峰值。
杂交多肽
用spr0057、spr0096、spr0565(任选spr0565A或spr0565B形式)、spr2021和RrgA成对制备杂交体。构建、表达和纯化不同的配对。例如,图32包括两块凝胶,显示纯化的(>1mg/ml,纯度≥80%)spr2021-spr0096和spr0096-spr2021,分子量均为~61kDa。尽管两种杂交体均以可溶形式表达和纯化,但spr2021-spr0096杂交体比spr0096-spr2021杂交体溶解性更好。
制备下列杂交序列(具有式NH2-A-{-X-L-}2-B-COOH):
  A   X1   L1   X2   L2   B   SEQ ID
  M   spr2021   SEQ ID 233   spr0057   LE   His6   193
  M   spr2021   SEQ ID 233   spr0096   LE   His6   194
  M   spr2021   SEQ ID 233   spr0565   SEQ ID 235   His6   195
  M   spr2021   SEQ ID 233   spr0565A   SEQ ID 235   His6   196
  M   spr2021   SEQ ID 233   spr0565B   SEQ ID 235   His6   197
  MAS   spr2021   SEQ ID 233   RrgA   LE   His6   198
  M   spr0057   SEQ ID 233   spr2021   SEQ ID 235   His6   199
  M   spr0057   SEQ ID 233   spr0096   LE   His6   200
  M   spr0057   SEQ ID 233   RrgA   LE   His6   201
  M   spr0057   SEQ ID 233   spr0565   SEQ ID 235   His6   202
  M   spr0057   SEQ ID 233   spr0565A   SEQ ID 235   His6   203
  M   spr0057   SEQ ID 233   spr0565B   SEQ ID 235   His6   204
  M   spr0096   SEQ ID 233   spr2021   SEQ ID 235   His6   205
  A   X1   L1   X2   L2   B   SEQ ID
  M   spr0096   SEQ ID 233   spr0057   LE   His6   206
  M   spr0096   SEQ ID 233   RrgA   LE   His6   207
  M   spr0096   SEQ ID 233   spr0565   SEQ ID 235   His6   208
  M   spr0096   SEQ ID 233   spr0565A   SEQ ID 235   His6   209
  M   spr0096   SEQ ID 233   spr0565B   SEQ ID 235   His6   210
  MAS   RrgA   SEQ ID 233   spr2021   SEQ ID 235   His6   211
  MAS   RrgA   SEQ ID 233   spr0565   SEQ ID 235   His6   212
  MAS   RrgA   SEQ ID 233   spr0565A   SEQ ID 235   His6   213
  MAS   RrgA   SEQ ID 233   spr0565B   SEQ ID 235   His6   214
  MAS   RrgA   SEQ ID 233   spr0057   LE   His6   215
  MAS   RrgA   SEQ ID 233   spr0096   LE   His6   216
  MAS   spr0565   SEQ ID 233   spr0057   SEQ ID 235   His6   217
  MAS   spr0565A   SEQ ID 233   spr0057   SEQ ID 235   His6   218
  MAS   spr0565B   SEQ ID 233   spr0057   LE   His6   219
  MAS   spr0565   SEQ ID 233   spr0096   LE   His6   220
  MAS   spr0565A   SEQ ID 233   spr0096   LE   His6   221
  MAS   spr0565B   SEQ ID 233   spr0096   LE   His6   222
  MAS   spr0565   SEQ ID 233   spr2021   SEQ ID 235   His6   223
  MAS   spr0565A   SEQ ID 233   spr2021   SEQ ID 235   His6   224
  MAS   spr0565B   SEQ ID 233   spr2021   SEQ ID 235   His6   225
  MAS   spr0565   SEQ ID 233   RrgA   LE   His6   226
  MAS   spr0565A   SEQ ID 233   RrgA   LE   His6   227
  A   X1   L1   X2   L2   B   SEQ ID
  MAS   spr0565B   SEQ ID 233   RrgA   LE   His6   228
这些杂交体的X1和X2部分能用于后续杂交体。
如上所述,使用4-硝基苯基-N-乙酰基-β-D-氨基葡糖苷作为底物时,spr0057多肽显示酶活性。这种酶活性在各种杂交多肽中得以保留(spr0096-spr0057;spr2021-spr0057;spr0057-spr2021;和spr0057-spr0096)。
在免疫学测试中对spr0057和spr0096的组合与杂交多肽spr0057-spr0096进行比较。如图28-31所示,与组合相比,杂交体显示相等或更好的效果。最大的区别是在i.p.免疫后接着用5.8x106cfu的TIGR进行i.v.刺激时观察到的死亡率(图31)。
应理解,仅以举例的方式描述了本发明,可在本发明的范围和构思内进行修改。
参考文献:
[1]WO02/22168.
[2]Ogunniyi等(2007)Infect Immun.75(1):350-7.
[3]WO02/079241
[4]WO02/34773.
[5]WO00/06737.
[6]WO00/06738.
[7]WO00/58475.
[8]WO2003/082183..
[9]Bagnoli等(2008)J Bacteriol.190(15):5480-92.
[10]WO2004/092209.
[11]研究公开(Research Disclosure),453077(2002.1).
[12]EP-A-0372501.
[13]EP-A-0378881.
[14]EP-A 0427347.
[15]WO93/17712.
[16]WO94/03208.
[17]WO98/58668.
[18]EP A 0471177.
[19]WO91/01146.
[20]Falugi等(2001)Eur J Immunol 31:3816-3824.
[21]Baraldo等(2004)Infect Immun 72(8):4884-7.
[22]EP-A-0594610.
[23]Ruan等(1990)JImmunol 145:3379-3384.
[24]WO00/56360.
[25]Kuo等(1995)Infect Immun 63:2706-13.
[26]Michon等(1998)Vaccine.16:1732-41.
[27]WO02/091998.
[28]WO01/72337.
[29]WO00/61761.
[30]WO00/33882
[31]WO2007/071707
[32]WO99/42130.
[33]美国专利4,761,283.
[34]美国专利4,356,170.
[35]美国专利4,882,317.
[36]美国专利4,695,624.
[37]Mol.Immunol.,1985,22,907-919
[38]EP-A-0208375.
[39]Bethell G.S.等,J.Biol.Chem.,1979,254,2572-4
[40]Hearn M.T.W.,J.Chromatogr.,1981,218,509-18
[41]WO00/10599.
[42]Gever等,Med.Microbiol.Immunol,165:171-288(1979).
[43]美国专利4,057,685.
[44]美国专利4,673,574;4,761,283;4,808,700.
[45]美国专利4,459,286.
[46]美国专利4,965,338.
[47]美国专利4,663,160.
[48]WO2007/000343.
[49]疫苗(Vaccines).(Plotkin和Orenstein编).第4版,2004,ISBN:0-7216-9688-0.
[50]Rappuoli等(1991)TIBTECH 9:232-238.
[51]Kirkham等(2006)Infect Immun.74(1):586-93.
[52]WO2005/108580.
[53]Berry等(1999)Infect Immun 67(2):981-5.
[54]US-6716432.
[55]WO90/06951.
[56]WO99/03884.
[57]Baba等(2002)Infect Immun 70:107-113.
[58]US-7217791
[59]WO2008/061953.
[60]Cao等(2007)Vaccine 25(27):4996-5005.
[61]WO2005/063283.
[62]WO2003/104272.
[63]WO00/37105.
[64]Adamou等(2001)Infect Immun.69(2):949-58.
[65]WO98/18930.
[66]WO99/53940.
[67]WO02/22167.
[68]WO02/08426.
[69]WO01/12219.
[70]Briles等(2000)J Infect Dis 182:1694-1701.
[71]Talkington等(1996)Microb Pathog.21(1):17-22.
[72]WO00/76540.
[73]Bethe等(2001)FEMS Microbiol Lett.205(1):99-104.
[74]WO01/81380.
[75]Brown等(2001)Infect Immun 69:6702-6.
[76]Whalan等(2005)FEMS Immunol Med Microbiol 43:73-80.
[77]Jomaa等(2006)Vaccine.24(24):5133-9.
[78]Giefing等(2008)J Exp Med 205:117-131.
[79]WO2007/116322.
[80]LeMieux等(2006)Infect Immun 74:2453-6.
[81]Nelson等(2007)Mol Microbiol 66:329-40.
[82]美国专利5,707,829
[83]新编分子生物学实验指南(Current Protocols in Molecular Biology)(F.M.Ausubel等编,1987)增刊30.
[84]Hoskins等(2001)J.Bacteriol.183:5709-5717.
[85]GenBank NC_004512.
[86]GenBank NC_003440.
[87]GenBank NC_003028.
[88]Tettelin等(2001)Science 293:498-506.
[89]WO02/077021.
[90]Needleman和Wunsch(1970)J.Mol.Biol.48,443-453.
[91]Rice等(2000)Trends Genet 16:276-277.
[92]美国专利6355271.
[93]WO00/23105.
[94]疫苗设计(Vaccine Design)(1995)Powell和Newman编.ISBN:030644867X.普朗姆出版社(Plenum).
[95]WO90/14837.
[96]WO90/14837.
[97]Podda和Del Giudice(2003)Expert Rev Vaccines 2:197-203.
[98]Podda(2001)Vaccine 19:2673-2680.
[99]疫苗设计:亚基和佐剂方法(Vaccine Design:The Subunit and AdjuvantApproach)(Powell和Newman编)普朗姆出版社(Plenum Press)1995(ISBN0-306-44867-X).
[100]疫苗佐剂:制备方法和研究方案(Vaccine Adjuvants:PreparationMethods and Research Protocols)(《分子药学方法》丛书第42卷).ISBN:1-59259-083-7.O’Hagan编.
[101]WO2008/043774.
[102]Allison和Byars(1992)Res Immunol 143:519-25.
[103]Hariharan等(1995)Cancer Res 55:3486-9.
[104]US 2007/014805.
[105]US-2007/0191314.
[106]Suli等(2004)Vaccine 22(25-26):3464-9.
[107]WO95/11700.
[108]美国专利6,080,725.
[109]WO2005/097181.
[110]WO2006/113373.
[111]Han等(2005)维生素E对老年人免疫功能和感染性疾病的影响(Impact of Vitamin E on Immune Function and Infectious Diseases in the Aged),欧洲营养学、免疫功能和健康会议(Nutrition,Immune functions and HealthEuroConference),巴黎,9-102005年6月.
[112]US-6630161.
[113]US 5,057,540.
[114]WO96/33739.
[115]EP A 0109942.
[116]WO96/11711.
[117]WO00/07621.
[118]Barr等(1998)Advanced Drug Delivery Reviews 32:247 271.
[119]Sjolanderet等(1998)Advanced Drug Delivery Reviews 32:321 338.
[120]Niikura等(2002)Virology 293:273-280.
[121]Lenz等(2001)J Immunol 166:5346-5355.
[122]Pinto等(2003)J Infect Dis 188:327-338.
[123]Gerber等(2001)J Virol 75:4752-4760.
[124]WO03/024480.
[125]WO03/024481.
[126]Gluck等(2002)Vaccine 20:B10 B16.
[127]EP A 0689454.
[128]Johnson等(1999)Bioorg Med Chem Lett 9:2273-2278.
[129]Evans等(2003)Expert Rev Vaccines 2:219-229.
[130]Meraldi等(2003)Vaccine 21:2485-2491.
[131]Pajak等(2003)Vaccine 21:836-842.
[132]Kandimalla等(2003)Nucleic Acids Research 31:2393-2400.
[133]WO02/26757.
[134]WO99/62923.
[135]Krieg(2003)Nature Medicine 9:831-835.
[136]McCluskie等(2002)FEMS Immunology and Medical Microbiology32:179-185.
[137]WO98/40100.
[138]US 6,207,646.
[139]US 6,239,116.
[140]US 6,429,199.
[141]Kandimalla等(2003)Biochemical  Society Transactions 31(part3):654-658.
[142]Blackwell等(2003)J Immunol 170:4061-4068.
[143]Krieg(2002)Trends Immunol 23:64-65.
[144]WO01/95935.
[145]Kandimalla等(2003)BBRC 306:948-953.
[146]Bhagat等(2003)BBRC 300:853-861.
[147]WO03/035836.
[148]WO01/22972.
[149]Schellack等(2006)Vaccine 24:5461-72.
[150]Kamath等(2008)Eur J Immunol 38:1247-56.
[151]Riedl等(2008)Vaccine 26:3461-8.
[152]WO95/17211.
[153]WO98/42375.
[154]Beignon等(2002)Infect Immun 70:3012-3019.
[155]Pizza等(2001)Vaccine 19:2534-2541.
[156]Pizza等(2000)Int J Med Microbiol 290:455-461.
[157]Scharton-Kersten等(2000)Infect Immun 68:5306-5313.
[158]Ryan等(1999)Infect Immun 67:6270-6280.
[159]Partidos等(1999)Immunol Lett 67:209-216.
[160]Peppoloni等(2003)Expert Rev Vaccines 2:285-293.
[161]Pine等(2002)J Control Release 85:263-270.
[162]Tebbey等(2000)Vaccine 18:2723-34.
[163]Domenighini等(1995)Mol Microbiol 15:1165 1167.
[164]WO99/40936.
[165]WO99/44636.
[166]Singh等(2001)J Cont Release 70:267-276.
[167]WO99/27960.
[168]US 6,090,406.
[169]US 5,916,588.
[170]EP A 0626169.
[171]WO99/52549.
[172]WO01/21207.
[173]WO01/21152.
[174]Andrianov等(1998)Biomaterials 19:109-115.
[175]Payne等(1998)Adv Drug Delivery Review 31:185-196.
[176]US 4,680,338.
[177]US 4,988,815.
[178]WO92/15582.
[179]Stanley(2002)Clin Exp Dermatol 27:571-577.
[180]Wu等(2004)Antiviral Res.64(2):79-83.
[181]Vasilakos等(2000)Cell Immunol.204(1):64-74.
[182]美国专利4689338、4929624、5238944、5266575、5268376、5346905、5352784、5389640、5395937、5482936、5494916、5525612、6083505、6440992、6627640、6656938、6660735、6660747、6664260、6664264、6664265、6667312、6670372、6677347、6677348、6677349、6683088、6703402、6743920、6800624、6809203、6888000和6924293.
[183]Jones(2003)Curr Opin Investig Drugs 4:214-218.
[184]WO03/011223.
[185]Johnson等(1999)Bioorg Med Chem Lett 9:2273-2278.
[186]Evans等(2003)Expert Rev Vaccines 2:219-229.
[187]WO2004/060308.
[188]WO2004/064759.
[189]US 6,924,271.
[190]US2005/0070556.
[191]US 5,658,731.
[192]美国专利5,011,828.
[193]WO2004/87153.
[194]US 6,605,617.
[195]WO02/18383.
[196]WO2004/018455.
[197]WO03/082272.
[198]Wong等(2003)J Clin Pharmacol 43(7):735-42.
[199]US2005/0215517.
[200]Dyakonova等(2004)Int Immunopharmacol 4(13):1615-23.
[201]FR-2859633.
[202]Signorelli和Hadden(2003)Int Immunopharmacol 3(8):1177-86.
[203]WO2004/064715.
[204]De Libero等,Nature Reviews Immunology,2005,5:485-496
[205]美国专利5,936,076.
[206]Oki等,J.Clin.Investig.,113:1631-1640
[207]US2005/0192248
[208]Yang等,Angew.Chem.Int.Ed.,2004,43:3818-3822
[209]WO2005/102049
[210]Goff等,J.Am.Chem.,Soc.,2004,126:13602-13603
[211]WO03/105769
[212]Cooper(1995)Pharm Biotechnol 6:559-80.
[213]WO99/11241.
[214]WO94/00153.
[215]WO98/57659.
[216]欧洲专利申请0835318、0735898和0761231.
[217]WO2006/110603.
[218]Zwijnenburg等(2001)J Infect Dis 183:1143-6.
[219]Donnelly等(1997)Annu Rev Immunol 15:617-648.
[220]Strugnell等(1997)Immunol Cell Biol 75(4):364-369.
[221]Cui(2005)Adv Genet 54:257-89.
[222]Robinson和Torres(1997)Seminars in Immunol 9:271-283.
[223]Brunham等(2000)J Infect Dis 181增刊3:S538-43.
[224]Svanholm等(2000)Scand J Immunol 51(4):345-53.
[225]DNA疫苗接种-遗传学疫苗接种(DNA Vaccination-GeneticVaccination)(1998)Koprowski等编(ISBN 3540633928).
[226]基因疫苗接种:理论和实践(Gene Vaccination:Theory andPractice)(1998)Raz等(ISBN 3540644288).
[227]Ferreira等(2006)J Med Microbiol.55(Pt 4):375-8.
[228]Findeis等,Trends Biotechnol.(1993)11:202
[229]Chiou等(1994)基因治疗:直接基因转移方法和应用(GeneTherapeutics:Methods And Applications Of Direct Gene Transfer)Wolff编
[230]Wu等,J.Biol.Chem.(1988)263:621
[231]Wu等,J.Biol.Chem.(1994)269:542
[232]Zenke等,Proc.Natl.Acad.Sci.(USA)(1990)87:3655
[233]Wu等,J.Biol.Chem.(1991)266:338
[234]Jolly,Cancer Gene Therapy(1994)1:51
[235]Kimura,Human Gene Therapy(1994)5:845
[236]Connelly,Human Gene Therapy(1995)1:185
[237]Kaplitt,Nature Genetics(1994)6:148
[238]WO 90/07936.
[239]WO 94/03622.
[240]WO 93/25698.
[241]WO 93/25234.
[242]美国专利5,219,740.
[243]WO 93/11230.
[244]WO 93/10218.
[245]美国专利4,777,127.
[246]GB专利号2,200,651.
[247]EP-A-0345242.
[248]WO 91/02805.
[249]WO 94/12649.
[250]WO 93/03769.
[251]WO 93/19191.
[252]WO 94/28938.
[253]WO 95/11984.
[254]WO 95/00655.
[255]Curiel,Hum.Gene Ther.(1992)3:147
[256]Wu,J.Biol.Chem.(1989)264:16985
[257]美国专利5,814,482.
[258]WO 95/07994.
[259]WO 96/17072.
[260]WO 95/30763.
[261]WO 97/42338.
[262]WO 90/11092.
[263]美国专利5,580,859
[264]美国专利5,422,120
[265]WO 95/13796.
[266]WO 94/23697.
[267]WO 91/14445.
[268]EP 0524968.
[269]Philip,Mol.Cell Biol.(1994)14:2411
[270]Woffendin,Proc.Natl.Acad.Sci.(1994)91:11581
[271]美国专利5,206,152.
[272]WO 92/11033.
[273]美国专利5,149,655.
[274]Brandt等(2006)J Antimicrob Chemother.58(6):1291-4.2006年10月26日电子公开
[275]Winter等,(1991)Nature 349:293-99
[276]US 4,816,567.
[277]Inbar等,(1972)Proc.Natl.Acad.Sci.U.S.A.69:2659-62.
[278]Ehrlich等,(1980)Biochem 19:4091-96.
[279]Huston等,(1988)Proc.Natl.Acad.Sci.U.S.A.85:5897-83.
[280]Pack等,(1992)Biochem 31,1579-84.
[281]Cumber等,(1992)J.Immunology 149B,120-26.
[282]Riechmann等,(1988)Nature 332,323-27.
[283]Verhoeyan等,(1988)Science 239,1534-36.
[284]GB 2,276,169.
[285]Gennaro(2000)雷鸣顿:药物科学和实践(Remington:The Science andPractice of Pharmacy).第20版,ISBN:0683306472.
[286]酶学方法(Methods In Enzymology)(S.Colowick和N.Kaplan编,学术出版社(Academic Press,Inc.))
[287]实验免疫学手册(Handbook of Experimental Immunology),I IV卷(D.M.Weir和C.C.Blackwell编,1986,布莱克维尔科学出版公司(Blackwell ScientificPublications)
[288]Sambrook等(2001)分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual),第3版(冷泉港实验室出版社)(Cold Spring HarborLaboratory Press).
[289]表面和胶体化学手册(Handbook of Surface and ColloidalChemistry)(Birdi,K.S.编,CRC出版社,1997)
[290]Ausubel等(编)(2002)分子生物学简明方案(Short protocols inmolecular biology),第5版(最新方案).
[291]分子生物学技术:实验室课程精编(Molecular Biology Techniques:AnIntensive Laboratory Course),(Ream等编,1998,学术出版社)
[292]PCR生物技术简介丛书(Introduction to Biotechniques Series),第2版.(Newton和Graham编,1997,施普林格出版社(Springer Verlag))
[293]Geysen等(1984)PNAS USA 81:3998-4002.
[294]Carter(1994)Methods Mol Biol 36:207-23.
[295]Jameson,BA等1988,CABIOS 4(1):181-186.
[296]Raddrizzani和Hammer(2000)Brief Bioinform 1(2):179-89.
[297]Bublil等(2007)Proteins 68(1):294-304.
[298]De Lalla等(1999)J.Immunol.163:1725-29.
[299]Kwok等(2001)Trends Immunol 22:583-88.
[300]Brusic等(1998)Bioinformatics 14(2):121-30
[301]Meister等(1995)Vaccine 13(6):581-91.
[302]Roberts等(1996)AIDS Res Hum Retroviruses 12(7):593-610.
[303]Maksyutov和Zagrebelnaya(1993)Comput Appl Biosci 9(3):291-7.
[304]Feller和de la Cruz(1991)Nature 349(6311):720-1.
[305]Hopp(1993)Peptide Research 6:183-190.
[306]Welling等(1985)FEBS Lett.188:215-218.
[307]Davenport等(1995)Immunogenetics 42:392-297.
[308]Tsurui和Takahashi(2007)J Pharmacol Sci.105(4):299-316.
[309]Tong等(2007)Brief Bioinform.8(2):96-108.
[310]Schirle等(2001)J Immunol Methods.257(1-2):1-16.
[311]Chen等(2007)Amino Acids 33(3):423-8.
[312]新编分子生物学实验指南(Current Protocols in MolecularBiology)(F.M.Ausubel等编,1987)增刊30
[313]Smith和Waterman(1981)Adv.Appl.Math.2:482-489.
[314]King等(2006)Mol Microbiol 59(3):961-74.
[315]Zysk等(2000)Infect Immun 68:3740-3.
[316]Wellmer等(2002)Infect Immun 70:6504-8.
[317]Gosink等(2000)Infect Immun 68(10):5690-5.
[318]Wizemann等(2001)Infect Immun 69:1593-8.
[319]Moscoso等(2005)Appl Environ Microbiol 71:8706-13..
[320]Kharat和Tomasz(2003)Infect Immun 71:2758-65.
[321]Chen等(2005)FEMS Microbiol Lett.253(1):151-4.
[322]Bumbaca等(2007)Proteins.66(3):547-58.
[323]Monterroso等(2005)Biochem J.391:41-9.
[324]Moscoso等(2005)J Bacteriology 187:6238-41.
[325]Ogunniyi等(2001)Infect Immun 69:5997-6003.
[326]Ng等(2005)J Bacteriol.187(21):7444-59.
[327]Mills等(2007)J Bacteriol.189:4544-6.
[328]WO2008/079732
序列表
SEQ ID NO:1
MKHEKQQRFSIRKYAVGAASVLIGFAFQAQTVAADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAELQPEAPKT
VETETPATDKVASLPKTEEKPQEEVSSTPSDKAEVVTPTSAEKETANKKEEEASPKKEEAKEVDSKESNTDKTDKDK
PAKKDEAKAEADKPETETGKERAATVNEKLAKKKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFM
LDDMSITANGKTYASDDVKRAIEKGTNDYYNDPNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKEL
GIQNPNFSYFGKKSARTVDLDNEQAVAFTKALIDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEG
YPVKGYEKFIAYANDLARIVKSHGLKPMAFNDGIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQIL
NTNDAWCYVLGRNADGQGWYNLDQGLNGIKNTPITSVPKTEGADIPIIGGMVAAWADTPSARYSPSHLFKLMRHFAN
ANAEYFAADYESAEQALNEVPKDLNRYTAESVAAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEA
QKEEEAKREVEKLAKNKVISIDAGRKYFTLDQLKRIVDKASELGYSDVHLLLGNDGLRFLLNDMTITANGKTYASDD
VKKAIIEGTKAYYDDPNGTALTQAEVTELIEYAKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTM
DLKNEEAMNFVKALIGKYMDFFAGKTKIFNFGTDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPM
AFNDGFYYEDKDDVQFDKDVLISYWSKGWWGYNLASPQYLASKGYKFLNTNGDWYYVIGNHKQDEAYPLSKAVENSG
KVPFNQLASTKYPEVDLPTVGSMLSIWADRPSAEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYS
KESLEALDAAKTALNYNLNRNKQAELDTLVANLKAALQGLKPAATHSGSLDENEVAANVETRPELITRTEEIPFEVI
KKENPNLPAGQENIITAGVKGERTHYISVLTENGKTTETVLDSQVTKEVINQVVEVGSPVTHKGDESGLAPTTEVKP
RLDIQEEEIPFTTVTRENPLLLKGKTQVITKGVNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTH
VGDENGQAAIAEEKPKLEIPSQPAPSTAPAEESKALPQDPAPVVTEKKLPETGTHDSAELVVAGLMSTLAAYGLTKR
KED
 
SEQ ID NO:2
MILQYVYWSVYMQTKTKKLIVSLSSLVLSGFLLNHYMTVGAEETTTNTIQQSQKEVQYQQRDTKNLVENGDFGQTED
GSSPWTGSKAQGWSAWVDQKNSSADASTRVIEAKDGAITISSPEKLRAAVHRMVPIEAKKKYKLRFKIKTDNKVGIA
KVRIIEESGKDKRLWNSATTSGTKDWQTIEADYSPTLDVDKIKLELFYETGTGTVSFKDIELVEVADQPSEDSQTDK
QLEEKIDLPIGKKHVFSLADYTYKVENPDVASVKNGILEPLKEGTTNVIVSKDGKEVKKIPLKILASVKDTYTDRLD
DWNGIIAGNQYYDSKNEQMAKLNQELEGKVADSLSSISSQADRIYLWEKFSNYKTSANLTATYRKLEEMAKQVTNPS
SRYYQDETVVRTVRDSMEWMHKHVYNSEKSIVGNWWDYEIGTPRAINNTLSLMKEYFSDEEIKKYTDVIEKFVPDPE
HFRKTTDNPFKALGGNLVDMGRVKVIAGLLRKDDQEISSTIRSIEQVFKLVDQGEGFYQDGSYIDHTNVAYTGAYGN
VLIDGLSQLLPVIQKTKNPIDKDKMQTMYHWIDKSFAPLLVNGELMDMSRGRSISRANSEGHVAAVEVLRGIHRIAD
MSEGETKQRLQSLVKTIVQSDSYYDVFKNLKTYKDISLMQSLLSDAGVASVPRTSYLSAFNKMDKTAMYNAEKGFGF
GLSLFSSRTLNYEHMNKENKRGWYTSDGMFYLYNGDLSHYSDGYWPTVNPYKMPGTTETDAKRADSDTGKVLPSAFV
GTSKLDDANATATMDFTNWNQTLTAHKSWFMLKDKIAFLGSNIQNTSTDTAATTIDQRKLESSNPYKVYVNDKEASL
TEQEKDYPETQSVFLESSDSKKNIGYFFFKKSSISMSKALQKGAWKDINEGQSDKEVENEFLTISQAHKQNGDSYGY
MLIPNVDRATFNQMIKELESSLIENNETLQSVYDAKQGVWGIVKYDDSVSTISNQFQVLKRGVYTIRKEGDEYKIAY
YNPETQESAPDQEVFKKLEQAAQPQVQNSKEKEKSEEEKNHSDQKNLPQTGEGQSILASLGFLLLGAFYLFRRGKNN
 
SEQ ID NO:3
MGKGHWNRKRVYSIRKFAVGACSVMIGTCAVLLGGNIAGESVVYADETLITHTAEKPKEEKMIVEEKADKALETKNV
VERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASSQEKPLKEDAKAVTNEEVNQMIENRKVDF
NQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRL
TFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLYKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVH
VEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILE
VERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENY
KAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWS
DFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADE
LDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASW
TFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNW
ENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAI
ARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNG
EQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTI
IGEAPEMPTTVPFVYSDGSRAERPVTWSLVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTNLNSV
DKSVSYVLTDGSVQEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPVVPTVTVGGEAVTG
LTSRQPMQYRTLSYGAQLPEVTASAENADVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVE
KADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKGQVELTIQAN
TEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQIFEVLGKVEGIDLEARAKVSV
EGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQ
TEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRSNPEASVGVLFGDSGILSKRSVDN
LSVGFHEDHGVGAPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVET
YAIRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTANVSNNGLA
TVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKNLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETK
DLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEVTVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVD
YLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVAQAKLHFFADSGTDAPSKLVLERYVGPGFEVPTY
YSNYQAYESGHPFNNPENWEAVPYRADKDIAAGDEINVTFKAVKAKVMRWRMERKADKSGVAMIEMTFLAPSELPQE
STQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSLPVLVRLVSESGKQVKEYRIQLTK
EKPVSAVQEDLPKLEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTVINPDGSKEEKLREVVEVPTDRIV
LVGTKPVAQEAKKPQVSEKADTKPIDSSEADQTNKAQLPNTGSAASQAAVAAGLALLGLSAGLVVTKGKKED
 
SEQ ID NO:4
MSQKNNKKKNKRKNLLTNILAGFLILLSLALIFNTQIRNIFIVWNTNKYQVSQVSKEKLEENQDTEGNFDFDSVKAI
SSEAVLTSQWDAQKLPVIGGIAIPELEMNLPIFKGLDNVNLFYGAGTMKREQVMGEGNYSLASHHIFGVDNANKMLF
SPLDNAKNGMKIYLTDKNKVYTYEIREVKRVTPDRVDEVDDRDGVNEITLVTCEDLAATERIIVKGDLKETKDYSQT
SDEILTAFNQPYKQFY
 
SEQ ID NO:5
MVPKTATSTETKTITRIIHYVDKVTNQNVKEDVVQPVTLSRTKTENKVTGVVTYGEWTTGNWDEVISGKIDKYKDPD
IPTVESQEVTSDSSDKEITVRYDRLSTPEKPIPQPNPEHPSVPTPNPELPNQETPTPDKPTPEPGTPKTETPVNPDP
EVPTYETGKREELPNTGTEANATLASAGIMTLLAGLGLGFFKKKEDEK
 
SEQ ID NO:6
MEKDMNLKREQEFVSQYHFDARNFEWENENGAPETKVDVNFQLLQHDQENQVTSLIVILSFMIVFDKFVISGTISQV
NHIDGRIVNEPNELNQEEVETLARPCLNMLNRLTYEVTEIALDLPGINLEF
 
SEQ ID NO:7
MKKNSLYIISSLFFACVLFVYATATNFQNSTSARQVKTETYTNTVTNVPIDIRYNSDKYFISGFASEVSVVLTGANR
LSLASEMQESTRKFKVTADLTDAGVGTIEVPLSIEDLPNGLTAVATPQKITVKIGKKAQKDKVKIVPEIDPSQIDSR
VQIENVMVSDKEVSITSDQETLDRIDKIIAVLPTSERITGNYSGSVPLQAIDRNGVVLPAVITPFDTIMKVTTKPVA
PSSSTSNSSTSSSSETSSSTKATSSKTN
 
SEQ ID NO:8
MNLGEFWYNKINKNRGRRLMKKVRFIFLALLFFLASPEGAMASDGTWQGKQYLKEDGSQAANEWVFDTHYQSWFYIK
ADANYAENEWLKQGDDYFYLKSGGYMAKSEWVEDKGAFYYLDQDGKMKRNAWVGTSYVGATGAKVIEDWVYDSQYDA
WFYIKADGQHAEKEWLQIKGKDYYFKSGGYLLTSQWINQAYVNASGAKVQQGWLFDKQYQSWFYIKENGNYADKEWI
FENGHYYYLKSGGYMAANEWIWDKESWFYLKFDGKIAEKEWVYDSHSQAWYYFKSGGYMAANEWIWDKESWFYLKFD
GKMAEKEWVYDSHSQAWYYFKSGGYMTANEWIWDKESWFYLKSDGKIAEKEWVYDSHSQAWYYFKSGGYMTANEWIW
DKESWFYLKSDGKMAEKEWVYDSHSQAWYYFKSGGYMAKNETVDGYQLGSDGKWLGGKATNKNAAYYQVVPVTANVY
DSDGEKLSYISQGSVVWLDKDRKSDDKRLAITISGLSGYMKTEDLQALDASKDFIPYYESDGHRFYHYVAQNASIPV
ASHLSDMEVGKKYYSADGLHFDGFKLENPFLFKDLTEATNYSAEELDKVFSLLNINNSLLENKGATFKEAEEHYHIN
ALYLLAHSALESNWGRSKIAKDKNNFFGITAYDTTPYLSAKTFDDVDKGILGATKWIKENYIDRGRTFLGNKASGMN
VEYASDPYWGEKIASVMMKINEKLGGKD
 
SEQ ID NO:9
MSVTFFIGEERLKIKIGLASICLLGLATSHVAANETEVAKTSQDTTTASSSSEQNQSSNKTQTSAEVQTNAAAYWDG
DYYVKDDGSKAQSEWIFDNYYKAWFYINSDGRYSQNEWHGNYYLKSGGYMAQNEWIYDSNYKSWFYLKSDGAYAHQE
WQLIGNKWYYFKKWGYMAKSQWQGSYFLNGQGAMIQNEWLYDPAYSAYFYLKSDGTYANQEWQKVGGKWYYFKKWGY
MARNEWQGNYYLTGSGAMATDEVIMDGARYIFAASGELKEKKDLNVGWVHRDGKRYFFNNREEQVGTEHAKKIIDIS
EHNGRINDWKKVIDENKVDGVIVRLGYSGKEDKELAHNIKELNRLGIPYGVYLYTYAENETDAENDAKQTIELIKKY
NMNLSYPIYYDVENWEYVNKSKRAPSDTDTWVKIINKYMDTMKQAGYQNVYVYSYRSLLQTRLKHPDILKHVNWVAA
YTNALEWENPYYSGEKGWQYTSSEYMKGIQGRVDVSVWY
 
SEQ ID NO:10
MANKAVNDFILAMNYDKKKLLTHQGESIENRFIKEGNQLPDEFVVIERKKRSLSTNTSDISVTATNDSRLYPGALLV
VDETLLENNPTLLAVDRAPMTYSIDLPGLASSDSFLQVEDPSNSSVRGAVNDLLAKWHQDYGQVNNVPARMQYEKIT
AHSMEQLKVKFGSDFEKTGNSLDIDFNSVHSGEKQIQIVNFKQIYYTVSVDAVKNPGDVFQDTVTVEDLKQRGISAE
RPLVYISSVAYGRQVYLKLETTSKSDEVEAAFEALIKGVKVAPQTEWKQILDNTEVKAVILGGDPSSGARVVTGKVD
MVEDLIQEGSRFTADHPGLPISYTTSFLRDNVVATFQNSTDYVETKVTAYRNGDLLLDHSGAYVAQYYITWDELSYD
HQGKEVLTPKAWDRNGQDLTAHFTTSIPLKGNVRNLSVKIRECTGLAWEWWRTVYEKTDLPLVRKRTISIWGTTLYP
QVEDKVEND
 
SEQ ID NO:11
MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAEND
RLQAESKKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQ
KADKKAISEKQVANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAA
AVAEAAYKEKRASQQQSVLASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWG
NGAQWATSAAAAGFRTGSTPQVGAIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGF
VTYIYAD
SEQ ID NO:12
MKSITKKIKATLAGVAALFAVFAPSFVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVI
DGPVAPVATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYGSW
TAAKNFWLNNGWY
 
SEQ ID NO:13
MTYLDAFKSGTLVLPSALLLHFKELFPSSDDFLVWQFFYLQNTTGLEEMSPSQIAERIGKEISDVNQSISNLTERGL
LQYRTIELNGEIELLFDASLALERLDDLFGAVHSSSDQLTSQNQLKDLVETFQQELGRLLTPFEIEDLTKTLKEDGT
SADLIKEALREAVLNGKPNWKYIQAILRNWRHEGIKSVAQIEAKRAEREASNPQLTQVSADFRNAMDLWKD
 
SEQ ID NO:14
MKKNRVFATAGLVLLAAGVLAACSSSKSSDSSAPKAYGYVYTADPETLDYLISRKNSTTVVTSNGIDGLFTNDNYGN
LAPAVAEDWEVSKDGLTYTYKIRKGVKWFTSDGEEYAEVTAKDFVNGLKHAADKKSEAMYLAENSVKGLADYLSGTS
TDFSTVGVKAVDDYTLQYTLNQPEPFWNSKLTYSIFWPLNEEFETSKGSDFAKPTDPTSLLYNGPFLLKGLTAKSSV
EFVKNEQYWDKENVHLDTINLAYYDGSDQESLERNFTSGAYSYARLYPTSSNYSKVAEEYKDNIYYTQSGSGIAGLG
VNIDRQSYNYTSKTTDSEKVATKKALLNKDFRQALNFALDRSAYSAQINGKDGAALAVRNLFVKPDFVSAGEKTFGD
LVAAQLPAYGDEWKGVNLADGQDGLFNADKAKAEFAKAKKALEADGVQFPIHLDVPVDQASKNYISRIQSFKQSVET
VLGVENVVVDIQQMTSDEFLNITYYAANASSEDWDVSGGVSWGPDYQDPSTYLDILKTTSSETTKTYLGFDNPNSPS
VVQVGLKEYDKLVDEAAKETSDLNVRYEKYAAAQAWLTDSSLFIPAMASSGAAPVLSRIVPFTGASAQTGSKGSDVY
FKYLKLQDKAVTKEEYEKAREKWLKEKAESNEKAQKELASHVK
 
SEQ ID NO:15
MFASKSERKVHYSIRKFSIGVASVAVASLVMGSVVHATENEGSTQAATSSNMAKTEHRKAAKQVVDEYIEKMLREIQ
LDRRKHTQNVALNIKLSAIKTKYLRELNVLEEKSKDELPSEIKAKLDAAFEKFKKDTLKPGEKVAEAKKKVEEAKKK
AEDQKEEDRRNYPTNTYKTLELEIAEFDVKVKEAELELVKEEAKESRNEGTIKQAKEKVESKKAEATRLENIKTDRK
KAEEEAKRKADAKLKEANVATSDQGKPKGRAKRGVPGELATPDKKENDAKSSDSSVGEETLPSSSLKSGKKVAEAEK
KVEEAEKKAKDQKEEDRRNYPTNTYKTLDLEIAESDVKVKEAELELVKEEAKEPRDEEKIKQAKAKVESKKAEATRL
ENIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPATQPEKPAPKPEKPAEQPKAEKTDDQQAEEDYARRSEEEYN
RLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNANGAMATGWLQNNGSWYYLNANG
SMATGWLQNNGSWYYLNANGAMATGWLQYNGSWYYLNSNGAMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLN
ANGDMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDGYGV
NANGEWVN
 
SEQ ID NO:16
MIPVVIEQTSRGERSYDIYSRLLKDRIIMLTGPVEDNMANSVIAQLLFLDAQDSTKDIYLYVNTPGGSVSAGLAIVD
TMNFIKADVQTIVMGMAASMGTVIASSGAKGKRFMLPNAEYMIHQPMGGTGGGTQQTDMAIAAEHLLKTRNTLEKIL
AENSGQSMEKVHADAERDNWMSAQETLEYGFIDEIMANNSLN
 
SEQ ID NO:17
MEINVSKLRTDLPQVGVQPYRQVHAHSTGNPHSTVQNEADYHWRKDPELGFFSHIVGNGCIMQVGPVDNGAWDVGGG
WNAETYAAVELIESHSTKEEFMTDYRLYIELLRNLADEAGLPKTLDTGSLAGIKTHEYCTNNQPNNHSDHVDPYPYL
AKWGISREQFKHDIENGLTIETGWQKNDTGYWYVHSDGSYPKDKFEKINGTWYYFDSSGYMLADRWRKHTDGNWYWF
DNSGEMATGWKKIADKWYYFNEEGAMKTGWVKYKDTWYYLDAKEGAMVSNAFIQSADGTGWYYLKPDGTLADRPEFT
VEPDGLITVK
 
SEQ ID NO:18
MQLEISNRKRVSMKINKKYLVGSAAALILSVCSYELGLYQARTVKENNRVSYIDGKQATQKTENLTPDEVSKREGIN
AEQIVIKITDQGYVTSHGDHYHYYNGKVPYDAIFSEELLMKDPNYKLKDEDIVNEVKGGYVIKVDGKYYVYLKDAAH
ADNVRTKEEINRQKQEHSQHREGGTPRNDGAVALARSQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNE
LSASELAAAEAFLSGRGNLSNSRTYRRQNSDNTSRTNWVPSVSNPGTTNTNTSNNSNTNSQASQSNDIDSLLKQLYK
LPLSQRHVESDGLVFDPAQITSRTARGVAVPHGDHYHFIPYSQMSELEERIARIIPLRYRSNHWVPDSRPEQPSPQP
TPEPSPGPQPAPNLKIDSNSSLVSQLVRKVGEGYVFEEKGISRYVFAKDLPSETVKNLESKLSKQESVSHTLTAKKE
NVAPRDQEFYDKAYNLLTEAHKALFENKGRNSDFQALDKLLERLNDESTNKEKLVDDLLAFLAPITHPERLGKPNSQ
IEYTEDEVRIAQLADKYTTSDGYIFDEHDIISDEGDAYVTPHMGHSHWIGKDSLSDKEKVAAQAYTKEKGILPPSPD
ADVKANPTGDSAAAIYNRVKGEKRIPLVRLPYMVEHTVEVKNGNLIIPHKDHYHNIKFAWFDDHTYKAPNGYTLEDL
FATIKYYVEHPDERPHSNDGWGNASEHVLGKKDHSEDPNKNFKADEEPVEETPAEPEVPQVETEKVEAQLKEAEVLL
AKVTDSSLKANATETLAGLRNNLTLQIMDNNSIMAEAEKLLALLKGSNPSSVSKEKIN
 
SEQ ID NO:19
MKINKKYLAGSVAVLALSVCSYELGRYQAGQDKKESNRVAYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQ
GYVTSHGDHYHYYNGKVPYDAIISEELLMKDPNYQLKDSDIVNEIKGGYVIKVNGKYYVYLKDAAHADNIRTKEEIK
RQKQERSHNHNSRADNAVAAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAYWN
GKQGSRPSSSSSYNANPAQPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTAR
GVAVPHGNHYHFIPYEQMSELEKRIARIIPLRYRSNHWVPDSRPEEPSPQPTPEPSPSPQPAPSNPIDGKLVKEAVR
KVGDGYVFEENGVSRYIPAKDLSAETAAGIDSKLAKQESLSHKLGTKKTDLPSSDRERYNKAYDLLARIHQDLLDNK
GRQVDFEALDNLLERLKDVSSDKVKLVEDILAFLAPIRHPERLGKPNAQITYTDDEIQVAKLAGKYTAEDGYIFDPR
DITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQAYAXEKGLTPPSTDHQDSGNTEAKGAEAIYNRVKAAKKVPLD
RMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAPKGYTLEDLLATVKYYVEHPNERPHSDNGFGNASDHV
QRNKNGQADTNQTEKPSEEKPQTEKPEEETPREEKPQSEKPESPKPTEEPEESPEESEEPQVETEKVEEKLREAEDL
LGKIQDPIIKSNAKETLTGLKNNLLFGTQDNNTIMAEAEKLLALLKESK
 
SEQ ID NO:20
MKINKKYLAGSVAVLALSVCSYELGRHQAGQVKKESNRVSYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQ
GYVTSHGDHYHYYNGKVPYDAIISEELLMKDPNYQLKDSDIVNEIKGGYVIKVDGKYYVYLKDAAHADNIRTKEEIK
RQKQERSHNHNSRADNAVAAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKSDLSASELAAAQAYWN
GKQGSRPSSSSSHNANPAQPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTAN
GVAVPHGDHYHFIPYSQLSPLEEKLARIIPLRYRSNHWVPDSRPEQPSPQSTPEPSPSPQPAPNPQPAPSNPIDEKL
VKEAVRKVGDGYVFEENGVPRYIPAKDLSAETAAGIDSKLAKQESLSHKLGAKKTDLPSSDREFYNKAYDLLARIHQ
DLLDNKGRQVDFEALDNLLERLKDVSSDKVKLVDDILAFLAPIRHPERLGKPNAQITYTDDEIQVAKLAGKYTTEDG
YIFDPRDITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQAYAKEKGLTPPSTDHQDSGNTEAKGAEAIYNRVKAA
KKVPLDRMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAPKGYSLEDLLATVKYYVEHPNERPHSDNGFG
NASDHVQRNKNGQADTNQTEKPNEEKPQTEKPEEDKEHDEVSEPTHPESDEKENHVGLNPSADNLYKPSTDTEETEE
EAEDTTDEAEIPQVEHSVINAKIAEAEALLEKVTDSSIRQNAVETLTGLKSSLLLGTKDNNTISAEVDSLLALLKES
QPTPIQ
 
SEQ ID NO:21
MKFSKKYIAAGSAVIVSLSLCAYALNQHRSQENKDNNRVSYVDGSQSSQKSENLTPDQVSQKEGIQAEQIVIKITDQ
GYVTSHGDHYHYYNGKVPYDALFSEELLMKDPNYQLKDADIVNEVKGGYIIKVDGKYYVYLKDAAHADNVRTKDEIN
RQKQEHVKDNEKVNSNVAVARSQGRYTTNDGYVFNPADIIEDTGNAYIVPHGGHYHYIPKSDLSASELAAAKAHLAG
KNMQPSQLSYSSTASDNNTQSVAKGSTSKPANKSENLQSLLKELYDSPSAQRYSESDGLVFDPAKIISRTPNGVAIP
HGDHYHFIPYSKLSALEEKIARRVPISGTGSTVSTNAKPNEVVSSLGSLSSNPSSLTTSKELSSASDGYIFNPKDIV
EETATAYIVRHGDHFHYIPKSNQIGQPTLPNNSLATPSPSLPINPGISHEKHEEDGYGFDANRIIAEDESGFIMSHG
NHNHYFFKKDLTEEQIKAAQKHLEEVKTSHNGLDSLSSHEQDYPGNAKEMKDLDKKIEEKIAGIMKQYGVKRESIVV
NKEKNAIIYPHGDHHHADPIDEHKPVGIGHSHSNYELFKPEEGVAKKEGNKVYTGEELTNVVNLLKNSTFNNQNFTL
ANGQKRVSFSFPPELEKKLGINMLVKLITPDGKVLEKVSGKVFGEGVGNIANFELDQPYLPGQTFKYTIASKDYPEV
SYDGTFTVPTSLAYKMASQTIFYPFHAGDTYLRVNPQFAVPKGTDALVRVFDEFHGNAYLENNYKVGEIKLPIPKLN
QGTTRTAGNKIPVTFMANAYLDNQSTYIVEVPILEKENQTDKPSILPQFKRNKAQENSKLDEKVEEPKTSEKVEKEK
LSETGNSTSNSTLEEVPTVDPVQEKVAKFAESYGMKLENVLFNMDGTIELYLPSGEVIKKNMADFTGEAPQGNGENK
PSENGKVSTGTVENQPTENKPADSLPEAPNEKPVKPENSTDNGMLNPEGNVGSDPMLDPALEEAPAVDPVQEKLEKF
TASYGLGLDSVIFNMDGTIELRLPSGEVIKKNLSDLIA
 
SEQ ID NO:22
MFKKDRFSIRKIKGVVGSVFLGSLLMAPSVVDAATYHYVNKEIISQEAKDLIQTGKPDRNEVVYGLVYQKDQLPQTG
TEASVLTAFGLLTVGSLLLIYKRKKIASVFLVGTMGLVVLPSAGAVDPVATLALASREGVVEMEGYRYVGYLSGDIL
KTLGLDTVLEETSAKPGEVTVVEVETPQSTTNQEQARTENQVVETEEAPKEEAPKTEESPKEEPKSEVKPTDDTLPK
VEEGKEDSAEPAPVEEVGGEVESKPEEKVAVKPESQPSDKPAEESKVEQAGEPVAPRKDEQAPVEPENQPEAPEEEK
AVEETPKQEESTPDTKAEETVEPKEETKTAKGTQEEGKEGQAPVQEVNPEYKVTTGTVEKSTESELDFTTEVVPDDT
KYVDEEVVERQGSKGVQVTKTTYETVEVVETDKVLSTTTEVKTPVVPKVVKKGTKPVETREEVIPFATKEQEDDTLK
RGTRQVAQEGVNGKKQITETYKTIRGEKTNEAPTVEETVLQAPQDEIIKKGTKGLEKPTLQWANTEKDVLKKSATAS
YTLTKPAGVEIKSIKLALKDKDGQLVKEVTVAENNLNATLDKLKYYQGYTLSTTMVYDRGEGEETEKLEDKQIQLDL
KKVEIKNIKETSLMNVDAEGNETDKSLLSEKPTDVSQLYLRVTTHDNKVTRLAVSSVEEVVVDGKTLYKVVAKAPDL
VQRRADDTLSEEYVHYFEKQLPKVNNVYYNFNELVKDMQANPMGEFKLGADLNAVNVKPAGKAYVMAKFRGTLSSVE
NHQYTIHNLERPLFNEAEGATLKNFNLGNVNINMPWADKVAPIGNMFKKSTLENIKVVGSVTGNNDVTGAVNKLDEA
NMRNVAFIGKINSLGDKGWWSGGLVSESWRSNTDSVYFDGDIVGNNSKFGGLVAKVNHGSNQWDVKQKGRLTNSVVK
GTMTLKNHGQSGGLVHENYDWGWVENNISMMKVNNGEIMYGSGSIDGDPYFGFDYFKNNYYVKDVATGESTYKRSKQ
IQSISQAEADAKIANMGITANTFAIQDPVVNKLNRIIDRDSEYKAIQDYQETRNLAYRNLEKLQPFYNKEWIVNQGN
KLTDESNLVKKTVLSVTGMKSGQFVTDLSSVDKIMIHYADGTKEEFGVSAISDSRVKQVKEYNVDDLGVVYTPNMVD
KNRDSLITKVKEKLSSVALDSAEVKSITNNPASLYLEESFAEVRETLDKLVKSLLENEDHQLNSDEVAEKALLKKVE
DNKAKIILALTYLNRYYGIDYDGLNFKHLMMFKPDFYGKTPSILDFLIRIGSAEKNLKGDRSLEAYREVIGGTIGKG
ELNGLLGYNMRLFTKYTDLNDWFIHAAKNVYVSEPETTTEDFKDKRHRIYDGLNNDVHGRMILPLLNLKKAHIFVIS
TYNTIAFSSFEKYGKNTEEERNAYKAEIDRVAKAQQRYLDFWSRLALPKVRNQLLKSQNSVPTPVWDNQVYVGLGGA
NRMGYGDGGRVVTPVRELFGPTDRWHQINWNMGAMAKIYERPWKDDQVYFMVTNMMEPFGISAFTHETTHVNDRMAY
YGGDWHREGTDLEAFAQGMLQTPDKSTTNGEYGALGINMAYERKNDGEQLYNYDPEKLDSREKIDSYMKNYNESMMM
LDYLEASAVIRQNLSDNSKWFKKMDKEWRTNADRNRLIGEPHQWDKLRDLTEEEKKLPIDSIDKLVENNFVTLHGMP
KNGRYRTEGFDSSYQPVNMMAGVFGGNTSKSTVGSISFKHNAFRMWGYYGYENGFIPYVSNKLKGAANKENKGLLGD
DFIIKKVSKNQFQNLEEWKKHWYHEVYDKAQKGFVEIEVDGVKISTYAQLQSLFEEAVSKDLAGMDDKNIKNHYQYT
ENLKWKIYKQLLKNTDGFSSDLFTAPQA
SEQ ID NO:23
MKILPFIARGTSYYLKMSVKKLVPFLVVGLMLAAGDSVYAYSRGNGSIARGDDYPAYYKNGSQEIDQWRMYSRQCTS
FVAFRLSNVNGFEIPAAYGNANEWGHRARREGYRVDNTPTIGSITWSTAGTYGHVAWVSNVMGDQIEIEEYNYGYTE
SYNKRVIKANTMTGFIHFKDLDSGSVGNSQSSASTGGTHYFKTKSAIKTEPLVSATVIDYYYPGEKVHYDQILEKDG
YKWLSYTAYNGSYRYVQLEAVNKNPLGNSVLSSTGGTHYFKIKSAIKTEPLVSATVIDYYYPGEKVHYDQILEKDGY
KWLSYTAYNGSRRYIQLEGVTSSQNYQNQSGNISSYGSNNSSTVGWKKINGSWYHFKSNGSKSTGWLKDGSSWYYLK
LSGEMQTGWLKENGSWYYLGSSGAMKTGWYQVSGEWYYSYSSGALAINTTVDGYRVNSDGERV
 
SEQ ID NO:24
MLTDWQKVNGNWYYLNSNGAMVTGSQTIDGKVYNFASSGEWI
 
SEQ ID NO:25
MFKRIRRVLVLAVFLFAGYKAYRVHQDVKQVMTYQPMVREILSEQDTPANEELVLAMIYTETKGKEGDVMQSSESAS
GSTNTINDNASSIRQGIQTLTGNLYLAQKKGVDIWTAVQAYNFGPAYIDFIAQNGKENTLALAKQYSRETVAPLLGN
RTGKTYSYIHPISIFHGAELYVNGGNYYYSRQVRLNLYIIKCFTLFSTSG
 
SEQ ID NO:26
MVKKNDLFVDVSSHNGYDITGILEQMGTTNTIIKISESTTYLNPCLSAQVEQSNPIGFYHFARFGGDVAEAEREAQF
FLDNVPMQVKYLVLDYEDDPSGDAQANTNACLRFMQMIADAGYKPIYYSYKPFTHDNVDYQQILAQFPNSLWIAGYG
LNDGTANFEYFPSMDGIRWWQYSSNPFDKNIVLLDDEEDDKPKTAGTWKQDSKGWWFRRNNGSFPYNKWEKIGGVWY
YFDSKGYCLTSEWLKDNEKWYYLKDNGAMATGWVLVGSEWYYMDDSGAMVTGWVKYKNNWYYMTNERGNMVSNEFIK
SGKGWYFMNTNGELADNPSFTKEPDGLITVA
 
SEQ ID NO:27
MFAFKKRRKVHYSIRKFSIGVASVAVASLFMGSVVHATEKEVTTQVATSSNKANKSQTEHMKAAKQVDEYIEKMLSE
IQLDRRKHTQNVGLLTKLGAIKTEYLRGLSVSKEKSTAELPSEIKEKLTAAFEQFKKDTLKSGKKVAEAQKKAKDQK
EAKQEIEALIVKHKGREIDLDRKKAKAAVTEHLKKLLNDIEKNLKKEQHTHTVELIKNLKDIEKTYLHKLDESTQKA
QLQKLIAESQSKLDEAFSKFKNGLSSSSNSGSSTKPETPQPETPKPEVKPELETPKPEVKPEPETPKPEVKPEPETP
KPEVKPELETPKPEVKPEPETPKPEVKPEPETPKPEVKPEPETPKPEVKPELETPKPEVKPELETPKPEVKPEPETP
KPEVKPELETPKPEVKPEPETPKPEVKPELETPKPEVKPEPETPKPEVKPELETPKPEVKPEPETPKPEVKPEPETP
KPEVKPEPETPKPEVKPELETPKQKVKPEPETPKPEVKPEPETPKPEVKPELETPKPEVKPELEIPKPEVKPDNSKP
QADDKKPSTPNNLSKDKQSSNQASTNENKKQGPATNKPKKSLPSTGSISNLALEIAGLLTLAGATILAKKRMK
 
SEQ ID NO:28
MKKKLLAGAITLLSVATLAACSKGSEGADLISMKGDVITEHQFYEQVKNNPSAQQVLLNMTIQKVFEKQYGSELDDK
EVDDTIAEEKKQYGENYQRVLSQAGMTLETRKAQIRTSKLVELAVKKVAEAELTDEAYKKAFDEYTPDVTAQIIRLN
NEDKAKEVLEKAKAEGADFAQLAKDNSTDEKTKENGGEITFDSASTEVPEQVKKAAFALDVDGVSDVITATGTQAYS
SQYYIVKLTKKTEKSSNIDDYKEKLKTVILTQKQNDSTFVQSIIGKELQAANIKVKDQAFQNIFTQYIGGGDSSSSS
STSNE
 
SEQ ID NO:29
MNKKKMILTSLASVAILGAGFVASQPTVVRAEESPVASQSKAEKDYDAAKKDAKNAKKAVEDAQKALDDAKAAQKKY
DEDQKKTEEKAALEKAASEEMDKAVAAVQQAYLAYQQATDKAAKDAADKMIDEAKKREEEAKTKFNTVRAMVVPEPE
QLAETKKKSEEAKQKAPELTKKLEEAKAKLEEAEKKATEAKQKVDAEEVAPQAKIAELENQVHRLEQELKEIDESES
EDYAKEGFRAPLQSKLDAKKAKLSKLEELSDKIDELDAEIAKLEDQLKAAEENNNVEDYFKEGLEKTIAAKKAELEK
TEADLKKAVNEPEKPAPAPETPAPEAPAEQPKPAPAPQPAPAPKPEKPAEQPKPEKTDDQQAEEDYARRSEEEYNRL
TQQQPPKAEKPAPAPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQYNGSWYYLNANGAMAT
GWAKVNGSWYYLNANGAMATGWLQYNGSWYYLNANGAMATGWAKVNGSWYYLNANGAMATGWLQYNGSWYYLNANGA
MATGWAKVNGSWYYLNANGAMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGLGALAVNTTVDGYKVNANG
EWV
 
SEQ ID NO:30
MKKLGTLLVLFLSAIILVACASGKKDTTSGQKLKVVATNSIIADITKNIAGDKIDLHSIVPIGQDPHEYEPLPEDVK
KTSEADLIFYNGINLETGGNAWFTKLVENAKKTENKDYFAVSDGVDVIYLEGQNEKGKEDPHAWLNLENGIIFAKNI
AKQLSAKDPNNKEFYEKNLKEYTDKLDKLDKESKDKFNKIPAEKKLIVTSEGAFKYFSKAYGVPSAYIWEINTEEEG
TPEQIKTLVEKLRQTKVPSLFVESSVDDRPMKTVSQDTNIPIYAQIFTDSIAEQGKEGDSYYSMMKYNLDKIAEGLA
K
 
SEQ ID NO:31
MKKSTVLSLTTAAVILAAYAPNEVVLADTSSSEDALSISDKEKVVVDKETENKEKHKDIHNAIETSKDTEEKKTTII
EEKEVVSKNPVIDTKTSNEEAKIKEENSNQSQGDHTDSFVNKNTENPKKEDKVVYIAEFKDKESGEKAIKGLSNLKN
TKVLYTYDRIFNGSAIETTPDNLDKIKQIEGISSIERAQKVQPMMNHARKEIGVEEAIDYLKSINAPFGKNFDGRGM
VISNIDTGTDYRHKAMRIDDDAKASMRFKKEDLKGTDKNYWLSDKIPHAFNYYNGGKITVEKYDDGRDYFDPHGMHI
AGILAGNDTEQDIKNFNGIDGIAPNAQIFSYKMYSDAGSGFAGDETMFHAIEDSIKHNVDVVSVSSGFTGTGLVGEK
YWQAIRALRKAGIPMVVATGNYATSASSSSWDLVANNHLKMTDTGNVTRTAAHEDAIAVASAKNQTVEFDKVNIGGE
SFKYRNIGAFFDKNKITTNEDGTKAPSKLKFVYIGKGQDQDLIGLDLRGKIAVMDRIYTKDLKNAFKKAMDKGARAI
MVVNTVNYYNRDNWTELPAMGYEADEGTKSQVFSISGDDGVKLWNMINPDKKTEVKRNNKEDFKDKLEQYYPIDMES
FNSNKPNVGDEKEIDFKFAPDTDKELYKEDIIVPAGSTSWGPRIDLLLKPDVSAPGKNIKSTLNVINGKSTYGYMSG
TSMATPIVAASTVLIRPKLKEMLERPVLKNLKGDDKIDLTSLTKIALQNTARPMMDATSWKEKSQYFASPRQQGAGL
INVANALRNEVVATFKNTDSKGLVNSYGSISLKEIKGDKKYFTIKLHNTSNRPLTFKVSASAITTDSLTDRLKLDET
YKDEKSPDGKQIVPEIHPEKVKGANITFEHGTFTIGANSSFDLNAVINVGEAKNKNKFVESFIHFESVEEMEALNSN
GKKINFQPSLSMPLMGFAGNWNHEPILDKWAWEEGSRSKTLGGYDDDGKPKIPGTLNKGIGGEHGIDKFNPAGVIQN
RKDKNTTSLDQNPELFAFNNQGINAPSSSGSKIANIYPLDSNGNPQDAQLERGLTPSPLVLRSAEEGLISIVNTNKE
GENQRDLKVISREHFIRGILNSKSNDAKGIKSSKLKVWGDLKWDGLIYNPRGREENAPESKDNQDPATKIRGQFEPI
AEGQYFYKFKYRLTKDYPWQVSYIPVKIDNTAPKIVSVDFSNPEKIKLITKDTYHKVKDQYKNETLFARDQKEHPEK
FDEIANEVWYAGAALVNEDGEVEKNLEVTYAGEGQGRNRKLDKDGNTIYEIKGAGDLRGKIIEVIALDGSSNFTKIH
RIKFADQADEKGMISYYLVDPDKDASKYEKLGEISEDKLKNAKSPEENTNNNQAKDEDSKPDEKSSVEGEASLEINK
TISTIREFENKDLKKLIKKKFREVNDFTSETGKRIEEYDYKYDDKGNIIAYDDGSALQYETEKFDEIKSKIYGVLSP
SKDGHFEILGKISNVSKNAKVYYGNSYKSIEIKATKYDSHSKTMIFDLYANINDIVDGLAFAGDMRLFVKDDNQIKA
ETKIRMPEKNKETKAEYPYVSSYGNVIELGEGDLSKNKPDNLTKMESGKIYSDSEKQQYLLKDNIILRKGYALKVTT
YNPGKTDMLEGNGVYSKEDIAKIQKANPNLRVLSETTIYADSRNVEDGRSTQAVLMSALDGFNIIRYQVFTFKMNDK
GEAIDKDGNLVTDSSKLVLFGKDDKEYTGEDKSNVEAIKEDGSMLFIDTKPVNLSMDKNYFNPSKSNKIYVRNPEFY
LRGKISDKGGFNWELRVNESVVDNYLIYGDLHIDNTRDFNIKLNVKDGDIMDWGMKDYKANGFPDKVTDMDGNVYLQ
TGYSDLNAKAVGVHYQFLYDNVKPEVNIDPKGNTSIEYADGKSVVFNINDKRNNGFDGEIQEQHIYVNGKEYTSFDD
IKQITDKTLNIKIVVKDFARNTTVKEFILNKDTGEVSELKPHRVTVTIQNGKEMSSTIVSEEDFILPVYKGELEKGY
QFDGWEISGFEGKKDAGYVINLSKDTFIKPVFKKIEEKKEEENKPTFDVSKKKDNPQVNHSQLNESHRKEDLQREDH
SQKSDSTKDVTATVLDKNNISSKSTTNNPNKLPKTGTASGAQTLLAAGIMFIVGIFLGLKKKNQD
 
SEQ ID NO:32
MRKKLFLTSAAILWAVTAMNSVHAATDVQKVIDETYVQPEYVLGSSLSEDQKNQTLKKLGYNASTDTKELKTMTPDV
YSKIMNVANDSSLQLYSSAKIQKLGDKSPLEVKIETPENITKVTQDMYRNAAVTLGVEHAKITVAAPIPVTGESALA
GIYYSLEANGAKVPQANKDLAQEELKALSDINAENKDKSGYDANKLNVALADIKSGLAKAKESKGNLTEEDIRKIVE
DTLKNYKLDQVITGNQINIIINFALNLSKSDILSNADFTKTLNDLKQSIVSQAGDSFKNINLNFDSDKALEDGGNFL
SSLWQALVNFFKSFGS
 
SEQ ID NO:33
MHAKMRNKKQINLGIIFVICLGLLITIFLSLKLGTKEINIRDFLAAFGMGNTNDDFIKSIIYKRIPRTIFAILAGSS
LAISGVLMQSVTRNPIADPGILGINTGASLSVVIGLSFLGISSSISHISFAIIGGLVSAIFVYAIAVSGKAGLTPIK
LALSGTCVSMALSSFVSFLILPNNNVLDKFRFWQIGSLGAATLSSISTLLPFIILGHLIAIFISSDLNALAMGDEMA
VGLGVNVNRIRSLAIIASVLLCSSITAIGGPIGFVGLIVPHFCGLFISKDIRTMTISSAFIGAELLLICDIIGRMLG
KPGEIEVGIITAIIGGPVLIYVTMKNRGVNT
 
SEQ ID NO:34
MKTSLKLYFTALVASFLLLLGACSTNSSTSQTETSSSAPTEITIKSSLDEVKLSKVPEKIVTFDLGAADTIRALGFE
KNIVGMPTKTVPTYLKDLVGTVKNVGSMKEPDLEAIAALEPDLIIASPRTQKFVDKFKEIAPTVLFQASKDDYWTST
KANIESLASAFGETSTQKAKEELAKLDKSIQEVATKNESSDKKALAILLNEGKMAAFGAKSRFSFLYQTLKFKPTDT
KFEDSRHGQEVSFESVKEINPDILFVINRTLAIGGDNSSNDGVLENALIAETPAAKNGKIIQLTPDLWYLSGGGLES
TKLMIEDIQKALK
 
SEQ ID NO:35
MSKNIVQLNNSFIQNEYQRRRYLMKERQKRNRFMGGVLILIMLLFILPTFNLAQSYQQLLQRRQQLADLQTQYQTLS
DEKDKETAFATKLKDEDYAAKYTRAKYYYSKSREKVYTIPDLLQR
 
SEQ ID NO:36
MDKKKLLLIDGSSVAFRAFFALYQQLDRFKNVAGLHTNAIYGFQLMLSHLLERVEPSHILVAFDAGKTTFRTEMYAD
YKGGRAKTPDEFREQFPFIRELLDHMGIRHYDLAQYEADDIIGTLDKLAEQDGFDITIVSGDKDLIQLTDEHTVVEI
SKKGVAEFEAFTPDYLMEEMGLTPAQFIDLKALMGDKSDNIPGVTKVGEKTGIKLLLEHGSLEGIYENIDGMKTSKM
KENLINDKEQAFLSKTLATIDTKAPIAIGLEDLVYSGPDVENLGKFYDEMGFKQLKQALNVSSADVSESLDFTIVDQ
ISQDMLSEESIFHFELFGENYHTDNLVGFVWSCGDKLYATDKLELLQDPIFKDFLEKTSLRVYDFKKVKVLLQRFGV
DLQAPAFDIRLAKYLLSTVEDNEIATIASLYGQTYLVDDETFYGKGVKKAIPEREKFLEHLACKLAVLVETEPILLE
KLSENGQLELLYDMEQPLAFVLAKMEIAGIMVKKETLLEMQAENELVIEKLTQEIYELAGEEFNVNSPKQLGVLLFE
KLGLPLEYTKKTKTGYSTAVDVLERLAPIAPIVKKILDYRQIAKIQSTYVIGLQDWILADGKIHTRYVQDLTQTGRL
SSVDPNLQNIPARLEQGRLIRKAFVPEWEDSVLLSSDYSQIELRVLAHISKDEHLIKAFQEGADIHTSTAMRVFGIE
RPDDVTANDRRNAKAVNFGVVYGISDFGLSNNLGISRKEAKAYIDTYFERFPGIKNYMDEVVREARDKGYVETLFKR
RRELPDINSRNFNIRGFAERTAINSPIQGSAADILKIAMIQLDKALVAGGYQTKMLLQVHDEIVLEVPKSELVEMKK
LVKQTMEEAIQLSVPLIADENEGATWYEAK
 
SEQ ID NO:37
MGMAAFKNPNNQYKAITIAQTLGDDASSEELAGRYGSAVQCTEVTASNLSTVKTKATVVEKPLKDFRASTSDQSGWV
ESNGKWYFYESGDVKTGWVKTDGKWYYLNDLGVMQTGFVKFSGSWYYLSNSGAMFTGWGTDGSRWFYFDGSGAMKTG
WYKENGTWYYLDEAGIMKTGWFKVGPHWYYAYGSGALAVSTTTPDGYRVNGNGEWVN
 
SEQ ID NO:38
MSRKSIGEKRHSFSMRKLSVGLVSVTVSSFFLMSQGIQSVSADNMESPIHYKYMTEGKLTDEEKSLLVEALPQLAEE
SDDTYYLVYRSQQFLPNTGFNPTVGTFLFTAGLSLLVLLVSKRENGKKRLVHFLLLTSMGVQLLPASAFGLTSQILS
AYNSQLSIGVGEHLPEPLKIEGYQYIGYIKTKKQDNTELSRTVDGKYSAQRDSQPNSTKTSDVVHSADLEWNQGQGK
VSLQGEASGDDGLSEKSSIAADNLSSNDSFASQVEQNPDHKGESVVRPTVPEQGNPVSATTVQSAEEEVLATTNDRP
EYKLPLETKGTQEPGHEGEAAVREDLPVYTKPLETKGTQGPGHEGEAAVREEEPAYTEPLATKGTQEPGHEGKATVR
EETLEYTEPVATKGTQEPEHEGEAAVEEELPALEVTTRNRTEIQNIPYTTEEIQDPTLLKNRRKIERQGQAGTRTIQ
YEDYIVNGNVVETKEVSRTEVAPVNEVVKVGTLVKVKPTVEITNLTKVENKKSITVSYNLIDTTSAYVSAKTQVFHG
DKLVKEVDIENPAKEQVISGLDYYTPYTVKTHLTYNLGENNEENTETSTQDFQLEYKKIEIKDIDSVELYGKENDRY
RRYLSLSEAPTDTAKYFVKVKSDRFKEMYLPVKSITENTDGTYKVTVAVDQLVEEGTDGYKDDYTFTVAKSKAEQPG
VYTSFKQLVTAMQSNLSGVYTLASDMTADEVSLGDKQTSYLTGAFTGSLIGSDGTKSYAIYDLKKPLFDTLNGATVR
DLDIKTVSADSKENVAALAKAANSANINNVAVEGKISGAKSVAGLVASATNTVIENSSFTGKLIANHQDSNKNDTGG
IVGNITGNSSRVNKVRVDALISTNARNNNQTAGGIVGRLENGALISNSVATGEIRNGQGYSRVGGIVGSTWQNGRVN
NVVSNVDVGDGYVITGDQYAAADVKNASTSVDNRKADRFATKLSKDQIDAKVADYGITVTLDDTGQDLKRNLREVDY
TRLNKAEAERKVAYSNIEKLMPFYNKDLVVHYGNKVATTDKLYTTELLDVVPMKDDEVVTDINNKKNSINKVMLHFK
DNTVEYLDVTFKENFINSQVIEYNVTGKEYIFTPEAFVSDYTAITNNVLSDLQNVTLNSEATKKVLGAANDAALDNL
YLDRQFEEVKANIAEHLRKVLAMDKSINTTGDGVVEYVSEKIKNNKEAFMLGLTYMNRWYDINYGKMNTKDLSTYKF
DFNGNNETSTLDTIVALGNSGLDNLRASNTVGLYANKLASVKGEDSVFDFVEAYRKLFLPNKTNNEWFKENTKAYIV
EMKSDIAEVREKQESPTADRKYSLGVYDRISAPSWGHKSMLLPLLTLPEESVYISSNMSTLAFGSYERYRDSVDGVI
LSGDALRTYVRNRVDIAAKRHRDHYDIWYNLLDSASKEKLFRSVIVYDGFNVKDETGRTYWARLTDKNIGSIKEFFG
PVGKWYEYNSSAGAYANGSLTHFVLDRLLDAYGTSVYTHEMVHNSDSAIYFEGNGRREGLGAELYALGLLQSVDSVN
SHILALNTLYKAEKDDLNRLHTYNPVERFDSDEALQSYMHGSYDVMYTLDAMEAKAILAQNNDVKKKWFRKIENYYV
RDTRHNKDTHAGNKVRPLTDEEVANLTSLNSLIDNDIINRRSYDDSREYKRNGYYTISMFSPVYAALSNSKGAPGDI
MFRKIAYELLAEKGYHKGFLPYVSNQYGAEAFASGSKTFSSWHGRDVALVTDDLVFKKVFNGEYSSWADFKKAMFKQ
RIDKQDNLKPITIQYELGNPNSTKEVTITTAAQMQQLINEAAAKDITNIDRATSHTPASWVHLLKQKIYNAYLRTTD
DFRNSIYK
 
SEQ ID NO:39
MKFNPNQRYTRWSIRRLSVGVASVVVASGFFVLVGQPSSVRADGLNPTPGQVLPEETSGTKEGDLSEKPGDTVLTQA
KPEGVTGNTNSLPTPTERTEVSEETSPSSLDTLFEKDEEAQKNPELTDVLKETVDTADVDGTQASPAETTPEQVKGG
VKENTKDSIDVPAAYLEKAEGKGPFTAGVNQVIPYELFAGDGMLTRLLLKASDNAPWSDNGTAKNPALPPLEGLTKG
KYFYEVDLNGNTVGKQGQALIDQLRANGTQTYKATVKVYGNKDGKADLTNLVATKNVDININGLVAKETVQKAVADN
VKDSIDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDGMLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQY
FYQVALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKPDLDNIVATKKVTININGLISKETVQKAVADNVK
DSIDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDGMLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQYFY
QLALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKPDLDNIVATKKVTININGLISKETVQKAVADNVKDS
IDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDGMLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQYFYQV
ALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKPDLDNIVATKKVTIKINVKETSDTANGSLSPSNSGSGV
TPMNHNHATGTTDSMPADTMTSSTNTMAGENMAASANKMSDTMMSEDKAMLPNTGETQTSMASIGFLGLALAGLLGG
LGLKNKKEEN
 
SEQ ID NO:40
MKSITKKIKATLAGVAALFAVFAPSFVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVI
DGPVAPVATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLT
DSYLNGDYSAENQERVADAYVAGRYGSWTAAKNFWLNNGWY
 
SEQ ID NO:41
MKKIVLVSLAFLFVLVGCGQKKETGPATKTEKDTLQSALPVIENAEKNTVVTKTLVLPKSDDGSQQTQTITYKDKTF
LSLAIQQKRPVSDELKTYIDQHGVEETQKALLEAEEKDKSIIEARKLAGFKLETKLLSATELQTTTSFDFQVLDVKK
ASQLEHLKNIGLENLLKNEPSKYISDRLANGATEQ
 
SEQ ID NO:42
MFEVEEWLHSRIGLNFRSGLGRMQQAVDLLGNPEQSYPIIHVTGTNGKGSTIAFMRELFMGHGKKVATFTSPHIVSI
NDRICINGQPIADADFIRLTDQVKEMEKTLLQTPAQLSFFELLTLVAFLYFREQEVDLVLLEVGIGGLLDTTNVVTG
EFAVITSIGLDHQETLGDSLEAIAEQKAGIFKAGKKAVIAKLPPEARLACQKKAESLAVNLYQAGQDFLMLNGDFSS
SLLNLSQLNIGLEGVYQQENAALALQTFLLFMRERKEAVDEQAVRKALEQTHWAGRLERIRPQIYLDGAHNLPALTR
LAEFIKEKEQEGYRPQILFGSLKRKDYQGMLGYLTEKLPQVELKVTGFDYQGALDERDVTGYDIVSSYREFISDFEE
RADAQDLLFVTGSLYFISEVRGYLLDREQIN
 
SEQ ID NO:43
VGIRVYKPTTNGRRNMTSLDFAEITTSTPEKSLLVALKSKAGRNNNGRITVRHQGGGHKRFYRLVDFKRNKDNVEAV
VKTIEYDPNRSANIALVHYTDGVKAYIIAPKGLEVGQRIVSGPEADIKVGNALPLANIPVGTLIHNIELKPGRGGEL
VRAAGASAQVLGSEGKYVLVRLQSGEVRMILGTCRATVGVVGNEQHGLVNLGKAGRSRWKGIRPTVRGSVMNPNDHP
HGGGEGKAPVGRKAPSTPWGKPALGLKTRNKKAKSDKLIVRRRNEK
 
SEQ ID NO:44
MAKKSMVAREAKRQKIVDRYAEKRAALKAAGDYEGLSKLPRNASPTRLHNRCRVTGRPHSVYRKFGLSRIAFRELAH
KGQIPGVTKASW
 
SEQ ID NO:45
MDIRQVTETIAMIEEQNFDIRTITMGISLLDCIDPDINRAAEKIYQKITTKAANLVAVGDEIAAELGIPIVNKRVSV
TPISLIGAATDATDYVVLAKALDKAAKEIGVDFIGGFSALVQKGYQKGDEILINSIPRALAETDKVCSSVNIGSTKS
GINMTAVADMGRIIKETANLSDMGVAKLVVFANAVEDNPFMAGAFHGVGEADVIINVGVSGPGVVKRALEKVRGQSF
DVVAETVKKTAFKITRIGQLVGQMASERLGVEFGIVDLSLAPTPAVGDSVARVLEEMGLETVGTHGTTAALALLNDQ
VKKGGVMACNQVGGLSGAFIPVSEDEGMIAAVQNGSLNLEKLEAMTAICSVGLDMIAIPEDTPAETIAAMIADEAAI
GVINMKTTAVRIIPKGKEGDMIEFGGLLGTAPVMKVNGASSVDFISRGGQIPAPIHSFKN
 
SEQ ID NO:46
MVNTEVARTTIKTEYFGSLTERMNKYREDVLNKKPYIDAERAVLATRAYERYKEQPNVLKRAYMLKEILENMTIYIE
EESMIAGNQASSNKDAPIFPEYTLEFVLNELDLFEKRDGDVFYITEETKEQLRSIAPFWENNNLRARAGALLPEEVS
VYMETGFFGMEGKMNSGDAHLAVNYQKLLQFGLRGFEERARKAKVALDLTDPASIDKYHFYDSIFIVIDAIKVYAKR
FVALAKSLAENANPKRKKELLEIADICSRVPYEPATTFAEAIQSVWFIQCILQIESNGHSLSYGRFDQYMYPYMKAD
LESGKETEDSIVERLTNLWIKTITINKVRSQSHTFSSAGSPLYQNVTIGGQTRDKKDAVNPLSYLVLKSVAQTHLPQ
PNLTVRYHAGLDARFMNECIEVMKLGFGMPAFNNDEIIIPSFIAKGVLEDDAYDYSAIGCVETAVPGKWGYRCTGMS
YMNFPKVLLITMNDGIDPASGKRFAPSFGRFKDMKNFSELENAWDKTLRYLTRMSVIVENSIDLSLEREVPDILCSA
LTDDCIGRGKHLKEGGAVYDYISGLQVGIANLSDSLAAIKKLVFEEERISPSQLWHALETDYAGEEGKVIQEMLIHD
APKYGNDDDYADKLVTAAYDIYVDEIAKYPNTRYGRGPIGGIRYSGTSSISANVGQGRGTLATPDGRNAGTPLAEGC
SPSHNMDQHGPTSVLKSVSKLPTDEIVGGVLLNQKVNPQTLAKEEDKLKLIALLRTFFNRLHGYHIQYNVVSRETLI
DAQKHPEKHRDLIVRVAGYSAFFNVLSKATQDDIIGRTEHTL
 
SEQ ID NO:47
MSQAQYAGTGRRKNAVARVRLVPGTGKITVNKKDVEEYIPHADLRLVINQPFAVTSTVGSYDVFVNVIGGGYAGQSG
AIRHGIARALLQVDPDFRDSLKRAGLLTRDSRKVERKKPGLKKARKASQFSKR
 
SEQ ID NO:48
LEKKLTIKDIAEMAQTSKTTVSFYLNGKYEKMSQETREKIEKVIHETNYKPSIVARSLNSKRTKLIGVLIGDITNSF
SNQIVKGIEDIASQNGYQVMIGNSNYSQESEDRYIESMLLLGVDGFIIQPTSNFRKYSRIIDEKKKKMVFFDSQLYE
HRTSWVKTNNYDAVYDMTQSCIEKGYEHFLLITADTSRLSTRIERASGFVDALTDANMRHASLTIEDKHTNLEQIKE
FLQKEIDPDEKTLVFIPNCWALPLVFTVIKELNYNLPQVGLIGFDNTEWTCFSSPSVSTLVQPSFEEGQQATKILID
QIEGRNQEERQQVLDCSVNWKESTF
 
SEQ ID NO:49
MNKGLFEKRCKYSIRKFSLGVASVMIGAAFFGTSPVLADSVQSGSTANLPADLATALATAKENDGRDFEAPKVGEDQ
GSPEVTDGPKTEEELLALEKEKPAEEKPKEDKPAAAKPETPKTVTPEWQTVANKEQQGTVTIREEKGVRYNQLSSTA
QNDNAGKPALFEKKGLTVDANGNATVDLTFKDDSEKGKSRFGVFLKFKDTKNNVFVGYDKDGWFWEYKSPTTSTWYR
GSRVAAPETGSTNRLSITLKSDGQLNASNNDVNLFDTVTLPAAVNDHLKNEKKILLKAGSYDDERTVVSVKTDNQEG
VKTEDTPAEKETGPEVDDSKVTYDTIQSKVLKAVIDQAFPRVKEYSLNGHTLPGQVQQFNQVFINNHRITPEVTYKK
INETTAEYLMKLRDDAHLINAEMTVRLQVVDNQLHFDVTKIVNHNQVTPGQKIDDESKLLSSISFLGNALVSVSSNQ
TGAKFDGATMSNNTHVSGDDHIDVTNPMKDLAKGYMYGFVSTDKLAAGVWSNSQNSYGGGSNDWTRLTAYKETVGNA
NYVGIHSSEWQWEKAYKGIVFPEYTKELPSAKVVITEDANADKNVDWQDGAIAYRSIMNNPQGWEKVKDITAYRIAM
NFGSQAQNPFLMTLDGIKKINLHTDGLGQGVLLKGYGSEGHDSGHLNYADIGKRIGGVEDFKTLIEKAKKYGAHLGI
HVNASETYPESKYFNEKILRKNPDGSYSYGWNWLDQGINIDAAYDLAHGRLARWEDLKKKLGDGLDFIYVDVWGNGQ
SGDNGAWATHVLAKEINKQGWRFAIEWGHGGEYDSTFHHWAADLTYGGYTNKGINSAITRFIRNHQKDAWVGDYRSY
GGAANYPLLGGYSMKDFEGWQGRSDYNGYVTNLFAHDVMTKYFQHFTVSKWENGTPVTMTDNGSTYKWTPEMRVELV
DADNNKVVVTRKSNDVNSPQYRERTVTLNGRVIQDGSAYLTPWNWDANGKKLSTDKEKMYYFNTQAGATTWTLPSDW
AKSKVYLYKLTDQGKTEEQELTVKDGKITLDLLANQPYVLYRSKQTNPEMSWSEGMHIYDQGFNSGTLKHWTISGDA
SKAEIVKSQGANDMLRIQGNKEKVSLTQKLTGLKPNTKYAVYVGVDNRSNAKASITVNTGEKEVTTYTNKSLALNYV
KAYAHNTRRDNATVDDTSYFQNMYAFFTTGADVSNVTLTLSREAGDQATYFDEIRTFENNSSMYGDKHDTGKGTFKQ
DFENVAQGIFPFVVGGVEGVEDNRTHLSEKHNPYTQRGWNGKKVDDVIEGNWSLKTNGLVSRRNLVYQTIPQNFRFE
AGKTYRVTFEYEAGSDNTYAFVVGKGEFQSGRRGTQASNLEMHELPNTWTDSKKAKKATFLVTGAETGDTWVGIYST
GNASNTRGDSGGNANFRGYNDFMMDNLQIEEITLTGKMLTENALKNYLPTVAMTNYTKESMDALKEAVFNLSQADDD
ISVEEARAEIAKIEALKNALVQKKTALVADDFASLTAPAQAQEGLANAFDGNVSSLWHTSWNGGDVGKPATMVLKEP
TEITGLRYVPRGSGSNGNLRDVKLVVTDESGKEHTFTATDWPNNNKPKDIDFGKTIKAKKIVLTGTKTYGDGGDKYQ
SAAELIFTRPQVAETPLDLSGYEAALVKAQKLTDKDNQEEVASVQASMKYATDNHLLTERMVEYFADYLNQLKDSAT
KPDAPTVEKPEFKLRSLASEQGKTPDYKQEIARPETPEQILPATGESQSDTALILASVSLALSALFVVKTKKD
 
SEQ ID NO:50
MNKPTILRLIKYLSISFLSLVIAAIVLGGGVFFYYVSKAPSLSESKLVATTSSKIYDNKNQLIADLGSERRVNAQAN
DIPTDLVKAIVSIEDHRFFDHRGIDTIRILGAFLRNLQSNSLQGGSTLTQQLIKLTYFSTSTSDQTISRKAQEAWLA
IQLEQKATKQEILTYYINKVYMSNGNYGMQTAAQNYYGKDLNNLSLPQLALLAGMPQAPNQYDPYSHPEAAQDRRNL
VLSEMKNQGYISAEQYEKAVNTPITDGLQSLKSASNYPAYMDNYLKEVINQVEEETGYNLLTTGMDVYTNVDQEAQK
HLWDIYNTDEYVAYPDDELQVASTIVDVSNGKVIAQLGARHQSSNVSFGINQAVETNRDWGSTMKPITDYAPALEYG
VYDSTATIVHDEPYNYPGTNTPVYNWDRGYFGNITLQYALQQSRNVPAVETLNKVGLNRAKTFLNGLGIDYPSIHYS
NAISSNTTESDKKYGASSEKMAAAYAAFANGGTYYKPMYIHKVVFSDGSEKEFSNVGTRAMKETTAYMMTDMMKTVL
TYGTGRNAYLAWLPQAGKTGTSNYTDEEIENHIKTSQFVAPDELFAGYTRKYSMAVWTGYSNRLTPLVGNGLTVAAK
VYRSMMTYLSEGSNPEDWNIPEGLYRNGEFVFKNGARSTWNSPAPQQPPSTESSSSSSDSSTSQSSSTTPSTNNSTT
TNPNNNTQQSNTTPDQQNQNPQPAQP
 
SEQ ID NO:51
MSKKRRNRHKKEGQEPQFDFDEAKELTVGQAIRKNEEVESGVLPEDSILDKYVKQHRDEIEADKFATRQYKKEEFVE
TQSLDDLIQEMREAVEKSEASSEEVPSSEDILLPLPLDDEEQGLDPLLLDDENPTEMTEEVEEEQNLSRLDQEDSEK
KSKKGFILTVLALVSVIICVSAYYVYRQVARSTKEIETSQSTTANQSDVDDFNTLYDAFYTDSNKTALKNSQFDKLS
QLKTLLDKLEGSREHTLAKSKYDSLATQIKAIQDVNAQFEKPAIVDGVLDTNAKAKSDAKFTDIKTGNTELDKVLDK
AISLGKSQQTSTSSSSSSQTSSSSSSQASSNTTSEPKPSSSNETRSSRSEVNMGLSSAGVAVQRSASRVAYNQSAID
DSNNSAWDFADGVLEQILATSRSRGYITGDQYILERVNIVNGNGYYNLYKPDGTYLFTLNCKTGYFVGNGAGHADDL
DY
 
SEQ ID NO:52
MKLLKKMMQVALAVFFFGLLATNTVFANTTGGRFVDKDNRKYYVKDDHKAIYWHKIDGKTYYFGDIGEMVVGWQYLE
IPGTGYRDNLFDNQPVNEIGLQEKWYYFGQDGALLEQTDKQVLEAKTSENTGKVYGEQYPLSAEKRTYYFDNNYAVK
TGWIYEEGHWYYLNKLGNFGDDSYNPLPIGEVAKGWTQDFHVTIDIDRSKPAPWYYLDASGKMLTDWQKVNGKWYYF
GSSGSMATGWKYVRGKWYYLDNKNGDMKTGWQYLGNKWYYLRSSGAMVTGWYQDGSTWYYLDPSNGDMKIGWTKVNG
KWYYLNSNGAMVTGSQTIDGKVYNFASSGEWI
 
SEQ ID NO:53
MKILKKTMQVGLTVFFFGLLGTSTVFADDSEGWQFVQENGRTYYKKGDLKETYWRVIDGKYYYFDSLSGEMVVGWQY
IPFPSKGSTIGPYPNGIRLEGFPKSEWYYFDKNGVLQEFVGWKTLEIKTKDSVGRKYGEKREDSEDKEEKRYYTNYY
FNQNHSLETGWLYDQSNWYYLAKTEINGENYLGGERRAGWINDDSTWYYLDPTTGIMQTGWQYLGNKWYYLRSSGAM
ATGWYQEGTTWYYLDHPNGDMKTGWQNLGNKWYYLRSSGAMATGWYQDGSTWYYLNAGNGDMKTGWFQVNGNWYYAY
SSGALAVNTTVDGYSVNYNGEWVR
 
SEQ ID NO:54
MVLSKYYGVADGMNVEGRGSANFIKDNVLITAAHNYYRHDYGKEADDIYVLPAVSPSQEPFGKIKVKEVRYLKEFRN
LNSKDAREYDLALLILEEPIGAKLGTLGLPTSQKNLTGITVTITGYPSYNFKIHQMYTDKKQVLSDDGMFLDYQVDT
LEGSSGSTVYDASHRVVGVHTLGDGANQINSAVKLNERNLPFIYSVLKGYSLEGWKKINGSWYHYRQHDKQTGWQEI
NDTWYYLDSSGKMLTDWQKVNGKWYYLNSNGAMVTGSQTIDGKVYNFASSGEWI
 
SEQ ID NO:55
LMKKTFFLLVLGLFCLLPLSVFAIDFKINSYQGDLYIHADNTAEFRQKIVYQFEEDFKGQIVGLGRAGKMPSGFDID
PHPKIQAAKNGAELADVTSEVTEEADGYTVRVYNPGQEGDIVEVDLVWNLKNLLFLYDDIAELNWQPLTDSSESIEK
FEFHVRGDKGAEKLFFHTGKLFREGTIEKSNLDYTIRLDNLPAKRGVELHAYWPRTDFASARDQGLKGNRLEEFNKI
EDSIVREKDQSKQLVTWVLPSILSISLLLSVCFYFIYRRKTTPSVKYAKNHRLYEPPMELEPMVLSEAVYSTSLEEV
SPLVKGAGKFTFDQLIQATLLDVIDRGNVSIISEGDAVGLRLVKEDGLSSFEKDCLNLAFSGKKEETLSNLFADYKV
SDSLYRRAKVSDEKRIQARGLQLKSSFEEVLNQMQEGVRKRVSFWGLPDYYRPLTGGEKALQVGMGALTILPLFIGF
GLFLYSLDVHGYLYLPLPILGFLGLVLSVFYYWKLRLDNRDGVLNEAGAEVYYLWTSFENMLREIARLDQAELESIV
VWNRLLVYATLFGYADKVSHLMKVHQIQVENPDINLYVAYGWHSTFYHSTAQMSHYASVANTASTYSVSSGSGSSGG
GFSGGGGGGSIGAF
 
SEQ ID NO:56
MKSINKFLTMLAALLLTASSLFSAATVFAAGTTTTSVTVHKLLATDGDMDKIANELETGNYAGNKVGVLPANAKEIA
GVMFVWTNTNNEIIDENGQTLGVNIDPQTFKLSGAMPATAMKKLTEAEGAKFNTANLPAAKYKIYEIHSLSTYVGED
GATLTGSKAVPIEIELPLNDVVDAHVYPKNTEAKPKIDKDFKGKANPDTPRVDKDTPVNHQVGDVVEYEIVTKIPAL
ANYATANWSDRMTEGLAFNKGTVKVTVDDVALEAGDYALTEVATGFDLKLTDAGLAKVNDQNAEKTVKITYSATLND
KAIVEVPESNDVTFNYGNNPDHGNTPKPNKPNENGDLTLTKTWVDATGAPIPAGAEATFDLVNAQTGKVVQTVTLTT
DKNTVTVNGLDKNTEYKFVERSIKGYSADYQEITTAGEIAVKNWKDENPKPLDPTEPKVVTYGKKFVKVNDKDNRLA
GAEFVIANADNAGQYLARKADKVSQEEKQLVVTTKDALDRAVAAYNALTAQQQTQQEKEKVDKAQAAYNAAVIAANN
AFEWVADKDNENVVKLVSDAQGRFEITGLLAGTYYLEETKQPAGYALLTSRQKFEVTATSYSATGQGIEYTAGSGKD
DATKVVNKKITIPQTGGIGTIIFAVAGAAIMGIAVYAYVKNNKDEDQLA
 
SEQ ID NO:57
MAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDERMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLE
IHERMGHVEIPVIDVDLPVYAGTAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYV
HNIKEVMAYQVDQVKVIEPTNFDDLLIVPGHDYVTLLTCTPYMINTHRLLVRGHRIPYVAEVEEEFIAANKLSHLYR
YLFYVAVGLIVILLWIIRRLRKKKKQPEKALKALKAARKEVKVEDGQQ
 
SEQ ID NO:58
MSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSLAYNQRLASQNRIVDPFL
AEGYEVNYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGMGLAHVDGTPLPLDGTGIRSVIAGHRAEPSHVFFR
HLDQLKVGDALYYDNGQEIVEYQMMDTEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDP
QTAAVARVAFTKEGQSVSRVATSQWLYRGLVVLAFLGILFVLWKLARLLRGK
 
SEQ ID NO:59
MKNPFFERRCRYSIRKLSVGACSLMIGAVLFAGPALAEETAVPENSGANTELVSGESEHSTNEADKQNEGEHARENK
LEKAEGVAIASETASPASNEAATTETAEAASAAKPEEKASEVVAETPSAEAKPKSDKETEAKPEATNQGDESKPAAE
ANKTEKEVQPDVPKNTEKTLKPKEIKFNSWEELLKWEPGAREDDAINRGSVVLASRRTGHLVNEKASKEAKVQALSN
TNSKAKDHASVGGEEFKAYAFDYWQYLDSMVFWEGLVPTPDVIDAGHRNGVPVYGTLFFNWSNSIADQERFAEALKQ
DADGSFPIARKLVDMAKYYGYDGYFINQETTGDLVKPLGEKMRQFMLYSKEYAAKVNHPIKYSWYDAMTYNYGRYHQ
DGLGEYNYQFMQPEGDKVPADNFFANFNWDKAKNDYTIATANWIGRNPYDVFAGLELQQGGSYKTKVKWNDILDENG
KLRLSLGLFAPDTITSLGKTGEDYHKNEDIFFTGYQGDPTGQKPGDKDWYGIANLVADRTPAVGNTFTTSFNTGHGK
KWFVDGKVSKDSEWNYRSVSGVLPTWRWWQTSTGEKLRAEYDFTDAYNGGNSLKFSGDVAGKTDQDVRLYSTKLEVT
EKTKLRVAHKGGKGSKVYMAFSTTPDYKFDDADAWKELTLSDNWTNEEFDLSSLAGKTIYAVKLFFEHEGAVKDYQF
NLGQLTISDNHQEPQSPTSFSVVKQSLKNAQEAEAVVQFKGNKDADFYEVYEKDGDSWKLLTGSSSTTIYLPKVSRS
ASAQGTTQELKVVAVGKNGVRSEAATTTFDWGMTVKDTSLPKPLAENIVPGATVIDSTFPKTEGGEGIEGMLNGTIT
SLSDKWSSAQLSGSVDIRLTKPRTVVRWVMDHAGAGGESVNDGLMNTKDFDLYYKDADGEWKLAKEVRGNKAHVTDI
TLDKPITAQDWRLNVVTSDNGTPWKAIRIYNWKMYEKLDTESVNIPMAKAAARSLGNNKVQVGFADVPAGATITVYD
NPNSQTPLATLKSEVGGDLASAPLDLTNQSGLLYYRTQLPGKEISNVLAVSVPKDDRRIKSVSLETGPKKTSYAEGE
DLDLRGGVLRVQYEGGTEDELIRLTHAGVSVSGFDTHHKGEQNLTLQYLGQPVNANLSVTVTGQDEASPKTILGIEV
SQEPKKDYLVGDSLDLSEGRFAVAYSNDTMEEHSFTDEGVEISGYDAQKTGRQTLTLHYQGHEVSFDVLVSPKAALN
DEYLKQKLAEVEAAKNKVVYNFASSEVKEAFLKAIEAAEQVLKDHETSTQDQVNDRLNKLTEAHKALNGQEKFTEEK
TELDRLTGEVQELLAAKPNHPSGSALAPLLEKNKALVEKVDLSPEELTTAKQSLKDLVALLKEDKPAVFSDSKTGVE
VHFSNKEKTVIKGLKVERVQASAEEKKYFAGEDAHVFEIEGLDEKGQDVDLSYASIVKIPIEKDKKVKKVFFLPEGK
EAVELAFEQTDSHVIFTAPHFTHYAFVYESAEKPQPAKPAPQNTVLPKPTYQPTSDQQKAPKLEVQEEKVAFHRQEH
ENTEMLVGEQRVIIQGRDGLLRHVFEVDENGQRRLRSTEVIQEAIPEIVEIGTKVKTVPAVVATQEKPAQNTAVKSE
EASKQLPNTGTADANEALIAGLASLGLASLALTLRRKREDKD
 
SEQ ID NO:60
MSITSFVKRIQDITRNDAGVNGDAQRIEQMSWLLFLKIYDSREMVWELEEDEYESIIPEELKWRNWAHAQNGERVLT
GDELLDFVNNKLFKELKELEITSNMPIRKTIVKSAFEDANNYMKNGVLLRQVINVIDEVDFNSPEDRHSFNDIYEKI
LKDIQNAGNSGEFYTPRAATDFIAEVLDPKLGESMADLACGTGGFLTSTLNRLSSQRKTSEDTKKYNTAVFGIEKKA
FPHLLAVTNLFLHEIDDPKIVHGNTLEKNVREYTDDEKFDIIMMNPPFGGSELETIKNNFPAELRSSETADLFMAVI
MYRLKENGRVGVILPDGFLFGEGVKTRLKQKLVDEFNLHTIIRLPHSVFAPYTGIHTNILFFDKTKKTEETWFYRLD
MPDGYKNFSKTKPMKSEHFNPVRDWWENREEILEGKFYKSKSFTPSELAELNYNLDQCDFPKEEEEILNPFELIQNY
QAERATLNHKIDNVLADILQLLEDK
 
SEQ ID NO:61
MNNTEFYDRLGVSKNASADEIKKAYRKLSKKYHPDINKEPGAEDKYKEVQEAYETLSDDQKRAAYDQYGAAGANGGF
GGAGGFGGFNGAGGFGGFEDIFSSFFGGGGSSRNPNAPRQGDDLQYRVNLTFEEAIFGTEKEVKYHREAGCRTCNGS
GAKPGTSPVTCGRCHGAGVINVDTQTPLGMMRRQVTCDVCHGRGKEIKYPCTTCHGTGHEKQAHSVHVKIPAGVETG
QQIRLAGQGEAGFNGGPYGDLYVVVSVEASDKFEREGTTIFYNLNLNFVQAALGDTVDIPTVHGDVELVIPEGTQTG
KKFRLRSKGAPSLRGGAVGDQYVTVNVVTPTGLNDRQKVALKEFAAAGDLKVNPKKKGFFDHIKDAFDGE
 
SEQ ID NO:62
MNPNLFRSVEFYQRRYHNYATVLIIPLSLLFTFILIFSLVATKEITVTSQGEIAPTSVIASIQSTSDNPILANHLVA
NQVVEKGDLLIKYSETMEESQKTALATQLQRLEKQKEGLGILKQSLEKATDLFSGEDEFGYHNTFMNFTKQSHDIEL
GITKTNTEVSNQANLSNSSSSAIEQEITKVQQQIGEYQELRDAIINNRARLPTGNPHQSILNRYLVASQGQTQGTAE
EPFLSQINQSIAGLESSIASLKIQQAGIGSVATYDNSLATKIEVLRTQFLQTASQQQLTVENQLTELKVQLDQATQR
LENNTLTSPSKGIVHLNSEFEGKNRIPTGTEIAQIFPVITDTREVLITYYVSSDYLPLLDKGQTVRLKLEKIGNHGT
TIIGQLQTIDQTPTRTEQGNLFKLTALAKLSNEDSKLIQYGLQGRVTSVTTKKTYFDYFKDKILTHSD
 
SEQ ID NO:63
MSKKLNRKKQLRNGLRRAGAFSSTVTKVVDETKKVVKRAEQSASAAGKAVSKKVEQAVEATKEQAQKVANSVEDFAA
NLGGLPLDRAKTFYDEGIKSASDFKNWTEKELLALKGIGPATIKKLKENGIKFK
 
SEQ ID NO:64
LISLFGLAAAKPVQADTSIADIQKRGELVVGVKQDVPNFGYKDPKTGTYSGIETDLAKMVADELKVKIRYVPVTAQT
RGPLLDNEQVDMDIATFTITDERKKLYNFTSPYYTDASGFLVNKSAKIKKIEDLNGKTIGVAQGSITQRLITELGKK
KGLKFKFVELGSYPELITSLHAHRIDTFSVDRSILSGYTSKRTALLDDSFKPSDYGIVTKKSNTELNDYLDNLVTKW
SKDGSLQKLYDRYKLKPSSHTAD
 
SEQ ID NO:65
MSNISLTTLGGVRENGKNMYIAEIGESIFVLNVGLKYPENEQLGVDVVIPNMDYLFENSDRIAGVFLTHGHADAIGA
LPYLLAEAKVPVFGSELTIELAKLFVKGNDAVKKFNDFHVIDENTEIDFGGTVVSFFPTTYSVPESLGIVLKTSEGS
IVYTGDFKFDQTASESYATDFARLAEIGRDGVLALLSDSANADSNIQVASESEVRDEITQTIADWEGRIIVAAVSSN
LSRIQQIFDAADKTGRRIVLTGFDIENIVRTAIRLKKLSLANEILLIKPKDMSRFEDHELIILETGRMGEPINGLRK
MSIGRHRYVEIKDGDLVYIATAPSIAKEAFVARVENMIYQAGGVVKLITQSLHVSGHGNVRDLQLMINLLQPKYLFP
VQGEYRELDAHAKAAMAVGMLPERIFIPKKGTTMAYENGDFVPAGSVSAGDILIDGNAIGDVGNVVLRDRKVLSEDG
IFIVAITVNRREKKIVARARVHTRGFVYLKKSRDILRESSELINQTVEEYLQGDDFDWADLKGKVRDNLTKYLFDQT
KRRPAILPVVMEAK
 
SEQ ID NO:66
MGKGHWNRKRVYSIRKFAVGACSVMIGTCAVLLGGNIAGESVVYADETLITHTAEKPKEEKMIVEEKADKALETKNI
VERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDF
NQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRL
TFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVH
VEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILE
VERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENY
KAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWS
DFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADE
LDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASW
TFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNW
ENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAI
ARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNG
EQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTI
IGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSV
DKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTG
LTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVE
KADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQAN
TEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSV
EGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQ
TEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDN
LSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVET
YAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLA
TVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETK
DLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVD
YLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTY
YSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQE
STQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTK
EKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVP
TDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQLPSTGSAASQAAVAAGLTLLGLSAGLVVTKGKKED
 
SEQ ID NO:67
MNKRLFSKMSLVTLPILALFSQSVLAEENIHFSSCKEAWANGYSDIHEGEPGYSAKLDRDHDGVACELKNAPKGAFK
AKQSTAIQINTSSATTSGWVKQDGAWYYFDGNGNLVKNAWQGSYYLKADGKMAQSEWIYDSSYQAWYYLKSDGSYAK
NAWQGAYYLKSNGKMAQGEWVYDSSYQAWYYLKSDGSYARNAWQGNYYLKSDGKMAKGEWVYDATYQAWYYLTSDGS
YAYSTWQGNYYLKSDGKMAVNEWVDGGRYYVGADGVWKEVQASTASSSNDSNSEYSAALGKAKSYNSLFHMSKKRMY
RQLTSDFDKFSNDAAQYAIDHLDD
SEQ ID NO:68
MKVIDQFKNKKVLVLGLAKSGESAARLLDKLGAIVTVNDGKPFEDNPAAQSLLEEGIKVITGGHPLELLDEEFALMV
KNPGIPYNNPMIEKALAKGIPVLTEVELAYLISEAPIIGITGSNGKTTTTTMIGEVLTAAGQHGLLSGNIGYPASQV
AQIASDKDTLVMELSSFQLMGVQEFHPEIAVITNLMPTHIDYHGSFSEYVAAKWNIQNKMTAADFLVLNFNQDLAKD
LTSKTEATVVPFSTLEKVDGAYLEDGQLYFRGEVVMAANEIGVPGSHNVENALATIAVAKLRDVDNQTIKETLSAFG
GVKHRLQFVDDIKGVKFYNDSKSTNILATQKALSGFDNSKVVLIAGGLDRGNEFDELVPDITGLKKMVILGQSAERV
KRAADKAGVAYVEATDIADATRKAYELATQGDVVLLSPANASWDMYANFEVRGDLFIDTVAELKE
 
SEQ ID NO:69
MKKKFALSFVALASVALLAACGEVKSGAVNTAGNSVEEKTIKIGFNFEESGSLAAYGTAEQKGAQLAVDEINAAGGI
DGKQIEVVDKDNKSETAEAASVTTNLVTQSKVSAVVGPATSGATAAAVANATKAGVPLISPSATQDGLTKGQDYLFI
GTFQDSFQGKIISNYVSEKLNAKKVVLYTDNASDYAKGIAKSFRESYKGEIVADETFVAGDTDFQAALTKMKGKDFD
AIVVPGYYNEAGKIVNQARGMGIDKPIVGGDGFNGEEFVQQATAEKASNIYFISGFSTTVEVSAKAKAFLDAYRAKY
NEEPSTFAALAYDSVHLVANAAKGAKNSGEIKNNLAKTKDFEGVTGQTSFDADHNTVKTAYMMTMNNGKVEAAEVVK
P
 
SEQ ID NO:70
MSILEVKNLSHGFGDRAIFEDVSFRLLKGEHIGLVGANGEGKSTFMSIVTGKMLPDEGKVEWSKYVTAGYLDQHSVL
AERQSVRDVLRTAFDELFKAEARINDLYMKMAEDGADVDALMEEVGELQDRLESRDFYTLDAKIDEVARALGVMDFG
MDTDVTSLSGGQRTKVLLAKLLLEKPDILLLDEPTNYLDAEHIDWLKRYLQNYENAFVLISHDIPFLNDVINIVYHV
ENQQLTRYSGDYYQFQEVYAMKKSQLEAAYERQQKEIADLKDFVARNKARVATRNMAMSRQKKLDKMDIIELQSEKP
KPSFDFKPARTPGRFIFQAKNLQIGYDRPLTKPLNLTFERNQKVAIIGANGIGKTTLLKSLLGIISPIAGEVERGDY
LELGYFEQEVEGGNRQTPLEAVWNAFPALNQAEVRAALARCGLTTKHIESQIQVLSGGEQAKVRFCLLMNRENNVLV
LDEPTNHLDVDAKDELKRALKEYRGSILMVCHEPDFYEGWIDQIWDFNNLT
 
SEQ ID NO:71
MKKKNGKAKKWQLYAAIGAASVVVLGAGGILLFRQPSQTALKDEPTHLVVAKEGSVASSVLLSGTVTAKNEQYVYFD
ASKGDLDEILVSVGDKVSEGQALVKYSSSEAQAAYDSASRAVARADRHINELNQARNEAASAPAPQLPAPVGGEDAT
VQSPTPVAGNSVASIDAQLGDARDARADAAAQLSKAQSQLDATTVLSTLEGTVVEVNSNVSKSPTGASQVMVHIVSN
ENLQVKGELSEYNLANLSVGQEVSFTSKVYPDKKWTGKLSYISDYPKNNGEAASPAAGNNTGSKYPYTIDVTGEVGD
LKQGFSVNIEVKSKTKAILVPVSSLVMDDSKNYVWIVDEQQKAKKVEVSLGNADAENQEITSGLTNGAKVISNPTSS
LEEGKEVKADEATN
 
SEQ ID NO:72
SETNHEIDSNFAGRLNILRAGVLDANDGIISIAGVVIGVASATTNIWIIFLSGFTAILAGAFSMAGGEYVSVSTPKD
TEEAAVSREKLLLDQDRELAKKSLYAAYIQNGEFKTSAQLLTNKIFLKNPLKALVEEKYGIEYEEFTNPWHAAISSF
VAFFLRSLPPMLSVTIFPSDYRIPATVLIVGVALLLTGYTSARLGKAPTKTAMIRNLAIGLLTMGVTFLLGQLFSI
 
SEQ ID NO:73
MKKKLTSLALVGAFLGLSWYGNVQAQESSGNKIHFINVQEGGSDAIILESNGHFAMVDTGEDYDFPDGSDSRYPWRE
GIETSYKHVLTDRVFRRLKELGVQKLDFILVTHTHSDHIGNVDELLSTYPVDRVYLKKYSDSRITNSERLWDNLYGY
DKVLQTAAEKGVSVIQNITQGDAHFQFGDMDIQLYNYENETDSSGELKKIWDDNSNSLISVVKVNGKKIYLGGDLDN
VHGAEDKYGPLIGKVDLMKFNHHHDTNKSNTKDFIKNLSPSLIVQTSDSLPWKNGVDSEYVNWLKERGIERINAASK
DYDATVFDIRKDGFVNISTSYKPIPSFQAGWHKSAYGNWWYQAPDSTGEYAVGWNEIEGEWYYFNQTGILLQNQWKK
WNNHWFYLTDSGASAKNWKKIAGIWYYFNKENQMEIGWIQDKEQWYYLDVDGSMKTGWLQYMGQWYYFAPSGEMKMG
WVKDKETWYYMDSTGVMKTGEIEVAGQHYYLEDSGAMKQGWHKKANDWYFYKTDGSRAVGWIKDKDKWYFLKENGQL
LVNGKTPEGYTVDSSGAWLVDVSIEKSATIKTTSHSEIKESKEVVKKDLENKETSQHESVTNFSTSQDLTSSTSQSS
ETSVNKSESEQ
 
SEQ ID NO:74
MDLGPTQRGISVVSQSYINVIGAGLAGSEAAYQIAERGIPVKLYEMRGVKSTPQHKTDNFAELVCSNSLRGDALTNA
VGLLKEEMRRLGSVILESAEATRVPAGGALAVDRDGFSQMVTEKVANHPLIEVVRDEITELPTDVITVIATGPLTSD
ALAEKIHALNDGAGFYFYDAAAPIIDVNTIDMSKVYLKSRYDKGEAAYLNAPMTKQEFMDFHEALVNAEEAPLSSFE
KEKYFEGCMPIEVMAKRGIKTMLYGPMKPVGLEYPDDYTGPRDGEFKTPYAVVQLRQDNAAGSLYNIVGFQTHLKWG
EQKRVFQMIPGLENAEFVRYGVMHRNSYMDSPNLLEQTYRSKKQPNLFFAGQMTGVEGYVESAASGLVAGINAARLF
KEESEAIFPETTAIGSLAHYITHADSKHFQPMNVNFGIIKELEGERIRDKKARYEKIAERALADLEEFLTV
 
SEQ ID NO:75
MLIGIPKEIKNNENRVALTPAGVHSLVSRGHRVLIETNAGLGSGFTDADYQKQGAEIVATAGEAWAAELVVKVKESL
SSEYGYLRDDLLLFTYLHMAAAPELADAMLTAKTTETVRDNQGQLPLLVPMSEVAGRMAVQIGAHFLTKQAGGSGVL
LGGVPGVPKGKVTIIGGGVVGTHAARIALGLGAQVTILDISSKRLSVLEEVFGSQIQTLMSNSFNIEASVRDADVVI
                                         13/42
 
GAILIPGAKAPELVTDEMVKQMRPGSVSLTLLLTKVALSKQLTVQRTMNPSMKNTVFSTMPLPISLVRLLALQPSPP
MSLFLISKLWLAKDSHKQSLKMKACVKVLLIKVTLTYQLLKDLIVTTLISMI
 
SEQ ID NO:76
MKILFVAAEGAPFSKTGGLGDVIGALPKSLVKAGHEVAVILPYYDMVEAKFGNQIEDVLHFEVSVGWRRQYCGIKKT
VLNGVTFYFIDNQYYFFRGHVYGDFDDGERFAFFQLAAIEAMERIDFIPDLLHVHDYHTAMIPFLLKEKYRWIQAYE
DIETVLTIHNLEFQGQFSEGMLGDLFGVGFERYADGTLRWNNCLNWMKAGILYANRVSTVSPSYAHEIMTSQFGCNL
DQILKMESGKVSGIVNGIDADLYNPQTDALLDYHFNQEDLSGKAKNKAKLQERVGLPVRADVPLVGIVSRLTRQKGF
DVVVESLHHILQEDVQIVLLGTGDPAFEGAFSWFAQIYPDKLSTNITFDVKLAQEIYAACDLFLMPSRFEPCGLSQM
MAMRYGTLPLVHEVGGLRDTVRAFNPIEGSGTGFSFDNLSPYWLNWTFQTALDLYRNHPDIWRNLQKQAMESDFSWD
TACKSYLDLYHSLVN
 
SEQ ID NO:77
MEKYFGEKQERFSFRKLSVGLVSATISSLFFMSVLASSSVDAQETAGVHYKYVADSELSSEEKKQLVYDIPTYVEND
DETYYLVYKLNSQNQLAELPNTGSKNERQALVAGASLAAMGILIFAVSKKKVKNKTVLHLVLVAGIGNGVLVSVHAL
ENHLLLNYNTDYELTSGEKLPLPKEISGYTYIGYIKEGKTTSESEVSNQKSSVATPTKQQKVDYNVTPNFVDHPSTV
QAIQEQTPVSSTKPTEVQVVEKPFSTELINPRKEEKQSSDSQEQLAEHKNLETKKEEKISPKEKTGVNTLNPQDEVL
SGQLNKPELLYREETMETKIDFQEEIQENPDLAEGTVRVKQEGKLGKKVEIVRIFSVNKEEVSREIVSTSTTAPSPR
IVEKGTKKTQVIKEQPETGVEHKDVQSGAIVEPAIQPELPEAVVSDKGEPEVQPTLPEAVVTDKGETEVQPESPDTV
VSDKGEPEQVAPLPEYKGNIEQVKPETPVEKTKEQGPEKTEEVPVKPTEETPVNPNEGTTEGTSIQEAENPVQPAEE
STTNSEKVSPDTSSKNTGEVSSNPSDSTTSVGESNKPEHNDSKNENSEKTVEEVPVNPNEGTVEGTSNQETEKPVQP
AEETQTNSGKIANENTGEVSNKPSDSKPPVEESNQPEKNGTATKPENSGNTTSENGQTEPEPSNGNSTEDVSTESNT
SNSNGNEEIKQENELDPDKKVEEPEKTLELRNVSDLELYSLSNGTYKQHISLEQVPSNPNSYFVKVKSSSFKDVYLP
VASISEERKNDKILYKITAKVEKLQQEIESRYKDNFTFYLAKKGTEETTNFTSFSNLVKAINQNPSGTYHLAASLNA
NEVELGPDERSYIKDTFTGRLIGEKDGKNYAIYNLKKPLFENLSGATVEKLSLKNVAISGKDDIGSLANEAQNNTKI
KQVHVDGVLAGERGIGGLLAKAEQSSITESSFKGRIINTYETTAAYNIGGMVGHLTGDKALLTKSKATVAISSNTNT
SDQTVGGLAGLVDRDAQIQDSYAEGDINNVKHFGRVAGVAGNLWDRTSGDVRHAGSLTNVLSDVNVTNGNAITGYHY
NEMKVKDTFSSKANRVYNVTLVKDEVVSKESFEERGTMLDASQIASKKAEINPLILPTVEPLSTSGKKDSDFSKVAY
YQAKRNLTYKNIEKLLPFYNKATIVKYGNLVNENSLLYQKELLSAVMMKDNQVITDIVSNKQTANKLLLHYKDDLSE
KLDLKYQNDFAKLAEYSLGNTGLLYTPNQFLYDQTSIIKQVLPDLQKVDYHSEAIRKTLGISPNVKQTELYLEDQFA
KTKQQLEDSLKKLLSADAGLASANPVTEGYLVDKIKRNKEALLLGLTYLERWYNFSYGQVNVKDLVLYHLDFFGKGN
ASPLDTLIELGKSGFNNLLAKNNVDTYGISLASQHGTTDLFSTLEHYRKVFLPNTSNNDWFKSETKAYIVEEKSTIE
EVKTKQGLAGTKYSIGVYDRITSATWKYRNMVLPLLTLPERSVFVISTMSSLGFGAYDRYRSSDHKAGKALNDFVEE
NARETAKRQRDHYDYWYRILDDNAREKLYRNILLYDAYKFGDDNTVGKATEVADFDNPNPAMQHFFGPVGNKVGHNQ
HGAYATGDAVYYMGYRMLDKDGAITYTHEMTHDSDQDIYLGGYGRRSGLGPEFFAKGLLQAPDHPDDATITINSILK
HSKSDSTESRRLQVLDPTTRFNNADDLKQYVHNMFDVVYMLEYLEGNSILKLDTNQKQQLLRKVTNEYHPDPDGNKV
YATNVVRNLTVEEVERLRSFNDLIDNNILSSREYASGKYERNGYFTIKLFAPIYAALSNDIGTPGDLMGRRIAYELL
AAKGFKDGMVPYISNQYEEEAKQKGKTINLYGKTRGLVTDDLVLEKVFNNQYHTWSEFKKAMYQERQDQFDRLNKVT
FNDTTQPWQTFAKKTTSSVDELQKLMDVAVRKDAEHNYYHWNNYNPDIDSEVHKLKRAIFKAYLDQTNDFRSSIFEN
KK
 
SEQ ID NO:78
MPVEIKTTKEIHPKIYAYTTPTVTSNEGWIKIGYTERDVTQRIKEQTHTAHIATDVLWTGDAAYTEEPDKGKTFKDH
DFHHFLSFHDVERRPKTEWFYFNGTPEKSKNLFDKFVQHDLSGYQPGKGQDYTLRQEQEEAVAKTLAYFQEHAGGKF
LWNAKPRFGKTLSTYDLARRMEAVNVLIVTNRPAIANSWYDDFETFIAGQTTYKFVSESDSLKSRPILSRQEFLGIL
ADDVRQLAFISLQDLKGSVYLGGEHDKLKWVTDLHWDLLVIDEAHEGVDTFKTDQAFNKIRRNFTLHLSGTSFKALA
KGDFTEEQIYNWSYADEQAAKYSWSLEQEEENPYESLPQLNLFTYQMSQMIGEKLEKGAQIDGENIDYVFDLSEFFA
TDDKGKFIHEHDVRNWLDTLSSNEKYPFSTKELRNELKHTFWLLERVASAKALKALLEEHPIYENYEIVLAAGDGRM
SEEDDKVKLKSLDLVRKAIAENDKTITLSVGQLTTGVTIPEWTGVLMLSNLKSPALYMQAAFRAQNPYSWSDNKGNH
FRKERAYVFDFAPERTLILFDEFANNLLLVTAAGRGTSATREENIRELLNFFPIIAEDRAGKMVEIDAKAVLTTPRQ
IKAREVLKRGFMSNLLFDNISGIFQASQTVLDILNELPVEKEGKVQDSSDLLDFSDVTVDDEGNAVVDHEIVVNQQM
RLFGEKVYGLGESVAELVTKDEERTQKQLVNDLSKTVSSVIVEELKADYSLKTRETEQIKKQITATLENEIRKNDIE
RKISEAHIKQELQQQLKEANDKAQKDKIQEDLEKRLEENKLIHKEKLEQTLKKEVEKMPEKFIEQVEIKRVEQLKQS
AQDEIRDHLRGFARTIPSFIMAYGDQTLTLDNFDAFVPEHVFYEVTGITIDQFRYLRDGGQDFAGHLFDKATFDEAI
QEFLRKKKELADYFKDQKEDIFDYIPPQKTNQIFTPKRVVKRMVDDLEKENPGIFDDPSKTFIDLYMKSGLYIAELV
KRLYNSNGLKEAFPNPEERLKHILEKQVYGFAPSEIIYNISTNFIFGNLSKDISRKNFVLADTIPAAKEGSIQKLVD
SYFENN
 
SEQ ID NO:79
MKKILIVDDEKPISDIIKFNMTKEGYEVVTAFNGREALEQFEAEQPDIIILDLMLPEIDGLEVAKTIRKTSSVPILM
LSAKDSEFDKVIGLELGADDYVTKPFSNRELQARVKALLRRSQPMPVDGQEADSKPQPIQIGDLEIVPDAYVAKKYG
EELDLTHREFELLYHLASHTGQVITREHLLETVWGYDYFGDVRTVDVTVRRLREKIEDTPSRPEYILTRRGVGYYMR
NNA
SEQ ID NO:80
MKKKFLAFLLILFPIFSLGIAKAETIKIVSDTAYAPFEFKDSDQTYKGIDVDIINKVAEIKGWNIQMSYPGFDAAVN
AVQAGQADAIMAGMTKTKEREKVFTMSDTYYDTKVVIATTKSHKISKYDQLTGKTVGVKNGTAAQRFLETIKDKYGF
TIKTFDTGDLMNNSLSAGAIDAMMDDKPVIEYAINQGQDLHIEMDGEAVGSFAFGVKKGSKYEHLVTEFNQALSEMK
KDGSLDKIIKKWTASSSSAVPTTTTLAGLKAIPVKAKYIIASDSSFAPFVFQNSSNQYTGIDMELIKAIAKDQGFEI
EITNPGFDAAISAVQAGQADGIIAGMSVTDARKATFDFSESYYTANTILGVKESSNIASYEDLKGKTVGVKNGTASQ
TFLTENQSKYGYKIKTFADGSSMYDSLNTGAIDAVMDDEPVLKYSISQGQKLKTPISGTPIGETAFAVKKGANPELI
EMFNNGLANLKANGEFQKILDKYLASESSTASTSTVDETTLWGLLQNNYKQLLSGLGITLALALISFAIAIVIGIIF
GMFSVSPYKSLRVISEIFVDVIRGIPLMILAAFIFWGIPNFIESITGQQSPINDFVAGTIALSLNAAAYIAEIVRGG
IQAVPVGQMEASRSLGISYGKTMRKIILPQAIKLMLPNFVNQFVIALKDTTIVSAIGLVELFQTGKIIIARNYQSFK
MYAILAIFYLVIITLLTRLAKRLEKRIR
 
SEQ ID NO:81
MAFESLTERLQNVFKNLRKKGKISESDVQEATKEIRLALLEADVALPVVKDFIKKVRERAVGHEVIDTLNPAQQIIK
IVDEELTAVLGSDTAEIIKSPKIPTIIMMVGLQGAGKTTFAGKLANKLKKEENARPLMIAADIYRPAAIDQLKTLGQ
QIDVPVFALGTEVPAVEIVRQGLEQAQTNHNDYVLIDTAGRLQIDELLMNELRDVKALAQPNEILLVVDAMIGQEAA
NVAREFNAQLEVTGVILTKIDGDTRGGAALSVRHITGKPIKFTGTGEKITDIETFHPDRMSSRILGMGDMLTLIEKA
SQEYDEQKALEMAEKMRENTFDFNDFIDQLDQVQNMGPMEDLLKMIPGMANNPALQNMKVDERQIARKRAIVSSMTP
EERENPDLLNPSRRRRIAAGSGNTFVEVNKFIKDFNQAKQLMQGVMSGDMNKMMKQMGINPNNLPKNMPNMGGMDMS
ALEGMMGQGGMPDLSALGGAGMPDMSQMFGGGLKGKIGEFAMKQSMKRMANKMKKAKKKRK
 
SEQ ID NO:82
MSQIWTKEKFISQVQGGVIVSCQALPGEALYNEEFSLMPFMAKAALEAGAVGIRANSVRDIKAIQKVVDLPIIGIIK
RDYPPQEPYITATMKEVDELVECGTTVIAFDATLRPRYDGLVVSEFIKKIKEKYPNQLLMADVSNLDEGLYAFKSGV
DFVGTTLSGYTSTSVQSDEPDFELMKKLADFNIPVIAEGKIHYPEQLKKAYSLGVTSVVIGGAITRPKEIAQRFINV
IK
 
SEQ ID NO:83
MRYLTAGESHGPRLTAIIEGIPAGLPLTAEDINEDLRRRQGGYGRGGRMKIENDQVVFTSGVRHGKTTGAPITMDVI
NKDHQKWLDIMSAEDIEDRLKSKRKITHPRPGHADLVGGIKYRFDDLRNSLERSSARETTMRVAVGAVAKRLLAELD
MEIANHVVVFGGKEIDVPENLTVAEIKQRAAQSEVSIVNQEREQEIKDYIDQIKRDGDTIGGVVETVVGGVPVGLGS
YVQWDRKLDARLAQAVVSINAFKGVEFGLGFEAGYRKGSQVMDEILWSKEDGYTRRTNNLGGFEGGMTNGQPIVVRG
VMKPIPTLYKPLMSVDIETHEPYKATVERSDPTALPAAGMVMEAVVATVLAQEILEKFSSDNLEELKEAVAKHRDYT
KNY
 
SEQ ID NO:84
MVVMNRIRVSKRVEKKLAKGLVLLEASDLENVNLKDQEVEVQGQEGNFLGTAYLSQQNKGLGWFISKDKVAFNQAFF
ETLFRKAKEKRNAYYQDDLTTAFRLFNQEGDGFGGLTVDLYGDYAVFSWYNSYVYQIRQTISEAFRQVFPEVLGAYE
KIRFKGLDYESAHVYGQEAPDFFNVLENGVLYQVFMNDGLMTGIFLDQHEVRGSLVDGLAMGKSLLNMFSYTAAFSV
AAAMGGASHTTSVDLAKRSRELSQAHFQANGLSTDEHRFIVMDVFEYFKYAKRKDLTYDVIVLDPPSFARNKKQTFS
VAKDYHKLISQSLEILNPGGIIIASTNAANVSRQKFTEQIDKGFAGRSYQILNKYGLPADFAYNKKDESSNYLKVIS
MKVSK
 
SEQ ID NO:85
MTKTLKRPEVLSPAGTLEKLKVAVQYGADAVFIGGQAYGLRSRAGNFTFEQMEEGVQFAAKYGAKVYVAANMVMHEG
NEAGAGEWFRKLRDIGIAAVIVSDPALIMIAVTEAPGLEIHLSTQASATNYETLEFWKELGLTRVVLAREVSMEELA
EIRKRTDVEIEAFVHGAMCISYSGRCTLSNHMSMRDANRGGCSQSCRWKYDLYDMPFGKERKSLQGEIPEEFSMSAV
DMSMIDHIPDMIENGVDSLKIEGRMKSIHYVSTVTNCYKAAVDAYLESPEKFEAIKQDLVDEMWKVAQRELATGFYY
GTPSENEQLFGARRKIPEYKFVAEVVSYDDAAQTATIRQRNVINEGDQVEFYGPGFRHFETYIEDLHDAKGNKIDRA
PNPMELLTIKVPQPVQSGDMVRALKEGLINLYKEDGTSVTVRA
 
SEQ ID NO:86
MNTYQLNNGVEIPVLGFGTFKAKDGEEAYRAVLEALKAGYRHIDTAAIYQNEESVGQAIKDSGVPREEMFVTTKLWN
SQQTYEQTRQALEKSIEKLGLDYLDLYLIHWPNPKPLRENDAWKTRNAEVWRAMEDLYQEGKIRAIGVSNFLPHHLD
ALLETATIVPAVNQVRLAPGVYQDQVVAYCREKGILLEAWGPFGQGELFDSKQVQEIAANHGKSVAQIALAWSLAEG
FLPLPKSVTTSRIQANLDCFGIELSHEERETLKTIAVQSGAPRVDDVDF
 
SEQ ID NO:87
LSEKSREEEKLSFKEQILRDLEKVKGYDEVLKEDEAVVRTPANEPSTEELMADSLSTVEEIMRKAPTVPTHPSQGVP
ASPADEIQRETPGVPSHPSQDVPSSPAEESGSRPGPGPVRPKKLEREYNETPTRVAVSYTTAEKKAEQAGPETPTPA
TETVDIIRDTSRRSRREGAKPVKPKKEKKSHVKAFVISFLVFLALLSAGGYFGYQYVLDSLLPIDANSKKYVTVGIP
EGSNVQEIGTTLEKAGLVKHGLIFSFYAKYKNYTDLKAGYYNLQKSMSTEDLLKELQKGGTDEPQEPVLATLTIPEG
YTLDQIAQAVGQLQGDFKESLTAEAFLAKVQDETFISQAVAKYPTLLESLPVKDSGARYRLEGYLFPATYSIKESTT
IESLIDEMLAAMDKNLSPYYSTIKSKNLTVNELLTIASLVEKEGAKTEDRKLIAGVFYNRLNRDMPLQSNIAILYAQ
GKLGQNISLAEDVAIDTNIDSPYNVYKNVGLMPGPVDSPSLDAIESSINQTKSDNLYFVADVTEGKVYYANNQEDHD
RNVAEHVNSKLN
 
SEQ ID NO:88
MKQERFPLVSDDEVMLTEMPVMNLYDESDLISNIKGEYRDKNYLEWAPIAEEKPVKPIEKQVEKPKKAPLGVKKEGK
SYAEVAREEARADLKKKRSANYLTQDFSLARRHSQPSLVRQGNQPTAPFQKENPGEFVKYSQKLTQSHYILAEEVHS
IPTKNEEVSAPAPKKNNYDFLKKSQIYNKKSKQTEQERRVAQELNLTRMTE
 
SEQ ID NO:89
MKKSKSKYLTLAGLVLGTGVLLSACGNSSTASKTYNYVYSSDPSSLNYLAENRAATSDIVANLVDGLLENDQYGNII
PSLAEDWTVSQDGLTYTYKLRKDAKWFTSEGEEYAPVTAQDFVTGLQYAADKKSEALYLVQDSVAGLDDYITGKTSD
FSTVGVKALDDQTVQYTLVKPELYWNSKTLATILFPVNADFLKSKGDDFGKADPSSILYNGPFLMKALVSKSAIEYK
KNPNYWDAKNVFVDDVKLTYYDGSDQESLERNFTAGAYTTARLFPNSSSYEGIKEKYKNNIIYSMQNSTSYFFNFNL
DRKSYNYTSKTSDIEKKSTQEAVLNKNFRQAINFAFDRTSYGAQSEGKEGATKILRNLVVPPNFVSIKGKDFGEVVA
SKMVNYGKEWQGINFADGQDPYYNPEKAKAKFAEAKKELEAKGVQFPIHLDKTVEVTDKVGIQGVSSIKQSIESVLG
SDNVVIDIQQLTSDEFDSSGYFAQTAAQKDYDLYHGGWGPDYQDPSTYLDIFNTNSGGFLQNLGLEPGEANDKAKAV
GLDVYTQMLEEANKEQDPAKRYEKYADIQAWLIDSSLVLPSVSRGGTPSLRRTVPFAAAYGLTGTKGVESYKYLKVQ
DKIVTTDEYAKAREKWLKEKEESNKKAQEELAKHVK
 
SEQ ID NO:90
MAKEPWQEDIYDQEESRAERRHRNHGGADRMANRILTILASIFFVIVVVMVIVLIYLSSGGSNRTAALKGFHDSDAS
VVQISSSSSSQPEQSSEPESTSSSSEEAANPEGTIKVLAGEGEAAIAARAGISIAQLEALNPGHMATGSWFANPGDV
IKIK
 
SEQ ID NO:91
MPITSLEIKDKTFGTRFRGFDPEEVDEFLDIVVRDYEDLVRANHDKNLRIKSLEERLSYFDEIKDSLSQSVLIAQDT
AERVKQAAHERSNNIIHQAEQDAQRLLEEAKYKANEILRQATDNAKKVAVETEELKNKSRVFHQRLKSTIESQLAIV
ESSDWEDILRPTATYLQTSDEAFKEVVSEVLGEPIPAPIEEEPIDMTRQFSQAEMAELQARIEVADKELSEFEAQIK
QEVEAPTPVVSPQVEEEPLLIQLAQCMKNQK
 
SEQ ID NO:92
MSLKDRFDRFIDYFTEDEDSSLPYEKRDEPVFTSVNSSQEPALPMNQPSQSAGTKENNITRLHARQQELANQSQRAT
DKVIIDVRYPRKYEDATEIVDLLAGNESILIDFQYMTEVQARRCLDYLDGACHVLAGNLKKVASTMYLLTPVNVIVN
VEDIRLPDEDQQGEFGFDMKRNRVR
 
SEQ ID NO:93
MSDLKKYEGVIPAFYACYDDQGEVSPERTRALVQYFIDKGVQGLYVNGSSGECIYQSVEDRKLILEEVMAVAKGKLT
IIAHVACNNTKDSMELARHAESLGVDAIATIPPIYFRLPEYSVAKYWNDISSAAPNTDYVIYNIPQLAGVALTPSLY
TEMLKNPRVIGVKNSSMPVQDIQTFVSLGGEDHIVFNGPDEQFLGGRLMGARAGIGGTYGAMPELFLKLNQLIADKD
LETARELQYAINAIIGKLTSAHGNMYGVIKEVLKINEGLNIGSVRSPLTPVTEEDRPVVEAAAALIRETKERFL
 
SEQ ID NO:94
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRIT
DIGEEDGQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTD
FGIAVAFAETSLTQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPS
VIAENPSVPQALENVIIKATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIP
KVQAQTEHKSIKNPSQAVTEETYQPQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKA
TLKKANFEIGEEKTEASEKVEEGRIIRTDPGAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPD
NLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQIVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKI
EEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTSVAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVT
TAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP
 
SEQ ID NO:95
MTKLIFMGTPDFSATVLKGLLTDDRYEILAVVTQPDRAVGRKKVIQETPVKQAAKEAGLSIYQPEKLSGSPEMEDLM
KLGADGIVTAAFGQFLPSKLLDSMDFAVNVHASLLPRHRGGAPIHYALIQGDEEAGVTIMEMVKEMDAGDMISRRSI
PITDEDNVGTLFEKLALVGRDLLLDTLPAYIAGDIKPEPQDTSQVTFSPNIKPEEEKLDWNKTNRQLFNQIRGMNPW
PVAHTFLKGDRFKIYEALPVEGQGNPGEILSIGKKELIVATAEGALSLKQVQPAGKPKMDIASFLNGVGRTLTVGER
FGD
SEQ ID NO:96
VFRRLGQDFQLRKVKKILKQINALKGKMSSLSDQELVAKTVEFRQRLSEGESLDDILVEAFAVVREADKRILGMFPY
DVQVMGAIVMHYGNVAEMNTGEGKTLTATMPVYLNAFSGEGVMVVTPNEYLSKRDAEEMGQVYRFLGLTIGVPFTED
PKKEMKAEEKKLIYASDIIYTTNSNLGFDYLNDNLASNEEGKFLRPFNYVIIDEIDDILLDSAQTPLIIAGSPRVQS
NYYAIIDTLVTTLVEGEDYIFKEEKEEVWLTTKGAKSAENFLGIDNLYKEEHASFARHLVYAIRAHKLFTKDKDYII
RGNEMVLVDKGTGRLMEMTKLQGGLHQAIEAKEHVKLSPETRAMASITYQSLFKMFNKISGMTGTGKVAEKEFIETY
NMSVVRIPTNRPRQRIDYPDNLYITLPEKVYASLEYIKQYHAKGNPLLVFVGSVEMSQLYSSLLFREGIAHNVLNAN
NAAREAQIISESGQMGAVTVATSMAGRGTDIKLGKGVAELGGLIVIGTERMESQRIDLQIRGRSGRQGDPGMSKFFV
SLEDDVIKKFGPSWVHKKYKDYQVQDMTQPEVLKGRKYRKLVEKAQHASDSAGRSARRQTLEYAESMNIQRDIVYKE
RNRLIDGSRDLEDVVVDIIERYTEEVAADHYASRELLFHFIVTNISFHVKEVPDYIDVTDKTAVRSFMKQVIDKELS
EKKELLNQHDLYEQFLRLSLLKAIDDNWVEQVDYLQQLSMAIGGQSASQKNPIVEYYQEAYAGFEAMKEQIHADMVR
NLLMGLVEVTPKGEIVTHFP
 
SEQ ID NO:97
MTETVEDKVSHSITGLDILKGIVAAGAVISGTVATQTKVFTNESAVLEKTVEKTDALATNDTVVLGTISTSNSASST
SLSASESASTSASESASTSASTSASTSASESASTSASTSISASSTVVGSQTAAATEATAKKVEEDRKKPASDYVASV
TNVNLQSYAKRRKRSVDSIEQLLASIKNAAVFSGNTIVNGAPAINASLNIAKSETKVYTGEGVDSVYRVPIYYKLKV
TNDGSKLTFTYTVTYVNPKTNDLGNISSMRPGYSIYNSGTSTQTMLTLGSDLGKPSGVKNYITDKNGRQVLSYNTST
MTTQGSGYTWGNGAQMNGFFAKKGYGLTSSWTVPITGTDTSFTFTPYAARTDRIGINYFNGGGKVVESSTTSQSLSQ
SKSLSVSASQSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSAS
ASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASGSASTSTSASAST
SASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASAS
TSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASA
SASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTS
ASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASA
STSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSAS
ASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSA
SASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESAS
TSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASA
SASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSAS
ASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSAST
SASESASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASAS
ASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASISA
SESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASASASTSASASASTSASASAS
TSASASASISASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASA
SASTSASASASTSASESASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTS
ASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASASTSASA
SASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTS
ASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASASASTSASASAST
SASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASAS
ASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSA
SASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASAS
TSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASA
STSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSAS
ASASTSASESASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASAST
SASESASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASAS
TSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASA
SASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTS
ASASASTSASESASTSASASASTSASASASTSASASASTSASASASASTSASASASTSASASASTSASASASISASE
SASTSASASASASTSASASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASAS
TSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSA
STSASASASTSASASASTSASESASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASAS
ASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSA
SASASTSASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSASASAS
TSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASASA
STSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS
ASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASAST
SASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASAS
ASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASE
SASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTS
ASESASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESA
STSTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASAS
ASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSA
SASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASAS
TSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASA
SASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTS
ASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASTSASASA
STSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASISASESASTSASASASTSAS
ASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASTSA
SESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESAS
TSASASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASESASTSASA
SASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTS
ASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASA
STSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSAS
ASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAST
SASASASTSASASASTSVSNSANHSNSQVGNTSGSTGKSQKELPNTGTESSIGSVLLGVLAAVTGIGLVAKRRKRDE
EE
 
SEQ ID NO:98
MSNEKNTNTNVEKKDATVVAHEIKGELTYEDKVIQKIIGLSLENVSGLLGIDGGFFSNLKEKIVNSDDVTSGVNVEV
GKTQVAVDLNVIVEYQKNVPALYSEIREIVSSEVAKMTDLEIVEINVNVVDIKTKEQHEADSVSLQDRVSDVAESTG
EFTSEQFEKAKSGLGSGFSTVQEKVSEGVEAVKGAANGVVSHENTRVN
 
SEQ ID NO:99
MTKEKNVILTARDIVVEFDVRDKVLTAIRGVSLELVEGEVLALVGESGSGKSVLTKTFTGMLEENGRIAQGSIDYRG
QDLTALSSHKDWEQIRGAKIATIFQDPMTSLDPIKTIGSQITEVIVKHQGKTAKEAKELAIDYMNKVGIPDADRRFN
EYPFQYSGGMRQRIVIAIALACRPDVLICDEPTTALDVTIQAQIIDLLKSLQNEYHFTTIFITHDLGVVASIADKVA
VMYAGEIVEYGTVEEVFYDPRHPYTWSLLSSLPQLADDKGDLYSIPGTPPSLYTDLKGDAFALRSDYAMQIDFEQKA
PQFSVSETHWAKTWLLHEDAPKVEKPAVIANLHDKIREKMGFAHLAD
 
SEQ ID NO:100
MKKNRVFATAGLVLLAAGVLAACSSSKSSDSSAPKAYGYVYTADPETLDYLISSKNSTTVVTSNGIDGLFTNDNYGN
LAPAVAEDWEVSKDGLTYTYKIRKGVKWFTSDGEEYAEVTAKDFVNGLKHAADKKSEAMYLAENSVKGLADYLSGTS
TDFSTVGVKAVDDYTLQYTLNQPEPFWNSKLTYSIFWPLNEEFETSKGSDFAKPTDPTSLLYNGPFLLKGLTAKSSV
EFVKNEQYWDKENVHLDTINLAYYDGSDQESLERNFTSGAYSYARLYPTSSNYSKVAEEYKDNIYYTQSGSGIAGLG
VNIDRQSYNYTSKTTDSEKVATKKALLNKDFRQALNFALDRSAYSAQINGKDGAALAVRNLFVKPDFVSAGEKTFGD
LVAAQLPAYGDEWKGVNLADGQDGLFNADKAKAEFAKAKKALEADGVQFPIHLDVPVDQASKNYISRIQSFKQSVET
VLGVENVVVDIQQMTSDEFLNITYYAANASSEDWDVSGGVSWGPDYQDPSTYLDILKTTSSETTKTYLGFDNPNSPS
VVQVGLKEYDKLVDEAARETSDLNVRYEKYAAAQAWLTDSSLFIPAMASSGAAPVLSRIVPFTGASAQTGSKGSDVY
FKYLKSQDKVVTKEEYEKAREKWLKEKAESNEKAQKELASHVK
 
SEQ ID NO:101
MKKKYWTLAILFFCLFNNSVTAQEIPKNLDGNITHTQTSESFSESDEKQVDYSNKNQEEVDQNKFRIQIDKTELFVT
TDKHLEKNCCKLELEPQINNDIVNSESNNLLGEDNLDNKIKENVSHLDNRGGNIEHDKDNLESSIVRKYEWDIDKVT
GGGESYKLYSKSNSKVSIAILDSGVDLQNTGLLKNLSNHSKNYVPNKGYLGKEEGEEGIISDIQDRLGHGTAVVAQI
VGDDNINGVNPHVNINVYRIFGKSSASPDWIVKAIFDAVDDGNDIINLSTGQYLMIDGEYEDGTNDFETFLKYKKAI
DYANQKGVIIVAALGNDSLNVSNQSDLLKLISSRKKVRKPGLVVDVPSYFSSTISVGGIDRLGNLSDFSNKGDSDAI
YAPAGSTLSLSELGLNNFINAEKYKEDWIFSATLGGYTYLYGNSFAAPKVSGAIAMIIDKYKLKDQPYNYMFVKKFW
KKHYQ
 
SEQ ID NO:102
MKKDELFEGFYLIKSADLRQTRAGKNYLAFTFQDDSGEIDGKLWDAQPHNIEAFTAGKVVHMKGRREVYNNTPQVNQ
ITLRLPQAGEPNDPADFKVKSPVDVKEIRDYMSQMIFKIENPVWQRIVRNLYTKYDKEFYSYPAAKTNHHAFETGLA
YHTATMVRLADAISEVYPQLNKSLLYAGIMLHDLAKVIELTGPDQTEYTVRGNLLGHIALIDSEITKTVMELGIDDT
KEEVVLLRHVILSHHGLLEYGSPVRPRIMEAEIIHMIDNLDASMMMMSTALALVDKGEMTNKIFAMDNRSFYKPDLD
 
SEQ ID NO:103
VTILGKDTVQQSAKGESVTQEATPEYKLENTPGGDKGGNTGSSDANANEGGGSQAGGSAHTGSQNSAQSQASKQLAT
EKESAKNAIEKAAKDKQDEIKGAPLSDKEKAELLARVEAEKQAALKEIENAKTMEDVKEAETIGVQAIAMVTVPKRP
VAPNAAPKTTSAPQATAGTMQDVTYQSPAGKQLPNTGSASSAALASLGLVVATSGFALLGRKTRRRK
 
SEQ ID NO:104
MNADDTVTIYDVAREAGVSMATVSRVVNGNKNVKENTRKKVLEVIDRLDYRPNAVARGLASKKTTTVGVVIPNITNG
YFSSLAKGIDDIAEMYKYNIVLANSDEDNEKEVSVVNTLFSKQVDGIIYMGYHLTDKIRSEFSRSRTPIVLAGTVDV
EHQLPSVNIDYKQATIDAVSYLAKENERIAFVSGPLVDDINGKVRLVGYKETLKKAGITYSEGLVFESKYSYDDGYA
LAERLISSNATAAVVTGDELAAGVLNGLADKGVSVPEDFEIITSDDSQISRFTRPNLTTIAQPLYDLGAISMRMLTK
IMHKEELEEREVLLPHGLTERSSTRKRK
SEQ ID NO:105
MKKKLVFPNLFWWGAASSGPQTEGQYGKVHENVMDYWFKTHPEDFFDNVGPLVASNFFHTYTEDFHLMKEIGVNSFR
TSIQWSRLIKNLETGEPDPKGIAFYNAIIEEAKKNQMDLVMNLHHFDLPVELLQKYGGWESKHVVELFVKFAKTAFT
CFGDKVHYWTTFNEPMVIPEAGYLYAFHYPNLKGKGKEAVQVIYNLNLASAKVIQLYRSLELDGKIGIILNLTPAYP
RSNSPEDLEASRFTDDFFNKVFLNPAVKGTFPERLVKQLERDGVLWSHTEKELQLMKSNTVDFLGVNYYHPKRVQAQ
ANPEEYQTPWMPDQYFKEYEWLERRMNPYRGWEIFPKAIYDIAMIVKEEYGNIPWFISENGMGVENEARFIDENGVI
DDVYRIEFYEEHLRWLHKAIEEGSHCFGYHAWTAFDCWSWNNAYKNRYGFISVDLETQKRTIKSSGRWYRKVSDNNG
FEVEIEE
 
SEQ ID NO:106
VENLTNFYEKYRVYLTRPRLELLAVVTIVFCAVLVFFLNIPGKGVLKLDNGTIVYDGSLVRGKMNGQGTITFQNGDQ
YTGGFNNGAFNGKGTFQSKEGWTYEGDFVNGQAEGKGKLTTEQEVVYEGTFKQGVFQQK
 
SEQ ID NO:107
MLNKIRDYLDFAGLQYRNPDKAGAEREKMLAFRHKGQEARKVFTELAKAFQASHPEWQLQQTSQWMNQAQRLRPHFW
VYLQRDGQVTEPMMALRLYGTSTDFGISLEVSFIERKKDEQTLGKQAKVLDIPTVKGIYYLTYSNGQSQRWEANEEK
RRTLREKVRSQEVRKVLVKVDVPMTENSSEEEIVEGLLKSYSKILPYYLATRK
 
SEQ ID NO:108
MVQNSCWQSKSHKVKAFTLLESLLALIVISGGLLLFQAMSQLLISEVRYQQQSEQKEWLLFVDQLEVELDRSQFEKV
EGNRLYMKQDGKDIAIGKSKSDDFRKTNARGRGYQPMVYGLKSVRITEDNQLVRFHFQFQKGLEREFIYRVEKEK
 
SEQ ID NO:109
MKKMMTFLKKAKVKAFTLVEMLVVLLIISVLFLLFVPNLTKQKEAVNDKGKAAVVKVVESQAELYSLEKNEDASLRK
LQADGRITEEQAKAYKEYNDKNGGANRKVND
 
SEQ ID NO:110
MTSKVRKAVIPAAGLGTRFLPATKALAKEMLPIVDKPTIQFIVEEALKSGIEDILVVTGKSKRSIEDHFDSNFELEY
NLKEKGKTDLLKLVDKTTDMRLHFIRQTHPRGLGDAVLQAKAFVGNEPFVVMLGDDLMDITDEKAVPLTKQLMDDYE
RTHASTIAVMPVPHDEVSAYGVIAPQGEGKDGLYSVETFVEKPAPEDAPSDLAIIGRYLLTPEIFEILEKQAPGAGN
EIQLTDAIDTLNKTQRVFAREFKGARYDVGDKFGFMKTSIDYALKHPQVKDDLKNYLIQLGKELTEKE
 
SEQ ID NO:111
MQNQLNELKRKMLEFFQQKQKNKKSARPGKKGSSTKKSKTLDKSVIFPAILLSIKALFNLLFVLGFLGGMLGAGIAL
GYGVALFDKVRVPQTEELVNQVKDISSISEITYSDGTVIASIESDLLRTSISSEQISENLKKAIIATEDEHFKEHKG
VVPKAVIRATLGKFVGLGSSSGGSTLTQQLIKQQVVGDAPTLARKAAEIVDALALERAMNKDEILTTYLNVAPFGRN
NKGQNIAGARQAAEGIFGVDASQLTVPQAAFLAGLPQSPITYSPYENTGELKSDEDLEIGLRRAKAVLYSMYRTGAL
SKDEYSQYKDYDLKQDFLPSGTVTGISRDYLYFTTLAEAQERMYDYLAQRDNVSAKELKNEATQKFYRDLAAKEIEN
GGYKITTTIDQKIHSAMQSAVADYGYLLDDGTGRVEVGNVLMDNQTGAILGFVGGRNYQENQNNHAFDTKRSPASTT
KPLLAYGIAIDQGLMGSETILSNYPTNFANGNPIMYANSKGTGMMTLGEALNYSWNIPAYWTYRMLREKGVDVKGYM
EKMGYEIPEYGIESLPMGGGIEVTVAQHTNGYQTLANNGVYHQKHVISKIEAADGRVVYEYQDKPVQVYSKATATIM
QGLLREVLSSRVTTTFKSNLTSLNPTLANADWIGKTGTTNQDENMWLMLSTPRLTLGGWIGHDDNHSLSRRAGYSNN
SNYMAHLVNAIQQASPSIWGNERFALDPSVVKSEVLKSTGQKPEKVSVEGKEVEVTGSTVTSYWANKSGAPATSYRF
AIGGSDADYQNAWSSIVGSLPTPSSSSSSSSSSSDSSNSSTTRPSSSRARR
 
SEQ ID NO:112
MSSKFMKSAAVLGTATLASLLLVACGSKTADKPADSGSSEVKELTVYVDEGYKSYIEEVAKAYEKEAGVKVTLKTGD
ALGGLDKLSLDNQSGNVPDVMMAPYDRVGSLGSDGQLSEVKLSDGAKTDDTTKSLVTAANGKVYGAPAVIESLVMYY
NKDLVKDAPKTFADLENLAKDSKYAFAGEDGKTTAFLADWTNFYYTYGLLAGNGAYVFGQNGKDAKDIGLANDGSIV
GINYAKSWYEKWPKGMQDTEGAGNLIQTQFQEGKTAAIIDGPWKAQAFKDAKVNYGVATIPTLPNGKEYAAFGGGKA
WVIPQAVKNLEASQKFVDFLVATEQQKVLYDKTNEIPANTEARSYAEGKNDELTTAVIKQFKNTQPLPNISQMSAVW
DPAKNMLFDAVSGQKDAKTAANDAVTLIKETIKQKFGE
 
SEQ ID NO:113
MIDKVVRNLLLTFFFCKMTKIIIFLTTILVKKKKICYNEFKLRNRKQKGVIMWVLGFILFMIFFYSNNSKKIKKLEN
KIKRLERKEKGNAEMSRLLQEMIGKEPIITGVYIGPDNWEVVDVDEEWVKLRRVDNTGKEKFKLQRIEDIQTVEFDG
E
SEQ ID NO:114
MILSKNREDGLRKFATNIRLNTLRTLNHLGFGHYGGSLSIVEVLAVLYGEIMPMTPEIFAARDRDYFILSKGHGGPA
LYSTLYLNGFFDKEFLYSLNTNGTKLPSHPDRNLTPGIDMTTGSLGQGISVATGLAYGQRIRKSPFYTYAIVGDGEL
NEGQCWEAIQFASHQQLSNLIVFVDDNKKQLDGFTKDICNPGDFVEKFSAFGFESIRVKGSDIREIYEGIVQLKQSN
NSSPKCIVLDTIKGQGVQELEEMKSNHHLRPTVEEKQMLTSVVERLSQELEETE
 
SEQ ID NO:115
MKKTTILSLTTAAVILAAYVPNEPILADTPSSEVIKETKVGSIIQQNNIKYKVLTVEGNIGTVQVGNGVTPVEFEAG
QDGKPFTIPTKITVGDKVFTVTEVASQAFSYYPDETGRIVYYPSSITIPSSIKKIQKKGFHGSKAKTIIFDKGSQLE
KIEDRAFDFSELEEIELPASLEYIGTSAFSFSQKLKKLTFSSSSKLELISHEAFANLSNLEKLTLPKSVKTLGSNLF
RLTTSLKHVDVEEGNESFASVDGVLFSKDKTQLIYYPSQKNDESYKTPKETKELASYSFNKNSYLKKLELNEGLEKI
GTFAFADAIKLEEISLPNSLETIERLAFYGNLELKELILPDNVKNFGKHVMNGLPKLKSLTIGNNINSLPSFFLSGV
LDSLKEIHIKNKSTEFSVKKDTFAIPETVKFYVTSEHIKDVLKSNLSTSNDIIVEKVDNIKQETDVAKPKKNSNQGV
VGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESG
SMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVTVSGKWYYTYNSGDLLVNTTTPDGYRVNAN
GEWVG
 
SEQ ID NO:116
MVRFTGLSLKQTQAIEVLKGHISLPDVEVAVTQSDQASISIEGEEGHYQLTYRKPHQLYRALSLLVTVLAEADKVEI
EEQAAYEDLAYMVDCSRNAVLNVASAKQMIEILALMGYSTFELYMEDTYQIEGQPYFGYFRGAYSAEELQEIEAYAQ
QFDVTFVPCIQTLAHLSAFVKWGVKEVQELRDVEDILLIGEEKVYDLIDGMFATLSKLKTRKVNIGMDEAHLVGLGR
YLILNGVVDRSLLMCQHLERVLDIADKYGFHCQMWSDMFFKLMSADGQYDRDVEIPEETRVYLDRLKDRVTLVYWDY
YQDSEEKYNRNFRNHHKISHDLAFAGGAWKWIGFTPHNHFSRLVAIEANKACRANQIKEVIVTGWGDNGGETAQFSI
LPSLQIWAELSYRNDLDGLSAHFKTNTGLTVEDFMQIDLANLLPDLPGNLSGINPNRYVFYQDILCPILDQHMTPEQ
DKPHFAQAAETLANIKEKAGNYAYLFETQAQLNAILSSKVDVGRRIRQAYQADDKESLQQIARQELPELRSQIEDFH
ALFSHQWLKENKVFGLDTVDIRMGGLLQRIKRAESRIEVYLAGQLDRIDELEVEILPFTDFYADKDFAATTANQWHT
IATASTIYTT
 
SEQ ID NO:117
MSNSFVKLLVSQLFANLADIFFRVTIIANIYIISKSVIATSLVPILIGISSFVASLLVPLVTKRLALNRVLSLSQFG
KTILLAILVGMFTVMQSVAPLYTYLFVVAISILDGFAAPVSYAIVPRYATDLGKANSALSMTGEAVQLIGWGLGGLL
FATIGLLPTTCINLVLYIISSFLMLFLPNAEVEVLESETNLEILLKGWKLVARNPRLRLFVSANLLEIFSNTIWVSS
IILVFVTELLNKTESYWGYSNTAYSIGIIISGLIAFRLSEKFLAAKWEPQLFTPNLKTIQNPCLSLDPGWFLFSPNG
CFLLDKKEFPLYGISVEKNTKRKETHMNSLPNHHFQNKSFYQLSFDGGHLTQYGGLIFFQELFSQLKLKERISKYLV
TNDQRRYCRYSDSDILVQFLFQLLTGYGTDYACKELSADAYFPKLLEGGQLASQPTLSRFLSRTDEETVHSLRCLNL
ELVEFFLQFHQLNQLIVDIDSTHFTTYGKQEGVAYNAHYRAHGYHPLYAFEGKTGYCFNAQLRPGNRYCSEEADSFI
TPVLERFNQLLFRMDSGFATPKLYDLIEKTGQYYLIKLKKNTVLSRLGDLSLPCPQDEDLTILPHSAYSETLYQAGS
WSHKRRVCQFSERKEGNLFYDVISLVTNMTSGTSQDQFQLYRGRGQAENFIKEMKEGFFGDKTDSSTLIKNEVRMMM
SCIAYNLYLFLKHLAGGDFQTLTIKRFRHLFLHVVGKCVRTGRKQLLKLSSLYAYSELFSALYSRIRKVNLNLPVPY
EPPRRKASLMMH
 
SEQ ID NO:118
MNYSKALNECIESAYMVAGHFGARYLESWHLLIAMSNHSYSVAGATLNDYPYEMDRLEEVALELTETDYSQDETFTE
LPFSRRLQVLFDEAEYVASVVHAKVLGTEHVLYAILHDSNALATRILERAGFSYEDKKDQVKIAALRRNLEERAGWT
REDLKALRQRHRTVADKQNSMANMMGMPQTPSGGLEDYTHDLTEQARSGKLEPVIGRDKEISRMIQILSRKTKNNPV
LVGDAGVGKTALALGLAQRIASGDVPAEMAKMRVLELDLMNVVAGTRFRGDFEERMNNIIKDIEEDGQVILFIDELH
TIMGSGSGIDSTLDAANILKPALARGTLRTVGATTQEEYQKHIEKDAALSRRFAKVTIEEPSVADSMTILQGLKATY
EKHHRVQITDEAVETAVKMAHRYLTSRHLPDSAIDLLDEAAATVQNKAKHVKADDSDLSPADKALMDGKWKQAAQLI
AKEEEVPVYKDLVTESDILTTLSRLSGIPVQKLTQTDAKKYLNLEAELHKRVIGQDQAVSSISRAIRRNQSGIRSHK
RPIGSFMFLGPTGVGKTELAKALAEVLFDDESALIRFDMSEYMEKFAASRLNGAPPGYVGYEEGGELTEKVRNKPYS
VLLFDEVEKAHPDIFNVLLQVLDDGVLTDSKGRKVDFSNTIIIMTSNLGATALRDDKTVGFGAKDIRFDQENMEKRM
FEELKKAYRPEFINRIDEKVVFHSLSSDHMQEVVKIMVKPLVASLTEKGIDLKLQASALKLLANQGYDPEMGARPLR
RTLQTEVEDKLAELLLKGDLVAGSTLKIGVKAGQLKFDIA
 
SEQ ID NO:119
MKILPFIARGTSYYLKMSVKKLVPFLVVGLMLAAGDSVYAYSRGNGSIARGDDYPAYYKNGSQEIDQWRMYSRQCTS
FVAFRLSNVNGFEIPAAYGNANEWGHRARREGYRVDNTPTIGSITWSTAGTYGHVAWVSNVMGDQIEIEEYNYGYTE
SYNKRVIKANTMTGFIHFKDLDGGSVGNSQSSTSTGGTHYFKTKSAIKTEPLASGTVIDYYYPGEKVHYDQILEKDG
YKWLSYTAYNGSYRYVQLEAVNKNPLGNSVLSSTGGTHYFKTKSAIKTEPLVSATVIDYYYPGEKVHYDQILEKDGY
KWLSYTAYNGSRRYIQLEGVTSSQNYQNQSGNISSYGSHSSSTVGWKKINGSWYHFKSNGSKSTGWLKDGSSWYYLK
LSGEMQTGWLKENGLWYYLGSSGAMKTGWYQVSGKWYYSYSSGALAVNTTVDGYRVNSDGERV
SEQ ID NO:120
MKVIFLADVKGKGKKGEIKEVPTGYAQNFLIKKNLAKEATAQAVGELRGKQKSEEKAHAEMIAEGKAIKAQLEAEET
VVEFVEKVGPDGRTFGSITNKKIAEELQKQFGIKIDKRHIQVQAPIRAVGLIDVPVKIYQDITSVINLRVKEG
 
SEQ ID NO:121
MSEIEIINAKKIYHDVPVIENLNITIPKGSLFTLLGASGCGKTTLLRMIAGFNSIKDGEFYFDDTKINNMEPSKRNI
GLVFQNYAIFPHLTVRDNVAFGLMQKKVPKEELIQQTNKYLELMQIAQYADRKPDKLSGGQQQRVTLACALAVNPSV
LLMDEPLSNLEAKLRLDMRQTIREIQHEVGITTVYVTHDQEEAMAISDQIAVMKDGVIQQIGRPKELYHKPANEFVA
TFIGRTNIIPANLEKRSDGAYIVFSDGYALRMPALDQVEEQAIHVSIRPEEFIKDESGDIEGTIRDSVYLGLNTDYF
IETGFASKIQVSEESTFEEELQKGNRIRLRINTQKLNIFSADGSQNLIKGVNHGT
 
SEQ ID NO:122
MVKRRIRRGTREPEKVVVPEQSSIPSYPVSVTSNQGTDVAVEPAKAVAPTTDWKQENGMWYFYNTDGSMATGWVQVN
SSWYYLNSNGSMKVNQWFQVGGKWYYVNTSGELAVNTSIDGYRVNDNGEWVR
 
SEQ ID NO:123
ELRRLSRLVDQELYFGCGWRLSLEWLPSMRKDSWPSNTAPRTTMVQ
 
SEQ ID NO:124
DCIRKQPFTRDEPNKTCRKTKPSKSYCSYRW
 
SEQ ID NO:125
GQRNPRRIERVIRMAETKPRISKKEG
 
SEQ ID NO:126
QRKLFKIFHLFQKKSGWNQKSSCLKLNLNSLNRKMTQMTKMFRSIFQPKKPLNTNFQAYNSLHQINQKISLKRRKLS
EKISKS
 
SEQ ID NO:127
LVIIVLKIQSKSETDFIFKTWPFILLSKIIPLMVLDCQVSISWTNRETVAYSKLLAIKTLKGDYHDGQSKKIRLSHA
SRVRTPSWYPHDMADSTRIMAFSRKGC
 
SEQ ID NO:128
ERLPAFPRSLSGRKLDQGGTKEKGSDGRSP
 
SEQ ID NO:129
RNCLSTWKSSSNYHTEIKRGTVRQCLGKGRFKEVYSADYAQQSYENNRKRSVKKSSLTKELKEKILHYHNQKFSPEM
MVMAKGVNVGISTIYYWIHHGKLGLSKQDLLYPRKGKALKKQASTNFKPAGQSIEQRPEAINLRLENGHYEIDTVLL
TRSKNYCLIVLTDRKSRHQIIRLIPNKSAEVVNQALKLILKQHKILSITADNGTEFNRLFDIFSEEHIYYAHPYASW
ERGTNENHNRLIRR
 
SEQ ID NO:130
PVMTISSPTMKNMDLSTKASPSQPLQGKHGMIWSGK
 
SEQ ID NO:131
TSSIRIHTRKSSPNWTTTPHLALSAETN
 
SEQ ID NO:132
YFLPHKYARESLSLPSTNKILHRKQGS
 
SEQ ID NO:133
AAFKKDQINERVEKLGKLKPITINYNGKSEVIDSKEKLQELMNKAVKDEVAQI
 
SEQ ID NO:134
AYAHSKRSAGSGRAGGRQCLCQCQNKCRRDFKY
SEQ ID NO:135
HGRPYHKPHQPHHHGFPQQSYNLLPPKHKPTLCVRR
 
SEQ ID NO:136
KGKILLLPRLTTQRWQRKIRPDSRKSANNKANLDFHNSRCKSSLSDEAPNLHKNPALLVHSLSRVIAVLLELSPLQA
YSIVKFSPKEDDLIHDDAILVRFGILEVHDSPYELLLLYHTHSYRFSCSIYLS
 
SEQ ID NO:137
FTVSHVFLLYLSFNPRPKSMSLSFTSSKLLRPRFRTFIISASDFSVKSCTVLIPARFKQLYERTDKSSSSIVRSKIR
SSDSVSASFITSVDLAISVRFVNKSRCSVKIRAESPKASSGIIVPFVKISRVNLSKPSLLPTRAGST
 
SEQ ID NO:138
LVCMKNKGCYKERNNCCH
 
SEQ ID NO:139
FHYLSKYFLVSAITTGDKTKRAIKFGRAIKALTISAIIQTISNSINPPNKTMSTKTTR
 
SEQ ID NO:140
GKKVFIKYPLSRVSSKTGPMITGRTKDKIVDKKVGCPFEKSTVKYSS
 
SEQ ID NO:141
SSPVFPKLVMVSGANKPRERRNFPFSSKMSFHLTFVL
 
SEQ ID NO:142
YLTSFSVPKIASSKVKLTRYWRSSPWRGAFGLREEPPPPKKLEKISSKPPKPPAPLKPPKPPAPPKPPLAPAAPYWS
 
SEQ ID NO:143
QSWRPIPDSKCYTQEKLTIPIKRRKDIKDFYHNSIQRHKNSHKSHLLDSYRLIITRLAEIVHENKILIVLILYVTNI
PSRSRRYEVNRV
 
SEQ ID NO:144
LFRFYRVIVLYRGWHIYLLILVNLQYVQNVFRKDRFLVRGAQPFFHGERSAGHLVLPYVL
 
SEQ ID NO:145
ITHPPLNPEHFVSRVFSSLGLKSYQPKDDRFLRKPSDSRHPESGNSGKWQVLNSPLVIVK
 
SEQ ID NO:146
TLAKAVGLMYSPPIPPKPFLGRITTDSSSI
 
SEQ ID NO:147
PGSPFSEISGAGFFGVAKRIFPRPPRPPWATINSCPCSIKSVKTLPVSASRTVVPCGTRTLRSSAPRPCIPLVIPFS
PESALK
 
SEQ ID NO:148
INSLTLATSLSKRRAPRKASKASPRMVSRLRPPDFSSPLPNLINWSNWQSRAKPAKLSSRTIIARSFDRSPSGFLGY
FLYRYSEINNCRTASPKNSKRSLCEIFKRRCSLA
 
SEQ ID NO:149
PIGKRNCKAECQSHHLLEKQKTFQSRKTKRYGASPEPRYRESRKPRLSQ
 
SEQ ID NO:150
QPLGHSKAEEHETICSHTFDNHTTETIPNQVKGRDMTSSETLPFPSKNQNQGKAKQIP
SEQ ID NO:151
PCSLPDYGLVGSGYHSCHYQSNDTRFLESHGNWRTLLYSWSWILCQEKTLFPHDLASLYPSCVRTSIHRYCLLHVKK
LRNSISTFFFTHIDKVLVQAHIISQFWMKRTYQHIFFLGCNNLIVHCC
 
SEQ ID NO:152
RVKDNHLDKLVKALLKRRSSTQYYIHQLLRKMIRLYGHQQLHNNSEILVYSDYGHVDLLLLETNKIPVY
 
SEQ ID NO:153
QVIKIDIATTNKTESVKSQSEREKKRLTSSNILKVRGRPI
 
SEQ ID NO:154
AFKSSKVPSLDPSSTKTYSISVSKSGSKASRA
 
SEQ ID NO:155
DKTDPLARKLPDKSKPSTSFCTKSLSPVNMASLTSAKPSKTKASLGICSPADKRMTSPSTNSSGLRATS
 
SEQ ID NO:156
LCRLQTQARPRGSVTNLTKQNKVYRYLNYLRQTQLSAM
 
SEQ ID NO:157
CIQSIGNEGQCKGNSCYVGKEIHLAPISDIVGHKGKEEGDDGNDDGRQFYLFLAHLVGSAFLRSFPLLYSKGINEEG
DGIGNDGRLISKDIINSTGQNGINNTKVISPFA
 
SEQ ID NO:1158
TSTKLVIDTTTFMTFCTNNTKSSKFTNTFTKLDVGTTTRHVGCDGNGTTLTSIHDDLGFSIVVFGIQDFVRNTSCNQ
FLRNVVTSFNRYCTNQDRLTLLVTSLNVFDNRFKLRFDTCIKKV
 
SEQ ID NO:159
ISTGVPTCSMYPLLKTAILSDKVKASS
 
SEQ ID NO:160
LSTMSSIKSILCSLPTHTIFSKSAISPKRGSTAI
 
SEQ ID NO:161
SCSYSSTNSKACSIVGLSKPTIFICVTPISAAKAISSASRPANSSTFKCVCVSKIISSNLVFYLLLYQKRGGAPNFS
VSPPLFNRELFCYLFYPILPISYSTVRDRRDWLH
 
SEQ ID NO:162
VTSCIVPAVACGALVVLGAALGATGLLGTVTMAMACTPIVSASFTSSIVFAFSISLRAACFSASTLAKSSAFSLSES
GAPLISSCLSLAAFSMAFLADSFSVANCLEACD
 
SEQ ID NO:163
YSPFNHSILIRKTTKIINPNPKAPRMNWRSKVWSNQPVNISTNHTKSDRPIKK
 
SEQ ID NO:164
DYFKFRTTFTRFSTVKPYSANTFGAGAEAPKVSIPRTAPSRPTYLYQF
 
SEQ ID NO:165
RGRRGLCVARIKAPRLVIKPKRTIDPPTKDRYSPPLSATSLSVPKSPIISFPAKMDKNPKRKLNSKVIFNASVT
 
SEQ ID NO:166
TPPYTKIPAKTAIIPFISAQDFNQAQRLSG
SEQ ID NO:167
MGIALENVNFIYQEGTPLASAALSDVSLTIEDGSYTALIGHTGSGKSTILQLLNGLLVPSQGSVRVFDTLITSTSKN
KDIRQIRKQVGLVFQFAENQIFEETVLKDVAFGPQNFGVSEEDAVKTAREKLALVGIDESLFDRSPFELSGGQMRRV
AIAGILAMEPSILVLDEPTAGLDPLGRKELMTLFKKLHQSGMTIVLVTHLMDDVAEYANQVYVMEKGRLVKGGKPSD
VFQDVVFMEEVQLGVPKITAFCKRLADRGVSFKRLPIKIEEFKESLNG
 
SEQ ID NO:168
MVMTDPIADFLTRIRNANQAKHEVLEVPASNIKKGIAEILKREGFVKNVEIIEDDKQGVIRVFLKYGPNGEKVITNL
KRVSKPGLRVYKKREDLPKVLNGLGIAILSTSEGLLTDKEARQKNVGGEVIAYVW
 
SEQ ID NO:169
MANKAVNDFILAMNYDKKKLLTHQGESIENRFIKEGNQLPDEFVVIERKKRSLSTNTSDISVTATNDSRLYPGALLV
VDETLLENNPTLLAVDRAPMTYSIDLPGLASSDSFLQVEDPSNSSVRGAVNDLLAKWHQDYGQVNNVPARMQYEKIT
AHSMEQLKVKFGSDFEKTGNSLDIDFNSVHSGEKQIQIVNFKQIYYTVSVDAVKNPGDVFQDTVTVEDLKQRGISAE
RPLVYISSVAYGRQVYLKLETTSKSDEVEAAFEALIKGVKVAPQTEWKQILDNTEVKAVILGGDPSSGARVVTGKVD
MVEDLIQEGSRFTADHLGLPISYTTSFLRDNVVATFQNSTDYVETKVTAYRNGDLLLDHSGAYVAQYYITWNELSYD
HQGKEVLTPKAWDRNGQDLTAHFTTSIPLKGNVRNLSVKIRECTGLAWEWWRTVYEKTDLPLVRKRTISIWGTTLYP
QVEDKVEND
 
SEQ ID NO:170
MANKAVNDFILAMNYDKKKLLTHQGESIENRFIKEGNQLPDEFVVIERKKRSLSTNTSDISVTATNDSRLYPGALLV
VDETLLENNPTLLAVDRAPMTYSIDLPGLASSDSFLQVEDPSNSSVRGAVNDLLAKWHQDYGQVNNVPARMQYEKIT
AHSMEQLKVKFGSDFEKTGNSLDIDFNSVHSGEKQIQIVNFKQIYYTVSVDAVKNPGDVFQDTVTVEDLKQRGISAE
RPLVYISSVAYGRQVYLKLETTSKSDEVEAAFEALIKGVKVAPQTEWKQILDNTEVKAVILGGDPSSGARVVTGKVD
MVEDLIQEGSRFTADHLGLPISYTTSFLRDNVVATFQNSTDYVETKVTAYRNGDLLLDHSGAYVAQYYITWNELSYD
HQGKEVLTPKAWDRNGQDLTAHFTTSIPLKGNVRNLSVKIRECTGLAWEWWRTVYEKTDLPLVRKRTISIWGTTLYP
QV
 
SEQ ID NO:171
MANKAVNDFILAMNYDKKKLLTHQGESIENRFIKEGNQLPDEFVVIERKKRSLSTNTSDISVTATNDSRLYPGALLV
VDETLLENNPTLLAVDRAPMTYSIDLPGLASSDSFLQVEDPSNSSVRGAVNDLLAKWHQDYGQVNNVPARMQYEKIT
AHSMEQLKVKFGSDFEKTGNSLDIDFNSVHSGEKQIQIVNFKQIYYTVSVDAVKNPGDVFQDTVTVEDLKQRGISAE
RPLVYISSVAYGRQVYLKLETTSKSDEVEAAFEALIKGVKVAPQTEWKQILDNTEVKAVILGGDPSSGARVVTGKVD
MVEDLIQEGSRFTADHLGLPISYTTSFLRDNVVATFQNSTDYVETKVTAYRNGDLLLDHSGAYVAQYYITWNELSYD
HQGKEVLTPKAWDRNGQDLTAHFTTSIPLKGNVRNLSVKIRECTGLAFEWWRTVYEKTDLPLVRKRTISIWGTTLYP
QVEDKVEND
 
SEQ ID NO:172
MKKVRKIFQKAVAGLCCISQLTAFSSIVALAETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEA
QTGEAIFSNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQII
KVDGSEKNGQHKALNPNPYERVIPEGTLSKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMS
NIRNKNARRAERAGEATRSLIDKITSDSENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTN
TKDYSYLKLTNDKNDIVELKNKVPTEAEDHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTM
SYPINFNHATFAPSYQNQLNAFFSKSPNKDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKP
EKYSEMKAAGYAVIGDPINGGYIWLNWRESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPG
TDEATATSFMQSISSKPENYTNVTDTTKILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTL
TANDGSRLENGQAVGGPQNDGGLLKNAKVLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTL
HPKEVEQNTVRDFPIPKIRDVRKYPEITISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGT
YQNVRTGEDGKLTFKNLSDGKYRLFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITN
EPIPPKREYPRTGGIGMLPFYLIGCMMMGGVLLYTRKHP
 
SEQ ID NO:173
MKSINKFLTMLAALLLTASSLFSAATVFAAGTTTTSVTVHKLLATDGDMDKIANELETGNYAGNKVGVLPANAKEIA
GVMFVWTNTNNEIIDENGQTLGVNIDPQTFKLSGAMPATAMKKLTEAEGAKFNTANLPAAKYKIYEIHSLSTYVGED
GATLTGSKAVPIEIELPLNDVVDAHVYPKNTEAKPKIDKDFKGKANPDTPRVDKDTPVNHQVGDVVEYEIVTKIPAL
ANYATANWSDRMTEGLAFNKGTVKVTVDDVALEAGDYALTEVATGFDLKLTDAGLAKVNDQNAEKTVKITYSATLND
KAIVEVPESNDVTFNYGNNPDHGNTPKPNKPNENGDLTLTKTWVDATGAPIPAGAEATFDLVNAQTGKVVQTVTLTT
DKNTVTVNGLDKNTEYKFVERSIKGYSADYQEITTAGEIAVKNWKDENPKPLDPTEPKVVTYGKKFVKVNDKDNRLA
GAEFVIANADNAGQYLARKADKVSQEEKQLVVTTKDALDRAVAAYNALTAQQQTQQEKEKVDKAQAAYNAAVIAANN
AFEWVADKDNENVVKLVSDAQGRFEITGLLAGTYYLEETKQPAGYALLTSRQKFEVTATSYSATGQGIEYTAGSGKD
DATKVVNKKITIPQTGGIGTIIFAVAGAAIMGIAVYAYVKNNKDEDQLA
SEQ ID NO:174
MKSINKFLTMLAALLLTASSLFSAATVFAADNVSTAPDAVTKTLTIHKLLLSEDDLKTWDTNGPKGYDGTQSSLKDL
TGVVAEEIPNVYFELQKYNLTDGKEKENLKDDSKWTTVHGGLTTKDGLKIETSTLKGVYRIREDRTKTTYVGPNGQV
LTGSKAVPALVTLPLVNNNGTVIDAHVFPKNSYNKPVVDKRIADTLNYNDQNGLSIGTKIPYVVNTTIPSNATFATS
FWSDEMTEGLTYNEDVTITLNNVAMDQADYEVTKGNNGFNLKLTEAGLAKINGKDADQKIQITYSATLNSLAVADIP
ESNDITYHYGNHQDHGNTPKPTKPNNGQITVTKTWDSQPAPEGVKATVQLVNAKTGEKVGAPVELSENNWTYTWSGL
DNSIEYKVEEEYNGYSAEYTVESKGKLGVKNWKDNNPAPINPEEPRVKTYGKKFVKVDQKDTRLENAQFVVKKADSN
KYIAFKSTAQQAADEKAAATAKQKLDAAVAAYTNAADKQAAQALVDQAQQEYNVAYKEAKFGYVEVAGKDEAMVLTS
NTDGQFQISGLAAGTYKLEEIKAPEGFAKIDDVEFVVGAGSWNQGEFNYLKDVQKNDATKVVNKKITIPQTGGIGTI
IFAVAGAAIMGIAVYAYVKNNKDEDQLA
 
SEQ ID NO:175
MKSINKFLTILAALLLTVSSLFSAATVFAAEQKTKTLTVHKLLMTDQELDAWNSDAITTAGYDGSQNFEQFKQLQGV
PQGVTEISGVAFELQSYTGPQGKEQENLTNDAVWTAVNKGVTTETGVKFDTEVLQGTYRLVEVRKESTYVGPNGKVL
TGMKAVPALITLPLVNQNGVVENAHVYPKNSEDKPTATKTFDTAAGFVDPGEKGLAIGTKVPYIVTTTIPKNSTLAT
AFWSDEMTEGLDYNGDVVVNYNGQPLDNSHYTLEAGHNGFILKLNEKGLEAINGKDAEATITLKYTATLNALAVADV
PEANDVTFHYGNNPGHGNTPKPNKPKNGELTITKTWADAKDAPIAGVEVTFDLVNAQTGEVVKVPGHETGIVLNQTN
NWTFTATGLDNNTEYKFVERTIKGYSADYQTITETGKIAVKNWKDENPEPINPEEPRVKTYGKKFVKVDQKDERLKE
AQFVVKNEQGKYLALKSAAQQAVNEKAAAEAKQALDAAIAAYTNAADKNAAQAVVDAAQKTYNDNYRAARFGYVEVE
RKEDALVLTSNTDGQFQISGLAAGSYTLEETKAPEGFAKLGDVKFEVGAGSWNQGDFNYLKDVQKNDATKVVNKKIT
IPQTGGIGTIIFAVAGAVIMGIAVYAYVKNNKDEDQLA
 
SEQ ID NO:176
MTMQKMQKMISRIFFVMALCFSLVWGAHAVQAQEDHTLVLQLENYQEVVSQLPSRDGHRLQVWKLDDSYSYDDRVQI
VRDLHSWDENKLSSFKKTSFEMTFLENQIEVSHIPNGLYYVRSIIQTDAVSYPAEFLFEMTDQTVEPLVIVAKKTDT
MTTKVKLIKVDQDHNRLEGVGFKLVSVARDVSEKEVPLIGEYRYSSSGQVGRTLYTDKNGEIFVTNLPLGNYRFKEV
EPLAGYAVTTLDTDVQLVDHQLVTITVVNQKLPRGNVDFMKVDGRTNTSLQGAMFKVMKEESGHYTPVLQNGKEVVV
TSGKDGRFRVEGLEYGTYYLWELQAPTGYVQLTSPVSFTIGKDTRKELVTVVKNNKRPRIDVPDTGEETLYILMLVA
ILLFGSGYYLTKKPNN
 
SEQ ID NO:177
DETLITHTAEKPKEEKMIVEEKADKALETKNVVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIES
QASSQEKPLKEDAKAVTNEEVNQMIENRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESP
AQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLYKDGRENVI
AVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQI
VERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWT
PNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAF
DTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKV
IKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPER
ELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDT
AGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQ
TSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYE
IVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSD
LLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSLVDVSKPGIVTVKGMAD
GREVEARVEVIALKSELPVVKRIAPNTNLNSVDKSVSYVLTDGSVQEYEVDKWEIAEEDKAK
 
SEQ ID NO:178
IAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPVVPTVTVGGEAVTGLTSRQPMQYRTLSYGAQLPEVT
ASAENADVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDG
TQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKGQVELTIQANTEKKIAQSIRPVNVVTDLHQEP
SLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQIFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLP
ESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFAS
DSNPSDPVSNVNDKLISYNNQPANRWTNWNRSNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGAPKSYVIEYY
VGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAIRIRMVKADNKRGTSITEVQ
IFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTANVSNNGLATVVPSVREGEPVRVIAKAENGD
ILGEYRLHFTKDKNLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTV
RGRVLGSNLVAEVTVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSS
NPEVSAGVIFRENGKIVERTVAQAKLHFFADSGTDAPSKLVLERYVGPGFEVPTYYSNYQAYESGHPFNNPENWEAV
PYRADKDIAAGDEINVTFKAVKAKVMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQD
YQITYKGQRPKVSVEENNQVASTVVDSGEDSLPVLVRLVSESGKQVKEYRIQLTKEKPVSAVQEDLPKLEFVEKDLA
YKTVEKKDSTLYLGETRVEQEGKVGKERIFTVINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADT
KPIDSSEADQTNKAQ
SEQ ID NO:179
MKKVRKIFQKAVAGLCCISQLTAFSSIVALAETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEA
QTGEAIFSNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQII
KVDGSEKNGQHKALNPNPYERVIPEGTLSKRIYQVNNLDDNQYGIELTVSGKTTVETKEASTPLDVVILLDNSNSMS
NIRHNHAHRAEKAGEATRALVDKITSNPDNRVALVTYGSTIFDGSEATVEKGVADANGKILNDSALWTFDRTTFTAK
TYNYSFLNLTSDPTDIQTIKDRIPSDAEELNKDKLMYQFGATFTQKALMTADDILTKQARPNSKKVIFHITDGVPTM
SYPINFKYTGTTQSYRTQLNNFKAKTPNSSGILLEDFVTWSADGEHKIVRGDGESYQMFTKKPVTDQYGVHQILSIT
SMEQRAKLVSAGYRFYGTDLYLYWRDSILAYPFNSSTDWITNHGDPTTWYYNGNMAQDGYDVFTVGVGVNGDPGTDE
ATATRFMQSISSSPDNYTNVADPSQILQELNRYFYTIVNEKKSIENGTITDPMGELIDFQLGADGRFDPADYTLTAN
DGSSLVNNVPTGGPQNDGGLLKNAKVFYDTTEKRIRVTGLYLGTGEKVTLTYNVRLNDQFVSNKFYDTNGRTTLHPK
EVEKNTVRDFPIPKIRDVRKYPEITIPKEKKLGEIEFIKINKNDKKPLRDAVFSLQKQHPDYPDIYGAIDQNGTYQN
VRTGEDGKLTFKNLSDGKYRLFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPI
PPKREYPRTGGIGMLPFYLIGCMMMGGVLLYTRKHP
 
SEQ ID NO:180
ADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAELQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDKA
EVVTPTSAEKETANKKEEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPETETGKERAATVNEKLAKK
KIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYNDP
NGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKALI
DKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFNDG
IYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWCYVLGRNADGQGWYNLDQGLNGIKNTP
ITSVPKTEGADIPIIGGMVAAWADTPSARYSPSHLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESVA
AVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLDQL
KRIVDKASELGYSDVHLLLGNDGLRFLLNDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEYA
KSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFGT
DEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGYN
LASPQYLASKGYKFLNTNGDWYYVIGNHKQDEAYPLSKAVENSGKVPFNQLASTKYPEVDLPTVGSMLSIWADRPSA
EYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVANL
KAALQGLKPAATHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTEN
GKTTETVLDSQVTKEVINQVVEVGSPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTRENPLLLKGKTQVITKGV
NGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEES
KALPQDPAPVVTEKK
 
SEQ ID NO:181
GAEETTTNTIQQSQKEVQYQQRDTKNLVENGDFGQTEDGSSPWTGSKAQGWSAWVDQKNSSADASTRVIEAKDGAIT
ISSPEKLRAAVHRMVPIEAKKKYKLRFKIKTDNKVGIAKVRIIEESGKDKRLWNSATTSGTKDWQTIEADYSPTLDV
DKIKLELFYETGTGTVSFKDIELVEVADQPSEDSQTDKQLEEKIDLPIGKKHVFSLADYTYKVENPDVASVKNGILE
PLKEGTTNVIVSKDGKEVKKIPLKILASVKDTYTDRLDDWNGIIAGNQYYDSKNEQMAKLNQELEGKVADSLSSISS
QADRIYLWEKFSNYKTSANLTATYRKLEEMAKQVTNPSSRYYQDETVVRTVRDSMEWMHKHVYNSEKSIVGNWWDYE
IGTPRAINNTLSLMKEYFSDEEIKKYTDVIEKFVPDPEHFRKTTDNPFKALGGNLVDMGRVKVIAGLLRKDDQEISS
TIRSIEQVFKLVDQGEGFYQDGSYIDHTNVAYTGAYGNVLIDGLSQLLPVIQKTKNPIDKDKMQTMYHWIDKSFAPL
LVNGELMDMSRGRSISRANSEGHVAAVEVLRGIHRIADMSEGETKQRLQSLVKTIVQSDSYYDVFKNLKTYKDISLM
QSLLSDAGVASVPRTSYLSAFNKMDKTAMYNAEKGFGFGLSLFSSRTLNYEHMNKENKRGWYTSDGMFYLYNGDLSH
YSDGYWPTVNPYKMPGTTETDAKRADSDTGKVLPSAFVGTSKLDDANATATMDFTNWNQTLTAHKSWFMLKDKIAFL
GSNIQNTSTDTAATTIDQRKLESSNPYKVYVNDKEASLTEQEKDYPETQSVFLESSDSKKNIGYFFFKKSSISMSKA
LQKGAWKDINEGQSDKEVENEFLTISQAHKQNGDSYGYMLIPNVDRATFNQMIKELESSLIENNETLQSVYDAKQGV
WGIVKYDDSVSTISNQFQVLKRGVYTIRKEGDEYKIAYYNPETQESAPDQEVFKKLEQAAQPQVQNSKEKEKSEEEK
NHSDQKN
 
SEQ ID NO:182
GAEETTTNTIQQSQKEVQYQQRDTKNLVENGDFGQTEDGSSPWTGSKAQGWSAWVDQKNSSADASTRVIEAKDGAIT
ISSPEKLRAAVHRMVPIEAKKKYKLRFKIKTDNKVGIAKVRIIEESGKDKRLWNSATTSGTKDWQTIEADYSPTLDV
DKIKLELFYETGTGTVSFKDIELVEVADQPSEDSQTDKQLEEKIDLPIGKKHVFSLADYTYKVENPDVASVKNGILE
PLKEGTTNVIVSKDGKEVKKIPLKILASVKDTYTDRLDDWNGIIAGNQYYDSKNEQMAKLNQELEGKVADSLSSISS
QADRIYLWEKFSNYKTSANLTATYRKLEEMAKQVTNPSSRYYQDETVVRTVRDSMEWMHKHVYNSEKSIVGNWWDYE
IGTPRAINNTLSLMKEYFSDEEIKKYTDVIEKFVPDPEHFRKTTDNPFKALGGNLVDMGRVKVIAGLLRKDDQEISS
TIRSIEQVFKLVDQGEGFYQDGSYIDHTNVAYTGAYGNVLIDGLSQLLPVIQKTKNPIDKDKMQTMYHWIDKSFAPL
LVNGELMDMSRGRSISRANSEGHVAAVEVLRGIHRIADMSEGETKQRLQSLVKTIVQSDSYYDVFKNLKTYKDISLM
QSLLSDAGVASV
 
SEQ ID NO:183
ANSEGHVAAVEVLRGIHRIADMSEGETKQRLQSLVKTIVQSDSYYDVFKNLKTYKDISLMQSLLSDAGVASVPRTSY
LSAFNKMDKTAMYNAEKGFGFGLSLFSSRTLNYEHMNKENKRGWYTSDGMFYLYNGDLSHYSDGYWPTVNPYKMPGT
TETDAKRADSDTGKVLPSAFVGTSKLDDANATATMDFTNWNQTLTAHKSWFMLKDKIAFLGSNIQNTSTDTAATTID
QRKLESSNPYKVYVNDKEASLTEQEKDYPETQSVFLESSDSKKNIGYFFFKKSSISMSKALQKGAWKDINEGQSDKE
VENEFLTISQAHKQNGDSYGYMLIPNVDRATFNQMIKELESSLIENNETLQSVYDAKQGVWGIVKYDDSVSTISNQF
QVLKRGVYTIRKEGDEYKIAYYNPETQESAPDQEVFKKLEQAAQPQVQNSKEKEKSEEEKNHSDQKN
 
SEQ ID NO:184
DETLITHTAEKPKEEKMIVEEKADKALETKNVVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIES
QASSQEKPLKEDAKAVTNEEVNQMIENRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESP
AQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLYKDGRENVI
AVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQI
VERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWT
PNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAF
DTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKV
IKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPER
ELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDT
AGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQ
TSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYE
IVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSD
LLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSLVDVSKPGIVTVKGMAD
GREVEARVEVIALKSELPVVKRIAPNTNLNSVDKSVSYVLTDGSVQEYEVDKWEIAEEDKAKLAIPGSRIQATGYLE
GQPIHATLVVEEGNPAAPVVPTVTVGGEAVTGLTSRQPMQYRTLSYGAQLPEVTASAENADVTVLQASAANGMRASI
FIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIR
KGMLELHKPGAVTLNAEYEGAKGQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQ
AIPKEKLDSYQIFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIR
PEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPA
NRWTNWNRSNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGAPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFN
DSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAIRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDL
ANFNPDLTDYYLESVDGKVPAVTANVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKNLLSHKPVAA
VKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEVTVRVTDKLGE
TLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVAQ
AKLHFFADSGTDAPSKLVLERYVGPGFEVPTYYSNYQAYESGHPFNNPENWEAVPYRADKDIAAGDEINVTFKAVKA
KVMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVAST
VVDSGEDSLPVLVRLVSESGKQVKEYRIQLTKEKPVSAVQEDLPKLEFVEKDLAYKTVEKKDSTLYLGETRVEQEGK
VGKERIFTVINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEADQTNKAQ
 
SEQ ID NO:185
ASDGTWQGKQYLKEDGSQAANEWVFDTHYQSWFYIKADANYAENEWLKQGDDYFYLKSGGYMAKSEWVEDKGAFYYL
DQDGKMKRNAWVGTSYVGATGAKVIEDWVYDSQYDAWFYIKADGQHAEKEWLQIKGKDYYFKSGGYLLTSQWINQAY
VNASGAKVQQGWLFDKQYQSWFYIKENGNYADKEWIFENGHYYYLKSGGYMAANEWIWDKESWFYLKFDGKIAEKEW
VYDSHSQAWYYFKSGGYMAANEWIWDKESWFYLKFDGKMAEKEWVYDSHSQAWYYFKSGGYMTANEWIWDKESWFYL
KSDGKIAEKEWVYDSHSQAWYYFKSGGYMTANEWIWDKESWFYLKSDGKMAEKEWVYDSHSQAWYYFKSGGYMAKNE
TVDGYQLGSDGKWLGGKATNKNAAYYQVVPVTANVYDSDGEKLSYISQGSVVWLDKDRKSDDKRLAITISGLSGYMK
TEDLQALDASKDFIPYYESDGHRFYHYVAQNASIPVASHLSDMEVGKKYYSADGLHFDGFKLENPFLFKDLTEATNY
SAEELDKVFSLLNINNSLLENKGATFKEAEEHYHINALYLLAHSALESNWGRSKIAKDKNNFFGITAYDTTPYLSAK
TFDDVDKGILGATKWIKENYIDRGRTFLGNKASGMNVEYASDPYWGEKIASVMMKINEKLGGKD
 
SEQ ID NO:186
ACSKGSEGADLISMKGDVITEHQFYEQVKNNPSAQQVLLNMTIQKVFEKQYGSELDDKEVDDTIAEEKKQYGENYQR
VLSQAGMTLETRKAQIRTSKLVELAVKKVAEAELTDEAYKKAFDEYTPDVTAQIIRLNNEDKAKEVLEKAKAEGADF
AQLAKDNSTDEKTKENGGEITFDSASTEVPEQVKKAAFALDVDGVSDVITATGTQAYSSQYYIVKLTKKTEKSSNID
DYKEKLKTVILTQKQNDSTFVQSIIGKELQAANIKVKDQAFQNIFTQYIGGGDSSSSSSTSNE
 
SEQ ID NO:187
ALIFNTQIRNIFIVWNTNKYQVSQVSKEKLEENQDTEGNFDFDSVKAISSEAVLTSQWDAQKLPVIGGIAIPELEMN
LPIFKGLDNVNLFYGAGTMKREQVMGEGNYSLASHHIFGVDNANKMLFSPLDNAKNGMKIYLTDKNKVYTYEIREVK
RVTPDRVDEVDDRDGVNEITLVTCEDLAATERIIVKGDLKETKDYSQTSDEILTAFNQPYKQFY
 
SEQ ID NO:188
VPKTATSTETKTITRIIHYVDKVTNQNVKEDVVQPVTLSRTKTENKVTGVVTYGEWTTGNWDEVISGKIDKYKDPDI
PTVESQEVTSDSSDKEITVRYDRLSTPEKPIPQPNPEHPSVPTPNPELPNQETPTPDKPTPEPGTPKTETPVNPDPE
VPTYETGKREE
SEQ ID NO:189
ANETEVAKTSQDTTTASSSSEQNQSSNKTQTSAEVQTNAAAYWDGDYYVKDDGSKAQSEWIFDNYYKAWFYINSDGR
YSQNEWHGNYYLKSGGYMAQNEWIYDSNYKSWFYLKSDGAYAHQEWQLIGNKWYYFKKWGYMAKSQWQGSYFLNGQG
AMIQNEWLYDPAYSAYFYLKSDGTYANQEWQKVGGKWYYFKKWGYMARNEWQGNYYLTGSGAMATDEVIMDGARYIF
AASGELKEKKDLNVGWVHRDGKRYFFNNREEQVGTEHAKKIIDISEHNGRINDWKKVIDENKVDGVIVRLGYSGKED
KELAHNIKELNRLGIPYGVYLYTYAENETDAENDAKQTIELIKKYNMNLSYPIYYDVENWEYVNKSKRAPSDTDTWV
KIINKYMDTMKQAGYQNVYVYSYRSLLQTRLKHPDILKHVNWVAAYTNALEWENPYYSGEKGWQYTSSEYMKGIQGR
VDVSVWY
 
SEQ ID NO:190
AETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQS
LEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQQ
KLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTNL
TAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAIA
CWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYAD
 
SEQ ID NO:191
ETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKPSTK
QWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTLSKR
IYQVNNLDDNQYGIELTVSGKTTVETKEASTPLDVVILLDNSNSMSNIRHNHAHRAEKAGEATRALVDKITSNPDNR
VALVTYGSTIFDGSEATVEKGVADANGKILNDSALWTFDRTTFTAKTYNYSFLNLTSDPTDIQTIKDRIPSDAEELN
KDKLMYQFGATFTQKALMTADDILTKQARPNSKKVIFHITDGVPTMSYPINFKYTGTTQSYRTQLNNFKAKTPNSSG
ILLEDFVTWSADGEHKIVRGDGESYQMFTKKPVTDQYGVHQILSITSMEQRAKLVSAGYRFYGTDLYLYWRDSILAY
PFNSSTDWITNHGDPTTWYYNGNMAQDGYDVFTVGVGVNGDPGTDEATATRFMQSISSSPDNYTNVADPSQILQELN
RYFYTIVNEKKSIENGTITDPMGELIDFQLGADGRFDPADYTLTANDGSSLVNNVPTGGPQNDGGLLKNAKVFYDTT
EKRIRVTGLYLGTGEKVTLTYNVRLNDQFVSNKFYDTNGRTTLHPKEVEKNTVRDFPIPKIRDVRKYPEITIPKEKK
LGEIEFIKINKNDKKPLRDAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENSEPAGYK
PVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKRE
 
SEQ ID NO:192
ETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKPSTK
QWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTLSKR
IYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDSENR
VALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAEDHD
GNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPNKDG
ILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWRESI
LAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTKILE
QLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAKVLY
DTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEITISK
EKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENSEPA
GYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKRE
 
SEQ ID NO:193
MAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQ
SLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQ
QKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTN
LTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAI
ACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGADGVTPTTTE
NQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDKAEVVTPTSAEK
ETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAKKKIVSIDAGRK
YFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYNDPNGNHLTESQM
TDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKALIDKYAAYFAKK
TEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFNDGIYYNSDTSFG
SFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNTPITSVPKTEGA
DIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESVTAVKEAEKAIR
SLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQLKRIVDKASEL
GYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEYAKSKDIGLIPA
INSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFGTDEYANDATSA
QGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGYNLASPQYLASK
GYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPSAEYKEEEIFEL
MTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVANLKAALQGLKPA
VTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTENGKTTETVLDS
QVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKGVNGHRSNFYSV
STSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEESKVLPQDPAPV
VTEKKLEHHHHHH
 
SEQ ID NO:194
MAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQ
SLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQ
QKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTN
LTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAI
ACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGVSAQESSTYT
VKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETVSAPVAETPVVS
ETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRYGSWTAAKNFWL
NNGWYLEHHHHHH
 
SEQ ID NO:195
MAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQ
SLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQ
QKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTN
LTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAI
ACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGDETLITHTAE
KPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLK
EDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNG
GEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPS
SRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTG
LVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGE
RIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPY
DYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYV
TMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPER
NYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYL
YQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEG
ANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVP
TANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVF
TGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEV
IALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVV
EEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPL
QTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPG
AVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSY
QTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVF
TVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTN
PEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTN
LKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDY
YLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVG
QALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDE
NSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSG
TDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERK
ADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFP
VLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKER
IFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:196
MAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQ
SLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQ
QKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTN
LTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAI
ACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGDETLITHTAE
KPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLK
EDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNG
GEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPS
SRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTG
LVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGE
RIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPY
DYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYV
TMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPER
NYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYL
YQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEG
ANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVP
TANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVF
TGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEV
IALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKAAALEHHHHHH
 
SEQ ID NO:197
MAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQ
SLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQ
QKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTN
LTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAI
ACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGIAEEDKAKLA
IPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTV
LQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKV
TFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEY
DKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNG
HVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSN
VNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPK
NPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAK
QGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFT
KDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLV
AEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIF
RENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAA
GDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRP
KVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVE
KKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDS
SEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:198
MASAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSR
NQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIA
NQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASAN
TNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVG
AIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADGSGSGGGGETPETSPA
IGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEK
NGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTLSKRIYQVNNLD
DNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDSENRVALVTYAS
TIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAEDHDGNRLMYQF
GATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPNKDGILLSDFIT
QATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWRESILAYPFNSN
TAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTKILEQLNRYFHT
IVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAKVLYDTTEKRIR
VTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEITISKEKKLGDIE
FIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENSEPAGYKPVQNK
PIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKRELEHHHHHH
 
SEQ ID NO:199
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRL
QAESKKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKA
DKKAISEKQVANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAV
AEAAYKEKRASQQQSVLASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNG
AQWATSAAAAGFRTGSTPQVGAIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVT
YIYADAAALEHHHHHH
SEQ ID NO:200
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDG
PVAPVATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDS
YLNGDYSAENQERVADAYVAGRYGSWTAAKNFWLNNGWYLEHHHHHH
 
SEQ ID NO:201
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIF
SNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEK
NGQHKALNPNPYERVIPEGTLSKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNA
RRAERAGEATRSLIDKITSDSENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYL
KLTNDKNDIVELKNKVPTEAEDHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFN
HATFAPSYQNQLNAFFSKSPNKDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMK
AAGYAVIGDPINGGYIWLNWRESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATAT
SFMQSISSKPENYTNVTDTTKILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSR
LENGQAVGGPQNDGGLLKNAKVLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQ
NTVRDFPIPKIRDVRKYPEITISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTG
EDGKLTFKNLSDGKYRLFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKR
ELEHHHHHH
 
SEQ ID NO:202
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKE
DEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDAD
VSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHY
PNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKV
ETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELIT
RVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTT
HNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWS
IGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHP
KWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYI
GEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAY
SNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPA
AVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAF
NGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRA
ERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKW
EIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEV
TASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQD
GTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQE
PSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQL
PESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFA
SDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEY
YVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEV
QIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENG
DILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFT
VRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPS
SNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEA
VPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQ
DYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEF
VEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQV
SEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:203
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKE
DEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDAD
VSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHY
PNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKV
ETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELIT
RVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTT
HNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWS
IGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHP
KWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYI
GEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAY
SNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPA
AVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAF
NGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRA
ERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKW
EIAEEDKAKAAALEHHHHHH
SEQ ID NO:204
MADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDK
AEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAK
KKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYND
PNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKAL
IDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFND
GIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNT
PITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESV
TAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQ
LKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEY
AKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFG
TDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGY
NLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPS
AEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVAN
LKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTE
NGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKG
VNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEE
SKVLPQDPAPVVTEKKGSGSGGGGIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAV
TGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQ
VEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQ
ANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKV
SVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVS
AQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSV
DNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKV
ETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNG
LATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYE
TKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDR
VDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVP
TYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELP
QESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHL
TKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVE
VPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:205
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRL
QAESKKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKA
DKKAISEKQVANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAV
AEAAYKEKRASQQQSVLASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNG
AQWATSAAAAGFRTGSTPQVGAIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVT
YIYADAAALEHHHHHH
 
SEQ ID NO:206
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATD
KVASLPKTEEKPQEEVSSTPSDKAEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKA
EADKPATEAGKERAATVNEKLAKKKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITAN
GKTYASDDVKRAIEKGTNDYYNDPNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSY
FGKKSARTVDLDNEQAVAFTKALIDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKF
IAYANDLARIVKSHGLKPMAFNDGIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYV
LGRNADGQGWYNLDQGLNGIKNTPITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAAD
YESAEQALNEVPKDLNRYTAESVTAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKRE
VEKLAKNKVISIDAGRKYFTLNQLKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGT
KAYYDDPNGTALTQAEVTELIEYAKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMN
FVKALIGKYMDFFAGKTKIFNFGTDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYE
DKDDVQFDKDVLISYWSKGWWGYNLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLAS
TKYPEVDLPTVGSMLSIWADRPSAEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDA
AKTALNYNLNRNKQAELDTLVANLKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPA
GQENIITAGVKGERTHYISVLTENGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEI
PFTTVTCENPLLLKGKTQVITKGVNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAA
IAEEKPKLEIPSQPAPSTAPAEESKVLPQDPAPVVTEKKLEHHHHHH
SEQ ID NO:207
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIF
SNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEK
NGQHKALNPNPYERVIPEGTLSKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNA
RRAERAGEATRSLIDKITSDSENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYL
KLTNDKNDIVELKNKVPTEAEDHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFN
HATFAPSYQNQLNAFFSKSPNKDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMK
AAGYAVIGDPINGGYIWLNWRESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATAT
SPMQSISSKPENYTNVTDTTKILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSR
LENGQAVGGPQNDGGLLKNAKVLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQ
NTVRDFPIPKIRDVRKYPEITISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTG
EDGKLTFKNLSDGKYRLFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKR
ELEHHHHHH
 
SEQ ID NO:208
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKE
DEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDAD
VSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHY
PNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKV
ETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELIT
RVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTT
HNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWS
IGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHP
KWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYI
GEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAY
SNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPA
AVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAF
NGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRA
ERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKW
EIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEV
TASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQD
GTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQE
PSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQL
PESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFA
SDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEY
YVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEV
QIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENG
DILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFT
VRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPS
SNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEA
VPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQ
DYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEF
VEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQV
SEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:209
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKE
DEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDAD
VSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHY
PNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKV
ETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELIT
RVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTT
HNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWS
IGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHP
KWLIYGSETSSATRTRGSYYRPERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYI
GEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAY
SNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPA
AVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAF
NGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRA
ERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKW
EIAEEDKAKAAALEHHHHHH
 
SEQ ID NO:210
MVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETV
SAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRY
GSWTAAKNFWLNNGWYGSGSGGGGIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAV
TGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQ
VEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQ
ANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKV
SVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVS
AQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSV
DNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKV
ETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNG
LATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYE
TKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDR
VDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVP
TYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELP
QESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHL
TKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVE
VPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:211
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGAETTDDKIAAQD
NKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQSLEKQARSAQTNG
AVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQQKLADDAQALTTK
QAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTNLTAQVQAVSESAA
APVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAIACWNDGGYGHVAV
VTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADAAALEHHHHHH
 
SEQ ID NO:212
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGDETLITHTAEKP
KEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKED
AKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGE
AWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSR
WYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLV
RTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERI
KFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDY
GRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTM
GADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPERNY
EQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQ
SQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGAN
ANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTA
NNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTG
KKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIA
LKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEE
GNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQT
YAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAV
TLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQT
FEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTV
NGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPE
ASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLK
APAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYL
ESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQA
LELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENS
NQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTD
APSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKAD
KSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVL
VRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIF
TAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQAAALEHHHHHH
 
SEQ ID NO:213
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGDETLITHTAEKP
KEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKED
AKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGE
AWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSR
WYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAEYQIVERGGHAVTGLV
RTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYYHWTPNEGFSLNGERI
KFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQEEAFDTWYGGKKPYDY
GRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRLVKVIKDVDKTRYVTM
GADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELKHSNGPERNY
EQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFYLYQ
SQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGAN
ANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTA
NNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTG
KKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIA
LKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKAAALEHHHHHH
 
SEQ ID NO:214
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGIAEEDKAKLAIP
GSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQ
ASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTF
STSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDK
GFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHV
SSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVN
DKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNP
SFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQG
QTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKD
KSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAE
ITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRE
NGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGD
EINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKV
SVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKK
DSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSE
ASQTNKAQAAALEHHHHHH
 
SEQ ID NO:215
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGADGVTPTTTENQ
PTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDKAEVVTPTSAEKET
ANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAKKKIVSIDAGRKYF
SPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYNDPNGNHLTESQMTD
LINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKALIDKYAAYFAKKTE
IFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFNDGIYYNSDTSFGSF
DKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNTPITSVPKTEGADI
PIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESVTAVKEAEKAIRSL
DSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQLKRIVDKASELGY
SDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEYAKSKDIGLIPAIN
SPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFGTDEYANDATSAQG
WYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGYNLASPQYLASKGY
KFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPSAEYKEEEIFELMT
AFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVANLKAALQGLKPAVT
HSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTENGKTTETVLDSQV
TKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKGVNGHRSNFYSVST
SADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEESKVLPQDPAPVVT
EKKLEHHHHHH
 
SEQ ID NO:216
MASETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKP
STKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTL
SKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDS
ENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAE
DHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPN
KDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWR
ESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTK
ILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAK
VLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEIT
ISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENS
EPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKREGSGSGGGGVSAQESSTYTVK
EGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETVSAPVAETPVVSET
VVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRYGSWTAAKNFWLNN
GWYLEHHHHHH
 
SEQ ID NO:217
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATG
YLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMR
ASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEV
AIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKV
TWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWD
AIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNN
QPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDH
VFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDG
KDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKP
VAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDK
LGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERT
VTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKA
IKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQV
ASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGE
TRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQ
GSGSGGGGADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEV
SSTPSDKAEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAAT
VNEKLAKKKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKG
TNDYYNDPNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQA
VAFTKALIDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGL
KPMAFNDGIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQG
LNGIKNTPITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLN
RYTAESVTAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGR
KYFTLNQLKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAE
VTELIEYAKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGK
TKIFNFGTDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYW
SKGWWGYNLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLS
IWADRPSAEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAE
LDTLVANLKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTH
YISVLTENGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGK
TQVITKGVNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAP
STAPAEESKVLPQDPAPVVTEKKAAALEHHHHHH
 
SEQ ID NO:218
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKGSGSGGGGADGV
TPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVETETPATDKVASLPKTEEKPQEEVSSTPSDKAEVVT
PTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPAKKDEAKAEADKPATEAGKERAATVNEKLAKKKIVS
IDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLDDMSITANGKTYASDDVKRAIEKGTNDYYNDPNGNH
LTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGIQNPNFSYFGKKSARTVDLDNEQAVAFTKALIDKYA
AYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYPVKGYEKFIAYANDLARIVKSHGLKPMAFNDGIYYN
SDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNTNDAWYYVLGRNADGQGWYNLDQGLNGIKNTPITSV
PKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANANAEYFAADYESAEQALNEVPKDLNRYTAESVTAVKE
AEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQKEEEAKREVEKLAKNKVISIDAGRKYFTLNQLKRIV
DKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVKKAIIEGTKAYYDDPNGTALTQAEVTELIEYAKSKD
IGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDLKNEEAMNFVKALIGKYMDFFAGKTKIFNFGTDEYA
NDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAFNDGFYYEDKDDVQFDKDVLISYWSKGWWGYNLASP
QYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKTPFNQLASTKYPEVDLPTVGSMLSIWADRPSAEYKE
EEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKESLEALDAAKTALNYNLNRNKQAELDTLVANLKAAL
QGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKKENPNLPAGQENIITAGVKGERTHYISVLTENGKTT
ETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRLDIQEEEIPFTTVTCENPLLLKGKTQVITKGVNGHR
SNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVGDENGQAAIAEEKPKLEIPSQPAPSTAPAEESKVLP
QDPAPVVTEKKAAALEHHHHHH
SEQ ID NO:219
MASIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLP
EVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHY
QDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH
QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAP
QLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLA
FASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVI
EYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSIT
EVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAE
NGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQ
FTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPT
PSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENW
EAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAEN
RQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKI
EFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKP
QVSEKADTKPIDSSEASQTNKAQGSGSGGGGADGVTPTTTENQPTIHTVSDSPQSSENRTEETPKAVLQPEAPKTVE
TETPATDKVASLPKTEEKPQEEVSSTPSDKAEVVTPTSAEKETANKKAEEASPKKEEAKEVDSKESNTDKTDKDKPA
KKDEAKAEADKPATEAGKERAATVNEKLAKKKIVSIDAGRKYFSPEQLKEIIDKAKHYGYTDLHLLVGNDGLRFMLD
DMSITANGKTYASDDVKRAIEKGTNDYYNDPNGNHLTESQMTDLINYAKDKGIGLIPTVNSPGHMDAILNAMKELGI
QNPNFSYFGKKSARTVDLDNEQAVAFTKALIDKYAAYFAKKTEIFNIGLDEYANDATDAKGWSVLQADKYYPNEGYP
VKGYEKFIAYANDLARIVKSHGLKPMAFNDGIYYNSDTSFGSFDKDIIVSMWTGGWGGYDVASSKLLAEKGHQILNT
NDAWYYVLGRNADGQGWYNLDQGLNGIKNTPITSVPKTEGADIPIIGGMVAAWADTPSARYSPSRLFKLMRHFANAN
AEYFAADYESAEQALNEVPKDLNRYTAESVTAVKEAEKAIRSLDSNLSRAQQDTIDQAIAKLQETVNNLTLTPEAQK
EEEAKREVEKLAKNKVISIDAGRKYFTLNQLKRIVDKASELGYSDVHLLLGNDGLRFLLDDMTITANGKTYASDDVK
KAIIEGTKAYYDDPNGTALTQAEVTELIEYAKSKDIGLIPAINSPGHMDAMLVAMEKLGIKNPQAHFDKVSKTTMDL
KNEEAMNFVKALIGKYMDFFAGKTKIFNFGTDEYANDATSAQGWYYLKWYQLYGKFAEYANTLAAMAKERGLQPMAF
NDGFYYEDKDDVQFDKDVLISYWSKGWWGYNLASPQYLASKGYKFLNTNGDWYYILGQKPEDGGGFLKKAIENTGKT
PFNQLASTKYPEVDLPTVGSMLSIWADRPSAEYKEEEIFELMTAFADHNKDYFRANYNALREELAKIPTNLEGYSKE
SLEALDAAKTALNYNLNRNKQAELDTLVANLKAALQGLKPAVTHSGSLDENEVAANVETRPELITRTEEIPFEVIKK
ENPNLPAGQENIITAGVKGERTHYISVLTENGKTTETVLDSQVTKEVINQVVEVGAPVTHKGDESGLAPTTEVKPRL
DIQEEEIPFTTVTCENPLLLKGKTQVITKGVNGHRSNFYSVSTSADGKEVKTLVNSVVAQEAVTQIVEVGTMVTHVG
DENGQAAIAEEKPKLEIPSQPAPSTAPAEESKVLPQDPAPVVTEKKLEHHHHHH
 
SEQ ID NO:220
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATG
YLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMR
ASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEV
AIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKV
TWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWD
AIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNN
QPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDH
VFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDG
KDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKP
VAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDK
LGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERT
VTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKA
IKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQV
ASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGE
TRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQ
GSGSGGGGVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAP
AAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVAD
AYVAGRYGSWTAAKNFWLNNGWYLEHHHHHH
SEQ ID NO:221
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKGSGSGGGGVSAQ
ESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETVSAPVA
ETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAENQERVADAYVAGRYGSWTA
AKNFWLNNGWYLEHHHHHH
 
SEQ ID NO:222
MASIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLP
EVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHY
QDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH
QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAP
QLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLA
FASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVI
EYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSIT
EVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAE
NGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQ
FTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPT
PSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENW
EAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAEN
RQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKI
EFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKP
QVSEKADTKPIDSSEASQTNKAQGSGSGGGGVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVD
QELVIDGPVAPVATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIG
RYQLTDSYLNGDYSAENQERVADAYVAGRYGSWTAAKNFWLNNGWYLEHHHHHH
 
SEQ ID NO:223
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATG
YLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMR
ASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEV
AIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKV
TWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWD
AIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNN
QPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDH
VFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDG
KDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKP
VAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDK
LGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERT
VTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKA
IKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQV
ASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGE
TRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQ
GSGSGGGGAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSK
NIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAI
NTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSV
LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGS
TPQVGAIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADAAALEHHHHHH
 
SEQ ID NO:224
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKGSGSGGGGAETT
DDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAESKKLEGEITELSKNIVSRNQSLEKQ
ARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQVANNDAINTVIANQQKLAD
DAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSVLASANTNLTAQV
QAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGAIACWND
GGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYADAAALEHHHHHH
 
SEQ ID NO:225
MASIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLP
EVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHY
QDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH
QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAP
QLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLA
FASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVI
EYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSIT
EVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAE
NGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQ
FTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPT
PSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENW
EAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAEN
RQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKI
EFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKP
QVSEKADTKPIDSSEASQTNKAQGSGSGGGGAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNL
QAENDRLQAESKKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNK
MLEQQKADKKAISEKQVANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEA
EARAAAVAEAAYKEKRASQQQSVLASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWA
GDYWGNGAQWATSAAAAGFRTGSTPQVGAIACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTT
TSEGFVTYIYADAAALEHHHHHH
 
SEQ ID NO:226
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATG
YLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMR
ASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHYQDGTQAVLPADKVTFSTSGEGEV
AIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLHQEPSLPATVTVEYDKGFPKTHKV
TWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESVRTYDSNGHVSSAKVAWD
AIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNN
QPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFVGNEDH
VFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDG
KDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKP
VAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDK
LGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERT
VTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKA
IKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQV
ASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGE
TRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQ
GSGSGGGGETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPP
VGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVI
PEGTLSKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDK
ITSDSENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKV
PTEAEDHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFF
SKSPNKDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYI
WLNWRESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNV
TDTTKILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGL
LKNAKVLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRK
YPEITISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYR
LFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKRELEHHHHHH
 
SEQ ID NO:227
MASDETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQSEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPR
IESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANSKEAIKPDADVSTWKKLDLPYDWSIFNDFDH
ESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLVGHYPNGYNQFSYDITKYLQKDGRE
NVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETHVTSKIVNTDDKDHELVAE
YQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLVDAKKDLFGYRYY
HWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAELGLLVQE
EAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRL
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYR
PERELKHSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGI
VDTAGIPKHDFYLYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFN
KKQTSDGRTYQEGANANELYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYI
YYEIVDSQGNVVPTANNLVRFQLHGQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTA
HSDLLKSNQVTVFTGKKEGQEKTVLGTEVPKVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKG
MADGREVEARVEVIALKSELPVVKRIAPNTDLNSVDKSVSYVLIDGSVEEYEVDKWEIAEEDKAKGSGSGGGGETPE
TSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEAQTGEAIFSNIKPGTYTLTEAQPPVGYKPSTKQWTV
EVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQIIKVDGSEKNGQHKALNPNPYERVIPEGTLSKRIYQV
NNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMSNIRNKNARRAERAGEATRSLIDKITSDSENRVALV
TYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTNTKDYSYLKLTNDKNDIVELKNKVPTEAEDHDGNRL
MYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTMSYPINFNHATFAPSYQNQLNAFFSKSPNKDGILLS
DFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKPEKYSEMKAAGYAVIGDPINGGYIWLNWRESILAYP
FNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPGTDEATATSFMQSISSKPENYTNVTDTTKILEQLNR
YFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTLTANDGSRLENGQAVGGPQNDGGLLKNAKVLYDTTE
KRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTLHPKEVEQNTVRDFPIPKIRDVRKYPEITISKEKKL
GDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGTYQNVRTGEDGKLTFKNLSDGKYRLFENSEPAGYKP
VQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITNEPIPPKRELEHHHHHH
 
SEQ ID NO:228
MASIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPMQYRTLAYGAKLP
EVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKLSVRAHY
QDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH
QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAP
QLPESVRTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLA
FASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVI
EYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSIT
EVQIFAKQVAAAKQGQTRIQVDGKDLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAE
NGDILGEYRLHFTKDKSLLSHKPVAAVKQARLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQ
FTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDENSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPT
PSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSKLVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENW
EAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMTFLAPSELPQESTQSKILVDGKELADFAEN
RQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRIHLTKEKPVSEKTVAAVQEDLPKI
EFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTDRIVLVGTKPVAQEAKKP
QVSEKADTKPIDSSEASQTNKAQGSGSGGGGETPETSPAIGKVVIKETGEGGALLGDAVFELKNNTDGTTVSQRTEA
QTGEAIFSNIKPGTYTLTEAQPPVGYKPSTKQWTVEVEKNGRTTVQGEQVENREEALSDQYPQTGTYPDVQTPYQII
KVDGSEKNGQHKALNPNPYERVIPEGTLSKRIYQVNNLDDNQYGIELTVSGKTVYEQKDKSVPLDVVILLDNSNSMS
NIRNKNARRAERAGEATRSLIDKITSDSENRVALVTYASTIFDGTEFTVEKGVADKNGKRLNDSLFWNYDQTSFTTN
TKDYSYLKLTNDKNDIVELKNKVPTEAEDHDGNRLMYQFGATFTQKALMKADEILTQQARQNSQKVIFHITDGVPTM
SYPINFNHATFAPSYQNQLNAFFSKSPNKDGILLSDFITQATSGEHTIVRGDGQSYQMFTDKTVYEKGAPAAFPVKP
EKYSEMKAAGYAVIGDPINGGYIWLNWRESILAYPFNSNTAKITNHGDPTRWYYNGNIAPDGYDVFTVGIGINGDPG
TDEATATSFMQSISSKPENYTNVTDTTKILEQLNRYFHTIVTEKKSIENGTITDPMGELIDLQLGTDGRFDPADYTL
TANDGSRLENGQAVGGPQNDGGLLKNAKVLYDTTEKRIRVTGLYLGTDEKVTLTYNVRLNDEFVSNKFYDTNGRTTL
HPKEVEQNTVRDFPIPKIRDVRKYPEITISKEKKLGDIEFIKVNKNDKKPLRGAVFSLQKQHPDYPDIYGAIDQNGT
YQNVRTGEDGKLTFKNLSDGKYRLFENSEPAGYKPVQNKPIVAFQIVNGEVRDVTSIVPQDIPAGYEFTNDKHYITN
EPIPPKRELEHHHHHH
 
SEQ ID NO:229
VSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAPVATPAPATYAAPAAQDETVS
APVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYGSWTAAKNFWLNNGWY
 
SEQ ID NO:230
ICICICICICICICICICICICICIC
 
SEQ ID NO:231
KLKLLLLLKLK
 
SEQ ID NO:232
GSGGGG
SEQ ID NO:233
GSGSGGGG
 
SEQ ID NO:234
HHHHHH
 
SEQ ID NO:235
AAALE

Claims (31)

1.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和/或(14)spr1707抗原。
2.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种、三种或四种抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原,其中:
所述spr0057抗原是包含某氨基酸序列的多肽,该序列:(a)与SEQ ID NO:1具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO:1的至少10个连续氨基酸的片段;
所述spr0096抗原是包含某氨基酸序列的多肽,该序列:(a)与SEQ ID NO:12具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO:12的至少10个连续氨基酸的片段;
所述spr0565抗原是包含某氨基酸序列的多肽,该序列:(a)与SEQ ID NO:3具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO:3的至少10个连续氨基酸的片段;和
所述spr2021抗原是包含某氨基酸序列的多肽,该序列:(a)与SEQ ID NO:11具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO:11的至少10个连续氨基酸的片段。
3.如权利要求2所述的组合物,其特征在于,还包含肺炎链球菌RrgA和/或RrgB菌毛抗原。
4.如权利要求2或3所述的组合物,其特征在于,还包含肺炎链球菌Pmp抗原。
5.如权利要求2、3或4所述的组合物,其特征在于,还包含一种或多种肺炎球菌荚膜糖和载体蛋白的偶联物,其中(i)所述荚膜糖来自以下一种或多种肺炎球菌血清型:1、3、4、5、6B、7F、9V、14、18C、19F和23F;和(ii)所述载体蛋白是细菌毒素或类毒素,或者是流感嗜血杆菌的蛋白D。
6.一种免疫原性组合物,其包含以下组合:(a)一种或多种选自下组的抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和/或(14)spr1707抗原;和(b)一种或多种肺炎球菌荚膜糖和载体蛋白的偶联物。
7.一种免疫原性组合物,其包含以下组合:(a)一种或多种选自下组的抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和/或(14)spr1707抗原;和(b)一种或多种选自下组的抗原:白喉类毒素;破伤风类毒素;乙型肝炎病毒表面抗原;灭活的脊髓灰质炎病毒抗原;一种或多种非细胞百日咳抗原;B型流感嗜血杆菌荚膜糖抗原的偶联物;脑膜炎奈瑟球菌血清组C荚膜糖抗原的偶联物;脑膜炎奈瑟球菌血清组Y荚膜糖抗原的偶联物;脑膜炎奈瑟球菌血清组W135荚膜糖抗原的偶联物;和脑膜炎奈瑟球菌血清组A荚膜糖抗原的偶联物。
8.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr0057抗原;(2)spr0565抗原;(3)spr0286抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;和/或(7)spr1418抗原。
9.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr2021抗原;(2)spr1431抗原;(3)spr1739抗原;和/或(4)spr0867抗原。
10.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr0057抗原;(2)spr0565抗原;(3)spr2021抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;和/或(11)spr0286抗原。
11.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr0096抗原;(2)spr1433抗原;和/或(3)spr1707抗原。
12.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr1098抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0286抗原;(9)spr1433抗原;和/或(10)spr1707抗原。
13.一种包含肺炎链球菌抗原组合的免疫原性组合物,所述组合包括选自下组的两种或多种抗原:(1)spr2021抗原;(2)spr0096抗原;(3)spr1739抗原;(4)spr0867抗原;(5)spr1431抗原;(6)spr1433抗原;和/或(7)spr1707抗原。
14.一种免疫原性组合物,其包含以下组合:(a)一种或多种选自下组的抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和/或(14)spr1707抗原;和(b)温度保护剂。
15.一种免疫原性组合物,其包含两种或多种不同的肺炎球菌外切糖苷酶。
16.一种免疫原性组合物,其包含至少一种肺炎球菌外切糖苷酶和至少一种肺炎球菌肽聚糖水解酶。
17.一种免疫原性组合物,其包含两种或多种不同的肺炎球菌肽聚糖水解酶。
18.一种免疫原性组合物,其包含权利要求19-25中任一项所述的多肽。
19.一种式NH2-A-{-X-L-}n-B-COOH所示的多肽,式中:
X是选自下组的肺炎球菌抗原的氨基酸序列:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)RrgA抗原;和(6)RrgB抗原;
L是任选的接头氨基酸序列;
A是任选的N末端氨基酸序列;
B是任选的C末端氨基酸序列;和
n是2或更大的整数。
20.如权利要求18所述的多肽,其特征在于,X是选自下组的肺炎球菌抗原的氨基酸序列:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;和(5)RrgA抗原。
21.如权利要求18所述的多肽,其特征在于,X是选自下组的肺炎球菌抗原的氨基酸序列:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;和(4)spr2021抗原。
22.如权利要求18-20中任一项所述的多肽,其特征在于,n是2。
23.如权利要求18-21中任一项所述的多肽,其特征在于,至少一个L序列包含Glyx,其中x=2、3、4、5、6、7、8、9或10。
24.如权利要求18-22中任一项所述的多肽,其特征在于,其包含选自SEQID NO:193-228的氨基酸序列。
25.一种多肽,其与选自SEQ ID NO:193-228的氨基酸序列具有75%或更高的序列相同性。
26.一种编码权利要求18-24中任一项所述多肽的核酸。
27.一种肺炎球菌,其中以下一种或多种多肽被敲除:(1)spr0057;(2)spr0286;(3)spr0565;(4)spr1098;(5)spr1345;(6)spr1416;(7)spr1418;(8)spr0867;(9)spr1431;(10)spr1739;(11)spr2021;(12)spr0096;(13)spr1433;和/或(14)spr1707。
28.一种在哺乳动物中产生免疫应答的方法,所述方法包括给予该哺乳动物有效量的权利要求1-18中任一项所述组合物的步骤。
29.联合使用以使哺乳动物产生免疫应答的选自下组的至少两种抗原:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和(14)spr1707抗原。
30.选自下组的至少两种抗原在生产使哺乳动物产生免疫应答的药物中的应用:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr0286抗原;(13)spr1433抗原;和(14)spr1707抗原。
31.一种用于使哺乳动物产生免疫应答以保护其免遭肺炎球菌感染的抗原,其选自下组:(1)spr0057抗原;(2)spr0096抗原;(3)spr0565抗原;(4)spr2021抗原;(5)spr1345抗原;(6)spr1416抗原;(7)spr1418抗原;(8)spr0867抗原;(9)spr1431抗原;(10)spr1739抗原;(11)spr1098抗原;(12)spr286抗原;(13)spr1433抗原;和(14)spr1707抗原。
CN200880108017A 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物 Pending CN101801409A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410192895.3A CN104001165B (zh) 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB0714963.6A GB0714963D0 (en) 2007-08-01 2007-08-01 Compositions comprising antigens
GB0714963.6 2007-08-01
US96686607P 2007-08-29 2007-08-29
US60/966,866 2007-08-29
PCT/IB2008/002866 WO2009016515A2 (en) 2007-08-01 2008-08-01 Compositions comprising pneumococcal antigens

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410192895.3A Division CN104001165B (zh) 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物

Publications (1)

Publication Number Publication Date
CN101801409A true CN101801409A (zh) 2010-08-11

Family

ID=38529101

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880108017A Pending CN101801409A (zh) 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物
CN201410192895.3A Active CN104001165B (zh) 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201410192895.3A Active CN104001165B (zh) 2007-08-01 2008-08-01 包含肺炎球菌抗原的组合物

Country Status (20)

Country Link
US (2) US20110243976A1 (zh)
EP (2) EP2572726B1 (zh)
JP (2) JP2010535025A (zh)
CN (2) CN101801409A (zh)
AP (1) AP2010005173A0 (zh)
AU (1) AU2008281438A1 (zh)
BR (1) BRPI0813892A2 (zh)
CA (1) CA2695169A1 (zh)
CO (1) CO6260103A2 (zh)
CY (1) CY1117689T1 (zh)
DK (1) DK2572726T3 (zh)
EA (1) EA018137B1 (zh)
ES (1) ES2580957T3 (zh)
GB (1) GB0714963D0 (zh)
HR (1) HRP20160685T1 (zh)
HU (1) HUE029670T2 (zh)
PL (1) PL2572726T3 (zh)
PT (1) PT2572726T (zh)
SI (1) SI2572726T1 (zh)
WO (1) WO2009016515A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103096920A (zh) * 2010-09-10 2013-05-08 惠氏有限责任公司 脑膜炎奈瑟球菌orf2086抗原的非脂质化变体
CN104080479A (zh) * 2011-11-07 2014-10-01 诺华股份有限公司 包括spr0096和spr2021抗原的运载体分子
CN110234658A (zh) * 2017-01-31 2019-09-13 辉瑞大药厂 脑膜炎奈瑟菌组合物及其使用方法

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX339524B (es) 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
US9931397B2 (en) 2005-06-27 2018-04-03 Glaxosmithkline Biologicals S.A. Immunogenic composition
WO2009115508A2 (en) * 2008-03-17 2009-09-24 Intercell Ag Peptides protective against s. pneumoniae and compositions, methods and uses relating thereto
ATE523204T1 (de) * 2009-02-16 2011-09-15 Karlsruher Inst Technologie Cd44v6-peptide als bakterielle infektionsinhibitoren
SG176285A1 (en) * 2009-06-01 2012-01-30 Novartis Ag COMBINATIONS OF PNEUMOCOCCAL RrgB CLADES
WO2011008548A1 (en) * 2009-06-29 2011-01-20 Genocea Biosciences, Inc. Vaccines and compositions against streptococcus pneumoniae
SG178904A1 (en) * 2009-09-10 2012-04-27 Novartis Ag Combination vaccines against respiratory tract diseases
CN102939105B (zh) * 2009-12-22 2016-11-16 赛诺菲巴斯德有限公司 免疫原性组合物和相关的方法
EP2550289A4 (en) 2010-03-12 2013-11-27 Childrens Medical Center NEW IMMUNOGENS AND METHODS FOR DISCOVERY AND SCREENING THEREOF
GB201005625D0 (en) 2010-04-01 2010-05-19 Novartis Ag Immunogenic proteins and compositions
EP2590626B1 (en) 2010-07-06 2015-10-28 GlaxoSmithKline Biologicals SA Liposomes with lipids having an advantageous pka-value for rna delivery
US9770463B2 (en) 2010-07-06 2017-09-26 Glaxosmithkline Biologicals Sa Delivery of RNA to different cell types
WO2012006369A2 (en) 2010-07-06 2012-01-12 Novartis Ag Immunisation of large mammals with low doses of rna
ES2646669T3 (es) 2010-07-06 2017-12-14 Glaxosmithkline Biologicals Sa Procedimientos de aumento de una respuesta inmunitaria mediante el suministro de ARN
PT2590676T (pt) 2010-07-06 2016-11-04 Glaxosmithkline Biologicals Sa Partículas de transferência de tipo virião para moléculas de arn auto-replicante
US9192661B2 (en) 2010-07-06 2015-11-24 Novartis Ag Delivery of self-replicating RNA using biodegradable polymer particles
HRP20210242T4 (hr) 2010-08-23 2024-05-10 Wyeth Llc Stabilne formulacije antigena iz bakterije neisseria meningitidis rlp2086
PL3981427T3 (pl) 2010-08-31 2022-09-19 Glaxosmithkline Biologicals S.A. Pegylowane liposomy do dostarczania rna kodującego immunogen
EP3542789A3 (en) 2010-08-31 2020-01-01 GlaxoSmithKline Biologicals SA Lipids suitable for liposomal delivery of protein-coding rna
TR201903651T4 (tr) 2010-10-11 2019-04-22 Glaxosmithkline Biologicals Sa Antijen uygulama platformları.
WO2012072769A1 (en) 2010-12-01 2012-06-07 Novartis Ag Pneumococcal rrgb epitopes and clade combinations
RU2623174C2 (ru) 2011-01-20 2017-06-22 Дженоцея Байосайенсиз, Инк. Вакцины и композиции против streptococcus pneumoniae
WO2012149405A2 (en) * 2011-04-29 2012-11-01 Selecta Biosciences, Inc. Tolerogenic synthetic nanocarriers for regulating innate immune responses
EP3912619A1 (en) 2011-05-11 2021-11-24 Children's Medical Center Corporation Modified biotin-binding protein, fusion proteins thereof and applications
CA2840989A1 (en) 2011-07-06 2013-01-10 Novartis Ag Immunogenic combination compositions and uses thereof
JP2014520806A (ja) 2011-07-06 2014-08-25 ノバルティス アーゲー Rna分子の送達のための有用なn:p比を有するリポソーム
SG10201602456WA (en) 2011-08-31 2016-04-28 Novartis Ag Pegylated liposomes for delivery of immunogen-encoding rna
CA2851270C (en) * 2011-10-05 2023-03-14 The Rockefeller University Dimeric bacteriophage lysins
JP2015510872A (ja) 2012-03-07 2015-04-13 ノバルティス アーゲー Streptococcuspneumoniae抗原の増強された製剤
BR122016004924A2 (pt) 2012-03-09 2019-07-30 Pfizer Inc. Polipeptídeo isolado e composições imunogênicas compreendendo os mesmos
SA115360586B1 (ar) 2012-03-09 2017-04-12 فايزر انك تركيبات لعلاج الالتهاب السحائي البكتيري وطرق لتحضيرها
KR102057217B1 (ko) 2012-06-20 2020-01-22 에스케이바이오사이언스 주식회사 다가 폐렴구균 다당류-단백질 접합체 조성물
AU2013320313B2 (en) 2012-09-18 2018-07-12 Glaxosmithkline Biologicals Sa Outer membrane vesicles
KR20140075196A (ko) * 2012-12-11 2014-06-19 에스케이케미칼주식회사 다가 폐렴구균 다당류-단백질 접합체 조성물
CA2900008A1 (en) * 2013-02-07 2014-08-14 Children's Medical Center Corporation Protein antigens that provide protection against pneumococcal colonization and/or disease
JP6446377B2 (ja) 2013-03-08 2018-12-26 ファイザー・インク 免疫原性融合ポリペプチド
ES2887254T3 (es) 2013-03-08 2021-12-22 Novartis Ag Lípidos y composiciones lipídicas para el suministro de agentes activos
ES2842206T3 (es) 2013-05-03 2021-07-13 Selecta Biosciences Inc Métodos y composiciones para potenciar linfocitos T reguladores CD4+
CA2923129C (en) 2013-09-08 2020-06-09 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
ES2774968T3 (es) 2013-12-19 2020-07-23 Novartis Ag Lípidos y composiciones lipídicas para la administración de agentes activos
WO2015095346A1 (en) 2013-12-19 2015-06-25 Novartis Ag Lipids and lipid compositions for the delivery of active agents
ES2949172T3 (es) 2014-07-16 2023-09-26 Novartis Ag Método de encapsulamiento de un ácido nucleico en un hospedante de nanopartículas lipídicas
WO2016037053A1 (en) 2014-09-05 2016-03-10 Novartis Ag Lipids and lipid compositions for the delivery of active agents
EA201790533A1 (ru) 2014-09-07 2017-07-31 Селекта Байосайенсиз, Инк. Способы и композиции для ослабления иммунных ответов против вирусного вектора для переноса, предназначенного для модулирования экспрессии генов
US9107906B1 (en) 2014-10-28 2015-08-18 Adma Biologics, Inc. Compositions and methods for the treatment of immunodeficiency
AU2016221318B2 (en) 2015-02-19 2020-06-25 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
EP3061826A1 (en) 2015-02-27 2016-08-31 Novartis AG Flavivirus replicons
CN104844712B (zh) * 2015-04-03 2019-06-28 长春百克生物科技股份公司 肺炎链球菌蛋白抗原及其制备方法和应用
GB201509782D0 (en) * 2015-06-05 2015-07-22 Isis Innovation Methods and products for fusion protein synthesis
CN108884134A (zh) 2015-12-10 2018-11-23 加拿大全国研究委员会 脂化肺炎链球菌抗原组合物、制备方法和用途
AU2018236123B2 (en) 2017-03-11 2024-04-18 Selecta Biosciences, Inc. Methods and compositions related to combined treatment with anti-inflammatories and synthetic nanocarriers comprising an immunosuppressant
US10259865B2 (en) 2017-03-15 2019-04-16 Adma Biologics, Inc. Anti-pneumococcal hyperimmune globulin for the treatment and prevention of pneumococcal infection
CN110730670A (zh) 2017-03-28 2020-01-24 儿童医疗中心有限公司 基于多抗原提呈系统(maps)的金黄色葡萄球菌疫苗、免疫原性组合物以及它们的用途
GB201705750D0 (en) 2017-04-10 2017-05-24 Univ Oxford Innovation Ltd Peptide ligase and use therof
KR102634811B1 (ko) 2017-06-10 2024-02-06 인벤트프라이즈 인크. 면역원성과 항원항체 결합성이 개선된 2가 또는 다가 접합체 다당류를 가진 다가 접합체 백신
US10729763B2 (en) 2017-06-10 2020-08-04 Inventprise, Llc Mixtures of polysaccharide-protein pegylated compounds
TW201925222A (zh) 2017-06-23 2019-07-01 美商醫院疫苗公司 免疫原性組成物
CN112969474A (zh) 2018-09-12 2021-06-15 艾芬尼维克斯公司 多价肺炎球菌疫苗
EP4387597A1 (en) 2021-08-16 2024-06-26 GlaxoSmithKline Biologicals SA Freeze-drying of lipid nanoparticles (lnps) encapsulating rna and formulations thereof
EP4387596A1 (en) 2021-08-16 2024-06-26 GlaxoSmithKline Biologicals SA Low-dose lyophilized rna vaccines and methods for preparing and using the same
CN114507658B (zh) * 2022-04-02 2022-07-05 深圳瑞德林生物技术有限公司 酶共表达系统及其在合成唾液酸的应用
WO2023236878A1 (zh) * 2022-06-07 2023-12-14 北京大学第一医院 包含IgA蛋白酶截短体的融合蛋白及其用途
WO2024006863A1 (en) 2022-06-30 2024-01-04 Precision NanoSystems ULC Lipid nanoparticle formulations for vaccines
CN116333063B (zh) * 2023-04-21 2024-03-12 华中农业大学 胸膜肺炎放线杆菌的三个候选抗原及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004092209A2 (en) * 2003-04-15 2004-10-28 Intercell Ag S. pneumoniae antigens

Family Cites Families (187)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4057685A (en) 1972-02-02 1977-11-08 Abbott Laboratories Chemically modified endotoxin immunizing agent
US4315919A (en) * 1980-10-06 1982-02-16 Edward Shanbrom Depyrogenation process
US4356170A (en) 1981-05-27 1982-10-26 Canadian Patents & Development Ltd. Immunogenic polysaccharide-protein conjugates
US4673574A (en) 1981-08-31 1987-06-16 Anderson Porter W Immunogenic conjugates
SE8205892D0 (sv) 1982-10-18 1982-10-18 Bror Morein Immunogent membranproteinkomplex, sett for framstellning och anvendning derav som immunstimulerande medel och sasom vaccin
US4459286A (en) 1983-01-31 1984-07-10 Merck & Co., Inc. Coupled H. influenzae type B vaccine
US4663160A (en) 1983-03-14 1987-05-05 Miles Laboratories, Inc. Vaccines for gram-negative bacteria
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4761283A (en) 1983-07-05 1988-08-02 The University Of Rochester Immunogenic conjugates
WO1995013796A1 (en) 1993-11-16 1995-05-26 Depotech Corporation Vesicles with controlled release of actives
IL73534A (en) 1983-11-18 1990-12-23 Riker Laboratories Inc 1h-imidazo(4,5-c)quinoline-4-amines,their preparation and pharmaceutical compositions containing certain such compounds
US5916588A (en) 1984-04-12 1999-06-29 The Liposome Company, Inc. Peptide-containing liposomes, immunogenic liposomes and methods of preparation and use
US6090406A (en) 1984-04-12 2000-07-18 The Liposome Company, Inc. Potentiation of immune responses with liposomal adjuvants
US4882317A (en) 1984-05-10 1989-11-21 Merck & Co., Inc. Covalently-modified bacterial polysaccharides, stable covalent conjugates of such polysaccharides and immunogenic proteins with bigeneric spacers and methods of preparing such polysaccharides and conjugataes and of confirming covalency
US4695624A (en) 1984-05-10 1987-09-22 Merck & Co., Inc. Covalently-modified polyanionic bacterial polysaccharides, stable covalent conjugates of such polysaccharides and immunogenic proteins with bigeneric spacers, and methods of preparing such polysaccharides and conjugates and of confirming covalency
US4808700A (en) 1984-07-09 1989-02-28 Praxis Biologics, Inc. Immunogenic conjugates of non-toxic E. coli LT-B enterotoxin subunit and capsular polymers
IT1187753B (it) 1985-07-05 1987-12-23 Sclavo Spa Coniugati glicoproteici ad attivita' immunogenica trivalente
US4777127A (en) 1985-09-30 1988-10-11 Labsystems Oy Human retrovirus-related products and methods of diagnosing and treating conditions associated with said retrovirus
US4680338A (en) 1985-10-17 1987-07-14 Immunomedics, Inc. Bifunctional linker
US5011828A (en) 1985-11-15 1991-04-30 Michael Goodman Immunostimulating guanine derivatives, compositions and methods
GB8702816D0 (en) 1987-02-07 1987-03-11 Al Sumidaie A M K Obtaining retrovirus-containing fraction
US5219740A (en) 1987-02-13 1993-06-15 Fred Hutchinson Cancer Research Center Retroviral gene transfer into diploid fibroblasts for gene therapy
US5057540A (en) 1987-05-29 1991-10-15 Cambridge Biotech Corporation Saponin adjuvant
US5206152A (en) 1988-04-08 1993-04-27 Arch Development Corporation Cloning and expression of early growth regulatory protein genes
US5422120A (en) 1988-05-30 1995-06-06 Depotech Corporation Heterovesicular liposomes
AP129A (en) 1988-06-03 1991-04-17 Smithkline Biologicals S A Expression of retrovirus gag protein eukaryotic cells
NL8802046A (nl) 1988-08-18 1990-03-16 Gen Electric Polymeermengsel met polyester en alkaansulfonaat, daaruit gevormde voorwerpen.
NZ241926A (en) 1988-08-25 1993-08-26 Liposome Co Inc Immunisation dosage form comprising a salt of an organic acid derivative of a sterol and an antigen
DE3841091A1 (de) 1988-12-07 1990-06-13 Behringwerke Ag Synthetische antigene, verfahren zu ihrer herstellung und ihre verwendung
US5238944A (en) 1988-12-15 1993-08-24 Riker Laboratories, Inc. Topical formulations and transdermal delivery systems containing 1-isobutyl-1H-imidazo[4,5-c]quinolin-4-amine
US6716432B1 (en) 1988-12-16 2004-04-06 James Cleland Paton Pneumolysin mutants and pneumococcal vaccines made therefrom
WO1990006951A1 (en) 1988-12-16 1990-06-28 De Staat Der Nederlanden Vertegenwoordigd Door De Minister Van Welzijn, Volksgezondheid En Cultuur Pneumolysin mutants and pneumococcal vaccines made therefrom
DE68907045T2 (de) 1989-01-17 1993-12-02 Eniricerche Spa Synthetische Peptide und deren Verwendung als allgemeine Träger für die Herstellung von immunogenischen Konjugaten, die für die Entwicklung von synthetischen Impfstoffen geeignet sind.
EP0832980B1 (en) 1989-01-23 2002-06-19 Chiron Corporation Recombinant therapies for infection and hyperproliferative disorders
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
DE69032284T2 (de) 1989-03-21 1998-10-08 Vical Inc Expression von exogenen polynukleotidsequenzen in wirbeltieren
US4929624A (en) 1989-03-23 1990-05-29 Minnesota Mining And Manufacturing Company Olefinic 1H-imidazo(4,5-c)quinolin-4-amines
JPH0832638B2 (ja) 1989-05-25 1996-03-29 カイロン コーポレイション サブミクロン油滴乳剤を含んで成るアジュバント製剤
CA2063271A1 (en) 1989-07-14 1991-01-15 Subramonia Pillai Cytokine and hormone carriers for conjugate vaccines
EP0487587A1 (en) 1989-08-18 1992-06-03 Chiron Corporation Recombinant retroviruses delivering vector constructs to target cells
US5585362A (en) 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US4988815A (en) 1989-10-26 1991-01-29 Riker Laboratories, Inc. 3-Amino or 3-nitro quinoline compounds which are intermediates in preparing 1H-imidazo[4,5-c]quinolines
IT1237764B (it) 1989-11-10 1993-06-17 Eniricerche Spa Peptidi sintetici utili come carriers universali per la preparazione di coniugati immunogenici e loro impiego per lo sviluppo di vaccini sintetici.
ZA911974B (en) 1990-03-21 1994-08-22 Res Dev Foundation Heterovesicular liposomes
US5658731A (en) 1990-04-09 1997-08-19 Europaisches Laboratorium Fur Molekularbiologie 2'-O-alkylnucleotides as well as polymers which contain such nucleotides
SE466259B (sv) 1990-05-31 1992-01-20 Arne Forsgren Protein d - ett igd-bindande protein fraan haemophilus influenzae, samt anvaendning av detta foer analys, vacciner och uppreningsaendamaal
US5149655A (en) 1990-06-21 1992-09-22 Agracetus, Inc. Apparatus for genetic transformation
GB2276169A (en) 1990-07-05 1994-09-21 Celltech Ltd Antibodies specific for carcinoembryonic antigen
DE69113564T2 (de) 1990-08-13 1996-05-30 American Cyanamid Co Faser-Hemagglutinin von Bordetella pertussis als Träger für konjugierten Impfstoff.
CA2098849C (en) 1990-12-20 2007-07-10 Ralph R. Weichselbaum Control of gene expression by ionizing radiation
US5389640A (en) 1991-03-01 1995-02-14 Minnesota Mining And Manufacturing Company 1-substituted, 2-substituted 1H-imidazo[4,5-c]quinolin-4-amines
HU222247B1 (hu) 1991-03-01 2003-05-28 Minnesota Mining And Manufacturing Company 1- és 2-helyzetben szubsztituált 1H-imidazo[4,5-c]kinolin-4-amin-származékok előállításában alkalmazható 1H-imidazo[4,5-c]kinolin-5N-oxid-származékok
DE69233013T2 (de) 1991-08-20 2004-03-04 The Government Of The United States Of America As Represented By The Secretary Of National Institute Of Health, Office Of Technology Transfer Adenovirus vermittelter gentransfer in den gastrointestinaltrakt
US5936076A (en) 1991-08-29 1999-08-10 Kirin Beer Kabushiki Kaisha αgalactosylceramide derivatives
US5268376A (en) 1991-09-04 1993-12-07 Minnesota Mining And Manufacturing Company 1-substituted 1H-imidazo[4,5-c]quinolin-4-amines
US5266575A (en) 1991-11-06 1993-11-30 Minnesota Mining And Manufacturing Company 2-ethyl 1H-imidazo[4,5-ciquinolin-4-amines
WO1993010218A1 (en) 1991-11-14 1993-05-27 The United States Government As Represented By The Secretary Of The Department Of Health And Human Services Vectors including foreign genes and negative selective markers
GB9125623D0 (en) 1991-12-02 1992-01-29 Dynal As Cell modification
IT1262896B (it) 1992-03-06 1996-07-22 Composti coniugati formati da proteine heat shock (hsp) e oligo-poli- saccaridi, loro uso per la produzione di vaccini.
FR2688514A1 (fr) 1992-03-16 1993-09-17 Centre Nat Rech Scient Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant.
IL105325A (en) 1992-04-16 1996-11-14 Minnesota Mining & Mfg Immunogen/vaccine adjuvant composition
JPH07507689A (ja) 1992-06-08 1995-08-31 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 特定組織のターゲティング方法及び組成物
JPH09507741A (ja) 1992-06-10 1997-08-12 アメリカ合衆国 ヒト血清による不活性化に耐性のあるベクター粒子
JP3755890B2 (ja) 1992-06-25 2006-03-15 スミスクライン・ビーチャム・バイオロジカルス(ソシエテ・アノニム) アジュバント含有ワクチン組成物
IL102687A (en) 1992-07-30 1997-06-10 Yeda Res & Dev Conjugates of poorly immunogenic antigens and synthetic pepide carriers and vaccines comprising them
GB2269175A (en) 1992-07-31 1994-02-02 Imperial College Retroviral vectors
CA2592997A1 (en) 1992-12-03 1994-06-09 Genzyme Corporation Pseudo-adenovirus vectors
US5395937A (en) 1993-01-29 1995-03-07 Minnesota Mining And Manufacturing Company Process for preparing quinoline amines
EP0812593B8 (en) 1993-03-23 2010-11-10 SmithKline Beecham Biologicals S.A. Vaccine compositions containing 3-0 deacylated monophosphoryl lipid a
EP0695169B1 (en) 1993-04-22 2002-11-20 SkyePharma Inc. Multivesicular cyclodextrin liposomes encapsulating pharmacologic compounds and methods for their use
EP0705344B8 (en) 1993-06-24 2006-05-10 Advec Inc. Adenovirus vectors for gene therapy
EP0708772B1 (en) 1993-07-15 2000-08-23 Minnesota Mining And Manufacturing Company IMIDAZO [4,5-c]PYRIDIN-4-AMINES
US5352784A (en) 1993-07-15 1994-10-04 Minnesota Mining And Manufacturing Company Fused cycloalkylimidazopyridines
ES2328424T3 (es) 1993-09-15 2009-11-12 Novartis Vaccines And Diagnostics, Inc. Vectores de alfavirus recombinantes.
US6015686A (en) 1993-09-15 2000-01-18 Chiron Viagene, Inc. Eukaryotic layered vector initiation systems
DE69434594T2 (de) 1993-10-25 2006-09-21 Canji, Inc., San Diego Rekombinante adenoviren-vektor und verfahren zur verwendung
AU5543294A (en) 1993-10-29 1995-05-22 Pharmos Corp. Submicron emulsions as vaccine adjuvants
GB9326174D0 (en) 1993-12-22 1994-02-23 Biocine Sclavo Mucosal adjuvant
GB9326253D0 (en) 1993-12-23 1994-02-23 Smithkline Beecham Biolog Vaccines
EP0772689B1 (en) 1994-05-09 2007-12-19 Oxford Biomedica (UK) Limited Retroviral vectors having a reduced recombination rate
US6239116B1 (en) 1994-07-15 2001-05-29 University Of Iowa Research Foundation Immunostimulatory nucleic acid molecules
US6207646B1 (en) 1994-07-15 2001-03-27 University Of Iowa Research Foundation Immunostimulatory nucleic acid molecules
US6429199B1 (en) 1994-07-15 2002-08-06 University Of Iowa Research Foundation Immunostimulatory nucleic acid molecules for activating dendritic cells
AUPM873294A0 (en) 1994-10-12 1994-11-03 Csl Limited Saponin preparations and use thereof in iscoms
AU4594996A (en) 1994-11-30 1996-06-19 Chiron Viagene, Inc. Recombinant alphavirus vectors
US5482936A (en) 1995-01-12 1996-01-09 Minnesota Mining And Manufacturing Company Imidazo[4,5-C]quinoline amines
UA56132C2 (uk) 1995-04-25 2003-05-15 Смітклайн Бічем Байолоджікалс С.А. Композиція вакцини (варіанти), спосіб стабілізації qs21 відносно гідролізу (варіанти), спосіб приготування композиції вакцини
GB9513261D0 (en) 1995-06-29 1995-09-06 Smithkline Beecham Biolog Vaccines
US5707829A (en) 1995-08-11 1998-01-13 Genetics Institute, Inc. DNA sequences and secreted proteins encoded thereby
US20020028215A1 (en) * 1999-08-09 2002-03-07 Jagath L. Kadurugamuwa Novel vaccines and pharmaceutical compositions using membrane vesicles of microorganisms, and methods for preparing same
ATE424463T1 (de) 1996-05-06 2009-03-15 Oxford Biomedica Ltd Rekombinationsunfähige retrovirale vektoren
WO1998018931A2 (en) 1996-10-31 1998-05-07 Human Genome Sciences, Inc. Streptococcus pneumoniae polynucleotides and sequences
EP1005368B1 (en) 1997-03-10 2009-09-02 Ottawa Hospital Research Institute Use of nucleic acids containing unmethylated CpG dinucleotide in combination with alum as adjuvants
US6818222B1 (en) 1997-03-21 2004-11-16 Chiron Corporation Detoxified mutants of bacterial ADP-ribosylating toxins as parenteral adjuvants
US6080725A (en) 1997-05-20 2000-06-27 Galenica Pharmaceuticals, Inc. Immunostimulating and vaccine compositions employing saponin analog adjuvants and uses thereof
GB9712347D0 (en) 1997-06-14 1997-08-13 Smithkline Beecham Biolog Vaccine
GB9713156D0 (en) 1997-06-20 1997-08-27 Microbiological Res Authority Vaccines
JP2001510031A (ja) 1997-07-21 2001-07-31 ノース・アメリカン・ヴァクシン・インコーポレーテッド ワクチンとしての修飾された免疫原ニューモリシン組成物
JP4426091B2 (ja) 1997-09-05 2010-03-03 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム サポニンを含有する水中油型エマルション
GB9725084D0 (en) 1997-11-28 1998-01-28 Medeva Europ Ltd Vaccine compositions
KR100585408B1 (ko) 1998-02-12 2006-06-01 와이어쓰 홀딩스 코포레이션 인터루킨-12로 제형된 폐렴구균 및 수막구균 백신
US7018637B2 (en) 1998-02-23 2006-03-28 Aventis Pasteur, Inc Multi-oligosaccharide glycoconjugate bacterial meningitis vaccines
US6303114B1 (en) 1998-03-05 2001-10-16 The Medical College Of Ohio IL-12 enhancement of immune responses to T-independent antigens
KR20010042573A (ko) 1998-04-09 2001-05-25 장 스테판느 애쥬번트 조성물
WO1999053940A1 (en) 1998-04-23 1999-10-28 Uab Research Foundation PNEUMOCOCCAL SURFACE PROTEIN C(PspC), EPITOPIC REGIONS AND STRAIN SELECTION THEREOF, AND USES THEREFOR
ES2296390T3 (es) 1998-05-07 2008-04-16 Corixa Corporation Composicion coadyuvante y procedimiento para su uso.
US6562798B1 (en) 1998-06-05 2003-05-13 Dynavax Technologies Corp. Immunostimulatory oligonucleotides with modified bases and methods of use thereof
JP2002531055A (ja) 1998-07-27 2002-09-24 マイクロビアル テクニクス リミティッド 肺炎連鎖球菌のタンパク質及び核酸分子
US20030134407A1 (en) * 1998-07-27 2003-07-17 Le Page Richard William Falla Nucleic acids and proteins from Streptococcus pneumoniae
WO2000006738A2 (en) 1998-07-27 2000-02-10 Microbial Technics Limited NUCLEIC ACIDS AND PROTEINS FROM $i(STREPTOCOCCUS PNEUMONIAE)
US6110929A (en) 1998-07-28 2000-08-29 3M Innovative Properties Company Oxazolo, thiazolo and selenazolo [4,5-c]-quinolin-4-amines and analogs thereof
GB9817052D0 (en) 1998-08-05 1998-09-30 Smithkline Beecham Biolog Vaccine
JP2004505885A (ja) 1998-08-19 2004-02-26 ノース アメリカン ワクチン, インコーポレイテッド N−アクリロイル化ポリサッカリドを用いて産生されたワクチンとして有用な免疫原性β−プロピオンアミド連結ポリサッカリド−タンパク質結合体
AU750587B2 (en) 1998-10-16 2002-07-25 Smithkline Beecham Biologicals (Sa) Adjuvant systems and vaccines
AU1626199A (en) 1998-12-04 2000-06-26 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The A vi-repa conjugate vaccine for immunization against salmonella typhi
EP2050464B1 (en) 1998-12-21 2019-08-07 Medimmune, Inc. Streptococcus pneumoniae proteins and immunogenic fragments for vaccines
US20030130212A1 (en) 1999-01-14 2003-07-10 Rossignol Daniel P. Administration of an anti-endotoxin drug by intravenous infusion
US6551600B2 (en) 1999-02-01 2003-04-22 Eisai Co., Ltd. Immunological adjuvant compounds compositions and methods of use thereof
AU2753100A (en) 1999-02-03 2000-08-25 Biosante Pharmaceuticals, Inc. Therapeutic calcium phosphate particles and methods of manufacture and use
JP4846906B2 (ja) 1999-03-19 2011-12-28 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム ワクチン
JP4785014B2 (ja) 1999-03-26 2011-10-05 プロヴァリス・ユーケー・リミテッド 蛋白質
CA2365914A1 (en) 1999-04-09 2000-10-19 Techlab, Inc. Recombinant clostridium toxin a protein carrier for polysaccharide conjugate vaccines
US6331539B1 (en) 1999-06-10 2001-12-18 3M Innovative Properties Company Sulfonamide and sulfamide substituted imidazoquinolines
ATE325620T1 (de) 1999-06-10 2006-06-15 Medimmune Inc Streptococcus pneumoniae proteine und impfstoffe
EP1075841A1 (en) 1999-08-13 2001-02-14 Erasmus Universiteit Rotterdam Pneumococcal vaccines
CN1391483A (zh) 1999-09-24 2003-01-15 史密丝克莱恩比彻姆生物有限公司 作为佐剂的聚氧乙烯脱水山梨醇酯和辛苯昔醇组合及其在疫苗中的应用
WO2001021152A1 (en) 1999-09-24 2001-03-29 Smithkline Beecham Biologicals S.A. Adjuvant comprising a polyxyethylene alkyl ether or ester and at least one nonionic surfactant
DE60022665T2 (de) 1999-09-25 2006-06-22 Coley Pharmaceutical Gmbh Immunstimulierende nukeinsäuren
CA2396871A1 (en) 2000-01-20 2001-12-20 Ottawa Health Research Institute Immunostimulatory nucleic acids for inducing a th2 immune response
GB0007432D0 (en) 2000-03-27 2000-05-17 Microbiological Res Authority Proteins for use as carriers in conjugate vaccines
AU2001255772B2 (en) 2000-04-27 2006-06-29 Medimmune, Llc Immunogenic pneumococcal protein and vaccine compositions thereof
WO2002008426A2 (en) 2000-07-20 2002-01-31 Hansa Medical Ab Fh-binding protein of streptococcus pneumoniae
ATE448226T1 (de) 2000-09-01 2009-11-15 Novartis Vaccines & Diagnostic Aza heterocyclische derivate und ihre therapeutische verwendung
WO2002022598A1 (en) 2000-09-11 2002-03-21 Chiron Corporation Quinolinone derivatives as tyrosine kinase inhibitors
GB0022742D0 (en) 2000-09-15 2000-11-01 Smithkline Beecham Biolog Vaccine
WO2002026757A2 (en) 2000-09-26 2002-04-04 Hybridon, Inc. Modulation of immunostimulatory activity of immunostimulatory oligonucleotide analogs by positional chemical changes
EP1330473A2 (en) 2000-10-26 2003-07-30 Imperial College Innovations Limited Streptococcal genes
US6677348B2 (en) 2000-12-08 2004-01-13 3M Innovative Properties Company Aryl ether substituted imidazoquinolines
US6664260B2 (en) 2000-12-08 2003-12-16 3M Innovative Properties Company Heterocyclic ether substituted imidazoquinolines
UA75622C2 (en) 2000-12-08 2006-05-15 3M Innovative Properties Co Aryl ether substituted imidazoquinolines, pharmaceutical composition based thereon
US6664265B2 (en) 2000-12-08 2003-12-16 3M Innovative Properties Company Amido ether substituted imidazoquinolines
US6660747B2 (en) 2000-12-08 2003-12-09 3M Innovative Properties Company Amido ether substituted imidazoquinolines
US6667312B2 (en) 2000-12-08 2003-12-23 3M Innovative Properties Company Thioether substituted imidazoquinolines
US6664264B2 (en) 2000-12-08 2003-12-16 3M Innovative Properties Company Thioether substituted imidazoquinolines
US6677347B2 (en) 2000-12-08 2004-01-13 3M Innovative Properties Company Sulfonamido ether substituted imidazoquinolines
US6660735B2 (en) 2000-12-08 2003-12-09 3M Innovative Properties Company Urea substituted imidazoquinoline ethers
GB0107658D0 (en) 2001-03-27 2001-05-16 Chiron Spa Streptococcus pneumoniae
GB0108079D0 (en) 2001-03-30 2001-05-23 Microbial Technics Ltd Protein
AU2002309706A1 (en) 2001-05-11 2002-11-25 Aventis Pasteur, Inc. Novel meningitis conjugate vaccine
US20030091593A1 (en) 2001-09-14 2003-05-15 Cytos Biotechnology Ag In vivo activation of antigen presenting cells for enhancement of immune responses induced by virus like particles
DE60234375D1 (de) 2001-09-14 2009-12-24 Cytos Biotechnology Ag VERPACKUNG VON IMMUNSTIMULIERENDEM CpG IN VIRUSÄHNLICHEN PARTIKELN: HERSTELLUNGSVERFAHREN UND VERWENDUNG
WO2003035836A2 (en) 2001-10-24 2003-05-01 Hybridon Inc. Modulation of immunostimulatory properties of oligonucleotide-based compounds by optimal presentation of 5' ends
KR100718371B1 (ko) 2001-11-27 2007-05-14 애나디스 파마슈티칼스, 인코포레이티드 3-β-D-리보푸라노실티아졸로[4,5-d]피리디민누클레오시드 및 이의 용도
US7321033B2 (en) 2001-11-27 2008-01-22 Anadys Pharmaceuticals, Inc. 3-B-D-ribofuranosylthiazolo [4,5-d] pyrimidine nucleosides and uses thereof
US6677349B1 (en) 2001-12-21 2004-01-13 3M Innovative Properties Company Sulfonamide and sulfamide substituted imidazoquinolines
EP1499311B1 (en) 2002-03-29 2009-11-04 Novartis Vaccines and Diagnostics, Inc. Substituted benzazoles and use thereof as raf kinase inhibitors
EP2275122A3 (en) 2002-04-02 2011-05-18 Ben Gurion University Of The Negev Research And Development Authority Protein-based streptococcus pneumoniae vaccines
WO2003101949A2 (en) 2002-05-29 2003-12-11 3M Innovative Properties Company Process for imidazo[4,5-c]pyridin-4-amines
CN100360558C (zh) 2002-06-11 2008-01-09 葛兰素史密丝克莱恩生物有限公司 免疫原性组合物
AU2003251518B2 (en) 2002-06-13 2009-07-02 New York University Synthetic C-glycolipid and its use for treating cancer infectious diseases and autoimmune diseases
ATE477251T1 (de) 2002-08-23 2010-08-15 Novartis Vaccines & Diagnostic Pyrrolverbindungen als glykogen synthase kinase 3 inhibitoren
AU2003268353A1 (en) * 2002-08-30 2004-03-19 Tufts University Streptococcus pneumoniae antigens for diagnosis, treatment and prevention of active infection
US7217791B2 (en) 2002-11-07 2007-05-15 Synergy America, Inc. Compositions and methods for treating or preventing pneumococcal infection
CA2511646A1 (en) 2002-12-27 2004-07-22 Chiron Corporation Thiosemicarbazones as anti-virals and immunopotentiators
EP1594524B1 (en) 2003-01-21 2012-08-15 Novartis Vaccines and Diagnostics, Inc. Use of tryptanthrin compounds for immune potentiation
GB0301554D0 (en) 2003-01-23 2003-02-26 Molecularnature Ltd Immunostimulatory compositions
ES2423800T3 (es) 2003-03-28 2013-09-24 Novartis Vaccines And Diagnostics, Inc. Uso de compuestos orgánicos para la inmunopotenciación
RU2236257C1 (ru) 2003-09-15 2004-09-20 Косяков Константин Сергеевич Синтетический иммуноген для терапии и профилактики злоупотреблений наркотическими и психоактивными веществами
US7771726B2 (en) 2003-10-08 2010-08-10 New York University Use of synthetic glycolipids as universal adjuvants for vaccines against cancer and infectious diseases
AU2003288788B2 (en) 2003-12-31 2007-02-15 Adelaide Research & Innovation Pty Ltd Vaccine comprising recombinant CLPP protein of Streptococcus pneumoniae
US20050222048A1 (en) 2004-03-31 2005-10-06 The Research Foundation Of The City University Of New York Novel synthetic C-glycolipids, their synthesis and use to treat infections, cancer and autoimmune diseases
JP5393978B2 (ja) 2004-04-05 2014-01-22 ゾエティス・ピー・エルエルシー マイクロ流動化された水中油型乳剤及びワクチン組成物
GB0410220D0 (en) 2004-05-07 2004-06-09 Kirkham Lea Ann Mutant pneumolysin proteins
WO2006084466A2 (en) * 2005-02-11 2006-08-17 Ace Biosciences A/S Surface-located streptococcus pneumoniae polypeptides
US7955605B2 (en) 2005-04-08 2011-06-07 Wyeth Llc Multivalent pneumococcal polysaccharide-protein conjugate composition
US20060228369A1 (en) 2005-04-11 2006-10-12 Program For Appropriate Technology In Health Stabilization and preservation of temperature-sensitive vaccines
US7691368B2 (en) 2005-04-15 2010-04-06 Merial Limited Vaccine formulations
CA2610667A1 (en) * 2005-06-01 2006-12-07 Variation Biotechnologies Inc. Peptide-based influenza vaccine formulation
US9931397B2 (en) 2005-06-27 2018-04-03 Glaxosmithkline Biologicals S.A. Immunogenic composition
US8703095B2 (en) 2005-07-07 2014-04-22 Sanofi Pasteur S.A. Immuno-adjuvant emulsion
CN101378778B (zh) 2005-12-22 2013-02-06 葛兰素史密丝克莱恩生物有限公司 肺炎球菌多糖缀合物疫苗
FR2896162B1 (fr) 2006-01-13 2008-02-15 Sanofi Pasteur Sa Emulsion huile dans eau thermoreversible
CA2642721A1 (en) 2006-02-17 2007-10-18 Novartis Ag Purification of bacterial antigens
PT2004225E (pt) * 2006-03-22 2012-05-30 Novartis Ag Regimes para imunização com conjugados meningocócicos
BRPI0717219B8 (pt) 2006-10-12 2021-05-25 Glaxosmithkline Biologicals Sa composição imunogênica, e, uso de uma composição imunogênica
EP1923069A1 (en) 2006-11-20 2008-05-21 Intercell AG Peptides protective against S. pneumoniae and compositions, methods and uses relating thereto
CN104080479B (zh) * 2011-11-07 2019-11-05 葛兰素史密丝克莱恩生物有限公司 包括spr0096和spr2021抗原的运载体分子

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004092209A2 (en) * 2003-04-15 2004-10-28 Intercell Ag S. pneumoniae antigens

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WAI-LEUNG NG ET AL: "Defective cell wall synthesis in Streptococcus pneumoniae R6 depleted for the essential PcsB putative murein hydrolase or the VicR(YycF)response regulator", 《MOLECULAR MICROBIOLOGY》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103096920A (zh) * 2010-09-10 2013-05-08 惠氏有限责任公司 脑膜炎奈瑟球菌orf2086抗原的非脂质化变体
CN103096920B (zh) * 2010-09-10 2016-03-23 惠氏有限责任公司 脑膜炎奈瑟球菌orf2086抗原的非脂质化变体
CN104080479A (zh) * 2011-11-07 2014-10-01 诺华股份有限公司 包括spr0096和spr2021抗原的运载体分子
CN104080479B (zh) * 2011-11-07 2019-11-05 葛兰素史密丝克莱恩生物有限公司 包括spr0096和spr2021抗原的运载体分子
CN110234658A (zh) * 2017-01-31 2019-09-13 辉瑞大药厂 脑膜炎奈瑟菌组合物及其使用方法
CN110234658B (zh) * 2017-01-31 2024-03-12 辉瑞大药厂 脑膜炎奈瑟菌组合物及其使用方法

Also Published As

Publication number Publication date
EP2572726B1 (en) 2016-05-04
US20140348868A1 (en) 2014-11-27
HRP20160685T1 (hr) 2016-07-15
WO2009016515A3 (en) 2009-08-13
GB0714963D0 (en) 2007-09-12
AP2010005173A0 (en) 2010-02-28
WO2009016515A2 (en) 2009-02-05
ES2580957T3 (es) 2016-08-30
PT2572726T (pt) 2016-08-05
BRPI0813892A2 (pt) 2017-05-09
AU2008281438A1 (en) 2009-02-05
CN104001165B (zh) 2018-08-14
JP5838193B2 (ja) 2016-01-06
CO6260103A2 (es) 2011-03-22
EA018137B1 (ru) 2013-05-30
EP2572726A1 (en) 2013-03-27
CN104001165A (zh) 2014-08-27
HUE029670T2 (en) 2017-03-28
CY1117689T1 (el) 2017-05-17
PL2572726T3 (pl) 2016-12-30
JP2010535025A (ja) 2010-11-18
CA2695169A1 (en) 2009-02-05
US20110243976A1 (en) 2011-10-06
EP2197484A2 (en) 2010-06-23
SI2572726T1 (sl) 2016-08-31
EA201070200A1 (ru) 2010-08-30
DK2572726T3 (en) 2016-07-04
JP2014034578A (ja) 2014-02-24

Similar Documents

Publication Publication Date Title
CN104001165B (zh) 包含肺炎球菌抗原的组合物
CN102647999A (zh) 用于免疫接种以抵御金黄色葡萄球菌的组合物
US20090104218A1 (en) Group B Streptococcus
ES2704069T3 (es) Vacuna basada en toxinas de Clostridium difficile
CN102917730A (zh) 修饰的脑膜炎球菌fHBP多肽
CN102675432A (zh) 来自尿路病原性大肠杆菌的免疫原
CN102481354A (zh) 肺炎球菌RrgB分化枝的组合物
US20130216568A1 (en) Immunogenic proteins and compositions
MX2012011157A (es) Proteinas inmunogenas y composiciones para el tratamiento y prevencion de streptococcus agalactiae.
US10279026B2 (en) Antigens and antigen combinations
US20190290748A1 (en) Antigens and antigen combinations
CN105142666A (zh) 假单胞菌抗原和抗原组合
CN102811733A (zh) 金黄色葡萄球菌的菌血症相关抗原
WO2013030783A1 (en) Immunogenic proteins and compositions
DONATI et al. Patent 2695169 Summary

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Basel

Applicant after: Novartis Ag

Address before: Basel

Applicant before: Novartis Vaccines & Diagnostic

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: NOVARTIS VACCINES + DIAGNOSTIC TO: NOVARTIS CO., LTD.

AD01 Patent right deemed abandoned

Effective date of abandoning: 20100811

C20 Patent right or utility model deemed to be abandoned or is abandoned