CN101014618A

CN101014618A - 抗原的寡聚装配多肽

Info

Publication number: CN101014618A
Application number: CNA2005800248434A
Authority: CN
Inventors: B·卡普奇; V·马斯格阿尼; R·拉普里奥; M·斯卡塞利
Original assignee: Chiron SRL
Current assignee: GSK Vaccines SRL
Priority date: 2004-07-23
Filing date: 2005-07-22
Publication date: 2007-08-08
Anticipated expiration: 2025-07-22
Also published as: EP1778725A2; ES2355980T3; ATE493437T1; WO2006011060A2; DE602005025647D1; US7915218B2; CN101014618B; CA2574375C; WO2006011060A3; US20080260769A1; EP1778725B1; CA2574375A1

Abstract

表达寡聚形式抗原性多肽的系统将抗原性多肽融合到寡聚多肽从而使该寡聚多肽能与其它寡聚多肽相互作用并使该抗原性多肽的多拷贝以寡聚体形式紧密接近。相比于单体形式，用这种方式表达寡聚形式多肽能提高它们的免疫原性。

Description

抗原的寡聚装配多肽

文中引用所有文献全文纳入本文作为参考。

发明领域

本发明涉及抗原呈递领域。更具体地说，涉及蛋白质的修饰以使它们以寡聚形式，例如，在细胞表面表达。

发明背景

许多天然免疫原性多肽在重组表达时会丢失此特性。一些情况下，天然多肽具有在异源宿主中表达时不会形成的结构特征，例如，翻译后修饰可能不正确、影响构象的分子间相互作用可能会丧失等等。造成免疫原性丢失的其它原因是，多肽(例如，表面表达的多肽)天然是寡聚的，且这种四聚结构是免疫原性所必需的(例如，仅当存在特定的四寡聚结构时多肽才展示出表位)。寡聚结构的丢失可能意味着单体蛋白的免疫原性低于其相应的天然寡聚物。

其它情况下，天然多肽可以是不能在重组宿主中表达的跨膜多肽。当要在原核生物中表达真核多肽(包括真核病毒的多肽)时通常会出现这些问题。提高病毒跨膜多肽表达的一种方法是除去其跨膜结构域并仅表达抗原性胞外结构域{1}。然而，这种“可溶性受体”技术也会造成四聚结构丢失。如果天然受体以寡聚形式存在于病毒表面，并且寡聚化由于跨膜区序列而发生，则可溶性受体将丢失其寡聚能力，且这种丢失可能具有功能性结果，例如丧失信号转导或亲合力。丢失结合亲合力，即便仍保留结合亲和力，对于例如用于疫苗的抗原特别成问题。

参考文献2和3已经描述了寡聚蛋白质的技术。

本发明的一个目的是提供提高多肽尤其是抗原性多肽的表达，例如，以保留其寡聚结构的方法。

发明概述

本发明基于表达寡聚形式抗原性多肽的系统。抗原性多肽与寡聚多肽相融合从而使该寡聚多肽能够与其它寡聚多肽相互作用并使该抗原性多肽的多拷贝以寡聚体形式紧密接近。相比于单体形式，用此方式表达寡聚形式多肽能提高它们的免疫原性。

因此，本发明提供了以重组寡聚形式表达感兴趣多肽的方法，其中所述感兴趣的多肽与寡聚多肽相融合从而使多个寡聚结构域可结合以呈递感兴趣的寡聚形式多肽。具体地说，该方法可用于：(a)在膜表面呈递寡聚多肽，但结构中包含跨膜序列，和(b)利用粘附素—如细菌粘附素，例如来自脑膜炎奈瑟氏球菌(Neisseria meningitidis)的NadA粘附素{4}—的结构特征呈递寡聚多肽。

本发明可用于任何抗原性多肽，包括病毒和非病毒抗原。该方法特别适合表达寡聚形式的表面多肽，如天然为寡聚形式的表面蛋白的胞外部分。感兴趣的多肽可以是全长多肽或者可以是全长多肽的片段，例如它可以包含全长多肽的一个或多个结构域。

本发明提供的多肽包含：(a)抗原结构域；(b)寡聚结构域；和(c)跨膜结构域，其中的结构域(a)、(b)和(c)天然状况下未在同一多肽中一起发现(尤其是，其中的结构域(a)和(b)天然状况下未在同一多肽中一起发现)。结构域从C-末端到N-末端或从N-末端到C-末端以(a)-(b)-(c)为序。跨膜结构域更通常位于或接近蛋白质的C-末端。

多肽中含有跨膜结构域能使多个寡聚结构域关联以在膜表面呈递寡聚形式多肽。除了通过其寡聚结构域关联，多肽还能够通过脂双层内它们的跨膜结构域的相互作用而关联进而维持寡聚结构。含有跨膜序列也有助于一些抗原的正确折叠。参考文献2的多体被设计成不含跨膜序列。

本发明提供的多肽包含：(a)抗原结构域；和(b)来自粘附素的寡聚结构域，其中结构域(a)和(b)天然状况下未在同一多肽中一起发现。结构域从C-末端到N-末端或从N-末端到C-末端以(a)-(b)为序。多肽通常将含有除(a)和(b)之外的序列。例如，为表面展示抗原性多肽，本发明通常涉及利用除寡聚结构域之外的跨膜结构域，如上所述。粘附素优选细菌粘附素，更优选‘Oca’粘附素，最优选来自脑膜炎奈瑟氏球菌的NadA粘附素。

附图简述

图1显示了SARS冠状病毒E2单体的结构。

图2显示了脑膜炎球菌NadA蛋白内的结构域{4}。

图3显示了HIV gp120 Env蛋白内的结构域。图4显示了NadA的结构域。图5显示了含有来自Env和NadA的区域的杂交蛋白。图6显示了gp120-NadA(824个氨基酸(aa))和gp140-NadA(741aa)构建物的构成。

图7显示了表达gp120-NadA和gp140-NadA的大肠杆菌(E.coli)的western印迹。

图8显示了表达gp120-NadA和gp140-NadA的大肠杆菌的SDS-PAGE。

图9-11显示了表达gp120-NadA或gp140-NadA的大肠杆菌的FACS分析。

图12显示了表达gp140-NadA的大肠杆菌的剂量依赖性CD4结合。

图13-14显示了结合CD4的表达gp140-NadA的大肠杆菌的数目。

图15显示了与或不与纯gp140预培养的表达gp140-NadA的大肠杆菌与CD4结合的FACS分析。

图16和17显示了CD4/Env复合体的HPLC分析。

图18显示了通过ELISA确定的抗-gp140ΔV2抗体滴度。水平的虚线显示了放血前的滴度。X轴上的箭头显示了给予致敏剂量的时间，“B”表示加强剂量。四条数据线从上到下分别为：阴性对照(-)；OMV-gp140-NadA(■)；OMV-gp120-NadA和gp140(▲)；和gp140阳性对照(●)。

序列表的描述

SEQ ID NO：	描述
SEQ ID NO：	描述	1	SARS冠状病毒的E2刺突蛋白，显示了前导肽和膜锚
2	SEQ ID NO：1的球状头域	1	SARS冠状病毒的E2刺突蛋白，显示了前导肽和膜锚
2	SEQ ID NO：1的球状头域	3-9	NadA-gp120杂交体
10	gp140ΔAV2序列，未表达NadA前导肽	3-9	NadA-gp120杂交体
10	gp140ΔAV2序列，未表达NadA前导肽	11	脑膜炎球菌NadA的前导肽(29aa)
12	gp120序列(475aa)	11	脑膜炎球菌NadA的前导肽(29aa)
12	gp120序列(475aa)	13	NadA茎(263aa)
14	二肽接头Gly-Ser(2aa)	13	NadA茎(263aa)
14	二肽接头Gly-Ser(2aa)	15	NadA锚(55aa)
16	gp120ΔV2(448aa)	15	NadA锚(55aa)
16	gp120ΔV2(448aa)	17	Gp4(171aa)
18	二肽接头Lys-Leu(2aa)	17	Gp4(171aa)
18	二肽接头Lys-Leu(2aa)	19	延伸的NadA锚(74aa)
20	延伸的NadA锚(108aa)	19	延伸的NadA锚(74aa)
20	延伸的NadA锚(108aa)	21	脑膜炎奈瑟氏球菌的蛋白287
22	脑膜炎奈瑟氏球菌的蛋白936	21	脑膜炎奈瑟氏球菌的蛋白287
22	脑膜炎奈瑟氏球菌的蛋白936	23-25	脑膜炎奈瑟氏球菌的蛋白741
26	脑膜炎奈瑟氏球菌的蛋白953	23-25	脑膜炎奈瑟氏球菌的蛋白741
26	脑膜炎奈瑟氏球菌的蛋白953	27	富含Gly的接头
28	NadA	27	富含Gly的接头

29	HadA
29	HadA	30	YadA
31	UspA2	30	YadA
31	UspA2	32-33	gp120-NadA杂交体
34-35	gp140-NadA杂交体	32-33	gp120-NadA杂交体
34-35	gp140-NadA杂交体	36	gp120
37-38	凝血酶序列	36	gp120
37-38	凝血酶序列	39	gp140
40	延伸的NadA锚	39	gp140
40	延伸的NadA锚	41	SEQ ID NO：13+SEQ ID NO：15
42-58	参考文献71的粘附素	41	SEQ ID NO：13+SEQ ID NO：15

发明详述

本发明表达多肽形式的感兴趣的抗原，其包括抗原的抗原性结构域和异源寡聚结构域。各单体多肽内的寡聚结构域可关联并形成寡聚体，其中感兴趣的抗原性结构域的多拷贝相互接近而展示。

本发明部分基于以下原则：天然蛋白质可可分成自发折叠结构域，这些结构域可被分离和重组而不丧失其基本功能{5，6}。因此，可根据其功能选择寡聚化结构域、抗原性结构域和许多其它任选结构域(例如，跨膜结构域、信号序列等)，然后重组而不丧失该功能。

寡聚结构域

寡聚结构域是本发明多肽中的氨基酸序列，它形成可与其它多肽(相同或不同)内的寡聚结构域(相同或不同)相互作用的结构，从而使这些多肽非共价关联形成寡聚体。

天然形成的蛋白质寡聚体(杂-寡聚体和同-寡聚体)以各种不同途径关联，例如通过不同单体内的β-片层关联，通过不同单体内的α-螺旋关联，通过疏水表面膜片(patch)关联，等等。

涉及蛋白质寡聚化的共同结构基序是卷曲螺旋结构域。卷曲的α-螺旋结构基序自身可形成螺旋，2、3、4或5个α-螺旋可相互缠绕形成称为“卷曲螺旋”的左手超螺旋{7-13}。卷曲螺旋结构域的简单性使其成为设计具有规定寡聚化状态的嵌合蛋白的常规选择{10}。

在卷曲螺旋结构中，α-螺旋通过沿各螺旋的一侧形成非极性条带(stripe)的疏水残基相互作用，该条带任一侧的侧链之间可存在稳定的静电相互作用。在α-螺旋的abcdefg七残基重复中，非极性条带由残基a和d上的疏水侧链确定范围，任何静电相互作用主要出现在残基e和g上。位置a上最常见是Leu、Ile或Ala，位置d上通常是Leu或Ala。残基e和g通常是Glu或Gln，Arg和Lys也主要在位置g上。带电残基因与溶剂相互作用而通常出现在位置b、c和f上。然而，这种常规七残基模式可以有例外，Pro残基有时出现在七残基内。这种例外通常具有功能意义。

本领域已知数百个卷曲螺旋结构域序列，任何合适的序列只要能与其它卷曲螺旋结构域寡聚且不破坏多肽内其它结构域的功能就能用作本发明的寡聚化基序。优选使用胞外发现{14}并自然担当寡聚结构域的卷曲螺旋结构域。除使用天然卷曲螺旋结构域外还可使用人工卷曲螺旋结构域{15，16}。结构域(b)可包含亮氨酸拉链序列或丙氨酸拉链序列{17}。

用于本发明多肽的卷曲螺旋结构域优选形成三聚体，从而使本发明多肽也可装配成三聚体。

优选的卷曲螺旋结构域可获自细菌跨膜蛋白。优选的跨膜蛋白亚类是粘附素{即介导粘附到其它细胞或者粘附到表面的细胞-表面蛋白)，尤其是非-菌毛粘附素(例如，寡聚化卷曲螺旋粘附素(或‘Oca’)家族中的粘附素)。用于本发明的特定跨膜序列是以下粘附素的跨膜序列：耶尔森菌小肠结肠炎(Yersinia enterocolitica)粘附素YadA{69；例如，本文的SEQ ID NO：30，或序列数据库中的其它多形形式}、脑膜炎奈瑟球菌粘附素NadA{4；例如，本文的SEQ ID NO：28，或其它多形形式，例如见参考文献18}、粘膜炎莫拉菌(Moraxella catarrhalis)表面蛋白UspA2{19，70；例如，本文的SEQ ID NO：31，或序列数据库中的其它多形形式}和其它粘附素，如来自流感嗜血杆菌埃及生物群(Haemophilus influenzae biogroup aegyptius)的HadA粘附素{71；本文的SEQ ID NO：29}和SEQ ID NO：42-58中公开的其它粘附素。因此，本发明多肽中的结构域(b)可包含本文的氨基酸序列SEQ ID NO：28-31或者42-58之一的片段，或者可包含与SEQ ID NO：28-31或42-58中的一个或多个有至少m％相同性的氨基酸序列的片段，其中m是50以上(例如，60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5以上)。该片段可以是SEQ ID NO：28-31或42-58中一个或多个的至少n个连续氨基酸，其中n是7以上(例如，8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250以上)。这些多肽包括SEQ ID NO：28-31或42-58的变体(例如，等位变体、同源物、直向同源物、侧向同源物、突变体等)。优选使用来自SEQ ID NO：28-31和42-58的粘附素，其头部区域和卷曲螺旋区域之间的边界已知。

在具有卷曲螺旋区域的多肽的氨基酸序列中，α-螺旋的七残基重复性质意味着可以一定精密度确定卷曲螺旋结构域的边界，但卷曲螺旋中残基的确切排列最终还无法绝对准确地知道。然而，由于常规试验可显示卷曲螺旋是否需要任何可疑的特定氨基酸残基，因此缺乏绝对精密度不是实施本发明的问题。即便如此，本发明不需要绝对准确地知道边界，因为本发明只要求卷曲螺旋结构域能使多肽与其它卷曲螺旋结构域寡聚而不破坏该多肽内其它结构域的功能。NadA中卷曲螺旋结构域的边界见参考文献4。

可用于本发明的另一类寡聚结构域是称为胶原螺旋的左手三螺旋{20}。这些形成三螺旋的序列包括基本的三肽重复序列¹Gly-²Xaa-³Xaa，其中²Xaa通常是Pro，³Xaa通常是4-羟脯氨酸。尽管该基序被称为“胶原”螺旋，但它在胶原之外的许多蛋白质中发现。因此，寡聚结构域可以是含有序列基序¹Gly-²Xaa-³Xaa多个重复的序列，该基序折叠形成可与其它多肽链中相应的螺旋结构寡聚的螺旋结构。

胶原还提供了另一类寡聚结构域。参考文献21描述了一种在X型胶原非-胶原结构域1(NC1)中发现的基序，这种基序可用于形成不含三螺旋的三聚体和多聚体。这种三聚结合高度热稳定性，且不含分子间二硫键。因此寡聚结构域可包含NC1序列。

用于本发明的寡聚结构域通常可维持寡聚结构而不需要形成单体内二硫桥，但含有二硫键连接单体的寡聚体也在本发明之内。

抗原结构域

抗原性结构域是本发明多肽内的一种氨基酸序列，它形成可与抗体结合的结构。抗原性结构域的排列不会阻止关联的寡聚结构域的寡聚化活性。

多肽的抗原性结构域可衍生自任何合适的多肽抗原。本发明可用于制备天然不寡聚多肽的寡聚形式，或者可用于重组表达模拟其天然寡聚装配形式的多肽。本发明可用于呈递天然展示在细胞表面的多肽的表面寡聚体，或者可用于呈递在表面范围内的非表面多肽。本发明可用于展示来自细菌、植物、动物以及病毒的多肽。

本发明尤其适合与自然形成寡聚体的表面抗原和/或抗原联用。细菌和病毒抗原是优选的抗原结构域来源。

一组优选的抗原是病毒表面糖蛋白，尤其是有包膜病毒的。有包膜病毒的表面蛋白包括跨膜结构域和病毒外(extraviral)结构域(胞外域)，其主要抗原决定簇位于病毒外部分。如上所述，已知将病毒外结构域与跨膜结构域{1}分离能得到膜抗原的可溶形式。根据本发明，可将病毒外结构域与跨膜结构域分离并与异源氨基酸结构域重组。因此，优选的用于本发明的抗原性结构域是有包膜病毒表面蛋白的病毒外结构域。

具体的感兴趣的病毒蛋白包括：

-逆转录病毒科的包膜糖蛋白。逆转录病毒科包括慢病毒属和泡沫病毒属。感兴趣的病毒包括HTLV-I、HTLV-II、猫免疫缺损病毒(FIV)、人免疫缺陷病毒(HIV)、猴免疫缺陷病毒(SIV)、黑猩猩泡沫病毒和人泡沫病毒。HIV的Env糖蛋白具有三聚卷曲螺旋融合区{22}，对其特别感兴趣。

-副粘病毒科的包膜糖蛋白，如F蛋白。副粘病毒科包括：(a)副粘病毒亚科(Paramyxovirinae)，其包括副粘病毒、腮腺炎病毒和麻疹病毒，以及(b)肺病毒亚科，其包括肺病毒。感兴趣的病毒包括副流感病毒(PIV)、人副粘病毒、牛瘟麻疹病毒、小反刍动物瘟病毒、麻疹病毒、流行性腮腺炎病毒、呼吸道合胞病毒(RSV)、尼派病毒(Nipah virus)、亨得拉病毒(Hendra virus)、马麻疹病毒(EMV)、狂犬病病毒和曼那角病毒(Menangle virus)。副粘病毒{23}、麻疹病毒{24}和RSV{25，26，27}的F糖蛋白具有三聚卷曲螺旋融合区，对其特别感兴趣。

-纤丝病毒科的包膜糖蛋白。纤丝病毒科包括马尔堡病毒和埃博拉病毒。埃博拉病毒的Gp蛋白形成卷曲螺旋三聚体{28}，对其特别感兴趣。

-正粘病毒科的包膜糖蛋白。正粘病毒科包括流感病毒和索戈托病毒。血凝素(HA)蛋白是流感病毒的融合蛋白，与卷曲螺旋茎{30}形成三聚体{29}。对HA特别感兴趣。

-冠状病毒科的刺突糖蛋白。冠状病毒科包括冠状病毒属和环曲病毒属。感兴趣的病毒包括人冠状病毒、鸟类感染性支气管炎病毒、猫传染性腹膜炎病毒、鼠肝炎病毒、猪流行性腹泻病毒、猪血凝性脑脊髓炎病毒、猪传染性胃肠炎病毒和伯尔尼病毒(Berne virus)。人SARS冠状病毒的刺突(E2)蛋白是I类病毒融合蛋白{31}，据信它形成三聚体，可能是我们感兴趣的。

-弹状病毒科的包膜糖蛋白。弹状病毒科包括弹状病毒属、水疱病毒属、狂犬病病毒属、短暂热病毒属、质型弹状病毒属和核型弹状病毒属。感兴趣的病毒包括水泡性口炎病毒、狂犬病病毒、莫科拉病毒、牛短暂热病毒。狂犬病病毒{32，33}、狂犬病病毒{34}和莫科拉病毒{34}的G蛋白在病毒表面形成三聚体，对它们特别感兴趣。

-披膜病毒科的包膜糖蛋白。披膜病毒科包括甲病毒属和风疹病毒属。感兴趣的病毒包括辛德毕斯病毒、东部和西部脑炎病毒、塞姆利基森林病毒(Semliki Forestvirus)、风疹病毒、奥拉病毒、巴班基病毒(Babanki virus)、巴码森林病毒鸟-A(BarmahForest virus avis-A)、贝巴鲁病毒、Buggy Creek病毒、基孔肯雅病毒、沼泽地病毒、摩根堡病毒(Fort Morgan virus)、格塔病毒、高地J病毒(Highlands J virus)、克泽拉格齐病毒、马亚罗病毒、米德尔堡病毒、穆坎博病毒、恩杜茂病毒、奥克尔布病毒(Ockelbovirus)、奥尼翁-尼翁病毒、皮克孙纳病毒、罗斯河病毒、鹭山病毒、乌纳病毒、委内瑞拉马脑炎病毒和沃达罗河病毒。塞姆利基森林病毒的E1刺突蛋白形成三聚卷曲螺旋结构{35}并负责融合，因此对其特别感兴趣。

-黄病毒科{36}的包膜(E¹)糖蛋白。黄病毒科包括黄病毒属、瘟病毒属和丙型肝炎病毒属。感兴趣的病毒包括登革病毒、丙肝病毒、黄热病毒、日本脑炎病毒、西尼罗病毒、圣路易士脑炎病毒、牛腹泻病毒和蜱传脑炎(TBE)病毒。西尼罗病毒{37}、登革病毒{38}、黄热病毒{38}和TBE病毒{39}的E蛋白在病毒表面形成三聚结构而对它们特别感兴趣。

-本扬病毒科的包膜糖蛋白。本扬病毒科包括本扬病毒属、内罗病毒属、白蛉病毒属、汉坦病毒属和番茄斑萎病毒属(Tospoviruses)。感兴趣的病毒包括本扬病毒、布尼亚维拉病毒、加利福尼亚脑炎病毒、拉克罗斯病毒、汉坦病毒、辛诺柏病毒、克里米亚-刚果出血热病毒、白蛉热西西里病毒和立夫特山谷热病毒。汉坦病毒属的核壳蛋白形成三聚卷曲螺旋{40}而对其特别感兴趣。

-沙粒病毒科的包膜糖蛋白。沙粒病毒科包括淋巴细胞性脉络丛脑膜炎病毒，伊派病毒和拉沙病毒。

这些蛋白可以任何已知形式使用，如天然形式、突变形式、截短形式、缺失形式等。例如，已知HIV Env蛋白的各种形式，包括修饰的和结构域缺失的蛋白质，所有这些各种形式都可用于本发明。

当病毒蛋白天然以剪切形式存在时(例如，HIV的gp160，切割成gp120/gp41；冠状病毒的刺突蛋白，切割成S1/S2；等等)，本发明优选使用N-末端切割产物，或者胞外域，作为抗原性结构域。

在病毒表面蛋白中，优选亚组是在病毒表面自然形成寡聚体的抗原。特别优选的抗原是病毒融合蛋白(或刺突蛋白)，该蛋白必须通常以寡聚形式使用以使其具有融合活性{41}。本发明提供了以天然寡聚形式呈递这些蛋白质的抗原性部分的方法。因此，用于本发明的优选抗原性结构域是来自有包膜病毒的病毒融合蛋白的球状头域。

病毒融合蛋白通常用描述为茎(stalk)结构域和球状头域。病毒外头域包含抗原决定簇，跨膜茎结构域将蛋白质锚定到病毒颗粒包膜上并通过其卷曲螺旋基序介导天然三聚装配。在天然病毒颗粒中，茎和头域可非共价或共价关联。它们可通过前体多肽的蛋白水解切割形成，切割产物在病毒颗粒表面保持关联。

SARS冠状病毒的E2刺突蛋白是一种病毒融合多肽，其S1球状头域可被用作抗原性结构域。可利用E2蛋白的一些基因组序列，本文的SEQ ID NO：1是优选的序列。SEQ ID NO：1内的球状头部约位于残基14-662(SEQ ID NO：2)。因此，本发明多肽中的结构域(a)可包含本文的氨基酸序列SEQ ID NO：2，或者可包含以下氨基酸序列：(i)与SEQ ID NO：2具有至少m％相同性，其中m是50以上(例如，60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5以上)；和/或(ii)是SEQ ID NO：2中至少n个连续氨基酸的片段，其n是7以上(例如，8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250以上)。这些多肽包括SEQ ID NO：2的变体(例如，等位变体、同源物、直向同源物、侧向同源物、突变体)。(ii)的优选片段包含SEQ ID NO：2的表位，优选B细胞表位。B细胞表位可凭经验鉴定或者可根据算法预测。(ii)的其它优选片段缺乏SEQ ID NO：2相关氨基酸序列中C-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、15、20、25个以上)，和/或N-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、15、20、25、45个以上)。

在病毒融合多肽的氨基酸序列中，无法绝对准确地知道球状头域的边界，但这不是实施本发明的问题。最初可大致确定球状序列，如果需要的话然后再通过检测有和没有毗邻氨基酸残基的第一近似序列(first approximation)的抗原性来确定其边界。即便如此，本发明不需要绝对准确地知道边界，因为本发明只基本要求该序列应以保留病毒蛋白相关抗原决定簇而不破坏多肽内其它结构域的功能的方式起作用。包含外源性非球状头部氨基酸通常不会损伤这种基本功能。

另一组优选的抗原是细菌表面蛋白。根据本发明，可操作其表面蛋白用于寡聚表达的特定细菌是：脑膜炎奈瑟球菌(Neisseria meningitides)，尤其是血清群B；淋病奈瑟球菌(Neisseria gonorrhoeae)；肺炎链球菌(Streptococcus pneumoniae)；酿脓链球菌(Streptococcus pyogenes)；无乳链球菌(Streptococcus agalactiae)；金黄色葡萄球菌(Staphylococcus aureus)；流感嗜血菌(Haemophilus influenzae)，包括b型和不可分型的菌株；粘膜炎莫拉菌(Moraxella catarrhalis)；幽门螺杆菌(Helicobacter pylori)；砂眼衣原体(Chlamydia trachomatis)；肺炎衣原体(Chlamydia pneumoniae)；白喉棒状杆菌(Corynebacterium diphtheriae)；破伤风梭菌(Clostridium tetani)；百日咳博德特菌(Bordetellapertussis)等。本发明将通常利用细菌表面蛋白的胞外抗原性区域，省略了任何细菌跨膜序列。根据模式识别、序列分析和同源性不难鉴定细菌表面蛋白的跨膜序列(如果存在的话)。

本发明多肽的结构域(a)可包含下述任何特定氨基酸序列，或者可包含以下氨基酸序列：(i)与以下氨基酸序列中的一个或多个有至少m％相同性，其中m是50以上(例如，60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5以上)；和/或(ii)以下氨基酸序列中至少n个连续氨基酸的片段，其中n是7以上(例如，8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250以上)：

-其抗原性结构域衍生自脑膜炎奈瑟球菌抗原，结构域(a)可基于选自SEQ ID NO：21-26的氨基酸序列。

-其抗原性结构域衍生自肺炎链球菌抗原，结构域(a)可基于选自PhtA、PhtD、PhtB、PhtE、SpsA、LytB、LytC、LytA、Sp125、Sp101、Sp128、Sp130或Sp133的氨基酸序列，如参考文献42所述。

-其抗原性结构域衍生自酿脓链球菌或无乳链球菌抗原，结构域(a)可基于选自参考文献43所述的链球菌氨基酸序列的氨基酸序列。

-其抗原性结构域衍生自金黄色葡萄球菌抗原，结构域(a)可基于选自参考文献44中SEQ ID NO：2-5642中偶数序列的氨基酸序列。

-其抗原性结构域衍生自流感嗜血菌抗原，结构域(a)可基于选自参考文献45中SEQ ID NO：2-5080的氨基酸序列。

-其抗原性结构域衍生自粘膜炎莫拉菌抗原，结构域(a)可基于选自参考文献46-58中所述抗原的氨基酸序列。

这些多肽包括变体(例如，等位变体、同源物、直向同源物、侧向同源物、突变体等)。(ii)的优选片段包括所述氨基酸序列的表位，优选B细胞表位。B细胞表位可凭经验鉴定或者可根据算法预测。(ii)的其它优选片段缺乏所述氨基酸序列中C-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、15、20、25以上)，和/或N-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、15、20、25、45以上)。

在细菌表面多肽的氨基酸序列中，无法绝对准确知道胞外抗原结构域和跨膜结构域之间的边界，但这不是实施本发明的问题。最初可大致确定抗原序列，如果需要的话然后再通过检测有和没有毗邻氨基酸残基的第一近似序列的抗原性来确定其边界。即便如此，本发明不需要绝对准确地知道边界，因为本发明只基本要求该序列应以保留细菌蛋白相关抗原决定簇而不破坏多肽内其它结构域的功能的方式起作用。

跨膜结构域

本发明的多肽将通常包含能使多肽定位于脂双层内的跨膜结构域。已知有数千个跨膜序列可用于本发明。一般来说，可将蛋白质的跨膜结构域视作一个完整的单元并取代其它蛋白质的跨膜结构域而不会破坏蛋白质的膜定位。

在脂双层内原位时，跨膜结构域的氨基酸链将通过脂双层至少一次，但也可通过若干次(单次通过或多次通过)。如果通过双层奇数次，则该跨膜结构域的起点将与跨膜结构域(以及抗原性结构域)的终点位于双层的相对侧；如果通过偶数次则起点和终点将位于相同侧。

跨膜结构域通常含有α-螺旋序列，尽管已知也可含有跨膜β-链(stranded)序列，因为α-螺旋序列包含埋在膜内的短成孔螺旋。

发现可用于本发明的一类跨膜结构域是七跨膜螺旋受体(7-TMR家族)。其名称说明这些蛋白质的跨膜结构域穿过脂双层七次。人7-TMR家族序列的综合数据库见参考文献59和60。

更普遍的是，可自由获得的Tmbase数据库{61，62}包括跨膜蛋白及其螺旋跨膜结构域的细节。相反，DB-NTMR{63}是跨膜蛋白非跨膜序列的数据库。TMPDB{64，65}是已经通过X-射线晶体学、NMR、基因融合技术、取代的半胱氨酸可达法、N-连接糖基化试验和其它生化方法测定的经试验表征的跨膜拓扑学数据库。

可对氨基酸序列采用多种跨膜预测算法来鉴定其它跨膜结构域，这些算法包括，例如，HMMTOP、TMHMM、TMPred、PHDhtm、DAS、TMFinder、SOSUI、TMAP、MEMSAT和TOPPred2{66，67}。

在跨膜蛋白的氨基酸序列中，无法绝对准确地知道跨膜结构域的边界(例如，具体氨基酸残基应该是跨膜结构域的一部分或是胞质或胞外结构域的一部分可能不清楚)，但这不是实施本发明的问题。最初可大致确定跨膜序列，如果需要的话然后再通过检测序列和融合等截短形式来确定其边界。即便如此，本发明不需要绝对准确地知道边界，本发明只基本要求该序列应以使得多肽定位于脂双层内而不破坏多肽内其它结构域的功能的方式起作用。在膜的一侧或两侧包含外源性非跨膜氨基酸通常不会破坏跨膜序列的这种基本功能。

跨膜结构域可来自真核或原核多肽(例如，来自植物、动物、哺乳动物、酵母、革兰氏阴性菌、革兰氏阳性菌、病毒等)或者可使用人工跨膜结构域{例如，68}。

优选的跨膜结构域来自细菌跨膜蛋白。跨膜蛋白的优选亚组是粘附素。用于本发明的特定跨膜序列是：小肠结肠炎耶尔森氏菌粘附素YadA{69}、脑膜炎奈瑟球菌粘附素NadA{4}、粘膜炎莫拉菌表面蛋白UspA2{70}和其它粘附素{71}，如SEQ ID NO：42-58的跨膜结构域。因此，本发明多肽的结构域(c)可包含本文的NadA氨基酸序列SEQ ID NO：15、19、20或40之一，或者可包含以下氨基酸序列：(i)与SEQ ID NO：15、19、20或40中的一个或多个有至少m％相同性，其中m是50以上(例如，60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5以上)；和/或(ii)SEQ ID NO：15、19、20或40中一个或多个的至少n个连续氨基酸的片段，其中n是7以上(例如，8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250以上)。这些多肽包括SEQ ID NO：15、19、20和40的变体(例如，等位变体、同源物、直向同源物、侧向同源物、突变体等)。(ii)的优选片段包括SEQ ID NO：15、19、20和40中一个或多个的表位，优选B细胞表位。B细胞表位可凭经验鉴定或者可根据算法预测。(ii)的其它优选片段缺乏SEQ ID NO：15、19、20和40相关氨基酸序列中C-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、15、20、25以上)，和/或N-末端的一个或多个氨基酸(例如，1、2、3、4、5、6、7、8、9、10、1 5、20、25、45以上)。

其它优选的跨膜结构域是取自同一蛋白质的抗原性结构域。因此结构域(a)和(c)可来自同一蛋白质，但寡聚结构域来自不同蛋白质。例如，如果抗原性结构域来自病毒(例如，HIV)的包膜蛋白则跨膜结构域也可来自该包膜蛋白。

结构域(a)、(b)和(c)的优选组合

优选结构域(a)、(b)和(c)中至少有一个具有真核来源且至少有一个具有原核来源。或者，(a)、(b)和(c)中的至少一个可以是未在自然界中发现的人工结构域。病毒根据其天然宿主被认为是原核生物或真核生物，例如，HIV是真核生物，而噬菌体是原核生物。

本发明特别适合细菌呈递真核抗原。因此，优选结构域(c)来自原核生物，如细菌，而结构域(a)来自真核生物，特别是真核病毒。结构域(b)可来自原核生物或真核生物，但优选使用原核序列。

在优选实施方案中，结构域(b)和(c)可来自同一原核蛋白质。则这些结构域在某些程度上相互兼容，这一点毋庸置疑。细菌表面蛋白是结构域(b)和(c)的优选来源，可用细菌粘附素。参考文献71的YadA、NadA、UspA2粘附素是合适的来源。NadA粘附素最为优选，因此结构域(b)和(c)可一起具有氨基酸序列，例如SEQ ID NO：41。

一种特别优选的本发明多肽包含：(a)来自包膜真核病毒病毒融合蛋白的抗原性结构域；(b)来自细菌粘附素的卷曲螺旋结构域；和(c)来自与(b)相同的细菌粘附素的跨膜结构域。具有来自脑膜炎奈瑟球菌NadA的结构域(b)和(c)和来自HIV的结构域(a)的这种蛋白质的例子是SEQ ID NO：3、4、5、6、32和33。

其它序列

本发明的多肽除了具有结构域(a)、(b)以及任选的(c)，还可包含其它序列。

多肽可包含N-末端前导肽或信号肽以指导蛋白质通行。这些肽将存在于新翻译的多肽上，但通常不存在于多肽的成熟形式中，例如位于脂双层内。当要在细胞表面展示蛋白质时，优选用前导肽将蛋白质引导至表达宿主的膜。为在大肠杆菌中表达，则可方便地利用NadA的前导肽，但熟练的技术人员也可利用许多其它合适的前导肽。

多肽通常包括从结构域(c)向内延伸的胞质序列。这种胞质序列通常位于结构域(c)的C-末端，并位于完整多肽的C-末端。合适的胞质尾区来自跨膜蛋白。为方便起见，通常采用天然发现的具有结构域(c)的胞质尾区，虽然也当然可对天然尾序列进行修饰。因此胞质序列可含有以下氨基酸序列：(i)与天然胞质尾区具有至少m％相同性，其中m是50以上(例如，60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5以上)；和/或(ii)胞质尾区至少n个连续氨基酸的片段，其中n是7以上(例如，8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250以上)。尾可影响蛋白质通行。

多肽可包含这些不同结构域之间的氨基酸序列。这些序列可以是人工序列(例如，为帮助DNA操作或克隆，如限制性位点)或者可以取自与结构域(a)-(c)相同的多肽，例如可采用已经位于跨膜结构域和卷曲螺旋序列之间的序列。有用的人工接头序列是GSGGGG(SEQ ID NO：27)，其中BamHI限制位点形成有助于克隆和操作的Gly-Ser二肽，(Gly)₄四肽通常是产生柔性的聚甘氨酸接头。

因此，本发明的多肽通常具有式NH₂-A-B-C-D-E-F-G-H-COOH，式中，-A-是任选前导序列；-B-是任选接头序列；-C-是抗原序列；-D-是任选接头序列；-E-是卷曲螺旋序列；-F-是任选接头序列；-G-是跨膜序列；和-H-是任选胞质尾区。

序列-A-、-B-、-D-、-F-和-H-通常较短(例如有40个以下的氨基酸，即39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、)。短肽有益于克隆和纯化(例如，组氨酸标签，即His_h，其中h＝3、4、5、6、7、8、9、10以上)。

多肽可包含一个或多个蛋白酶识别序列，从而能够在例如多肽表达后释放出所需部分(例如，胞外部分)，这样便可在细胞表面方便地表达蛋白质，但也可释放出供其它用途。可将蛋白酶识别序列引入各种位置，例如，结构域之间(例如和接头一起)，或者可将其插入结构域。蛋白酶识别序列可位于卷曲螺旋结构域和抗原性结构域之间，从而使蛋白酶能释放抗原性结构域并中断寡聚，或者可位于跨膜结构域和卷曲螺旋结构域之间，从而使蛋白酶能释放寡聚形式的多肽。在卷曲螺旋结构域内含有切割位点将根据该位点的位置对寡聚化具有不同作用。因此，上式中序列-D-、-E-和/或-F-中的一个或多个可包含蛋白酶识别位点。优选序列-F-中含有该位点。

凝血酶识别序列是LVPR/GS(SEQ ID NO：38)，可单独将其插入或者可与某接头(例如，SEQ ID NO：37)一起插入。其它蛋白酶和它们的识别序列是本领域熟知的。

制备表达多肽的核酸载体

本发明的多肽可用各种方法(例如，重组表达、从细胞培养物纯化、化学合成等)制备，并且可以是各种形式(例如，天然的、具有融合伴侣的、非糖基化的、脂质化的等)。优选制备基本纯的形式(即基本不含其它细菌或宿主细胞的蛋白质)。

根据本发明，采用重组宿主是多肽表达的优选途径。宿主包含编码本发明多肽的核酸序列。这种核酸序列可通过将编码蛋白质不同结构域的序列融合于读框内来制备。例如，编码抗原性结构域和寡聚结构域的核酸片段可通过化学合成、扩增、或消化来制备。在使片段变得相容的任何必需处理(例如末端钝化等)之后，可连接片段以使它们的编码序列位于读框内，从而得到完整的多肽编码序列。可将编码序列置于启动子下游的表达载体内并用于表达目的。

寡聚体

本发明多肽内的卷曲螺旋结构域提供了装配成寡聚体，例如二体、三聚体、四聚体或五聚体的能力。

因此，本发明提供了一种包含本发明寡聚多肽的寡聚蛋白质。这种寡聚体的单体单位可以相同或不同(如二聚蛋白质)，本发明提供了杂二聚体和同二聚体。

杂-寡聚体可通过几种方法产生。例如：单体可具有相同的跨膜和卷曲螺旋结构域，但有不同的抗原性结构域；单体可具有相同的卷曲螺旋和抗原性结构域，但有不同的跨膜结构域；单体可具有相同的跨膜和抗原性结构域，但有不同的卷曲螺旋结构域；单体可仅共用一个结构域；等等。杂-寡聚卷曲螺旋的形成是已知的{16}。

优选的本发明的寡聚体是三聚体。

宿主

本发明可在真核宿主内方便地表达真核多肽而不会损失天然真核多肽的寡聚装配。多肽的抗原性结构域在表达时位于胞外。因此，本发明提供了一种表达本发明多肽的宿主细胞。多肽优选表达在宿主细胞表面。

因此优选在原核宿主如细菌中表达本发明的多肽。大肠杆菌(Escherichia coli)是方便的宿主。其它合适的宿主包括：枯草芽孢杆菌(Bacillus subtilis)、霍乱弧菌(Vibriocholerae)、伤寒沙门菌(Salmonella typhi)、鼠伤寒沙门菌(Salmonella typhimurium)、乳糖奈瑟球菌(Neisseria lactamica)、灰色奈瑟球菌(Neisseria cinerea)、分枝杆菌属(如结核分枝杆菌(M.tuberculosis))、志贺菌属、小肠结肠炎耶尔森菌(Yersinia enterocolitica)、单核细胞增生利斯特菌(Listeria monocytogenes)、酵母等。可操作这些宿主以掺入真核糖基化途径。然而多数情况下，细菌宿主中缺乏内源糖基化途径是有利的，因为糖基化会遮蔽免疫上重要的T-和B-细胞表位。

免疫原

本发明涉及抗原性多肽的表达。抗原性多肽适用于免疫目的，免疫原可以有各种形式。

例如，可将完整的多肽纯化用作免疫原，该多肽可以是单体形式或者优选寡聚形式。当多肽包含蛋白酶切割位点时，可用蛋白酶处理多肽然后将切割的胞外部分用作免疫原。当多肽在细胞内表达时，可将细胞自身用作免疫原，其表面暴露的多肽赋予免疫原性活性。或者，含有暴露多肽的外膜小泡或大泡也可用作免疫原。

用含有本发明多肽的细胞膜(活的或被杀死的完整细胞(‘细菌载体疫苗’)或者衍生自细胞的膜制品)免疫是优选途径。含有本发明核酸和表达本发明多肽的宿主细胞可用作递送载体，例如共生细菌{72}。这对于递送到粘膜表面，包括口服给药特别有用，尤其是当完整细胞的天然营养(形式)用于体内运送。优选的细菌宿主是遗传确定的、减毒的和/或被受体动物或人良好耐受。这种方法的优选免疫宿主包括活的口腔沙门菌属载体疫苗、小肠结肠炎耶尔森菌、志贺菌属、霍乱弧菌、分枝杆菌属BCG菌株和单核细胞增生利斯特菌。

核酸

本发明还提供编码本发明多肽的核酸。此外，本发明提供可与这种核酸杂交的核酸，优选在“高严谨”条件下(例如，65℃，在0.1×SSC，0.5％SDS溶液中)。

本发明的核酸可用许多方法制备(例如，通过化学合成、来自基因组或cDNA文库、来自生物体自身等)并且可以有各种形式(例如，单链、双链、载体、探针等)。优选制备基本纯的形式(即基本不含其它细菌或宿主细胞的核酸)。

术语“核酸”包括DNA和RNA，还包括它们的类似物，例如含有修饰骨架的核酸(如硫代磷酸酯等)以及肽核酸(PNA)等。本发明包括含有与上述序列互补的序列的核酸(例如出于反义或探测的目的)。

免疫原性组合物和药物

本发明提供含有本发明多肽和/或本发明核酸的组合物。本发明组合物优选为免疫原性组合物，更优选是疫苗组合物。本发明疫苗可以是预防性(即，防止感染)或治疗性(即，治疗感染)，但一般是预防性的。

组合物的pH优选在6和8之间，优选约为7。可用缓冲液维持该pH。组合物可以是无菌和/或无热原的。人用组合物可以是等渗的。

本发明也提供用作药物的本发明组合物。所述药物优选能够在哺乳动物中引起免疫应答(即是免疫原性组合物)，更优选疫苗。

本发明也提供一种或多种(例如，2、3、4、5、6种)本发明多肽在制造用于在哺乳动物中引起免疫应答的药物中的应用。所述药物优选疫苗。

本发明也提供在哺乳动物中引起免疫应答的方法，该方法包括给予有效量本发明组合物的步骤。免疫应答优选是保护性的，优选涉及抗体和/或细胞介导的免疫力。该方法可引起加强应答。

哺乳动物优选是人。当疫苗用于预防用途时，人优选是儿童(例如，幼儿或婴儿)或青少年；当疫苗用于治疗用途时，人优选青少年或成人。用于儿童的疫苗也可给予成人，例如来评估安全性、剂量、免疫原性等。

检测治疗性治疗的疗效的一种方式包括给予本发明组合物后监测感染。检测预防性治疗的疗效的一种方式包括给药后监测针对该多肽的免疫应答。

本发明组合物一般直接给予患者。可通过胃肠外注射(例如皮下、腹膜内、静脉内、肌肉内或注射到组织的胞间隙中)，或通过直肠、口服(例如片剂、喷雾)、阴道、局部、透皮{例如见参考文献73}或经皮{例如见参考文献74和75}、鼻内{例如见参考文献76}、眼部、耳部、肺部或其它粘膜给药来实现直接递送。

本发明可用于引起全身免疫和/或粘膜免疫。

剂量治疗可以是单剂量方案或多剂量方案。多剂量(方案)可用于初次免疫方案和/或加强免疫方案。在多剂量方案中，可通过相同或不同途径给予各种剂量，例如，肠胃外初次免疫和粘膜加强免疫、粘膜初次免疫和肠胃外加强免疫，等等。

感染影响身体的各个区域，因此可将本发明的组合物制备为各种形式。例如，可将组合物制备为可注射的，如液体溶液或悬液。也可制备适合于在注射前溶解或悬浮在液体载体中的固体形式(例如，冻干组合物)。可将组合物制备为局部给药的，例如软膏、乳膏或粉末。可将组合物制备为用于口服给药的，例如片剂或胶囊，或糖浆(任选加入调味剂)。可将组合物制备为肺部给药，例如利用细粉或喷雾的吸入剂。可将组合物制备为栓剂或阴道栓。可将组合物制备为鼻部、耳部或眼部给药，例如滴剂。组合物可以是试剂盒形式，所述试剂盒设计成在给予患者之前要重建组合的组合物。这种试剂盒可包含一种或多种液体形式的抗原以及一种或多种冻干抗原。

用作疫苗的免疫原性组合物含有免疫有效量的抗原，以及需要的任何其它组分。‘免疫有效量’指给予个体的量对于治疗或预防有效，所述量可以是单剂量或者是一系列剂量中的一部分。这种量可根据要治疗个体的健康和身体状况、年龄、要治疗个体的分类(例如，非人灵长类、灵长类等)、个体免疫系统合成抗体的能力、治疗医生对病情的判断以及其它有关因素而不同。希望这种量将处于可通过常规试验确定的相对较宽范围内。

组合物的其它组分

本发明的组合物除上述组分外还将含有一种或多种‘药学上可接受的运载体’，包括本身不诱导有害于接受组合物的个体的抗体产生的任何运载体。合适的运载体一般是大的、缓慢代谢的大分子，例如蛋白质、多糖、多乳酸、多乙醇酸、聚氨基酸、氨基酸共聚物和脂质聚集体(例如油滴或脂质体)。这种运载体是本领域技术人员所熟知的。疫苗也可含有稀释剂，例如水、盐水、甘油等。此外，可存在辅助物质，例如润湿剂或乳化剂、pH缓冲物质等。药学上可接受的赋形剂的详尽讨论见参考文献77。

本发明的组合物可与免疫调节剂联合给予。具体地说，这些组合物通常包含一种或多种佐剂。合适的佐剂包括但不限于：

A.含有矿物质的组合物

适合用作本发明佐剂的含有矿物质的组合物包括矿物盐，例如铝盐和钙盐。本发明包括矿物盐，例如氢氧化物(如羟基氧化物(oxyhydroxide))、磷酸盐(如羟基磷酸盐、正磷酸盐)、硫酸盐等{如参见参考文献78的第8和9章}，或不同矿物质化合物的混合物，这些化合物可采取任何合适的形式(如凝胶、晶体、无定形等)，优选(具有)吸附性。含有矿物质的组合物也可配置为金属盐颗粒{79}。

B.油乳剂

适合用作本发明佐剂的油乳剂组合物包括角鲨烯-水乳剂，例如MF59{参考文献78的第10章；也可参见参考文献80}(利用微流化剂配置成亚微米颗粒的5％角鲨烯、0.5％吐温80和0.5％司盘85)。也可用完全弗氏佐剂(CFA)和不完全弗氏佐剂(IFA)。

C.皂苷制剂(参考文献78的第22章}

皂苷制剂也可用作本发明的佐剂。皂苷是在许多植物种类的树皮、叶、茎、根、甚至花中发现的固醇糖苷和三萜系糖苷的异质混合物(heterologous group)。皂树(Quillaia saponaria Molina)树皮中的皂苷是广泛研究的佐剂。皂苷也可购自丽花菝葜(Smilax ornata)(墨西哥菝葜(sarsaprilla))、锥花丝石竹(Gypsophillapaniculata)(婚纱花(brides veil))和肥皂草(Saponaria officianalis)(皂根(soap root))。皂苷佐剂制剂包括纯化的制剂，例如QS21，以及脂质制剂，例如ISCOM。QS21的商品名为StimulonTM。

也可利用HPLC和RP-HPLC纯化皂苷组合物。已经鉴定了用这些技术特别纯化的部分，包括QS7、QS17、QS18、QS21、QH-A、QH-B和QH-C。皂苷优选QS21。参考文献81公开了QS21的制备方法。皂苷制剂也可含有固醇，例如胆固醇{82}。

可联用皂苷和胆固醇来形成称为免疫刺激复合物(ISCOM)的独特颗粒{参考文献78的第23章}。ISCOM一般也含有磷脂，例如磷脂酰乙醇胺或磷脂酰胆碱。任何已知的皂苷可用在ISCOM中。ISCOM优选含有一种或多种QuilA、QHA和QHC。参考文献82-84进一步描述了ISCOM。ISCOM任选不含其它去污剂{85}。

皂苷佐剂开发的综述见参考86和87。

D.病毒体和病毒样颗粒

病毒体和病毒样颗粒(VLP)也可用作本发明的佐剂。这些结构通常含有一种或多种任选与磷脂联用或用磷脂配制的病毒蛋白质。它们通常是非病原性、非复制性，通常不含有任何天然病毒基因组。可重组产生或从完整病毒分离病毒蛋白。适用于病毒体或VLP中的病毒蛋白包括源自以下的蛋白质：流感病毒(例如HA或NA)、乙肝病毒(例如核心或衣壳蛋白)、戊肝病毒、麻疹病毒、辛德毕斯病毒、轮状病毒、口蹄疫病毒、逆转录病毒、诺瓦克病毒、人乳头瘤病毒、HIV、RNA-噬菌体、Qβ-噬菌体(例如外壳蛋白)、GA-噬菌体、fr-噬菌体、AP205噬菌体和Ty(例如逆转录转座子Ty蛋白p1)。参考文献88-93进一步讨论了VLP。例如，参考文献94进一步讨论了病毒体。

E.细菌或微生物衍生物

适用于本发明的佐剂包括细菌或微生物衍生物，例如肠细菌脂多糖(LPS)的无毒衍生物、脂质A衍生物、免疫刺激性寡核苷酸和ADP-核糖基化毒素和它们的解毒衍生物。

LPS的无毒衍生物包括单磷酰基脂质A(MPL)和3-O-脱酰基MPL(3dMPL)。3dMPL是具有4、5或6条酰化链的3脱-O-酰化单磷酰基脂质A的混合物。参考文献95公开了3脱-O-酰化单磷酰基脂质A的优选“小颗粒”形式。3dMPL的这种“小颗粒”足够小从而可经0.22μm膜无菌过滤{95}。其它无毒的LPS衍生物包括单磷酰基脂质A模拟物，例如氨基烷基氨基葡糖苷磷酸酯衍生物，如RC-529{96，97}。

脂质A衍生物包括大肠杆菌的脂质A的衍生物，例如OM-174。例如，OM-174描述于参考文献98和99。

适合用作本发明佐剂的免疫刺激性寡核苷酸包括含有CpG基序(含有通过磷酸键与鸟苷相连的未甲基化胞嘧啶的二核苷酸序列)的核苷酸序列。含有回文或聚(dG)序列的双链RNA和寡核苷酸也显示具有免疫刺激性。

CpG可含有核苷酸修饰/类似物，例如硫代磷酸酯修饰物并且可以是双链或单链的。参考文献100、101和102公开了可能的类似物取代，例如用2′-脱氧-7-脱氮鸟苷取代鸟苷。参考文献103-108进一步讨论了CpG寡核苷酸作为佐剂的作用。

CpG序列可涉及TLR9，例如基序GTCGTT或TTCGTT{109}。CpG序列，例如CpG-AODN特异地诱导Th1免疫应答，或者，例如CpG-B ODN更特异地诱导B细胞应答。参考文献110-112讨论了CpG-A和CpG-B ODN。CpG优选是CpG-AODN。

优选将CpG寡核苷酸构建为5’端易于为受体识别。两条CpG寡核苷酸序列任选在它们的3’端相连以形成“免疫聚物”(immunomer)。参见，例如参考文献109和113-115。

细菌ADP-核糖基化毒素及其解毒衍生物可用作本发明的佐剂。蛋白质优选源自大肠杆菌(大肠杆菌热不稳定肠毒素“LT”)霍乱(病毒)(“CT”)或百日咳(病毒)(“PT”)。参考文献116描述了解毒的ADP-核糖基化毒素作为粘膜佐剂的应用，参考文献117描述了其作为胃肠外佐剂的应用。毒素或类毒素优选为含有A和B亚基的全毒素形式。A亚基优选含有解毒性突变；B亚基优选未突变。佐剂优选是解毒的LT突变体，例如LT-K63、LT-R72和LT-G192。ADP-核糖基化毒素及其解毒衍生物，特别是LT-K63和LT-R72作为佐剂的应用见参考文献118-125。氨基酸取代的数字基准优选以参考文献126所述的ADP-核糖基化毒素的A和B亚基比对为基础，该文献专门全文纳入本文作为参考。

F.人免疫调节剂

适合用作本发明佐剂的人免疫调节剂包括细胞因子，例如白介素(如，IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12{127}等){128}、干扰素(如，干扰素-γ)、巨噬细胞集落刺激因子和肿瘤坏死因子。

G.生物粘合剂和粘膜粘合剂

生物粘合剂(bioadhesive)和粘膜粘合剂(mucoadhesive)也可用作本发明的佐剂。合适的生物粘合剂包括酯化的透明质酸微球{129}，或者粘膜粘合剂，例如聚(丙烯酸)的交联衍生物、聚乙烯醇、聚乙烯吡咯烷酮、多糖和羧甲基纤维素。壳多糖及其衍生物也可用作本发明的佐剂{130}。

H.微粒

微粒也可用作本发明的佐剂。可从生物可降解和无毒的材料(例如，聚(α-羟酸)、聚羟基丁酸、聚原酸酯、聚酐、聚己酸内酯等)，优选聚(丙交酯-共-乙交酯)形成微粒(即，直径约100nm到150μm，优选约200nm到约30μm，最优选约500nm到约10μm的颗粒)，任选将这些微粒处理成带负电的表面(例如，用SDS)或带正电的表面(例如，用阳离子洗涤剂，如CTAB)。

I.脂质体(参考文献78的第13和14章)

适合用作佐剂的脂质体制剂的例子描述于参考文献131-133。

J.聚氧乙烯醚或聚氧乙烯酯制剂

适用于本发明的佐剂包括聚氧乙烯醚和聚氧乙烯酯{134}。这种制剂还包括联用辛苯聚醇的聚氧乙烯山梨糖醇酯表面活性剂{135}以及联用至少一种其它非离子表面活性剂，例如辛苯聚醇的聚氧乙烯烷基醚或酯表面活性剂{136}。优选的聚氧乙烯醚选自：聚氧乙烯-9-月桂基醚(laureth 9)、聚氧乙烯-9-硬脂酰基(steoryl)醚、聚氧乙烯-8-硬脂酰基(steoryl)醚、聚氧乙烯-4-月桂基醚、聚氧乙烯-35-月桂基醚和聚氧乙烯-23-月桂基醚。

K.聚磷腈(PCPP)

PCPP制剂描述于，例如参考文献137和138中。

L.胞壁酰肽

适合用作本发明佐剂的胞壁酰肽的例子包括N-乙酰基-胞壁酰-L-苏氨酰基-D-异谷氨酰胺(thr-MDP)、N-乙酰基-去甲胞壁酰(normuramyl)-L-丙氨酰基-D-异谷氨酰胺(nor-MDP)和N-乙酰基胞壁酰-L-丙氨酰基-D-异谷氨酰胺-L-丙氨酸-2-(1′-2′-二棕榈酰基-sn-甘油基-3-羟基磷酰氧基)-乙胺(MTP-PE)。

M.咪唑并喹诺酮化合物

适合用作本发明佐剂的咪唑并喹诺酮化合物包括参考文献139和140中进一步描述的咪喹莫特(Imiquamod)及其同系物(例如，“瑞喹莫德3M”)。

本发明也包括联用一种或多种以上鉴定的佐剂的各方面。例如，以下佐剂组合物可用于本发明：(1)皂苷和水包油乳剂{141}；(2)皂苷(例如QS21)+无毒的LPS衍生物(例如3dMPL){142}；(3)皂苷(例如QS21)+无毒的LPS衍生物(例如3dMPL)+胆固醇；(4)皂苷(例如QS21)+3dMPL+IL-12(任选+固醇){143}；(5)联用3dMPL与例如QS21和/或水包油乳剂{144}；(6)含有10％角鲨烯、0.4％吐温80^TM、5％普朗尼克嵌段聚合物L121和thr-MDP的SAF，微流化为亚微米乳剂或搅拌(vortex)产生较大粒度的乳剂；(7)Ribi^TM佐剂系统(RAS)，(Ribi Immunochem)，其中含有2％角鲨烯、0.2％吐温80和一种或多种由单磷酸酰脂质A(monophosphorylipid A)(MPL)、海藻糖二分枝菌酸酯(TDM)和细胞壁骨架(CWS)，优选MPL+CWS(Detox^TM)组成的细菌细胞壁组分；和(8)一种或多种矿物盐(例如铝盐)+LPS的无毒衍生物(例如3dMPL)。

参考文献78的第7章公开了用作免疫刺激剂的其它物质。

其它抗原

除了含有本发明的多肽，本发明的组合物还含有一种或多种其它抗原。其它抗原包括，例如：

-来自幽门螺杆菌的抗原，如CagA{145-148}，VacA{149，150}，NAP{151，152，153}，HopX{例如，154}，HopY{例如，154}和/或脲酶。

-来自脑膜炎奈瑟球菌血清群B的蛋白质抗原，如参考文献155-161中的那些。

-来自脑膜炎奈瑟球菌血清群B的外膜小泡(OMV)制品，如参考文献162-165中所述的那些，等等。

-来自脑膜炎奈瑟球菌血清群C的糖抗原，如参考文献166中所述的来自血清群C的寡糖{也可参见参考文献167}。

-来自肺炎链球菌的糖抗原{例如，168，169，170}。

-来自甲肝病毒的抗原，如灭活的病毒{例如，171，172}。

-来自乙肝病毒的抗原，如表面和/或核心抗原{例如，172，173}。

-来自丙肝病毒的抗原{例如，174}。

-白喉抗原，如白喉类毒素{例如，参考文献175的第3章}，例如，CRM₁₉₇突变体{例如，176}。

-破伤风抗原，如破伤风类毒素{例如，参考文献175的第4章}。

-来自百日咳博德特菌的抗原，如百日咳全毒素(PT)和百日咳博得特菌的丝状血细胞凝集素(FHA)，也任选与百日咳杆菌粘附素和/或凝集原2和3联用{例如，参考文献177和178}

-细胞百日咳抗原。

-来自流感嗜血菌B的糖抗原{例如，167}。

-来自淋病奈瑟球菌的抗原{例如，155，156，157}。

-来自肺炎衣原体的抗原{例如，179，180，181，182，183，184，185}。

-来自砂眼衣原体的抗原{例如，186}。

-来自牙龈卟啉单胞菌(Porphyromonas gingivalis)的抗原{例如，187}。

-脊髓灰质炎抗原{例如，188，189}，如IPV或OPV。

-狂犬病抗原{例如，190}，如冻干灭活的病毒{例如，191，RabAvert^TM}。

-麻疹、流行性腮腺炎和/或风疹抗原{例如，参考文献175的第9、10和11章}。

-来自流感病毒的抗原{例如，参考文献175的第19章}，如血球凝集素和/或神经氨酸酶表面蛋白

-来自副粘病毒如呼吸道合胞病毒(RSV{192，193})和/或副流感病毒(PIV3{194})的抗原。

-粘膜炎莫拉菌的抗原{例如，195}。

-来自无乳链球菌(B组链球菌)的抗原{例如，196，197}。

-来自酿脓链球菌(A组链球菌)的抗原{例如，197，198，199}。

-来自金黄色葡萄球菌的抗原{例如，200}。

-来自炭疽芽孢杆菌(Bacillus anthracis)的抗原{例如，201，202，203}。

-来自黄病毒科(黄病毒属)病毒的抗原，如来自黄热病毒、日本脑炎病毒、登革病毒的四种血清型、蜱传脑炎病毒、西尼罗病毒的抗原。

-瘟病毒抗原，如来自经典猪发热病毒、牛病毒性腹泻病毒和/或边界病(borderdisease)病毒。

-细小病毒抗原，例如，来自细小病毒B19。

-朊病毒蛋白(例如，CJD朊病毒蛋白)

-淀粉样蛋白，如β肽{204}

-癌抗原，如参考文献205的表1或参考文献206的表3和4中列出的那些。

组合物可含有这些其它抗原中的一种或多种。优选抗原的组合应基于共享特征，例如，与呼吸道疾病有关的抗原、与肠病有关的抗原、与性传播疾病有关的抗原，等等。

当使用糖类或碳水化合物抗原时，优选与载体蛋白偶联以增强免疫原性{例如，参考文献207-216}。优选的载体蛋白是细菌毒素或类毒素，如白喉或破伤风类毒素。特别优选CRM₁₉₇白喉类毒素{217}。其它载体多肽包括脑膜炎奈瑟球菌外膜蛋白{218}、合成肽{219，220}、热激蛋白{221，222}、百日咳蛋白{223，224}、流感嗜血菌的D蛋白{225}、细胞因子{226}、淋巴因子{226}、激素{226}、生长因子{226}、艰难梭菌(C.difficile)的毒素A或B{227}、铁摄取蛋白(iron-uptake protein){228}等。不同糖类可偶联相同或不同类型的载体蛋白。可采用任何合适的偶联反应和任何需要的合适接头。

将蛋白质抗原用于本发明组合物的另一种方法可使用编码抗原的核酸{例如，参考文献229-237}。因此可用编码蛋白质的核酸(优选DNA，例如质粒形式的DNA)代替本发明组合物中的蛋白质组分。

方法

本发明也提供制备本发明多肽的方法，包括在诱导多肽表达的条件下培养用本发明核酸转化的宿主细胞的步骤。

本发明提供制备本发明多肽的方法，包括通过化学手段合成至少一部分多肽的步骤。

本发明提供制备本发明核酸的方法，包括用基于引物的扩增方法(例如，PCR)扩增核酸的步骤。

本发明提供制备本发明核酸的方法，包括通过化学手段合成至少一部分核酸的步骤。

概述

术语“含有”包括“包含”以及“由……构成”，例如“含有”X的组合物可仅由X构成或可包含其它的物质，例如X+Y。

与数值x相关的术语“约”表示，例如x±10％。

“基本上”不排除“完全”，例如“基本上无”Y的组合物可完全无Y。“基本上”可视需要从本发明定义中省去。

提及两条氨基酸序列之间的序列相同性百分比时是指，当比对时，在比较的两个序列中相同氨基酸的百分比。可用本领域已知的软件程序，例如参考文献238的7.7.18节所描述的那些来测定这种比对和同源性百分比或序列相同性。优选的比对可用仿射(affine)空位检索通过Smith-Waterman同源性检索算法测定，空位开放罚分为12，空位延伸罚分为2，BLOSUM矩阵为62。Smith-Waterman同源性检索算法描述于参考文献239。

在某些实施方案中，本发明不包括以下多肽：(a)寡聚结构域是来自脑膜炎奈瑟球菌的NadA粘附素或其片段；和(b)抗原结构域是SARS冠状病毒S1蛋白或其片段。类似地，在某些实施方案中，本发明不包括编码这种多肽的核酸。这些多肽和核酸描述于参考文献240，因此不包含在本发明的某些实施方案中。

本发明的实施方式

细菌粘附素的鉴定

已在几种细菌中鉴定了参与粘附的毒力相关抗原{71}，这些抗原的茎结构域可与本发明的异源抗原序列一起使用。

抗原被鉴定为：流感嗜血菌埃及生物群(‘HadA’，SEQ ID NO：29)；大肠杆菌K1(SEQ ID NO：42和43)和EHEC菌株EDL933；伴放线放线杆菌(Actinobacillusactinomycetemcomitans)(SEQ ID NO：44)；睡眠嗜血菌(Haemophilus somnus)(SEQ IDNO：45)；杜氏嗜血菌(Haemophilus ducreyi)(SEQ ID NO：46)；EPEC大肠杆菌菌株E2348/69(SEQ ID NO：47和48)；EAEC大肠杆菌菌株042(SEQ ID NO：49和50)；尿道病原性(uropathogenic)大肠杆菌(SEQ ID NO：51)；弗氏志贺菌(Shigella flexneri)(SEQ ID NO：52)；马尔他布鲁菌(Brucella melitensis)(SEQ ID NO：53)；猪布鲁菌(Brucella，suis)(SEQ ID NO：54)；茄科雷尔氏菌(Ralstonia solanacearum)(SEQ ID NO：55)；苜蓿中华根瘤菌(Sinorhizobium meliloti)(SEQ ID NO：56)；大豆满生根瘤菌(Bradorhizobium japonicum)(SEQ ID NO：57)；和伯克霍尔德菌(Burkholderiafungorum)(SEQ ID NO：58)。

SEQ ID NO：29和42-58中这些特征的位置如下：

SEQ ID	生物	长度	前导序列	头	卷曲螺旋	锚
SEQ ID	生物	长度	前导序列	头	卷曲螺旋	锚	29	流感嗜血菌埃及生物群	256	1-26	27-55	56-184	185-256
42	EHEC	338	1-23	24-207	208-266	267-338	29	流感嗜血菌埃及生物群	256	1-26	27-55	56-184	185-256
42		338	1-23	24-207	208-266	267-338	43	1588	1-53	54-1515^*		1516-1588
44		伴放线放线杆菌	295	1-25	26-150	151-222	43	1588	1-53	54-1515^*		1516-1588	223-295
44	45	伴放线放线杆菌	295	1-25	26-150	151-222	睡眠嗜血菌	452	1-26	27-158	159-378	379-452	223-295
46	45	杜氏嗜血菌	273	1-21	22-198^*		睡眠嗜血菌	452	1-26	27-158	159-378	379-452	199-273
46	47	杜氏嗜血菌	273	1-21	22-198^*		EPEC	338	1-24	25-209	210-266	267-338	199-273
48	47	577	1-504^*			505-577		338	1-24	25-209	210-266	267-338
48	49	577	1-504^*			505-577		EAEC	717	1-23	24-109	110-645	646-717
50	49	1743	1-53	54-1670^*		1671-1743			717	1-23	24-109	110-645	646-717
50	51	1743	1-53	54-1670^*		1671-1743	UPEC		1778	1-53	54-1705^*		1706-1778
52	51	弗氏志贺氏菌	990	1-917^*			UPEC	918-990	1778	1-53	54-1705^*		1706-1778
52	53	弗氏志贺氏菌	990	1-917^*			马尔他布鲁菌	918-990	227	1-27	28-122	123-154	155-227
54	53	猪布鲁菌	311	1-27	28-206	207-238	马尔他布鲁菌	239-311	227	1-27	28-122	123-154	155-227
54	55	猪布鲁菌	311	1-27	28-206	207-238	茄科雷尔氏菌	239-311	1309	1-230^*		231-708	1239-1309
56	55	苜蓿中华根瘤菌	1291	1-1219^*			茄科雷尔氏菌	1220-1291	1309	1-230^*		231-708	1239-1309
56	57	苜蓿中华根瘤菌	1291	1-1219^*			大豆满生根瘤菌	1220-1291	372	1-72	73-300^*		301-372
58	57	伯克霍尔德菌	3399	1-57	58-3328^*		大豆满生根瘤菌	3329-3399	372	1-72	73-300^*		301-372

*这些粘附素中一些的结构域之间的边界不是明显

SARS冠状病毒刺突蛋白

已经报道了SARS冠状病毒的E2刺突蛋白。该蛋白的氨基酸序列在文中示于SEQID NO：1。下面给出了其二级结构预测，其中C表示卷曲，H表示螺旋，E表示延伸序列：

10 20 30 40 50 60 70

| | | | | | |

MFIFLLFLTLTSGSDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYLTQDLFLPFYSNVTGFH

CeEEEEEEccCCCccceeeeCCCCCCCCCCCCCceEEEEEeCCcEEEEEEEEceEEEEEEeceEEcCeEe

TINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTNNNKSQSVIIINNSTNVVIRACNFELCDNPFFAV

ceeeeCCCceeeEeCCccecCCCCCCceEEEEEEEEccCCCcEEEEEeCCCEEEEEEEEEeccCCCCCCC

SKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLP

CCCCCCeEEEEEEEcCCCCcEEEEEeeeEEEcCCCCCChhHHheEEEEeCCCEEEEEEcCCCCCCcCCCC

SGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTTFMLKYDENGTITDAVDCSQ

CCCccccccceEEEeeeeceeeeEEEeccCcCCCcCCccchHHhhhccceEEEEEcCCCCEEEEeccCCC

NPLAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVA

CCCceEEeCceEeeeCCcEEEeCCeEEEeCCEEEEEeCCCCCCCccceecCCCCCCccHHHhHHHhhcch

DYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCV

hHHHHHHhhceEEeeeeceeececcccceeeEeEeeEEEcCCCeeecccCCCceEeecccceCCccceEE

LAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIG

EEEeCCCCCCcCCCCCCCCceccccCccCCccCCCCCCCCCCCCCCCCCCCCCCCCCCCCCceeccCCcc

YQpYRVVVLSFELLNAPATVCGPKLSTDLIKNQCVNFNFNGLTGTGVLTPSSKRFQPFQQFGRDVSDFTD

eeEEEEEEEEEeCCCCCcccCCCCcCCceEEeeeeEEEEeeccceeeeHHHHHHHhhHHHhheccCCCcc

SVRDPKTSEILDISPCSFGGVSVITPGTNASSEVAVLYQDVNCTDVSTAIHADQLTPAWRIYSTGNNVFQ

cccccCCCcEEEEEEccCceEEEEEeCCCCCCCceEEeeecceEEEeCCCCcccCCCCccccCCCCcHHH

TQAGCLIGAEHVDTSYECDIPIGAGICASYHTVSLLRSTSQKSIVAYTMSLGADSSIAYSNNTIAIPTNF

hhccceeeccCCCCCCCCCccCCCcceeEEeecceeeeeecCeEEEEEecCCCCCcccCCCCeEEeeCcc

SISITTEVMPVSMAKTSVDCNMYICGDSTECANLLLQYGSFCTQLNRALSGIAAEQDRNTREVFAQVKQM

EcccceEEEEEeCCceeecccccccCChHHHHHHHHHHhHHHHHHHHHHHHHHHHhhchHHHHHHHHHhC

YKTPTLKYFGGFNFSQILPDPLKPTKRSFIEDLLFNKVTIADAGFMKQYGECLGDINARDLICAQKFNGL

CeeeEEecCCceecccCCCCCCCcCChHHHHHHHhccceeeeccceccccccCCCcccccEEEEEEcCCc

TVLPPLLTDDMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFN

EeccCCCCcHHHHHHHHHHHhhhcCCCchhHhhHHHhccceeEeEhhhcCCcchhhHHHHHHHHHHHHHH

KAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLIT

HHHHHHHHhhHhHHHHHHHHHHHHHHHHHHHHHHHHHHHhcchHHHHHHHHHHHHHHHHHHHHHHHHHHH

GRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYV

HHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHhcccceccccchhHhheeeccCCCcEEEEEEEEE

PSQERNFTTAPAICHEGKAYFPREGVFVFNGTSWFITQRNFFSPQIITTDNTFVSGNCDVVIGIINNTVY

ECceeeeeccCCeeeeeeeecccCcEEEecCCEEEEcCCCccCCCcccCCCEEEEEEEEEEEeCCceecC

DPLQPELDSFKEELDKYFKNHTSPDVDFGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQ

cCCCCCCcHHHHHHHHHHHhCCCCCCCCCcCcceeEeeeccHHHHHHHHHHHHHHhcchhhHHhCCcEEE

YIKWPWYVWLGFIAGLIAIVMVTILLCCMTSCCSCLKGACSCGSCCKFDEDDSEPVLKGVKLHYT

EecchHHHHHHHHHHHHhheeEEEEEEEeCCCCcceecCCCCCCCcccCCCCCCeEEcccEEEcC

HIV包膜蛋白

HIV包膜糖蛋白从HIV基因组表达为gp160，翻译后切割得到保持关联的gp120和gp41。gp120蛋白是包膜的胞外结构域，gp41蛋白是包膜的跨膜蛋白。关联的蛋白质在病毒颗粒表面形成三聚体，但重组表达的gp120是单体。为提高包膜蛋白的免疫原性，利用NadA寡聚化结构在大肠杆菌中表达为非糖基化的三聚体。

接近但不包括其跨膜序列的包膜蛋白序列(任选删除30aa的V2超变区，该超变区是SEQ ID NO：12的aa 133-162，用Gly-Ala-Gly替代得到gp140ΔV2{241})用作通过NadA或gp160(即gp41)的茎连接，与脑膜炎奈瑟球菌NadA蛋白的锚区域组合的抗原性结构域。构建了具有NadA前导肽(SEQ ID NO：11)的7种不同形式的此这种杂合序列。7个序列示于SEQ ID NO 3-9，更详细地描述于下表：

SEQ IDNO：	长度(aa)	多肽的描述(SEQ ID NO的构成，从N-末端到C-末端
SEQ IDNO：	长度(aa)	多肽的描述(SEQ ID NO的构成，从N-末端到C-末端	3	824	11-12-14-13-15
4	769	11-12-14-13	3	824	11-12-14-13-15
4	769	11-12-14-13	5	797	11-16-14-13-15
6	742	11-16-14-13	5	797	11-16-14-13-15
6	742	11-16-14-13	7	705	11-16-17-18-15
8	724	11-16-17-18-19	7	705	11-16-17-18-15
8	724	11-16-17-18-19	9	758	11-16-17-18-20

因此，SEQ ID NO 3-9都包含衍生自NadA的前导肽(SEQ ID NO：11)、抗原性包膜结构域(SEQ ID NO：12或16)和卷曲螺旋区(来自HIV包膜(SEQ ID NO：17)或来自NadA(SEQ ID NO：13)、以及病毒和细菌序列之间的二肽接头(SEQ ID NO：14或18)。SEQ ID NO 3、5、7、8和9还包含衍生自NadA的跨膜锚序列(SEQ ID NO 15、19和20)。

还构建了648aa的第8个序列(SEQ ID NO：10，从N-末端到C-末端由SEQ ID NO11-16-17构成，即与SEQ ID NO 7-9相同，但无来自NadA的C-末端锚蛋白)。这些构建物示于图3-5。

在进一步的实验中，通过(a)用gp120亚单位取代NadA的头(‘gp120-NadA’)，或者(b)用完整的gp140取代NadA的头和茎(‘gp140-NadA’)构建了多肽。这些构建物示于图6(SEQ ID NO：32-35)：

SEQ ID NO：	长度	多肽的描述
SEQ ID NO：	长度	多肽的描述	32	824	aa1-29：NadA的前导序列(SEQ ID NO：11)aa30-504：gp120(SEQ ID NO：36)aa505-506：Gly-Ser二肽(SEQ ID NO：14)aa507-824：NadA茎和锚(SEQ ID NO：13+SEQ ID NO：15)

33	837	aa1-29：NadA的前导序列(SEQ ID NO：11)aa30-504：gp120(SEQ ID NO：36)aa505-506：Gly-Ser二肽(SEQ ID NO：14)aa507-734和748-837：NadA茎和锚(SEQ ID NO：13+15)aa735-747：凝血酶剪切序列(SEQ ID NO：37)
33	837		34	741	aa1-29：NadA的前导序列(SEQ ID NO：11)aa30-665：gp140(mut3-5)(SEQ ID NO：39)aa666-667：Lys-Leu二肽(SEQ ID NO：18)aa668-741：NadA锚(SEQ ID NO：19)
35	768	aa1-29：NadA的前导序列(SEQ ID NO：11)aa30-665：gp140(mut3-5)(SEQ ID NO：39)aa666-678：凝血酶剪切序列(SEQ ID NO：37)aa679-768：NadA锚(SEQ ID NO：40)	34	741

用pET系统在大肠杆菌BL21(DE3)中表达gp120-NadA和gp140-NadA多肽。通过SDS-PAGE和western印迹分析对总细胞裂解物和外膜小泡进行大肠杆菌表达和定位分析。如图7所示，采用抗-NadA抗体得到的总细胞裂解物的western印迹显示，蛋白质以单体和寡聚形式表达。此外，还在外膜小泡的SDS-PAGE中观察到了蛋白质，显示蛋白质被有效运送到大肠杆菌表面(图8)。还在培养物上清液中观察到gp140-NadA蛋白。

为证实蛋白质暴露于细胞表面，在全细胞细菌上通过FACS分析大肠杆菌。抗NadA的抗体(多克隆)和抗gp120的C4保守表位的抗体(单克隆)用于gp120-NadA蛋白，如图9所示，证实了表面表达。抗NadA的抗体(多克隆)和抗gp41表位的抗体(单克隆2F5)用于gp140-NadA蛋白，证实了表面表达(图10)。

为研究折叠，测量了蛋白质的CD4亲合力。将大肠杆菌与可溶性CD4在37℃培育1小时，利用单克隆抗-CD4抗体通过FACS检测结合。图13和14显示了能结合CD4的gp140-NadA大肠杆菌的百分比。如图11所示，表达任何一种蛋白质的大肠杆菌能结合CD4。如图12所示还观察到了gp140-NadA的剂量依赖性结合。此外，将CD4与糖基化的gp140预培育能够抑制结合(图15)。

采用HPLC的受体结合试验和荧光标记的CD4(CD4-FITC)证实CD4和GP140-NadA之间有相互作用。阳性对照试验(图16)显示，单独的CD4-FITC的保留时间为8.3分钟，在有纯化的糖基化HIVgp120存在时保留时间降至7.0分钟。如图17所示，将CD4与gp140-NadA的培养物上清液一起培育(图8，右手栏)导致CD4的保留时间降至5.2分钟，说明在gp140-NadA和CD4之间形成了复合物。

为证实Env结构域保留了免疫原性特性，利用富含重组Env-NadA蛋白的外膜制品采用初次免疫-加强免疫方案免疫动物。在第0、21、35和49天用来自大肠杆菌/gp120-NadA、大肠杆菌/gp140-NadA和大肠杆菌/pET(阴性对照)的外膜小泡制品以氢氧化铝为佐剂初次免疫每组2或3只家兔。糖基化的gp140(从人细胞纯化)用作与MF59佐剂组合的阳性对照。

在第49天用完全糖基化的Env胞外域(gp140ΔV2)对用gp120-NadA免疫的组加强免疫以选出能结合天然病毒刺突的抗体。在第35天(后二(post-two))、第49天(后三(post-three))和第64天(放血(bleed out))通过ELISA和中和试验分析血清。

结果显示，用OMVgp120-NadA免疫诱导的抗体在ELISA中能识别糖基化的gp140ΔV2(图18)。检测这些血清中和HIV-1分离物的能力。血清稀释物使相对发光单位相比病毒对照细胞降低50％时的滴度如下：

抗原		血清，后三(第49天)	血清，放血(第64天)
抗原		血清，后三(第49天)	血清，放血(第64天)		#7	-	1:34
OMV/gp120-NadA	#8	1:80	1:950		#7	-	1:34
OMV/gp120-NadA	#8	1:80	1:950		#9		1:185
					#9		1:185
				Gp140ΔV2	#17	1:2154	nd
	#18	1:3590	nd	Gp140ΔV2	#17	1:2154	nd

抗gp120-NadA OMV的血清在大量稀释时能够中和同源HIV-1分离物SF162。相反，用OMVgp140-NadA免疫产生较低抗体滴度，这些抗体不能中和抗同源菌株的抗体。

因此，使用来自NadA的寡聚化结构域和跨膜结构域能在大肠杆菌中于细胞表面表达非糖基化的CD4-结合寡聚形式的HIV包膜蛋白。

应理解，仅通过举例方式描述了本发明，可对其作出修饰而仍在本发明的范围和精神之内。

参考文献(其内容全文纳入本文作为参考)

{1}EP-A-0139417。

{2}美国专利申请2003/0053984。

{3}Terskikh等，(1997)PNAS USA94：1663-1668。

{4}Comanducci等，(2002)J Exp Med 195：1445-1454。

{5}Campbell&Downing(1994)Trends Biotechnol 12：168-172。

{6}Baron等，(1991)Trends Biochem Sci 16：13-17。

{7}Burkhard等，(2001)Trends Cell Biol 11：82-88。

{8}《蛋白质》(Proteins)第5.5.2章，Creighton(ISBN 0-7167-2317-4)。

{9}Yu(2002)Adv Dmg Deliv Rev 54：1113-1129。

{10}Muller等，(2000)Methods Enzymol 328：261-282。

{11}Beck&Brodsky(1998)J Stmct Biol 122：17-29。

{12}Lupas(1996)Trends Biochem Sci 21：375-382。

{13}Adamson等，(1993)Curr Opin Biotechnol 4：428-347。

{14}Kammerer(1997)Matrix Biol 15：555-568。

{15}Chao等，(1998)J Chromatog B Biomed SdAppi 715：307-329。

{16}Amdt等，(2002)Stmcture 10：1235-1248。

{17}Liu&Lu(2002)J Biol Chem 277：48708-48713。

{18}WO03/010194

{19}美国专利6,310,190。

{20}《蛋白质》第5.5.3章，Creighton(ISBN 0-7167-2317-4)。

{21}Zhang&Chen(1999)J Biol Chem 274：22409-22413。

{22}Sanders等，(2002)J Virol 76：8875-8889。

{23}Lamb等，(1999)MoI Membr Biol 16：11-19。

{24}Zhu等，(2002)Biochem Biophys Res Commun 299：897-902。

{25}Matthews等，(2000)J Virol 74：5911-5920。

{26}Lawless等，(2000)Biochemistry 39：11684-95。

{27}Zhao等，(2000)PNAS USA 97：14172-7。

{28}Malashkevich等，(1999)PNAS USA 96：2662-7。

{29}Weis等，(1988)Nature 333：426-431。

{30}Yu等，(1994)Science 266：274-6。

{31}Bosch等，(2003)J Virol 77：8801-8811。

{32}Langevin等，(2002)J Biol Chem 277：37655-37662。

{33}Gaudin等，(1992)Virology 187：627-32。

{34}Desmezieres等，(2003)Virus Res 91：181-7。

{35}Gibbons等，(2000)J Virol 74：7772-7780。

{36}Heinz等，(1994)Arch Virol 9：339-348。

{37}Wengler等，(1987)Virology 160：210-219。

{38}Zhang等，(2003)EMBO J 22：2604-13。

{39}Stiasny等，(2002)J Virol 76：3784-90。

{40}Alfadhli等，(2001)J Virol 75：2019-23

{41}Dutch等，(2000)Biosci Rep 20：597-612。

{42}WO02/22167。

{43}WO02/34771。

{44}WO02/094868。

{45}英国专利申请0410866.8。

{46}WO00/78968。

{47}WO99/58562。

{48}WO99/58682。

{49}WO99/55871。

{50}WO99/57277。

{51}WO99/58684。

{52}WO99/64602。

{53}WO00/09694。

{54}WO99/63093。

{55}WO99/58685&美国专利6706494。

{56JWO99/64448。

{57}WO00/15802&美国专利6600013。

{58}WO00/52042。

{59}Suwa等，(2002)Genome Informatics 13：511-512。

{60}http://sevens.cbrcjp/

{61}Hofmann&Stoffel(1993)Biol.Chem.Hoppe-Seyler 374：166。

{62}http://wmv.ch.embnet.org/software/tmbase/TMBASE_doc.html

{63}http://biophysics.biol.uoa.gr/DB-NTMR/

{64}lkeda等，(2003)Nucleic Acids Res.31：406-409。

{65}http://bioinfb.si.hirosaki-u.ac.jp/～TMPDB/

{66}Bertaccini&Trudell(2002)Protein Eng 15：443-54。

{67}Ikeda等，(2002)In Silico Biol 2：19-33。

{68}Shimaoka等，(2000)Nature Struct Biol 7：674-678。

{69}Cornelis等，(1998)Microbiol MoI Biol Rev 62：1315-1352。

{70}Chen等，(1999)Infect lmmun 67：1310-1316。

{71}国际专利申请PCT/IB2004/__，2004-6-25提交，要求英国专利申请0315022.4的优先权。

{72}Beninati等，(2000)Nature Biotechnology 18：1060-1064。

{73}WO99/27961。

{74JWO02/074244。

{75}WO02/064162。

{76}WO03/028760。

{77}Gennaro(2000)《雷明顿药物科学与实践》(Remington：The Science andPractice of Pharmacy).第20版，ISBN：0683306472。

{78}《疫苗设计》(Vaccine Design)(1995)Powell&Newman编.ISBN：030644867X.Plenum。

{79}WO00/23105。

{80}WO90/14837。

{81}美国专利5,057,540。

{82}WO96/33739。

{83}EP-A-0109942。

{84JWO96/11711。

{85}WO00/07621。

{86}Barr等，(1998)Advanced Drug Delivery Reviews 32：247-271。

{87}Sjolanderet等，(1998)Advanced Drug Delivery Reviews 32：321-338。

{88}Niikura等，(2002)Virology 293：273-280。

{89}Lenz等，(2001)J Immunol 166：5346-5355。

{90}Pinto等，(2003)J Infect Dis 188：327-338。

{91}Gerber等，(2001)Virol 75：4752-4760。

{92}WO03/024480

{93}WO03/024481

{94}Gluck等，(2002)Vaccine 20：B10-B16。

{95}EP-A-0689454。

{96}Johnson等，(1999)Bioorg Med Chem Lett 9：2273-2278。

{97}Evans等，(2003)Expert Rev Vaccines 2：219-229。

{98}Meraldi等，(2003)Vaccine 21：2485-2491。

{99}Pajak等，(2003)Vaccine 21：836-842。

{100}Kandimalla等，(2003)Nucleic Acids Research 31：2393-2400。

{101}WO02/26757。

{102}WO99/62923。

{103}Krieg(2003)Nature Medicine 9：831-835。

{104}McCluskie等，(2002)FEMS Immunology and Medical Microbiology 32：179-185。

{105}WO98/40100。

{106}美国专利6,207,646。

{107}美国专利6,239,116。

{108}美国专利6,429,199。

{109}Kandimalla等，(2003)Biochemical Society Transactions 31(第3部分)：654-658。

{110} B1ackwell等，(2003)J Immunol 170：4061-4068。

{111}Krieg(2002)Trends Immunol 23：64-65。

{112}WO01/95935。

{113}Kandimalla等，(2003)SSRC 306：948-953。

{114}Bhagat等，(2003)SSRC 300：853-861。

{115}WO03/035836。

{116}WO95/17211。

{117}WO98/42375。

{118}Beignon等，(2002)Infect lmmun 70：3012-3019。

{119}Pizza等，(2001)Vaccine 19：2534-2541。

{120}Pizza等，(2000)IntJ Med Microbiol 290：455-461。

{121}Scharton-Kersten等，(2000)Infect lmmun 68：5306-5313。

{122}Ryan等，(1999)Infect lmmun 67：6270-6280。

{123}Partidos等，(1999)Immunol Lett 67：209-216。

{124}Peppoloni等，(2003)Expert Rev Vaccines 2：285-293。

{125}Pine等，(2002)J Control Release 85：263-270。

{126}Domenighini等，(1995)MoI Microbiol 15：1165-1167。

{127}WO99/40936。

{128}WO99/44636。

{129}Singh等，(2001)J Cont Release 70：267-276。

{130}WO99/27960。

{131}美国专利6,090,406

{132}美国专利5,916,588

{133}EP-A-0626169。

{134}WO99/52549。

{135}WO01/21207。

{136}WO01/21152。

{137}Andrianov等，(1998)Biomaterials 19：109-115。

{138}Payne等，(1998)Adv Drug Delivery Review 31：185-196。

{139}Stanley(2002)Clin Exp Dermatol 27：571-577。

{140}Jones(2003)Curr Opin Investig Drugs 4：214-218。

{141}WO99/11241。

{142}WO94/00153。

{143}WO98/57659。

{144}欧洲专利申请0835318、0735898和0761231。

{145}Covacci&Rappuoli(2000)J.Exp.Med.19：587-592。

{146}WO93/18150。

{147}Covacci等，(1993)Proc.Natl.Acad.Sci.USA 90：5791-5795。

{148}Tummuru等，(1994)Infect.Immun.61：1799-1809。

{149}Marchetti等，(1998)Vaccine 16：33-37。

{150}Telfbrd等，(1994)J.Exp.Med.179：1653-1658。

{151}Evans等，(1995)Gene 153：123-127。

{152}WO96/01272&WO96/01273，尤其是SEQ ID NO：6。

{153}WO97/25429。

{154}WO98/04702。

{155}WO99/24578。

{156}WO99/36544。

{157}WO99/57280。

{158}WO00/22430。

{159}Tettelin等，(2000)Science 287：1809-1815。

{160}WO96/29412。

{161}Pizza等，(2000)Science 287：1816-1820。

{162}WO01/52885。

{163}Bjune等，(1991)Lancet 338(8775)：1093-1096。

{164}Fukasawa等，(1999)Vaccine 17：2951-2958。

{165}Rosenqvist等，(1998)Dei/.Biol.Stand.92：323-333。

{166}Costantino等，(1992)Vaccine 10：691-698。

{167}Costantino等，(1999)Vaccine 17：1251-1263。

{168}Watson (2000)Pediatr Infect Dis J 19：331-332。

{169}Rubin(2000)Pediatr Clin North Am 47：269-285，v。

{170}Jedrzejas(2001)Microbiol MoI Biol Rev 65：187-207。

{171}Bell(2000)Pediatr Infect Dis J 19：1187-1188。

{172}Iwarson(1995) APMIS 103：321-326。

{173}Gerlich等，(1990)Vaccine 8增刊：S63-68&79-80。

{174}Hsu等，(1999)C1in Liver Dis 3：901-915。

{175}《疫苗》(Vaccines)(1988)Plotkin&Mortimer编，ISBN 0-7216-1946-0。

{176}Del Guidice等，(1998)MolecularAspects ofMedicine 19：1-70。

{177}Gustafsson等，(1996)N.Engl.J.Med.334：349-355。

{178}Rappuoli等，(1991)TIBTECH 9：232-238。

{179}WO02/02606。

{180}Kalman等，(1999)Nature Genetics 21：385-389。

{181}Read等，(2000)NucleicAcids Res 28：1397-406。

{1 82}Shirai等，(2000)J.Infect.Dis.181(增刊3)：S524-S527。

{183}WO99/27105。

{184}WO00/27994。

{185}WO00/37494。

{186}WO99/28475。

{187}Ross等，(2001)Vaccine 19：41354142。

{188}Sutter等，(2000)Pediatr CHn North Am 47：287-308。

{189}Zimmerman&Spann(1999)Am Fam Physician 59：113-118，125-126。

{190}Dreesen(1997)Vaccine 15增刊：S2-6。

{191}MMWR Morb Mortal Wkly Rep 1998-1-16；47(1)：12，19。

{192}Anderson(2000)Vaccine 19增刊1：S59-65。

{193}Kahn(2000)Curr Opin Pediatr 12：257-262。

{194}Crowe(1995)Vaccine 13：415-421。

{195}McMichael(2000)Vaccine 19增刊1：S101-107。

{196}Schuchat(1999)Lancet 353(9146)：51-6。

{197}WO02/34771。

{198}Dale(1999)Infect Dis CHn North Am 13：22743，Viii。

{199}Ferretti等，(2001)PNAS USA98：4658-4663。

{200}Kuroda等，(2001)Lancet 357(9264)：1225-1240；也可参见pag

{201}J Toxicol Clin Toxicol(2001)39：85-100。

{202}Demicheli等，(1998)Vaccine 16：880-884。

{203}Stepanov等，(1996)J Biotechnol 44：155-160。

{204}Ingram(2001)Trends Neurosci 24：305-307。

{205}Rosenberg(2001)Nature 411：380-384。

{206}Moingeon(2001)Vaccine 19：1305-1326。

{207}Ramsay等，(2001)Lancet 357(9251)：195-196。

{208}Lindberg(1999)Vaccine 17增刊2：S28-36。

{209}Buttery&Moxon(2000)J R Coll Physicians Lond 34：163-168。

{210}Ahmad&Chapnick(1999)Infect Dis CHn North Am 13：113-133，vii。

{211}Goldblatt(1998)J.Med.Microbio1.47：563-567。

{212}欧洲专利0477508。

{213}美国专利5,306,492。

{214}国际专利申请WO98/42721。

{215}《偶联疫苗》(Conjugate Vaccines)(Cruse等编)ISBN 3805549326，尤其是第10卷，10：48-114。

{216}Hermanson(1996)《生物偶联技术》(Bioconjugate Techniques)ISBN：0123423368或012342335X。

{217}Research Disclosure，453077(2002-1)

{218}EP-A-0372501

{219}EP-A-0378881

{220}EP-A-0427347

{221}WO93/17712

{222}WO94/03208

{223}WO98/58668

{224}EP-A-0471177

{225}WO00/56360

{226}WO91/01146

{227}WO00/61761

{228}WO01/72337

{229}Robinson&Torres(1997)Seminars in Immunology 9：271-283。

{230}Donnelly等，(1997)Annu Rev Immunol 15：617-648。

{231}Scott-Taylor&Dalgleish(2000)Expert Opin Investig Drugs 9：471-480。

{232}Apostolopoulos&Plebanski(2000)Curr Opin MoI Ther 2：441-447。

{233}Man(1999)Curr Opin Mol Ther 1：116-120。

{234}Dubensky等，(2000)MoI Med 6：723-732。

{235}Robinson&Pertmer(2000)Adv Virus Res 55：1-74。

{236}Donnelly等，(2000)Am J Respir Crit Care Med 162(4Pt2)：S190-193。

{237}Davis(1999)Mt SinaiJ.Med.66：84-90。

{238}《分子生物学最新进展》(Current Protocols in Molecular Biology)(F.M.Ausubel等编，1987)增刊30。

{239}Smith&Waterman(1981)Adv.Appl.Math.2：482-489。

{240}国际专利申请PCT/US2004/011710。

{241}Srivastava等，(2003)J Virol 77：11244-11259。

序列表

SEQ ID NO：1-

MFIFLLFLTLTSGSDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYITQDLFLPFYSNVTGFHTINHTFGNPVIPFKDGI

YFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSE

KSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLPSGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTT

FMLKYDENGTITDAVDCSQNPLAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNC

VADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGN

YNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTDLIKN

QCVNFNFNGLTGTGVLTPSSKRFQPFQQFGRDVSDFTDSVRDPKTSEILDISPCSFGGVSVITPGTNASSEVAVLYQDVNCTDVSTA

IHADQLTPAWRIYSTGNNVFQTQAGCLIGAEHVDTSYECDIPIGAGICASYHTVSLLRSTSQKSIVAYTMSLGADSSIAYSNNTIAI

PTNFSISITTEVMPVSMAKTSVDCNMYICGDSTECANLLLQYGSFCTQLNRALSGIAAEQDRNTREVFAQVKQMYKTPTLKYFGGFN

FSQILPDPLKPTKRSFIEDILFNKVTLADAGFMKQYGECLGDINARDLICAQKFNGLTVLPPLLTDDMIAAYTAALVSGTATAGWTF

GAGAALQIPFAMPMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISS

VLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVIGQSKRVDFCGKGYHLMSFPQAAPHGVVF

LHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVFNGTSWFITQRNFFSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFK

EELDKYFKNHTSPDVDFGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYVWLGFIAGLIAIVMVTILLCC

MTSCCSCLKGACSCGSCCKFDEDDSEPVLKGVKLHYT

SEQ ID NO：2-

SDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYLTQDLFLPFYSNVTGFHTINHTFGNPVIPFKDGIYFAATEKSNVVRG

WVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREEVF

KNKDGFLYVYKGYQPIDVVRDLPSGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTTFMLKYDENGTITD

AVDCSQNPIAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFF

STFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKL

RPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTDLIKNQCVNFNFNGLTGT

GVLTPSSKRFQPFQQFGRDVSDFTDSVRDPKTSEILDISPCSFGGVSVITPGTNASSEVAVLYQDVNCTDVSTAIHADQLTPAWRIY

STGNNVFQTQAGCLIGAEHVDTSYECDIPIGAGICASYHT

SEQ ID NO：3-

MKHFPSKVLTTAILATFCSGALAASNDDDSAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVL

ENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVTTSIRNKMQKEYA

LFYKLDVVPIDNDNTSYKLINCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGSGPCTNVSTVQCTHGIRPVVSTQLLL

NGSLAEEGVVIRSENFTDNAKTIIVQLKESVEINCTRPNNNTRKSITIGPGRAFYATGDIIGDIRQAHCNISGEKWNNTLKQIVTKL

QAQFGNKTIVFKQSSGGDPEIVMHSFNCGGEFFYCNSTQLFNSTWNNTIGPNNTNGTITLPCRIKQIINRWQEVGKAMYAPPIRGQI

RCSSNITGLLLTRDGGKEISNTTEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKRGSKVVTNLTKTVNENKQN

VDAKVKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVADTVDKHAEAFNDIADSLD

ETNTKADEAVKTANEAKQTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIATNKDNIAKKANSADVYT

REESDSKFVRIDGLNATTEKLDTRLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSE

SAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：4-

MKHFPSKVLTTAIIATFCSGALAASNDDDSAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVL

REESDSKFVRIDGLNATTEKLDTRIASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVG

SEQ ID NO：5-

MKHFPSKVLTTAILATFCSGALAATNDDDSAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVL

ENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVGAGKLINCNTSVI

TQACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGSGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEGVVIRSENFTDNAKTIIVQL

KESVEINCTRPNNNTRKSITIGPGRAFYATGDIIGDIRQAHCNISGEKWNNTLKQIVTKLQAQFGNKTIVFKQSSGGDPEIVMRSFN

CGGEFFYCNSTQLFNSTWNNTIGPNNTNGTITLPCRIKQIINRWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGKEISNTTEIFR

PGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAISSVVQSEKSGSKVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKLADTDAALA

DTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADEAVKTANEAKQTAEETKQNV

DAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIATNKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLAS

AEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSS

GSSAAYHVGVNYEW

SEQ ID NO：6-

MKHFPSKVLTTAILATFCSGAIAATNDDDSAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVL

KESVEINCTRPNNNTRKSITIGPGRAFYATGDIIGDIRQAHCNISGEKWNNTLKQIVTKLQAQFGNKTIVFKQSSGGDPEIVMHSFN

AEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVG

SEQ ID NO：7-

PGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAISSVVQSEKSAVTLGAMFLGFLGAAGSTMGARSLTLTVQARQLLSGIVQQQNNLL

PAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLDQIWNNMTWMEWEREIDNYTNLIY

TLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKLRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAA

YHVGVNYEW

SEQ ID NO：8-

CGGEFFYCNSTQLFNSTWNNTIGPNNTNGTITLPCRIKQIINRWQEVGKAMYAPPIRGQIRCSSNITGLELTRDGGKEISNTTEIFR

RAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLDQIWNNMTWMEWEREIDNYTNLIY

TLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKLQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTE

NFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：9-

TLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKLLDTRLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGL

FQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：10-

ENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTFLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVGAGKLINCNTSVI

TLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYI

SEQ ID NO：11-

MKHFPSKVLTTAILATFCSGALAASNDDD

SEQ ID NO：12-

SAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVLENVTENFNMWKNNMVEQMHEDIISLWDQS

LKPCVKLTPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVTTSIRNKMQKEYALFYKLDVVPIDNDNTSYKLINCNTSVITQ

ACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGSGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEGVVIRSENFTDNAKTIIVQLKE

SVEINCTRPNNNTRKSITIGPGRAFYATGDIIGDIRQAHCNISGEKWNNTLKQIVTKLQAQFGNKTIVFKQSSGGDPEIVMHSFNCG

GEFFYCNSTQLFNSTWNNTIGPNNTNGTITLPCRIKQIINRWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGKEISNTTEIFRPG

GGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKR

SEQ ID NO：13-

KVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVADT

VDKHAEAFNDIADSLDETNTKADEAVKTANEAKQTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIAT

NKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYN

VG

SEQ ID NO：14-

GS

SEQ ID NO：15-

RFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：16-

SAVEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVAENVTENFNMWKNNMVEQMHEDIISLWDQS

LKPCVKLTPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVGAGKLINCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCND

KKFNGSGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEGVVIRSENFTDNAKTIIVQLKESVEINCTRPNNNTRKSITIGPGRAFYA

TGDIIGDIRQAHCNISGEKWNNTLKQIVTKLQAQFGNKTIVFKQSSGGDPEIVMHSFNCGGEFFYCNSTQLFNSTWNNTIGPNNTNG

TITLPCRIKQIINRWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGKEISNTTEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAP

TKAISSVVQSEKS

SEQ ID NO：17-

AVTLGAMFLGFLGAAGSTMGARSLTLTVQARQLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGC

SGKLICTTAVPWNASWSNKSLDQIWNNMTWMEWEREIDNYTNLIYTLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYI

SEQ ID NO：18-

KL

SEQ ID NO：19-

QGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：20-

LDTRLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAG

VAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：21-

SPDVKSADTLSKPAAPVVSEKETEAKEDAPQAGSQGQGAPSAQGSQDMAAVSEENTGNGGAVTADNPKNEDEVAQNDMPQNAAGTDS

STPNHTPDPNMLAGNMENQATDAGESSQPANQPDMANAADGMQGDDPSAGGQNAGNTAAQGANQAGNNQAAGSSDPIPASNPAPANG

GSNFGRVDLANGVLIDGPSQNITLTHCKGDSCSGNNFLDEEVQLKSEFEKLSDADKISNYKKDGKNDKFVGLVADSVQMKGINQYII

FYKPKPTSFARFRRSARSRRSLPAEMPLIPVNQADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKLPGGSYALRVQGEPAKGE

MLAGAAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKAAIDGNGFKGTWTENGSGDVSGKFYGPAG

EEVAGKYSYRPTDAEKGGFGVFAGKKEQD

SEQ ID NO：22-

VSAVIGSAAVGAKSAVDRRTTGAQTDDNVMALRIETTARSYLRQNNQTKGYTPQISVVGYNRHLLLLGQVATEGEKQFVGQIARSEQ

AAEGVYNYITVASLPRTAGDIAGDTWNTSKVRATLLGISPATQARVKIVTYGNVTYVMGILTPEEQAQITQKVSTTVGVQKVITLYQ

NYVQR

SEQ ID NO：23-

CSSGGGGVAADIGAGLADALTAPLDHKDKGLQSLTLDQSVRKNEKLKLAAQGAEKTYGNGDSLNTGKLKNDKVSRFDFIRQIEVDGQ

LITLESGEFQVYKQSHSALTAFQTEQIQDSEHSGKMVAKRQFRIGDIAGEHTSFDKLPEGGRATYRGTAFGSDDAGGKLTYTIDFAA

KQGNGKIEHLKSPELNVDLAAADIKPDGKRHAVISGSVLYNQAEKGSYSLGIFGGKAQEVAGSAEVKTVNGIRHIGLAAKQ

SEQ ID NO：24-

CSSGGGGVAADIGAGLADALTAPLDHKDKSLQSLTLDQSVRKNEKLKLAAQGAEKTYGNGDSLNTGKLKNDKVSRFDFIRQIEVDGQ

LITLESGEFQIYkQDHSAVVALQIEKINNPDKIDSLINQRSFLVSGLGGEHTAFNQLPDGKAEYHGKAFSSDDAGGKLTYTIDFAAK

QGHGKIEHLKTPEQNVELAAAELKADEKSHAVILGDTRYGSEEKGTYHLALFGDRAQEIAGSATVKIGEKVHEIGIAGKQ

SEQ ID NO：25-

CSSGGGGSGGGGVAADIGTGLADALTAPLDHKDKGLKSLTLEDSIPQNGTLTLSAQGAEKTFKAGDKDNSLNTGKLKNDKISRFDFV

QKIEVDGQTITLASGEFQIYKQNHSAVVALQIEKINNPDKTDSLINQRSFLVSGLGGEHTAFNQLPGGKAEYHGKAFSSDDPNGRLH

YSIDFTKKQGYGRIEHLKTLEQNVELAAAELKADEKSHAVILGDTRYGSEEKGTYHLALFGDRAQEIAGSATVKIGEKVHEIGIAGK

Q

SEQ ID NO：26-

ATYKVDEYHANARFAIDHFNTSTNVGGFYGLTGSVEFDQAKRDGKIDITIPIANLQSGSQHFTDHLKSADIFDAAQYPDIRFVSTKF

NFNGKKLVSVDGNLTMHGKTAPVKLKAEKFNCYQSPMEKTEVCGGDFSTTIDRTKWGMDYLVNVGMTKSVRIDIQIEAAKQ

SEQ ID NO：27-

GSGGGG

SEQ ID NO：28-

MKHFPSKVLTTAILATFCSGALAATNDDDVKKAATVAIAAAYNNGQEINGFKAGETIYDIDEDGTITKKDATAADVEADDFKGLGLK

KVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKIGENITTFAEETKTNIVKIDEKLEAVADT

VGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：29-

MKRNLLKQSVIAVLIGGTTVSNYALAQAQAQAQVKKDELSELKKQVKEMDAAIDGILDDNIAYEAEVDAKLDQHSAALGRHTNRLNN

LKTIAEKAKGDSSEALDKIEALEEQNDEFLADITALEEGVDGLDDDITGIQDNISDIEDDINQNSADIATNTAAIATHTQRLDNLDN

RVNNLNKDLKRGLAAQAALNGLFQPYNVGKLNLTAAVGGYKSQTAVAVGTGYRYNENIAAKAGVAFTHGGSATYNVGVNFEW

SEQ ID NO：30-

MTKDFKISVSAALISALFSSPYAFANNDEVHETAVQISPNSDPDSHVMIFQPEVRAPGGTNALAKGTHSIAVGASAEAAERAAVAVG

AGSIATGVNSVAIGPLSKALGDSAVTYGAGSTAQKDGVAIGARASTSDTGVAVGFNSKVDAKNSVSIGHSSHVAVDHDYSIAIGDRS

KTDRKNSVSIGHESLNRQLTHLAAGTKDTDAVNVAQLKKEIEKTQENANKKSAEVLGIANNYTDSKSAETLENARKEAFDLSNDALD

MAKKHSNSVARTTLETAEEHTNKKSAETLASANVYADSKSSHTLKTANSYTDVTVSNSTKKAIRESNQYTDHKFHQLDNRLDKLDTR

VDKGLASSAALNSLFQPYGVGKVNFTAGVGGYRSSQALAIGSGYRVNESVALKAGVAYAGSSDVMYNASFNIEW

SEQ ID NO：31-

MKTMKLLPLKIAVTSAMIIGLGAASTANAQATETFLPNLFDNDYTETTDPLYHGMILGNTAITQDTQYKFYAENGNEVPDSLFFNKI

LHDQQLNGFKEGDTIIPLDENGKPVYKLDEITENGVKRKVYSVTTKTATREDVEQSAYSRGIQGDIDDLYEANKENVNRLIEHGDKI

FANEESVQYLNKEVQNNIENIHELAQQQDQHSSDIKTLKKNVEEGLLELSGRLIAQKEDIAQNQTDIQDLATYNELQDQYAQKQTEA

IDALNKASSENTQNIAKNSNHIKTLENNIEEGLLELSGHLIDQKADLTKDIKALESNVEEGLLDLSGRLLDQKADIAKNQADIAQNQ

TDIQDLAAYNELQDQYAQKQTEAIDALNKASSENTQNIEDLAAYNELQDAYAKQQTEAIDALNKASSENTQNIEDLAAYNELQDAYA

KQQTEAIDALNKASSENTQNIAKNQADIANNINNIYELAQQQDQHSSDIKTLAKASAANTDRIAKNKADADASFETLTKNQNTLIEK

DKEHDKLITANKTAIDANKASADTKFAATADAITKNGNAITKNAKSITDLGTKVDGFDGRVTALDTKVNALDTKVNAFDGRITALDS

KVENGMAAQAALSGLFQPYSVGKFNATAALGGYGSKSAVAIGAGYRVNPNLAFKAGAAINTSGNKKGSYNIGVNYEF

SEQ ID NO：32-

ENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLHCTNIKNATNTKSSNWKEMDRGEIKNCSFKVTTSIRNKMQKEYA

RCSSNITGLLLTRDGGKEISNTTEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKSSVVQSEKSGSKVVTNLTKTVNENKQN

SAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：33-

RCSSNITGLLLTRDGGKEISNTTEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAISSVVQSEKSGSKVVTNLTKTVNENKQN

VDAKVKAAESEIEKLTTKLADTDAAAADTDAALDATTNALNKLGENITTEAEETKTNIVKIDEKLEAVADTVDKHAEAFNDIADSLD

REESDSKFVRIDGLNATTEKLDTRLAsAEKSIADHDTRKLVPRGSGGGGGGLNGLDKTVSDLRKETRQGLAEQAALSGLFQPTNVGR

FNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：34-

RCSSNITGLLLTRDGGKEISNTTEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKALRTLGAMFLGFLGAAGSTMGAAsLTLTV

QARQLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLDQIWNNM

TWMEWEREIDNYTNLIYTLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKLQGLAEQAALSGLFQPYNVGRFNVTAAVGG

YKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：35-

QAQFGNKTIVFKQSSGGDPEIVNHSFNCGGEFFYCNSTQLFNSTWNNTIGPNNTNGTITLPCRIKQIINRWQEVGKAMYAPPIRGQI

TWMEWEREIDNYTNLIYTLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKLVPRGSGGGGGGLNGLDKTVSDLRKETRQG

LAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：36-

LKPCVKLTPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVTTSIRNKNQKEYALFYKLDVVPIDNDNTSYKLINCNTSVITQ

GGDMRDNWRSELYKYKVVKIEPLGVAPTKAKSSVVQSEKS

SEQ ID NO：37-

KLVPRGSGGGGGG

SEQ ID NO：38-

LVPRGS

SEQ ID NO：39-

LKPCVKITPLCVTLHCTNLKNATNTKSSNWKEMDRGEIKNCSFKVTTSIRNKMQKEYALFYKLDVVPIDNDNTSYKLINCNTSVITQ

SVEINCTRPNNNTRKSITIGPGRAFYATGDIIGDIRQAHCNISGEKWNNTLKQIVTKIQAQFGNKTIVFKQSSGGDPEIVMHSFNCG

GGDMRDNWRSELYKYKVVKIEPLGVAPTKALRTLGAMFLGFLGAGSTMGAASLTLTVQARQILLSGIVQQQNNLLRAIEAQQHLLQL

TVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLDQIWNNMTWMEWEREIDNYTNLIYTLIEESQNQQEK

NEQELLELDKWASLWNWFDISKWLWYI

SEQ ID NO：40-

LNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVN

YEW

SEQ ID NO：41-

KVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKLADTDAAIADTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVADT

NKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLASAEKSIAIDHDTRANGLDKTVSDLRKETRQGLAEQAASGLFQPYN

VGRFNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEW

SEQ ID NO：42-

MKTVNVALIALIISATSSPVVIAGDTIEAAATELSAINSGMSQSEIEQKITRFLERTDNSPAAYTYLTEHHYIPSETPDTTQTPTVQ

TDPDAGQKTVAATGDVQTTARYQSMINARQSAVTDAQQTQITEQQAQIVATQKTLAATGDTQNTAHYQEMINARIAAQNEANQRTAT

EQGQKMNAITTDVAVQQQNERTQYDKQMQSLAQESAQAHEQIDSLSQDVTQTHQQLTNTQKRVADNSQQINTLNNHFSSLKNEVDDN

RKEANAGTASAIAIASQPQVKTGDVMMVSAGAGTFNGESAVSVGTSFNAGTHTVLKAGISADTQSDFGAGVGVGYSF

SEQ ID NO：43-

MNKIFKVIWNPATGNYTVTSETAKSRGKKSGRSKLLISALVAGGMLSSFGAIANAGNDNGQGVDYGSGSAGDGWVAIGKGAKANTFMNTSGSSTAV

GYDAIAEGQYSSAIGSKTHAIGGASMAFGVSAISEGDRSIALGASSYSLGQYSMALGRYSKALGKLSIAMGDSSKAEGANAIALGNATKATEIMS

IALGDTANASKAYSMALGASSVASEENAIAIGAETEAAENATAIGNNAKAKGTNSMAMGFGSIADKVNTIAIGNGSQALADNAIAIGQGNKADGV

DAIALGNGSQSRGLNTIALGTASNATGDKSIALGSNSSANGINSVALGADSIADLDNTVSVGNSSIKRKIVNVKNGAIKSDSYDAINGSQLYAIS

DSVAKRLGGGAAVDVDDGTVTAPTYNLKNGSKNNVGAAIAVIDENTLQWDQTKGKYSAAHGTSSPTASVITDVADGTISASSKDAVNGSQLKATN

DDVEANTANIATNTSNIATNTANIATNTTNITNLTDSVGDLQADALIWNETKKAFSAAHGQDTTSKITNVKDADLTADSTDAVNGSQLKTTNDAV

ATNTTNIANNTSIATNTTNISNLTETVTNLGEDALKWDKDNGVFTAAHGTETTSKITNVKDGDLTTTGSTDAVNGSQLKTTNDAVATNTTNIATN

TTNISNLTETVTNIGEDALKWDKDNGVFTAAHGNNTASKITNILDGTVTATSSDAINGSQLYDLSSNIATYFGGNASVNTDGVFTGPTYKIGETN

YYNVGDALAAINSSFSTSLGDALLWDATAGKFSAKHGTNGDASVITDVADGEISDSSSDAVNGSQLHGVSSYVVDALGGGAEVNADGTITAPTYT

IANADYDNVGDALNAIDTTLDDALLWDADAGENGAFSAAHGKDKTASVITNVANGAISAASSDAINGSQLYTTNKYIADALGGDAEVNADGTITA

PTYTIANAEYNNVGDALDALDDNAILWDETANGGAGAYNASHDGKASIITNVANGSISEDSTDAVNGSQLNATNMMIEQNTQIINQLAGNTDATY

IQENGAGINYVRTNDDGLAFNDASAQGVGATAIGYNSVAKGDSSVAIGQGSYSDVDTGIAIGSSSVSSRVIAKGSRDTSITENGVVIGYDTTDGE

LLGALSIGDDGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATTPTKYFHANSTEEDSLAVGTDSLAMGAKTIVNGDKGIGIGYGAYVDANALNG

IAIGSNAQVIHVNSIAIGNGSTTTRGAQTNYTAYNMDAPQNSVGEFSVGSADGQRQITNVAAGSADTDAVNVGQLKVTDAQVSQNTQSITNLDNR

VTNLDSRVTNIENGIGDIVTTGSTKYFKTNTDGVDASAQGKDSVAIGSGSIAAADNSVALGTGSVATEENTISVGSSTNQRRITNVAAGKNATDA

VNVAQLKSSEAGGVRYDTKADGSIDYSNITLGGGNGGTTRISNVSAGVNNNDVVNYAQLKQSVQETKQYTDQRMVEMDNKLSKTESKLSGGIASA

MAMTGLPQAYTPGASMASIGGGTYNGESAVALGVSMVSANGRWVYKLQGSTNSQGEYSAAIGAGIQW

SEQ ID NO：44-

MTYQLFKHHLVALMVTGAISVNALAKDSFLENPSANLPQQVFKNRVDIFNNETNINENKKDIAINKANIASIEKDVMRNTGGIDRLA

KQELVNRARITKNELDIRKNTKSIAENTASIARIDGNLEGVNRVLQNVDVRSTENAARSRANEQKIAENKKAIENKADKADVEKNRA

DIAANSRAIATFRSSSQNIAALTTKVDRNTARIDRLDSRVNELDKEVKNGLASQAAISGLFQPYNVGSLNLSAAVGGYKSKTALAVG

SGYRFNQNVAAKAGVAVSTNGGSATYNVGLNFEW

SEQ ID NO：45-

MKKVQFFKYSSLALALGLGVSASALAAPTSTSTTTGPEAPPTGPAPTAKDPLAETALAYDLENEVAYLRMKAGEWMQIGLDPEKEVI

KGWNEVKSLPRIDGNGKDKQTKDQIAMLIRTVDNTKELGRIVSTNIEDIKNLKKELYGFVEDVNESEARNISRIDENEKDIKNLKKE

LYDFVEDVNESEARNISRIDENEKDINTLKEIMDEDLNSVLTQIEDVKLTFQDVNDNVNLAFEEINGNAQKFDTAIEGLTSGLSDIQ

AKVDANKQETEDDIADNAKAIHSNTKGIAKNTKDIRDLDTKTKQMLENDKNLMTGLESLATETSKGFERFDVKTQQLDQAVANVVGR

VDITEQAIRQNTAGLVNVNKRVDTLDKNTKAGIASAVALGMLPQSTAPGKSLVSLGVGHHRGQSATAIGVSSMSSNGKWVVKGGMSY

DTQRHATFGGSVGFFFN

SEQ ID NO：46-

MKIKCLVAVVGLACSTITTMAQQPPKFAGVSSLYSYEYDYGKGKWTWSNEGGFDIKVPGIKMKPKEWISKQATYLELQHYMPYTPVL

VTSAPDVSPSSISILLYPMSDPDQLGINRQQLKLNLYSYFNDLRHDFKLKVLDARISKNKQNIDTISKYLLELGTYLDGSYRMMEQN

THNINKNTHNINKNTHNINKLSKELQTGLANQSALSMLVQPNGVGKTSVSAAVGGYRDKTALAIGVGSRITDRFTAKAGVAFNTYNG

GMSYGASVGYEF

SEQ ID NO：47-

MKTVNVALLALIISATSSPFVLAGDTIEAAATELSAINSGMSQSEIEQKITRFLERTDNSPAAYTYLTEHHYIPSETPDTTQTPPVQ

TDPDAGQKTVAATGDVQTTARYQSMINARQSTVTDAQQTQITEQQAQIVATQKTIAATGDTQNTAHYQEMINARIAAQNEANQRTTT

EQGQKMNALTTDVAAQQQKERAQYDKQMQSLAQKSVQAHEQIESLRQDSAQTQQQLTNTQKRVADNSQQINTLNNHFSSLKNEVEDN

RKEANAGTASAIAIAsQPQVKTGDLMMVsAGAGTFNGESAVSVGTSFNAGTHTVLKAGISADTQSDFGAGVGVGYSF

SEQ ID NO：48-

MLIQQNSEVINQLAGNTSETYIEENGASINYVRTNDTGLTFTDASAAGIGSTAVGYNTVAKGDNSVAMGYNSFAEGHSSVAIGQGSY

SGVETSIALGSESVSSRVIVKGSRNTSVSEEGVVIGYDTTDGELLGALSIGDDGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATT

PTKYYHANSTAEDSLAVGEDSLAMGAKTIVNGNAGIGIGLNTLVLADAINGIAIGSNARANHADSIAMGNGSQTTRGAQTNYTAYNM

DAPQNSVGEFSVGSEDGQRQITNVAAGSADTDAVNVGQLKVTDAQVSQNTQSITNLNTQVTNLDTRVTNIENGIGDIVTTGSTKYFK

TNTDGVDANAQGKDSVAIGSGSTAAADNSVALGTGSVANEENTISVGSSTNQRRITNVAAGVNATDAVNVSQLKSSEAGGVRYDTKA

DGSIDYSNITLGGGNGGTTRISNVSAGVNNNDAVNYAQLKQSVQETKQYTDQRMVEMDNKLSKTESKLSGGIASAMAMTGLPQAYTP

GASMASIGGGTYNGESAVALGVSMVSANGRWVYKLQGSTNSQGEYSAALGAGIQW

SEQ ID NO：49-

MKTVKLSLLAVVVATAVSPSAFAGDTVEAATTELTVIQPGMSQSEIDQKIGRFLERTGNSVAAQNYLIAHDYQTTTPQENTAASPVQ

PTNTLNPITNQAQTDRDNGQDTAIQDAQHAANWAsLKADDAQNAITVAQTDIDANTAAITDTRNDVSAVQSDVTNIKGDVAHAQSTA

DHANANANTALINGVKLSGAVTENKNNIEQNRSDIADQQKLLASNEQKQIVRDNGQDTAIQDAQHAANWASLKADDAQHAITVAQTD

IDANKAAITDIRNDVSAVQSDVTNIKGDVAHAQSTADHANANANTALMNGVKLSSAVTENKNNIEQNRSDIADQQKLLASNEQKQIV

RDNGQDTAIQDAQHAANWASMKADDAQHAITVAQTDIDANKAAIADTRNDVSAVQSDVTNIKGDVAHAQSTADHANANANTALINGV

KLSGAVTENKNNIEQNRSDIADQQQQLDETRKIVAATGDVQTAARYQSMIDARQTAAANAQQAQADTQQQQMDDQQKQIDATQKTVS

ALGDAQTNAHYQEMVNAGLRAQNDANARTAAEQKQKIDTLATNQATQQHINSVQYGEQIQRLAQDSTQTHEQIDSLTQDVTQTHQQL

SNTQKRVADNSQQITTLNNHFSSLKNEVEDNRKEANAGTASAIAIASQPQVKAGDFMMMSAGAGTFNGESAVSVGTSFNAGTHTVIK

AGVSADTQSDFGAGVGVGYSF

SEQ ID NO：50-

MNKIFKVIWNPATGSYTVASETAKSRGKKSGRSKLLISALVAGGMLSSFGVQAQAGRDNGQGVNYGQGTGTGWVAIGEDAKANSFTD

TGGGSSTAVGYHSTADGRWSTALGAKTHSLGEASVALGINTTSAGERSLAIGASATSTGGFSIALGRYANSVGEFSIAQGDHAETGA

DDAIAFGRESKALGIMSIALGATANASKEYAMALGASSAASAANAIAVGRNSAAAGVDSLAFGRQSAASAANAIAMGAESKAAENAT

AVGTNAEANGLNSIALGSGSIADVDNTIALGNQSQAVAAGAIAIGQGNKADGANAIALGNGSITGGVNAIALGQGSYAGLENGTAIG

AQASAQGKNSVALGAGSVATDADTVSVGNTTAQRQIVNMAAGDISTTSTDAINGSQLYAISKSVADNLGGGATVNAQGVVTSPNYRL

KSGIFGTVGDALTGLDNNTLQWDSLKKAYSAAHGTDTTSTITNVKDGAISDTSKDAVNGSQLKTTNDNVATNTANITTNTNSINTLT

DSVGDLKDDALLWNGTAFSAAHGTEATSKITNVKDGDLTAGSTDAVNGSQLKTTNDNVATNTTNITNLTDSVGDLKDDALLWNGTAF

SAAHGTDATSKITNVKDGDLTAGSTDAVNGSQLKTTNDAVAANTTNIATNTTNITNLTDAVDSLGDDSLLWNATAGAFSAAHGTDAT

SKITNVTAGDLTAGSTDAVNGSQLKTTNDAVAANTTNIATNTTNITNLTDAVDSLGDDSLLWNATAGAFSAAHGTDATSKITNVKDG

DLTAGSTDAVNGSQLKTTNDAVAANTTNIATNTTNITNLTDAVDSLGDDSLLWNATAGAFSAKHGTNGTDSKITNLLAGTVSSDSTD

AINGSQLYGLADSFTSYLGGGADISDAGVLTGPTYTIGGTDYNNVGDAIAAINTSFSTSLGDALLWDATAKGGDGAFSAGRGTDNTA

SIITNVADGAISSTSSDAINGSQLYDTSKYIADTLGGDAEVNADGTITAPTYAIAGGSYSNVGDALEAIDTTLDDALLWDATANDGN

GAFSAAHGKDKTASVITNVANGAISATSSDAINGSQLYTTNKYIADALGGDAEVNADGSITAPTYTIANAEYNNVGDALDALDDNAL

LWDATANDGAGAYNASHDGKASIITNVADGNIGEGSTDAINGSQLFNTNMLIQQNSEIINQLAGNTSETYIEDNGAGINYVRTNDNG

LAFNDASAsGIGATAVGYNAVASGESSVAIGQGSSSNVDTGIALGSSSVSSRVIVKGSRDTSVSEEGVVIGYDTTDGELLGALSIGD

DGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATTPTKYFHANSTEEDSLAVGEDSLAMGAKTIVNGNAGIGIGYGAYVDANALNGI

AIGSNARANHANSIAMGNGSQTTRGAQTGYAAYNMDAPQNSVGEFSVGSEDGQRQITNVAAGSADTDAVNVGQLKVTDAQVSQNTQS

ITNLNNQVTNLDTRVTNIENGIGDIVTTGSTKYFKTNTDGVDANAQGKDSVAIGSGSIAAADNSVALGTGSVANEENTISVGSSTNQ

RRITNVAAGVNATDAVNVSQLKSSEAGGVRYDTKADGSVDYSNITLGGGNGGTTRISNVSAGVNNNDAVNYAQLKQSVQETKQYTDQ

RMVEMDNKLSKTESKLSGGIASAMAMTGLPQAYTPGASMASIGGGTYNGESAVALGVSMVSANGRWVYKLQGSTNSQGEYSAALGAG

IQW

SEQ ID NO：51-

MNKIFKVIWNPATGSYTVASETAKSRGKKSGRSKLLISALVAGGLLSSFGASADNYTGQPTDYGDGSAGDGWVAIGKGAKANTFMNT

SGASTALGYDAIAEGEYSSAIGSKTLATGGASMAFGVSAKAMGDRSVALGASSVANGDRSMAFGRYAKTNGFTSLAIGDSSLADGEK

TIALGNTAKAYEIMSIALGDNANASKEYAMALGASSKAGGADSLAFGRKSTANSTGSLAIGADSSSSNDNAIAIGNKTQALGVNSMA

LGNASQASGESSIALGNTSEASEQNAIALGQGSIASKVNSIALGSNSLSSGENAIALGEGSAAGGSNSIAFGSQsRANGNDSVAIGV

GAAAATDNSVAIGAGSTTDASNTVSVGNSATKRKIVNMAAGAISNTSTDAINGSQLYTISDSVAKRLGGGATVGSDGTVTAVSYALR

SGTYNNVGDALSGIDNNTLQWNKTAGAFSANHGANATNKITNVAKGTVSATSTDVVNGSQLYDLQQDALLWNGTAFSAAHGTEATSK

ITNVTAGNLTAGSTDAVNGSQLKTTNDNVTTNTTNIATNTTNITNLTDAVNGLGDDSLLWNKAAGAFSAAHGTEATSKITNVTAGNL

TAGSTDAVNGSQLKTTNDNVTTNTTNIATNTTNITNLTDAVNGLGDDSLLWNKTAGAFSAAHGTDATSKITNVTAGNLTAGSTDAVN

GSQLKTTNDNVTTNTTNIATNTTNITNLTDAVNGLGDDSLLWNKTAGAFSAAHGTDATSKITNVKAGDLTAGSTDAVNGSQLKTTND

NVSTNTTNITNLTDAVNGLGDDSLLWNKTAGAFSAAHGTDATSKITNVKAGDLTAGSTDAVNGSQLKTTNDNVSTNTTNITNLTDSV

GDLKDDSLLWNKAAGAFSAAHGTEATSKITNLLAGKISSNSTDAINGSQLYGVADSFTSYLGGGADISDTGVLSGPTYTIGGTDYTN

VGDALAAINTSFSTSLGDALLWDATAGKFSAKHGINNAPSVITDVANGAVSSTSSDAINGSQLYGVSDYIADALGGNAVVNTDGSIT

TPTYAIAGGSYNNVGDALEAIDTTLDDALLWDTTANGGNGAFSAAHGKDKTASVITNVANGAVSATSNDAINGSQLYSTNKYIADAL

GGDAEVNADGTITAPTYTIANTDYNNVGEALDALDNNALLWDEDAGAYNASHDGNASKITNVAAGDLSTTSTDAVNGSQLNATNILV

TQNSQMINQLAGNTSETYIEENGAGINYVRTNDSGLAFNDASAsGIGATAVGYNAVASHASSVAIGQDSISEVDTGIALGSSSVSSR

VIVKGTRNTSVSEEGVVIGYDTTDGELLGALSIGDDGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATTPTKYYHANSTAEDSLAV

GEDSLAMGAKTIVNGNAGIGIGLNTLVLADAINGIAIGSNARANHADSIAMGNGSQTTRGAQTNYTAYNMDAPQNSVGEFSVGSEDG

QRQITNVAAGSADTDAVNVGQLKVTDAQVSQNTQSITNLNTQVTNLDTRVTNIENGIGDIVTTGSTKYFKTNTDGADANAQGKDSVA

IGSGSIAAADNSVAIGTGSVADEENTISVGSSTNQRRITNVAAGVNATDAVNVSQLKSSEAGGVRYDTKADGSIDYSNITLGGGNSG

TTRISNVSAGVNNNDAVNYAQLKQSVQETKQYTDQRMVEMDNKLSKTESKLSGGIASAMAMTGLPQAYTPGASMASIGGGTYNGESA

VALGVSMVSANGRWVYKLQGSTNSQGEYSAALGAGIQW

SEQ ID NO：52-

MTNLGEDALKWDKDNGVFTAAHGTETTSKITNVKDGDLTTGSTDAVNGSQLKTTNDAVATNTTNIATNTTNISNLTETVTNLGEDAL

KWDKDNGVFTAAHGNNTASKITNILDGTVTATSSDAINGSQLYDLSSNIATYFGGNASVNTDGVFTGPTYKIGETNYYNVGDALAAI

NSSFSTSLGDALLWDATAGKFSAKHGTNGDASVITDVADGEISDSSSDAVNGSQLHGVSSYVVDALGGGAEVNADGTITAPTYTIAN

ADYDNVGDALNAIDTTPDDALLWDADAGENGAFSAAHGKDKTASVITNVANGAISAASSDAINGSQLYTTNKYIADALGGDAEVNAD

GTITAPTYTIANAEYNNVGDALDALDDNALLWDKTANGGAGAYNASHDGKASIITNVANGSISEDSTDAVNGSQLNATNMMIEQNTQ

IINQLAGNTDATYIEENGAGINYVRTNDNDLAFNDASASGVGATAVGYNAVASGASSVAIGQNSSSTVDTGIALGSSSVSSRVIAKG

SRDTSVTENGVVIGYDTTDGELLGALSIGDDGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATTPTKYFHANSTAEDSLAVGEDSL

AMGAKTVVNGNAGIGIGLNTLVLADAINGIAIGSNARANHANSIAMGNGSQTTRGAQTGYTAYNMDAPQNSVGEFSVGSEDGQRQIT

NVAAGSADTDAVNVGQLKVTDERVAQNTQSITNLNNQVTNLDTRVTNIENGIGDIVTTGSTKYFKTNTDGVDANAQGKDSVAIGSGS

IAAADNSVALGTGSVAEEENTISVGSSTNQRRITNVAASVNATDAVNVSQLKSSEAGGVRYDTKADGSIDYSNITLGGGNGSTTRIS

NVSAGVNNNDAVNYAQLKQSAQETKQYTDQRMVEMDNKLSKTESKLSGGIASAMAMTGLPQAYTPGASMASIGGGTYNGESAVAIGV

SMVSANGRWVYKLQGSTNSQGEYSAALGAGIQW

SEQ ID NO：53-

MSFFKKNISITAMGGLMLSLAVDAAKAEENVSQVKLPPVFVFELVENQGLANIALIRPRVIAPDNNLRPGGIVSGIAGLLTLGQENR

NLISENRQVINNNTTAIGQNRTSISTNAKGVADNRAAIRQNSAAISALGQRVDGLQGQINSARKEARAGAANAAALSGIRYDNRPGK

VSIATGVGGFKGSTALAAGIGYTSKNENARYNVSVAYNEAGTSWNAGASFTLN

SEQ ID NO：54-

NLISENRQVINNNTTAIGQNSDRIDANAKGVADNRAAIGQNSGRIDANAKGVADNKAAIGRNSGRIDANAKGVADNKTAIGRNSGRI

DTNAKGVADNRAAISQNRGRINANAAGVASNRAAIRQNSAAISALGQRVDGLQGQINSARKEARAGAANAAALSGLRYDNRPGKVSI

ATGVGGFKGSTAIAAGIGYTSKNENARYNVSVAYNEAGTSWNAGASFTLN

SEQ ID NO：55-

MVFSAMPQYACAEMLLQNDPGTNCGSVGDAYAWARGDGYSGCKVGYEAAKNLAKGTAFGNSLGQLSPGTNILVYGSTLRAGMNDEVT

PLDSMNIGGHLDVWGASGFHGGVDMNNSAIKNLADGTLSATSTEAVTGRQLNATNTNITNLQNSIKSISSSASLVQQSAAGKDITVA

KDLDGDAVDFSGKKLSDSTTFSRKLTGVAEGTLSATSTDAVSGKQLYTTNQNLSTTNQNLADTNKSIAETNKNVSATTTNITNLQNT

IKNISGGSAGLVQQSAAGKDITVAKDLDGEAVDFSGKKLSDSTTFSRKLTGVAEGTLSATSTDAVSGKQLYTTNQNLAsTNKDLANT

NTRLTTAEGNLSSNTTSITNLQNTIKNISGGSAGLVQQSAAGKDITVAKDLDGDAVDFSGKKLSDSTTFSRKLTGVAEGTLSATSTD

AVSGRQLYTTNQNLSTTNQNLADTNKSLAETNKNVSATTTNITNLQNTVNNISSGSAGLVQQSAAGKDITVAKDLDGDAVDFSGKKL

SDSTTFSRKLTGVAEGTLSATSTDAVSGKQLYTTNQNLSTTNQNLADTNKSLAETNKNVSATTTNITNLQNTVNNISSGSAGLVQQS

AAGKDITVAKNLDGDAVDFSGKKLSDSTTFSRKLTGVAEGTLSATSTDAVSGKQLYTTNQNLASTNKDLANTNTRLTTAEGNLSSNT

TSITNLQNTIKNISGGSAGLVQQSAAGKDITVAKDLDGDAVDFSGKNLSDSTTFSRKLTGVAEGTLSATSTDAVSGKQLYTTNQNLS

TTNQNLADTNKSLAKTNNNVSATTTNITNLQNTVNNISSGSAGLVQQSAAGKDITVAKDLDGDAVDFSGKKLSDSTTFSRKLTGVAE

GTLSATSTDAVSGKQLYATNQNVSKLSANVTDVSDSVTNIKNTMNTIVNGGGLKYFHANSTLDDAQAMGLESIAFGGAAVAAGMNSM

AMGGNARAVAGNAVALGAGSVADRANTVSVGSAGKERQITNVAAGTADTDAVNVAQLKAAGIINGSGRTNATVTYGTNADGSADYGN

VTLGGGNAPAGTAIHNVAAGTAETDAVNVRQMNAAIASVQKVSNTNDPMFAADGDRAVKRASAKGTHATAMGAAASAGGDQSVATGH

NAQSGGDSSVAMGANAKATANHAVAVGSGSVANRANTMSVGSAGSERQITNVAAGVQGTDAVNVSQLSQAVYAAVGDLPAGTTARQY

TDEQIGMVRQGISQVARGAYSGIAAATALTMIPDVDQGKSIAIGIGSATYKGYQAVALGASARISHNLKAKMGVGYSSEGTTVGMGA

SYQW

SEQ ID NO：56-

MALGRQSVSAGSGSLAFGNGSYANSNGSVAIGQSAYAANVRAIAIGGDDAFAWREAEQTKAGGSQSIAMGVRARTKSLVVDDPDTVA

NEADPGGASDAIAIGTDAQANGDRSLAIGRQNQAGNEQSIGIGAGNTATGKLSIGIGSSNVASGEQSLSLGAGNNALGQGSISIGTE

TTAGGLRSIAFGVRASTKEQNLDIPDDVAAIDAIAIGTNTKANGDRSVSIGTGSQASSGAVSIGDAAKAVGDKSVSIGTESWADGDE

SVSIGLVNNAGFEGNDRIKGGQTSVSLGAFNQSPGIEAIAIGARNEANADRSIAIGSRAKTKAADPAQADGGARDAVAIGTDALAND

DRSISIGWNSSTSLNDSISIGTRATSGSAGDIMIGTGSGTGSTSGQNNVALGVAASQKVKGSSNIAIGDSAGGSREGDNNVAIGTNA

GIQFSESEHETAVRADLVVSDAVSIGNEALASADEAIAIGTGAVASGLKSISIGVGNTVSGASSGAIGDPTDITGTGSYSIGNDNTI

AADNAGTFGNDNTLADAADGSRVIGNGNNIDVSDAFVLGNGADVTEVGGVALGSGSVSDTGADVAGYVPGGAsTADQNAIEATQSTR

GAVAVGNPDAETGVYRQITGVAAGTADSDAANVAQLKSVETIAKTGWKLTTDSGSIDGIGPGDELVLKGGDGNIVISNQILSNDVSI

DLADEIEVNRVTARDPDTGASTVLDENGLSFTTQDANGEDTALGPRVTAAGIQAAGKITNVAAGEADTDAVNFSQLRQVETASGNTD

QRAVKYDWTDANTNGVIDEGELNLDSVTLAGGMGGTRISNLAPGALSAASTDAVNGSQLFGLRSRVSNVAVALGGGAAYDPVKDEWI

APKYTIGGTDYSNVGDALAAVGGTAGAGWSLSAQGANASNVAPGETVDLRSGDGNIVVSKAETGDTVSFDLADDLDVSESITVGADP

ADPNAPTTVITGGSIVIGSTMLGSNGLVITGGPSVTTDGIDAGGMKVTNVANGTVAKDSKDAVNGGQLFDVVANATANGVGYDDKSK

GTLTLEGANGTKITNVAAGDLNANSTDAVNGSQLYATNVKVDRLDTEVKEIDSRVTYIESFQGDLENAAVYDTDAAGKRLNTLTLEG

GDPDKPVLIANVAKGVKATDAVNVGQLDESVAESKSYTDEKTEWAIDQAAIYTDQVIETKVSAVNNYAQQRFAQLSGEIGQVRSEAR

QAAAIGLAAASLRFDNEPGKLSVALGGGFWRSEGALAFGAGYTSEDGRVRANLTGAAAGGNVGVGAGLSITLN

SEQ ID NO：57-

MRAFGSGNAINGTNYAAVGSNNVVAGNNGAVVGSGNGVTGDNTAAFGSSIGIAGGNNAAVGSFSTVTGSNSAAVGSFNNVSGNNSGA

FGTGQNIRGNGTFAIGDPNIVNGNNSLVFGDNNTVNGSNVAGRGDNIQLVGSNNTIAATSSAAGSSyFGSGNTVNATNAVVMGNNST

VSGASSVAIGNGTAVTGINAIAMGTGAGANFDNSVAIGSGATTTRANQVAVGTASSTYTMSGITSAASKAAQSGPTQLVTSDAAGNL

ATTSLAGLGLASAGDINGINSQLAALNGRVDNLTRESRGGVALAIAASSLQFDPRPGKISVSGGFGNFQGQSGLAVGLGYSYSDAMR

FNAAFTAAQQGAIGVRAGASWTLN

SEQ ID NO：58-

MNKTYRSVWNESTGTWVAASEHASARGKKSSAKTSSTKAVVGALGLAAGLYGADAFALGGGLTLCPTTEGSAGYTAGSASSANGAYC

GSDYQWGLFSNTNADGSKSGQPIGAAIEGMNDGSLLLYGPNNIVMKNLVSMSSNKIINLAPGTVSSTSADAVNGSQLYATNQNVSNI

GNTVNNITTGAGIMYFHVNSTLADSTANGVNSIAIGGATRTDANNSISIGTGLTQASSNTGAIAIGQNASINVYGANSIAIGTNSAT

GGIGGAIAIGENAFATGGKMLALGSGASATTANSVALGSGSTTTANLTAAGYNPGSGTLAGTSQATNGEVSVGNAGAERRITNVAAG

SAATDAVNVSQLQSEDAKVNTINNNVNNLSGSVTNISSTVNNITNGGGIKYFHANSTQADSSATGTDAVAIGGNAQATAANSVALGL

NSTSKGTNAIALGGAVAGGSYAFAAGSLALAATTGDIALGSSATASSANSNAYATALGTNALANATDATAIGEGASATAASSVALGA

RSKTTANLSTAGYNPGTGTLSGTTPTGEVSVGSAGKERRVTNVAAGSAATDAVNVSQLMSEDAKVNTINNNVNNLSNNVTNIAGNVT

NISNTVNNITNGGGIKYFHVNSTIADSSAGGTNSIAIGGGATTGNVTAGTSDNISIGTNATTNYGKNIAIGGNAQALGGAYDGGYNT

AIGENAIAKGDGAGGFGGGGWGQTTAIGGGSQALHDNTTAVGSGAIANVANATALGMSASATAGSAIALGQGAVASAANSVALGSGS

TTTXNLSAAGYNPGTGTLSGIASVANGEVSVGAAGKERRITNVAAGSAATDAVNVSQLQSEDAKVNTINNNVNNLSGSVTNISNTVN

NITNGGGIKYFHTKSTLADSSATGTDAVAIGGNAQATAANSVALGSNSTTTANLSAAGYNPGTGALSGIAsAANGEVSVGAAGKERR

ITNVAAGSAATDAVNVSQLQSEDAKVNTISNNVNNLSGSVTNISSTVNNITNGGGIKYFHTNSTLADSTANGVNSIAIGGATRTDAN

NSISIGTGLTQASSNTGAIAIGQNASINVYGANSIAIGTNSATGGIGGAIAIGENAFATGGKMLALGSGASATTANSVALGSGSTTT

ANLTAAGYNPGSGTILAGTSQATNGEVSVGNAGAERRITNVAAGSAATDAVVSQLQSEDAKVNTINNNVNNLSNNVTNIAGNVTNIS

NTVNNITNGGGIKYFHTKSTLADSSATGTDAVAIGGNAQATAANSVALGSNSTTTANLSAAGYNPGTGTLSGTTPTGEVSVGSAGKE

RRVTNVAAGSAATDAVNVSQLQSAIIGSTANAVAYDDGTKATVTLKGASGTKITNLTAGNLSATSTDAVNGSQLYATNQNVSNIGNT

VNNITNGGGIKYFHANSTQADSSATGSNSVAVGDRASSLGGSSVAMGDGATAVGAASIAIGNNAQNVTGSNNSVAIGGDSKAGDRSV

SLGNGADTSLSSWGVAVGTNANVSAALGTAIGAGANVSGANSTAIGANAVASATNSVALGSNSTTTANLSAAGYNPGTGTLSGIASA

ANGEVSVGAAGKERRVTNVAAGSAATDAVNVSQLQSEDAKVNTINNNVNNLSGSVTNISSTVNNITNGSGIKYFHTNSTIADSSAGG

ANSIAIGGGAATSSSAGLSDNMAIGTNATASYGKNIAIGGGAQATGGTYDGGYNVALGENANATAGTNAWGHNTAIGANTVINGVNS

VALGISATTSGSGSMAFGSAAQASADYAIASGAGANASAVNSVALGSNSTTTANLSAAGYNPGTGTLSGIASVANGEVSVGSAGKER

RVTNVAAGSAATDAVNVSQLQSEDAKVNTINNNVNNLSNNVSNIAGNVTNISNTVNNITNGGGGIKYFHANSTLADSSATGTDAVAI

GGMAQATAANSVALGSNSTTTANLSAAGYNPGTGTLSGTTPVGEVSVGSAGKERRVTNVAAGSAATDAVNVSQLQSAIIGSTANAVA

YDDGTKATVTLKGASGTKITNLTAGNLSATSTDAVNGSQLYATNQNVSNVGNTVSNLSNNVTNIAGNVTNISNTVNNITNGGGIKYF

HANSTLADSSATGTDAVAIGGNAQATAANSVALGSNSTTTANLSAAGYNPGTGALSATTPVGEVSVGSAGKERRVTNVAAGSAATDA

VNVSQLMSEDAKVNTINNNVNNLSNNVSNIAGNVTNISNTVNNITNGGSGIKYFHANSTLADSSATGVDAVAIGGNAQATAANSVAI

GSNSTTTANLSAAGYNPGTGALSGIAsAANGEVSVGAAGKERRITNVAAGSAATDAVNVSQLQSEDAKVNTINNNVNNLSNNVSNIA

GNVTNISNTVNNITNGGSGIKYFHANSTLADSSATGTDAVAIGGNASASAANSVALGSNSTTTANLSAAGYNPGSAALSGTASAANG

EVSVGAAGKERRITNVAAGSAATDAVNVSQLQSEDAKVNAEGAATAAALGGGSTYNTTTGAITSPTYIAGGKTFNNVGDVVTNIDGR

VTQNSTDITNLTTTIDNGTIGLVQQATPTSTITVAKDTGGATVDFRGTGNATRTLTGITAGELSATSTDAVNGSQLYATNQNVSNID

NTVSNLSNNVTNIAGNVTNISNTVNNITNGGGGIKYFHANSTLADSSATGVDAVAIGGNAQATAANSVALGSNSTTTANLSAAGYNP

GTGTLSGIASAANGEVSVGAAGKERRVTNVAAGSAATDAVNVSQLQSEDAKVNTINNNVNNLSNNVSNIAGNVTNISNTVNNITNGG

GGIKYFHANSTLADSSATGTNSLAAGPAAVASATDAVALGNGAKATNAGAVALGAGSTTTTAVATSGTTIGGITYTFAGVAPSSTVS

VGAAGSERTITNVAAGRLSATSTDAVNGSELFATNQQVTRNTADITNLTNNMNIGSVGLVQQDATTRTITVAKATDGTRVDFTGTGG

ARQLTGVAAGAVNATSVDAVNGSQLYGVSQSVADAIGGGSTVNTDGSISAPTYVVDGTTVHNAGDAISNLDNRVTQNTTDISTINNT

LNSITTGAGVKYVHVNSTLADSLAKGAESVAIGGNAQSQAANSVALGSNSVADRANTVSVGAAGAERQITNVAAGTADTDAVNVAQL

KASGVINTDGTTNAAVTYDHNADGSANYNSVTMGNGVAGGTTIHNVAAGSAADDAVNVSQMNAAISSVSNIIGSAGNPLFTADGNRD

TEAAVASGTHATAMGANAKASAANSVALGANSVADRENTVSVGSAGNERQVTNVAAGTATTDAVNVGQLNQAIGASIGNLPAGMSAK

DYTDQQINAVQNGVNQVAKNAYAGIAAATALTMIPDVDQGKTIAVGVGGGSYKGSQAVALGISARITQNLKMKAGAGTSSQGTTVGL

GASYQW

Claims

1.一种多肽，其包含：(a)抗原性结构域；(b)寡聚结构域；和(c)跨膜结构域，其中，结构域(a)、(b)和(c)天然状况下未在同一多肽中一起发现。

2.如权利要求1所述的多肽，其特征在于，所述寡聚结构域使所述多肽形成三聚体。

3.如上述任一项权利要求所述的多肽，其特征在于，所述寡聚结构域是卷曲螺旋结构域。

4.如权利要求3所述的多肽，其特征在于，所述卷曲螺旋结构域来自细菌跨膜蛋白。

5.如权利要求4所述的多肽，其特征在于，所述跨膜蛋白是粘附素。

6.如权利要求5所述的多肽，其特征在于，所述粘附素是小肠结肠炎耶尔森菌粘附素YadA、脑膜炎奈瑟球菌粘附素NadA或粘膜炎莫拉菌表面蛋白UspA2。

7.如上述任一项权利要求所述的多肽，其特征在于，所述抗原性结构域来自细菌或病毒的表面抗原。

8.如权利要求7所述的多肽，其特征在于，所述抗原性结构域包含病毒融合蛋白的病毒外结构域。

9.如权利要求8所述的多肽，其特征在于，所述融合蛋白选自：逆转录病毒的Env蛋白；副粘病毒的F蛋白；埃博拉病毒的Gp蛋白；流感病毒的血凝素蛋白；冠状病毒的刺突蛋白；狂犬病病毒糖蛋白(RVG)；虫媒病毒的融合蛋白；披膜病毒科的融合蛋白；黄病毒科的融合蛋白；甲病毒的融合蛋白；登革病毒的E蛋白；丙肝病毒的E蛋白；黄热病毒的E蛋白；日本脑炎病毒的E蛋白；西尼罗病毒的E蛋白；蜱传脑炎(TBE)病毒的E蛋白；麻疹病毒的融合蛋白；塞姆利基森林病毒的E1刺突蛋白；本扬病毒科的融合蛋白；和沙粒病毒科的融合蛋白。

10.如权利要求9所述的多肽，其特征在于，所述融合蛋白是HIV包膜蛋白。

11.如权利要求9所述的多肽，其特征在于，所述抗原性结构域来自所述融合多肽的N-末端切割产物。

12.如权利要求7所述的多肽，其特征在于，所述抗原性结构域来自选自下组的细菌的表面蛋白：脑膜炎奈瑟球菌；淋病奈瑟球菌；肺炎链球菌；酿脓链球菌；无乳链球菌；金黄色葡萄球菌；流感嗜血菌；粘膜炎莫拉菌；幽门螺杆菌；砂眼衣原体；和肺炎衣原体。

13.如上述任一项权利要求所述的多肽，其特征在于，所述跨膜结构域来自细菌跨膜蛋白。

14.如上述任一项权利要求所述的多肽，其特征在于，所述结构域(b)和(c)来自同种蛋白质。

15.如上述任一项权利要求所述的多肽，其特征在于，至少(a)、(b)和(c)之一具有真核来源，至少(a)、(b)和(c)中的另一具有原核来源。

16.如权利要求14所述的多肽，其特征在于，所述结构域(c)来自原核生物，结构域(a)来自真核病毒。

17.一种多肽，其包含：(a)来自包膜真核病毒病毒融合蛋白的抗原性结构域；(b)来自细菌粘附素的卷曲螺旋结构域；和(c)来自与(b)相同细菌粘附素的跨膜结构域。

18.一种具有式NH₂-A-B-C-D-E-F-G-H-COOH的多肽，式中，A是任选前导序列；B是任选的接头序列；C是抗原性序列；D是任选的接头序列；E是卷曲螺旋序列；F是任选的接头序列；G是跨膜序列；和H是任选的胞质尾区。

19.一种编码上述任一项权利要求所述多肽的核酸。

20.一种寡聚蛋白质，其包含如权利要求2-18中任一项所述的寡聚多肽。

21.如权利要求20所述的寡聚蛋白质，其为三聚体。

22.一种宿主细胞，其特征在于，所述宿主细胞在其表面表达如权利要求1-18中任一项所述的多肽。

23.如权利要求22所述的宿主细胞，其特征在于，所述细胞选自：大肠杆菌、枯草芽孢杆菌、霍乱弧菌、伤寒沙门菌、鼠伤寒沙门菌、乳糖奈瑟球菌、灰色奈瑟球菌、分枝杆菌属、志贺菌属、小肠结肠炎耶尔森菌和单核细胞增生利斯特菌。

24.一种衍生自如权利要求22或23所述宿主细胞的膜制品。

25.一种药物组合物，其含有如权利要求1-18中任一项所述的多肽，如权利要求19所述的核酸，如权利要求20或21所述的蛋白质，如权利要求22或23所述的宿主细胞，或如权利要求24所述的膜制品。

26.一种提高哺乳动物免疫应答的方法，其包括给予该哺乳动物有效量的如权利要求25所述组合物的步骤。