CN1824675A

CN1824675A - 奈瑟球菌抗原

Info

Publication number: CN1824675A
Application number: CNA2005101133957A
Authority: CN
Inventors: V·马斯格阿尼; R·拉普奥利; M·皮扎; V·斯卡拉托; G·格兰迪
Original assignee: Chiron SRL
Current assignee: GSK Vaccines SRL
Priority date: 1997-11-06
Filing date: 1998-10-09
Publication date: 2006-08-30
Anticipated expiration: 2018-10-09
Also published as: GB9723516D0; CN1824675B

Abstract

本发明提供了脑膜炎奈瑟球菌(菌株A和B)以及淋病奈瑟球菌的蛋白，包括氨基酸序列、对应的核苷酸序列、表达数据以及血清学数据。该蛋白是有用的抗原，可用作疫苗、免疫原性组合物和/或诊断试剂。

Description

奈瑟球菌抗原

本申请是申请日为1998年10月9日、申请号为CN98812844.6、发明名称为“奈瑟球菌抗原”的中国专利申请的分案申请。

技术领域

本发明涉及奈瑟球菌属细菌。

背景技术

脑膜炎奈瑟球菌(Neisseria meningitidis)和淋病奈瑟球菌(Neisseria gonrrhoeae)是不能动的人致病性革兰阴性双球菌。脑膜炎奈瑟球菌群集在咽喉处，并引起脑膜炎(有时没有脑膜炎而是败血病)；淋病奈瑟球菌群集在生殖道并引起淋病。尽管这两种病原体群集在身体不同的区域并引起完全不同的疾病，但它们却是密切相关的，然而脑膜炎球菌与淋球菌明显不同的一个特征是所有病原性脑膜炎双球菌中存在多糖荚膜。

在1983-1990年期间，单单在美国，淋病奈瑟球菌每年就引起约800000起病例(Meitzner和Cohen，″抗淋球菌感染的疫苗″章节，在New Generation Vaccines，第2版，Levine，Woodrow，Kaper和Cobon，Marcel Dekker编辑，New York，1997，817-842页)。该疾病引起的发病率很高，但死亡率有限。非常希望对淋病奈瑟球菌进行疫苗接种，但反复尝试没有成功。该疫苗的主要候选抗原是表面外露蛋白如菌毛、孔蛋白、与不透明相关的蛋白(Opas)以及其它外露蛋白如Lip、Laz、IgA1蛋白酶以及运铁蛋白结合蛋白。也有人提议用脂寡糖(LOS)作为疫苗(Meitzner和Cohen，同上)。

脑膜炎奈瑟球菌会引起地方性和流行性疾病。在美国，其发病率为每年每100000人有0.6-1人，爆发时可以高得多(见Lieberman等人，(1996)″血清型A/C脑膜炎奈瑟球菌寡糖-蛋白偶联物疫苗在幼儿中的安全性和免疫原性″，JAMA 275(19)：1499-1503；Schuchat等人(1997)“1995年美国的细菌性脑膜炎”，N Engl J Med 337(14)：970-976)。在发展中国家，地方性疾病率要高得多，在流行时，发病率可高达每年每100000人有500起。该病的死亡率在美国很高，为10-20％，在发展中国家则要高得多。在引入了抗流感嗜血菌的偶联物疫苗后，脑膜炎奈瑟球菌是引起美国所有年龄人群中细菌性脑膜炎的主要原因(Schuchat等人(1997)同上)。

根据生物的荚膜多糖，已经鉴定出12种脑膜炎奈瑟球菌的血清型。A型是亚撒哈拉-非洲地区流行病中最常见的病原体。B型和C型血清型菌是导致美国以及大多数发达国家内的大多数病例的原因。W135和Y型血清型菌是导致美国和发达国家的其余病例的原因。目前使用的脑膜炎球菌是由血清型A、C、Y和W135组成的四价多糖疫苗。尽管其在青年和成人中有效，但是它诱导了差的免疫应答和短期的保护作用，并且不能用于婴儿[例如，见发病率和死亡率每周报道，46卷，PR-5(1997)]这是因为多糖是T细胞非依赖型抗原，其诱导的弱免疫应答不能通过重复免疫来加强。在流感嗜血菌的疫苗接种成功后，已经开发出了针对血清型A和C的偶联疫苗，现在是临床测试的最终阶段(Zollinger WD″新的和改进的抗脑膜炎球菌疾病疫苗″，在：New Generation Vaccines中，同上，469-488页；Lieberman等人(1996)同上；Costantino等人(1992)“抗脑膜炎球菌A和C的偶联疫苗的开发和I期临床测试”，Vaccine，10：691-698)。

然而，脑膜炎球菌B仍是一个问题。此血清型目前在美国、欧洲和南美州引起的病例约占总脑膜炎的50％。不能采用多糖方法，因为menB荚膜多糖是α(2-8)-相连的N-乙酰基神经氨酸的聚合物，它也存在于哺乳动物组织中。这导致了对抗原的耐受；实际上，如果引发免疫应答，则该免疫应答是抗自身的，因此是不希望的。为了避免引起自身免疫力并诱导保护性免疫应答，已经对该荚膜多糖进行化学修饰，例如用N-丙酰基代替N-乙酰基，而不改变特异性抗原性(Romero和Outschoorn(1994)″B型脑膜炎球菌候选疫苗的目前状况：荚膜或非荚膜？″Clin Microbiol Rev7(4)：595-575)。

menB疫苗的另一种方法采用外膜蛋白(OMP)的复合物混合物，它只含有OMP、或富集在膜孔蛋白中的OMP，或缺失4型OMP(认为它诱导了封闭杀菌活性的抗体)。该方法产生的疫苗的性质还未经完全地分析。它们能保护机体抵抗同源的菌株，但是当存在许多外膜蛋白的抗原性变体株时一般无效。为了克服抗原性差异，已经构建了含有高达9种不同膜孔蛋白的多价疫苗(例如，Poolman JT(1992)“脑膜炎球菌疫苗的发展”Infect.Agents Dis.4：13-28)。用于外膜疫苗的其它蛋白是opa和opc蛋白，但是这些方法均不能克服抗原性差异(例如Ala′Aldeen和Borriello(1996)″脑膜炎球菌运铁蛋白结合蛋白1和2均是外露的，并产生能杀伤同源和异源菌株的杀菌性抗体″Vaccine 14(1)：49-53)。

已可得到脑膜炎球菌和淋球菌的基因和蛋白的一定数量的序列信息(例如EP-A-0467714，WO96/29412)，但这决不完全的。提供进一步的信息，就有机会能鉴定出估计是免疫系统靶标且没有抗原性差异的分泌的或外露的蛋白。例如，一些已鉴定的蛋白可作为抗脑膜炎球菌B的有效疫苗的成分，一些可作为抗有所脑膜炎球菌血清型的疫苗的成分，其它可作为抗所有病原性奈瑟球菌的疫苗的成分。

发明内容

本发明提供了一些蛋白，该蛋白含有公开在实施例中的奈瑟球菌氨基酸序列。这些序列涉及脑膜炎奈瑟球菌或淋病奈瑟球菌。

本发明还提供了含有与实施例所公开的奈瑟球菌氨基酸序列同源(即具有序列相同性)的序列的蛋白。根据具体的序列，相同性的程度宜大于50％(例如65％、80％、90％或更高)。这些同源性蛋白包括实施例中公开的序列的突变体和等位基因变体。通常，认为两种蛋白之间有50％或更高的相同性表明功能等价。蛋白之间的相同性宜用在MRSRCH程序(Oxford Molecular)中执行的Smith-Watemen同源性搜寻算法来确定，采用仿射空隙搜寻，参数“空隙开口罚分(gap open penalty)”为12，“空隙延伸罚分(gapextension penalty)”为1。

本发明还提供了包含实施例所公开的奈瑟球菌氨基酸序列片段的蛋白。该片段应包含该序列中至少n个连续的氨基酸，根据具体的序列，n为7或更高(例如，8、10、12、14、16、18、20或更高)。该片段宜包含该序列的一个表位。

本发明的蛋白当然可用各种方法(例如重组表达、从细胞培养中纯化、化学合成等)制成各种形式(例如天然的、融合物等)。它们宜制成基本上纯的或分离的形式(即基本上不含其它奈瑟球菌或宿主细胞蛋白)。

另一方面，本发明提供了结合这些蛋白的抗体。它们可能是多克隆的或单克隆的，可用任何合适的方法制得。

还有一方面，本发明提供了包含实施例所公开的奈瑟球菌核苷酸序列的核酸。另外，本发明还提供了包含与实施例所公开的奈瑟球菌核苷酸序列同源(即具有序列相同性)的序列的核酸。

另外，本发明还提供了能与实施例中公开的奈瑟球菌核酸杂交(较佳的是在“高度严谨”条件(65℃，在0.1×SSC、0.5％ SDS溶液中)下杂交)的核酸。

本发明还提供了包含这些序列之片段的核酸。这些核酸应包含来自奈瑟球菌序列的至少n个连续的核苷酸，根据具体的序列，n为10或更高(例如，12、14、15、18、20、25、30、35、40或更高)。

还有一方面，本发明提供了编码本发明的蛋白和蛋白片段的核酸。

也应理解，本发明也提供了包含与上述那些序列互补的序列的核酸(例如用于反义或探针目的)。

当然，本发明的核酸可用各种方式(例如化学合成，从基因组或cDNA文库、或从生物体本身制得等)制得，并可采用各种形式(例如单链、双链、载体、探针等)。

另外，术语“核酸”包括DNA和RNA，以及它们的类似物，如含有修饰的骨架的那些，还包括肽核酸(PNA)等。

另一方面，本发明提供了含有本发明的核苷酸序列的载体(如表达载体)以及转化了这些载体的宿主细胞。

另一方面，本发明提供了包含本发明的蛋白、抗体和/核酸的组合物。例如，这些组合物适合用作疫苗，或作为诊断性试剂，或作为免疫原性组合物。

本发明还提供了本发明的核酸、蛋白或抗体用作药剂(例如作为疫苗)或作为诊断性试剂的应用。本发明还提供了本发明的核酸、蛋白或抗体在生产下列物质中的应用：(i)用于治疗或预防奈瑟球菌感染的药剂；(ii)用于检测奈瑟球菌或针对奈瑟球菌产生的抗体是否存在的诊断性试剂；和/或(iii)可产生针对奈瑟球菌的抗体的制剂。所述奈瑟球菌可以是任何种或菌株(例如淋病奈瑟球菌或脑膜炎奈瑟球菌的任何菌株如菌株A、菌株B或菌株C)。

本发明还提供了一种治疗患者的方法，该方法包括给予患者治疗有效量的本发明的核酸、蛋白和/或抗体。

还有一方面，本发明提供了以下各种方法。

本发明提供了一种生产本发明的蛋白的方法，该方法包括在诱导蛋白表达的条件下培育本发明的宿主细胞的步骤。

本发明提供了一种生产本发明的蛋白或核酸的方法，其中用化学手段部分或全部合成所述蛋白或核酸。

本发明提供了一种检测本发明的多核苷酸的方法，该方法包括下列步骤：(a)在杂交条件下使本发明的核酸探针与生物样品接触，形成双链体；和(b)检测所述双链体。

本发明提供了一种检测本发明的蛋白质的方法，该方法包括下列步骤：(a)在适合形成抗体-抗原复合物的条件下使本发明的抗体和生物样品接触；和(b)检测所述复合物。

下面归纳了为了实施本发明而采用的标准技术和方法(例如用公开的序列用于接种或诊断性目的)。这种归纳不是对本发明的限制，而是举例，这些例子可以采用，但是不要求一定用。

综述

除非另有描述，本发明的实施将采用分子生物学、微生物学、重组DNA和免疫学的常规技术，这些均是本领域技术人员所知的。这些技术在下列文献中有完整的描述：例如，Sambrook《分子克隆实验指南》第2版(1989)；《DNA克隆》第I和II卷(D.N.Glover编辑1985)；《寡核苷酸合成》(M.J.Gait编辑，1984)；《核酸杂交》(B.D.Hames和S.J.Higgins编辑.1984)；《转录和翻译》(B.D.Hames和S.J.Higgins编辑，1984)；《动物细胞培养》(R.I.Freshney编辑，1986)；《固定化细胞和酶》(IRL出版社，1986)；B.Perbal，《分子克隆实用指南》(1984)；《酶学方法》系列丛书(Academic Press，Inc.)，尤其是154和155卷；《哺乳动物细胞的基因转移载体》(J.H.Miller和M.P.Calos编辑，1987，Cold Spring Harbor Laboratory)；Mayer和Walker编辑(1987)，《细胞和分子生物学的免疫化学方法》(Academic Press，London)；Scopes，(1987)《蛋白质纯化：原理和实践》第2版(Springer-Verlag，N.Y.)，以及《实验免疫学手册》I-IV卷(D.C.Weir和C.C.Blackwell编辑1986)。

在本说明书中采用了核苷酸和氨基酸的标准缩写。

本文引用的所有出版物、专利和专利申请均纳入本文作参考。尤其是将英国专利申请9723516.2、9724190.5、9724386.9、9725158.1、9726147.3、9800759.4和9819016.8的内容纳入本文作为参考。

定义

当组合物中总X+Y重量的至少85％是X时，则称含有X的组合物“基本上没有Y”。较佳的，X占组合物中X+Y总重量的至少约90％，更佳至少约95％或者甚至99％(重量)。

术语“包含”指“包括”以及“由…组成”，例如组合物“包含”X可以是只由X组成，或可包括X以外的物质，例如X+Y。

术语“异源”指在自然界中发现不在一起的两种生物学组分。此组分可以是宿主细胞、基因、或调控区如启动子。尽管异源组分在自然界中发现不在一起，但是它们能一起起作用，例如当与基因异源的启动子与该基因操作性相连时。另一个例子是奈瑟球菌序列与小鼠宿主细胞异源。还有一个例子是相同或不同蛋白的两个表位装配到一个蛋白中，以自然界中未曾发现的排列方式排列。

“复制起点”是启动和调节多核苷酸(例如表达载体)复制的多核苷酸序列。复制起点可作为细胞内多核苷酸复制的自主性单位，能在其自身的控制下进行复制。复制起点是载体在特定宿主细胞中复制所需的。有了某一复制起点，表达载体就能在细胞中合适蛋白的存在下高拷贝数的复制。复制起点的例子是在酵母中有效的自主复制序列；以及在COS-7细胞中有效的病毒性T-抗原。

“突变体”序列定义成与天然或公开的序列不同但具有序列相同性的DNA、RNA或氨基酸序列。根据具体的序列，天然或公开的序列与突变体序列之间的序列相同性程度宜大于50％(例如60％、70％、80％、90％、95％、99％或更高，用上述Smith-Waterman算法计算出)。如本文所述，本文提供的核酸序列的核酸分子或区域的“等位基因变体”是在另一或第二个分离物的基因组中基本上相同的基因座上的核酸分子或区域，由于诸如突变或重组引起的自然变异，它们具有相似但不相同的核酸序列。编码区等位基因变体通常编码的蛋白具有与其比较基因所编码蛋白相似的活性。等位基因变体还可包含基因5′或3′非翻译区中的变化，例如在调控控制区中的变化(例如见美国专利5,753,235)。

表达系统

奈瑟球菌核苷酸序列可在各种不同的表达系统中表达；例如和哺乳动物细胞、杆状病毒、植物、细菌和酵母一起使用的那些系统。

i.哺乳动物系统

哺乳动物表达系统是本领域中已知的。哺乳动物启动子是能结合哺乳动物RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的任何DNA序列。启动子具有一个转录起始区，其通常邻近编码序列的5′端，还具有一个TATA盒，其通常位于转录起始位点上游25-30个碱基对(bp)处。认为TATA盒指导RNA聚合酶II在正确位点开始RNA合成。哺乳动物启动子还含有一个上游启动子元件，其通常位于TATA盒上游100至200bp内。该上游启动子元件决定了转录启动的速度，并可在两个方向之一上起作用[Sambrook等人(1989)“克隆基因在哺乳动物细胞中的表达”《分子克隆实验指南》，第2版]。

哺乳动物病毒基因通常是高表达的，具有宽的宿主范围；因此，编码哺乳动物病毒基因的序列提供了特别有用的启动子序列。例子包括SV40早期启动子、小鼠乳房肿瘤病毒LTR启动子、腺病毒主要晚期启动子(Ad MLP)以及单纯疱疹病毒启动子。另外，从非病毒基因(如鼠金属硫蛋白基因)衍生的序列也提供了有用的启动子序列。表达可以是组成型的或受调控的(诱导的)，这取决于该启动子能否在激素反应性细胞中用促糖皮质激素诱导。

增强元件(增强子)的存在，联合上述启动子元件通常会提高表达水平。增强子是这样一种调控性DNA序列，当其与同源或异源启动子相连，合成在正常的RNA起始位点开始时，它能刺激转录提高1000倍。当增强子位于转录起始位点的上游或下游，处于正常或翻转方向，或距离启动子1000个核苷酸以上的距离时，它均具有活性[Maniatis等人(1987)Science 236：1237；Alberts等人(1989)《细胞分子生物学》，第2版]。从病毒衍生获得的增强子元件可能是特别有用的，因为它们通常具有较宽的宿主范围。例子包括SV40早期基因增强子[Dijkema等人(1985)EMBO J.4：761]以及衍生自Rous肉瘤病毒的长末端重复序列(LTR)的增强子/启动子[Gorman等人(1982b)Proc.Natl.Acad.Sci.79：6777]以及来自人巨细胞病毒的增强子/启动子[Boshart等人(1985)Cell 41：521]。另外，一些增强子仅仅在诱导物(例如激素或金属离子)的存在下是可调节的并具有活性[Sassone-Corsi和Borelli(1986)Trends Genet.2：215；Maniatis等人(1987)Science 236：1237]。

DNA分子可在哺乳动物细胞中胞内表达。启动子序列可以和DNA分子直接相连，在这种情况下，重组蛋白的N端第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育来从蛋白上切下N端。

另外，外来蛋白也可从细胞中分泌到生长培养基中，方法是产生嵌合的DNA分子，该DNA分子编码的融合蛋白包括一前导序列片段，该片段在哺乳动物细胞中提供了外源蛋白的分泌。较佳的，在前导序列片段和外源基因之间可以有能在体内或体外断裂的加工位点。前导序列片段通常编码一种信号肽，该信号肽包含指导蛋白分泌出细胞的疏水性氨基酸。腺病毒三联前导序列是哺乳动物细胞中分泌外来蛋白的一个前导序列例子。

通常，哺乳动物细胞识别的转录终止和聚腺苷酸化序列是位于翻译终止密码子3′的调控区域，因此它和启动子元件一起连接在编码序列的侧面。成熟mRNA的3′端由定点的转录后断裂和聚腺苷酸化形成[Birnstiel等人(1985)Cell 41：349；Proudfoot和Whitelaw(1988)″真核RNA的终止和3′端加工″《转录和剪接》(B.D.Hames和D.M.Glover编辑)；Proudfoot(1989)Trends Biochem.Sci.14：105]。这些序列指导mRNA的转录，mRNA能被翻译成该DNA编码的多肽。转录终止子/聚腺苷酸化信号的例子包括从SV40获得的那些[Sambrook等人(1989)“克隆基因在培养的哺乳动物细胞中的表达”《分子克隆实验指南》]。

通常，上述组件，包括启动子、聚腺苷酸化信号以及转录终止序列被一起放在表达构建物中。如果需要，该表达构建物中还包括增强子、具有功能性剪接供体体和受体位点的内含子以及前导序列。表达构建物通常以复制子形式维持，例如是能在宿主(如哺乳动物细胞或细菌)中稳定维持的染色体外元件(如质粒)。哺乳动物复制系统包括从动物病毒衍生的那些系统，其需要反式作用因子来进行复制。例如，含有乳多空病毒复制系统的质粒，如SV40[Gluzman(1981)Cell 23：175]或多瘤病毒，在合适的病毒T抗原存在下复制出极高的拷贝数。哺乳动物复制子的其它例子包括衍生自牛乳头瘤病毒和EB病毒的复制子。另外，复制子可以有两个复制系统，从而使其能维持在例如哺乳动物细胞中进行表达并能在原核宿主中克隆和扩增。这些哺乳动物细菌穿梭载体的例子包括pMT2[Kaufman等人(1989)Mol.Cell.Biol.9：946]和pHEBO[Shimizu等人(1986)Mol.Cell.Biol.6：1074]。

所用的转化程序取决于待转化的宿主。将异源多核苷酸导入哺乳动物细胞中的方法是本领域所知的，其包括葡聚糖介导的转染、磷酸钙沉淀、Polybrene(1，5-二甲基-1，5-二氮十一亚甲基聚甲溴化物)介导的转染、原生质体融合、电穿孔、将多核苷酸包裹在脂质体中以及将DNA直接显微注射到胞核中。

可作为宿主进行表达的哺乳动物细胞系是本领域中已知的，其包括许多从美国典型培养物保藏中心(ATCC)获得的无限增殖细胞系，包括但不局限于，中国仓鼠卵巢(CHO)细胞、海拉细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人肝细胞癌细胞(如Hep G2)和其它许多细胞系。

ii.杆状病毒系统

编码蛋白质的多核苷酸也可插入合适的昆虫表达载体中，并与该载体中的控制元件操作性相连。载体构建采用本领域已知的技术。总地来说，表达系统的组分包括一种转移载体，通常是细菌质粒，其含有杆状病毒基因组片段以及便于插入待表达异源基因的限制性位点；野生型杆状病毒，其序列与转移载体中的杆状病毒特异性片段同源(这使得异源基因能同源重组到杆状病毒基因组中)；以及合适的昆虫宿主细胞和生长培养基。

在将编码蛋白质的DNA序列插入转移载体中后，将载体和野生型病毒基因组转染到昆虫宿主细胞中，使载体和病毒基因组重组。表达包装的重组病毒，鉴定并纯化重组噬斑。杆状病毒/昆虫细胞表达系统材料及其方法，除别的以外，可以试剂盒形式购自Invitrogen，San Diego CA(″MaxBac″试剂盒)。这些技术通常是本领域技术人员所知的，在Summers和Smith的Texas Agricultural Experiment Station Bulletin No.1555(1987)(后称“Summer和Smith的文章”)中有充分描述。

在将编码蛋白质的DNA序列插入杆状病毒基因组之前，通常将上述组件，包括启动子、前导序列(如果需要)、感兴趣的编码序列以及转录终止序列装配在中间置换型构建物(转移载体)中。该构建物可含有单个基因以及操作性相连的调控元件；多个基因，每个基因有其自己的操作性相连调控元件；或是由同一组调控元件调控的多个基因。中间置换型构建物通常保持在一个复制子中，例如能在宿主(如细菌)内稳定保持的染色体外元件(如质粒)。复制子将具有一个复制系统，从而使其能保持在合适的宿主中进行克隆和扩增。

目前，用来将外源基因导入AcNPV的最常用的转移载体是pAc373。还可设计本领域技术人员已知的其它许多载体。这些载体例如包括，pVL985(其将多角体蛋白的起始密码子从ATG变为ATT，在ATT下游32个碱基对处引入一个BamHI克隆位点；见Luckow和Summers，Virology(1989)17：31)。

质粒通常还含有多角体蛋白聚腺苷酸化信号(Miller等人(1988)Ann.Rev.Microbiol.，42：177)以及用来在大肠杆菌中选择和繁殖的原核氨苄青霉素抗性(amp)基因和复制起点。

杆状病毒转移载体通常含有杆状病毒启动子。杆状病毒启动子是能结合杆状病毒RNA聚合酶并启动下游(5′到3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，该区通常邻近编码序列的5′端。该转录起始区通常包括一个RNA聚合酶结合位点以及一个转录起始位点。杆状病毒转移载体还可能有称为增强子的第二个区，如果该区域存在，它通常在结构基因的远端。表达可以是调控的或组成型的。

在病毒感染周期晚期大量转录的结构基因提供特别有用的启动子序列。例子包括从编码病毒多角体蛋白的基因衍生获得的序列，Friesen等人(1986)“杆状病毒基因表达的调控”《杆状病毒分子生物学》(Walter Doerfler编辑)；EPO公开号127 839和155476；以及编码p10蛋白的基因，Vlak等人(1988)，J.Gen.Virol.69：765。

编码合适的信号序列的DNA可以衍生自分泌的昆虫或杆状病毒蛋白(如杆状病毒多角体蛋白基因)的基因(Carbonell等人，(1988)Gene，73：409)。另外，由于哺乳动物细胞翻译后修饰的信号(如信号肽断裂、蛋白水解断裂和磷酸化)看来可被昆虫细胞识别，且分泌和胞核积累所需的信号看来在非脊椎动物细胞和脊椎动物细胞之间是保守的，因此也可用非昆虫来源的前导序列来提供昆虫中的分泌，这些前导序列例如是从编码人α-干扰素(Maeda等人(1985)，Nature 315：592)、人胃泌素释放的肽(Lebacq-Verheyden等人(1988)，Molec.Cell.Biol.8：3129)、人IL-2(Smith等人(1985)PNAS，82：8404)、小鼠IL-3(Miyajima等人(1987)Gene 58：273)和人葡糖脑苷脂酶(Martin等人(1988)DNA，7：99)的基因衍生获得的。

重组多肽或多蛋白可以在胞内表达，或如果它和合适的调控序列一起表达，它可被分泌。非融合的外源蛋白的良好的胞内表达理想的通常需要具有短前导序列的异源基因在ATG起始信号前有合适的翻译起始信号。如果需要，可通过和溴化氰体外培育来从成熟蛋白上切下N端甲硫氨酸。

另外，可通过产生嵌合的DNA分子将非天然分泌的重组聚蛋白或蛋白从昆虫细胞中分泌出来，该嵌合的DNA分子所编码的融合蛋白包含一前导序列片段，该片段提供了昆虫中分泌外源蛋白的作用。该前导序列片段通常编码一种信号肽，该信号肽包含的疏水性氨基酸指导蛋白质转移到内质网中。

在插入了编码该蛋白表达产物前体的DNA序列和/或基因后，用转移载体的异源DNA和野生型杆状病毒的基因组DNA共同转化(通常是共转染)昆虫细胞宿主。构建物的启动子和转录终止序列通常包含2-5kb的杆状病毒基因组片段。将异源DNA引入杆状病毒中所需位点内的方法是本领域所知的。(见Summers和Smith的文章，同上；Ju等人(1987)；Smith等人，Mol.Cell.Biol.(1983)3：2156；和Luckow和Summers(1989))。例如，插入可以是通过同源双交换重组来插入基因如多角体蛋白基因中；插入还可以是插入工程改造入所需杆状病毒基因内的限制性酶切位点中。Miller等人(1989)，Bioessays 4：91。当DNA序列被克隆在表达载体多角体蛋白基因位置中后，其5′和3′均侧接了多角体蛋白特异性序列，并位于多角体蛋白启动子的下游。

随后将新形成的杆状病毒表达载体包装到感染性重组杆状病毒中。发生同源重组的频率很低(在约1％和5％之间)；因此，共转染后产生的大多数病毒仍是野生型病毒。因此，需要用一种方法来鉴别重组病毒。该表达系统的一个优点是视觉筛选能区分重组病毒。在病毒感染后期，天然病毒产生的多角体蛋白在受其感染细胞的胞核中产生的水平非常高。累积的多角体蛋白形成的包涵体还含有包埋颗粒。这些包涵体的大小为15微米，它们具有高度的折光性，从而使它们呈现了明亮的发光的外观，在光学显微镜下很容易观察。感染了重组病毒的细胞缺少包涵体。为了区分重组病毒和野生型病毒，用本领域已知的技术将转染上清接种到单层昆虫细胞上形成噬斑。即，在光学显微镜下筛选存在(表明是野生型病毒)或不存在(表明是重组病毒)包涵体的噬斑。“当代微生物学方法”第2卷(Ausubel等人编辑)，16.8(增补10，1990)；Summers和Smith，同上；Miller等人(1989)。

已经开发出感染进入几种昆虫细胞的重组杆状病毒表达载体。例如，已经开发出用于感染以下昆虫的细胞的重组杆状病毒：埃及伊蚊、苜蓿丫纹夜蛾、家蚕、黑尾果蝇、草地夜蛾和粉纹夜蛾(WO 89/046699；Carbonell等人(1985)J.Virol.56：153；Wright(1986)Nature 321：718；Smith等人(1983)Mol.Cell.Biol.3：2156；综述见Fraser等人(1989)Vitro Cell.Dev.Biol.25：225)。

可以购得细胞和细胞培养基用于在杆状病毒/表达系统中直接表达和融合表达异源多肽；细胞培养技术是本领域技术人员通常所知的。例如见Summers和Smith，同上。

然后，经修饰的昆虫细胞可以生长在合适的营养培养基中，该培养基能稳定地保持该质粒于修饰的昆虫宿主中。当表达产物基因处于可诱导的控制下时，可以使宿主生长至高密度，并诱导表达。另外，当表达是组成型表达时，产物将被连续表达到培养基中，营养性培养基必需不断循环，同时取出感兴趣的产物并补充消耗的营养物。产物可用以下这些技术来纯化：例如层析，如HPLC、亲和层析、离子交换层析等；电泳；密度梯度离心；溶剂抽提等。产物可按需作进一步纯化，以基本上除去所有也分泌到培养基中或由昆虫细胞裂解而产生的昆虫蛋白，以提供一种至少基本上不含宿主碎片如蛋白质、脂质和多糖的产物。

为了进行蛋白质表达，将从转化子衍生获得的重组宿主细胞培育在允许重组蛋白的编码序列表达的条件下。这些条件将随所选定的宿主细胞而变。然而，本领域技术人员容易根据本领域已知的知识来确定该条件。

iii.植物系统

本领域中已知有许多植物细胞培养系统和全植物遗传表达系统。典型的植物细胞基因表达系统包括在以下专利中描述的那些，例如：US 5,693,506；US 5,659,122；和US5,608,143。Zenk，Phytochemistry 30：3861-3863(1991)中描述了在植物细胞培养物中遗传表达的其它例子。除上述参考文献外，关于植物蛋白信号肽的描述还可在下列文献中找到：Vaulcombe等人，Mol.Gen.Genet.209：33-40(1987)；Chandler等人，PlantMolecular Biology 3：407-418(1984)；Rogers，J.Biol.Chem.260：3731-3738(1985)；Rothstein等人，Gene 55：353-356(1987)；Whittier等人，Nucleic Acids Research15：2515-2535(1987)；Wirsel等人，Molecular Microbiology 3：3-14(1989)；Yu等人，Gene 122：247-253(1992)。关于用植物激素、赤霉素酸和赤霉素酸诱导分泌的酶调节植物基因表达的描述可在R.L.Jones和J.MacMillin，Gibberellins，《植物生理学进展》，Malcolm B.Wilkins编辑，1984 Pitman Publishing Limited，London，21-52页中找到。描述其它调节代谢的基因的参考文献参见：Sheen，Plant Cell，2：1027-1038(1990)；Maas等人，EMBO J.9：3447-3452(1990)；Benkel和Hickey，Proc.Natl.Acad.Sci.84：1337-1339(1987)。

通常，利用本领域已知的技术，将所需的多核苷酸序列插入一表达盒中，该表达盒含有为在植物中操作而设计的基因调控元件。将该表达盒插入所需的表达载体中，表达盒的上游和下游有适合在植物宿主中表达的伴随序列。该伴随序列可来自质粒或病毒，并为载体提供所需的性质，以允许载体将DNA从起初的克隆宿主(如细菌)中移动到所需植物宿主中。基础的细菌/植物载体构建物最好能提供宽的宿主范围原核复制起点；原核可选择标记；以及，对于农杆菌转化而言，宜提供T DNA序列用于农杆菌介导转移至植物染色体。当异源基因不易检测时，该构建物最好还具有一个适用于确定植物细胞是否已经转化的可选择标记基因。关于合适标记(例如对于禾草类家族成员)的综述可在Wilmink和Dons，1993，Plant Mol.Biol.Reptr，11(2)：165-185中找到。

还建议采用合适将异源序列整合到植物基因组中的序列。这些序列可能包括用于同源重组的转座子序列以及允许将异源表达盒随机插入植物基因组中的Ti序列。合适的原核可选择标记包括抗生素(如氨苄青霉素或四环素)抗性标记。编码其它功能的其它DNA序列也可存在于载体中，这是本领域所知的。

本发明的核酸分子可包括在一个表达盒中来表达感兴趣的蛋白质。通常只有一个表达盒，但是两个或多个表达盒也是可行的。除了编码异源蛋白的序列外，重组表达盒还含有下列元件：启动子区域、植物5′非翻译序列、起始密码子(根据结构基因原来是否具有而定)、以及转录和翻译终止序列。表达盒5′和3′端的独特限制性酶位点能使表达盒方便地插入预先存在的载体中。

异源编码序列可以用于任何与本发明有关的蛋白。编码感兴趣的蛋白的序列将编码出一个信号肽，该信号肽能适当地加工和转运蛋白质，并且通常缺少可能会导致本发明的所需蛋白与膜结合的序列。由于对于大部分来说，转录起始区将针对发芽期间表达和转运的基因，采用提供转运的信号肽，也可提供转运感兴趣的蛋白质。通过这种方式，感兴趣的蛋白将从表达该蛋白的细胞中转运出来，并能被有效地收获。通常，种子中的分泌是通过糊粉或小盾体上皮层进入种子的胚乳。尽管不需要使蛋白从产生该蛋白的细胞中分泌出来，但是这种分泌有利于重组蛋白的分离和纯化。

由于所需基因产物的最终表达将在真核细胞中进行，因此需要确定克隆的基因部分是否含有作为内含子被宿主剪接体机制加工的序列。如果是这样，需要对“内含子”区进行定点诱变，以防止一部分遗传信息作为错误的内含子密码而丧失，Reed和Maniatis，Cell 41：95-105，1985。

可用微量移液管以机械方式转移重组DNA，将载体直接显微注射到植物细胞中。Crossway，Mol.Gen.Genet，202：179-185。还可用聚乙二醇将遗传物质转移到植物细胞中，Krens等人，Nature，296，72-74，1982。导入核酸片段的另一种方法是用小颗粒进行高速弹道贯穿，在这些小珠或颗粒的基质中或表面上带有核酸，Klein等人，Nature，327，70-73，1987，Knudsen和Muller，1991，Planta，185：330-336提出用颗粒轰击大麦胚乳以产生转基因大麦。还有一种导入方法是使原生质体和其它实体(微细胞(minicell)、细胞、溶酶体或其它可融合的脂质表面体)融合，Fraley等人，Proc.Natl.Acad.Sci.USA，79，1859-1863，1982。

载体也可通过电穿孔导入植物细胞中。(Fromm等人，PNAS 82：5824，1958)。在该技术中，在含有基因构建物的质粒存在下电穿孔植物原生质体。高电场强度的电脉冲使生物膜可逆地被通透，从而允许导入质粒。电穿孔的植物原生质体改造了细胞壁，分裂并形成植物胼胝体。

本发明可转化所有的植物，从中能分离出原生质体并能培育成全再生植物，从而回收得到含有转基因的全植物。已经知道实际上可以从培育的细胞或组织再生所有的全植物，其包括但不局限于，甘蔗、甜菜、棉花、果实和其它树、豆科植物和蔬菜的所有主要种类。一些合适的植物包括，例如，草莓属、莲花属、苜蓿属、驴食豆属、三叶草属、胡卢巴属、豇豆属、柑橘属、亚麻属、老鹳草属、Manihot、Daucus、鼠耳芥属、芸苔属、萝卜属、白芥属、颠茄属、辣椒属、曼陀罗属、天仙子属、番茄属、烟草属、茄属、碧冬茄属、毛地黄属、Majorana、菊苣属、向日葵属、莴苣属、雀麦属、天门冬属、金鱼草属、龙骨角属、Nemesia、天竺葵属、稷属、狼尾草属、毛茛属、千里光属、Salpiglossis、香瓜属、Browaalia、大豆属、黑麦草属、玉蜀黍属、小麦、蜀黍属和曼陀罗属各种类。

各种植物的再生方式是不同的，但是通常是首先提供含有异源基因拷贝的转化的原生质体悬液。形成胼胝体组织，从胼胝体中诱生出枝条，随后是根。另外，从原生质体悬液可以诱生形成胚胎。这些胚胎象天然的胚胎那样发芽形成植物。培养基通常含有各种氨基酸和激素，如植物生长素和细胞分裂素。尤其是对于玉米和苜蓿属来说，在培养基中加入谷氨酸和脯氨酸也是很有利的。枝条和根通常同时发育。有效的再生取决于培养基、基因型以及培养史。如果控制了这三个变量，那么再生能完全再现和重复。

在一些植物细胞培养系统中，本发明所需的蛋白可能被排泄出来，或者蛋白可从全植物中提取出来。当本发明所需的蛋白被分泌到培养基中后，就可进行收集。或者，可以用机械方式破碎胚以及无胚-半种子或其它植物组织，以释放出分泌到细胞和组织之间的蛋白。将该混合物悬于缓冲液中，以提取可溶性蛋白。然后用常规的蛋白分离和纯化方法纯化重组蛋白。用常规方法调节时间、温度、pH、氧和体积等参数，以优化异源蛋白的表达和回收。

iv.细菌系统

细菌表达技术是本领域已知的。细菌启动子是能结合细菌RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，其通常位于编码序列的5′端附近。该转录起始区通常包括RNA聚合酶结合位点以及一个转录起始位点。细菌启动子可能还有第二个功能区域称为操纵子，它可能与毗邻的RNA合成开始的RNA聚合酶结合位点重叠。该操纵子允许(可诱导)对转录的负调节，因为基因阻遏蛋白可能结合操纵子并因而抑制特定基因的转录。在负调节元件(如操纵子)不存在时，可能发生组成型表达。另外，正调节可通过基因激活蛋白结合序列来实现，如果有的话，它通常邻近RNA聚合酶结合序列(5′)。基因激活蛋白的例子是分解代谢物激活剂蛋白(CAP)，它帮助启动大肠杆菌(E.coli)中的lac操纵子的转录[Raibaud等人(1984)Annu.Rev.Genet.18：173]。因此，表达调控可能是正作用或负作用，从而增强或减弱了转录。

编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括衍生自糖(如半乳糖、乳糖(lac)[Chang等人(1977)Nature 198：1056]和麦芽糖)代谢酶的启动子序列。其它例子包括衍生自生物合成酶(如色氨酸(trp))[Goeddel等人(1980)Nuc.AcidsRes.8：4057；Yelverton等人(1981)Nucl.Acids Res.9：731；美国专利4,738,921；EP-A-0036776和EP-A-0121775]的启动子序列。g-内酰胺酶(bla)启动子系统[Weissmann(1981)″干扰素的克隆和其它错误″《干扰素3》(I.Gresser编辑)]，λ嗜菌体PL[Shimatake等人(1981)Nature 292：128]和T5[美国专利4,689,406]启动子系统也提供了有用的启动子序列。

另外，非天然存在的合成的启动子也可象细菌启动子一样起作用。例如，一种细菌或嗜菌体启动子的转录激活序列可以和另一种细菌或嗜菌体启动子的操纵子序列连接在一起，形成合成的杂交启动子[美国专利4,551,433]。例如，tac启动子是杂合的trp-lac启动子，它由trp启动子以及受lac阻遏蛋白调节的lac操纵子序列组成[Amann等人(1983)Gene 25：167；de Boer等人，(1983)Proc.Natl.Acad.Sci.80：21]。另外，细菌启动子可包括非细菌来源但能结合细菌RNA聚合酶并启动转录的天然存在的启动子。天然存在的非细菌来源的启动子还能和相容的RNA聚合酶偶联在一起，从而在原核细胞中高水平地表达某些基因[Studier等人(1986)J.Mol.Biol.189：113；Tabor等人(1985)Proc.Natl.Acad.Sci.82：1074]。另外，杂合的启动子还可由嗜菌体启动子以及大肠杆菌操纵子区域组成(EPO A-0 267 851)。

除了有功能的启动子序列外，有效的核糖体结合位点对于外来基因在原核细胞中的表达也是有用的。在大肠杆菌中，核糖体结合位点称为Shine-Dalgarno(SD)序列，其包括起始密码子(ATG)以及在起始密码子上游3-11个核苷酸处的长度为3-9个核苷酸的序列[Shine等人(1975)Nature 254：34]。认为SD序列是通过SD序列和大肠杆菌16S rRNA的3′端碱基配对来促进mRNA与核糖体结合的[Steitz等人(1979)″信使RNA中的遗传信号和核苷酸序列″生物学调节和发育：基因表达″(编者R.F.Goldberger)]。为了表达具有弱的核糖体结合位点的原核基因和真核基因[Sambrook等人(1989)″克隆基因在大肠杆菌中的表达″《分子克隆实验指南》]。

DNA分子可以在胞内表达。启动子序列可以直接与DNA分子相连，在这种情况下，N端的第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育或通过和细菌甲硫氨酸N-端肽酶体内或体外培育，将N端的甲硫氨酸从蛋白质上切下(EPO-A-0 219 237)。

融合蛋白为直接表达提供了一种备选方案。通常，将编码内源细菌蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时，该构建物将提供这两个氨基酸序列的融合物。例如，λ噬菌体细胞基因可以和外源基因的5′端相连并在细菌中表达。所得融合蛋白宜保留一个酶(因子Xa)加工位点，以便将噬菌体蛋白与外源基因切开[Nagai等人(1984)Nature 309：810]。融合蛋白也可用lacZ[Jia等人(1987)Gene 60：197]，trpE[Allen等人(1987)J.Biotechnol.5：93；Makoff等人(1989)，J.Gen.Microbiol.135：11]以及Chey[EP-A-0-324 647]基因的序列组成。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成，该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点，以便将外源蛋白和遍在蛋白切开。通过这种方法，可以分离获得天然的外源蛋白[Miller等人(1989)Bio/Technology 7：698]。

另外，还可通过产生嵌合的DNA分子来将外源蛋白分泌出细胞，该嵌合的DNA分子编码的融合蛋白含有一个信号肽序列片段，该序列片段能使细菌中的外源蛋白分泌出来[美国专利4,336,336]。信号序列片段通常编码一个信号肽，该信号肽含有疏水性氨基酸，能指引蛋白分泌出细胞。蛋白质被分泌到生长培养基(革兰阳性菌)中或细胞内膜和外膜之间的周质间隙内(革兰阴性菌)。在编码的信号肽片段和外源基因之间宜具有能在体内或体外切割的加工位点。

编码合适信号序列的DNA可以从分泌性细菌蛋白的基因衍生获得，这些基因例如是大肠杆菌外膜蛋白基因(ompA)[Masui等人(1983)，《基因表达的实验操作》；Ghrayeb等人(1984)EMBO J.3：2437]以及大肠杆菌碱性磷酸酶信号序列(phoA)[Oka等人(1985)Proc.Natl.Acad.Sci.82：7212]。另一个例子是，可采用各种芽孢杆菌菌株的α淀粉酶基因的信号序列将异源蛋白分泌出枯草芽孢杆菌[Palva等人(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0 244 042]。

通常，细菌所识别的转录终止序列是位于翻译终止密码子3′的调控区，它和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录，而mRNA能被翻译成该DNA所编码的多肽。转录终止序列通常包括约50个核苷酸的DNA序列，该序列能形成帮助终止转录的茎环结构。例子包括衍生自具有强启动子的基因(如大肠杆菌中的trp基因以及其它生物合成的基因)的转录终止序列。

上述组件，包括启动子、信号序列(如果需要的)、感兴趣的编码序列以及转录终止序列通常一起被放在表达构建物中。表达构建物通常以复制子的形式维持，例如能在宿主(如细菌)中稳定维持的染色体外元件(如质粒)。复制子具有一个复制系统，从而允许其维持在原核宿主中或进行表达或进行克隆和扩增。另外，复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间，通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒，更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响，可以选择高拷贝数或低拷贝数的载体。

另外，表达构建物可以和一个整合载体一起整合入细菌基因组中。整合载体通常含有至少一个序列与细菌染色体同源，从而允许该载体整合。整合看来是载体和细菌染色体中的同源DNA之间重组引起的。例如，用不同芽孢杆菌菌株的DNA构建的整合载体整合到芽孢杆菌染色体中(EP-A-0 127 328)。整合载体还可包含噬菌体或转座子序列。

通常，染色体外以及整合的表达构建物均含有可选择的标记，以便选择已经转化的菌株。可选择标记可在细菌宿主中表达，其包括赋予细菌对药物(如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素)抗性的基因[Davies等人(1978)Annu.Rev.Microbiol.32：469]。可选择标记还可包括生物合成性基因，如在组氨酸、色氨酸以及亮氨酸生物合成途径中的那些基因。

另外，上述某些组件可以一起放在转化载体中。转化载体通常包含一个可选择标记，如上所述，该载体以复制子形式维持或发展成一个整合载体。

已经开发出了用于转化到许多细菌中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如，已经开发出了用于下列细菌的表达载体：枯草芽孢杆菌[Palva等人，(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0 036 259和EP-A-0 063 953；WO 84/04541]，大肠杆菌[Shimatake等人，(1981)Nature 292：128；Amann等人，(1985)Gene 40：183；Studier等人，(1986)J.Mol.Biol.189：113；EP-A-0 036 776，EP-A-0 136829和EP-A-0 136 907]，酪链球菌[Powell等人，(1988)Appl.Environ.Microbiol.54：655]；浅青紫链球菌[Powell等人，(1988)Appl.Environ.Microbiol.54：655]，浅青紫链霉菌[US patent 4,745,056].

将外源DNA导入细菌宿主的方法是本领域熟知的，通常包括用氯化钙或其它试剂(如二价阳离子和DMSO)处理对细菌进行转化。DNA还可通过电穿孔方法导入细菌细胞。转化程序通常因待转化的细菌种类而不同。例如参见[Masson等人，(1989)FEMS Microbiol.Lett.60：273；Palva等人，(1982)Proc.Natl.Acad.Sci.USA 79：5582；EP-A-0 036 259和EP-A-0 063 953；WO 84/04541，芽孢杆菌]，[Miller等人，(1988)Proc.Natl.Acad.Sci.85：856；Wang等人，(1990)J.Bacteriol.172：949，弯曲杆菌]，[Cohen等人，(1973)Proc.Natl.Acad.Sci.69：2110；Dower等人，(1988)Nucleic Acids Res.16：6127；Kushner(1978)″用ColE1-衍生的质粒转化大肠杆菌的改进的方法″GeneticEngineering：Proceedings of the International Symposium on Genetic Engineering(H.W.Boyer和S.Nicosia编辑)；Mandel等人，(1970)J.Mol.Biol.53：159；Taketo(1988)Biochim.Biophys.Acta 949：318；埃希氏菌]，[Chassy等人，(1987)FEMS Microbiol.Lett.44：173乳酸杆菌]；[Fiedler等人，(1988)Anal.Biochem 170：38，假单胞菌]；[Augustin等人，(1990)FEMS Microbiol.Lett.66：203，葡萄球菌]，[Barany等人，(1980)J.Bacteriol.144：698；Harlander(1987)″用电穿孔转化链球菌产乳酸微生物″Streptococcal Genetics(J.Ferretti和R.Curtiss III编辑)；Perry等人，(1981)Infect.Immun.32：1295；Powell等人，(1988)Appl.Environ.Microbiol.54：655；Somkuti等人，(1987)Proc.4th Evr.Cong.Biotechnology 1：412，链球菌]。

v.酵母表达

酵母表达系统也是本领域技术人员所知的。酵母启动子是能结合酵母RNA聚合酶并启动下游(3′)编码序列(如结构基因)转录成mRNA的DNA序列。启动子具有一个转录起始区，它通常位于编码序列的5′端附近。该转录起始区通常包括RNA聚合酶结合位点(″TATA″盒)以及一个转录起始位点。酵母启动子可能还有第二个功能区域称为上游激活序列(UAS)，如果存在的话，它通常在结构基因的远端。UAS能调节表达(可诱导)。在UAS不存在时，发生组成型表达。表达的调控可能是正作用或负作用的，从而增强或减弱了转录。

酵母是一种发酵生物体，具有活泼的代谢途径，因此编码代谢途径中的酶的序列提供了特别有用的启动子序列。例子包括醇脱氢酶(ADH)(EP-A-0 284 044)、烯醇酶、葡萄糖激酶、葡萄糖-6-磷酸异构酶、甘油醛-3-磷酸-脱氢酶(GAP或GAPDH)、己糖激酶、磷酸果糖激酶、3-磷酸甘油酸变位酶、以及丙酮酸激酶(PyK)(EPO-A-0 329 203)。编码酸性磷酸酶的酵母PHO5基因也提供了有用的启动子序列[Myanohara等人(1983)Proc.Natl.Acad.Sci.USA 80：1]。

另外，非天然存在的合成的启动子也可象酵母启动子一样起作用。例如，一种酵母启动子的UAS序列可以和另一种酵母启动子的转录激活区连接在一起，形成合成的杂合启动子。这种杂合启动子的例子包括与GAP转录激活区相连的ADH调控序列(美国专利No.4,876,197和4,880,734)。杂合启动子的其它例子包括由ADH2、GAL4、GAL10或PHO5基因的调控序列组成的启动子与糖酵解酶基因如GAP或PyK的转录激活区组合(EP-A-0 164 556)。另外，酵母启动子可包括非酵母来源但能结合酵母RNA聚合酶并启动转录的天然存在的启动子。这些启动子的例子包括，尤其是，[Cohen等人，(1980)Proc.Natl.Acad.Sci.USA 77：1078；Henikoff等人，(1981)Nature 283：835；Hollenberg等人，(1981)Curr.Topics Microbiol.Immunol.96：119；Hollenberg等人，(1979)″细菌抗生素抗性基因在酿酒酵母中的表达″Plasmids of Medical，Environmentaland Commercial Importance(K.N.Timmis和A.Puhler编辑)；Mercerau-Puigalon等人，(1980)Gene 11：163；Panthier等人，(1980)Curr.Genet.2：109]。

DNA分子可以在酵母菌胞内表达。启动子序列可以直接与DNA分子相连，在这种情况下，重组蛋白N端的第一个氨基酸始终是甲硫氨酸，其由ATG起始密码子编码。如果需要，可通过和溴化氰体外培育将N端的甲硫氨酸从蛋白质上切下。

象在哺乳动物、杆状病毒以及细菌表达系统中一样，融合蛋白为酵母表达系统提供了一种备选方案。通常，将编码内源酵母蛋白或其它稳定的蛋白之N端部分的DNA序列与异源编码序列的5′端融合。在表达时，该构建物将提供这两个氨基酸序列的融合物。例如，酵母或人超氧化物歧化酶(SOD)基因可以和外源基因5′端相连并在酵母中表达。两个氨基酸序列连接处的DNA序列可能编码或不编码可切割的位点。例如参见EP-A-0 196 056。另一个例子是遍在蛋白融合蛋白。这种融合蛋白由遍在蛋白区域组成，该区域宜保留一个酶(例如遍在蛋白特异性加工蛋白酶)加工位点，以便将外源蛋白和遍在蛋白切开。因此，通过这种方法，可以分离获得天然的外源蛋白(例如WO88/024066)。

另外，还可通过产生嵌合的DNA分子来将外源蛋白从细胞分泌到生长培养基中，该嵌合的DNA分子编码的融合蛋白含有一个前导序列片段，该前导序列片段能使酵母中的外源蛋白分泌出来。较佳的，在编码的前导片段和外来基因之间宜具有能在体内或体外切割的加工位点。该前导序列片段通常编码了含有疏水性氨基酸的信号肽，其指导蛋白从细胞分泌出来。

编码合适信号序列的DNA可以从分泌性酵母蛋白的基因衍生获得，这些基因例如有酵母转化酶基因(EP-A-0 012 873；JPO.62,096,086)以及A-因子基因(美国专利4,588,684)。另外，非酵母来源的前导序列(如干扰素前导序列)的存在也能提供分泌出酵母的作用(EP-A-0 060 057)。

较佳的一类分泌前导序列采用了酵母α-因子基因的片段，其含有″pre″信号序列和″pro″区。可采用的α因子片段的类型包括全长pre-pro α因子前导序列(约83个氨基酸残基)以及截短的α-因子前导序列(通常约25至50个氨基酸残基)(美国专利4,546,083和4,870,008；EP-A-0 324 274)。采用α-因子前导片段提供分泌作用的其它前导序列包括杂合的α-因子前导序列，其由第一个酵母的pre序列以及第二个酵母α因子的pro区域组成(例如见WO 89/02463)。

通常，被酵母识别的转录终止序列是位于翻译终止密码子3′的调控区，其和启动子一起侧接在编码序列的两侧。这些序列指导mRNA的转录，而mRNA能被翻译成该DNA所编码的多肽。转录终止序列和其它酵母识别的终止序列的例子例如是编码糖酵解酶的那些转录终止序列。

上述组件，包括启动子、信号序列(如果需要的)、感兴趣的编码序列以及转录终止序列，通常被一起放在表达构建物中。表达构建物通常以复制子的形式保持，例如能在宿主(如酵母或细菌)中稳定保持的染色体外元件(如质粒)。复制子可能具有两个复制系统，从而允许其能维持在例如酵母中进行表达，并能维持在原核宿主进行克隆和扩增。这些酵母-细菌穿梭载体的例子包括YEp24[Botstein等人(1979)Gene8：17-24]，pCL/1[Brake等人，(1984)Proc.Natl.Acad.Sci.USA 81：4642-4646]和YRp17[Stinchcomb等人(1982)J.Mol.Biol.158：157]。另外，复制子可以是高拷贝数或低拷贝数的质粒。高拷贝数质粒的拷贝数大致在约5至200之间，通常在约10至150之间。含有高拷贝数质粒的宿主宜含有至少约10个质粒，更佳的含有至少约20个质粒。根据载体以及外源蛋白对宿主的影响，可以选择高拷贝数或低拷贝数的载体。例如参见Brake等人，同上。

另外，表达构建物可以和一个整合载体一起整合入酵母基因组中。整合载体通常含有至少一个序列与酵母染色体同源，从而允许该载体整合，最好含有两个同源序列侧接该表达构建物。整合看来是载体和酵母染色体中同源DNA之间重组引起的[Orr-Weaver等人(1983)Methods in Enzymol.101：228-245]。通过选择合适的同源序列插入载体中，可以使整合载体针对酵母中某一特定的基因座。见Orr-Weaver等人，同上。可以整合入一个或多个表达构建物，这可能会影响重组蛋白产生的水平[Rine等人(1983)Proc.Natl.Acad.Sci.USA 80：6750]。载体中的染色体序列可以载体中的单个片段形式存在(从而导致整个载体的整合)，或是与染色体中的相邻片段同源的两个片段，这两个片段在载体中侧接在表达构建物两侧，从而导致仅仅表达构建物稳定地整合。

通常，染色体外以及整合的表达构建物均含有可选择的标记，以便选择已经转化的酵母菌株。可选择标记可包括能在酵母宿主中表达的生物合成基因(如ADE2、HIS4、LEU2、TRP1和ALG7以及G418抗性基因)，这些基因分别赋予酵母细胞对衣霉素以及G418的抗性。另外，合适的可选择标记还可能为酵母在毒性化合物(如金属)存在下提供生长能力。例如，CUP1的存在使酵母能在铜离子存在下生长[Butt等人，(1987)Microbiol，Rev.51：351]。

已经开发出了用于转化入许多酵母中的表达和转化载体(无论是染色体外复制子还是整合载体)。例如，已经开发出用于下列酵母菌的表达载体：白假丝酵母[Kurtz，等人，(1986)Mol.Cell.Biol.6：142]，麦芽糖念珠菌[Kunze，等人，(1985)J.BasicMicrobiol.25：141]，多形汉逊酵母[Gleeson，等人，(1986)J.Gen.Microbiol.132：3459；Roggenkamp等人，(1986)Mol.Gen.Genet.202：302]，脆壁克鲁维酵母[Das，等人，(1984)J.Bacteriol.158：1165]，乳酸克鲁维酵母[De Louvencourt等人，(1983)J.Bacteriol.154：737；Van den Berg等人，(1990)Bio/Technology 8：135]，季也蒙毕赤酵母[Kunze等人，(1985)J.Basic Microbiol.25：141]，巴斯德毕酵母[Cregg，等人，(1985)Mol.Cell.Biol.5：3376；美国专利No.4,837,148和4,929,555]，酿酒酵母[Hinnen等人，(1978)Proc.Natl.Acad.Sci.USA 75：1929；Ito等人，(1983)J.Bacteriol.153：163]，栗酒裂植酵母[Beach和Nurse(1981)Nature 300：706]，以及Yarrowia lipolytica[Davidow，等人，(1985)Curr.Genet 10：380471 Gaillardin，等人，(1985)Curr.Genet.10：49]。

将外源DNA导入酵母宿主的方法是本领域熟知的，通常包括用碱阳离子处理转化的原生质球或完整酵母细胞。转化程序通常因待转化的酵母种类而不同。例如参见，[Kurtz等人，(1986)Mol.Cell.Biol.6：142；Kunze等人，(1985)J.Basic Microbiol.25：141；假丝酵母]；[Gleeson等人，(1986)J.Gen.Microbiol.132：3459；Roggenkamp等人，(1986)Mol.Gen.Genet.202：302；汉逊酵母]；[Das等人，(1984)J.Bacteriol.158：1165；De Louvencourt等人，(1983)J.Bacteriol.154：1165；Van den Berg等人，(1990)Bio/Technology 8：135；克鲁维酵母]；[Cregg等人，(1985)Mol.Cell.Biol.5：3376；Kunze等人，(1985)J.Basic Microbiol.25：141；美国专利No.4,837,148和4,929,555；毕赤酵母]；[Hinnen等人，(1978)Proc.Natl.Acad.Sci.USA 75；1929；Ito等人，(1983)J.Bacteriol.153：163酿酒酵母]；[Beach和Nurse(1981)Nature 300：706；裂殖酵母]；[Davidow等人，(1985)Curr.Genet.10：39；Gaillardin等人，(1985)Curr.Genet.10：49；Yarrowia]。

抗体

本文所用的术语“抗体”指由至少一个抗体结合位点组成的一个或一组多肽。“抗体结合位点”是一个三维结合空间，其内表面形状和电荷分布与抗原表位的特征互补，从而使抗体与抗原结合。“抗体”例如包括，脊椎动物抗体、杂合抗体、嵌合抗体、人化抗体、经修饰的抗体、单价抗体、Fab蛋白以及单结构域抗体。

针对本发明蛋白的抗体可用于亲和层析、免疫试验以及区别/鉴定奈瑟球菌蛋白。

针对本发明蛋白的多克隆和单克隆抗体可用常规方法制得。通常，首先用蛋白来免疫合适的动物，较佳的是小鼠、大鼠、家兔或山羊。由于可获得的血清体积多，能获得标记的抗家兔和抗山羊抗体，因此对于制备多克隆抗血清来说，家兔和山羊是较佳的。免疫通常这样进行：将蛋白混合或乳化到盐水(较佳的是佐剂如Freund完全佐剂)中，然后肠胃外(通常是皮下或肌内)注射该混合物或乳剂。每次注射50-200微克的剂量就足够了。2-6周后用盐水(较佳的是用Freund不完全佐剂)配的蛋白质注射一次或多次以强化免疫。另外可以用本领域已知的方法进行体外免疫来产生抗体，从本发明的目的来看，认为其与体内免疫等效。将免疫后的动物血液抽取到玻璃或塑料容器中，25℃培育该血液1小时，然后4℃培育2-18小时，获得多克隆抗血清。离心(例如1000g 10分钟)回收血清。家兔每次取血可获得约20-50毫升。

用Kohler和Milstein的标准方法[Nature(1975)256：495-96]或其改进方法制得单克隆抗体。通常，如上所述对小鼠或大鼠免疫。然而，并非是对动物取血然后抽提血清，而是取出脾脏(以及任选地取出几个大的淋巴结)，将其分离成单细胞。如果需要，可将细胞悬液(在除去非特异性粘附的细胞后)加入包被了蛋白质抗原的板或孔中，对脾细胞进行筛选。表达抗原特异性的膜结合免疫球蛋白的B细胞结合到板上，不象悬液其它物质那样被洗去。然后使所得B细胞或所有解离的脾细胞与骨髓瘤细胞融合形成杂交瘤，培养在选择性培养基(如次黄嘌呤、氨基蝶呤胸苷培养基，“HAT”)中。通过有限稀释接种所得杂交瘤，并测定特异性结合免疫抗原(且不结合无关抗原)的抗体的产生。然后，体外(例如在组织培养瓶或中空纤维反应器中)或体内(如小鼠腹水中)培养所选的分泌单克隆抗体的杂交瘤。

如果需要，抗体(无论是多克隆还是单克隆抗体)可用常规技术来标记。合适的标记包括荧光团、发色团、放射活性原子(具体是³²P和¹²⁵I)、密电子试剂、酶、以及具有特异性结合配偶的配体。酶通常靠其活性来检测。例如，辣根过氧化物酶通常是检测其将3，3′，5，5′-四甲基联苯胺(TMB)转变成蓝色的能力，可用分光光度计定量测定。“特异性结合配偶”指能以高特异性结合配体分子的蛋白质，例如抗原以及对其有特异性的单克隆抗体。其它特异性结合配偶包括生物素和亲和素或链亲和素，IgG和蛋白A，以及本领域已知的许多受体-配体对。应理解，上述内容并非要将各种标记分成不同的类，因为同一标记可在几种不同的模型中起作用。例如，¹²⁵I可作为放射活性标记，或作为密电子试剂。HRP可作为酶或单抗的抗原。另外，一种物质可以和各种标记组合以获得所需的效果。例如，在实施本发明中，单抗和亲和素也需要标记，因此，可以用生物素标记单抗，并用标记了¹²⁵I的亲和素检测其存在，或用标记HRP的抗生物素单抗检测其存在。其它替换和可能性对于本领域普通技术人员来说是显而易见的，所以应认作等价物属于本发明的范围。

药物组合物

药物组合物可包含本发明的多肽、抗体或核酸。该药物组合物将包含治疗有效量的本发明的多肽、抗体或多核苷酸。

本文所用的术语“治疗有效量”指治疗剂治疗、缓解或预防目标疾病或状况的量，或是表现出可检测的治疗或预防效果的量。该效果例如可通过化学标记或抗原水平来检测。治疗效果也包括生理性症状的减少，例如体温降低。对于某一对象的精确有效的量取决于该对象的体型和健康状况、病症的性质和程度、以及选择给予的治疗剂和或治疗剂的组合。因此，预先指定准确的有效量是没用的。然而，对于某给定的状况而言，可以用常规实验来确定该有效量，临床医师是能够判断出来的。

为了本发明的目的，有效的剂量为给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。

药物组合物还可含有药学上可接受的载体。术语“药学上可接受的载体”指用于治疗剂(例如抗体、多肽、基因或其它治疗剂)给药的载体。该术语指这样一些药剂载体：它们本身不诱导产生对接受该组合物的个体有害的抗体，且给药后没有过分的毒性。合适的载体可能是大的、代谢缓慢的大分子，如蛋白质、多糖、聚乳酸(polylacticacid)、聚乙醇酸、氨基酸聚合物、氨基酸共聚物以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。

本文可用的药学上可接受的盐例如有：无机酸盐，如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等；以及有机酸的盐，如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。在Remington′sPharmaceutical Sciences(Mack Pub.Co.，N.J.1991)中可找到关于药学上可接受的赋形剂的充分讨论。

治疗性组合物中的药学上可接受的载体可含有液体，如水、盐水、甘油和乙醇。另外，这些载体中还可能存在辅助性的物质，如润湿剂或乳化剂、pH缓冲物质等。通常，可将治疗性组合物制成可注射剂，例如作为液体溶液或悬液；还可制成在注射前适合配入溶液或悬液中、液体载体的固体形式。脂质体也包括在药学上可接受的载体的定义中。

输药方法

一旦配成本发明的组合物，可将其直接给予对象。待治疗的对象可以是动物；尤其可以治疗人对象。

直接输送该组合物通常可通过皮下、腹膜内、静脉内或肌内注射或输送至组织间隙来实现。组合物也可输送至病灶区。其它给药方式包括口服和肺给药、栓剂和透皮或经皮肤应用(例如参见WO98/20734)、用针、基因枪或手持喷雾器(hypospray)。治疗剂量方案可以是单剂方案或多剂方案。

疫苗

本发明的疫苗可以是预后性的(即预防感染)或治疗性的(即在感染后治疗疾病)。

这些疫苗包含免疫性抗原、免疫原、多肽、蛋白或核酸，通常与“药学上可接受的载体”组合，这些载体包括本身不诱导产生对接受该组合物的个体有害的抗体的任何载体。合适的载体通常是大的、代谢缓慢的大分子，如蛋白质、多糖、聚乳酸、聚乙醇酸、氨基酸聚合物、氨基酸共聚物、脂质凝集物(如油滴或脂质体)以及无活性的病毒颗粒。这些载体是本领域普通技术人员所熟知的。另外，这些载体可作为免疫刺激剂(“佐剂”)。另外，抗原或免疫原可以和细菌类毒素(如白喉、破伤风、霍乱、幽门螺杆菌等病原体的类毒素)偶联。

增强组合物效果的较佳的佐剂包括但不局限于：(1)铝盐(alum)，如氢氧化铝、磷酸铝、硫酸铝等；(2)水包油的乳剂配方(有或没有其它特异性的免疫刺激剂，如胞壁酰肽(见下文)或细菌细胞壁成分)，例如，例(a)MF59^TM(WO 90/14837；《疫苗设计：亚基和佐剂方法》第10章，编者Powell和Newman，Plenum Press 1995)，其含有5％鲨烯、0.5％吐温80和0.5％Span 85(任选地含有不同量的MTP-PE(见下文)，虽然并不需要)，用微量流化器(如110Y型微量流化器(Microfluidics，Newton，MA))制成亚微米级颗粒；(b)SAF，其含有10％鲨烯、0.4％吐温80、5％普卢兰尼克(pluronic)嵌段聚合物L121以及thr-MDP(见下文)，微量流化成亚微米级乳剂或涡流振荡产生粒径较大的乳剂，和(c)Ribi^TM佐剂系统(RAS)(Ribi Immunochem，Hamilton，MT)，其含有2％鲨烯、0.2％吐温80以及取自单磷酰脂A(MPL)、二霉菌酸海藻糖酯(TDM)、和细胞壁骨架(CWS)的一种或多种细菌细胞壁组分，较佳的是MPL+CWS(Detox^TM)；(3)皂素佐剂，例如可采用Stimulon^TM(Cambridge Bioscience，Worcester，MA)或从其产生的颗粒，如ISCOM(免疫刺激性复合物)；(4)Freund完全佐剂(CFA)和Freund不完全佐剂(IFA)；(5)细胞因子，如白介素(如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12等)、干扰素(如γ干扰素)、巨噬细胞集落刺激因子(M-CFS)、肿瘤坏死因子(TNF)等；以及(6)作为免疫刺激剂来增强组合物效果的其它物质。Alum和MF59^TM是较佳的。

如上所述，胞壁酰肽包括但不局限于，N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP)、N-乙酰-去胞壁酰-L-丙氨酰-D-异谷氨酰胺(nor-MDP)、N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰氨酰基-L-丙氨酸-2-(1′-2′-二棕榈酰-sn-甘油-3-羟基磷酰氧)-乙胺(MTP-PE)等。

免疫原性组合物(如免疫用抗原/免疫原/多肽/蛋白质/核酸，药学上可接受的载体以及佐剂)通常含有稀释剂，如水，盐水，甘油，乙醇等。另外，辅助性物质，如润湿剂或乳化剂、pH缓冲物质等可存在于该赋形剂中。

通常，可将免疫原性组合物制成可注射剂，例如作为液体溶液或悬液；还可制成在注射前适合配入溶液或悬液、液体赋形剂的固体形式。该制剂还可乳化或包封在脂质体中，在上述药学上可接受的载体下增强佐剂效果。

用作疫苗的免疫原性组合物包含免疫学有效量的抗原性或免疫原性多肽，以及上述其它所需的组分。“免疫学有效量”指以单剂或连续剂一部分给予个体的量对治疗或预防是有效的。该用量根据所治疗个体的健康状况和生理状况、所治疗个体的类别(如非人灵长类等)、个体免疫系统合成抗体的能力、所需的保护程度、疫苗的配制、治疗医师对医疗状况的评估、及其它的相关因素而定。预计该用量将在相对较宽的范围内，可通过常规实验来确定。

传统方法是从肠胃外(皮下、肌内、或透皮/经皮肤(如WO98/20734))途径通过注射给予免疫原性组合物。适合其它给药方式的其它配方包括口服和肺制剂、栓剂和透皮应用。治疗剂量可以是单剂方案或多剂方案。疫苗可以结合其它免疫调节剂一起给予。

作为以蛋白质为基础的疫苗的备选方案是，可以采用DNA疫苗接种[例如，Robinson和Torres(1997)Seminars in Immunology 9：271-283；Donnelly等人(1997)Annu Rev.Immunol 15：617-648；见下文]。

基因输送载体

用于输送构建物的基因治疗载体可以口服或全身性给予，其中所述构建物包括本发明治疗剂的编码序列，将其输送至哺乳动物以便在哺乳动物体内表达。这些构建物可利用体内或活体外方式中的病毒或非病毒载体方法。这些编码序列的表达可用内源哺乳动物启动子或异源启动子诱导。编码序列的体内表达可以是组成型的或受调控的。

本发明包括能表达所涉及的核酸序列的基因输送载体。基因输送载体宜为病毒载体，更佳的是逆转录病毒、腺病毒、腺伴随病毒(AAV)、疱疹病毒或甲病毒载体。病毒载体还可以是星状病毒、冠状病毒、正粘病毒、乳多空病毒、副粘病毒、细小病毒、小核糖核酸病毒、痘病毒或披膜病毒的病毒载体。通常参见Jolly(1994)Cancer GeneTherapy 1：51-64；Kimura(1994)Human Gene Therapy 5：845-852；Connelly(1995)Human Gene Therapy 6：185-193；以及Kaplitt(1994)Nature Genetics 6：148-153。

逆转录病毒载体是本领域中熟知的，我们认为任何逆转录病毒基因治疗载体均可用于本发明，包括B、C和D型逆转录病毒、异嗜性逆转录病毒(例如NZB-X1、NZB-X2和NZB9-1(见O′Neill(1985)J.Virol.53：160)广食性逆转录病毒如MCF和MCF-MLV(见Kelly(1983)J.Virol 45：291)、泡沫病毒和慢病毒。见《RNA肿瘤病毒》第2版，ColdSpring Harbor Laboratory，1985。

逆转录病毒基因治疗载体的诸部分可从不同逆转录病毒衍生获得。例如，逆转录载体LTR可以从鼠肉瘤病毒衍生获得，tRNA结合位点可以从Rous肉瘤病毒衍生获得，包装信号从鼠白血病病毒获得，第二链的合成起点从禽类白血病病毒获得。

可将这些重组逆转录病毒导入合适的包装细胞系，用来产生转导感受态逆转录病毒载体颗粒(见美国专利5,591,624)。通过将嵌合性整合酶掺入逆转录病毒颗粒，构建逆转录病毒载体，以便将其定点整合到宿主细胞DNA中(见WO96/37626)。较佳的是重组病毒载体是复制缺陷型重组病毒。

适合与上述逆转录病毒载体一起使用的包装细胞系是本领域中熟知的，很容易制得(见WO95/30763和WO92/05266)，并能用来产生能生产重组载体颗粒的生产型细胞系(也称为载体细胞系或“VCL”)。包装细胞系宜从人亲代细胞(如HT1080细胞)或貂亲代细胞系制取，以便消除人血清的灭活作用。

用来构建逆转录病毒基因治疗载体的较佳的逆转录病毒包括禽类白血病病毒、牛白血病病毒、鼠白血病病毒、水貂细胞灶诱导病毒、鼠肉瘤病毒、网状内皮组织增殖病毒和Rous肉瘤病毒。特别佳的鼠白血病病毒包括4070A和1504A(Hartley和Rowe(1976)J Virol 19：19-25)，Abelson(ATCC No.VR-999)，Friend(ATCCNo.VR-245)，Graffi，Gross(ATCC Nol VR-590)，Kirsten，Harvey肉瘤病毒和Rauscher(ATCC No.VR-998)以及莫洛尼鼠白血病病毒(ATCC No.VR-190)。这些逆转录病毒可以从保藏机构或保藏中心如Rockville，Maryland的美国典型培养物保藏中心(ATCC)获得，或用常用的技术从已知来源分离获得。

可用于本发明的典型的已知逆转录病毒基因治疗载体包括在以下专利申请中描述的那些载体：GB2200651，EP0415731，EP0345242，EP0334301，WO89/02468；WO89/05349，WO89/09271，WO90/02806，WO90/07936，WO94/03622，WO93/25698，WO93/25234，WO93/11230，WO93/10218，WO91/02805，WO91/02825，WO95/07994，US 5,219,740，US 4,405,712，US 4,861,719，US 4,980,289，US 4,777,127，US 5,591,624.另见Vile(1993)Cancer Res 53：3860-3864；Vile(1993)Cancer Res 53：962-967；Ram(1993)Cancer Res 53(1993)83-88；Takamiya(1992)J Neurosci Res 33：493-503；Baba(1993)J Neurosurg 79：729-735；Mann(1983)Cell 33：153；Cane(1984)Proc Natl AcadSci 81：6349；以及Miller(1990)Human Gene Therapy 1。

人腺病毒基因治疗载体也是本领域中已知的，并可用于本发明。例如参见Berkner(1988)Biotechniques 6：616和Rosenfeld(1991)Science 252：431，以及WO93/07283，WO93/06223和WO93/07282。用于本发明的典型的已知的腺病毒基因治疗载体包括在上述文献以及下述专利中描述的那些例子：WO94/12649，WO93/03769，WO93/19191，WO94/28938，WO95/11984，WO95/00655，WO95/27071，WO95/29993，WO95/34671，WO96/05320，WO94/08026，WO94/11506，WO93/06223，WO94/24299，WO95/14102，WO95/24297，WO95/02697，WO94/28152，WO94/24299，WO95/09241，WO95/25807，WO95/05835，WO94/18922和WO95/09654。另外，可以采用Curiel(1992)Hum.Gene Ther.3：147-154中描述的给予和已杀死腺病毒相连的DNA的方法。本发明的基因输递载体还包括腺病毒伴随病毒(AAV)载体。用于本发明的这种载体的主要且较佳的例子是Srivastava，WO93/09239中公开的AAV-2为基的载体。最佳的AAV载体包含两个AAV反向末端重复序列，其中通过替换核苷酸对天然D-序列进行修饰，使至少5-18个天然的核苷酸(较佳的至少10-18个天然核苷酸，最佳的10个天然核苷酸)被保留下来，而D-序列其余的核苷酸缺失或被非天然核苷酸取代。AAV末端反向重复序列的天然D-序列是每个AAV反向末端重复序列中不参与HP形成的20个串联核苷酸的序列(即每一端有一个序列)。非天然的替换核苷酸可以是天然D-序列该位置中所见核苷酸除外的任何核苷酸。其它可采用典型AAV载体是pWP-19、pWN-1，两者均公开在Nahreini(1993)Gene 124：257-262中。这样的AAV的另一个例子是psub201(见Samulski(1987)J.Virol.61：3096)。另一个典型的AAV载体是Double-D ITR载体。Double-D ITR载体的构建方案公开在美国专利5,478,745中。还有其它的载体是公开在Carter的美国专利4,797,368和Muzyczka的美国专利5,139,941、Chartejee的美国专利5,474,935和Kotin的WO94/288157中的载体。可用于本发明的另一个AAV载体例子是SSV9AFABTKneo，它含有AFP增强子和白蛋白启动子，并且主要指导肝内表达。其结构和构建方案公开在Su(1996)Human Gene Therapy 7：463-470中。其它的AAV基因治疗载体在美国专利5,354,678，5,173,414，5,139,941，5,252,479中有所描述。

本发明的基因治疗载体还包括疱疹载体。主要且较佳的例子是含有编码胸苷激酶多肽的序列的单纯疱疹病毒载体，如公开在US5,288,641和EP0176170(Roizman)中的那些。其它典型的单纯疱疹病毒载体包括WO95/04139中公开的HFEM/ICP6-LacZ(Wistar Institute)、Geller(1988)Science 241：1667-1669以及WO90/09441和WO92/07945中公开的pHSVlac、Fink(1992)Human Gene Therapy3：11-19中描述的HSV Us3::pgC-lacZ、EP 0453242(Breakefield)中描述的HSV 7134、2RH 105和GAL4以及保藏于ATCC、保藏号为ATCC VR-977和ATCC VR-260的那些病毒。

还考虑到甲病毒基因基因治疗载体也可用于本发明。较佳的甲病毒载体是新培斯病毒载体。披膜病毒、Semliki Forest病毒(ATCC VR-67；ATCC VR-1247)、Middleberg病毒(ATCC VR-370)、Ross River病毒(ATCC VR-373；ATCC VR-1246)、委内瑞拉马脑炎病毒(ATCC VR923；ATCC VR-1250；ATCC VR-1249；ATCC VR-532)、以及在美国专利5,091,309，5,217,879以及WO92/10578中描述的那些。更具体地说，可以采用1995年3月15日提交的美国申请08/405,627、WO94/21792、WO92/10578、WO95/07994、US 5,091,309和US 5,217,879中描述的那些甲病毒载体。这些甲病毒可以从保藏机构或保藏中心如Rockville，Maryland的美国典型培养物保藏中心(ATCC)获得，或用常用的技术从已知来源分离获得。较佳的是，采用细胞毒性减少的甲病毒载体(见USSN 08/679640)。

DNA载体系统，如真核分层的(layered)表达系统也可用于表达本发明的核酸。关于真核分层的表达系统详见WO95/07994。较佳的，本发明的真核分层表达系统宜从甲病毒载体衍生获得，更佳的从新培斯病毒载体衍生获得。

适用于本发明的其它病毒载体包括：从脊髓灰质炎病毒衍生的病毒，例如ATCCVR-58以及在Evans，Nature 339(1989)385和Sabin(1973)J.Biol.Standardization 1：115中描述的那些；鼻病毒，例如ATCC VR-1110以及在Arnold(1990)J Cell Biochem L401中描述的那些；痘病毒，如金黄色痘病毒或牛痘病毒，例如ATCC VR-111和ATCCVR-2010，以及在Fisher-Hoch(1989)Proc Natl Acad Sci 86：317；Flexner(1989)Ann NYAcad Sci 569：86，Flexner(1990)Vaccine 8：17；US 4,603,112，US 4,769,330以及WO89/01973中描述的那些；SV40病毒，例如ATCC VR-305以及在Mulligan(1979)Nature 277：108和Madzak(1992)J Gen Virol 73：1533中描述的那些；流感病毒，例如ATCC VR-797以及用例如US 5,166,057和Enami(1990)Proc Natl Acad Sci87：3802-3805；Enami和Palese(1991)J Virol 65：2711-2713；Luytjes(1989)Cell 59：110中所述的反基因技术制得的重组流感病毒(另见McMichael(1983)NEJ Med 309：13，Yap(1978)Nature 273：238以及Nature(1979)277：108)；EP-0386882和Buchschacher(1992)J Virol.66：2731中描述的人免疫缺陷病毒；麻疹病毒，例如ATCC VR-67和VR-1247，以及EP-0440219中描述的那些；奥拉病毒，例如ATCC VR-368；Bebaru病毒，例如ATCC VR-600和ATCC VR-1240；Cabassou病毒，例如ATCC VR-922；屈曲病毒，例如ATCC VR-64和ATCC VR-1241；Fort Morgan病毒，例如ATCC VR-924；Getah病毒，例如ATCC VR-369和ATCC VR-1243；Kyzylagach病毒，例如ATCCVR-927；Mayaro病毒，例如ATCC VR-66；Mucambo病毒，例如ATCC VR-580和ATCC VR-1244；Ndumu病毒，例如ATCC VR-371；Pixuna病毒，例如ATCC VR-372和ATCC VR-1245；Tonate病毒，例如ATCC VR-925；Triniti病毒，例如ATCC VR-469；Una病毒，例如ATCC VR-374；Whataroa病毒，例如ATCC VR-926；Y-62-33病毒，例如ATCC VR-375；O′Nyong病毒，东部脑炎病毒，例如ATCC VR-65和ATCCVR-1242；西部脑炎病毒，例如ATCC VR-70，ATCC VR-1251，ATCC VR-622和ATCCVR-1252；和冠状病毒，例如ATCC VR-740和在Hamre(1966)Proc Soc Exp Biol Med121：190中描述的那些。

将本发明的组合物输送至细胞内并不局限于上述病毒载体。还可采用其它输送方法和介质，例如核酸表达载体、与已被杀死的腺病毒相连或不相连的单独的聚阳离子凝缩的DNA(例如参见1994年12月30日美国申请No.08/366,787和Curiel(1992)HumGene Ther 3：147-154)、配体连接的DNA(例如参见Wu(1989)J.Biol.Chem.264：16985-16987)、真核细胞输送载体细胞(例如参见1994年5月9日提交的美国申请No.08/240,030以及美国申请No.08/404,796)、光聚合水凝胶材料的沉淀、手提式基因转移颗粒枪(如美国专利5,149,655所述)、电离辐射(如US5,206,152和WO92/11033所述)、核电荷中和或与细胞膜融合。其它方法在Philip(1994)Mol CellBiol 14：2411-2418以及Woffendin(1994)Proc.Natl.Acad.Sci.91：1581-1585中有所描述。

可以采用颗粒介导的基因转移，例如参见美国申请No.60/023,867。简言之，可将序列插入含有控制高水平表达的常规序列的常规载体中，然后和合成性基因转移分子一起培育，这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白)，其与细胞寻靶配体(如脱唾液酸血清类粘蛋白(如Wu和Wu(1987)J.Biol.Chem.262：4429-4432所述)、胰岛素(如Hucked(1990)Biochem Pharmacol40：253-263所述)、半乳糖(如Plank(1992)Bioconjugate Chem 3：533-539所述)、乳糖或运铁蛋白)相连。

还可使用裸露的DNA。典型的裸露DNA导入方法在WO 90/11902和US5,580,859中有所描述。用可生物降解的乳胶珠可以改善摄取效果。在对珠粒的胞吞作用开始后，DNA包被的乳胶珠粒被有效地运输到细胞中。通过处理珠粒以提高其疏水性可进一步改进该方法，从而帮助破坏核内体和将DNA释放到细胞质中。

可作为基因输送载体的脂质体在US 5,422,120，WO95/13796，WO94/23697，WO91/14445和EP-524,968中有所描述。如USSN 60/023,867中所描述的，在非病毒输送时，可将编码多肽的核酸序列插入含有控制高水平表达的常规序列的常规载体中，然后和合成性基因转移分子一起培育，这些基因转移分子例如是聚合性DNA-结合阳离子(如聚赖氨酸、鱼精蛋白和白蛋白)，其与细胞寻靶配体(如脱唾液酸血清类粘蛋白、胰岛素、半乳糖、乳糖或运铁蛋白)相连。其它输送系统包括采用脂质体来包裹DNA，该DNA所含基因在各种组织特异性或活性普遍存在的启动子控制下。适用的其它非病毒输送系统包括机械输送系统，如Woffendin等人(1994)Proc.Natl.Acad.Sci.USA 91(24)：11581-11585中描述的方法。另外，该系统的编码序列和表达产物可以通过光聚合的水凝胶材料的沉淀来输送。可用来输送编码序列的其它基因输送常规方法例如包括，用手提式基因转移颗粒枪(如美国专利5,149,655所述)；用电离辐射来激活转移的基因(如US 5,206,152和WO92/11033所述)。

典型的脂质体和聚阳离子基因输送载体在下列文献中有所描述：US 5,422,120和4,762,915；WO 95/13796；WO94/23697；WO91/14445；EP-0524968；Stryer，Biochemistry，236-240页(1975)W.H.Freeman，San Francisco；Szoka(1980)BiochemBiophys Acta 600：1；Bayer(1979)Biochem Biophys Acta 550：464；Rivnay(1987)MethEnzymol 149：119；Wang(1987)Proc Natl Acad Sci 84：7851；Plant(1989)Anal Biochem176：420。

多核苷酸组合物可包含治疗有效量的基因治疗载体，其定义如上所述。出于本发明的目的，有效的剂量是给予个体约0.01毫克/千克至50毫克/千克或0.05毫克/千克至10毫克/千克的DNA构建物。

输送方法

一旦配制成后，本发明的多核苷酸组合物可以以下三种方式给予：(1)直接给予对象；(2)活体外输送至从对象衍生获得的细胞；或(3)体外表达重组蛋白。待处理的对象可以是哺乳动物或鸟类。另外，也可对人进行治疗。

活体外输送以及将转化的细胞重新植入对象体内的方法是本领域所熟知的，在例如WO93/14778中有所描述。用于活体外应用的细胞例子包括例如干细胞、尤其是造血细胞、淋巴细胞、巨噬细胞、树突细胞或肿瘤细胞。

通常，对于活体外和体外应用，核酸的输送可通过以下步骤来实现，例如有葡聚糖介导的转染、磷酸钙沉淀、Polybrene介导的转染、原生质体融合、电穿孔、将多核苷酸包囊在脂质体中以及将DNA直接显微注射到胞核中，所有这些均是本领域所熟知的。

多核苷酸和多肽药物组合物

除了上述的药学上可接受的载体和盐外，多核苷酸和多肽组合物中还可采用下列附加试剂。

A.多肽

一个例子是多肽，其包括但不局限于：脱唾液酸血清类粘蛋白(ASOR)；运铁蛋白；脱唾液酸糖蛋白；抗体；抗体片段；铁蛋白；白介素；干扰素；粒细胞-巨噬细胞集落刺激因子(GM-CSF)；粒细胞集落刺激因子(G-CSF)、巨噬细胞集落刺激因子(M-CSF)、干细胞因子和促红细胞生成素。还可使用病毒抗原，如包膜蛋白。另外，可用来自其它侵袭性生物的蛋白，例如疟原虫恶性疟疾的环孢子蛋白的17个氨基酸的肽(称为RII)。

B.激素，维生素等

其它可包括的种类例如是：激素、类固醇、雄激素、雌激素、甲状腺激素或维生素、叶酸。

C.聚亚烷基、多糖等

另外，聚(亚烷基)二醇可以和所需的多核苷酸/多肽组合在一起。在一个较佳的实施方案中，聚(亚烷基)二醇是聚乙二醇。另外，可以加入单糖、二糖或多糖。在此方面的一个较佳实施方案中，多糖是葡聚糖或DEAE-葡聚糖。另外有脱乙酰壳多糖和聚交酯-聚乙醇酸内酯共聚物。

D.脂质和脂质体

所需的多核苷酸/多肽还可在输送给对象或对象衍生的细胞之前包裹在脂质中或包裹在脂质体中。

脂质包裹通常用能稳定结合或捕获并保留核酸的脂质体来实现。浓缩的多核苷酸与脂质制剂之比可以变化，但是通常在约1∶1(毫克DNA∶微摩尔脂质)之间，或脂质更多。关于脂质体作为输送核酸的载体的综述参见Hug和Sleight(1991)Biochim.Biophys.Acta.1097：1-17；Straubinger(1983)Meth.Enzymol.101：512-527。

用于本发明的脂质体制剂包括阳离子(带正电荷)、阴离子(带负电荷)和中性制剂。阳离子脂质体已经显示出能以有功能的形式介导质粒DNA的胞内输送(Felgner(1987)Proc.Natl.Acad.Sci.USA 84：7413-7416)；mRNA(Malone(1989)Proc.Natl.Acad.Sci.USA 86：6077-6081)；和纯化的转录因子(Debs(1990)J.Biol.Chem.265：10189-10192)。

阳离子脂质体很容易购得。例如，N[1-2，3-二油烯基氧)丙基]-N，N，N-三乙铵(DOMTA)脂质体可以Lipofectin的商品名从GIBCO BRL，Grand Island，NY购得。(另见Felgner，同上)。其它市售的脂质体包括transfectace(DDAB/DOPE)和DOTAP/DOPE(Boerhinger)。其它阳离子脂质体可用本领域熟知的方法从易购得的材料制得。例如参见，Szoka(1978)PNAS 75：4194-4198；WO90/11092关于DOTAP(1，2-二(油酰基氧)-3-(三甲基铵溶)丙烷)脂质体合成的描述。

同样，阴离子和中性脂质体也是容易获得的，例如购自Avanti PolarLipids(birmingham，AL)，或容易用易购得的材料制得。这种材料包括磷脂酰胆碱、胆固醇、磷脂酰乙醇胺、二油酰基磷脂酰胆碱(DOPC)、二油酰基磷脂酰甘油(DOPG)、二油酰基磷脂酰乙醇胺(DOPE)。这些材料还能以合适比例与DOTMA和DOTAP原料混合。用这些材料制备脂质体的方法是本领域熟知的。

脂质体可包含多层脂质体(MLV)，小的单层脂质体(SUV)、或大的单层脂质体(LUV)。各种脂质体-核酸复合物可用本领域已知的方法制得。例如参见Straubinger(1983)Meth.Immunol.101：512-527；Szoka(1978)Proc.Natl.Acad.Sci.USA75：4194-4198；Papahadjopoulos(1975)Biochim.Biophys.Acta 394：483；Wilson(1979)Cell 17：77)；Deamer和Bangham(1976)Biochim.Biophys.Acta 443：629；Ostro(1977)Biochem.Biophys.Res.Commun.76：836；Fraley(1979)Proc.Natl.Acad.Sci.USA76：3348)；Enoch和Strittmatter(1979)Proc.Natl.Acad.Sci.USA 76：145；Fraley(1980)J.Biol.Chem.(1980)255：10431；Szoka和Papahadjopoulos(1978)Proc.Natl.Acad.Sci.USA 75：145；以及Schaefer-Ridder(1982)Science 215：166。

E.脂蛋白

另外，脂蛋白也可加入待输送的多核苷酸/多肽中。采用的脂蛋白的例子包括：乳糜微粒、HDL、IDL、LDL和VLDL。还可采用这些蛋白的突变体、片段或融合物。另外，可采用天然存在的脂蛋白的修饰物，例如乙酰化的LDL。这些脂蛋白能使多核苷酸的输送指向表达脂蛋白受体的细胞。较佳的，如果待输送的多核苷酸中加入了脂蛋白，则组合物中不加入其它寻靶的配体。

天然存在的脂蛋白包含脂质和蛋白部分。蛋白部分称为脱辅基蛋白。目前，已经分离并鉴定出了脱辅基蛋白A、B、C、D和E。其中至少有两个含有几种蛋白，用罗马数字AI、AII、AIV；CI、CII、CIII命名。

脂蛋白可包含多个脱辅基蛋白。例如，天然存在的乳糜微粒包含A、B、C和E，随着时间的推移，这些脂蛋白失去A，得到C和E脱辅基蛋白。VLDL包含A、B、C、和E脱辅基蛋白，LDL包含脱辅基蛋白B；HDL包含脱辅基蛋白A、C和E。

这些脱辅基蛋白的氨基酸是已知的，并且在下列文献中有所描述：Breslow(1985)Annu Rev.Biochem 54：699；Law(1986)Adv.Exp Med.Biol.151：162；Chen(1986)J BiolChem 261：12918；Kane(1980)Proc Natl Acad Sci USA 77：2465；and Utermann(1984)Hum Genet 65：232。

脂蛋白含有各种脂质，包括甘油三酯、胆固醇(游离的和酯型)以及磷脂。天然存在的脂蛋白中脂质的组成是不同的。例如，乳糜微粒主要含甘油三酯。关于天然存在的脂蛋白的脂质含量更详细的描述可在例如Meth.Enzymol.128(1968)中找到。选择脂质的组成，以使脱辅基蛋白的构型与受体结合活性相符。还可选择脂质的组成，以促进与多核苷酸结合分子的疏水性相互作用和结合。

天然存在的脂蛋白可以用诸如超离心的方法从血清中分离出来。这些方法在Meth.Enzymol.(同上)；Pitas(1980)J.BioChem.255：5454-5460以及Mahey(1979)J Clin.Invest 64：743-750中有所描述。脂蛋白还可在体外产生，或通过在所需宿主细胞中表达脱辅基蛋白基因的重组方法产生。例如参见Atkinson(1986)Annu Rev Biophys Chem15：403和Radding(1958)Biochim Biophys Acta 30：443。脂蛋白也可购自商业供应商，如Biomedical Techniologies，Inc.，Stoughton，Massachusetts，USA。关于脂蛋白的进一步描述可在Zuckermann等人的PCT/US97/14465中找到。

F.聚阳离子试剂

聚阳离子试剂可以与或不与脂蛋白一起包括在含所需待输送多核苷酸/多肽的组合物中。

聚阳离子试剂通常在生理性相关的pH下表现出净的正电荷，并能中和核酸的电荷，以有助于输送至所需位置。这些试剂具有体外、活体外和体内的用途。聚阳离子试剂可用来将核酸通过肌内或皮下等输送至活的对象。

下面是用作聚阳离子试剂的多肽例子：聚赖氨酸、聚精氨酸、聚鸟氨酸和鱼精蛋白。其它例子包括组蛋白、鱼精蛋白、人血清白蛋白、DNA结合蛋白、非组蛋白染色体蛋白、DNA病毒的外壳蛋白，如(X174，转录因子还含有结合DNA的结构域，因此可用作核酸浓缩剂。简言之，转录因子如C/CEBP、c-jun、c-fos、AP-1、AP-2、AP-3、CPF、Prot-1、Sp-1、Oct-1、Oct-2、CREP、和TFIID含有结合DNA序列的基础性结构域。

聚阳离子有机试剂包括：精胺、亚精胺和腐胺。

从上面的清单可以推出聚阳离子试剂的尺寸和生理性能，以构建其它多肽聚阳离子试剂或产生合成的聚阳离子试剂。

可采用的合成的聚阳离子试剂例如包括，DEAE-葡聚糖、polybrene。Lipofectin^TM和lipofectAMINE^TM是和多核苷酸/多肽组合时形成聚阳离子复合物的单体。

免疫诊断试验

本发明的奈瑟球菌抗原可用于免疫试验来检测抗体水平(或相反，可用抗奈瑟球菌抗体来检测抗原水平)。根据明确的免疫试验，可以开发出重组抗原，以代替侵入性诊断性方法。针对生物学样品(例如包括血液或血清样品)中的奈瑟球菌蛋白的抗体可以被检测出来。免疫试验的设计可作很大变化，其各种方案均是本领域中已知的。免疫试验的方案可采取例如竞争性、或直接反应或夹心型试验。方案例如还可采用固体支持物，或可以采用免疫沉淀法。大多数试验涉及采用有标记的抗体或多肽；该标记例如可以是荧光标记、化学发光标记、放射活性标记或染料分子。扩增探针信号的试验也是已知的；其例子是采用生物素和亲和素的试验，酶标记的和介导的免疫试验，如ELISA试验。

将合适的材料(包括本发明的组合物)以及进行试验所需的其它试剂和材料(例如合适的缓冲液、盐溶液等)和合适的试验说明包装到合适的容器中，构成适用于免疫诊断且含有适当标记的试剂的试剂盒。

核酸杂交

“杂交”指两个核酸序列相互之间通过氢键而结合。通常，一个序列被固定到固体载体中，另一个将游离于溶液内。然后，在有利于形成氢键的条件下使两个序列相互接触。影响这种结合的因素包括：溶剂的类型和体积；反应温度；杂交时间；搅拌程度；封闭液相序列与固体载体非特异性连接的试剂(Denhardt′s试剂或BLOTTO)；序列的浓度；是否用化合物来增加序列结合的速度(硫酸葡聚糖或聚乙二醇)；以及杂交后洗涤条件的严谨程度。见Sambrook等人[同上]第2卷，第9章，9.47至9.57页。

“严谨性”指有利于非常相似的序列与不同序列发生结合的杂交反应条件。例如，应选择温度和盐浓度组合，使温度比所研究的杂交物的Tm计算值低大约120至200℃。温度和盐浓度常可在前期初步实验中通过经验来确定，在初步实验中，固定在滤膜上的基因组DNA样品与感兴趣的序列杂交，然后在不同的严谨度条件下洗涤。见Sambrook等人第9.50页。

在进行例如Southern印迹时，要考虑的参数是(1)待印迹的DNA的复杂性以及(2)探针与受检测序列之间的同源性。对于高度复杂的真核基因组中的单拷贝基因，待研究片段的总量可以在10的一个数量级范围内变化，质粒为0.1至1微克，或将噬菌体消化至10^-9至10^-8克。对于复杂性较低的多核苷酸，可以采用实际上更短的印迹、杂交以及接触时间，更少量的起始多核苷酸，以及比活更低的探针。例如，从1微克酵母DNA开始，用仅仅1小时的接触时间，印迹2小时，然后和10⁸cpm/μg的探针杂交4-8小时，就可以检测单拷贝酵母基因。对于单拷贝哺乳动物基因而言，一种保守的方法是从10微克DNA开始，印迹过夜，在10％硫酸葡聚糖存在下用10⁸cpm/μg以上的探针杂交过夜，导致接触时间约为24小时。

有几个因素可能会影响探针与感兴趣片段之间的DNA-DNA杂合物的解链温度(Tm)，因而影响杂交和洗涤的合适条件。在许多情况下，探针并非与片段100％同源。其它常常遇到的变量包括杂交序列的长度和G+C总含量，以及杂交缓冲液的离子强度和甲酰胺含量。所有这些因素的作用可近似表示成一个方程式：

Tm＝81+16.6(log₁₀Ci)+0.4[％(G+C)]-0.6(％甲酰胺)-600/n-1.5(％错配)其中Ci是盐浓度(单价离子)，n是杂交物碱基对的长度(对Meinkoth和Wahl(1984)Anal.Biochem.138：267-284中的稍稍作了修改)。

在设计杂交实验时，影响核酸杂交的一些因素可以方便地予以改变。杂交和洗涤时的温度以及洗涤时的盐浓度的调节最为简单。随着杂交温度(即严谨度)的升高，不同源的链之间发生杂交的可能性变得更少，结果背景值降低。如果放射性标记的探针并非与固定的片段完全同源(这在基因家族和种间杂交实验中是常见的)，则必须降低杂交温度，而背景值将会增加。洗涤温度以类似的方式影响杂交带的强度和背景值的程度。洗涤的严谨性也随盐浓度的降低而升高。

通常，在50％甲酰胺存在下的方便的杂交温度是：对于靶片段同源性达95％至100％的探针而言，是42℃；对于同源性为90％至95％的探针，为37℃；对于同源性为85％和90％的探针，为32℃。对于较低的同源性，应用上述方程式应相应地降低甲酰胺含量和调节温度。如果探针和靶片段之间的同源性是未知的，则最简单的方法是从非严谨的杂交和洗涤条件开始。如果在放射自显影后发现了非特异性的条带或高背景值，则可在高严谨性下洗涤滤膜，并重新曝光。如果曝光所需时间使得该方法不切实际，则应平行测试几个杂交和/或洗涤严谨性。

核酸探针试验

采用本发明的核酸探针的方法(如PCR、分支DNA探针试验或印迹技术)能确定cDNA或mRNA的存在。如果探针和本发明的序列能形成稳定地足以被检测到的双链体或双链复合物，则称探针与本发明的序列“杂交”。

核酸探针将与本发明的奈瑟球菌核苷酸序列(包括有义和反义链)杂交。尽管有许多不同的核苷酸序列编码该氨基酸序列，但是天然的奈瑟球菌序列是较佳的，因为它是实际存在于细胞中的序列。mRNA代表一种编码序列，因此探针应与该编码序列互补；单链cDNA与mRNA互补，因此cDNA探针应与非编码序列互补。

探针序列无需和奈瑟球菌序列(或其互补体)相同，序列以及长度的一些差异能增加试验的灵敏度，如果核酸探针能和靶核苷酸形成能被检测的双链体的话。另外，核酸探针可包括其它核苷酸，以使形成的双链体稳定。其它奈瑟球菌序列也是有帮助的，可作为检测形成的双链体的标记。例如，非互补的核苷酸序列可以和探针的5′端相连，探针序列的其余部分与奈瑟球菌序列互补。或者，非互补的碱基或较长的序列能散布到探针中，只要探针序列与奈瑟球菌序列有足够的互补性以便与其杂交从而形成能被检测的双链体。

探针的确切长度和序列将取决于杂交条件，如温度，盐浓度等。例如，对于诊断应用，根据分析物序列的复杂程度，核酸探针通常含有至少10-20个核苷酸，较佳的有15-25个，更佳的有至少30个核苷酸，但是也可短于该长度。短的引物通常需要温度较低，以便和模板形成足够稳定的杂交复合物。

探针可用合成方法产生，例如Matteucci等人[J.Am.Chem.Soc.(1981)103：3185]的方法或Urdea等人[Proc.Natl.Acad.Sci.USA(1983)80：7461]的方法，或用市售的自动寡核苷酸合成仪合成。

可以根据偏好选择探针的化学特征。对于某些应用，DNA或RNA是合适的。对于其它的应用，可以加入修饰，例如骨架修饰，如硫代磷酸酯或甲基磷酸酯，可用来增加体内半衰期，改变RNA亲和力，增加核酸酶抗性等[例如参见Agrawal和Iyer(1995)Curr Opin Biotechnol 6：12-19；Agrawal(1996)TIBTECH 14：376-387]；还可采用类似物如肽核酸[例如参见Corey(1997)TIBTECH 15：224-229；Buchardt等人(1993)TIBTECH 11：384-386]。

另外，聚合酶链反应(PCR)是另一个熟知的检测少量靶核酸的手段。该试验在Mullis等人[Meth.Enzymol.(1987)155：335-350]；美国专利4,683,195和4,468,202中有所描述。用两个“引物”核苷酸与靶核酸杂交，并用来引导反应。引物可包含不与扩增靶序列(或其互补序列)杂交的序列，以帮助双链体的稳定性，或例如可插入一个简便的限制性位点。这些序列通常侧接所需的奈瑟球菌序列。

利用最初的靶核酸作为模板，热稳定的聚合酶能从引物产生靶核酸的拷贝。在聚合酶产生临界量的靶核酸后，它们可用较传统的方法(如Southern印迹)来检测。当采用Southern印迹方法后，标记的探针将与奈瑟球菌序列(如其互补序列)杂交。

另外，mRNA或cDNA也可用Sambrook等人[同上]中描述的传统印迹技术来检测。用凝胶电泳可纯化并分离利用聚合酶从mRNA产生的mRNA或cDNA。然后，将凝胶上的核酸印迹到固体载体如硝酸纤维素上。使固体载体与标记的探针接触，然后洗涤除去所有未杂交的探针。然后，检测含有标记探针的双链体。该探针通常用放射活性物质作标记。

附图简述

图1-20显示了实施例中，和ORF 37、5、2、15、22、28、32、4、61、76、89、97、106、138、23、25、27、79、85以及132的序列分析所得的生化数据。M1和M2是分子量标记。箭头表示主要重组产物的位置，或在Western印迹中，主要的脑膜炎奈瑟球菌免疫反应性条带的位置。TP表示脑膜炎奈瑟球菌总蛋白抽提物；OMV表示脑膜炎奈瑟球菌外膜泡囊制备物。在杀菌试验的结果中：菱形(◆)表示免疫前的数据；三角(▲)表示GST对照数据；圆圈(●)表示脑膜炎奈瑟球菌重组蛋白的数据。计算机分析显示了亲水性曲线(上方)、抗原性指数曲线(中间)以及AMPHI分析(下方)。用AMPHI程序预测T-细胞表位[Gao等人(1989)J.Immunol.143：3007；Roberts等人(1996)AIDS Res Hum Retrovir 12：593；Quakyi等人(1992)Scand J Immunol增版11：9]，该程序可从DNASTAR，Inc(1228 South Park Street，Madison，Wisconsin 53715 USA)的Protean软件包中获得。

实施例

下列实施例描述已经在脑膜炎奈瑟球菌和淋病奈瑟球菌中鉴定的核酸序列及其推定的翻译产物。并非所有的核酸序列都是完整的，即它们编码的不是全长野生型蛋白。

实施例总体上采用下列形式：

●脑膜炎奈瑟球菌(B株)中已经鉴定的核苷酸序列

●该序列推定的翻译产物

●根据数据库比较用计算机分析翻译产物

●脑膜炎奈瑟球菌(A株)以及淋病奈瑟球菌中鉴定的对应的基因和蛋白序列

●可能具有适当抗原性的蛋白的特性描述

●生物化学分析(表达、纯化、ELISA、FACS等)的结果

实施例通常包括菌株和菌株之间的序列相同性细节情况。序列相似的蛋白其结构和功能通常是相似的，序列相同性通常表示有共同的进化起源。广泛采用功能已知的蛋白序列之间的比较，作为赋予其新序列推定蛋白功能的指南，在全基因组分析中证明这是特别有用的。

在NCBI(http：//www.ncbi.nlm.nih.gov)用BLAST、BLAST2、BLASTn、BLASTp、tBLASTn、BLASTx、和tBLASTx算法进行序列比较[例如参见Altschul等人(1997)″Gapped BLAST和PSI-BLAST：新一代的蛋白数据库搜索程序″Nucleic AcidsResearch 25：2289-3402]。对下列数据库进行搜索：非冗长的GenBank+EMBL+DDBJ+PDB序列和非冗长的GenBank CDS翻译+PDB+SwissProt+SPupdate+PIR序列。

为了比较脑膜炎球菌和淋球菌序列，用tBLASTx算法，在http：//www.genome.ou.edu/gono_blast.html中执行。还用FASTA算法来比较ORF(购自GCG Wisconsin Package，9.0版)。

核苷酸序列中的点(例如SEQ ID 11中的495位)代表为了维持读码框而任意导入的核苷酸。同样，除去带双划线的核苷酸。小写字母(如SEQ ID 11的496位)代表在独立测序反应的序列对比时出现了多义性(实施例中的一些核苷酸序列是通过合并两个或多个实验的结果而获得的)。

用根据Esposti等人[″膜蛋白亲水性的关键评价″(1990)Eur J Biochem190：207-219]的统计研究的算法，扫描所有6个读码框中的核苷酸序列，以预测疏水性区域的存在。这些结构域代表潜在的跨膜区域或疏水性前导序列。

用ORFFINDER程序(NCBI)从片段化的核苷酸序列预测开放读框。

有下划线的氨基酸序列代表用PSORT算法(http：//www.psort.nibb.ac.jp)估测出的ORF中可能的跨膜区域或前导序列。还用MOTIFS程序(GCG Wisconsin和PROSITE)预测了功能性结构域。

可用各种试验来评价实施例中鉴定的蛋白的体内免疫原性。例如，可以重组表达蛋白，并用于免疫印迹筛选患者血清。蛋白和患者血清之间发生阳性反应表明该患者以前已经建立了对该所述蛋白的免疫应答，即该蛋白是免疫原。该方法还可用来鉴定免疫优势蛋白。

重组蛋白还可方便地用来例如在小鼠中制备抗体。这些抗体可用来直接确认蛋白位于细胞表面。将标记的抗体(例如对于FACS为荧光标记)与完整的细菌培育，细菌表面出现标记确认了该蛋白的位置。

具体地说，采用下列方法(A)至(S)，来表达、纯化和分析本发明蛋白的生物化学特性：

A)染色体DNA制备

使脑膜炎奈瑟球菌2996菌株在100毫升GC培养基中生长至指数期，离心收获，重悬于5毫升缓冲液(20％蔗糖、50毫摩尔Tris-HCl、50毫摩尔EDTA、pH 8)中。冰上培育10分钟后，加入10毫升裂解溶液(50毫摩尔NaCl，1％Na-十二烷基肌氨酸钠，50微克/毫升蛋白酶K)裂解该细菌，37℃培育悬液2小时。用苯酚抽提两次(平衡至pH 8)，用三氯甲烷/异戊醇(24∶1)抽提一次。加入0.3M乙酸钠和2体积乙醇，使DNA沉淀，离心收集。用70％乙醇洗涤沉淀一次，重新溶解在4毫升缓冲液(10毫摩尔Tris-HCl，1毫摩尔EDTA，pH 8)中。读取260纳米下OD值，测定DNA浓度。

B)寡核苷酸设计

用(a)脑膜炎球菌B的序列(当能获得时)，或(b)淋球菌/脑膜炎球菌A序列(按需适应于脑膜炎球菌密码子偏好利用率)，根据各ORF的编码序列，设计合成的寡核苷酸引物。推导紧靠预计的前导序列下游5′端扩增引物序列，忽略任何预计的信号肽。

对于大多数ORF，5′引物包括两个限制性酶识别位点(BamHI-NdeI，BamHI-NheI或EcoRI-NheI，这取决于基因自身的限制性方式)；3′引物包括一个XhoI限制性位点。建立该步骤是为了指导各扩增产物(对应于各ORF)克隆到以下两个不同的表达系统中：pGEX-KG(用BamHI-XhoI或EcoRI-XhoI)，以及pET21b+(用NdeI-XhoI或NheI-XhoI)。

5’-端引物尾序列：CGC GGATCCCATATG (BamHI-NdeI)

CGC GGATCCGCTAGC (BamHI-NheI)

CC GGAATTCTA GCTAGC (EcoRI-NheI)

3’-端引物尾序列：CCCG CTCGAG (XhoI)

对于ORF5、15、17、19、20、22、27、28、65和69，进行两个不同的扩增，将各ORF克隆到两个表达系统中。对于各ORF采用两个不同的5′引物；如前采用了同一3′XhoI引物：

5’-端引物尾序列：GGAATTC CATATGGCCATGG (NdeI)

5’-端引物尾序列：CG GGATCC (BamHI)

ORF76被克隆到pTRC表达载体中，并表达成氨基端His-tag融合。在该具体情况中，预计的信号肽包括在最终产物中。用下列引物掺入NheI-BamHI限制性位点：

5’-端引物尾序列：GATCA GCTAGCCATATG (NheI)

3’-端引物尾序列：CG GGATCC (BamHI)

引物不仅含有限制性酶识别序列，而且还包括与待扩增序列杂交的核苷酸。杂交核苷酸的数目取决于整个引物的解链温度，对于各引物可用下式测定：

Tm＝4(G+C)+2(A+T) (排除尾部)

Tm＝64.9+0.41(％GC)-600/N (整个引物)

对于整个寡核苷酸来说，所选寡核苷酸的平均解链温度为65-70℃，对于单单杂交区来说，平均解链温度为50-55℃。

表1(511页)显示了用于各种扩增的正向和反向引物。在某些情况下，应注意引物的序列没有与ORF中的序列完全匹配。在进行最初的扩增时，一些脑膜炎球菌ORF的完整的5′和/或3′序列并不是已知的，但是已经鉴定了其在淋球菌中的对应序列。为了进行扩增，可用淋球菌序列作为引物设计的根据，考虑密码偏好作了改变。具体地说，改变下列密码子：ATA→ATT；TCG→TCT；CAG→CAA；AAG→AAA；GAG→GAA；CGA→CGC；CGG→CGC；GGG→GGC。表1中的斜体核苷酸表明这种变化。应理解，一旦鉴定出了完整的序列，就不再需要该方法了。

用Perkin Elmer 394 DNA/RNA合成仪合成寡核苷酸，用2毫升氢氧化铵从柱上洗脱下，56℃培育5小时去保护。加入0.3M乙酸钠和2体积乙醇，使寡核苷酸沉淀。然后离心样品，将沉淀重悬于100微升或1毫升水中。用Perkin ElmerλBio分光光度计测定OD₂₆₀，测得浓度，调节至2-10pmol/微升。

C)扩增

标准的PCR程序如下：在20-40微摩尔各寡核苷酸、400-800微摩尔dNTP溶液、1×PCR缓冲液(包括1.5毫摩尔氯化镁)、2.5单位TaqI DNA聚合酶(用Perkin-ElmerAmpliTaQ，GIBCO Platinum，Pwo DNA聚合酶或Tahara Shuzo Taq聚合酶)存在下，用50-200ng基因组DNA作为模板。

在一些例子中，通过加入10微升DMSO或50微升2M甜菜碱来优化PCR。

在加热开始后(在最初的95℃培育整个混合物3分钟期间加入聚合酶)，每个样品经历两个步骤的扩增：开头5轮的进行用排除限制性酶尾部的寡核苷酸的解链温度作为杂交温度，随后的30轮根据全长寡核苷酸的杂交温度来进行。这些轮后是最后在72℃下延伸10分钟。

标准循环如下：

	变性	杂交	延伸
	变性	杂交	延伸	前5轮	30秒95℃	30秒50-55℃	30-60秒72℃
后30轮	30秒	30秒	30-60秒	前5轮	30秒95℃	30秒50-55℃	30-60秒72℃

95℃

65-70℃

72℃

延伸时间随待扩增ORF的长度不同而不同。

扩增用9600或2400 Perkin Elmer GeneAmp PCR系统进行。为了检查结果，将1/10的扩增体积装载到1-1.5％琼脂糖凝胶上，将各扩增片段的大小与DNA分子标记作比较。

将扩增的DNA直接上样到1％琼脂糖凝胶上，或是先用乙醇沉淀，然后重悬于合适的体积中，上样到1％琼脂糖凝胶上。然后用Qiagen凝胶抽提试剂盒按照生产商说明从凝胶中洗脱并纯化获得对应于大小正确条带的DNA片段。该DNA片段的最终体积为30微升或50微升的水，或10毫摩尔Tris，pH 8.5。

D)PCR片段的消化

将对应于扩增片段的纯化的DNA分成2等份，用以下物质进行双重消化：

-NdeI/XhoI或NheI/XhoI，用于克隆到pET-21b+中，该蛋白进一步表达成C-端His-尾融合物

-BamHI/XhoI或EcoRI/XhoI，用于克隆到pGEX-KG中，该蛋白进一步表达成N-端GST融合物

-对于ORF76，NheI/BamHI，用于克隆到pTRC-HisA载体中，该蛋白进一步表达成N-端His-尾融合物

-EcoRI/PstI，EcoRI/SalI，SalI/PstI，用于克隆到pGex-His中，该蛋白进一步表达成N-端His-尾融合物

在合适的缓冲液存在下，使各纯化的DNA片段与20单位的各种限制性酶(NewEngland Biolabs)在30或40微升的最终体积中培育(37℃培育3小时至过夜)。然后用QIAquick PCR纯化试剂盒按照生产商说明书纯化消化产物，洗脱到最终体积为30微升或50微升的水中或10毫摩尔Tris-HCl，pH 8.5中。在滴定的分子量标记存在下，通过1％琼脂糖凝胶电泳测定最终的DNA浓度。

E)克隆载体(pET22B，pGEX-KG，pTRC-His A和pGex-His)的消化

在合适的缓冲液存在下，使200微升反应体积中的限制性酶各50单位与10微克质粒37℃培育过夜，对10微克质粒进行双消化。在将全部消化物上样到1％琼脂糖凝胶上后，用Qiagen QIAquick凝胶抽提试剂盒从凝胶中纯化对应于消化载体的条带，将DNA洗脱到50微升10毫摩尔Tris-HCl，pH 8.5中。测定样品的OD₂₆₀，评价其DNA浓度，并调节至50微克/微升。每个克隆步骤采用1微升质粒。

pGEX-His载体是经修饰的pGEX-2T载体，其在凝血酶断裂位点上游携带有一个编码6个组氨酸残基的区域，而且还含有载体pTRC99(Pharmacia)的多个克隆位点。

F)克隆

将预先消化和纯化的对应于各ORF的片段连接到pET22b和pGEX-KG中。在20微升的最终体积，在生产商提供的缓冲液存在下，用0.5微升NEB T4 DNA连接酶(400单位/微升)连接摩尔比为3∶1的片段/载体。室温培育反应3小时。在一些实验中，用Boheringer的″快速连接试剂盒″按照生产商说明书进行连接。

为了将重组质粒导入合适的菌株内，使100微升大肠杆菌DH5感受态细胞与连接酶反应溶液于冰上培育40分钟，然后37℃3分钟，然后在加入800微升LB肉汤后，再37℃培育20分钟。然后在Eppendorf微量离心机中以最大速度离心细胞，重悬于约200微升上清液中。然后将悬液接种到LB氨苄青霉素(100毫克/毫升)平板上。

使5个随机选择的菌落在2毫升(pGEX或pTC克隆)或5毫升(pET克隆)LB肉汤+100微克/毫升氨苄青霉素中37℃生长过夜，对重组克隆进行筛选。然后，使细胞沉淀，用Qiagen QIAprep旋转微量制备试剂盒，按照生产商说明书，将DNA抽提到最终体积为30微升。用NdeI/XhoI或BamHI/XhoI消化5微升各个微量制备物(约1微克)，将整个消化物上样到1-1.5％琼脂糖凝胶上(取决于预计的插入物大小)，与分子量标记(1Kb DNA梯序列，GIBCO)平行。根据正确的插入物大小筛选阳性克隆。

对于ORF110、111、113、115、119、122、125和130的克隆，将双消化的PCR产物连接入双消化载体利用的是EcoRI-PstI克隆位点，或者对于115和127，利用的是EcoRI-SalI位点，或者对于ORF122，利用的是SalI-PstI位点。克隆后，将重组质粒导入大肠杆菌宿主W3110中。使单个克隆在含50微升/毫升氨苄青霉素的L-肉汤中37℃生长过夜。

G)表达

将克隆到表达载体中的每个ORF转化入适合表达重组蛋白产物的菌株中。用1微升各构建物转化上述30微升大肠杆菌BL21(pGEX载体)、大肠杆菌TOP10(pTRC载体)或大肠杆菌BL21-DE3(pET载体)。在pGEX-His载体例子中，用相同的大肠杆菌菌株(W3110)进行最初的克隆和表达。将单个重组菌落接种到2毫升LB+Amp(100微克/毫升)中，37℃培育过夜，然后1∶30稀释在100毫升瓶中的20毫升LB+Amp(100微克/毫升)中，确保OD₆₀₀在0.1至0.15之间。将瓶培育在30℃的回转水浴摇床中，直至OD表明达到适合诱导表达的指数生长(pET和pTRC载体的OD为0.4-0.8；pGEX和pGEX-His载体的OD为0.8-1)。对于pET，pTRC和pGEX-His载体，加入1毫摩尔IPTG，诱导蛋白质表达，而在pGEX系统情况下，IPTG的最终浓度为0.2毫摩尔。30℃培育3小时后，测OD检查样品的最终浓度。为了检查表达，取出各样品1毫升，在微量离心机中离心，将沉淀重悬于PBS中，用12％SDS-PAGE和考马斯蓝染色分析。6000g离心整个样品，将沉淀重悬于PBS中待用。

H)GST-融合蛋白大规模纯化

使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到水浴摇床中20毫升LB+Amp培养液中，生长过夜。将细菌1∶30稀释到600毫升新鲜培养基中，使其在最适温度(20-37℃)下生长至OD₅₅₀为0.8-1。用0.2毫摩尔IPTG诱导蛋白质表达，然后培育3小时。4℃、8000rpm离心培养物。弃去上清液，将细菌沉淀重悬于7.5毫升冷的PBS中。用40W的Brason超声波仪B-15在冰上超声破碎细胞30秒种，冻融2次，再次离心。收集上清液，与150微升谷胱苷肽-Sepharose 4B树脂(Pharmacia)(先用PBS洗涤)混合，室温下培育30分钟。4℃、700g离心样品5分钟。用10毫升冷的PBS洗涤树脂2次10分钟，重悬于1毫升冷的PBS中，上样于一次性柱中。用2毫升冷PBS洗柱2次，直至流穿液OD₂₈₀达到0.02-0.06。加入700微升冷的谷胱苷肽洗脱缓冲液(10毫摩尔还原的谷胱苷肽，50毫摩尔Tris-HCl)，洗脱GST-融合蛋白，收集组分直至OD₂₈₀为0.1。将各组分21微升上样于12％SDS凝胶上，凝胶采用BioradSDS-PAGE分子量标准宽范围(M1)(200，116.25，97.4，66.2，45，31，21.5，14.4，6.5kDa)或Amersham Rainbow标记(M2)(220，66，46，30，21.5，14.3kDa)作为标准。因为GST的MW为26kDa，因此该值必须加入各GST-融合蛋白的MW中。

I)His-融合物溶解度分析(ORF111-129)

为了分析His-融合物表达产物的溶解度，将3毫升培养物沉淀重悬于缓冲液M1[500微升PBS，pH 7.2]中。加入25微升溶菌酶(10毫克/毫升)，4℃培育细菌15分钟。用Branson超声仪B-15以40W超声破碎沉淀30秒，冻融两次，然后再次离心分离成沉淀和上清液。收集上清液，将沉淀重悬于缓冲液M2[8M尿素，0.5M氯化钠，20毫摩尔咪唑和0.1M磷酸二氢钠]中，4℃培育3-4小时。离心后，收集上清液，将沉淀重悬于缓冲液M3[6M盐酸胍，0.5M氯化钠，20毫摩尔咪唑和0.1M磷酸二氢钠]中，4℃过夜。用SDS-PAGE分析所有步骤的上清液。

发现ORF113、119和120表达的蛋白溶于PBS，而ORF111、122、116以及129表达的蛋白的溶解需要尿素，ORF125和127的需要盐酸胍。

J)His融合物大规模纯化

使单菌落在LB+Amp琼脂板上37℃培育过夜。将细菌接种到20毫升LB+Amp培养液中，在水浴摇床中培育过夜。将细菌1∶30稀释到600毫升新鲜培养基中，使其在最适温度(20-37℃)下生长至OD₅₅₀为0.6-0.8。加入1毫摩尔IPTG诱导蛋白质表达，进一步培育该培养物3小时。4℃、8000rpm离心培养物，弃去上清液，将细菌沉淀重悬于7.5毫升(i)冷的缓冲液A(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，10毫摩尔咪唑，pH 8，针对可溶性蛋白)或(ii)缓冲液B(尿素8M，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH 8.8，针对不溶性蛋白)。

用Brason超声波仪B-15于40W在冰上超声破碎细胞30秒种，冻融2次，再次离心。

对于不溶性蛋白，-20℃保藏上清液，而将沉淀重悬于2毫升缓冲液C(6M盐酸胍，100毫摩尔磷酸缓冲液，10毫摩尔Tris-HCl，pH 7.5)中，在匀化器中处理10个循环。13000rpm离心产物40分钟。

收集上清液，与150微升Ni²⁺ _-树脂(Pharmacia)(先用合适的缓冲液A或缓冲液B洗涤)，室温下轻微搅动培育30分钟。4℃，700g离心样品5分钟。用10毫升缓冲液A或B洗涤树脂二次10分钟，重悬于1毫升缓冲液A或B中，上样于一次性柱中。用2毫升冷的缓冲液A 4℃洗涤树脂，或在室温下用2毫升缓冲液B洗涤树脂，直至流穿液OD₂₈₀达到0.02-0.06。

用以下缓冲液洗涤树脂：(i)2毫升冷的20毫摩尔咪唑缓冲液(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，20毫摩尔咪唑，pH 8)或(ii)缓冲液D(尿素gM，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH 6.3)，直至流穿液OD₂₈₀达到0.02-0.06。加入700微升的(i)冷的洗脱缓冲液A(300毫摩尔氯化钠，50毫摩尔磷酸缓冲液，250毫摩尔咪唑，pH8)或(ii)洗脱缓冲液B(尿素8M，10毫摩尔Tris-HCl，100毫摩尔磷酸缓冲液，pH 4.5)，洗脱His-融合蛋白，收集组分直至OD₂₈₀为0.1。将各组分21微升上样于12％SDS凝胶中。

K)His-融合蛋白复性

在变性的蛋白中加入10％甘油。然后用透析缓冲液I(10％甘油，0.5M精氨酸，50毫摩尔磷酸缓冲液，5毫摩尔还原的谷胱苷肽，0.5毫摩尔氧化的谷胱苷肽，2M尿素，pH 8.8)将蛋白质稀释至20微克/毫升，用相同的缓冲液4℃透析12-14小时。用透析缓冲液II(10％甘油，0.5M精氨酸，50mM磷酸缓冲液，5毫摩尔还原的谷胱苷肽，0.5毫摩尔氧化的谷胱苷肽，pH 8.8)进一步4℃透析蛋白质12-14小时。用下式评价蛋白浓度：

蛋白质(毫克/毫升)＝(1.55×OD₂₈₀)-(0.76×OD₂₆₀)

L)His-融合物大规模纯化(ORF111-129)

用上述步骤诱导500毫升细菌培养物，获得可溶于缓冲液M1、M2或M3的融合蛋白。将细菌粗提物上样于Ni-NTA superflow柱(Quiagen)，根据融合蛋白的溶解缓冲液，用M1、M2或M3预先平衡该柱。用相同缓冲液洗柱，洗脱未结合的物质。用含有500毫摩尔咪唑的相应缓冲液洗脱特异性蛋白，用不含咪唑的相应缓冲液透析。每一轮后，在下次使用前用至少两个柱体积的0.5M氢氧化钠洗涤并重新平衡，对柱进行清洁。

M)小鼠免疫

用各纯化蛋白20微克腹膜内免疫小鼠。在ORF 2、4、15、22、27、28、37、76、89和97情况下，用氢氧化铝作为佐剂，在第1、21和42天免疫Balb-C小鼠，检测第56天所取样品中的免疫应答。对于ORF 44、106和132，用相同方案免疫CD1小鼠。对于ORF 25和40，用Freund佐剂，而不是氢氧化铝，免疫CD1小鼠，采用相同的免疫方案，只是在第42天而非56天测定免疫应答。同样，对于ORF 23、32、38和79，用Freund佐剂免疫CD1小鼠，但是在第49天测定免疫应答。

N)ELISA试验(血清分析)

将无荚膜MenB M7菌株接种到巧克力琼脂板上，37℃培育过夜。用无菌挑菌拭子收集琼脂板的细菌菌落，接种到7毫升含0.25％葡萄糖的Mueller-Hinton肉汤(Difco)中。跟踪OD₂₆₀每30分钟监测细菌生长。使细菌长至OD达到0.3-0.4。10000rpm离心培养物10分钟。弃去上清液，用PBS洗涤细菌1次，重悬于含0.025％甲醛的PBS中，室温培育2小时，然后4℃搅拌过夜。在96孔Greiner板的每个孔中加入100微升细菌细胞，4℃培育过夜。然后用PBT洗涤缓冲液(0.1％吐温-20，PBS配)洗涤孔三次。每个孔中加入200微升饱和缓冲液(含2.7％聚乙烯吡咯烷酮10的水)，37℃培育平板2小时。用PBT洗涤各孔3次。每个孔中加入200微升稀释的血清(稀释缓冲液：1％BSA，0.1％吐温-20，0.1％叠氮钠，PBS配)，37℃培育平板90分钟。用PBT洗孔三次。在每个孔中加入100微升以稀释缓冲液1∶2000稀释的HRP-偶联的家兔抗小鼠(Dako)血清，37℃培育平板90分钟。用PBT缓冲液洗涤孔三次。在每个孔中加入100微升HRP的底物缓冲液(25毫升柠檬酸缓冲液pH 5，10毫克邻苯二胺和10微升水)，使平板在室温下放置20分钟。在每个孔中加入100微升硫酸，并跟踪OD₄₉₀。当OD₄₉₀为各自免疫前血清OD值的2.5倍时，认为ELISA呈阳性。

O)FACScan细菌结合试验程序

将无荚膜MenB M7菌株接种到巧克力琼脂板上，37℃培育过夜。用无菌挑菌拭子收集琼脂板上的细菌菌落，接种到8毫升含0.25％葡萄糖的Mueller-Hinton肉汤(Difco)的4个试管中。跟踪OD₂₆₀，每30分钟监测细菌生长。使细菌长至OD达到0.35-0.5。4000rpm离心培养物10分钟。弃去上清液，将沉淀重悬于封闭缓冲液(1％BSA，0.4％叠氮钠)中，4000rpm离心5分钟。将细胞重悬于封闭缓冲液中，至OD₆₂₀为0.07。在Costar 96孔板的每个孔中加入100微升细菌细胞。在每个孔中加入100微升稀释(1∶200)血清(封闭缓冲液配)，4℃培育平板2小时。4000rpm离心细胞5分钟，吸出上清液，每个孔中加入200微升封闭缓冲液，洗涤细胞。在每个孔中加入1∶100稀释的R-Phicoerytrin偶联的F(ab)₂山羊抗小鼠抗体，4℃培育平板1小时。4000rpm离心5分钟，使细胞旋转沉淀，在每个孔中加入200微升封闭缓冲液进行洗涤。吸出上清液，将细胞重悬于每孔200微升PBS和0.25％甲醛中。将样品转移到FACScan管中读数。FACScan设置的条件为：FL1，开，FL2和FL3关；FSC-H临界值：92；FSC PMT电压：E 02；SSC PMT：474；Amp.Gains 7.1；FL-2PMT：539；补偿值：0。

P)OMV制备

使细菌在5GC平板上生长过夜，用挑菌环收获，重悬于10毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟，在冰上超声破碎该细菌10分钟(50％负载循环，50％输出)。5000g离心10分钟，除去未破碎的细胞，4℃、50000g离心75分钟，回收全部细胞包膜组分。为了从粗制的外膜中抽提出细胞质膜蛋白，将全部组分重悬于2％十二烷基肌氨酸钠(Sigma)中，室温培育20分钟。10000g离心该悬浮液10分钟，除去凝聚物，对上清液进一步50000g超离心75分钟，使外膜沉淀。将外膜重悬于10毫摩尔Tris-HCl，pH 8，用BioRad蛋白质试验以BSA为标准品测定蛋白浓度。

Q)全抽提物制备

使细菌在GC板上生长过夜，用挑菌环收获，重悬于1毫升20毫摩尔Tris-HCl中。56℃热灭活30分钟。

R)Western印迹

将MenB菌株2996的纯化蛋白(每条泳道500ng)、外膜泡囊(5微克)和全细胞抽提物(25微克)上样于15％SDS-PAGE中并转移到硝酸纤维素膜上。转移在4℃、150mA、转移缓冲液(0.3％Tris碱，1.44％甘氨酸，20％甲醇)中进行2小时。在饱和缓冲液(10％脱脂乳、0.1％Triton X100，PBS配)中4℃培育过夜，使该膜饱和。用洗涤缓冲液(3％脱脂乳，0.1％Triton X100，PBS配)洗涤该膜两次，并与洗涤缓冲液1∶200稀释的小鼠血清37℃培育2小时。洗涤该膜两次，和稀释度为1∶2000的辣根过氧化物酶标记的抗小鼠Ig培育90分钟。用含0.1％Triton X100的PBS洗涤该膜两次，用Opti-4CN底物试剂盒(Bio-Rad)显影。加入水，终止反应。

S)杀菌试验

使MC58菌株在巧克力琼脂板上37℃生长过夜。收集5-7个菌落，用于接种7毫升Mueller-Hinton肉汤。在章动器上37℃培育该悬浮液，使其生长，至OD₆₂₀为0.5-0.8。将培养液等分到1.5毫升无菌Eppendorf管中，在微量离心机中以最大速度离心20分钟。以Gey′s缓冲液(Gibco)洗涤沉淀一次，重悬于相同缓冲液中，至OD₆₂₀为0.5，以Gey′s缓冲液稀释1∶20000，25℃保藏。

在96孔组织培养板的每个孔中加入50微升Gey′s缓冲液/1％BSA。在每个孔中加入25微升稀释的小鼠血清(1∶100稀释在Gey′s缓冲液/0.2％BSA中)，4℃培育平板。将25微升前述细菌悬浮液加入每个孔中。每个孔中加入25微升热灭活(56℃水浴30分钟)或正常的幼兔补体。在加入幼兔补体后，立即将每个孔中22微升的样品接种到Mueller-Hinton琼脂板(时间0)。37℃转动培育96孔板1小时，然后将每个孔内22微升的样品接种到Mueller-Hinton琼脂板(时间1)上。过夜培育后，计数对应于时间0和时间1的菌落。

表II(520页)给出了克隆、表达和纯化结果的小结。

实施例1

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 1>：

1 ATGAAACAGA CAGTCAA.AT GCTTGCCGCC GCCCTGATTG CCTTGGGCTT

51 GAACCGACCG GTGTGGNCGG ATGACGTATC GGATTTTCGG GAAAACTTGC

101 A.GCGGCAGC ACAGGGAAAT GCAGCAGCCC AATACAATTT GGGCGCAATG

151 TAT.TACAAA GGACGCGCGT GCGCCGGGAT GATGCTGAAG CGGTCAGATG

201 GTATCGGCAG CCGGCGGAAC AGGGGTTAGC CCAAGCCCAA TACAATTTGG

251 GCTGGATGTA TGCCAACGGG CGCGC.GTGC GCCAAGATGA TACCGAAGCG

301 GTCAGATGGT ATCGGCAGGC GGCAGCGCAG GGGGTTGTCC AAGCCCAATA

351 CAATTTGGGC GTGATATATG CCGAAGGACG TGGAGTGCGC CAAGACGATG

401 TCGAAGCGGT CAGATGGTTT CGGCAGGCGG CAGCGCAGGG GGTAGCCCAA

451 GCCCAAAACA ATTTGGGCGT GATGTATGCC GAAAGANCGC GCGTGCGCCA

501 AGACCG...

它对应于氨基酸序列<SEQ ID 2；ORF37>：

1 MKQTVXMLAA ALIALGLNRP VWXDDVSDFR ENLXAAAQGN AAAQYNLGAM

51 YXQRTRVRRD DAEAVRWYRQ PAEQGLAQAQ YNLGWMYANG RXVRQDDTEA

101 VRWYRQAAAQ GVVQAQYNLG VIYAEGRGVR QDDVEAVRWF RQAAAQGVAQ

151 AQNNLGVMYA ERXRVRQD...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 3>：

1 ATGAAACAGA CAGTCAAATG GCTTGCCGCC GCCCTGATTG CCTTGGGCTT

51 GAACCGAGCG GTGTGGGCGG ATGACGTATC GGATTTTCGG GAAAACTTGC

101 AGGCGGCAGC ACAGGGAAAT GCAGCAGCCC AATACAATTT GGGCGCAATG

151 TATTACAAAG GACGCGGCGT GCGCCGGGAT GATGCTGAAG CGGTCAGATG

201 GTATCGGCAG GCGGCGGAAC AGGGGTTAGC CCAAGCCCAA TACAATTTGG

251 GCTGGATGTA TGCCAACGGG CGCGGCGTGC GCCAAGATGA TACCGAAGCG

301 GTCAGATGGT ATCGGCAGGC GGCAGCGCAG GGGGTTGTCC AAGCCCAATA

351 CAATTTGGGC GTGATATATG CCGAAGGACG TGGAGTGCGC CAAGACGATG

401 TCGAAGCGGT CAGATGGTTT CGGCAGGCGG CAGCGCAGGG GGTAGCCCAA

451 GCCCAAAACA ATTTGGGCGT GATGTATGCC GAAAGACGCG GCGTGCGCCA

501 AGACCGCGCC CTTGCACAAG AATGGTTTGG CAAGGCTTGT CAAAACGGAG

551 ACCAAGACGG CTGCGACAAT GACCAACGCC TGAAGGCGGG TTATTGA

其对应于氨基酸序列<SEQ ID 4；ORF37-1>：

1 MKQTVKWLAA ALIALGLNRA VWADDVSDFR ENLQAAAQGN AAAQYNLGAM

51 YYKGRGVRRD DAEAVRWYRQ AAEQGLAQAQ YNLGWMYANG RGVRQDDTEA

101 VRWYRQAAAQ GVVQAQYNLG VIYAEGRGVR QDDVEAVRWF RQAAAQGVAQ

151 AQNNLGVMYA ERRGVRQDRA LAQEWFGKAC QNGDQDGCDN DQRLKAGY*

进一步的工作鉴定了脑膜炎奈瑟球菌菌株A中对应的基因<SEQ ID 5>：

1 ATGAAACAGA CAGTCAAATG GCTTGCCGCC GCCCTGATTG CCTTGGGCTT

51 GAACCAAGCG GTGTGGGCGG ATGACGTATC GGATTTTCGG GAAAACTTGC

101 AGGCGGCAGC ACAGGGAAAT GCAGCAGCCC AAAACAATTT GGGCGTGATG

151 TATGCCGAAA GACGCGGCGT GCGCCAAGAC CGCGCCCTTG CACAAGAATG

201 GCTTGGCAAG GCTTGTCAAA ACGGATACCA AGACAGCTGC GACAATGACC

251 AACGCCTGAA AGCGGGTTAT TGA

它编码的蛋白具有以下的氨基酸序列<SEQ ID 6；ORF37a>：

1 MKQTVKWLAA ALIALGLNQA VWADDVSDFR ENLQAAAQGN AAAQNNLGVM

51 YAERRGVRQD RALAQEWLGK ACQNGYQDSC DNDQRLKAGY *

最初鉴定的部分菌株B序列(ORF37)和ORF37a在75个氨基酸的重叠区内显示出有68.0％的相同性：

10 20 30 40 50 60

orf37.pep MKQTVXMLAAALIALGLNRPVWXDDVSDFRENLXAAAQGNAAAQYNLGAMYXQRTRVRRD

||||| |||||||||||: || | ||||||||| |||||||||| |||:|| :| ||:|

orf37a MKQTVKWLAAALIALGLNQAVWADDVSDFRENLQAAAQGNAAAQNNLGVMYAERRGVRQD

10 20 30 40 50 60

70 80 90 100 110 120

orf37.pep DAEAVRWYRQPAEQGLAQAQ YNLGWMYANGRXVRQDDTEAVRWYRQAAAQGVVQAQYNLG

| | :| : ::|

orf37a RALAQEWLGKACQNGYQDSC DNDQRLKAGYX

70 80 90

进一步的工作鉴定了淋病奈瑟球菌中的对应基因<SEQ ID 7>：

1 ATGAAACAGA CAGTCAAATG GCTTGCCGCC GCCCTGATTG CCTTGGGCTT

51 GAACCAAGCG GTGTGGGCGG GTGACGTATC GGATTTTCGG GAAAACTTGC

101 AGgcggcaGA ACaggGAAAT GCAGCAGCCC AATTCAATTT GGGCGTGATG

151 TATGAAAATG GACAAGGAGT TCGTCAAGAT TATGTACAGG CAGTGCAGTG

201 GTATCGCAAG GCTTCAGAAC AAGGGGATGC CCAAGCCCAA TACAATTTGG

251 GCTTGATGTA TTACGATGGA CGCGGCGTGC GCCAAGACCT TGCGCTCGCT

301 CAACAATGGC TTGGCAAGGC TTGTCAAAAC GGAGACCAAA ACAGCTGCGA

351 CAATGACCAA CGCCTGAAGG CGGGTTATTA A

它编码的蛋白质具有以下的氨基酸序列<SEQ ID 8；ORF37ng>：

1 MKQTVKWLAA ALIALGLNQA VWAGDVSDFR ENLQAAEQGN AAAQFNLGVM

51 YENGQGVRQD YVQAVQWYRK ASEQGDAQAQ YNLGLMYYDG RGVRQDLALA

101 QQWLGKACQN GDQNSCDNDQ RLKAGY*

最初鉴定的部分菌株B序列(ORF37)在与ORF37ng重叠的111个氨基酸内显示出64.9％的相同性：

orf37.pep MKQTVXMLAAALIALGLNRPVWXDDVSDFRENLXAAAQGNAAAQYNLGAMYXQRTRVRRD 60

||||| |||||||||||: || ||||||||| || |||||||:|||:|| : ||:|

orf37ng MKQTVKWLAAALIALGLNQAVWAGDVSDFRENLQAAEQGNAAAQFNLGVMYENGQGVRQD 60

orf37.pep DAEAVRWYRQPAEQGLAQAQYNLGWMYANGRXVRQDDTEAVRWYRQAAAQGVVQAQYNLG 120

::||:|||: :||| |||||||| || :|| |||| : | :| :| :|

orf37ng YVQAVQWYRKASEQGDAQAQYNLGLMYYDGRGVRQDLALAQQWLGKACQNGDQNSCDNDQ 120

orf37.pep VIYAEGRGVRQDDVEAVRWFRQAAAQGVAQAQNNLGVMYAERXRVRQD 168

orf37ng RLKAGY 126

完整的菌株B序列(ORF37-1)和ORF37ng在重叠的198个氨基酸中显示出51.5％的相同性：

10 20 30 40 50 60

orf37-1.pep MKQTVKWLAAALIALGLNRAVWADDVSDFRENLQAAAQGNAAAQYNLGAMYYKGRGVRRD

||||||||||||||||||:|||| |||||||||||| |||||||:|||:|| :|:|||:|

orf37ng MKQTVKWLAAALIALGLNQAVWAGDVSDFRENLQAAEQGNAAAQFNLGVMYENGQGVRQD

10 20 30 40 50 60

70 80 90 100 110 120

orf37-1.pep DAEAVRWYRQAAEQGLAQAQYNLGWMYANGRGVRQDDTEAVRWYRQAAAQGVVQAQYNLG

::||:|||:|:||| |||||||| || :|||||||

orf37ng YVQAVQWYRKASEQGDAQAQYNLGLMYYDGRGVRQD------------------------

70 80 90

130 140 150 160 170 180

orf37-1.pep VIYAEGRGVRQDDVEAVRWFRQAAAQGVAQAQNNLGVMYAERRGVRQDRALAQEWFGKAC

||||:|:||||

orf37ng ------------------------------------------------LALAQQWLGKAC

100

190 199

orf37-1.pep QNGDQDGCDNDQRLKAGYX

|||||::||||||||||||

orf37ng QNGDQNSCDNDQRLKAGYX

110 120

这些氨基酸序列的计算机分析表明了一个推定的前导序列，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位能用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF37-1(11kDa)克隆到pET和pGex载体中，并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图1A显示了GST-融合蛋白亲和纯化的结果，图1B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST-融合蛋白免疫小鼠，用该小鼠的血清进行ELISA(阳性结果)，FACS分析(图1C)和杀菌试验(图1D)。这些实验确证ORF37-1是一种外露蛋白，并且是一种有用的免疫原。

图1E显示了ORF37-1的亲水性、抗原性指数以及AMPHI区域。

实施例2

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 9>：

TTCGGCGA CATCGGCGGT TTGAAGGTCA ATGCCCCCGT CAAATCCGCA

GGCGTATTGG TCGGGCGCGT CGGCGCTATC GGACTTGACC CGAAATCCTA

TCAGGCGAGG GTGCGCCTCG ATTTGGACGG CAAGTATCAG TTCAGCAGCG

ACGTTTCCGC GCAAATCCTG ACTTCsGGAC TTTTGGGCGA GCAGTACATC

GGGCTGCAGC AGGGCGGCGA CACGGAAAAC CTTGCTGCCG GCGACACCAT

CTCCGTAACC AGTTCTGCAA TGGTTCTGGA AAACCTTATC GGCAAATTCA

TGACGAGTTT TGCCGAGAAA AATGCCGACG GCGGCAATGC GGAAAAAGCC

GCCGAATAA

它对应于氨基酸序列<SEQ ID 10>：

1 FGDIGGLKVN APVKSAGVLV GRVGAIGLDP KSYQARVRLD LDGKYQFSSD

51 VSAQILTSGL LGEQYIGLQQ GGDTENLAAG DTISVTSSAM VLENLIGKFM

101 TSFAEKNADG GNAEKAAE*

这些氨基酸序列的计算机分析给出了下列结果：

与假设的流感嗜血菌蛋白(ybrd.haein：登录号p45029)的同源性

SEQ ID 9和ybrd.haein在122个重叠的氨基酸内显示出有48.4％的相同性：

20 30 40 50 60 70

yrbd.h LGIGALVFLGLRVANVQGFAETKSYTVTATFDNIGGLKVRAPLKIGGVVIGRVSAITLDE

|::||||||:||:| :||::|||:||:||

N.m FGDIGGLKVNAPVKSAGVLVGRVGAIGLDP

10 20 30

80 90 100 110 120 130

yrbd.h KSYLPKVSIAINQEYNEIPENSSLSIKTSGLLGEQYIALTMGFDDGDTAMLKNGSQIQDT

||| ::|::::: :| ::::: | | ||||||||||:| | |||: | :|: | |

N.m KSYQARVRLDLDGKY-QFSSDVSAQILTSGLLGEQYIGLQQG---GDTENLAAGDTISVT

40 50 60 70 80

140 150 160

yrbd.h TSAMVLEDLIGQFL--YGSKKSDGNEKSESTEQ

:||||||:|||:|: :::|::||:: ::::|:

N.m SSAMVLENLIGKFMTSFAEKNADGGNAEKAAEX

90 100 110 120

与淋病奈瑟球菌的预计的ORF的同源性

SEQ ID 9与淋病奈瑟球菌的预计的ORF在重叠的118个氨基酸内显示出有99.2％的相同性：

20 30 40 50 60 70

yrbd GAAAVAFLAFRVAGGAAFGGSDKTYAVYADFGDIGGLKVNAPVKSAGVLVGRVGAIGLDP

||||||||||||||||||||||||||||||

N.m FGDIGGLKVNAPVKSAGVLVGRVGAIGLDP

10 20 30

80 90 100 110 120 130

yrbd KSYQARVRLDLDGKYQFSSDVSAQILTSGLLGEQYIGLQQGGDTENLAAGDTISVTSSAM

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

N.m KSYQARVRLDLDGKYQFSSDVSAQILTSGLLGEQYIGLQQGGDTENLAAGDTISVTSSAM

40 50 60 70 80 90

140 150 160

yrbd VLENLIGKFMTSFAEKNAEGGNAEKAAEX

||||||||||||||||||:||||||||||

N.m VLENLIGKFMTSFAEKNADGGNAEKAAEX

100 110 120

完整的yrbd流感嗜血菌序列具有一个前导序列，预计全长的同源脑膜炎奈瑟球菌该蛋白也会有一个前导序列。这提示它可能是膜蛋白、分泌的蛋白或表面蛋白，且该蛋白或其表位之一可能是疫苗或诊断的有用抗原。

实施例3

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 11>：

1 ..ATTTTGATAT ACCTCATCCG CAAGAATCTA GGTTCGCCCG TCTTCTTCTT

51 TCAGGAACGC CCCGGAAAGG ACGGAAAACC TTTTAAAATG GTCAAATTCC

101 GTTCCATGCG CGACGGCTTG TATTCAGACG GCATTCCGCT GCCCGACGGA

151 GAACGCCTGA CACCGTTCGG CAAAAAACTG CGTGCCGcCA GTwTGGACGA

201 ACTGCCTGAA TTATGGAATA TCTTAAAAGG CGAGATGAGC CTGGTCGGCC

251 CCCGCCCGCT GCTGATGCAA TATCTGCCGC TGTACGACAA CTTCCAAAAC

301 CGCCGCCACG AAATGAAACC CGGCATTACC GGCTGGGCGC AGGTCAACGG

351 GCGCAACGCg CTTTCGTGGG ACGAAAAATT CGCCTGCGAT GTTTGGTATA

401 TCGACCACTT CAGCCTGTGC CTCGACATCA AAATCCTACT GCTGACGGTT

451 AAAAAAGTAT TAATCAAGGA AGGGATTTCC GCACAGGGCG AACA.aCCAT

501 GCCCCCTTTC ACAGGAAAAC GCAAACTCGC CGTCGTCGGT GCGGGCGGAC

551 ACGGAAAAGT CGTTGCCGAC CTTGCCGCCG CACTCGGCCG GTACAGGGAA

601 ATCGTTTTTC TGGACGACCG CGCACAAGGC AGCGTCAACG GCTTTTCCGT

651 CATCGGCACG ACGCTGCTGC TTGAAAACAG TTTATCGCCC GAACAATACG

701 ACGTCGCCGT CGCCGTCGGC AACAACCGCA TCCGCCGCCA AATCGCCGAA

751 AAAGCCGCCG CGCTCGGCTT CGCCCTGCCC GTACTGGTTC ATCCGGACGC

801 GACCGTCTCG CCTTCTGCAA CAGTCGGACA AGGCAGCGTC GTTATGGCGA

851 AAGCGGTCG..

它对应于氨基酸序列<SEQ ID 12；ORF3>：

1.. ILIYLIRKNL GSPVFFFQER PGKDGKPFKM VKFRSMRDGL YSDGIPLPDG

51 ERLTPFGKKL RAASXDELPE LWNILKGEMS LVGPRPLLMQ YLPLYDNFQN

101 RRHEMKPGIT GWAQVNGRNA LSWDEKFACD VWYIDHFSLC LDIKILLLTV

151 KKVLIKEGIS AQGEXTMPPF TGKRKLAVVG AGGHGKVVAD LAAALGRYRE

201 IVFLDDRAQG SVNGFSVIGT TLLLENSLSP EQYDVAVAVG NNRIRRQIAE

251 KAAALGFALP VLVHPDATVS PSATVGQGSV VMAKAV..

进一步的序列分析揭示了完整的核苷酸序列<SEQ ID 13>：

1 ATGAGTAAAT TCTTCAAACG CCTGTTTGAC ATTGTTGCCT CCGCCTCGGG

51 ACTGATTTTC CTCTCGCCAG TATTTTTGAT TTTGATATAC CTCATCCGCA

101 AGAATCTAGG TTCGCCCGTC TTCTTCTTTC AGGAACGCCC CGGAAAGGAC

151 GGAAAACCTT TTAAAATGGT CAAATTCCGT TCCATGCGCG ACGCGCTTGA

201 TTCAGACGGC ATTCCGCTGC CCGACGGAGA ACGCCTGACA CCGTTCGGCA

251 AAAAACTGCG TGCCGCCAGT TTGGACGAAC TGCCTGAATT ATGGAATATC

301 TTAAAAGGCG AGATGAGCCT GGTCGGCCCC CGCCCGCTGC TGATGCAATA

351 TCTGCCGCTG TACGACAACT TCCAAAACCG CCGCCACGAA ATGAAACCCG

401 GCATTACCGG CTGGGCGCAG GTCAACGGGC GCAACGCGCT TTCGTGGGAC

451 GAAAAATTCG CCTGCGATGT TTGGTATATC GACCACTTCA GCCTGTGCCT

501 CGACATCAAA ATCCTACTGC TGACGGTTAA AAAAGTATTA ATCAAGGAAG

551 GGATTTCCGC ACAGGGCGAA GCCACCATGC CCCCTTTCAC AGGAAAACGC

601 AAACTCGCCG TCGTCGGTGC GGGCGGACAC GGAAAAGTCG TTGCCGACCT

651 TGCCGCCGCA CTCGGCCGGT ACAGGGAAAT CGTTTTTCTG GACGACCGCG

701 CACAAGGCAG CGTCAACGGC TTTTCCGTCA TCGGCACGAC GCTGCTGCTT

751 GAAAACAGTT TATCGCCCGA ACAATACGAC GTCGCCGTCG CCGTCGGCAA

801 CAACCGCATC CGCCGCCAAA TCGCCGAAAA AGCCGCCGCG CTCGGCTTCG

851 CCCTGCCCGT TCTGGTTCAT CCGGACGCGA CCGTCTCGCC TTCTGCAACA

901 GTCGGACAAG GCAGCGTCGT TATGGCGAAA GCCGTCGTAC AGGCAGGCAG

951 CGTATTGAAA GACGGCGTGA TTGTGAACAC TGCCGCCACC GTCGATCACG

1001 ACTGCCTGCT TAACGCTTTC GTCCACATCA GCCCAGGCGC GCACCTGTCG

1051 GGCAACACGC ATATCGGCGA AGAAAGCTGG ATAGGCACGG GCGCGTGCAG

1101 CCGCCAGCAG ATCCGTATCG GCAGCCGCGC AACCATTGGA GCGGGCGCAG

1151 TCGTCGTACG CGACGTTTCA GACGGCATGA CCGTCGCGGG CAATCCGGCA

1201 AAGCCGCTGC CGCGCAAAAA CCCCGAGACC TCGACAGCAT AA

它对应于氨基酸序列<SEQ ID 14；ORF3-1>：

1 MSKFFKRLFD IVASA SGLIF LSPVFLILIY LIRKNLGSPV FFFQERPGKD

51 GKPFKMVKFR SMRDALDSDG IPLPDGERLT PFGKKLRAAS LDELPELWNI

101 LKGEMSLVGP RPLLMQYLPL YDNFQNRRHE MKPGITGWAQ VNGRNALSWD

151 EKFACDVWYI DHF SLCLDIK ILLLTVKKVL IKEGISAQGE ATMPPFTGKR

201 KLAVVGAGGH GKVVADLAAA LGRYREIVFL DDRAQGSVNG FSVIGTTLLL

251 ENSLSPEQYD VAVAVGNNRI RRQIAEKAAA LGFALPVLVH PDATVSPSAT

301 VGQGSVVMAK AVVQAGSVLK DGVIVNTAAT VDHDCLLNAF VHISPGAHLS

351 GNTHIGEESW IGTGACSRQQ IRIGSRATIG AGAVVVRDVS DGMTVAGNPA

401 KPLPRKNPET STA*

对该氨基酸序列的计算机分析给出下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF3与脑膜炎奈瑟球菌菌株A的ORF(ORF3a)在重叠的286个氨基酸内显示出有93.0％的相同性：

10 20 30

orf3.pep ILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR

|||||| ||||||||||||||||||||||||||||

orf3a MSKFFKRLFDIVASA SGLIFLSPVFLILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR

10 20 30 40 50 60

40 50 60 70 80 90

orf3.pep SMRDGLYSDGIPLPDGERLTPFGKKLRAASXDELPELWNILKGEMSLVGPRPLLMQYLPL

||:|:| |||| |||||||||||||||||| ||||||||:|||:||||||||||||||||

orf3a SMHDALDSDGILLPDGERLTPFGKKLRAASLDELPELWNVLKGDMSLVGPRPLLMQYLPL

70 80 90 100 110 120

100 110 120 130 140 150

orf3.pep YDNFQNRRHEMKPGITGWAQVNGRNALSWDEKFACDVWYIDHFS LCLDIKILLLTVKKVL

|||||||||||||||||||||||||||||||:||||:||||||| ||||||||||||||||

orf3a YDNFQNRRHEMKPGITGWAQVNGRNALSWDERFACDIWYIDHFS LCLDIKILLLTVKKVL

130 140 150 160 170 180

160 170 180 190 200 210

orf3.pep IKEGISAQGEXTMPPFTGKRKLAVVGAGGHGKVVADLAAALGRYREIVFLDDRAQGSVNG

|||||||||| ||||||||||||||||||||||||:|||||| | ||||||||:||||||

orf3a IKEGISAQGEATMPPFTGKRKLAVVGAGGHGKVVAELAAALGTYGEIVFLDDRVQGSVNG

190 200 210 220 230 240

220 230 240 250 260 270

orf3.pep FSVIGTTLLLENSLSPEQYDVAVAVGNNRIRRQIAEKAAALGFALPVLVHPDATVSPSAT

| ||||||||||||||||:|:|||||||||||||||||||||||||||:|||:|||||||

orf3a FPVIGTTLLLENSLSPEQFDIAVAVGNNRIRRQIAEKAAALGFALPVLIHPDSTVSPSAT

250 260 270 280 290 300

280

orf3.pep VGQGSVVMAKAV

||||:|||||||

orf3a VGQGGVVMAKAVVQADSVLKDGVIVNTAATVDHDCLLDAFVHISPGAHLSGNTRIGEESW

310 320 330 340 350 360

全长ORF3a核苷酸序列<SEQ ID 15>是：

1 ATGAGTAAAT TCTTCAAACG CCTGTTTGAC ATTGTTGCCT CCGCCTCGGG

51 ACTGATTTTC CTCTCGCCAG TATTTTTGAT TTTGATATAC CTCATCCGCA

101 AGAATCTGGG TTCGCCCGTC TTCTTCTTTC AGGAACGCCC CGGAAAGGAC

151 GGAAAACCTT TTAAAATGGT CAAATTCCGT TCCATGCACG ACGCGCTTGA

201 TTCAGACGGC ATTCTGCTGC CCGACGGAGA ACGCCTGACA CCGTTCGGCA

251 AAAAACTGCG TGCCGCCAGT TTGGACGAAC TGCCCGAACT GTGGAACGTC

301 CTCAAAGGCG ACATGAGCCT GGTCGGCCCC CGCCCGCTGC TGATGCAATA

351 TCTGCCGCTG TACGACAACT TCCAAAACCG CCGCCACGAA ATGAAACCGG

401 GCATTACCGG CTGGGCGCAG GTCAACGGGC GCAACGCGCT TTCGTGGGAC

451 GAACGCTTCG CATGCGACAT CTGGTATATC GACCACTTCA GCCTGTGCCT

501 CGACATCAAA ATCCTACTGC TGACGGTTAA AAAAGTATTA ATCAAAGAAG

551 GGATTTCCGC ACAGGGCGAA GCCACCATGC CCCCTTTCAC AGGAAAACGC

601 AAACTTGCCG TCGTCGGTGC GGGCGGACAC GGCAAAGTCG TTGCCGAGCT

651 TGCCGCCGCA CTCGGCACAT ACGGCGAAAT CGTTTTTCTG GACGACCGCG

701 TCCAAGGCAG CGTCAACGGC TTCCCCGTCA TCGGCACGAC GCTGCTGCTT

751 GAAAACAGTT TATCGCCCGA ACAATTCGAC ATCGCCGTCG CCGTCGGCAA

801 CAACCGCATC CGCCGCCAAA TCGCCGAAAA AGCCGCCGCG CTCGGCTTCG

851 CCCTGCCCGT CCTGATTCAT CCGGACTCGA CCGTCTCGCC TTCTGCAACA

901 GTCGGACAAG GCGGCGTCGT TATGGCGAAA GCCGTCGTAC AGGCTGACAG

951 CGTATTGAAA GACGGCGTAA TTGTGAACAC TGCCGCCACC GTCGATCACG

1001 ATTGCCTGCT TGATGCTTTC GTCCACATCA GCCCGGGCGC GCACCTGTCG

1051 GGCAACACGC GTATCGGCGA AGAAAGCTGG ATAGGCACAG GCGCGTGCAG

1101 CCGCCAGCAG ATCCGTATCG GCAGCCGCGC AACCATTGGA GCGGGCGCAG

1151 TCGTCGTGCG CGACGTTTCA GACGGCATGA CCGTCGCGGG CAACCCGGCA

1201 AAACCATTGG CAGGCAAAAA TACCGAGACC CTGCGGTCGT AA

预计它编码的蛋白具有下列氨基酸序列<SEQ ID 16>：

1 MSKFFKRLFD IVASA SGLIF LSPVFLILIY LIRKNLGSPV FFFQERPGKD

51 GKPFKMVKFR SMHDALDSDG ILLPDGERLT PFGKKLRAAS LDELPELWNV

101 LKGDMSLVGP RPLLMQYLPL YDNFQNRRHE MKPGITGWAQ VNGRNALSWD

151 ERFACDIWYI DHFS LCLDIK ILLLTVKKVL IKEGISAQGE ATMPPFTGKR

201 KLAVVGAGGH GKVVAELAAA LGTYGEIVFL DDRVQGSVNG FPVIGTTLLL

251 ENSLSPEQFD IAVAVGNNRI RRQIAEKAAA LGFALPVLIH PDSTVSPSAT

301 VGQGGVVMAK AVVQADSVLK DGVIVNTAAT VDHDCLLDAF VHISPGAHLS

351 GNTRIGEESW IGTGACSRQQ IRIGSRATIG AGAVVVRDVS DGMTVAGNPA

401 KPLAGKNTET LRS*

两个跨膜结构域用下划线表示。

ORF3-1与ORF3a在重叠的410个氨基酸中显示出有94.6％的相同性：

10 20 30 40 50 60

orf3a.pep MSKFFKRLFDIVASASGLIFLSPVFLILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf3-1 MSKFFKRLFDIVASASGLIFLSPVFLILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR

10 20 30 40 50 60

70 80 90 100 110 120

orf3a.pep SMHDALDSDGILLPDGERLTPFGKKLRAASLDELPELWNVLKGDMSLVGPRPLLMQYLPL

||:|||||||| |||||||||||||||||||||||||||:|||:||||||||||||||||

orf3-1 SMRDALDSDGIPLPDGERLTPFGKKLRAASLDELPELWNILKGEMSLVGPRPLLMQYLPL

70 80 90 100 110 120

130 140 150 160 170 180

orf3a.pep YDNFQNRRHEMKPGITGWAQVNGRNALSWDERFACDIWYIDHFSLCLDIKILLLTVKKVL

|||||||||||||||||||||||||||||||:||||:|||||||||||||||||||||||

orf3-1 YDNFQNRRHEMKPGITGWAQVNGRNALSWDEKFACDVWYIDHFSLCLDIKILLLTVKKVL

130 140 150 160 170 180

190 200 210 220 230 240

orf3a.pep IKEGISAQGEATMPPFTGKRKLAVVGAGGHGKVVAELAAALGTYGEIVFLDDRVQGSVNG

|||||||||||||||||||||||||||||||||||:|||||| | ||||||||:||||||

orf3-1 IKEGISAQGEATMPPFTGKRKLAVVGAGGHGKVVADLAAALGRYREIVFLDDRAQGSVNG

190 200 210 220 230 240

250 260 270 280 290 300

orf3a.pep FPVIGTTLLLENSLSPEQFDIAVAVGNNRIRRQIAEKAAALGFALPVLIHPDSTVSPSAT

| ||||||||||||||||:|:|||||||||||||||||||||||||||:|||:|||||||

orf3-1 FSVIGTTLLLENSLSPEQYDVAVAVGNNRIRRQIAEKAAALGFALPVLVHPDATVSPSAT

250 260 270 280 290 300

310 320 330 340 350 360

orf3a.pep VGQGGVVMAKAVVQADSVLKDGVIVNTAATVDHDCLLDAFVHISPGAHLSGNTRIGEESW

||||:|||||||||| |||||||||||||||||||||:|||||||||||||||:||||||

orf3-1 VGQGSVVMAKAVVQAGSVLKDGVIVNTAATVDHDCLLNAFVHISPGAHLSGNTHIGEESW

310 320 330 340 350 360

370 380 390 400 410

orf3a.pep IGTGACSRQQIRIGSRATIGAGAVVVRDVSDGMTVAGNPAKPLAGKNTETLRSX

||||||||||||||||||||||||||||||||||||||||||| || ||

orf3-1 IGTGACSRQQIRIGSRATIGAGAVVVRDVSDGMTVAGNPAKPLPRKNPETSTAX

370 380 390 400 410

与枯草芽孢杆菌的yvfc基因(登录号为Z71928)编码的假设蛋白质的同源性

ORF3和YVFC蛋白质在170个氨基酸重叠区域内表现出有55％的氨基酸相同性(BLASTp)：

ORF3 3 IYLIRKNLGSPVFFFQERPGKDGKPFKMVKFRSMRDGLYSDGIPLPDGERLTPFGKKLRA 62

I ++R +GSPVFF Q RPG GKPF + KFR+M D S G LPD RLT G+ +R

yvfc 27 IAVVRLKIGSPVFFKQVRPGLHGKPFTLYKFRTMTDERDSKGNLLPDEVRLTKTGRLIRK 86

ORF3 63 ASXDELPELWNILKGEMSLVGPRPLLMQYLPLYDNFQNRRHEMKPGITGWAQVNGRNALS 122

S DELP+L N+LKG++SLVGPRPLLM YLPLY Q RRHE+KPGITGWAQ+NGRNA+S

yvfc 87 LSIDELPQLLNVLKGDLSLVGPRPLLMDYLPLYTEKQARRHEVKPGITGWAQINGRNAIS 146

ORF3 123 WDEKFACDVWYIDHFSLCLDXXXXXXXXXXXXXXEGISAQGEXTMPPFTG 172

W++KF DVWY+D++S LD EGI T FTG

vvfc 147 WEKKFELDVWYVDNWSFFLDLKILCLTVRKVLVSEGIQQTNHVTAERFTG 196

与淋病奈瑟球菌的预计ORF的同源性

ORF3与淋病奈瑟球菌的预计ORF(ORF3.ng)在重叠的286个氨基酸内显示出有86.3％的相同性：

orf3 ILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR 34

:||||| ||| ||||||::||||||||||||||||

orf3ng MSKAVKRLFDIIASA SGLIVLSPVFLVLIYLIRKNKGSPVFFIRERPGKDGKPFKMVKFR 60

orf3 SMRDGLYSDGIPLPD GERLTPFGKKLRAASXD ELPELWNILKGEMSLVGPRPLLMQYLPL 94

||||:| |||||||| :|||| |||||||:| | |||||||:||||||||||||||||||||

orf3ng SMRDALDSDGIPLPD SERLTDFGKKLRATSLD ELPELWNVLKGEMSLVGPRPLLMQYLPL 120

orf3 YDNFQNRRHEMKPGI TGWAQVNGRNALSWDEK FACDVWYIDHFSLCLDIKILLLTVKKVL 154

|::|||||||||||| ||||||||||||||||| |:||||| |:||: ||:|||:|||||||

orf3ng YNKFQNRRHEMKPGI TGWAQVNGRNALSWDEK FSCDVWYTDNFSFWLDMKILFLTVKKVL 180

orf3 IKEGISAQGEXTMPP FTGKRKLAVVGAGGHGK VVADLAAALGRYREIVFLDDRAQGSVNG 214

|||||||||| |||| |:|:|||||:||||||| |||:|||||| | ||||||||:||||||

orf3ng IKEGISAQGEATMPP FAGNRKLAVIGAGGHGK VVAELAAALGTYGEIVFLDDRTQGSVNG 240

orf3 FSVIGTTLLLENSLS PEQYDVAVAVGNNRIRR QIAEKAAALGFALPVLVHPDATVSPSAT 274

| ||||||||||||| |||:|::|||||||||| ||:|:|||||| ||||:||||||||||

orf3ng FPVIGTTLLLENSLS PEQFDITVAVGNNRIRR QITENAAALGFKLPVLIHPDATVSPSAI 300

orf3 VGQGSVVMAKAV 286

:|||||||||||

orf3ng IGQGSVVMAKAVVQA GSVLKDGVIVNTAATVD HDCLLDAFVHISPGAHLSGNTRIGEESR 360

全长ORF3ng核苷酸序列<SEQ ID 17>是：

1 ATGAGTAAAG CCGTCAAACG CCTGTTCGAC ATCATCGCAT CCGCATCGGG

51 GCTGATTGTC CTGTCGCCCG TGTTTTTGGT TTTAATATAC CTCATCCGCA

101 AAAACTTAGG TTCGCCCGTC TTCTTCattC GGGAACGCCc cgGAAAGGAc

151 ggaaaacCTT TTAAAATGGT CAAATTCCGT TCCAtgcgcg acgcgcttGA

201 TTCAGACGGC ATTCCGCTGC CCGATAGCGA ACGCCTGACC GATTTCGGCA

251 AAAAATTACG CGCCACCAGT TTGGACGAAC TTCCTGAATT ATGGAATGTC

301 CTCAAAGGCG AGATGAGCCT GGTCGGCCCC CGCCCGCTTT TGATGCAGTA

351 TCTGCCGCTT TACAACAAAT TTCAAAACCG CCGCCACGAA ATGAAACCGG

401 GCATTACCGG CTGGGCGCAG GTCAACGGGC GCAACGCGCT TTCGTGGGAC

451 GAAAAGTTCT CCTGCGATGT TTGGTACACC GACAATTTCA GCTTTTGGCT

501 GGATATGAAA ATCCTGTTTC TGACAGTCAA AAAAGTCTTG ATTAAAGAAG

551 GCATTTCGGC GCAAGGGGAA GCCACCATGC CCCCTTTCGC GGGGAATCGC

601 AAACTCGCCG TTATCGGCGC GGGCGGACAC GGCAAAGTCG TTGCCGAGCT

651 TGCCGCCGCA CTCGGCACAT ACGGCGAAAT CGTTTTTCTG GACGACCGCA

701 CCCAAGGCAG CGTCAACGGC TTCCCCGTCA TCGGCACGAC GCTGCTGCTT

751 GAAAACAGTT TATCGCCCGA ACAATTCGAC ATCACCGTCG CCGTCGGCAA

801 CAACCGCATC CGCCGCCAAA TCACCGAAAA CGCCGCCGCG CTCGGCTTCA

851 AACTGCCCGT TCTGATTCAT CCCGACGCGA CCGTCTCGCC TTCTGCAATA

901 ATCGGACAAG GCAGCGTCGT AATGGCGAAA GCCGTCGTAC AGGCCGGCAG

951 CGTATTGAAA GACGGCGTGA TTGTGAACAC TGCCGCCACC GTCGATCACG

1001 ACTGCCTGCT TGACGCTTTC GtccaCATCA GCCCGGGCGC GCACCTGTCG

1051 GGCAACACGC GTATCGGCGA AGAAAGCCGG ATAGGCACGG GCGCGTGCAG

1101 CCGCCAGCAG ACAACCGTCG GCAGCGGGGT TACCgGcgGT GCAGGGgcGG

1151 TTATCGTATG CGACATCCCG GACGGCATGA CCGTCGCGGG CAACCCGGCA

1201 AAGCCCCTTA CGGGCAAAAA CCCCAAGACC GGGACGGCAT AA

它编码的蛋白质具有下列氨基酸序列<SEQ ID 18>：

1 MSKAVKRLFD IIASA SGLIV LSPVFLVLIY LIRKNLGSPV FFIRERPGKD

51 GKPFKMVKFR SMRDALDSDG IPLPDSERLT DFGKKLRATS LDELPELWNV

101 LKGEMSLVGP RPLLMQYLPL YNKFQNRRHE MKPGITGWAQ VNGRNALSWD

151 EKFSCDVWYT DNFSFWLDMK ILFLTVKKVL IKEGISAQGE ATMPPFAGNR

201 KLAVIGAGGH GKVVAELAAA LGTYGEIVFL DDRTQGSVNG FPVIGTTLLL

251 ENSLSPEQFD ITVAVGNNRI RRQITENAAA LGFKLPVLIH PDATVSPSAI

301 IGQGSVVMAK AVVQAGSVLK DGVIVNTAAT VDHDCLLDAF VHISPGAHLS

351 GNTRIGEESR IGTGACSRQQ TT VGSGVTAG AGAVIVCDIP DGMTVAGNPA

401 KPLTGKNPKT GTA*

该蛋白与ORF3-1在重叠的413个氨基酸内有86.9％的相同性：

10 20 30 40 50 60

orf3-1.pep MSKFFKRLFDIVASASGLIFLSPVFLILIYLIRKNLGSPVFFFQERPGKDGKPFKMVKFR

||| ||||||:||||||| ||||||:|||||||||||||||::||||||||||||||||

orf3ng MSKAVKRLFDIIASASGLIVLSPVFLVLIYLIRKNLGSPVFFIRERPGKDGKPFKMVKFR

10 20 30 40 50 60

70 80 90 100 110 120

orf3-1.pep SMFDALDSDGIPLPDGERLTPFGKKLRAASLDELPELWNILKGEMSLVGPRPLLMQYLPL

|||||||||||||||:|||| |||||||:||||||||||:||||||||||||||||||||

orf3ng SMRDALDSDGIPLPDSERLTDFGKKLRATSLDELPELWNVLKGEMSLVGPRPLLMQYLPL

70 80 90 100 110 120

130 140 150 160 170 180

orf3-1.pep YDNFQNRRHEMKPGITGWAQVNGRNALSWDEKFACDVWYIDHFSLCLDIKILLLTVKKVL

|::||||||||||||||||||||||||||||||:||||| |:||: ||:|||:|||||||

orf3ng YNKFQNRRHEMKPGITGWAQVNGRNALSWDEKFSCDVWYTDNFSFWLDMKILFLTVKKVL

130 140 150 160 170 180

190 200 210 220 230 240

orf3-1.pep IKEGISAQGEATMPPFTGKRKLAVVGAGGHGKVVADLAAALGRYREIVFLDDRAQGSVNG

||||||||||||||||:|:|||||:||||||||||:|||||| | ||||||||:||||||

orf3ng IKEGISAQGEATMPPFAGNRKLAVIGAGGHGKVVAELAAALGTYGEIVFLDDRTQGSVNG

190 200 210 220 230 240

250 260 270 280 290 300

orf3-1.pep FSVIGTTLLLENSLSPEQYDVAVAVGNNRIRRQIAEKAAALGFALPVLVHPDATVSPSAT

| ||||||||||||||||:|::||||||||||||:|:|||||| ||||:||||||||||

orf3ng FPVIGTTLLLENSLSPEQFDITVAVGNNRIRRQITENAAALGFKLPVLIHPDATVSPSAI

250 260 270 280 290 300

310 320 330 340 350 360

orf3-1.pep VGQGSVVMAKAVVQAGSVLKDGVIVNTAATVDHDCLLNAFVHISPGAHLSGNTHIGEESW

:||||||||||||||||||||||||||||||||||||:|||||||||||||||:|||||

orf3ng IGQGSVVMAKAVVQAGSVLKDGVIVNTAATVDHDCLLDAFVHISPGAHLSGNTRIGEESR

310 320 330 340 350 360

370 380 390 400 410

orf3-1.pep IGTGACSRQQIRIGSRATIGAGAVVVRDVSDGMTVAGNPAKPLPRKNPETSTAX

|||||||||| :|| :| |||||:| |: ||||||||||||| |||:|:|||

orf3ng IGTGACSRQQTTVGSGVTAGAGAVIVCDIPDGMTVAGNPAKPLTGKNPKTGTAX

370 380 390 400 410

另外，ORF3ng显示出与枯草芽孢杆菌的假设蛋白明显同源：

gnl|PID|e238668(Z71928)假设蛋白[枯草芽孢杆菌]

>gi|1945702|gnl|PID|e313004(Z94043)假设蛋白[枯草芽孢杆菌]>gi|2635938|gnl|PID|e1186113(Z99121)与

荚膜多糖生物合成相似[枯草芽孢杆菌]长度＝202

评分＝235位(594)，估计值＝3e-61

相同性＝114/195(58％)，阳性＝142/195(72％)

询问：5 VKRLFDIIASASGLIVLSPVFLVLIYLIRKNLGSPVFFIRERPGKDGKPFKMVKFRSMRD 64

+KRLFD+ A+ L S + L I ++R +GSPVFF + RPG GKPF + KFR+M D

目标：3 LKRLFDLTAAIFLLCCTSVIILFTIAVVRLKIGSPVFFKQVRPGLHGKPFTLYKFRTMTD 62

询问：65 ALDSDGIPLPDSERLTDFGKKLRATSLDELPELWNVLKGEMSLVGPRPLLMQYLPLYNKF 124

DS G LPD RLT G+ +R S+DELP+L NVLKG++SLVGPRPLLM YLPLY +

目标：63 ERDSKGNLLPDEVRLTKTGRLIRKLSIDELPQLLNVLKGDLSLVGPRPLLMDYLPLYTEK 122

询问：125 QNRRHEMKPGITGWAQVNGRNALSWDEKFSCDVWYTDNFSFWLDMKILFLTVKKVLIKEG 184

Q RRHE+KPGITGWAQ+NGRNA+SW++KF DVWY DN+SF+LD+KIL LTV+KVL+ EG

目标：123 QARRHEVKPGITGWAQINGRNAISWEKKFELDVWYVDNWSFFLDLKILCLTVRKVLVSEG 182

询问：185 ISAQGEATMPPFAGN 199

I T F G+

目标：183 IQQTNHVTAERFTGS 197

yvfc基因的假设产物显示与苜蓿根瘤菌(R.meliloti)的EXOY(一种外多糖产生蛋白(exopolysaccharide production protein))相似。根据这个情况以及同源的淋病奈瑟球菌序列中两个预计的跨膜区，预计这些蛋白或它们的表位可能是疫苗或诊断，或产生抗体的有用抗原。

实施例4

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 19>：

1 ..AACCATATGG CGATTGTCAT CGACGAATAC GGCGGCACAT CCGGCTTGGT

51 CACCTTTGAA GACATCATCG AGCAAATCGT CGGCGAAATC GAAGACGAGT

101 TTGACGAAGA CGATAGCGCC GACAATATCC ATGCCGTTTC TTCAGACACG

151 TGGCGCATCC ATGCAGCTAC CGAAATCGAA GACATCAACA CCTTCTTCGG

201 CACGGAATAC AGCATCGAAG AAGCCGACAC CATT.GGCGG CCTGGTCATT

251 CAAGAGTTGG GACATCTGCC CGTGCGCGGC GAAAAAGTCC TTATCGGCGG

301 TTTGCAGTTC ACCGTCGCAC GCGCCGACAA CCGCCGCCTG CATACGCTGA

351 TGGCGACCCG CGTGAAGTAA GC........ .....ACCGC CGTTTCTGCA

401 CAGTTTAG

它对应于氨基酸序列<SEQ ID 20：ORF5>：

1 ..NHMAIVIDEY GGTSGLVTFE DIIEQIVGEI EDEFDEDDSA DNIHAVSSDT

51 WRIHAATEIE DINTFFGTEY SIEEADTIXR PGHSRVGTSA RARRKSPYRR

101 FAVHRRTRRQ PPPAYADGDP REVS....XR RFCTV*

进一步的序列分析揭示了完整的DNA序列是<SEQ ID 21>：

1 ATGGACGGCG CACAACCGAA AACGAATTTT TTTGAACGCC TGATTGCCCG

51 ACTCGCCCGC GAACCCGATT CCGCCGAAGA CGTATTAAAC CTGCTTCGGC

101 AGGCGCACGA GCAGGAAGTT TTTGATGCGG ATACGCTTTT AAGATTGGAA

151 AAAGTCCTCG ATTTTTCCGA TTTGGAAGTG CGCGACGCGA TGATTACGCG

201 CAGCCGTATG AACGTTTTAA AAGAAAACGA CAGCATCGAG CGCATCACCG

251 CCTACGTTAT CGATACCGCC CATTCGCGCT TCCCCGTCAT CGGCGAAGAC

301 AAAGACGAAG TTTTGGGCAT TTTGCACGCC AAAGACCTGC TCAAATATAT

351 GTTTAACCCC GAGCAGTTCC ACCTCAAATC CATTCTCCGC CCCGCCGTCT

401 TCGTCCCCGA AGGCAAATCG CTGACCGCCC TTTTAAAAGA GTTCCGCGAA

451 CAGCGCAACC ATATGGCGAT TGTCATCGAC GAATACGGCG GCACATCCGG

501 CTTGGTCACC TTTGAAGACA TCATCGAGCA AATCGTCGGC GAAATCGAAG

551 ACGAGTTTGA CGAAGACGAT AGCGCCGACA ATATCCATGC CGTTTCTTCC

601 GAACGCTGGC GCATCCATGC AGCTACCGAA ATCGAAGACA TCAACACCTT

651 CTTCGGCACG GAATACAGCA GCGAAGAAGC CGACACCATT CGGCCTGGTC

701 ATTCAAGAGT TGGGACATCT GCCCGTGCGC GGCGAAAAAG TCCTTATCGG

751 CGGTTTGCAG TTCACCGTCG CACGCGCCGA CAACCGCCGC CTGCATACGC

801 TGATGGCGAC CCGCGTGAAG TAAGCACCGC CGTTTCTGCA CAGTTTAGGA

851 TGACGGTACG GGCGTTTTCT GTTTCAATCC GCCCCATCCG CCAAACATAA

它对应于氨基酸序列<SEQ ID 22；ORF5-1>：

1 MDGAQPKTNF FERLIARLAR EPDSAEDVLN LLRQAHEQEV FDADTLLRLE

51 KVLDFSDLEV RDAMITRSRM NVLKENDSIE RITAYVIDTA HSRFPVIGED

101 KDEVLGILHA KDLLKYMFNP EQFHLKSILR PAVFVPEGKS LTALLKEFRE

151 QRNHMAIVID EYGGTSGLVT FEDIIEQIVG EIEDEFDEDD SADNIHAVSS

201 ERWRIHAATE IEDINTFFGT EYSSEEADTI RPGHSRVGTS ARARRKSPYR

251 RFAVHRRTRR QPPPAYADGD PREVSTAVSA QFRMTVRAFS VSIRPIRQT*

进一步的工作鉴定了脑膜炎奈瑟球菌菌株A中对应的基因<SEQ ID 23>：

1 ATGGACGGCG CACAACCGAA AACAAATTTT TTNNAACGCC TGATTGCCCG

51 ACTCGCCCGC GAACCCGATT CCGCCGAAGA CGTATTGACC CTGTTGCGCC

101 AAGCGCACGA ACAGGAAGTA TTTGATGCGG ATACGCTTTT AAGATTGGAA

151 AAAGTCCTCG ATTTTTCTGA TTTGGAAGTG CGCGACGCGA TGATTACGCG

201 CAGCCGTATG AACGTTTTAA AAGAAAACGA CAGCATCGAA CGCATCACCG

251 CCTACGTTAT CGATACCGCC CATTCGCGCT TCCCCGTCAT CGGTGAAGAC

301 AAAGACGAAG TTTTGGGTAT TTTGCACGCC AAAGACCTGC TCAAATATAT

351 GTTCAACCCC GAGCAGTTCC ACCTCAAATC GATATTGCGC CCTGCCGTCT

401 TCGTCCCCGA AGGCAAATCG CTGACCGCCC TTTTAAAAGA GTTCCGCGAA

451 CAGCGCAACC ATATGGCAAT CGTCATCGAC GAATACGGCG GCACGTCGGG

501 TTTGGTAACT TTTGAAGACA TCATCGAGCA AATCGTCGGC GACATCGAAG

551 ATGAGTTTGA CGAAGACGAA AGCGCGGACA ACATCCACGC CGTTTCCGCC

601 GAACGCTGGC GCATCCACGC GGCTACCGAA ATCGAAGACA TCAACGCCTT

651 TTTCGGCACG GAATACAGCA GCGAAGAAGC CGACACCATC GGCGGCCNTG

701 GTCATTCAGG AATTGGNACA CCTGCCCGTG CGCGGCGAAA AAGTCNTTAT

751 CGGCGNNTTG CANTTCACNG TCGCCNGCGC NGACAACCGC CGCCTGCATA

801 CGCTGATGGC GACCCGCGTG AAGTAAGCTC CGCCGTTTCT GTACAGTTTA

851 GGATGACGGT ACGGGCGTTT TCTGTTTCAA TCCGCCCCAT CCGCCANACA

901 TAA

它编码的蛋白具有以下的氨基酸序列<SEQ ID 24；ORF5a>：

1 MDGAQPKTNF XXRLIARLAR EPDSAEDVLT LLRQAHEQEV FDADTLLRLE

51 KVLDFSDLEV RDAMITRSRM NVLKENDSIE RITAYVIDTA HSRFPVIGED

101 KDEVLGILHA KDLLKYMFNP EQFHLKSILR PAVFVPEGKS LTALLKEFRE

151 QRNHMAIVID EYGGTSGLVT FEDIIEQIVG DIEDEFDEDE SADNIHAVSA

201 ERWRIHAATE IEDINAFFGT EYSSEEADTI GGXGHSGIGT PARARRKSXY

251 RRXAXHXRXR XQPPPAYADG DPREVSSAVS VQFRMTVRAF SVSIRPIRXT

301 *

最初鉴定的部分菌株B序列(ORF5)与ORF5a在重叠的124个氨基酸内显示出有54.7％的相同性：

10 20 30

orf5.pep NHMAIVIDEYGGTSGLVTFEDIIEQIVGEI

||||||||||||||||||||||||||||:|

orf5a FHLKSILRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVGDI

130 140 150 160 170 180

40 50 60 70 80 90

orf5.pep EDEFDEDDSADNIHAVSSDTWRIHAATEIEDINTFFGTEYSIEEADTIXRPGHSRVGTSA

|||||||:|||||||||:: |||||||||||||:||||||| |||||| ||| :|| |

orf5a EDEFDEDESADNIHAVSAERWRIHAATEIEDINAFFGTEYSSEEADTIGGXGHSGIGTPA

190 200 210 220 230 240

100 110 120 130

orf5.pep RARRKSPYRRFAVHRRTRRQPPPAYADGDPREVSXXXXXRRFCTV

|||||| ||| | | |:| |||||||||||||||

orf5a RARRKSXYRRXAXHXRXRXQPPPAYADGDPREVSSAVSVQFRMTVRAFSVSIRPIRXTX

250 260 270 280 290 300

完整的菌株B序列(ORF5-1)和ORF5a在重叠的300个氨基酸中显示出有92.7％的相同性：

10 20 30 40 50 60

orf5a.pep MDGAQPKTNFXXRLIARLAREPDSAEDVLTLLRQAHEQEVFDADTLLRLEKVLDFSDLEV

|||||||||| |||||||||||||||||:||||||||||||||||||||||||||||||

orf5-1 MDGAQPKTNFFERLIARLAREPDSAEDVLNLLRQAHEQEVFDADTLLRLEKVLDFSDLEV

10 20 30 40 50 60

70 80 90 100 110 120

orf5a.pep RDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGEDKDEVLGILHAKDLLKYMFNP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf5-1 RDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGEDKDEVLGILHAKDLLKYMFNP

70 80 90 100 110 120

130 140 150 160 170 180

orf5a.pep EQFHLKSILRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf5-1 EQFHLKSILRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVG

130 140 150 160 170 180

190 200 210 220 230 240

orf5a.pep DIEDEFDEDESADNIHAVSAERWRIHAATEIEDINAFFGTEYSSEEADTIGGXGHSGIGT

:||||||||:|||||||||:|||||||||||||||:|||||||||||||| ||| :||

orf5-1 EIEDEFDEDDSADNIHAVSSERWRIHAATEIEDINTFFGTEYSSEEADTIRP-GHSRVGT

190 200 210 220 230

250 260 270 280 290 300

orf5a.pep PARARRKSXYRRXAXHXRXRXQPPPAYADGDPREVSSAVSVQFRMTVRAFSVSIRPIRXT

||||||| ||| | | |:| |||||||||||||||:|||:||||||||||||||||| |

orf5-1 SARARRKSPYRRFAVHRRTRRQPPPAYADGDPREVSTAVSAQFRMTVRAFSVSIRPIRQT

240 250 260 270 280 290

进一步的工作鉴定了淋病奈瑟球菌中的部分DNA序列<SEQ ID 25>，它编码的蛋白质具有氨基酸序列<SEQ ID 26；ORF5ng>：

1 MDGAQPKTNF FERLIARLAR EPDSAEDVLN LLRQAHEQEV FDADTLTRLE

51 KVLDFAELEV RDAMITRSRM NVLKENDSIE RITAYVIDTA HSRFPVIGED

101 KDEVLGILHA KDLLKYMFNP EQFHLKSVLR PAVFVPEGKS LTALLKEFRE

151 QRNHMAIVID EYGGTSGLVT FEDIIEQIVG DIEDEFDEDE SADDIHSVSA

201 ERWRIHAATE IEDINAFFGT EYGSEEADTI RRLGHSGIGT PARARRKSPY

251 RRFAVHRRPR RQPPPAHADG DPREVSRACP HRRFCTV*

进一步的分析揭示了完整的淋球菌核苷酸序列<SEQ ID 27>是：

1 ATGGACGGCG CACAACCGAA AACAAATTTT TTTGAACGCC TGATTGCCCG

51 ACTCGCCCGC GAACCCGATT CCGCCGAAGA CGTATTAAAC CTGCTTCGGC

101 AGGCGCACGA ACAGGAAGTT TTTGATGCCG ACACACTGAC CCGGCTGGAA

151 AAAGTATTGG ACTTTGCCGA GCTGGAAGTG CGCGATGCGA TGATTACGCG

201 CAGCCGCATG AACGTATTGA AAGAAAACGA CAGCATCGAA CGCATCACCG

251 CCTACGTCAT CGATACCGCC CATTCGCGCT TCCCCGTCAT CGGCGAAGAC

301 AAAGACGAAG TTTTGGGCAT TTTGCACGCC AAAGACCTGC TCAAATATAT

351 GTTCAACCCC GAGCAGTTCC ACCTGAAATC CGTCTTGCGC CCTGCCGTTT

401 TCGTGCCCGA AGGCAAATCT TTGACCGCCC TTTTAAAAGA GTTCCGCGAA

451 CAGCGCAACC ATATGGCAAT CGTCATCGAC GAATACGGCG GCACGTCGGG

501 TTTGGTCACC TTTGAAGACA TCATCGAGCA AATCGTCGGT GACATCGAAG

551 ACGAGTTTGA CGAAGACGAA AGCGccgacg acatCCACTC cgTTTccgCC

601 GAACGCTGGC GCATCCacgc ggctaCCGAA ATCGAAGaca TCAACGCCTT

651 TTTCGGTACG GAatacggca gcgaagaagc cgacaccatc cggcggctTG

701 GTCATTCAGG AATTGGGACA CCTGCCCGTG CGCGGCGAAA AAGTCCTTAt

751 cggcgGTTTG Cagttcaccg tCGCCCGCGC CGACAACCGC CGCCTGCACA

801 CGCTGATGGC GACCCGCGTG AAGTAAGCAG AGCCTGCCcg AccgccgttT

851 CTGCacAGTT TAGGatgACG gtaCGGTCGT TTTCTGTTTC AATCCGCCCC

901 ATCCGCCAAA CATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 28；ORF5ng-1>：

1 MDGAQPKTNF FERLIARLAR EPDSAEDVLN LLRQAHEQEV FDADTLTRLE

51 KVLDFAELEV RDAMITRSRM NVLKENDSIE RITAYVIDTA HSRFPVIGED

101 KDEVLGILHA KDLLKYMFNP EQFHLKSVLR PAVFVPEGKS LTALLKEFRE

151 QRNHMAIVID EYGGTSGLVT FEDIIEQIVG DIEDEFDEDE SADDIHSVSA

201 ERWRIHAATE IEDINAFFGT EYGSEEADTI RRLGHSGIGT PARARRKSPY

251 RRFAVHRRPR RQPPPAHADG DPREVSRACP TAVSAQFRMT VRSFSVSIRP

301 IRQT*

最初鉴定的部分菌株B序列(ORF5)与部分淋球菌序列(ORF5ng)在重叠的135个氨基酸内显示出有83.1％的相同性：

orf5 NHMAIVIDEYGGTSGLVTFEDIIEQIVGEI 30

||||||||||||||||||||||||||||:|

orf5ng FHLKSVLRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVGDI 182

orf5 EDEFDEDDSADNIHAVSSDTWRIHAATEIEDINTFFGTEYSIEEADTIXRPGHSRVGTSA 90

|||||||:|||:||:||:: |||||||||||||:||||||: |||||| | ||| :|| |

orf5ng EDEFDEDESADDIHSVSAERWRIHAATEIEDINAFFGTEYGSEEADTIRRLGHSGIGTPA 242

orf5 RARRKSPYRRFAVHRRTRRQPPPAYADGDPREVSX----RRFCTV 131

|||||||||||||||| |||||||:||||||||| ||||||

orf5ng RARRKSPYRRFAVHRRPRRQPPPAHADGDPREVSRACPHRRFCTV 287

完整的菌株B和淋球菌序列(ORF5-1和ORF5ng-1)在重叠的304个氨基酸中显示出有92.4％的相同性：

10 20 30 40 50 60

orf5ng-1.pep MDGAQPKTNFFERLIARLAREPDSAEDVLNLLRQAHEQEVFDADTLTRLEKVLDFAELEV

|||||||||||||||||||||||||||||||||||||||||||||| ||||||||::|||

orf5-1 MDGAQPKTNFFERLIARLAREPDSAEDVLNLLRQAHEQEVFDADTLLRLEKVLDFSDLEV

10 20 30 40 50 60

70 80 90 100 110 120

orf5ng-1.pep RDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGEDKDEVLGILHAKDLLKYMFNP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf5-1 RDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGEDKDEVLGILHAKDLLKYMFNP

70 80 90 100 110 120

130 140 150 160 170 180

orf5ng-1.pep EQFHLKSVLRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVG

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf5-1 EQFHLKSILRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIVG

130 140 150 160 170 180

190 200 210 220 230 240

orf5ng-1.pep DIEDEFDEDESADDIHSVSAERWRIHAATEIEDINAFFGTEYGSEEADTIRRLGHSGIGT

:||||||||:|||:||:||:|||||||||||||||:||||||:|||||||| ||| :||

orf5-1 EIEDEFDEDDSADNIHAVSSERWRIHAATEIEDINTFFGTEYSSEEADTIRP-GHSRVGT

190 200 210 220 230

250 260 270 280 290 300

orf5ng-1.pep PARARRKSPYRRFAVHRRPRRQPPPAHADGDPREVSRACPTAVSAQFRMTVRSFSVSIRP

||||||||||||||||| |||||||:||||||||| ||||||||||||:|||||||

orf5-1 SARARRKSPYRRFAVHRRTRRQPPPAYADGDPREVS----TAVSAQFRMTVRAFSVSIRP

240 250 260 270 280 290

orf5ng-1.pep IRQTX

|||||

orf5-1 IRQTX

300

这些氨基酸序列的计算机分析表明了一个推定的前导序列，并鉴定了下列同源性：

与流感嗜血菌的溶血素同系物TlyC(登录号为U32716)的同源性

ORF5和TlyC蛋白在重叠的77个氨基酸内有58％的相同性(BLASTp)。

ORF5 2 HMAIVIDEYGGTSGLVTFEDIIEQIVGEIEDEFDEDDSADNIHAVSSDTWRIHAATEIED 61

HMAIV+DE+G SGLVT EDI+EQIVG+IEDEFDE++ AD I +S T+ + A T+I+D

TlyC 166 HMAIVVDEFGAVSGLVTIEDILEQIVGDIEDEFDEEEIAD-IRQLSRHTYAVRALTDIDD 224

ORF5 62 INTFFGTEYSIEEADTI 78

N F T++ EE DTI

TlyC 225 FNAQFNTDFDDEEVDTI 241

ORF5ng-1还显示出与TlyC明显同源：

评分Init1：301 Initn：419 Opt：668

Smith-Waterman评分：668；242个重叠的氨基酸内有45.9％的相同性

10 20 30 40 50

orf5ng-1.pep MDGAQPKTNFFERLIARLAR-EPDSAEDVLNLLRQAHEQEVFDADTLTRLEK

| ||: |::|: : | : |::::::|::::::::| :| :|

tlyc_haein MNDEQQNSNQSENTKKPFFQSLFGRFFQGELKNREELVEVIRDSEQNDLIDQNTREMIEG

10 20 30 40 50 60

60 70 80 90 100 109

orf5ng-1.pep VLDFAELEVRDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGE--DKDEVLGILH

|:::|||:||| || ||:: :::::::: :|::||||||||:: |:|:::||||

tlyc_haein VMEIAELRVRDIMIPRSQIIFIEDQQDLNTCLNTIIESAHSRFPVIADADDRDNIVGILH

70 80 90 100 110 120

110 120 130 140 150 160

orf5ng-1.pep AKDLLKYMF-NPEQFHLKSVLRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGL

||||||:: : | | |:|:|||:|:|||:| : :||:|| :| |||||:||:|::|||

tlyc_haein AKDLLKFLREDAEVFDLSSLLRPVVIVPESKRVDRMLKDFRSERFHMAIVVDEFGAVSGL

130 140 150 160 170 180

170 180 190 200 210 220

orf5ng-1.pep VTFEDIIEQIVGDIEDEFDEDESADDIHSVSAERWRIHAATEIEDINAFFGTEYGSEEAD

||:|||:|||||||||||||:| || |:::| : : ::| |:|:|:|| |:|:: :||:|

tlyc_haein VTIEDILEQIVGDIEDEFDEEEIAD-IRQLSRHTYAVRALTDIDDFNAQFNTDFDDEEVD

190 200 210 220 230

230 240 250 260 270 280

orf5ng-1.pep TIRRLGHSGIG-TPARARRKSPYRRFAVHRRPRRQPPPAHADGDPREVSRACPTAVSAQF

|| | : :| | |:

tlyc_haein TIGGLIMQTFGYLPKRGEEIILKNLQFKVTSADSRRLIQLRVTVPDEHLAEMNNVDEKSE

240 250 260 270 280 290

与大肠杆菌的假设分泌蛋白的同源性：

ORF5显示出与大肠杆菌的一种假设分泌蛋白有同源性：

sp|P77392|YBEX_ECOLI CUTE-ASNB基因间区域中假设的33.3KD蛋白

>gi|1778577(U82598)与流感嗜血菌相似[大肠杆菌]>gi|1786879(AE000170)f292；该292aa ORF与约440aa

蛋白的272个残基有23％的相同性(9个空隙)YTFL_HAEIN SW：P44717[大肠杆菌]长度＝292

评分＝212位(533)，估计值＝3e-54

相同性＝112/230(48％)，阳性＝149/230(64％)，空隙＝3/230(1％)

询问：2 DGAQPKTNFXXRLIARLAR-EPDSAEDVLTLLRQAHEQEVFDADTLLRLEKVLDFSDLEV 60

D K F L+++L EP + +++L L+R + + ++ D DT LE V+D +D V

目标：10 DTISNKKGFFSLLLSQLFHGEPKNRDELLALIRDSGQNDLIDEDTRDMLEGVMDIADQRV 69

询问：61 RDAMITRSRMNVLKENDSIERITAYVIDTAHSRFPVIGEDKDEVLGILHAKDLLKYM-FN 119

RD MI RS+M LK N +++ +I++AHSRFPVI EDKD + GIL AKDLL +M +

目标：70 RDIMIPRSQMITLKRNQTLDECLDVIIESAHSRFPVISEDKDHIEGILMAKDLLPFMRSD 129

询问：120 PEQFHLKSILRPAVFVPEGKSLTALLKEFREQRNHMAIVIDEYGGTSGLVTFEDIIEQIV 179

E F + +LR AV VPE K + +LKEFR QR HMAIVIDE+GG SGLVT EDI+E IV

目标：130 AEAFSMDKVLRQAVVVPESKRVDRMLKEFRSQRYHMAIVIDEFGGVSGLVTIEDILELIV 189

询问：180 GDIEDEFDEDESADNIHAVSAERWRIHAATEIEDINAFFGTEYSSEEADT 229

G+IEDE+DE++ D +S W + A IED N FGT +S EE DT

目标：190 GEIEDEYDEEDDID-FRQLSRHTWTVRALASIEDFNEAFGTHFSDEEVDT 238

根据该分析，包括与流感嗜血菌的TlyC溶血素同系物的氨基酸同源性(溶血素是分泌的蛋白质)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白是分泌性的，因此可用作疫苗或诊断用的抗原。

如上所述，将ORF5-1(30.7kDa)克隆到pGex中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图2A显示了GST-融合蛋白亲和纯化的结果。用纯化的GST-融合蛋白免疫小鼠，将小鼠的血清用于Western印迹分析(图1B)。这些实验确认ORF5-1是外露的蛋白，且是有用的免疫原。

实施例5

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 29>：

1 ATGCGCGGCG GCAGGCCGGA TTCCGTTACC GTGCAGATTA TCGAAGGTTC

51 GCGTTTTTCG CATATGAGGA AAGTCATCGA CGCAACGCCC GACATCGGAC

101 ACGACACCAA AGGCTGGAGC AATGAAAAAC TGATGGCGGA AGTTGCGCCC

151 GATGCCTTCA GCGGCAATCC TGAAgGGCAG TTTTTCCCCG ACAGCTACGA

201 AATCGATGCG GGCGGCAGTG ATTTGCAGAT TTACCAAACC GCCTACAA

G

251 GCGATGCAAC GCCGCCTGAA TGA GGCATG GGAAAGCAGG CAGGACGGGC

301 TGCCTTATAA AAACCCTTAT GAAATGCTGA TTATGGCGAr CCTGGTCGAA

351 AAGGAAACAG GGCATGAAGC CGAsCsCGAC CATGTcGCTT CCGTCTTCGT

401 CAACCGCCTG AAAATCGGTA TGCGCCTGCA AACCgAssCG TCCGTGATTT

451 ACGGCATGGG TGCGGCATAC AAGGGCAAAA TCCGTAAAGC CGACCTGCGC

501 CGCGACACGC CGTACAACAC CTACACGCGC GGCGGTCTGC CGCCAACCCC

551 GATTGCGCTG CCC..

它对应于氨基酸序列<SEQ ID 30；ORF7>：

1 MRGGRPDSVT VQIIEGSRFS HMRKVIDATP DIGHDTKGWS NEKLMAEVAP

51 DAFSGNPEGQ FFPDSYEIDA GGSDLQIYQT AYKAMQRRLN EAWESRQDGL

101 PYKNPYEMLI MAXLVEKETG HEAXXDHVAS VFVNRLKIGM RLQTXXSVIY

151 GMGAAYKGKI RKADLRRDTP YNTYTRGGLP PTPIALP.

进一步的序列分析揭示了完整的DNA序列<SEQ ID 31>：

1 ATGTTGAGAA AATTGTTGAA ATGGTCTGCC GTTTTTTTGA CCGTGTCGGC

51 AGCCGTTTTC GCCGCGCTGC TTTTTGTTCC TAAGGATAAC GGCAGGGCAT

101 ACCGAATCAA AATTGCCAAA AACCAGGGTA TTTCGTCGGT CGGCAGGAAA

151 CTTGCCGAAG ACCGCATCGT GTTCAGCAGG CATGTTTTGA CGGCGGCGGC

201 CTACGTTTTG GGTGTGCACA ACAGGCTGCA TACGGGGACG TACAGATTGC

251 CTTCGGAAGT GTCTGCTTGG GATATCTTGC AGAAAATGCG CGGCGGCAGG

301 CCGGATTCCG TTACCGTGCA GATTATCGAA GGTTCGCGTT TTTCGCATAT

351 GAGGAAAGTC ATCGACGCAA CGCCCGACAT CGGACACGAC ACCAAAGGCT

401 GGAGCAATGA AAAACTGATG GCGGAAGTTG CGCCCGATGC CTTCAGCGGC

451 AATCCTGAAG GGCAGTTTTT CCCCGACAGC TACGAAATCG ATGCGGGCGG

501 CAGTGATTTG CAGATTTACC AAACCGCCTA CAAGGCGATG CAACGCCGCC

551 TGAATGAGGC ATGGGAAAGC AGGCAGGACG GGCTGCCTTA TAAAAACCCT

601 TATGAAATGC TGATTATGGC GAGCCTGGTC GAAAAGGAAA CAGGGCATGA

651 AGCCGACCGC GACCATGTCG CTTCCGTCTT CGTCAACCGC CTGAAAATCG

701 GTATGCGCCT GCAAACCGAC CCGTCCGTGA TTTACGGCAT GGGTGCGGCA

751 TACAAGGGCA AAATCCGTAA AGCCGACCTG CGCCGCGACA CGCCGTACAA

801 CACCTACACG CGCGGCGGTC TGCCGCCAAC CCCGATTGCG CTGCCCGGCA

851 AGGCGGCACT CGATGCCGCC GCCCATCCGT CCGGCGAAAA ATACCTGTAT

901 TTCGTGTCCA AAATGGACGG CACGGGCTTG AGCCAGTTCA GCCATGATTT

951 GACCGAACAC AATGCCGCCG TCCGCAAATA TATTTTGAAA AAATAA

它对应于氨基酸序列<SEQ ID 32；ORF7-1>：

1 MLRKLLKWSA VFLTVSAAVF AALLFVPKDN GRAYRIKIAK NQGISSVGRK

51 LAEDRIVFSR HVLTAAAYVL GVHNRLHTGT YRLPSEVSAW DILQKMRGGR

101 PDSVTVQIIE GSRFSHMRKV IDATPDIGHD TKGWSNEKLM AEVAPDAFSG

151 NPEGQFFPDS YEIDAGGSDL QIYQTAYKAM QRRLNEAWES RQDGLPYKNP

201 YEMLIMASLV EKETGHEADR DHVASVFVNR LKIGMRLQTD PSVIYGMGAA

251 YKGKIRKADL RRDTPYNTYT RGGLPPTPIA LPGKAALDAA AHPSGEKYLY

301 FVSKMDGTGL SQFSHDLTEH NAAVRKYILK K*

该氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的yceg基因(登录号为P44270)编码的假设蛋白的同源性

ORF7和yceg蛋白在重叠的192个氨基酸内显示出有44％的氨基酸相同性：

ORF7 1 MRGGRPDSVTVQIIEGSRFSHMRKVIDATPDIGHDTKGWSNEKLMA-----EVAPDAFSG 55

+ G+ V+ IEG F RK ++ P + K SNE++ A ++ +

yceg 102 LNSGKEVQFNVKWIEGKTFKDWRKDLENAPHLVQTLKDKSNEEIFALLDLPDIGQNLELK 161

ORF7 56 NPEGQFFPDSYEIDAGGSDLQIYQTAYKAMQRRLNEAWESRQDGLPYKNPYEMLIMAXLV 115

N EG +PD+Y +DL++ + + + M++ LN+AW R + LP NPYEMLI+A +V

yceg 162 NVEGWLYPDTYNYTPKSTDLELLKRSAERMKKALNKAWNERDEDLPLANPYEMLILASIV 221

ORF7 116 EKETGHEAXXDHVASVFVNRLKIGMRLQTXXSVIYGMGAAYKGKIRKADLRRDTPYNTYT 175

EKETG VASVF+NRLK M+LQT +VIYGMG Y G IRK DL TPYNTY

yceg 222 EKETGIANERAKVASVFINRLKAKMKLQTDPTVIYGMGENYNGNIRKKDLETKTPYNTYV 281

ORF7 176 RGGLPPTPIALP 187

GLPPTPIA+P

yceg 282 IDGLPPTPIAMP 293

全长YCEG蛋白具有以下序列：

1 MKKFLIAILL LILILAGVAS FSYYKMTEFV KTPVNVQADE LLTIERGTTS

51 SKLATLFEQE KLIADGKLLP YLLKLKPELN KIKAGTYSLE NVKTVQDLLD

101 LLNSGKEVQF NVKWIEGKTF KDWRKDLENA PHLVQTLKDK SNEEIFALLD

151 LPDIGQNLEL KNVEGWLYPD TYNYTPKSTD LELLKRSAER MKKALNKAWN

201 ERDEDLPLAN PYEMLILASI VEKETGIANE RAKVASVFIN RLKAKMKLQT

251 DPTVIYGMGE NYNGNIRKKD LETKTPYNTY VIDGLPPTPI AMPSESSLQA

301 VANPEKTDFY YFVADGSGGH KFTRNLNEHN KAVQEYLRWY RSQKNAK

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF7与脑膜炎奈瑟球菌菌株A的ORF(ORF7a)在重叠的187个氨基酸内显示出有95.2％的相同性：

10 20 30

orf7.pep MRGGRPDSVTVQIIEGSRFSHMRKVIDATP

||||||||||||||||||||||||||||||

orf7a AAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPDSVTVQIIEGSRFSHMRKVIDATP

70 80 90 100 110 120

40 50 60 70 80 90

orf7.pep DIGHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLQIYQTAYKAMQRRLN

|| |||||||||||||||||||||||||||||||||||||||||:||| ||||||||||

orf7a DIEHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLRIYQIAYKAMQRRLN

130 140 150 160 170 180

100 110 120 130 140 150

orf7.pep EAWESRQDGLPYKNPYEMLIMAXLVEKETGHEAXXDHVASVFVNRLKIGMRLQTXXSVIY

|||||||||||||||||||||| |:|||||||| ||||||||||||||||||| ||||

orf7a EAWESRQDGLPYKNPYEMLIMASLIEKETGHEADRDHVASVFVNRLKIGMRLQTDPSVIY

190 200 210 220 230 240

160 170 180

orf7.pep GMGAAYKGKIRKADLRRDTPYNTYTRGGLPPTPIALP

|||||||||||||||||||||||||||||||||||||

orf7a GMGAAYKGKIRKADLRRDTPYNTYTRGGLPPTPIALPGKAALDAAAHPSGEKYLYFVSKM

250 260 270 280 290 300

orf7a DGTGLSQFSHDLTEHNAAVRKYILKKX

310 320 330

全长ORF7a核苷酸序列<SEQ ID 33>是：

1 ATGTTGAGAA AATTGTTGAA ATGGTCTGCC GTTTTTTTGA CCGTATCGGC

51 AGCCGTTTTC GCCGCGCTGC TTTTCGTCCC TAAAGACAAC GGCAGGGCAT

101 ACAGGATTAA AATTGCCAAA AACCAGGGTA TTTCGTCGGT CGGCAGGAAA

151 CTTGCCGAAG ACCGCATCGT GTTCAGCAGG CATGTTTTGA CGGCGGCGGC

201 CTACGTTTTG GGTGTGCACA ACAGGCTGCA TACGGGGACG TACAGACTGC

251 CTTCGGAAGT GTCTGCTTGG GATATCTTGC AGAAAATGCG CGGCGGCAGG

301 CCGGATTCCG TTACCGTGCA GATTATCGAA GGTTCGCGTT TTTCGCATAT

351 GAGGAAAGTC ATCGACGCAA CGCCCGACAT CGAACACGAC ACCAAAGGCT

401 GGAGCAATGA AAAACTGATG GCGGAAGTTG CCCCTGATGC CTTCAGCGGC

451 AATCCTGAAG GGCAGTTTTT CCCCGACAGC TACGAAATCG ATGCGGGCGG

501 CAGCGATTTA CGGATTTACC AAATCGCCTA CAAGGCGATG CAACGCCGAC

551 TGAATGAGGC ATGGGAAAGC AGGCAGGACG GGCTGCCTTA TAAAAACCCT

601 TATGAAATGC TGATTATGGC GAGCCTGATC GAAAAGGAAA CAGGGCATGA

651 AGCCGACCGC GACCATGTCG CTTCCGTCTT CGTCAACCGC CTGAAAATCG

701 GTATGCGCCT GCAAACCGAC CCGTCCGTGA TTTACGGCAT GGGTGCGGCA

751 TACAAGGGCA AAATCCGTAA AGCCGACCTG CGCCGCGACA CGCCGTACAA

801 CACCTACACG CGCGGCGGTC TGCCGCCAAC CCCGATCGCG CTGCCCGGCA

851 AGGCGGCACT CGATGCCGCC GCCCATCCGT CCGGTGAAAA ATACCTGTAT

901 TTCGTGTCCA AAATGGACGG TACGGGCTTG AGCCAGTTCA GCCATGATTT

951 GACCGAACAC AACGCCGCCG TTCGCAAATA TATTTTGAAA AAATAA

预计它编码的蛋白质具有氨基酸序列<SEQ ID 34>：

1 MLRKLLKWSA VFLTVSAAVF AALLFVPKDN GRAYRIKIAK NQGISSVGRK

51 LAEDRIVFSR HVLTAAAYVL GVHNRLHTGT YRLPSEVSAW DILQKMRGGR

101 PDSVTVQIIE GSRFSHMRKV IDATPDIEHD TKGWSNEKLM AEVAPDAFSG

151 NPEGQFFPDS YEIDAGGSDL RIYQIAYKAM QRRLNEAWES RQDGLPYKNP

201 YEMLIMASLI EKETGHEADR DHVASVFVNR LKIGMRLQTD PSVIYGMGAA

251 YKGKIRKADL RRDTPYNTYT RGGLPPTPIA LPGKAALDAA AHPSGEKYLY

301 FVSKMDGTGL SQFSHDLTEH NAAVRKYILK K*

前导肽用下划线表示。

ORF7a和ORF7-1在重叠的133个氨基酸内显示出有98.1％的相同性：

10 20 30 40 50 60

orf7a.pep MLRKLLKWSAVFLTVSAAVFAALLFVPKDNGRAYRIKIAKNQGISSVGRKLAEDRIVFSR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7-1 MLRKLLKWSAVFLTVSAAVFAALLFVPKDNGRAYRIKIAKNQGISSVGRKLAEDRIVFSR

10 20 30 40 50 60

70 80 90 100 110 120

orf7a.pep HVLTAAAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPDSVTVQIIEGSRFSHMRKV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7-1 HVLTAAAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPDSVTVQIIEGSRFSHMRKV

70 80 90 100 110 120

130 140 150 160 170 180

orf7a.pep IDATPDIEHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLRIYQIAYKAM

||||||| ||||||||||||||||||||||||||||||||||||||||||:||| |||||

orf7-1 IDATPDIGHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLQIYQTAYKAM

130 140 150 160 170 180

190 200 210 220 230 240

orf7a.pep QRRLNEAWESRQDGLPYKNPYEMLIMASLIEKETGHEADRDHVASVFVNRLKIGMRLQTD

|||||||||||||||||||||||||||||:||||||||||||||||||||||||||||||

orf7-1 QRRLNEAWESRQDGLPYKNPYEMLIMASLVEKETGHEADRDHVASVFVNRLKIGMRLQTD

190 200 210 220 230 240

250 260 270 280 290 300

orf7a.pep PSVIYGMGAAYKGKIRKADLRRDTPYNTYTRGGLPPTPIALPGKAALDAAAHPSGEKYLY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7-1 PSVIYGMGAAYKGKIRKADLRRDTPYNTYTRGGLPPTPIALPGKAALDAAAHPSGEKYLY

250 260 270 280 290 300

310 320 330

orf7a.pep FVSKMDGTGLSQFSHDLTEHNAAVRKYILKKX

||||||||||||||||||||||||||||||||

orf7-1 FVSKMDGTGLSQFSHDLTEHNAAVRKYILKKX

310 320 330

与淋病奈瑟球菌的预计ORF的同源性

ORF7与淋病奈瑟球菌的预计ORF(ORF7.ng)在重叠的187个氨基酸内显示出有94.7％的相同性：

orf7 MRGGRPDSVTVQIIEGSRFSHMRKVIDATPDIGHDTKGWSNEKLMAEVAPDAFSGNPEGQ 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7ng MRGGRPDSVTVQIIEGSRFSHMRKVIDATPDIGHDTKGWSNEKLMAEVAPDAFSGNPEGQ 60

orf7 FFPDSYEIDAGGSDLQIYQTAYKAMQRRLNEAWESRQDGLPYKNPYEMLIMAXLVEKETG 120

||||||||||||||||||||||||||||||||| :||||||||||||||||| |:|||||

orf7ng FFPDSYEIDAGGSDLQIYQTAYKAMQRRLNEAWAGRQDGLPYKNPYEMLIMASLIEKETG 120

orf7 HEAXXDHVASVFVNRLKIGMRLQTXXSVIYGMGAAYKGKIRKADLRRDTPYNTYTRGGLP 180

||| ||||||||||||||||||| ||||||||||||||||||||||||||||| ||||

orf7ng HEADRDHVASVFVNRLKIGMRLQTDPSVIYGMGAAYKGKIRKADLRRDTPYNTYTGGGLP 180

orf7 PTPIALP 187

|| ||||

orf7ng PTRIALPGKAAMDAAAHPSGEKYLYFVSKMDGTGLSQFSHDLTEHNAAVRKYILKK 236

预计ORF7ng核苷酸序列<SEQ ID 35>编码的蛋白质具有氨基酸序列<SEQ ID36>：

1 MRGGRPDSVT VQIIEGSRFS HMRKVIDATP DIGHDTKGWS NEKLMAEVAP

51 DAFSGNPEGQ FFPDSYEIDA GGSDLQIYQT AYKAMQRRLN EAWAGRQDGL

101 PYKNPYEMLI MASLIEKETG HEADRDHVAS VFVNRLKIGM RLQTDPSVIY

151 GMGAAYKGKI RKADLRRDTP YNTYTGGGLP PTRIALPGKA AMDAAAHPSG

201 EKYLYFVSKM DGTGLSQFSH DLTEHNAAVR KYILKK*

进一步的序列分析揭示了ORF7ng的部分DNA序列<SEQ ID 37>：

1 ..taccgaatca AGATTGCCAA AAATCAGGGT ATTTCGTCGG TCGGCAGGAA

51 ACTTGCcgaA GACCGCATCG TGTTCAGCAG GCATGTTTTG ACAGCGGCGG

101 CCTACGTTTT GGGTGTGCAC AACAGGCTGC ATACGGGGAC gTACAGATTG

151 CCTTCGGAAG TGTCTGCTTG GGATATCTTG CAGAAAATGC GCGGCGGCAG

201 GCCGGATTCC GTTACCGTGC AGATTATCGA AGGTTCGCGT TTTTCGCATA

251 TGAGGAAAGT CATCGACGCA ACGCCCGACA TCGGACACGA CACCAAAGGC

301 TGGAGCAATG AAAAACTGAT GGCGGAAGTT GCGCCCGATG CCTTCAGCGG

351 CAATCCTGAA GGGCAGTTTT TTCCCGACAG CTACGAAATC GATGCGGGCG

401 GCAGCGATTT GCAGATTTAC CAAACCGCCT ACAAGGCGAT GCAACGCCGC

451 CTGAACGAGG CATGGGCAGG CAGGCAGGAC GGGCTGCCTT ATAAAAACCC

501 TTATGAAATG CTGATTATGG CGAGCCTGAT CGAAAAGGAA ACGGGGCATG

551 AGGCCGACCG CGACCATGTC GCTTCCGTCT TCGTCAACCG CCTGAAAATC

601 GGTATGCGCC TGCAAACCGA CCCGTCCGTG ATTTACGGCA TGGGTGCGGC

651 ATACAAGGGC AAAATCCGTA AAGCCGACCT GCGCCGCGAC ACGCCGTACA

701 aCAccTAtac gggcgggggc ttgccgccaa cccggattgc gctgcccggC

751 Aaggcggcaa tggatgccgc cgcccacccg tccggcgaAa aatacctgTa

801 tttcgtgtcC AAAATGGACG GCACGGGCTT GAGCCAGTTC AGCCATGATT

851 TGACCGAACA CAACGCCGCc gTcCGCAAAT ATATTTTGAA AAAATAA

它对应于氨基酸序列<SEQ ID 38：ORF7ng-1>：

1 ..YRIKIAKNQG ISSVGRKLAE DRIVFSRHVL TAAAYVLGVH NRLHTGTYRL

51 PSEVSAWDIL QKMRGGRPDS VTVQIIEGSR FSHMRKVIDA TPDIGHDTKG

101 WSNEKLMAEV APDAFSGNPE GQFFPDSYEI DAGGSDLQIY QTAYKAMQRR

151 LNEAWAGRQD GLPYKNPYEM LIMASLIEKE TGHEADRDHV ASVFVNRLKI

201 GMRLQTDPSV IYGMGAAYKG KIRKADLRRD TPYNTYTGGG LPPTRIALPG

251 KAAMDAAAHP SGEKYLYFVS KMDGTGLSQF SHDLTEHNAA VRKYILKK*

ORF7ng-1和ORF7-1在重叠的298个氨基酸内有98.0％的相同性：

10 20 30 40 50 60

orf7-1.pep KLLKWSAVFLTVSAAVFAALLFVPKDNGRAYRIKIAKNQGISSVGRKLAEDRIVFSRHVL

||||||||||||||||||||||||||||||

orf7ng-1 YRIKIAKNQGISSVGRKLAEDRIVFSRHVL

10 20 30

70 80 90 100 110 120

orf7-1.pep TAAAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPDSVTVQIIEGSRFSHMRKVIDA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7ng-1 TAAAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPDSVTVQIIEGSRFSHMRKVIDA

40 50 60 70 80 90

130 140 150 160 170 180

orf7-1.pep TPDIGHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLQIYQTAYKAMQRR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf7ng-1 TPDIGHDTKGWSNEKLMAEVAPDAFSGNPEGQFFPDSYEIDAGGSDLQIYQTAYKAMQRR

100 110 120 130 140 150

190 200 210 220 230 240

orf7-1.pep LNEAWESRQDGLPYKNPYEMLIMASLVEKETGHEADRDHVASVFVNRLKIGMRLQTDPSV

||||| :|||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf7ng-1 LNEAWAGRQDGLPYKNPYEMLIMASLIEKETGHEADRDHVASVFVNRLKIGMRLQTDPSV

160 170 180 190 200 210

250 260 270 280 290 300

orf7-1.pep IYGMGAAYKGKIRKADLRRDTPYNTYTRGGLPPTPIALPGKAALDAAAHPSGEKYLYFVS

||||||||||||||||||||||||||| |||||| ||||||||:||||||||||||||||

orf7ng-1 IYGMGAAYKGKIRKADLRRDTPYNTYTGGGLPPTRIALPGKAAMDAAAHPSGEKYLYFVS

220 230 240 250 260 270

310 320 330

orf7-1.pep KMDGTGLSQFSHDLTEHNAAVRKYILKKX

|||||||||||||||||||||||||||||

orf7ng-1 KMDGTGLSQFSHDLTEHNAAVRKYILKKX

280 290

另外，ORF7ng-1显示出与一种假设的大肠杆菌蛋白明显同源：

sp|P28306|YCEG_ECOLI PABC-HOLB基因间区域中假设的38.2KD蛋白gi|1787339(AE000210)o340；与YCEG_ECOLI

片段100％相同SW：P28306但有97个附加的C端残基[大肠杆菌]长度＝340

评分＝79(36.2位)，估计值＝5.0e-57，Sum P(2)＝5.0e-57

相同性＝20/87(22％)，阳性＝40/87(45％)

询问： 10 GISSVGRKLAEDRIVFSRHVLTAAAYVLGVHNRLHTGTYRLPSEVSAWDILQKMRGGRPD 69

G ++G +L D+I+ V + + GTYR +++ ++L+ + G+

目标： 49 GRLALGEQLYADKIINRPRVFQWLLRIEPDLSHFKAGTYRFTPQMTVREMLKLLESGKEA 108

询问： 70 SVTVQIIEGSRFSHMRKVIDATPDIGH 96

++++EG R S K + P I H

目标：109 QFPLRLVEGMRLSDYLKQLREAPYIKH 135

评分＝438(200.7位)，估计值＝5.0e-57，Sum P(2)＝5.0e-57

相同性＝84/155(54％)，阳性＝111/155(71％)

询问：120 EGQFFPDSYEIDAGGSDLQIYQTAYKAMQRRLNEAWAGRQDGLPYKNPYEMLIMASLIEK 179

EG F+PD++ A +D+ + + A+K M + ++ AW GR DGLPYK+ +++ MAS+IEK

目标：158 EGWFWPDTWMYTANTTDVALLKRAHKKMVKAVDSAWEGRADGLPYKDKNQLVTMASIIEK 217

询问：180 ETGHEADRDHVASVFVNRLKIGMRLQTDPSVIYGMGAAYKGKIRKADLRRDTPYNTYTGG 239

ET ++RD VASVF+NRL+IGMRLQTDP+VIYGMG Y GK+ +ADL T YNTYT

目标：218 ETAVASERDKVASVFINRLRIGMRLQTDPTVIYGMGERYNGKLSRADLETPTAYNTYTIT 277

询问：240 GLPPTRIALPGKAAMDAAAHPSGEKYLYFVSKMDG 274

GLPP IA PG ++ AAAHP+ YLYFV+ G

目标：278 GLPPGAIATPGADSLKAAAHPAKTPYLYFVADGKG 312

根据该分析，包括流感嗜血菌YCEG蛋白具有一个可能的前导序列这一事实，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白及其表位可能是疫苗或诊断，或产生抗体的有用抗原。

实施例6

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 39>：

1 CGTTTCAAAA TGTTAACTGT GTTGACGGCA ACCTTGATTG CCGGACAGGT

51 ATCTGCCGCC GGAGGCGGTG CGGGGGATAT GAAACAGCCG AAGGAAGTCG

101 GAAAGGTTTT CAGAAAGCAG CAGCGTTACA GCGAGGAAGA AATCAAAAAC

151 GAACGCGCAC GGCTTGCGGC AGTGGGCGAG CGGGTTAATC AGATATTTAC

201 GTTGCTGGGA GGGGAAACCG CCTTGCAAAA GGGGCAGGCG GGAACGGCTC

251 TGGCAACCTA TATGCTGATG TTGGAACGCA CAAAATCCCC CGAAGTCGCC

301 GAACGCGCCT TGGAAATGGC CGTGTCGCTG AACGCGTTTG AACAGGCGGA

351 AATGATTTAT CAGAAATGGC GGCAGATTGA GCCTATACCG GGTAAGGCGC

401 AAAAACGGGC GGGGTGGCTG CGGAACGTGC TGAGGGAAAG AGGAAATCAG

451 CATCTGGACG GACGGGAAGA AGTGCTGGCT CAGGCGGACG AAGGACAG

它对应于氨基酸序列<SEQ ID 40；ORF9>：

1 .. RFKMLTVLTA TLIAGQVSAA GGGAGDMKQP KEVGKVFRKQ QRYSEEEIKN

51 ERARLAAVGE RVNQIFTLLG GETALQKGQA GTALATYMLM LERTKSPEVA

101 ERALEMAVSL NAFEQAEMIY QKWRQIEPIP GKAQKRAGWL RNVLRERGNQ

151 HLDGREEVLA QADEGQ

进一步的序列分析揭示了完整的DNA序列<SEQ ID 41>：

1 ATGTTACCTA ACCGTTTCAA AATGTTAACT GTGTTGACGG CAACCTTGAT

51 TGCCGGACAG GTATCTGCCG CCGGAGGCGG TGCGGGGGAT ATGAAACAGC

101 CGAAGGAAGT CGGAAAGGTT TTCAGAAAGC AGCAGCGTTA CAGCGAGGAA

151 GAAATCAAAA ACGAACGCGC ACGGCTTGCG GCAGTGGGCG AGCGGGTTAA

201 TCAGATATTT ACGTTGCTGG GAGGGGAAAC CGCCTTGCAA AAGGGGCAGG

251 CGGGAACGGC TCTGGCAACC TATATGCTGA TGTTGGAACG CACAAAATCC

301 CCCGAAGTCG CCGAACGCGC CTTGGAAATG GCCGTGTCGC TGAACGCGTT

351 TGAACAGGCG GAAATGATTT ATCAGAAATG GCGGCAGATT GAGCCTATAC

401 CGGGTAAGGC GCAAAAACGG GCGGGGTGGC TGCGGAACGT GCTGAGGGAA

451 AGAGGAAATC AGCATCTGGA CGGACTGGAA GAAGTGCTGG CTCAGGCGGA

501 CGAAGGACAG AACCGCAGGG TGTTTTTATT GTTGGCACAA GCCGCCGTGC

551 AACAGGACGG GTTGGCGCAA AAAGCATCGA AAGCGGTTCG CCGCGCGGCG

601 TTGAAATATG AACATCTGCC CGAAGCGGCG GTTGCCGATG TGGTGTTCAG

651 CGTACAGGGA CGCGAAAAGG AAAAGGCAAT CGGAGCTTTG CAGCGTTTGG

701 CGAAGCTCGA TACGGAAATA TTGCCCCCCA CTTTAATGAC GTTGCGTCTG

751 ACTGCACGCA AATATCCCGA AATACTCGAC GGCTTTTTCG AGCAGACAGA

801 CACCCAAAAC CTTTCGGCCG TCTGGCAGGA AATGGAAATT ATGAATCTGG

851 TTTCCCTGCA CAGGCTGGAT GATGCCTATG CGCGTTTGAA CGTGCTGTTG

901 GAACGCAATC CGAATGCAGA CCTGTATATT CAGGCAGCGA TATTGGCGGC

951 AAACCGAAAA GAAGGTGCTT CCGTTATCGA CGGCTACGCC GAAAAGGCAT

1001 ACGGCAGGGG GACGGAGGAA CAGCGGAGCA GGGCGGCGCT AACGGCGGCG

1051 ATGATGTATG CCGACCGCAG GGATTACGCC AAAGTCAGGC AGTGGCTGAA

1101 AAAAGTATCC GCGCCGGAAT ACCTGTTCGA CAAAGGTGTG CTGGCGGCTG

1151 CGGCGGCTGT CGAGTTGGAC GGCGGCAGGG CGGCTTTGCG GCAGATCGGC

1201 AGGGTGCGGA AACTTCCCGA ACAGCAGGGG CGGTATTTTA CGGCAGACAA

1251 TTTGTCCAAA ATACAGATGC TCGCCCTGTC GAAGCTGCCC GATAAACGGG

1301 AGGCTTTGAG GGGGTTGGAC AAGATTATCG AAAAACCGCC TGCCGGCAGT

1351 AATACAGAGT TACAGGCAGA GGCATTGGTA CAGCGGTCAG TTGTTTACGA

1401 TCGGCTTGGC AAGCGGAAAA AAATGATTTC AGATCTTGAA AGGGCGTTCA

1451 GGCTTGCACC CGATAACGCT CAGATTATGA ATAATCTGGG CTACAGCCTG

1501 CTGACCGATT CCAAACGTTT GGACGAAGGT TTCGCCCTGC TTCAGACGGC

1551 ATACCAAATC AACCCGGACG ATACCGCTGT CAACGACAGC ATAGGCTGGG

1601 CGTATTACCT GAAAGGCGAC GCGGAAAGCG CGCTGCCGTA TCTGCGGTAT

1651 TCGTTTGAAA ACGACCCCGA GCCCGAAGTT GCCGCCCATT TGGGCGAAGT

1701 GTTGTGGGCA TTGGGCGAAC GCGATCAGGC GGTTGACGTA TGGACGCAGG

1751 CGGCACACCT TACGGGAGAC AAGAAAATAT GGCGGGAAAC GCTCAAACGT

1801 CACGGCATCG CATTGCCCCA ACCTTCCCGA AAACCTCGGA AATAA

它对应于氨基酸序列<SEQ ID 42；ORF9-1>：

1 MLPNRFKMLT VLTATLIAGQ VSAAGGGAGD MKQPKEVGKV FRKQQRYSEE

51 EIKNERARLA AVGERVNQIF TLLGGETALQ KGQAGTALAT YMLMLERTKS

101 PEVAERALEM AVSLNAFEQA EMIYQKWRQI EPIPGKAQKR AGWLRNVLRE

151 RGNQHLDGLE EVLAQADEGQ NRRVFLLLAQ AAVQQDGLAQ KASKAVRRAA

201 LKYEHLPEAA VADVVFSVQG REKEKAIGAL QRLAKLDTEI LPPTLMTLRL

251 TARKYPEILD GFFEQTDTQN LSAVWQEMEI MNLVSLHRLD DAYARLNVLL

301 ERNPNADLYI QAAILAANRK EGASVIDGYA EKAYGRGTEE QRSRAALTAA

351 MMYADRRDYA KVRQWLKKVS APEYLFDKGV LAAAAAVELD GGRAALRQIG

401 RVRKLPEQQG RYFTADNLSK IQMLALSKLP DKREALRGLD KIIEKPPAGS

451 NTELQAEALV QRSVVYDRLG KRKKMISDLE RAFRLAPDNA QIMNNLGYSL

501 LTDSKRLDEG FALLQTAYQI NPDDTAVNDS IGWAYYLKGD AESALPYLRY

551 SFENDPEPEV AAHLGEVLWA LGERDQAVDV WTQAAHLTGD KKIWRETLKR

601 HGIALPQPSR KPRK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF9与脑膜炎奈瑟球菌菌株A的ORF(ORF9a)在重叠的166个氨基酸区域表现出有89.8％的相同性：

10 20 30 40 50

orf9.pep RFKMLTVLTATLIAGQVSAAGGGAGDMKQPKEVGKVFRKQQRYSEEEIKNERARLA

|| :|:||:|:|:|||: || ||:| | |||||||||||||||||||||||||||

orf9a MLPARFTILSVLAAALLAGQAYAA--GAADAKPPKEVGKVFRKQQRYSEEEIKNERARLA

10 20 30 40 50

60 70 80 90 100 110

orf9.pep AVGERVNQIFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

|||||||||||||| |||||||||||||||||||||||||||||||||||||||||||||

orf9a AVGERVNQIFTLLGXETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

60 70 80 90 100 110

120 130 140 150 160

orf9.pep EMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGREEVLAQADEGQ

|||||||||||||||||||||||||||||||||||||| || |||||| |

orf9a EMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGLEEXLAQADEXQNRRVFLLLAQ

120 130 140 150 160 170

orf9a AAVQQDGLAQKASKAVRRAALRYEHLPEAAVADVVFSVQXREKEKAIGALQRLAKLDTEI

180 190 200 210 220 230

全长ORF9a核苷酸序列<SEQ ID 43>是：

1 ATGTTACCCG CCCGTTTCAC CATTTTATCT GTGCTCGCGG CAGCCCTGCT

51 TGCCGGGCAG GCGTATGCCG CCGGCGCGGC GGATGCGAAG CCGCCGAAGG

101 AAGTCGGAAA GGTTTTCAGA AAGCAGCAGC GTTACAGCGA GGAAGAAATC

151 AAAAACGAAC GCGCACGGCT TGCGGCAGTG GGCGAGCGGG TTAATCAGAT

201 ATTTACGTTG CTGGGANGGG AAACCGCCTT GCAAAAGGGG CAGGCGGGAA

251 CGGCTCTGGC AACCTATATG CTGATGTTGG AACGCACAAA ATCCCCCGAA

301 GTCGCCGAAC GCGCCTTGGA AATGGCCGTG TCNCTGAACG CGTTTGAACA

351 GGCGGAAATG ATTTATCAGA AATGGCGGCA GATTGAGCCT ATACCGGGTA

401 AGGCGCAAAA ACGGGCGGGG TGGCTGCGGA ACGTGCTGAG GGAAAGAGGA

451 AATCAGCATC TAGACGGACT GGAAGAANTG CTGGCTCAGG CGGACGAANG

501 ACAGAACCGC AGGGTGTTTT TATTGTTGGC ACAAGCCGCC GTGCAACAGG

551 ACGGGTTGGC GCAAAAAGCA TCGAAAGCGG TTCGCCGCGC GGCGTTGAGA

601 TATGAACATC TGCCCGAAGC GGCGGTTGCC GATGTGGTGT TCAGCGTACA

651 GGNACGCGAA AAGGAAAAGG CAATCGGAGC TTTGCAGCGT TTGGCGAAGC

701 TCGATACGGA AATATTGCCC CCCACTTTAA TGACGTTGCG TCTGACTGCA

751 CGCAAATATC CCGAAATACT CGACGGCTTT TTCGAGCAGA CAGACACCCA

801 AAACCTTTCG GCCGTCTGGC AGGAAATGGA AATTATGAAT CTGGTTTCCC

851 TGCACAGGCT GGATGATGCC TATGCGCGTT TGAACGTGCT GTTGGAACGC

901 AATCCGAATG CAGACCTGTA TATTCAGGCA GCGATATTGG CGGCAAACCG

951 AAAAGAANGT GCTTCCGTTA TCGACGGCTA CGCCGAAAAG GCATACGGCA

1001 GGGGGACGGG GGAACAGCGG GGCAGGGCGG CAATGACGGC GGCGATGATA

1051 TATGCCGACC GAAGGGATTA CACCAAAGTC AGGCAGTGGT TGAAAAAAGT

1101 GTCCGCGCCG GAATACCTGT TCGACAAAGG TGTGCTGGCG GCTGCGGCGG

1151 CTGTCGAGTT GGACNGCGGC AGGGCGGCTT TGCGGCAGAT CGGCAGGGTG

1201 CGGAAACTTC CCGAACAGCA GGGGCGGTAT TTTACGGCAG ACAATTTGTC

1251 CAAAATACAG ATGTTCGCCC TGTCGAAGCT GCCCGACAAA CGGGAGGCTT

1301 TGAGGGGGTT GGACAAGATT ATCGAAAAAC CGCCTGCCGG CAGTAATACA

1351 GAGTTACAGG CAGAGGCATT GGTACAGCGG TCAGTTGTTT ACGATCGGCT

1401 TGGCAAGCGG AAAAAAATGA TTTCAGATCT TGAAAGGGCG TTCAGGCTTG

1451 CACCCGATAA CGCTCAGATT ATGAATAATC TGGGCTACAG CCTGCTTTCC

1501 GATTCCAAAC GTTTGGACGA AGGCTTCGCC CTGCTTCAGA CGGCATACCA

1551 AATCAACCCG GACGATACCG CTGTCAACGA CAGCATAGGC TGGGCGTATT

1601 ACCTGAAANG CGACGCGGAA AGCGCGCTGC CGTATCTGCG GTATTCGTTT

1651 GAAAACGACC CCGAGCCCGA AGTTGCCGCC CATTTGGGCG AAGTGTTGTG

1701 GGCATTGGGC GAACGCGATC AGGCGGTTGA CGTATGGACG CAGGCGGCAC

1751 ACCTTACGGG AGACAAGAAA ATATGGCGGG AAACGCTCAA ACGTCACGGC

1801 ATCGCATTGC CCCAACCTTC CCGAAAACCT CGGAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 44>：

1 MLPARFTILS VLAAALLAGQ AYAAGAADAK PPKEVGKVFR KQQRYSEEEI

51 KNERARLAAV GERVNQIFTL LGXETALQKG QAGTALATYM LMLERTKSPE

101 VAERALEMAV SLNAFEQAEM IYQKWRQIEP IPGKAQKRAG WLRNVLRERG

151 NQHLDGLEEX LAQADEXQNR RVFLLLAQAA VQQDGLAQKA SKAVRRAALR

201 YEHLPEAAVA DVVFSVQXRE KEKAIGALQR LAKLDTEILP PTLMTLRLTA

251 RKYPEILDGF FEQTDTQNLS AVWQEMEIMN LVSLHRLDDA YARLNVLLER

301 NPNADLYIQA AILAANRKEX ASVIDGYAEK AYGRGTGEQR GRAAMTAAMI

351 YADRRDYTKV RQWLKKVSAP EYLFDKGVLA AAAAVELDXG RAALRQIGRV

401 RKLPEQQGRY FTADNLSKIQ MFALSKLPDK REALRGLDKI IEKPPAGSNT

451 ELQAEALVQR SVVYDRLGKR KKMISDLERA FRLAPDNAQI MNNLGYSLLS

501 DSKRLDEGFA LLQTAYQINP DDTAVNDSIG WAYYLKXDAE SALPYLRYSF

551 ENDPEPEVAA HLGEVLWALG ERDQAVDVWT QAAHLTGDKK IWRETLKRHG

601 IALPQPSRKP RK*

ORF9a和ORF9-1在614个氨基酸的重叠区域内显示出有95.3％的相同性：

10 20 30 40 50

orf9a.pep MLPARFTILSVLAAALLAGQAYAAG--AADAKPPKEVGKVFRKQQRYSEEEIKNERARLA

||| || :|:||:|:|:|||: ||| |:| | |||||||||||||||||||||||||||

orf9-1 MLPNRFKMLTVLTATLIAGQVSAAGGGAGDMKQPKEVGKVFRKQQRYSEEEIKNERARLA

10 20 30 40 50 60

60 70 80 90 100 110

orf9a.pep AVGERVNQIFTLLGXETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

|||||||||||||| |||||||||||||||||||||||||||||||||||||||||||||

orf9-1 AVGERVNQIFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

70 80 90 100 110 120

120 130 140 150 160 170

orf9a.pep EMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGLEEXLAQADEXQNRRVFLLLAQ

||||||||||||||||||||||||||||||||||||||||| |||||| |||||||||||

orf9-1 EMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGLEEVLAQADEGQNRRVFLLLAQ

130 140 150 160 170 180

180 190 200 210 220 230

orf9a.pep AAVQQDGLAQKASKAVRRAALRYEHLPEAAVADVVFSVQXREKEKAIGALQRLAKLDTEI

|||||||||||||||||||||:||||||||||||||||| ||||||||||||||||||||

orf9-1 AAVQQDGLAQKASKAVRRAALKYEHLPEAAVADVVFSVQGREKEKAIGALQRLAKLDTEI

190 200 210 220 230 240

240 250 260 270 280 290

orf9a.pep LPPTLMTLRLTARKYPEILDGFFEQTDTQNLSAVWQEMEIMNLVSLHRLDDAYARLNVLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf9-1 LPPTLMTLRLTARKYPEILDGFFEQTDTQNLSAVWQEMEIMNLVSLHRLDDAYARLNVLL

250 260 270 280 290 300

300 310 320 330 340 350

orf9a.pep ERNPNADLYIQAAILAANRKEXASVIDGYAEKAYGRGTGEQRGRAAMTAAMIYADRRDYT

|||||||||||||||||||||||||||||||||||||| |||:|||:||||:|||||||:

orf9-1 ERNPNADLYIQAAILAANRKEGASVIDGYAEKAYGRGTEEQRSRAALTAAMMYADRRDYA

310 320 330 340 350 360

360 370 380 390 400 410

orf9a.pep KVRQWLKKVSAPEYLFDKGVLAAAAAVELDXGRAALRQIGRVRKLPEQQGRYFTADNLSK

|||||||||||||||||||||||||||||| |||||||||||||||||||||||||||||

orf9-1 KVRQWLKKVSAPEYLFDKGVLAAAAAVELDGGRAALRQIGRVRKLPEQQGRYFTADNLSK

370 380 390 400 410 420

420 430 440 450 460 470

orf9a.pep IQMFALSKLPDKREALRGLDKIIEKPPAGSNTELQAEALVQRSVVYDRLGKRKKMISDLE

|||:||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf9-1 IQMLALSKLPDKREALRGLDKIIEKPPAGSNTELQAEALVQRSVVYDRLGKRKKMISDLE

430 440 450 460 470 480

480 490 500 510 520 530

orf9a.pep RAFRLAPDNAQIMNNLGYSLLSDSKRLDEGFALLQTAYQINPDDTAVNDSIGWAYYLKXD

|||||||||||||||||||||:|||||||||||||||||||||||||||||||||||| |

orf9-1 RAFRLAPDNAQIMNNLGYSLLTDSKRLDEGFALLQTAYQINPDDTAVNDSIGWAYYLKGD

490 500 510 520 530 540

540 550 560 570 580 590

orf9a.pep AESALPYLRYSFENDPEPEVAAHLGEVLWALGERDQAVDVWTQAAHLTGDKKIWRETLKR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf9-1 AESALPYLRYSFENDPEPEVAAHLGEVLWALGERDQAVDVWTQAAHLTGDKKIWRETLKR

550 560 570 580 590 600

600 610

orf9a.pep HGIALPQPSRKPRKX

|||||||||||||||

orf9-1 HGIALPQPSRKPRKX

610

与淋病奈瑟球菌的预计ORF的同源性

ORF9与淋病奈瑟球菌的预计ORF(ORF9.ng)在重叠的163个氨基酸区域内显示出有82.8％的相同性：

Orf9 RFKMLTVLTATLIAGQVSAAGGGAGDMKQPKEVGKVFRKQQRYSEEEIKNERAR 54

|| :|:||:|:|:|||: || ||:|:: |||||||:||::|||||||||||||

orf9ng MIMLPARFTILSVLAAALLAGQAYAA--GAADVELPKEVGKVLRKHRRYSEEEIKNERAR 58

orf9 LAAVGERVNQIFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFE 114

|||||||||::|||||||||||||||||||||||||||||||||||||||||||||||||

orf9ng LAAVGERVNRVFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFE 118

orf9 QAEMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGREEVLAQADEGQ 166

|||||||||||||||||:||| ||||||||:| || ||| ||| ||:|

orf9ng QAEMIYQKWRQIEPIPGEAQKPAGWLRNVLKEGGNPHLDRLEEVPAQSDYVHQPMIFLLL 178

预计ORF9ng核苷酸序列<SEQ ID 45>编码的蛋白质具有氨基酸序列<SEQ ID46>：

1 MIMLPARFTI LSVLAAALLA GQAYAAGAAD VELPKEVGKV LRKHRRYSEE

51 EIKNERARLA AVGERVNRVF TLLGGETALQ KGQAGTALAT YMLMLERTKS

101 PEVAERALEM AVSLNAFEQA EMIYQKWRQI EPIPGEAQKP AGWLRNVLKE

151 GGNPHLDRLE EVPAQSDYVH QP MIFLLLVQ AAVQHGGVAQ KPSKAVRPAA

201 YNYEVLPETA GADAVFCVQG PQYEKAIQSF PPCGRNPQTE NIAPPFNELF

251 RPTARPISPK LLQRFFRTEP NLAKPFRPPG PEMETYQTGF PRPLTRNNPT

氨基酸1-28是推定的前导序列，173-189预计是跨膜结构域。

进一步的序列分析揭示了全长ORF9ng DNA序列<SEQ ID 47>：

1 ATGTTACCCG CCCGTTTCAC TATTTTATCT GTCCTCGCAG CAGCCCTGCT

51 TGCCGGACAG GCGTATGCTG CCGGCGCGGC GGATGTGGAG CTGCCGAAGG

101 AAGTCGGAAA GGTTTTAAGG AAACATCGGC GTTACAGCGA GGAAGAAATC

151 AAAAACGAAC GCGCACGGCT TGCGGCAGTG GGCGAACGGG TCAACAGGGT

201 GTTTACGCTG TTGGGCGGTG AAACGGCTTT GCAGAAAGGG CAGGCGGGAA

251 CGGCTCTGGC AACCTATATG CTGATGTTGG AACGCACAAA ATCCCCCGAA

301 GTCGCCGAAC GCGCCTTGGA AATGGCCGTG TCGCTGAACG CGTTTGAACA

351 GGCGGAAATG ATTTATCAGA AATGgcggca gatcgagcct ataCcgggtg

401 aggcgcaaaa accgGcgggG tggctgcgga acgtattgaa ggaagggGGa

451 aaTCAGCATC TGGAcgggtt gaaagaggTG CtggcgcaAT cggacgatGT

501 GCAAAAAcgc aggaTATTTT TGCTGCTGGT GCAAGCCGCC GTGCagcagg

551 gTGGGGTGGC TCAAAAAGCA TCGAAAGCGG TTCGCcgtgc GGcgttgaAG

601 TATGAACATC TGCCcgaagc ggcggTTGCC GATGcggTGT TCGGCGTACA

651 GGGACGCGAA AAGGAAAagg caaTCGAAGC TTTGCAGCGT TTGGCGAAGC

701 TCGATACGGA AATATTGCCC CCCACTTTAA TGACGTTGCG TCTGACTGCA

751 CGCAAATATC CCGAAATACT CGACGGCTTT TTCGAGCAGA CAGACACCCA

801 AAACCTTTCG GCCGTCTGGC AGGAAATGGA AATTATGAAT CTGGTTTCCC

851 TGCGTAAGCC GGATGATGCC TATGCGCGTT TGAACGTGCT GTTGGAACAC

901 AACCCGAATG CAAACCTGTA TATTCAGGCG GCGATATTGG CGGCAAACCG

951 AAAAGAAGGT GCGTCCGTTA TCGACGGCTA CGCCGAAAAG GCATACGGCA

1001 GGGGGACGGG GGAACAGCGG GGCagggcgg cAATgacggc GGCGATGATA

1051 TATGCCGACC GCAGGGATTA CGCCAAAGTC AGGCAGTGGT TGAAAAAAGT

1101 GTCCGCGCCG GAATACCTGT TCGACAAAGG CGTGCTGGCG GCTGCGGCGG

1151 CTGCCGAATT GGACGGAGGC CGGGCGGCTT TGCGGCAGAT CGGCAGGGTG

1201 CGGAAACTTC CCGAACAGCA GGGGCGGTAT TTTACGGCAG ACAATTTGTC

1251 CAAAATACAG ATGCTCGCCC TGTCGAAGCT GCCCGACAAA CGGGAAGCCC

1301 TGATCGGGCT GAACAACATC ATCGCCAAAC TTTCGGCGGC GGGAAGCACG

1351 GAACCTTTGG CGGAAGCATT GGCACAGCGT TCCATTATTT ACGaacAGTT

1401 cggCAAACGG GGAAAAATGA TTGCCGACCT tgaAACcgcg CTCAAACTTA

1451 CGCCCGATAA TGCACAAATT ATGAATAATC TGGGCTACAG CCTGCTTTCC

1501 GATTCCAAAC GTTTGGACGA GGGTTTCGCC CTGCTTCAGA CGGCATACCA

1551 AATCAACCCG GACGATACCG CCGTTAACGA CAGCATAGGC TGGGCGTATT

1601 ACCTGAAAGG CGACgcggaA AGCGCGCTGC CGTATCTGcg gtattcgttt

1651 gAAAACGACC CCGAGCCCGA AGTTGCCGCC CATTTGGGCG AAGTGTTGTG

1701 GGCATTGGGC GAACGCGATC AGGCGGTTGA CGTATGGACG CAGGCGGCAC

1751 ACCTTAGGGG AGACAAGAAA ATATGGCGGG AGACGCTCAA ACGCTACGGA

1801 ATCGCCTTGC CCGAGCCTTC CCGAAAACCC CGGAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 48>：

1 MLPARFTILS VLAAALLAGQ AYAAGAADVE LPKEVGKVLR KHRRYSEEEI

51 KNERARLAAV GERVNRVFTL LGGETALQKG QAGTALATYM LMLERTKSPE

101 VAERALEMAV SLNAFEQAEM IYQKWRQIEP IPGEAQKPAG WLRNVLKEGG

151 NQHLDGLKEV LAQSDDVQKR RIFLLLVQAA VQQGGVAQKA SKAVRRAALK

201 YEHLPEAAVA DAVFGVQGRE KEKAIEALQR LAKLDTEILP PTLMTLRLTA

251 RKYPEILDGF FEQTDTQNLS AVWQEMEIMN LVSLRKPDDA YARLNVLLEH

301 NPNANLYIQA AILAANRKEG ASVIDGYAEK AYGRGTGEQR GRAAMTAAMI

351 YADRRDYAKV RQWLKKVSAP EYLFDKGVLA AAAAAELDGG RAALRQIGRV

401 RKLPEQQGRY FTADNLSKIQ MLALSKLPDK REALIGLNNI IAKLSAAGST

451 EPLAEALAQR SIIYEQFGKR GKMIADLETA LKLTPDNAQI MNNLGYSLLS

501 DSKRLDEGFA LLQTAYQINP DDTAVNDSIG WAYYLKGDAE SALPYLRYSF

551 ENDPEPEVAA HLGEVLWALG ERDQAVDVWT QAAHLRGDKK IWRETLKRYG

601 IALPEPSRKP RK*

ORF9ng和ORF9-1在614个氨基酸的重叠区域内显示出有88.1％的相同性：

10 20 30 40 50 60

orf9-1.pep MLPNRFKMLTVLTATLIAGQVSAAGGGAGDMKQPKEVGKVFRKQQRYSEEEIKNERARLA

||| || :|:||:|:|:|||: ||| |:|:: |||||||:||::|||||||||||||||

orf9ng-1 MLPARFTILSVLAAALLAGQAYAAG--AADVELPKEVGKVLRKHRRYSEEEIKNERARLA

10 20 30 40 50

70 80 90 100 110 120

orf9-1.pep AVGERVNQIFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

|||||||::|||||||||||||||||||||||||||||||||||||||||||||||||||

orf9ng-1 AVGERVNRVFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQA

60 70 80 90 100 110

130 140 150 160 170 180

orf9-1.pep EMIYQKWRQIEPIPGKAQKRAGWLRNVLRERGNQHLDGLEEVLAQADEGQNRRVFLLLAQ

|||||||||||||||:||| ||||||||:| ||||||||:|||||:|: |:||:||||:|

orf9ng-1 EMIYQKWRQIEPIPGEAQKPAGWLRNVLKEGGNQHLDGLKEVLAQSDDVQKRRIFLLLVQ

120 130 140 150 160 170

190 200 210 220 230 240

orf9-1.pep AAVQQDGLAQKASKAVRRAALKYEHLPEAAVADVVFSVQGREKEKAIGALQRLAKLDTEI

||||| |:|||||||||||||||||||||||||:||:|||||||||| ||||||||||||

orf9ng-1 AAVQQGGVAQKASKAVRRAALKYEHLPEAAVADAVFGVQGREKEKAIEALQRLAKLDTEI

180 190 200 210 220 230

250 260 270 280 290 300

orf9-1.pep LPPTLMTLRLTARKYPEILDGFFEQTDTQNLSAVWQEMEIMNLVSLHRLDDAYARLNVLL

||||||||||||||||||||||||||||||||||||||||||||||:: |||||||||||

orf9ng-1 LPPTLMTLRLTARKYPEILDGFFEQTDTQNLSAVWQEMEIMNLVSLRKPDDAYARLNVLL

240 250 260 270 280 290

310 320 330 340 350 360

orf9-1.pep ERNPNADLYIQAAILAANRKEGASVIDGYAEKAYGRGTEEQRSRAALTAAMMYADRRDYA

|:||||:||||||||||||||||||||||||||||||| |||:|||:||||:||||||||

orf9ng-1 EHNPNANLYIQAAILAANRKEGASVIDGYAEKAYGRGTGEQRGRAAMTAAMIYADRRDYA

300 310 320 330 340 350

370 380 390 400 410 420

orf9-1.pep KVRQWLKKVSAPEYLFDKGVLAAAAAVELDGGRAALRQIGRVRKLPEQQGRYFTADNLSK

||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf9ng-1 KVRQWLKKVSAPEYLFDKGVLAAAAAAELDGGRAALRQIGRVRKLPEQQGRYFTADNLSK

360 370 380 390 400 410

430 440 450 460 470 480

orf9-1.pep IQMLALSKLPDKREALRGLDKIIEKPPAGSNTELQAEALVQRSVVYDRLGKRKKMISDLE

|||||||||||||||| ||::|| | |:::|| ||||:|||::|:::||| |||:|||

orf9ng-1 IQMLALSKLPDKREALIGLNNIIAKLSAAGSTEPLAEALAQRSIIYEQFGKRGKMIADLE

420 430 440 450 460 470

490 500 510 520 530 540

orf9-1.pep RAFRLAPDNAQIMNNLGYSLLTDSKRLDEGFALLQTAYQINPDDTAVNDSIGWAYYLKGD

|::|:|||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf9ng-1 TALKLTPDNAQIMNNLGYSLLSDSKRLDEGFALLQTAYQINPDDTAVNDSIGWAYYLKGD

480 490 500 510 520 530

550 560 570 580 590 600

orf9-1.pep AESALPYLRYSFENDPEPEVAAHLGEVLWALGERDQAVDVWTQAAHLTGDKKIWRETLKR

||||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||

orf9ng-1 AESALPYLRYSFENDPEPEVAAHLGEVLWALGERDQAVDVWTQAAHLRGDKKIWRETLKR

540 550 560 570 580 590

610

orf9-1.pep HGIALPQPSRKPRKX

:|||||:||||||||

orf9ng-1 YGIALPEPSRKPRKX

600 610

另外，ORF9ng显示出与绿脓杆菌的一种假设蛋白明显同源：

sp|P42810|YHE3_PSEAE HEMM-HEMA基因间区域中的假设的64.8KD蛋白(ORF3)

>gi|1072999|pir||S49376假设蛋白3-绿脓杆菌>gi|557259(X82071)orf3[绿脓杆菌]长度＝576

评分＝128位(318)，估计值＝1e-28

相同性＝138/587(23％)，阳性＝228/587(38％)，空隙＝125/587(21％)

询问：67 VFTLLGGETALQKGQAGTALATYMLMLERTKSPEVAERALEMAVSLNAFEQAEMIYQKWR 126

+++LL E A Q+ + AL+ Y++ ++T+ P V+ERA +A L A ++A W

目标：53 LYSLLVAELAGQRNRFDIALSNYVVQAQKTRDPGVSERAFRIAEYLGADQEALDTSLLWA 112

询问：127 QIEPIPGEAQKPAG--------------WLRNVLKEGGNQHLDGLKEVLAQSDDVQKRRI 172

+ P +AQ+ A ++ VL G+ H D L A++D + +

目标：113 RSAPDNLDAQRAAAIQLARAGRYEESMVYMEKVLNGQGDTHFDFLALSAAETDPDTRAGL 172

询问：173 FXXXXXXXXXXXXXXXKASKAVRRAALKYEHLPEAAVADAVFGVQGREKEKAIEALQRLA 232

++ KY + + A+ Q ++A+ L+ +

目标：173 L------------------QSFDHLLKKYPNNGQLLFGKALLLQQDGRPDEALTLLEDNS 214

询问：233 KLDTEILPPTLMTLRLTARK-----YPEILDGFFEQTDTQNLSAVWQEMEIMNLVSLRKP 287

E+ P L + L + K P + G E D + + + + LV +

目标：215 ASRHEVAPLLLRSRLLQSMKRSDEALPLLKAGIKEHPDDKRVRLAYARL----LVEQNRL 270

询问：288 DDAYARLNVLLEHNPN---------------------ANLYIQAAI-------------- 312

DDA A L++ P+ A +Y++ +

目标：271 DDAKAEFAGLVQQFPDDDDDLRFSLALVCLEAQAWDEARIYLEELVERDSHVDAAHFNLG 330

询问：313 -LAANRKEGASVIDGYAEKAYGRGTGEQRGRAAMTAAMIYADRRDYAKVRQWLKKVSAPE 371

LA +K+ A +D YA+ G G + T ++ A R D A R + P+

目标：331 RLAEEQKDTARALDEYAQ--VGPGNDFLPAQLRQTDVLLKAGRVDEAAQRLDKARSEQPD 388

询问：372 YLFDKXXXXXXXXXXXXXXXXXXRQIGRVRKLPEQQGRYFTADNLSKIQMLALSKLPDKR 431

Y A L I+ ALS +

目标：389 Y----------------------------------------AIQLYLIEAEALSNNDQQE 408

询问：432 EALIGLNNIIAKLSAAGSTEPLAEALAQRSIIYEQFGKRGKMIADLETALKLTPDNAQIM 491

+A + + + E L L RS++ E+ +M DL + PDNA +

目标：409 KAWQAIQEGLKQYP-----EDL-NLLYTRSMLAEKRNDLAQMEKDLRFVIAREPDNAMAL 462

询问：492 NNLGYSLLSDSKRLDEGFALLQTAYQINPDDTAVNDSIGWAYYLKGDAESALPYLRYSFE 551

N LGY+L + R E L+ A+++NPDD A+ DS+GW Y +G A YLR + +

目标：463 NALGYTLADRTTRYGEARELILKAHKLNPDDPAILDSMGWINYRQGKLADAERYLRQALQ 522

询问：552 NDPEPEVAAHLGEVLWALGERDQAVDVWTQAAHLRGDKKIWRETLKR 598

P+ EVAAHLGEVLWA G + A +W + + D + R T+KR

目标：523 RYPDHEVAAHLGEVLWAQGRQGDARAIWREYLDKQPDSDVLRRTIKR 569

gi|2983399(AE000710)假设蛋白[Aquifex aeolicus]长度＝545

评分＝81.5位(198)，估计值＝1e-14

相同性＝61/198(30％)，阳性＝98/198(48％)，空隙＝19/198(9％)

询问：408 GRYFTADNL-SKIQMLALSKLPDKREALIGLNNIIAKLSAAGSTEPLAEALAQ------- 459

G Y A L K ++LA PDK+E L + +K + + L +

目标：335 GNYEDAKRLIEKAKVLA----PDKKEILFLEADYYSKTKQYDKALEILKKLEKDYPNDSR 390

询问：460 ----RSIIYEQFGKRGKMIADLETALKLTPDNAQIMNNLGYSLLS--DSKRLDEGFALLQ 513

+I+Y+ G L A++L P+N N LGYSLL +R++E L++

目标：391 VYFMEAIVYDNLGDIKNAEKALRKAIELDPENPDYYNYLGYSLLLWYGKERVEEAEELIK 450

询问：514 TAYQINPDDTAVNDSIGWAYYLKGDAESALPYLRYSF-ENDPEPEVAAHLGEVLWALGER 572

A + +P++ A DS+GW YYLKGD E A+ YL + E +P V H+G+VL +G +

目标：451 KALEKDPENPAYIDSMGWVYYLKGDYERAMQYLLKALREAYDDPVVNEHVGDVLLKMGYK 510

询问：573 DQAVDVWTQAAHLRGDKK 590

++A + + +A L + K

目标：511 EEARNYYERALKLLEEGK 528

根据该分析，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可能是疫苗或诊断，或产生抗体的有用抗原。

实施例7

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 49>：

1 AACCTCTACG CCGGCCCGCA GACCACATCC GTCATCGCAA ACATCGCCGA

51 CAACCTGCAA CTGGCCAAAG ACTACGGCAA AGTACACTGG TTCGCCTCCC

101 CGCTCTTCTG GCTCCTGAAC CAACTGCACA ACATCATCGG CAACTGGGGC

151 TGGGCGATTA TCGTTTTAAC CATCATCGTC AAAGCCGTAC TGTATCCATT

201 GACCAACGCC TCTTACCGCT CTATGGCGAA AATGCGTGCC GCCGCACCCA

251 AACTGCAAGC CATCAAAGAG AAATACGGCG ACGACCGTAT GGCGCAACAA

301 CAGGCGATGA TGCAGCTTTA CACAGACGAG AAAATCAACC CG CTGGGCG

351 GCTGCCTGCC TATGCTGTTG CAAATCCCCG TCTTCATCGG ATTGTATTGG

401 GCATTGTTCG CCTCCGTAGA ATTGCGCCAG GCACCTTGGC TGGGTTGGAT

451 TACCGACCTC AGCCGCGCCG ACCCCTACTA CATCCTGCCC ATCATTATGG

501 CGGCAACGAT GTTCGCCCAA ACTTATCTGA ACCCGCCGCC GAcCGACCCG

551 ATGCagGCGA AAATGATGAA AATCATGCCG TTGGTTTTCT CsGwCrTGTT

601 CTTCTTCTTC CCTGCCGGks TGGTATTGTA CTGGGTAGTC AACAACCTCC

651 TGACCATCGC CCAGCAATGG CACATCAACC GCAGCATCGA AAAACAACGC

701 GCCCAAGGCG AAGTCGTTTC CTAA

它对应于氨基酸序列<SEQ ID 50：ORF11>：

1 ..NLYAGPQTTS VIANIADNLQ LAKDYGKVHW FASPLFWLLN QLHNIIGNWG

51 WAIIVLTIIV KAVLYPLTNA SYRSMAKMRA AAPKLQAIKE KYGDDRMAQQ

101 QAMMQLYTDE KINPLGGCLP MLLQIPVFIG LYWALFASVE LRQAPWLGWI

151 TDLSRADPYY ILPIIMAATM FAQTYLNPPP TDPMQAKMMK IMP LVFSXXF

201 FFFPAGXVLY WVVNNLLTIA QQWHINRSIE KQRAQGEVVS *

进一步的序列分析揭示了全部的DNA序列<SEQ ID 51>：

1 ATGGATTTTA AAAGACTCAC GGCGTTTTTC GCCATCGCGC TGGTGATTAT

51 GATCGGCTGG GAAAAGATGT TCCCCACTCC GAAGCCAGTC CCCGCGCCCC

101 AACAGGCAGC ACAACAACAG GCCGTAACCG CTTCCGCCGA AGCCGCGCTC

151 GCGCCCGCAA CGCCGATTAC CGTAACGACC GACACGGTTC AAGCCGTCAT

201 TGATGAAAAA AGCGGCGACC TGCGCCGGCT GACCCTGCTC AAATACAAAG

251 CAACCGGCGA CGAAAATAAA CCGTTCATCC TGTTTGGCGA CGGCAAAGAA

301 TACACCTACG TCGCCCAATC CGAACTTTTG GACGCGCAGG GCAACAACAT

351 TCTAAAAGGC ATCGGCTTTA GCGCACCGAA AAAACAGTAC AGCTTGGAAG

401 GCGACAAAGT TGAAGTCCGC CTGAGCGCGC CTGAAACACG CGGTCTGAAA

451 ATCGACAAAG TTTATACTTT CACCAAAGGC AGCTATCTGG TCAACGTCCG

501 CTTCGACATC GCCAACGGCA GCGGTCAAAC CGCCAACCTG AGCGCGGACT

551 ACCGCATCGT CCGCGACCAC AGCGAACCCG AGGGTCAAGG TTACTTTACC

601 CACTCTTACG TCGGCCCTGT TGTTTATACC CCTGAAGGCA ACTTCCAAAA

651 AGTCAGCTTT TCCGACTTGG ACGACGATGC CAAATCCGGC AAATCCGAGG

701 CCGAATACAT CCGCAAAACC CCGACCGGCT GGCTCGGCAT GATTGAACAC

751 CACTTCATGT CCACCTGGAT TCTCCAACCT AAAGGCAGAC AAAGCGTTTG

801 CGCCGCAGGC GAGTGCAACA TCGACATCAA ACGCCGCAAC GACAAGCTGT

851 ACAGCACCAG CGTCAGCGTG CCTTTAGCCG CCATCCAAAA CGGCGCGAAA

901 GCCGAAGCCT CCATCAACCT CTACGCCGGC CCGCAGACCA CATCCGTCAT

951 CGCAAACATC GCCGACAACC TGCAACTGGC CAAAGACTAC GGCAAAGTAC

1001 ACTGGTTCGC CTCCCCGCTC TTCTGGCTCC TGAACCAACT GCACAACATC

1051 ATCGGCAACT GGGGCTGGGC GATTATCGTT TTAACCATCA TCGTCAAAGC

1101 CGTACTGTAT CCATTGACCA ACGCCTCTTA CCGCTCTATG GCGAAAATGC

1151 GTGCCGCCGC ACCCAAACTG CAAGCCATCA AAGAGAAATA CGGCGACGAC

1201 CGTATGGCGC AACAACAGGC GATGATGCAG CTTTACACAG ACGAGAAAAT

1251 CAACCCGCTG GGCGGCTGCC TGCCTATGCT GTTGCAAATC CCCGTCTTCA

1301 TCGGATTGTA TTGGGCATTG TTCGCCTCCG TAGAATTGCG CCAGGCACCT

1351 TGGCTGGGTT GGATTACCGA CCTCAGCCGC GCCGACCCCT ACTACATCCT

1401 GCCCATCATT ATGGCGGCAA CGATGTTCGC CCAAACTTAT CTGAACCCGC

1451 CGCCGACCGA CCCGATGCAG GCGAAAATGA TGAAAATCAT GCCGTTGGTT

1501 TTCTCCGTCA TGTTCTTCTT CTTCCCTGCC GGTCTGGTAT TGTACTGGGT

1551 AGTCAACAAC CTCCTGACCA TCGCCCAGCA ATGGCACATC AACCGCAGCA

1601 TCGAAAAACA ACGCGCCCAA GGCGAAGTCG TTTCCTAA

它对应于氨基酸序列<SEQ ID 52；ORF11-1>：

1 MDFKRLTAFF AIALVIMIGW EKMFPTPKPV PAPQQAAQQQ AVTASAEAAL

51 APATPITVTT DTVQAVIDEK SGDLRRLTLL KYKATGDENK PFILFGDGKE

101 YTYVAQSELL DAQGNNILKG IGFSAPKKQY SLEGDKVEVR LSAPETRGLK

151 IDKVYTFTKG SYLVNVRFDI ANGSGQTANL SADYRIVRDH SEPEGQGYFT

201 HSYVGPVVYT PEGNFQKVSF SDLDDDAKSG KSEAEYIRKT PTGWLGMIEH

251 HFMSTWILQP KGRQSVCAAG ECNIDIKRRN DKLYSTSVSV PLAAIQNGAK

301 AEASINLYAG PQTTSVIANI ADNLQLAKDY GKVHWFASPL FWLLNQLHNI

351 IGNWGW AIIV LTIIVKAVLY PLTNASYRSM AKMRAAAPKL QAIKEKYGDD

401 RMAQQQAMMQ LYTDEKINPL GGCLP MLLQI PVFIGLYWAL FASVELRQAP

451 WLGWITDLSR ADPYYILPII MAATMFAQTY LNPPPTDPMQ AKMMKIMP LV

501 FSVMFFFFPA GLVLYWVVNN LLTIAQQWHI NRSIEKQRAQ GEVVS*

该氨基酸序列的计算机分析给出了下列结果：

与恶臭假单胞菌ORF11的60kDa内膜蛋白(登录号为P25754)的同源性

ORF11和60kDa的蛋白在229个氨基酸的重叠区域内显示出有58％的氨基酸相同性(BLASTp)。

ORF11 2 LYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIIVLTIIVK 61

LYAGP+ S + ++ L+L DYG + + A P+FWLL +H+++GNWGW+IIVLT+++K

60K 324 LYAGPKIQSKLKELSPGLELTVDYGFLWFIAQPIFWLLQHIHSLLGNWGWSIIVLTMLIK 383

ORF11 62 AVLYPLTNASYRSMAKMRAAAPKLQAIKEKYGDDRXXXXXXXXXLYTDEKINPLGGCLPM 121

+ +PL+ ASYRSMA+MRA APKL A+KE++GDDR LY EKINPLGGCLP+

60K 384 GLFFPLSAASYRSMARMRAVAPKLAALKERFGDDRQKMSQAMMELYKKEKINPLGGCLPI 443

ORF11 122 LLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTYLNPPPT 181

L+Q+PVF+ LYW L SVE+RQAPW+ WITDLS DP++ILPIIM ATMF Q LNP P

60K 444 LVQMPVFLALYWVLLESVEMRQAPWILWITDLSIKDPFFILPIIMGATMFIQQRLNPTPP 503

ORF11 182 DPMQAKAMKIMPLVXXXXXXXXPAGXVLYWVVNNLLTIAQQWHINRSIE 230

DPMQAK+MK+MP++ PAG VLYWVVNN L+I+QQW+I R IE

60K 504 DPMQAKVMKMMPIIFTFFFLWFPAGLVLYWVVNNCLSISQQWYITRRIE 552

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF11与脑膜炎奈瑟球菌菌株A的ORF(ORF11a)在240个氨基酸重叠区域内显示出有97.9％的相同性：

10 20 30

orf11.pep NLYAGPQTTSVIANIADNLQLAKDYGKVHW

||||||||||||||||||||||||||||||

orf11a IKRRNDKLYSTSVSVPLAAIQNGAKSXASINLYAGPQTTSVIANIADNLQLXKDYGKVHW

280 290 300 310 320 330

40 50 60 70 80 90

orf11.pep FASPLFWLLNQLHNIIGNWGWAIIVLTIIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11a FASPLFWLLNQLHNIIGNWGWAIIVLTIIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKE

340 350 360 370 380 390

100 110 120 130 140 150

orf11.pep KYGDDRMAQQQAMMQLYTDEKINPLGGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11a KYGDDRMAQQQAMMQLYTDEKINPLGGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWI

400 410 420 430 440 450

160 170 180 190 200 210

orf11.pep TDLSRADPYYILPIIMAATMFAQTYLNPPPTDPMQAKMMKIMPLVFSXXFFFFPAGXVLY

||||||||||||||||||||||||||||||||||||||||||||| ||||| |||| |||

orf11a TDLSRADPYYILPIIMAATMFAQTYLNPPPTDPMQAKMMKIMPLVXSXXFFXFPAGLVLY

460 470 480 490 500 510

220 230 240

orf11.pep WVVNNLLTIAQQWHINRSIEKQRAQGEVVSX

||:||||||||||||||||||||||||||||

orf11a WVINNLLTIAQQWHINRSIEKQRAQGEVVSX

520 530 540

全长ORF11核苷酸序列<SEQ ID 53>是：

1 ANGGATTTTA AAAGACTCAC NGNGTTTTTC GCCATCGCAC TGGTGATTAT

51 GATCGGATNG NAAANGATGT TCCCCACTCC GAAGCCCGTC CCCGCGCCCC

101 AACAGACGGC ACAACAACAG GCCGTAANCG CTTCCGCCGA AGCCGCGCTC

151 GCGCCCGNAN CGCCGATTAC CGTAACGACC GACACGGTTC AAGCCGTCAT

201 TGATGAAAAA AGCGGCGACC TGCGCCGGCT GACCCTGCTC AAATACAAAG

251 CAACCGGCGA CNAAAATAAA CCGTTCATCC TGTTTGGCGA CGGCAAANAA

301 TACACCTACN TCGCCCANTC CGAACTTTTG GACGCGCAGG GCAACAACAT

351 TCTAAAAGGC ATCGGCTTTA GCGCACCGAA AAAACAGTAC AGCTTGGAAG

401 GCGACAAAGT TGAAGTCCGC CTGAGCGCAC CTGAAACACG CGGTCTGAAA

451 ATCGACAAAG TTTATACTTT CACCAAAGGC AGCTATCTGG TCAACGTCCG

501 CTTCGACATC GCCAACGGCA GCGGTCAAAC CGCCAACCTG AGCGCGGACT

551 ACCGCATCGT CCGCGACCAC AGCGAACCCG AGGGTCAAGG CTACTTTACC

601 CACTCTTACG TCGGCCCTGT TGTTTATACC CCTGAAGGCA ACTTCCAAAA

651 AGTCAGCTTC TCCGACTTGG ACGACGATGC CAANTCCGGN AAATCCGAGG

701 CCGAATACAT CCGCAAAACC CNGACCGGCT GGCTCGGCAT GATTGAACAC

751 CACTTCATGT CCACCTGGAT CCTCCAACCC AAAGGCGGAC AAAGCGTTTG

801 CGCCGCTGGC GACTGCNGTA TNGACATCAA ACGCCGCAAC GACAAGCTGT

851 ACAGCACCAG CGTCAGCGTG CCTTTAGCCG CTATCCAAAA CGGTGCGAAA

901 TCCNAAGCCT CCATCAACCT CTACGCCGGC CCACAGACCA CATCNGTTAT

951 CGCAAACATC GCCGACAACC TGCAACTGGN CAAAGACTAC GGCAAAGTAC

1001 ACTGGTTCGC CTCCCCCCTC TTTTGGCTTT TGAACCAACT GCACAACATC

1051 ATCGGCAACT GGGGCTGGGC GATTATCGTT TTAACCATCA TCGTCAAAGC

1101 CGTACTGTAT CCATTGACCA ACGCCTCTTA CCGTTCGATG GCGAAAATGC

1151 GTGCCGCCGC GCCCAAACTG CAAGCCATCA AAGAGAAATA CGGCGACGAC

1201 CGTATGGCGC AGCAACAAGC CATGATGCAG CTTTACACAG ACGAGAAAAT

1251 CAACCCGCTG GGCGGCTGCC TGCCTATGCT GTTGCAAATC CCCGTCTTCA

1301 TCGGATTGTA TTGGGCATTG TTCGCCTCCG TAGAATTGCG CCAGGCACCT

1351 TGGCTGGGTT GGATTACCGA CCTCAGCCGC GCCGACCCNT ACTACATCCT

1401 GCCCATCATT ATGGCGGCAA CGATGTTCGC CCAAACCTAT CTGAACCCGC

1451 CGCCGACCGA CCCGATGCAG GCGAAAATGA TGAAAATCAT GCCTTTGGTT

1501 NTNTCNNNNA NGTTCTTCNN CTTCCCTGCC GGTCTGGTAT TGTACTGGGT

1551 GATCAACAAC CTCCTGACCA TCGCCCAGCA ATGGCACATC AACCGCAGCA

1601 TCGAAAAACA ACGCGCCCAA GGCGAAGTCG TTTCCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 54>：

1 XDFKRLTXFF AIALVIMIGX XXMFPTPKPV PAPQQTAQQQ AVXASAEAAL

51 APXXPITVTT DTVQAVIDEK SGDLRRLTLL KYKATGDXNK PFILFGDGKX

101 YTYXAXSELL DAQGNNILKG IGFSAPKKQY SLEGDKVEVR LSAPETRGLK

151 IDKVYTFTKG SYLVNVRFDI ANGSGQTANL SADYRIVRDH SEPEGQGYFT

201 HSYVGPVVYT PEGNFQKVSF SDLDDDAXSG KSEAEYIRKT XTGWLGMIEH

251 HFMSTWILQP KGGQSVCAAG DCXXDIKRRN DKLYSTSVSV PLAAIQNGAK

301 SXASINLYAG PQTTSVIANI ADNLQLXKDY GKVHWFASPL FWLLNQLHNI

351 IGNWGW AIIV LTIIVKAVLY PLTNASYRSM AKMRAAAPKL QAIKEKYGDD

401 RMAQQQAMMQ LYTDEKINPL GGCLP MLLQI PVFIGLYWAL FASVELRQAP

451 WLGWITDLSR ADPYYILPII MAATMFAQTY LNPPPTDPMQ AKMMKIMP LV

501 XSXXFFXFPA GLVLYWVINN LLTIAQQWHI NRSIEKQRAQ GEVVS*

ORF11和ORF11-1在544个氨基酸重叠区域内显示出有95.2％的相同性：

10 20 30 40 50 60

orf11a.pep XDFKRLTXFFAIALVIMIGXXXMFPTPKPVPAPQQTAQQQAVXASAEAALAPXXPITVTT

||||||| ||||||||||| |||||||||||||:||||||:||||||||| :||||||

orf11-1 MDFKRLTAFFAIALVIMIGWEKMFPTPKPVPAPQQAAQQQAVTASAEAALAPATPITVTT

10 20 30 40 50 60

70 80 90 100 110 120

orf11a.pep DTVQAVIDEKSGDLRRLTLLKYKATGDXNKPFILFGDGKXYTYXAXSELLDAQGNNILKG

||||||||||||||||||||||||||| ||||||||||| ||| | ||||||||||||||

orf11-1 DTVQAVIDEKSGDLRRLTLLKYKATGDENKPFILFGDGKEYTYVAQSELLDAQGNNILKG

70 80 90 100 110 120

130 140 150 160 170 180

orf11a.pep IGFSAPKKQYSLEGDKVEVRLSAPETRGLKIDKVYTFTKGSYLVNVRFDIANGSGQTANL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 IGFSAPKKQYSLEGDKVEVRLSAPETRGLKIDKVYTFTKGSYLVNVRFDIANGSGQTANL

130 140 150 160 170 180

190 200 210 220 230 240

orf11a.pep SADYRIVRDHSEPEGQGYFTHSYVGPVVYTPEGNFQKVSFSDLDDDAXSGKSEAEYIRKT

||||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||

orf11-1 SADYRIVRDHSEPEGQGYFTHSYVGPVVYTPEGNFQKVSFSDLDDDAKSGKSEAEYIRKT

190 200 210 220 230 240

250 260 270 280 290 300

orf11a.pep XTGWLGMIEHHFMSTWILQPKGGQSVCAAGDCXXDIKRRNDKLYSTSVSVPLAAIQNGAK

|||||||||||||||||||||| |||||||:| ||||||||||||||||||||||||||

orf11-1 PTGWLGMIEHHFMSTWILQPKGRQSVCAAGECNIDIKRRNDKLYSTSVSVPLAAIQNGAK

250 260 270 280 290 300

310 320 330 340 350 360

orf11a.pep SXASINLYAGPQTTSVIANIADNLQLXKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIIV

: |||||||||||||||||||||||| |||||||||||||||||||||||||||||||||

orf11-1 AEASINLYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIIV

310 320 330 340 350 360

370 380 390 400 410 420

orf11a.pep LTIIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKEKYGDDRMAQQQAMMQLYTDEKINPL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 LTIIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKEKYGDDRMAQQQAMMQLYTDEKINPL

370 380 390 400 410 420

430 440 450 460 470 480

orf11a.pep GGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 GGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTY

430 440 450 460 470 480

490 500 510 520 530 540

orf11a.pep LNPPPTDPMQAKMMKIMPLVXSXXFFXFPAGLVLYWVINNLLTIAQQWHINRSIEKQRAQ

|||||||||||||||||||| | || ||||||||||:||||||||||||||||||||||

orf11-1 LNPPPTDPMQAKMMKIMPLVFSVMFFFFPAGLVLYWVVNNLLTIAQQWHINRSIEKQRAQ

490 500 510 520 530 540

orf11a.pep GEVVSX

||||||

orf11-1 GEVVSX

与淋病奈瑟球菌的预计ORF的同源性

ORF11与淋病奈瑟球菌的预计ORF(ORF11.ng)在240个氨基酸重叠区域内显示出有93.6％的相同性：

Orf11 NLYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIIVLT 57

|||||||||||||||||||||||||||||||||||||||||||||||||||||:|||

orf11ng MAVNLYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIVVLT 60

orf11 IIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKEKYGDDRMAQQQAMMQLYTDEKINPLGG 117

||||||||||||||||||||||||||:||:|||||||||||||||||||: ||:||||||

orf11ng IIVKAVLYPLTNASYRSMAKMRAAAPELQTIKEKYGDDRMAQQQAMMQLFEDEEINPLGG 120

orf11 CLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTYLN 177

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11ng CLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTYLN 180

orf11 PPPTDPMQAKMMKIMPLVFSXXFFFFPAGXVLYWVVNNLLTIAQQWHINRSIEKQRAQGE 237

|||||||||||||||||||| ||||||| ||||||||||||||||||||||||||||||

orf11ng PPPTDPMQAKMMKIMPLVFSVMFFFFPAGLVLYWVVNNLLTIAQQWHINRSIEKQRAQGE 240

orf11 VVS 240

|||

orf11ng VVS 243

预计ORF11ng核苷酸序列<SEQ ID 55>编码的蛋白质具有氨基酸序列<SEQ ID56>：

1 MAVNLYAGPQ TTSVIANIAD NLQLAKDYGK VHWFASPLFW LLNQLHNIIG

51 NWGW AIVVLT IIVKAVLYPL TNASYRSMAK MRAAAPELQT IKEKYGDDRM

101 AQQQAMMQLF EDEEINPLGG CLP MLLQIPV FIGLYWALFA SVELRQAPWL

151 GWITDLSRAD PYYILPIIMA ATMFAQTYLN PPPTDPMQAK MMKIMP LVFS

201 VMFFFFPAGL VLYWVVNNLL TIAQQWHINR SIEKQRAQGE VVS*

进一步的序列分析揭示了全部的淋球菌DNA序列<SEQ ID 57>是：

1 ATGGATTTTA AAAGACTCAC GGCGTTTTTC GCCATCGCGC TGGTGATTAT

51 GATCGGCTGG GAAAAAATGT TCCCCACCCC GAAACCCGTC CCCGCGCCCC

101 AACAGGCGGC ACAAAAACAG GCAGCAACCG CTTCCGCCGA AGCCGCGCTC

151 GCGCCCGCAA CGCCGATTAC CGTAACGACC GACACGGTTC AAGCCGTTAT

201 TGATGAAAAA AGTGGCGACC TGCGCCGGCT GACCCTGCTC AAATACAAAG

251 CAACCGGCGA CGAAAACAAA CCGTTCGTCC TGTTTGGCGA CGGCAAAGAA

301 TACACCTACG TCGCCCAATC CGAACTTTTG GACGCGCAGG GCAACAACAT

351 TCTGAAAGGC ATCGGCTTTA GCGCACCGAA AAAACAGTAC ACCCTCAACG

401 GCGACACAGT CGAAGTCCGC CTGAGCGCGC CCGAAACCAA CGGACTGAAA

451 ATCGACAAAG TCTATACCTT TACCAAAGAC AGCTATCTGG TCAACGTCCG

501 CTTCGACATC GCCAACGGCA GCGGTCAAAC CGCCAACCTG AGCGCGGACT

551 ACCGCATCGT CCGCGACCAC AGCGAACCCG AGGGTCAAGG CTACTTTACC

601 CACTCTTACG TCGGCCCTGT TGTTTATACC CCTGAAGGCA ACTTCCAAAA

651 AGTCAGCTTC TCCgacTTgg acgACGATGC gaaaTccggc aaATccgagg

701 ccgaatacaT CCGCAAAACC ccgaccggtt ggctcggcat gattgaacac

751 cacttcatgt ccacctggat cctccAAcct aaaggcggcc aaaacgtttg

801 cgcccaggga gactgccgta tcgacattaa aCgccgcaac gacaagctgt

851 acagcgcaag cgtcagcgtg cctttaaccg ctatcccaac ccgggggcca

901 aaaccgaaaa tggcggTCAA CCTGTATGCC GGTCCGCAAA CCACATCCGT

951 TATCGCAAAC ATCGCcgacA ACCTGCAACT GGCAAAAGAC TACGGTAAAG

1001 TACACTGGTT CGCATCGCCG CTCTTCTGGC TCCTGAACCA ACTGCACAAC

1051 ATTATCGGCA ACTGGGGCTG GGCAATCGTC GTTTTGACCA TCATCGTCAA

1101 AGCCGTACTG TATCCATTGA CCAACGcctc ctACCGTTCG ATGGCGAAAA

1151 TGCGTGccgc cgcacCcaaA CTGCAGACCA TCAAAGAAAA ATAcgGCGAC

1201 GACCGTATGG CGCAACAGCA AGCGATGATG CAGCTTTACA AAgacgAGAA

1251 AATCAACCCG CTGGGCGGCT GTctgcctat gctgttgCAA ATCCCCGTCT

1301 TCATCGGCTT GTACTGGGCA TTGTTCGCCT CCGTAGAATT GCGCCAGGCA

1351 CCTTGGCTGG GCTGGATTAC CGACCTCAGC CGCGCCGACC CCTACTACAT

1401 CCTGCCCATC ATTATGGCGG CAACGATGTT CGCCCAAACC TATCTGAACC

1451 CGCCGCCGAC CGACCCGATG CAGGCGAAAA TGATGAAAAT CATGCCGTTG

1501 GTTTTCTCCG TCATGTTCTT CTTCTTCCCT GCCGGTTTGG TTCTCTACTG

1551 GGTGGTCAAC AACCTCCTGA CCATCGCCCA GCAGTGGCAC ATCAACCGCA

1601 GCATCGAAAA ACAACGCGCC CAAGGCGAAG TCGTTTCCTA A

它编码的蛋白质具有氨基酸序列<SEQ ID 58；ORF11ng-1>：

1 MDFKRLTAFF AIALVIMIGW EKMFPTPKPV PAPQQAAQKQ AATASAEAAL

51 APATPITVTT DTVQAVIDEK SGDLRRLTLL KYKATGDENK PFVLFGDGKE

101 YTYVAQSELL DAQGNNILKG IGFSAPKKQY TLNGDTVEVR LSAPETNGLK

151 IDKVYTFTKD SYLVNVRFDI ANGSGQTANL SADYRIVRDH SEPEGQGYFT

201 HSYVGPVVYT PEGNFQKVSF SDLDDDAKSG KSEAEYIRKT PTGWLGMIEH

251 HFMSTWILQP KGGQNVCAQG DCRIDIKRRN DKLYSASVSV PLTAIPTRGP

301 KPKMAVNLYA GPQTTSVIAN IADNLQLAKD YGKVHWFASP LFWLLNQLHN

351 IIGNWGW AIV VLTIIVKAVL YPLTNASYRS MAKMRAAAPK LQTIKEKYGD

401 DRMAQQQAMM QLYKDEKINP LGGCLP MLLQ IPVFIGLYWA LFASVELRQA

451 PWLGWITDLS RADPYYILPI IMAATMFAQT YLNPPPTDPM QAKMMKIMP L

501 VFSVMFFFFP AGLVLYWVVN NLLTIAQQWH INRSIEKQRA QGEVVS*

ORF11ng-1和ORF11-1在546个氨基酸的重叠区域内显示出有95.1％的相同性：

10 20 30 40 50 60

orf11ng-1.pep MDFKRLTAFFAIALVIMIGWEKMFPTPKPVPAPQQAAQKQAATASAEAALAPATPITVTT

||||||||||||||||||||||||||||||||||||||:||:||||||||||||||||||

orf11-1 MDFKRLTAFFAIALVIMIGWEKMFPTPKPVPAPQQAAQQQAVTASAEAALAPATPITVTT

10 20 30 40 50 60

70 80 90 100 110 120

orf11ng-1.pep DTVQAVIDEKSGDLRRLTLLKYKATGDENKPFVLFGDGKEYTYVAQSELLDAQGNNILKG

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf11-1 DTVQAVIDEKSGDLRRLTLLKYKATGDENKPFILFGDGKEYTYVAQSELLDAQGNNILKG

70 80 90 100 110 120

130 140 150 160 170 180

orf11ng-1.pep IGFSAPKKQYTLNGDTVEVRLSAPETNGLKIDKVYTFTKDSYLVNVRFDIANGSGQTANL

||||||||||:|:|| |||||||||| |||||||||||| ||||||||||||||||||||

orf11-1 IGFSAPKKQYSLEGDKVEVRLSAPETRGLKIDKVYTFTKGSYLVNVRFDIANGSGQTANL

130 140 150 160 170 180

190 200 210 220 230 240

orf11ng-1.pep SADYRIVRDHSEPEGQGYFTHSYVGPVVYTPEGNFQKVSFSDLDDDAKSGKSEAEYIRKT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 SADYRIVRDHSEPEGQGYFTHSYVGPVVYTPEGNFQKVSFSDLDDDAKSGKSEAEYIRKT

190 200 210 220 230 240

250 260 270 280 290 300

orf11ng-1.pep PTGWLGMIEHHFMSTWILQPKGGQNVCAQGDCRIDIKRRNDKLYSASVSVPLTAIPTRGP

|||||||||||||||||||||| |:||| |:| ||||||||||||:||||||:|| : |

orf11-1 PTGWLGMIEHHFMSTWILQPKGRQSVCAAGECNIDIKRRNDKLYSTSVSVPLAAIQN-GA

250 260 270 280 290

310 320 330 340 350 360

orf11ng-1.pep KPKMAVNLYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAIV

| : ::|||||||||||||||||||||||||||||||||||||||||||||||||||||:

orf11-1 KAEASINLYAGPQTTSVIANIADNLQLAKDYGKVHWFASPLFWLLNQLHNIIGNWGWAII

300 310 320 330 340 350

370 380 390 400 410 420

orf11ng-1.pep VLTIIVKAVLYPLTNASYRSMAKMRAAAPKLQTIKEKYGDDRMAQQQAMMQLYKDEKINP

||||||||||||||||||||||||||||||||:|||||||||||||||||||| ||||||

orf11-1 VLTIIVKAVLYPLTNASYRSMAKMRAAAPKLQAIKEKYGDDRMAQQQAMMQLYTDEKINP

360 370 380 390 400 410

430 440 450 460 470 480

orf11ng-1.pep LGGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 LGGCLPMLLQIPVFIGLYWALFASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQT

420 430 440 450 460 470

490 500 510 520 530 540

orf11ng-1.pep YLNPPPTDPMQAKMMKIMPLVFSVMFFFFPAGLVLYWVVNNLLTIAQQWHINRSIEKQRA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf11-1 YLNPPPTDPMQAKMMKIMPLVFSVMFFFFPAGLVLYWVVNNLLTIAQQWHINRSIEKQRA

480 490 500 510 520 530

orf11ng-1.pep QGEVVSX

|||||||

orf11-1 QGEVVSX

540

另外，ORF11ng-1显示出与数据库中的内膜蛋白(登录号为p25754)明显同源：

ID 60IM_PSEPU STANDARD； PRT； 560 AA.

AC P25754；

DT 01-MAY-1992(REL.22，产生)

DT 01-MAY-1992(REL.22，序列的最后更新)

DT 01-NOV-1995(REL.32，注解的最后更新)

DE 60 KD内膜蛋白....

SCORES Init1：1074 Initn：1293 Opt：1103

Smith-Waterman评分：1406；574个氨基酸重叠区内有41.5％的相同性

10 20 30 40

orf11ng-1.pep MDFKR---LTAFFAIALVIMIGW-----EKMFPT------------PKPVPAPQQAAQKQ

||:|| ::|: ::: |::: | : :|| | ||| :::|: :

p25754 MDIKRTILIAALAVVSYVMVLKWNDDYGQAALPTQNTAASTVAPGLPDGVPAGNNGASAD

10 20 30 40 50 60

50 60 70 80 90

orf11ng-1.pep AATASAEAALAPATPIT-------VTTDTVQAVIDEKSGDLRRLTLLKYKATGDE-NKPF

: :|:||:: | :|:: | ||::: :|| :||: :|:| || |: | ||

p25754 VPSANAESSPAELAPVALSKDLIRVKTDVLELAIDPVGGDIVQLNLPKYPRRQDHPNIPF

70 80 90 100 110 120

100 110 120 130 140

orf11ng-1.pep VLFGDGKEYTYVAQSELLDAQGNNILKGIG---FSAPKKQYTL-NGD---TVEVRLSAPE

|| :| | :|:||| | ::| : :: | ::| :|:| | :|: :|::::|

p25754 QLFDNGGERVYLAQSGLTGTDGPDA-RASGRPLYAAEQKSYQLADGQEQLVVDLKFS---

130 140 150 160 170

150 160 170 180 190 200

orf11ng-1.pep TNGLKIDKVYTFTKDSYLVNVRFDIANGSGQTANLSADYRIVRDHS-EPEGQGYF-THSY

||:: | ::| : | :|| : | | |||: | : :: || | :| :: | :|

p25754 DNGVNYIKRFSFKRGEYDLNVSYLIDNQSGQAWNGNMFAQLKRDASGDPSSSTATGTATY

180 190 200 210 220 230

210 220 230 240 250 260

orf11ng-1.pep VGPVVYTPEGNFQKVSFSDLDDDAKSGKSEAEYIRKTPTGWLGMIEHHFMSTWILQPKGG

:| :::| ::|||::|:| |:: :| :: ||:: ::|:|:::|| |:

p25754 LGAALWTASEPYKKVSMKDID---KGSLKE-----NVSGGWVAWLQHYFVTAWI-PAKSD

240 250 260 270 280

270 280 290 300 310 320

orf11ng-1.pep QNVCAQGDCRIDIKRRNDKLYSASVSVPLTAIPTRGPKPKMAVNLYAGPQTTSVIANIAD

:|| :: :: :: | : : |: ::|: | | : :: |||||: | : :::

p25754 NNV-------VQTRKDSQGNYIIGYTGPVISVPA-GGKVETSALLYAGPKIQSKLKELSP

290 300 310 320 330

330 340 350 360 370 380

orf11ng-1.pep NLQLAKDYGKVHWF-ASPLFWLLNQLHNIIGNWGWAIVVLTIIVKAVLYPLTNASYRSMA

:|:|: ||| : || |:|:||||:::|:::|||||:|:|||:::|::::||: |||||||

p25754 GLELTVDYGFL-WFIAQPIFWLLQHIHSLLGNWGWSIIVLTMLIKGLFFPLSAASYRSMA

340 350 360 370 380 390

390 400 410 420 430 440

orf11ng-1.pep KMRAAAPKLQTIKEKYGDDRMAQQQAMMQLYKDEKINPLGGCLPMLLQIPVFIGLYWALF

:|||:|||| ::||::||||: ::||||:||| |||||||||||:|:|:|||::|||:|:

p25754 RMRAVAPKLAALKERFGDDRQKMSQAMMELYKKEKINPLGGCLPILVQMPVFLALYWVLL

400 410 420 430 440 450

450 460 470 480 490 500

orf11ng-1.pep ASVELRQAPWLGWITDLSRADPYYILPIIMAATMFAQTYLNPPPTDPMQAKMMKIMPLVF

|||:|||||: |||||| ||::||||||:|||| | ||| | ||||||:||:||::|

p25754 ESVEMRQAPWILWITDLSIKDPFFILPIIMGATMFIQQRLNPTPPDPMQAKVMKMMPIIF

460 470 480 490 500 510

510 520 530 540

orf11ng-1.pep SVMFFFFPAGLVLYWVVNNLLTIAQQWHINRSIEKQRAQGEVVSX

: :|::||||||||||||| |:|:|||:|:| ||

p25754 TFFFLWFPAGLVLYWVVNNCLSISQQWYITRRIEAATKKAAA

520 530 540 550 560

根据该分析结果(包括与恶臭假单胞菌的内膜蛋白以及预计的跨膜结构域有同源性(在脑膜炎球菌和淋球菌蛋白均见到))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白及其表位可能是疫苗或诊断，或产生抗体的有用抗体。

实施例8

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 59>：

1 ..GCCGTCTTAA TCATCGAATT ATTGACGGGA ACGGTTTATC TTTTGGTTGT

51 NAGCGCGGCT TTGGCGGGTT CGGGCATTGC TTACGGGCTG ACCGGCAGTA

101 CGCCTGCCGC CGTCTTGACC GNCGCTCTGC TTTCCGCGCT GGGTATTTNG

151 TTCGTACACG CCAAAACCGC CGTTAGAAAA GTTGAAACGG ATTCATATCA

201 GGATTTGGAT GCCGGACAAT ATGTCGAAAT CCTCCGNCAC ACAGGCGGCA

251 ACCGTTACGA AGTT.TTTAT CGCGGTACG. ACTGGCAGGC TCAAAATACG

301 GGGCAAGAAG AGCTTGAACC AGGAACTCGC GCCCTCATTG TCCGCAAGGA

351 AGGCAACCTT CTTATTATCA CACACCCTTA A

它对应于氨基酸序列<SEQ ID 60；ORF13>：

1.. AVLIIELLTG TVYLLVVSAA LAGSGIAYGL TGSTPAAVLT XALLSALGIX

51 FVHAKTAVRK VETDSYQDLD AGQYVEILRH TGGNRYEVXY RGTXWQAQNT

101 GQEELEPGTR ALIVRKEGNL LIITHP*

进一步的序列分析稍稍详细地描述了DNA序列<SEQ ID 61>：

1 ..GCCGTCTTAA TCATCGAATT ATTGACGGGA ACGGTTTATC TTTTGGTTGT

51 nAGCGCGGCT TTGGCGGGTT CGGGCATTGC TTACGGGCTG ACCGGCAGTA

101 CGCCTGCCGC CGTCTTGACC GnCGCTCTGC TTTCCGCGCT GGGTATTTnG

151 TTCGTACACG CCAAAACCGC CGTTAGAAAA GTTGAAACGG ATTCATATCA

201 GGATTTGGAT GCCGGACAAT ATGTCGAAAT CCTCCGACAC ACAGGCGGCA

251 ACCGTTACGA AGTTTTtTAT CGCGGTACGc ACTGGCAGGC TCAAAATACG

301 GGGCAAGAAG AGCTTGAACC AGGAACTCGC GCCCTCATTG TCCGCAAGGA

351 AGGCAACCTT CTTATTATCA CACACCCTTA A

它对应于氨基酸序列<SEQ ID 62；ORF13-1>：

1.. AVLIIELLTG TVYLLVVSAA LAGSGIAYGL TGSTPAAVLT XALLSALGIX

51 FVHAKTAVRK VETDSYQDLD AGQYVEILRH TGGNRYEVFY RGTHWQAQNT

101 GQEELEPGTR ALIVRKEGNL LIITHP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF13和脑膜炎奈瑟球菌菌株A的ORF(ORF13a)在126氨基酸重叠区显示出有92.9％的相同性：

10 20 30 40 50

orf13.pep AVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTXALLSALGIXF

|||||||||||||||||||||||||||||||||||||||| |||||||| |

orf13a MTVWFVAAVAVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTAALLSALGIWF

10 20 30 40 50 60

60 70 80 90 100 110

orf13.pep VHAKTAVRKVETDSYQDLDAGQYVEILRHTGGNRYEVXYRGTXWQAQNTGQEELEPGTRA

||||||| |||||||||||||||:|||||:||||||| |||| |||||||||||||||||

orf13a VHAKTAVGKVETDSYQDLDAGQYAEILRHAGGNRYEVFYRGTHWQAQNTGQEELEPGTRA

70 80 90 100 110 120

120

orf13.pep LIVRKEGNLLIITHPX

||||||||||||::||

orf13a LIVRKEGNLLIIAKPX

130

全长ORF13a核苷酸序列<SEQ ID 63>是：

1 ATGACTGTAT GGTTTGTTGC CGCTGTTGCC GTCTTAATCA TCGAATTATT

51 GACGGGAACG GTTTATCTTT TGGTTGTCAG CGCGGCTTTG GCGGGTTCGG

101 GCATTGCTTA CGGGCTGACC GGCAGCACGC CTGCCGCCGT CTTGACCGCC

151 GCTCTGCTTT CCGCGCTGGG TATTTGGTTC GTACACGCCA AAACCGCCGT

201 GGGAAAAGTT GAAACGGATT CATATCAGGA TTTGGATGCC GGGCAATATG

251 CCGAAATCCT CCGGCACGCA GGCGGCAACC GTTACGAAGT TTTTTATCGC

301 GGTACGCACT GGCAGGCTCA AAATACGGGG CAAGAAGAGC TTGAACCAGG

351 AACGCGCGCC CTAATCGTCC GCAAGGAAGG CAACCTTCTT ATCATCGCAA

401 AACCTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 64>：

1 MTVWFVAAVA VLIIELLTGT VYLLVVSAAL AGSGIAYGLT GSTPAAVLTA

51 ALLSALGIWF VHAKTAVGKV ETDSYQDLDA GQYAEILRHA GGNRYEVFYR

101 GTHWQAQNTG QEELEPGTRA LIVRKEGNLL IIAKP*

ORF13a和ORF13-1在126氨基酸重叠区内表现出94.4％的相同性

10 20 30 40 50 60

orf13a.pep MTVWFVAAVAVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTAALLSALGIWF

|||||||||||||||||||||||||||||||||||||||| |||||||| |

orf13-1 AVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTXALLSALGIXF

10 20 30 40 50

70 80 90 100 110 120

orf13a.pep VHAKTAVGKVETDSYQDLDAGQYAEILRHAGGNRYEVFYRGTHWQAQNTGQEELEPGTRA

||||||| |||||||||||||||:|||||:||||||||||||||||||||||||||||||

orf13-1 VHAKTAVRKVETDSYQDLDAGQYVEILRHTGGNRYEVFYRGTHWQAQNTGQEELEPGTRA

60 70 80 90 100 110

orf13a.pep LIVRKEGNLLIIAKPX

||||||||||||::||

orf13-1 LIVRKEGNLLIITHPX

120

与淋病奈瑟球菌的预计ORF的同源性

ORF13和淋病奈瑟球菌的预计ORF(ORF13.ng)在126氨基酸重叠区内显示出有89.7％的相同性：

orf13 AVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTXALLSALGIXF 51

|||||||||||||||||||||||||||||||||||||||| |||||||| |

orf13ng MTVWFVAAVAVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTAALLSALGIWF 60

orf13 VHAKTAVRKVETDSYQDLDAGQYVEILRHTGGNRYEVXYRGTXWQAQNTGQEELEPGTRA 111

||||||| |||||||||||:|:|:||||:|||||||| |||| ||||||||| :||||||

orf13ng VHAKTAVGKVETDSYQDLDTGKYAEILRYTGGNRYEVFYRGTHWQAQNTGQEVFEPGTRA 120

orf13 LIVRKEGNLLIITHP 126

||||||||||||::|

orf13ng LIVRKEGNLLIIANP 135

全长ORF13ng核苷酸序列<SEQ ID 65>是：

1 ATGACTGTAT GGTTTGTTGC CGCTGTTGCC GTCTTAATCA TCGAATTATT

51 GACGGGAACG GTTTATCTTT TGGTTGTCAG CGCGGCTTTG GCGGGTTCGG

101 GCATTGCCTA CGGGCTGACT GGCAGCACGC CTGCCGCCGT CTTGACCGCC

151 GCACTGCTTT CCGCGCTGGG CATTTGGTTC GTACATGCCA AAACCGCCGT

201 GGGAAAAGTT GAAACGGATT CATATCAGGA TTTGGATACC GGAAAATATG

251 CCGAAATCCT CCGATACACA GGCGGCAACC GTTACGAAGT TTTTTATCGC

301 GGTACGCACT GGCAGGCGCA AAATACGGGG CAGGAAGTGT TTGAACCGGG

351 AACGCGCGCC CTCATCGTCC GCAAAGAAGG TAACCTTCTT ATCATCGCAA

401 ACCCTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 66>：

1 MTVWFVAAVA VLIIELLTGT VYLLVVSAAL AGSGIAYGLT GSTPAAVLTA

51 ALLSALGIWF VHAKTAVGKV ETDSYQDLDT GKYAEILRYT GGNRYEVFYR

101 GTHWQAQNTG QEVFEPGTRA LIVRKEGNLL IIANP*

OFR13ng和ORF13-1在重叠的126个氨基酸内显示出有91.3％的相同性：

10 20 30 40 50

orf13-1.pep AVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTXALLSALGIXF

|||||||||||||||||||||||||||||||||||||||| |||||||| |

orf13ng MTVWFVAAVAVLIIELLTGTVYLLVVSAALAGSGIAYGLTGSTPAAVLTAALLSALGIWF

10 20 30 40 50 60

60 70 80 90 100 110

orf13-1.pep VHAKTAVRKVETDSYQDLDAGQYVEILRHTGGNRYEVFYRGTHWQAQNTGQEELEPGTRA

||||||| |||||||||||:|:|:||||:||||||||||||||||||||||| :||||||

orf13ng VHAKTAVGKVETDSYQDLDTGKYAEILRYTGGNRYEVFYRGTHWQAQNTGQEVFEPGTRA

70 80 90 100 110 120

120

orf13-1.pep LIVRKEGNLLIITHPX

||||||||||||::||

orf13ng LIVRKEGNLLIIANPX

130

根据该分析，包括该蛋白中的延伸前导序列，预计ORF13和ORF13ng可能是外膜蛋白。因此，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可能是疫苗或诊断，或产生抗体的有用抗原。

实施例9

在脑膜炎奈瑟球菌中鉴定出下列DNA序列<SEQ ID 67>：

1 ATGTwTGATT TCGGTTTrGG CGArCTGGTT TTTGTCGGCA TTATCGCCCT

51 GATwGtCCTC GGCCCCGAAC GCsTGCCCGA GGCCGCCCGC AyCGCCGGAC

101 GGcTCATCGG CAGGCTGCAA CGCTTTGTCG GcAGCGTCAA ACAGGAATTT

151 GACACTCAAA TCGAACTGGA AGAACTGAGG AAGGCAAAGC AGGAATTTGA

201 AGCTGCCGcC GCTCAGGTTC GAGACAGCCT CAAAGAAACC GGTACGGATA

251 TGGAAGGCAA TCTGCACGAC ATTTCCGACG GTCTGAAGCC TTGGGAAAAA

301 CTGCCCGAAC AGCGGACACC TGCCGATTTC GGTGTCGATG AAAACGGCAA

351 TCCGCT.TCC CGATGCGGCA AACACCCTAT CAGACGGCAT TTCCGACGTT

401 ATGCCGTC..

它对应于氨基酸序列<SEQ ID 68；ORF2>：

1 MXDFGLGELV FVGIIALIVL GPERXPEAAR XAGRLIGRLQ RFVGSVKQEF

51 DTQIELEELR KAKQEFEAAA AQVRDSLKET GTDMEGNLHD ISDGLKPWEK

101 LPEQRTPADF GVDENGNPXS RCGKHPIRRH FRRYAV.

进一步的工作揭示了完整的核苷酸序列<SEQ ID 69>：

1 ATGTTTGATT TCGGTTTGGG CGAGCTGGTT TTTGTCGGCA TTATCGCCCT

51 GATTGTCCTC GGCCCCGAAC GCCTGCCCGA GGCCGCCCGC ACCGCCGGAC

101 GGCTCATCGG CAGGCTGCAA CGCTTTGTCG GCAGCGTCAA ACAGGAATTT

151 GACACTCAAA TCGAACTGGA AGAACTGAGG AAGGCAAAGC AGGAATTTGA

201 AGCTGCCGCC GCTCAGGTTC GAGACAGCCT CAAAGAAACC GGTACGGATA

251 TGGAAGGCAA TCTGCACGAC ATTTCCGACG GTCTGAAGCC TTGGGAAAAA

301 CTGCCCGAAC AGCGGACACC TGCCGATTTC GGTGTCGATG AAAACGGCAA

351 TCCGCTTCCC GATGCGGCAA ACACCCTATC AGACGGCATT TCCGACGTTA

401 TGCCGTCCGA ACGTTCCTAC GCTTCCGCCG AAACCCTTGG GGACAGCGGG

451 CAAACCGGCA GTACAGCCGA ACCCGCGGAA ACCGACCAAG ACCGCGCATG

501 GCGGGAATAC CTGACTGCTT CTGCCGCCGC ACCCGTCGTA CAGACCGTCG

551 AAGTCAGCTA TATCGATACT GCTGTTGAAA CGCCTGTTCC GCACACCACT

601 TCCCTGCGCA AACAGGCAAT AAGCCGCAAA CGCGATTTTC GTCCGAAACA

651 CCGCGCCAAA CCTAAATTGC GCGTCCGTAA ATCATAA

它对应于氨基酸序列<SEQ ID 70；ORF2-1>：

1 MFD FGLGELV FVGIIALIVL GPERLPEAAR TAGRLTGRLQ RFVGSVKQEF

51 DTQIELEELR KAKQEFEAAA AQVRDSLKET GTDMEGNLHD ISDGLKPWEK

101 LPEQRTPADF GVDENGNPLP DAANTLSDGI SDVMPSERSY ASAETLGDSG

151 QTGSTAEPAE TDQDRAWREY LTASAAAPVV QTVEVSYIDT AVETPVPHTT

201 SLRKQAISRK RDFRPKHRAK PKLRVRKS*

进一步的工作鉴定了脑膜炎奈瑟球菌菌株A中对应的基因<SEQ ID 71>：

1 ATGTTTGATT TCGGTTTGGG CGAGCTGGTT TTTGTCGGCA TTATCGCCCT

51 GATTGTCCTC GGCCCCGAAC GCCTGCCCGA GGCCGCCCGC ACCGCCGGAC

101 GGCTCATCGG CAGGCTGCAA CGCTTTGTCG GCAGCGTCAA ACAGGAATTT

151 GACACGCAAA TCGAACTGGA AGAACTAAGG AAGGCAAAGC AGGAATTTGA

201 AGCTGCCGCT GCTCAGGTTC GAGACAGCCT CAAAGAAACC GGTACGGATA

251 TGGAGGGTAA TCTGCACGAC ATTTCCGACG GTCTGAAGCC TTGGGAAAAA

301 CTGCCCGAAC AGCGCACGCC TGCTGATTTC GGTGTCGATG AAAACGGCAA

351 TCCCTTTCCC GATGCGGCAA ACACCCTATT AGACGGCATT TCCGACGTTA

401 TGCCGTCCGA ACGTTCCTAC GCTTCCGCCG AAACCCTTGG GGACAGCGGG

451 CAAACCGGCA GTACAGCCGA ACCCGCGGAA ACCGACCAAG ACCGTGCATG

501 GCGGGAATAC CTGACTGCTT CTGCCGCCGC ACCCGTCGTA CAGACCGTCG

551 AAGTCAGCTA TATCGATACC GCTGTTGAAA CCCCTGTTCC GCATACCACT

601 TCGCTGCGTA AACAGGCAAT AAGCCGCAAA CGCGATTTGC GTCCTAAATC

651 CCGCGCCAAA CCTAAATTGC GCGTCCGTAA ATCATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 72；ORF2a>：

1 MFD FGLGELV FVGIIALIVL GPERLPEAAR TAGRLIGRLQ RFVGSVKQEF

51 DTQIELEELR KAKQEFEAAA AQVRDSLKET GTDMEGNLHD ISDGLKPWEK

101 LPEQRTPADF GVDENGNPFP DAANTLLDGI SDVMPSERSY ASAETLGDSG

151 QTGSTAEPAE TDQDRAWREY LTASAAAPVV QTVEVSYIDT AVETPVPHTT

201 SLRKQAISRK RDLRPKSRAK PKLRVRKS*

最初鉴定的菌株B部分序列(ORF2)和ORF2a在重叠的118氨基酸内显示出有97.5％的相同性：

10 20 30 40 50 60

orf2.pep MXD FGLGELVFVGIIALIVLGPERXPEAARXAGRLIGRLQRFVGSVKQEFDTQIELEELR

| | ||||||||||||||||| |||| |||||:|||||||||||||||||||||||||||||

orf2a MFD FGLGELVFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQEFDTQIELEELR

10 20 30 40 50 60

70 80 90 100 110 120

orf2.pep KAK QEFEAAAAQVRDSLKET GTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPXS

||| ||||||||||||||||| ||||||||||||||||||||||||||||||||||||||

orf2a KAK QEFEAAAAQVRDSLKET GTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPFP

70 80 90 100 110 120

130

orf2.pep RCG KHPIRRHFRRYAV

orf2a DAA NTLLDGISDVMPSERSY ASAETLGDSGQTGSTAEPAETDQDRAWREYLTASAAAPVV

130 140 150 160 170 180

完整的菌株B序列(ORF2-1)和ORF2a在228个氨基酸重叠区内显示出有98.2％的相同性：

orf2a.pep MFDFGLGELVFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQEFDTQIELEELR 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf2-1 MFDFGLGELVFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQEFDTQIELEELR 60

orf2a.pep KAKQEFEAAAAQVRDSLKETGTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPFP 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf2-1 KAKQEFEAAAAQVRDSLKETGTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPLP 120

orf2a.pep DAANTLLDGISDVMPSERSYASAETLGDSGQTGSTAEPAETDQDRAWREYLTASAAAPVV 180

|||||| |||||||||||||||||||||||||||||||||||||||||||||||||||||

orf2-1 DAANTLSDGISDVMPSERSYASAETLGDSGQTGSTAEPAETDQDRAWREYLTASAAAPVV 180

orf2a.pep QTVEVSYIDTAVETPVPHTTSLRKQAISRKRDLRPKSRAKPKLRVRKSX 229

||||||||||||||||||||||||||||||||:||| ||||||||||||

orf2-1 QTVEVSYIDTAVETPVPHTTSLRKQAISRKRDFRPKHRAKPKLRVRKSX 229

进一步的工作鉴定了淋病奈瑟球菌中的部分DNA序列<SEQ ID 73>，它编码下列氨基酸序列<SEQ ID 74；ORF2ng>：

1 MFD FGLGELI FVGIIALIVL GPERLPEAAR TAGRLIGRLQ RFVGSVKQEL

51 DTQIELEELR KVKQAFEAAA AQVRDSLKET DTDMQNSLHD ISDGLKPWEK

101 LPEQRTPADF GVDEKGNSLS RYGKHRIRRH FRRYAV*

进一步的工作鉴定了完整的淋球菌基因序列<SEQ ID 75>：

1 ATGTTTGATT TCGGTTTGGG CGAGCTGATT TTTGTCGGCA TTATCGCCCT

51 GATTGTCCTT GGTCCAGAAC GCCTGCCCGA AGCCGCCCGC ACTGCCGGAC

101 GGCTTATCGG CAGGCTGCAA CGCTTTGTAG GAAGCGTCAA ACAAGAACTT

151 GACACTCAAA TCGAACTGGA AGAGCTGAGG AAGGTCAAGC AGGCATTCGA

201 AGCTGCCGCC GCTCAGGTTC GAGACAGCCT CAAAGAAACC GATACGGATA

251 TGCAGAACAG TCTGCACGAC ATTTCCGACG GTCTGAAGCC TTGGGAAAAA

301 CTGCCCGAAC AGCGCACGCc tgccgatttc gGTGTCGATg AAAacggcaa

351 tccccttccc gATACGGCAA ACACCGTATC AGACGGCATT TCCGACGTTA

401 TGCCGTCTGA ACGTTCCGAT ACTtccgcCG AAACCCTTGG GGACGACAGG

451 CAAACCGGCA GTACAGCCGA ACCTGCGGAA ACCGACAAAG ACCGCGCATG

501 GCGGGAATAC CTGactgctt ctgccgccgc acctgtcgta Cagagggccg

551 tcgaagtcag ctaTATCGAT ACTGCTGTTG AAacgcctgT tccgcaCacc

601 acttccctgc gcaAACAGGC AATAAACCGC AAACGCGATT TttgtccgaA

651 ACACCGCGCc aAACCGAAat tgcgcgtcCG TAAATCATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 76；ORF2ng-1>：

1 MFD FGLGELI FVGIIALIVL GPERLPEAAR TAGRLIGRLQ RFVGSVKQEL

51 DTQIELEELR KVKQAFEAAA AQVRDSLKET DTDMQNSLHD ISDGLKPWEK

101 LPEQRTPADF GVDENGNPLP DTANTVSDGI SDVMPSERSD TSAETLGDDR

151 QTGSTAEPAE TDKDRAWREY LTASAAAPVV QRAVEVSYID TAVETPVPHT

201 TSLRKQAINR KRDFCPKHRA KPKLRVRKS*

最初鉴定的菌株B部分序列(ORF2)和ORF2ng在重叠的136个氨基酸内显示出有87.5％的相同性：

orf2.pep MXDFGLGELVFVGIIALIVLGPERXPEAARXAGRLIGRLQRFVGSVKQEFDTQIELEELR 60

| |||||||:|||||||||||||| |||||:||||||||||||||||||:||||||||||

orf2ng MFDFGLGELIFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQELDTQIELEELR 60

orf2.pep KAKQEFEAAAAQVRDSLKETGTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPXS 120

|:|| ||||||||||||||| |||:::|||||||||||||||||||||||||||:||

orf2ng KVKQAFEAAAAQVRDSLKETDTDMQNSLHDISDGLKPWEKLPEQRTPADFGVDEKGNSLP 120

orf2.pep RCGKHPIRRHFRRYAV 136

| ||| ||||||||||

orf2ng RYGKHRIRRHFRRYAV 136

完整的菌株B和淋球菌序列(ORF2-1和ORF2ng-1)在229个氨基酸的重叠区内显示出有91.7％的相同性：

10 20 30 40 50 60

orf2-1.pep MFDFGLGELVFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQEFDTQIELEELR

|||||||||:|||||||||||||||||||||||||||||||||||||||:||||||||||

orf2ng-1 MFDFGLGELIFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQELDTQIELEELR

10 20 30 40 50 60

70 80 90 100 110 120

orf2-1.pep KAKQEFEAAAAQVRDSLKETGTDMEGNLHDISDGLKPWEKLPEQRTPADFGVDENGNPLP

|:|| ||||||||||||||| |||:::|||||||||||||||||||||||||||||||||

orf2ng-1 KVKQAFEAAAAQVRDSLKETDTDMQNSLHDISDGLKPWEKLPEQRTPADFGVDENGNPLP

70 80 90 100 110 120

130 140 150 160 170 180

orf2-1.pep DAANTLSDGISDVMPSERSYASAETLGDSGQTGSTAEPAETDQDRAWREYLTASAAAPVV

|:|||:||||||||||||| :|||||||: ||||||||||||:|||||||||||||||||

orf2ng-1 DTANTVSDGISDVMPSERSDTSAETLGDDRQTGSTAEPAETDKDRAWREYLTASAAAPVV

130 140 150 160 170 180

190 200 210 220 229

orf2-1.pep Q-TVEVSYIDTAVETPVPHTTSLRKQAISRKRDFRPKHRAKPKLRVRKSX

| :|||||||||||||||||||||||||:||||| |||||||||||||||

orf2ng-1 QRAVEVSYIDTAVETPVPHTTSLRKQAINRKRDFCPKHRAKPKLRVRKSX

190 200 210 220 230

计算机分析这些氨基酸序列，结果提示了一个跨膜区(下划线)，并且还揭示淋球菌序列与大肠杆菌的TatB蛋白之间有同源性(59％的相同性)：

gnl|PID|e1292181(AJ005830)TatB蛋白[大肠杆菌]长度＝171

评分＝56.6位(134)，估计值＝1e-07

相同性＝30/88(34％)，阳性＝52/88(59％)，空隙＝1/88(1％)

询问：1 MFDFGLGELIFVGIIALIVLGPERLPEAARTAGRLIGRLQRFVGSVKQELDTQIELEELR 60

MFD G EL+ V II L+VLGP+RLP A +T I L+ +V+ EL +++L+E +

目标：1 MFDIGFSELLLVFIIGLVVLGPQRLPVAVKTVAGWIRALRSLATTVQNELTQELKLQEFQ 60

询问：61 -KVKQAFEAAAAQVRDSLKETDTDMQNS 87

+K+ +A+ + LK + +++ +

目标：61 DSLKKVEKASLTNLTPELKASMDELRQA 88

根据该分析，预计ORF2、ORF2a和ORF2ng可能是膜蛋白，因此，脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF2-1(16kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图3A显示了GST融合蛋白亲和纯化的结果，图3B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST融合蛋白免疫小鼠，用小鼠血清进行Western印迹(图3C)、ELISA(阳性结果)和FACS分析(图3D)。这些实验确认ORF37-1是一种外露蛋白，并且它是有用的免疫原。

实施例10

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 77>：

1 ATGCAAGCAC GGCTGCTGAT ACCTATTCTT TTTTCAGTTT TTATTTTATC

51 CGC.TGCGGG ACACTGACAG GTATTCCATC GCATGGCGgA GkTAAACgCT

101 TTgCGGTCGA ACAAGAACTT GTGGCCGCTT CTGCCAGAGC TGCCGTTAAA

151 GACATGGATT TACAGGCATT ACACGGACGA AAAGTTGCAT TGTACATTGC

201 CACTATGGGC GACCAAGGTT CAGGcAGTTT GACAGGGGGG

CGCTACTCC

251 ATTGATGCAC kGrTwCsTGG CGAATACATA AACAGCCCTG CCGTCCGTAC

301 CGATTACACC TATCCACGTT ACGAAACCAC CGCTGAAACA ACATCAGGCG

351 GTTTGACAGG TTTAACCACT TCTTTATCTA CACTTAATGC CCCTGCACTC

401 TCTCGCACCC AATCAGACGG TAGCGGAAGT AAAAGCAGTC TGGGCTTAAA

451 TATTGGCGGG ATGGGGGATT ATCGAAATGA AACCTTGACG ACTAACCCGC

501 GCGACACTGC CTTTCTTTCC CACTTGGTAC AGACCGTATT TTTCCTGCGC

551 GGCATAGACG TTGTTTCTCC TGCCAATGCC GATACAGATG TGTTTATTAA

601 CATCGACGTA TTCGGAACGA TACGCAACAG AACCGAAATG..

它对应于氨基酸序列<SEQ ID 78；ORF 15>：

1 MQA RLLIPIL FSVF ILSACG TLTGIPSHGG XKRFAVEQEL VAASARAAVK

51 DMDLQALHGR KVALYIATMG DQGSGSLTGG RYSIDAXXXG EYINSPAVRT

101 DYTYPRYETT AETTSGGLTG LTTSLSTLNA PALSRTQSDG SGSKSSLGLN

151 IGGMGDYRNE TLTTNPRDTA FLSHLVQTVF FLRGIDVVSP ANADTDVFIN

201 IDVFGTIRNR TEM..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 79>：

1 ATGCAAGCAC GGCTGCTGAT ACCTATTCTT TTTTCAGTTT TTATTTTATC

51 CGCCTGCGGG ACACTGACAG GTATTCCATC GCATGGCGGA GGTAAACGCT

101 TTGCGGTCGA ACAAGAACTT GTGGCCGCTT CTGCCAGAGC TGCCGTTAAA

151 GACATGGATT TACAGGCATT ACACGGACGA AAAGTTGCAT TGTACATTGC

201 CACTATGGGC GACCAAGGTT CAGGCAGTTT GACAGGGGGT CGCTACTCCA

251 TTGATGCACT GATTCGTGGC GAATACATAA ACAGCCCTGC CGTCCGTACC

301 GATTACACCT ATCCACGTTA CGAAACCACC GCTGAAACAA CATCAGGCGG

351 TTTGACAGGT TTAACCACTT CTTTATCTAC ACTTAATGCC CCTGCACTCT

401 CTCGCACCCA ATCAGACGGT AGCGGAAGTA AAAGCAGTCT GGGCTTAAAT

451 ATTGGCGGGA TGGGGGATTA TCGAAATGAA ACCTTGACGA CTAACCCGCG

501 CGACACTGCC TTTCTTTCCC ACTTGGTACA GACCGTATTT TTCCTGCGCG

551 GCATAGACGT TGTTTCTCCT GCCAATGCCG ATACAGATGT GTTTATTAAC

601 ATCGACGTAT TCGGAACGAT ACGCAACAGA ACCGAAATGC ACCTATACAA

651 TGCCGAAACA CTGAAAGCCC AAACAAAACT GGAATATTTC GCAGTAGACA

701 GAACCAATAA AAAATTGCTC ATCAAACCAA AAACCAATGC GTTTGAAGCT

751 GCCTATAAAG AAAATTACGC ATTGTGGATG GGGCCGTATA AAGTAAGCAA

801 AGGAATTAAA CCGACGGAAG GATTAATGGT CGATTTCTCC GATATCCGAC

851 CATACGGCAA TCATACGGGT AACTCCGCCC CATCCGTAGA GGCTGATAAC

901 AGTCATGAGG GGTATGGATA CAGCGATGAA GTAGTGCGAC AACATAGACA

951 AGGACAACCT TGA

它对应于氨基酸序列<SEQ ID 80；ORF15-1>：

1 MQARLLIPIL FSVFILSACG TLTGIPSHGG GKRFAVEQEL VAASARAAVK

51 DMDLQALHGR KVALYIATMG DQGSGSLTGG RYSIDALIRG EYINSPAVRT

101 DYTYPRYETT AETTSGGLTG LTTSLSTLNA PALSRTQSDG SGSKSSLGLN

151 IGGMGDYRNE TLTTNPRDTA FLSHLVQTVF FLRGIDVVSP ANADTDVFIN

201 IDVFGTIRNR TEMHLYNAET LKAQTKLEYF AVDRTNKKLL IKPKTNAFEA

251 AYKENYALWM GPYKVSKGIK PTEGLMVDFS DI RPYGNHTG NSAPSVEADN

301 SHEGYGYSDE VVRQHRQGQP*

进一步的工作鉴定了脑膜炎奈瑟球菌菌株A中对应的基因<SEQ ID 81>：

1 ATGCAAGCAC GGCTGCTGAT ACCTATTCTT TTTTCAGTTT TTATTTTATC

51 CGCCTGCGGG ACACTGACAG GTATTCCATC GCATGGCGGA GGTAAACGCT

101 TTGCGGTCGA ACAAGAACTT GTGGCCGCTT CTGCCAGAGC TGCCGTTAAA

151 GACATGGATT TACAGGCATT ACACGGACGA AAAGTTGCAT TGTACATTGC

201 AACTATGGGC GACCAAGGTT CAGGCAGTTT GACAGGGGGT CGCTACTCCA

251 TTGATGCACT GATTCGTGGC GAATACATAA ACAGCCCTGC CGTCCGTACC

301 GATTACACCT ATCCACGTTA CGAAACCACC GCTGAAACAA CATCAGGCGG

351 TTTGACAGGT TTAACCACTT CTTTATCTAC ACTTAATGCC CCTGCACTCT

401 CGCGCACCCA ATCAGACGGT AGCGGAAGTA AAAGCAGTCT GGGCTTAAAT

451 ATTGGCGGGA TGGGGGATTA TCGAAATGAA ACCTTGACGA CTAACCCGCG

501 CGACACTGCC TTTCTTTCCC ACTTGGTACA GACCGTATTT TTCCTGCGCG

551 GCATAGACGT TGTTTCTCCT GCCAATGCCG ATACGGATGT GTTTATTAAC

601 ATCGACGTAT TCGGAACGAT ACGCAACAGA ACCGAAATGC ACCTATACAA

651 TGCCGAAACA CTGAAAGCCC AAACAAAACT GGAATATTTC GCAGTAGACA

701 GAACCAATAA AAAATTGCTC ATCAAACCAA AAACCAATGC GTTTGAAGCT

751 GCCTATAAAG AAAATTACGC ATTGTGGATG GGACCGTATA AAGTAAGCAA

801 AGGAATTAAA CCGACAGAAG GATTAATGGT CGATTTCTCC GATATCCAAC

851 CATACGGCAA TCATATGGGT AACTCTGCCC CATCCGTAGA GGCTGATAAC

901 AGTCATGAGG GGTATGGATA CAGCGATGAA GCAGTGCGAC GACATAGACA

951 AGGGCAACCT TGA

它编码的蛋白质具有氨基酸序列<SEQ ID 82；ORF15a>：

1 MQARLLIPIL FSVFILSACG TLTGIPSHGG GKRFAVEQEL VAASARAAVK

51 DMDLQALHGR KVALYIATMG DQGSGSLTGG RYSIDALIRG EYINSPAVRT

101 DYTYPRYETT AETTSGGLTG LTTSLSTLNA PALSRTQSDG SGSKSSLGLN

151 IGGMGDYRNE TLTTNPRDTA FLSHLVQTVF FLRGIDVVSP ANADTDVFIN

201 IDVFGTIRNR TEMHLYNAET LKAQTKLEYF AVDRTNKKLL IKPKTNAFEA

251 AYKENYALWM GPYKVSKGIK PTEGLMVDFS DIQPYGNHMG NSAPSVEADN

301 SHEGYGYSDE AVRRHRQGQP*

最初鉴定的菌株B部分序列(ORF15)和ORF15a在213氨基酸重叠区内显示出有98.1％的相同性：

10 20 30 40 50 60

orf15.pep MQARLLIPILFSVFILSACGTLTGIPSHGGXKRFAVEQELVAASARAAVKDMDLQALHGR

|||||||||||||||||| |||||||||||| |||||||||||||||||||||||||||||

orf15a MQARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR

10 20 30 40 50 60

70 80 90 100 110 120

orf15.pep KVALYIATMGDQGSGSLT GGRYSIDAXXXGEYINSPAVRTDYTYPRYETTAETTSGGLTG

|||||||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf15a KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG

70 80 90 100 110 120

130 140 150 160 170 180

orf15.pep LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15a LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

130 140 150 160 170 180

190 200 210

orf15.pep FLRGIDVVSPANADTDVFINIDVFGTIRNRTEM

|||||||||||||||||||||||||||||||||

orf15a FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL

190 200 210 220 230 240

完整的菌株B序列(ORF15-1)和ORF15a在320个氨基酸的重叠区内显示出有98.8％的相同性：

10 20 30 40 50 60

orf15a.pep MQARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15-1 MQARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR

10 20 30 40 50 60

70 80 90 100 110 120

orf15a.pep KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15-1 KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG

70 80 90 100 110 120

130 140 150 160 170 180

orf15a.pep LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15-1 LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

130 140 150 160 170 180

190 200 210 220 230 240

orf15a.pep FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15-1 FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL

190 200 210 220 230 240

250 260 270 280 290 300

orf15a.pep IKPKTNAFEAAYKENYALWMGPYKVSKGIKPTEGLMVDFSDIQPYGNHMGNSAPSVEADN

||||||||||||||||||||||||||||||||||||||||||:||||| |||||||||||

orf15-1 IKPKTNAFEAAYKENYALWMGPYKVSKGIKPTEGLMVDFSDIRPYGNHTGNSAPSVEADN

250 260 270 280 290 300

310 320

orf15a.pep SHEGYGYSDEAVRRHRQGQPX

||||||||||:||:|||||||

orf15-1 SHEGYGYSDEVVRQHRQGQPX

310 320

进一步的工作鉴定了淋病奈瑟球菌中对应的基因<SEQ ID 83>：

1 ATGCGGGCAC GGCTGCTGAT ACCTATTCTT TTTTCAGTTT TTATTTTATC

51 CGCCTGCGGG ACACTGACAG GTATTCCATC GCATGGCGGA GGCAAACGCT

101 TCGCGGTCGA ACAAGAACTT GTGGCCGCTT CTGCCAGAGC TGCCGTTAAA

151 GACATGGATT TACAGGCATT ACACGGACGA AAAGTTGCAT TGTACATTGC

201 AACTATGGGC GACCAAGGTT CAGGCAGTTT GACAGGGGGT CGCTACTCCA

251 TTGATGCACT GATTCGCGGC GAATACATAA ACAGCCCTGC CGTCCGCACC

301 GATTACACCT ATCCGCGTTA CGAAACCACC GCTGAAACAA CATCAGGCGG

351 TTTGACGGGT TTAACCACTT CTTTATCTAC ACTTAATGCC CCTGCACTCT

401 CGCGCACCCA ATCAGACGGT AGCGGAAGTA GGAGCAGTCT GGGCTTAAAT

451 ATTGGCGGGA TGGGGGATTA TCGAAATGAA ACCTTGACGA CCAACCCGCG

501 CGACACTGCC TTTCTTTCCC ACTTGGTGCA GACCGTATTT TTCCTGCGCG

551 GCATAGACGT TGTTTCTCCT GCCAATGCCG ATACAGATGT GTTTATTAAC

601 ATCGACGTAT TCGGAACGAT ACGCAACAGA ACCGAAATGC ACCTATACAA

651 TGCCGAAACA CTGAAAGCCC AAACAAAACT GGAATATTTC GCAGTAGACA

701 GAACCAATAA AAAATTGCTC ATCAAACCCA AAACCAATGC GTTTGAAGCT

751 GCCTATAAAG AAAATTACGC ATTGTGGATG GGGCCGTATA AAGTAAGCAA

801 AGGAATCAAA CCGACGGAAG GATTGATGGT CGATTTCTCC GATATCCAAC

851 CATACGGCAA TCATACGGGT AACTCCGCCC CATCCGTAGA GGCTGATAAC

901 AGTCATGAGG GGTATGGATA CAGCGATGAA GCAGTGCGAC AACATAGACA

951 AGGGCAACCT TGA

它编码的蛋白质具有氨基酸序列<SEQ ID 84；ORF15ng>：

1 MRARLLIPIL FSVF ILSACG TLTGIPSHGG GKRFAVEQEL VAASARAAVK

51 DMDLQALHGR KVALYIATMG DQGSGSLTGG RYSIDALIRG EYINSPAVRT

101 DYTYPRYETT AETTSGGLTG LTTSLSTLNA PALSRTQSDG SGSRSSLGLN

151 IGGMGDYRNE TLTTNPRDTA FLSHLVQTVF FLRGIDVVSP ANADTDVFIN

201 IDVFGTIRNR TEMHLYNAET LKAQTKLEYF AVDRTNKKLL IKPKTNAFEA

251 AYKENYALWM GPYKVSKGIK PTEGLMVDFS DIQPYGNHTG NSAPSVEADN

301 SHEGYGYSDE AVRQHRQGQP *

最初鉴定的菌株B部分序列(ORF15)和ORF15ng在重叠的213个氨基酸内显示出有97.2％的相同性：

orf15.pep MQARLLIPILFSVFILSACGTLTGIPSHGGXKRFAVEQELVAASARAAVKDMDLQALHGR 60

|:|||||||||||||||||||||||||||| |||||||||||||||||||||||||||||

orf15ng MRARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR 60

orf15.pep KVALYIATMGDQGSGSLTGGRYSIDAXXXGEYINSPAVRTDYTYPRYETTAETTSGGLTG 120

|||||||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf15ng KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG 120

orf15.pep LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF 180

|||||||||||||||||||||||:||||||||||||||||||||||||||||||||||||

orf 15ng LTTSLSTLNAPALSRTQSDGSGSRSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF 180

orf15.pep FLRGIDVVSPANADTDVFINIDVFGTIRNRTEM 213

|||||||||||||||||||||||||||||||||

orf15ng FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL 240

完整的菌株B序列(ORF15-1)和ORF15ng在320个氨基酸的重叠区内显示出有98.8％的相同性：

10 20 30 40 50 60

orf15-1.pep MQARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR

|:||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15ng MRARLLIPILFSVFILSACGTLTGIPSHGGGKRFAVEQELVAASARAAVKDMDLQALHGR

10 20 30 40 50 60

70 80 90 100 110 120

orf15-1.pep KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15ng KVALYIATMGDQGSGSLTGGRYSIDALIRGEYINSPAVRTDYTYPRYETTAETTSGGLTG

70 80 90 100 110 120

130 140 150 160 170 180

orf15-1.pep LTTSLSTLNAPALSRTQSDGSGSKSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

|||||||||||||||||||||||:||||||||||||||||||||||||||||||||||||

orf15ng LTTSLSTLNAPALSRTQSDGSGSRSSLGLNIGGMGDYRNETLTTNPRDTAFLSHLVQTVF

130 140 150 160 170 180

190 200 210 220 230 240

orf15-1.pep FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf15ng FLRGIDVVSPANADTDVFINIDVFGTIRNRTEMHLYNAETLKAQTKLEYFAVDRTNKKLL

190 200 210 220 230 240

250 260 270 280 290 300

orf15-1.pep IKPKTNAFEAAYKENYALWMGPYKVSKGIKPTEGLMVDFSDIRPYGNHTGNSAPSVEADN

||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||

orf15ng IKPKTNAFEAAYKENYALWMGPYKVSKGIKPTEGLMVDFSDIQPYGNHTGNSAPSVEADN

250 260 270 280 290 300

310 320

orf15-1.pep SHEGYGYSDEVVRQHRQGQPX

||||||||||:||||||||||

orf15ng SHEGYGYSDEAVRQHRQGQPX

310 320

这些氨基酸序列的计算机分析揭示了一个ILSAC基序(推定的膜脂蛋白脂质连接位点，如MOTIFS程序所预计的那样)，暗示了一个推定的前导序列，并且预计脑膜炎奈瑟球菌和淋病奈瑟球菌的该蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

将ORF15-1(31.7kDa)如上所述克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图4A显示了GST-融合蛋白的亲和纯化结果，图4B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST-融合蛋白免疫小鼠，用小鼠血清进行Western印迹(图4C)和ELISA(阳性结果)。这些结果确认ORFX-1是一种外露蛋白，且是一种有用的免疫原。

实施例11

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 85>：

1 ..GG.CAGCACA AAAAACAGGC GGTT AACGG AAAAACCGTA TTTACGATGA

51 TGCCGGGTAT GATATTCGGC GTATTCACGG GCGCATTCTC CGCAAAATAT

101 ATCCCCGCGT TCGGGCTTCA AATTTTCTTC ATCCTGTTTT TAACCGCCGT

151 CGCATTCAAA ACACTGCATA CCGACCCTCA GACGGCATCC CGCCCGCTGC

201 CCGGACTGCC CrGACTGACT GCGGTTTCCA CACTGTTCGG CACAATGTCG

251 AGCTGGGTCG GCATAGGCGG CGGTTCACTT TCCGTCCCCT TCTTAATCCA

301 CTGCGGCTTC CCCGCCCATA AAGCCATCGG CACATCATCC GGCCTTGCCT

351 GGCCGATTGC ACTCTCCGGC GCAATATCGT ATCTGCTCAA CGGCCTGAAT

401 ATTGCAGGAT TGCCCGAAGG GTCACTGGGC TTCCTTTACC TGCCCGCCGT

451 CGCCGTCCTC AGCGCGGCAA CCATTGCCTT TGCCCCGCTC GGTGTCAAAA

501 CCGCCCACAA ACTTTCTTCT GCCAAACTCA AAAAATC.TT CGGCATTATG

551 TTGCTTTTGA TTGCCGGAAA AATGCTGTAC AACCTGCTTT AA

它对应于氨基酸序列<SEQ ID 86；ORF17>：

1 ..GQHKKQAVNG KTVFTMMPGM IFGVFTGAFS AKYIPAFGLQ IFFILFLTAV

51 AFKTLHTDPQ TASRPLPGLP XLTAVSTLFG TMSSWVGIGG GSLSVPFLIH

101 CGFPAHKAIG TSSGLAWPIA LSGAISYLLN GLNIAGLPEG SLGFLYLPAV

151 AVLSAATIAF APLGVKTAHK LSSAKLKKSF GIMLLLIAGK MLYNLL*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 87>：

1 ATGTGGCATT GGGACATTAT CTTAATCCTG CTTGCCGTAG GCAGTGCGGC

51 AGGTTTTATT GCCGGCCTGT TCGGCGTAGG CGGCGGCACG CTGATTGTCC

101 CTGTCGTTTT ATGGGTGCTT GATTTGCAGG GTTTGGCACA ACATCCTTAC

151 GCGCAACACC TCGCCGTCGG CACATCCTTC GCCGTCATGG TCTTCACCGC

201 CTTTTCCAGT ATGCTGGGGC AGCACAAAAA ACAGGCGGTC GACTGGAAAA

251 CCGTATTTAC GATGATGCCG GGTATGATAT TCGGCGTATT CACGGGCGCA

301 CTCTCCGCAA AATATATCCC CGCGTTCGGG CTTCAAATTT TCTTCATCCT

351 GTTTTTAACC GCCGTCGCAT TCAAAACACT GCATACCGAC CCTCAGACGG

401 CATCCCGCCC GCTGCCCGGA CTGCCCGGAC TGACTGCGGT TTCCACACTG

451 TTCGGCACAA TGTCGAGCTG GGTCGGCATA GGCGGCGGTT CACTTTCCGT

501 CCCCTTCTTA ATCCACTGCG GCTTCCCCGC CCATAAAGCC ATCGGCACAT

551 CATCCGGCCT TGCCTGGCCG ATTGCACTCT CCGGCGCAAT ATCGTATCTG

601 CTCAACGGCC TGAATATTGC AGGATTGCCC GAAGGGTCAC TGGGCTTCCT

651 TTACCTGCCC GCCGTCGCCG TCCTCAGCGC GGCAACCATT GCCTTTGCCC

701 CGCTCGGTGT CAAAACCGCC CACAAACTTT CTTCTGCCAA ACTCAAAAAA

751 Tc.TTCGGCA TTATGTTGCT TTTGATTGCC GGAAAAATGC TGTACAACCT

801 GCTTTAA

它对应于氨基酸序列<SEQ ID 88；ORF 17-1>：

1 MWHWDIILIL LAVGSAAGFI AG LFGVGGGT LIVPVVLWVL DLQGLAQHPY

51 AQHLA VGTSF AVMVFTAFSS MLGQHKKQAV DWKT VFTMMP GMIFGVFTGA

101 LSAKYIP AFG LQIFFILFLT AVAFKTLHTD PQTASRPLPG LPGLTAVSTL

151 FGTMSSWVGI GGGSLSVPFL IHCGFPAHKA IGTSSGLAWP IALSGAISYL

201 LNGLNIAGLP EGSLGFLYLP AVAVLSAATI AFAPLGVKTA HKLSSAKLKK

251 X FGIMLLLIA GKMLYNLL*

该氨基酸序列的计算机分析给出了下列结果：

与假设的流感嗜血菌跨膜蛋白HI0902(登录号P44070)的同源性：

ORF17和HI0902蛋白在192个氨基酸的重叠区内显示出有28％的氨基酸相同性：

ORF17 3 HKKQAVNGKTVFTMMPGMIFGVFT-GAFSAKYIPAFGLQIF--FILFLTAVAFKTLHTDP 59

HK + + V + P ++ VF G F + +IF +++L ++ D

HI0902 72 HKLGNIVWQAVRILAPVIMLSVFICGLFIGRLDREISAKIFACLVVYLATKMVLSIKKD- 130

ORF17 60 QTASRPLPGLPXLTAVSTLFGTMSSWVGIGGGSLSVPFLIHCGFPAHKAIGTSSGLAWPI 119

Q ++ L L + L G SS GIGGG VPFL G +AIG+S+ +

HI0902 131 QVTTKSLTPLSSVIG-GILIGMASSAAGIGGGGFIVPFLTARGINIKQAIGSSAFCGMLL 189

ORF17 120 ALSGAISYLLNGLNIAGLPEGSLGFLYLPAVAVLSAATIAFAPLGVXXXXXXXXXXXXXX 179

+SG S++++G +PE SLG++YLPAV ++A + + LG

HI0902 190 GISGMFSFIVSGWGNPLMPEYSLGYIYLPAVLGITATSFFTSKLGASATAKLPVSTLKKG 249

ORF17 180 FGIMLLLIAGKM 191

F + L+++A M

HI0902 250 FALFLIVVAINM 261

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF17和脑膜炎奈瑟球菌菌株A的ORF(ORF17a)在重叠的196个氨基酸内显示出有96.9％的相同性：

10 20 30

orf17.pep GQHKKQAVNGKT VFTMMPGMIFGVFTGAFS

||||||||: || ||||||||:||||:|| :|

orf17a QGLAQHPYAQHLA VGTSFAVMVFTAFSSMLGQHKKQAVDWKT VFTMMPGMVFGVFAGALS

50 60 70 80 90 100

40 50 60 70 80 90

orf17.pep AKYIP AFGLQIFFILFLTAVAFKTLHTDPQTASRPLPGLPXLTAVSTLFGTMSSWVGIGG

||||| ||||||||||||||||| |||||||||||||||||| |||||||||||||||||||

orf17a AKYIP AFGLQIFFILFLTAVAFKTLHTDPQTASRPLPGLPGLTAVSTLFGTMSSWVGIGG

110 120 130 140 150 160

100 110 120 130 140 150

orf17.pep GSLSVPFLIHCGFPAHKAIGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLP AV

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||

orf17a GSLSVPFLIHCGFPAHKAIGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLP AV

170 180 190 200 210 220

160 170 180 190

orf17.pep AVLSAATIAFAPLGVKTAHKLSSAKLKKS FGIMLLLIAGKMLYNLLX

||||||||||||||| |||||||||||||| ||||||||||||||||| |

orf17a AVLSAATIAFAPLGVKTAHKLSSAKLKKS FGIMLLLIAGKMLYNLLX

230 240 250 260

全长ORF17a核苷酸序列<SEQ ID 89>是：

1 ATGTGGCATT GGGACATTAT CTTAATCCTG CTTGCCGTAG GCAGTGCGGC

51 AGGTTTTATT GCCGGCCTGT TCGGCGTAGG CGGCGGCACG CTGATTGTCC

101 CTGTCGTTTT ATGGGTGCTT GATTTGCAGG GTTTGGCACA ACATCCTTAC

151 GCGCAACACC TCGCCGTCGG CACATCCTTC GCCGTCATGG TCTTCACCGC

201 CTTTTCCAGT ATGCTGGGGC AGCACAAAAA ACAGGCGGTC GACTGGAAAA

251 CCGTATTTAC GATGATGCCG GGTATGGTAT TCGGCGTATT CGCTGGCGCA

301 CTCTCCGCAA AATATATCCC AGCGTTCGGG CTTCAAATTT TCTTCATCCT

351 GTTTTTAACC GCCGTCGCAT TCAAAACACT GCATACCGAC CCTCAGACGG

401 CATCCCGCCC GCTGCCCGGA CTGCCCGGAC TGACTGCGGT TTCCACACTG

451 TTCGGCACAA TGTCGAGCTG GGTCGGCATA GGCGGCGGTT CACTTTCCGT

501 CCCCTTCTTA ATCCACTGCG GCTTCCCCGC CCATAAAGCC ATCGGCACAT

551 CATCCGGCCT TGCCTGGCCG ATTGCACTCT CCGGCGCAAT ATCGTATCTG

601 CTCAACGGCC TGAATATTGC AGGATTGCCC GAAGGGTCAC TGGGCTTCCT

651 TTACCTGCCC GCCGTCGCCG TCCTCAGCGC GGCAACCATT GCCTTTGCCC

701 CGCTCGGTGT CAAAACCGCC CACAAACTTT CTTCTGCCAA ACTCAAAAAA

751 TCCTTCGGCA TTATGTTGCT TTTGATTGCC GGAAAAATGC TGTACAACCT

801 GCTTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 90>：

1 MWHWDIILIL LAVGSAAGFI AG LFGVGGGT LIVPVVLWVL DLQGLAQHPY

51 AQHLA VGTSF AVMVFTAFSS MLGQHKKQAV DWKT VFTMMP GMVFGVFAGA

101 LSAKYIP AFG LQIFFILFLT AVAFKTLHTD PQTASRPLPG LPGLTAVSTL

151 FGTMSSWVGI GGGSLSVPFL IHCGFPAHKA IGTSSGLAWP IALSGAISYL

201 LNGLNIAGLP EGSLGFLYLP AVAVLSAATI AFAPLGVKTA HKLSSAKLKK

251 S FGIMLLLIA GKMLYNLL*

ORF17a和ORF17-1在268个氨基酸的重叠区内显示出有98.9％的相同性：

10 20 30 40 50 60

orf17a.pep MWHWDIILILLAVGSAAGFIAGLFGVGGGTLIVPVVLWVLDLQGLAQHPYAQHLAVGTSF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf17-1 MWHWDIILILLAVGSAAGFIAGLFGVGGGTLIVPVVLWVLDLQGLAQHPYAQHLAVGTSF

10 20 30 40 50 60

70 80 90 100 110 120

orf17a.pep AVMVFTAFSSMLGQHKKQAVDWKTVFTMMPGMVFGVFAGALSAKYIPAFGLQIFFILFLT

||||||||||||||||||||||||||||||||:||||:||||||||||||||||||||||

orf17-1 AVMVFTAFSSMLGQHKKQAVDWKTVFTMMPGMIFGVFTGALSAKYIPAFGLQIFFILFLT

70 80 90 100 110 120

130 140 150 160 170 180

orf17a.pep AVAFKTLHTDPQTASRPLPGLPGLTAVSTLFGTMSSWVGIGGGSLSVPFLIHCGFPAHKA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf17-1 AVAFKTLHTDPQTASRPLPGLPGLTAVSTLFGTMSSWVGIGGGSLSVPFLIHCGFPAHKA

130 140 150 160 170 180

190 200 210 220 230 240

orf17a.pep IGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLPAVAVLSAATIAFAPLGVKTA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf17-1 IGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLPAVAVLSAATIAFAPLGVKTA

190 200 210 220 230 240

250 260 269

orf17a.pep HKLSSAKLKKSFGIMLLLIAGKMLYNLLX

|||||||||| ||||||||||||||||||

orf17-1 HKLSSAKLKKXFGIMLLLIAGKMLYNLLX

250 260

与淋病奈瑟球菌的预计ORF的同源性

ORF17与淋病奈瑟球菌的预计ORF(ORF17.ng)在196氨基酸重叠区内显示出有93.9％的相同性：

orf17.pep GQHKKQAVNGKTVFTMMPGMIFGVFTGAFS 30

||||||||: ||:|:||||||||||:||:|

orf17ng QGLAQHPYAQHLAVGTSFAVMVFTAFSSMLGQHKKQAVDWKTIFAMMPGMIFGVFAGALS 102

orf17.pep AKYIPAFGLQIFFILFLTAVAFKTLHTDPQTASRPLPGLPXLTAVSTLFGTMSSWVGIGG 90

||||||||||||||||||||||||||| ||||||||||| |||||||||:|||||||||

orf17ng AKYIPAFGLQIFFILFLTAVAFKTLHTGRQTASRPLPGLPGLTAVSTLFGAMSSWVGIGG 162

orf17.pep GSLSVPFLIHCGFPAHKAIGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLPAV 150

||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||

orf17ng GSLSVPFLIHCGFPAHKAIGTSSGLAWPIALSGAISYLVNGLNIAGLPEGSLGFLYLPAV 202

orf17.pep AVLSAATIAFAPLGVKTAHKLSSAKLKKSFGIMLLLIAGKMLYNLL 196

|||||||||||||||||||||||||||:||||||||||||||||||

orf17ng AVLSAATIAFAPLGVKTAHKLSSAKLKESFGIMLLLIAGKMLYNLL 268

预计ORF17ng核苷酸序列<SEQ ID 91>编码的蛋白质具有氨基酸序列<SEQ ID92>：

1 MWHWDIILIL LAVGSAAGFI AGLFGVGGGT LIVPVVLWVL DLQGLAQHPY

51 AQHLAVGTSF AVMVFTAFSS MLGQHKKQAV DWKTIFAMMP GMIFGVFAGA

101 LSAKYIPAFG LQIFFILFLT AVAFKTLHTG RQTASRPLPG LPGLTAVSTL

151 FGAMSSWVGI GGGSLSVPFL IHCGFPAHKA IGTSSGLAWP IALSGAISYL

201 VNGLNIAGLP EGSLGFLYLP AVAVLSAATI AFAPLGVKTA HKLSSAKLKE

251 SFGIMLLLIA GKMLYNLL*

进一步的工作揭示了该完整的淋球菌DNA序列<SEQ ID 93>：

1 ATGTGGCATT GGGACATTAT CTTAATCCTG CTTGCcgtag gcAGTGCGGC

51 AGGTTTTATT GCCGGCCTGT Tcggtgtagg cggcgGTACG CTGATTGTCC

101 CTGTCGTTTT ATGGGTGCTT GATTTGCAGG GTTTGGCACA ACATCCTTAC

151 GCGCAACACC TCGCCGTCGG CAcaTccttc gcCGTCATGG TCTTCACCGC

201 CTTTTCCAGT ATGTTGGGGC AGCACAAAAA ACAGGCGGTC GACTGGAAAA

251 CCATATTTGC GATGATGCCG GGTATGATAT TCGGCGTATT CGCTGGCGCA

301 CTCTCCGCAA AATATATCCC CGCGTTCGGG CTTCAAATTT TCTTCATCCT

351 GTTTTTAACC GCCGTCGCAT TCAAAACACT GCATACCGGT CGTCAGACGG

401 CATCCCGCCC GCTGCCCGGG CTGCCCGGAC TGACTGCGGT TTCCACACTG

451 TTCGGCGCAA TGTCGAGCTG GGTCGGCATA GGCGGCGGTT CACTTTCCGT

501 CCCCTTCTTA ATCCACTGCG GCTTCCCCGC CCATAAAGCC ATCGGCACAT

551 CATCCGGCCT TGCCTGGCCG ATTGCACTCT CCGGCGCAAT ATCGTATCTG

601 GTCAACGGTC TGAATATTGC AGGATTGCCC GAAGGGTCGC TGGGCTTCCT

651 TTACCTGCCC GCCGTCGCCG TCCTCAGCGC GGCAACCATT GCCTTTGCCC

701 CGCTCGGTGT CAAAACCGCC CACAAACTTT CTTCTGCCAA ACTCAAAGAA

751 TCCTTCGGCA TTATGTTGCT TTTGATTGCC GGAAAAATGC TGTACAACCT

801 GCTTTAA

它对应于氨基酸序列<SEQ ID 94；ORF17ng-1>：

1 MWHWDIILIL LAVGSAAGFI AG LFGVGGGT LIVPVVLWVL DLQGLAQHPY

51 AQHLA VGTSF AVMVFTAFSS MLGQHKKQAV DWKT IFAMMP GMIFGVFAGA

101 LSAKYIP AFG LQIFFILFLT AVAFKTLHTG RQTASRPLPG LPGLTAVSTL

151 FGAMSSWVGI GGGSLSVPFL IHCGFPAHKA IGTSSGLAWP IALSGAISYL

201 VNGLNIAGLP EGSLGFLYLP AVAVLSAATI AFAPLGVKTA HKLSSAKLKE

251 S FGIMLLLIA GKMLYNLL*

ORF17ng-1和ORF17-1在268个氨基酸的重叠区内显示出有96.6％的相同性：

10 20 30 40 50 60

orf17-1.pep MWHWDIILILLAVGSAAGFIAGLFGVGGGTLIVPVVLWVLDLQGLAQHPYAQHLAVGTSF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf17ng-1 MWHWDIILILLAVGSAAGFIAGLFGVGGGTLIVPVVLWVLDLQGLAQHPYAQHLAVGTSF

10 20 30 40 50 60

70 80 90 100 110 120

orf17-1.pep AVMVFTAFSSMLGQHKKQAVDWKTVFTMMPGMIFGVFTGALSAKYIPAFGLQIFFILFLT

||||||||||||||||||||||||:|:||||||||||:||||||||||||||||||||||

orf17ng-1 AVMVFTAFSSMLGQHKKQAVDWKTIFAMMPGMIFGVFAGALSAKYIPAFGLQIFFILFLT

70 80 90 100 110 120

130 140 150 160 170 180

orf17-1.pep AVAFKTLHTDPQTASRPLPGLPGLTAVSTLFGTMSSWVGIGGGSLSVPFLIHCGFPAHKA

||||||||| |||||||||||||||||||||:|||||||||||||||||||||||||||

orf17ng-1 AVAFKTLHTGRQTASRPLPGLPGLTAVSTLFGAMSSWVGIGGGSLSVPFLIHCGFPAHKA

130 140 150 160 170 180

190 200 210 220 230 240

orf17-1.pep IGTSSGLAWPIALSGAISYLLNGLNIAGLPEGSLGFLYLPAVAVLSAATIAFAPLGVKTA

||||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||

orf17ng-1 IGTSSGLAWPIALSGAISYLVNGLNIAGLPEGSLGFLYLPAVAVLSAATIAFAPLGVKTA

190 200 210 220 230 240

250 260 269

orf17-1.pep HKLSSAKLKKXFGIMLLLIAGKMLYNLLX

|||||||||: ||||||||||||||||||

orf17ng-1 HKLSSAKLKESFGIMLLLIAGKMLYNLLX

250 260

另外，ORF17ng-1显示出与假设的流感嗜血菌蛋白同源：

sp|P44070|Y902_HAEIN假设蛋白HI0902pir||G64015假设蛋白HI0902-流感嗜血菌(Rd KW20菌株)gi|1573922(U32772)流感嗜血菌预计编码区HI0902[流感嗜血菌]长度＝264

评分＝74(34.9位)，估计值＝1.6e-23，Sum P(2)＝1.6e-23

相同性＝15/43(34％)，阳性＝23/43(53％)

询问：55 AVGTSFAVMVFTAFSSMLGQHKKQAVDWKTIFAMMPGMIFGVF 97

A+GTSFA +V T S HK + W+ + + P ++ VF

目标：52 ALGTSFATIVITGIGSAQRHHKLGNIVWQAVRILAPVIMLSVF 94

评分＝195(91.9位)，估计值＝1.6e-23，Sum P(2)＝1.6e-23

相同性＝44/114(38％)，阳性＝65/114(57％)

询问：150 LFGAMSSWVGIGGGSLSVPFLIHCGFPAHKAIGTSSGLAWPIALSGAISYLVNGLNIAGL 209

L G SS GIGGG VPFL G +AIG+S+ + +SG S++V+G +

目标：148 LIGMASSAAGIGGGGFIVPFLTARGINIKQAIGSSAFCGMLLGISGMFSFIVSGWGNPLM 207

询问：210 PEGSLGFLYLPAVAVLSAATIAFAPLGVKTAHKLSSAKLKESFGIMLLLIAGKM 263

PE SLG++YLPAV ++A + + LG KL + LK+ F + L+++A M

目标：208 PEYSLGYIYLPAVLGITATSFFTSKLGASATAKLPVSTLKKGFALFLIVVAINM 261

这个分析结果，包括与一种假设的流感嗜血菌跨膜蛋白有同源性，提示脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例12

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 95>：

1 ..GGAAACGGAT GGCAGGCAGA CCCCGAACAT CCGCTGCTCG GGCTTTTTGC

51 CGTCAGTAAT GTATCGATGA CGCTTGCTTT TGTCGGAATA TGTGCGTTGG

101 TGCATTATTG CTTTTCGGGA ACGGTTCAAG TGTTTGTGTT TGCGGCACTG

151 CTCAAACTTT ATGCGCTGAA GCCGGTTTAT TGGTTCGTGT TGCAGTTTGT

201 GCTGATGGCG GTTGCCTATG TCCACCGCTG CGGTATAGAC CGGCAGCCGC

251 CGTCAACGTT CGGCGGCTCG CAGCTGCGAC TCGGCGGGTT GACGGCAGCG

301 TTGATGCAGG TCTCGGTACT GGTGCTGCTG CTTTCAGAAA TTGGAAGATA

351 A

它对应于氨基酸序列<SEQ ID 96；ORF 18>：

1 ..GNGWQADPEH PLLGLFAVSN VSMTLAFVGI CALVHYCFSG TVQVFVFAAL

51 LKLYALKPVY WFVLQFVLMA VAYVHRCGID RQPPSTFGGS QLRLGGLTAA

101 LMQVSVLVLL LSEIGR*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 97>：

1 ATGATTTTGC TGCATTTGGA TTTTTTGTCT GCCTTACTGT ATGCGGCGGT

51 TTTTCTGTTT CTGATATTCC GCGCAGGAAT GTTGCAATGG TTTTGGGCGA

101 GTATTATGCT GTGGCTGGGC ATATCGGTTT TGGGGGCAAA GCTGATGCCC

151 GGCATATGGG GAATGACCCG CGCCGCGCCC TTGTTCATCC CCCATTTTTA

201 CCTGACTTTG GGCAGCATAT TTTTTTTCAT CGGGCATTGG AACCGGAAAA

251 CAGATGGAAA CGGATGGCAG GCAGACCCCG AACATCCGCT GCTCGGGCTT

301 TTTGCCGTCA GTAATGTATC GATGACGCTT GCTTTTGTCG GAATATGTGC

351 GTTGGTGCAT TATTGCTTTT CGGGAACGGT TCAAGTGTTT GTGTTTGCGG

401 CACTGCTCAA ACTTTATGCG CTGAAGCCGG TTTATTGGTT CGTGTTGCAG

451 TTTGTGCTGA TGGCGGTTGC CTATGTCCAC CGCTGCGGTA TAGACCGGCA

501 GCCGCCGTCA ACGTTCGGCG GCTCGCAGCT GCGACTCGGC GGGTTGACGG

551 CAGCGTTGAT GCAGGTCTCG GTACTGGTGC TGCTGCTTTC AGAAATTGGA

601 AGATAA

它对应于氨基酸序列<SEQ ID 98；ORF 18-1>：

1 MILLHLDFLS ALLYAAVFLF LIFRAGMLQW FWASIMLWLG ISVLGAKLMP

51 GIWGMTRAAP LFIPHFYLTL GSIFFFIGHW NRKTDGNGWQ ADPEHPLLGL

101 FA VSNVSMTL AFVGICALVH Y CFSGTVQVF VFAALLKLYA LK PVYWFVLQ

151 FVLMAVAYVH RCGIDRQPPS TFGGSQLRLG GLTAALMQVS VLVLLLSEIG

201 R*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF18与脑膜炎奈瑟球菌菌株A的ORF(ORF18a)在重叠的116个氨基酸内显示出有98.3％的相同性：

10 20 30

orf 18.pep GNGWQADPEHPLLGLFA VSNVSMTLAFVGI

||||||||||||||||| |||||||||||||

orf18a TRAAP LFIPHFYLTLGSIFFFIGHWNRKTDGNGWQADPEHPLLGLFA VSNVSMTLAFVGI

60 70 80 90 100 110

40 50 60 70 80 90

orf18.pep CALVHY CFSGTVQVFVFAALLKL YALK PVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGS

|||| || ||| ||||||||||||| |||| ||||||||||||||||| ||||||||||||||||

orf18a CALVHY CFSXTVQVFVFAALLKLYALK PVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGS

120 130 140 150 160 170

100 110

orf18.pep QLRLG GLTAALMQVSVLVLLLSEIGRX

||||| |||||||| |||||||| |||||

orf18a QLRLG GLTAALMQXSVLVLLLSEIGRX

180 190 200

全长ORF18a核苷酸序列<SEQ ID 99>是：

1 ATGATTTTGC TGCATTTGGA TTTTTTGTCT GCCTTACTGT ATGCGGCGGT

51 TTTTCTGTTT CTGATATTCC GCGCAGGAAT GTTGCAATGG TTTTGGGCGA

101 GTATTATGCT GTGGCTGGGC ATATCGGTTT TGGGGGCAAA GCTGATGCCC

151 GGCATATGGG GAATGACCCG CGCCGCGCCC TTGTTCATCC CCCATTTTTA

201 CCTGACTTTG GGCAGCATAT TTTTTTTCAT CGGGCATTGG AACCGGAAAA

251 CGGATGGAAA CGGATGGCAG GCAGACCCCG AACATCCTCT GCTCGGGCTG

301 TTTGCCGTCA GTAATGTATC GATGACGCTT GCTTTTGTCG GAATATGTGC

351 GTTGGTGCAT TATTGCTTTT CGNGAACGGT TCAAGTGTTT GTGTTTGCGG

401 CACTGCTCAA ACTTTATGCG CTGAAGCCGG TTTATTGGTT CGTGTTGCAG

451 TTTGTGCTGA TGGCGGTTGC CTATGTCCAC CGCTGCGGTA TAGACCGGCA

501 GCCGCCGTCA ACGTTCGGCG GNTCGCAGCT GCGACTCGGC GGGTTGACGG

551 CAGCGTTGAT GCAGNTCTCG GTACTGGTGC TGCTGCTTTC AGAAATTGGA

601 AGATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 100>：

1 MILLHLDFLS ALLYAAVFLF LIFRAGMLQW FWASIMLWLG ISVLGAKLMP

51 GIWGMTRAAP LFIPHFYLTL GSIFFFIGHW NRKTDGNGWQ ADPEHPLLGL

101 FA VSNVSMTL AFVGICALVH Y CFSXTVQVF VFAALLKLYA LK PVYWFVLQ

151 FVLMAVAYVH RCGIDRQPPS TFGGSQLRLG GLTAALMQXS VLVLLLSEIG

201 R*

ORF18a和ORF18-1在201个氨基酸的重叠区内显示出有99.0％的相同性：

10 20 30 40 50 60

orf18a.pep MILLHLDFLSALLYAAVFLFLIFRAGMLQWFWASIMLWLGISVLGAKLMPGIWGMTRAAP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf18-1 MILLHLDFLSALLYAAVFLFLIFRAGMLQWFWASIMLWLGISVLGAKLMPGIWGMTRAAP

10 20 30 40 50 60

70 80 90 100 110 120

orf18a.pep LFIPHFYLTLGSIFFFIGHWNRKTDGNGWQADPEHPLLGLFAVSNVSMTLAFVGICALVH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf18-1 LFIPHFYLTLGSIFFFIGHWNRKTDGNGWQADPEHPLLGLFAVSNVSMTLAFVGICALVH

70 80 90 100 110 120

130 140 150 160 170 180

orf18a.pep YCFSXTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGSQLRLG

|||| |||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf18-1 YCFSGTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGSQLRLG

130 140 150 160 170 180

190 200

orf18a.pep GLTAALMQXSVLVLLLSEIGRX

|||||||| |||||||||||||

orf18-1 GLTAALMQVSVLVLLLSEIGRX

190 200

与淋病奈瑟球菌的预计ORF的同源性

ORF18显示出在与淋病奈瑟球菌的预计ORF(ORF18.ng)在重叠的116个氨基酸中有93.1％的相同性：

orf18.pep GNGWQADPEHPLLGLFAVSNVSMTLAFVGI 30

||||||||||||||||||||||||||||||

orf18ng TRAAPLFIPHFYLTLGSIFFFIGYWNRKTDGNGWQADPEHPLLGLFAVSNVSMTLAFVGI 115

orf18.pep CALVHYCFSGTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGS 90

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf18ng CALVHYCFSGTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGS 175

orf18.pep QLRLGGLTAALMQVSVLVLLLSEIGR 116

||||| |:| ||||:| ::||:||||

orf18ng QLRLGVLAAMLMQVAVTAMLLAEIGR 201

全长ORF18ng核苷酸序列是<SEQ ID 101>：

1 ATGATTTTGC TGCATTTGGA TTTTTTGTCT GCCTTACTGt aTGCGGcggt

51 tttTctgTTT CTGATATTCC GCGCAGGAAT GTTGCAATGG TTTTGGGCGA

101 GTATTGCGTT GTGGCTCGGC ATCTCGGTTT TAGGGGTAAA GCTGATGCCG

151 GGGATGTGGG GAATGACCCG CGCCGCGCCT TTGTTCATCC CCCATTTTTA

201 CCTGACTTTG GGCAGCATAT TTTTTTTCAT CGGGTATTGG AACCGGAAAA

251 CAGATGGAAA CGGATGGCAG GCAGACCCCG AACATCCGCT GCTCGGGCTT

301 TTTGCCGTCA GTAATGTATC GATGACGCTT GCTTTTGTCG GAATATGTGC

351 GTTGGTGCAT TATTGCTTTT CGGGAACGGT TCAAGTGTTT GTGTTTGCGG

401 CATTGCTCAA ACTTTATGCG CTGAAGCCGG TTTATTGGTT CGTGTTGCAG

451 TTTGTATTGA TGGCGGttgC CTATGTCCAC CGCTGCGGTA TAGACCGGCA

501 GCCGCCGTCA ACGTTCGGCG GTTCGCAGCT GCGACTCGGC GTGTTGGCGG

551 CGATGTTGAT GCAGGTTGCG GTAACGGCGA TGCTGCTTGC CGAAATCGGC

601 AGATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 102>：

1 MILLHLDFLS ALLYAAVFLF LIFRAGMLQW FWASIALWLG ISVLGVKLMP

51 GMWGMTRAAP LFIPHFYLTL GSIFFFIGYW NRKTDGNGWQ ADPEHPLLGL

101 FAV SNVSMTL AFVGICALVH Y CFSGTVQVF VFAALLKLYA LKP VYWFVLQ

151 FVLMAVAYVH RCGIDRQPPS TFGGSQLRLG VLAAMLMQVA VTAMLLAEIG

201 R*

此ORF18ng蛋白质序列显示出与ORF18-1在重叠的201个氨基酸中有94.0％的相同性：

10 20 30 40 50 60

orf18-1.pep MILLHLDFLSALLYAAVFLFLIFRAGMLQWFWASIMLWLGISVLGAKLMPGIWGMTRAAP

||||||||||||||||||||||||||||||||||| |||||||||:|||||:||||||||

orf18ng MILLHLDFLSALLYAAVFLFLIFRAGMLQWFWASIALWLGISVLGVKLMPGMWGMTRAAP

10 20 30 40 50 60

70 80 90 100 110 120

orf18-1.pep LFIPHFYLTLGSIFFFIGHWNRKTDGNGWQADPEHPLLGLFAVSNVSMTLAFVGICALVH

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf18ng LFIPHFYLTLGSIFFFIGYWNRKTDGNGWQADPEHPLLGLFAVSNVSMTLAFVGICALVH

70 80 90 100 110 120

130 140 150 160 170 180

orf18-1.pep YCFSGTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGSQLRLG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf18ng YCFSGTVQVFVFAALLKLYALKPVYWFVLQFVLMAVAYVHRCGIDRQPPSTFGGSQLRLG

130 140 150 160 170 180

190 200

orf18-1.pep GLTAALMQVSVLVLLLSEIGRX

|:| ||||:| ::||:|||||

orf18ng VLAAMLMQVAVTAMLLAEIGRX

190 200

根据本分析，包括该淋球菌蛋白中存在几个推定跨膜结构域的分析，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例13

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 103>：

1 ATGAAAACCC CACTCCTCAA GCCTCTGCTN ATTACCTCGC TTCCCGTTTT

51 CGCCAGTGTT TTTACCGCCG CCTCCATCGT CTGGCAGCTA GGCGAACCCA

101 AGCTCGCCAT GCCCTTCGTA CTCGGCATCA TCGCCGGCGG CCTTGTCGAT

151 TTGGACAACC NCNTGACCGG ACGGCTNAAA AACATCATCA CCACCGTCGC

201 CCTGTTCACC CTCTCCTCGC TCACGGCACA AAGCACCCTC GGCACAGGGC

251 TGCCCTTCAT CCTCGCCATG ACCCTGATGA CTT.CG.CTT CACCATTTTA

301 GGCGCGGNCG ...

它对应于氨基酸序列<SEQ ID 104；ORF19>：

1 MKTPLLKPLL ITSLPVFASV FTAASIVWQL GEPKLAMPFV LGIIAGGLVD

51 LDNXXTGRLK NIITTVALFT LSSLTAQSTL GTGLPFILAM TLMTXXFTIL

101 GAX...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 105>：

1 ATGAAAACCC CACTCCTCAA GCCTCTGCTC ATTACCTCGC TTCCCGTTTT

51 CGCCAGTGTT TTTACCGCCG CCTCCATCGT CTGGCAGCTA GGCGAACCCA

101 AGCTCGCCAT GCCCTTCGTA CTCGGCATCA TCGCCGGCGG CCTTGTCGAT

151 TTGGACAACC GCCTGACCGG ACGGCTGAAA AACATCATCA CCACCGTCGC

201 CCTGTTCACC CTCTCCTCGC TCACGGCACA AAGCACCCTC GGCACAGGGC

251 TGCCCTTCAT CCTCGCCATG ACCCTGATGA CCTTCGGCTT CACCATTTTA

301 GGCGCGGTCG GGCTCAAATA CCGCACCTTC GCCTTCGGTG CACTCGCCGT

351 CGCCACCTAC ACCACACTTA CCTACACCCC CGAAACCTAC TGGCTGACCA

401 ACCCCTTCAT GATTTTATGC GGCACCGTAC TGTACAGCAC CGCCATCCTC

451 CTGTTCCAAA TCGTCCTGCC CCACCGCCCC GTCCAAGAAA GCGTCGCCAA

501 CGCCTACGAC GCACTCGGCG GCTACCTCGA AGCCAAAGCC GACTTCTTCG

551 ACCCCGATGA GGCAGCCTGG ATAGGCAACC GCCACATCGA CCTCGCCATG

601 AGCAACACCG GCGTCATCAC CGCCTTCAAC CAATGCCGTT CCGCCCTGTT

651 TTACCGCCTT CGCGGCAAAC ACCGCCACCC GCGCACCGCC AAAATGCTGC

701 GTTACTACTT TGCCGCCCAA GACATACACG AACGCATCAG CTCCGCCCAC

751 GTCGATTATC AGGAAATGTC CGAAAAATTC AAAAACACCG ACATCATCTT

801 CCGCATCCAC CGCCTGCTCG AAATGCAGGG ACAAGCCTGC CGCAACACCG

851 CCCAAGCCCT GCGCGCAAGC AAAGACTACG TTTACAGCAA ACGCCTCGGC

901 CGCGCCATCG AAGGCTGCCG CCAATCGCTG CGCCTCCTTT CAGACAGCAA

951 CGACAGTCCC GACATCCGCC ACCTGCGCCG CCTTCTCGAC AACCTCGGCA

1001 GCGTCGACCA GCAGTTCCGC CAACTCCAGC ACAACGGCCT GCAGGCAGAA

1051 AACGACCGCA TGGGCGACAC CCGCATCGCC GCCCTCGAAA CCAGCAGCCT

1101 CAAAAACACC TGGCAGGCAA TCCGTCCGCA GCTAAACCTC GAATCAGGCG

1151 TATTCCGCCA TGCCGTCCGC CTGTCCCTCG TCGTTGCCGC CGCCTGCACC

1201 ATCGTCGAAG CCCTCAACCT CAACCTCGGC TACTGGATAC TACTGACCGC

1251 CCTTTTCGTC TGCCAACCCA ACTACACCGC CACCAAAAGC CGCGTCCGCC

1301 AGCGCATCGC CGGCACCGTA CTCGGCGTAA TCGTCGGCTC GCTCGTCCCC

1351 TACTTCACCC CGTCTGTCGA AACCAAACTC TGGATTGTCA TCGCCAGTAC

1401 CACCCTCTTT TTCATGACCC GCACCTACAA ATACAGTTTC TCCACCTTCT

1451 TCATTACCAT TCAAGCCCTG ACCAGCCTCT CCCTCGCAGG TTTGGACGTA

1501 TACGCCGCCA TGCCCGTACG CATCATCGAC ACCATTATCG GCGCATCCCT

1551 TGCCTGGGCG GCAGTCAGCT ACCTGTGGCC AGACTGGAAA TACCTCACGC

1601 TCGAACGCAC CGCCGCCCTT GCCGTATGCA GCAACGGTGC CTATCTCGAA

1651 AAAATCACCG AACGCCTCAA AAGCGGCGAA ACCGGCGACG ACGTCGAATA

1701 CCGCGCCACC CGCCGCCGCG CCCACGAACA CACCGCCGCC CTCAGCAGCA

1751 CCCTTTCCGA CATGAGCAGC GAACCCGCAA AATTCGCCGA CAGCCTGCAA

1801 CCCGGCTTTA CCCTGCTCAA AACCGGCTAC GCCCTGACCG GCTACATCTC

1851 CGCCCTCGGC GCATACCGCA GCGAAATGCA CGAAGAATGC AGCCCCGACT

1901 TTACCGCACA GTTCCACCTC GCCGCCGAAC ACACCGCCCA CATCTTCCAA

1951 CACCTGCCCG AAACCGAACC CGACGACTTT CAGACAGCAC TGGATACACT

2001 GCGCGGCGAA CTCGACACCC TCCGCACCCA CAGCAGCGGA ACACAAAGCC

2051 ACATCCTCCT CCAACAGCTC CAACTCATCG CCCGACAGCT CGAACCCTAC

2101 TACCGCGCCT ACCGCCAAAT TCCGCACAGG CAGCCCCAAA ATGCAGCCTG

2151 A

它对应于氨基酸序列<SEQ ID 106；ORF19-1>：

1 MKTPLLKPLL ITSLPVFASV FTAASIVWQL GEPK LAMPFV LGIIAGGLVD

51 LDNRLTGRLK NIITTVALFT LSSLTAQSTL GTGLPF ILAM TLMTFGFTIL

101 GAVGLKYRTF AFGALAVATY TTLTYTPETY WLTNP FMILC GTVLYSTAIL

151 LFQIVLPHRP VQESVANAYD ALGGYLEAKA DFFDPDEAAW IGNRHIDLAM

201 SNTGVITAFN QCRSALFYRL RGKHRHPRTA KMLRYYFAAQ DIHERISSAH

251 VDYQEMSEKF KNTDIIFRIH RLLEMQGQAC RNTAQALRAS KDYVYSKRLG

301 RAIEGCRQSL RLLSDSNDSP DIRHLRRLLD NLGSVDQQFR QLQHNGLQAE

351 NDRMGDTRIA ALETSSLKNT WQAIRPQLNL ESGVFRHAVR LSLVVAAACT

401 IVEALNLNLG YWILLTALFV CQPNYTATKS RVRQR IAGTV LGVIVGSLVP

451 YFTPSVETKL WIVIASTTLF FMTRTYKYSF STFFITIQAL TSLSLAGLDV

501 YAAMPVRIID TIIGASLAWA AVSYLWPDWK YLTLERTAAL AVCSNGAYLE

551 KITERLKSGE TGDDVEYRAT RRRAHEHTAA LSSTLSDMSS EPAKFADSLQ

601 PGFTLLKTGY ALTGYISALG AYRSEMHEEC SPDFTAQFHL AAEHTAHIFQ

651 HLPETEPDDF QTALDTLRGE LDTLRTHSSG TQSHILLQQL QLIARQLEPY

701 YRAYRQIPHR QPQNAA*

该氨基酸序列的计算机分析给出了下列结果：

与预计的流感嗜血菌的跨膜蛋白YHFK(登录号为P44289)的同源性

ORF19和YHFK蛋白在97个氨基酸的重叠区内显示出有45％的氨基酸相同性：

orf19 6 LKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNXXTGRLKNIITT 65

L +I+++PVF +V AA +W +MP +LGIIAGGLVDLDN TGRLKN+ T

YHFK 5 LNAKVISTIPVFIAVNIAAVGIWFFDISSQSMPLILGIIAGGLVDLDNRLTGRLKNVFFT 64

orf19 66 VALFTLSSLTAQSTLGTGLPFILAMTLMTXXFTILGA 102

+ F++SS Q +G + +I+ MT++T FT++GA

YHFK 65 LIAFSISSFIVQLHIGKPIQYIVLMTVLTFIFTMIGA 101

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF19显示出在与脑膜炎奈瑟球菌菌株A的ORF(ORF19a)在重叠的102个氨基酸内有92.2％的相同性：

10 20 30 40 50 60

orf19.pep MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPK LAMPFVLGIIAGGLVDLDNXXTGRLK

|||| ||||||||||||||||| |||||||||||| ||||||||||||||||| || |||||

orf19a MKTPPLKPLLITSLPVFASVFTAASIVWQLGEPK LAMPFVLGIIAGGLVDLDNRLTGRLK

10 20 30 40 50 60

70 80 90 100

orf19.pep NIITTVALFTLSSLTAQSTLGTGLPF ILAMTLMTXXFTILGAX

|||:||||||||||:||||||||||| |||||||| |||:||

orf19a NIIATVALFTLSSLVAQSTLGTGLPF ILAMTLMTFGFTIMGAVGLKYRTFAFGALAVATY

70 80 90 100 110 120

orf19a TTLTYTPETYWLTNP FMILCGTVLYSTAIILFQIILPHRPVQENVANAYEALGSYLEAKA

130 140 150 160 170 180

全长ORF19a核苷酸序列<SEQ ID 107>是：

1 ATGAAAACCC CACCCCTCAA GCCTCTGCTC ATTACCTCGC TTCCCGTTTT

51 CGCCAGTGTC TTTACCGCCG CCTCCATCGT CTGGCAGCTG GGCGAACCCA

101 AGCTCGCCAT GCCCTTCGTA CTCGGCATCA TCGCTGGCGG CCTGGTCGAT

151 TTGGACAACC GCCTGACCGG ACGGCTGAAA AACATCATCG CCACCGTCGC

201 CCTGTTCACC CTCTCCTCAC TTGTCGCGCA AAGCACCCTC GGCACAGGTT

251 TGCCATTCAT CCTCGCCATG ACCCTGATGA CTTTCGGCTT TACCATCATG

301 GGCGCGGTCG GGCTGAAATA CCGCACCTTC GCCTTCGGCG CACTCGCCGT

351 CGCCACCTAC ACCACACTTA CCTACACCCC CGAAACCTAC TGGCTGACCA

401 ACCCCTTTAT GATTCTGTGC GGAACCGTAC TGTACAGCAC CGCCATCATC

451 CTGTTCCAAA TCATCCTGCC CCACCGCCCC GTTCAAGAAA ACGTCGCCAA

501 CGCCTACGAA GCACTCGGCA GCTACCTCGA AGCCAAAGCC GACTTTTTCG

551 ATCCCGACGA AGCCGAATGG ATAGGCAACC GCCACATCGA CCTCGCCATG

601 AGCAACACCG GCGTCATCAC CGCCTTCAAC CAATGCCGTT CCGCCCTGTT

651 TTACCGCCTT CGCGGCAAAC ACCGCCACCC GCGCACCGCC AAAATGCTGC

701 GCTACTACTT CGCCGCCCAA GACATACACG AACGCATCAG CTCCGCCCAC

751 GTCGACTACC AAGAGATGTC CGAAAAATTC AAAAACACCG ACATCATCTT

801 CCGCATCCAC CGCCTGCTCG AAATGCAGGG ACAAGCCTGC CGCAACACCG

851 CCCAAGCCCT GCGCGCAAGC AAAGACTACG TTTACAGCAA ACGCCTCGGC

901 CGCGCCATCG AAGGCTGCCG CCAATCGCTG CGCCTCCTTT CAGACAGCAA

951 CGACAATCCC GACATCCGCC ACCTGCGCCG CCTTCTCGAC AACCTCGGCA

1001 GCGTCGACCA GCAGTTCCGC CAACTCCAGC ACAACGGCCT GCAGGCAGAA

1051 AACGACCGCA TGGGCGACAC CCGCATCGCC GCCCTCGAAA CCGGCAGCCT

1101 CAAAAACACC TGGCAGGCAA TCCGTCCGCA GCTAAACCTC GAATCAGGCG

1151 TATTCCGCCA TGCCGTCCGC CTGTCCCTTG TCGTTGCCGC CGCCTGCACC

1201 ATCGTCGAAG CCCTCAACCT CAACCTCGGC TACTGGATAC TACTGACCGC

1251 CCTTTTCGTC TGCCAACCCA ACTACACCGC CACCAAAAGC CGCGTCCGCC

1301 AGCGCATCGC CGGCACCGTA CTCGGCGTAA TCGTCGGCTC GCTCGTCCCC

1351 TACTTTACCC CCTCCGTCGA AACCAAACTC TGGATCGTCA TCGCCAGTAC

1401 CACCCTCTTT TTCATGACCC GCACCTACAA ATACAGCTTC TCGACATTTT

1451 TCATCACCAT TCAAGCCCTG ACCAGCCTCT CCCTCGCAGG GTTGGACGTA

1501 TACGCCGCCA TGCCCGTACG CATCATCGAC ACCATTATCG GCGCATCCCT

1551 TGCCTGGGCG GCAGTCAGCT ACCTGTGGCC AGACTGGAAA TACCTCACGC

1601 TCGAACGCAC CGCCGCCCTT GCCGTATGCA GCAACGGCGC CTATCTCGAA

1651 AAAATCACCG AACGCCTCAA AAGCGGCGAA ACCGGCGACG ACGTCGAATA

1701 CCGCGCCACC CGCCGCCGCG CCCACGAACA CACCGCCGCC CTCAGCAGCA

1751 CCCTTTCCGA CATGAGCAGC GAACCCGCAA AATTCGCCGA CAGCCTGCAA

1801 CCCGGCTTTA CCCTGCTCAA AACCGGCTAC GCCCTGACCG GCTACATCTC

1851 CGCCCTCGGC GCATACCGCA GCGAAATGCA CGAAGAATGC AGCCCCGACT

1901 TTACCGCACA GTTCCACCTC GCCGCCGAAC ACACCGCCCA CATCTTCCAA

1951 CACCTGCCCG AAACCGAACC CGACGACTTT CAGACAGCAC TGGATACACT

2001 GCGCGGCGAA CTCGACACCC TCCGCACCCA CAGCAGCGGA ACACAAAGCC

2051 ACATCCTCCT CCAACAGCTC CAACTCATCG CCCGGCAGCT CGAACCCTAC

2101 TACCGCGCCT ACCGACAAAT TCCGCACAGG CAGCCCCAAA ACGCAGCCTG

2151 A

它编码的蛋白质具有氨基酸序列<SEQ ID 108>：

1 MKTPPLKPLL ITSLPVFASV FTAASIVWQL GEPK LAMPFV LGIIAGGLVD

51 LDNRLTGRLK NIIATVALFT LSSLVAQSTL GTGLPF ILAM TLMTFGFTIM

101 GAVGLKYRTF AFGALAVATY TTLTYTPETY WLTNP FMILC GTVLYSTAII

151 LFQIILPHRP VQENVANAYE ALGSYLEAKA DFFDPDEAEW IGNRHIDLAM

201 SNTGVITAFN QCRSALFYRL RGKHRHPRTA KMLRYYFAAQ DIHERISSAH

251 VDYQEMSEKF KNTDIIFRIH RLLEMQGQAC RNTAQALRAS KDYVYSKRLG

301 RAIEGCRQSL RLLSDSNDNP DIRHLRRLLD NLGSVDQQFR QLQHNGLQAE

351 NDRMGDTRIA ALETGSLKNT WQAIRPQLNL ESGVFRHAVR LSLVVAAACT

401 IVEALNLNLG YWILLTALFV CQPNYTATKS RVRQR IAGTV LGVIVGSLVP

451 YFTPSVETKL WIVIASTTLF FMTRTYKYSF STFFITIQAL TSLSLAGLDV

501 YAAMPVRIID TIIGASLAWA AVSYLWPDWK YLTLERTAAL AVCSNGAYLE

551 KITERLKSGE TGDDVEYRAT RRRAHEHTAA LSSTLSDMSS EPAKFADSLQ

601 PGFTLLKTGY ALTGYISALG AYRSEMHEEC SPDFTAQFHL AAEHTAHIFQ

651 HLPETEPDDF QTALDTLRGE LDTLRTHSSG TQSHILLQQL QLIARQLEPY

701 YRAYRQIPHR QPQNAA*

ORF19a和ORF19-1显示在716个氨基酸的重叠区内有98.3％的相同性：

10 20 30 40 50 60

orf19a.pep MKTPPLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNRLTGRLK

|||| |||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNRLTGRLK

10 20 30 40 50 60

70 80 90 100 110 120

orf19a.pep NIIATVALFTLSSLVAQSTLGTGLPFILAMTLMTFGFTIMGAVGLKYRTFAFGALAVATY

|||:||||||||||:||||||||||||||||||||||||:||||||||||||||||||||

orf19-1 NIITTVALFTLSSLTAQSTLGTGLPFILAMTLMTFGFTILGAVGLKYRTFAFGALAVATY

70 80 90 100 110 120

130 140 150 160 170 180

orf19a.pep TTLTYTPETYWLTNPFMILCGTVLYSTAIILFQIILPHRPVQENVANAYEALGSYLEAKA

|||||||||||||||||||||||||||||:||||:||||||||:|||||:|||:||||||

orf19-1 TTLTYTPETYWLTNPFMILCGTVLYSTAILLFQIVLPHRPVQESVANAYDALGGYLEAKA

130 140 150 160 170 180

190 200 210 220 230 240

orf19a.pep DFFDPDEAEWIGNRHIDLAMSNTGVITAFNQCRSALFYRLRGKHRHPRTAKMLRYYFAAQ

|||||||| |||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 DFFDPDEAAWIGNRHIDLAMSNTGVITAFNQCRSALFYRLRGKHRHPRTAKMLRYYFAAQ

190 200 210 220 230 240

250 260 270 280 290 300

orf19a.pep DIHERISSAHVDYQEMSEKFKNTDIIFRIHRLLEMQGQACRNTAQALRASKDYVYSKRLG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 DIHERISSAHVDYQEMSEKFKNTDIIFRIHRLLEMQGQACRNTAQALRASKDYVYSKRLG

250 260 270 280 290 300

310 320 330 340 350 360

orf19a.pep RAIEGCRQSLRLLSDSNDNPDIRHLRRLLDNLGSVDQQFRQLQHNGLQAENDRMGDTRIA

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf19-1 RAIEGCRQSLRLLSDSNDSPDIRHLRRLLDNLGSVDQQFRQLQHNGLQAENDRMGDTRIA

310 320 330 340 350 360

370 380 390 400 410 420

orf19a.pep ALETGSLKNTWQAIRPQLNLESGVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTALFV

||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 ALETSSLKNTWQAIRPQLNLESGVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTALFV

370 380 390 400 410 420

430 440 450 460 470 480

orf19a.pep CQPNYTATKSRVRQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIASTTLFFMTRTYKYSF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 CQPNYTATKSRVRQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIASTTLFFMTRTYKYSF

430 440 450 460 470 480

490 500 510 520 530 540

orf19a.pep STFFITIQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAAL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 STFFITIQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAAL

490 500 510 520 530 540

550 560 570 580 590 600

orf19a.pep AVCSNGAYLEKITERLKSGETGDDVEYRATRRRAHEHTAALSSTLSDMSSEPAKFADSLQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 AVCSNGAYLEKITERLKSGETGDDVEYRATRRRAHEHTAALSSTLSDMSSEPAKFADSLQ

550 560 570 580 590 600

610 620 630 640 650 660

orf19a.pep PGFTLLKTGYALTGYISALGAYRSEMHEECSPDFTAQFHLAAEHTAHIFQHLPETEPDDF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 PGFTLLKTGYALTGYISALGAYRSEMHEECSPDFTAQFHLAAEHTAHIFQHLPETEPDDF

610 620 630 640 650 660

670 680 690 700 710

orf19a.pep QTALDTLRGELDTLRTHSSGTQSHILLQQLQLIARQLEPYYRAYRQIPHRQPQNAAX

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19-1 QTALDTLRGELDTLRTHSSGTQSHILLQQLQLIARQLEPYYRAYRQIPHRQPQNAAX

670 680 690 700 710

与淋病奈瑟球菌的预计ORF的同源性

ORF19在与淋病奈瑟球菌的预计ORF(ORF19.ng)在重叠的102个氨基酸内显示有95.1％的相同性：

orf19.pep MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNXXTGRLK 60

||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||

orf19ng MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNRLTGRLK 60

orf19.pep NIITTVALFTLSSLTAQSTLGTGLPFILAMTLMTXXFTILGAX 103

|||:|||||||||||||||||||||||||||||| |||||||

orf19ng NIIATVALFTLSSLTAQSTLGTGLPFILAMTLMTFGFTILGAVGLKYRTFAFGALAVATY 120

预计ORF19ng核苷酸序列<SEQ ID 109>编码的蛋白质具有氨基酸序列<SEQ ID110>：

1 MKTPLLKPLL ITSLPVFASV FTAASIVWQL GEPKLAMPFV LGI IAGGLVD

51 LDNRLTGRLK NIIATVA LFT LSSLTAQSTL GTGLPFILAM TLMTFGFTIL

101 GAVGLKYRTF AFGALAVAT Y TTLTYTPETY WLTNPFMILC GTVLYSTAII

151 LFQIILPHRP VQESVANA YE ALGGYLEAKA DFFDPDEAAW IGNRHIDLAM

201 SNTGVITAFN QCRSALFYRL RGKHRHPRTA KMLRYYFAAQ DIHERISSAH

251 VDYQEMSEKF KNTDIIFRIR RLLEMQGQAC RNTAQAIRSG KDYVYSKRLG

301 RAIEGCRQSL RLLSDGNDSP DIRHLSRLLD NLGSVDQQFR QLRHSDSPAE

351 NDRMGDTRIA ALETGSFKNT *

进一步的工作揭示了完整的核苷酸序列<SEQ ID 111>：

1 ATGAAAACCC CACTCCTCAA GCCTCTGCTC ATTACCTCGC TTCCCGTTTT

51 CGCCAGTGTC TTTACCGCCG CCTCCATCGT CTGGCAGCTA GGCGAACCCA

101 AGCTCGCCAT GCCCTTCGTA CTCGGCATCA TCGCCGGCGG CCTGGTCGAT

151 TTGGACAACC GCCTGACCGG ACGGCTGAAA AACATCATCG CCACCGTCGC

201 CCTGTTTACC CTCTCCTCGC TCACGGCGCA AAGCACCCTC GGCACAGGGC

251 TGCCCTTCAT CCTCGCCATG ACCCTGATGA CCTTCGGCTT TACCATTTTA

301 GGCGCGGTCG GGCTGAAATA CCGCACCTTC GCCTTCGGCG CACTCGCCGT

351 CGCCACCTAC ACCACGCTTA CCTACACCCC CGAAACCTAC TGGCTGACCA

401 ACCCCTTCAT GATTTTATGC GGCACCGTAC TGTACAGCAC CGCCATCATC

451 CTGTTCCAAA TCATCCTGCC CCACCGCCCC GTCCAAGAAA GCGTCGCCAA

501 TGCCTACGAA GCACTCGGCG GCTACCTCGA AGCCAAAGCC GACTTCTTCG

551 ACCCCGATGA GGCAGCCTGG ATAGGCAACC GCCACATCGA CCTCGCCATG

601 AGCAACACCG GCGTCATCAC CGCCTTCAAC CAATGCCGTT CCGCCCTGTT

651 TTACCGTTTG CGCGGCAAAC ACCGCCACCC GCGCACCGCC AAAATGCTGC

701 GCTACTACTT CGCCGCCCAA GACATCCACG AACGCATCAG CTCCGCCCAC

751 GTCGACTACC AAGAGATGTC CGAAAAATTC AAAAACACCG ACATCATCTT

801 CCGCATCCGC CGCCTGCTCG AAATGCAGGG GCAGGCGTGC CGCAACACCG

851 CCCAAGCCAT CCGGTCGGGC AAAGACTAcg tTTACAGCAA ACGCCTCGGA

901 CGCGCCATcg aaggctgCCG CCAGTCGCtg cgcctCCTTt cagacggcaA

951 CGACAGTCCC GACATCCGCC ACCTGAGccg CCTTCTCGAC AACCTCGgca

1001 GCGTcgacca gcagtTCcgc caactCCGAC ACAgcgactC CCCCGCcgaa

1051 Aacgaccgca tgggcgacaC CCGCATCGCC GCCCtcgaaa ccggcagctT

1101 caaaaaCAcc tggcaggCAA TCCGTCCGCa gctgaaCCTC GAATCatgCG

1151 TATTCCGCCA TGCCGTCCGC CTGTCCCTCG TCGTTGCCGC CGCCTGCACC

1201 ATCGTCgaag cCCTCAACCT CAACCTCGGC TACTGGATAC TGCTGACCGC

1251 CCTTTTCGTC TGCCAACCCA ACTACACCGC CACCAAAAGC CGCGTGTACC

1301 AACGCATCGC CGGCACCGTA CTCGGCGTAA TCGTCGGCTC GCTCGTCCCC

1351 TACTTCACCC CCTCCGTCGA AACCAAACTC TGGATTGTCA TCGCCGGTAC

1401 CACCCTGTTC TTCATGACCC GCACCTACAA ATACAGTTTC TCCACCTTCT

1451 TCATCACCAT TCAGGCACTG ACCAGCCTCT CCCTCGCAGG TTTGGACGTA

1501 TACGCCGCCA TGCCCGTGCG CATCATcgaC ACCATTATCG GCGCATCCCT

1551 TGCCTGGGCG GCGGTCAGCT ACCTGTGGCC AGACTGGAAA TACCTCACGC

1601 TCGAACGCAC CGCCGCCCTT GCCGTATGCA GCAGCGGCAC ATACCTCCAA

1651 AAAATTGCCG AACGCCTCAA AACCGGCGAA ACCGGCGACG ACATAGAATA

1701 CCGCATCACC CGCCGCCGCG CCCACGAACA CACCGCCGCC CTCAGCAGCA

1751 CCCTTTCCGA CATGAGCAGC GAACCCGCAA AATTCGCCGA CAGCCTGCAA

1801 CCCGGCTTTA CCCTGCTCAA AACCGGCTAC GCCCTGACCG GCTACATCTC

1851 CGCCCTCGGC GCATACCGCA GCGAAATGCA CGAAGAATGC AGCCCCGACT

1901 TTACCGCACA GTTCCACCTT GCCGCCGAAC ACACCGCCCA CATCTTCCAA

1951 CACCTGCCCG ACATGGGACC CGACGACTTT CAGACGGCAT TGGATACACT

2001 GCGCGGCGAA CTCGGCACCC TCCGCACCCG CAGCAGCGGA ACACAAAGCC

2051 ACATCCTCCT CCAACAGCTC CAACTCATCG CccgGCAACT CGAACCCTAC

2101 TACCGCGCCT ACCGACAAAT TCCGCACAGG CAGCCCCAAA ACGCAGCCTG

2151 A

它对应于氨基酸序列<SEQ ID 112；ORF19ng-1>：

1 MKTPLLKPLL ITSLPVFASV FTAASIVWQL GEPK LAMPFV LGIIAGGLVD

51 LDNRLTGRLK NIIATVALFT LSSLTAQSTL GTGLPF ILAM TLMTFGFTIL

101 GAVGLKYRTF AFGALAVATY TTLTYTPETY WLTNP FMILC GTVLYSTAII

151 LFQIILPHRP VQESVANAYE ALGGYLEAKA DFFDPDEAAW IGNRHIDLAM

201 SNTGVITAFN QCRSALFYRL RGKHRHPRTA KMLRYYFAAQ DIHERISSAH

251 VDYQEMSEKF KNTDIIFRIR RLLEMQGQAC RNTAQAIRSG KDYVYSKRLG

301 RAIEGCRQSL RLLSDGNDSP DIRHLSRLLD NLGSVDQQFR QLRHSDSPAE

351 NDRMGDTRIA ALETGSFKNT WQAIRPQLNL ESCVFRHAVR LSLVVAAACT

401 IVEALNLNLG YWILLTALFV CQPNYTATKS RVYQR IAGTV LGVIVGSLVP

451 YFTPSVETKL WIVIAGTTLF FMTRTYKYSF STFFITIQAL TSLSLAGLDV

501 YAAMPVRIID TIIGASLAWA AVSYLWPDWK YLTLERTAAL AVCSSGTYLQ

551 KIAERLKTGE TGDDIEYRIT RRRAHEHTAA LSSTLSDMSS EPAKFADSLQ

601 PGFTLLKTGY ALTGYISALG AYRSEMHEEC SPDFTAQFHL AAEHTAHIFQ

651 HLPDMGPDDF QTALDTLRGE LGTLRTRSSG TQSHILLQQL QLIARQLEPY

701 YRAYRQIPHR QPQNAA*

ORF19ng-1和ORF19-1在716个氨基酸的重叠区内显示出有95.5％的相同性：

10 20 30 40 50 60

orf19-1.pep MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNRLTGRLK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19ng-1 MKTPLLKPLLITSLPVFASVFTAASIVWQLGEPKLAMPFVLGIIAGGLVDLDNRLTGRLK

10 20 30 40 50 60

70 80 90 100 110 120

orf19-1.pep NIITTVALFTLSSLTAQSTLGTGLPFILAMTLMTFGFTILGAVGLKYRTFAFGALAVATY

|||:||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19ng-1 NIIATVALFTLSSLTAQSTLGTGLPFILAMTLMTFGFTILGAVGLKYRTFAFGALAVATY

70 80 90 100 110 120

130 140 150 160 170 180

orf19-1.pep TTLTYTPETYWLTNPFMILCGTVLYSTAILLFQIVLPHRPVQESVANAYDALGGYLEAKA

|||||||||||||||||||||||||||||:||||:||||||||||||||:||||||||||

orf19ng-1 TTLTYTPETYWLTNPFMILCGTVLYSTAIILFQIILPHRPVQESVANAYEALGGYLEAKA

130 140 150 160 170 180

190 200 210 220 230 240

orf19-1.pep DFFDPDEAAWIGNRHIDLAMSNTGVITAFNQCRSALFYRLRGKHRHPRTAKMLRYYFAAQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19ng-1 DFFDPDEAAWIGNRHIDLAMSNTGVITAFNQCRSALFYRLRGKHRHPRTAKMLRYYFAAQ

190 200 210 220 230 240

250 260 270 280 290 300

orf19-1.pep DIHERISSAHVDYQEMSEKFKNTDIIFRIHRLLEMQGQACRNTAQALRASKDYVYSKRLG

|||||||||||||||||||||||||||||:||||||||||||||||:|::||||||||||

orf19ng-1 DIHERISSAHVDYQEMSEKFKNTDIIFRIRRLLEMQGQACRNTAQAIRSGKDYVYSKRLG

250 260 270 280 290 300

310 320 330 340 350 360

orf19-1.pep RAIEGCRQSLRLLSDSNDSPDIRHLRRLLDNLGSVDQQFRQLQHNGLQAENDRMGDTRIA

|||||||||||||||:||||||||| ||||||||||||||||||| ||||||||||||

orf19ng-1 RAIEGCRQSLRLLSDGNDSPDIRHLSRLLDNLGSVDQQFRQLRHSDSPAENDRMGDTRIA

310 320 330 340 350 360

370 380 390 400 410 420

orf19-1.pep ALETSSLKNTWQAIRPQLNLESGVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTALFV

||||:|:||||||||||||||| |||||||||||||||||||||||||||||||||||||

orf19ng-1 ALETGSFKNTWQAIRPQLNLESCVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTALFV

370 380 390 400 410 420

430 440 450 460 470 480

orf19-1.pep CQFNYTATKSRVRQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIASTTLFFMTRTYKYSF

|||||||||||| ||||||||||||||||||||||||||||||||:||||||||||||||

orf19ng-1 CQPNYTATKSRVYQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIAGTTLFFMTRTYKYSF

430 440 450 460 470 480

490 500 510 520 530 540

orf19-1.pep STFFITIQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAAL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf19ng-1 STFFITIQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAAL

490 500 510 520 530 540

550 560 570 580 590 600

orf19-1.pep AVCSNGAYLEKITERLKSGETGDDVEYRATRRRAHEHTAALSSTLSDMSSEPAKFADSLQ

||||:|:||:||:||||:||||||:||| |||||||||||||||||||||||||||||||

orf19ng-1 AVCSSGTYLQKIAERLKTGETGDDIEYRITRRRAHEHTAALSSTLSDMSSEPAKFADSLQ

550 560 570 580 590 600

610 620 630 640 650 660

orf19-1.pep PGFTLLKTGYALTGYISALGAYRSEMHEECSPDFTAQFHLAAEHTAHIFQHLPETEPDDF

|||||||||||||||||||||||||||||||||||||||||||||||||||||: ||||

orf19ng-1 PGFTLLKTGYALTGYISALGAYRSEMHEECSPDFTAQFHLAAEHTAHIFQHLPDMGPDDF

610 620 630 640 650 660

670 680 690 700 710

orf19-1.pep QTALDTLRGELDTLRTHSSGTQSHILLQQLQLIARQLEPYYRAYRQIPHRQPQNAAX

||||||||||| ||||:||||||||||||||||||||||||||||||||||||||||

orf19ng-1 QTALDTLRGELGTLRTRSSGTQSHILLQQLQLIARQLEPYYRAYRQIPHRQPQNAAX

670 680 690 700 710

另外，ORF19ng-1显示出与以前输入数据库的一种假设的淋球菌蛋白有明显同源性：

sp|033369|YOR2_NEIGO假设的45.5KD蛋白(ORF2)gnl|PID|e1154438(AJ002423)假设蛋白[淋病奈瑟球菌]长度＝417

评分＝1512(705.6位)，估计值＝5.3e-203，P＝5.3e-203

相同性＝301/326(92％)，阳性＝306/326(93％)

询问：307 RQSLRLLSDGNDSPDIRHLSRLLDNLGSVDQQFRQLRHSDSPAENDRMGDTRIAALETGS 366

RQSLRLLSDGNDS DIRHLSRLLDNLGSVDQQFRQLRHSDSPAENDRMGDTRIAALETGS

目标：1 RQSLRLLSDGNDSXDIRHLSRLLDNLGSVDQQFRQLRHSDSPAENDRMGDTRIAALETGS 60

询问：367 FKNTWQAIRPQLNLESCVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTALFVCQPNYT 426

FKNTWQAIRPQLNLES VFRHAVRLSLVVAAACTIVEALNLNLGYWILLT LFVCQPNYT

目标：61 FKNTWQAIRPQLNLESGVFRHAVRLSLVVAAACTIVEALNLNLGYWILLTRLFVCQPNYT 120

询问：427 ATKSRVYQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIAGTTLFFMTRTYKYSFSTFFIT 486

ATKSRVYQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIAGTTLFFMTRTYKYSFSTFFIT

目标：121 ATKSRVYQRIAGTVLGVIVGSLVPYFTPSVETKLWIVIAGTTLFFMTRTYKYSFSTFFIT 180

询问：487 IQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAALAVCSSG 546

IQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAALAVCSSG

目标：181 IQALTSLSLAGLDVYAAMPVRIIDTIIGASLAWAAVSYLWPDWKYLTLERTAALAVCSSG 240

询问：547 TYLQKIAERLKTGETGDDIEYRITRRRAHEHTAALSSTLSDMSSEPAKFADSLQPGFTLL 606

TYLQKIAERLKTGETGDDIEYRITRRRAHEHTAALSSTLSDMSSEPAKFAD+ P

目标：241 TYLQKIAERLKTGETGDDIEYRITRRRAHEHTAALSSTLSDMSSEPAKFADTCNPALPCS 300

询问：607 KTGYALTGYISALGAYRSEMHEECSP 632

K ALTGYISALG ++ + +P

目标：301 KPATALTGYISALGHTAAKCTKNAAP 326

根据该分析，包括该淋球菌蛋白中存在几个推定的跨膜结构域(第一个结构域在脑膜炎球菌蛋白中也见到)以及与YHFK蛋白的同源性，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例14

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 113>：

1 ATGAATATGC TGGGAGCTTT GGCAAAAGTC GGCAGCCTGA CGATGGTGTC

51 GCGCGTTTTG GGATTTGTGC GCGATACGGT CATTGCGCGG GCATTCGGCG

101 CGGGTATGGC GACGGATGCG TTTTTTGTCG CGTTCAAACT GCCCAACCTG

151 CTTCGCCGCG TGTTTGCGGA GGGGGCGTTT GCCCAAGCGT TTGTGCCGAT

201 TTTGGCGGAA TACAAGGAAA CGCGTTCAAA AGAGGCGG.C GAAGCCTTTA

251 TCCGCCATGT GGCGGGGATG CTGTCGTTTG TACTGGTTAT CGTTACCGCG

301 CTGGGCATAC TTGCCGCGCC TTGGGTGATT TATGTTTCCG CACCC AGTT

351 TTGCCCAAGA TGCCGACAAA TTTCAGCTCT CCATCGATTT GCTGCGGATT

401 ACGTTTCCTT ATATATTATT GATTTCCCTG TCTTCATTTG TCGGCTCGGT

451 ACTCAATTCT TATCATAAGT TCGGCATTCC GGCGTTTACG CCAC.GTTTC

501 TGAACGTGTC GTTTATCGTA TTCGCGCTGT TTTTCGTGCC GTATTTCGAT

551 CCGCCCGTTA CCGCGCyGGC GTGGGCGGTC TTTGTCGGCG GCATTTTGCA

601 ACTCGrmTTC CAACTGCCCT GGCTGGCGAA ACTGGGCTTT TTGAAACTGC

651 CCAAACtGAG TTTCAAAGAT GCGGCGGTCA ACCGCGTGAT GAAACAGATG

701 GCGCCTGCgA TTTTgGGCGT GAgCGTGGCG CAGGTTTCTT TGGTGATCAA

751 CACGATTTTc GCGTCTTATC TGCAATCGGG CAGCGTTTCA TGGATGTATT

801 ACGCCGACCG CATGATGGAG CTGCCCAGCG GCGTGCTGGG GGCGGCACTC

851 GGTACGATTT TGCTGCCGAC TTTGTCCAAA CACTCGGCAA ACCaAGATAC

901 GGaACAGTTT TCCGCCCTGC TCGACTGGGG TTTGCGCCTG TGCATGCtgc

951 TGACGCTGCC GGCGgcGGTC GGACTGGCGG TGTTGTCGTT cCCgCtGGTG

1001 GCGACGCTGT TTATGTACCG CGwATTTACG CTGTTTGACG CGCAGATGAC

1051 GCAACACGCG CTGATTGCCT ATTCTTTCGG TTTAATCGGC TTAATCATGA

1101 TTAAAGTGTT GGCACCCGGC TTCTATGCGC GGCAAAACAT CAAwAmGCCC

1151 GTCAAAATCG CCATCTTCAC GCTCATCTGC mCGCAGTTGA TGAACCTTGs

1201 CTTTAyCGGC CCACTrrAAC rCa

TCGGAC TTTCGCTTGC CATCGGTCTG

1251 GGCGCGTGTA TCAATGCCGG ATTGTTGTTT TACCTGTTGC GCAGACACGG

1301 TATTTACCAA CCTGG.CAAG GGTTGGGCAG CGTTCTT.AG CAAAAATGCT

1351 GcTCTCGCTC GCCGTGA

它对应于氨基酸序列<SEQ ID 114；ORF20>：

1 MNMLGALAKV GSLTMVSRVL GFVRDTVIAR AFGAGMATDA FFVAFKLPNL

51 LRRVFAEGAF AQAFVPILAE YKETRSKEAX EAFIRHVAGM LSFVLVIVTA

101 LGILAAPWVI YVSAPSFAQD ADKFQLSIDL LRITFPYILL ISLSSFVGSV

151 LNSYHKFGIP AFTPXFLNVS FIVFALFFVP YFDPPVTAXA WAVFVGGILQ

201 LXFQLPWLAK LGFLKLPKLS FKDAAVNRVM KQMAPAILGV SVAQVSLVIN

251 TIFASYLQSG SVSWMYYADR MMELPSGVLG AALGTILLPT LSKHSANQDT

301 EQFSALLDWG LRLCMLLTLP AAVGLAVLSF PLVATLFMYR XFTLFDAQMT

351 QHALIAYSFG LIGLIMIKVL APGFYARQNI XXPVKIAIFT LICXQLMNLX

401 FXGPLXXIGL SLAIGLGACI NAGLLFYLLR RHGIYQPXQG LGSVLXQKCC

451 SRSP*

详细描述这些序列，其完整的DNA序列<SEQ ID 115>是：

1 ATGAATATGC TGGGAGCTTT GGCAAAAGTC GGCAGCCTGA CGATGGTGTC

51 GCGCGTTTTG GGATTTGTGC GCGATACGGT CATTGCGCGG GCATTCGGCG

101 CGGGTATGGC GACGGATGCG TTTTTTGTCG CGTTCAAACT GCCCAACCTG

151 CTTCGCCGCG TGTTTGCGGA GGGGGCGTTT GCCCAAGCGT TTGTGCCGAT

201 TTTGGCGGAA TACAAGGAAA CGCGTTCAAA AGAGGCGGCG GAGGCTTTTA

251 TCCGCCATGT GGCGGGGATG CTGTCGTTTG TACTGGTTAT CGTTACCGCG

301 CTGGGCATAC TTGCCGCGCC TTGGGTGATT TATGTTTCCG CACCCGGTTT

351 TGCCCAAGAT GCCGACAAAT TTCAGCTCTC CATCGATTTG CTGCGGATTA

401 CGTTTCCTTA TATATTATTG ATTTCCCTGT CTTCATTTGT CGGCTCGGTA

451 CTCAATTCTT ATCATAAGTT CGGCATTCCG GCGTTTACGC CCACGTTTCT

501 GAACGTGTCG TTTATCGTAT TCGCGCTGTT TTTCGTGCCG TATTTCGATC

551 CGCCCGTTAC CGCGCTGGCG TGGGCGGTCT TTGTCGGCGG CATTTTGCAA

601 CTCGGCTTCC AACTGCCCTG GCTGGCGAAA CTGGGCTTTT TGAAACTGCC

651 CAAACTGAGT TTCAAAGATG CGGCGGTCAA CCGCGTGATG AAACAGATGG

701 CGCCTGCGAT TTTGGGCGTG AGCGTGGCGC AGGTTTCTTT GGTGATCAAC

751 ACGATTTTCG CGTCTTATCT GCAATCGGGC AGCGTTTCAT GGATGTATTA

801 CGCCGACCGC ATGATGGAGC TGCCCAGCGG CGTGCTGGGG GCGGCACTCG

851 GTACGATTTT GCTGCCGACT TTGTCCAAAC ACTCGGCAAA CCAAGATACG

901 GAACAGTTTT CCGCCCTGCT CGACTGGGGT TTGCGCCTGT GCATGCTGCT

951 GACGCTGCCG GCGGCGGTCG GACTGGCGGT GTTGTCGTTC CCGCTGGTGG

1001 CGACGCTGTT TATGTACCGC GAATTTACGC TGTTTGACGC GCAGATGACG

1051 CAACACGCGC TGATTGCCTA TTCTTTCGGT TTAATCGGCT TAATCATGAT

1101 TAAAGTGTTG GCACCCGGCT TCTATGCGCG GCAAAACATC AAAACGCCCG

1151 TCAAAATCGC CATCTTCACG CTCATCTGCA CGCAGTTGAT GAACCTTGCC

1201 TTTATCGGCC CACTGAAACA CGTCGGACTT TCGCTTGCCA TCGGTCTGGG

1251 CGCGTGTATC AATGCCGGAT TGTTGTTTTA CCTGTTGCGC AGACACGGTA

1301 TTTACCAACC TGGCAAGGGT TGGGCAGCGT TCTTAGCAAA AATGCTGCTC

1351 TCGCTCGCCG TGATGTGCGG CGGACTGTGG GCAGCGCAGG CTTACCTGCC

1401 GTTTGAATGG GCGCACGCCG GCGGAATGCG GAAAGCGGGG CAGCTCTGCA

1451 TCCTGATTGC CGTCGGCGGC GGACTGTATT TCGCATCACT GGCGGCTTTG

1501 GGCTTCCGTC CGCGCCATTT CAAACGCGTG GAAAACTGA

它对应于氨基酸序列<SEQ ID 116；ORF20-1>：

1 MNMLGALAKV GSLTMVSRVL GFVRDTVIAR AFGAGMATDA FFVAFKLPNL

51 LRRVFAEGAF AQAFVPILAE YKETRSKEAA EAFIRHVAG M LSFVLVIVTA

101 LGILAAPWVI YVSAPGFAQD ADKFQLSIDL LRIT FPYILL ISLSSFVGSV

151 LNSYHKFGIP AFTPT FLNVS FIVFALFFVP YFDPP VTALA WAVFVGGILQ

201 LGFQLPWLAK LGFLKLPKLS FKDAAVNRVM KQ MAPAILGV SVAQVSLVIN

251 TIFASYLQSG SVSWMYYADR MMELPSGVLG AALGTILLPT LSKHSANQDT

301 EQFSALLDWG LR LCMLLTLP AAVGLAVLSF PLVATLFMYR EFTLFDAQMT

351 QHA LIAYSFG LIGLIMIKVL APGFYARQNI KTPVK IAIFT LICTQLMNLA

401 FIGPLKHVGL S LAIGLGACI NAGLLFYLLR RHGIYQPGKG WA AFLAKMLL

451 SLAVMCGGLW AAQAYLPFEW AHAGGMRKAG Q LCILIAVGG GLYFASLAAL

501 GFRPRHFKRV EN*

该氨基酸序列的计算机分析给出了下列结果：

与鼠伤寒杆菌的MviN毒力因子(登录号为P37169)的同源性

ORF20和MviN蛋白在440个氨基酸重叠区内显示出有63％的氨基酸相同性：

Orf20 1 MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF 60

MN+L +LA V S+TM SRVLGF RD ++AR FGAGMATDAFFVAFKLPNLLRR+FAEGAF

MviN 14 MNLLKSLAAVSSMTMFSRVLGFARDAIVARIFGAGMATDAFFVAFKLPNLLRRIFAEGAF 73

Orf20 61 AQAFVPILAEYKETRSKEAXEAFIRHVAGMLSFVLVIVTALGILAAPWVIYVSAPSFAQD 120

+QAFVPILAEYK + +EA F+ +V+G+L+ L +VT G+LAAPWVI V+AP FA

MviN 74 SQAFVPILAEYKSKQGEEATRIFVAYVSGLLTLALAVVTVAGMLAAPWVIMVTAPGFADT 133

Orf20 121 ADKFQLSIDLLRITFPYILLISLSSFVGSVLNSYHKFGIPAFTPXFLNVSFIVFALFFVP 180

ADKF L+ LLRITFPYILLISL+S VG++LN++++F IPAF P FLN+S I FALF P

MviN 134 ADKFALTTQLLRITFPYILLISLASLVGAILNTWNRFSIPAFAPTFLNISMIGFALFAAP 193

Orf20 181 YFDPPVTAXAWAVFVGGILQLXFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQMAPAILGV 240

YF+PPV A AWAV VGG+LQL +QLP+L K+G L LP+++F+D RV+KQM PAILGV

MviN 194 YFNPPVLALAWAVTVGGVLQLVYQLPYLKKIGMLVLPRINFRDTGAMRVVKQMGPAILGV 253

Orf20 241 SVAQVSLVINTIFASYLQSGSVSWMYYADRMMELPSGVLGAALGTILLPTLSKHSANQDT 300

SV+Q+SL+INTIFAS+L SGSVSWMYYADR+ME PSGVLG ALGTILLP+LSK A+ +

MviN 254 SVSQISLIINTIFASFLASGSVSWMYYADRLMEFPSGVLGVALGTILLPSLSKSFASGNH 313

Orf20 301 EQFSALLDWGLRLCMLLTLPAAVGLAVLSFPLVATLFMYRXFTLFDAQMTQHALIAYSFG 360

+++ L+DWGLRLC LL LP+AV L+L+ PL +LF Y FT FDA MTQ ALIAYS G

MviN 314 DEYCRLMDWGLRLCFLLALPSAVALGILAKPLTVSLFQYGKFTAFDAAMTQRALIAYSVG 373

Orf20 361 LIGLIMIKVLAPGFYARQNIXXPVKIAIFTLICXQLMNLXFXXXXXXXXXXXXXXXXXCI 420

LIGLI++KVLAPGFY+RQ+I PVKIAI TLI QLMNL F C+

MviN 374 LIGLIVVKVLAPGFYSRQDIKTPVKIAIVTLIMTQLMNLAFIGPLKHAGLSLSIGLAACL 433

Orf20 421 NAGLLFYLLRRHGIYQPXQG 440

NA LL++ LR+ I+ P G

MviN 434 NASLLYWQLRKQNIFTPQPG 453

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF20与脑膜炎奈瑟球菌菌株A的ORF(ORF20a)在重叠的447个氨基酸内显示出有93.5％的相同性：

10 20 30 40 50 60

orf20.pep MNMLGALAKVGSLTMVSRVLGFVRDTVIA RAFGAGMATDAFFVAFK LPNLLRRVFAEGAF

|||||||:||||||||||||||||||||| ||||||||||||||||| ||||||||||||||

orf20a MNMLGALVKVGSLTMVSRVLGFVRDTVIA RAFGAGMATDAFFVAFK LPNLLRRVFAEGAF

10 20 30 40 50 60

70 80 90 100 110 120

orf20.pep AQAFVPILAEYKETRSKEAXEAFIRHVAG MLSFVLVIVTALGILAAPWVIYVSAPSFAQD

|||||||||||||||||||:||||||||| ||||||||||||||||| |||||||||:||:|

orf20a AQAFVPILAEYKETRSKEATEAFIRHVAG MLSFVLVIVTALGILAAPWVIYVSAPGFAKD

70 80 90 100 110 120

130 140 150 160 170 180

orf20.pep ADKFQLSIDLLRIT FPYILLISLSSFVGSVLNSYHKFGIPAFTPX FLNVSFIVFALFFVP

|||||||||||||| ||||||||||||||||| ||||||:||||||: |||||||||||||||

orf20a ADKFQLSIDLLRIT FPYILLISLSSFVGSVLNSYHKFSIPAFTPT FLNVSFIVFALFFVP

130 140 150 160 170 180

190 200 210 220 230 240

orf20.pep YFDPP VTAXAWAVFVGGILQLXFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQ MAPAILGV

|| ||| ||| |||||||||||| |||||||||||||||||||||||||||||| ||||||||

orf20a YFDPP VTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQ MAPAILGV

190 200 210 220 230 240

250 260 270 280 290 300

orf20.pep SVAQVSLVINTIFASYLQSGSVSWMYYADRMMELPSGVLGAALGTILLPTLSKHSANQDT

||||:|||| ||||||||||||||||||||||||||:||||||||||||||||||||||||

orf20a SVAQISLVINTIFASYLQSGSVSWMYYADRMMELPGGVLGAALGTILLPTLSKHSANQDT

250 260 270 280 290 300

310 320 330 340 350 360

orf20.pep EQFSALLDWGLR LCMLLTLPAAVGLAVLSFPLVATLFMYRXFTLFDAQMTQHA LIAYSFG

|||||||||||| |||||||||||:||||| |||||||||| |||||||||||| |||||||

orf20a EQFSALLDWGLR XCMLLTLPAAVGMAVLSFPLVATLFMYREFTLFDAQMTQHA LIAYSFG

310 320 330 340 350 360

370 380 390 400 410 420

orf20.pep LIGLIMIKVLAPGFYARQNIXXPVK IAIFTLICXQLMNLXFXGPLXXIGLS LAIGLGACI

|||||||||| |||||||||| :||| ||||||||:||||| | ||| :||| |||||||||

orf20a LIGLIMIKVLAPGFYARQNIKTPVK IAIFTLICTQLMNLAFIGPLKHVGLS LAIGLGACI

370 380 390 400 410 420

430 440 450

orf20.pep NAGLLFYLLRRHGIYQPXQGLG SVLXQKCCSRSPX

|||||||| ||||||||| :| : : | :

orf20a NAGLLFYLLRRHGIYQPGKGWA AFLAKMLLSLAVMGGGLYAAQIWLPFDWAHAGGMQKAA

430 440 450 460 470 480

全长ORF20a核苷酸序列<SEQ ID 117>是：

1 ATGAATATGC TGGGAGCTTT GGTAAAAGTC GGCAGCCTGA CGATGGTGTC

51 GCGCGTTTTG GGATTTGTGC GCGATACGGT CATTGCGCGC GCATTCGGCG

101 CAGGCATGGC GACGGATGCG TTCTTTGTCG CGTTCAAACT GCCCAACCTG

151 CTTCGCCGCG TGTTTGCGGA GGGGGCGTTT GCCCAAGCGT TTGTGCCGAT

201 TTTGGCGGAA TATAAGGAAA CGCGTTCTAA AGAGGCGACG GAGGCTTTTA

251 TCCGCCATGT GGCGGGGATG CTGTCGTTTG TACTGGTCAT CGTTACCGCG

301 CTGGGCATAC TTGCCGCGCC TTGGGTGATT TATGTTTCCG CACCCGGTTT

351 TGCCAAAGAT GCCGACAAAT TTCAGCTCTC TATCGATTTG CTGCGGATTA

401 CGTTTCCTTA TATCTTATTG ATTTCACTTT CCTCTTTTGT CGGCTCGGTA

451 CTCAATTCCT ATCATAAATT CAGCATTCCT GCGTTTACGC CCACGTTCCT

501 GAACGTGTCG TTTATCGTAT TCGCGCTGTT TTTCGTGCCG TATTTCGATC

551 CTCCCGTTAC CGCGCTGGCT TGGGCGGTTT TTGTCGGCGG CATTTTGCAA

601 CTCGGCTTCC AACTGCCCTG GCTGGCGAAA CTGGGTTTTT TGAAACTGCC

651 CAAACTGAGT TTCAAAGATG CGGCGGTCAA CCGCGTGATG AAACAGATGG

701 CGCCTGCGAT TTTGGGCGTG AGCGTGGCGC AGATTTCTTT GGTGATCAAC

751 ACGATTTTCG CGTCTTATCT GCAATCGGGC AGCGTTTCAT GGATGTATTA

801 CGCCGACCGC ATGATGGAAC TGCCCGGCGG CGTGCTGGGG GCGGCACTCG

851 GTACGATTTT GCTGCCGACT TTGTCCAAAC ACTCGGCAAA CCAAGATACG

901 GAACAGTTTT CCGCCCTGCT CGACTGGGGT TTGCGCNTGT GCATGCTGCT

951 GACGCTGCCG GCGGCGGTCG GAATGGCGGT GTTGTCGTTC CCGCTGGTGG

1001 CAACCTTGTT TATGTACCGA GAATTCACGC TGTTTGACGC GCAGATGACG

1051 CAACACGCGC TGATTGCCTA TTCTTTCGGT TTAATCGGTT TAATCATGAT

1101 TAAAGTGTTG GCGCCCGGCT TTTATGCGCG GCAAAACATC AAAACGCCCG

1151 TCAAAATCGC CATCTTCACG CTCATTTGCA CGCAGTTGAT GAACCTTGCC

1201 TTTATCGGCC CACTGAAACA CGTCGGACTT TCGCTTGCCA TCGGTCTGGG

1251 CGCGTGTATC AATGCCGGAT TGTTGTTTTA CCTGTTGCGC AGACACGGTA

1301 TTTACCAACC TGGCAAGGGT TGGGCAGCGT TCTTGGCAAA AATGCTGCTC

1351 TCGCTCGCCG TGATGGGAGG CGGCCTGTAT GCCGCCCAAA TCTGGCTGCC

1401 GTTCGACTGG GCACACGCCG GCGGAATGCA AAAGGCCGCC CGGCTCTTCA

1451 TCCTGATTGC CGTCGGCGGC GGACTGTATT TCGCATCACT GGCGGCTTTG

1501 GGCTTCCGTC CGCGCCATTT CAAACGCGTG GAAAGCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 118>：

1 MNMLGALVKV GSLTMVSRVL GFVRDTVIAR AFGAGMATDA FFVAFKLPNL

51 LRRVFAEGAF AQAFVPILAE YKETRSKEAT EAFIRHVAG M LSFVLVIVTA

101 LGILAAPWVI YVSAPGFAKD ADKFQLSIDL LRIT FPYILL ISLSSFVGSV

151 LNSYHKFSIP AFTPT FLNVS FIVFALFFVP YFDPP VTALA WAVFVGGILQ

201 LGFQLPWLAK LGFLKLPKLS FKDAAVNRVM KQ MAPAILGV SVAQISLVIN

251 TIFASYLQSG SVSWMYYADR MMELPGGVLG AALGTILLPT LSKHSANQDT

301 EQFSALLDWG LR XCMLLTLP AAVGMAVLSF PLVATLFMYR EFTLFDAQMT

351 QHA LIAYSFG LIGLIMIKVL APGFYARQNI KTPVK IAIFT LICTQLMNLA

401 FIGPLKHVGL S LAIGLGACI NAGLLFYLLR RHGIYQPGKG WA AFLAKMLL

451 SLAVMGGGLY AAQIWLPFDW AHAGGMQKAA R LFILIAVGG GLYFASLAAL

501 GFRPRHFKRV ES*

ORF20a和ORF20-1在512个氨基酸的重叠区内显示出有96.5％的相同性：

10 20 30 40 50 60

orf20a.pep MNMLGALVKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf20-1 MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF

10 20 30 40 50 60

70 80 90 100 110 120

orf20a.pep AQAFVPILAEYKETRSKEATEAFIRHVAGMLSFVLVIVTALGILAAPWVIYVSAPGFAKD

|||||||||||||||||||:||||||||||||||||||||||||||||||||||||||:|

orf20-1 AQAFVPILAEYKETRSKEAAEAFIRHVAGMLSFVLVIVTALGILAAPWVIYVSAPGFAQD

70 80 90 100 110 120

130 140 150 160 170 180

orf20a.pep ADKFQLSIDLLRITFPYILLISLSSFVGSVLNSYHKFSIPAFTPTFLNVSFIVFALFFVP

|||||||||||||||||||||||||||||||||||||:||||||||||||||||||||||

orf20-1 ADKFQLSIDLLRITFPYILLISLSSFVGSVLNSYHKFGIPAFTPTFLNVSFIVFALFFVP

130 140 150 160 170 180

190 200 210 220 230 240

orf20a.pep YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQMAPAILGV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf20-1 YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQMAPAILGV

190 200 210 220 230 240

250 260 270 280 290 300

orf20a.pep SVAQISLVINTIFASYLQSGSVSWMYYADRMMELPGGVLGAALGTILLPTLSKHSANQDT

||||:||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf20-1 SVAQVSLVINTIFASYLQSGSVSWMYYADRMMELPSGVLGAALGTILLPTLSKHSANQDT

250 260 270 280 290 300

310 320 330 340 350 360

orf20a.pep EQFSALLDWGLRXCMLLTLPAAVGMAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG

|||||||||||| |||||||||||:|||||||||||||||||||||||||||||||||||

orf20-1 EQFSALLDWGLRLCMLLTLPAAVGLAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG

310 320 330 340 350 360

370 380 390 400 410 420

orf20a.pep LIGLIMIKVLAPGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHVGLSLAIGLGACI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf20-1 LIGLIMIKVLAPGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHVGLSLAIGLGACI

370 380 390 400 410 420

430 440 450 460 470 480

orf20a.pep NAGLLFYLLRRHGIYQPGKGWAAFLAKMLLSLAVMGGGLYAAQIWLPFDWAHAGGMQKAA

||||||||||||||||||||||||||||||||||| |||:||| :|||:|||||||:||:

orf20-1 NAGLLFYLLRRHGIYQPGKGWAAFLAKMLLSLAVMCGGLWAAQAYLPFEWAHAGGMRKAG

430 440 450 460 470 480

490 500 510

orf20a.pep RLFILIAVGGGLYFASLAALGFRPRHFKRVESX

:| ||||||||||||||||||||||||||||:|

orf20-1 QLCILIAVGGGLYFASLAALGFRPRHFKRVENX

490 500 510

与淋病奈瑟球菌的预计ORF的同源性

ORF20与淋病奈瑟球菌的预计ORF(ORF20ng)在重叠的454个氨基酸内显示出有92.1％的相同性：

orf20.pep MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf20ng MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF 60

orf20.pep AQAFVPILAEYKETRSKEAXEAFIRHVAGMLSFVLVIVTALGILAAPWVIYVSAPSFAQD 120

||||||||||||||||||||:||||||||||||||::||||||||||||||||||:|::|

orf20ng AQAFVAILAEYKETRSKEATEAFIRHVAGMLSFVLIVVTALGILAAPWVIYVSAPGFTKD 120

orf20.pep ADKFQLSIDLLRITFPYILLISLSSFVGSVLNSYHKFGIPAFTPXFLNVSFIVFALFFVP 180

||||||||:||||||||||||||||||||:||||||||||||||:|||:|||||||||||

orf20ng ADKFQLSISLLRITFPYILLISLSSFVGSILNSYHKFGIPAFTPTFLNISFIVFALFFVP 180

orf20.pep YFDPPVTAXAWAVFVGGILQLXFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQMAPAILGV 240

|||||||| |||||||||||| |||||||||||||||||:||||||||||||||||||||

orf20ng YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLNFKDAAVNRVMKQMAPAILGV 240

orf20.pep SVAQVSLVINTIFASYLQSGSVSWMYYADRMMELPSGVLGAALGTILLPTLSKHSANQDT 300

||||:||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf20ng SVAQISLVINTIFASYLQSGSVSWMYYADRMMELPGGVLGAALGTILLPTLSKHSANQDT 300

orf20.pep EQFSALLDWGLRLCMLLTLPAAVGLAVLSFPLVATLFMYRXFTLFDAQMTQHALIAYSFG 360

||||||||||||||||||||||:||||||||||||||||| |||||||||||||||||||

orf20ng EQFSALLDWGLRLCMLLTLPAAAGLAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG 360

orf20.pep LIGLIMIKVLAPGFYARQNIXXPVKIAIFTLICXQLMNLXFXGPLXXIGLSLAIGLGACI 420

||||||||||| |||||||| :|||||||||||:||||| | ||| ||||||||||||

orf20ng LIGLIMIKVLASGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHAGLSLAIGLGACI 420

orf20.pep NAGLLFYLLRRHGIYQPXQGLGSVLXQKCCSRSP 454

||||||:|:|:||||:| ||||: :|||||||

orf20ng NAGLLFFLFRKHGIYRPGQGLGQPSWRKCCSRSP 454

预计ORF20ng核苷酸序列<SEQ ID 119>编码的蛋白质具有氨基酸序列<SEQ ID120>：

1 MNMLGALAKV GSLTMVSRVL GFVRDTVIAR AFGAGMATDA FFVAFKLPNL

51 LRRVFAEGAF AQAFVPILAE YKETRSKEAT EAFIRHVAGM LSFVLIVVTA

101 LGILAAPWVI YVSAPGFTKD ADKFQLSISL LRITFPYILL ISLSSFVGSI

151 LNSYHKFGIP AFTPTFLNIS FIVFALFFVP YFDPPVTALA WAVFVGGILQ

201 LGFQLPWLAK LGFLKLPKLN FKDAAVNRVM KQMAPAILGV SVAQISLVIN

251 TIFASYLQSG SVSWMYYADR MMELPGGVLG AALGTILLPT LSKHSANQDT

301 EQFSALLDWG LRLCMLLTLP AAAGLAVLSF PLVATLFMYR EFTLFDAQMT

351 QHALIAYSFG LIGLIMIKVL ASGFYARQNI KTPVKIAIFT LICTQLMNLA

401 FIGPLKHAGL SLAIGLGACI NAGLLFFLFR KHGIYRPGQG LGQPSWRKCC

451 SRSP*

进一步的DNA分析揭示了下列DNA序列<SEQ ID 121>：

1 ATGAATATGC TTGGAGCTTT GGCAAAAGTC GGCAGCCTGA CGATGGTGTC

51 GCGCGTTTTG GGATTTGTGC GCGATACGGT CATTGCGCGG GCATTCGGCG

101 CGGGTATGGC GACGGATGCG TTTTTTGTCG CGTTCAAACT GCCCAACCTG

151 CTTCGCCGCG TGTTTGCGGA GGGGGCGTTT GCCCAAGCGT TTGTGCCGAT

201 TTTGGCGGAA TATAAGGAAA CGCGTTCTAA AGAGGCGAcg gAGGCTTTTA

251 TCCGCCACGt tgcgggAatg CTGTCGTTTG TGCTGATcgt cGttacCGCG

301 CTGGGCATAC TTGCCGCgcc tTGGGTGATT TATGTTtccg CgcccGGCTT

351 TACCAAAGAC GCGGACAAGT TCCAACTTTC CATCAGCCTG CTGCGGATTA

401 CGTTTCCTTA TATATTATTG ATTTCTTTGT CTTCTTTTGT CGGCTCGATA

451 CTCAATTCCT ACCATAAGTT CGGCATTCCC GCGTTTACGC CCACGTTTTT

501 AAACATCTCT TTTATCGTAT TCGCACTGTT TTTCGTGCCG TATTTCGATC

551 CGCCCGTTAC CGCGCTGGCG TGGGCGGTTT TTGTCGGCGG TATTTTGCAG

601 CTCGGTTTCC AACTGCCGTG GCTGGCGAAA CTGGGCTTTT TGAAACTGCC

651 CAAACTGAAT TTCAAAGATG CGGCGGTCAA CCGCGTCATG AAACAGATGG

701 CGCCTGCGAT TTTGGGCGTG agcgTGGCGC AAATTTCTTT GgttATCAAC

751 ACGATTTTCG CGTCTTATCT GCAATCGGGC AGCGTTTCAT GGATGTatta

801 cgCCGACCGC ATGATGGAGc tgcgccGGGG CGTGCTGGGG GCTGCACTCG

851 GTACAATTTT GCTGCCGACT TTGTCCAAAC ACTCGGCAAA CCAAGATACG

901 GAACAGTTTT CCGCCCTGCT CGACTGGGGT TTGCGCCTGT GCATGCTGCT

951 GACGCTGCCG GCGGCGGccg GACTGGCGGT ATTGTCGTTC CCGCTGGTGG

1001 CGACGCTGTT TATGTACCGA GAATTCACGC TGTTTGACGC ACAAATGACG

1051 CAACACGCGC TGATTGCCTA TTCTTTCGGT TTAATCGGTT TAATTATGAT

1101 TAAAGTGTTG GCATCCGGCT TTTATGCGCG GCAAAACATC AAAACGCCCG

1151 TCAAAATCGC CATCTTCACG CTCATCTGCA CGCAGTTGAT GAACCTCGCC

1201 TTTATCGGTC CGTTGAAACA CGCCGGGCTT TCGCTCGCCA TCGGCCTGGG

1251 CGCGTGCATC AACGCCGGAT TGTTGTTCTT CCTGTTGCGC AAACACGGTA

1301 TTTACCGGCC cggcaggggt tgggcggcgt TCTTGGCGAA AATGCTGCTC

1351 GCGCTCGCCG TGATGTGCGG CGGACTGTGG GCGGCGCAGG CTTGCCTGCC

1401 GTTCGAATGG GCGCACGCCG GCGGAATGCG GAAAGCGGGG CAGCTCTGCA

1451 TCCTGATTGC CGTCGGCGGC GGACTGTATT TCGCATCTCT GGCGGCTTTG

1501 GGCTTCCGTC CGCGCCATTT CAAACGCGTG GAAAGCTGA

它编码下列氨基酸序列<SEQ ID 122；ORF20ng-1>：

1 MNMLGALAKV GSLTMVSRVL GFVRDTVIAR AFGAGMATDA FFVAFKLPNL

51 LRRVFAEGAF AQAFVPILAE YKETRSKEAT EAFIRHVAG M LSFVLIVVTA

101 LGILAAPWVI YVSAPGFTKD ADKFQLSISL LRIT FPYILL ISLSSFVGSI

151 LNSYHKFGIP AFTPT FLNIS FIVFALFFVP YFDPP VTALA WAVFVGGILQ

201 LGFQLPWLAK LGFLKLPKLN FKDAAVNRVM KQ MAPAILGV SVAQISLVIN

251 TIFASYLQSG SVSWMYYADR MMELRRGVLG AALGTILLPT LSKHSANQDT

301 EQFSALLDWG LR LCMLLTLP AAAGLAVLSF PLVATLFMYR EFTLFDAQMT

351 QHA LIAYSFG LIGLIMIKVL ASGFYARQNI KTPVK IAIFT LICTQLMNLA

401 FIGPLKHAGL S LAIGLGACI NAGLLFFLLR KHGIYRPGRG WA AFLAKMLL

451 ALAVMCGGLW AAQACLPFEW AHAGGMRKAG Q LCILIAVGG GLYFASLAAL

501 GFRPRHFKRV ES*

ORF20ng-1和ORF20-1在512个氨基酸的重叠区内显示出有95.7％的相同性：

10 20 30 40 50 60

orf20-1.pep MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf20ng-1 MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF

10 20 30 40 50 60

70 80 90 100 110 120

orf20-1.pep AQAFVPILAEYKETRSKEAAEAFIRHVAGMLSFVLVIVTALGILAAPWVIYVSAPGFAQD

||||||||||||||||||:|||||||||||||||::|||||||||||||||||||||::|

orf20ng-1 AQAFVPILAEYKETRSKEATEAFIRHVAGMLSFVLIVVTALGILAAPWVIYVSAPGFTKD

70 80 90 100 110 120

130 140 150 160 170 180

orf20-1.pep ADKFQLSIDLLRITFPYILLISLSSFVGSVLNSYHKFGIPAFTPTFLNVSFIVFALFFVP

||||||||:||||||||||||||||||||:||||||||||||||||||:|||||||||||

orf20ng-1 ADKFQLSISLLRITFPYILLISLSSFVGSILNSYHKFGIPAFTPTFLNISFIVFALFFVP

130 140 150 160 170 180

190 200 210 220 230 240

orf20-1.pep YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLSFKDAAVNRVMKQMAPAILGV

|||||||||||||||||||||||||||||||||||||||:||||||||||||||||||||

orf20ng-1 YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLNFKDAAVNRVMKQMAPAILGV

190 200 210 220 230 240

250 260 270 280 290 300

orf20-1.pep SVAQVSLVINTIFASYLQSGSVSWMYYADRMMELPSGVLGAALGTILLPTLSKHSANQDT

||||:||||||||||||||||||||||||||||| ||||||||||||||||||||||||

orf20ng-1 SVAQISLVINTIFASYLQSGSVSWMYYADRMMELRRGVLGAALGTILLPTLSKHSANQDT

250 260 270 280 290 300

310 320 330 340 350 360

orf20-1.pep EQFSALLDWGLRLCMLLTLPAAVGLAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG

||||||||||||||||||||||:|||||||||||||||||||||||||||||||||||||

orf20ng-1 EQFSALLDWGLRLCMLLTLPAAAGLAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG

310 320 330 340 350 360

370 380 390 400 410 420

orf20-1.pep LIGLIMIKVLAPGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHVGLSLAIGLGACI

||||||||||| |||||||||||||||||||||||||||||||||||:||||||||||||

orf20ng-1 LIGLIMIKVLASGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHAGLSLAIGLGACI

370 380 390 400 410 420

430 440 450 460 470 480

orf20-1.pep NAGLLFYLLRRHGIYQPGKGWAAFLAKMLLSLAVMCGGLWAAQAYLPFEWAHAGGMRKAG

||||||:|||:||||:||:|||||||||||:||||||||||||| |||||||||||||||

orf20ng-1 NAGLLFFLLRKHGIYRPGRGWAAFLAKMLLALAVMCGGLWAAQACLPFEWAHAGGMRKAG

430 440 450 460 470 480

490 500 510

orf20-1.pep QLCILIAVGGGLYFASLAALGFRPRHFKRVENX

|||||||||||||||||||||||||||||||:|

orf20ng-1 QLCILIAVGGGLYFASLAALGFRPRHFKRVESX

490 500 510

另外，ORF20ng-1显示出与鼠伤寒杆菌的一种毒力因子明显同源：

sp|P37169|MVIN_SALTY毒力因子MVIN pir||S40271 mviN蛋白-鼠伤寒杆菌gi|438252(Z26133)mviB基因产物[鼠伤寒杆菌]gnl|PID|d1005521(D25292)ORF2[鼠伤寒杆菌]长度＝524

评分＝1573(750.1位)，估计值＝1.1e-220，Sum P(2)＝1.1e-220

相同性＝309/467(66％)，阳性＝368/467(78％)

询问： 1 MNMLGALAKVGSLTMVSRVLGFVRDTVIARAFGAGMATDAFFVAFKLPNLLRRVFAEGAF 60

MN+L +LA V S+TM SRVLGF RD ++AR FGAGMATDAFFVAFKLPNLLRR+FAEGAF

目标： 14 MNLLKSLAAVSSMTMFSRVLGFARDAIVARIFGAGMATDAFFVAFKLPNLLRRIFAEGAF 73

询问： 61 AQAFVPILAEYKETRSKEATEAFIRHVAGMLSFVLIVVTALGILAAPWVIYVSAPGFTKD 120

+QAFVPILAEYK + +EAT F+ +V+G+L+ L VVT G+LAAPWVI V+APGF

目标： 74 SQAFVPILAEYKSKQGEEATRIFVAYVSGLLTLALAVVTVAGMLAAPWVIMVTAPGFADT 133

询问：121 ADKFQLSISLLRITFPYILLISLSSFVGSILNSYHKFGIPAFTPTFLNISFIVFALFFVP 180

ADKF L+ LLRITFPYILLISL+S VG+ILN++++F IPAF PTFLNIS I FALF P

目标：134 ADKFALTTQLLRITFPYILLISLASLVGAILNTWNRFSIPAFAPTFLNISMIGFALFAAP 193

询问：181 YFDPPVTALAWAVFVGGILQLGFQLPWLAKLGFLKLPKLNFKDAAVNRVMKQMAPAILGV 240

YF+PPV ALAWAV VGG+LQL +QLP+L K+G L LP++NF+D RV+KQM PAILGV

目标：194 YFNPPVLALAWAVTVGGVLQLVYQLPYLKKIGMLVLPRINFRDTGAMRVVKQMGPAILGV 253

询问：241 SVAQISLVINTIFASYLQSGSVSWMYYADRMMELRRGVLGAALGTILLPTLSKHSANQDT 300

SV+QISL+INTIFAS+L SGSVSWMYYADR+ME GVLG ALGTILLP+LSK A+ +

目标：254 SVSQISLIINTIFASFLASGSVSWMYYADRLMEFPSGVLGVALGTILLPSLSKSFASGNH 313

询问：301 EQFSALLDWGLRLCMLLTLPAAAGLAVLSFPLVATLFMYREFTLFDAQMTQHALIAYSFG 360

+++ L+DWGLRLC LL LP+A L +L+ PL +LF Y +FT FDA MTQ ALIAYS G

目标：314 DEYCRLMDWGLRLCFLLALPSAVALGILAKPLTVSLFQYGKFTAFDAAMTQRALIAYSVG 373

询问：361 LIGLIMIKVLASGFYARQNIKTPVKIAIFTLICTQLMNLAFIGPLKHAGLSLAIGLGACI 420

LIGLI++KVLA GFY+RQ+IKTPVKIAI TLI TQLMNLAFIGPLKHAGLSL+IGL AC+

目标：374 LIGLIVVKVLAPGFYSRQDIKTPVKIAIVTLIMTQLMNLAFIGPLKHAGLSLSIGLAACL 433

询问：421 NAGLLFFLLRKHGIYRPGRGWXXXXXXXXXXXXVMCGGLWAAQACLP 467

NA LL++ LRK I+ P GW VM L+ +P

目标：434 NASLLYWQLRKQNIFTPQPGWMWFLMRLIISVLVMAAVLFGVLHIMP 480

评分＝70(33.4位)，估计值＝1.1e-220，Sum P(2)＝1.1e-220

相同性＝14/41(34％)，阳性＝23/41(56％)

询问：469 EWAHAGGMRKAGQLCILIAVGGGLYFASLAALGFRPRHFKR 509

EW+ + + +L ++ G YFA+LA LGF+ + F R

目标：481 EWSQGSMLWRLLRLMAVVIAGIAAYFAALAVLGFKVKEFVR 521

根据该分析结果，包括与鼠伤寒杆菌的一种毒力因子有同源性，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白质可作为疫苗或诊断用的抗原，或用来产生抗体。

实施例15

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 123>：

1 atGATTAAAA TCAAAAAAGG TCTAAACCTG CCCATCGCGG GCAGACCGGA

51 GCAAGCCGTT tACGACGGCC CGGCCaTTAC CGAAGtCGCG TTGCTTGGCG

101 AAGAATATGC CGGTATGCGC CCCTCGATGA AAGTCAAGGA AGGCGATGCC

151 GTcAAAAAAG GCCAAGTGCT GTTTGAAGAC AAAAAGAATC CGGGCGTGGT

201 GTTTACTGCG CCGGCTTCAG GcAAAATCGC CGCGATTCAC CGTGGCGAAA

251 AGCGCGTACT TCAGTCAGTC GTGATTGCCG TTGAArGCAA CGACGAAATC

301 GAGTTTGAAC GCTACGCACC TGAAGCGCTG GCAAACTTAA GCGGCGAAGA

351 AGTGCGCCGC AACCTGATCC AATCCGGTTT GTGGACTGCG CTGCGCACCC

401 GTCCGTTCAG CAAAATTCCT GCCGTCGATG CCGAGCCGTT CGCCATCTTC

451 GTCAATGCGA tGGACACCAA TCCG..

它对应于氨基酸序列<SEQ ID 124；ORF22>：

1 MIKIKKGLNL PIAGRPEQAV YDGPAITEVA LLGEEYAGMR PSMKVKEGDA

51 VKKGQVLFED KKNPGVVFTA PASGKIAAIH RGEKRVLQSV VIAVEXNDEI

101 EFERYAPEAL ANLSGEEVRR NLIQSGLWTA LRTRPFSKIP AVDAEPFAIF

151 VNAMDTNP..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 125>：

1 ATGATTAAAA TCAAAAAAGG TCTAAACCTG CCCATCGCGG GCAGACCGGA

51 GCAAGCCGTT TACGACGGCC CGGCCATTAC CGAAGTCGCG TTGCTTGGCG

101 AAGAATATGC CGGTATGCGC CCCTCGATGA AAGTCAAGGA AGGCGATGCC

151 GTCAAAAAAG GCCAAGTGCT GTTTGAAGAC AAAAAGAATC CGGGCGTGGT

201 GTTTACTGCG CCGGCTTCAG GCAAAATCGC CGCGATTCAC CGTGGCGAAA

251 AGCGCGTACT TCAGTCAGTC GTGATTGCCG TTGAAGGCAA CGACGAAATC

301 GAGTTTGAAC GCTACGCACC TGAAGCGCTG GCAAACTTAA GCGGCGAAGA

351 AGTGCGCCGC AACCTGATCC AATCCGGTTT GTGGACTGCG CTGCGCACCC

401 GTCCGTTCAG CAAAATTCCT GCCGTCGATG CCGAGCCGTT CGCCATCTTC

451 GTCAATGCGA TGGACACCAA TCCGCTGGCT GCCGACCCTA CGGTCATTAT

501 CAAAGAAGCC GCCGAGGATT TCAAACGCGG CCTGTTGGTA TTGAGCCGTT

551 TGACCGAACG CAAAATCCAT GTTTGTAAGG CAGCTGGCGC AGACGTGCCG

601 TCTGAAAATG CTGCCAACAT CGAAACACAT GAATTCGGCG GCCCGCATCC

651 TGCCGGTTTG AGTGGCACGC ACATTCATTT CATCGAGCCG GTCGGCGCGA

701 ATAAAACCGT GTGGACCATC AATTATCAAG ATGTAATTAC CATTGGCCGT

751 TTGTTTGCAA CAGGCCGTCT GAACACCGAG CGCGTGATTG CCCTAGGTGG

801 TTCTCAAGTC AACAAACCGC GCCTCTTGCG TACCGTTTTG GGTGCGAAAG

851 TATCGCAAAT TACTGCGGGC GAATTGGTTG ACACAGACAA CCGCGTGATT

901 TCCGGTTCGG TATTGAACGG CGCGATTACA CAAGGCGCGC ACGATTATTT

951 GGGACGCTAC CACAATCAGA TTTCCGTTAT CGAAGAAGGC CGCAGCAAAG

1001 AGCTGTTCGG CTGGGTTGCG CCGCAGCCGG ACAAATACTC CATCACGCGT

1051 ACAACCCTCG GCCATTTCCT GAAAAACAAA CTCTTCAAGT TCAACACAGC

1101 CGTCAACGGC GGCGACCGCG CCATGGTGCC GATTGGTACT TACGAGCGCG

1151 TGATGCCCTT GGATATCCTG CCCACCCTGC TTTTGCGCGA TTTAATCGTC

1201 GGCGATACCG ACAGCGCGCA GGCATTGGGT TGCTTGGAAT TGGACGAAGA

1251 AGACCTCGCT TTGTGCAGCT TCGTCTGCCC GGGCAAATAC GAATACGGCC

1301 CGCTGTTGCG CAAAGTGCTG GAAACCATTG AGAAGGAAGG CTGA

它对应于氨基酸序列<SEQ ID 126；ORF22-1>：

1 MIKIKKGLNL PIAGRPEQAV YDGPAITEVA LLGEEYAGMR PSMKVKEGDA

51 VKKGQVLFED KKNPGVVFTA PASGKIAAIH RGEKRVLQSV VIAVEGNDEI

101 EFERYAPEAL ANLSGEEVRR NLIQSGLWTA LRTRPFSKIP AVDAEPFAIF

151 VNAMDTNPLA ADPTVIIKEA AEDFKRGLLV LSRLTERKIH VCKAAGADVP

201 SENAANIETH EFGGPHPAGL SGTHIHFIEP VGANKTVWTI NYQDVITIGR

251 LFATGRLNTE RVIALGGSQV NKPRLLRTVL GAKVSQITAG ELVDTDNRVI

301 SGSVLNGAIT QGAHDYLGRY HNQISVIEEG RSKELFGWVA PQPDKYSITR

351 TTLGHFLKNK LFKFNTAVNG GDRAMVPIGT YERVMPLDIL PTLLLRDLIV

401 GDTDSAQALG CLELDEEDLA LCSFVCPGKY EYGPLLRKVL ETIEKEG*

进一步的工作鉴定了脑膜炎奈瑟球菌菌株A中对应的基因<SEQ ID 127>：

1 ATGATTAAAA TCAAAAAAGG TCTAAACCTG CCCATCGCGG GCAGACCGGA

51 GCAAGTCATT TATGACGGGC CCGTCATTAC CGAAGTCGCG TTGCTTGGCG

101 AAGAATATGC CGGTATGCGC CCCTNGATGA AAGTCAAGGA AGGCGATGCC

151 GTCAAAAAAG GCCAAGTGCT GTTTGAAGAC AAAAAGNATC CGGGCGTGGT

201 GTTTACCGCG CCNGTTTCAG GCAAAATCGC CGCCATCCAT CGCGGCGAAA

251 AGCGCGTACT TCAGTCGGTC GTGATTGCCG TTGAAGGCAA CGACGAAATC

301 GAGTTCGAAC GCTACGCGCC CGAAGCGTTG GCAAACTTAA GCGGCGANGA

351 ANTNNGNNGC AATCTGATCC AATCCGGTTT GTGGACTGCG CTGCGTANCC

401 GTCCGTTCAG CAAAATCCCT GCCGTCGATG CCGAGCCGTT CGCCATCTTC

451 GTCAATGCGA TGGACACCAA TCCGCTNGCG GCAGACCCTG TGGTTGTGAT

501 CAAAGAAGCC GNCGANGATT TCAGACGANG TNTGCTGGTA TTGAGCCGTT

551 TGACCGAGCG TAAAATCCAT GTGTGTAAGG CAGCTGGCGC AGACGTGCCG

601 TCTGAAAATG CTGCCAACAT CGAAACACAT GAATTCGGCG GCCCGCATCC

651 GGCCGGTTTG AGTGGCACGC ACATTCATTT CATTGAGCCG GTCGGTGCAA

701 ACAAAACCGT TTGGACCATC AATTATCAAG ATGTAATTGC CATCGGACGT

751 TTGTTTGCAA CAGGCCGTCT GAACACCGAG CGCGTGATTG CTTTGGGTGG

801 TTCTCAAGTC AACAAACCAC GCCTCTTGCG TACCGTTTTG GGTGCGAAAG

851 TATCGCAAAT TACTGCGGGC GAATTGGTTG ACGCAGACAA CCGCGTGATT

901 TCCGGTTCGG TATTGAACGG CGCGATTACA CAAGGCGCGC ACGATTATTT

951 GGGACGCTAC CACAATCAGA TTTCCGTTAT CGAAGAAGGC CGCAGCAAAG

1001 AGCTGTTCGG CTGGGTTGCG CCGCAGCCGG ACAAATACTC CATCACGCGT

1051 ACGACCCTCG GCCATTTCCT GAAAAACAAA CTCTTCAAGT TCACGACAGC

1101 CGTCAACGGT GGCGACCGCG CCATGGTGCC GATTGGTACT TACGAGCGCG

1151 TAATGCCGCT AGACATCCTG CCTACCCTGC TTTTGCGCGA TTTAATCGTC

1201 GGCGATACCG ACAGCGCGCA AGCATTGGGT TGCTTGGAAT TGGACGAAGA

1251 AGACCTCGCT TTGTGCAGCT TCGTCTGCCC GGGCAAATAC GAATANGGCC

1301 CGCTGTTGCG TAAGGTGCTG GAAACCNTTG AGAAGGAAGG CTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 128；ORF22a>：

1 MIKIKKGLNL PIAGRPEQVI YDGPVITEVA LLGEEYAGMR PXMKVKEGDA

51 VKKGQVLFED KKXPGVVFTA PVSGKIAAIH RGEKRVLQSV VIAVEGNDEI

101 EFERYAPEAL ANLSGXEXXX NLIQSGLWTA LRXRPFSKIP AVDAEPFAIF

151 VNAMDTNPLA ADPVVVIKEA XXDFRRXXLV LSRLTERKIH VCKAAGADVP

201 SENAANIETH EFGGPHPAGL SGTHIHFIEP VGANKTVWTI NYQDVIAIGR

251 LFATGRLNTE RVIALGGSQV NKPRLLRTVL GAKVSQITAG ELVDADNRVI

301 SGSVLNGAIT QGAHDYLGRY HNQISVIEEG RSKELFGWVA PQPDKYSITR

351 TTLGHFLKNK LFKFTTAVNG GDRAMVPIGT YERVMPLDIL PTLLLRDLIV

401 GDTDSAQALG CLELDEEDLA LCSFVCPGKY EXGPLLRKVL ETXEKEG*

最初鉴定的菌株B部分序列(ORF22)与ORF22a在重叠的158个氨基酸内显示出有94.2％的相同性：

10 20 30 40 50 60

orf22.pep MIKIKKGLNLPIAGRPEQAVYDGPAITEVALLGEEYAGMRPSMKVKEGDAVKKGQVLFED

||||||||||||||||||::||||:|||||||||||||||| ||||||||||||||||||

orf22a MIKIKKGLNLPIAGRPEQVIYDGPVITEVALLGEEYAGMRPXMKVKEGDAVKKGQVLFED

10 20 30 40 50 60

70 80 90 100 110 120

orf22.pep KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEXNDEIEFERYAPEALANLSGEEVRR

|| ||||||||:||||||||||||||||||||||| ||||||||||||||||||| |

orf22a KKXPGVVFTAPVSGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYAPEALANLSGXEXXX

70 80 90 100 110 120

130 140 150

orf22.pep NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNP

||||||||||||:|||||||||||||||||||||||||

orf22a NLIQSGLWTALRXRPFSKIPAVDAEPFAIFVNAMDTNPLAADPVVVIKEAXXDFRRXXLV

130 140 150 160 170 180

完整的菌株B序列(ORF22-1)和ORF22a在447个氨基酸的重叠区内显示出有94.9％的相同性：

10 20 30 40 50 60

orf22a.pep MIKIKKGLNLPIAGRPEQVIYDGPVITEVALLGEEYAGMRPXMKVKEGDAVKKGQVLFED

||||||||||||||||||::||||:|||||||||||||||| ||||||||||||||||||

orf22-1 MIKIKKGLNLPIAGRPEQAVYDGPAITEVALLGEEYAGMRPSMKVKEGDAVKKGQVLFED

10 20 30 40 50 60

70 80 90 100 110 120

orf22a.pep KKXPGVVFTAPVSGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYAPEALANLSGXEXXX

|| ||||||||:||||||||||||||||||||||||||||||||||||||||||| |

orf22-1 KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYAPEALANLSGEEVRR

70 80 90 100 110 120

130 140 150 160 170 180

orf22a.pep NLIQSGLWTALRXRPFSKIPAVDAEPFAIFVNAMDTNPLAADPVVVIKEAXXDFRRXXLV

||||||||||||:||||||||||||||||||||||||||||||:|:|||| ||:| ||

orf22-1 NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNPLAADPTVIIKEAAEDFKRGLLV

130 140 150 160 170 180

190 200 210 220 230 240

orf22a.pep LSRLTERKIHVCKAAGADVPSENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTVWTI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22-1 LSRLTERKIHVCKAAGADVPSENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTVWTI

190 200 210 220 230 240

250 260 270 280 290 300

orf22a.pep NYQDVIAIGRLFATGRLNTERVIALGGSQVNKPRLLRTVLGAKVSQITAGELVDADNRVI

||||||:|||||||||||||||||||||||||||||||||||||||||||||||:|||||

orf22-1 NYQDVITIGRLFATGRLNTERVIALGGSQVNKPRLLRTVLGAKVSQITAGELVDTDNRVI

250 260 270 280 290 300

310 320 330 340 350 360

orf22a.pep SGSVLNGAITQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFLKNK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22-1 SGSVLNGAITQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFLKNK

310 320 330 340 350 360

370 380 390 400 410 420

orf22a.pep LFKFTTAVNGGDRAMVPIGTYERVMPLDILPTLLLRDLIVGDTDSAQALGCLELDEEDLA

||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22-1 LFKFNTAVNGGDRAMVPIGTYERVMPLDILPTLLLRDLIVGDTDSAQALGCLELDEEDLA

370 380 390 400 410 420

430 440

orf22a.pep LCSFVCPGKYEXGPLLRKVLETXEKEGX

||||||||||| |||||||||| |||||

orf22-1 LCSFVCPGKYEYGPLLRKVLETIEKEGX

430 440

进一步的工作鉴定了淋病奈瑟球菌的部分基因序列<SEQ ID 129>，它编码下列氨基酸序列<SEQ ID 130；ORF22ng>：

1 MIKIKKGLNL PIAGRPEQVI YDGPAITEVA LLGEEYVGMR PSMKIKEGEA

51 VKKGQVLFED KKNPGVVFTA PASGKIAAIH RGEKRVLQSV VIAVEGNDEI

101 EFERYVPEAL AKLSSEKVRR NLIQSGLWTA LRTRPFSKIP AVDAEPFAIF

151 VNAMDTNPLA ADPTVIIKEA AEDFKRGLLV LSRLTERKIH VCKAAGADVP

201 SENAANIETH EFGGPHPAGL SGTHIHFIEP VGANKTVWTI NYQDVIAIGR

251 LFVTGRLNTE RVVALGGLQV NKPRLLRTVL GAKVSQLTAG ELVDADNRVI

301 SGSVLNGAIA QGAHDYLGRY HN*

进一步的工作鉴定了完整的淋球菌基因<SEQ ID 131>：

1 ATGATTAAAA TCAAAAAAGG TCTAAATCTG CCCATCGCGG GCAGACCGGA

51 GCAAGTCATT TATGACGGCC CGGCCATTAC CGAAGTCGCG TTGCTTGGCG

101 AAGAATATGT CGGCATGCGC CCCTCGATGA AAATCAAGGA AGGTGAAGCC

151 GTCAAAAAAG GCCAAGTGCT GTTTGAAGAC AAAAAGAATC CGGGCGTAGT

201 ATTTACTGCG CCGGCTTCAG GCAAAATCGC CGCTATTCAC CGTGGCGAAA

251 AGCGCGTACT TCAGTCAGTC GTGATTGCCG TTGAAGGCAA CGACGAAATC

301 GAGTTCGAAC GCTACGTACC TGAAGCGCTG GCAAAATTGA GCAGCGAAAA

351 AGTGCGCCGC AACCTGATTC AATCAGGCTT ATGGACTGCG CTTCGCACCC

401 GTCCGTTCAG CAAAATCCCT GCCGTAGATG CCGAGCCGTT CGCCATCTTC

451 GTCAATGCGA TGGACACCAA TCCGCTGGCT GCCGACCCTA CGGTCATCAT

501 CAAAGAAGCC GCCGAAGACT TCAAACGCGG CCTGTTGGTA TTGAGCCGCC

551 TGACCGAACG TAAAATCCAT GTGTGTAAAG CAGCAGGCGC AGACGTGCCG

601 TCTGAAAATG CTGCCAATAT CGAAACACAT GAATTTGGCG GCCCGCATCC

651 TGCCGGCTTG AGTGGCACGC ACATTCATTT CATCGAGCCA GTCGGCGCGA

701 ATAAAACCGT GTGGACCATC AATTATCAAG ACGTGATTGC TATCGGACGT

751 TTGTTCGTAA CAGGCCGTCT GAATACCGAG CGCGTGGTTG CCTTGGGCGG

801 CCTGCAAGTC AACAAACCGC GCCTCTTGCG TACCGTTTTG GGTGCGAAGG

851 TGTCTCAACT TACCGCCGGC GAATTGGTTG ACGCGGACAA CCGCGTGATT

901 TCCGGTTCGG TATTGAACGG TGCGATTGCA CAAGGCGCGC ATGATTATTT

951 GGGACGCTAC CACAATCAGA TTTCCGTTAT CGAAGAAGGC CGCAGCAAAG

1001 AGCTGTTCGG CTGGGTTGCG CCGCAGCCGG ACAAATACTC CATCACGCGC

1051 ACCACTCTCG GCCATTTCCT AAAAAACAAA CTCTTCAAGT TCACGACAGC

1101 CGTCAACGGC GGCGACCGCG CCATGGTACC GATCGGCACT TATGAGCGCG

1151 TAATGCCGTT GGACATCCTG CCTACCTTGC TTTTGCGCGA TTTAATCGTC

1201 GGCGATACCG ACAGCGCGCA GGCTTTGGGT TGCTTGGAAT TGGACGAAGA

1251 AGACCTCGCT TTGTGCAGCT TCGTCTGCCC GGGCAAATAC GAATACGGCC

1301 CGCTGTTGCG CAAAGTGCTG GAAACCATTG AGAAGGAAGG CTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 132；ORF22ng-1>：

1 MIKIKKGLNL PIAGRPEQVI YDGPAITEVA LLGEEYVGMR PSMKIKEGEA

51 VKKGQVLFED KKNPGVVFTA PASGKIAAIH RGEKRVLQSV VIAVEGNDEI

101 EFERYVPEAL AKLSSEKVRR NLIQSGLWTA LRTRPFSKIP AVDAEPFAIF

151 VNAMDTNPLA ADPTVIIKEA AEDFKRGLLV LSRLTERKIH VCKAAGADVP

201 SENAANIETH EFGGPHPAGL SGTHIHFIEP VGANKTVWTI NYQDVIAIGR

251 LFVTGRLNTE RVVALGGLQV NKPRLLRTVL GAKVSQLTAG ELVDADNRVI

301 SGSVLNGAIA QGAHDYLGRY HNQISVIEEG RSKELFGWVA PQPDKYSITR

351 TTLGHFLKNK LFKFTTAVNG GDRAMVPIGT YERVMPLDIL PTLLLRDLIV

401 GDTDSAQALG CLELDEEDLA LCSFVCPGKY EYGPLLRKVL ETIEKEG*

最初鉴定的菌株B部分序列(ORF22)与ORF22ng在重叠的158个氨基酸内显示出有93.7％的相同性：

orf22.pep MIKIKKGLNLPIAGRPEQAVYDGPAITEVALLGEEYAGMRPSMKVKEGDAVKKGQVLFED 60

||||||||||||||||||::||||||||||||||||:|||||||:|||:|||||||||||

orf22ng MIKIKKGLNLPIAGRPEQVIYDGPAITEVALLGEEYVGMRPSMKIKEGEAVKKGQVLFED 60

orf22.pep KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEXNDEIEFERYAPEALANLSGEEVRR 120

||||||||||||||||||||||||||||||||||| |||||||||:|||||:||:|:|||

orf22ng KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYVPEALAKLSSEKVRR 120

orf22.pep NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNP 158

||||||||||||||||||||||||||||||||||||||

orf22ng NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNPLAADPTVIIKEAAEDFKRGLLV 180

菌株B(ORF22-1)和淋球菌(ORF22ng)的完整序列在447个氨基酸的重叠区内显示出有96.2％的相同性：

10 20 30 40 50 60

orf22-1.pep MIKIKKGLNLPIAGRPEQAVYDGPAITEVALLGEEYAGMRPSMKVKEGDAVKKGQVLFED

||||||||||||||||||::||||||||||||||||:|||||||:|||:|||||||||||

orf22ng-1 MIKIKKGLNLPIAGRPEQVIYDGPAITEVALLGEEYVGMRPSMKIKEGEAVKKGQVLFED

10 20 30 40 50 60

70 80 90 100 110 120

orf22-1.pep KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYAPEALANLSGEEVRR

|||||||||||||||||||||||||||||||||||||||||||||:|||||:||:|:|||

orf22ng-1 KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYVPEALAKLSSEKVRR

70 80 90 100 110 120

130 140 150 160 170 180

orf22-1.pep NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNPLAADPTVIIKEAAEDFKRGLLV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22ng-1 NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNPLAADPTVIIKEAAEDFKRGLLV

130 140 150 160 170 180

190 200 210 220 230 240

orf22-1.pep LSRLTERKIHVCKAAGADVPSENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTVWTI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22ng-1 LSRLTERKIHVCKAAGADVPSENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTVWTI

190 200 210 220 230 240

250 260 270 280 290 300

orf22-1.pep NYQDVITIGRLFATGRLNTERVIALGGSQVNKPRLLRTVLGAKVSQITAGELVDTDNRVI

||||||:|||||:|||||||||:|||| ||||||||||||||||||:|||||||:|||||

orf22ng-1 NYQDVIAIGRLFVTGRLNTERVVALGGLQVNKPRLLRTVLGAKVSQLTAGELVDADNRVI

250 260 270 280 290 300

310 320 330 340 350 360

orf22-1.pep SGSVLNGAITQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFLKNK

|||||||||:||||||||||||||||||||||||||||||||||||||||||||||||||

orf22ng-1 SGSVLNGAIAQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFLKNK

310 320 330 340 350 360

370 380 390 400 410 420

orf22-1.pep LFKFNTAVNGGDRAMVPIGTYERVMPLDILPTLLLRDLIVGDTDSAQALGCLELDEEDLA

||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf22ng-1 LFKFTTAVNGGDRAMVPIGTYERVMPLDILPTLLLRDLIVGDTDSAQALGCLELDEEDLA

370 380 390 400 410 420

430 440

orf22-1.pep LCSFVCPGKYEYGPLLRKVLETIEKEGX

||||||||||||||||||||||||||||

orf22ng-1 LCSFVCPGKYEYGPLLRKVLETIEKEGX

430 440

这些序列的计算机分析给出了下列结果：

与大叶性肺炎放线杆菌的48kDa外膜蛋白(登录号U24492)的同源性

ORF22和该48kDa蛋白在158个氨基酸的重叠区内有72％的氨基酸相同性：

Orf22 1 MIKIKKGLNLPIAGRPEQAVYDGPAITEVALLGEEYAGMRPSMKVKEGDAVKKGQVLFED 60

MI IKKGL+LPIAG P Q+++G + EVA+LGEEY GMRPSMKV+EGD VKKGQVLFED

48kDa 1 MITIKKGLDLPIAGTPAQVIHNGNTVNEVAMLGEEYVGMRPSMKVREGDVVKKGQVLFED 60

orf22 61 KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEXNDEIEFERYAPEALANLSGEEVRR 120

KKNPGVVFTAPASG + I+RGEKRVLQSVVI VE +++I F RY LA+LS E+V++

48kDa 61 KKNPGVVFTAPASGTVVTINRGEKRVLQSVVIKVEGDEQITFTRYEAAQLASLSAEQVKQ 120

orf22 121 NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNP 158

NLI+SGLWTA RTRPFSK+PA+DA P +IFVNAMDTNP

48kDa 121 NLIESGLWTAFRTRPFSKVPALDAIPSSIFVNAMDTNP 158

ORF22a还显示出与48kDa的大叶性肺炎放线杆菌蛋白有同源性：

gi|1185395(U24492)48kDa外膜蛋白[大叶性肺炎放线杆菌]长度＝449

评分＝530位(1351)，估计值＝e-150

相同性＝274/450(60％)，阳性＝323/450(70％)，空隙＝4/450(0％)

询问：1 MIKIKKGLNLPIAGRPEQVIYDGPVITEVALLGEEYAGMRPXMKVKEGDAVKKGQVLFED 60

MI IKKGL+LPIAG P QVI++G + EVA+LGEEY GMRP MKV+EGD VKKGQVLFED

目标：1 MITIKKGLDLPIAGTPAQVIHNGNTVNEVAMLGEEYVGMRPSMKVREGDVVKKGQVLFED 60

询问：61 KKXPGVVFTAPVSGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYAPEALANLSGXEXXX 120

KK PGVVFTAP SG + I+RGEKRVLQSVVI VEG+++I F RY LA+LS +

目标：61 KKNPGVVFTAPASGTVVTINRGEKRVLQSVVIKVEGDEQITFTRYEAAQLASLSAEQVKQ 120

询问：121 NLIQSGLWTALRXRPFSKIPAVDAEPFAIFVNAMDTNPLAADPVVVIKEAXXDFRRXXLV 180

NLI+SGLWTA R RPFSK+PA+DA P +IFVNAMDTNPLAADP VV+KE DF+ V

目标：121 NLIESGLWTAFRTRPFSKVPALDAIPSSIFVNAMDTNPLAADPEVVLKEYETDFKDGLTV 180

询问：181 LSRL--TERKIHVCKAAGADVP-SENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTV 237

L+RL ++ +++CK A +++P S I F G HPAGL GTHIHF++PVGA K V

目标：181 LTRLFNGQKPVYLCKDADSNIPLSPAIEGITIKSFSGVHPAGLVGTHIHFVDPVGATKQV 240

询问：238 WTINYQDVIAIGRLFATGRLNTERVIALGGSQVNKPRLLRTVLGAKVSQITAGELVDADN 297

W +NYQDVIAIG+LF TG L T+R+I+L G QV PRL+RT LGA+SQ+TA EL +N

目标：241 WHLNYQDVIAIGKLFTTGELFTDRIISLAGPQVKNPRLVRTRLGANLSQLTANELNAGEN 300

询问：298 RVISGSVLNGAITQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFL 357

RVISGSVL+GA G DYLGRY Q+SV+ EGR KELFGW+ P DK+SITRT LGHF

目标：301 RVISGSVLSGATAAGPVDYLGRYALQVSVLAEGREKELFGWIMPGSDKFSITRTVLGHFG 360

询问：358 KNKLFKFTTAVNGGDRAMVPIGTYERVMXXXXXXXXXXXXXXVGDTDSAQXXXXXXXXXX 417

K KLF FTTAV+GG+RAMVPIG YERVM GDTDSAQ

目标：361 K-KLFNFTTAVHGGERAMVPIGAYERVMPLDIIPTLLLRDLAAGDTDSAQNLGCLELDEE 419

询问：418 XXXXXSFVCPGKYEXGPLLRKVLETXEKEG 447

++VCPGK GP+LR LE EKEG

ORF22ng-1还显示出与大叶性肺炎放线杆菌的OMP有同源性：

gi|1185395(U24492)48kDa外膜蛋白[大叶性肺炎放线杆菌]长度＝449

评分＝555位(1414)，估计值＝e-157

相同性＝284/450(63％)，阳性＝337/450(74％)，空隙＝4/450(0％)

询问：27 MIKIKKGLNLPIAGRPEQVIYDGPAITEVALLGEEYVGMRPSMKIKEGEAVKKGQVLFED 86

MI IKKGL+LPIAG P QVI++G + EVA+LGEEYVGMRPSMK++EG+ VKKGQVLFED

目标：1 MITIKKGLDLPIAGTPAQVIHNGNTVNEVAMLGEEYVGMRPSMKVREGDVVKKGQVLFED 60

询问：87 KKNPGVVFTAPASGKIAAIHRGEKRVLQSVVIAVEGNDEIEFERYVPEALAKLSSEKVRR 146

KKNPGVVFTAPASG + I+RGEKRVLQSVVI VEG+++I F RY LA LS+E+V++

目标：61 KKNPGVVFTAPASGTVVTINRGEKRVLQSVVIKVEGDEQITFTRYEAAQLASLSAEQVKQ 120

询问：147 NLIQSGLWTALRTRPFSKIPAVDAEPFAIFVNAMDTNPLAADPTVIIKEAAEDFKRGLLV 206

NLI+SGLWTA RTRPFSK+PA+DA P +IFVNAMDTNPLAADP V++KE DFK GL V

目标：121 NLIESGLWTAFRTRPFSKVPALDAIPSSIFVNAMDTNPLAADPEVVLKEYETDFKDGLTV 180

询问：207 LSRL--TERKIHVCKAAGADVP-SENAANIETHEFGGPHPAGLSGTHIHFIEPVGANKTV 263

L+RL ++ +++CK A +++P S I F G HPAGL GTHIHF++PVGA K V

目标：181 LTRLFNGQKPVYLCKDADSNIPLSPAIEGITIKSFSGVHPAGLVGTHIHFVDPVGATKQV 240

询问：264 WTINYQDVIAIGRLFVTGRLNTERVVALGGLQVNKPRLLRTVLGAKVSQLTAGELVDADN 323

W+NYQDVIAIG+LF TG L T+R+++L G QV PRL+RT LGA +SQLTA EL +N

目标：241 WHLNYQDVIAIGKLFTTGELFTDRIISLAGPQVKNPRLVRTRLGANLSQLTANELNAGEN 300

询问：324 RVISGSVLNGAIAQGAHDYLGRYHNQISVIEEGRSKELFGWVAPQPDKYSITRTTLGHFL 383

RVISGSVL+GA A G DYLGRY Q+SV+EGR KELFGW+P DK+SITRT LGHF

目标：301 RVISGSVLSGATAAGPVDYLGRYALQVSVLAEGREKELFGWIMPGSDKFSITRTVLGHFG 360

询问：384 KNKLFKFTTAVNGGDRAMVPIGTYERVMXXXXXXXXXXXXXXVGDTDSAQXXXXXXXXXX 443

K KLF FTTAV+GG+RAMVPIG YERVM GDTDSAQ

目标：361 K-KLFNFTTAVHGGERAMVPIGAYERVMPLDIIPTLLLRDLAAGDTDSAQNLGCLELDEE 419

询问：444 XXXXXSFVCPGKYEYGPLLRKVLETIEKEG 473

++VCPGK YGP+LR LE IEKEG

目标：420 DLALCTYVCPGKNNYGPMLRAALEKIEKEG 449

根据该分析结果，包括与大叶性肺炎放线杆菌外膜蛋白有同源性，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

将ORF22-1(35.4kDa)如上所述克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图5A显示了GST-融合蛋白的亲和纯化结果，图5B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST-融合蛋白来免疫小鼠，用小鼠血清进行ELISA(阳性结果)和FACS分析(图5C)。这些结果确认ORF22-1是一种外露蛋白，且是一种有用的免疫原。

实施例16

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 133>：

1 ..GCGnCGnAAA TCATCCATCC CC..nACGTC GTAGGCCCTG AAGCCAACTG

51 GTTTTTTATG GTAGCCAGTA CGTTTGTGAT TGCTTTGATT GGTTATTTTG

101 TTACTGAAAA AATCGTCGAA CCGCAATTGG GCCCTTATCA ATCAGATTTG

151 TCACAAGAAG AAAAAGACAT TCGGCATTCC AATGAAATCA CGCCTTTGGA

201 ATATAAAGGA TTAATTTGGG CTGGCGTGGT GTTTGTTGCC TTATCCGCCC

251 TATTGGCTTG GAGCATCGTC CCTGCCGACG GTATTTTGCG TCATCCTGAA

301 ACAGGATTGG TTTCCGGTTC GCCGTTTTTA AAATCGATTG TTGTTTTTAT

351 TTTCTTGTTG TTTGCACTGC CGGGCATTGT TTATGGCCGG GTAACCCGAA

401 GTTTGCGCGG CGAACAGGAA GTCGTTAATG CGmyGGCCGA ATCGATGAGT

451 ACTCTGGsGC TTTmTTTGsw CAkcATCTTT TTTGCCGCAC AGTTTGTCGC

501 ATTTTTTAAT TGGACGAATA TTGGGCAATA TATTGCCGTT AAAGGGGCGA

551 CGTTCTTAAA AGAAGTCGGC TTGGGCGGCA GCGTGTTGTT TATCGGTTTT

601 ATTTTAATTT GTGCTTTTAT CAATCTGATG ATAGGCTCCG CCTCCGCGCA

651 ATGGGCGGTA ACTGCGCCGA TTTTCGTCCC TATGCTGATG TTGGCCGGCT

701 ACGCGCCCGA AGTCATTCAA GCCGCTTACC GCATCGGTGA TTCCGTTACC

751 AATATTATTA CGCCGATGAT GAGTTATTTC GGGCTGATTA TGGCGACGGT

801 GrkCmmmTAC AAAAAAGATG CGGGCGTGGG TaCGcTGATT wCTATGATGT

851 TGCCGTATTC CGCTTTCTTC TTGATTGCgT GGATTGCCTT ATTCTGCATT

901 TGGGTATTTg TTTTGGGCCT GCCCGTCGGT CCCGGCGCGC CCACATTCTA

951 TCCCGCACCT TAA

它对应于氨基酸序列<SEQ ID 134；ORF12>：

1 ..AXXIIHPXXV VGPEANWFFM VASTFVIALI GYFVTEKIVE PQLGPYQSDL

51 SQEEKDIRHS NEITPLEYKG LIWAGVVFVA LSALLAWSIV PADGILRHPE

101 TGLVSGSPFL KSIVVFIFLL FALPGIVYGR VTRSLRGEQE VVNAXAESMS

151 TLXLXLXXIF FAAQFVAFFN WTNIGQYIAV KGATFLKEVG LGGSVLFIGF

201 ILICAFINLM IGSASAQWAV TAPIFVPMLM LAGYAPEVIQ AAYRIGDSVT

251 NIITPMMSYF GLIMATVXXY KKDAGVGTLI XMMLPYSAFF LIAWIALFCI

301 WVFVLGLPVG PGAPTFYPAP*

进一步的序列分析揭示了完整的DNA序列<SEQ ID 135>是：

1 ATGAGTCAAA CCGATACGCA ACGGGACGGA CGATTTTTAC GCACAGTCGA

51 ATGGCTGGGC AATATGTTGC CGCATCCGGT TACGCTTTTT ATTATTTTCA

101 TTGTGTTATT GCTGATTGCC TCTGCCGTCG GTGCGTATTT CGGACTATCC

151 GTCCCCGATC CGCGCCCTGT TGGTGCGAAA GGACGTGCCG ATGACGGTTT

201 GATTTACATT GTCAGCCTGC TCAATGCCGA CGGTTTTATC AAAATCCTGA

251 CGCATACCGT TAAAAATTTC ACCGGTTTCG CGCCGTTGGG AACGGTGTTG

301 GTTTCTTTAT TGGGCGTGGG GATTGCGGAA AAATCGGGCT TGATTTCCGC

351 ATTAATGCGC TTATTGCTCA CAAAATCGCC ACGCAAACTC ACTACTTTTA

401 TGGTTGTTTT TACAGGGATT TTATCTAATA CCGCTTCTGA ATTGGGCTAT

451 GTCGTCCTAA TCCCTTTGTC CGCCATCATC TTTCATTCCC TCGGCCGCCA

501 TCCGCTTGCC GGTCTGGCTG CGGCTTTCGC CGGCGTTTCG GGCGGTTATT

551 CGGCCAATCT GTTCTTAGGC ACAATCGATC CGCTCTTGGC AGGCATCACC

601 CAACAGGCGG CGCAAATCAT CCATCCCGAC TACGTCGTAG GCCCTGAAGC

651 CAACTGGTTT TTTATGGTAG CCAGTACGTT TGTGATTGCT TTGATTGGTT

701 ATTTTGTTAC TGAAAAAATC GTCGAACCGC AATTGGGCCC TTATCAATCA

751 GATTTGTCAC AAGAAGAAAA AGACATTCGG CATTCCAATG AAATCACGCC

801 TTTGGAATAT AAAGGATTAA TTTGGGCTGG CGTGGTGTTT GTTGCCTTAT

851 CCGCCCTATT GGCTTGGAGC ATCGTCCCTG CCGACGGTAT TTTGCGTCAT

901 CCTGAAACAG GATTGGTTTC CGGTTCGCCG TTTTTAAAAT CGATTGTTGT

951 TTTTATTTTC TTGTTGTTTG CACTGCCGGG CATTGTTTAT GGCCGGGTAA

1001 CCCGAAGTTT GCGCGGCGAA CAGGAAGTCG TTAATGCGAT GGCCGAATCG

1051 ATGAGTACTC TGGGGCTTTA TTTGGTCATC ATCTTTTTTG CCGCACAGTT

1101 TGTCGCATTT TTTAATTGGA CGAATATTGG GCAATATATT GCCGTTAAAG

1151 GGGCGACGTT CTTAAAAGAA GTCGGCTTGG GCGGCAGCGT GTTGTTTATC

1201 GGTTTTATTT TAATTTGTGC TTTTATCAAT CTGATGATAG GCTCCGCCTC

1251 CGCGCAATGG GCGGTAACTG CGCCGATTTT CGTCCCTATG CTGATGTTGG

1301 CCGGCTACGC GCCCGAAGTC ATTCAAGCCG CTTACCGCAT CGGTGATTCC

1351 GTTACCAATA TTATTACGCC GATGATGAGT TATTTCGGGC TGATTATGGC

1401 GACGGTGATC AAATACAAAA AAGATGCGGG CGTGGGTACG CTGATTTCTA

1451 TGATGTTGCC GTATTCCGCT TTCTTCTTGA TTGCGTGGAT TGCCTTATTC

1501 TGCATTTGGG TATTTGTTTT GGGCCTGCCC GTCGGTCCCG GCGCGCCCAC

1551 ATTCTATCCC GCACCTTAA

它对应于氨基酸序列<SEQ ID 136；ORF12-1>：

1 MSQTDTQRDG RFLRTVEWLG NMLPHP VTLF IIFIVLLLIA SAVGAYFGLS

51 VPDPRPVGAK GRADDG LIYI VSLLNADGFI KILTHTVKNF TG FAPLGTVL

101 VSLLGVGIAE KSGLISALMR LLLTKSPRKL TTFMVVFTGI LSNTASE LGY

151 VVLIPLSAII FHSLGRHPLA GLAAAFAGVS GGYSANLFLG TIDPLLAGIT

201 QQAAQIIHPD YVVGPEANW F FMVASTFVIA LIGYFVTEKI VEPQLGPYQS

251 DLSQEEKDIR HSNEITPLEY KGLIW AGVVF VALSALLAWS IVPADGILRH

301 PETGLVSGSP FLKS IVVFIF LLFALPGIVY GRVTRSLRGE QEVVNAMAES

351 MST LGLYLVI IFFAAQFVAF FNWTNIGQYI AVKGATFLKE VGLGGS VLFI

401 GFILICAFIN LMIGSASAQW AVTAPIFVPM LMLAGYAPEV IQAAYRIGDS

451 VTN IITPMMS YFGLIMATVI KYKKDAGVGT LISMMLPYSA FFLIAWIALF

501 CIWVFVLGLP VGPGAPTFYP AP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF12与脑膜炎奈瑟球菌菌株A的ORF(ORF12a)在重叠的320个氨基酸内显示出有96.3％的相同性：

10 20 30

orf12.pep AXXIIHPXXVVGPEANWFFMVASTFVIALI

| |||| |||||||||||||||||||||

orf12a AAAFAGVSGGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMVASTFVIALI

180 190 200 210 220 230

40 50 60 70 80 90

orf12.pep GYFVTEKIVEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12a GYFVTEKIVEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIV

240 250 260 270 280 290

100 110 120 130 140 150

orf12.pep PADGILRHPETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAXAESMS

|||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||

orf12a PADGILRHPETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAMAESMS

300 310 320 330 340 350

160 170 180 190 200 210

orf12.pep TLXLXLXXIFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLM

|| | | ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12a TLGLYLVIIFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLM

360 370 380 390 400 410

220 230 240 250 260 270

orf12.pep IGSASAQWAVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVXXY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||| |

orf12a IGSASAQWAVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKY

420 430 440 450 460 470

280 290 300 310 320

orf12.pep KKDAGVGTLIXMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAPX

|||||||||| ||||||||||||||||||||||||||||||||||||||||

orf12a KKDAGVGTLISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAPX

480 490 500 510 520

全长ORF12a核苷酸序列<SEQ ID 137>是：

1 ATGAGTCAAA CCGATACGCA ACGGGACGGA CGATTTTTAC GCACAGTCGA

51 ATGGCTGGGC AATATGTTGC CGCACCCGGT TACGCTTTTT ATTATTTTCA

101 TTGTGTTATT GCTGATTGCC TCTGCCGCCG GTGCGTATTT CGGACTATCC

151 GTCCCCGATC CGCGCCCTGT TGGTGCGAAA GGACGTGCCG ATGACGGTTT

201 GATTCACGTT GTCAGCCTGC TCGATGCTGA CGGTTTGATC AAAATCCTGA

251 CGCATACCGT TAAAAATTTC ACCGGTTTCG CGCCGTTGGG AACGGTGTTG

301 GTTTCTTTAT TGGGCGTGGG GATTGCGGAA AAATCGGGCT TGATTTCCGC

351 ATTAATGCGC TTATTGCTCA CAAAATCTCC ACGCAAACTC ACTACTTTTA

401 TGGTTGTTTT TACAGGGATT TTATCTAATA CCGCTTCTGA ATTGGGCTAT

451 GTCGTCCTAA TCCCTTTGTC CGCCATCATC TTTCATTCCC TCGGCCGCCA

501 TCCGCTTGCC GGTCTGGCTG CGGCTTTCGC CGGCGTTTCG GGCGGTTATT

551 CGGCCAATCT GTTCTTAGGC ACAATCGATC CGCTCTTGGC AGGCATCACC

601 CAACAGGCGG CGCAAATCAT CCATCCCGAC TACGTCGTAG GCCCTGAAGC

651 CAACTGGTTT TTTATGGTAG CCAGTACGTT TGTGATTGCT TTGATTGGTT

701 ATTTTGTTAC TGAAAAAATC GTCGAACCGC AATTGGGCCC TTATCAATCA

751 GATTTGTCAC AAGAAGAAAA AGACATTCGA CATTCCAATG AAATCACGCC

801 TTTGGAATAT AAAGGATTAA TTTGGGCTGG CGTGGTGTTT GTTGCCTTAT

851 CCGCCCTATT GGCTTGGAGC ATCGTCCCTG CCGACGGTAT TTTGCGTCAT

901 CCTGAAACAG GATTGGTTTC CGGTTCGCCG TTTTTAAAAT CAATTGTTGT

951 TTTTATTTTC TTGTTGTTTG CACTGCCGGG CATTGTTTAT GGCCGGGTAA

1001 CCCGAAGTTT GCGCGGCGAA CAGGAAGTCG TTAATGCGAT GGCCGAATCG

1051 ATGAGTACTC TGGGGCTTTA TTTGGTCATC ATCTTTTTTG CCGCACAGTT

1101 TGTCGCATTT TTTAATTGGA CGAATATTGG GCAATATATT GCCGTTAAAG

1151 GGGCGACGTT CTTAAAAGAA GTCGGCTTGG GCGGCAGCGT GTTGTTTATC

1201 GGTTTTATTT TAATTTGTGC TTTTATCAAT CTGATGATAG GCTCCGCCTC

1251 CGCGCAATGG GCGGTAACTG CGCCGATTTT CGTCCCTATG CTGATGTTGG

1301 CCGGCTACGC GCCCGAAGTC ATTCAAGCCG CTTACCGCAT CGGTGATTCC

1351 GTTACCAATA TTATTACGCC GATGATGAGT TATTTCGGGC TGATTATGGC

1401 GACGGTGATC AAATACAAAA AAGATGCGGG CGTGGGTACG CTGATTTCTA

1451 TGATGTTGCC GTATTCCGCT TTCTTCTTGA TTGCGTGGAT TGCCTTATTC

1501 TGCATTTGGG TATTTGTTTT GGGCCTGCCC GTCGGTCCCG GCGCGCCCAC

1551 ATTCTATCCC GCACCTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 138>：

1 MSQTDTQRDG RFLRTVEWLG NMLPHP VTLF IIFIVLLLIA SAAGAYFGLS

51 VPDPRPVGAK GRADDG LIHV VSLLDADGLI KILTHTVKNF TG FAPLGTVL

101 VSLLGVGIAE KSGLISALMR LLLTKSPRKL TTFMVVFTGI LSNTASE LGY

151 VVLIPLSAII FHSLGRHPLA GLAAAFAGVS GGYSANLFLG TIDPLLAGIT

201 QQAAQIIHPD YVVGPEANW F FMVASTFVIA LIGYFVTEKI VEPQLGPYQS

251 DLSQEEKDIR HSNEITPLEY KGLIW AGVVF VALSALLAWS IVPADGILRH

301 PETGLVSGSP FLKS IVVFIF LLFALPGIVY GRVTRSLRGE QEVVNAMAES

351 MST LGLYLVI IFFAAQFVAF FNWTNIGQYI AVKGATFLKE VGLGGS VLFI

401 GFILICAFIN LMIGSASAQW AVTAPIFVPM LMLAGYAPEV IQAAYRTGDS

451 VTN IITPMMS YFGLIMATVI KYKKDAGVGT LISMMLPYSA FFLIAWIALF

501 CIWVFVLGLP VGPGAPTFYP AP*

ORF12a和ORF12-1在522个氨基酸的重叠区内显示出有99.0％的相同性：

10 20 30 40 50 60

orf12a.pep MSQTDTQRDGRFLRTVEWLGNMLPHPVTLFIIFIVLLLIASAAGAYFGLSVPDPRPVGAK

||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||

orf12-1 MSQTDTQRDGRFLRTVEWLGNMLPHPVTLFIIFIVLLLIASAVGAYFGLSVPDPRPVGAK

10 20 30 40 50 60

70 80 90 100 110 120

orf12a.pep GRADDGLIHVVSLLDADGLIKILTHTVKNFTGFAPLGTVLVSLLGVGIAEKSGLISALMR

||||||||::||||:|||:|||||||||||||||||||||||||||||||||||||||||

orf12-1 GRADDGLIYIVSLLNADGFIKILTHTVKNFTGFAPLGTVLVSLLGVGIAEKSGLISALMR

70 80 90 100 110 120

130 140 150 160 170 180

orf12a.pep LLLTKSPRKLTTFMVVFTGILSNTASELGYVVLIPLSAIIFHSLGRHPLAGLAAAFAGVS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 LLLTKSPRKLTTFMVVFTGILSNTASELGYVVLIPLSAIIFHSLGRHPLAGLAAAFAGVS

130 140 150 160 170 180

190 200 210 220 230 240

orf12a.pep GGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMVASTFVIALIGYFVTEKI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 GGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMVASTFVIALIGYFVTEKI

190 200 210 220 230 240

250 260 270 280 290 300

orf12a.pep VEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIVPADGILRH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 VEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIVPADGILRH

250 260 270 280 290 300

310 320 330 340 350 360

orf12a.pep PETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAMAESMSTLGLYLVI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 PETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAMAESMSTLGLYLVI

310 320 330 340 350 360

370 380 390 400 410 420

orf12a.pep IFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLMIGSASAQW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 IFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLMIGSASAQW

370 380 390 400 410 420

430 440 450 460 470 480

orf12a.pep AVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKYKKDAGVGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12-1 AVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKYKKDAGVGT

430 440 450 460 470 480

490 500 510 520

orf12a.pep LISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAPX

|||||||||||||||||||||||||||||||||||||||||||

orf12-1 LISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAPX

490 500 510 520与淋病奈瑟球菌的预计ORF的同源性

ORF12与淋病奈瑟球菌的预计ORF(ORF12.ng)在重叠的320个氨基酸内显示出有92.5％的相同性：

orf12.pep AXXIIHPXXVVGPEANWFFMVASTFVIALI 30

| ||| |||||||||||:|||||||||

orf12ng AAAFAGVSGGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMAASTFVIALI 232

orf12.pep GYFVTEKIVEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIV 90

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12ng GYFVTEKIVEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIV 292

orf12.pep PADGILRHPETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAXAESMS 150

||||||||||||||:|||||||||||||||||||||||||:|||||||:||||| |||||

orf12ng PADGILRHPETGLVAGSPFLKSIVVFIFLLFALPGIVYGRITRSLRGEREVVNAMAESMS 352

orf12.pep TLXLXLXXIFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLM 210

|| | | |||||||||||||||||||||||||:|||: ||||||||||||||||||||

orf12ng TLGLYLVIIFFAAQFVAFFNWTNIGQYIAVKGAVFLKKFRLGGSVLFIGFILICAFINLM 412

orf12.pep IGSASAQWAVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVXXY 270

||||||||||||||||||||||| ||:|||||||||||||||||||||||||||||| |

orf12ng IGSASAQWAVTAPIFVPMLMLAGNAPQVIQAAYRIGDSVTNI ITPMMSYFGLIMATVIKY 472

orf12.pep KKDAGVGTLIXMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAP 320

|||||||||| |||||||||||||||||||||||||||||||:|||||:|

orf12ng KKDAGVGTLISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGTPTFYPVP 522

全长ORF 2ng核苷酸序列<SEQ ID 139>是：

1 ATGAGTCAAA CCGACGCGCG TCGTAGCGGA CGATTTTTAC GCACAGTCGA

51 ATGGCTGGGC AATATGTTGC CGCACCCGGT TACGCTTTTT ATTATTTTCA

101 TTGTGTTATT GCTGATTGcc tctgCCGTCG GTGCGTATTT CGGACTATCC

151 GTCCCCGATC CGCGTCCTGT TGGGGCGAAA GGACGTGCCG ATGACGGTTT

201 GATTCACGTT GTCAGCCTGC TCGATGCCGA CGGTTTGATC AAAATCCTGA

251 CGCATACCGT TAAAAATTTC ACCGGTTTCG CGCCGTTGGG AACGGTGTTG

301 GTTTCTTTAT TGGGCGTGGG GATTGCGGAA AAATCGGGCT TGATTTCCGC

351 ATTAATGCGC TTATTGCTCA CAAAATCCCC ACGCAAACTC ACTACTTTTA

401 TGGTTGTTTT TACAGGGATT TTATCCAATA CGGCTTCTGA ATTGGGCTAT

451 GTCGTCCTAA TCCCTTTGTC CGCCGTCATC TTTCATTCGC TCGGCCGCCA

501 TCCGCTTGCC GGTTTGGCTG CGGCTTTCGC CGGCGTTTCG GGCGGTTATT

551 CGGCCAATCT GTTCTTAGGC ACAATCGATC CGCTCTTGGC AGGCATCACC

601 CAACAGGCGG CGCAAATCAT CCATCCCGAC TACGTCGTAG GCCCTGAAGC

651 CAACTGGTTT TTTATGGCAG CCAGTACGTT TGTGATTGCT TTGATTGGTT

701 ATTTTGTTAC TGAAAAAATC GTCGAACCGC AATTGGGCCC TTATCAATCA

751 GATTTGTCAC AAGAAGAAAA AGACATTCGG CATTCCAATG AAATCACGCC

801 TTTGGAATAT AAAGGATTAA TTTGGGCAGG CGTGGTGTTT GTTGCCTTAT

851 CCGCCCTATT GGCTTGGAGC ATCGTCCCTG CCGACGGTAT TTTGCGTCAT

901 CCTGAAACAG GATTGGTTGC CGGTTCGCCG TTTTTAAAAT CGATTGTTGT

951 TTTTATTTTC TTGTTGTTTG CGCTGCCGGG CATTGTTTAT GGCCGGATAA

1001 CCCGAAGTTT GCGCGGCGAA CGGGAAGTCG TTAATGCGAT GGCCGAATCG

1051 ATGAGTACTT TGGGACTTTA TTTGGTCATC ATCTTTTTTG CCGCACAGTT

1101 TGTCGCATTT TTTAATTGGA CGAATATTGG GCAATATATT GCCGTTAAAG

1151 GGGCGGTGTT CTTAAAAGAA GTCGGCTTGG GCGGCAGTGT GTTGTTTATC

1201 GGTTTTATTT TAATTTGTGC TTTTATCAAT CTGATGATAG GCTCCGCCTC

1251 CGCGCAATGG GCGGTAACTG CGCCGATTTT CGTCCCTATG CTGATGTTGG

1301 CCGGCTACGC GCCCGAAGTC ATTCAAGCCG CTTACCGCAT CGGTGATTCC

1351 GTTACCAATA TTATTACGCC GATGATGAGT TATTTCGGGC TGATTATGGC

1401 GACGGTAATC AAATACAAAA AAGATGCGGG CGTAGGCACG CTGATTTCTA

1451 TGATGTTGCC GTATTCCGCT TTCTTCTTAA TTGCATGGAT CGCCTTATTC

1501 TGCATTTGGG TATTTGTTTT GGGTCTGCCC GTCGGTCCCG GCACACCCAC

1551 ATTCTATCCG GTGCCTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 140>：

1 MSQTDARRSG RFLRTVEWLG NMLPHPVTLF IIFIVLLLIA SAVGAYFGLS

51 VPDPRPVGAK GRADDG LIHV VSLLDADGLI KILTHTVKNF TG FAPLGTVL

101 VSLLGVGIAE KSGLISALMR LLLTKSPRKL TTFMVVFTGI LSNTASE LGY

151 VVLIPLSAVI FHSLGRHPLA GLAAAFAGVS GGYSANLFLG TIDPLLAGIT

201 QQAAQIIHPD YVVGPEANWF FMAASTFVIA LIGYFVTEKI VEPQLGPYQS

251 DLSQEEKDIR HSNEITPLEY KGLIW AGVVF VALSALLAWS IVPADGILRH

301 PETGLVAGSP FLKS IVVFIF LLFALPGIVY GRITRSLRGE REVVNAMAES

351 MST LGLYLVI IFFAAQFVAF FNWTNIGQYI AVKGAVFLKK FRLGGS VLFI

401 GFILICAFIN LMIGSASAQW AVTAPIFVPM LMLAGNAPQV IQAAYRIGDS

451 VTN IITPMMS YFGLIMATVI KYKKDAGVGT LISMMLPYSA FFLIAWIALF

501 CIWVFVLGLP VGPGTPTFYP VP*

ORF12ng与ORF12-1在重叠的522个氨基酸内显示出有97.1％的相同性：

10 20 30 40 50 60

orf12-1.pep MSQTDTQRDGRFLRTVEWLGNMLPHPVTLFIIFIVLLLIASAVGAYFGLSVPDPRPVGAK

|||||::|:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf12ng MSQTDARRSGRFLRTVEWLGNMLPHPVTLFIIFIVLLLIASAVGAYFGLSVPDPRPVGAK

10 20 30 40 50 60

70 80 90 100 110 120

orf12-1.pep GRADDGLIYIVSLLNADGFIKILTHTVKNFTGFAPLGTVLVSLLGVGIAEKSGLISALMR

||||||||::||||:|||:|||||||||||||||||||||||||||||||||||||||||

orf12ng GRADDGLIHVVSLLDADGLIKILTHTVKNFTGFAPLGTVLVSLLGVGIAEKSGLISALMR

70 80 90 100 110 120

130 140 150 160 170 180

orf12-1.pep LLLTKSPRKLTTFMVVFTGILSNTASELGYVVLIPLSAIIFHSLGRHPLAGLAAAFAGVS

||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||

orf12ng LLLTKSPRKLTTFMVVFTGILSNTASELGYVVLIPLSAVIFHSLGRHPLAGLAAAFAGVS

130 140 150 160 170 180

190 200 210 220 230 240

orf12-1.pep GGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMVASTFVIALIGYFVTEKI

||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||

orf12ng GGYSANLFLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMAASTFVIALIGYFVTEKI

190 200 210 220 230 240

250 260 270 280 290 300

orf12-1.pep VEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIVPADGILRH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12ng VEPQLGPYQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIVPADGILRH

250 260 270 280 290 300

310 320 330 340 350 360

orf12-1.pep PETGLVSGSPFLKSIVVFIFLLFALPGIVYGRVTRSLRGEQEVVNAMAESMSTLGLYLVI

||||||:|||||||||||||||||||||||||:|||||||:|||||||||||||||||||

orf12ng PETGLVAGSPFLKSIVVFIFLLFALPGIVYGRITRSLRGEREVVNAMAESMSTLGLYLVI

310 320 330 340 350 360

370 380 390 400 410 420

orf12-1.pep IFFAAQFVAFFNWTNIGQYIAVKGATFLKEVGLGGSVLFIGFILICAFINLMIGSASAQW

|||||||||||||||||||||||||:||||||||||||||||||||||||||||||||||

orf12ng IFFAAQFVAFFNWTNIGQYIAVKGAVFLKEVGLGGSVLFIGFILICAFINLMIGSASAQW

370 380 390 400 410 420

430 440 450 460 470 480

orf12-1.pep AVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKYKKDAGVGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf12ng AVTAPIFVPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKYKKDAGVGT

430 440 450 460 470 480

490 500 510 520

orf12-1.pep LISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGAPTFYPAPX

||||||||||||||||||||||||||||||||||:|||||:||

orf12ng LISMMLPYSAFFLIAWIALFCIWVFVLGLPVGPGTPTFYPVPX

490 500 510 520

另外，ORF12ng显示出与大肠杆菌的一种假设蛋白明显同源：

sp|P46133|YDAH_ECOLI OGT-DBPA基因间区域中假设的55.1KD蛋白

>gi|1787597(AE000231)5’区域中的假设蛋白[大肠杆菌]长度＝510

评分＝329位(835)，估计值＝2e-89

相同性＝178/507(35％)，阳性＝281/507(55％)，空隙＝15/507(2％)

询问：8 RSGRFLRTVEWLGNMLPHPVTXXXXXXXXXXXASAVGAYFGLSVPDPRPVGAKGRADDGL 67

+SG+ VE +GN +PHP +A+ + FG +S +P D

目标：13 QSGKLYGWVERIGNKVPHPFLLFIYLIIVLMVTTAILSAFGVSAKNP--------TDGTP 64

询问：68 IHVVSLLDADGLIKILTHTVKNFTGFAPXXXXXXXXXXXXIAEKSGLISALMRLLLTKSP 127

+ V +LL +GL L + +KNF+GFAP +AE+ GL+ ALM + +

目标：65 VVVKNLLSVEGLHWFLPNVIKNFSGFAPLGAILALVLGAGLAERVGLLPALMVKMASHVN 124

询问：128 RKLTTFMVVFTGILSNTASELGYVVLIPLSAVIFHSLGRHPLAGLAAAFAGVSGGYSANL 187

+ ++MV+F S+ +S+ V++ P+ A+IF ++GRHP+AGL AA AGV G++ANL

目标：125 ARYASYMVLFIAFFSHISSDAALVIMPPMGALIFLAVGRHPVAGLLAAIAGVGCGFTANL 184

询问：188 FLGTIDPLLAGITQQAAQIIHPDYVVGPEANWFFMAASTFVIALIGYFVTEKIVEPQLGP 247

+ T D LL+GI+ +AA +P V NW+FMA+S V+ ++G +T+KI+EP+LG

目标：185 LIVTTDVLLSGISTEAAAAFNPQMHVSVIDNWYFMASSVVVLTIVGGLITDKIIEPRLGQ 244

询问：248 YQSDLSQEEKDIRHSNEITPLEYKGLIWAGVVFVALSALLAWSIVPADGILRHPETGLVA 307

+Q + ++ + + S GL AGVV + A +A ++P +GILR P V

目标：245 WQGNSDEKLQTLTESQRF------GLRIAGVVSLLFIAAIALMVIPQNGILRDPINHTVM 298

询问：308 GSPFLKSIVVFIFLLFALPGIVYGRITRSLRGEREVVNAMAESMSTLGLYLXXXXXXXXX 367

SPF+K IV I L F + + YG TR++R + ++ + M E M + ++

目标：299 PSPFIKGIVPLIILFFFVVSLAYGIATRTIRRQADLPHLMIEPMKEMAGFIVMVFPLAQF 358

询问：368 XXXXNWTNIGQYIAVKGAVFLKEVGLGGSVLFIGFILICAFINLMIGSASAQWAVTAPIF 427

NW+N+G++IAV L+ GL G F+G L+ +F+ + I S SA W++ APIF

目标：359 VAMFNWSNMGKFIAVGLTDILESSGLSGIPAFVGLALLSSFLCMFIASGSAIWSILAPIF 418

询问：428 VPMLMLAGYAPEVIQAAYRIGDSVTNIITPMMSYFGLIMATVIKYKKDAGVGTLISMMLP 487

VPM ML G+P Q +RI DS + P+ + L + + +YK DA +GT S++LP

目标：419 VPMFMLLGFHPAFAQILFRIADSSVLPLAPVSPFVPLFLGFLQRYKPDAKLGTYYSLVLP 478

询问：488 YSAFFLIAWIALFCIWVFVLGLPVGPG 514

Y FL+ W+ + W +++GLP+GPG

目标：479YPLIFLVVWLLMLLAW-YLVGLPIGPG 504

根据该分析结果，包括该淋球菌蛋白中存在几个推定的跨膜结构域和预计的辅肌动蛋白型结合肌动蛋白的结构域特征序列(用粗体表示)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例17

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 141>：

1 ..ACAGCCGGCG CAGCAGGTTn CnCGGTCTTC GTTTTCGTAA CGGACAGTCA

51 GGTGGAGGTG TTCGGGAACA TCCAGACCGC AGTGGAAACA GGTTTTTTTC

101 ATGGCATTTC GGTTTCGTCT GTGTTTGGTG CGGCGGCACA AGACTCGGCA

151 ATgGCTTCGC GCAGTGCGTC TATACCGGTA TTTTCAGCAA CGGAAATGCG

201 GACGGcGgCA ATTTTTCCCG CAGCGTCGCG CCATATGCCC GTGTTTTgTT

251 CTTCAGACGG CAGCAGGTCG GTTTTGTTGT ACACCTTgAT GCACGGAaTA

301 TCGCCGGCAT GGATTTCTTG CAGTACGTTT TCCACGTCTT CAATCTGCTG

351 TCCGCTGTTC GGAGCGGCGG CATCGACGAC GTGCAGCAGC ACATCgGcTT

401 gCGCGGTTTC TTCCAGCGTG GCgGAAAAGG CGGAAATCAG TTTgTGCGGC

451 agATyGCTnA CGAATCCGAC GGTATCGGTC AGGATAATGC TGCATTCGGG

501 ACT..

它对应于氨基酸序列<SEQ ID 142；ORF 14>：

1 ..TAGAAGXXVF VFVTDSQVEV FGNIQTAVET GFFHGISVSS VFGAAAQDSA

51 MASRSASIPV FSATEMRTAA IFPAASRHMP VFCSSDGSRS VLLYTLMHGI

101 SPAWISCSTF STSSICCPLF GAAASTTCSS TSACAVSSSV AEKAEISLCG

151 RXLTNPTVSV RIMLHSG..

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF14与脑膜炎奈瑟球菌菌株A的ORF(ORF14a)在重叠的167个氨基酸内显示出有94.0％的相同性：

10 20 30

orf14.pep TAGAAGXXVFVFVTDSQVEVFGNIQTAVET

|:|||| |||||||:|::||||:| ||||

orf14a GRQLGFLRVGGALFVITAQARVNNALCDCLTTGAAGFAVFVFVTDGQMQVFGNVQPAVET

150 160 170 180 190 200

40 50 60 70 80 90

orf14.pep GFFHGISVSSVFGAAAQDSAMASRSASIPVFSATEMRTAAIFPAASRHMPVFCSSDGSRS

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf14a GFFHGISVSSVFGAAAQYSAMASRSASIPVFSATEMRTAAIFPAASRHMPVFCSSDGSRS

210 220 230 240 250 260

100 110 120 130 140 150

orf14.pep VLLYTLMHGISPAWISCSTFSTSSICCPLFGAAASTTCSSTSACAVSSSVAEKAEISLCG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf14a VLLYTLMHGISPAWISCSTFSTSSICCPLFGAAASTTCSSTSACAVSSSVAEKAEISLCG

270 280 290 300 310 320

160

orf14.pep RXLTNPTVSVRIMLHSG

| |||||||||||||||

orf14a RSLTNPTVSVRIMLHSGLMYSRRAVVSSVAKSWSFAYMPDLVSRLNRLDLPTLVX

330 340 350 360 370 380

全长ORF14a核苷酸序列<SEQ ID 143>是：

1 ATGGAGGATT TGCAGGAAAT CGGGTTCGAT GTCGCCGCCG TAAAGGTAGG

51 TCGGCAGCGC GAACATCATC GTCTGCATCA TCCCCAGCCC GGCAACGGCG

101 AGGCGGACGA TGTATTGTTT GCGTTCTTTT TGGTTGGCGG CTTCGATTTT

151 TTGCGCGTCA TAGGGTGCGG CGGTGTAGCC TATCTGCCTG ATTTTCAACA

201 GAATGTCGGA AAGGCGGATT TTGCCGTCGT CCCAGACGAC GCGGCAGCGG

251 TGCGTGCTGT AATTGAGGTC GATGCGGACG ATGCCGTCTG TACGCAAAAG

301 CTGCTGTTCG ATCAGCCAGA CGCAGGCGGC GCAGGTGATG CCGCCGAGCA

351 TTAAAACCGC CTCGCGCGTG CCGCCGTGGG TTTCCACAAA GTCGGACTGG

401 ACTTCGGGCA GGTCGTACAG GCGGATTTGG TCGAGGATTT CTTGGGGCGG

451 CAGCTCGGTT TTTTGCGCGT CGGCGGTGCG TTGTTTGTAA TAACTGCCCA

501 AGCCCGCGTC AATAATGCTT TGTGCGACTG CCTGACAACC GGCGCAGCAG

551 GTTTCGCGGT CTTCGTTTTC GTAACGGACG GTCAGATGCA GGTTTTCGGG

601 AACGTCCAGC CCGCAGTGGA AACAGGTTTT TTTCATGGCA TTTCGGTTTC

651 GTCTGTGTTT GGTGCGGCGG CACAATACTC GGCAATGGCT TCGCGCAGTG

701 CGTCTATACC GGTATTTTCA GCAACGGAAA TGCGGACGGC GGCAATTTTT

751 CCCGCAGCGT CGCGCCATAT GCCCGTGTTT TGTTCTTCAG ACGGCAGCAG

801 GTCGGTTTTG TTGTACACCT TGATGCACGG AATATCGCCG GCATGGATTT

851 CTTGCAGTAC GTTTTCCACG TCTTCAATCT GCTGTCCGCT GTTCGGAGCG

901 GCGGCATCGA CGACGTGCAG CAGCACATCG GCTTGCGCGG TTTCTTCCAG

951 CGTGGCGGAA AAGGCGGAAA TCAGTTTGTG CGGCAGATCG CTGACGAATC

1001 CGACGGTATC GGTCAGGATA ATGCTGCATT CGGGACTGAT GTACAGCCGC

1051 CGCGCCGTCG TGTCGAGTGT GGCGAAAAGC TGGTCTTTCG CATATATGCC

1101 CGACTTGGTC AGCCGGTTGA ACAGACTGGA TTTGCCGACA TTGGTATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 144>：

1 MEDLQEIGFD VAAVKVGRQR EHHRLHHPQP GNGEADDVLF AFFLVGGFDF

51 LRVIGCGGVA YLPDFQQNVG KADFAVVPDD AAAVRAVIEV DADDAVCTQK

101 LLFDQPDAGG AGDAAEH*NR LARAAVGFHK VGLDFGQVVQ ADLVEDFLGR

151 QLGFLRVGGA LFVITAQARV NNALCDCLTT GAAGFAVFVF VTDGQMQVFG

201 NVQPAVETGF FHGISVSSVF GAAAQYSAMA SRSASIPVFS ATEMRTAAIF

251 PAASRHMPVF CSSDGSRSVL LYTLMHGISP AWISCSTFST SSICCPLFGA

301 AASTTCSSTS ACAVSSSVAE KAEISLCGRS LTNPTVSVRI MLHSGLMYSR

351 RAVVSSVAKS WSFAYMPDLV SRLNRLDLPT LV*

应注意该序列在118位包括一个终止密码子。

与淋病奈瑟球菌的预计ORF的同源性

ORF14与淋病奈瑟球菌的预计ORF(ORF14.ng)在重叠的167个氨基酸内显示出有89.8％的相同性：

orf14.pep TAGAAGXXVFVFVTDSQVEVFGNIQTAVET 30

|| ||| ||:||:|:|::||||:| ||||

orf14ng GRQFGFFRVGGASFVITAQAGIDDALCDCLTADAAGFAVFAFVADGQMQVFGNVQPAVET 208

orf14.pep GFFHGISVSSVFGAAAQDSAMASRSASIPVFSATEMRTAAIFPAASRHMPVFCSSDGSRS 90

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf14ng GFFHGISVSSVFGAAAQYSAMASRSASIPVFSATEMRTAAIFPAASRHMPVFCSSDGSRS 268

orf14.pep VLLYTLMHGISPAWISCSTFSTSSICCPLFGAAASTTCSSTSACAVSSSVAEKAEISLCG 150

||||||||||| ||||||||||||||||||||||||||||||||:|||:|||||||||||

orf14ng VLLYTLMHGISWAWISCSTFSTSSICCPLFRAAASTTCSSTSACTVSSKVAEKAEISLCG 328

orf14.pep RXLTNPTVSVRIMLHSG 167

| |||||||||||||:|

orf14ng RSLTNPTVSVRIMLHAGLMYSRRAVVSRVAKSWSFAYMPDLVSRLNRLDLPTLV 382

预计全长ORF14ng核苷酸序列<SEQ ID 145>编码的蛋白质具有氨基酸序列<SEQ ID 146>：

1 MEDLQEIGFD VAAVKVGRQR EHHRLHHTQS GNGKADD VLF AFFLVGGFDF

51 LRVIGCGGVA CLPDFQQNVG EADFAVVPDD AAAVRAVIEV DADDAVCAQK

101 LLFDQPDAGG AGNAAEHQHC FVRAIMGFHK VGLDFGQVVQ ADLVEDFLGR

151 QFGFFRVGGA SFVITAQAGI DDALCDCLTA DAAGFAVFAF VADGQMQVFG

201 NVQPAVETGF FHGISVSSVF GAAAQYSAMA SRSASIPVFS ATEMRTAAIF

251 PAASRHMPVF CSSDGSRSVL LYTLMHGISW AWISCSTFST SSICCPLFRA

301 AASTTCSSTS ACTVSSKVAE KAEISLCGRS LTNPTVSVRI MLHAGLMYSR

351 RAVVSRVAKS WSFAYMPDLV SRLNRLDLPT LV*

根据该淋球菌蛋白中有一个推定的跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例18

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 147>：

1 ..GGCCATTACT CCGACCGCAC TTGGAAGCCG CGTTTGGNCG GCCGCCGTCT

51 GCCGTATCTG CTTTATGGCA CGCTGATTGC GGTTATTGTG ATGATTTTGA

101 TGCCGAACTC GGGCAGCTTC GGTTTCGGCT ATGCGTCGCT GGCGGCTTTG

151 TCGTTCGGCG CGCTGATGAT TGCGCTGTTA GACGTGTCGT CAAATATGGC

201 GATGCAGCCG TTTAAGATGA TGGTCGGCGA CATGGTCAAC GAGGAGCAGA

251 AAA.NTACGC CTACGGGATT CAAAGTTTCT TAGCAAATAC GGGCGCGGTC

301 GTGGCGGCGA TTCTGCCGTT TGTGTTTGCG TATATCGGTT TGGCGAACAC

351 CGCCGANAAA GGCGTTGTGC CGCAGACCGT GGTCGTGGCG TTTTATGTGG

401 GTGCGGCGTT GCTGGTGATT ACCAGCGCGT TCACGATTTT CAAAGTGAAG

451 GAATACGANC CGGAAACCTA CGCCCGTTAC CACGGCATCG ATGTCGCCGC

501 GAATCAGGAA AAAGCCAACT GGATCGCACT CTTAAAA.CC GCGC..

它对应于氨基酸序列<SEQ ID 148；ORF16>：

1 ..GHYSDRTWKP RLXGRRLPYL LYGTLIAVIV MILMPNSGSF GFGYASLAAL

51 SFGALMIALL DVSSNMAMQP FKMMVGDMVN EEQKXYAYGI QSFLANTGAV

101 VAAILPFVFA YIGLANTAXK GVVPQTVVVA FYVGAALLVI TSAFTIFKVK

151 EYXPETYARY HGIDVAANQE KANWIALLKX A..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 149>：

1 ATGTCGGAAT ATACGCCTCA AACAGCAAAA CAAGGTTTGC CCGCGCTGGC

51 AAAAAGCACG ATTTGGATGC TCAGTTTCGG CTTTCTCGGC GTTCAGACGG

101 CCTTTACCCT GCAAAGCTCG CAAATGAGCC GCATTTTTCA AACGCTAGGC

151 GCAGACCCGC ACAATTTGGG CTGGTTTTTC ATCCTGCCGC CGCTGGCGGG

201 GATGCTGGTG CAGCCGATTG TCGGCCATTA CTCCGACCGC ACTTGGAAGC

251 CGCGTTTGGG CGGCCGCCGT CTGCCGTATC TGCTTTATGG CACGCTGATT

301 GCGGTTATTG TGATGATTTT GATGCCGAAC TCGGGCAGCT TCGGTTTCGG

351 CTATGCGTCG CTGGCGGCTT TGTCGTTCGG CGCGCTGATG ATTGCGCTGT

401 TAGACGTGTC GTCAAATATG GCGATGCAGC CGTTTAAGAT GATGGTCGGC

451 GACATGGTCA ACGAGGAGCA GAAAGGCTAC GCCTACGGGA TTCAAAGTTT

501 CTTAGCAAAT ACGGGCGCGG TCGTGGCGGC GATTCTGCCG TTTGTGTTTG

551 CGTATATCGG TTTGGCGAAC ACCGCCGAGA AAGGCGTTGT GCCGCAGACC

601 GTGGTCGTGG CGTTTTATGT GGGTGCGGCG TTGCTGGTGA TTACCAGCGC

651 GTTCACGATT TTCAAAGTGA AGGAATACGA TCCGGAAACC TACGCCCGTT

701 ACCACGGCAT CGATGTCGCC GCGAATCAGG AAAAAGCCAA CTGGATCGAA

751 CTCTTGAAAA CCGCGCCTAA GGCGTTTTGG ACGGTTACTT TGGTGCAATT

801 CTTCTGCTGG TTCGCCTTCC AATATATGTG GACTTACTCG GCAGGCGCGA

851 TTGCGGAAAA CGTCTGGCAC ACCACCGATG CGTCTTCCGT AGGTTATCAG

901 GAGGCGGGTA ACTGGTACGG CGTTTTGGCG GCGGTGCAGT CGGTTGCGGC

951 GGTGATTTGT TCGTTTGTAT TGGCGAAAGT GCCGAATAAA TACCATAAGG

1001 CGGGTTATTT CGGCTGTTTG GCTTTGGGCG CGCTCGGCTT TTTCTCCGTT

1051 TTCTTCATCG GCAACCAATA CGCGCTGGTG TTGTCTTATA CCTTAATCGG

1101 CATCGCTTGG GCGGGCATTA TCACTTATCC GCTGACGATT GTGACCAACG

1151 CCTTGTCGGG CAAGCATATG GGCACTTACT TGGGCTTGTT TAACGGCTCT

1201 ATCTGTATGC CTCAAATCGT CGCTTCGCTG TTGAGTTTCG TGCTTTTCCC

1251 TATGCTGGGC GGCTTGCAGG CCACTATGTT CTTGGTAGGG GGCGTCGTCC

1301 TGCTGCTGGG CGCGTTTTCC GTGTTCCTGA TTAAAGAAAC ACACGGCGGG

1351 GTTTGA

它对应于氨基酸序列<SEQ ID 150；ORF16-1>：

1 MSEYTPQTAK QGLPALAKST IWMLSFGFLG VQTAFTLQSS QMSRIFQTLG

51 ADPHNLGW FF ILPPLAGMLV QPIVGHYSDR TWKPRLGGRR LPYLLYGTLI

101 AVIVMILMPN SGSFGFGYA S LAALSFGALM IALLDVSSNM AMQPFKMMVG

151 DMVNEEQKGY AYGIQSFLAN TG AVVAAILP FVFAYIGLAN TAEKGVVPQT

201 VVVAFYVGAA LLVITSAFTI FKVKEYDPET YARYHGIDVA ANQEKANWIE

251 LLKTAPKAFW TVTLVQFFCW FAFQYMWTYS AGAIAENVWH TTDASSVGYQ

301 EAGNWYG VLA AVQSVAAVIC SFVLAKVPNK YHKAGY FGCL ALGALGFFSV

351 FFIGNQY ALV LSYTLIGIAW AGIITYPLTI VTNALSGKHM GTYLGLFNGS

401 ICMPQ IVASL LSFVLFPMLG GLQATMF LVG GVVLLLGAFS VFLIKETHGG

451 V*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF16与脑膜炎奈瑟球菌菌株A的ORF(ORF16a)在重叠的181个氨基酸内显示出有96.7％的相同性：

10 20 30

orf16.pep GHYSDRTWKPRLXGRR LPYLLYGTLIAVIV

| ||||||||||| ||| ||||||||||||||

135

orf16a IFQTLGADPHSLGW FFILPPLAGMLVQPIVGHYSDRTWKPRLGGRR LPYLLYGTLIAVIV

50 60 70 80 90 100

40 50 60 70 80 90

orf16.pep MILMPNSGSFGFGYA SLAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKXYAYGI

||| |||||||||||| ||||||||||||||||| |||||||||||||||||||||| |||||

orf16a MILMPNSGSFGFGYA SLAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKGYAYGI

110 120 130 140 150 160

100 110 120 130 140 150

orf16.pep QSFLANTG AVVAAILPFVFAYIGLANTAXKGVVPQT VVVAFYVGAALLVITSAFTIFKVK

|||||||| ||||||||||||||||| ||| ||||||| ||||||||||||||||| |||||||

orf16a QSFLANTG AVVAAILPFVFAYIGLANTAEKGVVPQT VVVAFYVGAALLVITSAFTIFKVK

170 180 190 200 210 220

160 170 180

orf16.pep EYXPETYARYHGIDVAANQEKANWIALLKXA

|| |||||||||||||||||||||| |||:|

orf16a EYNPETYARYHGIDVAANQEKANWIELLKTAPKAFWTVTLVQFFCWFAFQYMWTYSAGAI

230 240 250 260 270 280

orf16a AENVWHTTDASSVGYQEAGNWYG VLAAVQSVAAVICSFVLAKVPNKYHKAGYFGCLALGA

290 300 310 320 330 340

全长ORF16a核苷酸序列<SEQ ID 151>是：

1 ATGTCGGAAT ATACGCCTCA AACAGCAAAA CAAGGTTTGC CCGCGCTGGC

51 AAAAAGCACG ATTTGGATGC TCAGTTTCGG CTTTCTCGGC GTTCAGACGG

101 CCTTTACCCT GCAAAGCTCG CAGATGAGCC GCATCTTCCA GACGCTCGGT

151 GCCGATCCGC ACAGCCTCGG CTGGTTCTTT ATCCTGCCGC CGCTGGCGGG

201 GATGCTGGTG CAGCCGATTG TCGGCCATTA CTCCGACCGC ACTTGGAAGC

251 CGCGTTTGGG CGGCCGCCGT CTGCCGTATC TGCTTTATGG CACGCTGATT

301 GCGGTTATTG TGATGATTTT GATGCCGAAC TCGGGCAGCT TCGGTTTCGG

351 CTATGCGTCG CTGGCGGCTT TGTCGTTCGG CGCGCTGATG ATTGCGCTGT

401 TAGACGTGTC GTCAAATATG GCGATGCAGC CGTTTAAGAT GATGGTCGGC

451 GACATGGTCA ACGAGGAGCA GAAAGGCTAC GCCTACGGGA TTCAAAGTTT

501 CTTAGCGAAT ACGGGCGCGG TCGTGGCGGC GATTCTGCCG TTTGTGTTTG

551 CGTATATCGG TTTGGCGAAC ACCGCCGAGA AAGGCGTTGT GCCGCAGACC

601 GTGGTCGTGG CGTTTTATGT GGGTGCGGCG TTGCTGGTGA TTACCAGCGC

651 GTTCACGATT TTCAAAGTGA AGGAATACAA TCCGGAAACC TACGCCCGTT

701 ACCACGGCAT CGATGTCGCC GCGAATCAGG AAAAAGCCAA CTGGATCGAA

751 CTCTTGAAAA CCGCGCCTAA GGCGTTTTGG ACGGTTACTT TGGTGCAATT

801 CTTCTGCTGG TTCGCCTTCC AATATATGTG GACTTACTCG GCAGGCGCGA

851 TTGCGGAAAA CGTCTGGCAC ACCACCGATG CGTCTTCCGT AGGTTATCAG

901 GAGGCGGGTA ACTGGTACGG CGTTTTGGCG GCGGTGCAGT CGGTTGCGGC

951 GGTGATTTGT TCGTTTGTAT TGGCGAAAGT GCCGAATAAA TACCATAAGG

1001 CGGGTTATTT CGGCTGTTTG GCTTTGGGCG CGCTCGGCTT TTTCTCCGTT

1051 TTCTTCATCG GCAACCAATA CGCGCTGGTG TTGTCTTATA CCTTAATCGG

1101 CATCGCTTGG GCGGGCATTA TCACTTATCC GCTGACGATT GTGACCAACG

1151 CCTTGTCGGG CAAGCATATG GGCACTTACT TGGGCCTGTT TAACGGCTCT

1201 ATCTGTATGC CGCAAATCGT CGCTTCGCTG TTGAGTTTCG TGCTTTTCCC

1251 TATGCTGGGC GGCTTGCAGG CCACTATGTT CTTGGTAGGG GGCGTCGTCC

1301 TGCTGCTGGG CGCGTTTTCC GTGTTCCTGA TTAAAGAAAC ACACGGCGGG

1351 GTTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 152>：

1 MSEYTPQTAK QGLPALAKST IWMLSFGFLG VQTAFTLQSS QMSRIFQTLG

51 ADPHSLGW FF ILPPLAGMLV QPIVGHYSDR TWKPRLGGRR LPYLLYGTLI

101 AVIVMILMPN SGSFGFGYA S LAALSFGALM IALLDVSSNM AMQPFKMMVG

151 DMVNEEQKGY AYGIQSFLAN TG AVVAAILP FVFAYIGLAN TAEKGVVPQT

201 VVVAFYVGAA LLVITSAFTI FKVKEYNPET YARYHGIDVA ANQEKANWIE

251 LLKTAPKAFW TVTLVQFFCW FAFQYMWTYS AGAIAENVWH TTDASSVGYQ

301 EAGNWYG VLA AVQSVAAVIC SFVLAKVPNK YHKAGY FGCL ALGALGFFSV

351 FFIGNQY ALV LSYTLIGIAW AGIITYPLTI VTNALSGKHM GTYLGLFNGS

401 ICMPQ IVASL LSFVLFPMLG GLQATMF LVG GVVLLLGAFS VFLIKETHGG

451 V*

ORF16a和ORF16-1在451个氨基酸的重叠区内显示出有99.6％的相同性：

10 20 30 40 50 60

orf16a.pep MSEYTPQTAKQGLPALAKSTIWMLSFGFLGVQTAFTLQSSQMSRIFQTLGADPHSLGWFF

||||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||

orf16-1 MSEYTPQTAKQGLPALAKSTIWMLSFGFLGVQTAFTLQSSQMSRIFQTLGADPHNLGWFF

10 20 30 40 50 60

70 80 90 100 110 120

orf16a.pep ILPPLAGMLVQPIVGHYSDRTWKPRLGGRRLPYLLYGTLIAVIVMILMPNSGSFGFGYAS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16-1 ILPPLAGMLVQPIVGHYSDRTWKPRLGGRRLPYLLYGTLIAVIVMILMPNSGSFGFGYAS

70 80 90 100 110 120

130 140 150 160 170 180

orf16a.pep LAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKGYAYGIQSFLANTGAVVAAILP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16-1 LAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKGYAYGIQSFLANTGAVVAAILP

130 140 150 160 170 180

190 200 210 220 230 240

orf16a.pep FVFAYIGLANTAEKGVVPQTVVVAFYVGAALLVITSAFTIFKVKEYNPETYARYHGIDVA

||||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||

orf16-1 FVFAYIGLANTAEKGVVPQTVVVAFYVGAALLVITSAFTIFKVKEYDPETYARYHGIDVA

190 200 210 220 230 240

250 260 270 280 290 300

orf16a.pep ANQEKANWIELLKTAPKAFWTVTLVQFFCWFAFQYMWTYSAGAIAENVWHTTDASSVGYQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16- 1 ANQEKANWIELLKTAPKAFWTVTLVQFFCWFAFQYMWTYSAGAIAENVWHTTDASSVGYQ

250 260 270 280 290 300

310 320 330 340 350 360

orf16a.pep EAGNWYGVLAAVQSVAAVICSFVLAKVPNKYHKAGYFGCLALGALGFFSVFFIGNQYALV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16-1 EAGNWYGVLAAVQSVAAVICSFVLAKVPNKYHKAGYFGCLALGALGFFSVFFIGNQYALV

310 320 330 340 350 360

370 380 390 400 410 420

orf16a.pep LSYTLIGIAWAGIITYPLTIVTNALSGKHMGTYLGLFNGSICMPQIVASLLSFVLFPMLG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16-1 LSYTLIGIAWAGIITYPLTIVTNALSGKHMGTYLGLFNGSICMPQIVASLLSFVLFPMLG

370 380 390 400 410 420

430 440 450

orf16a.pep GLQATMFLVGGVVLLLGAFSVFLIKETHGGVX

||||||||||||||||||||||||||||||||

orf16-1 GLQATMFLVGGVVLLLGAFSVFLIKETHGGVX

430 440 450

与淋病奈瑟球菌的预计ORF的同源性

ORF16与淋病奈瑟球菌预计的ORF(ORF16.ng)在重叠的181个氨基酸内显示出有93.9％的相同性：

orf16.pep GHYSDRTWKPRLXGRRLPYLLYGTLIAVIV 30

|:|||||||||| |||||||||||||||||

orf16ng HFSNARRRPAQFGLVFHPAAAGGDAGSADSGYYSDRTWKPRLGGRRLPYLLYGTLIAVIV 131

orf16.pep MILMPNSGSFGFGYASLAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKXYAYGI 90

|||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||

orf16ng MILMPNSGSFGFGYASLAALSFGALMIALLDVSSNMAMQPFKMMVGDMVNEEQKSYAYGI 191

orf16.pep QSFLANTGAVVAAILPFVFAYIGLANTAXKGVVPQTVVVAFYVGAALLVITSAFTIFKVK 150

||||||| |||||||||||||||||||| |||||||||||||||||||:||||||| |||

orf16ng QSFLANTDAVVAAILPFVFAYIGLANTAEKGVVPQTVVVAFYVGAALLIITSAFTISKVK 251

orf16.pep EYXPETYARYHGIDVAANQEKANWIALLKXA 181

|| |||||||||||||||||||||: |||:|

orf16ng EYDPETYARYHGIDVAANQEKANWFELLKTAPKVFWTVTPVQFFCWFAFRYMWTYSAGAI 311

全长ORF16ng核苷酸序列<SEQ ID 153>是：

1 ATGATAGGGG ATCGCCGCGC CGGCAACCAT TTCGGATTTT CCAAAGCAAA

51 TACTTTTCAA ATCAAAAAAA AGGATTTACT TTATGTCGGA ATATACGCCT

101 CAAACAGCAA AACAAGGTTT GCCCGCGCCG GCAAAAAGCA CGATTTGGAT

151 GTTGAGCTTC GGCTATCTCG GCGTTCAGAC GGCCTTTACC CTGCAAAGCT

201 CGCAGATGAG CCGCATTTTT CAAACGCTAG GCGCAGACCC GCACAATTTG

251 GGCTGGTTTT TCATCCTGCC GCCGCTGGCG GGGATGCTGG TTCAGCCGAT

301 AGTGGCTACT ACTCAGACCG CACTTGGAAG CCGCGCTTGG GCGGCCGCCG

351 CCTGCCGTAT CTGCTTTACG GCACGCTGAT TGCGGTCATC GTGATGATTT

401 TGATGCCGAA CTCGGGCAGC TTCGGTTTCG GCTATGCGTC GCTGGCGGCC

451 TTGTCGTTCG GCGCGCTGAT GATTGCGCTG TTGGACGTGT CGTCGAATAT

501 GGCGATGCAG CCGTTTAAGA TGATGGTCGG CGATATGGTC AACGAGGAGC

551 AGAAAAGCTA CGCCTACGGG ATTCAAAGTT TCTTAGCGAA TACGGACGCG

601 GTTGTGGCAG CGATTCTGCC GTTTGTGTTC GCGTATATCG GTTTGGCGAA

651 CACTGCCGAG AAAGGCGTTG TGCCACAAAC CGTGGTCGTA GCATTCTATG

701 TGGGTGCGGC GTTACTGATT ATTACCAGTG CGTTCACAAT CTCCAAAGTC

751 AAAGAATACG ACCCGGAAAC CTACGCCCGT TACCACGGCA TCGATGTCGC

801 CGCGAATCAG GAAAAAGCCA ACTGGTTCGA ACTCTTAAAA ACCGCGCCTA

851 AAGTGTTTTG GACGGTTACT CCGGTACAGT TTTTCTGCTG GTTCGCCTTC

901 CGGTATATGT GGACTTACTC GGCAGGCGCG ATTGCAGAAA ACGTCTGGCA

951 CACTACCGAT GCGTCTTCCG TAGGCCATCA GGAGGCGGGC AACCGGTACG

1001 GCGTTTTGGC GGCGGTGTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 154>：

1 MIGDRRAGNH FGFSKANTFQ IKKKDLLYVG IYASNSKTRF ARAGKKHDLD

51 VELRLSRRSD GLYPAKLADE PHFSNARRRP AQFGLVFHPA AAGGDAGSAD

101 SGYYSDRTWK PRLGGRR LPY LLYGTLIAVI VMILMPNSGS FGFGYA SLAA

151 LSFGALMIAL LDVSSNMAMQ PFKMMVGDMV NEEQKSYAYG IQSFLANTD A

201 VVAAILPFVF AYIGLANTAE KGVVPQT VVV AFYVGAALLI ITSAFTISKV

251 KEYDPETYAR YHGIDVAANQ EKANWFELLK TAPKVFWTVT PVQFFCWFAF

301 RYMWTYSAGA IAENVWHTTD ASSVGHQEAG NRYGVLAAV*

ORF16ng和ORF16-1在261个氨基酸的重叠区内显示出有89.3％的相同性：

30 40 50 60 70 80

orf16-1.pep MLSFGFLGVQTAFTLQSSQMSRIFQTLGADPHNLGWFFILPPLAGMLVQPI-VGHYSDRT

| ::| | | || : |:|||||

orf16ng DVELRLSRRSDGLYPAKLADEPHFSNARRRPAQFGLVF-HPAAAGGDAGSADSGYYSDRT

50 60 70 80 90 100

90 100 110 120 130 140

orf16-1.pep WKPRLGGRRLPYLLYGTLIAVIVMILMPNSGSFGFGYASLAALSFGALMIALLDVSSNMA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf16ng WKPRLGGRRLPYLLYGTLIAVIVMILMPNSGSFGFGYASLAALSFGALMIALLDVSSNMA

110 120 130 140 150 160

150 160 170 180 190 200

orf16-1.pep MQPFKMMVGDMVNEEQKGYAYGIQSFLANTGAVVAAILPFVFAYIGLANTAEKGVVPQTV

|||||||||||||||||:|||||||||||| |||||||||||||||||||||||||||||

orf16ng MQPFKMMVGDMVNEEQKSYAYGIQSFLANTDAVVAAILPFVFAYIGLANTAEKGVVPQTV

170 180 190 200 210 220

210 220 230 240 250 260

orf16-1.pep VVAFYVGAALLVITSAFTIFKVKEYDPETYARYHGIDVAANQEKANWIELLKTAPKAFWT

|||||||||||:||||||| |||||||||||||||||||||||||||:||||||||:|||

orf16ng VVAFYVGAALLIITSAFTISKVKEYDPETYARYHGIDVAANQEKANWFELLKTAPKVFWT

230 240 250 260 270 280

270 280 290 300 310 320

orf16-1.pep VTLVQFFCWFAFQYMWTYSAGAIAENVWHTTDASSVGYQEAGNWYGVLAAVQSVAAVICS

|| ||||||||:||||||||||||||||||||||||:||||| |||||||||||||

orf16ng VTPVQFFCWFAFRYMWTYSAGAIAENVWHTTDASSVGHQEAGNRYGVLAAVX

290 300 310 320 330 340

根据该分析结果，包括该淋球菌蛋白中存在几个推定的跨膜结构域的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例19

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 155>：

1 ATGTTGTTCC GTAAAACGAC CGCCGCCGTT TTGGCGCATA CCTTGATGCT

51 GAACGGCTGT ACGTTGATGT TGTGGGGAAT GAACAACCCG GTCAGCGAAA

101 CAATCACCCG NAAACACGTT GNCAAAGACC AAATCCGNGN CTTCGGTGTG

151 GTTGCCGAAG ACAATGCCCA ATTGGAAAAG GGCAGCCTGG TGATGATGGG

201 CGGAAAATAC TGGTTCGTCG TCAATCCCGA AGATTCGGCG AA.NTGACGG

251 GNATTTTGAN GGCAGGGCTG GACAAACCCT TCCAAATAGT TNAGGATACC

301 CCGAGCTATG C.TGCCACCA AGCCCTGCCG GTCAAACTCG GATCGNCTGG

351 CAGCCAGAAT...

它对应于氨基酸序列<SEQ ID 156；ORF28>：

1 MLFRKTTAAV LAHTLMLNGC TLMLWGMNNP VSETITRKHV XKDQIRXFGV

51 VAEDNAQLEK GSLVMMGGKY WFVVNPEDSA XXTGILXAGL DKPFQIVXDT

101 PSYXCHQALP VKLGSXGSQN...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 157>：

1 ATGTTGTTCC GTAAAACGAC CGCCGCCGTT TTGGCGGCAA CCTTGATGCT

51 GAACGGCTGT ACGTTGATGT TGTGGGGAAT GAACAACCCG GTCAGCGAAA

101 CAATCACCCG CAAACACGTT GACAAAGACC AAATCCGCGC CTTCGGTGTG

151 GTTGCCGAAG ACAATGCCCA ATTGGAAAAG GGCAGCCTGG TGATGATGGG

201 CGGAAAATAC TGGTTCGTCG TCAATCCCGA AGATTCGGCG AAGCTGACGG

251 GCATTTTGAA GGCAGGGCTG GACAAACCCT TCCAAATAGT TGAGGATACC

301 CCGAGCTATG CTCGCCACCA AGCCCTGCCG GTCAAACTCG AATCGCCTGG

351 CAGCCAGAAT TTCAGTACCG AAGGCCTTTG CCTGCGCTAC GATACCGACA

401 AGCCTGCCGA CATCGCCAAG CTGAAACAGC TCGGGTTTGA AGCGGTCAAA

451 CTCGACAATC GGACCATTTA CACGCGCTGC GTATCCGCCA AAGGCAAATA

501 CTACGCCACA CCGCAAAAAC TGAACGCCGA TTACCATTTT GAGCAAAGTG

551 TGCCTGCCGA TATTTATTAC ACGGTTACTG AAGAACATAC CGACAAATCC

601 AAGCTGTTTG CAAATATCTT ATATACGCCC CCCTTTTTGA TACTGGATGC

651 GGCGGGCGCG GTACTGGCCT TGCCTGCGGC GGCTCTGGGT GCGGTCGTGG

701 ATGCCGCCCG CAAATGA

它对应于氨基酸序列<SEQ ID 158；ORF28-1>：

1 MLFRKTTAAV LAATLMLNGC TLMLWGMNNP VSETITRKHV DKDQIRAFGV

51 VAEDNAQLEK GSLVMMGGKY WFVVNPEDSA KLTGILKAGL DKPFQIVEDT

101 PSYARHQALP VKLESPGSQN FSTEGLCLRY DTDKPADIAK LKQLGFEAVK

151 LDNRTIYTRC VSAKGKYYAT PQKLNADYHF EQSVPADIYY TVTEEHTDKS

201 KLFANILYTP PF LILDAAGA VLALPAAALG AVVDAARK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF28与脑膜炎奈瑟球菌菌株A的ORF(ORF28a)在重叠的120个氨基酸内显示出有79.2％的相同性：

10 20 30 40 50 60

orf28.pep MLFRKTTAAVLAHTLMLNGCTLMLWGMNNPVSETITRKHVXKDQIRXFGVVAEDNAQLEK

|||||||||||| |||||| ||:|:||||:| ||| :|||| ||||| |||||||||||||

orf28a MLFRKTTAAVLAATLMLNGCTVMMWGMNSPFSETTARKHVDKDQIRAFGVVAEDNAQLEK

10 20 30 40 50 60

70 80 90 100 110 120

orf28.pep GSLVMMGGKYWFVVNPEDSAXXTGILXAGLDKPFQIVXDTPSYXCHQALPVKLGSXGSQN

|||||||||||||||||||| |||| ||||| ||:| :| : :||||||| | :|||

orf28a GSLVMMGGKYWFVVNPEDSAKLTGILKAGLDKQFQMVEPNPRFA-YQALPVKLESPASQN

70 80 90 100 110

orf28a FSTEGLCLRYDTDRPADIAKLKQLEFEAVELDNRTIYTRCVSAKGKYYATPQKLNADYHF

120 130 140 150 160 170

全长ORF28a核苷酸序列<SEQ ID 159>是：

1 ATGTTGTTCC GTAAAACGAC CGCCGCCGTT TTGGCGGCAA CCTTGATGTT

51 GAACGGCTGT ACGGTAATGA TGTGGGGTAT GAACAGCCCG TTCAGCGAAA

101 CGACCGCCCG CAAACACGTT GACAAGGACC AAATCCGCGC CTTCGGTGTG

151 GTTGCCGAAG ACAATGCCCA ATTGGAAAAG GGCAGCCTGG TGATGATGGG

201 CGGGAAATAC TGGTTCGTCG TCAATCCTGA AGATTCGGCG AAGCTGACGG

251 GCATTTTGAA GGCCGGGTTG GACAAGCAGT TTCAAATGGT TGAGCCCAAC

301 CCGCGCTTTG CCTACCAAGC CCTGCCGGTC AAACTCGAAT CGCCCGCCAG

351 CCAGAATTTC AGTACCGAAG GCCTTTGCCT GCGCTACGAT ACCGACAGAC

401 CTGCCGACAT CGCCAAGCTG AAACAGCTTG AGTTTGAAGC GGTCGAACTC

451 GACAATCGGA CCATTTACAC GCGCTGCGTC TCCGCCAAAG GCAAATACTA

501 CGCCACACCG CAAAAACTGA ACGCCGATTA TCATTTTGAG CAAAGTGTGC

551 CTGCCGATAT TTATTACACG GTTACGAAAA AACATACCGA CAAATCCAAG

601 TTGTTTGAAA ATATTGCATA TACGCCCACC ACGTTGATAC TGGATGCGGT

651 GGGCGCGGTG CTGGCCTTGC CTGTCGCGGC GTTGATTGCA GCCACGAATT

701 CCTCAGACAA ATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 160>：

1 MLFRKTTAAV LAATLMLNGC TVMMWGMNSP FSETTARKHV DKDQIRAFGV

51 VAEDNAQLEK GSLVMMGGKY WFVVNPEDSA KLTGILKAGL DKQFQMVEPN

101 PRFAYQALPV KLESPASQNF STEGLCLRYD TDRPADIAKL KQLEFEAVEL

151 DNRTIYTRCV SAKGKYYATP QKLNADYHFE QSVPADIYYT VTKKHTDKSK

201 LFENIAYTPT TL ILDAVGAV LALPVAALIA ATNSSDK*

ORF28a和ORF28-1在238个氨基酸的重叠区内显示出有86.1％的相同性：

10 20 30 40 50 60

orf28a.pep MLFRKTTAAVLAATLMLNGCTVMMWGMNSPFSETTARKHVDKDQIRAFGVVAEDNAQLEK

|||||||||||||||||||||:|:||||:| ||| :||||||||||||||||||||||||

orf28-1 MLFRKTTAAVLAATLMLNGCTLMLWGMNNPVSETITRKHVDKDQIRAFGVVAEDNAQLEK

10 20 30 40 50 60

70 80 90 100 110 119

orf28a.pep GSLVMMGGKYWFVVNPEDSAKLTGILKAGLDKQFQMVEPNPRFA-YQALPVKLESPASQN

|||||||||||||||||||||||||||||||| ||:||:| :| :|||||||||||:|||

orf28-1 GSLVMMGGKYWFVVNPEDSAKLTGILKAGLDKPFQIVEDTPSYARHQALPVKLESPGSQN

70 80 90 100 110 120

120 130 140 150 160 170 179

orf28a.pep FSTEGLCLRYDTDRPADIAKLKQLEFEAVELDNRTIYTRCVSAKGKYYATPQKLNADYHF

|||||||||||||:|||||||||| ||||:||||||||||||||||||||||||||||||

orf28-1 FSTEGLCLRYDTDKPADIAKLKQLGFEAVKLDNRTIYTRCVSAKGKYYATPQKLNADYHF

130 140 150 160 170 180

180 190 200 210 220 230

orf28a.pep EQSVPADIYYTVTKKHTDKSKLFENIAYTPTTLILDAVGAVLALPVAALIAATNSSDKX

|||||||||||||::|||||||| || ||| |||||:|||||||:||| |::::: ||

orf28-1 EQSVPADIYYTVTEEHTDKSKLFANILYTPPFLILDAAGAVLALPAAALGAVVDAARKX

190 200 210 220 230

与淋病奈瑟球菌的预计ORF的同源性

ORF28与淋病奈瑟球菌的预计ORF(ORF28.ng)在重叠的120个氨基酸内显示出有84.2％的相同性：

orf28.pep MLFRKTTAAVLAHTLMLNGCTLMLWGMNNPVSETITRKHVXKDQI RXFGVVAEDNAQLEK 60

|||||||||||| ||:|||||:|| |||||||:||||||| ||||| ||||||||||||||

orf28ng MLFRKTTAAVLAATLILNGCTMMLRGMNNPVSQTITRKHVDKDQIRAFGVVAEDNAQLEK 60

orf28.pep GSLVMMGGKYWFVVNPEDSAXXTGILXAGLDKPFQIVXDTPSYXCHQALPVKLGSXGSQN 120

||||||||||||:|||||||| ||:|||||||||||| ||||| |||||||: : ||||

orf28ng GSLVMMGGKYWFAVNPEDSAKLTGLLKAGLDKPFQIVEDTPSYARHQALPVKFEAPGSQN 120

全长ORF28ng核苷酸序列<SEQ ID 161>是

1 ATGTTGTTCC GTAAAACGAC CGCCGCCGTT TTGGCGGCAA CCTTGATACT

51 GAACGGCTGT ACGATGATGT TGCGGGGGAT GAACAACCCG GTCAGCCAAA

101 CAATCACCCG CAAACACGTT GACAAAGACC AAATCCGCGC CTTCGGTGTG

151 GTTGCCGAAG ACAATGCCCA ATTGGAAAAG GGCAGCCTGG TGATGATGGG

201 CGGGAAATAC TGGTTCGCCG TCAATCCCGA AGATTCGGCG AAGCTGACGG

251 GCCTTTTGAA GGCCGGGTTG GACAAGCCCT TCCAAATAGT TGAGGATACC

301 CCGAGCTATG CCCGCCACCA AGCCCTGCCG GTCAAATTCG AAGCGCCCGG

351 CAGCCAGAAT TTCAGTACCG GAGGTCTTTG CCTGCGCTAT GATACCGGCA

401 GACCTGACGA CATCGCCAAG CTGAAACAGC TTGAGTTTAA AGCGGTCAAA

451 CTCGACAATC GGACCATTTA CACGCGCTGC GTATCCGCCA AAGGCAAATA

501 CTACGCCACG CCGCAAAAAC TGAACGCCGA TTATCATTTT GAGCAAAGTG

551 TGCCCGCCGA TATTTATTAT ACGGTTACTG AAAAACATAC CGACAAATCC

601 AAGCTGTTTG GAAATATCTT ATATACGCCC CCCTTGTTGA TATTGGATGC

651 GGCGGCCGCG GTGCTGGTCT TGCCTATGGC TCTGATTGCA GCCGCGAATT

701 CCTCAGACAA ATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 162>：

1 MLFRKTTAAV LAATLILNGC TMMLRGMNNP VSQTITRKHV DKDQIRAFGV

51 VAEDNAQLEK GSLVMMGGKY WFAVNPEDSA KLTGLLKAGL DKPFQIVEDT

101 PSYARHQALP VKFEAPGSQN FSTGGLCLRY DTGRPDDIAK LKQLEFKAVK

151 LDNRTIYTRC VSAKGKYYAT PQKLNADYHF EQSVPADIYY TVTEKHTDKS

201 KLFGNILYTP PL LILDAAAA VLVLPMALIA AANSSDK*

ORF28ng和ORF28-1在231个氨基酸的重叠区内显示有90.0％的相同性：

10 20 30 40 50 60

orf28-1.pep MLFRKTTAAVLAATLMLNGCTLMLWGMNNPVSETITRKHVDKDQIRAFGVVAEDNAQLEK

||||||||||||||:|||||:|| |||||||:||||||||||||||||||||||||||||

orf28ng MLFRKTTAAVLAATLILNGCTMMLRGMNNPVSQTITRKHVDKDQIRAFGVVAEDNAQLEK

10 20 30 40 50 60

70 80 90 100 110 120

orf28-1.pep GSLVMMGGKYWFVVNPEDSAKLTGILKAGLDKPFQIVEDTPSYARHQALPVKLESPGSQN

||||||||||||:|||||||||||:|||||||||||||||||||||||||||:|:|||||

orf28ng GSLVMMGGKYWFAVNPEDSAKLTGLLKAGLDKPFQIVEDTPSYARHQALPVKFEAPGSQN

70 80 90 100 110 120

130 140 150 160 170 180

orf28-1.pep FSTEGLCLRYDTDKPADIAKLKQLGFEAVKLDNRTIYTRCVSAKGKYYATPQKLNADYHF

||| |||||||| :| |||||||| |:|||||||||||||||||||||||||||||||||

orf28ng FSTGGLCLRYDTGRPDDIAKLKQLEFKAVKLDNRTIYTRCVSAKGKYYATPQKLNADYHF

130 140 150 160 170 180

190 200 210 220 230 239

orf28-1.pep EQSVPADIYYTVTEEHTDKSKLFANILYTPPFLILDAAGAVLALPAAALGAVVDAARKX

||||||||||||||:||||||||:|||||||:||||||:|||||| | ::|:

orf28ng EQSVPADIYYTVTEKHTDKSKLFGNILYTPPLLILDAAAAVLVLPMALIAAANSSDKX

190 200 210 220 230

根据该分析结果(包括该淋球菌蛋白中存在一个推定的跨膜结构域的结果)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF28-1(24kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图6A显示了GST-融合蛋白的亲和纯化结果，图6B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST-融合蛋白来免疫小鼠，用小鼠血清进行ELISA，得到阳性结果。这些结果确认ORF28-1是一种外露蛋白，且其可能是一种有用的免疫原。

实施例20

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 163>：

1 ..GTCAGTCCTG TACTGCCTAT TACACACGAA CGGACAGGGT TTGAAGGTGT

51 TATCGGTTAT GAAACCCATT TTTCAGGGCA CGGACATGAA GTACACAGTC

101 CGTTCGATCA TCATGATTCA AAAAGCACTT CTGATTTCAG CGGCGGTGTA

151 GACGGCGGTT TTACTGTTTA CCAACTTCAT CGAACATGGT CGGAAATCCA

201 TCCGGAGGAT GAATATGACG GGCCGCAAGC AGCG.ATTAT CCGCCCCCCG

251 GAGGAGCAAG GGATATATAC AGCTATTATG TCAAAGGAAC TTCAACAAAA

301 ACAAAGACTA GTATTGTCCC TCAAGCCCCA TTTTCAGACC GTTGGCTAGA

351 AGAAAATGCC GGTGCCGCCT CTGGT..

它对应于氨基酸序列<SEQ ID 164；ORF29>：

1 ..VSPVLPITHE RTGFEGVIGY ETHFSGHGHE VHSPFDHHDS KSTSDFSGGV

51 DGGFTVYQLH RTWSEIHPED EYDGPQAAXY PPPGGARDIY SYYVKGTSTK

101 TKTSIVPQAP FSDRWLEENA GAASG..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 165>：

1 ATGAATTTGC CTATTCAAAA ATTCATGATG CTGTTTGCAG CAGCAATATC

51 GTTGCTGCAA ATCCCCATTA GTCATGCGAA CGGTTTGGAT GCCCGTTTGC

101 GCGATGATAT GCAGGCAAAA CACTACGAAC CGGGTGGTAA ATACCATCTG

151 TTTGGTAATG CTCGCGGCAG TGTTAAAAAG CGGGTTTACG CCGTCCAGAC

201 ATTTGATGCA ACTGCGGTCA GTCCTGTACT GCCTATTACA CACGAACGGA

251 CAGGGTTTGA AGGTGTTATC GGTTATGAAA CCCATTTTTC AGGGCACGGA

301 CATGAAGTAC ACAGTCCGTT CGATCATCAT GATTCAAAAA GCACTTCTGA

351 TTTCAGCGGC GGTGTAGACG GCGGTTTTAC TGTTTACCAA CTTCATCGAA

401 CAGGGTCGGA AATCCATCCG GAGGATGGAT ATGACGGGCC GCAAGGCAGC

451 GATTATCCGC CCCCCGGAGG AGCAAGGGAT ATATACAGCT ATTATGTCAA

501 AGGAACTTCA ACAAAAACAA AGACTAATAT TGTCCCTCAA GCCCCATTTT

551 CAGACCGTTG GCTAAAAGAA AATGCCGGTG CCGCCTCTGG TTTTTTCAGC

601 CGTGCGGATG AAGCAGGAAA ACTGATATGG GAAAGCGACC CCAATAAAAA

651 TTGGTGGGCT AACCGTATGG ATGATGTTCG CGGCATCGTC CAAGGTGCGG

701 TTAATCCTTT TTTAATGGGT TTTCAAGGAG TAGGGATTGG GGCAATTACA

751 GACAGTGCAG TAAGCCCGGT CACAGATACA GCCGCGCAGC AGACTCTACA

801 AGGTATTAAT GATTTAGGAA AATTAAGTCC GGAAGCACAA CTTGCTGCCG

851 CGAGCCTATT ACAGGACAGT GCTTTTGCGG TAAAAGACGG TATCAACTCT

901 GCCAAACAAT GGGCTGATGC CCATCCAAAT ATAACAGCTA CTGCCCAAAC

951 TGCCCTTTCC GCAGCAGAGG CCGCAGGTAC GGTTTGGAGA GGTAAAAAAG

1001 TAGAACTTAA CCCGACTAAA TGGGATTGGG TTAAAAATAC CGGTTATAAA

1051 AAACCTGCTG CCCGCCATAT GCAGACTTTA GATGGGGAGA TGGCAGGTGG

1101 GAATAAACCT ATTAAATCTT TACCAAACAG TGCCGCTGAA AAAAGAAAAC

1151 AAAATTTTGA GAAGTTTAAT AGTAACTGGA GTTCAGCAAG TTTTGATTCA

1201 GTGCACAAAA CACTAACTCC CAATGCACCT GGTATTTTAA GTCCTGATAA

1251 AGTTAAAACT CGATACACTA GTTTAGATGG AAAAATTACA ATTATAAAAG

1301 ATAACGAAAA CAACTATTTT AGAATCCATG ATAATTCACG AAAACAGTAT

1351 CTTGATTCAA ATGGTAATGC TGTGAAAACC GGTAATTTAC AAGGTAAGCA

1401 AGCAAAAGAT TATTTACAAC AACAAACTCA TATCAGGAAC TTAGACAAAT

1451 GA

它对应于氨基酸序列<SEQ ID 166；ORF29-1>：

1 MNLPIQKFMM LFAAAISLLQ IPISHANGLD ARLRDDMQAK HYEPGGKYHL

51 FGNARGSVKK RVYAVQTFDA TAVSPVLPIT HERTGFEGVI GYETHFSGHG

101 HEVHSPFDHH DSKSTSDFSG GVDGGFTVYQ LHRTGSEIHP EDGYDGPQGS

151 DYPPPGGARD IYSYYVKGTS TKTKTNIVPQ APFSDRWLKE NAGAASGFFS

201 RADEAGKLIW ESDPNKNWWA NRMDDVRGIV QGAVNPFLMG FQGVGIGAIT

251 DSAVSPVTDT AAQQTLQGIN DLGKLSPEAQ LAAASLLQDS AFAVKDGINS

301 AKQWADAHPN ITATAQTALS AAEAAGTVWR GKKVELNPTK WDWVKNTGYK

351 KPAARHMQTL DGEMAGGNKP IKSLPNSAAE KRKQNFEKFN SNWSSASFDS

401 VHKTLTPNAP GILSPDKVKT RYTSLDGKIT IIKDNENNYF RIHDNSRKQY

451 LDSNGNAVKT GNLQGKQAKD YLQQQTHIRN LDK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF29与脑膜炎奈瑟球菌菌株A的ORF(ORF29a)在重叠的125个氨基酸中显示出有88.0％的相同性：

10 20 30

orf29.pep VSPVLPITHERTGFEGVIGYETHFSGHGHE

|:|:||||||||||||:|||||||||||||

orf29a EPGGKYHLFGNARGSVKNRVYAVQTFDATAVGPILPITHERTGFEGIIGYETHFSGHGHE

50 60 70 80 90 100

40 50 60 70 80 90

orf29.pep VHSPFDHHDSKSTSDFSGGVDGGFTVYQLHRTWSEIHPEDEYDGPQAAXYPPPGGARDIY

||||||:||||||||||||||||||||||||| ||||||| |||||:: |||||||||||

orf29a VHSPFDNHDSKSTSDFSGGVDGGFTVYQLHRTGSEIHPEDGYDGPQGSDYPPPGGARDIY

110 120 130 140 150 160

100 110 120

orf29.pep SYYVKGTSTKTKTSIVPQAPFSDRWLEENAGAASG

||||||||||::|||:||||||||:|||||||||

orf29a XXYVKGTSTKTKSNIVPRAPFSDRWLKENAGAASGFFSRADEAGKLIWESDPNKNWWANR

170 180 190 200 210 220

orf29a MDDIRGIVQGAVNPFLMGFQGVGIGAITDSAVSPVTDTAAQQTLQGXNHLGXLSPEAQLA

230 240 250 260 270 280

全长ORF29a核苷酸序列<SEQ ID 167>是：

1 ATGAATTNGC CTATTCAAAA ATTCATGATG CTGTTTGCAG CAGCAATATC

51 GTNGCTGCAA ATCCCNATTA GTCATGCGAA CGGTTTGGAT GCCCGTTTGC

101 GCGATGATAT GCAGGCAAAA CACTACGAAC CGGGTGGTAA ATACCATCTG

151 TTTGGTAATG CTCGCGGCAG TGTTAAAAAT CGGGTTTACG CCGTCCAAAC

201 ATTTGATGCA ACTGCGGTCG GCCCCATACT GCCTATTACA CACGAACGGA

251 CAGGATTTGA AGGCATTATC GGTTATGAAA CCCATTTTTC AGGACATGGA

301 CATGAAGTAC ACAGTCCGTT CGATAATCAT GATTCAAAAA GCACTTCTGA

351 TTTCAGCGGC GGCGTAGACG GTGGTTTTAC CGTTTACCAA CTTCATCGGA

401 CAGGGTCGGA AATCCATCCG GAGGATGGAT ATGACGGGCC GCAAGGCAGC

451 GATTATCCGC CCCCCGGAGG AGCAAGGGAT ATATACANNT ANTATGTCAA

501 AGGAACTTCA ACAAAAACAA AGAGTAATAT TGTTCCCCGA GCCCCATTTT

551 CAGACCGCTG GCTAAAAGAA AATGCCGGTG CCGCCTCTGG TTTTTTCAGC

601 CGTGCTGATG AAGCAGGAAA ACTGATATGG GAAAGCGACC CCAATAAAAA

651 TTGGTGGGCT AACCGTATGG ATGATATTCG CGGCATCGTC CAAGGTGCGG

701 TTAATCCTTT TTTAATGGGT TTTCAAGGAG TAGGGATTGG GGCAATTACA

751 GACAGTGCAG TAAGCCCGGT CACAGATACA GCCGCGCAGC AGACTCTACA

801 AGGTATNAAT CATTTAGGAA ANTTAAGTCC CGAAGCACAA CTTGCGGCTG

851 CAACCGCATT ACAAGACAGT GCTTTTGCGG TAAAAGACGG TATCAATTCC

901 GCCAGACAAT GGGCTGATGC CCATCCGAAT ATAACTGCAA CAGCCCAAAC

951 TGCCCTTGCC GTAGCAGANG CCGCAACTAC GGTTTGGGGC GGTAAAAAAG

1001 TAGAACTTAA CCCGACCAAA TGGGATTGGG TTAAAAATAC NGGCTATAAN

1051 ACACCTGCTG TTCGCACCAT GCATACTTTG GATGGGGAAA TGGCCGGTGG

1101 GAATAGACCG CCTAAATCTA TAACGTCCAA CAGCAAAGCA GATGCTTCCA

1151 CACAACCGTC TTTACAAGCG CAACTAATTG GAGAACAAAT TANNNNNGGG

1201 CATGCTTATA ACAAGCATGT CATAAGACAA CAAGAATTTA CGGATTTAAA

1251 TATCAATTCA CCAGCAGATT TTGCTCGGCA TATTGAAAAT ATTGTTAGCC

1301 ATCCANCAAA TATGAAAGAG TTACCTCGCG GTAGAACTGC GTATTGGGAT

1351 NATAAAACAG GGACNATAGT TATCCGAGAT AAAAATTCTG ACGATGGAGG

1401 TACAGCATTT AGACCAACAT CAGGTAAAAA ATATTATGAT GATTTATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 168>：

1 MNXPIQKFMM LFAAAISXLQ IPISHANGLD ARLRDDMQAK HYEPGGKYHL

51 FGNARGSVKN RVYAVQTFDA TAVGPILPIT HERTGFEGII GYETHFSGHG

101 HEVHSPFDNH DSKSTSDFSG GVDGGFTVYQ LHRTGSEIHP EDGYDGPQGS

151 DYPPPGGARD IYXXYVKGTS TKTKSNIVPR APFSDRWLKE NAGAASGFFS

201 RADEAGKLIW ESDPNKNWWA NRMDDIRGIV QGAVNPFLMG FQGVGIGAIT

251 DSAVSPVTDT AAQQTLQGXN HLGXLSPEAQ LAAATALQDS AFAVKDGINS

301 ARQWADAHPN ITATAQTALA VAXAATTVWG GKKVELNPTK WDWVKNTGYX

351 TPAVRTMHTL DGEMAGGNRP PKSITSNSKA DASTQPSLQA QLIGEQIXXG

401 HAYNKHVIRQ QEFTDLNINS PADFARHIEN IVSHPXNMKE LPRGRTAYWD

451 XKTGTIVIRD KNSDDGGTAF RPTSGKKYYD DL*

ORF29a和ORF29-1在385个氨基酸的重叠区内显示出有90.1％的相同性：

10 20 30 40 50 60

orf29a.pep MNXPIQKFMMLFAAAISXLQIPISHANGLDARLRDDMQAKHYEPGGKYHLFGNARGSVKN

|| |||||||||||||| |||||||||||||||||||||||||||||||||||||||||:

orf29-1 MNLPIQKFMMLFAAAISLLQIPISHANGLDARLRDDMQAKHYEPGGKYHLFGNARGSVKK

10 20 30 40 50 60

70 80 90 100 110 120

orf29a.pep RVYAVQTFDATAVGPILPITHERTGFEGIIGYETHFSGHGHEVHSPFDNHDSKSTSDFSG

|||||||||||||:|:||||||||||||:|||||||||||||||||||:|||||||||||

orf29-1 RVYAVQTFDATAVSPVLPITHERTGFEGVIGYETHFSGHGHEVHSPFDHHDSKSTSDFSG

70 80 90 100 110 120

130 140 150 160 170 180

orf29a.pep GVDGGFTVYQLHRTGSEIHPEDGYDGPQGSDYPPPGGARDIYXXYVKGTSTKTKSNIVPR

|||||||||||||||||||||||||||||||||||||||||| ||||||||||:||||:

orf29-1 GVDGGFTVYQLHRTGSEIHPEDGYDGPQGSDYPPPGGARDIYSYYVKGTSTKTKTNIVPQ

130 140 150 160 170 180

190 200 210 220 230 240

orf29a.pep APFSDRWLKENAGAASGFFSRADEAGKLIWESDPNKNWWANRMDDIRGIVQGAVNPFLMG

|||||||||||||||||||||||||||||||||||||||||||||:||||||||||||||

orf29-1 APFSDRWLKENAGAASGFFSRADEAGKLIWESDPNKNWWANRMDDVRGIVQGAVNPFLMG

190 200 210 220 230 240

250 260 270 280 290 300

orf29a.pep FQGVGIGAITDSAVSPVTDTAAQQTLQGXNHLGXLSPEAQLAAATALQDSAFAVKDGINS

|||||||||||||||||||||||||||| | ||||||||||||:||||||||||||||||

orf29-1 FQGVGIGAITDSAVSPVTDTAAQQTLQGINDLGKLSPEAQLAAASLLQDSAFAVKDGINS

250 260 270 280 290 300

310 320 330 340 350 360

orf29a.pep ARQWADAHPNITATAQTALAVAXAATTVWGGKKVELNPTKWDWVKNTGYXTPAVRTMHTL

|:|||||||||||||||||::| || ||| ||||||||||||||||||| ||:| |:||

orf29-1 AKQWADAHPNITATAQTALSAAEAAGTVWRGKKVELNPTKWDWVKNTGYKKPAARHMQTL

310 320 330 340 350 360

370 380 390 400 410 420

orf29a.pep DGEMAGGNRPPKSITSNSKADASTQPSLQAQLIGEQIXXGHAYNKHVIRQQEFTDLNINS

||||||||:| ||: || |: |

orf29-1 DGEMAGGNKPIKSLP-NSAAEKRKQNFEKFNSNWSSASFDSVHKTLTPNAPGILSPDKVK

370 380 390 400 410

与淋病奈瑟球菌的预计ORF的同源性

ORF29与淋病奈瑟球菌的预计ORF(ORF29.ng)在重叠的125个氨基酸内显示出有88.8％的相同性：

orf29.pep VSPVLPITHERTGFEGVIGYETHFSGHGHE 30

|:|:||||||||||||||||||||||||||

orf29ng EPGGKYHLFGNARGSVKNRVCAVQTFDATAVGPILPITHERTGFEGVIGYETHFSGHGHE 102

orf29.pep VHSPFDHHDSKSTSDFSGGVDGGFTVYQLHRTWSEIHPEDEYDGPQAAXYPPPGGARDIY 90

||||||:||||||||||||||||||||||||| ||||||| |||||:: |||||||||||

orf29ng VHSPFDNHDSKSTSDFSGGVDGGFTVYQLHRTGSEIHPEDGYDGPQGGGYPPPGGARDIY 162

orf29.pep SYYVKGTSTKTKTSIVPQAPFSDRWLEENAGAASG 125

||::||||||||:|||||||||||:|||||||

orf29ng SYHIKGTSTKTKINTVPQAPFSDRWLKENAGAASGFLSRADEAGKLIWENDPDKNWRANR 222

预计全长ORF29ng核苷酸序列<SEQ ID 169>编码的蛋白质具有氨基酸序列<SEQ ID 170>：

1 MNLPIQKFMM LFAAAISLLQ IPISHANGLD ARLRDDMQAK HYEPGGKYHL

51 FGNARGSVKN RVCAVQTFDA TAVGPILPIT HERTGFEGVI GYETHFSGHG

101 HEVHSPFDNH DSKSTSDFSG GVDGGFTVYQ LHRTGSEIHP EDGYDGPQGG

151 GYPPPGGARD IYSYHIKGTS TKTKINTVPQ APFSDRWLKE NAGAASGFLS

201 RADEAGKLIW ENDPDKNWRA NRMDDIRGIV QGAVNPFLTG FQGLGVGAIT

251 DSAVSPVTYA AARKTLQGIH NLGNLSPEAQ LAAATALQDS AFAVKDSINS

301 ARQWADAHPN ITATAQTALA VTEAATTVWG GKKVELNPAK WDWVKNTGYK

351 KPAARHMQTV DGEMAGGNKP LESKNTVTTN NFFENTGYTE KVLRQASNGD

401 YHGFPQSVDA FSENGTVIQI VGGDNIVRHK LYIPGSYKGK DGNFEYIREA

451 DGKINHRLFV PNQQLPEK*

在第二个实验中，鉴定出下列DNA序列<SEQ ID 171>：

1 atgAATTTGC CTATTCAAAA ATTCATGATG ctgttggcAg cggcaatatc

51 gatgctGCat ATCCCCATTA GTCATGCGAA CGGTTTGGAT GCCCGTTTGC

101 GCGATGATAT GCAGGCAAAA CACTACGAAC CGGGTGGCAA ATACCATCTG

151 TTTGGTAATG CTCGCGGCAG TGTTAAAAAT CGGGTTTGCG CCGTCCAAAC

201 ATTTGATGCA ACTGCGGTCG GCCCCATACT GCCTATTACA CACGAACGGA

251 CAGGATTTGA AGGTGTTATC GGCTATGAAA CCCATTTTTC AGGACACGGA

301 CACGAAGTAC ACAGTCCGTT CGATAATCAT GATTCAAAAA GCACTTCTGA

351 TTTCAGCGGC GGCGTAGACG GCGGTTTTAC CGTTTACCAA CTTCATCGGA

401 CAGGGTCGGA AATACATCCC GCAGACGGAT ATGACGGGCC TCAAGGCGGC

451 GGTTATCCGG AACCACAAGG GGCAAGGGAT ATATACAGCT ACCATATCAA

501 AGGAACTTCA ACCAAAACAA AGATAAACAC TGTTCCGCAA GCCCCTTTTT

551 CAGACCGCTG GCTAAAAGAA AATGCCGGTG CCGCTTCCGG TTTTCTCAGC

601 CGTGCGGATG AAGCAGGAAA ACTGATATGG GAAAACGACC CCGATAAAAA

651 TTGGCGGGCT AACCGTATGG ATGATATTCG CGGCATCGTC CAAGGTGCGG

701 TTAATCCTTT TTTAACGGGT TTTCAAGGGG TAGGGATTGG GGCAATTACA

751 GACAGTGCGG TAAGCCCGGT CACAGATACA GCCGCTCAGC AGACTCTACA

801 AGGTATTAAT GATTTAGGAA ATTTAAGTCC GGAAGCACAA CTTGCCGCCG

851 CGAGCCTATT ACAGGACAGT GCCTTTGCGG TAAAAGACGG CATCAATTCC

901 GCCAGACAAT GGGCTGATGC CCATCCGAAT ATAACAGCAA CAGCCCAAAC

951 TGCCCTTGCC GTAGCAGAGG CCGCAGGTAC GGTTTGGCGC GGTAAAAAAG

1001 TAGAACTTAA CCCGACCAAA TGGGATTGGG TTAAAAATAC CGGCTATAAA

1051 AAACCTGCTG CCCGCCATAT GCAGACTGTA GATGGGGAGA TGGCAGGGGG

1101 GAATAGACCG CCTAAATCTA TAACGTCGGA AGGAAAAGCT AATGCTGCAA

1151 CCTATCCTAA GTTGGTTAAT CAGCTAAATG AGCAAAACTT AAATAACATT

1201 GCGGCTCAAG ATCCAAGATT GAGTCTAGCT ATTCATGAGG GTAAAAAAAA

1251 TTTTCCAATA GGAACTGCAA CTTATGAAGA GGCAGATAGA CTAGGTAAAA

1301 TTTGGGTTGG TGAGGGTGCA AGACAAACTA GTGGAGGCGG ATGGTTAAGT

1351 AGAGATGGCA CTCGACAATA TCGGCCACCA ACAGAAAAAA AATCACAATT

1401 TGCAACTACA GGTATTCAAG CAAATTTTGA AACTTATACT ATTGATTCAA

1451 ATGAAAAAAG AAATAAAATT AAAAATGGAC ATTTAAATAT TAGGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 172；ORF29ng-1>：

1 MNLPIQKFMM LLAAAISMLH IPISHANGLD ARLRDDMQAK HYEPGGKYHL

51 FGNARGSVKN RVCAVQTFDA TAVGPILPIT HERTGFEGVI GYETHFSGHG

101 HEVHSPFDNH DSKSTSDFSG GVDGGFTVYQ LHRTGSEIHP ADGYDGPQGG

151 GYPEPQGARD IYSYHIKGTS TKTKINTVPQ APFSDRWLKE NAGAASGFLS

201 RADEAGKLIW ENDPDKNWRA NRMDDIRGIV QGAVNPFLTG FQGVGIGAIT

251 DSAVSPVTDT AAQQTLQGIN DLGNLSPEAQ LAAASLLQDS AFAVKDGINS

301 ARQWADAHPN ITATAQTALA VAEAAGTVWR GKKVELNPTK WDWVKNTGYK

351 KPAARHMQTV DGEMAGGNRP PKSITSEGKA NAATYPKLVN QLNEQNLNNI

401 AAQDPRLSLA IHEGKKNFPI GTATYEEADR LGKIWVGEGA RQTSGGGWLS

451 RDGTRQYRPP TEKKSQFATT GIQANFETYT IDSNEKRNKI KNGHLNIR*

ORF29ng-1和ORF29-1在401个氨基酸的重叠区内显示出有86.0％的相同性：

10 20 30 40 50 60

orf29ng-1.pep MNLPIQKFMMLLAAAISMLHIPISHANGLDARLRDDMQAKHYEPGGKYHLFGNARGSVKN

|||||||||||:|||||:|:|||||||||||||||||||||||||||||||||||||||:

orf29-1 MNLPIQKFMMLFAAAISLLQIPISHANGLDARLRDDMQAKHYEPGGKYHLFGNARGSVKK

10 20 30 40 50 60

70 80 90 100 110 120

orf29ng-1.pep RVCAVQTFDATAVGPILPITHERTGFEGVIGYETHFSGHGHEVHSPFDNHDSKSTSDFSG

|| ||||||||||:|:||||||||||||||||||||||||||||||||:|||||||||||

orf29-1 RVYAVQTFDATAVSPVLPITHERTGFEGVIGYETHFSGHGHEVHSPFDHHDSKSTSDFSG

70 80 90 100 110 120

130 140 150 160 170 180

orf29ng-1.pep GVDGGFTVYQLHRTGSEIHPADGYDGPQGGGYPEPQGARDIYSYHIKGTSTKTKINTVPQ

|||||||||||||||||||| ||||||||: || | ||||||||::|||||||| | |||

orf29-1 GVDGGFTVYQLHRTGSEIHPEDGYDGPQGSDYPPPGGARDIYSYYVKGTSTKTKTNIVPQ

130 140 150 160 170 180

190 200 210 220 230 240

orf29ng-1.pep APFSDRWLKENAGAASGFLSRADEAGKLIWENDPDKNWRANRMDDIRGIVQGAVNPFLTG

||||||||||||||||||:||||||||||||:||:||| ||||||:|||||||||||| |

orf29-1 APFSDRWLKENAGAASGFFSRADEAGKLIWESDPNKNWWANRMDDVRGIVQGAVNPFLMG

190 200 210 220 230 240

250 260 270 280 290 300

orf29ng-1.pep FQGVGIGAITDSAVSPVTDTAAQQTLQGINDLGNLSPEAQLAAASLLQDSAFAVKDGINS

|||||||||||||||||||||||||||||||||:||||||||||||||||||||||||||

orf29-1 FQGVGIGAITDSAVSPVTDTAAQQTLQGINDLGKLSPEAQLAAASLLQDSAFAVKDGINS

250 260 270 280 290 300

310 320 330 340 350 360

orf29ng-1.pep ARQWADAHPNITATAQTALAVAEAAGTVWRGKKVELNPTKWDWVKNTGYKKPAARHMQTV

|:|||||||||||||||||::||||||||||||||||||||||||||||||||||||||:

orf29-1 AKQWADAHPNITATAQTALSAAEAAGTVWRGKKVELNPTKWDWVKNTGYKKPAARHMQTL

310 320 330 340 350 360

370 380 390 400 410 419

orf29ng-1.pep DGEMAGGNRPPKSI-TSEGKANAATYPKLVNQLNEQNLNNIAAQDPRLSLAIHEGKKNFP

||||||||:| ||: :| :: :: |: :: : :::::

orf29-1 DGEMAGGNKPIKSLPNSAAEKRKQNFEKFNSNWSSASFDSVHKTLTPNAPGILSPDKVKT

370 380 390 400 410 420

420 430 440 450 460 470 479

orf29ng-1.pep IGTATYEEADRLGKIWVGEGARQTSGGGWLSRDGTRQYRPPTEKKSQFATTGIQANFETY

orf29-1 RYTSLDGKITIIKDNENNYFRIHDNSRKQYLDSNGNAVKTGNLQGKQAKDYLQQQTHIRN

430 440 450 460 470 480

根据该分析结果，包括该淋球菌蛋白中有一个推定的前导序列的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例21

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 173>：

1 ATGAAAAAAC AAATCACCGC AGCCGTAATG ATGCTGTCTA TGATTGCCCC

51 CGCAATGGCA AACGGCTTGG ACAATCAGGC ATTTGAAGAC CAAATGTTCC

101 ACACGCGGGC AGATGCACCG ATGCAG...

它对应于氨基酸序列<SEQ ID 174；ORF30>：

1 MKKQITAAVM MLSMIAPAMA NGLDNQAFED QMFHTRADAP MQ..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 175>：

1 ATGAAAAAAC AAATCACCGC AGCCGTAATG ATGCTGTCTA TGATTGCCCC

51 CGCAATGGCA AACGGCTTGG ACAATCAGGC ATTTGAAGAC CAAGTGTTCC

101 ACACGCGGGC AGATGCACCG ATGCAGTTGG CGGAGCTTTC TCAAAAGGAG

151 ATGAAGGAGA CAGAGGGGGC GTTTCTTCCA TTGGCTATCT TGGGTGGTGC

201 TGCCATTGGT ATGTGGACAC AGCATGGTTT TAGTTATGCA ACGACAGGCA

251 GACCAGCTTC TGTTAGAGAT GTTGCTATTG CTGGCGGATT AGGCGCAATT

301 CCTGGTGGTG TAGGCGCCGC AGGAAAGGTT GTTTCCTTTG CTAAATATGG

351 ACGTGAGATT AAAATCGGCA ATAATATGCG GATAGCCCCT TTCGGTAATA

401 GAACAGGTCA TCCTATTGGA AAATTTCCCC ATTATCATCG TCGAGTTACG

451 GATAATACGG GCAAGACTTT GCCTGGACAG GGAATTGGTC GTCATCGCCC

501 TTGGGAATCA AAATCTACGG ACAGATCATG GAAAAACCGC TTCTAA

它对应于氨基酸序列<SEQ ID 176；ORF30-1>：

1 MKKQITAAVM MLSMIAPAMA NGLDNQAFED QVFHTRADAP MQLAELSQKE

51 MKETE GAFLP LAILGGAAIG MWTQHGFSYA TTGRPASVRD VAIAGGLGAI

101 PGGVGAAGKV VSFAKYGREI KIGNNMRIAP FGNRTGHPIG KFPHYHRRVT

151 DNTGKTLPGQ GIGRHRPWES KSTDRSWKNR F*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF30与脑膜炎奈瑟球菌菌株A的ORF(ORF30a)在重叠的42个氨基酸内显示出有97.6％的相同性：

10 20 30 40

orf30.pep MKKQITAAVMMLSMIAPAMANGLDNQAFEDQMFHTRADAPMQ

|||||||||||||||||||| |||||||||||:||||||||||

orf30a MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKXTX GAFLP

10 20 30 40 50 60

orf30a LXILGGAAIGMWTQHGFSYATTGRPASVRDVAIAGGLGAIPGXVGAAGKVVSFAKYGREI

70 80 90 100 110 120

全长ORF30a核苷酸序列<SEQ ID 177>是：

1 ATGAAAAAAC AAATCACCGC AGCCGTAATG ATGCTGTCTA TGATTGCCCC

51 CGCAATGGCA AACGGCTTGG ACAATCAGGC ATTTGAAGAC CAAGTGTTCC

101 ACACGCGGGC AGATGCACCG ATGCAGTTGG CGGAGCTTTC TCAAAAGGAG

151 ATGAAGGANA CAGNGGGGGC GTTTCTTCCA TTGGNTATCT TGGGTGGTGC

201 TGCCATTGGT ATGTGGACAC AGCATGGTTT TAGTTATGCA ACGACAGGCA

251 GACCAGCTTC TGTTAGAGAT GTTGCTATTG CTGGCGGATT AGGCGCAATT

301 CCTGGTGNTG TAGGCGCCGC AGGAAAGGTT GTTTCCTTTG CTAAATATGG

351 ACGTGAGATT AAAATCGGCA ATAATATGCG GATAGCCCCT TTCGGTAATA

401 GAACAGGTCA TCCTATTGGN AAATTTCCCC ATTATCATCG TCGAGTTACG

451 GATAATACGG GCAAGACTTT GCCTGGACAG GGAATTGGTC GTCATCGCCC

501 TTGGGAATCA AAATCTACGG ACAGATCATG GAAAAACCGC TTCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 178>：

1 MKKQITAAVM MLSMIAPAMA NGLDNQAFED QVFHTRADAP MQLAELSQKE

51 MKXTX GAFLP LXILGGAAIG MWTQHGFSYA TTGRPASVRD VAIAGGLGAI

101 PGXVGAAGKV VSFAKYGREI KIGNNMRIAP FGNRTGHPIG KFPHYHRRVT

151 DNTGKTLPGQ GIGRHRPWES KSTDRSWKNR F*

ORF30a和ORF30-1在181个氨基酸的重叠区内显示出有97.8％的相同性：

orf30a.pep MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKXTXGAFLP 60

|||||||||||||||||||||||||||||||||||||||||||||||||||| | |||||

orf30-1 MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKETEGAFLP 60

orf30a.pep LXILGGAAIGMWTQHGFSYATTGRPASVRDVAIAGGLGAIPGXVGAAGKVVSFAKYGREI 120

| |||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf30-1 LAILGGAAIGMWTQHGFSYATTGRPASVRDVAIAGGLGAIPGGVGAAGKVVSFAKYGREI 120

orf30a.pep KIGNNMRIAPFGNRTGHPIGKFPHYHRRVTDNTGKTLPGQGIGRHRPWESKSTDRSWKNR 180

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf30-1 KIGNNMRIAPFGNRTGHPIGKFPHYHRRVTDNTGKTLPGQGIGRHRPWESKSTDRSWKNR 180

orf30a.pep FX

||

orf30-1 FX

与淋病奈瑟球菌的预计ORF的同源性

ORF30与淋病奈瑟球菌的预计ORF(ORF30.ng)在重叠的42个氨基酸内显示出有97.6％的相同性：

orf30.pep MKKQITAAVMMLSMIAPAMANGLDNQAFEDQMFHTRADAPMQ 42

|||||||||||||||||||||||||||||||:||||||||||

orf30ng MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKETEGAFLP 60

全长ORF30ng核苷酸序列<SEQ ID 179>是

1 ATGAAAAAAC AAATCACCGC AGCCGTAATG ATGCTGTCTA TGATCGCCCC

51 CGCAATGGCA AACGGATTGG ACAATCAGGC ATTTGAAGAC CAAGTGTTCC

101 ACACGCGGGC AGATGCGCCG ATGCAGTTGG CGGAGCTTTC TCAGAAGGAG

151 ATGAAGGAGA CTGAAGGGGC TTTTCTTCCA TTGGCTATCT TGGGTGGTGC

201 TGCCATTGGT ATGTGGACAC AGCATGGTTT TAGTTATGCA ACGACAGGCA

251 GACCAGCTTC TGTTAGAGAT GTTGCTGGCG GATTAGGCGC AATTCCTGGT

301 GATGTAGGTG CTGCAGGAAA GGTTGTTTCC TTTGCTAAAT ATGGACGTGA

351 GATTAAAATC GGCAATAATA TGCGGATAGC CCCTTTCGGT AATAGAACAG

401 GTCATCCTAT TGGAAAATTT CCCCATTATC ATCGTCGAGT TACGGATAAT

451 ACGGGCAAGA CTTTGCCTGG ACAGGGAATT GGTCGTCATC GCCCTTGGGA

501 ATCAAAATCT ACGGACAGAT CATGGAAAAA CCGCTTCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 180>：

1 MKKQITAAVM MLSMIAPAMA NGLDNQAFED QVFHTRADAP MQLAELSQKE

51 MKETEGAFLP LAILGGAAIG MWTQHGFSYA TTGRPASVRD VAGGLGAIPG

101 DVGAAGKVVS FAKYGREIKI GNNMRIAPFG NRTGHPIGKF PHYHRRVTDN

151 TGKTLPGQGI GRHRPWESKS TDRSWKNRF*

ORF30ng和ORF30-1在181个氨基酸的重叠区内显示出有98.3％的相同性：

10 20 30 40 50 60

orf30ng.pep MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKETEGAFLP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf30-1 MKKQITAAVMMLSMIAPAMANGLDNQAFEDQVFHTRADAPMQLAELSQKEMKETEGAFLP

10 20 30 40 50 60

70 80 90 100 110

orf30ng.pep LAILGGAAIGMWFQHGFSYATTGRPASVRDVA--GGLGAIPGDVGAAGKVVSFAKYGREI

|||||||||||||||||||||||||||||||| ||||||||||| ||||||||||||||

orf30-1 LAILGGAAIGMWTQHGFSYATTGRPASVRDVAIAGGLGAIPGGVGAAGKVVSFAKYGREI

70 80 90 100 110 120

120 130 140 150 160 170

orf30ng.pep KIGNNMRIAPFGNRTGHPIGKFPHYHRRVTDNTGKTLPGQGIGRHRPWESKSTDRSWKNR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf30-1 KIGNNMRIAPFGNRTGHPIGKFPHYHRRVTDNTGKTLPGQGIGRHRPWESKSTDRSWKNR

130 140 150 160 170 180

180

orf30ng.pep FX

||

orf30-1 FX

实施例22

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 181>：

1 ATGAATAAAA CTCTCTATCG TGTAATTTTC AACCGCAAAC GTGGGGCTGT

51 GrTAGCCGTT GCTGAAACTA CCAAGCGCGA AGGTAAAAGC TGTGCCGATA

101 GTGATTCAGG CAGCGCTCAT GTGAAATCTG TTCCTTTTGG TACTACTCAT

151 GCACCTGTTT GTg.CGTTaC AAATATCTTT TCTTTTTCTT TATTGGGCTT

201 TTCTTTATGT TTGGCTGTAG GtacGGyCAA TATTGCTTTT GCTGATGGCA

251 TT..

它对应于氨基酸序列<SEQ ID 182；ORF31>：

1 MNKTLYRVIF NRKRGAVXAV AETTKREGKS CADSDSGSAH VKSVPFGTTH

51 APVCXVTNIF SFSLLGFSLC LAVGTXNIAF ADGI..

进一步的工作揭示进一步的部分核苷酸序列<SEQ ID 183>：

1 ATGAATAAAA CTCTCTATCG TGTAATTTTC AACCGCAAAC GTGGGGCTGT

51 GGTAGCCGTT GCTGAAACTA CCAAGCGCGA AGGTAAAAGC TGTGCCGATA

101 GTGATTCAGG CAGCGCTCAT GTGAAATCTG TTCCTTTTGG TACTACTCAT

151 GCACCTGTTT GTCGTTCAAA TATCTTTTCT TTTTCTTTAT TGGGCTTTTC

201 TTTATGTTTG GCTGTAGGTA CGGCCAATAT TGCTTTTGCT GATGGCATT..

它对应于氨基酸序列<SEQ ID 184；ORF31-1>：

1 MNKTLYRVIF NRKRGAVVAV AETTKREGKS CADSDSGSAH VKSVPFGTTH

51 APVCRSNIFS FSLLGFSLCL AVGTANIAFA DGI..

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的预计ORF的同源性

ORF31与淋病奈瑟球菌的预计ORF(ORF31.ng)在重叠的84个氨基酸内显示出有76.2％的相同性：

orf31.pep MNKTLYRVIFNRKRGAVXAVAETTKREGKSCADSDSGSAHVKSVPFGTTHAPVCXVTNIF 60

||||||||||||||||| |||||||||||||||| |||::|||| | || :: |

orf31ng MNKTLYRVIFNRKRGAVVAVAETTKREGKSCADSGSGSVYVKSVSFIPTH------SKAF 54

orf31.pep SFSLLGFSLCLAVGTXNIAFADGI 84

|| ||||||||:|| ||||||||

orf31ng CFSALGFSLCLALGTVNIAFADGI ITDKAAPKTQQATILQTGNGIPQVNIQTPTSAGVSV 114

全长ORF31ng核苷酸序列<SEQ ID 185>是：

1 ATGAACAAAA CCCTCTATCG TGTGATTTTC AACCGCAAAC GCGGTGCTGT

51 GGTAGCTGTT GCCGAAACCA CCAAGCGCGA AGGTAAAAGC TGTGCCGATA

101 GTGGTTCGGG CAGCGTTTAT GTGAAATCCG TTTCTTTCAT TCCTACTCAT

151 TCCAAAGCCT TTTGTTTTTC TGCATTAGGC TTTTCTTTAT GTTTGGCTTT

201 GGGTACGGTC AATATTGCTT TTGCTGACGG CATTATTACT GATAAAGCTG

251 CTCCTAAAAC CCAACAAGCC ACGATTCTGC AAACAGGTaa cGGCATACCG

301 CAAGTCAATA TTCAAACCCC TACTTCGGCA GGGGTTTCTG TTAATCAATA

351 TGCCCAGTTT GATGTGGGTA ATCGCGGGGC GATTTTAAAC AACAGTCGCA

401 GCAACACCCA AACACAGCTA GGCGGTTGGA TTCAAGGCAA TCCTTGGTTG

451 ACAAGGGGCG AAGCACGTGT GGTTGTAAAC CAAATCAACA GCAGCCATCC

501 TTCACAACTG AATGGCTATA TTGAAGTGGG TGGACGACGT GCAGAAGTCG

551 TTATTGCCAA TCCGGCAGGG ATTGCAGTCA ATGGTGGTGG TTTTATCAAT

601 GCTTCCCGTG CCACTTTGAC GACAGGCCAA CCGCAATATC AAGCAGGAGA

651 CTTTAGCGGC TTTAAGATAA GGCAAGGCAA TGCTGTAATC GCCGGACACG

701 GTTTGGATGC CCGTGATACC GATTTCACAC GTATTCTTGT ATGCCAACAA

751 AATCACCTTG ATCAGTACGG CCGAACAAGC AGGCATTCGT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 186>：

1 MNKTLYRVIF NRKRGAVVAV AETTKREGKS CADSGSGSVY VKSVSFIPTH

51 SKAFCFSALG FSLCLALGTV NIAFADGIIT DKAAPKTQQA TILQTGNGIP

101 QVNIQTPTSA GVSVNQYAQF DVGNRGAILN NSRSNTQTQL GGWIQGNPWL

151 TRGEARVVVN QINSSHPSQL NGYIEVGGRR AEVVIANPAG IAVNGGGFIN

201 ASRATLTTGQ PQYQAGDFSG FKIRQGNAVI AGHGLDARDT DFTRILVCQQ

251 NHLDQYGRTS RHS*

该淋球菌蛋白与菊欧文氏菌的孔形成溶血素样HecA蛋白(登录号为L39897)在重叠的149个氨基酸内有50％的相同性：

orf31ng 96 GNGIPQVNIQTPTSAGVSVNQYAQFDVGNRGAILNNSRSN-TQTQLGGWIQGNPWLTRGE 154

GNG+P VNI TP ++G+S N+Y F+V NRG ILNN + T +QLGG IQ NP L

HecA 45 GNGVPVVNIATPDASGLSHNRYHDFNVDNRGLILNNGTARLTPSQLGGLIQNNPNLNGRA 104

Orf31ng 155 ARVVVNQINSSHPSQLNGYIEVGGRRAEVVIANPAGIAVNGGGFINASRATLTTGQPQYQ 214

A ++N++ S + S+L GY+EV G+A VV+ANP GI +G GF+N R TLTTG PQ+

HecA 105 AAAILNEVVSPNRSRLAGYLEVAGQAANVVVANPYGITCSGCGFLNTPRLTLTTGTPQFD 164

Orf31ng 215 -AGDFSGFKIRQGNAVIAGHGLDARDTDF 242

AG SG +R G+ +I G GLDA +D+

HecA 165 AAGGLSGLDVRGGDILIDGAGLDASRSDY 193

另外，ORF31ng和ORF31-1在83个氨基酸的重叠区内显示出有79.5％的相同性：

10 20 30 40 50 60

orf31-1.pep MNKTLYRVIFNRKRGAVVAVAETTKREGKSCADSDSGSAHVKSVPFGTTHAPVCRSNIFS

|||||||||||||||||||||||||||||||||| |||::|||| | || |:|

orf31ng MNKTLYRVIFNRKRGAVVAVAETTKREGKSCADSGSGSVYVKSVSFIPTH-----SKAFC

10 20 30 40 50

70 80

orf31-1.pep FSLLGFSLCLAVGTANIAFADGI

|| ||||||||:||:||||||||

orf31ng FSALGFSLCLALGTVNIAFADGIITDKAAPKTQQATILQTGNGIPQVNIQTPTSAGVSVN

60 70 80 90 100 110

根据这一发现，包括与溶血素以及粘附素有同源性，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例23

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 187>：

1 ATGAATACTC CTCCTTTTGT CTGTTGGATT TTTTGCAAGG TCATCGACAA

51 TTTCGGCGAC ATCGGCGTTT CGTGGCGGCT CGCCCGTGTT TTGCACCGCG

101 AACTCGGTTG GCAGGTGCAT TTGTGGACGG ACGATGTGTC CGCCTTGCGT

151 GCGCTTTGCC CTGATTTGCC CGATGTTCCC TGCGTTCATC AGGATATTCA

201 TGTCCGCACT TGGCATTCCG ATGCGGCAGA TATTGATACC GCG..

它对应于氨基酸序列<SEQ ID 188；ORF32>：

1 MNTPPFVCWI FCKVIDNFGD IGVSWRLARV LHRELGWQVH LWTDDVSALR

51 ALCPDLPDVP CVHQDIHVRT WHSDAADIDT A..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 189>：

1 ATGAATACTC CTCCTTTTGT CTGTTGGATT TTTTGCAAGG TCATCGACAA

51 TTTCGGCGAC ATCGGCGTTT CGTGGCGGCT CGCCCGTGTT TTGCACCGCG

101 AACTCGGTTG GCAGGTGCAT TTGTGGACGG ACGATGTGTC CGCCTTGCGT

151 GCGCTTTGCC CTGATTTGCC CGATGTTCCC TGCGTTCATC AGGATATTCA

201 TGTCCGCACT TGGCATTCCG ATGCGGCAGA TATTGATACC GCGCCTGTTC

251 CCGATGTCGT CATCGAAACT TTTGCCTGCG ACCTGCCCGA AAATGTGCTG

301 CACATTATCC GCCGACACAA GCCGCTTTGG CTGAATTGGG AATATTTGAG

351 CGCGGAGGAA AGCAATGAAA GGCTGCATCT GATGCCTTCG CCGCAGGAGG

401 GTGTTCAAAA ATATTTTTGG TTTATGGGTT TCAGCGAAAA AAGCGGCGGG

451 TTGATACGCG AACGTGATTA CTGCGAAGCC GTCCGTTTCG ATACTGAAGC

501 CCTGCGAGAG CGGCTGATGC TGCCCGAAAA AAACGCCTCC GAATGGCTGC

551 TTTTCGGCTA TCGGAGCGAT GTTTGGGCAA AGTGGCTGGA AATGTGGCGA

601 CAGGCAGGCA GCCCGATGAC ACTGTTGCTG GCGGGGACGC AAATCATCGA

651 CAGCCTCAAA CAAAGCGGCG TTATTCCGCA AGATGCCCTG CAAAACGACG

701 GCGATGTTTT TCAGACGGCA TCCGTCCGCC TCGTCAAAAT CCCTTTCGTG

751 CCGCAACAGG ACTTCGACCA ACTGCTGCAC CTTGCCGACT GCGCCGTCAT

801 CCGCGGCGAA GACAGTTTCG TGCGCGCCCA GCTTGCGGGC AAACCCTTCT

851 TTTGGCACAT CTACCCGCAA GACGAGAATG TCCATCTCGA CAAACTCCAC

901 GCCTTTTGGG ATAAGGCACA CGGTTTCTAC ACGCCCGAAA CCGTGTCGGC

951 ACACCGCCGT CTTTCGGACG ACCTCAACGG CGGAGAGGCT TTATCCGCAA

1001 CACAACGCCT CGAATGTTGG CAAACCCTGC AACAACATCA AAACGGCTGG

1051 CGGCAAGGCG CGGAGGATTG GAGCCGTTAT CTTTTCGGGC AGCCGTCAGC

1101 TCCTGAAAAA CTCGCTGCCT TTGTTTCAAA GCATCAAAAA ATACGCTAG它对应于氨基酸序列<SEQ ID 190；ORF32-1>：

1 MNTPPFVCWI FCKVIDNFGD IGVSWRLARV LHRELGWQVH LWTDDVSALR

51 ALCPDLPDVP CVHQDIHVRT WHSDAADIDT APVPDVVIET FACDLPENVL

101 HIIRRHKPLW LNWEYLSAEE SNERLHLMPS PQEGVQKYFW FMGFSEKSGG

151 LIRERDYCEA VRFDTEALRE RLMLPEKNAS EWLLFGYRSD VWAKWLEMWR

201 QAGSPMTLLL AGTQIIDSLK QSGVIPQDAL QNDGDVFQTA SVRLVKIPFV

251 PQQDFDQLLH LADCAVIRGE DSFVRAQLAG KPFFWHIYPQ DENVHLDKLH

301 AFWDKAHGFY TPETVSAHRR LSDDLNGGEA LSATQRLECW QTLQQHQNGW

351 RQGAEDWSRY LFGQPSAPEK LAAFVSKHQK IR*w

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF32与脑膜炎奈瑟球菌菌株A的ORF(ORF32a)在重叠的81个氨基酸内显示出有93.8％的相同性：

10 20 30 40 50 60

orf32.pep MNTPPFVCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDVP

|||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf32a MNTPPFSAGXFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDVX

10 20 30 40 50 60

70 80

orf32.pep CVHQDIHVRTWHSDAADIDTA

|||||||||||||||||||||

orf32a CVHQDIHVRTWHSDAADIDTAPVXDVVIETFACDLPENVLHIIRRHKPLWLXWEYLSAEX

70 80 90 100 110 120

全长ORF32a核苷酸序列<SEQ ID 191>是：

1 ATGAATACTC CTCCTTTTTC TGCTGGANTT TTTTGCAAGG TCATCGACAA

51 TTTCGGCGAC ATCGGCGTTT CGTGGCGGCT TGCCCGTGTT TTGCACCGCG

101 AACTCGGTTG GCAGGTGCAT TTGTGGACGG ACGATGTGTC CGCCTTGCGT

151 GCGCTTTGCC CTGATTTGCC CGATGTTCNC TGCGTTCATC AGGATATTCA

201 TGTCCGCACT TGGCATTCCG ATGCGGCAGA TATTGATACC GCGCCTGTTC

251 NCGATGTCGT CATCGAAACT TTTGCCTGCG ACCTGCCCGA AAATGTGCTG

301 CACATCATCC GCCGACACAA GCCGCTTTGG CTGAANTGGG AATATTTGAG

351 CGCGGAGGAN AGCAATGAAA GGCTGCACNT GATGCCTTCG CCGCAGGAGA

401 GTGTTCNAAA ATANTTTTGG TTTATGGGTT TCAGCGAANN NAGCGGCGGA

451 CTGATACGCG AACGCGATTA CTGCGAAGCC GTCCGTTTCG ATAGCGGAGC

501 CTTGCGCAAG AGGCTGATGC TTCCCGAAAA AAACGNCCCC GAATGGCTGC

551 TTTTCGGCTA TCGGAGCGAT GTTTGGGCAA AGTGGCTGGA AATGTGGCGA

601 CAGGCAGGCA GTCCGTTGAC ACTTTTGCTG GCNGGGGCGC ANATTATCGA

651 CAGCCTCAAA CAAAACGGCG TTATTCCGCA AGATGCCCTG CAAAACGACG

701 GCGATGTTTT TCAGACGGCA TCCGTCCGCC TCGTCAAAAT CCCTTTCGTG

751 CCGCAACAGG ACTTCGACAA ACTGCTGCAC CTTGCCGACT GCGCCGTCAT

801 CCGCGGCGAA GACAGTTTCG TGCGCGCCCA GCTTGCGGGC AAACCCTTCT

851 TTTGGCACAT CTACCCGCAA GATGAGAATG TCCATCTCGA CAAACTCCAC

901 GCCTTTTGGG ATAAGGCACA CGGTTTCTAC ACGCCCGAAA CCGCATCGGC

951 ACACCGCCGC CTTTCAGACG ACCTCAACGG CGGAGAGGCT TTATCCGCAA

1001 CACAACGCCT CGAATGTTGG CAAATCCTGC AACAACATCA AAACGGCTGG

1051 CGGCAAGGCG CGGAGGATTG GAGCCGTTAT CTTTTTGGGC AGCCTTCCGC

1101 ATCCGAAAAA CTCGCCGCCT TTGTTTCAAA GCATCAAAAA ATACGCTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 192>：

1 MNTPPFSAGX FCKVIDNFGD IGVSWRLARV LHRELGWQVH LWTDDVSALR

51 ALCPDLPDVX CVHQDIHVRT WHSDAADIDT APVXDVVIET FACDLPENVL

101 HIIRRHKPLW LXWEYLSAEX SNERLHXMPS PQESVXKXFW FMGFSEXSGG

151 LIRERDYCEA VRFDSGALRK RLMLPEKNXP EWLLFGYRSD VWAKWLEMWR

201 QAGSPLTLLL AGAXIIDSLK QNGVIPQDAL QNDGDVFQTA SVRLVKIPFV

251 PQQDFDKLLH LADCAVIRGE DSFVRAQLAG KPFFWHIYPQ DENVHLDKLH

301 AFWDKAHGFY TPETASAHRR LSDDLNGGEA LSATQRLECW QILQQHQNGW

351 RQGAEDWSRY LFGQPSASEK LAAFVSKHQK IR*

ORF32a和ORF32-1在382个氨基酸的重叠区内显示出有93.2％的相同性：

10 20 30 40 50 60

orf32-1.pep MNTPPFVCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDVP

|||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf32a MNTPPFSAGXFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDVX

10 20 30 40 50 60

70 80 90 100 110 120

orf32-1.pep CVHQDIHVRTWHSDAADIDTAPVPDVVIETFACDLPENVLHIIRRHKPLWLNWEYLSAEE

||||||||||||||||||||||| ||||||||||||||||||||||||||| ||||||||

orf32a CVHQDIHVRTWHSDAADIDTAPVXDVVIETFACDLPENVLHI IRRHKPLWLXWEYLSAEX

70 80 90 100 110 120

130 140 150 160 170 180

orf32-1.pep SNERLHLMPSPQEGVQKYFWFMGFSEKSGGLIRERDYCEAVRFDTEALRERLMLPEKNAS

|||||| ||||||:| | |||||||| |||||||||||||||||: |||:||||||||||

orf32a SNERLHXMPSPQESVXKXFWFMGFSEXSGGLIRERDYCEAVRFDSGALRKRLMLPEKNXP

130 140 150 160 170 180

190 200 210 220 230 240

orf32-1.pep EWLLFGYRSDVWAKWLEMWRQAGSPMTLLLAGTQIIDSLKQSGVIPQDALQNDGDVFQTA

|||||||||||||||||||||||||:||||||: |||||||:||||||||||||||||||

orf32a EWLLFGYRSDVWAKWLEMWRQAGSPLTLLLAGAXI IDSLKQNGVIPQDALQNDGDVFQTA

190 200 210 220 230 240

250 260 270 280 290 300

orf32-1.pep SVRLVKIPFVPQQDFDQLLHLADCAVIRGEDSFVRAQLAGKPFFWHIYPQDENVHLDKLH

||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||

orf32a SVRLVKIPFVPQQDFDKLLHLADCAVIRGEDSFVRAQLAGKPFFWHIYPQDENVHLDKLH

250 260 270 280 290 300

310 320 330 340 350 360

orf32-1.pep AFWDKAHGFYTPETVSAHRRLSDDLNGGEALSATQRLECWQTLQQHQNGWRQGAEDWSRY

||||||||||||||:|||||||||||||||||||||||||| ||||||||||||||||||

orf32a AFWDKAHGFYTPETASAHRRLSDDLNGGEALSATQRLECWQILQQHQNGWRQGAEDWSRY

310 320 330 340 350 360

370 380

orf32-1.pep LFGQPSAPEKLAAFVSKHQKIRX

||||||| |||||||||||||||

orf32a LFGQPSASEKLAAFVSKHQKIRX

370 380

与淋病奈瑟球菌的预计ORF的同源性

ORF32与淋病奈瑟球菌的预计ORF(ORF32.ng)在重叠的82个氨基酸内显示出有95.1％的相同性：

orf32.pep MNTPPF-VCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLP 57

||| | |||||||||||||||||||||||||||||||||||||||||||||||||||

orf32ng MVMNTYAFPVCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLP 60

orf32.pep DVPCVHQDIHVRTWHSDAADIDTA 81

||| ||||||||||||||||||||

orf32ng DVPFVHQDIHVRTWHSDAADIDTAPVPDAVIETFACDLPENVLNIIRRHKPLWLNWEYLS 120

预计ORF32ng核苷酸序列<SEQ ID 193>编码的蛋白质具有氨基酸序列<SEQ ID194>：

1 MVMNTYAFPV CWIFCKVIDN FGDIGVSWRL ARVLHRELGW QVHLWTDDVS

51 ALRALCPDLP DVPFVHQDIH VRTWHSDAAD IDTAPVPDAV IETFACDLPE

101 NVLNIIRRHK PLWLNWEYLS AEESNERLHL MPSPQEGVQK YFWFMGFSEK

151 SGGLIRERDY REAVRFDTEA LRRRLVLPEK NAPEWLLFGY RGDVWAKWLD

201 MWQQAGSLMT LLLAGAQIID SLKQSGVIPQ NALQNEGGVF QTASVRLVKI

251 PFVPQQDFDK LLHLADCAVI RGEDSFVRTQ LAGKPFFWHI YPQDENVHLD

301 KLHAFWDKAY GFYTPETASV HRLLSDDLNG GEALSATQRL ECGVL*

进一步的测序揭示了下列DNA序列<SEQ ID 195>：

1 ATGAATACAT ACGCTTTTCC TGTCTGTTGG ATTTTTTGCA AGGTCATCGA

51 CAATTTCGGC GACATCGGCG TTTCGTGGCG GCTCGCCCGT GTTTTGCACC

101 GCGAACTCGG TTGGCAGGTG CATTTGTGGA CGGACGACGT GTCCGCCTTG

151 CGCGCGCTTT GTCCCGATTT GCCCGATGTT CCCTTCGTTC ATCAGGATAT

201 TCATGTCCGC ACTTGGCATT CCGATGCGGC AGACATTGAT ACCGCGCCCG

251 TTCCCGATGC CGTTATCGAA ACTTTTGCCT GCGACCTGCC CGAAAATGTG

301 CTGAACATCA TCCGCCGACA CAAACCGCTT TGGCTGAATT GGGAATATTT

351 GAGCGCGGAG GAAAGCAATG AAAGGCTGCA CCTGATGCCT TCGCCGCAGG

401 AGGGCGTTCA AAAATATTTT TGGTTTATGG GTTTCAGCGA AAAAAGCGGC

451 GGGTTGATAC GCGAACGCGA TTACCGCGAA GCCGTCCGTT TCGATACCGA

501 AGCCCTGCGC CGGCGGCTGG TGCTGCCCGA AAAAAACGCC CCCGAATGGC

551 TGCTTTTCGG CTATCGGGGC GATGTTTGGG CAAAGTGGCT GGACATGTGG

601 CAACAGGCAG GCAGCCTGAT GACCCTACTG CTGGCGGGGG CGCAAATTAT

651 CGACAGCCTC AAACAAAGCG GCGTTATTCC GCAAAACGCC CTGCAAAAtg

701 aaggcgGTGT CTTTCagacG gcatccgTcC gccttGTCAA AAtcCCGTTC

751 GTGCcGCAAC AGGAcTTCGA CAAATTGCTG CAcctcgcCG ACTGCGCCGT

801 GATACGCGGC GAAGACAGTT TCGTGCGTAC CCAGCTTGCC GGAAAACCCT

851 TTTTTTGGCA CATCTACCCG CAAGACGAGA ATGTCCATCT CGACAAACTC

901 CACGCCTTTT GGGATAAGGC ATACGGCTTC TACACGCCCG AAACCGCATC

951 GGTGCACCGC CTCCTTTCGG ACGACCTCAA CGGCGGAGAG GCTTTATCCG

1001 CAACACAACG CCTCGAATGT TGGCAAACCC TGCAACAACA TCAAAACGGC

1051 TGGCGGCAAG GCGCGGAGGA TTGGAGCCGT TATCTTTTCG GGCAGCCTTC

1101 CGCATCCGAA AAACTCGCCG CCTTTGTTTC AAAGCATCAA AAAATACGCT

1151 AG

它编码的蛋白质具有氨基酸序列<SEQ ID 196；ORF32ng-1>：

1 MNTYAFPVCW IFCKVIDNFG DIGVSWRLAR VLHRELGWQV HLWTDDVSAL

51 RALCPDLPDV PFVHQDIHVR TWHSDAADID TAPVPDAVIE TFACDLPENV

101 LNIIRRHKPL WLNWEYLSAE ESNERLHLMP SPQEGVQKYF WFMGFSEKSG

151 GLIRERDYRE AVRFDTEALR RRLVLPEKNA PEWLLFGYRG DVWAKWLDMW

201 QQAGSLMTLL LAGAQIIDSL KQSGVIPQNA LQNEGGVFQT ASVRLVKIPF

251 VPQQDFDKLL HLADCAVIRG EDSFVRTQLA GKPFFWHIYP QDENVHLDKL

301 HAFWDKAYGF YTPETASVHR LLSDDLNGGE ALSATQRLEC WQTLQQHQNG

351 WRQGAEDWSR YLFGQPSASE KLAAFVSKHQ KIR*

ORF32ng-1和ORF32-1在383个氨基酸的重叠区内显示出有93.5％的相同性：

10 20 30 40 50 59

orf32-1.pep MNTPPF-VCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDV

||| | |||||||||||||||||||||||||||||||||||||||||||||||||||||

orf32ng-1 MNTYAFPVCWIFCKVIDNFGDIGVSWRLARVLHRELGWQVHLWTDDVSALRALCPDLPDV

10 20 30 40 50 60

60 70 80 90 100 110 119

orf32-1.pep PCVHQDIHVRTWHSDAADIDTAPVPDVVIETFACDLPENVLHIIRRHKPLWLNWEYLSAE

| ||||||||||||||||||||||||:||||||||||||||:||||||||||||||||||

orf32ng-1 PFVHQDIHVRTWHSDAADIDTAPVPDAVIETFACDLPENVLNIIRRHKPLWLNWEYLSAE

70 80 90 100 110 120

120 130 140 150 160 170 179

orf32-1.pep ESNERLHLMPSPQEGVQKYFWFMGFSEKSGGLIRERDYCEAVRFDTEALRERLMLPEKNA

||||||||||||||||||||||||||||||||||||||| |||||||||||:||:|||||

orf32ng-1 ESNERLHLMPSPQEGVQKYFWFMGFSEKSGGLIRERDYREAVRFDTEALRRRLVLPEKNA

130 140 150 160 170 180

180 190 200 210 220 230 239

orf32-1.pep SEWLLFGYRSDVWAKWLEMWRQAGSPMTLLLAGTQIIDSLKQSGVIPQDALQNDGDVFQT

||||||||:|||||||:||:|||| |||||||:||||||||||||||:||||:| ||||

orf32ng-1 PEWLLFGYRGDVWAKWLDMWQQAGSLMTLLLAGAQIIDSLKQSGVIPQNALQNEGGVFQT

190 200 210 220 230 240

240 250 260 270 280 290 299

orf32-1.pep ASVRLVKIPFVPQQDFDQLLHLADCAVIRGEDSFVRAQLAGKPFFWHIYPQDENVHLDKL

||||||||||||||||:||||||||||||||||||:||||||||||||||||||||||||

orf32ng-1 ASVRLVKIPFVPQQDFDKLLHLADCAVIRGEDSFVRTQLAGKPFFWHIYPQDENVHLDKL

250 260 270 280 290 300

300 310 320 330 340 350 359

orf32-1.pep HAFWDKAHGFYTPETVSAHRRLSDDLNGGEALSATQRLECWQTLQQHQNGWRQGAEDWSR

|||||||:|||||||||:|| |||||||||||||||||||||||||||||||||||||||

orf32ng-1 HAFWDKAYGFYTPETASVHRLLSDDLNGGEALSATQRLECWQTLQQHQNGWRQGAEDWSR

310 320 330 340 350 360

360 370 380

orf32-1.pep YLFGQPSAPEKLAAFVSKHQKIRX

|||||||| |||||||||||||||

orf32ng-1 YLFGQPSASEKLAAFVSKHQKIRX

370 380

根据这一发现，包括该淋球菌蛋白中有粘附素有特有的RGD序列的发现，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF32-1(42kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图7A显示出His-融合蛋白亲和纯化的结果，图7B显示出GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，用小鼠血清进行ELISA，得到阳性结果。这些结果确认ORF32-1是一种外露蛋白，且是一种有用的免疫原。

实施例24

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 197>：

1 ..TTGTTCCTGC GTGTNAAAGT GGGGCGTTTT TTCAGCAGTC CGGCGACGTG

51 GTTTCGGGNC AAAGACCCTG TAAATCAGGC GGTGTTGCGG CTGTATNCGG

101 ACGAGTGGCG GCA.ACTTCG GTACGTTGGA AAATAGNCGC AACGTCGCAC

151 AGCCTGTGGC TCTGCACGCT GCTCGGAATG CTGGTGTCGG TATTGTTGCT

201 GCTTTTGGTG CGGCAATATA CGTTCAACTG GGAAAGCACG CTGTTGAGCA

251 ATGCCGCTTC GGTACGCGCG GTGGAAATGT TGGCATGGCT GCCGTCGAAA

301 CTCGGTTTCC CTGTCCCCGA TGCGCGGTCG GTCATCGAAG GCCGTCTGAA

351 CGGCAATATT GCCGATGCGC GGGCTTGGTC GGGGCTGCTG GTCGNCAGTA

401 TCGCCTGCTA NGGCATCCTG CCGCGCCTG..

它对应于氨基酸序列<SEQ ID 198；ORF33>：

1 ..LFLRVKVGRF FSSPATWFRX KDPVNQAVLR LYXDEWRXTS VRWKIXATSH

51 SLWLCTLLGM LVSVLLLLLV RQYTFNWEST LLSNAASVRA VEMLAWLPSK

101 LGFPVPDARS VIEGRLNGNI ADARAWSGLL VXSIACXGIL PRL..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 199>：

1 ATGTTGAATC CATCCCGAAA ACTGGTTGAG CTGGTCCGTA TTTTGGACGA

51 AGGCGGTTTT ATTTTCAGCG GCGATCCCGT ACAGGCGACG GAGGCTTTGC

101 GCCGCGTGGA CGGCAGTACG GAGGAAAAAA TCATCCGTCG GGCGGAGATG

151 ATTGACAGGA ACCGTATGCT GCGGGAGACG TTGGAACGTG TGCGTGCGGG

201 GTCGTTCTGG TTGTGGGTGG TGGCGGCGAC GTTTGCATTT TTTACCGGTT

251 TTTCAGTCAC TTATCTTCTA ATGGACAATC AGGGTCTGAA TTTCTTTTTG

301 GTTTTGGCGG GCGTGTTGGG CATGAATACG CTGATGCTGG CAGTATGGTT

351 GGCAATGTTG TTCCTGCGTG TGAAAGTGGG GCGTTTTTTC AGCAGTCCGG

401 CGACGTGGTT TCGGGGCAAA GACCCTGTAA ATCAGGCGGT GTTGCGGCTG

451 TATGCGGACG AGTGGCGGCA ACCTTCGGTA CGTTGGAAAA TAGGCGCAAC

501 GTCGCACAGC CTGTGGCTCT GCACGCTGCT CGGAATGCTG GTGTCGGTAT

551 TGTTGCTGCT TTTGGTGCGG CAATATACGT TCAACTGGGA AAGCACGCTG

601 TTGAGCAATG CCGCTTCGGT ACGCGCGGTG GAAATGTTGG CATGGCTGCC

651 GTCGAAACTC GGTTTCCCTG TCCCCGATGC GCGGGCGGTC ATCGAAGGCC

701 GTCTGAACGG CAATATTGCC GATGCGCGGG CTTGGTCGGG GCTGCTGGTC

751 GGCAGTATCG CCTGCTACGG CATCCTGCCG CGCCTGCTGG CTTGGGTAGT

801 GTGTAAAATC CTTTTGAAAA CAAGCGAAAA CGGATTGGAT TTGGAAAAGC

851 CCTATTATCA GGCGGTCATC CGCCGCTGGC AGAACAAAAT CACCGATGCG

901 GATACGCGTC GGGAAACCGT GTCCGCCGTT TCACCGAAAA TCATCTTGAA

951 CGATGCGCCG AAATGGGCGG TCATGCTGGA GACCGAGTGG CAGGACGGCG

1001 AATGGTTCGA GGGCAGGCTG GCGCAGGAAT GGCTGGATAA GGGCGTTGCC

1051 ACCAATCGGG AACAGGTTGC CGCGCTGGAG ACAGAGCTGA AGCAGAAACC

1101 GGCGCAACTG CTTATCGGCG TGCGCGCCCA AACTGTGCCG GACCGCGGCG

1151 TGTTGCGGCA GATTGTCCGA CTCTCGGAAG CGGCGCAGGG CGGCGCGGTG

1201 GTGCAGCTTT TGGCGGAACA GGGGCTTTCA GACGACCTTT CGGAAAAGCT

1251 GGAACATTGG CGTAACGCGC TGGCCGAATG CGGCGCGGCG TGGCTTGAGC

1301 CTGACAGGGC GGCGCAGGAA GGGCGTTTGA AAGACCAATA A

它对应于氨基酸序列<SEQ ID 200；ORF33-1>：

1ML MLNPSRKLVE LVRILDEGGF IFSGDPVQAT EALRRVDGST EEKIIRRAEM

51I IDRNRMLRET LERVRAGS FW LWVVAATFAF FTGFSVTYLL MDNQGLNF FL

101 VLAGVLGMNT LMLAVWLAML FLRVKVGRFF SSPATWFRGK DPVNQAVLRL

151 YADEWRQPSV RWKIGATSHS LW LCTLLGML VSVLLLLLVR QYTFNWESTL

201 LSNAASVRAV EMLAWLPSKL GFPVPDARAV IEGRLNGNIA DARAWSG LLV

251 GSIACYGILP RLLAWVVCKI LLKTSENGLD LEKPYYQAVI RRWQNKITDA

301 DTRRETVSAV SPKIILNDAP KWAVMLETEW QDGEWFEGRL AQEWLDKGVA

351 TNREQYAALE TELKQKPAQL LIGVRAQTVP DRGVLRQIVR LSEAAQGGAV

401 VQLLAEQGLS DDLSEKLEHW RNALAECGAA WLEPDRAAQE GRLKDQ*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF33与脑膜炎奈瑟球菌菌株A的ORF(ORF33a)在重叠的143个氨基酸内显示出有90.9％的相同性：

10 20 30

orf33.pep LFLRVKVGRFFSSPATWFRXKDPVNQAVLR

||||||||||||||||||| ||||||||||

orf33a LMDNQGLNF FLVLAGVXGMNTLMLAVWLAMLFLRVKVGRFFSSPATWFRGKDPVNQAVLR

90 100 110 120 130 140

40 50 60 70 80 90

orf33.pep LYXDEWRXTSVRWKIXATSHSLW LCTLLGMLVSVLLLLLVRQYTFNWESTLLSNAASVRA

|| ||||| |||||| ||||||| ||||||||||||||||| |||||||||||||::::|||

orf33a LYADEWRXPSVRWKIGATSHSLW LCTLLGMLVSVLLLLLVRQYTFNWESTLLGDSSSVRL

150 160 170 180 190 200

100 110 120 130 140

orf33.pep VEMLAWLPSKLGFPVPDARSVIEGRLNGNIADARAWSG LLVXSIACXGILPRL

||||||||:||||||||||:||||||||||||||||||||| |||| ||||||

orf33a VEMLAWLPAKLGFPVPDARAVIEGRLNGNIADARAWSG LLVGSIACYGILPRLLAWAVCK

210 220 230 240 250 260

orf33a ILXXTSENGLDLEKXXXXXXIRRWQNKITDADTRRETVSAVSPKIVLNDAPKWAVMLETE

270 280 290 300 310 320

全长ORF33a核苷酸序列<SEQ ID 201>是：

1 ATGTTGAATC CATCCCGAAA ACTGGTTGAG CTGGTCCGTA TTTTGGAAGA

51 AGGCGGCTTT ATTTTCAGCG GCGATCCCGT GCAGGCGACG GAGGCTTTGC

101 GCCGCGTGGA CGGCAGTACG GAGGAAAAAA TCATCCGTCG GGCGAAGATG

151 ATCGACAGGA ACCGTATGCT GCGGGAGACG TTGGAACGTG TGCGTGCGGG

201 GTCGTTCTGG TTGTGGGTGG CGGCGGCGAC GTTTGCGTTT NTTACCGNTT

251 TTTCAGTTAC TTATCTTCTA ATGGACAATC AGGGTCTGAA TTTCTTTTTG

301 GTTTTGGCGG GCGTGNTGGG CATGAATACG CTGATGCTGG CAGTATGGTT

351 GGCAATGTTG TTCCTGCGCG TGAAAGTGGG GCGTTTTTTC AGCAGTCCGG

401 CGACGTGGTT TCGGGGCAAA GACCCTGTCA ATCAGGCGGT GTTGCGGCTG

451 TATGCGGACG AGTGGCGGCN ACCTTCGGTA CGTTGGAAAA TAGGCGCAAC

501 GTCGCACAGC CTGTGGCTCT GCACGCTGCT CGGAATGCTG GTGTCGGTAT

551 TGTTGCTGCT TTTGGTGCGG CAATATACGT TCAACTGGGA AAGCACGCTG

601 TTGGGCGATT CGTCTTCGGT ACGGCTGGTG GAAATGTTGG CATGGCTGCC

651 TGCGAAACTG GGTTTTCCCG TGCCTGATGC GCGGGCGGTC ATCGAAGGTC

701 GTCTGAACGG CAATATTGCC GATGCGCGGG CTTGGTCGGG GCTGCTGGTC

751 GGCAGTATCG CCTGCTACGG CATCCTGCCG CGCCTCTTGG CTTGGGCGGT

801 ATGCAAAATC CTTNTGNAAA CAAGCGAAAA CGGCTTGGAT TTGGAAAAGC

851 NCNNNNNTCN NNCGNTCATC CGCCGCTGGC AGAACAAAAT CACCGATGCG

901 GATACGCGTC GGGAAACCGT GTCCGCCGTT TCGCCGAAAA TCGTCTTGAA

951 CGATGCGCCG AAATGGGCGG TCATGCTGGA GACCGAATGG CAGGACGGCG

1001 AATGGTTCGA GGGCAGGCTG GCGCAGGAAT GGCTGGATAA GGGCGTTGCC

1051 GCCAATCGGG AACAGGTTGC CGCGCTGGAG ACAGAGCTGA AGCAGAAACC

1101 GGCGCAACTG CTTATCGGCG TGCGCGCCCA AACTGTGCCC GACCGCGGCG

1151 TGTTGCGGCA GATCGTCCGA CTTTCGGAAG CGGCGCAGGG CGGCGCGGTG

1201 GTGCANCTTT TGGCGGAACA GGGGCTTTCA GACGACCTTT CGGAAAAGCT

1251 GGAACATTGG CGTAACGCGC TGACCGAATG CGGCGCGGCG TGGCTGGAAC

1301 CCGACAGAGC GGCGCAGGAA GGCCGTCTGA AAACCAACGA CCGCACTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 202>：

1 MLNPSRKLVE LVRILEEGGF IFSGDPVQAT EALRRVDGST EEKIIRRAKM

51 IDRNRMLRET LERVRAGS FW LWVAAATFAF XTXFSVTYLL MDNQGLNF FL

101 VLAGVXGMNT LMLAVWLAML FLRVKVGRFF SSPATWFRGK DPVNQAVLRL

151 YADEWRXPSV RWKIGATSHS LW LCTLLGML VSVLLLLLVR QYTFNWESTL

201 LGDSSSVRLV EMLAWLPAKL GFPVPDARAV IEGRLNGNIA DARAWSG LLV

251 GSIACYGILP RLLAWAVCKI LXXTSENGLD LEKXXXXXXI RRWQNKITDA

301 DTRRETVSAV SPKIVLNDAP KWAVMLETEW QDGEWFEGRL AQEWLDKGVA

351 ANREQVAALE TELKQKPAQL LIGVRAQTVP DRGVLRQIVR LSEAAQGGAV

401 VXLLAEQGLS DDLSEKLEHW RNALTECGAA WLEPDRAAQE GRLKTNDRT*

ORF33a和ORF33-1在444个氨基酸的重叠区内显示出有94.1％的相同性：

10 20 30 40 50 60

orf33a.pep MLNPSRKLVELVRILEEGGFIFSGDPVQATEALRRVDGSTEEKIIRRAKMIDRNRMLRET

|||||||||||||||:||||||||||||||||||||||||||||||||:|||||||||||

orf33-1 MLNPSRKLVELVRILDEGGFIFSGDPVQATEALRRVDGSTEEKIIRRAEMIDRNRMLRET

10 20 30 40 50 60

70 80 90 100 110 120

orf33a.pep LERVRAGSFWLWVAAATFAFXTXFSVTYLLMDNQGLNFFLVLAGVXGMNTLMLAVWLAML

||||||||||||||||:|||||| | ||||||||||||||||||| ||||||||||||||

orf33-1 LERVRAGSFWLWVVAATFAFFTGFSVTYLLMDNQGLNFFLVLAGVLGMNTLMLAVWLAML

70 80 90 100 110 120

130 140 150 160 170 180

orf33a.pep FLRVKVGRFFSSPATWFRGKDPVNQAVLRLYADEWRXPSVRWKIGATSHSLWLCTLLGML

|||||||||||||||||||||||||||||||||||| |||||||||||||||||||||||

orf33-1 FLRVKVGRFFSSPATWFRGKDPVNQAVLRLYADEWRQPSVRWKIGATSHSLWLCTLLGML

130 140 150 160 170 180

190 200 210 220 230 240

orf33a.pep VSVLLLLLVRQYTFNWESTLLGDSSSVRLVEMLAWLPAKLGFPVPDARAVIEGRLNGNIA

|||||||||||||||||||||::::||| ||||||||:||||||||||||||||||||||

orf33-1 VSVLLLLLVRQYTFNWESTLLSNAASVRAVEMLAWLPSKLGFPVPDARAVIEGRLNGNIA

190 200 210 220 230 240

250 260 270 280 290 300

orf33a.pep DARAWSGLLVGSIACYGILPRLLAWAVCKILXXTSENGLDLEKXXXXXXIRRWQNKITDA

|||||||||||||||||||||||||:||||| |||||||||| |||||||||||

orf33-1 DARAWSGLLVGSIACYGILPRLLAWVVCKILLKTSENGLDLEKPYYQAVIRRWQNKITDA

250 260 270 280 290 300

310 320 330 340 350 360

orf33a.pep DTRRETVSAVSPKIVLNDAPKWAVMLETEWQDGEWFEGRLAQEWLDKGVAANREQVAALE

||||||||||||||:|||||||||||||||||||||||||||||||||||:|||||||||

orf33-1 DTRRETVSAVSPKIILNDAPKWAVMLETEWQDGEWFEGRLAQEWLDKGVATNREQVAALE

310 320 330 340 350 360

370 380 390 400 410 420

orf33a.pep TELKQKPAQLLIGVRAQTVPDRGVLRQIVRLSEAAQGGAVVXLLAEQGLSDDLSEKLEHW

||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||

orf33-1 TELKQKPAQLLIGVRAQTVPDRGVLRQIVRLSEAAQGGAVVQLLAEQGLSDDLSEKLEHW

370 380 390 400 410 420

430 440 450

orf33a.pep RNALTECGAAWLEPDRAAQEGRLKTNDRTX

||||:|||||||||||||||||||

orf33-1 RNALAECGAAWLEPDRAAQEGRLKDQX

430 440

与淋病奈瑟球菌的预计ORF的同源性

ORF33与淋病奈瑟球菌的预计ORF(ORF33.ng)在重叠的143个氨基酸内显示出有91.6％的相同性：

orf33.pep LFLRVKVGRFFSSPATWFRXKDPVNQAVLR 30

||||||||||||||||||| | ||||||||

orf33ng LMDNQGLNFFLVLAGVLGMNTLMLAVWLATLFLRVKVGRFFSSPATWFRGKGPVNQAVLR 100

orf33.pep LYXDEWRXTSVRWKIXATSHSLWLCTLLGMLVSVLLLLLVRQYTFNWESTLLSNAASVRA 90

|| |:|| |||||| ||:|||||||||||||||||||||||||||||||||||||||||

orf33ng LYADQWRQPSVRWKIGATAHSLWLCTLLGMLVSVLLLLLVRQYTFNWESTLLSNAASVRA 160

orf33.pep VEMLAWLPSKLGFPVPDARSVIEGRLNGNIADARAWSGLLVXSIACXGILPRL 143

|||||||||||||||||||:||||||||||||||||||||| ||:| ||||||

orf33ng VEMLAWLPSKLGFPVPDARAVIEGRLNGNIADARAWSGLLVGSIVCYGILPRLLAWVVCK 220

预计ORF33ng核苷酸序列<SEQ ID 203>编码的蛋白质具有氨基酸序列<SEQ ID204>：

1 MIDRDRMLRD TLERVRAGS F WLWVVVASMM FTAGFSGTYL LMDNQGLNFF

51 LVLAGVLGMN TLMLAVWLAT LFLRVKVGRF FSSPATWFRG KGPVNQAVLR

101 LYADQWRQPS VRWKIGATAH SLW LCTLLGM LVSVLLLLLV RQYTFNWEST

151 LLSNAASVRA VEMLAWLPSK LGFPVPDARA VIEGRLNGNI ADARAWSG LL

201 VGSIVCYGIL PRLLAWVVCK ILLKTSENGL DLEKTYYQAV IRRWQNKITD

251 ADTRRETVSA VSPKIVLNDA PKWALMLETE WQDGQWFEGR LAQEWLDKGV

301 AANREQVAAL ETELKQKPAQ LLIGVRAQTV PDRGVLRQIV RLSEAAQGGA

351 VVQLLAEQGL SDDLSEKLEH WRNALTECGA AWLEPDRVAQ EGRLKDQ*

进一步的序列分析揭示了下列DNA序列<SEQ ID 205>：

1 ATGTTGaatC CATCCCgaAA ACTGgttgag ctGgTCCgtA Ttttgaataa

51 agggggtTTT attttcagcg gcgatcctgt gcaggcgacg gaggctttgc

101 gccgcgtgga cggcAGTACG GAggAaaaaa tcttccgtcg GGCGGAGAtg

151 atcgACAGGg accgtatgtt gcgggACaCg TtggaacGTG TGCGTGCggg

201 gtcgtTctgG TTATGGGTGG TggtggCAtC gATGATGTtt aCCGCCGGAT

251 TTTCAGgcac ttatCttCTG ATGGACaatC AGGGGCtGAA TtTCTTTTTA

301 GTTTTggcgG GAGTGTtggG CATGaatacG ctgATGCTGG CAGTATGGtt

351 gGCAACGTTG TTCCTGCGCG TGAAAGTGGG ACGGTTTTTC AGCAGTCCGG

401 CGACGTGGTT TCGGGGCAAA GGCCCTGTAA ATCAGGCGGT GTTGCGGCTG

451 TATGCGGACC AGTGGCGGCA ACCTTCGGTA CGATGGAAAA TAGGCGCAAC

501 GGCGCACAGC TTGTGGCTCT GCACGCTGCT CGGAATGCTG GTGTCGGTAT

551 TGCTGCTGCT TTTGGTGCGG CAATATACGT TCAACTGGGA AAGCACGCTG

601 TTGAGCAATG CCGCTTCGGT ACGCGCGGTG GAAATGTTGG CATGGCTGCC

651 GTCGAAACTC GGTTTCCCTG TCCCCGATGC GCGGGCGGTC ATCGAAGGTC

701 GTCTGAACGG CAATATTGCC GATGCGCGGG CTTGGTCGGG GCTGCTGGTC

751 GGCAGTATCG TCTGCTACGG CATCCTGCCG CGCCTCTTGG CTTGGGTAGT

801 GTGTAAAATC CTTTTGAAAA CAAGCGAAAA CGGattgGAT TTGGAAAAAA

851 CCTATTATCA GGCGGTCATC CGCCGCTGGC AGAACAAAAT CACCGATGCG

901 GATACGCGTC GGGAAACCGT GTCCGCCGTT TCGCcgaAAA TCGTCTTGAA

951 CGATGCGCCG AAATGGGCGC TCATGCTGGA GACCGAGTGG CAGGACGGCC

1001 AATGGTTCGA GGGCAGGCTG GCGCAGGAAT GGCTGGATAA GGGCGTTGCC

1051 GCCAATCGGG AACAGGTTGC CGCGCTGGAG ACAGAGCTGA AGCAGAAACC

1101 GGCGCAACTG CTTATCGGCG TACGCGCCCA AACTGTGCCG GACCGGGGCG

1151 TGCTGCGGCA GATTGTGCGG CTTTCGGAAG CGGCGCAGGG CGGCGCGGTG

1201 GTGCAGCTTT TGGCGGAACA GGGGCTTTCA GACGACCTTT CGGAAAAGCT

1251 GGAACATTGG CGTAACGCGC TGACCGAATG CGGCGCGGCG TGGCTTGAGC

1301 CTGACAGGGT GGCGCAGGAA GGCCGTTTGA AAGACCAATA A

它编码的蛋白质具有氨基酸序列<SEQ ID 206；ORF33ng-1>：

1 MLNPSRKLVE LVRILNKGGF IFSGDPVQAT EALRRVDGST EEKIFRRAEM

51 IDRDRMLRDT LERVRAGS FW LWVVVASMMF TAGFSGTYLL MDNQGLNF FL

101 VLAGVLGMNT LMLAVWLATL FLRVKVGRFF SSPATWFRGK GPVNQAVLRL

151 YADQWRQPSV RWKIGATAHS LW LCTLLGML VSVLLLLLVR QYTFNWESTL

201 LSNAASVRAV EMLAWLPSKL GFPVPDARAV IEGRLNGNIA DARAWSG LLV

251 GSIVCYGILP RLLAWVVCKI LLKTSENGLD LEKTYYQAVI RRWQNKITDA

301 DTRRETVSAV SPKIVLNDAP KWALMLETEW QDGQWFEGRL AQEWLDKGVA

351 ANREQVAALE TELKQKPAQL LIGVRAQTVP DRGVLRQIVR LSEAAQGGAV

401 VQLLAEQGLS DDLSEKLEHW RNALTECGAA WLEPDRVAQE GRLKDQ*

ORF33ng-1和ORF33-1在446个氨基酸的重叠区内显示出有94.6％的相同性：

10 20 30 40 50 60

orf33-1.pep MLNPSRKLVELVRILDEGGFIFSGDPVQATEALRRVDGSTEEKIIRRAEMIDRNRMLRET

||||||||||||||::||||||||||||||||||||||||||||:||||||||:||||:|

orf33ng-1 MLNPSRKLVELVRILNKGGFIFSGDPVQATEALRRVDGSTEEKIFRRAEMIDRDRMLRDT

10 20 30 40 50 60

70 80 90 100 110 120

orf33-1.pep LERVRAGSFWLWVVAATFAFFTGFSVTYLLMDNQGLNFFLVLAGVLGMNTLMLAVWLAML

||||||||||||||:|:: | :||| |||||||||||||||||||||||||||||||| |

orf33ng-1 LERVRAGSFWLWVVVASMMFTAGFSGTYLLMDNQGLNFFLVLAGVLGMNTLMLAVWLATL

70 80 90 100 110 120

130 140 150 160 170 180

orf33-1.pep FLRVKVGRFFSSPATWFRGKDPVNQAVLRLYADEWRQPSVRWKIGATSHSLWLCTLLGML

|||||||||||||||||||| ||||||||||||:|||||||||||||:||||||||||||

orf33ng-1 FLRVKVGRFFSSPATWFRGKGPVNQAVLRLYADQWRQPSVRWKIGATAHSLWLCTLLGML

130 140 150 160 170 180

190 200 210 220 230 240

orf33-1.pep VSVLLLLLVRQYTFNWESTLLSNAASVRAVEMLAWLPSKLGFPVPDARAVIEGRLNGNIA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf33ng-1 VSVLLLLLVRQYTFNWESTLLSNAASVRAVEMLAWLPSKLGFPVPDARAVIEGRLNGNIA

190 200 210 220 230 240

250 260 270 280 290 300

orf33-1.pep DARAWSGLLVGSIACYGILPRLLAWVVCKILLKTSENGLDLEKPYYQAVIRRWQNKITDA

|||||||||||||:||||||||||||||||||||||||||||| ||||||||||||||||

orf33ng-1 DARAWSGLLVGSIVCYGILPRLLAWVVCKILLKTSENGLDLEKTYYQAVIRRWQNKITDA

250 260 270 280 290 300

310 320 330 340 350 360

orf33-1.pep DTRRETVSAVSPKIILNDAPKWAVMLETEWQDGEWFEGRLAQEWLDKGVATNREQVAALE

||||||||||||||:||||||||:|||||||||:||||||||||||||||:|||||||||

orf33ng-1 DTRRETVSAVSPKIVLNDAPKWALMLETEWQDGQWFEGRLAQEWLDKGVAANREQVAALE

310 320 330 340 350 360

370 380 390 400 410 420

orf33-1.pep TELKQKPAQLLIGVRAQTVPDRGVLRQIVRLSEAAQGGAVVQLLAEQGLSDDLSEKLEHW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf33ng-1 TELKQKPAQLLIGVRAQTVPDRGVLRQIVRLSEAAQGGAVVQLLAEQGLSDDLSEKLEHW

370 380 390 400 410 420

430 440

orf33-1.pep RNALAECGAAWLEPDRAAQEGRLKDQX

||||:|||||||||||:||||||||||

orf33ng-1 RNALTECGAAWLEPDRVAQEGRLKDQX

430 440

根据该淋球菌蛋白中存在几个推定的跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例25

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 207>：

1 ..CAGAAGAGTT TGTCGAGAAT TTCTTTATGG GGTTTGGGCG GCGTGTTTTT

51 CGGGGTGTCC GGTCTGGTAT GGTTTTCTTT GGGCGTTTCT TT.GAGTGCG

101 CCTGTTTTTC GGGTGTTTCT TTTCGGGGTT CGGGACGGGG GACGTTTGTG

151 GGCAGTACGG GGGTTTCTTT GAGTGTGTTT TCAGCTTGTG TTCC.GGCGT

201 CGTCCGGCTG CCTGTCGGTT TGAGCTGTGT CGGCAGGTTG CG..GTTTGA

251 CCCGGTTTTT CTTGGGTGCG GCAGGGGACG TCATTCTCCT GCCGCTTTCG

301 TCTGTGCCGT CCGGCTGTGC GGGTTCGGAT GAGGCGGCGT GGTGGTGTTC

351 GGGTTGGGCG GCATCTTGT CCGACTACGC CGTTTGGCAG CCAGAATTCG

401 GTTTCGCGGG GGCTGTCGGT GTGTTGCGGT TCGGCTTGAA GGGTTTTGTC

451 GTCC..

它对应于氨基酸序列<SEQ ID 208；ORF34>：

1 ..QKSLSRISLW GLGGVFFGVS GLVWFSLGVS XECACFSGVS FRGSGRGTFV

51 GSTGVSLSVF SACVXGVVRL PVGLSCVGRL XXLTRFFLGA AGDVILLPLS

101 SVPSGCAGSD EAAWWCSGWA ASCPTTPFGS QNSVSRGLSV CCGSA*RVLS

151 S..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 209>：

1 ATGATGATGC CGTTCATAAT GCTTCCTTGG ATTGCkGGTG TGCCTGCCGT

51 GCCGGGTCAG AATAGGTTGT CCAGAATTTC TTTATGGGGT TTGGGCGGCG

101 TGTTTTTCGG GGTGTCCGGT TTGGTATGGT TTTCTTTGGG CGTTTCTTTG

151 GGCTGCGCCT GTTTTTCGGG TGTTTCTTTT CGGGGTTCGG GACGGGGGAC

201 GTTTGTGGGC AGTACGGGGG TTTCTTTGAG TGTGTTTTCA GCTTGTGTTC

251 CGGCGTCGTC CGGCTGCCTG TCGGTTTGAG CTGTGTCGGC AGGTTGCGGT

301 TTGACCCGGT TTTTCTTGGG TGCGGCAGGG GACGGCAGTC CGCTGCCGCT

351 TTCGTCTGTG CCGTCCGGCT GTGCGGGTTC GGATGAGGCG GCGTGGTGGT

401 GTTCGGGTTG GGCGGCATCT TGTCCGACTA CGCCGTTTGG CAGCCAGAAT

451 TCGGTTTCGC GGGGGCTGTC GGTGTGTTGC GGTTCGGCTT GAAGGGTTTT

501 GTCGCCGTTC GGGTTGAATG TGCTGACGAT GCCTATTGCC AATGCGCCGA

551 TGGCGGCGAT ACAGATGAGC AATACGGCGC GTATCAGGAG TTTGGGGGTC

601 AGCCTGAAGG GTTTGTTCGG TTTTTTTGCC ATTTTGATTG TGCTTTTGGG

651 GTGTCGGGCA ATGCCGTCTG AAGGCGGTTC AGACGGCATT GCCGAGTCAG

701 CGTTGGACGT AGTTTTGGTA GAGGGTGATG ACTTTTTGTA CGCCGACGGT

751 GGTGCTGACT TTTTGGGTAA TCTGCGCCTG TTCTTCGGGG GTGAGGATGC

801 CCATAACGTA GGTTACGTTG CCGTAGGTAA CGATTTTGAC GCGCGCCTGT

851 GTGGCGGGGC TGATGCCCAA CAGCGTGGCG CGGACTTTGG ATGTGTTCCA

901 AGTGTCGCCG GCGATGTCGC CGGCAGTGCG CGGCAGGGAG GCGACGGTAA

951 TATAGTTGTA CACGCCTTCG GCGGCCTGTT CGGAACGTGC AATCTGACCG

1001 ACGAACTGTT TTTCGCCTTC GGTGGCGACT TGTCCGAGCA GCAGCAGGTG

1051 GCGGTTGTAG CCGACGACGG AGATTTGGGG CGTGTAGCCT TTGGTTTGGT

1101 TGTTTTGGCG CAGATAGGAA CGGGCGGTGG TTTCGATACG CAACGCCATA

1151 ACGTTGTCGT CGGTTTGCGC GCCGGTGGTT CGGCGGTCGA CGGCGGATTT

1201 CGCGCCGACG GCGGCGCTTC CGATTACTGC GCTGACGCAG CCGCTAAGGG

1251 CAAGGCTGAA AATGGCGGCA ATCAGGGTGC GGACGGTGTG CGGTTTGGGT

1301 TTCATCGGGT GCTTCCTTTC TTGGGCGTTT CAGACGGCAT TGCTTTGCGC

1351 CATGCCGTCT GA

它对应于氨基酸序列<SEQ ID 210；ORF34-1>：

1 MMMPFIMLPW IAGVPAVPGQ NRLSR ISLWG LGGVFFGVSG LVWFSLG VSL

51 GCACFSGVSF RGSGRGTFVG STGVSLSVFS ACVPASSGCL SV*AVSAGCG

101 LTRFFLGAAG DGSPLPLSSV PSGCAGSDEA AWWCSGWAAS CPTTPFGSQN

151 SVSRGLSVCC GSA*RVLSPF GLNVLTMPIA NAPMAAIQMS NTARIRSLG V

201 SLKGLFGFFA ILIVLLGCRA MPSEGGSDGI AESALDVVLV EGDDFLYADG

251 GADFLGNLRL FFGGEDAHNV GYVAVGNDFD ARLCGGADAQ QRGADFGCVP

301 SVAGDVAGSA RQGGDGNIVV HAFGGLFGTC NLTDELFFAF GGDLSEQQQV

351 AVVADDGDLG R VAFGLVVLA QIGTGGGFDT QRHNVVVGLR AGGSAVDGGF

401 RADGGASDYC ADAAAKGKAE NGGNQGADGV RFGFHRVLPF LGVSDGIALR

451 HAV*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF34与脑膜炎奈瑟球菌菌株A的ORF(ORF34a)在重叠的161个氨基酸内显示出有73.3％的相同性：

10 20 30

orf34.pep QKSLSR ISLWGLGGVFFGVSGLVWFSLG VSXE------CAC

|| ||| |||||| |||||||||| ||||| ||| |||

orf34a MMXPXIMLPWIAGVPAVPGQKRLSR XSLWGLGGXFFGVSGLVWFSLG VSXSLGVSXGCAC

10 20 30 40 50 60

40 50 60 70 80 90

orf34.pep FSGVSFRGSGRG TFVGSTGVSLSVFSACVXGVVRLPVGLSCVGRLXX-----LTRFFLGA

|||| |||||||| ||||||||||||||||: |:: :|:: ||| | ||

orf34a FSGVSFRGSGRG TFVGSTGVSLSVFSACA------PASSGCLSVXAVSAGCGLTRXFXGA

70 80 90 100 110

100 110 120 130 140 150

orf34.pep AGDVILLPLSSVPSGCAGSDEAAWWCSGWAASCPTTPFGSQNSVSRGLSVCCGSAXRVLS

||| ||||||||||||:|| | |||||||||||||||||||||||||||||: ||||

orf34a AGDGSPLPLSSVPSGCAGADEEAXXCSGWAASCPTTPFGSQNSVSRGLSVCCGSVWRVLS

120 130 140 150 160 170

orf34.pep S

orf34a PFGXNVLTMPIANAPMAVIQMSNTARIRSL GVSLKGLFXFFAILIVLLGCRAMPSEGGSD

180 190 200 210 220 230

全长ORF34a核苷酸序列<SEQ ID 211>是：

1 ATGATGATNC CGTTNATAAT GCTTCCTTGG ATTGCGGGTG TGCCTGCCGT

51 GCCGGGTCAG AAGAGGTTGT CGAGAANTTC TTTATGGGGT TTAGGCGGCN

101 TGTTTTTCGG GGTGTCCGGT TTGGTATGGT TTTCTTTGGG CGTTTCTNTT

151 TCTTTGGGTG TTTCTNTGGG CTGTGCCTGT TTTTCGGGTG TTTCTTTTCG

201 GGGTTCGGGA CGGGGGACGT TTGTGGGCAG TACNGGGGTT TCTTTGAGTG

251 TGTTTTCAGC TTGTGCTCCG GCGTCGTCCG GCTGCCTGTC GGTTTNAGCT

301 GTGTCGGCAG GTTGCGGTTT GACCCGGNTT TTCTTNGGTG CGGCAGGGGA

351 CGGCAGTCCG CTGCCGCTTT CGTCTGTGCC GTCCGGCTGT GCGGGTGCGG

401 ATGAGGAGGC GTNGTNGTGT TCGGGTTGGG CGGCATCTTG TCCGACTACG

451 CCGTTTGGCA GCCAGAATTC GGTTTCGCGG GGGCTGTCGG TGTGTTGCGG

501 TTCGGTNTGG AGGGTTTTGT CNCCGTTCGG GTNGAATGTG CTGACGATGC

551 CTATTGCCAA TGCGCCGATG GCGGTGATAC AGATGAGCAA TACGGCGCGT

601 ATCAGGAGTT TGGGGGTCAG CCTGAAGGGT TTGTTCNGTT TTTTTGCCAT

651 TTTGATTGTG CTTTTGGGGT GTCGGGCAAT GCCGTCTGAA GGCGGTTCAG

701 ACGGCATTGC CGAGTCAGCG TTGGACGTAG TTTNGGTAGA GGGTGATGAC

751 TTTTTGTACG CCGACGGTGG TGCTGACTTT TTGGGTAATC TGCGCCTGTT

801 CTTCGGGGGT GAGGATGCCC ATAACGTAGG TTACGTTGCC GTAGGTAACG

851 ATTTTGACGC GCGCCTGTGT GGCGGGGCTG ATGCCCAACA GCGTGGCGCG

901 GACTTTGGAT GTGTTCCAAG TGTCGCCGGC GATGTCGCCG GCAGTGCGCG

951 GCAGGGAGGC GACGGTAATG TANTTGTACA CGCCTTCGGC GGCCTGTTCG

1001 GAACGTGCAA TCTGACCGAC GAACTGTTTC TCGCCTTCGG TGGCGACTTG

1051 TCCGAGCAGC AGCAGGTGGC GGTTGTAGCC GACAACGGAG ATTTGGGGCG

1101 TGTANCCTTT GGTTTGGTTG TTTTGGCGCA GATAGGAGCG GGCGGTGGTT

1151 TCGATACGCA GCGCCATTAC GTTGTCGTCG GTTNGCGCGC CGGTGGTTCG

1201 GCGGTCGACG GCGGATTTCG CGCCGACCGC CGCGCCGCCG ACGACTGCGC

1251 TGACGCAGCC GCCGAGGGCA AGGCTGAGGA CGGCGGCAGT CAGGGTGCGG

1301 ACGGTGTGCG GTTTGGGTTT CATCGGGTGC TTCCTTTCTT GGGCGTTTCA

1351 GACGGCATTG CTTTGCGCCA TGCCGTCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 212>：

1 MMXPXIMLPW IAGVPAVPGQ KRLSR XSLWG LGGXFFGVSG LVWFSLG VSX

51 SLGVSXGCAC FSGVSFRGSG RG TFVGSTGV SLSVFSACAP ASSGCLSVXA

101 VSAGCGLTRX FXGAAGDGSP LPLSSVPSGC AGADEEAXXC SGWAASCPTT

151 PFGSQNSVSR GLSVCCGSVW RVLSPFGXNV LTMPIANAPM AVIQMSNTAR

201 IRSL GVSLKG LFXFFAILIV LLGCRAMPSE GGSDGIAESA LDVVXVEGDD

251 FLYADGGADF LGNLRLFFGG EDAHNVGYVA VGNDFDARLC GGADAQQRGA

301 DFGCVPSVAG DVAGSARQGG DGNVXVHAFG GLFGTCNLTD ELFLAFGGDL

351 SEQQQVAVVA DNGDLGR VXF GLVVLAQIGA GGGFDTQRHY VVVGXRAGGS

401 AVDGGFRADR RAADDCADAA AEGKAEDGGS QGADGVRFGF HRVLPFLGVS

451 DGIALRHAV*

ORF34a和ORF34-1在459个氨基酸的重叠区内显示出有91.3％的相同性：

10 20 30 40 50 60

orf34a.pep MMXPXIMLPWIAGVPAVPGQKRLSRXSLWGLGGXFFGVSGLVWFSLGVSXSLGVSXGCAC

|| | |||||||||||||||:|||| ||||||| ||||||||||||||| ||||

orf34-1 MMMPFIMLPWIAGVPAVPGQNRLSRISLWGLGGVFFGVSGLVWFSLGVSL------GCAC

10 20 30 40 50

70 80 90 100 110 120

orf34a.pep FSGVSFRGSGRGTFVGSTGVSLSVFSACAPASSGCLSVXAVSAGCGLTRXFXGAAGDGSP

||||||||||||||||||||||||||||:|||||||||||||||||||| | ||||||||

orf34-1 FSGVSFRGSGRGTFVGSTGVSLSVFSACVPASSGCLSVXAVSAGCGLTRFFLGAAGDGSP

60 70 80 90 100 110

130 140 150 160 170 180

orf34a.pep LPLSSVPSGCAGADEEAXXCSGWAASCPTTPFGSQNSVSRGLSVCCGSVWRVLSPFGXNV

||||||||||||:|| | |||||||||||||||||||||||||||||: ||||||| ||

orf34-1 LPLSSVPSGCAGSDEAAWWCSGWAASCPTTPFGSQNSVSRGLSVCCGSAXRVLSPFGLNV

120 130 140 150 160 170

190 200 210 220 230 240

orf34a.pep LTMPIANAPMAVIQMSNTARIRSLGVSLKGLFXFFAILIVLLGCRAMPSEGGSDGIAESA

|||||||||||:|||||||||||||||||||| |||||||||||||||||||||||||||

orf34-1 LTMPIANAPMAAIQMSNTARIRSLGVSLKGLFGFFAILIVLLGCRAMPSEGGSDGIAESA

180 190 200 210 220 230

250 260 270 280 290 300

orf34a.pep LDVVXVEGDDFLYADGGADFLGNLRLFFGGEDAHNVGYVAVGNDFDARLCGGADAQQRGA

|||| |||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf34-1 LDVVLVEGDDFLYADGGADFLGNLRLFFGGEDAHNVGYVAVGNDFDARLCGGADAQQRGA

240 250 260 270 280 290

310 320 330 340 350 360

orf34a.pep DFGCVPSVAGDVAGSARQGGDGNVXVHAFGGLFGTCNLTDELFLAFGGDLSEQQQVAVVA

|||||||||||||||||||||||: ||||||||||||||||||:||||||||||||||||

orf34-1 DFGCVPSVAGDVAGSARQGGDGNIVVHAFGGLFGTCNLTDELFFAFGGDLSEQQQVAVVA

300 310 320 330 340 350

370 380 390 400 410 420

orf34a.pep DNGDLGRVXFGLVVLAQIGAGGGFDTQRHYVVVGXRAGGSAVDGGFRADRRAADDCADAA

|:|||||| ||||||||||:||||||||| |||| |||||||||||||| |:| |||||

orf34-1 DDGDLGRVAFGLVVLAQIGTGGGFDTQRHNVVVGLRAGGSAVDGGFRADGGASDYCADAA

360 370 380 390 400 410

430 440 450 460

orf34a.pep AEGKAEDGGSQGADGVRFGFHRVLPFLGVSDGIALRHAVX

|:||||:||:||||||||||||||||||||||||||||||

orf34-1 AKGKAENGGNQGADGVRFGFHRVLPFLGVSDGIALRHAVX

420 430 440 450

与淋病奈瑟球菌的预计ORF的同源性

ORF34与淋病奈瑟球菌的预计ORF(ORF34.ng)在重叠的161个氨基酸内显示出有77.6％的相同性：

orf34.pep QKSLSRISLWGLGGVFFGVSGLVWFSLGVSXE------CAC 35

|| |||||||||:||||||||||||||||| |||

orf34ng MMMPFIMLPWIAGVPAVPGQKRLSRISLWGLAGVFFGVSGLVWFSLGVSFSLGVSLGCAC 60

orf34.pep FSGVSFRGSGRGTFVGSTGVSLSVFSACVXGVVRLPVGLSCV-----GRLXXLTRFFLGA 90

|||||||||| |:|||||||||||||||| :||: | : || ||||||||

orf34ng FSGVSFRGSGWGAFVGSTGVSLSVFSACVP----VPVNESAARAASEGR--GLTRFFLGA 114

orf34.pep AGDVILLPLSSVPSGCAGSDEAAWWCSGWAASCPTTPFGSQNSVSRGLSVCCGSAXRVLS 150

||| |||||||||||||||||||||||||||||:||||||||||||||||||: ||||

orf34ng AGDGSPLPLSSVPSGCAGSDEAAWWCSGWAASCPTAPFGSQNSVSRGLSVCCGSVWRVLS 174

orf34.pep S 175

orf34ng PFGLNVLTMPTANAPMAVIQMSNTARIRSLGVSLKGLFGFFAILIVLLGCRAMPSEGGSD 234

全长ORF34ng核苷酸序列<SEQ ID 213>是：

1 ATGATGATGC CGTTCATAAT GCTTCCTTGG ATTGCGGGTG TGCCTGCCGT

51 GCCGGGTCAA AAGAGGTTGT CGAGAATCTC TTTATGGGGT TTGGCCGGCG

101 TGTTTTTCGG GGTGTCCGGT TTGGTATGGT TTTCTTTGGG CGTTTCTTTT

151 TCTTTGGGTG TTTCTTTGGG CTGCGCCTGT TTTTCGGGTG TTTCTTTTCG

201 GGGTTCGGGA TGGGGGGCGT TTGTGGGCAG TACGGGGGTT TCTTTGAGTG

251 TGTTTTCAGC TTGTGTTCCG GTGCCGGTTA ACGAATCGGC TGCCCGGGCC

301 GCATCCGAAG GGCGCGGTTT gACCCGGTTT TTCTTGGGTG CGGCAGGGGA

351 CGGCAGTCCG CTGCCGCTTT CTTCTGTGCC GTCCGGCTGT GCGGGTTCGG

401 ATGAGGCGGC GTGGTGGTGT TCGGGTTGGG CGGCATCTTG TCCGACGGCG

451 CCGTTTGGCA GCCAGAATTC GGTTTCGCGG GGGCTGTCGG TGTGTTGCGG

501 TTCGGTTTGG AGGGTTTTGT CGCCGTTCGG GTTGAATGTG CTGACGATGC

551 CTACTGCCAA TGCGCCGATG GCGGTGATAC AGATGAGCAA TACGGCGCGT

601 ATCAGGAGTT TGGGGGTCAG CCTGAAGGGT TTGTTCGGTT TTTTTGCCAT

651 TTTGATTGTG CTTTTGGGGT GTCGGGCAAT GCCGTCTGAA GGCGGTTCAG

701 ACGGCATTGC CGAGTCAGCG TTGGACGTAG TTTTGGTAGA GGGTAATGAC

751 TTTTTGTACG CCGAcggTGG TGCTGACTTT TTGGGTAATC TGCGCCTGTT

801 CTTCGGGGGT GAGGATGCCC ATAACGTAGG TTACATTGCC GTAGGTAATG

851 ATTTTGACGC GCGCCTGTGT AGCGGGGCTG ATGCCCAGCA GcgtgGCGCG

901 GACTTTGGAC GTGTTCCAAG TGTCGCCGGC GATGTCGCCC GCAGTGCGCG

951 GCAGGGAGGC GACGGTAATG TAGTTGTATA CGCCTTCGGC GGCCTGTTCG

1001 GAACGTGCAA TCTGACCGAC GAACTGTTTT TCGCCTTCGG TGGCGACTTG

1051 TCCGAGCAGC AGCAGGTGGC GGTTGTAGCC GACGACGGAG ATTTGGGGCG

1101 TGTAGCCTTT GGTTTGGTTG TTTTGGCGCA GGTAGGAACG GGCGGTGGTT

1151 TCGATACGCA ACGCCATAAC GTtgtCATCG GTTtgcgcgc CGGTGGTTcg

1201 gCGGTCGATG ACGGATTTTG CGCCGACGGC GGCCCCGCCG ACGACTGCGC

1251 TGAAGCAGCC GCCGAGGGCA AGGCTGAGGA CGGCGGCAAT CAGGGTGCGG

1301 ACGGTGTGTG GTTTGGGTTT CATCGGGGAC TTCCTTTCTT GGGCGTTTCA

1351 GACGGCATTG CTTTGCGCCA TGCCGTCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 214>：

1

VPGQ KRLSR ISLWG LAGVFFGVSG LVWFSLG VSF

51 SLGVSLGCAC FSGVSFRGSG WG AFVGSTGV SLSVFSACVP VPVNESAARA

101 ASEGRGLTRF FLGAAGDGSP LPLSSVPSGC AGSDEAAWWC SGWAASCPTA

151 PFGSQNSVSR GLSVCCGSVW RVLSPFGLNV LTMPTANAPM AVIQMSNTAR

201 IRSLG VSLKG LFGFFAILIV LLGCRAMPSE GGSDGIAESA LDVVLVEGND

251 FLYADGGADF LGNLRLFFGG EDAHNVGYIA VGNDFDARLC SGADAQQRGA

301 DFGRVPSVAG DVARSARQGG DGNVVVYAFG GLFGTCNLTD ELFFAFGGDL

351 SEQQQVAVVA DDGDLGR VAF GLVVLAQVGT GGGFDTQRHN VVIGLRAGGS

401 AVDDGFCADG GPADDCAEAA AEGKAEDGGN QGADGVWFGF HRGLPFLGVS

451 DGIALRHAV*

ORF34ng和ORF34-1在459个氨基酸的重叠区内显示出有90.0％的相同性：

10 20 30 40 4 50

orf34-1.pep MMMPFIMLPWIAGVPAVPGQNRLSRISLWGLGGVFFGVSGLVWFSLGVS------LGCAC

||||||||||||||||||||:||||||||||:||||||||||||||||| |||||

orf34ng MMMPFIMLPWIAGVPAVPGQKRLSRISLWGLAGVFFGVSGLVWFSLGVSFSLGVSLGCAC

10 20 30 40 50 60

60 70 80 90 100 110

orf34-1.pep FSGVSFRGSGRGTFVGSTGVSLSVFSACVPASSGCLSVXAVSAGCGLTRFFLGAAGDGSP

|||||||||| |:|||||||||||||||||: : :: |:| | |||||||||||||||

orf34ng FSGVSFRGSGWGAFVGSTGVSLSVFSACVPVPVNESAARAASEGRGLTRFFLGAAGDGSP

70 80 90 100 110 120

120 130 140 150 160 170

orf34-1.pep LPLSSVPSGCAGSDEAAWWCSGWAASCPTTPFGSQNSVSRGLSVCCGSAXRVLSPFGLNV

|||||||||||||||||||||||||||||:||||||||||||||||||: ||||||||||

orf34ng LPLSSVPSGCAGSDEAAWWCSGWAASCPTAPFGSQNSVSRGLSVCCGSVWRVLSPFGLNV

130 140 150 160 170 180

180 190 200 210 220 230

orf34-1.pep LTMPIANAPMAAIQMSNTARIRSLGVSLKGLFGFFAILIVLLGCRAMPSEGGSDGIAESA

|||| ||||||:||||||||||||||||||||||||||||||||||||||||||||||||

orf34ng LTMPTANAPMAVIQMSNTARIRSLGVSLKGLFGFFAILIVLLGCRAMPSEGGSDGIAESA

190 200 210 220 230 240

240 250 260 270 280 290

orf34-1.pep LDVVLVEGDDFLYADGGADFLGNLRLFFGGEDAHNVGYVAVGNDFDARLCGGADAQQRGA

||||||||:|||||||||||||||||||||||||||||:|||||||||||:|||||||||

orf34ng LDVVLVEGNDFLYADGGADFLGNLRLFFGGEDAHNVGYIAVGNDFDARLCSGADAQQRGA

250 260 270 280 290 300

300 310 320 330 340 350

orf34-1.pep DFGCVPSVAGDVAGSARQGGDGNIVVHAFGGLFGTCNLTDELFFAFGGDLSEQQQVAVVA

||| |||||||||||||||||||:||:|||||||||||||||||||||||||||||||||

orf34ng DFGRVPSVAGDVARSARQGGDGNVVVYAFGGLFGTCNLTDELFFAFGGDLSEQQQVAVVA

310 320 330 340 350 360

360 370 380 390 400 41O

orf34-1.pep DDGDLGRVAFGLVVLAQIGTGGGFDTQRHNVVVGLRAGGSAVDGGFRADGGASDYCADAA

|||||||||||||||||:||||||||||||||:|||||||||| || |||| :| ||:||

orf34ng DDGDLGRVAFGLVVLAQVGTGGGFDTQRHNVVIGLRAGGSAVDDGFCADGGPADDCAEAA

370 380 390 400 410 420

420 430 440 450

orf34-1.pep AKGKAENGGNQGADGVRFGFHRVLPFLGVSDGIALRHAVX

|:||||:||||||||| ||||| |||||||||||||||||

orf34ng AEGKAEDGGNQGADGVWFGFHRGLPFLGVSDGIALRHAVX

430 440 450 460

根据该分析结果，包括此淋球菌蛋白中存在一个推定的前导序列(双划线)和几个推定的跨膜结构域(单划线)的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例26

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 215>：

1 ATGAAAACCT TCTTCAAAAC CCTTTCCGCC GCCGCACTCG CGCTCATCCT

51 CGCCGCCTGC GGATT.CAAA AAGACAGCGC GCCCGCCGCA TCCGCTTCTG

101 CCGCCGCCGA CAACGGCGCG GCG AAAAAA GAAATCGTCT TCGGCACGAC

151 CGTCGGCGAC TTCGGCGATA TGGTCAAAGA ACAAATCCAA GCCGAGCTGG

201 AGAAAAAAGG CTACACCGTC AAACTGGTCG AGTTTACCGA CTATGTACGC

251 CCGAATCTGG CATTGGCTGA GGGCGAGTTG

它对应于氨基酸序列<SEQ ID 216；0RF4>：

1 MKTFFKTLSA AALALILAAC G.QKDSAPAA SASAAADNGA AKKEIVFGTT

51 VGDFGDMVKE QIQAELEKKG YTVKLVEFTD YVRPNLALAE GEL

进一步的序列分析揭示了完整的核苷酸序列<SEQ ID 217>：

1 ATGAAAACCT TCTTCAAAAC CCTTTCCGCC GCCGCACTCG CGCTCATCCT

51 CGCCGCCTGC GGCGGTCAAA AAGACAGCGC GCCCGCCGCA TCCGCTTCTG

101 CCGCCGCCGA CAACGGCGCG GCGAAAAAAG AAATCGTCTT CGGCACGACC

151 GTCGGCGACT TCGGCGATAT GGTCAAAGAA CAAATCCAAG CCGAGCTGGA

201 GAAAAAAGGC TACACCGTCA AACTGGTCGA GTTTACCGAC TATGTACGCC

251 CGAATCTGGC ATTGGCTGAG GGCGAGTTGG ACATCAACGT CTTCCAACAC

301 AAACCCTATC TTGACGACTT CAAAAAAGAA CACAATCTGG ACATCACCGA

35l AGTCTTCCAA GTGCCGACCG CGCCTTTGGG ACTGTACCCG GGCAAGCTGA

401 AATCGCTGGA AGAAGTCAAA GACGGCAGCA CCGTATCCGC GCCCAACGAC

451 CCGTCCAACT TCGCCCGCGT CTTGGTGATG CTCGACGAAC TGGGTTGGAT

501 CAAACTCAAA GACGGCATCA ATCCGTTGAC CGCATCCAAA GCGGACATCG

551 CCGAGAACCT GAAAAACATC AAAATCGTCG AGCTTGAAGC CGCGCAACTG

601 CCGCGTAGCC GCGCCGACGT GGATTTTGCC GTCGTCAACG GCAACTACGC

651 CATAAGCAGC GGCATGAAGC TGACCGAAGC CCTGTTCCAA GAACCGAGCT

701 TTGCCTATGT CAACTGGTCT GCCGTCAAAA CCGCCGACAA AGACAGCCAA

751 TGGCTTAAAG ACGTAACCGA GGCCTATAAC TCCGACGCGT TCAAAGCCTA

801 CGCGCACAAA CGCTTCGAGG GCTACAAATC CCCTGCCGCA TGGAATGAAG

851 GCGCAGCCAA ATAA

它对应于氨基酸序列<SEQ ID 218；ORF4-1>：

1 MKTFFKTLSA AALALILAAC GGQKDSAPAA SASAAADNGA AKKEIVFGTT

51 VGDFGDMVKE QIQAELEKKG YTVKLVEFTD YVRPNLALAE GELDINVFQH

101 KPYLDDFKKE HNLDITEVFQ VPTAPLGLYP GKLKSLEEVK DGSTVSAPND

151 PSNFARVLVM LDELGWIKLK DGINPLTASK ADIAENLKNI KIVELEAAQL

201 PRSRADVDFA VVNGNYAISS GMKLTEALFQ EPSFAYVNWS AVKTADKDSQ

251 WLKDVTEAYN SDAFKAYAHK RFEGYKSPAA WNEGAAK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF4与脑膜炎奈瑟球菌菌株A的ORF(ORF4a)在重叠的93个氨基酸内显示出有93.5％的相同性：

10 20 30 40 50 59

orf4.pep MKTFFKTLSAAALALILAACG-QKDSAPAASASAAADNGAAKKEIVFGTTVGDFGDMVKE

||||||||||||||||||| || ||||||||||||||||||| ||||||||||||||||||

orf4a MKTFFKTLSAAALALILAACGGQKDSAPAASASAAADNGAAXKEIVFGTTVGDFGDMVKE

10 20 30 40 50 60

60 70 80 90

orf4.pep QIQAELEKKGYTVKLVEFTDYVRPNLALAEGEL

|| ||||||||||||| ||||| |||||||||

orf4a XIQPELEKKGYTVKLVEXTDYVRXNLALAEGELDINVXQHXXYLDDXKKXHNLDITXVXQ

70 80 90 100 110 120

orf4a VPTAPLGLYPGKLKSLXXVKXGSTVSAPNDPXXFXRVLVMLDELGXIKLKDXIXXXXXXX

130 140 150 160 170 180

全长ORF4a核苷酸序列<SEQ ID 219>是：

1 ATGAAAACCT TCTTCAAAAC CCTTTCCGCC GCCGCACTCG CGCTCATCCT

51 CGCCGCCTGC GGCGGTCAAA AAGATAGCGC GCCCGCCGCA TCCGCTTCTG

101 CCGCCGCCGA CAACGGCGCG GCGAANAAAG AAATCGTCTT CGGCACGACC

151 GTCGGCGACT TCGGCGATAT GGTCAAAGAA CANATCCAAC CCGAGCTGGA

201 GAAAAAAGGC TACACCGTCA AACTGGTCGA GTNTACCGAC TATGTGCGCN

251 CGAATCTGGC ATTGGCTGAG GGCGAGTTGG ACATCAACGT CTTNCAACAC

301 ANACNCTATC TTGACGACTN CAAAAAANAA CACAATCTGG ACATCACCNN

351 AGTCTTNCAA GTGCCGACCG CGCCTTTGGG ACTGTACCCG GGCAAGCTGA

401 AATCGCTGGA NNAAGTCAAA GANGGCAGCA CCGTATCCGC GCCCAACGAC

451 CCGTNNNACT TCGNCCGCGT CTTGGTGATG CTCGACGAAC TGGGTTNGAT

501 CAAACTCAAA GACNGCATCA NNNNGNNGNN NNNANCNANA NNNGANANNN

551 NNNNANNNNT NNNNNNNNNN NNNNNCNNCG NNNNNNNANN NNNNNNNNNN

601 NCGNNTNNNN NNGCNNNNNT NNANNNTNNN NNCNNCNNNN NNNNNTNNNN

651 NANNANNAGC GGCATGAAGC TGACCGAAGC CCTGTTCCAA GAACCGAGCT

701 TTGCCTATGT CAACTGGTCT GCCGTCAAAA CCGCCGACAA AGACAGCCAA

751 TGGCTTAAAG ACGTAACCGA GGCCTATAAC TCCGACGCGT TCAAAGCCTA

801 CGCGCACAAA CGCTTCGAGG GCTACAAATC CCCTGCCGCA TGGAATGAAG

851 GCGCAGCCAA ATAA

预计编码的蛋白质具有氨基酸序列<SEQ ID 220>：

1 MKTFFKTLSA AALALILAAC GGQKDSAPAA SASAAADNGA AXKEIVFGTT

51 VGDFGDMVKE XIQPELEKKG YTVKLVEXTD YVRXNLALAE GELDINVXQH

101 XXYLDDXKKX HNLDITXVXQ VPTAPLGLYP GKLKSLXXVK XGSTVSAPND

151 PXXFXRVLVM LDELGXIKLK DXIXXXXXXX XXXXXXXXXX XXXXXXXXXX

201 XXXXAXXXXX XXXXXXXXXS GMKLTEALFQ EPSFAYVNWS AVKTADKDSQ

251 WLKDVTEAYN SDAFKAYAHK RFEGYKSPAA WNEGAAK*

前导肽用下划线表示。

对这些菌株A序列作进一步的分析，揭示了完整的DNA序列<SEQ ID 221>：

1 ATGAAAACCT TCTTCAAAAC CCTTTCCGCC GCCGCACTCG CGCTCATCCT

51 CGCCGCCTGC GGCGGTCAAA AAGATAGCGC GCCCGCCGCA TCCGCTTCTG

101 CCGCCGCCGA CAACGGCGCG GCGAAAAAAG AAATCGTCTT CGGCACGACC

151 GTCGGCGACT TCGGCGATAT GGTCAAAGAA CAAATCCAAC CCGAGCTGGA

201 GAAAAAAGGC TACACCGTCA AACTGGTCGA GTTTACCGAC TATGTGCGCC

251 CGAATCTGGC ATTGGCTGAG GGCGAGTTGG ACATCAACGT CTTCCAACAC

301 AAACCCTATC TTGACGACTT CAAAAAAGAA CACAATCTGG ACATCACCGA

351 AGTCTTCCAA GTGCCGACCG CGCCTTTGGG ACTGTACCCG GGCAAGCTGA

401 AATCGCTGGA AGAAGTCAAA GACGGCAGCA CCGTATCCGC GCCCAACGAC

451 CCGTCCAACT TCGCCCGCGT CTTGGTGATG CTCGACGAAC TGGGTTGGAT

501 CAAACTCAAA GACGGCATCA ATCCGCTGAC CGCATCCAAA GCGGACATTG

551 CCGAAAACCT GAAAAACATC AAAATCGTCG AGCTTGAAGC CGCGCAACTG

601 CCGCGTAGCC GCGCCGACGT GGATTTTGCC GTCGTCAACG GCAACTACGC

651 CATAAGCAGC GGCATGAAGC TGACCGAAGC CCTGTTCCAA GAACCGAGCT

701 TTGCCTATGT CAACTGGTCT GCCGTCAAAA CCGCCGACAA AGACAGCCAA

751 TGGCTTAAAG ACGTAACCGA GGCCTATAAC TCCGACGCGT TCAAAGCCTA

801 CGCGCACAAA CGCTTCGAGG GCTACAAATC CCCTGCCGCA TGGAATGAAG

851 GCGCAGCCAA ATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 222；ORF4a-1>：

1 MKTFFKTLSA AALALILAAC GGQKDSAPAA SASAAADNGA AKKEIVFGTT

51 VGDFGDMVKE QIQPELEKKG YTVKLVEFTD YVRPNLALAE GELDINVFQH

101 KPYLDDFKKE HNLDITEVFQ VPTAPLGLYP GKLKSLEEVK DGSTVSAPND

151 PSNFARVLVM LDELGWIKLK DGINPLTASK ADIAENLKNI KIVELEAAQL

201 PRSRADVDFA VVNGNYAISS GMKLTEALFQ EPSFAYVNWS AVKTADKDSQ

251 WLKDVTEAYN SDAFKAYAHK RFEGYKSPAA WNEGAAK*

ORF4a-1和ORF4-1在287个氨基酸的重叠区内显示出有99.7％的相同性：

10 20 30 40 50 60

orf4a-1 MKTFFKTLSAAALALILAACGGQKDSAPAASASAAADNGAAKKEIVFGTTVGDFGDMVKE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4-1 MKTFFKTLSAAALALILAACGGQKDSAPAASASAAADNGAAKKEIVFGTTVGDFGDMVKE

10 20 30 40 50 60

70 80 90 100 110 120

orf4a-1 QIQPELEKKGYTVKLVEFTDYVRPNLALAEGELDINVFQHKPYLDDFKKEHNLDITEVFQ

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4-1 QIQAELEKKGYTVKLVEFTDYVRPNLALAEGELDINVFQHKPYLDDFKKEHNLDITEVFQ

70 80 90 100 110 120

130 140 150 160 170 180

orf4a-1 VPTAPLGLYPGKLKSLEEVKDGSTVSAPNDPSNFARVLVMLDELGWIKLKDGINPLTASK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4-1 VPTAPLGLYPGKLKSLEEVKDGSTVSAPNDPSNFARVLVMLDELGWIKLKDGINPLTASK

130 140 150 160 170 180

190 200 210 220 230 240

orf4a-1 ADIAENLKNIKIVELEAAQLPRSRADVDFAVVNGNYAISSGMKLTEALFQEPSFAYVNWS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4-1 ADIAENLKNIKIVELEAAQLPRSRADVDFAVVNGNYAISSGMKLTEALFQEPSFAYVNWS

190 200 210 220 230 240

250 260 270 280

orf4a-1 AVKTADKDSQWLKDVTEAYNSDAFKAYAHKRFEGYKSPAAWNEGAAKX

||||||||||||||||||||||||||||||||||||||||||||||||

orf4-1 AVKTADKDSQWLKDVTEAYNSDAFKAYAHKRFEGYKSPAAWNEGAAKX

250 260 270 280

与溶血性巴斯德氏菌的外膜蛋白(登录号为q08869)的同源性

ORF4和此外膜蛋白在91个氨基酸的重叠区内显示出有33％的氨基酸相同性：

10 20

lip2.pasha MNFKKLLGVALVSALALTACKDEKAQAP----

|| | ::|| || |:|| :|: |

ORF4 VXTPNPDGRTPCPSFLFETATTSGENMKTFFKTLSAAAL--ALILAACGFKKTARPPHPL

110 120 130 140 150

30 40 50 60 70 80

lip2.pasha -ATTAKTENKAPLKVGVMTGPEAQMTEVAVKIAKEKYGLDVELVQFTEYTQPNAALHSKD

: :: | : |: :| ::|:: :: || | |:||:||:|::|| || :

ORF4 LPPPTTARRKKEIVFGTTVGDFGDMVKEQIQAELEKKGYTVKLVEFTDYVRPNLALAEGE

160 170 180 190 200 210

90 100 110 120 130 140

lip2.pasha LDANAFQTVPYLEQEVKDRGYKLAIIGNTLVWPIAAYSKKIKNISELKDGATVAIPNNAS

|

ORF4 L.....

与淋病奈瑟球菌的预计ORF的同源性

ORF4与淋病奈瑟球菌的预计ORF(ORF4.ng)在重叠的94个氨基酸内显示出有93.6％的相同性：

10 20 30

orf4nm.pep MKTFFKTLSAAALALILAACGXQKDSAPAA

|||||||||:|:||||||||| ||||||||

orf4ng RANAVXTPNPDGRTPCLSFLFETATTSGENMKTFFKTLSTASLALILAACGGQKDSAPAA

200 210 220 230 240 250

40 50 60 70 80 89

orf4nm.pep SASA-AADNGAAKKEIVFGTTVGDFGDMVKEQIQAELEKKGYTVKLVEFTDYVRPNLALA

||:| :||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4ng SAAAPSADNGAAKKEIVFGTTVGDFGDMVKEQIQAELEKKGYTVKLVEFTDYVRPNLALA

260 270 280 290 300 310

90

orf4nm.pep EGEL

||||

orf4ng EGELDINVFQHKPYLDDFKKEHNLDITEAFQVPTAPLGLYPGKLKSLEEVKDGSTVSAPN

320 330 340 350 360 370

预计全长ORF4ng核苷酸序列<SEQ ID 223>编码的蛋白质具有氨基酸序列<SEQID 224>：

1 MKTFFKTLST ASLAL ILAAC GGQKDSAPAA SAAAPSADNG AAKKEIVFGT

51 TVGDFGDMVK EQIQAELEKK GYTVKLVEFT DYVRPNLALA EGELDINVFQ

101 HKPYLDDFKK EHNLDITEAF QVPTAPLGLY PGKLKSLEEV KDGSTVSAPN

151 DPSNFARALV MLNELGWIKL KDGINPLTAS KADIAENLKN IKIVELEAAQ

201 LPRSRADVDF AVVNGNYAIS SGMKLTEALF QEPSFAYVNW SAVKTADKDS

251QWLKDVTEAY NSDAFKAYAH KRFEGYKYPA AWNEGAAK*

进一步的分析揭示了全长ORF4ngDNA序列<SEQ ID 225>是：

1 atgAAAACCT TCTTCAAAAC cctttccgcc gccgcaCTCG CGCTCATCCT

51 CGCAGCCTGc ggCggtcaAA AAGACAGCGC GCCCgcagcc tctgcCGCCG

101 CCCCTTCTGC CGATAACGgc gCgGCGAAAA AAGAAAtcgt ctTCGGCACG

151 Accgtgggcg acttcggcgA TAtggTCAAA GAACAAATCC AagcCGAgct

201 gGAGAAAAAA GgctACACcg tcAAattggt cgaatttacc gactatgtGC

251 gCCCGAATCT GGCATTGGCG GAGGGCGAGT TGGACATCAA CGTCTTCCAA

301 CACAAACCCT ATCTTGACGA TTTCAAAAAA GAACACAACC TGGACATCAC

351 CGAAGCCTTC CAAGTGCCGA CCGCGCCTTT GGGACTGTAT CCGGGCAAAC

401 TGAAATCGCT GGAAGAAGTC AAAGACGGCA GCACCGTATC CGCGCCCAac

451 gACccgTCCA ACTTCGCACG CGCCTTGGTG ATGCTGAACG AACTGGGTTG

501 GATCAAACTC AAAGACGGCA TCAATCCGCT GACCGCATCC AAAGCCGACA

551 TCGCGGAAAA CCTGAAAAAC ATCAAAATCG TCGAGCTTGA AGCCGCACAA

601 CTGCCGCGCA GCCGCGCCGA CGTGGATTTT GCCGTCGTCA ACGGCAACTA

651 CGCCATAAGC AGCGGCATGA AGCTGACCGA AGCCCTGTTC CAAGAGCCGA

701 GCTTTGCCTA TGTCAACTGG TCTGCCgtcA AAACCGCCGA CAAAGACAGC

751 CAATGGCTTA AAGACGTAAC CGAGGCCTAT AACTCCGACG CGTTCAAAGC

801 CTACGCGCAC AAACGCTTCG AGGGCTACAA ATACCCTGCC GCATGGAATG

851 AAGGCGCAGC CAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 226；ORF4ng-1>：

1 MKTFFKTLSA AALALILAAC GGQKDSAPAA SAAAPSADNG AAKKEIVFGT

51 TVGDFGDMVK EQIQAELEKK GYTVKLVEFT DYVRPNLALA EGELDINVFQ

101 HKPYLDDFKK EHNLDITEAF QVPTAPLGLY PGKLKSLEEV KDGSTVSAPN

151 DPSNFARALV MLNELGWIKL KDGINPLTAS KADIAENLKN IKIVELEAAQ

201 LPRSRADVDF AVVNGNYAIS SGMKLTEALF QEPSFAYVNW SAVKTADKDS

251 QWLKDVTEAY NSDAFKAYAH KRFEGYKYPA AWNEGAAK*

它与ORF4-1在重叠的288个氨基酸内显示出有97.6％的相同性：

10 20 30 40 50 59

orf4-1.pep MKTFFKTLSAAALALILAACGGQKDSAPAASASA-AADNGAAKKEIVFGTTVGDFGDMVK

||||||||||||||||||||||||||||||||:| :||||||||||||||||||||||||

orf4ng-1 MKTFFKTLSAAALALILAACGGQKDSAPAASAAAPSADNGAAKKEIVFGTTVGDFGDMVK

10 20 30 40 50 60

60 70 80 90 100 110 119

orf4-1.pep EQIQAELEKKGYTVKLVEFTDYVRPNLALAEGELDINVFQHKPYLDDFKKEHNLDITEVF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf4ng-1 EQIQAELEKKGYTVKLVEFTDYVRPNLALAEGELDINVFQHKPYLDDFKKEHNLDITEAF

70 80 90 100 110 120

120 130 140 150 160 170 179

orf4-1.pep QVPTAPLGLYPGKLKSLEEVKDGSTVSAPNDPSNFARVLVMLDELGWIKLKDGINPLTAS

|||||||||||||||||||||||||||||||||||||:||||:|||||||||||||||||

orf4ng-1 QVPTAPLGLYPGKLKSLEEVKDGSTVSAPNDPSNFARALVMLNELGWIKLKDGINPLTAS

130 140 150 160 170 180

180 190 200 210 220 230 239

orf4-1.pep KADIAENLKNIKIVELEAAQLPRSRADVDFAVVNGNYAISSGMKLTEALFQEPSFAYVNW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf4ng-1 KADIAENLKNIKIVELEAAQLPRSRADVDFAVVNGNYAISSGMKLTEALFQEPSFAYVNW

190 200 210 220 230 240

240 250 260 270 280

orf4-1.pep SAVKTADKDSQWLKDVTEAYNSDAFKAYAHKRFEGYKSPAAWNEGAAKX

||||||||||||||||||||||||||||||||||||| |||||||||||

orf4ng-1 SAVKTADKDSQWLKDVTEAYNSDAFKAYAHKRFEGYKYPAAWNEGAAKX

250 260 270 280

另外，ORF4ng-1显示出与数据库的一种外膜蛋白明显同源：

ID LIP2_PASHA STANDARD； PRT；276AA.

AC Q08869；

DT 01-NOV-1995(REL.32，产生的)

DT 01-NOV-1995(REL.32，序列的最后更新)

DT 01-NOV-1995(REL.32，注解的最后更新)

DE 28.2KD外膜蛋白前体....

SCORES Init1：279Initn：416Opt：494

Smith-Waterman评分：494；在275个氨基酸的重叠区内有36.0％的相同性

10 20 30 40 50

orf4ng-1.pep MKTFFKTLSAAAL--ALILAACGGQKDSAPAASAAAPSADNGAAKKEIVFGTTVGDFGDM

|| | ::|| || |:|| :| :|||::| :::| | | |: :| ::|

lip2_pasha MNFKKLLGVALVSALALTACKDEKAQAPATTA---KTENKAPLK---VGVMTGPEAQM

10 20 30 40 50

60 70 80 90 100 110

orf4ng-1.pep VKEQIQAELEKKGYTVKLVEFTDYVRPNLALAEGELDINVFQHKPYLDDFKKEHNLDITE

:: :: || | |:||:||:|::|| || :|| |:|| |||:: |::: ::

lip2_pasha TEVAVKIAKEKYGLDVELVQFTEYTQPNAALHSKDLDANAFQTVPYLEQEVKDRGYKLAI

60 70 80 90 100 110

120 130 140 150 160 170

orf4ng-1.pep AFQVPTAPLGLYPGKLKSLEEVKDGSTVSAPNDPSNFARALVMLNELGWIKLKDGINPLT

:: : |:: | |:|:: |:|||:||: ||: || ||||::|: | :|||| | :

lip2_pasha IGNTLVWPIAAYSKKIKNISELKDGATVAIPNNASNTARALLLLQAHGLLKLKDPKN-VF

120 130 140 150 160 170

180 190 200 210 220 230

orf4ng-1.pep ASKADIAENLKNIKIVELEAAQLPRSRADVDFAVVNGNYAISSGMKLTE--ALFQEPSFA

|:: || || ||||||: ::: | | ||::||:|::|| ::|:: : : : :

lip2_pasha ATENDIIENPKNIKIVQADTSLLTRMLDDVELAVINNTYAGQAGLSPDKDGIIVESKDSP

180 190 200 210 220 230

240 250 260 270 280 289

orf4ng-1.pep YVNWSAVKTADKDSQWLKDVTEAYNSDAFKAYAHKRFEGYKYPAAWNEGAAKX

||| : : :||: |: ::::::: | | |:|

lip2_pasha YVNLVVSREDNKDDPRLQTFVKSFQTEEVFQEALKLFNGGVVKGW

240 250 260 270

根据该分析结果(包括与溶血性巴斯德氏菌的外膜蛋白同源，以及淋球菌蛋白中存在一个推定的原核细胞膜脂蛋白脂质连接位点)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF4-1(30kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图8A和8B分别显示了His-融合蛋白以及GST-融合蛋白的亲和纯化的结果。用纯化的His-融合蛋白免疫小鼠，用其血清进行ELISA(阳性结果)，Western印迹(图8C)，FACS分析(图8D)，和杀菌试验(图8E)。这些结果确认ORF4-1是一种外露蛋白，且是一种有用的免疫原。

图8F显示了出ORF4-1的亲水性、抗原性指数和AMPHI区域的曲线。

实施例27

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 227>：

1 CCTCGTCGTC CTCGGCATGC TCCAGTTTCA AGGGGCGATT TACTCCAAGG

51 CGGTGGAACG TATGCTCGGC ACGGTCATCG GGCTGGGCGC GGGTTTGGGC

101 GTTTTATGGC TGAACCAGCA TTATTTCCAC GGCAACCTCC TCTTCTACCT

151 CACCGTCGGC ACGGCAAGCG CACTGGCCGG CTGGGCGGCG GTCGGCAAAA

201 ACGGCTACGT CCCTmTGCTG GCAGGGCTGA CGATGTGTAT GCTCATCGGC

251 GACAACGGCA GCGAATGGCT CGACAGCGGA CTCATGCGCG CCATGAACGT

301 CCTCATCGGC GyGGCCATCG CCATCGCCGC CGCCAAACTG CTGCCGCTGA

351 AATCCACACT GATGTGGCGT TTCATGCTTG CCGACAACCT GGCCGACTGC

401 AGCAAAATGA TTGCCGAAAT CAGCAACGGC AGGCGCATGA CCCGCGAACG

451 CCTCGAGGAG AACATGGCGA AAATGCGCCA AATCAACGCA CGCATGGTCA

501 AAAGCCGCAG CCATCTCGCC GCCACATCGG GCGAAAGCTG CATCAGCCCC

551 GCCATGATGG AAGCCATGCA GCACGCCCAC CGTAAAATCG TCAACACCAC

601 CGAGCTGCTC CTGACCACCG CCGCCAAGCT GCAATCTCCC AAACTCAACG

651 GCAGCGAAAT CCGGCTGCTT GACCGCCACT TCACACTGCT CCAAAC....

701. .......... .......... ........GC AGACACGCCC GCCGCATCCG

751 CATCGACACC GCCATCAACC CCGAACTGGA AGCCCTCGCC GAACACCTCC

801 ACTACCAATG GCAGGGCTTC CTCTGGCTCA GCACCGATAT GCGTCAGGAA

851 ATTTCCGCCC TCGTCATCCT GCTGCAACGC ACCCGCCGCA AATGGCTGGA

901 TGCCCACGAA CGCCAACACC TGCGCCAAAG CCTGCTTGA

它对应于氨基酸序列<SEQ ID 228；ORF8>：

1 ......PRRP RHAPVSRGDL LQGGGTYARH GHRAGRGFGR FMAEPALFPR

51 QPPLLPHRRH GKRTGRLGGG RQKRLRPXAG RADDVYAHRR QRQRMARQRT

101 HARHERPHRR GHRHRRRQTA AAEIHTDVAF HACRQPGRLQ QNDCRNQQRQ

151 AHDPRTPRGE HGENAPNQRT HGQKPQPSRR HIGRKLHQPR HDGSHAARPP

201 XNRQHHRAAP DHRRQAAISQ TQRQRNPAAX PPLHTAPN.. .........Q

251 TRPPHPHRHR HQPRTGSPRR TPPLPMAGLP LAQHRYASGN FRPRHPAATH

301 PPQMAGCPRT PTPAPKPA*

该氨基酸序列的计算机分析给出了下列结果：

序列基序

ORF8富含脯氨酸，其脯氨酸残基分布与表面定位相符。而且，RGD基序的存在可能暗示其可能在细菌粘附行为中有作用。

与淋病奈瑟球菌的预计ORF的同源性

ORF8与淋病奈瑟球菌的预计ORF(ORF8.ng)在重叠的312个氨基酸内有86.5％的相同性：

orf8ng 1 MDRDDRLRRPRHAPVPRRDLLQRGGTYARYGHRAGRGFGRFMAEPALFPR 50

|||||||| | |||| ||||||:||||||||||||||||||||

orf8.pep 1 ......PRRPRHAPVSRGDLLQGGGTYARHGHRAGRGFGRFMAEPALFPR 44

orf8ng 51 QPPLLPDHRHGKRTGRLGGGRQKRLRPYVGGADDVHAHRRQRQRMARQRP 100

|||||| |||||||||||||||||| | ||||:|||||||||||||||

orf8.pep 45 QPPLLPHRRHGKRTGRLGGGRQKRLRPXAGRADDVYAHRRQRQRMARQRT 94

orf8ng 101 DARDERPHRRRHRHCRRQTAAAEIHTDVAFHACRQPGRLQQNDCRNQQRQ 150

|| |||||| ||| ||||||||||||||||||||||| |||||||||||

orf8.pep 95 HARHERPHRRGHRHRRRQTAAAEIHTDVAFHACRQPGRMQQNDCRNQQRQ 144

orf8ng 151 AYDARTFGAEYGQNAPNQRTHGQKPQPPRRHIGRKPHQPLHDGSHAARPP 200

|:| || |:|:|||||||||||||| ||||||| ||| ||||||||||

orf8.pep 145 AHDPRTPRGEHGENAPNQRTHGQKPQPSRRHIGRKLHQPRHDGSHAARPP 194

orf8ng 201 QNRQHHRAAPDHRRQAAISQTQRQRNPAARPPLHTAPNRPATNRRPHQRQ 250

|||||||||||||||||||||||||||| |||||||| |

orf8.pep 195 XNRQHHRAAPDHRRQAAISQTQRQRNPAAXPPLHTAPN...........Q 244

orf8ng 251 TRPPHPHRHRHQPRTGSPRRTPPLPMAGFPLAQHQYASGNFRPRHPPATH 300

|||||||||||||||||||||||||||| ||||| ||||||||||| |||

orf8.pep 245 TRPPHPHRHRHQPRTGSPRRTPPLPMAGLPLAQHRYASGNFRPRHPAATH 294

orf8ng 301 PPQMAGCPRTPTPAPKPA* 319

||||||||||||||||||

orf8.pep 295 PPQMAGCPRTPTPAPKPA* 313

预计全长ORF8ng核苷酸序列<SEQ ID 229>编码的蛋白质具有氨基酸序列<SEQID 230>：

1 MDRDDRLRRP RHAPVPRRDL LQRGGTYARY GHRAGRGFGR FMAEPALFPR

51 QPPLLPDHRH GKRTGRLGGG RQKRLRPYVG GADDVHAHRR QRQRMARQRP

101 DARDERPHRR RHRHCRRQTA AAEIHTDVAF HACRQPGRLQ QNDCRNQQRQ

151 AYDARTFGAE YGQNAPNQRT HGQKPQPPRR HIGRKPHQPL HDGSHAARPP

201 QNRQHHRAAP DHRRQAAISQ TQRQRNPAAR PPLHTAPNRP ATNRRPHQRQ

251 TRPPHPHRHR HQPRTGSPRR TPPLPMAGFP LAQHQYASGN FRPRHPPATH

301 PPQMAGCPRT PTPAPKPA*

根据这些蛋白质中的序列基序，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例28

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 231>：

1 ..GAAATCAGCC TGCGGTCCGA CNACAGGCCG GTTTCCGTGN CGAAGCGGCG

51 GGATTCGGAA CGTTTTCTGC TGTTGGACGG CGGCAACAGC CGGCTCAAGT

101 GGGCGTGGGT GGAAAACGGC ACGTTCGCAA CCGTCGGTAG CGCGCCGTAC

151 CGCGATTTGT CGCCTTTGGG CGCGGAGTGG GCGGAAAAGG CGGATGGAAA

201 TGTCCGCATC GTCGGTTGCG CTGTGTGCGG AGAATTCAAA AAGGCACAAG

251 TGCAGGAACA GCTCGCCCGA AAAATCGAGT GGCTGCCGTC TTCCGCACAG

301 GCTTT.GGCA TACGCAACCA CTACCGCCAC CCCGAAGAAC ACGGTTCCGA

351 CCGCTGGTTC AACGCCTTGG GCAGCCGCCG CTTCAGCCGC AACGCCTGCG

401 TCGTCGTCAG TTGCGGCACG GCGGTAACGG TTGACGCGCT CACCGATGAC

451 GGACATTATC TCGGAGA.GG AACCATCATG CCCGGTTTCC ACCTGATGAA

501 AGAATCGCTC GCCGTCCGAA CCGCCAACCT CAACCGGCAC GCCGGTAAGC

551 GTTATCCTTT CCCGACCGG..

它对应于氨基酸序列<SEQ ID 232；ORF61>：

1 ..EISLRSDXRP VSVXKRRDSE RFLLLDGGNS RLKWAWVENG TFATVGSAPY

51 RDLSPLGAEW AEKADGNVRI VGCAVCGEFK KAQVQEQLAR KIEWLPSSAQ

101 AXGIRNHYRH PEEHGSDRWF NALGSRRFSR NACVVVSCGT AVTVDALTDD

151 GHYLGXGTIM PGFHLMKESL AVRTANLNRH AGKRYPFPT..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 233>：

1 ATGACGGTTT TGAAGCTTTC GCACTGGCGG GTGTTGGCGG AGCTTGCCGA

51 CGGTTTGCCG CAACACGTCT CGCAACTGGC GCGTATGGCG GATATGAAGC

101 CGCAGCAGCT CAACGGTTTT TGGCAGCAGA TGCCGGCGCA CATACGCGGG

151 CTGTTGCGCC AACACGACGG CTATTGGCGG CTGGTGCGCC CATTGGCGGT

201 TTTCGATGCC GAAGGTTTGC GCGAGCTGGG GGAAAGGTCG GGTTTTCAGA

251 CGGCATTGAA GCACGAGTGC GCGTCCAGCA ACGACGAGAT ACTGGAATTG

301 GCGCGGATTG CGCCGGACAA GGCGCACAAA ACCATATGCG TGACCCACCT

351 GCAAAGTAAG GGCAGGGGGC GGCAGGGGCG GAAGTGGTCG CACCGTTTGG

401 GCGAGTGTCT GATGTTCAGT TTTGGCTGGG TGTTTGACCG GCCGCAGTAT

451 GAGTTGGGTT CGCTGTCGCC TGTTGCGGCA GTGGCGTGTC GGCGCGCCTT

501 GTCGCGTTTA GGTTTGGATG TGCAGATTAA GTGGCCCAAT GATTTGGTTG

551 TCGGACGCGA CAAATTGGGC GGCATTCTGA TTGAAACGGT CAGGACGGGC

601 GGCAAAACGG TTGCCGTGGT CGGTATCGGC ATCAATTTTG TCCTGCCCAA

651 GGAAGTAGAA AATGCCGCTT CCGTGCAATC GCTGTTTCAG ACGGCATCGC

701 GGCGGGGCAA TGCCGATGCC GCCGTGCTGC TGGAAACGCT GTTGGTGGAA

751 CTGGACGCGG TGTTGTTGCA ATATGCGCGG GACGGATTTG CGCCTTTTGT

801 GGCGGAATAT CAGGCTGCCA ACCGCGACCA CGGCAAGGCG GTATTGCTGT

851 TGCGCGACGG CGAAACCGTG TTCGAAGGCA CGGTTAAAGG CGTGGACGGA

901 CAAGGCGTTT TGCACTTGGA AACGGCAGAG GGCAAACAGA CGGTCGTCAG

951 CGGCGAAATC AGCCTGCGGT CCGACGACAG GCCGGTTTCC GTGCCGAAGC

1001 GGCGGGATTC GGAACGTTTT CTGCTGTTGG ACGGCGGCAA CAGCCGGCTC

1051 AAGTGGGCGT GGGTGGAAAA CGGCACGTTC GCAACCGTCG GTAGCGCGCC

1101 GTACCGCGAT TTGTCGCCTT TGGGCGCGGA GTGGGCGGAA AAGGCGGATG

1151 GAAATGTCCG CATCGTCGGT TGCGCTGTGT GCGGAGAATT CAAAAAGGCA

1201 CAAGTGCAGG AACAGCTCGC CCGAAAAATC GAGTGGCTGC CGTCTTCCGC

1251 ACAGGCTTTG GGCATACGCA ACCACTACCG CCACCCCGAA GAACACGGTT

1301 CCGACCGCTG GTTCAACGCC TTGGGCAGCC GCCGCTTCAG CCGCAACGCC

1351 TGCGTCGTCG TCAGTTGCGG CACGGCGGTA ACGGTTGACG CGCTCACCGA

1401 TGACGGACAT TATCTCGGGG GAACCATCAT GCCCGGTTTC CACCTGATGA

1451 AAGAATCGCT CGCCGTCCGA ACCGCCAACC TCAACCGGCA CGCCGGTAAG

1501 CGTTATCCTT TCCCGACCAC AACGGGCAAT GCCGTCGCCA GCGGCATGAT

1551 GGATGCGGTT TGCGGCTCGG TTATGATGAT GCACGGGCGT TTGAAAGAAA

1601 AAACCGGGGC GGGCAAGCCT GTCGATGTCA TCATTACCGG CGGCGGCGCG

1651 GCAAAAGTTG CCGAAGCCCT GCCGCCTGCA TTTTTGGCGG AAAATACCGT

1701 GCGCGTGGCG GACAACCTCG TCATTTACGG GTTGTTGAAC ATGATTGCCG

1751 CCGAAGGCAG GGAATATGAA CATATTTAA

它对应于氨基酸序列<SEQ ID 234；ORF61-1>：

1 MTVLKLSHWR VLAELADGLP QHVSQLARMA DMKPQQLNGF WQQMPAHIRG

51 LLRQHDGYWR LVRPLAVFDA EGLRELGERS GFQTALKHEC ASSNDEILEL

101 ARIAPDKAHK TICVTHLQSK GRGRQGRKWS HRLGECLMFS FGWVFDRPQY

151 ELGSLSPVAA VACRRALSRL GLDVQIKWPN DLVVGRDKLG GILIETVRTG

201 GKTVAVVGIG INFVLPKEVE NAASVQSLFQ TASRRGNADA AVLLETLLVE

251 LDAVLLQYAR DGFAPFVAEY QAANRDHGKA VLLLRDGETV FEGTVKGVDG

301 Q3VLHLETAE GKQTVVSGEI SLRSDDRPVS VPKRRDSERF LLLDGGNSRL

351 KWAWVENGTF ATVGSAPYRD LSPLGAEWAE KADGNVRIVG CAVCGEFKKA

401 QVQEQLARKI EWLPSSAQAL GIRNHYRHPE EHGSDRWFNA LGSRRFSRNA

451 CVVVSCGTAV TVDALTDDGH YLGGTIMPGF HLMKESLAVR TANLNRHAGK

501 RYPFPTTTGN AVASGMMDAV CGSVMMMHGR LKEKTGAGKP VDVIITGGGA

551 AKVAEALPPA FLAENTVRVA DNLVIYGLLN MIAAEGREYE HI*

图9显示出ORF61-1的亲水性、抗原性指数和AMPHI区域的曲线。该氨基酸序列的进一步计算机分析给出了下列结果：

与副百日咳博德特氏菌的baf蛋白(登录号为U12020)的同源性

ORF61和baf蛋白在166个氨基酸的重叠区内有33％的氨基酸相同性：

orf61 23 LLLDGGNSRLKWAWVE-NGTFATVGSAPYR----DLSPLGAEWAEKADGNVRIVGCAVCG 77

+L+D GNSRLK W + + A AP DL LG A R +G V G

baf 3 ILIDSGNSRLKVGWFDPDAPQAAREPAPVAFDNLDLDALGRWLATLPRRPQRALGVNVAG 62

orf61 78 EFKKAQVQEQLAR---KIEWLPSSAQAXGIRNHYRHPEEHGSDRW---FNALGSRRFSRN 131

+ + L I WL + A G+RN YR+P++ G+DRW L +

baf 63 LARGEAIAATLRAGGCDIRWLRAQPLAMGLRNGYRNPDQLGADRWACMVGVLARQPSVHP 122

orf61 132 ACVVVSCGTAVTVDALTDDGHYLGXGTIMPGFHLMKESLAVRTANL 177

+V S GTA T+D + D + G G I+PG +M+ +LA TA+L

baf 123 PLLVASFGTATTLDTIGPDNVFPG-GLILPGPAMMRGALAYGTAHL 167

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF61与脑膜炎奈瑟球菌菌株A的ORF(ORF61a)在重叠的189个氨基酸内有97.4％的相同性：

10 20 30

orf61.pep EISLRSDXRPVSVXKRRDSERFLLLDGGNS

||||||| ||||| ||||||||||||||||

orf61a TVFEGTVKGVDGQGVLHLETAEGKQTVVSGEISLRSDDRPVSVPKRRDSERFLLLDGGNS

290 300 310 320 330 340

40 50 60 70 80 90

orf61.pep RLKWAWVENGTFATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGEFKKAQVQEQLAR

|||||||||||||||||||||||||||||||||:||||||||||||||||||||||||||

orf61a RLKWAWVENGTFATVGSAPYRDLSPLGAEWAEKVDGNVRIVGCAVCGEFKKAQVQEQLAR

350 360 370 380 390 400

100 110 120 130 140 150

orf61.pep KIEWLPSSAQAXGIRNHYRHPEEHGSDRWFNALGSRRFSRN ACVVVSCGTAVTVDALTDD

||||||||||| ||||||||||||||||||||||||||||||||||||||||||||||||

orf61a KIEWLPSSAQALGIRHYRHPEEHGSDRWFNALGSRRFSRN ACVVVSCGTAVTVDALTDD

410 420 430 440 450 460

160 170 180 189

orf61.pep GHYLGXGTIMPGFHLMKESLAVRTANLNRHAGKRYPFPT

||||| |||||||||||||||||||||||||||||||||

orf61a GHYLG-GTIMPGFHLMKESLAVRTANLNRHAGKRYPFPTTTGNAVASGMMDAVCGSVMMM

470 480 490 500 510 520

orf61a HGRLKEKTGAGKPVDVIITGGGAAKVAEALPPAFLAENTVRVADNLVIHGLLNLIAAEGG

530 540 550 560 570 580

全长ORF61a核苷酸序列<SEQ ID 235>是：

1 ATGACGGTTT TGAAGCCTTC GCACTGGCGG GTGTTGGCGG AGCTTGCCGA

51 CGGTTTGCCG CAACACGTCT CGCAACTGGC GCGTATGGCG GATATGAAGC

101 CGCAGCAGCT CAACGGTTTT TGGCAGCAGA TGCCGGCGCA CATACGCGGG

151 CTGTTGCGCC AACACGACGG CTATTGGCGG CTGGTGCGCC CATTGGCGGT

201 TTTCGATGCC GAAGGTTTGC GCGAGCTGGG GGAAAGGTCG GGTTTTCAGA

251 CGGCATTGAA GCACGAGTGC GCGTCCAGCA ACGACGAGAT ACTGGAATTG

301 GCGCGGATTG CGCCGGACAA GGCGCACAAA ACCATATGTG TGACCCACCT

351 GCAAAGTAAG GGCAGGGGGC GGCAGGGGCG GAAGTGGTCG CACCGTTTGG

401 GCGAGTGTCT GATGTTCAGT TTTGGCTGGG TGTTTGACCG GCCGCAGTAT

451 GAGTTGGGTT CGCTGTCGCC TGTTGCGGCA GTGGCGTGCC GGCGCGCCTT

501 GTCGCGTTTG GGTTTGAAAA CGCAAATCAA GTGGCCAAAC GATTTGGTCG

551 TCGGACGCGA CAAATTGGGC GGCATTCTGA TTGAAACGGT CAGGACGGGC

601 GGCAAAACGG TTGCCGTGGT CGGTATCGGC ATCAATTTCG TGCTGCCCAA

651 GGAAGTGGAA AACGCCGCTT CCGTGCAATC GCTGTTTCAG ACGGCATCGC

701 GGCGGGGAAA TGCCGATGCC GCCGTGTTGC TGGAAACGCT GTTGGCGGAA

751 CTTGATGCGG TGTTGTTGCA ATATGCGCGG GACGGATTTG CGCCTTTTGT

801 GGCGGAATAT CAGGCTGCCA ACCGCGACCA CGGCAAGGCG GTATTGCTGT

851 TGCGCGACGG CGAAACCGTG TTCGAAGGCA CGGTTAAAGG CGTGGACGGA

901 CAAGGCGTTC TGCACTTGGA AACGGCAGAG GGCAAACAGA CGGTCGTCAG

951 CGGCGAAATC AGCCTGCGGT CCGACGACAG GCCGGTTTCC GTGCCGAAGC

1001 GGCGGGATTC GGAACGTTTT CTGCTGTTGG ACGGCGGCAA CAGCCGGCTC

1051 AAGTGGGCGT GGGTGGAAAA CGGCACGTTC GCAACCGTCG GTAGCGCGCC

1101 GTACCGCGAT TTGTCGCCTT TGGGCGCGGA GTGGGCGGAA AAGGTGGATG

1151 GAAATGTCCG CATCGTCGGT TGCGCCGTGT GCGGAGAATT CAAAAAGGCA

1201 CAAGTGCAGG AACAGCTCGC CCGAAAAATC GAGTGGCTGC CGTCTTCCGC

1251 ACAGGCTTTG GGCATACGCA ACCACTACCG CCACCCCGAA GAACACGGTT

1301 CCGACCGCTG GTTCAACGCC TTGGGCAGCC GCCGCTTCAG CCGCAACGCC

1351 TGCGTCGTCG TCAGTTGCGG CACGGCGGTA ACGGTTGACG CGCTCACCGA

1401 TGACGGACAT TATCTCGGGG GAACCATCAT GCCCGGTTTC CACCTGATGA

1451 AAGAATCGCT CGCCGTCCGA ACCGCCAACC TCAACCGGCA CGCCGGTAAG

1501 CGTTATCCTT TCCCGACCAC AACGGGCAAT GCCGTCGCCA GCGGCATGAT

1551 GGATGCGGTT TGCGGCTCGG TTATGATGAT GCACGGGCGT TTGAAAGAAA

1601 AAACCGGGGC GGGCAAGCCT GTCGATGTCA TCATTACCGG CGGCGGCGCG

1651 GCAAAAGTTG CCGAAGCCCT GCCGCCTGCA TTTTTGGCGG AAAATACCGT

1701 GCGCGTGGCG GACAACCTCG TCATTCACGG GCTGCTGAAC CTGATTGCCG

1751 CCGAAGGCGG GGAATCGGAA CATACTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 236>：

1 MTVLKPSHWR VLAELADGLP QHVSQLARMA DMKPQQLNGF WQQMPAHIRG

51 LLRQHDGYWR LVRPLAVFDA EGLRELGERS GFQTALKHEC ASSNDEILEL

101 ARIAPDKAHK TICVTHLQSK GRGRQGRKWS HRLGECLMFS FGWVFDRPQY

151 ELGSLSPVAA VACRRALSRL GLKTQIKWPN DLVVGRDKLG GILIETVRTG

201 GKTVAVVGIG INFVLPKEVE NAASVQSLFQ TASRRGNADA AVLLETLLAE

251 LDAVLLQYAR DGFAPFVAEY QAANRDHGKA VLLLRDGETV FEGTVKGVDG

301 QGVLHLETAE GKQTVVSGEI SLRSDDRPVS VPKRRDSERF LLLDGGNSRL

351 KWAWVENGTF ATVGSAPYRD LSPLGAEWAE KVDGNVRIVG CAVCGEFKKA

401 QVQEQLARKI EWLPSSAQAL GIRNHYRHPE EHGSDRWFNA LGSRRFSRNA

451 CVVVSCGTAV TVDALTDDGH YLGGTIMPGF HLMKESLAVR TANLNRHAGK

501 RYPFPTTTGN AVASGMMDAV CGSVMMMHGR LKEKTGAGKP VDVIITGGGA

551 AKVAEALPPA FLAENTVRVA DNLVIHGLLN LIAAEGGESE HT*

ORF61a和ORF61-1在591个氨基酸的重叠区内有98.5％的相同性：

10 20 30 40 50 60

orf61a.pep MTVLKPSHWRVLAELADGLPQHVSQLARMADMKPQQLNGFWQQMPAHIRGLLRQHDGYWR

||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 MTVLKLSHWRVLAELADGLPQHVSQLARMADMKPQQLNGFWQQMPAHIRGLLRQHDGYWR

10 20 30 40 50 60

70 80 90 100 110 120

orf61a.pep LVRPLAVFDAEGLRELGERSGFQTALKHECASSNDEILELARIAPDKAHKTICVTHLQSK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 LVRPLAVFDAEGLRELGERSGFQTALKHECASSNDEILELARIAPDKAHKTICVTHLQSK

70 80 90 100 110 120b 130 140 150 160 170 180

orf61a.pep GRGRQGRKWSHRLGECLMFSFGWVFDRPQYELGSLSPVAAVACRRALSRLGLKTQIKWPN

|||||||||||||||||||||||||||||||||||||||||||||||||||| :||||||

orf61-1 GRGRQGRKWSHRLGECLMFSFGWVFDRPQYELGSLSPVAAVACRRALSRLGLDVQIKWPN

130 140 150 160 170 180

190 200 210 220 230 240

orf61a.pep DLVVGRDKLGGILIETVRTGGKTVAVVGIGINFVLPKEVENAASVQSLFQTASRRGNADA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 DLVVGRDKLGGILIETVRTGGKTVAVVGIGINFVLPKEVENAASVQSLFQTASRRGNADA

190 200 210 220 230 240

250 260 270 280 290 300

orf61a.pep AVLLETLLAELDAVLLQYARDGFAPFVAEYQAANRDHGKAVLLLRDGETVFEGTVKGVDG

||||||||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 AVLLETLLVELDAVLLQYARDGFAPFVAEYQAANRDHGKAVLLLRDGETVFEGTVKGVDG

250 260 270 280 290 300

310 320 330 340 350 360

orf61a.pep QGVLHLETAEGKQTVVSGEISLRSDDRPVSVPKRRDSERFLLLDGGNSRLKWAWVENGTF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 QGVLHLETAEGKQTVVSGEISLRSDDRPVSVPKRRDSERFLLLDGGNSRLKWAWVENGTF

310 320 330 340 350 360

370 380 390 400 410 420

orf61a.pep ATVGSAPYRDLSPLGAEWAEKVDGNVRIVGCAVCGEFKKAQVQEQLARKIEWLPSSAQAL

|||||||||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf61-1 ATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGEFKKAQVQEQLARKIEWLPSSAQAL

370 380 390 400 410 420

430 440 450 460 470 480

orf61a.pep GIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDDGHYLGGTIMPGF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 GIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDDGHYLGGTIMPGF

430 440 450 460 470 480

490 500 510 520 530 540

orf61a.pep HLMKESLAVRTANLNRHAGKRYPFPTTTGNAVASGMMDAVCGSVMMMHGRLKEKTGAGKP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 HLMKESLAVRTANLNRHAGKRYPFPTTTGNAVASGMMDAVCGSVMMMHGRLKEKTGAGKP

490 500 510 520 530 540

550 560 570 580 590

orf61a.pep VDVIITGGGAAKVAEALPPAFLAENTVRVADNLVIHGLLNLIAAEGGESEHTX

|||||||||||||||||||||||||||||||||||:||||:||||| | ||

orf61-1 VDVIITGGGAAKVAEALPPAFLAENTVRVADNLVIYGLLNMIAAEGREYEHIX

550 560 570 580 590

与淋病奈瑟球菌的预计ORF的同源性

ORF61与淋病奈瑟球菌的预计ORF(ORF61.ng)在重叠的189个氨基酸内有94.2％的相同性：

orf61.pep EISLRSDXRPVSVXKRRDSERFLLLDGGNS 30

||||| | | ||| || ||||||||:||||

orf61ng TVCEGTVKGVDGRGVLHLETAEGEQTVVSGEISLRPDNRSVSVPKRPDSERFLLLEGGNS 211

orf61.pep RLKWAWVENGTFATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGEFKKAQVQEQLAR 90

|||||||||||||||||||||||||||||||||||||||||||||||| |||||:|||||

orf61ng RLKWAWVENGTFATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGESKKAQVKEQLAR 271

orf61.pep KIEWLPSSAQAXGIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDD 150

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61ng KIEWLPSSAQALGIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDD 331

orf61.pep GHYLGXGTIMPGFHLMKESLAVRTANLNRHAGKRYPFPT 189

||||| ||||||||||||||||||||||| |||||||||

orf61ng GHYLG-GTIMPGFHLMKESLAVRTANLNRPAGKRYPFPTTTGNAVASGMMDAVCGSIMMM 390

预计ORF61ng核苷酸序列<SEQ ID 237>编码的蛋白质具有氨基酸序列<SEQ ID238>：

1 MFSFGWAFDR PQYEL GSLSP VAALACRRAL GCLGLETQIK WPNDLVVGRD

51 KLGGILIETV RAGGKTVAVV GIGINFVLPK EVENAASVQS LFQTASRRGN

101 ADAAVLLETL LAELGAVLEQ YAEEGFAPFL NEYETANRDH GKAVLLLRDG

151 ETVCEGTVKG VDGRGVLHLE TAEGEQTVVS GEISLRPDNR SVSVPKRPDS

201 ERFLLLEGGN SRLKWAWVEN GTFATVGSAP YRDLSPLGAE WAEKADGNVR

251 IVGCAVCGES KKAQVKEQLA RKIEWLPSSA QALGIRNHYR HPEEHGSDRW

301 FNALGSRRFS RNACVVVSCG TAVTVDALTD DGHYLGGTIM PGFHLMKESL

351 AVRTANLNRP AGKRYPFPTT TGNAVASGMM DAVCGSIMMM HGRLKEKNGA

401 GKPVDVIITG GGAAKVAEAL PPAFLAENTV RVADNLVIHG LLNLIAAEGG

451 ESEHA*

进一步的分析揭示完整的淋球菌DNA序列<SEQ ID 239>是：

1 ATGACGGTTT TGAAGCCTTC GCATTGGCGG GTGTTGGCGG AGCTTGCCGA

51 CGGTTTGCCG CAACACGTAT CGCAATTGGC GCGTGAGGCG GACATGAAGC

101 CGCAGCAGCT CAACGGTTTT TGGCAGCAGA TGCCGGCGCA TATACGCGGG

151 CTGTTGCGCC AACACGACGG CTATTGGCGG CTGGTGCGCC CCTTGGCGGT

201 TTTCGATGCC GAAGGTTTGC GCGATCTGGG GGAAAGGTCG GGTTTTCAGA

251 CGGCATTGAA GCACGAGTGC GCGTCCAGCA ACGACGAGAT ACTGGAATTG

301 GCGCGGATTG CGCCGGACAA GGCGCACAAA ACCATATGCG TGACCCACCT

351 GCAAAGTAAG GGCAGGGGGC GGCAGGGGCG GAAGTGGTCG CACCGTTTGG

401 GCGAGTGCCT GATGTTCAGT TTCGGCTGGG CGTTTGACCG GCCGCAGTAT

451 GAGTTGGGTT CGCTGTCGCC TGTTGCGGCA CTTGCGTGCC GGCGCGCTTT

501 GGGGTGTTTG GGTTTGGAAA CGCAAATCAA GTGGCCAAAC GATTTGGTCG

551 TCGGACGCGA CAAATTGGGC GGCATTCTGA TTGAAACAGT CAGGGCGGGC

601 GGTAAAACGG TTGCCGTGGT CGGTATCGGC ATCAATTTCG TGCTGCCCAA

651 GGAAGTGGAA AACGCCGCTT CCGTGCAGTC GCTGTTTCAG ACGGCATCGC

701 GGCGGGGCAA TGCCGATGCC GCCGTATTGC TGGAAACATT GCTTGCGGAA

751 CTGGGCGCGG TGTTGGAACA ATATGCGGAA GAAGGGTTCG CGCCATTTTT

801 AAATGAGTAT GAAACGGCCA ACCGCGACCA CGGCAAGGCG GTATTGCTGT

851 TGCGCGACGG CGAAACCGTG TGCGAAGGCA CGGTTAAAGG CGTGGACGGA

901 CGAGGCGTTC TGCACTTGGA AACGGCAgaa ggcgaACAGa cggtcgtcag

951 cggcgaaaTC AGcctGCggc ccgacaacaG GTCGGtttcc gtgccgaagc

1001 ggccggatTC GgaacgtTTT tTGCtgttgg aaggcgggaa cagccgGCTC

1051 AAGTGGGCGT GggtggAAAa cggcacgttc gcaaccgtgg gcagcgcgCc

1101 gtaCCGCGAT TTGTCGCCTT TGGGCGCGGA GTGGGCGGAA AAGGCGGATG

1151 GAAATGTCCG CATCGTCGGT TGCGCCGTGT GCGGAGAATC CAAAAAGGCA

1201 CAAGTGAAGG AACAGCTCGC CCGAAAAATC GAGTGGCTGC CGTCTTCCGC

1251 ACAGGCTTTG GGCATACGCA ACCACTACCG CCACCCCGAA GAACACGGTT

1301 CCGACCGTTG GTTCAACGCC TTGGGCAGCC GCCGCTTCAG CCGCAACGCC

1351 TGCGTCGTCG TCAGTTGCGG CACGGCGGTA ACGGTTGACG CGCTCACCGA

1401 TGACGGACAT TATCTCGGCG GAACCATCAT GCCCGGCTTC CACCTGATGA

1451 AAGAATCGCT CGCCGTCCGA ACCGCCAACC TCAACCGCCC CGCCGGCAAA

1501 CGTTACCCTT TCCCGACCAC AACGGGCAAC GCCGTCGCAA GCGGCATGAT

1551 GGACGCGGTT TGCGGCTCGA TAATGATGAT GCACGGCCGT TTGAAAGAAA

1601 AAAACGGCGC GGGCAAGCCT GTCGATGTCA TCATTACCGG CGGCGGCGCG

1651 GCGAAAGTCG CCGAAGCCCT GCCGCCTGCA TTTTTGGCGG AAAATACCGT

1701 GCGCGTGGCG GACAACCTCG TCATCCACGG GCTGCTGAAC CTGATTGCCG

1751 CCGAAGGCGG GGAATCGGAA CACGCTTAA

它对应于氨基酸序列<SEQ ID 240；ORF61ng-1>：

1 MTVLKPSHWR VLAELADGLP QHVSQLAREA DMKPQQLNGF WQQMPAHIRG

51 LLRQHDGYWR LVRPLAVFDA EGLRDLGERS GFQTALKHEC ASSNDEILEL

101 ARIAPDKAHK TICVTHLQSK GRGRQGRKWS HRLGECLMFS FGWAFDRPQY

151 ELGSLSPVAA LACRRALGCL GLETQIKWPN DLVVGRDKLG GILIETVRAG

201 GKTVAVVGIG INFVLPKEVE NAASVQSLFQ TASRRGNADA AVLLETLLAE

251 LGAVLEQYAE EGFAPFLNEY ETANRDHGKA VLLLRDGETV CEGTVKGVDG

301 RGVLHLETAE GEQTVVSGEI SLRPDNRSVS VPKRPDSERF LLLEGGNSRL

351 KWAWVENGTF ATVGSAPYRD LSPLGAEWAE KADGNVRIVG CAVCGESKKA

401 QVKEQLARKI EWLPSSAQAL GIRNHYRHPE EHGSDRWFNA LGSRRFSRNA

451 CVVVSCGTAV TVDALTDDGH YLGGTIMPGF HLMKESLAVR TANLNRPAGK

501 RYPFPTTTGN AVASGMMDAV CGSIMMMHGR LKEKNGAGKP VDVIITGGGA

551 AKVAEALPPA FLAENTVRVA DNLVIHGLLN LIAAEGGESE HA*

ORF61ng-1和ORF61-1在591个氨基酸的重叠区内有93.9％的相同性：

orf61ng-1.pep MTVLKPSHWRVLAELADGLPQHVSQLAREADMKPQQLNGFWQQMPAHIRGLLRQHDGYWR 60

||||| |||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf61-1 MTVLKLSHWRVLAELADGLPQHVSQLARMADMKPQQLNGFWQQMPAHIRGLLRQHDGYWR 60

orf61ng-1.pep LVRPLAVFDAEGLRDLGERSGFQTALKHECASSNDEILELARIAPDKAHKTICVTHLQSK 120

||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf61-1 LVRPLAVFDAEGLRELGERSGFQTALKHECASSNDEILELARIAPDKAHKTICVTHLQSK 120

orf61ng-1.pep GRGRQGRKWSHRLGECLMFSFGWAFDRPQYELGSLSPVAALACRRALGCLGLETQIKWPN 180

|||||||||||||||||||||||:|||||||||||||||||||||||: |||::||||||

orf61-1 GRGRQGRKWSHRLGECLMFSFGWVFDRPQYELGSLSPVAAVACRRALSRLGLDVQIKWPN 180

orf61ng-1.pep DLVVGRDKLGGILIETVRAGGKTVAVVGIGINFVLPKEVENAASVQSLFQTASRRGNADA 240

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf61-1 DLVVGRDKLGGILIETVRTGGKTVAVVGIGINFVLPKEVENAASVQSLFQTASRRGNADA 240

orf61ng-1.pep AVLLETLLAELGAVLEQYAEEGFAPFLNEYETANRDHGKAVLLLRDGETVCEGTVKGVDG 300

||||||||:|| ||| |||::|||||: ||::|||||||||||||||||| |||||||||

orf61-1 AVLLETLLVELDAVLLQYARDGFAPFVAEYQAANRDHGKAVLLLRDGETVFEGTVKGVDG 300

orf61ng-1.pep RGVLHLETAEGEQTVVSGEISLRPDNRSVSVPKRPDSERFLLLEGGNSRLKWAWVENGTF 360

:||||||||||:||||||||||| |:| |||||| ||||||||:|||||||||||||||

orf61-1 QGVLHLETAEGKQTVVSGEISLRSDDRPVSVPKRRDSERFLLLDGGNSRLKWAWVENGTF 360

orf61ng-1.pep ATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGESKKAQVKEQLARKIEWLPSSAQAL 420

|||||||||||||||||||||||||||||||||||| |||||:|||||||||||||||||

orf61-1 ATVGSAPYRDLSPLGAEWAEKADGNVRIVGCAVCGEFKKAQVQEQLARKIEWLPSSAQAL 420

orf61ng-1.pep GIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDDGHYLGGTIMPGF 480

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf61-1 GIRNHYRHPEEHGSDRWFNALGSRRFSRNACVVVSCGTAVTVDALTDDGHYLGGTIMPGF 480

orf61ng-1.pep HLMKESLAVRTANLNRPAGKRYPFPTTTGNAVASGMMDAVCGSIMMMHGRLKEKNGAGKP 540

|||||||||||||||| ||||||||||||||||||||||||||:||||||||||:|||||

orf61-1 HLMKESLAVRTANLNRHAGKRYPFPTTTGNAVASGMMDAVCGSVMMMHGRLKEKTGAGKP 540

orf61ng-1.pep VDVIITGGGAAKVAEALPPAFLAENTVRVADNLVIHGLLNLIAAEGGESEHAX 593

||||||||||||||||||||||||||||||||||:||||:|||||| | ||

orf61-1 VDVIITGGGAAKVAEALPPAFLAENTVRVADNLVIYGLLNMIAAEGREYEHIX 593

根据该分析结果(包括与副百日咳博德特氏菌的baf蛋白有同源性，以及存在一个推定的原核细胞膜脂蛋白脂质连接位点)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例29

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 241>：

1 ATGTTTTACC AAATCCTTGC CCTGATTATC TGGAGCAGCT CGTTTATTGC

51 CGCCAAATAT GTCTATGGCG GCATCGATCC CGCATTGATG GTCGGCGTGC

101 GCCTGCTAAT TGCCGCGCTG CCTGCACTGC CCGCCTGCCG CCGTCATGTC

151 GGCAAGATTC CGCGTGAGGA ATGGAAGCCG TTGCTGATTG TGTCGTTCGT

201 CAACTATGTG CTGACCCTGC TGCTTCAGTT TGTCGGGTTG AAATACACTT

251 CCGCCGCCAG CGCATCGGTC ATTGTCGGAC TCGAGCCGCT GCTGATGGTG

301 TTTGTCGGAC ACTTTTTCTT CAACGACAAA GCGCGTGCCT ACCACTGGAT

351 ATGCGGCGCG GCGGCATTTG CCGGTGTCGC GCTGCTGATG GCGGGCGGTG

401 CGGaAGAGGG CGGCGaAGTC GGCTGGTTCG GCTGCCTGCT GGTGTTGTTG

451 GCGGGCGCGG GCTTTTGTGC CGCTATGCGT CCGACGCAAA GGCTGATTGC

501 ACGCATCGGC GCACCGGCAT TCACATCTGT TTCCATTGCC GCCGCATCGT

551 TGATGTGCCT GCCGTTTTCG CTTGCTTTGG CGCAAAGTTA TACCGTGGAC

601 TGGAGCGTCG GGATGGTATT GTCGCTGCTG TATTTGGGTT TGGGGTGC..

它对应于氨基酸序列<SEQ ID 242；ORF62>：

1 MFYQILALII WSSSFIAAKY VYGGIDPALM VGVRLLIAAL PALPACRRHV

51 GKIPREEWKP LLIVSFVNYV LTLLLQFVGL KYTSAASASV IVGLEPLLMV

101 FVGHFFFNDK ARAYHWICGA AAFAGVALLM AGGAEEGGEV GWFGCLLVLL

151 AGAGFCAAMR PTQRLIARIG APAFTSVSIA AASLMCLPFS LALAQSYTVD

201 WSVGMVLSLL YLGLGC..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 243>：

1 ATGTTTTACC AAATCCTTGC CCTGATTATC TGGAGCAGCT CGTTTATTGC

51 CGCCAAATAT GTCTATGGCG GCATCGATCC CGCATTGATG GTCGGCGTGC

101 GCCTGCTAAT TGCCGCGCTG CCTGCACTGC CCGCCTGCCG CCGTCATGTC

151 GGCAAGATTC CGCGTGAGGA ATGGAAGCCG TTGCTGATTG TGTCGTTCGT

201 CAACTATGTG CTGACCCTGC TGCTTCAGTT TGTCGGGTTG AAATACACTT

251 CCGCCGCCAG CGCATCGGTC ATTGTCGGAC TCGAGCCGCT GCTGATGGTG

301 TTTGTCGGAC ACTTTTTCTT CAACGACAAA GCGCGTGCCT ACCACTGGAT

351 ATGCGGCGCG GCGGCATTTG CCGGTGTCGC GCTGCTGATG GCGGGCGGTG

401 CGGAAGAGGG CGGCGAAGTC GGCTGGTTCG GCTGCCTGCT GGTGTTGTTG

451 GCGGGCGCGG GCTTTTGTGC CGCTATGCGT CCGACGCAAA GGCTGATTGC

501 ACGCATCGGC GCACCGGCAT TCACATCTGT TTCCATTGCC GCCGCATCGT

551 TGATGTGCCT GCCGTTTTCG CTTGCTTTGG CGCAAAGTTA TACCGTGGAC

601 TGGAGCGTCG GGATGGTATT GTCGCTGCTG TATTTGGGTT TGGGGTGCGG

651 CTGGTACGCC TATTGGCTGT GGAACAAGGG GATGAGCCGT GTTCCTGCCA

701 ATGTTTCGGG ACTGTTGATT TCGCTCGAAC CCGTCGTCGG CGTGCTGCTG

751 GCGGTTTTGA TTTTGGGCGA ACACCTGTCG CCCGTGTCCG CCTTGGGCGT

801 GTTTGTCGTC ATCGCCGCCA CCTTGGTTGC CGGCCGGCTG TCGCATCAAA

851 AATAA

它对应于氨基酸序列<SEQ ID 244；ORF62-1>：

1 MFYQILALII WSSSFIAAKY VYGGID PALM VGVRLLIAAL PALPACRRHV

51 GKIPREEWKP L LIVSFVNYV LTLLLQFVGL KYTSA ASASV IVGLEPLLMV

101 FVGHFFFNDK ARAYHW ICGA AAFAGVALLM AGGAEEGGEV GW FGCLLVLL

151 AGAGFCAAMR PTQRLIARIG APAFTS VSIA AASLMCLPFS LALAQSYTVD

201 WSVGMVLSLL YLGLGCGWYA YWLWNKGMSR VPANVSG LLI SLEPVVGVLL

251 AVLILGEHLS P VSALGVFVV IAATLVAGRL SHQK*

该氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的假设跨膜蛋白HI0976(登录号为Q57147)的同源性

ORF62和HI0976在114的氨基酸的重叠区内有50％的氨基酸相同性：

Orf62 1 MFYQILALIIWSSSFIAAKYVYGGIDPALMVGVRXXXXXXXXXXXCRRHVGKIPREEWKP 60

M YQILAL+IWSSS I K Y +DP L+V VR R KI + K

HI0976 1 MLYQILALLIWSSSLIVGKLTYSMMDPVLVVQVRLIIAMIIVMPLFLRRWKKIDKPMRKQ 60

Orf62 61 LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAY 114

L ++F NY LLQF+GLKYTSA+SA ++GLEPLL+VFVGHFFF K +

HI0976 61 LWWLAFFNYTAVFLLQFIGLKYTSASSAVTMIGLEPLLVVFVGHFFFKTKQNGF 114

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF62与脑膜炎奈瑟球菌菌株A的ORF(ORF62a)在重叠的216个氨基酸内有99.5％的相同性：

10 20 30 40 50 60

orf62.pep MFYQILALIIWSSSFIAAKYVYGGID PALMVGVRLLIAALPALPACRRHVGKIPREEWKP

||||||||||||||||| ||||||||| ||||||||||||||||| |||||||||||||||||

orf62a MFYQILALIIWSSSFIAAKYVYGGID PALMVGVRLLIAALPALPACRRHVGKIPREEWKP

10 20 30 40 50 60

70 80 90 100 110 120

orf62.pep L LIVSFVNYVLTLLLQFVGLKYTSA ASASVIVGLEPLLMVFVGHFFFNDKARAYHW ICGA

||||||||||||||||||| ||||||| ||||||||||||||||| |||||||||||||| |||

orf62a L LIVSFVNYVLTLLLQFVGLKYTSA ASASVIVGLEPLLMVFVGHFFFNDKARAYHW ICGA

70 80 90 100 110 120

130 140 150 160 170 180

orf62.pep AAFAGVALLMAGGAEEGGEVGW FGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTS VSIA

||||||||||||| ||||||||| ||||||||||||||||| ||||||||||||||||| ||||

orf62a AAFAGVALLMAGGAEEGGEVGW FGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTS VSIA

130 140 150 160 170 180

190 200 210

orf62.pep AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGC

||||||||||||| ||||||||||||||||||||:||

orf62a AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGVGCSWYAYWLWNKGMSRVPANVSG LLI

190 200 210 220 230 240

orf62a SLEPVVGVLLAVLILGEHLSPVSVLGVFVVIAATLVAGRLSHQKX

250 260 270 280

全长ORF62a核苷酸序列<SEQ ID 245>是：

1 ATGTTTTACC AAATCCTTGC CCTGATTATC TGGAGCAGCT CGTTTATTGC

51 CGCCAAATAT GTCTATGGCG GCATCGATCC CGCATTGATG GTCGGCGTGC

101 GCCTGCTGAT TGCTGCGCTG CCTGCACTGC CCGCCTGCCG CCGTCATGTC

151 GGCAAGATTC CGCGTGAGGA ATGGAAGCCG TTGCTGATTG TGTCGTTCGT

201 CAACTATGTG CTGACCCTGC TACTTCAGTT TGTCGGGTTG AAATACACTT

251 CCGCCGCCAG CGCATCGGTC ATTGTCGGAC TCGAGCCACT GCTGATGGTG

301 TTTGTCGGAC ACTTTTTCTT CAACGACAAA GCGCGTGCCT ACCACTGGAT

351 ATGCGGCGCG GCGGCATTTG CCGGTGTCGC GCTGCTGATG GCGGGCGGTG

401 CGGAAGAGGG CGGCGAAGTC GGCTGGTTCG GCTGCCTGCT GGTGTTGTTG

451 GCGGGCGCGG GCTTTTGTGC CGCTATGCGT CCGACGCAAA GGCTGATTGC

501 ACGCATCGGC GCACCGGCAT TCACATCTGT TTCCATTGCC GCCGCATCGT

551 TGATGTGCCT GCCGTTTTCG CTTGCTTTGG CGCAAAGTTA TACCGTGGAC

601 TGGAGCGTCG GAATGGTATT GTCGCTGCTG TATTTGGGCG TGGGGTGCAG

651 CTGGTACGCC TATTGGCTGT GGAACAAGGG GATGAGCCGT GTTCCTGCCA

701 ACGTTTCGGG ACTGTTGATT TCGCTCGAAC CCGTCGTCGG CGTGCTGCTG

751 GCGGTTTTGA TTTTGGGCGA ACACCTGTCG CCCGTGTCCG TCTTGGGCGT

801 GTTTGTCGTC ATCGCCGCCA CCTTGGTTGC CGGCCGGCTG TCGCATCAAA

851 AATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 246>：

1 MFYQILALII WSSSFIAAKY VYGGID PALM VGVRLLIAAL PALPACRRHV

51 GKIPREEWKP L LIVSFVNYV LTLLLQFVGL KYTSA ASASV IVGLEPLLMV

101 FVGHFFFNDK ARAYHW ICGA AAFAGVALLM AGGAEEGGEV GW FGCLLVLL

151 AGAGFCAAMR PTQRLIARIG APAFTS VSIA AASLMCLPFS LALAQSYTVD

201 WSVGMVLSLL YLGVGCSWYA YWLWNKGMSR VPANVSG LLI SLEPVVGVLL

251 AVLILGEHLS P VSVLGVFVV IAATLVAGRL SHQK*

ORF62a和ORF62-1在284个氨基酸的重叠区内有98.9％的相同性：

orf62a.pep MFYQILALIIWSSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 MFYQILALIIWSSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP 60

orf62a.pep LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA 120

orf62a.pep AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA 180

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA 180

orf62a.pep AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGVGCSWYAYWLWNKGMSRVPANVSGLLI 240

|||||||||||||||||||||||||||||||||:||:|||||||||||||||||||||||

orf62-1 AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGCGWYAYWLWNKGMSRVPANVSGLLI 240

orf62a.pep SLEPVVGVLLAVLILGEHLSPVSVLGVFVVIAATLVAGRLSHQKX 285

|||||||||||||||||||||||:|||||||||||||||||||||

orf62-1 SLEPVVGVLLAVLILGEHLSPVSALGVFVVIAATLVAGRLSHQKX 285

与淋病奈瑟球菌的预计ORF的同源性

ORF62与淋病奈瑟球菌的预计ORF(ORF62.ng)在重叠的216个氨基酸内有99.5％的相同性：

orf62.pep MFYQILALIIWSSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP 60

|||||||||||:||||||||||||||||||||||||||||||||||||||||||||||||

orf62ng MFYQILALIIWGSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP 60

orf62.pep LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62ng LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA 120

orf62.pep AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA 180

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62ng AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA 180

orf62.pep AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGC 216

||||||||||||||||||||||||||||||||||||

orf62ng AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGCGWYAYWLWNKGMSRVPANASGLLI 240

全长ORF62ng核苷酸序列<SEQ ID 247>是：

1 ATGTTTTACC AAATCCTTGC CCTGATTATC TGGGGCAGCT CGTTTATTGC

51 CGCCAAATAT GTCTATGGCG GCATCGATCC CGCATTGATG GTCGGCGTGC

101 GCCTGCTGAT TGCCGCGCTG CCTGCACTGC CCGCCTGCCG CCGTCATGTC

151 GGCAAGATTC CGCGTGAGGA ATGGAAGCCG TTGCTGATTG TGTCGTTCGT

201 CAACTATGTG CTGACCCTGC TGCTTCAGTT TGTCGGGTTG AAATACACTT

251 CCGCCGCCAG CGCATCGGTC ATTGTCGGAC TCGAGCCGCT GCTGATGGTG

301 TTTGTCGGAC ACTTTTTCTT CAACGACAAA GCGCGTGCCT ACCACTGGAT

351 ATGCGGCGCG GCGGCATTTG CCGGTGTCGC GCTGCTGATG GCGGGCGGTG

401 CGGAAGAGGG CGGCGAAGTC GGCTGGTTCG GCTGCCTGCT GGTGTTGTTG

451 GCGGGCGCGG GCTTTTGTGC CGCTATGCGT CCGACGCAAA GGCTGATTGC

501 CCGCATCGGC GCACCGGCAT TCACATCTGT TTCCATTGCC GCCGCATCGT

551 TGATGTGCCT GCCGTTTTCG CTTGCTTTGG CGCAAAGTTA TACCGTGGAC

601 TGGAGCGTCG GGATGGTATT GTCGCTGTTG TATTTGGGTT TGGGGTGCGG

651 CTGGTACGCC TATTGGCTGT GGAACAAGGG GATGAGCCGT GTTCCTGCCA

701 ACGCGTCGGG ACTGTTGATT TCGCTCGAAC CCGTCGTCGG CGTGCTGTTG

751 GCGGTTTTGA TTTTGGGCGA ACATTTATCG CCCGTGTCCG CCTTGGGCGT

801 GTTTGTCGTC ATCGCCGCCA CTTTCGCCGC CGGCCGGCTG TCGCGCAGGG

851 ACGCGCAAAA CGGCAATGCC GTCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 248>：

1 AKY VYGGIDPALM VGVRLLIAAL PALPACRRHV

51 GKIPREEWKP L LIVSFVNYV LTLLLQFVGL KYTSA ASASV IVGLEPLLMV

101 FVGHFFFNDK ARAYHW ICGA AAFAGVALLM AGGAEEGGEV GW FGCLLVLL

151 AGAGFCAAMR PTQRLIARIG APAFTS VSIA AASLMCLPFS LALAQSYTVD

201 WSVGMVLSLL YLGLGCGWYA YWLWNKGMSR VPANASG LLI SLEPVVGVLL

251 AVLILGEHLS P VSALGVFVV IAATFAAGRL SRRDAQNGNA V*

ORF62ng和ORF62-1在283个氨基酸的重叠区内有97.9％的相同性：

10 20 30 40 50 60

orf62ng.pep MFYQILALIIWGSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP

||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 MFYQILALIIWSSSFIAAKYVYGGIDPALMVGVRLLIAALPALPACRRHVGKIPREEWKP

10 20 30 40 50 60

70 80 90 100 110 120

orf62ng.pep LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAYHWICGA

70 80 90 100 110 120

130 140 150 160 170 180

orf62ng.pep AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf62-1 AAFAGVALLMAGGAEEGGEVGWFGCLLVLLAGAGFCAAMRPTQRLIARIGAPAFTSVSIA

130 140 150 160 170 180

190 200 210 220 230 240

orf62ng.pep AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGCGWYAYWLWNKGMSRVPANASGLLI

||||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||

orf62-1 AASLMCLPFSLALAQSYTVDWSVGMVLSLLYLGLGCGWYAYWLWNKGMSRVPANVSGLLI

190 200 210 220 230 240

250 260 270 280 290

orf62ng.pep SLEPVVGVLLAVLILGEHLSPVSALGVFVVIAATFAAGRLSRRDAQNGNAVX

|||||||||||||||||||||||||||||||||||::||||::

orf62-1 SLEPVVGVLLAVLILGEHLSPVSALGVFVVIAATLVAGRLSHQKX

250 260 270 280

另外，ORF62ng显示出与假设的流感嗜血菌蛋白明显同源：

sp|Q57147|Y976_HAEIN假设蛋白HI0976>gi|1074589|pir||B64163假设蛋白HI0976-流感嗜血菌(Rd KW20菌株)

>gi|1574004(U32778)假设的[流感嗜血菌]长度＝128

评分＝106位(262)，估计值＝2e-22

相同性＝56/114(49％)，阳性＝68/114(59％)

询问：1 MFYQILALIIWGSSFIAAKYVYGGIDPALMVGVRXXXXXXXXXXXCRRHVGKIPREEWKP 60

M YQILAL+IW SS I K Y +DP L+V VR R KI + K

目标：1 MLYQILALLIWSSSLIVGKLTYSMMDPVLVVQVRLIIAMIIVMPLFLRRWKKIDKPMRKQ 60

询问：61 LLIVSFVNYVLTLLLQFVGLKYTSAASASVIVGLEPLLMVFVGHFFFNDKARAY 114

L ++F NY LLQF+GLKYTSA+SA ++GLEPLL+VFVGHFFF K +

目标：61 LWWLAFFNYTAVFLLQFIGLKYTSASSAVTMIGLEPLLVVFVGHFFFKTKQNGF 114

根据该分析结果(包括与流感嗜血菌的跨膜蛋白同源，且淋球菌蛋白中有推定的前导序列和几个跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例30

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 249>：

1 ATGCGCCGTT TTCTACCGAT CGCAGCCATA TGCGCmGwms TCCTGkkGTA

51 sGGACTGACG GCGGCAACCG GCAGCACCAG TTCGCTGGCG GATTATTTCT

101 GGTGGATTGT TGCGTTCAGC GCAATGCTGC TGCTGGTGTT GTCCGCCGTT

151 TTGGCACGTT ATGTCATATT GCTGTTGAAA GACAGGCGCG ACGGCGTATT

201 CGGTTCG

tA srTyGCCAAA gsGCCTgkks TGGG.ATGTT TACGCTGGTT

251 GCCGkACTGC CCGGCGTGTT TCTGTTCGGC TTTCCCGCAC AGTTCATCAA

301 CGGCACGATT AATTCGTGGT TCGGCAACGA TACCCACGAG GCGCTTGAAC

351 GCAGCCTCAA TTTGAGCAAG TCCGCATTGA ATTTGGCGGC AGACAACGCC

401 CTCGGCAACG CCGTCCCCGT GCAGATAGAC CTCATCGGCG CGGCTTCCCT

451 GCCCGGGGAT ATGGGCAGGG TGCTGGAACA TTACGCCGGC AGCGGTTTTG

501 CCCAGCTTGC CCTGTACAAy ksCGCAAGCG GCAAAATCGA AAAAAGCATC

551 AACCCGCACA AGCTCGATCA GCCGTTTCCA GGTAAGGCGC GTTGGGAaAa

601 AATCCaACGG GCGGGTTCGG TCAGGGATTT GGAAAGCATA GGCGGCGTAT

651 TGTaCGCGCA GGGCTGGCTG TCGGCGGGTA CGCACwACGG GCGCGATTAC

701 GCCTTGTTTT TCCGTCAGCC GGTTCCCAAA GGCGTGGCAG AGGATGCCGT

751 yTTAATCGAA AAGGCAAGGG CGAAATATGC TGAGTTGAGT TACAGCAAAA

801 AAGGTTTGCA GACCTTTTTC CTGGCAACCC TGCTGATTGC CTCGCTGCTG

851 TCGATTTTTC TTGCACTGGT CATGGCACTG TATTTCGCCC GCCGTTTCGT

901 CGAACCCGTC CTATCGCTTG CCGAGGGGGC GAAGGCGGTG GCGCAAGGCG

951 ATTTCAGCCA GACGCGCCCC GTGTTGCGCA ACGACGAGTT CGGACGCTTG

1001 ACCArGTTGT TCAACCACAT GACCGAGCAG CTTTCCATCG CCAAAGATGC

1051 AGACGAGCGC AACCGCCGGC GCGAGGAAGC CGCCAGGCAT TATCTTGAAT

1101 GCGTGTTGGA GGGGCTGACC ACGGGCGTGG TGGTGTTTGA CGAACAAGGC

1151 TGTCTGAAAA CCTTCAACAA AGCGGCGGGT ACC..

它对应于氨基酸序列<SEQ ID 250；ORF64>：

1 MRRFLPIAAI CAXXLXXGLT AATGSTSSLA DYFWWIVAFS AMLLLVLSAV

51 LARYVILLLK DRRDGVFGSX XAKXPXXXMF TLVAXLPGVF LFGFPAQFIN

101 GTINSWFGND THEALERSLN LSKSALNLAA DNALGNAVPV QIDLIGAASL

151 PGDMGRVLEH YAGSGFAQLA LYNXASGKIE KSINPHKLDQ PFPGKARWEK

201 IQRAGSVRDL ESIGGVLYAQ GWLSAGTHXG RDYALFFRQP VPKGVAEDAV

251 LIEKARAKYA ELSYSKKGLQ TFFLATLLIA SLLSIFLALV MALYFARRFV

301 EPVLSLAEGA KAVAQGDFSQ TRPVLRNDEF GRLTXLFNHM TEQLSIAKDA

351 DERNRRREEA ARHYLECVLE GLTTGVVVFD EQGCLKTFNK AAGT..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 251>：

1 ATGCGCCGTT TTCTACCGAT CGCAGCCATA TGCGCCGTCG TCCTGTTGTA

51 CGGACTGACG GCGGCAACCG GCAGCACCAG TTCGCTGGCG GATTATTTCT

101 GGTGGATTGT TGCGTTCAGC GCAATGCTGC TGCTGGTGTT GTCCGCCGTT

151 TTGGCACGTT ATGTCATATT GCTGTTGAAA GACAGGCGCG ACGGCGTATT

201 CGGTTCGCAG ATTGCCAAAC GCCTTTCTGG GATGTTTACG CTGGTTGCCG

251 TACTGCCCGG CGTGTTTCTG TTCGGCGTTT CCGCACAGTT CATCAACGGC

301 ACGATTAATT CGTGGTTCGG CAACGATACC CACGAGGCGC TTGAACGCAG

351 CCTCAATTTG AGCAAGTCCG CATTGAATTT GGCGGCAGAC AACGCCCTCG

401 GCAACGCCGT CCCCGTGCAG ATAGACCTCA TCGGCGCGGC TTCCCTGCCC

451 GGGGATATGG GCAGGGTGCT GGAACATTAC GCCGGCAGCG GTTTTGCCCA

501 GCTTGCCCTG TACAATGCCG CAAGCGGCAA AATCGAAAAA AGCATCAACC

551 CGCACAAGCT CGATCAGCCG TTTCCAGGTA AGGCGCGTTG GGAAAAAATC

601 CAACGGGCGG GTTCGGTCAG GGATTTGGAA AGCATAGGCG GCGTATTGTA

651 CGCGCAGGGC TGGCTGTCGG CGGGTACGCA CAACGGGCGC GATTACGCCT

701 TGTTTTTCCG TCAGCCGGTT CCCAAAGGCG TGGCAGAGGA TGCCGTCTTA

751 ATCGAAAAGG CAAGGGCGAA ATATGCTGAG TTGAGTTACA GCAAAAAAGG

801 TTTGCAGACC TTTTTCCTGG CAACCCTGCT GATTGCCTCG CTGCTGTCGA

851 TTTTTCTTGC ACTGGTCATG GCACTGTATT TCGCCCGCCG TTTCGTCGAA

901 CCCGTCCTAT CGCTTGCCGA GGGGGCGAAG GCGGTGGCGC AAGGCGATTT

951 CAGCCAGACG CGCCCCGTGT TGCGCAACGA CGAGTTCGGA CGCTTGACCA

1001 AGTTGTTCAA CCACATGACC GAGCAGCTTT CCATCGCCAA AGAAGCAGAC

1051 GAGCGCAACC GCCGGCGCGA GGAAGCCGCC AGGCATTATC TTGAATGCGT

1101 GTTGGAGGGG CTGACCACGG GCGTGGTGGT GTTTGACGAA CAAGGCTGTC

1151 TGAAAACCTT CAACAAAGCG GCGGAACAGA TTTTGGGGAT GCCGCTTACC

1201 CCCCTGTGGG GCAGCAGCCG GCACGGTTGG CACGGCGTTT CGGCGCAGCA

1251 GTCCCTGCTT GCCGAAGTGT TTGCCGCCAT CGGCGCGGCG GCAGGTACGG

1301 ACAAACCGGT CCATGTGAAA TATGCCGCGC CGGACGATGC CAAAATCCTG

1351 CTGGGCAAGG CAACCGTCCT GCCCGAAGAC AACGGCAACG GCGTGGTAAT

1401 GGTGATTGAC GACATCACCG TTTTGATACA CGCGCAAAAA GAAGCCGCGT

1451 GGGGCGAAGT GGCGAAGCGG CTGGCACACG AAATCCGCAA TCCGCTCACG

1501 CCCATCCAGC TTTCCGCCGA ACGGCTGGCG TGGAAATTGG GCGGGAAGCT

1551 GGATGAGCAG GATGCGCAAA TCCTGACGCG TTCGACCGAC ACCATCGTCA

1601 AACAGGTGGC GGCATTGAAG GAAATGGTCG AAGCATTCCG CAATTATGCG

1651 CGTTCCCCTT CGCTCAAATT GGAAAATCAG GATTTGAACG CCTTAATCGG

1701 CGATGTGTTG GCATTGTATG AAGCCGGTCC GTGCCGGTTT GCGGCGGAGC

1751 TTGCCGGCGA ACCGCTGACG GTGGCGGCGG ATACGACCGC CATGCGGCAG

1801 GTGCTGCACA ATATTTTCAA AAATGCCGCC GAAGCGGCGG AAGAAGCCGA

1851 TGTGCCCGAA GTCAGGGTAA AATCGGAAAC AGGGCAGGAC GGTCGGATTG

1901 TCCTGACGGT TTGCGACAAC GGCAAAGGGT TCGGCAGGGA AATGCTGCAC

1951 AACGCCTTCG AGCCGTATGT AACGGACAAA CCGGCGGGAA CGGGATTGGG

2001 TCTGCCTGTG GTGAAAAAAA TCATTGAAGA ACACGGCGGC CGCATCAGCC

2051 TGAGCAATCA GGATGCGGGT GGCGCGTGTG TCAGAATCAT CTTGCCAAAA

2101 ACGGTAAAAA CTTATGCGTA G

它对应于氨基酸序列<SEQ ID 252；ORF64-1>：

1 MRRFLPIAAI CAVVLLYGLT AATGSTSSLA DYFWWIVAFS AM LLLVLSAV

51 LARYVILLLK DRRDGVFGSQ IAKRLS GMFT LVAVLPGVFL FGVSAQFING

101 TINSWFGNDT HEALERSLNL SKSALNLAAD NALGNAVPVQ IDLIGAASLP

151 GDMGRVLEHY AGSGFAQLAL YNAASGKIEK SINPHKLDQP FPGKARWEKI

201 QRAGSVRDLE SIGGVLYAQG WLSAGTHNGR DYALFFRQPV PKGVAEDAVL

251 IEKARAKYAE LSYSKKGLQT FFLAT LLIAS LLSIFLALVM ALYFARRFVE

301 PVLSLAEGAK AVAQGDFSQT RPVLRNDEFG RLTKLFNHMT EQLSIAKEAD

351 ERNRRREEAA RHYLECVLEG LTTGVVVFDE QGCLKTFNKA AEQILGMPLT

401 PLWGSSRHGW HGVSAQQSLL AEVFAAIGAA AGTDKPVHVK YAAPDDAKIL

451 LGKATVLPED NGNGVVMVID DITVLIHAQK EAAWGEVAKR LAHEIRNPLT

501 PIQLSAERLA WKLGGKLDEQ DAQILTRSTD TIVKQVAALK EMVEAFRNYA

551 RSPSLKLENQ DLNALIGDVL ALYEAGPCRF AAELAGEPLT VAADTTAMRQ

601 VLHNIFKNAA EAAEEADVPE VRVKSETGQD GRIVLTVCDN GKGFGREMLH

651 NAFEPYVTDK PAGTGLGLPV VKKIIEEHGG RISLSNQDAG GACVRIILPK

701 TVKTYA*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF64与脑膜炎奈瑟球菌菌株A的ORF(ORF64a)在重叠的392个氨基酸内有92.6％的相同性：

10 20 30 40 50 60

orf64.pep MRRFLPIAAICAXXLXXGLTAATGSTSSLADYFWWIVAFSAM LLLVLSAVLARYVILLLK

|||||||||||| | ||||||||||||| |||||||||||| ||||||||||||||||| |

orf64a MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVAFSAM LLLVLSAVLARYVILLLK

10 20 30 40 50 60

70 80 90 100 110 120

orf64.pep DRRDGVFGSXXAKXPXX XMFTLVAXLPGVFLFGFPAQFINGTINSWFGNDTHEALERSLN

||||||||| || |||||| |||||||| |||||||||||||||||||||||||

orf64a DRRDGVFGSQIAKR-LS GMFTLVAVLPGVFLFGVSAQFINGTINSWFGNDTHEALERSLN

70 80 90 100 110

130 140 150 160 170 180

orf64.pep LSKSALNLAADNALGNAVPVQIDLIGAASLPGDMGRVLEHYAGSGFAQLALYNXASGKIE

|||||||||||||||||:||||| ||||||| ||||||||||||||||||||| ||||||

orf64a LSKSALNLAADNALGNAIPVQIDXIGAASLPXDMGRVLEHYAGSGFAQLALYNAASGKIE

120 130 140 150 160 170

190 200 210 220 230 240

orf64.pep KSINPHKLDQPFPGKARWEKIQRAGSVRDLESIGGVLYAQGWLSAGTHXGRDYALFFRQP

||||||||||||||||||||||:|||||| ||||||||| ||||| || |||||||||||

orf64a KSINPHKLDQPFPGKARWEKIQQAGSVRDXESIGGVLYAXGWLSAXTHNGRDYALFFRQP

180 190 200 210 220 230

250 260 270 280 290 300

orf64.pep VPKGVAEDAVLIEKARAKYAELSYSKKGLQTFFLATLLIASLLSIFLALVMALYFARRFV

||||||||||||||||| |||||||||||||||||||||||||||||||||||||||

orf64a VPKGVAEDAVLIEKARAXXXXLSYSKKGLQTFFLATLLIASLLSIFLALVMALYFARRFV

240 250 260 270 280 290

310 320 330 340 350 360

orf64.pep EPVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTXLFNHMTEQLSIAKDADERNRRREEA

|||||||||||||||||||||||||||||||||| |||||||||||||:|||||||||||

orf64a EPVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEA

300 310 320 330 340 350

370 380 390

orf64.pep ARHYLECVLEGLTTGVVVFDEQGCLKTFNKAAGT

||||||||||||||||||||||||||||||||

orf64a ARHYLECVLEGLTTGVVVFDEQGCLKTFNKAAEQILGMPLTPLWGSSRHGWHGVSAQQSL

360 370 380 390 400 410

orf64a LAEVFAAIGAAAGTDKPVHVKYAAPDDAKILLGKATVLPEDNXNGVVMVIDDITVLIHAQ

420 430 440 450 460 470

全长ORF64a核苷酸序列<SEQ ID 253>是：

1 ATGCGCCGTT TTCTACCGAT CGCAGCCATA TGCGCCGTCG TCCTGTTGTA

51 CGGACTGACG GCGGCAACCG GCAGCACCAG TTCGCTGGCG GATTATTTCT

101 GGTGGATTGT TGCGTTCAGC GCAATGCTGC TGCTGGTGTT GTCCGCCGTT

151 TTGGCACGTT ATGTCATATT GCTGTTGAAA GACAGGCGCG ACGGCGTATT

201 CGGTTCGCAG ATTGCCAAAC GCCTTTCCGG GATGTTTACG CTGGTTGCCG

251 TACTGCCCGG CGTGTTTCTG TTCGGCGTTT CCGCACAGTT TATCAACGGC

301 ACGATTAATT CGTGGTTCGG CAACGATACC CACGAGGCGC TTGAACGCAG

351 CCTCAATTTG AGCAAGTCCG CATTGAATCT GGCGGCAGAC AACGCCCTTG

401 GCAACGCCAT CCCCGTGCAG ATAGACNTCA TCGGCGCGGC TTCCCTGCCC

451 NGGGATATGG GCAGGGTGCT GGAACATTAC GCCGGCAGCG GTTTTGCCCA

501 GCTTGCCCTG TACAATGCCG CAAGCGGCAA AATCGAAAAA AGCATCAACC

551 CGCACAAGCT CGATCAGCCG TTTCCAGGTA AGGCGCGTTG GGAAAAAATC

601 CAACAGGCGG GTTCGGTCAG GGATNNGGAA AGCATAGGCG GCGTATTGTA

651 CGCGCANGGC TGGCTGTCGG CAGNNACGCA CAACGGGCGC GATTACGCCT

701 TGTTTTTCCG TCAGCCGGTT CCCAAAGGCG TGGCAGAGGA TGCCGTCTTA

751 ATCGAAAAGG CAAGGGCGNA ANANNNTNAG TTGAGTTACA GCAAAAAAGG

801 TTTGCAGACC TTTTTCCTNG CAACCCTGCT GATTGCCTCN CTGCTGTCGA

851 TTTTTCTTGC ACTGGTCATG GCACTGTATT TCGCCCGCCG TTTCGTCGAA

901 CCCGTCCTAT CGCTTGCCGA GGGGGCGAAG GCGGTGGCGC AAGGCGATTT

951 CAGCCAGACG CGCCCCGTGT TGCGCAACGA CGAGTTCGGA CGCTTGACCA

1001 AGTTGTTCAA CCACATGACC GAGCAGCTTT CCATCGCCAA AGAAGCAGAC

1051 GAGCGCAACC GCCGGCGCGA GGAAGCCGCC AGACATTATC TCGAATGCGT

1101 GTTGGAGGGG CTGACCACGG GCGTGGTGGT GTTTGACGAA CAAGGCTGTC

1151 TGAAAACCTT CAACAAAGCG GCGGAACAGA TTTTGGGGAT GCCGCTTACC

1201 CCCCTGTGGG GCAGCAGCCG GCACGGTTGG CACGGCGTTT CGGCGCAGCA

1251 GTCCCTGCTT GCCGAAGTGT TTGCCGCCAT CGGCGCGGCG GCAGGTACGG

1301 ACAAACCGGT CCATGTGAAA TATGCCGCGC CGGACGATGC CAAAATCCTG

1351 CTGGGCAAGG CAACCGTCCT GCCCGAAGAC AACNGCAACG GCGTGGTAAT

1401 GGTGATTGAC GACATCACCG TTTTGATACA CGCGCAAAAA GAAGCCGCGT

1451 GGGGCGAAGT GGCAAAACGG CTGGCACACG AAATCCGCAA TCCGCTCACG

1501 CCCATCCAGC TTTCTGCCGA ACGGCTGGCG TGGAAATTGG GCGGGAAGCT

1551 GGACGAGCAN GACGCGCAAA TCCTGACACG TTCGACCGAC ACCATCATCA

1601 AACAAGTGGC GGCATTAAAA GAAATGGTCG AGGCATTCCG CAATTACNCG

1651 CGTTCCCCTT CGNCTCAATT GGAAAATCAG GATTTGAACG CCTTAATCGG

1701 CGATGTGTTG GCATTGTACG AAGCTGGTCC GTGCCGGTTT GCGGCGGAAC

1751 TTGCCGGCGA ACCGCTGATG ATGGCGGCGG ATACGACCGC CATGCGGCAG

1801 GTGCTGCACA ATATTTTCAA AAATGCCGCC GAAGCGGCGG AAGAAGCCGA

1851 TGTGCCCGAA GTCAGGGTAA AATCGGAAGC GGGGCAGGAC GGACGGATTG

1901 TCCTGACAGT TTGCGACAAC GGCAAGGGGT TCGGCAGGGA AATGCTGCAC

1951 AATGCCTTCG AGCCGTATGT AACGGACAAA CCGGCTGGAA CGGGATTGNG

2001 ACTGCCCGTG GTGAAAAAAA TCATTGAAGA ACACGGCGGC CNCATCAGCC

2051 TGAGCAATCA GGATGCGGGC GGCGCGTNTG TCAGAATCAT CTTGCCAAAA

2101 ACGGTAGAAA CTTATGCGTA G

它编码的蛋白质具有氨基酸序列<SEQ ID 254>：

1 MRRFLPIAAI CAVVLLYGLT AATGSTSSLA DYFWWIVAFS AM LLLVLSAV

51 LARYVILLLK DRRDGVFGSQ IAKRLS GMFT LVAVLPGVFL FGVSAQFING

101 TINSWFGNDT HEALERSLNL SKSALNLAAD NALGNAIPVQ IDXIGAASLP

151 XDMGRVLEHY AGSGFAQLAL YNAASGKIEK SINPHKLDQP FPGKARWEKI

201 QQAGSVRDXE SIGGVLYAXG WLSAXTHNGR DYALFFRQPV PKGVAEDAVL

251 IEKARAXXXX LSYSKKGLQT FFLAT LLIAS LLSIFLALVM ALYFARRFVE

301 PVLSLAEGAK AVAQGDFSQT RPVLRNDEFG RLTKLFNHMT EQLSIAKEAD

351 ERNRRREEAA RHYLECVLEG LTTGVVVFDE QGCLKTFNKA AEQILGMPLT

401 PLWGSSRHGW HGVSAQQSLL AEVFAAIGAA AGTDKPVHVK YAAPDDAKIL

451 LGKATVLPED NXNGVVMVID DITVLIHAQK EAAWGEVAKR LAHEIRNPLT

501 PIQLSAERLA WKLGGKLDEX DAQILTRSTD TIIKQVAALK EMVEAFRNYX

551 RSPSXQLENQ DLNALIGDVL ALYEAGPCRF AAELAGEPLM MAADTTAMRQ

601 VLHNIFKNAA EAAEEADVPE VRVKSEAGQD GRIVLTVCDN GKGFGREMLH

651 NAFEPYVTDK PAGTGLXLPV VKKIIEEHGG XISLSNQDAG GAXVRI ILPK

701 TVETYA*

ORF64a和ORF64-1在706个氨基酸的重叠区内有96.6％的相同性：

10 20 30 40 50 60

orf64a.pep MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVAFSAMLLLVLSAVLARYVILLLK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf64-1 MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVAFSAMLLLVLSAVLARYVILLLK

10 20 30 40 50 60

70 80 90 100 110 120

orf64a.pep DRRDGVFGSQIAKRLSGMFTLVAVLPGVFLFGVSAQFINGTINSWFGNDTHEALERSLNL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf64-1 DRRDGVFGSQIAKRLSGMFTLVAVLPGVFLFGVSAQFINGTINSWFGNDTHEALERSLNL

70 80 90 100 110 120

130 140 150 160 170 180

orf64a.pep SKSALNLAADNALGNAIPVQIDXIGAASLPXDMGRVLEHYAGSGFAQLALYNAASGKIEK

||||||||||||||||:||||| ||||||| |||||||||||||||||||||||||||||

orf64-1 SKSALNLAADNALGNAVPVQIDLIGAASLPGDMGRVLEHYAGSGFAQLALYNAASGKIEK

130 140 150 160 170 180

190 200 210 220 230 240

orf64a.pep SINPHKLDQPFPGKARWEKIQQAGSVRDXESIGGVLYAXGWLSAXTHNGRDYALFFRQPV

|||||||||||||||||||||:|||||| ||||||||| ||||| |||||||||||||||

orf64-1 SINPHKLDQPFPGKARWEKIQRAGSVRDLESIGGVLYAQGWLSAGTHNGRDYALFFRQPV

190 200 210 220 230 240

250 260 270 280 290 300

orf64a.pep PKGVAEDAVLIEKARAXXXXLSYSKKGLQTFFLATLLIASLLSIFLALVMALYFARRFVE

|||||||||||||||| ||||||||||||||||||||||||||||||||||||||||

orf64-1 PKGVAEDAVLIEKARAKYAELSYSKKGLQTFFLATLLIASLLSIFLALVMALYFARRFVE

250 260 270 280 290 300

310 320 330 340 350 360

orf64a.pep PVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEAA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf64-1 PVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEAA

310 320 330 340 350 360

370 380 390 400 410 420

orf64a.pep RHYLECVLEGLTTGVVVFDEQGCLKTFNKAAEQILGMPLTPLWGSSRHGWHGVSAQQSLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf64-1 RHYLECVLEGLTTGVVVFDEQGCLKTFNKAAEQILGMPLTPLWGSSRHGWHGVSAQQSLL

370 380 390 400 410 420

430 440 450 460 470 480

orf64a.pep AEVFAAIGAAAGTDKPVHVKYAAPDDAKILLGKATVLPEDNXNGVVMVIDDITVLIHAQK

||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||

orf64-1 AEVFAAIGAAAGTDKPVHVKYAAPDDAKILLGKATVLPEDNGNGVVMVIDDITVLIHAQK

430 440 450 460 470 480

490 500 510 520 530 540

orf64a.pep EAAWGEVAKRLAHEIRNPLTPIQLSAERLAWKLGGKLDEXDAQILTRSTDTIIKQVAALK

||||||||||||||||||||||||||||||||||||||| ||||||||||||:|||||||

orf64-1 EAAWGEVAKRLAHEIRNPLTPIQLSAERLAWKLGGKLDEQDAQILTRSTDTIVKQVAALK

490 500 510 520 530 540

550 560 570 580 590 600

orf64a.pep EMVEAFRNYXRSPSXQLENQDLNALIGDVLALYEAGPCRFAAELAGEPLMMAADTTAMRQ

||||||||| |||| :||||||||||||||||||||||||||||||||| :|||||||||

orf64-1 EMVEAFRNYARSPSLKLENQDLNALIGDVLALYEAGPCRFAAELAGEPLTVAADTTAMRQ

550 560 570 580 590 600

610 620 630 640 650 660

orf64a.pep VLHNIFKNAAEAAEEADVPEVRVKSEAGQDGRIVLTVCDNGKGFGREMLHNAFEPYVTDK

||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf64-1 VLHNIFKNAAEAAEEADVPEVRVKSETGQDGRIVLTVCDNGKGFGREMLHNAFEPYVTDK

610 620 630 640 650 660

670 680 690 700

orf64a.pep PAGTGLXLPVVKKIIEEHGGXISLSNQDAGGAXVRIILPKTVETYAX

|||||| ||||||||||||| ||||||||||| |||||||||:||||

orf64-1 PAGTGLGLPVVKKIIEEHGGRISLSNQDAGGACVRIILPKTVKTYAX

670 680 690 700

与淋病奈瑟球菌的预计ORF的同源性

ORF64与淋病奈瑟球菌的预计ORF(ORF64.ng)在重叠的387个氨基酸内有86.6％的相同性：

orf64.pep MRRFLPIAAICAXXLXXGLTAATGSTSSLADYFWWIVAFSAMLLLVLSAVLARYVILLLK 60

|||||||||||| | ||||||||||||||||||||:||||||||||||||||||||||

orf64ng MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVSFSAMLLLVLSAVLARYVILLLK 60

orf64.pep DRRDGVFGSXXAKXPXXXMFTLVAXLPGVFLFGFPAQFINGTINSWFGNDTHEALERSLN 120

|||:||||| || |||||| |||:||||: |||||||||||||||||||||||||

orf64ng DRRNGVFGSQIAKR-LSGMFTLVAVLPGLFLFGISAQFINGTINSWFGNDTHEALERSLN 119

orf64.pep LSKSALNLAADNALGNAVPVQIDLIGAASLPGDMGRVLEHYAGSGFAQLALYNXASGKIE 180

||||||:||||||::|||||||||||:||| |:|| ||||||||||||||||| ||||||

orf64ng LSKSALDLAADNAVSNAVPVQIDLIGTASLSGNMGSVLEHYAGSGFAQLALYNAASGKIE 179

orf64.pep KSINPHKLDQPFPGKARWEKIQRAGSVRDLESIGGVLYAQGWLSAGTHXGRDYALFFRQP 240

||||||::|||:| | :||:||::||||:||||||||||||||||||| |||||||||||

orf64ng KSINPHQFDQPLPDKEHWEQIQQTGSVRSLESIGGVLYAQGWLSAGTHNGRDYALFFRQP 239

orf64.pep VPKGVAEDAVLIEKARAKYAELSYSKKGLQTFFLATLLIASLLSIFLALVMALYFARRFV 300

:|::||:|||||||||||||||||||||||||||:|||||||||||||||||||||||||

orf64ng IPENVAQDAVLIEKARAKYAELSYSKKGLQTFFLVTLLIASLLSIFLALVMALYFARRFV 299

orf64.pep EPVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTXLFNHMTEQLSIAKDADERNRRREEA 360

||:||||||||||||||||||||||||||||||| |||||||||||||:|||||||||||

orf64ng EPILSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEA 359

orf64.pep ARHYLECVLEGLTTGVVVFDEQGCLKTFNKAAGT 394

|||||||||:|||||||| :| :|

orf64ng ARHYLECVLDGLTTGVVVSYPLSCCRTAVFSTCHSSPLSYF 400

预计ORF64ng核苷酸序列<SEQ ID 255>编码的蛋白质具有氨基酸序列<SEQ ID256>：

1 DYFWWIVSFS AM LLLVLSAV

51 LARYVILLLK DRRNGVFGSQ IAKRLS GMFT LVAVLPGLFL FGISAQFING

101 TINSWFGNDT HEALERSLNL SKSALDLAAD NAVSNAVPVQ IDLIGTASLS

151 GNMGSVLEHY AGSGFAQLAL YNAASGKIEK SINPHQFDQP LPDKEHWEQI

201 QQTGSVRSLE SIGGVLYAQG WLSAGTHNGR DYALFFRQPI PENVAQDAVL

251 IEKARAKYAE LSYSKKGLQT FFLVT LLIAS LLSIFLALVM ALYFARRFVE

301 PILSLAEGAK AVAQGDFSQT RPVLRNDEFG RLTKLFNHMT EQLSIAKEAD

351 ERNRRREEAA RHYLECVLDG LTTGVVVSYP LSCCRTAVFS TCHSSPLSYF*

进一步的工作揭示了完整的淋球菌DNA序列<SEQ ID 257>：

1 ATGCGCCGCT TCCTACCGAT CGCAGCCATA TGCGCCGTCG TCCTGCTGTA

51 CGGATTGACG GCGGCGACCG GCAGCACCAG TTCGCTGGCG GATTATTTCT

101 GGTGGATAGT CTCGTTCAGC GCAATGCTGC TGCTGGTGTT GTCCGCCGTT

151 TTGGCACGTT ATGTCATATT GCTGTTGAAA GACAGGCGCA ACGGCGTGTT

201 CGGTTCGCAG ATTGCCAAAC GCCTTTCCGG GATGTTCACG CTGGTCGCCG

251 TACTGCCCGG CTTGTTCCTG TTCGGCATTT CCGCGCAGTT TATCAACGGC

301 ACGATTAATT CGTGGTTCGG CAACGACACC CACGAAGCCC TCGAACGCAG

351 CCTTAATTTG AGCAAGTCCG CACTGGATTT GGCGGCAGAC AATGCCGTCA

401 GCAACGCCGT TCCCGTACAG ATAGACCTCA TCGGCACCGC CTCCCTGTCG

451 GGCAATATGG GCAGTGTGCT GGAACACTAC GCCGGCAGCG GTTTTGCCCA

501 GCTTGCCCTG TACAATGCCG CAAGCGGGAA AATCGAAAAA AGCATCAATC

551 CGCACCAATT CGACCAGCCG CTTCCCGACA AAGAACATTG GGAACAGATT

601 CAGCAGACCG GTTCGGTTCG GAGTTTGGAA AGCATAGGCG GCGTATTGTA

651 CGCGCAGGGA TGGTTGTCGG CAGGTACGCA CAACGGGCGC GATTACGCGC

701 TGTTCTTCCG CCAGCCGATT CCCGAAAATG TGGCACAGGA TGCCGTTCTG

751 ATTGAAAAGG CGCGGGCGAA ATATGCCGAA TTGAGTTACA GCAAAAAAGG

801 TTTGCAGACC TTTTTTCTGG TAACCCTGCT GATTGCCTCG CTGCTGTCGA

851 TTTTTCTTGC GCTGGTAATG GCACTGTATT TTGCCCGCCG TTTCGTCGAA

901 CCCATTCTGT CGCTTGCCGA GGGCGCAAAG GCGGTGGCGC AGGGTGATTT

951 CAGCCAGACG CGCCCCGTAT TGCGCAACGA CGAGTTCGGA CGTTTGACCA

1001 AGCTGTTCAA CCATATGACC GAGCAGCTTT CCATCGCCAA AGAAGCAGAC

1051 GAACGCAACC GCCGGCGCGA GGAAGCCGCC CGTCACTACC TCGAGTGCGT

1101 GTTGGATGGG TTGACTACCG GTGTGGTGGT GTTTGACGAA AAAGGCCGTT

1151 TGAAAACCTT CAACAAGGCG GCGGAACAGA TTTTGGGGAT GCCGCTCGCC

1201 CCCCTGTGGG GCAGCAGCCG GCACGGTTGG CACGGCGTTT CGGCGCAGCA

1251 GTCCCTGCTT GCCGAAGTGT TtgccgccAT CGGTGCGGCG GCAGGTACGG

1301 ACAAACCGGT CCAGGTGGAA TATGCCGCGC CGGACGATGC CAAAATCCTG

1351 CTGGGCAAGG CGACGGTATT GCCCGAAGAC AACGGCAACG GCGTGGTGAT

1401 GGTGATTGAC GACATCACCG TGCTGATACG CGCGCAAAAA GAAGCCGCGT

1451 GGGGTGAAGT GGCGAAGCGG CTGGCACACG AAATCCGCAA TCCGCTCACG

1501 CCCATCCAGC TTTCCGCCGA ACGGCTGGCG TGGAAATTGG GCGGGAAGCT

1551 GGACGATCAG GACGCGCAAA TCCTGACGCG TtcgACCGAC ACCATCATCA

1601 AACAGgtggc gGCGTTAAAA GAAATGGTCG AGGCATTCCG CAATTACGCG

1651 CGCGCCCCTT CGCTCAAACT GGAAAATCAG GATTTGAACG CCTTAATCGG

1701 CGATGTTTTG GCCCTGTACG AAGCCGGCCC GTGCCGGTTT GAGGCGGAAC

1751 TTGCCGGCGA ACCGCTGATG ATGGCGGCGG ATACGACCGC CATGCGGCAG

1801 GTGCTGCACA ATATTTTCAA AAATGCCGCC GAAGCGGCGG AAGAAGCCGA

1851 TATGCCCGAA GTCAGGGTAA AATCGGAAAC GGGGCAGGAC GGACGGATTG

1901 TCCTGACGGT TTGCGACAAC GGCAAGGGAT TCGGCAAGGA AATGCTGCAC

1951 AATGCTTTCG AGCCGTATGT GACGGATAAG CCGGCGGGAA CGGGACTGGG

2001 TCTGCCTGTA GTGAAAAAAA TCATTGGAGAACACGGCGGC CGCATCAGCC

2051 TGAGCAATCA GGATGCGGGT GGGGCGTGTG TCAGAATCAT CTTGCCAAAA

2101 ACGGTAGAAA CTTATGCGTA G

它对应于氨基酸序列<SEQ ID 258；ORF64ng-1>：

1 MRRFLPIAAI CAVVLLYGLT AATGSTSSLA DYFWWIVSFS AM LLLVLSAV

51 LARYVILLLK DRRNGVFGSQ IAKRLS GMFT LVAVLPGLFL FGISAQFING

101 TINSWFGNDT HEALERSLNL SKSALDLAAD NAVSNAVPVQ IDLIGTASLS

151 GNMGSVLEHY AGSGFAQLAL YNAASGKIEK SINPHQFDQP LPDKEHWEQI

201 QQTGSVRSLE SIGGVLYAQG WLSAGTHNGR DYALFFRQPI PENVAQDAVL

251 IEKARAKYAE LSYSKKGLQT FFLVT LLIAS LLSIFLALVM ALYFARRFVE

301 PILSLAEGAK AVAQGDFSQT RPVLRNDEFG RLTKLFNHMT EQLSIAKEAD

351 ERNRRREEAA RHYLECVLDG LTTGVVVFDE KGRLKTFNKA AEQILGMPLA

401 PLWGSSRHGW HGVSAQQSLL AEVFAAIGAA AGTDKPVQVE YAAPDDAKIL

451 LGKATVLPED NGNGVVMVID DITVLIRAQK EAAWGEVAKR LAHEIRNPLT

501 PIQLSAERLA WKLGGKLDDQ DAQILTRSTD TIIKQVAALK EMVEAFRNYA

551 RAPSLKLENQ DLNALIGDVL ALYEAGPCRF EAELAGEPLM MAADTTAMRQ

601 VLHNIFKNAA EAAEEADMPE VRVKSETGQD GRIVLTVCDN GKGFGKEMLH

651 NAFEPYVTDK PAGTGLGLPV VKKIIGEHGG RISLSNQDAG GACVRIILPK

701 TVETYA*

ORF64ng-1和ORF64-1在706个氨基酸的重叠区内有93.8％的相同性：

10 20 30 40 50 60

orf64ng-1.pep MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVSFSAMLLLVLSAVLARYVILLLK

|||||||||||||||||||||||||||||||||||||:||||||||||||||||||||||

orf64-1 MRRFLPIAAICAVVLLYGLTAATGSTSSLADYFWWIVAFSAMLLLVLSAVLARYVILLLK

10 20 30 40 50 60

70 80 90 100 110 120

orf64ng-1.pep DRRNGVFGSQIAKRLSGMFTLVAVLPGLFLFGISAQFINGTINSWFGNDTHEALERSLNL

|||:|||||||||||||||||||||||:||||:|||||||||||||||||||||||||||

orf64-1 DRRDGVFGSQIAKRLSGMFTLVAVLPGVFLFGVSAQFINGTINSWFGNDTHEALERSLNL

70 80 90 100 110 120

130 140 150 160 170 180

orf64ng-1.pep SKSALDLAADNAVSNAVPVQIDLIGTASLSGNMGSVLEHYAGSGFAQLALYNAASGKIEK

|||||:||||||::|||||||||||:||| |:|| |||||||||||||||||||||||||

orf64-1 SKSALNLAADNALGNAVPVQIDLIGAASLPGDMGRVLEHYAGSGFAQLALYNAASGKIEK

130 140 150 160 170 180

190 200 210 220 230 240

orf64ng-1. pep SINPHQFDQPLPDKEHWEQIQQTGSVRSLESIGGVLYAQGWLSAGTHNGRDYALFFRQPI

|||||::|||:| | :||:||::||||:|||||||||||||||||||||||||||||||:

orf64-1 SINPHKLDQPFPGKARWEKIQRAGSVRDLESIGGVLYAQGWLSAGTHNGRDYALFFRQPV

190 200 210 220 230 240

250 260 270 280 290 300

orf64ng-1.pep PENVAQDAVLIEKARAKYAELSYSKKGLQTFFLVTLLIA LLSIFLALVMALYFARRFVE

|::||:|||||||||||||||||||||||||||:||||||||||||||||||||||||||

orf64-1 PKGVAEDAVLIEKARAKYAELSYSKKGLQTFFLATLLIA LLSIFLALVMALYFARRFVE

250 260 270 280 290 300

310 320 330 340 350 360

orf64ng-1.pep PILSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEAA

|:||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf64-1 PVLSLAEGAKAVAQGDFSQTRPVLRNDEFGRLTKLFNHMTEQLSIAKEADERNRRREEAA

310 320 330 340 350 360

370 380 390 400 410 420

orf64ng-1.pep RHYLECVLDGLTTGVVVFDEKGRLKTFNKAAEQILGMPLAPLWGSSRHGWHGVSAQQSLL

||||||||:|||||||||||:| ||||||||||||||||:||||||||||||||||||||

orf64-1 RHYLECVLEGLTTGVVVFDEQGCLKTFNKAAEQILGMPLTPLWGSSRHGWHGVSAQQSLL

370 380 390 400 410 420

430 440 450 460 470 480

orf64ng-1.pep AEVFAAIGAAAGTDKPVQVEYAAPDDAKILLGKATVLPEDNGNGVVMVIDDITVLIRAQK

|||||||||||||||||:|:||||||||||||||||||||||||||||||||||||:|||

orf64-1 AEVFAAIGAAAGTDKPVHVKYAAPDDAKILLGKATVLPEDNGNGVVMVIDDITVLIHAQK

430 440 450 460 470 480

490 500 510 520 530 540

orf64ng-1.pep EAAWGEVAKRLAHEIRNPLTPIQLSAERLAWKLGGKLDDQDAQILTRSTDTIIKQVAALK

||||||||||||||||||||||||||||||||||||||:|||||||||||||:|||||||

orf64-1 EAAWGEVAKRLAHEIRNPLTPIQLSAERLAWKLGGKLDEQDAQILTRSTDTIVKQVAALK

490 500 510 520 530 540

550 560 570 580 590 600

orf64ng-1.pep EMVEAFRNYARAPSLKLENQDLNALIGDVLALYEAGPCRFEAELAGEPLMMAADTTAMRQ

|||||||||||:|||||||||||||||||||||||||||| |||||||| :|||||||||

orf64-1 EMVEAFRNYARSPSLKLENQDLNALIGDVLALYEAGPCRFAAELAGEPLTVAADTTAMRQ

550 560 570 580 590 600

610 620 630 640 650 660

orf64ng-1.pep VLHNIFKNAAEAAEEADMPEVRVKSETGQDGRIVLTVCDNGKGFGKEMLHNAFEPYVTDK

|||||||||||||||||:|||||||||||||||||||||||||||:||||||||||||||

orf64-1 VLHNIFKNAAEAAEEADVPEVRVKSETGQDGRIVLTVCDNGKGFGREMLHNAFEPYVTDK

610 620 630 640 650 660

670 680 690 700

orf64ng-1.pep PAGTGLGLPVVKKIIGEHGGRISLSNQDAGGACVRIILPKTVETYAX

||||||||||||||| ||||||||||||||||||||||||||:||||

orf64-1 PAGTGLGLPVVKKIIEEHGGRISLSNQDAGGACVRIILPKTVKTYAX

670 680 690 700

另外，ORF64ng-1显示出与茎瘤固氮根瘤菌的一种蛋白明显同源：

sp|Q04850|NTRY_AZOCA氮调节蛋白NTRY>gi|77479|pir||S18624ntrY蛋白-茎瘤固氮根瘤菌>gi|38737(X63841)NtrY基因产物[茎瘤固氮根瘤菌]长度＝771

评分＝218位(550)，估计值＝7e-56

相同性＝195/720(27％)，阳性＝320/720(44％)，空隙＝58/720(8％)

询问：7 IAAICAVVLLYGLTAATGSTSSLADYFWWIXXXXXXXXXXXXXXXXRYVILLLKDRRNGV 66

I+A+ ++L GLT + + + R + + K R G

目标：35 ISALATFLILMGLTPVVPTHQVVIS----VLLVNAAAVLILSAMVGREIWRIAKARARGR 90

询问：67 FGSQIAKRLSGMFTLVAVLPGLFLFGISAQFINGTINSWFGNDTHEALERSLNLSKSALD 126

+++ R+ G+F +V+V+P + + +++ ++ ++ WF T E + S++++++ +

目标：91 AAARLHIRIVGLFAVVSVVPAILVAVVASLTLDRGLDRWFSMRTQEIVASSVSVAQTYVR 150

询问：127 LAADNAVSNAVPVQIDLIGTASLSGNMGSVLEHYAG--SGFAQLALYNAASGKIEKSINP 184

A N + + + DL S+ Y G S F Q+ AA + ++

目标：151 EHALNIRGDILAMSADLTRLKSV----------YEGDRSRFNQILTAQAALRNLPGAMLI 200

询问：185 HQFDQPLPDKEHWEQIQQTGSVRSLESIGGVLYAQGWLSAGTHNGRDYA----------- 233

+ D + ++ + I + V + +IG Q + N DY

目标：201 RR-DLSVVERAN-VNIGREFIVPANLAIGDATPDQPVIYLP--NDADYVAAVVPLKDYDD 256

询问：234 --LFFRQPIPENVAQDAVLIEKARAKYAELSYSKKGLQTFFLVTXXXXXXXXXXXXXVMA 291

L+ + I V ++ A Y L + G+Q F + +

目标：257 LYLYVARLIDPRVIGYLKTTQETLADYRSLEERRFGVQVAFALMYAVITLIVLLSAVWLG 316

询问：292 LYFARRFVEPILSLAEGAKAVAQGDFSQTRPVLRND-EFGRLTKLFNHMTEQLSIXXXXX 350

L F++ V PI L A VA+G+ P+ R + + L + FN MT +L

目标：317 LNFSKWLVAPIRRLMSAADHVAEGNLDVRVPIYRAEGDLASLAETFNKMTHELRSQREAI 376

询问：351 XXXXXXXXXXXHYLECVLDGLTTGVVVFDEKGRLKTFNKAAEQILGMPLAPLWGSSRHGW 410

+E VL G+ GV+ D + R+ N++AE++LG L+ + RH

目标：377 LTARDQIDSRRRFTEAVLSGVGAGVIGLDSQERITILNRSAERLLG--LSEVEALHRHLA 434

询问：411 HGVSAQQSLLAEVFXXXXXXXXTDKPVQVEYAAPDDAKILLGKATVLPEDNG---NGVVM 467

V LL E + VQ D + + V E + +G V+

目标：435 EVVPETAGLLEEA------EHARQRSVQGNITLTRDGRERVFAVRVTTEQSPEAEHGWVV 488

询问：468 VIDDITVLIRAQKEAAWGEVAKRLAHEIRNPLTPIQLSAERLAWKLGGKLDDQDAQILTR 527

+DDIT LI AQ+ +AW +VA+R+AHEI+NPLTPIQLSAERL K G + QD +I +

目标：489 TLDDITELISAQRTSAWADVARRIAHEIKNPLTPIQLSAERLKRKFGRHV-TQDREIFDQ 547

询问：528 STDTIIKQVAALKEMVEAFRNYARAPSLKLENQDLNALIGDVLALYEAGPCRFEAELAGE 587

TDTII+QV + MV+ F ++AR P +++QD++ +I +L G +

目标：548 CTDTIIRQVGDIGRMVDEFSSFARMPKPVVDSQDMSEIIRQTVFLMRVGHPEVVFDSEVP 607

询问：588 PLMMAA-DTTAMRQVLHNIFKNXXXXXXXXDMPEVRVK-------SETGQDGRIVLTVCD 639

P M A D + Q L NI KN P+VR + + G+D +V+ + D

目标：608 PAMPARFDRRLVSQALTNILKNAAEAIEAVP-PDVRGQGRIRVSANRVGED--LVIDIID 664

询问：640 NGKGFGKEMLHNAFEPYVTDKPAGTGLGLPVVKKIIGEHGGRISLSNQDAG-GACVRIIL 698

NG G +E + EPYVT + GTGLGL +V KI+ EHGG I L++ G GA +R+ L

目标：665 NGTGLPQESRNRLLEPYVTTREKGTGLGLAIVGKIMEEHGGGIELNDAPEGRGAWIRLTL 724

根据该分析结果(包括该淋球菌蛋白中存在一个推定的前导序列(双划线)和几个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例31

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 259>：

1 ATGTACGCAT TTACCGCCGC ACAGCAACAG AAGGCACTCT TCCGGCTGGT

51 GCTTTTTCAT ATCCTCATCA TCGCCGCCAG CAACTATCTG GTGCAGTTCC

101 CTTTCCAAAT TTTCGGCATC CACACCACTT GGGGCGCATT TTCCTTTCCC

151 TTCATCTTCC TTGCCACCGA CCTGACCGTC CGCATTTTCG GTTCTCACTT

201 GGCACGGCGG ATTATCTTTT GGGTGATGTT CCCCGCCCTT TTGCTTTCCT

251 ACGTCTTTTC CGTTTTGTTC CACAACGGCA GTTGGACAGG CTTGGGCGCG

301 CTGTCCGAAT TCAACACCTT TGTCGGACGC ATCGCCTTAG CCAGCTTTGC

351 CGCCTACGCG ATCGGACAAA TCCTTGATAT TTTTGTATTC AACAAATTAC

401 GCCGTCTGAA AGCGTGGTGG ATTGCACCGA ACGCATCAAC CGTCATCGGG

451 CACGCGTTGG ATACG...

它对应于氨基酸序列<SEQ ID 260；ORF66>：

1 MYAFTAAQQQ KALFRLVLFH ILIIAASNYL VQFPFQIFGI HTTWGAFSFP

51 FIFLATDLTV RIFGSHLARR IIFWVMFPAL LLSYVFSVLF HNGSWTGLGA

101 LSEFNTFVGR IALASFAAYA IGQILDIFVF NKLRRLKAWW IAPNASTVIG

151 HALDT...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 261>：

1 ATGTACGCAT TTACCGCCGC ACAGCAACAG AAGGCACTCT TCCGGCTGGT

51 GCTTTTTCAT ATCCTCATCA TCGCCGCCAG CAACTATCTG GTGCAGTTCC

101 CTTTCCAAAT TTTCGGCATC CACACCACTT GGGGCGCATT TTCCTTTCCC

151 TTCATCTTCC TTGCCACCGA CCTGACCGTC CGCATTTTCG GTTCTCACTT

201 GGCACGGCGG ATTATCTTTT GGGTGATGTT CCCCGCCCTT TTGCTTTCCT

251 ACGTCTTTTC CGTTTTGTTC CACAACGGCA GTTGGACAGG CTTGGGCGCG

301 CTGTCCGAAT TCAACACCTT TGTCGGACGC ATCGCCTTAG CCAGCTTTGC

351 CGCCTACGCG ATCGGACAAA TCCTTGATAT TTTTGTATTC AACAAATTAC

401 GCCGTCTGAA AGCGTGGTGG ATTGCACCGA CCGCATCAAC CGTCATCGGC

451 AACGCCTTGG ATACGCTGGT ATTTTTCGCC GTTGCCTTCT ACGCAAGCAG

501 CGATGGATTT ATGGCGGCAA ACTGGCAGGG CATCGCTTTT GTCGATTACC

551 TGTTCAAACT TACCGTCTGC ACCCTCTTCT TCCTGCCCGC CTACGGCGTG

601 ATACTGAATC TGCTGACGAA AAAACTGACA ACCCTGCAAA CCAAACAGGC

651 GCAAGACCGC CCCGCGCCCT CGCTGCAAAA TCCGTAA

它对应于氨基酸序列<SEQ ID 262；ORF66-1>：

1 MYAFTAAQQQ KALFRLVLFH ILI IAASNYL VQFPFQIFGI HTTWGAFSFP

51 FIFLATDLTV RIFGSHLARR IIFWVMFPAL LLSYVFSVLF HNGSWTGLGA

101 LSEFNTFVGR IA LASFAAYA IGQILDIFVF NKLRRLKAWW IAPTAS TVIG

151 NALDTLVFFA VAFYASSDGF MAANWQGIAF VDYLFKLT VC TLFFLPAYGV

201 ILNLLTKKLT TLQTKQAQDR PAPSLQNP*

该氨基酸序列的计算机分析给出了下列结果：

与大肠杆菌的假设蛋白o221(登录号P37619)的同源性

ORF66和o221蛋白在155个氨基酸的重叠区内有67％的氨基酸相同性：

orf66 1 MYAFTAAQQQKALFRLVLFHILIIAASNYLVQFPFQIFGIHTTWGAFSFPFIFLATDLTV 60

M F+ Q+ KALF L LFH+L+I +SNYLVQ P I G HTTWGAFSFPFIFLATDLTV

o221 1 MNVFSQTQRYKALFWLSLFHLLVITSSNYLVQLPVSILGFHTTWGAFSFPFIFLATDLTV 60

orf66 61 RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIALASFAAYA 120

RIFG+ LARRIIF VM PALL+SYV S LF+GSW G GAL +FN FV RIA ASF AYA

o221 61 RIFGAPLARRIIFAVMIPALLISYVISSLFYMGSWQGFGALAHFNLFVARIATASFMAYA 120

orf66 121 IGQILDIFVFNKLRRLKAWWIAPNASTVIGHALDT 155

+GQILD+ VFN+LR+ + WW+AP AST+ G+ DT

o221 121 LGQILDVHVFNRLRQSRRWWLAPTASTLFGNVSDT 155

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF66与脑膜炎奈瑟球菌菌株A的ORF(ORF66a)在重叠的155个氨基酸内有96.1％的相同性：

10 20 30 40 50 60

orf66.pep MYAFTAAQQQKALFRLVLFHILIIAASNYLVQFPFQIFGIHTTWGAFSFPFIFLATDLTV

|||||||||||||| |||||||||||||||||||||| |||||||||| ||||||||||||

orf66a MYAFTAAQQQKALFWLVLFHILIIAASNYLVQFPFQISGIHTTWGAFSFPFIFLATDLTV

10 20 30 40 50 60

70 80 90 100 110 120

orf66.pep RIFGSHLARR IIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIA LASFAAYA

|||||||||| ||||||||||||||||| ||||||||||||||||||||||||| ||||||||

orf66a RIFGSHLARR IIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIA LASFAAYA

70 80 90 100 110 120

130 140 150

orf66.pep IGQILDIFVFNKLRRLKAWWIAPNAS TVIGHALDT

:||||||| ||||||||||||:||:|| ||||:||||

orf66a LGQILDIFVFNKLRRLKAWWVAPTAS TVIGNALDTLVFFAVAFYASSDGFMAANWQGIAF

130 140 150 160 170 180

orf66a VDYLFKLT VCGLFFLPAYGVILNLLTKKLTTLQTKQAQDRPAPSLQNPX

190 200 210 220

全长ORF66a核苷酸序列<SEQ ID 263>是：

1 ATGTACGCAT TTACCGCCGC ACAGCAACAG AAGGCACTCT TCTGGCTGGT

51 GCTTTTTCAT ATCCTCATCA TCGCCGCCAG CAACTATCTG GTGCAGTTCC

101 CCTTCCAAAT TTCCGGCATC CACACCACTT GGGGCGCGTT TTCCTTTCCC

151 TTCATCTTCC TCGCCACCGA CCTGACCGTC CGCATTTTCG GTTCGCACTT

201 GGCACGGCGG ATTATCTTTT GGGTCATGTT CCCCGCCCTT TTGCTTTCCT

251 ACGTCTTTTC CGTTTTGTTC CACAACGGCA GTTGGACGGG CTTGGGCGCG

301 CTGTCCGAAT TCAACACCTT TGTCGGACGC ATCGCGCTGG CAAGTTTTGC

351 CGCCTACGCG CTCGGACAAA TCCTTGATAT TTTTGTGTTC AACAAATTAC

401 GCCGTCTGAA AGCGTGGTGG GTTGCCCCGA CTGCATCAAC CGTCATCGGC

451 AACGCCTTAG ATACGTTGGT ATTTTTCGCC GTTGCCTTCT ACGCAAGCAG

501 CGATGGATTT ATGGCGGCAA ACTGGCAGGG CATCGCTTTT GTCGATTACC

551 TGTTCAAACT CACCGTCTGC GGTCTGTTTT TCCTGCCCGC CTACGGCGTG

601 ATTCTGAATC TGCTGACGAA AAAACTGACG ACCCTGCAAA CCAAACAGGC

651 GCAAGACCGC CCCGCGCCCT CGCTGCAAAA TCCGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 264>：

1 MYAFTAAQQQ KALFWLVLFH ILIIAASNYL VQFPFQISGI HTTWGAFSFP

51 FIFLATDLTV RIFGSHLARR IIFWVMFPAL LLSYVFSVLF HNGSWTGLGA

101 LSEFNTFVGR IA LASFAAYA LGQILDIFVF NKLRRLKAWW VAPTAS TVIG

151 NALDTLVFFA VAFYASSDGF MAANWQGIAF VDYLFKLT VC GLFFLPAYGV

201 ILNLLTKKLT TLQTKQAQDR PAPSLQNP*

ORF66a和ORF66-1在228个氨基酸的重叠区内有97.8％的相同性：

10 20 30 40 50 60

orf66a.pep MYAFTAAQQQKALFWLVLFHILIIAASNYLVQFPFQISGIHTTWGAFSFPFIFLATDLTV

|||||||||||||| |||||||||||||||||||||| ||||||||||||||||||||||

orf66-1 MYAFTAAQQQKALFRLVLFHILIIAASNYLVQFPFQIFGIHTTWGAFSFPFIFLATDLTV

10 20 30 40 50 60

70 80 90 100 110 120

orf66a.pep RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIALASFAAYA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf66-1 RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIALASFAAYA

70 80 90 100 110 120

130 140 150 160 170 180

orf66a.pep LGQILDIFVFNKLRRLKAWWVAPTASTVIGNALDTLVFFAVAFYASSDGFMAANWQGIAF

:|||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||

orf66-1 IGQILDIFVFNKLRRLKAWWIAPTASTVIGNALDTLVFFAVAFYASSDGFMAANWQGIAF

130 140 150 160 170 180

190 200 210 220 229

orf66a.pep VDYLFKLTVCGLFFLPAYGVILNLLTKKLTTLQTKQAQDRPAPSLQNPX

|||||||||| ||||||||||||||||||||||||||||||||||||||

orf66-1 VDYLFKLTVCTLFFLPAYGVILNLLTKKLTTLQTKQAQDRPAPSLQNPX

190 200 210 220

与淋病奈瑟球菌的预计ORF的同源性

ORF66与淋病奈瑟球菌的预计ORF(ORF66.ng)在重叠的155个氨基酸内有94.2％的相同性：

orf66.pep MYAFTAAQQQKALFRLVLFHILIIAASNYLVQFPFQIFGIHTTWGAFSFPFIFLATDLTV 60

|||:|||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf66ng MYALTAAQQQKALFRLVLFHILIIAASNYLVQFPFRIFGIHTTWGAFSFPFIFLATDLTV 60

orf66.pep RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIALASFAAYA 120

||||||||||||||||||||| |||||||||||||||||| |:|||||||||||||||||

orf66ng RIFGSHLARRIIFWVMFPALSLSYVFSVLFHNGSWTGLGAPSQFNTFVGRIALASFAAYA 120

orf66.pep IGQILDIFVFNKLRRLKAWWIAPNASTVIGHALDT 155

:|||||||||:|||||||||||| ||||||:||||

orf66ng LGQILDIFVFDKLRRLKAWWIAPAASTVIGNALDTLVFFAVAFYASSDEFMAANWQGIAF 180

全长ORF66ng核苷酸序列<SEQ ID 265>是：

1 ATGTACGCAT TGACCGCCGC ACAGCAACAG AAGGCACTCT TCCGGCTGGT

51 GCTTTTCCAT ATCCTCATCA TCGCCGCCAG CAACTATCTG GTGCAGTTCC

101 CCTTCCGGAT TTTCGGCATC CACACCACTT GGGGCGCGTT TTCCTTTCCC

151 TTCATCTTCC TCGCCACCGA CCTGACCGTC CGCATTTTCG GTTCGCACTT

201 GGCGCGGCGG ATTATCTTTT GGGTGATGTT CCCCGCCCTT ttgCTTTcat

251 aCGTCTTTTC CGTTTTGTTC CACAACGGCA GTTGGACGGG CTTGGGCGCG

301 ctgTCCCAAT TCAACACCTT TGTCGGACGC ATCGCGCTGG CAAGTTTTGC

351 CGCCTACGCG CTCGGACAAA TCCTTGATAT TTTCGTATTC GACAAATTAC

401 GCCGTCTGAA AGCGTGGTGG ATTGCCCCGG CCGCATCAAC CGTCATCGGC

451 AATGCACTGG ACACGTTAGT ATTTTTTGCC GTTGCCTTTT ACGCAAGCAG

501 CGATGAATTT ATGGCGGCAA ACTGGCAGGG CATCGCTTTT GTCGATTACC

551 TGTTCAAACT TACCGTCTGC ACCCTCTTCT TCCTGCCCGC CTACGGCGTG

601 ATACTGAATC TGCTGACGAA AAAACTGACG GCCCTGCAAA CCAAACAGGC

651 GCAAGACCGC CCCGTGCCCT CGCTGCAAAA TCCGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 266>：

1 MYALTAAQQQ KALFRLVLFH ILIIAASNYL VQFPFRIFGI HTTW GAFSFP

51 FIFLATDLTV RIFGSHLARR IIFWVMFPAL SLSYVFSVLF HNGSWTGLGA

101 PSQ FNTFVGR IALASFAAYA LGQILDIFVF DKLRRLKAWW IAPAA STVIG

151 NALDTLVFFA VAFYASSDEF MAANWQGIA F VDYLFKLTVC TLFFLPAYGV

201 ILNLLTKKLT ALQTKQAQDR PVPSLQNP*

另一个注释的序列是：

1 MYALTAAQQQ KALFRLVLFH ILIIAASNYL VQFPFRIFGI HTTWGAFSFP

51 FIFLATDLTV RIFGSHLARR IIFWVMFPAL LLSYVFSVLF HNGSWTGLGA

101 LSQFNTFVGR IA LASFAAYA LGQILDIFVF DKLRRLKAWW IAPAAS TVIG

151 NALDTLVFFA VAFYASSDEF MAANWQGIAF VDYLFKLT VC TLFFLPAYGV

201 ILNLLTKKLT ALQTKQAQDR PVPSLQNP*

ORF66ng和ORF66-1在228个氨基酸的重叠区内有96.1％的相同性：

orf66-1.pep MYAFTAAQQQKALFRLVLFHILIIAASNYLVQFPFQIFGIHTTWGAFSFPFIFLATDLTV 60

|||:|||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf66ng MYALTAAQQQKALFRLVLFHILIIAASNYLVQFPFRIFGIHTTWGAFSFPFIFLATDLTV 60

orf66-1.pep RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSEFNTFVGRIALASFAAYA 120

||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||

orf66ng RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSQFNTFVGRIALASFAAYA 120

orf66-1.pep IGQILDIFVFNKLRRLKAWWIAPTASTVIGNALDTLVFFAVAFYASSDGFMAANWQGIAF 180

:|||||||||:||||||||||||:|||||||||||||||||||||||| |||||||||||

orf66ng LGQILDIFVFDKLRRLKAWWIAPAASTVIGNALDTLVFFAVAFYASSDEFMAANWQGIAF 180

orf66-1.pep VDYLFKLTVCTLFFLPAYGVILNLLTKKLTTLQTKQAQDRPAPSLQNPX 229

||||||||||||||||||||||||||||||:||||||||||:|||||||

orf66ng VDYLFKLTVCTLFFLPAYGVILNLLTKKLTALQTKQAQDRPVPSLQNPX 229

另外，ORF66ng显示出与大肠杆菌的ORF有明显的同源性：

sp|P37619|YHHQ_ECOLI FTSY-NIKA基因间区域中的假设的25.3KD蛋白(O221)

>gi|1073495|pir||S47690假设蛋白o221-大肠杆菌>gi|466607(U00039)没有发现确定线[大肠杆菌]

>gi|1789882(AE000423)ftsY-nikA基因间区域中假设的25.3kD蛋白[大肠杆菌]长度＝221

评分＝273位(692)，估计值＝5e-73

相同性＝132/203(65％)，阳性＝155/203(76％)

询问：1 MYALTAAQQQKALFRLVLFHILIIAASNYLVQFPFRIFGIHTTWGAFSFPFIFLATDLTV 60

M + Q+ KALF L LFH+L+I +SNYLVQ P I G HTTWGAFSFPFIFLATDLTV

目标：1 MNVFSQTQRYKALFWLSLFHLLVITSSNYLVQLPVSILGFHTTWGAFSFPFIFLATDLTV 60

询问：61 RIFGSHLARRIIFWVMFPALLLSYVFSVLFHNGSWTGLGALSQFNTFVGRIALASFAAYA 120

RIFG+ LARRIIF VM PALL+SYV S LF+ GSW G GAL+ FN FV RIA ASF AYA

目标：61 RIFGAPLARRIIFAVMIPALLISYVISSLFYMGSWQGFGALAHFNLFVARIATASFMAYA 120

询问：121 LGQILDIFVFDKLRRLKAWWIAPAASTVIGNALDTLVFFAVAFYASSDEFMAANWQGIAF 180

LGQILD+ VF++LR+ + WW+AP AST+ GN DTL FF +AF+ S D FMA +W IA

目标：121 LGQILDVHVFNRLRQSRRWWLAPTASTLFGNVSDTLAFFFIAFWRSPDAFMAEHWMEIAL 180

询问：181 VDYLFKLTVCTLFFLPAYGVILN 203

VDY FK+ + +FFLP YGV+LN

目标：181 VDYCFKVLISIVFFLPMYGVLLN 203

根据该分析结果(包括与大肠杆菌蛋白质同源以及淋球菌蛋白中存在几个推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例32

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 267>：

1 ATGGTCATAA AATATACAAA TTTGAATTTT GCGAAATTGT CGATAATTGC

51 AATTTTGATG ATGTATTCGT TTGAAGCGAA TGCAAAyGCA GTmwrAATAT

101 CTGAAACTGT TTCAGTTGAT ACCGGACAAG GTGCGAAAAT TCATAAGTTT

151 GTACCTAAAA ATAGTAAAAC TTATTCATCT GATTTAATAA AAACGGTAGA

201 TTTAACACAC AyyCCTACGG GCGCAAAAGC CCGAATCAAC GCCAAAATAA

251 CCGCCAGCGT ATCCCGCGCC GGCGTATTGG CGGGGGTCGG CAAACTTGCC

301 CGCTTAGgCG CGAAATTCAG CACAAGGGCG GTtCCCTATG TCGGAACAGC

351 CcTTTTAGCC CACGACGTAT ACGAAAcTTT CAAAGAAGAC ATACAGGCAC

401 GAGGCTACCA ATACGACCCC GAAACCGACA AATTTGTAAA AGGCTACGAA

451 TATAGTAATT GCCTTTGGTA CGAAGACAAA AGACGTATTA ATAGAACCTA

501 TGGCTGCTAC GGCGTTGAT..

它对应于氨基酸序列<SEQ ID 268；ORF72>：

1 MVIKYTNLNF AKLSIIAILM MYSFEANANA VXISETVSVD TGQGAKIHKF

51 VPKNSKTYSS DLIKTVDLTH XPTGAKARIN AKITASVSRA GVLAGVGKLA

101 RLGAKFSTRA VPYVGTALLA HDVYETFKED IQARGYQYDP ETDKFVKGYE

151 YSNCLWYEDK RRINRTYGCY GVD..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 269>：

1 ATGGTCATAA AATATACAAA TTTGAATTTT GCGAAATTGT CGATAATTGC

51 AATTTTGATG ATGTATTCGT TTGAAGCGAA TGCAAATGCA GTAAAAATAT

101 CTGAAACTGT TTCAGTTGAT ACCGGACAAG GTGCGAAAAT TCATAAGTTT

151 GTACCTAAAA ATAGTAAAAC TTATTCATCT GATTTAATAA AAACGGTAGA

201 TTTAACACAC ATCCCTACGG GCGCAAAAGC CCGAATCAAC GCCAAAATAA

251 CCGCCAGCGT ATCCCGCGCC GGCGTATTGG CGGGGGTCGG CAAACTTGCC

301 CGCTTAGGCG CGAAATTCAG CACAAGGGCG GTTCCCTATG TCGGAACAGC

351 CCTTTTAGCC CACGACGTAT ACGAAACTTT CAAAGAAGAC ATACAGGCAC

401 GAGGCTACCA ATACGACCCC GAAACCGACA AATTTGCAAA GGTCTCAGGC

451 TAA

它对应于氨基酸序列<SEQ ID 270；ORF72-1>：

1 MVIKYTNLNF AKLSIIAILM MYSFEANANA VKISETVSVD TGQGAKIHKF

51 VPKNSKTYSS DLIKTVDLTH IPTGAKARIN AKITASVSRA GVLAGVGKLA

101 RLGAKFSTRA VPYVGTALLA HDVYETFKED IQARGYQYDP ETDKFAKVSG

151 *

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF72与脑膜炎奈瑟球菌菌株A的ORF(ORF72a)在重叠的147个氨基酸内有98.0％的相同性。

10 20 30 40 50 60

orf72.pep MVIKYTNLNFAKLSIIAILMMYSFEANANAVXISETVSVDTGQGAKIHKFVPKNSKTYSS

|||||||||||||||||||||||||||| ||| ||||||||||||||||||||||||||||

orf72a MVIKYTNLNFAKLSIIAILMMYSFEANANAVKISETVSVDTGQGAKIHKFVPKNSKTYSS

10 20 30 40 50 60

70 80 90 100 110 120

orf72.pep DLIKTVDLTHXPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA

|||||||||| |||||||||||||||||||||||||||||||||||||||||||||||||

orf72a DLIKTVDLTHIPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA

70 80 90 100 110 120

130 140 150 160 170

orf72.pep HDVYETFKEDIQARGYQYDPETDKFVKGYEYSNCLWYEDKRRINRTYGCYGVD

|||||||||||||||||||||||||:|

orf72a HDVYETFKEDIQARGYQYDPETDKFAKVSGX

130 140 150

全长ORF72a核苷酸序列<SEQ ID 271>是：

1 ATGGTCATAA AATATACAAA TTTGAATTTT GCGAAATTGT CGATAATTGC

51 AATTTTGATG ATGTATTCGT TTGAAGCGAA TGCAAATGCA GTAAAAATAT

101 CTGAAACTGT TTCAGTTGAT ACCGGACAAG GTGCGAAAAT TCATAAGTTT

151 GTACCTAAAA ATAGTAAAAC TTATTCATCT GATTTAATAA AAACGGTAGA

201 TTTAACACAC ATCCCTACGG GCGCAAAAGC CCGAATCAAC GCCAAAATAA

251 CCGCCAGCGT ATCCCGCGCC GGCGTATTGG CGGGGGTCGG CAAACTTGCC

301 CGCTTAGGCG CGAAATTCAG CACAAGGGCG GTTCCCTATG TCGGAACAGC

351 CCTTTTAGCC CACGACGTAT ACGAAACTTT CAAAGAAGAC ATACAGGCAC

401 GAGGCTACCA ATACGACCCC GAAACCGACA AATTTGCAAA GGTCTCAGGC

451 TAA

它编码的蛋白质具有氨基酸序列<SEQ ID 272>：

1 MVIKYTNLNF AKLSIIAILM MYSFEANANA VKISETVSVD TGQGAKIHKF

51 VPKNSKTYSS DLIKTVDLTH IPTGAKARIN AKITASVSRA GVLAGVGKLA

101 RLGAKFSTRA VPYVGTALLA HDVYETFKED IQARGYQYDP ETDKFAKVSG

151 *

ORF72a和ORF72-1在150个氨基酸的重叠区内有100.0％的相同性：

10 20 30 40 50 60

orf72a.pep MVIKYTNLNFAKLSIIAILMMYSFEANANAVKISETVSVDTGQGAKIHKFVPKNSKTYSS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf72-1 MVIKYTNLNFAKLSIIAILMMYSFEANANAVKISETVSVDTGQGAKIHKFVPKNSKTYSS

10 20 30 40 50 60

70 80 90 100 110 120

orf72a.pep DLIKTVDLTHIPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf72-1 DLIKTVDLTHIPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA

70 80 90 100 110 120

130 140 150

orf72a.pep HDVYETFKEDIQARGYQYDPETDKFAKVSGX

|||||||||||||||||||||||||||||||

orf72-1 HDVYETFKEDIQARGYQYDPETDKFAKVSGX

130 140 150

与淋病奈瑟球菌的预计ORF的同源性

ORF72与淋病奈瑟球菌的预计ORF(ORF72.ng)在重叠的173个氨基酸内有89％的相同性：

orf72.pep MVIKYTNLNFAKLSIIAILMMYSFEANANAVXISETVSVDTGQGAKIHKFVPKNSKTYSS 60

|| |:|||||||||||||||||||||||||| ||||:|||||||||:||||||:|: |||

orf72ng MVTKHTNLNFAKLSIIAILMMYSFEANANAVKISETLSVDTGQGAKVHKFVPKSSNIYSS 60

orf72.pep DLIKTVDLTHXPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA 120

|| |:||||| ||||||||||||||||||||||:|||||:| ||||:|||||||||||||

orf72ng DLTKAVDLTHIPTGAKARINAKITASVSRAGVLSGVGKLVRQGAKFGTRAVPYVGTALLA 120

orf72.pep HDVYETFKEDIQARGYQYDPETDKFVKGYEYSNCLWYEDKRRINRTYGCYGVD 173

||||||||||||||||| :||||||||||||:|||||||:|||||||||||||

orf72ng HDVYETFKEDIQARGCRYDPETDKFVKGYEYANCLWYEDERRINRTYGCYGVDSSIMRLM 180

预计ORF72ng核苷酸序列<SEQ ID 273>编码的蛋白质具有氨基酸序列<SEQ ID274>：

1 MVTKHTNLNF AKLSIIAILM MYSFEANANA VKISETLSVD TGQGAKVHKF

51 VPKSSNIYSS DLTKAVDLTH IPTGAKARIN AKITASVSRA GVLSGVGKLV

101 RQGAKFGTRA VPYVGTALLA HDVYETFKED IQARGCRYDP ETDKFVKGYE

151 YANCLWYEDE RRINRTYGCY GVDSSIMRLM PDRSRFPEVK QLMESQMYRL

201 ARPFWNWRKE ELNKLSSLDW NNFVLNRCTF DWNGGGCAVN KGDDFRAGAS

251 FSLGRNPKYK EEMDAKKPEE ILSLKVDADP DKYIEATGYP GYSEKVEVAP

301 GTKVNMGPVT DRNGNPVQVA ATFGRDAQGN TTADVQVIPR PDLTPASAEA

351 PHAQPLPEVS PAENPANNPD PDENPGTRPN PEPDPDLNPD ANPDTDGQPG

401 TSPDSPAVPD RPNGRHRKER KEGEDGGLSC DYFPEILACQ EMGKPSDRMF

451 HDISIPQVTD DKTWSSHNFL PSNGVCPQPK TFHVFGRQYR ASYEPLCVFA

501 EKIR FAVLLA FI IMSAFVVF GSLGGE*

在进一步分析后，鉴定出下列淋球菌DNA序列<SEQ ID 275>：

1 ATGGTCACAA AACATACAAA TTTGAATTTT GCGAAATTGT CGATAATTGC

51 AATTTTGATG ATGTATTCGT TTGAAGCGAA TGCAAATGCA GTAAAAATAT

101 CTGAAACTCT TTCGGTTGAT ACCGGACAAG GCGCGAAAGT TCATAAGTTC

151 GTTCCTAAAT CAAGTAATAT TTATTCATCT GATTTAACAA AAGCGGTAGA

201 TTTAACGCAT ATCCCCACGG GCGCAAAAGC CCGAATCAAC GCCAAAATAA

251 CCGCCAGCGT ATCCCGCGCC GGCGTATTGT CGGGGGTCGG CAAACTTGTC

301 CGCCAAGGCG CGAAATTCGG CACAAGGGCG GTTCCCTATG TCGGAACAGC

351 CCTTTTAGCC CACGACGTAT ACGAAACTTT CAAAGAAGAC ATACAGGCAC

401 GAGGCTGCCG ATACGATCCC GAAACCGACA AATTT

它对应于氨基酸序列<SEQ ID 276；ORF72ng-1>：

1 MVTKHTNLNF AKLSIIAILM MYSFEANANA VKISETLSVD TGQGAKVHKF

51 VPKSSNIYSS DLTKAVDLTH IPTGAKARIN AKITASVSRA GVLSGVGKLV

101 RQGAKFGTRA VPYVGTALLA HDVYETFKED IQARGCRYDP ETDKF

ORF72ng-1和ORF721-1在145个氨基酸的重叠区内有89.7％的相同性：

10 20 30 40 50 60

orf72ng-1.pe MVTKHTNLNFAKLSIIAILMMYSFEANANAVKISETLSVDTGQGAKVHKFVPKSSNIYSS

|| |:|||||||||||||||||||||||||||||||:|||||||||:||||||:|: |||

orf72-1 MVIKYTNLNFAKLSIIAILMMYSFEANANAVKISETVSVDTGQGAKIHKFVPKNSKTYSS

10 20 30 40 50 60

70 80 90 100 110 120

orf72ng-1.pe DLTKAVDLTHIPTGAKARINAKITASVSRAGVLSGVGKLVRQGAKFGTRAVPYVGTALLA

|| |:||||||||||||||||||||||||||||:|||||:| ||||:|||||||||||||

orf72-1 DLIKTVDLTHIPTGAKARINAKITASVSRAGVLAGVGKLARLGAKFSTRAVPYVGTALLA

70 80 90 100 110 120

130 140

orf72ng-1.pe HDVYETFKEDIQARGCRYDPETDKF

||||||||||||||| :||||||||

orf72-1 HDVYETFKEDIQARGYQYDPETDKFAKVSGX

130 140 150

根据该分析结果(包括该淋球菌蛋白中存在一个推定的前导序列以及数个跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例33

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 277>：

1 ATGAGATTTT TCGGTATCGG TTTTTTGGTG CTGCTGTTTT TGGAGATTAT

51 GTCGATTGTG TGGGTTGCCG ATTGGCTGGG CGGCGGCTGG ACGTTGTTTT

101 TGATGGCGGC AGGTTTTGCC GCCGGCGTGC TGATGCTCAG GCAAACCGGG

151 CTGACCGGT CTTTTATTGG CGGGCGCGGC AATGAGAAGC GGCGGGAAGG

201 TATCCGTTTA TCAGATGTTG TGGCCTATC..

它对应于氨基酸序列<SEQ ID 278；ORF73>：

1 MRFFGIGFLV LLFLEIMSIV WVADWLGGGW TLFLMAAGFA AGVLMLRQTG

51 LTGLLLAGAA MRSGGKVSVY QMLWPI..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 279>：

1 ATGAGATTTT TCGGTATCGG TTTTTTGGTG CTGCTGTTTT TGGAGATTAT

51 GTCGATTGTG TGGGTTGCCG ATTGGCTGGG CGGCGGCTGG ACGTTGTTTT

101 TGATGGCGGC AGGTTTTGCC GCCGGCGTGC TGATGCTCAG GCATACGGGG

151 CTGTCCGGTC TTTTATTGGC GGGCGCGGCA ATGAGAAGCG GCGGGAGGGT

201 ATCCGTTTAT CAGATGTTGT GGCCTATCCG TTATACGGTG GCGGCTGTGT

251 GTCTGATGAG TCCGGGATTC GTATCCTCGG TGTTGGCGGT ATTGCTGCTG

301 CTGCCGTTTA AGGGAGGGGC AGTGTTGCAG GCAGGAGGTG CGGAAAATTT

351 TTTCAACATG AACCAATCGG GCAGAAAAGA GGGCTTTTCC CGCGATGACG

401 ATATTATCGA GGGAGAATAT ACGGTTGAAG AGCCTTACGG CGGCAATCGT

451 TCCCGAAACG CCATCGAACA CAAAAAAGAC GAATAA

它对应于氨基酸序列<SEQ ID 280；ORF73-1>：

1 MRFFGIGFLV LLFLEIMSIV WVADWLGGGW TLFLMAAGFA AGVLMLRHTG

51 LSGLLLAGAA MRSGGRVSVY QMLWPIRYTV AAVC LMSPGF VSSVLAVLLL

101 LPFKGGAVLQ AGGAENFFNM NQSGRKEGFS RDDDIIEGEY TVEEPYGGNR

151 SRNAIEHKKD E*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF73与脑膜炎奈瑟球菌菌株A的ORF(ORF73a)在重叠的76个氨基酸内有90.8％的相同性：

10 20 30 40 50 60

orf73.pep MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAAGFAAGVLMLRQTGLTGLLLAGAA

|||||||||||||||||||||||||||||||||||||||| |||:|||:|||:||||||||

orf73a MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAATFAAGVVMLRHTGLSGLLLAGAA

10 20 30 40 50 60

70

orf73.pep MRSGGKVSVYQMLWPI

|||||:|||| ||| |

orf73a MRSGGRVSVYXMLWXIRYTVAAVC XMSPGFVSSVXAVLLXLPFKGGAVLQAGGAENFFNM

全长ORF73a核苷酸序列<SEQ ID 281>是：

1 ATGAGATTTT TCGGTATCGG TTTTTTGGTG CTGCTGTTTT TGGAGATTAT

51 GTCGATTGTG TGGGTTGCCG ATTGGTTGGG CGGCGGTTGG ACGCTGTTTC

101 TAATGGCGGC AACCTTTGCC GCCGGCGTGG TGATGCTCAG GCATACGGGG

151 CTGTCCGGTC TTTTATTGGC GGGCGCGGCA ATGAGAAGCG GCGGGAGGGT

201 ATCCGTTTAT CANATGTTGT GGCNTATCCG TTATACGGTG GCGGCGGTGT

251 GTCNGATGAG TCCGGGATTC GTATCCTCGG TGTNGGCGGT ATTGCTGNTG

301 CTNCCGTTTA AGGGAGGTGC AGTGTTGCAG GCAGGAGGTG CGGAAAATTT

351 TTTCAACATG AACCANTCGG GCAGAAAAGA NGGCNTTTCC CGCGATGACG

401 ATATTATCGA GGGGGAATAT ACGGTTGAAG ANCCTTACGG CGGCANTCGT

451 TTCCGAAACG CCNTNGAACA CAAAAAAGAC GAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 282>：

1 MRFFGIGFLV LLFLEIMSIV WVADWLGGGW TLFLMAATFA AGVVMLRHTG

51 LSGLLLAGAA MRSGGRVSVY XMLWXIRYTV AAVC XMSPGF VSSVXAVLLX

101 LPFKGGAVLQ AGGAENFFNM NXSGRKXGXS RDDDI IEGEY TVEXPYGGXR

151 FRNAXEHKKD E*

ORF73a和ORF73-1在161个氨基酸的重叠区内有91.3％的相同性

10 20 30 40 50 60

orf73a.pep MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAATFAAGVVMLRHTGLSGLLLAGAA

||||||||||||||||||||||||||||||||||||| |||||:||||||||||||||||

orf73-1 MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAAGFAAGVLMLRHTGLSGLLLAGAA

10 20 30 40 50 60

70 80 90 100 110 120

orf73a.pep MRSGGRVSVYXMLWXIRYTVAAVCXMSPGFVSSVXAVLLXLPFKGGAVLQAGGAENFFNM

|||||||||| ||| ||||||||| ||||||||| |||| ||||||||||||||||||||

orf73-1 MRSGGRVSVYQMLWPIRYTVAAVCLMSPGFVSSVLAVLLLLPFKGGAVLQAGGAENFFNM

70 80 90 100 110 120

130 140 150 160

orf73a.pep NXSGRKXGXSRDDDIIEGEYTVEXPYGGXRFRNAXEHKKDEX

| |||| | |||||||||||||| |||| | ||| |||||||

orf73-1 NQSGRKEGFSRDDDIIEGEYTVEEPYGGNRSRNAIEHKKDEX

130 140 150 160

与淋病奈瑟球菌的预计ORF的同源性

ORF73与淋病奈瑟球菌的预计ORF(ORF73.ng)在重叠的76个氨基酸内有92.1％的相同性：

orf73.pep MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAAGFAAGVLMLRQTGLTGLLLAGAA 60

||||||||||||||||||||||||||||||||||||| |||||||||:|||:||||||||

orf73ng MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAATFAAGVLMLRHTGLSGLLLAGAA 60

orf73.pep MRSGGKVSVYQMLWPI 76

::|:||||||||||||

orf73ng VKSSGKVSVYQMLWPIRYTVAAVCLMSPGFVSSVLAVLLLLPFKGGAVLQAGGAENFFNM 120

全长ORF73ng核苷酸序列<SEQ ID 283>是：

1 ATGAGATTTT TCGGTATCGG TTTTTTGGTG CTGCTGTTTT TGGAAATTAT

51 GTCGATTGTG TGGGTTGCCG ATTGGCTGGG CGGCGGTTGG AcgcTGTTTC

101 TAATGGCGGC AACCTTTGCC GCCGGTGTGC TGATGCTCAG GCATAcggGG

151 CTGTCCGGTC TTTTATTGGC TGGCGCGGCG GTAAAAagta gtgGGAAGGT

201 ATCTGTTTAT CagatgtTGT GGCCTATCCG TTATAcggtg gcggcggtgT

251 GTCTGatgag tCcggGATTC GTATCCTccg tgttggCGGT ATTGCTGCTG

301 CTGCcgttta aggGaggGgc agtgttgcag gcaggaggtg cggaaaATTT

351 TTTCAACATg aaCcaatcgg gcagaaAaga gggatttttc cacgatgacg

401 atattatcga gggagaatat acggttgaaa aacctgacgg cggcaatcgt

451 tcccgaAAcg ccatcgaaca cgaaaAagac gaataA

它编码的蛋白质具有氨基酸序列<SEQ ID 284>：

1 MRFFGIGFLV LLFLEIMSIV WVADWLGGGW TLFLMAATFA AGVLMLRHTG

51 LSGLLLAGAA VKSSGKVSVY QMLWPIRYTV AAVC LMSPGF VSSVLAVLLL

101 LPFKGGAVLQ AGGAENFFNM NQSGRKEGFF HDDDIIEGEY TVEKPDGGNR

151 SRNAIEHEKD E*

ORF73ng和ORG73-1在161个氨基酸的重叠区内有93.8％的相同性

10 20 30 40 50 60

orf73-1.pep MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAAGFAAGVLMLRHTGLSGLLLAGAA

||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||||

orf73ng MRFFGIGFLVLLFLEIMSIVWVADWLGGGWTLFLMAATFAAGVLMLRHTGLSGLLLAGAA

10 20 30 40 50 60

70 80 90 100 110 120

orf73-1.pep MRSGGRVSVYQMLWPIRYTVAAVCLMSPGFVSSVLAVLLLLPFKGGAVLQAGGAENFFNM

::|:|:||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf73ng VKSSGKVSVYQMLWPIRYTVAAVCLMSPGFVSSVLAVLLLLPFKGGAVLQAGGAENFFNM

70 80 90 100 110 120

130 140 150 160

orf73-1.pep NQSGRKEGFSRDDDIIEGEYTVEEPYGGNRSRNAIEHKKDEX

||||||||| :||||||||||||:| |||||||||||:||||

orf73ng NQSGRKEGFFHDDDIIEGEYTVEKPDGGNRSRNAIEHEKDEX

130 140 150 160

根据该分析结果(包括该淋球菌蛋白中存在一个推定的前导序列以及推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例34

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 285>：

1 ATGTTTGTTT TTCAGACGGC ATTCTT.ATG TTTCAGAAAC ATTTGCAGAA

51 AGCCTCCGAC AGCGTCGTCG GAGGGACATT ATACGTGGTT GCCACGCCCA

101 TCGGCAATTT GGCGGACATT ACCCTGCGCG CTTTGGCGGT ATTGCAAAAG

151 GCG....... .....GCCGA AGACACGCGC GTTACCGCAC AGCTTTTGAG

201 CGCGTACGGC ATTCAGGGCA AACTCGTCAG TGTGCGCGAA CACAACGAAC

251 GGCAGATGGC GGACAAGATT GTCGGCTATC TTTCAGACGG CATGGTTGTG

301 GCACAGGTTT CCGATGCGGG TACGCCGGCC GTGTGCGACC CGGGCGCGAA

351 ACTCGCCCGC CGCGTGCGTG AGGCCGGGTT TAAAGTCGTT CCCGTCGTGG

401 GCGCAAC.GC GGTGATGGCG GCTTTGAGCG TGGCCGGTGT GGAAGGATCC

451 GATTTTTATT TCAACGGTTT TGTACCGCCG AAATCGGGAG AACGCAGGAA

501 ACTGTTTGCC AAATGGGTGC GGGCGGCGTT TCCTATCGTC ATGTTTGAAA

551 CGCCGCACCG CATCGGTGCA GCGCTTGCCG ATATGGCGGA ACTGTTCCCC

601 GAACGCCGAT TAATGCTGGC GCGCGAAATT ACGAAAACGT TTGAAACGTT

651 CTTAAGCGGC ACGGTTGGGG AAATTCAGAC GGCATTGTCT GCCGACGGCG

701 ACCAATCGCG CGGCGAGATG GTGTTGGTGC TTTATCCGGC GCAGGATGAA

751 AAACACGAAG GCTTGTCCGA GTCCGCGCAA AACATCATGA AAATCCTCAC

801 AGCCGAGCTG CCGACCAAAC AGGCGGCGGA GCTTGCTGCC AAAATCACGG

851 GCGAGGGAAA GAAAGCTTTG TACGAT..

它对应于氨基酸序列<SEQ ID 286；ORF75>：

1 MFVFQTAFXM FQKHLQKASD SVVGGTLYVV ATPIGNLADI TLRALAVLQK

51 A....AEDTR VTAQLLSAYG IQGKLVSVRE HNERQMADKI VGYLSDGMVV

101 AQVSDAGTPA VCDPGAKLAR RVREAGFKVV PVVGAXAVMA ALSVAGVEGS

151 DFYFNGFVPP KSGERRKLFA KWVRAAFPIV MFETPHRIGA ALADMAELFP

201 ERRLMLAREI TKTFETFLSG TVGEIQTALS ADGDQSRGEM VLVLYPAQDE

251 KHEGLSESAQ NIMKILTAEL PTKQAAELAA KITGEGKKAL YD..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 287>：

1 ATGTTTCAGA AACATTTGCA GAAAGCCTCC GACAGCGTCG TCGGAGGGAC

51 ATTATACGTG GTTGCCACGC CCATCGGCAA TTTGGCGGAC ATTACCCTGC

101 GCGCTTTGGC GGTATTGCAA AAGGCGGACA TCATCTGTGC CGAAGACACG

151 CGCGTTACCG CACAGCTTTT GAGCGCGTAC GGCATTCAGG GCAAACTCGT

201 CAGTGTGCGC GAACACAACG AACGGCAGAT GGCGGACAAG ATTGTCGGCT

251 ATCTTTCAGA CGGCATGGTT GTGGCACAGG TTTCCGATGC GGGTACGCCG

301 GCCGTGTGCG ACCCGGGCGC GAAACTCGCC CGCCGCGTGC GTGAGGCCGG

351 GTTTAAAGTC GTTCCCGTCG TGGGCGCAAG CGCGGTGATG GCGGCTTTGA

401 GCGTGGCCGG TGTGGAAGGA TCCGATTTTT ATTTCAACGG TTTTGTACCG

451 CCGAAATCGG GAGAACGCAG GAAACTGTTT GCCAAATGGG TGCGGGCGGC

501 GTTTCCTATC GTCATGTTTG AAACGCCGCA CCGCATCGGT GCGACGCTTG

551 CCGATATGGC GGAACTGTTC CCCGAACGCC GATTAATGCT GGCGCGCGAA

601 ATTACGAAAA CGTTTGAAAC GTTCTTAAGC GGCACGGTTG GGGAAATTCA

651 GACGGCATTG TCTGCCGACG GCAACCAATC GCGCGGCGAG ATGGTGTTGG

701 TGCTTTATCC GGCGCAGGAT GAAAAACACG AAGGCTTGTC CGAGTCCGCG

751 CAAAACATCA TGAAAATCCT CACAGCCGAG CTGCCGACCA AACAGGCGGC

801 GGAGCTTGCT GCCAAAATCA CGGGCGAGGG AAAGAAAGCT TTGTACGATC

851 TGGCTCTGTC TTGGAAAAAC AAATAG

它对应于氨基酸序列<SEQ ID 288；ORF75-1>：

1 MFQKHLQKAS DSVVGGTLYV VATPIGNLAD ITLRALAVLQ KADI ICAEDT

51 RVTAQLLSAY GIQGKLVSVR EHNERQMADK IVGYLSDGMV VAQVSDAGTP

101 AVCDPGAKLA RRVREAGFK V VPVVGASAVM AALSVAGVEG SDFYFNGFVP

151 PKSGERRKLF AKWVRAAFPI VMFETPHRIG ATLADMAELF PERRLMLARE

201 ITKTFETFLS GTVGEIQTAL SADGNQSRGE MVLVLYPAQD EKHEGLSESA

251 QNIMKILTAE LPTKQAAELA AKITGEGKKA LYDLALSWKN K*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF75与脑膜炎奈瑟球菌菌株A的ORF(ORF75a)在重叠的283个氨基酸内有95.8％的相同性：

10 20 30 40 50 60

orf75.pep MFVFQTAFXMFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKAXXXXAEDTR

|||||||||||||||||||||||||||||||||||||||||| |||||

orf75a MFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTR

10 20 30 40 50

70 80 90 100 110 120

orf75.pep VTAQLLSAYGIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLAR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf75a VTAQLLSAYGIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLAR

60 70 80 90 100 110

130 140 150 160 170 180

orf75.pep RVREAGFK VVPVVGAXAVMAALSVAGVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIV

||||:||| ||||||| ||||||||| || ||||||||||||||||||||||||||:|||:|

orf75a RVREVGFK VVPVVGASAVMAALSVAGVAGSDFYFNGFVPPKSGERRKLFAKWVRVAFPVV

120 130 140 150 160 170

190 200 210 220 230 240

orf75.pep MFETPHRIGAALADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALSADGDQSRGEM

|||||||||||:||||||||||||||||||||||||||||||||||||||:|||:|||||

orf75a MFETPHRIGATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEM

180 190 200 210 220 230

250 260 270 280 290

orf75.pep VLVLYPAQDEKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALYD

||||||||||||||||||||||||||||||||||||||||||||||||||||

orf75a VLVLYPAQDEKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALYDLALSWKNK

240 250 260 270 280 290

orf75a X

全长ORF75a核苷酸序列<SEQ ID 289>是：

1 ATGTTTCAGA AACATTTGCA GAAAGCCTCC GACAGCGTCG TCGGAGGGAC

51 ATTATACGTG GTTGCCACGC CCATCGGCAA TTTGGCGGAC ATTACCCTGC

101 GCGCTTTGGC GGTATTGCAA AAGGCGGACA TCATCTGTGC CGAAGACACG

151 CGCGTTACCG CGCAGCTTTT GAGCGCGTAC GGCATTCAGG GCAAACTCGT

201 CAGCGTGCGC GAACACAACG AACGGCAGAT GGCGGACAAG ATTGTCGGCT

251 ATCTTTCAGA CGGCATGGTT GTGGCACAGG TTTCCGATGC GGGTACGCCG

301 GCCGTGTGCG ACCCGGGCGC GAAACTCGCC CGCCGCGTGC GTGAGGTCGG

351 GTTTAAAGTT GTCCCTGTTG TCGGCGCAAG CGCGGTGATG GCGGCTTTGA

401 GTGTGGCTGG TGTGGCGGGA TCCGATTTTT ATTTCAACGG TTTTGTACCG

451 CCGAAATCGG GCGAACGTAG GAAATTGTTT GCCAAATGGG TGCGGGTGGC

501 GTTTCCCGTC GTGATGTTTG AAACGCCGCA CCGCATCGGG GCGACGCTTG

551 CCGATATGGC GGAACTGTTC CCCGAACGCC GATTAATGCT GGCGCGCGAA

601 ATCACGAAAA CGTTTGAAAC GTTCTTAAGC GGCACGGTTG GGGAAATTCA

651 GACGGCATTG GCGGCGGACG GCAACCAATC GCGCGGCGAG ATGGTGTTGG

701 TGCTTTATCC GGCGCAGGAT GAAAAACACG AAGGCTTGTC CGAGTCCGCG

751 CAAAACATCA TGAAAATCCT CACAGCCGAG CTGCCGACCA AACAGGCGGC

801 GGAGCTTGCC GCCAAAATCA CGGGCGAGGG AAAAAAAGCT TTGTACGATC

851 TGGCACTGTC TTGGAAAAAC AAATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 290>：

1 MFQKHLQKAS DSVVGGTLYV VATPIGNLAD ITLRALAVLQ KADI ICAEDT

51 RVTAQLLSAY GIQGKLVSVR EHNERQMADK IVGYLSDGMV VAQVSDAGTP

101 AVCDPGAKLA RRVREVGFK V VPVVGASAVM AALSVAGVAG SDFYFNGFVP

151 PKSGERRKLF AKWVRVAFPV VMFETPHRIG ATLADMAELF PERRLMLARE

201 ITKTFETFLS GTVGEIQTAL AADGNQSRGE MVLVLYPAQD EKHEGLSESA

251 QNIMKILTAE LPTKQAAELA AKITGEGKKA LYDLALSWKN K*

ORF75a和ORF75-1在291个氨基酸的重叠区内有98.3％的相同性：

10 20 30 40 50 60

orf75a.pep MFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf75-1 MFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAY

10 20 30 40 50 60

70 80 90 100 110 120

orf75a.pep GIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREVGFKV

|||||||||||||||||||||||||||||||||||||||||||||||||||||||:||||

orf75-1 GIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREAGFKV

70 80 90 100 110 120

130 140 150 160 170 180

orf75a.pep VPVVGASAVMAALSVAGVAGSDFYFNGFVPPKSGERRKLFAKWVRVAFPVVMFETPHRIG

|||||||||||||||||| ||||||||||||||||||||||||||:|||:||||||||||

orf75-1 VPVVGASAVMAALSVAGVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIVMFETPHRIG

130 140 150 160 170 180

190 200 210 220 230 240

orf75a.pep m ATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQD

||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||

orf75-1 ATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALSADGNQSRGEMVLVLYPAQD

190 200 210 220 230 240

250 260 270 280 290

orf75a.pep EKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALYDLALSWKNKX

||||||||||||||||||||||||||||||||||||||||||||||||||||

orf75-1 EKHEGLSESAQNKMKILTAELPTKQAAELAAKITGEGKKALYDLALSWKNKX

250 260 270 280 290

与淋病奈瑟球菌的预计ORF的同源性

ORF75与淋病奈瑟球菌的预计ORF(ORF75.ng)在重叠的292个氨基酸内有93.2％的相同性：

orf75.pep MFVFQTAFXMFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKA----AEDTR 56

| |||||| |||||||||||||||||||||||||||||||||||||||||| |||||

orf75ng MSVFQTAFFMFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTR 60

orf75.pep VTAQLLSAYGIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLAR 116

|||||||||||||:|||||||||||||||::|:||||:||||||||||||||||||||||

orf75ng VTAQLLSAYGIQGRLVSVREHNERQMADKVIGFLSDGLVVAQVSDAGTPAVCDPGAKLAR 120

orf75.pep RVREAGFKVVPVVGAXAVMAALSVAGVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIV 176

||||||||||||||| ||||||||||| |||||||||||||||||||||||||||||:|

orf75ng RVREAGFKVVPVVGASAVMAALSVAGVAESDFYFNGFVPPKSGERRKLFAKWVRAAFPVV 180

orf75.pep MFETPHRIGAALADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALSADGDQSRGEM 236

||||||||||:||||||||||||||||||||||||||||||||||||||:|||:||||||

orf75ng MFETPHRIGATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEM 240

orf75.pep VLVLYPAQDEKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALYD 288

||||||||||||||||||||| ||||:|||||||||||||||||||||||||

orf75ng VLVLYPAQDEKHEGLSESAQNAMKILAAELPTKQAAELAAKITGEGKKALYDLALSWKNK 300

预计ORF75ng核苷酸序列<SEQ ID 291>编码的蛋白质具有氨基酸序列<SEQ ID292>：

1 MSVFQTAFFM FQKHLQKASD SVVGGTLYVV ATPIGNLADI TLRALAVLQK

51 ADIICAEDTR VTAQLLSAYG IQGRLVSVRE HNERQMADKV IGFLSDGLVV

101 AQVSDAGTPA VCDPGAKLAR RVREAGFK VV PVVGASAVMA ALSVAGVAES

151 DFYFNGFVPP KSGERRKLFA KWVRAAFPVV MFETPHRIGA TLADMAELFP

201 ERRLMLAREI TKTFETFLSG TVGEIQTALA ADGNQSRGEM VLVLYPAQDE

251 KHEGLSESAQ NAMKILAAEL PTKQAAELAA KITGEGKKAL YDLALSWKNK

301 *

在进一步分析后，鉴定出下列淋球菌DNA序列<SEQ ID 293>：

1 ATGTTTCAGA AACACTTGCA GAAAGCCTCC GACAGCGTCG TCGGAGGGAC

51 ATTATACGTG GTTGCCACGC CCATCGGCAA TTTGGCAGAC ATTACCCTGC

101 GCGCTTTGGC GGTATTGCAA AAGGCGGACA TCATTTGTGC CGAAGACACG

151 CGCGTTACTG CGCAGCTTTT GAGCGCGTAC GGCATTCAGG GCAGGTTGGT

201 CAGTGTGCGC GAACACAACG AGCGGCAGAT GGCGGACAAG GTAATCGGTT

251 TCCTTTCAGA CGGCCTGGTT GTGGCGCAGG TTTCCGATGC GGGTACGCCG

301 GCCGTGTGCG ACCCGGGCGC GAAACTCGCC CGCCGCGTGC GCGAAGCAGG

351 GTTCAAAGTC GTTCCCGTCG TGGGCGCAAG CGCGGTAATG GCGGCGTTGA

401 GTGTGGCCGG TGTGGCGGAA TCCGATTTTT ATTTCAACGG TTTTGTACCG

451 CCGAAATCGG GCGAACGTAG GAAATTGTTT GCCAAATGGG TGCGGGCGGC

501 ATTTCCTGTC GTCATGTTTG AAACGCCGCA CCGAATCGGG GCAACGCTTG

551 CCGATATGGC GGAATTGTTC CCCGAACGCC GTCTGATGCT GGCGCGCGAA

601 ATCACGAAAA CGTTTGAAAC GTTCTTAAGC GGCACGGTTG GGGAAATTCA

651 GACGGCATTG GCGGCGGACG GCAACCAATC GCGCGGCGAG ATGGTGTTGG

701 TGCTTTATCC GGCGCAGGAT GAAAAACACG AAGGCTTGTC CGAGTCTGCG

751 CAAAATGCGA TGAAAATCCT TGCGGCCGAG CTGCCGACCA AGCAGGCGGC

801 GGAGCTTGCC GCCAAGATTA CAGGTGAGGG CAAAAAGGCT TTGTACGATT

851 TGGCACTGTC GTGGAAAAAC AAATGA

它对应于氨基酸序列<SEQ ID 294；ORF75ng-1>：

1 MFQKHLQKAS DSVVGGTLYV VATPIGNLAD ITLRALAVLQ KADIICAEDT

51 RVTAQLLSAY GIQGRLVSVR EHNERQMADK VIGFLSDGLV VAQVSDAGTP

101 AVCDPGAKLA RRVREAGFK V VPVVGASAVM AALSVAGVAE SDFYFNGFVP

151 PKSGERRKLF AKWVRAAFPV VMFETPHRIG ATLADMAELF PERRLMLARE

201 ITKTFETFLS GTVGEIQTAL AADGNQSRGE MVLVLYPAQD EKHEGLSESA

251 QNAMKILAAE LPTKQAAELA AKITGEGKKA LYDLALSWKN K*

ORF75ng-1和ORF75-1在291个氨基酸的重叠区内有96.2％的相同性：

10 20 30 40 50 60

orf75-1.pep MFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf75ng-1 MFQKHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAY

10 20 30 40 50 60

70 80 90 100 110 120

orf75-1.pep GIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREAGFKV

||||:|||||||||||||||::|:||||:|||||||||||||||||||||||||||||||

orf75ng-1 GIQGRLVSVREHNERQMADKVIGFLSDGLVVAQVSDAGTPAVCDPGAKLARRVREAGFKV

70 80 90 100 110 120

130 140 150 160 170 180

orf75-1.pep VPVVGASAVMAALSVAGVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIVMFETPHRIG

|||||||||||||||||| |||||||||||||||||||||||||||||:||||||||||

orf75ng-1 VPVVGASAVMAALSVAGVAESDFYFNGFVPPKSGERRKLFAKWVRAAFPVVMFETPHRIG

130 140 150 160 170 180

190 200 210 220 230 240

orf75-1.pep ATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALSADGNQSRGEMVLVLYPAQD

||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||

orf75ng-1 ATLADMAELFPERRLMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQD

190 200 210 220 230 240

250 260 270 280 290

orf75-1.pep EKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALYDLALSWKNKX

|||||||||||| ||||:||||||||||||||||||||||||||||||||||

orf75ng-1 EKHEGLSESAQNAMKILAAELPTKQAAELAAKITGEGKKALYDLALSWKNKX

250 260 270 280 290

另外，ORG75ng-1显示出与一种假设的大肠杆菌蛋白明显同源：

sp|P45528|YRAL_ECOLI AGAI-MTR基因间区域中的假设的31.3KD蛋白(F286)

>ig|606086(U18997)ORF_f286[大肠杆菌]

>ig|1789535(AE000395)agai-mtr基因间区域中的假设的31.3kD蛋白[大肠杆菌]长度＝286

评分＝218位(550)，估计值＝3e-56

相同性＝128/284(45％)，阳性＝171/284(60％)，空隙＝4/284(1％)

询问：4 KHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAYGIQ 63

K Q A+S G LY+V TPIGNLADIT RAL VLQ D+I AEDTR T LL +GI

目标：2 KQHQSADNSQ--GQLYIVPTPIGNLADITQRALEVLQAVDLIAAEDTRHTGLLLQHFGIN 59

询问：64 GRLVSVREHNERQMADKVIGFLSDGLVVAQVSDAGTPAVCDPGAKLARRVREAGFKVVPV 123

RL ++ +HNE+Q A+ ++ L +G +A VSDAGTP + DPG L R REAG +VVP+

目标：60 ARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPGYHLVRTCREAGIRVVPL 119

询问：124 VGASAVMAALSVAGVAESDFYFNGFVPPKSGERRKLFAKWVRAAFPVVMFETPHRIGATL 183

G A + ALS AG+ F + GF+P KS RR ++ +E+ HR+ +L

目标：120 PGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAEPRTLIFYESTHRLLDSL 179

询问：184 ADMAELFPERR-LMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQDEK 242

D+ + E R ++LARE+TKT+ET VGE+ + D N+ +GEMVL++ +

目标：180 EDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDENRRKGEMVLIV-EGHKAQ 238

询问：243 HEGLSESAQNAMKILAAELPTKQAAELAAKITGEGKKALYDLAL 286

E L A + +L AELP K+AA LAA+I G K ALY AL

目标：239 EEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALYKYAL 282

根据该分析结果(包括该淋球菌蛋白中存在一个推定的跨膜结构域的结果)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的该蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例35

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 295>：

1 ATGAAACAGA AAAAAACCGC TGCCGCAGTT ATTGCTGCAA TGTTGGCAGG

51 TTTTGCGGCA GC.AAAGCAC CCGAAATCGA CCCGGCTTTG ..........

//

651 .......... ...GAGTTGG TCAGAAACCA GTTGGAGCAG GGTTTGAGAC

701 AGGAAAAAGC CCGCTTGAAA ATCGATGCCC TTTTGGAAGA AAACGGTGTC

751 AAACCGTAA

它对应于氨基酸序列<SEQ ID 296；ORF76>：

1 MKQKKTAAAV IAAMLAGFAA XKAPEIDPAL .......... ..........

//

201 .......... .......... ELVRNQLEQG LRQEKARLKI DALLEENGVK

251 P*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 297>：

1 ATGAAACAGA AAAAAACCGC TGCCGCAGTT ATTGCTGCAA TGTTGGCAGG

51 TTTTGCGGCA GCCAAAGCAC CCGAAATCGA CCCGGCTTTG GTGGATACGC

101 TGGTGGCGCA GATCATGCAG CAGGCAGACC GGCATGCGGA GCAGTCCCAA

151 AAACCGGACG GGCAGGCAAT CCGAAACGAT GCCGTCCGCC GGCTACAAAC

201 TTTGGAAGTT TTGAAAAACA GGGCATTGAA GGAAGGTTTG GATAAGGATA

251 AGGATGTCCA AAACCGCTTT AAAATCGCCG AAGCGTCTTT TTATGCCGAG

301 GAGTACGTCC GTTTTCTGGA ACGTTCGGAA ACGGTTTCCG AAGACGAGCT

351 GCACAAGTTT TACGAACAGC AAATCCGCAT GATCAAATTG CAGCAGGTCA

401 GCTTCGCAAC CGAAGAGGAG GCGCGTCAGG CGCAGCAGCT CCTGCTCAAA

451 GGGCTGTCTT TTGAAGGGCT GATGAAGCGT TATCCGAACG ACGAGCAGGC

501 TTTTGACGGT TTCATTATGG CGCAGCAGCT TCCCGAGCCG CTGGCTTCGC

551 AGTTTGCCGC GATGAATCGG GGCGACGTTA CCCGCGATCC GGTCAAATTG

601 GGCGAACGCT ATTATCTGTT CAAACTCAGC GAGGTCGGGA AAAACCCCGA

651 CGCGCAGCCT TTCGAGTTGG TCAGAAACCA GTTGGAGCAG GGTTTGAGAC

701 AGGAAAAAGC CCGCTTGAAA ATCGATGCCC TTTTGGAAGA AAACGGTGTC

751 AAACCGTAA

它对应于氨基酸序列<SEQ ID 298；ORF76-1>：

1 MKQKKTAAAV IAAMLAGFAA AKAPEIDPAL VDTLVAQIMQ QADRHAEQSQ

51 KPDGQAIRND AVRRLQTLEV LKNRALKEGL DKDKDVQNRF KIAEASFYAE

101 EYVRFLERSE TVSEDELHKF YEQQIRMIKL QQVSFATEEE ARQAQQLLLK

151 GLSFEGLMKR YPNDEQAFDG FIMAQQLPEP LASQFAAMNR GDVTRDPVKL

201 GERYYLFKLS EVGKNPDAQP FELVRNQLEQ GLRQEKARLK IDALLEENGV

251 KP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF76与脑膜炎奈瑟球菌菌株A的ORF(ORF76a)在重叠的30个氨基酸中有96.7％的相同性，在31个氨基酸的重叠区内有96.8％的相同性：

10 20 30

orf76.pep MKQKKTAAAVIAAMLAGFAAXKAPEIDPAL

|||||||||||||||||||| || |||||||

orf76a MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQKPDGQAIRND

10 20 30 40 50 60

//

70 80 90

orf76.pep XELVRNQLEQGLRQEKARLKIDALLEENGVKPX

|||||||||||||||||||||||:|||||||||

orf76a DVTRDPVKLGERYYLFKLSEVGKNPDAQPFELVRNQLEQGLRQEKARLKIDAILEENGVKPX

200 210 220 230 240 250

全长ORF76a核苷酸序列<SEQ ID 299>是：

1 ATGAAACAGA AAAAAACCGC TGCCGCAGTT ATTGCTGCAA TGTTGGCAGG

51 TTTTGCGGCA GCCAAAGCAC CCGAAATCGA CCCGGCTTTG GTGGATACGC

101 TGGTGGCGCA GATCATGCAG CAGGCAGACC GGCATGCGGA GCAGTCCCAA

151 AAACCGGACG GGCAGGCAAT CCGAAACGAT GCCGTCCGTC GGCTGCAAAC

201 TTTGGAAGTT TTGAAAAACA GGGCATTGAA GGAAGGTTTG GATAAGGATA

251 AGGATGTCCA AAACCGCTTT AAAATCGCCG AAGCGTCTTT TTATGCCGAG

301 GAGTACGTCC GTTTTCTGGA ACGTTCGGAA ACGGTTTCCG AAAGCGCACT

351 GCGTCAGTTT TATGAGCGGC AAATCCGCAT GATCAAATTG CAGCAGGTCA

401 GCTTCGCAAC CGAAGAGGAG GCGCGTCAGG CGCAGCAGCT CCTGCTCAAA

451 GGGCTGTCTT TTGAAGGGCT GATGAAGCGT TATCCGAACG ACGAGCAGGC

501 TTTTGACGGT TTCATTATGG CGCAGCAGCT TCCCGAGCCG CTGGCTTCGC

551 AGTTTGCAGC GATGAATCGG GGCGACGTTA CCCGCGATCC GGTCAAATTG

601 GGCGAACGCT ATTATCTGTT CAAACTCAGC GAGGTCGGGA AAAACCCCGA

651 CGCGCAGCCT TTCGAGTTGG TCAGAAACCA GTTGGAACAA GGTTTGAGAC

701 AGGAAAAAGC CCGCTTGAAA ATCGATGCCA TTTTGGAAGA AAACGGTGTC

751 AAACCGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 300>：

1 MKQKKTAAAV IAAMLAGFAA AKAPEIDPAL VDTLVAQIMQ QADRHAEQSQ

51 KPDGQAIRND AVRRLQTLEV LKNRALKEGL DKDKDVQNRF KIAEASFYAE

101 EYVRFLERSE TVSESALRQF YERQIRMIKL QQVSFATEEE ARQAQQLLLK

151 GLSFEGLMKR YPNDEQAFDG FIMAQQLPEP LASQFAAMNR GDVTRDPVKL

201 GERYYLFKLS EVGKNPDAQP FELVRNQLEQ GLRQEKARLK IDAILEENGV

251 KP*

ORF76a和ORF76-1在252个氨基酸的重叠区内有97.6％的相同性：

10 20 30 40 50 60

orf76a.pep MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQKPDGQAIRND

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf76-1 MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQKPDGQAIRND

10 20 30 40 50 60

70 80 90 100 110 120

orf76a.pep AVRRLQTLEVLKNRALKEGLDKDKDVQNRFKIAEASFYAEEYVRFLERSETVSESALRQF

||||||||||||||||||||||||||||||||||||||||||||||||||||||: |::|

orf76-1 AVRRLQTLEVLKNRALKEGLDKDKDVQNRFKIAEASFYAEEYVRFLERSETVSEDELHKF

70 80 90 100 110 120

130 140 150 160 170 180

orf76a.pep YERQIRMIKLQQVSFATEEEARQAQQLLLKGLSFEGLMKRYPNDEQAFDGFIMAQQLPEP

||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf76-1 YEQQIRMIKLQQVSFATEEEARQAQQLLLKGLSFEGLMKRYPNDEQAFDGFIMAQQLPEP

130 140 150 160 170 180

190 200 210 220 230 240

orf76a.pep LASQFAAMNRGDVTRDPVKLGERYYLFKLSEVGKNPDAQPFELVRNQLEQGLRQEKARLK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf76-1 LASQFAAMNRGDVTRDPVKLGERYYLFKLSEVGKNPDAQPFELVRNQLEQGLRQEKARLK

190 200 210 220 230 240

250

orf76a.pep IDAILEENGVKPX

|||:|||||||||

orf76-1 IDALLEENGVKPX

250

与淋病奈瑟球菌的预计ORF的同源性

ORF76与淋病奈瑟球菌的预计ORF(ORF76.ng)的N端和C端进行氨基酸序列对比，分别显示在30和31个氨基酸重叠区内有96.7％和100％的相同性：

orf76.pep MKQKKTAAAVIAAMLAGFAAXKAPEIDPAL 30

|||||||||||||||||||| |||||||||

orf76ng MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQRPDGQAIRND 60

//

orf76.pep ELVRNQLEQGLRQEKARLKIDALLEENGVKP 251

|||||||||||||||||||||||||||||||

orf76ng VTRNPVKLGERYYLFKLGAVGKNPDAQPFELVRNQLEQGLRQEKARLKIDALLEENGVKP 251

全长ORF76ng核苷酸序列<SEQ ID 301>是：

1 ATGAAACAGA AAAAGACCGC TGCCGCAGTT ATTGCTGCAA TGTTGGCAGG

51 TTTTGCGGCA GCCAAAGCAC CCGAAATCGA CCCGGCTTTG GTGGATACGC

101 TGGTGGCGCA GATCATGCAG CAGGCAGACC GGCATGCGGA GCAGTCCCAA

151 AGACCGGACG GGCAGGCAAT CCGAAACGAT GCCGTCCGCC GGCTGCAAAC

201 TTTGGAAGTT TTGAAAAACA GGGCATTGAA GGAAGGTTTG GATAAGGATA

251 AGGATGTCCA AAACCGCTTT AAAATCGCCG AAGCGTCTTT TTATGCCGAG

301 GAGTACGTCC GTTTTCTGGA ACGTTCGGAA ACGGTTTCCG AAAGCGCACT

351 GCGTCAGTTT TATGAGCGGC AAATCCGCAT GATCAAATTG CAGCAGGTCA

401 GCTTCGCAAC CGAAGAGGAG GCGCGTCAGG CGCAGCAGCT CCTGCTCAAA

451 GGGCTGTCTT TTGAAGGGCT GATGAAGCGT TATCCGAACG ACGAGCAGGC

501 GTTCGACGGT TTCATTATGG CGCAGCAGCT TCCCGAGCCG CTGGCTTcgc

551 agtttgCCGG TATGAACCGT GGCGACGTTA CCCGCAATCC GGTCAAATTG

601 GGCGAACGCT ATTACCTGTT CAAACTCGGC GCGGTCGGGA AAAACCCCGA

651 CGCGCAGCCT TTCGAGTTGG TCAGAAACCA GTTGGAACAA GGTTTGAGGC

701 AGGAAAAAGC CCGCTTGAAA ATCGATGCCC TTTTGGAaga Aaacggtgtc

751 AaacCGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 302>：

1

PEIDPAL VDTLVAQIMQ QADRHAEQSQ

51 RPDGQAIRND AVRRLQTLEV LKNRALKEGL DKDKDVQNRF KIAEASFYAE

101 EYVRFLERSE TVSESALRQF YERQIRMIKL QQVSFATEEE ARQAQQLLLK

151 GLSFEGLMKR YPNDEQAFDG FIMAQQLPEP LASQFAGMNR GDVTRNPVKL

201 GERYYLFKLG AVGKNPDAQP FELVRNQLEQ GLRQEKARLK IDALLEENGV

251 KP*

ORF76ng和ORF76-1在252个氨基酸的重叠区内有96.0％的相同性

10 20 30 40 50 60

orf76-1.pep MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQKPDGQAIRND

||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||

orf76ng MKQKKTAAAVIAAMLAGFAAAKAPEIDPALVDTLVAQIMQQADRHAEQSQRPDGQAIRND

10 20 30 40 50 60

70 80 90 100 110 120

orf76-1.pep AVRRLQTLEVLKNRALKEGLDKDKDVQNRFKIAEASFYAEEYVRFLERSETVSEDELHKF

||||||||||||||||||||||||||||||||||||||||||||||||||||||: |::|

orf76ng AVRRLQTLEVLKNRALKEGLDKDKDVQNRFKIAEASFYAEEYVRFLERSETVSESALRQF

70 80 90 100 110 120

130 140 150 160 170 180

orf76-1.pep YEQQIRMIKLQQVSFATEEEARQAQQLLLKGLSFEGLMKRYPNDEQAFDGFIMAQQLPEP

||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf76ng YERQIRMIKLQQVSFATEEEARQAQQLLLKGLSFEGLMKRYPNDEQAFDGFIMAQQLPEP

130 140 150 160 170 180

190 200 210 220 230 240

orf76-1.pep LASQFAAMNRGDVTRDPVKLGERYYLFKLSEVGKNPDAQPFELVRNQLEQGLRQEKARLK

||||||:||||||||:|||||||||||||:||||||||||||||||||||||||||||||

orf76ng LASQFAGMNRGDVTRNPVKLGERYYLFKLGAVGKNPDAQPFELVRNQLEQGLRQEKARLK

190 200 210 220 230 240

250

orf76-1.pep IDALLEENGVKPX

|||||||||||||

orf76ng IDALLEENGVKPX

250

另外，ORF76ng显示出与一种枯草杆菌输出蛋白(export protein)前体明显同源：

sp|P24327|PRSA_BACSU蛋白输出蛋白PRSA前体>gi|98227|pir||S1526933K脂蛋白-枯草芽孢杆菌>gi|39782(X57271)33kDa脂蛋白[枯草芽孢杆菌]

>gi|2226124|gnl|PID|e325181(Y14077)33kDa脂蛋白[枯草芽孢杆菌]>gi|2633331|gnl|PID|e1182997(Z99109)分子陪伴蛋白[枯草芽孢杆菌]长度＝292

评分＝50.4位(118)，估计值＝1e-05

相同性＝48/199(24％)，阳性＝82/199(41％)，空隙＝32/199(16％)

询问：70 VLKNRALKEGLDK-----DKDVQNRFKIAEASF----------YAEEYVRFLERSETVSE 114

VL ++ LDK DK++ N+ K + Y ++Y++ + E +++

目标：53 VLTQLVQEKVLDKKYKVSDKEIDNKLKEYKTQLGDQYTALEKQYGKDYLKEQVKYELLTQ 112

询问：115 SA-----------LRQFYERQIRMIKLQQVSFATEEEARQAQQLLLKGLSFEGLMKRYPN 163

A +++++E I+ + A ++ A + ++ L KG FE L K Y

目标：113 KAAKDNIKVTDADIKEYWEGLKGKIRASHILVADKKTAEEVEKKLKKGEKFEDLAKEYST 172

询问：164 DEQAFDG-----FIMAQQLPEPLASQFAAMNRGDVTRDPVKLGERYYLFKLSEVGKNPDA 218

D A G F Q+ E + + G+V+ DPVK Y++ K +E D

目标：173 DSSASKGGDLGWFAKEGQMDETFSKAAFKLKTGEVS-DPVKTQYGYHIIKKTEERGKYDD 231

询问：219 QPFELVRNQLEQGLRQEKA 237

EL LEQ L A

目标：232 MKKELKSEVLEQKLNDNAA 250

根据该分析结果(包括此淋球菌蛋白中存在一个推定前导序列和一个RGD基序)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF76-1(27.8kDa)克隆到pET载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图10A显示出His-融合蛋白亲和纯化的结果。用纯化的His-融合蛋白免疫小鼠，将小鼠血清用于Western印迹(图10B)，ELISA(阳性结果)，和FACS分析(图10C)。这些实验确认ORF76-1是一种外露蛋白，且是一种有用的免疫原。

实施例36

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 303>：

1 ATGAAAAAAT CTTTCCTTAC GCTTGTTCTG TATTCGTCTT TACTTACCGC

51 CAGCGAAATT GCC TACCCC TTGGAATTGG GGATTGAAAC CTTACCGGCG

101 GCAAAAATTG CGGAAACGTT TGCGCTGACA TTTGTGATTG CTGCGCTGTA

151 TCTGTTTGCG CGTAATAAGG TGACGCGTTT GTTGATTGCG GTGTTTTTTG

201 CGTTCAGCAT TATTGCCAAC AATGTGCATT ACGCGGATTA TCAAAGCTGG

251 ATGACG.... .......... .......... .......... ..........

//

1201 .......... CAAACCGTAT TCGAGCAGCT GCAAAAGACT CCTGACGGCA

1251 ACTGGCTGTT TGCCTATACC TCCGATCATG GCCAGTATGT TCGCCAAGAT

1301 ATCTACAATC AAGGCACGGT GCAGCCCGAC AGCTATCTCG TGCCGCTAGT

1351 GTTGTACAGC CCGGATAAGG CCGTGCAACA GGCTGCCAAC CAGGCTTTTG

1401 CGCCTTGCGA GATTGCCTTC CATCAGCAGC TTTCAACGTT CCTGATTCAC

1451 ACGTTGGGCT ACGATATGCC GGTTTCAGGT TGTCGCGAAG GCTCGGTAAC

1501 GGGCAACCTG ATTACGGGTG ATGCAGGCAG CTTGAACATT CGCGACGGCA

1551 AGGCGGAATA TGTTTATCCG CAATGA

它对应于氨基酸序列<SEQ ID 304；ORF81>：

1 MKKSFLTLVL YSSLLTASEI AYPLELGIET LPAAKIAETF ALTFVIAALY

51 LFARNKVTRL LIAVFFAFSI IANNVHYADY QSWMT..... ..........

//

401 ...QTVFEQL QKTPDGNWLF AYTSDHGQYV RQDIYNQGTV QPDSYLVPLV

451 LYSPDKAVQQ AANQAFAPCE IAFHQQLSTF LIHTLGYDMP VSGCREGSVT

501 GNLITGDAGS LNIRDGKAEY VYPQ*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 305>：

1 ATGAAAAAAT CTTTCCTTAC GCTTGTTCTG TATTCGTCTT TACTTACCGC

51 CAGCGAAATT GCCTATCGCT TTGTATTTGG GATTGAAACC TTACCGGCGG

101 CAAAAATTGC GGAAACGTTT GCGCTGACAT TTGTGATTGC TGCGCTGTAT

151 CTGTTTGCGC GTTATAAGGT GACGCGTTTG TTGATTGCGG TGTTTTTTGC

201 GTTCAGCATT ATTGCCAACA ATGTGCATTA CGCGGTTTAT CAAAGCTGGA

251 TGACGGGCAT CAATTATTGG CTGATGCTGA AAGAGGTTAC CGAAGTCGGC

301 AGCGCGGGTG CGTCGATGTT GGATAAGTTG TGGCTGCCTG TGTTGTGGGG

351 CGTGTTGGAA GTCATGTTGT TTTGCAGCCT TGCCAAGTTC CGCCGTAAGA

401 CGCATTTTTC TGCCGATATA CTGTTTGCCT TCCTAATGCT GATGATTTTC

451 GTGCGTTCGT TCGACACGAA ACAAGAGCAC GGTATTTCGC CCAAACCGAC

501 ATACAGCCGC ATCAAAGCCA ATTATTTCAG CTTCGGTTAT TTTGTCGGAC

551 GCGTGTTGCC GTATCAGTTG TTTGATTTAA GCAGGATTCC CGCCTTTAAG

601 CAGCCTGCTC CAAGCAAAAT CGGGCAGGGC AGTGTTCAAA ATATCGTCCT

651 GATTATGGGC GAAAGCGAAA GCGCGGCGCA TTTGAAGCTG TTTGGCTACG

701 GACGCGAAAC TTCGCCGTTT TTAACCCGGC TGTCGCAAGC CGATTTTAAG

751 CCGATTGTGA AACAAAGTTA TTCCGCAGGC TTTATGACTG CAGTGTCCCT

801 GCCCAGTTTT TTCAATGCGA TACCGCACGC CAACGGCTTG GAACAAATCA

851 GCGGCGGCGA TACCAATATG TTCCGCCTCG CCAAAGAGCA GGGCTATGAA

901 ACGTATTTTT ACAGCGCGCA GGCGGAAAAC GAGATGGCGA TTTTGAACTT

951 AATCGGTAAG AAATGGATAG ACCATCTGAT TCAGCCGACG CAACTTGGCT

1001 ACGGCAACGG CGACAATATG CCCGATGAGA AGCTGCTGCC GTTGTTCGAC

1051 AAAATCAATT TGCAGCAGGG CAAGCATTTT ATCGTGTTGC ACCAACGCGG

1101 TTCGCACGCC CCATACGGCG CATTGTTGCA GCCTCAAGAT AAAGTATTCG

1151 GCGAAGCCGA TATTGTGGAT AAGTACGACA ACACCATCCA CAAAACCGAC

1201 CAAATGATTC AAACCGTATT CGAGCAGCTG CAAAAGCAGC CTGACGGCAA

1251 CTGGCTGTTT GCCTATACCT CCGATCATGG CCAGTATGTT CGCCAAGATA

1301 TCTACAATCA AGGCACGGTG CAGCCCGACA GCTATCTCGT GCCGCTAGTG

1351 TTGTACAGCC CGGATAAGGC CGTGCAACAG GCTGCCAACC AGGCTTTTGC

1401 GCCTTGCGAG ATTGCCTTCC ATCAGCAGCT TTCAACGTTC CTGATTCACA

1451 CGTTGGGCTA CGATATGCCG GTTTCAGGTT GTCGCGAAGG CTCGGTAACG

1501 GGCAACCTGA TTACGGGTGA TGCAGGCAGC TTGAACATTC GCGACGGCAA

1551 GGCGGAATAT GTTTATCCGC AATGA

它对应于氨基酸序列<SEQ ID 306；ORF81-1>：

1 MKKSFLTLVL YSSLLTASEI AYRFVFGIET LPAAKIAETF ALTFVIAALY

51 LFARYKVTRL LIAVFFAFSI IANNVHYAVY QSWMTGINYW LMLKEVTEVG

101 SAGASMLDKL WLPVLWGVLE VMLFCSLAKF RRKTHFSADI LFAFLMLMIF

151 VRSFDTKQEH GISPKPTYSR IKANYFSFGY FVGRVLPYQL FDLSRIPAFK

201 QPAPSKIGQG SVQNIVLIMG ESESAAHLKL FGYGRETSPF LTRLSQADFK

251 PIVKQSYSAG FMTAVSLPSF FNAIPHANGL EQISGGDTNM FRLAKEQGYE

301 TYFYSAQAEN EMAILNLIGK KWIDHLIQPT QLGYGNGDNM PDEKLLPLFD

351 KINLQQGKHF IVLHQRGSHA PYGALLQPQD KVFGEADIVD KYDNTIHKTD

401 QMIQTVFEQL QKQPDGNWLF AYTSDHGQYV RQDIYNQGTV QPDSYLVPLV

451 LYSPDKAVQQ AANQAFAPCE IAFHQQLSTF LIHTLGYDMP VSGCREGSVT

501 GNLITGDAGS LNIRDGKAEY VYPQ*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF81和脑膜炎奈瑟球菌菌株A的ORF(ORF81a)在85个氨基酸的重叠区内有84.7％的相同性，在121个氨基酸的重叠区内有99.2％的相同性：

10 20 30 40 50 60

orf81.pep MKKSFLTLVLYSSLLTASEIAYPLELGIETLPAAK IAETFALTFVIAALYLFARNKVTR L

||||:::| ||||||||||||| : :|||||||||:|||||||||||||||||| |:|||

orf81a MKKSLFVLFLYSSLLTASEIAYRFVFGIETLPAAK MAETFALTFVIAALYLFARYKATR L

10 20 30 40 50 60

70 80

orf81.pep LIAVFFAFSIIANNVHYADYQSWMT

|||||||||||||||||| ||||:|

orf81a LIAVFFAFSIIANNVHYAVYQSWITGINYWLMLKEITEVGGAGASMLDKLW LPALWGVLE

70 80 90 100 110 120

//

120 130 140

orf81.pep QTVFEQLQKTPDGNWLFAYTSDHGQYVRQD

||||||||| ||||||||||||||||||||

orf81a IPHANGLEQISGGDIVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLFAYTSDHGQYVRQD

280 290 300 310 320 330

150 160 170 180 190 200

orf81.pep IYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTFLIHTLGYDMPVSG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf81a IYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTFLIHTLGYDMPVSG

340 350 360 370 380 390

210 220 230

orf81.pep CREGSVTGNLITGDAGSLNIRDGKAEYVYPQX

||||||||||||||||||||||||||||||||

orf81a CREGSVTGNLITGDAGSLNIRDGKAEYVYPQX

400 410 420

全长ORF81a核苷酸序列<SEQ ID 307>是：

1 ATGAAAAAAT CCCTTTTCGT TCTCTTTCTG TATTCGTCCC TACTTACTGC

51 CAGCGAAATT GCTTATCGCT TTGTATTCGG AATTGAAACC TTACCGGCTG

101 CAAAAATGGC AGAAACGTTT GCGCTGACAT TTGTGATTGC TGCGCTGTAT

151 CTGTTTGCGC GTTATAAGGC AACGCGTTTG TTGATTGCGG TGTTTTTCGC

201 GTTCAGCATT ATTGCCAACA ATGTGCATTA CGCGGTTTAT CAAAGCTGGA

251 TAACGGGCAT TAATTATTGG CTGATGCTGA AAGAGATTAC CGAAGTTGGC

301 GGCGCAGGGG CGTCGATGTT GGATAAGTTG TGGCTGCCTG CGTTGTGGGG

351 CGTGTTGGAA GTCATGTTGT TTTGCAGCCT TGCCAAGTTC CGCCGTAAGA

401 CGCATTTTTC TGCCGATATA CTGTTTGCCT TCCTAATGCT GATGATTTTC

451 GTGCGTTCGT TCGACACGAA ACAAGAACAC GGTATTTCGC CCAAACCGAC

501 ATACAGCCGC ATCAAAGCCA ATTATTTCAG CTTCGGTTAT TTTGTCGGAC

551 GCGTGTTGCC GTATCAGTTG TTTGATTTAA GCAAGATTCC TGTGTTCAAA

601 CAGCCTGCTC CAAGCAGAAT CGGGCAAGGC AGTATTCAAA ATATCGTCCT

651 GATTATGGGC GAAAGCGAAA GCGCGGCGCA TTTGAAATTG TTTGGCTACG

701 GGCGCGAAAC TTCGCCGTTT TTGACCCAGC TTTCGCAAGC CGATTTTAAG

751 CCGATTGTGA AACAAAGTTA TTCCGCAGGC TTTATGACGG CAGTATCCCT

801 GCCCAGTTTC TTTAACGTCA TACCGCATGC CAACGGCTTG GAACAAATCA

851 GCGGCGGCGA TATTGTGGAT AAGTACGACA ACACCATCCA CAAAACCGAC

901 CAAATGATTC AAACCGTATT CGAGCAGCTG CAAAAGCAGC CTGACGGCAA

951 CTGGCTGTTT GCCTATACCT CCGATCATGG CCAGTATGTT CGCCAAGATA

1001 TCTACAATCA AGGCACGGTG CAGCCCGACA GCTATCTCGT GCCGCTGGTG

1051 TTGTACAGCC CGGATAAGGC CGTGCAACAG GCTGCCAACC AGGCTTTTGC

1101 GCCTTGCGAG ATTGCCTTCC ATCAGCAGCT TTCAACGTTC CTGATTCACA

1151 CGTTGGGCTA CGATATGCCG GTTTCAGGTT GTCGCGAAGG CTCGGTAACG

1201 GGCAACCTGA TTACGGGTGA TGCAGGCAGC TTGAACATTC GCGACGGCAA

1251 GGCGGAATAT GTTTATCCGC AATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 308>：

1 MKKSLFVLFL YSSLLTASEI AYRFVFGIET LPAAK MAETF ALTFVIAALY

51 LFARYKATR L LIAVFFAFSI IANNVHYAVY QSWITGINYW LMLKEITEVG

101 GAGASMLDKL W LPALWGVLE VMLFCSLAKF RRKT HFSADI LFAFLMLMIF

151 VRSFDTKQEH GISPKPTYSR IKANYFSFGY FVGRVLPYQL FDLSKIPVFK

201 QPAPSRIGQG SIQNIVLIMG ESESAAHLKL FGYGRETSPF LTQLSQADFK

251 PIVKQSYSAG FMTAVSLPSF FNVIPHANGL EQISGGDIVD KYDNTIHKTD

301 QMIQTVFEQL QKQPDGNWLF AYTSDHGQYV RQDIYNQGTV QPDSYLVPLV

351 LYSPDKAVQQ AANQAFAPCE IAFHQQLSTF LIHTLGYDMP VSGCREGSVT

401 GNLITGDAGS LNIRDGKAEY VYPQ*

ORF81a和ORF81-1在524个氨基酸的重叠区内有77.9％的相同性：

10 20 30 40 50 60

orf81a.pep MKKSLFVLFLYSSLLTASEIAYRFVFGIETLPAAKMAETFALTFVIAALYLFARYKATRL

||||:::| ||||||||||||||||||||||||||:||||||||||||||||||||:|||

orf81-1 MKKSFLTLVLYSSLLTASEIAYRFVFGIETLPAAKIAETFALTFVIAALYLFARYKVTRL

10 20 30 40 50 60

70 80 90 100 110 120

orf81a.pep LIAVFFAFSIIANNVHYAVYQSWITGINYWLMLKEITEVGGAGASMLDKLWLPALWGVLE

||||||||||||||||||||||||:|||||||||||:||||:||||||||||||:|||||

orf81-1 LIAVFFAFSIIANNVHYAVYQSWMTGINYWLMLKEVTEVGSAGASMLDKLWLPVLWGVLE

70 80 90 100 110 120

130 140 150 160 170 180

orf81a.pep VMLFCSLAKFRRKTHFSADILFAFLMLMIFVRSFDTKQEHGISPKPTYSRIKANYFSFGY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf81-1 VMLFCSLAKFRRKTHFSADILFAFLMLMIFVRSFDTKQEHGISPKPTYSRIKANYFSFGY

130 140 150 160 170 180

190 200 210 220 230 240

orf81a.pep FVGRVLPYQLFDLSKIPVFKQPAPSRIGQGSIQNIVLIMGESESAAHLKLFGYGRETSPF

||||||||||||||:||:|||||||:|||||:||||||||||||||||||||||||||||

orf81-1 FVGRVLPYQLFDLSRIPAFKQPAPSKIGQGSVQNIVLIMGESESAAHLKLFGYGRETSPF

190 200 210 220 230 240

250 260 270 280

orf81a.pep LTQLSQADFKPIVKQSYSAGFMTAVSLPSFFNVIPHANGLEQISGGD-------------

||:|||||||||||||||||||||||||||||:||||||||||||||

orf81-1 LTRLSQADFKPIVKQSYSAGFMTAVSLPSFFNAIPHANGLEQISGGDTNMFRLAKEQGYE

250 260 270 280 290 300

orf81a.pep ------------------------------------------------------------

orf81-1 TYFYSAQAENEMAILNLIGKKWIDHLIQPTQLGYGNGDNMPDEKLLPLFDKINLQQGKHF

310 320 330 340 350 360

290 300 310 320

orf81a.pep ---------------------------IVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLF

|||||||||||||||||||||||||||||||||

orf81-1 IVLHQRGSHAPYGALLQPQDKVFGEADIVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLF

370 380 390 400 410 420

330 340 350 360 370 380

orf81a.pep AYTSDHGQYVRQDIYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf81-1 AYTSDHGQYVRQDIYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTF

430 440 450 460 470 480

390 400 410 420

orf81a.pep LIHTLGYDMPVSGCREGSVTGNLITGDAGSLNIRDGKAEYVYPQX

|||||||||||||||||||||||||||||||||||||||||||||

orf81-1 LIHTLGYDMPVSGCREGSVTGNLITGDAGSLNIRDGKAEYVYPQX

490 500 510 520

与淋病奈瑟球菌的预计ORF的同源性

ORF81与淋病奈瑟球菌的预计ORF(ORF81.ng)的N-和C-端的氨基酸序列对比分别显示出在85和121个氨基酸的重叠区内有82.4％和97.5％的相同性：

orf81.pep MKKSFLTLVLYSSLLTASEIAYPLELGIETLPAAKIAETFALTFVIAALYLFARNKVTRL 60

||||:::| ||||||||||||| : :|||||||||:||||||||:||||||||| |::||

orf81ng MKKSLFVLFLYSSLLTASEIAYRFVFGIETLPAAKMAETFALTFMIAALYLFARYKASRL 60

orf81.pep LIAVFFAFSIIANNVHYADYQSWMT 85

|||||||||:|||||||||||||||

orf81ng LIAVFFAFSMIANNVHYAVYQSWMTGINYWLMLKEVTEVGSAGASMLDKLWLPALWGVAE 120

//

orf81.pep QTVFEQLQKTPDGNWLFAYTSDHGQYVRQD 433

||||||||| ||||||||||||||||||||

orf81ng ALLQPQDKVFGEADIVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLFAYTSDHGQYVRQD 433

orf81.pep IYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTFLIHTLGYDMPVSG 493

||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||||

orf81ng IYNQGTVQPDSYIVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTFLIHTLGYDMPVSG 493

orf81.pep CREGSVTGNLITGDAGSLNIRDGKAEYVYPQ 524

|||||||||||||||||||||:|||||||||

orf81ng CREGSVTGNLITGDAGSLNIRNGKAEYVYPQ 524

全长ORF81ng核苷酸序列<SEQ ID 309>是：

1 ATGAAAAAAT CCCTTTTCGT TCTCTTTCTG TATTCATCCC TACTTACCGC

51 CAGCGAAATC GCCTATCGCT TTGTATTCGG AATTGAAACC TTACCGGCTG

101 CAAAAATGGC GGAAACGTTT GCGCTGACAT TTATGATTGC TGCGCTGTAT

151 CTGTTTGCGC GTTATAAGGC TTCGCGGCTG CTGATTGCGG TGTTTTTCGC

201 GTTCAGCATG ATTGCCAACA ATGTGCATTA CGCGGTTTAT CAAAGCTGGA

251 TGACGGGTAT TAACTATTGG CTGATGCTGA AAGAGGTTAC CGAAGTCGGC

301 AGCGCGGGCG CGTCGATGTT GGATAAGTTG TGGCTGCCTG CTTTGTGGGG

351 CGTGGCGGAA GTCATGTTGT TTTGCAGCCT TGCCAAGTTC CGCCGTAAGA

401 CGCATTTTTC TGCCGATATA CTGTTTGCCT TCCTAATGCT GATGATTTTC

451 GTGCGTTCGT TCGACACGAA ACAAGAGCAC GGTATTTCGC CCAAACCGAC

501 ATACAGCCGC ATCAAAGCCA ATTATTTCAG CTTCGGTTAT TTTGTCGGGC

551 GCGTGTTGCC GTATCAGTTG TTTGATTTAA GCAAGATCCC TGTGTTCAAA

601 CAGCCTGCTC CAAGCAAAAT CGGGCAAGGC AGTATTCAAA ATATCGTCCT

651 GATTATGGGC GAAAGCGAAA GCGCGGCGCA TTTGAAATTG TTTGGTTACG

701 GGCGCGAAAC TTCGCCGTTT TTAACCCGGC TGTCGCAAGC CGATTTTAAG

751 CCGATTGTGA AACAAAGTTA TTCCGCAGGC TTTATGACGG CAGTATCCCT

801 GCCCAGTTTC TTTAACGTCA TACCGCACGC CAACGGCTTG GAACAAATCA

851 GCGGCGGCGA TACCAATATG TTCCGCCTCG CCAAAGAGCA GGGCTATGAA

901 ACGTATTTTT ACAGTGCCCA GGCTGAAAAC CAAATGGCAA TTTTGAACTT

951 AATCGGTAAG AAATGGATAG ACCATCTGAT TCAGCCGACG CAACTTGGCT

1001 ACGGCAACGG CGACAATATG CCCGATGAGA AGCTGCTGCC GTTGTTCGAC

1051 AAAATCAATT TGCAGCAGGG CAGGCATTTT ATCGTGTTGC ACCAACGCGG

1101 TTCGCACGCC CCATACGGCG CATTGTTGCA GCCTCAAGAT AAAGTATTCG

1151 GCGAAGCCGA TATTGTGGAT AAGTACGACA ACACCATCCA CAAAACCGAC

1201 CAAATGATTC AAACCGTATT CGAGCAGCTG CAAAAGCAGC CTGACGGCAA

1251 CTGGCTGTTT GCCTATACCT CCGATCATGG CCAGTATGTG CGCCAAGATA

1301 TCTACAATCA AGGCACGGTG CAGCCCGACA GCTATATTGT GCCTCTGGTT

1351 TTGTACAGCC CGGATAAGGC CGTGCAACAG GCTGCCAACC AGGCTTTTGC

1401 GCCTTGCGAG ATTGCCTTCC ATCAGCAGCT TTCAACGTTC CTGATTCACA

1451 CGTTGGGCTA CGATATGCCG GTTTCAGGTT GTCGCGAAGG CTCGGTAACA

1501 GGCAACCTGA TTACGGGCGA TGCAGGCAGC TTGAACATTC GCAACGGCAA

1551 GGCGGAATAT GTTTATCCGC AATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 310>：

1

51

RYKASRL LIAVFFAFSM IANNVHYAVY QSWMTGINYW LMLKEVTEVG

101 SAGASMLDKL W LPALWGVAE VMLFCSLAKF RRKT HFSADI LFAFLMLMIF

151 VRSFDTKQEH GISPKPTYSR IKANYFSFGY FVGRVLPYQL FDLSKIPVFK

201 QPAPSKIGQG SIQNIVLIMG ESESAAHLKL FGYGRETSPF LTRLSQADFK

251 PIVKQSYSAG FMTAVSLPSF FNVIPHANGL EQISGGDTNM FRLAKEQGYE

301 TYFYSAQAEN QMAILNLIGK KWIDHLIQPT QLGYGNGDNM PDEKLLPLFD

351 KINLQQGRHF IVLHQRGSHA PYGALLQPQD KVFGEADIVD KYDNTIHKTD

401 QMIQTVFEQL QKQPDGNWLF AYTSDHGQYV RQDIYNQGTV QPDSYIVPLV

451 LYSPDKAVQQ AANQAFAPCE IAFHQQLSTF LIHTLGYDMP VSGCREGSVT

501 GNLITGDAGS LNIRNGKAEY VYPQ*

ORF81ng和ORF81-1在524个氨基酸的重叠区内有96.4％的相同性：

10 20 30 40 50 60

orf81ng-1.pep MKKSLFVLFLYSSLLTASEIAYRFVFGIETLPAAKMAETFALTFMIAALYLFARYKASRL

||||:::| ||||||||||||||||||||||||||:||||||||:|||||||||||::||

orf81-1 MKKSFLTLVLYSSLLTASEIAYRFVFGIETLPAAKIAETFALTFVIAALYLFARYKVTRL

10 20 30 40 50 60

70 80 90 100 110 120

orf81ng-1.pep LIAVFFAFSMIANNVHYAVYQSWMTGINYWLMLKEVTEVGSAGASMLDKLWLPALWGVAE

|||||||||:|||||||||||||||||||||||||||||||||||||||||||:|||| |

orf81-1 LIAVFFAFSIIANNVHYAVYQSWMTGINYWLMLKEVTEVGSAGASMLDKLWLPVLWGVLE

70 80 90 100 110 120

130 140 150 160 170 180

orf81ng-1.pep VMLFCSLAKFRRKTHFSADILFAFLMLMIFVRSFDTKQEHGISPKPTYSRIKANYFSFGY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf81-1 VMLFCSLAKFRRKTHFSADILFAFLMLMIFVRSFDTKQEHGISPKPTYSRIKANYFSFGY

130 140 150 160 170 180

190 200 210 220 230 240

orf81ng-1.pep FVGRVLPYQLFDLSKIPVFKQPAPSKIGQGSIQNIVLIMGESESAAHLKLFGYGRETSPF

||||||||||||||:||:|||||||||||||:||||||||||||||||||||||||||||

orf81-1 FVGRVLPYQLFDLSRIPAFKQPAPSKIGQGSVQNIVLIMGESESAAHLKLFGYGRETSPF

190 200 210 220 230 240

250 260 270 280 290 300

orf81ng-1.pep LTRLSQADFKPIVKQSYSAGFMTAVSLPSFFNVIPHANGLEQISGGDTNMFRLAKEQGYE

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf81-1 LTRLSQADFKPIVKQSYSAGFMTAVSLPSFFNAIPHANGLEQISGGDTNMFRLAKEQGYE

250 260 270 280 290 300

310 320 330 340 350 360

orf81ng-1.pep TYFYSAQAENQMAILNLIGKKWIDHLIQPTQLGYGNGDNMPDEKLLPLFDKINLQQGRHF

||||||||||:||||||||||||||||||||||||||||||||||||||||||||||:||

orf81-1 TYFYSAQAENEMAILNLIGKKWIDHLIQPTQLGYGNGDNMPDEKLLPLFDKINLQQGKHF

310 320 330 340 350 360

370 380 390 400 410 420

orf81ng-1.pep IVLHQRGSHAPYGALLQPQDKVFGEADIVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf81-1 IVLHQRGSHAPYGALLQPQDKVFGEADIVDKYDNTIHKTDQMIQTVFEQLQKQPDGNWLF

370 380 390 400 410 420

430 440 450 460 470 480

orf81ng-1.pep AYTSDHGQYVRQDIYNQGTVQPDSYIVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTF

|||||||||||||||||||||||||:||||||||||||||||||||||||||||||||||

orf81-1 AYTSDHGQYVRQDIYNQGTVQPDSYLVPLVLYSPDKAVQQAANQAFAPCEIAFHQQLSTF

430 440 450 460 470 480

490 500 510 520

orf81ng-1.pep LIHTLGYDMPVSGCREGSVTGNLITGDAGSLNIRNGKAEYVYPQX

||||||||||||||||||||||||||||||||||:||||||||||

orf81-1 LIHTLGYDMPVSGCREGSVTGNLITGDAGSLNIRDGKAEYVYPQX

490 500 510 520

另外，ORF81ng显示出与大肠杆菌的OMP明显同源：

gi|1256380(U50906)结合外膜蛋白粘附蛋白的蛋白[E.coli]长度＝547

评分＝87.4位(213)，估计值＝2e-16

相同性＝122/468(26％)，阳性＝198/468(42％)，空隙＝70/468(14％)

询问：25 VFGIETLPAAKMAETFA-LTFMIAALYLFARYKAS--RLLIAVFFAFSMIANNVHYAVYQ 81

VFGI L A+ A L F + + + R + RLL+A F + A ++ ++Y

目标：29 VFGITNLVASSGAHMVQRLLFFVLTILVVKRISSLPLRLLVAAPFVL-LTAADMSISLY- 86

询问：82 SWMT-------GINYWLMLKEVTEVGSAGASMLDKLWLPALWGVAEVMLFCSLAKFRRKT 134

SW T G ++ + EV A ML ++ P L A + L +

目标：87 SWCTFGTTFNDGFAISVLQSDPDEV----AKMLG-MYSPYLCAFAFLSLLFLAVIIKYDV 141

询问：135 HFSADILFAFLMLMIFVRSF---------DTKQEHGISPKPTYSRIKAN--YFSFGYFVG 183

+ L+L++ S D K ++ SP SR +F+ YF

目标：142 SLPTKKVTGILLLIVISGSLFSACQFAYKDAKNKNAFSPYILASRFATYTPFFNLNYFAL 201

询问：184 RVLPYQ--LFDLSKIPVFKQPAPSKIGQGSIQNIVLIMGESESAAHLKLFGYGRETSPFL 241

+Q L + +P F+ + I VLI+GES ++ L+GY R T+P +

目标：202 AAKEHQRLLSIANTVPYFQL----SVRDTGIDTYVLIVGESVRVDNMSLYGYTRSTTPQV 257

询问：242 TRLSQADFKPIVKQSYSAGFMTAVSLP---SFFNVIPHANGLEQISGGDTNMFRLAKEQG 298

+Q + Q+ S TA+S+P + +V+ H I N+ +A + G

目标：258 E--AQRKQIKLFNQAISGAPYTALSVPLSLTADSVLSH-----DIHNYPDNI INMANQAG 310

询问：299 YETYFYSAQA---ENQMAILNLIGKKWIDHLIQPTQLGYGNGDNMPDEKLLPLFDKINLQ 355

++T++ S+Q+ +N A+ ++ ++ + Y G DE LLP + Q

目标：311 FQTFWLSSQSAFRQNGTAVTSI--------AMRAMETVYVRGF---DELLLPHLSQALQQ 359

询问：356 --QGRHFIVLHQRGSHAPYGALLQPQDKVFGEADIVDK-YDNTIHKTDQMIQTVFEQLQK 412

Q + IVLH GSH P + VF D D YDN+IH TD ++ VFE L+

目标：360 NTQQKKLIVLHLNGSHEPACSAYPQSSAVFQPQDDQDACYDNSIHYTDSLLGQVFELLK- 418

询问：413 QPDGNWLFAYTSDHG---QYVRQDIYNQG--TVQPDSYIVPL-VLYSP 454

D Y +DHG ++++Y G +Y VP+ + YSP

目标：419--DRRASVMYFADHGLERDPTKKNVYFHGGREASQQAYHVPMFIWYSP 464

根据该分析结果(包括该淋球菌蛋白中存在一个推定的前导序列(双划线)和数个推定的跨膜结构域(单划线)的结果)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例37

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 311>：

1 ...ACCCTGCTCC TCTTCATCCC CCTCGTCCTC ACAC.GTGCG GCACACTGAC

51 CGGCATACTC GCCCaCGGCG GCGGCAAACG CTTTGCCGTC GAACAAGAAC

101 TCGTCGCCGC ATCGTCCCGC GCCGCCGTCA AAGAAATGGA TTTGTCCGCC

151 yTAAAAGGAC GCAAAGCCGC CyTTTACGTC TCCGTTATGG GCGACCAAGG

201 TTCGGGCAAC ATAAGCGGCG GACGCTACTC TATCGACGCA CTGATACGCG

251 GCGGCTACCA CAACAACCCC GAAAGTGCCA CCCAATACAG CTACCCCGCC

301 TACGACACTA CCGCCACCAC CAAATCCGAC GCGCTCTCCA GCGTAACCAC

351 TTCCACATCG CTTTTGAACG CCCCCGCCGC CGyCyTGACG AAAAACAGCG

401 GACGCAAAGG CGAACGcTCC GCCGGACTGT CCGTCAACGG CACGGGCGAC

451 TACCGCAACG AAACCCTGCT CGCCAACCCC CGCGACGTTT CCTTCCTGAC

501 CAACCTCATC CAAACCGTCT TCTACCTGCG CGGCATCGAA GTCgTACCGC

551 CCGrATACGC CGACACCGAC GTATTCGTAA CCGTCGACGT A...

它对应于氨基酸序列<SEQ ID 312；ORF83>：

1 ..TLLLFIPLVL TXCGTLTGIL AHGGGKRFAV EQELVAASSR AAVKEMDLSA

51 LKGRKAAXYV SVMGDQGSGN ISGGRYSIDA LIRGGYHNNP ESATQYSYPA

101 YDTTATTKSD ALSSVTTSTS LLNAPAAXLT KNSGRKGERS AGLSVNGTGD

151 YRNETLLANP RDVSFLTNLI QTVFYLRGIE VVPPXYADTD VFVTVDV..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 313>：

1 ATGAAAACCC TGCTCCTCCT CATCCCCCTC GTCCTCACAG CCTGCGGCAC

51 ACTGACCGGC ATACCCGCCC ACGGCGGCGG CAAACGCTTT GCCGTCGAAC

101 AAGAACTCGT CGCCGCATCG TCCCGCGCCG CCGTCAAAGA AATGGATTTG

151 TCCGCCCTAA AAGGACGCAA AGCCGCCCTT TACGTCTCCG TTATGGGCGA

201 CCAAGGTTCG GGCAACATAA GCGGCGGACG CTACTCTATC GACGCACTGA

251 TACGCGGCGG CTACCACAAC AACCCCGAAA GTGCCACCCA ATACAGCTAC

301 CCCGCCTACG ACACTACCGC CACCACCAAA TCCGACGCGC TCTCCAGCGT

351 AACCACTTCC ACATCGCTTT TGAACGCCCC CGCCGCCGCC CTGACGAAAA

401 ACAGCGGACG CAAAGGCGAA CGCTCCGCCG GACTGTCCGT CAACGGCACG

451 GGCGACTACC GCAACGAAAC CCTGCTCGCC AACCCCCGCG ACGTTTCCTT

501 CCTGACCAAC CTCATCCAAA CCGTCTTCTA CCTGCGCGGC ATCGAAGTCG

551 TACCGCCCGA ATACGCCGAC ACCGACGTAT TCGTAACCGT CGACGTATTC

601 GGCACCGTCC GCAGCCGTAC CGAACTGCAC CTCTACAACG CCGAAACCCT

651 TAAAGCCCAA ACCAAGCTCG AATATTTCGC CGTTGACCGC GACAGCCGGA

701 AACTGCTGAT TACCCCTAAA ACCGCCGCCT ACGAATCCCA ATACCAAGAA

751 CAATACGCCC TTTGGACCGG CCCTTACAAA GTCAGCAAAA CCGTCAAAGC

801 CTCAGACCGC CTGATGGTCG ATTTCTCCGA CATTACCCCC TACGGCGACA

851 CAACCGCCCA AAACCGTCCC GACTTCAAAC AAAACAACGG TAAAAAACCC

901 GATGTCGGCA ACGAAGTCAT CCGCCGCCGC AAAGGAGGAT AA

它对应于氨基酸序列<SEQ ID 314；ORF83-1>：

1 MKTLLLLIPL VLTACGTLTG IPAHGGGKRF AVEQELVAAS SRAAVKEMDL

51 SALKGRKAAL YVSVMGDQGS GNISGGRYSI DALIRGGYHN NPESATQYSY

101 PAYDTTATTK SDALSSVTTS TSLLNAPAAA LTKNSGRKGE RSAGLSVNGT

151 GDYRNETLLA NPRDVSFLTN LIQTVFYLRG IEVVPPEYAD TDVFVTVDVF

201 GTVRSRTELH LYNAETLKAQ TKLEYFAVDR DSRKLLITPK TAAYESQYQE

251 QYALWTGPYK VSKTVKASDR LMVDFSDITP YGDTTAQNRP DFKQNNGKKP

301 DVGNEVIRRR KGG*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF83与脑膜炎奈瑟球菌菌株A的ORF(ORF83a)在重叠的197个氨基酸内有96.4％的相同性：

10 20 30 40 50

orf83.pep TLLLFIPLVLTXCGTLTGILAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAX

||| :|||||| ||||||| ||||||||||||||||||||||||||||||||||||||

orf83a MKTLLXLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL

10 20 30 40 50 60

60 70 80 90 100 110

orf83.pep YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf83a YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS

70 80 90 100 110 120

120 130 140 150 160 170

orf83.pep TSLLNAPAAXLTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

||||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf83a TSLLNAPAAALTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

130 140 150 160 170 180

180 190

orf83.pep IEVVPPXYADTDVFVTVDV

|||||| ||||||||||||

orf83a IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLIAPK

190 200 210 220 230 240

全长ORF83a核苷酸序列<SEQ ID 315>是：

1 ATGAAAACCC TGCTCNTCCT CATCCCCCTC GTCCTCACAG CCTGCGGCAC

51 ACTGACCGGC ATACCCGCCC ACGGCGGCGG CAAACGCTTT GCCGTCGAAC

101 AAGAACTCGT CGCCGCATCG TCCCGCGCCG CCGTCAAAGA AATGGACTTG

151 TCCGCCCTGA AAGGACGCAA AGCCGCCCTT TACGTCTCCG TTATGGGCGA

201 CCAAGGTTCG GGCAACATAA GCGGCGGACG CTACTCTATC GACGCACTGA

251 TACGCGGCGG CTACCACAAC AACCCCGAAA GTGCCACCCA ATACAGCTAC

301 CCCGCCTACG ACACTACCGC CACCACCAAA TCCGACGCGC TCTCCAGCGT

351 AACCACTTCC ACATCGCTTT TGAACGCCCC CGCCGCCGCC CTGACGAAAA

401 ACAGCGGACG CAAAGGCGAA CGCTCCGCCG GACTGTCCGT CAACGGCACG

451 GGCGACTACC GCAACGAAAC CCTGCTCGCC AACCCCCGCG ACGTTTCCTT

501 CCTGACCAAC CTCATCCAAA CCGTCTTCTA CCTGCGCGGC ATCGAAGTCG

551 TACCGCCCGA ATACGCCGAC ACCGACGTAT TCGTAACCGT CGACGTATTC

601 GGCACCGTCC GCAGCCGCAC CGAACTGCAC CTCTACAACG CCGAAACCCT

651 TAAAGCCCAA ACCAAGCTCG AATATTTCGC CGTTGACCGC GACAGCCGGA

701 AACTGCTGAT TGCCCCTAAA ACCGCCGCCT ACGAATCCCA ATACCAAGAA

751 CAATACGCCC TCTGGATGGG ACCTTACAGC GTCGGCAAAA CCGTCAAAGC

801 CTCAGACCGC CTGATGGTCG ATTTCTCCGA CATCACCCCC TACGGCGACA

851 CAACCGCCCA AAACCGTCCC GACTTCAAAC AAAACAACGG TAAAAAACCC

901 GATGTCGGCA ACGAAGTCAT CCGCCGCCGC AAAGGAGGAT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 316>：

1 MKTLLXLIPL VLTACGTLTG IPAHGGGKRF AVEQELVAAS SRAAVKEMDL

51 SALKGRKAAL YVSVMGDQGS GNISGGRYSI DALIRGGYHN NPESATQYSY

101 PAYDTTATTK SDALSSVTTS TSLLNAPAAA LTKNSGRKGE RSAGLSVNGT

151 GDYRNETLLA NPRDVSFLTN LIQTVFYLRG IEVVPPEYAD TDVFVTVDVF

201 GTVRSRTELH LYNAETLKAQ TKLEYFAVDR DSRKLLIAPK TAAYESQYQE

251 QYALWMGPYS VGKTVKASDR LMVDFSDITP YGDTTAQNRP DFKQNNGKKP

301 DVGNEVIRRR KGG*

ORF83a和ORF83-1在313个氨基酸的重叠区内有98.4％的相同性：

10 20 30 40 50 60

orf83a.pep MKTLLXLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL

||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf83-1 MKTLLLLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL

10 20 30 40 50 60

70 80 90 100 110 120

orf83a.pep YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf83-1 YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS

70 80 90 100 110 120

130 140 150 160 170 180

orf83a.pep TSLLNAPAAALTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf83-1 TSLLNAPAAALTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

130 140 150 160 170 180

190 200 210 220 230 240

orf83a.pep IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLIAPK

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||:||

orf83-1 IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLITPK

190 200 210 220 230 240

250 260 270 280 290 300

orf83a.pep TAAYESQYQEQYALWMGPYSVGKTVKASDRLMVDFSDITPYGDTTAQNRPDFKQNNGKKP

||||||||||||||| |||:|:||||||||||||||||||||||||||||||||||||||

orf83-1 TAAYESQYQEQYALWTGPYKVSKTVKASDRLMVDFSDITPYGDTTAQNRPDFKQNNGKKP

250 260 270 280 290 300

310

orf83a.pep DVGNEVIRRRKGGX

||||||||||||||

orf83-1 DVGNEVIRRRKGGX

310

与淋病奈瑟球菌的预计ORF的同源性

ORF83和淋病奈瑟球菌的预计ORF(ORF83.ng)在重叠的197个氨基酸内有94.9％的相同性：

orf83.pep TLLLFIPLVLTXCGTLTGILAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAX 58

||||:|||||| ||||||| ||||||||||||||||||||||||||||||||||||||

orf83ng MKTLLLLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL 60

orf83.pep YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS 118

||||||||||||||||||||||||||||||||:|||:||||||||||||||||||:||||

orf83ng YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPDSATRYSYPAYDTTATTKSDALSGVTTS 120

orf83.pep TSLLNAPAAXLTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG 178

||||||||| ||||:|||||||||||||||||||||||||||||||||||||||||||||

orf83ng TSLLNAPAAALTKNNGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG 180

orf83.pep IEVVPPXYADTDVFVTVDV 197

|||||||||||||||||||

orf83ng IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLIAPK 240

全长ORF83ng核苷酸序列<SEQ ID 317>是：

1 ATGAAAACCC TGCTCCTCCT CATCCCCCTC GTACTCACCG CCTGCGGCAC

51 ACTGACCGGC ATACCCGCCC ACGGCGGCGG CAAACGCTTT GCCGTCGAAC

101 AGGAACTCGT CGCCGCATCG TCCCGCGCCG CCGTCAAAGA AATGGACTTG

151 TCCGCCCTGA AAGGACGCAA AGCCGCCCTT TACGTCTCCG TTATGGGCGA

201 CCAAGGTTCG GGCAACATAA GCGGCGGACG CTACTCCATC GACGCACTGA

251 TACGCGGCGG CTACCACAAC AACCCCGACA GCGCCACCCG ATACAGCTAC

301 CCCGCCTATG ACACTACCGC CACCACCAAA TCCGACGCGC TCTCCGGCGT

351 AACCACTTCC ACATCGCTTT TGAACGCCCC CGCCGCCGCC CTGACGAAAA

401 ACAACGGACG CAAAGGCGAA CGCTCCGCCG GACTGTCCGT CAACGGCACG

451 GGCGACTACC GCAACGAAAC CCTGCTCGCC AACCCCCGCG ACGTTTCCTT

501 CCTGACCAAC CTCATCCAAA CCGTCTTCTA CCTGCGCGGC ATCGAAGTCG

551 TACCGCCCGA ATACGCCGAC ACCGACGTAT TCGTAACCGT CGACGTATTC

601 GGCACCGTCC GCAGCCGTAC CGAACTGCAC CTCTACAACG CCGAAACCCT

651 TAAAGCCCAA ACCAAGCTCG AATATTTCGC CGTCGACCGC GACAGCCGGA

701 AACTGCTGAT TGCCCCTAAA ACCGCCGCCT ACGAATCCCA ATACCAAGAA

751 CAATACGCCC TCTGGATGGG ACCTTACAGC GTCGGCAAAA CCGTCAAAGC

801 CTCAGACCGC CTGATGGTCG ATTTCTCCGA CATCACCCCC TACGGCGACA

851 CAACCGCCCA AAACCGTCCC GACTTCAAAC AAAACAACGG TAAAAACCCC

901 GATGTCGGCA ACGAAGTCAT CCGCCGCCGC AAAGGAGGAT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 318>：

1 MKTL LLLIPL VLTACGTLTG IPAHGGGKRF AVEQELVAAS SRAAVKEMDL

51 SALKGRKAAL YVSVMGDQGS GNISGGRYSI DALIRGGYHN NPDSATRYSY

101 PAYDTTATTK SDALSGVTTS TSLLNAPAAA LTKNNGRKGE RSAGLSVNGT

151 GDYRNETLLA NPRDVSFLTN LIQTVFYLRG IEVVPPEYAD TDVFVTVDVF

201 GTVRSRTELH LYNAETLKAQ TKLEYFAVDR DSRKLLIAPK TAAYESQYQE

251 QYALWM VKASDR LMVDFSDITP YGDTTAQNRP DFKQNNGKNP

301 DVGNEVIRRR KGG*

ORF83ng和ORF83-1在313个氨基酸的重叠区内有97.1％的相同性

10 20 30 40 50 60

orf83-1.pep MKTLLLLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf83ng MKTLLLLIPLVLTACGTLTGIPAHGGGKRFAVEQELVAASSRAAVKEMDLSALKGRKAAL

10 20 30 40 50 60

70 80 90 100 110 120

orf83-1.pep YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPESATQYSYPAYDTTATTKSDALSSVTTS

||||||||||||||||||||||||||||||||:|||:||||||||||||||||||:||||

orf83ng YVSVMGDQGSGNISGGRYSIDALIRGGYHNNPDSATRYSYPAYDTTATTKSDALSGVTTS

70 80 90 100 110 120

130 140 150 160 170 180

orf83-1.pep TSLLNAPAAALTKNSGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf83ng TSLLNAPAAALTKNNGRKGERSAGLSVNGTGDYRNETLLANPRDVSFLTNLIQTVFYLRG

130 140 150 160 170 180

190 200 210 220 230 240

orf83-1.pep IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLITPK

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||:||

orf83ng IEVVPPEYADTDVFVTVDVFGTVRSRTELHLYNAETLKAQTKLEYFAVDRDSRKLLIAPK

190 200 210 220 230 240

250 260 270 280 290 300

orf83-1.pep TAAYESQYQEQYALWTGPYKVSKTVKASDRLMVDFSDITPYGDTTAQNRPDFKQNNGKKP

||||||||||||||| |||:|:||||||||||||||||||||||||||||||||||||:|

orf83ng TAAYESQYQEQYALWMGPYSVGKTVKASDRLMVDFSDITPYGDTTAQNRPDFKQNNGKNP

250 260 270 280 290 300

310

orf83-1.pep DVGNEVIRRRKGGX

||||||||||||||

orf83ng DVGNEVIRRRKGGX

310

根据该分析结果(预计淋球菌蛋白中存在一个推定的ATP/GTP-结合位点基序A(P-环)(双划线)以及一个推定的原核细胞膜脂蛋白脂质连接位点(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例38

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 319>：

1 ATGGCAGAGA TCTGTTTGAT AACCGGCACG CCCGGTTCAG GGAAAACATT

51 AAAAATGGTT TCCATGATGG CGAATGATGA AATGTTTAAG CCTGATGAAA

101 AAGCCATACG CCGTAAAGTA TTTACGAACA TAAAAGGCTT GAAAATACCG

151 CACACCTACA TAGAAACGGA CGCAAAAAAG CTGCCGAAAT CGACAGATGA

201 GCAGCTTTCG GCGCATGATA TGTACGAATG GATAAAGAAG CCCGAAAATA

251 TCGGGTCTAT TGTCATTGTA GATGAAGCTC AAGACGTATG GCCGGCACGC

301 TCGGCAGGTT CAAAAATCCC TGAAAATGTC CAATGGCTGA ATACGCACAG

351 ACATCAGGGC ATTGATATAT TTGTTTTGAC TCAAGGTCCT AAGCTTCTAG

401 ATCAAAATCT TAGAACGCTT GTACGGAAAC ATTACCACAT CGCTTCAAAC

451 AAGATGGGTA TGCGTACGCT TTTAGAATGG AAAATATGCG CGGACGATCC

501 CGTAAAAATG GCATCAAGCG CATTCTCCAG TATCTATACA CTGGATAAAA

551 AAGTTTATGA CTTGTAysrr TmmGCGGAAG TTCATACCGT AAATAAGGTC

601 AAGCGGTCAA AGTGGTTTTA CACTCTGCCa GTAATAGTAT TGCTGATTCC

651 CGTGTTTGTC GGCCTGTCCT ATAAAATGTT GagCaGTTAC GGAAAAAAAC

701 aGGAAGAACC CGCAGCACAA GAATCGGCGG CAACAGAACA GCAGGCAGTA

751 CTTCCGGATA AAACAGAAGG CGAGCCGGTA AATAACGGCA ACCTTACCGC

801 AGATATGTTT GTTCCGACAT TGTCCGAaAA ACCCGrAAGC AAGCcgaTTT

851 ATAACGGTGT AAGGCAGGTA AGAACCTTTG AATATATAGC AGGCTGTATA

901 GAAGGCGGAA GAACCGGATG CGCCTGCTAT TCGCaTCAAG GGACGGCATt

951 gaAAGAAGTG ACGGaGTTGA TGTGc

aAgG aCTATGTaAA AAacGGCTTG

1001 CCGTTTAACC CaTACAAAGA AGAAAGCCAA GGGCAGGAAG TTCAGCAAAG

1051 CGCGCAgCAA CATTCGGACA GGGCG

CAAG TTGCCACATT GGGCGGAAAA

1101 CCGTAGCAGA ACCTAATGTA CGATAATTGG GAAGAACGCG GGAAACCGTT

1151 TGAAGGAATC GG

CGGGGGC GTGGTCGGAT CGGCAAACTG A

它对应于氨基酸序列<SEQ ID 320；ORF84>：

1 MAEICLITGT PGSGKTLKMV SMMANDEMFK PDEKAIRRKV FTNIKGLKIP

51 HTYIETDAKK LPKSTDEQLS AHDMYEWIKK PENIGSIVIV DEAQDVWPAR

101 SAGSKIPENV QWLNTHRHQG IDIFVLTQGP KLLDQNLRTL VRKHYHIASN

151 KMGMRTLLEW KICADDPVKM ASSAFSSIYT LDKKVYDLYX XAEVHTVNKV

201 KRSKWFYTLP VIVLLIPVFV GLSYKMLSSY GKKQEEPAAQ ESAATEQQAV

251 LPDKTEGEPV NNGNLTADMF VPTLSEKPXS KPIYNGVRQV RTFEYIAGCI

301 EGGRTGCACY SHQGTALKEV TELMCKDYVK NGLPFNPYKE ESQGQEVQQS

351 AQQHSDRAQV ATLGGKPXQN LMYDNWEERG KPFEGIGGGV VGSAN*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 321>：

1 ATGGCAGAGA TCTGTTTGAT AACCGGCACG CCCGGTTCAG GGAAAACATT

51 AAAAATGGTT TCCATGATGG CGAATGATGA AATGTTTAAG CCTGATGAAA

101 ACGGCATACG CCGTAAAGTA TTTACGAACA TAAAAGGCTT GAAAATACCG

151 CACACCTACA TAGAAACGGA CGCAAAAAAG CTGCCGAAAT CGACAGATGA

201 GCAGCTTTCG GCGCATGATA TGTACGAATG GATAAAGAAG CCCGAAAATA

251 TCGGGTCTAT TGTCATTGTA GATGAAGCTC AAGACGTATG GCCGGCACGC

301 TCGGCAGGTT CAAAAATCCC TGAAAATGTC CAATGGCTGA ATACGCACAG

351 ACATCAGGGC ATTGATATAT TTGTTTTGAC TCAAGGTCCT AAGCTTCTAG

401 ATCAAAATCT TAGAACGCTT GTACGGAAAC ATTACCACAT CGCTTCAAAC

451 AAGATGGGTA TGCGTACGCT TTTAGAATGG AAAATATGCG CGGACGATCC

501 CGTAAAAATG GCATCAAGCG CATTCTCCAG TATCTATACA CTGGATAAAA

551 AAGTTTATGA CTTGTACGAA TCAGCGGAAG TTCATACCGT AAATAAGGTC

601 AAGCGGTCAA AGTGGTTTTA CACTCTGCCA GTAATAGTAT TGCTGATTCC

651 CGTGTTTGTC GGCCTGTCCT ATAAAATGTT GAGCAGTTAC GGAAAAAAAC

701 AGGAAGAACC CGCAGCACAA GAATCGGCGG CAACAGAACA GCAGGCAGTA

751 CTTCCGGATA AAACAGAAGG CGAGCCGGTA AATAACGGCA ACCTTACCGC

801 AGATATGTTT GTTCCGACAT TGTCCGAAAA ACCCGAAAGC AAGCCGATTT

851 ATAACGGTGT AAGGCAGGTA AGAACCTTTG AATATATAGC AGGCTGTATA

901 GAAGGCGGAA GAACCGGATG CGCCTGCTAT TCGCATCAAG GGACGGCATT

951 GAAAGAAGTG ACGGAGTTGA TGTGCAAGGA CTATGTAAAA AACGGCTTGC

1001 CGTTTAACCC ATACAAAGAA GAAAGCCAAG GGCAGGAAGT TCAGCAAAGC

1051 GCGCAGCAAC ATTCGGACAG GGCGCAAGTT GCCACATTGG GCGGAAAACC

1101 GTAGCAGAAC CTAATGTACG ATAATTGGGA AGAACGCGGG AAACCGTTTG

1151 AAGGAATCGG CGGGGGCGTG GTCGGATCGG CAAACTGA

它对应于氨基酸序列<SEQ ID 322；ORF84-1>：

1 MAEICLITGT PGSGKTLKMV SMMANDEMFK PDENGIRRKV FTNIKGLKIP

51 HTYIETDAKK LPKSTDEQLS AHDMYEWIKK PENIGSIVIV DEAQDVWPAR

101 SAGSKIPENV QWLNTHRHQG IDIFVLTQGP KLLDQNLRTL VRKHYHIASN

151 KMGMRTLLEW KICADDPVKM ASSAFSSIYT LDKKVYDLYE SAEVHTVNKV

201 KRSKW FYTLP VIVLLIPVFV GLSYKMLSSY GKKQEEPAAQ ESAATEQQAV

251 LPDKTEGEPV NNGNLTADMF VPTLSEKPES KPIYNGVRQV RTFEYIAGCI

301 EGGRTGCACY SHQGTALKEV TELMCKDYVK NGLPFNPYKE ESQGQEVQQS

351 AQQHSDRAQV ATLGGKP*QN LMYDNWEERG KPFEGIGGGV VGSAN*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF84与脑膜炎奈瑟球菌菌株A的ORF(ORF84a)在重叠的395个氨基酸内有93.9％的相同性：

10 20 30 40 50 60

orf84.pep MAEICLITGTPGSGKTLKMVSMMANDEMFKPDEKAIRRKVFTNIKGLKIPHTYIETDAKK

|||||||||||||||||||||||||||||||||::|||||||||||||||||||||||||

orf84a MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGIRRKVFTNIKGLKIPHTYIETDAKK

10 20 30 40 50 60

70 80 90 100 110 120

orf84.pep LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf84a LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

70 80 90 100 110 120

130 140 150 160 170 180

orf84.pep IDIFVLTQGPKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT

||||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf84a IDIFVLTQGSKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT

130 140 150 160 170 180

190 200 210 220 230 240

orf84.pep LDKKVYDLYXXAEVHTVNKVKRSKW FYTLPVIVLLIPVFVGLSYKMLSSYGKKQEEPAAQ

||||||||| |||||||||||||||||||||:|||||||||||||||||||||||||||

orf84a LDKKVYDLYESAEVHTVNKVKRSKW FYTLPVI ILLIPVFVGLSYKMLSSYGKKQEEPAAQ

190 200 210 220 230 240

250 260 270 280 290 300

orf84.pep ESAATEQQAVLPDKTEGEPVNNGNLTADMFVPTLSEKPXSKPIYNGVRQVRTFEYIAGCI

||||||:|||: |||||||||||||||||||||||||| ||||||||||||||||||||:

orf84a ESAATEHQAVFQDKTEGEPVNNGNLTADMFVPTLSEKPESKPIYNGVRQVRTFEYIAGCV

250 260 270 280 290 300

310 320 330 340 350 360

orf84.pep EGGRTGCACYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV

|||||||:|||||||||||:|: |||||::||||||||||||||::|||| |:|||| ||

orf84a EGGRTGCTCYSHQGTALKEITKEMCKDYARNGLPFNPYKEESQGRDVQQSEQHHSDRPQV

310 320 330 340 350 360

370 380 390

orf84.pep ATLGGKPXQNLMYDNWEERGKPFEGIGGGVVGSANX

||||||| ||||||||:|||||||||||||||||||

orf84a ATLGGKPWQNLMYDNWQERGKPFEGIGGGVVGSANX

370 380 390

全长ORF84a核苷酸序列<SEQ ID 323>是：

1 ATGGCAGAGA TCTGTTTGAT AACCGGCACG CCCGGTTCAG GGAAAACATT

51 AAAAATGGTT TCCATGATGG CAAACGATGA AATGTTTAAG CCGGATGAAA

101 ACGGCATACG CCGTAAAGTA TTTACGAACA TCAAAGGCTT GAAGATACCG

151 CACACCTACA TAGAAACGGA CGCGAAAAAG CTGCCGAAAT CGACAGATGA

201 GCAGCTTTCG GCGCATGATA TGTACGAATG GATAAAGAAG CCCGAAAATA

251 TCGGGTCTAT TGTCATTGTA GATGAAGCTC AAGACGTATG GCCGGCACGC

301 TCGGCAGGTT CAAAAATCCC TGAAAATGTC CAATGGCTGA ATACGCACAG

351 ACATCAGGGC ATTGATATAT TTGTTTTGAC TCAAGGCTCT AAGCTTCTAG

401 ATCAAAATCT TAGAACGCTT GTACGGAAAC ATTACCACAT CGCTTCAAAC

451 AAGATGGGTA TGCGTACGCT TTTAGAATGG AAAATATGCG CGGACGATCC

501 CGTAAAAATG GCATCAAGCG CATTCTCCAG TATCTATACA CTGGATAAAA

551 AAGTTTATGA CTTGTACGAA TCAGCGGAAG TTCATACCGT AAATAAGGTC

601 AAGCGGTCAA AATGGTTTTA TACTCTGCCA GTAATAATAT TGCTGATTCC

651 CGTTTTTGTC GGCCTGTCCT ATAAAATGTT AAGTAGTTAT GGAAAAAAAC

701 AGGAAGAACC CGCAGCACAA GAATCGGCGG CAACAGAACA TCAGGCAGTA

751 TTTCAGGATA AAACAGAAGG CGAGCCGGTA AACAACGGTA ACCTTACCGC

801 AGATATGTTT GTTCCGACAT TGTCCGAAAA ACCCGAAAGC AAGCCGATTT

851 ATAACGGTGT AAGGCAGGTA AGAACCTTTG AATATATAGC AGGCTGTGTA

901 GAAGGCGGAA GAACCGGATG CACATGCTAT TCGCATCAAG GGACGGCATT

951 GAAAGAAATT ACAAAGGAAA TGTGCAAGGA TTACGCAAGA AACGGATTGC

1001 CGTTTAACCC ATATAAAGAA GAAAGCCAAG GGCGGGATGT CCAGCAAAGT

1051 GAGCAGCACC ATTCGGACAG ACCGCAAGTT GCCACGTTGG GCGGAAAGCC

1101 GTGGCAAAAT CTTATGTATG ATAATTGGCA GGAGCGCGGA AAACCGTTTG

1151 AAGGAATCGG CGGGGGCGTG GTCGGATCGG CAAACTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 324>：

1 MAEICLITGT PGSGKTLKMV SMMANDEMFK PDENGIRRKV FTNIKGLKIP

51 HTYIETDAKK LPKSTDEQLS AHDMYEWIKK PENIGSIVIV DEAQDVWPAR

101 SAGSKIPENV QWLNTHRHQG IDIFVLTQGS KLLDQNLRTL VRKHYHIASN

151 KMGMRTLLEW KICADDPVKM ASSAFSSIYT LDKKVYDLYE SAEVHTVNKV

201 KRSKW FYTLP VIILLIPVFV GLSYKMLSSY GKKQEEPAAQ ESAATEHQAV

251 FQDKTEGEPV NNGNLTADMF VPTLSEKPES KPIYNGVRQV RTFEYIAGCV

301 EGGRTGCTCY SHQGTALKEI TKEMCKDYAR NGLPFNPYKE ESQGRDVQQS

351 EQHHSDRPQV ATLGGKPWQN LMYDNWQERG KPFEGIGGGV VGSAN*

ORF84a和ORF84-1在395个氨基酸的重叠区内有95.2％的相同性：

10 20 30 40 50 60

orf84a.pep MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGIRRKVFTNIKGLKIPHTYIETDAKK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf84-1 MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGIRRKVFTNIKGLKIPHTYIETDAKK

10 20 30 40 50 60

70 80 90 100 110 120

orf84a.pep LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf84-1 LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

70 80 90 100 110 120

130 140 150 160 170 180

orf84a.pep IDIFVLTQGSKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT

||||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf84-1 IDIFVLTQGPKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT

130 140 150 160 170 180

190 200 210 220 230 240

orf84a.pep LDKKVYDLYESAEVHTVNKVKRSKWFYTLPVIILLIPVFVGLSYKMLSSYGKKQEEPAAQ

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf84-1 LDKKVYDLYESAEVHTVNKVKRSKWFYTLPVIVLLIPVFVGLSYKMLSSYGKKQEEPAAQ

190 200 210 220 230 240

250 260 270 280 290 300

orf84a.pep ESAATEHQAVFQDKTEGEPVNNGNLTADMFVPTLSEKPESKPIYNGVRQVRTFEYIAGCV

||||||:|||: |||||||||||||||||||||||||||||||||||||||||||||||:

orf84-1 ESAATEQQAVLPDKTEGEPVNNGNLTADMFVPTLSEKPESKPIYNGVRQVRTFEYIAGCI

250 260 270 280 290 300

310 320 330 340 350 360

orf84a.pep EGGRTGCTCYSHQGTALKEITKEMCKDYARNGLPFNPYKEESQGRDVQQSEQHHSDRPQV

|||||||:|||||||||||:|:|||||::||||||||||||||::|||| |:|||| ||

orf84-1 EGGRTGCACYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV

310 320 330 340 350 360

370 380 390

orf84a.pep ATLGGKPWQNLMYDNWQERGKPFEGIGGGVVGSANX

||||||| ||||||||:|||||||||||||||||||

orf84-1 ATLGGKPXQNLMYDNWEERGKPFEGIGGGVVGSANX

370 380 390

与淋病奈瑟球菌的预计ORF的同源性

ORF84与淋病奈瑟球菌的预计ORF(ORF84.ng)在重叠的395个氨基酸内有94.2％的相同性：

orf84.pep MAEICLITGTPGSGKTLKMVSMMANDEMFKPDEKAIRRKVFTNIKGLKIPHTYIETDAKK 60

|||||||||||||||||||||||||||||||||:::||||||||||||||||:|||||||

orf84ng MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGVRRKVFTNIKGLKIPHTHIETDAKK 60

orf84.pep LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG 120

|||||||||||||||||||||||:|:||||||||||||||||||||||||||||||||||

orf84ng LPKSTDEQLSAHDMYEWIKKPENVGAIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG 120

orf84.pep IDIFVLTQGPKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT 180

|||||||||||||||||||||::|||||:||||:|||||||:||||||||||||||||||

orf84ng IDIFVLTQGPKLLDQNLRTLVKRHYHIAANKMGLRTLLEWKVCADDPVKMASSAFSSIYT 180

orf84.pep LDKKVYDLYXXAEVHTVNKVKRSKWFYTLPVIVLLIPVFVGLSYKMLSSYGKKQEEPAAQ 240

||||||||| ||:|||||||||||||:||||:||||:|||||||||:||||||||||||

orf84ng LDKKVYDLYESAEIHTVNKVKRSKWFYALPVIILLIPLFVGLSYKMLGSYGKKQEEPAAQ 240

orf84.pep ESAATEQQAVLPDKTEGEPVNNGNLTADMFVPTLSEKPXSKPIYNGVRQVRTFEYIAGCI 300

|||||||||||||||||| ||||||||||||||| ||| |||||||||||||||||||||

orf84ng ESAATEQQAVLPDKTEGESVNNGNLTADMFVPTLPEKPESKPIYNGVRQVRTFEYIAGCI 300

orf84.pep EGGRTGCACYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV 360

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf84ng EGGRTGCTCYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV 360

orf84.pep ATLGGKPXQNLMYDNWEERGKPFEGIGGGVVGSAN 395

||||||| |||||||||||||||||||||||||||

orf84ng ATLGGKPQQNLMYDNWEERGKPFEGIGGGVVGSAN 395

全长ORF84ng核苷酸序列<SEQ ID 325>是：

1 ATGGCAGAAA TCTGTTTGAT AACCGGCACG CCCGGTTCAG GGAAAACATT

51 AAAAATGGTT TCCATGATGG CAAACGATGA AATGTTTAAG CCAGATGAAA

101 ACGGCGTACG CCGTAAAGTA TTTACGAACA TCAAAGGTTT GAAGATACCG

151 CACACCCACA TAGAAACAGA CGCAAAGAAG CTGCCGAAAT CAACCGATGA

201 ACAGCTTTCG GCGCATGATA TGTATGAATG GATCAAGAAG CCTGAAAacg

251 tcggcgCAAT CGTTATTGTC GATGAGGCGC AAGACGTATG GCCCGCACGC

301 TccgCAGGTT CGAAAATCCC CGAAAACGTC CAATGGCTGA ACACACACAG

351 GCATCAGGGC ATAGATATAT TTGTATTGAC ACAAGGTCCT AAACTCTTAG

401 ATCAGAACTT GCGAACATTG GTTAAAAGAC ATTACCACAT TGCGGCCAAC

451 AAAATGGGTT TGCGTACCCT GCTTGAATGG AAAGTATGCG CGGATGACCC

501 GGTAAAAATG GCATCAAGTG CATTTTCCAG TATCTACACA CTGGATAAAA

551 AAGTTTATGA CTTGTACGAA TCCGCAGAAA TTCACACGGT AAACAAAGTC

601 AAGCGTTCAA AATGGTTTTA TGCATTGCCC GTCATCATAT TATTGATTCC

651 GCTATTTGTC GGTTTGTCTT ACAAAATGTT GGGCAGTTAC GGAAAAAAAC

701 AGGAAGAACC CGCAGCACAA GAATCGGCGG CAACAGAACA GCAGGCAGTA

751 CTTCCGGATA AAACAGAAGG AGAATCGGTG AATAACGGAA ACCTTACGGC

801 AGATATGTTT GTTCCGACAT TGCCCGAAAA ACCCGAAAGC AAGCCGATTT

851 ATAACGGTGT AAGGCAGGTA AGGACCTTTG AATATATAGC AGGCTGTATA

901 GAAGGCGGAA GAACCGGATG CACCTGCTAT TCGCATCAAG GGACGGCATT

951 GAAAGAAGTG ACGGAGTTGA TGTGCAAGGA CTATGTAAAA AACGGCTTGC

1001 CGTTTAACCC ATACAAAGAA GAAAGCCAAG GGCAGGAAGT TCAGCAAAGC

1051 GCGCAGCAAC ATTCGGACAG GGCGCAAGTT GCCACCTTGG GCGGAAAACC

1101 GCAGCAGAAC CTAATGTACG ACAATTGGGA AGAACGCGGG AAACCGTTTG

1151 AAGGAATCGG CGGGGGCGTG GTCGGATCGG CAAACTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 326>：

1 MAEICLIT

LKMV SMMANDEMFK PDENGVRRKV FTNIKGLKIP

51 HTHIETDAKK LPKSTDEQLS AHDMYEWIKK PENVGAIVIV DEAQDVWPAR

101 SAGSKIPENV QWLNTHRHQG IDIFVLTQGP KLLDQNLRTL VKRHYHIAAN

151 KMGLRTLLEW KVCADDPVKM ASSAFSSIYT LDKKVYDLYE SAEIHTVNKV

201 KRSKW FYALP VIILLIPLFV GLSYKMLGSY GKKQEEPAAQ ESAATEQQAV

251 LPDKTEGESV NNGNLTADMF VPTLPEKPES KPIYNGVRQV RTFEYIAGCI

301 EGGRTGCTCY SHQGTALKEV TELMCKDYVK NGLPFNPYKE ESQGQEVQQS

351 AQQHSDRAQV ATLGGKPQQN LMYDNWEERG KPFEGIGGGV VGSAN*

ORF84ng和ORF84-1在395个氨基酸的重叠区内有95.4％的相同性：

10 20 30 40 50 60

orf84-1.pep MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGIRRKVFTNIKGLKIPHTYIETDAKK

|||||||||||||||||||||||||||||||||||:||||||||||||||||:|||||||

orf84ng MAEICLITGTPGSGKTLKMVSMMANDEMFKPDENGVRRKVFTNIKGLKIPHTHIETDAKK

10 20 30 40 50 60

70 80 90 100 110 120

orf84-1.pep LPKSTDEQLSAHDMYEWIKKPENIGSIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

|||||||||||||||||||||||:|:||||||||||||||||||||||||||||||||||

orf84ng LPKSTDEQLSAHDMYEWIKKPENVGAIVIVDEAQDVWPARSAGSKIPENVQWLNTHRHQG

70 80 90 100 110 120

130 140 150 160 170 180

orf84-1.pep IDIFVLTQGPKLLDQNLRTLVRKHYHIASNKMGMRTLLEWKICADDPVKMASSAFSSIYT

|||||||||||||||||||||::|||||:||||:|||||||:||||||||||||||||||

orf84ng IDIFVLTQGPKLLDQNLRTLVKRHYHIAANKMGLRTLLEWKVCADDPVKMASSAFSSIYT

130 140 150 160 170 180

190 200 210 220 230 240

orf84-1.pep LDKKVYDLYESAEVHTVNKVKRSKWFYTLPVIVLLIPVFVGLSYKMLSSYGKKQEEPAAQ

|||||||||||||:|||||||||||||:||||:||||:|||||||||:||||||||||||

orf84ng LDKKVYDLYESAEIHTVNKVKRSKWFYALPVIILLIPLFVGLSYKMLGSYGKKQEEPAAQ

190 200 210 220 230 240

250 260 270 280 290 300

orf84-1.pep ESAATEQQAVLPDKTEGEPVNNGNLTADMFVPTLSEKPESKPIYNGVRQVRTFEYIAGCI

|||||||||||||||||| ||||||||||||||| |||||||||||||||||||||||||

orf84ng ESAATEQQAVLPDKTEGESVNNGNLTADMFVPTLPEKPESKPIYNGVRQVRTFEYIAGCI

250 260 270 280 290 300

310 320 330 340 350 360

orf84-1.pep EGGRTGCACYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf84ng EGGRTGCTCYSHQGTALKEVTELMCKDYVKNGLPFNPYKEESQGQEVQQSAQQHSDRAQV

310 320 330 340 350 360

370 380 390

orf84-1.pep ATLGGKPXQNLMYDNWEERGKPFEGIGGGVVGSANX

||||||| ||||||||||||||||||||||||||||

orf84ng ATLGGKPQQNLMYDNWEERGKPFEGIGGGVVGSANX

370 380 390

根据该分析结果(包括淋球菌蛋白中存在一个推定的跨膜结构域(单划线)，以及一个推定的ATP/GTP-结合位点基序A(P环，双划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例39

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 327>：

1 GTGGTTTTCC TGAATGCCGA CAACGGGATA TTGGTTCAGG ACTTGCCTTT

51 TGAAGTCAAA CTGAAAAAAT TCCATATCGA TTTTTACAAT ACGGGTATGC

101 CGCGTGATTT CGCCAGCGAT ATTGAAGTGA CGGACAAGGC AACCGGTGAG

151 AAACTCGAGC GCACCATCCG CGTGAACCAT CCTTTGACCT TGCACGGCAT

201 CACGATTTAT CAGGCGAGTT TTGCCGACGG CGGTTCGGAT TTGACATTCA

251 AGGCGTGGAA TTTGGGTGAT GCTTCGCGCG AGCCTGTCGT GTTGAAGGCA

301 ACATCCATAC ACCAGTTTCC GTTGGAAATT GGCAAACACA AATATCGTCT

351 TGAGTTCGAT CAGTTCACTT CTATGAATGT GGAGGACATG AGCGAGGGCG

401 CGGAACGGGA AAAAAGCCTG AAATCCACGC TGCCCGATGT CCGCGCCGTT

451 ACTCAGGAAG GTCACAAATA CACCAAT... .......... .....TACCG

501 TATCCGTGAT GCGCCAGGCC AGGCGGTCGA ATATAAAAAC TATATGCTGC

551 CGGTTTTGCA GGAACAGGAT TATTTTTGGA TTACCGGCAC GCGCAGCGC.

601 TTGCAGCAGC AATACCGCTG GCTGCGTATC CCCTTGGACA AGCAGTTGAA

651 AGCGGACACC TTTATGGCAT TGCGTGAGTT TTTGAAAGAT GGGGAAGGGC

701 GCAAACGTCT .GTTGCCGAC GCAACCAAAG GCGCACCTGC CGAAATCCGC

751 GAACAATTCA TGCTGGCTGC GGAAAACACG CTGAACATCT TTGCACAAAA

801 AGGCTATTTG GGATTGGACG AATTTATTAC GTCCAATATC CCGAAAGAGC

851 AGCAGGATAA GATGCAGGGC TATTTCTACG AAATGCTTTA CGGCGTGATG

901 AACGCTGCTT TGGATGAAAC CAT.ACCCGG TACGGCTTGC CCGAATGGCA

951 GCAGGATGAA GCGCGGAATC GTTTCCTGCT GCACAGTATG GATGCGTACA

1001 CGGGTTTGAC CGAATATCCC GCGCCTATGC TGCTGCAACT TGATGGGTTT

1051 TCCGAGGTGC GTTCGTCGGG TTTGCAGATG ACCCGTTCCC C.GGTCCGCT

1101 TTTGGTCTAT CTC...

它对应于氨基酸序列<SEQ ID 328；ORF88>：

1 MVFLNADNGI LVQDLPFEVK LKKFHIDFYN TGMPRDFASD IEVTDKATGE

51 KLERTIRVNH PLTLHGITIY QASFADGGSD LTFKAWNLGD ASREPVVLKA

101 TSIHQFPLEI GKHKYRLEFD QFTSMNVEDM SEGAEREKSL KSTLPDVRAV

151 TQEGHKYTNX XXXXXYRIRD APGQAVEYKN YMLPVLQEQD YFWITGTRSX

201 LQQQYRWLRI PLDKQLKADT FMALREFLKD GEGRKRXVAD ATKGAPAEIR

251 EQFMLAAENT LNIFAQKGYL GLDEFITSNI PKEQQDKMQG YFYEMLYGVM

301 NAALDETXTR YGLPEWQQDE ARNRFLLHSM DAYTGLTEYP APMLLQLDGF

351 SEVRSSGLQM TRSXGPLLVY L...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 329>：

1 ATGAGTAAAT CCCGTAGATC TCCCCCACTT CTTTCCCGTC CGTGGTTCGC

51 TTTTTTCAGC TCCATGCGCT TTGCAGTCGC TTTGCTCAGT CTGCTGGGTA

101 TTGCATCGGT TATCGGTACG GTGTTGCAGC AAAACCAGCC GCAGACGGAT

151 TATTTGGTCA AATTCGGATC GTTTTGGGCG CAGATTTTTG GTTTTCTGGG

201 ACTGTATGAC GTCTATGCTT CGGCATGGTT TGTCGTTATC ATGATGTTTT

251 TGGTGGTTTC TACCAGTTTG TGCCTGATTC GCAATGTGCC GCCGTTCTGG

301 CGCGAAATGA AGTCTTTTCG GGAAAAGGTT AAAGAAAAAT CTCTGGCGGC

351 GATGCGCCAT TCTTCGCTGT TGGATGTAAA AATTGCGCCC GAGGTTGCCA

401 AACGTTATCT GGAAGTACAA GGTTTTCAGG GAAAAACCAT TAACCGTGAA

451 GACGGGTCGG TTCTGATTGC CGCCAAAAAA GGCACAATGA ACAAATGGGG

501 CTATATCTTT GCCCATGTTG CTTTGATTGT CATTTGCCTG GGCGGGTTGA

551 TAGACAGTAA CCTGCTGTTG AAACTGGGTA TGCTGACCGG TCGGATTGTT

601 CCGGACAATC AGGCGGTTTA TGCCAAGGAT TTCAAGCCCG AAAGTATTTT

651 GGGTGCGTCC AATCTCTCAT TTAGGGGCAA CGTCAATATT TCCGAGGGGC

701 AGAGTGCGGA TGTGGTTTTC CTGAATGCCG ACAACGGGAT ATTGGTTCAG

751 GACTTGCCTT TTGAAGTCAA ACTGAAAAAA TTCCATATCG ATTTTTACAA

801 TACGGGTATG CCGCGTGATT TCGCCAGCGA TATTGAAGTG ACGGACAAGG

851 CAACCGGTGA GAAACTCGAG CGCACCATCC GCGTGAACCA TCCTTTGACC

901 TTGCACGGCA TCACGATTTA TCAGGCGAGT TTTGCCGACG GCGGTTCGGA

951 TTTGACATTC AAGGCGTGGA ATTTGGGTGA TGCTTCGCGC GAGCCTGTCG

1001 TGTTGAAGGC AACATCCATA CACCAGTTTC CGTTGGAAAT TGGCAAACAC

1051 AAATATCGTC TTGAGTTCGA TCAGTTCACT TCTATGAATG TGGAGGACAT

1101 GAGCGAGGGC GCGGAACGGG AAAAAAGCCT GAAATCCACG CTGAACGATG

1151 TCCGCGCCGT TACTCAGGAA GGTAAAAAAT ACACCAATAT CGGCCCTTCC

1201 ATTGTTTACC GTATCCGTGA TGCGGCAGGG CAGGCGGTCG AATATAAAAA

1251 CTATATGCTG CCGGTTTTGC AGGAACAGGA TTATTTTTGG ATTACCGGCA

1301 CGCGCAGCGG CTTGCAGCAG CAATACCGCT GGCTGCGTAT CCCCTTGGAC

1351 AAGCAGTTGA AAGCGGACAC CTTTATGGCA TTGCGTGAGT TTTTGAAAGA

1401 TGGGGAAGGG CGCAAACGTC TGGTTGCCGA CGCAACCAAA GGCGCACCTG

1451 CCGAAATCCG CGAACAATTC ATGCTGGCTG CGGAAAACAC GCTGAACATC

1501 TTTGCACAAA AAGGCTATTT GGGATTGGAC GAATTTATTA CGTCCAATAT

1551 CCCGAAAGAG CAGCAGGATA AGATGCAGGG CTATTTCTAC GAAATGCTTT

1601 ACGGCGTGAT GAACGCTGCT TTGGATGAAA CCATACGCCG GTACGGCTTG

1651 CCCGAATGGC AGCAGGATGA AGCGCGGAAT CGTTTCCTGC TGCACAGTAT

1701 GGATGCGTAC ACGGGTTTGA CCGAATATCC CGCGCCTATG CTGCTGCAAC

1751 TTGATGGGTT TTCCGAGGTG CGTTCGTCGG GTTTGCAGAT GACCCGTTCC

1801 CCGGGTGCGC TTTTGGTCTA TCTCGGCTCG GTGCTGTTGG TATTGGGTAC

1851 GGTATTGATG TTTTATGTGC GCGAAAAACG GGCGTGGGTA TTGTTTTCAG

1901 ACGGCAAAAT CCGTTTTGCC ATGTCTTCGG CCCGCAGCGA ACGGGATTTG

1951 CAGAAGGAAT TTCCAAAACA CGTCGAGAGT CTGCAACGGC TCGGCAAGGA

2001 CTTGAATCAT GACTGA

它对应于氨基酸序列<SEQ ID 330；ORF88-1>：

1 MSKSRRSPPL LSRPWFAFFS SMRFA VALLS LLGIASVIGT VLQQNQPQTD

51 YLVKFGSFWA QIFGFLGLYD VYASAW FVVI MMFLVVSTSL CLIRNVPPFW

101 REMKSFREKV KEKSLAAMRH SSLLDVKIAP EVAKRYLEVQ GFQGKTINRE

151 DGSVLIAAKK GTMNKWG YIF AHVALIVICL GGLIDSNLLL KLGMLTGRIV

201 PDNQAVYAKD FKPESILGAS NLSFRGNVNI SEGQSADVVF LNADNGILVQ

251 DLPFEVKLKK FHIDFYNTGM PRDFASDIEV TDKATGEKLE RTIRVNHPLT

301 LHGITIYQAS FADGGSDLTF KAWNLGDASR EPVVLKATSI HQFPLEIGKH

351 KYRLEFDQFT SMNVEDMSEG AEREKSLKST LNDVRAVTQE GKKYTNIGPS

401 IVYRIRDAAG QAVEYKNYML PVLQEQDYFW ITGTRSGLQQ QYRWLRIPLD

451 KQLKADTFMA LREFLKDGEG RKRLVADATK GAPAEIREQF MLAAENTLNI

501 FAQKGYLGLD EFITSNIPKE QQDKMQGYFY EMLYGVMNAA LDETIRRYGL

551 PEWQQDEARN RFLLHSMDAY TGLTEYPAPM LLQLDGFSEV RSSGLQMTRS

601 PGA LLVYLGS VLLVLGTVLM FYVREKRAWV LFSDGKIRFA MSSARSERDL

651 QKEFPKHVES LQRLGKDLNH D*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF88与脑膜炎奈瑟球菌菌株A的ORF(ORF88a)在重叠的371个氨基酸内有95.7％的相同性：

10 20 30

orf88.pep MVFLNADNGILVQDLPFEVKLKKFHIDFYN

:|||||||||||||||||||||||||||||

orf88a AKDFKPESILGASNLSFRGNVNISEGQSADVVFLNADNGILVQDLPFEVKLKKFHIDFYN

210 220 230 240 250 260

40 50 60 70 80 90

orf88.pep TGMPRDFASDIEVTDKATGEKLERTIRVNHPLTLHGITIYQASFADGGSDLTFKAWNLGD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88a TGMPRDFASDIEVTDKATGEKLERTIRVNHPLTLHGITIYQASFADGGSDLTFKAWNLGD

270 280 290 300 310 320

100 110 120 130 140 150

orf88.pep ASREPVVLKATSIHQFPLEIGKHKYRLEFDQFTSMNVEDMSEGAEREKSLKSTLPDVRAV

|||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||

orf88a ASREPVVLKATSIHQFPLEIGKHKYRLEFDQFTSMNVEDMSEGAEREKSLKSTLNDVRAV

330 340 350 360 370 380

160 170 180 190 200 210

orf88.pep TQEGHKYTNXXXXXXYRIRDAPGQAVEYKNYMLPVLQEQDYFWITGTRSXLQQQYRWLRI

||||:|||| |||||| ||||||||||||||||||||||||||| ||||||||||

orf88a TQEGKKYTNIGPSIVYRIRDAAGQAVEYKNYMLPVLQEQDYFWITGTRSGLQQQYRWLRI

390 400 410 420 430 440

220 230 240 250 260 270

orf88.pep PLDKQLKADTFMALREFLKDGEGRKRXVADATKGAPAEIREQFMLAAENTLNIFAQKGYL

|||||||||||||||||||||||||| |||||||||||||||||||||||||||||||||

orf88a PLDKQLKADTFMALREFLKDGEGRKRLVADATKGAPAEIREQFMLAAENTLNIFAQKGYL

450 460 470 480 490 500

280 290 300 310 320 330

orf88.pep GLDEFITSNIPKEQQDKMQGYFYEMLYGVMNAALDETXTRYGLPEWQQDEARNRFLLHSM

||||||||||||||||||||||||||||||||||||| |||||||||||||||||||||

orf88a GLDEFITSNIPKEQQDKMQGYFYEMLYGVMNAALDETIRRYGLPEWQQDEARNRFLLHSM

510 520 530 540 550 560

340 350 360 370

orf88.pep DAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRSXGP LLVYL

||||||||||||||||||||||||||||||||| | |||||

orf88a DAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRSPGA LLVYLGSVLLVLGTVLMFYVREKR

570 580 590 600 610 620

orf88a AWVLFSDGKIRFAMSSARSERDLQKEFPKHVESLQRLGKDLNHDX

630 640 650 660 670

全长ORF88a核苷酸序列<SEQ ID 331>是：

1 ATGAGTAAAT CCCGTAGATC TCCCCCACTT CTTTCCCGTC CGTGGTTCGC

51 TTTTTTCAGC TCCATGCGCT TTGCGGTCGC TTTGCTCAGT CTGCTGGGTA

101 TTGCATCGGT TATCGGTACG GTGTTGCAGC AAAACCAGCC GCAGACGGAT

151 TATTTGGTCA AATTCGGATC GTTTTGGGCG CAGATTTTTG GTTTTCTGGG

201 ACTGTATGAC GTCTATGCTT CGGCATGGTT TGTCGTTATC ATGATGTTTT

251 TGGTGGTTTC TACCAGTTTG TGCCTGATTC GCAATGTGCC GCCGTTCTGG

301 CGCGAAATGA AGTCTTTTCG GGAAAAGGTT AAAGAAAAAT CTCTGGCGGC

351 GATGCGCCAT TCTTCGCTGT TGGATGTAAA AATTGCGCCC GAGGTTGCCA

401 AACGTTATCT GGAAGTACAA GGTTTTCAGG GAAAAACCAT TAACCGTGAA

451 GACGGGTCGG TTCTGATTGC CGCCAAAAAA GGCACAATGA ACAAATGGGG

501 CTATATCTTT GCCCATGTTG CTTTGATTGT CATTTGCCTG GGCGGGTTGA

551 TAGACAGTAA CCTGCTGTTG AAACTGGGTA TGCTGACCGG TCGGATTGTT

601 CCGGACAATC AGGCGGTTTA TGCCAAGGAT TTCAAGCCCG AAAGTATTTT

651 GGGTGCGTCC AATCTCTCAT TTAGGGGCAA CGTCAATATT TCCGAGGGGC

701 AGAGTGCGGA TGTGGTTTTC CTGAATGCCG ACAACGGGAT ATTGGTTCAG

751 GACTTGCCTT TTGAAGTCAA ACTGAAAAAA TTCCATATCG ATTTTTACAA

801 TACGGGTATG CCGCGCGATT TTGCCAGTGA TATTGAAGTA ACGGATAAGG

851 CAACCGGTGA GAAACTCGAG CGCACCATCC GCGTGAACCA TCCTTTGACC

901 TTGCACGGCA TCACGATTTA TCAGGCGAGT TTTGCCGACG GCGGTTCGGA

951 TTTGACATTC AAGGCGTGGA ATTTGGGTGA TGCTTCGCGC GAGCCTGTCG

1001 TGTTGAAGGC AACATCCATA CACCAGTTTC CGTTGGAAAT TGGCAAACAC

1051 AAATATCGTC TTGAGTTCGA TCAGTTTACT TCTATGAATG TGGAGGACAT

1101 GAGCGAGGGC GCGGAACGGG AAAAAAGCCT GAAATCCACG CTGAACGATG

1151 TCCGCGCCGT TACTCAGGAA GGTAAAAAAT ACACCAATAT CGGCCCTTCC

1201 ATTGTTTACC GTATCCGTGA TGCGGCAGGG CAGGCGGTCG AATATAAAAA

1251 CTATATGCTG CCGGTTTTGC AGGAACAGGA TTATTTTTGG ATTACCGGCA

1301 CGCGCAGCGG CTTGCAGCAG CAATACCGCT GGCTGCGTAT CCCCTTGGAC

1351 AAGCAGTTGA AAGCGGACAC CTTTATGGCA TTGCGTGAGT TTTTGAAAGA

1401 TGGGGAAGGG CGCAAACGTC TGGTTGCCGA CGCAACCAAA GGCGCACCTG

1451 CCGAAATCCG CGAACAATTC ATGCTGGCTG CGGAAAACAC GCTGAACATC

1501 TTTGCACAAA AAGGCTATTT GGGATTGGAC GAATTTATTA CGTCCAATAT

1551 CCCGAAAGAG CAGCAGGATA AGATGCAGGG CTATTTCTAC GAAATGCTTT

1601 ACGGCGTGAT GAACGCTGCT TTGGATGAAA CCATACGCCG GTACGGCTTG

1651 CCCGAATGGC AGCAGGATGA AGCGCGGAAT CGTTTCCTGC TGCACAGTAT

1701 GGATGCGTAC ACGGGTTTGA CCGAATATCC CGCGCCTATG CTGCTGCAAC

1751 TTGATGGGTT TTCCGAGGTG CGTTCGTCGG GTTTGCAGAT GACCCGTTCC

1801 CCGGGTGCGC TTTTGGTCTA TCTCGGCTCG GTGCTGTTGG TATTGGGTAC

1851 GGTATTGATG TTTTATGTGC GCGAAAAACG GGCGTGGGTA TTGTTTTCAG

1901 ACGGCAAAAT CCGTTTTGCC ATGTCTTCGG CCCGCAGCGA ACGGGATTTG

1951 CAGAAGGAAT TTCCAAAACA CGTCGAGAGT CTGCAACGGC TCGGCAAGGA

2001 CTTGAATCAT GACTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 332>：

1 MSKSRRSPPL LSRPWFAFFS SMRFA VALLS LLGIASVIGT VLQQNQPQTD

51 YLVKFGSFWA QIFGFLGLYD VYASAW FVVI MMFLVVSTSL CLIRNVPPFW

101 REMKSFREKV KEKSLAAMRH SSLLDVKIAP EVAKRYLEVQ GFQGKTINRE

151 DGSVLIAAKK GTMNKWG YIF AHVALIVICL GGLIDSNLLL KLGMLTGRIV

201 PDNQAVYAKD FKPESILGAS NLSFRGNVNI SEGQSADVVF LNADNGILVQ

251 DLPFEVKLKK FHIDFYNTGM PRDFASDIEV TDKATGEKLE RTIRVNHPLT

301 LHGITIYQAS FADGGSDLTF KAWNLGDASR EPVVLKATSI HQFPLEIGKH

351 KYRLEFDQFT SMNVEDMSEG AEREKSLKST LNDVRAVTQE GKKYTNIGPS

401 IVYRIRDAAG QAVEYKNYML PVLQEQDYFW ITGTRSGLQQ QYRWLRIPLD

451 KQLKADTFMA LREFLKDGEG RKRLVADATK GAPAEIREQF MLAAENTLNI

501 FAQKGYLGLD EFITSNIPKE QQDKMQGYFY EMLYGVMNAA LDETIRRYGL

551 PEWQQDEARN RFLLHSMDAY TGLTEYPAPM LLQLDGFSEV RSSGLQMTRS

601 PGA LLVYLGS VLLVLGTVLM FYVREKRAWV LFSDGKIRFA MSSARSERDL

651 QKEFPKHVES LQRLGKDLNH D*

ORF88a和ORF88-1在671个氨基酸的重叠区内有100.0％的相同性：

orf88a.pep MSKSRRSPPLLSRPWFAFFSSMRFAVALLSLLGIASVIGTVLQQNQPQTDYLVKFGSFWA 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 MSKSRRSPPLLSRPWFAFFSSMRFAVALLSLLGIASVIGTVLQQNQPQTDYLVKFGSFWA 60

orf88a.pep QIFGFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 QIFGFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 120

orf88a.pep SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWGYIFAHVALIVICL 180

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWGYIFAHVALIVICL 180

orf88a.pep GGLIDSNLLLKLGMLTGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVF 240

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 GGLIDSNLLLKLGMLTGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVF 240

orf88a.pep LNADNGILVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNHPLT 300

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 LNADNGILVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNHPLT 300

orf88a.pep LHGITIYQASFADGGSDLTFKAWNLGDASREPVVLKATSIHQFPLEIGKHKYRLEFDQFT 360

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 LHGITIYQASFADGGSDLTFKAWNLGDASREPVVLKATSIHQFPLEIGKHKYRLEFDQFT 360

orf88a.pep SMNVEDMSEGAEREKSLKSTLNDVRAVTQEGKKYTNIGPSIVYRIRDAAGQAVEYKNYML 420

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 SMNVEDMSEGAEREKSLKSTLNDVRAVTQEGKKYTNIGPSIVYRIRDAAGQAVEYKNYML 420

orf88a.pep PVLQEQDYFWITGTRSGLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRLVADATK 480

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 PVLQEQDYFWITGTRSGLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRLVADATK 480

orf88a.pep GAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKEQQDKMQGYFYEMLYGVMNAA 540

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 GAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKEQQDKMQGYFYEMLYGVMNAA 540

orf88a.pep LDETIRRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRS 600

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 LDETIRRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRS 600

orf88a.pep PGALLVYLGSVLLVLGTVLMFYVREKRAWVLFSDGKIRFAMSSARSERDLQKEFPKHVES 660

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88-1 PGALLVYLGSVLLVLGTVLMFYVREKRAWVLFSDGKIRFAMSSARSERDLQKEFPKHVES 660

orf88a.pep LQRLGKDLNHD 672

|||||||||||

orf88-1 LQRLGKDLNHD 672

与淋病奈瑟球菌的预计ORF的同源性

ORF88与淋病奈瑟球菌的预计ORF(ORF88.ng)在重叠的371个氨基酸内有93.8％的相同性：

orf88.pep MVFLNADNGILVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNH 60

|||||||||:||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng MVFLNADNGMLVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNH 60

orf88.pep PLTLHGITIYQASFADGGSDLTFKAWNLGDASREPVVLKATSIHQFPLEIGKHKYRLEFD 120

|||||||||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf88ng PLTLHGITIYQASFADGGSDLTFKAWNLRDASREPVVLKATSIHQFPLEIGKHKYRLEFD 120

orf88.pep QFTSMNVEDMSEGAEREKSLKSTLPDVRAVTQEGHKYTNXXXXXXYRIRDAPGQAVEYKN 180

|||||||||||||||||||||||| |||||||||:|||| |||||| ||||||||

orf88ng QFTSMNVEDMSEGAEREKSLKSTLNDVRAVTQEGKKYTNIGPSIVYRIRDAAGQAVEYKN 180

orf88.pep YMLPVLQEQDYFWITGTRSXLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRXVAD 240

||||:||::||||:||||| |||||||||||||||||||||||||||||||||||| |||

orf88ng YMLPILQDKDYFWLTGTRSGLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRLVAD 240

orf88.pep ATKGAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKEQQDKMQGYFYEMLYGVM 300

||| |||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf88ng ATKDAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKGQQDKMQGYFYEMLYGVM 300

orf88.pep NAALDETXTRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQM 360

||||||| |||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng NAALDETIRRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQM 360

orf88.pep TRSXGPLLVYL 371

||| | |||||

orf88ng TRSPGALLVYLGSVLLVLGTVFMFYVPKKRAWVLFSNXKIRFAMSSARSERDLQKEFPKH 420

预计ORF88ng核苷酸序列<SEQ ID 333>编码的蛋白质具有氨基酸序列<SEQ ID334>：

1 MVFLNADNGM LVQDLPFEVK LKKFHIDFYN TGMPRDFASD IEVTDKATGE

51 KLERTIRVNH PLTLHGITIY QASFADGGSD LTFKAWNLRD ASREPVVLKA

101 TSIHQFPLEI GKHKYRLEFD QFTSMNVEDM SEGAEREKSL KSTLNDVRAV

151 TQEGKKYTNI GPSIVYRIRD AAGQAVEYKN YMLPILQDKD YFWLTGTRSG

201 LQQQYRWLRI PLDKQLKADT FMALREFLKD GEGRKRLVAD ATKDAPAEIR

251 EQFMLAAENT LNIFAQKGYL GLDEFITSNI PKGQQDKMQG YFYEMLYGVM

301 NAALDETIRR YGLPEWQQDE ARNRFLLHSM DAYTGLTEYP APMLLQLDGF

351 SEVRSSGLQM TRSPGA LLVY LGSVLLVLGT VFMFYVPKKR AWVLFSNXKI

401 RFAMSSARSE RDLQKEFPKH VESLQRLGKD LNHD*

进一步的工作揭示了完整的淋球菌DNA序列<SEQ ID 335>：

1 ATGAGTAAAT CCCGTATATC TCCCACACTT CTTTCCCGTC CGTGGTTCGC

51 TTTTTTCAGC TCCATGCGCT TTGCGGTCGC TTTGCTCAGT CTGCTGGGTA

101 TTGCATCGGT TATCGGCACG GTGTTACAGC AAAACCAGCC GCAGACGGAT

151 TATTTGGTCA AATTCGGACC GTTTTGGACT CGGATTTTTG ATTTTTTGGG

201 TTTGTATGAT GTCTATGCTT CGGCATGGTT TGTCGTTATC ATGATGTTTC

251 TGGTGGTTTC TACCAGTTTG TGTTTAATCC GTAACGTTCC GCCGTTTTGG

301 CGCGAAATGA AGTCTTTCCG GGAAAAGGTT AAAGAAAAAT CTCTGGCGGC

351 GATGCGCCAT TCTTCGCTGT TGGATGTAAA AATTGCCCCC GAAGTTGCCA

401 AACGTTATCT GGAGGTGCGG GGTTTTCAGG GAAAAACCGT CAGCCGTGAG

451 GACGGGTCGG TTCTGATTGC CGCCAAAAAA GGCAcaatga acaaATGGGG

501 CTATATCTTT GCccaagtag ctTTGATTGT CATTTGCCTG GGCGGGTTGA

551 TAGACAGTAA CCTGCTGCTG AAGCTGGGTA TGCTGGCCGG TCGGATTGTT

601 CCGGACAATC AGGCGGTTTA TGCCAAGGAT TTCAAGCCCG AAAGTATTTT

651 GGGTGCGTCC AATCTCTCAT TTAGGGGCAA CGTCAATATT TCCGAGGGGC

701 AAAGTGCGGA TGTGGTTTTC CTGAATGCCG ACAACGGGAT GTTGGTTCAG

751 GACTTGCCTT TTGAAGTCAA ACTGAAAAAA TTCCATATCG ATTTTTACAA

801 TACGGGTATG CCGCGCGATT TTGCCAGCGA TATTGAAGTA ACGGACAAGG

851 CAACCGGTGA GAAACTCGAG CGCACCATCC GCGTGAACCA TCCTTTGACC

901 TTGCACGGCA TCACGATTTA TCAGGCGAGT TTTGCCGACG GCGGTTCGGA

951 TTTGACATTC AAGGCGTGGA ATTTGAGGGA TGCTTCGCGC GAACCTGTCG

1001 TGTTGAAGGC AACCTCCATA CACCAGTTTC CGTTGGAAAT CGGCAAACAC

1051 AAATATCGTC TTGAGTTCGA TCAGTTCACT TCTATGAATG TGGAGGACAT

1101 GAGCGAGGGT GCGGAACGGG AAAAAAGCCT GAAATCCACT CTGAACGATG

1151 TCCGCGCCGT TACTCAGGAA GGTAAAAAAT ACACCAATAT CGGCCCTTCC

1201 ATCGTGTACC GCATCCGTGA TGcggCAGGG CAGGCGGTCG AATATAAAAA

1251 CTATATGCTG CCGATTTTGC AGGACAAAGA TTATTTTTGG CTGACCGGCA

1301 CGCGCAGCGG CTTGCAGCAG CAATACCGCT GGCTGCGTAT CCCCTTGGAC

1351 AAGCAGTTGA AAGCGGACAC CTTTATGGCA TTGCGTGAGT TTTTGAAAGA

1401 TGGGGAAGGG CGCAAACGTC TGGTTGCCGA CGCAACCAAA GACGCACCTG

1451 CCGAAATCCG CGAACAATTC ATGCTGGCTG CGGAAAACAC GCTGAATATC

1501 TTTGCGCAAA AAGGCTATTT GGGATTGGAC GAATTTATTA CGTCCAATAT

1551 CCCGAAAGGG CAGCAGGATA AGATGCAGGG CTATTTCTAC GAAATGCTTT

1601 ACGGCGTGAT GAACGCTGCT TTGGATGAAA CCATACGCCG GTACGGCTTG

1651 CCCGAATGGC AGCAGGATGA AGCGCGGAAC CGTTTCCTGC TGCACAGTAT

1701 GGATGCCTAT ACGGGGCTGA CGGAATATCC CGCGCCTATG CTGCTCCAGC

1751 TTGACGGGTT TTCCGAGGTG CGTTCCTCAG GTTTGCAGAT GACCCGTTCG

1801 CCGGGTGCGC TTTTGGTCTA TCtcggctcg gtattgttgg TTTTGGgtac

1851 ggtaTttatg tTTTATGTGC GCGAAAAACG GGCGTGGgta tTGTTTTCag

1901 aCGGCAAAAT CCGTTTTGCT ATGtCTTcgg CCcgcagcga ACGGGATTTG

1951 cAGAaggaaT TTCCAAAACA CGtcgAGAGC CTGCAACggc tcggcaaggA

2001 CttgaaTCAT GACTga

它对应于氨基酸序列<SEQ ID 336；ORF88ng-1>：

1 MSKSRISPTL LSRPWFAFFS SMRFA VALLS LLGIASVIGT VLQQNQPQTD

51 YLVKFGPFWT RIFDFLGLYD VYASAW FVVI MMFLVVSTSL CLIRNVPPFW

101 REMKSFREKV KEKSLAAMRH SSLLDVKIAP EVAKRYLEVR GFQGKTVSRE

151 DGSVLIAAKK GTMNKWG YIF AQVALIVICL GGLIDSNLLL KLGMLAGRIV

201 PDNQAVYAKD FKPESILGAS NLSFRGNVNI SEGQSADVVF LNADNGMLVQ

251 DLPFEVKLKK FHIDFYNTGM PRDFASDIEV TDKATGEKLE RTIRVNHPLT

301 LHGITIYQAS FADGGSDLTF KAWNLRDASR EPVVLKATSI HQFPLEIGKH

351 KYRLEFDQFT SMNVEDMSEG AEREKSLKST LNDVRAVTQE GKKYTNIGPS

401 IVYRIRDAAG QAVEYKNYML PILQDKDYFW LTGTRSGLQQ QYRWLRIPLD

451 KQLKADTFMA LREFLKDGEG RKRLVADATK DAPAEIREQF MLAAENTLNI

501 FAQKGYLGLD EFITSNIPKG QQDKMQGYFY EMLYGVMNAA LDETIRRYGL

551 PEWQQDEARN RFLLHSMDAY TGLTEYPAPM LLQLDGFSEV RSSGLQMTRS

601 PGA LLVYLGS VLLVLGTVFM FYVREKRAWV LFSDGKIRFA MSSARSERDL

651 QKEFPKHVES LQRLGKDLNH D*

ORF88ng-1和ORF88-1在671个氨基酸的重叠区内有97.0％的相同性：

orf88-1.pep MSKSRRSPPLLSRPWFAFFSSMRFAVALLSLLGIASVIGTVLQQNQPQTDYLVKFGSFWA 60

||||| || ||||||||||||||||||||||||||||||||||||||||||||||| ||:

orf88ng-1 MSKSRISPTLLSRPWFAFFSSMRFAVALLSLLGIASVIGTVLQQNQPQTDYLVKFGPFWT 60

orf88-1.pep QIFGFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 120

:|| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 RIFDFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 120

orf88-1.pep SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWGYIFAHVALIVICL 180

|||||||||||||||||||:||||||::|||||||||||||||||||||||:||||||||

orf88ng-1 SSLLDVKIAPEVAKRYLEVRGFQGKTVSREDGSVLIAAKKGTMNKWGYIFAQVALIVICL 180

orf88-1.pep GGLIDSNLLLKLGMLTGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVF 240

|||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 GGLIDSNLLLKLGMLAGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVF 240

orf88-1.pep LNADNGILVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNHPLT 300

||||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 LNADNGMLVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNHPLT 300

orf88-1.pep LHGITIYQASFADGGSDLTFKAWNLGDASREPVVLKATSIHQFPLEIGKHKYRLEFDQFT 360

||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||||

orf88ng-1 LHGITIYQASFADGGSDLTFKAWNLRDASREPVVLKATSIHQFPLEIGKHKYRLEFDQFT 360

orf88-1.pep SMNVEDMSEGAEREKSLKSTLNDVRAVTQEGKKYTNIGPSIVYRIRDAAGQAVEYKNYML 420

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 SMNVEDMSEGAEREKSLKSTLNDVRAVTQEGKKYTNIGPSIVYRIRDAAGQAVEYKNYML 420

orf88-1.pep PVLQEQDYFWITGTRSGLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRLVADATK 480

|:||::||||:|||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 PILQDKDYFWLTGTRSGLQQQYRWLRIPLDKQLKADTFMALREFLKDGEGRKRLVADATK 480

orf88-1.pep GAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKEQQDKMQGYFYEMLYGVMNAA 540

||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||

orf88ng-1 DAPAEIREQFMLAAENTLNIFAQKGYLGLDEFITSNIPKGQQDKMQGYFYEMLYGVMNAA 540

orf88-1.pep LDETIRRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRS 600

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf88ng-1 LDETIRRYGLPEWQQDEARNRFLLHSMDAYTGLTEYPAPMLLQLDGFSEVRSSGLQMTRS 600

orf88-1.pep PGALLVYLGSVLLVLGTVLMFYVREKRAWVLFSDGKIRFAMSSARSERDLQKEFPKHVES 660

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf88ng-1 PGALLVYLGSVLLVLGTVFMFYVREKRAWVLFSDGKIRFAMSSARSERDLQKEFPKHVES 660

orf88-1.pep LQRLGKDLNHD 671

|||||||||||

orf88ng-1 LQRLGKDLNHD 671

另外，ORG88ng-1显示出与Aquifex aeolicus的一种假设蛋白同源：

gi|2984296(AE000771)假设蛋白[Aquifex aeolicus]长度＝537

评分＝94.4位(231)，估计值＝2e-18

相同性＝91/334(27％)，阳性＝159/334(47％)，空隙＝59/334(17％)

询问：16 FAFFSSMRFAVALLSLLGIASVIG-TVLQQNQPQTDYLVKFGPFWTRIFDFLGLYDVYAS 74

+ F +S++ A+ ++ +LGI S++G T ++QNQ YL +FG L L DV+ S

目标：80 YDFLASLKLAIFIMLVLGILSMLGSTYIKQNQSFEWYLDQFGYDVGIWIWKLWLNDVFHS 139

询问：75 AWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRHSSLLDVKIAPEVAK 134

++++ ++ L V+ C I+ +P W++ S +E++ + A +H + VKI P+ K

目标：140 WYYILFIVLLAVNLIFCSIKRLPRVWKQAFS-KERILKLDEHAEKHLKPITVKI-PDKDK 197

询问：135 --RYLEVRGFQGKTVSREDGSVLIAAKKGTMNKWGYIFAQVALIVICLGGLIDSNLLLKL 192

++L +GF+ V E + + A+KG ++ G +AL+VI G LID

目标：198 VLKFLLKKGFK-VFVEEEGNKLYVFAEKGRFSRLGVYITHIALLVIMAGALID------- 249

询问：193 GMLAGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVFLNADNGMLVQDL 252

+I+G RG++ ++EG + DV+ + A+ L

目标：250 ----------------------AIVGV-----RGSLIVAEGDTNDVMLVGAE--QKPYKL 280

询问：253 PFEVKLKKFHIDFY---NTGMPRDFA-------SDIEVTDKATGEKLER--TIRVNHPLT 300

PF V L F I Y N + + FA SDIE+ + G K+E T++VN P

目标：281 PFAVHLIDFRIKTYAEENPNVDKRFAQAVSSYESDIEIIN---GGKVEAKGTVKVNEPFD 337

询问：301 LHGITIYQASFA--DGGSDLTFKAWNLRDASREP 332

++QA++ DG S + + + A +P

目标：338 FGRYRLFQATYGILDGTSGMGVIVVDRKKAHEDP 371

根据该分析结果(包括此淋球菌蛋白中有推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例40

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 337>：

1 ATGATGAGTA ATAmAATGGm ACAAAAAGGG TTTACATTGA TTGmGmTGAT

51 GATAGTCGTC GCGATACTCG GCATTATCAG CGTCATTGCC ATACCTTCTT

101 ATCmAAGTTA TATTGAAAAA GGCTATCAGT CCCAGCTTTA TACGGAGATG

151 GyCGGTATCA ACAATATTTC CAAACAGTTT ATTTTGAAAA ATCCCCTGGA

201 CGATAATCAG ACCATCGAGA ACAAACTGGA AATATTTGTC TCAGGCTATA

251 AGATGAATCC GAAAATTGCC AAAAAaTATA GTGTTTCGGT AAAGTTTGTC

301 GATAAGGAAA AATCAAGGGC ATACAGGTTG GTCGGCGTTC CGAAGGCGGG

351 GACGGGTTAT ACTTTGTCGG TATGGATGAA CAGCGTGGGC GACGGATACA

401 AATGCCGTGA TGCCGCTTCT GCCCAAGCCC ATTTGGAGAC CTTGTCCTCA

451 GATGTCGGCT GTGAAGCCTT CTCTAATCGT AAAAAATAA

它对应于氨基酸序列<SEQ ID 338；ORF89>：

1 MMSNXMXQKG FTLIXXMIVV AILGIISVIA IPSYXSYIEK GYQSQLYTEM

51 XGINNISKQF ILKNPLDDNQ TIENKLEIFV SGYKMNPKIA KKYSVSVKFV

101 DKEKSRAYRL VGVPKAGTGY TLSVWMNSVG DGYKCRDAAS AQAHLETLSS

151 DVGCEAFSNR KK*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 339>：

1 ATGATGAGTA ATAAAATGGA ACAAAAAGGG TTTACATTGA TTGAGATGAT

51 GATAGTCGTC GCGATACTCG GCATTATCAG CGTCATTGCC ATACCTTCTT

101 ATCAAAGTTA TATTGAAAAA GGCTATCAGT CCCAGCTTTA TACGGAGATG

151 GTCGGTATCA ACAATATTTC CAAACAGTTT ATTTTGAAAA ATCCCCTGGA

201 CGATAATCAG ACCATCGAGA ACAAACTGGA AATATTTGTC TCAGGCTATA

251 AGATGAATCC GAAAATTGCC AAAAAATATA GTGTTTCGGT AAAGTTTGTC

301 GATAAGGAAA AATCAAGGGC ATACAGGTTG GTCGGCGTTC CGAAGGCGGG

351 GACGGGTTAT ACTTTGTCGG TATGGATGAA CAGCGTGGGC GACGGATACA

401 AATGCCGTGA TGCCGCTTCT GCCCAAGCCC ATTTGGAGAC CTTGTCCTCA

451 GATGTCGGCT GTGAAGCCTT CTCTAATCGT AAAAAATAA

它对应于氨基酸序列<SEQ ID 340；ORF89-1>：

1 MMSNKMEQKG FTLIEMMIVV AILGIISVIA IPSYQSYIEK GYQSQLYTEM

51 VGINNISKQF ILKNPLDDNQ TIENKLEIFV SGYKMNPKIA KKYSVSVKFV

101 DKEKSRAYRL VGVPKAGTGY TLSVWMNSVG DGYKCRDAAS AQAHLETLSS

151 DVGCEAFSNR KK*

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的PilE(登录号Z69260)的同源性

ORF89和PilE蛋白在120个氨基酸重叠区内显示出有30％的氨基酸相同性：

orf89 8 QKGFTLIXXMIVVAILGIISVIAIPSYXSYIEKGYQSQLYTEMXGINNISKQFILKNPL- 66

QKGFTLI MIV+AI+GI++ +A+P+Y Y + S+ G + ++ L + +

PilE 5 QKGFTLIELMIVIAIVGILAAVALPAYQDYTARAQVSEAILLAEGQKSAVTEYYLNHGIW 64

orf89 67 -DDNQTIENKLEIFVSGYKMNPKIAKKYSVSVKFVDKEKSRAYRLVGVPKAGTGYTLSVW 125

DN + +G + KI KY SV + GV K G LS+W

PilE 65 PKDNTS---------AGVASSDKIKGKYVQSVTVAKGVVTAEMASTGVNKEIQGKKLSLW 115

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF89显示与脑膜炎奈瑟球菌菌株A的ORF(ORF89a)在重叠的162个氨基酸内有83.3％的相同性：

10 20 30 40 50 60

orf89.pep MMSNXMXQKGFTLIXXMIVVAILGIISVIAIPSYXSYIEKGYQSQLYTEMXGINNISKQF

|||| | ||||||||| || ||| ||||||||||||||||| ||||||||

orf89a MMSNKMEQKGFTLIXXXXXXAIXXXXSVIXXXXYXSYIEKGYQSQLYTEMVGINNISKQX

10 20 30 40 50 60

70 80 90 100 110 120

orf89.pep ILKNPLDDNQTIENKLEIFVSGYKMNPKIAKKYSVSVKFVDKEKSRAYRLVGVPKAGTGY

||||||||||||::||||||||||||||||:||:|||:||::|| ||| ||||||:||||

orf89a ILKNPLDDNQTIKSKLEIFVSGYKMNPKIAEKYNVSVHFVNEEKPRAYSLVGVPKTGTGY

70 80 90 100 110 120

130 140 150 160

orf89.pep TLSVWMNSVGDGYKCRDAASAQAHLETLSSDVGCEAFSNRKKX

|||||||||||||||||||||:|||||||||||||||||||||

orf89a TLSVWMNSVGDGYKCRDAASARAHLETLSSDVGCEAFSNRKKX

130 140 150 160

全长ORF89a核苷酸序列<SEQ ID 341>是：

1 ATGATGAGTA ATAAAATGGA ACAAAAAGGG TTTACATTGA TTGNGANGNT

51 NATNGNCNTC GCGATACNCN GCNTTANCAG CGTCATTNCN ATNNNTNCNT

101 ATCNNAGTTA TATTGAAAAA GGCTATCAGT CCCAGCTTTA TACGGAGATG

151 GTCGGTATCA ACAATATTTC CAAACAGTNT ATTTTGAAAA ATCCCCTGGA

201 CGATAATCAG ACCATCAAGA GCAAACTGGA AATATTTGTC TCAGGCTATA

251 AGATGAATCC GAAAATTGCC GAAAAATATA ATGTTTCGGT GCATTTTGTC

301 AATGAGGAAA AACCNAGGGC ATACAGCTTG GTCGGCGTTC CAAAGACGGG

351 GACGGGTTAT ACTTTGTCGG TATGGATGAA CAGCGTGGGC GACGGATACA

401 AATGCCGTGA TGCCGCTTCT GCCCGAGCCC ATTTGGAGAC CTTGTCCTCA

451 GATGTCGGCT GTGAAGCCTT CTCTAATCGT AAAAAATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 342>：

1 MMSNKMEQKG FTLIXXXXXX AIXXXXSVIX XXXYXSYIEK GYQSQLYTEM

51 VGINNISKQX ILKNPLDDNQ TIKSKLEIFV SGYKMNPKIA EKYNVSVHFV

101 NEEKPRAYSL VGVPKTGTGY TLSVWMNSVG DGYKCRDAAS ARAHLETLSS

151 DVGCEAFSNR KK*

ORF89a和ORF89-1显示在162个氨基酸的重叠区内有83.3％的相同性：

10 20 30 40 50 60

orf89a.pep MMSNKMEQKGFTLIXXXXXXAIXXXXSVIXXXXYXSYIEKGYQSQLYTEMVGINNISKQX

|||||||||||||| || ||| | |||||||||||||||||||||||||

orf89-1 MMSNKMEQKGFTLIEMMIVVAILGIISVIAIPSYQSYIEKGYQSQLYTEMVGINNISKQF

10 20 30 40 50 60

70 80 90 100 110 120

orf89a.pep ILKNPLDDNQTIKSKLEIFVSGYKMNPKIAEKYNVSVHFVNEEKPRAYSLVGVPKTGTGY

||||||||||||::||||||||||||||||:||:|||:||::|| ||| ||||||:||||

orf89-1 ILKNPLDDNQTIENKLEIFVSGYKMNPKIAKKYSVSVKFVDKEKSRAYRLVGVPKAGTGY

70 80 90 100 110 120

130 140 150 160

orf89a.pep TLSVWMNSVGDGYKCRDAASARAHLETLSSDVGCEAFSNRKKX

|||||||||||||||||||||:|||||||||||||||||||||

orf89-1 TLSVWMNSVGDGYKCRDAASAQAHLETLSSDVGCEAFSNRKKX

130 140 150 160

与淋病奈瑟球菌的预计ORF的同源性

ORF89与淋病奈瑟球菌的预计ORF(ORF89.ng)在重叠的162个氨基酸内显示有84.6％的相同性：

orf89 MMSNXMXQKGFTLIXXMIVVAILGIISVIAIPSYXSYIEKGYQSQLYTEMXGINNISKQF 60

|||| | ||||||| ||||:||||||||||||| ||||||||||||||| ||||: |||

orf89ng MMSNKMEQKGFTLIEMMIVVTILGIISVIAIPSYQSYIEKGYQSQLYTEMVGINNVLKQF 60

orf89 ILKNPLDDNQTIENKLEIFVSGYKMNPKIAKKYSVSVKFVDKEKSRAYRLVGVPKAGTGY 120

||||| |||:|:::||:||||||||||||||||||||:||| || |||||||||:|||||

orf89ng ILKNPQDDNDTLKSKLKIFVSGYKMNPKIAKKYSVSVRFVDAEKPRAYRLVGVPNAGTGY 120

orf89 TLSVWMNSVGDGYKCRDAASAQAHLETLSSDVGCEAFSNRKK 162

||||||||||||||||||:||||: :|||:| ||||||||||

orf89ng TLSVWMNSVGDGYKCRDATSAQAYSDTLSADSGCEAFSNRKK 162

全长ORF89ng核苷酸序列<SEQ ID 343>是：

1 aTGATGAGCA ATAAAATGGA ACAAAAAGGG TTTACATTGA TTGAGATGAT

51 GATAGTTGTC ACGATACTCG GCATCATCAG CGTCATTGCC ATACCTTCTT

101 ATCAGAGTTA TATTGAAAAA GGCTATCAGT CCCAGCTTTA TACGGAGATG

151 GTCGGTATCA ACAATGTTCT CAAACAGTTT ATTTTGAAAA ATCCCCAGGA

201 CGATAATGAT ACCCTCAAGA GCAAACTGAA AATATTTGTC TCAGGCTATA

251 AGATGAATCC GAAAAttgCC AAAAAATATA GTGTTTCGGt aaggtttGTC

301 gatGCGGAAA AACCAAGGGC ATACAGGTTG GTCGGCGTTC CGAACGCGGG

351 GACGGGTTAT ACTTTGTCGG TATGGATGAA CAGCGTGGGC GACGGATACA

401 AATGCCGTGA TGCCACTTCT GCCCAGGCCT ATTCGGACAC CTTGTCCGCA

451 GATAGCGGCT GTGAAGCTTT CTCTAATCGT AAAAAATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 344>：

1

A IPSYQSYIEK GYQSQLYTEM

51 VGINNVLKQF ILKNPQDDND TLKSKLKIFV SGYKMNPKIA KKYSVSVRFV

101 DAEKPRAYRL VGVPNAGTGY TLSVWMNSVG DGYKCRDATS AQAYSDTLSA

151 DSGCEAFSNR KK*

该淋球菌蛋白具有一个推定的前导序列(下划线)和N端甲基化位点(NMePhe或4型菌毛，双划线)。另外，ORF89ng和ORF89-1在162个氨基酸的重叠区内有88.3％的相同性：

10 20 30 40 50 60

orf89-1.pep MMSNKMEQKGFTLIEMMIVVAILGIISVIAIPSYQSYIEKGYQSQLYTEMVGINNISKQF

||||||||||||||||||||:||||||||||||||||||||||||||||||||||: |||

orf89ng MMSNKMEQKGFTLIEMMIVVTILGIISVIAIPSYQSYIEKGYQSQLYTEMVGINNVLKQF

10 20 30 40 50 60

70 80 90 100 110 120

orf89-1.pep ILKNPLDDNQTIENKLEIFVSGYKMNPKIAKKYSVSVKFVDKEKSRAYRLVGVPKAGTGY

||||| |||:|:::||:||||||||||||||||||||:||| || |||||||||:|||||

orf89ng ILKNPQDDNDTLKSKLKIFVSGYKMNPKIAKKYSVSVRFVDAEKPRAYRLVGVPNAGTGY

70 80 90 100 110 120

130 140 150 160

orf89-1.pep TLSVWMNSVGDGYKCRDAASAQAHLETLSSDVGCEAFSNRKKX

||||||||||||||||||:||||: :|||:| |||||||||||

orf89ng TLSVWMNSVGDGYKCRDATSAQAYSDTLSADSGCEAFSNRKKX

130 140 150 160

根据该分析结果(包括淋球菌基序以及与已知PilE蛋白的同源性)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF89-1(13.6kDa)克隆到pGex载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图11A显示出GST-融合蛋白亲和纯化的结果。用纯化的GST-融合蛋白免疫小鼠，该小鼠的血清在ELISA测试中给出了阳性结果，这确认了ORF89-1是一种外露蛋白，且是一种有用的免疫原。

实施例41

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 345>：

1 ATGAAAAAAT CCTCCCTCAT CAGCGCATTG GGCATCGGTA TTTTGAGCAT

51 CGGCATGGCA TTTGCCGCCC CTGCCGACGC GGTAAGCCAA ATCCGTCAAA

101 ACGCCACTCA AGTATTGAGC ATCTTAAAAA ACGGCGATGC CAACACCGCT

151 CGCCAAAAAG CCGAAGCCTA TGCGATTCCC TATTTCGATT TCCAACGTAT

201 GACCGCATTG GCGGTCGGCA ACCCTTGGsG CACCG.GTCC GACG.GCAAA

251 AACAAGCGTT GGCCn.AGAA TTTCAACCC...

它对应于氨基酸序列<SEQ ID 346；ORF91>：

1 MKKSSLISAL GIGILSIGMA FAAPADAVSQ IRQNATQVLS ILKNGDANTA

51 RQKAEAYAIP YFDFQRMTAL AVGNPWXTXS DXQKQALAXE FQP...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 347>：

1 ATGAAAAAAT CCTCCCTCAT CAGCGCATTG GGCATCGGTA TTTTGAGCAT

51 CGGCATGGCA TTTGCCGCCC CTGCCGACGC GGTAAGCCAA ATCCGTCAAA

101 ACGCCACTCA AGTATTGAGC ATCTTAAAAA ACGGCGATGC CAACACCGCT

151 CGCCAAAAAG CCGAAGCCTA TGCGATTCCC TATTTCGATT TCCAACGTAT

201 GACCGCATTG GCGGTCGGCA ACCCTTGGCG CACCGCGTCC GACGCGCAAA

251 AACAAGCGTT GGCCAAAGAA TTTCAAACCC TGCTGATCCG CACCTATTCC

301 GGCACGATGC TGAAATTAAA AAACGCCAAC GTCAACGTCA AAGACAATCC

351 CATCGTCAAT AAAGGCGGCA AAGAAATCAT CGTCCGCGCC GAAGTCGGCG

401 TACCCGGGCA AAAACCCGTC AACATGGACT TCACCACCTA CCAAAGCGGC

451 GGTAAATACC GTACCTACAA CGTCGCCATC GAAGGCGCGA GCCTGGTTAC

501 CGTGTACCGC AACCAATTCG GCGAAATTAT CAAAGCGAAA GGCGTGGACG

551 GACTGATTGC CGAGTTGAAA GCCAAAAACG GCGGCAAATA A

它对应于氨基酸序列<SEQ ID 348；ORF91-1>：

1 MKKSSLISAL GIGILSIGMA FAAPADAVSQ IRQNATQVLS ILKNGDANTA

51 RQKAEAYAIP YFDFQRMTAL AVGNPWRTAS DAQKQALAKE FQTLLIRTYS

101 GTMLKLKNAN VNVKDNPIVN KGGKEIIVRA EVGVPGQKPV NMDFTTYQSG

151 GKYRTYNVAI EGASLVTVYR NQFGEIIKAK GVDGLIAELK AKNGGK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF91显示与脑膜炎奈瑟球菌菌株A的ORF(ORF91a)在重叠的92个氨基酸内有92.4％的相同性：

10 20 30 40 50 60

orf91.pep MKKSSLISALGIGILSIGMAFAAPADAVSQIRQNATQVLSILKNGDANTARQKAEAYAIP

|||||:||||||||||||||||||||||:||||||||||||||:||||||||||||||||

orf91a MKKSSFISALGIGILSIGMAFAAPADAVNQIRQNATQVLSILKSGDANTARQKAEAYAIP

10 20 30 40 50 60

70 80 90

orf91.pep YFDFQRMTALAVGNPWXTXSDXQKQALAXEFQP

|||||||||||||||| | || |||||| |||

orf91a YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKLKNANVNVKDNPIVN

70 80 90 100 110 120

orf91a KGGKEIIVRAEVGVPGQKPVNMDFTTYQSGGKYRTYNVAIEGASLVTVYRNQFGEIIKAK

130 140 150 160 170 180

全长ORF91a核苷酸序列<SEQ ID 349>是：

1 ATGAAAAAAT CCTCCTTCAT CAGCGCATTG GGCATCGGTA TTTTGAGCAT

51 CGGCATGGCA TTTGCCGCCC CTGCCGACGC GGTAAACCAA ATCCGTCAAA

101 ACGCCACTCA AGTATTGAGC ATCTTAAAAA GCGGTGATGC CAACACCGCC

151 CGCCAAAAAG CCGAAGCCTA TGCGATTCCC TATTTCGATT TCCAACGTAT

201 GACCGCATTG GCGGTCGGCA ACCCTTGGCG CACCGCGTCC GACGCGCAAA

251 AACAAGCGTT GGCCAAAGAA TTTCAAACCC TGCTGATCCG CACCTATTCC

301 GGCACGATGC TGAAATTAAA AAACGCCAAC GTCAACGTCA AAGACAATCC

351 CATCGTCAAT AAAGGCGGCA AAGAAATCAT CGTCCGCGCC GAAGTCGGCG

401 TACCCGGGCA AAAACCCGTC AACATGGACT TCACCACCTA CCAAAGCGGC

451 GGTAAATACC GTACCTACAA CGTCGCCATC GAAGGCGCGA GCCTGGTTAC

501 CGTGTACCGC AACCAATTCG GCGAAATTAT CAAAGCGAAA GGCGTGGACG

551 GACTGATTGC CGAGTTGAAG GCTAAAAACG GCAGCAAGTA A

它编码的蛋白质具有氨基酸序列<SEQ ID 350>：

1 MKKSSFISAL GIGILSIGMA FAAPADAVNQ IRQNATQVLS ILKSGDANTA

51 RQKAEAYAIP YFDFQRMTAL AVGNPWRTAS DAQKQALAKE FQTLLIRTYS

101 GTMLKLKNAN VNVKDNPIVN KGGKEIIVRA EVGVPGQKPV NMDFTTYQSG

151 GKYRTYNVAI EGASLVTVYR NQFGEIIKAK GVDGLIAELK AKNGSK*

ORF91a和ORF91-1显示在196个氨基酸的重叠区内有98.0％的相同性：

10 20 30 40 50 60

orf91a.pep MKKSSFISALGIGILSIGMAFAAPADAVNQIRQNATQVLSILKSGDANTARQKAEAYAIP

|||||:||||||||||||||||||||||:||||||||||||||:||||||||||||||||

orf91-1 MKKSSLISALGIGILSIGMAFAAPADAVSQIRQNATQVLSILKNGDANTARQKAEAYAIP

10 20 30 40 50 60

70 80 90 100 110 120

orf91a.pep YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKLKNANVNVKDNPIVN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf91-1 YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKLKNANVNVKDNPIVN

70 80 90 100 110 120

130 140 150 160 170 180

orf91a.pep KGGKEIIVRAEVGVPGQKPVNMDFTTYQSGGKYRTYNVAIEGASLVTVYRNQFGEIIKAK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf91-1 KGGKEIIVRAEVGVPGQKPVNMDFTTYQSGGKYRTYNVAIEGASLVTVYRNQFGEIIKAK

130 140 150 160 170 180

190

orf91a.pep GVDGLIAELKAKNGSKX

||||||||||||||:||

orf91-1 GVDGLIAELKAKNGGKX

190

与淋病奈瑟球菌的预计ORF的同源性

ORF91显示与淋病奈瑟球菌的预计ORF(ORF91.ng)在重叠的92个氨基酸内有84.8％的相同性：

orf91.pep MKKSSLISALGIGILSIGMAFAAPADAVSQIRQNATQVLSILKNGDANTARQKAEAYAIP 60

:||||:||||||||||||||||:|||||:||||||||||:|||:||| :|| ||||||:|

orf91ng VKKSSFISALGIGILSIGMAFASPADAVGQIRQNATQVLTILKSGDAASARPKAEAYAVP 60

orf91.pep YFDFQRMTALAVGNPWXTXSDXQKQALAXEFQP 93

|||||||||||||||| | || |||||| |||

orf91ng YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKFKNATVNVKDNPIVN 120

预计全长ORF91ng核苷酸序列<SEQ ID 351>编码的蛋白质具有氨基酸序列<SEQ ID 352>：

1 VKKSSFISAL GIGILSIGMA FASPADAVGQ IRQNATQVLT ILKSGDAASA

51 RPKAEAYAVP YFDFQRMTAL AVGNPWRTAS DAQKQALAKE FQTLLIRTYS

101 GTMLKFKNAT VNVKDNPIVN KGGKEIVVRA EVGIPGQKPV NMDFTTYQSG

151 GKYRTYNVAI EGTSLVTVYR NQFGEIIKAK GIDGLIAELK AKNGGK*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 353>：

1 ATGAAAAAAT CCTCCTTCAT CAGCGCATTG GGCATCGGTA TTTTGAGCAT

51 CGGCATGGCA TTTGCCTCCC CGGCCGACGC AGTGGGACAA ATCCGCCAAA

101 ACGCCACACA GGTTTTGACC ATCCTCAAAA GCGGCGACGC GGCTTCTGCA

151 CGCCCAAAAG CCGAAGCCTA TGCGGTTCCC TATTTCGATT TCCAACGTAT

201 GACCGCATTG GCGGTCGGCA ACCCTTGGCG TACCGCGTCC GACGCGCAAA

251 AACAAGCGTT GGCCAAAGAA TTTCAAACCC TGCTGATCCG CACCTATTCC

301 GGCACGATGC TGAAATTCAA AAACGCGACC GTCAACGTCA AAGACAATCC

351 CATCGTCAAT AAGGGCGGCA AGGAAATCGT CGTCCGTGCC GAAGTCGGCA

401 TCCCCGGTCA GAAGCCCGTC AATATGGACT TTACCACCTA CCAAAGCGGC

451 GGCAAATACC GTACCTACAA CGTCGCCATC GAAGGCACGA GCCTGGTTAC

501 CGTGTACCGC AACCAATTCG GCGAAATCAT CAAAGCCAAA GGCATCGACG

551 GGCTGATTGC CGAGTTGAAA GCCAAAAACG GCGGCAAATA A

它对应于氨基酸序列<SEQ ID 354；ORF91ng-1>：

1 MKKSSFISAL GIGILSIGMA FASPADAVGQ IRQNATQVLT ILKSGDAASA

51 RPKAEAYAVP YFDFQRMTAL AVGNPWRTAS DAQKQALAKE FQTLLIRTYS

101 GTMLKFKNAT VNVKDNPIVN KGGKEIVVRA EVGIPGQKPV NMDFTTYQSG

151 GKYRTYNVAI EGTSLVTVYR NQFGEIIKAK GIDGLIAELK AKNGGK*

ORF91ng-1和ORF91-1显示在196个氨基酸的重叠区内有92.3％的相同性：

10 20 30 40 50 60

orf91-1.pep MKKSSLISALGIGILSIGMAFAAPADAVSQIRQNATQVLSILKNGDANTARQKAEAYAIP

|||||:||||||||||||||||:|||||:||||||||||:|||:||| :|| ||||||:|

orf91ng-1 MKKSSFISALGIGILSIGMAFASPADAVGQIRQNATQVLTILKSGDAASARPKAEAYAVP

10 20 30 40 50 60

70 80 90 100 110 120

orf91-1.pep YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKLKNANVNVKDNPIVN

|||||||||||||||||||||||||||||||||||||||||||||:|||:||||||||||

orf91ng-1 YFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKFKNATVNVKDNPIVN

70 80 90 100 110 120

130 140 150 160 170 180

orf91-1.pep KGGKEIIVRAEVGVPGQKPVNMDFTTYQSGGKYRTYNVAIEGASLVTVYRNQFGEIIKAK

||||||:||||||:||||||||||||||||||||||||||||:|||||||||||||||||

orf91ng-1 KGGKEIVVRAEVGIPGQKPVNMDFTTYQSGGKYRTYNVAIEGTSLVTVYRNQFGEIIKAK

130 140 150 160 170 180

190

orf91-1.pep GVDGLIAELKAKNGGKX

|:|||||||||||||||

orf91ng-1 GIDGLIAELKAKNGGKX

190

另外，ORF91ng-1显示出与一种假设的大肠杆菌蛋白同源：

sp|P45390|YRBC_ECOLI MURA-RPON基因间区域中的假设的24.0KD蛋白前体(F211)>gi|606130(U18997)ORF_f211[大肠杆菌]>gi|1789583(AE000399)murZ-rpoN基因间区域中的假设的24.0kD蛋白[大肠杆菌]长度＝211

评分＝70.6位(170)，估计值＝6e-12

相同性＝42/137(30％)，阳性＝76/137(54％)，空隙＝6/137(4％)

询问：59 VPYFDFQRMTALAVGNPWRTASDAQKQALAKEFQTLLIRTYSGTMLKFKNATVNVKDNPI 118

+PY + AL +G +++A+ AQ++A F+ L + Y + + T + P

目标：65 LPYVQVKYAGALVLGQYYKSATPAQREAYFAAFREYLKQAYGQALAMYHGQTYQIA--PE 122

询问：119 VNKGGKEIV-VRAEVGIP-GQKPVNMDFTTYQSG--GKYRTYNVAIEGTSLVTVYRNQFG 174

G K IV +R + P G+ PV +DF ++ G ++ Y++ EG S++T +N++G

目标：123 QPLGDKTIVPIRVTIIDPNGRPPVRLDFQWRKNSQTGNWQAYDMIAEGVSMITTKQNEWG 182

询问：175 EIIKAKGIDGLIAELKA 191

+++ KGIDGL A+LK+

目标：183 TLLRTKGIDGLTAQLKS 199

根据该分析结果，包括此淋球菌蛋白中有一个推定的前导序列的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例42

在脑膜炎奈瑟球菌中鉴定出下列DNA序列<SEQ ID 355>：

1 ATGAAACACA TACTCCCCCT GATTGCCGCA TCCGCACTCT GCATTTCAAC

51 CGCTTCGGCA CATCCTGCCA GCGAACCGTC CACTCAAAAC GAAACCGCTA

101 TGATCACGCA TACCCTCATC TCAAAATACA GTTTTGGnnn nnnnnnnnnn

151 nnnnnnnnnn nnGCCATAAA AAGCAAAGGG ATGGACATTT TTGCCGTCAT

201 CGACCATCAG GAAGCCGCAC GCCGAAACGG CTTAACGATG CAGCCGGCAA

251 AAGTCATCGT CTTCGGCACG CCCAAAGCCG GCACGCCGCT GATGGTCAAA

301 GACCCCGCCT TCGCCCTGCA ACTGCCCCTA CGCGTCCTCG TTACCGAAAC

351 GGACGGCAAA GTACGCGCCG CCTATACCGA TACGCGCGCC CTCATCGCCG

401 GCAGCCGCAT CGGTTTCGAC GAAGTGGCAA ACACTTTGGC AAACGCCGAA

451 AAACTGATAC AAAAAACCGT AGGCGAATAA

它对应于氨基酸序列<SEQ ID 356；ORF97>：

1 MKHILPLIAA SALCISTASA HPASEPSTQN ETAMITHTLI SKYSFGXXXX

51 XXXXAIKSKG MDIFAVIDHQ EAARRNGLTM QPAKVIVFGT PKAGTPLMVK

101 DPAFALQLPL RVLVTETDGK VRAAYTDTRA LIAGSRIGFD EVANTLANAE

151 KLIQKTVGE*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 357>：

1 ATGAAACACA TACTCCCCCT GATTGCCGCA TCCGCACTCT GCATTTCAAC

51 CGCTTCGGCA CATCCTGCCA GCGAACCGTC CACCCAAAAC GAAACCGCTA

101 TGACCACGCA TACCCTCACC TCAAAATACA GTTTTGACGA AACCGTCAGC

151 CGCCTTGAAA CCGCCATAAA AAGCAAAGGG ATGGACATTT TTGCCGTCAT

201 CGACCATCAG GAAGCCGCCC GCCGAAACGG CTTAACGATG CAGCCGGCAA

251 AAGTCATCGT CTTCGGCACG CCCAAAGCCG GCACGCCGCT GATGGTCAAA

301 GACCCCGCCT TCGCCCTGCA ACTGCCCCTA CGCGTCCTCG TTACCGAAAC

351 GGACGGCAAA GTACGCGCCG CCTATACCGA TACGCGCGCC CTCATCGCCG

401 GCAGCCGCAT CGGTTTCGAC GAAGTGGCAA ACACTTTGGC AAACGCCGAA

451 AAACTGATAC AAAAAACCGT AGGCGAATAA

它对应于氨基酸序列<SEQ ID 358；ORF97-1>：

1 MKHILPLIAA SALCISTASA HPASEPSTQN ETAMTTHTLT SKYSFDETVS

51 RLETAIKSKG MDIFAVIDHQ EAARRNGLTM QPAKVIVFGT PKAGTPLMVK

101 DPAFALQLPL RVLVTETDGK VRAAYTDTRA LIAGSRIGFD EVANTLANAE

151 KLIQKTVGE*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF97显示与脑膜炎奈瑟球菌菌株A的ORF(ORF97a)在重叠的159个氨基酸内有88.7％的相同性：

10 20 30 40 50 60

orf97.pep MKHILPLIAASALCISTASAHPASEPSTQNETAMITHTLISKYSFGXXXXXXXXAIKSKG

| ||||| |||||||||| ||||||:||||||| |||| ||||| : :||||||

orf97a MXHILPLXXASALCISTASXHPASEPQTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG

10 20 30 40 50 60

70 80 90 100 110 120

orf97.pep MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK

|||||||||||||||||||||||||||||||||||||||||||||||||||| |||||||

orf97a MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVXVTETDGK

70 80 90 100 110 120

130 140 150 160

orf97.pep VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTVGEX

||||||||||||||||||||||||||||||||||||:|||

orf97a VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTIGEX

130 140 150 160

全长ORF97a核苷酸序列<SEQ ID 359>是：

1 ATGANACACA TACTCCCCCT GANTGNCGCA TCCGCACTCT GCATTTCAAC

51 CGCTTCGGNN CATCCTGCCA GCGAACCGCA AACCCAAAAC GAAACCGCTA

101 TGACCACGCA TACCCTCACC TCAAAATACA GTTTTGACGA AACCGTCAGC

151 CGCCTTGAAA CCGCCATAAA AAGCAAAGGG ATGGACATTT TTGCCGTCAT

201 CGACCATCAG GAAGCCGCCC GCCGAAACGG CTTAACGATG CAGCCGGCAA

251 AAGTCATCGT CTTCGGCACG CCCAAAGCCG GTACGCCGCT GATGGTCAAA

301 GACCCCGCCT TCGCCCTGCA ACTGCCCCTG CGCGTCNTCG TTACCGAAAC

351 GGACGGCAAA GTACGCGCCG CCTATACCGA TACGCGCGCC CTCATCGCCG

401 GCAGCCGCAT CGGTTTCGAC GAAGTGGCAA ACACTTTGGC AAACGCCGAA

451 AAACTGATAC AAAAAACCAT AGGCGAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 360>：

1 MXHILPLXXA SALCISTASX HPASEPQTQN ETAMTTHTLT SKYSFDETVS

51 RLETAIKSKG MDIFAVIDHQ EAARRNGLTM QPAKVIVFGT PKAGTPLMVK

101 DPAFALQLPL RVXVTETDGK VRAAYTDTRA LIAGSRIGFD EVANTLANAE

151 KLIQKTIGE*

ORF97a和ORF97-1显示在159个氨基酸的重叠区内有95.6％的相同性：

10 20 30 40 50 60

orf97a.pep MXHILPLXXASALCISTASXHPASEPQTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG

| ||||| |||||||||| ||||||:|||||||||||||||||||||||||||||||||

orf97-1 MKHILPLIAASALCISTASAHPASEPSTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG

10 20 30 40 50 60

70 80 90 100 110 120

orf97a.pep MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVXVTETDGK

|||||||||||||||||||||||||||||||||||||||||||||||||||| |||||||

orf97-1 MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK

70 80 90 100 110 120

130 140 150 160

orf97a.pep VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTIGEX

||||||||||||||||||||||||||||||||||||:|||

orf97-1 VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTVGEX

130 140 150 160

与淋病奈瑟球菌的预计ORF的同源性

ORF97显示与淋病奈瑟球菌的预计ORF(ORF97.ng)在重叠的159个氨基酸内有88.1％的相同性：

orf97.pep MKHILPLIAASALCISTASAHPASEPSTQNETAMITHTLISKYSFGXXXXXXXXAIKSKG 60

|||||| |||||:||||||||||::| ||||||| |||| ||||| : :||||||

orf97ng MKHILPPIAASAFCISTASAHPAGKPPTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG 60

orf97.pep MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf97ng MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK 120

orf97.pep VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTVGE 159

||:|||||||||:||||:|||||||||||||||||||||

orf97ng VRTAYTDTRALIVGSRISFDEVANTLANAEKLIQKTVGE 159

预计全长ORF97ng核苷酸序列<SEQ ID 361>编码的蛋白质具有氨基酸序列<SEQ ID 362>：

1 MKHILPPIAA SAFCISTASA HPAGKPPTQN ETAMTTHTLT SKYSFDETVS

51 RLETAIKSKG MDIFAVIDHQ EAARRNGLTM QPAKVIVFGT PKAGTPLMVK

101 DPAFALQLPL RVLVTETDGK VRTAYTDTRA LIVGSRISFD EVANTLANAE

151 KLIQKTVGE*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 363>：

1 ATGAAACACA TACTCCCcct gatcgccgca TccgcactCT GCATTTCAAC

51 CGCTTCGGCA CACCCTGCCG GCAAACCGCC CACCCAAAAC GAAACCGCTA

101 TGACCACGCA CACCCTCACC TCGAAATACA GTTTTGACGA AACCGTCAGC

151 CGCCTTGAAA CCGCCATAAA AAGCAAAGGG ATGGACATTT TTGCCGTCAT

201 CGACCATCAG GAAGCGGCAC GCCGAAACGG CCTGACCATG CAGCCGGCAA

251 AAGTCATCGT CTTCGGCACG CCCAAGGCCG GTACGCCgct GATGGTCAAA

301 GACCCCGCCT TCGCCCTGCA ACTGCCCCTG CGCGTCCTCG TTACCGAAAC

351 GGACGGCAAA GTACGCACCG CCTATACCGA TACGCGCGCC CTCATCGTCG

401 GCAGCCGCAT CAGTTTCGAC GAAGTGGCAA ACACTTTGGC AAACGCCGAA

451 AAACTGATAC AAAAAACCGT AGGCGAATAA

它对应于氨基酸序列<SEQ ID 364；ORF97ng-1>：

1 MKHILPLIAA SALCISTASA HPAGKPPTQN ETAMTTHTLT SKYSFDETVS

51 RLETAIKSKG MDIFAVIDHQ EAARRNGLTM QPAKVIVFGT PKAGTPLMVK

101 DPAFALQLPL RVLVTETDGK VRTAYTDTRA LIVGSRISFD EVANTLANAE

151 KLIQKTVGE*

ORF97ng-1和ORF97-1显示在159个氨基酸的重叠区内有96.2％的相同性：

10 20 30 40 50 60

orf97-1.pep MKHILPLIAASALCISTASAHPASEPSTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG

|||||||||||||||||||||||::| |||||||||||||||||||||||||||||||||

orf97ng-1 MKHILPLIAASALCISTASAHPAGKPPTQNETAMTTHTLTSKYSFDETVSRLETAIKSKG

10 20 30 40 50 60

70 80 90 100 110 120

orf97-1.pep MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf97ng-1 MDIFAVIDHQEAARRNGLTMQPAKVIVFGTPKAGTPLMVKDPAFALQLPLRVLVTETDGK

70 80 90 100 110 120

130 140 150 160

orf97-1.pep VRAAYTDTRALIAGSRIGFDEVANTLANAEKLIQKTVGEX

||:|||||||||:||||:||||||||||||||||||||||

orf97ng-1 VRTAYTDTRALIVGSRISFDEVANTLANAEKLIQKTVGEX

130 140 150 160

根据该分析，包括此淋球菌蛋白中有一个推定的前导序列，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF97-1(15.3kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图12A和12B分别显示了GST-融合蛋白和His-融合蛋白的亲和纯化结果。用纯化的GST-融合蛋白免疫小鼠，用小鼠血清进行Western印迹(图12C)，ELISA(阳性结果)，和FACS分析(图12D).这些实验确认ORF97-1是一种外露蛋白，且是一种有用的免疫原。

图12E显示出ORF97-1的亲水性、抗原性指数和AMPHI区域的曲线。

实施例43

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA<SEQ ID 365>：

1 ATGGCTTTTA TTACGCGCTT ATTCAAAAGC AGTAAATGGC TGATTGTGCC

51 GCTGATGCTC CCCGCCTTTC AGAATGTGGC GGCGGAGGGG ATAGATGTGA

101 GCCGTGCCGA AGCGAGGATA ACCGACGGCG GGCAGCTTTC CATCAGCAGC

151 CGCTTCCAAA CCGAGCTGCC CGACCAGCTC CAACAGGCGT TGCGCCGGGg

201 CGTGCCGCTC AACTTTACCT TAAGCTGGCA GCTTTCCGCC CCGATAATCG

251 CTTCTTATCG GTTTAAATTG GGGCAACTGA TTGGCGATGA CGACaATATT

301 GACTACAAAC TGAGTTTCCA TCCGCTGACc AaACGCTACC GCGTTACCgT

351 CGgCGCGTTT TCGACAGACT ACGACACCTT GGATGCGGCA TTGCGCGCGA

401 CCGGCGCGGT TGCCAACTGG AAAGTCCTGA ACAAAGGCGC GCTGTCCGGT

451 GCGGAAGCAG GGGAAACCAA GGCGGAAATC CGCCTGACGC TGTCCACTTC

501 AAAACTGCCC AAGCCTTTTC AAATCAATGC ATTGACTTCT CAAAACTGGC

551 ATTTGGATTC GGGTTGGAAA CCTCTAAACA TCATCGGGAA CAAATAA

它对应于氨基酸序列<SEQ ID 366；ORF106>：

1 MAFITRLFKS SKWLIVPLML PAFQNVAAEG IDVSRAEARI TDGGQLSISS

51 RFQTELPDQL QQALRRGVPL NFTLSWQLSA PIIASYRFKL GQLIGDDDNI

101 DYKLSFHPLT KRYRVTVGAF STDYDTLDAA LRATGAVANW KVLNKGALSG

151 AEAGETKAEI RLTLSTSKLP KPFQINALTS QNWHLDSGWK PLNIIGNK*

进一步的工作揭示了下列DNA序列<SEQ ID 367>：

1 ATGGCTTTTA TTACGCGCTT ATTCAAAAGC AGTAAATGGC TGATTGTGCC

51 GCTGATGCTC CCCGCCTTTC AGAATGTGGC GGCGGAGGGG ATAGATGTGA

101 GCCGTGCCGA AGCGAGGATA ACCGACGGCG GGCAGCTTTC CATCAGCAGC

151 CGCTTCCAAA CCGAGCTGCC CGACCAGCTC CAACAGGCGT TGCGCCGGGG

201 CGTGCCGCTC AACTTTACCT TAAGCTGGCA GCTTTCCGCC CCGATAATCG

251 CTTCTTATCG GTTTAAATTG GGGCAACTGA TTGGCGATGA CGACAATATT

301 GACTACAAAC TGAGTTTCCA TCCGCTGACC AACCGCTACC GCGTTACCGT

351 CGGCGCGTTT TCGACAGACT ACGACACCTT GGATGCGGCA TTGCGCGCGA

401 CCGGCGCGGT TGCCAACTGG AAAGTCCTGA ACAAAGGCGC GCTGTCCGGT

451 GCGGAAGCAG GGGAAACCAA GGCGGAAATC CGCCTGACGC TGTCCACTTC

501 AAAACTGCCC AAGCCTTTTC AAATCAATGC ATTGACTTCT CAAAACTGGC

551 ATTTGGATTC GGGTTGGAAA CCTCTAAACA TCATCGGGAA CAAATAA

它对应于氨基酸序列<SEQ ID 368；ORF106-1>：

1 MAFITRLFKS SKWLIVPLML PAFQNVAAEG IDVSRAEARI TDGGQLSISS

51 RFQTELPDQL QQALRRGVPL NFTLSWQLSA PIIASYRFKL GQLIGDDDNI

101 DYKLSFHPLT NRYRVTVGAF STDYDTLDAA LRATGAVANW KVLNKGALSG

151 AEAGETKAEI RLTLSTSKLP KPFQINALTS QNWHLDSGWK PLNIIGNK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF106显示与脑膜炎奈瑟球菌菌株A的ORF(ORF106a)在重叠的199个氨基酸内有87.4％的相同性：

10 20 30 40 50 59

orf106.pep MAFITRLFKSSK-WLIVPLMLPAFQNVAAEGIDVSRAEARITDGGQLSISSRFQTELPDQ

|||||||||| | ||:: || :: ::||||||||||||||:|||||| ||||||||||

orf106a MAFITRLFKSIKQWLVLLPMLSVLPDAAAEGIDVSRAEARIXDGGQLSXXSRFQTELPDQ

10 20 30 40 50 60

60 70 80 90 100 110 119

orf106.pep LQQALRRGVPLNFTLSWQLSAPIIASYRFKLGQLIGDDDNIDYKLSFHPLTKRYRVTVGA

|| | ||| || || ||||||||||||| ||||||||| |||||||||||:||||||||

orf106a LQXAXXRGVXLNXTLXWQLSAPIIASYRFXLGQLIGDDDXIDYKLSFHPLTNRYRVTVGA

70 80 90 100 110 120

120 130 140 150 160 170 179

orf106.pep FSTDYDTLDAALRATGAVANWKVLNKGALSGAEAGETKAEIRLTLSTSKLPKPFQINALT

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf106a FSTXYDTLDAALRATGAVANWKVLNKGALSGAEAGETKAEIRLTLSTSKLPKPFQINALT

130 140 150 160 170 180

180 190 199

orf106.pep SQNWHLDSGWKPLNIIGNKX

||||||||||||||||||||

orf106a SQNWHLDSGWKPLNIIGNKX

190 200

由于残基11位的K被替代成N，ORF106a和ORF106-1之间在相同的199个氨基酸重叠区内的同源性是87.9％。

全长ORF106a核苷酸序列<SEQ ID 369>是：

1 ATGGCTTTTA TTACGCGCTT ATTCAAAAGC ATTAAACAAT GGCTTGTGCT

51 GCTGCCGATG CTTTCCGTTT TGCCGGACGC GGCGGCGGAG GGGATAGATG

101 TGAGCCGCGC CGAAGCGAGG ATAANCGACG GCGGGCAGCT TTCCATNAGN

151 AGCCGCTTCC AAACCGAGCT GCCCGACCAG CTCCAANNNG CGNNGNGCCG

201 GGGCGTGNCG CTCAACTNTA CCTTAAGNTG GCAGCTTTCC GCCCCGATAA

251 TCGCTTCTTA TCGGTTTNAA TTGGGGCAAC TGATTGGCGA TGACGACNAT

301 ATTGACTACA AACTGAGTTT CCATCCGCTG ACCAACCGCT ACCGCGTTAC

351 CGTCGGCGCG TTTTCGACAG ANTACGACAC CTTGGATGCG GCATTGCGCG

401 CGACCGGCGC GGTTGCCAAC TGGAAAGTCC TGAACAAAGG CGCGCTGTCC

451 GGTGCGGAAG CAGGGGAAAC CAAGGCGGAA ATCCGCCTGA CGCTGTCCAC

501 TTCAAAACTG CCCAAGCCTT TTCAAATCAA TGCATTGACT TCTCAAAACT

551 GGCATTTGGA TTCGGGTTGG AAACCTCTAA ACATCATCGG GAACAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 370>：

1 MAFITRLFKS IKQWLVLLPM LSVLPDAAAE GIDVSRAEAR IXDGGQLSXX

51 SRFQTELPDQ LQXAXXRGVX LNXTLXWQLS APIIASYRFX LGQLIGDDDX

101 IDYKLSFHPL TNRYRVTVGA FSTXYDTLDA ALRATGAVAN WKYLNKGALS

151 GAEAGETKAE IRLTLSTSKL PKPFQINALT SQNWHLDSGW KPLNIIGNK*

与淋病奈瑟球菌的预计ORF的同源性

ORF106显示与淋病奈瑟球菌的预计ORF(ORF106.ng)在重叠的199个氨基酸内有90.5％的相同性：

orf106.pep MAFITRLFKSSK-WLIVPLMLPAFQNVAAEGIDVSRAEARITDGGQLSISSRFQTELPDQ 59

|||||||||| | ||:: :| :: ::||||| ::||||||||||:||||||||||||||

orf106ng MAFITRLFKSIKQWLVLLPILSVLPDAAAEGIAATRAEARITDGGRLSISSRFQTELPDQ 60

orf106.pep LQQALRRGVPLNFTLSWQLSAPIIASYRFKLGQLIGDDDNIDYKLSFHPLTKRYRVTVGA 119

|||||||||||||||||||||| ||||||||||||||||||||||||||||:||||||||

orf106ng LQQALRRGVPLNFTLSWQLSAPTIASYRFKLGQLIGDDDNIDYKLSFHPLTNRYRVTVGA 120

orf106.pep FSTDYDTLDAALRATGAVANWKVLNKGALSGAEAGETKAEIRLTLSTSKLPKPFQINALT 179

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf106ng FSTDYDTLDAALRATGAVANWKVLNKGALSGAEAGETKAEIRLTLSTSKLPKPFQINALT 180

orf106.pep SQNWHLDSGWKPLNIIGNK 198

|||||||||||||||||||

orf106ng SQNWHLDSGWKPLNIIGNK 199

由于残基111位的K被替换成N，ORF106ng和ORF106-1之间在相同的199个氨基酸重叠区内的同源性是91.0％。

全长ORF106ng核苷酸序列<SEQ ID 371>是：

1 ATGGCTTTTA TTACGCGCTT ATTCAAAAGC ATTAAACAAT GGCTTGTGCT

51 GTTGCCGATA CTCTCCGTTT TGCCGGACGC GGCGGCGGAG GGCATTGCCG

101 CGACCCGCGC CGAAGCGAGG ATAACCGACG GCGGGCGGCT TTCCATCAGC

151 AGCCGCTTCC AAACCGAGCT GCCCGACCAG CTCCAACAGG CGTTGCGCCG

201 GGGCGTACCG CTCAACTTTA CCTTAAGCTG GCAGCTTTCC GCCCCGACAA

251 TCGCTTCTTA TCGGTTTAAA TTGGGGCAAC TGATTGGCGA TGACGACAAT

301 ATTGACTACA AACTAAGTTT CCATCCGCTG ACCAACCGCT ACCGCGTTAC

351 CGTCGGCGCA TTTTCCACCG ATTACGACAC TTTGGATGCG GCATTGCGCG

401 CGACCGGCGC GGTTGCCAAC TGGAAAGTCC TGAACAAAGG CGCGTTGTCC

451 GGTGCGGAAG CAGGGGAAAC CAAGGCGGAA ATCCGCCTGA CGCTGTCCAC

501 TTCAAAACTG CCCAAGCCTT TCCAAATCAA CGCATTGACT TCTCAAAACT

551 GGCATTTGGA TTCGGGTTGG AAACCTCTAA ACATCATCGG GAACAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 372>：

1 MAFITRLFKS IKQWLVLLPI LSVLPDAAAE GIAATRAEAR ITDGGRLSIS

51 SRFQTELPDQ LQQALRRGVP LNFTLSWQLS APTIASYRFK LGQLIGDDDN

101 IDYKLSFHPL TNRYRVTVGA FSTDYDTLDA ALRATGAVAN WKVLNKGALS

151 GAEAGETKAE IRLTLSTSKL PKPFQINALT SQNWHLDSGW KPLNIIGNK*

如上所述，将ORF106-1(18kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图13A显示出His-融合蛋白亲和纯化的结果，图13B显示出GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，将小鼠血清用于FACS分析(图13C)。这些实验确认ORF106-1是一种外露蛋白，且是一种有用的免疫原。

实施例44

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 373>：

1 ATGGACACAA AAGAAATCCT CGG.TACGCG GcAGGcTCGA TCGGCAGCGC

51 GGTTTTAGCC GTCATCATCc TGCCGCTGCT GTCGTGGTAT TTCCCCGCCG

101 ACGACATCGG GCGCATCGTG CTGATGCAGA CGGCGGCGGG GCTgACGGTG

151 TCGGTGTTGT GCCTCGGGCT GGATCAGGCA TACGTCCGCG AATACTATGC

201 CACCGCCGAC AAAGACAcCT TGTTCAAAAC CCTGTTCCTG CCGCCGCTGC

251 TGTCTGCCGC CGCGATAGCC GCCCTGCTGC TTTCCCGCCC GTCCCTGCCG

301 TCTGAAATCC TGTTTTCACT CGACGATGCC gCCGCCGGCa TCGGGCTGGT

351 GCTGTTTGAA CtGAGCTTCC TGCCCATCCG cTTTCTCTTA CTGGTTTTGC

401 GTATGGAAGG ACGCGCCcTT GCCTTTTCGT CCGCGCAACT CGTGCcCAAG

451 CTCGCCATCC TGCTGCTG.T GCCGCTGACG GTCGGGCTGC TGCACTTTCC

501 AGCGAACACC GCCGTCCTGA CCGCCGTTTA CGCGCTGGCA AACCTTGCCG

551 CCGCCGCCTT TTTGCTGTTT CAAAACCGAT GCCGTCTGAA GGCCGTCCGG

601 CACGCACCGT TTTCGCCCGC CGTCCTGCAC CGGGGG.TGC GCTACGGCAT

651 ACCGATCGCA CTGAGCAGCA TCGCCTATTG GGGGCTGGCA TCCGCCGACC

701 GTTTGTTCCT GAAAAAATAT GCCGGCCTGG AACAGCTCGG CGTTTATTCG

751 ATGGGTATTT CGTTCGGCGG GGCGGCATTA TTGTTCCAAA GCATCTTTTC

801 AACGGTCTGG ACACCGTATA TTTTCCGCGC AATCGAAGAA AACGCCCCGC

851 CCGCTCGCCT CTCGGCAACG GCAGAATCCG CCGCCGCCCT GCTTGCCTCC

901 GCCCTCTGC. TGACCGGCAT TTTCTCGCCC CTTGCCTCCC TCCTGCTGCC

951 GGAAAACTAC GCCGCCGTCC GGTTTATCGT CGTATCGTGT ATG.TGCCGC

1001 CGCTGTTTTG CACGCTGGCG GAAATCAGCG GCATCGGTTT GAACGTCGTT

1051 CGCAAAACGC GCCCGATCGC GCTCGCCACC TTGGGCGCGC TGGCGGCAAA

1101 CCTGCTGCTG CTGGGGCTTG ACCGTGCCGT ACCGGCGAGG CCGCC.GGCG

1151 CGGCGGTTGC CTGTGCCGCC TCATTCTGGC TGTTTTTTGC CTTCAAGACC

1201 GAAAGCTCyT GCCGCCTGTG GCAGCCGCTC AAACGCCTGC CGCTTTATCT

1251 GCACACATTG TTCTGCCTGA CCTCCTCGGC GGCCTACACC TGCTTCGGCA

1301 CGCCGGCAAA CTATCCCCTG TTTGCCGGCG TATGGGCGGC ATATCTGGCA

1351 GGCTGCATCC TGCGCCACCG GAAAGATTTG CACAAACTGT TTCATTATTT

1401 GAAAAAACAA GGTTTCCCAT TATGA

它对应于氨基酸序列<SEQ ID 374；ORF10>：

1 MDTKEILXYA AGSIGSAVLA VIILPLLSWY FPADDIGRIV LMQTAAGLTV

51 SVLCLGLDQA YVREYYATAD KDTLFKTLFL PPLLSAAAIA ALLLSRPSLP

101 SEILFSLDDA AAGIGLVLFE LSFLPIRFLL LVLRMEGRAL AFSSAQLVPK

151 LAILLLXPLT VGLLHFPANT AVLTAVYALA NLAAAAFLLF QNRCRLKAVR

201 HAPFSPAVLH RGXRYGIPIA LSSIAYWGLA SADRLFLKKY AGLEQLGVYS

251 MGISFGGAAL LFQSIFSTVW TPYIFRAIEE NAPPARLSAT AESAAALLAS

301 ALCXTGIFSP LASLLLPENY AAVRFIVVSC MXPPLFCTLA EISGIGLNVV

351 RKTRPIALAT LGALAANLLL LGLDRAVPAR PXGAAVACAA SFWLFFAFKT

401 ESSCRLWQPL KRLPLYLHTL FCLTSSAAYT CFGTPANYPL FAGVWAAYLA

451 GCILRHRKDL HKLFHYLKKQ GFPL*

进一步的序列分析揭示了完整的DNA序列<SEQ ID 375>是：

1 ATGGACACAA AAGAAATCCT CGGCTACGCG GCAGGCTCGA TCGGCAGCGC

51 GGTTTTAGCC GTCATCATCC TGCCGCTGCT GTCGTGGTAT TTCCCCGCCG

101 ACGACATCGG GCGCATCGTG CTGATGCAGA CGGCGGCGGG GCTGACGGTG

151 TCGGTGTTGT GCCTCGGGCT GGATCAGGCA TACGTCCGCG AATACTATGC

201 CACCGCCGAC AAAGACACCT TGTTCAAAAC CCTGTTCCTG CCGCCGCTGC

251 TGTCTGCCGC CGCGATAGCC GCCCTGCTGC TTTCCCGCCC GTCCCTGCCG

301 TCTGAAATCC TGTTTTCACT CGACGATGCC GCCGCCGGCA TCGGGCTGGT

351 GCTGTTTGAA CTGAGCTTCC TGCCCATCCG CTTTCTCTTA CTGGTTTTGC

401 GTATGGAAGG ACGCGCCCTT GCCTTTTCGT CCGCGCAACT CGTGCCCAAG

451 CTCGCCATCC TGCTGCTGCT GCCGCTGACG GTCGGGCTGC TGCACTTTCC

501 AGCGAACACC GCCGTCCTGA CCGCCGTTTA CGCGCTGGCA AACCTTGCCG

551 CCGCCGCCTT TTTGCTGTTT CAAAACCGAT GCCGTCTGAA GGCCGTCCGG

601 CACGCACCGT TTTCGCCCGC CGTCCTGCAC CGGGGGCTGC GCTACGGCAT

651 ACCGATCGCA CTGAGCAGCA TCGCCTATTG GGGGCTGGCA TCCGCCGACC

701 GTTTGTTCCT GAAAAAATAT GCCGGCCTGG AACAGCTCGG CGTTTATTCG

751 ATGGGTATTT CGTTCGGCGG GGCGGCATTA TTGTTCCAAA GCATCTTTTC

801 AACGGTCTGG ACACCGTATA TTTTCCGCGC AATCGAAGAA AACGCCCCGC

851 CCGCCCGCCT CTCGGCAACG GCAGAATCCG CCGCCGCCCT GCTTGCCTCC

901 GCCCTCTGCC TGACCGGCAT TTTCTCGCCC CTTGCCTCCC TCCTGCTGCC

951 GGAAAACTAC GCCGCCGTCC GGTTTATCGT CGTATCGTGT ATGCTGCCGC

1001 CGCTGTTTTG CACGCTGGCG GAAATCAGCG GCATCGGTTT GAACGTCGTC

1051 CGCAAAACGC GCCCGATCGC GCTCGCCACC TTGGGCGCGC TGGCGGCAAA

1101 CCTGCTGCTG CTGGGGCTTG CCGTGCCGTC CGGCGGCGCG CGCGGCGCGG

1151 CGGTTGCCTG TGCCGCCTCA TTCTGGCTGT TTTTTGCCTT CAAGACCGAA

1201 AGCTCCTGCC GCCTGTGGCA GCCGCTCAAA CGCCTGCCGC TTTATCTGCA

1251 CACATTGTTC TGCCTGACCT CCTCGGCGGC CTACACCTGC TTCGGCACGC

1301 CGGCAAACTA TCCCCTGTTT GCCGGCGTAT GGGCGGCATA TCTGGCAGGC

1351 TGCATCCTGC GCCACCGGAA AGATTTGCAC AAACTGTTTC ATTATTTGAA

1401 AAAACAAGGT TTCCCATTAT GA

它对应于氨基酸序列<SEQ ID 376；ORF10-1>：

1 MDTKEILGYA AGSIGSAVLA VIILPLLSWY FPADDIGRI V LMQTAAGLTV

51 SVLCLGLDQA YVREYYATAD KDTLFKT LFL PPLLSAAAIA ALLLSRPSLP

101 SEILFSLDDA AAGIG LVLFE LSFLPIRFLL LVLRMEGRAL AFSSAQL VPK

151 LAILLLLPLT VGLLHFPANT A VLTAVYALA NLAAAAFLLF QNRCRLKAVR

201 HAPFSPAVLH RGLRYGIPIA LSSIAYWGLA SADRLFLKKY AGLEQ LGVYS

251 MGISFGGAAL LFQSIFSTVW TPYIFRAIEE NAPPARLSAT AESA AALLAS

301 ALCLTGIFSP LASLLLPENY AAVRFIVVSC MLPPLFCTLA EISGIGLNVV

351 RKTRP IALAT LGALAANLLL LGLAVPSGGA R GAAVACAAS FWLFFAFKTE

401 SSCRLWQPLK RLPLYLHTLF CLTSSAAYTC FGTPANYPLF AGVWAAYLAG

451 CILRHRKDLH KLFHYLKKQG FPL*

该氨基酸序列的计算机分析给出了下列结果：

预计

预计ORF10-1是一种整合膜蛋白的前体，因为它包含几个(12-13个)潜在跨膜片段，以及一个可能的可断裂信号肽。

与唾液链球菌嗜热亚种的EpsM(登录号为U40830)的同源性

ORF10显示出与唾液链球菌嗜热亚种的epsM基因同源，该基因编码的蛋白质大小与ORF10相似，并涉及外多糖的合成。它还与原核生物膜蛋白有其它同源性：

相同性＝(25％)

询问： 213 LRYGIPLALSSLAYWGLASADRLFLKKYAGLEQLGVYSMGISFGGAALLLQSIFSTVW 270

L Y +PL SS+ +W L ++ R F+ + G G+ ++ + +IF+ W

目标： 210 LYYALPLIPSSILWWLLNASSRYFVLFFLGAGANGLLAVATKIPSIISIFNTIFTQAW 267

相同性＝15/57(26％)，阳性＝31/57(54％)

询问： 7 LGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQAYVR 63

L + G++GS +L +++PL ++ + G L QT A L + ++ + + A +R

目标： 12 LVFTIGNLGSKLLVFLLVPLYTYAMTPQEYGMADLYQTTANLLLPLITMNVFDATLR 68

相同性＝16/96(16％)，阳性＝36/96(37％)

询问：307 IFSPLASLLLPENYAAVRFTVVSCMLPPLFYTLTEISGIGLNVVRKTRPIXXXXXXXXXX 366

+ P+ ++ +YA+ V ML LF + ++ G ++T+ +

目标：305 VLKPIVEKVVSSDYASSWQYVPFFMLSMLFSSFSDFFGTNYIAAKQTKGVFMTSIYGTIV 364

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF10显示与脑膜炎奈瑟球菌菌株A的ORF(ORF10a)在重叠的475个氨基酸内有95.4％的相同性：

10 20 30 40 50 60

orf10.pep MDTKEILXYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10a MDTKEILGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

10 20 30 40 50 60

70 80 90 100 110 120

orf10.pep YVREYYATADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10a YVREYYAAADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

70 80 90 100 110 120

130 140 150 160 170 180

orf10.pep LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLXPLTVGLLHFPANTAVLTAVYALA

|||||||||||||||||||||||||||| ||||||| |||||||||||||||||||||||

orf10a LSFLPIRFLLLVLRMEGRALAFSSAQLVSKLAILLLLPLTVGLLHFPANTAVLTAVYALA

130 140 150 160 170 180

190 200 210 220 230 240

orf10.pep NLAAAAFLLFQNRCRLKAVRHAPFSPAVLHRGXRYGIPIALSSIAYWGLASADRLFLKKY

||||||||||||||||||||:|||| |||||| |||||||||||||||||||||||||||

orf10a NLAAAAFLLFQNRCRLKAVRRAPFSSAVLHRGLRYGIPIALSSIAYWGLASADRLFLKKY

190 200 210 220 230 240

250 260 270 280 290 300

orf10.pep AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEENAPPARLSATAESAAALLAS

||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||

orf10a AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEANAPPARLSATAESAAALLAS

250 260 270 280 290 300

310 320 330 340 350 360

orf10.pep ALCXTGIFSPLASLLLPENYAAVRFIVVSCMXPPLFCTLAEISGIGLNVVRKTRPIALAT

||| ||||||||||||||||||||||||||| |||||||:||||||||||||||||||||

orf10a ALCLTGIFSPLASLLLPENYAAVRFIVVSCMLPPLFCTLVEISGIGLNVVRKTRPIALAT

310 320 330 340 350 360

370 380 390 400 410 419

orf10.pep LGALAANLLLLGLDRAVPAR-PXGAAVACAASFWLFFAFKTESSCRLWQPLKRLPLYLHT

||||||||||||| |||: ||||||||||||||:|||||||||||||||||||:||

orf 10a LGALAANLLLLGL--AVPSGGARGAAVACAASFWLFFVFKTESSCRLWQPLKRLPLYMHT

370 380 390 400 410

420 430 440 450 460 470

orf10.pep LFCLTSSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKDLHKLFHYLKKQGFPLX

||||:||||||||||||||||||||||:||||||||||||||||||||||||||||

orf10a LFCLASSAAYTCFGTPANYPLFAGVWAVYLAGCILRHRKDLHKLFHYLKKQGFPLX

420 430 440 450 460 470

全长ORF10a核苷酸序列<SEQ ID 377>是：

1 ATGGACACAA AAGAAATCCT CGGCTACGCG GCAGGCTCGA TCGGCAGCGC

51 GGTTTTAGCC GTCATCATCC TGCCGCTGCT GTCGTGGTAT TTCCCTGCCG

101 ACGACATCGG ACGCATCGTG CTGATGCAGA CGGCGGCGGG GCTGACGGTG

151 TCGGTGTTGT GCCTCGGGCT GGATCAGGCA TACGTCCGCG AATACTATGC

201 CGCCGCCGAC AAAGACACTT TGTTCAAAAC CCTGTTCCTG CCGCCGCTGC

251 TGTCTGCCGC CGCGATAGCC GCCCTGCTGC TTTCCCGCCC ATCCCTGCCG

301 TCTGAAATCC TGTTTTCGCT CGACGATGCC GCCGCCGGCA TCGGGCTGGT

351 GCTGTTTGAA CTGAGCTTCC TGCCCATCCG CTTTCTCTTA CTGGTTTTGC

401 GTATGGAAGG ACGCGCCCTT GCCTTTTCGT CCGCGCAACT CGTGTCCAAG

451 CTCGCCATCC TGCTGCTGCT GCCGCTGACG GTCGGGCTGC TGCACTTTCC

501 GGCGAACACC GCCGTCCTGA CCGCCGTTTA CGCGCTGGCA AACCTTGCCG

551 CCGCCGCCTT TTTGCTGTTT CAAAACCGAT GCCGTCTGAA GGCCGTCCGG

601 CGCGCACCGT TTTCATCCGC CGTCCTGCAT CGCGGCCTGC GCTACGGCAT

651 ACCGATCGCA CTAAGCAGCA TCGCCTATTG GGGGCTGGCA TCCGCCGACC

701 GTTTGTTCCT GAAAAAATAT GCCGGCCTAG AACAGCTCGG CGTTTATTCG

751 ATGGGTATTT CGTTCGGCGG AGCGGCATTA TTGTTCCAAA GCATCTTTTC

801 AACGGTCTGG ACACCGTATA TTTTCCGCGC AATCGAAGCA AACGCCCCGC

851 CCGCCCGCCT CTCGGCAACG GCAGAATCCG CCGCCGCCCT GCTTGCCTCC

901 GCCCTCTGCC TGACCGGCAT TTTCTCGCCC CTCGCCTCCC TCCTGCTGCC

951 GGAAAACTAC GCCGCCGTCC GGTTTATCGT CGTATCGTGT ATGCTGCCTC

1001 CGCTGTTTTG CACGCTGGTA GAAATCAGCG GCATCGGTTT GAACGTCGTC

1051 CGAAAAACAC GCCCGATCGC GCTCGCCACC TTGGGCGCGC TGGCGGCAAA

1101 CCTGCTGCTG CTGGGGCTTG CCGTACCGTC CGGCGGCGCG CGCGGCGCGG

1151 CGGTTGCCTG TGCCGCCTCA TTTTGGCTGT TTTTTGTTTT CAAGACCGAA

1201 AGCTCCTGCC GCCTGTGGCA GCCGCTCAAA CGCCTGCCGC TTTATATGCA

1251 CACATTGTTC TGCCTGGCCT CCTCGGCGGC CTACACCTGC TTCGGCACTC

1301 CGGCAAACTA CCCCCTGTTT GCCGGCGTAT GGGCGGTATA TCTGGCAGGC

1351 TGCATCCTGC GCCACCGGAA AGATTTGCAC AAACTGTTTC ATTATTTGAA

1401 AAAACAAGGT TTCCCATTAT GA

它编码的蛋白质具有氨基酸序列<SEQ ID 378>：

1 MDTKEILGYA AGSIGSAVLA VIILPLLSWY FPADDIGRIV LMQTAAGLTV

51 SVLCLGLDQA YVREYYAAAD KDTLFKTLFL PPLLSAAAIA ALLLSRPSLP

101 SEILFSLDDA AAGIGLVLFE LSFLPIRFLL LVLRMEGRAL AFSSAQLVSK

151 LAILLLLPLT VGLLHFPANT AVLTAVYALA NLAAAAFLLF QNRCRLKAVR

201 RAPFSSAVLH RGLRYGIPIA LSSIAYWGLA SADRLFLKKY AGLEQLGVYS

251 MGISFGGAAL LFQSIFSTVW TPYIFRAIEA NAPPARLSAT AESAAALLAS

301 ALCLTGIFSP LASLLLPENY AAVRFIVVSC MLPPLFCTLV EISGIGLNVV

351 RKTRPIALAT LGALAANLLL LGLAVPSGGA RGAAVACAAS FWLFFVFKTE

401 SSCRLWQPLK RLPLYMHTLF CLASSAAYTC FGTPANYPLF AGVWAVYLAG

451 CILRHRKDLH KLFHYLKKQG FPL*

ORF10a和ORF10-1显示在475个氨基酸的重叠区内有95.4％的相同性：

10 20 30 40 50 60

orf10-1.pep MDTKEILXYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10a MDTKEILGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

10 20 30 40 50 60

70 80 90 100 110 120

orf10-1.pep YVREYYATADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10a YVREYYAAADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

70 80 90 100 110 120

130 140 150 160 170 180

orf10-1.pep LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLXPLTVGLLHFPANTAVLTAVYALA

|||||||||||||||||||||||||||| ||||||| |||||||||||||||||||||||

orf10a LSFLPIRFLLLVLRMEGRALAFSSAQLVSKLAILLLLPLTVGLLHFPANTAVLTAVYALA

130 140 150 160 170 180

190 200 210 220 230 240

orf10-1.pep NLAAAAFLLFQNRCRLKAVRHAPFSPAVLHRGXRYGIPIALSSIAYWGLASADRLFLKKY

||||||||||||||||||||:|||| |||||| |||||||||||||||||||||||||||

orf10a NLAAAAFLLFQNRCRLKAVRRAPFSSAVLHRGLRYGIPIALSSIAYWGLASADRLFLKKY

190 200 210 220 230 240

250 260 270 280 290 300

orf10-1.pep AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEENAPPARLSATAESAAALLAS

||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||

orf10a AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEANAPPARLSATAESAAALLAS

250 260 270 280 290 300

310 320 330 340 350 360

orf10-1.pep ALCXTGIFSPLASLLLPENYAAVRFIVVSCMXPPLFCTLAEISGIGLNVVRKTRPIALAT

||| ||||||||||||||||||||||||||| |||||||:||||||||||||||||||||

orf10a ALCLTGIFSPLASLLLPENYAAVRFIVVSCMLPPLFCTLVEISGIGLNVVRKTRPIALAT

310 320 330 340 350 360

370 380 390 400 410 419

orf10-1.pep LGALAANLLLLGLDRAVPAR-PXGAAVACAASFWLFFAFKTESSCRLWQPLKRLPLYLHT

||||||||||||| |||: ||||||||||||||:|||||||||||||||||||:||

orf10a LGALAANLLLLGL--AVPSGGARGAAVACAASFWLFFVFKTESSCRLWQPLKRLPLYMHT

370 380 390 400 410

420 430 440 450 460 470

orf10-1.pep LFCLTSSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKDLHKLFHYLKKQGFPLX

||||:||||||||||||||||||||||:||||||||||||||||||||||||||||

orf10a LFCLASSAAYTCFGTPANYPLFAGVWAVYLAGCILRHRKDLHKLFHYLKKQGFPLX

420 430 440 450 460 470

与淋病奈瑟球菌的预计ORF的同源性

ORF10显示与淋病奈瑟球菌的预计ORF(ORF10.ng)在重叠的475个氨基酸内有94.1％的相同性：

orf10ng.pep MDTKEILGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA 60

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10nm MDTKEILXYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA 60

orf10ng.pep YVREYYAAADKDTLFKTLFLPPLLFSAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE 120

|||||||:|||||||||||||||| :||||||||||||||||||||||||||||||||||

orf10nm YVREYYATADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE 120

orf10ng.pep LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLLPLTVGLLHFPANTSVLTAVYALA 180

|||||||||||||||||||||||||||||||||||| |||||||||||||:|||||||||

orf10nm LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLXPLTVGLLHFPANTAVLTAVYALA 180

orf10ng.pep NLAAAAFLLFQNRCRLKAVRRAPFSPAVLHRGLRYGIPLALSSLAYWGLASADRLFLKKY 240

||||||||||||||||||||:||||||||||| |||||:||||:||||||||||||||||

orf10nm NLAAAAFLLFQNRCRLKAVRHAPFSPAVLHRGXRYGIPIALSSIAYWGLASADRLFLKKY 240

orf10ng.pep AGLEQLGVYSMGISFGGAALLLQSIFSTVWTPYIFRAIEENATPARLSATAESAAALLAS 300

|||||||||||||||||||||:|||||||||||||||||||| |||||||||||||||||

orf10nm AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEENAPPARLSATAESAAALLAS 300

orf10ng.pep ALCLTGIFSPLASLLLPENYAAVRFTVVSCMLPPLFYTLTEISGIGLNVVRKTRPIALAT 360

||| ||||||||||||||||||||| ||||| |||| ||:||||||||||||||||||||

orf10nm ALCXTGIFSPLASLLLPENYAAVRFIVVSCMXPPLFCTLAEISGIGLNVVRKTRPIALAT 360

370 380 390 400 410

orf10ng.pep LGALAANLLLLGL--AVPSGGTRGAAVACAASFWLFFVFKTESSCRLWQPLKRLPLYMHT

||||||||||||| |||: ||||||||||||||:|||||||||||||||||||:||

orf10nm LGALAANLLLLGLDRAVPAR-PXGAAVACAASFWLFFAFKTESSCRLWQPLKRLPLYLHT

370 380 390 400 410

420 430 440 450 460 470

orf10ng.pep LFCLASSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKNLHKLFHYLKKQGFPLX

||||:||||||||||||||||||||||||||||||||||:||||||||||||||||

orf10nm LFCLTSSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKDLHKLFHYLKKQGFPLX

420 430 440 450 460 470

全长ORF10ng核苷酸序列<SEQ ID 379>是：

1 ATGGACACAA AAGAAATCCT CGGCTACGCG GCAGGCTCGA TCGGCAGCGC

51 GGTTTTAGCC GTCATCATCC TGCCGCTGCT GTCGTGGTAT TTCcccgCCG

101 ACGACATCGG GCGCATCGTG CTGATGCAGA CGGCGGCGGG ACTGACGGTG

151 TCGGTATTGT GCCTCGGGCT GGATCAGGCA TACGTCCGCG AATACTATGC

201 CGCCGCCGAC AAAGACACTT TGTTCAAAAC CCTGTTCCTG CCGCCGCTGC

251 TGTTTTCCGC CGCGATAGCC GCCCTGCTGC TTTCCCGCCC GTCCCTGCCG

301 TCTGAAATCC TGTTTTCGCT CGACGATGCC GCCGCCGGCA TCGGGCTGGT

351 GCTGTTTGAA CTGAGCTTCC TGCCCATCCG CTTTCTCTTA CTGGTTTTGC

401 GTATGGAAGG GCGCGCCCTT GCCTTTTCGT CCGCGCAACT CGTGCCCAAA

451 CTCGCCATTC TGCTGCTGTT GCCGCTGACG GTCGGGCTGC TGCACTTTCC

501 GGCGAACACC TCCGTCCTGA CCGCCGTTTA CGCGCTGGCA AACCTTGCCG

551 CCGCCGCCTT TTTGCTGTTT CAAAACCGAT GCCGTCTGAA GGCCGTCCGG

601 CGCGCGCCGT TTTCGCCCGC CGTCCTGCAC CGGGGGCTGC GCTACGGCAT

651 ACCGCTCGCA CTGAGCAGCC TTGCCTATTG GGGGCTGGCA TCCGCCGACC

701 GTTTGTTCCT GAAAAAATAT GCGGGCCTGG AACAGCTCGG CGTTTATTCG

751 ATGGGTATTT CGTTCGGCGG GGCGGCATTA TTGCTCCAAA GCATCTTTTC

801 AACGGTCTGG ACACCGTATA TTTTCCGTGC AATCGAAGAA AACGCCACGC

851 CCGCCCGCCT CTCGGCAACG GCAGAATCCG CCGCCGCCCT GCTTGCCTCC

901 GCCCTCTGCC TGACCGGAAT TTTCTCGCCC CTCGCCTCCC TCCTGCTGCC

951 GGAAAACTAC GCCGCCGTCC GGTTTACCGT CGTATCGTGT ATGCTGccgc

1001 cgctGTTTTA CACGCTGACC GAAATCAGCG GCATCGGTTT GAACGTCGTC

1051 CGCAAAACGC GTCCGATCGC GCTTGCCACC TTGGGCGCGC TGGCGGCAAA

1101 CCTGCTGCTG CTGGGGCTTG CCGTACCGTC CGGCGGCACG CGCGGCGCGG

1151 CGGTTGCCTG TGCCGCCTCA TTCTGGTTGT TTTTTGTTTT CAAGACAGAA

1201 AGCTCCTGCC GCCTGTGGCA GCCGCTCAAA CGCCTGCCGC TTTATATGCA

1251 CACATTGTTC TGCCTgGCCT CCTCGGCGGC CTACACCTGC TTCGGCACAC

1301 CGGCAAACTA CCCcctgttt gccggcgtAT GGGCGGCATA TCTGGCAGGC

1351 TGCATCCTGC GCCACCGGAA AAATTTGCAC AAACTGTTTC ATTATTTGAA

1401 AAAACAAGGT TTCCCATTAT GA

它编码的蛋白质具有氨基酸序列<SEQ ID 380>：

1 MDTKEILGYA AGSIGSAVLA VIILPLLSWY FPADDIGRIV LMQTAAGLTV

51 SVLCLGLDQA YVREYYAAAD KDTLFKTL FL PPLLFSAAIA ALLLSRPSLP

101 SEILFSLDDA AAGIGLVLFE LSFLPIRFLL LVLRMEGRAL AFSSAQLVPK

151 LAILLLLPLT VGLLHFPANT SVLTAVYALA NLAAAAFLLF QNRCRLKAVR

201 RAPFSPAVLH RGLRYGIPLA LSSLAYWGLA SADRLFLKKY AGLEQLGVYS

251 MGISFGGAAL LLQSIFSTVW TPYIFRAIEE NATPARLSAT AESAAALLAS

301 ALCLTGIFSP LASLLLPENY AAVRFTVVSC MLPPLFYTLT EISGIGLNVV

351 RKTRPI ALAT LGALAANLLL LGLAVPSGGT RGAAVACAAS FWLFFVFKTE

401 SSCRLWQPLK RLPLYMHTLF CLASSAAYTC FGTPANYPLF AGVWAAYLAG

451 CILRHRKNLH KLFHYLKKQG FPL*

ORF10ng和OFF10-1显示在473个氨基酸的重叠区内有96.4％的相同性：

10 20 30 40 50 60

orf10-1.pep MDTKEILGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf10ng-1 MDTKEILGYAAGSIGSAVLAVIILPLLSWYFPADDIGRIVLMQTAAGLTVSVLCLGLDQA

10 20 30 40 50 60

70 80 90 100 110 120

orf10-1.pep YVREYYATADKDTLFKTLFLPPLLSAAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

|||||||:|||||||||||||||| :||||||||||||||||||||||||||||||||||

orf10ng-1 YVREYYAAADKDTLFKTLFLPPLLFSAAIAALLLSRPSLPSEILFSLDDAAAGIGLVLFE

70 80 90 100 110 120

130 140 150 160 170 180

orf10-1.pep LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLLPLTVGLLHFPANTAVLTAVYALA

||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||

orf10ng-1 LSFLPIRFLLLVLRMEGRALAFSSAQLVPKLAILLLLPLTVGLLHFPANTSVLTAVYALA

130 140 150 160 170 180

190 200 210 220 230 240

orf10-1.pep NLAAAAFLLFQNRCRLKAVRHAPFSPAVLHRGLRYGIPIALSSIAYWGLASADRLFLKKY

||||||||||||||||||||:|||||||||||||||||:||||:||||||||||||||||

orf10ng-1 NLAAAAFLLFQNRCRLKAVRRAPFSPAVLHRGLRYGIPLALSSLAYWGLASADRLFLKKY

190 200 210 220 230 240

250 260 270 280 290 300

orf10-1.pep AGLEQLGVYSMGISFGGAALLFQSIFSTVWTPYIFRAIEENAPPARLSATAESAAALLAS

|||||||||||||||||||||:|||||||||||||||||||| |||||||||||||||||

orf10ng-1 AGLEQLGVYSMGISFGGAALLLQSIFSTVWTPYIFRAIEENATPARLSATAESAAALLAS

250 260 270 280 290 300

310 320 330 340 350 360

orf10-1.pep ALCLTGIFSPLASLLLPENYAAVRFIVVSCMLPPLFCTLAEISGIGLNVVRKTRPIALAT

||||||||||||||||||||||||| |||||||||| ||:||||||||||||||||||||

orf10ng-1 ALCLTGIFSPLASLLLPENYAAVRFTVVSCMLPPLFYTLTEISGIGLNVVRKTRPIALAT

310 320 330 340 350 360

370 380 390 400 410 420

orf10-1.pep LGALAANLLLLGLAVPSGGARGAAVACAASFWLFFAFKTESSCRLWQPLKRLPLYLHTLF

|||||||||||||||||||:|||||||||||||||:|||||||||||||||||||:||||

orf10ng-1 LGALAANLLLLGLAVPSGGTRGAAVACAASFWLFFVFKTESSCRLWQPLKRLPLYMHTLF

370 380 390 400 410 420

430 440 450 460 470

orf10-1.pep CLTSSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKDLHKLFHYLKKQGFPLX

||:||||||||||||||||||||||||||||||||||:||||||||||||||||

orf10ng-1 CLASSAAYTCFGTPANYPLFAGVWAAYLAGCILRHRKNLHKLFHYLKKQGFPLX

430 440 450 460 470

根据该分析结果(包括存在一个推定的前导肽和几个跨膜片段，以及存在一个亮氨酸拉链基序(相隔6个氨基酸的4个Leu残基，用粗体表示))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例45

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 381>：

1..ATCCTGAAAC CGCATAACCA GCTTAAGGAA GACATCCAAC CTGATCCGGC

51 CGATCAAAAC GCCTTGTCCG AACCGGATGC TGCGACAGAG GCAGAGCAGT

101 CGGATGCGGA AAATGCTGCC GACAAGCAGC CCGTTGCCGA TAAAGCCGAC

151 GAGGTTGAAG AAAAGGCGGG CGAGCCGGAA CGGGAAGAGC CGGACGGACA

201 GGCAGTGCGT AAGAAAGCGC TGACGGAAGA GCGTGAACAA ACCGTCAGGG

251 AAAAAGCGCA GAAGAAAGAT GCCGAAACGG TTAAAATACA AGCGGTAAAA

301 CCGTCTAAAG AAACAGAGAA AAAAGCTTCA AAAGAAGAGA AAAAGGCGGC

351 GAAGGAAAAA GTTGCACCCA AACCAACCCC GGAACAAATC CTCAACAGCG

401 GCAgCATCGA AAAmGCGCGC AgTGCCGCCG CCAAAGAAGT GCAGAAAATG

451 AA.AACGTCC GACAAGGCGG AAGC.AACGC ATTATCTGCA AATGGGCGCG

501 TATGCCGACC GTCAGAGCGC GGAAGGGCAG CGTGCCAAAC TGGCAATCTT

551 GGGCATATCT TCCAAGGTGG TCGGTTATCA GGCGGGACAT AAAACGCTTT

601 ACCGGGTGCA AAGCGGCAAT ATGTCTGCCG ATGCGGTGA

它对应于氨基酸序列<SEQ ID 382；ORF65>：

1..ILKPHNQLKE DIQPDPADQN ALSEPDAATE AEQSDAENAA DKQPVADKAD

51 EVEEKAGEPE REEPDGQAVR KKALTEEREQ TVREKAQKKD AETVKIQAVK

101 PSKETEKKAS KEEKKAAKEK VAPKPTPEQI LNSGSIEXAR SAAAKEVQKM

151 XNVRQGGSXR IICKWARMPT VRARKGSVPN WQSWAYLPRW SVIRRDIKRF

201 TGCKAAICLP MR*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 383>：

1 ATGTTTATGA ACAAATTTTC CCAATCCGGA AAAGGTCTGT CCGGTTTTTT

51 CTTCGGTTTG ATACTGGCGA CGGTCATTAT TGCCGGTATT TTGTTTTATC

101 TGAACCAGAG CGGTCAAAAT GCGTTCAAAA TCCCGGCTTC GTCGAAGCAG

151 CCTGCAGAAA CGGAAATCCT GAAACCGAAA AACCAGCCTA AGGAAGACAT

201 CCAACCTGAA CCGGCCGATC AAAACGCCTT GTCCGAACCG GATGCTGCGA

251 CAGAGGCAGA GCAGTCGGAT GCGGAAAAAG CTGCCGACAA GCAGCCCGTT

301 GCCGATAAAG CCGACGAGGT TGAAGAAAAG GCGGGCGAGC CGGAACGGGA

351 AGAGCCGGAC GGACAGGCAG TGCGTAAGAA AGCGCTGACG GAAGAGCGTG

401 AACAAACCGT CAGGGAAAAA GCGCAGAAGA AAGATGCCGA AACGGTTAAA

451 AAACAAGCGG TAAAACCGTC TAAAGAAACA GAGAAAAAAG CTTCAAAAGA

501 AGAGAAAAAG GCGGCGAAGG AAAAAGTTGC ACCCAAACCA ACCCCGGAAC

551 AAATCCTCAA CAGCGGCAGC ATCGAAAAAG CGCGCAGTGC CGCCGCCAAA

601 GAAGTGCAGA AAATGAAAAC GTCCGACAAG GCGGAAGCAA CGCATTATCT

651 GCAAATGGGC GCGTATGCCG ACCGTCAGAG CGCGGAAGGG CAGCGTGCCA

701 AACTGGCAAT CTTGGGCATA TCTTCCAAGG TGGTCGGTTA TCAGGCGGGA

751 CATAAAACGC TTTACCGGGT GCAAAGCGGC AATATGTCTG CCGATGCGGT

801 GAAAAAAATG CAGGACGAGT TGAAAAAACA TGAAGTCGCC AGCCTGATCC

851 GTTCTATCGA AAGCAAATAA

它对应于氨基酸序列<SEQ ID 384；ORF65-1>：

1 MFMNKFSQSG KGLSG FFFGL ILATVIIAGI LFYLNQSGQN AFKIPASSKQ

51 PAETEILKPK NQPKEDIQPE PADQNALSEP DAATEAEQSD AEKAADKQPV

101 ADKADEVEEK AGEPEREEPD GQAVRKKALT EEREQTVREK AQKKDAETVK

151 KQAVKPSKET EKKASKEEKK AAKEKVAPKP TPEQILNSGS IEKARSAAAK

201 EVQKMKTSDK AEATHYLQMG AYADRQSAEG QRAKLAILGI SSKVVGYQAG

251 HKTLYRVQSG NMSADAVKKM QDELKKHEVA SLIRSIESK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF65显示与脑膜炎奈瑟球菌菌株A的ORF(ORF65a)在重叠的150个氨基酸内有92.0％的相同性：

10 20 30

orf65.pep ILKPHNQLKEDIQPDPADQNALSEPDAATE

||||:|| ||||||:||||||||||||| |

orf65a IIAGILFYLNQSGQNAFKIPVPSKQPAETEILKPKNQPKEDIQPEPADQNALSEPDAAKE

30 40 50 60 70 80

40 50 60 70 80 90

orf65.pep AEQSDAENAADKQPVADKADEVEEKAGEPEREEPDGQAVRKKALTEEREQTVREKAQKKD

|||||||:|||||||||||||||||| |||||: |||||||||||||||||| |||||||

orf65a AEQSDAEKAADKQPVADKADEVEEKADEPEREKSDGQAVRKKALTEEREQTVGEKAQKKD

90 100 110 120 130 140

100 110 120 130 140 150

orf65.pep AETVKIQAVKPSKETEKKASKEEKKAAKEKVAPKPTPEQILNSGSIEXARSAAAKEVQKM

||||| |||||||||||||||||||| |||||||||||||||||||| ||||||||||||

orf65a AETVKKQAVKPSKETEKKASKEEKKAEKEKVAPKPTPEQILNSGSIEKARSAAAKEVQKM

150 160 170 180 190 200

160 170 180 190 200 210

orf65.pep XNVRQGGSXRIICKWARMPTVRARKGSVPNWQSWAYLPRWSVIRRDIKRFTGCKAAICLP

orf65a KTPDKAEATHYLQMGAYADRRSAEGQRAKLAILGISSKVVGYQAGHKTLYRVQSGNMSAD

210 220 230 240 250 260

全长ORF65a核苷酸序列<SEQ ID 385>是：

1 ATGTTTATGA ACAAATTTTC CCAATCCGGA AAAGGTCTGT CCGGTTTTTT

51 CTTCGGTTTG ATACTGGCGA CGGTCATTAT TGCCGGTATT TTGTTTTATC

101 TGAACCAGAG CGGTCAAAAT GCGTTCAAAA TCCCGGTTCC GTCGAAGCAG

151 CCTGCAGAAA CGGAAATCCT GAAACCGAAA AACCAGCCTA AGGAAGACAT

201 CCAACCTGAA CCGGCCGATC AAAACGCCTT GTCCGAACCG GATGCTGCGA

251 AAGAGGCAGA GCAGTCGGAT GCGGAAAAAG CTGCCGACAA GCAGCCCGTT

301 GCCGACAAAG CCGACGAGGT TGAGGAAAAG GCGGACGAGC CGGAGCGGGA

351 AAAGTCGGAC GGACAGGCAG TGCGCAAGAA AGCACTGACG GAAGAGCGTG

401 AACAAACCGT CGGGGAAAAA GCGCAGAAGA AAGATGCCGA AACGGTTAAA

451 AAACAAGCGG TAAAACCATC TAAAGAAACA GAGAAAAAAG CTTCAAAAGA

501 AGAGAAAAAG GCGGAGAAGG AAAAAGTTGC ACCCAAACCG ACCCCGGAAC

551 AAATCCTCAA CAGCGGCAGC ATCGAAAAAG CGCGCAGTGC CGCTGCCAAA

601 GAAGTGCAGA AAATGAAAAC GCCCGACAAG GCGGAAGCAA CGCATTATCT

651 GCAAATGGGC GCGTATGCCG ACCGCCGGAG CGCGGAAGGG CAGCGTGCCA

701 AACTGGCAAT CTTGGGCATA TCTTCCAAGG TGGTCGGTTA TCAGGCGGGA

751 CATAAAACGC TTTACCGGGT GCAAAGCGGC AATATGTCTG CCGATGCGGT

801 GAAAAAAATG CAGGACGAGT TGAAAAAACA TGAAGTCGCC AGCCTGATCC

851 GTTCTATCGA AAGCAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 386>：

1 MFMNKFSQSG KGLSG FFFGL ILATVIIAGI LFYLNQSGQN AFKIPVPSKQ

51 PAETEILKPK NQPKEDIQPE PADQNALSEP DAAKEAEQSD AEKAADKQPV

101 ADKADEVEEK ADEPEREKSD GQAVRKKALT EEREQTVGEK AQKKDAETVK

151 KQAVKPSKET EKKASKEEKK AEKEKVAPKP TPEQILNSGS IEKARSAAAK

201 EVQKMKTPDK AEATHYLQMG AYADRRSAEG QRAKLAILGI SSKVVGYQAG

251 HKTLYRVQSG NMSADAVKKM QDELKKHEVA SLIRSIESK*

ORF65a和ORF65-1显示在289个氨基酸的重叠区内有96.5％的相同性：

10 20 30 40 50 60

orf65a.pep MFMNKFSQSGKGLSGFFFGLILATVIIAGILFYLNQSGQNAFKIPVPSKQPAETEILKPK

|||||||||||||||||||||||||||||||||||||||||||||: |||||||||||||

orf65-1 MFMNKFSQSGKGLSGFFFGLILATVIIAGILFYLNQSGQNAFKIPASSKQPAETEILKPK

10 20 30 40 50 60

70 80 90 100 110 120

orf65a.pep NQPKEDIQPEPADQNALSEPDAAKEAEQSDAEKAADKQPVADKADEVEEKADEPEREKSD

||||||||||||||||||||||| ||||||||||||||||||||||||||| |||||: |

orf65-1 NQPKEDIQPEPADQNALSEPDAATEAEQSDAEKAADKQPVADKADEVEEKAGEPEREEPD

70 80 90 100 110 120

130 140 150 160 170 180

orf65a.pep GQAVRKKALTEEREQTVGEKAQKKDAETVKKQAVKPSKETEKKASKEEKKAEKEKVAPKP

||||||||||||||||| ||||||||||||||||||||||||||||||||| ||||||||

orf65-1 GQAVRKKALTEEREQTVREKAQKKDAETVKKQAVKPSKETEKKASKEEKKAAKEKVAPKP

130 140 150 160 170 180

190 200 210 220 230 240

orf65a.pep TPEQILNSGSIEKARSAAAKEVQKMKTPDKAEATHYLQMGAYADRRSAEGQRAKLAILGI

||||||||||||||||||||||||||| |||||||||||||||||:||||||||||||||

orf65-1 TPEQILNSGSIEKARSAAAKEVQKMKTSDKAEATHYLQMGAYADRQSAEGQRAKLAILGI

190 200 210 220 230 240

250 260 270 280 290

orf65a.pep SSKVVGYQAGHKTLYRVQSGNMSADAVKKMQDELKKHEVASLIRSIESKX

||||||||||||||||||||||||||||||||||||||||||||||||||

orf65-1 SSKVVGYQAGHKTLYRVQSGNMSADAVKKMQDELKKHEVASLIRSIESKX

250 260 270 280 290

与淋病奈瑟球菌的预计ORF的同源性

ORF65显示与淋病奈瑟球菌的预计ORF(ORF65.ng)在重叠的212个氨基酸内有89.6％的相同性：

30 40 50 60 70 80

ORF65ng IIAGILLYLNQGGQNAFKIPAPSKQPAETEILKLKNQPKEDIQPEPADQNALSEPDVAKE

||| :|| ||||||:|||||||||||:| |

ORF65 ILKPHNQLKEDIQPDPADQNALSEPDAATE

10 20 30

90 100 110 120 130 140

ORF65ng AEQSDAEKAADKQPVADKADEVEEKAGEPEREEPDGQAVRKKALTEEREQTVREKAQKKD

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

ORF65 AEQSDAENAADKQPVADKADEVEEKAGEPEREEPDGQAVRKKALTEEREQTVREKAQKKD

40 50 60 70 80 90

150 160 170 180 190 200

ORF65ng AETVKKKAVKPSKETEKKASKEEKKAAKEKVAPKPTPEQILNSRSIEKARSAAAKEVQKM

||||| :|||||||||||||||||||||||||||||||||||| ||| ||||||||||||

ORF65 AETVKIQAVKPSKETEKKASKEEKKAAKEKVAPKPTPEQILNSGSIEXARSAAAKEVQKM

100 110 120 130 140 150

210 220 230 240 250 260

ORF65ng KNFGQGGSQRIICKWARMPNPGARKGSVPNWQSWAYLPKWSAIRRDIKRFTACKAAICPP

| |||| ||||||||||: ||||||||||||||||:||:|||||||||:|||||| |

ORF65 XNVRQGGSXRIICKWARMPTVRARKGSVPNWQSWAYLPRWSVIRRDIKRFTGCKAAICLP

160 170 180 190 200 210

ORF65ng MR

||

ORF65 MR

预计An ORF65ng核苷酸序列<SEQ ID 387>编码的蛋白质具有氨基酸序列<SEQID 388>：

1 MFMNKFSQSG K GLSGFFFGL ILATVIIAGI LLYLNQGGQN AFKIPAPSKQ

51 PAETEILKLK NQPKEDIQPE PADQNALSEP DVAKEAEQSD AEKAADKQPV

101 ADKADEVEEK AGEPEREEPD GQAVRKKALT EEREQTVREK AQKKDAETVK

151 KKAVKPSKET EKKASKEEKK AAKEKVAPKP TPEQILNSRS IEKARSAAAK

201 EVQKMKNFGQ GGSQRIICKW ARMPNPGARK GSVPNWQSWA YLPKWSAIRR

251 DIKRFTACKA AICPPMR*

进一步分析后，发现此完整的淋球菌DNA序列<SEQ ID 389>是：

1 ATGTTTATGA ACAAATTTTC CCAATCCGGA AAAGGTCTGT CCGGTTTCTT

51 CTTCGGTTTG ATACTGGCAA CGGTCATTAT TGCCGGTATT TTGCTTTATC

101 TGAACCAGGG CGGTCAAAAT GCGTTCAAAA TCCCGGCTCC GTCGAAGCAG

151 CCTGCAGAAA CGGAAATCCT GAAACTGAAA AACCAGCCTA AGGAAGACAT

201 CCAACCTGAA CCGGCCGATC AAAACGCCTT GTCCGAACCG GATGTTGCGA

251 AAGAGGCAGA GCAGTCGGAT GCGGAAAAAG CTGCCGACAA GCAGCCCGTT

301 GCCGACAAag ccgacgAGGT TGAAGAAAag GcGGgcgAgc cggaACGGga

351 aGAGCCGGAC ggACAGGCAG TGCGCAAGAA AGCACTGAcg gAAGAgcGTG

401 AACAAACcgt cagggAAAAA GCGCagaaga AAGATGCCGA AACGgTTAAA

451 AAacaaGCgg tAaaaccgtc tAAAGAAACa gagaaaaaag cTtcaaaaga

501 agagaaaaag gcggcgaaag aaaAAGttgc acccaaaccg accccggaaC

551 aaatcctcaa cagccgCagc atcgaaaaag cgcgtagtgc cgctgccaaa

601 gaAgtgcaGA AAatgaaaaa ctTtgggcaa ggcgGaagcc aacgcattaT

651 CTGcaaatgg gcgcgtatgc cgaccgtccg gagcgcggaA gggcagcgtg

701 ccaaACtggc aAtcttgGgc atatctTccg aagtggtcgG CTATCAGGCG

751 GGACATAAAA CGCTTTACCG CGTGCAAagc GGCAatatgt ccgccgatgc

801 gGTGAAAAAA ATGCAGGACG AGTTGAAAAA GCATGGGGtt gcCAGCCTGA

851 TCCGTGcgAT TGAAGGCAAA TAA

它编码下列氨基酸序列<SEQ ID 390>：

1 MFMNKFSQSG KGLSG FFFGL ILATVIIAGI LLYLNQGGQN AFKIPAPSKQ

51 PAETEILKLK NQPKEDIQPE PADQNALSEP DVAKEAEQSD AEKAADKQPV

101 ADKADEVEEK AGEPEREEPD GQAVRKKALT EEREQTVREK AQKKDAETVK

151 KQAVKPSKET EKKASKEEKK AAKEKVAPKP TPEQILNSRS IEKARSAAAK

201 EVQKMKNFGQ GGSQRIICKW ARMPTVRSAE GQRAKLAILG ISSEVVGYQA

251 GHKTLYRVQS GNMSADAVKK MQDELKKHGV ASLIRAIEGK *

ORF65ng-1和ORF65-1显示在290个氨基酸的重叠区内有89.0％的相同性：

10 20 30 40 50 60

orf65-1.pep MFMNKFSQSGKGLSGFFFGLILATVIIAGILFYLNQSGQNAFKIPASSKQPAETEILKPK

|||||||||||||||||||||||||||||||:||||:||||||||| ||||||||||| |

orf65ng-1 MFMNKFSQSGKGLSGFFFGLILATVIIAGILLYLNQGGQNAFKIPAPSKQPAETEILKLK

10 20 30 40 50 60

70 80 90 100 110 120

orf65-1.pep NQPKEDIQPEPADQNALSEPDAATEAEQSDAEKAADKQPVADKADEVEEKAGEPEREEPD

|||||||||||||||||||||:| ||||||||||||||||||||||||||||||||||||

orf65ng-1 NQPKEDIQPEPADQNALSEPDVAKEAEQSDAEKAADKQPVADKADEVEEKAGEPEREEPD

70 80 90 100 110 120

130 140 150 160 170 180

orf65-1.pep GQAVRKKALTEEREQTVREKAQKKDAETVKKQAVKPSKETEKKASKEEKKAAKEKVAPKP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf65ng-1 GQAVRKKALTEEREQTVREKAQKKDAETVKKQAVKPSKETEKKASKEEKKAAKEKVAPKP

130 140 150 160 170 180

190 200 210 220 230 239

orf65-1.pep TPEQILNSGSIEKARSAAAKEVQKMKTSDKAEATHYL-QMGAYADRQSAEGQRAKLAILG

|||||||| |||||||||||||||||: :: : : : : : : :|||||||||||||

orf65ng-1 TPEQILNSRSIEKARSAAAKEVQKMKNFGQGGSQRIICKWARMPTVRSAEGQRAKLAILG

190 200 210 220 230 240

240 250 260 270 280 290

orf65-1.pep ISSKVVGYQAGHKTLYRVQSGNMSADAVKKMQDELKKHEVASLIRSIESKX

|||:|||||||||||||||||||||||||||||||||| ||||||:||:||

orf65ng-1 ISSEVVGYQAGHKTLYRVQSGNMSADAVKKMQDELKKHGVASLIRAIEGKX

250 260 270 280 290

根据该结果，包括淋球菌蛋白中存在一个推定的跨膜结构域的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例46

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 391>：

1 ATGAACCACG ACATCACTTT CCTCACCCTG TTCCTACTCG GTkTCTTCGG

51 CGGAAcGCAC TGCATCGGTA TGTGCGGCGG ATTAAGCAGC GcGTTTGs.s

101 TCCAACTCCC CCCGCATATC AACCGCTTTT GGCTGATCCT GCTGCTTAAC

151 ACAGGACGGG TAAGCAGCTA TACGGCAAtC GGCCTGATAC TCGGATTAAT

201 CGGACAGGTC GGCGTTTCAC TCGAcCAaAC CCGCGTCCTG CAGAATATTT

251 TATACACGGC CGCCAACCTC CTGCTGCTCT TTTTAGGCTT ATACTTGAGC

301 GGTATTTCTT CCTTGGCGGC AAAAATCGAG AAaATCGGCA AACCGATATG

351 GCGGAACCTG AACCCGATAC TCAACCGGCT GTTACCCATA AAATCCATAC

401 CCGCCTGCCT tGCGgTCGGA ATATTATGGG GCTGGCTGCC GTGCGGACTG

451 GTTTACAGCG CGTCGCTTTA CGCGCTGGGA AgCGGTAGTG CGGCAACGGG

501 CGGGTTATAT ATGCTTGCCT TTGCACTGGG TACGCTGCCC AATCTTtTAG

551 CAATCGGCAT TTTtTCCCTG CAACTGAAwA AAATCATGCA AAACCGATAT

601 ATCCGCCTGT GTACGGGATT ATCCGTATCA TTATGGGCAT TATGGAAACT

651 TGCCGTCCTG TGGCTGTAA

它对应于氨基酸序列<SEQ ID 392；ORF103>：

1 MNHDITFLTL FLLGXFGGTH CIGMCGGLSS AFXXQLPPHI NRFWLILLLN

51 TGRVSSYTAI GLILGLIGQV GVSLDQTRVL QNILYTAANL LLLFLGLYLS

101 GISSLAAKIE KIGKPIWRNL NPILNRLLPI KSIPACLAVG ILWGWLPCGL

151 VYSASLYALG SGSAATGGLY MLAFALGTLP NLLAIGIFSL QLXKIMQNRY

201 IRLCTGLSVS LWALWKLAVL WL*

进一步的工作详细描述了该DNA序列<SEQ ID 393>：

1 ATGAACCACG ACATCACTTT CCTCACCCTG TTCCTACTCG GTTTCTTCGG

51 CGGAACGCAC TGCATCGGTA TGTGCGGCGG ATTAAGCAGC GCGTTTGCGC

101 TCCAACTCCC CCCGCATATC AACCGCTTTT GGCTGATCCT GCTGCTTAAC

151 ACAGGACGGG TAAGCAGCTA TACGGCAATC GGCCTGATAC TCGGATTAAT

201 CGGACAGGTC GGCGTTTCAC TCGACCAAAC CCGCGTCCTG CAGAATATTT

251 TATACACGGC CGCCAACCTC CTGCTGCTCT TTTTAGGCTT ATACTTGAGC

301 GGTATTTCTT CCTTGGCGGC AAAAATCGAG AAAATCGGCA AACCGATATG

351 GCGGAACCTG AACCCGATAC TCAACCGGCT GTTACCCATA AAATCCATAC

401 CCGCCTGCCT TGCGGTCGGA ATATTATGGG GCTGGCTGCC GTGCGGACTG

451 GTTTACAGCG CGTCGCTTTA CGCGCTGGGA AGCGGTAGTG CGGCAACGGG

501 CGGGTTATAT ATGCTTGCCT TTGCACTGGG TACGCTGCCC AATCTTTTAG

551 CAATCGGCAT TTTTTCCCTG CAACTGAAAA AAATCATGCA AAACCGATAT

601 ATCCGCCTGT GTACGGGATT ATCCGTATCA TTATGGGCAT TATGGAAACT

651 TGCCGTCCTG TGGCTGTAA

它对应于氨基酸序列<SEQ ID 394；ORF103-1>：

1 MNHDITFLTL FLLGFFGGTH CIGMCGGLSS AFALQLPPHI NRFWLILLLN

51 TGRVSSY TAI GLILGLIGQV GVSLDQTRVL QNILYTAAN L LLLFLGLYLS

101 GISSLAAKIE KIGKPIWRNL NPILNRLLPI KSIP ACLAVG ILWGWLPCGL

151 VYSASLYALG SGSAATGGLY M LAFALGTLP NLLAIGIFSL QLKKIMQNRY

201 IRLCTGLSVS LWALWKLAVL WL*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF103显示与脑膜炎奈瑟球菌菌株A的ORF(ORF103.a)在重叠的222个氨基酸内有93.8％的相同性：

10 20 30 40 50 60

orf103.pep MNHDITFLTLFLLGXFGGTHCIGMCGGLSSAFXXQLPPHINRFWLILLLNTGRVSSYTAI

|| ||||||||||| ||||||||||||||||| |||||||| |||||||||||||||||

orf103a MNXDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRXWLILLLNTGRVSSYTAI

10 20 30 40 50 60

70 80 90 100 110 120

orf103.pep GLILGLIGQVGVSLDQTRVLQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

||||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||

orf103a GLILGLIGQVGVSLDQTRVXQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

70 80 90 100 110 120

130 140 150 160 170 180

orf103.pep NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf103a NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP

130 140 150 160 170 180

190 200 210 220

orf103.pep NLLAIGIFSLQLXKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

|| ||||||||||||||||||||||||||||||||||||||||

orf103a NLXAIGIFSLQLXKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

190 200 210 220

全长ORF103a核苷酸序列<SEQ ID 395>是：

1 ATGAACCANG ACATCACTTT CCTCACCCTG TTCCTACTCG GTTTCTTCGG

51 CGGAACGCAC TGCATCGGTA TGTGCGGCGG ATTAAGCAGC GCGTTTGCGC

101 TCCAACTCCC CCCGCATATC AACCGCTTNT GGCTGATCCT GCTGCTTAAC

151 ACAGGACGGG TAAGCAGCTA TACGGCAATC GGCCTGATAC TCGGATTAAT

201 CGGACAGGTC GGCGTTTCAC TCGACCAAAC CCGCGTCNTG CAGAATATTT

251 TATACACGGC CGCCAACCTC CTGCTGCTCT TTTTAGGCTT ATACTTGAGC

301 GGTATTTCTT CCTTGGCGGC AAAAATCGAG AAAATCGGCA AACCGATATG

351 GCGGAACCTG AACCCGATAC TCAACCGGCT GTTACCCATA AAATCCATAC

401 CCGCCTGCCT TGCGGTCGGA ATATTATGGG GCTGGCTGCC GTGCGGACTA

451 GTTTACAGCG CGTCGCTTTA CGCGCTGGGA AGCGGTAGTG CGGCAACGGG

501 CGGGTTATAT ATGCTTGCCT TTGCACTGGG TACGCTGCCC AATCTTTNGG

551 CAATCGGCAT TTTTTCCCTG CAACTGNAAA AAATCATGCA AAACCGATAT

601 ATCCGCCTGT GTACGGGATT ATCCGTATCA TTATGGGCAT TATGGAAACT

651 TGCCGTCCTG TGGCTGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 396>：

1 MNXDITFLTL FLLGFFGGTH CIGMCGGLSS AFALQLPPHI NRXWLILLLN

51 TGRVSSY TAI GLILGLIGQV GVSLDQTRVX QNILYTAAN L LLLFLGLYLS

101 GISSLAAKIE KIGKPIWRNL NPILNRLLPI KSIP ACLAVG ILWGWLPCGL

151 VYSASLYALG SGSAATGGLY M LAFALGTLP NLXAIGIFSL QLXKIMQNRY

201 IRLCTGLSVS LWALWKLAVL WL*

ORF103a和ORF103-1显示在222个氨基酸的重叠区内有97.7％的相同性：

10 20 30 40 50 60

orf103a.pep MNXDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRXWLILLLNTGRVSSYTAI

|| ||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf103-1 MNHDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRFWLILLLNTGRVSSYTAI

10 20 30 40 50 60

70 80 90 100 110 120

orf103a.pep GLILGLIGQVGVSLDQTRVXQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

||||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||

orf103-1 GLILGLIGQVGVSLDQTRVLQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

70 80 90 100 110 120

130 140 150 160 170 180

orf103a.pep NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf103-1 NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP

130 140 150 160 170 180

190 200 210 220

orf103a.pep NLXAIGIFSLQLXKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

|| ||||||||| ||||||||||||||||||||||||||||||

orf103-1 NLLAIGIFSLQLKKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

190 200 210 220

与淋病奈瑟球菌的预计ORF的同源性

ORF103显示与淋病奈瑟球菌的预计ORF(ORF103.ng)在重叠的222个氨基酸内有95.5％的相同性：

orf103.pep MNHDITFLTLFLLGXFGGTHCIGMCGGLSSAFXXQLPPHINRFWLILLLNTGRVSSYTAI 60

|||||||||||||| ||||||||||||||||| |||||||||||||||||||:||||||

orf103ng MNHDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRFWLILLLNTGRISSYTAI 60

orf103.pep GLILGLIGQVGVSLDQTRVLQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL 120

||:||||||:|:|||||||||||||||:||||||||||||||||||||||||||||||||

orf103ng GLMLGLIGQLGISLDQTRVLQNILYTASNLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL 120

orf103.pep NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP 180

||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||

orf103ng NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSATTGGLYMLAFALGTLP 180

orf103.pep NLLAIGIFSLQLXKIMQNRYIRLCTGLSVSLWALWKLAVLWL 222

|||||||||||| |||||||||||||||||||||||||||||

orf103ng NLLAIGIFSLQLKKIMQNRYIRLCTGLSVSLWALWKLAVLWL 222

全长ORF103ng核苷酸序列<SEQ ID 397>是：

1 ATGAACCACG ACATCACTTT CCTCACCCTG TTCCTGCTCG GTTTCTTCGG

51 CGGAACTCAC TGCATCGGTA TGTGCGGCGG ATTAAGCAGC GCGTTTGCGC

101 TCCAACTCCC CCCGCATATC AACCGCTTTT GGCTGATTCT GCTGCTTAAC

151 ACAGGACGGA TAAGCAGCTA TACGGCAATC GGCCTGATGC TCGGATTAAT

201 CGGACAACTC GGCATTTCAC TCGACCAAAc ccgcgTCCTG CAAAATATTT

251 tatacacagc ctccaaCCTC CTGCTGCTCT TTTTAGGCTT ATACTTGAGC

301 GGTATTTCTT CCTTGGCGGC AAAAATCGAG AAAATCGGCA AACCGATATG

351 GCGCAACCTG AACCCGATAC TCAACCGGCT GCTGCCCATA AAATCCATAC

401 CCGCCTGCCT TGCTGTCGGA ATATTATGGG GCTGGCTGCC GTGCGGACTG

451 GTTTACAGCG CATCACTTTA CGCGCTGGGA AGCGGTAGTG CGACAACCGG

501 CGGACTGTAT ATGCTTGCCT TTGCACTGGG TACGCTGCCC AATCTTTTGG

551 CAATCGGCAT TTTTTCCCTG CAACTGAAAA AAATCATGCA AAACCGATAT

601 ATCCGCCTGT GTACAGGATT ATCCGTATCA TTATGGGCAT TATGGAAGCT

651 TGCCGTCCTG TGGCTGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 398>：

1 LQLPPHI NRFWLILLLN

51 TGRISSY TAI GLMLGLIGQL GISLDQTRVL QNILYTASN L LLLFLGLYLS

101 GISSLAAKIE KIGKPIWRNL NPILNRLLPI KSIP ACLAVG ILWGWLPCGL

151 VYSASLYALG SGSATTGGLY M LAFALGTLP NLLAIGIFSL QLKKIMQNRY

201 IRLCTGLSVS LWALWKLAVL WL*

另外，ORF103ng和ORF103-1显示在222个氨基酸的重叠区内有97.3％的相同性：

10 20 30 40 50 60

orf103-1.pep MNHDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRFWLILLLNTGRVSSYTAI

|||||||||||||||||||||||||||||||||||||||||||||||||||||:||||||

orf103ng MNHDITFLTLFLLGFFGGTHCIGMCGGLSSAFALQLPPHINRFWLILLLNTGRISSYTAI

10 20 30 40 50 60

70 80 90 100 110 120

orf103-1.pep GLILGLIGQVGVSLDQTRVLQNILYTAANLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

||:||||||:|:|||||||||||||||:||||||||||||||||||||||||||||||||

orf103ng GLMLGLIGQLGISLDQTRVLQNILYTASNLLLLFLGLYLSGISSLAAKIEKIGKPIWRNL

70 80 90 100 110 120

130 140 150 160 170 180

orf103-1.pep NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSAATGGLYMLAFALGTLP

||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||

orf103ng NPILNRLLPIKSIPACLAVGILWGWLPCGLVYSASLYALGSGSATTGGLYMLAFALGTLP

130 140 150 160 170 180

190 200 210 220

orf103-1.pep NLLAIGIFSLQLKKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

|||||||||||||||||||||||||||||||||||||||||||

orf103ng NLLAIGIFSLQLKKIMQNRYIRLCTGLSVSLWALWKLAVLWLX

190 200 210 220

根据该分析结果(包括此淋球菌蛋白中存在一个推定的前导序列(双划线)和数个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例47

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 399>：

1 ATGGAAAACC AAAGGCCGCT CCTAGGCTTT CGCTTGGCAC TTTTGGCGGC

51 GATGACGTGG GGAACGCTGC CGAT.TCCGT GCGGCAGGTA TTGAAGTTTG

101 TCGATGCGCC GACGCTGGTG TGGGTGCGTT TTACCGTGGC GGCGGCGGTA

151 TTGTTTGTTT TGCTGGCACT GGGCGGGCGG CTGCcGAAGC GGCG GGATT

201 TTTCTTGGTG CTCATTCAGG CTGCTGCTGC TCGGCGTGGC GGGCATTTCG

251 GCAAACTTTG TGCTGATTGC CCAAGGGCTG CATTATATTT CGCCGACCAC

301 GACGCAGGTT TTGTGGCAGA TTTCGCCGTT TACGATGATT GTwGTCGGTG

351 TGTTGGTGTT TAAAGACCGG ATGACTGCCG CTCAGAAAAT CGGCTTGGTT

401 TTGCTGCTTG CCGGTTTGCT TATGTATTTT AACGATAAAT TCGGCGAGTT

451 GTCGGGTTTG GGCGCGTATG C.AAGGGCGT GTTGCTGTGT GCGGCAGGCA

501 GTATGGCATG GGTGTGTAAT GCCGTGGCGC AAAAGCTGCT GTCGGCGCAA

551 TTCGGGCCGC AACAGATTCT GCTGTTGATT TATGCGGCAA GTGCCGCCGT

601 GTTCCTGCCG TTTGCCGAAC CGGCACACAT CGGAAGTATG GACGGTACGT

651 TGGCGTGGGT ATGTATTGCG TATTGCTGCT TGAATACGTT AATCGGTTAC

701 GGCTCGTTCG GCGAGGCGTT GAAACATTGG GAGGCTTCCA AAGTCAGCGC

751 GGTAACAACC TTGCTCCCCG TGTTTACCGT AATAAATACT TTGCTCGGGC

801 ATTATGTGAT GCCTGAAACT TTTGCCGCGC CGGA..

它对应于氨基酸序列<SEQ ID 400；ORF104>：

1 MENQRPLLGF RLALLAAMTW GTLPXSVRQV LKFVDAPTLV WVRFTVAAAV

51 LFVLLALGGR LPKRRDFSWC SFRLLLLGVA GISANFVLIA QGLHYISPTT

101 TQVLWQISPF TMIVVGVLVF KDRMTAAQKI GLVLLLAGLL MYFNDKFGEL

151 SGLGAYXKGV LLCAAGSMAW VCNAVAQKLL SAQFGPQQIL LLIYAASAAV

201 FLPFAEPAHI GSMDGTLAWV CIAYCCLNTL IGYGSFGEAL KHWEASKVSA

251 VTTLLPVFTV INTLLGHYVM PETFAAP...

进一步的工作进一步揭示了部分DNA序列<SEQ ID 401>：

1 ATGGAAAACC AAAGGCCGCT CCTAGGCTTC GCGTTGGCAC TTTTGGCGGC

51 GATGACGTGG GGAACGCTGC CGATTGCCGT GCGGCAGGTA TTGAAGTTTG

101 TCGATGCGCC GACGCTGGTG TGGGTGCGTT TTACCGTGGC GGCGGCGGTA

151 TTGTTTGTTT TGCTGGCACT GGGCGGGCGG CTGCCGAAGC GGCGGGATTT

201 TTCTTGGTGC TCATTCAGGC TGCTGCTGCT CGGCGTGGCG GGCATTTCGG

251 CAAACTTTGT GCTGATTGCC CAAGGGCTGC ATTATATTTC GCCGACCACG

301 ACGCAGGTTT TGTGGCAGAT TTCGCCGTTT ACGATGATTG TTGTCGGTGT

351 GTTGGTGTTT AAAGACCGGA TGACTGCCGC TCAGAAAATC GGCTTGGTTT

401 TGCTGCTTGC CGGTTTGCTT ATGTTTTTTA ACGATAAATT CGGCGAGTTG

451 TCGGGTTTGG GCGCGTATGC GAAGGGCGTG TTGCTGTGTG CGGCAGGCAG

501 TATGGCATGG GTGTGTTATG CCGTGGCGCA AAAGCTGCTG TCGGCGCAAT

551 TCGGGCCGCA ACAGATTCTG CTGTTGATTT ATGCGGCAAG TGCCGCCGTG

601 TTCCTGCCGT TTGCCGAACC GGCACACATC GGAAGTTTGG ACGGTACGTT

651 GGCGTGGGTT TGTTTTGCGT ATTGCTGCTT GAATACGTTA ATCGGTTACG

701 GCTCGTTCGG CGAGGCGTTG AAACATTGGG AGGCTTCCAA AGTCAGCGCG

751 GTAACAACCT TGCTCCCCGT GTTTACCGTA ATAwTwwCTT TGCTCGGGCA

801 TTATGTGATG CCTGAAACTT TTGCCGCGCC GGA...

它对应于氨基酸序列<SEQ ID 402；ORF104-1>：

1 MENQRPLLGF ALALLAAMTW GTLPIAVRQV LKFVDAPT LV WVRFTVAAAV

51 LFVLLALGGR LPKRRDFSWC SFR LLLLGVA GISANFVLIA QGLHYISPTT

101 TQ VLWQISPF TMIVVGVLVF KDRMTA AQKI GLVLLLAGLL MFFNDKFGEL

151 SGLGAYAKG V LLCAAGSMAW VCYAVAQKLL SAQFGPQQ IL LLIYAASAAV

201 FLPFAEPAHI GSLD GTLAWV CFAYCCLNTL IGYGSFGEAL KHWEASK VSA

251 VTTLLPVFTV IXXLLGHYVM PETFAAP...

该氨基酸序列的计算机分析给出了下列结果：

与假设的流感嗜血菌HI0878蛋白(登录号U32769)的同源性

ORF104和HI0878显示在277个氨基酸的重叠区内有40％的氨基酸相同性：

orf104 4 QRPLLGFRLALLAAMTWGTLPXSVRQVLKFVDAPTLVWXXXXXXXXXXXXXXXXXXXXP- 62

Q+PLLGF AL+ AM WG+LP +++QVL ++A T+VW P

HI0878 3 QQPLLGFTFALITAMAWGSLPIALKQVLSVMNAQTIVWYRFIIAAVSLLALLAYKKQLPE 62

orf104 63 --KRRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF 120

K R ++W ++L+GV G+++NF+L + L+YI P+ Q+ +S F M++ GVL+F

HI0878 63 LMKVRQYAW----IMLIGVIGLTSNFLLFSSSLNYIEPSVAQIFIHLSSFGMLICGVLIF 118

orf104 121 KDRMTAAQKIXXXXXXXXXXMYFNDKFGELSGLGAYXKGVLLCAAGSMAWVCNAVAQKLL 180

K+++ QKI ++FND+F +GL Y GV+L G++ WV +AQKL+

HI0878 119 KEKLGLHQKIGLFLLLIGLGLFFNDRFDAFAGLNQYSTGVILGVGGALIWVAYGMAQKLM 178

orf104 181 SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSMDGTLAWVCIAYCCLNTLIGYGSFGEAL 240

+F QQILL++Y A F+P A+ + + + LA +C YCCLNTLIGYGS+ EAL

HI0878 179 LRKFNSQQILLMMYLGCAIAFMPMADFSQVQELT-PLALICFIYCCLNTLIGYGSYAEAL 237

orf104 241 KHWEASKVSAVTTLLPVFTVINTLLGHYVMPETFAAP 277

W+ SKVS V TL+P+FT++ + + HY P FAAP

HI0878 238 NRWDVSKVSVVITLVPLFTILFSHIAHYFSPADFAAP 274

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF104显示与脑膜炎奈瑟球菌菌株A的ORF(ORF104a)在重叠的277个氨基酸内有95.3％的相同性：

10 20 30 40 50 60

orf104.pep MENQRPLLGFRLALLAAMTWGTLPXSVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

|||||||||| ||||||||||||| :||||||||||||||||||||||||||||||||||

orf104a MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

10 20 30 40 50 60

70 80 90 100 110 120

orf104.pep LPKRRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf104a LPKWRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

70 80 90 100 110 120

130 140 150 160 170 180

orf104.pep KDRMTAAQKIGLVLLLAGLLMYFNDKFGELSGLGAYXKGVLLCAAGSMAWVCNAVAQKLL

|||||||||||||||||||||:|||||||||||||| ||||||||||||||| |||||||

orf104a KDRMTAAQKIGLVLLLAGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL

130 140 150 160 170 180

190 200 210 220 230 240

orf104.pep SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSMDGTLAWVCIAYCCLNTLIGYGSFGEAL

|||||||||||||||||||||||||| |||||:||||||||:||||||||||||||||||

orf104a SAQFGPQQILLLIYAASAAVFLPFAELAHIGSLDGTLAWVCFAYCCLNTLIGYGSFGEAL

190 200 210 220 230 240

250 260 270

orf104.pep KHWEASKVSAVTTLLPVFTVINTLLGHYVMPETFAAP

||||||||||||||||||||| :||||||||:|||||

orf104a KHWEASKVSAVTTLLPVFTVIFSLLGHYVMPDTFAAPDMNGLGYAGALVVVGGAVTAAVG

250 260 270 280 290 300

全长ORF104a核苷酸序列<SEQ ID 403>是：

1 ATGGAAAACC AAAGGCCGCT CCTAGGCTTC GCGTTGGCAC TTTTGGCGGC

51 GATGACGTGG GGAACGCTGC CGATTGCCGT GCGGCAGGTA TTGAAGTTTG

101 TCGATGCGCC GACGCTGGTG TGGGTGCGTT TTACCGTGGC GGCGGCGGTA

151 TTGTTTGTTT TGCTGGCATT GGGCGGGCGG CTGCCGAAGT GGCGGGATTT

201 TTCTTGGTGC TCATTCAGGC TGCTGCTGCT CGGCGTGGCG GGCATTTCGG

251 CAAACTTTGT GCTGATTGCC CAAGGGCTGC ATTATATTTC GCCGACCACG

301 ACGCAGGTTT TGTGGCAGAT TTCGCCGTTT ACGATGATTG TTGTCGGTGT

351 GTTGGTGTTT AAAGACCGGA TGACTGCCGC TCAGAAAATC GGCTTGGTTT

401 TGCTGCTTGC CGGTTTGCTT ATGTTTTTTA ACGATAAATT CGGCGAGTTG

451 TCGGGTTTGG GCGCGTATGC GAAGGGCGTG TTGCTGTGTG CGGCAGGCAG

501 TATGGCATGG GTGTGTTATG CCGTGGCGCA AAAGCTGCTG TCGGCGCAAT

551 TCGGGCCGCA ACAGATTCTG CTGTTGATTT ATGCGGCAAG TGCCGCCGTG

601 TTCCTGCCGT TTGCCGAACT GGCACACATC GGAAGTTTGG ACGGTACGTT

651 GGCGTGGGTT TGTTTTGCGT ATTGCTGCTT GAATACGTTA ATCGGTTACG

701 GCTCGTTCGG CGAGGCGTTG AAACATTGGG AGGCTTCCAA AGTCAGCGCG

751 GTAACAACCT TGCTCCCCGT GTTTACCGTA ATATTTTCTT TGCTCGGGCA

801 TTATGTGATG CCTGATACTT TTGCCGCGCC GGATATGAAC GGTTTGGGTT

851 ATGCCGGCGC ACTGGTCGTG GTCGGGGGTG CGGTTACGGC GGCGGTGGGG

901 GACAGGCTGT TCAAACGCCG CTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 404>：

1 MENQRPLLGF ALALLAAMTW GTLPIAVRQV LKFVDAPT LV WVRFTVAAAV

51 LFVLLALGGR LPKWRDFSWC SFR LLLLGVA GISANFVLIA QGLHYISPTT

101 TQ VLWQISPF TMIVVGVLVF KDRMTA AQKI GLVLLLAGLL MFFNDKFGEL

151 SGLGAYAKG V LLCAAGSMAW VCYAVAQKLL SAQFGPQQ IL LLIYAASAAV

201 FLPFAELAHI GSLD GTLAWV CFAYCCLNTL IGYGSFGEAL KHWEASK VSA

251 VTTLLPVFTV IFSLLGHYVM PDTFAAPDMN GL GYAGALVV VGGAVTAAVG

301 DRLFKRR*

ORF104a和ORF104-1显示在277个氨基酸的重叠区内有98.2％的相同性：

10 20 30 40 50 60

orf104a.pep MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf104-1 MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

10 20 30 40 50 60

70 80 90 100 110 120

orf104a.pep LPKWRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf104-1 LPKRRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

70 80 90 100 110 120

130 140 150 160 170 180

orf104a.pep KDRMTAAQKIGLVLLLAGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf104-1 KDRMTAAQKIGLVLLLAGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL

130 140 150 160 170 180

190 200 210 220 230 240

orf104a.pep SAQFGPQQILLLIYAASAAVFLPFAELAHIGSLDGTLAWVCFAYCCLNTLIGYGSFGEAL

|||||||||||||||||||||||||| |||||||||||||||||||||||||||||||||

orf104-1 SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSLDGTLAWVCFAYCCLNTLIGYGSFGEAL

190 200 210 220 230 240

250 260 270 280 290 300

orf104a.pep KHWEASKVSAVTTLLPVFTVIFSLLGHYVMPDTFAAPDMNGLGYAGALVVVGGAVTAAVG

||||||||||||||||||||| ||||||||:|||||

orf104-1 KHWEASKVSAVTTLLPVFTVIXXLLGHYVMPETFAAP

250 260 270

与淋病奈瑟球菌的预计ORF的同源性

ORF104显示和淋病奈瑟球菌的预计ORF(ORF104.ng)在重叠的277个氨基酸内有93.9％的相同性：

orf104.pep MENQRPLLGFRLALLAAMTWGTLPXSVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR 60

|||||||||| ||||||||||||| :||||||||||||||||||||||||||||||||||

orf104ng MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR 60

orf104.pep LPKRRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF 120

||||||||| |||||||||:||||||||||||||||||||||||||||||||||||||||

orf104ng LPKRRDFSWHSFRLLLLGVTGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF 120

orf104.pep KDRMTAAQKIGLVLLLAGLLMYFNDKFGELSGLGAYXKGVLLCAAGSMAWVCNAVAQKLL 180

||||||||||||||||:||||:|||||||||||||| ||||||||||||||| |||||||

orf104ng KDRMTAAQKIGLVLLLVGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL 180

orf104.pep SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSMDGTLAWVCIAYCCLNTLIGYGSFGEAL 240

|||||||||||||||||||||| ||||||||:||||||||::|||||||||||||||||

orf104ng SAQFGPQQILLLIYAASAAVFLLXAEPAHIGSLDGTLAWVCFVYCCLNTLIGYGSFGEAL 240

orf104.pep KHWEASKVSAVTTLLPVFTVINTLLGHYVMPETFAAP 277

||||||||||||||||||||| :||||||||:|||||

orf104ng KHWEASKVSAVTTLLPVFTVIFSLLGHYVMPDTFAAPDMNGLGYVGALVVVGGAVTAAVG 300

预计全长ORF104ng核苷酸序列<SEQ ID 405>编码的蛋白质具有氨基酸序列<SEQ ID 406>：

1 W GTLPIAVRQV LKFVDAPT LV WVRFTVAAAV

51 LFVLLALGGR LPKRRDFSWH SFR LLLLGVT GISANFVLIA QGLHYISPTT

101 TQ VLWQISPF TMIVVGVLVF KDRMTA AQKI GLVLLLVGLL MFFNDKFGEL

151 SGLGAYAKGV LLCAAGSMAW VCYAVAQKLL SAQFGPQ QIL LLIYAASAAV

201 FLLXAEPAHI GSL DGTLAWV CFVYCCLNTL IGYGSFGEAL KHWEAS KVSA

251 VTTLLPVFTV IFSLLGHYVM PDTFAAPDMN G LGYVGALVV VGGAVTAAVG

301 DRPFKRR*

进一步的工作揭示了完整的淋球菌核苷酸序列<SEQ ID 407>：

1 ATGGAAAACC AAAGGCCGCT CCTAGGCTTC GCGTTGGCAC TTTTGGCGGC

51 GATGACGTGG GGGACGCTGC CGATTGCCGT GCGGCAGGTA TTGAAGTTTG

101 TCGATGCGCC GACGCTGGTG TGGGTGCGTT TTACCGTGGC GGCGGCGGTA

151 TTGTTTGTTT TGCTGGCATT GGGCGGGCGG CTGCCGAAGC GGCGGGATTT

201 TTCTTGGCAT TCATTCAGGC TGCTGCTGCT CGGCGTGACG GGCATTTCGG

251 CAAACTTTGT GCTGATTGCC CAAGGGCTGC ATTATATTTC GCCGACCACG

301 ACGCAGGTTT TGTGGCAGAT TTCGCCGTTT ACGATGATTG TTGTCGGCGT

351 GTTGGTGTTT AAAGACCGGA tgaCTGCCGC GCAGAAAATC GGTTTGGTTT

401 TGCTGCttgT CGGTttgCTT ATGTTTTtta ACGACAAATT CGGCGAGTTG

451 TCGGGTTTGG GCGCGTATGC GAAGGGCGTG TTGCTGTGTG CGGCAGGCAG

501 TATGGCCTGG GTGTGTTATG CCGTGGCGCA AAAGCTGCTG TCGGCGCAAT

551 TCGGGCCGCA ACAGATTCTG CTGTTGATTT ATGCGGcaag tgccgccGTG

601 TTCCtgccgT TTGccgaaCC GGCACACATC GGAAGTTTgg aCGGTACGtt

651 GGCGTGGGTT TGTTTTGTGT ATTGCTGCTT GAATACGTTA ATCGGTTACG

701 GCTCGTTCGG CGAGGCGTTG AAACATTGGG AGGCTTCCAA AGTCAGCGCG

751 GTAACAACCT TGCTCCCCGT GTTTACCGTA ATATTTTCTT TGCTCGGGCA

801 TTATGTGATG CCTGATACTT TTGCCGCGCC GGATATGAAC GGTTTGGGTT

851 ATGTCGGCGC ACTGGTCGTG GTCGGGGGTG CGGTTACGGC GGCGGTGGGG

901 GACAGGCCGT TCAAACGCCG CTAG

它对应于氨基酸序列<SEQ ID 408；ORF104ng-1>：

1 MENQRPLLGF ALALLAAMTW GTLPIAVRQV LKFVDAPT LV WVRFTVAAAV

51 LFVLLALGGR LPKRRDFSWH SFR LLLLGVT GISANFVLIA QGLHYISPTT

101 TQ VLWQISPF TMIVVGVLVF KDRMTA AQKI GLVLLLVGLL MFFNDKFGEL

151 SGLGAYAKG V LLCAAGSMAW VCYAVAQKLL SAQFGPQQ IL LLIYAASAAV

201 FLPFAEPAHI GSLD GTLAWV CFVYCCLNTL IGYGSFGEAL KHWEASK VSA

251 VTTLLPVFTV IFSLLGHYVM PDTFAAPDMN GL GYVGALVV VGGAVTAAVG

301 DRPFKRR*

ORF104ng-1和ORF104-1显示在277个氨基酸的重叠区内有97.5％的相同性：

10 20 30 40 50 60

orf104-1.pep MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf104ng-1 MENQRPLLGFALALLAAMTWGTLPIAVRQVLKFVDAPTLVWVRFTVAAAVLFVLLALGGR

10 20 30 40 50 60

70 80 90 100 110 120

orf104-1.pep LPKRRDFSWCSFRLLLLGVAGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

||||||||| |||||||||:||||||||||||||||||||||||||||||||||||||||

orf104ng-1 LPKRRDFSWHSFRLLLLGVTGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF

70 80 90 100 110 120

130 140 150 160 170 180

orf104-1.pep KDRMTAAQKIGLVLLLAGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL

||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||

orf104ng-1 KDRMTAAQKIGLVLLLVGLLMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL

130 140 150 160 170 180

190 200 210 220 230 240

orf104-1.pep SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSLDGTLAWVCFAYCCLNTLIGYGSFGEAL

||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||

orf104ng-1 SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSLDGTLAWVCFVYCCLNTLIGYGSFGEAL

190 200 210 220 230 240

250 260 270

orf104-1.pep KHWEASKVSAVTTLLPVFTVIXXLLGHYVMPETFAAP

||||||||||||||||||||| ||||||||:|||||

orf104ng-1 KHWEASKVSAVTTLLPVFTVIFSLLGHYVMPDTFAAPDMNGLGYVGALVVVGGAVTAAVG

250 260 270 280 290 300

另外，ORF104ng-1显示出与一种假设的流感嗜血菌蛋白明显同源：

gi|1573895(U32769)假设的[流感嗜血菌]长度＝306

评分＝237位(598)，估计值＝8e-62

相同性＝114/280(40％)，阳性＝168/280(59％)，空隙＝8/280(2％)

询问：30 QRPXXXXXXXXXXXMTWGTLPIAVRQVLKFVDAPTLVWXXXXXXXXXXXXXXXXXXXXP- 88

Q+P M WG+LPIA++QVL ++A T+VW P

目标：3 QQPLLGFTFALITAMAWGSLPIALKQVLSVMNAQTIVWYRFIIAAVSLLALLAYKKQLPE 62

询问：89 --KRRDFSWHSFRLLLLGVTGISANFVLIAQGLHYISPTTTQVLWQISPFTMIVVGVLVF 146

K R ++W ++L+GV G+++NF+L + L+YI P+ Q+ +S F M++ GVL+F

目标：63 LMKVRQYAW----IMLIGVIGLTSNFLLFSSSLNYIEPSVAQIFIHLSSFGMLICGVLIF 118

询问：147 KDRMTAAQKIXXXXXXXXXXMFFNDKFGELSGLGAYAKGVLLCAAGSMAWVCYAVAQKLL 206

K+++ QKI +FFND+F +GL Y+ GV+L G++ WV Y +AQKL+

目标：119 KEKLGLHQKIGLFLLLIGLGLFFNDRFDAFAGLNQYSTGVILGVGGALIWVAYGMAQKLM 178

询问：207 SAQFGPQQILLLIYAASAAVFLPFAEPAHIGSLDGTLAWVCFVYCCLNTLIGYGSFGEAL 266

+F QQILL++Y A F+P A+ + + L LA +CF+YCCLNTLIGYGS+ EAL

目标：179 LRKFNSQQILLMMYLGCAIAFMPMADFSQVQELT-PLALICFIYCCLNTLIGYGSYAEAL 237

询问：267 KHWEASKVSAVTTLLPVFTVIFSLLGHYVMPDTFAAPDMN 306

W+ SKVS V TL+P+FT++FS + HY P FAAP++N

目标：238 NRWDVSKVSVVITLVPLFTILFSHIAHYFSPADFAAPELN 277

根据该分析结果(包括此淋球菌蛋白中存在一个推定的前导序列和数个推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例48

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 409>：

1 ATGGTAGCTC GTCGGGCTCA TAACCCGAAG GTCGTAGGTT CGAATCCTGT

51 .CCCGCAACC TAATTTCAAA CCCCTCGGTT CAATGCCGAG GG.GTTTTGT

101 T.TTGCCTGT TTCCTGTTTC CTGTTTCCTG CCGCCTCCGT TTTTTGCCGG

151 ATTTTCCTTC CGGCCGCAAT ATCGGAACGG CAGACCGCCG TCTGTTTGCG

201 GTTGCAAATT CAGGCAGTTT GGCTACAATC TTCCGCATTG TCTTCAAGAA

251 AGCCAACCAT GCCGACCGTC CGTTTTACCG AATCCGTCAG CAAACAAGAC

301 CTTGATGCTC TGTTCGAGTG GGCAAAAGCA AGTTACGGTG CAGAAAGTTG

351 CTGGAAAACG CTGTATCTGA ACGGTCysCC TTTGGGCAAC CTGTCGCCGG

401 AATGGGTGGA ACGCGTsmmA AAAGACTGGG AGGCAGGCTG CyCGGAGTCT

451 TCAGACGGCA TTTTTCTGAA TgCGGACGGc TGgCctGATA TGGgCGGAcg

501 cTTACAGCAC CTCGCCCTCG GTTGGCACTG TGCGGGGCTG TTGGACGgsT

551 GGCGCAACGA GTGTTTCGAC CTGACCGACG GCGGCGGCAA CCCCTTGTTC

601 ACGCTCGaAc GCGCCGyTTT mCGTCCTkTC GGACTGCTCA GCCGCGCCGT

651 CCATCTCAAC GGTCTGACCG AATCGGACGG CCGATGGCAT TTCTGGATAG

701 GCAGGCGCAG TCCGCACAAA GCAGTCGATC CCAACAAACT CGACAATACT

751 rCCGCCGGCG GTGTTTCCGG CGGCGAAATG CCGTCTGAAG CCGTGTGTCG

801 CGAAAGCAGC GAAGAAGCCG GTTTGGATAA AACGCTGcTT CCGCTCATCC

851 GCCCGGTATC GCAGCTGCAC AGCCTGCGCT CCGTCAGCCG GGGTGTACAC

901 AATGAAATCC TGTATGTATT CGATGCCGTC CTGCCG...

它对应于氨基酸序列<SEQ ID 410；ORF105>：

1 MVARRAHNPK VVGSNPXPAT XFQTPRFNAE XVLXLPVSCF LFPAASVFCR

51 IFLPAAISER QTAVCLRLQI QAVWLQSSAL SSRKPTMPTV RFTESVSKQD

101 LDALFEWAKA SYGAESCWKT LYLNGXPLGN LSPEWVERVX KDWEAGCXES

151 SDGIFLNADG WPDMGGRLQH LALGWHCAGL LDGWRNECFD LTDGGGNPLF

201 TLERAXXRPX GLLSRAVHLN GLTESDGRWH FWIGRRSPHK AVDPNKLDNT

251 XAGGVSGGEM PSEAVCRESS EEAGLDKTLL PLIRPVSQLH SLRSVSRGVH

301 NEILYVFDAV LP...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 411>：

1 ATGCCGACCG TCCGTTTTAC CGAATCCGTC AGCAAACAAG ACCTTGATGC

51 TCTGTTCGAG TGGGCAAAAG CAAGTTACGG TGCAGAAAGT TGCTGGAAAA

101 CGCTGTATCT GAACGGTCTG CCTTTGGGCA ACCTGTCGCC GGAATGGGTG

151 GAACGCGTCA AAAAAGACTG GGAGGCAGGC TGCTCGGAGT CTTCAGACGG

201 CATTTTTCTG AATGCGGACG GCTGGCCTGA TATGGGCGGA CGCTTACAGC

251 ACCTCGCCCT CGGTTGGCAC TGTGCGGGGC TGTTGGACGG CTGGCGCAAC

301 GAGTGTTTCG ACCTGACCGA CGGCGGCGGC AACCCCTTGT TCACGCTCGA

351 ACGCGCCGCT TTCCGTCCTT TCGGACTGCT CAGCCGCGCC GTCCATCTCA

401 ACGGTCTGAC CGAATCGGAC GGCCGATGGC ATTTCTGGAT AGGCAGGCGC

451 AGTCCGCACA AAGCAGTCGA TCCCAACAAA CTCGACAATA CTGCCGCCGG

501 CGGTGTTTCC GGCGGCGAAA TGCCGTCTGA AGCCGTGTGT CGCGAAAGCA

551 GCGAAGAAGC CGGTTTGGAT AAAACGCTGC TTCCGCTCAT CCGCCCGGTA

601 TCGCAGCTGC ACAGCCTGCG CTCCGTCAGC CGGGGTGTAC ACAATGAAAT

651 CCTGTATGTA TTCGATGCCG TCCTGCCCGA AACCTTCCTG CCTGAAAATC

701 AGGATGGCGA AGTGGCGGGT TTTGAGAAAA TGGACATCGG CGGTCTGTTG

751 GATGCCATGT TGTCGGGAAA CATGATGCAC GACGCGCAAC TGGTTACGCT

801 GGACGCGTTT TGCCGTTACG GTCTGATTGA TGCCGCCCAT CCGCTGTCCG

851 AGTGGCTGGA CGGCATACGT TTATAG

它对应于氨基酸序列<SEQ ID 412；ORF105-1>：

1 MPTVRFTESV SKQDLDALFE WAKASYGAES CWKTLYLNGL PLGNLSPEWV

51 ERVKKDWEAG CSESSDGIFL NADGWPDMGG RLQHLALGWH CAGLLDGWRN

101 ECFDLTDGGG NPLFTLERAA FRPFGLLSRA VHLNGLTESD GRWHFWIGRR

151 SPHKAVDPNK LDNTAAGGVS GGEMPSEAVC RESSEEAGLD KTLLPLIRPV

201 SQLHSLRSVS RGVHNEILYV FDAVLPETFL PENQDGEVAG FEKMDIGGLL

251 DAMLSGNMMH DAQLVTLDAF CRYGLIDAAH PLSEWLDGIR L*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF105显示与脑膜炎奈瑟球菌菌株A的ORF(ORF105a)在重叠的226个氨基酸内有89.4％的相同性：

60 70 80 90 100 110

orf105.pep ISERQTAVCLRLQIQAVWLQSSALSSRKPTMPTVRFTESVSKQDLDALFEWAKASYGAES

||||||||||||:|||||||||||||||||

orf105a MPTVRFTESVSKHDLDALFEWAKASYGAES

10 20 30

120 130 140 150 160 170

orf105.pep CWKTLYLNGXPLGNLSPEWVERVXKDWEAGCXESSDGIFLNADGWPDMGGRLQHLALGWH

||||||||| |||||||||:||| ||||||| ||||||||||||||||| |||||| |:

orf105a CWKTLYLNGLPLGNLSPEWAERVKKDWEAGCSESSDGIFLNADGWPDMGRRLQHLARIWK

40 50 60 70 80 90

180 190 200 210 220 230

orf105.pep CAGLLDGWRNECFDLTDGGGNPLFTLERAXXRPXGLLSRAVHLNGLTESDGRWHFWIGRR

|||| |||:|||||||||:||||:|||| || ||||||||||||:|||||||||||||

orf105a EAGLLHGWRDECFDLTDGGSNPLFALERAAFRPFGLLSRAVHLNGLVESDGRWHFWIGRR

100 110 120 130 140 150

240 250 260 270 280 290

orf105.pep SPHKAVDPNKLDNTXAGGVSGGEMPSEAVCRESSEEAGLDKTLLPLIRPVSQLHSLRSVS

||||||||:||||| |||||:||:|||:||||||||||||||||||||||||||||| ||

orf105a SPHKAVDPDKLDNTAAGGVSSGELPSETVCRESSEEAGLDKTLLPLIRPVSQLHSLRPVS

160 170 180 190 200 210

300 310

orf105.pep RGVHNEILYVFDAVLP

||||||||||||||||

orf105a RGVHNEILYVFDAVLPETFLPENQDGEVAGFEKMDIGGLLAAMLSGNMMHDAQLVTLDAF

220 230 240 250 260 270

全长ORF105a核苷酸序列<SEQ ID 413>是：

1 ATGCCGACCG TCCGTTTTAC CGAATCCGTC AGCAAACACG ACCTTGATGC

51 CCTATTCGAG TGGGCAAAGG CAAGTTACGG TGCGGAAAGT TGCTGGAAAA

101 CGCTGTATCT GAACGGTCTG CCTTTGGGCA ATCTGTCGCC GGAATGGGCG

151 GAGCGCGTCA AAAAAGACTG GGAGGCAGGC TGCTCGGAGT CTTCAGACGG

201 CATTTTCCTG AATGCGGACG GCTGGCCAGA TATGGGCAGA CGCTTGCAGC

251 ACCTCGCCCG AATATGGAAA GAAGCGGGAC TGCTTCACGG CTGGCGCGAC

301 GAGTGTTTCG ACCTGACCGA CGGCGGCAGC AATCCCTTGT TCGCGCTCGA

351 ACGCGCCGCT TTCCGTCCGT TCGGACTGCT CAGCCGCGCC GTCCATCTCA

401 ACGGTTTGGT CGAATCGGAC GGCCGATGGC ATTTCTGGAT AGGCAGGCGC

451 AGTCCGCACA AAGCAGTCGA TCCCGACAAA CTCGACAATA CTGCCGCCGG

501 CGGTGTTTCC AGCGGTGAAT TGCCGTCTGA AACCGTGTGT CGCGAAAGCA

551 GCGAAGAAGC CGGTTTGGAT AAAACGCTGC TTCCGCTCAT CCGCCCGGTA

601 TCGCAGCTGC ACAGCCTGCG CCCCGTCAGC CGGGGTGTGC ACAATGAAAT

651 CCTGTATGTA TTCGATGCCG TCCTGCCCGA AACCTTCCTG CCTGAAAATC

701 AGGATGGCGA AGTGGCGGGT TTTGAGAAAA TGGACATCGG CGGTCTGTTG

751 GCTGCCATGT TGTCGGGAAA CATGATGCAC GACGCGCAAC TGGTTACGCT

801 GGACGCGTTT TGCCGTTACG GTCTGATTGA TGCCGCCCAT CCGCTGTCCG

851 AGTGGCTGGA CGGCATACGT TTATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 414>：

1 MPTVRFTESV SKHDLDALFE WAKASYGAES CWKTLYLNGL PLGNLSPEWA

51 ERVKKDWEAG CSESSDGIFL NADGWPDMGR RLQHLARIWK EAGLLHGWRD

101 ECFDLTDGGS NPLFALERAA FRPFGLLSRA VHLNGLVESD GRWHFWIGRR

151 SPHKAVDPDK LDNTAAGGVS SGELPSETVC RESSEEAGLD KTLLPLIRPV

201 SQLHSLRPVS RGVHNEILYV FDAVLPETFL PENQDGEVAG FEKMDIGGLL

251 AAMLSGNMMH DAQLVTLDAF CRYGLIDAAH PLSEWLDGIR L*

ORF105a和ORF105-1显示在291个氨基酸的重叠区内有93.8％的相同性：

10 20 30 40 50 60

orf105a.pep MPTVRFTESVSKHDLDALFEWAKASYGAESCWKTLYLNGLPLGNLSPEWAERVKKDWEAG

||||||||||||:||||||||||||||||||||||||||||||||||||:||||||||||

orf105-1 MPTVRFTESVSKQDLDALFEWAKASYGAESCWKTLYLNGLPLGNLSPEWVERVKKDWEAG

10 20 30 40 50 60

70 80 90 100 110 120

orf105a.pep CSESSDGIFLNADGWPDMGRRLQHLARIWKEAGLLHGWRDECFDLTDGGSNPLFALERAA

||||||||||||||||||| |||||| |: |||| |||:|||||||||:||||:|||||

orf105-1 CSESSDGIFLNADGWPDMGGRLQHLALGWHCAGLLDGWRNECFDLTDGGGNPLFTLERAA

70 80 90 100 110 120

130 140 150 160 170 180

orf105a.pep FRPFGLLSRAVHLNGLVESDGRWHFWIGRRSPHKAVDPDKLDNTAAGGVSSGELPSETVC

||||||||||||||||:|||||||||||||||||||||:|||||||||||:||:|||:||

orf105-1 FRPFGLLSRAVHLNGLTESDGRWHFWIGRRSPHKAVDPNKLDNTAAGGVSGGEMPSEAVC

130 140 150 160 170 180

190 200 210 220 230 240

orf105a.pep RESSEEAGLDKTLLPLIRPVSQLHSLRPVSRGVHNEILYVFDAVLPETFLPENQDGEVAG

||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||

orf105-1 RESSEEAGLDKTLLPLIRPVSQLHSLRSVSRGVHNEILYVFDAVLPETFLPENQDGEVAG

190 200 210 220 230 240

250 260 270 280 290

orf105a.pep FEKMDIGGLLAAMLSGNMMHDAQLVTLDAFCRYGLIDAAHPLSEWLDGIRLX

|||||||||| |||||||||||||||||||||||||||||||||||||||||

orf105-1 FEKMDIGGLLDAMLSGNMMHDAQLVTLDAFCRYGLIDAAHPLSEWLDGIRLX

250 260 270 280 290

与淋病奈瑟球菌的预计ORF的同源性

ORF105显示与淋病奈瑟球菌的预计ORF(ORF105.ng)在重叠的312个氨基酸内有87.5％的相同性：

orf105.pep MVARRAHNPKVVGSNPXPATXFQTPRFNAEXVLXLPVSCFLFPAASVFCRIFLPAAISER 60

|||||||||||||||| ||| :|||||||| || |||||||||||||||||||||

orf105ng MVARRAHNPKVVGSNPAPATKYQTPRFNAEGVLF-----FLFPAASVFCRIFLPAAISER 55

orf105.pep QTAVCLRLQIQAVWLQSSALSSRKPTMPTVRFTESVSKQDLDALFEWAKASYGAESCWKT 120

|:|||||||||||||||||| ||||:|||||||||||||||||||| |||||||||||||

orf105ng QAAVCLRLQIQAVWLQSSALCSRKPAMPTVRFTESVSKQDLDALFERAKASYGAESCWKT 115

orf105.pep LYLNGXPLGNLSPEWVERVXKDWEAGCXESSDGIFLNADGWPDMGGRLQHLALGWHCAGL 180

|||| |||||||||:||: ||||||| |||:|||||||||||||||||||| |: |||

orf105ng LYLNRLPLGNLSPEWAERIKKDWEAGCSESSNGIFLNADGWPDMGGRLQHLARTWNKAGL 175

orf105.pep LDGWRNECFDLTDGGGNPLFTLERAXXRPXGLLSRAVHLNGLTESDGRWHFWIGRRSPHK 240

| ||||||||||||||||||||||| || ||| ||||||||:||:||||||||||||||

orf105ng LHGWRNECFDLTDGGGNPLFTLERAAFRPFGLLIRAVHLNGLVESNGRWHFWIGRRSPHK 235

orf105.pep AVDPNKLDNTXAGGVSGGEMPSEAVCRESSEEAGLDKTLLPLIRPVSQLHSLRSVSRGVH 300

||||:|||| :|||||||||||||||||||||||||||:|||||||:||||| ||||||

orf105ng AVDPGKLDNIAGGGVSGGEMPSEAVCRESSEEAGLDKTLFPLIRPVSRLHSLRPVSRGVH 295

orf105.pep NEILYVFDAVLP 312

||||||||||||

orf105ng NEILYVFDAVLPETFLPENQDGEVAGFEKMDIGGLLDAMLSKNMMHDAQLVTLDAFYRYG 355

预计全ORF105ng核苷酸序列<SEQ ID 415>编码的蛋白质具有氨基酸序列<SEQID 416>：

1 MVARRAHNPK VVGSNPAPAT KYQTPRFNAE G VLFFLFPAA SVFCRIFLPA

51 AISERQAAVC LRLQIQAVWL QSSALCSRKP AMPTVRFTES VSKQDLDALF

101 ERAKASYGAE SCWKTLYLNR LPLGNLSPEW AERIKKDWEA GCSESSNGIF

151 LNADGWPDMG GRLQHLARTW NKAGLLHGWR NECFDLTDGG GNPLFTLERA

201 AFRPFGLLIR AVHLNGLVES NGRWHFWIGR RSPHKAVDPG KLDNIAGGGV

251 SGGEMPSEAV CRESSEEAGL DKTLFPLIRP VSRLHSLRPV SRGVHNEILY

301 VFDAVLPETF LPENQDGEVA GFEKMDIGGL LDAMLSKNMM HDAQLVTLDA

351 FYRYGLIDAA HPLSEWLDGI RL*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 417>：

1 ATGCCGACCG TCCGTTTTAC CGAATCCGTC AGCAAACAAG ACCTTGATGC

51 CCTGTTCGAG CGGGCAAAAG CAAGTTACGG TGCCGAAAGT TGCTGGAAAA

101 CGCTGTATCT GAACCGTCTT CCTTTGGGCA ATCTGTCGCC GGAATGGGCT

151 GAGCGCATCA AAAAAGACTG GGAGGCAGGC TGCTCCGAGT CTTCAGACGG

201 CATTTTTCTG AATGCGGACG GCTGGCCGGA TATGGGCGGA CGCTTGCAGC

251 ACCTCGCCCG CACATGGAAC AAGGCGGGGC TGCTTCACGG ATGGCGCAAC

301 GAGTGTTTCG ACCTGACCGA CGGCGGCGGC AACCCCTTGT TCACGCTCGA

351 ACGCGCCGCT TTCCGTCCGT TCGGACTACT CAGCCGCGCC GTCCATCTCA

401 ACGGTTTGGT CGAATCGAAC GGCAGATGGC ATTTTTGGAT AGGCAGGCGC

451 AGTCCGCACA AAGCAGTCGa tcCCGGCAAG CTCGACAATA TTGCCGGCGG

501 CGGTGTTTCC GGCGGCGAAA TGCCGTCTGA AGCCGTGTGC CGCGAAAGCA

551 GCGAAGAAGC CGGTTTGGAT AAAACGCTGT TTCCGCTCAT CCGCCCAGTA

601 TCGCGGCTGC ACAGCCTTCG CCCCGTCAGC CGAGGTGTGC ACAATGAAAT

651 CCTGTATGTG TTCGATGCCG TCCTGCCCGA AACCTTCCTG CCTGAAAATC

701 AGGATGGCGA GGTAGCGGGT TTTGAAAAGA TGGACATTGG CGGCCTATTG

751 GATGCCATGT TGTCGAAAAA CATGATGCAC GACGCGCAAC TGGTTACGCT

801 GGACGCGTTT TACCGTTACG GTCTGATTGA TGCCGCCCAT CCGCTGTCCG

851 AGTGGCTGGA CGGCATACGT TTATAG

它对应于氨基酸序列<SEQ ID 418；ORF105ng-1>：

1 MPTVRFTESV SKQDLDALFE RAKASYGAES CWKTLYLNRL PLGNLSPEWA

51 ERIKKDWEAG CSESSDGIFL NADGWPDMGG RLQHLARTWN KAGLLHGWRN

101 ECFDLTDGGG NPLFTLERAA FRPFGLLSRA VHLNGLVESN GRWHFWIGRR

151 SPHKAVDPGK LDNIAGGGVS GGEMPSEAVC RESSEEAGLD KTLFPLIRPV

201 SRLHSLRPVS RGVHNEILYV FDAVLPETFL PENQDGEVAG FEKMDIGGLL

251 DAMLSKNMMH DAQLVTLDAF YRYGLIDAAH PLSEWLDGIR L*

ORG105ng-1和ORF105-1显示在291个氨基酸的重叠区内有93.5％的相同性：

10 20 30 40 50 60

orf105-1.pep MPTVRFTESVSKQDLDALFEWAKASYGAESCWKTLYLNGLPLGNLSPEWVERVKKDWEAG

|||||||||||||||||||| ||||||||||||||||| ||||||||||:||:|||||||

orf105ng-1 MPTVRFTESVSKQDLDALFERAKASYGAESCWKTLYLNRLPLGNLSPEWAERIKKDWEAG

10 20 30 40 50 60

70 80 90 100 110 120

orf105-1.pep CSESSDGIFLNADGWPDMGGRLQHLALGWHCAGLLDGWRNECFDLTDGGGNPLFTLERAA

|||||||||||||||||||||||||| |: |||| ||||||||||||||||||||||||

orf105ng-1 CSESSDGIFLNADGWPDMGGRLQHLARTWNKAGLLHGWRNECFDLTDGGGNPLFTLERAA

70 80 90 100 110 120

130 140 150 160 170 180

orf105-1.pep FRPFGLLSRAVHLNGLTESDGRWHFWIGRRSPHKAVDPNKLDNTAAGGVSGGEMPSEAVC

||||||||||||||||:||:||||||||||||||||||:|||| |:||||||||||||||

orf105ng-1 FRPFGLLSRAVHLNGLVESNGRWHFWIGRRSPHKAVDPGKLDNIAGGGVSGGEMPSEAVC

130 140 150 160 170 180

190 200 210 220 230 240

orf105-1.pep RESSEEAGLDKTLLPLIRPVSQLHSLRSVSRGVHNEILYVFDAVLPETFLPENQDGEVAG

|||||||||||||:|||||||:||||| ||||||||||||||||||||||||||||||||

orf105ng-1 RESSEEAGLDKTLFPLIRPVSRLHSLRPVSRGVHNEILYVFDAVLPETFLPENQDGEVAG

190 200 210 220 230 240

250 260 270 280 290

orf105-1.pep FEKMDIGGLLDAMLSGNMMHDAQLVTLDAFCRYGLIDAAHPLSEWLDGIRLX

||||||||||||||| |||||||||||||| |||||||||||||||||||||

orf105ng-1 FEKMDIGGLLDAMLSKNMMHDAQLVTLDAFYRYGLIDAAHPLSEWLDGIRLX

250 260 270 280 290

另外，ORF105ng-1显示出与一种酵母的酶同源：

sp|P41888|TNR3_SCHPO硫胺焦磷酸激酶(TPK)(硫胺激酶)

>gi|1076928|pir||S52350硫胺焦磷酸激酶(EC 2.7.6.2)-裂殖酵母(栗酒裂殖酵母)>gi|666111(X84417)硫胺焦磷酸激酶[栗酒裂殖酵母]>gi|2330852|gnl|PID|e334056(Z98533)硫胺焦磷酸激酶[栗酒裂殖酵母]长度＝569

评分＝105位(259)，估计值＝4e-22

相同性＝64/192(33％)，阳性＝94/192(48％)，空隙＝3/192(1％)

询问：268 NKAGLLHGWRNECFDLTDGGGNPLFTLERAAFRPFGLLSRAVHLNGLVESNGRW--HFWI 441

N G+ WRNE + + P+ +ER F FG LS VH + + W+

目标：96 NTFGIADQWRNELYTVYGKSKKPVLAVERGGFWLFGFLSTGVHCTMYIPATKEHPLRIWV 155

询问：442 GRRSPHKAVDPGKLDNIAGGGVSGGEMPSEAVCRESSEEAGLDKTLFPLIRPVSRLHSLR 621

RRSP K P LDN GG++ G+ + +E SEEA LD + LI P + ++

目标：156 PRRSPTKQTWPNYLDNSVAGGIAHGDSVIGTMIKEFSEEANLDVSSMNLI-PCGTVSYIK 214

询问：622 PVSRG-VHNEILYVFDAVLPETFLPENQDGEVAGFEKMDIGGLLDAMLSKNMMHDAQLVT 798

R + E+ YVFD + + +P DGEVAGF + + +L + K+ + LV

目标：215 MEKRHWIQPELQYVFDLPVDDLVIPRINDGEVAGFSLLPLNQVLHELELKSFKPNCALVL 274

询问：799 LDAFYRYGLIDAAHP 843

LD R+G+I HP

目标：275 LDFLIRHGIITPQHP 289

根据该分析结果(包括淋球菌蛋白中存在一个推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例49

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 419>：

1 ATGAATAGAC CCAAGCAACC CTTCTTCCGT CCCGAAGTCG CCGTTGCCCG

51 CCAAACCAGC CTGACGGGTA AAGTGATTCT GACACGACCG TTGTCATTTT

101 CCCTATGGAC GACATTTGCA TCGATATCTG CGTTATTGAT TATCCTGTTT

151 TTGATATTTG GTAACTATAC GCGAAAGACA ACAGTGGAGG GACAAATTTT

201 ACCTGCATCG GGCGTAATCA GGGTGTATGC ACCGgATACG rGkACAATTA

251 CAGCGAAATT CGTGGAAGAT GGmsAAAAGG TTAAGGCTGG CGACAAGCTA

301 TTTGCGCTTT CGACCTCACG TTTCGGCGCA GGAGGTAGCG TGCAGCAGCA

351 GTTGAAAACG GAGGCAGTTT TGAAGAAAAC GTTGGCAGAA CAGGAACTGG

401 GTCGTCTGAA GCTGATACAC GGGAATGAAA CGCGCAgCcT TAAAGCAACT

451 GTCGAACGTT TGGAAAACCA GGAACTCCAT ATTTCGCAAC AGATAGACGG

501 TCAGAAAAGG CGCATTAGAC TTGCGGAAGA AATGTTGCAG AAATATCGTT

551 TCCTATCCGC .CAATGA

它对应于氨基酸序列<SEQ ID 420；ORF107>：

1 MNRPKQPFFR PEVAVARQTS LTGKVILTRP LSFSLWTTFA SISALLIILF

51 LIFGNYTRKT TVEGQILPAS GVIRVYAPDT XTITAKFVED GXKVKAGDKL

101 FALSTSRFGA GGSVQQQLKT EAVLKKTLAE QELGRLKLIH GNETRSLKAT

151 VERLENQELH ISQQIDGQKR RIRLAEEMLQ KYRFLSXQ*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF107显示与脑膜炎奈瑟球菌菌株A的ORF(ORF107a)在重叠的186个氨基酸内有97.8％的相同性：

10 20 30 40 50 60

orf107.pep MNRPKQPFFRPEVAVARQTSLTGKVILTRPLSFSLWTTFASISALLIILFLIFGNYTRKT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf107a MNRPKQPFFRPEVAVARQTSLTGKVILTRPLSFSLWTTFASISALLIILFLIFGNYTRKT

10 20 30 40 50 60

70 80 90 100 110 120

orf107.pep TVEGQILPASGVIRVYAPDTXTITAKFVEDGXKVKAGDKLFALSTSRFGAGGSVQQQLKT

|||||||||||||||||||| |||||| ||| ||||||||||||||||||| ||||||||

orf107a TVEGQILPASGVIRVYAPDTGTITAKFXEDGEKVKAGDKLFALSTSRFGAGDSVQQQLKT

70 80 90 100 110 120

130 140 150 160 170 180

orf107.pep EAVLKKTLAEQELGRLKLIHGNETRSLKATVERLENQELHISQQIDGQKRRIRLAEEMLQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf107a EAVLKKTLAEQELGRLKLIHGNETRSLKATVERLENQELHISQQIDGQKRRIRLAEEMLQ

130 140 150 160 170 180

189

orf107.pep KYRFLSXQX

||||||

orf107a KYRFLSANDAVPKQEMMNVKAELLEQKAKLDAYRREEVGLLQEIRTQNLTLXSLPQAAX

190 200 210 220 230

全长ORF107a核苷酸序列<SEQ ID 421>是：

1 ATGAATAGAC CCAAGCAACC NTTCTTCCGT CCCGAAGTCG CCGTTGCCCG

51 CCAAACCAGC CTGACGGGTA AAGTGATTCT GACACGACCG TTGTCATTTT

101 CCCTATGGAC GACATTTGCA TCGATATCTG CGTTATTGAT TATCCTGTTT

151 TTGATATTTG GTAACTATAC GCGAAAGACA ACAGTGGAGG GACAAATTTT

201 ACCTGCATCG GGCGTAATCA GGGTGTATGC ACCGGATACG GGGACAATTA

251 CNGCGAAATT CNTGGAAGAT GGAGAAAAGG TTAAGGCTGG CGACAAGCTA

301 TTTGCGCTTT CGACCTCACG TTTCGGCGCA GGAGATAGCG TGCAGCAGCA

351 GTTGAAAACG GAGGCAGTTT TGAAGAAAAC GTTGGCAGAA CAGGAACTGG

401 GTCGTCTGAA GCTGATACAC GGGAATGAAA CGCGCAGCCT TAAAGCAACT

451 GTCGAACGTT TGGAAAACCA GGAACTCCAT ATTTCGCAAC AGATAGACGG

501 TCAGAAAAGG CGCATTAGAC TTGCGGAAGA AATGTTGCAG AAATATCGTT

551 TCCTATCCGC CAATGATGCA GTGCCAAAAC AAGAAATGAT GAATGTCAAG

601 GCAGAGCTTT TAGAGCAGAA AGCCAAACTT GATGCCTACC GCCGAGAAGA

651 AGTCGGGCTG CTTCAGGAAA TCCGCACGCA GAATCTGACA TTGGNNAGCC

701 TCCCCCAAGC GGCATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 422>：

1 MNRPKQPFFR PEVAVARQTS LTGKVILTRP LSFSLWT TFA SISALLIILF

51 LIFGNYTRKT TVEGQILPAS GVIRVYAPDT GTITAKFXED GEKVKAGDKL

101 FALSTSRFGA GDSVQQQLKT EAVLKKTLAE QELGRLKLIH GNETRSLKAT

151 VERLENQELH ISQQIDGQKR RIRLAEEMLQ KYRFLSANDA VPKQEMMNVK

201 AELLEQKAKL DAYRREEVGL LQEIRTQNLT LXSLPQAA*

与淋病奈瑟球菌的预计ORF的同源性

ORF107显示与淋病奈瑟球菌的预计ORF(ORF107.ng)在重叠的188个氨基酸内有95.7％的相同性：

orf107.pep MNRPKQPFFRPEVAVARQTSLTGKVILTRPLSFSLWTTFASISALLIILFLIFGNYTRKT 60

||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf107ng MNRPKQPFFRPEVAIARQTSLTGKVILTRPLSFSLWTTFASISALLIILFLIFGNYTRKT 60

orf107.pep TVEGQILPASGVIRVYAPDTXTITAKFVEDGXKVKAGDKLFALSTSRFGAGGSVQQQLKT 120

|:|||||||||||||||||| |||||||||| ||||||||||||||||||||||||||||

orf107ng TMEGQILPASGVIRVYAPDTGTITAKFVEDGEKVKAGDKLFALSTSRFGAGGSVQQQLKT 120

orf107.pep EAVLKKTLAEQELGRLKLIHGNETRSLKATVERLENQELHISQQIDGQKRRIRLAEEMLQ 180

|||||||||||||||||||| ||||||||||||||||:|||||||||||||||||||||:

orf107ng EAVLKKTLAEQELGRLKLIHENETRSLKATVERLENQKLHISQQIDGQKRRIRLAEEMLR 180

orf107.pep KYRFLSXQ 188

|||||| |

orf107ng KYRFLSAQ 188

预计全长ORF107ng核苷酸序列<SEQ ID 423>编码的蛋白质具有氨基酸序列<SEQ ID 424>：

1 MNRPKQPFFR PEVAIARQTS LTGKVILTRP LSFSLWT TFA SISALLIILF

51 LIFGNYTRKT TMEGQILPAS GVIRVYAPDT GTITAKFVED GEKVKAGDKL

101 FALSTSRFGA GGSVQQQLKT EAVLKKTLAE QELGRLKLIH ENETRSLKAT

151 VERLENQKLH ISQQIDGQKR RIRLAEEMLR KYRFLSAQ*

根据此淋球菌蛋白中存在一个推定的跨膜结构域的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例50

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 425>：

1 ATGCTGAATA CTTTTTTTGC CGTATTGGGC GGCTGCCTGC TGCT.TTGCC

51 GTGCGGCAAA TCCGTAAATA CGGCGGTACA GCCGCAAAAC GCGGTACAAA

101 GCGCGCCGAA ACCGGTTTTC AAAGTCATAT ATATCGACAA TACGGCGATT

151 GCCGGTTTGG ATTTGGGACA AAGCAGCGAA GGCAAAACCA ACGACGGCAA

201 AAAACAAATC AGTTATCCGA TTAAAGGCTT GCCGGAACAA AATGTTATCC

251 GACTGATCGG CAAGCATCCC GGCGACTTGG AAGCCGTCAG CGGCAAATGT

301 ATGGAAACCG ATGATAAGGA CAGTCCGGCA GGTTGGGCAG AAAACGGCGT

351 GTGCCATACC TTGTTTGCCA AACTGGTGGG CAATATCGCC GAAGACGGCG

401 GCAAACTGAC GGATTACCTA GTTTCGCATG CCGCCCTGCA ACCCTATCAG

451 GCAGGCAAAA GCGGCTATGC CGCCGTGCAG AACGGACGCT ATGTGCTGGA

501 AATCGACAGC GAAGGGGCGT TTTATTTCCG CCGCCGCCAT TATTGA

它对应于氨基酸序列<SEQ ID 426；ORF 108>：

1 MLNTFFAVLG GCLLXLPCGK SVNTAVQPQN AVQSAPKPVF KVIYIDNTAI

51 AGLDLGQSSE GKTNDGKKQI SYPIKGLPEQ NVIRLIGKHP GDLEAVSGKC

101 METDDKDSPA GWAENGVCHT LFAKLVGNIA EDGGKLTDYL VSHAALQPYQ

151 AGKSGYAAVQ NGRYVLEIDS EGAFYFRRRH Y*

进一步的工作揭示了下列DNA序列<SEQ ID 427>：

1 ATGCTGAAAA CATCTTTTGC CGTATTGGGC GGCTGCCTGC TGCTTGCCGC

51 CTGCGGCAAA TCCGAAAATA CGGCGGAACA GCCGCAAAAC GCGGTACAAA

101 GCGCGCCGAA ACCGGTTTTC AAAGTCAAAT ATATCGACAA TACGGCGATT

151 GCCGGTTTGG ATTTGGGACA AAGCAGCGAA GGCAAAACCA ACGACGGCAA

201 AAAACAAATC AGTTATCCGA TTAAAGGCTT GCCGGAACAA AATGTTATCC

251 GACTGATCGG CAAGCATCCC GGCGACTTGG AAGCCGTCAG CGGCAAATGT

301 ATGGAAACCG ATGATAAGGA CAGTCCGGCA GGTTGGGCAG AAAACGGCGT

351 GTGCCATACC TTGTTTGCCA AACTGGTGGG CAATATCGCC GAAGACGGCG

401 GCAAACTGAC GGATTACCTA GTTTCGCATG CCGCCCTGCA ACCCTATCAG

451 GCAGGCAAAA GCGGCTATGC CGCCGTGCAG AACGGACGCT ATGTGCTGGA

501 AATCGACAGC GAAGGGGCGT TTTATTTCCG CCGCCGCCAT TATTGA

它对应于氨基酸序列<SEQ ID 428；ORF108-1>：

1 MLKTSFAVLG GCLLLAACGK SENTAEQPQN AVQSAPKPVF KVKYIDNTAI

51 AGLDLGQSSE GKTNDGKKQI SYPIKGLPEQ NVIRLIGKHP GDLEAVSGKC

101 METDDKDSPA GWAENGVCHT LFAKLVGNIA EDGGKLTDYL VSHAALQPYQ

151 AGKSGYAAVQ NGRYVLEIDS EGAFYFRRRH Y*

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的预计ORF的同源性

ORF108显示与淋病奈瑟球菌的预计ORF(ORF108.ng)在重叠的181个氨基酸内有88.4％的相同性：

orf108.pep MLNTFFAVLGGCLLXLPCGKSVNTAVQPQNAVQSAPKPVFKVIYIDNTAIAGLDLGQSSE 60

||: ||||||||| |||| ||| |||||:|||||||||| |||||||||| ||||||

orf108ng MLKIPFAVLGGCLLLAACGKSENTAEQPQNAAQSAPKPVFKVKYIDNTAIAGLALGQSSE 60

orf108.pep GKTNDGKKQISYPIKGLPEQNVIRLIGKHPGDLEAVSGKCMETDDKDSPAGWAENGVCHT 120

|||||||||||||||||||||::|| ||||:||||| ||||||| ||:|:||||||||||

orf108ng GKTNDGKKQISYPIKGLPEQNAVRLTGKHPNDLEAVVGKCMETDGKDAPSGWAENGVCHT 120

orf108.pep LFAKLVGNIAEDGGKLTDYLVSHAALQPYQAGKSGYAAVQNGRYVLEIDSEGAFYFRRRHY 181

||||||||||||||||||||:||:|||||||||||||||||||||||||||||||||||||

orf108ng LFAKLVGNIAEDGGKLTDYLISHSALQPYQAGKSGYAAVQNGRYVLEIDSEGAFYFRRRHY 181

ORF108-1与ORF108ng在相同的181个氨基酸重叠区内有92.3％的相同性：

orf108-1.pep MLKTSFAVLGGCLLLAACGKSENTAEQPQNAVQSAPKPVFKVKYIDNTAIAGLDLGQSSE 60

||| ||||||||||||||||||||||||||:||||||||||||||||||||| ||||||

orf108ng-1 MLKIPFAVLGGCLLLAACGKSENTAEQPQNAAQSAPKPVFKVKYIDNTAIAGLALGQSSE 60

orf108-1.pep GKTNDGKKQISYPIKGLPEQNVIRLIGKHPGDLEAVSGKCMETDDKDSPAGWAENGVCHT 120

|||||||||||||||||||||::|| ||||:||||| ||||||| ||:|:||||||||||

orf108ng-1 GKTNDGKKQISYPIKGLPEQNAVRLTGKHPNDLEAVVGKCMETDGKDAPSGWAENGVCHT 120

orf108-1.pep LFAKLVGNIAEDGGKLTDYLVSHAALQPYQAGKSGYAAVQNGRYVLEIDSEGAFYFRRRHY 181

||||||||||||||||||||:||:|||||||||||||||||||||||||||||||||||||

orf108ng-1 LFAKLVGNIAEDGGKLTDYLISHSALQPYQAGKSGYAAVQNGRYVLEIDSEGAFYFRRRHY 181

全长ORF108ng核苷酸序列<SEQ ID 429>是：

1 ATGCTGAAAa tacctTTTGC CGTGTtgggc ggCtgcctGC TGCTTGCCGC

51 CTGCGGCAAA TCCGAAAATa cggcggaACA GCCGCAAAAT gcggCACAAA

101 GCGCGCCGAA ACCGGTTTTC AAAGTCAAAT ACATCGACAA TACGGCGATT

151 GCCGGTTTGG CTTTGGGACA AAGTAGCGAA GGCAAAACCA acgacgGCAA

201 AAAACAAATC AGTTATccgA TTAAAGGCTT GCCGGAACAA Aacgccgtcc

251 gGCTGACCGG AAAGCATCCC AACGACTTGG AagccgtcgT CGGCAAATGT

301 ATGGAAACCG ACGGAAAGGA CGCGCCTTCG GGCTGGGCGG AAAACGGCGT

351 GTGCCATACC TTGTTTGCCA AACTGGTGGG CAATATCGCC GAAGACGGCG

401 GCAAACTGAC TGATTACCTG ATTTCGCATT CCGCCCTGCA ACCCTATCAG

451 GCAGGCAAAA GCGGCTATGC CGCCGTGCAG AACGGACGCT ATGTGCTGGA

501 AATCGACAGC GagggGGCGT TTTATttccg ccgccgccat tattgA

它编码的蛋白质具有氨基酸序列<SEQ ID 430>：

1 MLKIPFA YLG GCLLLAACGK SENTAEQPQN AAQSAPKPVF KVKYIDNTAI

51 AGLA

NDGKKQI SYPIKGLPEQ NAVRLTGKHP NDLEAVVGKC

101 METDGKDAPS GWAENGVCHT LFAKLVGNIA EDGGKLTDYL ISHSALQPYQ

151 AGKSGYAAVQ NGRYVLEIDS EGAFYFRRRH Y*

根据该分析结果(包括淋球菌蛋白中存在一个预计的原核细胞膜脂蛋白脂质连接位点(下划线)和一个推定的ATP/GTP-结合位点基序A(P-环，双划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例51

在脑膜炎奈瑟球菌中鉴定出下列DNA序列<SEQ ID 431>：

1 ATGGAAGATT TATATATAAT ACTCGCTTTG GGTTTGGTTG CGATGATTGC

51 CGgATTTATC GATgcgatTg cGggCGGGGG TGGTTTGATT ACGCTGCCCG

101 CACTCTTGTT GGCAGGTATT CCTCCCGTGT CGGCAATTGC CACCAACAAG

151 CTGCAAgCAG CCGCTGCTAC GTTTTCAGCT ACGGTTTCTT TTGCACGCAA

201 AGGTTTGATT GATTGGAAGA AAGGTCTCCC GATTGCCGCA GCATCGTTTG

251 TAGGCGGCGT GGcCGGTGCA TTATCGGTCA GCTTGGTTTC CAAAGATATT

301 CTgCTgGCGG TCGTGCCGGT TTTGTTGATA TTTGTCGCAC TGTATTTTGT

351 GTTTTCGCCC AAGCTCGACG GCAGTAAGGA AGGCAAAGCC AGAATGTCTT

401 TTTTTCTGTT cGGGCTGACG GTCGC.ACCG CTTTTGGGTT TTTACGACGG

451 TGTGTTCGGA CCGGGTGTCG GCTCGTTTTT TCTGATTGCC TTTATTGTTT

501 TGCTCGGCTG CAAgCTGTTG AACGCGATGT CTTACACCAA ATTGGCGAAC

551 GTTGCCTGCA ATCTTGGTTC GCTATCGGTA TTCCTGCTGC ACGGTTCGAT

601 TATTTTCCCG ATTGCGGCAA CGaTGGCGGT CGGTGCGTTT GTCGGtGCGA

651 ATTTAgGTGC GAGATTTGCC GTaCgctTCG GTTCGAAGCT GATTAA

它对应于氨基酸序列<SEQ ID 432；ORF109>：

1 MEDLYIILAL GLVAMIAGFI DAIAGGGGLI TLPALLLAGI PPVSAIATNK

51 LQAAAATFSA TVSFARKGLI DWKKGLPIAA ASFVGGVAGA LSVSLVSKDI

101 LLAVVPVLLI FVALYFVFSP KLDGSKEGKA RMSFFLFGLT VXTAFGFLRR

151 CVRTGCRLVF SDCLYCFARL QAVERDVLHQ IGERCLQSWF AIGIPAARFD

201 YFPDCGNDGG RCVCRCEFRC EICRTLRFEA D*

进一步的工作揭示了下列DNA序列<SEQ ID 433>：

1 ATGGAAGATT TATATATAAT ACTCGCTTTG GGTTTGGTTG CGATGATTGC

51 CGGATTTATC GATGCGATTG CGGGCGGGGG TGGTTTGATT ACGCTGCCCG

101 CACTCTTGTT GGCAGGTATT CCTCCCGTGT CGGCAATTGC CACCAACAAG

151 CTGCAAGCAG CCGCTGCTAC GTTTTCAGCT ACGGTTTCTT TTGCACGCAA

201 AGGTTTGATT GATTGGAAGA AAGGTCTCCC GATTGCCGCA GCATCGTTTG

251 TAGGCGGCGT GGCCGGTGCA TTATCGGTCA GCTTGGTTTC CAAAGATATT

301 CTGCTGGCGG TCGTGCCGGT TTTGTTGATA TTTGTCGCAC TGTATTTTGT

351 GTTTTCGCCC AAGCTCGACG GCAGTAAGGA AGGCAAAGCC AGAATGTCTT

401 TTTTTCTGTT CGGGCTGACG GTCGCACCGC TTTTGGGTTT TTACGACGGT

451 GTGTTCGGAC CGGGTGTCGG CTCGTTTTTT CTGATTGCCT TTATTGTTTT

501 GCTCGGCTGC AAGCTGTTGA ACGCGATGTC TTACACCAAA TTGGCGAACG

551 TTGCCTGCAA TCTTGGTTCG CTATCGGTAT TCCTGCTGCA CGGTTCGATT

601 ATTTTCCCGA TTGCGGCAAC GATGGCGGTC GGTGCGTTTG TCGGTGCGAA

651 TTTAGGTGCG AGATTTGCCG TCCGCTTCGG TTCGAAGCTG ATTAAGCCGC

701 TGCTGATTGT CATCAGCATT TCGATGGCTG TGAAATTGTT GATAGACGAG

751 AGAAATCCGC TGTATCAGAT GATTGTTTCG ATGTTTTAA

它对应于氨基酸序列<SEQ ID 434；ORF109-1>：

1 MEDLYIILAL GLVAMIAGFI DAIAGGGGLI TLPALLLAGI PPVSAIATNK

51 LQAAAATFSA TVSFARKGLI DWKKGLPIA A ASFVGGVAGA LSVSLVSKD I

101 LLAVVPVLLI FVALYFVFSP KLDGSKEGKA R MSFFLFGLT VAPLLGFYDG

151 VFGPG VGSFF LIAFIVLLGC KLLNAMSYTK LANVACNLGS LSVFLLHGS I

201 IFPIAATMAV GAFVGANLGA RFAVRFGSKL IK PLLIVISI SMAVKLLIDE

251 RNPLYQMIVS MF*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF109显示与脑膜炎奈瑟球菌菌株A的ORF(ORF109a)在重叠的147个氨基酸内有95.9％的相同性：

10 20 30 40 50 60

orf109.pep MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109a MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

10 20 30 40 50 60

70 80 90 100 110 120

orf109.pep TVSFARKGLIDWKKGLPIAAASFVGGVAGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

|||||||||||||||||||||||:|||:||||||||||||||||||||||||||||||||

orf109a TVSFARKGLIDWKKGLPIAAASFAGGVVGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

70 80 90 100 110 120

130 140 150 160 170 180

orf109.pep KLDGSKEGKARMSFFLFGLTVXTAFGFLRRCVRTGCRLVFSDCLYCFARLQAVERDVLHQ

||||||||||||||||||||| :||

orf109a KLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFFLIAFIVLLGCKLLNAMSYTK

130 140 150 160 170 180

全长ORF109a核苷酸序列<SEQ ID 435>是：

1 ATGGAAGATT TATACATAAT ACTCGCTTTG GGTTTGGTTG CGATGATTGC

51 CGGATTTATC GATGCGATTG CGGGTGGGGG TGGTTTGATT ACGCTGCCTG

101 CACTCTTGTT GGCAGGTATT CCTCCCGTGT CGGCAATTGC CACCAACAAG

151 CTGCAAGCAG CCGCTGCTAC GTTTTCGGCT ACGGTTTCTT TTGCACGCAA

201 AGGTTTGATT GATTGGAAGA AAGGTCTCCC GATTGCGGCA GCATCGTTTG

251 CAGGCGGCGT GGTCGGTGCA TTATCGGTCA GCTTGGTTTC CAAAGATATT

301 CTGCTGGCGG TCGTGCCGGT TTTGTTGATA TTTGTCGCGC TGTATTTTGT

351 GTTTTCGCCC AAGCTCGACG GCAGTAAGGA AGGCAAAGCC AGAATGTCTT

401 TTTTTCTGTT CGGTCTGACG GTTGCACCAC TTTTGGGTTT TTACGACGGT

451 GTGTTCGGAC CGGGTGTCGG CTCGTTTTTT CTGATTGCCT TTATTGTTTT

501 GCTCGGCTGC AAGCTGTTGA ACGCGATGTC TTACACCAAA TTGGCGAACG

551 TTGCCTGCAA TCTTGGTTCG CTATCGGTAT TCCTGCTGCA CGGTTCGATT

601 ATTTTCCCGA TTGCGGCAAC GATGGCGGTC GGTGCGTTTG TCGGTGCGAA

651 TTTAGGTGCG AGATTTGCCG TCCGCTTCGG TTCGAAGCTG ATTAAGCCGC

701 TGCTGATTGT CATCAGCATT TCGATGGCTG TGAAATTGTT GATAGACGAG

751 AGAAATCCGC TGTATCAGAT GATTGTTTCG ATGTTTTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 436>：

1 MEDLYIILAL GLVAMIAGFI DAIAGGGGLI TLPALLLAGI PPVSAIATNK

51 LQAAAATFSA TVSFARKGLI DWKKGLPIA A ASFAGGVVGA LSVSLVSKD I

101 LLAVVPVLLI FVALYFVFSP KLDGSKEGKA R MSFFLFGLT VAPLLGFYDG

151 VFGPG VGSFF LIAFIVLLGC KLLNAMSYTK LANVACNLGS LSVFLLHGS I

201 IFPIAATMAV GAFVGANLGA RFAVRFGSKL IK PLLIVISI SMAVKLLIDE

251 RNPLYQMIVS MF*

ORF109a和ORF109-1显示在262个氨基酸的重叠区内有99.2％的相同性：

10 20 30 40 50 60

orf109a.pep MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109-1 MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

10 20 30 40 50 60

70 80 90 100 110 120

orf109a.pep TVSFARKGLIDWKKGLPIAAASFAGGVVGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

|||||||||||||||||||||||:|||:||||||||||||||||||||||||||||||||

orf109-1 TVSFARKGLIDWKKGLPIAAASFVGGVAGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

70 80 90 100 110 120

130 140 150 160 170 180

orf109a.pep KLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFFLIAFIVLLGCKLLNAMSYTK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109-1 KLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFFLIAFIVLLGCKLLNAMSYTK

130 140 150 160 170 180

190 200 210 220 230 240

orf109a.pep LANVACNLGSLSVFLLHGSIIFPIAATMAVGAFVGANLGARFAVRFGSKLIKPLLIVISI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109-1 LANVACNLGSLSVFLLHGSIIFPIAATMAVGAFVGANLGARFAVRFGSKLIKPLLIVISI

190 200 210 220 230 240

250 260

orf109a.pep SMAVKLLIDERNPLYQMIVSMFX

|||||||||||||||||||||||

orf109-1 SMAVKLLIDERNPLYQMIVSMFX

250 260

与淋病奈瑟球菌的预计ORF的同源性

ORF109显示与淋病奈瑟球菌的预计ORF(ORF109.ng)在重叠的231个氨基酸内有98.3％的相同性：

orf109.pep MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109ng MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA 60

orf109.pep TVSFARKGLIDWKKGLPIAAASFVGGVAGALSVSLVSKDILLAVVPVLLIFVALYFVFSP 120

|||||||||||||||||||||||:|||:||||||||||||||||||||||||||||||||

orf109ng TVSFARKGLIDWKKGLPIAAASFAGGVVGALSVSLVSKDILLAVVPVLLIFVALYFVFSP 120

orf109.pep KLDGSKEGKARMSFFLFGLTVXTAFGFLRRCVRTGCRLVFSDCLYCFARLQAVERDVLHQ 180

||||||||||||||||||||| ||||||||||||||||||||||||||||||||||||||

orf109ng KLDGSKEGKARMSFFLFGLTVATAFGFLRRCVRTGCRLVFSDCLYCFARLQAVERDVLHQ 180

orf109.pep IGERCLQSWFAIGIPAARFDYFPDCGNDGGRCVCRCEFRCEICRTLRFEAD 231

|||||||||||||||||||||||||||||||||||||||||||| ||||||

orf109ng IGERCLQSWFAIGIPAARFDYFPDCGNDGGRCVCRCEFRCEICRPLRFEAD 231

预计ORF109ng核苷酸序列<SEQ ID 437>编码的蛋白质具有氨基酸序列<SEQ ID438>：

1 TNK

51 LQAAAATFSA TVSFARKGLI DWKKGLPIA A ASFAGGVVGA LSVSLVSKD I

101 LLAVVPVLLI FVALYFVFSP KLDGSKEGKA R MSFFLFGLT VATAFGFLRR

151 CVRTGCRLVF SDCLYCFARL QAVERDVLHQ IGERCLQSWF AIGIPAARFD

201 YFPDCGNDGG RCVCRCEFRC EICRPLRFEA D*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 439>：

1 ATGGAAGATT TATACATAAT ACTCGCTTTG GGTTTGGTTG CGATGATCGC

51 CGGATTTATC GATGCGATTG CGGGCGGGGG TGGTTTGATT ACGCTGCCTG

101 CACTCTTGTT GGCAGGTATT CCTCCCGTGT CGGCAATTGC CACCAACAAG

151 CTGCAAGCAG CCGCTGCTAC GTTTTCGGCT ACGGTTTCTT TTGCACGCAA

201 AGGTTTGATT GATTGGAAGA AAGGTCTCCC GATTGCCGCA GCATCGTTTG

251 CAGGCGGCGT GGTCGGTGCA TTATCGGTCA GCTTGGTTTC CAAAGATATT

301 TTGCTGGCGG TCGTGCCGGT TTTGTTGATA TTTGTCGCGC TGTATTTTGT

351 GTTTTCGCCC AAGCTCGACG GCAGTAAGGA AGGCAAAGCC AGAATGTCTT

401 TTTTTCTATT CGGGCTGACG GTTGCACCGC TTTTGGGTTT TTACGACGGT

451 GTGTTCGGAC CGGGTGTCGG CTCGTTTTTT CTGATTGCCT TTATTGTTTT

501 GCTCGGCTGC AAGCTGTTGA ACGCGATGTC TTACACCAAA TTGGCGAACG

551 TTGCTTGCAA TCTTGGTTCG CTATCGGTAT TCCTGCTGCA CGGTTCGATT

601 ATTTTCCCGA TTGTGGCAAC GATGGCGGTC GGTGCGTTTG TCGGTGCGAA

651 TTTAGGTGCG AGATTTGCCG TCCGCTTCGG TTCGAAGCTG ATTAAGCCGC

701 TGCTGATTGT CATCAGCATT TCGATGGCTG TGAAATTGTT GATAGACGAG

751 AGAAATCCGC TGTATCAGAT GATTGTTTCG ATGTTTTAA

它对应于氨基酸序列<SEQ ID 440；ORF109ng-1>：

1 MEDLYIILAL GLVAMIAGFI DAIAGGGGLI TLPALLLAGI PPVSAIATNK

51 LQAAAATFSA TVSFARKGLI DWKKGLPIA A ASFAGGVVGA LSVSLVSKD I

101 LLAVVPVLLI FVALYFVFSP KLDGSKEGKA R MSFFLFGLT VAPLLGFYDG

151 VFGPG VGSFF LIAFIVLLGC KLLNAMSYTK LANVACNLGS LSVFLLHGS I

201 IFPIVATMAV GAFVGANLGA RFAVRFGSKL IK PLLIVISI SMAVKLLIDE

251 RNPLYQMIVS MF*

ORF109ng-1和ORF109-1显示在262个氨基酸的重叠区内有98.9％的相同性：

10 20 30 40 50 60

orf109ng-1.pep MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109-1 MEDLYIILALGLVAMIAGFIDAIAGGGGLITLPALLLAGIPPVSAIATNKLQAAAATFSA

10 20 30 40 50 60

70 80 90 100 110 120

orf109ng-1.pep TVSFARKGLIDWKKGLPIAAASFAGGVVGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

|||||||||||||||||||||||:|||:||||||||||||||||||||||||||||||||

orf109-1 TVSFARKGLIDWKKGLPIAAASFVGGVAGALSVSLVSKDILLAVVPVLLIFVALYFVFSP

70 80 90 100 110 120

130 140 150 160 170 180

orf109ng-1.pep KLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFFLIAFIVLLGCKLLNAMSYTK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf109-1 KLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFFLIAFIVLLGCKLLNAMSYTK

130 140 150 160 170 180

190 200 210 220 230 240

orf109ng-1.pep LANVACNLGSLSVFLLHGSIIFPIVATMAVGAFVGANLGARFAVRFGSKLIKPLLIVISI

||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||||

orf109-1 LANVACNLGSLSVFLLHGSIIFPIAATMAVGAFVGANLGARFAVRFGSKLIKPLLIVISI

190 200 210 220 230 240

250 260

orf109ng-1.pep SMAVKLLIDERNPLYQMIVSMFX

|||||||||||||||||||||||

orf109-1 SMAVKLLIDERNPLYQMIVSMFX

250 260

另外，ORF109ng-1显示出与一种假设的假单胞菌属蛋白同源：

sp|P29942|YCB9_PSEDE COBO 3’区域中假设的27.4KD蛋白(ORF9)

>gi|94984|pir||I38164假设蛋白9-假单胞菌属>gi|551929(M62866)ORF9[脱氮假单胞菌]长度＝261

评分＝175位(439)，估计值＝3e-43

相同性＝83/214(38％)，阳性＝131/214(60％)，空隙＝1/214(0％)

询问：41 PPVSAIATNKLQXXXXXXXXXXXXXRKGLIDWKKGLPIXXXXXXXXXXXXXXXXXXXKDI 100

PP+ + TNKLQ R+G ++ K+ LP+ D+

目标：43 PPLQTLGTNKLQGLFGSGSATLSYARRGHVNLKEQLPMALMSAAGAVLGALLATIVPGDV 102

询问：101 LLAVVPVLLIFVALYFVFSPKLDGSKEGKARMSFFLFGLTVAPLLGFYDGVFGPGVGSFF 160

L A++P LLI +ALYF P + G + +R++ F+F LT+ PL+GFYDGVFGPG GSFF

目标：103 LKAILPFLLIAIALYFGLKPNM-GDVDQHSRVTPFVFTLTLVPLIGFYDGVFGPGTGSFF 161

询问：161 LIAFIVLLGCKLLNAMSYTKLANVACNLGSLSVFLLHGSIIFPIVATMAVGAFVGANLGA 220

++ F+ L G +L A ++TK N N+G+ VFL G++++ + M +G F+GA +G+

目标：162 MLGFVTLAGFGVLKATAHTKFLNFGSNVGAFGVFLFFGAVLWKVGLLMGLGQFLGAQVGS 221

询问：221 RFAVRFGSKLIKPLLIVISISMAVKLLIDERNPL 254

R+A+ G+K+IKPLL+++SI++A++LL D +PL

目标：222 RYAMAKGAKIIKPLLVIVSIALAIRLLADPTHPL 255

根据该分析结果(包括该淋球菌蛋白中存在一个推定的前导序列(双划线)和数个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例52

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 441>：

1 ..CTGCTAGG ATTGCATCGG TTATCGGTAC G CTGTTGCA GCAAAACCAG

51 CCGCAGACGG ATTATTTGGT CAAATTCGGA TCGTTTTGGG CGAG.ATTTT

101 TGGTTTTCTG GGACTGTATG ACGTCTATGC TTCGGCATGG TTTGTCGTTA

151 TCATGATGTT TTTGGTGGTT TCTACCAGTT TGTGCCTGAT TCGCAATGTG

201 CCGCCGTTCT GGCGCGAAAT GAAGTCTTTT CGGGAAAAGG TTAAAGAAAA

251 ATCTCTGGCG GCGATGCGCC ATTCTTCGCT GTTGGATGTA AAAATTGCGC

301 CCGAGGTTGC CAAACGTTAT CTGGAAGTAC AAGGTTTTCA GGGGAAAACC

351 ATTAACCGTG AAGACGGGTC GGTTCTGATT GCCGCCAAAA AAGGCACAAT

401 GAACAAATGG GGCTATATCT TTGCCCATGT TGCTTTGATT GTCATTTGCC

451 TGGGCGGGTT GATAGACAGT AACCTGCTGT TGAAACTGGG TATGCTGACC

501 GGTCGGATT

TTCCGGACAA TCAGGCGGTT TATGCCAAGG ATTTC.AAGC

551 CCGAAAGTAT .TTTGGGTGC gTCCAATCTC TCATTTAGGG GCAACGTCAA

601 TATTTCCG.A GGGGCAGAgT GCGGATGTGG TTTTCCTGA

它对应于氨基酸序列<SEQ ID 442；ORF110>：

1 ..LLGIASVIGT LLQQNQPQTD YLVKFGSFWA XIFGFLGLYD VYASAWFVVI

51 MMFLVVSTSL CLIRNVPPFW REMKSFREKV KEKSLAAMRH SSLLDVKIAP

101 EVAKRYLEVQ GFQGKTINRE DGSVLIAAKK GTMNKWGYIF AHVALIVICL

151 GGLIDSNLLL KLGMLTGRIF RTIRRFMPRI XKPESXFGCV QSLI*GQRQY

201 FXRGRVRMWF S*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的ORF88a的同源性

ORF110显示与脑膜炎奈瑟球菌菌株A的ORF88a在重叠的188个氨基酸内有91.5％的相同性：

10 20 30 40 50 60

orf88a.pep MSKSRRSPPLLSRPWFAFFSSMRFA VALLSLLGIASVIGTVLQQNQPQTDYLVKFGSFWA

||||||||||:| ||||||||||||||||||

orf110 LLGIASVIGTLLQQNQPQTDYLVKFGSFWA

10 20 30

70 80 90 100 110 120

orf88a.pep QIFGFLGLYDVYASAW FVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH

|||||||||||||||| ||||||||||||||||| |||||||||||||||||||||||||||

orf110 XIFGFLGLYDVYASAW FVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH

40 50 60 70 80 90

130 140 150 160 170 180

orf88a.pep SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWG YIFAHVALIVICL

||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||||

orf110 SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWG YIFAHVALIVICL

100 110 120 130 140 150

190 200 210 220 230 240

orf88a.pep GGLIDSNLLLKLGMLTGRIVPDNQAVYAKDFKPESILGASNLSFRGNVNISEGQSADVVF

|||| ||||||||||||||| : : : |||| :|

orf110 GGLIDSNLLLKLGMLTGRIFRTIRRFMPRIXKPESXFGCVQSLIXGQRQYFXRGRVRMWF

160 170 180 190 200 210

250 260 270 280 290 300

orf88a.pep LNADNGILVQDLPFEVKLKKFHIDFYNTGMPRDFASDIEVTDKATGEKLERTIRVNHPLT

orf110 SX

然而，ORF88和ORF110并不匹配，因为它们代表了同一蛋白上的两个不同片段。

与淋病奈瑟球菌的预计ORF的同源性

ORF110显示与淋病奈瑟球菌的预计ORF(ORF110.ng)在重叠的211个氨基酸内有88.6％的相同性：

orf110.pep LLGIASVIGTLLQQNQPQTDYLVKFGSFWA 30

||||||||||:||||||||||||||| ||:

orf110ng MSKSRISPTLLSRPWFAFFSSMRFAVALLSLLGIASVIGTVLQQNQPQTDYLVKFGPFWT 60

orf110.pep XIFGFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 90

|| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf110ng RIFDFLGLYDVYASAWFVVIMMFLVVSTSLCLIRNVPPFWREMKSFREKVKEKSLAAMRH 120

orf110.pep SSLLDVKIAPEVAKRYLEVQGFQGKTINREDGSVLIAAKKGTMNKWGYIFAHVALIVICL 150

|||||||||||||||||||:||||||::||||||||||||||||||||| ||||||||||

orf110ng SSLLDVKIAPEVAKRYLEVRGFQGKTVSREDGSVLIAAKKGTMNKWGYIXAHVALIVICL 180

orf110.pep GGLIDSNLLLKLGMLTGRIFRTIRRFMPRIXKPESXFGCVQSLIXGQRQYFXRGRVRMWF 210

| ||: |||||||||:| |||: || |||| |||| :| ||||| |||||| ||:|||||

orf110ng GRLINXNLLLKLGMLAGSIFRNNRRVMPRISKPESIWGGVQSLIKGQRQYFQRGKVRMWF 240

orf110.pep S 211

|

orf110ng S 241

预计全长ORF110ng核苷酸序列<SEQ ID 443>编码的蛋白质具有氨基酸序列<SEQ ID 444>：

1 MSKSRISPTL LSRPWFAFFS SMRFA VALLS LLGIASVIGT VLQQNQPQTD

51 YLVKFGPFWT RIFDFLGLYD VYASAW FVVI MMFLVVSTSL CLIRNVPPFW

101 REMKSFREKV KEKSLAAMRH SSLLDVKIAP EVAKRYLEVR GFQGKTVSRE

151 DGSVLIAAKK GTMNKWGYIX A HVALIVICL GRLINXNLLL KLGMLAGSIF

201 RNNRRVMPRI SKPESIWGGV QSLIKGQRQY FQRGKVRMWF S*

根据淋球菌蛋白中存在推定的跨膜结构域的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例53

在脑膜炎奈瑟球菌中鉴定出下列DNA序列<SEQ ID 445>：

1 ATGCCGTCTG AAACACGCCT GCCGAACTTT ATCCGCGTCT TGATATTTGC

51 CCTGGGTTTC ATCTTCCTGA ACGCCTGTTC GGAACAAACC GCGCAAACCG

101 TTACCCTGCA AGGCGAAACG ATGGGCACGA CCTATACCGT CAAATACCTT

151 TCAAATAATC GGGACAAACT CCCCTCACCT GCCGAAATAC AAAAACGCAT

201 CGATGACGCG CTTAAAGAAG TCAACCGGCA GATGTCCACC TATCAGCCCG

251 ACTCCGAAAT CAGCCGGTTC AACCAACACA CAGCCGGCAA GCCCCTCCGC

301 ATTTCAAGCG ACTTCGCACA CGTTACTGCC GAAGCCGTCC GCCTGAACCG

351 CCTGACACAC GGCGCGCTGG ACGTAACCGT CGGCCCCTTG GTCAACCTTT

401 GGGGATTCGG CCCCGACAAA TCCGTTACCC GTGAACCGTC GCCGGAACAA

451 ATCAAACAGG CGGCATCTTA TACGGGCATA GACAAAATCA TTTTGAAACA

501 AGGCAAAGAT TACGCTTCCT TGAGCAAAAC CCACCCCAAG GCCTATTTGG

551 ATTTATCTTC GATTGCCAAA GGCTTCGGCG TTGATAAAGT TGCGGGCGAA

601 CTGGAAAAAT ACGGCATTCA AAATTATCTG GTCGAAATCG GCGGCGAGTT

651 GCACGGCAAA GGCAAAAACG CGCGCGGCGA ACCGTGGCGC ATCGGTATCG

701 AGCAGCCCAA TATCGTCCAA GGCGGCAATA CGCAGATTAT CGTCCCGCTG

751 AACAACCGTT CGCTTGCCAC TTCCGGCGAT TACCGTATTT TCCACGTCGA

801 TAAAAACGGC AAACGCCTCT CCCATATCAT CAACCCGAAC AACAAACGAC

851 CCATCAGCCA CAACCTCGCC TCCATCAGCG TGGTCGCAGA CAGTGCGATG

901 ACGGCGGACG GCTTGTCCAC AGGATTATTC GTATTGGGCG AAACCGAAGC

951 CTTAAAGCTG GCAGAGCGCG AAAAACTCGC TGTTTTCCTG ATTGTCAGGG

1001 ATAAAGGCGG CTACCGCACC GCCATGTCTT CCGAATTTGA AAAACTGCTC

1051 CGCTAA

它对应于氨基酸序列<SEQ ID 446；ORF111>：

1 MPSETRLPNF IRVLIFALGF IFLNACSEQT AQTVTLQGET MGTTYTVKYL

51 SNNRDKLPSP AEIQKRIDDA LKEVNRQMST YQPDSEISRF NQHTAGKPLR

101 ISSDFAHVTA EAVRLNRLTH GALDVTVGPL VNLWGFGPDK SVTREPSPEQ

151 IKQAASYTGI DKIILKQGKD YASLSKTHPK AYLDLSSIAK GFGVDKVAGE

201 LEKYGIQNYL VEIGGELHGK GKNARGEPWR IGIEQPNIVQ GGNTQIIVPL

251 NNRSLATSGD YRIFHVDKNG KRLSHIINPN NKRPISHNLA SISVVADSAM

301 TADGLSTGLF VLGETEALKL AEREKLAVFL IVRDKGGYRT AMSSEFEKLL

351 R*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF111显示与脑膜炎奈瑟球菌菌株A的ORF(ORF111a)在重叠的351个氨基酸内有96.9％的相同性：

10 20 30 40 50 60

orf111a.pep MPSETRLPNFIRTLIFALSFIFLNACSEQTAQTVTLQGETMGTTYTVKYLSNNRDXLPSP

||||||||||||:|||||:|||||||||||||||||||||||||||||||||||| ||||

orf111 MPSETRLPNFIRVLIFALGFIFLNACSEQTAQTVTLQGETMGTTYTVKYLSNNRDKLPSP

10 20 30 40 50 60

70 80 90 100 110 120

orf111a.pep AEIQXRIDDALKEVNRQMSTYQPDSEISRFNQHTAGKPLRISSDFAHVTAEAVHLNRLTH

|||| ||||||||||||||||||||||||||||||||||||||||||||||||:||||||

orf111 AEIQKRIDDALKEVNRQMSTYQPDSEISRFNQHTAGKPLRISSDFAHVTAEAVRLNRLTH

70 80 90 100 110 120

130 140 150 160 170 180

orf111a.pep GALDVTVGPLVNLWGFGPDKSVTREPSPEQIKQAASYTGIDKIILKQGKDYASLSKTHPK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf111 GALDVTVGPLVNLWGFGPDKSVTREPSPEQIKQAASYTGIDKIILKQGKDYASLSKTHPK

130 140 150 160 170 180

190 200 210 220 230 240

orf111a.pep AYLDLSSIAKGFGVDXVAGELEKYGIQNYLVEIGGELHGKXKNARGEPWRIGIEQPNIVQ

||||||||||||||| |||||||||||||||||||||||| |||||||||||||||||||

orf111 AYLDLSSIAKGFGVDKVAGELEKYGIQNYLVEIGGELHGKGKNARGEPWRIGIEQPNIVQ

190 200 210 220 230 240

250 260 270 280 290 300

orf111a.pep GGNTQIIVPLNNRSXATSGDYRIFHVDKSGKRLSHIINPNNKRPISHNLASISVXADSAM

|||||||||||||| |||||||||||||:||||||||||||||||||||||||| |||||

orf111 GGNTQIIVPLNNRSLATSGDYRIFHVDKNGKRLSHIINPNNKRPISHNLASISVVADSAM

250 260 270 280 290 300

310 320 330 340 350

orf111a.pep TADGXSTGLFVLGETEALKLAEREKLAVFLIVRDKGGYRTAMSSEFEKLLRX

|||| |||||||||||||||||||||||||||||||||||||||||||||||

orf111 TADGLSTGLFVLGETEALKLAEREKLAVFLIVRDKGGYRTAMSSEFEKLLRX

310 320 330 340 350

全长ORF111a核苷酸序列<SEQ ID 447>是：

1 ATGCCGTCTG AAACACGCCT GCCGAACTTT ATCCGCACCT TGATATTTGC

51 CCTGAGTTTT ATCTTCCTGA ACGCCTGTTC GGAACAAACC GCGCAAACCG

101 TTACCCTGCA AGGTGAAACG ATGGGCACGA CCTATACCGT CAAATACCTT

151 TCAAATAATC GGGACNAACT CCCNTCACCT GCCGAAATAC AAAANCGCAT

201 CGATGACGCG CTTAAAGAAG TCAACCGGCA GATGTCCACC TATCAGCCCG

251 ACTCCGAAAT CAGCCGGTTC AACCAACACA CAGCCGGCAA GCCCCTCCGC

301 ATTTCAAGCG ACTTCGCACA CGTTACTGCC GAAGCCGTCC ACCTGAACCG

351 CCTGACACAC GGCGCGCTGG ACGTAACCGT CGGCCCCTTG GTCAACCTTT

401 GGGGATTCGG CCCCGACAAA TCCGTTACCC GTGAACCGTC GCCGGAACAA

451 ATCAAACAAG CAGCATCTTA TACGGGCATA GACAAAATCA TTTTGAAACA

501 AGGCAAAGAT TACGCTTCCT TGAGCAAAAC CCACCCCAAG GCCTATTTGG

551 ATTTATCTTC GATTGCCAAA GGCTTCGGCG TTGATNANGT TGCGGGCGAA

601 CTGGAAAAAT ACGGCATTCA AAATTATCTG GTCGAAATCG GCGGNGAGTT

651 GCACGGCAAA GNCAAAAACG CGCGCGGCGA ACCTTGGCGC ATCGGCATCG

701 AACAGCCCAA CATCGTCCAA GGCGGCAATA CGCAGATTAT CGTCCCGCTG

751 AACAACCGTT CGNTTGCCAC TTCCGGCGAT TACCGTATTT TCCACGTCGA

801 TAAAAGCGGC AAACGCCTCT CCCATATCAT TAATCCGAAC AACAAACGAC

851 CCATCAGCCA CAACCTCGCC TCCATCAGCG TGNTCGCAGA CAGTGCGATG

901 ACGGCGGACG GCTTNTCCAC AGGATTATTC GTATTGGGCG AAACCGAAGC

951 CTTAAAGCTG GCAGAGCGCG AAAAACTCGC TGTTTTCCTG ATTGTCAGGG

1001 ATAAAGGCGG CTACCGCACC GCCATGTCTT CCGAATTTGA AAAACTGCTC

1051 CGCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 448>：

1 MPSETRLPNF IRTLIFALSF IFLNACSEQT AQTVTLQGET MGTTYTVKYL

51 SNNRDXLPSP AEIQXRIDDA LKEVNRQMST YQPDSEISRF NQHTAGKPLR

101 ISSDFAHVTA EAVHLNRLTH GALDVTVGPL VNLWGFGPDK SVTREPSPEQ

151 IKQAASYTGI DKIILKQGKD YASLSKTHPK AYLDLSSIAK GFGVDXVAGE

201 LEKYGIQNYL VEIGGELHGK XKNARGEPWR IGIEQPNIVQ GGNTQIIVPL

251 NNRSXATSGD YRIFHVDKSG KRLSHIINPN NKRPISHNLA SISVXADSAM

301 TADGXSTGLF VLGETEALKL AEREKLAVFL IVRDKGGYRT AMSSEFEKLL

351 R*

与淋病奈瑟球菌的预计ORF的同源性

ORF111显示与淋病奈瑟球菌的预计ORF(ORF111.ng)在重叠的351个氨基酸内有96.6％的相同性：

10 20 30 40 50 60

orf111ng MPSETRLPNLIRALIFALGFIFLNACSEQTAQTVTLQGETMGTTYTVKYLSNNRDKLPSP

|||||||||:||:|||||||||||||||||||||||||||||||||||||||||||||||

orf111 MPSETRLPNFIRVLIFALGFIFLNACSEQTAQTVTLQGETMGTTYTVKYLSNNRDKLPSP

10 20 30 40 50 60

70 80 90 100 110 120

orf111 AKIQKRIDDALKEVNRQMSTYQTDSEISRFNQHTAGKPLRISSDFAHVTAEAVRLNRLTH

|:|||||||||||||||||||| |||||||||||||||||||||||||||||||||||||

orf111 AEIQKRIDDALKEVNRQMSTYQPDSEISRFNQHTAGKPLRISSDFAHVTAEAVRLNRLTH

70 80 90 100 110 120

130 140 150 160 170 180

orf111ng GALDVTVGPLVNLWGFGPDKSVTREPSPEQIKQAASYTGIDKIILQQGKDYASLSKTHPK

|||||||||||||||||||||||||||||||||||||||||||||:||||||||||||||

orf111 GALDVTVGPLVNLWGFGPDKSVTREPSPEQIKQAASYTGIDKIILKQGKDYASLSKTHPK

130 140 150 160 170 180

190 200 210 220 230 240

orf111ng AYLDLSSIAKGFGVDKVAGELEKYGIQNYLVEIGGELHGKGKNAHGEPWRIGIEQPNIIQ

||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||:|

orf111 AYLDLSSIAKGFGVDKVAGELEKYGIQNYLVEIGGELHGKGKNARGEPWRIGIEQPNIVQ

190 200 210 220 230 240

250 260 270 280 290 300

orf111ng GGNTQIIVPLNNRSLATSGDYRIFHVDKNGKRLSHIINPNNKRPISHNLASISVVSDSAM

|||||||||||||||||||||||||||||||||||||||||||||||||||||||:||||

orf111 GGNTQIIVPLNNRSLATSGDYRIFHVDKNGKRLSHIINPNNKRPISHNLASISVVADSAM

250 260 270 280 290 300

310 320 330 340 350

orf111ng TADGLSTGLFVLGETEALRLAEQEKLAVFLIVRDKDGYRTAMSSEFAKLLRX

||||||||||||||||||:|||:|||||||||||| |||||||||| |||||

orf111 TADGLSTGLFVLGETEALKLAEREKLAVFLIVRDKGGYRTAMSSEFEKLLRX

310 320 330 340 350

全长ORF111ng核苷酸序列<SEQ ID 449>是：

1 ATGCCGTCTG AAACACGCCT GCCGAACCTT ATCCGCGCCT TGATATTTGC

51 CCTGGGTTTC ATCTTCCTGA ACGCCTGTTC GGaacaaacC GCGCAaaccg

101 TTACCCTGCA AGGCGAAAcg aTGGGTACGA CCTATACCGT CAAATACCTT

151 TCAAATAATC GGGACAAACT CCCCTCCCCT GCCAAAATAC AAAAGCGCAT

201 TGATGATGCG CTTAAAGAAG TCAACCGGCA GATGTCCACC TACCAGACCG

251 ATTCCGAAAT CAGCCGGTTC AACCAACACA CAGCCGGCAA GCCCCTCCGC

301 ATTTCAAGCG ATTTCGCACA CGTTACCGCC GAAGCCGTCC GCCTGAACCG

351 CCTGACTCAC GGCGCACTGG ACGTAACCGT CGGCCCTTTG GTCAACCTTT

401 GGGGGTTCGG CCCCGACAAA TCCGTTACCC GTGAACCGTC GCCGGAACAA

451 ATCAAACAGG CGGCATCTTA TACGGGCATA GACAAAATCA TTTTGCAACA

501 AGGCAAAGAT TACGCTTCCT TGAGCAAAAC CCACCCCAAA GCCTATTTGG

551 ATTTATCTTC GATTGCCAAA GGCTTCGGCG TTGATAAAGT TGCGGGCGAA

601 CTGGAAAAAT ACGGCATTCA AAATTATCTG GTCGAAAtcg gcggcGAGTT

651 GCACGGCAAA GGCAAAAATG CGCACGGCGA ACCGTGGCGC ATCGGTATAG

701 AGCAACCCAA TATCATCCAA GgcgGCAata CGCAGATTAt cgtcccgctg

751 aaCaaccgtt cgctTGCCAC TTCCGGCGAT TAccgtaTTT tccacgtcgA

801 TAAAAAcggc aaacgccttt cccacaTCAT CAATCCCaAC aacAAACgac

851 ccATCAGcca caacctcgcc tccatcagcg tggtctcAGA CAGTGCAATG

901 ACGGCGGACG GTTtatCCAC AGGATTATTT GTTTTAGGCG AAACCGAAGC

951 CTTAAGGCTG GCAGAACAAG AAAAACTCGC TGTTTTCCTA ATTGTCCGGG

1001 ATAAGGACGG CTACCGCACC GCCATGTCTT CCGAATTTGC CAAGCTGCTC

1051 CGCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 450>：

1 MPSETRLPNL IRALIFALGF IFLNACSEQT AQTVTLQGET MGTTYTVKYL

51 SNNRDKLPSP AKIQKRIDDA LKEVNRQMST YQTDSEISRF NQHTAGKPLR

101 ISSDFAHVTA EAVRLNRLTH GALDVTVGPL VNLWGFGPDK SVTREPSPEQ

151 IKQAASYTGI DKIILQQGKD YASLSKTHPK AYLDLSSIAK GFGVDKVAGE

201 LEKYGIQNYL VEIGGELHGK GKNAHGEPWR IGIEQPNIIQ GGNTQIIVPL

251 NNRSLATSGD YRIFHVDKNG KRLSHIINPN NKRPISHNLA SISVVSDSAM

301 TADGLSTGLF VLGETEALRL AEQEKLAVFL IVRDKDGYRT AMSSEFAKLL

351 R*

该蛋白显示出与一种假设的流感嗜血菌的脂蛋白前体同源：

sp|P44550|YOJL_HAEIN假设的脂蛋白HI0172前体>gi|1074292|pir|4假设蛋白HI0172-流感嗜血菌(Rd KW20菌株)>gi|1573128(U32702)假设的[流感嗜血菌]长度＝346

评分＝353位(896)，估计值＝9e-97

相同性＝181/344(52％)，阳性＝247/344(71％)，空隙＝4/344(1％)

询问：7 LPNLIRALIFALGFIFLNACSEQTAQTVTLQGETMGTTYTVKYLSNNRDKLPSPAKIQKR 66

+ LI +I + L AC ++T + ++L G+TMGTTY VKYL + S K +

目标：1 MKKLISGIIAVAMALSLAACQKET-KVISLSGKTMGTTYHVKYLDDGSITATSE-KTHEE 58

询问：67 IDDALKEVNRQMSTYQTDSEISRFNQHT-AGKPLRISSDFAHVTAEAVRLNRLTHGALDV 125

I+ LK+VN +MSTY+ DSE+SRFNQ+T P+ IS+DFA V AEA+RLN++T GALDV

目标：59 IEAILKDVNAKMSTYKKDSELSRFNQNTQVNTPIEISADFAKVLAEAIRLNKVTEGALDV 118

询问：126 TVGPLVNLWGFGPDKSVTREPSPEQIKQAASYTGIDKIILQQGKDYASLSKTHPKAYLDL 185

TVGP+VNLWGFGP+K ++P+PEQ+ + ++ GIDKI L K+ A+LSK P+ Y+DL

目标：119 TVGPVVNLWGFGPEKRPEKQPTPEQLAERQAWVGIDKITLDTNKEKATLSKALPQVYVDL 178

询问：186 SSIAKGFGVDKVAGELEKYGIQNYLVEIGGELHGKGKNAHGEPWRIGIEQPNIIQGGNTQ 245

SSIAKGFGVD+VA +LE+ QNY+VEIGGE+ KGKN G+PW+I IE+P +

目标：179 SSIAKGFGVDQVAEKLEQLNAQNYMVEIGGEIRAKGKNIEGKPWQIAIEKPTTTGERAVE 238

询问：246 IIVPLNNRSLATSGDYRIFHVDKNGKRLSHIINPNNKRPISHNLASISVVSDSAMTADGL 305

++ LNN +A+SGDYRI+ ++NGKR +H I+P PI H+LASI+V++ ++MTADGL

目标：239 AVIGLNNMGMASSGDYRIY-FEENGKRFAHEIDPKTGYPIQHHLASITVLAPTSMTADGL 297

询问：306 STGLFVLGETEALRLAEQEKLAVFLIVRDKDGYRTAMSSEFAKL 349

STGLFVLGE +AL +AE+ LAV+LI+R +G+ T SS F KL

目标：298 STGLFVLGEDKALEVAEKNNLAVYLIIRTDNGFVTKSSSAFKKL 341

根据该分析结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例54

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 451>：

1 ..CCGTGCCGCC GACAGGGCGA CGACGTGTAT GCGGCGCACG CGTCCCGTCA

51 AAAATTGTGG CTGCGCTTCA TCGGCGGCCG GTCGCATCAA AATATACGGG

101 GCGGCGCGGC TGCGGACGGG TGGCGCAAAG GCGTGCAAAT CGGCGGCGAG

151 GTGTTTGTAC GGCAAAATGA AGGCAGCCkA yTGGCAATCG GCGTGATGGG

201 CGGCAGGGCC GGCCAGCACG CwTCAGTCAA CGGCAAAGGC GGTGCGGCAG

251 gCAGTGATTT GTATGGTTAT GgCGGGGgTG TTTATGCTgC GTGGCATCAG

301 TTGCGCGATA AACAAACGGG TgCGTATTTG GACGGCTGGT TGCAATACCA

351 ACGTTTCAAA CACCGCATCA ATGATGAAAA CCGTGCGGAA CgCTACAAAA

401 CCAAAGGTTG GACGGCTTCT GTCGAAGGCG GCTACAACGC GCTTGTGGCG

451 GAAGGCATTG TCGGAAAAGG CAATAATGTG CGGTTTTACC TACAACCGCA

501 GgCGCAGTTT ACCTACTTGG GCGTAAACGG CGGCTTTACC GACAGCGAGG

551 GGACGGCGGT CGGACTGCTC GGCAGCGGTC AGTGGCAAAG CCGCGCCGGC

601 AtTCGGGCAA AAACCCGTTT TGCTTTGCGT AACGGTGTCA ATCTTCAGCC

651 TTTTGCCGCT TTTAATGTtt TGCACAGGTC AAAATCTTTC GGCGTGGAAA

701 TGGACGGCGA AAAACAGACG CTGGCAGGCA GGACGGCACT CGAAGGGCGG

751 TTCGGTATTG AAGCCGGTTG GAAAGGCCAT ATGTCCGCA..

它对应于氨基酸序列<SEQ ID 452；ORF35>：

1 ..PCRRQGDDVY AAHASRQKLW LRFIGGRSHQ NIRGGAAADG WRKGVQIGGE

51 VFVRQNEGSX LAIGVMGGRA GQHASVNGKG GAAGSDLYGY GGGVYAAWHQ

101 LRDKQTGAYL DGWLQYQRFK HRINDENRAE RYKTKGWTAS VEGGYNALVA

151 EGIVGKGNNV RFYLQPQAQF TYLGVNGGFT DSEGTAVGLL GSGQWQSRAG

201 IRAKTRFALR NGVNLQPFAA FNVLHRSKSF GVEMDGEKQT LAGRTALEGR

251 FGIEAGWKGH MSA..

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌的推定分泌性VirG-同系物(登录号A32247)的同源性

ORF和virg-h蛋白显示在261个氨基酸的重叠区内有51％的氨基酸相同性：

Orf35 5 QGDDVYAAHASRQKLWLRFIGGRSHQNIRGGAA-ADGWRKGVQIGGEVFVRQNEGSXLAI 63

+ D++ R+ LWLR I G S+Q ++G A +G+RKGVQ+GGEVF QNE + L+I

virg-h 396 KNSDIFDRTLPRKGLWLRVIDGHSNQWVQGKTAPVEGYRKGVQLGGEVFTWQNESNQLSI 455

Orf35 64 GVMGGRAGQHASVNGKG--GAAGSDLYGYGGGVYAAWHQLRDKQTGAYLDGWLQYQRFKH 121

G+MGG+A Q ++ + ++ G+G GVYA WHQL+DKQTGAY D W+QYQRF+H

virg-h 456 GLMGGQAEQRSTFHNPDTDNLTTGNVKGFGAGVYATWHQLQDKQTGAYADSWMQYQRFRH 515

Orf35 122 RINDENRAERYKTKGWTASVEGGYNALVAEGIVGKGNNVRFYLQPQAQFTYLGVNGGFTD 181

RIN E+ ER+ +KG TAS+E GYNAL+AE KGN++R YLQPQAQ TYLGVNG F+D

virg-h 516 RINTEDGTERFTSKGITASIEAGYNALLAEHFTKKGNSLRVYLQPQAQLTYLGVNGKFSD 575

Orf35 182 SEGTAVGLLGSGQWQSRAGIRAKTRFALRNGVNLQPFAAFNVLHRSKSFGVEMDGEKQTL 241

SE V LLGS Q Q+R G++AK +F+L + ++PFAA N L+ +K FGVEMDGE++ +

virg-h 576 SENAHVNLLGSRQLQTRVGVQAKAQFSLYKNIAIEPFAAVNALYHNKPFGVEMDGERRVI 635

Orf35 242 AGRTALEGRFGIEAGWKGHMS 262

+TA+E + G+ K H++

virg-h 636 NNKTAIESQLGVAVKIKSHLT 656

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF35显示与脑膜炎奈瑟球菌菌株A的ORF(ORF35a)在重叠的259个氨基酸内有96.9％的相同性：

10 20 30

orf35.pep PCRRQGDDVYAAHASRQKLWLRFIGGRSHQNIRG

:||||||| ||||||||||||||||||||

orf35a QRLAIPEAEAVLYAQQAYAANTLFGLRAADRGDDVYAADPSRQKLWLRFIGGRSHQNIRG

310 320 330 340 350 360

40 50 60 70 80 90

orf35.pep GAAADGWRKGVQIGGEVFVRQNEGSXLAIGVMGGRAGQHASVNGKGGAAGSDLYGYGGGV

|||||| |||||||||||||||||| ||||||||||||||||||||||||| |:||||||

orf35a GAAADGRRKGVQIGGEVFVRQNEGSRLAIGVMGGRAGQHASVNGKGGAAGSYLHGYGGGV

370 380 390 400 410 420

100 110 120 130 140 150

orf35.pep YAAWHQLRDKQTGAYLDGWLQYQRFKHRINDENRAERYKTKGWTASVEGGYNALVAEGIV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf35a YAAWHQLRDKQTGAYLDGWLQYQRFKHRINDENRAERYKTKGWTASVEGGYNALVAEGVV

430 440 450 460 470 480

160 170 180 190 200 210

orf35.pep GKGNNVRFYLQPQAQFTYLGVNGGFTDSEGTAVGLLGSGQWQSRAGIRAKTRFALRNGVN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf35a GKGNNVRFYLQPQAQFTYLGVNGGFTDSEGTAVGLLGSGQWQSRAGIRAKTRFALRNGVN

490 500 510 520 530 540

220 230 240 250 260

orf35.pep LQPFAAFNVLHRSKSFGVEMDGEKQTLAGRTALEGRFGIEAGWKGHMSA

|||||||||||||||||||||||||||||||||||||||||||||||||

orf35a LQPFAAFNVLHRSKSFGVEMDGEKQTLAGRTALEGRFGIEAGWKGHMSARIGYGKRTDGD

550 560 570 580 590 600

orf35a KEAALSLKWLFX

610 620

全长ORF35a核苷酸序列<SEQ ID 453>是：

1 ATGTTCAGAG CTCAGCTTGG TTCAAATACT CGTTCTACCA AAATCGGCGA

51 CGATGCCGAT TTTTCATTTT CAGACAAGCC GAAACCCGGC ACTTCCCATT

101 ATTTTTCCAG CGGTAAAACC GATCAAAATT CATCCGAATA TGGGTATGAC

151 GAAATCAATA TCCAAGGTAA AAACTACAAT AGCGGCATAC TCGCCGTCGA

201 TAATATGCCC GTTGTTAAGA AATATATTAC AGATACTTAC GGGGATAATT

251 TAAAGGATGC GGTTAAGAAG CAATTACAGG ATTTATACAA AACAAGACCC

301 GAAGCTTGGG AAGAAAATAA AAAACGGACT GAGGAGGCGT ATATAGAACA

351 GCTTGGACCA AAATTTAGTA TACTCAAACA GAAAAACCCC GATTTAATTA

401 ATAAATTGGT AGAAGATTCC GTACTCACTC CTCATAGTAA TACATCACAG

451 ACTAGTCTCA ACAACATCTT CAATAAAAAA TTACACGTCA AAATCGAAAA

501 CAAATCCCAC GTCGCCGGAC AGGTGTTGGA ACTGACCAAG ATGACGCTGA

551 AAGATTCCCT TTGGGAACCG CGCCGCCATT CCGACATCCA TATGCTGGAA

601 ACTTCCGATA ATGCCCGCAT CCGCCTGAAC ACGAAAGATG AAAAACTGAC

651 CGTCCATAAA GCGTATCAGG GCGGTGCGGA TTTCCTGTTC GGCTACGACG

701 TGCGGGAGTC GGACAAACCC GCCCTGACCT TTGAAGAAAA AGTCAGCGGA

751 CAATCCGGCG TGGTTTTGGA ACGCCGGCCG GAAAATCTGA AAACGCTCGA

801 CGGGCGCAAA CTGATTGCGG CGGAAAAGGC AGACTCTAAT TCGTTTGCGT

851 TTAAACAAAA TTACCGGCAG GGACTGTACG AATTATTGCT CAAGCAATGC

901 GAAGGCGGAT TTTGCTTGGG CGTGCAGCGT TTGGCTATCC CCGAGGCGGA

951 AGCGGTTTTA TATGCCCAAC AGGCTTATGC GGCAAATACT TTGTTCGGGC

1001 TGCGTGCCGC CGACAGGGGC GACGACGTGT ATGCCGCCGA TCCGTCCCGT

1051 CAAAAATTGT GGCTGCGCTT CATCGGCGGC CGGTCGCATC AAAATATACG

1101 GGGCGGCGCG GCTGCGGACG GGCGGCGCAA AGGCGTGCAA ATCGGCGGCG

1151 AGGTGTTTGT ACGGCAAAAT GAAGGCAGCC GGCTGGCAAT CGGCGTGATG

1201 GGCGGCAGGG CTGGCCAGCA CGCATCAGTC AACGGCAAAG GCGGTGCGGC

1251 AGGCAGTTAT TTGCATGGTT ATGGCGGGGG TGTTTATGCT GCGTGGCATC

1301 AGTTGCGCGA TAAACAAACG GGTGCGTATT TGGACGGCTG GTTGCAATAC

1351 CAACGTTTCA AACACCGCAT CAATGATGAA AACCGTGCGG AACGCTACAA

1401 AACCAAAGGT TGGACGGCTT CTGTCGAAGG CGGCTACAAC GCGCTTGTGG

1451 CGGAAGGCGT TGTCGGAAAA GGCAATAATG TGCGGTTTTA CCTGCAACCG

1501 CAGGCGCAGT TTACCTACTT GGGCGTAAAC GGCGGCTTTA CCGACAGCGA

1551 GGGGACGGCG GTCGGACTGC TCGGCAGCGG TCAGTGGCAA AGCCGCGCCG

1601 GCATTCGGGC AAAAACCCGT TTTGCTTTGC GTAACGGTGT CAATCTTCAG

1651 CCTTTTGCCG CTTTTAATGT TTTGCACAGG TCAAAATCTT TCGGCGTGGA

1701 AATGGACGGC GAAAAACAGA CGCTGGCAGG CAGGACGGCG CTCGAAGGGC

1751 GGTTCGGCAT TGAAGCCGGT TGGAAAGGCC ATATGTCCGC ACGCATCGGA

1801 TACGGCAAAA GGACGGACGG CGACAAAGAA GCCGCATTGT CGCTCAAATG

1851 GCTGTTTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 454>：

1 MFRAQLGSNT RSTKIGDDAD FSFSDKPKPG TSHYFSSGKT DQNSSEYGYD

51 EINIQGKNYN SGILAVDNMP VVKKYITDTY GDNLKDAVKK QLQDLYKTRP

101 EAWEENKKRT EEAYIEQLGP KFSILKQKNP DLINKLVEDS VLTPHSNTSQ

151 TSLNNIFNKK LHVKIENKSH VAGQVLELTK MTLKDSLWEP RRHSDIHMLE

201 TSDNARIRLN TKDEKLTVHK AYQGGADFLF GYDVRESDKP ALTFEEKVSG

251 QSGVVLERRP ENLKTLDGRK LIAAEKADSN SFAFKQNYRQ GLYELLLKQC

301 EGGFCLGVQR LAIPEAEAVL YAQQAYAANT LFGLRAADRG DDVYAADPSR

351 QKLWLRFIGG RSHQNIRGGA AADGRRKGVQ IGGEVFVRQN EGSRLAIGVM

401 GGRAGQHASV NGKGGAAGSY LHGYGGGVYA AWHQLRDKQT GAYLDGWLQY

451 QRFKHRINDE NRAERYKTKG WTASVEGGYN ALVAEGVVGK GNNVRFYLQP

501 QAQFTYLGVN GGFTDSEGTA VGLLGSGQWQ SRAGIRAKTR FALRNGVNLQ

551 PFAAFNVLHR SKSFGVEMDG EKQTLAGRTA LEGRFGIEAG WKGHMSARIG

601 YGKRTDGDKE AALSLKWLF*

与淋病奈瑟球菌的预计ORF的同源性

ORF35显示与淋病奈瑟球菌的预计ORF(ORF35ngh)在重叠的261个氨基酸内有51.7％的相同性：

orf35.pep PCRRQGDDVYAAHASRQKLWLRFIGGRSHQNIRG 34

:::|:: |: |||| | |:|:| ::|

orf35ngh FTKVQERDDIAIYAQQAQAANTLFALRLNDKNSDIFDRTLPRKGLWLRVIDGHSNQWVQG 370

orf35.pep GAA-ADGWRKGVQIGGEVFVRQNEGSXLAIGVMGGRAGQHASVNGKG--GAAGSDLYGYG 91

:| ::|:|||||:|||||: |||:: |:||:|||:| |::: : : : ::: |:|

orf35ngh KTAPVEGYRKGVQLGGEVFTWQNESNQLSIGLMGGQAEQRSTFRNPDTDNLTTGNVKGFG 430

orf35.pep GGVYAAWHQLRDKQTGAYLDGWLQYQRFKHRINDENRAERYKTKGWTASVEGGYNALVAE 151

:||||:||||:|||||||:|:|:|||||:|||| | :||: :|| |||:|:|||||:||

orf35ngh AGVYATWHQLQDKQTGAYVDSWMQYQRFRHRINTEYATERFTSKGITASIEAGYNALLAE 490

orf35.pep GIVGKGNNVRFYLQPQAQFTYLGVNGGFTDSEGTAVGLLGSGQWQSRAGIRAKTRFALRN 211

:: |||::| |||||||:||||||| |:|||:: |:|||| | |||:|::||::||: |

orf35ngh HFTKKGNSLRVYLQPQAQLTYLGVNGKFSDSENAQVNLLGSRQLQSRVGVQAKAQFAFTN 550

orf35.pep GVNLQPFAAFNVLHRSKSFGVEMDGEKQTLAGRTALEGRFGIEAGWKGHMSA 263

||::|||:| | ::::| ||||:||::::: ::|::| ::|: | |:|::

orf35ngh GVTFQPFVAVNSIYQQKPFGVEIDGDRRVINNKTVIETQLGVAAKIKSHLTLQASFNRQT 610

预计部分ORF35ngh核苷酸序列<SEQ ID 455>编码的蛋白质具有部分氨基酸序列<SEQ ID 456>：

1 ..KKLRDRNSEY WKEETYHIKS NGRTYPNIPA LFPKHPFDPF ENINNSKKIS

51 FYDKEYTEDY LVGFARGFGV EKRNGEEEKP LRQYFKDCVN TENSNNDNCK

101 ISSFGNYGPI LIKSDIFALA SQIKNSHINS EILSVGNYIE WLRPTLNKLT

151 GWQEHLYAGL DPFHYIEVTD NSHVIGQTID LGALELTNSL WKPRWNSNID

201 YLITKNAEIR FNTKNESLLV KEDYAGGARF RFAYDLKDKV PEIPVLTFEK

251 NITGTSDIIF EGKALDNLKH LDGHQIVKVN DTADKDAFRL SSKYRKGIYT

301 LSLQQRPEGF FTKVQERDDI AIYAQQAQAA NTLFALRLND KNSDIFDRTL

351 PRKGLWLRVI DGHSNQWVQG KTAPVEGYRK GVQLGGEVFT WQNESNQLSI

401 GLMGGQAEQR STFRNPDTDN LTTGNVKGFG AGVYATWHQL QDKQTGAYVD

451 SWMQYQRFRH RINTEYATER FTSKGITASI EAGYNALLAE HFTKKGNSLR

501 VYLQPQAQLT YLGVNGKFSD SENAQVNLLG SRQLQSRVGV QAKAQFAFTN

551 GVTFQPFVAV NSIYQQKPFG VEIDGDRRVI NNKTVIETQL GVAAKIKSHL

601 TLQASFNRQT SKHHHAKQGA LNLQWTF*

根据该预测，脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例55

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 457>：

1 ..GCGGAATATG TTCAGTTCTC TATAGATTTG TTCAGTGTGG GTAAATCGGG

51 GGGCGGTATA CCTAAGGCTA AGCCTGTGTT TGATGCGAAA CCGAGATGGG

101 AGGTTGATAG GAAGCTTAAT AAATTGACAA CTCGTGAGCA GGTGGAGAAA

151 AATGTTCAGG AAACGAGAAG AAGGAGTCAG AGTAGTCAGT TTAAAGCCCA

201 TGCGCAACGA GAATGGGAAA ATAAAACAGG GTTAGATTTT AATCATTTTA

251 TAGGTGGTGA TATCAATAAA AAAGGCACAG TAACAGGAGG GCATAGTCTA

301 ACCCGTGGTG ATGTACGGGT GATACAACAA ACCTCGGCAC CTGATAAACA

351 TGGGGT.TTA TCAAGCGACA GTGGAAATTN A

它对应于氨基酸序列<SEQ ID 458；ORF46>：

1 ..AEYVQFSIDL FSVGKSGGGI PKAKPVFDAK PRWEVDRKLN KLTTREQVEK

51 NVQETRRRSQ SSQFKAHAQR EWENKTGLDF NHFIGGDINK KGTVTGGHSL

101 TRGDVRVIQQ TSAPDKHGXL SSDSGNX

进一步的工作进一步揭示了部分核苷酸序列<SEQ ID 459>：

1 ..GCAGTGTGCC TnCCGATGCA TGCACACGCC TCAnATTTGG CAAACGATTC

51 TTTTATCCGG CAGGTTCTCG ACCGTCAGCA TTTCGAACCC GACGGGAAAT

101 ACCACCTATT CGGCAGCAGG GGGGAACTTG CCGAGCGCCA GTCTCATATC

151 GGATTGGGAA AAATACAAAG CCATCAGTTG GGCAACCTGA TGATTCAACA

201 GGCGGCCATT AAAGGAAATA TCGGCTACAT TGTCCGCTTT TCCGATCACG

251 GGCACGAAGT CCATTCCCCs TTCGACAACC ATGCCTCACA TTCCGATTCT

301 GATGAAGCCG GTAGTCCCGT TGACGGATTT AGCCTTTACC GCATCCATTG

351 GGACGGATAC GAACACCATC CCGCCGACGG CTATGACGGG CCACAGGGCG

401 GCGGCTATCC CGCTCCCAAA GGCGCGAGGG ATATATACAG TTACGACATA

451 AAAGGCGTTG CCCAAAATAT CCGCCTCAAC CTGACCGACA ACCGCAGCAC

501 CGGACAACGG CTTGCCGACC GTTTCCACAA TGCCGGTAGT ATGCTGACGC

551 AAGGAGTAGG CGACGGATTC AAACGCGCCA CCCGATACAG CCCCGAGCTG

601 GACAGATCGG GCAATGCCGC CGAAGCCTTC AACGGCACTG CAGATATCGT

651 TAAAAACATC ATCGGCGCTG CAGGAGAAAT TGT

它对应于氨基酸序列<SEQ ID 460；ORF46-1>：

1 .. AVCLPMHAHA SXLANDSFIR QVLDRQHFEP DGKYHLFGSR GELAERQSHI

51 GLGKIQSHQL GNLMIQQAAI KGNIGYIVRF SDHGHEVHSP FDNHASHSDS

101 DEAGSPVDGF SLYRIHWDGY EHHPADGYDG PQGGGYPAPK GARDIYSYDI

151 KGVAQNIRLN LTDNRSTGQR LADRFHNAGS MLTQGVGDGF KRATRYSPEL

201 DRSGNAAEAF NGTADIVKNI IGAAGEI

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的预计ORF的同源性

ORF46显示与淋病奈瑟球菌的预计ORF(ORF64ng)在重叠的111个氨基酸内有98.2％的相同性：

orf46.pep AEYVQFSIDLFSVGKSGGGIPKAKPVFDAKPRWEVDRKLNKLTTR 45

||||||||||||||||||||||||||||||

orf46ng PKTGVPFDGKGFPNFEKHVKYDTKLDIQELSGGGIPKAKPVFDAKPRWEVDRKLNKLTTR 217

orf46.pep EQVEKNVQETRRRSQSSQFKAHAQREWENKTGLDFNHFIGGDINKKGTVTGGHSLTRGDV 105

|||||||||||||||||||||||||||||||||||||||||||||||:||||||||||||

orf46ng EQVEKNVQETRRRSQSSQFKAHAQREWENKTGLDFNHFIGGDINKKGAVTGGHSLTRGDV 277

orf46.pep RVIQQTSAPDKHGXLSSDSGN 126

||||||||||||| |||||||

orf46ng RVIQQTSAPDKHGVLSSDSGN 298

预计部分ORF46ng核苷酸序列<SEQ ID 461>编码的蛋白质具有部分氨基酸序列<SEQ ID 462>：

1 ..RRLKHCCHAR LGSAFHRKQD GAHQRFGRYG ATQRLCRSSH PRLGSPKPQC

51 RTRHRSRQQY LYGSHPHQRD WSCPGKIQLG RHHGTSCRAV ADXRDRICER

101 EIRRQRQXCR CRLGKIPSLS IPKYPLKLEQ RYGKENITSS TVPPSNGKNV

151 KLADQRHPKT GVPFDGKGFP NFEKHVKYDT KLDIQELSGG GIPKAKPVFD

201 AKPRWEVDRK LNKLTTREQV EKNVQETRRR SQSSQFKAHA QREWENKTGL

251 DFNHFIGGDI NKKGAVTGGH SLT RGDVRVI QQTSAPDKHG VLSSDSGN*

进一步的工作揭示了该完整的淋球菌DNA序列<SEQ ID 463>：

1 TTGGGCATTT CCCGCAAAAT ATCCCTTATT CTGTCCATAC TGGCAGTGTG

51 CCTGCCGATG CATGCACACG CCTCAGATTT GGcaAACGAT CCCTTTATCC

101 GgCaggttcT CGaccGTCAG CATTTCGaac ccgacggGAa ATACCaCCTA

151 TTcggCaGCA GGGGGGAGCT TgccnagcGC aacggccATa tcggattggG

201 aaacaTAcaa Agccatcagt tGggccacct gatgattcaa caggcggccg

251 ttgaaggaaA TAtcgGctac attgtccgct tttccgatca cgggcacaaa

301 ttccattcgc ccttcGAcaa ccaTGCCTCA CATTCCGATT CTGACGAAGC

351 CGGTAGTCCC GTTGACGGAT TCAGCCTTTA CCGCATCCAT TGGGACGGAT

401 ACGAACACCA TCCCGCCGAC GGCTATGACG GGCCACAGGG CGGCGGCTAT

451 CCCGCTCCCA AAGGCGCGAG GGATATATAC AGCTACGACA TAAAAGGCGT

501 TGCCCAAAAT ATCCGCCTCA ACCTGACCGA CAACCGCAGC ACCGGACAAC

551 GGCTTGCCGA CCGTTTCCAC AATGCCGGCG CTATGCTGAC GCAAGGAGTA

601 GGCGACGGAT TCAAACGCGC CACCCGATAC AGCCCCGAGC TGGACAGATC

651 GGGCAATGCc gccGAAGCCT TCAACGGCAC TGCAGATATC GTCAAAAACA

701 TCATCGGCGC GGCAGGAGAA ATTGTCGGCG CAGGCGATGC CGTGCagGGT

751 ATAAGCGAAG GCTCAAACAT TGCTGTCATG CACGGCTTGG GTCTGCTTTC

801 CACCGAAAAC AAGATGGCGC GCATCAACGA TTTGGCAGAT ATGGCGCAAC

851 TCAAAGACTA TGCCGCAGCA GCCATCCGCG ATTGGGCAGT CCAAAACCCC

901 AATGCCGCAC AAGGCATAGA AGCCGTCAGC AATATCTTTA TGGCAGCCAT

951 CCCCATCAAA GGGATTGGAG CTGTCCGGGG AAAATACGGC TTGGGCGGCA

1001 TCACGGCACA TCCTGTCAAG CGGTCGCAGA TGGGCGCGAT CGCATTGCCG

1051 AAAGGGAAAT CCGCCGTCAG CGACAATTTT GCCGATGCGG CATACGCCAA

1101 ATACCCGTCC CCTTACCATT CCCGAAATAT CCGTTCAAAC TTGGAGCAGC

1151 GTTACGGCAA AGAAAACATC ACCTCCTCAA CCGTGCCGCC GTCAAACGGC

1201 AAAAATGTCA AACTGGCAGA CCAACGCCAC CCGAAGACAG GCGTACCGTT

1251 TGACGGTAAA GGGTTTCCGA ATTTTGAGAA GCACGTGAAA TATGATACGA

1301 AGCTCGATAT TCAAGAATTA TCGGGGGGCG GTATACCTAA GGCTAAGCCT

1351 GTGTTTGATG CGAAACCGAG ATGGGAGGTT GATAGGAAGC TTAATAAATT

1401 GACAACTCGT GAGCAGGTGG AGAAAAATGT TCAGGAAACG AGAAGAAGGA

1451 GTCAGAGTAG TCAGTTTAAA GCCCATGCGC AACGAGAATG GGAAAATAAA

1501 ACAGGGTTAG ATTTTAATCA TTTTATAGGT GGTGATATCA ATAAGAAAGG

1551 CACAGTAACA GGAGGGCATA GTCTAACCCG TGGTGATGTA CGGGTGATAC

1601 AACAAACCTC GGCACCTGAT AAACATGGGG TTTATCAAGC GACAGTGGAA

1651 ATTAAAAAGC CTGATGGAAG TTGGGAGGTG AAAACGAAAA AAGGTGGGAA

1701 AGTGATGACC AAGCACACCA TGTTCCCAAA AGATTGGGAT GAGGCTAGAA

1751 TTAGGGCTGA AGTTACTTCG GCTTGGGAAA GTAGAATAAT GCTTAAGGAT

1801 AATAAATGGC AGGGTACAAG TAAATCGGGT ATTAAAATAG AAGGATTTAC

1851 CGAACCTAAT AGAACAGCAT ATCCCATTTA TGAATAG

它对应于氨基酸序列<SEQ ID 464；ORF46ng-1>：

1 LGISRKISLI LSILAVCLPM HAHASDLAND PFIRQVLDRQ HFEPDGKYHL

51 FGSRGELAXR NGHIGLGNIQ SHQLGHLMIQ QAAVEGNIGY IVRFSDHGHK

101 FHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD GYDGPQGGGY

151 PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLADRFH NAGAMLTQGV

201 GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNIIGAAGE IVGAGDAVQG

251 ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA AIRDWAVQNP

301 NAAQGIEAVS NIFMAAIPIK GIGAVRGKYG LGGITAHPVK RSQMGAIALP

351 KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI TSSTVPPSNG

401 KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTKLDIQEL SGGGIPKAKP

451 VFDAKPRWEV DRKLNKLTTR EQVEKNVQET RRRSQSSQFK AHAQREWENK

501 TGLDFNHFIG GDINKKGTVT GGHSLTRGDV RVIQQTSAPD KHGVYQATVE

551 IKKPDGSWEV KTKKGGKVMT KHTMFPKDWD EARIRAEVTS AWESRIMLKD

601 NKWQGTSKSG IKIEGFTEPN RTAYPIYE*

ORF46ng-1和ORF46-1显示在227个氨基酸的重叠区内有94.7％的相同性：

10 20 30 40

orf46-1.pep AVCLPMHAHASXLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAER

||||||||||| |||| ||||||||||||||||||||||||||| |

orf46ng-1 LGISRKISLILSILAVCLPMHAHASDLANDPFIRQVLDRQHFEPDGKYHLFGSRGELAXR

10 20 30 40 50 60

50 60 70 80 90 100

orf46-1.pep QSHIGLGKIQSHQLGNLMIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSP

::|||||:|||||||:|||||||::||||||||||||||: |||||||||||||||||||

orf46ng-1 NGHIGLGNIQSHQLGHLMIQQAAVEGNIGYIVRFSDHGHKFHSPFDNHASHSDSDEAGSP

70 80 90 100 110 120

110 120 130 140 150 160

orf46-1.pep VDGFSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf46ng-1 VDGFSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRS

130 140 150 160 170 180

170 180 190 200 210 220

orf46-1.pep TGQRLADRFHNAGSMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGE

|||||||||||||:||||||||||||||||||||||||||||||||||||||||||||||

orf46ng-1 TGQRLADRFHNAGAMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGE

190 200 210 220 230 240

orf46-1.pep I

|

orf46ng-1 IVGAGDAVQGISEGSNIAVMHGLGLLSTENKMARINDLADMAQLKDYAAAAIRDWAVQNP

250 260 270 280 290 300

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF46ng-1显示与脑膜炎奈瑟球菌菌株A的ORF(ORF46a)在重叠的486个氨基酸内有87.4％的相同性：

10 20 30 40 50 60

orf46a.pep LGISRKISLILSILAVCLPMHAHASDLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAER

|||||||||||||||||||||||||||||| ||||||||||||||||||||||||||| |

orf46ng-1 LGISRKISLILSILAVCLPMHAHASDLANDPFIRQVLDRQHFEPDGKYHLFGSRGELAXR

10 20 30 40 50 60

70 80 90 100 110 120

orf46a.pep SGHIGLGNIQSHQLGNLFIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSP

:||||||||||||||:|:|||||::||||||||||||||: |||||||||||||||||||

orf46ng-1 NGHIGLGNIQSHQLGHLMIQQAAVEGNIGYIVRFSDHGHKFHSPFDNHASHSDSDEAGSP

70 80 90 100 110 120

130 140 150 160 170 180

orf46a.pep VDGFSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf46ng-1 VDGFSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRS

130 140 150 160 170 180

190 200 210 220 230 240

orf46a.pep TGQRLVDRFHNTGSMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGE

|||||:|||||:|:||||||||||||||||||||||||||||||||||||||||||||||

orf46ng-1 TGQRLADRFHNAGAMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGE

190 200 210 220 230 240

250 260 270 280 290 300

orf46a.pep IVGAGDAVQGISEGSNIAVMHGLGLLSTENKMARINDLADMAQLKDYAAAAIRDWAVQNP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf46ng-1 IVGAGDAVQGISEGSNIAVMHGLGLLSTENKMARINDLADMAQLKDYAAAAIRDWAVQNP

250 260 270 280 290 300

310 320 330 340 350 360

orf46a.pep NAAQGIEAVSNIFTAVIPVKGIGAVRGKYGLGGITAHPVKRSQMGEIALPKGKSAVSDNF

||||||||||||| |:||:|||||||||||||||||||||||||| ||||||||||||||

orf46ng-1 NAAQGIEAVSNIFMAAIPIKGIGAVRGKYGLGGITAHPVKRSQMGAIALPKGKSAVSDNF

310 320 330 340 350 360

370 380 390 400 410 420

orf46a.pep ADAAYAKYPSPYHSRNIRSNLEQRYGKENITSSTVPPSNGKNVKLANKRHPKTKVPFDGK

||||||||||||||||||||||||||||||||||||||||||||||::||||| ||||||

orf46ng-1 ADAAYAKYPSPYHSRNIRSNLEQRYGKENITSSTVPPSNGKNVKLADQRHPKTGVPFDGK

370 380 390 400 410 420

430 440 450 460 470

orf46a.pep GFPNFEKDVKYDTRINTAVPQVN----PIDEPVFN--PKGSVGSAHSWSITARIQYAKLP

||||||| |||||::: : ::: | :|||: |: | : ::|:| | |

orf46ng-1 GFPNFEKHVKYDTKLD--IQELSGGGIPKAKPVFDAKPRWEVDRKLN-KLTTREQVEKNV

430 440 450 460 470

480 490 500 510 520 530

orf46a.pep RQGRIRYIPPKNYSPSAPLPKGPNNGYLDKFGNEWTKGPSRTKGQEFEWDVQLSKTGREQ

:: | |

orf46ng-1 QETRRRSQSSQFKAHAQREWENKTGLDFNHFIGGDINKKGTVTGGHSLTRGDVRVIQQTS

480 490 500 510 520 530

全长ORF46aDNA序列<SEQ ID 465>是：

1 TTGGGCATTT CCCGCAAAAT ATCCCTTATT CTGTCCATAC TGGCAGTGTG

51 CCTGCCGATG CATGCACACG CCTCAGATTT GGCAAACGAT TCTTTTATCC

101 GGCAGGTTCT CGACCGTCAG CATTTCGAAC CCGACGGGAA ATACCACCTA

151 TTCGGCAGCA GGGGGGAACT TGCCGAGCGC AGCGGTCATA TCGGATTGGG

201 AAACATACAA AGCCATCAGT TGGGCAACCT GTTCATCCAG CAGGCGGCCA

251 TTAAAGGAAA TATCGGCTAC ATTGTCCGCT TTTCCGATCA CGGGCACGAA

301 GTCCATTCCC CCTTCGACAA CCATGCCTCA CATTCCGATT CTGATGAAGC

351 CGGTAGTCCC GTTGACGGAT TCAGCCTTTA CCGCATCCAT TGGGACGGAT

401 ACGAACACCA TCCCGCCGAC GGCTATGACG GGCCACAGGG CGGCGGCTAT

451 CCCGCTCCCA AAGGCGCGAG GGATATATAC AGCTACGACA TAAAAGGCGT

501 TGCCCAAAAT ATCCGCCTCA ACCTGACCGA CAACCGCAGC ACCGGACAAC

551 GGCTTGTCGA CCGTTTCCAC AATACCGGTA GTATGCTGAC GCAAGGAGTA

601 GGCGACGGAT TCAAACGCGC CACCCGATAC AGCCCCGAGC TGGACAGATC

651 GGGCAATGCC GCCGAAGCTT TCAACGGCAC TGCAGATATC GTCAAAAACA

701 TCATCGGCGC GGCAGGAGAA ATTGTCGGCG CAGGCGATGC CGTGCAGGGT

751 ATAAGCGAAG GCTCAAACAT TGCTGTTATG CACGGCTTGG GTCTGCTTTC

801 CACCGAAAAC AAGATGGCGC GCATCAACGA TTTGGCAGAT ATGGCGCAAC

851 TCAAAGACTA TGCCGCAGCA GCCATCCGCG ATTGGGCAGT CCAAAACCCC

901 AATGCCGCAC AAGGCATAGA AGCCGTCAGC AATATCTTTA CGGCAGTCAT

951 CCCCGTCAAA GGGATTGGAG CTGTTCGGGG AAAATACGGC TTGGGCGGCA

1001 TCACGGCACA TCCTGTCAAG CGGTCGCAGA TGGGCGAGAT CGCATTGCCG

1051 AAAGGGAAAT CCGCCGTCAG CGACAATTTT GCCGATGCGG CATACGCCAA

1101 ATACCCGTCC CCTTACCATT CCCGAAATAT CCGTTCAAAC TTGGAGCAGC

1151 GTTACGGCAA AGAAAACATC ACCTCCTCAA CCGTGCCGCC GTCAAACGGA

1201 AAGAATGTGA AACTGGCAAA CAAACGCCAC CCGAAGACCA AAGTGCCGTT

1251 TGACGGTAAA GGGTTTCCGA ATTTTGAAAA AGACGTAAAA TACGATACGA

1301 GAATTAATAC CGCTGTACCA CAAGTGAATC CTATAGATGA ACCCGTCTTT

1351 AATCCTAAAG GTTCTGTCGG ATCGGCTCAT TCTTGGTCTA TAACTGCCAG

1401 AATTCAATAC GCAAAATTAC CAAGGCAAGG TAGAATCAGA TATATCCCAC

1451 CTAAAAATTA CTCTCCTTCA GCACCGCTAC CAAAAGGACC TAATAATGGA

1501 TATTTGGATA AATTTGGTAA TGAATGGACT AAAGGTCCAT CAAGAACTAA

1551 AGGTCAAGAA TTTGAATGGG ATGTTCAATT GTCTAAAACA GGAAGAGAGC

1601 AACTTGGATG GGCTAGTAGG GATGGTAAGC ATTTAAATAT ATCAATTGAT

1651 GGAAAGATTA CACACAAATG A

它对应于氨基酸序列<SEQ ID 466>：

1 LGISRKISLI LSILAVCLPM HAHASDLAND SFIRQVLDRQ HFEPDGKYHL

51 FGSRGELAER SGHIGLGNIQ SHQLGNLFIQ QAAIKGNIGY IVRFSDHGHE

101 VHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD GYDGPQGGGY

151 PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLVDRFH NTGSMLTQGV

201 GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNIIGAAGE IVGAGDAVQG

251 ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA AIRDWAVQNP

301 NAAQGIEAVS NIFTAVIPVK GIGAVRGKYG LGGITAHPVK RSQMGEIALP

351 KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI TSSTVPPSNG

401 KNVKLANKRH PKTKVPFDGK GFPNFEKDVK YDTRINTAVP QVNPIDEPVF

451 NPKGSVGSAH SWSITARIQY AKLPRQGRIR YIPPKNYSPS APLPKGPNNG

501 YLDKFGNEWT KGPSRTKGQE FEWDVQLSKT GREQLGWASR DGKHLNISID

551 GKITHK*

根据该分析结果(包括淋球菌蛋白中存在粘附素典型的RGD序列)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例56

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 467>：

1 ATGAATATTC ACACCCTGCT CTCCAAACAA TGGACGCTGC CGCCATTCCT

51 GCCGAAACGG CTGCTGCTGT CCCTGCTGAT ACTGCTTGCC CCCAATGCGG

101 TGTTTTGGGT TTTGGCACTG CTGACCGCCA CCGCCCGCCC GATTGTCAAT

151 TTGGACTATC TTCCCGCCGC GCTGCTGATC GCCCTGCCTT GGCGTTTCGT

201 CAAAATTGCC GGCGTATTGG CGTTTTGGCT GGCGGTTTTG TTTGACGGGC

251 TGATGATGGT GATCCAACTC TTCCCTTTTA TGGATCTCAT CGGCGCCATC

301 AACCTCGTCC CCTTCATCCT GACCGCCCCC GCCCCTTATC AGATAATGAC

351 CGGGCTG...

它对应于氨基酸序列<SEQ ID 468；ORF48>：

1 MNIHTLLSKQ WTLPPFLPKR LLLSLLILLA PNAVFWVLAL LTATARPIVN

51 LDYLPAALLI ALPWRFVKIA GVLAFWLAVL FDGLMMVIQL FPFMDLIGAI

101 NLVPFILTAP APYQIMTGL...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 469>：

1 ATGAATATTC ACACCCTGCT CTCCAAACAA TGGACGCTGC CGCCATTCCT

51 GCCGAAACGG CTGCTGCTGT CCCTGCTGAT ACTGCTTGCC CCCAATGCGG

101 TGTTTTGGGT TTTGGCACTG CTGACCGCCA CCGCCCGCCC GATTGTCAAT

151 TTGGACTATC TTCCCGCCGC GCTGCTGATC GCCCTGCCTT GGCGTTTCGT

201 CAAAATTGCC GGCGTATTGG CGTTTTGGCT GGCGGTTTTG TTTGACGGGC

251 TGATGATGGT GATCCAACTC TTCCCTTTTA TGGATCTCAT CGGCGCCATC

301 AACCTCGTCC CCTTCATCCT GACCGCCCCC GCCCCTTATC AGATAATGAC

351 CGGGCTGTTG CTGCTGTATA TGCTGGCGAT GCCGTTTGTG TTGCAGAAAG

401 CCGCCGCCAA AACCGACTTC CGGCACATTG CCGTCTGCGC CGCCGTTGTG

451 GCGGCAGCCG GCTATTTCAC CGGCCATTTG AGTTACTACG ACCGGGGTCG

501 GATGGCCAAT ATCTTCGGCG CAAACAACTT CTACTACGCC AAAAGTCAGG

551 CGATGCTCTA CACCGTCAGC CAGAATGCCG ACTTTATTAC CGCCGGCCTG

601 GTCGATCCCG TCTTCCTCCC CTTGGGCAAT CAACAGCGTG CCGCCACGCA

651 TCTGAACGAG CCGAAATCTC AAAAAATCCT CTTTATCGTC GCCGAATCTT

701 GGGGGCTGCC GGCCAATCCC GAACTTCAAA ACGCCACTTT TGCCAAACTG

751 CTGGCGCAAA AAGACCGTTT TTCGGTTTGG GAAAGCGGCA GTTTTCCCTT

801 CATCGGCGCG ACGGTCGAAG GCGAAATGCG CGAACTGTGT GCCTACGGCG

851 GTTTGCGCGG GTTCGCACTG CGCCGCGCGC CCGACGAAAA ATTTGCCCGC

901 TGCCTCCCCA ACCGTTTGAA ACAAGAAGGT TACGCCACCT TTGCGATGCA

951 CGGCGCGGGC AGTTCGCTTT ACGACCGCTT CAGCTGGTAT CCGAGGGCGG

1001 GCTTTCAAGA AATCAAAACC GCCGAAAACC TGATCGGTAA AAAAACCTGC

1051 GCCATTTTCG GCGGCGTGTG CGACAGCGAG CTGTTCGGCG AAGTGTCGGC

1101 ATTTTTCAAA AAACACGACA AGGGACTGTT TTACTGGATG ACGCTGACCA

1151 GCCACGCCGA CTATCCCGAA TCCGACATTT TCAACCACAG GCTCAAATGC

1201 ACCGAATATG GCCTGCCCGC CGAAACCGAC CTCTGCCGCA ATTTCAGCCT

1251 GCACACCCAA TTCTTCGACC AACTGGCGGA TTTGATCCAA CGCCCCGAAA

1301 TGAAAGGCAC GGAAGTCATC ATCGTCGGCG ACCATCCGCC GCCCGTCGGC

1351 AACCTCAATG AAACCTTCCG CTACCTCAAA CAGGGGCACG TCGCCTGGCT

1401 GAACTTCAAA ATCAAATAA

它对应于氨基酸序列<SEQ ID 470；ORF48-1>：

1 MNIHTLLSKQ WTLPPFLPKR LLLSLLILLA PNAVFWVLAL LTATARPIVN

51 LDYLPAALLI ALPWRFVKIA G VLAFWLAVL FDGLMMVIQ L FPFMDLIGAI

101 NLVPFILTAP APYQ IMTGLL LLYMLAMPFV LQKAAAKTDF R HIAVCAAVV

151 AAAGYFTGHL SYYDRGRMAN IFGANNFYYA KSQAMLYTVS QNADFITAGL

201 VDPVFLPLGN QQRAATHLNE PKSQKILFIV AESWGLPANP ELQNATFAKL

251 LAQKDRFSVW ESGSFPFIGA TVEGEMRELC AYGGLRGFAL RRAPDEKFAR

301 CLPNRLKQEG YATFAMHGAG SSLYDRFSWY PRAGFQEIKT AENLIGKKTC

351 AIFGGVCDSE LFGEVSAFFK KHDKGLFYWM TLTSHADYPE SDIFNHRLKC

401 TEYGLPAETD LCRNFSLHTQ FFDQLADLIQ RPEMKGTEVI IVGDHPPPVG

451 NLNETFRYLK QGHVAWLNFK IK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF48显示与脑膜炎奈瑟球菌菌株A的ORF(ORF48a)在重叠的119个氨基酸内有94.1％的相同性：

10 20 30 40 50 60

orf48.pep MNIHTLLSKQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI

||||||||||||||||||||||||||||| ||||||||||||||| |||||| ||||||||

orf48a MNIHTLLSKQWTLPPFLPKRLLLSLLILLXPNAVFWVLALLTATARPIVNLXYLPAALLI

10 20 30 40 50 60

70 80 90 100 110 119

orf48.pep ALPWRFVKIAG VLAFWLAVLFDGLMMVIQ LFPFMDLIGAINLVPFILTAPAPYQ IMTGL

||||| ||| | ||| ||||||||||||| | ||||||||||||||||| |||| || |||||

orf48a ALPWRXVKIXG VLAXWLAVLFDGLMMVIQ LFPFMDLIGAINLVPFIXTAPALYQ IMTGLL

70 80 90 100 110 120

orf48a LLYMLAMPFVLQKAAAKTDFRHIAACAAVVVAAGYFTGHLSXYDRGRMANIFGANNFYYA

130 140 150 160 170 180

全长ORF48a核苷酸序列<SEQ ID 471>是：

1 ATGAATATTC ACACCCTGCT CTCCAAACAA TGGACGCTGC CGCCATTCCT

51 GCCGAAACGG CTGCTGCTGT CCCTGCTGAT ACTGCTNNCC CCCAATGCGG

101 TGTTTTGGGT TTTGGCACTG CTGACCGCCA CCGCCCGCCC GATTGTCAAT

151 TTGGANTACC TTCCCGCCGC GCTGCTGATC GCCCTGCCTT GGCGTNTCGT

201 CAAAATTGNC GGCGTATTGG CGTNTTGGCT GGCGGTTTTG TTTGACGGGC

251 TGATGATGGT GATCCAACTC TTCCCTTTTA TGGATCTCAT CGGCGCCATC

301 AACCTCGTCC CCTTCATCNT GACCGCCCCC GCCCTTTATC AGATAATGAC

351 CGGGCTGTTA CTGCTGTATA TGCTGGCGAT GCCGTTTGTG TTGCAGAAAG

401 CCGCCGCCAA AACCGACTTC CGACACATTG CCGCCTGTGC CGCCGTTGTG

451 GTGGCAGCCG GCTATTTTAC CGGCCATTTG AGTTANTACG ACCGGGGGCG

501 GATGGCCAAT ATCTTCGGCG CAAACAACTT CTATTACGCC AAAAGTCAGG

551 CGATGCTCTA CACCGTCAGC CAGAATGCCG ACTTTATTAC CGCCGGCCTG

601 GTCGATCCCG TCTTCCTCCC CTTGGGCAAT CAACAGCGTG CCGCCACGCA

651 TCTGAACGAG CCGAAATCTC AAAAAATCCT CTTTATCGTC GCCGAATCTT

701 GGGGGCTGCC GGCCAATCCC GAACTTCAAA ACGCCACTTT TGCCAAACTG

751 CTGGCGCAAA AAGANCGTTT TTCGGTTTGG GAAAGCGGCA GTTTTCCCTT

801 CATCGGCGCG ACGATCGAAG GCGAAATGCG CGAACTGTGT GCCTACGGCG

851 GTTTGCGCGG GTTCGCACTG CGCCGCGCGC CCGACGAAAA ATTTGCCCGC

901 TGCCTCCCCA ACCGTTTGAA ACAAGAAGGT TACGCCACCT TTGCGATGCA

951 CGGCGCGGGC AGTTCGCTTT ACGACCGCTT CAGCTGGTAT CCGAGGGCGG

1001 GCTTTCAAGA AATCAAAACC GCCGAAAACC TGATCGGTAA AAAAACCTGC

1051 GCCATTTTCG GCGGCGTGTG CGACAGCGAG CTGTTCGGCG AAGTGTCGGC

1101 ANTTTTCAAA AAACACGACA AGGGACTGTT TTACTGGATG ACGCTGACCA

1151 GCCACGCCGA CTATCCCGAA TCNGACATTT TCAACCACAG GCTCAAATGC

1201 ACCGAATATG GCCTGCCCGC CGAAACCGAC NTCTGCCGCA ATTTCAGCCT

1251 GCACACCCAA TTCTTCGACC AACTGGCGGA TTTGATCCAA CGCCCCGAAA

1301 TGAAAGGCAC GGAAGTCATC ATCGTCGGCG ACCATCCGCC GCCCGTCGGC

1351 AACCTCAATG AAACCTTCCG CTACCTCAAA CAGGGGCACG TCGNCTGGCT

1401 GAACTTCAAA ATCAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 472>：

1 MNIHTLLSKQ WTLPPFLPKR LLLSLLILLX PNAVFWVLAL LTATARPIVN

51 LXYLPAALLI ALPWRXVKIX G VLAXWLAVL FDGLMMVIQ L FPFMDLIGAI

101 NLVPFIXTAP ALYQ IMTGLL LLYMLAMPFV LQKAAAKTDF R HIAACAAVV

151 VAAGYFTGHL SXYDRGRMAN IFGANNFYYA KSQAMLYTVS QNADFITAGL

201 VDPVFLPLGN QQRAATHLNE PKSQKILFIV AESWGLPANP ELQNATFAKL

251 LAQKXRFSVW ESGSFPFIGA TIEGEMRELC AYGGLRGFAL RRAPDEKFAR

301 CLPNRLKQEG YATFAMHGAG SSLYDRFSWY PRAGFQEIKT AENLIGKKTC

351 AIFGGVCDSE LFGEVSAXFK KHDKGLFYWM TLTSHADYPE SDIFNHRLKC

401 TEYGLPAETD XCRNFSLHTQ FFDQLADLIQ RPEMKGTEVI IVGDHPPPVG

451 NLNETFRYLK QGHVXWLNFK IK*

ORF48a和ORF48-1显示在472个氨基酸的重叠区内有96.8％的相同性：

10 20 30 40 50 60

orf48a.pep MNIHTLLSKQWTLPPFLPKRLLLSLLILLXPNAVFWVLALLTATARPIVNLXYLPAALLI

||||||||||||||||||||||||||||| ||||||||||||||||||||| ||||||||

orf48-1 MNIHTLLSKQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI

10 20 30 40 50 60

70 80 90 100 110 120

orf48a.pep ALPWRXVKIXGVLAXWLAVLFDGLMMVIQLFPFMDLIGAINLVPFIXTAPALYQIMTGLL

||||| ||| |||| ||||||||||||||||||||||||||||||| |||| ||||||||

orf48-1 ALPWRFVKIAGVLAFWLAVLFDGLMMVIQLFPFMDLIGAINLVPFILTAPAPYQIMTGLL

70 80 90 100 110 120

130 140 150 160 170 180

orf48a.pep LLYMLAMPFVLQKAAAKTDFRHIAACAAVVVAAGYFTGHLSXYDRGRMANIFGANNFYYA

||||||||||||||||||||||||:|||||:|||||||||| ||||||||||||||||||

orf48-1 LLYMLAMPFVLQKAAAKTDFRHIAVCAAVVAAAGYFTGHLSYYDRGRMANIFGANNFYYA

130 140 150 160 170 180

190 200 210 220 230 240

orf48a.pep KSQAMLYTVSQNADFITAGLVDPVFLPLGNQQRAATHLNEPKSQKILFIVAESWGLPANP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf48-1 KSQAMLYTVSQNADFITAGLVDPVFLPLGNQQRAATHLNEPKSQKILFIVAESWGLPANP

190 200 210 220 230 240

250 260 270 280 290 300

orf48a.pep ELQNATFAKLLAQKXRFSVWESGSFPFIGATIEGEMRELCAYGGLRGFALRRAPDEKFAR

|||||||||||||| ||||||||||||||||:||||||||||||||||||||||||||||

orf48-1 ELQNATFAKLLAQKDRFSVWESGSFPFIGATVEGEMRELCAYGGLRGFALRRAPDEKFAR

250 260 270 280 290 300

310 320 330 340 350 360

orf48a.pep CLPNRLKQEGYATFAMHGAGSSLYDRFSWYPRAGFQEIKTAENLIGKKTCAIFGGVCDSE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf48-1 CLPNRLKQEGYATFAMHGAGSSLYDRFSWYPRAGFQEIKTAENLIGKKTCAIFGGVCDSE

310 320 330 340 350 360

370 380 390 400 410 420

orf48a.pep LFGEVSAXFKKHDKGLFYWMTLTSHADYPESDIFNHRLKCTEYGLPAETDXCRNFSLHTQ

||||||| |||||||||||||||||||||||||||||||||||||||||| |||||||||

orf48-1 LFGEVSAFFKKHDKGLFYWMTLTSHADYPESDIFNHRLKCTEYGLPAETDLCRNFSLHTQ

370 380 390 400 410 420

430 440 450 460 470

orf48a.pep FFDQLADLIQRPEMKGTEVIIVGDHPPPVGNLNETFRYLKQGHVXWLNFKIKX

|||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf48-1 FFDQLADLIQRPEMKGTEVIIVGDHPPPVGNLNETFRYLKQGHVAWLNFKIKX

430 440 450 460 470

与淋病奈瑟球菌的预计ORF的同源性

ORF48显示与淋病奈瑟球菌的预计ORF(ORF48ng)在重叠的119个氨基酸内有97.5％的相同性：

orf48.pep MNIHTLLSKQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI 60

||||:|||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf48ng MNIHALLSEQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI 60

orf48.pep ALPWRFVKIAGVLAFWLAVLFDGLMMVIQLFPFMDLIGAINLVPFILTAPAPYQIMTGL 119

|||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf48ng ALPWRFVKIAGVLAFWPAVLFDGLMMVIQLFPFMDLIGAINLVPFILTAPAPYQIMTGLL 120

预计ORF48ng核苷酸序列<SEQ ID 473>编码的蛋白质具有氨基酸序列<SEQ ID474>：

1 RPTVN

51 LDYLPAALLI ALPWRFVKIA G VLAFWPAVL FDGLMMVIQ L FPFMDLIGAI

101 NLVPFILTAP APYQ IMTGLL LLYMLAMPFV LQKAAVKTDF RHIAVCAAVV

151 AAARYFTGPF ELLRTGGRWQ YVQHRRLLLS GSRASFRRRQ KADVLRRLGN

201 PYASMGNGG..

进一步的工作鉴定出完整的淋球菌DNA序列<SEQ ID 475>：

1 ATGAATATTC ACGCCCTGCT CTCCGAACAA TGGACGCTGC CGCCATTCCT

51 GCCGAAACGG CTGCTGCTGT CCCTGCTGAT ACTGCTGGCC CCCAATGCGG

101 TGTTTTGGGT TTTGGCACTG CTGACCGCCA CCGCCCGCCC GATTGTCAAT

151 TTGGACTACC TTCCCGCCGC GCTGCTGATC GCCCTGCCTT GGCGTTTCGT

201 CAAAATTGCC GGCGTATTGG CGTTTTGGCC GGCGGTTTTG TTTGACGGGC

251 TGATGATGGT GATCCAACTC TTCCCTTTTA TGGACCTCAT CGGCGCCATC

301 AACCTCGTCC CCTTCATCCT GACCGCCCCC GCCCCTTATC AGATAATGAC

351 CGGGCTGTTG CTGCTGTATA TGCTGGCGAT GCCGTTTGTG TTGCAAAAAG

401 CCGCCGTCAA AACCGACTTC CGACACATTG CCGTCTGTGC CGCCGTTGTG

451 GCGGCAGCCG GCTATTTCAC CGGCCATTTG AGTTACTACG ACCGGGGGCG

501 GATGGCCAAT ATCTTCGGCG CAAACAACTT CTATTACGCc aAAAGTCAGG

551 CGATGCTCTA CACCGTCAGC CAGAATGCCG ACTTTATTAC CGCCGgcctG

601 GTCGACCCCG TCTTCCTCCC CTTGGGCAAT CAGCAGCGTG CCGCCACGCG

651 GCTGAGTGAG CCGAAATCTC AAAAAATCCT CTTTATCGTC GCCGAATCTT

701 GGGGGCTGCC GGGCAATCCC GAGCTTCAAA ACGCCACTTT TGCCAAACTG

751 CTGGCGCAAA AAGACCGTTT TTCGGTTTGG GAAAGCGGCA GTTTTCCCTT

801 CATCGGCGCG ACGGTCGAAG GCGAAATGCG CGAATTGTGC GCCTACGGCG

851 GTTTGCGCGG GTTCGCACTG CGCCGCGCGC CCGACGAAAA ATTTGCCCGC

901 TGCCTCCCCA ACCGTTTGAA ACAAGAAGGT TACGCCACCT TTGCGATGCA

951 CGGCGCGGGT AGTTCGCTTT ACGACCGCTT CAGCTGGTAT CCGAGGGCGG

1001 GCTTTCAAAA AATCAAAACC GCCGAAAACC TGATCGGTAA AAAAACCTGC

1051 GCCATTTTCG GCGGCGTGTG CGACAGCGAG CTGTTCGGCG AAGTGTCGGC

1101 ATTTTTCAAA AAACACGACA AGGGACTGTT TTACTGGATG ACGCTGACCA

1151 GCCACGCCGA CTATCCCGAA TCCGACATTT TCAACCACAG GCTCAAATGC

1201 ACCGAATACG GCCTGCCCGC CGAAACCGAC CTCTGCCGCA ATTTCAGCCT

1251 GCACACCCAA TtcttcgACC AACTGGCGGA TTTGATCCGA CGCCCCGAAA

1301 TGAAAGGCAC GGAAGTCATC ATCGTCGGCG ACCATCCGCC GCCCGTCGGC

1351 AACCTCAATG AAACCTTCCG CTACCTCAAA CAGGGACACG TCGCCTGGCT

1401 GCACTTCAAA ATCAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 476；ORF48ng-1>：

1 MNIHALLSEQ WTLPPFLPKR LLLSLLILLA PNAVFWVLAL LTATARPIVN

51 LDYLPAALLI ALPWRFVKIA GVLAFWPAVL FDGLMMVIQL FPFMDLIGAI

101 NLVPFILTAP APYQIMTGLL LLYMLAMPFV LQKAAVKTDF RHIAVCAAVV

151 AAAGYFTGHL SYYDRGRMAN IFGANNFYYA KSQAMLYTVS QNADFITAGL

201 VDPVFLPLGN QQRAATRLSE PKSQKILFIV AESWGLPGNP ELQNATFAKL

251 LAQKDRFSVW ESGSFPFIGA TVEGEMRELC AYGGLRGFAL RRAPDEKFAR

301 CLPNRLKQEG YATFAMHGAG SSLYDRFSWY PRAGFQKIKT AENLIGKKTC

351 AIFGGVCDSE LFGEVSAFFK KHDKGLFYWM TLTSHADYPE SDIFNHRLKC

401 TEYGLPAETD LCRNFSLHTQ FFDQLADLIR RPEMKGTEVI IVGDHPPPVG

451 NLNETFRYLK QGHVAWLHFK IK*

ORG48ng-1和ORF48-1显示在472个氨基酸的重叠区内有97.9％的相同性：

10 20 30 40 50 60

orf48-1.pep MNIHTLLSKQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI

||||:|||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf48ng-1 MNIHALLSEQWTLPPFLPKRLLLSLLILLAPNAVFWVLALLTATARPIVNLDYLPAALLI

10 20 30 40 50 60

70 80 90 100 110 120

orf48-1.pep ALPWRFVKIAGVLAFWLAVLFDGLMMVIQLFPFMDLIGAINLVPFILTAPAPYQIMTGLL

|||||||||||||||| |||||||||||||||||||||||||||||||||||||||||||

orf48ng-1 ALPWRFVKIAGVLAFWPAVLFDGLMMVIQLFPFMDLIGAINLVPFILTAPAPYQIMTGLL

70 80 90 100 110 120

130 140 150 160 170 180

orf48-1.pep LLYMLAMPFVLQKAAAKTDFRHIAVCAAVVAAAGYFTGHLSYYDRGRMANIFGANNFYYA

|||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||

orf48ng-1 LLYMLAMPFVLQKAAVKTDFRHIAVCAAVVAAAGYFTGHLSYYDRGRMANIFGANNFYYA

130 140 150 160 170 180

190 200 210 220 230 240

orf48-1.pep KSQAMLYTVSQNADFITAGLVDPVFLPLGNQQRAATHLNEPKSQKILFIVAESWGLPANP

||||||||||||||||||||||||||||||||||||:|:||||||||||||||||||:||

orf48ng-1 KSQAMLYTVSQNADFITAGLVDPVFLPLGNQQRAATRLSEPKSQKILFIVAESWGLPGNP

190 200 210 220 230 240

250 260 270 280 290 300

orf48-1.pep ELQNATFAKLLAQKDRFSVWESGSFPFIGATVEGEMRELCAYGGLRGFALRRAPDEKFAR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf48ng-1 ELQNATFAKLLAQKDRFSVWESGSFPFIGATVEGEMRELCAYGGLRGFALRRAPDEKFAR

250 260 270 280 290 300

310 320 330 340 350 360

orf48-1.pep CLPNRLKQEGYATFAMHGAGSSLYDRFSWYPRAGFQEIKTAENLIGKKTCAIFGGVCDSE

||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||

orf48ng-1 CLPNRLKQEGYATFAMHGAGSSLYDRFSWYPRAGFQKIKTAENLIGKKTCAIFGGVCDSE

310 320 330 340 350 360

370 380 390 400 410 420

orf48-1.pep LFGEVSAFFKKHDKGLFYWMTLTSHADYPESDIFNHRLKCTEYGLPAETDLCRNFSLHTQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf48ng-1 LFGEVSAFFKKHDKGLFYWMTLTSHADYPESDIFNHRLKCTEYGLPAETDLCRNFSLHTQ

370 380 390 400 410 420

430 440 450 460 470

orf48-1.pep FFDQLADLIQRPEMKGTEVIIVGDHPPPVGNLNETFRYLKQGHVAWLNFKIKX

|||||||||:|||||||||||||||||||||||||||||||||||||:|||||

orf48ng-1 FFDQLADLIRRPEMKGTEVIIVGDHPPPVGNLNETFRYLKQGHVAWLHFKIKX

430 440 450 460 470

根据该分析结果(包括淋球菌蛋白中存在一个推定的前导序列(双划线)和两个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例57

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 477>：

1 ..GTGAGCGGAC GTTACCGCGC TTTGGATCGC GTTTCCAAAA TCATCATCGT

51 TACTTTGAGT ATCGCCACGC TTGCCGCCGC CGGCATCGCT ATGTCGCGCG

101 GTATGCAGAT GCAGTCCGAT TTTATCGAGC CGACACCGTG GACGCTTGCC

151 GGTTTGGGCT TCCTGATCGC GCTGATGGGC TGGATGCCCG CGCCGATTGA

201 AATTTCCGCC ATCAATTCTT TGTGGGTAAC CGAAAAACAA CGCATCAATC

251 CTTCCGAATA CCGCGACGGG ATTTTTGAAT TCAACGTCGG TTATATCGCC

301 AGTGCGGTTT TGGCTTTGGT TTTCCTTGCA CTGGGCGC.G TAGCGCCGAA

351 CGGCAACGGC GA.ACAGTGC AGATGGCGGG CGGCAAATAT AACGGGCAAT

401 TGATCAATAT GTACGCC..

它对应于氨基酸序列<SEQ ID 478；ORF53>：

1 ..VSGRYRALDR VSKIIIVTLS IATLAAAGIA MSRGMQMQSD FIEPTPWTLA

51 GLGFLIALMG WMPAPIEISA INSLWVTEKQ RINPSEYRDG IFEFNVGYIA

101 SAVLALVFLA LGXVAPNGNG XTVQMAGGKY NGQLINMYA..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 479>：

1 ATGTCCGAAC AACATATTTC GACTTGGAAA AGTAAAATCA ACGCATTGGG

51 TCCGGGGATC ATGATGGCTT CGGCGGCGGT CGGCGGTTCG CACCTGATTG

101 CCTCGACGCA GGCGGGCGCG CTTTACGGCT GGCAGATCGC GCTCATCATC

151 ATCCTGACCA ACCTCTTCAA ATACCCGTTT TTCCGCTTCA GCGCGCATTA

201 CACGCTGGAC ACGGGCAAGA GCCTGATTGA AGGTTATGCC GAGAAAAGCC

251 GCGTTTATTT GTGGGTATTC CTGATTTTGT GCATCCTCTC CGCCACGATT

301 AACGCGGGCG CGGTCGCCAT TGTAACCGCC GCCATCGTCA AAATGGCGAT

351 TCCCTCGCTG ATGTTTGATG CCGGCACGGT TGCCGCCTTG ATTATGGCAT

401 CCTGCCTGAT TATTTTGGTG AGCGGACGTT ACCGCGCTTT GGATCGCGTT

451 TCCAAAATCA TCATCGTTAC TTTGAGTATC GCCACGCTTG CCGCCGCCGG

501 CATCGCTATG TCGCGCGGTA TGCAGATGCA GTCCGATTTT ATCGAGCCGA

551 CACCGTGGAC GCTTGCCGGT TTGGGCTTCC TGATCGCGCT GATGGGCTGG

601 ATGCCCGCGC CGATTGAAAT TTCCGCCATC AATTCTTTGT GGGTAACCGA

651 AAAACAACGC ATCAATCCTT CCGAATACCG CGACGGGATT TTTGATTTCA

701 ACGTCGGTTA TATCGCCAGT GCGGTTTTGG CTTTGGTTTT CCTTGCACTG

751 GGCGCGTTTG TGCAATACGG CAACGGCGAA GCAGTGCAGA TGGCGGGCGG

801 CAAATATATC GGGCAATTGA TCAATATGTA CGCCGTTACC ATCGGCGGCT

851 GGTCGCGCCC GCTGGTGGCG TTTATCGCGT TTGCCTGTAT GTACGGCACG

901 ACGATTACCG TCGTGGACGG CTATGCCCGT GCCATTGCCG AACCCGTGCG

951 CCTGCTGCGC GGAAAAGACA AAACGGGCAA CGCCGAATTC TTTGCCTGGA

1001 ATATTTGGGT GGCGGGCAGC GGTTTGGCGG TGATTTTCTG GTTTGACGGC

1051 GTAATGGCGA ATCTGCTCAA ATTTGCGATG ATTGCCGCTT TTGTGTCCGC

1101 CCCTGTGTTT GCCTGGCTGA ATTACCGTTT GGTTAAAGGT GATGAAAAAC

1151 ACAAACTCAC ATCAGGTATG AATGCCCTTG CATTGGCAGG CTTGATTTAT

1201 CTGACCGGTT TTACCGTTTT GTTCTTATTG AATTTGGCGG GAATGTTCAA

1251 ATGA

它对应于氨基酸序列<SEQ ID 480；ORF53-1>：

1 MSEQHISTWK SKINALGPGI MMASAAVGGS HLIASTQAG A LYGWQIALII

51 ILTNLFKYPF FRFSAHYTLD TGKSLIEGYA EKSRVYLW VF LILCILSATI

101 NAGAV AIVTA AIVKMAIPSL MFD AGTVAAL IMASCLIILV SGRYRALDRV

151 SK IIIVTLSI ATLAAAGIAM SRGMQMQSDF IEPTPW TLAG LGFLIALMGW

201 MPAPIEISAI NSLWVTEKQR INPSEYRDGI FDFNVGY IAS AVLALVFLAL

251 GAFVQYGNGE AVQMAGGKYI GQLINMYAVT IGGWSRPL VA FIAFACMYGT

301 TITVVDGYAR AIAEPVRLLR GKDKTGNAE F FAWNIWVAGS GLAVIFWFDG

351 VMAN LLKFAM IAAFVSAPVF AWLNYRLVKG DEKHKLTSGM NA LALAGLIY

401 LTGFTVLFLL NLAGMFK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF53显示与脑膜炎奈瑟球菌菌株A的ORF(ORF53a)在重叠的139个氨基酸内有93.5％的相同性：

10 20 30

orf53.pep VSGRYRALDRVSK IIIVTLSIATLAAAGIA

| |||||||||||| |||||||||||||||||

orf53a A AIVKMAIPSLMFD AGTVAALIMASCLIILVSGRYRALDRVSK IIIVTLSIATLAAAGIA

110 120 130 140 150 160

40 50 60 70 80 90

orf53.pep MSRGMQMQSDFIEPTPW TLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDG

||||||||||||||||| ||||||||||||||||| ||||||||||||||||||||||||||

orf53a MSRGMQMQSDFIEPTPW TLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDG

170 180 190 200 210 220

100 110 120 130 139

orf53.pep IFEFNVGY IASAVLALVFLALGXVAPNGNGXTVQMAGGKYNGQLINMYA

||:||||| |||||||||||||| : ||| :|||||||| ||||||||

orf53a IFDFNVGY IASAVLALVFLALGAFVQYGNGEAVQMAGGKYIGQLINMYAVTIGGWSRPLV

230 240 250 260 270 280

orf53a AFIAFACMYGTTITVVDGYARAIAEPVRLLRGKDKTGNAEFFAWNIWVAGSGLAVIFWFD

290 300 310 320 330 340

全长ORF53a核苷酸序列<SEQ ID 481>是：

1 ATGTCCGAAC AACATATTTC GACTTGGAAA AGTAAAATCA ACGCATTGGG

51 ACCGGGGATT ATGATGGCTT CGGCGGCGGT CGGCGGTTCG CACCTGATTG

101 CCTCGACGCA GGCGGGCGCG CTTTACGGCT GGCAGATCGC GCTCATCATC

151 ATCCTGACCA ACCTCTTCAA ATACCCGTTT TTCCGCTTCA GCGCGCATTA

201 CACGCTGGAC ACGGGCAAGA GCCTGATTGA AGGTTATGCC GAGAAAAGCC

251 GCGTTTATTT GTGGGTATTC CTGATTTTGT GCATCCTCTC CGCCACGATT

301 AACGCGGGCG CGGTCGCCAT TGTAACCGCC GCCATCGTCA AAATGGCGAT

351 TCCCTCGCTG ATGTTTGATG CCGGCACGGT TGCCGCCTTG ATTATGGCAT

401 CCTGCCTGAT TATTTTGGTG AGCGGACGTT ACCGCGCTTT GGATCGCGTT

451 TCCAAAATCA TCATCGTTAC TTTGAGTATC GCCACGCTTG CCGCCGCCGG

501 CATCGCTATG TCGCGCGGTA TGCAGATGCA GTCCGATTTT ATCGAGCCGA

551 CACCGTGGAC GCTTGCCGGT TTGGGCTTCC TGATCGCGCT GATGGGCTGG

601 ATGCCCGCGC CGATTGAAAT TTCCGCCATC AATTCTTTGT GGGTAACCGA

651 AAAACAACGC ATCAATCCTT CCGAATACCG CGACGGGATT TTTGATTTCA

701 ACGTCGGTTA TATCGCCAGT GCGGTTTTGG CTTTGGTTTT CCTTGCACTG

751 GGCGCGTTTG TGCAATACGG CAACGGCGAA GCAGTGCAGA TGGCGGGCGG

801 CAAATATATC GGGCAATTGA TCAATATGTA CGCCGTTACC ATCGGCGGCT

851 GGTCGCGCCC GCTGGTGGCG TTTATCGCGT TTGCCTGTAT GTACGGCACG

901 ACGATTACCG TTGTGGACGG CTATGCCCGT GCCATTGCCG AACCCGTGCG

951 CCTGCTGCGC GGAAAAGACA AAACGGGCAA CGCCGAATTC TTTGCCTGGA

1001 ATATTTGGGT GGCGGGCAGC GGTTTGGCGG TGATTTTCTG GTTTGACGGC

1051 GTAATGGCGA ATCTGCTCAA ATTTGCGATG ATTGCCGCTT TTGTGTCCGC

1101 CCCTGTGTTT GCCTGGCTGA ATTACCGTTT GGTCAAAGGT GATGAAAAAC

1151 ACAAACTCAC ATCAGGTATG AATGCCCTTG CATTGGCAGG CTTGATTTAT

1201 CTGACCGGTT TTACCGTTTT GTTCTTATTG AATTTGGCGG GAATGTTCAA

1251 ATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 482>：

1 MSEQHISTWK SKINALGPGI MMASAAVGGS HLIASTQAG A LYGWQIALII

51 ILTNLFKYPF FRFSAHYTLD TGKSLIEGYA EKSRVYLW VF LILCILSATI

101 NAGAV AIVTA AIVKMAIPSL MFD AGTVAAL IMASCLIILV SGRYRALDRV

151 SK IIIVTLSI ATLAAAGIAM SRGMQMQSDF IEPTPW TLAG LGFLIALMGW

201 MPAPIEISAI NSLWVTEKQR INPSEYRDGI FDFNVGY IAS AVLALVFLAL

251 GAFVQYGNGE AVQMAGGKYI GQLINMYAVT IGGWSRPL VA FIAFACMYGT

301 TITVVDGYAR AIAEPVRLLR GKDKTGNAE F FAWNIWVAGS GLAVIFWFDG

351 VMAN LLKFAM IAAFVSAPVF AWLNYRLVKG DEKHKLTSGM NA LALAGLIY

401 LTGFTVLFLL NLAGMFK*

ORF 53a显示与ORF53-1在重叠的417个氨基酸内有100.0％的相同性：

10 20 30 40 50 60

orf53a.pep MSEQHISTWKSKINALGPGIMMASAAVGGSHLIASTQAGALYGWQIALIIILTNLFKYPF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 MSEQHISTWKSKINALGPGIMMASAAVGGSHLIASTQAGALYGWQIALIIILTNLFKYPF

10 20 30 40 50 60

70 80 90 100 110 120

orf53a.pep FRFSAHYTLDTGKSLIEGYAEKSRVYLWVFLILCILSATINAGAVAIVTAAIVKMAIPSL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 FRFSAHYTLDTGKSLIEGYAEKSRVYLWVFLILCILSATINAGAVAIVTAAIVKMAIPSL

70 80 90 100 110 120

130 140 150 160 170 180

orf53a.pep MFDAGTVAALIMASCLIILVSGRYRALDRVSKIIIVTLSIATLAAAGIAMSRGMQMQSDF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 MFDAGTVAALIMASCLIILVSGRYRALDRVSKIIIVTLSIATLAAAGIAMSRGMQMQSDF

130 140 150 160 170 180

190 200 210 220 230 240

orf53a.pep IEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDGIFDFNVGYIAS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 IEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDGIFDFNVGYIAS

190 200 210 220 230 240

250 260 270 280 290 300

orf53a.pep AVLALVFLALGAFVQYGNGEAVQMAGGKYIGQLINMYAVTIGGWSRPLVAFIAFACMYGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 AVLALVFLALGAFVQYGNGEAVQMAGGKYIGQLINMYAVTIGGWSRPLVAFIAFACMYGT

250 260 270 280 290 300

310 320 330 340 350 360

orf53a.pep TITVVDGYARAIAEPVRLLRGKDKTGNAEFFAWNIWVAGSGLAVIFWFDGVMANLLKFAM

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 TITVVDGYARAIAEPVRLLRGKDKTGNAEFFAWNIWVAGSGLAVIFWFDGVMANLLKFAM

310 320 330 340 350 360

370 380 390 400 410

orf53a.pep IAAFVSAPVFAWLNYRLVKGDEKHKLTSGMNALALAGLIYLTGFTVLFLLNLAGMFKX

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53-1 IAAFVSAPVFAWLNYRLVKGDEKHKLTSGMNALALAGLIYLTGFTVLFLLNLAGMFKX

370 380 390 400 410

与淋病奈瑟球菌的预计ORF的同源性

ORF53显示与淋病奈瑟球菌的预计ORF(ORF53ng)在重叠的139个氨基酸内有92.1％的相同性：

orf53.pep VSGRYRALDRVSKIIIVTLSIATLAAAGIA 30

||||||||||||||||||||||||||||||

orf53ng AAIVKMAIPSLMFDAGTVAALIMASCLIILVSGRYRALDRVSKIIIVTLSIATLAAAGIA 91

orf53.pep MSRGMQMQSDFIEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDG 90

|||||||| |||||||||||||||||||||||||||||||||||||||||||||||||||

orf53ng MSRGMQMQPDFIEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDG 151

orf53.pep IFEFNVGYIASAVLALVFLALGXVAPNGNGXTVQMAGGKYNGQLINMYA 139

||:||||||||||||||||||| : ||| :|||:|||| ||||||||

orf53ng IFDFNVGYIASAVLALVFLALGAFVQYGNGEAVQMGGGKYIGQLINMYAVTIGGGSRPLV 211

预计ORF53ng核苷酸序列<SEQ ID 483>编码的蛋白质具有氨基酸序列<SEQ ID484>：

1

51 ALIMASCLII LVSGRYRALD RVSK IIIVTL SIATLAAAGI AMSRGMQMQP

101 DFIEPTPW TL AGLGFLIALM GWMPAPIEIS AINSLWVTEK QRINPSEYRD

151 GIFDFNVGY I ASAVLALVFL ALGAFVQYGN GEAVQMGGGK YIGQLINMYA

201 VTIGGGSRPL VAFIAFACMY GAASTVVDGY ARAIAEPVRL LRGKDKTARP

251 IVLLEKLGGR HRFGRDFLV*

进一步的分析进一步揭示了淋球菌的该部分DNA序列<SEQ ID 485>：

1 ..aagaAAAGCT GCGTTTATTT GTGGGTTTTT TTGATTTTGT GTATCGCCTC

51 CGCCACGATT AACGCGGGCG CGGTCGCCAT TGTAACCGCC GCCATCGTCA

101 AAATGGCGAT TCCCTCGCTG ATGTTTGATG CCGGCACGGT TGCCGCCTTG

151 ATTATGGCAT CCTGCCTGAT TATTTTGGTG AGCGGACGTT ACCGCGCTTT

201 GGATCGTGTT TCCAAAATCA TCATTGTTAC TTTGAGCATC GCCACGCTTG

251 CCGCCGCCGG CATCGCTATG TCGCGCGGTA TGCAGATGCA GCCCGATTTT

301 ATCGAGCCGA CACCGTGGAC GCTTGCCGGT TTGGGCTTCC TGATCGCGCT

351 GATGGGCTGG ATGCCCGCGC CGATCGAAAT TTCCGCCATC AATTCTTTGT

401 GGGTAACCGA AAAACAACGC ATCAATCCTT CTGAATACCG CGACGGGATT

451 TTCGATTTCA ACGTCGGTTA TATCGCcagT GCGGTTTTGG CTTTGGTTTT

501 CCTTGCACTG GGCGCGTTTG TGCAATACGG CAACGGCGAA GCAGTGCAGA

551 TGGCGGGCGG CAAATATATC GGGCAATTGA TTAATATGTA TGCCGTAACC

601 ATCGGCGGCT GGTCTCGTCC GCTGGTGGCG TTTATCGCGT TTGCCTGTAT

651 GTACGGCACG ACGATTACCG TTGTGGACGG TTATGCGCGT GCCATTGCCG

701 AACCCGTGCG CCTGCTGCGC GGCAGGGATA AAACCGGCAA CGCCGAGTTG

751 TTtgccTGGA ATATTTGGGT GGCGGGCAGC GGTTTGGCGG TGATTTTCTG

801 GTTTGACggc gcaaTGGCgG AACtgcTCAA ATTTGCGATG ATtgccgcCT

851 TTGTGTCCGC CCCTGTGTTC GCCTGGCTCA ACTACCGCCT CGTCAAAGGG

901 GACAAACGCC ACAGGCTTAC CGCCGGTATG AACGCCCTTG CCATTGTCGG

951 CCTGCTCTAC CTGGCCGGGT TTGCCGTTTT GTTCCTGTTG AACCTTACCG

1001 GACTTTTGGC ATAG

它对应于氨基酸序列<SEQ ID 486；ORF53ng-1>：

1 ..KKSCVYLWVF LILCIASATI NAGAVAIVTA AIVKMAIPSL MFDAGTVAAL

51 IMASCLIILV SGRYRALDRV SK IIIVTLSI ATLAAAGIAM SRGMQMQPDF

101 IEPTPW TLAG LGFLIALMGW MPAPIEISAI NSLWVTEKQR INPSEYRDGI

151 FDFNVGY IAS AVLALVFLAL GAFVQYGNGE AVQMAGGKYI GQLINMYAVT

201 IGGWSRPL VA FIAFACMYGT TITVVDGYAR AIAEPVRLLR GRDKTGNAE L

251 FAWNIWVAGS GLAVIFWFDG AMAE LLKFAM IAAFVSAPVF AWLNYRLVKG

301 DKRHRLTAGM NA LAIVGLLY LAGFAVLFLL NLTGLLA*

ORF53ng-1和ORF53-1显示在336个氨基酸的重叠区内有94.0％的相同性：

60 70 80 90 100 110

orf53-1.pep ILTNLFKYPFFRFSAHYTLDTGKSLIEGYAEKSRVYLWVFLILCILSATINAGAVAIVTA

:|| ||||||||||| ||||||||||||||

orf53ng-1 KKSCVYLWVFLILCIASATINAGAVAIVTA

10 20 30

120 130 140 150 160 170

orf53-1.pep AIVKMAIPSLMFDAGTVAALIMASCLIILVSGRYRALDRVSKIIIVTLSIATLAAAGIAM

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53ng-1 AIVKMAIPSLMFDAGTVAALIMASCLIILVSGRYRALDRVSKIIIVTLSIATLAAAGIAM

40 50 60 70 80 90

180 190 200 210 220 230

orf53-1.pep SRGMQMQSDFIEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDGI

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53ng-1 SRGMQMQPDFIEPTPWTLAGLGFLIALMGWMPAPIEISAINSLWVTEKQRINPSEYRDGI

100 110 120 130 140 150

240 250 260 270 280 290

orf53-1.pep FDFNVGYIASAVLALVFLALGAFVQYGNGEAVQMAGGKYIGQLINMYAVTIGGWSRPLVA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf53ng-1 FDFNVGYIASAVLALVFLALGAFVQYGNGEAVQMAGGKYIGQLINMYAVTIGGWSRPLVA

160 170 180 190 200 210

300 310 320 330 340 350

orf53-1.pep FIAFACMYGTTITVVDGYARAIAEPVRLLRGKDKTGNAEFFAWNIWVAGSGLAVIFWFDG

|||||||||||||||||||||||||||||||:|||||||:||||||||||||||||||||

orf53ng-1 FIAFACMYGTTITVVDGYARAIAEPVRLLRGRDKTGNAELFAWNIWVAGSGLAVIFWFDG

220 230 240 250 260 270

360 370 380 390 400 410

orf53-1.pep VMANLLKFAMIAAFVSAPVFAWLNYRLVKGDEKHKLTSGMNALALAGLIYLTGFTVLFLL

:||:|||||||||||||||||||||||||||::|:||:||||||::||:||:||:|||||

orf53ng-1 AMAELLKFAMIAAFVSAPVFAWLNYRLVKGDKRHRLTAGMNALAIVGLLYLAGFAVLFLL

280 290 300 310 320 330

orf53-1.pep NLAGMFKX

||:|::

orf53ng-1 NLTGLLAX

根据该分析结果(包括淋球菌蛋白中存在一个推定的前导序列(双划线)和数个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例58

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 487>：

1 ..TTGCGGGAAA CGGCATATGT TTTGGATAGT TTTGATCGTT ATTTTGTTGT

51 TGCGCTTGCC GGCTTGTTTT TTGTCCGCGC ACAATCCGAA CGCGAGTGGA

101 TGCGCGAGGT TTCTGCGTGG CAGGAAAAGA AAGGGGAAAA ACAGGCGGAG

151 CTGCCTGAAA TCAAAGACGG TATGCCCGAT TTTCCCGAAC TTGCCCTGAT

201 GCTTTTCCAC GCCGTCAAAA CGGCAGTGTA TTGGCTGTTT GTCGGTGTCG

251 TCCGTTTCTG CCGAAACTAT CTGGCGCACG AATCCGAACC GGACAGGCCC

301 GTTCCGCCT..

它对应于氨基酸序列<SEQ ID 488；ORF58>：

1 ..LRETAYVLDS FDRYFVVALA GLFFVRAQSE REWMREVSAW QEKKGEKQAE

51 LPEIKDGMPD FPELALML FH AVKTAVYWLF VGVVRFCRNY LAHESEPDRP

101 VPP..

进一步的工作揭示了其完整的核苷酸序列<SEQ ID 489>：

1 ATGTTTTGGA TAGTTTTGAT CGTTATTTTG TTGCTTGCGC TTGCCGGCTT

51 GTTTTTTGTC CGCGCACAAT CCGAACGCGA GTGGATGCGC GAGGTTTCTG

101 CGTGGCAGGA AAAGAAAGGG GAAAAACAGG CGGAGCTGCC TGAAATCAAA

151 GACGGTATGC CCGATTTTCC CGAACTTGCC CTGATGCTTT TCCATGCCGT

201 CAAAACGGCA GTGTATTGGC TGTTTGTCGG TGTCGTCCGT TTCTGCCGAA

251 ACTATCTGGC GCACGAATCC GAACCGGACA GGCCCGTTCC GCCTGCTTCT

301 GCAAACCGTG CGGATGTTCC GACCGCATCC GACGGATATT CAGACAGTGG

351 AAACGGGACG GAAGAAGCGG AAACGGAAGA AGCAGAAGCT GCGGAGGAAG

401 AGGCTGCCGA TACGGAAGAC ATTGCAACTG CCGTAATCGA CAACCGCCGC

451 ATCCCATTCG ACCGGAGTAT TGCTGAAGGG TTGATGCCGT CTGAAAGCGA

501 AATTTCGCCC GTCCGTCCGG TTTTTAAAGA AATCACTTTG GAAGAAGCAA

551 CGCGTGCTTT AAACAGCGCG GCTTTAAGGG AAACGAAAAA ACGCTATATC

601 GATGCATTTG AGAAAAACGA AACAGCGGTC CCCAAAGTCC GCGTGTCCGA

651 TACCCCGATG GAAGGGCTGC AGATTATCGG TTTGGACGAC CCTGTGCTTC

701 AACGCACGTA TTCCCATATG TTCGATGCGG ACAAAGAAGC GTTTTCCGAG

751 TCTGCGGATT ACGGATTTGA GCCGTATTTT GAGAAGCAGC ATCCGTCTGC

801 CTTTTCTGCA GTCAAAGCCG AAAATGCACG GAATGCGCCG TTCCACCGTC

851 ATGCAGGGCA GGGGAAAGGG CAGGCGGAGG CAAAATCCCC GGATGTTTCC

901 CAAGGGCAGT CCGTTTCAGA CGGCACGGCC GTCCGCGATG CCCGCCGCCG

951 CGTTTCCGTC AATTTGAAAG AACCGAACAA GGCAACGGTT TCTGCGGAGG

1001 CGCGAATTTC TCGCCTGATT CCGGAAAGTC AGACGGTTGT CGGGAAACGG

1051 GATGTCGAAA TGCCGTCTGA AACCGAAAAT GTTTTCACGG AAACCGTTTC

1101 GTCTGTGGGA TACGGCGGTC CGGTTTATGA TGAAACTGCC GATATCCATA

1151 TTGAAGAACC TGCCGCGCCC GATGCTTGGG TGGTCGAACC ACCCGAAGTG

1201 CCGAAAGTTC CCATGACCGC AATCGATATT CAGCCGCCGC CTCCCGTATC

1251 GGAAATCTAC AACCGTACCT ATGAACCGCC GTCAGGATTC GAGCAGGTGC

1301 AACGCAGCCG CATTGCCGAG ACCGACCATC TTGCCGATGA TGTTTTGAAT

1351 GGAGGTTGGC AGGAGGAAAC CGCCGCTATT GCGGATGACG GCAGTGAAGG

1401 TGCGGCAGAG CGGTCAAGCG GGCAATATCT GTCGGAAACC GAAGCGTTCG

1451 GGCATGACAG TCAGGCGGTT TGTCCGTTTG AAAATGTGCC GTCTGAACGC

1501 CCGTCCTGCC GGGTATCGGA TACGGAAGCG GATGAAGGGG CGTTCCCATC

1551 TGAAGAAACC GGTGCGGTAT CCGAACACCT GCCGACAACC GACCTGCTTC

1601 TGCCTCCGCT GTTCAATCCC GAGGCGACGC AAACCGAAGA AGAACTGTTG

1651 GAAAACAGCA TCACCATCGA AGAAAAATTG GCGGAGTTCA AAGTCAAGGT

1701 CAAGGTTGTC GATTCTTATT CCGGCCCCGT AATTACGCGT TATGAAATCG

1751 AACCCGATGT CGGCGTGCGC GGCAATTCCG TTCTGAATCT GGAAAAAGAT

1801 TTGGCGCGTT CGCTCGGCGT GGCTTCCATC CGCGTTGTCG AAACCATCCC

1851 CGGCAAAACC TGCATGGGTT TGGAACTTCC GAACCCGAAA CGCCAAATGA

1901 TACGCCTGAG CGAAATCTTC AATTCGCCCG AGTTTGCCGA ATCCAAATCC

1951 AAGCTGACGC TCGCGCTCGG TCAGGACATC ACCGGACAGC CCGTCGTAAC

2001 CGACTTGGGA AAAGCACCGC ATTTGTTGGT TGCCGGCACG ACCGGTTCGG

2051 GCAAATCGGT GGGTGTCAAC GCGATGATTC TGTCTATGCT TTTCAAAGCC

2101 GCGCCGGAAG ACGTGCGTAT GATTATGATC GATCCGAAAA TGCTGGAATT

2151 GAGCATTTAC GAAGGCATCC CGCACCTGCT CGCCCCTGTC GTTACCGATA

2201 TGAAGCTGGC GGCAAACGCG CTGAACTGGT GTGTTAACGA AATGGAAAAA

2251 CGCTACCGCC TGATGAGCTT TATGGGCGTG CGTAATCTTG CGGGCTTCAA

2301 TCAAAAAATC GCCGAAGCCG CAGCAAGGGG AGAAAAAATC GGCAATCCGT

2351 TCAGCCTCAC GCCCGACGAT CCCGAACCTT TGGAAAAACT GCCGTTTATC

2401 GTGGTCGTGG TCGATGAGTT TGCCGACCTG ATGATGACGG CAGGCAAGAA

2451 AATCGAAGAA CTGATTGCCC GCCTCGCCCA AAAAGCCCGC GCGGCAGGCA

2501 TCCATTTGAT TCTTGCCACA CAACGCCCCA GCGTCGATGT CATCACGGGT

2551 CTGATTAAGG CGAACATCCC GACGCGTATC GCGTTCCAAG TGTCCAGCAA

2601 AATCGACAGC CGCACGATTC TCGACCAAAT GGGCGCGGAA AACCTGCTCG

2651 GTCAGGGCGA TATGCTGTTC CTGCTGCCGG GTACTGCCTA TCCGCAGCGC

2701 GTTCACGGCG CGTTTGCCTC GGATGAAGAG GTGCACCGCG TGGTCGAATA

2751 TTTGAAACAG TTTGGCGAAC CGGACTATGT TGACGATATT TTGAGCGGCG

2801 GCGGCAGCGA AGAGCTGCCC GGCATCGGGC GCAGCGGCGA CGACGAAACC

2851 GATCCGATGT ACGACGAGGC CGTATCCGTT GTCCTGAAAA CGCGCAAAGC

2901 CAGCATTTCG GGCGTACAGC GCGCCTTGCG TATCGGCTAC AACCGCGCCG

2951 CGCGTCTGAT TGACCAGATG GAGGCGGAAG GCATTGTGTC CGCACCGGAA

3001 CACAACGGCA ACCGTACGAT TCTCGTCCCC TTGGACAATG CTTGA

它对应于氨基酸序列<SEQ ID 490；ORF58-1>：

1 MFWIVLIVIL LLALAGLFFV RAQSEREWMR EVSAWQEKKG EKQAELPEIK

51 DGMPDFPELA LM LFHAVKTA VYWLFVGVVR FCRNYLAHES EPDRPVPPAS

101 ANRADVPTAS DGYSDSGNGT EEAETEEAEA AEEEAADTED IATAVIDNRR

151 IPFDRSIAEG LMPSESEISP VRPVFKEITL EEATRALNSA ALRETKKRYI

201 DAFEKNETAV PKVRVSDTPM EGLQIIGLDD PVLQRTYSHM FDADKEAFSE

251 SADYGFEPYF EKQHPSAFSA VKAENARNAP FHRHAGQGKG QAEAKSPDVS

301 QGQSVSDGTA VRDARRRVSV NLKEPNKATV SAEARISRLI PESQTVVGKR

351 DVEMPSETEN VFTETVSSVG YGGPVYDETA DIHIEEPAAP DAWVVEPPEV

401 PKVPMTAIDI QPPPPVSEIY NRTYEPPSGF EQVQRSRIAE TDHLADDVLN

451 GGWQEETAAI ADDGSEGAAE RSSGQYLSET EAFGHDSQAV CPFENVPSER

501 PSCRVSDTEA DEGAFPSEET GAVSEHLPTT DLLLPPLFNP EATQTEEELL

551 ENSITIEEKL AEFKVKVKVV DSYSGPVITR YEIEPDVGVR GNSVLNLEKD

601 LARSLGVASI RVVETIPGKT CMGLELPNPK RQMIRLSEIF NSPEFAESKS

651 KLTLALGQDI TGQPVVTDLG KAPHLLVAGT TGSGKSVGVN AMILSMLFKA

701 APEDVRMIMI DPKMLELSIY EGIPHLLAPV VTDMKLAANA LNWCVNEMEK

751 RYRLMSFMGV RNLAGFNQKI AEAAARGEKI GNPFSLTPDD PEPLEK LPFI

801 VVVVDEFADL MMTAGKKIEE LIARLAQKAR AAGIHLILAT QRPSVDVITG

851 LIKANIPTRI AFQVSSKIDS RTILDQMGAE NLLGQGDMLF LLPGTAYPQR

901 VHGAFASDEE VHRVVEYLKQ FGEPDYVDDI LSGGGSEELP GIGRSGDDET

951 DPMYDEAVSV VLKTRKASIS GVQRALRIGY NRAARLIDQM EAEGIVSAPE

1001 HNGNRTILVP LDNA*

对该氨基酸序列的计算机分析预计了指定的跨膜区，并给出下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF58显示与脑膜炎奈瑟球菌菌株A的ORF(ORF58a)在重叠的89个氨基酸内有96.6％的相同性：

10 20 30 40 50 60

orf58.pep LRETAYVLDSFDRYFVV ALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPD

::: |||||||||||| |||||||||||||||||||||||||||||||

orf58a MFWIVLIVILLLALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPD

10 20 30 40 50

70 80 90 100

orf58.pep FPELALM LFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPP

||||||| ||||||||||||||||| |||||||||||||||||||

orf58a FPELALM LFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPPASANRADVPTASDGYSD

60 70 80 90 100 110

全长ORF58a核苷酸序列<SEQ ID 491>是：

1 ATGTTTTGGA TAGTTTTGAT CGTTATTTTG TTGCTTGCGC TTGCCGGCTT

51 GTTTTTTGTC CGCGCACAAT CCGAACGCGA GTGGATGCGC GAGGTTTCTG

101 CGTGGCAGGA AAAGAAAGGG GAAAAACAGG CGGAGCTGCC TGAAATCAAA

151 GACGGTATGC CCGATTTTCC CGAACTTGCC CTGATGCTTT TCCATGCCGT

201 CAAAACGGCA GTGTATTGGC TGTTTGTCGG TGTCGTCCGT TTCTGCCGAA

251 ACTATCTGGC GCACGAATCC GAACCGGACA GGCCCGTTCC GCCTGCTTCT

301 GCAAATCGTG CGGATGTTCC GACCGCATCC GACGGATATT CAGACAGTGG

351 AAACGGGACG GAAGAAGCGG AAACGGAAGA AGCAGAAGCT GCGGAGGAAG

401 AGGCTGCCGA TACGGAAGAC ATTGCAACTG CCGTAATCGA CAACCGCCGC

451 ATCCCATTCG ACCGGAGTAT TGCTGAAGGG TTGATGCCGT CTGAAAGCGA

501 AATTTCGCCC GTCCGTCCGG TTTTTAAGGA AATCACTTTG GAAGAAGCAA

551 CGCGTGCTTT AAACAGCGCG GCTTTAAGGG AAACGAAAAA ACGCTATATC

601 GATGCATTTG AGAAAAACGA AACAGCGGTC CCCAAAGTCC GCGTGTCCGA

651 TACCCCGATG GAAGGGCTGC AGATTATCGG TTTGGACGAC CCTGTGCTTC

701 AACGCACGTA TTCCCGTATG TTCGATGCGG ACAAAGAAGC GTTTTCCGAG

751 TCTGCGGATT ACGGATTTGA GCCGTATTTT GAGAAGCAGC ATCCGTCTGC

801 CTTTTCTGCA GTCAAAGCCG AAAATGCACG GAATGCGCCG TTCCGCCGTC

851 ATGCAGGGCA GGGNAAAGGG CAGGCGGAGG CNAAATCCCC GGATGTTTCC

901 CAAGGGCAGT CCGTTTCAGA CGGCACAGCC GTCCGCGATG CCNGCCGCCG

951 CGTTTCCGTC AATTTGAAAG AACCGAACAA GGCAACGGTT TCTGCGGAGG

1001 CGCGGATTTC GCGCCTGATT CCGGAAAGTC GGACGGTTGT CGGGAAACGG

1051 GATGTCGAAA TGCCGTCTGA AACCGAAAAT GTTTTCACGG AAANTGTTTC

1101 GTCTGTGGGA TACGGCGNTC CGGTTTATGA TGAAACTGCC GATATCCATA

1151 TTGAAGAACC TGCCGCGCCC GATGCTTGGG TGGTCGAACC ACCCGAAGTG

1201 CCGAAAGTTC CCATGCCCGC AATNGATATT CCGCCGCCGC CTCCCGTATC

1251 GGAAATCTAC AACCGTACCT ATGAACCGCC GGCAGGATTC GAGCAGGTGC

1301 AACGCAGCCG CATTGCCGAA ACCGATCATC TTGCCGATGA TGTTTTGAAT

1351 GGAGGTTGGC AGGAGGAAAC CGCCGCTATT GCGAATGACG GCAGTGAGGG

1401 TGTGGCAGAG CGGTCAAGCG GGCAATATTT GTCGGAAACC GAAGCGTTCG

1451 GGCATGACAG TCAGGCGGTT TGTCCGTTTG AAAATGTGCC GTCTGAACGC

1501 CCGTCCCGCC GGGCATNGGA TACGGAAGCG GATGAAGGGG CGTTCCAATC

1551 TGAAGAAACC GGTGCGGTAT CCGAACACCT GCCGACAACC GACCTGCTTC

1601 TGCCGCCGCT GTTCAATCCC GGGGCGACGC AAACCGAAGA AGANCTGTTG

1651 GANAACAGCA TCACCATCGA AGAAAAATNG GCGGAGTTCA AAGTCAAGGT

1701 CAAGGTTGTC GATTCTTATT CCGGCCCCGT GATTACGCGT TATGAAATCG

1751 AACCCGATGT CGGCGTGCGC GGCAATTCCG TTCTAAATCT GGAAAAAGAN

1801 TTGGCGCGTT CGCTCGGCGT GGCTTCCATC CGCGTTGTCG AAACCATCCT

1851 CGGCAAAACC TGTATGGGTT TGGAACTTCC GAACCCGAAA CGCCAAATGA

1901 TACGCCTGAG CGAAATCTTC AATTCGCCCG AGTTTGCCGA ATCCAAATCC

1951 AAGCTGACGC TCGCGCTCGG TCAGGACATC ACCGGACAGC CCGTCGTAAC

2001 CGACTTGGGC AAAGCACCGC ATTTGTTGGT TGCCGGCACG ACCGGTTCGG

2051 GCAAATCGGT GGGTGTCAAC GCGATGATTC TGTCTATGCT TTTCAAAGCC

2101 GCGCCGGAAG ACGTGCGTAT GATTATGATC GATCCGAAAA TGCTGGAATT

2151 GAGCATTTAC GAAGGCATCC CGCACCTGCT CGCCCCTGTC GTTACCGATA

2201 TGAAGCTGGC GGCAAACGCG CTGAACTGGT GTGTTAACGA AATGGAAAAA

2251 CGCTACCGCC TGATGAGCTT TATGGGCGTG CGCAATCTTG CGGGTNTCAA

2301 TCAAAAAATC GCCGAAGCCG CAGCAAGGGG GGAGAAAATC GGCAACCCGT

2351 TCAGCCTCAC GCCCGACAAT CCCGAACCTT TGGANAAATT GCCGTTTATC

2401 GTGGTCGTGG TTGATGAGTT TGCCGACCTG ATGATGACGG CAGGCAAGAA

2451 AATCGAAGAA CTGATTGCCC GCCTCGCCCA AAAAGCCCGC GCGGCAGGCA

2501 TCCATCTTAT CCTTGCCACA CAACGCCCCA GTGTCGATGT CATCACGGGT

2551 CTGATTAAGG CGAACATCCC GACGCGTATC GCGTTCCAAG TGTCCAGCAA

2601 AATCGACAGC CGCACGATTC TTGACCAAAT GGGTGCGGAA AACCTGCTCG

2651 GGCAGGGCGA TATGCTGTTC CTGCCGCCGG GTACGGCCTA TCCGCAGCGC

2701 GTTCACGGCG CGTTTGCCTC GGATGAAGAG GTGCACCGCG TGGTCGAATA

2751 TCTGAAACAG TTTGGCGAAC CGGACTATGT TGACGATATN TTGAGCGGCG

2801 GTATGTCCGA CGATTTGCTG GGAATCAGCC GGAGCGGCGA CGGCGAAACC

2851 GATCCGATGT ACGACGAGGC CGTGTCNGTT GTTTTGAAAA CGCGCAAAGC

2901 CAGCATTTCT GGCGTGCAGC GCGCATTGCG TATCGGCTAT AATCGCGCCG

2951 CGCGTCTGAT TGACCAGATG GAGGCGGAAG GCATTGTGTC CGCACCGGAA

3001 CACAACGGCA ACCGTACGAT TCTCGTCCCC TTNGACAATG CTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 492>：

1 MFWIVLIVIL LLALAGLFFV RAQSEREWMR EVSAWQEKKG EKQAELPEIK

51 DGMPDFPELA LM LFHAVKTA VYWLFVGVVR FCRNYLAHES EPDRPVPPAS

101 ANRADVPTAS DGYSDSGNGT EEAETEEAEA AEEEAADTED IATAVIDNRR

151 IPFDRSIAEG LMPSESEISP VRPVFKEITL EEATRALNSA ALRETKKRYI

201 DAFEKNETAV PKVRVSDTPM EGLQIIGLDD PVLQRTYSRM FDADKEAFSE

251 SADYGFEPYF EKQHPSAFSA VKAENARNAP FRRHAGQGKG QAEAKSPDVS

301 QGQSVSDGTA VRDAXRRVSV NLKEPNKATV SAEARISRLI PESRTVVGKR

351 DVEMPSETEN VFTEXVSSVG YGXPVYDETA DIHIEEPAAP wDAWVVEPPEV

401 PKVPMPAXDI PPPPPVSEIY NRTYEPPAGF EQVQRSRIAE TDHLADDVLN

451 GGWQEETAAI ANDGSEGVAE RSSGQYLSET EAFGHDSQAV CPFENVPSER

501 PSRRAXDTEA DEGAFQSEET GAVSEHLPTT DLLLPPLFNP GATQTEEXLL

551 XNSITIEEKX AEFKVKVKVV DSYSGPVITR YEIEPDVGVR GNSVLNLEKX

601 LARSLGVASI RVVETILGKT CMGLELPNPK RQMIRLSEIF NSPEFAESKS

651 KLTLALGQDI TGQPVVTDLG KAPHLLVAGT TGSGKSVGVN AMILSMLFKA

701 APEDVRMIMI DPKMLELSIY EGIPHLLAPV VTDMKLAANA LNWCVNEMEK

751 RYRLMSFMGV RNLAGXNQKI AEAAARGEKI GNPFSLTPDN PEPLXK LPFI

801 VVVVDEFADL MMTAGKKIEE LIARLAQKAR AAGIHLILAT QRPSVDVITG

851 LIKANIPTRI AFQVSSKIDS RTILDQMGAE NLLGQGDMLF LPPGTAYPQR

901 VHGAFASDEE VHRVVEYLKQ FGEPDYVDDX LSGGMSDDLL GISRSGDGET

951 DPMYDEAVSV VLKTRKASIS GVQRALRIGY NRAARLIDQM EAEGIVSAPE

1001 HNGNRTILVP XDNA*

ORF58a和ORF58-1显示在1014个氨基酸的重叠区内有96.6％的相同性：

10 20 30 40 50 60

orf58a.pep MFWIVLIVILLLALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPDFPELA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58-1 MFWIVLIVILLLALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPDFPELA

10 20 30 40 50 60

70 80 90 100 110 120

orf58a.pep LMLFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPPASANRADVPTASDGYSDSGNGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58-1 LMLFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPPASANRADVPTASDGYSDSGNGT

70 80 90 100 110 120

130 140 150 160 170 180

orf58a.pep EEAETEEAEAAEEEAADTEDIATAVIDNRRIPFDRSIAEGLMPSESEISPVRPVFKEITL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58-1 EEAETEEAEAAEEEAADTEDIATAVIDNRRIPFDRSIAEGLMPSESEISPVRPVFKEITL

130 140 150 160 170 180

190 200 210 220 230 240

orf58a.pep EEATRALNSAALRETKKRYIDAFEKNETAVPKVRVSDTPMEGLQIIGLDDPVLQRTYSRM

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf58-1 EEATRALNSAALRETKKRYIDAFEKNETAVPKVRVSDTPMEGLQIIGLDDPVLQRTYSHM

190 200 210 220 230 240

250 260 270 280 290 300

orf58a.pep FDADKEAFSESADYGFEPYFEKQHPSAFSAVKAENARNAPFRRHAGQGKGQAEAKSPDVS

|||||||||||||||||||||||||||||||||||||||||:||||||||||||||||||

orf58-1 FDADKEAFSESADYGFEPYFEKQHPSAFSAVKAENARNAPFHRHAGQGKGQAEAKSPDVS

250 260 270 280 290 300

310 320 330 340 350 360

orf58a.pep QGQSVSDGTAVRDAXRRVSVNLKEPNKATVSAEARISRLIPESRTVVGKRDVEMPSETEN

|||||||||||||| ||||||||||||||||||||||||||||:||||||||||||||||

orf58-1 QGQSVSDGTAVRDARRRVSVNLKEPNKATVSAEARISRLIPESQTVVGKRDVEMPSETEN

310 320 330 340 350 360

370 380 390 400 410 420

orf58a.pep VFTEXVSSVGYGXPVYDETADIHIEEPAAPDAWVVEPPEVPKVPMPAXDIPPPPPVSEIY

||||:||||||| |||||||||||||||||||||||||||||||| | || |||||||||

orf58-1 VFTETVSSVGYGGPVYDETADIHIEEPAAPDAWVVEPPEVPKVPMTAIDIQPPPPVSEIY

370 380 390 400 410 420

430 440 450 460 470 480

orf58a.pep NRTYEPPAGFEQVQRSRIAETDHLADDVLNGGWQEETAAIANDGSEGVAERSSGQYLSET

|||||||:|||||||||||||||||||||||||||||||||:|||||:||||||||||||

orf58-1 NRTYEPPSGFEQVQRSRIAETDHLADDVLNGGWQEETAAIADDGSEGAAERSSGQYLSET

430 440 450 460 470 480

490 500 510 520 530 540

orf58a.pep EAFGHDSQAVCPFENVPSERPSRRAXDTEADEGAFQSEETGAVSEHLPTTDLLLPPLFNP

|||||||||||||||||||||| |: ||||||||| ||||||||||||||||||||||||

orf58-1 EAFGHDSQAVCPFENVPSERPSCRVSDTEADEGAFPSEETGAVSEHLPTTDLLLPPLFNP

490 500 510 520 530 540

550 560 570 580 590 600

orf58a.pep GATQTEEXLLXNSITIEEKXAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKX

|||||| || |||||||| |||||||||||||||||||||||||||||||||||||||

orf58-1 EATQTEEELLENSITIEEKLAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKD

550 560 570 580 590 600

610 620 630 640 650 660

orf58a.pep LARSLGVASIRVVETILGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDI

|||||||||||||||| |||||||||||||||||||||||||||||||||||||||||||

orf58-1 LARSLGVASIRVVETIPGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDI

610 620 630 640 650 660

670 680 690 700 710 720

orf58a.pep TGQPVVTDLGKAPHLLVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58-1 TGQPVVTDLGKAPHLLVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIY

670 680 690 700 710 720

730 740 750 760 770 780

orf58a.pep EGIPHLLAPVVTDMKLAANALNWCVNEMEKRYRLMSFMGVRNLAGXNQKIAEAAARGEKI

||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||||

orf58-1 EGIPHLLAPVVTDMKLAANALNWCVNEMEKRYRLMSFMGVRNLAGFNQKIAEAAARGEKI

730 740 750 760 770 780

790 800 810 820 830 840

orf58a.pep GNPFSLTPDNPEPLXKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILAT

|||||||||:|||| |||||||||||||||||||||||||||||||||||||||||||||

orf58-1 GNPFSLTPDDPEPLEKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILAT

790 800 810 820 830 840

850 860 870 880 890 900

orf58a.pep QRPSVDVITGLIKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLPPGTAYPQR

||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf58-1 QRPSVDVITGLIKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLLPGTAYPQR

850 860 870 880 890 900

910 920 930 940 950 960

orf58a.pep VHGAFASDEEVHRVVEYLKQFGEPDYVDDXLSGGMSDDLLGISRSGDGETDPMYDEAVSV

||||||||||||||||||||||||||||| |||| |::| ||:|||| ||||||||||||

orf58-1 VHGAFASDEEVHRVVEYLKQFGEPDYVDDILSGGGSEELPGIGRSGDDETDPMYDEAVSV

910 920 930 940 950 960

970 980 990 1000 1010

orf58a.pep VLKTRKASISGVQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVPXDNAX

|||||||||||||||||||||||||||||||||||||||||||||||||| ||||

orf58-1 VLKTRKASISGVQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVPLDNAX

970 980 990 1000 1010

与淋病奈瑟球菌的预计ORF的同源性

ORF58显示出与淋病奈瑟球菌的预计ORF(ORF58ng)的9个氨基酸重叠区完全相同：

orf58.pep ALMLFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPP 103

|||||||||

orf58ng SEPDRPVPPASANRADVPTASDGYSDSGNG 30

预计ORF58ng核苷酸序列<SEQ ID 493>编码的蛋白质具有部分氨基酸序列

<SEQ ID 494>：

1 ..SEPDRPVPPA 8ANRADVPTA SDGYSDSGNG TEEAETEAAE AAEEEAADTE

51 DIATAVIDNR RIPFDRSIAE GLMQSESKTS PVRPVFKEIT LEEATRALSS

101 AALRETKKRY IDAFEKNGTA VPKVRVSDTP MEGLQIIGLD DPVLQRTYSR

151 MFDADKEAFS ESADYGFEPY FEKQHPSAFS AVKAENARNA PFRRHAGQEK

201 GQAEAKSPDV SQGQSVSDGT AVRDARRRVS VNLKEPNKAT VSAEARISRL

251 IPESRTVVGK RDVEMPSETE NVFTETVSSV GYGGPVYDEA ADIHIEEPAA

301 PDAWVVEPPE VPEVAVPEID ILPPPPVSEI YNRTYEPPAG FEQAQRSRIA

351 ETDHLAADVL NGGWQEETAA IADDGSEGAA ERSSGQYLSE TEAFGHDSQA

401 VCPFEDVPSE RPSCRVSDTE ADEGAFQSEE TGAVSEHLPT TDLLLPPLFN

451 PEATQTEEEL LENSITIEEK LAEFKVKVKV VDSYSGPVIT RYEIEPDVGV

501 RGNSVLNLEK DLARSLGVAS IRVVETIPGK TCMGLELPNP KRQMIRLSEI

551 FNSPEFAESK 8KLTLALGQD ITGQPVVTDL GKAPHLLVA

VGV

601 NAMILSMLFK AAPEDVRMIM IDPKMLELSI YEGITHLLAP VVTDMKLAAN

651 ALNWCVNEME KRYRLMSFMG VRNLAGFNQK IAEAAARGEK IGNPFSLTPD

701 DPEPLEK LPF IVVVVDEFAD LMMTAGKKIE ELIARLAQKA RAAGIHLILA

751 TQRPSVDVIT GLIKANIPTR IAFQVSSKID SRTILDQMGA ENLLGQGDML

801 FLPPGTAYPQ RVHGAFASDE EVHRVVEYLK QFGEPDYVDD ILSGGGSEEL

851 PGIGRSGDGE TDPMYDEAVS VVLKTRKASI SGVQRALRIG YNRAARLIDQ

901 MEAEGIVSAP EHNGNRTILV PLDNA*

该部分淋球菌序列含有一个预计的跨膜区和一个预计的ATP/GTP-结合位点基序A(P-环；双划线)。另外，它具有一个与大肠杆菌的FTSK细胞分裂蛋白同源的结构域。将ORF58ng和Ftsk(登录号p46889)作序列对比，结果显示在459个氨基酸重叠区内有65％的氨基酸相同性：

ORF58ng： 467 IEEKLAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKDLARSLGVASIRVVET 526

+E +LA+F++K VV+ GPVITR+E+ GV+ + NL +DLARSL ++RVVE

FtsK： 868 VEARLADFRIKADVVNYSPGPVITRFELNLAPGVKAARISNLSRDLARSLSTVAVRVVEV 927

ORF58ng： 527 IPGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDITGQPVVTDLGKAPHL 586

IPGK +GLELPN KRQ + L E+ ++ +F ++ S LT+ LG+DI G+PVV DL K PHL

FtsK： 928 IPGKPYVGLELPNKKRQTVYLREVLDNAKFRDNPSPLTVVLGKDIAGEPVVADLAKMPHL 987

ORF58ng： 587 LVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIYEGITHLLAPVVTDMK 646

LVAGTTGSGKSVGVNAMILSML+KA PEDVR IMIDPKMLELS+YEGI HLL VVTDMK

FtsK： 988 LVAGTTGSGKSVGVNAMILSMLYKAQPEDVRFIMIDPKMLELSVYEGIPHLLTEVVTDMK 1047

ORF58ng： 647 LAANALNWCVNEMEKRYRLMSFMGVRNLAGFNQKIAEAAARGEKIGNPFSLTPDDPEP-- 704

AANAL WCVNEME+RY+LMS +GVRNLAG+N+KIAEA I +P+ D +

FtsK： 1048 DAANALRWCVNEMERRYKLMSALGVRNLAGYNEKIAEADRMMRPIPDPYWKPGDSMDAQH 1107

ORF58ng： 705 --LEKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILATQRPSVDVITGL 762

L+K P+IVV+VDEFADLMMT GKK+EELIARLAQKARAAGIHL+LATQRPSVDVITGL

FtsK： 1108 PVLKKEPYIVVLVDEFADLMMTVGKKVEELIARLAQKARAAGIHLVLATQRPSVDVITGL 1167

ORF58ng： 763 IKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLPPGTAYPQRVHGAFASDEEV 822

IKANIPTRIAF VSSKIDSRTILDQ GAE+LLG GDML+ P + P RVHGAF D+EV

FtsK： 1168 IKANIPTRIAFTVSSKIDSRTILDQAGAESLLGMGDMLYSGPNSTLPVRVHGAFVRDQEV 1227

0RF58ng： 823 HRVVEYLKQFGEPDYVDDILSGGGSEELPGIGRSGDGETDPMYDEAVSVVLKTRKASISG 882

H VV+ K G P YVD I S SE G G G E DP++D+AV V + RKASISG

FtsK： 1228 HAVVQDWKARGRPQYVDGITSDSESEGGAG-GFDGAEELDPLFDQAVQFVTEKRKASISG 1286

ORF58ng： 883 VQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVP 921

VQR RIGYNRAAR+I+QMEA+GIVS HNGNR+L P

FtsK： 1287 VQRQFRIGYNRAARIIEQMEAQGIVSEQGHNGNREVLAP 1325

对ORF58ng作进一步工作揭示了其完整的淋球菌DNA序列<SEQ ID 495>是：

1 ATGTTTTGGA TAGTTTTGAT CGTTATtgtg TTGCTTGCGC TTGCCGGCCT

51 GTTTTTTGTC CGCGCACAAT CCGAACGCGA GTGGATGCGC GAGGTTTCTG

101 CGTGGCAGGA AAAGAAAGGG GAAAAACAGG CGGAGCTGCC TGAAATCAAA

151 GACGGTATGC CCGATTTTCC CGAGTTTTCC CTGATGCTTT TCCATGCCGT

201 CAAAACGGCA GTGTATTGGC TGTTTGTCGG TGTCGTCCGT TTCTGCCGAA

251 ACTATCTGGC GCACGAATCC GAACCGGACA GGCCCGTTCC GCCTGCTTCT

301 GCAAACCGTG CGGATGTTCC GACCGCATCC GACGGGTATT CAGACAGTGG

351 AAACGGGACG GAAGAAGCGG AAACGGAAGC AGCAGAAGCT GCGGAGGAAG

401 AGGCTGCCgA TACgGAAGAC ATTGCAACTG CCGTAATCGA CAACCGCCGC

451 ATCCcatTCG ACCGGAGTAT TGCTGAAGGG TTGATGCAGT CTGAAAGCAA

501 AACTTCGCCC GTCCGTCCGG TTTTTAAGGA AATCACTTTG GAAGAAGCAA

551 CGCGTGCTTT AAGCAGCGCG GCTTTAAGGG AAACGAAAAA ACGCTATATC

601 GATGCATTTG AGAAAAACGG AACAGCCGTC CCCAAAGTAC GCGTGTCCGA

651 TACCCCGATG GAAGGGCTGC AGATTATCGG TTTGGACGAC CCTGTGCTTC

701 AACGCACGTA TTCCCGTATG TTTGATGCGG ACAAAGAAGC GTTTTCCGAG

751 TCTGCGGATT ACGGATTTGA GCCGTATTTT GAGAAGCAGC ATCCGTCTGC

801 CTTTTCTGCA GTCAAAGCCG AAAATGCACG GAATGCGCCG TTCCGCCGTC

851 ATGCAGGGCA GGAGAAAGGG CAGGCGGAGG CAAAATCCCC GGATGTTTCC

901 CAAGGGCAGT CCGTTTCAGA CGGCACAGCC GTCCGCGATG CCCGCCGCCG

951 CGTTTCCGTC AATTTGAAAG AACCGAACAA GGCAACGGTT TCTGCGGAGG

1001 CGCGGATTTC GCGCCTGATT CCGGAAAGTC GGACGGTTGT CGGGAAACGG

1051 GATGTCGAAA TGCCGTCTGA AACCGAAAAT GTTTTCACGG AAACCGTTTC

1101 GTCTGTGGGA TACGGCGGTC CGGTTTATGA TGAAGCTGCC GATATCCATA

1151 TTGAAGAGCC TGCCGCGCCC GATGCTTGGG TGGTCGAACC ACCCGAAGTG

1201 CCGGAGGTAG CCGTACCCGA AATCGATATT CTGCCGCCGC CTCCCGTATC

1251 GGAAATCTAC AACCGTACCT ATGAGCCGCC GGCAGGATTC GAGCAGGCGC

1301 AACGCAGCCG CATTGCCGAA ACCGACCATC TTGCCGCTGA TGTTTTGAAT

1351 GGAGGTTGGC AGGAGGAAAC CGCCGCTATT GCAGATGACG GCAGTGAGGG

1401 TGCGGCAGAG CGGTCAAGCG GGCAATATCT GTCGGAAACC GAAGCGTTCG

1451 GGCATGACAG TCAGGCGGTT TGTCCGTTTG AAGATGTGCC GTCTGAACGC

1501 CCGTCCTGCC GGGTATCGGA TACGGAAGCG GATGAAGGGG CGTTCCAATC

1551 GGAAGAGACC GGTGCGGTAT CCGAACACCT GCCGACAACC GACCTGCTTC

1601 TGCCTCCGCT GTTCAATCCC GAGGCGACGC AAACCGAAGA AGAACTGTTG

1651 GAAAACAGCA TCACCATCGA AGAAAAATTG GCGGAGTTCA AAGTCAAGGT

1701 CAAGGTTGTC GATTCTTATT CCGGCCCCGT GATTACGCGT TATGAAATCG

1751 AACCCGATGT CGGCGTGCGC GGCAATTCCG TTCTGAATTT GGAAAAAGAC

1801 TTGGCGCGTT CGCTCGGCGT GGCTTCCATC CGCGTTGTCG AAACCATCCC

1851 CGGCAAAACC TGCATGGGTT TGGAACTTCC GAACCCGAAA CGCCAAATGA

1901 TACGCCTGAG CGAAATTTTC AATTCGCCCG AGTTTGCCGA ATCCAAATCC

1951 AAGCTGACGC TCGCGCTCGG TCAGGACATT ACCGGACAGC CCGTCGTAAC

2001 CGACTTGGGC AAAGCACCGC ATTTGCTGGT TGCCGGCACG ACCGGTTCGG

2051 GCAAATCGGT GGGTGTCAAC GCGATGATTC TGTCTATGCT TTTCAAAGCC

2101 GCGCCGGAAG ACGTGCGTAT GATTATGATC GATCCGAAAA TGCTGGAATT

2151 GAGCATTTAC GAAGGCATCA CGCACCTGCT CGCCCCTGTC GTTACCGATA

2201 TGAAGCTGGC GGCAAACGCG CTGAACTGGT GTGTTAACGA AATGGAAAAA

2251 CGCTACCGCC TGATGAGCTT TATGGGCGTG CGCAATCTTG CGGGCTTCAA

2301 CCAAAAAATC GCCGAAGCCG CAGCAAGGGG AGAAAAAATC GGCAATCCGT

2351 TCAGCCTCAC GCCCGACGAT CCCGAACCTT TGGAAAAACT GCCGTTTATC

2401 GTGGTCGTGG TCGATGAGTT TGCCGATTTG ATGATGACGG CAGGCAAGAA

2451 AATCGAAGAA CTGATTGCGC GCCTCGCCCA AAAAGCCCGC GCGGCAGGCA

2501 TCCACCTTAT CCTTGCCACA CAACGCCCCA GCGTCGATGT CATCACGGGT

2551 CTGATTAAGG CGAACATCCC GACGCGTATC GCGTTCCAAG TGTCCAGCAA

2601 AATCGACAGC CGCACGATTC TCGACCAAAT GGGCGCGGAA AACCTGCTCG

2651 GTCAGGGCGA TATGCTGTTC CTGCCGCCGG GTACTGCCTA TCCGCAGCGC

2701 GTTCACGGCG CGTTTGCCTC GGATGAAGAG GTGCACCGCG TGGTCGAATA

2751 TCTGAAGCAG TTTGGCGAGC CGGACTATGT TGACGATATT TTGAGCGGCG

2801 GCGGCAGCGA AGAGCTGCCC GGCATCGGGC GCAGCGGCGA CGGCGAAACC

2851 GATCCGATGT ACGACGAGGC CGTATCCGTT GTCCTGAAAA CGCGCAAAGC

2901 CAGCATTTCG GGCGTACAGC GCGCCTTGCG CATCGGCTAC AACCGCGCCG

2951 CGCGTCTGAT TGACCAAATG GAAGCGGAAG GCATTGTGTC CGCACCGGAA

3001 CACAACGGCA ACCGTACGAT TCTCGTCCCC TTGGACAATG CTTGA

它对应于氨基酸序列<SEQ ID 496；ORF58ng-1>：

1 MFWIVLIVIV LLALAGLFFV RAQSEREWMR EVSAWQEKKG EKQAELPEIK

51 DGMPDFPEFS LM LFHAVKTA VYWLFVGVVR FCRNYLAHES EPDRPVPPAS

101 ANRADVPTAS DGYSDSGNGT EEAETEAAEA AEEEAADTED IATAVIDNRR

151 IPFDRSIAEG LMQSESKTSP VRPVFKEITL EEATRALSSA ALRETKKRYI

201 DAFEKNGTAV PKVRVSDTPM EGLQIIGLDD PVLQRTYSRM FDADKEAFSE

251 SADYGFEPYF EKQHPSAFSA VKAENARNAP FRRHAGQEKG QAEAKSPDVS

301 QGQSVSDGTA VRDARRRVSV NLKEPNKATV SAEARISRLI PESRTVVGKR

351 DVEMPSETEN VFTETVSSVG YGGPVYDEAA DIHIEEPAAP DAWVVEPPEV

401 PEVAVPEIDI LPPPPVSEIY NRTYEPPAGF EQAQRSRIAE TDHLAADVLN

451 GGWQEETAAI ADDGSEGAAE RSSGQYLSET EAFGHDSQAV CPFEDVPSER

501 PSCRVSDTEA DEGAFQSEET GAVSEHLPTT DLLLPPLFNP EATQTEEELL

551 ENSITIEEKL AEFKVKVKVV DSYSGPVITR YEIEPDVGVR GNSVLNLEKD

601 LARSLGVASI RVVETIPGKT CMGLELPNPK RQMIRLSEIF NSPEFAESKS

651 KLTLALGQDI TGQPVVTDLG KAPHLLVAGT TGSGKSVGVN AMILSMLFKA

701 APEDVRMIMI DPKMLELSIY EGITHLLAPV VTDMKLAANA LNWCVNEMEK

751 RYRLMSFMGV RNLAGFNQKI AEAAARGEKI GNPFSLTPDD PEPLEK LPFI

801 VVVVDEFADL MMTAGKKIEE LIARLAQKAR AAGIHLILAT QRPSVDVITG

851 LIKANIPTRI AFQVSSKIDS RTILDQMGAE NLLGQGDMLF LPPGTAYPQR

901 VHGAFASDEE VHRVVEYLKQ FGEPDYVDDI LSGGGSEELP GIGRSGDGET

951 DPMYDEAVSV VLKTRKASIS GVQRALRIGY NRAARLIDQM EAEGIVSAPE

1001 HNGNRTILVP LDNA*

ORF58ng-1和ORF58-1显示在1014个氨基酸的重叠区内有97.2％的相同性：

10 20 30 40 50 60

orf58-1.pep MFWIVLIVILLLALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPDFPELA

|||||||||:||||||||||||||||||||||||||||||||||||||||||||||||::

orf58ng-1 MFWIVLIVIVLLALAGLFFVRAQSEREWMREVSAWQEKKGEKQAELPEIKDGMPDFPEFS

10 20 30 40 50 60

70 80 90 100 110 120

orf58-1.pep LMLFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPPASANRADVPTASDGYSDSGNGT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 LMLFHAVKTAVYWLFVGVVRFCRNYLAHESEPDRPVPPASANRADVPTASDGYSDSGNGT

70 80 90 100 110 120

130 140 150 160 170 180

orf58-1.pep EEAETEEAEAAEEEAADTEDIATAVIDNRRIPFDRSIAEGLMPSESEISPVRPVFKEITL

|||||| ||||||||||||||||||||||||||||||||||| |||: ||||||||||||

orf58ng-1 EEAETEAAEAAEEEAADTEDIATAVIDNRRIPFDRSIAEGLMQSESKTSPVRPVFKEITL

130 140 150 160 170 180

190 200 210 220 230 240

orf58-1.pep EEATRALNSAALRETKKRYIDAFEKNETAVPKVRVSDTPMEGLQIIGLDDPVLQRTYSHM

|||||||:|||||||||||||||||| |||||||||||||||||||||||||||||||:|

orf58ng-1 EEATRALSSAALRETKKRYIDAFEKNGTAVPKVRVSDTPMEGLQIIGLDDPVLQRTYSRM

190 200 210 220 230 240

250 260 270 280 290 300

orf58-1.pep FDADKEAFSESADYGFEPYFEKQHPSAFSAVKAENARNAPFHRHAGQGKGQAEAKSPDVS

|||||||||||||||||||||||||||||||||||||||||:||||| ||||||||||||

orf58ng-1 FDADKEAFSESADYGFEPYFEKQHPSAFSAVKAENARNAPFRRHAGQEKGQAEAKSPDVS

250 260 270 280 290 300

310 320 330 340 350 360

orf58-1.pep QGQSVSDGTAVRDARRRVSVNLKEPNKATVSAEARISRLIPESQTVVGKRDVEMPSETEN

|||||||||||||||||||||||||||||||||||||||||||:||||||||||||||||

orf58ng-1 QGQSVSDGTAVRDARRRVSVNLKEPNKATVSAEARISRLIPESRTVVGKRDVEMPSETEN

310 320 330 340 350 360

370 380 390 400 410 420

orf58-1.pep VFTETVSSVGYGGPVYDETADIHIEEPAAPDAWVVEPPEVPKVPMTAIDIQPPPPVSEIY

||||||||||||||||||:||||||||||||||||||||||:| : ||| |||||||||

orf58ng-1 VFTETVSSVGYGGPVYDEAADIHIEEPAAPDAWVVEPPEVPEVAVPEIDILPPPPVSEIY

370 380 390 400 410 420

430 440 450 460 470 480

orf58-1.pep NRTYEPPSGFEQVQRSRIAETDHLADDVLNGGWQEETAAIADDGSEGAAERSSGQYLSET

|||||||:||||:|||||||||||| ||||||||||||||||||||||||||||||||||

orf58ng-1 NRTYEPPAGFEQAQRSRIAETDHLAADVLNGGWQEETAAIADDGSEGAAERSSGQYLSET

430 440 450 460 470 480

490 500 510 520 530 540

orf58-1.pep EAFGHDSQAVCPFENVPSERPSCRVSDTEADEGAFPSEETGAVSEHLPTTDLLLPPLFNP

||||||||||||||:|||||||||||||||||||| ||||||||||||||||||||||||

orf58ng-1 EAFGHDSQAVCPFEDVPSERPSCRVSDTEADEGAFQSEETGAVSEHLPTTDLLLPPLFNP

490 500 510 520 530 540

550 560 570 580 590 600

orf58-1.pep EATQTEEELLENSITIEEKLAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 EATQTEEELLENSITIEEKLAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKD

550 560 570 580 590 600

610 620 630 640 650 660

orf58-1.pep LARSLGVASIRVVETIPGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 LARSLGVASIRVVETIPGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDI

610 620 630 640 650 660

670 680 690 700 710 720

orf58-1.pep TGQPVVTDLGKAPHLLVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 TGQPVVTDLGKAPHLLVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIY

670 680 690 700 710 720

730 740 750 760 770 780

orf58-1.pep EGIPHLLAPVVTDMKLAANALNWCVNEMEKRYRLMSFMGVRNLAGFNQKIAEAAARGEKI

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 EGITHLLAPVVTDMKLAANALNWCVNEMEKRYRLMSFMGVRNLAGFNQKIAEAAARGEKI

730 740 750 760 770 780

790 800 810 820 830 840

orf58-1.pep GNPFSLTPDDPEPLEKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILAT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 GNPFSLTPDDPEPLEKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILAT

790 800 810 820 830 840

850 860 870 880 890 900

orf58-1.pep QRPSVDVITGLIKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLLPGTAYPQR

||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf58ng-1 QRPSVDVITGLIKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLPPGTAYPQR

850 860 870 880 890 900

910 920 930 940 950 960

orf58-1.pep VHGAFASDEEVHRVVEYLKQFGEPDYVDDILSGGGSEELPGIGRSGDDETDPMYDEAVSV

||||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||

orf58ng-1 VHGAFASDEEVHRVVEYLKQFGEPDYVDDILSGGGSEELPGIGRSGDGETDPMYDEAVSV

910 920 930 940 950 960

970 980 990 1000 1010

orf58-1.pep VLKTRKASISGVQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVPLDNAX

|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf58ng-1 VLKTRKASISGVQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVPLDNAX

970 980 990 1000 1010

另外，ORF58ng-1显示出与大肠杆菌蛋白Ftsk明显同源：

sp|P46889|FTSK_ECOLI细胞分裂蛋白FTSK>gi|1651412|gnl|PID|d1015290(D1分裂蛋白FtsK[大肠杆菌]>gi|1651418|gnl|PID|d1015296(D90727)细胞分裂蛋白FtsK[大肠杆菌]>gi|1787117(AE000191)细胞分裂蛋白FtsK[大肠杆菌]长度＝1329

评分＝576位(1469)，估计值＝e-163

相同性＝301/459(65％)，阳性＝353/459(76％)，空隙＝5/459(1％)

询问：556 IEEKLAEFKVKVKVVDSYSGPVITRYEIEPDVGVRGNSVLNLEKDLARSLGVASIRVVET 615

+E +LA+F++K VV+ GPVITR+E+ GV+ + NL +DLARSL ++RVVE

目标：868 VEARLADFRIKADVVNYSPGPVITRFELNLAPGVKAARISNLSRDLARSLSTVAVRVVEV 927

询问：616 IPGKTCMGLELPNPKRQMIRLSEIFNSPEFAESKSKLTLALGQDITGQPVVTDLGKAPHL 675

IPGK +GLELPN KRQ + L E+ ++ +F ++ S LT+ LG+DI G+PVV DL K PHL

目标：928 IPGKPYVGLELPNKKRQTVYLREVLDNAKFRDNPSPLTVVLGKDIAGEPVVADLAKMPHL 987

询问：676 LVAGTTGSGKSVGVNAMILSMLFKAAPEDVRMIMIDPKMLELSIYEGITHLLAPVVTDMK 735

LVAGTTGSGKSVGVNAMILSML+KA PEDVR IMIDPKMLELS+YEGI HLL VVTDMK

目标：988 LVAGTTGSGKSVGVNAMILSMLYKAQPEDVRFIMIDPKMLELSVYEGIPHLLTEVVTDMK 1047

询问：736 LAANALNWCVNEMEKRYRLMSFMGVRNLAGFNQKIAEAAARGEKIGNPFSLTPDDPEP-- 793

AANAL WCVNEME+RY+LMS +GVRNLAG+N+KIAEA I +P+ D +

目标：1048 DAANALRWCVNEMERRYKLMSALGVRNLAGYNEKIAEADRMMRPIPDPYWKPGDSMDAQH 1107

询问：794 --LEKLPFIVVVVDEFADLMMTAGKKIEELIARLAQKARAAGIHLILATQRPSVDVITGL 851

L+K P+IVV+VDEFADLMMT GKK+EELIARLAQKARAAGIHL+LATQRPSVDVITGL

目标：1108 PVLKKEPYIVVLVDEFADLMMTVGKKVEELIARLAQKARAAGIHLVLATQRPSVDVITGL 1167

询问：852 IKANIPTRIAFQVSSKIDSRTILDQMGAENLLGQGDMLFLPPGTAYPQRVHGAFASDEEV 911

IKANIPTRIAF VSSKIDSRTILDQ GAE+LLG GDML+ P + P RVHGAF D+EV

目标：1168 IKANIPTRIAFTVSSKIDSRTILDQAGAESLLGMGDMLYSGPNSTLPVRVHGAFVRDQEV 1227

询问：912 HRVVEYLKQFGEPDYVDDILSGGGSEELPGIGRSGDGETDPMYDEAVSVVLKTRKASISG 971

H VV+ K G P YVD I S SE G G G E DP++D+AV V + RKASISG

目标：1228 HAVVQDWKARGRPQYVDGITSDSESEGGAG-GFDGAEELDPLFDQAVQFVTEKRKASISG 1286

询问：972 VQRALRIGYNRAARLIDQMEAEGIVSAPEHNGNRTILVP 1010

VQR RIGYNRAAR+I+QMEA+GIVS HNGNR +L P

目标：1287 VQRQFRIGYNRAARIIEQMEAQGIVSEQGHNGNREVLAP 1325

实施例59

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 497>：

1 ATGATTTATC AAAGAAACCT CATCAAAGAA CTCTCTTTTA CCGCCGTCGG

51 CATTTTCGTC GTCCTCTTGG CGGTATTGGT CTCCACGCAG GCAATCAACC

101 TGCTCGGCCG TGCCGCCGAC GGGC..GTGA TCGCCATCGA TGCCGTGTTG

151 GCATTGGTCG GCTTCTGGGT C......... .......... ..........

//

901 .........A TTGCCATCGG TTTGTTTTTA ATTTACCAAA ACGGGCTGAC

951 CCTGCTTTTT GAAGCCGTGG AAGACGGCAA AATCCATTTT TGGCTCGGAC

1001 TGCTGCCTAT GCACATTATC ATGTTTGTCC TTGCACTCAT CCTGTTGCGC

1051 GTCCGCAGTA TGCCCAGCCA GCCCTTGTGG CAGGCGGTTG GCAAAAGTCT

1101 GACATTGAAA GGCGGAAAAT GA

它对应于氨基酸序列<SEQ ID 498；ORF101>：

1 MIYQRNLIKE LSFTAVGIFV VLLAVLVSTQ AINLLGRAAD GXVIAIDAVL

51 ALVGFWV... .......... .......... .......... ..........

//

301 ...IAIGLFL IYQNGLTLLF EAVEDGKIHF WLGLLPMHII MFVLALILLR

351 VRSMPSQPFW QAVGKSLTLK GGK*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 499>：

1 ATGATTTATC AAAGAAACCT CATCAAAGAA CTCTCTTTTA CCGCCGTCGG

51 CATTTTCGTC GTCCTCTTGG CGGTATTGGT CTCCACGCAG GCAATCAACC

101 TGCTCGGCCG TGCCGCCGAC GGGCGTGTCG CCATCGATGC CGTGTTGGCA

151 TTGGTCGGCT TCTGGGTCAT CGGTATGACG CCGCTTTTGC TGGTGTTGAC

201 CGCATTTATC AGTACGTTGA CCGTGTTGAC CCGCTACTGG CGCGACAGCG

251 AAATGTCGGT CTGGCTATCC TGCGGATTGG CATTGAAACA ATGGATACGC

301 CCGGTGATGC AGTTTGCCGT GCCGTTTGCC GTTTTGGTTG CCGTCATGCA

351 GCTTTGGGTG ATACCGTGGG CAGAGCTACG CAGCCGCGAA TACGCTGAAA

401 TCCTGAAGCA GAAGCAGGAA TTGTCTTTGG TGGAGGCAGG CGAGTTCAAC

451 AGTTTGGGCA AGCGCAACGG CAGGGTTTAT TTTGTCGAAA CCTTCGATAC

501 CGAATCCGGC ATCATGAAAA ACCTGTTCCT GCGCGAACAG GACAAAAACG

551 GCGGCGACAA CATCATCTTC GCCAAAGAAG GTAACTTCTC GCTGAACGAC

601 AACAAACGCA CGCTCGAATT GCGCCACGGC TACCGTTACA GCGGCACGCC

651 CGGACGCGCC GACTACAATC AGGTTTCCTT CCAAAAACTC AACCTGATTA

701 TCAGCACCAC GCCCAAACTC ATCGACCCCG TTTCCCACCG CCGTACCATT

751 CCGACCGCCC AACTGATTGG CAGCAGCAAC CCGCAACATC AGGCGGAATT

801 GATGTGGCGC ATCTCGCTGA CCGTCAGCGT CCTCCTACTC TGCCTGCTTG

851 CCGTGCCGCT TTCCTATTTC AACCCGCGCA GCGGACATAC CTACAATATC

901 TTGATTGCCA TCGGTTTGTT TTTAATTTAC CAAAACGGGC TGACCCTGCT

951 TTTTGAAGCC GTGGAAGACG GCAAAATCCA TTTTTGGCTC GGACTGCTGC

1001 CTATGCACAT TATCATGTTT GCCGTTGCAC TCATCCTGTT GCGCGTCCGC

1051 AGTATGCCCA GCCAGCCCTT CTGGCAGGCG GTTGGCAAAA GTCTGACATT

1101 GAAAGGCGGA AAATGA

它对应于氨基酸序列<SEQ ID 500；ORF101-1>：

1 MIYQRNLIKE LSFTAVGIFV VLLAVLVSTQ AINLLGRAAD GRVAIDA VLA

51 LVGFWVIGMT PLLLVLTAFI STLTVLTRYW RDSEMSVWLS CGLALKQWIR

101 PVMQ FAVPFA VLVAVMQLWV IPWAELRSRE YAEILKQKQE LSLVEAGEFN

151 SLGKRNGRVY FVETFDTESG IMKNLFLREQ DKNGGDNIIF AKEGNFSLND

201 NKRTLELRHG YRYSGTPGRA DYNQVSFQKL NLIISTTPKL IDPVSHRRTI

251 PTAQLIGSSN PQHQAELMWR ISLTVSVLLL CLLAVPLSYF NPRSGHTYN I

301 LIAIGLFLIY QNGLTLLFEA VEDGKIHFWL GLLPMHIIMF AVALILLRVR

351 SMPSQPFWQA VGKSLTLKGG K*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF101显示和脑膜炎奈瑟球菌菌株A的ORF(ORF101a)在57个氨基酸重叠区内有91.2％的相同性，在69个氨基酸重叠区内有95.7％的相同性：

10 20 30 40 50

orf101.pep MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGXVIAIDAVLALVGFWVX

|||||||||||||||||||||||||||||||||||| ||| ||||||||||||||

orf101a MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGXAADXRX-AIDAVLALVGFWVXXM

10 20 30 40 50

//

90 100 110

orf101.pep .............................IAIGLFLIYQNGLTLLFEAVEDGKIHFWLGL

||||||||||||||||||||||||||||||

orf101a LTVSVLLLCLLAVPLSYFNPRSGHTYNILXAIGLFLIYQNGLTLLFEAVEDGKIHFWLGL

280 290 300 310 320 330

120 130 140 150

orf101.pep LPMHIIMFVLALILLRVRSMPSQPFWQAVGKSLTLKGGKX

|||||||||:|::|||||||||||||||||||||||||||

orf101a LPMHIIMFVIAIVLLRVRSMPSQPFWQAVGKSLTLKGGKX

340 350 360 370

全长ORF101a核苷酸序列<SEQ ID 501>是：

1 ATGATTTATC AAAGAAACCT CATCAAAGAACTCTCTTTTA CCGCCGTCGG

51 CATTTTCGTC GTCCTCTTGG CGGTATTGGT CTCCACGCAG GCAATCAACC

101 TGCTCGGCCN TGCCGCCGAC NGGCGTNTCG CCATCGATGC CGTGTTGGCA

151 TTGGTCGGCT TCTGGGTCNN NNGNATGACG CCGCTTTTGC TNGTGTTGAC

201 CGCATTTATC AGTACGTTGA CCGTGTTGAC CCGCTACTGG CGNGACAGCG

251 AAATGTCGGT CTGGNTATCC TGCGGATTGG CATTGAAACA ATGGATACGC

301 CCGGTGATGC AGTTTGCCGT GCCGTTTGCC GTTTTGGTTG CCGTCATGCA

351 GCTTTGGGTG ATACCGTGGG CAGAGCTACG CAGCCGCGAA TACGCTGAAA

401 TCCTGAAGCA GAAGCAGGAA TTGTCTTTGG TGGAGGCAGG CGGGTTCAAC

451 AGTTTGGGCA AGCGCAACGG CAGGGTTTAT TTTGTCGAAA CCTTCGATAC

501 CGAATCCGGC ATCATGAAAA ACCTGTTCCT GCGCGAACAG GACAAAAACG

551 GCGGCGACAA CATCATCTTC NCCAAAGAAA GTAACTTCTC GCTGAACGAC

601 AACAAACGCA CGCTCGAATT GCGCCACGGC TACCGTTACA GCGGCACGCC

651 CGGACGCGCC GACTACAATC AGGTTTCCTT CCNAAAACTC AACCTGATTA

701 TCAGCACCAC GCCCAAACTC ATCGACCCCG TTTCCCACCG CCGTACNATN

751 CCNACNGCCC AACTGATTGG CAGCAGCAAC CCGCAACATC ANGCGGAATT

801 GATGTGGCGC ATCTCGCTGA CCGTCAGCGT CCTCCTACTC TGCCTGCTTG

851 CCGTGCCGCT TTCCTATTTC AACCCGCGCA GCGGACATAC CTACAATATC

901 TTGANTGCCA TCGGTTTGTT TTTAATTTAC CAAAACGGGC TGACCCTGCT

951 TTTTGAAGCC GTGGAAGACG GCAAAATCCA TTTTTGGCTC GGACTGCTGC

1001 CTATGCACAT CATCATGTTC GTCATCGCAA TCGTACTTCT GCGCGTCCGC

1051 AGCATGCCCA GCCAGCCCTT CTGGCAGGCG GTTGGCAAAA GTCTGACATT

1101 GAAAGGCGGA AAATGA

它编码的蛋白质具有氨基酸序列<SEQ ID 502>：

1 MIYQRNLIKE LSFTAVGIFV VLLAVLVSTQ AINLLGXAAD XRXAIDA VLA

51 LVGFWVXXMT PLLLVLTAFI STLTVLTRYW RDSEMSVWXS CGLALKQWIR

101 PVMQ FAVPFA VLVAVMQLWV IPWAELRSRE YAEILKQKQE LSLVEAGGFN

151 SLGKRNGRVY FVETFDTESG IMKNLFLREQ DKNGGDNIIF XKESNFSLND

201 NKRTLELRHG YRYSGTPGRA DYNQVSFXKL NLIISTTPKL IDPVSHRRTX

251 PTAQLIGSSN PQHXAELMWR ISLTVSVLLL CLLAVPLSYF NPRSGHTYN I

301 LXAIGLFLIY QNGLTLLFEA VEDGKIHFWL GLLPMHIIMF VIAIVLLRVR

351 SMPSQPFWQA VGKSLTLKGG K*

ORF101a和ORF101-1显示在371个氨基酸的重叠区内有95.4％的相同性：

orf101a.pep MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGXAADXRXAIDAVLALVGFWVXXMT 60

|||||||||||||||||||||||||||||||||||| ||| | ||||||||||||| ||

orf101-1 MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGRVAIDAVLALVGFWVIGMT 60

orf101a.pep PLLLVLTAFISTLTVLTRYWRDSEMSVWXSCGLALKQWIRPVMQFAVPFAVLVAVMQLWV 120

|||||||||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf101-1 PLLLVLTAFISTLTVLTRYWRDSEMSVWLSCGLALKQWIRPVMQFAVPFAVLVAVMQLWV 120

orf101a.pep IPWAELRSREYAEILKQKQELSLVEAGGFNSLGKRNGRVYFVETFDTESGIMKNLFLREQ 180

||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||

orf101-1 IPWAELRSREYAEILKQKQELSLVEAGEFNSLGKRNGRVYFVETFDTESGIMKNLFLREQ 180

orf101a.pep DKNGGDNIIFXKESNFSLNDNKRTLELRHGYRYSGTPGRADYNQVSFXKLNLIISTTPKL 240

|||||||||| ||:||||||||||||||||||||||||||||||||| ||||||||||||

orf101-1 DKNGGDNIIFAKEGNFSLNDNKRTLELRHGYRYSGTPGRADYNQVSFQKLNLIISTTPKL 240

orf101a.pep IDPVSHRRTXPTAQLIGSSNPQHXAELMWRISLTVSVLLLCLLAVPLSYFNPRSGHTYNI 300

||||||||| ||||||||||||| ||||||||||||||||||||||||||||||||||||

orf101-1 IDPVSHRRTIPTAQLIGSSNPQHQAELMWRISLTVSVLLLCLLAVPLSYFNPRSGHTYNI 300

orf101a.pep LXAIGLFLIYQNGLTLLFEAVEDGKIHFWLGLLPMHIIMFVIAIVLLRVRSMPSQPFWQA 360

| ||||||||||||||||||||||||||||||||||||||::|::|||||||||||||||

orf101-1 LIAIGLFLIYQNGLTLLFEAVEDGKIHFWLGLLPMHIIMFAVALILLRVRSMPSQPFWQA 360

orf101a.pep VGKSLTLKGGK 371

|||||||||||

orf101-1 VGKSLTLKGGK 371

与淋病奈瑟球菌的预计ORF的同源性

ORF101显示和淋病奈瑟球菌的预计ORF(ORF101ng)在N端结构域的57个氨基酸重叠区以及C端结构域的61个氨基酸重叠区内分别有96.5％和95.1％的相同性：

orf101.pep MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGXVIAIDAVLALVGFWV 57

||||||||||||||||||||||||||||||||||||||||| | |||||||||||||

orf101ng MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGRV-AIDAVLALVGFWVIGM 59

//

orf101.pep IAIGLFLIYQNGLTLLFEAVEDGKIHFWLG 333

||||||||||||||||||||||||||||||

orf101ng SLTVSVLLLCLLAVPLSYFNPRSGHTYNILIAIGLFLIYQNGLTLLFEAVEDGKIHFWLG 331

orf101.pep LLPMHIIMFVLALILLRVRSMPSQPFWQAVGKSLTLKGGK 373

||||||||||:|::|||||||||||||||||

orf101ng LLPMHIIMFVIAIVLLRVRSMPSQPFWQAVG 362

预计ORF101ng核苷酸序列<SEQ ID 503>编码的蛋白质具有部分氨基酸序列<SEQ ID 504>：

1

LLAVLVSTQ AINLLGRAAD GRVAIDA VLA

51 LVGFWVIGMT PLLLVLTAFI STLTVLTRYW RDSEMSVWLS CGLALKQWIR

101 PVMQ FAVPFA ILIAVMQLWV IPWAELRSRE YAEILKQKQE LSLVEAGEFN

151 NLGKRNGRVY FVETFDTESG IMKNLFLREQ DKNGGDNIIF AKEGNFSLKD

201 NKRTLELRHG YRYSGTPGRA DYNQVSFQKL NLIISTTPKL IDPVSHRRTI

251 STAQLIGSSN PQHQAELMWR ISLTVSVLLL CLLAVPLSYF NPRSGHTYN I

301 LIAIGLFLIY QNGLTLLFEA VEDGKIHFWL GLLPMHIIMF VIAIVLLRVR

351 SMPSQPFWQA VG...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 505>：

1 ATGATTTATC AAAGAAACCT CATCAAAGAA CTCTCTTTTA CCGCCGTCGG

51 CATTTTCGTC GTCCTCTTGG CGGTGTTGGT GTCCACGCAG GCGATCAACC

101 TGCTTGGCCG CGCAGCTGAC GGGCGTGTCG CCATCGATGC CGTGTTGGCC

151 TTAGTCGGCT TCTGGGTCAT CGGTATGACC CCGCTTTTGC TGGTGTTGAC

201 CGCATTCATC AGCACGCTGA CCGTATTGAC CCGCTACTGG CGCGACAGCG

251 AAATGTCGGT CTGGCTATCC TGCGGATTGG CGTTGAAACA GTGGATACGC

301 CCCGTCATGC AGTTTGCCGT GCCGTTTGCC ATCCTGATTG CCGTCATGCA

351 GCTTTGGGTG ATACCGTGGG CAGAGCTGCG CAGCCGCGAA TATGCCGAAA

401 TTTTGAAGCA GAAGCAGGAA TTGTCTTTGG TGGAAGCCGG CGAGTTCAAT

451 AACTTGGGCA AGCGCAACGG CAgggtttaT TtcgtcgaaA CCTTTGACAC

501 CGaatccgGC ATCATGAAAA ACCTGTtcct GGGCGAACAG GACAAAAACG

551 gcggcgacaA CATCATCTTC GCcaaaGAag gtaactTctc gctgaaggaC

601 AACAAAcgca cgctcgaATT GCGCCACGGC TACCGTTACA GCGGcacgcC

651 CGGacGCGCc gactaCAATC AGGTTtcctt cCAAAAacTc aacctgATta

701 TCAGCACCAC GCCCAAacTT ATCGaccCCG TTTCCCACCG CCGCACCATT

751 tcgacCGCCC AAcTGATTGG CAGCAGCAAT CCGCAACATC AGGCAGAATT

801 GATGTGGCGC ATCTCGCTGA CCGTCAGCGT CCTCCTGCTC TGCCTACTCG

851 CCGTGCCGCT TTCCTATTTC AACCCGCGCA GCGGACATAC CTACAATATC

901 TTGATTGCCA TCGGTTTGTT TTTAATTTAC CAAAACGGGC TGACCCTGCT

951 TTTTGAAGCC GTGGAAGACG GCAAAATCCA TTTTTGGCTC GGACTGCTGC

1001 CTATGCACAT CATCATGTTC GTCATCGCAA TCGTACTTCT GCGCGTCCGC

1051 AGTATGCCCA GCCAGCCCTT CTGGCAGGCG GTTGGCAAAA GTCTGACATT

1101 GAAAGgcgGA AAATGA

它对应于氨基酸序列<SEQ ID 506；ORF101ng-1>：

1 MIYQRNLIKE LSFTAVGIFV VLLAVLVSTQ AINLLGRAAD GRVAIDA VLA

51 LVGFWVIGMT PLLLVLTAFI STLTVLTRYW RDSEMSVWLS CGLALKQWIR

101 PVMQ FAVPFA ILIAVMQLWV IPWAELRSRE YAEILKQKQE LSLVEAGEFN

151 NLGKRNGRVY FVETFDTESG IMKNLFLREQ DKNGGDNIIF AKEGNFSLKD

201 NKRTLELRHG YRYSGTPGRA DYNQVSFQKL NLIISTTPKL IDPVSHRRTI

251 STAQLIGSSN PQHQAELMWR ISLTVSVLLL CLLAVPLSYF NPRSGHTYN I

301 LIAIGLFLIY QNGLTLLFEA VEDGKIHFWL GLLPMHIIMF VIAIVLLRVR

351 SMPSQPFWQA VGKSLTLKGG K*

ORF101ng-1和ORF101-1显示在371个氨基酸的重叠区内有97.6％的相同性：

10 20 30 40 50 60

orf101-1.pep MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGRVAIDAVLALVGFWVIGMT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf101ng-1 MIYQRNLIKELSFTAVGIFVVLLAVLVSTQAINLLGRAADGRVAIDAVLALVGFWVIGMT

10 20 30 40 50 60

70 80 90 100 110 120

orf101-1.pep PLLLVLTAFISTLTVLTRYWRDSEMSVWLSCGLALKQWIRPVMQFAVPFAVLVAVMQLWV

||||||||||||||||||||||||||||||||||||||||||||||||||:|:|||||||

orf101ng-1 PLLLVLTAFISTLTVLTRYWRDSEMSVWLSCGLALKQWIRPVMQFAVPFAILIAVMQLWV

70 80 90 100 110 120

130 140 150 160 170 180

orf101-1.pep IPWAELRSREYAEILKQKQELSLVEAGEFNSLGKRNGRVYFVETFDTESGIMKNLFLREQ

||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||||

orf101ng-1 IPWAELRSREYAEILKQKQELSLVEAGEFNNLGKRNGRVYFVETFDTESGIMKNLFLREQ

130 140 150 160 170 180

190 200 210 220 230 240

orf101-1.pep DKNGGDNIIFAKEGNFSLNDNKRTLELRHGYRYSGTPGRADYNQVSFQKLNLIISTTPKL

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf101ng-1 DKNGGDNIIFAKEGNFSLKDNKRTLELRHGYRYSGTPGRADYNQVSFQKLNLIISTTPKL

190 200 210 220 230 240

250 260 270 280 290 300

orf101-1.pep IDPVSHRRTIPTAQLIGSSNPQHQAELMWRISLTVSVLLLCLLAVPLSYFNPRSGHTYNI

|||||||||| |||||||||||||||||||||||||||||||||||||||||||||||||

orf101ng-1 IDPVSHRRTISTAQLIGSSNPQHQAELMWRISLTVSVLLLCLLAVPLSYFNPRSGHTYNI

250 260 270 280 290 300

310 320 330 340 350 360

orf101-1.pep LIAIGLFLIYQNGLTLLFEAVEDGKIHFWLGLLPMHIIMFAVALILLRVRSMPSQPFWQA

||||||||||||||||||||||||||||||||||||||||::|::|||||||||||||||

orf101ng-1 LIAIGLFLIYQNGLTLLFEAVEDGKIHFWLGLLPMHIIMFVIAIVLLRVRSMPSQPFWQA

310 320 330 340 350 360

370

orf101-1.pep VGKSLTLKGGKX

||||||||||||

orf101ng-1 VGKSLTLKGGKX

370

实施例60

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 507>：

1 ..GGTGGTGGTT TTATCAATGC TTCCTGTGCC ACTTTGACGA CAGCCAAACC

51 GCAATATCAA GCAGGAGACC TTAGCGCTTT TAAGATAAGG CAAGGCAATG

101 TTGTAATCGC CGGACACGGT TTGGATGCAC GTGATACCGA TTACACACGT

151 ATTCTCAGTT ATCATTCCAA AATCGATGCA CCCGTATGGG GACAAGATGT

201 TCGTGTCGTC GCGGGACAAA ACGATGTGGC CGCAACAGGT GATGCACATT

251 CGCCTATTCT CAATAATGCT GCTGCCAATA CGTCAAACAA TACAGCCAAC

301 AACGGCACAC ATATCCCTTT ATTTGCGATT GATACAGGCA AATTAGGAGG

351 TAT.GTATGC CAACAAAATC ACCTTGATCA GTACGGTCGA GCAAGCAGGC

401 ATTCGTAA

它对应于氨基酸序列<SEQ ID 508；ORF113>：

1 ..GGGFINASCA TLTTAKPQYQ AGDLSAFKIR QGNVVIAGHG LDARDTDYTR

51 ILSYHSKIDA PVWGQDVRVV AGQNDVAATG DAHSPILNNA AANTSNNTAN

101 NGTHIPLFAI DTGKLGGXVC QQNHLDQYGR ASRHS*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌的pspA推定分泌蛋白(登录号为AF030941)的同源性

ORF和pspA显示在179个氨基酸的重叠区内有44％的氨基酸相同性：

orf113 GGGFINASCATLTTAKPQYQAGDLSAFKIRQGNVVIAGHGLDARDTDYTRILSYHSKIDA 60

GGG INA+ TLT+ P G+L+ F + G VVI G GLD D DYTRILS ++I+A

pspa GGGLINAASVTLTSGVPVLNNGNLTGFDVSSGKVVIGGKGLDTSDADYTRILSRAAEINA 256

orf113 PVWGQDVRVVAGQNDVAATGDAHSPILXXXXXXXXXXXXXXGTHIPLFAIDTGKLGGMYA 120

VWG+DV+VV+G+N + G + P AIDT LGGMYA

pspa GVWGKDVKVVSGKNKLDFDG---------SLAKTASAPSSSDSVTPTVAIDTATLGGMYA 307

orf113 NKITLISTVEQAGIRNQGQWFASAGNVAVNAEGKLVNTGMIAATGENHAVSLHARNVHN 179

+KITLIST A IRN+G+ FA+ G V ++A+GKL N+G I A +++ A+ V N

pspa DKITLISTDNGAVIRNKGRIFAATGGVTLSADGKLSNSGSIDAA----EITISAQTVDN 362

与淋病奈瑟球菌的预计ORF的同源性

ORF113显示和淋病奈瑟球菌的预计ORF(ORF113ng)在N端部分的52个氨基酸重叠区以及C端部分的17个氨基酸重叠区内有86.5％和94.1％的相同性：

orf113 GGGFINASCATLTTAKPQYQAGDLSAFKIR 30

|||||||| |||||::||||||||:|:|||

orf113ng SHPSQLNGYIEVGGRRAEVVIANPAGIAVNGGGFINASRATLTTGQPQYQAGDFSGFKIR 224

orf113 QGNVVIAGHGLDARDTDYTRILSYHSKIDAPVWGQDVRVVAGQNDVAATGDAHSPILNNA 90

|||:|||||||||||||:||||

orf113ng QGNAVIAGHGLDARDTDFTRILVCQQNHLDQYGRTSRHS 263

orf113 IDTGKLGGXVCQQNHLDQYGRASRHS 135

||||||||||||:||||

orf113ng DFSGFKIRQGNAVIAGHGLDARDTDFTRILVCQQNHLDQYGRTSRHS 263

预计全长ORF113ng核苷酸序列<SEQ ID 509>编码的蛋白质具有氨基酸序列<SEQ ID 510>：

1 MNKTLYRVIF NRKRGAVVAV AETTKREGKS CADSGSGSVY VKSVSFTPTH

51 SKAFCFSALG FSLCLALGTV NIAFADGIIT DKAAPKTQQA TILQTGNGIP

101 QVNIQTPTSA GVSVNQYAQF DVGNRGAILN NSRSNTQTQL GGWIQGNPWL

151 TRGEARVVVN QINSSHPSQL NGYIEVGGRR AEVVIANPAG IAVNGGGFIN

201 ASRATLTTGQ PQYQAGDFSG FKIRQGNAVI AGHGLDARDT DFTRILVCQQ

251 NHLDQYGRTS RHS*

根据该分析结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例61

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 511>：

1 ..TCAACGGGAC ATAGCGAACA AAATTACACT TTGCCGCGAG AAATCACACG

51 CAACATTTCA CTGGGTTCAT TTGCCTATGA ATCGCATCGC AAAGCATTAA

101 GCCATCATGC GCCCAGCCAA GGCACTGAGT TGCCGCAAAG CAACGGTATT

151 TCGCTACCCT ATACGTCCAA TTCTTTTACC CCATTACCCA GCAGCAGCTT

201 ATACATTATC AATCCTGTCA ATAAAGGCTA TCTTGTTGAA ACCGATCCAC

251 GCTTTGCCAA CTACCGTCAA TGGTTGGGTA GTGACTATAT GCtGGACAGC

301 CTCAAACTAG ACCCAAACAA TTTACATAAA CGTTTGGGTG ATGGTTATTA

351 CGAGCAACGT TTAATCAATG AACAAATCGC AGAGCTGACA GGGCATCGTC

401 GTTTAGAcGG TTATCAAAAC GACGAAGAAC AATTTAAAGC CTTAATGGAT

451 AATGGCGCGA CTGCGGCACG TTcGATGAAT CTCAGCGTTG GCATTGCATT

501 AAGTGCCGAG CAAGTAGCGC AACTGACCAG CGATATTGTT TGGTTGGTAC

551 AAAAAGAAGT TAAGCTTCCT GATGGCGGCA CACAAACCGT ATTGGTGCCA

601 CAGGTTTATG TACGCGTTAA AAATGGCGAC ATAGACGGTA AAGGTGCATT

651 GTTGTCAGGC AGCAATACAC AAATCAATGT TTCAGGCAGC CTGAAAAACT

701 CAGGCACGAT TGCAGGgCGC AATGCGCTTA TTATCAATAC CGATACGCTA

751 GACAATATCG GTGGGCGTAT TCATGCGCAA AAATCAGCGG TTACGGCCAC

801 ACAAGACATC AATAATATTG GCGGCATGCT TTCTGCCGAA CAGACATTAT

851 TGCTCAACGC AGGCAACAAC ATCAACAGCC AAAGCACCAC CGCCAGCAGT

901 CAAAATACAC AAGGCAGCAG CACCTACCTA GACCGAATGG CAGGTATTTA

951 TATCACAGGC AAAGAAAAAG GTGTTT..

它对应于氨基酸序列<SEQ ID 512；ORF115>：

1 ..STGHSEQNYT LPREITRNIS LGSFAYESHR KALSHHAPSQ GTELPQSNGI

51 SLPYTSNSFT PLPSSSLYII NPVNKGYLVE TDPRFANYRQ WLGSDYMLDS

101 LKLDPNNLHK RLGDGYYEQR LINEQIAELT GHRRLDGYQN DEEQFKALMD

151 NGATAARSMN LSVGIALSAE QVAQLTSDIV WLVQKEVKLP DGGTQTVLVP

201 QVYVRVKNGD IDGKGALLSG SNTQINVSGS LKNSGTIAGR NALIINTDTL

251 DNIGGRIHAQ KSAVTATQDI NNIGGMLSAE QTLLLNAGNN INSQSTTASS

301 QNTQGSSTYL DRMAGIYITG KEKGV..

该氨基酸序列的计算机分析给出了下列结果：

ORF115和pspA蛋白显示在325个氨基酸的重叠区内有50％的氨基酸相同性：

Orf115：1 STGHSEQNYTLPREITRNISLGSFAYESHRKALSHHAPSQGTELPQSNGISLPYTSNSFT 60

STG+S Y E++ +I +G AY+ + + P + NGI +T

pspA： 778 STGYSRSPYEPAPEVS-SIRMGISAYKGYAPQQASDIPGTVVPVVAENGIHPTFT----- 831

Orf115：61 PLPSSSLYIINPVNKGYLVETDPRFANYRQWLGSDYMLDSLKLDPNNLHKRLGDGYYEQR 120

LP+SSL+ I P NKGYL+ETDP F +YR+WLGS YML +L+ DPN++HKRLGDGYYEQ+

pspA： 832 -LPNSSLFAIAPNNKGYLIETDPAFTDYRKWLGSGYMLAALQQDPNHIHKRLGDGYYEQK 890

Orf115：121 LINEQIAELTGHRRLDGYQNDEEQFKALMDNGATAARSMNLSVGIALSAEQVAQLTSDIV 180

L+NEQIA+LTG+RRLDGY NDEEQFKALMDNG T A+ + L+ GIALSAEQVA+LTSDIV

pspA： 891 LVNEQIAKLTGYRRLDGYTNDEEQFKALMDNGITIAKELQLTPGIALSAEQVARLTSDIV 950

Orf115：181 WLVQKEVKLPDGGTQTVLVPQVYVRVKNGDIDGKGALLSGSNTQINVSGSLKN-SGTIAG 239

WL + V LPDG TQTVL P+VYVR + D++G+GALLSGS I SG+++N G IAG

pspA： 951 WLENETVTLPDGTTQTVLKPKVYVRARPKDMNGQGALLSGSVVDIG-SGAIENRGGLIAG 1009

Orf115：240 RNALIINTDTLDNIGGRIHAQKSAVTATQDINNIGGMLSAEQTLLLNAGXXXXXXXXXXX 299

R ALI+N + N+ G + + A DI N G + AE LLL A

pspA： 1010 REALILNAQNIKNLQGDLQGKNIFAAAGSDITNTGS-IGAENALLLKASNNIESRSETRS 1068

Orf115：300 XXXXXXXXXYLDRMAGIYITGKEKG 324

+ R+AGIY+TG++ G

pspA： 1069 NQNEQGSVRNIGRVAGIYLTGRQNG 1093

与淋病奈瑟球菌的预计ORF的同源性

ORF115显示与淋病奈瑟球菌的预计ORF(ORF115ng)在重叠的334个氨基酸内有91.9％的相同性：

orf115.pep STGHSEQNYTLPREITRNISLGSFAYESHRK 31

||| |||||||:||||:||||||||||| |

orf115ng NEQTFGEKKVFSENGKLHNYWRARRKGHDETGHREQNYTLPEEITRDISLGSFAYESHSK 71

orf115.pep ALSHHAPSQGTELPQSN----------GISLPYTSNSFTPLPSSSLYIINPVNKGYLVET 81

|||:||||||||||||| ||||||| |||||||:||||||||:||||||||

orf115ng ALSRHAPSQGTELPQSNRDNIRTAKSNGISLPYTPNSFTPLPGSSLYIINPANKGYLVET 131

orf115.pep DPRFANYRQWLGSDYMLDSLKLDPNNLHKRLGDGYYEQRLINEQIAELTGHRRLDGYQND 141

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf115ng DPRFANYRQWLGSDYMLGSLKLDPNNLHKRLGDGYYEQRLINEQIAELTGHRRLDGYQND 191

orf115.pep EEQFKALMDNGATAARSMNLSVGIALSAEQVAQLTSDIVWLVQKEVKLPDGGTQTVLVPQ 201

||||||||||||||||||||||||||||||:||||||||||||||||||||||||||:||

orf115ng EEQFKALMDNGATAARSMNLSVGIALSAEQAAQLTSDIVWLVQKEVKLPDGGTQTVLMPQ 251

orf115.pep VYVRVKNGDIDGKGALLSGSNTQINVSGSLKNSGTIAGRNALIINTDTLDNIGGRIHAQK 261

|||||||| |||||||||||||||||||||||||||||||||||||||||||||||||||

orf115ng VYVRVKNGGIDGKGALLSGSNTQINVSGSLKNSGTIAGRNALIINTDTLDNIGGRIHAQK 311

orf115.pep SAVTATQDINNIGGMLSAEQTLLLNAGNNINSQSTTASSQNTQGSSTYLDRMAGIYITGK 321

||||||||||||||:||||||||||||||||:|||: ||||:||||||||||||||||||

orf115ng SAVTATQDINNIGGILSAEQTLLLNAGNNINNQSTAKSSQNAQGSSTYLDRMAGIYITGK 371

orf115.pep EKGV 325

||||

orf115ng EKGVLAAQAGKDINIIAGQISNQSDQGQTRLQAGRDINLDTVQTGKYQEIHFDADNHTIR 431

预计ORF115ng核苷酸序列<SEQ ID 513>编码的蛋白质具有氨基酸序列<SEQ ID514>：

1 MLVQTEKDGL HNEQTFGEKK VFSENGKLHN YWRARRKGHD ETGHREQNYT

51 LPEEITRDIS LGSFAYESHS KALSRHAPSQ GTELPQSNRD NIRTAKSNGI

101 SLPYTPNSFT PLPGSSLYII NPANKGYLVE TDPRFANYRQ WLGSDYMLGS

151 LKLDPNNLHK RLGDGYYEQR LINEQIAELT GHRRLDGYQN DEEQFKALMD

201 NGATAARSMN LSVGIALSAE QAAQLTSDIV WLVQKEVKLP DGGTQTVLMP

251 QVYVRVKNGG IDGKGALLSG SNTQINVSGS LKNSGTIAGR NALIINTDTL

301 DNIGGRIHAQ KSAVTATQDI NNIGGILSAE QTLLLNAGNN INNQSTAKSS

351 QNAQGSSTYL DRMAGIYITG KEKGVLAAQA GKDINIIAGQ ISNQSDQGQT

401 RLQAGRDINL DTVQTGKYQE IHFDADNHTI RGSTNEVGSS IQTKGDVTLL

451 SGNNLNAKAA EVGSAKGTLA VYAKNDITIS SGIHAGQVDD ASKHTGRSGG

501 GNKLVITDKA QSHHETAQSS TFEGKQVVLQ AGNDANILGS NVISDNGTRI

551 QAGNHVRIGT TQTQSQSETY HQTQKSGLMS AGIGFTIGSK TNTQENQSQS

601 NEHTGSTVGS LKGDTTIVAS KHYEQTGSNV SSPEGNNLIS TQSMDIGAAQ

651 NQLNSKTTQT YEQKGLTVAF SSPVTDLAQQ AIAVAHKAAK QFDKAKTTAL

701 MPWRLPMQVG RLFKQAKAPK K*

进一步的工作揭示了下列淋球菌的部分DNA序列<SEQ ID 515>：

1 TTGCTTGTGC AAACAGAAAA AGACGGTTTG CATAACGAGC AAACCTTTGG

51 CGAGAAGAAA GTCTTCAGCG AAAATGGTAA GTTGCACAAC TACTGGCGTG

101 CGCGTCGTAA AGGACATGAT GAAACAGGGC ATCGTGAACA AAATTATACT

151 TTGCCGGAGG AAATCACACG CGACATTTCA CTGGGTTCAT TTGCCTATGA

201 ATCGCATAGC AAAGCATTAA GCCGTCATGC GCCCAGCCAA GGCACTGAGT

251 TGCCACAAAG TAACCGGGAT AATATCCGTA CTGCGAAAAG CAACGGTATT

301 TCGCTACCCT ATACGCCCAA TTCTTTTACC CCATTACCCG GCAGCAGCTT

351 ATACATTATC AATCCTGCCA ATAAAGGCTA TCTTGTTGAA ACCGATCCAC

401 GCTTTGCCAA CTACCGTCAA TGGTTGGGTA GTGACTATAT GCTGGGCAGC

451 CTCAAACTAG ACCCAAACAA TTTACATAAA CGTTTGGGTG ATGGTTATTA

501 CGAGCAACGT TTAATCAATG AACAAATCGC AGAGCTGACA GGGCATCGTC

551 GTTTAGACGG TTATCAAAAC GACGAAGAAC AATTTAAAGC CTTAATGGAT

601 AATGGCGCGA CTGCGGCACG TTCGATGAAT CTCAGCGTTG GCATTGCATT

651 AAGTGCCGAG CAAGCAGCGC AACTGACCAG CGATATTGTT TGGTTGGTAC

701 AAAAAGAAGT TAAACTTCCT GATGGCGGCA CACAAACCGT ATTGATGCCA

751 CAGGTTTATG TACGCGTTAA AAATGGCGGC ATAGACGGTA AAGGTGCATT

801 GTTGTCAGGC AGCAATACAC AAATCAATGT TTCAGGCAGC CTGAAAAACT

851 CAGGCACGAT TGCAGGGCGC AATGCGCTTA TTATCAATAC CGATACGCTA

901 GACAATATCG GTGGGCGTAT TCATGCGCAA AAATCAGCGG TTACGGCCAC

951 ACAAGACATC AATAATATTG GCGGCATTCT TTCTGCCGAA CAGACATTAT

1001 TGCTCAATGC GGGTAACAAC ATCAACAACC AAAGCACGGC CAAGAGCAGT

1051 CAAAATGCAC AAGGTAGCAG CACCTACCTA GACCGAATGG CAGGTATTTA

1101 TATCACAGGC AAAGAAAAAG GTGTTTTAGC AGCGCAGGCA GGCAAAGACA

1151 TCAACATCAT TGCCGGTCAA ATCAGCAATC AATCAGATCA AGGGCAAACC

1201 CGGCTGCAGG CAGGACGCGA CATTAACCTG GATACGGTAC AAACCGGCAA

1251 ATATCAAGAA ATCCATTTTG ATGCCGATAA CCATACCATC CGAGGTTCAA

1301 CGAACGAAGT CGGCAGCAGC ATTCAAACAA AAGGCGATGT TACCCtatTG

1351 TCAGGGAATA ATCTCAATGC CAAAGCTGCC GAAGTCGGCA GCGCAAAAGG

1401 CACACTTGCC GTGTATGCTA AAAATGACAT TACTATCAGC TCAGGCATCC

1451 ATGCCGGCCA AGTTGATGAT GCGTCCAAAC ATACAGGCAG AAGCGGCGGC

1501 GGTAATAAAT TAGTCATTAC CGATAAAGCC CAAAGTCATC ACGAAACTGC

1551 TCAAAGCAGC ACCTTTGAAG GCAAGCAAGT TGTATTGCAG GCAGGAAACG

1601 ATGCCAACAT CCTTGGCAGT AATGTTATTT CCGATAATGG CACCCGGATT

1651 CAAGCAGGCA ATCATGTTCG CATTGGTACA ACCCAAACTC AAAGCCAAAG

1701 CGAAACCTAT CATCAAACCC AAAAATCAGG ATTGATGAGT GCAGGTATCG

1751 GCTTCACTAT TGGCAGCAAG ACAAACACAC AAGAAAACCA ATCCCAAAGC

1801 AACGAACATA CAGGCAGTAC CGTAGGCAGC CTGAAAGGCG ATACCACCAT

1851 TGTTGCAAGC AAACACTACG AACAAACCGG CAGCAACGTT TCCAGCCCTG

1901 AGGGCAACAA CCTTATCAGC ACGCAAAGTA TGGATATTGG CGCAGCACAA

1951 AACCAATTAA ACAGCAAAAC CACCCAAACC TACGAACAAA AAGGCTTAAC

2001 GGTGGCATTC AGTTCGCCCG TTACCGATTT GGCACAACAA GCGATTGCCG

2051 TAGCACACAA AGCAGCAAAC AAGTCGGACA AAGCAAAAAC GACCGCGTTA

2101 ATGCCATGGC GGCTGCCAAT GCAGGTTGGC AGGCCTATCA AACAGGCAAA

2151 GGCGCACAAA ACTTAG

它对应于氨基酸序列<SEQ ID 516；ORF115ng-1>：

1 LLVQTEKDGL HNEQTFGEKK VFSENGKLHN YWRARRKGHD ETGHREQNYT

51 LPEEITRDIS LGSFAYESHS KALSRHAPSQ GTELPQSNRD NIRTAKSNGI

101 SLPYTPNSFT PLPGSSLYII NPANKGYLVE TDPRFANYRQ WLGSDYMLGS

151 LKLDPNNLHK RLGDGYYEQR LINEQIAELT GHRRLDGYQN DEEQFKALMD

201 NGATAARSMN LSVGIALSAE QAAQLTSDIV WLVQKEVKLP DGGTQTVLMP

251 QVYVRVKNGG IDGKGALLSG SNTQINVSGS LKNSGTIAGR NALIINTDTL

301 DNIGGRIHAQ KSAVTATQDI NNIGGILSAE QTLLLNAGNN INNQSTAKSS

351 QNAQGSSTYL DRMAGIYITG KEKGVLAAQA GKDINIIAGQ ISNQSDQGQT

401 RLQAGRDINL DTVQTGKYQE IHFDADNHTI RGSTNEVGSS IQTKGDVTLL

451 SGNNLNAKAA EVGSAKGTLA VYAKNDITIS SGIHAGQVDD ASKHTGRSGG

501 GNKLVITDKA QSHHETAQSS TFEGKQVVLQ AGNDANILGS NVISDNGTRI

551 QAGNHVRIGT TQTQSQSETY HQTQKSGLMS AGIGFTIGSK TNTQENQSQS

601 NEHTGSTVGS LKGDTTIVAS KHYEQTGSNV SSPEGNNLIS TQSMDIGAAQ

651 NQLNSKTTQT YEQKGLTVAF SSPVTDLAQQ AIAVAHKAAN KSDKAKTTAL

701 MPWRLPMQVG RPIKQAKAHK T*

此淋球菌蛋白(ORF115ng-1)显示和ORF115在334个氨基酸内有91.9％的相同性：

20 30 40 50 60 70

orf115ng-1.p NEQTFGEKKVFSENGKLHNYWRARRKGHDETGHREQNYTLPEEITRDISLGSFAYESHSK

||| |||||||:||||:||||||||||| |

orf115 STGHSEQNYTLPREITRNISLGSFAYESHRK

10 20 30

80 90 100 110 120 130

orf115ng-1.p ALSRHAPSQGTELPQSNRDNIRTAKSNGISLPYTPNSFTPLPGSSLYIINPANKGYLVET

|||:||||||||||||| ||||||| |||||||:||||||||:||||||||

orf115 ALSHHAPSQGTELPQSN----------GISLPYTSNSFTPLPSSSLYIINPVNKGYLVET

40 50 60 70 80

140 150 160 170 180 190

orf115ng-1.p DPRFANYRQWLGSDYMLGSLKLDPNNLHKRLGDGYYEQRLINEQIAELTGHRRLDGYQND

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf115 DPRFANYRQWLGSDYMLDSLKLDPNNLHKRLGDGYYEQRLINEQIAELTGHRRLDGYQND

90 100 110 120 130 140

200 210 220 230 240 250

orf115ng-1.p EEQFKALMDNGATAARSMNLSVGIALSAEQAAQLTSDIVWLVQKEVKLPDGGTQTVLMPQ

||||||||||||||||||||||||||||||:||||||||||||||||||||||||||:||

orf115 EEQFKALMDNGATAARSMNLSVGIALSAEQVAQLTSDIVWLVQKEVKLPDGGTQTVLVPQ

150 160 170 180 190 200

260 270 280 290 300 310

orf115ng-1.p VYVRVKNGGIDGKGALLSGSNTQINVSGSLKNSGTIAGRNALIINTDTLDNIGGRIHAQK

|||||||| |||||||||||||||||||||||||||||||||||||||||||||||||||| orf115 VYVRVKNGDIDGKGALLSGSNTQINVSGSLKNSGTIAGRNALIINTDTLDNIGGRIHAQK

210 220 230 240 250 260

320 330 340 350 360 370

orf1 15ng-1.p SAVTATQDINNIGGILSAEQTLLLNAGNNINNQSTAKSSQNAQGSSTYLDRMAGIYITGK

||||||||||||||:||||||||||||||||:|||: ||||:||||||||||||||||||

orf115 SAVTATQDINNIGGMLSAEQTLLLNAGNNINSQSTTASSQNTQGSSTYLDRMAGIYITGK

270 280 290 300 310 320

380 390 400 410 420 430

orf115ng-1.p EKGVLAAQAGKDINIIAGQISNQSDQGQTRLQAGRDINLDTVQTGKYQEIHFDADNHTIR

||||

orf115 EKGV

另外，它显示出与数据库中一种分泌的脑膜炎奈瑟球菌蛋白同源：

gi|2623258(AF030941)推定分泌的蛋白[脑膜炎奈瑟球菌]长度＝2273

评分＝604位(1541)，估计值＝e-172

相同性＝325/678(47％)，阳性＝449/678(65％)，空隙＝22/678(3％)

询问：1 LLVQTEKDGLHNEQTFGEKKVFSENGKLHNYWRARRKGHDETGHREQNYTLPEEITRDIS 60

L+V T + L N++T G K + ++ G LH Y R +KG D TG+ Y E++ I

目标：739 LIVGTPESALDNDETLGTKTI-TDKGDLHRYHRHHKKGRDSTGYSRSPYEPAPEVS-SIR 796

询问：61 LGSFAYESHSKALSRHAPSQGTELPQSNRDNIRTAKSNGISLPYTPNSFTPLPGSSLYII 120

+G AY+ + AP Q +++P + + NGI +T LP SSL+ I

目标：797 MGISAYKGY-------APQQASDIPGTV---VPVVAENGIHPTFT------LPNSSLFAI 840

询问：121 NPANKGYLVETDPRFANYRQWLGSDYMLGSLKLDPNNLHKRLGDGYYEQRLINEQIAELT 180

P NKGYL+ETDP F +YR+WLGS YML +L+ DPN++HKRLGDGYYEQ+L+NEQIA+LT

目标：841 APNNKGYLIETDPAFTDYRKWLGSGYMLAALQQDPNHIHKRLGDGYYEQKLVNEQIAKLT 900

询问：181 GHRRLDGYQNDEEQFKALMDNGATAARSMNLSVGIALSAEQAAQLTSDIVWLVQKEVKLP 240

G+RRLDGY NDEEQFKALMDNG T A+ + L+ GIALSAEQ A+LTSDIVWL + V LP

目标：901 GYRRLDGYTNDEEQFKALMDNGITIAKELQLTPGIALSAEQVARLTSDIVWLENETVTLP 960

询问：241 DGGTQTVLMPQVYVRVKNGGIDGKGALLSGSNTQINVSGSLKN-SGTIAGRNALIINTDT 299

DG TQTVL P+VYVR + ++G+GALLSGS I SG+++N G IAGR ALI+N

目标：961 DGTTQTVLKPKVYVRARPKDMNGQGALLSGSVVDIG-SGAIENRGGLIAGREALILNAQN 1019

询问：300 LDNIGGRIHAQKSAVTATQDINNIGGILSAEQTLLLNAGNNINNQSTAKSSQNAQGSSTY 359

+ N+ G + + A DI N G I AE LLL A NNI ++S +S+QN QGS

目标：1020 IKNLQGDLQGKNIFAAAGSDITNTGSI-GAENALLLKASNNIESRSETRSNQNEQGSVRN 1078

询问：360 LDRMAGIYITGKEKGVLAAQAGKDINIIAGQISNQSDQGQTRLQAGRDINLDTVQTGKYQ 419

+ R+AGIY+TG++ G + AG +I + A +++NQS+ GQT L AG DI DT + Q

目标：1079 IGRVAGIYLTGRQNGSVLLDAGNNIVLTASELTNQSEDGQTVLNAGGDIRSDTTGISRNQ 1138

询问：420 EIHFDADNHTIRGSTNEVGSSIQTKGDVTLLSGNNLNAKAAEVGSAKGTLAVYAKNDITI 479

FD+DN+ IR NEVGS+I+T+G+++L + ++ +AAEVGS +G L + A DI +

目标：1139 NTIFDSDNYVIRKEQNEVGSTIRTRGNLSLNAKGDIRIRAAEVGSEQGRLKLAAGRDIKV 1198

询问：480 SSGIHAGQVDDASKHTGRSGGGNKLVITDKAQSHHETAQSSTFEGKQVVLQAGNDANILG 539

+G + +DA K+TGRSGGG K +T ++ + A S T +GK+++L +G D + G

目标：1199 EAGKAHTETEDALKYTGRSGGGIKQKMTRHLKNQNGQAVSGTLDGKEIILVSGRDITVTG 1258

询问：540 SNVISDNGTRIQAGNHVRIGTTQTQSQSETYHQTQKSGLM-SAGIGFTIGSKTNTQENQS 598

SN+I+DN T + A N++ + +T+S+S ++ +KSGLM S GIGFT GSK +TQ N+S

目标：1259 SNIIADNHTILSAKNNIVLKAAETRSRSAEMNKKEKSGLMGSGGIGFTAGSKKDTQTNRS 1318

询问：599 QSNEHTGSTVGSLKGDTTIVASKHYEQTGSNVSSPEGNNLISTQSMDIGAAQNQLNSKTT 658

++ HT S VGSL G+T I A KHY QTGS +SSP+G+ IS+ + I AAQN+ + ++

目标：1319 ETVSHTESVVGSLNGNTLISAGKHYTQTGSTISSPQGDVGISSGKISIDAAQNRYSQESK 1378

询问：659 QTYEQKGLTVAFSSPVTD 676

Q YEQKG+TVA S PV +

目标：1379 QVYEQKGVTVAISVPVVN 1396

实施例62

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 517>：

1 ..TCAGGGAATA ACCTCAATGC CAAAGCTGCC GAAGTCAGCA GCGCAAACGG

51 TACACTCGCT GTGTCTGCCA ATAATGACAT CAACATCAGC GCAGGCATCA

101 ACACGACCCA TGTTGATGAT GCGTCCAAAC ACACAGGCAG AAGCGGTGGT

151 GGCAATAAAT TAGTCATTAC CGATAAAGCC CAAAGTCATC ACGAAACCGC

201 CCAAAGCAGC ACCTTTGAAG GCAAGCAAGT TGTATTGCAG GCAGGAAACG

251 ATGCCAACAT CCTTGGCAGC AATGTTATTT CCGATAATGG CACCCAGATT

301 CAAGCAGGCA ATCATGTTCG CATTGGTACA ACCCAAACTC AAAGCCAAAG

351 CGAAACCTAT CATCAAACCC AGAAATCAGG ATTGATGAGT GCAGGTATCG

401 GCTTCACTAT TGGCAGCAAG ACAAACACAC AAGAAAACCA ATCCCAAAGC

451 AACGAACATA CAGGCAGTAC CGTAGGCAGC TTGAAAGGCG ATACCACCAT

501 TGTTGCAGGC AAACACTACG AACAAATCGG CAGTACCGTT TCCAGCCCGG

551 AAGGCAACAA TACCATCTAT GCCCAAAGCA TAGACATTCA AGCGGCACAC

601 AACAAATTAA ACAGTAATAC CACCCAAACC TATGAACAAA AAGG.CTAAC

651 GGTGGCATTC AGTTCGCCCG TTACCGATTT GGCACAACAA ...

它对应于氨基酸序列<SEQ ID 518；ORF117>：

1 ..SGNNLNAKAA EVSSANGTLA VSANNDINIS AGINTTHVDD ASKHTGRSGG

51 GNKLVITDKA QSHHETAQSS TFEGKQVVLQ AGNDANILGS NVISDNGTQI

101 QAGNHVRIGT TQTQSQSETY HQTQKSGLMS AGIGFTIGSK TNTQENQSQS

151 NEHTGSTVGS LKGDTTIVAG KHYEQIGSTV SSPEGNNTIY AQSIDIQAAH

201 NKLNSNTTQT YEQKXLTVAF SSPVTDLAQQ ...

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌的pspA推定分泌蛋白(登录号AF030941)的同源性

ORF117和pspA蛋白显示在224个氨基酸的重叠区内有45％的氨基酸相同性：

Orf117：4 NLNAKAAEVSSANGTLAVSANNDINISAGINTTHVDDASKHTGRSGGGNKLVITDKAQSH 63

++ +AAEV S G L ++A DI + AG T +DA K+TGRSGGG K +T ++

pspA： 1173 DIRIRAAEVGSEQGRLKLAAGRDIKVEAGKAHTETEDALKYTGRSGGGIKQKMTRHLKNQ 1232

Orf117：64 HETAQSSTFEGKQVVLQAGNDANILGSNVISDNGTQIQAGNHVRIGTTQTQSQSETYHQT 123

+ A S T +GK+++L +G D + GSN+I+DN T + A N++ + +T+S+S ++

pspA： 1233 NGQAVSGTLDGKEIILVSGRDITVTGSNIIADNHTILSAKNNIVLKAAETRSRSAEMNKK 1292

Orf117：124 QKSGLM-SAGIGFTIGSKTNTQENQSQSNEHTGSTVGSLKGDTTIVAGKHYEQIGSTVSS 182

+KSGLM S GIGFT GSK +TQ N+S++ HT S VGSL G+T I AGKHY Q GST+SS

pspA： 1293 EKSGLMGSGGIGFTAGSKKDTQTNRSETVSHTESVVGSLNGNTLISAGKHYTQTGSTISS 1352

Orf117：183 PEGNNTIYAQSIDIQAAHNKLNSNTTQTYEQKXLTVAFSSPVTD 226

P+G+ I + I I AA N+ + + Q YEQK +TVA S PV +

pspA： 1353 PQGDVGISSGKISIDAAQNRYSQESKQVYEQKGVTVAISVPVVN 1396

与淋病奈瑟球菌的预计ORF的同源性

ORF117显示和淋病奈瑟球菌的预计ORF(ORF117ng)在230个氨基酸的重叠区内有90％的相同性：

orf117.pep SGNNLNAKAAEVSSANGTLAVSANNDINIS 30

||||||||||||:||:||||| |:|||:||

orf117ng IHFDADNHTIRGSTNEVGSSIQTKGDVTLLSGNNLNAKAAEVGSAKGTLAVYAKNDITIS 480

orf117.pep AGINTTHVDDASKHTGRSGGGNKLVITDKAQSHHETAQSSTFEGKQVVLQAGNDANILGS 90

:||:: :|||||||||||||||||||||||||||||||||||||||||||||||||||||

orf117ng SGIHAGQVDDASKHTGRSGGGNKLVITDKAQSHHETAQSSTFEGKQVVLQAGNDANILGS 540

orf117.pep NVISDNGTQIQAGNHVRIGTTQTQSQSETYHQTQKSGLMSAGIGFTIGSKTNTQENQSQS 150

||||||||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf117ng NVISDNGTRIQAGNHVRIGTTQTQSQSETYHQTQKSGLMSAGIGFTIGSKTNTQENQSQS 600

orf117.pep NEHTGSTVGSLKGDTTIVAGKHYEQIGSTVSSPEGNNTIYAQSIDIQAAHNKLNSNTTQT 210

|||||||||||||||||||:||||| ||:|||||||| | :||:|| ||:|:|||:||||

orf117ng NEHTGSTVGSLKGDTTIVASKHYEQTGSNVSSPEGNNLISTQSMDIGAAQNQLNSKTTQT 660

orf117.pep YEQKXLTVAFSSPVTDLAQQ 230

|||| |||||||||||||||

orf117ng YEQKGLTVAFSSPVTDLAQQAIAVAHKAAKQFDKAKTTALMPWRLPMQVGRLFKQAKAPK 720

预计ORF117ng核苷酸序列<SEQ ID 519>编码的蛋白质具有氨基酸序列<SEQ ID520>：

1 ..LLVQTEKDGL HNEQTFGEKK VFSENGKLHN YWRARRKGHD ETGHREQNYT

51 LPEEITRDIS LGSFAYESHS KALSRHAPSQ GTELPQSNRD NIRTAKSNGI

101 SLPYTPNSFT PLPGSSLYII NPANKGYLVE TDPRFANYRQ WLGSDYMLGS

151 LKLDPNNLHK RLGDGYYEQR LINEQIAELT GHRRLDGYQN DEEQFKALMD

201 NGATAARSMN LSVGIALSAE QAAQLTSDIV WLVQKEVKLP DGGTQTVLMP

251 QVYVRVKNGG IDGKGALLSG SNTQINVSGS LKNSGTIAGR NALIINTDTL

301 DNIGGRIHAQ KSAVTATQDI NNIGGILSAE QTLLLNAGNN INNQSTAKSS

351 QNAQGSSTYL DRMAGIYITG KEKGVLAAQA GKDINIIAGQ ISNQSDQGQT

401 RLQAGRDINL DTVQTGKYQE IHFDADNHTI RGSTNEVGSS IQTKGDVTLL

451 SGNNLNAKAA EVGSAKGTLA VYAKNDITIS SGIHAGQVDD ASKHTGRSGG

501 GNKLVITDKA QSHHETAQSS TFEGKQVVLQ AGNDANILGS NVISDNGTRI

551 QAGNHVRIGT TQTQSQSETY HQTQKSGLMS AGIGFTIGSK TNTQENQSQS

601 NEHTGSTVGS LKGDTTIVAS KHYEQTGSNV SSPEGNNLIS TQSMDIGAAQ

651 NQLNSKTTQT YEQKGLTVAF SSPVTDLAQQ AIAVAHKAAK QFDKAKTTAL

701 MPWRLPMQVG RLFKQAKAPK K*

进一步的工作揭示了下列淋球菌的部分DNA序列<SEQ ID 521>：

1 TTGCTTGTGC AAACAGAAAA AGACGGTTTG CATAACGAGC AAACCTTTGG

51 CGAGAAGAAA GTCTTCAGCG AAAATGGTAA GTTGCACAAC TACTGGCGTG

101 CGCGTCGTAA AGGACATGAT GAAACAGGGC ATCGTGAACA AAATTATACT

151 TTGCCGGAGG AAATCACACG CGACATTTCA CTGGGTTCAT TTGCCTATGA

201 ATCGCATAGC AAAGCATTAA GCCGTCATGC GCCCAGCCAA GGCACTGAGT

251 TGCCACAAAG TAACCGGGAT AATATCCGTA CTGCGAAAAG CAACGGTATT

301 TCGCTACCCT ATACGCCCAA TTCTTTTACC CCATTACCCG GCAGCAGCTT

351 ATACATTATC AATCCTGCCA ATAAAGGCTA TCTTGTTGAA ACCGATCCAC

401 GCTTTGCCAA CTACCGTCAA TGGTTGGGTA GTGACTATAT GCTGGGCAGC

451 CTCAAACTAG ACCCAAACAA TTTACATAAA CGTTTGGGTG ATGGTTATTA

501 CGAGCAACGT TTAATCAATG AACAAATCGC AGAGCTGACA GGGCATCGTC

551 GTTTAGACGG TTATCAAAAC GACGAAGAAC AATTTAAAGC CTTAATGGAT

601 AATGGCGCGA CTGCGGCACG TTCGATGAAT CTCAGCGTTG GCATTGCATT

651 AAGTGCCGAG CAAGCAGCGC AACTGACCAG CGATATTGTT TGGTTGGTAC

701 AAAAAGAAGT TAAACTTCCT GATGGCGGCA CACAAACCGT ATTGATGCCA

751 CAGGTTTATG TACGCGTTAA AAATGGCGGC ATAGACGGTA AAGGTGCATT

801 GTTGTCAGGC AGCAATACAC AAATCAATGT TTCAGGCAGC CTGAAAAACT

851 CAGGCACGAT TGCAGGGCGC AATGCGCTTA TTATCAATAC CGATACGCTA

901 GACAATATCG GTGGGCGTAT TCATGCGCAA AAATCAGCGG TTACGGCCAC

951 ACAAGACATC AATAATATTG GCGGCATTCT TTCTGCCGAA CAGACATTAT

1001 TGCTCAATGC GGGTAACAAC ATCAACAACC AAAGCACGGC CAAGAGCAGT

1051 CAAAATGCAC AAGGTAGCAG CACCTACCTA GACCGAATGG CAGGTATTTA

1101 TATCACAGGC AAAGAAAAAG GTGTTTTAGC AGCGCAGGCA GGCAAAGACA

1151 TCAACATCAT TGCCGGTCAA ATCAGCAATC AATCAGATCA AGGGCAAACC

1201 CGGCTGCAGG CAGGACGCGA CATTAACCTG GATACGGTAC AAACCGGCAA

1251 ATATCAAGAA ATCCATTTTG ATGCCGATAA CCATACCATC CGAGGTTCAA

1301 CGAACGAAGT CGGCAGCAGC ATTCAAACAA AAGGCGATGT TACCCtatTG

1351 TCAGGGAATA ATCTCAATGC CAAAGCTGCC GAAGTCGGCA GCGCAAAAGG

1401 CACACTTGCC GTGTATGCTA AAAATGACAT TACTATCAGC TCAGGCATCC

1451 ATGCCGGCCA AGTTGATGAT GCGTCCAAAC ATACAGGCAG AAGCGGCGGC

1501 GGTAATAAAT TAGTCATTAC CGATAAAGCC CAAAGTCATC ACGAAACTGC

1551 TCAAAGCAGC ACCTTTGAAG GCAAGCAAGT TGTATTGCAG GCAGGAAACG

1601 ATGCCAACAT CCTTGGCAGT AATGTTATTT CCGATAATGG CACCCGGATT

1651 CAAGCAGGCA ATCATGTTCG CATTGGTACA ACCCAAACTC AAAGCCAAAG

1701 CGAAACCTAT CATCAAACCC AAAAATCAGG ATTGATGAGT GCAGGTATCG

1751 GCTTCACTAT TGGCAGCAAG ACAAACACAC AAGAAAACCA ATCCCAAAGC

1801 AACGAACATA CAGGCAGTAC CGTAGGCAGC CTGAAAGGCG ATACCACCAT

1851 TGTTGCAAGC AAACACTACG AACAAACCGG CAGCAACGTT TCCAGCCCTG

1901 AGGGCAACAA CCTTATCAGC ACGCAAAGTA TGGATATTGG CGCAGCACAA

1951 AACCAATTAA ACAGCAAAAC CACCCAAACC TACGAACAAA AAGGCTTAAC

2001 GGTGGCATTC AGTTCGCCCG TTACCGATTT GGCACAACAA GCGATTGCCG

2051 TAGCACACAA AGCAGCAAAC AAGTCGGACA AAGCAAAAAC GACCGCGTTA

2101 ATGCCATGGC GGCTGCCAAT GCAGGTTGGC AGGCCTATCA AACAGGCAAA

2151 GGCGCACAAA ACTTAG

它对应于氨基酸序列<SEQ ID 522；ORF117ng-1>：

1 LLVQTEKDGL HNEQTFGEKK VFSENGKLHN YWRARRKGHD ETGHREQNYT

51 LPEEITRDIS LGSFAYESHS KALSRHAPSQ GTELPQSNRD NIRTAKSNGI

101 SLPYTPNSFT PLPGSSLYII NPANKGYLVE TDPRFANYRQ WLGSDYMLGS

151 LKLDPNNLHK RLGDGYYEQR LINEQIAELT GHRRLDGYQN DEEQFKALMD

201 NGATAARSMN LSVGIALSAE QAAQLTSDIV WLVQKEVKLP DGGTQTVLMP

251 QVYVRVKNGG IDGKGALLSG SNTQINVSGS LKNSGTIAGR NALIINTDTL

301 DNIGGRIHAQ KSAVTATQDI NNIGGILSAE QTLLLNAGNN INNQSTAKSS

351 QNAQGSSTYL DRMAGIYITG KEKGVLAAQA GKDINIIAGQ ISNQSDQGQT

401 RLQAGRDINL DTVQTGKYQE IHFDADNHTI RGSTNEVGSS IQTKGDVTLL

451 SGNNLNAKAA EVGSAKGTLA VYAKNDITIS SGIHAGQVDD ASKHTGRSGG

501 GNKLVITDKA QSHHETAQSS TFEGKQVVLQ AGNDANILGS NVISDNGTRI

551 QAGNHVRIGT TQTQSQSETY HQTQKSGLMS AGIGFTIGSK TNTQENQSQS

601 NEHTGSTVGS LKGDTTIVAS KHYEQTGSNV SSPEGNNLIS TQSMDIGAAQ

651 NQLNSKTTQT YEQKGLTVAF SSPVTDLAQQ AIAVAHKAAN KSDKAKTTAL

701 MPWRLPMQVG RPIKQAKAHK T*

ORF117ng-1和ORF117显示在230个氨基酸的重叠区内同样有90％的相同性。另外，它显示出与数据库中一种分泌型脑膜炎奈瑟球菌蛋白同源：

gi|2623258(AF030941)推定分泌的蛋白[脑膜炎奈瑟球菌]长度＝2273

评分＝604位(1541)，估计值＝e-172

相同性＝325/678(47％)，阳性＝449/678(65％)，空隙＝22/678(3％)

询问：1 LLVQTEKDGLHNEQTFGEKKVFSENGKLHNYWRARRKGHDETGHREQNYTLPEEITRDIS 60

L+V T + L N++T G K + ++ G LH Y R +KG D TG+ Y E++ I

目标：739 LIVGTPESALDNDETLGTKTI-TDKGDLHRYHRHHKKGRDSTGYSRSPYEPAPEVS-SIR 796

询问：61 LGSFAYESHSKALSRHAPSQGTELPQSNRDNIRTAKSNGISLPYTPNSFTPLPGSSLYII 120

+G AY+ + AP Q +++P + + NGI +T LP SSL+ I

目标：797 MGISAYKGY-------APQQASDIPGTV---VPVVAENGIHPTFT------LPNSSLFAI 840

询问：121 NPANKGYLVETDPRFANYRQWLGSDYMLGSLKLDPNNLHKRLGDGYYEQRLINEQIAELT 180

P NKGYL+ETDP F +YR+WLGS YML +L+ DPN++HKRLGDGYYEQ+L+NEQIA+LT

目标：841 APNNKGYLIETDPAFTDYRKWLGSGYMLAALQQDPNHIHKRLGDGYYEQKLVNEQIAKLT 900

询问：181 GHRRLDGYQNDEEQFKALMDNGATAARSMNLSVGIALSAEQAAQLTSDIVWLVQKEVKLP 240

G+RRLDGY NDEEQFKALMDNG T A+ + L+ GIALSAEQ A+LTSDIVWL + V LP

目标：901 GYRRLDGYTNDEEQFKALMDNGITIAKELQLTPGIALSAEQVARLTSDIVWLENETVTLP 960

询问：241 DGGTQTVLMPQVYVRVKNGGIDGKGALLSGSNTQINVSGSLKN-SGTIAGRNALIINTDT 299

DG TQTVL P+VYVR + ++G+GALLSGS I SG+++N G IAGR ALI+N

目标：961 DGTTQTVLKPKVYVRARPKDMNGQGALLSGSVVDIG-SGAIENRGGLIAGREALILNAQN 1019

询问：300 LDNIGGRIHAQKSAVTATQDINNIGGILSAEQTLLLNAGNNINNQSTAKSSQNAQGSSTY 359

+ N+ G + + A DI N G I AE LLL A NNI ++S +S+QN QGS

目标：1020 IKNLQGDLQGKNIFAAAGSDITNTGSI-GAENALLLKASNNIESRSETRSNQNEQGSVRN 1078

询问：360 LDRMAGIYITGKEKGVLAAQAGKDINIIAGQISNQSDQGQTRLQAGRDINLDTVQTGKYQ 419

+ R+AGIY+TG++ G + AG +I + A +++NQS+ GQT L AG DI DT + Q

目标：1079 IGRVAGIYLTGRQNGSVLLDAGNNIVLTASELTNQSEDGQTVLNAGGDIRSDTTGISRNQ 1138

询问：420 EIHFDADNHTIRGSTNEVGSSIQTKGDVTLLSGNNLNAKAAEVGSAKGTLAVYAKNDITI 479

FD+DN+ IR NEVGS+I+T+G+++L + ++ +AAEVGS +G L + A DI +

目标：1139 NTIFDSDNYVIRKEQNEVGSTIRTRGNLSLNAKGDIRIRAAEVGSEQGRLKLAAGRDIKV 1198

询问：480 SSGIHAGQVDDASKHTGRSGGGNKLVITDKAQSHHETAQSSTFEGKQVVLQAGNDANILG 539

+G + +DA K+TGRSGGG K +T ++ + A S T +GK+++L +G D + G

目标：1199 EAGKAHTETEDALKYTGRSGGGIKQKMTRHLKNQNGQAVSGTLDGKEIILVSGRDITVTG 1258

询问：540 SNVISDNGTRIQAGNHVRIGTTQTQSQSETYHQTQKSGLM-SAGIGFTIGSKTNTQENQS 598

SN+I+DN T + A N++ + +T+S+S ++ +KSGLM S GIGFT GSK +TQ N+S

目标：1259 SNIIADNHTILSAKNNIVLKAAETRSRSAEMNKKEKSGLMGSGGIGFTAGSKKDTQTNRS 1318

询问：599 QSNEHTGSTVGSLKGDTTIVASKHYEQTGSNVSSPEGNNLISTQSMDIGAAQNQLNSKTT 658

++ HT S VGSL G+T I A KHY QTGS +SSP+G+ IS+ + I AAQN+ + ++

目标：1319 ETVSHTESVVGSLNGNTLISAGKHYTQTGSTISSPQGDVGISSGKISIDAAQNRYSQESK 1378

询问：659 QTYEQKGLTVAFSSPVTD 676

Q YEQKG+TVA S PV +

目标：1379 QVYEQKGVTVAISVPVVN 1396

实施例63

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 523>：

1 ATGATTTACA TCGTACTGTT TCTAGCTGTC GTCCTCGCCG TTGTCGCCTA

51 CAACATGTAT CAGGAAAACC AATACCGCAA AAAAGTGCGC GACCAGTTCG

101 GACACTCCGA CAAAGATGCC CTGCTCAACA GCAwAACCAG CCATGTCCGC

151 GACGGCAAAC CGTCCGGCGG GTCAGTCATG ATGCCGAAAC CCCAACCGGC

201 GGTCAAAAAA ACGGCAAAAC CCCAAGACCC CGyCATGCGC AACCTGCAAG

251 AACAGGATGC CGTCTACATC GCCAAGCAGA AACAGGCAAA AGCCTCCCCG

301 TTCAAAACCG AAATCGAAAC CGCCTTGGAA GAAAGCGGCA TTATCGGCAA

351 CTCCGCCCAC ACCGTTTCCG AACCCCAAAC CGGACATTCC GCAACGAAAC

401 CTGCCGACGC GTCGGCAAAA CCTGCACCCG TTCCGCAAAC ACCTGCAAAA

451 CCGCTGATTA CGCTCAAAGA ACTGTCAAAA GTCGAATTAT CCTGGTTTGA

501 CGTGCGCATC GACTTCATCT CCTAT...

它对应于氨基酸序列<SEQ ID 524；ORF119>：

1 MIYIVLFLAV VLAVVAYNMY QENQYRKKVR DQFGHSDKDA LLNSXTSHVR

51 DGKPSGGSVM MPKPQPAVKK TAKPQDPXMR NLQEQDAVYI AKQKQAKASP

101 FKTEIETALE ESGIIGNSAH TVSEPQTGHS ATKPADASAK PAPVPQTPAK

151 PLITLKELSK VELSWFDVRI DFISY...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 525>：

1 ATGATTTACA TCGTACTGTT TCTAGCTGTC GTCCTCGCCG TTGTCGCCTA

51 CAACATGTAT CAGGAAAACC AATACCGCAA AAAAGTGCGC GACCAGTTCG

101 GACACTCCGA CAAAGATGCC CTGCTCAACA GCAAAACCAG CCATGTCCGC

151 GACGGCAAAC CGTCCGGCGG GTCAGTCATG ATGCCGAAAC CCCAACCGGC

201 GGTCAAAAAA ACGGCAAAAC CCCAAGACCC CGCCATGCGC AACCTGCAAG

251 AACAGGATGC CGTCTACATC GCCAAGCAGA AACAGGCAAA AGCCTCCCCG

301 TTCAAAACCG AAATCGAAAC CGCCTTGGAA GAAAGCGGCA TTATCGGCAA

351 CTCCGCCCAC ACCGTTTCCG AACCCCAAAC CGGACATTCC GCACCGAAAC

401 CTGCCGACGC GCCGGCAAAA CCTGCACCCG TTCCGCAAAC ACCTGCAAAA

451 CCGCTGATTA CGCTCAAAGA ACTGTCAAAA GTCGAATTAC CCTGGTTTGA

501 CGTGCGCTTC GACTTCATCT CCTATATCGC GCTGACCGAA GCCAAAGAAC

551 TGCACGCACT GCCGCGCCTT TCCAACCGCT GCCGCTACCA GATTGTCGGC

601 TGCACCATGG ACGACCATTT CCAGATTGCC GAACCCATCC CGGGCATCCG

651 CTATCAGGCA TTTATCGTGG GTATTCAGGC AGTCAGCCGC AACGGACTTG

701 CCTCGCAGGA AGAACTCTCC GCATTCAACC GCCAGGTGGA CGCATTCGCA

751 CAAAGCATGG GCGGTCAGAC GCTGCACACC GACCTTGCCG CCTTTATCGA

801 AGTGGCTTCC GCACTGGACG CATTCTGCGC GCGCGTCGAC CAGACCATCG

851 CCATCCATTT GGTTTCCCCG ACCAGCATCA GCGGCGTAGA ACTGCGTTCC

901 GCCGTAACGG GCGTGGGTTT CGTTTTGGAA GACGACGGCG CGTTCCACTA

951 TACCGACACG TCGGGCTCGA CCATGTTCTC CATCTGCTCG CTCAACAACG

1001 AGCCGTTTAC CAACGCCCTT TTGGACAACC AGTCCTACAA AGGCTTCAGT

1051 ATGCTGCTCG ACATCCCGCA CTCTCCGGCA GGCGAAAAAA CCTTCGACGA

1101 TTTGTTTATG GATTTGGCGG TACGCCTGTC CGGCCAGTTG AACCTGAATC

1151 TGGTCAACGA CAAAATGGAA GAAGTTTCGA CCCAATGGCT CAAAGACGTG

1201 CGCACTTATG TATTGGCGCG TCAGTCCGAG ATGCTCAAAG TCGGTATCGA

1251 ACCGGGCGGC AAAACCGCAT TGCGCCTGTT CTCCTAA

它对应于氨基酸序列<SEQ ID 526；ORF119-1>：

1 MIYIVLFLAV VLAVVAYNMY QENQYRKKVR DQFGHSDKDA LLNSKTSHVR

51 DGKPSGGSVM MPKPQPAVKK TAKPQDPAMR NLQEQDAVYI AKQKQAKASP

101 FKTEIETALE ESGIIGNSAH TVSEPQTGHS APKPADAPAK PAPVPQTPAK

151 PLITLKELSK VELPWFDVRF DFISYIALTE AKELHALPRL SNRCRYQIVG

201 CTMDDHFQIA EPIPGIRYQA FIVGIQAVSR NGLASQEELS AFNRQVDAFA

251 QSMGGQTLHT DLAAFIEVAS ALDAFCARVD QTIAIHLVSP TSISGVELRS

301 AVTGVGFVLE DDGAFHYTDT SGSTMFSICS LNNEPFTNAL LDNQSYKGFS

351 MLLDIPHSPA GEKTFDDLFM DLAVRLSGQL NLNLVNDKME EVSTQWLKDV

401 RTYVLARQSE MLKVGIEPGG KTALRLFS*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF119显示和脑膜炎奈瑟球菌菌株A的ORF(ORF119a)在175个氨基酸的重叠区内有93.7％的相同性：

10 20 30 40 50 60

orf119.pep MIYIVLFLAVVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSXTSHVRDGKPSGGSVM

|||||||||:|||||||||||||||||||||||||||||||||| |||||||||||| ||

orf119a MIYIVLFLAAVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGPVM

10 20 30 40 50 60

70 80 90 100 110 120

orf119.pep MPKPQPAVKKTAKPQDPXMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH

||||||||||||| ||| ||||||||||||||||||||||||||||||||||||||||||

orf119a MPKPQPAVKKTAKSQDPAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH

70 80 90 100 110 120

130 140 150 160 170

orf119.pep TVSEPQTGHSATKPADASAKPAPVPQTPAKPLITLKELSKVELSWFDVRIDFISY

|| |||||||| ||||| |||:||||||||||||||||||||| |||||:|||||

orf119a TVPEPQTGHSAPKPADAPAKPVPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE

130 140 150 160 170 180

orf119a AKELHALPRLSNRCRYQIVGCTMDDHFQIAEPIPGIRYQAFIVGIQAVSRNGLASQEELS

190 200 210 220 230 240

全长ORF119a核苷酸序列<SEQ ID 527>是：

1 ATGATTTACA TCGTACTGTT CCTCGCCGCC GTCCTCGCCG TTGTCGCCTA

51 CAATATGTAT CAGGAAAACC AATACCGCAA AAAAGTGCGC GACCAGTTCG

101 GGCACTCCGA CAAAGATGCC CTGCTCAACA GCAAAACCAG CCATGTCCGC

151 GACGGCAAAC CGTCCGGCGG GCCAGTCATG ATGCCGAAAC CCCAACCGGC

201 GGTCAAAAAA ACGGCAAAAT CCCAAGACCC CGCCATGCGC AACCTGCAAG

251 AGCAGGATGC CGTCTACATC GCCAAGCAGA AACAGGCAAA AGCCTCCCCG

301 TTCAAAACCG AAATCGAAAC CGCCTTGGAA GAAAGCGGCA TTATCGGCAA

351 CTCCGCCCAC ACCGTTCCCG AACCCCAAAC CGGACATTCC GCACCAAAAC

401 CTGCCGACGC GCCGGCAAAA CCTGTTCCCG TTCCGCAAAC GCCGGCAAAA

451 CCGCTGATTA CGCTCAAAGA GCTGTCGAAG GTCGAGCTGC CCTGGTTTGA

501 CGTGCGCTTC GACTTCATCT CTTATATCGC GCTGACCGAA GCCAAAGAAC

551 TGCACGCACT GCCGCGCCTT TCCAACCGCT GCCGCTACCA GATTGTCGGC

601 TGCACCATGG ACGACCATTT CCAGATTGCC GAACCCATCC CGGGCATCCG

651 CTATCAGGCA TTTATCGTGG GTATTCAGGC AGTCAGCCGC AACGGACTTG

701 CCTCGCAGGA AGAACTCTCC GCATTCAACC GCCAGGTGGA TGCATTCGCA

751 CACAGCATGG GCGGTCAGAC GCTGCACACC GACCTTGCCG CCTTTATCGA

801 AGTGGCTTCC GCACTGGACG CATTCTGCGC GCGCGTCGAC CAGACTATCG

851 CCATCCATTT GGTTTCCCCG ACCAGCATCA GCGGCGTAGA ACTGCGTTCC

901 GCCGTAACGG GCGTGGGTTT CGTTTTGGAA GACGACGGCG CGTTCCACTA

951 TACCGACACG TCGGGCTCGA CCATGTTCTC CATCTGCTCG CTCAACAACG

1001 AGCCGTTTAC CAATGCCCTT TTGGACAACC AGTCCTATAA AGGCTTCAGT

1051 ATGCTGCTCG ACATCCCGCA CTCTCCGGCA GGCGAAAAAA CCTTCGACGA

1101 TTTGTTTATG GATTTGGCGG TACGCCTGTC CGGCCAGTTG AACCTGAATC

1151 TGGTCAACGA CAAAATGGAA GAAGTTTCGA CCCAATGGCT CAAAGACGTG

1201 CGCACTTATG TATTGGCTCG TCAGTCCGAG ATGCTCAAAG TCGGTATCGA

1251 ACCGGGCGGC AAAACCGCAT TGCGCCTGTT CTCCTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 528>：

1 MIYIVLFLAA VLAVVAYNMY QENQYRKKVR DQFGHSDKDA LLNSKTSHVR

51 DGKPSGGPVM MPKPQPAVKK TAKSQDPAMR NLQEQDAVYI AKQKQAKASP

101 FKTEIETALE ESGIIGNSAH TVPEPQTGHS APKPADAPAK PVPVPQTPAK

151 PLITLKELSK VELPWFDVRF DFISYIALTE AKELHALPRL SNRCRYQIVG

201 CTMDDHFQIA EPIPGIRYQA FIVGIQAVSR NGLASQEELS AFNRQVDAFA

251 HSMGGQTLHT DLAAFIEVAS ALDAFCARVD QTIAIHLVSP TSISGVELRS

301 AVTGVGFVLE DDGAFHYTDT SGSTMFSICS LNNEPFTNAL LDNQSYKGFS

351 MLLDIPHSPA GEKTFDDLFM DLAVRLSGQL NLNLVNDKME EVSTQWLKDV

401 RTYVLARQSE MLKVGIEPGG KTALRLFS*

ORF119a和ORF119-1显示在428个氨基酸的重叠区内有98.6％的相同性：

10 20 30 40 50 60

orf119a.pep MIYIVLFLAAVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGPVM

|||||||||:||||||||||||||||||||||||||||||||||||||||||||||| ||

orf119-1 MIYIVLFLAVVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGSVM

10 20 30 40 50 60

70 80 90 100 110 120

orf119a.pep MPKPQPAVKKTAKSQDPAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH

||||||||||||| ||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 MPKPQPAVKKTAKPQDPAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH

70 80 90 100 110 120

130 140 150 160 170 180

orf119a.pep TVPEPQTGHSAPKPADAPAKPVPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE

|| ||||||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf119-1 TVSEPQTGHSAPKPADAPAKPAPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE

130 140 150 160 170 180

190 200 210 220 230 240

orf119a.pep AKELHALPRLSNRCRYQIVGCTMDDHFQIAEPIPGIRYQAFIVGIQAVSRNGLASQEELS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AKELHALPRLSNRCRYQIVGCTMDDHFQIAEPIPGIRYQAFIVGIQAVSRNGLASQEELS

190 200 210 220 230 240

250 260 270 280 290 300

orf119a.pep AFNRQVDAFAHSMGGQTLHTDLAAFIEVASALDAFCARVDQTIAIHLVSPTSISGVELRS

||||||||||:|||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AFNRQVDAFAQSMGGQTLHTDLAAFIEVASALDAFCARVDQTIAIHLVSPTSISGVELRS

250 260 270 280 290 300

310 320 330 340 350 360

orf119a.pep AVTGVGFVLEDDGAFHYTDTSGSTMFSICSLNNEPFTNALLDNQSYKGFSMLLDIPHSPA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AVTGVGFVLEDDGAFHYTDTSGSTMFSICSLNNEPFTNALLDNQSYKGFSMLLDIPHSPA

310 320 330 340 350 360

370 380 390 400 410 420

orf119a.pep GEKTFDDLFMDLAVRLSGQLNLNLVNDKMEEVSTQWLKDVRTYVLARQSEMLKVGIEPGG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 GEKTFDDLFMDLAVRLSGQLNLNLVNDKMEEVSTQWLKDVRTYVLARQSEMLKVGIEPGG

370 380 390 400 410 420

429

orf119a.pep KTALRLFSX

|||||||||

orf119-1 KTALRLFSX

与淋病奈瑟球菌的预计ORF的同源性

ORF119显示和淋病奈瑟球菌的预计ORF(ORF119ng)在175个氨基酸的重叠区内有93.1％的相同性：

orf119.pep MIYIVLFLAVVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSXTSHVRDGKPSGGSVM 60

|||||||||:|||||||||||||||||||||||||||||||||| |||||||||||| ||

orf119ng MIYIVLFLAAVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGPVM 60

orf119.pep MPKPQPAVKKTAKPQDPXMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH 120

|||||||||| ||||| |||||||||||||||||||||||||||||||||| ||||||||

orf119ng MPKPQPAVKKPAKPQDSAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEEIGIIGNSAH 120

orf119.pep TVSEPQTGHSATKPADASAKPAPVPQTPAKPLITLKELSKVELSWFDVRIDFISY 175

||||||||||| ||||| |||:||||||||||||||||||||| |||||:|||||

orf119ng TVSEPQTGHSAPKPADAPAKPVPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE 180

全长ORF119ng核苷酸序列<SEQ ID 529>是：

1 ATGATTTACA TCGTACTGTT CCTCGCCGCC GTCCTCGCCG TTGTCGCCTA

51 CAATATGTAT CAGGAAAACC AATACCGCAA AAAAGTGCGC GACCAGTTCG

101 GACACTCCGA CAAAGATGCC CTGCTCAACA GCAAAACCAG CCATGTCCGC

151 GACGGCAAAC CGTCCGGCGG GCCAGTCATG ATGCCGAAAC CCCAACCGGC

201 GGTCAAAAAA CCGGCCAAAC CCCAAGACTC CGCCATGCGC AACCTGCAAG

251 AACAGGATGC CGTCTACATC GCCAAGCAGA AACAGGCAAA AGCCTCCCCG

301 TTCAAAACCG AAATCGAAAC CGCCTTGGAA GAAATCGGCA TTATCGGCAA

351 CTCCGCCCAC ACCGTTTCCG AACCCCAAAC CGGACATTCC GCACCGAAAC

401 CTGCCGACGC GCCGGCAAAA CCCGTTCCCG TTCCGCAAAC GCCGGCAAAA

451 CCGCTGATTA CGCTCAAAGA GCTGTCGAAG GTCGAGCTGC CCTGGTTTGA

501 CGTGCGCTtc gACTTCATCT CCTATATCGC GCTGACCGAA GCCAAAGAAC

551 TGCACGCACT GCCGCGCCTT tccAACCGCT GCCGCTACCA GATTGTCGGC

601 TGCACCATGG ACGACCATTT CCAGATTGCC GAACCCATCC CGGGCATCCG

651 CTATCAGGCA TTTATCGTGG GTATCCAGGC AGTCAGCCGC AACGGACTTG

701 CCTCGCAGGA AGAACTCTCC GCATTCAACC GCCAGGCGGA CGCATTCGCA

751 CAAAGCATGG GCGGTCAGAC GCTGCACACC GACCTTGCCG CCTTTATCGA

801 AGTGGCTTCC GCACTGGACG CATTCTGCGC GCGCGTCGAC CAGACCATCG

851 CCATCCATTT GGTTTCGCCG ACCAGCATCA GCGGCGTAGA ACTGCGTTCC

901 GCCGTAACGG GCGTGGGTTT CGTTTTGGAA GACGACGGCG CGTTCCACTA

951 TACCGACACG TCGGGCTCGA CCATGTTCTC CATCTGCTCG CTCAACAACG

1001 AGCCGTTTAC CAATGCCCTT TTGGACAACC AGTCCTACAA AGGCTTCAGT

1051 ATGCTGCTCG ACATCCCGCA CTCTCCGGCA GGCGAAAAAA CCTTCGACGA

1101 TTTGTTTATG GATTTGGCGG TACGCCTGTC CGGTCAGTTG AACCTGAATC

1151 TGGTCAACGA CAAAATGGAA GAAGTTTCGA CCCAATGGCT CAAAGACGTA

1201 CGCACTTATG TATTGGCGCG TCAGTCCGAG ATGCTCAAAG TCGGTATCGA

1251 ACCGGGCGGC AAAACCGCCC TGCGCCTGTT TTCATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 530>：

1 MIYIVLFLAA VLAVVAYNMY QENQYRKKVR DQFGHSDKDA LLNSKTSHVR

51 DGKPSGGPVM MPKPQPAVKK PAKPQDSAMR NLQEQDAVYI AKQKQAKASP

101 FKTEIETALE EIGIIGNSAH TVSEPQTGHS APKPADAPAK PVPVPQTPAK

151 PLITLKELSK VELPWFDVRF DFISYIALTE AKELHALPRL SNRCRYQIVG

201 CTMDDHFQIA EPIPGIRYQA FIVGIQAVSR NGLASQEELS AFNRQADAFA

251 QSMGGQTLHT DLAAFIEVAS ALDAFCARVD QTIAIHLVSP TSISGVELRS

301 AVTGVGFVLE DDGAFHYTDT SGSTMFSICS LNNEPFTNAL LDNQSYKGFS

351 MLLDIPHSPA GEKTFDDLFM DLAVRLSGQL NLNLVNDKME EVSTQWLKDV

401 RTYVLARQSE MLKVGIEPGG KTALRLFS*

ORF119ng和ORF119-1显示在428个氨基酸的重叠区内有98.4％的相同性：

10 20 30 40 50 60

orf119ng MIYIVLFLAAVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGPVM

|||||||||:||||||||||||||||||||||||||||||||||||||||||||||| ||

orf119-1 MIYIVLFLAVVLAVVAYNMYQENQYRKKVRDQFGHSDKDALLNSKTSHVRDGKPSGGSVM

10 20 30 40 50 60

70 80 90 100 110 120

orf119ng MPKPQPAVKKPAKPQDSAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEEIGIIGNSAH

|||||||||| ||||| |||||||||||||||||||||||||||||||||| ||||||||

orf119-1 MPKPQPAVKKTAKPQDPAMRNLQEQDAVYIAKQKQAKASPFKTEIETALEESGIIGNSAH

70 80 90 100 110 120

130 140 150 160 170 180

orf119ng TVSEPQTGHSAPKPADAPAKPVPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE

|||||||||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf119-1 TVSEPQTGHSAPKPADAPAKPAPVPQTPAKPLITLKELSKVELPWFDVRFDFISYIALTE

130 140 150 160 170 180

190 200 210 220 230 240

orf119ng AKELHALPRLSNRCRYQIVGCTMDDHFQIAEPIPGIRYQAFIVGIQAVSRNGLASQEELS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AKELHALPRLSNRCRYQIVGCTMDDHFQIAEPIPGIRYQAFIVGIQAVSRNGLASQEELS

190 200 210 220 230 240

250 260 270 280 290 300

orf119ng AFNRQADAFAQSMGGQTLHTDLAAFIEVASALDAFCARVDQTIAIHLVSPTSISGVELRS

|||||:||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AFNRQVDAFAQSMGGQTLHTDLAAFIEVASALDAFCARVDQTIAIHLVSPTSISGVELRS

250 260 270 280 290 300

310 320 330 340 350 360

orf119ng AVTGVGFVLEDDGAFHYTDTSGSTMFSICSLNNEPFTNALLDNQSYKGFSMLLDIPHSPA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 AVTGVGFVLEDDGAFHYTDTSGSTMFSICSLNNEPFTNALLDNQSYKGFSMLLDIPHSPA

310 320 330 340 350 360

370 380 390 400 410 420

orf119ng GEKTFDDLFMDLAVRLSGQLNLNLVNDKMEEVSTQWLKDVRTYVLARQSEMLKVGIEPGG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf119-1 GEKTFDDLFMDLAVRLSGQLNLNLVNDKMEEVSTQWLKDVRTYVLARQSEMLKVGIEPGG

370 380 390 400 410 420

429

orf119ng KTALRLFSX

|||||||||

orf119-1 KTALRLFSX

根据该分析结果，包括此淋球菌蛋白中有一个推定的前导序列，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例64

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 531>

1 ..GCGCGGCACG GCACGGAAGA TTTCTTCATG AACAACAGCG ACAC.ATCAG

51 GCAGATAGTC GAAAGCACCA CCGGTACGAT GAAGCTGCTG ATTTCCTCCA

101 TCGCCCTGAT TTCATTGGTA GTCGGCGGCA TCGGCGTGAT GAACATCATG

151 CTGGTGTCCG TTACCGAGCG CACCAAAGAA ATCGGCATAC GGATGGCAAT

201 CGGCGCGCGG CGCGGCAATA TTTyGCAGCA GTTTTTGATT GAGGCGGTGT

251 TAATCTGCGT CATCGGCGGT TTGGTCGGCG TGGGTTTGTC CGCCGCCGTC

301 AGCCTCGTGT TCAATCATTT TGTAACCGAC TTCCCGATGG ACATTTCCGC

351 CATGTCCGTC ATCGGCGCGG TCGCCTGTTC GACCGGAATC GGCATCGCGT

401 TCGGCTTTAT GCCTGCCAAT AAAGCAGCCA AACTCAATCC GATAGACGCA

451 TTGGCACAGG ATTGA

它对应于氨基酸序列<SEQ ID 532；ORF134>：

1 ..ARHGTEDFFM NNSDXIRQIV ESTTGTMKLL ISSIALISLV VGGIGVMNIM

51 LVSVTERTKE IGIRMAIGAR RGNIXQQFLI EAVLICVIGG LVGVGLSAAV

101 SLVFNHFYTD FPMDISAMSV IGAVACSTGI GIAFGFMPAN KAAKLNPIDA

151 LAQD*

进一步的工作揭示了其完整的核苷酸序列<SEQ ID 533>：

1 ATGTCGGTGC AAGCAGTATT GGCGCACAAA ATGCGTTCGC TTCTGACGAT

51 GCTCGGCATC ATCATCGGTA TCGCGTCGGT GGTTTCCGTC GTCGCATTGG

101 GCAATGGTTC GCAGAAAAAA ATCCTTGAAG ACATCAGTTC GATAGGGACG

151 AACACCATCA GCATCTTCCC GGGGCGCGGC TTCGGCGACA GGCGCAGCGG

201 CAGGATTAAA ACCCTGACCA TAGACGACGC AAAAATCATC GCCAAACAAA

251 GCTACGTTGC TTCCGCCACG CCCATGACTT CGAGCGGCGG CACGCTGACT

301 TACCGCAACA CCGACCTGAC CGCCTCGCTT TACGGCGTGG GCGAACAATA

351 TTTCGACGTG CGCGGACTGA AGCTGGAAAC GGGGCGGCTG TTTGACGAAA

401 ACGATGTGAA AGAAGACGCG CAGGTCGTCG TCATCGACCA AAATGTCAAA

451 GACAAACTCT TTGCGGACTC GGATCCGTTG GGTAAAACCA TTTTGTTCAG

501 GAAACGCCCC TTGACCGTCA TCGGCGTGAT GAAAAAAGAC GAAAACGCTT

551 TCGGCAATTC CGACGTGCTG ATGCTTTGGT CGCCCTATAC GACGGTGATG

601 CACCAAATCA CAGGCGAGAG CCACACCAAC TCCATCACCG TCAAAATCAA

651 AGACAATGCC AATACCCAGG TTGCCGAAAA AGGGCTGACC GATCTGCTCA

701 AAGCGCGGCA CGGCACGGAA GATTTCTTCA TGAACAACAG CGACAGCATC

751 AGGCAGATAG TCGAAAGCAC CACCGGTACG ATGAAGCTGC TGATTTCCTC

801 CATCGCCCTG ATTTCATTGG TAGTCGGCGG CATCGGCGTG ATGAACATCA

851 TGCTGGTGTC CGTTACCGAG CGCACCAAAG AAATCGGCAT ACGGATGGCA

901 ATCGGCGCGC GGCGCGGCAA TATTTTGCAG CAGTTTTTGA TTGAGGCGGT

951 GTTAATCTGC GTCATCGGCG GTTTGGTCGG CGTGGGTTTG TCCGCCGCCG

1001 TCAGCCTCGT GTTCAATCAT TTTGTAACCG ACTTCCCGAT GGACATTTCC

1051 GCCATGTCCG TCATCGGCGC GGTCGCCTGT TCGACCGGAA TCGGCATCGC

1101 GTTCGGCTTT ATGCCTGCCA ATAAAGCAGC CAAACTCAAT CCGATAGACG

1151 CATTGGCACA GGATTGA

它对应于氨基酸序列<SEQ ID 534；ORF134-1>：

1 MSVQAVLAHK MRSLLTMLGI IIGIASVVSV VALGNGSQKK ILEDISSIGT

51 NTISIFPGRG FGDRRSGRIK TLTIDDAKII AKQSYVASAT PMTSSGGTLT

101 YRNTDLTASL YGVGEQYFDV RGLKLETGRL FDENDVKEDA QVVVIDQNVK

151 DKLFADSDPL GKTILFRKRP LTVIGVMKKD ENAFGNSDVL MLWSPYTTVM

201 HQITGESHTN SITVKIKDNA NTQVAEKGLT DLLKARHGTE DFFMNNSDSI

251 RQIVESTTGT MKL LISSIAL ISLVVGGIGV MNIMLVSVTE RTKEIGIRMA

301 IGARRGNILQ Q FLIEAVLIC VIGGLVGVGL SAAVSLVFNH FVTDFPMDIS

351 AMS VIGAVAC STGIGIAFGF MPANKAAKLN PIDALAQD*

该氨基酸序列的计算机分析给出了下列结果：

与假设的大肠杆菌o648蛋白(登录号为AE000189)的同源性

ORF134和o648蛋白显示在153个氨基酸的重叠区内有45％的氨基酸相同性：

Orf134：2 RHGTEDFFMNNSDXIRQIVESTTGTMKXXXXXXXXXXXVVGGIGVMNIMLVSVTERTKEI 61

RHG +DFF N D + + VE TT T++ VVGGIGVMNIMLVSVTERT+EI

o648： 496 RHGKKDFFTWNMDGVLKTVEKTTRTLQLFLTLVAVISLVVGGIGVMNIMLVSVTERTREI 555

Orf134：62 GIRMAIGARRGNIXQQFLIEAXXXXXXXXXXXXXXXXXXXXXFNHFVTDFPMDISAMSVI 121

GIRMA+GAR ++ QQFLIEA F+ + + S ++++

o648： 556 GIRMAVGARASDVLQQFLIEAVLVCLVGGALGITLSLLIAFTLQLFLPGWEIGFSPLALL 615

Orf134：122 GAVACSTGIGIAFGFMPANKAAKLNPIDALAQD 154

A CST GI FG++PA AA+L+P+DALA++

o648： 616 LAFLCSTVTGILFGWLPARNAARLDPVDALARE 648

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF134显示和脑膜炎奈瑟球菌菌株A的ORF(ORF134a)在154个氨基酸的重叠区内有98.7％的相同性：

10 20 30

orf134.pep ARHGTEDFFMNNSDXIRQIVESTTGTMKLL

|||||||||||||| |||||||||||||||

orf134a GESHTNSITVKIKDNANTQVAEKGLTDLLKARHGTEDFFMNNSDSIRQIVESTTGTMKLL

210 220 230 240 250 260

40 50 60 70 80 90

orf134.pep ISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMAIGARRGNIXQQFLIEAVLICVIGG

|||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||

orf134a ISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMAIGARRGNILQQFLIEAVLICVIGG

270 280 290 300 310 320

100 110 120 130 140 150

orf134.pep LVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVACSTGIGIAFGFMPANKAAKLNPIDA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134a LVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVACSTGIGIAFGFMPANKAAKLNPIDA

330 340 350 360 370 380

orf134.pep LAQDX

|||||

orf134a LAQDX

全长ORF134a核苷酸序列<SEQ ID 535>是：

1 ATGTCGGTGC AAGCAGTATT GGCGCACAAA ATGCGTTCGC TTCTGACGAT

51 GCTCGGCATC ATCATCGGTA TCGCTTCGGT TGTCTCCGTC GTCGCATTGG

101 GCAACGGTTC GCAGAAAAAA ATCCTTGAAG ACATCAGTTC GATAGGGACG

151 AACACCATCA GCATCTTCCC AGGGCGCGGC TTCGGCGACA GGCGCAGCGG

201 CAGGATTAAA ACCCTGACCA TAGACGACGC AAAAATCATC GCCAAACAAA

251 GCTACGTTGC TTCCGCCACG CCCATGACTT CGAGCGGCGG CACGCTGACT

301 TACCGCAATA CCGACCTGAC CGCTTCTTTG TACGGTGTGG GCGAACAATA

351 TTTCGACGTG CGCGGGCTGA AGCTGGAAAC GGGGCGGCTG TTTGACGAAA

401 ACGATGTGAA AGAAGACGCG CAGGTCGTCG TCATCGACCA AAATGTCAAA

451 GACAAACTCT TTGCGGACTC GGATCCGTTG GGTAAAACCA TTTTGTTCAG

501 GAAACGCCCC TTGACCGTCA TCGGCGTGAT GAAAAAAGAC GAAAACGCTT

551 TCGGCAATTC CGACGTGCTG ATGCTTTGGT CGCCCTATAC GACGGTGATG

601 CACCAAATCA CAGGCGAGAG CCACACCAAC TCCATCACCG TCAAAATCAA

651 AGACAATGCC AATACCCAGG TTGCCGAAAA AGGGCTGACC GATCTGCTCA

701 AAGCGCGGCA CGGCACGGAA GATTTCTTCA TGAACAACAG CGACAGCATC

751 AGGCAGATAG TCGAAAGCAC CACCGGTACG ATGAAGCTGC TGATTTCCTC

801 CATCGCCCTG ATTTCATTGG TAGTCGGCGG CATCGGCGTG ATGAACATCA

851 TGCTGGTGTC CGTTACCGAG CGCACCAAAG AAATCGGCAT ACGGATGGCA

901 ATCGGCGCGC GGCGCGGCAA TATTTTGCAG CAGTTTTTGA TTGAGGCGGT

951 GTTAATCTGC GTCATCGGCG GTTTGGTCGG CGTGGGTTTG TCCGCCGCCG

1001 TCAGCCTCGT GTTCAATCAT TTTGTAACCG ACTTCCCGAT GGACATTTCC

1051 GCCATGTCCG TCATCGGCGC GGTCGCCTGT TCGACCGGAA TCGGCATCGC

1101 GTTCGGCTTT ATGCCTGCCA ATAAAGCAGC CAAACTCAAT CCGATAGATG

1151 CATTGGCGCA GGATTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 536>：

1 MSVQAVLAHK MRSLLTMLGI IIGIASVVSV VALGNGSQKK ILEDISSIGT

51 NTISIFPGRG FGDRRSGRIK TLTIDDAKII AKQSYVASAT PMTSSGGTLT

101 YRNTDLTASL YGVGEQYFDV RGLKLETGRL FDENDVKEDA QVVVIDQNVK

151 DKLFADSDPL GKTILFRKRP LTVIGVMKKD ENAFGNSDVL MLWSPYTTVM

201 HQITGESHTN SITVKIKDNA NTQVAEKGLT DLLKARHGTE DFFMNNSDSI

251 RQIVESTTGT MKL LISSIAL ISLVVGGIGV MNIMLVSVTE RTKEIGIRMA

301 IGARRGNILQ Q FLIEAVLIC VIGGLVGVGL SAAVSLVFNH FVTDFPMDIS

351 AMS VIGAVAC STGIGIAFGF MPANKAAKLN PIDALAQD*

ORF134a和ORF134-1显示在388个氨基酸的重叠区内有100.0％的相同性：

orf134a.pep MSVQAVLAHKMRSLLTMLGIIIGIASVVSVVALGNGSQKKILEDISSIGTNTISIFPGRG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 MSVQAVLAHKMRSLLTMLGIIIGIASVVSVVALGNGSQKKILEDISSIGTNTISIFPGRG

orf134a.pep FGDRRSGRIKTLTIDDAKIIAKQSYVASATPMTSSGGTLTYRNTDLTASLYGVGEQYFDV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 FGDRRSGRIKTLTIDDAKIIAKQSYVASATPMTSSGGTLTYRNTDLTASLYGVGEQYFDV

orf134a.pep RGLKLETGRLFDENDVKEDAQVVVIDQNVKDKLFADSDPLGKTILFRKRPLTVIGVMKKD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 RGLKLETGRLFDENDVKEDAQVVVIDQNVKDKLFADSDPLGKTILFRKRPLTVIGVMKKD

orf134a.pep ENAFGNSDVLMLWSPYTTVMHQITGESHTNSITVKIKDNANTQVAEKGLTDLLKARHGTE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 ENAFGNSDVLMLWSPYTTVMHQITGESHTNSITVKIKDNANTQVAEKGLTDLLKARHGTE

orf134a.pep DFFMNNSDSIRQIVESTTGTMKLLISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 DFFMNNSDSIRQIVESTTGTMKLLISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMA

orf134a.pep IGARRGNILQQFLIEAVLICVIGGLVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVAC

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 IGARRGNILQQFLIEAVLICVIGGLVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVAC

orf134a.pep STGIGIAFGFMPANKAAKLNPIDALAQDX

|||||||||||||||||||||||||||||

orf134-1 STGIGIAFGFMPANKAAKLNPIDALAQDX

与淋病奈瑟球菌的预计ORF的同源性

ORF134显示和淋病奈瑟球菌的预计ORF(ORF134.ng)在154个氨基酸的重叠区内有96.8％的相同性：

orf134.pep ARHGTEDFFMNNSDXIRQIVESTTGTMKLL 30

|||||||||||||| |||:|||||||||||

orf134ng GESHTNSITVKIKDNANTRVAEKGLAELLKARHGTEDFFMNNSDSIRQMVESTTGTMKLL 264

orf134.pep ISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMAIGARRGNIXQQFLIEAVLICVIGG 90

|||||||||||||||||||||||||||||||||||||||||||| |||||||||||:|||

orf134ng ISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMAIGARRGNILQQFLIEAVLICIIGG 324

orf134.pep LVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVACSTGIGIAFGFMPANKAAKLNPIDA 150

||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||

orf134ng LVGVGLSAAVSLVFNHFVTDFPMDISAASVIGAVACSTGIGIAFGFMPANKAAKLNPIDA 384

orf134.pep LAQD 154

||||

orf134ng LAQD 388

全长ORF134ng核苷酸序列<SEQ ID 537>是：

1 ATGTCGGTGC AAGCAGTATT GGCGCACAAA ATGCGTTCGC TTCTGACCAT

51 GCTCGGCATC ATCATCGGTA TCGCTTCGGT TGTCTCCGTC GTCGCGCTGG

101 GCAACGGTTC GCAGAAAAAA ATCCTCGAAG ACATCAGTTC GATGGGGACG

151 AACACCATCA GCATCTTCCC CGGGCGCGGC TTCGGCGACA GGCGCAGCGG

201 CAAAATCAAA ACCCTGACCA TAGACGACGC AAAAATCATC GCCAAACAAA

251 GCTACGTTGC CTCCGCCACG CCCATGACTT CGAGCGGCGG CACGCTGACC

301 TACCGCAATA CCGACCTGAC CGCTTCTTTG TACGGTGTGG GCGAACAATA

351 TTTCGACGTG CGCGGGCTGA AGCTGGAAAC GGGGCGGCTG TTTGATGAGA

401 ACGATGTGAA AGAAGACGCG CAAGTCGTCG TCATCGACCA AAATGTCAAA

451 GACAAACTCT TTGCGGACTC GGATCCGTTG GGTAAAACCA TTTTGTTCAG

501 GAAACGCCCC TTGACCGTCA TCGGCGTGAT GAAAAAAGAC GAAAACGCTT

551 TCGGCAATTC CGACGTGCTG ATGCTTTGGT CGCCCTATAC GACGGTGATG

601 CACCAAATCA CAGGCGAGAG CCACACCAAC TCCATCACCG TCAAAATCAA

651 AGACAATGCC AATACCCGGG TTGCCGAAAA AGGGCTGGCC GAGCTGCTCA

701 AAGCACGGCA CGGCACGGAA GACTTCTTTA TGAACAACAG CGACAGCATC

751 AGGCAGATGG TCGAAAGCAC CACCGGTACG ATGAAGCTGC TGATTTCCTC

801 CATCGCCCTG ATTTCATTGG TAGTCGGCGG CATCGGTGTG ATGAACATTA

851 TGCTGGTGTC CGTTACCGAG CGCACCAAAG AAATCGGCAT ACGGATGGCA

901 ATCGGCGCGC GGCGCGGCAA TATTTTGCAG CAGTTTTTGA TTGAGGCGGT

951 GTTAATCTGC ATCATCGGAG GCTTGGTCGG CGTAGGTTTG TCCGCCGCCG

1001 TCAGCCTCGT GTTCAATCAT TTTGTAACCG ATTTCCCGAT GGACATTTCG

1051 GCGGCATCCG TTATCGGGGC GGTCGCCTGT TCGACCGGAA TCGGCATCGC

1101 GTTCGGCTTT ATGCCTGCCA ATAAGGCAGC CAAACTCAAT CCGATAGATG

1151 CATTGGCGCA GGATTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 538>：

1 MSVQAVLAHK MRSLLTMLGI IIGIASVVSV VALGNGSQKK ILEDISSMGT

51 NTISIFPGRG FGDRRSGKIK TLTIDDAKII AKQSYVASAT PMTSSGGTLT

101 YRNTDLTASL YGVGEQYFDV RGLKLETGRL FDENDVKEDA QVVVIDQNVK

151 DKLFADSDPL GKTILFRKRP LTVIGVMKKD ENAFGNSDVL MLWSPYTTVM

201 HQITGESHTN SITVKIKDNA NTRVAEKGLA ELLKARHGTE DFFMNNSDSI

251 RQMVESTTGT MKL LISSIAL ISLVVGGIGV MNIMLVSVTE RTKEIGIRMA

301 IGARRGNILQ Q FLIEAVLIC IIGGLVGVGL SAAVSLVFNH FVTDFPMDIS

351 AAS VIGAVAC STGIGIAFGF MPANKAAKLN PIDALAQD*

ORF134ng和ORF134-1显示在388个氨基酸的重叠区内有97.9％的相同性：

orf134ng MSVQAVLAHKMRSLLTMLGIIIGIASVVSVVALGNGSQKKILEDISSMGTNTISIFPGRG

|||||||||||||||||||||||||||||||||||||||||||||||:||||||||||||

orf134-1 MSVQAVLAHKMRSLLTMLGIIIGIASVVSVVALGNGSQKKILEDISSIGTNTISIFPGRG

orf134ng FGDRRSGKIKTLTIDDAKIIAKQSYVASATPMTSSGGTLTYRNTDLTASLYGVGEQYFDV

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 FGDRRSGRIKTLTIDDAKIIAKQSYVASATPMTSSGGTLTYRNTDLTASLYGVGEQYFDV

orf134ng RGLKLETGRLFDENDVKEDAQVVVIDQNVKDKLFADSDPLGKTILFRKRPLTVIGVMKKD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 RGLKLETGRLFDENDVKEDAQVVVIDQNVKDKLFADSDPLGKTILFRKRPLTVIGVMKKD

orf134ng ENAFGNSDVLMLWSPYTTVMHQITGESHTNSITVKIKDNANTRVAEKGLAELLKARHGTE

||||||||||||||||||||||||||||||||||||||||||:|||||::||||||||||

orf134-1 ENAFGNSDVLMLWSPYTTVMHQITGESHTNSITVKIKDNANTQVAEKGLTDLLKARHGTE

orf134ng DFFMNNSDSIRQMVESTTGTMKLLISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMA

||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||||

orf134-1 DFFMNNSDSIRQIVESTTGTMKLLISSIALISLVVGGIGVMNIMLVSVTERTKEIGIRMA

orf134ng IGARRGNILQQFLIEAVLICIIGGLVGVGLSAAVSLVFNHFVTDFPMDISAASVIGAVAC

||||||||||||||||||||:|||||||||||||||||||||||||||||| ||||||||

orf134-1 IGARRGNILQQFLIEAVLICVIGGLVGVGLSAAVSLVFNHFVTDFPMDISAMSVIGAVAC

orf134ng STGIGIAFGFMPANKAAKLNPIDALAQDX

|||||||||||||||||||||||||||||

orf134-1 STGIGIAFGFMPANKAAKLNPIDALAQDX

ORF134ng还显示出与一种大肠杆菌ABC转运蛋白同源：

sp|P75831|YBJZ_ECOLI假设的ABC转运蛋白ATP-结合蛋白YBJZ>gi5(AE000189)o648；similar to YBBA_HAEINSW：P45247[大肠杆菌]长度＝648

评分＝297位(753)，估计值＝6e-80

相同性＝162/389(41％)，阳性＝230/389(58％)，空隙＝1/389(0％)

询问：1 MSVQAVLAHKMRSLLTMLXXXXXXXXXXXXXXLGNGSQKKILEDISSMGTNTISIFPGRG 60

M+ +A+ A+KMR+LLTML +G+ +++ +L DI S+GTNTI ++PG+

目标：260 MAWRALAANKMRTLLTMLGIIIGIASVVSIVVVGDAAKQMVLADIRSIGTNTIDVYPGKD 319

询问：61 FGDRRSGKIKTLTIDDAKIIAKQSYVASATPMTSSGGTLTYRNTDLTASLYGVGEQYFDV 120

FGD + L DD I KQ +VASATP S L Y N D+ AS GV YF+V

目标：320 FGDDDPQYQQALKYDDLIAIQKQPWVASATPAVSQNLRLRYNNVDVAASANGVSGDYFNV 379

询问：121 RGLKLETGRLFDENDVKEDAQVVVIDQNVKDKLFAD-SDPLGKTILFRKRPLTVIGVMKK 179

G+ G F++ + AQVVV+D N + +LF +D +G+ IL P VIGV ++

目标：380 YGMTFSEGNTFNQEQLNGRAQVVVLDSNTRRQLFPHKADVVGEVILVGNMPARVIGVAEE 439

询问：180 DENAFGNSDVLMLWSPYTTVMHQITGESHTNSITVKIKDNANTRVAEKGLAELLKARHGT 239

++ FG+S VL +W PY+T+ ++ G+S NSITV++K+ ++ AE+ L LL RHG

目标：440 KQSMFGSSKVLRVWLPYSTMSGRVMGQSWLNSITVRVKEGFDSAEAEQQLTRLLSLRHGK 499

询问：240 EDFFMNNSDSIRQMVESTTGTMKXXXXXXXXXXXVVGGIGVMNIMLVSVTERTKEIGIRM 299

+DFF N D + + VE TT T++ VVGGIGVMNIMLVSVTERT+EIGIRM

目标：500 KDFFTWNMDGVLKTVEKTTRTLQLFLTLVAVISLVVGGIGVMNIMLVSVTERTREIGIRM 559

询问：300 AIGARRGNILQQFLIEXXXXXXXXXXXXXXXXXXXXXXFNHFVTDFPMDISAASVIGAVA 359

A+GAR ++LQQFLIE F+ + + S +++ A

目标：560 AVGARASDVLQQFLIEAVLVCLVGGALGITLSLLIAFTLQLFLPGWEIGFSPLALLLAFL 619

询问：360 CSTGIGIAFGFMPANKAAKLNPIDALAQD 388

CST GI FG++PA AA+L+P+DALA++

目标：620 CSTVTGILFGWLPARNAARLDPVDALARE 648

根据该分析结果(包括淋球菌蛋白中存在前导肽和跨膜区)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例65

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 539>：

1 ..GGGACGGGAG CGATGCTGCT GCTGTTTTAC GCGGTAACGA T.CTGCCTTT

51 GGCCACTGGC GTTACCCTGA GTTACACCTC GTCGATTTTT TTGGCGGTAT

101 TTTCCTTCCT GATTTTGAAA GAACGGATTT CCGTTTACAC GCAGGCGGTG

151 CTGCTCCTTG GTTTTGCCGG CGTGGTATTG CTGCTTAATC CCTCGTTCCG

201 CAGCGGTCAG GAAACGGCGG CACTCGCCGG GCTGGCGGGC GGCGCGATGT

251 CCGGCTGGGC GTATTTGAAA GTGCGCGAAC TGTCTTTGGC GGGCGAACCC

301 GGCTGGCGCG TCGTGTTTTA CCTTTCCGTG ACAGGTGTGG CGATGTCGTC

351 GGTTTGGGCG ACGCTGACCG GCTGGCACAC CCTGTCCTTT CCATCGGCAG

401 TTTATCTGTC GTGCATCGGC GTGTCCGCGC TGATTGCCCA ACTGTCGATG

451 ACGCGCGCCT ACAAAGTCGG CGACAAATTC ACGGTTGCCT CGCTTTCCTA

501 TATGACCGTC GTTTTTTCCG CTCTGTCTGC CGCATTTTTT CTGGGCGAAG

551 AGCTTTTCTG GCAGGAAATA CTCGGTATGT GCATCATCAT C

TCAGCGGT

601 ATTTTGA

它对应于氨基酸序列<SEQ ID 540；ORF135>：

1 ..GTGAMLLLFY AVTILPLATG VTLSYTSSIF LAVFSFLILK ERISVYTQAV

51 LLLGFAGVVL LLNPSFRSGQ ETAALAGLAG GAMSGWAYLK VRELSLAGEP

101 GWRVVFYLSV TGVAMSSVWA TLTGWHTLSF PSAVYLSCIG VSALIAQLSM

151 TRAYKVGDKF TVASLSYMTV VFSALSAAFF LGEELFWQEI LGMCIIISAV

201 F*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 541>：

1 ATGGATACCG CAAAAAAAGA CATTTTAGGA TCGGGCTGGA TGCTGGTGGC

51 GGCGGCCTGC TTTACCATTA TGAACGTATT GATTAAAGAG GCATCGGCAA

101 AATTTGCCCT CGGCAGCGGC GAATTGGTCT TTTGGCGCAT GCTGTTTTCA

151 ACCGTTGCGC TCGGGGCTGC CGCCGTATTG CGTCGGGACA mCTTCCGCAC

201 GCCCCATTGG AAAAACCACT TAAACCGCAG TATGGTCGGG ACGGGGGCGA

251 TGCTGCTGCT GTTTTACGCG GTAACGCATC TGCCTTTGGC CACTGGCGTT

301 ACCCTGAGTT ACACCTCGTC GATTTTTTTG GCGGTATTTT CCTTCCTGAT

351 TTTGAAAGAA CGGATTTCCG TTTACACGCA GGCGGTGCTG CTCCTTGGTT

401 TTGCCGGCGT GGTATTGCTG CTTAATCCCT CGTTCCGCAG CGGTCAGGAA

451 ACGGCGGCAC TCGCCGGGCT GGCGGGCGGC GCGATGTCCG GCTGGGCGTA

501 TTTGAAAGTG CGCGAACTGT CTTTGGCGGG CGAACCCGGC TGGCGCGTCG

551 TGTTTTACCT TTCCGTGACA GGTGTGGCGA TGTCGTCGGT TTGGGCGACG

601 CTGACCGGCT GGCACACCCT GTCCTTTCCA TCGGCAGTTT ATCTGTCGTG

651 CATCGGCGTG TCCGCGCTGA TTGCCCAACT GTCGATGACG CGCGCCTACA

701 AAGTCGGCGA CAAATTCACG GTTGCCTCGC TTTCCTATAT GACCGTCGTT

751 TTTTCCGCTC TGTCTGCCGC ATTTTTTCTG GGCGAAGAGC TTTTCTGGCA

801 GGAAATACTC GGTATGTGCA TCATCATCCT CAGCGGTATT TTGAGCAGCA

851 TCCGCCCCAC TGCCTTCAAA CAGCGGCTGC AATCCCTGTT CCGCCAAAGA

901 TAA

它对应于氨基酸序列<SEQ ID 542；ORF135-1>：

1 MDTAKKDILG SGWMLVAAAC FTIMNVLIKE ASAKFALGSG ELVFWRMLFS

51 TVALGAAAVL RRDXFRTPHW KNHLNRS MVG TGAMLLLFYA VTHLPLATGV

101 T LSYTSSIFL AVFSFLILKE RISVYTQA VL LLGFAGVVLL LNPSFRSGQE

151 TAALAGLAGG AMSGWAYLKV RELSLAGEPG WRVVFYLSVT GVAMSSVWAT

201 LTGWHTLS FP SAVYLSCIGV SALIAQLSMT RAYKVGDKFT VAS LSYMTVV

251 FSALSAAFFL GEELFWQ EIL GMCIIILSGI LSSIRPTAFK QRLQSLFRQR

301 *

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF135显示和脑膜炎奈瑟球菌菌株A的ORF(ORF135a)在197个氨基酸的重叠区内有99.0％的相同性：

10 20 30

orf135.pep GTGAMLLLFYAVTILPLATGVTLSYTSSIF

||||||||||||| ||||||||||||||||

orf135a STVALGAAAVLRRDTFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLATGVTLSYTSSIF

50 60 70 80 90 100

40 50 60 70 80 90

orf135.pep LAVFSFLILKERISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135a LAVFSFLILKERISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLK

110 120 130 140 150 160

100 110 120 130 140 150

orf135.pep VRELSLAGEPGWRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSM

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135a VRELSLAGEPGWRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSM

170 180 190 200 210 220

160 170 180 190 200

orf135.pep TRAYKVGDKFTVASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIISAVFX

|||||||||||||||||||||||||||||||:|||||||||||||||

orf135a TRAYKVGDKFTVASLSYMTVVFSALSAAFFLAEELFWQEILGMCIIILSGILSSIRPTAF

230 240 250 260 270 280

orf135a KQRLQSLFRQRX

290 300

全长ORF135a核苷酸序列<SEQ ID 543>是：

1 ATGGATACCG CAAAAAAAGA CATTTTAGGA TCGGGCTGGA TGCTGGTGGC

51 GGCGGCCTGC TTTACCATTA TGAACGTATT GATTAAAGAG GCATCGGCAA

101 AATTTGCCCT CGGCAGCGGC GAATTGGTCT TTTGGCGCAT GCTGTTTTCA

151 ACCGTTGCGC TCGGGGCTGC CGCCGTATTG CGTCGGGACA CCTTCCGCAC

201 GCCCCATTGG AAAAACCACT TAAACCGCAG TATGGTCGGG ACGGGGGCGA

251 TGCTGCTGCT GTTTTACGCG GTAACGCATC TGCCTTTGGC CACCGGCGTT

301 ACCCTGAGTT ACACCTCGTC GATTTTTTTG GCGGTATTTT CCTTCCTGAT

351 TTTGAAAGAA CGGATTTCCG TTTACACGCA GGCGGTGCTG CTCCTTGGTT

401 TTGCCGGCGT GGTATTGCTG CTTAATCCCT CGTTCCGCAG CGGTCAGGAA

451 ACGGCGGCAC TCGCCGGGCT GGCGGGCGGC GCGATGTCCG GCTGGGCGTA

501 TTTGAAAGTG CGCGAACTGT CTTTGGCGGG CGAACCCGGC TGGCGCGTCG

551 TGTTTTACCT TTCCGTGACA GGTGTGGCGA TGTCATCGGT TTGGGCGACG

601 CTGACCGGCT GGCACACCCT GTCCTTTCCA TCGGCAGTTT ATCTGTCGTG

651 CATCGGCGTG TCCGCGCTGA TTGCCCAACT GTCGATGACG CGCGCCTACA

701 AAGTCGGCGA CAAATTCACG GTTGCCTCGC TTTCCTATAT GACCGTCGTT

751 TTTTCCGCTC TGTCTGCCGC ATTTTTTCTG GCCGAAGAGC TTTTCTGGCA

801 GGAAATACTC GGTATGTGCA TCATCATCCT CAGCGGTATT TTGAGCAGCA

851 TCCGCCCCAC TGCCTTCAAA CAGCGGCTGC AATCCCTGTT CCGCCAAAGA

901 TAA

它编码的蛋白质具有氨基酸序列<SEQ ID 544>：

1 MDTAKKDILG SGWMLVAAAC FTIMNVLIKE ASAKFALGSG ELVFWRMLFS

51 TVALGAAAVL RRDTFRTPHW KNHLNRS MVG TGAMLLLFYA VTHLPLATGV

101 T LSYTSSIFL AVFSFLILKE RISVYTQA VL LLGFAGVVLL LNPSFRSGQE

151 TAALAGLAGG AMSGWAYLKV RELSLAGEPG WRVVFYLSVT GVAMSSVWAT

201 LTGWHTLS FP SAVYLSCIGV SALIAQLSMT RAYKVGDKFT VAS LSYMTVV

251 FSALSAAFFL AEELFWQ EIL GMCIIILSGI LSSIRPTAFK QRLQSLFRQR

301 *

ORF135a和ORF135-1显示在300个氨基酸的重叠区内有99.3％的相同性：

orf135a.pep MDTAKKDILGSGWMLVAAACFTIMNVLIKEASAKFALGSGELVFWRMLFSTVALGAAAVL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135-1 MDTAKKDILGSGWMLVAAACFTIMNVLIKEASAKFALGSGELVFWRMLFSTVALGAAAVL

orf135a.pep RRDTFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLATGVTLSYTSSIFLAVFSFLILKE

|||:||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135-1 RRDXFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLATGVTLSYTSSIFLAVFSFLILKE

orf135a.pep RISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLKVRELSLAGEPG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135-1 RISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLKVRELSLAGEPG

orf135a.pep WRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSMTRAYKVGDKFT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf135-1 WRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSMTRAYKVGDKFT

orf135a.pep VASLSYMTVVFSALSAAFFLAEELFWQEILGMCIIILSGILSSIRPTAFKQRLQSLFRQR

||||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||

orf135-1 VASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIILSGILSSIRPTAFKQRLQSLFRQR

与淋病奈瑟球菌的预计ORF的同源性

ORF135和淋病奈瑟球菌的预计ORF(ORF135ng)在201个氨基酸的重叠区内显示出有97％的相同性：

orf135.pep GTGAMLLLFYAVTXLPLATGVTLSYTSSIF 30

||||||||||||| |||:||||||||||||

orf135ng STVTLGAAAVLRRDTFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLTTGVTLSYTSSIF 335

orf135.pep LAVFSFLILKERISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLK 90

||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||

orf135ng LAVFSFLILKERISVYTQAVLLLGFAGVVLLLNPSFRSGQEPAALAGLAGGAMSGWAYLK 395

orf135.pep VRELSLAGEPGWRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSM 150

|||||||||||||||||||:||||||||||||||||||||||||||| ||||||||||||

orf135ng VRELSLAGEPGWRVVFYLSATGVAMSSVWATLTGWHTLSFPSAVYLSGIGVSALIAQLSM 455

orf135.pep TRAYKVGDKFTVASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIISAVF 201

|||||||||||||||||||||||||||||||||||||||||||||||||:|

orf135ng TRAYKVGDKFTVASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIISAAF 506

预计ORF135ng核苷酸序列<SEQ ID 545>编码的蛋白质具有氨基酸序列<SEQ ID546>：

1 MPSEKAFRRH LRTASFQGLH LHHFHQKVGK CGIIGFGIHI FPTLLPAAQG

51 ILDIQLGLFR IDFAALAVYR RTQVDFIHTV IDGIASDQAF SEVVQILRRL

101 NLGHFTDTHL IAQARRFIAD FGNIRPMRRG EAKTFCRCFR FDGIDGIHGD

151 FRQCGHINRL APGKDCRNGK RDKYFFHTRH YNQVCLEKTN CSARKIKFRH

201 QKQAKTHSTS LAARFTIRPS LSQRPFMDTA KKDILGS GWM LVAAACFTVM

251 NVLIKEASAK FALGSGELVF WRMLFSTVTL GAAAVLRRDT FRTPHWKNHL

301 NRS MVGTGAM LLLFYAVTHL PLTTGVT LSY TSSIFLAVFS FLILKERISV

351 YTQA VLLLGF AGVVLLLNPS FRSGQEPAAL AGLAGGAMSG WAYLKVRELS

401 LAGEPGWRVV FYLSATGVAM SSVWATLTGW HTLS FPSAVY LSGIGVSALI

451 AQLSMTRAYK VGDKFTVAS L SYMTVVFSAL SAAFFLGEE L FWQEILGMCI

501 IISAAF*

进一步的工作揭示了下列淋球菌序列<SEQ ID 547>：

1 ATGGATACCG CAAAAAAAGA CATTTTAGGA TCGGGCTGGA TGCTGGTGGC

51 GGCGGCCTGC TTCACCGTTA TGAACGTATT GATTAAAGAG GCATCGGCAA

101 AATTTGCCCT CGGCAGCGGC GAATTGGTCT TTTGGCGCAT GCTGTTTTCA

151 ACCGTTACGC TCGGTGCTGC CGCCGTATTG CGGCGCGACA CCTTCCGCAC

201 GCCCCATTGG AAAAACCACT TAAACCGCAG TATGGTCGGG ACGGGGGCGA

251 TGCTGCTGCT GTTTTACGCG GTAACGCATC TGCCTTTGAC AACCGGCGTT

301 ACCCTGAGTT ACACCTCGTC GATTTTTttg GCGGTATTTT CCTTCCTGAT

351 TTTGAAAGAA CGGATTTCCG TTTACACGCA GGCGGTGCTG CTCCTTGGTT

401 TTGCCGGCGT GGTATTGCTG CTTAATCCCT CGTTCCGCAG CGGTCAGGAA

451 CCGGCGGCAC TCGCCGGGCT GGCGGGCGGC GCGATGTCCG GCTGGGCGTA

501 TTTGAAAGTG CGCGAACTGT CTTTGGCGGG CGAACCCGGC TGGCGCGTCG

551 TGTTTTACCT TTCCGCAACC GGCGTGGCGA TGTCGTCggt ttgggcgacg

601 Ctgaccggct ggCACAcccT GTCCTTTcca tcggcagttt ATCtgtCGGG

651 CATCGGCGTG tccgcgCtgA TTGCCCAaCT GtcgatgAcg cGCGcctaca

701 aaGTCGGCGA CAAATTCACG GTTGCCTCGC tttcctaTAt gaccgtcGTC

751 TTTTCCGCCC TGTCTGCCGC ATTTTTTCTg ggcgaagagc tttTCtggCA

801 GGAAATACTC GGTATGTGCA TCATTAtccT CAGCGGCATT TTGAGCAGCA

851 TCCGCCCCAT TGCCTTCAAA CAGCGGCTGC AAGCCCTCTT CCGCCAAAGA

901 TAA

它对应于氨基酸序列<SEQ ID 548；ORF135ng-1>：

1 MDTAKKDILG SGWMLVAAAC FTVMNVLIKE ASAKFALGSG ELVFWRMLFS

51 TVTLGAAAVL RRDTFRTPHW KNHLNRS MVG TGAMLLLFYA VTHLPLTTGV

101 T LSYTSSIFL AVFSFLILKE RISVYTQA VL LLGFAGVVLL LNPSFRSGQE

151 PAALAGLAGG AMSGWAYLKV RELSLAGEPG WRVVFYLSAT GVAMSSVWAT

201 LTGWHTLS FP SAVYLSGIGV SALIAQLSMT RAYKVGDKFT VAS LSYMTVV

251 FSALSAAFFL GEELFWQ EIL GMCIIILSGI LSSIRPIAFK QRLQALFRQR

301 *

ORF135ng-1和ORF135-1显示在300个氨基酸的重叠区内有97.0％的相同性：

orf135ng-1.pep MDTAKKDILGSGWMLVAAACFTVMNVLIKEASAKFALGSGELVFWRMLFSTVTLGAAAVL

||||||||||||||||||||||:|||||||||||||||||||||||||||||:|||||||

orf135-1 MDTAKKDILGSGWMLVAAACFTIMNVLIKEASAKFALGSGELVFWRMLFSTVALGAAAVL

orf135ng-1.pep RRDTFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLTTGVTLSYTSSIFLAVFSFLILKE

|||:||||||||||||||||||||||||||||||||:|||||||||||||||||||||||

orf135-1 RRDXFRTPHWKNHLNRSMVGTGAMLLLFYAVTHLPLATGVTLSYTSSIFLAVFSFLILKE

orf135ng-1.pep RISVYTQAVLLLGFAGVVLLLNPSFRSGQEPAALAGLAGGAMSGWAYLKVRELSLAGEPG

|||||||||||||||||||||||||||||| |||||||||||||||||||||||||||||

orf135-1 RISVYTQAVLLLGFAGVVLLLNPSFRSGQETAALAGLAGGAMSGWAYLKVRELSLAGEPG

orf135ng-1.pep WRVVFYLSATGVAMSSVWATLTGWHTLSFPSAVYLSGIGVSALIAQLSMTRAYKVGDKFT

||||||||:||||||||||||||||||||||||||| |||||||||||||||||||||||

orf135-1 WRVVFYLSVTGVAMSSVWATLTGWHTLSFPSAVYLSCIGVSALIAQLSMTRAYKVGDKFT

orf135ng-1.pep VASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIILSGILSSIRPIAFKQRLQALFRQR

|||||||||||||||||||||||||||||||||||||||||||||| |||||||:|||||

orf135-1 VASLSYMTVVFSALSAAFFLGEELFWQEILGMCIIILSGILSSIRPTAFKQRLQSLFRQR

根据该分析结果，包括此淋球菌蛋白中存在几个推定的跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例66

在脑膜炎奈瑟球菌中鉴定出下列DNA序列<SEQ ID 549>：

1 ATGAAGCGGC GTATAGCCGT CTTCGTCCTG TTCCCGCAGA TAATCCGAGT

51 TTTGGGACAA CTGTTGCCGA AAATCGTCAA TACAGTTCCG GCACATCGGA

101 TGCTCTTCCA GATTTTCGGG ATGTTCTTTT TCTTCATACA CCAGCAATAT

151 CTGCCCGGGA TCGCCGAAAT CGATTCCCCA TGCGGCATCG TGTTCGGTGC

201 GCTCCTCTTC CGTCATCTGC CCGCGCATTG CCTGTATGGT AAAGCCGCCG

251 TAGGGGATGC CgTTGCACAC GAACATCCAG TCGCTGATGT CGTCAACCGG

301 AACGCAAACG cTTTCGCCTT GTTCGACATT GGTCAGTTCG CCsGGTTCAT

351 TGTTCAGCAC ACCGTAAATA TAAAGACCGT CAAAATAAAT ATCGTCGATC

401 CACATATGTT CGCAAATTTC GCCGTCTTCG CCGTCTTGGA AAAAAGGGAC

451 TTTGACCATG GCAAAATCCA AGGCGGAAAT AATGCGGCGG CGTTCCCAAA

501 AAAGcTCGCG CCAAAAATAT TTGAATGTTT TACGGGCGCG TTCGTCGGCA

551 CGGTTTACCG GTTCGTCTGC CTGTTCTACA TAATAAATGA CGGAATCGCC

601 CATCAT

TCT GCTCCTCAAC GTGTACGGTA TCTGTTTGCA CCTTACTGCG

651 GCTTTCTgcC kTCGGCATCC GATTCGGATT TGAAAAGTTC mmrwyATTCG

701 GAATAG

它对应于氨基酸序列<SEQ ID 550；ORF136>：

1 MKRRIAVFVL FPQIIRVLGQ LLPKIVNTVP AHRMLFQIFG MFFFFIHQQY

51 LPGIAEIDSP CGIVFGALLF RHLPAHCLYG KAAVGDAVAH EHPVADVVNR

101 NANAFALFDI GQFAXFIVQH TVNIKTVKIN IVDPHMFANF AVFAVLEKRD

151 FDHGKIQGGN NAAAFPKKLA PKIFECFTGA FVGTVYRFVC LFYIINDGIA

201 HHSAPQRVRY LFAPYCGFLP SASDSDLKSS XXSE*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 551>：

1 ATGATGAAGC GGCGTATAGC CGTCTTCGTC CTGTTCCCGC AGATAATCCG

51 AGTTTTGGGA CAACTGTTGC CGAAAATCGT CAATACAGTT CCGGCACATC

101 GGATGCTCTT CCAGATTTTC GGGATGTTCT TTTTCTTCAT ACACCAGCAA

151 TATCTGCCCG GGATCGCCGA AATCGATTCC CCATGCGGCA TCGTGTTCGG

201 TGCGCTCCTC TTCCGTCATC TGCCCGCGCA TTGCCTGTAT GGTAAAGCCG

251 CCGTAGGGGA TGCCGTTGCA CACGAACATC CAGTCGCTGA TGTCGTCAAC

301 CGGAACGCAA ACGCTTTCGC CTTGTTCGAC ATTGGTCAGT TCGCCGGGTT

351 CATTGTTCAG CACACCGTAA ATATAAAGAC CGTCAAAATA AATATCGTCG

401 ATCCACATAT GTTCGCAAAT TTCGCCGTCT TCGCCGTCTT GGAAAAAAGG

451 GACTTTGACC ATGGCAAAAT CCAAGGCGGA AATAATGCGG CGGCGTTCCC

501 AAAAAAGCTC GCGCCAAAAA TATTTGAATG TTTTACGGGC GCGTTCGTCG

551 GCACGGTTTA CCGGTTCGTC TGCCTGTTCT ACATAATAAA TGACGGAATC

601 GCCCATCATT CTGCTCCTCA ACGTGTACGG TATCTGTTTG CACCTTACTG

651 CGGCTTTCTG CCTTCGGCAT CCGATTCGGA TTTGAAAAGT TCCAAATATT

701 CGGAATAG

它对应于氨基酸序列<SEQ ID 552；ORF 136-1>：

1 MMKRR IAVFV LFPQIIRVLG QLLPKIVNTV PAHRMLFQIF GMFFFFIHQQ

51 YLPGIAEIDS PCGIVFGALL FRHLPAHCLY GKAAVGDAVA HEHPVADVVN

101 RNANAFALFD IGQFAGFIVQ HTVNIKTVKI NIVDPHMFAN FAVFAVLEKR

151 DFDHGKIQGG NNAAAFPKKL APKIFECFT G AFVGTVYRFV CLFYIINDGI

201 AHHSAPQRVR YLFAPYCGFL PSASDSDLKS SKYSE*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF136和脑膜炎奈瑟球菌菌株A的ORF(ORF136a)在237个氨基酸的重叠区内显示出有71.7％的相同性：

10 20 30 40 50 59

orf136.pep MKRRIAVFVLFPQIIRVLGQLLPKIVNTVPAHRMLFQIFGMFFFFIHQQYLPGIAEIDS

||||||||||: | ||:|||||||||||||||||||| |||||||||||||||||||||

orf136a MMKRRIAVFVLLMQKIRILGQLLPKIVNTVPAHRMLFQXFGMFFFFIHQQYLPGIAEIDS

10 20 30 40 50 60

60 70 80 90 100 110 119

orf136.pep PCGIVFGALLFRHLPAHCLYGKAAVGDAVAHEHPVADVVNRNANAFALFDIGQFAXFIVQ

|||||||:||||| :||||||||||:|||||||||||||||||||||||||||| ||||

orf136a PCGIVFGTLLFRHXSTHCLYGKAAVGNAVAHEHPVADVVNRNANAFALFDIGQFAGFIVQ

70 80 90 100 110 120

120 130 140 150 160 170 179

orf136.pep HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKIFECFTG

|::|:||||||||||||||||| ||||||| : :| : |: | :: : :

orf136a HAINVKTVKINIVDPHMFANFAXFAVLEKRALTMAKSKXXXMRRRSQKSSRQKYLNVLRA

130 140 150 160 170 180

180 190 200 210 220 230

orf136.pep AFVGTVYRFVCLFYIINDGIAHH---SAPQRVRYLFAPYCGFLPSASDSDLKSSXXSEX

: ||: | : ::: |||||||||||||||||||||||||||| |||

orf136a R---SPARFTGLSACSTXXMTESPIISAPQRVRYLFAPYCGFLPSASDSDLKSSKYSEX

190 200 210 220 230

全长ORF136a核苷酸序列<SEQ ID 553>是：

1 ATGATGAAGC GGCGTATAGC CGTCTTCGTC CTGCTCATGC AGAAAATCCG

51 GATTTTGGGA CAACTGTTGC CGAAAATCGT CAATACAGTT CCGGCACATC

101 GGATGCTCTT CCAGATNTTC GGGATGTTCT TTTTCTTCAT ACACCAGCAA

151 TACCTGCCCG GGATCGCCGA AATCGATTCC CCATGCGGCA TCGTGTTCGG

201 TACGCTCCTC TTCCGTCATC NGTCCACGCA TTGCCTGTAT GGTAAAGCCG

251 CCGTAGGGAA TGCCGTTGCA CACGAACATC CAGTCGCTGA TGTCGTCAAC

301 CGGAACGCAA ACGCTTTCGC CTTGTTCGAC ATTGGTCAGT TCGCCGGGTT

351 CATTGTTCAG CACGCCATAA ATGTAAAGAC CGTCAAAATA AATATCGTCG

401 ATCCACATAT GTTCGCAAAT TTCGCCNTCT TCGCCGTCTT GGAAAAAAGG

451 GCTTTGACCA TGGCAAAATC TAAGGNGNNA NNGATGCGGC GGCGTTCCCA

501 AAAAAGCTCG CGCCAAAAAT ATTTGAATGT TTTGCGGGCG CGTTCGCCGG

551 CACGGTTTAC CGGTTTGTCT GCCTGTTCTA CATAATAAAT GACGGAATCG

601 CCCATCATAT CTGCTCCTCA ACGTGTACGG TATCTGTTTG CACCTTACTG

651 CGGCTTTCTG CCTTCGGCAT CCGATTCGGA TTTGAAAAGT TCCAAATATT

701 CGGAATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 554>：

1 MMKRR IAVFV LLMQKIRILG QLLPKIVNTV PAHRMLFQXF GMFFFFIHQQ

51 YLPGIAEIDS PCGIVFGTLL FRHXSTHCLY GKAAVGNAVA HEHPVADVVN

101 RNANAFALFD IGQFAGFIVQ HAINVKTVKI NIVDPHMFAN FAXFAVLEKR

151 ALTMAKSKXX XMRRRSQKSS RQKYLNVLRA RSPARFTGLS ACST**MTES

201 PIISAPQRVR YLFAPYCGFL PSASDSDLKS SKYSE*

ORF136a和ORF136-1显示在238个氨基酸的重叠区内有73.1％的相同性：

10 20 30 40 50 60

orf136a.pep MMKRRIAVFVLLMQKIRILGQLLPKIVNTVPAHRMLFQXFGMFFFFIHQQYLPGIAEIDS

|||||||||||: | ||:|||||||||||||||||||| |||||||||||||||||||||

orf136-1 MMKRRIAVFVLFPQIIRVLGQLLPKIVNTVPAHRMLFQIFGMFFFFIHQQYLPGIAEIDS

10 20 30 40 50 60

70 80 90 100 110 120

orf136a.pep PCGIVFGTLLFRHXSTHCLYGKAAVGNAVAHEHPVADVVNRNANAFALFDIGQFAGFIVQ

|||||||:||||| :||||||||||:|||||||||||||||||||||||||||||||||

orf136-1 PCGIVFGALLFRHLPAHCLYGKAAVGDAVAHEHPVADVVNRNANAFALFDIGQFAGFIVQ

70 80 90 100 110 120

130 140 150 160 170 180

orf136a.pep HAINVKTVKINIVDPHMFANFAXFAVLEKRALTMAKSKXXXMRRRSQKSSRQKYLNVLRA

|::|:||||||||||||||||| ||||||| : :| : |: | :: : :

orf136-1 HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKIFECFTG

130 140 150 160 170 180

190 200 210 220 230

orf136a.pep R---SPARFTGLSACSTXXMTESPIISAPQRVRYLFAPYCGFLPSASDSDLKSSKYSEX

: ||: | : ::: |||||||||||||||||||||||||||||||||

orf136-1 AFVGTVYRFVCLFYIINDGIAHH---SAPQRVRYLFAPYCGFLPSASDSDLKSSKYSEX

190 200 210 220 230

与淋病奈瑟球菌的预计ORF的同源性

ORF136和淋病奈瑟球菌的预计ORF(ORF136ng)在234个氨基酸的重叠区内显示出有92.3％的相同性：

orf136.pep MKRRIAVFVLFPQIIRVLGQLLPKIVNTVPAHRMLFQIFGMFFFFIHQQYLPGIAEIDS 59

||||||||||: | ||:||||||||||||||||||||||||||||||:|||||||||||

orf136ng MMKRRIAVFVLLMQKIRILGQLLPKIVNTVPAHRMLFQIFGMFFFFIHRQYLPGIAEIDS 60

orf136.pep PCGIVFGALLFRHLPAHCLYGKAAVGDAVAHEHPVADVVNRNANAFALFDIGQFAXFIVQ 119

| |||||:|||||| |||||||||||||||||||||||:|||||||||||||| | ||||

orf136ng PGGIVFGTLLFRHLSAHCLYGKAAVGDAVAHEHPVADVANRNANAFALFDIGQSAGFIVQ 120

orf136.pep HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKIFECFTG 179

|||||||||||||||||||||||||||||||||||||||||||||||||||||:||||||

orf136ng HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKVFECFTG 180

orf136.pep AFVGTVYRFVCLFYIINDGIAHHSAPQRVRYLFAPYCGFLPSASDSDLKSSXXSE 234

||:||||||||||||||||||||:|||||||||||| |||| ||||||||| ||

orf136ng AFAGTVYRFVCLFYIINDGIAHHTAPQRVRYLFAPYRGFLPPASDSDLKSSKYSE 235

全长ORF136ng核苷酸序列<SEQ ID 555>是：

1 ATGATGAAGC GGCGTATAGC CGTCTTCGTC CTGCTCATGC AGAAAATCCG

51 GATTTTGGGA CAACTGTTGC CGAAAATCGT CAATACAGTT CCGGCACATC

101 GGATGCTCTT CCAAATTTTC GGGATGTTCT TTTTCTTCAT ACACCGGCAA

151 TACCTGCCCG GGATCGCCGA AATCGATTCC CCAGGCGGTA TCGTGTTCGG

201 TACGCTCCTC TTCCGTCATC TGTCCGCGCA TTGCCTGTAC GGTAAAGCCG

251 CCGTAGGGGA TGCCGTTGCA CACGAACATC CAGTCGCTGA TGTCGCCAAC

301 CGGAACGCAA ACGCTTTCGC CTTGTTCGAC ATTGGTCAGT CCGCCGGGTT

351 CATTGTTCAG CACACCGTAA ATATAAAGAC CGTCAAAATA AATATCGTCG

401 ATCCACATAT GTTCGCAAAT TTCGCCGTCT TCGCCGTCTT GGAAAAAAGG

451 GACTTTGACC ATGGCAAAAT CCAAGGCGGA AATAATGCGG CGGCGTTCCC

501 AAAAAAGCTC GCGCCAAAAG TATTTGAATG TTTTACGGGC GCGTTCGCCG

551 GCACGGTTTA CCGGTTCGTC TGCCTGTTCT ACATAATAAA TGACGGAATC

601 GCCCATCATA CTGCTCCTCA ACGTGTACGG TATCTGTTTG CACCTTACCG

651 CGGTTTTCTA CCTCCGGCAT CCGATTCGGA TTTGAAAAGT TCCAAATATT

701 CGGAATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 556>：

1 MMKRR IAVFV LLMQKIRILG QLLPKIVNTV PAHRMLFQIF GMFFFFIHRQ

51 YLPGIAEIDS PGGIVFGTLL FRHLSAHCLY GKAAVGDAVA HEHPVADVAN

101 RNANAFALFD IGQSAGFIVQ HTVNIKTVKI NIVDPHMFAN FAVFAVLEKR

151 DFDHGKIQGG NNAAAFPKKL APKVFECFT G AFAGTVYRFV CLFYIINDGI

201 AHHTAPQRVR YLFAPYRGFL PPASDSDLKS SKYSE*

ORF136ng和ORF136-1显示在235个氨基酸的重叠区内有93.6％的相同性：

orf136ng MMKRRIAVFVLLMQKIRILGQLLPKIVNTVPAHRMLFQIFGMFFFFIHRQYLPGIAEIDS

|||||||||||: | ||:||||||||||||||||||||||||||||||:|||||||||||

orf136-1 MMKRRIAVFVLFPQIIRVLGQLLPKIVNTVPAHRMLFQIFGMFFFFIHQQYLPGIAEIDS

orf136ng PGGIVFGTLLFRHLSAHCLYGKAAVGDAVAHEHPVADVANRNANAFALFDIGQSAGFIVQ

| |||||:|||||| |||||||||||||||||||||||:|||||||||||||| ||||||

orf136-1 PCGIVFGALLFRHLPAHCLYGKAAVGDAVAHEHPVADVVNRNANAFALFDIGQFAGFIVQ

orf136ng HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKVFECFTG

|||||||||||||||||||||||||||||||||||||||||||||||||||||:||||||

orf136-1 HTVNIKTVKINIVDPHMFANFAVFAVLEKRDFDHGKIQGGNNAAAFPKKLAPKIFECFTG

orf136ng AFAGTVYRFVCLFYIINDGIAHHTAPQRVRYLFAPYRGFLPPASDSDLKSSKYSEX

||:||||||||||||||||||||:|||||||||||| |||| ||||||||||||||

orf136-1 AFVGTVYRFVCLFYIINDGIAHHSAPQRVRYLFAPYCGFLPSASDSDLKSSKYSEX

根据此淋球菌蛋白中存在推定跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例67

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 557>：

1 ATGGAAAATA TGGTAACGTT TTCAAAAATC AGACCGCTTT TGGCAATCGC

51 CGCCGCCGCG TTGCTTGCCG CC.TGCGGAC GGCGGGAAAT AATGCTGTCC

101 GCAAGCCGGT GCAAACCGCC AAACCCGCCG CAGTGGTCGG TTTGGCACTC

151 GGTGGCGGCG CATCTAAAGG ATTTGCCCAT GTAGGTATTA TTAAGGTTTT

201 GAAAGAAAAC GGTATTCCTG TGAAGGTGGT TACCGGCACC TCCGCAGGTT

251 CGATTGTCGG CAACCTTTTT GCATCGGGTA TGTCGCCCGA CCGCCTCGAA

301 TTGGAAGCCG AAATTTTAGG CAAAACCGAT TTGGTCGATT TAACCTTGTC

351 CACCAATGGG TTTATCAAAG GCGCAAAGCT GCAAAATTAC ATCAACCGAA

401 AACTCCGCGG CATGCAGATT CAGCAGTTTC CCATCAAATT TGCCGCC..

它对应于氨基酸序列<SEQ ID 558；ORF137>：

1 MENMVTFSKI RPLLAIAAAA LLAAXRTAGN NAVRKPVQTA KPAAVVGLAL

51 GGGASKGFAH VGIIKVLKEN GIPVKVVTGT SAGSIVGNLF ASGMSPDRLE

101 LEAEILGKTD LVDLTLSTNG FIKGAKLQNY INRKLRGMQI QQFPIKFAA..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 559>：

1 ATGGAAAATA TGGTAACGTT TTCAAAAATC AGACCGCTTT TGGCAATCGC

51 CGCCGCCGCG TTGCTTGCCG CCTGCGGCAC GGCGGGAAAT AATGCTGTCC

101 GCAAGCCGGT GCAAACCGCC AAACCCGCCG CAGTGGTCGG TTTGGCACTC

151 GGTGGCGGCG CATCTAAAGG ATTTGCCCAT GTAGGTATTA TTAAGGTTTT

201 GAAAGAAAAC GGTATTCCTG TGAAGGTGGT TACCGGCACA TCGGCAGGTT

251 CGATTGTCGG CAGCCTTTTT GCATCGGGTA TGTCGCCCGA CCGCCTCGAA

301 TTGGAAGCCG AAATTTTAGG CAAAACCGAT TTGGTCGATT TAACCTTGTC

351 CACCAGTGGT TTTATCAAAG GCGAAAAGCT GCAAAATTAC ATCAACCGAA

401 AAGTCGGCGG CAGGCAGATT CAGCAGTTTC CCATCAAATT TGCCGCCGTT

451 GCTACTGATT TTGAAACCGG CAAGGCCGTC GCTTTCAATC AGGGGAATGC

501 CGGGCAGGCT GTGCGCGCTT CCGCCGCCAT TCCCAATGTG TTCCAACCCG

551 TTATCATCGG CAGGCATACA TATGTTGACG GCGGTCTGTC GCAGCCCGTG

601 CCCGTCAGTG CCGCCCGGCG GCAGGGGGCG AATTTCGTGA TTGCCGTCGA

651 TATTTCCGCC CGTCCGGGCA AAAACATCAG CCAAGGTTTC TTCTCTTATC

701 TCGATCAGAC GCTGAACGTA ATGAGCGTTT CTGCGTTGCA AAATGAGTTG

751 GGGCAGGCGG ATGTGGTTAT CAAACCGCAG GTTTTGGATT TGGGTGCAGT

801 CGGCGGATTC GATCAGAAAA AACGCGCCAT CCGGTTGGGT GAGGAGGCAG

851 CACGTGCCGC ATTGCCTGAA ATCAAACGCA AACTGGCGGC ATACCGTTAT

901 TGA

它对应于氨基酸序列<SEQ ID 560；ORF137-1>：

1 MENMVTFSKI RPLLAIAAAA LLAACGTAGN NAVRKPVQTA KPAAVVGLAL

51 GGGASKGFAH VGIIKVLKEN GIPVKVVTGT SAGSIVGSLF ASGMSPDRLE

101 LEAEILGKTD LVDLTLSTSG FIKGEKLQNY INRKVGGRQI QQFPIKFAAV

151 ATDFETGKAV AFNQGNAGQA VRASAAIPNV FQPVIIGRHT YVDGGLSQPV

201 PVSAARRQGA NFVIAVDISA RPGKNISQGF FSYLDQTLNV MSVSALQNEL

251 GQADVVIKPQ VLDLGAVGGF DQKKRAIRLG EEAARAALPE IKRKLAAYRY

301 *

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF137和脑膜炎奈瑟球菌菌株A的ORF(ORF137a)在149个氨基酸的重叠区内显示出有93.3％的相同性：

10 20 30 40 50 60

orf137.pep MENMVTFSKIRPLLAIAAAALLAAXRTAGNNAVRKPVQTAKPAAVVGLALGGGASKGFAH

|||||||||||||||||||||||| ||||||:|||||||||||||||||||||||||||

orf137a MENMVTFSKIRPLLAIAAAALLAACGTAGNNAARKPVQTAKPAAVVGLALGGGASKGFAH

10 20 30 40 50 60

70 80 90 100 110 120

orf137.pep VGIIKVLKENGIPVKVVTGTSAGSIVGNLFASGMSPDRLELEAEILGKTDLVDLTLSTNG

|||||||||||||||||||||||||||:||||||||||||||||||||||||||||||:|

orf137a VGIIKVLKENGIPVKVVTGTSAGSIVGSLFASGMSPDRLELEAEILGKTDLVDLTLSTSG

70 80 90 100 110 120

130 140 149

orf137.pep FIKGAKLQNYINRKLRGMQIQQFPIKFAA

|||| |||||||||: | :||||||||||

orf137a FIKGEKLQNYINRKVGGRRIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV

130 140 150 160 170 180

全长ORF137a核苷酸序列<SEQ ID 561>是：

1 ATGGAAAATA TGGTAACGTT TTCAAAAATC AGACCGCTTT TGGCAATCGC

51 CGCCGCCGCG TTGCTTGCCG CCTGCGGCAC GGCGGGAAAT AATGCTGCCC

101 GCAAGCCGGT GCAAACCGCC AAACCCGCCG CAGTGGTCGG TTTGGCACTC

151 GGTGGCGGCG CATCTAAAGG ATTTGCCCAT GTAGGTATTA TTAAGGTTTT

201 GAAAGAAAAC GGTATTCCTG TGAAGGTGGT TACCGGCACA TCGGCAGGTT

251 CGATAGTCGG CAGCCTTTTT GCATCGGGTA TGTCGCCCGA CCGCCTCGAA

301 TTGGAAGCCG AAATTTTAGG TAAAACCGAT TTGGTCGATT TAACCTTGTC

351 CACCAGTGGT TTTATCAAAG GCGAAAAGCT GCAAAATTAC ATCAACCGAA

401 AAGTCGGCGG CAGGCGGATT CAGCAGTTTC CCATCAAATT TGCCGCCGTT

451 GCTACTGATT TTGAAACCGG CAAGGCCGTC GCTTTCAATC AAGGGAATGC

501 CGGGCAGGCT GTGCGCGCTT CCGCCGCCAT TCCCAATGTG TTCCAACCCG

551 TTATCATCGG CAGGCATACA TATGTTGACG GCGGTCTGTC GCAGCCCGTG

601 CCCGTCAGTG CCGCCCGGCG GCANGNNNNG NATNTCGTGA TTGCCGTCGA

651 TATTTCCGCC CGTCCGAGCA AAAACATCAG CCAAGGCTTC TTCTCTTATC

701 TCGATCAGAC GCTGAACGTA ATGAGCGTTT CCGCGTTGCA AAATGAGTTG

751 GGGCAGGCGG ATGTGGTTAT CAAACCGCAG GTTTTGGATT TGGGTGCAGT

801 CGGCGGATTC GATCAGAAAA AACGCGCCAT CCGGTTGGGT GAGGAGGCAG

851 CACGTGCCGC ATTGCCTGAA ATCAAACGCA AACTGGCGGC ATACCGTTAT

901 TGA

它编码的蛋白质具有氨基酸序列<SEQ ID 562>：

1 MENMVTFSKI RPLLAIAAAA LLAACGTAGN NAARKPVQTA KPAAVVGLAL

51 GGGASKGFAH VGIIKVLKEN GIPVKVVTGT SAGSIVGSLF ASGMSPDRLE

101 LEAEILGKTD LVDLTLSTSG FIKGEKLQNY INRKVGGRRI QQFPIKFAAV

151 ATDFETGKAV AFNQGNAGQA VRASAAIPNV FQPVIIGRHT YVDGGLSQPV

201 PVSAARRXXX XXVIAVDISA RPSKNISQGF FSYLDQTLNV MSVSALQNEL

251 GQADVVIKPQ VLDLGAVGGF DQKKRAIRLG EEAARAALPE IKRKLAAYRY

301 *

ORF137a和ORF137-1显示在300个氨基酸的重叠区内有97.3％的相同性：

orf137a.pep MENMVTFSKIRPLLAIAAAALLAACGTAGNNAARKPVQTAKPAAVVGLALGGGASKGFAH

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf137-1 MENMVTFSKIRPLLAIAAAALLAACGTAGNNAVRKPVQTAKPAAVVGLALGGGASKGFAH

orf137a.pep VGIIKVLKENGIPVKVVTGTSAGSIVGSLFASGMSPDRLELEAEILGKTDLVDLTLSTSG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf137-1 VGIIKVLKENGIPVKVVTGTSAGSIVGSLFASGMSPDRLELEAEILGKTDLVDLTLSTSG

orf137a.pep FIKGEKLQNYINRKVGGRRIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV

||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf137-1 FIKGEKLQNYINRKVGGRQIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV

orf137a.pep FQPVIIGRHTYVDGGLSQPVPVSAARRXXXXXVIAVDISARPSKNISQGFFSYLDQTLNV

||||||||||||||||||||||||||| ||||||||||:|||||||||||||||||

orf137-1 FQPVIIGRHTYVDGGLSQPVPVSAARRQGANFVIAVDISARPGKNISQGFFSYLDQTLNV

orf137a.pep MSVSALQNELGQADVVIKPQVLDLGAVGGFDQKKRAIRLGEEAARAALPEIKRKLAAYRY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf137-1 MSVSALQNELGQADVVIKPQVLDLGAVGGFDQKKRAIRLGEEAARAALPEIKRKLAAYRY

与淋病奈瑟球菌的预计ORF的同源性

ORF137和淋病奈瑟球菌的预计ORF(ORF137ng)在149个氨基酸的重叠区内显示出有89.9％的相同性：

orf137.pep MENMVTFSKIRPLLAIAAAALLAAXRTAGNNAVRKPVQTAKPAAVVGLALGGGASKGFAH 60

||||||||||| :||||||||||| ||||||:|||||||||||||:|||||||||||||

orf137ng MENMVTFSKIRSFLAIAAAALLAACGTAGNNAARKPVQTAKPAAVVALALGGGASKGFAH 60

orf137.pep VGIIKVLKENGIPVKVVTGTSAGSIVGNLFASGMSPDRLELEAEILGKTDLVDLTLSTNG 120

:||:|||||||||||||||||||||||:|:||||||||||||||||||||||||||||:|

orf137ng IGIVKVLKENGIPVKVVTGTSAGSIVGSLLASGMSPDRLELEAEILGKTDLVDLTLSTSG 120

orf137.pep FIKGAKLQNYINRKLRGMQIQQFPIKFAA 149

|||| |||||||||: | |||||||||||

orf137ng FIKGEKLQNYINRKVGGRQIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV 180

全长ORF137ng核苷酸序列<SEQ ID 563>是：

1 ATGGAAAATA TGGTAACGTT TTCAAAAATC AGATCATTTT TGGCAATCGC

51 CGCCGCCGCG TTGCTTGCCG CCTGCGGTAC GGCGGGAAAC AATGCCGCCC

101 GCAAGCCGGT GCAAACCGCC AAACCCGCCG CAGTGGTCGC TTTGGCACTC

151 GGTGGCGGCG CATCTAAAGG ATTTGCCCAT ATAGGAATTG TTAAGGTTTT

201 GAAAGAAAAC GGTATTCCTG TGAAGGTGGT TACCGGCACA TCGGCAGGTT

251 CGATAGTCGG CAGCCTTTTG GCATCGGGTA TGTCGCCCGA CCGCCTCGAA

301 TTGGAAGCCG AGATTTTAGG TAAAACCGAT TTAGTCGATT TAACCTTGTC

351 CACCAGTGGT TTTATCAAAG GCGAAAAGCT GCAAAATTAC ATCAACCGAA

401 AAGTCGGCGG CAGGCAGATT CAGCAGTTTC CCATCAAATT TGCCGCCGTT

451 GCCACTGATT TTGAAACCGG CAAGGCCGTC GCTTTCAATC AAGGGAATGC

501 CGGGCAGGCG GTTCGTGCTT CCGCCGCCAT TCCCAATGTG TTCCAGCCAG

551 TCATCATCGG CAGGCACAAA TATGTTGACG GCGGTCTGTC GCAGCCCGTG

601 CCCGTCAGTG CCGCTCGGCG GCAGGGGGCG AATTTCGTGA TTGCCGTCGA

651 TATTTCCGCA CGTCCGAGCA AAAATGTCGG TCAAGGTTTC TTCTCTTATC

701 TCGATCAGAC GCTGAACGTG ATGAGCGTTT CCGTGTTGCA AAACGAGTTG

751 gggcAGGCGG ATGTGGTTAT CAAACCGCag gtTTTGGATT TGGGTGCAGT

801 CGGCGGATTC GATCAGAAAA AGCGCGCCAT CCGGTTGGGC GAGGAGGCAG

851 CACGTGCCGC ATTGCCTGAA ATCAAACGCA AACTGGCGGC ATACCGTTAT

901 TGA

它编码的蛋白质具有氨基酸序列<SEQ ID 564>：

1 MENMVTFSK I RSFLAIAAAA LLAACGTAGN NAARKPVQTA KPAAVVALAL

51 GGGASKGFAH IGIVKVLKEN GIPVKVVTGT SAGSIVGSLL ASGMSPDRLE

101 LEAEILGKTD LVDLTLSTSG FIKGEKLQNY INRKVGGRQI QQFPIKFAAV

151 ATDFETGKAV AFNQGNAGQA VRASAAIPNV FQPVIIGRHK YVDGGLSQPV

201 PVSAARRQGA NFVIAVDISA RPSKNVGQGF FSYLDQTLNV MSVSVLQNEL

251 GQADVVIKPQ VLDLGAVGGF DQKKRAIRLG EEAARAALPE IKRKLAAYRY

301 *

ORF137ng和ORF137-1显示在300个氨基酸的重叠区内有96.0％的相同性：

orf137ng MENMVTFSKIRSFLAIAAAALLAACGTAGNNAARKPVQTAKPAAVVALALGGGASKGFAH

||||||||||| :|||||||||||||||||||:|||||||||||||:|||||||||||||

orf137-1 MENMVTFSKIRPLLAIAAAALLAACGTAGNNAVRKPVQTAKPAAVVGLALGGGASKGFAH

orf137ng IGIVKVLKENGIPVKVVTGTSAGSIVGSLLASGMSPDRLELEAEILGKTDLVDLTLSTSG

:||:|||||||||||||||||||||||||:||||||||||||||||||||||||||||||

orf137-1 VGIIKVLKENGIPVKVVTGTSAGSIVGSLFASGMSPDRLELEAEILGKTDLVDLTLSTSG

orf137ng FIKGEKLQNYINRKVGGRQIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf137-1 FIKGEKLQNYINRKVGGRQIQQFPIKFAAVATDFETGKAVAFNQGNAGQAVRASAAIPNV

orf137ng FQPVIIGRHKYVDGGLSQPVPVSAARRQGANFVIAVDISARPSKNVGQGFFSYLDQTLNV

||||||||| ||||||||||||||||||||||||||||||||:||::|||||||||||||

orf137-1 FQPVIIGRHTYVDGGLSQPVPVSAARRQGANFVIAVDISARPGKNISQGFFSYLDQTLNV

orf137ng MSVSVLQNELGQADVVIKPQVLDLGAVGGFDQKKRAIRLGEEAARAALPEIKRKLAAYRY

||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf137 MSVSALQNELGQADVVIKPQVLDLGAVGGFDQKKRAIRLGEEAARAALPEIKRKLAAYRY

根据此淋球菌蛋白中存在预计的原核细胞膜脂蛋白脂质连接位点(下划线表示)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例68

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 565>：

1 ATGTTTCGTT TACAATTCAG GCTGTTTCCC CCTTTGCGAA CCGCCATGCA

51 CATCCTGTTG ACCGCCCTGC TCAAATGCCT CTCCCTGcTG CCGCTTTCCT

101 GTCTGCACAC GCTGGGAAAC CGGCTCGGAC ATCTGGCGTT TTACCTTTTA

151 AAGGAAGACC GCGCGCGCAT CGTCGCCmAT ATGCGGCAGG CGGGTTTGAA

201 CCCCGACCCC AAAACGGTCA AAGCCGTTTT TGCGGAAACG GCAAAAGGCG

251 GTTTGGAACT TGCCCCCGCG TTTTTCAGAA AACCGGAAGA CATAGAAACA

301 ATGTTCAAAG CGGTACACGG CTGGGAACAT GTGCAGCAGG CTTTGGACAA

351 ACACGAAGGG CTGCTATTC..

它对应于氨基酸序列<SEQ ID 566；ORF138>：

1 MFRLQFRLFP PLRTAMHILL TALLKCLSLL PLSCLHTLGN RLGHLAFYLL

51 KEDRARIVAX MRQAGLNPDP KTVKAVFAET AKGGLELAPA FFRKPEDIET

101 MFKAVHGWEH VQQALDKHEG LLF

进一步的工作揭示了完整的核苷酸序列<SEQ ID 567>：

1 ATGTTTCGTT TACAATTCAG GCTGTTTCCC CCTTTGCGAA CCGCCATGCA

51 CATCCTGTTG ACCGCCCTGC TCAAATGCCT CTCCCTGCTG CCGCTTTCCT

101 GTCTGCACAC GCTGGGAAAC CGGCTCGGAC ATCTGGCGTT TTACCTTTTA

151 AAGGAAGACC GCGCGCGCAT CGTCGCCAAT ATGCGGCAGG CGGGTTTGAA

201 CCCCGACCCC AAAACGGTCA AAGCCGTTTT TGCGGAAACG GCAAAAGGCG

251 GTTTGGAACT TGCCCCCGCG TTTTTCAGAA AACCGGAAGA CATAGAAACA

301 ATGTTCAAAG CGGTACACGG CTGGGAACAT GTGCAGCAGG CTTTGGACAA

351 ACACGAAGGG CTGCTATTCA TCACGCCGCA CATCGGCAGC TACGATTTGG

401 GCGGACGCTA CATCAGCCAG CAGCTTCCGT TCCCGCTGAC CGCCATGTAC

451 AAACCGCCGA AAATCAAAGC GATAGACAAA ATCATGCAGG CGGGCAGGGT

501 TCGCGGCAAA GGAAAAACCG CGCCTACCAG CATACAAGGG GTCAAACAAA

551 TCATCAAAGC CCTGCGTTCG GGCGAAGCAA CCATCGTCCT GCCCGACCAC

601 GTCCCCTCCC CTCAAGAAGG CGGGGAAGGC GTATGGGTGG ATTTCTTCGG

651 CAAACCTGCC TATACCATGA CGCTGGCGGC AAAATTGGCA CACGTCAAAG

701 GCGTGAAAAC CCTGTTTTTC TGCTGCGAAC GCCTGCCTGG CGGACAAGGT

751 TTCGATTTGC ACATCCGCCC CGTCCAAGGG GAATTGAACG GCGACAAAGC

801 CCATGATGCC GCCGTGTTCA ACCGCAATGC CGAATATTGG ATACGCCGTT

851 TTCCGACGCA GTATCTGTTT ATGTACAACC GCTACAAAAT GCCGTAA

它对应于氨基酸序列<SEQ ID 568；ORF138-1>：

1 MFRLQFRLFP PLRTAMH ILL TALLKCLSLL PLSCLHTLGN RLGHLAFYLL

51 KEDRARIVAN MRQAGLNPDP KTVKAVFAET AKGGLELAPA FFRKPEDIET

101 MFKAVHGWEH VQQALDKHEG LLFITPHIGS YDLGGRYISQ QLPFPLTAMY

151 KPPKIKAIDK IMQAGRVRGK GKTAPTSIQG VKQIIKALRS GEATIVLPDH

201 VPSPQEGGEG VWVDFFGKPA YTMTLAAKLA HVKGVKTLFF CCERLPGGQG

251 FDLHIRPVQG ELNGDKAHDA AVFNRNAEYW IRRFPTQYLF MYNRYKMP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF138和脑膜炎奈瑟球菌菌株A的ORE(ORF138a)在123个氨基酸重叠区内显示出有99.2％的相同性：

10 20 30 40 50 60

orf138.pep MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAX

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138a MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAN

10 20 30 40 50 60

70 80 90 100 110 120

orf138.pep MRQAGLNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138a MRQAGLNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG

70 80 90 100 110 120

orf138.pep LLF

|||

orf138a LLFITPHIGSYDLGGRYISQQLPFPLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTSIQG

130 140 150 160 170 180

全长ORF138a核苷酸序列<SEQ ID 569>是：

1 ATGTTTCGTT TACAATTCAG GCTGTTTCCC CCTTTGCGAA CCGCCATGCA

51 CATCCTGTTG ACCGCCCTGC TCAAATGCCT CTCCCTGCTG CCGCTTTCCT

101 GTCTGCACAC GCTGGGAAAC CGGCTCGGAC ATCTGGCGTT TTACCTTTTA

151 AAGGAAGACC GCGCGCGCAT CGTCGCCAAT ATGCGTCAGG CAGGCATGAA

201 TCCCGACCCC AAAACGGTCA AAGCCGTTTT TGCGGAAACG GCAAAAGGCG

251 GTTTGGAACT TGCCCCCGCG TTTTTCAGAA AACCGGAAGA CATAGAAACA

301 ATGTTCAAAG CGGTACACGG CTGGGAACAT GTGCAGCAGG CTTTGGACAA

351 ACACGAAGGG CTGCTATTCA TCACGCCGCA CATCGGCAGC TACGATTTGG

401 GCGGACGCTA CATCAGCCAG CAGCTTCCGT TCCCGCTGAC CGCCATGTAC

451 AAACCGCCGA AAATCAAAGC GATAGACAAA ATCATGCAGG CGGGCAGGGT

501 TCGCGGCAAA GGAAAAACCG CGCCTACCAG CATACAAGGG GTCAAACAAA

551 TCATCAAAGC CCTGCGTTCG GGCGAAGCAA CCATCGTCCT GCCCGACCAC

601 GTCCCCTCCC CTCAAGAAGG CGGGGAAGGC GTATGGGTGG ATTTCTTCGG

651 CAAACCTGCC TATACCATGA CGCTGGCGGC AAAATTGGCA CACGTCAAAG

701 GCGTGAAAAC CCTGTTTTTC TGCTGCGAAC GCCTGCCTGG CGGACAAGGT

751 TTCGATTTGC ACATCCGCCC CGTCCAAGGG GAATTGAACG GCGACAAAGC

801 CCATGATGCC GCCGTGTTCA ACCGCAATGC CGAATATTGG ATACGCCGTT

851 TTCCGACGCA GTATCTGTTT ATGTACAACC GCTACAAAAT GCCGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 570>：

1 MFRLQFRLFP PLRTAMH ILL TALLKCLSLL PLSCLHTLGN RLGHLAFYLL

51 KEDRARIVAN MRQAGLNPDP KTVKAVFAET AKGGLELAPA FFRKPEDIET

101 MFKAVHGWEH VQQALDKHEG LLFITPHIGS YDLGGRYISQ QLPFPLTAMY

151 KPPKIKAIDK IMQAGRVRGK GKTAPTSIQG VKQIIKALRS GEATIVLPDH

201 VPSPQEGGEG VWVDFFGKPA YTMTLAAKLA HVKGVKTLFF CCERLPGGQG

251 FDLHIRPVQG ELNGDKAHDA AVFNRNAEYW IRRFPTQYLF MYNRYKMP*

ORF138a和ORF138-1显示在298个氨基酸的重叠区内有99.7％的相同性：

orf138a.pep MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138-1 MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAN

orf138a.pep MRQAGMNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG

|||||:||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138-1 MRQAGLNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG

orf138a.pep LLFITPHIGSYDLGGRYISQQLPFPLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTSIQG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138-1 LLFITPHIGSYDLGGRYISQQLPFPLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTSIQG

orf138a.pep VKQIIKALRSGEATIVLPDHVPSPQEGGEGVWVDFFGKPAYTMTLAAKLAHVKGVKTLFF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138-1 VKQIIKALRSGEATIVLPDHVPSPQEGGEGVWVDFFGKPAYTMTLAAKLAHVKGVKTLFF

orf138a.pep CCERLPGGQGFDLHIRPVQGELNGDKAHDAAVFNRNAEYWIRRFPTQYLFMYNRYKMP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf138-1 CCERLPGGQGFDLHIRPVQGELNGDKAHDAAVFNRNAEYWIRRFPTQYLFMYNRYKMP

与淋病奈瑟球菌的预计ORF的同源性

ORF138和淋病奈瑟球菌的预计ORF(ORF138ng)在123个氨基酸的重叠区内显示出有94.3％的相同性：

orf138.pep MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAX 60

|||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||

orf138ng MFRLQFRLFPPLRTAMHILLTALLKCLSLLSLSCLHTLGNRLGHLAFYLLKEDRARIVAN 60

orf138.pep MRQAGLNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG 120

||||||||| :||||||||||| |||||||||:|||||||||||||||||||||||| ||

orf138ng MRQAGLNPDTQTVKAVFAETAKCGLELAPAFFKKPEDIETMFKAVHGWEHVQQALDKGEG 120

orf138.pep LLF 123

|||

orf138ng LLFITPHIGSYDLGGRYISQQLPFHLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTGIQG 180

全长ORF138ng核苷酸序列<SEQ ID 571>是：

1 ATGTTTCGTT TACAATTCAG GCTGTTTCCC CCTTTGCGAA CCGCCATGCA

51 CATCCTGTTG ACCGCCCTGC TCAAATGCCT CTCCCTGCTG TCGCTTTCCT

101 GTCTGCACAC GCTGGGAAAC CGGCTCGGAC ATCTGGCGTT TTACCTTTTA

151 AAGGAAGACC GCGCGCGCAT CGTCGCCAAT ATGCGGCAGG CGGGTTTGAA

201 CCCCGACACG CAGACGGTCA AAGCCGTTTT TGCGGAAACG GCAAAATGCG

251 GTTTGGAACT TGCCCCCGCG TTTTTCAAAA AACCGGAAGA CATCGAAACA

301 ATGTTCAAAG CGGTACACGG CTGGGAACAC GTGCAGCAGG CTTTGGACAA

351 GGGCGAAGGG CTGCTGTTCA TCACGCCGCA CATCGGCAGC TACGATTTGG

401 GCGGACGCTA CATCAGCCAG CAGCTTCCGT TCCACCTGAC CGCCATGTAC

451 AAGCCGCCGA AAATCAAAGC GATAGACAAA ATCATGCAGG CGGGCAGGGT

501 GCGCGGCAAA GGCAAAACcg cgcccaccgg catACAAGGG GTCAAACAAA

551 tcatcaAGGC CCTGCGCGCG GGCGAGGCAA CCAtcATCCT GCCCGACCAC

601 GTCCCTTCTC CGCAGGAagg cggCGGCGTG TGGGCGGATT TTTTCGGCAA

651 ACCTGCATAc acCATGACAC TGGCGGCAAA ATTGGCACAC GTCAAAGGCG

701 TGAAAACCCT GTTTTTCTGC TGCGAACGCC TGCCCGACGG ACAAGGCTTC

751 GTGTTGCACA TCCGCCCCGT CCAAGGGGAA TTGAACGGCA ACAAAGCCCA

801 CGATGCCGCC GTGTTCAACC GCAATACCGA ATATTGGATA CGCCGTTTTC

851 CGACGCAGTA TCTGTTTATG TACAACCGCT ATAAAACGCC GTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 572>：

1 MFRLQFRLFP PLRTAMH ILL TALLKCLSLL SLSCLHTLGN RLGHLAFYLL

51 KEDRARIVAN MRQAGLNPDT QTVKAVFAET AKCGLELAPA FFKKPEDIET

101 MFKAVHGWEH VQQALDKGEG LLFITPHIGS YDLGGRYISQ QLPFHLTAMY

151 KPPKIKAIDK IMQAGRVRGK GKTAPTGIQG VKQIIKALRA GEATIILPDH

201 VPSPQEGGGV WADFFGKPAY TMTLAAKLAH VKGVKTLFFC CERLPDGQGF

251 VLHIRPVQGE LNGNKAHDAA VFNRNTEYWI RRFPTQYLFM YNRYKTP*

ORF138ng和ORF138-1在299个氨基酸的重叠区内显示出有94.3％的相同性：

orf138-1.pep MFRLQFRLFPPLRTAMHILLTALLKCLSLLPLSCLHTLGNRLGHLAFYLLKEDRARIVAN

|||||||||||||||||||||||||||||| |||||||||||||||||||||||||||||

orf138ng MFRLQFRLFPPLRTAMHILLTALLKCLSLLSLSCLHTLGNRLGHLAFYLLKEDRARIVAN

orf138-1.pep MRQAGLNPDPKTVKAVFAETAKGGLELAPAFFRKPEDIETMFKAVHGWEHVQQALDKHEG

||||||||| :||||||||||| |||||||||:|||||||||||||||||||||||| ||

orf138ng MRQAGLNPDTQTVKAVFAETAKCGLELAPAFFKKPEDIETMFKAVHGWEHVQQALDKGEG

orf138-1.pep LLFITPHIGSYDLGGRYISQQLPFPLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTSIQG

|||||||||||||||||||||||| |||||||||||||||||||||||||||||||:|||

orf138ng LLFITPHIGSYDLGGRYISQQLPFHLTAMYKPPKIKAIDKIMQAGRVRGKGKTAPTGIQG

orf138-1.pep VKQIIKALRSGEATIVLPDHVPSPQEGGEGVWVDFFGKPAYTMTLAAKLAHVKGVKTLFF

|||||||||:|||||:|||||||||||| |||:|||||||||||||||||||||||||||

orf138ng VKQIIKALRAGEATIILPDHVPSPQEGG-GVWADFFGKPAYTMTLAAKLAHVKGVKTLFF

orf138-1.pep CCERLPGGQGFDLHIRPVQGELNGDKAHDAAVFNRNAEYWIRRFPTQYLFMYNRYKMP

|||||| |||| ||||||||||||:|||||||||||:||||||||||||||||||| |

orf138ng CCERLPDGQGFVLHIRPVQGELNGNKAHDAAVFNRNTEYWIRRFPTQYLFMYNRYKTP

另外，ORF138ng与荧光假单胞菌的htrB蛋白同源：

gnl|PID|e334283(Y14568)htrB[荧光假单胞菌]长度＝253

评分＝80.8位(196)，估计值＝9e-15

相同性＝49/151(32％)，阳性＝79/151(51％)，空隙＝6/151(3％)

询问：101 MFKAVHGWEHVQQALDKGEGLLFITPHIGSYD-LGGRYISQQLPFHLTAMYKPPKIKAID 159

+ + V G E +++AL G+G++ IT H+G+++ L Y SQ P Y+PPK+KA+D

目标：94 LVREVEGLEVLKEALASGKGVVGITSHLGNWEVLNHFYCSQCKPI---IFYRPPKLKAVD 150

询问：160 KIMQAGRVRGKGKTAPTGIQGVKQIIKALRAGEATIILPDHVPSPQEGGGVWADFFGKPA 219

++++ RV+ K A + +G+ +IK +R G I D P P E G++ FF A

目标：151 ELLRKQRVQLGNKVAASTKEGILSVIKEVRKGGQVGIPAD--PEPAESAGIFVPFFATQA 208

询问：220 YTMTLAAKLAHVKGVKTLFFCCERLPDGQGF 250

T + +F RLPDG G+

目标：209 LTSKFVPNMLAGGKAVGVFLHALRLPDGSGY 239

根据该分析结果(包括淋球菌蛋白中存在推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF138-1(57kDa)克隆到pGex载体中，并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图14A显示出GST-融合蛋白亲和纯化的结果。用纯化的GST-融合蛋白来免疫小鼠，用小鼠血清进行ELISA(阳性结果)和FACS分析(图14B)。这些实验确认ORF138-1是一种外露蛋白，且是一种有用的免疫原。

实施例69

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 573>：

1 ..GCGTGGTCGG CCGGCGAATC GTGGCGTGTG TTAATGGAAA GTGAAACGTG

51 GCATGCGGTG TGGAATACTT TGCGCTTCTC GGCGGCGGCG GTGTATGCGG

101 CAGCGGTTTT GGGTGTGGTG TATGCGGCGC CGGCGCGGCG GTCGGCGTGG

151 ATGCGCGGGC TGATGTTTTA GCCGTTTATG GTGTCGCCGG TTTGTGTTTC

201 GGCGGGCGTG CTGCTGCTTT ATCCGCAGTG GACGGCTTCG TTGCCGTTGC

251 TGCTGGCGAT GTATGCGCTG CTGGCGTATC CGTTTGTGGC AAAAGATGTT

301 TTATCAGCCT GGGATGCACT GCCGCCGGAT TACGGCAGGG CGGCGGCGGG

351 TTTGGGTGCA AACGGCTTTC AGACGGCATG CCGCATCACG TTCCCCCTCT

401 TGAAACCGGC GTTGCGGCGC GGTCTGACTT TGGCGGCGGC AACCTGCGTG

451 GGCGAATTTG CGGCGACATT GTTTCTGTCG CGTCCGGAAT GGCAGACGCT

501 GACGACTTTG ATTTATGCCT ATTTGGGACG CGCGGGTGAG GATAATTACG

551 CGCGGGCGAT GGTGCTG..

它对应于氨基酸序列<SEQ ID 574；ORF139>：

1 ..AWSAGESWRV LMESETWHAV WNTLRFSAAA VYAAAVLGVV YAAPARRSAW

51 MRGLMFXPFM VSPVCVSAGV LLLYPQWTAS LPLLLAMYAL LAYPFVAKDV

101 LSAWDALPPD YGRAAAGLGA NGFQTACRIT FPLLKPALRR GLTLAAATCV

151 GEFAATLFLS RPEWQTLTTL IYAYLGRAGE DNYARAMVL..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 575>：

1 ATGGATGGAC GGCGTTGGGT GGTATGGGGT GCTTTTGCCC TGCTGCCTTC

51 GGCTTTTTTG GCGGTAATGG TCGTTGCGCC TTTGTGGGCG GTGGCGGCGT

101 ATGACGGTTT GGCGTGGCGC GCGGTGCTGT CGGATGCCTA TATGCTCAAA

151 CGTTTGGCGT GGACGGTATT TCAGGCAGCG GCAACCTGTG TGCTGGTGCT

201 GCCTTTGGGC GTGCCTGTCG CGTGGGTGCT GGCGCGGCTG GCGTTTCCGG

251 GGCGGGCTTT GGTGCTGCGC CTGCTGATGC TGCCTTTTGT GATGCCCACG

301 TTGGTGGCGG GCGTGGGCGT GCTGGCCCTG TTCGGGGCGG ACGGGCTGTT

351 GTGGCGCGGC AGGCAGGATA CGCCGTATCT GTTGTTGTAC GGCAATGTGT

401 TTTTCAACCT TCCTGTGTTG GTCAGGGCGG CGTATCAGGG GTTTGTGCAA

451 GTGCCTGCGG CACGGCTTCA GACGGCACGG ACGTTGGGCG CGGGGGCGTG

501 GCGGCGGTTT TGGGACATTG AAATGCCCGT TTTGCGCCCG TGGCTTGCCG

551 GCGGCGTGTG CCTTGTCTTT CTGTATTGTT TTTCCGGGTT CGGGCTGGCG

601 CTGCTGCTGG GCGGCAGCCG TTATGCCACG GTCGAAGTGG AAATTTACCA

651 GTTGGTCATG TTCGAACTCG ATATGGCGGT TGCTTCGGTG CTGGTGTGGC

701 TGGTGTTGGG GGTAACGGCG GCGGCAGGGT TGCTGTATGC GTGGTTCGGC

751 AGGCGCGCGG TTTCGGATAA GGCGGTTTCC CCTGTGATGC CGTCGCCGCC

801 GCAGTCGGTC GGGGAATATG TGCTGCTGGC GTTTGCGGCG GCGGTGTTGT

851 CTGTGTGCTG CCTGTTTCCT TTGTTGGCAA TTGTTGTGAA AGCGTGGTCG

901 GCCGGCGAAT CGTGGCGTGT GTTAATGGAA AGTGAAACGT GGCAGGCGGT

951 GTGGAATACT TTGCGCTTCT CGGCGGCGGC GGTGTATGCG GCGGCGGTTT

1001 TGGGTGTGGT GTATGCGGCG GCGGCGCGGC GGTCGGCGTG GATGCGCGGG

1051 CTGATGTTTT TGCCGTTTAT GGTGTCGCCG GTTTGTGTTT CGGCGGGCGT

1101 GCTGCTGCTT TATCCGCAGT GGACGGCTTC GTTGCCGTTG CTGCTGGCGA

1151 TGTATGCGCT GCTGGCGTAT CCGTTTGTGG CAAAAGATGT TTTATCAGCC

1201 TGGGATGCAC TGCCGCCGGA TTACGGCAGG GCGGCGGCGG GTTTGGGTGC

1251 AAACGGCTTT CAGACGGCAT GCCGCATCAC GTTCCCCCTC TTGAAACCGG

1301 CGTTGCGGCG CGGTCTGACT TTGGCGGCGG CAACCTGCGT GGGCGAATTT

1351 GCGGCGACAT TGTTTCTGTC GCGTCCGGAA TGGCAGACGC TGACGACTTT

1401 GATTTATGCC TATTTGGGAC GCGCGGGTGA GGATAATTAC GCGCGGGCGA

1451 TGGTGCTGAC ATTGCTGTTG GCGGCGTTCG CGCTGGGTAT TTTCCTGCTG

1501 TTGGACGGCG GCGAAGGCGG AAAACAGACG GAAACGTTAT AA

它对应于氨基酸序列<SEQ ID 576；ORF139-1>：

1 MDGRRWVVWG AFALLPSAFL AVMVVAPLWA VAAYDGLAWR AVLSDAYMLK

51 RLAWTVFQAA ATCVLVLPLG VPVAWVLARL AFPGRALVLR LLML PFVMPT

101 LVAGVGVLAL FGADGLLWRG RQDTPYLLLY GNVFFNLPVL VRAAYQGFVQ

151 VPAARLQTAR TLGAGAWRRF WDIEMPVLRP WLAGG VCLVF LYCFSGFGLA

201 LLLGGSRYAT VEVEIYQLVM FELDMAVA SV LVWLVLGVTA AAGLLYAWFG

251 RRAVSDKAVS PVMPSPPQSV GEYVLLAFA A AVLSVCCLFP LLAIVVKAWS

301 AGESWRVLME SETWQAVWNT LRFS AAAVYA AAVLGVVYAA AARRSAWMRG

351 LMF LPFMVSP VCVSAGVLLL YPQWTAS LPL LLAMYALLAY PFVAKDVLSA

401 WDALPPDYGR AAAGLGANGF QTACRITFPL LKPALRRGLT LAAATCVGEF

451 AATLFLSRPE WQTLTTLIYA YLGRAGEDNY ARAM VLTLLL AAFALGIFLL

501 LDGGEGGKQT ETL*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF139和脑膜炎奈瑟球菌菌株A的ORF(ORF139a)在189个氨基酸的重叠区内显示出有94.7％的相同性：

10 20 30

orf139.pep AWSAGESWRVLMESETWHAVWNTLRFS AAA

|||||||||||||||||:||||| ||| |||

orf139a QSVGEYVLLAFA AAVXSVCCLFXLLAIVVKAWSAGESWRVLMESETWQAVWNTXRFS AAA

270 280 290 300 310 320

40 50 60 70 80 90

orf139.pep VYAAAVLGVVYAAPARRSAWMRGLMF XPFMVSPVCVSAGVLLLYPQWTAS LPLLLAMYAL

||||||||||||| |||||||||||| |||||||||||||||| |||||| ||||||||||

orf139a VYAAAVLGVVYAAAARRSAWMRGLMF LPFMVSPVCVSAGVLLLXPQWTAS LPLLLAMYAL

330 340 350 360 370 380

100 110 120 130 140 150

orf139.pep LAYPFVAKDVLSAWDALPPDYGRAAAGLGANGFQTACRITFPLLKPALRRGLTLAAATCV

||||||| |||||| ||||||||||||||||||||||||||||||||||||||||||||||

orf139a LAYPFVAKDVLSAXDALPPDYGRAAAGLGANGFQTACRITFPLLKPALRRGLTLAAATCV

390 400 410 420 430 440

160 170 180 189

orf139.pep GEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNYARAM VL

|||||||| || |||||||||||| |||| |||||||||

orf139a GEFAATLFXSRXEWQTLTTLIYAYXGRAGXDNYARAM VLTLLLAAFALGXFLLLDGGEGG

450 460 470 480 490 500

全长ORF139a核苷酸序列<SEQ ID 577>是：

1 ATGGATGGAC GGCGTTGGGC GGTATGGGGT GCTTTTGCCC TGCTGCCTTC

51 GGCTTTTTTG GCGGCAATGG TCGTTGCGCC TTTGTGGGCG GTGGCGGCGT

101 ATGACGGTTT GGCGTGGCGC GCGGTGCTGT CGGATGCCTA TATGCTCAAA

151 CGTTTGGCGT GGACGGTATT TCAGGCAGCG GCAACCTGTG TGCTGGTGCT

201 GCCTTTGGGC GTGCCTGTCG CGTGGGTGCT GGCGCGGCTG GCGTTTCCGG

251 GGCGGGCTTT GGTGCTGCGC CTGCTGATGC TGCCTTTTGT GATGCCCACG

301 TTGGTGGCGG GCGTGGGCGT GCTGGCTCTG TTCGGGGCGG ACGGCCTGTN

351 GTGGCGCGGC TGGCAGGATA CGCCGTATCT GTTGTTGTAC GGCAATGTGT

401 TTTTTNACCT TCCTGTGTTG GTCAGGGCGG CATATCAGGG GTTTGTGCAA

451 GTGCCTGCGG CACGGCTTCA GACGGCACNG ACATTGGGCG CGGGGGCGTG

501 GCGGCGGTTT TGGGACATTG AAATGCCCGT TTTGCGCCCG TGGCTTGCCG

551 GCGGCGTGTG CCTTGTCTTC CTGTATTGTT TTTCGGGGTT CGGGCTGGCA

601 TTGCTGCTGG GCGGCAGCCG TTATGCCACG GTCGAAGTGG AAATTTACCA

651 GTTGGTCATG TTCGAACTCG ATATGGCGGT TGCTTCGGTG CTNGTGTGGC

701 TGGTGTNGGG GGTAACNGCG GCGGCAGGGT TGCTGTATGC GTGGTTCGGC

751 AGGCGCGCGG TTTCGGATAA GGCNGTTTCC CCTGTGATGC CGTCGCCGCC

801 GCAGTCGGTC GGGGAATATG TGCTNCTGGC GTTTGCGGCG GCGGTGTNGT

851 CTGTGTGCTG CCTGTTTCNT TTGTTGGCAA TTGTTGTGAA AGCGTGGTCG

901 GCCGGCGAAT CGTGGCGTGT GTTAATGGAA AGTGAAACGT GGCAGGCGGT

951 GTGGAATACT NTGCGCTTCT CGGCGGCGGC GGTGTATGCG GCGGCGGTTT

1001 TGGGTGTGGT GTATGCGGCG GCGGCGCGGC GGTCGGCGTG GATGCGCGGG

1051 CTGATGTTTT TGCCGTTTAT GGTGTCGCCG GTTTGTGTTT CGGCGGGCGT

1101 GCTGCTGCTT NATCCGCAGT GGACGGCTTC GTTGCCGCTG CTGCTGGCGA

1151 TGTATGCGCT GCTGGCGTAT CCGTTTGTGG CAAAAGATGT TTTATCAGCC

1201 TGNGATGCAC TGCCGCCGGA TTACGGCAGG GCGGCGGCGG GTTTGGGTGC

1251 AAACGGCTTT CAGACGGCAT GCCGCATCAC GTTCCCCCTC TTGAAACCGG

1301 CGTTGCGGCG CGGTCTGACT TTGGCGGCGG CAACCTGCGT GGGCGAATTT

1351 GCGGCAACCT TGTTCNTGTC GCGTCNCGAG TGGCAGACGC TGACGACTTT

1401 GATTTATGCC TATNTGGGAC GCGCGGGTGA NGATAATTAC GCGCGGGCGA

1451 TGGTGCTGAC ATTGCTGTTG GCGGCGTTCG CGCTGGGTAT NTTCCTGCTG

1501 TTGGACGGCG GCGAAGGCGG AAAACGGACG GAAACGTTAT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 578>：

1 MDGRRWAVWG AFALLPSAFL AAMVVAPLWA VAAYDGLAWR AVLSDAYMLK

51 RLAWTVFQAA ATCVLVLPLG VPVAWVLARL AFPGRALVLR LLML PFVMPT

101 LVAGVGVLAL FGADGLXWRG WQDTPYLLLY GNVFFXLPVL VRAAYQGFVQ

151 VPAARLQTAX TLGAGAWRRF WDIEMPVLRP WLAGG VCLVF LYCFSGFGLA

201 LLLGGSRYAT VEVEIYQLVM FELDMAVA SV LVWLVXGVTA AAGLLYAWFG

251 RRAVSDKAVS PVMPSPPQSV GEYVLLAFA A AVXSVCCLFX LLAIVVKAWS

301 AGESWRVLME SETWQAVWNT XRFS AAAVYA AAVLGVVYAA AARRSAWMRG

351 LMF LPFMVSP VCVSAGVLLL XPQWTAS LPL LLAMYALLAY PFVAKDVLSA

401 XDALPPDYGR AAAGLGANGF QTACRITFPL LKPALRRGLT LAAATCVGEF

451 AATLFXSRXE WQTLTTLIYA YXGRAGXDNY ARAM VLTLLL AAFALGXFLL

501 LDGGEGGKRT ETL*

ORF139a和ORF139-1在514个氨基酸的重叠区内显示出有96.5％的同源性：

orf139a.pep MDGRRWAVWGAFALLPSAFLAAMVVAPLWAVAAYDGLAWRAVLSDAYMLKRLAWTVFQAA

||||||:||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf139-1 MDGRRWVVWGAFALLPSAFLAVMVVAPLWAVAAYDGLAWRAVLSDAYMLKRLAWTVFQAA

orf139a.pep ATCVLVLPLGVPVAWVLARLAFPGRALVLRLLMLPFVMPTLVAGVGVLALFGADGLXWRG

|||||||||||||||||||||||||||||||||||||||||||||||||||||||| |||

orf139-1 ATCVLVLPLGVPVAWVLARLAFPGRALVLRLLMLPFVMPTLVAGVGVLALFGADGLLWRG

orf139a.pep WQDTPYLLLYGNVFFXLPVLVRAAYQGFVQVPAARLQTAXTLGAGAWRRFWDIEMPVLRP

|||||||||||||| ||||||||||||||||||||||| ||||||||||||||||||||

orf139-1 RQDTPYLLLYGNVFFNLPVLVRAAYQGFVQVPAARLQTARTLGAGAWRRFWDIEMPVLRP

orf139a.pep WLAGGVCLVFLYCFSGFGLALLLGGSRYATVEVEIYQLVMFELDMAVASVLVWLVXGVTA

||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||

orf139-1 WLAGGVCLVFLYCFSGFGLALLLGGSRYATVEVEIYQLVMFELDMAVASVLVWLVLGVTA

orf139a.pep AAGLLYAWFGRRAVSDKAVSPVMPSPPQSVGEYVLLAFAAAVXSVCCLFXLLAIVVKAWS

|||||||||||||||||||||||||||||||||||||||||| |||||| ||||||||||

orf139-1 AAGLLYAWFGRRAVSDKAVSPVMPSPPQSVGEYVLLAFAAAVLSVCCLFPLLAIVVKAWS

orf139a.pep AGESWRVLMESETWQAVWNTXRFSAAAVYAAAVLGVVYAAAARRSAWMRGLMFLPFMVSP

|||||||||||||||||||| |||||||||||||||||||||||||||||||||||||||

orf139-1 AGESWRVLMESETWQAVWNTLRFSAAAVYAAAVLGVVYAAAARRSAWMRGLMFLPFMVSP

orf139a.pep VCVSAGVLLLXPQWTASLPLLLAMYALLAYPFVAKDVLSAXDALPPDYGRAAAGLGANGF

|||||||||| ||||||||||||||||||||||||||||| ||||||||||||||| |||

orf139-1 VCVSAGVLLLYPQWTASLPLLLAMYALLAYPFVAKDVLSAWDALPPDYGRAAAGLGANGF

orf139a.pep QTACRITFPLLKPALRRGLTLAAATCVGEFAATLFXSRXEWQTLTTLIYAYXGRAGXDNY

||||||||||||||||||||||||||||||||||| || |||||||||||| |||| |||

orf139-1 QTACRITFPLLKPALRRGLTLAAATCVGEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNY

orf139a.pep ARAMVLTLLLAAFALGXFLLLDGGEGGKRTETLX

|||||||||||||||| |||||||||||:|||||

orf139-1 ARAMVLTLLLAAFALGIFLLLDGGEGGKQTETLX

与淋病奈瑟球菌的预计ORF的同源性

ORF139和淋病奈瑟球菌的预计ORF(ORF139ng)在189个氨基酸的重叠区内显示出有95.2％的相同性：

orf139.pep AWSAGESWRVLMESETWHAVWNTLRFSAAA 30

||||||| |||||||||:||||||||||||

orf139ng QSVGEYVLLAFSVAVLSVCCLFPLSAIVVKAWSAGESRRVLMESETWQAVWNTLRFSAAA 327

orf139.pep VYAAAVLGVVYAAPARRSAWMRGLMFXPFMVSPVCVSAGVLLLYPQWTASLPLLLAMYAL 90

|:||||||||||| ||| :|||||:| |||||||||||||||||| ||||||||||||||

orf139ng VFAAAVLGVVYAAAARRLVWMRGLVFLPFMVSPVCVSAGVLLLYPGWTASLPLLLAMYAL 387

orf139.pep LAYPFVAKDVLSAWDALPPDYGRAAAGLGANGFQTACRITFPLLKPALRRGLTLAAATCV 150

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf139ng LAYPFVAKDVLSAWDALPPDYGRAAAGLGANGFQTACRITFPLLKPALRRGLTLAAATCV 447

orf139.pep GEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNYARAMVL 189

|||||||||||||||||||||||||||||||||||||||

orf139ng GEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNYARAMVLTLLLSAFAVCIFLLLDNGEGG 507

预计全长ORF139ng核苷酸序列<SEQ ID 579>编码的蛋白质具有氨基酸序列<SEQ ID 580>：

1 MDGRCWAVRG AFSLLPSAFL AVMVVAPLWA VAAYDGLAWR AVLSDAYMLK

51 RLAWTVFQAA ATCVLVLPLG VPVAWVLARL AFPGRALVLR LLMLPFVMPT

101 LVAGVGVLAL FGADGLLWRG RQDTPYLLLY GNVFFNLPVL VRAAYQGFAQ

151 VPAARLQTAR TLGAGAWRPF WDIEMPVLRP WLAGGVCLVF LYCFSGFGLA

201 LLLGGSRYAT VEVEIYQLVM FELDMAGASA LVWLVLGVTA AAGLLYAWFG

251 RRAVSDKAVS PVMPSPPQSV GEYVLLAFSV AVLSVCCLFP LSAIVVKAWS

301 AGESRRVLME SETWQAVWNT LRFSAAAVFA AAVLGVVYAA AARRLVWMRG

351 LVFLPFMVSP VCVSAGVLLL YPGWTASLPL LLAMYALLAY PFVAKDVLSA

401 WDALPPDYGR AAAGLGANGF QTACRITFPL LKPALRRGLT LAAATCVGEF

451 AATLFLSRPE WQTLTTLIYA YLGRAGEDNY ARAMVLTLLL SAFAVCIFLL

501 LDNGEGGKRT ETL*

进一步的工作揭示了一个淋球菌变体DNA序列<SEQ ID 581>：

1 ATGGATGGAC GGTGTTGGGC GGTACGGGGT GCTTTTTCCC TGCTGCCTTC

51 GGCTTTTTTG GCGGTAATGG TCGTTGCGCC TTTGTGGGCG GTGGCGGCGT

101 ATGACGGTTT GGCGTGGCGC GCGGTGCTGT CGGATGCCTA TATGCTCAAA

151 CGTTTGGCGT GGACGGTGTT TCAGGCGGCG GCAACCTGTG TGCTGGTGCT

201 GCCTTTGGGC GTGCCTGTCG CGTGGGTGCT GGCGCGGCTG GCGTTCCCGG

251 GGCGGGCTTT GGTGCTGCGC CTGCTGATGC TGCCGTTTGT GATGCCCACG

301 CTGGTGGCGG GCGTGGGCGT GCTGGCTCTG TTCGGGGCGG ACGGGCTGTT

351 GTGGCGCGGC CGGCAGGATA CGCCGTATCT GTTGTTGTAC GGCAATGTGT

401 TTTTCAACCT GCCCGTGTTG GTCAGGGCGG CGTATCAGGG GTTTGCTCAA

451 GTGCCTGCGG CACGGCTTCA GACGGCACGG ACGTTGGGCG CGGGGGCGTG

501 GCGGCGGTTT TGGGACATTG AAATGCCCGT TTTGCGCCCG TGGCTTGCCG

551 GCGGCGTGTG CCTTGTCTTC CTGTATTGTT TTTCGGGGTT CGGGCTGGCA

601 TTGCTGTTGG GCGGCAGCCG TTATGCCACG GTCGAAGTGG AAATTTACCA

651 GTTGGTTATG TTCGAACTCG ATATGGCGGG GGCTTCGGCG CTGGTGTGGC

701 TGGTGTTGGG GGTAACGGCG GCGGCAGGGT TGCTGTATGC GTGGTTCGGC

751 AGGCGCGCGG TTTCGGATAA GGCGGTTTCC CCCGTGATGC CGTCGCCGCC

801 GCAATCGGTG GGGGAATATG TATTGCTGGC ATTTTCGGTG GCGGTGTTGT

851 CCGTGTGCTG CCTGTTTCCT TTGTCGGCAA TTGTTGTGAA AGCGTGGTCG

901 GCCGGCGAAT CGCGGCGTGT GTTAATGGAA AGTGAAACGT GGCAGGCAGT

951 GTGGAATACt ttGCGCTTTT CGGCGGCGGC GGTGTTTGCG GCGGCGGTTT

1001 TGGGTGTGGT GTATGCGGCG GCGGCGCGGC GGCTGGTGTG GATGCGCGGA

1051 CTGGTGTTTT TACCGTTTAT GGTGTCGCCG GTTTGTGTTT CGGCGGGCGT

1101 GCTGCTGCTT TATCCGGGGT GGACGGCTTC GTTACCGCTG CTGCTGGCGA

1151 TGTATGCGCT GCTGGCGTAT CCGTTTGTGG CAAAAGATGT TTTATCGGCC

1201 TGGGATGCAC TGCCGCCGGA TTACGGCAGG GCGGCGGCAG GTTTGGGCGC

1251 AAACGGCTTT CAGACGGCAT GCCGTATCAC GTTCCCCCTC TTGAAACCGG

1301 CGTTGCGGCG CGGTCTGACT TTGGCGGCGG CGACGTGTGT GGGCGAATTT

1351 GCGGCAACCT TGTTCCTGTC GCGTCCGGAA TGGCAGACGT TGACGACTTT

1401 GATTTATGCC TATTTGGGGC GTGCGGGTGA GGACAATTAT GCGCGGGCAA

1451 TGGTGTTGAC ATTGCTGTTG TCGGCATTTG CGGTGTGCAT TTTCCTGCTG

1501 TTGGACAACG GCGAAGGCGg aaaACGGACG GAAACGTTAT AA

它对应于氨基酸序列<SEQ ID 582；ORF139ng-1>：

1 MDGRCWAVRG AFSLLPSAFL AVMVVAPLWA VAAYDGLAWR AVLSDAYMLK

51 RLAWTVFQAA ATCVLVLPLG VPVAWVLARL AFPGRALVLR LLMLP FVMPT

101 LVAGVGVLAL FGADGLLWRG RQDTPYLLLY GNVFFNLPVL VRAAYQGFAQ

151 VPAARLQTAR TLGAGAWRRF WDIEMPVLRP WLAGG VCLVF LYCFSGFGLA

201 LLLGGSRYAT VEVEIYQLVM FELDMAGA SA LVWLVLGVTA AAGLLYAWFG

251 RRAVSDKAVS PVMPSPPQSV GEYVLLAFS V AVLSVCCLFP LSAIVVKAWS

301 AGESRRVLME SETWQAVWNT LRFS AAAVFA AAVLGVVYAA AARRLVWMRG

351 LVF LPFMVSP VCVSAGVLLL YPGWTASL PL LLAMYALLAY PFVAKDVLSA

401 WDALPPDYGR AAAGLGANGF QTACRITFPL LKPALRRGLT LAAATCVGEF

451 AATLFLSRPE WQTLTTLIYA YLGRAGEDNY ARAM VLTLLL SAFAVCIFLL

501 LDNGEGGKRT ETL*

ORF139ng-1和ORF139-1在513个氨基酸的重叠区内显示出有95.9％的相同性：

orf139ng MDGRCWAVRGAFSLLPSAFLAVMVVAPLWAVAAYDGLAWRAVLSDAYMLKRLAWTVFQAA

|||| |:| |||:|||||||||||||||||||||||||||||||||||||||||||||||

orf139-1 MDGRRWVVWGAFALLPSAFLAVMVVAPLWAVAAYDGLAWRAVLSDAYMLKRLAWTVFQAA

orf139ng ATCVLVLPLGVPVAWVLARLAFPGRALVLRLLMLPFVMPTLVAGVGVLALFGADGLLWRG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf139-1 ATCVLVLPLGVPVAWVLARLAFPGRALVLRLLMLPFVMPTLVAGVGVLALFGADGLLWRG

orf139ng RQDTPYLLLYGNVFFNLPVLVRAAYQGFAQVPAARLQTARTLGAGAWRRFWDIEMPVLRP

||||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||

orf139-1 RQDTPYLLLYGNVFFNLPVLVRAAYQGFVQVPAARLQTARTLGAGAWRRFWDIEMPVLRP

orf139ng WLAGGVCLVFLYCFSGFGLALLLGGSRYATVEVEIYQLVMFELDMAGASALVWLVLGVTA

|||||||||||||||||||||||||||||||||||||||||||||| ||:||||||||||

orf139-1 WLAGGVCLVFLYCFSGFGLALLLGGSRYATVEVEIYQLVMFELDMAVASVLVWLVLGVTA

orf139ng AAGLLYAWFGRRAVSDKAVSPVMPSPPQSVGEYVLLAFSVAVLSVCCLFPLSAIVVKAWS

||||||||||||||||||||||||||||||||||||||::||||||||||| ||||||||

orf139-1 AAGLLYAWFGRRAVSDKAVSPVMPSPPQSVGEYVLLAFAAAVLSVCCLFPLLAIVVKAWS

orf139ng AGESRRVLMESETWQAVWNTLRFSAAAVFAAAVLGVVYAAAARRLVWMRGLVFLPFMVSP

|||| |||||||||||||||||||||||:||||||||||||||| :|||||:||||||||

orf139 AGESWRVLMESETWQAVWNTLRFSAAAVYAAAVLGVVYAAAARRSAWMRGLMFLPFMVSP

orf139ng VCVSAGVLLLYPGWTASLPLLLAMYALLAYPFVAKDVLSAWDALPPDYGRAAAGLGANGF

|||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||

orf139-1 VCVSAGVLLLYPQWTASLPLLLAMYALLAYPFVAKDVLSAWDALPPDYGRAAAGLGANGF

orf139ng QTACRITFPLLKPALRRGLTLAAATCVGEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf139-1 QTACRITFPLLKPALRRGLTLAAATCVGEFAATLFLSRPEWQTLTTLIYAYLGRAGEDNY

orf139ng ARAMVLTLLLSAFAVCIFLLLDNGEGGKRTETL

||||||||||:|||: ||||||:|||||:||||

orf139-1 ARAMVLTLLLAAFALGIFLLLDGGEGGKQTETL

根据淋球菌蛋白中存在一个预计的结合蛋白依赖型转运蛋白系统内膜组分特征序列(下划线)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例70

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 583>：

1 ATGGACGGCT GGACACAGAC GCTGTCCGCG CAAACCCTGT TGGGCATTTC

51 GGCGGCGGCA ATCATCCTCA TTCTGATTTT AATCGTCAGA TTCCGCATCC

101 ACGCGCTGCT GACACTGGTC ATCGTCAGCC TGCTGACGGC TTTGGCAACC

151 GGTTTGCCCA CAGGCAGCAT TGTCAAAGAC ATACTGGTCA AAAACTTCGG

201 CGGCACGCTC GGCGGCGTGG CGCTTCTGGT CGGCCTGGGC GCGATGCTCG

251 AACGTTTGGT C...

它对应于氨基酸序列<SEQ ID 584；ORF 140>：

1 MDGWTQTLSA QTLLGISAAA IILILILIVR FRIHALLTLV IVSLLTALAT

51 GLPTGSIVKD ILVKNFGGTL GGVALLVGLG AMLERLV..

进一步的工作揭示了其完整的核苷酸序列<SEQ ID 585>：

1 ATGGACGGCT GGACACAGAC GCTGTCCGCG CAAACCCTGT TGGGCATTTC

51 GGCGGCGGCA ATCATCCTCA TTCTGATTTT AATCGTCAAA TTCCGCATCC

101 ACGCGCTGCT GACACTGGTC ATCGTCAGCC TGCTGACGGC TTTGGCAACC

151 GGTTTGCCCA CAGGCAGCAT TGTCAACGAC ATACTGGTCA AAAACTTCGG

201 CGGCACGCTC GGCGGCGTGG CGCTTCTGGT CGGCCTGGGC GCGATGCTCG

251 GACGTTTGGT CGAAACATCC GGCGGCGCAC AGTCGCTGGC GGACGCGCTG

301 ATCCGGATGT TCGGCGAAAA ACGCGCACCG TTCGCGCTGG GCGTTGCCTC

351 GCTGATTTTC GGCTTCCCGA TTTTCTTCGA TGCCGGACTA ATCGTCATGC

401 TGCCCATCGT GTTCGCCACC GCACGGCGCA TGAAACAGGA CGTACTGCCC

451 TTCGCGCTTG CCTCCATCGG CGCATTTTCC GTCATGCACG TCTTCCTGCC

501 GCCCCATCCG GGCCCGATTG CCGCTTCCGA ATTTTACGGC GCGAACATCG

551 GCCAAGTTTT GATTTTGGGT CTGCCGACCG CCTTCATCAC ATGGTATTTC

601 AGCGGCTATA TGCTCGGCAA AGTGTTGGGG CGCACCATCC ATGTTCCCGT

651 TCCCGAACTG CTCAGCGGCG GCACGCAAGA CAACGACCTG CCGAAAGAAC

701 CTGCCAAAGC AGGAACGGTC GTCGCCATCA TGCTGATTCC CATGCTGCTG

751 ATTTTCCTGA ATACCGGCGT ATCGGCCCTC ATCAGCGAAA AACTCGTAAG

801 TGCGGACGAA ACCTGGGTTC AGACGGCAAA AATAATCGGT TCGACACCGA

851 TCGCCCTTCT GATTTCCGTA TTGGTCGCAC TGTTTGTCTT GGGACGCAAA

901 CGCGGCGAAA GCGGCAGCGC GTTGGAAAAA ACCGTGGACG GCGCACTCGC

951 CCCCGTCTGT TCCGTGATTC TGATTACCGG CGCGGGCGGT ATGTTCGGCG

1001 GCGTTTTGCG CGCTTCCGGC ATCGGCAAGG CACTCGCCGA CAGCATGGCG

1051 GATTTGGGCA TTCCCGTCCT TTTGGGCTGT TTCCTTGTCG CCTTGGCACT

1101 GCGTATCGCG CAAGGTTCGG CAACCGTCGC CCTGACCACC GCCGCCGCGC

1151 TGATGGCTCC TGCCGTTGCC GCCGCCGGCT TTACCGACTG GCAGCTCGCC

1201 TGTATCGTAT TGGCAACGGC GGCAGGTTCG GTCGGTTGCA GCCACTTCAA

1251 CGACTCCGGC TTCTGGCTGG TCGGCCGTCT CTTGGACATG GACGTACCGA

1301 CCACGCTGAA AACCTGGACG GTCAACCAAA CCCTCATCGC ACTCATCGGC

1351 TTTGCCTTGT CCGCACTGCT GTTCGCCATC GTCTGA

它对应于氨基酸序列<SEQ ID 586；ORF140-1>：

1 MDGWTQTLSA QTLLGISAAA IILILILIVK FRIHALLTLV IVSLLTALAT

51 GLPTGSIVND ILVKNFGGTL GGVALLVGLG AMLGRLVETS GGAQSLADAL

101 IRMFGEKRAP FALGVAS LIF GFPIFFDAGL IVMLPIVFAT ARRMKQD VLP

151 FALASIGAFS VMHVFLPPHP GPIAASEFYG ANIGQVLILG LPTAFITWYF

201 SGYMLGKVLG RTIHVPVPEL LSGGTQDNDL PKEPAK AGTV VAIMLIPMLL

251 IFLNTGVSAL ISEKLVSADE TWVQTAKIIG S TPIALLISV LVALFVLGRK

301 RGESGSALEK TVDGALAPVC SVILITGAGG MFGGVLRASG IGKALADSMA

351 DLG IPVLLGC FLVALALRIA QGSAT VALTT AAALMAPAVA AAGFTDWQLA

401 CIVLATAAGS VGCSHFNDSG FWLVGRLLDM DVPTTLKTWT VNQTLIALIG

451 FALSALLFAI V*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF140和脑膜炎奈瑟球菌菌株A的ORF(ORF140a)在87个氨基酸的重叠区内显示出有95.4％的相同性：

10 20 30 40 50 60

orf140.pep MDGWTQTLSAQTLLGISAAAIILILILIVRFRIHALLTLVIVSLLTALATGLPTGSIVKD

|||||||||||||||||||||||||||||:||||||||||||||||||||||||||||:|

orf140a MDGWTQTLSAQTLLGISAAAIILILILIVKFRIHALLTLVIVSLLTALATGLPTGSIVND

10 20 30 40 50 60

70 80

orf140.pep ILVKNFGGTL GGVALLVGLGAMLERLV

:|||||||||||||||||||||| |||

orf140a VLVKNFGGTL GGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFALGVASLIF

70 80 90 100 110 120

全长ORF140a核苷酸序列<SEQ ID 587>是：

1 ATGGACGGCT GGACACAGAC GCTGTCCGCG CAAACCCTGT TGGGCATTTC

51 GGCGGCGGCA ATCATCCTCA TTCTGATTTT AATCGTCAAA TTCCGCATCC

101 ACGCGCTGCT GACACTGGTC ATCGTCAGCC TGCTGACGGC TTTGGCAACC

151 GGTTTGCCCA CAGGCAGCAT TGTCAACGAC GTACTGGTCA AAAACTTCGG

201 CGGCACGCTC GGCGGCGTGG CGCTTCTGGT CGGCCTGGGC GCGATGCTCG

251 GACGTTTGGT CGAAACATCC GGCGGCGCAC AGTCGCTGGC GGACGCGCTG

301 ATCCGGATGT TCGGCGAAAA ACGCGCACCG TTCGCGCTGG GCGTTGCCTC

351 GCTGATTTTC GGCTTCCCGA TTTTCTTCGA TGCCGGACTA ATCGTCATGC

401 TGCCCATCGT GTTCGCCACC GCACGGCGCA TGAAACAGGA CGTACTGCCC

451 TTCGCGCTTG CCTCCATCGG CGCATTTTCC GTCATGCACG TCTTCCTGCC

501 GCCCCATCCG GGCCCGATTG CCGCTTCCGA ATTTTACGGC GCGAACATCG

551 GCCAAGTTTT GATTTTGGGT CTGCCGACCG CCTTCATCAC ATGGTATTTC

601 AGCGGCTATA TGCTCGGCAA AGTGTTGGGG CGCACCATCC ATGTTCCCGT

651 TCCCGAACTG CTCAGCGGCG GCACGCAAGA CAACGACCTG CCGAAAGAAC

701 CTGCCAAAGC AGGAACGGTC GTCGCCATCA TGCTGATTCC CATGCTGCTG

751 ATTTTCCTGA ATACCGGCGT ATCGGCCCTC ATCAGCGAAA AACTCGTAAG

801 TGCGGACGAA ACCTGGGTTC AGACGGCAAA AATAATCGGT TCGACACCGA

851 TCGCCCTTCT GATTTCCGTA TTGGTCGCAC TGTTTGTCTT GGGACGCAAA

901 CGCGGCGAAA GCGGCAGCGC GTTGGAAAAA ACCGTGGACG GCGCACTCGC

951 CCCCGTCTGT TCCGTGATTC TGATTACCGG CGCGGGCGGT ATGTTCGGCG

1001 GCGTTTTGCG CGCTTCCGGC ATCGGCAAGG CACTCGCCGA CAGCATGGCG

1051 GATTTGGGCA TTCCCGTCCT TTTGGGCTGT TTCCTTGTCG CCTTGGCACT

1101 GCGTATCGCG CAAGGTTCGG CAACCGTCGC CCTGACCACC GCCGCCGCGC

1151 TGATGGCTCC TGCCGTTGCC GCCGCCGGCT TTACCGACTG GCAGCTCGCC

1201 TGTATCGTAT TGGCAACGGC GGCAGGTTCG GTCGGTTGCA GCCACTTCAA

1251 CGACTCCGGC TTCTGGCTGG TCGGCCGCCT CTTGGACATG GACGTACCGA

1301 CCACGCTGAA AACCTGGACG GTCAACCAAA CCCTCATCGC ACTCATCGGC

1351 TTTGCCTTGT CCGCACTGCT GTTCGCCATC GTCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 588>：

1 MDGWTQTLSA QTLLGISAAA IILILILIVK FRIHALLTLV IVSLLTALAT

51 GLPTGSIVND VLVKNFGGTL GGVALLVGLG AMLGRLVETS GGAQSLADAL

101 IRMFGEKRAP FALGVAS LIF GFPIFFDAGL IVMLPIVFAT ARRMKQD VLP

151 FALASIGAFS VMHVFLPPHP GPIAASEFYG ANIGQVLILG LPTAFITWYF

201 SGYMLGKVLG RTIHVPVPEL LSGGTQDNDL PKEPAK AGTV VAIMLIPMLL

251 IFLNTGVSAL ISEKLVSADE TWVQTAKIIG S TPIALLISV LVALFVLGRK

301 RGESGSALEK TVDGALAPVC SVILITGAGG MFGGVLRASG IGKALADSMA

351 DLG IPVLLGC FLVALALRIA QGSAT VALTT AAALMAPAVA AAGFTDWQLA

401 CIVLATAAGS VGCSHFNDSG FWLVGRLLDM DVPTTLKTWT VNQT LIALIG

451 FALSALLFAI V*

ORF140a和ORF140-1在461个氨基酸的重叠区内显示出有99.8％的相同性：

orf140-1.pep MDGWTQTLSAQTLLGISAAAIILILILIVKFRIHALLTLVIVSLLTALATGLPTGSIVND 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a MDGWTQTLSAQTLLGISAAAIILILILIVKFRIHALLTLVIVSLLTALATGLPTGSIVND 60

orf140-1.pep ILVKNFGGTLGGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFALGVASLIF 120

:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a VLVKNFGGTLGGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFALGVASLIF 120

orf140-1.pep GFPIFFDAGLIVMLPIVFATARRMKQDVLPFALASIGAFSVMHVFLPPHPGPIAASEFYG 180

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a GFPIFFDAGLIVMLPIVFATARRMKQDVLPFALASIGAFSVMHVFLPPHPGPIAASEFYG 810

orf140-1.pep ANIGQVLILGLPTAFITWYFSGYMLGKVLGRTIHVPVPELLSGGTQDNDLPKEPAKAGTV 240

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a ANIGQVLILGLPTAFITWYFSGYMLGKVLGRTIHVPVPELLSGGTQDNDLPKEPAKAGTV 240

orf140-1.pep VAIMLIPMLLIFLNTGVSALISEKLVSADETWVQTAKIIGSTPIALLISVLVALFVLGRK 300

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a VAIMLIPMLLIFLNTGVSALISEKLVSADETWVQTAKIIGSTPIALLISVLVALFVLGRK 300

orf140-1.pep RGESGSALEKTVDGALAPVCSVILITGAGGMFGGVLRASGIGKALADSMADLGIPVLLGC 360

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a RGESGSALEKTVDGALAPVCSVILITGAGGMFGGVLRASGIGKALADSMADLGIPVLLGC 360

orf140-1.pep FLVALALRIAQGSATVALTTAAALMAPAVAAAGFTDWQLACIVLATAAGSVGCSHFNDSG 420

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140a FLVALALRIAQGSATVALTTAAALMAPAVAAAGFTDWQLACIVLATAAGSVGCSHFNDSG 420

orf140-1.pep FWLVGRLLDMDVPTTLKTWTVNQTLIALIGFALSALLFAIV 461

|||||||||||||||||||||||||||||||||||||||||

orf140a FWLVGRLLDMDVPTTLKTWTVNQTLIALIGFALSALLFAIV 461

与淋病奈瑟球菌的预计ORF的同源性

ORF140和淋病奈瑟球菌的预计ORF(ORF140ng)在87个氨基酸的重叠区内显示出有92％的相同性：

orf140.pep MDGWTQTLSAQTLLGISAAAIILILILIVRFRIHALLTLVIVSLLTALATGLPTGSIVKD 60

||| |||||||||||||||||||||||||:|||:|||||||:||||||||||||||||:|

orf140ng MDGRTQTLSAQTLLGISAAAIILILILIVKFRIRALLTLVIASLLTALATGLPTGSIVND 60

orf140.pep ILVKNFGGTLGGVALLVGLGAMLERLV 87

:|||||||||||||||||||||| |||

orf140ng VLVKNFGGTLGGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFAPGVASLIF 120

预计全长ORF 140ng核苷酸序列<SEQ ID 589>编码的蛋白质具有氨基酸序列<SEQ ID 590>：

1

51

LPTGSIVND VLVKNFGGTL GGVALLVGLG AMLGRLVETS GGAQSLADAL

101 IRMFGEKRAP FAPGVAS LIF GFPIFFDAGL IVMLPIVFAT ARRMKQD VLP

151 FALASVGAFS VMHVFLPPHP GPIAASEFYG ANIGQVLILG LPTAFITWYF

201 SGYMLGKVLG RAIHVPVPEL LSGGTQDSDP PKEPAK AGTV VAVMLIPMLL

251 IFLNTGVSAL ISEKLVSADE TWVQTAKMIG S TPVALLISV LAALLVLGRK

301 RGESGSTLEK TVDGALAPA C SVILITGAGG MFGGVLRASG IGKALADSMA

351 DLG IPVLLGC FLVALALRIA QGSAT VALTT AAALMAPAVA AAGFTDWQLA

401 CIVLATAAGS VGCSHFNDSG FWLVGRLSDM DVPTTLKTWT VNQT LIAFIG

451 FALSALLFAI V*

进一步的工作揭示了一个淋球菌变体DNA序列<SEQ ID 591>：

1 ATGGACGGCC GGACACAGAC GCTGTCCGCG CAAACCTTGT TGGGCATTTC

51 GGCGGCGGCA ATCATCCTCA TTCTGATTTT AATCGTCAAA TTCCGCATCC

101 GCGCGCTGCT GACACTGGTC ATCGCCAGCC TGCTGACGGC TTTGGCAACC

151 GGTTTGCCCA CAGGCAGCAT CGTCAACGAC GTACTGGTCA AAAACTTCGG

201 CGGCACGCTC GGCGGCGTGG CGCTTCTGGT CGGTCTGGGC GCAATGCTCG

251 GACGTTTGGT AGAAACATCC GGCGGCGCAC AGTCGCTGGC GGACGCGCTG

301 ATCCGGATGT TCGGCGAAAA ACGCGCACCG TTCGCTCCGG GCGTTGCCTC

351 GCTGATTTTC GGCTTCCCGA TTTTCTTCGA TGCCGGACTA ATCGTCATGC

401 TGCCCATCGT ATTCGCCACC GCACGGCGCA TGAAACAGGA CGTACTGCCC

451 TTCGCGCTTG CCTCCGTCGG CGCATTTTCC GTCATGCACG TCTTCCTGCC

501 GCCCCATCCG GGCCCGATTG CCGCTTCCGA ATTTTACGGC GCGAACATCG

551 GCCAGGTTTT GATTTTGGGT CTGCCGACCG CCTTCATCAC ATGGTATTTC

601 AGCGGCTATA TGCTCGGCAA AGTGTTGGGG CGCGCCATCC ATGTTCCCGT

651 TCCCGAACTG CTCAGCGGCG GCACGCAAGA CAGCGACCCG CCGAAAGAAC

701 CTGCCAAAGC AGGAACGGTC GTCGCCGTCA TGCTGATTCC CATGCTGCTG

751 ATTTTCCTGA ATACCGGCGT ATCAGCCCTC ATCAGCGAAA AACTCGTAAG

801 TGCGGACGAA ACTTGGGTTC AGACGGCAAA AATGATCGGT TCGACACCTG

851 TCGCCCTTCT GATTTCCGTA TTGGCCGCAC TGTTGGTCTT GGGACGCAAA

901 CGCGGCGAAA GCGGCAGCAC GTTGGAAAAA ACCGTGGACG GCGCACTCGC

951 CCCCGCCTGT TCCGTGATTC TGATTACCGG CGCGGGCGGT ATGTTCGGCG

1001 GCGTTTTGCG CGCTTCCGGC ATCGGCAAGG CACTCGCCGA CAGCATGGCG

1051 GATTTGGGCA TTCCCGTCCT TTTGGGCTGC TTCCTTGTCG CCTTGGCACT

1101 GCGTATCGCG CAAGGTTCGG CAACCGTCGC CCTGACCACA GCCGCCGCGC

1151 TGATGGCTCC TGCCGTTGCC GCCGCCGGCT TTACCGACTG GCAGCTCGCC

1201 TGTATCGTAT TGGCAACGGC GGCAGGTTCG GTCGGTTGCA GCCACTTCAA

1251 CGACTCCGGC TTCTGGCTGG TCGGCCGCCT CTTGGATATG GACGTACCGA

1301 CCACGCTGAA AACCTGGACG GTCAACCAAA CCCTCATCGC ATTCATCGGC

1351 TTTGCCTTGT CCGCACTGCT GTTTGCCATC GTCTGA

它对应于氨基酸序列<SEQ ID 592；ORF140ng-1>：

1 MDGRTQTLSA QTLLGISAAA IILILILIVK FRIRALLTLV IASLLTALAT

51 GLPTGSIVND VLVKNFGGTL GGVALLVGLG AMLGRLVETS GGAQSLADAL

101 IRMFGEKRAP FAPGVAS LIF GFPIFFDAGL IVMLPIVFAT ARRMKQD VLP

151 FALASVGAFS VMHVFLPPHP GPIAASEFYG ANIGQVLILG LPTAFITWYF

201 SGYMLGKVLG RAIHVPVPEL LSGGTQDSDP PKEPAK AGTV VAVMLIPMLL

251 IFLNTGVSAL ISEKLVSADE TWVQTAKMIG S TPVALLISV LAALLVLGRK

301 RGESGSTLEK TVDGALAPAC SVILITGAGG MFGGVLRASG IGKALADSMA

351 DLG IPVLLGC FLVALALRIA QGSAT VALTT AAALMAPAVA AAGFTDWQLA

401 CIVLATAAGS VGCSHFNDSG FWLVGRLLDM DVPTTLKTWT VNQT LIAFIG

451 FALSALLFAI V*

ORF140ng-1和ORF140-1在461个氨基酸的重叠区内显示出有96.3％的相同性：

orf140ng-1.pep MDGRTQTLSAQTLLGISAAAIILILILIVKFRIRALLTLVIASLLTALATGLPTGSIVND

||| |||||||||||||||||||||||||||||:|||||||:||||||||||||||||||

orf140-1 MDGWTQTLSAQTLLGISAAAIILILILIVKFRIHALLTLVIVSLLTALATGLPTGSIVND

orf140ng-1.pep VLVKNFGGTLGGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFAPGVASLIF

:||||||||||||||||||||||||||||||||||||||||||||||||||| |||||||

orf140-1 ILVKNFGGTLGGVALLVGLGAMLGRLVETSGGAQSLADALIRMFGEKRAPFALGVASLIF

orf140ng-1.pep GFPIFFDAGLIVMLPIVFATARRMKQDVLPFALASVGAFSVMHVFLPPHPGPIAASEFYG

|||||||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf140-1 GFPIFFDAGLIVMLPIVFATARRMKQDVLPFALASIGAFSVMHVFLPPHPGPIAASEFYG

orf140ng-1.pep ANIGQVLILGLPTAFITWYFSGYMLGKVLGRAIHVPVPELLSGGTQDSDPPKEPAKAGTV

|||||||||||||||||||||||||||||||:|||||||||||||||:| ||||||||||

orf140-1 ANIGQVLILGLPTAFITWYFSGYMLGKVLGRTIHVPVPELLSGGTQDNDLPKEPAKAGTV

orf140ng-1.pep VAVMLIPMLLIFLNTGVSALISEKLVSADETWVQTAKMIGSTPVALLISVLAALLVLGRK

||:||||||||||||||||||||||||||||||||||:|||||:|||||||:||:|||||

orf140-1 VAIMLIPMLLIFLNTGVSALISEKLVSADETWVQTAKIIGSTPIALLISVLVALFVLGRK

orf140ng-1.pep RGESGSTLEKTVDGALAPACSVILITGAGGMFGGVLRASGIGKALADSMADLGIPVLLGC

||||||:|||||||||||:|||||||||||||||||||||||||||||||||||||||||

orf140-1 RGESGSALEKTVDGALAPVCSVILITGAGGMFGGVLRASGIGKALADSMADLGIPVLLGC

orf140ng-1.pep FLVALALRIAQGSATVALTTAAALMAPAVAAAGFTDWQLACIVLATAAGSVGCSHFNDSG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf140-1 FLVALALRIAQGSATVALTTAAALMAPAVAAAGFTDWQLACIVLATAAGSVGCSHFNDSG

orf140ng-1.pep FWLVGRLLDMDVPTTLKTWTVNQTLIAFIGFALSALLFAIV

|||||||||||||||||||||||||||:|||||||||||||

orf140-1 FWLVGRLLDMDVPTTLKTWTVNQTLIALIGFALSALLFAIV

另外，ORF140ng-1与一种大肠杆菌蛋白同源：

gi|882633(U29579)ORF_o454[大肠杆菌]＞gi|1789097(AE000358)o454；

该454个氨基酸的ORF与约456个氨基酸的蛋白的444个残基有34％的相同性(9个空隙)GNTP_BACLI SW：P46832[大肠杆菌]长度＝454

评分＝210位(529)，估计值＝1e-53

相同性＝130/384(33％)，阳性＝194/384(49％)，空隙＝19/384(4％)

询问：88 ETSGGAQSLADALIRMFGEKRAPFAPGVASLIFGFPIFFDAGLIVMLPIVFATARRMKQD 147

E SGGA+SLA+ R G+KR A +A+ G P+FFD G I++ PI++ A+ K

目标：80 EHSGGAESLANYFSRKLGDKRTIAALTLAAFFLGIPVFFDVGFIILAPIIYGFAKVAKIS 139

询问：148 VLPFALASVGAFSVMHVFLPPHPGPIAASEFYGANIGQVLILGLPTAFITWYFSGYMLGK 207

L F L G +HV +PPHPGP+AA+ A+IG + I+G+ + I GY K

目标：140 PLKFGLPVAGIMLTVHVAVPPHPGPVAAAGLLHADIGWLTIIGIAIS-IPVGVVGYFAAK 198

询问：208 VLGRAIHVPVPELL----------SGGTQDSDPPKEPAKAGTVVAVMLIPMLLIFLNTGV 257

++ + + E+L G T+ SD P A V ++++IP+ +I T

目标：199 IINKRQYAMSVEVLEQMQLAPASEEGATKLSDKINPPGVA-LVTSLIVIPIAIIMAGT-- 255

询问：258 SALISEKLVSADETWVQTAKMIGSTPXXXXXXXXXXXXXXGRKRGESGSTLEKTVDGALA 317

+S L+ + T ++IGS +RG S + AL

目标：256 ---VSATLMPPSHPLLGTLQLIGSPMVALMIALVLAFWLLALRRGWSLQHTSDIMGSALP 312

询问：318 PACSVILITGAGGMFGGVLRASGIGKALADSMADLGIPVLLGCFLVALALRIAQGSXXXX 377

A VIL+TGAGG+FG VL SG+GKALA+ + + +P+L F+++LALR +QGS

目标：313 TAAVVILVTGAGGVFGKVLVESGVGKALANMLQMIDLPLLPAAFIISLALRASQGS--AT 370

询问：378 XXXXXXXXXXXXXXXGFTDWQLACIVLATAAGSVGCSHFNDSGFWLVGRLLDMDVPTTLK 437

G Q + LA G +G SH NDSGFW+V + L + V LK

目标：371 VAILTTGGLLSEAVMGLNPIQCVLVTLAACFGGLGASHINDSGFWIVTKYLGLSVADGLK 430

询问：438 TWTVNQTLIAFIGFALSALLFAIV 461

TWTV T++ F GF ++ ++A++

目标：431 TWTVLTTILGFTGFLITWCVWAVI 454

根据该分析结果(包括鉴定出此淋球菌蛋白中存在一个推定前导序列(双划线)和几个推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例71

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 593>：

1 ..GATTTCGGCA TATCGCCCGT GTATCTTTGG GTTGCCGCCG CGTTCAAACA

51 TTTGCTGTCG CCGTGGGCTG CCGACTCATA CGATGTCGCA CGCTTTGCAG

101 GCGTATTTTT TGCCGTTATC GGACTGACTT CCTGCGGCTT TGCCGGTTTC

151 AACTTTTTGG GCAGACACCA CGGGCGCAC. GTCGTCCTGA TTCTCATCGG

201 CTGTATCGGG CTGATTCCAG TTGCCCATTT CCTCAACCCC GCTGCCGCCG

251 CCTTTGCCGC CGCCGGACTG GTGCTGCACG GTTATTCTTT GGCTCGCCGG

301 CGCGTGATTG CCGCCTCTTT TCTGCTCGGT ACGGGCTGGA CGCTGATGTC

351 GTTGGCAGCA GCTTATCCGG CAGCATTTGC CCTGATGCTG CCCTTGCCCG

401 TACTGATGTT TTTCCGTCCG ..

它对应于氨基酸序列<SEQ ID 594；ORF141>：

1 ..DFGISPVYLW VAAAFKHLLS PWAADSYDVA RFAGVFFAVI GLTSCGFAGF

51 NFLGRHHGRX VVLILIGCIG LIPVAHFLNP AAAAFAAAGL VLHGYSLARR

101 RVIAASFLLG TGWTLMSLAA AYPAAFALML PLPVLMFFRP ..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 595>：

1 ATGCTGACCT ATACCCCGCC CGATGCCCGC CCGCCCGCCA AAACCCACGA

51 AAAGCCGTGG CTGCTGCTGT TGATGGCGTT TGCCTGGTTG TGGCCCGGCG

101 TGTTTTCCCA CGATTTGTGG AATCCTGACG AACCTGCCGT CTATACCGCC

151 GTCGAAGCAC TGGCAGGCAG CCCCACCCCC TTGGTTGCCC ATCTGTTCGG

201 TCAAACCGAT TTCGGCATAC CGCCCGTGTA TCTTTGGGTT GCCGCCGCGT

251 TCAAACATTT GCTGTCGCCG TGGGCTGCCG ACTCATACGA TGCCGCACGC

301 TTTGCAGGCG TATTTTTTGC CGTTATCGGA CTGACTTCCT GCGGCTTTGC

351 CGGTTTCAAC TTTTTGGGCA GACACCACGG GCGCAgCGTC GTCCTGATTC

401 TCATCGGCTG TATCGGGCTG ATTCCAGTTG CCCATTTCCT CAACCCCGCT

451 GCCGCCGCCT TTGCCGCCGC CGGACTGGTG CTGCACGGTT ATTCTTTGGC

501 TCGCCGGCGC GTGATTGCCG CCTCTTTTCT GCTCGGTACG GGCTGGACGC

551 TGATGTCGTT GGCAGCAGCT TATCCGGCAG CATTTGCCCT GATGCTGCCC

601 TTGCCCGTAC TGATGTTTTT CCGTCCGTGG CAAAGCAGGC GTTTGATGTT

651 GACGGCAGTC GCCTCACTTG CCTTTGCCCT GCCGCTTATG ACCGTTTACC

701 CGCTGCTCTT GGCAAAAACG CAGCCCGCGC TGTTCGCGCA ATGGCTCGAC

751 TATCACGTTT TCGGTACGTT CGGCGGCGTG CGGCACGTTC AGACGGCATT

801 CAGTTTGTTT TACTATCTGA AAAACCTGCT TTGGTTTGCA TTGCCCGCGC

851 TGCCGCTGGC GGTTTGGACG GTTTGCCGCA CGCGCCTGTT TTCGACCGAC

901 TGGGGGATTT TGGGCGTCGT CTGGATGCTT GCCGTTTTGG TGCTGCTTGC

951 CGTCAATCCG CAGCGTTTTC AGGATAACCT CGTCTGGCTG CTTCCGCCGC

1001 TTGCCCTGTT CGGCGCGGCG CAACTGGACA GCCTGAGGCG CGGCGCGGCG

1051 GCGTTTGTCA ACTGGTTCGG CATTATGGCG TTCGGACTGT TTGCCGTGTT

1101 CCTGTGGACG GGCTTTTTCG CCATGAATTA CGGCTGGCCC GCCAAGCTTG

1151 CCGAACGCGC CGCCTATTTC AGCCCGTATT ATGTTCCTGA TATCGATCCC

1201 ATTCCGATGG CGGTTGCCGT ACTGTTCACA CCCTTGTGGC TGTGGGCGAT

1251 TACCCGGAAA AACATACGCG GCAGGCAGGC GGTTACCAAC TGGGCGGCAG

1301 GCGTTACCCT GACCTGGGCT TTGCTGATGA CGCTGTTCCT GCCGTGGCTG

1351 GACGCGGCGA AAAGCCACGC GCCGGTCGTC CGGAGTATGG AGGCATCGCT

1401 TTCCCCGGAA TTGAAACGGG AGCTTTCAGA CGGCATCGAG TGTATCGGCA

1451 TAGGCGGCGG CGACCTGCAC ACGCGGATTG TTTGGACGCA GTACGGCACA

1501 TTGCCGCACC GCGTCGGCGA TGTACAATGC CGCTACCGCA TCGTCCTCCT

1551 GCCCCAAAAT GCGGATGCGC CGCAAGGCTG GCAGACGGTT TGGCAGGGTG

1601 CGCGTCCGCG CAACAAAGAC AGTAAGTTCG CACTGATACG GAAAATCGGG

1651 GAAAATATAT AA

它对应于氨基酸序列<SEQ ID 596；ORF141-1>：

1 MLTYTPPDAR PPAKTHEKPW LLLLMAFAWL WPGVFSHDLW NPDEPAVYTA

51 VEALAGSPTP LVAHLFGQTD FGIPPVYLWV AAAFKHLLSP WAADSYDAAR

101 FAGVFFAVIG LTSCGFAGFN FLGRHHGRS V VLILIGCIGL IPVAHFLNPA

151 AAAFAAAGLV LHGYSLARRR VIAASFLLGT GWTLMSLAAA YPAAFALMLP

201 LPVLMFFRPW QSRRL MLTAV ASLAFALPLM TVYPLLLAKT QPALFAQWLD

251 YHVFGTFGGV RHVQTAFSLF YYLKNLLWFA LPALPLAVWT VCRTRLFSTD

301 W GILGVVWML AVLVLLAVNP QRFQDNLVWL LPPLALFGAA QLDSLRRGAA

351 AFVNWFGIMA FGLFAVFLWT GFFAMNYGWP AKLAERAAYF SPYYVPDIDP

401 IPMAVAVLFT PLWLWAITRK NIRGRQAVTN WAAGVTLTWA LLMTLFLPWL

451 DAAKSHAPVV RSMEASLSPE LKRELSDGIE CIGIGGGDLH TRIVWTQYGT

501 LPHRVGDVQC RYRIVLLPQN ADAPQGWQTV WQGARPRNKD SKFALIRKIG

551 ENI*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF141和脑膜炎奈瑟球菌菌株A的ORF(ORF141a)在140个氨基酸的重叠区内显示出有95.0％的相同性：

10 20 30

orf141.pep DFGISPVYLWVAAAFKHLLSPWAADSYDVA

|||| |||||||||||||||||||| ||:|

orf141a WNPDEPAVYTAVEALAGSPTPLVAHLFGQIDFGIPPVYLWVAAAFKHLLSPWAADPYDAA

40 50 60 70 80 90

orf141.pep R FAGVFFAVIGLTSCGFAGFNFLGRHHGRX VVLILIGCIGLIPVAHFLNPAAAAFAAAGL

| ||||||||:||||||||| |||||||||| |||||||||||||::|||||||||||||||

orf141a R FAGVFFAVVGLTSCGFAGFNFLGRHHGRS VVLILIGCIGLIPTVHFLNPAAAAFAAAGL

100 110 120 130 140 150

100 110 120 130 140

orf141.pep VLHGYSLARRR VIAASFLLGTGWTLMSLAAA YPAAFALMLPLPVLMFFRP

||||||||||||||||||||||||||||||||||||||||||||||||||

orf141a VLHGYSLARRR VIAASFLLGTGWFLMSLAAA YPAAFALMLPLPVLMFFRPWQSRRL MLTA

160 170 180 190 200 210

orf141a VASLAFALPLMTVYPLLLAKTQPALFAQWLDDHVFGTFGGVRHIQTAFSLFYYLKNLLWF

220 230 240 250 260 270

全长ORF141a核苷酸序列<SEQ ID 597>是：

1 ATGCTGACCT ATACCCCGCC CGATGCCCGC CCGCCCGCCA AAACCCACGA

51 AAAGCCGTGG CTGTTGCTGT TGATGGCGTT TGCCTGGTTG TGGCCCGGCG

101 TGTTTTCCCA CGATTTGTGG AATCCTGACG AACCTGCCGT CTATACCGCC

151 GTCGAAGCAC TGGCAGGCAG CCCCACCCCT TTGGTTGCCC ATCTGTTCGG

201 TCAAATCGAT TTCGGCATAC CGCCCGTGTA TCTTTGGGTT GCCGCCGCGT

251 TCAAACATTT GCTGTCGCCG TGGGCTGCCG ACCCGTATGA TGCCGCACGC

301 TTTGCCGGCG TGTTTTTCGC CGTTGTCGGA CTGACTTCCT GCGGCTTTGC

351 CGGTTTCAAC TTTTTGGGCA GACACCACGG GCGCAGCGTC GTCCTGATTC

401 TCATCGGCTG TATCGGGCTG ATTCCGACCG TACACTTTCT CAACCCCGCT

451 GCCGCCGCCT TTGCCGCCGC CGGACTGGTG CTGCACGGTT ATTCTTTGGC

501 TCGCCGGCGC GTGATTGCCG CCTCTTTTCT GCTCGGTACG GGTTGGACGC

551 TGATGTCGTT GGCAGCAGCT TATCCGGCGG CATTTGCCCT GATGCTGCCC

601 CTGCCCGTGC TGATGTTTTT CCGTCCGTGG CAAAGCAGGC GTTTGATGTT

651 GACGGCAGTC GCCTCGCTTG CCTTTGCCCT GCCGCTTATG ACCGTTTACC

701 CGCTGCTCTT GGCAAAAACG CAGCCCGCGC TGTTCGCGCA ATGGCTCGAC

751 GATCACGTTT TCGGTACGTT CGGCGGCGTG CGGCACATTC AGACGGCATT

801 CAGTTTGTTT TACTATCTGA AAAACCTGCT TTGGTTTGCA TTGCCTGCGC

851 TGCCGCTGGC GGTTTGGACG GTTTGCCGCA CGCGCCTGTT TTCGACCGAC

901 TGGGGGATTT TGGGCGTCGT CTGGATGCTT GCCGTTTTGG TGCTGCTTGC

951 CGTCAATCCG CAGCGTTTTC AGGATAACCT CGTCTGGCTG CTTCCGCCGC

1001 TTGCCCTGTT CGGCGCGGCG CAACTGGACA GCCTGAGACG CGGCGCGGCG

1051 GCGTTTGTCA ACTGGTTCGG CATTATGGCG TTCGGACTGT TTGCCGTGTT

1101 CCTGTGGACG GGCTTTTTCG CCATGAATTA CGGCTGGCCC GCCAAGCTTG

1151 CCGAACGCGC CGCCTATTTC AGCCCGTATT ATGTTCCTGA TATCGATCCC

1201 ATTCCGATGG CGGTTGCCGT ACTGTTCACA CCCTTGTGGC TGTGGGCGAT

1251 TACCCGCAAA AACATACGCG GCAGGCAGGC GGTTACCAAC TGGGCGGCAG

1301 GCGTTACCCT GACCTGGGCT TTGCTGATGA CGCTGTTCCT GCCGTGGCTG

1351 GACGCGGCGA AAAGCCACGC GCCCGTCGTC CGGAGTATGG AGGCATCGCT

1401 TTCCCCGGAA TTAAAACGGG AGCTTTCAGA CGGCATCGAG TGTATCGACA

1451 TAGGCGGCGG CGACCTACAC ACGCGGATTG TTTGGACGCA GTACGGCACA

1501 TTGCCGCACC GCGTCGGCGA TGTACAATGC CGCTACCGCA TCGTCCGCTT

1551 GCCCCAAAAC GCGGATGCGC CGCAAGGCTG GCAGACGGTC TGGCAGGGTG

1601 CGCGCCCGCG CAACAAAGAC AGTAAGTTCG CACTGATACG GAAAACCGGG

1651 GAAAATATAT TAAAAACAAC AGATTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 598>：

1 MLTYTPPDAR PPAKTHEKPW LLLLMAFAWL WPGVFSHDLW NPDEPAVYTA

51 VEALAGSPTP LVAHLFGQID FGIPPVYLWV AAAFKHLLSP WAADPYDAAR

101 FAGVFFAVVG LTSCGFAGFN FLGRHHGRS V VLILIGCIGL IPTVHFLNPA

151 AAAFAAAGLV LHGYSLARRR VIAASFLLGT GWTLMSLAAA YPAAFALMLP

201 LPVLMFFRPW QSRRL MLTAV ASLAFALPLM TVYPLLLAKT QPALFAQWLD

251 DHVFGTFGGV RHIQTAFSLF YYLKNLLWFA LPALPLAVWT VCRTRLFSTD

301 W GILGVVWML AVLVLLAVNP QRFQDNLVWL LPPLALFGAA QLDSLRRGAA

351 AFVNWFGIMA FGLFAVFLWT GFFAMNYGWP AKLAERAAYF SPYYVPDIDP

401 IPMAVAVLFT PLWLWAITRK NIRGRQAVTN WAAGVTLTWA LLMTLFLPWL

451 DAAKSHAPVV RSMEASLSPE LKRELSDGIE CIDIGGGDLH TRIVWTQYGT

501 LPHRVGDVQC RYRIVRLPQN ADAPQGWQTV WQGARPRNKD SKFALIRKTG

551 ENILKTTD*

ORF141a和ORF141-1在553个氨基酸的重叠区内显示出有98.2％的相同性：

orf141a.pep MLTYTPPDARPPAKTHEKPWLLLLMAFAWLWPGVFSHDLWNPDEPAVYTAVEALAGSPTP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 MLTYTPPDARPPAKTHEKPWLLLLMAFAWLWPGVFSHDLWNPDEPAVYTAVEALAGSPTP

orf141a.pep LVAHLFGQIDFGIPPVYLWVAAAFKHLLSPWAADPYDAARFAGVFFAVVGLTSCGFAGFN

|||||||| ||||||||||||||||||||||||| |||||||||||||:|||||||||||

orf141-1 LVAHLFGQTDFGIPPVYLWVAAAFKHLLSPWAADSYDAARFAGVFFAVIGLTSCGFAGFN

orf141a.pep FLGRHHGRSVVLILIGCIGLIPTVHFLNPAAAAFAAAGLVLHGYSLARRRVIAASFLLGT

||||||||||||||||||||||::||||||||||||||||||||||||||||||||||||

orf141-1 FLGRHHGRSVVLILIGCIGLIPVAHFLNPAAAAFAAAGLVLHGYSLARRRVIAASFLLGT

orf141a.pep GWTLMSLAAAYPAAFALMLPLPVLMFFRPWQSRRLMLTAVASLAFALPLMTVYPLLLAKT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 GWTLMSLAAAYPAAFALMLPLPVLMFFRPWQSRRLMLTAVASLAFALPLMTVYPLLLAKT

orf141a.pep QPALFAQWLDDHVFGTFGGVRHIQTAFSLFYYLKNLLWFALPALPLAVWTVCRTRLFSTD

|||||||||| |||||||||||:|||||||||||||||||||||||||||||||||||||

orf141-1 QPALFAQWLDYHVFGTFGGVRHVQTAFSLFYYLKNLLWFALPALPLAVWTVCRTRLFSTD

orf141a.pep WGILGVVWMLAVLVLLAVNPQRFQDNLVWLLPPLALFGAAQLDSLRRGAAAFVNWFGIMA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 WGILGVVWMLAVLVLLAVNPQRFQDNLVWLLPPLALFGAAQLDSLRRGAAAFVNWFGIMA

orf141a.pep FGLFAVFLWTGFFAMNYGWPAKLAERAAYFSPYYVPDIDPIPMAVAVLFTPLWLWAITRK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 FGLFAVFLWTGFFAMNYGWPAKLAERAAYFSPYYVPDIDPIPMAVAVLFTPLWLWAITRK

orf141a.pep NIRGRQAVTNWAAGVTLTWALLMTLFLPWLDAAKSHAPVVRSMEASLSPELKRELSDGIE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 NIRGRQAVTNWAAGVTLTWALLMTLFLPWLDAAKSHAPVVRSMEASLSPELKRELSDGIE

orf141a.pep CIDIGGGDLHTRIVWTQYGTLPHRVGDVQCRYRIVRLPQNADAPQGWQTVWQGARPRNKD

|| |||||||||||||||||||||||||||||||| ||||||||||||||||||||||||

orf141-1 CIGIGGGDLHTRIVWTQYGTLPHRVGDVQCRYRIVLLPQNADAPQGWQTVWQGARPRNKD

orf141a.pep SKFALIRKTGENI

|||||||| ||||

orf141-1 SKFALIRKIGENI

与淋病奈瑟球菌的预计ORF的同源性

ORF141和淋病奈瑟球菌的预计ORF(ORF141ng)在140个氨基酸的重叠区内显示出有95％的相同性：

orf141.pep DFGISPVYLWVAAAFKHLLSPWAADSYDVA 30

|||| ||||||||||||||||||| ||:|

orf141ng WNPAEPAVYTAVEALAGSPTPLVAHLFGQTDFGIPPVYLWVAAAFKHLLSPWAAHPYDAA 126

orf141.pep RFAGVFFAVIGLTSCGFAGFNFLGRHHGRXVVLILIGCIGLIPVAHFLNPAAAAFAAAGL 90

||||||||||||||||||||||||||||| |||| ||||||||||||:||||||||||||

orf141ng RFAGVFFAVIGLTSCGFAGFNFLGRHHGRSVVLIHIGCIGLIPVAHFFNPAAAAFAAAGL 186

orf141.pep VLHGYSLARRRVIAASFLLGTGWTLMSLAAAYPAAFALMLPLPVLMFFRP 140

||||||||||||||||||||||||||||||||||||||||||||||||||

orf141ng VLHGYSLARRRVIAASFLLGTGWTLMSLAAAYPAAFALMLPLPVLMFFRPWQSRRLMLTA 246

预计ORF141ng核苷酸序列<SEQ ID 599>编码的蛋白质具有氨基酸序列<SEQ ID600>：

1 MPSEAVSARP LCEYLLHLAI RPFLLTLMLT YTPPDARPPA KTHEKP WLLL

51 LMAFAWLWPG VFSHDLWNPA EPAVYTAVEA LAGSPTPLVA HLFGQTDFGI

101 PPVYLWVAAA FKHLLSPWAA HPYDAAR FAG VFFAVIGLTS CGFAGFNFLG

151 RHHGRS VVLI HIGCIGLIPV AHFFNPAAAA FAAAGLVLHG YSLARRR VIA

201 ASFLLGTGWT LMSLAAA YPA AFALMLPLPV LMFFRPWQSR RL MLTAVASL

251 AFALPLMTVY PLLLAKTQPA LFAQWLNYHV FGTFGGVRHI QRAFSLFHYL

301 KNLLWFAPPG LPLAVWTVCR TRLFSTDW GI LGIVWMLAVL VLLAFNPQRF

351 QDNLVWLLPP LALFGAAQLD SLRRGAAAFV NWFG IMAFGL FAVFLWTGFF

401 AMNYGWPAKL AERAAYFSPY YVPDIDP IPM AVAVLFTPLW LWAITRKNIR

451 GRQAVTN WAA GVTLTWALLM TLFLPWLDAA KSHAPVVRSM EASFSPELKR

501 ELSDGIECIG IGGGDLHTRI VWTQYGTLPH RVGDVRCRYR IVRLPQNADA

551 PQGWQTVWQG ARPRNKDSKF ALIRKIGENI LKTTD*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 601>：

1 ATGCTGACCT ATACCCCGCC CGATGCCCGC CCGCCCGCCA AAACCCACGA

51 AAAACCGTGG CTGCTGCTGT TGATGGCGTT TGCCTGGCTG TGGCCCGGCG

101 TGTTTTCCCA CGATTTGTGG AATCCTGCCG AACCTGCCGT CTATACCGCC

151 GTCGAAGCAC TGGCAGGCAG CCCCACCCCC TTGGTTGCCC ATCTGTTCGG

201 TCAAACCGAT TTCGGCATAC CGCCCGTGTA TCTTTGGGTT GCCGCCGCAT

251 TCAAACATTT GCTGTCGCCG TGGGCAGCCG ACCCGTATGA TGCCGCACGC

301 TTTGCAGGCG TATTTTTTGC CGTTATCGGA CTGACTTCTT GCGGCTTTGC

351 CGGTTTCAAC TTTTTGGGCA GACACCACGG GCGCAGCGTT GTTTTAATCC

401 ATATCGGCTG TATCGGGCTG ATTCCGGTTG CCCATTTCCT CAATCCcgcc

451 gccgccgcct tTGCCGCCGC CGGACTGGTG CTGCacggct actcgctgGC

501 ACGCCGGCGC GTGATtgccg cctctTtccT GCTCGGTACG GGTTGGACGT

551 TGATGTCGCT GGCGGCAGCT TATCCGGCGG CGTTTGCGCT GATGCTGCCC

601 CTGCCCGTGC TGATGTTTTT CCGTCCGTGG CAAAGCAGGC GTTTGATGTT

651 GACGGCAGTC GCCTCGCTTG CCTTTGCCCT GCCGCTTATG ACCGTTTACC

701 CGCTGCTCtt gGCAAAAACG CAGCCCGCGC TGTTTGCGCA ATGGCTCAAC

751 TATCACGTTT TCGGTACGTt cggcgGCGTG CGGCAcaTTC AGAggGCatT

801 Cagtttgttt cactatctgA AAaatctgct ttggttcgca ccgcccgggC

851 TGCCGCTGGC GGTTTGGACG GTTTGCCGCA CACGCCTGTT TTCGACCGAC

901 TGGGGGATTT TGGGCATTGT CTGGATGCTT GCCGTTTTGG TGCTGCTCGC

951 CTTTAATCCG CAGCGTTTTC AAGACAACCT CGTCTGGCTG CTGCCGCCGC

1001 TTGCCCTGTT CGGCGCGGCG CAACTGGACA GCCTGAGGCG CGGCGCGGCG

1051 GCTTTTGTCA ACTGGTTCGG CATTATGGCG TTCGGGCTGT TTGCCGTGTT

1101 CCTGTGGACG GGCTTTTTCG CCATGAATTA CGGCTGGCCC GCCAAGCTTG

1151 CCGAACGCGC CGCCTACTTC AGCCCGTATT ACGTTCCCGA CATCGATCCC

1201 ATTCCGATGG CGGTTGCCGT ACTGTTCACA CCCTTGTGGC TGTGGGCGAT

1251 TACCCGGAAA AACATACGCG GCAGGCAGGC GGTTACCAAC TGGGCGGCAG

1301 GCGTTACCCT GACCTGGGCT TTGCTGATGA CGCTGTTCCT GCCGTGGCTG

1351 GACGCGGCGA AAAGCCACGC GCCCGTCGTC CGGAGTATGG AGGCATCGTT

1401 TTCCCCGGAA TTAAAACGGG AGCTTTCAGA CGGCATCGAG TGTATCGGCA

1451 TAGGCGGCGG CGACCTGCAC ACGCGGATTG TTTGGACGCA GTACGGCACA

1501 TTGCCGCACC GCGTCGGCGA TGTCCGTTGC CGCTACCGTA TCGTCCGCCT

1551 GCCCCAAAAC GCGGATGCGC CGCAAGGCTG GCAGACGGTC TGGCAGGGTG

1601 CGCGCCCGCG CAACAAAGAC AGTAAGTTTG CACTGATACG GAAAATCGGG

1651 GAAAATATAT TAAAAACAAC AGATTGA

它对应于氨基酸序列<SEQ ID 602；ORF141ng-1>：

1 MLTYTPPDAR PPAKTHEKPW LLLLMAFAWL WPGVFSHDLW NPAEPAVYTA

51 VEALAGSPTP LVAHLFGQTD FGIPPVYLWV AAAFKHLLSP WAADPYDAAR

101 FAGVFFAVIG LTSCGFAGFN FLGRHHGRS V VLIHIGCIGL IPVAHFLNPA

151 AAAFAAAGLV LHGYSLARRR VIAASFLLGT GWTLMSLAAA YPAAFALMLP

201 LPVLMFFRPW QSRRL MLTAV ASLAFALPLM TVYPLLLAKT QPALFAQWLN

251 YHVFGTFGGV RHIQRAFSLF HYLKNLLWFA PPGLPLAVWT VCRTRLFSTD

301 W GILGIVWML AVLVLLAFNP QRFQDNLVWL LPPLALFGAA QLDSLRRGAA

351 AFVNWFG IMA FGLFAVFLWT GFFAMNYGWP AKLAERAAYF SPYYVPDIDP

401 IPMAVAVLFT PLWLWAITRK NIRGRQAVTN WAAGVTLTWA LLMTLFLPWL

451 DAAKSHAPVV RSMEASFSPE LKRELSDGIE CIGIGGGDLH TRIVWTQYGT

501 LPHRVGDVRC RYRIVRLPQN ADAPQGWQTV WQGARPRNKD SKFALIRKIG

551 ENILKTTD*

ORF141ng-1和ORF141-1在553个氨基酸的重叠区内显示出有97.5％的相同性有：

orf141ng-1.pep MLTYTPPDARPPAKTHEKPWLLLLMAFAWLWPGVFSHDLWNPAEPAVYTAVEALAGSPTP

|||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf141-1 MLTYTPPDARPPAKTHEKPWLLLLMAFAWLWPGVFSHDLWNPDEPAVYTAVEALAGSPTP

orf141ng-1.pep LVAHLFGQTDFGIPPVYLWVAAAFKHLLSPWAADPYDAARFAGVFFAVIGLTSCGFAGFN

|||||||||||||||||||||||||||||||||| |||||||||||||||||||||||||

orf141-1 LVAHLFGQTDFGIPPVYLWVAAAFKHLLSPWAADSYDAARFAGVFFAVIGLTSCGFAGFN

orf141ng-1.pep FLGRHHGRSVVLIHIGCIGLIPVAHFLNPAAAAFAAAGLVLHGYSLARRRVIAASFLLGT

||||||||||||| ||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 FLGRHHGRSVVLILIGCIGLIPVAHFLNPAAAAFAAAGLVLHGYSLARRRVIAASFLLGT

orf141ng-1.pep GWTLMSLAAAYPAAFALMLPLPVLMFFRPWQSRRLMLTAVASLAFALPLMTVYPLLLAKT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 GWTLMSLAAAYPAAFALMLPLPVLMFFRPWQSRRLMLTAVASLAFALPLMTVYPLLLAKT

orf141ng-1.pep QPALFAQWLNYHVFGTFGGVRHIQRAFSLFHYLKNLLWFAPPGLPLAVWTVCRTRLFSTD

|||||||||:||||||||||||:| |||||:||||||||| |:|||||||||||||||||

orf141-1 QPALFAQWLDYHVFGTFGGVRHVQTAFSLFYYLKNLLWFALPALPLAVWTVCRTRLFSTD

orf141ng-1.pep WGILGIVWMLAVLVLLAFNPQRFQDNLVWLLPPLALFGAAQLDSLRRGAAAFVNWFGIMA

|||||:||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf141-1 WGILGVVWMLAVLVLLAVNPQRFQDNLVWLLPPLALFGAAQLDSLRRGAAAFVNWFGIMA

orf141ng-1.pep FGLFAVFLWTGFFAMNYGWPAKLAERAAYFSPYYVPDIDPIPMAVAVLFTPLWLWAITRK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf141-1 FGLFAVFLWTGFFAMNYGWPAKLAERAAYFSPYYVPDIDPIPMAVAVLFTPLWLWAITRK

orf141ng-1.pep NIRGRQAVTNWAAGVTLTWALLMTLFLPWLDAAKSHAPVVRSMEASFSPELKRELSDGIE

||||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||

orf141-1 NIRGRQAVTNWAAGVTLTWALLMTLFLPWLDAAKSHAPVVRSMEASLSPELKRELSDGIE

orf141ng-1.pep CIGIGGGDLHTRIVWTQYGTLPHRVGDVRCRYRIVRLPQNADAPQGWQTVWQGARPRNKD

||||||||||||||||||||||||||||:|||||| ||||||||||||||||||||||||

orf141-1 CIGIGGGDLHTRIVWTQYGTLPHRVGDVQCRYRIVLLPQNADAPQGWQTVWQGARPRNKD

orf141ng-1.pep SKFALIRKIGENILKTTDX

|||||||||||||

orf141-1 SKFALIRKIGENIX

根据淋球菌中存在几个推定跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例72

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 603>：

1 ..CAATCCGCCA AATGGTTATC GGGCCAAACT CTAGTCGGCA CAGCAATTGG

51 GATACGCGGG CAGATAAAGC TTGGCGGCAA CCTGCATTAC GATATATTTA

101 CCGGCCGCGC ATTGAAAAAG CCCGAATTTT TCCAATCAAG GAAATGGGCA

151 AGCGGTTTTC AGGTAGGCTA TACGTTTTAA

它对应于氨基酸序列<SEQ ID 604；ORF142>：

1 ..QSAKWLSGQT LVGTAIGIRG QIKLGGNLHY DIFTGRALKK PEFFQSRKWA

51 SGFQVGYTF*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 605>：

1 ATGGATAATT CGGGTAGTGA GGCGACAGGA AAATACCAAG GAAATATCAC

51 TTTCTCTGCC GACAATCCTT TGGGACTGAG TGATATGTTC TATGTAAATT

101 ATGGACGTTC GATTGGCGGT ACGCCCGATG AGGAAAGTTT TGACGGCCAT

151 CGCAAAGAAG GCGGATCAAA CAATTACGCC GTACATTATT CAGCCCCTTT

201 CGGTAAATGG ACATGGGCAT TCAATCACAA TGGCTACCGT TACCATCAGG

251 CAGTTTCCGG ATTATCGGAA GTCTATGACT ATAATGGAAA AAGTTACAAT

301 ACTGATTTCG GCTTCAACCG CCTGTTGTAT CGTGATGCCA AACGCAAAAC

351 CTATCTCGGT GTAAAACTGT GGATGAGGGA AACAAAAAGT TACATTGATG

401 ATGCCGAACT GACTGTACAA CGGCGTAAAA CTGCGGGTTG GTTGGCAGAA

451 CTTTCCCACA AAGAATATAT CGGTCGCAGT ACGGCAGATT TTAAGTTGAA

501 ATATAAACGC GGCACCGGCA TGAAAGATGC TCTGCGCGCG CCTGAAGAAG

551 CCTTTGGCGA AGGCACGTCA CGTATGAAAA TTTGGACGGC ATCGGCTGAT

601 GTAAATACTC CTTTTCAAAT CGGTAAACAG CTATTTGCCT ATGACACATC

651 CGTTCATGCA CAATGGAACA AAACCCCGCT AACATCGCAA GACAAACTGG

701 CTATCGGCGG ACACCACACC GTACGTGGCT TCGACGGTGA AATGAGTTTG

751 TCTGCCGAGC GGGGATGGTA TTGGCGCAAC GATTTGAGCT GGCAATTTAA

801 ACCAGGCCAT CAGCTTTATC TTGGGGCTGA TGTAGGACAT GTTTCAGGAC

851 AATCCGCCAA ATGGTTATCG GGCCAAACTC TAGTCGGCAC AGCAATTGGG

901 ATACGCGGGC AGATAAAGCT TGGCGGCAAC CTGCATTACG ATATATTTAC

951 CGGCCGCGCA TTGAAAAAGC CCGAATTTTT CCAATCAAGG AAATGGGCAA

1001 GCGGTTTTCA GGTAGGCTAT ACGTTTTAA

它对应于氨基酸序列<SEQ ID 606；ORF142-1>：

1 MDNSGSEATG KYQGNITFSA DNPLGLSDMF YVNYGRSIGG TPDEESFDGH

51 RKEGGSNNYA VHYSAPFGKW TWAFNHNGYR YHQAVSGLSE VYDYNGKSYN

101 TDFGFNRLLY RDAKRKTYLG VKLWMRETKS YIDDAELTVQ RRKTAGWLAE

151 LSHKEYIGRS TADFKLKYKR GTGMKDALRA PEEAFGEGTS RMKIWTASAD

201 VNTPFQIGKQ LFAYDTSVHA QWNKTPLTSQ DKLAIGGHHT VRGFDGEMSL

251 SAERGWYWRN DLSWQFKPGH QLYLGADVGH VSGQSAKWLS GQTLVGTAIG

301 IRGQIKLGGN LHYDIFTGRA LKKPEFFQSR KWASGFQVG Y TF*

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的预计ORF的同源性

ORF142和淋病奈瑟球菌的预计ORF(ORF142ng)在59个氨基酸的重叠区内显示出有88.1％的相同性。

orf142.pep QSAKWLSGQTLVGTAIGIRGQIKLGGNLHY 30

|||||||||||:||||||||||||||||||

orf142ng RGWYWRNDLSWQFKPGHQLYLGADVGHVSGQSAKWLSGQTLAGTAIGIRGQIKLGGNLHY 313

orf142.pep DIFTGRALKKPEFFQSRKWASGFQVGYTF 59

||||||||||||:||::||::||||||:|

orf142ng DIFTGRALKKPEYFQTKKWVTGFQVGYSF 342

全长ORF142ng核苷酸序列<SEQ ID 607>是：

1 ATGGATAATT CGGGTAGTGA GGCGACAGGA AAATACCAAG GAAATATCAC

51 TTTCTCTGCC GACAATCCTT TTGGACTGAG TGATATGTTC TATGTAAATT

101 ATGGACGTTC AATTGGCGGT ACGCCCGATG AGGAAAATTT TGACGGCCAT

151 CGCAAAGAAG GCGGATCAAA CAATTACGCC GTACATTATT CAGCCCCTTT

201 CGGTAAATGG ACATGGGCAT TCAATCACAA TGGCTACCGT TACCATCAGG

251 CGGTTTCCGG ATTATCGGAA GTCTATGACT ATAATGGAAA AAGTTACAAC

301 ACTGATTTCG GCTTCAACCG CCTGTTGTAT CGTGATGCCA AACGCAAAAC

351 CTATCTCAGT GTAAAACTGT GGACGAGGGA AACAAAAAGT TACATTGATG

401 ATGCCGAACT GACTGTACAA CGGCGTAAAA CCACAGGTTG GTTGGCAGAA

451 CTTTCCCACA AAGGATATAT CGGTCGCAGT ACGGCAGATT TTAAGTTGAA

501 ATATAAACAC GGCACCGGCA TGAAAGATGC TCTGCGCGCG CCTGAAGAAG

551 CCTTTGGCGA AGGCACGTCA CGTATGAAAA TTTGGACGGC ATCGGCTGAT

601 GTAAATACTC CTTTTCAAAT CGGTAAACAG CTATTTGCCT ATGACACATC

651 CGTTCATGCA CAATGGAACA AAACCCCGCT AACATCGCAA GACAAACTGG

701 CTATCGGCGG ACACCACACC GTACGTGGCT TCGACGGTGA AATGAGTTTG

751 CCTGCCGAGC GGGGATGGTA TTGGCGCAAC GATTTGAGCT GGCAATTTAA

801 ACCAGGCCAT CAGCTTTATC TTGGGGCTGA TGTAGGACAT GTTTCAGGAC

851 AATCCGCCAA ATGGTTATCG GGCCAAACTC TAGCCGGCAC AGCAATTGGG

901 ATACGCGGGC AGATAAAGCT TGGCGGCAAC CTGCATTACG ATATATTTAC

951 CGGCCGTGCA TTGAAAAAGC CCGAATATTT TCAGACGAAG AAATGGGTAA

1001 CGGGGTTTCA GGTGGGTTAT TCGTTTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 608>：

1 MDNSGSEATG KYQGNITFSA DNPFGLSDMF YVNYGRSIGG TPDEENFDGH

51 RKEGGSNNYA VHYSAPFGKW TWAFNHNGYR YHQAVSGLSE VYDYNGKSYN

101 TDFGFNRLLY RDAKRKTYLS VKLWTRETKS YIDDAELTVQ RRKTTGWLAE

151 LSHKGYIGRS TADFKLKYKH GTGMKDALRA PEEAFGEGTS RMKIWTASAD

201 VNTPFQIGKQ LFAYDTSVHA QWNKTPLTSQ DKLAIGGHHT VRGFDGEMSL

251 PAERGWYWRN DLSWQFKPGH QLYLGADVGH VSGQSAKWLS GQTLAGTAIG

301 IRGQIKLGGN LHYDIFTGRA LKKPEYFQTK KWVTGFQVG Y SF*

通常发现有下划线的序列(芳族-Xaa-芳族氨基酸基序)在外膜蛋白的C端。

ORF142ng和ORF142-1在342个氨基酸的重叠区内显示出有95.6％的相同性：

orf142-1.pep MDNSGSEATGKYQGNITFSADNPLGLSDMFYVNYGRSIGGTPDEESFDGHRKEGGSNNYA

|||||||||||||||||||||||:|||||||||||||||||||||:||||||||||||||

orf142ng-1 MDNSGSEATGKYQGNITFSADNPFGLSDMFYVNYGRSIGGTPDEENFDGHRKEGGSNNYA

orf142-1.pep VHYSAPFGKWTWAFNHNGYRYHQAVSGLSEVYDYNGKSYNTDFGFNRLLYRDAKRKTYLG

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:

orf142ng-1 VHYSAPFGKWTWAFNHNGYRYHQAVSGLSEVYDYNGKSYNTDFGFNRLLYRDAKRKTYLS

orf142-1.pep VKLWMRETKSYIDDAELTVQRRKTAGWLAELSHKEYIGRSTADFKLKYKRGTGMKDALRA

|||| |||||||||||||||||||:||||||||| ||||||||||||||:||||||||||

orf142ng-1 VKLWTRETKSYIDDAELTVQRRKTTGWLAELSHKGYIGRSTADFKLKYKHGTGMKDALRA

orf142-1.pep PEEAFGEGTSRMKIWTASADVNTPFQIGKQLFAYDTSVHAQWNKTPLTSQDKLAIGGHHT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf142ng-1 PEEAFGEGTSRMKIWTASADVNTPFQIGKQLFAYDTSVHAQWNKTPLTSQDKLAIGGHHT

orf142-1.pep VRGFDGEMSLSAERGWYWRNDLSWQFKPGHQLYLGADVGHVSGQSAKWLSGQTLVGTAIG

|||||||||| |||||||||||||||||||||||||||||||||||||||||||:|||||

orf142ng-1 VRGFDGEMSLPAERGWYWRNDLSWQFKPGHQLYLGADVGHVSGQSAKWLSGQTLAGTAIG

orf142-1.pep IRGQIKLGGNLHYDIFTGRALKKPEFFQSRKWASGFQVGYTF

|||||||||||||||||||||||||:||::||::||||||:|

orf142ng-1 IRGQIKLGGNLHYDIFTGRALKKPEYFQTKKWVTGFQVGYSF

另外，ORF142ng与菊欧文氏菌的HecB蛋白同源：

gi|1772622(L39897)HecB[菊欧文氏菌]长度＝558

评分＝119位(295)，估计值＝3e-26

相同性＝88/346(25％)，阳性＝151/346(43％)，空隙＝22/346(6％)

询问：2 DNSGSEATGKYQGNITFSADNPFGLSDMFYVNYGRSIGGTPDEENFDGHRKEGGSNNYAV 61

DNSG ++TG+ Q N + + DN FGL+D ++++ G S + +D + G

目标：230 DNSGQKSTGEEQLNGSLALDNVFGLADQWFISAGHS---SRFATSHDAESLQAG------ 280

询问：62 HYSAPFGKWTWAFNHNGYRYHQAVSGLSEVYDYNGKSYNTDFGFNRLLYRDAKRKTYLSV 121

+S P+G W +N++ RY + G S F +R+++RD KT ++

目标：281 -FSMPYGYWNLGYNYSQSRYRNTFINRDFPWHSTGDSDTHRFSLSRVVFRDGTMKTAIAG 339

询问：122 KLWTRETKSYIDDAELTVQRRKTTGWLAELSHKGYIGRSTADFKLKYKHGTGMKDALRAP 181

R +Y++ + L RK + ++H + A F Y G +

目标：340 TFSQRTGNNYLNGSLLPSSSRKLSSVSLGVNHSQKLWGGLATFNPTYNRGVRWLGSETDT 399

询问：182 EEAFGEGTSRMKIWTASADVNTPFQIGKQLFAYDTSVHAQWNKTPLTSQDKLAIGGHHTV 241

+++ E + WT SA P Y S++ Q++ L ++L +GG ++

目标：400 DKSADEPRAEFNKWTLSASYYHPV---TDSITYLGSLYGQYSARALYGSEQLTLGGESSI 456

询问：242 RGFDGEMSLPAERGWYWRNDLSWQFKP----GHQLYLGA-DVGHVSGQSAKWLSGQTLAG 296

RGF E RG YWRN+L+WQ G+ ++ A D GH+ + +L G

目标：457 RGF-REQYTSGNRGAYWRNELNWQAWQLPVLGNVTFMAAVDGGHLYNHKQDNSTAASLWG 515

询问：297 TAIGIRGQIKLGGNLHYDIFTGRALKKPEYFQTKKWVTGFQVGYSF 342

A+G+ + L + G + P + Q V G++VG SF

目标：516 GAVGMTVASRW---LSQQVTVGWPISYPAWLQPDTMVVGYRVGLSF 558

实施例73

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 609>：

1 ATGCGGACGA AATGGTCAGC AGTGAGAAGC TGC

ACTTG GgCGGACACC

51 GCCGACATCG ATACCGCTTT GAACCTGTTG TACCGTTTGC AAAAACTCGA

101 ATTCCTCTAT GGCGATGAAA ACGGTCATTC AGACGGCATC AATTTGwCGG

151 ACGAGCAATT GCCGTTGCTG ATGGAACAAT TGTCCGGCAG CGGTAAGGCG

201 TTATTGGTCG ATCGGAACGG TCTGTATCTT GCCAACGCCA ATTTCCATCA

251 TGAGGCGGCG GAAGAGTTGG GGTTGTTGGC GGCAGAAGTC GCACAGATGG

301 AAAAGAAATA CCGGCTGCTG ATTAAGAACA AC..

它对应于氨基酸序列<SEQ ID 610；ORF143>：

1 MRTKWSAVRS CTWADTADID TALNLLYRLQ KLEFLYGDEN GHSDGINLXD

51 EQLPLLMEQL SGSGKALLVD RNGLYLANAN FHHEAAEELG LLAAEVAQME

101 KKYRLLIKNN ..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 611>：

1 ATGGAATCAA CACTTTCACT ACAAGCAAAT TTATATCCCC GCCTGACTCC

51 TGCCGGTGCA TTTTATGCCG TATCCAGCGA TGCCCCCAGT GCCGGTAAAA

101 CTTTGTTGCA CAGCCTGTTG AAAGCAGATG CGGACGAAAT GGTCAGCAGT

151 GAGAAGCTGC TTACTTGGGC GGACACCGCC GACATCGATA CCGCTTTGAA

201 CCTGTTGTAC CGTTTGCAAA AACTCGAATT CCTCTATGGC GATGAAAACG

251 GTCATTCAGA CGGCATCAAT TTGTCGGACG AGCAATTGCC GTTGCTGATG

301 GAACAATTGT CCGGCAGCGG TAAGGCGTTA TTGGTCGATC GGAACGGTCT

351 GTATCTTGCC AACGCCAATT TCCATCATGA GGCGGCGGAA GAGTTGGGGT

401 TGTTGGCGGC AGAAGTCGCA CAGATGGAAA AGAAATACCG GCTGCTGATT

451 AAGAACAACC TGTATATCAA CAATAACGCT TGGGGCGTTT GCGATCCTTC

501 CGGTCAGAGC GAATTGACAT TTTTCCCATT GTATATCGGT TCAACCAAAT

551 TTATTTTGGT TATCGGCGGC ATTCCCGATT TGGGCAAAGA GGCATTTGTT

601 ACTTTGGTAA GGATTTTATA CCGCCGTTAC AGCAACCGCG TGTAA

它对应于氨基酸序列<SEQ ID 612；ORF143-1>：

1 MESTLSLQAN LYPRLTPAGA FYAVSSDAPS AGKTLLHSLL KADADEMVSS

51 EKLLTWADTA DIDTALNLLY RLQKLEFLYG DENGHSDGIN LSDEQLPLLM

101 EQLSGSGKAL LVDRNGLYLA NANFHHEAAE ELGLLAAEVA QMEKKYRLLI

151 KNNLYINNNA WGVCDPSGQS ELT FFPLYIG STKFILVIGG IPDLGKEAFV

201 TLVRILYRRY SNRV*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF143和脑膜炎奈瑟球菌菌株A的ORF(ORF143a)在105个氨基酸的重叠区内显示出有92.4％的相同性：

10 20 30

orf143.pep MRTKWSAVRSCTWADTADIDTALNLLYRLQKLEFL

|: : ||| ||||||||||||||||||||

orf143a GAFYAVSSDXPSAGKTLLHSLLKADADEMVSSEKLLTWAXTADIDTALNLLYRLQKLEFL

20 30 40 50 60 70

40 50 60 70 80 90

orf143.pep YGDENGHSDGINLXDEQLPLLMEQLSGSGKALLVDRNGLYLANANFHHEAAEELGLLAAE

||||||||||||| ||||||||||||||||||||||||||||||||||||||||||||||

orf143a YGDENGHSDGINLSDEQLPLLMEQLSGSGKALLVDRNGLYLANANFHHEAAEELGLLAAE

80 90 100 110 120 130

100 110

orf143.pep VAQMEKKYRLLIKNN

|||||||||| ||||

orf143a VAQMEKKYRLXIKNNLYINNNAWGVCDPSGQSELT FFPLYIGSTKFILVIGGIPDLGKEA

140 150 160 170 180 190

全长ORF143a核苷酸序列<SEQ ID 613>是：

1 ATGGAATCAA CANTTTCACT ACAAGCAAAT TTATATCNCC GCCTGACTCC

51 TGCCGGTGCA TTTTATGCCG TATCCAGCGA TGNCCCCAGT GCCGGTAAAA

101 CTTTGTTGCA CAGCCTGTTG AAAGCGGATG CGGACGAAAT GGTNAGCAGT

151 GAGAAGCTGC TTACCTGGGC GGANACCGCC GACATCGATA CCGCTTTGAA

201 CCTGTTGTAC CGTTTGCAAA AACTCGAATT CCTCTATGGC GATGAAAACG

251 GTCATTCAGA CGGCATCAAT TTGTCGGACG AGCAATTGCC GTTGCTGATG

301 GAACAATTGT CCGGCAGCGG TAAGGCGTTA TTGGTCGATC GGAACGGTCT

351 GTATCTTGCC AACGCCAATT TCCATCATGA GGCGGCGGAA GAGTTGGGGT

401 TGTTGGCGGC AGAAGTCGCA CAGATGGAAA AGAAATACCG GCTGCNNATT

451 AAGAACAACC TGTATATCAA CAATAACGCT TGGGGCGTTT GCGATCCTTC

501 CGGTCAGAGC GAATTGACAT TTTTCCCATT GTATATCGGT TCAACCAAAT

551 TTATTTTGGT TATCGGCGGC ATTCCCGATT TGGGCAAAGA GGCATTTGTT

601 ACTTTGGTAA GGATNTTATA CCNCCNGTTA CAGCAACCGC GTGTAAAACT

651 TGGGAGAGAG GANGGGTTAT GCAGCAATTA TTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 614>：

1 MESTXSLQAN LYXRLTPAGA FYAVSSDXPS AGKTLLHSLL KADADEMVSS

51 EKLLTWAXTA DIDTALNLLY RLQKLEFLYG DENGHSDGIN LSDEQLPLLM

101 EQLSGSGKAL LVDRNGLYLA NANFHHEAAE ELGLLAAEVA QMEKKYRLXI

151 KNNLYINNNA WGVCDPSGQS ELT FFPLYIG STKFILVIGG IPDLGKEAFV

201 TLVRXLYXXL QQPRVKLGRE XGLCSNY*

ORF143a和ORF143-1在207个氨基酸的重叠区内显示出有97.1％的相同性：

orf143a.pep MESTXSLQANLYXRLTPAGAFYAVSSDXPSAGKTLLHSLLKADADEMVSSEKLLTWAXTA

|||| ||||||| |||||||||||||| ||||||||||||||||||||||||||||| ||

orf143-1 MESTLSLQANLYPRLTPAGAFYAVSSDAPSAGKTLLHSLLKADADEMVSSEKLLTWADTA

orf143a.pep DIDTALNLLYRLQKLEFLYGDENGHSDGINLSDEQLPLLMEQLSGSGKALLVDRNGLYLA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf143-1 DIDTALNLLYRLQKLEFLYGDENGHSDGINLSDEQLPLLMEQLSGSGKALLVDRNGLYLA

orf143a.pep NANFHHEAAEELGLLAAEVAQMEKKYRLXIKNNLYINNNAWGVCDPSGQSELTFFPLYIG

|||||||||||||||||||||||||||| |||||||||||||||||||||||||||||||

orf143-1 NANFHHEAAEELGLLAAEVAQMEKKYRLLIKNNLYINNNAWGVCDPSGQSELTFFPLYIG

orf143a.pep STKFILVIGGIPDLGKEAFVTLVRXLY

|||||||||||||||||||||||| ||

orf143-1 STKFILVIGGIPDLGKEAFVTLVRILY

与淋病奈瑟球菌的预计ORF的同源性

ORF143和淋病奈瑟球菌的预计ORF(ORF143ng)在110个氨基酸的重叠区内显示出有95.5％的相同性：

orf143.pep MRTKWSAVRSCTWADTADIDTALNLLYRLQKLEFLYGDENGHSDGINLXDEQLPLLMEQL 60

|||||||||||: ||||||||||||||||||||||||||||||||||| |||||||||||

orf143ng MRTKWSAVRSCSRADTADIDTALNLLYRLQKLEFLYGDENGHSDGINLSDEQLPLLMEQL 60

orf143.pep SGSGKALLVDRNGLYLANANFHHEAAEELGLLAAEVAQMEKKYRLLIKNN 110

|||||||||||||||||||||||||:||||||||||||||||||||||:||

orf143ng SGSGKALLVDRNGLYLANANFHHESAEELGLLAAEVAQMEKKYRLLIRNNLYINNNAWGV 120

预计ORF143ng核苷酸序列<SEQ ID 615>编码的蛋白质具有氨基酸序列<SEQ ID616>：

1 MRTKWSAVRS CSRADTADID TALNLLYRLQ KLEFLYGDEN GHSDGINLSD

51 EQLPLLMEQL SGSGKALLVD RNGLYLANAN FHHESAEELG LLAAEVAQME

101 KKYRLLIRNN LYINNNAWGV CDPSGQSELT F FPLYIGSTK FILVIAGIPD

151 LSKGGICYFG KDFIPPLQQP RVKLGTGGIM RQLLISILED LNNTSTDIIA

201 SAVISTDGLP MATMLPSHLN SDRVGAISAT LLALGSRSVQ ELACGELEQV

251 MIKGKSGYIL LSQAGKDAVL VLVAKETG RL GLILLDAKRA ARHIAEAI*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 617>：

1 ATGGAATCAA CACTTTCACT ACAAGCGAAT TTATATCCCT GCCTGACTCC

51 TGCCGGTGCA TTTTATGCCG TATCCAGCGA TGCCCCCAGT GCCGGTAAAA

101 CTTTGTTGCG CAGCCTGTTG AAAGCGGATG CGGACGAAGT GGTCAGCAGT

151 GAGAAGCTGC TCGCGGCGGA CACCGCCGAC ATCGATACCG CTTTGAACCT

201 GTTGTACCGT TTGCAAAAAC TCGAATTCCT CTATGGCGAT GAAAACGGTC

251 ATTCAGACGG CATCAATTTG TCGGACGAGC AATTGCCGTT GCTGATGGAA

301 CAATTGTCCG GCAGCGGTAA GGCATTATTG GTCGATCGGA ACGGTCTGTA

351 TCTTGCCAAC GCCAATTTCC ATCATGAGTC GGCGGAAGAG TTGGGGTTGT

401 TGGCGGCAGA AGTCGCACAG ATGGAAAAGA AATACCGGCT GCTGATTAGG

451 AACAACCTGT ATATCAACAA TAACGCTTGG GGCGTTTGCG ATCCTTCCGG

501 TCAGAGCGAA TTGACATTTT TCCCATTGTA TATCGGTTCA ACCAAATTTA

551 TTTTGGTTAT CGCCGGCATT CCCGATTTGA GCAAAGAGGC ATTTGTTACT

601 TTGGTAAGGA TTTTATACCG CCGTTACAGC AACCGCGTGT AA

它对应于氨基酸序列<SEQ ID 618；ORF143ng-1>：

1 MESTLSLQAN LYPCLTPAGA FYAVSSDAPS AGKTLLRSLL KADADEVVSS

51 EKLLAADTAD IDTALNLLYR LQKLEFLYGD ENGHSDGINL SDEQLPLLME

101 QLSGSGKALL VDRNGLYLAN ANFHHESAEE LGLLAAEVAQ MEKKYRLLIR

151 NNLYINNNAW GVCDPSGQSE LTF FPLYIGS TKFILVIAGI PDLSKEAFVT

201 LVRILYRRYS NRV*

ORF143ng-1和ORF143-1在214个氨基酸的重叠区内显示出有95.8％的相同性：

orf143ng-1.pep MESTLSLQANLYPCLTPAGAFYAVSSDAPSAGKTLLRSLLKADADEVVSSEKLLA-ADTA 59

||||||||||||| ||||||||||||||||||||||:|||||||||:|||||||: ||||

orf 143-1 MESTLSLQANLYPRLTPAGAFYAVSSDAPSAGKTLLHSLLKADADEMVSSEKLLTWADTA 60

orf143ng-1.pep DIDTALNLLYRLQKLEFLYGDENGHSDGINLSDEQLPLLMEQLSGSGKALLVDRNGLYLA 119

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf143-1 DIDTALNLLYRLQKLEFLYGDENGHSDGINLSDEQLPLLMEQLSGSGKALLVDRNGLYLA 120

orf143ng-1.pep NANFHHESAEELGLLAAEVAQMEKKYRLLIRNNLYINNNAWGVCDPSGQSELTFFPLYIG 179

|||||||:||||||||||||||||||||||:|||||||||||||||||||||||||||||

orf143-1 NANFHHEAAEELGLLAAEVAQMEKKYRLLIKNNLYINNNAWGVCDPSGQSELTFFPLYIG 180

orf143ng-1.pep STKFILVIAGIPDLSKEAFVTLVRILYRRYSNRV 213

||||||||:|||||:|||||||||||||||||||

orf143-1 STKFILVIGGIPDLGKEAFVTLVRILYRRYSNRV 214

根据淋球菌蛋白中存在推定的跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例74

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 619>：

1 ATGACCTTTT TACAACGTTT GCAAGGTTTG GCAGACAATA AAATCTGTGC

51 GTTTGCATGG TTCGTCGTCC GCCGCTTTGA TGAAGAACGC GTACCGCAGr

101 CGGCGGCAAG CATGACGTTT ACGACGCTGC TGGCACTCGT CCCCGTGCTG

151 ACCGTGATGG TGGCGGTCGC TTCGATTTTC CCCGTGTTCG ACCGCTGGTC

201 GGATTCGTTC GTCTCCTTCG TCAACCAAAC CATTGTGCCG CA.GGCGCGG

251 ACATGGTGTT CGACTATATC AATGCGTTCC GCGAGCAGGC GAACCGGCTG

301 ACGGCAATCG GCAGCGTGAT GCTGGTCGTT ACCTCGCTGA TGCTGATTCG

351 GACGATAGAC AATACGTTCA ACCGCATCTG G

CGGGTCAA wTyCCAGCGT

401 CCGTGGATG..

它对应于氨基酸序列<SEQ ID 620；ORF144>：

1 MTFLQRLQGL ADNKICAFAW FVVRRFDEER VPQXAASMTF TTLLALVPVL

51 TVMVAVASIF PVFDRWSDSF VSFVNQTIVP XGADMVFDYI NAFREQANRL

101 TAIGSVMLVV TSLMLIRTID NTFNRIWRVX XQRPWM...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 621>：

1 ATGACCTTTT TACAACGTTT GCAAGGTTTG GCAGACAATA AAATCTGTGC

51 GTTTGCATGG TTCGTCGTCC GCCGCTTTGA TGAAGAACGC GTACCGCAGG

101 CGGCGGCAAG CATGACGTTT ACGACGCTGC TGGCACTCGT CCCCGTGCTG

151 ACCGTGATGG TGGCGGTCGC TTCGATTTTC CCCGTGTTCG ACCGCTGGTC

201 GGATTCGTTC GTCTCCTTCG TCAACCAAAC CATTGTGCCG CAGGGCGCGG

251 ACATGGTGTT CGACTATATC AATGCGTTCC GCGAGCAGGC GAACCGGCTG

301 ACGGCAATCG GCAGCGTGAT GCTGGTCGTT ACCTCGCTGA TGCTGATTCG

351 GACGATAGAC AATACGTTCA ACCGCATCTG GCGGGTCAAT TCCCAGCGTC

401 CGTGGATGAT GCAGTTTCTC GTCTATTGGG CTTTACTGAC GTTCGGGCCG

451 CTGTCTTTGG GCGTGGGCAT TTCCTTTATG GTCGGCTCGG TACAGGATGC

501 CGCGCTTGCC TCAGGTGCGC CGCAGTGGTC GGGCGCGTTG CGAACGGCGG

551 CGACGCTGAC CTTCATGACG CTTTTGCTGT GGGGGCTGTA CCGCTTCGTG

601 CCAAACCGCT TCGTTCCCGC GCGGCAGGCG TTTGTCGGGG CTTTGGCAAC

651 AGCGTTTTGT CTGGAAACCG CGCGCTCCCT CTTCACTTGG TATATGGGCA

701 ATTTCGACGG CTACCGCTCG ATTTACGGCG CGTTTGCCGC CGTGCCGTTT

751 TTTCTGTTGT GGCTGAACCT GTTGTGGACG CTGGTCTTGG GCGGCGCGGT

801 GCTGACTTCT TCACTCTCCT ACTGGCAGGG AGAAGCGTTC CGCAGGGGCT

851 TCGACTCGCG CGGACGGTTT GACGACGTGT TGAAAATCCT GCTGCTTCTG

901 GATGCGGCGC AAAAAGAAGG CAAAGCCTTG CCTGTTCAGG AGTTCAGACG

951 GCATATCAAT ATGGGCTACG ACGAGTTGGG CGAGCTTTTG GAAAAGCTGG

1001 CGCGGCACGG CTACATCTAT TCCGGCAGAC AGGGTTGGGT GTTGAAAACG

1051 GGGGCGGATT CGATTGAGTT GAACGAACTC TTCAAGCTCT TCGTTTACCG

1101 TCCGTTGCCT GTGGAAAGGG ATCATGTGAA CCAAGCTGTC GATGCGGTAA

1151 TGACACCGTG TTTGCAGACT TTGAACATGA CGCTGGCAGA GTTTGACGCT

1201 CAGGCGAAAA AACGGCAGTA G

它对应于氨基酸序列<SEQ ID 622；ORF144-1>：

1 MTFLQRLQGL ADNKICAFAW FVVRRFDEER VPQAAASMTF TT LLALVPVL

51 TVMVAVASIF PVFDRWSDSF VSFVNQTIVP QGADMVFDYI NAFREQANR L

101 TAIGSVMLVV TSLMLIRTID NTFNRIWRVN SQRPWMMQFL VYWA LLTFGP

151 LSLGVGISFM VGSVQDAALA SGAPQWSGAL RTAATLTFMT LLLWGLYRFV

201 PNRFVPARQA FVGALATAFC LETARSLFTW YMGNFDGYRS IYGAF AAVPF

251 FLLWLNLLWT LVLGGAVLTS SLSYWQGEAF RRGFDSRGRF DDVLKILLLL

301 DAAQKEGKAL PVQEFRRHIN MGYDELGELL EKLARHGYIY SGRQGWVLKT

351 GADSIELNEL FKLFVYRPLP VERDHVNQAV DAVMTPCLQT LNMTLAEFDA

401 QAKKRQ*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF144和脑膜炎奈瑟球菌菌株A的ORF(ORF144a)在136个氨基酸的重叠区内显示出有96.3％的相同性：

10 20 30 40 50 60

orf144.pep MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQXAASMTFTT LLALVPVLTVMVAVASIF

||||||||||||||||||| |||||||||||||| |||||||| ||||||||||||||||| |

orf144a MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQAAASMTFTT LLALVPVLTVMVAVASIF

10 20 30 40 50 60

70 80 90 100 110 120

orf144.pep PVFDRWSDSFVSFVNQTIVPXGADMVFDYINAFREQANR LTAIGSVMLVVTSLMLIRTID

|||||||||||||||||||| ||||||||||||||||||||||||||||||| |||||||

orf144a PVFDRWSDSFVSFVNQTIVPQGADMVFDYINAFREQANR LTAIGSVMLVVTSXMLIRTID

70 80 90 100 110 120

130

orf144.pep NTFNRIWRVXXQRPWM

||||||||| |||||

orf144a NTFNRIWRVNSQRPWMMQFLVYWA LLTFGPLSLGVGISFXVGSVQDAALASGAPQWSGAL

130 140 150 160 170 180

全长ORF144a核苷酸序列<SEQ ID 623>是：

1 ATGACCTTTT TACAACGTTT GCAAGGTTTG GCAGACAATA AAATCTGTGC

51 GTTTGCATGG TTCGTCGTCC GCCGCTTTGA TGAAGAACGC GTACCGCAGG

101 CGGCGGCAAG CATGACGTTT ACGACACTGC TGGCACTCGT CCCCGTGCTG

151 ACCGTGATGG TGGCGGTCGC TTCGATTTTC CCCGTGTTCG ACCGNTGGTC

201 GGATTCGTTC GTCTCCTTCG TCAACCAAAC CATTGTGCCG CAGGGCGCGG

251 ACATGGTNTT CGACTATATC AATGCGTTCC GCGAGCAGGC GAACCGGCTG

301 ACGGCAATCG GCAGCGTGAT GCTGGTCGTT ACCTCGCNGA TGCTGATTCG

351 GACGATAGAC AATACGTTCA ACCGCATCTG GCGGGTCAAT TCCCAGCGTC

401 CGTGGATGAT GCAGTTTCTC GTCTATTGGG CTTTACTGAC GTTCGGGCCG

451 CTGTCTTTGG GCGTGGGCAT TTCCTTTATN GTCGGCTCGG TACAGGATGC

501 CGCGCTTGCC TCAGGTGCGC CGCAGTGGTC GGGCGCGTTG CGAACGGCGG

551 CGACGCTGAN CTTCATGACG CTTTTGCTGT GGGGGCTGTA CCGCTNCGTG

601 CCAAACCGCT TCGTTCCCGC GCGGCANGCG TTTGTCGGGG CTTTGGCAAC

651 AGCGTTCTGT CTGGAAACCG CGCGTTCCCT CTTTACTTGG TATATGGGCA

701 ATTTCGACGG CTACCGCTCG ATTTACGGNG CGTTTGCCGC CGTGCCGTTT

751 TTTCTGTTGT GGCTGAACCT GTTGTGGACG CTGGTCTTGG GCGGCGCGGT

801 GCTGACTTCT TCACTCTCCT ACTGGCAGGG AGAAGCGTTC CGCAGGGNCT

851 TCGACTCGCG CGGACGGTTT GACGACGTGT TGAAAATCCT GCTGCTTCTG

901 GATGCGGCGC AAAAAGAAGG CNAAGCCTTG CCTGTTCAGG AGTTCAGACG

951 GCATATCAAT ATGGGCTACG ACGAGTTGGG CGAGCTTTTG GAAAAGCTGG

1001 CGCGGCACGG CTACATCTAT TCCGGCAGAC AGGGTTGGGT GTTGAAAACG

1051 GGGGCGGATT CGATTGAGTT GAACGAACTC TTCAAGCTCT TCGTTTACCG

1101 TCCGTTGCCT GTGGAAAGGG ATCATGTGAA CCAAGCTGTC GATGCGGTAA

1151 TGATGCCGTG TTTGCAGACT TTGAACATGA CGCTGGCAGA GTTTGACGCT

1201 CAGGCGAAAA AACAGCAGCA ATCTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 624>：

1 MTFLQRLQGL ADNKICAFAW FVVRRFDEER VPQAAASMTF TT LLALVPVL

51 TVMVAVASIF PVFDRWSDSF VSFVNQTIVP QGADMVFDYI NAFREQANRL

101 TAIGSVMLVV TSXMLIRTID NTFNRIWRVN SQRPWMMQFL VYWA LLTFGP

151 LSLGVGISFX VGSVQDAALA SGAPQWSGAL RTAATLXFMT LLLWGLYRXV

201 PNRFVPARXA FVGALATAFC LETARSLFTW YMGNFDGYRS IYGAFA AVPF

251 FLLWLNLLWT LVLGGAVLTS SLSYWQGEAF RRXFDSRGRF DDVLKILLLL

301 DAAQKEGXAL PVQEFRRHIN MGYDELGELL EKLARHGYIY SGRQGWVLKT

351 GADSIELNEL FKLFVYRPLP VERDHVNQAV DAVMMPCLQT LNMTLAEFDA

401 QAKKQQQS*

ORF144a和ORF144-1在406个氨基酸的重叠区内显示出有97.8％的相同性：

orf144a.pep MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQAAASMTFTTLLALVPVLTVMVAVASIF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf144-1 MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQAAASMTFTTLLALVPVLTVMVAVASIF

orf144a.pep PVFDRWSDSFVSFVNQTIVPQGADMVFDYINAFREQANRLTAIGSVMLVVTSXMLIRTID

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf144-1 PVFDRWSDSFVSFVNQTIVPQGADMVFDYINAFREQANRLTAIGSVMLVVTSLMLIRTID

orf144a.pep NTFNRIWRVNSQRPWMMQFLVYWALLTFGPLSLGVGISFXVGSVQDAALASGAPQWSGAL

||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||

orf144-1 NTFNRIWRVNSQRPWMMQFLVYWALLTFGPLSLGVGISFMVGSVQDAALASGAPQWSGAL

orf144a.pep RTAATLXFMTLLLWGLYRXVPNRFVPARXAFVGALATAFCLETARSLFTWYMGNFDGYRS

||||||:||||||||||| ||||||||| |||||||||||||||||||||||||||||||

orf144-1 RTAATLTFMTLLLWGLYRFVPNRFVPARQAFVGALATAFCLETARSLFTWYMGNFDGYRS

orf144a.pep IYGAFAAVPFFLLWLNLLWTLVLGGAVLTSSLSYWQGEAFRRXFDSRGRFDDVLKILLLL

|||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf144-1 IYGAFAAVPFFLLWLNLLWTLVLGGAVLTSSLSYWQGEAFRRGFDSRGRFDDVLKILLLL

orf144a.pep DAAQKEGXALPVQEFRRHINMGYDELGELLEKLARHGYIYSGRQGWVLKTGADSIELNEL

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf144-1 DAAQKEGKALPVQEFRRHINMGYDELGELLEKLARHGYIYSGRQGWVLKTGADSIELNEL

orf144a.pep FKLFVYRPLPVERDHVNQAVDAVMMPCLQTLNMTLAEFDAQAKKQQQS 408

|||||||||||||||||||||||| |||||||||||||||||||:|

orf144-1 FKLFVYRPLPVERDHVNQAVDAVMTPCLQTLNMTLAEFDAQAKKRQ 406

与淋病奈瑟球菌的预计ORF的同源性

ORF144和淋病奈瑟球菌的预计ORF(ORF114ng)在136个氨基酸的重叠区内显示出有91.2％的相同性：

orf144.pep MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQXAASMTFTTLLALVPVLTVMVAVASIF 60

||||| || ||||||||||||:|||:|||||| ||||||||||||||||||||||||||

orf144ng MTFLQCWQGSADNKICAFAWFVIRRFSEERVPQAAASMTFTTLLALVPVLTVMVAVASIF 60

orf144.pep PVFDRWSDSFVSFVNQTIVPXGADMVFDYINAFREQANRLTAIGSVMLVVTSLMLIRTID 120

|||||||||||||||||||| |||||||||:|||:|||||||||||||||||||||||||

orf144ng PVFDRWSDSFVSFVNQTIVPQGADMVFDYIDAFRDQANRLTAIGSVMLVVTSLMLIRTID 120

orf144.pep NTFNRIWRVXXQRPWM 136

|:||||||| :|||||

orf144ng NAFNRIWRVNTQRPWMMQFLVYWALLTFGPLSLGVGISFMVGSVQDSVLSSGAQQWADAL 180

预计全长ORF144ng核苷酸序列<SEQ ID 625>编码的蛋白质具有氨基酸序列<SEQ ID 626>：

1 MTFLQCWQGS ADNKICAFAW FVIRRFSEER VPQAAASMTF TT LLALVPVL

51 TVMVAVASIF PVFDRWSDSF VSFVNQTIVP QGADMVFDYI DAFRDQANR L

101 TAIGSVMLVV TSLMLIRTID NAFNRIWRVN TQRPWMMQFL VYWA LLTFGP

151 LSLGVGISFM VGSVQDSVLS SGAQQWADAL KTAARLAFMT LLLWGLYRFV

201 PNRFVPARQA FVGALITAFC LETARFLFTW YMGNFDGYRS IYGAFA AVPF

251 FLLWLNLLWT LVLGGAVLTS SLSYWQGEAF RRGFDSRGRF DDVLKILLLL

301 DAAQKEGRTL SVQEFRRHIN MGYDELGELL EKLARYGYIY SGRQGWVLKT

351 GADSIELSEL FKLFVYRPLP VERDHVNQAV DAVMTPCLQT LNMTLAEFDA

401 QAKKQQQS*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 627>：

1 ATGACCTTTT TACAACGTTG GCAAGGTTTG GCGGACAATA AAATCTGTGC

51 ATTTGCATGG TTCGTCATCC GCCGTTTCAG TGAAGAGCGC GTACCGCAGG

101 CAGCGGCGAG CATGACGTTT ACGACACTGC TGGCACTCGT CCCCGTACTG

151 ACCGTAATGG TCGCGGTCGC TTCGATTTTC CCCGTGTTCG ACCGCTGGTC

201 GGATTCGTTC GTCTCCTTCG TCAACCAAAC CATTGTGCCG CAGGGCGCGG

251 ATATGGTGTT CGACTATATC GACGCATTCC GCGATCAGGC AAACCGGCTG

301 ACCGCCATCG GCAGCGTGAT GCTGGTCGTA ACCTCGCTGA TGCTGATTCG

351 GACGATAGAC AATGCGTTCA ACCGCATCTG GCGGGTTAAC ACGCAACGCC

401 CCTGGATGAT GCAGTTCCTC GTTTATTGGG CGTTGCTGAC TTTCGGGCCT

451 TTGTCTTTGG GTGTGGGCAT TTCCTTTATG GTCGGGTCGG TTCAAGACTC

501 CGTACTCTCC TCCGGAGCGC AACAATGGGC GGACGCGTTG AAGACGGCGG

551 CAAGGCTGGC TTTCATGACG CTTTTGCTGT GGGGGCTGTA CCGCTTCGTG

601 CCCAACCGCT TCGTGCCCGC CCGGCAGGCG TTTGTCGGAG CTTTGATTAC

651 GGCATTCTGC CTGGAGACGG CACGTTTCCT GTTCACCTGG TATATGGGCA

701 ATTTCGACGG CTACCGCTCG ATTTACGGCG CATTTGCCGC CGTGCCGTTT

751 TTCCTGCTGT GGTTAAACCT GCTGTGGACG CTGGTCTTGG GCGGGGCGGT

801 GCTGACTTCG TCGCTGTCTT ATTGGCAGGG CGAGGCCTTC CGCAGGGGAT

851 TCGACTCGCG CGGACGGTTT GACGACGTGT TGAAAATCCT GCTGCTTCTG

901 GATGCGGCGC AAAAAGAAGG CCGAACCCTG TCCGTTCAGG AGTTCAGACG

951 GCATATCAAT ATGGGTTACG ATGAATTGGG CGAGCTTTTG GAAAAGCTGG

1001 CGCGGTACGG CTATATCTAT TCCGGCAGAC AGGGCTGGGT TTTGAAAACG

1051 GGGGCGGATT CGATTGAGTT GAGCGAACTC TTCAAGCTCT TCGTGTACCG

1101 CCCGTTGCct gtggaAAGGG ATCATGTGAA CCAAGCTGtc gaTGCGGTAA

1151 TGAcgccgtG TTTGCAGACT TTGAACATGA CGCTGGCGGA GTTTGACGCT

1201 CAGgcgAAAA AACAGCAGCA GTCTTGA

它编码ORF144ng的一个变体，该变体具有氨基酸序列<SEQ ID 628；ORF144ng-1>：

1 MTFLQRWQGL ADNKICAFAW FVIRRFSEER VPQAAASMTF TT LLALVPVL

51 TVMVAVASIF PVFDRWSDSF VSFVNQTIVP QGADMVFDYI DAFRDQANRL

101 TAIGSVMLVV TSLMLIRTID NAFNRIWRVN TQRPWMMQFL VYWA LLTFGP

151 LSLGVGISFM VGSVQDSVLS SGAQQWADAL KTAARLAFMT LLLWGLYRFV

201 PNRFVPARQA FVGALITAFC LETARFLFTW YMGNFDGYRS IYGAFA AVPF

251 FLLWLNLLWT LVLGGAVLTS SLSYWQGEAF RRGFDSRGRF DDVLKILLLL

301 DAAQKEGRTL SVQEFRRHIN MGYDELGELL EKLARYGYIY SGRQGWVLKT

351 GADSIELSEL FKLFVYRPLP VERDHVNQAV DAVMTPCLQT LNMTLAEFDA

401 QAKKQQQS*

ORF144ng-1和ORF144-1在406个氨基酸的重叠区内显示出有94.1％的相同性：

orf144ng-1.pep MTFLQRWQGLADNKICAFAWFVIRRFSEERVPQAAASMTFTTLLALVPVLTVMVAVASIF

|||||| |||||||||||||||:|||:|||||||||||||||||||||||||||||||||

orf144-1 MTFLQRLQGLADNKICAFAWFVVRRFDEERVPQAAASMTFTTLLALVPVLTVMVAVASIF

orf144ng-1.pep PVFDRWSDSFVSFVNQTIVPQGADMVFDYIDAFRDQANRLTAIGSVMLVVTSLMLIRTID

||||||||||||||||||||||||||||||:|||:|||||||||||||||||||||||||

orf144-1 PVFDRWSDSFVSFVNQTIVPQGADMVFDYINAFREQANRLTAIGSVMLVVTSLMLIRTID

orf144ng-1.pep NAFNRIWRVNTQRPWMMQFLVYWALLTFGPLSLGVGISFMVGSVQDSVLSSGAQQWADAL

|:||||||||:|||||||||||||||||||||||||||||||||||::|:||| ||: ||

orf 144-1 NTFNRIWRVNSQRPWMMQFLVYWALLTFGPLSLGVGISFMVGSVQDAALASGAPQWSGAL

orf144ng-1.pep KTAARLAFMTLLLWGLYRFVPNRFVPARQAFVGALITAFCLETARFLFTWYMGNFDGYRS

:||| |:|||||||||||||||||||||||||||| ||||||||| ||||||||||||||

orf144-1 RTAATLTFMTLLLWGLYRFVPNRFVPARQAFVGALATAFCLETARSLFTWYMGNFDGYRS

orf144ng-1.pep IYGAFAAVPFFLLWLNLLWTLVLGGAVLTSSLSYWQGEAFRRGFDSRGRFDDVLKILLLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf144-1 IYGAFAAVPFFLLWLNLLWTLVLGGAVLTSSLSYWQGEAFRRGFDSRGRFDDVLKILLLL

orf144ng-1.pep DAAQKEGRTLSVQEFRRHINMGYDELGELLEKLARYGYIYSGRQGWVLKTGADSIELSEL

|||||||::| ||||||||||||||||||||||||:|||||||||||||||||||||:||

orf144-1 DAAQKEGKALPVQEFRRHINMGYDELGELLEKLARHGYIYSGRQGWVLKTGADSIELNEL

orf144ng-1.pep FKLFVYRPLPVERDHVNQAVDAVMTPCLQTLNMTLAEFDAQAKKQQQS

||||||||||||||||||||||||||||||||||||||||||||:|

orf144-1 FKLFVYRPLPVERDHVNQAVDAVMTPCLQTLNMTLAEFDAQAKKRQ

根据该分析结果(包括在淋球菌蛋白中鉴定出几个推定的跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例75

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 629>：

1 ..AGACACGCCC GCCGCATCCG CATCGACACC GCCATCAACC CCGAACTGGA

51 AGCCCTCGCC GAACACCTCC ACTACCAATG GCAGGGCTTC CTCTGGCTCA

101 GCACCGATAT GCGTCAGGAA ATTTCCGCCC TCGTCATCCT GCTGCAACGC

151 ACCCGCCGCA AATGGCTGGA TGCCCACGAA CGCCAACACC TGCGCCAAAG

201 CCTGCTTGAA ACACGGGAAC ACGGCTGA

它对应于氨基酸序列<SEQ ID 630；ORF146>：

1 ..RHARRIRIDT AINPELEALA EHLHYQWQGF LWLSTDMRQE ISALVILLQR

51 TRRKWLDAHE RQHLRQSLLE TREHG*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 631>：

1 ATGAACACCT CGCAACGCAA CCGCCTCGTC AGCCGCTGGC TCAACTCCTA

51 CGAACGCTAC CGCTACCGCC GCCTCATCCA CGCCGTCCGG CTCGGCGGGG

101 CCGTCCTGTT CGCCACCGCC TCCGCCCGGC TGCTCCACCT CCAACACGGC

151 GAGTGGATAG GGATGACCGT CTTCGTCGTC CTCGGCATGC TCCAGTTTCA

201 AGGGGCGATT TACTCCAAGG CGGTGGAACG TATGCTCGGC ACGGTCATCG

251 GGCTGGGCGC GGGTTTGGGC GTTTTATGGC TGAACCAGCA TTATTTCCAC

301 GGCAACCTCC TCTTCTACCT CACCGTCGGC ACGGCAAGCG CACTGGCCGG

351 CTGGGCGGCG GTCGGCAAAA ACGGCTACGT CCCTATGCTG GCAGGGCTGA

401 CGATGTGTAT GCTCATCGGC GACAACGGCA GCGAATGGCT CGACAGCGGA

451 CTCATGCGCG CCATGAACGT CCTCATCGGC GCGGCCATCG CCATCGCCGC

501 CGCCAAACTG CTGCCGCTGA AATCCACACT GATGTGGCGT TTCATGCTTG

551 CCGACAACCT GGCCGACTGC AGCAAAATGA TTGCCGAAAT CAGCAACGGC

601 AGGCGCATGA CCCGCGAACG CCTCGAGGAG AACATGGCGA AAATGCGCCA

651 AATCAACGCA CGCATGGTCA AAAGCCGCAG CCATCTCGCC GCCACATCGG

701 GCGAAAGCCG CATCAGCCCC GCCATGATGG AAGCCATGCA GCACGCCCAC

751 CGTAAAATCG TCAACACCAC CGAGCTGCTC CTGACCACCG CCGCCAAGCT

801 GCAATCTCCC AAACTCAACG GCAGCGAAAT CCGGCTGCTT GACCGCCACT

851 TCACACTGCT CCAAACCGAC CTGCAACAAA CCGTCGCCCT TATCAACGGC

901 AGACACGCCC GCCGCATCCG CATCGACACC GCCATCAACC CCGAACTGGA

951 AGCCCTCGCC GAACACCTCC ACTACCAATG GCAGGGCTTC CTCTGGCTCA

1001 GCACCAATAT GCGTCAGGAA ATTTCCGCCC TCGTCATCCT GCTGCAACGC

1051 ACCCGCCGCA AATGGCTGGA TGCCCACGAA CGCCAACACC TGCGCCAAAG

1101 CCTGCTTGAA ACACGGGAAC ACGGCTGA

它对应于氨基酸序列<SEQ ID 632；ORF146-1>：

1 MNTSQRNRLV SRWLNSYERY RYRRLIHAVR LGGAVLFATA SARLLHLQHG

51 EW IGMTVFVV LGMLQFQGAI YSKAVER MLG TVIGLGAGLG VLWLNQHYFH

101 GNLLFYLTVG TASALAGWAA VGKNGYVPML AGLTMCMLIG DNGSEWLDSG

151 LMRAMN VLIG AAIAIAAAKL LPLKSTLMWR FMLADNLADC SKMIAEISNG

201 RRMTRERLEE NMAKMRQINA RMVKSRSHLA ATSGESRISP AMMEAMQHAH

251 RKIVNTTELL LTTAAKLQSP KLNGSEIRLL DRHFTLLQTD LQQTVALING

301 RHARRIRIDT AINPELEALA EHLHYQWQGF LWLSTNMRQE ISALVILLQR

351 TRRKWLDAHE RQHLRQSLLE TREHG*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF146和脑膜炎奈瑟球菌菌株A的ORF(ORF146a)在74个氨基酸的重叠区内显示出有98.6％的相同性：

10 20 30

orf146.pep RHARRIRIDTAINPELEALAEHLHYQWQGF

||||||||||||||||||||||||||||||

orf146a KLNGSEIRLLDRHFTLLQTDLQQTVALINGRHARRIRIDTAINPELEALAEHLHYQWQGF

280 290 300 310 320 330

40 50 60 70

orf146.pep LWLSTDMRQEISALVILLQRTRRKWLDAHERQHLRQSLLETREHGX

|||||:||||||||||||||||||||||||||||||||||||||:

orf146a LWLSTNMRQEISALVILLQRTRRKWLDAHERQHLRQSLLETREHSX

340 350 360 370

全长ORF146a核苷酸序列<SEQ ID 633>是：

1 ATGAACACCT CGCAACGCAA CCGCCTCGTC AGCCGCTGGC TCAACTCCTA

51 CGAACGCTAC CGCTACCGCC GCCTCATCCA CGCCGTCCGG CTCGGCGGGG

101 CCGTCCTGTT CGCCACCGCC TCCGCCCGGC TGCTCCACCT CCAACACGGC

151 GAGTGGATAG GGATGACCGT CTTCGTCGTC CTCGGCATGC TCCAGTTTCA

201 AGGGGCGATT TACTCCAAGG CGGTGGAACG TATGCTCGGC ACGGTCATCG

251 GGCTGGGCGC GGGTTTGGGC GTTTTATGGC TGAACCAGCA TTATTTCCAC

301 GGCAACCTCC TCTTCTACCT CACCGTCGGC ACGGCAAGCG CACTGGCCGG

351 CTGGGCGGCG GTCGGCAAAA ACGGCTACGT CCCTATGCTG GCGGGGCTGA

401 CGATGTGCAT GCTCATCGGC GACAACGGCA GCGAATGGTT CGACAGCGGC

451 CTGATGCGCG CGATGAACGT CCTCATCGGC GCGGCCATCG CCATCGCCGC

501 CGCCAAACTG CTGCCGCTGA AATCCACACT GATGTGGCGT TTCATGCTTG

551 CCGACAACCT GACCGACTGC AGCAAAATGA TTGCCGAAAT CAGCAACGGC

601 AGGCGCATGA CCCGCGAACG CCTCGAAGAG AACATGGCGA AAATGCGCCA

651 AATCAACGCA CGCATGGTCA AAAGCCGCAG CCACCTCGCC GCCACATCGG

701 GCGAAAGCCG CATCAGCCCC GCCATGATGG AAGCCATGCA GCACGCCCAC

751 CGTAAAATTG TCAACACCAC CGAGCTGCTC CTGACCACCG CCGCCAAGCT

801 GCAATCTCCC AAACTCAACG GCAGCGAAAT CCGGCTGCTT GACCGCCACT

851 TCACACTGCT CCAAACCGAC CTGCAACAAA CCGTCGCCCT TATCAACGGC

901 AGACACGCCC GCCGCATCCG CATCGACACC GCCATCAACC CCGAACTGGA

951 AGCCCTCGCC GAACACCTCC ACTACCAATG GCAGGGCTTC CTCTGGCTCA

1001 GCACCAATAT GCGTCAGGAA ATTTCCGCCC TCGTCATCCT GCTGCAACGC

1051 ACCCGCCGCA AATGGCTGGA TGCCCACGAA CGCCAACACC TGCGCCAAAG

1101 CCTGCTTGAA ACACGGGAAC ACAGTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 634>：

1 MNTSQRNRLV SRWLNSYERY RYRRLIHAVR LGGAVLFATA SARLLHLQHG

51 EW IGMTVFVV LGMLQFQGAI YSKAVER MLG TVIGLGAGLG VLWLNQHYFH

101 GNLLFYLTVG TASALAGWAA VGKNGYVPML AGLTMCMLIG DNGSEWFDSG

151 LMRAMN VLIG AAIAIAAAKL LPLKSTLMWR FMLADNLTDC SKMIAEISNG

201 RRMTRERLEE NMAKMRQINA RMVKSRSHLA ATSGESRISP AMMEAMQHAH

251 RKIVNTTELL LTTAAKLQSP KLNGSEIRLL DRHFTLLQTD LQQTVALING

301 RHARRIRIDT AINPELEALA EHLHYQWQGF LWLSTNMRQE ISALVILLQR

351 TRRKWLDAHE RQHLRQSLLE TREHS*

ORF146a和ORF146-1在374个氨基酸的重叠区内显示出有99.5％的相同性：

orf146a.pep MNTSQRNRLVSRWLNSYERYRYRRLIHAVRLGGAVLFATASARLLHLQHGEWIGMTVFVV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146-1 MNTSQRNRLVSRWLNSYERYRYRRLIHAVRLGGAVLFATASARLLHLQHGEWIGMTVFVV

orf146a.pep LGMLQFQGAIYSKAVERMLGTVIGLGAGLGVLWLNQHYFHGNLLFYLTVGTASALAGWAA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146-1 LGMLQFQGAIYSKAVERMLGTVIGLGAGLGVLWLNQHYFHGNLLFYLTVGTASALAGWAA

orf146a.pep VGKNGYVPMLAGLTMCMLIGDNGSEWFDSGLMRAMNVLIGAAIAIAAAKLLPLKSTLMWR

||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf146-1 VGKNGYVPMLAGLTMCMLIGDNGSEWLDSGLMRAMNVLIGAAIAIAAAKLLPLKSTLMWR

orf146a.pep FMLADNLTDCSKMIAEISNGRRMTRERLEENMAKMRQINARMVKSRSHLAATSGESRISP

|||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146-1 FMLADNLADCSKMIAEISNGRRMTRERLEENMAKMRQINARMVKSRSHLAATSGESRISP

orf146a.pep AMMEAMQHAHRKIVNTTELLLTTAAKLQSPKLNGSEIRLLDRHFTLLQTDLQQTVALING

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146-1 AMMEAMQHAHRKIVNTTELLLTTAAKLQSPKLNGSEIRLLDRHFTLLQTDLQQTVALING

orf146a.pep RHARRIRIDTAINPELEALAEHLHYQWQGFLWLSTNMRQEISALVILLQRTRRKWLDAHE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146-1 RHARRIRIDTAINPELEALAEHLHYQWQGFLWLSTNMRQEISALVILLQRTRRKWLDAHE

orf146a.pep RQHLRQSLLETREHSX

||||||||||||||:

orf146-1 RQHLRQSLLETREHGX

与淋病奈瑟球菌的预计ORF的同源性

ORF146和淋病奈瑟球菌的预计ORF(ORF146ng)在75个氨基酸的重叠区内显示出有97.3％的相同性：

orf146.pep RHARRIRIDTAINPELEALAEHLHYQWQGF 30

||||||||||||||||||||||||||||||

orf146ng KLNGSEIRLLDRHFTLLQTDLQQTAALINGRHARRIRIDTAINPELEALAEHLHYQWQGF 364

orf146.pep LWLSTDMRQEISALVILLQRTRRKWLDAHERQHLRQSLLETREHG 75

|||||:|||||||||| ||||||||||||||||||||||||||||

orf146ng LWLSTNMRQEISALVIPLQRTRRKWLDAHERQHLRQSLLETREHG 409

预计ORF146ng核苷酸序列<SEQ ID 635>编码的蛋白质具有氨基酸序列<SEQ ID636>：

1 MSGVRFPSPA PIPSTDPPSG SLCFFTFPLQ TASDMNSSQR KRLSGRWLNS

51 YERYRHRRLI HAVRLGGTVL FATALARLLH LQHGEW IGMT VFVVLGMLQF

101 QGAIYSNAVE R MLGTVIGLG AGLGVLWLNQ HYFHGNLLFY LTIGTASALA

151 GWAAVGKNGY VPMLAGLTMC MLIGDNGSEW LDSGLMRAMN VLIGAAIAIA

201 AAKLLPLKST LMWRFMLADN LADCSKMIAE ISNGRRMTRE RLEQNMVKMR

251 QINARMVKSR SHLAATSGES RISPSMMEAM QHAHRKIVNT TELLLTTAAK

301 LQSPKLNGSE IRLLDRHFTL LQTDLQQTAA LINGRHARRI RIDTAINPEL

351 EALAEHLHYQ WQGFLWLSTN MRQEISALVI PLQRTRRKWL DAHERQHLRQ

401 SLLETREHG*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 637>：

1 ATGAACTCCT CGCAACGCAA ACGCCTTTCC GgccGCTGGC TCAACTCCTA

51 CGAACGCTac cGCCaccGCC GCCTCATACA TGCCGTGCGG CTCGGCggaa

101 ccgtCCTGTT CGCCACCGCA CTCGCCCGgc tACTCCACCT CCAacacggc

151 gAATGGATAG GGAtgaCCGT CTTCGTCGTC CTCGGCATGC TCCAGTTCCA

201 AGGCgcgatt tActccaacg cggtgGAacg taTGctcggt acggtcatcg

251 ggctgGGCGC GGGTTTGGgc gTTTTATGGC TGAACCAGCA TTAtttccac

301 ggcaacCTcc tcttctacct gaccatcggc acggcaagcg cactggccgg

351 ctGGGCGGCG GTCGGCAAAA acggctacgt ccctatgctg GCGGGGctgA

401 CGATGTGCAT gctcatcggc gACAACGGCA GCGAATGGCT CGACAGCGGC

451 CTGATGCGCG CGATGAACGT CCTCATCGGC GCCGCCATCG CCATTGCCGC

501 CGCCAAACTG CTGCCGCTGA AATCCACACT GATGTGGCGT TTCATGCTTG

551 CCGACAACCT GGCCGACTGC AGCAAAATGA TTGCCGAAAT CAGCAACGGC

601 AGGCGTATGA CGCGCGAACG TTTGGAGCAG AATATGGTCA AAATGCGCCA

651 AATCAACGCA CGCATGGTCA AAAGCCGCAG CCACCTCGCC GCCACATCGG

701 GCGAAAGCCG CATCAGCCCC TCCATGATGG AAGCCATGCA GCACGCCCAC

751 CGCAAAATCG TCAACACCAC CGAGCTGCTC CTGACCACCG CCGCCAAGCT

801 GCAATCTCCC AAACTCAACG GCAGCGAAAT CCGGCTGCTC GACCGCCACT

851 TCACACTGCT CCAAACCGAC CTGCAACAAA CCGCCGCCCT CATCAACGGC

901 AGACACGCCC GCCGCATCCG CATCGACACC GCCATCAACC CCGAACTGGA

951 AGCCCTCGCC GAACACCTCC ACTACCAATG GCAGGGCTTC CTCTGGCTCA

1001 GCACCAATAT GCGTCAGGAA ATTTCCGCCC TCGTCATCCT GCTGCAACGC

1051 ACCCGCCGCA AATGGCTGGA TGCCCACGAA CGCCAACACC TGCGCCAAAG

1101 CCTGCTTGAA ACACGGGAAC ACGGCTGA

它对应于氨基酸序列<SEQ ID 638；ORF146ng-1>：

1 MNSSQRKRLS GRWLNSYERY RHRRLIHAVR LGGTVLFATA LARLLHLQHG

51 EW IGMTVFVV LGMLQFQGAI YSNAVER MLG TVIGLGAGLG VLWLNQHYFH

101 GNLLFYLTIG TASALAGWAA VGKNGYVPML AGLTMCMLIG DNGSEWLDSG

151 LMRAMN VLIG AAIAIAAAKL LPLKSTLMWR FMLADNLADC SKMIAEISNG

201 RRMTRERLEQ NMVKMRQINA RMVKSRSHLA ATSGESRISP SMMEAMQHAH

251 RKIVNTTELL LTTAAKLQSP KLNGSEIRLL DRHFTLLQTD LQQTAALING

301 RHARRIRIDT AINPELEALA EHLHYQWQGF LWLSTNMRQE ISALVILLQR

351 TRRKWLDAHE RQHLRQSLLE TREHG*

ORF146ng-1和ORF146-1在375个氨基酸的重叠区内显示出有96.5％的相同性：

orf146-1.pep MNTSQRNRLVSRWLNSYERYRYRRLIHAVRLGGAVLFATASARLLHLQHGEWIGMTVFVV

||:|||:|| :||||||||||:|||||||||||:|||||| |||||||||||||||||||

orf146ng-1 MNSSQRKRLSGRWLNSYERYRHRRLIHAVRLGGTVLFATALARLLHLQHGEWIGMTVFVV

orf146-1.pep LGMLQFQGAIYSKAVERMLGTVIGLGAGLGVLWLNQHYFHGNLLFYLTVGTASALAGWAA

||||||||||||:|||||||||||||||||||||||||||||||||||:|||||||||||

orf146ng-1 LGMLQFQGAIYSNAVERMLGTVIGLGAGLGVLWLNQHYFHGNLLFYLTIGTASALAGWAA

orf146-1.pep VGKNGYVPMLAGLTMCMLIGDNGSEWLDSGLMRAMNVLIGAAIAIAAAKLLPLKSTLMWR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146ng-1 VGKNGYVPMLAGLTMCMLIGDNGSEWLDSGLMRAMNVLIGAAIAIAAAKLLPLKSTLMWR

orf146-1.pep FMLADNLADCSKMIAEISNGRRMTRERLEENMAKMRQINARMVKSRSHLAATSGESRISP

|||||||||||||||||||||||||||||:||:|||||||||||||||||||||||||||

orf146ng-1 FMLADNLADCSKMIAEISNGRRMTRERLEQNMVKMRQINARMVKSRSHLAATSGESRISP

orf146-1.pep AMMEAMQHAHRKIVNTTELLLTTAAKLQSPKLNGSEIRLLDRHFTLLQTDLQQTVALING

:|||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||

orf146ng-1 SMMEAMQHAHRKIVNTTELLLTTAAKLQSPKLNGSEIRLLDRHFTLLQTDLQQTAALING

orf146-1.pep RHARRIRIDTAINPELEALAEHLHYQWQGFLWLSTNMRQEISALVILLQRTRRKWLDAHE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf146ng-1 RHARRIRIDTAINPELEALAEHLHYQWQGFLWLSTNMRQEISALVILLQRTRRKWLDAHE

orf146-1.pep RQHLRQSLLETREHGX

||||||||||||||||

orf146ng-1 RQHLRQSLLETREHGX

另外，ORF146ng-1显示出与一种假设的大肠杆菌蛋白同源：

sp|P33011|YEEA_ECOLI COBU-SBMC基因间区域中假设的40.0KD蛋白

＞gi|1736674|gnl|PID|d1016553(D90838)ORF_ID：o348#20；与[SwissProt登录号P33011][大肠杆菌]相似＞gi|1736682|gnl|PID|d1016560(D90839)ORF_ID：o348#20；与[SwissProt登录号P33011][大肠杆菌]相似＞gi|1788318(AE000292)f352；与片段YEEA_ECOLI 100％相同SW：P33011，但C端有附加的203个残基[大肠杆菌]长度＝352

评分＝109位(271)，估计值＝2e-23

相同性＝89/347(25％)，阳性＝150/347(42％)，空隙＝21/347(6％)

询问：20 YRHRRLIHAVRLGGTVLFATALARLLHLQHGEWIGMTVFVVLGMLQFQGAIYSNAVERML 79

YRH R++H R+ L + RL + W +T+ V++G + F G + A ER+

目标：15 YRHYRIVHGTRVALAFLLTFLIIRLFTIPESTWPLVTMVVIMGPISFWGNVVPRAFERIG 74

询问：80 GTVIGLGAGLGVLWLNQHYFHGNLLFYLTIGTASALAGWAAVGKNGYVPMLAGLTMCMLI 139

GTV+G GL L L L + A L GW A+GK Y +L G+T+ +++

目标：75 GTVLGSILGLIALQLE---LISLPLMLVWCAAAMFLCGWLALGKKPYQGLLIGVTLAIVV 131

询问：140 GDNGSEWLDSGLMRAMNVLIGXXXXXXXXKLLPLKSTLMWRFMLADNLADCSKMIAEISN 199

G E +D+ L R+ +V++G + P ++ + WR LA +L + +++ +

目标：132 GSPTGE-IDTALWRSGDVILGSLLAMLFTGIWPQRAFIHWRIQLAKSLTEYNRVYQSAFS 190

询问：200 GRRMTRERLEQNMVKMRQINARMVKSRSHLAATSGESRISPSMMEAMQHAHRKIVNXXXX 259

+ R RLE ++ K+ VK R +A S E+RI S+ E +Q +R +V

目标：191 PNLLERPRLESHLQKLL---TDAVKMRGLIAPASKETRIPKSIYEGIQTINRNLVCMLEL 247

询问：260 XXXXXXXXQSPK---LNGSEIRLLDRHFXXXXXXXXXXAALINGRHARRIRIDTAINPEL 316

+ LN ++R D AL G +N +

目标：248 QINAYWATRPSHFVLLNAQKLR--DTQHMMQQILLSLVHALYEGNPQPVFANTEKLNDAV 305

询问：317 EALAEHL--HYQWQ-------GFLWLSTNMRQEISALVILLQRTRRK 354

E L + L H+ + G++WL+ ++ L L+ R RK

目标：306 EELRQLLNNHHDLKVVETPIYGYVWLNMETAHQLELLSNLICRALRK 352

根据该分析结果(包括鉴定出在此淋球菌中的几个跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例76

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 639>

1 ..GCCGAAGACA CGCGCGTTAC CGCACAGCTT TTGAGCGCGT ACGGCATTCA

51 GGGCAAACTC GTCAGTGTGC GCGAACACAA CGAACGGCAG ATGGCGGACA

101 AGATTGTCGG CTATCTTTCA GACGGCATGG TTGTGGCACA GGTTTCCGAT

151 GCGGGTACGC CGGCCGTGTG CGACCCGGGC GCGAAACTCG CCCGCCGCGT

201 GCGTGAGGCC GGGTTTAAAG TCGTTCCCGT CGTGGGCGCA AC.GCGGTGA

251 TGGCGGCTTT GAGCGTGGCC GGTGTGGAAG GATCCGATTT TTATTTCAAC

301 GGTTTTGTAC CGCCGAAATC GGGAGAACGC AGGAAACTGT TTGCCAAATG

351 GGTGCGGGCG GCGTTTCCTA TCGTCATGTT TGAAACGCCG CACCGCATCG

401 GTGCAGCGCT TGCCGATATG GCGGAACTGT TCCCCGAACG CCGATTAATG

451 CTGGCGCGCG AAATTACGAA AACGTTTGAA ACGTTCTTAA GCGGCACGGT

501 TGGGGAAATT CAGACGGCAT TGTCTGCCGA CGGCGACCAA TCGCGCGGCG

551 AGATGGTGTT GGTGCTTTAT CCGGCGCAGG ATGAAAAACA CGAAGGCTTG

601 TCCGAGTCCG CGCAAAACAT CATGAAAATC CTCACAGCCG AGCTGCCGAC

651 CAAACAGGCG GCGGAGCTTG CTGCCAAAAT CACGGGCGAG GGAAAGAAAG

701 CTTTGTACGA T..

它对应于氨基酸序列<SEQ ID 640；ORF147>：

1 ..AEDTRVTAQL LSAYGIQGKL VSVREHNERQ MADKIVGYLS DGMVVAQVSD

51 AGTPAVCDPG AKLARRVREA GFKVVPVVGA XAVMAALSVA GVEGSDFYFN

101 GFVPPKSGER RKLFAKWVRA AFPIVMFETP HRIGAALADM AELFPERRLM

151 LAREITKTFE TFLSGTVGEI QTALSADGDQ SRGEMVLVLY PAQDEKHEGL

201 SESAQNIMKI LTAELPTKQA AELAAKITGE GKKALYD..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 641>：

1 ATGTTTCAGA AACATTTGCA GAAAGCCTCC GACAGCGTCG TCGGAGGGAC

51 ATTATACGTG GTTGCCACGC CCATCGGCAA TTTGGCGGAC ATTACCCTGC

101 GCGCTTTGGC GGTATTGCAA AAGGCGGACA TCATCTGTGC CGAAGACACG

151 CGCGTTACCG CACAGCTTTT GAGCGCGTAC GGCATTCAGG GCAAACTCGT

201 CAGTGTGCGC GAACACAACG AACGGCAGAT GGCGGACAAG ATTGTCGGCT

251 ATCTTTCAGA CGGCATGGTT GTGGCACAGG TTTCCGATGC GGGTACGCCG

301 GCCGTGTGCG ACCCGGGCGC GAAACTCGCC CGCCGCGTGC GTGAGGCCGG

351 GTTTAAAGTC GTTCCCGTCG TGGGCGCAAG CGCGGTGATG GCGGCTTTGA

401 GCGTGGCCGG TGTGGAAGGA TCCGATTTTT ATTTCAACGG TTTTGTACCG

451 CCGAAATCGG GAGAACGCAG GAAACTGTTT GCCAAATGGG TGCGGGCGGC

501 GTTTCCTATC GTCATGTTTG AAACGCCGCA CCGCATCGGT GCGACGCTTG

551 CCGATATGGC GGAACTGTTC CCCGAACGCC GATTAATGCT GGCGCGCGAA

601 ATTACGAAAA CGTTTGAAAC GTTCTTAAGC GGCACGGTTG GGGAAATTCA

651 GACGGCATTG TCTGCCGACG GCAACCAATC GCGCGGCGAG ATGGTGTTGG

701 TGCTTTATCC GGCGCAGGAT GAAAAACACG AAGGCTTGTC CGAGTCCGCG

751 CAAAACATCA TGAAAATCCT CACAGCCGAG CTGCCGACCA AACAGGCGGC

801 GGAGCTTGCT GCCAAAATCA CGGGCGAGGG AAAGAAAGCT TTGTACGATC

851 TGGCTCTGTC TTGGAAAAAC AAATAG

它对应于氨基酸序列<SEQ ID 642；ORF147-1>：

1 MFQKHLQKAS DSVVGGTLYV VATPIGNLAD ITLRALAVLQ KADIICAEDT

51 RVTAQLLSAY GIQGKLVSVR EHNERQMADK IVGYLSDGMV VAQVSDAGTP

101 AVCDPGAKLA RRVREAGFK V VPVVGASAVM AALSVAGVEG SDFYFNGFVP

151 PKSGERRKLF AKWVRAAFPI VMFETPHRIG ATLADMAELF PERRLMLARE

201 ITKTFETFLS GTVGEIQTAL SADGNQSRGE MVLVLYPAQD EKHEGLSESA

251 QNIMKILTAE LPTKQAAELA AKITGEGKKA LYDLALSWKN K*

该氨基酸序列的计算机分析给出了下列结果：

与大肠杆菌的假设蛋白ORF286(登录号为U18997)的同源性

ORF147和大肠杆菌ORF286蛋白在237个氨基酸的重叠区内显示出有36％的氨基酸相同性：

Orf147：1 AEDTRVTAQLLSAYGIQGKLVSVREHNERQMADKIVGYLSDGMVVAQVSDAGTPAVCDPG 60

AEDTR T LL +GI +L ++ +HNE+Q A+ ++ L +G +A VSDAGTP + DPG

Orf286：43 AEDTRHTGLLLQHFGINARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPG 102

Orf147：61 AKLARRVREXXXXXXXXXXXXXXXXXXXXXXXEGSDFYFNGFVPPKSGERRKLFAKWVRA 120

L R RE F + GF+P KS RR

Orf286：103 YHLVRTCREAGIRVVPLPGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAE 162

Orf147：121 AFPIVMFETPHRIGAALADMAELFPERR-LMLAREITKTFETFLSGTVGEIQTALSADGD 179

++ +E+ HR+ +L D+ + E R ++LARE+TKT+ET VGE+ + D +

Orf286：163 PRTLIFYESTHRLLDSLEDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDEN 222

Orf147：180 QSRGEMVLVLYPAQDEKHEGLSESAQNIMKILTAELPTKQAAELAAKITGEGKKALY 236

+ +GEMVL++ + E L A + +L AELP K+AA LAA+I G K ALY

Orf286：223 RRKGEMVLIV-EGHKAQEEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALY 278

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF147和脑膜炎奈瑟球菌菌株A的ORF75a在237个氨基酸的重叠区内显示出有96.6％的相同性：

10 20 30

orf147.pep AEDTRVTAQLLSAYGIQGKLVSVREHNERQ

||||||||||||||||||||||||||||||

orf75a TLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAYGIQGKLVSVREHNERQ

20 30 40 50 60 70

40 50 60 70 80 90

orf147.pep MADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREAGFK VVPVVGAXAVMAALSVA

|||||||||||||||||||||||||||||||||||||||:|||||||||| |||||||||

orf75a MADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREVGFK VVPVVGASAVMAALSVA

80 90 100 110 120 130

100 110 120 130 140 150

orf 147.pep GVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIVMFETPHRIGAALADMAELFPERRLM

|| ||||||||||||||||||||||||||:|||:|||||||||||:||||||||||||||

orf75a GVAGSDFYFNGFVPPKSGERRKLFAKWVRVAFPVVMFETPHRIGATLADMAELFPERRLM

140 150 160 170 180 190

160 170 180 190 200 210

orf147.pep LAREITKTFETFLSGTVGEIQTALSADGDQSRGEMVLVLYPAQDEKHEGLSESAQNIMKI

||||||||||||||||||||||||:|||:|||||||||||||||||||||||||||||||

orf75a LAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQDEKHEGLSESAQNIMKI

200 210 220 230 240 250

220 230

orf147.pep LTAELPTKQAAELAAKITGEGKKALYD

|||||||||||||||||||||||||||

orf75a LTAELPTKQAAELAAKITGEGKKALYDLALSWKNKX

260 270 280 290

ORF147a与ORF75a相同，它包括ORF75的氨基酸56-292。

与淋病奈瑟球菌的预计ORF的同源性

ORF147和淋病奈瑟球菌的预计ORF(ORF147ng)在237个氨基酸的重叠区内显示出有94.1％的相同性：

orf147.pep AEDTRVTAQLLSAYGIQGKLVSVREHNERQ 30

||||||||||||||||||:|||||||||||

orf147ng TLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAYGIQGRLVSVREHNERQ 85

orf147.pep MADKIVGYLSDGMVVAQVSDAGTPAVCDPGAKLARRVREAGFKVVPVVGAXAVMAALSVA 90

||||::|:||||:||||||||||||||||||||||||||||||||||||| |||||||||

orf147ng MADKVIGFLSDGLVVAQVSDAGTPAVCDPGAKLARRVREAGFKVVPVVGASAVMAALSVA 145

orf147.pep GVEGSDFYFNGFVPPKSGERRKLFAKWVRAAFPIVMFETPHRIGAALADMAELFPERRLM 150

|| |||||||||||||||||||||||||||||:|||||||||||:||||||||||||||

orf147ng GVAESDFYFNGFVPPKSGERRKLFAKWVRAAFPVVMFETPHRIGATLADMAELFPERRLM 205

orf147.pep LAREITKTFETFLSGTVGEIQTALSADGDQSRGEMVLVLYPAQDEKHEGLSESAQNIMKI 210

||||||||||||||||||||||||:|||:|||||||||||||||||||||||||| |||

orf147ng LAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQDEKHEGLSESAQNAMKI 265

orf147.pep LTAELPTKQAAELAAKITGEGKKALYD 237

|:|||||||||||||||||||||||||

orf147ng LAAELPTKQAAELAAKITGEGKKALYDLALSWKNK 300

预计ORF147ng核苷酸序列<SEQ ID 643>编码的蛋白质具有氨基酸序列<SEQ ID644>：

1 MSVFQTAFFM FQKHLQKASD SVVGGTLYVV ATPIGNLADI TLRALAVLQK

51 ADIICAEDTR VTAQLLSAYG IQGRLVSVRE HNERQMADKV IGFLSDGLVV

101 AQVSDAGTPA VCDPGAKLAR RVREAGFK VV PVVGASAVMA ALSVAGVAES

151 DFYFNGFVPP KSGERRKLFA KWVRAAFPVV MFETPHRIGA TLADMAELFP

201 ERRLMLAREI TKTFETFLSG TVGEIQTALA ADGNQSRGEM VLVLYPAQDE

251 KHEGLSESAQ NAMKILAAEL PTKQAAELAA KITGEGKKAL YDLALSWKNK

301 *

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 645>：

1 ATGTTTCAGA AACACTTGCA GAAAGCCTCC GACAGCGTCG TCGGAGGGAC

51 ATTATACGTG GTTGCCACGC CCATCGGCAA TTTGGCAGAC ATTACCCTGC

101 GCGCTTTGGC GGTATTGCAA AAGGCGGACA TCATTTGTGC CGAAGACACG

151 CGCGTTACTG CGCAGCTTTT GAGCGCGTAC GGCATTCAGG GCAGGTTGGT

201 CAGTGTGCGC GAACACAACG AGCGGCAGAT GGCGGACAAG GTAATCGGTT

251 TCCTTTCAGA CGGCCTGGTT GTGGCGCAGG TTTCCGATGC GGGTACGCCG

301 GCCGTGTGCG ACCCGGGCGC GAAACTCGCC CGCCGCGTGC GCGAAGCAGG

351 GTTCAAAGTC GTTCCCGTCG TGGGCGCAAG CGCGGTAATG GCGGCGTTGA

401 GTGTGGCCGG TGTGGCGGAA TCCGATTTTT ATTTCAACGG TTTTGTACCG

451 CCGAAATCGG GCGAACGTAG GAAATTGTTT GCCAAATGGG TGCGGGCGGC

501 ATTTCCTGTC GTCATGTTTG AAACGCCGCA CCGAATCGGG GCAACGCTTG

551 CCGATATGGC GGAATTGTTC CCCGAACGCC GTCTGATGCT GGCGCGCGAA

601 ATCACGAAAA CGTTTGAAAC GTTCTTAAGC GGCACGGTTG GGGAAATTCA

651 GACGGCATTG GCGGCGGACG GCAACCAATC GCGCGGCGAG ATGGTGTTGG

701 TGCTTTATCC GGCGCAGGAT GAAAAACACG AAGGCTTGTC CGAGTCTGCG

751 CAAAATGCGA TGAAAATCCT TGCGGCCGAG CTGCCGACCA AGCAGGCGGC

801 GGAGCTTGCC GCCAAGATTA CAGGTGAGGG CAAAAAGGCT TTGTACGATT

851 TGGCACTGTC GTGGAAAAAC AAATGA

它对应于氨基酸序列<SEQ ID 646；ORF147ng-1>：

1 MFQKHLQKAS DSVVGGTLYV VATPIGNLAD ITLRALAVLQ KADIICAEDT

51 RVTAQLLSAY GIQGRLVSVR EHNERQMADK VIGFLSDGLV VAQVSDAGTP

101 AVCDPGAKLA RRVREAGFK V VPVVGASAVM AALSVAGVAE SDFYFNGFVP

151 PKSGERRKLF AKWVRAAFPV VMFETPHRIG ATLADMAELF PERRLMLARE

201 ITKTFETFLS GTVGEIQTAL AADGNQSRGE MVLVLYPAQD EKHEGLSESA

251 QNAMKILAAE LPTKQAAELA AKITGEGKKA LYDLALSWKN K*

ORF147ng显示出与一种假设的大肠杆菌蛋白同源：

sp|P45528|YRAL_ECOLI AGAI-MTR基因间区域中假设的31.3KD蛋白(F286)

＞gi|606086(U18997)ORF_f286[大肠杆菌]

＞gi|1789535(AE000395)agai-mtr基因间区域中假设的31.3 kD蛋白[大肠杆菌]长度＝286

评分＝218位(550)，估计值＝3e-56

相同性＝128/284(45％)，阳性＝171/284(60％)，空隙＝4/284(1％)

询问：4 KHLQKASDSVVGGTLYVVATPIGNLADITLRALAVLQKADIICAEDTRVTAQLLSAYGIQ 63

K Q A +S G LY+V TPIGNLADIT RAL VLQ D+I AEDTR T LL +GI

目标：2 KQHQSADNSQ--GQLYIVPTPIGNLADITQRALEVLQAVDLIAAEDTRHTGLLLQHFGIN 59

询问：64 GRLVSVREHNERQMADKVIGFLSDGLVVAQVSDAGTPAVCDPGAKLARRVREAGFKVVPV 123

RL ++ +HNE+Q A+ ++ L +G +A VSDAGTP + DPG L R REAG +VVP+

目标：60 ARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPGYHLVRTCREAGIRVVPL 119

询问：124 VGASAVMAALSVAGVAESDFYFNGFVPPKSGERRKLFAKWVRAAFPVVMFETPHRIGATL 183

G A + ALS AG+ F + GF+P KS RR ++ +E+ HR+ +L

目标：120 PGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAEPRTLIFYESTHRLLDSL 179

询问：184 ADMAELFPERR-LMLAREITKTFETFLSGTVGEIQTALAADGNQSRGEMVLVLYPAQDEK 242

D+ + E R ++LARE+TKT+ET VGE+ + D N+ +GEMVL++ +

目标：180 EDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDENRRKGEMVLIV-EGHKAQ 238

询问：243 HEGLSESAQNAMKILAAELPTKQAAELAAKITGEGKKALYDLAL 286

E L A + +L AELP K+AA LAA+I G K ALY AL

目标：239 EEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALYKYAL 282

根据计算机的分析以及淋球菌蛋白中存在一个推定跨膜结构域，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例77

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 647>

1 ATGAAAACAA CCGACAAACG GACAACCGAA ACACACCGCA AAGCCCCGAA

51 AACCGGTCGC ATCCGCTTCT C.GCTGCTTA CTTAGCCATA TGCCTGTCGT

101 TCGGCATTCT TCCCCAAGCC TGGGCGGGAC ACACTTATTT CGGCATCAAC

151 TACCAATACT ATCGCGACTT TGCCGAAAAT AAAGGCAAGT TTGCAGTCGG

201 GGCGAAAGAT ATTGAGGTTT ACAACAAAAA AGGGGAGTTG GTCGGCAAAT

251 CAATGACAAA AGCCCCGATG ATTGATTTTT CTGTGGTGTC GCGTAACGGC

301 GTGGCGGcAT TGGTGGGCGt A

CAATATAT TGTGAGCGTG GCACATAACG

351 GCGGCTATAA CAACGTTGAT TTTGGTGCGG AAGGAAk.AA tATCCC.GAT

401 CAACAwCGww TTACTTATAA AATTGTGAAA CGGAATAATT ATAAAGCAGG

451 GACTAAAGGC CATCCTTATG GCGGCGATTA TCATATGCCG CGTTTGCATA

501 AATwTGTCAC AGATGCAGAA CCTGTTGAAA TGACCAGTTA TATGGATGGG

551 CGGAAATATA TCGATCAAAA TAATTACCCT GACCGTGTTC GTATTGGGGC

601 AGGCAGGCAA TATTGGCGAT CTGATGAAGA TGAGCCCAAT AACCGCGAAA

651 GTTCATATCA TATTGCAAGT .......... .......... ..........

701 .......... .....GGCTC ACCAATGTTT ATCTATGATG CCCAAAAGCA

751 AAAGTGGTTA ATTAATGGGG TATTGCAAAC GGGCAACCCC TATATAGGAA

801 AAAGCAATGG CTTCCAGCTG GTTCGTAAAG ATTGGTTCTA TGATGAAATC

851 TTTGCTGGAG ATACCCATTC AGTATTCTAC GAACCACGTC AAAATGGGAA

901 ATACTCTTTT AACGACGATA ATAATGGCAC AGGAAAAATC AATGCCAAAC

951 ATGAACACAA TTCTCTGCCT AATAGATTAA AAACACGAAC CGTTCAATTG

1001 TTTAATGTTT CTTTATCCGA GACAGCAAGA GAACCTGTTT ATCATGCTGC

1051 AGGTGGTGTC AACAGTTATC GACCCAGACT GAATAATGGA GAAAATATTT

1101 CCTTTATTGA CGAAGGAAAA GGCGAATTGA TACTTACCAG CAACATCAAT

1151 CAAGGTGCTG GAGGATTATA TTTCCAAGGA GATTTTACGG TCTCGCCTGA

1201 AAATAACGAA ACTTGGCAAG GCGCGGGCGT TCATATCAGT GAAGACAGTA

1251 CCGTTACTTG GAAAGTAAAC GGCGTGGCAA ACGACCGCCT GTCCAAAATC

1301 GGCAAAGGCA CGCTG..... .......... .......... ..........

//

2101 .......... .......... .......... .......... ...GATAAAG

2151 TGACTGCTTC ATTGACTAAG ACCGACATCA GCGGCAATGT CGATCTTGCC

2201 GATCACGCTC ATTTAAATCT CACAGGGCTT GCCACACTCA ACGGCAATCT

2251 TAGTGCAAAT GGCGATACAC GTTATACAGT CAGCCACAAC GCCACCCAAA

2301 ACGGCAACCk TAgCCtCGtG G.sAATGcCC AAGCAACATT TAATCAAGCC

2351 ACATTAAACG GCAACACATC GGCTTCgGGC AATGCTTCAT TTAATCTAAG

2401 CGACCACGCC GTACAAAACG GCAGTCTGAC GCTTTCCGGC AACGCTAAGG

2451 CAAACGTAAG CCATTCCGCA CTCAACGGTA ATGTCTCCCT AGCCGATAAG

2501 GCAGTATTCC ATTTTGAAAG CAGCCGCTTT ACCGGACAAA TCAGCGGCGG

2551 CAagGATACG GCATTACACT TAAAAGACAG CGAATGGACG CTGCCGTCAg

2601 GarCGGAATT AGGCAATTTA AACCTTGACA ACGCCACCAT TACaCTCAAT

2651 TCCGCCTATC GCCACGATGC GGCAGGGGCG CAAACCGGCA GTGCGACAGA

2701 TGCGCCGCGC CGCCGTTCGC GCCGTTCGCG CCGTTCCCTA TTATmCGTTA

2751 CACCGCCAAC TTCGGTAGAA TCCCGTTTCA ACACGCTGAC GGTAAACGGC

2801 AAATTGAACG GTCAGGGAAC ATTCCGCTTT ATGTCGGAAC TCTTCGGCTA

2851 CCGCAGCGAC AAATTGAAGC TGGCGGAAAG TTCCGAAGGC ACTTACACCT

2901 TGGCGGTCAA CAATACCGGC AACGAACCTG CAAGCCTCGA ACAATTGACG

2951 GTAGTGGAAG GAAAAGACAA CAAACCGCTG TCCGAAAACC TTAATTTCAC

3001 CCTGCAAAAC GAACACGTCG ATGCAGGCGC GTGG...... ..........

//

3551 .......... .......... ....TTAGAC CGCGTATTTG CCGAAGACCG

3601 CCGCAACGCC GTTTGGACAA GCGGCATCCG GGACACCAAA CACTACCGTT

3651 CGCAAGATTT CCGCGCCTAC CGCCAACAAA CCGACCTGCG CCAAATCGGT

3701 ATGCAGAAAA ACCTCGGCAG CGGGCGCGTC GGCATCCTGT TTTCGCACAA

3751 CCGGACCGAA AACACCTTCG ACGACGGCAT CGGCAACTCG GCACGGCTTG

3801 CCCACGGCGC CGTTTTCGGG CAATACGGCA TCGACAGGTT CTACATCGGC

3851 ATCAG

CGCG GGCGCGGGTT TTAGCAGCGG CAGCCTTTGA GACGGCATCG

3901 GAGsmAAAwT CCGCCGCCGC GTGCtGCATT ACGGCATTCA GGCACGAtAC

3951 CGCGCCGgtt tCggCGgATt CGGCATCGAA CCGCACATCG GCGCAACGCg

4001 ctATTTCGTC CAAAAAGCGG ATTACCGCTA CGAAAACGTC AATATCGCCA

4051 CCCCCGGCCT TGCATTCAAC CGcTACCGCG CGGGCATTAa GGCAGATTAT

4101 TCATTCAAAC CGGCGCAACA CATTTCCATC ACGCCTTATT TGAGCCTGTC

4151 CTATACCGAT GCCGCTTCGG GCAAAGTCCG AACACGCGTC AATACCGCCG

4201 TATTGGCTCA GGATTTCGGC AAAACCCGCA GTGCGGAATG GGgCGTAAAC

4251 GCCGAAATCA AAGGTTTCAC GCTGTCCCTC CACGCTGCCG CCGCCAAAGG

4301 CCCGCAACTG GAAGCGCAAC ACAGCGCGGG CATCAAATTA GGCTACCGCT

4351 GGTAA...

它对应于氨基酸序列<SEQ ID 648；ORF1>：

1 MKTTDKRTTE THRKAPKTGR IRFXAAYLAI CLSFGILPQA WAGHTYFGIN

51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG

101 VAALVGVQYI VSVAHNGGYN NVDFGAEGXN IXDQXRXTYK IVKRNNYKAG

151 TKGHPYGGDY HMPRLHKXVT DAEPVEMTSY MDGRKYIDQN NYPDRVRIGA

201 GRQYWRSDED EPNNRESSYH IAS....... ........GS PMFIYDAQKQ

251 KWLINGVLQT GNPYIGKSNG FQLVRKDWFY DEIFAGDTHS VFYEPRQNGK

301 YSFNDDNNGT GKINAKHEHN SLPNRLKTRT VQLFNVSLSE TAREPVYHAA

351 GGVNSYRPRL NNGENISFID EGKGELILTS NINQGAGGLY FQGDFTVSPE

401 NNETWQGAGV HISEDSTVTW KVNGVANDRL SKIGKGTL.. ..........

//

701 .......... ....DKVTAS LTKTDISGNV DLADHAHLNL TGLATLNGNL

751 SANGDTRYTV SHNATQNGNX SLVXNAQATF NQATLNGNTS ASGNASFNLS

801 DHAVQNGSLT LSGNAKANVS HSALNGNVSL ADKAVFHFES SRFTGQISGG

851 KDTALHLKDS EWTLPSGXEL GNLNLDNATI TLNSAYRHDA AGAQTGSATD

901 APRRRSRRSR RSLLXVTPPT SVESRFNTLT VNGKLNGQGT FRFMSELFGY

951 RSDKLKLAES SEGTYTLAVN NTGNEPASLE QLTVVEGKDN KPLSENLNFT

1001 LQNEHVDAGA W......... .......... .......... ..........

//

1151 .......... .......... .......... .......... .LDRVFAEDR

1201 RNAVWTSGIR DTKHYRSQDF RAYRQQTDLR QIGMQKNLGS GRVGILFSHN

1251 RTENTFDDGI GNSARLAHGA VFGQYGIDRF YIGISAGAGF SSGSLSDGIG

1301 XKXRRRVLHY GIQARYRAGF GGFGIEPHIG ATRYFVQKAD YRYENVNIAT

1351 PGLAFNRYRA GIKADYSFKP AQHISITPYL SLSYTDAASG KVRTRVNTAV

1401 LAQDFGKTRS AEWGVNAEIK GFTLSLHAAA AKGPQLEAQH SAGIKLGYRW

1451 *

进一步的序列分析揭示了全部的核苷酸序列<SEQ ID 649>：

1 ATGAAAACAA CCGACAAACG GACAACCGAA ACACACCGCA AAGCCCCGAA

51 AACCGGCCGC ATCCGCTTCT CGCCTGCTTA CTTAGCCATA TGCCTGTCGT

101 TCGGCATTCT TCCCCAAGCC TGGGCGGGAC ACACTTATTT CGGCATCAAC

151 TACCAATACT ATCGCGACTT TGCCGAAAAT AAAGGCAAGT TTGCAGTCGG

201 GGCGAAAGAT ATTGAGGTTT ACAACAAAAA AGGGGAGTTG GTCGGCAAAT

251 CAATGACAAA AGCCCCGATG ATTGATTTTT CTGTGGTGTC GCGTAACGGC

301 GTGGCGGCAT TGGTGGGCGA TCAATATATT GTGAGCGTGG CACATAACGG

351 CGGCTATAAC AACGTTGATT TTGGTGCGGA AGGAAGAAAT CCCGATCAAC

401 ATCGTTTTAC TTATAAAATT GTGAAACGGA ATAATTATAA AGCAGGGACT

451 AAAGGCCATC CTTATGGCGG CGATTATCAT ATGCCGCGTT TGCATAAATT

501 TGTCACAGAT GCAGAACCTG TTGAAATGAC CAGTTATATG GATGGGCGGA

551 AATATATCGA TCAAAATAAT TACCCTGACC GTGTTCGTAT TGGGGCAGGC

601 AGGCAATATT GGCGATCTGA TGAAGATGAG CCCAATAACC GCGAAAGTTC

651 ATATCATATT GCAAGTGCGT ATTCTTGGCT CGTTGGTGGC AATACCTTTG

701 CACAAAATGG ATCAGGTGGT GGCACAGTCA ACTTAGGTAG TGAAAAAATT

751 AAACATAGCC CATATGGTTT TTTACCAACA GGAGGCTCAT TTGGCGACAG

801 TGGCTCACCA ATGTTTATCT ATGATGCCCA AAAGCAAAAG TGGTTAATTA

851 ATGGGGTATT GCAAACGGGC AACCCCTATA TAGGAAAAAG CAATGGCTTC

901 CAGCTGGTTC GTAAAGATTG GTTCTATGAT GAAATCTTTG CTGGAGATAC

951 CCATTCAGTA TTCTACGAAC CACGTCAAAA TGGGAAATAC TCTTTTAACG

1001 ACGATAATAA TGGCACAGGA AAAATCAATG CCAAACATGA ACACAATTCT

1051 CTGCCTAATA GATTAAAAAC ACGAACCGTT CAATTGTTTA ATGTTTCTTT

1101 ATCCGAGACA GCAAGAGAAC CTGTTTATCA TGCTGCAGGT GGTGTCAACA

1151 GTTATCGACC CAGACTGAAT AATGGAGAAA ATATTTCCTT TATTGACGAA

1201 GGAAAAGGCG AATTGATACT TACCAGCAAC ATCAATCAAG GTGCTGGAGG

1251 ATTATATTTC CAAGGAGATT TTACGGTCTC GCCTGAAAAT AACGAAACTT

1301 GGCAAGGCGC GGGCGTTCAT ATCAGTGAAG ACAGTACCGT TACTTGGAAA

1351 GTAAACGGCG TGGCAAACGA CCGCCTGTCC AAAATCGGCA AAGGCACGCT

1401 GCACGTTCAA GCCAAAGGGG AAAACCAAGG CTCGATCAGC GTGGGCGACG

1451 GTACAGTCAT TTTGGATCAG CAGGCAGACG ATAAAGGCAA AAAACAAGCC

1501 TTTAGTGAAA TCGGCTTGGT CAGCGGCAGG GGTACGGTGC AACTGAATGC

1551 CGATAATCAG TTCAACCCCG ACAAACTCTA TTTCGGCTTT CGCGGCGGAC

1601 GTTTGGATTT AAACGGGCAT TCGCTTTCGT TCCACCGTAT TCAAAATACC

1651 GATGAAGGGG CGATGATTGT CAACCACAAT CAAGACAAAG AATCCACCGT

1701 TACCATTACA GGCAATAAAG ATATTGCTAC AACCGGCAAT AACAACAGCT

1751 TGGATAGCAA AAAAGAAATT GCCTACAACG GTTGGTTTGG CGAGAAAGAT

1801 ACGACCAAAA CGAACGGGCG GCTCAACCTT GTTTACCAGC CCGCCGCAGA

1851 AGACCGCACC CTGCTGCTTT CCGGCGGAAC AAATTTAAAC GGCAACATCA

1901 CGCAAACAAA CGGCAAACTG TTTTTCAGCG GCAGACCAAC ACCGCACGCC

1951 TACAATCATT TAAACGACCA TTGGTCGCAA AAAGAGGGCA TTCCTCGCGG

2001 GGAAATCGTG TGGGACAACG ACTGGATCAA CCGCACATTT AAAGCGGAAA

2051 ACTTCCAAAT TAAAGGCGGA CAGGCGGTGG TTTCCCGCAA TGTTGCCAAA

2101 GTGAAAGGCG ATTGGCATTT GAGCAATCAC GCCCAAGCAG TTTTTGGTGT

2151 CGCACCGCAT CAAAGCCACA CAATCTGTAC ACGTTCGGAC TGGACGGGTC

2201 TGACAAATTG TGTCGAAAAA ACCATTACCG ACGATAAAGT GATTGCTTCA

2251 TTGACTAAGA CCGACATCAG CGGCAATGTC GATCTTGCCG ATCACGCTCA

2301 TTTAAATCTC ACAGGGCTTG CCACACTCAA CGGCAATCTT AGTGCAAATG

2351 GCGATACACG TTATACAGTC AGCCACAACG CCACCCAAAA CGGCAACCTT

2401 AGCCTCGTGG GCAATGCCCA AGCAACATTT AATCAAGCCA CATTAAACGG

2451 CAACACATCG GCTTCGGGCA ATGCTTCATT TAATCTAAGC GACCACGCCG

2501 TACAAAACGG CAGTCTGACG CTTTCCGGCA ACGCTAAGGC AAACGTAAGC

2551 CATTCCGCAC TCAACGGTAA TGTCTCCCTA GCCGATAAGG CAGTATTCCA

2601 TTTTGAAAGC AGCCGCTTTA CCGGACAAAT CAGCGGCGGC AAGGATACGG

2651 CATTACACTT AAAAGACAGC GAATGGACGC TGCCGTCAGG CACGGAATTA

2701 GGCAATTTAA ACCTTGACAA CGCCACCATT ACACTCAATT CCGCCTATCG

2751 CCACGATGCG GCAGGGGCGC AAACCGGCAG TGCGACAGAT GCGCCGCGCC

2801 GCCGTTCGCG CCGTTCGCGC CGTTCCCTAT TATCCGTTAC ACCGCCAACT

2851 TCGGTAGAAT CCCGTTTCAA CACGCTGACG GTAAACGGCA AATTGAACGG

2901 TCAGGGAACA TTCCGCTTTA TGTCGGAACT CTTCGGCTAC CGCAGCGACA

2951 AATTGAAGCT GGCGGAAAGT TCCGAAGGCA CTTACACCTT GGCGGTCAAC

3001 AATACCGGCA ACGAACCTGC AAGCCTCGAA CAATTGACGG TAGTGGAAGG

3051 AAAAGACAAC AAACCGCTGT CCGAAAACCT TAATTTCACC CTGCAAAACG

3101 AACACGTCGA TGCCGGCGCG TGGCGTTACC AACTCATCCG CAAAGACGGC

3151 GAGTTCCGCC TGCATAATCC GGTCAAAGAA CAAGAGCTTT CCGACAAACT

3201 CGGCAAGGCA GAAGCCAAAA AACAGGCGGA AAAAGACAAC GCGCAAAGCC

3251 TTGACGCGCT GATTGCGGCC GGGCGCGATG CCGTCGAAAA GACAGAAAGC

3301 GTTGCCGAAC CGGCCCGGCA GGCAGGCGGG GAAAATGTCG GCATTATGCA

3351 GGCGGAGGAA GAGAAAAAAC GGGTGCAGGC GGATAAAGAC ACCGCCTTGG

3401 CGAAACAGCG CGAAGCGGAA ACCCGGCCGG CTACCACCGC CTTCCCCCGC

3451 GCCCGCCGCG CCCGCCGGGA TTTGCCGCAA CTGCAACCCC AACCGCAGCC

3501 CCAACCGCAG CGCGACCTGA TCAGCCGTTA TGCCAATAGC GGTTTGAGTG

3551 AATTTTCCGC CACGCTCAAC AGCGTTTTCG CCGTACAGGA CGAATTAGAC

3601 CGCGTATTTG CCGAAGACCG CCGCAACGCC GTTTGGACAA GCGGCATCCG

3651 GGACACCAAA CACTACCGTT CGCAAGATTT CCGCGCCTAC CGCCAACAAA

3701 CCGACCTGCG CCAAATCGGT ATGCAGAAAA ACCTCGGCAG CGGGCGCGTC

3751 GGCATCCTGT TTTCGCACAA CCGGACCGAA AACACCTTCG ACGACGGCAT

3801 CGGCAACTCG GCACGGCTTG CCCACGGCGC CGTTTTCGGG CAATACGGCA

3851 TCGACAGGTT CTACATCGGC ATCAGCGCGG GCGCGGGTTT TAGCAGCGGC

3901 AGCCTTTCAG ACGGCATCGG AGGCAAAATC CGCCGCCGCG TGCTGCATTA

3951 CGGCATTCAG GCACGATACC GCGCCGGTTT CGGCGGATTC GGCATCGAAC

4001 CGCACATCGG CGCAACGCGC TATTTCGTCC AAAAAGCGGA TTACCGCTAC

4051 GAAAACGTCA ATATCGCCAC CCCCGGCCTT GCATTCAACC GCTACCGCGC

4101 GGGCATTAAG GCAGATTATT CATTCAAACC GGCGCAACAC ATTTCCATCA

4151 CGCCTTATTT GAGCCTGTCC TATACCGATG CCGCTTCGGG CAAAGTCCGA

4201 ACACGCGTCA ATACCGCCGT ATTGGCTCAG GATTTCGGCA AAACCCGCAG

4251 TGCGGAATGG GGCGTAAACG CCGAAATCAA AGGTTTCACG CTGTCCCTCC

4301 ACGCTGCCGC CGCCAAAGGC CCGCAACTGG AAGCGCAACA CAGCGCGGGC

4351 ATCAAATTAG GCTACCGCTG GTAA

它对应于氨基酸序列<SEQ ID 650；ORF1-1>：

1 MKTTDKRTTE THRKAPKTGR IRFSPAYLAI CLSFGILPQA WAGHTYFGIN

51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG

101 VAALVGDQYI VSVAHNGGYN NVDFGAEGRN PDQHRFTYKI VKRNNYKAGT

151 KGHPYGGDYH MPRLHKFVTD AEPVEMTSYM DGRKYIDQNN YPDRVRIGAG

201 RQYWRSDEDE PNNRESSYHI ASAYSWLVGG NTFAQNGSGG GTVNLGSEKI

251 KHSPYGFLPT GGSFGDSGSP MFIYDAQKQK WLINGVLQTG NPYIGKSNGF

301 QLVRKDWFYD EIFAGDTHSV FYEPRQNGKY SFNDDNNGTG KINAKHEHNS

351 LPNRLKTRTV QLFNVSLSET AREPVYHAAG GVNSYRPRLN NGENISFIDE

401 GKGELILTSN INQGAGGLYF QGDFTVSPEN NETWQGAGVH ISEDSTVTWK

451 VNGVANDRLS KIGKGTLHVQ AKGENQGSIS VGDGTVILDQ QADDKGKKQA

501 FSEIGLVSGR GTVQLNADNQ FNPDKLYFGF RGGRLDLNGH SLSFHRIQNT

551 DEGAMIVNHN QDKESTVTIT GNKDIATTGN NNSLDSKKEI AYNGWFGEKD

601 TTKTNGRLNL VYQPAAEDRT LLLSGGTNLN GNITQTNGKL FFSGRPTPHA

651 YNHLNDHWSQ KEGIPRGEIV WDNDWINRTF KAENFQIKGG QAVVSRNVAK

701 VKGDWHLSNH AQAVFGVAPH QSHTICTRSD WTGLTNCVEK TITDDKVIAS

751 LTKTDISGNV DLADHAHLNL TGLATLNGNL SANGDTRYTV SHNATQNGNL

801 SLVGNAQATF NQATLNGNTS ASGNASFNLS DHAVQNGSLT LSGNAKANVS

851 HSALNGNVSL ADKAVFHFES SRFTGQISGG KDTALHLKDS EWTLPSGTEL

901 GNLNLDNATI TLNSAYRHDA AGAQTGSATD APRRRSRRSR RSLLSVTPPT

951 SVESRFNTLT VNGKLNGQGT FRFMSELFGY RSDKLKLAES SEGTYTLAVN

1001 NTGNEPASLE QLTVVEGKDN KPLSENLNFT LQNEHVDAGA WRYQLIRKDG

1051 EFRLHNPVKE QELSDKLGKA EAKKQAEKDN AQSLDALIAA GRDAVEKTES

1101 VAEPARQAGG ENVGIMQAEE EKKRVQADKD TALAKQREAE TRPATTAFPR

1151 ARRARRDLPQ LQPQPQPQPQ RDLISRYANS GLSEFSATLN SVFAVQDELD

1201 RVFAEDRRNA VWTSGIRDTK HYRSQDFRAY RQQTDLRQIG MQKNLGSGRV

1251 GILFSHNRTE NTFDDGIGNS ARLAHGAVFG QYGIDRFYIG ISAGAGFSSG

1301 SLSDGIGGKI RRRVLHYGIQ ARYRAGFGGF GIEPHIGATR YFVQKADYRY

1351 ENVNIATPGL AFNRYRAGIK ADYSFKPAQH ISITPYLSLS YTDAASGKVR

1401 TRVNTAVLAQ DFGKTRSAEW GVNAEIKGFT LSLHAAAAKG PQLEAQHSAG

1451 IKLGYRW*

这些序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF1和脑膜炎奈瑟球菌菌株A的ORF(ORF1a)在1456个氨基酸的重叠区内显示出有57.8％的相同性：

10 20 30 40 50 60

orf1.pep MKTTDKRTTETHRKAPKTGR IRFXAAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN

||||||||||||||||||||||| |||||||||||||||||||||||||||||||||||

orf1a MKTTDKRTTETHRKAPKTGR IRFSPAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN

10 20 30 40 50 60

70 80 90 100 110 120

orf1.pep KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGVQYIVSVAHNGGYN

|||||||||||||||||||||||||||||||||||||||||||||| |||||||||||||

orf1a KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYN

70 80 90 100 110 120

130 140 150 160 170 180

orf1.pep NVDFGAEGXNIXDQXRXTYKIVKRNNYKAGTKGHPYGGDYHMPRLHKXVTDAEPVEMTSY

|||||||||| || | :|:|||||||| :: |||:|| ||||||| |||||||||||

orf1a NVDFGAEGXN-PDQHRFSYQIVKRNNYKPDNS-HPYNGDXHMPRLHKFVTDAEPVEMTSD

130 140 150 160 170

190 200 210

orf1.pep MDGRKYIDQNNYPDRVRIGAGRQYWRSDEDEP---------------------NN-----

| | | |:::||:|||||:|::||| |:|: ||

orf1a MRGNTYSDKEKYPERVRIGSGHHYWRYDDDKHGDLSYSGAWLIGGNTHMQGWGNNGVXSL

180 190 200 210 220 230

220 230 240 250 260

orf1.pep ----RESSYH----IA-----SGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRK

|::: : || ||||||||| ::|||:||||||| || |: |||||:||

orf1a SGDVRHANDYGPMPIAGAAGDSGSPMFIYDKTNNKWLLNGVLQTGYPYSGRENGFQLIRK

240 250 260 270 280 290

270 280 290 300 310 320

orf1.pep DWFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRTVQLFNV

|||||:|: ||||:| :|||:||::||:::||||| :: :|: | | :||::||:||:

orf1a DWFYDDIYRGDTHTVXFEPRSNGHFSFTSNNNGTGTVTETNEKVSNP-KLKVQTVRLFDE

300 310 320 330 340 350

330 340 350 360 370 380

orf1.pep SLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKGELILTSNINQGAGGLYFQGDFT

||:|||:|||| ||||||:||||||||||:|||| |:|:|||::|||||||||||:||||

orf1a SLNETDKEPVY-AAGGVNQYRPRLNNGENLSFIDYGNGKLILSNNINQGAGGLYFEGDFT

360 370 380 390 400 410

390 400 410 420 430

orf1.pep VSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTL------------------

||||||||||||||||||||||||||||||||||||||||||

orf1a VSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSISVGDGT

420 430 440 450 460 470

orf1.pep ------------------------------------------------------------

orf1a VILDQQADDKGKKQAFSEIGLXSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGHSLSFH

480 490 500 510 520 530

orf1.pep ------------------------------------------------------------

orf1a RIQNTDEGAMIXXHNATTTSTVTITGNESITQPSGKNINRLNYSKEIAYNGWFGEKDTTK

540 550 560 570 580 590

orf1.pep ------------------------------------------------------------

orf1a TNGRLNLVYQPAAEDRTXLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLGSGWSKMEG

600 610 620 630 640 650

orf1.pep ------------------------------------------------------------

orf1a IPQGEIVWDNDWIXRTFKAENFHIQGGQAVISRNVAKVEGDXHLSNHAQAVFGVAPHQSH

660 670 680 690 700 710

440 450 460 470 480

orf1.pep ----------------XXXXXDKVTASLTKTDISGNVDLADHAHLNLTGLATLNGNLSAN

: || : ||| ||||||| || | | |:| |:| ||||||

orf1a TICTRSDWTGLTNCVEXXITDDKVIASLTKTDXSGXVXLXXXXXXXLXGXAXLXGNLSAN

720 730 740 750 760 770

490 500 510 520 530 540

orf1.pep GDTRYTVSHNATQNGNXSLVXNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSG

|||||||||||||||| ||| ||||||||||||||:| |||||||||::|:||||||||

orf 1a GDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNXSXSGNASFNLSNNAAQNGSLTLSD

780 790 800 810 820 830

550 560 570 580 590 600

orf1.pep NAKANVSHSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSGXELGNL

||||||||||||||||||||||||||:||||||:||:| |||||||||||||||:|||||

orf1a NAKANVSHSALNGNVSLADKAVFHFENSRFTGQLSGSKXTALHLKDSEWTLPSGTELGNL

840 850 860 870 880 890

610 620 630 640 650 660

orf1.pep NLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRSLLXVTPPTSVESRFNTLTVNG

||||||||||||||||||||||| ::|:|||||||| || ||||||||||||||||||

orf1a NLDNATITLNSAYRHDAAGAQTGXVSDTPRRRSRRS---LLSVTPPTSVESRFNTLTVNG

900 910 920 930 940 950

670 680 690 700 710 720

orf1.pep KLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKDNKPL

||| |||||||||||||||||||||||||||||||||||||||:||:|||||||||||||

orf1a KLNXQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPVSLDQLTVVEGKDNKPL

960 970 980 990 1000 1010

730 740 750

orf1.pep SENLNFTLQNEHVDAGAW------------------------------------------

||||||||||||||||||

orf1a SENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQS

1020 1030 1040 1050 1060 1070

orf1.pep ------------------------------------------------------------

orf1a LDALIAAGRDAAEKTESVAEPARXAGGENVGIMQAEEEKKRVQADKDSALAKQREAETRP

1080 1090 1100 1110 1120 1130

760

orf1.pep ---------------------------------------------------------LDR

|||

orf1a XTTAFPRARXARRDLPQPQPQPQPQPQPQRDLXSRYANSGLSEFSATLNSVFAVQDELDR

1140 1150 1160 1170 1180 1190

770 780 790 800 810 820

orf1.pep VFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFSHNRTEN

||||||||||||| || |||||||||||||||||||||||||||||||||||||||||||

orf1a VFAEDRRNAVWTSXIRXTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFSHNRTEN

1200 1210 1220 1230 1240 1250

830 840 850 860 870 880

orf1.pep TFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGXKXRRRVLHYGIQA

:|||||||||||||||||||||| || ||||:||||||| |||||||| |||||||||||

orf1a XFDDGIGNSARLAHGAVFGQYGIGRFDIGISTGAGFSSGXLSDGIGGKIRRRVLHYGIQA

1260 1270 1280 1290 1300 1310

890 900 910 920 930 940

orf1.pep RYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHI

|||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf1a RYRAGFGGFGIEPYIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHX

1320 1330 1340 1350 1360 1370

950 960 970 980 990 1000

orf1.pep SITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSLHAAAAKGP

||||| ||||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf1a SITPYXSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSXHAAAAKGP

1380 1390 1400 1410 1420 1430

1010 1020

orf1.pep QLEAQHSAGIKLGYRWX

|||||||||||||||||

orf1a QLEAQHSAGIKLGYRWX

1440 1450

全长ORF1a核苷酸序列<SEQ ID 651>是：

1 ATGAAAACAA CCGACAAACG GACAACCGAA ACACACCGCA AAGCCCCGAA

51 AACCGGCCGC ATCCGCTTCT CGCCTGCTTA CTTAGCCATA TGCCTGTCGT

101 TCGGCATTCT TCCCCAAGCT TGGGCGGGAC ACACTTATTT CGGCATCAAC

151 TACCAATACT ATCGCGACTT TGCCGAAAAT AAAGGCAAGT TTGCAGTCGG

201 GGCGAAAGAT ATTGAGGTNT ACAACAAAAA AGGGGAGTTG GTCGGCAAAT

251 CAATGACAAA AGCCCCGATG ATTGATTTTT CTGTGGTGTC GCGTAACGGC

301 GTGGCGGCAT TGGTGGGCGA TCAATATATT GTGAGCGTGG CACATAACGG

351 CGGCTATAAC AACGTTGATT TTGGTGCGGA AGGAAGNAAT CCCGATCAGC

401 ACCGTTTTTC TTACCAAATT GTGAAAAGAA ATAATTATAA GCCTGACAAT

451 TCACACCCTT ACAACGGCGA TTANCATATG CCGCGTTTGC ATAAATTTGT

501 CACAGATGCA GAACCTGTCG AAATGACGAG TGACATGAGG GGGAATACCT

551 ATTCCGATAA AGAAAAATAT CCCGAGCGTG TCCGCATCGG CTCAGGACAC

601 CACTATTGGC GTTATGATGA TGACAAACAC GGCGATTTAT CCTACTCCGG

651 CGCATGGTTA ATTGGCGGCA ATACACATAT GCAGGGTTGG GGAAATAATG

701 GCGTANTTAG TTTGAGCGGC GATGTGCGCC ATGCCAACGA CTATGGCCCT

751 ATGCCGATTG CAGGTGCGGC AGGCGACAGC GGTTCGCCAA TGTTTATTTA

801 TGACAAAACA AACAATAAAT GGCTGCTCAA CGGAGTTTTA CAAACCGGCT

851 ACCCTTATTC CGGCAGGGAA AACGGTTTCC AGCTGATACG CAAAGATTGG

901 TTCTACGATG ACATTTACAG AGGCGATACA CATACCGTCT NTTTTGAACC

951 GCGCAGTAAC GGACATTTTT CCTTTACATC CAACAACAAC GGTACGGGTA

1001 CGGTAACAGA AACCAACGAA AAGGTNTCCA ATCCAAAGCT TAAAGTACAG

1051 ACAGTCCGAC TGTTTGACGA ATCTTTGAAT GAAACTGATA AAGAACCAGT

1101 TTACGCGGCA GGGGGTGTTA ATCAGTACCG TCCAAGGTTA AACAACGGTG

1151 AAAACCTTTC TTTTATCGAT TACGGCAACG GCAAACTCAT CTTATCAAAC

1201 AACATCAACC AAGGCGCGGG CGGTTTGTAT TTTGAAGGTG ATTTTACGGT

1251 CTCGCCTGAA AACAACGAAA CGTGGCAAGG CGCGGGCGTT CATATCAGTG

1301 AAGACAGTAC CGTTACTTGG AAAGTAAACG GCGTGGCAAA CGACCGCCTG

1351 TCCAAAATCG GCAAAGGCAC GCTGCACGTT CAAGCCAAAG GGGAAAACCA

1401 AGGCTCGATC AGCGTGGGCG ACGGTACAGT CATTTTGGAT CAGCAGGCAG

1451 ACGATAAAGG CAAAAAACAA GCCTTTAGTG AAATCGGCTT GNTCAGCGGC

1501 AGGGGTACGG TGCAACTGAA TGCCGATAAT CAGTTCAACC CCGACAAACT

1551 CTATTTCGGC TTTCGCGGCG GACGTTTGGA TTTAAACGGG CATTCGCTTT

1601 CGTTCCACCG TATTCAAAAT ACCGATGAAG GGGCGATGAT TGNCNATCAT

1651 AATGCCACAA CAACATCCAC CGTTACCATT ACAGGGAATG AAAGTATTAC

1701 ACAACCGAGT GGTAAGAATA TCAATAGACT TAATTACAGC AAAGAAATTG

1751 CCTACAACGG TTGGTTTGGC GAGAAAGATA CGACCAAAAC GAACGGGCGG

1801 CTCAACCTTG TTTACCAGCC CGCCGCAGAA GACCGCACCC NGCTGCTTTC

1851 CGGCGGAACA AATTTAAACG GCAACATCAC GCAAACAAAC GGCAAACTGT

1901 TTTTCAGCGG CAGACCGACA CCGCACGCCT ACAATCATTT AGGAAGCGGG

1951 TGGTCAAAAA TGGAAGGTAT CCCACAAGGA GAAATCGTGT GGGACAACGA

2001 CTGGATCNAC CGCACGTTTA AAGCGGAAAA TTTCCATATT CAGGGCGGGC

2051 AGGCGGTGAT TTCCCGCAAT GTTGCCAAAG TGGAAGGCGA TTGNCATTTG

2101 AGCAATCACG CCCAAGCAGT TTTTGGTGTC GCACCGCATC AAAGCCATAC

2151 AATCTGTACA CGTTCGGACT GGACNGGTCT GACAAATTGT GTCGAANAAA

2201 NCATTACCGA CGATAAAGTG ATTGCTTCAT TGACTAAGAC NGACNTNAGC

2251 GGCANTGTNA GNCTNNCCNA TNACGNTNNT TNAAANCTCN CNGGGCNTGC

2301 NNCACTNAAN GGCAATCTTA GTGCAAATGG CGATACACGT TATACAGTCA

2351 GCCACAACGC CACCCAAAAC GGCAACCTTA GCCTCGTGGG CAATGCCCAA

2401 GCAACATTTA ATCAAGCCAC ATTAAACGGC AACNCATCGG NTTCGGGCAA

2451 TGCTTCATTT AATCTAAGCA ACAACGCCGC ACAAAACGGC AGTCTGACGC

2501 TTTCCGACAA CGCTAAGGCA AACGTAAGCC ATTCCGCACT CAACGGCAAT

2551 GTCTCCCTAG CCGATAAGGC AGTATTCCAT TTTGAAAACA GCCGCTTTAC

2601 CGGACAACTC AGCGGCAGCA AGGANACAGC ATTACACTTA AAAGACAGCG

2651 AATGGACGCT GCCGTCAGGC ACGGAATTAG GCAATTTAAA CCTTGACAAC

2701 GCCACCATTA CACTCAATTC CGCCTATCGC CACGATGCTG CAGGCGCGCA

2751 AACCGGCAGN GTGTCAGACA CGCCGCGCCG CCGTTCGCGC CGTTCCCTAT

2801 TATCCGTTAC ACCGCCAACT TCGGTAGAAT CCCGTTTCAA CACGCTGACG

2851 GTAAACGGCA AATTGAACNG TCAAGGAACA TTCCGCTTTA TGTCGGAACT

2901 CTTCGGCTAC CGAAGCGACA AATTGAAGCT GGCGGAAAGT TCCGAAGGNA

2951 CTTACACCTT GGCGGTCAAC AATACCGGCA ACGAACCCGT AAGCCTCGAT

3001 CAATTGACGG TAGTGGAAGG GAAAGACAAC AAACCGCTGT CCGAAAACCT

3051 TAATTTCACC CTGCAAAACG AACACGTCGA TGCCGGCGCG TGGCGTTACC

3101 AACTCATCCG CAAAGACGGC GAGTTCCGCC TGCATAATCC GGTCAAAGAA

3151 CAAGAGCTTT CCGACAAACT CGGCAAGGCA GAAGCCAAAA AACAGGCGGA

3201 AAAAGACAAC GCGCAAAGCC TTGACGCGCT GATTGCGGCC GGGCGCGATG

3251 CCGCCGAAAA GACAGAAAGC GTTGCCGAAC CGGCCCGGCN GGCAGGCGGG

3301 GAAAATGTCG GCATTATGCA GGCGGAGGAA GAGAAAAAAC GGGTGCAGGC

3351 GGATAAAGAC AGCGCNTTGG CGAAACAGCG CGAAGCGGAA ACCCGGCCGG

3401 NTACCACCGC CTTCCCCCGC GCCCGCNGCG CCCGCCGGGA TTTGCCGCAA

3451 CCGCAGCCCC AACCGCAACC TCAACCCCAA CCGCAGCGCG ACCTGATNAG

3501 CCGTTATGCC AATAGCGGTT TGAGTGAATT TTCCGCCACG CTCAACAGCG

3551 TTTTCGCCGT ACAGGACGAA TTGGACCGCG TGTTTGCCGA AGACCGCCGC

3601 AACGCNGTTT GGACAAGCNG CATCCGGNAC ACCAAACACT ACCGTTCGCA

3651 AGATTTCCGC GCCTACCGCC AACAAACCGA CCTGCGCCAA ATCGGTATGC

3701 AGAAAAACCT CGGCAGCGGG CGCGTCGGCA TCCTGTTTTC GCACAACCGG

3751 ACCGAAAACA NCTTCGACGA CGGCATCGGC AACTCGGCAC GGCTTGCCCA

3801 CGGCGCCGTT TTCGGGCAAT ACGGCATCGG CAGGTTCGAC ATCGGCATCA

3851 GCACGGGCGC GGGTTTTAGC AGCGGCANTC TNTCAGACGG CATCGGAGGC

3901 AAAATCCGCC GCCGCGTGCT GCATTACGGC ATTCAGGCAC GATACCGCGC

3951 CGGTTTCGGC GGATTCGGCA TCGAACCGTA CATCGGCGCA ACGCGCTATT

4001 TCGTCCAAAA AGCGGATTAC CGCTACGAAA ACGTCAATAT CGCCACCCCC

4051 GGTCTTGCGT TCAACCGNTA CCGNGCGGGC ATTAAGGCAG ATTATTCATT

4101 CAAACCGGCG CAACACATNT CCATCACNCC TTATTTNAGC CTGTCCTATA

4151 CCGATGCCGC TTCGGGCAAA GTCCGAACAC GCGTCAATAC CGCNGTATTG

4201 GCTCAGGATT TCGGCAAAAC CCGCAGTGCG GAATGGGGCG TAAACGCCGA

4251 AATCAAAGGT TTCACGCTGT CCNTCCACGC TGCCGCCGCC AAAGGNCCGC

4301 AACTGGAAGC GCAACACAGC GCGGGCATCA AATTAGGCTA CCGCTGGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 652>：

1 MKTTDKRTTE THRKAPKTGR IRFSPAYLAI CLSFGILPQA WAGHTYFGIN

51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG

101 VAALVGDQYI VSVAHNGGYN NVDFGAEGXN PDQHRFSYQI VKRNNYKPDN

151 SHPYNGDXHM PRLHKFVTDA EPVEMTSDMR GNTYSDKEKY PERVRIGSGH

201 HYWRYDDDKH GDLSYSGAWL IGGNTHMQGW GNNGVXSLSG DVRHANDYGP

251 MPIAGAAGDS GSPMFIYDKT NNKWLLNGVL QTGYPYSGRE NGFQLIRKDW

301 FYDDIYRGDT HTVXFEPRSN GHFSFTSNNN GTGTVTETNE KVSNPKLKVQ

351 TVRLFDESLN ETDKEPVYAA GGVNQYRPRL NNGENLSFID YGNGKLILSN

401 NINQGAGGLY FEGDFTVSPE NNETWQGAGV HISEDSTVTW KVNGVANDRL

451 SKIGKGTLHV QAKGENQGSI SVGDGTVILD QQADDKGKKQ AFSEIGLXSG

501 RGTVQLNADN QFNPDKLYFG FRGGRLDLNG HSLSFHRIQN TDEGAMIXXH

551 NATTTSTVTI TGNESITQPS GKNINRLNYS KEIAYNGWFG EKDTTKTNGR

601 LNLVYQPAAE DRTXLLSGGT NLNGNITQTN GKLFFSGRPT PHAYNHLGSG

651 WSKMEGIPQG EIVWDNDWIX RTFKAENFHI QGGQAVISRN VAKVEGDXHL

701 SNHAQAVFGV APHQSHTICT RSDWTGLTNC VEXXITDDKV IASLTKTDXS

751 GXVXLXXXXX XXLXGXAXLX GNLSANGDTR YTVSHNATQN GNLSLVGNAQ

801 ATFNQATLNG NXSXSGNASF NLSNNAAQNG SLTLSDNAKA NVSHSALNGN

851 VSLADKAVFH FENSRFTGQL SGSKXTALHL KDSEWTLPSG TELGNLNLDN

901 ATITLNSAYR HDAAGAQTGX VSDTPRRRSR RSLLSVTPPT SVESRFNTLT

951 VNGKLNXQGT FRFMSELFGY RSDKLKLAES SEGTYTLAVN NTGNEPVSLD

1001 QLTVVEGKDN KPLSENLNFT LQNEHVDAGA WRYQLIRKDG EFRLHNPVKE

1051 QELSDKLGKA EAKKQAEKDN AQSLDALIAA GRDAAEKTES VAEPARXAGG

1101 ENVGIMQAEE EKKRVQADKD SALAKQREAE TRPXTTAFPR ARXARRDLPQ

1151 PQPQPQPQPQ PQRDLXSRYA NSGLSEFSAT LNSVFAVQDE LDRVFAEDRR

1201 NAVWTSXIRX TKHYRSQDFR AYRQQTDLRQ IGMQKNLGSG RVGILFSHNR

1251 TENXFDDGIG NSARLAHGAV FGQYGIGRFD IGISTGAGFS SGXLSDGIGG

1301 KIRRRVLHYG IQARYRAGFG GFGIEPYIGA TRYFYQKADY RYENVNIATP

1351 GLAFNRYRAG IKADYSFKPA QHXSITPYXS LSYTDAASGK VRTRVNTAVL

1401 AQDFGKTRSA EWGVNAEIKG FTLSXHAAAA KGPQLEAQHS AGIKLGYRW*

跨膜区用下划线表示。

ORF1-1和ORF1a在1462个氨基酸的重叠区内显示出有86.3％的相同性：

10 20 30 40 50 60

orf1a.pep MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1-1 MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN

10 20 30 40 50 60

70 80 90 100 110 120

orf1a.pep KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1-1 KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYN

70 80 90 100 110 120

130 140 150 160 170 179

orf1a.pep NVDFGAEGXNPDQHRFSYQIVKRNNYKPDNS-HPYNGDXHMPRLHKFVTDAEPVEMTSDM

|||||||| |||||||:|:|||||||| :: |||:|| ||||||||||||||||||| |

orf1-1 NVDFGAEGRNPDQHRFTYKIVKRNNYKAGTKGHPYGGDYHMPRLHKFVTDAEPVEMTSYM

130 140 150 160 170 180

180 190 200 210 220 230

orf1a.pep RGNTYSDKEKYPERVRIGSGHHYWRYDDDKHGDL--SYSGA----WLIGGNTHMQGWGNN

| | |:::||:|||||:|::||| |:|: :: || | ||:|||| |: :::

orf1-1 DGRKYIDQNNYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGG

190 200 210 220 230 240

240 250 260 270 280 290

orf1a.pep GVXSLSGD-VRHANDYGPMPIAGAAGDSGSPMFIYDKTNNKWLLNGVLQTGYPYSGRENG

|: :|::: :: || :| : ||||||||||||| ::|||:||||||| || |: ||

orf1-1 GTVNLGSEKIKHS-PYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNG

250 260 270 280 290

300 310 320 330 340 350

orf1a.pep FQLIRKDWFYDDIYRGDTHTVXFEPRSNGHFSFTSNNNGTGTVTETNEKVSNP-KLKVQT

|||:|||||||:|: ||||:| :|||:||::||:::||||| :: :|: | | :||::|

orf1-1 FQLVRKDWFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRT

300 310 320 330 340 350

360 370 380 390 400 410

orf1a.pep VRLFDESLNETDKEPVY-AAGGVNQYRPRLNNGENLSFIDYGNGKLILSNNINQGAGGLY

|:||: ||:|| :|||| ||||||:||||||||||:||||||:|:|||::||||||||||

orf1-1 VQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKGELILTSNINQGAGGLY

360 370 380 390 400 410

420 430 440 450 460 470

orf1a.pep FEGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSI

|:||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1-1 FQGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSI

420 430 440 450 460 470

480 490 500 510 520 530

orf1a.pep SVGDGTVILDQQADDKGKKQAFSEIGLXSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNG

||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||

orf1-1 SVGDGTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNG

480 490 500 510 520 530

540 550 560 570 580 590

orf1a.pep HSLSFHRIQNTDEGAMIXXHNATTTSTVTITGNESITQPSGKNINRLNYSKEIAYNGWFG

||||||||||||||||| || ||||||||::|: :|:| | |: :||||||||||

orf1-1 HSLSFHRIQNTDEGAMIVNHNQDKESTVTITGNKDIAT-TGNN-NSLDSKKEIAYNGWFG

540 550 560 570 580 590

600 610 620 630 640 650

orf1a.pep EKDTTKTNGRLNLVYQPAAEDRTXLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLGSG

||||||||||||||||||||||| |||||||||||||||||||||||||||||||||::

orf1-1 EKDTTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLNDH

600 610 620 630 640 650

660 670 680 690 700 710

orf1a.pep WSKMEGIPQGEIVWDNDWIXRTFKAENFHIQGGQAVISRNVAKVEGDXHLSNHAQAVFGV

||: ||||:|||||||||| ||||||||:|:|||||:|||||||:|| ||||||||||||

orf1-1 WSQKEGIPRGEIVWDNDWINRTFKAENFQIKGGQAVVSRNVAKVKGDWHLSNHAQAVFGV

660 670 680 690 700 710

720 730 740 750 760 770

orf1a.pep APHQSHTICTRSDWTGLTNCVEXXITDDKVIASLTKTDXSGXVXLXXXXXXXLXGXAXLX

|||||||||||||||||||||| :|||||||||||||| || | | |:| |:|

orf1-1 APHQSHTICTRSDWTGLTNCVEKTITDDKVIASLTKTDISGNVDLADHAHLNLTGLATLN

720 730 740 750 760 770

780 790 800 810 820 830

orf1a.pep GNLSANGDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNXSXSGNASFNLSNNAAQNG

|||||||||||||||||||||||||||||||||||||||||:| |||||||||::|:|||

orf1-1 GNLSANGDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNG

780 790 800 810 820 830

840 850 860 870 880 890

orf1a.pep SLTLSDNAKANVSHSALNGNVSLADKAVFHFENSRFTGQLSGSKXTALHLKDSEWTLPSG

|||||:||||||||||||||||||||||||||:||||||:||:| |||||||||||||||

orf1-1 SLTLSGNAKANVSHSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSG

840 850 860 870 880 890

900 910 920 930 940

orf1a.pep TELGNLNLDNATITLNSAYRHDAAGAQTGXVSDTPRRRSRRS---LLSVTPPTSVESRFN

||||||||||||||||||||||||||||| ::|:|||||||| |||||||||||||||

orf1-1 TELGNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRSLLSVTPPTSVESRFN

900 910 920 930 940 950

950 960 970 980 990 1000

orf1a.pep TLTVNGKLNXQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPVSLDQLTVVEG

||||||||| |||||||||||||||||||||||||||||||||||||||:||:|||||||

orf1-1 TLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEG

960 970 980 990 1000 1010

1010 1020 1030 1040 1050 1060

orf1a.pep KDNKPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1-1 KDNKPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAE

1020 1030 1040 1050 1060 1070

1070 1080 1090 1100 1110 1120

orf1a.pep KDNAQSLDALIAAGRDAAEKTESVAEPARXAGGENVGIMQAEEEKKRVQADKDSALAKQR

||||||||||||:|||||||||||||||| |||||||||||||||||||||||:||||||

orf1-1 KDNAQSLDALIAAGRDAVEKTESVAEPARQAGGENVGIMQAEEEKKRVQADKDTALAKQR

1080 1090 1100 1110 1120 1130

1130 1140 1150 1160 1170 1180

orf1a.pep EAETRPXTTAFPRARXARRDLPQPQPQPQPQPQPQRDLXSRYANSGLSEFSATLNSVFAV

|||||| |||||||| ||||||| |||||||| |||| |||||||||||||||||||||

orf1-1 EAETRPATTAFPRARRARRDLPQLQPQPQPQP--QRDLISRYANSGLSEFSATLNSVFAV

1140 1150 1160 1170 1180 1190

1190 1200 1210 1220 1230 1240

orf1a.pep QDELDRVFAEDRRNAVWTSXIRXTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFS

||||||||||||||||||| || |||||||||||||||||||||||||||||||||||||

orf1-1 QDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFS

1200 1210 1220 1230 1240 1250

1250 1260 1270 1280 1290 1300

orf1a.pep HNRTENXFDDGIGNSARLAHGAVFGQYGIGRFDIGISTGAGFSSGXLSDGIGGKIRRRVL

||||||:|||||||||||||||||||||| || ||||:||||||| ||||||||||||||

orf1-1 HNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGGKIRRRVL

1260 1270 1280 1290 1300 1310

1310 1320 1330 1340 1350 1360

orf1a.pep HYGIQARYRAGFGGFGIEPYIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSF

|||||||||||||||||||:||||||||||||||||||||||||||||||||||||||||

orf1-1 HYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSF

1320 1330 1340 1350 1360 1370

1370 1380 1390 1400 1410 1420

orf1a.pep KPAQHXSITPYXSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSXHA

||||| ||||| ||||||||||||||||||||||||||||||||||||||||||||| ||

orf1-1 KPAQHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSLHA

1380 1390 1400 1410 1420 1430

1430 1440 1450

orf1a.pep AAAKGPQLEAQHSAGIKLGYRWX

|||||||||||||||||||||||

orf1-1 AAAKGPQLEAQHSAGIKLGYRWX

1440 1450

与流感嗜血菌的粘附和穿透蛋白hap前体(登录号为P45387)的同源性

ORF1的氨基酸23-423和hap蛋白在450个氨基酸的重叠区内显示出有59％的氨基酸相同性：

orf1 23 FXAAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAENKGKFAVGAKDIEVYNKKGELVG 82

F +L C+S GI QAWAGHTYFGI+YQYYRDFAENKGKF VGAK+IEVYNK+G+LVG

hap 6 FRLNFLTACVSLGIASQAWAGHTYFGIDYQYYRDFAENKGKFTVGAKNIEVYNKEGQLVG 65

orf1 83 KSMTKAPMIDFSVVSRNGVAALVGVQYIVSVAHNGGYNNVDFGAEGXNIXDQXRXTYKIV 142

SMTKAPMIDFSVVSRNGVAALVG QYIVSVAHNGGYN+VDFGAEG N DQ R TY+IV

hap 66 TSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYNDVDFGAEGRN-PDQHRFTYQIV 124

orf1 143 KRNNYKAGTKGHPYGGDYHMPRLHKXVTDAEPVEMTSYMDGRKYIDQNNYPDRVRIGAGR 202

KRNNY+A + HPY GDYHMPRLHK VT+AEPV MT+ MDG+ Y D+ NYP+RVRIG+GR

hap 125 KRNNYQAWERKHPYDGDYHMPRLHKFVTEAEPVGMTTNMDGKVYADRENYPERVRIGSGR 184

orf1 203 QYWRSDEDEPNNRESSYHIA---------------------------------------- 222

QYWR+D+DE N SSY+++

hap 185 QYWRTDKDEETNVHSSYYVSGAYRYLTAGNTHTQSGNGNGTVNLSGNVVSPNHYGPLPTG 244

orf1 223 -----SGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRKDWFYDEIFAGDTHSVF 277

SGSPMFIYDA+K++WLIN VLQTG+P+ G+ NGFQL+R++WFY+E+ A DT SVF

hap 245 GSKGDSGSPMFIYDAKKKQWLINAVLQTGHPFFGRGNGFQLIREEWFYNEVLAVDTPSVF 304

orf1 278 --YEPRQNGKYSFNDDNNGTGKIN-AKHEHNSLPNRLKTRTVQLFNVSLSETAREPVYHA 334

Y P NG YSF +N+GTGK+ + + + + TV+LFN SL++TA+E V A

hap 305 QRYIPPINGHYSFVSNNDGTGKLTLTRPSKDGSKAKSEVGTVKLFNPSLNQTAKEHV-KA 363

orf1 335 AGGVNSYRPRLNNGENISFIDEGKGELILTSNINQGAGGLYFQGDFTV-SPENNETWQGA 393

A G N Y+PR+ G+NI D+GKG L + +NINQGAGGLYF+G+F V +NN TWQGA

hap 364 AAGYNIYQPRMEYGKNIYLGDQGKGTLTIENNINQGAGGLYFEGNFVVKGKQNNITWQGA 423

orf1 394 GVHISEDSTVTWKVNGVANDRLSKIGKGTL 423

GV I +D+TV WKV+ NDRLSKIG GTL

hap 424 GVSIGQDATVEWKVHNPENDRLSKIGIGTL 453

ORF1的氨基酸715-1011和hap蛋白在258个氨基酸的重叠区内显示出有50％的氨基酸相同性：

Orf1 41 DTRYTVSHNATQ-NGNXSLVXNAQATFNQ-ATLNGNTSASGNASFNLSDHAVQNGSLTLS 98

DT+ S TQ NG+ +L NA + A LNGN + ++ F LS++A Q G++ LS

hap 733 DTKVINSIPITQINGSINLTNNATVNIHGLAKLNGNVTLIDHSQFTLSNNATQTGNIKLS 792

orf1 99 GNAKANVSHSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSGXELGN 158

+A A V+++ LNGNV L D A F ++S F QI G KDT + L+++ WT+PS L N

hap 793 NHANATVNNATLNGNVHLTDSAQFSLKNSHFWHQIQGDKDTTVTLENATWTMPSDTTLQN 852

orf1 159 LNLDNATITLNSAYRHDAAGAQTGSATDAPXXXXXXXXXXLLXVTPPTSVESRFNTLTVN 218

L L+N+T+TLNSAY + S+ +AP L T PTS E RFNTLTVN

hap 853 LTLNNSTVTLNSAY--------SASSNNAPRHRRS-----LETETTPTSAEHRFNTLTVN 899

orf1 219 GKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKDNKP 278

GKL+GQGTF+F S LFGY+SDKLKL+ +EG YTL+V NTG EP +LEQLT++E DNKP

hap 900 GKLSGQGTFQFTSSLFGYKSDKLKLSNDAEGDYTLSVRNTGKEPVTLEQLTLIESLDNKP 959

orf1 279 LSENLNFTLQNEHVDAGA 296

LS+ L FTL+N+HVDAGA

hap 960 LSDKLKFTLENDHVDAGA 977

ORF1的氨基酸1192-1450和hap蛋白在259个氨基酸的重叠区内显示出有41％的氨基酸相同性：

Orf1 1 LDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFSHNR 60

LDR+F + ++AVWT+ +D + Y S FRAY+Q+T+LRQIG+QK L +GR+G +FSH+R

hap 1135 LDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQKTNLRQIGVQKALANGRIGAVFSHSR 1194

orf1 61 TENTFDDGIGNSARLAHGAVFGQYGIDRFYXXXXXXXXXXXXXXXXXIGXKXRRRVLHYG 120

++NTFD+ + N A L + F QY K R+ ++YG

hap 1195 SDNTFDEQVKNHATLTMMSGFAQYQWGDLQFGVNVGTGISASKMAEEQSRKIHRKAINYG 1254

orf1 121 IQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPA 180

+ A Y+ G GI+P+ G RYF+++ +Y+ E V + TP LAFNRY AGI+ DY+F P

hap 1255 VNASYQFRLGQLGIQPYFGVNRYFIERENYQSEEVRVKTPSLAFNRYNAGIRVDYTFTPT 1314

orf1 181 QHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSLHAAAA 240

+IS+ PY ++Y D ++ V+T VN VL Q FG+ E G+ AEI F +S + +

hap 1315 DNISVKPYFFVNYVDVSNANVQTTVNLTVLQQPFGRYWQKEVGLKAEILHFQISAFISKS 1374

orf1 241 KGPQLEAQHSAGIKLGYRW 259

+G QL Q + G+KLGYRW

hap 1375 QGSQLGKQQNVGVKLGYRW 1393

与淋病奈瑟球菌的预计ORF的同源性

ORF1的片段和淋病奈瑟球菌的预计ORF(ORF1ng)在467、298和259个氨基酸的重叠区内分别显示出有83.5％，88.3％和97.7％的相同性：

orf1.pep MKTTDKRTTETHRKAPKTGRIRFXAAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN 60

||||||||||||||||||||||| ||||||||||||||| |||||||||||||||||||

orf1ng MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQARAGHTYFGINYQYYRDFAEN 60

orf1.pep KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGVQYIVSVAHNGGYN 120

||||||||||||||||||||||||||||||||||||||||||||:| |||||||||||||

orf1ng KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALAGDQYIVSVAHNGGYN 120

orf1.pep NVDFGAEGXNIXDQXRXTYKIVKRNNYKAGTKGHPYGGDYHMPRLHKXVTDAEPVEMTSY 180

|||||||||| || | :|:|||||||||||:||||||||||||||| ||||||||||||

orf1ng NVDFGAEGSN-PDQHRFSYQIVKRNNYKAGTNGHPYGGDYHMPRLHKFVTDAEPVEMTSY 179

orf1.pep MDGRKYIDQNNYPDRVRIGAGRQYWRSDEDEPNNRESSYHIAS----------------- 223

||| || | |:||||||||||||||||||||||||||||||||

orf1ng MDGWKYADLNKYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSG 239

orf1.pep ---------------------------- GSPMFIYDAQKQKWLIN 255

||||||||||||||||||||||||||||||||

orf1ng GGTVNLGSEKIKHSPY GFLPTGGSFGDSGSPMFIYDAQKQKWLIN GVLQTGNPYIGKSNG 289

orf1.pep VRKDWFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRT 315

201 GGCGAAAGAT ATTGAGGTTT ACAACAAAAA AGGGGAGTTG GTCGGCAAAT

251 CGATGACGAA AGCCCCGATG ATTGATTTTT CTGTGGTATC GCGTAACGGC

301 GTGGCGGCAT TGGCGGGCGA TCAATATATT GTGAGCGTGG CACATAACGG

351 CGGCTATAAC AATGTTGATT TTGGTGCGGA GGGAAGCAAT CCCGATCAGC

401 ACCGCTTTTC TTACCAAATT GTGAAAAGAA ATAATTATAA AGCAGGGACT

451 AACGGCCATC CTTATGGCGG CGATTATCAT ATGCCGCGTT TGCACAAATT

501 TGTCACAGAT GCAGAACCTG TTGAGATGAC CAGTTATATG GATGGGTGGA

551 AATACGCTGA TTTAAATAAA TACCCTGATC GTGTTCGAAT CGGAGCAGGC

601 AGACAATATT GGCGGTCTGA TGAAGACGAA CCCAATAACC GCGAAAGTTC

651 ATATCATATT GCAAGCGCAT ATTCTTGGCT CGTCGGTGGC AATACCTTTG

701 CACAAAATGG ATCAGGTGGT GGCACAGTCA ACTTAGGTAG CGAAAAAATT

751 AAACATAGCC CATATGGTTT TTTACCAACA GGAGGCTCAT TTGGCGACAG

801 TGGCTCACCA ATGTTTATCT ATGATGCCCA AAAGCAAAAG TGGTTAATTA

851 ATGGGGTATT GCAAACAGGC AACCCCTATA TAGGAAAAAG CAATGGCTTC

901 CAGCTAGTTC GTAAAGATTG GTTCTATGAT GAAATCTTTG CTGGAGATAC

951 CCATTCAGTA TTCTACGAAC CACATCAAAA TGGGAAATAC TTTTTTAACG

1001 ACAATAATAA TGGCGCAGGA AAAATCGATG CCAAACATAA ACACTATTCT

1051 CTACCTTATA GATTAAAAAC ACGAACCGTT CAATTGTTTA ATGTTTCTTT

1101 ATCCGAGACA GCAAGAGAAC CTGTTTATCA TGCTGCAGGT GGGGTCAACA

1151 GTTATCGACC CAGACTGAAT AATGGAGAAA ATATTTCCTT TATTGACAAA

1201 GGAAAAGGTG AATTGATACT TACCAGCAAC ATCAACCAAG GCGCGGGCGG

1251 TTTGTATTTT GAGGGTAATT TTACGGTCTC GCCTAAAAAC AACGAAACGT

1301 GGCAAGGCGC GGGCGTTCAT ATCAGTGATG GCAGTACCGT TACTTGGAAA

1351 GTAAACGGCG TGGCAAACGA CCGCCTGTCC AAAATCGGCA AAGGCACGCT

1401 GCTGGTTCAA GCCAAAGGGG AAAACCAAGG CTCGGTCAGC GTGGGCGACG

1451 GTAAAGTCAT CTTAGATCAG CAGGCGGACG ATCAAGGCAA AAAACAAGCC

1501 TTTAGTGAAA TCGGCTTGGT CAGCGGCAGG GGGACGGTGC AACTGAATGC

1551 CGATAATCAG TTCAACCCCG ACAAACTCTA TTTCGGCTTT CGCGGCGGAC

1601 GTTTGGATTT GAACGGGCAT TCGCTTTCGT TCCACCGCAT TCAAAATACC

1651 GATGAAGGGG CGATGATTGT CAACCACAAT CAAGACAAAG AATCCACCGT

1701 TACCATTACA GGCAATAAAG ATATTACTAC AACCGGCAAT AACAACAACT

1751 TGGATAGCAA AAAAGAAATT GCCTACAACG GTTGGTTTGG CGAGAAAGAT

1801 GCAACCAAAA CGAACGGGCG GCTCAATCTG AATTACCAAC CGGAAGAAGC

1851 GGATCGCACT TTACTGCTTT CCGGCGGAAC AAATTTAAAC GGCAATATCA

1901 CGCAAACAAA CGGCAAACTG TTTTTCAGCG GCAGACCGAC ACCGCACGCC

1951 TACAATCATT TAGGAAGCGG GTGGTCAAAA ATGGAAGGTA TCCCACAAGG

2001 AGAAATCGTG TGGGACAACG ATTGGATCGA CCGCACATTT AAAGCGGAAA

2051 ACTTCCATAT TCAGGGCGGA CAAGCGGTGG TTTCCCGCAA TGTTGCCAAA

2101 GTGGAAGGCG ATTGGCATTT AAGCAATCAC GCCCAAGCAG TTTTCGGTGT

2151 CGCACCGCAT CAAAGCCACA CAATCTGTAC ACGTTCGGAC TGGACGGGTC

2201 TGACAAGTTG TACCGAAAAA ACCATTACCG ACGATAAAGT GATTGCTTCA

2251 TTGAGCAAGA CCGACATCAG AGGCAATGTC AGCCTTGCCG ATCACGCTCA

2301 TTTAAATCTC ACAGGACTTG CCACACTCAA CGGCAATCTT AGTGCAGGCG

2351 GAGACACGCA CTATACGGTT ACGCGCAACG CCACCCAAAA CGGCAACCTC

2401 AGCCTCGTGG GCAATGCCCA AGCAACATTT AATCAAGCCA CATTAAACGG

2451 CAACACATCG GCTTCGGACA ATGCTTCATT TAATCTAAGC AACAACGCCG

2501 TACAAAACGG CAGTCTGACG CTTTCCGACA ACGCTAAGGC AAACGTAAGC

2551 CATTCCGCAC TCAACGGCAA TGTCTCCCTA GCCGATAAGG CAGTATTCCA

2601 TTTTGAAAAC AGCCGCTTTA CCGGAAAAAT CAGCGGCGGC AAGGATACGG

2651 CATTACACTT AAAAGACAGC GAATGGACGC TGCCGTCGGG CACGGAATTA

2701 GGCAATTTAA ACCTTGACAA CGCCACCATT ACACTCAATT CCGCCTATCG

2751 ACACGATGCG GCAGGCGCGC AAACCGGCAG TGCGGCAGAT GCGCCGCGCC

2801 GCCGTTCGCG CCGTTCCCTA TTATCCGTTA CGCCGCCAAC TTCGGCAGAA

2851 TCCCGTTTCA ACACGCTGAC GGTAAACGGC AAATTGAACG GTCAGGGAAC

2901 ATTCCGCTTT ATGTCGGAAC TCTTCGGCTA CCGCAGCGGC AAATTGAAGC

2951 TGGCGGAAAG TTCCGAAGGC ACTTACACCT TGGCTGTCAA CAATACCGGC

3001 AACGAACCCG TAAGTCTCGA GCAATTGACG GTAGTGGAAG GAAAAGACAA

3051 CACACCGCTG TCCGAAAATC TTAATTTCAC CCTGCaaaAc gaacacgtcg

3101 atgccggcgc atggCGTTAT CAGCTTATCC gcaaagacgG CGAGTTCCgc

3151 CTGCATAATC CGGTCAAAGA ACAAGAGCTT TCCGACAAAC TCGGCAAGgc

3201 gggagaaACA GAggccgccT TGACGGCAAA ACAGGCacaA CTTGCCGCCA

3251 AAcaacaggc ggaaaAAGAC AACgcgcaaa gccttgAcgc gctgattgcg

3301 gCcgggcgca atgccaccga AAAGGCAgaa agtgttgccg aaccgGCCCG

3351 GCAGGCAGGC GGGGAAAAtg ccgGCATTAT GCAGGCGGAG GAAGAGAAAA

3401 AACGGGTGCA GGCGGATAAA GACACCGCCT TGGCGAAACA GCGCGAAGCG

3451 GAAACCCGGC CGGCTACCAC CGCCTTCCCC CGCGCCCGCC GCGCCCGCCG

3501 GGATTTGCCG CAACCGCAGC CCCAACCGCA ACCCCAACCG CAGCGCGACC

3551 TGATCAGCCG TTATGCCAAT AGCGGTTTGA GTGAATTTTC CGCCACGCTC

3601 AACAGCGTTT TCGCCGTACA GGACGAATTG GACCGCGTGT TTGCCGAAGA

3651 CCGCCGCAAC GCCGTTTGGA CAAGCGGCAT CCGGGACACC AAACACTACC

3701 GTTCGCAAGA TTTCCGCGCC TACCGCCAAC AAACCGACCT GCGCCAAATC

3751 GGTATGCAGA AAAACCTCGG CAGCGGGCGC GTCGGCATCC TGTTTTCGCA

3801 CAACCGGACC GGAAACACCT TCGACGACGG CATCGGCAAC TCGGCACGGC

3851 TTGCCCACGG TGCCGTTTTC GGGCAATACG GCATCGGCAG GTTCGACATC

3901 GGCATCAGCG CGGGCGCGGG TTTTAGTAGC GGCAGCCTTT CAGACGGCAT

3951 CAGAGGCAAA ATCCGCCGCC GCGTGCTGCA TTACGGCATT CAGGCAAGAT

4001 ACCGCGCAGG TTTCGGCGGA TTCGGCATCG AACCGCACAT CGGCGCAACG

4051 CGCTATTTCG TCCAAAAAGC GGATTACCGA TACGAAAACG TCAATATCGC

4101 CACCCCGGGC CTTGCATTCA ACCGCTACCG CGCGGGCATT AAGGCAGATT

4151 ATTCATTCAA ACCGGCGCAA CACATTTCCA TCACGCCTTA TTTGAGCCTG

4201 TCCTATACCG ATGCCGCTTC CGGCAAAGTC CGAACGCGCG TCAATACCGC

4251 CGTATTGGCG CAGGATTTCG GCAAAACCCG CAGTGCGGAA TGGGGCGTAA

4301 ACGCCGAAAT CAAAGGTTTC ACGCTGTCCC TCCACGCTGC CGCCGCCAAG

4351 GGGCCGCAAT TGGAAGCGCA GCACAGCGCG GGCATCAAAT TAGGCTACCG

4401 CTGGTAA

预计它编码的蛋白质具有氨基酸序列<SEQ ID 654>：

1 MKTTDKRTTE THRKAPKTGR IRFSPAYLAI CLSFGILPQA RAGHTYFGIN

51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG

101 VAALAGDQYI VSVAHNGGYN NVDFGAEGSN PDQHRFSYQI VKRNNYKAGT

151 NGHPYGGDYH MPRLHKFVTD AEPVEMTSYM DGWKYADLNK YPDRVRIGAG

201 RQYWRSDEDE PNNRESSYHI ASAYSWLVGG NTFAQNGSGG GTVNLGSEKI

251 KHSPY GFLPT GGSFGDSGSP MFIYDAQKQK WLIN

301 VRKDWFYD EIFAGDTHSV FYEPHQNGKY FFNDNNNGAG KIDAKHKHYS

351 LPYRLKTRTV QLFNVSLSET AREPVYHAAG GVNSYRPRLN NGENISFIDK

401 GKGELILTSN INQGAGGLYF EGNFTVSPKN NETWQGAGVH ISDGSTVTWK

451 VNGVANDRLS KIGKGTLLVQ AKGENQGSVS VGDGKVILDQ QADDQGKKQA

501 FSEIGLVSGR GTVQLNADNQ FNPDKLYFGF RGGRLDLNGH SLSFHRIQNT

551 DEGAMIVNHN QDKESTVTIT GNKDITTTGN NNNLDSKKEI AYNGWFGEKD

601 ATKTNGGLNL NYPPEEADRT LLLSGGTNLN GNITQTNGKL FFSGRPTPHA

651 YNHLGSGWSK MEGIPQGEIV WDNDWIDRTF KAENFHIQGG QAVVSRNVAK

701 VEGDWHLSNH AQAVFGVAPH QSHTICTRSD WTGLTSCTEK TITDDKVIAS

751 LSKTDVRGNV SLADHAHLNL TGLATFNGNL VQAETRTIRL RANATQNGNL

801 SLVGNAQATF NQATLNGNTS ASDNASFNLS NNAVQNGSLT LSDNAKANVS

851 HSALNGNVSL ADKAVFHFEN SRFTGKISGG KDTALHLKDS EWTLPSGTEL

901 GNLNLDNATI TLNSAYRHDA AGAQTGSAAD APRRRSRRSL LSVTPPTSAE

951 SRFNTLTVNG KLNGQGTFRF MSELFGYRSG KLKLAESSEG TYTLAVNNTG

1001 NEPVSLEQLT VVEGKDNTPL SENLNFTLQN EHVDAGAWRY QLIRKDGEFR

1051 LHNPVKEQEL SDKLGKAGET EAALTAKQAQ LAAKQQAEKD NAQSLDALIA

1101 AGRNATEKAE SVAEPARQAG GENAGIMQAE EEKKRVQADK DTALAKQREA

1151 ETRPATTAFP RARRARRDLP QPQPQPQPQP QRDLISRYAN SGLSEFSATL

1201 NSVFAVQDEL DRVFAEDRRN AVWTSGIRDT KHYRSQDFRA YRQQTDLRQI

1251 GMQKNLGSGR VGILFSHNRT GNTFDDGIGN SARLAHGAVF GQYGIGRFDI

1301 GISAGAGFSS GSLSDGIRGK IRRRVLHYGI QARYRAGFGG FGIEPHIGAT

1351 RYFVQKADYR YENVNIATPG LAFNRYRAGI KADYSFKPAQ HISITPYLSL

1401 SYTDAASGKV RTRVNTAVLA QDFGKTRSAE WGVNAEIKGF TLSLHAAAAK

1451 GPQLEAQHSA GIKLGYRW*

有下划线和双划线的序列代表丝氨酸蛋白酶(胰蛋白酶家族)的活性位点以及ATP/GTP-结合位点基序A(P-环)。

ORF1-1和ORF1ng在1471个氨基酸的重叠区内显示出有93.7％的相同性：

10 20 30 40 50 60

orf1-1.pep MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQAWAGHTYFGINYQYYRDFAEN

|||||||||||||||||||||||||||||||||||||||| |||||||||||||||||||

orf1ng-1 MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQARAGHTYFGINYQYYRDFAEN

10 20 30 40 50 60

70 80 90 100 110 120

orf1-1.pep KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYN

||||||||||||||||||||||||||||||||||||||||||||:|||||||||||||||

orf1ng-1 KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALAGDQYIVSVAHNGGYN

70 80 90 100 110 120

130 140 150 160 170 180

orf1-1.pep NVDFGAEGRNPDQHRFTYKIVKRNNYKAGTKGHPYGGDYHMPRLHKFVTDAEPVEMTSYM

|||||||| |||||||:|:|||||||||||:|||||||||||||||||||||||||||||

orf1ng-1 NVDFGAEGSNPDQHRFSYQIVKRNNYKAGTNGHPYGGDYHMPRLHKFVTDAEPVEMTSYM

130 140 150 160 170 180

190 200 210 220 230 240

orf1-1.pep DGRKYIDQNNYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGG

|| || | |:||||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 DGWKYADLNKYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGG

190 200 210 220 230 240

250 260 270 280 290 300

orf1-1.pep GTVNLGSEKIKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 GTVNLGSEKIKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGF

250 260 270 280 290 300

310 320 330 340 350 360

orf1-1.pep QLVRKDWFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRTV

||||||||||||||||||||||||:||||| |||:|||:|||:|||:| ||| |||||||

orf1ng-1 QLVRKDWFYDEIFAGDTHSVFYEPHQNGKYFFNDNNNGAGKIDAKHKHYSLPYRLKTRTV

310 320 330 340 350 360

370 380 390 400 410 420

orf1-1.pep QLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKGELILTSNINQGAGGLYF

|||||||||||||||||||||||||||||||||||||||||||:||||||||||||||||

orf1ng-1 QLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDKGKGELILTSNINQGAGGLYF

370 380 390 400 410 420

430 440 450 460 470 480

orf1-1.pep QGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSIS

:|:||||||||:||||||||||: ||||||||||||||||||||||| ||||||||||:|

orf1ng-1 EGNFTVSPKNNETWQGAGVHISDGSTVTWKVNGVANDRLSKIGKGTLLVQAKGENQGSVS

430 440 450 460 470 480

490 500 510 520 530 540

orf1-1.pep VGDGTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGH

||| |||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 VGDGKVILDQQADDQGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGH

490 500 510 520 530 540

550 560 570 580 590 600

orf1-1.pep SLSFHRIQNTDEGAMIVNHNQDKESTVTITGNKDIATTGNNNSLDSKKEIAYNGWFGEKD

|||||||||||||||||||||||||||||||||||:||||||:|||||||||||||||||

orf1ng-1 SLSFHRIQNTDEGAMIVNHNQDKESTVTITGNKDITTTGNNNNLDSKKEIAYNGWFGEKD

550 560 570 580 590 600

610 620 630 640 650 660

orf1-1.pep TTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLNDHWSQ

:||||||||| ||| ||||||||||||||||||||||||||||||||||||:: ||:

orf 1ng-1 ATKTNGRLNLNYQPEEADRTLLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLGSGWSK

610 620 630 640 650 660

670 680 690 700 710 720

orf1-1.pep KEGIPRGEIVWDNDWINRTFKAENFQIKGGQAVVSRNVAKVKGDWHLSNHAQAVFGVAPH

|||||:||||||||||:||||||||:|:|||||||||||||:||||||||||||||||||

orf1ng-1 MEGIPQGEIVWDNDWIDRTFKAENFHIQGGQAVVSRNVAKVEGDWHLSNHAQAVFGVAPH

670 680 690 700 710 720

730 740 750 760 770 780

orf1-1.pep QSHTICTRSDWTGLTNCVEKTITDDKVIASLTKTDISGNVDLADHAHLNLTGLATLNGNL

|||||||||||||||:|:|||||||||||||:|||| |||:|||||||||||||||||||

orf1ng-1 QSHTICTRSDWTGLTSCTEKTITDDKVIASLSKTDIRGNVSLADHAHLNLTGLATLNGNL

730 740 750 760 770 780

790 800 810 820 830 840

orf1-1.pep SANGDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLT

||:|||:|||::|||||||||||||||||||||||||||||| |||||||::||||||||

orf1ng-1 SAGGDTHYTVTRNATQNGNLSLVGNAQATFNQATLNGNTSASDNASFNLSNNAVQNGSLT

790 800 810 820 830 840

850 860 870 880 890 900

orf1-1.pep LSGNAKANVSHSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSGTEL

|| ||||||||||||||||||||||||||:|||||:||||||||||||||||||||||||

orf1ng-1 LSDNAKANVSHSALNGNVSLADKAVFHFENSRFTGKISGGKDTALHLKDSEWTLPSGTEL

850 860 870 880 890 900

910 920 930 940 950 960

orf1-1.pep GNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRSLLSVTPPTSVESRFNTLT

||||||||||||||||||||||||||||:|||||||| |||||||||||:||||||||

orf1ng-1 GNLNLDNATITLNSAYRHDAAGAQTGSAADAPRRRSR---RSLLSVTPPTSAESRFNTLT

910 920 930 940 950

970 980 990 1000 1010 1020

orf1-1.pep VNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKDN

|||||||||||||||||||||| |||||||||||||||||||||||:|||||||||||||

orf1ng-1 VNGKLNGQGTFRFMSELFGYRSGKLKLAESSEGTYTLAVNNTGNEPVSLEQLTVVEGKDN

960 970 980 990 1000 1010

1030 1040 1050 1060 1070

orf1-1.pep KPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKA----------

|||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 TPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAGETEAALTAK

1020 1030 1040 1050 1060 1070

1080 1090 1100 1110 1120

orf1-1.pep ----EAKKQAEKDNAQSLDALIAAGRDAVEKTESVAEPARQAGGENVGIMQAEEEKKRVQ

||:||||||||||||||||||:|:||:||||||||||||||:|||||||||||||

orf1ng-1 QAQLAAKQQAEKDNAQSLDALIAAGRNATEKAESVAEPARQAGGENAGIMQAEEEKKRVQ

1080 1090 1100 1110 1120 1130

1130 1140 1150 1160 1170 1180

orf1-1.pep ADKDTALAKQREAETRPATTAFPRARRARRDLPQLQPQPQPQPQRDLISRYANSGLSEFS

|||||||||||||||||||||||||||||||||| |||||||||||||||||||||||||

orf1ng-1 ADKDTALAKQREAETRPATTAFPRARRARRDLPQPQPQPQPQPQRDLISRYANSGLSEFS

1140 1150 1160 1170 1180 1190

1190 1200 1210 1220 1230 1240

orf1-1.pep ATLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 ATLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLG

1200 1210 1220 1230 1240 1250

1250 1260 1270 1280 1290 1300

orf1-1.pep SGRVGILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGI

||||||||||||| |||||||||||||||||||||||| || ||||||||||||||||||

orf1ng-1 SGRVGILFSHNRTGNTFDDGIGNSARLAHGAVFGQYGIGRFDIGISAGAGFSSGSLSDGI

1260 1270 1280 1290 1300 1310

1310 1320 1330 1340 1350 1360

orf1-1.pep GGKIRRRVLHYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYR

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 RGKIRRRVLHYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYR

1320 1330 1340 1350 1360 1370

1370 1380 1390 1400 1410 1420

orf1-1.pep AGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf1ng-1 AGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEI

1380 1390 1400 1410 1420 1430

1430 1440 1450

orf1-1.pep KGFTLSLHAAAAKGPQLEAQHSAGIKLGYRWX

||||||||||||||||||||||||||||||||

orf 1ng-1 KGFTLSLHAAAAKGPQLEAQHSAGIKLGYRWX

1440 1450 1460

另外，ORF1ng和hap蛋白(P45387)在1455个氨基酸的重叠区内显示出有55.7％的相同性：

SCORES Initl：1104 Initn：4632 Opt：2680

Smith-Waterman评分：5165；在1455个氨基酸的重叠区内有55.7％的相同性

10 20 30 40 50 60

orf1ng-1.pep MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQARAGHTYFGINYQYYRDFAEN

| :|: |:|:||: || ||||||||:||||||||||

p45387 MKKTVFRLNFLTACISLGIVSQAWAGHTYFGIDYQYYRDFAEN

10 20 30 40

70 80 90 100 110 120

orf1ng-1.pep KGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALAGDQYIVSVAHNGGYN

||||:|||::|:||||:|:||| ||| |||||||||||||||||: :||||||||| ||:

p45387 KGKFTVGAQNIKVYNKQGQLVGTSMTKAPMIDFSVVSRNGVAALVENQYIVSVAHNVGYT

50 60 70 80 90 100

130 140 150 160 170 180

orf1ng-1.pep NVDFGAEGSNPDQHRFSYQIVKRNNYKAGTNGHPYGGDYHMPRLHKFVTDAEPVEMTSYM

:|||||||:|||||||:|:|||||||| | |||| ||| ||||||||:| |::||| |

p45387 DVDFGAEGNNPDQHRFTYKIVKRNNYKKD-NLHPYEDDYHNPRLHKFVTEAAPIDMTSNM

110 120 130 140 150 160

190 200 210 220 230 240

orf1ng-1.pep DGWKYADLNKYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGG

:| |:| :|||:|||||:|||:||:|:|: : ::|:|| :|::||| | |:|:

p45387 NGSTYSDRTKYPERVRIGSGRQFWRNDQDKGD------QVAGAYHYLTAGNTHNQRGAGN

170 180 190 200 210

250 260 270 280 290 300

orf1ng-1.pep GTVNLGSEKIKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGF

| ||:: | : || || :|| ||||||||||||:||||||||:|:||||: || |||

p45387 GYSYLGGDVRKAGEYGPLPIAGSKGDSGSPMFIYDAEKQKWLINGILREGNPFEGKENGF

220 230 240 250 260 270

310 320 330 340 350 360

orf1ng-1.pep QLVRKDWFYDEIFAGDTHSVFYEPHQNGKYFFNDNNNGAGKIDAKHKHYSLPYRLKTRTV

|||||::| |||| | |: :| || | :: |:|| |:| | ::| ::| :

p45387 QLVRKSYF-DEIFERDLHTSLYTRAGNGVYTISGNDNGQGSITQKS---GIPSEIK---I

280 290 300 310 320

370 380 390 400 410 419

orf1ng-1.pep QLFNVSLSETAREPVYHAA-GGVNSYRPRLNNGENISFIDKGKGELILTSNINQGAGGLY

| |:|| :: |:: | | | |||||||:: |:|: :| ||::|:|||||||||

p45387 TLANMSLPLKEKDKVHNPRYDGPNIYSPRLNNGETLYFMDQKQGSLIFASDINQGAGGLY

330 340 350 360 370 380

420 430 440 450 460 470 479

orf1ng-1.pep FEGNFTVSPKNNETWQGAGVHISDGSTVTWKVNGVANDRLSKIGKGTLLVQAKGENQGSV

|||||||||::|:||||||:|:|::|||||||||| :||||||||||| |||||||:||:

p45387 FEGNFTVSPNSNQTWQGAGIHVSENSTVTWKVNGVEHDRLSKIGKGTLHVQAKGENKGSI

390 400 410 420 430 440

480 490 500 510 520 530 539

orf1ng-1.pep SVGDGKVILDQQADDQGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNG

|||||||||:|||||||:||||||||||||||||||| |:||: ||:|||||||||||||

p45387 SVGDGKVILEQQADDQGNKQAFSEIGLVSGRGTVQLNDDKQFDTDKFYFGFRGGRLDLNG

450 460 470 480 490 500

540 550 560 570 580 590

orf1ng-1.pep HSLSFHRIQNTDEGAMIVNHNQDKESTVTITGNKDITT-TGNN-NNLDSKKEIAYNGWFG

|||:|:||||||||||||||| : ::||||||::|: :||| |:|| :||||||||||

p45387 HSLTFKRIQNTDEGAMIVNHNTTQAANVTITGNESIVLPNGNNINKLDYRKEIAYNGWFG

510 520 530 540 550 560

600 610 620 630 640 650

orf1ng-1.pep EKDATKTNGRLNLNYQPEEADRTLLLSGGTNLNGNITQTNGKLFFSGRPTPHAYNHLGSG

| | :| |||||| |:| ||||||||||||:|:||||:|||||||||||||||||::

p45387 ETDKNKHNGRLNLIYKPTTEDRTLLLSGGTNLKGDITQTKGKLFFSGRPTPHAYNHLNKR

570 580 590 600 610 620

660 670 680 690 700 710

orf1ng-1.pep WSKMEGIPQGEIVWDNDWIDRTFKAENFHIQGGQAVVSRNVAKVEGDWHLSNHAQAVFGV

||:||||||||||||:|||:||||||||:|:||:|||||||:::||:| :||:|:|:|||

p45387 WSEMEGIPQGEIVWDHDWINRTFKAENFQIKGGSAVVSRNVSSIEGNWTVSNNANATFGV

630 640 650 660 670 680

720 730 740 750 760 770

orf1ng-1.pep APHQSHTICTRSDWTGLTSCTEKTITDDKVIASLSKTDIRGNVSLADHAHLNLTGLATLN

:|:|::||||||||||||:| : :|| ||| |: ||:| |:::|:|:| |: ||| ||

p45387 VPNQQNTICTRSDWTGLTTCQKVDLTDTKVINSIPKTQINGSINLTDNATANVKGLAKLN

690 700 710 720 730 740

780 790 800 810 820 830

orf1ng-1.pep GNLSAGGDTHYTVTRNATQNGNLSLVGNAQATFNQATLNGNTSASDNASFNLSNNAVQNG

||:: :::::|:|||||:| |

p45387 GNVTL---------------------------------------TNHSQFTLSNNATQIG

750 760 770

840 850 860 870 880 890

orf1ng-1.pep SLTLSDNAKANVSHSALNGNVSLADKAVFHFENSRFTGKISGGKDTALHLKDSEWTLPSG

:: ||||: |:|::: ||||| |:|:| | ::||:|: :|:| | |:: |::: ||:||

p45387 NIRLSDNSTATVDNANLNGNVHLTDSAQFSLKNSHFSHQIQGDKGTTVTLENATWTMPSD

780 790 800 810 820 830

900 910 920 930 940 950

orf1ng-1.pep TELGNLNLDNATITLNSAYRHDAAGAQTGSAADAPRRRSRRSLLSVTPPTSAESRFNTLT

| | ||:|:|:|||||||| ::|: ::||||| | : | ||||| ||||||

p45387 TTLQNLTLNNSTITLNSAY--------SASSNNTPRRRS---LETETTPTSAEHRFNTLT

840 850 860 870

960 970 980 990 1000 1010

orf1ng-1.pep VNGKLNGQGTFRFMSELFGYRSGKLKLAESSEGTYTLAVNNTGNEPVSLEQLTVVEGKDN

|||||:|||||:| | ||||:| ||||::::|| | |:| |||:|| :|||||:||:|||

p45387 VNGKLSGQGTFQFTSSLFGYKSDKLKLSNDAEGDYILSVRNTGKEPETLEQLTLVESKDN

880 890 900 910 920 930

1020 1030 1040 1050 1060 1070

orf1ng-1.pep TPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAGETEAALTAK

|||::|:|||:|:|||||| ||:|:::|||||||||:||||| : | :| ::| :| ||

p45387 QPLSDKLKFTLENDHVDAGALRYKLVKNDGEFRLHNPIKEQELHNDLVRAEQAERTLEAK

940 950 960 970 980 990

1080 1090 1100 1110 1120 1130

orf1ng-1.pep QAQLAAKQQAEKDNAQSLDALIAAGRNAT-EKAESVAEPARQAGGENAGIMQAEEEKKRV

|:: :|| |: : :::| | || :: ::: | |:|| :| :::: : |:|

p45387 QVEPTAKTQTGEPKVRSRRAARAAFPDTLPDQSLLNALEAKQAE-LTAETQKSKAKTKKV

1000 1010 1020 1030 1040 1050

1140 1150 1160 1170 1180 1190

orf1ng-1.pep QADK---DTALAKQREAETRPATTAFPRARRARRD-LPQPQPQPQPQPQRDLISRYANSG

:: : : | | : | :: :::::| | | : : | : |:||||||:||:

p45387 RSKRAVFSDPLLDQSLFALEAALEVIDAPQQSEKDRLAQEEAEKQ-RKQKDLISRYSNSA

1060 1070 1080 1090 1100 1110

1200 1210 1220 1230 1240 1250

orf1ng-1.pep LSEFSATLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQ-TDLRQIG

|||:|||:||:::|||||||:|::: ::||||: :| ::| |: ||||:|| |:|||||

p45387 LSELSATVNSMLSVQDELDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQQKTNLRQIG

1120 1130 1140 1150 1160 1170

1260 1270 1280 1290 1300 1310

orf1ng-1.pep MQKNLGSGRVGILFSHNRTGNTFDDGIGNSARLAHGAVFGQYGIGRFDIGISAGAGFSSG

:|| |::||:| :|||:|: ||||: : | | |: : |:|| | :::|:::|:|:|::

p45387 VQKALANGRIGAVFSHSRSDNTFDEQVKNHATLTMMSGFAQYQWGDLQFGVNVGTGISAS

1180 1190 1200 1210 1220 1230

1320 1330 1340 1350 1360 1370

orf1ng-1.pep SLSDGIRGKIRRRVLHYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGL

:::: ||:|::::||::| |: :| :||:|::|::|||::: :|: |:| : ||:|

p45387 KMAEEQSRKIHRKAINYGVNASYQFRLGQLGIQPYFGVNRYFIERENYQSEEVRVKTPSL

1240 1250 1260 1270 1280 1290

1380 1390 1400 1410 1420 1430

orf1ng-1.pep AFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEW

||||| |||::||:| |:::||: ||: ::|:|:::::|:| || :|| | ||: : |

p45387 AFNRYNAGIRVDYTFTPTDNISVKPYFFVNYVDVSNANVQTTVNLTVLQQPFGRYWQKEV

1300 1310 1320 1330 1340 1350

1440 1450 1460 1469

orf1ng-1.pep GVNAEIKGFTLSLHAAAAKGPQLEAQHSAGIKLGYRWX

|::||| | :| : ::| || |:::|:||||||

p45387 GLKAEILHFQISAFISKSQGSQLGKQQNVGVKLGYRW

1360 1370 1380 1390

实施例78

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 655>：

1 ..AAGGTGTGGC AATTTGTCGA AGA.CCGCTG CGTGCCGTCG TGCCTGCCGA

51 CAGTTTTGAA CCGACCGCGC AAAAATTGAA CCTGTTTAAG GCGGGTGCGG

101 CAACCATTTT GTTTTATGAA GATCAAAATG TCGTCAAAGG TTTGCAGGAG

151 CAGTTCCCTG CTTATGCCGC TAACTTCCCC GTTTGGGCGg ATCAGGCAAA

201 CGCGATGGTG CAGTATGCCG TTTGGACGAC ACTTGCCGCG GTCGGCGTAG

251 GTGCAAACCT GCAACATTAC AATCCCTTGC CCGATGCGGC GATTGCCAAA

301 GCGTGGAATA TCCCCGAAAA CTGGTTGTTG CGCGCACAAA TGGTTATCGG

351 CGGTATTGAA GGGGCGGCAG GTGAAAAGAC CTTTGAACCC GTTGCAGAAC

401 GTTTGAAAGT GTTCGGCGCA TAA

它对应于氨基酸序列<SEQ ID 656；ORF6>：

1 ..KVWQFVEXPL RAVVPADSFE PTAQKLNLFK AGAATILFYE DQNVVKGLQE

51 QFPAYAANFP VWADQANAMV QYAVWTTLAA VGVGANLQHY NPLPDAAIAK

101 AWNIPENWLL RAQMVIGGIE GAAGEKTFEP VAERLKVFGA *

进一步的序列分析进一步揭示了部分DNA序列<SEQ ID 657>：

1 ..CTGCGTGCCG TCGTGCCTGC CGACAGTTTT GAACCGACCG CGCAAAAATT

51 GAACCTGTTT AAGGCGGGTG CGGCAACCAT TTTGTTTTAT GAAGATCAAA

101 ATGTCGTCAA AGGTTTGCAG GAGCAGTTCC CTGCTTATGC CGCTAACTTC

151 CCCGTTTGGG CGGATCAGGC AAACGCGATG GTGCAGTATG CCGTTTGGAC

201 GACACTTGCC GCGGTCGGCG TAGGTGCAAA CCTGCAACAT TACAATCCCT

251 TGCCCGATGC GGCGATTGCC AAAGCGTGGA ATATCCCCGA AAACTGGTTG

301 TTGCGCGCAC AAATGGTTAT CGGCGGTATT GAAGGGGCGG CAGGTGAAAA

351 GACCTTTGAA CCCGTTGCAG AACGTTTGAA AGTGTTCGGC GCATAA

它对应于氨基酸序列<SEQ ID 658；ORF6-1>：

1 ..LRAVVPADSF EPTAQKLNLF KAGAATILFY EDQNVVKGLQ EQFPAYAANF

51 PVWADQANAM VQYAVWTTLA AVGVGANLQH YNPLPDAAIA KAWNIPENWL

101 LRAQMVIGGI EGAAGEKTFE PVAERLKVFG A*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF6和脑膜炎奈瑟球菌菌株A的ORF(ORF6a)在140个氨基酸的重叠区内显示出有98.6％的相同性：

10 20 30

orf6.pep KVWQFVEXPLRAVVPADSFEPTAQKLNLFK

||||||| |||||||||||||||||||||

orf6a QIVEHAVLHTPSSFNSQSARVVVLFGEEHDKVWQFVEDALRAVVPADSFEPTAQKLNLFK

40 50 60 70 80 90

orf6.pep AGAATILFYEDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf6a AGAATILFYEDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHY

100 110 120 130 140 150

100 110 120 130 140

orf6.pep NPLPDAAIAKAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGAX

|||||||||||||||||||||||||||||||||||||||||||||||||||

orf6a NPLPDAAIAKAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGAX

160 170 180 190 200

全长ORF6a核苷酸序列<SEQ ID 659>是：

1 ATGACCCGTC AATCTCTGCA ACAGGCTGCC GAAAGCCGCC GTTCCATTTA

51 TTCGTTAAAT AAAAATCTGC CCGTCGGCAA AGATGAAATC GTCCAAATCG

101 TCGAACACGC CGTTTTGCAC ACACCTTCTT CGTTCAATTC CCAATCTGCC

151 CGTGTGGTCG TGCTGTTTGG CGAAGAGCAT GATAAGGTGT GGCAATTTGT

201 CGAAGACGCG CTGCGTGCCG TCGTGCCTGC CGACAGTTTT GAACCGACCG

251 CGCAAAAATT GAACCTGTTT AAGGCGGGTG CGGCAACTAT TTTGTTTTAT

301 GAAGATCAAA ATGTCGTCAA AGGTTTGCAG GAGCAGTTCC CTGCTTATGC

351 CGCCAACTTT CCCGTTTGGG CGGACCAGGC GAACGCGATG GTGCAGTATG

401 CCGTTTGGAC GACACTTGCC GCGGTCGGCG TAGGTGCAAA CCTGCAACAT

451 TACAATCCCT TGCCCGATGC GGCGATTGCC AAAGCGTGGA ATATCCCCGA

501 AAACTGGTTG TTGCGCGCAC AAATGGTTAT CGGCGGTATT GAAGGGGCGG

551 CAGGTGAAAA GACCTTTGAA CCAGTTGCAG AACGTTTGAA AGTGTTCGGC

601 GCATAA

预计它编码的蛋白质具有氨基酸序列<SEQ ID 660>：

1 MTRQSLQQAA ESRRSIYSLN KNLPVGKDEI VQIVEHAVLH TPSSFNSQSA

51 RVVVLFGEEH DKVWQFVEDA LRAVVPADSF EPTAQKLNLF KAGAATILFY

101 EDQNVVKGLQ EQFPAYAANF PVWADQANAM VQYAVWTTLA AVGVGANLQH

151 YNPLPDAAIA KAWNIPENWL LRAQMVIGGI EGAAGEKTFE PVAERLKVFG

201 A*

ORF6a和ORF6-1在131个氨基酸的重叠区内显示出有100.0％的相同性：

50 60 70 80 90 100

orf6a.pep TPSSFNSQSARVVVLFGEEHDKVWQFVEDALRAVVPADSFEPTAQKLNLFKAGAATILFY

||||||||||||||||||||||||||||||

orf6-1 LRAVVPADSFEPTAQKLNLFKAGAATILFY

10 20 30

110 120 130 140 150 160

orf6a.pep EDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHYNPLPDAAIA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf6-1 EDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHYNPLPDAAIA

40 50 60 70 80 90

170 180 190 200

orf6a.pep KAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGAX

||||||||||||||||||||||||||||||||||||||||||

orf6-1 KAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGAX

100 110 120 130

与淋病奈瑟球菌的预计ORF的同源性

ORF6和淋病奈瑟球菌的预计ORF(ORF6ng)在140个氨基酸的重叠区内显示出有95.7％的相同性：

orf6.pep KVWQFVEXPLRAVVPADSFEPTAQKLNLFK 30

||||||| |||||||||||||||||:|||

orf6ng SNVSLDMSNPTVLRMGLPLYIASLRRGAIYKVWQFVEDALRAVVPADSFEPTAQKLKLFK 64

orf6.pep AGAATILFYEDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHY 90

||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||

orf6ng AGAATILFYEDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGAGANLQHY 124

orf6.pep NPLPDAAIAKAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGA 140

|||||:||||||||||||||||||||||||||||||:|||||||||||||

orf6ng NPLPDVAIAKAWNIPENWLLRAQMVIGGIEGAAGEKVFEPVAERLKVFGA 174

鉴定出全长ORF6ng核苷酸序列<SEQ ID 661>：

1 ATGGCCGTTG CGTCAAATGT CAGCTTGGAT ATGTCCAATC CTACGGTGTT

51 ACGCATGGGA TTACCCTTAT ATATTGCGTC CCTAAGAAGG GGCGCAATAT

101 ATAAGGTGTG GCAATTTGTC GAAGACGCGC TGCGTGCCGT CGTGCCTGCC

151 GACAGTTTTG AACCGACCGC GCAAAAATTG AAGCTGTTTA AGGCGGGCGC

201 GGCAACCATT TTGTTTTATG AAGATCAAAA TGTCGTCAAA GGTTTGCAGG

251 AGCAGTTCCC TGCTTATGCC GCCAACTTTC CCGTTTGGGC GGACCAGGCG

301 AACGCTATGG TACAGTATGC CGTCTGGACG ACACTTGCCG CGGTCGGTGC

351 AGGTGCAAAT CTGCAACATT ACAACCCCTT GCCCGATGTG GCGATTGCTA

401 AAGCGTGGAA TATTCCCGAA AACTGGCTGT TGCGCGCGCA AATGGTTATC

451 GGTGGTATTG AAGGGGcggc aggtgaaaaa gtctttgaac CCGTTGCgga

501 acgtttgAAA GTGTTCGGCG CATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 662>：

1 MAVASNVSLD MSNPTVLRMG LPLYIASLRR GAIYKVWQFV EDALRAVVPA

51 DSFEPTAQKL KLFKAGAATI LFYEDQNVVK GLQEQFPAYA ANFPVWADQA

101 NAMVQYAVWT TLAAVGAGAN LQHYNPLPDV AIAKAWNIPE NWLLRAQMVI

151 GGIEGAAGEK VFEPVAERLK VFGA*

ORF6ng和ORF6-1在131个氨基酸的重叠区内显示出有96.9％的相同性：

10 20 30

orf6-1.pep LRAVVPADSFEPTAQKLNLFKAGAATILFY

|||||||||||||||||:||||||||||||

orf6ng PTVLRMGLPLYIASLRRGAIYKVWQFVEDALRAVVPADSFEPTAQKLKLFKAGAATILFY

20 30 40 50 60 70

40 50 60 70 80 90

orf6-1.pep EDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGVGANLQHYNPLPDAAIA

|||||||||||||||||||||||||||||||||||||||||||:||||||||||||:|||

orf6ng EDQNVVKGLQEQFPAYAANFPVWADQANAMVQYAVWTTLAAVGAGANLQHYNPLPDVAIA

80 90 100 110 120 130

100 110 120 130

orf6-1.pep KAWNIPENWLLRAQMVIGGIEGAAGEKTFEPVAERLKVFGAX

|||||||||||||||||||||||||||:||||||||||||||

orf6ng KAWNIPENWLLRAQMVIGGIEGAAGEKVFEPVAERLKVFGAX

140 150 160 170

预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例79

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 663>

1 ..GGCTACAACT ACCTGTTCGC GCGCGGCAGC CGCATCGCCA ACTACCAAAT

51 CAACGGCATC CCCGTTGCCG ACGCGCTGGC CGATACGGG

CAATGCCAAC

101 ACCGCCGCCT ATGAGCGCGT AGAAGTCGTG CGCGGCGTGG CGGGGCTGCT

151 GGACGGCACG GGCGAGCCTT CCGCCACCGT CAATCTGGTG CGCAAACGCC

201 TGACCCGCAA GCCATTGTTT GAAGTCCGCG CCGAAGCgGG CAACCGcAAA

251 CATTTCGGGC TGGACGCGGA CGTATCGGGC AGCCTGAACA CCGAAG.crC

301 rCTGCGCgGC CGCCTGGTTT CCAcCTTCGG ACGCGGCGAC TCGTGGCGGC

351 GGCGCGAACG CAGCCGskAT GCCGAACTCT ACGGCATTTT GGAATACGAC

401 ATCGCACCGC AAACCCGCGT CCACGCArGC ATGGACTACC AGCAGGCGAA

451 AGAAACCGCC GACGCGCCGC TCAGcTACGC CGTGTACGAC AGCCAAGGTT

501 ATGCCACCGC CTTCGGCCCG AAAGACAACC CCGCCACAAA TTGGGCGAAC

551 AGCCACCACC GTGCGCTCAA CCTGTTCGCC GGCATCGAAC ACCGCTTCAA

601 CCAAGACTGG AAACTCAAAG CCGAATACGA CTAC..

它对应于氨基酸序列<SEQ ID 664；ORF23>：

1 ..GYNYLFARGS RIANYQINGI PVADALADTG NANTAAYERV EVVRGVAGLL

51 DGTGEPSATV NLVRKRLTRK PLFEVRAEAG NRKHFGLDAD VSGSLNTEXX

101 LRGRLVSTFG RGDSWRRRER SRXAELYGIL EYDIAPQTRV HAXMDYQQAK

151 ETADAPLSYA VYDSQGYATA FGPKDNPATN WANSHHRALN LFAGIEHRFN

201 QDWKLKAEYD Y..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 665>：

1 ATGACACGCT TCAAATATTC CCTGCTGTTT GCCGCCCTGT TGCCCGTGTA

51 CGCGCAGGCC GATGTTTCTG TTTCAGACGA CCCCAAACCG CAGGAAAGCA

101 CTGAATTGCC GACCATCACC GTTACCGCCG ACCGCACCGC GAGTTCCAAC

151 GACGGCTACA CTGTTTCCGG CACGCACACC CCGCTCGGGC TGCCCATGAC

201 CCTGCGCGAA ATCCCGCAGA GCGTCAGCGT CATCACATCG CAACAAATGC

251 GCGACCAAAA CATCAAAACG CTCGACCGCG CCCTGTTGCA GGCGACCGGC

301 ACCAGCCGCC AGATTTACGG CTCCGACCGC GCGGGCTACA ACTACCTGTT

351 CGCGCGCGGC AGCCGCATCG CCAACTACCA AATCAACGGC ATCCCCGTTG

401 CCGACGCGCT GGCCGATACG GGCAATGCCA ACACCGCCGC CTATGAGCGC

451 GTAGAAGTCG TGCGCGGCGT GGCGGGGCTG CTGGACGGCA CGGGCGAGCC

501 TTCCGCCACC GTCAATCTGG TGCGCAAACG CCTGACCCGC AAGCCATTGT

551 TTGAAGTCCG CGCCGAAGCG GGCAACCGCA AACATTTCGG GCTGGACGCG

601 GACGTATCGG GCAGCCTGAA CACCGAAGGC ACGCTGCGCG GCCGCCTGGT

651 TTCCACCTTC GGACGCGGCG ACTCGTGGCG GCGGCGCGAA CGCAGCCGCG

701 ATGCCGAACT CTACGGCATT TTGGAATACG ACATCGCACC GCAAACCCGC

751 GTCCACGCAG GCATGGACTA CCAGCAGGCG AAAGAAACCG CCGACGCGCC

801 GCTCAGCTAC GCCGTGTACG ACAGCCAAGG TTATGCCACC GCCTTCGGCC

851 CGAAAGACAA CCCCGCCACA AATTGGGCGA ACAGCCGCCA CCGTGCGCTC

901 AACCTGTTCG CCGGCATCGA ACACCGCTTC AACCAAGACT GGAAACTCAA

951 AGCCGAATAC GACTACACCC GCAGCCGCTT CCGCCAGCCC TACGGCGTAG

1001 CAGGCGTGCT TTCCATCGAC CACAACACCG CCGCCACCGA CCTGATTCCC

1051 GGTTATTGGC ACGCCGACCC GCGCACCCAC AGCGCCAGCG TGTCATTGAT

1101 CGGCAAATAC CGCCTGTTCG GCCGCGAACA CGATTTAATC GCGGGTATCA

1151 ACGGTTACAA ATACGCCAGC AACAAATACG GCGAACGCAG CATCATCCCC

1201 AACGCCATTC CCAACGCCTA CGAATTTTCC CGCACGGGTG CCTACCCGCA

1251 GCCTGCATCG TTTGCCCAAA CCATCCCGCA ATACGGCACC AGGCGGCAAA

1301 TCGGCGGCTA TCTCGCCACC CGTTTCCGCG CCGCCGACAA CCTTTCGCTG

1351 ATTTTGGGCG GACGATACAC CCGTTACCGC ACCGGCAGCT ACGACAGCCG

1401 CACACAAGGC ATGACCTATG TGTCCGCCAA CCGTTTCACC CCCTACACAG

1451 GCATCGTGTT CGACCTGACC GGCAACCTGT CTCTTTACGG CTCGTACAGC

1501 AGCCTGTTCG TCCCGCAATC GCAAAAAGAC GAACACGGCA GCTACCTGAA

1551 ACCCGTAACC GGCAACAATC TGGAAGCCGG CATCAAAGGC GAATGGCTTG

1601 AAGGCCGTCT GAACGCATCC GCCGCCGTGT ACCGCGCCCG TAAAAACAAC

1651 CTCGCCACCG CAGCAGGACG CGACCCGAGC GGCAACACCT ACTACCGCGC

1701 CGCCAACCAA GCCAAAACCC ACGGCTGGGA AATCGAAGTC GGCGGCCGCA

1751 TCACGCCCGA ATGGCAGATA CAGGCAGGTT ACAGCCAAAG CAAAACCCGC

1801 GACCAAGACG GCAGCCGCCT GAACCCCGAC AGCGTACCCG AACGCAGCTT

1851 CAAACTCTTC ACTGCCTACC ACTTTGCCCC CGAAGCCCCC AGCGGCTGGA

1901 CCATCGGCGC AGGCGTGCGC TGGCAGAGCG AAACCCACAC CGACCCTGCC

1951 ACGCTCCGCA TCCCCAACCC CGCCGCCAAA GCCCGCGCCG CCGACAACAG

2001 CCGCCAAAAA GCCTACGCCG TCGCCGACAT CATGGCGCGT TACCGCTTCA

2051 ATCCGCGCGC CGAACTGTCG CTGAACGTGG ACAATCTGTT CAACAAACAC

2101 TACCGCACCC AGCCCGACCG CCACAGCTAC GGCGCACTGC GGACAGTGAA

2151 CGCGGCGTTT ACCTATCGGT TTAAATAA

它对应于氨基酸序列<SEQ ID 666；ORF23-1>：

1 MTRFKYSLLF AALLPVYAQA DVSVSDDPKP QESTELPTIT VTADRTASSN

51 DGYTVSGTHT PLGLPMTLRE IPQSVSVITS QQMRDQNIKT LDRALLQATG

101 TSRQIYGSDR AGYNYLFARG SRIANYQING IPVADALADT GNANTAAYER

151 VEVVRGVAGL LDGTGEPSAT VNLVRKRLTR KPLFEVRAEA GNRKHFGLDA

201 DVSGSLNTEG TLRGRLVSTF GRGDSWRRRE RSRDAELYGI LEYDIAPQTR

251 VHAGMDYQQA KETADAPLSY AVYDSQGYAT AFGPKDNPAT NWANSRHRAL

301 NLFAGIEHRF NQDWKLKAEY DYTRSRFRQP YGVAGVLSID HNTAATDLIP

351 GYWHADPRTH SASVSLIGKY RLFGREHDLI AGINGYKYAS NKYGERSIIP

401 NAIPNAYEFS RTGAYPQPAS FAQTIPQYGT RRQIGGYLAT RFRAADNLSL

451 ILGGRYTRYR TGSYDSRTQG MTYVSANRFT PYTGIVFDLT GNLSLYGSYS

501 SLFVPQSQKD EHGSYLKPVT GNNLEAGIKG EWLEGRLNAS AAVYRARKNN

551 LATAAGRDPS GNTYYRAANQ AKTHGWEIEV GGRITPEWQI QAGYSQSKTR

601 DQDGSRLNPD SVPERSFKLF TAYHFAPEAP SGWTIGAGVR WQSETHTDPA

651 TLRIPNPAAK ARAADNSRQK AYAVADIMAR YRFNPRAELS LNVDNLFNKH

701 YRTQPDRHSY GALRTVNAAF TYRFK*

该氨基酸序列的计算机分析给出了下列结果：

与恶臭假单胞菌的铁-假单胞菌素受体PupB(登录号为P38047)的同源性

ORF23和PupB蛋白在205个氨基酸的重叠区内显示出有32％的氨基酸相同性：

Orf23 6 FARGSRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRK 65

++RG I NY+++G+P + L D + + A ++RVE+VRG GL+ G G PSAT+NL+RK

PupB 215 WSRGFAIQNYEVDGVPTSTRL-DNYSQSMAMFDRVEIVRGATGLISGMGNPSATINLIRK 273

Orf23 66 RLTRKPLFEVRAEAGNRKHFGLDADVSGSLNTEXXLRGRLVSTFXXXXXXXXXXXXXXAE 125

R T+ + EAGN +G DVSG L +RGR V+ +

PupB 274 RPTAEAQASITGEAGNWDRYGTGFDVSGPLTETGNIRGRFVADYKTEKAWIDRYNQQSQL 333

Orf23 126 LYGILEYDIAPQTRVHAXMDYQQAKETADAPLSYAVYD--SQGYATAFGPKDNPATNWAN 183

+YGI E+D++ T + Y + D+PL + S G T N A +W+

PupB 334 MYGITEFDLSEDTLLTVGFSY--LRSDIDSPLRSGLPTRFSTGERTNLKRSLNAAPDWSY 391

Orf23 184 SHHRALNLFAGIEHRFNQDWKLKAE 208

+ H + F IE + W K E

PupB 392 NDHEQTSFFTSIEQQLGNGWSGKIE 416

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF23和脑膜炎奈瑟球菌菌株A的ORF(ORF23a)在211个氨基酸的重叠区内显示出有95.7％的相同性：

10 20 30

orf23.pep GYNYLFARGSRIANYQINGIPVADALADTG

||||||||||||||||||||||||||||||

orf23a QMRDQNIKALDRALLQATGTSRQIYGSDRAGYNYLFARGSRIANYQINGIPVADALADTG

90 100 110 120 130 140

40 50 60 70 80 90

orf23.pep NANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRKRLTRKPLFEVRAEAGNRKHFGLDAD

|||||||||||||||||||||||||||||||||||| |||||||||||||||||||| ||

orf23a NANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRKRPTRKPLFEVRAEAGNRKHFGLGAD

150 160 170 180 190 200

100 110 120 130 140 150

orf23.pep VSGSLNTEXXLRGRLVSTFGRGDSWRRRERSRXAELYGILEYDIAPQTRVHAXMDYQQAK

||||||:| :||||||||||||||||:||||| ||||||||||||||||||| |||||||

orf23a VSGSLNAEGTLRGRLVSTFGRGDSWRQRERSRDAELYGILEYDIAPQTRVHAGMDYQQAK

210 220 230 240 250 260

160 170 180 190 200 210

orf23.pep ETADAPLSYAVYDSQGYATAFGPKDNPATNWANSHHRALNLFAGIEHRFNQDWKLKAEYD

||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||

orf23a ETADAPLSYAVYDSQGYATAFGPKDNPATNWANSRHRALNLFAGIEHRFNQDWKLKAEYD

270 280 290 300 310 320

orf23.pep Y

|

orf23a YTRSRFRQPYGVAGVLSIDHNTAATDLIPGYWHADPRTHSASVSLIGKYRLFGREHDLIA

330 340 350 360 370 380

全长ORF23a核苷酸序列<SEQ ID 667>是：

1 ATGACACGCT TCAAATATTC CCTGCTGTTT GCCGCCCTGT TGCCCGTGTA

51 CGCGCAGGCC GATGTTTCTG TTTCAGACGA CCCAAAACCG CAGGAAAGCA

101 CTGAATTGCC GACCATCACC GTTACCGCCG ACCGCACCGC GAGTTCCAAC

151 GACGGCTACA CTGTTTCCGG CACGCACACC CCGCTCGGGC TGCCCATGAC

201 CCTGCGCGAA ATCCCGCAGA GCGTCAGCGT CATCACATCG CAACAAATGC

251 GCGACCAAAA CATCAAAGCG CTCGACCGCG CCCTGTTGCA GGCGACCGGC

301 ACCAGCCGCC AGATTTACGG CTCCGACCGC GCGGGCTACA ACTACCTGTT

351 CGCGCGCGGC AGCCGCATCG CCAACTACCA AATCAACGGC ATCCCCGTTG

401 CCGACGCGCT GGCCGATACG GGCAATGCCA ACACCGCCGC CTATGAGCGC

451 GTAGAAGTCG TGCGCGGCGT GGCGGGGCTG CTGGACGGCA CGGGCGAGCC

501 TTCCGCCACC GTCAATCTGG TGCGCAAACG CCCGACCCGC AAGCCATTGT

551 TTGAAGTCCG CGCCGAAGCG GGCAACCGCA AACATTTCGG GCTGGGCGCG

601 GACGTATCGG GCAGCCTGAA TGCCGAAGGC ACGCTGCGCG GCCGCCTGGT

651 TTCCACCTTC GGACGCGGCG ACTCGTGGCG GCAGCGCGAA CGCAGCCGCG

701 ATGCCGAACT CTACGGCATT TTGGAATACG ACATCGCACC GCAAACCCGC

751 GTCCACGCAG GCATGGACTA CCAGCAGGCG AAAGAAACCG CCGACGCGCC

801 GCTCAGCTAC GCCGTGTACG ACAGCCAAGG TTATGCCACC GCCTTCGGCC

851 CGAAAGACAA CCCCGCCACA AATTGGGCGA ACAGCCGCCA CCGTGCGCTC

901 AACCTGTTCG CCGGCATCGA ACACCGCTTC AACCAAGACT GGAAACTCAA

951 AGCCGAATAC GACTACACCC GCAGCCGCTT CCGCCAGCCC TACGGCGTAG

1001 CAGGCGTGCT TTCCATCGAC CACAACACCG CCGCCACCGA CCTGATTCCC

1051 GGTTATTGGC ACGCCGACCC GCGCACCCAC AGCGCCAGCG TGTCATTAAT

1101 CGGCAAATAC CGCCTGTTCG GCCGCGAACA CGATTTAATC GCGGGTATCA

1151 ACGGTTACAA ATACGCCAGC AACAAATACG GCGAACGCAG CATCATCCCC

1201 AACGCCATTC CCAACGCCTA CGAATTTTCC CGCACGGGTG CCTACCCGCA

1251 GCCTGCATCG TTTGCCCAAA CCATCCCGCA ATACGGCACC AGGCGGCAAA

1301 TCGGCGGCTA TCTCGCCACC CGTTTCCGCG CCGCCGACAA CCTTTCGCTG

1351 ATACTCGGCG GCAGATACAG CCGTTACCGC ACCGGCAGCT ACGACAGCCG

1401 CACACAAGGC ATGACCTATG TGTCCGCCAA CCGTTTCACC CCCTACACAG

1451 GCATCGTGTT CGACCTGACC GGCAACCTGT CGCTTTACGG CTCGTACAGC

1501 AGCCTGTTCG TCCCGCAATC GCAAAAAGAC GAACACGGCA GCTACCTGAA

1551 ACCCGTAACC GGCAACAATC TGGAAGCCGG CATCAAAGGC GAATGGCTTG

1601 AAGGCCGTCT GAACGCATCC GCCGCCGTGT ACCGCGCCCG TAAAAACAAC

1651 CTCGCCACCG CAGCAGGACG CGACCCGAGC GGCAACACCT ACTACCGCGC

1701 CGCCAACCAA GCCAAAACCC ACGGCTGGGA AATCGAAGTC GGCGGCCGCA

1751 TCACGCCCGA ATGGCAGATA CAGGCAGGTT ACAGCCAAAG CAAAACCCGC

1801 GACCAAGACG GCAGCCGCCT GAACCCCGAC AGCGTACCCG AACGCAGCTT

1851 CAAACTCTTC ACTGCCTACC ACTTTGCCCC CGAAGCCCCC AGCGGCTGGA

1901 CCATCGGCGC AGGCGTGCGC TGGCAGAGCG AAACCCACAC CGACCCTGCC

1951 ACGCTCCGCA TCCCCAACCC CGCCGCCAAA GCCCGCGCCG CCGACAACAG

2001 CCGCCAAAAA GCCTACGCCG TCGCCGACAT CATGGCGCGT TACCGCTTCA

2051 ATCCGCGCGC CGAACTGTCG CTGAACGTGG ACAATCTGTT CAACAAACAC

2101 TACCGCACCC AGCCCGACCG CCACAGCTAC GGCGCACTGC GGACAGTGAA

2151 CGCGGCGTTT ACCTATCGGT TTAAATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 668>：

1 MTRFKYSLLF AALLPVYAQA DVSVSDDPKP QESTELPTIT VTADRTASSN

51 DGYTVSGTHT PLGLPMTLRE IPQSVSVITS QQMRDQNIKA LDRALLQATG

101 TSRQIYGSDR AGYNYLFARG SRIANYQING IPVADALADT GNANTAAYER

151 VEVVRGVAGL LDGTGEPSAT VNLVRKRPTR KPLFEVRAEA GNRKHFGLGA

201 DVSGSLNAEG TLRGRLVSTF GRGDSWRQRE RSRDAELYGI LEYDIAPQTR

251 VHAGMDYQQA KETADAPLSY AVYDSQGYAT AFGPKDNPAT NWANSRHRAL

301 NLFAGIEHRF NQDWKLKAEY DYTRSRFRQP YGVAGVLSID HNTAATDLIP

351 GYWHADPRTH SASVSLIGKY RLFGREHDLI AGINGYKYAS NKYGERSIIP

401 NAIPNAYEFS RTGAYPQPAS FAQTIPQYGT RRQIGGYLAT RFRAADNLSL

451 ILGGRYSRYR TGSYDSRTQG MTYVSANRFT PYTGIVFDLT GNLSLYGSYS

501 SLFVPQSQKD EHGSYLKPVT GNNLEAGIKG EWLEGRLNAS AAVYRARKNN

551 LATAAGRDPS GNTYYRAANQ AKTHGWEIEV GGRITPEWQI QAGYSQSKTR

601 DQDGSRLNPD SVPERSFKLF TAYHFAPEAP SGWTIGAGVR WQSETHTDPA

651 TLRIPNPAAK ARAADNSRQK AYAVADIMAR YRFNPRAELS LNVDNLFNKH

701 YRTQPDRHSY GALRTVNAAF TYRFK*

ORF23a和ORF23-1在725个氨基酸的重叠区内显示出有99.2％的相同性：

10 20 30 40 50 60

orf23a.pep MTRFKYSLLFAALLPVYAQADVSVSDDPKPQESTELPTITVTADRTASSNDGYTVSGTHT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 MTRFKYSLLFAALLPVYAQADVSVSDDPKPQESTELPTITVTADRTASSNDGYTVSGTHT

10 20 30 40 50 60

70 80 90 100 110 120

orf23a.pep PLGLPMTLREIPQSVSVITSQQMRDQNIKALDRALLQATGTSRQIYGSDRAGYNYLFARG

|||||||||||||||||||||||||||||||||:||||||||||||||||||||||||||

orf23-1 PLGLPMTLREIPQSVSVITSQQMRDQNIKTLDRALLQATGTSRQIYGSDRAGYNYLFARG

70 80 90 100 110 120

130 140 150 160 170 180

orf23a.pep SRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRKRPTR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||

orf23-1 SRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRKRLTR

130 140 150 160 170 180

190 200 210 220 230 240

orf23a.pep KPLFEVRAEAGNRKHFGLGADVSGSLNAEGTLRGRLVSTFGRGDSWRQRERSRDAELYGI

|||||||||||||||||| ||||||||;|||||||||||||||||||:||||||||||||

orf23-1 KPLFEVRAEAGNRKHFGLDADVSGSLNTEGTLRGRLVSTFGRGDSWRRRERSRDAELYGI

190 200 210 220 230 240

250 260 270 280 290 300

orf23a.pep LEYDIAPQTRVHAGMDYQQAKETADAPLSYAVYDSQGYATAFGPKDNPATNWANSRHRAL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 LEYDIAPQTRVHAGMDYQQAKETADAPLSYAVYDSQGYATAFGPKDNPATNWANSRHRAL

250 260 270 280 290 300

310 320 330 340 350 360

orf23a.pep NLFAGIEHRFNQDWKLKAEYDYTRSRFRQPYGVAGVLSIDHNTAATDLIPGYWHADPRTH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 NLFAGIEHRFNQDWKLKAEYDYTRSRFRQPYGVAGVLSIDHNTAATDLIPGYWHADPRTH

310 320 330 340 350 360

370 380 390 400 410 420

orf23a.pep SASVSLIGKYRLFGREHDLIAGINGYKYASNKYGERSIIPNAIPNAYEFSRTGAYPQPAS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 SASVSLIGKYRLFGREHDLIAGINGYKYASNKYGERSIIPNAIPNAYEFSRTGAYPQPAS

370 380 390 400 410 420

430 440 450 460 470 480

orf23a.pep FAQTIPQYGTRRQIGGYLATRFRAADNLSLILGGRYSRYRTGSYDSRTQGMTYVSANRFT

||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||

orf23-1 FAQTIPQYGTRRQIGGYLATRFRAADNLSLILGGRYTRYRTGSYDSRTQGMTYVSANRFT

430 440 450 460 470 480

490 500 510 520 530 540

orf23a.pep PYTGIVFDLTGNLSLYGSYSSLFVPQSQKDEHGSYLKPVTGNNLEAGIKGEWLEGRLNAS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 PYTGIVFDLTGNLSLYGSYSSLFVPQSQKDEHGSYLKPVTGNNLEAGIKGEWLEGRLNAS

490 500 510 520 530 540

550 560 570 580 590 600

orf23a.pep AAVYRARKNNLATAAGRDPSGNTYYRAANQAKTHGWEIEVGGRITPEWQIQAGYSQSKTR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 AAVYRARKNNLATAAGRDPSGNTYYRAANQAKTHGWEIEVGGRITPEWQIQAGYSQSKTR

550 560 570 580 590 600

610 620 630 640 650 660

orf23a.pep DQDGSRLNPDSVPERSFKLFTAYHFAPEAPSGWTIGAGVRWQSETHTDPATLRIPNPAAK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 DQDGSRLNPDSVPERSFKLFTAYHFAPEAPSGWTIGAGVRWQSETHTDPATLRIPNPAAK

610 620 630 640 650 660

670 680 690 700 710 720

orf23a.pep ARAADNSRQKAYAVADIMARYRFNPRAELSLNVDNLFNKHYRTQPDRHSYGALRTVNAAF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23-1 ARAADNSRQKAYAVADIMARYRFNPRAELSLNVDNLFNKHYRTQPDRHSYGALRTVNAAF

670 680 690 700 710 720

orf23a.pep TYRFKX

||||||

orf23-1 TYRFKX

与淋病奈瑟球菌的预计ORF的同源性

ORF23和淋病奈瑟球菌的预计ORF(ORF23.ng)在211个氨基酸的重叠区内显示出有93.4％的相同性：

orf23.pep GYNYLFARGSRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLLD 51

||||||||||||||||||||||||||||||||||||||||||||||||| |

orf23ng SAVDACRIPGYNYLFARGSRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLPD 60

orf23.pep GTGEPSATVNLVRKRLTRKPLFEVRAEAGNRKHFGLDADVSGSLNTEXXLRGRLVSTFGR 111

||||||||||||||: |||||||||||||||||||| ||||||||:| :|||||||||||

orf23ng GTGEPSATYNLVRKHPTRKPLFEVRAEAGNRKHFGLGADVSGSLNAEGTLRGRLVSTFGR 120

orf23.pep GDSWRRRERSRXAELYGILEYDIAPQTRVHAXMDYQQAKETADAPLSYAVYDSQGYATAF 171

|||||: |||| ||||||||||||||||||| ||||||||||||||||||||||||||||

orf23ng GDSWRQLERSRDAELYGILEYDIAPQTRVHAGMDYQQAKETADAPLSYAVYDSQGYATAF 180

orf23.pep GPKDNPATNWANSHHRALNLFAGIEHRFNQDWKLKAEYDY 211

||||||||||:||::|||||||||||||||||||||||||

orf23ng GPKDNPATNWSNSRNRALNLFAGIEHRFNQDWKLKAEYDYTRSRFRQPYGVAGVLSIDHS 240

预计ORF23ng核苷酸序列<SEQ ID 669>编码的蛋白质包含氨基酸序列<SEQ ID670>：

1 SAVDACRIPG YNYLFARGSR IANYQINGIP VADALADTGN ANTAAYERVE

51 VVRGVAGLPD GTGEPSATVN LVRKHPTRKP LFEVRAEAGN RKHFGLGADV

101 SGSLNAEGTL RGRLVSTFGR GDSWRQLERS RDAELYGILE YDIAPQTRVH

151 AGMDYQQAKE TADAPLSYAV YDSQGYATAF GPKDNPATNW SNSRNRALNL

201 FAGIEHRFNQ DWKLKAEYDY TRSRFRQPYG VAGVLSIDHS TAATDLIPGY

251 WHADPRTHSA SMSLTGKYRL FGREHDLIAG INGYKYASNK YGERSIIPNA

301 IPNAYEFSRT GAYPQPSSFA QTIPQYDTRR QIGGYLATRF RAADNLSLIL

351 GGRYSRYRAG SYNSRTQGMT YVSANRFTPY TGIVFDLTGN LSLYGSYSSL

401 FVPQLQKDEH GSYLKPVTGN NLEADIKGEW LEGRLNASAA VYRARKNNLA

451 TAAGRDQSGN TYYRAANQAK THGWEIEVGG RITPEWQIQA GYSQSKPRDQ

501 DGSRLNPDSV PERSFKLFTA YHLAPEAPSG RTIGAGVRRQ GETHTDPAAL

551 RIPNPAAKAR AVANSRQKAY AVADIMARYR FNPRTELSLN VDNLFNKHYR

601 TQPDRHSYGA LRTVNAAFTY RFK*

进一步的工作揭示了其完整的核苷酸序列<SEQ ID 671>：

1 ATGACACGCT TCAAATACTC CCTGCTTTTT GCCGCCCTGC TACCCGTGTA

51 CGCGCAGGCC GATGTTTCTG TTTCAGACGA CCCCAAACCG CAGGAAAGCA

101 CCGAATTGCC GACCATCACC GTTACCGCCG ACCGCACCGC GAGTTCCAAC

151 GACGGCTACA CCGTTTCCGG CACGCACACC CCGTTCGGGC TGCCCATGAC

201 CCTGCGCGAA ATCCCGCAGA GCGTCAGCGT CATCACATCG CAACAAATGC

251 GCGACCAAAA CATCAAAACG CTCGACCGCG CCCTGTTGCA GGCGACCGGC

301 ACCAGCCGCC AGATTTACGG CTCCGACCGC GCGGGCTACA ACTACCTGTT

351 CGCGCGCGGC AGCCGCATCG CCAACTACCA AATCAACGGC ATCCCCGTTG

401 CCGACGCGCT GGCCGATACG GGCAATGCCA ACACCGCCGC CTATGAGCGC

451 GTAGAAGTCG TGCGCGGCGT GGCGGGGCTG CCGGACGGCA CGGGCGAGCC

501 TTCTGCCACC GTCAATCTGG TACGCAAACA CCCGACCCGC AAGCCATTGT

551 TTGAAGTCCG CGCCGAAGCC GGCAACCGCA AACATTTCGG GCTGGGCGCG

601 GACGTATCGG GCAGCCTGAA CGCCGAAGGC ACGCTGCGCG GCCGCCTGGT

651 TTCCACCTTC GGACGCGGCG ACTCGTGGCG GCAGCTCGAA CGCAGCCGCG

701 ATGCCGAACT CTACGGCATT TTGGAATACG ACATCGCACC GCAAACCCGC

751 GTCCACGCAG GCATGGACTA CCAGCAGGCG AAAGAAACCG CAGACGCGCC

801 GCTCAGCTAC GCCGTGTACG ACAGCCAAGG TTATGCCACC GCCTTCGGCC

851 CAAAAGACAA CCCCGCCACA AATTGGTCGA ACAGCCGCAA CCGTGCGCTC

901 AACCTGTTCG CCGGCATAGA ACACCGCTTC AACCAAGACT GGAAACTCAA

951 AGCCGAATAC GACTACACCC GTAGCCGCTT CCGCCAGCCC TACGGTGTGG

1001 CAGGCGTACT TTCCATCGAC CACAGCACTG CCGCCACCGA CCTGATTCCC

1051 GGTTATTGGC ACGCcgatcc GCGCACCCAC AGCGCCAGCA TGTCATTGAC

1101 CGGCAAATAC CgcctGTTCG GCCGCGAGCA CGATTTAATC GCGGGTATCA

1151 ACGGCTACAA ATACGCCAGC AACAAATACG GCGAACGCAG CATCATTCCC

1201 AACGCCATTC CCAACGCCTA CGAATTTTCC CGCACGGGCG CCTATCCGCA

1251 GCCATCATCG TTTGCCCAAA CCATCCCGCA ATACGACACC AGGCGGCAAA

1301 TCGGCGGCTA TCTCGCCACC CGTTTCCGCG CCGCCGACAA CCTTTCGCTG

1351 ATACTCGGCG GCAGATACAG CCGCTACCGC GCAGGCAGCT ACAACAGCCG

1401 CACACAAGGC ATGACCTATG TGTCCGCCAA CCGTTTCACC CCCTACACAG

1451 GCATCGTGTT CGATCTGACC GGCAACCTGT CGCTTTACGG CTCGTACAGC

1501 AGCCTGTTCG TCCCGCAATT GCAAAAAGAC GAACACGGCA GCTACCTGAA

1551 ACCCGTAACC GGCAACAATC TGGAAGCCGA CATCAAAGGC GAATGGCTTG

1601 AAGGGCGTCT GAACGCATCC GCCGCCGTGT ACCGCGCCCG TAAAAACAAC

1651 CTCGCCACCG CAGCAGGACG CGACCAGAGC GGCAACACCT ACTATCGCGC

1701 CGCCAACCAA GCCAAAACCC ACGGCTGGGA AATCGAAGTC GGCGGCCGCA

1751 TCACGCCCGA ATGGCAGATA CAGGCAGGCT ACAGCCAAAG CAAACCCCGC

1801 GACCAAGACG GCAGCCGCCT GAACCCCGAC AGCGTAcCCG AACGCAGCTT

1851 CAAACTCTTC ACCGCCTACC ACTTAGCCCC CGAAGCCCCC AGCGGCCGGA

1901 CCATcggTGC GGGTGTGCGC CGGCAGGGCG AAACCCACAC CGACCCAGCC

1951 GCGCTCCGCA TCCCCAACCC CGCCGCCAAA GCCCGCGCCG TCGCCAACAG

2001 CCGCCAGAAA GCCTACGCCG TCGCCGACAT CATGGCGCGT TACCGCTTCA

2051 ATCCGCGCAC CGAACTGTCG CTGAACGTGG ACAACCTGTT CAACAAACAC

2101 TACCGCACCC AGCCCGACCG CCACAGCTAC GGCGCACTGC GGACAGTGAA

2151 CGCGGCGTTT ACCTATCGGT TTAAATAA

它对应于氨基酸序列<SEQ ID 672；ORF23ng-1>：

1 MTRFKYSLLF AALLPVYAQA DVSVSDDPKP QESTELPTIT VTADRTASSN

51 DGYTVSGTHT PFGLPMTLRE IPQSVSVITS QQMRDQNIKT LDRALLQATG

101 TSRQIYGSDR AGYNYLFARG SRIANYQING IPVADALADT GNANTAAYER

151 VEVVRGVAGL PDGTGEPSAT VNLVRKHPTR KPLFEVRAEA GNRKHFGLGA

201 DVSGSLNAEG TLRGRLVSTF GRGDSWRQLE RSRDAELYGI LEYDIAPQTR

251 VHAGMDYQQA KETADAPLSY AVYDSQGYAT AFGPKDNPAT NWSNSRNRAL

301 NLFAGIEHRF NQDWKLKAEY DYTRSRFRQP YGVAGVLSID HSTAATDLIP

351 GYWHADPRTH SASMSLTGKY RLFGREHDLI AGINGYKYAS NKYGERSIIP

401 NAIPNAYEFS RTGAYPQPSS FAQTIPQYDT RRQIGGYLAT RFRAADNLSL

451 ILGGRYSRYR AGSYNSRTQG MTYVSANRFT PYTGIVFDLT GNLSLYGSYS

501 SLFVPQLQKD EHGSYLKPVT GNNLEADIKG EWLEGRLNAS AAVYRARKNN

551 LATAAGRDQS GNTYYRAANQ AKTHGWEIEV GGRITPEWQI QAGYSQSKPR

601 DQDGSRLNPD SVPERSFKLF TAYHLAPEAP SGRTIGAGVR RQGETHTDPA

651 ALRIPNPAAK ARAVANSRQK AYAVADIMAR YRFNPRTELS LNVDNLFNKH

701 YRTQPDRHSY GALRTVNAAF TYRFK*

ORF23ng-1和ORF23-1在725个氨基酸的重叠区内显示出有95.9％的相同性：

10 20 30 40 50 60

orf23-1.pep MTRFKYSLLFAALLPVYAQADVSVSDDPKPQESTELPTITVTADRTASSNDGYTVSGTHT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23ng-1 MTRFKYSLLFAALLPVYAQADVSVSDDPKPQESTELPTITVTADRTASSNDGYTVSGTHT

10 20 30 40 50 60

70 80 90 100 110 120

orf23-1.pep PLGLPMTLREIPQSVSVITSQQMRDQNIKTLDRALLQATGTSRQIYGSDRAGYNYLFARG

|:||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf23ng-1 PFGLPMTLREIPQSVSVITSQQMRDQNIKTLDRALLQATGTSRQIYGSDRAGYNYLFARG

70 80 90 100 110 120

130 140 150 160 170 180

orf23-1.pep SRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLLDGTGEPSATVNLVRKRLTR

|||||||||||||||||||||||||||||||||||||||| |||||||||||||||: ||

orf23ng-1 SRIANYQINGIPVADALADTGNANTAAYERVEVVRGVAGLPDGTGEPSATVNLVRKHPTR

130 140 150 160 170 180

190 200 210 220 230 240

orf23-1.pep KPLFEVRAEAGNRKHFGLDADVSGSLNTEGTLRGRLVSTFGRGDSWRRRERSRDAELYGI

|||||||||||||||||| ||||||||:|||||||||||||||||||: |||||||||||

orf23ng-1 KPLFEVRAEAGNRKHFGLGADVSGSLNAEGTLRGRLVSTFGRGDSWRQLERSRDAELYGI

190 200 210 220 230 240

250 260 270 280 290 300

orf23-1.pep LEYDIAPQTRVHAGMDYQQAKETADAPLSYAVYDSQGYATAFGPKDNPATNWANSRHRAL

||||||||||||||||||||||||||||||||||||||||||||||||||||:|||:|||

orf23ng-1 LEYDIAPQTRVHAGMDYQQAKETADAPLSYAVYDSQGYATAFGPKDNPATNWSNSRNRAL

250 260 270 280 290 300

310 320 330 340 350 360

orf23-1.pep NLFAGIEHRFNQDWKLKAEYDYTRSRFRQPYGVAGVLSIDHNTAATDLIPGYWHADPRTH

|||||||||||||||||||||||||||||||||||||||||:||||||||||||||||||

orf23ng-1 NLFAGIEHRFNQDWKLKAEYDYTRSRFRQPYGVAGVLSIDHSTAATDLIPGYWHADPRTH

310 320 330 340 350 360

370 380 390 400 410 420

orf23-1.pep SASVSLIGKYRLFGREHDLIAGINGYKYASNKYGERSIIPNAIPNAYEFSRTGAYPQPAS

|||:|| |||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf23ng-1 SASMSLTGKYRLFGREHDLIAGINGYKYASNKYGERSIIPNAIPNAYEFSRTGAYPQPSS

370 380 390 400 410 420

430 440 450 460 470 480

orf23-1.pep FAQTIPQYGTRRQIGGYLATRFRAADNLSLILGGRYTRYRTGSYDSRTQGMTYVSANRFT

|||||||| |||||||||||||||||||||||||||:|||:|||:|||||||||||||||

orf23ng-1 FAQTIPQYDTRRQIGGYLATRFRAADNLSLILGGRYSRYRAGSYNSRTQGMTYVSANRFT

430 440 450 460 470 480

490 500 510 520 530 540

orf23-1.pep PYTGIVFDLTGNLSLYGSYSSLFVPQSQKDEHGSYLKPVTGNNLEAGIKGEWLEGRLNAS

|||||||||||||||||||||||||| ||||||||||||||||||| |||||||||||||

orf23ng-1 PYTGIVFDLTGNLSLYGSYSSLFVPQLQKDEHGSYLKPVTGNNLEADIKGEWLEGRLNAS

490 500 510 520 530 540

550 560 570 580 590 600

orf23-1.pep AAVYRARKNNLATAAGRDPSGNTYYRAANQAKTHGWEIEVGGRITPEWQIQAGYSQSKTR

|||||||||||||||||| ||||||||||||||||||||||||||||||||||||||| |

orf23ng-1 AAVYRARKNNLATAAGRDQSGNTYYRAANQAKTHGWEIEVGGRITPEWQIQAGYSQSKPR

550 560 570 580 590 600

610 620 630 640 650 660

orf23-1.pep DQDGSRLNPDSVPERSFKLFTAYHFAPEAPSGWTIGAGVRWQSETHTDPATLRIPNPAAK

||||||||||||||||||||||||:||||||| ||||||| |:|||||||:|||||||||

orf23ng-1 DQDGSRLNPDSVPERSFKLFTAYHLAPEAPSGRTIGAGVRRQGETHTDPAALRIPNPAAK

610 620 630 640 650 660

670 680 690 700 710 720

orf23-1.pep ARAADNSRQKAYAVADIMARYRFNPRAELSLNVDNLFNKHYRTQPDRHSYGALRTVNAAF

|||: |||||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf23ng-1 ARAVANSRQKAYAVADIMARYRFNPRTELSLNVDNLFNKHYRTQPDRHSYGALRTVNAAF

670 680 690 700 710 720

orf23-1.pep TYRFKX

||||||

orf23ng-1 TYRFKX

另外，ORF23ng-1显示出与大肠杆菌的OMP明显同源：

sp|P16869|FHUE_ECOLI FE(III)粪原因子、FE(III)铁草铵以及FE(III)-RHODOTRULIC ACID前体的外膜受体＞gi|1651542|gnl|PID|d1015403(D90745)外膜蛋白FhuE前体[大肠杆菌]＞gi|1651545|gnl|PID|d1015405(D90746)外膜蛋白FhuE前体[大肠杆菌]＞gi|1787344(AE000210)E(III)粪原因子、FE(III)铁草铵以及FE(III)-RHODOTRULIC ACID前体的外膜受体[大肠杆菌]长度＝729

评分＝332位(843)，估计值＝3e-90

相同性＝228/717(31％)，阳性＝350/717(48％)，空隙＝60/717(8％)

询问：38 TITVTADRTASSN--DGYTVSGTHTPFGLPMTLREIPQSVSVITSQQMRDQNIKTLDRAL 95

T+ V TA + + Y+V+ T + MT R+IPQSV++++ Q+M DQ ++TL +

目标：43 TVIVEGSATAPDDGENDYSVTSTSAGTKMQMTQRDIPQSVTIVSQQRMEDQQLQTLGEVM 102

询问：96 LQATGTSRQIYGSDRAGYNYLFARGSRIANYQINGIP--------VADALADTGNANTAA 147

G S+ SDRA Y ++RG +I NY ++GIP + DAL+D A

目标：103 ENTLGISKSQADSDRALY---YSRGFQIDNYMVDGIPTYFESRWNLGDALSDM-----AL 154

询问：148 YERVEVVRGVAGLPDGTGEPSATVNLVRKHPTRKPLF-EVRAEAGNRKHFGLGADVSGSL 206

+ERVEVVRG GL GTG PSA +N+VRKH T + +V AE G+ AD+ L

目标：155 FERVEVVRGATGLMTGTGNPSAAINMVRKHATSREFKGDVSAEYGSWNKERYVADLQSPL 214

询问：207 NAEGTLRGRLVSTFGRGDSWRQLERSRDAELYGILEYDIAPQTRVHAGMDYQQAKETADA 266

+G +R R+V + DSW S GI++ D+ T + AG +YQ+ +

目标：215 TEDGKIRARIVGGYQNNDSWLDRYNSEKTFFSGIVDADLGDLTTLSAGYEYQRIDVNSPT 274

询问：267 PLSYAVYDSQGYATAFGPKDNPATNWSNSRNRALNLFAGIEHRFNQDWKLKAEYDYTRSR 326

+++ G + ++ + A +W+ + +F ++ +F W+ ++

目标：275 WGGLPRWNTDGSSNSYDRARSTAPDWAYNDKEINKVFMTLKQQFADTWQATLNATHSEVE 334

询问：327 F--RQPYGVAGVLSIDHSTAA--TDLIPGY-------WHADPRTHSA-SMSLTGKYRLFG 374

F + Y A V D ++ PG+ W++ R A + G Y LFG

目标：335 FDSKMMYVDAYVNKADGMLVGPYSNYGPGFDYVGGTGWNSGKRKVDALDLFADGSYELFG 394

询问：375 REHDLIAGINGYKYASNKYGER--SIIPNAIPNAYEFSRTGAYPQPSSFAQTIPQYDTRR 432

R+H+L+ G Y +N+Y +I P+ I + Y F+ G +PQ Q++ Q DT

目标：395 RQHNLMFG-GSYSKQNNRYFSSWANIFPDEIGSFYNFN--GNFPQTDWSPQSLAQDDTTH 451

询问：433 QIGGYLATRFRAADNLSLILGGRYSRYRAGSYNSRTQGMTY-VSANRFTPYTGIVFDXXX 491

Y ATR AD L LILG RY+ +R + +TY + N TPY G+VFD

目标：452 MKSLYAATRVTLADPLHLILGARYTNWRVDT-------LTYSMEKNHTTPYAGLVFDIND 504

询问：492 XXXXXXXXXXXFVPQLQKDEHGSYLKPVTGNNLEADIKGEWLEGRLNASAAVYRARKNNL 551

F PQ +D G YL P+TGNN E +K +W+ RL + A++R ++N+

目标：505 NWSTYASYTSIFQPQNDRDSSGKYLAPITGNNYELGLKSDWMNSRLTTTLAIFRIEQDNV 564

询问：552 ATAAGR---DQSGNTYYRAANQAKTHGWEIEVGGRITPEWQIQAGYSQSKPRDQDGSRLN 608

A + G +G T Y+A + + G E E+ G IT WQ+ G ++ D +G+ +N

目标：565 AQSTGTPIPGSNGETAYKAVDGTVSKGVEFELNGAITDNWQLTFGATRYIAEDNEGNAVN 624

询问：609 PDSVPERSFKLFTAYHLAPEAPSGRTIGAGVRRQGETHTDPAALRIPNPAAKARAVANSR 668

P ++P + K+FT+Y L P P T+G GV Q +TD P RA

目标：625 P-NLPRTTVKMFTSYRL-PVMPE-LTVGGGVNWQNRVYTDTV-----TPYGTFRA----E 672

询问：669 QKAYAVADIMARYRFNPRTELSLNVDNLFNKHYRTQPDRH-SYGALRTVNAAFTYRF 724

Q +YA+ D+ RY+ L NV+NLF+K Y T + YG R + TY+F

目标：673 QGSYALVDLFTRYQVTKNFSLQGNVNNLFDKTYDTNVEGSIVYGTPRNFSITGTYQF 729

如上所述，将ORF23-1(77.5kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图15A显示出His-融合蛋白亲和纯化的结果，图15B显示出GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，对小鼠血清进行Western印迹(图15C)和ELISA(阳性结果).这些实验确认ORF23-1是一种外露蛋白，且是一种有用的免疫原。

实施例80

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 673>：

1 ATGCGCACGG CAGTGGTTTT GCTGTTGATC ATGCCGATGG CGGCTTCGTC

51 GGCAATGATG CCGGAAATGG TGTGCGCGGG CGTGTCGCCG GGAACGGCAA

101 TCATATCCAA GCCGACCGAA CAAACGGCGG TCATGGCTTC GAGTTTGTCC

151 AGCGTCAgcA CGCCTGCTTC GGCGgcGgCa ATCATACCTT CGTCTTCGGA

201 AACGGGGATA AACGcGCCAC TCAAACCCCC GACCGCGCTG GAAGCCATCA

251 TGCCGCCTTT TTTCACGGCA TCGTTCAGCA ATGCCAAAGC TGCTGTTGTG

301 CCGTGCGTAC CGCAGACGCT CAAGCCCATT TnTTCAAGAA TGCGTGCCAC

351 TnAGTCGCCG ACGGGG..

它对应于氨基酸序列<SEQ ID 674；ORF24>：

1 MRTAVVLLLI MPMAASSAMM PEMVCAGVSP GTAIISKPTE QTAVMASSLS

51 SVSTPASAAA IIPSSSETGI NAPLKPPTAL EAIMPPFFTA SFSNAKAAVV

101 PCVPQTLKPI XSRMRATXSP TG..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 675>：

1 ATGCGCACGG CAGTGGTTTT GCTGTTGATC ATGCCGATGG CGGCTTCGTC

51 GGCAATGATG CCGGAAATGG TGTGCGCGGG CGTGTCGCCG GGAACGGCAA

101 TCATATCCAA GCCGACCGAA CAAACGGCGG TCATGGCTTC GAGTTTGTCC

151 AGCGTCAGCA CGCCTGCTTC GGCGGCGGCA ATCATACCTT CGTCTTCGGA

201 AACGGGGATA AACGCGCCAC TCAAACCCCC GACCGCGCTG GAAGCCATCA

251 TGCCGCCTTT TTTCACGGCA TCGTTCAGCA ATGCCAAAGC TGCTGTTGTG

301 CCGTGCGTAC CGCAGACGCT CAAGCCCATT TCTTCAAGAA TGCGTGCCAC

351 TGAGTCGCCG ACGGCGGGGG TCGGCGCCAG CGACAAGTCG AGAATACCAA

401 ACGGGATATT CAGCATTTTT GAGGCTTCGC GGCCGATGAG TTCGCCCACG

451 CGGGTAATTT TGAAAGCAGT TTTCTTCACT ACTTCCGCAA CTTCGGTCAA

501 TGTCGTTGCA TCTGAATTTT CCAACGCGGC TTTTACGACA CCTGGGCCGG

551 ATACGCCGAC ATTGATAACG GCATCCGCTT CGCCCGAACC ATGAAACGCG

601 CCCGCCATAA ACGGGTTGTC TTCCACCGCG TTGCAGAACA CGACAATTTT

651 AGCGCAGCCG AAACCTTCGG GCGTGATTTC CGCCGTGCGT TTGACGGTTT

701 CGCCCGCCAG CTTGACCGCA TCCATATTGA TACCGGCACG CGTACTGCCG

751 ATATTGATGG AGCTGCACAC AATATCGGTA GTCTTCATCG CTTCGGGAAT

801 GGAGCGGATT AACACCTCAT CCGAAGGCGA CATCCCTTTT TGCACCAACG

851 CGGAAAAACC GCCGATAAAA GACACACCGA TGGCTTTGGC AGCTTTATCC

901 AAAGTTTGCG CCACGCTGAC GTAA

它对应于氨基酸序列<SEQ ID 676；ORF24-1>：

1 MRTAVVLLLI MPMAASSAMM PEMVCAGVSP GTAIISKPTE QTAVMASSLS

51 SVSTPASAAA IIPSSSETGI NAPLKPPTAL EAIMPPFFTA SFSNAKAAVV

101 PCVPQTLKPI SSRMRATESP TAGVGASDKS RIPNGIFSIF EASRPMSSPT

151 RVILKAVFFT TSATSVNVVA SEFSNAAFTT PGPDTPTLIT ASASPEP*NA

201 PAINGLSSTA LQNTTILAQP KPSGVIS AVR LTVSPASLTA SILIPAR VLP

251 ILMELHTISV VFIASGMERI NTSSEGDIPF CTNAEKPPIK DTPMALAALS

301 KVCATLT*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF24和脑膜炎奈瑟球菌菌株A的ORF(ORF24a)在307个氨基酸的重叠区内显示出有96.4％的相同性：

10 20 30 40 50 60

orf24a.pep MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISXPTEQTAVIASSLSNVSTPASAAA

|||||||||||||||||||||||||||||||||||| |||||||:|||||:|||||||||

orf24 MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISKPTEQTAVMASSLSSVSTPASAAA

10 20 30 40 50 60

70 80 90 100 110 120

orf24a.pep IIPSSSXTGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

|||||| |||||||||||||||||||||||||||||||||||||||||||||||||||||

orf24 IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

70 80 90 100 110 120

130 140 150 160 170 180

orf24a.pep TAGVGASDKSRIPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVNVVASEFSNAAFTT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf24 TAGVGASDKSRIPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVNVVASEFSNAAFTT

130 140 150 160 170 180

190 200 210 220 230 240

orf24a.pep PGPDTPTLITASASPEPXNAPAIXGLSSXALQNTTILAQPKPSSVISXVRLMVSPASLTA

||||||||||||||||||||||| ||||:||||||||||||||:||| ||| ||||||||

orf24 PGPDTPTLITASASPEPXNAPAINGLSSTALQNTTILAQPKPSGVISAVRLTVSPASLTA

190 200 210 220 230 240

250 260 270 280 290 300

orf24a.pep SILIPARVLPILMELHTISVVFIASGMERXNTSSEGDIPFCTSAEKPPIKDTPMALAALS

||||||||||||||||||||||||||||| ||||||||||||:|||||||||||||||||

orf24 SILIPARVLPILMELHTISVVFIASGMERINTSSEGDIPFCTNAEKPPIKDTPMALAALS

250 260 270 280 290 300

orf24a.pep KVCATLTX

||||||||

orf24 KVCATLTX

全长ORF24a核苷酸序列<SEQ ID 677>是：

1 ATGCGCACGG CAGTGGTTTT GCTGTTGATC ATGCCGATGG CGGCTTCGTC

51 GGCAATGATG CCGGAAATGG TGTGCGCGGG TGTGTCGCCG GGAACGGCAA

101 TCATATCCAA NCCGACCGAA CAAACGGCGG TCATCGCTTC GAGTTTATCC

151 AACGTCAGCA CGCCTGCTTC GGCGGCGGCA ATCATACCTT CGTCTTCGGA

201 NACGGGGATA AACGCGCCAC TCAAACCGCC AACCGCGCTC GAAGCCATCA

251 TGCCGCCCTT TTTCACGGCA TCGTTCAGCA ATGCCAAAGC TGCTGTTGTG

301 CCGTGCGTAC CGCAGACGCT CAAACCCATT TCTTCAAGAA TGCGCGCCAC

351 CGAGTCGCCG ACGGCAGGGG TCGGTGCCAG CGACAAGTCG AGAATACCAA

401 ACGGGATATT CAGCATTTTT GAGGCTTCGC GGCCGATGAG TTCGCCCACG

451 CGGGTAATTT TGAAGGCGGT TTTCTTCACA ACTTCGGCAA CTTCGGTCAA

501 TGTCGTTGCA TCCGAATTTT CCAACGCGGC TTTTACGACA CCCGGGCCGG

551 ATACGCCGAC ATTAATCACA GCATCCGCTT CGCCTGAGCC GTGAAACGCG

601 CCCGCCATAN ACGGGTTGTC TTCCNCCGCG TTGCAGAACA CGACGATTTT

651 GGCGCAGCCG AAACCTTCTA GTGTGATTTC ANCCGTGCGT TTGATGGTTT

701 CGCCCGCCAG TCTGACCGCG TCCATATTGA TACCGGCGCG CGTACTGCCG

751 ATATTGATGG AGCTGCACAC GATATCAGTA GTCTTCATCG CTTCGGGAAT

801 GGAACGGATN AACACCTCGT CAGAAGGCGA CATACCTTTT TGCACCAGCG

851 CGGAAAAGCC GCCAATAAAA GACACGCCGA TGGCTTTGGC AGCCTTATCC

901 AAAGTTTGCG CCACGCTGAC GTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 678>：

1 MRTAVVLLLI MPMAASSAMM PEMVCAGVSP GTAIISXPTE QTAVIASSLS

51 NVSTPASAAA IIPSSSXTGI NAPLKPPTAL EAIMPPFFTA SFSNAKAAVV

101 PCVPQTLKPI SSRMRATESP TAGVGASDKS RIPNGIFSIF EASRPMSSPT

151 RVILKAVFFT TSATSVNVVA SEFSNAAFTT PGPDTPTLIT ASASPEP NA

201 PAIXGLSSXA LQNTTILAQP KPSSVISXVR LMVSPASLTA SILIPARVLP

251 ILMELHTISV VFIASGMERX NTSSEGDIPF CTSAEKPPIK DTPMALAALS

301 KVCATLT*

应注意，该蛋白质包括198位的终止密码子。

ORF24a和ORF24-1在307个氨基酸的重叠区内显示出有96.4％的相同性：

10 20 30 40 50 60

orf24a.pep MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISXPTEQTAVIASSLSNVSTPASAAA

|||||||||||||||||||||||||||||||||||| |||||||:|||||:|||||||||

orf24-1 MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISKPTEQTAVMASSLSSVSTPASAAA

10 20 30 40 50 60

70 80 90 100 110 120

orf24a.pep IIPSSSXTGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

|||||| |||||||||||||||||||||||||||||||||||||||||||||||||||||

orf24-1 IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

70 80 90 100 110 120

130 140 150 160 170 180

orf24a.pep TAGVGASDKSRIPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVNVVASEFSNAAFTT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf24-1 TAGVGASDKSRIPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVNVVASEFSNAAFTT

130 140 150 160 170 180

190 200 210 220 230 240

orf24a.pep PGPDTPTLITASASPEPXNAPAIXGLSSXALQNTTILAQPKPSSVISXVRLMVSPASLTA

||||||||||||||||||||||| ||||:||||||||||||||:||| ||| ||||||||

orf24-1 PGPDTPTLITASASPEPXNAPAINGLSSTALQNTTILAQPKPSGVISAVRLTVSPASLTA

190 200 210 220 230 240

250 260 270 280 290 300

orf24a.pep SILIPARVLPILMELHTISVVFIASGMERXNTSSEGDIPFCTSAEKPPIKDTPMALAALS

||||||||||||||||||||||||||||| ||||||||||||:|||||||||||||||||

orf24-1 SILIPARVLPILMELHTISVVFIASGMERINTSSEGDIPFCTNAEKPPIKDTPMALAALS

250 260 270 280 290 300

orf24a.pep KVCATLTX

||||||||

orf24-1 KVCATLTX

与淋病奈瑟球菌的预计ORF的同源性

ORF24和淋病奈瑟球菌的预计ORF(ORF24ng)在121个氨基酸的重叠区内显示出有96.7％的相同性：

orf24.pep MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISKPTEQTAVMASSLSSVSTPASAAA 60

||||||||||||||||||||||||||||||||||:|||||||||||||||||:|||||||

orf24ng MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIMSKPTEQTAVMASSLSSVNTPASAAA 60

orf24.pep IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPIXSRMRATXSP 120

|||||||||||||||||||||||||||||||||||||||||||||||||| |||||| ||

orf24ng IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP 120

orf24.pep TG 122

|:

orf24ng TAGVGASDKSRMPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVRLTASEFSSAALTT 180

全长ORF24ng核苷酸序列<SEQ ID 679>是：

1 ATGCGCACGG CGGTGGTTTT GCTGTTGATC ATGCCGATGG CGGCTTCGTC

51 GGCGATGATG CCGGAAATGG TGTGCGCGGG CGTGTCGCCG GGAACGGCAA

101 TCATGTCCAA ACCAACGGAG CAGACGGCGG TCATGGCTTC GAGTTTGTCC

151 AGCGTCAACA CGCCTGCCTC GGCGGCGGCA ATCATACCTT CGTCTTCGGA

201 AACGGGGATA AACGCGCCGC TCAAACCGCC GACCGCGCTG GAAGCCATCA

251 TGCCGCCCTT TTTCACGGCA TCGTTCAGCA ATGCCAAAGC TGCTGTTGTG

301 CCGTGCGTAC CGCAGACGCT CAAGCCCATT TCTTCAAGAA TGCGCGCCAC

351 CGAGTCGCCG ACGGCGGGGG TCGGTGCCAG CGACAAATCG AGAATGCCGA

401 ACGGGATATT CAGCATTTTT GAGGCTTCGC GACCGATGAG TTCGCCCACG

451 CGGGTGATTT TGAAAGCGGT TTTCTTCACG ACTTCGGCGA CCTCGGTCAG

501 GCTGACCGCG TCCGAATTTT CCAGCGCGGC TTTGACCACG CCTGGACCGG

551 ATACGCCGAC ATTAATCACA GCATCCGCTT CGCCCGAGCC GTGGAACGCA

601 CCCGCCATAA ACGGATTGTC TTCCACCGCG TTGCAGAACA CGACGATTTT

651 GGCGCAGCCG AAACCTTCGG GTGTGATTTC AGCCGTGCGT TTGATGGTTT

701 CGCCTGCCAG CTTGACCGCA TCCATATTGA TACCGGCACG CGTGCTGCCG

751 ATATTGATGG AGCTGCACAC GATATCGGTA GTTTTCATCG CTTCGGGAAC

801 GGAACGGATC AACACCTCAT CCGAAGGCGA CATACCTTTT TGCACCAGCG

851 CGGAAAAGCC GCCGATAAAG GACACGCCGA TGGCTTTGGC TGCCTTGTCC

901 AAAGTCTGCG CCACGCTGAC ATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 680>：

1

MM PEMVCAGVSP GTAIMSKPTE QTAVMASSLS

51 SVNTPASAAA IIPSSSETGI NAPLKPPTAL EAIMPPFFTA SFSNAKAAVV

101 PCVPQTLKPI SSRMRATESP TAGVGASDKS RMPNGIFSIF EASRPMSSPT

151 RVILKAVFFT TSATSVRLTA SEFSSAALTT PGPDTPTLIT ASASPEPWNA

201 PAINGLSSTA LQNTTILAQP KPSGVIS AVR LMVSPASLTA SILIPAR VLP

251 ILMELHTISV VFIASGTERI NTSSEGDIPF CTSAEKPPIK DTPMALAALS

301 KVCATLT*

ORF24ng和ORF24-1在307个氨基酸的重叠区内显示出有96.1％的相同性：

10 20 30 40 50 60

orf24-1.pep MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIISKPTEQTAVMASSLSSVSTPASAAA

||||||||||||||||||||||||||||||||||:|||||||||||||||||:|||||||

orf24ng MRTAVVLLLIMPMAASSAMMPEMVCAGVSPGTAIMSKPTEQTAVMASSLSSVNTPASAAA

10 20 30 40 50 60

70 80 90 100 110 120

orf24-1.pep IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf24ng IIPSSSETGINAPLKPPTALEAIMPPFFTASFSNAKAAVVPCVPQTLKPISSRMRATESP

70 80 90 100 110 120

130 140 150 160 170 180

orf24-1.pep TAGVGASDKSRIPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVNVVASEFSNAAFTT

|||||||||||:|||||||||||||||||||||||||||||||||| ::|||||:||:||

orf24ng TAGVGASDKSRMPNGIFSIFEASRPMSSPTRVILKAVFFTTSATSVRLTASEFSSAALTT

130 140 150 160 170 180

190 200 210 220 230 240

orf24-1.pep PGPDTPTLITASASPEPXNAPATNGLSSTALQNTTILAQPKPSGVISAVRLTVSPASLTA

||||||||||||||||| ||||||||||||||||||||||||||||||||| ||||||||

orf24ng PGPDTPTLITASASPEPWNAPAINGLSSTALQNTTILAQPKPSGVISAVRLMVSPASLTA

190 200 210 220 230 240

250 260 270 280 290 300

orf24-1.pep SILIPARVLPILMELHTISVVFIASGMERINTSSEGDIPFCTNAEKPPIKDTPMALAALS

|||||||||||||||||||||||||| |||||||||||||||:|||||||||||||||||

orf24ng SILIPARVLPILMELHTISVVFIASGTERINTSSEGDIPFCTSAEKPPIKDTPMALAALS

250 260 270 280 290 300

orf24-1.pep KVCATLTX

||||||||

orf24ng KVCATLTX

根据该分析结果(包括淋球菌蛋白中存在一个推定前导序列(前18个氨基酸，用双划线表示)和推定的跨膜结构域(单划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例81

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 681>：

1 ..ACCGACGTGC AAAAAGAGTT GGTCGGCGAA CAACGCAAGT GGGCGCAGGA

51 AAAAATCAGC AACTGCCGAC AAGCCGCCGC GCAGGCAGAC CGGCAGGAAT

101 ACGCCGAATA CCTCAAGCTG CAATGCGACA CGCGGATGAC GCGCGAACGG

151 ATACAGTATC TTCGCGGCTA TTCCATCGAT TAG

它对应于氨基酸序列<SEQ ID 682；ORF25>：

1 ..TDVQKELVGE QRKWAQEKIS NCRQAAAQAD RQEYAEYLKL QCDTRMTRER

51 IQYLRGYSID*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 683>：

1 ATGTATCGGA AACTCATTGC GCTGCCGTTT GCCCTGCTGC TTGGCGCTTG

51 CGGCAGGGAA GAACCGCCCA AGGCATTGGA ATGCGCCAAC CCCGCCGTGT

101 TGCAAGGCAT ACGCGGCAAT ATTCAGGAAA CGCTCACGCA GGAAGCGCGT

151 TCTTTCGCGC GCGAAGACGG CAGGCAGTTT GTCGATGCCG ACAAAATTAT

201 CGCCGCCGCC TACGGTTTGG CGTTTTCTTT GGAACACGCT TCGGAAACGC

251 AGGAAGGCGG GCGCACGTTC TGTATCGCCG ATTTGAACAT TACCGTGCCG

301 TCTGAAACGC TTGCCGATGC CAAGGCAAAC AGCCCCCTGT TGTACGGGGA

351 AACTGCTTTG TCGGATATTG TGCGGCAGAA GACGGGCGGC AATGTCGAGT

401 TTAAAGACGG CGTATTGACG GCAGCCGTCC GCTTCCTGCC CGTCAAAGAC

451 GGTCAGACGG CATTTGTCGA CAACACGGTC GGTATGGCGG CGCAAACGCT

501 GTCTGCCGCG CTGCTGCCTT ACGGCGTGAA GAGCATCGTG ATGATAGACG

551 GCAAGGCGGT GAAAAAAGAA GACGCGGTCA GGATTTTGAG CGGAAAAGCC

601 CGTGAAGAAG AACCGTCCAA ACCCACGCCC GAAGACATTT TGGAACACAA

651 TGCCGCCGGC GGCGATGCGG GCGTACCCCA AGCCGCAGAA GGCGCGCCCG

701 AACCGGAAAT CCTGCATCCT GACGACGGCG AGCGTGCCGA TACCGTTACC

751 GTATCACGGG GCGAAGTGGA AGAGGCGCGC GTACAAAACC AGCGTGCGGA

801 ATCCGAAATT ACCAAACTTT GGGGAGGACT CGATACCGAC GTGCAAAAAG

851 AGTTGGTCGG CGAACAACGC AAGTGGGCGC AGGAAAAAAT CAGCAACTGC

901 CGACAAGCCG CCGCGCAGGC AGACCGGCAG GAATACGCCG AATACCTCAA

951 GCTGCAATGC GACACGCGGA TGACGCGCGA ACGGATACAG TATCTTCGCG

1001 GCTATTCCAT CGATTAG

它对应于氨基酸序列<SEQ ID 684；ORF25-1>：

1 MYRKLIALPF ALLLAACGRE EPPKALECAN PAVLQGIRGN IQETLTQEAR

51 SFAREDGRQF VDADKIIAAA YGLAFSLEHA SETQEGGRTF CIADLNITVP

101 SETLADAKAN SPLLYGETAL SDIVRQKTGG NVEFKDGVLT AAVRFLPVKD

151 GQTAFVDNTV GMAAQTLSAA LLPYGVKSIV MIDGKAVKKE DAVRILSGKA

201 REEEPSKPTP EDILEHNAAG GDAGVPQAAE GAPEPEILHP DDGERADTVT

251 VSRGEVEEAR VQNQRAESEI TKLWGGLDTD VQKELVGEQR KWAQEKISNC

301 RQAAAQADRQ EYAEYLKLQC DTRMTRERIQ YLRGYSID*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF25和脑膜炎奈瑟球菌菌株A的ORF(ORF25a)在60个氨基酸的重叠区内显示出有98.3％的相同性：

10 20 30

orf25.pep TDVQKELVGEQRKWAQEKISNCRQAAAQAD

|||||||||| |||||||||||||||||||

orf25a VTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEXRKWAQEKISNCRQAAAQAD

250 260 270 280 290 300

40 50 60

orf25.pep RQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

|||||||||||||||||||||||||||||||

orf25a RQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

310 320 330

全长ORF25a核苷酸序列<SEQ ID 685>是：

1 ATGTATCGGA AACTCATTGC GCTGCCGTTT GCCCTGCTGC TTGCCGCTTG

51 CGGCAGGGAA GAACCGCCCA AGGCATTGGA ATGCGCCAAC CCCGCCGTGT

101 TGCAANGCAT ACGCNGCAAT ATTCAGGAAA CGCTCACGCA GGAAGCGCGT

151 TCTTTCGCGC GCGAAGACNG CANGCAGTTT GTCGATGCCG ACNAAATTAT

201 CGCCGCCGCC TANGNTNNGN NGNTNTCTTT GGAACACGCT TCGGAAACGC

251 AGGAAGGCGG GCGCACGTTC TGTNTCGCCG ATTTGAACAT TACCGTGCCG

301 TCTGAAACGC TTGCCGATGC CAAGGCAAAC AGCCCCCTGC TGTACGGGGA

351 AACCGCTTTG TCGGATATTG TGCGGCAGAA GACGGGCGGC AATGTCGAGT

401 TTAAAGACGG CGTATTGACG GCAGCCGTCC GCTTCCTACC CGTCAAAGAC

451 GGTCAGANGG CATTTGTCGA CAACACGGTC GGTATGGCGG CGCAAACGCT

501 GTCTGCCGCG TTGCTGCCTT ACGGCGTGAA GAGCATCGTG ATGATAGACG

551 GCAAGGCGGT AAAAAAAGAA GACGCGGTCA GGATTNTGAG CNGANAAGCC

601 CGTGAANAAG AACCGTCCAA ANCCNNGCCC GAAGACATTT TGGAACATAA

651 TGCCGCCGGA GGGGATGCAG ACGTACCCCA AGCCGGAGAA GACGCGCCCG

701 AACCGGAAAT CCTGCATCCT GACGACGGCG AGCGTGCCGA TACCGTTACC

751 GTATCACGGG GCGAAGTGGA AGAGGCGCGN GTACAAAACC AGCGTGCGGA

801 ATCCGAAATT ACCAAACTTT GGGGAGGACT CGATACCGAC GTGCAAAAAG

851 AGTTGGTCGG CGAANAACGC AAGTGGGCGC AGGAAAAAAT CAGCAACTGC

901 CGACAAGCCG CCGCGCAGGC AGACCGGCAG GAATACGCCG AATACCTCAA

951 GCTGCAATGC GACACGCGGA TGACGCGCGA ACGGATACAG TATCTTCGCG

1001 GCTATTCCAT CGATTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 686>：

1 MYRKLIALPF ALLLAACGRE EPPKALECAN PAVLQXIRXN IQETLTQEAR

51 SFAREDXXQF VDADXIIAAA XXXXXSLEHA SETQEGGRTF CXADLNITVP

101 SETLADAKAN SPLLYGETAL SDIVRQKTGG NVEFKDGVLT AAVRFLPVKD

151 GQXAFVDNTV GMAAQTLSAA LLPYGVKSIV MIDGKAVKKE DAVRIXSXXA

201 REXEPSKXXP EDILEHNAAG GDADVPQAGE DAPEPEILHP DDGERADTVT

251 VSRGEVEEAR VQNQRAESEI TKLWGGLDTD VQKELVGEXR KWAQEKISNC

301 RQAAAQADRQ EYAEYLKLQC DTRMTRERIQ YLRGYSID*

ORF25a和ORF25-1在338个氨基酸的重叠区内显示出有93.5％的相同性：

10 20 30 40 50 60

orf25a.pep MYRKLIALPFALLLAACGREEPPKALECANPAVLQXIRXNIQETLTQEARSFAREDXXQF

||||||||||||||||||||||||||||||||||| || ||||||||||||||||| ||

orf25-1 MYRKLIALPFALLLAACGREEPPKALECANPAVLQGIRGNIQETLTQEARSFAREDGRQF

10 20 30 40 50 60

70 80 90 100 110 120

orf25a.pep VDADXIIAAAXXXXXSLEHASETQEGGRTFCXADLNITVPSETLADAKANSPLLYGETAL

|||| ||||| |||||||||||||||| ||||||||||||||||||||||||||||

orf25-1 VDADKIIAAAYGLAFSLEHASETQEGGRTFCIADLNITVPSETLADAKANSPLLYGETAL

70 80 90 100 110 120

130 140 150 160 170 180

orf25a.pep SDIVRQKTGGNVEFKDGVLTAAVRFLPVKDGQXAFVDNTVGMAAQTLSAALLPYGVKSIV

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf25-1 SDIVRQKTGGNVEFKDGVLTAAVRFLPVKDGQTAFVDNTVGMAAQTLSAALLPYGVKSIV

130 140 150 160 170 180

190 200 210 220 230 240

orf25a.pep MIDGKAVKKEDAVRIXSXXAREXEPSKXXPEDILEHNAAGGDADVPQAGEDAPEPEILHP

||||||||||||||| | ||| |||| :|||||||||||||| ||||:| |||||||||

orf25-1 MIDGKAVKKEDAVRILSGKAREEEPSKPTPEDILEHNAAGGDAGVPQAAEGAPEPEILHP

190 200 210 220 230 240

250 260 270 280 290 300

orf25a.pep DDGERADTVTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEXRKWAQEKISNC

|||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||

orf25-1 DDGERADTVTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEQRKWAQEKISNC

250 260 270 280 290 300

310 320 330 339

orf25a.pep RQAAAQADRQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

|||||||||||||||||||||||||||||||||||||||

orf25-1 RQAAAQADRQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

310 320 330

与淋病奈瑟球菌的预计ORF的同源性

ORF25和淋病奈瑟球菌的预计ORF(ORF25ng)在60个氨基酸的重叠区内显示出有100％的相同性：

orf25.pep TDVQKELVGEQRKWAQEKISNCRQAAAQAD 30

||||||||||||||||||||||||||||||

orf25ng VTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEQRKWAQEKISNCRQAAAQAD 308

orf25.pep RQEYAEYLKLQCDTRMTRERIQYLRGYSID 60

||||||||||||||||||||||||||||||

orf25ng RQEYAEYLKLQCDTRMTRERIQYLRGYSID 338

全长ORF25ng核苷酸序列<SEQ ID 687>是：

1 ATGTATCGGA AACTCATTGC GCTGCCGTTT GCCCTGCTGC TTGCAGCGTG

51 CGGCAGGGAA GAACCGCCCA AGGCGTTGGA ATGCGCCAAC CCCGCCGTGT

101 TGCAGGACAT ACGCGGCAGT ATTCAGGAAA CGCTCACGCA GGAAGCGCGT

151 TCTTTCGCGC GCGAAGACGG CAGGCAGTTT GTCGATGCCG ACAAAATTAT

201 CGCCGCCGCC TACGGTTTGG CGTTTTCTTT GGAACACGCT TCGGAAACGC

251 AGGAAGGCGG GCGCACGTTC TGTATCGCCG ATTTGAACAT TACCGTGCCG

301 TCTGAAACGC TTGCCGATGC CGAGGCAAAC AGCCCCCTGC TGTATGGGGA

351 AACGTCTTTG GCAGACATCG TGCAGCAGAA GACGGGCGGC AATGTCGAGT

401 TTAAAGACGG CGTATTGACG GCAGCCGTCC GCTTCCTGCC CGCCAAAGAC

451 GCTCGGACGG CATTTATCGA CAACACGGTC GGTATGGCGA CGCAAACGCT

501 GTCTGCCGCG TTGCTGCCTT ACGGCGTGAA GAGCATCGTG ATGATAGACG

551 GCAAGGCGGT GACAAAAGAA GACGCGGTCA GGGTTTTGAG CGGCAAAGCC

601 CGTGAAGAAG AACCGTCCAA ACCCACCCCC GAAGACATTT TGGAACACAA

651 TGCCGCCGGC GGCGATGCGG GCGTACCCCA AGCCGCAGAA GGCGCACCCG

701 AACCCGAAAT CCTGCATCCC GACGACGTCG AGCGTGCCGA TACCGTTACC

751 GTATCACGGG GCGAAGTGGA AGAGGCGCGC GTACAAAACC AACGTGCGGA

801 ATCCGAAATT ACCAAACTTT GGGGAGGACT CGATACCGAC GTGCAAAAAG

851 AGTTGGTCGG CGAACAGCGC AAGTGGGCGC AGGAAAAAAT CAGcaactgc

901 cgACAAGCCG CCGCGCAGGC AGACCGGCAG GAATACGCCG AATACCTCAA

951 GCTCCAATGC GACACGCGGA TGACGCGCGA ACggaTACAG TATCTTCGCG

1001 GCTATTCCAT CGATTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 688>：

1 MYRKLIALPF ALLLAACGRE EPPKALECAN PAVLQDIRGS IQETLTQEAR

51 SFAREDGRQF VDADKIIAAA YGLAFSLEHA SETQEGGRTF CIADLNITVP

101 SETLADAEAN SPLLYGETSL ADIVQQKTGG NVEFKDGVLT AAVRFLPAKD

151 ARTAFIDNTV GMATQTLSAA LLPYGVKSIV MIDGKAVTKE DAVRVLSGKA

201 REEEPSKPTP EDILEHNAAG GDAGVPQAAE GAPEPEILHP DDVERADTVT

251 VSRGEVEEAR VQNQRAESEI TKLWGGLDTD VQKELVGEQR KWAQEKISNC

301 RQAAAQADRQ EYAEYLKLQC DTRMTRERIQ YLRGYSID*

ORF25ng和ORF25-1在338个氨基酸的重叠区内显示出有95.9％的相同性：

10 20 30 40 50 60

orf25-1.pep MYRKLIALPFALLLAACGREEPPKALECANPAVLQGIRGNIQETLTQEARSFAREDGRQF

||||||||||||||||||||||||||||||||||| |||:||||||||||||||||||||

orf25ng MYRKLIALPFALLLAACGREEPPKALECANPAVLQDIRGSIQETLTQEARSFAREDGRQF

10 20 30 40 50 60

70 80 90 100 110 120

orf25-1.pep VDADKIIAAAYGLAFSLEHASETQEGGRTFCIADLNITVPSETLADAKANSPLLYGETAL

|||||||||||||||||||||||||||||||||||||||||||||||:||||||||||:|

orf25ng VDADKIIAAAYGLAFSLEHASETQEGGRTFCIADLNITVPSETLADAEANSPLLYGETSL

70 80 90 100 110 120

130 140 150 160 170 180

orf25-1.pep SDIVRQKTGGNVEFKDGVLTAAVRFLPVKDGQTAFVDNTVGMAAQTLSAALLPYGVKSIV

:|||:||||||||||||||||||||||:||::|||:|||||||:||||||||||||||||

orf25ng ADIVQQKTGGNVEFKDGVLTAAVRFLPAKDARTAFIDNTVGMATQTLSAALLPYGVKSIV

130 140 150 160 170 180

190 200 210 220 230 240

orf25-1.pep MIDGKAVKKEDAVRILSGKAREEEPSKPTPEDILEHNAAGGDAGVPQAAEGAPEPEILHP

||||||| ||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf25ng MIDGKAVTKEDAVRVLSGKAREEEPSKPTPEDILEHNAAGGDAGVPQAAEGAPEPEILHP

190 200 210 220 230 240

250 260 270 280 290 300

orf25-1.pep DDGERADTVTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEQRKWAQEKISNC

|| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf25ng DDVERADTVTVSRGEVEEARVQNQRAESEITKLWGGLDTDVQKELVGEQRKWAQEKISNC

250 260 270 280 290 300

310 320 330 339

orf25-1.pep RQAAAQADRQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

|||||||||||||||||||||||||||||||||||||||

orf25ng RQAAAQADRQEYAEYLKLQCDTRMTRERIQYLRGYSIDX

310 320 330

根据该分析结果(包括淋球菌蛋白中存在一个预计的原核细胞膜脂蛋白脂质连接位点(下划线))，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF25-1(37kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图16A显示了GST-融合蛋白的亲和纯化结果，图16B显示了His-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，对小鼠血清进行Western印迹(图16C)，ELISA(阳性结果)，和FACS分析(图16D)。这些实验确认ORF25-1是一种外露蛋白，且是一种有用的免疫原。

图16E显示出ORF25-1的亲水性、抗原性指数和AMPHI区域的曲线。

实施例82

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 689>

1 ATGCAGCTGA TCGACTATTC ACATTCATTT TTCTCGGTTG TGCCACCCTT

51 TTTGGCACTG GCACTTGCCG TCATTACCCG CCGCGTACTG CTGTCTTTAG

101 GCATCGGTAT TCTGGwysGC GTTGCCTTTT TGGTCGGCGG CAACCCCGTC

151 GACGGTCTGA CACACCTGAA AGACATGGTC GTCGGCTTGG CTTGGTCAGA

201 CGsyGATTGG TCGCTGGGCA AACCAAAAAT CTTGGTTTTC CkGATACTTT

251 TGGGTATTTT TACTTCCCTG CTGACCTACT CCGGCAGCAA T.........

//

851 .......... .......... .......... ........AC TTCGCTGGTA

901 TTCGGCGGCA CTTGCGGCGT CTTTGCCGTC GTTCTCTGCA CGCTCGGCAC

951 GATTAAAACC GCCGACTATC CCAAAGCCGT TTGGCAGGGT GCGAAATCTA

1001 TGTTCGGCGC AATCGCCATT TTAATCCTCG CTTGGCTCAT CAGTACGGTT

1051 GTCGGCGAAA TGCACACCGG CGATTACCTC TCCACACTGG TTGCGGGCAA

1101 CATCCATCCC GGCTTCCTGC CCGTCATCCT CTTCCTGCTC GCCAGCGTGA

1151 TGGCGTTTGC CACAGGCACA AGCTGGGGGA CGTTCGGCAT TATGCTGCCG

1201 ATTGCCGCCG CCATGGCGGT CAAAGTCGAA CCCGCGCTGA TTATCCCGTG

1251 TATGTCCGCA GTAATGGCGG GGGCGGTATG CGGCGACCAC TGCTCGCCCA

1301 TTTCCGACAC GACCATCCTG TCGTCCACCG GCGCGCGCTG CAACCACATC

1351 GACCACGTTA CCTCGCAACT GCCTTACGCC TTAACCGTTG CCGCCGCCGC

1401 CGCATCGGGC TACCTCGCAT TGGGTCTGAC AAAATCCGCG CTGTTGGGCT

1451 TTGGCACGAC AGGCATTGTA TTGGCGGTGC TGATTTTTCT GTTGAAAGAT

1501 AAAAAA..

它对应于氨基酸序列<SEQ ID 690；ORF26>：

1 MQLIDYSHSF FSVVPPFLAL ALAVITRRVL LSLGIGILXX VAFLVGGNPV

51 DGLTHLKDMV VGLAWSDXDW SLGKPKILVF XILLGIFTSL LTYSGSN...

//

251 .......... .......... .......... .......... ......TSLV

301 FGGTCGVFAV VLCTLGTIKT ADYPKAVWQG AKSMFGAIAI LILAWLISTV

351 VGEMHTGDYL STLVAGNIHP GFLPVILFLL ASVMAFATGT SWGTFGIMLP

401 IAAAMAVKVE PALIIPCMSA VMAGAVCGDH CSPISDTTIL SSTGARCNHI

451 DHVTSQLPYA LTVAAAAASG YLALGLTKSA LLGFGTTGIV LAVLIFLLKD

501 KK..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 691>：

1 ATGCAGCTGA TCGACTATTC ACATTCATTT TTCTCGGTTG TGCCACCCTT

51 TTTGGCACTG GCACTTGCCG TCATTACCCG CCGCGTACTG CTGTCTTTAG

101 GCATCGGTAT TCTGGTCGGC GTTGCCTTTT TGGTCGGCGG CAACCCCGTC

151 GACGGTCTGA CACACCTGAA AGACATGGTC GTCGGCTTGG CTTGGTCAGA

201 CGGCGATTGG TCGCTGGGCA AACCAAAAAT CTTGGTTTTC CTGATACTTT

251 TGGGTATTTT TACTTCCCTG CTGACCTACT CCGGCAGCAA TCAGGCGTTT

301 GCCGACTGGG CAAAACGGCA CATTAAAAAC CGGCGCGGCG CGAAAATGCT

351 GACCGCCTGC CTCGTGTTCG TAACCTTTAT CGACGACTAT TTCCACAGTC

401 TCGCCGTCGG TGCGATTGCC CGCCCCGTTA CCGACAAGTT TAAAGTTTCC

451 CGCACCAAAC TCGCCTACAT CCTCGACTCC ACTGCCGCTC CTATGTGCGT

501 GCTGATGCCC GTTTCAAGCT GGGGCGCGTC GATTATCGCC ACGCTTGCCG

551 GACTGCTCGT TACCTACAAA ATCACCGAAT ACACGCCGAT GGGGACGTTT

601 GTCGCCATGA GCCTGATGAA CTATTACGCA CTGTTTGCCC TGATTATGGT

651 GTTCGTCGTC GCATGGTTTT CCTTCGACAT CGGCTCGATG GCACGTTTCG

701 AACAAGCCGC GTTGAACGAA GCCCACGATG AAACTGCCGT TTCAGACGCT

751 ACCAAAGGTC GTGTTTACGC ACTGATTATT CCCGTTTTGG CCTTAATCGC

801 CTCAACGGTT TCCGCCATGA TCTACACCGG CGCGCAGGCA AGCGAAACCT

851 TCAGCATTTT GGGGGCATTT GAAAACACGG ACGTAAACAC TTCGCTGGTA

901 TTCGGCGGCA CTTGCGGCGT CCTTGCCGTC GTTCTCTGCA CGCTCGGCAC

951 GATTAAAACC GCCGACTATC CCAAAGCCGT TTGGCAGGGT GCGAAATCTA

1001 TGTTCGGCGC AATCGCCATT TTAATCCTCG CTTGGCTCAT CAGTACGGTT

1051 GTCGGCGAAA TGCACACCGG CGATTACCTC TCCACACTGG TTGCGGGCAA

1101 CATCCATCCC GGCTTCCTGC CCGTCATCCT CTTCCTGCTC GCCAGCGTGA

1151 TGGCGTTTGC CACAGGCACA AGCTGGGGGA CGTTCGGCAT TATGCTGCCG

1201 ATTGCCGCCG CCATGGCGGT CAAAGTCGAA CCCGCGCTGA TTATCCCGTG

1251 TATGTCCGCA GTAATGGCGG GGGCGGTATG CGGCGACCAC TGCTCGCCCA

1301 TTTCCGACAC GACCATCCTG TCGTCCACCG GCGCGCGCTG CAACCACATC

1351 GACCACGTTA CCTCGCAACT GCCTTACGCC TTAACCGTTG CCGCCGCCGC

1401 CGCATCGGGC TACCTCGCAT TGGGTCTGAC AAAATCCGCG CTGTTGGGCT

1451 TTGGCACGAC AGGCATTGTA TTGGCGGTGC TGATTTTTCT GTTGAAAGAT

1501 AAAAAACGCG CCAACGCCTG A

它对应于氨基酸序列<SEQ ID 692；ORF26-1>：

1 MQLIDYSHSF FSVVPPFLAL ALAVITRR VL LSLGIGILVG VAFLVGGNPV

51 DGLTHLKDMV VGLAWSDGDW SLGKPK ILVF LILLGIFTSL LTYSGSNQAF

101 ADWAKRHIKN R RGAKMLTAC LVFVTFIDDY FHSLAVGAIA RPVTDKFKVS

151 RTKLAYILDS TAAPMCVLMP VSSWGASIIA TLAGLLVTYK ITEYTPMGTF

201 VAMSLMNYYA LFALIMVFVV AWFSFDIGSM ARFEQAALNE AHDETAVSDA

251 TKGRVYA LII PVLALIASTV SAMIYTGAQA SETFSILGAF ENTDVNTS LV

301 FGGTCGVLAV VLCTLGTIKT ADYPKAVWQG AKSM FGAIAI LILAWLISTV

351 VGEMHTGDYL STLVAGNIHP GFLPVILFLL ASVMAFATGT SW GTFGIMLP

401 IAAAMAVKVE P ALIIPCMSA VMAGAVCGDH CSPISDTTIL SSTGARCNHI

451 DHVTSQLPY A LTVAAAAASG YLALGLTKSA LLGFGTTGIV LAVLIFLLKD

501 KKRANA*

该氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的假设跨膜蛋白HI1586(登录号为P44263)的同源性

ORF26和HI1586在N端和C端的97和221个氨基酸重叠区内分别显示出有53％和49％的氨基酸相同性：

Orf26 1 MQLIDYSHSFFSVVPPFLALALAVITRRVXXXXXXXXXXXVAFLVGGNPVDGLTHLKDMV 60

M+LID+S S +S+VP LA+ LA+ TRRV L +L V

HI1586 14 MELIDFSSSVWSIVPALLAIILAIATRRVLVSLSAGIIIGSLMLSDWQIGSAFNYLVKNV 73

Orf26 61 VGLAWSDXDWSLGKPKILVFXILLGIFTSLLTYSGSN 97

V L ++D + + I++F +LLG+ T+LLT SGSN

HI1586 74 VSLVYADGEIN-SNMNIVLFLLLLGVLTALLTVSGSN 109

//

Orf26 86 IFTSLLTYSGS--NTSLVFGGTCGVFAVVLCTL--GTIKTADYPKAVWQGAKSMFGXXXX 141

+F+ L T+ + TSLV GG C + L + + +Y ++ G KSM G

HI1586 299 VFSVLGTFENTVVGTSLVVGGFCSIIISTLLIILDRQVSVPEYVRSWIVGIKSMSGAIAI 358

Orf26 142 XXXXXXXSTVVGEMHTGDYLSTLVAGNIHPGFLPVILFLLASVMAFATGTSWGTFGIMLP 201

+ +VG+M TG YLS+LV+GNI FLPVILF+L + MAF+TGTSWGTFGIMLP

HI1586 359 LFFAWTINKIVGDMQTGKYLSSLVSGNIPMQFLPVILFVLGAAMAFSTGTSWGTFGIMLP 418

Orf26 202 IAAAMAVKVEPALIIPCMSAVMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQXXXX 261

IAAAMA P L++PC+SAVMAGAVCGDHCSP+SDTTILSSTGA+CNHIDHVT+Q

HI1586 419 IAAAMAANAAPELLLPCLSAVMAGAVCGDHCSPVSDTTILSSTGAKCNHIDHVTTQLPYA 478

Orf26 262 XXXXXXXXXXXXXXXXXKSALLGFGTTGIVLAVLIFLLKDK 302

S L GF T + L V+IF +K +

HI1586 479 ATVATATSIGYIVVGFTYSGLAGFAATAVSLIVIIFAVKKR 519

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF26和脑膜炎奈瑟球菌菌株A的ORF(ORF26a)在502个氨基酸的重叠区内显示出有58.2％的相同性：

10 20 30 40 50 60

orf26.pep MQLIDYSHSFFSVVPPFLALALAVITRR VLLSLGIGILXXVAFLVGGNPVDGLTHLKDMV

||||||||||||||||||||| ||||||| |||||||||| ||||| |||||||||||||||

orf26a MQLIDYSHSFFSVVPPFLALALAVITRR VLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV

10 20 30 40 50 60

70 80 90 99

orf26.pep VGLAWSDXDWSLGKPK ILVFXILLGIFTSLLTYSGSNXX---------------------

|||||||||||||||| |||| |||||||||||| ||||

orf26a VGLAWSDGDWSLGKPK XLVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRRGAKMLTAC

70 80 90 100 110 120

orf26.pep ------------------------------------------------------------

orf26a LVFVTFIDDYFHSLAVGAXARPVTDKFKVSRAKLAYILDSTAAPMCVLMP VSSWGASIIA

130 140 150 160 170 180

orf26.pep ------------------------------------------------------------

orf26a TLAGLLVTYKITEYTPMGTFVAMSLMNYYA LFALIMVFVVAWFSFDIGSMARFEQAALNE

190 200 210 220 230 240

100 110

orf26.pep --------------------------------------------------------TSLV

||||

orf26a AHDETAVSDGSWGRVYA LIIPVLALIASTVSAMIYTGAQASETFSILGAFENTDVNTS LV

250 260 270 280 290 300

120 130 140 150 160 170

orf26.pep FGGTCGVFAVVLCTLGTIKTADYPKAVWQGAKSM FGAIAILILAWLISTVVGEMHTGDYL

|||||||:||||||||||| ||||||||||||||||||||||||||||||||||||||||

orf26a FGGTCGVLAVVLCTLGTIKIADYPKAVWQGAKSM FGAIAILILAWLISTVVGEMHTGDYL

310 320 330 340 350 360

180 190 200 210 220 230

orf26.pep STLVAGNIHP GFLPVILFLLASVMAFATGTSW GTFGIMLPIAAAMAVKVEP ALIIPCMSA

|||||||||| ||| ||||||||||||| ||||| |||||||||||||||| |: |:||||||||

orf26a STLVAGNIHP GFLXVILFLLASVMAFATGTSW GTFGIMLPIAAAMAVKVDP SLIIPCMSA

370 380 390 400 410 420

240 250 260 270 280 290

orf26.pep VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPY ALTVAAAAASGYLALGLTKSA

|||||||| ||||||||||||||||||||||||||||||| ||||||||||||||||| ||||

orf26a VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPY ALTVAAAAASGYLALGLTKSA

430 440 450 460 470 480

300 310

orf26.pep LLGFGTTGIVLAVLIFLLKDKK

||||||:|||||||||| |||||

orf26a LLGFGXTGIVLAVLIFLLKDKKRANAX

490 500

全长ORF26a核苷酸序列<SEQ ID 693>是：

1 ATGCAGCTGA TCGACTATTC ACATTCATTT TTCTCGGTTG TGCCACCCTT

51 TTTGGCACTG GCACTTGCCG TCATTACCCG CCGCGTACTG CTGTCTTTAG

101 GCATCGGTAT TCTGGTCGGC GTTGCCTTTT TGGTCGGCGG CAACCCCGTC

151 GACGGTCTGA CACACCTGAA AGACATGGTC GTCGGCTTGG CTTGGTCAGA

201 CGGCGATTGG TCGCTGGGCA AACCAAAANT CTTGGTTTTC CTGATACTTT

251 TGGGTATTTT TACTTCCCTG CTGACCTACT CCGGCAGCAA TCAGGCGTTT

301 GCCGACTGGG CAAAACGGCA CATTAAAAAC CGGCGCGGCG CGAAAATGCT

351 GACCGCCTGC CTCGTGTTCG TAACCTTTAT CGACGACTAT TTCCACAGTC

401 TCGCCGTCGG TGCGNTTGCC CGCCCCGTTA CCGACAAGTT TAAAGTTTCC

451 CGCGCCAAAC TCGCCTACAT CCTCGACTCC ACTGCCGCGC CTATGTGCGT

501 GCTGATGCCC GTTTCAAGCT GGGGCGCGTC GATTATCGCC ACGCTTGCCG

551 GACTGCTCGT TACCTACAAA ATCACCGAAT ACACGCCGAT GGGGACGTTT

601 GTCGCCATGA GCCTGATGAA CTATTACGCA CTGTTTGCCC TGATTATGGT

651 GTTCGTCGTC GCATGGTTCT CCTTCGACAT CGGCTCGATG GCACGTTTCG

701 AACAAGCCGC GTTGAACGAA GCCCACGATG AAACTGCCGT TTCAGACGGC

751 AGCTGGGGCA GGGTTTACGC ATTGATTATT CCCGTTTTGG CCTTAATCGC

801 CTCAACGGTT TCCGCCATGA TCTACACCGG TGCACAGGCA AGCGAAACCT

851 TCAGCATTTT GGGTGCATTT GAAAATACGG ACGTGAACAC TTCGCTGGTA

901 TTCGGCGGCA CTTGCGGCGT GCTTGCCGTC GTCCTCTGCA CGCTCGGCAC

951 GATTAAAATC GCCGATTATC CCAAAGCCGT TTGGCAGGGT GCGAAATCCA

1001 TGTTCGGCGC AATCGCCATT TTAATCCTTG CCTGGCTCAT CAGTACGGTT

1051 GTCGGCGAAA TGCACACAGG CGACTACCTC TCCACGCTGG TTGCGGGCAA

1101 CATCCATCCC GGCTTCCTGN CCGTCATCCT TTTCCTGCTC GCCAGCGTGA

1151 TGGCGTTTGC CACAGGCACA AGCTGGGGGA CGTTCGGCAT CATGCTGCCG

1201 ATTGCCGCCG CCATGGCGGT CAAAGTCGAT CCCTCACTGA TTATCCCGTG

1251 TATGTCCGCC GTGATGGCGG GGGCGGTATG CGGCGACCAC TGCTCGCCCA

1301 TTTCCGACAC GACCATCCTG TCGTCCACCG GCGCGCGCTG CAACCACATC

1351 GACCACGTTA CNTCGCAACT GCCTTACGCC TTAACCGTTG CCGCCGCCGC

1401 CGCATCGGGN TACCTCGCAT TGGGTCTGAC AAAATCCGCG CTGTTGGGTT

1451 TTGGCANGAC AGGCATTGTA TTGGCGGTGC TGATTTTTCT GTTGAAAGAT

1501 AAAAAACGCG CCAACGCCTG A

它编码的蛋白质具有氨基酸序列<SEQ ID 694>：

1 MQLIDYSHSF FSVVPPFLAL ALAVITRR VL LSLGIGILVG VAFLVGGNPV

51 DGLTHLKDMV VGLAWSDGDW SLGKPK XLVF LILLGIFTSL LTYSGSNQAF

101 ADWAKRHIKN R RGAKMLTAC LVFVTFIDDY FHSLAVGAXA RPVTDKFKVS

151 RAKLAYILDS TAAPMCVLMP VSSWGASIIA TLAGLLVTYK ITEYTPMGTF

201 VAMSLMNYYA LFALIMVFVV AWFSFDIGSM ARFEQAALNE AHDETAVSDG

251 SWGRVYA LII PVLALIASTV SAMIYTGAQA SETFSILGAF ENTDVNT SLV

301 FGGTCGVLAV VLCTLGTIKI ADYPKAVWQG AKSM FGAIAI LILAWLISTV

351 VGEMHTGDYL STLVAGNIHP GFLXVILFLL ASVMAFATGT SW GTFGIMLP

401 IAAAMAVKVD P SLIIPCMSA VMAGAVCGDH CSPISDTTIL SSTGARCNHI

451 DHVTSQLPY A LTVAAAAASG YLALGLTKSA LLGFGXTGIV LAVLIFLLKD

501 KKRANA*

ORF26a和ORF26-1在506个氨基酸的重叠区内显示出有97.8％的相同性：

10 20 30 40 50 60

orf26a.pep MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26-1 MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV

10 20 30 40 50 60

70 80 90 100 110 120

orf26a.pep VGLAWSDGDWSLGKPKXLVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRRGAKMLTAC

|||||||||||||||| |||||||||||||||||||||||||||||||||||||||||||

orf26-1 VGLAWSDGDWSLGKPKILVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRRGAKMLTAC

70 80 90 100 110 120

130 140 150 160 170 180

orf26a.pep LVFVTFIDDYFHSLAVGAXARPVTDKFKVSRAKLAYILDSTAAPMCVLMPVSSWGASIIA

|||||||||||||||||| |||||||||||||||:|||||||||||||||||||||||||

orf26-1 LVFVTFIDDYFHSLAVGAIARPVTDKFKVSRTKLAYILDSTAAPMCVLMPVSSWGASIIA

130 140 150 160 170 180

190 200 210 220 230 240

orf26a.pep TLAGLLVTYKITEYTPMGTFVAMSLMNYYALFALIMVFVVAWFSFDIGSMARFEQAALNE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26-1 TLAGLLVTYKITEYTPMGTFVAMSLMNYYALFALIMVFVVAWFSFDIGSMARFEQAALNE

190 200 210 220 230 240

250 260 270 280 290 300

orf26a.pep AHDETAVSDGSWGRVYALIIPVLALIASTVSAMIYTGAQASETFSILGAFENTDVNTSLV

|||||||||:: ||||||||||||||||||||||||||||||||||||||||||||||||

orf26-1 AHDETAVSDATKGRVYALIIPVLALIASTVSAMIYTGAQASETFSILGAFENTDVNTSLV

250 260 270 280 290 300

310 320 330 340 350 360

orf26a.pep FGGTCGVLAVVLCTLGTIKIADYPKAVWQGAKSMFGAIAILILAWLISTVVGEMHTGDYL

||||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||

orf26-1 FGGTCGVLAVVLCTLGTIKTADYPKAVWQGAKSMFGAIAILILAWLISTVVGEMHTGDYL

310 320 330 340 350 360

370 380 390 400 410 420

orf26a.pep STLVAGNIHPGFLXVILFLLASVMAFATGTSWGTFGIMLPIAAAMAVKVDPSLIIPCMSA

||||||||||||| |||||||||||||||||||||||||||||||||||:|:||||||||

orf26-1 STLVAGNIHPGFLPVILFLLASVMAFATGTSWGTFGIMLPIAAAMAVKVEPALIIPCMSA

370 380 390 400 410 420

430 440 450 460 470 480

orf26a.pep VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPYALTVAAAAASGYLALGLTKSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26-1 VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPYALTVAAAAASGYLALGLTKSA

430 440 450 460 470 480

490 500

orf26a.pep LLGFGXTGIVLAVLIFLLKDKKRANAX

|||||:|||||||||||||||||||||

orf26-1 LLGFGTTGIVLAVLIFLLKDKKRANAX

490 500

与淋病奈瑟球菌的预计ORF的同源性

ORF26和淋病奈瑟球菌的预计ORF(ORF26ng)在N端和C端的97和206个氨基酸的重叠区内分别显示出有94.8％和99％的相同性：

orf26.pep MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILXXVAFLVGGNPVDGLTHLKDMV 60

|||||||||||||||||||||||||||||||||||||| ||||||||||||||||||||

orf26ng MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV 60

orf26.pep VGLAWSDXDWSLGKPKILVFXILLGIFTSLLTYSGSN 97

|||||:| |||||||||||| ||||||||||||||||

orf26ng VGLAWADGDWSLGKPKILVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRCGAKMLTAC 120

//

orf26.pep TSLVFGGTCGVFAVVLCTLGTIKTADYPKA 326

|||||||||||:||||||:|||||||||||

orf26ng ASTVSAMIYTGAQASETFSILGAFENTDVNTSLVFGGTCGVLAVVLCTFGTIKTADYPKA 326

orf26.pep VWQGAKSMFGAIAILILAWLISTVVGEMHTGDYLSTLVAGNIHPGFLPVILFLLASVMAF 386

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng VWQGAKSMFGAIAILILAWLISTVVGEMHTGDYLSTLVAGNIHPGFLPVILFLLASVMAF 386

orf26.pep ATGTSWGTFGIMLPIAAAMAVKVEPALIIPCMSAVMAGAVCGDHCSPISDTTILSSTGAR 446

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng ATGTSWGTFGIMLPIAAAMAVKVEPALIIPCMSAVMAGAVCGDHCSPISDTTILSSTGAR 446

orf26.pep CNHIDHVTSQLPYALTVAAAAASGYLALGLTKSALLGFGTTGIVLAVLIFLLKDKK 502

||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng CNHIDHVTSQLPYALTVAAAAASGYLALGLTKSALLGFGTTGIVLAVLIFLLKDKKRADV 506

全长ORF26ng核苷酸序列<SEQ ID 695>是：

1 ATGCAGCTGA TTGACTATTC ACATTCATTT TTCTCGGTTG TGCCACCCTT

51 TTTGGCACTG GCACTTGCCG TCATTACCCG CCGCGTACTG CTGTCTTTAG

101 GCATCGGTAT TTTGGTCGGC GTTGCCTTTT TGGTCGGCGG CAACCCCGTC

151 GACGGTCTGA CACACCTGAA AGACATGGTC GTCGGCTTGG CTTGGGCAGA

201 CGGCGATTGG TCGCTGGGCA AACCAAAAAT CTTGGTTTTC CTGATACTTT

251 TGGGCATTTT CACTTCACTG CTGACCTACT CCGGCAGCAA TCAGGCGTTT

301 GCCGACTGGG CAAAACGGCA CATTAAAAAC CGGTGCGGCG CGAAAATGCT

351 GACCGCCTGC CTCGTGTTCG TAACCTTTAT CGACGACTAT TTCCACAGCC

401 TCGCCGTCGG TGCGATTGCC CGCCCCGTTA CCGACAAGTT TAAAGTTTCC

451 CGCGCCAAAC TCGCCTACAT CCTCGACTCC ACTGCCTCGC CCATGTGCGT

501 GCTGATGGCC GTTTCAAGCT GGGGCGCGTC GATTATCGCC ACGCTTGCCG

551 GATTGCTCGT TACCTACAAA ATTACCGAAT ACACGCCGAT GGGGACGTTT

601 GTCGCCATGA GCCTGATGAA CTATTACGCG CTGTTTGCCC TGATTATGGT

651 ATTCGTCGTC GCATGGTTCT CCTTCGACAT CGGCTCGAtg gCGCGTTTCG

701 AACAGGCTGC GTTGAACGAA gcccaggacg aaaccgccgc tTCAGACgCT

751 ACCAAAGGTC GTGTTTACGC ATTGATTATT CCCGTTTTGG CCTTAATCGC

801 CTCAACGGTT TCCGCCATGA TCTACACCGG CGCGCAGGCA AGCGAAACCT

851 TCAGCATTTT GGGGGCATTT GAAAATACCG ACGTAAACAC TTCGCTGGTA

901 TTCGGCGGCA CTTGCGGCGT GCTTGCCGTC GTCCTCTGCA CGTTCGGCAC

951 GATTAAAACC GCCGATTATC CCAAAGCCGT GTGGCAGGGT GCGAAATCCA

1001 TGTTCGGCGC AATCGCCATT TTAATCCTCG CCTGGCTCAT CAGTACGGTT

1051 GTCGGCGAAA TGCACACGGG CGACTACCTC TCCACGCTGG TTGCGGGCAA

1101 CATCCATCCC GGCTTCCTGC CCGTCATCCT CTTCCTGCTC GCCAGCGTGA

1151 TGGCGTTTGC CACAGGCACA AGCTGGGGGA CGTTCGGCAT TATGCTGCCG

1201 ATTGCCGCCG CCATGGCGGT CAAAGTCGAA CCCGCGCTGA TTAtcccGTG

1251 TATGTCCGCA GTAATGGCGG GGGCGGTATG CGGCGACCAC TGTTCGCCCA

1301 TCTCCGACAC GACCATCCTG TCGTCCACCG GCGCGCGCTG CAACCACATC

1351 GACCACGTTA CCTCGCAACT GCCTTATGCC CTGACGGTTG CCGCCGCCGC

1401 CGCATCGGGC TACCTCGCAT TGGGTCTGAC AAAATCCGCG CTGTTGGGCT

1451 TTGGCACGAC CGGTATTGTA TTGGCGGTGC TGATTTTTCT GTTGAAAGAT

1501 AAAAAACGCG CCGACGTTTG A

它编码的蛋白质具有氨基酸序列<SEQ ID 696>：

1 MQLIDYSHSF FSVVPPFLAL ALAVITRR VL LSLGIGILVG VAFLVGGNPV

51 DGLTHLKDMV VGLAWADGDW SLGKPK ILVF LILLGIFTSL LTYSGSNQAF

101 ADWAKRHIKN R CGAKMLTAC LVFVTFIDDY FHSLAVGAIA RPVTDKFKVS

151 RAKLAYILDS TASPMCVLMP VSSWGASIIA TLAGLLVTYK ITEYTPMGTF

201 VAMSLMNYYA LFALIMVFVV AWFSFDIGSM ARFEQAALNE AQDETAASDA

251 TKGRVYA LII PVLALIASTV SAMIYTGAQA SETFSILGAF ENTDVNTS LV

301 FGGTCGVLAV VLCTFGTIKT ADYPKAVWQG AKSM FGAIAI LILAWLISTV

351 VGEMHTGDYL STLVAGNIHP GFLPVILFLL ASVMAFATGT SW GTFGIMLP

401 IAAAMAVKVE P ALIIPCMSA VMAGAVCGDH CSPISDTTIL SSTGARCNHI

451 DHVTSQLPY A LTVAAAAASG YLALGLTKSA LLGFGTTGIV LAVLIFLLKD

501 KKRADV*

ORF26ng和ORF26-1在505个氨基酸的重叠区内显示出有98.4％的相同性：

10 20 30 40 50 60

orf26-1.pep MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng MQLIDYSHSFFSVVPPFLALALAVITRRVLLSLGIGILVGVAFLVGGNPVDGLTHLKDMV

10 20 30 40 50 60

70 80 90 100 110 120

orf26-1.pep VGLAWSDGDWSLGKPKILVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRRGAKMLTAC

|||||:||||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf26ng VGLAWADGDWSLGKPKILVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRCGAKMLTAC

70 80 90 100 110 120

130 140 150 160 170 180

orf26-1.pep LVFVTFIDDYFHSLAVGAIARPVTDKFKVSRTKLAYILDSTAAPMCVLMPVSSWGASIIA

|||||||||||||||||||||||||||||||:||||||||||:|||||||||||||||||

orf26ng LVFVTFIDDYFHSLAVGAIARPVTDKFKVSRAKLAYILDSTASPMCVLMPVSSWGASIIA

130 140 150 160 170 180

190 200 210 220 230 240

orf26-1.pep TLAGLLVTYKITEYTPMGTFVAMSLMNYYALFALIMVFVVAWFSFDIGSMARFEQAALNE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng TLAGLLVTYKITEYTPMGTFVAMSLMNYYALFALIMVFVVAWFSFDIGSMARFEQAALNE

190 200 210 220 230 240

250 260 270 280 290 300

orf26-1.pep AHDETAVSDATKGRVYALIIPVLALIASTVSAMIYTGAQASETFSILGAFENTDVNTSLV

|:||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng AQDETAASDATKGRVYALIIPVLALIASTVSAMIYTGAQASETFSILGAFENTDVNTSLV

250 260 270 280 290 300

310 320 330 340 350 360

orf26-1.pep FGGTCGVLAVVLCTLGTIKTADYPKAVWQGAKSMFGAIAILILAWLISTVVGEMHTGDYL

||||||||||||||:|||||||||||||||||||||||||||||||||||||||||||||

orf26ng FGGTCGVLAVVLCTFGTIKTADYPKAVWQGAKSMFGAIAILILAWLISTVVGEMHTGDYL

310 320 330 340 350 360

370 380 390 400 410 420

orf26-1.pep STLVAGNIHPGFLPVILFLLASVMAFATGTSWGTFGIMLPIAAAMAVKVEPALIIPCMSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng STLVAGNIHPGFLPVILFLLASVMAFATGTSWGTFGIMLPIAAAMAVKVEPALIIPCMSA

370 380 390 400 410 420

430 440 450 460 470 480

orf26-1.pep VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPYALTVAAAAASGYLALGLTKSA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf26ng VMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQLPYALTVAAAAASGYLALGLTKSA

430 440 450 460 470 480

490 500

orf26-1. pep LLGFGTTGIVLAVLIFLLKDKKRANAX

||||||||||||||||||||||||::

orf26ng LLGFGTTGIVLAVLIFLLKDKKRADVX

490 500

另外，ORF26ng显示出与一种假设的流感嗜血菌蛋白明显同源：

sp|P44263|YF86_HAEIN假设蛋白HI1586＞gi|1074850|pir||C64037假设

protein HI1586-流感嗜血菌(Rd KW20菌株)＞gi|1574427(U32832)流感嗜血菌预计编码区HI1586[流感嗜血菌]长度＝519

评分＝538位(1370)，估计值＝e-152

相同性＝280/507(55％)，阳性＝346/507(68％)，空隙＝7/507(1％)

询问：1 MQLIDYSHSFFSVVPPFLALALAVITRRXXXXXXXXXXXXXAFLVGGNPVDGLTHLKDMV 60

M+LID+S S +S+VP LA+ LA+ TRR L +L V

目标：14 MELIDFSSSVWSIVPALLAIILAIATRRVLVSLSAGIIIGSLMLSDWQIGSAFNYLVKNV 73

询问：61 VGLAWADGDWSLGKPKILVFLILLGIFTSLLTYSGSNQAFADWAKRHIKNRCGAKMLTAC 120

V L +ADG+ + I++FL+LLG+ T+LLT SGSN+AFA+WA+ IK R GAK+L A

目标：74 VSLVYADGEIN-SNMNIVLFLLLLGVLTALLTVSGSNRAFAEWAQSRIKGRRGAKLLAAS 132

询问：121 LVFVTFIDDYFHSLAVGAIARPVTDKFKVSRAKLAYILDSTASPMCVLMPVSSWGASIIA 180

LVFVTFIDDYFHSLAVGAIARPVTD+FKVSRAKLAYILDSTA+PMCV+MPVSSWGA II

目标：133 LVFVTFIDDYFHSLAVGAIARPVTDRFKVSRAKLAYILDSTAAPMCVMMPVSSWGAYIIT 192

询问：181 TLAGLLVTYKITEYTPMGTFVAMSLMNYYALFALIMVFVVAWFSFDIGSMARFEQAALNE 240

+ GLL TY ITEYTP+G FVAMS MN+YA+F++IMVF VA+FSFDI SM R E+ AL

目标：193 LIGGLLATYSITEYTPIGAFVAMSSMNFYAIFSIIMVFFVAYFSFDIASMVRHEKLALKN 252

询问：241 AQDETAASDATKGRVYALIIPVLALIASTVSAMIYTGAQA----SETFSILGAFENTDVN 296

+D+ TKG+V LI+P+L LI +TVS MIYTGA+A + FS+LG FENT V

目标：253 TEDQLEEETGTKGQVRNLILPILVLIIATVSMMIYTGAEALAADGKVFSVLGTFENTVVG 312

询问：297 TSLVFGGTCGVL--AVVLCTFGTIKTADYPKAVWQGAKSMFGXXXXXXXXXXXSTVVGEM 354

TSLV GG C ++ +++ + +Y ++ G KSM G + +VG+M

目标：313 TSLVVGGFCSIIISTLLIILDRQVSVPEYVRSWIVGIKSMSGAIAILFFAWTINKIVGDM 372

询问：355 HTGDYLSTLVAGNIHPGFLPVILFLLASVMAFATGTSWGTFGIMLPIAAAMAVKVEPALI 414

TG YLS+LV+GNI FLPVILF+L + MAF+TGTSWGTFGIMLPIAAAMA P L+

目标：373 QTGKYLSSLVSGNIPMQFLPVILFVLGAAMAFSTGTSWGTFGIMLPIAAAMAANAAPELL 432

询问：415 IPCMSAVMAGAVCGDHCSPISDTTILSSTGARCNHIDHVTSQXXXXXXXXXXXXXXXXXX 474

+PC+SAVMAGAVCGDHCSP+SDTTILSSTGA+CNHIDHVT+Q

目标：433 LPCLSAVMAGAVCGDHCSPVSDTTILSSTGAKCNHIDHVTTQLPYAATVATATSIGYIVV 492

询问：475 XXXKSALLGFGTTGIVLAVLIFLLKDK 501

S L GF T + L V+IF +K +

目标：493 GFTYSGLAGFAATAVSLIVIIFAVKKR 519

实施例83

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 697>：

1 ..AAGCAATGGT ATGCCGACGN .AGTATCAAG ACGGAAATGG TTATGGTCAA

51 CGATGAGCCT GCCAAAATTC TGACTTGGGA TGAAAGCGGC CGATTACTCT

101 CGGAACTGTC TATCCGCCAC CATCAACGCA ACGGGGTGGT TTTGGAGTGG

151 TATGAAGATG GTTCTAAAAA GAGCGAAGT. GTTTATCAGG ATGACAAGTT

201 GGTCAGGAAA ACCCAGTGGG ATAAGGATGG TTATTTAATC GAACCCTGA

它对应于氨基酸序列<SEQ ID 698；ORF27>：

1 ..KQWYADXSIK TEMVMVNDEP AKILTWDESG RLLSELSIRH HQRNGVVLEW

51 YEDGSKKSEX VYQDDKLVRK TQWDKDGYLI EP*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 699>：

1 ATGAAAAAAT TATCTCGGAT TGTATTTTCA ACTGTCCTGT TGGGTTTTTC

51 GGCCGCTTTG CCGGCGCAGA CCTATTCTGT TTATTTTAAT CAGAACGGAA

101 AGCTGACGGC GACGATGTCT TCTGCCGCTT ATATCAGGCA ATATAGTGTG

151 GTGGCGGGTA TTGCGCACGC GCAGGATTTT TATTATCCGT CGATGAAGAA

201 ATATTCTGAA CCTTATATCG TTGCTTCAAC GCAAATCAAA TCTTTTGTGC

251 CTACCCTGCA AAACGGTATG TTGATTTTGT GGCATTTTAA TGGTCAGAAA

301 AAAATGGCGG GGGGCTTCAG CAAGGGTAAG CCGGACGGGG AGTGGGTCAA

351 CTGGTATCCG AACGGTAAAA AATCTGCCGT TATGCCTTAT AAAAATGGCT

401 TGAGTGAGGG TACGGGATAC CGCTATTACC GTAACGGCGG CAAGGAAAGC

451 GAAATCCAGT TTAAGCAAAA TAAGGCAAAC GGCGTATGGA AGCAATGGTA

501 TGCCGACGGC AGTATCAAGA CGGAAATGGT TATGGTCAAC GATGAGCCTG

551 CCAAAATTCT GACTTGGGAT GAAAGCGGCC GATTACTCTC GGAACTGTCT

601 ATCCGCCACC ATCAACGCAA CGGGGTGGTT TTGGAGTGGT ATGAAGATGG

651 TTCTAAAAAG AGCGAAGCTG TTTATCAGGA TGACAAGTTG GTCAGGAAAA

701 CCCAGTGGGA TAAGGATGGT TATTTAATCG AACCCTGA

它对应于氨基酸序列<SEQ ID 700；ORF27-1>：

1 MKKLSRIVFS TVLLGFSAAL PAQTYSVYFN QNGKLTATMS SAAYIRQYSV

51 VAGIAHAQDF YYPSMKKYSE PYIVASTQIK SFVPTLQNGM LILWHFNGQK

101 KMAGGFSKGK PDGEWVNWYP NGKKSAVMPY KNGLSEGTGY RYYRNGGKES

151 EIQFKQNKAN GVWKQWYADG SIKTEMVMVN DEPAKILTWD ESGRLLSELS

201 IRHHQRNGVV LEWYEDGSKK SEAVYQDDKL VRKTQWDKDG YLIEP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF27和脑膜炎奈瑟球菌菌株A的ORF(ORF27a)在82个氨基酸的重叠区内显示出有91.5％的相同性：

10 20 30

orf27.pep KQWYADXSIKTEMVMVNDEPAKILTWDESG

|||||| :||||||||||||||||||||||

orf27a LSEGTGXRYYRNGGKESEIQFKQNKANGVWKQWYADGNIKTEMVMVNDEPAKILTWDESG

140 150 160 170 180 190

40 50 60 70 80

orf27.pep RLLSELSIRHHQRNGVVLEWYEDGSKKSEXVYQDDKLVRKTQWDKDGYLIEPX

||||||||:|| ||||||||||||||||| |||||||||||||| ||||||||

orf27a RLLSELSIHHHXRNGVVLEWYEDGSKKXEAVYQDDKLVRKTQWDXDGYLIEPX

200 210 220 230 240

全长ORF27a核苷酸序列<SEQ ID 701>是：

1 ATGAAAAAAT TATCTCGGAT TGTATTTTCA ACTGTCCTGT TGGGTTTTTC

51 GGCCGCTTTG CCGGCGCAGA NCTATTCTGT TTATTTTAAT CAGAACGGGA

101 AACTGACGGC GACGNTGTCT TCTGCCGCNT ATATCAGGCA ATATAGTGTG

151 GCGGAGGGTA TTGCGCACGC GCAGGANTTT TANTATCCGT CGATGAAGAA

201 ATATTCCGAA CCTTATATCG TTGCTTCAAC GCAAATCAAA TCTTTTGTGC

251 CTACCCTGCA AAACGGTATG TTGATTTTGT GGCATTTTAA NGGTCAGAAA

301 AAAATGGCNG GGGGCTTCAG CAAGGGTAAG CCGGACGGGG AGTGGGTCAA

351 CTGGTATCCG AACGGTAAAA AATCTGCCGT TATGCCTTAT AAAAATGGTT

401 TGAGTGAAGG TACGGGGTNN CGCTATTACC GTAACGGCGG CAAGGAAAGC

451 GAAATCCAGT TTAAACAGAA TAAGGCAAAC GGCGTATGGA AGCAATGGTA

501 TGCCGACGGC AATATCAAAA CGGAAATGGT TATGGTCAAT GATGAGCCTG

551 CCAAAATTCT GACATGGGAT GAAAGCGGTC GATTACTCTC GGAACTGTCT

601 ATCCATCATC ATNAACGTAA TGGAGTAGTC TTAGAGTGGT ATGAAGATGG

651 TTCTAAAAAG ANTGAAGCTG TTTATCAGGA TGATAAGTTG GTCAGGAAAA

701 CCCAGTGGGA TAANGATGGT TATTTAATCG AACCCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 702>：

1 MKKLSRIVFS TVLLGFSAAL PAQXYSVYFN QNGKLTATXS SAAYIRQYSV

51 AEGIAHAQXF XYPSMKKYSE PYIVASTQIK SFVPTLQNGM LILWHFXGQK

101 KMAGGFSKGK PDGEWVNWYP NGKKSAVMPY KNGLSEGTGX RYYRNGGKES

151 EIQFKQNKAN GVWKQWYADG NIKTEMVMVN DEPAKILTWD ESGRLLSELS

201 IHHHXRNGVV LEWYEDGSKK XEAVYQDDKL VRKTQWDXDG YLIEP*

ORF27a和ORF27-1在245个氨基酸的重叠区内显示出有94.7％的相同性：

10 20 30 40 50 60

orf27a.pep MKKLSRIVFSTVLLGFSAALPAQXYSVYFNQNGKLTATXSSAAYIRQYSVAEGIAHAQXF

|||||||||||||||||||||||:|||||||||||||| |||||||||||: |||||| |

orf27-1 MKKLSRIVFSTVLLGFSAALPAQTYSVYFNQNGKLTATMSSAAYIRQYSVVAGIAHAQDF

10 20 30 40 50 60

70 80 90 100 110 120

orf27a.pep XYPSMKKYSEPYIVASTQIKSFVPTLQNGMLILWHFXGQKKMAGGFSKGKPDGEWVNWYP

||||||||||||||||||||||||||||||||||| |||||||||||||||||||||||

orf27-1 YYPSMKKYSEPYIVASTQIKSFVPTLQNGMLILWHFNGQKKMAGGFSKGKPDGEWVNWYP

70 80 90 100 110 120

130 140 150 160 170 180

orf27a.pep NGKKSAVMPYKNGLSEGTGXRYYRNGGKESEIQFKQNKANGVWKQWYADGNIKTEMVMVN

||||||||||||||||||| ||||||||||||||||||||||||||||||:|||||||||

orf27-1 NGKKSAVMPYKNGLSEGTGYRYYRNGGKESEIQFKQNKANGVWKQWYADGSIKTEMVMVN

130 140 150 160 170 180

190 200 210 220 230 240

orf27a.pep DEPAKILTWDESGRLLSELSIHHHXRNGVVLEWYEDGSKKXEAVYQDDKLVRKTQWDXDG

|||||||||||||||||||||:|| ||||||||||||||| |||||||||||||||| ||

orf27-1 DEPAKILTWDESGRLLSELSIRHHQRNGVVLEWYEDGSKKSEAVYQDDKLVRKTQWDKDG

190 200 210 220 230 240

orf27a.pep YLIEPX

||||||

orf27-1 YLIEPX

与淋病奈瑟球菌的预计ORF的同源性

ORF27和淋病奈瑟球菌的预计ORF(ORF27ng)在82个氨基酸的重叠区内显示出有96.3％的相同性：

orf27.pep KQWYADXSIKTEMVMVNDEPAKILTWDESG 30

|||||| |||||||||||||||||||||||

orf27ng LSEGTGYRYYRNGGKESEIQFKQNKANGVWKQWYADGSIKTEMVMVNDEPAKILTWDESG 193

orf27.pep RLLSELSIRHHQRNGVVLEWYEDGSKKSEXVYQDDKLVRKTQWDKDGYLIEP 82

|||||||||||:||||||||||||||||| ||||||||||||||||||||||

orf27ng RLLSELSIRHHKRNGVYLEWYEDGSKKSEAVYQDDKLYRKTQWDKDGYLIEP 245

全长ORF27ng核苷酸序列<SEQ ID 703>是：

1 ATGAAGAAAT TATCTCGGAT TGTATTTTCA ATCGTACTGT TGGGTTTTTC

51 GGCCGCTTTG CCGGCGCAGA CCTATTCTGT TTATTTTAAT CAGAACGGGA

101 AACTGACGGC GACGATGTCT TCTGCCGCTT ATATCAGGCA ATATAGTGTG

151 GCGGCGGGTA TCGCACACGC GCAGGATTTT TATTATCCGT CGATGAAGAA

201 ATATTCCGAA CCTTATATCG TTGCTTCAAC GCAAATCAAA TCTTTTGTGC

251 CTACCCTGCA AAACGGTATG TTGATTTTGT GGCATTTTAA TGGTCAGAAA

301 AAAATGGCGG GGGGCTTCAG CAAGGGTAAG CCGGACGGGG AATGGGTCAA

351 CTGGTATCCG AACGGTAAAA AATCTGCGGT TATGCCTTAT AAAAATGGCT

401 TGAGTGAGGG TACGGGATAC CGTTATTACC GTAACGGCGG CAAGGAAAGC

451 GAAATCCAGT TTAAGCAAAA TAAGGCGAAC GGCGTATGGA AGCAATGGTA

501 TGCCGATGGA AGTATCAAGA CGGAAATGGT TATGGTCAAC GATGAGCCTG

551 CCAAAATTCT GACTTGGGAT GAAAGCGGCC GATTACTTTC GGAACTGTCT

601 ATCCGCCACC ATAAACGCAA CGGGGTGGTT TTGGAGTGGT ATGAAGATGG

651 TTCTAAAAAG AGCGAGGCTG TTTATCAGGA TGACAAGTTG GTCAGGAAAA

701 CCCAATGGGA TAAGGATGGT TATTTAATCG AACCCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 704>：

1 MKKLSRIVFS IVLLGFSAAL PAQTYSVYFN QNGKLTATMS SAAYIRQYSV

51 AAGIAHAQDF YYPSMKKYSE PYIVASTQIK SFVPTLQNGM LILWHFNGQK

101 KMAGGFSKGK PDGEWVNWYP NGKKSAVMPY KNGLSEGTGY RYYRNGGKES

151 EIQFKQNKAN GVWKQWYADG SIKTEMVMVN DEPAKILTWD ESGRLLSELS

201 IRHHKRNGVV LEWYEDGSKK SEAVYQDDKL VRKTQWDKDG YLIEP*

ORF27ng和ORF27-1在245个氨基酸的重叠区内显示出有98.8％的相同性：

10 20 30 40 50 60

orf27-1.pep MKKLSRIVFSTVLLGFSAALPAQTYSVYFNQNGKLTATMSSAAYIRQYSVVAGIAHAQDF

|||||||||| |||||||||||||||||||||||||||||||||||||||:|||||||||

orf27ng MKKLSRIVFSIVLLGFSAALPAQTYSVYFNQNGKLTATMSSAAYIRQYSVAAGIAHAQDF

10 20 30 40 50 60

70 80 90 100 110 120

orf27-1.pep YYPSMKKYSEPYIVASTQIKSFVPTLQNGMLILWHFNGQKKMAGGFSKGKPDGEWVNWYP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf27ng YYPSMKKYSEPYIVASTQIKSFVPTLQNGMLILWHFNGQKKMAGGFSKGKPDGEWVNWYP

70 80 90 100 110 120

130 140 150 160 170 180

orf27-1.pep NGKKSAVMPYKNGLSEGTGYRYYRNGGKESEIQFKQNKANGVWKQWYADGSIKTEMVMVN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf27ng NGKKSAVMPYKNGLSEGTGYRYYRNGGKESEIQFKQNKANGVWKQWYADGSIKTEMVMVN

130 140 150 160 170 180

190 200 210 220 230 240

orf27-1.pep DEPAKILTWDESGRLLSELSIRHHQRNGVVLEWYEDGSKKSEAVYQDDKLVRKTQWDKDG

||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||||

orf27ng DEPAKILTWDESGRLLSELSIRHHKRNGVVLEWYEDGSKKSEAVYQDDKLVRKTQWDKDG

190 200 210 220 230 240

orf27-1.pep YLIEPX

||||||

orf27ng YLIEPX

根据该分析结果(包括淋球菌蛋白中有推定的前导序列)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

如上所述，将ORF27-1(24.5kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图17A显示了GST-融合蛋白的亲和纯化结果，图17B显示了His-融合物在大肠杆菌中表达的结果。用纯化的GST-融合蛋白来免疫小鼠，用小鼠血清进行ELISA，该试验给出了阳性结果，这确认ORF27-1是一种外露蛋白，且是一种有用的免疫原。

实施例84在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 705>：

1 ATGAAATTTA CCAAGCACCC CGTCTGGGCA ATGGCGTTCC GCCCATTTTA

51 TTCGCTGGCG GCTCTGTACG GCGCATTGTC CGTATTGCTG TGGGGTTTCG

101 GCTACACGGG AACGCACkAG CTGTCCGGTT TCTATTGGCA CGCGCATGAg

151 ATGATTTGGG GTTATGCCGG ACTGGTCGTC ATCGCCTTCC TGCTGACCGC

201 CGTCGCCACT TGGACGGGGC AGCCGCCCAC GCGGGGCGGC GTaTCTGGTC

251 GGCTTGACTA TCTTTTGGCT GGCTGCGCGG ATTGCCGCCT TTATCCCGGG

301 TTGGGGTGCG TCGGCAAGCG GCATACTCGG TACGCTGTTT TTCTGGTACG

351 GCGCGGTGTG CATGGCTTTG CCCGTTATCC GTTCGCAGAA TCAACGCAAC

401 TATGTTgCCG TGTTCGCGCT GTTCGTCTTG GGCGGCACGC ATGCGGCGTT

451 CCACGTCCAG CTGCACAACG GCAACCTAGG CGGACTCTTG AGCGGATTGC

501 AGTCGGGCTT GGTGATG

它对应于氨基酸序列<SEQ ID 706；ORF47>：

1 MKFTKHPVWA MAFRPFYSLA ALYGALSVLL WGFGYTGTHX LSGFYWHAHE

51 MIWGYAGLVV IAFLLTAVAT WTGQPPTRGG VLVGLTIFWL AARIAAFIPG

101 WGASASGILG TLFFWYGAVC MALPVIRSQN QRNYVAVFAL FVLGGTHAAF

151 HVQLHNGNLG GLLSGLQSGL VM

进一步的工作揭示了完整的核苷酸序列<SEQ ID 707>：

1 ATGAAATTTA CCAAGCACCC CGTCTGGGCA ATGGCGTTCC GCCCATTTTA

51 TTCGCTGGCG GCTCTGTACG GCGCATTGTC CGTATTGCTG TGGGGTTTCG

101 GCTACACGGG AACGCACGAG CTGTCCGGTT TCTATTGGCA CGCGCATGAG

151 ATGATTTGGG GTTATGCCGG ACTGGTCGTC ATCGCCTTCC TGCTGACCGC

201 CGTCGCCACT TGGACGGGGC AGCCGCCCAC GCGGGGCGGC GTTCTGGTCG

251 GCTTGACTAT CTTTTGGCTG GCTGCGCGGA TTGCCGCCTT TATCCCGGGT

301 TGGGGTGCGT CGGCAAGCGG CATACTCGGT ACGCTGTTTT TCTGGTACGG

351 CGCGGTGTGC ATGGCTTTGC CCGTTATCCG TTCGCAGAAT CAACGCAACT

401 ATGTTGCCGT GTTCGCGCTG TTCGTCTTGG GCGGCACGCA TGCGGCGTTC

451 CACGTCCAGC TGCACAACGG CAACCTAGGC GGACTCTTGA GCGGATTGCA

501 GTCGGGCTTG GTGATGGTGT CGGGTTTTAT CGGTCTGATT GGTACGCGGA

551 TTATTTCGTT TTTTACGTCC AAACGCTTGA ATGTGCCGCA GATTCCCAGT

601 CCGAAATGGG TGGCGCAGGC TTCGCTGTGG CTGCCCATGC TGACTGCCAT

651 GCTGATGGCG CACGGTGTGT TGGCTTGGCT GTCTGCCGTT TTTGCCTTTG

701 CGGCAGGTGT GATTTTTACC GTGCAGGTGT ACCGCTGGTG GTATAAACCC

751 GTGTTGAAAG AGCCGATGCT GTGGATTCTG TTTGCCGGCT ATCTGTTTAC

801 CGGATTGGGG CTGATTGCGG TCGGCGCGTC TTATTTCAAA CCCGCTTTCC

851 TCAATCTGGG TGTGCATCTG ATCGGGGTCG GCGGTATCGG CGTGCTGACT

901 TTGGGCATGA TGGCGCGTAC CGCGCTTGGT CATACGGGCA ATCCGATTTA

951 TCCGCCGCCC AAAGCCGTTC CCGTTGCGTT TTGGCTGATG ATGGCGGCAA

1001 CCGCCGTCCG TATGGTTGCC GTATTTTCTT CCGGCACTGC CTACACGCAC

1051 AGCATCCGCA CCTCTTCGGT TTTGTTTGCA CTCGCGCTTT TGGTGTATGC

1101 GTGGAAGTAT ATTCCTTGGC TGATTCGTCC GCGTTCGGAC GGCAGGCCCG

1151 GTTGA

它对应于氨基酸序列<SEQ ID 708；ORF47-1>：

1 MKFTKHPVWA MAFRPFYSLA ALYGALSVLL WGFGYTGTHE LSGFYWHAHE

51 M IWGYAGLVV IAFLLTAVAT WTGQPPTRGG V LVGLTIFWL AARIAAFIPG

101 WGASAS GILG TLFFWYGAVC MALPVIRSQN QRN YVAVFAL FVLGGTHAAF

151 HVQLHNGNLG GLLSGLQS GL VMVSGFIGLI GTRIISFFTS KRLNVPQIPS

201 PKW VAQASLW LPMLTAMLMA HGVLAW LSAV FAFAAGVIFT VQVYRWWYKP

251 VLKEPMLW IL FAGYLFTGLG LIAVGASYFK PA FLNLGVHL IGVGGIGVLT

301 LGMMARTALG HTGNPIYPPP KAVP VAFWLM MAATAVRMVA VFSSGTAYTH

351 SIRTSSVLFA LALLVYAWKY IPWLIRPRSD GRPG*

对该氨基酸序列进行计算机分析预测到有一个前导肽，并且还给出了下列结果：：

与脑膜炎奈瑟球菌(菌株A)的预计fQRF的同源性

ORF47和脑膜炎奈瑟球菌菌株A的ORF(ORF47a)在172个氨基酸的重叠区内显示出有99.4％的相同性：

10 20 30 40 50 60

orf47.pep MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHXLSGFYWHAHEM IWGYAGLVV

||||||||||||||||||||||||||||||||||||||| ||||||||||| |||||||||

orf47a MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEM IWGYAGLVV

10 20 30 40 50 60

70 80 90 100 110 120

orf47.pep IAFLLTAVATWTGQPPTRGGV LVGLTIFWLAARIAAFIPGWGASAS GILGTLFFWYGAVC

|||||||| ||||||||||||| ||||||||||||||||| |||||||| ||||||||||||||

orf47a IAFLLTAVATWTGQPPTRGGV LVGLTIFWLAARIAAFIPGWGASAS GILGTLFFWYGAVC

70 80 90 100 110 120

130 140 150 160 170

orf47.pep MALPVIRSQNQRN YVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQS GLVM

|||| |||||||||| ||||||||||||||||| |||||||||||||||||| ||||

orf47a MALPVIRSQNQRN YVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQS GLVMVSGFIGLI

130 140 150 160 170 180

orf47a GTRIISFFTSKRLNVPQIPSPKWVAQASLWLPMLTAMLMAHGVMPWLSAAFAFAAGVIFT

190 200 210 220 230 240

全长ORF47a核苷酸序列<SEQ ID 709>是：

1 ATGAAATTTA CCAAGCACCC CGTTTGGGCA ATGGCGTTCC GCCCGTTTTA

51 TTCACTGGCG GCTCTGTACG GCGCATTGTC CGTATTGCTG TGGGGTTTCG

101 GCTACACGGG AACGCACGAG CTGTCCGGTT TCTATTGGCA CGCGCATGAG

151 ATGATTTGGG GTTATGCCGG ACTGGTCGTC ATCGCCTTCC TGCTGACCGC

201 CGTCGCCACT TGGACGGGGC AGCCGCCCAC GCGGGGCGGC GTTCTGGTCG

251 GCTTGACTAT CTTTTGGCTG GCTGCGCGGA TTGCCGCCTT TATCCCGGGT

301 TGGGGTGCGT CGGCAAGCGG CATACTCGGT ACGCTGTTTT TCTGGTACGG

351 CGCGGTGTGC ATGGCTTTGC CCGTTATCCG TTCGCAGAAT CAACGCAATT

401 ATGTTGCCGT GTTCGCGCTG TTCGTCTTGG GCGGTACGCA CGCGGCGTTC

451 CACGTCCAGC TGCACAACGG CAACCTAGGC GGACTCTTGA GCGGATTGCA

501 GTCGGGCTTG GTGATGGTGT CGGGTTTTAT CGGTCTGATT GGTACGCGGA

551 TTATTTCGTT TTTTACGTCC AAACGGTTGA ATGTGCCGCA GATTCCCAGT

601 CCGAAATGGG TGGCGCAGGC TTCGCTGTGG CTGCCCATGC TGACCGCCAT

651 GCTGATGGCG CACGGCGTGA TGCCTTGGCT GTCGGCGGCT TTCGCGTTTG

701 CGGCAGGTGT GATTTTTACC GTGCAGGTGT ACCGCTGGTG GTATAAGCCT

751 GTGTTGAAAG AGCCGATGCT GTGGATTCTG TTTGCCGGCT ATCTGTTTAC

801 CGGATTGGGG CTGATTGCGG TCGGCGCGTC TTATTTCAAA CCCGCTTTCC

851 TCAATCTGGG TGTGCATCTG ATCGGGGTCG GCGGTATCGG CGTGCTGACT

901 TTGGGCATGA TGGCGCGTAC CGCGCTCGGT CATACGGGCA ATCCGATTTA

951 TCCGCCGCCC AAAGCCGTTC CCGTTGCGTT TTGGCTGATG ATGGCGGCAA

1001 CCGCCGTCCG TATGGTTGCC GTATTTTCTT CCGGCACTGC CTACACGCAC

1051 AGCATACGCA CCTCTTCGGT TTTGTTTGCA CTCGCGCTTT TGGTGTATGC

1101 GTGGAAGTAT ATTCCTTGGC TGATTCGTCC GCGTTCGGAC GGCAGGCCCG

1151 GTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 710>：

1 MKFTKHPVWA MAFRPFYSLA ALYGALSVLL WGFGYTGTHE LSGFYWHAHE

51 M IWGYAGLVV IAFLLTAVAT WTGQPPTRGG V LVGLTIFWL AARIAAFIPG

101 WGASAS GILG TLFFWYGAVC MALPVIRSQN QRN YVAVFAL FVLGGTHAAF

151 HVQLHNGNLG GLLSGLQS GL VMVSGFIGLI GTRIISFFTS KRLNVPQIPS

201 PKW VAQASLW LPMLTAMLMA HGVMPW LSAA FAFAAGVIFT VQVYRWWYKP

251 VLKEPMLW IL FAGYLFTGLG LIAVGASYFK PA FLNLGVHL IGVGGIGVLT

301 LGMMARTALG HTGNPIYPPP KAVP VAFWLM MAATAVRMVA VFSSGTAYTH

351 SIRTSSVLFA LALLVYAWKY IPWLIRPRSD GRPG*

ORF47a和ORF47-1在384个氨基酸的重叠区内显示出有99.2％的相同性：

10 20 30 40 50 60

orf47a.pep MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47-1 MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV

10 20 30 40 50 60

70 80 90 100 110 120

orf47a.pep IAFLLTAVATWTGQPPTRGGVLVGLTIFWLAARIAAFIPGWGASASGILGTLFFWYGAVC

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47-1 IAFLLTAVATWTGQPPTRGGVLVGLTIFWLAARIAAFIPGWGASASGILGTLFFWYGAVC

70 80 90 100 110 120

130 140 150 160 170 180

orf47a.pep MALPVIRSQNQRNYVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVMVSGFIGLI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47-1 MALPVIRSQNQRNYVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVMVSGFIGLI

130 140 150 160 170 180

190 200 210 220 230 240

orf47a.pep GTRIISFFTSKRLNVPQIPSPKWVAQASLWLPMLTAMLMAHGVMPWLSAAFAFAAGVIFT

|||||||||||||||||||||||||||||||||||||||||||: ||||:||||||||||

orf47-1 GTRIISFFTSKRLNVPQIPSPKWVAQASLWLPMLTAMLMAHGVLAWLSAVFAFAAGVIFT

190 200 210 220 230 240

250 260 270 280 290 300

orf47a.pep VQVYRWWYKPVLKEPMLWILFAGYLFTGLGLIAVGASYFKPAFLNLGVHLIGVGGIGVLT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47-1 VQVYRWWYKPVLKEPMLWILFAGYLFTGLGLIAVGASYFKPAFLNLGVHLIGVGGIGVLT

250 260 270 280 290 300

310 320 330 340 350 360

orf47a.pep LGMMARTALGHTGNPIYPPPKAVPVAFWLMMAATAVRMVAVFSSGTAYTHSIRTSSVLFA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47-1 LGMMARTALGHTGNPIYPPPKAVPVAFWLMMAATAVRMVAVFSSGTAYTHSIRTSSVLFA

310 320 330 340 350 360

370 380

orf47a.pep LALLVYAWKYIPWLIRPRSDGRPGX

|||||||||||||||||||||||||

orf47-1 LALLVYAWKYIPWLIRPRSDGRPGX

370 380

与淋病奈瑟球菌的预计ORF的同源性

ORF47和淋病奈瑟球菌的预计ORF(ORF47a)在172个氨基酸的重叠区显示出有97.1％的相同性：

ORF47 MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

ORF47ng MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV 60

ORF47 IAFLLTAVATWTGQPPTRGGVLVGLTIFWLAARIAAFIPGWGASASGILGTLFFWYGAVC 120

|||||||||||||||||||||||||| ||||||||||||||||:||||||||||||||||

ORF47ng IAFLLTAVATWTGQPPTRGGVLVGLTAFWLAARIAAFIPGWGAAASGILGTLFFWYGAVC 120

ORF47 MALPVIRSQNQRNYVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVM 172

||||||||||:||||||||:||||||||||||||||||||||||||||||||

ORF47ng MALPVIRSQNRRNYVAVFAIFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVMVWGFIGLI 180

预计ORF47ng核苷酸序列<SEQ ID 711>编码的蛋白质包含氨基酸序列<SEQ ID712>：

1 MKFTKHPVWA MAFRPFYSLA ALYGALSVLL WGFGYTGTHE LSGFYWHAHE

51 M IWGYAGLVV IAFLLTAVAT WTGQPPTRGG V LVGLTAFWL AARIAAFIPG

101 WGAAAS GILG TLFFWYGAVC MALPVIRSQN RRN YVAVFAI FVLGGTHAAF

151 HVQLHNGNLG GLLSGLQS GL VMVWGFIGLI GMKI ISFFTS KRLKLPQIPS

201 PKWVAHASLW LPMLNAILMA HRVMPW LSAA FPFAAGVIFT VQVYAGGITP

251 IEETSCGSVA GICYRLGNSS G

预计的前导肽和跨膜结构域与脑膜炎球菌蛋白(另见施氏假单胞菌orf396，登录号为e246540)中的序列相同(除了87位的Ile/Ala替换和140位的Leu/Ile替换)：

ORF47ng中的TM节段

整合可能性＝-5.63 跨膜 52-68

整合可能性＝-3.88 跨膜 169-185

整合可能性＝-3.08 跨膜 82-98

整合可能性＝-1.91 跨膜 134-150

整合可能性＝-1.44 跨膜 107-123

整合可能性＝-1.38 跨膜 227-243

进一步的工作揭示了完整的淋球菌DNA序列<SEQ ID 713>：

1 ATGAAATTTA CCAAACATCC CGTCTGGGCA ATGGCGTTCC GCCCGTTTTA

51 TTCACTGGCG GCACTGTACG GCGCATTGTC CGTATTGCTG TGGGGTTTCG

101 GCTACACGGG AACGCACGAG CTGTCCGGTT TCTATTGGCA CGCGCATGAG

151 ATGATTTGGG GTTATGCCGG TCTCGTCGTC ATCGCCTTCC TGCTGACCGC

201 CGTCGCCACT TGGACGGGAC AGCCGCCCAC GAGGGGCGGC GTTCTGGTCG

251 GCTTGACCGC CTTTTGGCTG GCTGCGCGGA TTGCCGCCTT TATCCCGGGT

301 TGGGGTGCGG CGGCAAGCGG CATACTCGGT ACGCTGTTTT TCTGGTACGG

351 CGCGGTGTGC ATGGCTTTGC CCGTTATCCG TtcgCAAAAC CGGCGCAACT

401 ATGtcgCCGT ATTCGCAATA TTTGTGCTGG GCGGTACGCA TGCGgcgTTC

451 CACGtccAgc tGCACAACGG CAACCTAGGC GGACTCTTGA GCGGATTGCA

501 GTCGGGCCTG GTTATGGTGT CGGGCTTTAT CGGCCTGATT GGGATGAGGA

551 TTATTTCGTT TTTTACGTCC AAACGGTTGA ACGTGCCGCA GATTCCCAGT

601 CCGAAATGGG TGGCGCAGGC TTCGCTGTGG CTACCCATGC TGACCGCCAT

651 ACTGATGGCG CACGGCGTGA TGCCTTGGCT GTCGGCGGCT TTCGCGTTTG

701 CGGCGGGCGT GATTTTTACC GTACAGGTGT ACCGCTGGTG GTATAAACCC

751 GTATTGAAAG AACCGATGCT GTGGATTCTG TTTGCCGGCT ATCTGTTTAC

801 CGGATTGGGG CTGATTGCGG TCGGCGCGTC TTATTTCAAA CCTGCCTTCC

851 TCAATCTGGG CGTACATCTG ATCGGGGTCG GCGGTATCGG CGTGCTGACT

901 TTGGGCATGA TGGCGCGTAC CGCGCTCGGT CATACGGGCA ATTCGATTTA

951 TCCGCCGCCC AAAGCCGTTC CCGTTGCGTT TTGGCTGATG ATGGCGGCAA

1001 CCGCCGTCCG TATGGTTGCC GTATTTTCTT CCGGCACTGC CTACACGCAC

1051 AGCATCCGCA CGTCTTCGGT TTTGTTTGCA CTCGCGCTGC TGGTGTATGC

1101 GTGGAAATAC ATTCCGTGGC TGATCCGTCC GCGTTCGGAC GGCAGGCCCG

1151 GTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 714；ORF47ng-1>：

1 MKFTKHPVWA MAFRPFYSLA ALYGALSVLL WGFGYTGTHE LSGFYWHAHE

51 M IWGYAGLVV IAFLLTAVAT WTGQPPTRGG V LVGLTAFWL AARIAAFIPG

101 WGAAAS GILG TLFFWYGAVC MALPVIRSQN RRN YVAVFAI FVLGGTHAAF

151 HVQLHNGNLG GLLSGLQS GL VMVSGFIGLI GMRIISFFTS KRLNVPQIPS

201 PKW VAQASLW LPMLTAILMA HGVMPW LSAA FAFAAGVIFT VQVYRWWYKP

251 VLKEPMLW IL FAGYLFTGLG LIAVGASYFK PA FLNLGVHL IGVGGIGVLT

301 LGMMARTALG HTGNSIYPPP KAVP VAFWLM MAATAVRMVA VFSSGTAYTH

351 SIRTSSVLFA LALLVYAWKY IPWLIRPRSD GRPG*

ORF47ng-1和ORF47-1在384个氨基酸的重叠区内显示出有97.4％的相同性：

10 20 30 40 50 60

orf47-1.pep MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47ng-1 MKFTKHPVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFYWHAHEMIWGYAGLVV

10 20 30 40 50 60

70 80 90 100 110 120

orf47-1.pep IAFLLTAVATWTGQPPTRGGVLVGLTIFWLAARIAAFIPGWGASASGILGTLFFWYGAVC

|||||||||||||||||||||||||| ||||||||||||||||:||||||||||||||||

orf47ng-1 IAFLLTAVATWTGQPPTRGGVLVGLTAFWLAARIAAFIPGWGAAASGILGTLFFWYGAVC

70 80 90 100 110 120

130 140 150 160 170 180

orf47-1.pep MALPVIRSQNQRNYVAVFALFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVMVSGFIGLI

||||||||:||||||||||:||||||||||||||||||||||||||||||||||||||||

orf47ng-1 MALPVIRSQNRRNYVAVFAIFVLGGTHAAFHVQLHNGNLGGLLSGLQSGLVMVSGFIGLI

130 140 150 160 170 180

190 200 210 220 230 240

orf47-1.pep GTRIISFFTSKRLNVPQIPSPKWVAQASLWLPMLTAMLMAHGVLAWLSAVFAFAAGVIFT

| ||||||||||||||||||||||||||||||||||:||||||: ||||:||||||||||

orf47ng-1 GMRIISFFTSKRLNVPQIPSPKWVAQASLWLPMLTAILMAHGVMPWLSAAFAFAAGVIFT

190 200 210 220 230 240

250 260 270 280 290 300

orf47-1.pep VQVYRWWYKPVLKEPMLWILFAGYLFTGLGLIAVGASYFKPAFLNLGVHLIGVGGIGVLT

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf47ng-1 VQVYRWWYKPVLKEPMLWILFAGYLFTGLGLIAVGASYFKPAFLNLGVHLIGVGGIGVLT

250 260 270 280 290 300

310 320 330 340 350 360

orf47-1.pep LGMMARTALGHTGNPIYPPPKAVPVAFWLMMAATAVRMVAVFSSGTAYTHSIRTSSVLFA

|||||||||||||| |||||||||||||||||||||||||||||||||||||||||||||

orf47ng-1 LGMMARTALGHTGNSIYPPPKAVPVAFWLMMAATAVRMVAVFSSGTAYTHSIRTSSVLFA

310 320 330 340 350 360

370 380

orf47-1.pep LALLVYAWKYIPWLIRPRSDGRPGX

|||||||||||||||||||||||||

orf47ng-1 LALLVYAWKYIPWLIRPRSDGRPGX

370 380

另外，ORF47ng-1显示出与施氏假单胞菌的一个ORF明显同源：

gnl|PID|e246540(Z73914)ORF396蛋白[施氏假单胞菌]长度＝396

评分＝155位(389)，估计值＝5e-37

相同性＝121/391(30％)，阳性＝169/391(42％)，空隙＝21/391(5％)

询问：7 PVWAMAFRPFYSLAALYGALSVLLWGFGYTGTHELSGFY-------WHAHEMIWGYAGLV 59

P+W+ AFRPF+ +LY L++ LW +TG GF WH HEM++G+A +

目标：14 PIWRLAFRPFFLAGSLYALLAIPLWVAAWTGLWP--GFQPTGGWLAWHRHEMLFGFAMAI 71

询问：60 VIAFLLTAVATWTGQPPTRGGVLVGLTAFWLAARIAAFIPGWGAAASGILGTLFFWYGAV 119

V FLLTAV TWTGQ G LVGL A WLAAR+ ++ G AA L LF

目标：72 VAGFLLTAVQTWTGQTAPSGNRLVGLAAVWLAARL-GWLFGLPAAWLAPLDLLFLVALVW 130

询问：120 CMALPVIRSQNRRNYVAVFAIFVLGGTHAAFXXXXXXXXXXXXXXXXXXXXXMVSGFIGL 179

MA + + +RNY V + ++ G +V+ + L

目标：131 MMAQMLWAVRQKRNYPIVVVLSLMLGADVLILTGLLQGNDALQRQGVLAGLWLVAALMAL 190

询问：180 IGMRIISFFTSKRLNVPQIPSP-KWVAQASLWLPMLTAILMAHGV----MPWLSAAFAFA 234

IG R+I FFT + L P W+ A L + A+L A GV P L F A

目标：191 IGGRVIPFFTQRGLGKVDAVKPWVWLDVALLVGTGVIALLHAFGVAMRPQPLLGLLFV-A 249

询问：235 AGVIFTVQVYRWWYKPVLKEPMLWILFAGYLFTGLGLIAVGASYF-KPAFXXXXXXXXXX 293

GV +++ RW+ K + K +LW L L+ + + +F A

目标：250 IGVGHLLRLMRWYDKGIWKVGLLWSLHVAMLWLVVAAFGLALWHFGLLAQSSPSLHALSV 309

询问：294 XXXXXXXXXMMARTALGHTGNSIYPPPKAVPVAFWLXXXXXXXXXXXXFSSGTAYTHSIR 353

M+AR LGHTG + P + AF L F S +

目标：310 GSMSGLILAMIARVTLGHTGRPLQLPAGIIG-AFVL---FNLGTAARVFLSVAWPVGGLW 365

询问：354 TSSVLFALALLVYAWKYIPWLIRPRSDGRPG 384

++V +LA +Y W+Y P L+ R DG PG

目标：366 LAAVCWTLAFALYVWRYAPMLVAARVDGHPG 396

实施例85

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 715>：

1 ..ATGCCGTCTG AAGGTTCAGA CGGCmTCGGT GyCGGGGAAy CAGAAGyGGT

51 AGCGCATGCC CAATGAGACT TCGTGGGTTT TGAAGCGGGT GTTTTCCAAG

101 CGTCCCCAGT TGTGGTAACG GTATCCGGTG TCyAArGTCA GCTTGGGyGT

151 GATGTCGAAa CCGACACCGG CGATGACACC AAGACCyAmG CTGCTGATrC

201 TGTkGCTTTC GTGATAGGsA GGTTTGyTGG kmksAsyTTG TAyrATwkkG

251 CCTssCwsTG kAGmGCCkTk CkyTGGTkkA swGrwArTAG TCGTGGTTTy

301 TkTTyyCACC GAATGAACyT GATGTTTAAC GTGTCCGTAG GCGACGCGCG

351 CGCCGATATA GGGTTTGAAT TTATCGTTGA GTTTGAAATC GTAAATGGCG

401 GACAAGCCGA GAGAAGAAAC GGCGTGGAAG CTGCCGTTTC CCTGATGTTT

451 TGTTTGGGTT TCTTTGTAGT TGTTGTTTAT CTCTTCAGTA ACTTTTTTAG

501 TAGAAGAATT ACTTTCTTTC CATTTTCTGT AACTGGCATA ATCTGCCGCT

551 ATTCTCCAGC CGCCGAAATC ..

它对应于氨基酸序列<SEQ ID 716；ORF67>：

1 ..MPSEGSDGXG XGEXEXVAHA QXDFVGFEAG VFQASPVVVT VSGVXXQLGX

51 DVETDTGDDT KTXAADXVAF VIGRFXGXXL YXXAXXXXAX XWXXXXSRGF

101 XXHRMNLMFN VSVGDARADI GFEFIVEFEI VNGGQAERRN GVEAAVSLMF

151 CLGFFVVVVY LFSNFFSRRI TFFPFSVTGI ICRYSPAAEI ..

该氨基酸序列的计算机分析给出了下列结果：

与淋病奈瑟球菌的预计ORF的同源性

ORF67和淋病奈瑟球菌的预计ORF(ORF67ng)在199个氨基酸的重叠区内显示出有51.8％的相同性：

orf67.pep MPSEGSDGXGXGEXEXVAHAQXDFVGFEAG 30

|||||||| | || | ||||| |||||||

orf67ng TNFEIAVLSGMTVRVFYCARPAPVNGGRLKMPSEGSDGIGIGESEAVAHAQRGFVGFEAG 146

90 100 110 120 130 140

orf67.pep VFQASPVVVTVSGVXXQLGXDVETDTGDDTKTXAADXVAFVIGRFXGXXLYXXAXXXXAX 90

|||||||||:|:|| | | || : : ::: || |||:|| | : :

orf67ng VFQASPVVVAVAGVQGQAGRDVYAHARHRAEAQAAAAVAFLIGVFLRMSVRINRNCCVSI 206

orf67.pep XWXXXXSRGFXXHRMNLMFNVSVGDARADIGFEFIVEFEIVNGGQAERRNGVEAAVSLMF 150

: | : |:: : :|||||||:||||||:|||||||||||||||||| || |||

orf67ng TRVGGKSTCYFFSRIDAVSDVSVGDARTDIGFEFVVEFEIVNGGQAERRNGVECAVFLMF 266

orf67.pep CLGFFVV--------VVYLFSNFFSRRITFF-PFSVTGIICRYSPAAEI 190

| | | :: |: |: : | : || ||||| :||||:

orf67ng RLLVFYVKLVAAKSFIILSFQLFYVHGIFIVVPFPVTGIIRGDAPAAEVVADRHPGVDGM 326

预计ORF67ng核苷酸序列<SEQ ID 717>编码的蛋白质包含氨基酸序列<SEQ ID718>：

1 MPSETVGSIV NVGVDESVGF SPPFPSIQHF YRFHRIHRIR LFRPPGPMQL

51 NRHSHGSGNL GRGVWATVLS DKFPCGQVRI PACAGMTNFE IAVLSGMTVR

101 VFYCARPAPV NGGRLKMPSE GSDGIGIGES EAVAHAQRGF VGFEAGVFQA

151 SPVVVAVAGV QGQAGRDVYA HARHRAEAQ A AAAVAFLIGV FLRMSVRINR

201 NCCVSITRVG GKSTCYFFSR IDAVSDVSVG DARTDIGFEF VVEFEIVNGG

251 QAERRNGVE C AVFLMFRLLV FYVKLVAAKS F IILSFQLFY VHGIFIVVPF

301 PVTGIIRGDA PAAEVVADRH PGVDGMRTDV SEIIAYRAYF VFAWSGWFRI

351 IVGNAFGGVG*

根据淋球菌蛋白中存在几个推定的跨膜结构域的发现，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例86

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 719>

1 ATGTTTGCTT TTTTAGAAGC CTTTTTTGTC GAATACGGTT ATGCGGCTGT

51 TTTTTTTGTA TTGGTCATCT GCGGTTTCGG CGTGCCGATT CCCGAGGATT

101 TGACCTTGGT AACAGGCGGC GTGATTTCGG GTATGGGTTA TACCAATCCG

151 CATATTATGT TTGCAGTCGG TATGCTCGGC GTATTGGTCG GGGACGGCAT

201 CATGTTCGCC GCCGGACGAA TTTGGGGGCA GArArTCCTA rGGTTCArAC

251 CTATTGCGsG CATCATGACG CCGrAACGTT ATGAGCAGGT TCAGGAAAAA

301 TTCGACAAAT ACGGTAACTG GGTCTTATTT GTCGCCCGTT TCCTGCCCGG

351 TTTGAGAACG GCCGTATTTG TTACAGCCGG TATCAGCCGC AAGGTTTCAT

401 ACTTGCGTTT TATCATTATG GATGGACTGG CCGCA...

它对应于氨基酸序列<SEQ ID 720；ORF78>：

1 MFAFLEAFFV EYG YAAVFFV LVICGFGVPI PEDLTLVTGG VISGMGYTNP

51 H IMFAVGMLG VLVGDGIMFA AGRIWGQXXL XFXPIAXIMT PXRYEQVQEK

101 F DKYGNWVLF VARFLPGLRT AVFVTAGISR KVSYLRFIIM DGLAA...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 721>：

1 ATGTTTGCTT TTTTAGAAGC CTTTTTTGTC GAATACGGTT ATGCGGCTGT

51 TTTTTTTGTA TTGGTCATCT GCGGTTTCGG CGTGCCGATT CCCGAGGATT

101 TGACCTTGGT AACAGGCGGC GTGATTTCGG GTATGGGTTA TACCAATCCG

151 CATATTATGT TTGCAGTCGG TATGCTCGGC GTATTGGTCG GGGACGGCAT

201 CATGTTCGCC GCCGGACGAA TTTGGGGGCA GAAAATCCTA AGGTTCAAAC

251 CTATTGCGCG CATCATGACG CCGAAACGTT ATGAGCAGGT TCAGGAAAAA

301 TTCGACAAAT ACGGTAACTG GGTCTTATTT GTCGCCCGTT TCCTGCCCGG

351 TTTGAGAACG GCCGTATTTG TTACAGCCGG TATCAGCCGC AAGGTTTCAT

401 ACTTGCGTTT TATCATTATG GATGGACTGG CCGCACTGAT TTCCGTCCCT

451 ATTTGGATTT ATCTGGGCGA ATACGGTGCG CACAACATCG ATTGGCTGAT

501 GGCGAAAATG CACAGCCTGC AATCGGGTAT TTTTGTTATC TTGGGTATAG

551 GTGCGACCGT TGTCGCTTGG ATTTGGTGGA AAAAACGCCA ACGTATCCAG

601 TTTTACCGCA GCAAATTGAA AGAAAAGCGG GCGCAACGCA AAGCCGCCAA

651 GGCAGCCAAA AAAGCCGCGC AAAGCAAACA ATAA

它对应于氨基酸序列<SEQ ID 722；ORF78-1>：

1 MFAFLEAFFV EYG YAAVFFV LVICGFGVPI PEDLTLVTGG VISGMGYTNP

51 H IMFAVGMLG VLVGDGIMFA AGRIWGQKIL RFKPIARIMT PKRYEQVQEK

101 FDKYGNW VLF VARFLPGLRT AVFVTAGISR KVSYLR FIIM DGLAALISVP

151 IWIYLGEYGA HNIDWLMAKM HSLQ SGIFVI LGIGATVVAW IWWKKRQRIQ

201 FYRSKLKEKR AQRKAAKAAK KAAQSKQ*

该氨基酸序列的计算机分析预测了几个跨膜结构域，并且还给出了下列结果：

与流感嗜血菌的dedA类似物(登录号为P45280)的同源性

ORF78和dedA类似物在144个氨基酸的重叠区内显示出有58％的氨基酸相同性：

Orf78：4 FLEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGM--GYTNPHIMFAVGMLGV 61

FL FF EYGY AV FVL+ICGFGVPIPED+TLV+GGVI+G+ N H+M V M+GV

DedA： 20 FLIGFFTEYGYWAVLFVLIICGFGVPIPEDITLVSGGVIAGLYPENVNSHLMLLVSMIGV 79

Orf78：62 LVGDGIMFAAGRIWGQXXLXFXPIAXIMTPXRYEQVQEKFDKYGNWVLFVARFLPGLRTA 121

L GD M+ GRI+G L F PI I+T R V+EKF +YGN VLFVARFLPGLR

DedA： 80 LAGDSCMYWLGRIYGTKILRFRPIRRIVTLQRLRMVREKFSQYGNRVLFVARFLPGLRAP 139

Orf78：122 VFVTAGISRKVSYLRFIIMDGLAA 145

+++ +GI+R+VSY+RF+++D AA

DedA： 140 IYMVSGITRRVSYVRFVLIDFCAA 163

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF78和脑膜炎奈瑟球菌菌株A的ORF(ORF78a)在145个氨基酸的重叠区内显示出有93.8％的相同性：

10 20 30 40 50 60

orf78.pep MFAFLEAFFVEYG YAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPH IMFAVGMLG

|||:||||||||| ||||||||||||||||| ||||||||||||||||||||| |||||||||

orf78a MFALLEAFFVEYG YAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPH IMFAVGMLG

10 20 30 40 50 60

70 80 90 100 110 120

orf78.pep VLVGDGIMFAAGRIWGQXXLXFXPIAXIMTPXRYEQVQEKFDKYGNW VLFVARFLPGLRT

|||||||| ||||||||| | | ||| |||| || |||||||||||| |||||||||||||

orf78a VLVGDGIMFAAGRIWGQKILKFKPIARIMTPKRYAQVQEKFDKYGNW VLFVARFLPGLRT

70 80 90 100 110 120

130 140

orf78.pep AVFVTAGISRKVSYLR FIIMDGLAA

|||| |||||||||||| |:|||||||

orf78a AVFVTAGISRKVSYLR FLIMDGLAALISVPVWIYLGEYGAHNIDWLMAKMHSLQ SGIFIA

130 140 150 160 170 180

全长ORF78a核苷酸序列<SEQ ID 723>是：

1 ATGTTTGCCC TTTTGGAAGC CTTTTTTGTC GAATACGGCT ATGCGGCCGT

51 GTTTTTCGTT TTGGTCATCT GCGGTTTCGG CGTGCCGATT CCCGAGGATT

101 TGACCTTGGT AACAGGCGGC GTGATTTCGG GTATGGGTTA TACCAATCCG

151 CATATTATGT TTGCAGTCGG TATGCTCGGC GTATTGGTCG GGGACGGCAT

201 CATGTTCGCC GCCGGACGCA TCTGGGGGCA GAAAATCCTC AAGTTCAAAC

251 CGATTGCGCG CATCATGACG CCGAAACGTT ACGCACAGGT TCAGGAAAAA

301 TTCGACAAAT ACGGCAACTG GGTGTTATTT GTCGCTCGTT TCCTGCCCGG

351 TTTGCGGACT GCCGTTTTCG TTACCGCCGG CATCAGCCGC AAAGTATCGT

401 ATCTGCGCTT TCTGATTATG GACGGGCTTG CCGCGCTGAT TTCCGTGCCC

451 GTTTGGATTT ACTTGGGCGA GTACGGCGCG CACAACATCG ATTGGCTGAT

501 GGCGAAAATG CACAGCCTGC AATCCGGCAT CTTCATCGCA TTGGGCGTGC

551 TGGCGGCGGC GCTGGCGTGG TTCTGGTGGC GCAAACGCCG ACATTATCAG

601 CTTTACCGCG CACAATTGAG CGAAAAACGC GCCAAACGCA AGGCGGAAAA

651 GGCAGCGAAA AAAGCGGCAC AGAAGCAGCA GTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 724>：

1 MFALLEAFFV EYG YAAVFFV LVICGFGVPI PEDLTLVTGG VISGMGYTNP

51 H IMFAVGMLG VLVGDGIMFA AGRIWGQKIL KFKPIARIMT PKRYAQVQEK

101 FDKYGNW VLF VARFLPGLRT AVFVTAGISR KVSYLR FLIM DGLAALISVP

151 VWIYLGEYGA HNIDWLMAKM HSLQ SGIFIA LGVLAAALAW FWWRKRRHYQ

201 LYRAQLSEKR AKRKAEKAAK KAAQKQQ*

ORF78a和ORF78-1在227个氨基酸的重叠区内显示出有89.0％的相同性：

10 20 30 40 50 60

orf78a.pep MFALLEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPHIMFAVGMLG

|||:||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf78-1 MFAFLEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPHIMFAVGMLG

10 20 30 40 50 60

70 80 90 100 110 120

orf78a.pep VLVGDGIMFAAGRIWGQKILKFKPIARIMTPKRYAQVQEKFDKYGNWVLFVARFLPGLRT

||||||||||||||||||||:||||||||||||| |||||||||||||||||||||||||

orf78-1 VLVGDGIMFAAGRIWGQKILRFKPIARIMTPKRYEQVQEKFDKYGNWVLFVARFLPGLRT

70 80 90 100 110 120

130 140 150 160 170 180

orf78a.pep AVFVTAGISRKVSYLRFLIMDGLAALISVPVWIYLGEYGAHNIDWLMAKMHSLQSGIFIA

|||||||||||||||||:||||||||||||:|||||||||||||||||||||||||||:

orf78-1 AVFVTAGISRKVSYLRFIIMDGLAALISVPIWIYLGEYGAHNIDWLMAKMHSLQSGIFVI

130 140 150 160 170 180

190 200 210 220

orf78a.pep LGVLAAALAWFWWRKRRHYQLYRAQLSEKRAKRKAEKAAKKAAQKQQX

||: |:::||:||:||:: |:||::|:||||:||| ||||||||::||

orf78-1 LGIGATVVAWIWWKKRQRIQFYRSKLKEKRAQRKAAKAAKKAAQSKQX

190 200 210 220

与淋病奈瑟球菌的预计ORF的同源性

ORF78和淋病奈瑟球菌的预计ORF(ORF78ng)在38个氨基酸的重叠区内显示出有97.4％的相同性：

orf78.pep XXLXFXPIAXIMTPXRYEQVQEKFDKYGNWVLFVARFLPGLRTAVFVTAGISRKVSYLRF 137

||||||||||||||||||||||||||||||

orf78ng YPVLFVARFLPGLRTAVFVTAGISRKVSYLRF 32

orf78.pep IIMDGLAA 145

:|||||||

orf78ng LIMDGLAALISVPVWIYLGEYGAHNIDWLMAKMHSLQSGIFIALGVLAAALAWFWWRKRR 92

预计ORF78ng核苷酸序列<SEQ ID 725>编码的蛋白质具有氨基酸序列<SEQ ID726>：

1 ..YP VLFVARFL PGLRTAVFVT AGISRKVSYL R FLIMDGLAA LISVPVWIYL

51 GEYGAHNIDW LMAKMHSLQ S GIFIALGVLA AALAWFWWRK RRHYQLYRAQ

101 LSEKRAKRKA EKAAKKAAQK QQ*

进一步的工作揭示了完整的淋球菌核苷酸序列<SEQ ID 727>：

1 atgtttgccc tttTggaagc CTTTTTTGTC GAAtacggCt atgcGGCCGT

51 GTTTTTCGTT TTGGTCATCT GCGGTTTCGG CGTGCCGATT CCCGAAGATT

101 TGACCTTGGT AACGGGCGGC GTGATTTCGG GTATGGGTTA TACCAATCCG

151 CATATTATGT TTGCGGTCGG TATGCTCGGC GTGTTGGCGG GCGACGGCGT

201 GATGTTTGCC GCCGGACGCA TCTGGGGGCA GAAAATCCTC AAGTTCAAAC

251 CGATTGCGCG CATCATGACG CCGAAACGTT ACGCGCAGGT TCAGGAAAAA

301 TTCGACAAAT ACGGCAACTG GGTTCTGTTT GTCGCCCGTT TCCTGCCGGG

351 TTTGCGGACT GCCGTTTTCG TTACCGCCGG CATCAGCCGC AAAGTATCGT

401 ATCTGCGCTT TCTGATTATG GACGGGCTGG CCGCGCTGAT TTCCGTGCCC

451 GTTTGGATTT ACTTGGGCGA GTACGGCGCG CACAACATCG ATTGGCTGAT

501 GGCGAAAATG CACAGCCTGC AATCGGGCAT CTTCATCGCA TTGGGCGTGC

551 TGGCGGCGGC GCTGGCGTGG TTCTGGTGGC GCAAACGCCG ACATTATCAG

601 CTTTACCGCG CACAATTGAG CGAAAAACGC GCCAAACGCA AGGCGGAAAA

651 GGCAGCGAAA AAAGCGGCAC AGAAGCAGCA GTAa

它对应于氨基酸序列<SEQ ID 728；ORF78ng-1>：

1 MFALLEAFFV EYG YAAVFFV LVICGFGVPI PEDLTLVTGG VISGMGYTNP

51 H IMFAVGMLG VLAGDGVMFA AGRIWGQKIL KFKPIARIMT PKRYAQVQEK

101 FDKYGNW VLF VARFLPGLRT AVFVTAGISR KVSYLR FLIM DGLAALISVP

151 VWIYLGEYGA HNIDWLMAKM HSLQ SGIFIA LGVLAAALAW FWWRKRRHYQ

201 LYRAQLSEKR AKRKAEKAAK KAAQKQQ*

ORF78ng-1和ORF78-1在227个氨基酸的重叠区内显示出有88.1％的相同性：

10 20 30 40 50 60

orf78-1.pep MFAFLEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPHIMFAVGMLG

|||:||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf78ng-1 MFALLEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGMGYTNPHIMFAVGMLG

10 20 30 40 50 60

70 80 90 100 110 120

orf78-1.pep VLVGDGIMFAAGRIWGQKILRFKPIARIMTPKRYEQVQEKFDKYGNWVLFVARFLPGLRT

||:|||:|||||||||||||:||||||||||||| |||||||||||||||||||||||||

orf78ng-1 VLAGDGVMFAAGRIWGQKILKFKPIARIMTPKRYAQVQEKFDKYGNWVLFVARFLPGLRT

70 80 90 100 110 120

130 140 150 160 170 180

orf78-1.pep AVFVTAGISRKVSYLRFIIMDGLAALISVPIWIYLGEYGAHNIDWLMAKMHSLQSGIFVI

|||||||||||||||||:||||||||||||:|||||||||||||||||||||||||||:

orf78ng-1 AVFVTAGISRKVSYLRFLIMDGLAALISVPVWIYLGEYGAHNIDWLMAKMHSLQSGIFIA

130 140 150 160 170 180

190 200 210 220

orf78-1.pep LGIGATVVAWIWWKKRQRIQFYRSKLKEKRAQRKAAKAAKKAAQSKQX

||: |:::||:||:||:: |:||::|:||||:||| ||||||||::||

orf78ng-1 LGVLAAALAWFWWRKRRHYQLYRAQLSEKRAKRKAEKAAKKAAQKQQX

190 200 210 220

另外，orf78ng-1显示出与流感嗜血菌的dedA蛋白同源：

sp|P45280| YG29_HAEIN假设蛋白HI1629＞gi|1073983|pir||D64133 dedA蛋白(dedA)同系物-流感嗜血菌(Rd KW20菌株)

＞gi|1574476(U32836)dedA蛋白(dedA)[流感嗜血菌]长度＝212

评分＝223位(563)，估计值＝7e-58

相同性＝108/182(59％)，阳性＝140/182(76％)，空隙＝2/182(1％)

询问：5 LEAFFVEYGYAAVFFVLVICGFGVPIPEDLTLVTGGVISGM--GYTNPHIMFAVGMLGVL 62

L FF EYGY AV FVL+ICGFGVPIPED+TLV+GGVI+G+ N H+M V M+GVL

目标：21 LIGFFTEYGYWAVLFVLIICGFGVPIPEDITLVSGGVIAGLYPENVNSHLMLLVSMIGVL 80

询问：63 AGDGVMFAAGRIWGQKILKFKPIARIMTPKRYAQVQEKFDKYGNWVLFVARFLPGLRTAV 122

AGD M+ GRI+G KIL+F+PI RI+T +R V+EKF +YGN VLFVARFLPGLR +

目标：81 AGDSCMYWLGRIYGTKILRFRPIRRIVTLQRLRMVREKFSQYGNRVLFVARFLPGLRAPI 140

询问：123 FVTAGISRKVSYLRFLIMDGLAALISVPVWIYLGEYGAHNIDWLMAKMHSLQSGIFIALG 182

++ +GI+R+VSY+RF+++D AA+ISVP+WIYLGE GA N+DWL ++ Q I+I +G

目标：141 YMVSGITRRVSYVRFVLIDFCAAIISVPIWIYLGELGAKNLDWLHTQIQKGQIVIYIFIG 200

询问：183 VL 184

L

目标：201 YL 202

根据该分析结果(包括推定跨膜结构域的存在)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例87

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 729>：

1 ATGAAAAAAT TATTGGCGGC CGTGATGATG GCAGGTTTGG CAGGCGCGGT

51 TTCCGCCGCC GGAGTCCACG TTGAGGACGG CTGGGCGCGC ACCACCGTCG

101 AAGGTATGAA AATAGGCGGC GCGTTCATGA AAATCCACAA CGACGAAGCC

151 AAACAAGACT TTTTGCTCGG CGGAAGCAGC CCCGTTGCCG ACCGCGTCGA

201 AGTGCATACC CACATCAACG ACAACGGCGT GATGCGGATG CGCGAAGTCG

251 AAGGCGGCGT GCCTTTGGAA GCGAAATCCG TTACCGAACT CAAACCCGGC

301 AGCTATCATG TGATGTTTAT GGGTTTGAAA AAACAATTAA AAGAGGGCGA

351 TAAAATTCCC GTTACCCTGA AATTTAAAAA CGCCAAAGCG CAAACCGTCC

401 AACTGGAAGT CAAAATCGCG CCGATGCCGG CAATGAACCA C...

它对应于氨基酸序列<SEQ ID 730；ORF79>：

1 MKKLLAAVMM AGLAGAVSAA GVHVEDGWAR TTVEGMKIGG AFMKIHNDEA

51 KQDFLLGGSS PVADRVEVHT HINDNGVMRM REVEGGVPLE AKSVTELKPG

101 SYHVMFMGLK KQLKEGDKIP VTLKFKNAKA QTVQLEVKIA PMPAMNH..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 731>：

1 ATGAAAAAAT TATTGGCGGC CGTGATGATG GCAGGTTTGG CAGGCGCGGT

51 TTCCGCCGCC GGAGTCCACG TTGAGGACGG CTGGGCGCGC ACCACCGTCG

101 AAGGTATGAA AATAGGCGGC GCGTTCATGA AAATCCACAA CGACGAAGCC

151 AAACAAGACT TTTTGCTCGG CGGAAGCAGC CCCGTTGCCG ACCGCGTCGA

201 AGTGCATACC CACATCAACG ACAACGGCGT GATGCGGATG CGCGAAGTCG

251 AAGGCGGCGT GCCTTTGGAA GCGAAATCCG TTACCGAACT CAAACCCGGC

301 AGCTATCATG TGATGTTTAT GGGTTTGAAA AAACAATTAA AAGAGGGCGA

351 TAAAATTCCC GTTACCCTGA AATTTAAAAA CGCCAAAGCG CAAACCGTCC

401 AACTGGAAGT CAAAATCGCG CCGATGCCGG CAATGAACCA CGGTCATCAC

451 CACGGCGAAG CGCATCAGCA CTAA

它对应于氨基酸序列<SEQ ID 732；ORF79-1>：

1 MKKLLAAVMM AGLAGAVSAA GVHVEDGWAR TTVEGMKIGG AFMKIHNDEA

51 KQDFLLGGSS PVADRVEVHT HINDNGVMRM REVEGGVPLE AKSVTELKPG

101 SYHVMFMGLK KQLKEGDKIP VTLKFKNAKA QTVQLEVKIA PMPAMNHGHH

151 HGEAHQH*

对该氨基酸序列的计算机分析揭示了一个推定的前导肽，并且还给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF79和脑膜炎奈瑟球菌菌株A的ORF(ORF79a)在147个氨基酸的重叠区内显示出有94.6％的相同性：

10 20 30 40 50 60

orf79.pep MKKLLAAVMMAGLAGAVSAAGVHVEDGWARTTVEGMKIGGAFMKIHNDEAKQDFLLGGSS

|| ||||||||||||||||||:|||||||||||||||:||||||||||||||||||||||

orf79a MKXLLAAVMMAGLAGAVSAAGIHVEDGWARTTVEGMKMGGAFMKIHNDEAKQDFLLGGSS

10 20 30 40 50 60

70 80 90 100 110 120

orf79.pep PVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGSYHVMFMGLKKQLKEGDKIP

|||||||||||||||||||||||||||||||||||||||||||||||| ||||| |||||

orf79a PVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGSYHVMFMGXKKQLKXGDKIP

70 80 90 100 110 120

130 140

orf79.pep VTLKFKNAKAQTVQLEVKIAPMPAMNH

|||||||||||||||||| ||| ||:|

orf79a VTLKFKNAKAQTVQLEVKTAPMSAMDHGHHHGEAHQHX

130 140 150

全长ORF79a核苷酸序列<SEQ ID 733>是：

1 ATGAAANAAC TATTGGCAGC CGTGATGATG GCAGGTTTGG CAGGCGCGGT

51 TTCCGCCGCC GGAATCCACG TTGAGGACGG CTGGGCGCGC ACCACCGTCG

101 AAGGTATGAA AATGGGCGGC GCGTTCATGA AAATCCACAA CGACGAAGCC

151 AAACAAGACT TTTTGCTCGG CGGAAGCAGC CCTGTTGCCG ACCGCGTCGA

201 AGTGCATACC CATATCAATG ATAACGGTGT GATGCGGATG CGCGAAGTCG

251 AAGGCGGCGT GCCTTTGGAG GCGAAATCCG TTACCGAACT CAAACCCGGC

301 AGCTATCATG TCATGTTTAT GGGTNTGAAA AAACAATTAA AAGANGGCGA

351 CAAGATTCCC GTTACCCTGA AATTTAAAAA CGCCAAAGCA CAAACCGTCC

401 AACTGGAAGT CAAAACCGCG CCGATGTCGG CAATGGACCA CGGTCATCAC

451 CACGGCGAAG CGCATCAGCA CTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 734>：

1 MKXLLAAVMM AGLAGAVSAA GIHVEDGWAR TTVEGMKMGG AFMKIHNDEA

51 KQDFLLGGSS PVADRVEVHT HINDNGVMRM REVEGGVPLE AKSVTELKPG

101 SYHVMFMGXK KQLKXGDKIP VTLKFKNAKA QTVQLEVKTA PMSAMDHGHH

151 HGEAHQH*

ORF79a和ORF79-1在157个氨基酸的重叠区内显示出有94.9％的相同性：

10 20 30 40 50 60

orf79a.pep MKXLLAAVMMAGLAGAVSAAGIHVEDGWARTTVEGMKMGGAFMKIHNDEAKQDFLLGGSS

|| ||||||||||||||||||:|||||||||||||||:||||||||||||||||||||||

orf79-1 MKKLLAAVMMAGLAGAVSAAGVHVEDGWARTTVEGMKIGGAFMKIHNDEAKQDFLLGGSS

10 20 30 40 50 60

70 80 90 100 110 120

orf79a.pep PVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGSYHVMFMGXKKQLKXGDKIP

|||||||||||||||||||||||||||||||||||||||||||||||| ||||| |||||

orf79-1 PVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGSYHVMFMGLKKQLKEGDKIP

70 80 90 100 110 120

130 140 150

orf79a.pep VTLKFKNAKAQTVQLEVKTAPMSAMDHGHHHGEAHQHX

|||||||||||||||||| ||| ||:||||||||||||

orf79-1 VTLKFKNAKAQTVQLEVKIAPMPAMNHGHHHGEAHQHX

130 140 150

与淋病奈瑟球菌的预计ORF的同源性

ORF79和淋病奈瑟球菌的预计ORF(ORF79ng)在76个氨基酸的重叠区内显示出有96.1％的相同性：

orf79.pep FMKIHNDEAKQDFLLGGSSPVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGS 101

||||||||||||:|||||||||||||||||

orf79ng INDNGVMRMREVKGGVPLEAKSVTELKPGS 30

orf79.pep YHVMFMGLKKQLKEGDKIPVTLKFKNAKAQTVQLEVKIAPMPAMNH 147

||||||||||||||||||||||||||||||||||||| ||| ||||

orf79ng YHVMFMGLKKQLKEGDKIPVTLKFKNAKAQTVQLEVKTAPMSAMNHGHHHGEAHQH 86

预计ORF79ng核苷酸序列<SEQ ID 735>编码的蛋白质包含氨基酸序列<SEQ ID736>：

1 ..INDNGVMRMR EVKGGVPLEA KSVTELKPGS YHVMFMGLKK QLKEGDKIPV

51 TLKFKNAKAQ TVQLEVKTAP MSAMNHGHHH GEAHQH*

进一步的工作揭示了完整的淋球菌DNA序列<SEQ ID 737>：

1 ATGAAAAAAT TATTGGCAGC CGTGATGATG GCAGGTTTGG CAGGCGCGGT

51 TTccgccgCc GGagTccAtG TCGAggACGG CTGGGCGCGc accaCTGtcg

101 aaggtATgaa aatggGCGGC GCgttCATga aaATCCACAA CGACGaaGcc

151 atacaaGACt ttgtgcTCgg CGGaagcatg cccgttgccg accgcGTCGA

201 AGTGCAtaca cacATCAACG ACAACGGCGT GATGCGTATG CGCGAAGTCA

251 AAGGCGGCGT GCCTTTGGAG GCGAAATCCG TTACCGAACT CAAACCCGGC

301 AGCTATCACG TGATGTTTAT GGGTTTGAAA AAACAACTGA AAGAGGGCGA

351 CAAGATTCCC GTTACCCTGA AATTTAAAAA CGCCAAAGCG CAAACCGTCC

401 AACTGGAAGT CAAAACCGCG CCGATGTCGG CAATGAACCA CGGTCATCAC

451 CACGGCGAAG CGCATCAGCA CTAA

它对应于氨基酸序列<SEQ ID 738；ORF79ng-1>：

1 MKKLLAAVMM AGLAGAVSAA GVHVEDGWAR TTVEGMKMGG AFMKIHNDEA

51 IQDFVLGGSM PVADRVEVHT HINDNGVMRM REVKGGVPLE AKSVTELKPG

101 SYHVMFMGLK KQLKEGDKIP VTLKFKNAKA QTVQLEVKTA PMSAMNHGHH

151 HGEAHQH*

ORF79ng-1和ORF79-1在157个氨基酸的重叠区内显示出有95.5％的相同性：

10 20 30 40 50 60

orf79-1.pep MKKLLAAVMMAGLAGAVSAAGVHVEDGWARTTVEGMKIGGAFMKIHNDEAKQDFLLGGSS

|||||||||||||||||||||||||||||||||||||:|||||||||||| |||:|||||

orf79ng-1 MKKLLAAVMMAGLAGAVSAAGVHVEDGWARTTVEGMKMGGAFMKIHNDEAIQDFVLGGSM

10 20 30 40 50 60

70 80 90 100 110 120

orf79-1.pep PVADRVEVHTHINDNGVMRMREVEGGVPLEAKSVTELKPGSYHVMFMGLKKQLKEGDKIP

|||||||||||||||||||||||:||||||||||||||||||||||||||||||||||||

orf79ng-1 PVADRVEVHTHINDNGVMRMREVKGGVPLEAKSVTELKPGSYHVMFMGLKKQLKEGDKIP

70 80 90 100 110 120

130 140 150

orf79-1.pep VTLKFKNAKAQTVQLEVKIAPMPAMNHGHHHGEAHQHX

|||||||||||||||||| ||| |||||||||||||||

orf79ng-1 VTLKFKNAKAQTVQLEVKTAPMSAMNHGHHHGEAHQHX

130 140 150

另外，ORF79ng-1显示出与Aquifex aeolicus的蛋白有明显的同源性

gi|2983695(AE000731)推定的蛋白[Aquifex aeolicus]长度＝151

评分＝63.6位(152)，估计值＝6e-10

相同性＝38/114(33％)，阳性＝58/114(50％)，空隙＝1/114(0％)

询问：24 VEDGWARTTVEGMKMGGAFMKIHNDEAIQDFVLGGSMPVADRVEVHTHINDNGVMRMREV 83

V+ W G M I N+ D+++G +A RVE+H + +N V +M

目标：27 VKHPWVMEPPPGPNTTMMGMI IVNEGDEPDYLIGAKTDIAQRVELHKTVIENDVAKMVPQ 86

询问：84 KGGVPLEAKSVTELKPGSYHVMFMGLKKQLKEGDKIPVTLKFKNAKAQTVQLEV 137

+ + + K E K YHVM +GLKK++KEGDK+ V L F+ + TV+ V

目标：87 ER-IEIPPKGKVEFKHHGYHVMIIGLKKRIKEGDKVKVELIFEKSGKITVEAPV 139

如上所述，将ORF79-1(15.6kDa)克隆到pET载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图18A显示出His-融合蛋白亲和纯化的结果。用纯化的His-融合蛋白免疫小鼠，用其血清进行ELISA(阳性结果)和FACS分析(图18B)。这些实验确认ORF79-1是一种外露蛋白，且是一种有用的免疫原。

实施例88

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 739>：

1 ATGACGGTAA CTGCGGCCGA AGGCGGCAAA GCTGCCAAGG CGTTAAAAAA

51 ATATCTGATT ACGGGCATTT TGGTCTGGCT GCCGATTGCG GTAACGGTTT

101 GGGTGGTTTC CTATATCGTT TCCGCGTCCG ATCAGCTCGT CAACCTGCTG

151 CCGAAGCAAT GGCGGCCGCA ATATGTTTTG GGGTTTAATA TCCCGGGGCT

201 GGGCGTTATC GTTGCCATTG CCGTATTGTT TGTAACCGGA TTGTTTGCCG

251 CCAACGTATT GGGTCGGCAG ATCCTCGCCG CGTGGGACAG CCTGTTGGGG

301 CGGATTCCGG TTGTGAAAtC CATCTATTCG AGTGTGAAAA AAGTATCCGA

351 ATacgTGCTG TCCGACAGCA GCCGTTCGTT TAAAACGCCG GTACTCGTGC

401 CGTTTCCCCA GCCCGGTATT TGGACGATyG CTTTCGTGTC AGGGCAGGTG

451 TCGAATGCGG TTAAGGCCGC ATTGCCGAAs GACGGCGATT ATCTTTCCGT

501 GTATGTTCCG ACCACGCCGA ATCCGACCGG CGGTTACTAT ATTATGGTAA

551 AGAAAAGCGA TGTGCGCGAA CTCGATATGA GCGTGGACGA AsCATTGAAA

601 TATGTGATTT CGCTGGGTAT GGTCATCCCT GACGACCTGC CCGTCAAAAC

651 ATTGGCAsGA CCTATGCCGT CTGAAAAGGC GGATTTGCCC GAACAACAAT

701 AA

它对应于氨基酸序列<SEQ ID 740；ORF98>：

1 MTVTAAEGGK AAKALKKYLI TGILVWLPIA VTVWVVSYIV SASDQLVNLL

51 PKQWRPQYVL GFNIPGLGVI VAIAVLFVTG LFAANVLGRQ ILAAWDSLLG

101 RIPVVKSIYS SVKKVSEYVL SDSSRSFKTP VLVPFPQPGI WTIAFVSGQV

151 SNAVKAALPX DGDYLSVYVP TTPNPTGGYY IMVKKSDVRE LDMSVDEXLK

201 YVISLGMVIP DDLPVKTLAX PMPSEKADLP EQQ*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 741>：

1 ATGACGGAAC nTGCGGCCGA AGGCGGCAAA GCTGCCAArG CGTTAAAAAA

51 ATATCTGATT ACGGGCATTT TGGTCTGGCT GCCGATTGCG GTAACGGTTT

101 GGGTGGTTTC CTATATCGTT TCCGCGTCCG ATCAGCTCGT CAACCTGCTG

151 CCGAAGCAAT GGCGGCCGCA ATATGTTTTG GGGTTTAATA TCCCGGGGCT

201 GGGCGTTATC GTTGCCATTG CCGTATTGTT TGTAACCGGA TTGTTTGCCG

251 CCAACGTATT GGGTCGGCAG ATCCTCGCCG CGTGGGACAG CCTGTTGGGG

301 CGGATTCCGG TTGTGAAATC CATCTATTCG AGTGTGAAAA AAGTATCCGA

351 ATCGCTGCTG TCCGACAGCA GCCGTTCGTT TAAAACGCCG GTACTCGTGC

401 CGTTTCCCCA GCCCGGTATT TGGACGATTG CTTTCGTGTC AGGGCAGGTG

451 TCGAATGCGG TTAAGGCCGC ATTGCCGAAG GACGGCGATT ATCTTTCCGT

501 GTATGTTCCG ACCACGCCGA ATCCGACCGG CGGTTACTAT ATTATGGTAA

551 AGAAAAGCGA TGTGCGCGAA CTCGATATGA GCGTGGACGA AGCATTGAAA

601 TATGTGATTT CGCTGGGTAT GGTCATCCCT GACGACCTGC CCGTCAAAAC

651 ATTGGCAGGA CCTATGCCGT CTGAAAAGGC GGATTTGCCC GAACAACAAT

701 AA

它对应于氨基酸序列<SEQ ID 742；ORF98-1>：

1 MTEXAAEGGK AAKALKKYL I TGILVWLPIA VTVWVVSYIV SASDQLVNLL

51 PKQWRPQYVL GFNIPG LGVI VAIAVLFVTG LFAANVLGRQ ILAAWDSLLG

101 RIPVVKSIYS SVKKVSESLL SDSSRSFKTP VLVPFPQPGI WTIAFVSGQV

151 SNAVKAALPK DGDYLSVYVP TTPNPTGGYY IMVKKSDVRE LDMSVDEALK

201 YVISLGMVIP DDLPVKTLAG PMPSEKADLP EQQ*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF98和脑膜炎奈瑟球菌菌株A的ORF(ORF98a)在233个氨基酸的重叠区内显示出有96.1％的相同性：

10 20 30 40 50 60

orf98.pep MTVTAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

|| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98a MTEPAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

10 20 30 40 50 60

70 80 90 100 110 120

orf98.pep GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSEYVL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||| :|

orf98a GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSXSLL

70 80 90 100 110 120

130 140 150 160 170 180

orf98.pep SDSSRSFKTPVLVPFPQPGIWTIAFVSGQVSNAVKAALPXDGDYLSVYVPTTPNPTGGYY

||||||||||||||||| ||||||||||||||||||||| ||||||||||||||||||||

orf98a SDSSRSFKTPVLVPFPQSGIWTIAFVSGQVSNAVKAALPKDGDYLSVYVPTTPNPTGGYY

130 140 150 160 170 180

190 200 210 220 230

orf98.pep IMVKKSDVRELDMSVDEXLKYVISLGMVIPDDLPVKTLAXPMPSEKADLPEQQX

||||||||||||||||| ||||||||||||||||||||| ||||||||||||||

orf98a IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPSEKADLPEQQX

190 200 210 220 230

全长ORF98a核苷酸序列<SEQ ID 743>是：

1 ATGACGGAAC CTGCGGCCGA AGGCGGCAAA GCTGCCAAGG CGTTAAAAAA

51 ATATCTGATT ACGGGCATTT TGGTCTGGCT GCCGATTGCG GTAACGGTTT

101 GGGTGGTTTC CTATATCGTT TCCGCGTCCG ATCAGCTCGT CAACCTGCTG

151 CCGAAGCAAT GGCGGCCGCA ATATGTTTTG GGGTTTAATA TCCCGGGGCT

201 GGGCGTTATC GTTGCCATTG CCGTATTGTT TGTAACCGGA TTATTTGCCG

251 CAAACGTATT GGGCCGGCAG ATTCTTGCCG CGTGGGACAG CTTGTTGGGG

301 CGGATTCCGG TTGTGAAGTC CATCTATTCG AGTGTGAAAA AAGTATCCGA

351 NTCGTTGCTG TCCGACAGCA GCCGTTCGTT TAAAACACCA GTACTCGTGC

401 CGTTTCCCCA ATCGGGTATT TGGACAATCG CATTCGTGTC CGGTCAGGTG

451 TCGAATGCGG TTAAGGCCGC ATTGCCGAAG GACGGCGATT ATCTTTCCGT

501 GTATGTTCCG ACCACGCCGA ATCCGACCGG CGGTTACTAT ATTATGGTAA

551 AGAAAAGCGA TGTGCGCGAA CTCGATATGA GCGTGGACGA AGCGTTGAAA

601 TATGTGATTT CGCTGGGTAT GGTCATCCCT GACGACCTGC CCGTCAAAAC

651 ATTGGCAGGA CCTATGCCGT CTGAAAAGGC GGATTTGCCC GAACAACAAT

701 AA

它编码的蛋白质具有氨基酸序列<SEQ ID 744>：

1 MTEPAAEGGK AAKALKKYL I TGILVWLPIA VTVWVVSYIV SASDQLVNLL

51 PKQWRPQYVL GFNIPG LGVI VAIAVLFVTG LFAANVLGRQ ILAAWDSLLG

101 RIPVVKSIYS SVKKVSXSLL SDSSRSFKTP VLVPFPQSGI WTIAFVSGQV

151 SNAVKAALPK DGDYLSVYVP TTPNPTGGYY IMVKKSDVRE LDMSVDEALK

201 YVISLGMVIP DDLPVKTLAG PMPSEKADLP EQQ*

ORF98a和ORF98-1在233个氨基酸的重叠区内显示出有98.7％的相同性：

10 20 30 40 50 60

orf98a.pep MTEPAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98-1 MTEXAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

10 20 30 40 50 60

70 80 90 100 110 120

orf98a.pep GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSXSLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98-1 GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSESLL

70 80 90 100 110 120

130 140 150 160 170 180

orf98a.pep SDSSRSFKTPVLVPFPQSGIWTIAFVSGQVSNAVKAALPKDGDYLSVYVPTTPNPTGGYY

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf98-1 SDSSRSFKTPVLVPFPQPGIWTIAFVSGQVSNAVKAALPKDGDYLSVYVPTTPNPTGGYY

130 140 150 160 170 180

190 200 210 220 230

orf98a.pep IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPSEKADLPEQQX

||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98-1 IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPSEKADLPEQQX

190 200 210 220 230

与淋病奈瑟球菌的预计ORF的同源性

ORF98和淋病奈瑟球菌的预计ORF(ORF98ng)在233个氨基酸的重叠区内显示出有95.3％的相同性：

10 20 30 40 50 60

orf98.pep MTVTAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL 60

|| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98ng MTEPAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL 60

orf98.pep GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSEYVL 120

||||||||||||||||||||||||||||||||||||||| ||||||||||||||||| :|

orf9Sng GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLXRIPVVKSIYSSVKKVSESLL 120

orf98.pep SDSSRSFKTPVLVPFPQPGIWTIAFVSGQVSNAVKAALPXDGDYLSVYVPTTPNPTGGYY 180

||||||||||||||||| ||||||||||||||||||||| ||||||||||||||||||||

orf98ng SDSSRSFKTPVLVPFPQSGIWTIAFVSGQVSNAVKAALPQDGDYLSVYVPTTPNPTGGYY 180

orf98.pep IMVKKSDVRELDMSVDEXLKYVISLGMVIPDDLPVKTLAXPMPSEKADLPEQQ 233

||||||||||||||||| ||||||||||||||||||||| ||| |||:|||||

orf98ng IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPPEKAELPEQQ 233

预计全长ORF98ng核苷酸序列<SEQ ID 745>编码的蛋白质具有氨基酸序列<SEQ ID 746>：

1 MTEPAAEGGK AAKALKKYL I TGILVWLPIA VTVWVVSYIV SASDQLVNLL

51 PKQWRPQYVL GFNIPG LGVI VAIAVLFVTG LFAANVLGRQ ILAAWDSLLX

101 RIPVVKSIYS SVKKVSESLL SDSSRSFKTP VLVPFPQSGI WTIAFVSGQV

151 SNAVKAALPQ DGDYLSVYVP TTPNPTGGYY IMVKKSDVRE LDMSVDEALK

201 YVISLGMVIP DDLPVKTLAG PMPPEKAELP EQQ*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 747>：

1 ATGACGGAAC CTGCGGCCGA AGGCGGCAAA GCTGCCAAGG CGTTAAAAAA

51 ATATCTGATT ACAGGCATTT TGGTCTGGCT GCCGATTGCG GTAACGGTTT

101 GGGTGGTTTC CTATATCGTT TCCGCGTCCG ACCAGCTTGT CAACCTGCTG

151 CCGAAGCAAT GGCGGCCGCA ATATGTTTTG GGGTTTAATA TCCCCGGGCT

201 CGGCGTTATT GTTGCCATTG CCGTATTGTT TGTAACCGGA TTATTTGCCG

251 CAAACGTGTT GGGCCGGCAG ATTCTTGCCG CGTGGGACAG CCTGTTgggg

301 cggaTTCCGG TTGTCAAATC CATCTATTCG AGTGTGAAAA AAGTATCCGA

351 ATCGCTGCTG TCCGACAGCA GCCGTTCGTT TAAAACGCCG GTACTCGTGC

401 CGTTTCCCCA ATCGGGTATT TGGACAATCG CATTCGTGTC CGGTCAGGTG

451 TCGAATGCGG TTAAGGCCGC ATTGCCGCAG GATGGCGATT ATCTTTCCGT

501 GTATGTCCCG ACCACGCCCA ACCCGACCGG CGGTTACTAT ATTATGGTAA

551 AGAAAAGCGA TGTGCGCGAA CTCGATATGA GCGTGGACGA AGCGTTGAAA

601 TATGTGATTT CGCTGGGTAT GGTCATCCCT GACGACCTGC CCGTCAAAAC

651 ATTGGCAGGA CCTATGCCGC CTGAAAAGGC GGAGTTGCCC GAACAACAAT

701 AA

它对应于氨基酸序列<SEQ ID 748；ORF98ng-1>：

1 MTEPAAEGGK AAKALKKYL I TGILVWLPIA VTVWVVSYIV SASDQLVNLL

51 PKQWRPQYVL GFNIPG LGVI VAIAVLFVTG LFAANVLGRQ ILAAWDSLLG

101 RIPVVKSIYS SVKKVSESLL SDSSRSFKTP VLVPFPQSGI WTIAFVSGQV

151 SNAVKAALPQ DGDYLSVYVP TTPNPTGGYY IMVKKSDVRE LDMSVDEALK

201 YVISLGMVIP DDLPVKTLAG PMPPEKAELP EQQ*

ORF98ng-1和ORF98-1在233个氨基酸的重叠区内显示出有97.9％的相同性：

10 20 30 40 50 60

orf98-1.pep MTEXAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98ng-1 MTEPAAEGGKAAKALKKYLITGILVWLPIAVTVWVVSYIVSASDQLVNLLPKQWRPQYVL

10 20 30 40 50 60

70 80 90 100 110 120

orf98-1.pep GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSESLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf98ng-1 GFNIPGLGVIVAIAVLFVTGLFAANVLGRQILAAWDSLLGRIPVVKSIYSSVKKVSESLL

70 80 90 100 110 120

130 140 150 160 170 180

orf98-1.pep SDSSRSFKTPVLVPFPQPGIWTIAFVSGQVSNAVKAALPKDGDYLSVYVPTTPNPTGGYY

||||||||||||||||| |||||||||||||||||||||:||||||||||||||||||||

orf98ng-1 SDSSRSFKTPVLVPFPQSGIWTIAFVSGQVSNAVKAALPQDGDYLSVYVPTTPNPTGGYY

130 140 150 160 170 180

190 200 210 220 230

orf98-1.pep IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPSEKADLPEQQX

||||||||||||||||||||||||||||||||||||||||||| |||:||||||

orf98ng-1 IMVKKSDVRELDMSVDEALKYVISLGMVIPDDLPVKTLAGPMPPEKAELPEQQX

190 200 210 220 230

根据该分析结果(包括淋球菌蛋白中的推定跨膜结构域与脑膜炎球菌蛋白中的序列相同这一事实)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例89

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 749>：

1 ATgAAAACGG TAGTCTGGAT TGTCGTCCTG TTTGCCGCCG CCGTCGGACT

51 GGCGCTGGCT TCGGGCATTT ACACCGGCGA CGTGTATATC GTACTCGGAC

101 AGACCATGCT CAGAATCAAC CTGCACGCCT TTGTGTTAGG TTCGCTGATT

151 GCCGTCGTGG TGTGGTATTT CTTGTTTAAA TTCATTATCG G

GgTACTCA

201 ATATCCCCGA AAAGATGCAG CGTTTCGGTT CGGCnCGTAA AGGCCkCAAG

251 ssCGsGCTTG CCTTGAACAA GGCGGGTTTG GCGTATTTTG AAGGGCGTTT

301 TGAAAAGGCG GAACTAGAAG CCTCACGCGT GTTGGTCAAC AAAGtAGGCC

351 G

AGACAAC CGGACTTTGG CATTGATGCT GrGCGCGCAC GCCGCCGGAC

401 AGATGGAAAA CATCGAssTG CGCGACCGTT ATCTTGCGGA AATCGCCAAA

451 CTGCCGGAAA AACAGCAGCT TTCCCGTTAT CTTTTGTTGG CGGAATCGGC

501 GTTGAACCGG CGCGATTACG AAGCGGCGGA AGCCAATCTT CATGCGGCGG

551 CGAAGATGAA TGCCAACCTT ACGCGCCTCG TGCGTCTGCA .ATTCGTTAC

601 GCTTTCGACA GGGGCGACGC GTTGCAGGTT CTGGCAAAAA CCGAAAAACT

651 TTCCAAGGCG GGCGCGTTGG GCAAATCGGA AATGGAACGG TATCAAAATT

701 GGGCATAT C GTCGCCAGCT GGCGGATGCT GCCGATGCCG CCGCTTTGAA

751 AACCTGCCTG AAGCGGATTC CCGACAGCCT CAAAAACGGG GAATTGAGCG

801 TATCGGTTGC GGAAAAGTAC GAACGTTTGG GACTGTATGC CGATGCGGTC

851 AAATGGGTCA AACAGCATTA TCCGCAsAAC CGCCGCCCCG AGCTTTTGGA

901 AGCCTTTGTC GAAAGCGTGC GCTTTTTGGG CGAGCGCGAA CAGCAGAAAG

951 CCATCGATTT TGCCGATGCT TGGCTGAAAG AACAGCCCGA TAACGCGCTT

1001 CTGCTGATGT ATCTCGGTCG GCTCGCCTTC GGCCGCAAAC TTTGGGGCAA

1051 GGCAAAAGGC TACCTTGAAG CGAGCATTGC ATTAAAGCCG AGTATTTCCG

1101 CGCGTTTGGT TCTAACAAAG GTTTTCGACG AAATCGGAGA ACCGCAGAAG

1151 GCGGAGGCGC AC...

它对应于氨基酸序列<SEQ ID 750；ORF100>：

1 MKTVVWIVVL FAAAVGLALA SGIYTGDVYI VLGQTMLRIN LHAFVLGSLI

51 AVVVWYFLFK FIIGVLNIPE KMQRFGSARK GXKXXLALNK AGLAYFEGRF

101 EKAELEASRV LVNKVGRDNR TLALMLXAHA AGQMENIXXR DRYLAEIAKL

151 PEKQQLSRYL LLAESALNRR DYEAAEANLH AAAKMNANLT RLVRLXIRYA

201 FDRGDALQVL AKTEKLSKAG ALGKSEMERY QNWAYRRQLA DAADAAALKT

251 CLKRIPDSLK NGELSVSVAE KYERLGLYAD AVKWVKQHYP XNRRPELLEA

301 FVESVRFLGE REQQKAIDFA DAWLKEQPDN ALLLMYLGRL AFGRKLWGKA

351 KGYLEASIAL KPSISARLVL TKVFDEIGEP QKAEAH...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 751>：

1 ATGAAAACGG TAGTCTGGAT TGTCGTCCTG TTTGCCGCCG CCGTCGGACT

51 GGCGCTGGCT TCGGGCATTT ACACCGGCGA CGTGTATATC GTACTCGGAC

101 AGACCATGCT CAGAATCAAC CTGCACGCCT TTGTGTTAGG TTCGCTGATT

151 GCCGTCGTGG TGTGGTATTT CTTGTTTAAA TTCATTATCG GCGTACTCAA

201 TATCCCCGAA AAGATGCAGC GTTTCGGTTC GGCGCGTAAA GGCCGCAAGG

251 CCGCGCTTGC CTTGAACAAG GCGGGTTTGG CGTATTTTGA AGGGCGTTTT

301 GAAAAGGCGG AACTAGAAGC CTCACGCGTG TTGGTCAACA AAGAGGCCGG

351 AGACAACCGG ACTTTGGCAT TGATGCTGGG CGCGCACGCC GCCGGACAGA

401 TGGAAAACAT CGAGCTGCGC GACCGTTATC TTGCGGAAAT CGCCAAACTG

451 CCGGAAAAAC AGCAGCTTTC CCGTTATCTT TTGTTGGCGG AATCGGCGTT

501 GAACCGGCGC GATTACGAAG CGGCGGAAGC CAATCTTCAT GCGGCGGCGA

551 AGATGAATGC CAACCTTACG CGCCTCGTGC GTCTGCAACT TCGTTACGCT

601 TTCGACAGGG GCGACGCGTT GCAGGTTCTG GCAAAAACCG AAAAACTTTC

651 CAAGGCGGGC GCGTTGGGCA AATCGGAAAT GGAACGGTAT CAAAATTGGG

701 CATACCGCCG CCAGCTGGCG GATGCTGCCG ATGCCGCCGC TTTGAAAACC

751 TGCCTGAAGC GGATTCCCGA CAGCCTCAAA AACGGGGAAT TGAGCGTATC

801 GGTTGCGGAA AAGTACGAAC GTTTGGGACT GTATGCCGAT GCGGTCAAAT

851 GGGTCAAACA GCATTATCCG CACAACCGCC GCCCCGAGCT TTTGGAAGCC

901 TTTGTCGAAA GCGTGCGCTT TTTGGGCGAG CGCGAACAGC AGAAAGCCAT

951 CGATTTTGCC GATGCTTGGC TGAAAGAACA GCCCGATAAC GCGCTTCTGC

1001 TGATGTATCT CGGTCGGCTC GCCTACGGCC GCAAACTTTG GGGCAAGGCA

1051 AAAGGCTACC TTGAAGCGAG CATTGCATTA AAGCCGAGTA TTTCCGCGCG

1101 TTTGGTTCTA GCAAAGGTTT TCGACGAAAT CGGAGAACCG CAGAAGGCGG

1151 AGGCGCAGCG CAACTTGGTT TTGGAAGCCG TCTCCGATGA CGAACGTCAC

1201 GCAGCGTTAG AGCAGCATAG CTGA

它对应于氨基酸序列<SEQ ID 752；ORF100-1>：

1 MKTVVWIVVL FAAAVGLALA SGIYTGDVYI VLGQTMLRIN LHAFVLGS LI

51 AVVVWYFLFK FIIGVLNIPE KMQRFGSARK GRKAALALNK AGLAYFEGRF

101 EKAELEASRV LVNKEAGDNR TLALMLGAHA AGQMENIELR DRYLAEIAKL

151 PEKQQLSRYL LLAESALNRR DYEAAEANLH AAAKMNANLT RLVRLQLRYA

201 FDRGDALQVL AKTEKLSKAG ALGKSEMERY QNWAYRRQLA DAADAAALKT

251 CLKRIPDSLK NGELSVSVAE KYERLGLYAD AVKWVKQHYP HNRRPELLEA

301 FVESVRFLGE REQQKAIDFA DAWLKEQPDN ALLLMYLGRL AYGRKLWGKA

351 KGYLEASIAL KPSISARLVL AKVFDEIGEP QKAEAQRNLV LEAVSDDERH

401 AALEQHS*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF100和脑膜炎奈瑟球菌菌株A的ORF(ORF100a)在386个氨基酸的重叠区内显示出有93.5％的相同性：

10 20 30 40 50 60

orf100.pep MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

|||||||||||||| |||||||| ||||||||||||||||||||||||||||||||||||

orf100a MKTVVWIVVLFAAAXGLALASGIXTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

10 20 30 40 50 60

70 80 90 100 110 120

orf100.pep FIIGVLNIPEKMQRFGSARKGXKXXLALNKAGLAYFEGRFEKAELEASRVLVNKVGRDNR

||||||| ||||||||||||| | |||||||||||||||||||||||||| || : |||

orf100a FIIGVLNXPEKMQRFGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLGNKEAGDNR

70 80 90 100 110 120

130 140 150 160 170 180

orf100.pep TLALMLXAHAAGQMENIXXRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

|||||| |||||||||| |||||||||||||||||||||||||||||||||||||||||

orf100a TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

130 140 150 160 170 180

190 200 210 220 230 240

orf100.pep AAAKMNANLTRLVRLXIRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQLA

||||||||||||||| :||||||||||||||||| ||||| ||||||||||||||||||

orf100a AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKXSKAGAXGKSEMERYQNWAYRRQLX

190 200 210 220 230 240

250 260 270 280 290 300

orf100.pep DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPXNRRPELLEA

|||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||

orf100a DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA

250 260 270 280 290 300

310 320 330 340 350 360

orf100.pep FVESVRFLGEREQQKAIDFADAWLKEQPDNALLLMYLGRLAFGRKLWGKAKGYLEASIAL

|||||||||||:|||||||||||||||||||||||||||||:||||||||||||||||||

orf100a FVESVRFLGERDQQKAIDFADAWLKEQPDNALLLXYLGRLAYGRKLWGKAKGYLEASIAL

310 320 330 340 350 360

370 380

orf100.pep KPSISARLVLTKVFDEIGEPQKAEAH

||||||||||:||||| ||||||||:

orf100a KPSISARLVLAKVFDETGEPQKAEAQRNLVLASVAEENRPSAETHX

370 380 390 400

全长ORF100a核苷酸序列<SEQ ID 753>是：

1 ATGAAAACGG TAGTCTGGAT TGTCGTCCTG TTTGCCGCCG CNNTCGGGCT

51 GGCATTGGCG TCGGGCATTN ACACCGGCGA CGTGTATATC GTACTCGGAC

101 AGACCATGCT CAGAATCAAC CTGCACGCCT TTGTGTTAGG TTCGCTGATT

151 GCCGTCGTGG TGTGGTATTT CCTGTTCAAA TTCATCATCG GCGTACTCAA

201 TANCCCCGAA AAGATGCAGC GTTTCGGTTC GGCGCGTAAA GGCCGCAAGG

251 CCGCGCTTGC TTTGAACAAG GCGGGTTTGG CGTATTTTGA AGGGCGTTTT

301 GAAAAGGCGG AACTTGAAGC CTCGCGCGTA TTGGGAAACA AAGAGGCGGG

351 GGATAACCGG ACTTTGGCAT TGATGTTGGG CGCACATGCC GCCGGGCAGA

401 TGGAAAACAT CGAGCTGCGC GACCGTTATC TTGCGGAAAT CGCCAAACTG

451 CCGGAAAAGC AGCAGCTTTC CCGTTATCTT TTGTTGGCGG AATCGGCGTT

501 GAACCGGCGC GATTACGAAG CGGCGGAAGC CAATCTTCAT GCGGCGGCGA

551 AGATGAATGC CAACCTTACG CGCCTCGTGC GTCTGCAACT TCGTTACGCT

601 TTCGACAGGG GCGACGCGTT GCAGGTTCTG GCAAAAACCG AAAAANTTTC

651 CAAGGCGGGC GCGTNGGGCA AATCGGAAAT GGAACGGTAT CAAAATTGGG

701 CATACCGCCG CCAGCTGNCG GATGCTGCCG ATGCCGCCGC TTTGAAAACC

751 TGCCTGAAGC GGATTCCCGA CAGCCTCAAA AACGGGGAAT TGAGCGTATC

801 GGTTGCGGAA AAGTACGAAC GTTTGGGACT GTATGCCGAT GCGGTCAAAT

851 GGGTCAAACA GCATTATCCG CACAACCGCC GACCCGAACT TTTGGAAGCN

901 TTTGTCGAAA GCGTGCGCTT TTTGGGCGAA CGCGATCAGC AGAAAGCCAT

951 CGATTTTGCC GATGCTTGGC TGAAAGAACA GCCCGATAAT GCGCTTCTGC

1001 TGANGTATCT CGGTCGGCTC GCCTACGGCC GCAAACTTTG GGGCAAGGCA

1051 AAAGGCTACC TTGAAGCGAG CATTGCATTA AAGCCGAGTA TTTCCGCGCG

1101 TTTGGTTCTG GCAAAGGTTT TTGACGAAAC CGGAGAACCG CAGAAGGCGG

1151 AGGCGCAGCG CAACTTGGTT TTGGCAAGCG TTGCCGAGGA AAACCGNCCT

1201 TCCGCCGAAA CCCATTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 754>：

1 MKTVVWIVVL FAAAXGLALA SGIXTGDVYI VLGQTMLRIN LHAFVLGS LI

51 AVVVWYFLFK FIIGVLNXPE KMQRFGSARK GRKAALALNK AGLAYFEGRF

101 EKAELEASRV LGNKEAGDNR TLALMLGAHA AGQMENIELR DRYLAEIAKL

151 PEKQQLSRYL LLAESALNRR DYEAAEANLH AAAKMNANLT RLVRLQLRYA

201 FDRGDALQVL AKTEKXSKAG AXGKSEMERY QNWAYRRQLX DAADAAALKT

251 CLKRIPDSLK NGELSVSVAE KYERLGLYAD AVKWVKQHYP HNRRPELLEA

301 FVESVRFLGE RDQQKAIDFA DAWLKEQPDN ALLLXYLGRL AYGRKLWGKA

351 KGYLEASIAL KPSISARLVL AKVFDETGEP QKAEAQRNLV LASVAEENRP

401 SAETH*

ORF100a和ORF100-1在406个氨基酸的重叠区内显示出有95.1％的相同性：

10 20 30 40 50 60

orf100a.pep MKTVVWIVVLFAAAXGLALASGIXTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

|||||||||||||| |||||||| ||||||||||||||||||||||||||||||||||||

orf100-1 MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

10 20 30 40 50 60

70 80 90 100 110 120

orf100a.pep FIIGVLNXPEKMQRFGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLGNKEAGDNR

||||||| ||||||||||||||||||||||||||||||||||||||||||| ||||||||

orf100-1 FIIGVLNIPEKMQRFGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLVNKEAGDNR

70 80 90 100 110 120

130 140 150 160 170 180

orf100a.pep TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100-1 TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

130 140 150 160 170 180

190 200 210 220 230 240

orf100a.pep AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKXSKAGAXGKSEMERYQNWAYRRQLX

||||||||||||||||||||||||||||||||||| ||||| |||||||||||||||||

orf100-1 AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQLA

190 200 210 220 230 240

250 260 270 280 290 300

orf100a.pep DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100-1 DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA

250 260 270 280 290 300

310 320 330 340 350 360

orf100a.pep FVESVRFLGERDQQKAIDFADAWLKEQPDNALLLXYLGRLAYGRKLWGKAKGYLEASIAL

|||||||||||:|||||||||||||||||||||| |||||||||||||||||||||||||

orf100-1 FVESVRFLGEREQQKAIDFADAWLKEQPDNALLLMYLGRLAYGRKLWGKAKGYLEASIAL

310 320 330 340 350 360

370 380 390 400

orf100a.pep KPSISARLVLAKVFDETGEPQKAEAQRNLVLASVAEENRPSA-ETHX

|||||||||||||||| |||||||||||||| :|::::| :| | |

orf100-1 KPSISARLVLAKVFDEIGEPQKAEAQRNLVLEAVSDDERHAALEQHSX

370 380 390 400

与淋病奈瑟基菌的预计ORF的同源性

ORF100和淋病奈瑟球菌的预计ORF(ORF100ng)在386个氨基酸的重叠区内显示出有93.3％的相同性：

orf100.pep MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100ng MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK 60

orf100.pep FIIGVLNIPEKMQRFGSARKGXKXXLALNKAGLAYFEGRFEKAELEASRVLVNKVGRDNR 120

||||||||||:|:| |||||| | |||||||||||||||||||||||||| || : |||

orf100ng FIIGVLNIPENMRRSGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLGNKEAGDNR 120

orf100.pep TLALMLXAHAAGQMENIXXRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH 180

|||||| |||||||||| |||||||||||||||||||||||||||||||||||||||||

orf100ng TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH 180

orf100.pep AAAKMNANLTRLVRLXIRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQLA 240

||||||||||||||| :|||||||||||||||||||||||||||||||||||||||||:|

orf100ng AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQMA 240

orf100.pep DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPXNRRPELLEA 300

|||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||

orf100ng DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA 300

orf100.pep FVESVRFLGEREQQKAIDFADAWLKEQPDNALLLMYLGRLAFGRKLWGKAKGYLEASIAL 360

|||||||||||||||||||:|||||||||||||||||||||:||||||||||||||||||

orf100ng FVESVRFLGEREQQKAIDFADSWLKEQPDNALLLMYLGRLAYGRKLWGKAKGYLEASIAL 360

orf100.pep KPSISARLVLTKVFDEIGEPQKAEAH 386

|||| |||||:||||| :: |||||:

orf100ng KPSIPARLVLAKVFDETAQSQKAEAQRNLVLASVAGENRPSAETR 405

全长ORF100ng核苷酸序列<SEQ ID 755>是：

1 ATGAAAACGG TAGTCTGGAT TGTTGTCCTG TTTGCCGCCG CCGTCGGACT

51 GGCGCTGGCT TCGGGCATTT ACACCGGCGA CGTGTATATC GTACTCGGAC

101 AGACCATGCT CAGAATCAAC CTGCACGCCT TTGTGTTAGG TTCGCTGATT

151 GCCGTCGTGG TGTGGTATTT CCTGTTTAAA TTCATCATCG GCGTACTCAA

201 TATCCCCGAA AATATGCGGC GTTCCGGTTC GGCGCGGAAA GGCCGCAAGG

251 CCGCGCTTGC CTTGAATAAG GCGGGTTTGG CGTATTTCGA AGGGCGTTTT

301 GAAAAGGCGG AACTCGAAGC CTCTCGAGTG TTGGGCAACA AAGAGGCCGG

351 AGACAACCGG ACTTTGGCAT TGATGCTGGG CGCGCACGCG GCAGGACAGA

401 TGGAAAATAT CGAGCTGCGC GACCGTTATC TTGCGGAAAT CGCCAAACTG

451 CCGGAAAAAC AGCAGCTTTC CCGCTATCTT CTGCTGGCGG AATCGGCGTT

501 AAACCGGCGC GATTACGAAG CGGCGGAAGC CAATCTTCAT GCGGCGGCGA

551 AGATGAATGC CAACCTTACG CGCCTCGTGC GTCTGCAACT TCGTTACGCC

601 TTCGATCGGG GCGATGCGTT GCAGGTTCTG GCAAAAaccG AAAAACTTTC

651 CAAGGCGGGC GCGTTGGGCA AATCGGAAAT GGAACGGTAT CAAAATTGGG

701 CATACCGCCG CCAGATGGCG GATGCTGCCG ATGCCGCCGC TTTGAAAACC

751 TGCCTGAAGC GGATTCCCGA CAGCCTCAAA AACGGGGAAT TGagcGTATC

801 GGTTGCGGAA AAGTACGAAC GTTTGGGACT GTATGCCGAT GCGGTCAAAT

851 GGGTCAAACA GCATTATCCG CACAACCGCC GCCCCGAGCT TTTGGAAGCC

901 TTTGTCGAAA GCGTGCGCTT TTTGGGCGAG CGCGAACAGC AGAAAGCCAT

951 CGATTTTGCC GATTCTTGGC TGAAAGAACA GCCCGATAAC GCGCTTCTGC1001 TGATGTATCT CGGCCGGCTC GCCTACGGCC GCAAACTTTG GGGTAAGGCA1051 AAAGGCTACC TTGAAGCGAG TATTGCACTG AAGCCGAGTA TTCCGGCGCG1101 TTTGGTGTTG GCAAAGGTTT TTGACGAAAC CGCACAGTCG CAAAAAGCCG1151 AAGCACAGCG CAACTTGGTT TTGGCAAGCG TTGCCGGGGA AAACCGCCCT1201 TCCGCCGAAA CCCGTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 756>：

1 MKTVVWIVVL FAAAVGLALA SGIYTGDVYI VLGQTMLRIN LHAFVLGSL I

51 AVVVWYFLFK FIIGVLNIPE NMRRSGSARK GRKAALALNK AGLAYFEGRF

101 EKAELEASRV LGNKEAGDNR TLALMLGAHA AGQMENIELR DRYLAEIAKL

151 PEKQQLSRYL LLAESALNRR DYEAAEANLH AAAKMNANLT RLVRLQLRYA

201 FD RGDALQVL AKTEKLSKAG ALGKSEMERY QNWAYRRQMA DAADAAALKT

251 CLKRIPDSLK NGELSVSVAE KYERLGLYAD AVKWVKQHYP HNRRPELLEA

301 FVESVRFLGE REQQKAIDFA DSWLKEQPDN ALLLMYLGRL AYGRKLWGKA

351 KGYLEASIAL KPSIPARLVL AKVFDETAQS QKAEAQRNLV LASVAGENRP

401 SAETR*

ORF100ng和ORF100-在402个氨基酸的重叠区内1显示出有95.3％的相同性：

10 20 30 40 50 60

orf100-1.pep MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100ng MKTVVWIVVLFAAAVGLALASGIYTGDVYIVLGQTMLRINLHAFVLGSLIAVVVWYFLFK

10 20 30 40 50 60

70 80 90 100 110 120

orf100-1.pep FIIGVLNIPEKMQRFGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLVNKEAGDNR

||||||||||:|:| |||||||||||||||||||||||||||||||||| ||||||||||

orf100ng FIIGVLNIPENMRRSGSARKGRKAALALNKAGLAYFEGRFEKAELEASRVLGNKEAGDNR

70 80 90 100 110 120

130 140 150 160 170 180

orf100-1.pep TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100ng TLALMLGAHAAGQMENIELRDRYLAEIAKLPEKQQLSRYLLLAESALNRRDYEAAEANLH

130 140 150 160 170 180

190 200 210 220 230 240

orf100-1.pep AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQLA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf100ng AAAKMNANLTRLVRLQLRYAFDRGDALQVLAKTEKLSKAGALGKSEMERYQNWAYRRQMA

190 200 210 220 230 240

250 260 270 280 290 300

orf100-1.pep DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf100ng DAADAAALKTCLKRIPDSLKNGELSVSVAEKYERLGLYADAVKWVKQHYPHNRRPELLEA

250 260 270 280 290 300

310 320 330 340 350 360

orf100-1.pep FVESVRFLGEREQQKAIDFADAWLKEQPDNALLLMYLGRLAYGRKLWGKAKGYLEASIAL

|||||||||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf100ng FVESVRFLGEREQQKAIDFADSWLKEQPDNALLLMYLGRLAYGRKLWGKAKGYLEASIAL

310 320 330 340 350 360

370 380 390 400

orf100-1.pep KPSISARLVLAKVFDEIGEPQKAEAQRNLVLEAVSDDERHAALEQHSX

|||| ||||||||||| :: ||||||||||| :|: ::| :|

orf100n KPSIPARLVLAKVFDETAQSQKAEAQRNLVLASVAGENRPSAETRX

370 380 390 400

根据该分析结果(包括一个推定的前导序列、一个推定的跨膜结构域以及一个RGD基序的存在)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例90

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 757>

1 ATGATGTTTT CTTGGTTCAA GCTGTTTCAC TTGTTTTTTG TCATTTCGTG

51 GTTTGCAGGG CTGTTTTACC TGCCGAGGAT TTTCGTCAAT ATGGCGATGA

101 TTGATGTGCC GCGCGGCAAT CCCGAGTATG TGCGTCTGTC GGGCATGGCG

151 GTGCGGCTGT ACCGTTTTAT GTCGCCGTTG GGCTTCGGCG CGGTCGTGTT

201 CGGCGCGGCG ATACCGTTTG CCGCCGGCTG GTGGGGCAGC GGCTGGGTAC

251 ACGTCAAACT GTGTTTGGGC TTGATGCTCT TGGCTTACCA GTTGTATTGC

301 GGCGTGCTGC TGCGCCGTTT TCAGGATTAC AGCAATGCTT TTTCACACCG

351 CTGGTACCGC GTGTTCAACG AAATCCCCGT GCTGCTGATG GTTGCCGCGC

401 TGTATsTGGT CGTGTTCAAA CCGTTTTGA

它对应于氨基酸序列<SEQ ID 758；ORF102>：

1 MMFSWFKLFH LFFVISWFAG LFYLPRIFVN MAMIDVPRGN PEYVRLSGMA

51 VRLYRFMSPL GFGAVVFGAA IPFAAGWWGS GWVHVKLCLG LMLLAYQLYC

101 GVLLRRFQDY SNAFSHRWYR VFNEIPVLLM VAALYXVVFK PF*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 759>：

1 ATGATGTTTT CTTGGTTCAA GCTGTTTCAC TTGTTTTTTG TCATTTCGTG

51 GTTTGCAGGG CTGTTTTACC TGCCGAGGAT TTTCGTCAAT ATGGCGATGA

101 TTGATGTGCC GCGCGGCAAT CCCGAGTATG TGCGTCTGTC GGGCATGGCG

151 GTGCGGCTGT ACCGTTTTAT GTCGCCGTTG GGCTTCGGCG CGGTCGTGTT

201 CGGCGCGGCG ATACCGTTTG CCGCCGGCTG GTGGGGCAGC GGCTGGGTAC

251 ACGTCAAACT GTGTTTGGGC TTGATGCTCT TGGCTTACCA GTTGTATTGC

301 GGCGTGCTGC TGCGCCGTTT TCAGGATTAC AGCAATGCTT TTTCACACCG

351 CTGGTACCGC GTGTTCAACG AAATCCCCGT GCTGCTGATG GTTGCCGCGC

401 TGTATCTGGT CGTGTTCAAA CCGTTTTGA

它对应于氨基酸序列<SEQ ID 760；ORF102-1>：

1 MMFSWFKLFH LFFVISWFAG LFYLPRIFVN MAMIDVPRGN PEYVRLSGMA

51 VRLYRFMSP L GFGAVVFGAA IPFAAGWWGS GWVHVK LCLG LMLLAYQLYC

101 GVLLRRFQDY SNAFSHRWYR VFNE IPVLLM VAALYLVVFK PF*

该氨基酸序列的计算机分析给出了下列结果：

与幽门螺杆菌的HP1484假设整合膜蛋白(登录号为AE000647)的同源性ORF102和HP1484在143个氨基酸的重叠区内显示出有33％的氨基酸相同性：

orf102 3 FSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPLGF 62

F W K FH+ VISW A LFYLPR+FV A + V++ +LY F++

HP1484 8 FLWVKAFHVIAVISWMAALFYLPRLFVYHAENAHKKEFVGVVQIQEK--KLYSFIASPAM 65

orf102 63 GAVVFGAAIPFAAG---WWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWY 119

G + + + GW+H KL L ++LLAY YC +R + + R+Y

HP1484 66 GFTLITGILMLLIEPTLFKSGGWLHAKLALVVLLLAYHFYCKKCMRELEKDPTRRNARFY 125

orf102 120 RVFNEIPXXXXXXXXXXXXFKPF 142

RVFNE P KPF

HP1484 126 RVFNEAPTILMILIVILVVVKPF 148

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF102和脑膜炎奈瑟球菌菌株A的ORF(ORF102a)在142个氨基酸的重叠区内显示出有99.3％的相同性：

10 20 30 40 50 60

orf102.pep MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf102a MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL

10 20 30 40 50 60

70 80 90 100 110 120

orf102.pep GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf102a GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

70 80 90 100 110 120

130 140

orf102.pep VFNEIPVLLMVAALYXVVFKPFX

||||||||||||||| |||||||

orf102a VFNEIPVLLMVAALYLVVFKPFX

130 140

全长ORF102a核苷酸序列<SEQ ID 761>是：

1 ATGATGTTTT CTTGGTTCAA GCTGTTTCAC TTGTTTTTTG TCATTTCGTG

51 GTTTGCAGGG CTGTTTTACC TGCCGAGGAT TTTCGTCAAT ATGGCGATGA

101 TTGATGTGCC GCGCGGCAAT CCCGAGTATG TGCGTCTGTC GGGCATGGCG

151 GTGCGGCTGT ACCGTTTTAT GTCGCCGTTG GGCTTCGGCG CGGTCGTGTT

201 CGGCGCGGCG ATACCGTTTG CCGCCGGCTG GTGGGGCAGC GGCTGGGTAC

251 ACGTCAAACT GTGTTTGGGC TTGATGCTCT TGGCTTACCA GTTGTATTGC

301 GGCGTGCTGC TGCGCCGTTT TCAGGATTAC AGCAATGCTT TTTCACACCG

351 CTGGTACCGC GTGTTCAACG AAATCCCCGT GCTGCTGATG GTTGCCGCGC

401 TGTATCTGGT CGTGTTCAAA CCGTTTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 762>：

1 MMFSWFKLFH LFFVISWFAG LFYLPRIFVN MAMIDVPRGN PEYVRLSGMA

51 VRLYRFMSP L GFGAVVFGAA IPFAAGWWGS GWVHVK LCLG LMLLAYQLYC

101 GVLLRRFQDY SNAFSHRWYR VFNE IPVLLM VAALYLVVFK PF*

ORF102a和ORF102-1在142个氨基酸的重叠区内显示出完全相同：

10 20 30 40 50 60

orf102a.pep MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf102-1 MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL

10 20 30 40 50 60

70 80 90 100 110 120

orf102a.pep GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf102-1 GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

70 80 90 100 110 120

130 140

orf102a.pep VFNEIPVLLMVAALYLVVFKPFX

|||||||||||||||||||||||

orf102-1 VFNEIPVLLMVAALYLVVFKPFX

130 140

与淋病奈瑟球菌的预计ORF的同源性

ORF102和淋病奈瑟球菌的预计ORF(ORF102ng)在142个氨基酸的重叠区内显示出有97.9％的相同性：

orf102.pep MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL 60

|||||||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf102ng MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDAPRGNPEYVRLSGMAVRLYRFMSPL 60

orf102.pep GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR 120

|||||||||||||||| |||||||||||||||||||||||||||||||||||||||||||

orf102ng GFGAVVFGAAIPFAAGRWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR 120

orf102.pep VFNEIPVLLMVAALYXVVFKPF 142

||||||||||||||| ||||||

orf102ng VFNEIPVLLMVAALYLVVFKPF 142

全长ORF102ng核苷酸序列<SEQ ID 763>是：

1 ATGATGTTTT CTTGGTTCAA GCTGTTTCAC TTGTTTTTTG TCATTTCGTG

51 GTTTGCAGGG CTGTTTTACC TGCCGAGGAT TTTCGTCAAT ATGGCGATGA

101 TTGATGCGCC GCGCGGCAAT CCCGAGTATG TGCGCCTGTC GGGGATGGCG

151 GTGCGGTTGT ACCGTTTTAT GTCGCCTTTG GGTTTCGGCG CGGTCGTGTT

201 CGGCGCGGCG ATACCGTTTG CCGCcggccg GTGGGGCagc ggctggGTTC

251 ACGTCAAACT GTGTTTGGGC TTGATGCTCT TGGCTTATCA GTTGTATTGC

301 GGCGTGCTGC TGCGCCGTTT TCAGGATTAC AGCAATGCTT TTTCACACCG

351 CTGGTACCGC GTGTTCAAcg aAATCCCCGT GCTGCTGATG GTTGCCGCGC

401 TGTATCTGGT CGTGTTCAAA CCGTTTTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 764>：

1 MMFSWFKLFH LFFYISWFAG LFYLPRIFVN MAMIDAPRGN PEYVRLSGMA

51 VRLYRFMSP L GFGAVVFGAA IPFAAGRWGS GWVHVK LCLG LMLLAYQLYC

101 GVLLRRFQDY SNAFSHRWYR VFNE IPVLLM VAALYLVVFK PF*

ORF102ng和ORF102-1在142个氨基酸的重叠区内显示出有98.6％的相同性：

10 20 30 40 50 60

orf102-1.pep MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDVPRGNPEYVRLSGMAVRLYRFMSPL

|||||||||||||||||||||||||||||||||||:||||||||||||||||||||||||

orf102ng MMFSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDAPRGNPEYVRLSGMAVRLYRFMSPL

10 20 30 40 50 60

70 80 90 100 110 120

orf102-1.pep GFGAVVFGAAIPFAAGWWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

|||||||||||||||| |||||||||||||||||||||||||||||||||||||||||||

orf102ng GFGAVVFGAAIPFAAGRWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFSHRWYR

70 80 90 100 110 120

130 140

orf102-1.pep VFNEIPVLLMVAALYLVVFKPFX

|||||||||||||||||||||||

orf102ng VFNEIPVLLMVAALYLVVFKPFX

130 140

另外，ORF102ng显示出与幽门螺杆菌的一种膜蛋白明显同源：

gi|2314656(AE000647)保守的假设整合蛋白[幽门螺杆菌]长度＝148

评分＝79.2位(192)，估计值＝1e-14

相同性＝50/147(34％)，阳性＝68/147(46％)，空隙＝13/147(8％)

询问：3 FSWFKLFHLFFVISWFAGLFYLPRIFVNMAMIDAPRGNPEYVRLSGMAVRLYRFMSPLGF 62

F W K FH+ VISW A LFYLPR+FV A + V++ +LY F++

目标：8 FLWVKAFHVIAVISWMAALFYLPRLFVYHAENAHKKEFVGVVQIQEK--KLYSFIASPAM 65

询问：63 GAVVFGAAIP-------FAAGRWGSGWVHVKLCLGLMLLAYQLYCGVLLRRFQDYSNAFS 115

G + + F +G GW+H KL L ++LLAY YC +R + +

目标：66 GFTLITGILMLLIEPTLFKSG----GWLHAKLALVVLLLAYHFYCKKCMRELEKDPTRRN 121

询问：116 HRWYRVFNEIPXXXXXXXXXXXXFKPF 142

R+YRVFNE P KPF

目标：122 ARFYRVFNEAPTILMILIVILVVVKPF 148

实施例91

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 765>：

1 ATGGCAAAAA TGATGAAATG GGCGGCTGTT GCGGCGGTCG CGGCGGCAGC

51 GGTTTGGGGC GGATGGTCTT AACTGAAGCC CGAGCCGCAC GTGCTTGATA

101 TTACGGAAAC GGTCAGGCGC GGC //.....

//.. ATTTCGTTTA CGATTTTGTC CGAACCGGAT ACGCCGATTA AGGCGAAGCT

51 CGACAGCGTC GACCCCGGGC TGACCACGAT GTCGTCGGGC GGTTACAACA

101 GCAGTACGGA TACGGCTTCC AATGCGGTCT ACTATTATGC CCGTTCGTTT

151 GTGCCGAATC CGGACGGCAA ACTCGCCACG GGGATGACGA CGCAGAATAC

201 GGTTGAAATC GACGGCGTGA AAAATGTGCT GATTATTCCG TCGCTGACCG

251 TGAAAAATCG CGGCGGCAAG GCGTTTGTGC GCGTGTTGGG TGCGGACGGC

301 AAGGCGGCGG AACGCGAAAT CCGGACCGGT ATGAGAGACA GTATGAATAC

351 CGAAGTAAAA AGCGGGTTGA AAGAGGGGGA CAAAGTGGTC ATCTCCGAAA

401 TAACCGCCGC CGAGCAACAG GAAAGCGGCG AACGCGCCCT AGGCGGCCCG

451 CCGCGCCGAT AA

它对应于氨基酸序列<SEQ ID 766；ORF85>：

1 MAKMMKWAAV AAVAAAAVWG GWS.LKPEPH VLDITETVRR G........

51 .......... .......... .......... .......... ..........

101 .......... .......... .......... .......... ..........

151 .......... .......... .......... .......... ..........

201 .......... .......... .......... .........I SFTILSEPDT

251 PIKAKLDSVD PGLTTMSSGG YNSSTDTASN AVYYYARSFV PNPDGKLATG

301 MTTQNTVEID GVKNVLIIPS LTVKNRGGKA FVRVLGADGK AAEREIRTGM

351 RDSMNTEVKS GLKEGDKVVI SEITAAEQQE SGERALGGPP RR*

进一步的工作揭示了部分核苷酸序列<SEQ ID 767>：

1 ..GTATCGGTCG GCGCGCAGGC ATCGGGGCAG ATTAAGATAC TTTATGTCAA

51 ACTCGGGCAA CAGGTTAAAA AGGGCGATTT GATTGCGGAA ATCAATTCGA

101 CCTCGCAGAC CAATACGCTC AATACGGAAA AATCCAAGTT GGAAACGTAT

151 CAGGCGAAGC TGGTGTCGGC ACAGATTGCA TTGGGCAGCG CGGAGAAGAA

201 ATATAAGCGT CAGGCGGCGT TATGGAAGGA AAACGCGACT TCCAAAGAGG

251 ATTTGGAAAG CGCGCAGGAT GCGTTTGCCG CCGCCAAAGC CAATGTTGCC

301 GAGCTGAAGG CTTTAATCAG ACAGAGCAAA ATTTCCATCA ATACCGCCGA

351 GTCGGAATTG GGCTACACGC GCATTACCGC AACGATGGAC GGCACGGTGG

401 TGGCGATTCT CGTGGAAGAG GGGCAGACTG TGAACGCGGC GCAGTCTACG

451 CCGACGATTG TCCAATTGGC GAATCTGGAT ATGATGTTGA ACAAAATGCA

501 GATTGCCGAG GGCGATATTA CCAAGGTGAA GGCGGGGCAG GATATTTCGT

551 TTACGATTTT GTCCGAACCG GATACGCCGA TTAAGGCGAA GCTCGACAGC

601 GTCGACCCCG GGCTGACCAC GATGTCGTCG GGCGGTTACA ACAGCAGTAC

651 GGATACGGCT TCCAATGCGG TCTACTATTA TGCCCGTTCG TTTGTGCCGA

701 ATCCGGACGG CAAACTCGCC ACGGGGATGA CGACGCAGAA TACGGTTGAA

751 ATCGACGGCG TGAAAAATGT GCTGATTATT CCGTCGCTGA CCGTGAAAAA

801 TCGCGGCGGC AAGGCGTTTG TGCGCGTGTT GGGTGCGGAC GGCAAGGCGG

851 CGGAACGCGA AATCCGGACC GGTATGAGAG ACAGTATGAA TACCGAAGTA

901 AAAAGCGGGT TGAAAGAGGG GGACAAAGTG GTCATCTCCG AAATAACCGC

951 CGCCGAGCAA CAGGAAAGCG GCGAACGCGC CCTAGGCGGC CCGCCGCGCC

1001 GATAA

它对应于氨基酸序列<SEQ ID 768；ORF85-1>：

1 ..VSVGAQASGQ IKILYVKLGQ QVKKGDLIAE INSTSQTNTL NTEKSKLETY

51 QAKLVSAQIA LGSAEKKYKR QAALWKENAT SKEDLESAQD AFAAAKANVA

101 ELKALIRQSK ISINTAESEL GYTRITATMD GTVVAILVEE GQTVNAAQST

151 PTIVQLANLD MMLNKMQIAE GDITKVKAGQ DISFTILSEP DTPIKAKLDS

201 VDPGLTTMSS GGYNSSTDTA SNAVYYYARS FVPNPDGKLA TGMTTQNTVE

251 IDGVKNVLII PSLTVKNRGG KAFVRVLGAD GKAAEREIRT GMRDSMNTEV

301 KSGLKEGDKV VISEITAAEQ QESGERALGG PPRR*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF85和脑膜炎奈瑟球菌菌株A的ORF(ORF85a)在41个氨基酸的重叠区内有87.8％的相同性，在153个氨基酸的重叠区内有99.3％的相同性：

10 20 30 40

orf85.pep MAKMMKWAAVAAVAAAAVWGGWS-LKPEPHVLDITETVRRG

||||||||||||||||||||||| |||||:: ||||||||

orf85a MAKMMKWAAVAAVAAAAVWGGWSYLKPEPQAAYITETVRRGDISRTVSATGEISPSNLVS

10 20 30 40 50 60

80 90 100

orf85.pep ..............................ISFTILSEPDTPIKAKLDSVDPGLTTMSSG

||||||||||||||||||||||||||||||

orf85a TIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSSG

210 220 230 240 250 260

110 120 130 140 150 160

orf85.pep GYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLIIPSLTVKNRGGK

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:

orf85a GYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLIIPSLTVKNRGGR

270 280 290 300 310 320

170 180 190 200 210 220

orf85.pep AFVRVLGADGKAAEREIRTGMRDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGGP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85a AFVRVLGADGKAAEREIRTGMRDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGGP

330 340 350 360 370 380

230

orf85.pep PRRX

||||

orf85a PRRX

390

全长ORF85a核苷酸序列<SEQ ID 769>是：

1 ATGGCAAAAA TGATGAAATG GGCGGCTGTT GCGGCGGTCG CGGCGGCAGC

51 GGTTTGGGGC GGATGGTCTT ATCTGAAGCC CGAGCCGCAG GCTGCTTATA

101 TTACGGAAAC GGTCAGGCGC GGCGACATCA GCCGGACGGT TTCTGCAACA

151 GGGGAGATTT CGCCGTCCAA CCTGGTATCG GTCGGCGCGC AGGCATCGGG

201 GCAGATTAAG AAACTTTATG TCAAACTCGG GCAACAGGTT AAAAAGGGCG

251 ATTTGATTGC GGAAATCAAT TCGACCTCGC AGACCAATAC GCTCAATACG

301 GAAAAATCCA AATTGGAAAC GTATCAGGCG AAGCTGGTGT CGGCACAGAT

351 TGCATTGGGC AGCGCGGAGA AGAAATATAA GCGTCAGGCG GCGTTGTGGA

401 AGGATGATGC GACCGCTAAA GAAGATTTGG AAAGCGCACA GGATGCGCTT

451 GCCGCCGCCA AAGCCAATGT TGCCGAGCTG AAGGCTCTAA TCAGACAGAG

501 CAAAATTTCC ATCAATACCG CCGAGTCGGA ATTGGGCTAC ACGCGCATTA

551 CCGCAACGAT GGACGGCACG GTGGTGGCGA TTCTCGTGGA AGAGGGGCAG

601 ACTGTGAACG CGGCGCAGTC TACGCCGACG ATTGTCCAAT TGGCGAATCT

651 GGATATGATG TTGAACAAAA TGCAGATTGC CGAGGGCGAT ATTACCAAGG

701 TGAAGGCGGG GCAGGATATT TCGTTTACGA TTTTGTCCGA ACCGGATACG

751 CCGATTAAGG CGAAGCTCGA CAGCGTCGAC CCCGGGCTGA CCACGATGTC

801 GTCGGGCGGC TACAACAGCA GTACGGATAC GGCTTCCAAT GCGGTCTACT

851 ATTATGCCCG TTCGTTTGTG CCGAATCCGG ACGGCAAACT CGCCACGGGG

901 ATGACGACGC AGAATACGGT TGAAATCGAC GGTGTGAAAA ATGTGCTGAT

951 TATTCCGTCG CTGACCGTGA AAAATCGCGG CGGCAGGGCG TTTGTGCGCG

1001 TGTTGGGTGC AGACGGCAAG GCGGCGGAAC GCGAAATCCG GACCGGTATG

1051 AGAGACAGTA TGAATACCGA AGTAAAAAGC GGGTTGAAAG AGGGGGACAA

1101 AGTGGTCATC TCCGAAATAA CCGCCGCCGA GCAGCAGGAA AGCGGCGAAC

1151 GCGCCCTAGG CGGCCCGCCG CGCCGATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 770>：

1 MAKMMKWAAV AAVAAAAVWG GWSYLKPEPQ AAYITETVRR GDISRTVSAT

51 GEISPSNLVS VGAQASGQIK KLYVKLGQQV KKGDLIAEIN STSQTNTLNT

101 EKSKLETYQA KLVSAQIALG SAEKKYKRQA ALWKDDATAK EDLESAQDAL

151 AAAKANVAEL KALIRQSKIS INTAESELGY TRITATMDGT VVAILVEEGQ

201 TVNAAQSTPT IVQLANLDMM LNKMQIAEGD ITKVKAGQDI SFTILSEPDT

251 PIKAKLDSVD PGLTTMSSGG YNSSTDTASN AVYYYARSFV PNPDGKLATG

301 MTTQNTVEID GVKNVLIIPS LTVKNRGGRA FVRVLGADGK AAEREIRTGM

351 RDSMNTEVKS GLKEGDKVVI SEITAAEQQE SGERALGGPP RR*

ORF85a和ORF85-1在334个氨基酸的重叠区内显示出有98.2％的相同性：

30 40 50 60 70 80

orf85a.pep PQAAYITETVRRGDISRTVSATGEISPSNLVSVGAQASGQIKKLYVKLGQQVKKGDLIAE

|||||||||||| |||||||||||||||||

orf85-1 VSVGAQASGQIKILYVKLGQQVKKGDLIAE

10 20 30

90 100 110 120 130 140

orf85a.pep INSTSQTNTLNTEKSKLETYQAKLVSAQIALGSAEKKYKRQAALWKDDATAKEDLESAQD

||||||||||||||||||||||||||||||||||||||||||||||::||:|||||||||

orf85-1 INSTSQTNTLNTEKSKLETYQAKLVSAQIALGSAEKKYKRQAALWKENATSKEDLESAQD

40 50 60 70 80 90

150 160 170 180 190 200

orf85a.pep ALAAAKANVAELKALIRQSKISINTAESELGYTRITATMDGTVVAILVEEGQTVNAAQST

|:||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85-1 AFAAAKANVAELKALIRQSKISINTAESELGYTRITATMDGTVVAILVEEGQTVNAAQST

100 110 120 130 140 150

210 220 230 240 250 260

orf85a.pep PTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85-1 PTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSS

160 170 180 190 200 210

270 280 290 300 310 320

orf85a.pep GGYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLIIPSLTVKNRGG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85-1 GGYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLIIPSLTVKNRGG

220 230 240 250 260 270

330 340 350 360 370 380

orf85a.pep RAFVRVLGADGKAAEREIRTGMRDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGG

:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85-1 KAFVRVLGADGKAAEREIRTGMRDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGG

280 290 300 310 320 330

390

orf85a.pep PPRRX

|||||

orf85-1 PPRRX

图19D显示出ORF85a的亲水性、抗原性指数和AMPHI区域的曲线。

与淋病奈瑟球菌的预计ORF的同源性

ORF85和淋病奈瑟球菌的预计ORF(ORF85ng)显示出高度的相同性：

ORF85 1 MAKMMKWAAVAAVAAAAVWGGWS.LKPEPHVLDITETVRRG......... 40

||||||||||||||||||||||| |||||:: |||:||||

ORF85ng 1 MAKMMKWAAVAAVAAAAVWGGWSYLKPEPQAAYITEAVRRGDISRTVSAT 50

. . . . .

ORF85 .......................................ISFTILSEPDT 250

|||||||||||

ORF85ng 201 TVNAAQSTPTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDT 250

. . . . .

ORF85 251 PIKAKLDSVDPGLTTMSSGGYNSSTDTASNAVYYYARSFVPNPDGKLATG 300

||||||||||||||||||||||||||||||||||||||||||||||||||

ORF85ng 251 PIKAKLDSVDPGLTTMSSGGYNSSTDTASNAVYYYARSFVPNPDGKLATG 300

. . . . .

ORF85 301 MTTQNTVEIDGVKNVLIIPSLTVKNRGGKAFVRVLGADGKAAEREIRTGM 350

||||||||||||||||:|||||||||||||||||||||||| ||||||||

ORF85ng 301 MTTQNTVEIDGVKNVLLIPSLTVKNRGGKAFVRVLGADGKAVEREIRTGM 350

. . . . .

ORF85 152 RDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGGPPRR 393

:|||||||||||||||||||||||||||||||||||||||||

ORF85ng 351 KDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGGPPRR 393

全长ORF85ng核苷酸序列<SEQ ID 771>是：

1 ATGGCAAAAA TGATGAAATG GGCGGCTGTT GCGGCGGTCG CGGCGGCaac

51 GGTTTGGGGC GGATGGTCTT ATCTGAAGCC CGAACCGCAG GCTGCTTATA

101 TTACGGAaac ggTCAGGCGC GGCGATATCA GCCGGACGGT TTCCGCGACG

151 GgcgAGATTT CGCCGTCCAA CCTGGTATCG GTCGGCGCGC AGGCTTCGGG

201 GCAGATTAAA AAGCTTTATG TCAAACTCGG GCAACAGGTC AAAAAGGGCG

251 ATTTGATTGC GGAAATCAAT TCGACCACGC AGACCAACAC GATCGATATG

301 GAAAAATCCA AATTGGAAAC GTATCAGGCG AAGCTGGTGT CGGCACAGAT

351 TGCATTGGGC AGCGCGGAGA AGAAATATAA GCGTCAGGCG GCGTTGTGGA

401 AGGATGATGC GACCTCTAAA GAAGATTTGG AAAGCGCGCA GGATGCGCTT

451 GCCGCCGCCA AAGCCAATGT TGCCGAGTTG AAGGCTTTAA TCAGACAGAG

501 CAAAATTTCC ATCAATACCG CCGAGTCGGA TTTGGGCTAC ACGCGCATTA

551 CCGCGACGAT GGACGGCACG GTGGTGGCGA TTCCCGTGGA AGAGGGGCAG

601 ACTGTGAACG CGGCGCAGTC TACGCCGACG ATTGTCCAAT TGGCGAATCT

651 GGATATGATG TTGAACAAAA TGCAGATTGC CGAGGGCGAT ATTACCAAGG

701 TGAAGGCGGG GCAGGATATT TCGTTTACGA TTTTGTCCGA ACCGGATACG

751 CCGATTAAGG CGAAGCTCGA CAGCGTCGAC CCCGGGCTGA CCACGATGTC

801 GTCGGGCGGC TACAACAGCA GTACGGATAC GGCTTCCAAT GCGGTCTATT

851 ATTATGCCCG TTCGTTTGTG CCGAATCCGG ACGGCAAACT CGCCACGGGG

901 ATGACGACGC AGAATACGGT TGAAATCGAC GGTGTGAAAA ATGTGTTGCT

951 TATTCCGTCG CTGACCGTGA AAAATCGCGG CGGCAAGGCG TTCGTACGCG

1001 TGTTGGGTGC GGACGGCAAG GCAGTGGAAC GCGAAATCCG GACCGGTATG

1051 AAAGACAGTA TGAATACCGA AGTGAAAAGC GGGTTGAAAG AGGGGGACAA

1101 AGTGGTCATC TCCGAAATAA CCGCCGCCGA GCAGCAGGAA AGCGGCGAAC

1151 GCGCCCTAGG CGGCCCGCCG CGCCGATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 772>：

1 MAKMMKWAAV AAVAAAAVWG GWSYLKPEPQ AAYITEAVR R GDISRTVSAT

51 GEISPSNLVS VGAQASGQIK KLYVKLGQQV KKGDLIAEIN STTQTNTIDM

101 EKSKLETYQA KLVSAQIALG SAEKKYKRQA ALWKDDATSK EDLESAQDAL

151 AAAKANVAEL KALIRQSKIS INTAESDLGY TRITATMDGT VVAIPVEEGQ

201 TVNAAQSTPT IVQLANLDMM LNKMQIAEGD ITKVKAGQDI SFTILSEPDT

251 PIKAKLDSVD PGLTTMSSGG YNSSTDTASN AVYYYARSFV PNPDGKLATG

301 MTTQNTVEID GVKNVLLIPS LTVKNRGGKA FVRVLGADGK AVEREIRTGM

351 KDSMNTEVKS GLKEGDKVVI SEITAAEQQE SGERALGGPP RR*

ORF85ng和ORF85-1在334个氨基酸的重叠区内显示出有96.1％的相同性：

30 40 50 60 70 80

orf85ng PQAAYITETVRRGDISRTVSATGEISPSNLVSVGAQASGQIKKLYVKLGQQVKKGDLIAE

|||||||||||| |||||||||||||||||

orf85-1 VSVGAQASGQIKILYVKLGQQVKKGDLIAE

10 20 30

90 100 110 120 130 140

orf85ng INSTTQTNTIDMEKSKLETYQAKLVSAQIALGSAEKKYKRQAALWKDDATSKEDLESAQD

||||:||||:: ||||||||||||||||||||||||||||||||||::||||||||||||

orf85-1 INSTSQTNTLNTEKSKLETYQAKLVSAQIALGSAEKKYKRQAALWKENATSKEDLESAQD

40 50 60 70 80 90

150 160 170 180 190 200

orf85ng ALAAAKANVAELKALIRQSKISINTAESDLGYTRITATMDGTVVAIPVEEGQTVNAAQST

|:||||||||||||||||||||||||||:||||||||||||||||| |||||||||||||

orf85-1 AFAAAKANVAELKALIRQSKISINTAESELGYTRITATMDGTVVAILVEEGQTVNAAQST

100 110 120 130 140 150

210 220 230 240 250 260

orf85ng PTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf85-1 PTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSS

160 170 180 190 200 210

270 280 290 300 310 320

orf85ng GGYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLLIPSLTVKNRGG

||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||||

orf85-1 GGYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLIIPSLTVKNRGG

220 230 240 250 260 270

330 340 350 360 370 380

orf85ng KAFVRVLGADGKAVEREIRTGMKDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGG

|||||||||||||:||||||||:|||||||||||||||||||||||||||||||||||||

orf85-1 KAFVRVLGADGKAAEREIRTGMRDSMNTEVKSGLKEGDKVVISEITAAEQQESGERALGG

280 290 300 310 320 330

390

orf85ng PPRRX

|||||

orf85-1 PPRRX

另外，ORF85ng显示出与大肠杆菌一种膜融合蛋白明显同源：

gi|1787104(AE000189)o380；与膜融合蛋白前体的332个残基有27％相同(27个空隙)，MTRC_NEIGO SW：P43505(412aa)[大肠杆菌]长度＝380

评分＝193位(485)，估计值＝2e-48

相同性＝120/345(34％)，阳性＝182/345(51％)，空隙＝13/345(3％)

询问：29 PQAAYITETVRRGDISRTVSATGEISPSNLVSVGAQASGQIKKLYVKLGQQVKKGDLIAE 88

P Y T VR GD+ ++V ATG++ V VGAQ SGQ+K L V +G +VKK L+

目标：41 PVPTYQTLIVRPGDLQQSVLATGKLDALRKVDVGAQVSGQLKTLSVAIGDKVKKDQLLGV 100

询问：89 INSTTQTNTIDMEKSKLETYQAKLVSAQIALGSAEKKYKRQAALWKDDATSKEXXXXXXX 148

I+ N I ++ L +A+ A+ L A Y RQ L + A S++

目标：101 IDPEQAENQIKEVEATLMELRAQRQQAEAELKLARVTYSRQQRLAQTKAVSQQDLDTAAT 160

询问：149 XXXXXXXXXXXXXXXIRQSKISINTAESDLGYTRITATMDGTVVAIPVEEGQTVNAAQST 208

I++++ S++TA+++L YTRI A M G V I +GQTV AAQ

目标：161 EMAVKQAQIGTIDAQIKRNQASLDTAKTNLDYTRIVAPMAGEVTQITTLQGQTVIAAQQA 220

询问：209 PTIVQLANLDMMLNKMQIAEGDITKVKAGQDISFTILSEPDTPIKAKLDSVDPGLTTMSS 268

P I+ LA++ ML K Q++E D+ +K GQ FT+L +P T + ++ V P

目标：221 PNILTLADMSAMLVKAQVSEADVIHLKPGQKAWFTVLGDPLTRYEGQIKDVLP------- 273

询问：269 GGYNSSTDTASNAVYYYARSFVPNPDGKLATGMTTQNTVEIDGVKNVLLIPSLTVKNRGG 328

+ + ++A++YYAR VPNP+G L MT Q +++ VKNVL IP + + G

目标：274 -----TPEKVNDAIFYYARFEVPNPNGLLRLDMTAQVHIQLTDVKNVLTIPLSALGDPVG 328

询问：329 KAFVRV-LGADGKAVEREIRTGMKDSMNTEVKSGLKEGDKVVISE 372

+V L +G+ ERE+ G ++ + E+ GL+ GD+VVI E

目标：329 DNRYKVKLLRNGETREREVTIGARNDTDVEIVKGLEAGDEVVIGE 373

如上所述，将ORF85-1(40.4kDa)克隆到pGex载体中，并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图19A显示出GST-融合蛋白亲和纯化的结果。用纯化的GST-融合蛋白免疫小鼠，用小鼠血清进行Western印迹(图19B)，FACS分析(图19C)和ELISA(阳性结果)。这些实验确认ORF85-1是一种外露蛋白，且是一种有用的免疫原。

实施例92

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 773>：

1 ..ATTCCCGCCA CGATGACATT TGAACGCAGC GGCAATGCTT ACAAAATCGT

51 TTCGACGATT AAAGTGCCGC TATACAATAT CCGTTTCGAG TCCGGCGGTA

101 CGGTTGTCGG CAATACCCTG CACCCTACCT ACTATAGAGA CATACGCAGG

151 GGCAAACTGT ATGCGGAAgc CAAATTCGCC GACgGcAGCG TAACTTACGG

201 CAAAGCGGGC GAGAGCAAAA CCGAGCAAAG CCCCAAGGCT ATGGATTTGT

251 TCACGCTTGC CTGGCAGTTG GCGGCAAATG ACGCGAAACT CCCCCCGGGG

301 CTGAAAATCA CCAACGGCAA AAAACTTTAT TCCGTCGGCG GTTTGAATAA

351 GGCGGGTACA GGAAAATACA GCATAGGCGG CGTGGAAACC GAAGTCGTCA

401 AATATCGGGT GCGGCGCGGC GACGATGCGG TAATGTATTT cTTCGCACCG

451 TCCCTGAACA ATATTCCGGC ACAAATCGGC TATACCGACG ACGGCAAAAC

501 CTATACGCTG AAACTCAAAT CGGTGCAGAT CAACGGCCAG GCAGCCAAAC

551 CGTAA

它对应于氨基酸序列<SEQ ID 774；ORF120>：

1 ..IPATMTFERS GNAYKIVSTI KVPLYNIRFE SGGTVVGNTL HPTYYRDIRR

51 GKLYAEAKFA DGSVTYGKAG ESKTEQSPKA MDLFTLAWQL AANDAKLPPG

101 LKITNGKKLY SVGGLNKAGT GKYSIGGVET EVVKYRVRRG DDAVMYFFAP

151 SLNNIPAQIG YTDDGKTYTL KLKSVQINGQ AAKP*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 775>：

1 ATGATGAAGA CTTTTAAAAA TATATTTTCC GCCGCCATTT TGTCCGCCGC

51 CCTGCCGTGC GCGTATGCGG CAGGGCTGCC CCAATCCGCC GTGCTGCACT

101 ATTCCGGCAG CTACGGCATT CCCGCCACGA TGACATTTGA ACGCAGCGGC

151 AATGCTTACA AAATCGTTTC GACGATTAAA GTGCCGCTAT ACAATATCCG

201 TTTCGAGTCC GGCGGTACGG TTGTCGGCAA TACCCTGCAC CCTACCTACT

251 ATAGAGACAT ACGCAGGGGC AAACTGTATG CGGAAGCCAA ATTCGCCGAC

301 GGCAGCGTAA CTTACGGCAA AGCGGGCGAG AGCAAAACCG AGCAAAGCCC

351 CAAGGCTATG GATTTGTTCA CGCTTGCCTG GCAGTTGGCG GCAAATGACG

401 CGAAACTCCC CCCGGGGCTG AAAATCACCA ACGGCAAAAA ACTTTATTCC

451 GTCGGCGGTT TGAATAAGGC GGGTACAGGA AAATACAGCA TAGGCGGCGT

501 GGAAACCGAA GTCGTCAAAT ATCGGGTGCG GCGCGGCGAC GATGCGGTAA

551 TGTATTTCTT CGCACCGTCC CTGAACAATA TTCCGGCACA AATCGGCTAT

601 ACCGACGACG GCAAAACCTA TACGCTGAAA CTCAAATCGG TGCAGATCAA

651 CGGCCAGGCA GCCAAACCGT AA

它对应于氨基酸序列<SEQ ID 776；ORF120-1>：

1 MMKTFKNIFS AAILSAALPC AYAAGLPQSA VLHYSGSYGI PATMTFERSG

51 NAYKIVSTIK VPLYNIRFES GGTVVGNTLH PTYYRDIRRG KLYAEAKFAD

101 GSVTYGKAGE SKTEQSPKAM DLFTLAWQLA ANDAKLPPGL KITNGKKLYS

151 VGGLNKAGTG KYSIGGVETE VVKYRVRRGD DAVMYFFAPS LNNIPAQIGY

201 TDDGKTYTLK LKSVQINGQA AKP*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF120和脑膜炎奈瑟球菌菌株A的ORF(ORF120a)在184个氨基酸的重叠区内显示出有92.4％的相同性：

10 20 30

orf120.pep IPATMTFERSGNAYKIVSTIKVPLYNIRFE

|||| : ||||||||||||||||||||

orf120a SAAILSAALPCAYAAGLPXSAVLHYSGSYGIPATXXXXXXXNAXKIVSTIKVPLYNIRFE

10 20 30 40 50 60

40 50 60 70 80 90

orf120.pep SGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAMDLFTLAWQL

||||||||||||||||||||||||||||||||||||||| : |||||||||||||||

orf120a SGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAXXXXXXQSPKAMDLFTLAWQL

70 80 90 100 110 120

100 110 120 130 140 150

orf120.pep AANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGDDAVMYFFAP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf120a AANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGDDAVMYFFAP

130 140 150 160 170 180

160 170 180

orf120.pep SLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

|||||||||||||||||||||||||||||||||||

orf120a SLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

190 200 210 220

全长ORF120a核苷酸序列<SEQ ID 777>是：

1 ATGATGAAGA CTTTTAAAAA TATATTTTCC GCCGCCATTT TGTCCGCCGC

51 CCTGCCGTGC GCGTATGCGG CAGGGCTGCC CNAATCCGCC GTGCTGCACT

101 ATTCCGGCAG CTACGGCATT CCCGCCACNA NNANNTNNGN ACNNNGNGNC

151 AATGCTTNCA AAATCGTTTC GACGATTAAA GTGCCGCTAT ACAATATCCG

201 TTTCGAGTCC GGCGGTACGG TTGTCGGCAA TACCCTGCAC CCTACCTACT

251 ATAGAGACAT ACGCAGGGGC AAACTGTATG CGGAAGCCAA ATTCGCCGAC

301 GGCAGCGTAA CCTACGGCAA AGCGGNNNNN ANCNNNNNNG NGCAAAGCCC

351 CAAGGCTATG GATTTGTTCA CGCTTGCNTG GCAGTTGGCG GCAAATGACG

401 CGAAACTCCC CCCGGGGCTG AAAATCACCA ACGGCAAAAA ACTTTATTCC

451 GTCGGCGGTT TGAATAAGGC GGGTACAGGA AAATACAGCA TAGGCGGCGT

501 GGAAACCGAA GTCGTCAAAT ATCGGGTGCG GCGCGGCGAC GATGCGGTAA

551 TGTATTTCTT CGCACCGTCC CTGAACAATA TTCCGGCACA AATCGGCTAT

601 ACCGACGACG GCAAAACCTA TACGCTGAAA CTCAAATCGG TGCAGATCAA

651 CGGCCAGGCA GCCAAACCGT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 778>：

1 MMKTFKNIFS AAILSAALPC AYAAGLPXSA VLHYSGSYGI PATXXXXXXX

51 NAXKIVSTIK VPLYNIRFES GGTVVGNTLH PTYYRDIRRG KLYAEAKFAD

101 GSVTYGKAXX XXXXQSPKAM DLFTLAWQLA ANDAKLPPGL KITNGKKLYS

151 VGGLNKAGTG KYSIGGVETE VVKYRVRRGD DAVMYFFAPS LNNIPAQIGY

201 TDDGKTYTLK LKSVQINGQA AKP*

ORF120a和ORF120-1在223个氨基酸的重叠区内显示出有93.3％的相同性：

10 20 30 40 50 60

orf120a.pep MMKTFKNIFSAAILSAALPCAYAAGLPXSAVLHYSGSYGIPATXXXXXXXNAXKIVSTIK

||||||||||||||||||||||||||| ||||||||||||||| : ||| |||||||

orf120-1 MMKTFKNIFSAAILSAALPCAYAAGLPQSAVLHYSGSYGIPATMTFERSGNAYKIVSTIK

10 20 30 40 50 60

70 80 90 100 110 120

orf120a.pep VPLYNIRFESGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAXXXXXXQSPKAM

|||||||||||||||||||||||||||||||||||||||||||||||| : ||||||

orf120-1 VPLYNIRFESGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAM

70 80 90 100 110 120

130 140 150 160 170 180

orf120a.pep DLFTLAWQLAANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf120-1 DLFTLAWQLAANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGD

130 140 150 160 170 180

190 200 210 220

orf120a.pep DAVMYFFAPSLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

||||||||||||||||||||||||||||||||||||||||||||

orf120-1 DAVMYFFAPSLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

190 200 210 220

与淋病奈瑟球菌的预计ORF的同源性

ORF120和淋病奈瑟球菌的预计ORF(ORF120ng)在184个氨基酸的重叠区内显示出有97.8％的相同性：

orf120.pep IPATMTFERSGNAYKIVSTIKVPLYNIRFE 30

||||||||||||||||||||||||||||||

orf120ng SAAILSAALPCAYAARLPQSAVLHYSGSYGIPATMTFERSGNAYKIVSTIKVPLYNIRFE 69

orf120.pep SGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAMDLFTLAWQL 90

||||||||||||:||:|||||||||||||||||||||||||||||||||||||||||||

orf120ng SGGTVVGNTLHPAYYKDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAMDLFTLAWQL 129

orf120.pep AANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGDDAVMYFFAP 150

||||||||||||||||||||||||||||||||||||||||||||||||||||:| |||||

orf120ng AANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGDDTVTYFFAP 189

orf120.pep SLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKP 184

||||||||||||||||||||||||||||||||||

orf120ng SLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKP 223

全长ORF120ng核苷酸序列<SEQ ID 779>是：

1 ATGATGAAGA CTTTTAAAAA TATATTTTCC GCCGCCATTT TGTCCGCCGC

51 CCTGCCGTGC GCGTATGCGG CAAGGCTACC CCAATCCGCC GTGCTGCACT

101 ATTCCGGCAG CTACGGCATT CCCGCCACGA TGACATTTGA ACGCAGCGGC

151 AATGCTTACA AAATCGTTTC GACGATTAAA GTGCCGCTAT ACAATATCCG

201 TTTCGAATCC GGCGGTACGG TTGTCGGCAA TACCCTGCAC CCTGCCTACT

251 ATAAAGACAT ACGCAGGGGC AAACTGTATG CGGAAGCCAA ATTCGCCGAC

301 GGCAGCGTAA CCTACGGCAA AGCGGGCGAG AGCAAAACCG AGCAAAGCCC

351 CAAGGCTATG GATTTGTTCA CGCTTGCCTG GCAGTTGGCG GCAAATGACG

401 CGAAACTCCC CCCGGGTCTG AAAATCACCA ACGGCAAAAA ACTTTATTCC

451 GTCGGCGGCC TGAATAAGGC GGGTACGGGA AAATACAGCA TaggCGGCGT

501 GGAAACCGAA GTCGTCAAAT ATCGGGTGCG GCGCGGCGAC GATACGGTAA

551 CGTATTTCTT CGCACCGTCC CTGAACAATA TTCCGGCACA AATCGGCTAT

601 ACCGACGACG GCAAAACCTA TACGCTGAAG CTCAAATCGG TGCAGATCAA

651 CGGACAGGCC GCCAAACCGT AA

它编码的蛋白质具有氨基酸序列<SEQ ID 780>：

1 MMKTFKNIFS AAILSAALPC AYAARLPQSA VLHYSGSYGI PATMTFERSG

51 NAYKIVSTIK VPLYNIRFES GGTVVGNTLH PAYYKDIRRG KLYAEAKFAD

101 GSVTYGKAGE SKTEQSPKAM DLFTLAWQLA ANDAKLPPGL KITNGKKLYS

151 VGGLNKAGTG KYSIGGVETE VVKYRVRRGD DTVTYFFAPS LNNIPAQIGY

201 TDDGKTYTLK LKSVQINGQA AKP*

与ORF120-1相比，ORF120ng在223个氨基酸的重叠区内显示出有97.8％的相同性：

10 20 30 40 50 60

orf120-1.pep MMKTFKNIFSAAALSAALPCAYAAGLPQSAVLHYSGSYGIPATMTFERSGNAYKIVSTIK

|||||||||||||||||||||||| |||||||||||||||||||||||||||||||||||

orf120ng MMKTFKNIFSAAILSAALPCAYAARLPQSAVLHYSGSYGIPATMTFERSGNAYKIVSTIK

10 20 30 40 50 60

70 80 90 100 110 120

orf120-1.pep VPLYNIRFESGGTVVGNTLHPTYYRDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAM

|||||||||||||||||||||:||:|||||||||||||||||||||||||||||||||||

orf120ng VPLYNIRFESGGTVVGNTLHPAYYKDIRRGKLYAEAKFADGSVTYGKAGESKTEQSPKAM

70 80 90 100 110 120

130 140 150 160 170 180

orf120-1.pep DLFTLAWQLAANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGD

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf120ng DLFTLAWQLAANDAKLPPGLKITNGKKLYSVGGLNKAGTGKYSIGGVETEVVKYRVRRGD

130 140 150 160 170 180

190 200 210 220

orf120-1.pep DAVMYFFAPSLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

|:| ||||||||||||||||||||||||||||||||||||||||

orf120ng DTVTYFFAPSLNNIPAQIGYTDDGKTYTLKLKSVQINGQAAKPX

190 200 210 220

该分析结果(包括淋球菌蛋白中有一个推定的前导序列)提示脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例93

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 781>：

1 ATGTATCGGA GGAAAGGGCG GGGCATCAAG CCGTGGATGG GTGCCGGTGC

51 .GCGTTTGCC GCCTTGGTCT GGCTGGTTTT CGCGCTCGGC GATACTTTGA

101 CTCCGTTTGC GGTTGCGGCG GTGCTGGCGT ATGTATTGGA CCCTTTGGTC

151 GAATGGTTGC AGAAAAAGGG TTTGAACCGT GCATCCGCTT CGATGTCTGT

201 GATGGTGTTT TCCTTGATTT TGTTGTTGGC ATTATTGTTG ATTATCGTCC

251 CTATGCTGGT CGGGCAGTTC AACAATTTGG CATCGCGCCT GCCCCAATTA

301 ATCGGTTTTA TGCAGAACAC GCTGCTGCCG TGGTTGAAAA ATACAATCGG

351 CGGATATGTG GAAATCGATC AGGCATCTAT TATTGCGTGG CTTCAGGCGC

401 ATACGGGAGA GTTGAGCAAC GCGCTTAAGG CGTGGTTTCC CGTTTTGATG

451 AGGCAGGGCG GCAATATT..

它对应于氨基酸序列<SEQ ID 782；ORF121>：

1 MYRRKGRGIK PWMGAGXAFA ALVWLVFALG DTLTPFAVAA VLAYVLDPLV

51 EWLQKKGLNR ASASMSVMVF SLILLLALLL IIVPMLVGQF NNLASRLPQL

101 IGFMQNTLLP WLKNTIGGYV EIDQASIIAW LQAHTGELSN ALKAWFPVLM

151 RQGGNI..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 783>：

1 ATGTATCGGA GGAAAGGGCG GGGCATCAAG CCGTGGATGG GTGCCGGTGC

51 GGCGTTTGCC GCCTTGGTCT GGCTGGTTTT CGCGCTCGGC GATACTTTGA

101 CTCCGTTTGC GGTTGCGGCG GTGCTGGCGT ATGTATTGGA CCCTTTGGTC

151 GAATGGTTGC AGAAAAAGGG TTTGAACCGT GCATCCGCTT CGATGTCTGT

201 GATGGTGTTT TCCTTGATTT TGTTGTTGGC ATTATTGTTG ATTATCGTCC

251 CTATGCTGGT CGGGCAGTTC AACAATTTGG CATCGCGCCT GCCCCAATTA

301 ATCGGTTTTA TGCAGAACAC GCTGCTGCCG TGGTTGAAAA ATACAATCGG

351 CGGATATGTG GAAATCGATC AGGCATCTAT TATTGCGTGG CTTCAGGCGC

401 ATACGGGAGA GTTGAGCAAC GCGCTTAAGG CGTGGTTTCC CGTTTTGATG

451 AGGCAGGGCG GCAATATTGT CAGCAGTATC GGCAACCTGC TGCTGCTTCC

501 CTTGCTGCTT TACTATTTCC TGCTGGATTG GCAGCGGTGG TCGTGCGGCA

551 TTGCCAAACT GGTTCCGAgG CGTTTTGCCG GTGCTTATAC GCGCATTACA

601 GGCAATTTGA ACGAGGTATT GGGCGAATTT TTGCGCGGGC AGCTTCTGGT

651 AATGCTGATT ATGGGCTTGG TTTACGGTTT GGGATTGGTG CTGGTCGGGC

701 TGGATTCGGG GTTTGCCATC GGTATGCTTG CCGGTATTTT GGTGTTTGTC

751 CCTTATCTCG GGGCGTTTAC GGGATTGCTG CTTGCCACCG TCGCCGCCTT

801 GCTCCAGTTC GGTTCGTGGA ACGGCATCCT ATCGGTTTGG GCGGTTTTTG

851 CCGTAGGACA GTTTCTCGAA AGTTTTTTCA TTACGCCGAA AATCGTGGGA

901 GACCGTATCG GGCTGTCGCC GTTTTGGGTT ATCTTTTCGC TGATGGCGTT

951 CGGGCAGCTG ATGGGCTTTG TCGGAATGTT GGCGGGATTG CCTTTGGCCG1001 CCGTAACCTT GGTCTTGCTT CGCGAGGGCG TGCAGAAATA TTTTGCCGGC1051 AGTTTTTACC GGGGCAGGTA G

它对应于氨基酸序列<SEQ ID 784；ORF121-1>：

1 MYRRKGRGIK PWMGAGAAFA ALVWLVFALG DTL TPFAVAA VLAYVLDPLV

51 EWLQKKGLNR ASASMS VMVF SLILLLALLL IIVPMLVGQF NNLASRLPQL

101 IGFMQNTLLP WLKNTIGGYV EIDQASIIAW LQAHTGELSN ALKAWFPVLM

151 RQGGNIVS SI GNLLLLPLLL YYFLLDWQRW SCGIAKLVPR RFAGAYTRIT

201 GNLNEVLGEF LRGQL LVMLI MGLVYGLGLV LVGLDSGFAI GMLAG ILVFV

251 PYLGAFTGLL LATVAALLQF GSWNG ILSVW AVFAVGQFLE SFFITPKIVG

301 DRIGLSPFWV IFSLMAFGQL MGF VGMLAGL PLAAVTLVLL REGVQKYFAG

351 SFYRGR*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF121和脑膜炎奈瑟球菌菌株A的ORF(ORF121a)在156个氨基酸的重叠区内显示出有98.7％的相同性：

10 20 30 40 50 60

orf121.pep MYRRKGRGIKPWMGAGXAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

||||||||||||| || |||||||||||||||||||||||||||||||||||||||||||

orf121a MYRRKGRGIKPWMDAGAAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

10 20 30 40 50 60

70 80 90 100 110 120

orf121.pep ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121a ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

70 80 90 100 110 120

130 140 150

orf121.pep EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNI

||||||||||||||||||||||||||||||||||||

orf121a EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNIVSSIGNLLLLPLLLYYFLLDWQRW

130 140 150 160 170 180

orf121a SCGIAKLVPRRFAGAYTRITGNLNEVLGEFLRGQLLVMLIMGLVYGLGLVLVGLDSGFAI

190 200 210 220 230 240

全长ORF121a核苷酸序列<SEQ ID 785>是：

1 ATGTATCGGA GGAAAGGGCG GGGCATCAAG CCGTGGATGG ATGCCGGTGC

51 GGCGTTTGCC GCCTTGGTCT GGCTGGTTTT CGCGCTCGGC GATACTTTGA

101 CTCCGTTTGC GGTTGCGGCG GTGCTGGCGT ATGTATTGGA CCCTTTGGTC

151 GAATGGTTGC AGAAAAAGGG TTTGAACCGT GCATCCGCTT CGATGTCTGT

201 GATGGTGTTT TCCTTGATTT TGTTGTTGGC ATTATTGTTG ATTATTGTCC

251 CTATGCTGGT CGGGCAGTTC AACAATTTGG CATCGCGCCT GCCCCAATTA

301 ATCGGTTTTA TGCAGAACAC GCTGCTGCCG TGGTTGAAAA ATACAATCGG

351 CGGATATGTG GAAATCGATC AGGCATCTAT TATTGCGTGG CTTCAGGCGC

401 ATACGGGCGA GTTGAGCAAC GCGCTTAAGG CGTGGTTTCC CGTTTTGATG

451 AGGCAGGGCG GCAATATTGT CAGCAGTATC GGCAACCTGC TGCTGCTTCC

501 CTTGCTGCTT TACTATTTCC TGCTGGATTG GCAGCGGTGG TCGTGCGGCA

551 TTGCCAAACT GGTTCCGAGG CGTTTTGCCG GTGCTTATAC GCGCATTACA

601 GGCAATTTGA ACGAGGTATT GGGCGAATTT TTGCGCGGGC AGCTTCTGGT

651 GATGCTGATT ATGGGTTTGG TTTACGGCTT GGGGTTGGTG CTGGTCGGGC

701 TGGATTCGGG GTTTGCAATC GGTATGGTTG CCGGTATTTT GGTTTTTGTT

751 CCCTATTTGG GCGCGTTTAC AGGACTGCTG CTGGCAACCG TCGCCGCCTT

801 GCTCCAGTTC GGTTCGTGGA ACGGCATCTT GGCTGTTTGG GCGGTTTTTG

851 CCGTAGGACA GTTTCTCGAA AGTTTTTTCA TTACGCCGAA AATCGTGGGA

901 GACCGTATCG GCCTGTCGCC GTTTTGGGTT ATCTTTTCGC TGATGGCGTT

951 CGGGCAGCTG ATGGGCTTTG TCGGAATGTT GGCCGGATTG CCTTTGGCCG

1001 CCGTAACCTT GGTCTTGCTT CGCGAGGGCG TGCAGAAATA TTTTGCCGGC

1051 AGTTTTTACC GGGGCAGGTA G

它编码的蛋白质具有氨基酸序列<SEQ ID 786>：

1 MYRRKGRGIK PWMDAGAAFA ALVWLVFALG DTL TPFAVAA VLAYVLDPLV

51 EWLQKKGLNR ASASMS VMVF SLILLLALLL IIVPMLVGQF NNLASRLPQL

101 IGFMQNTLLP WLKNTIGGYV EIDQASIIAW LQAHTGELSN ALKAWFPVLM

151 RQGGNIVS SI GNLLLLPLLL YYFLLDWQRW SCGIAKLVPR RFAGAYTRIT

201 GNLNEVLGEF LRGQL LVMLI MGLVYGLGLV LVGLDSGFAI GMVAG ILVFV

251 PYLGAFTGLL LATVAALLQF GSWNG ILAVW AVFAVGQFLE SFFITPKIVG

301 DRIGLSPFWV IFSLMAFGQL MGF VGMLAGL PLAAVTLVLL REGVQKYFAG

351 SFYRGR*

ORF121a和ORF121-1在356个氨基酸的重叠区内显示出有99.2％的相同性：

10 20 30 40 50 60

orf121a.pep MYRRKGRGIKPWMDAGAAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

|||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||

orf121-1 MYRRKGRGIKPWMGAGAAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

10 20 30 40 50 60

70 80 90 100 110 120

orf121a.pep ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121-1 ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

70 80 90 100 110 120

130 140 150 160 170 180

orf121a.pep EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNIVSSIGNLLLLPLLLYYFLLDWQRW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121-1 EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNIVSSIGNLLLLPLLLYYFLLDWQRW

130 140 150 160 170 180

190 200 210 220 230 240

orf121a.pep SCGIAKLVPRRFAGAYTRITGNLNEVLGEFLRGQLLVMLIMGLVYGLGLVLVGLDSGFAI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121-1 SCGIAKLVPRRFAGAYTRITGNLNEVLGEFLRGQLLVMLIMGLVYGLGLVLVGLDSGFAI

190 200 210 220 230 240

250 260 270 280 290 300

orf121a.pep GMVAGILVFVPYLGAFTGLLLATVAALLQFGSWNGILAVWAVFAVGQFLESFFITPKIVG

||:||||||||||||||||||||||||||||||||||:||||||||||||||||||||||

orf121-1 GMLAGILVFVPYLGAFTGLLLATVAALLQFGSWNGILSVWAVFAVGQFLESFFITPKIVG

250 260 270 280 290 300

310 320 330 340 350

orf121a.pep DRIGLSPFWVIFSLMAFGQLMGFVGMLAGLPLAAVTLVLLREGVQKYFAGSFYRGRX

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121-1 DRIGLSPFWVIFSLMAFGQLMGFVGMLAGLPLAAVTLVLLREGVQKYFAGSFYRGRX

310 320 330 340 350

与淋病奈瑟球菌的预计ORF的同源性

ORF121和淋病奈瑟球菌的预计ORF(ORF121ng)在156个氨基酸的重叠区内显示出有97.4％的相同性：

orf121.pep MYRRKGRGIKPWMGAGXAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR 60

|||||||||||||||| |||||||||:|||||||||||||||||||||||||||||||||

orf121ng MYRRKGRGIKPWMGAGAAFAALVWLVYALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR 60

orf121.pep ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV 120

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121ng ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV 120

orf121.pep EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNI 156

||||||||||:|||||||||||||||||||:|||||

orf121ng EIDQASIIAWFQAHTGELSNALKAWFPVLMKQGGNIVSTIGNLLLPPLLLYYFLLDWHRW 180

预计ORF121ng核苷酸序列<SEQ ID 787>编码的蛋白质具有氨基酸序列<SEQ ID788>：

1 MYRRKGRGIK PWMGAGAAFA ALVWLVYALG DTL TPFAVAA VLAYVLDPLV

51 EWLQKKGLNR ASASMS VMVF SLILLLALLL IIVPMLVGQF NNLASRLPQL

101 IGFMQNTLLP WLKNTIGGYV EIDQASIIAW FQAHTGELSN ALKAWFPVLM

151 KQGGNIVS TI GNLLLPPLLL YYFLLDWHRW SCGIPKLVPR RFAGAYTRIT

201 GNLNKVWGKF LRGQLLGETE RGAVVCRVGR ECWEGGGARS RPSDDGWPRW

251 GGG*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 789>：

1 ATGTATCGGA GAAAAGGACG GGGCATCAAG CCGTGGATGG GTGCCGGCGC

51 GGCGTTTGCC GCCTTGGTCT GGCTGGTTTA CGCGCTCGGC GATACTTTGA

101 CTCCGTTTGC GGTTGCGGCG GTGCTGGCGT ATGTGTTGGA CCCTTTGGTC

151 GAATGGTTGC AGAAAAAGGG TTTGAACCGT GCATCCGCTT CGATGTCTGT

201 GATGGTGTTT TCCTTGATTT TGTTGTTGGC ATTATTGTTG ATTATTGTCC

251 CTATGCTGGT CGGGCAGTTC AATAATTTGG CATCTCGCCT GCCCCAATTA

301 ATCGGTTTTA TGCAGAACAC GCTGCTGCCG TGGTTGAAAA ATACAATCGG

351 CGGATATGTG GAAATCGATC AGGCATCTAT TATTGCGTGG TTTCAGGCGC

401 ATACGGGCGA GTTGAGCAAC GCGCTTAAGG CGTGGTTTCC CGTTTTGATG

451 AAACAGGGCG GCAATATTGT CAGCAGTATC GGCAACCTGC TGCTGCCGCC

501 CTTGCTGCTT TACTATTTCC TGCTGGATTG GCAGCGGTGG TCGTGCGGCA

551 TCGCCAAACT GGTTCCGAGG CGTTTTGCCG GTGCTTATAC GCGCATTACG

601 GGTAATTTGA ACGAGGTATT GGGCGAATTT TTGCGCGGTC AGCTTCTGGT

651 GATGCTGATT ATGGGCTTGG TTTACGGTTT GGGATTGATG CTAGTCGGAC

701 TGGATTCGGG ATTTGCCATC GGTATGGTTG CCGGTATTTT GGTGTTTGTC

751 CCCTATTTGG GTGCGTTTAC GGGATTGCTG CTTGCCACTG TTGCAGCCTT

801 GCTCCAGTTC GGTTCGTGGA ACGGAATCTT GGCTGTTTGG GCGGTTTTTG

851 CCGTCGGTCA GTTTCTCGAA AGTTTTTTCA TTACGCCGAA AATTGTAGGA

901 GACCGTATCG GCCTGTCGCC GTTTTGGGTT ATCTTTTCGC TGATGGCGTT

951 CGGAGAGCTG ATGGGCTTTG TCGGAATGTT GGCCGGATTG CCTTTGGCCG

1001 CCGTAACCTT GGTCTTGCTT CGCGAGGGCG CGCAGAAATA TTTTGCCGGC

1051 AGTTTTTACC GGGGCAGGTA G

它对应于氨基酸序列<SEQ ID 790；ORF121ng-1>：

1 MYRRKGRGIK PWMGAGAAFA ALVWLVYALG DTL TPFAVAA VLAYVLDPLV

51 EWLQKKGLNR ASASMS VMVF SLILLLALLL IIVPMLVGQF NNLASRLPQL

101 IGFMQNTLLP WLKNTIGGYV EIDQASIIAW FQAHTGELSN ALKAWFPVLM

151 KQGGNIVS SI GNLLLPPLLL YYFLLDWQRW SCGIAKLVPR RFAGAYTRIT

201 GNLNEYLGEF LRGQL LVMLI MGLVYGLGLM LVGLDSGFAI GMVAG ILVFV

251 PYLGAFTGLL LATVAALLQF GSWNG ILAVW AVFAVGQFLE SFFITPKIVG

301 DRIGLSPFWV IFSLMAFGEL MGF VGMLAGL PLAAVTLVLL REGAQKYFAG

351 SFYRGR*

ORF121ng-1和ORF121-1在356个氨基酸的重叠区内显示出有97.5％的相同性：

10 20 30 40 50 60

orf121-1.pep MYRRKGRGIKPWMGAGAAFAALVWLVFALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||

orf121ng-1 MYRRKGRGIKPWMGAGAAFAALVWLVYALGDTLTPFAVAAVLAYVLDPLVEWLQKKGLNR

10 20 30 40 50 60

70 80 90 100 110 120

orf121-1.pep ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf121ng-1 ASASMSVMVFSLILLLALLLIIVPMLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYV

70 80 90 100 110 120

130 140 150 160 170 180

orf121-1.pep EIDQASIIAWLQAHTGELSNALKAWFPVLMRQGGNIVSSIGNLLLLPLLLYYFLLDWQRW

||||||||||:|||||||||||||||||||:||||||||||||| |||||||||||||||

orf121ng-1 EIDQASIIAWFQAHTGELSNALKAWFPVLMKQGGNIVSSIGNLLLPPLLLYYFLLDWQRW

130 140 150 160 170 180

190 200 210 220 230 240

orf121-1.pep SCGIAKLVPRRFAGAYTRITGNLNEVLGEFLRGQLLVMLIMGLVYGLGLVLVGLDSGFAI

|||||||||||||||||||||||||||||||||||||||||||||||||:||||||||||

orf121ng-1 SCGIAKLVPRRFAGAYTRITGNLNEVLGEFLRGQLLVMLIMGLVYGLGLMLVGLDSGFAI

190 200 210 220 230 240

250 260 270 280 290 300

orf121-1.pep GMLAGILVFVPYLGAFTGLLLATVAALLQFGSWNGILSVWAVFAVGQFLESFFITPKIVG

||:||||||||||||||||||||||||||||||||||:||||||||||||||||||||||

orf121ng-1 GMVAGILVFVPYLGAFTGLLLATVAALLQFGSWNGILAVWAVFAVGQFLESFFITPKIVG

250 260 270 280 290 300

310 320 330 340 350

orf121-1.pep DRIGLSPFWVIFSLMAFGQLMGFVGMLAGLPLAAVTLVLLREGVQKYFAGSFYRGRX

||||||||||||||||||:||||||||||||||||||||||||:|||||||||||||

orf121ng-1 DRIGLSPFWVIFSLMAFGELMGFVGMLAGLPLAAVTLVLLREGAQKYFAGSFYRGRX

310 320 330 340 350

另外，ORF121ng-1显示出与流感嗜血菌的一种通透酶同源：

sp|P43969|PERM_HAEIN推定的通透酶PERM同系物长度＝349

评分＝69.9位(168)，估计值＝2e-11

相同性＝67/317(21％)，阳性＝120/317(37％)，空隙＝7/317(2％)

询问：26 VYALGDTLTPFAVAAVLAYVLDPLVEWL-QKKGLNRASASMSVMVFSXXXXXXXXXXXVP 84

+Y GD + P +A VL+Y+L+ + +L Q R A++ + VP

目标：32 IYFFGDLIAPLLIALVLSYLLEIPINFLNQYLKCPRMLATILIFGSFIGLAAVFFLVLVP 91

询问：85 MLVGQFNNLASRLPQLIGFMQNTLLPWLKNTIGGYVE-IDQASIIAWFQAHTGELSNALK 143

ML Q +L S LP + N WL N Y E ID + + + F + ++ +

目标：92 MLWNQTISLLSDLPAMF----NKSNEWLLNLPKNYPELIDYSMVDSIFNSVREKILGFGE 147

询问：144 AWFPVLMKQGGNIVSSIGNXXXXXXXXXXXXXDWQRWSCGIAKLVPRRFAGAYTRITGNL 203

+ + + N+VS D G+++ +P+ A+ R +

目标：148 SAVKLSLASIMNLVSLGIYAFLVPLMMFFMLKDKSELLQGVSRFLPKNRNLAFXRWK-EM 206

询问：204 NEVLGEFLRGQXXXXXXXXXXXXXXXXXXXXDSGFAIGMVAGILVFVPYXXXXXXXXXXX 263

+ + ++ G+ + + G+ V VPY

目标：207 QQQISNYIHGKLLEILIVTLITYIIFLIFGLNYPLLLAFAVGLSVLVPYIGAVIVTIPVA 266

询问：264 XXXXXQFGSWNGILAVWAVFAVGQFLESFFITPKIVGDRIGLSPFWVIFSLMAFGELMGF 323

QFG + FAV Q L+ + P + + + L P +I S++ FG L GF

目标：267 LVALFQFGISPTFWYIIIAFAVSQLLDGNLLVPYLFSEAVNLHPLIIIISVLIFGGLWGF 326

询问：324 VGMLAGLPLAAVTLVLL 340

G+ +PLA + ++

目标：327 WGVFFAIPLATLVKAVI 343

根据该分析结果(包括两个蛋白中存在一个推定的前导序列和跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例94

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 791>：

1 ..ACTGCTTTTT CGGCGGCGCT GCGCTTGAGT CCATCATGAC TCGTCATATT

51 TTTGTCCTTT GGGAAACCGT ATCAACAAAC AGCCGCCATC TTAACATTTT

101 TTTGCACGTC CTGCCCGCCG CGTTCAAATG CGTACCAGCA ATACCGCCGC

151 CTGCGCCTCT ATGCCTTCCA TCCGCCCGAG ATAGCCGAGT TTTTCGTTGG

201 TTTTGCCTTT GATGTTGACG CACGAAATGT CTATGCCCAA ATCGGCGGCG

251 ATGTTGGCAC GCATTTGCGG AATGTGCGGC GCGAGTGTGG GTTTCTGTGC

301 AATCACGGTC GTATCGACAT TGACCGCCTG CCAACCCTGC GCCTGAACGC

351 TTTGATACGC CGCACGCAAA AGGACGCGGC TGTCCGCATC TTTGAACTCT

401 GCGGCGGTGT CGGGGAAATG GCTGCCGATA TCGCCCAAAC CTGCCGCACC

451 GAGCAGCGCG TCGGTAACGG CGTGCAGCAG CGCATCGGCA TCGGAGTGTC

501 CGAGCAGCCC TTTTTCAAAT GGGATTTCAA CTCCGCCAAG TATCAG..

它对应于氨基酸序列<SEQ ID 792；ORF122>：

1 ..TAFSAALRLS PSXLVIFLSF GKPYQQTAAI LTFFCTSCPP RSNAYQQYRR

51 LRLYAFHPPE IAEFFVGFAF DVDARNVYAQ IGGDVGTHLR NVRRECGFLC

101 NHGRIDIDRL PTLRLNALIR RTQKDAAVRI FELCGGVGEM AADIAQTCRT

151 EQRVGNGVQQ RIGIGVSEQP FFKWDFNSAK YQ..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 793>：

1 ATATCGTACT GGGCAAGCAG TTCGCCGGAT TTTTTGGAAG TAGATACCGC

51 GCCTTTGATT TTTTTGCCGC TCTTACCCAA GGCTTCGATG AAAAAGTTGA

101 TGGTCGAGCC GGTACCGATG CCGATATATT CATTTTCGGG TACGAATTCG

151 ACTGCTTTTT CGGCGGCGAT GCGCTTGAGT TCGTCTTGTG TCGTCATATT

201 TTTGTCCTTT GGGAAACCGT ATCAACAAAC AGCCGCCATC TTAACATTTT

251 TTTGCACGTC CTGCCCGCCG CGTTCAAATG CGTACCAGCA ATACCGCCGC

301 CTGCGCCTCT ATGCCTTCCA TCCGCCCGAG ATAGCCGAGT TTTTCGTTGG

351 TTTTGCCTTT GATGTTGACG CACGAAATGT CTATGCCCAA ATCGGCGGCG

401 ATGTTGGCAC GCATTTGCGG AATGTGCGGC GCGAGTTTGG GTTTCTGTGC

451 AATCACGGTC GTATCGACAT TGACCGCCTG CCAACCCTGC GCCTGAACGC

501 TTTGATACGC CGCACGCAAA AGGACGCGGC TGTCCGCATC TTTGAACTCT

551 GCGGCGGTGT CGGGGAAATG GCTGCCGATA TCGCCCAAAC CTGCCGCACC

601 GAGCAGCGCG TCGGTAACGG CGTGCAGCAG CGCATCGGCA TCGGAGTGTC

651 CGAGCAGCCC TTTTTCAAAT GGGATTTCAA CTCCGCCAAG TATCAGCTTT

701 CTGCCTTCGG TCAGTTGGTG GACATCGTAG CCCTGTCCGA TACGGATGTT

751 CGTCATCGTT TGTGTTCCTG A

它对应于氨基酸序列<SEQ ID 794；ORF122-1>：

1 ISYWASSSPD FLEVDTAPLI FLPLLPKASM KKLMVEPVPM PIYSFSGTNS

51 TAFSAAMRLS SSCVVIFLSF GKPYQQTAAI LTFFCTSCPP RSNAYQQYRR

101 LRLYAFHPPE IAEFFVGFAF DVDARNVYAQ IGGDVGTHLR NVRREFGFLC

151 NHGRIDIDRL PTLRLNALIR RTQKDAAVRI FELCGGVGEM AADIAQTCRT

201 EQRVGNGVQQ RIGIGVSEQP FFKWDFNSAK YQLSAFGQLV DIVALSDTDV

251 RHRLCS*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF122和脑膜炎奈瑟球菌菌株A的ORF(ORF122a)在182个氨基酸的重叠区内显示出有94.0％的相同性：

10 20 30

orf122.pep TAFSAALRLSPSXLVIFLSFGKPYQQTAAI

||||||:||| | :||||||||||||||||

orf122a FLPLLPKASMKKLMVEPVPMPMYSFSGTNSTAFSAAMRLSSSCVVIFLSFGKPYQQTAAI

30 40 50 60 70 80

40 50 60 70 80 90

orf122.pep LTFFCTSCPPRSNAYQQYRRLRLYAFHPPEIAEFFVGFAFDVDARNVYAQIGGDVGTHLR

|||| |||||||| ||||||||||||| |||:|||||||| |||||||||||||||||||

orf122a LTFFXTSCPPRSNPYQQYRRLRLYAFHAPEITEFFVGFAFXVDARNVYAQIGGDVGTHLR

90 100 110 120 130 140

100 110 120 130 140 150

orf122.pep NVRRECGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRIFELCGGVGEMAADIAQTCRT

|:||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf122a NMRREFGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRIFELCGGVGEMAADIAQTCRT

150 160 170 180 190 200

160 170 180

orf122.pep EQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQ

||||||||||||||||||||||||||||||||

orf122a EQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQLSAFGQLVDIVALSDTDVRHRLCSX

210 220 230 240 250

全长ORF122a核苷酸序列<SEQ ID 795>是：

1 ATATCATATT GGGCAAGCAG TTCACTGGAT TTTTTGGAAG TAGATACCGC

51 GCCTTTGATT TTTTTGCCGC TCTTACCCAA GGCTTCGATG AAAAAGTTGA

101 TGGTCGAACC GGTACCGATG CCGATGTATT CGTTTTCGGG TACGAATTCG

151 ACTGCNTTTT CGGCGGCGAT GCGCTTGAGT TCGTCTTGTG TCGTCATATT

201 TTTGTCCTTT GGGAAACCGT ATCAACAAAC AGCCGCCATC TTAACATTTT

251 TTNNNACGTC CTGCCCGCCG CGTTCAAATC CTTACCAGCA ATACCGCCGC

301 CTGCGACTCT ATGCCTTCCA TGCGCCCGAG ATAACCGAGT TTTTCGTTGG

351 TTTTGCCTTT GANGTTGACG CACGAAATGT CTATGCCCAA ATCGGCGGCG

401 ATGTTGGCAC GCATTTGCGG AATATGCGGC GCGAGTTTGG GTTTCTGTGC

451 AATCACGGTC GTATCGACAT TGACCGCCTG CCAACCCTGC GCCTGAACGC

501 TTTGATACGC CGCACGCAAA AGGACGCGGC TGTCCGCATC TTTGAACTCT

551 GCGGCGGTGT CGGGGAAATG GCTGCCGATA TCGCCCAAAC CTGCCGCACC

601 GAGCAGCGCG TCGGTAACGG CGTGCAGCAG CGCATCGGCA TCGGAGTGTC

651 CGAGCAGCCC TTTTTCAAAT GGGATTTCAA CTCCGCCAAG TATCAGCTTT

701 CTGCCTTCGG TCAGTTGGTG GACATCGTAG CCCTGTCCGA TACGGATGTT

751 CGTCATCGTT TGTGTTCCTG A

它编码的蛋白质具有氨基酸序列<SEQ ID 796>：

1 ISYWASSSLD FLEVDTAPLI FLPLLPKASM KKLMVEPVPM PMYSFSGTNS

51 TAFSAAMRLS SSCVVIFLSF GKPYQQTAAI LTFFXTSCPP RSNPYQQYRR

101 LRLYAFHAPE ITEFFVGFAF XVDARNVYAQ IGGDVGTHLR NMRREFGFLC

151 NHGRIDIDRL PTLRLNALIR RTQKDAAVRI FELCGGVGEM AADIAQTCRT

201 EQRVGNGVQQ RIGIGVSEQP FFKWDFNSAK YQLSAFGQLV DIVALSDTDV

251 RHRLCS*

ORF122a和ORF122-1在256个氨基酸的重叠区内显示出有96.9％的相同性：

10 20 30 40 50 60

orf122a.pep ISYWASSSLDFLEVDTAPLIFLPLLPKASMKKLMVEPVPMPMYSFSGTNSTAFSAAMRLS

|||||||| ||||||||||||||||||||||||||||||:||||||||||||||||||||

orf122-1 ISYWASSSPDFLEVDTAPLIFLPLLPKASMKKLMVEPVPMPIYSFSGTNSTAFSAAMRLS

10 20 30 40 50 60

70 80 90 100 110 120

orf122a.pep SSCVVIFLSFGKPYQQTAAILTFFXTSCPPRSNPYQQYRRLRLYAFHAPEITEFFVGFAF

|||||||||||||||||||||||| |||||||| |||||| |||||| |||:||||||||

orf122-1 SSCVVIFLSFGKPYQQTAAILTFFCTSCPPRSNAYQQYRRLRLYAFHPPEIAEFFVGFAF

70 80 90 100 110 120

130 140 150 160 170 180

orf122a.pep XVDARNVYAQIGGDVGTHLRNMRREFGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRI

|||||||||||||||||||||:||||||||||||||||||||||||||||||||||||||

orf122-1 DVDARNVYAQIGGDVGTHLRNVRREFGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRI

130 140 150 160 170 180

190 200 210 220 230 240

orf122a.pep FELCGGVGEMAADIAQTCRTEQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQLSAFGQLV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf122-1 FELCGGVGEMAADIAQTCRTEQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQLSAFGQLV

190 200 210 220 230 240

250

orf122a.pep DIVALSDTDVRHRLCSX

|||||||||||||||||

orf122-1 DIVALSDTDVRHRLCSX

250

与淋病奈瑟球菌的预计ORF的同源性

ORF122和淋病奈瑟球菌的ORF(ORF122ng)在182个氨基酸的重叠区内显示出有89.6％的相同性：

orf122.pep TAFSAALRLSPSXLVIFLSFGKPYQQTAAI 30

||||||:||| | :||||||||||||||||

orf122ng FLPLLPKASMKKLMVEPVPMPMYSFSGTNSTAFSAAMRLSSSCVVIFLSFGKPYQQTAAI 80

orf122.pep LTFFCTSCPPRSNAYQQYRRLRLYAFHPPEIAEFFVGFAFDVDARNVYAQIGGDVGTHLR 90

||||||| ||||| |||||||||||||||||||||||||||:||||: :|||||||||||

orf122ng LTFFCTSWPPRSNPYQQYRRLRLYAFHPPEIAEFFVGFAFDIDARNIDTQIGGDVGTHLR 140

orf122.pep NVRRECGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRIFELCGGVGEMAADIAQTCRT 150

||| | ||||||||||||:|||||||||||||||||||||||||||||:||||:||||||

orf122ng NVRCEFGFLCNHGRIDIDHLPTLRLNALIRRTQKDAAVRIFELCGGVGKMAADVAQTCRT 200

orf122.pep EQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQ 182

|||||||||||:|| : |||||||||||||||

orf122ng EQRVGNGVQQRVGIRMPEQPFFKWDFNSAKYQLSAFGQLVDIVALSDTDIRHRLCS 256

全长ORF122ng核苷酸序列<SEQ ID 797>是：

1 ATGTCGTACC GGGCAAGCAG TTCGCCGGAT TTTTTGGAGG TTGAAACCGC

51 GCCTTTGATT TTTTTACCGC TTTTGCCCAA GGCTTCGATG AAGAAATTGa

101 tgGTCGAACC GgtaCCGATG CCGATGTATT CGTTTTCGGG TACGAATTCG

151 ACTGCTTTTT CGGCGGCGAT GCGCttgAgt TCgtcttgcg TcgTCATATT

201 TTTAtccttt gGGAAaccct atcaAcaAAc agccgccatC TTAACATTTT

251 TTTGCACGtc ctggccgccg cgttcaAATc cgtaccaGca ataccgccgc

301 ctgcgcctCT AtgcCTTCCA TCCGCCCGAG ATAGCCGAGT TTTTCGTTGG

351 TTTTGCCTTT GATatTGACG CACGAAATAT CGatacCCAa atcggcgGCG

401 ATGTTGGCAC GCATTTGCGG AATGTGCGGT GCGAGTTTGG GTTTCTGTGC

451 AATCACGGTC GTATCGACAT TGACCACCTG CCAACCCTGC GCCTGAACGC

501 TTTGATACGC CGCACGCAAA AGGACGCGGC TGTCCGCATC TTTGAACTCT

551 GCGGCGGTGT CGGGAAAATG GCTGCCGATG TCGCCCAAAC CTGCCGCACC

601 GAGCAGCgcg tcggtaaCGG CGTGCAGCAG cgcgTcgGCA TCCGAATGCC

651 CGAGCAGCCC TTTTTCAAAT GGGATTTCAA CTCCGCCAAG TATCAGCTTT

701 CTGCCTTCGG TCAATTGGTG GACATCGTAG CCCTGTCCGA TACGGATATT

751 CGTCATCGTT TGTGTTCCTG A

它编码的蛋白质具有氨基酸序列<SEQ ID 798>：

1 MSYRASSSPD FLEVETAPLI FLPLLPKASM KKLMVEPVPM PMYSFSGTNS

51 TAFSAAMRLS SSCVVIFLSF GKPYQQTAAI LTFFCTSWPP RSNPYQQYRR

101 LRLYAFHPPE IAEFFVGFAF DIDARNIDTQ IGGDVGTHLR NVRCEFGFLC

151 NHGRIDIDHL PTLRLNALIR RTQKDAAVRI FELCGGVGKM AADVAQTCRT

201 EQRVGNGVQQ RVGIRMPEQP FFKWDFNSAK YQLSAFGQLV DIVALSDTDI

251 RHRLCS*

ORF122ng和ORF122-1在256个氨基酸的重叠区内显示出有92.6％的相同性：

10 20 30 40 50 60

orf122-1.pep ISYWASSSPDFLEVDTAPLIFLPLLPKASMKKLMVEPVPMPIYSFSGTNSTAFSAAMRLS

:|| ||||||||||:||||||||||||||||||||||||||:||||||||||||||||||

orf122ng MSYRASSSPDFLEVETAPLIFLPLLPKASMKKLMVEPVPMPMYSFSGTNSTAFSAAMRLS

10 20 30 40 50 60

70 80 90 100 110 120

orf122-1.pep SSCVVIFLSFGKPYQQTAAILTFFCTSCPPRSNAYQQYRRLRLYAFHPPEIAEFFVGFAF

|||||||||||||||||||||||| |||||||| ||||||||||||||||||||||||||

orf122ng SSCVVIFLSFGKPYQQTAAILTFFCTSWPPRSNPYQQYRRLRLYAFHPPEIAEFFVGFAF

70 80 90 100 110 120

130 140 150 160 170 180

orf122-1.pep DVDARNVYAQIGGDVGTHLRNVRREFGFLCNHGRIDIDRLPTLRLNALIRRTQKDAAVRI

|:||||: :|||||||||||||| ||||||||||||||:|||||||||||||||||||||

orf122ng DIDARNIDTQIGGDVGTHLRNVRCEFGFLCNHGRIDIDHLPTLRLNALIRRTQKDAAVRI

130 140 150 160 170 180

190 200 210 220 230 240

orf122-1.pep FELCGGVGEMAADIAQTCRTEQRVGNGVQQRIGIGVSEQPFFKWDFNSAKYQLSAFGQLV

||||||||:||||:|||||||||||||||||:|| : |||||||||||||||||||||||

orf122ng FELCGGVGKMAADVAQTCRTEQRVGNGVQQRVGIRMPEQPFFKWDFNSAKYQLSAFGQLV

190 200 210 220 230 240

250

orf122-1.pep DIVALSDTDVRHRLCSX

|||||||||:|||||||

orf122ng DIVALSDTDIRHRLCSX

250

实施例95

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 799>：

1 ..GCCGGCGCGA GTGCGAACAA CATTTCCGCG CGTTTTGCGG AAACACCCGT

51 CGCTGTCAGC GTTACCCTGA TCGGCACGGT ACTTGCCGTC ATGCTGCCCG

101 TTACCGAATA TGAAAACTTC CTGCTGCTTA TCGGCTCGGT ATTTGCGCCG

151 ATG

GGCGGA

TTTGATTGC CGACTTTTTC GTCTTGAAAC GGCGTGA

它对应于氨基酸序列<SEQ ID 800；ORF125>：

1 ..AGASANNISA RFAETPVAVS VTLIGTVLAV MLPVTEYENF LLLIGSVFAP

51 MGGFDCRLFR LETA*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 801>：

1 ATGTCGGGCA ATGCCTCCTC TCCTTCATCT TCCTCCGCCA TCGGGCTGAT

51 TTGGTTCGGC GCGGCGGTAT CGATTGCCGA AATCAGCACG GGTACGCTGC

101 TTGCGCCTTT GGGCTGGCAG CGCGGTCTGG CGGCTCTACT TTTGGGTCAT

151 GCCGTCGGCG GCGCGCTGTT TTTTGCGGCG GCGTATATCG GCGCACTGAC

201 CGGACGCAGC TCGATGGAAA GCGTGCGCCT GTCGTTCGGC AAACGCGGTT

251 CAGTGCTGTT TTCCGTGGCG AATATGCTGC AACTGGCCGG CTGGACGGCG

301 GTGATGATTT ACGCCGGCGC AACGGTCAGC TCCGCTTTGG GCAAAGTGTT

351 GTGGGACGGC GAATCTTTTG TCTGGTGGGC ATTGGCAAAC GGCGCGCTGA

401 TTGTGCTGTG GCTGGTTTTC GGCGCACGCA AAACAGGCGG GCTGAAAACC

451 GTTTCGATGC TGCTGATGCT GTTGGCGGTT CTGTGGCTGA GTGCCGAAGT

501 CTTTTCCACG GCAGGCAGCA CCGCCGCACA GGTTTCAGAC GGCATGAGTT

551 TCGGAACGGC AGTCGAGCTG TCCGCCGTGA TGCCGCTTTC CTGGCTGCCG

601 CTTGCCGCCG ACTACACGCG CCACGCGCGC CGCCCGTTTG CGGCAACCCT

651 GACGGCAACG CTCGCCTACA CGCTGACCGG CTGCTGGATG TATGCCTTGG

701 GTTTGGCAGC GGCGTTGTTC ACCGGAGAAA CCGACGTGGC AAAAATCCTG

751 CTGGGCGCAG GTTTGGGTGC GGCAGGCATT TTGGCGGTCG TCCTCTCCAC

801 CGTTACCACA ACGTTTCTCG ATGCCTATTC CGCCGGCGCG AGTGCGAACA

851 ACATTTCCGC GCGTTTTGCG GAAACACCCG TCGCTGTCGG CGTTACCCTG

901 ATCGGCACGG TACTTGCCGT CATGCTGCCC GTTACCGAAT ATGAAAACTT

951 CCTGCTGCTT ATCGGCTCGG TATTTGCGCC GATGGCGGCG GTTTTGATTG

1001 CCGACTTTTT CGTCTTGAAA CGGCGTGAGG AGATTGAAGG CTTTGACTTT

1051 GCCGGACTGG TTCTGTGGCT TGCGGGCTTC ATCCTCTACC GCTTCCTGCT

1101 CTCGTCCGGC TGGGAAAGCA GCATCGGTCT GACCGCCCCC GTAATGTCTG

1151 CCGTTGCCAT TGCCACCGTA TCGGTACGCC TTTTCTTTAA AAAAACCCAA

1201 TCTTTACAAA GGAACCCGTC ATGA

它对应于氨基酸序列<SEQ ID 802；ORF125-1>：

1 MSGNASSPSS SSAIGLIWFG AAVSIAEIST GTLLAPLGWQ RGLAALLLGH

51 AVGGALFFAA AYIGALTGRS SMESVRLSFG KRGSVLFSVA NMLQLAGWTA

101 VMIYAGATVS SALGKVLWDG ES FVWWALAN GALIVLWLVF GARKTGGLKT

151 VS MLLMLLAV LWLSAEVFST AGSTAAQVSD GMSFGTAVEL SAVMPLSWLP

201 LAADYTRHAR RPFAATLTAT LAYTLTGCWM YALGLAAALF TGETDVAK IL

251 LGAGLGAAGI LAVVLSTVTT TFLDAYSAGA SANNISARFA E TPVAVGVTL

301 IGTVLAVMLP VTEYEN FLLL IGSVFAPMAA VLIADFFVLK RREEIEGFDF

351 AGLVLWLAGF ILYRFLLSSG WESSIGLTA P VMSAVAIATV SVRLFFKKTQ

401 SLQRNPS*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF125和脑膜炎奈瑟球菌菌株A的ORF(ORF125a)在51个氨基酸的重叠区内显示出有76.5％的相同性：

10 20 30

orf125.pep AGASANNISARFAETPVAVSVTLIGTVLAV

||:|||||||:::| |:||:|:::||:|||

orf125a KILLGAGLGAAGILAVVLSTVTTTFLDAYSAGVSANNISAKLSEIPIAVAVAVVGTLLAV

250 260 270 280 290 300

40 50 60

orf125.pep MLPVTEYENFLLLIGSVFAPMGGFDCRLFRLETAX

:||||||||||||||||||||:

orf125a LLPVTEYENFLLLIGSVFAPMAAVLIADFFVLKRREEIEG

310 320 330 340

该ORF125a的部分核苷酸序列<SEQ ID 803>是：

1 ATGTCGGGCA ATGCCTCCTC TCNTTCATCT TCCGCCGCCA TCGGGCTGAT

51 TTGGTTCGGC GCGGCGGTAT CGATTGCCGA AATCAGCACG GGTACACTGC

101 TTGCGCCTTT GGGCTGGCAG CGCGGTCTGG CNGCTCTGCT TTTGGGTCAT

151 GCCGTCGGCG GCGCGCTGTT TTTTGCGGCG GCGTATATCG GCGCACTGAC

201 CGGACNCANC TCGATGGAAA GCGTGCGCCT GTCGTTCGGC AAACGCGGTT

251 CAGTGCTGTT TTCCGTGGCG AATATGCTGC AACTGGCCGG CTGGACGGCG

301 GTGATGATTT ACGCCGGCGC AACGGTCAGC TCCGCTTTGG GCAAAGTGTT

351 GTGGGACGGC GAATCTTTTG TCTGGTGGGC ATTGGCAAAC GGCGCGCTGA

401 TTGTGCTGTG GCTGGTTTTC GGCGCACGCA AAACAGGCGG GCTGAAAACC

451 GTTTCGATGC TGCTGATGCT GTTGGCGGTT CTGTGGCTGA GTGCCGAANT

501 NTTTTCCACG GCAGGCAGCA CCGCCGCANN GGTNNCAGAC GGCATGAGTT

551 TCGGAACGGC AGTCGAGCTG TCCGCCGTNA TGCCGCTTTC TTGGCTGCCG

601 CTGGCCGCCG ACTACACGCG CCACGCGCGC CGCCCGTTTG CGGCAACCCT

651 GACGGCAACG CTCGCCTACA CGCTGACCGG CTGCTGGATG TATGCCTTGG

701 GTTTGGCAGC GGCGTTGTTC ACCGGAGAAA CCGACGTGGC AAAAATCCTG

751 CTGGGCGCAG GTTTGGGTGC GGCAGGCATT TTGGCGGTCG TCCTGTCGAC

801 CGTTACCACC ACTTTTCTCG ATGCNTACTC CGCCGGCGTA AGTGCCAACA

851 ATATTTCCGC CAAACTTTCG GAAATACCNA TCGCCGTTGC CGTCGCCGTT

901 GTCGGCACAC TGCTTGCCGT CCTCCTGCCC GTTACCGAAT ATGAAAACTT

951 CCTGCTGCTT ATCGGCTCGG TATTTGCGCC GATGGCGGCG GTTTTGATTG

1001 CCGACTTTTT CGTCTTGAAA CGGCGTGAGG AGATTGAAGG C..

它编码的蛋白质具有部分氨基酸序列<SEQ ID 804>：

1 MSGNASSXSS SAAIGLIWFG AAVSIAEIST GTLLAPLGWQ RGLAALLLGH

51 AVGGALFFAA AYIGALTGXX SMESVRLSFG KRGSVLFSVA NMLQLAGWTA

101 VMIYAGATVS SALGKVLWDG ES FVWWALAN GALIVLWLVF GARKTGGLKT

151 VS MLLMLLAV LWLSAEXFST AGSTAAXVXD GMSFGTAVEL SAVMPLSWLP

201 LAADYTRHAR RPFAATLTAT LAYTLTGCWM YALGLAAALF TGETDVAK IL

251 LGAGLGAAGI LAVVLSTVTT TFLDAYSAGV SANNISAKLS E IPIAVAVAV

301 VGTLLAVLLP VTEYEN FLLL IGSVFAPMAA VLIADFFVLK RREEIEG..

ORF125a和ORF125-1在347个氨基酸的重叠区内显示出有94.5％的相同性：

10 20 30 40 50 60

orf125a.pep MSGNASSXSSSAAIGLIWFGAAVSIAEISTGTLLAPLGWQRGLAALLLGHAVGGALFFAA

||||||| |||:||||||||||||||||||||||||||||||||||||||||||||||||

orf125-1 MSGNASSPSSSSAIGLIWFGAAVSIAEISTGTLLAPLGWQRGLAALLLGHAVGGALFFAA

10 20 30 40 50 60

70 80 90 100 110 120

orf125a.pep AYIGALTGXXSMESVRLSFGKRGSVLFSVANMLQLAGWTAVMIYAGATVSSALGKVLWDG

|||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||

orf125-1 AYIGALTGRSSMESVRLSFGKRGSVLFSVANMLQLAGWTAVMIYAGATVSSALGKVLWDG

70 80 90 100 110 120

130 140 150 160 170 180

orf125a.pep ESFVWWALANGALIVLWLVFGARKTGGLKTVSMLLMLLAVLWLSAEXFSTAGSTAAXVXD

|||||||||||||||||||||||||||||||||||||||||||||| ||||||||| | |

orf125-1 ESFVWWALANGALIVLWLVFGARKTGGLKTVSMLLMLLAVLWLSAEVFSTAGSTAAQVSD

130 140 150 160 170 180

190 200 210 220 230 240

orf125a.pep GMSFGTAVELSAVMPLSWLPLAADYTRHARRPFAATLTATLAYTLTGCWMYALGLAAALF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf125-1 GMSFGTAVELSAVMPLSWLPLAADYTRHARRPFAATLTATLAYTLTGCWMYALGLAAALF

190 200 210 220 230 240

250 260 270 280 290 300

orf125a.pep TGETDVAKILLGAGLGAAGILAVVLSTVTTTFLDAYSAGVSANNISAKLSEIPIAVAVAV

|||||||||||||||||||||||||||||||||||||||:|||||||:::| |:||:|::

orf125-1 TGETDVAKILLGAGLGAAGILAVVLSTVTTTFLDAYSAGASANNISARFAETPVAVGVTL

250 260 270 280 290 300

310 320 330 340

orf125a.pep VGTLLAVLLPVTEYENFLLLIGSVFAPMAAVLIADFFVLKRREEIEG

:||:|||:|||||||||||||||||||||||||||||||||||||||

orf125-1 IGTVLAVMLPVTEYENFLLLIGSVFAPMAAVLIADFFVLKRREEIEGFDFAGLVLWLAGF

310 320 330 340 350 360

与淋病奈瑟球菌的预计ORF的同源性

ORF125和淋病奈瑟球菌的预计ORF(ORF125ng)在65个氨基酸的重叠区内显示出有86.2％的相同性：

orf125.pep AGASANNISARFAETPVAVSVTLIGTVLAV 30

|||||||||||||| ||||:|||| |||||

orf125ng KILLGAGLGITGILAVVLSTVTTTFLDTYSAGASANNISARFAEIPVAVGVTLIRTVLAV 308

orf125.pep MLPVTEYENFLLLIGSVFAPM-GGFDCRLFRLETA 64

|||||||:|||||| |||:|| |||||||| |:||

orf125ng MLPVTEYKNFLLLIRSVFGPMAGGFDCRLFCLKTA 343

预计ORF125ng核苷酸序列<SEQ ID 805>编码的蛋白质具有氨基酸序列<SEQ ID806>：

1 MSGNASSPSS SAAIGLVWFG AAVSIAEIST GTLLAPLGWQ RGLAALLLGH

51 AVGGALFFAA AYIGALTGRS SMESVRLSFG KCGSVLFSVA NMLQLAGWTA

101 VMIYVGATVS SALGKVLWDG ES FVWWALAN GALIVLWLVF GARRTGGLKT

151 VS MLLMLLAV LWLSVEVFAS SGTNAAPAVS DGMTFGTAVE LSAVMPLSWL

201 PLAADYTRQA RRPFAATLTA TLAYTLTGCW MYALGLAAAL FTGETDVAK I

251 LLGAGLGITG ILAVVLSTVT TTFLDTYSAG ASANNISARF AE IPVAVGVT

301 LIRTVLAVML PVTEYKNFLL LIRSVFGPMA GGFDCRLFCL KTA*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 807>：

1 ATGTCGGGCA ATGCCTCCTC TCCTTCATCT TCCGCCGCCA TCGGGCTGGT

51 TTGGTTCGGC GCGGCGGTAT CGATTGCCGA AATCAGCACG GGTACGCTGC

101 TCGCCCCCTT GGGCTGGCAG CGCGGTCTGG CGGCCCTGCT TTTGGGTCAT

151 GCCGTCGGCG GCGCGCTGTT TTTTGCGGCG GCGTATATCG GCGCACTGAC

201 CGGACGCAGC TCGATGGAAA GTGTGCGCCT GTCGTTCGGC AAATGCGGTT

251 CAGTGCTGTT TTCCGTGGCG AATATGCTGC AACTGGCCGG CTGGACGGCG

301 GTGATGATTT ACGTCGGCGC AACGGTCAGC TCCGCTTTGG GCAAAGTGTT

351 GTGGGACGGC GAATCCTTTG TCTGGTGGGC ATTGGCAAAC GGCGCACTGA

401 TCGTGCTGTG GCTGGTTTTC GGCGCACGCA GAACGGGCGG GCTGAAAACC

451 GTTTCGATGC TGCTGATGCT GCTTGCCGTG TTGTGGTTGA GCGTCGAAGT

501 GTTCGCTTCG TCCGGCACAA ACGCCGCGCC CGCCGTTTCA GACGGCATGA

551 CCTTCGGAAC GGCAGTCGAA CTGTCCGCCG TCATGCCGCT TTCCTGGCTG

601 CCGCTGGCCG CCGACTACAC GCGCCAAGCA CGCCGCCCGT TTGCGGCAAC

651 CCTGACGGCA ACGCTCGCCT ATACGCTGAC GGGCTGCTGG ATGTATGCCT

701 TGGGTTTGGC GGCGGCTCTG TTTACCGGAG AAACCGACGT GGCGAAAATC

751 CTGTTGGGCG CGGGCTTGGG CATAACGGGC ATTCTGGCAG TCGTCCTCTC

801 CACCGTTACC ACAACGTTTC TCGATACCTA TTCCGCCGGC GCGAGTGCGA

851 ACAACATTTC CGCGCGTTTT GCGGAAATAC CCGTCGCTGT CGGCGTTACC

901 CTGATCGGCA CGGTGCTTGC CGTCATGCTG CCCGTTACCG AATATAAAAA

951 CTTCCTGCTG CTTATCGGCT CGGTATTTGC GCCGATGGCG GCGGTTTTGA

1001 TTGCCGACTT TTTCGTCTTA AAACGGCGTG AGGAGATTGA AGGCTTTGAC

1051 TTTGCCGGAC TGGTTCTGTG GCTGGCAGGC TTCATCCTCT ACCGCTTCCT

1101 GCTCTCGTCC GGTTGGGAAA GCAGCATCGG TCTGACCGCC CCCGTAATGT

1151 CTGCCGTTGC CATTGCCACC GTATCGGTAC GCCTTTTCTT TAAAAAAACC

1201 CAATCTTTAC AAAGGAACCC GTCATGA

它对应于氨基酸序列<SEQ ID 808；ORF125ng-1>：

1 MSGNASSPSS SAAIGLVWFG AAVSIAEIST GTLLAPLGWQ RGLAALLLGH

51 AVGGALFFAA AYIGALTGRS SMESVRLSFG KCGSVLFSVA NMLQLAGWTA

101 VMIYVGATVS SALGKVLWDG ES FVWWALAN GALIVLWLVF GARRTGGLKT

151 VS MLLMLLAV LWLSVEVFAS SGTNAAPAVS DGMTFGTAVE LSAVMPLSWL

201 PLAADYTRQA RRPFAATLTA TLAYTLTGCW MYALGLAAAL FTGETDVAK I

251 LLGAGLGITG ILAVVLSTVT TTFLDTYSAG ASANNISARF AE IPVAVGVT

301 LIGTVLAVML PVTEYKN FLL LIGSVFAPMA AVLIADFFVL KRREEIEGFD

351 F AGLVLWLAG FILYRFLLSS GWESSIGLTA PVMSAVAIAT VSVRLFFKKT

401 QSLQRNPS*

ORF125ng-1和ORF125-1在408个氨基酸的重叠区内显示出有95.1％的相同性：

10 20 30 40 50 60

orf125-1.pep MSGNASSPSSSSAIGLIWFGAAVSIAEISTGTLLAPLGWQRGLAALLLGHAVGGALFFAA

|||||||||||:||||:|||||||||||||||||||||||||||||||||||||||||||

orf125ng-1 MSGNASSPSSSAAIGLVWFGAAVSIAEISTGTLLAPLGWQRGLAALLLGHAVGGALFFAA

10 20 30 40 50 60

70 80 90 100 110 120

orf125-1.pep AYIGALTGRSSMESVRLSFGKRGSVLFSVANMLQLAGWTAVMIYAGATVSSALGKVLWDG

||||||||||||||||||||| |||||||||||||||||:||||||||||||||||||||

orf125ng-1 AYIGALTGRSSMESVRLSFGKCGSVLFSVANMLQLAGWTAVMIYVGATVSSALGKVLWDG

70 80 90 100 110 120

130 140 150 160 170 179

orf125-1.pep ESFVWWALANGALIVLWLVFGARKTGGLKTVSMLLMLLAVLWLSAEVFSTAGSTAAQ-VS

|||||||||||||||||||||||:||||||||||||||||||||:|||:::|::|| ||

orf125ng-1 ESFVWWALANGALIVLWLVFGARRTGGLKTVSMLLMLLAVLWLSVEVFASSGTNAAPAVS

130 140 150 160 170 180

180 190 200 210 220 230 239

orf125-1.pep DGMSFGTAVELSAVMPLSWLPLAADYTRHARRPFAATLTATLAYTLTGCWMYALGLAAAL

|||:||||||||||||||||||||||||:|||||||||||||||||||||||||||||||

orf125ng-1 DGMTFGTAVELSAVMPLSWLPLAADYTRQARRPFAATLTATLAYTLTGCWMYALGLAAAL

190 200 210 220 230 240

240 250 260 270 280 290 299

orf125-1.pep FTGETDVAKILLGAGLGAAGILAVVLSTVTTTFLDAYSAGASANNISARFAETPVAVGVT

||||||||||||||||| :||||||||||||||||:|||||||||||||||| |||||||

orf125ng-1 FTGETDVAKILLGAGLGITGILAVVLSTVTTTFLDTYSAGASANNISARFAEIPVAVGVT

250 260 270 280 290 300

300 310 320 330 340 350 359

orf125-1.pep LIGTVLAVMLPVTEYENFLLLIGSVFAPMAAVLIADFFVLKRREEIEGFDFAGLVLWLAG

|||||||||||||||:||||||||||||||||||||||||||||||||||||||||||||

orf125ng-1 LIGTVLAVMLPVTEYKNFLLLIGSVFAPMAAVLIADFFVLKRREEIEGFDFAGLVLWLAG

310 320 330 340 350 360

360 370 380 390 400

orf125-1.pep FILYRFLLSSGWESSIGLTAPVMSAVAIATVSVRLFFKKTQSLQRNPSX

|||||||||||||||||||||||||||||||||||||||||||||||||

orf125ng-1 FILYRFLLSSGWESSIGLTAPVMSAVAIATVSVRLFFKKTQSLQRNPSX

370 380 390 400

根据该分析结果(包括淋球菌蛋白中存在推定的前导序列和跨膜结构域)，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例96

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 809>：

1 ATGACCCGTA TCGCCATCCT CGGCGGCGGC CTCTCGGGAA GGCTGACCGC

51 GTTGCAGCTT GCAGAACAAG GTTATCAGAT TGCACTTTTC GATAAAAGCT

101 GCCGCCGGGG CGAACACGCC GCCGCCTATG TAGCCGCCGC CATGCTCGCG

151 CCTGCAGCGG A.ACGGTCGA AGCCACGCCC GAAGTGGTCA GGCTGGGCAG

201 GCAGAGCATC CCGCTTTGGC GCGGCATCCG ATGCCGTCTG AACACGCACA

251 CGATGATGCA GGAAAACGGC AGCCTGATTG TATGGCACGG GCAGGACAAG

301 CCATTATCCA GCGAGTTCGT CCGCCATCTC AAACGCGGCG GCGT.ACGGA

351 TGACGAAATC GTCCGTTGGC GCGCCGACGA CATCGCCGAA CGCGAACCGC

401 AACTCGGCGG ACGTTTTTAA GACGGCATCT ACCTGCCGAC CGAAGC.CAG

451 CTCGACGGGC GGCAATTATA GTCTGCACTT GCCGACGCTT TGGACGAACT

501 GAACGTCCCC TGCCATTGGG AACACGAATG CGTCCCCGAA GCCTGCAAG..

它对应于氨基酸序列<SEQ ID 810；ORF126>：

1 MTRIAILGGG LSGRLTALQL AEQGYQIALF DKSCRRGEHA AAYVAAAMLA

51 PAAXTVEATP EVVRLGRQSI PLWRGIRCRL NTHTMMQENG SLIVWHGQDK

101 PLSSEFVRHL KRGGXTDDEI VRWRADDIAE REPQLGGRFX DGIYLPTEXQ

151 LDGRQLXSAL ADALDELNVP CHWEHECVPE ACK...

进一步的工作揭示了完整的核苷酸序列<SEQ ID 811>：

1 ATGACCCGTA TCGCCATCCT CGGCGGCGGC CTCTCGGGAA GGCTGACCGC

51 GTTGCAGCTT GCAGAACAAG GTTATCAGAT TGCACTTTTC GATAAAGGCT

101 GCCGCCGGGG CGAACACGCC GCCGCCTATG TTGCCGCCGC CATGCTCGCG

151 CCTGCGGCGG AAGCGGTCGA AGCCACGCCC GAAGTGGTCA GGCTGGGCAG

201 GCAGAGCATC CCGCTTTGGC GCGGCATCCG ATGCCGTCTG AACACGCACA

251 CGATGATGCA GGAAAACGGC AGCCTGATTG TGTGGCACGG GCAGGACAAG

301 CCATTATCCA GCGAGTTCGT CCGCCATCTC AAACGCGGCG GCGTAGCGGA

351 TGACGAAATC GTCCGTTGGC GCGCCGACGA CATCGCCGAA CGCGAACCGC

401 AACTCGGCGG ACGTTTTTCA GACGGCATCT ACCTGCCGAC CGAAGGCCAG

451 CTCGACGGGC GGCAAATATT GTCTGCACTT GCCGACGCTT TGGACGAACT

501 GAACGTCCCC TGCCATTGGG AACACGAATG CGTCCCCGAA GGCCTGCAAG

551 CCCAATACGA CTGGCTGATC GACTGCCGCG GCTACGGCGC AAAAACCGCG

601 TGGAACCAAT CCCCCGAGCA CACCAGCACC CTGCGCGGCA TACGCGGCGA

651 AGTGGCGCGG GTTTACACAC CCGAAATCAC GCTCAACCGC CCCGTGCGTC

701 TGCTCCATCC GCGTTATCCG CTCTACATCG CCCCGAAAGA AAACCACGTC

751 TTCGTCATCG GCGCGACCCA AATCGAAAGC GAAAGCCAAG CCCCCGCCAG

801 CGTGCGTTCA GGGTTGGAAC TCTTGTCCGC ACTCTATGCC ATCCACCCCG

851 CCTTCGGCGA AGCCGACATC CTCGAAATCG CCACCGGCCT GCGCCCCACG

901 CTCAACCACC ACAACCCCGA AATCCGTTAC AACCGCGCCC GACGCCTGAT

951 TGAAATCAAC GGCCTTTTCC GCCACGGTTT CATGATCTCC CCCGCCGTAA

1001 CCGCCGCCGC CGCCAGATTG GCAGTGGCAC TGTTTGACGG AAAAGACGCG

1051 CCCGAACGCG ATAAAGAAAG CGGTTTGGCG TATATCCGAA GACAAGATTA

1101 A

它对应于氨基酸序列<SEQ ID 812；ORF126-1>：

1 MTRIAILGGG LSGRLTALQL AEQGYQIALF DKGCRRGEHA AAYVAAAMLA

51 PAAEAVEATP EVVRLGRQSI PLWRGIRCRL NTHTMMQENG SLIVWHGQDK

101 PLSSEFVRHL KRGGVADDEI VRWRADDIAE REPQLGGRFS DGIYLPTEGQ

151 LDGRQILSAL ADALDELNVP CHWEHECVPE GLQAQYDWLI DCRGYGAKTA

201 WNQSPEHTST LRGIRGEVAR VYTPEITLNR PVRLLHPRYP LYIAPKENHV

251 FVIGATQIES ESQAPASVRS GLELLSALYA IHPAFGEADI LEIATGLRPT

301 LNHHNPEIRY NRARRLIEIN GLFRHGFM IS PAVTAAAARL AVALFDGKDA

351 PERDKESGLA YIRRQD*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF126和脑膜炎奈瑟球菌菌株A的ORF(ORF126a)在180个氨基酸的重叠区内显示出有90.0％的相同性：

10 20 30 40 50 60

orf126.pep MTRIAILGGGLSGRLTALQLAEQGYQIALFDKSCRRGEHAAAYVAAAMLAPAAXTVEATP

||||||||||||||||||||||||||||||||:|||||||||||||||||||| :|||||

orf126a MTRIAILGGGLSGRLTALQLAEQGYQIALFDKGCRRGEHAAAYVAAAMLAPAAEAVEATP

10 20 30 40 50 60

70 80 90 100 110 120

orf126.pep EVVRLGRQSIPLWRGIRCRLNTHTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGXTDDEI

|||||||| |||||||||:|:| :|| ||||||||||||||||:|||||||||| :|| |

orf126a EVVRLGRQXIPLWRGIRCHLKTPAMMXENGSLIVWHGQDKPLSNEFVRHLKRGGVADDXI

70 80 90 100 110 120

130 140 150 160 170 180

orf126.pep VRWRADDIAEREPQLGGRFXDGIYLPTEXQLDGRQLXSALADALDELNVPCHWEHECVPE

||||||||||||||||||| |||||||| ||||||: ||||||||||||||||||||:||

orf126a VRWRADDIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECAPE

130 140 150 160 170 180

全长ORF126a核苷酸序列<SEQ ID 813>是：

1 ATGACCCGTA TCGCCATCCT CGGCGGCGGC CTCTCNGGAA GGCTGACCGC

51 ACTGCAGCTT GCAGAACAAG GTTATCAGAT TGCACTTTTC GATAAAGGCT

101 GCCGCCGGGG CGAACACGCC GCCGCCTATG TTGCCGCCGC CATGCTCGCG

151 CCTGCGGCGG AAGCGGTCGA AGCCACGCCT GAAGTGGTCA GGCTGGGCAG

201 GCAGANCATC CCGCTTTGGC GCGGCATCCG ATGCCATCTG AAAACGCCTG

251 CCATGATGCA NGAAAACGGC AGCCTGATTG TGTGGCACGG GCAGGACAAA

301 CCTTTATCCA ACGAGTTCGT CCGCCATCTC AAACGCGGCG GCGTAGCGGA

351 TGACNAAATC GTCCGTTGGC GCGCCGACGA CATCGCCGAA CGCGAACCGC

401 AACTCGGCGG ACGTTTTTCA GACGGCATCT ACCTGCCGAC CGAAGGCCAG

451 CTCGACGGGC GGCAAATATT GTCTGCACTT GCCGACGCTT TGGACGAACT

501 GAACGTCCCC TGCCATTGGG AACACGAATG TGCCCCCGAA GACTTGCAAG

551 CCCAATACGA CTGGCTGATC GACTGCCGCG GCTACGGCGC AAAAACCGCG

601 TGGAACCAAT CCCCCGANNA NACCAGCACC CTGCGCGGCA TACGCGGCGA

651 AGTGGCGCGG GTTTACACAC CCGAAATCAC GCTCAACCGC CCCGTGCGCC

701 TGCTACACCC GCGCTATCCG CTNTACATCG CCCCGAAAGA AAACCNCGTC

751 TTCGTCATCG GCGCGACCCA AATCGAAAGC GAAAGCCAAG CACCTGCCAG

801 CGTGCGTTCC GGGCTGGAAC TCTTATCCGC ACTCTATGCC GTCCACCCCG

851 CCTTCGGCGA AGCCGACATC CTCGAAATCG CCACCGGCCT GCGCCCCACG

901 CTCAATCACC ACAACCCCGA AATCCGTTAC AACCGCGCCC GACGCCTGAT

951 TGAAATCAAC GGCCTTTTCC GCCACGGTTT CATGATCTCC CCCGCCGTAA

1001 CCGCCGCCGC CGTCAGATTG GCAGTGGCAC TGTTTGACGG AAAAGANGCG

1051 CCCGAACGCG ATGAAGAAAG CGGTTTGGCG TATATCCGAA GACAAGATTA

1101 A

它编码的蛋白质具有氨基酸序列<SEQ ID 814>：

1 MTRIAILGGG LSGRLTALQL AEQGYQIALF DKGCRRGEHA AAYVAAAMLA

51 PAAEAVEATP EVVRLGRQXI PLWRGIRCHL KTPAMMXENG SLIVWHGQDK

101 PLSNEFVRHL KRGGVADDXI VRWRADDIAE REPQLGGRFS DGIYLPTEGQ

151 LDGRQILSAL ADALDELNVP CHWEHECAPE DLQAQYDWLI DCRGYGAKTA

201 WNQSPXXTST LRGIRGEVAR VYTPEITLNR PVRLLHPRYP LYIAPKENXV

251 FVIGATQIES ESQAPASVRS GLELLSALYA VHPAFGEADI LEIATGLRPT

301 LNHHNPEIRY NRARRLIEIN GLFRHGFM IS PAVTAAAVRL AVALFDGKXA

351 PERDEESGLA YIRRQD*

ORF126a和ORF126-1在366个氨基酸的重叠区内显示出有95.4％的相同性：

10 20 30 40 50 60

orf126a.pep MTRIAILGGGLSGRLTALQLAEQGYQIALFDKGCRRGEHAAAYVAAAMLAPAAEAVEATP

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf126-1 MTRIAILGGGLSGRLTALQLAEQGYQIALFDKGCRRGEHAAAYVAAAMLAPAAEAVEATP

10 20 30 40 50 60

70 80 90 100 110 120

orf126a.pep EVVRLGRQXIPLWRGIRCHLKTPAMMXENGSLIVWHGQDKPLSNEFVRHLKRGGVADDXI

|||||||| |||||||||:|:| :|| ||||||||||||||||:|||||||||||||| |

orf126-1 EVVRLGRQSIPLWRGIRCRLNTHTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGVADDEI

70 80 90 100 110 120

130 140 150 160 170 180

orf126a.pep VRWRADDIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECAPE

|||||||||||||||||||||||||||||||||||||||||||||||||||||||||:||

orf126-1 VRWRADDIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECVPE

130 140 150 160 170 180

190 200 210 220 230 240

orf126a.pep DLQAQYDWLIDCRGYGAKTAWNQSPXXTSTLRGIRGEVARVYTPEITLNRPVRLLHPRYP

||||||||||||||||||||||||| |||||||||||||||||||||||||||||||||

orf126-1 GLQAQYDWLIDCRGYGAKTAWNQSPEHTSTLRGIRGEVARVYTPEITLNRPVRLLHPRYP

190 200 210 220 230 240

250 260 270 280 290 300

orf126a.pep LYIAPKENXVFVIGATQIESESQAPASVRSGLELLSALYAVHPAFGEADILEIATGLRPT

|||||||| |||||||||||||||||||||||||||||||:|||||||||||||||||||

orf126-1 LYIAPKENHVFVIGATQIESESQAPASVRSGLELLSALYAIHPAFGEADILEIATGLRPT

250 260 270 280 290 300

310 320 330 340 350 360

orf126a.pep LNHHNPEIRYNRARRLIEINGLFRHGFMISPAVTAAAVRLAVALFDGKXAPERDEESGLA

||||||||||||||||||||||||||||||||:||||||||||||||| |||||:|||||

orf126-1 LNHHNPEIRYNRARRLIEINGLFRHGFMISPAVTAAAARLAVALFDGKDAPERDKESGLA

310 320 330 340 350 360

orf126a.pep YIRRQDX

|||||||

orf126-1 YIRRQDX

与淋病奈瑟球菌的预计ORF的同源性

ORF126和淋病奈瑟球菌的预计ORF(ORF126ng)在180个氨基酸的重叠区内显示出有90％的相同性：

orf126.pep MTRIAILGGGLSGRLTALQLAEQGYQIALFDKSCRRGEHAAAYVAAAMLAPAAXTVEATP 60

|||||:||||||||||||||||||||| ||||: |:||||||||||||||||| :|||||

orf126ng MTRIAVLGGGLSGRLTALQLAEQGYQIELFDKGTRQGEHAAAYVAAAMLAPAAEAVEATP 60

orf126.pep EVVRLGRQSIPLWRGIRCRLNTHTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGXTDDEI 120

||:||||||||||||||||||| ||||||||||||||||||||||||||||||| :||||

orf126ng EVIRLGRQSIPLWRGIRCRLNTLTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGVADDEI 120

orf126.pep VRWRADDIAEREPQLGGRFXDGIYLPTEXQLDGRQLXSALADALDELNVPCHWEHECVPE 180

||||||:|||||||||||| |||||||| ||||||: ||||||||||||||||||||:|:

orf126ng VRWRADEIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECAPQ 180

预计ORF126ng核苷酸序列<SEQ ID 815>编码的蛋白质具有氨基酸序列<SEQ ID816>：

1 MTRIAVLGGG LSGRLTALQL AEQGYQIELF DKGTRQGEHA AAYVAAAMLA

51 PAAEAVEATP EVIRLGRQSI PLWRGIRCRL NTLTMMQENG SLIVWHGQDK

101 PLSSEFVRHL KRGGVADDEI VRWRADEIAE REPQLGGRFS DGIYLPTEGQ

151 LDGRQILSAL ADALDELNVP CHWEHECAPQ DLQAQYDWVI DCRGYGAKTA

201 WNQSPEHTST LRGIRGEVRG FTRPKSRSTA PCACCTRAIR STSPRKKTTS

251 SSSARPKSKA KAKPPPAYVP GWNSYPRSMP STPPSAKPTS SKWRPGLRPT

301 LNHHNPEIRY SRERRLIEIN GLFRHGFM IS PAVTAAAVRL AVALFDGKDA

351 PERDEESGLA YIGRQD*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 817>：

1 ATGACCCGTA TCGCCGTCCT CGGAGGCGGC CTTTCCGGAA GGCTGACCGC

51 ATTGCAGCTT GCAGAACAAG GTTATCAGAT TGAACTTTTC GACAAGGGCA

101 CCCGCCAAGG CGAACACGCC GCCGCCTATG TTGCCGCCGC GATGCTCGCG

151 CCTGCGGCGG AAGCGGTCGA GGCAACGCCC GAAGTCATCA GGCTGGGCAG

201 GCAGAGCATT CCGCTTTGGC GCGGCATCCG ATGCCGTCTG AACACGCTCA

251 CGATGATGCA GGAAAACGGC AGCCTGATTG TGTGGCACGG GCAGGACAAG

301 CCATTATCCA GCGAGTTCGT CCGCCATCTC AAACGCGGCG GCGTAGCGGA

351 TGACGAAATC GTCCGTTGGC GCGCCGATGA AATCGCCGAA CGCGAACCGC

401 AACTCGGCGG ACGTTTTTCA GACGGCATCT ACCTGCCGAC CGAAGGCCAG

451 CTCGACGGGC GGCAAATATT GTCTGCACTT GCCGACGCTT TGGACGAACT

501 GAACGTCCCT TGCCATTGGG AACACGAATG CGCCCCCCAA GACCTGCAAG

551 CCCAATACGA CTGGGTAATC GACTGCCGGG GCTACGGCGC GAAAACCGCG

601 TGGAACCAAT CCCCCGAGCA CACCAGCACC TTGCGCGGCA TACGCGGCGA

651 AGTGGCGCGG GTTTACACGC CCGAAATCAC GCTCAACCGC CCCGTGCGCC

701 TGCTGCACCC GCGCTATCCG CTCTACATCG CCCCGAAAGA AAACCACGTC

751 TTCGTCATCG GCGCGACCCA AATCGAAAGC GAAAGCCAAG CCCCCGCCAG

801 CGTACGTTCC GGGCTGGAAC TCTTATCCGC GCTCTATGCC GTCCACCCCG

851 CCTTCGGCGA AGCCGACATC CTCGAAATCG CCGCCGGCCT GCGCCCCACG

901 CTCAACCACC ACAACCCCGA AATCCGCTAC AGCCGCGAAC GCCGCCTCAT

951 CGAAATCAAC GGCCTTTTCC GGCACGGCTT TATGATTTCC CCCGCCGTAA

1001 CCGCCGCCGC CGTCAGATTG GCAGTGGCAC TGTTTGACGG AAAAGACGCG

1051 CCCGAACGTG ATGAAGAAAG CGGTTTGGCG TATATCGGAA GACAAGATTA

1101 A

它对应于氨基酸序列<SEQ ID 818；ORF126ng-1>：

1 MTRIAVLGGG LSGRLTALQL AEQGYQIELF DKGTRQGEHA AAYVAAAMLA

51 PAAEAVEATP EVIRLGRQSI PLWRGIRCRL NTLTMMQENG SLIVWHGQDK

101 PLSSEFVRHL KRGGVADDEI VRWRADEIAE REPQLGGRFS DGIYLPTEGQ

151 LDGRQILSAL ADALDELNVP CHWEHECAPQ DLQAQYDWVI DCRGYGAKTA

201 WNQSPEHTST LRGIRGEVAR VYTPEITLNR PVRLLHPRYP LYIAPKENHV

251 FVIGATQIES ESQAPASVRS GLELLSALYA VHPAFGEADI LEIAAGLRPT

301 LNHHNPEIRY SRERRLIEIN GLFRHGFM IS PAVTAAAVRL AVALFDGKDA

351 PERDEESGLA YIGRQD*

ORF126ng-1和ORF126-1在366个氨基酸的重叠区内显示出有95.1％的相同性：

10 20 30 40 50 60

orf126-1.pep MTRIAILGGGLSGRLTALQLAEQGYQIALFDKGCRRGEHAAAYVAAAMLAPAAEAVEATP

|||||:|||||||||||||| |||||| ||||| |:||||||||||||||||||||||||

orf126ng-1 MTRIAVLGGGLSGRLTALQLAEQGYQIELFDKGTRQGEHAAAYVAAAMLAPAAEAVEATP

10 20 30 40 50 60

70 80 90 100 110 120

orf126-1.pep EVVRLGRQSIPLWRGIRCRLNTHTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGVADDEI

||:||||||||||||||||||| |||||||||||||||||||||||||||||||||||||

orf126ng-1 EVIRLGRQSIPLWRGIRCRLNTLTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGVADDEI

70 80 90 100 110 120

130 140 150 160 170 180

orf126-1.pep VRWRADDIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECVPE

||||||:||||||||||||||||||||||||||||||||||||||||||||||||||:|:

orf126ng-1 VRWRADEIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECAPQ

130 140 150 160 170 180

190 200 210 220 230 240

orf126-1.pep GLQAQYDWLIDCRGYGAKTAWNQSPEHTSTLRGIRGEVARVYTPEITLNRPVRLLHPRYP

||||||||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf126ng-1 DLQAQYDWVIDCRGYGAKTAWNQSPEHTSTLRGIRGEVARVYTPEITLNRPVRLLHPRYP

190 200 210 220 230 240

250 260 270 280 290 300

orf126-1.pep LYIAPKENHVFVIGATQIESESQAPASVRSGLELLSALYAIHPAFGEADILEIATGLRPT

||||||||||||||||||||||||||||||||||||||||:|||||||||||||:|||||

orf126ng-1 LYIAPKENHVFVIGATQIESESQAPASVRSGLELLSALYAVHPAFGEADILEIAAGLRPT

250 260 270 280 290 300

310 320 330 340 350 360

orf126-1.pep LNHHNPEIRYNRARRLIEINGLFRHGFMISPAVTAAAARLAVALFDGKDAPERDKESGLA

||||||||||:| ||||||||||||||||||||||||:||||||||||||||||:|||||

orf126ng-1 LNHHNPEIRYSRERRLIEINGLFRHGFMISPAVTAAAVRLAVALFDGKDAPERDEESGLA

310 320 330 340 350 360

orf126-1.pep YIRRQDX

|| ||||

orf126ng-1 YIGRQDX

另外，ORF126ng-1显示出与一种推定的根瘤菌氧化酶黄素蛋白同源：

gi|2627327(AF004408)推定的氨基酸氧化酶黄素蛋白[Rhizobium etli]长度＝327

评分＝169位(423)，估计值＝3e-41

相同性＝112/329(34％)，阳性＝163/329(49％)，空隙＝25/329(7％)

询问：3 RIAVLGGGLSGRLTALQLAEQGYQIELFDKGTRQGEHXXXXXXXXXXXXXXXXXXXXXXX 62

RI V G G++G A QL G+++ L ++ G

目标：2 RILVNGAGVAGLTVAWQLYRHGFRVTLAERAGTVGA-GASGFAGGMLAPWCERESAEEPV 60

询问：63 IRLGRQSIPLWRGIRCRLNTLTMMQENGSLIVWHGQDKPLSSEFVRHLKRGGVADDEIVR 122

+ LGR + W + G+L+V G+D F R G DE+

目标：61 LTLGRLAADWWEAA-----LPGHVHRRGTLVVAGGRDTGELDRFSRRTS-GWEWLDEVA- 113

询问：123 WRADEIAEREPQLGGRFSDGIYLPTEGQLDGRQILSALADALDELNVPCHWEHECAPQDL 182

IA EP L GRF ++ E LD RQ L+ALA L++ + +

目标：114 -----IAALEPDLAGRFRRALFFRQEAHLDPRQALAALAAGLEDARMRLTLG---VVGES 165

询问：183 QAQYDWVIDCRGYGAKTAWNQSPEHTSTLRGIRGEVARVYTPEITLNRPVRLLHPRYPLY 242

+D V+DC G LRG+RGE+ V T E++L+RPVRLLHPR+P+Y

目标：166 DVDHDRVVDCTGAA-------QIGRLPGLRGVRGEMLCVETTEVSLSRPVRLLHPRHPIY 218

询问：243 IAPKENHVFVIGATQIESESQAPASVRSGLELLSALYAVHPAFGEADILEIAAGLRPTLN 302

I P++ + F++GAT IES+ P + RS +ELL+A YA+HPAFGEA + E AG+RP

目标：219 IVPRDKNRFMVGATMIESDDGGPITARSLMELLNAAYAMHPAFGEARVTETGAGVRPAYP 278

询问：303 HHNPEIRYSRERRLIEINGLFRHGFMISP 331

+P R ++E R + +NGL+RHGF+++P

目标：279 DNLP--RVTQEGRTLHVNGLYRHGFLLAP 305

该分析结果提示，脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例97

在脑膜炎奈瑟球菌中鉴定出下列认为是完整的DNA序列<SEQ ID 819>：

1 ATGACTGATA ATCGGGGGTT TACGCTGGTT GAATTAATAT CAGTGGTCTT

51 GATATTGTCT GTACTTGCTT TAATTGTTTA TCCGAGCTAT CGCAATTATG

101 TTGAGAAAGC AAAGATAAAT GCAGTGCGGG CAGCCTTGTT AGAAAATGCA

151 CATTTTATGG AAAAGTTTTA TCTGCAGAAT GGGAGGTTTA AACAAACATC

201 TACCAAGTGG CCAAGTTTGC CGATTAAAGA GGCAGAAGGC TTTTGTATCC

251 GTTTGAATGG AATCGtCGCG CGGG..GCTT TAGACAGTAA ATTCATGTTG

301 AAGGCGGTAG CCATAGATAA AGATAAAAAT CCTTTTATTA TTAAGATGAA

351 TGAAAATCTA GTAACCTTTATTTGCAAGA AGTCCGCCAG TTCGTGTAGT

401 GACGGGCTGG ATTATTTTAA AGGAAATGAT AAGGACTGCA AGTTACTTAA

451 GTAG

它对应于氨基酸序列<SEQ ID 820；ORF127>：

1 MTDNRGFTLV ELISVVLILS VLALIVYPSY RNYVEKAKIN AVRAALLENA

51 HFMEKFYLQN GRFKQTSTKW PSLPIKEAEG FCIRLNGIVA RXALDSKFML

101 KAVAIDKDKN PFI IKMNENL VTFICKKSAS SCSDGLDYFK GNDKDCKLLK

151 *

进一步的工作揭示了下列DNA序列<SEQ ID 821>：

1 ATGACTGATA ATCGGGGGTT TACGCTGGTT GAATTAATAT CAGTGGTCTT

51 GATATTGTCT GTACTTGCTT TAATTGTTTA TCCGAGCTAT CGCAATTATG

101 TTGAGAAAGC AAAGATAAAT GCAGTGCGGG CAGCCTTGTT AGAAAATGCA

151 CATTTTATGG AAAAGTTTTA TCTGCAGAAT GGGAGGTTTA AACAAACATC

201 TACCAAGTGG CCAAGTTTGC CGATTAAAGA GGCAGAAGGC TTTTGTATCC

251 GTTTGAATGG AATCGCGCGC GGGGCTTTAG ACAGTAAATT CATGTTGAAG

301 GCGGTAGCCA TAGATAAAGA TAAAAATCCT TTTATTATTA AGATGAATGA

351 AAATCTAGTA ACCTTTATTT GCAAGAAGTC CGCCAGTTCG TGTAGTGACG

401 GGCTGGATTA TTTTAAAGGA AATGATAAGG ACTGCAAGTT ACTTAAGTAG

它对应于氨基酸序列<SEQ ID 822；ORF127-1>：

1 MTDNRGFTL V ELISVVLILS VLALIVYPSY RNYVEKAKIN AVRAALLENA

51 HFMEKFYLQN GRFKQTSTKW PSLPIKEAEG FCIRLNGIAR GALDSKFMLK

101 AVAIDKDKNP FIIKMNENLV TFICKKSASS CSDGLDYFKG NDKDCKLLK*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF127和脑膜炎奈瑟球菌菌株A的ORF(ORF127a)在150个氨基酸的重叠区内显示出有98.0％的相同性：

10 20 30 40 50 60

orf127.pep MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAALLENAHFMEKFYLQN

||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||

orf127a MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINTVRAALLENAHFMEKFYLQN

10 20 30 40 50 60

70 80 90 100 110 120

orf127.pep GRFKQTSTKWPSLPIKEAEGFCIRLNGIVARXALDSKFMLKAVAIDKDKNPFIIKMNENL

|||||||||||||||||||||||||||| || ||||||||||||||||||||||||||||

orf127a GRFKQTSTKWPSLPIKEAEGFCIRLNGI-ARGALDSKFMLKAVAIDKDKNPFIIKMNENL

70 80 90 100 110

130 140 150

orf127.pep VTFICKKSASSCSDGLDYFKGNDKDCKLLKX

|||||||||||||||||||||||||||||||

orf127a VTFICKKSASSCSDGLDYFKGNDKDCKLLKX

120 130 140 150

全长ORF127a核苷酸序列<SEQ ID 823>是：

1 ATGACTGATA ATCGGGGGTT TACGCTGGTT GAATTAATAT CAGTGGTCTT

51 GATATTGTCT GTACTTGCTT TAATTGTTTA TCCGAGCTAT CGCAATTATG

101 TTGAGAAAGC AAAGATAAAT ACAGTGCGGG CAGCCTTGTT AGAAAATGCA

151 CATTTTATGG AAAAGTTTTA TCTGCAGAAT GGGAGATTTA AACAAACATC

201 TACCAAATGG CCAAGTTTGC CGATTAAAGA GGCAGAAGGC TTTTGTATCC

251 GTTTGAATGG AATCGCGCGC GGGGCCTTAG ACAGTAAATT CATGTTGAAG

301 GCGGTAGCCA TAGATAAAGA TAAAAATCCT TTTATTATTA AGATGAATGA

351 AAATCTAGTA ACCTTTATTT GCAAGAAGTC CGCCAGTTCG TGTAGTGACG

401 GGCTGGATTA TTTTAAAGGA AATGATAAGG ACTGCAAGTT ACTTAAGTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 824>：

1 MTDNRGFTL V ELISVVLILS VLALIVYPSY RNYVEKAKIN TVRAALLENA

51 HFMEKFYLQN GRFKQTSTKW PSLPIKEAEG FCIRLNGIAR GALDSKFMLK

101 AVAIDKDKNP FIIKMNENLV TFICKKSASS CSDGLDYFKG NDKDCKLLK*

ORF127a和ORF127-1在149个氨基酸的重叠区内显示出有99.3％的相同性：

10 20 30 40 50 60

orf127a.pep MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINTVRAALLENAHFMEKFYLQN

||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||

orf127-1 MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAALLENAHFMEKFYLQN

10 20 30 40 50 60

70 80 90 100 110 120

orf127a.pep GRFKQTSTKWPSLPIKEAEGFCIRLNGIARGALDSKFMLKAVAIDKDKNPFIIKMNENLV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf127-1 GRFKQTSTKWPSLPIKEAEGFCIRLNGIARGALDSKFMLKAVAIDKDKNPFIIKMNENLV

70 80 90 100 110 120

130 140 150

orf127a.pep TFICKKSASSCSDGLDYFKGNDKDCKLLKX

||||||||||||||||||||||||||||||

orf127-1 TFICKKSASSCSDGLDYFKGNDKDCKLLKX

130 140 150

与淋病奈瑟球菌的预计ORF的同源性

ORF127和淋病奈瑟球菌的预计ORF(ORF127ng)在150个氨基酸的重叠区内显示出有97.3％的相同性：

orf127.pep MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAALLENAHFMEKFYLQN 60

|||||||||||||||||||||||||||||||||||||||||||||:||||||||||||||

orf127ng MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAAFLENAHFMEKFYLQN 60

orf127.pep GRFKQTSTKWPSLPIKEAEGFCIRLNGIVARXALDSKFMLKAVAIDKDKNPFIIKMNENL 120

|||||||||||||||||||||||||||| || ||||||||||||||||||||||||||||

orf127ng GRFKQTSTKWPSLPIKEAEGFCIRLNGI-ARGALDSKFMLKAVAIDKDKNPFIIKMNENL 119

orf127.pep VTFICKKSASSCSDGLDYFKGNDKDCKLLK 150

|||||||||||||| |||||||||||||||

orf127ng VTFICKKSASSCSDRLDYFKGNDKDCKLLK 149

全长ORF127ng核苷酸序列<SEQ ID 825>是：

1 ATGACTGATA ATCGGGGGTT TACACTGGTT GAATTAATAT CAGTGGTCTT

51 GATATTGTCT GTACTTGCTT TAATTGTTTA TCCGAGCTAT CGCAATTATG

101 TTGAGAAAGC AAAGATAAAT GCAGTGCGGG CAGCCTTGTT AGAAAATGCA

151 CATTTTATGG AAAAGTTTTA TCTGCAGAAT GGGAGATTTA AACAAACATC

201 TACCAAATGG CCAAGTTTGC CGATTAAAGA GGCAGAAGGC TTTTGTATCC

251 GTTTGAATGG AATCGCGCGC GGGGCTTTAG ACAGTAAATT CATGTTGAAG

301 GCGGTAGCCA TAGATAAAGA TAAAAATCCT TTTATTATTA AGATGAATGA

351 AAATCTAGTA ACCTTTATTT GCAAGAAGTC CGCCAGTTCG TGTAGTGACG

401 GGCTGGATTA TTTTAAAGGA AATGATAAGG ACTGCAAGTT ACTTAAGTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 826>：

1 MTDNRGFTL V ELISVVLILS VLALIVYPSY RNYVEKAKIN AVRAAFLENA

51 HFMEKFYLQN GRFKQTSTKW PSLPIKEAEG FCIRLNGIAR GALDSKFMLK

101 AVAIDKDKNP FIIKMNENLV TFICKKSASS CSDRLDYFKG NDKDCKLLK*

ORF127ng和ORF127-1在149个氨基酸的重叠区内显示出有100.0％的相同性：

10 20 30 40 50 60

orf127-1.pep MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAALLENAHFMEKFYLQN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf127ng-1 MTDNRGFTLVELISVVLILSVLALIVYPSYRNYVEKAKINAVRAALLENAHFMEKFYLQN

10 20 30 40 50 60

70 80 90 100 110 120

orf127-1.pep GRFKQTSTKWPSLPIKEAEGFCIRLNGIARGALDSKFMLKAVAIDKDKNPFIIKMNENLV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf127ng-1 GRFKQTSTKWPSLPIKEAEGFCIRLNGIARGALDSKFMLKAVAIDKDKNPFIIKMNENLV

70 80 90 100 110 120

130 140 150

orf127-1.pep TFICKKSASSCSDGLDYFKGNDKDCKLLKX

||||||||||||||||||||||||||||||

orf127ng-1 TFICKKSASSCSDGLDYFKGNDKDCKLLKX

130 140 150

该分析结果(包括脑膜炎球菌和淋球菌蛋白均具有预计的跨膜结构域这一事实)提示，脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例98

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 827>

1 ..GTGTCGCTGG CTTCGGTGAT TGCCTCTCAA ATCTTCCTTT ACGAAGATTT

51 CAACCAAATG CGGAAAACC CGTGGAGCTAT CTGCGGTTTT CTTGTCCAAT

101 ATTTATCTGG GGTTTCAGCA GGGGTATTTC GATTTGAGTG CCGACGAGAA

151 CCCCGTACTG CATATCTGGT CTTTGGCAGT AGAGGAACAG TATTACCTCC

201 TGTATCCCCT TTTGCTGATA TTTTGCTGCA AAAAAACCAA ATCGCTACGG

251 GTGCTGCGTA ACATCAGCAT CATCCTGTTT TTGATTTTGA CTGCCTCATC

301 GTTTTTGCCA AGCGGGTTTT ATACCGACAT CCTCAACCAA CCCAATACTT

351 ATTACCTTTC GACACTGAGG TTTCCCGAGC TGTTGGCAGG TTCGCTGCTG

401 GCGGTTTACG GGCAAACGCA AAACGGCAGA CGGCAAACAG CAAATGGAAA

451 ACGGCAGTTG CTTTCATCAC TCTGCTTCGG CGCATTGCTT GCCTGCCTGT

501 TCGTGATTGA CAAACACAAT CCGTTTATCC CGGGAATGAC CCTGCTCCTT

551 CCCTGCCTGC TGACGGCACT GCTTATCCGG AGTATGCAAT ACGGGACACT

601 TCCGACCCGC ATCCTGTCGG CAAGCCCCAT CGTATTTGTC GGCAAAATCT

651 CTTATTCCCT ATACCTGTAC CATTGGATTT TTATTGCTTT CGCTCCGCTC

701 ATTAGAGGCG GGAAACAGCT CGGACTGCCT GCCG..

它对应于氨基酸序列<SEQ ID 828；ORF128>：

1 ..VSLASVIASQ IFLYEDFNQM RKTVELSAVF LSNIYLGFQQ GYFDLSADEN

51 PVLHIWSLAV EEQYYLLYPL LLIFCCKKTK SLRVLRNISI ILFLILTASS

101 FLPSGFYTDI LNQPNTYYLS TLRFPELLAG SLLAVYGQTQ NGRRQTANGK

151 RQLLSSLCFG ALLACLFVID KHNPFIPGMT LLLPCLLTAL LIRSMQYGTL

201 PTRILSASPI VFVGKISYSL YLYHWIFIAF APLIRGGKQL GLPA..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 829>：

1 ATGCAAGCTG TCCGATACAG ACCGGAAATT GACGGATTGC GGGCCGTCGC

51 CGTGCTATCC GTCATGATTT TCCACCTGAA TAACCGCTGG CTGCCCGGAG

101 GATTCCTGGG GGTGGACATT TTCTTTGTCA TCTCAGGATT CCTCATTACC

151 GGCATCATTC TTTCTGAAAT ACAGAACGGT TCTTTTTCTT TCCGGGATTT

201 TTATACCCGC AGGATTAAGC GGATTTATCC TGCCTTTATT GCGGCCGTGT

251 CGCTGGCTTC GGTGATTGCC TCTCAAATCT TCCTTTACGA AGATTTCAAC

301 CAAATGCGGA AAACCGTGGA GCTTTCTGCG GTTTTCTTGT CCAATATTTA

351 TCTGGGGTTT CAGCAGGGGT ATTTCGATTT GAGTGCCGAC GAGAACCCCG

401 TACTGCATAT CTGGTCTTTG GCAGTAGAGG AACAGTATTA CCTCCTGTAT

451 CCCCTTTTGC TGATATTTTG CTGCAAAAAA ACCAAATCGC TACGGGTGCT

501 GCGTAACATC AGCATCATCC TGTTTTTGAT TTTGACTGCC TCATCGTTTT

551 TGCCAAGCGG GTTTTATACC GACATCCTCA ACCAACCCAA TACTTATTAC

601 CTTTCGACAC TGAGGTTTCC CGAGCTGTTG GCAGGTTCGC TGCTGGCGGT

651 TTACGGGCAA ACGCAAAACG GCAGACGGCA AACAGCAAAT GGAAAACGGC

701 AGTTGCTTTC ATCACTCTGC TTCGGCGCAT TGCTTGCCTG CCTGTTCGTG

751 ATTGACAAAC ACAATCCGTT TATCCCGGGA ATGACCCTGC TCCTTCCCTG

801 CCTGCTGACG GCACTGCTTA TCCGGAGTAT GCAATACGGG ACACTTCCGA

851 CCCGCATCCT GTCGGCAAGC CCCATCGTAT TTGTCGGCAA AATCTCTTAT

901 TCCCTATACC TGTACCATTG GATTTTTATT GCTTTCGCCC ATTACATTAC

951 AGGCGACAAA CAGCTCGGAC TGCCTGCCGT ATCGGCGGTT GCCGCGTTGA

1001 CGGCCGGATT TTCCCTGTTG AGTTATTATT TGATTGAACA GCCGCTTAGA

1051 AAACGGAAGA TGACCTTCAA AAAGGCATTT TTCTGCCTCT ATCTCGCCCC

1101 GTCCCTGATA CTTGTCGGTT ACAACCTGTA CGCAAGGGGG ATATTGAAAC

1151 AGGAACACCT CCGCCCGTTG CCCGGCGCGC CCCTTGCTGC GGAAAATCAT

1201 TTTCCGGAAA CCGTCCTGAC CCTCGGCGAC TCGCACGCCG GACACCTGAG

1251 GGGGTTTCTG GATTATGTCG GCAGCCGGGA AGGGTGGAAA GCCAAAATCC

1301 TGTCCCTCGA TTCGGAGTGT TTGGTTTGGG TAGATGAGAA GCTGGCAGAC

1351 AACCCGTTAT GTCGAAAATA CCGGGATGAA GTTGAAAAAG CCGAAGCCGT

1401 TTTCATTGCC CAATTCTATG ATTTGAGGAT GGGCGGCCAG CCTGTGCCGA

1451 GATTTGAAGC GCAATCCTTC CTAATACCCG GGTTCCCAGC CCGATTCAGG

1501 GAAACCGTCA AAAGGATAGC CGCCGTCAAA CCCGTCTATG TTTTTGCAAA

1551 CAACACATCA ATCAGCCGTT CGCCCCTGAG GGAGGAAAAA TTGAAAAGAT

1601 TTGCCGCAAA CCAATATCTC CGCCCCATTC AGGCTATGGG CGACATCGGC

1651 AAGAGCAATC AGGCGGTCTT TGATTTGATT AAAGATATTC CCAATGTGCA

1701 TTGGGTGGAC GCACAAAAAT ACCTGCCCAA AAACACGGTC GAAATATACG

1751 GCCGCTATCT TTACGGCGAC CAAGACCACC TGACCTATTT CGGTTCTTAT

1801 TATATGGGGC GGGAATTCCA CAAACACGAA CGCCTGCTTA AATCTTCCCA

1851 CGGCGGCGCA TTGCAGTAG

它对应于氨基酸序列<SEQ ID 830；ORF128-1>：

1 MQAVRYRPE I DGLRAVAVLS VMIFHLNNRW LPGGFLG VDI FFVISGFLIT

51 GIILSEIQNG SFSFRDFYTR RIKRIYPA FI AAVSLASVIA SQIFLYEDFN

101 QMRKTVELSA VFLSNIYLGF QQGYFDLSAD ENPVLHIWSL AVEEQYYLLY

151 PLLLIFCCKK TKSLRVLRN I SIILFLILTA SSFLPSGFYT DILNQPNTYY

201 LSTLRFPELL AGSLLAVYGQ TQNGRRQTAN GKRQ LLSSLC FGALLACLFV

251 IDKHNPF IPG MTLLLPCLLT ALLIRSMQYG TLPTRILSAS PIVFVGKISY

301 SLYLYHWIFI AFAHYITGDK QLG LPAVSAV AALTAGFSLL SYYLIEQPLR

351 KRKMTFKKAF FCLYLAPSLI LVGYNLYARG ILKQEHLRPL PGAPLAAENH

401 FPETVLTLGD SHAGHLRGFL DYVGSREGWK AKILSLDSEC LVWVDEKLAD

451 NPLCRKYRDE VEKAEAVFIA QFYDLRMGGQ PVPRFEAQSF LIPGFPARFR

501 ETVKRIAAVK PVYVFANNTS ISRSPLREEK LKRFAANQYL RPIQAMGDIG

551 KSNQAVFDLI KDIPNVHWVD AQKYLPKNTV EIYGRYLYGD QDHLTYFGSY

601 YMGREFHKHE RLLKSSHGGA LQ*

该氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的假设的整合膜蛋白HI0392(登录号为U32723)的同源性ORF128和HI0392在180个氨基酸的重叠区内显示出有52％的氨基酸相同性：

Orf128：1 VSLASVIASQIFLYEDFNQMRKTVELSAVFLSNIYLGFQQGYFDLSADENPVLHIWSLAV 60

++L S IAS IF+Y DFN++RKT+EL+ FLSN YLG QGYFDLSA+ENPVLHIWSLAV

HI0392：46 MALVSFIASAIFIYNDFNKLRKTIELAIAFLSNFYLGLTQGYFDLSANENPVLHIWSLAV 105

Orf128：61 EEQXXXXXXXXXIFCCKKTKSLRVLRNISIILFLILTASSFLPSGFYTDILNQPNTYYLS 120

E Q I KK + ++VL I++ILF IL A+SF+ + FY ++L+QPN YYLS

HI0392：106 EGQYYLIFPLILILAYKKFREVKVLFIITLILFFILLATSFVSANFYKEVLHQPNIYYLS 165

0rf128：121 TLRFPELLAGSLLAVYGQTQNGRRQTANGKRQLLSSLCFGALLACLFVIDKHNPFIPGMT 180

LRFPELL GSLLA+Y N + Q + +L+ L L +CLF+++ + FIPG+T

HI0392：166 NLRFPELLVGSLLAIYHNLSN-KVQLSKQVNNILAILSTLLLFSCLFLMNNNIAFIPGIT 224

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF128和脑膜炎奈瑟球菌菌株A的ORF(ORF128a)在244个氨基酸的重叠区内显示出有98.0％的相同性：

10 20 30

orf128.pep VSLASVIASQIFLYEDFNQMRKTVELSAVF

||||||||||||||||||||||||||||||

orf128a ILSEIQNGSFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTVELSAVF

60 70 80 90 100 110

40 50 60 70 80 90

orf128.pep LSNIYLGFQQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128a LSNIYLGFQQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISI

120 130 140 150 160 170

100 110 120 130 140 150

orf128.pep ILFLILTASSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGK

||||||||:|||||||||||||||||||||||||||||||||||||||||||||||||||

orf128a ILFLILTATSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGK

180 190 200 210 220 230

160 170 180 190 200 210

orf128.pep RQLLSSLCFGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPI

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128a RQLLSSLCFGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPI

240 250 260 270 280 290

220 230 240

orf128.pep VFVGKISYSLYLYHWIFIAFAPLIRGGKQLGLPA

||||||||||||||||||||| | | |||||||

orf128a VFVGKISYSLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKR

300 310 320 330 340 350

orf128a KMTFKKAFFCLYLAPSLILVGYNLYARGILKQEHLRPLPGAPLAAENHFPETVLTLGDSH

360 370 380 390 400 410

全长ORF128a核苷酸序列<SEQ ID 831>是：

1 ATGCAAGCTG TCCGATACAG ACCGGAAATT GACGGATTGC GGGCCGTCGC

51 CGTGCTATCC GTCATGATTT TCCACCTGAA TAACCGCTGG CTGCCCGGAG

101 GATTCCTGGG GGTGGACATT TTCTTTGTCA TCTCAGGATT CCTCATTACC

151 GGCATCATTC TTTCTGAAAT ACAGAACGGT TCTTTTTCTT TCCGGGATTT

201 TTATACCCGC AGGATTAAGC GGATTTATCC TGCTTTTATT GCGGCCGTGT

251 CGCTGGCTTC GGTGATTGCC TCTCAAATCT TCCTTTACGA AGATTTCAAC

301 CAAATGCGGA AAACCGTGGA GCTTTCTGCG GTTTTCTTGT CCAATATTTA

351 TCTGGGGTTT CAGCAGGGGT ATTTCGATTT GAGTGCCGAC GAGAACCCCG

401 TACTGCATAT CTGGTCTTTG GCAGTAGAGG AACAGTATTA CCTCCTGTAT

451 CCTCTTTTGC TGATATTTTG CTGCAAAAAA ACAAAATCGC TACGGGTGCT

501 GCGTAACATC AGCATCATCC TATTTCTGAT TTTGACTGCC ACATCGTTTT

551 TGCCAAGCGG GTTTTATACC GATATTCTCA ACCAACCCAA TACTTATTAC

601 CTTTCGACAC TGAGGTTTCC CGAGCTGTTG GCAGGTTCGC TGCTGGCGGT

651 TTACGGGCAA ACGCAAAACG GCAGACGGCA AACAGCAAAT GGAAAACGGC

701 AGTTGCTTTC ATCACTCTGC TTCGGCGCAT TGCTTGCCTG CCTGTTCGTG

751 ATTGACAAAC ACAATCCGTT TATCCCGGGA ATGACCCTGC TCCTTCCCTG

801 CCTGCTGACG GCACTGCTTA TCCGGAGTAT GCAATACGGG ACACTTCCGA

851 CCCGCATCCT GTCGGCAAGC CCCATCGTAT TTGTCGGCAA AATCTCTTAT

901 TCCCTATACC TGTACCATTG GATTTTTATT GCTTTCGCCC ATTACATTAC

951 AGGCGACAAA CAGCTCGGAC TGCCTGCCGT ATCGGCGGTT GCCGCGTTGA

1001 CGGCCGGATT TTCCCTGTTG AGTTATTATT TGATTGAACA GCCGCTTAGA

1051 AAACGGAAGA TGACCTTCAA AAAGGCATTT TTCTGCCTCT ATCTCGCCCC

1101 GTCCCTGATA CTTGTCGGTT ACAACCTGTA CGCAAGGGGG ATATTGAAAC

1151 AGGAACACCT CCGCCCGTTG CCCGGCGCGC CCCTTGCTGC GGAAAATCAT

1201 TTTCCGGAAA CCGTCCTGAC CCTCGGCGAC TCGCACGCCG GACACCTGCG

1251 GGGGTTTCTG GATTATGTCG GCAGCCGGGA AGGGTGGAAA GCCAAAATCC

1301 TGTCCCTCGA TTCGGAGTGT TTGGTTTGGG TAGATGAGAA GCTGGCAGAC

1351 AACCCGTTAT GTCGAAAATA CCGGGATGAA GTTGAAAAAG CCGAAGCCGT

1401 TTTCATTGCC CAATTCTATG ATTTGAGGAT GGGCGGCCAG CCCGTGCCGA

1451 GATTTGAAGC GCAATCCTTC CTAATACCCG GGTTCCCAGC CCGATTCAGG

1501 GAAACCGTCA AAAGGATAGC CGCCGTCAAA CCCGTCTATG TTTTTGCAAA

1551 CAACACATCA ATCAGCCGTT CGCCCCTGAG GGAGGAAAAA TTGAAAAGAT

1601 TTGCCGCAAA CCAATATCTC CGCCCCATTC AGGCTATGGG CGACATCGGC

1651 AAGAGCAATC AGGCGGTCTT TGATTTGATT AAAGATATTC CCAATGTGCA

1701 TTGGGTGGAC GCACAAAAAT ACCTGCCCAA AAACACGGTC GAAATATACG

1751 GCCGCTATCT TTACGGCGAC CAAGACCACC TGACCTATTT CGGTTCTTAT

1801 TATATGGGGC GGGAATTTCA CAAACACGAA CGCCTGCTTA AATCTTCTCG

1851 CGACGGCGCA TTGCAGTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 832>：

1 MQAVRYRPE I DGLRAVAVLS VMIFHLNNRW LPGGFLG VDI FFVISGFLIT

51 GIILSEIQNG SFSFRDFYTR RIKRIYPA FI AAVSLASVIA SQIFLYEDFN

101 QMRKTVELSA VFLSNIYLGF QQGYFDLSAD ENPVLHIWSL AVEEQYYLLY

151 PLLLIFCCKK TKSLRVLRN I SIILFLILTA TSFLPSGFYT DILNQPNTYY

201 LSTLRFPELL AGSLLAVYGQ TQNGRRQTAN GKRQ LLSSLC FGALLACLFV

251 IDKHNPF IPG MTLLLPCLLT ALLIRSMQYG TLPTRILSAS PIVFVGKISY

301 SLYLYHWIFI AFAHYITGDK QLG LPAVSAV AALTAGFSLL SYYLIEQPLR

351 KRKMTFKKAF FCLYLAPSLI LVGYNLYARG ILKQEHLRPL PGAPLAAENH

401 FPETVLTLGD SHAGHLRGFL DYVGSREGWK AKILSLDSEC LVWVDEKLAD

451 NPLCRKYRDE VEKAEAVFIA QFYDLRMGGQ PVPRFEAQSF LIPGFPARFR

501 ETVKRIAAVK PVYVFANNTS ISRSPLREEK LKRFAANQYL RPIQAMGDIG

551 KSNQAVFDLI KDIPNVHWVD AQKYLPKNTV EIYGRYLYGD QDHLTYFGSY

601 YMGREFHKHE RLLKSSRDGA LQ*

ORF128a和ORF128-1在622个氨基酸的重叠区内显示出有99.5％的相同性：

orf128a.pep MQAVRYRPEIDGLRAVAVLSVMIFHLNNRWLPGGFLGVDIFFVISGFLITGIILSEIQNG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 MQAVRYRPEIDGLRAVAVLSVMIFHLNNRWLPGGFLGVDIFFVISGFLITGIILSEIQNG

orf128a.pep SFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTVELSAVFLSNIYLGF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 SFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTVELSAVFLSNIYLGF

orf128a.pep QQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISIILFLILTA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 QQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISIILFLILTA

orf128a.pep TSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGKRQLLSSLC

:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 SSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGKRQLLSSLC

orf128a.pep FGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPIVFVGKISY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 FGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPIVFVGKISY

orf128a.pep SLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKRKMTFKKAF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 SLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKRKMTFKKAF

orf128a.pep FCLYLAPSLILVGYNLYARGILKQEHLRPLPGAPLAAENHFPETVLTLGDSHAGHLRGFL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 FCLYLAPSLILVGYNLYARGILKQEHLRPLPGAPLAAENHFPETVLTLGDSHAGHLRGFL

orf128a.pep DYVGSREGWKAKILSLDSECLVWVDEKLADNPLCRKYRDEVEKAEAVFIAQFYDLRMGGQ

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 DYVGSREGWKAKILSLDSECLVWVDEKLADNPLCRKYRDEVEKAEAVFIAQFYDLRMGGQ

orf128a.pep PVPRFEAQSFLIPGFPARFRETVKRIAAVKPVYVFANNTSISRSPLREEKLKRFAANQYL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 PVPRFEAQSFLIPGFPARFRETVKRIAAVKPVYVFANNTSISRSPLREEKLKRFAANQYL

orf128a.pep RPIQAMGDIGKSNQAVFDLIKDIPNVHWVDAQKYLPKNTVEIYGRYLYGDQDHLTYFGSY

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128-1 RPIQAMGDIGKSNQAVFDLIKDIPNVHWVDAQKYLPKNTVEIYGRYLYGDQDHLTYFGSY

orf128a.pep YMGREFHKHERLLKSSRDGALQX

||||||||||||||||: |||||

orf128-1 YMGREFHKHERLLKSSHGGALQX

与淋病奈瑟球菌的预计ORF的同源性

ORF128和淋病奈瑟球菌的预计ORF(ORF128ng)在244个氨基酸的重叠区内显示出有93.4％的相同性：

orf128.pep VSLASVIASQIFLYEDFNQMRKTVELSAVF 30

|||||||||||||||||||||||:|||:||

orf128ng ILSEIQNGSFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTIELSTVF 112

orf128.pep LSNIYLGFQQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISI 90

||||||||: ||||||||||||||||||||||||||||||||||| ||||||||||||||

orf128ng LSNIYLGFRLGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCYKKTKSLRVLRNISI 172

orf128.pep ILFLILTASSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGK 150

|||||||||||||:||||||||||||||||||||||||:||||||||||||||||| |||

orf128ng ILFLILTASSFLPAGFYTDILNQPNTYYLSTLRFPELLVGSLLAVYGQTQNGRRQTENGK 232

orf128.pep RQLLSSLCFGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPI 210

|||| ||||||||:||||||||:|||||:|||||||||||||||||||||||||||||||

orf128ng RQLLSLLCFGALLVCLFVIDKHDPFIPGITLLLPCLLTALLIRSMQYGTLPTRILSASPI 292

orf128.pep VFVGKISYSLYLYHWIFIAFAPLIRGGKQLGLPA 244

||||||||||||||||||||| | | |||||||

orf128ng VFVGKISYSLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKR 352

全长ORF128ng核苷酸序列<SEQ ID 833>是：

1 ATGCAAGCTG TCCGATACAG GCCTGAAATT GACGGATTGC GGGCCGTCGC

51 CGTGCTATCC GTCATTATTT TCCACCTGAA TAACCGCTGG CTGCCCGGAG

101 GATTCCTGGG GGTGGACATT TTCTTTGTCA TCTCGGGATT CCTCATTACC

151 AACATCATTC TTTCTGAAAT ACAGAACGGT TCTTTTTCTT TCCGGGATTT

201 TTATACCCGC AGGATTAAGC GGATTTATCC TGCTTTTATT GCGGCCGTGT

251 CCCTGGCTTC GGTGATTGCT TCTCAAATCT TCCTTTACGA AGATTTCAAC

301 CAAATGAGGA AAACCATAGA GCTTTCTACG GTTTTTTTGT CCAATATTTA

351 TTTGGGGTTC CGATTGGGGT ATTTCGATTT GAGTGCCGAC GAGAACCCCG

401 TACTGCATAT CTGGTCTTTG GCGGTAGAGG AACAGTATTA CCTCCTGTAT

451 CCTCTTTTGC TGATATTCTG TTACAAAAAA ACCAAATCAC TACGGGTGCT

501 GCGTAATATC AGCATCATCC TGTTTCTGAT TTTGACCGCA TCATCGTTTT

551 TGCCGGCCGG GTTTTATACC GACATCCTCA ACCAACCcaa TACTTATTAC

601 CTTTCGACAC TGAGGTTTCC CGAGCTGTTG GTGGGTTCGC TGTTGGCGGT

651 TTACGGGCAA ACGCAAAACG GCAGACGGCA AACAGAAAAT GGAAAACGGC

701 AGTTGCTTTC ATTACTCTGT TTCGGCGCat tgCTTGTCTG CCTGTTCGTG

751 ATCGACAAAC ACGATCCGTT TATCCCGGGA ATAACCCTGC TCCTTCCCTG

801 CCTGCTGACG GCGCTGCTTA TCCGGAGTAT GCAATACGGG ACACTTCCGA

851 CCCGCATCCT GTCGGCAAGC CCCATCGTAT TTGTCGGCAA AATCTCTTAT

901 TCCCTATACC TGTACCATTG GATTTTTATT GCCTTCGCCC ATTACATTAC

951 AGGCGACAAA CAGCTCGGAC TGCCTGCCGT ATCGGCGGTT GCCGCGTTGA

1001 CGGCCGGATT TTCCCTGTTG AGCTATTATT TGATTGAACA GCCGCTTAGA

1051 AAACGGAAGA TGACCTTCAA AAAGGCATTT TTCTGCCTTT ATCTCGCCCC

1101 GTCCCTGATG CTTGTCGGTT ACAACCTGTA TTCAAGAGGG ATATTGAAAC

1151 AGGAACACCT CCGCCCGCTG CCCGGCACGC CCGTTGCTGC GGAAAATAAT

1201 TTTCCGGAAA CCGTCTTGAC CCTCGGCGAC TCGCACGCCG GACACCTGCG

1251 GGGGTTTCTG GATTATGTCG GCGGCAGGGA AGGGTGGAAA GCTAAAATCC

1301 TGTCCCTCGA TTCGGAGTGT TTGGTTTGGG TGGATGAGAA GCTGGCAGAC

1351 AACCCGTTGT GCCGAAAATA CCGGGATGAA GTTGAAAAAG CCGAAGCTGT

1401 TTTCATTGCC CAATTCTATG ATTTGAGGAT GGGCGGCCAG CCCGTGCCGA

1451 GATTTGAAGC GCAATCCTTC CTGATACCCG GGTTCAAAGC CCGATTCAGG

1501 GAAACCGTCA AGAGGATAGC CGCCGTCAAA CCTGTATATG TTTTTGCAAA

1551 CAATACATCA ATCAGCCGTT CTCCCTTGAG GGAGGAAAAA TTGAAAAGAT

1601 TTGCTATAAA CCAATACCTC CGGCCTATTC GGGCTATGGG CGACATCGGC

1651 AAGAGCAATC AGGCGGTCTT TGATTTGGTT AAAGATATTC CCAATGTGCA

1701 TTGGGTGGAC GCACAAAAAT ACCTGCCCAA AAACACGGTC GAAATACACG

1751 GACGCTATCT TTACGGCGAC CAAGACCACC TGACCTATTT CGGTTCTTAT

1801 TATATGGGGC GGGAATTTCA CAAACACGAA CGCCTGCTCA AGCATTCCCG

1851 AGGCGGCGCA TTGCAGTAG

它编码的蛋白质具有氨基酸序列<SEQ ID 834>：

1 MQAVRYRPE I DGLRAVAVLS VIIFHLNNRW LPGGFLG VDI FFVISGFLIT

51 NIILSEIQNG SFSFRDFYTR RIKRIYPA FI AAVSLASVIA SQIFLYEDFN

101 QMRKTIELST VFLSNIYLGF RLGYFDLSAD ENPVLHIWSL AVEEQYYLLY

151 PLLLIFCYKK TKSLRVLRN I SIILFLILTA SSFLPAGFYT DILNQPNTYY

201 LSTLRFPELL VGSLLAVYGQ TQNGRRQTEN GKRQ LLSLLC FGALLVCLFV

251 IDKHDPF IPG ITLLLPCLLT ALLIRSMQYG TLPTRILSAS PIVFVGKISY

301 SLYLYHWIFI AFAHYITGDK QLG LPAVSAV AALTAGFSLL SYYLIEQPLR

351 KRKMTFKKAF FCLYLAPSLM LVGYNLYSRG ILKQEHLRPL PGTPVAAENN

401 FPETVLTLGD SHAGHLRGFL DYVGGREGWK AKILSLDSEC LVWVDEKLAD

451 NPLCRKYRDE VEKAEAVFIA QFYDLRMGGQ PVPRFEAQSF LIPGFKARFR

501 ETVKRIAAVK PVYVFANNTS ISRSPLREEK LKRFAINQYL RPIRAMGDIG

551 KSNQAVFDLV KDIPNVHWVD AQKYLPKNTV EIHGRYLYGD QDHLTYFGSY

601 YMGREFHKHE RLLKHSRGGA LQ*

ORF128ng和ORF128-1在622个氨基酸的重叠区内显示出有95.7％的相同性：

orf128-1.pep MQAVRYRPEIDGLRAVAVLSVMIFHLNNRWLPGGFLGVDIFFVISGFLITGIILSEIQNG

|||||||||||||||||||||:||||||||||||||||||||||||||||:|||||||||

orf128ng MQAVRYRPEIDGLRAVAVLSVIIFHLNNRWLPGGFLGVDIFFVISGFLITNIILSEIQNG

orf128-1.pep SFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTVELSAVFLSNIYLGF

|||||||||||||||||||||||||||||||||||||||||||||:|||:||||||||||

orf128ng SFSFRDFYTRRIKRIYPAFIAAVSLASVIASQIFLYEDFNQMRKTIELSTVFLSNIYLGF

orf128-1.pep QQGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCCKKTKSLRVLRNISIILFLILTA

:|||||||||||||||||||||||||||||||||||| ||||||||||||||||||||||

orf128ng RLGYFDLSADENPVLHIWSLAVEEQYYLLYPLLLIFCYKKTKSLRVLRNISIILFLILTA

orf128-1.pep SSFLPSGFYTDILNQPNTYYLSTLRFPELLAGSLLAVYGQTQNGRRQTANGKRQLLSSLC

|||||:||||||||||||||||||||||||:||||||||||||||||| |||||||| ||

orf128ng SSFLPAGFYTDILNQPNTYYLSTLRFPELLVGSLLAVYGQTQNGRRQTENGKRQLLSLLC

orf128-1.pep FGALLACLFVIDKHNPFIPGMTLLLPCLLTALLIRSMQYGTLPTRILSASPIVFVGKISY

|||||:||||||||:|||||:|||||||||||||||||||||||||||||||||||||||

orf128ng FGALLVCLFVIDKHDPFIPGITLLLPCLLTALLIRSMQYGTLPTRILSASPIVFVGKISY

orf128-1.pep SLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKRKMTFKKAF

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128ng SLYLYHWIFIAFAHYITGDKQLGLPAVSAVAALTAGFSLLSYYLIEQPLRKRKMTFKKAF

orf128-1.pep FCLYLAPSLILVGYNLYARGILKQEHLRPLPGAPLAAENHFPETVLTLGDSHAGHLRGFL

|||||||||:|||||||:||||||||||||||:|:||||:||||||||||||||||||||

orf128ng FCLYLAPSLMLVGYNLYSRGILKQEHLRPLPGTPVAAENNFPETVLTLGDSHAGHLRGFL

orf128-1.pep DYVGSREGWKAKILSLDSECLVWVDEKLADNPLCRKYRDEVEKAEAVFIAQFYDLRMGGQ

||||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf128ng DYVGGREGWKAKILSLDSECLVWVDEKLADNPLCRKYRDEVEKAEAVFIAQFYDLRMGGQ

orf128-1.pep PVPRFEAQSFLIPGFPARFRETVKRIAAVKPVYVFANNTSISRSPLREEKLKRFAANQYL

||||||||||||||| ||||||||||||||||||||||||||||||||||||||| ||||

orf128ng PVPRFEAQSFLIPGFKARFRETVKRIAAVKPVYVFANNTSISRSPLREEKLKRFAINQYL

orf128-1.pep RPIQAMGDIGKSNQAVFDLIKDIPNVHWVDAQKYLPKNTVEIYGRYLYGDQDHLTYFGSY

|||:|||||||||||||||:||||||||||||||||||||||:|||||||||||||||||

orf128ng RPIRAMGDIGKSNQAVFDLVKDIPNVHWVDAQKYLPKNTVEIHGRYLYGDQDHLTYFGSY

orf128-1.pep YMGREFHKHERLLKSSHGGALQX

|||||||||||||| |:||||||

orf128ng YMGREFHKHERLLKHSRGGALQX

610 620

另外，ORF218ng显示出与一种假设的流感嗜血菌蛋白同源：

sp|P43993|Y392_AEIN假设蛋白HI0392＞gi|1074385|pir||B64007假设蛋白HI0392-流感嗜血菌(Rd KW20菌株)＞gi|1573364(U32723)流感嗜血菌预计的编码区HI0392[流感嗜血菌]长度＝245

评分＝239位(604)，估计值＝3e-62

相同性＝124/225(55％)，阳性＝152/225(67％)，空隙＝1/225(0％)

询问：38 VDIFFVISGFLITNIILSEIQNGSFSFRDFYTRRIKRIYPXXXXXXXXXXXXXXXXFLYE 97

+DIFFVISGFLIT II++EIQ SFS + FYTRRIKRIYP F+Y

目标：1 MDIFFVISGFLITGIIITEIQQNSFSLKQFYTRRIKRIYPAFITVMALVSFIASAIFIYN 60

询问：98 DFNQMRKTIELSTVFLSNIYLGFRLGYFDLSADENPVLHIWSLAVEEQXXXXXXXXXIFC 157

DFN++RKTIEL+ FLSN YLG GYFDLSA+ENPVLHIWSLAVE Q I

目标：61 DFNKLRKTIELAIAFLSNFYLGLTQGYFDLSANENPVLHIWSLAVEGQYYLIFPLILILA 120

询问：158 YKKTKSLRVLRNISIILFLILTASSFLPAGFYTDILNQPNTYYLSTLRFPELLVGSLLAV 217

YKK + ++VL I++ILF IL A+SF+ A FY ++L+QPN YYLS LRFPELLVGSLLA+

目标：121 YKKFREVKVLFIITLILFFILLATSFVSANFYKEVLHQPNIYYLSNLRFPELLVGSLLAI 180

询问：218 YGQTQNGRRQTENGKRQLLSLLCFGALLVCLFVIDKHDPFIPGIT 262

Y N + Q +L++L L CLF+++ + FIPGIT

目标：181 YHNLSN-KVQLSKQVNNILAILSTLLLFSCLFLMNNNIAFIPGIT 224

该分析结果(包括鉴定出几个推定的跨膜结构域)提示脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例99

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 835>：

1 ..ATTATTTACG AATACCGCTG GATGTTTCTT TACGGCGCAC TGACGACCTT

51 GGGGCTGACG GTCGTGGCAA C.GCGGGCGG TTCGGTATTG GGTCTGTTGT

101 TGGCGTTGGC GCGCCTGATT CACTTGGAAA AAGCCGGTGC GCCGATGCGC

151 GTGCTGGCGT GGGCGTTGCG TAAAGTTTCG CTGCTGTATG TTACGCTGTT

201 CCGGGGTACG CCGCTGTTTG TGCAGATTGT GATTTGGGCG TATGTGTGGT

251 TTCCGTTTTT CGTC..

它对应于氨基酸序列<SEQ ID 836；ORF129>：

1 ..IIYEYRWMFL YGALTTLGLT VVAXAGGSVL GLLLALARLI HLEKAGAPMR

51 VLAWALRKVS LLYVTLFRGT PLFVQIVIWA YVWFPFFV..

进一步的工作揭示了其完整的核苷酸序列<SEQ ID 837>：

1 ATGGATTTTC GTTTTGACAT TATTTACGAA TACCGCTGGA TGTTTCTTTA

51 CGGCGCACTG ACGACCTTGG GGCTGACGGT CGTGGCAACG GCGGGCGGTT

101 CGGTATTGGG TCTGTTGTTG GCGTTGGCGC GCCTGATTCA CTTGGAAAAA

151 GCCGGTGCGC CGATGCGCGT GCTGGCGTGG GCGTTGCGTA AAGTTTCGCT

201 GCTGTATGTT ACGCTGTTCC GGGGTACGCC GCTGTTTGTG CAGATTGTGA

251 TTTGGGCGTA TGTGTGGTTT CCGTTTTTCG TCCATCCTTC AGACGGCATT

301 TTGGTCAGCG GCGAGGCGGC AATCGCGCTG CGTCGCGGAT ACGGGCCGCT

351 GATTGCCGGT TCTTTGGCAC TGATCGCCAA CTCGGGGGCG TATATCTGTG

401 AGATTTTCCG CGCGGGCATC CAGTCTATAG ACAAAGGACA GATGGAGGCG

451 GCGCGTTCTT TGGGGCTGAC CTATCCGCAG GCGATGCGCT ATGTGATTCT

501 GCCGCAGGCA TTGCGCCGCA TGCTGCCGCC TTTGGCGAGC GAGTTCATCA

551 CGCTCTTGAA AGACAGCTCG CTGCTGTCGG TCATTGCTGT GGCGGAGTTG

601 GCGTATGTTC AGAATACGAT TACGGGCCGG TATTCGGTTT ATGAAGAACC

651 GCTTTACACC GTCGCCCTGA TTTATCTGTT GATGACGACT TTCTTAGGCT

701 GGATATTCCT GCGTTTGGAA AAACGTTACA ATCCGCAACA CCGCTGA

它对应于氨基酸序列<SEQ ID 838；ORF129-1>：

1 MDFRFDIIYE YRWMFLYGAL TTLGLT VVAT AGGSVLGLLL ALARLIHLEK

51 AGAPMRVLAW ALRKVSLLYV TLFRGTP LFV QIVIWAYVWF PFFVHPSDGI

101 LVSGEAAIAL RRGYGP LIAG SLALIANSGA YICEIFRAGI QSIDKGQMEA

151 ARSLGLTYPQ AMRYVILPQA LRRMLPPLAS E FITLLKDSS LLSVIAVAEL

201 AYVQNTITGR YSVYEEPLYT VALIYLLMTT FLGWIFLRLE KRYNPQHR*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF129和脑膜炎奈瑟球菌菌株A的ORF(ORF129a)在88个氨基酸的重叠区内显示出有98.9％的相同性：

10 20 30 40 50

orf129.pep IIYEYRWMFLYGALTTLGLT VVAXAGGSVLGLLLALARLIHLEKAGAPMRVLAW

|||||||||||||||||||||||:||||||||||||||||||||||||||||||

orf129a MDFRFDIIYEYRWMFLYGALTTLGLT VVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW

10 20 30 40 50 60

60 70 80

orf129.pep ALRKVSLLYVTLFRGTP LFVQIVIWAYVWFPFFV

||||||||||||||||||||||||||||||||||

orf129a ALRKVSLLYVTLFRGTP LFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGP LIAG

70 80 90 100 110 120

orf129a SLALIANSGAYICEIFRAGIQSIDKGQMEAARSLGLTYPQAMRYVILPQALRRMLPPLAS

130 140 150 160 170 180

全长ORF129a核苷酸序列<SEQ ID 839>是：

1 ATGGATTTTC GTTTTGACAT TATTTACGAA TACCGCTGGA TGTTTCTTTA

51 CGGCGCACTG ACGACCTTGG GGCTGACGGT CGTGGCGACG GCGGGCGGTT

101 CGGTATTGGG TCTGTTGTTG GCGTTGGCGC GCCTGATTCA CTTGGAAAAA

151 GCCGGTGCGC CGATGCGCGT GCTGGCGTGG GCGTTGCGTA AGGTTTCGCT

201 GCTGTATGTT ACGCTGTTCC GGGGTACGCC GCTGTTTGTG CAGATTGTGA

251 TTTGGGCGTA TGTGTGGTTT CCGTTTTTCG TCCATCCTTC AGACGGCATT

301 TTGGTTAGCG GCGAGGCGGC AATCGCGCTG CGTCGCGGAT ACGGGCCGCT

351 GATTGCCGGT TCTTTGGCAC TGATCGCCAA CTCGGGGGCG TATATCTGTG

401 AGATTTTCCG CGCGGGCATC CAGTCTATAG ACAAAGGACA GATGGAGGCG

451 GCGCGTTCTT TGGGGCTGAC CTATCCGCAG GCGATGCGCT ATGTGATTCT

501 GCCGCAGGCA TTGCGCCGTA TGCTGCCGCC TTTGGCGAGC GAGTTCATCA

551 CGCTCTTGAA AGACAGCTCG CTGCTGTCGG TCATTGCTGT GGCGGAGTTG

601 GCGTATGTTC AGAATACGAT TACGGGCCGG TATTCGGTTT ATGAAGAACC

651 GCTTTACACC GTCGCCCTGA TTTATCTGTT GATGACGACT TTCTTAGGCT

701 GGATATTCCT GCGTTTGGAA AAACGTTACA ATCCGCAACA CCGCTGA

它编码的蛋白质具有氨基酸序列<SEQ ID 840>：

1 MDFRFDIIYE YRWMFLYGAL TTLGLT VVAT AGGSVLGLLL ALARLIHLEK

51 AGAPMRVLAW ALRKVSLLYV TLFRGTP LFV QIVIWAYVWF PFFVHPSDGI

101 LVSGEAAIAL RRGYGP LIAG SLALIANSGA YICEIFRAGI QSIDKGQMEA

151 ARSLGLTYPQ AMRYVILPQA LRRMLPPLAS E FITLLKDSS LLSVIAVAEL

201 AYVQNTITGR YSVYEEPLYT VALIYLLMTT FLGWIFLRLE KRYNPQHR*

ORF129a和ORF129-1在248个氨基酸的重叠区内显示出有100.0％的相同性：

orf129a.pep MDFRFDIIYEYRWMFLYGALTTLGLTVVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129-1 MDFRFDIIYEYRWMFLYGALTTLGLTVVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW

orf129a.pep ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGPLIAG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129-1 ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGPLIAG

orf129a.pep SLALIANSGAYICEIFRAGIQSIDKGQMEAARSLGLTYPQAMRYVILPQALRRMLPPLAS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129-1 SLALIANSGAYICEIFRAGIQSIDKGQMEAARSLGLTYPQAMRYVILPQALRRMLPPLAS

orf129a.pep EFITLLKDSSLLSVIAVAELAYVQNTITGRYSVYEEPLYTVALIYLLMTTFLGWIFLRLE

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129-1 EFITLLKDSSLLSVIAVAELAYVQNTITGRYSVYEEPLYTVALIYLLMTTFLGWIFLRLE

orf129a.pep KRYNPQHRX

|||||||||

orf129-1 KRYNPQHRX

与淋病奈瑟球菌的预计ORF的同源性

ORF129和淋病奈瑟球菌的预计ORF(ORF129ng)在88个氨基酸的重叠区内显示出有98.9％的相同性：

orf129.pep IIYEYRWMFLYGALTTLGLTVVAXAGGSVLGLLLALARLIHLEKAGAPMRVLAW 54

|||||||||||||||||||||||:||||||||||||||||||||||||||||||

orf129ng MDFRFDIIYEYRWMFLYGALTTLGLTVVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW 60

orf129.pep ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFV 88

||||||||||||||||||||||||||||||||||

orf129ng ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFVILHTAFLGNAMRQSRRVPDKGRWIAG 120

预计ORF129ng核苷酸序列<SEQ ID 841>编码的蛋白质具有氨基酸序列<SEQ ID842>：

1 MDFRFDIIYE YRWMFLYGAL TTLGLT VVAT AGGSVLGLLL ALARLIHLEK

51 AGAPMRVLAW ALRKVSLLYV TLFRGTPLF V QIVIWAYVWF PFFVILHTAF

101 LGNAMRQSRR VPDKGRWIAG SLELNCQPRG RKTRGEFPPG ESNLGTEPRN

151 PLSMGQRRFP GCENWYPPQN FIKK*

进一步的工作揭示了下列淋球菌序列<SEQ ID 843>：

1 ATGGATTTTc gtTTTGACAT TATTTAcgaA TACCGCTGGA TGTTTCTTTA

51 CGGCGCACTG Acgaccttgg ggctgacggt cgtggcgacg gCGGGCGGTT

101 CGGtattggG TCTGTTGTTG GCGTTGGCGC GCCTGATTCA CTTGGAAAAA

151 GCCGGTGCGC CGATGCGCGT GCTGGCGTGG GCGTTGCGTA AGGTTTCGCT

201 GCTGTACGTT ACCCTGTTCC GGGGTACCCC GCTGTTTGTG CAGATTGTGA

251 TTTGGGCGTA TGTGTGGTTT CCGTTTTTCG TCCATCCTTC AGACGGCATT

301 TTGGTCAGCG GCGAGGCGGC AATCGCGCTG CGTCGCGGAT ACGGGCCGCT

351 GATTGCCGGT TCTTTGGCAC TGATCGCCAA CTCGGGGGCG TATATCTGTG

401 AGATTTTCCG CGCGGGCATC CAGTCTATAG ACAAAGGACA GATGGAGGCG

451 GCGTGTTCTT TGGGACTGAC CTATCCGCAG GCGATGCGCT ATGTGATTCT

501 GCCGCAGGCA TTGCGCCGTA TGCTGCCGCC TTTGGCGAGC GAGTTCATCA

551 CGCTCTTGAA AGACAGCTCG CTGCTGTCGG TCATTGCTGT GGCGGAGTTG

601 GCGTATGTTC AGAATACGAT TACGGGCCGG TATTCGGTTT ATGAAGAACC

651 GCTTTACACC GCCGCCCTGA TTTATCTGTT GATGACGACT TTCTTAGGCT

701 GGATATTCCT GCGTTTGGAA AAACGTTACA ATCCGCAACA CCGCTGA

它对应于氨基酸序列<SEQ ID 844；ORF129ng-1>：

1 MDFRFDIIYE YRWMFLYGAL TTLGLT VVAT AGGSVLGLLL ALARLIHLEK

51 AGAPMRVLAW ALRKVSLLYV TLFRGTP LFV QIVIWAYVWF PFFVHPSDGI

101 LVSGEAAIAL RRGYGP LIAG SLALIANSGA YICEIFRAGI QSIDKGQMEA

151 ARSLGLTYPQ AMRYVILPQA LRRMLPPLAS E FITLLKDSS LLSVIAVAEL

201 AYVQNTITGR YSVYEEPLYT VALIYLLMTT FL6WIFLRLE KRYNPQHR*

ORF129ng-1和ORF129-1在248个氨基酸的重叠区内显示出有99.2％的相同性：

orf129-1.pep MDFRFDIIYEYRWMFLYGALTTLGLTVVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129ng-1 MDFRFDIIYEYRWMFLYGALTTLGLTVVATAGGSVLGLLLALARLIHLEKAGAPMRVLAW

orf129-1.pep ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGPLIAG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf129ng-1 ALRKVSLLYVTLFRGTPLFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGPLIAG

orf129-1.pep SLALIANSGAYICEIFRAGIQSIDKGQMEAARSLGLTYPQAMRYVILPQALRRMLPPLAS

||||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||

orf129ng-1 SLALIANSGAYICEIFRAGIQSIDKGQMEAACSLGLTYPQAMRYVILPQALRRMLPPLAS

orf129-1.pep EFITLLKDSSLLSVIAVAELAYVQNTITGRYSVYEEPLYTVALIYLLMTTFLGWIFLRLE

||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||

orf129ng-1 EFITLLKDSSLLSVIAVAELAYVQNTITGRYSVYEEPLYTAALIYLLMTTFLGWIFLRLE

orf129-1.pep KRYNPQHRX

|||||||||

orf129ng-1 KRYNPQHRX

另外，ORF129ng-1与闪烁古生球菌的ABC转运蛋白同源：

2650409(AE001090)谷氨酰胺ABC转运蛋白，通透酶蛋白(glnP)[闪烁古生球菌]长度＝224

评分＝132位(329)，估计值＝2e-30

相同性＝86/178(48％)，阳性＝103/178(57％)，空隙＝18/178(10％)

询问：65 VSLLYVTLFRGTPLFVQIVIWAYVWFPFFVHPSDGILVSGEAAIALRRGYGPLIAGSLAL 124

+S YV + RGTPL VQI+I +F P+ GI + E A G +AL

目标：58 ISTAYVEVIRGTPLLVQILI------VYFGLPAIGINLQPEPA------------GIIAL 99

询问：125 IANSGAYICEIFRAGIQSIDKGQMEAACSLGLTYPQAMRYVILPQALRRMLPPLASEFIT 184

SGAYI EI RAGI+SI GQMEAA SLG+TY QAMRYVI PQA R +LP L +EFI

目标：100 SICSGAYIAEIYRAGIESIPIGQMEAARSLGMTYLQAMRYVIFPQAFRNILPALGNEFIA 159

询问：185 LLKDSSLLSVIAVAELAYVQNTITGRYSVYEEPLYTAALIYLLMTTFLGWIFLRLEKR 242

LLKDSSLLSVI++ EL V I P AL YL+MT L + +K+

目标：160 LLKDSSLLSVISIVELTRVGRQIVNTTFNAWTPFLGVALFYLMMTIPLSRLVAYSQKK 217

该分析结果(包括在两个蛋白中鉴定出几个跨膜结构域)提示脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例100

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 845>：

1 ..CTGAAAGAAT GCCGTCTGAA AGACCCTGTT TTTATTCCAA ATATCGTTTA

51 TAAGAACATC GCCATTACTT TCCTGCTCTT GCACGCCGCC GCCGAACTTT

101 GGCTGCCCGC GCAAACCGCC GGTTTTACCG CGCTCGCCGT CGGCTTCATC

151 CTGCTCGCCA AGCTGCGTGA gCTTCACCAT CACGAACTCT TACGTAAACA

201 cTACGTCCGC ACTTATTACy TGCTCCAACT CTTTGCCGCC GCAGgc

AgT

251 TTGTGGACAG GCGCGGCGwA ATTACAAAAC CTGCCCGCyT CCGCGCCCCT

301 GCACCTGATT ACCCTCGGCG GCATGATGGG CGGCGTGATG ATGGTGTGGc

351 TGACCGCCGG ACTGTGGCAC AGCGGCTTTA CCAAACTCGA CTACCCCAAA

401 CTCTGCCGCA TTGCCGTCCC CATCCTTTTC GCCGCCGCCG TCTCGCGCGC

451 TTTCTTGrTG AACGTGAACC CGrTATTTTT CATTACCGTT CCTGCGATTC

501 TGACCGCCGC CGTATTCGTA CTGTATCTTT TCrCGTTTAT ACCGATATTT

551 CGGGCGAATG CGTTTACAGA CGATCCGGAr TAr

它对应于氨基酸序列<SEQ ID 846；ORF130>：

1 ..LKECRLKDPV FIPNIVYKNI AITFLLLHAA AELWLPAQTA GFTALAVGFI

51 LLAKLRELHH HELLRKHYVR TYYLLQLFAA AGSLWTGAAX LQNLPASAPL

101 HLITLGGMMG GVMMVWLTAG LWHSGFTKLD YPKLCRIAVP ILFAAAVSRA

151 FLXNVNPXFF ITVPAILTAA VFVLYLFXFI PIFRANAFTD DPE*

进一步的工作揭示了完整的核苷酸序列<SEQ ID 847>：

1 ATGCGGCCGT TTTTCGTCGG CGCGGCGGTG CTTGCCATAC TCGGTGCGCT

51 GGTGTTTTTC ATCAACCCCG GTGCCATCGT CCTGCACCGC CAAATTTTCT

101 TGGAACTTAT GCTGCCGGCG GCATACGGCG GTTTTTTGAC TGCGGCTTTG

151 TTGGACTGGA CGGGTTTTTC GGGTAACCTG AAACCTGTCG CGACTTTGAT

201 GGCGGCATTA TTGCTCGCCG CATCCGCTAT ACTGCCCTTT TCGCCGCAAA

251 CTGCCTCGTT TTTCGTCGCC GCCTATTGGC TGGTGTTGCT GCTGTTCTGC

301 GCCCGGCTGA TTTGGCTAGA CCGAAACACC GACAACTTCG CCCTGCTAAT

351 GTTACTTGCC GCGTTCACTG TTTTTCAGAC GGCATATGCC GTCAGCGGCG

401 ATTTGAACCT GTTGCGCGCG CAAGTGCATC TAAATATGGC GGCGGTGATG

451 TTCGTATCCG TGCGCGTCAG TATTCTTTTG GGCGCGGAAG CCCTGAAAGA

501 ATGCCGTCTG AAAGACCCTG TTTTTATTCC AAATATCGTT TATAAAAACA

551 TCGCCATTAC TTTCCTGCTC TTGCACGCCG CCGCCGAACT TTGGCTGCCC

601 GCGCAAACCG CCGGTTTTAC CGCGCTCGCC GTCGGCTTCA TCCTGCTCGC

651 CAAGCTGCGT GAGCTTCACC ATCACGAACT CTTACGTAAA CACTACGTCC

701 GCACTTATTA CCTGCTCCAA CTCTTTGCCG CCGCAGGCTA TTTGTGGACA

751 GGCGCGGCGA AATTACAAAA CCTGCCCGCC TCCGCGCCCC TGCACCTGAT

801 TACCCTCGGC GGCATGATGG GCGGCGTGAT GATGGTGTGG CTGACCGCCG

851 GACTGTGGCA CAGCGGCTTT ACCAAACTCG ACTACCCCAA ACTCTGCCGC

901 ATTGCCGTCC CCATCCTTTT CGCCGCCGCC GTCTCGCGCG CTTTCTTGAT

951 GAACGTGAAC CCGATATTTT TCATTACCGT TCCTGCGATT CTGACCGCCG

1001 CCGTATTCGT ACTGTATCTT TTCACGTTTA TACCGATATT TCGGGCGAAT

1051 GCGTTTACAG ACGATCCGGA ATAA

它对应于氨基酸序列<SEQ ID 848；ORF130-1>：

1 MRPFFVGAAV LAILGALVFF INPGAIVLHR QIFLELMLPA AYGGFLTAAL

51 LDWTGFSGNL KP VATLMAAL LLAASAILPF SPQT ASFFVA AYWLVLLLFC

101 ARLIWLDRNT DNFA LLMLLA AFTVFQTAYA VSGDLNLLRA QVHLN MAAVM

151 FVSVRVSILL GAEALKECRL KDPVFIPNIV YKN IAITFLL LHAAAELWLP

201 AQ TAGFTALA VGFILLAKLR ELHHHELLRK HYVRTYYLLQ LFAAAGYLWT

251 GAAKLQNLPA SAPLH LITLG GMMGGVMMVW LTAGLWHSGF TKLDYPKLCR

301 IAVPILFAAA VSRAFLMNVN P IFFITVPAI LTAAVFVLYL FTFIPIFRAN

351 AFTDDPE*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF130和脑膜炎奈瑟球菌菌株A的ORF(ORF130a)在193个氨基酸的重叠区内显示出有94.3％的相同性：

10 20 30

orf130.pep LKECRLKDPVFIPNIVYKNIAITFLLLHAA

||||||||||||||:|||||||||||||||

orf130a LNLLRAQVHLNMAAVMFVSVRVSILLGAEALKECRLKDPVFIPNVVYKNIAITFLLLHAA

140 150 160 170 180 190

40 50 60 70 80 90

orf130.pep AELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQLFAAAGSLWTGAAX

|||||||||||||:|||||||||||||||||||||||||||||||||||||| |||||||

orf130a AELWLPAQTAGFTSLAVGFILLAKLRELHHHELLRKHYVRTYYLLQLFAAAGYLWTGAAK

200 210 220 230 240 250

100 110 120 130 140 150

orf130.pep LQNLPASAPLHLITLGGMMGGVMMVWLTAGLWHSGFTKLDYPKLCRIAVPILFAAAVSRA

||||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||

orf130a LQNLPASAPLHLITLGGMMGSVMMVWLTAGLWHSGFTKLDYPKLCRIAVPILFAAAVSRA

260 270 280 290 300 310

160 170 180 190

orf130.pep FLXNVNPXFFITVPAILTAAVFVLYLFXFIPIFRANAFTDDPEX

| ||||| ||||||||||||||||||::|:||||||||||||||

orf130a VLMNVNPIFFITVPAILTAAVFVLYLLTFVPIFRANAFTDDPEX

320 330 340 350

全长ORF130a核苷酸序列<SEQ ID 849>是：

1 ATGCGGCCGT TTTTCGTCGG CGCGGCGGTG CTTGCCATAC TCGGTGCGCT

51 GGTGTTTTTC ATCAACCCCG GTGCCATCGT CCTGCACCGC CAAATTTTCT

101 TGGAACTTAT GCTGCCGGCG GCATACGGCG GTTTTTTGAC TGCGGCTTTG

151 TTGGACTGGA CGGGTTTTTC GGGTAACCTG AAACCTGTCG CGACTTTGAT

201 GGCGGCATTA TTGCTCGCCG CATCCGCTAT ACTGCCCTTT TCGCCGCAAA

251 CTGCCTCGTT TTTCGTCGCC GCCTATTGGC TGGTGTTGCT GCTGTTCTGC

301 GCCCGGCTGA TTTGGCTAGA CCGAAACACC GACAACTTCG CCCTGCTAAT

351 GTTACTTGCC GCGTTCACTG TTTTTCAGAC GGCATATGCC GTCAGCGGCG

401 ATTTGAACCT GTTGCGCGCG CAAGTGCATC TAAATATGGC GGCGGTGATG

451 TTCGTATCCG TGCGCGTCAG TATTCTTTTG GGCGCGGAAG CCCTGAAAGA

501 ATGCCGTCTG AAAGACCCAG TATTCATCCC CAATGTCGTC TATAAAAACA

551 TCGCCATTAC CTTCCTGCTC CTGCACGCCG CCGCCGAACT TTGGCTGCCT

601 GCGCAAACCG CCGGTTTTAC CTCGCTCGCC GTCGGCTTTA TCCTGCTTGC

651 CAAGCTGCGT GAGCTTCACC ATCACGAACT CCTGCGCAAA CACTACGTCC

701 GCACTTATTA CCTGCTCCAA CTCTTTGCCG CCGCAGGCTA TTTGTGGACA

751 GGCGCGGCGA AATTACAAAA CCTGCCCGCC TCCGCGCCCC TGCACCTGAT

801 TACCCTCGGT GGCATGATGG GCAGCGTGAT GATGGTGTGG CTGACTGCCG

851 GACTGTGGCA CAGCGGCTTT ACCAAGCTCG ACTACCCGAA ACTCTGCCGC

901 ATCGCCGTCC CCATCCTNTT CGCCGCCGCC GTTTCGCGCG CTGTTTTAAT

951 GAACGTAAAC CCGATATTCT TCATCACCGT CCCCGCAATT CTGACCGCCG

1001 CCGTGTTCGT GCTTTACCTG CTGACATTCG TACCGATCTT TCGGGCGAAC

1051 GCGTTTACAG ACGATCCGGA ATAA

它编码的蛋白质具有氨基酸序列<SEQ ID 850>：

1 MRPFFVGAAV LAILGALVFF INPGAIVLHR QIFLELMLPA AYGGFLTAAL

51 LDWTGFSGNL KP VATLMAAL LLAASAILPF SPQT ASFFVA AYWLVLLLFC

101 ARLIWLDRNT DNFA LLMLLA AFTVFQTAYA VSGDLNLLRA QVHLN MAAVM

151 FVSVRVSILL GAEALKECRL KDPVFIPNVV YKN IAITFLL LHAAAELWLP

201 AQ TAGFTSLA VGFILLAKLR ELHHHELLRK HYVRTYYLLQ LFAAAGYLWT

251 GAAKLQNLPA SAPLH LITLG GMMGSVMMVW LTAGLWHSGF TKLDYPKLCR

301 IAVPILFAAA VSRAVLMNVN P IFFITVPAI LTAAVFVLYL LTFVPIFRAN

351 AFTDDPE*

ORF130a和ORF130-1在357个氨基酸的重叠区内显示出有98.3％的相同性：

orf130a.pep MRPFFVGAAVLAILGALVFFINPGAIVLHRQIFLELMLPAAYGGFLTAALLDWTGFSGNL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf130-1 MRPFFVGAAVLAILGALVFFINPGAIVLHRQIFLELMLPAAYGGFLTAALLDWTGFSGNL

orf130a.pep KPVATLMAALLLAASAILPFSPQTASFFVAAYWLVLLLFCARLIWLDRNTDNFALLMLLA

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf130-1 KPVATLMAALLLAASAILPFSPQTASFFVAAYWLVLLLFCARLIWLDRNTDNFALLMLLA

orf130a.pep AFTVFQTAYAVSGDLNLLRAQVHLNMAAVMFVSVRVSILLGAEALKECRLKDPVFIPNVV

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|

orf130-1 AFTVFQTAYAVSGDLNLLRAQVHLNMAAVMFVSVRVSILLGAEALKECRLKDPVFIPNIV

orf130a.pep YKNIAITFLLLHAAAELWLPAQTAGFTSLAVGFILLAKLRELHHHELLRKHYVRTYYLLQ

|||||||||||||||||||||||||||:||||||||||||||||||||||||||||||||

orf130-1 YKNIAITFLLLHAAAELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQ

orf130a.pep LFAAAGYLWTGAAKLQNLPASAPLHLITLGGMMGSVMMVWLTAGLWHSGFTKLDYPKLCR

||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||

orf130-1 LFAAAGYLWTGAAKLQNLPASAPLHLITLGGMMGGVMMVWLTAGLWHSGFTKLDYPKLCR

orf130a.pep IAVPILFAAAVSRAVLMNVNPIFFITVPAILTAAVFVLYLLTFVPIFRANAFTDDPE

|||||||||||||| |||||||||||||||||||||||||:||:|||||||||||||

orf130-1 IAVPILFAAAVSRAFLMNVNPIFFITVPAILTAAVFVLYLFTFIPIFRANAFTDDPE

与淋病奈瑟球菌的预计ORF的同源性

ORF130和淋病奈瑟球菌的预计ORF(ORF130ng)在193个氨基酸的重叠区内显示出有91.7％的相同性：

orf130.pep LKECRLKDPVFIPNIVYKNIAITFLLLHAA 30

||||||||||||||::||||||| ||||||

orf130ng LNLLRAQVHLNMAAVMFVSVRVSVLLGTETLKECRLKDPVFIPNVIYKNIAIT-LLLHAA 201

orf130.pep AELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQLFAAAGSLWTGAAX 90

|||||||||||||||||||||||||||||||||||||||||||||||||||| |||||||

orf130ng AELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQLFAAAGYLWTGAAK 261

orf130.pep LQNLPASAPLHLITLGGMMGGVMMVWLTAGLWHSGFTKLDYPKLCRIAVPILFAAAVSRA 150

|||||||||||||||||| |||||||||||||||||||||||||||||| ||||:|||||

orf130ng LQNLPASAPLHLITLGGMTGGVMMVWLTAGLWHSGFTKLDYPKLCRIAVSILFASAVSRA 321

orf130.pep FLXNVNPXFFITVPAILTAAVFVLYLFXFIPIFRANAFTDDPE 193

| |||| |||||| |||||||:|||::|:|||||||||||||

orf130ng VLMNVNPIFFITVPEILTAAVFMLYLLTFVPIFRANAFTDDPE 364

预计ORF130ng核苷酸序列<SEQ ID 851>编码的蛋白质具有氨基酸序列<SEQ ID852>：

1 MNKFFTHPMR PFFVGAAVLA ILGALVFFHQ PRRYHPAPPN FLGTYAAGCI

51 RRFFDYRFVG PDGFFRQPET CRYFDG GVVA CCGCFIAVFT ATCRIFRRRL

101 LAGVAAVLRL ADLARRQHRT LRSVDVTAAF TVFQTAYAVS GDLNLLRAQV

151 H LNMAAVMFV SVRVSVLLGT ETLKECRLKD P VFIPNVIYK NIAITLLLHA

201 AAELWLPAQ T AGFTALAVGF ILLAKLRELH HHELLRKHYV RTYYLLQLFA

251 AAGYLWTGAA KLQNLPASAP LHLITLGGMT GGVMMVWLTA GLWHSGFTKL

301 DYPKLCR IAV SILFASAVSR AVLMNVNPIF FITVPE ILTA AVFMLYLLTF

351 VPIFRANAFT DDPE*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 853>：

1 ATGCGCCCGT TTTTCGTCGG TGCGGCAGTA CTTGCCATAC TCGGTGCGTT

51 GGTGTTTTTT ATCAACCCCG GCGCTATCAT CCTGCACCGC CAAATTTTCT

101 TGGAACTTAT GCTGCCGGCT GCATACGGCG GTTTTTTGAC TACCGCTTTG

151 TTGGACCGGA CGGGTTTTTC AGGCAACCTG AAACCTGCCG CTACTTTGAT

201 GGCGGTGTTG TTGCTTGTTG CGGCTGTTTT ATTGCCGTTT TTACCGCAAC

251 TTGCCGCATT TTTCGTCGCC GCCTATTGGC TGGTGTTGCT GCTGTTCTGC

301 GCCTGGCTGA TTTGGCTCGA CCGCAACACC GACAACTTCG CTCTGTTGAT

351 GTTACTTGCC GCATTTACCG TTTTTCAGAC GGCCTATGCC GTCAGCGGCG

401 ATTTGAACTT ACTGCGCGCG CAAGTGCATT TGAATATGGC GGCGGTCATG

451 TTCGTATCCG TCCGCGTCAG CGTCCTTTTG GGCACGGAAA CCCTGAAAGA

501 ATGCCGTCTG AAAGACCCCG TATTCATCCC CAACGTTATC TATAAAAACA

551 TCGCCATCAC CCTGCTGCTG CACGCCGCCG CCGAACTTTG GCTGCCCGCG

601 CAAACCGCCG GTTTTACTGC GCTTGCCGTC GGCTTCATCC TGCTCGCCAA

651 GCTGCGCGAA CTGCACCATC ACGAACTCTT ACGCAAACAC TACGTCCGCA

701 CTTATTACCT GCTCCAGCTC TTTGCCGCCG CAGGTTATCT GTGGACAGGC

751 GCGGCGAAAC TGCAAAACCT GCCCGCCTCC GCGCCCCTGC ACCTGATTAC

801 CCTCGGCGGC ATGACGGGTG GCGTGATGAT GGTGTGGCTG ACTGCCGGAC

851 TGTGGCACAG CGGCTTTACC AAACTCGACT ACCCGAAACT CTGCCGCATC

901 GCCGTCTCCA TCCTTTTCGC CTCCGCCGTT TCGCGCGCTG TTTTAATGAA

951 CGTGAATCCG ATATTCTTCA TCACCGTTCC CGAGATTCTG ACCGCCGCCG

1001 TGTTCATGCT TTACCTGCTG ACGTTCGTAC CGATTTTTCG AGCGAACGCG

1051 TTTACAGACG ATCCGGAATA A

它对应于氨基酸序列<SEQ ID 854；ORF130ng-1>：

1 MRPF FVGAAV LAILGALVFF INPGAIILHR QIFLELMLPA AYGGFLTTAL

51 LDRTGFSGNL KPAA TLMAVL LLVAAVLLPF LPQ LAAFFVA AYWLVLLLFC

101 AWLIWLDRNT DNFA LLMLLA AFTVFQTAYA VSGDLNLLRA QVH LNMAAVM

151 FVSVRVSVLL GTETLKECRL KDP VFIPNVI YKNIAITLLL HAAAELWLPA

201 Q TAGFTALAV GFILLAKLRE LHHHELLRKH YVRTYYLLQL FAAAGYLWTG

251 AAKLQNLPAS APLHLITLGG MTGGVMMVWL TAGLWHSGFT KLDYPKLCR I

301 AVSILFASAV SRAVLMNVNP IFFITVPE IL TAAVFMLYLL TFVPIFRANA

351 FTDDPE*

ORF130ng-1和ORF130-1在357个氨基酸的重叠区内显示出有92.4％的相同性：

orf130-1.pep MRPFFVGAAVLAILGALVFFINPGAIVLHRQIFLELMLPAAYGGFLTAALLDWTGFSGNL

||||||||||||||||||||||||||:||||||||||||||||||||:||||||||||||

orf130ng-1 MRPFFVGAAVLAILGALVFFINPGAIILHRQIFLELMLPAAYGGFLTTALLDRTGFSGNL

orf130-1.pep KPVATLMAALLLAASAILPFSPQTASFFVAAYWLVLLLFCARLIWLDRNTDNFALLMLLA

||:|||||:|||:|:::||| || |:||||||||||||||| ||||||||||||||||||

orf130ng-1 KPAATLMAVLLLVAAVLLPFLPQLAAFFVAAYWLVLLLFCAWLIWLDRNTDNFALLMLLA

orf130-1.pep AFTVFQTAYAVSGDLNLLRAQVHLNMAAVMFVSVRVSILLGAEALKECRLKDPVFIPNIV

|||||||||||||||||||||||||||||||||||||:|||:|:||||||||||||||::

orf130ng-1 AFTVFQTAYAVSGDLNLLRAQVHLNMAAVMFVSVRVSVLLGTETLKECRLKDPVFIPNVI

orf130-1.pep YKNIAITFLLLHAAAELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQ

||||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||

orf130ng-1 YKNIAIT-LLLHAAAELWLPAQTAGFTALAVGFILLAKLRELHHHELLRKHYVRTYYLLQ

orf130-1.pep LFAAAGYLWTGAAKLQNLPASAPLHLITLGGMMGGVMMVWLTAGLWHSGFTKLDYPKLCR

|||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||

orf130ng-1 LFAAAGYLWTGAAKLQNLPASAPLHLITLGGMTGGVMMVWLTAGLWHSGFTKLDYPKLCR

orf130-1.pep IAVPILFAAAVSRAFLMNVNPIFFITVPAILTAAVFVLYLFTFIPIFRANAFTDDPEX

||| ||||:||||| ||||||||||||| |||||:|||:||:||||||||||||||||

orf130ng-1 IAVSILFASAVSRAVLMNVNPIFFITVPEILTAAVFMLYLLTFVPIFRANAFTDDPEX

实施例101

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 855>：

1 ATGGAAATTC GGGCAATAAA ATATACGGCA ATGGCTGCGT TGCTTGCATT

51 TACGGTTGCA GGCTGCCGGC TGGCGGGGTG GTATGAGTGT TCGTCCCTCA

101 CCGGCTGGTG TAAGCCGAGA AAACCGGCTG CCATCGATTT TTGGGATATT

151 GGCGGCGAGA GTCCGCCGTC TTTAGGGGAC TACGAGATAC CGCTTTCAGA

201 CGGCAATAGT TCCGTCAGGG CAAACGAATA TGAATCCGCA CAACAATCTT

251 ACTTTTACAG GAAAATAGGG AAGTTTGAAG C.TGCGGGCT GGATTGGCGT

301 ACGCGTGACG GCAAACCTTT GATTGAGACG TTCAAACAGG GAGGATTTGA

351 CTGCTTGGAA AAG..

它对应于氨基酸序列<SEQ ID 856；ORF131>：

1 MEIRAIKYTA MAALLAFTVA GCRLAGWYEC SSLTGWCKPR KPAAIDFWDI

51 GGESPPSLGD YEIPLSDGNS SVRANEYESA QQSYFYRKIG KFEXCGLDWR

101 TRDGKPLIET FKQGGFDCLE K..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 857>：

1 ATGGAAATTC GGGCAATAAA ATATACGGCA ATGGCTGCGT TGCTTGCATT

51 TACGGTTGCA GGCTGCCGGC TGGCGGGGTG GTATGAGTGT TCGTCCCTCA

101 CCGGCTGGTG TAAGCCGAGA AAACCGGCTG CCATCGATTT TTGGGATATT

151 GGCGGCGAGA GTCCGCCGTC TTTAGGGGAC TACGAGATAC CGCTTTCAGA

201 CGGCAATCGT TCCGTCAGGG CAAACGAATA TGAATCCGCA CAACAATCTT

251 ACTTTTACAG GAAAATAGGG AAGTTTGAAG CCTGCGGGCT GGATTGGCGT

301 ACGCGTGACG GCAAACCTTT GATTGAGACG TTCAAACAGG GAGGATTTGA

351 CTGCTTGGAA AAGCAGGGGT TGCGGCGCAA CGGTCTGTCC GAGCGCGTCC

401 GATGGTAA

它对应于氨基酸序列<SEQ ID 858；ORF131-1>：

1 MEIRAIKYTA MAALLAFTVA GCRLAGWYEC SSLTGWCKPR KPAAIDFWDI

51 GGESPPSLGD YEIPLSDGNR SVRANEYESA QQSYFYRKIG KFEACGLDWR

101 TRDGKPLIET FKQGGFDCLE KQGLRRNGLS ERVRW*

该氨基酸序列的计算机分析给出了下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF131和脑膜炎奈瑟球菌菌株A的ORF(ORF131a)在121个氨基酸的重叠区内显示出有95.0％的相同性：

10 20 30 40 50 60

orf131.pep MEIRAIKYTAMAALLAFTVAGCRLAGWYECSSLTGWCKPRKPAAIDFWDIGGESPPSLGD

|||||||||||||||||||||||||||||||||:|||||||||||||||||||||||| |

orf131a MEIRAIKYTAMAALLAFTVAGCRLAGWYECSSLSGWCKPRKPAAIDFWDIGGESPPSLED

10 20 30 40 50 60

70 80 90 100 110 120

orf131.pep YEIPLSDGNSSVRANEYESAQQSYFYRKIGKFEXCGLDWRTRDGKPLIETFKQGGFDCLE

||||||||| ||||||||||||||||||||||| ||||||||||||||||||| |||||:

orf131a YEIPLSDGNRSVRANEYESAQQSYFYRKIGKFEACGLDWRTRDGKPLIETFKQEGFDCLK

70 80 90 100 110 120

orf131.pep K

|

orf131a KQGLRRNGLSERVRWX

130

全长ORF131a核苷酸序列<SEQ ID 859>是：

1 ATGGAAATTC GGGCAATAAA ATATACGGCA ATGGCTGCGT TGCTTGCATT

51 TACGGTTGCA GGCTGCCGGT TGGCAGGTTG GTATGAGTGT TCGTCCCTGT

101 CCGGCTGGTG TAAGCCGAGA AAACCTGCCG CCATCGATTT TTGGGATATT

151 GGCGGCGAGA GTCCTCCGTC TTTAGAGGAC TACGAGATAC CGCTTTCAGA

201 CGGCAATCGT TCCGTCAGGG CAAACGAATA TGAATCCGCA CAACAATCTT

251 ACTTTTACAG GAAAATAGGG AAGTTTGAAG CCTGCGGGTT GGATTGGCGT

301 ACGCGTGACG GCAAACCTTT GATTGAGACG TTCAAACAGG AAGGTTTTGA

351 TTGTTTGAAA AAGCAGGGGT TGCGGCGCAA CGGTCTGTCC GAGCGCGTCC

401 GATGGTAA

它编码的蛋白质具有氨基酸序列<SEQ ID 860>：

1 MEIRAIKYTA MAALLAFTVA GCRLAGWYEC SSLSGWCKPR KPAAIDFWDI

51 GGESPPSLED YEIPLSDGNR SVRANEYESA QQSYFYRKIG KFEACGLDWR

101 TRDGKPLIET FKQEGFDCLK KQGLRRNGLS ERVRW*

ORF131a和ORF131-1在135个氨基酸的重叠区内显示出有97.0％的相同性：

orf131a.pep MEIRAIKYTAMAALLAFTVAGCRLAGWYECSSLSGWCKPRKPAAIDFWDIGGESPPSLED

|||||||||||||||||||||||||||||||||:|||||||||||||||||||||||| |

orf131a.pep YEIPLSDGNRSVRANEYESAQQSYFYRKIGKFEACGLDWRTRDGKPLIETFKQEGFDCLK

||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||:

orf131-1 YEIPLSDGNRSVRANEYESAQQSYFYRKIGKFEACGLDWRTRDGKPLIETFKQGGFDCLE

orf131a.pep KQGLRRNGLSERVRWX

||||||||||||||||

orf131-1 KQGLRRNGLSERVRWX

与淋病奈瑟球菌的预计ORF的同源性

ORF131和淋病奈瑟球菌的预计ORF(ORF131ng)121个氨基酸的重叠区内显示出有89.3％的相同性：

orf131.pep MEIRAIKYTAMAALLAFTVAGCRLAGWYECSSLTGWCKPRKPAAIDFWDIGGESPPSLGD 60

||||:||||| |||:||||||||||||||| ||:||||||||||||||||||||| || |

orf131ng MEIRVIKYTATAALFAFFVAGCRLAGWYECLSLSGWCKPRKPAAIDFWDIGGESPLSLED 60

orf131.pep YEIPLSDGNSSVRANEYESAQQSYFYRKIGKFEXCGLDWRTRDGKPLIETFKQGGFDCLE 120

||||||||| |||||||||||:||||||||||| |||||||||||||:| ||| ||||||

orf131ng YEIPLSDGNRSVRANEYESAQKSYFYRKIGKFEACGLDWRTRDGKPLVERFKQEGFDCLE 120

orf131.pep K 121

|

orf131ng KQGLRRNGLSERVRW 134

预计全长ORF131ng核苷酸序列<SEQ ID 861>编码的蛋白质具有氨基酸序列<SEQ ID 862>：

1 MEIRVIKYTA TAALFAFTVA GCRLAGWYEC LSLSGWCKPR KPAAIDFWDI

51 GGESPLSLED YEIPLSDGNR SVRANEYESA QKSYFYRKIG KFEACGLDWR

101 TRDGKPLVER FKQEGFDCLE KQGLRRNGLS ERVRW*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 863>：

1 ATGGAAATTC GGGTAATAAA ATATACGGCA ACGGCTGCGT TGTTTGCATT

51 TACGGTTGCA GGCTGCCGGC TGGCGGGGTG GTATGAGTGT TCGTCCTTGT

101 CCGGCTGGTG TAAGCCGAGA AAACCTGCCG CCATCGATTT TTGGGATATT

151 GGCGGCGAGA GtccgctGTC TTTAGAGGAC TACGAGATAC CGCTTTCAGA

201 CGGCAATCGT TCCGTCAGGG CAAACGAATA TGAATCCGCG CAAAAATCTT

251 ACTTTTATAG GAAAATAGGG AAGTTTGAAG CCTGCGGGTT GGATTGGCGT

301 ACGCGTGACG GCAAACCTTT GGTTGAGAGG TTCAAACAGG AAGGTTTCGA

351 CTGTTTGGAA AAGCAGGGGT TGCGGCGCAA CGGCCTGTCC GAGCGCGTCC

401 GATGGTAA

它对应于氨基酸序列<SEQ ID 864；ORF131ng-1>：

1 MEIRVIKYTA TAALFAFTVA GCRLAGWYEC SSLSGWCKPR KPAAIDFWDI

51 GGESPLSLED YEIPLSDGNR SVRANEYESA QKSYFYRKIG KFEACGLDWR

101 TRDGKPLVER FKQEGFDCLE KQGLRRNGLS ERVRW*

ORF131ng-1和ORF131-1在135个氨基酸的重叠区内显示出有92.6％的相同性：

orf131ng-1.pep MEIRVIKYTATAALFAFTVAGCRLAGWYECSSLSGWCKPRKPAAIDFWDIGGESPLSLED

||||:||||| |||:||||||||||||||||||:||||||||||||||||||||| || |

orf131-1 MEIRAIKYTAMAALLAFTVAGCRLAGWYECSSLTGWCKPRKPAAIDFWDIGGESPPSLGD

orf131ng-1.pep YEIPLSDGNRSVRANEYESAQKSYFYRKIGKFEACGLDWRTRDGKPLVERFKQEGFDCLE

|||||||||||||||||||||:|||||||||||||||||||||||||:| ||| ||||||

orf131-1 YEIPLSDGNRSVRANEYESAQQSYFYRKIGKFEACGLDWRTRDGKPLIETFKQGGFDCLE

orf131ng-1.pep KQGLRRNGLSERVRWX

||||||||||||||||

orf131-1 KQGLRRNGLSERVRWX

根据存在预计的原核细胞膜脂蛋白脂质连接位点的结果，预计脑膜炎奈瑟球菌和淋病奈瑟球菌的此蛋白质及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例102

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 865>

1 ATGAAACACA TCCATATTAT CGGTATCGGC GGCACGTTTA TGGGCGGGCT

51 TGCCGCCATT GCCAAAGAAG CGGGGTTTGA AGTCAGCGGT TGCGACGCGA

101 AGATGTATCC GCCGATGAGC ACCCAGCTCG AAGCCTTGGG TATAGACGTG

151 TATGAAGGCT TCGATGCCGC TCAGTTGGAC GAATTTAAAG CCGACGTTTA

201 CGTTATCGGC AATGTCGCCA AGCGCGGGAT GGATGTGGTT GAAGCGATTT

251 TGAACCTCGG CCTGCCtTAT ATtTcCGGCC CGCAATGGCT GTCGGAAAAC

301 GTGCTGCACC ATCATTGGGT ACTCGGTGTG GCGGGGACgC ACGGCAAAAC

351 GACCACCGCC TCCATGCTCG CATGGGTCTT GGAATATgCC GGCCTCGCGC

401 CGGGCTTCCT TATtGGCGGC GTACC.GGAA AATttCGGCG TTTCCGCCCG

451 CCTGCCGCAA ACGCCGCGCC AAGACCCGAA CAGCCAATCG CCGTTTTTcG

501 TCATCGAAGC CGACGAATAC GACACCGCCT TTtTCGACAA ACGTTCTAAA

551 TtCGTGCATT ACCGTCCGCG TACCGCCGTG TTGAACAATC TGGAATTCGA

601 CCACGCCGAC ATCTTTGCCG ACTTGGGCGC GATACAGACc CAGTTCCACT

651 ACCTCGTGCG TACCGTGCCG TCTGAAGGCT TAATCGTCTG CAACGGACGG

701 CAGCAAAGCC TGCAAGATAC TTTGGACAAA GGCTGCTGGA CGCCGGTGGA

751 AAAATTCGGC ACGGAACACG GCTGGCA..

它对应于氨基酸序列<SEQ ID 866；ORF132>：

1 MKHIHIIGIG GTFMGGLAAI AKEAGFEVSG CDAKMYPPMS TQLEALGIDV

51 YEGFDAAQLD EFKADVYVIG NVAKRGMDVV EAILNLGLPY ISGPQWLSEN

101 VLHHHWVLGV AGTHGKTTTA SMLAWVLEYA GLAPGFLIGG VXGKFRRFRP

151 PAANAAPRPE QPIAVFRHRS RRIRHRLFRQ TFXIRALPSA YRRVEQSGIR

201 PRRHLCRLGR DTDPVPLPRA YRAVXRLNRL QRTAAKPARY FGQRLLDAGG

251 KIRHGTRLA..

进一步的工作揭示了完整的核苷酸序列<SEQ ID 867>：

1 ATGAAACACA TCCATATTAT CGGTATCGGC GGCACGTTTA TGGGCGGGCT

51 TGCCGCCATT GCCAAAGAAG CGGGGTTTGA AGTCAGCGGT TGCGACGCGA

101 AGATGTATCC GCCGATGAGC ACCCAGCTCG AAGCCTTGGG TATAGACGTG

151 TATGAAGGCT TCGATGCCGC TCAGTTGGAC GAATTTAAAG CCGACGTTTA

201 CGTTATCGGC AATGTCGCCA AGCGCGGGAT GGATGTGGTT GAAGCGATTT

251 TGAACCTCGG CCTGCCTTAT ATTTCCGGCC CGCAATGGCT GTCGGAAAAC

301 GTGCTGCACC ATCATTGGGT ACTCGGTGTG GCGGGGACGC ACGGCAAAAC

351 GACCACCGCC TCCATGCTCG CATGGGTCTT GGAATATGCC GGCCTCGCGC

401 CGGGCTTCCT TATTGGCGGC GTACCGGAAA ATTTCGGCGT TTCCGCCCGC

451 CTGCCGCAAA CGCCGCGCCA AGACCCGAAC AGCCAATCGC CGTTTTTCGT

501 CATCGAAGCC GACGAATACG ACACCGCCTT TTTCGACAAA CGTTCTAAAT

551 TCGTGCATTA CCGTCCGCGT ACCGCCGTGT TGAACAATCT GGAATTCGAC

601 CACGCCGACA TCTTTGCCGA CTTGGGCGCG ATACAGACCC AGTTCCACTA

651 CCTCGTGCGT ACCGTGCCGT CTGAAGGCTT AATCGTCTGC AACGGACGGC

701 AGCAAAGCCT GCAAGATACT TTGGACAAAG GCTGCTGGAC GCCGGTGGAA

751 AAATTCGGCA CGGAACACGG CTGGCAGGCC GGCGAAGCCA ATGCCGACGG

801 CTCGTTCGAC GTGTTGCTCG ACGGCAAAAC CGCCGGACGC GTCAAATGGG

851 ATTTGATGGG CAGGCACAAC CGCATGAACG CGCTCGCCGT CATTGCCGCC

901 GCGCGTCATG TCGGTGTCGA TATTCAGACC GCCTGCGAAG CCTTGGGCGC

951 GTTTAAAAAC GTCAAACGCC GGATGGAAAT CAAAGGCACG GCAAACGGCA

1001 TCACCGTTTA CGACGACTTC GCCCACCACC CGACCGCCAT CGAAACCACG

1051 ATTCAAGGTT TGCGCCAACG CGTCGGCGGC GCGCGCATCC TCGCCGTCCT

1101 CGAACCGCGT TCCAACACGA TGAAGCTGGG CACGATGAAG TCCGCCCTGC

1151 CTGTAAGCCT CAAAGAAGCC GACCAAGTGT TCTGCTACGC CGGCGGCGTG

1201 GACTGGGACG TCGCCGAAGC CCTCGCGCCT TTGGGCGGCA GGCTGAACGT

1251 CGGCAAAGAC TTCGATGCCT TCGTTGCCGA AATCGTGAAA AACGCCGAAG

1301 TAGGCGACCA TATTTTGGTG ATGAGCAACG GCGGTTTCGG CGGAATACAC

1351 GGAAAGCTGC TGGAAGCTTT GAGATAG

它对应于氨基酸序列<SEQ ID 868；ORF132-1>：

1 MKHIHIIGIG GTFMGGLAAI AKEAGFEVSG CDAKMYPPMS TQLEALGIDV

51 YEGFDAAQLD EFKADVYVIG NVAKRGMDVV EAILNLGLPY ISGPQWLSEN

101 VLHHHWVLGV AGTHGKTTTA SMLAWVLEYA GLAPGFLIGG VPENFGVSAR

151 LPQTPRQDPN SQSPFFVIEA DEYDTAFFDK RSKFVHYRPR TAVLNNLEFD

201 HADIFADLGA IQTQFHYLVR TVPSEGLIVC NGRQQSLQDT LDKGCWTPVE

251 KFGTEHGWQA GEANADGSFD VLLDGKTAGR VKWDLMGRHN RMNALAVIAA

301 ARHVGVDIQT ACEALGAFKN VKRRMEIKGT ANGITVYDDF AHHPTAIETT

351 IQGLRQRVGG ARILAVLEPR SNTMKLGTMK SALPVSLKEA DQVFCYAGGV

401 DWDVAEALAP LGGRLNVGKD FDAFVAEIVK NAEVGDHILV MSNGGFGGIH

451 GKLLEALR*

该氨基酸序列的计算机分析给出了下列结果：

与大肠杆菌的假设的o457蛋白(登录号为U14003)的同源性

ORF132和o457在140个氨基酸的重叠区内显示出有58％的氨基酸相同性：

Orf132：4 IHIIGIGGTFMGGLAAIAKEAGFEVSGCDAKMYPPMSTQLEALGIDVYEGFDAAQLDEFK 63

IHI+GI GTFMGGLA +A++ G EV+G DA +YPPMST LE GI++ +G+DA+QL+ +

o457：3 IHILGICGTFMGGLAMLARQLGHEVTGSDANVYPPMSTLLEKQGIELIQGYDASQLEP-Q 61

Orf132：64 ADVYVIGNVAKRGMDVVEAILNLGLPYISGPQWLSENVLHHHWVLGVAGTHGKTTTASML 123

D+ +IGN RG VEA+L +PY+SGPQWL + VL WVL VAGTHGKTTTA M

o457：62 PDLVIIGNAMTRGNPCVEAVLEKNIPYMSGPQWLHDFVLRDRWVLAVAGTHGKTTTAGMA 121

Orf132：124 AWVLEYAGLAPGFLIGGVXG 143

W+LE G PGF+IGGV G

o457：122 TWILEQCGYKPGFVIGGVPG 141

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF132和脑膜炎奈瑟球菌菌株A的ORF(ORF132a)在189个氨基酸的重叠区内显示出有74.6％的相同性：

10 20 30 40 50 60

orf132.pep MKHIHIIGIGGTFMGGLAAIAKEAGFEVSGCDAKMYPPMSTQLEALGIDVYEGFDAAQLD

||||||||||||||||:|||||||||| |||||||||||||||||||| ||||||:||||

orf132a MKHIHIIGIGGTFMGGIAAIAKEAGFEXSGCDAKMYPPMSTQLEALGIGVYEGFDTAQLD

10 20 30 40 50 60

70 80 90 100 110 120

orf132.pep EFKADVYVIGNVAKRGMDVVEAILNLGLPYISGPQWLSENVLHHHWVLGVAGTHGKTTTA

||||||||||||||||||||||| |||||||||||||:|| ||||| |||| ||||||||

orf132a EFKADVYVIGNVAKRGMDVVEAILNRGLPYISGPQWLAENXLHHHWXLGVAXTHGKTTTA

70 80 90 100 110 120

130 140 150 160

orf132.pep SMLAWVLEYAGLAPGFLIGGVXGKFR---RFRPPAANAAPRPEQPI----------AVFR

||||||||||||||||||||| :| |: | : | ::|: | |

orf132a SMLAWVLEYAGLAPGFXIGGVPENFSVSARL-PQTPRQDPNSQSPFFVIEADEYDTAFFD

130 140 150 160 170

170 180 190 200 210 220

orf132.pep HRSRRIRHRLFRQTFXIRALPSAYRRVEQSGIRPRRHLCRLGRDTDPVPLPRAYRAVXRL

:||: :::|

orf132a KRSKFVHYRPRTAVLNNLEFDHADIFADLGAIQTQFHHLVRTVPSEGLIVCNGRQQSLQD

180 190 200 210 220 230

全长ORF132a核苷酸序列<SEQ ID 869>是：

1 ATGAAACACA TCCACATTAT CGGTATCGGC GGCACGTTTA TGGGTGGGAT

51 TGCCGCCATT GCCAAAGAAG CAGGGTTTGA ANTCAGCGGT TGCGATGCGA

101 AGATGTATCC GCCGATGAGC ACCCAGCTCG AAGCCTTGGG CATAGGCGTG

151 TATGAAGGCT TCGACACCGC GCAGTTGGAC GAATTTAAAG CCGACGTTTA

201 CGTTATCGGC AATGTCGCCA AGCGCGGGAT GGATGTGGTT GAAGCGATTT

251 TGAACCGTGG GCTGCCTTAT ATTTCCGGCC CGCAATGGCT GGCTGAAAAC

301 NTGCTGCACC ATCATTGGNN ACTCGGCGTG GCGGNGACGC ACGGCAAAAC

351 GACCACCGCG TCTATGCTCG CGTGGGTTTT GGAATATGCC GGACTCGCAC

401 CGGGCTTCNT TATCGGCGGC GTACCGGAAA ACTTCAGCGT TTCCGCCCGC

451 CTGCCGCAAA CGCCGCGCCA AGACCCGAAC AGCCAATCGC CGTTTTTCGT

501 CATTGAAGCC GACGAATACG ACACCGCGTT TTTCGACAAA CGCTCCAAAT

551 TCGTGCATTA CCGTCCGCGT ACCGCCGTGT TGAACAATCT GGAATTCGAC

601 CACGCCGACA TCTTCGCCGA TTTGGGCGCG ATACAGACCC AGTTCCACCA

651 CCTCGTGCGT ACCGTGCCGT CTGAAGGCCT CATCGTCTGC AACGGACGGC

701 AGCAAAGCCT GCAAGACACT TTGGACAAAG GCTGCTGGAC GCCGGTGGAA

751 AAATTCGGCA CGGAACACGG CTGGCAGGCC GGCGAAGCCA ATGCCGATGG

801 CTCGTTCGAC GTGTTGCTTG ACGGCAAAAA AGCCGGACAC GTCGCTTGGA

851 GTTTGATGGG CGGACACAAC CGCATGAACG CGCTCGCNGT CATCGCCGCC

901 GCGCGTCATG CCGGAGTNGA CATTCAGACG GCCTGCGAAG CCTTGAGCAC

951 GTTTAAAAAC GTCAAACGCC GCATGGAAAT CAAAGGCACG GCAAACGGTA

1001 TCACCGTTTA CGACGACTTC GCCCACCATC CGACCGCTAT CGAAACCACG

1051 ATTCAAGGTT TGCGCCAGCG CGTCGGCGGC GCGCGCATCC TCGCCGTCCT

1101 CGAACCGCGT TCCAATACGA TGAAGCTGGG TACGATGAAA GCCGCCCTGC

1151 CCGCAAGCCT CAAAGAAGCC GACCAAGTGT TCTGNTACGC CGGCGGCGCG

1201 GACTGGGACG TTGCCGAAGC CCTCGCGCCT TTGGGCGGCA GGCTGCACGT

1251 CGGCAAAGAC TTCGATGCCT TCGTTGCCGA AATCGTGAAA AACGCCGAAG

1301 CAGGCGACCA TATTTTGGTG ATGAGCAACG GCGGTTTCGG CGGAATACAC

1351 ACCAAACTGC TGGACGCTTT GAGATAG

它编码的蛋白质具有氨基酸序列<SEQ ID 870>：

1 MKHIHIIGIG GTFMGGIAAI AKEAGFEXSG CDAKMYPPMS TQLEALGIGV

51 YEGFDTAQLD EFKADVYVIG NVAKRGMDVV EAILNRGLPY ISGPQWLAEN

101 XLHHHWXLGV AXTHGKTTTA SMLAWVLEYA GLAPGFXIGG VPENFSVSAR

151 LPQTPRQDPN SQSPFFVIEA DEYDTAFFDK RSKFVHYRPR TAVLNNLEFD

201 HADIFADLGA IQTQFHHLVR TVPSEGLIVC NGRQQSLQDT LDKGCWTPVE

251 KFGTEHGWQA GEANADGSFD VLLDGKKAGH VAWSLMGGHN RMNALAVIAA

301 ARHAGVDIQT ACEALSTFKN VKRRMEIKGT ANGITVYDDF AHHPTAIETT

351 IQGLRQRVGG ARILAVLEPR SNTMKLGTMK AALPASLKEA DQVFXYAGGA

401 DWDVAEALAP LGGRLHVGKD FDAFVAEIVK NAEAGDHILV MSNGGFGGIH

451 TKLLDALR*

ORF132a和ORF132-1在458个氨基酸的重叠区内显示出有93.9％的相同性：

orf132a.pep MKHIHIIGIGGTFMGGIAAIAKEAGFEXSGCDAKMYPPMSTQLEALGIGVYEGFDTAQLD

|||||||||||||||||||:||||||| |||||||||||||||||||| ||||||:||||

orf132-1 MKHIHIIGIGGTFMGGLAAIAKEAGFEVSGCDAKMYPPMSTQLEALGIDVYEGFDAAQLD

orf132a.pep EFKADVYVIGNVAKRGMDVVEAILNRGLPYISGPQWLAENXLHHHWXLGVAXTHGKTTTA

||||||||||||||||||||||||| |||||||||||:|| ||||| |||||||||||||

orf132-1 EFKADVYVIGNVAKRGMDVVEAILNLGLPYISGPQWLSENVLHHHWVLGVAGTHGKTTTA

orf132a.pep SMLAWVLEYAGLAPGFXIGGVPENFSVSARLPQTPRQDPNSQSPFFVIEADEYDTAFFDK

|||||||||||||||| ||||||||:||||||||||||||||||||||||||||||||||

orf132-1 SMLAWVLEYAGLAPGFLIGGVPENFGVSARLPQTPRQDPNSQSPFFVIEADEYDTAFFDK

orf132a.pep RSKFVHYRPRTAVLNNLEFDHADIFADLGAIQTQFHHLVRTVPSEGLIVCNGRQQSLQDT

||||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||

orf132-1 RSKFVHYRPRTAVLNNLEFDHADIFADLGAIQTQFHYLVRTVPSEGLIVCNGRQQSLQDT

orf132a.pep LDKGCWTPVEKFGTEHGWQAGEANADGSFDVLLDGKKAGHVAWSLMGGHNRMNALAVIAA

|||||||||||||||||||||||||||||||||||| ||:| |:||| ||||||||||||

orf132-1 LDKGCWTPVEKFGTEHGWQAGEANADGSFDVLLDGKTAGRVKWDLMGRHNRMNALAVIAA

orf132a.pep ARHAGVDIQTACEALSTFKNVKRRMEIKGTANGITVYDDFAHHPTAIETTIQGLRQRVGG

|||:|||||||||||::|||||||||||||||||||||||||||||||||||||||||||

orf132-1 ARHVGVDIQTACEALGAFKNVKRRMEIKGTANGITVYDDFAHHPTAIETTIQGLRQRVGG

orf132a.pep ARILAVLEPRSNTMKLGTMKAALPASLKEADQVFXYAGGADWDVAEALAPLGGRLHVGKD

||||||||||||||||||||:|||:||||||||| |:||||||||||||||||||:||||

orf132-1 ARILAVLEPRSNTMKLGTMKSALPVSLKEADQVFCYAGGVDWDVAEALAPLGGRLNVGKD

orf132a.pep FDAFVAEIVKNAEAGDHILVMSNGGFGGIHTKLLDALRX

|||||||||||:|||||||||||||||||| |||:||||

orf132-1 FDAFVAEIVKNAEVGDHILVMSNGGFGGIHGKLLEALRX

与淋病奈瑟球菌的预计ORF的同源性

ORF132和淋病奈瑟球菌的预计ORF(ORF132ng)在259个氨基酸的重叠区内显示出有89.6％的相同性：

orf132.pep MKHIHIIGIGGTFMGGLAAIAKEAGFEVSGCDAKMYPPMSTQLEALGIDVYEGFDAAQLD 60

||||||||||||||||:|||||||||:||||||||||||||||||||| |:||||||||:

orf132ng MKHIHIIGIGGTFMGGIAAIAKEAGFKVSGCDAKMYPPMSTQLEALGIGVHEGFDAAQLE 60

orf132.pep EFKADVYVIGNVAKRGMDVVEAILNLGLPYISGPQWLSENVLHHHWVLGVAGTHGKTTTA 120

||:||:|||||||:||||||||| |||||||||||||:||||||||||||||||||||||

orf132ng EFQADIYVIGNVARRGMDVVEAILNRGLPYISGPQWLAENVLHHHWVLGVAGTHGKTTTA 120

orf132.pep SMLAWVLEYAGLAPGFLIGGVXGKFRRFRPPAANAAPRPEQPIAVFRHRSRRIRHRLFRQ 180

||||||||||||||||||||| |||||||||:|||| |||| ||||||||||||||||||

orf132ng SMLAWVLEYAGLAPGFLIGGVPGKFRRFRPPTANAASRPEQQIAVFRHRSRRIRHRLFRQ 180

orf132.pep TFXIRALPSAYRRVEQSGIRPRRHLCRLGRDTDPVPLPRAYRAVXRLNRLQRTAAKPARY 240

|: |||| ||||||||||||||||| |||||||||| |||:|:: | :||||||||||||

orf132ng TLQIRALSPAYRRVEQSGIRPRRHLRRLGRDTDPVPPPRAHRTIRRPHRLQRTAAKPARY 240

orf132.pep FGQRLLDAGGKIRHGTRLA 259

|||||||||||||| ||||

orf132ng FGQRLLDAGGKIRHRTRLADW 261

预计ORF132ng核苷酸序列<SEQ ID 871>编码的蛋白质具有氨基酸序列<SEQ ID872>：

1 MKHIHIIGIG GTFMGGIAAI AKEAGFKVSG CDAKMYPPMS TQLEALGIGV

51 HEGFDAAQLE EFQADIYVIG NVARRGMDVV EAILNRGLPY ISGPQWLAEN

101 VLHHHWVLGV AGTHGKTTTA SMLAWVLEYA GLAPGFLIGG VPGKFRRFRP

151 PTANAASRPE QQIAVFRHRS RRIRHRLFRQ TLQIRALSPA YRRVEQSGIR

201 PRRHLRRLGR DTDPVPPPRA HRTIRRPHRL QRTAAKPARY FGQRLLDAGG

251 KIRHRTRLAD W*

进一步的工作揭示了下列淋球菌DNA序列<SEQ ID 873>：

1 ATGAAACACA TCCACATTAT CGGTATCGGC GGCACGTTTA TGGGCGGGAT

51 TGCCGCCATT GCCAAAGAAG CCGGGTTCAA AGTCAGCGGT TGCGACGCGA

101 AGATGTATCC GCCGATGAGC ACCCAGCTCG AAGCCTTGGG CATAGGCGTA

151 CACGAAGGCT TCGATGCCGC GCAGTTGGAA GAATTTCAAG CCGATATTTA

201 CGTCATCGGC AATGTCGCCA GGCGCGGGAT GGATGTGGTC GAGGCGATTT

251 TGAACCGTGG GCTGCCTTAT ATTTCCGGCC CGCAATGGCT GGCTGAAAac

301 GTGCtgcacc atcaTTGGgt ACTCGGCGTG GcagggaCGC ACGGcaaAac

351 gaccaCcGcg tCCATGCTCG CCTGGGTCTT GGAATATGCC GGACTCGCGC

401 CGGGCTTCCT CATCGGCGGt gtaccggaAA ATTTCGGCGT TTCCGCCCGC

451 CTACCGCAAA CGCCGCGTCA AGACCCGAAC AGCAAATCGC CGTTTTTCGT

501 CATCGAAGCC GACGAATACG ACACCGCCTT TTTCGACAAA CGCTCCAAAT

551 TCGTGCATTA TCGCCCGCGT ACCGCCGTGT TGAACAATCT GGAATTCGAC

601 CACGCCGACA TCTTCGCCGA CTTGGGCGCG ATACAGACCC AGTTCCACCA

651 CCTCGTGCGC ACCGTACCAT CCGAAGGCCT CATCGTCTGC AACGGACAGC

701 AGCAAAGCCT GCAAGATACT TTGGACAAAG GCTGCTGGAC GCCGGTGGAA

751 AAATTCGGCA CCGGACACGG CTGGCAGATT GGTGAAGTCA ATGCCGACGG

801 CTCGTTCGAC GTATTGCTTG ACGGCAAAAA AGCCGGACAC GTCGCATGGG

851 ATTTGATGGG CGGACACAAC CGCATGAACG CGCTCGCCGT CATCGCTGCC

901 GCACGCCATG CCGGAGTCGA TGTTCAGACG GCCTGCGAAG CCTTGGGTGC

951 GTTTAAAAAC GTCAAACGCC GCATGGAAAT CAAAGGCACG GCAAACGGCA1001 TCACCGTTTA CGACGATTTC GCCCACCACC CGACCGCCAT CGAAACCACG1051 ATTCAAGGTT TGCGCCAACG TGTCGGCGGC GCGCGCATCC TCGCCGTCCT1101 CGAGCCGCGT TCCAACACCA TGAAACTCGG CACGATGAAG TCCGCCCTGC1151 CCGCAAGCCT CAAAGAAGCC GACCAAGTGT TCTGCTACGC CGGCGGCGCG

1201 GACTGGGACG TTGCCGAAGC CCTCGCGCCT TTGGGCTGCA GGCTGCGCGT

1251 CGGTAAAGAT TTCGATACCT TCGTTGCCGA AATTGTGAAA AACGCCCGAA

1301 CCGGCGACCA TATTTTGGTG ATGAGCAACG GCGGTTTCGG CGGAATACAC

1351 ACCAAACTGC TGGACGCTTT GAGATAG

它对应于氨基酸序列<SEQ ID 874；ORF132ng-1>：

1 MKHIHIIGIG GTFMGGIAAI AKEAGFKVSG CDAKMYPPMS TQLEALGIGV

51 HEGFDAAQLE EFQADIYVIG NVARRGMDVV EAILNRGLPY ISGPQWLAEN

101 VLHHHWVLGV AGTHGKTTTA SMLAWVLEYA GLAPGFLIGG VPENFGVSAR

151 LPQTPRQDPN SKSPFFVIEA DEYDTAFFDK RSKFVHYRPR TAVLNNLEFD

201 HADIFADLGA IQTQFHHLVR TVPSEGLIVC NGQQQSLQDT LDKGCWTPVE

251 KFGTGHGWQI GEVNADGSFD VLLDGKKAGH VAWDLMGGHN RMNALAVIAA

301 ARHAGVDVQT ACEALGAFKN VKRRMEIKGT ANGITVYDDF AHHPTAIETT

351 IQGLRQRVGG ARILAVLEPR SNTMKLGTMK SALPASLKEA DQVFCYAGGA

401 DWDVAEALAP LGCRLRVGKD FDTFVAEIVK NARTGDHILV MSNGGFGGIH

451 TKLLDALR*

ORF132ng-1和ORF132-1在458个氨基酸的重叠区内显示出有93.2％的相同性：

orf132ng-1.pep MKHIHIIGIGGTFMGGIAAIAKEAGFKVSGCDAKMYPPMSTQLEALGIGVHEGFDAAQLE

|||||||||||||||||||:||||||:||||||||||||||||||||| |:||||||||:

orf132-1 MKHIHIIGIGGTFMGGLAAIAKEAGFEVSGCDAKMYPPMSTQLEALGIDVYEGFDAAQLD

orf132ng-1.pep EFQADIYVIGNVARRGMDVVEAILNRGLPYISGPQWLAENVLHHHWVLGVAGTHGKTTTA

||:||:|||||||:||||||||||| |||||||||||:||||||||||||||||||||||

orf132-1 EFKADVYVIGNVAKRGMDVVEAILNLGLPYISGPQWLSENVLHHHWVLGVAGTHGKTTTA

orf132ng-1.pep SMLAWVLEYAGLAPGFLIGGVPENFGVSARLPQTPRQDPNSKSPFFVIEADEYDTAFFDK

|||||||||||||||||||||||||||||||||||||||||:||||||||||||||||||

orf132-1 SMLAWVLEYAGLAPGFLIGGVPENFGVSARLPQTPRQDPNSQSPFFVIEADEYDTAFFDK

orf132ng-1.pep RSKFVHYRPRTAVLNNLEFDHADIFADLGAIQTQFHHLVRTVPSEGLIVCNGQQQSLQDT

||||||||||||||||||||||||||||||||||||:|||||||||||||||:|||||||

orf132-1 RSKFVHYRPRTAVLNNLEFDHADIFADLGAIQTQFHYLVRTVPSEGLIVCNGRQQSLQDT

orf132ng-1.pep LDKGCWTPVEKFGTGHGWQIGEVNADGSFDVLLDGKKAGHVAWDLMGGHNRMNALAVIAA

|||||||||||||| |||| ||:||||||||||||| ||:| |||| |||||||||||||

orf132-1 LDKGCWTPVEKFGTEHGWQAGEANADGSFDVLLDGKTAGRVKWDLMGRHNRMNALAVIAA

orf132ng-1.pep ARHAGVDVQTACEALGAFKNVKRRMEIKGTANGITVYDDFAHHPTAIETTIQGLRQRVGG

|||:|||:||||||||||||||||||||||||||||||||||||||||||||||||||||

orf132-1 ARHVGVDIQTACEALGAFKNVKRRMEIKGTANGITVYDDFAHHPTAIETTIQGLRQRVGG

orf132ng-1.pep ARILAVLEPRSNTMKLGTMKSALPASLKEADQVFCYAGGADWDVAEALAPLGCRLRVGKD

|||||||||||||||||||||:||||||||||||||:||||||||||||||| || ||||

orf132-1 ARILAVLEPRSNTMKLGTMKSALPVSLKEADQVFCYAGGVDWDVAEALAPLGGRLNVGKD

orf132ng-1.pep FDTFVAEIVKNARTGDHILVMSNGGFGGIHTKLLDALRX

||:|||||||||::|||||||||||||||| |||:||||

orf132-1 FDAFVAEIVKNAEVGDHILVMSNGGFGGIHGKLLEALRX

另外，ORF132ng-1与一种假设的大肠杆菌蛋白同源：

pir||S56459假设蛋白o457-大肠杆菌＞gi|537075(U14003)

ORF_o457[大肠杆菌]＞gi|1790680(AE000494)fbp-pmba基因间区中的假设的48.5kD蛋白[大肠杆菌]长度＝457

评分＝474位(1207)，估计值＝e-133

相同性＝249/439(56％)，阳性＝294/439(66％)，空隙＝13/439(2％)

询问：22 KEAGFKVSGCDAKMYPPMSTQLEALGIGVHEGFDAAQLEEFQADIYVIGNVARRGMDVVE 81

++ G +V+G DA +YPPMST LE GI + +G+DA+QLE Q D+ +IGN RG VE

目标：21 RQLGHEVTGSDANVYPPMSTLLEKQGIELIQGYDASQLEP-QPDLVIIGNAMTRGNPCVE 79

询问：82 AILNRGLPYISGPQWLAENVLHHHWVLGVAGTHGKTTTASMLAWVLEYAGLAPGFLIGGV 141

A+L + +PY+SGPQWL + VL WVL VAGTHGKTTTA M W+LE G PGF+IGGV

目标：80 AVLEKNIPYMSGPQWLHDFVLRDRWVLAVAGTHGKTTTAGMATWILEQCGYKPGFVIGGV 139

询问：142 PENFGVSARLPQTPRQDPNSKSPFFVIEADEYDTAFFDKRSKFVHYRPRTAVLNNLEFDH 201

P NF VSA L +S FFVIEADEYD AFFDKRSKFYHY PRT +LNNLEFDH

目标：140 PGNFEVSAHL---------GESDFFVIEADEYDCAFFDKRSKFVHYCPRTLILNNLEFDH 190

询问：202 ADIFADLGAIQTQFHHLVRTVPSEGLIVCNGQQQSLQDTLDKGCWTPVEKFGTGHGWQIG 261

ADIF DL AIQ QFHHLVR VP +G I+ +L+ T+ GCW+ E G WQ

目标：191 ADIFDDLKAIQKQFHHLVRIVPGQGRIIWPENDINLKQTMAMGCWSEQELVGEQGHWQAK 250

询问：262 EVNADGS-FDVLLDGKKAGHVAWDLMGGHNRMNALAVIAAARHAGVDVQTACEALGAFKN 320

++ D S ++VLLDG+K G V W L+G HN N L IAAARH GV A ALG+F N

目标：251 KLTTDASEWEVLLDGEKVGEVKWSLVGEHNMHNGLMAIAAARHVGVAPADAANALGSFIN 310

询问：321 VKRRMEIKGTANGITVYDDFAHHPTAIETTIQGLRQRYGG-ARILAVLEPRSNTMKLGTM 379

+RR+E++G ANG+TVYDDFAHHPTAI T+ LR +VGG ARI+AVLEPRSNTMK+G

目标：311 ARRRLELRGEANGYTVYDDFAHHPTAILATLAALRGKVGGTARIIAVLEPRSNTMKMGIC 370

询问：380 KSALPASLKEADQVF-CYAGGADWDVAEALAPLGCRLRVGKDFDTFVAEIVKNARTGDHI 438

K L SL AD+VF W VAE D DT +VK A+ GDHI

目标：371 KDDLAPSLGRADEVFLLQPAHIPWQVAEVAEACVQPAHWSGDVDTLADMVVKTAQPGDHI 430

询问：439 LVMSNGGFGGIHTKLLDAL 457

LVMSNGGFGGIH KLLD L

目标：431 LVMSNGGFGGIHQKLLDGL 449

如上所述，将ORF132-1(26.4kDa)克隆到pET和pGeX载体中并在大肠杆菌中表达。用SDS-PAGE分析蛋白表达和纯化的产物。图20A显示出His-融合蛋白亲和纯化的结果，图20B显示出GST-融合物在大肠杆菌中表达的结果。用纯化的His-融合蛋白免疫小鼠，将小鼠血清用于FACS分析(图20C)和ELISA(阳性结果)。这些实验确认ORF132是一种外露蛋白，且是一种有用的免疫原。

实施例103

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 875>

1 ..CCGGGCTATT ACGGCTCGGA TGACGAATTT AAGCGGGCAT TCGGAGAAAA

51 CTCGCCGACA TmCAAGAAAC ATTGCAACCG GAGCTGCGGG ATTTATGAAC

101 CCGTATTGAA AAAATACGGC AAAAAGCGCG CCAACAACCA TTCGGTCAGC

151 ATTAGTGCGG ACTTCGGCGA TTATTTCATG CCGTTCGCCA GCTATTCGCG

201 CACACACCGT ATGCCCAACA TCCAAGAAAT GTATTTTTCC CAAATCGGCG

251 ACTCCGGCGT TCACACCGCC TTAAAACCAG AGCGCGCAAA CACTTGGCAA

301 TTTGGCTTCr ATACCTATAA AAAAGGATTG TTAAAACAAG ATGATACATT

351 AGGATTAAAA CTGGTCGGCT ACCGCAGCCG CATCGACAAC TACATCCACA

401 ACGTTTACGG GAAATGGTGG GATTTGAACG GGGATATTCC GAGCTGGGTC

451 AGCAGCACCG GGCTTGCCTA CACCATCCAA CATCGCrATT TCAwAGACAA

501 AGTGCATCAA nnnnnnnnnn nnnnnnnnnn nnnnTACGAT TATGGGCGTT

551 TTTTCACCAA CCTTTCTTAC GCCTATCAAA AAAGCACGCA ACCGACCAAC

601 TTCAGCGATG CGAGCGAATC GCCCAACAAT GCGTCCAAAG AAGACCAACT

651 CAAACAAGGT TATGGGTTGA GCAGGGTTTC CGCCCTGCCG CGAGATTACG

701 GACGTTTGGA AGTCGGTACG CGCTGGTTGG GCAACAAACT GACTTTGGGC

751 GGCGCGATGC GCTATTTCGG CAAGAGCATC CGCGCGACGG CTGAAGAACG

801 CTATATCGAC GGCACCAACG GGGGAAATAC CAGCAATTTC CGGCAACTGG

851 GCAAGCGTTC CATCAAACAA ACCGAAACTC TTGCCCGCCA GCCTTTGATT

901 TTwGATTTTa ACGCCGCTTA CGAGCCGAAG AAAAACCTTA TTTTCCGCGC

951 CGAAGTCAAA AATCTGTTCG ACAGGCGTTA TATCGATCCG CTCGATGCGG

1001 GCAATGATGC GGCAAC.GAG CGTTATTACA GCTCGTTCGA CCCGAAAGAC

1051 AAGGACrrAG ACGTAACGTG TAATGCTGAT AAAACGTTGT GCaACGGCAA

1101 ATACGGCGGC ACAAGCAAAA GCGTATTGAC CAATTTTGCA CGCGGACGCA

1151 CCTTTTTgAT GACGATGAGC TACAAGTTTT AA

它对应于氨基酸序列<SEQ ID 876；ORF133>：

1 ..PGYYGSDDEF KRAFGENSPT XKKHCNRSCG IYEPVLKKYG KKRANNHSVS

51 ISADFGDYFM PFASYSRTHR MPNIQEMYFS QIGDSGVHTA LKPERANTWQ

101 FGFXTYKKGL LKQDDTLGLK LVGYRSRIDN YIHNVYGKWW DLNGDIPSWV

151 SSTGLAYTIQ HRXFXDKVHQ XXXXXXXXYD YGRFFTNLSY AYQKSTQPTN

201 FSDASESPNN ASKEDQLKQG YGLSRVSALP RDYGRLEVGT RWLGNKLTLG

251 GAMRYFGKSI RATAEERYID GTNGGNTSNF RQLGKRSIKQ TETLARQPLI

301 XDFNAAYEPK KNLIFRAEVK NLFDRRYIDP LDAGNDAAXE RYYSSFDPKD

351 KDXDVTCNAD KTLCNGKYGG TSKSVLTNFA RGRTFLMTMS YKF*

进一步的工作揭示了部分DNA序列<SEQ ID 877>：

1 GAGGCGCAGA TACAGGTTTT GGAAGATGTG CACGTCAAGG CGAAGCGCGT

51 ACCGAAAGAC AAAAAAGTGT TTACCGATGC GCGTGCCGTA TCGACCCGTC

101 AGGATATATT CAAATCCAGC GAAAACCTCG ACAACATCGT ACGCAGCATC

151 CCCGGTGCGT TTACACAGCA AGATAAAAGC TCGGGCATTG TGTCTTTGAA

201 TATTCGCGGC GACAGCGGGT TCGGGCGGGT CAATACGATG GTGGACGGCA

251 TCACGCAGAC CTTTTATTCG ACTTCTACCG ATGCGGGCAG GGCAGGCGGT

301 TCATCTCAAT TCGGTGCATC TGTCGACAGC AATTTTATTG CCGGACTGGA

351 TGTCGTCAAA GGCAGCTTCA GCGGCTCGGC AGGCATCAAC AGCCTTGCCG

401 GTTCGGCGAA TCTGCGGACT TTAGGCGTGG ATGACGTCGT TCAGGGCAAT

451 AATACCTACG GCCTGCTGCT AAAAGGTCTG ACCGGCACCA ATTCAACCAA

501 AGGTAATGCG ATGGCGGCGA TAGGTGCGCG CAAATGGCTG GAAAGCGGAG

551 CATCTGTCGG TGTGCTTTAC GGGCACAGCA GGCGCAGCGT GGCGCAAAAT

601 TACCGCGTGG GCGGCGGCGG GCAGCACATC GGAAATTTTG GCGCGGAATA

651 TTTGGAACGG CGCAAGCAGC GATATTTTGT ACAAGAGGGT GCTTTGAAAT

701 TCAATTCCGA CAGCGGAAAA TGGGAGCGGG ATTTACAAAG GCAACAGTGG

751 AAATACAAGC CGTATAAAAA TTACAACAAC CAAGAACTAC AaAAATACAT

801 CGAAGAGCAT GACAAAAGCT GGCGGGAAAA CCTg.CaCCG CAATACGACA

851 TTACCCCCAT CGATCCGTCC AGCCTGAAGC AGCAGTCGGC AGGCAATCTG

901 TTTAAATTGG AATACGACGG CGTATTCAAT AAATACACGG CGCAATTTCG

951 CGATTTAAAC ACCAAAATCG GCAGCCGCAA AATCATCAAC CGCAATTATC

1001 AGTTCAATTA CGGTTTGTCT TTGAACCCGT ATACCAACCT CAATCTGACC

1051 GCAGCCTACA ATTCGGGCAG GCAGAAATAT CCGAAAGGGT CGAAGTTTAC

1101 AGGCTGGGGG CTTTTAAAGG ATTTTGAAAC CTACAACAAC GCGAAAATCC

1151 TCGACCTCAA CAACACCGCC ACCTTCCGGC TGCCCCGCGA AACCGAGTTG

1201 CAAACCACTT TGGGCTTCAA TTATTTCCAC AACGAATACG GCAAAAACCG

1251 CTTTCCTGAA GAATTGGGGC TGTTTTTCGA CGGTCCTGAT CAGGACAACG

1301 GGCTTTATTC CTATTTGGGG CGGTTTAAGG GCGATAAAGG GCTGCTGCCC

1351 CAAAAATCAA CCATTGTCCA ACCGGCCGGC AGCCAATATT TCAACACGTT

1401 CTACTTCGAT GCCGCGCTCA AAAAAGACAT TTACCGCTTA AACTACAGCA

1451 CCAATACCGT CGGCTACCGT TTCGGCGGCG AATATACGGG CTATTACGGC

1501 TCGGATGACG AATTTAAGCG GGCATTCGGA GAAAACTCGC CGACATACAA

1551 GAAACATTGC AACCGGAGCT GCGGGATTTA TGAACCCGTA TTGAAAAAAT

1601 ACGGCAAAAA GCGCGCCAAC AACCATTCGG TCAGCATTAG TGCGGACTTC

1651 GGCGATTATT TCATGCCGTT CGCCAGCTAT TCGCGCACAC ACCGTATGCC

1701 CAACATCCAA GAAATGTATT TTTCCCAAAT CGGCGACTCC GGCGTTCACA

1751 CCGCCTTAAA ACCAGAGCGC GCAAACACTT GGCAATTTGG CTTCAATACC

1801 TATAAAAAAG GATTGTTAAA ACAAGATGAT ACATTAGGAT TAAAACTGGT

1851 CGGCTACCGC AGCCGCATCG ACAACTACAT CCACAACGTT TACGGGAAAT

1901 GGTGGGATTT GAACGGGGAT ATTCCGAGCT GGGTCAGCAG CACCGGGCTT

1951 GCCTACACCA TCCAACATCG CAATTTCAAA GACAAAGTGC ACAAACACGG

2001 TTTTGAGTTG GAGCTGAATT ACGATTATGG GCGTTTTTTC ACCAACCTTT

2051 CTTACGCCTA TCAAAAAAGC ACGCAACCGA CCAACTTCAG CGATGCGAGC

2101 GAATCGCCCA ACAATGCGTC CAAAGAAGAC CAACTCAAAC AAGGTTATGG

2151 GTTGAGCAGG GTTTCCGCCC TGCCGCGAGA TTACGGACGT TTGGAAGTCG

2201 GTACGCGCTG GTTGGGCAAC AAACTGACTT TGGGCGGCGC GATGCGCTAT

2251 TTCGGCAAGA GCATCCGCGC GACGGCTGAA GAACGCTATA TCGACGGCAC

2301 CAACGGGGGA AATACCAGCA ATTTCCGGCA ACTGGGCAAG CGTTCCATCA

2351 AACAAACCGA AACTCTTGCC CGCCAGCCTT TGATTTTTGA TTTTTACGCC

2401 GCTTACGAGC CGAAGAAAAA CCTTATTTTC CGCGCCGAAG TCAAAAATCT

2451 GTTCGACAGG CGTTATATCG ATCCGCTCGA TGCGGGCAAT GATGCGGCAA

2501 CGCAGCGTTA TTACAGCTCG TTCGACCCGA AAGACAAGGA CGAAGACGTA

2551 ACGTGTAATG CTGATAAAAC GTTGTGCAAC GGCAAATACG GCGGCACAAG

2601 CAAAAGCGTA TTGACCAATT TTGCACGCGG ACGCACCTTT TTGATGACGA

2651 TGAGCTACAA GTTTTAA

它对应于氨基酸序列<SEQ ID 878；ORF133-1>：

1 EAQIQVLEDV HVKAKRVPKD KKVFTDARAV STRQDIFKSS ENLDNIVRSI

51 PGAFTQQDKS SGIVSLNIRG DSGFGRVNTM VDGITQTFYS TSTDAGRAGG

101 SSQFGASVDS NFIAGLDVVK GSFSGSAGIN SLAGSANLRT LGVDDVVQGN

151 NTYGLLLKGL TGTNSTKGNA MAAIGARKWL ESGASVGVLY GHSRRSVAQN

201 YRVGGGGQHI GNFGAEYLER RKQRYFVQEG ALKFNSDSGK WERDLQRQQW

251 KYKPYKNYNN QELQKYIEEH DKSWRENLXP QYDITPIDPS SLKQQSAGNL

301 FKLEYDGVFN KYTAQFRDLN TKIGSRKIIN RNYQFNYGLS LNPYTNLNLT

351 AAYNSGRQKY PKGSKFTGWG LLKDFETYNN AKILDLNNTA TFRLPRETEL

401 QTTLGFNYFH NEYGKNRFPE ELGLFFDGPD QDNGLYSYLG RFKGDKGLLP

451 QKSTIVQPAG SQYFNTFYFD AALKKDIYRL NYSTNTVGYR FGGEYTGYYG

501 SDDEFKRAFG ENSPTYKKHC NRSCGIYEPV LKKYGKKRAN NHSVSISADF

551 GDYFMPFASY SRTHRMPNIQ EMYFSQIGDS GVHTALKPER ANTWQFGFNT

601 YKKGLLKQDD TLGLKLVGYR SRIDNYIHNV YGKWWDLNGD IPSWVSSTGL

651 AYTIQHRNFK DKVHKHGFEL ELNYDYGRFF TNLSYAYQKS TQPTNFSDAS

701 ESPNNASKED QLKQGYGLSR VSALPRDYGR LEVGTRWLGN KLTLGGAMRY

751 FGKSIRATAE ERYIDGTNGG NTSNFRQLGK RSIKQTETLA RQPLIFDFYA

801 AYEPKKNLIF RAEVKNLFDR RYIDPLDAGN DAATQRYYSS FDPKDKDEDV

851 TCNADKTLCN GKYGGTSKSV LTNFARGRTF LMTMSYKF*

该氨基酸序列的计算机分析给出了下列结果：

与流感嗜血菌的可能的TonB依赖性受体HI121(登录号为U32801)的同源性

ORF133和HI121在363个氨基酸的重叠区内显示出有57％的氨基酸相同性：

Orf133：31 IYEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTA 90

I EP+L K G K+A NHS ++SA+ DYFMPF +YSRTHRMPNIQEM+FSQ+ ++GV+TA

HI121： 563 INEPILHKSGHKKAFNHSATLSAELSDYFMPFFTYSRTHRMPNIQEMFFSQVSNAGVNTA 622

0rf133：91 LKPERANTWQFGFXTYKKGLLKQDDTLGLKLVGYRSRIDNYIHNVYGKWWDLNGDIPSWV 150

LKPE+++T+Q GF TYKKGL QDD LG+KLVGYRS I NYIHNVYG WW +P+W

HI121： 623 LKPEQSDTYQLGFNTYKKGLFTQDDVLGVKLVGYRSFIKNYIHNVYGVWW--RDGMPTWA 680

Orf133：151 SSTGLAYTIQHRXFXDKVHXXXXXXXXXYDYGRFFTNLSYAYQKSTQPTNFSDASESPNN 210

S G YTI H+ + V YD GRFF N+SYAYQ++ QPTN++DAS PNN

HI121： 681 ESNGFKYTIAHQNYKPIVKKSGYELEINYDMGRFFANVSYAYQRTNQPTNYADASPRPNN 740

Orf133：211 ASKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYID 270

AS+ED LKQGYGLSRVS LP+DYGRLE+GTRW KLTLG A RY+GKS RAT EE YI+

HI121： 741 ASQEDILKQGYGLSRVSMLPKDYGRLELGTRWFDQKLTLGLAARYYGKSKRATIEEEYIN 800

Orf133：271 GTNGGNTSNFRQLGKRSIKQTETLARQPLIXDFNAAYEPKKNLIFRAEVKNLFDRRYIDP 330

G+ + R+ ++K+TE + +QP+I D + +YEP K+LI +AEV+NL D+RY+DP

HI121：801 GSR-FKKNTLRRENYYAVKKTEDIKKQPIILDLHVSYEPIKDLIIKAEVQNLLDKRYVDP 859

Orf133：331 LDAGNDAAXERYYSSFDPKDKDXDVTCNADKTLCNGKYGGTSKSVLTNFARGRTFLMTMS 390

LDAGNDAA +RYYSS + + C D + C GG+ K+VL NFARGRT++++++

HI121：860 LDAGNDAASQRYYSSL-----NNSIECAQDSSAC----GGSDKTVLYNFARGRTYILSLN 910

Orf133：391 YKF 393

YKF

HI121：911 YKF 913

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF133和脑膜炎奈瑟球菌菌株A的ORF(ORF133a)在392个氨基酸的重叠区内显示出有90.8％的相同性：

10 20 30

orf133.pep PGYYGSDDEFKRAFGENSPTXKKHCNRSCGI

|||| ||||||||||||||| |||||:||||

orf133a FYFDAALKKDIYRLNYSTNTVGYRFGGXYTGYYXSDDEFKRAFGENSPTYXKHCNQSCGI

450 460 470 480 490 500

40 50 60 70 80 90

orf133.pep YEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTAL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133a YEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTAL

510 520 530 540 550 560

100 110 120 130 140 150

orf133.pep KPERANTWQFGFXTYKKGLLKQDDTLGLKLVGYRSRIDNYIHNVYGKWWDLNGDIPSWVS

|||||||||||| ||||||||||| ||||||||||||| ||||||||||||||:||||||

orf133a KPERANTWQFGFNTYKKGLLKQDDILGLKLVGYRSRIDXYIHNVYGKWWDLNGNIPSWVS

570 580 590 600 610 620

160 170 180 190 200 210

orf133.pep STGLAYTIQHRXFXDKVHQXXXXXXXXYDYGRFFTNLSYAYQKSTQPTNFSDASESPNNA

||||||||||| | ||||: ||| |||||||||||||||||||||||||||||

orf133a STGLAYTIQHRNFKDKVHKHGFELELNYDYXRFFTNLSYAYQKSTQPTNFSDASESPNNA

630 640 650 660 670 680

220 230 240 250 260 270

orf133.pep SKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDG

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133a SKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDX

690 700 710 720 730 740

280 290 300 310 320 330

orf133.pep TNGGNTSNFRQLGKRSIKQTETLARQPLIXDFNAAYEPKKNLIFRAEVKNLFDRRYIDPL

||| |||||||||||| ||||||||||| | ||||||| |||||||||||||||||||

orf133a TNGXXTSNFRQLGKRSIXQTETLARQPLIFDXYAAYEPKKXLIFRAEVKNLFDRRYIDPL

750 760 770 780 790 800

340 350 360 370 380 390

orf133.pep DAGNDAAXERYYSSFDPKDKDXDVTCNADKTLCNGKYGGTSKSVLTNFARGRTFLMTMSY

|||||||::|||||||||||| :|||| |:||||||||||||||||||||| |||:||||

orf133a DAGNDAATQRYYSSFDPKDKDEEVTCNDDNTLCNGKYGGTSKSVLTNFARGXTFLITMSY

810 820 830 840 850 860

orf133.pep KFX

|||

orf133a KFX

870

一部分ORF133a核苷酸序列<SEQ ID 879>是：

1 AAAGACAAAA AAGTGTTTAC CGATGCGCGT GCCGTATCGA CCCGTCAGGA

51 TATATTCAAA TCCANCGAAA ACCTCGACAA CATCGTACGC ANCATCCCCG

101 GTGCGTTTAC ACANCAANAT AAAAGCTCGG GCNTTGTGTC TTTGAATATT

151 CGCNGCGACA GCGGGTTCGG GCGGGTCAAT ACNATGGTNG ACGGCATCAC

201 NCANACCTTT TATTCGACTT CTACCGATGC GGGCAGGGCA GGCGGTTCAT

251 CTCAATTCGG TGCATCTGTC GACAGCAATT TTATNGCCGG ACTGGATGTC

301 GTCAAAGGCA GCTTCAGCGG CTCGGCAGGC ATCAACAGCC TTGCCGGTTC

351 GGCGAATCTG CGGACTTTAN GCGTGGATGA TGTCGTTCAG GGCAATANTA

401 CNTACGGCCT GCTGCTAAAA GGTCTGACCG GCACCAATTC AACCAAAGGT

451 AATGCGATGG CGGCGATAGG TGCGCGCAAA TGGCTGGAAA GCGGAGCATC

501 TGTCGGTGTG CTTTACGGGC ACAGCAGGCG CAGCGTGGCG CAAAATTACC

551 GCGTGGGCGG CGGCGGGCAG CACATCGGAA ATTTTGGCGC GGAATATCTG

601 GAACGACGCA AGCAACGATA TTTTGAGCAA GAAGGCGGGT TGAAATTCAA

651 TTCCAACAGC GGAAAATGGG AGCGGGATTT CCAAAAGTCG TACTGGAAAA

701 CCAAGTGGTA TCAAAAATAC GATGCCCCCC AAGAACTGCA AAAATACATC

751 GAAGGTCATG ATAAAAGCTG GCGGGAAAAC CTGGCGCCGC AATACGACAT

801 CACCCCCATC GATCCGTCCA GCCTGAAGCN GCAGTCGGCA GGCAACCTGT

851 TTAAATTGGA ATACGACGGC GTATTCAATA AATACACGGC GCAATTTCGC

901 GATTTAAACA CCAAAATCGG CAGCCGCAAA ATCATCAACC GCAATTATCA

951 ATTCAATTAC GGTTTGTCTT TGAACCCGTA TACCAACCTC AATCTGACCG

1001 CAGCCTACAA TTCGGGCAGG CAGAAATATC CGAAAGGGTC GAAGTTTACA

1051 GGCTGGGGGC TTTTNAAAGA TTTTGAAACC TACAACAACG CAAAAATCCT

1101 CGACCTCANC AACACCTCCA CCTTCCGGCT GCCCCGTGAA ACCGAGTTGC

1151 AAACCACTTT GGGCTTCAAT TATTTCCACA ACGAATACGG CAAAAACCGC

1201 TTTCCTGAAG AATTGGGGCT GTTTTTCGAC GGTCCGGATC ANGACAACGG

1251 GCTTTATTCC TATTTGGGGC GGTTTAAGGG CGATAAAGGG CTGCTGCCCC

1301 AAAAATCAAC CATTGTCCAA CCGGCCGGCA GCCAATATTT CAACACGTTC

1351 TACTTCGATG CCGCGCTCAA AAAAGACATT TACCGCTTAA ACTACAGCAC

1401 CAATACCGTC GGCTACCGTT TCGGCGGCNA ATATACGGGC TATTACNGCT

1451 CGGATGACGA ATTTAAGCGG GCATTCGGAG AAAACTCGCC GACATACANG

1501 AAACATTGCA ACCAGAGCTG CGGAATTTAT GAACCCGTAT TGAAAAAATA

1551 CGGCAAAAAG CGCGCCAACA ACCATTCGGT CAGCATTAGT GCGGACTTCG

1601 GCGATTATTT CATGCCGTTC GCCAGCTATT CGCGCACACA CCGTATGCCC

1651 AACATCCAAG AAATGTATTT TTCCCAAATC GGCGACTCCG GCGTTCACAC

1701 CGCCTTAAAA CCAGAGCGCG CAAACACTTG GCAATTTGGC TTCAATACCT

1751 ATAAAAAAGG ATTGTTAAAA CAAGATGATA TATTAGGATT AAAACTGGTC

1801 GGCTACCGCA GCCGCATCGA CNACTACATC CACAACGTTT ACGGGAAATG

1851 GTGGGATTTG AACGGGAATA TTCCGAGCTG GGTCAGCAGC ACCGGGCTTG

1901 CCTACACCAT CCAACACCGC AATTTCAAAG ACAAAGTGCA CAAACACGGT

1951 TTTGAGTTGG AGCTGAATTA CGATTATNGG CGTTTTTTCA CCAACCTTTC

2001 TTACGCCTAT CAAAAAAGCA CGCAACCGAC CAACTTCAGC GATGCGAGCG

2051 AATCGCCCAA CAATGCGTCC AAAGAAGACC AACTCAAACA AGGTTATGGG

2101 TTGAGCAGGG TTTCCGCCCT GCCGCGAGAT TACGGACGTT TGGAAGTCGG

2151 TACGCGCTGG TTGGGCAACA AACTGACTTT GGGCGGCGCG ATGCGCTATT

2201 TCGGCAAGAG CATCCGCGCG ACGGCTGAAG AACGCTATAT CGACGNCACC

2251 AATGGGGNAN NTACCAGCAA TTTCCGGCAA CTGGGCAAGC GTTCCATCAN

2301 ACAAACCGAA ACCCTTGCCC GCCAGCCTTT GATTTTTGAT TTNTACGCCG

2351 CTTACGAGCC GAAGAAAAAN CTTATTTTCC GCGCCGAAGT CAAAAATCTG

2401 TTCGACAGGC GTTATATCGA TCCGCTCGAT GCGGGCAATG ATGCGGCAAC

2451 GCAGCGTTAT TACAGTTCGT TCGACCCGAA AGACAAGGAC GAAGAAGTAA

2501 CGTGTAATGA TGATAACACG TTATGCAACG GCAAATACGG CGGCACAAGC

2551 AAAAGCGTAT TGACCAATTT TGCACGCGGA CNCACCTTTT TGATAACGAT

2601 GAGCTACAAG TTTTAA

它编码的蛋白质具有(部分)氨基酸序列<SEQ ID 880>：

1 KDKKVFTDAR AVSTRQDIFK SXENLDNIVR XIPGAFTXQX KSSGXVSLNI

51 RXDSGFGRVN TMVDGITXTF YSTSTDAGRA GGSSQFGASV DSNFXAGLDV

101 VKGSFSGSAG INSLAGSANL RTLXVDDVVQ GNXTYGLLLK GLTGTNSTKG

151 NAMAAIGARK WLESGASVGV LYGHSRRSVA QNYRVGGGGQ HIGNFGAEYL

201 ERRKQRYFEQ EGGLKFNSNS GKWERDFQKS YWKTKWYQKY DAPQELQKYI

251 EGHDKSWREN LAPQYDITPI DPSSLKXQSA GNLFKLEYDG VFNKYTAQFR

301 DLNTKIGSRK IINRNYQFNY GLSLNPYTNL NLTAAYNSGR QKYPKGSKFT

351 GWGLXKDFET YNNAKILDLX NTSTFRLPRE TELQTTLGFN YFHNEYGKNR

401 FPEELGLFFD GPDXDNGLYS YLGRFKGDKG LLPQKSTIVQ PAGSQYFNTF

451 YFDAALKKDI YRLNYSTNTV GYRFGGXYTG YYXSDDEFKR AFGENSPTYX

501 KHCNQSCGIY EPVLKKYGKK RANNHSVSIS ADFGDYFMPF ASYSRTHRMP

551 NIQEMYFSQI GDSGVHTALK PERANTWQFG FNTYKKGLLK QDDILGLKLV

601 GYRSRIDXYI HNVYGKWWDL NGNIPSWVSS TGLAYTIQHR NFKDKVHKHG

651 FELELNYDYX RFFTNLSYAY QKSTQPTNFS DASESPNNAS KEDQLKQGYG

701 LSRVSALPRD YGRLEVGTRW LGNKLTLGGA MRYFGKSIRA TAEERYIDXT

751 NGXXTSNFRQ LGKRSIXQTE TLARQPLIFD XYAAYEPKKX LIFRAEVKNL

801 FDRRYIDPLD AGNDAATQRY YSSFDPKDKD EEVTCNDDNT LCNGKYGGTS

851 KSVLTNFARG XTFLITMSYK F*

ORF133a和ORF133-1在871个氨基酸的重叠区内显示出有94.3％的相同性：

10 20 30 40

orf133a.pep KDKKVFTDARAVSTRQDIFKSXENLDNIVRXIPGAFTXQXKS

||||||||||||||||||||| |||||||| |||||| | ||

orf133-1 EAQIQVLEDVHVKAKRVPKDKKVFTDARAVSTRQDIFKSSENLDNIVRSIPGAFTQQDKS

10 20 30 40 50 60

50 60 70 80 90 100

orf133a.pep SGXVSLNIRXDSGFGRVNTMVDGITXTFYSTSTDAGRAGGSSQFGASVDSNFXAGLDVVK

|| |||||| ||||||||||||||| |||||||||||||||||||||||||| |||||||

orf133-1 SGIVSLNIRGDSGFGRVNTMVDGITQTFYSTSTDAGRAGGSSQFGASVDSNFIAGLDVVK

70 80 90 100 110 120

110 120 130 140 150 160

orf133a.pep GSFSGSAGINSLAGSANLRTLXYDDYVQGNXTYGLLLKGLTGTNSTKGNAMAAIGARKWL

||||||||||||||||||||| |||||||| |||||||||||||||||||||||||||||

orf133-1 GSFSGSAGINSLAGSANLRTLGVDDVVQGNNTYGLLLKGLTGTNSTKGNAMAAIGARKWL

130 140 150 160 170 180

170 180 190 200 210 220

orf133a.pep ESGASVGVLYGHSRRSVAQNYRVGGGGQHIGNFGAEYLERRKQRYFEQEGGLKFNSNSGK

|||||||||||||||||||||||||||||||||||||||||||||| |||:|||||:|||

orf133-1 ESGASVGVLYGHSRRSVAQNYRVGGGGQHIGNFGAEYLERRKQRYFVQEGALKFNSDSGK

190 200 210 220 230 240

230 240 250 260 270 280

orf133a.pep WERDFQKSYWKTKWYQKYDAPQELQKYIEGHDKSWRENLAPQYDITPIDPSSLKXQSAGN

||||:|:: || | |::|: |||||||| ||||||||| |||||||||||||| |||||

orf133-1 WERDLQRQQWKYKPYKNYNN-QELQKYIEEHDKSWRENLXPQYDITPIDPSSLKQQSAGN

250 260 270 280 290

290 300 310 320 330 340

orf133a.pep LFKLEYDGVFNKYTAQFRDLNTKIGSRKIINRNYQFNYGLSLNPYTNLNLTAAYNSGRQK

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 LFKLEYDGVFNKYTAQFRDLNTKIGSRKIINRNYQFNYGLSLNPYTNLNLTAAYNSGRQK

300 310 320 330 340 350

350 360 370 380 390 400

orf133a.pep YPKGSKFTGWGLXKDFETYNNAKILDLXNTSTFRLPRETELQTTLGFNYFHNEYGKNRFP

|||||||||||| |||||||||||||| ||:|||||||||||||||||||||||||||||

orf133-1 YPKGSKFTGWGLLKDFETYNNAKILDLNNTATFRLPRETELQTTLGFNYFHNEYGKNRFP

360 370 380 390 400 410

410 420 430 440 450 460

orf133a.pep EELGLFFDGPDXDNGLYSYLGRFKGDKGLLPQKSTIVQPAGSQYFNTFYFDAALKKDIYR

||||||||||| ||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 EELGLFFDGPDQDNGLYSYLGRFKGDKGLLPQKSTIVQPAGSQYFNTFYFDAALKKDIYR

420 430 440 450 460 470

470 480 490 500 510 520

orf133a.pep LNYSTNTVGYRFGGXYTGYYXSDDEFKRAFGENSPTYXKHCNQSCGIYEPVLKKYGKKRA

|||||||||||||| ||||| |||||||||||||||| ||||:|||||||||||||||||

orf133-1 LNYSTNTVGYRFGGEYTGYYGSDDEFKRAFGENSPTYKKHCNRSCGIYEPVLKKYGKKRA

480 490 500 510 520 530

530 540 550 560 570 580

orf133a.pep NNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTALKPERANTWQFGFN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 NNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTALKPERANTWQFGFN

540 550 560 570 580 590

590 600 610 620 630 640

orf133a.pep TYKKGLLKQDDILGLKLVGYRSRIDXYIHNVYGKWWDLNGNIPSWVSSTGLAYTIQHRNF

||||||||||| ||||||||||||| ||||||||||||:|||||||||||||||||||||

orf133-1 TYKKGLLKQDDTLGLKLVGYRSRIDNYIHNVYGKWWDLNGDIPSWVSSTGLAYTIQHRNF

600 610 620 630 640 650

650 660 670 680 690 700

orf133a.pep KDKVHKHGFELELNYDYXRFFTNLSYAYQKSTQPTNFSDASESPNNASKEDQLKQGYGLS

||||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf133-1 KDKVHKHGFELELNYDYGRFFTNLSYAYQKSTQPTNFSDASESPNNASKEDQLKQGYGLS

660 670 680 690 700 710

710 720 730 740 750 760

orf133a.pep RVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDXTNGXXTSNFRQLG

|||||||||||||||||||||||||||||||||||||||||||||| ||| ||||||||

orf133-1 RVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDGTNGGNTSNFRQLG

720 730 740 750 760 770

770 780 790 800 810 820

orf133a.pep KRSIXQTETLARQPLIFDXYAAYEPKKXLIFRAEVKNLFDRRYIDPLDAGNDAATQRYYS

|||| ||||||||||||| |||||||| ||||||||||||||||||||||||||||||||

orf133-1 KRSIKQTETLARQPLIFDFYAAYEPKKNLIFRAEVKNLFDRRYIDPLDAGNDAATQRYYS

780 790 800 810 820 830

830 840 850 860 870

orf133a.pep SFDPKDKDEEVTCNDDNTLCNGKYGGTSKSVLTNFARGXTFLITMSYKFX

|||||||||:|||| |:||||||||||||||||||||| |||:|||||||

orf133-1 SFDPKDKDEDVTCNADKTLCNGKYGGTSKSVLTNFARGRTFLMTMSYKFX

840 850 860 870 880

与淋病奈瑟球菌的预计ORF的同源性

ORF133和淋病奈瑟球菌的预计ORF(ORF133ng)在392个氨基酸的重叠区内显示出有92.3％的相同性：

orf133.pep PGYYGSDDEFKRAFGENSPTXKKHCNRSCGI 31

|||||::|||||||||||: |:||:|||:

orf133ng FYFDAALKKDIYRLNYSTNAINYRFGGEYTGYYGSENEFKRAFGENSPAYKEHCDPSCGL 560

orf133.pep YEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRMPNIQEMYFSQIGDSGVHTAL 91

||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||||

orf133ng YEPVLKKYGKKRANNHSVSISADFGDYFMPFAGYSRTHRMPNIQEMYFSQIGDSGVHTAL 620

orf133.pep KPERANTWQFGFXTYKKGLLKQDDTLGLKLVGYRSRIDNYIHNVYGKWWDLNGDIPSWVS 151

|||||||||||| ||||||||||| ||||||||||||||||||||||||||||||||||:

orf133ng KPERANTWQFGFNTYKKGLLKQDDILGLKLVGYRSRIDNYIHNVYGKWWDLNGDIPSWVG 680

orf133.pep STGLAYTIQHRXFXDKVHQXXXXXXXXYDYGRFFTNLSYAYQKSTQPTNFSDASESPNNA 211

||||||||:|| | ||||: |||||||||||||||||||||||||||||||||

orf133ng STGLAYTIRHRNFKDKVHKHGFELELNYDYGRFFTNLSYAYQKSTQPTNFSDASESPNNA 740

orf133.pep SKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDG 271

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133ng SKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDG 800

orf133.pep TNGGNTSNFRQLGKRSIKQTETLARQPLIXDFNAAYEPKKNLIFRAEVKNLFDRRYIDPL 331

|||||||| |||||||||||||||||||| || |||||||||||||||||||||||||||

orf133ng TNGGNTSNVRQLGKRSIKQTETLARQPLIFDFYAAYEPKKNLIFRAEVKNLFDRRYIDPL 860

orf133.pep DAGNDAAXERYYSSFDPKDKDXDVTCNADKTLCNGKYGGTSKSVLTNFARGRTFLMTMSY 391

|||||||::|||||||||||| ||||||||||||||||||||||||||||||||||||||

orf133ng DAGNDAATQRYYSSFDPKDKDEDYTCNADKTLCNGKYGGTSKSVLTNFARGRTFLMTMSY 920

orf133.pep KF 393

||

orf133ng KF 922

预计全长ORF133ng核苷酸序列<SEQ ID 881>编码的蛋白质具有氨基酸序列<SEQ ID 882>：

1 MRSSFRLKPI CFYLMGVMLY HHSYAEDAGR AGSEAQIQVL EDVHVKAKRV

51 PKDKKVFTDA RAVSTRQDYF KSGENLDNIV RSIPGAFTQQ DKSSGIVSLN

101 IRGDSGFGRV NTMVDGITQT FYSTSTDAGR AGGSSQFGAS VDSNFIAGLD

151 VVKGSFSGSA GINSLAGSAN LRTLGVDDVV QGNNTYGLLL KGLTGTNSTK

201 GNAMAAIGAR KWLESGASVG VLYGHSRRGV AQNYRVGGGG QHIGNFGEEY

251 LERRKQQYFV QEGGLKFNAG SGKWERDLQR QYWKTKWYKK YEDPQELQKY

301 IEEHDKSWRE NLAPQYDITP IDPSGLKQQS AGNLLNLEYD GVFNKYTAQF

351 RDLNTRIGSR KIINRNYQFN YGLSLNPYTN LNLTAAYNSG RQKYPKGAKF

401 TGWGLLKDFE TYNNAKILDL NNTATFRLPR ETELQTTLGF NYFHNEYGKN

451 RFPEELGLFF DGPDQDNGLY SYLGRFKGDK GLLPQKSTIV QPAGSQYFNT

501 FYFDAALKKD IYRLNYSTNA INYRFGGEYT GYYGSENEFK RAFGENSPAY

551 KEHCDPSCGL YEPVLKKYGK KRANNHSVSI SADFGDYFMP FAGYSRTHRM

601 PNIQEMYFSQ IGDSGVHTAL KPERANTWQF GFNTYKKGLL KQDDILGLKL

651 VGYRSRIDNY IHNVYGKWWD LNGDIPSWVG STGLAYTIRH RNFKDKVHKH

701 GFELELNYDY GRFFTNLSYA YQKSTQPTNF SDASESPNNA SKEDQLKQGY

751 GLSRVSALPR DYGRLEVGTR WLGNK LTLGG AMRYFGKSIR ATAEERYIDG

801 TNGGNTSNVR QLGKRSIKQT ETLARQPLIF DFYAAYEPKK NLIFRAEVKN

851 LFDRRYIDPL DAGNDAATQR YYSSFDPKDK DEDVTCNADK TLCNGKYGGT

901 SKSVLTNFAR GRTFLMTMSY KF*

还鉴定出一个变体，它由淋球菌DNA序列<SEQ ID 883>编码：

1 ATGAGATCTT CTTTCCGGTT GAAGCCGATT TGTTTTTATC TTATGGGTGT

51 TATGCTATAT CATCATAGTT ATGCCGAAGA TGCAGGGCGC GCGGGCAGCG

101 AGGCGCAGAT ACAGGTTTTG GAAGATGTGC ACGTCAAGGC GAAGCGCGTA

151 CCGAAAGACA AAAAAGTGTT TACCGATGCG CGTGCCGTAT CGACCCGTca

201 gGATGTGTTC AAATCCGGCG AAAACCTCGA CAACATCGTA CGCAGCATAC

251 CCGGTGCGTT TACACAGCAA GATAAAAGCT CGGGCATTGT GTCTTTGAAT

301 ATTCGCGGCG ACAGCGGGTT CGGGCGGGTC AATACGATGG TGGACGGCAT

351 CACGCAGACC TTTTATTCGA CTTCTACCGA TGCGGGCAGG GCAGGCGGTT

401 CATCTCAATT CGGTGCATCT GTCGACAGCA ATTTTATTGC CGGACTGGAT

451 GTCGTCAAAG GCAGCTTCAG CGGCTCGGCA GGCATCAACA GCCTTGCCGG

501 TTCGGCGAAT CTGCGGACTT TAGGCGTGGA TGACGTCGTT CAGGGCAATA

551 ATACCTACGG CCTGCTGCTA AAAGGTCTGA CCGGCACCAA TTCAACCAAA

601 GGTAATGCGA TGGCGGCGAT AGGTGCGCGC AAATGGCTGG AAAGCGGAGC

651 GTCTGTCGGT GTGCTTTACG GGCACAGCAG GCGCGGCGTG GCGCAAAATT

701 ACCGCGTGGG CGGCGGCGGG CAGCACATCG GAAATTTTGG TGAAGAATAT

751 CTGGAACGGC GCAAACAGCA ATATTTTGTA CAAGAGGGTG GTTTGAAATT

801 CAATGCCGGC AGCGGAAAAT GGGAACGGGA TTTGCAAAGG CAATACTGGA

851 AAACAAAGTG GTATAAAAAA TACGAAGACC CCCAAGAACT GCAAAAATAC

901 ATCGAAGAGC ATGATAAAAG CTGGCGGGAA AACCTGGCGC CGCAATACGA

951 CATCACCCCC ATCGATCCGT CCGGCCTGAA GCAGCAGTCG GCAGGCAATC

1001 TGTTTAAATT GGAATACGAC GGCGTATTCA ATAAATACAC GGCGCAATTT

1051 CGCGATTTAA ACACCAGAAT CGGCAGCCGC AAAATCATCA ACCGCAATTA

1101 TCAATTCAAT TACGGTTTGT CTTTGAACCC GTATACCAAC CTCAATCTGA

1151 CCGCAGCCTA CAATTCGGGC AGGCAGAAAT ATCCGAAAGG GGCGAAGTTT

1201 ACAGGCTGGG GGCTTTTAAA AGATTTTGAA ACCTACAACA ACGCGAAAAT

1251 CCTCGACCTC AACAACACCG CCACCTTCCG GCTGCCCCGC GAAACCGAGT

1301 TGCAAACCAC TTTGGGCTTC AATTATTTCC ACAACGAATA CGGCAAAAAC

1351 CGCTTTCCTG AAGAATTGGG GCTGTTTTTC GACGGTCCTG ATCAGGACAA

1401 CGGGCTTTAT TCCTATTTGG GGCGGTTTAA GGGCGATAAA GGGCTGTTGC

1451 CTCAAAAATC AACCATTGTC CAACCGGCCG GCAGCCAATA TTTCAACACG

1501 TTCTACTTCG ATGCCGCGCT CAAAAAAGAC ATTTACCGCT TAAACTACAG

1551 CACCAATGCA ATCAACTACC GTTTCGGCGG CGAATATACG GGCTATTACG

1601 GCTCGGAAAA CGAATTTAAG CGGGCATTCG GAGAAAACTC GCCGGCATAC

1651 AAGGAACATT GCGACCCGAG CTGCGGGCTT TATGAACCCG TATTGAAAAA

1701 ATACGGCAAA AAGCGCGCCA ACAACCATTC GGTCAGCATT AGTGCGGACT

1751 TCGGCGATTA TTTCATGCCG TTCGCCGGCT ATTCGCGCAC ACACCGTATG

1801 CCCAACATCC AAGAAATGTA TTTTTCCCAA ATCGGCGACT CCGGCGTTCA

1851 CACCGCCTTA AAACCAGAGC GCGCAAACAC TTGGCAATTT GGCTTCAATA

1901 CCTATAAAAA AGGATTGTTA AAACAAGATG ATATATTAGG ATTGAAACTG

1951 GTCGGCTACC GCAGCCGCAT TGACAACTAC ATCCACAACG TTTACGGGAA

2001 ATGGTGGGAT TTGAACGGGG ATATTCCGAG CTGGGTCGGC AGCACCGGGC

2051 TTGCCTACAC CATCCGACAC CGCAATTTCA AAGACAAAGT GCACAAACAC

2101 GGTTTTGAGC TGGAGCTGAA TTACGATTAT GGGCGTTTTT TCACCAACCT

2151 TTCTTACGCC TATCAAAAAA GCACGCAACC GACCAATTTC AGCGATGCGA

2201 GCGAATCGCC CAACAATGCC tccaaAGAAG ACCAACTCAA ACAAGGTTAT

2251 GGGCTGAGCA GGGTTTCCGC CCTGCCGCGA GATTACGGAC GTTTGGAAGT

2301 CGGTACGCGC TGGTTGGGCA ACAAACTGAC TTTGGGCGGC GCGAtgcGCT

2351 ATTTCGGCAA GAGCATCCGC GCGACGGCTG AAGAACGCTA TATCGACGGC

2401 ACCAACGGGG GAAATACCAG CAATGTCCGG CAACTGGGCA AGCGTTCCAT

2451 CAAACAAACC GAAACCCTTG CCCGACAGCC TTTGATTTTT GATTTTTACG

2501 CCGCTTACGA GCCGAAGAAA AACCTTATTT TCCGCGCCGA AGTCAAAAAC

2551 CTGTTCGACA GGCGTTATAT CGATCCGCTC GATGCGGGCA ATGATGCGGC

2601 AACGCAGCGT TATTACAGCT CGTTCGACCC GAAAGACAAG GACGAAGACG

2651 TAACGTGTAA TGCTGATAAA ACGTTGTGCA ACGGCAAATA CGGCGGCACA

2701 AGCAAAAGCG TATTGACCAA TTTCGCACGC GGACGCACCT TCTTGATGAC

2751 GATGAGCTAC AAGTTTTAA

它对应于氨基酸序列<SEQ ID 884；ORF133ng-1>：

1 MRSSFRLKPI CFYLMGVMLY HHSYAEDAGR AGSEAQIQVL EDVHVKAKRV

51 PKDKKVFTDA RAVSTRQDVF KSGENLDNIV RSIPGAFTQQ DKSSGIVSLN

101 IRGDSGFGRV NTMVDGITQT FYSTSTDAGR AGGSSQFGAS VDSNFIAGLD

151 VVKGSFSGSA GINSLAGSAN LRTLGVDDVV QGNNTYGLLL KGLTGTNSTK

201 GNAMAAIGAR KWLESGASVG VLYGHSRRGV AQNYRVGGGG QHIGNFGEEY

251 LERRKQQYEV QEGGLKFNAG SGKWERDLQR QYWKTKWYKK YEDPQELQKY

301 IEEHDKSWRE NLAPQYDITP IDPSGLKQQS AGNLFKLEYD GVFNKYTAQF

351 RDLNTRIGSR KIINRNYQFN YGLSLNPYTN LNLTAAYNSG RQKYPKGAKF

401 TGWGLLKDFE TYNNAKILDL NNTATFRLPR ETELQTTLGF NYFHNEYGKN

451 RFPEELGLFF DGPDQDNGLY SYLGRFKGDK GLLPQKSTIV QPAGSQYFNT

501 FYFDAALKKD IYRLNYSTNA INYRFGGEYT GYYGSENEFK RAFGENSPAY

551 KEHCDPSCGL YEPVLKKYGK KRANNHSVSI SADFGDYFMP FAGYSRTHRM

601 PNIQEMYFSQ IGDSGVHTAL KPERANTWQF GFNTYKKGLL KQDDILGLKL

651 VGYRSRIDNY IHNVYGKWWD LNGDIPSWVG STGLAYTIRH RNFKDKVHKH

701 GFELELNYDY GRFFTNLSYA YQKSTQPTNF SDASESPNNA SKEDQLKQGY

751 GLSRVSALPR DYGRLEVGTR WLGNKLTLGG AMRYFGKSIR ATAEERYIDG

801 TNGGNTSNVR QLGKRSIKQT ETLARQPLIF DFYAAYEPKK NLIFRAEVKN

851 LFDRRYIDPL DAGNDAATQR YYSSFDPKDK DEDVTCNADK TLCNGKYGGT

901 SKSVLTNFAR GRTFLMTMSY KF*

ORF133ng-1和ORF133-1在889个氨基酸的重叠区显示出有96.2％的相同性：

10 20 30 40 50 60

orf133ng-1.pep SFRLKPICFYLMGVMLYHHSYAEDAGRAGSEAQIQVLEDVHVKAKRVPKDKKVFTDARAV

||||||||||||||||||||||||||||||

orf133-1 EAQIQVLEDVHVKAKRVPKDKKVFTDARAV

10 20 30

70 80 90 100 110 120

orf133ng-1.pep STRQDVFKSGENLDNIVRSIPGAFTQQDKSSGIVSLNIRGDSGFGRVNTMVDGITQTFYS

|||||:|||:||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 STRQDIFKSSENLDNIVRSIPGAFTQQDKSSGIVSLNIRGDSGFGRVNTMVDGITQTFYS

40 50 60 70 80 90

130 140 150 160 170 180

orf133ng-1.pep TSTDAGRAGGSSQFGASVDSNFIAGLDVVKGSFSGSAGINSLAGSANLRTLGVDDVVQGN

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 TSTDAGRAGGSSQFGASVDSNFIAGLDVVKGSFSGSAGINSLAGSANLRTLGVDDVVQGN

100 110 120 130 140 150

190 200 210 220 230 240

orf133ng-1.pep NTYGLLLKGLTGTNSTKGNAMAAIGARKWLESGASVGVLYGHSRRGVAQNYRVGGGGQHI

||||||||||||||||||||||||||||||||||||||||:|||||||||||||||||||

orf133-1 NTYGLLLKGLTGTNSTKGNAMAAIGARKWLESGASVGVLYGHSRRSVAQNYRVGGGGQHI

160 170 180 190 200 210

250 260 270 280 290 300

orf133ng-1.pep GNFGEEYLERRKQQYFVQEGGLKFNAGSGKWERDLQRQYWKTKWYKKYEDPQELQKYIEE

|||| ||||||||:||||||:||||: ||||||||||| || | ||:|:: |||||||||

orf133-1 GNFGAEYLERRKQRYFVQEGALKFNSDSGKWERDLQRQQWKYKPYKNYNN-QELQKYIEE

220 230 240 250 260

310 320 330 340 350 360

orf133ng-1.pep HDKSWRENLAPQYDITPIDPSGLKQQSAGNLFKLEYDGVFNKYTAQFRDLNTRIGSRKII

||||||||| |||||||||||:||||||||||||||||||||||||||||||:|||||||

orf133-1 HDKSWRENLXPQYDITPIDPSSLKQQSAGNLFKLEYDGVFNKYTAQFRDLNTKIGSRKII

270 280 290 300 310 320

370 380 390 400 410 420

orf133ng-1.pep NRNYQFNYGLSLNPYTNLNLTAAYNSGRQKYPKGAKFTGWGLLKDFETYNNAKILDLNNT

||||||||||||||||||||||||||||||||||:|||||||||||||||||||||||||

orf133-1 NRNYQFNYGLSLNPYTNLNLTAAYNSGRQKYPKGSKFTGWGLLKDFETYNNAKILDLNNT

330 340 350 360 370 380

430 440 450 460 470 480

orf133ng-1.pep ATFRLPRETELQTTLGFNYFHNEYGKNRFPEELGLFFDGPDQDNGLYSYLGRFKGDKGLL

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 ATFRLPRETELQTTLGFNYFHNEYGKNRFPEELGLFFDGPDQDNGLYSYLGRFKGDKGLL

390 400 410 420 430 440

490 500 510 520 530 540

orf133ng-1.pep PQKSTIVQPAGSQYFNTFYFDAALKKDIYRLNYSTNAINYRFGGEYTGYYGSENEFKRAF

||||||||||||||||||||||||||||||||||||:::|||||||||||||::||||||

orf133-1 PQKSTIVQPAGSQYFNTFYFDAALKKDIYRLNYSTNTVGYRFGGEYTGYYGSDDEFKRAF

450 460 470 480 490 500

550 560 570 580 590 600

orf133ng-1.pep GENSPAYKEHCDPSCGLYEPVLKKYGKKRANNHSVSISADFGDYFMPFAGYSRTHRMPNI

|||||:||:||: |||:||||||||||||||||||||||||||||||||:||||||||||

orf133-1 GENSPTYKKHCNRSCGIYEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRMPNI

510 520 530 540 550 560

610 620 630 640 650 660

orf133ng-1.pep QEMYFSQIGDSGVHTALKPERANTWQFGFNTYKKGLLKQDDILGLKLVGYRSRIDNYIHN

||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||

orf133-1 QEMYFSQIGDSGVHTALKPERANTWQFGFNTYKKGLLKQDDTLGLKLVGYRSRIDNYIHN

570 580 590 600 610 620

670 680 690 700 710 720

orf133ng-1.pep VYGKWWDLNGDIPSWVGSTGLAYTIRHRNFKDKVHKHGFELELNYDYGRFFTNLSYAYQK

||||||||||||||||:||||||||:||||||||||||||||||||||||||||||||||

orf133-1 VYGKWWDLNGDIPSWVSSTGLAYTIQHRNFKDKVHKHGFELELNYDYGRFFTNLSYAYQK

630 640 650 660 670 680

730 740 750 760 770 780

orf133ng-1.pep STQPTNFSDASESPNNASKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 STQPTNFSDASESPNNASKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMR

690 700 710 720 730 740

790 800 810 820 830 840

orf133ng-1.pep YFGKSIRATAEERYIDGTNGGNTSNVRQLGKRSIKQTETLARQPLIFDFYAAYEPKKNLI

||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||||

orf133-1 YFGKSIRATAEERYIDGTNGGNTSNFRQLGKRSIKQTETLARQPLIFDFYAAYEPKKNLI

750 760 770 780 790 800

850 860 870 880 890 900

orf133ng-1.pep FRAEVKNLFDRRYIDPLDAGNDAATQRYYSSFDPKDKDEDVTCNADKTLCNGKYGGTSKS

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf133-1 FRAEVKNLFDRRYIDPLDAGNDAATQRYYSSFDPKDKDEDVTCNADKTLCNGKYGGTSKS

810 820 830 840 850 860

910 920

orf133ng-1.pep VLTNFARGRTFLMTMSYKFX

||||||||||||||||||||

orf133-1 VLTNFARGRTFLMTMSYKFX

870 880

另外，ORF133ng-1与流感嗜血菌中的TonB-依赖性受体同源：

sp|P45114|YC17_HAEIN可能的TONB-依赖性受体HI1217前体

＞gi|1075372|pir||G64110运铁蛋白结合蛋白1前体(tbp1)同系物-流感嗜血菌(Rd KW20菌株)＞gi|1574147(U32801)运铁蛋白结合蛋白1前体(tbp1)[流感嗜血菌]长度＝913

评分＝930位(2377)，估计值＝0.0

相同性＝476/921(51％)，阳性＝619/921(66％)，空隙＝72/921(7％)

询问：38 QVLEDVHVKAKRVPKDKKVFTDARAVSTRQDVFKSGENLDNIVRSIPGAFTQQDKSSGIV 97

+ L + V K + DKK FT+A+A STR++VFK + +D ++RSIPGAFTQQDK SG+V

目标：29 ETLGQIDVVEKVISNDKKPFTEAKAKSTRENVFKETQTIDQVIRSIPGAFTQQDKGSGVV 88

询问：98 SLNIRGDSGFGRVNTMVDGITQTFYSTSTDAGRAGGSSQFGASVDSNFIAGLDVVKGSFS 157

S+NIRG++G GRVNTMVDG+TQTFYST+ D+G++GGSSQFGA++D NFIAG+DV K +FS

目标：89 SVNIRGENGLGRVNTMVDGVTQTFYSTALDSGQSGGSSQFGAAIDPNFIAGVDVNKSNFS 148

询问：158 GSAGINSLAGSANLRTLGVDDVVQXXXXXXXXXXXXXXXXXXXXXAMAAIGARKWLESGA 217

G++GIN+LAGSAN RTLGV+DV+ M RKWL++G

目标：149 GASGINALAGSANFRTLGVNDVITDDKPFGIILKGMTGSNATKSNFMTMAAGRKWLDNGG 208

询问：218 SVGVLYGHSRRGVAQNYRVGGGGQHIGNFGEEYLERRKQQYFVQEGGLKFNAGSGKWERD 277

VGV+YG+S+R V+Q+YR+ GGG+ + + G++ L + K+ YF + G N G+W D

目标：209 YVGVVYGYSQREVSQDYRI-GGGERLASLGQDILAKEKEAYF-RNAGYILNP-EGQWTPD 265

询问：278 LQRQYWK-----------TKWY--------------------KKYEDPQELQK---YIEE 303

L +++W +Y KK +D ++LQK IEE

目标：266 LSKKHWSCNKPDYQKNGDCSYYRIGSAAKTRREILQELLTNGKKPKDIEKLQKGNDGIEE 325

询问：304 HDKSWRENLAPQYDITPIDPSGLKQQSAGNLFKLEYDGVFNKYTAQFRDLNTRIGSRKII 363

DKS+ N QY + PI+P L+ +S +L K EY AQ R L+ +IGSRKI

目标：326 TDKSFERN-KDQYSVAPIEPGSLQSRSRSHLLKFEYGDDHQNLGAQLRTLDNKIGSRKIE 384

询问：364 NRNYQFNYGLSLNPYTNLNLTAAYNSGRQKYPKGAKFTGWGLLKDFETYNNAKILDLNNT 423

NRNYQ NY +N Y +LNL AA+N G+ YPKG F GW + T N A I+D+NN+

目标：385 NRNYQVNYNFNNNSYLDLNLMAAHNIGKTIYPKGGFFAGWQVADKLITKNVANIVDINNS 444

询问：424 ATFRLPRETELQTTLGFNYFHNEYGKNRFPEELGLFFDGPDQDNGLYSY--LGRFKGDKG 481

TF LP+E +L+TTLGFNYF NEY KNRFPEEL LF++ D GLYS+ GR+ G K

目标：445 HTFLLPKEIDLKTTLGFNYFTNEYSKNRFPEELSLFYNDASHDQGLYSHSKRGRYSGTKS 504

询问：482 LLPQKSTIVQPAGSQYFNTFYFDAALKKDIYRLNYSTNAINYRFGGEYTGYYGSENEFKR 541

LLPQ+S I+QP+G Q F T YFD AL K IY LNYS N +Y F GEY GY

目标：505 LLPQRSVILQPSGKQKFKTVYFDTALSKGIYHLNYSVNFTHYAFNGEYVGY--------- 555

询问：542 AFGENSPAYKEHCDPSCGLYEPVLKKYGKKRANNHSVSISADFGDYFMPFAGYSRTHRMP 601

EN+ + + EP+L K G K+A NHS ++SA+ DYFMPF YSRTHRMP

目标：556 ---ENTAGQQ--------INEPILHKSGHKKAFNHSATLSAELSDYFMPFFTYSRTHRMP 604

询问：602 NIQEMYFSQIGDSGVHTALKPERANTWQFGFNTYKKGLLKQDDILGLKLVGYRSRIDNYI 661

NIQEM+FSQ+ ++GV+TALKPE+++T+Q GFNTYKKGL QDD+LG+KLVGYRS I NYI

目标：605 NIQEMFFSQVSNAGVNTALKPEQSDTYQLGFNTYKKGLFTQDDVLGVKLVGYRSFIKNYI 664

询问：662 HNVYGKWWDLNGDIPSWVGSTGLAYTIRHRNFKDKVHKHGFELELNYDYGRFFTNLSYAY 721

HNVYG WW +P+W S G YTI H+N+K V K G ELE+NYD GRFF N+SYAY

目标：665 HNVYGVWW--RDGMPTWAESNGFKYTIAHQNYKPIVKKSGVELEINYDMGRFFANVSYAY 722

询问：722 QKSTQPTNFSDASESPNNASKEDQLKQGYGLSRVSALPRDYGRLEVGTRWLGNKLTLGGA 781

Q++ QPTN++DAS PNNAS+ED LKQGYGLSRVS LP+DYGRLE+GTRW KLTLG A

目标：723 QRTNQPTNYADASPRPNNASQEDILKQGYGLSRVSMLPKDYGRLELGTRWFDQKLTLGLA 782

询问：782 MRYFGKSIRATAEERYIDGTNGGNTSNVRQLGKRSIKQTETLARQPLIFDFYAAYEPKKN 841

RY+GKS RAT EE YI+G+ + +R+ ++K+TE + +QP+I D + +YEP K+

目标：783 ARYYGKSKRATIEEEYINGSR-FKKNTLRRENYYAVKKTEDIKKQPIILDLHVSYEPIKD 841

询问：842 LIFRAEVKNLFDRRYIDPLDAGNDAATQRYYSSFDPKDKDEDVTCNADKTLCNGKYGGTS 901

LI +AEV+NL D+RY+DPLDAGNDAA+QRYYSS + + C D + C GG+

目标：842 LIIKAEVQNLLDKRYVDPLDAGNDAASQRYYSSL-----NNSIECAQDSSAC----GGSD 892

询问：902 KSVLTNFARGRTFLMTMSYKF 922

K+VL NFARGRT++++++YKF

目标：893 KTVLYNFARGRTYILSLNYKF 913

该淋球菌蛋白中用下划线示出的基序预计是ATP/GTP结合位点基序A(P-环)，该分析提示脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

实施例104

在脑膜炎奈瑟球菌中鉴定出下列部分DNA序列<SEQ ID 885>

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG

151 GGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCGTGAT CAATGTGCGC GAAATGTTGC CCGACCAT..

它对应于氨基酸序列<SEQ ID 886；ORF112>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML

51 GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSVINVR EMLPDH...

进一步的工作揭示了部分核苷酸序列<SEQ ID 887>：

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG

151 gGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TGATTCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCCCT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCCGCCAT CAACGGCAAA ATCAGCACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCrTkAT CAATGTGCGC GAAATGTTGC CCGACCATAC

501 GCTTTTGGGC ATCAAAATTT GGGCGCGCAA CGATAAAAAC GAATTGGCAG

551 AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG

601 TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC

651 TATTGCGGCT GAAGAAAACT GGCCGATTTC CGTCAAACGC AACCTGATGG

701 ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC

751 TACATCCGCC ACCTCCAAAA CAACAGCCAA AACACCCGAA TCTACGCCAT

801 CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC

851 TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC

901 TTAAAACTCT TCGGCGGCAT CTGTsTCGGA TTGCTGTTCC ACCTTGCCGG

951 ACGGCTCTTT GGGTTTACCA GCCAACTCGG...

它对应于氨基酸序列<SEQ ID 888；ORF112-1>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML

51 GYTALKMPAR AYE LIPLAVL IGGLVSLSQL AAGSELTVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSXINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ

201 LKNIRRSTLG EDKVEVSIAA EENWPISVKR NLMDVLLVKP DQMSVGELTT

251 YIRHLQNNSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG

301 LKLFGGICXG LLFHLAGRLF GFTSQL...

对该氨基酸序列进行的计算机分析预测了两个跨膜结构域，并给出下列结果：

与脑膜炎奈瑟球菌(菌株A)的预计ORF的同源性

ORF112和脑膜炎奈瑟球菌菌株A的ORF(ORF112a)在166个氨基酸的重叠区内显示出有96.4％的相同性：

10 20 30 40 50 60

orf112.pep MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

||||||||||||||||||||||||||||||||||||||||||||||||| ||||||| ||

orf112a MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR

10 20 30 40 50 60

70 80 90 100 110 120

orf112.pep AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||

orf112a AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

70 80 90 100 110 120

130 140 150 160

orf112.pep VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSVINVREMLPDH

|||||||||||||||||||||||||||||||||||:||||||||||

orf112a VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN

130 140 150 160 170 180

orf112a ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP

190 200 210 220 230 240

该ORF112a的核苷酸序列<SEQ ID 889>是：

1 ATGAACCTGA TTTCACGTTA CATCATCCGT CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGNTG

151 GGNTACACCG CCCTCAAAAT GNCCGCCCGC GCCTACGAAC TGATGCCCCT

201 CGCCGTCCTT ATCGGCGGAC TGGTCTCTNT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGAN CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CGCAGTTCGG TTTTATTTTT GCTATTGCCA CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CACTGAGCCA AAAAGCCGAA AACATCAAAG

401 CCGCGGCCAT CAACGGCAAA ATCAGTACCG GCAATACCGG CCTTTGGCTG

451 AAAGAAAAAA ACAGCATTAT CAATGTGCGC GAAATGTTGC CCGACCATAC

501 CCTGCTGGGC ATTAAAATCT GGGCCCGCAA CGATAAAAAC GAACTGGCAG

551 AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGTTGGCAG

601 TTGAAAAACA TCCGCCGCAG CACGCTTGGC GAAGACAAAG TCGAGGTCTC

651 TATTGCGGCT GAAGAAAANT GGCCGATTTC CGTCAAACGC AACCTGATGG

701 ACGTATTGCT CGTCAAACCC GACCAAATGT CCGTCGGCGA ACTGACCACC

751 TACATCCGCC ACCTCCAAAN NNACAGCCAA AACACCCGAA TCTACGCCAT

801 CGCATGGTGG CGCAAATTGG TTTACCCCGC CGCAGCCTGG GTGATGGCGC

851 TCGTCGCCTT TGCCTTTACC CCGCAAACCA CCCGCCACGG CAATATGGGC

901 TTAAAANTCT TCGGCGGCAT CTGTCTCGGA TTGCTGTTCC ACCTTGCCGG

951 NCGGCTCTTC NGGTTTACCA GCCAACTCTA CGGCATCCCG CCCTTCCTCG

1001 NCGGCGCACT ACCTACCATA GCCTTCGCCT TGCTCGCCGT TTGGCTGATA

1051 CGCAAACAGG AAAAACGCTA A

它编码的蛋白质具有氨基酸序列<SEQ ID 890>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEMX

51 GYTALKMXAR AYE LMPLAVL IGGLVSXSQL AAGSELXVIK ASGMSTKK LL

101 LILSQFGFIF AIATVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKNSIINVR EMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ

201 LKNIRRSTLG EDKVEVSIAA EEXWPISVKR NLMDVLLVKP DQMSVGELTT

251 YIRHLQXXSQ NTRIYAIAWW RK LVYPAAAW VMALVAFAFT PQTTRHGN MG

301 LKXFGGICLG LLFHLAGRLF XFTSQLYGIP PFLXGALPTI AFALLAVWLI

351 RKQEKR*

ORF112a和ORF112-1在326个氨基酸的重叠区内显示出有96.3％的相同性：

orf112a.pep MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMXGYTALKMXAR

||||||||||||||||||||||||||||||||||||||||||||||||| ||||||| ||

orf112-1 MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

orf112a.pep AYELMPLAVLIGGLVSXSQLAAGSELXVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

||||:||||||||||| |||||||||:|||||||||||||||||||||||||||||||||

orf112-1 AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

orf112a.pep VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSIINVREMLPDHTLLGIKIWARNDKN

||||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||

orf112-1 VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSXINVREMLPDHTLLGIKIWARNDKN

orf112a.pep ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEEXWPISVKRNLMDVLLVKP

|||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||

orf112-1 ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEENWPISVKRNLMDVLLVKP

orf112a.pep DQMSVGELTTYIRHLQXXSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG

|||||||||||||||| ||||||||||||||||||||||||||||||||||||||||||

orf112-1 DQMSVGELTTYIRHLQNNSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG

orf112a.pep LKXFGGICLGLLFHLAGRLFXFTSQLYGIPPFLXGALPTIAFALLAVWLIRKQEKRX

|| ||||| ||||||||||| |||||

orf112-1 LKLFGGICXGLLFHLAGRLFGFTSQL

与淋病奈瑟球菌的预计ORF的同源性

ORF112和淋病奈瑟球菌的预计ORF(ORF112ng)在166个氨基酸的重叠区内显示出有95.8％的相同性：

orf112.pep MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR 60

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf112ng MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR 60

orf112.pep AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW 120

||||:|||||||||:|||||||||||:|||||||||||||||||||||||||||:|||||

orf112ng AYELMPLAVLIGGLASLSQLAAGSELAVIKASGMSTKKLLLILSQFGFIFAIAAVALGEW 120

orf112.pep VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSVINVREMLPDH 166

|||||||||||||||||||||||||||||||||:|:|||| |||||

orf112ng VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKTSIINVRGMLPDHTLLGIKIWARNDKN 180

全长ORF112ng核苷酸序列<SEQ ID 891>是：

1 ATGAACCTGA TTTCACGTTA CATCATCCGC CAAATGGCGG TTATGGCGGT

51 TTACGCGCTC CTTGCCTTCC TCGCTTTGTA CAGCTTTTTT GAAATCCTGT

101 ACGAAACCGG CAACCTCGGC AAAGGCAGTT ACGGCATATG GGAAATGCTG

151 GGCTACACCG CCCTCAAAAT GCCCGCCCGC GCCTACGAAC TCATGCCCCT

201 CGCCGTCCTC ATCGGCGGAC TGGCCTCTCT CAGCCAGCTT GCCGCCGGCA

251 GCGAACTGGC CGTCATCAAA GCCAGCGGCA TGAGCACCAA AAAGCTGCTG

301 TTGATTCTGT CTCAGTTCGG TTTTATTTTT GCTATTGCCG CCGTCGCGCT

351 CGGCGAATGG GTTGCGCCCA CGCTGAGCCA AAAAGCCGAA AACATCAAag

401 cCGCCGCCAt taacggCAAA ATCAGCAccg gcAATACCGG CCTTTggcTG

451 AAAGAAAAAa ccAGCATTAT CAATGTGcGc GGAATGTTGC CCGACCATAC

501 GCTTTTGGGC ATCAAAATTT GGGCGCGCAA CGATAAAAAC GAATTGGCAG

551 AGGCAGTGGA AGCCGATTCC GCCGTTTTGA ACAGCGACGG CAGCTGGCAG

601 TTGAAAAACA TCCGCCGCAG CATCATGGGT ACAGACAAAA TCGAAACATC

651 cgCCGCCGCC GAAGAAACTT gGCCGATTGC CGTCAGACGC AACCTGATGG

701 ACGTATTGCT CGTCAAGCCC GACCAAATGT CCGTCGGCGA GCTGACCACC

751 TACATCCGCC ACCTCCAAAA CAACAGCCAA AACACCCAAA TCTACGCCAT

801 CGCATGGTGG CGTAAACTCG TTTACCCCGT CGCCGCATGG GTCATGGCGC

851 TCGTTGCCTT CGCCTTTACG CCGCAAACCA CGCGCCACGG CAATATGGGC

901 TTAAAACTCT TCGGCGGCAT CTGTCTCGGA TTGCTGTTCC ACCTTGCCGG

951 CAGGCTCTTC GGGTTTACCA GCCAACTCTA CGGCACCCCA CCCTTCCTCG

1001 CCGGCGCACT GCCTACCATA GCCTTCGCCT TGCTCGCTGT TTGGCTGATA

1051 CGCAAACAGG AAAAACGTTG A

它编码的蛋白质具有氨基酸序列<SEQ ID 892>：

1 MNLISRYIIR QMAVMAVYAL LAFLALYSFF EILYETGNLG KGSYGIWEML

51 GYTALKMPAR AYE LMPLAVL IGGLASLSQL AAGSELAVIK ASGMSTKK LL

101 LILSQFGFIF AIAAVALGEW VAPTLSQKAE NIKAAAINGK ISTGNTGLWL

151 KEKTSIINVR GMLPDHTLLG IKIWARNDKN ELAEAVEADS AVLNSDGSWQ

201 LKNIRRSIMG TDKIETSAAA EETWPIAVRR NLMDVLLVKP DQMSVGELTT

251 YIRHLQNNSQ NTQIYAIAWW RK LVYPVAAW VMALVAFAFT PQTTRHGN MG

301 LKLFGGICLG LLFHLAGRLF GFTSQLYGTP PFL AGALPTI AFALLAVWLI

351 RKQEKR*

ORF112ng和ORF112-1在326个氨基酸的重叠区内显示出有94.2％的相同性：

10 20 30 40 50 60

orf112ng MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

orf112-1 MNLISRYIIRQMAVMAVYALLAFLALYSFFEILYETGNLGKGSYGIWEMLGYTALKMPAR

10 20 30 40 50 60

70 80 90 100 110 120

orf112ng AYELMPLAVLIGGLASLSQLAAGSELAVIKASGMSTKKLLLILSQFGFIFAIAAVALGEW

||||:|||||||||:|||||||||||:||||||||||||||||||||||||||:||||||

orf112-1 AYELIPLAVLIGGLVSLSQLAAGSELTVIKASGMSTKKLLLILSQFGFIFAIATVALGEW

70 80 90 100 110 120

130 140 150 160 170 180

orf112ng VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKTSIINVRGMLPDHTLLGIKIWARNDKN

|||||||||||||||||||||||||||||||||:| |||| |||||||||||||||||||

orf112-1 VAPTLSQKAENIKAAAINGKISTGNTGLWLKEKNSXINVREMLPDHTLLGIKIWARNDKN

130 140 150 160 170 180

190 200 210 220 230 240

orf112ng ELAEAVEADSAVLNSDGSWQLKNIRRSIMGTDKIETSAAAEETWPIAVRRNLMDVLLVKP

||||||||||||||||||||||||||| :| ||:|:| ||||:|||:|:|||||||||||

orf112-1 ELAEAVEADSAVLNSDGSWQLKNIRRSTLGEDKVEVSIAAEENWPISVKRNLMDVLLVKP

190 200 210 220 230 240

250 260 270 280 290 300

orf112ng DQMSVGELTTYIRHLQNNSQNTQIYAIAWWRKLVYPVAAWVMALVAFAFTPQTTRHGNMG

|||||||||||||||||||:||||||||||||||||:|||||||||||||||||||||||

orf112-1 DQMSVGELTTYIRHLQNNSQNTRIYAIAWWRKLVYPAAAWVMALVAFAFTPQTTRHGNMG

250 260 270 280 290 300

310 320 330 340 350

orf112ng LKLFGGICLGLLFHLAGRLFGFTSQLYGTPPFLAGALPTIAFALLAVWLIRKQEKRX

|||||||| |||||||||||||||||

orf112-1 LKLFGGICXGLLFHLAGRLFGFTSQL

310 320

该分析结果提示脑膜炎奈瑟球菌和淋病奈瑟球菌的这些蛋白及其表位可用作疫苗或诊断用的抗原，或用来产生抗体。

应理解，本发明只通过实施例进行了描述，而在本发明的思路和范围内还可作其它改动。

表I-PCR引物

ORF	引物	序列	限制性位点
ORF	引物	序列	限制性位点	ORF 1ORF 2ORF 2-1ORF 4ORF 5ORF 6ORF 7ORF 8ORF 9ORF 10	正向反向正向反向正向反向正向反向正向正向反向正向反向正向反向正向反向正向反向正向反向	CGC GGATCCGCTAGC-GGACACACTTATTTCGGCCCG CTCGAG-CCAGCGGTAGCCTAATTGC GGATCCCATATG-TTTGATTTCGGTTTGGGCCCG CTCGAG-GACGGCATAACGGCGGC GGATCCCATATG-TTTGATTTCGGTTTGGGCCCG CTCGAG-TGATTTACGGACGCGCAGC GGATCCCATATG-TGCGGAGGTCAAAAAGACCCCG CTCGAG-TTTGGCTGCGCCTTCGGAATTC CATATGG CCATGG-TGGAAGGCGCACAACCCG GGATCC-ATGGAAGGCGCACAACCCCG CTCGAG-GACTGTGCAAAAACGGCGC GGATCCCATATG-ACCCGTCAATCTCTGCACCCG CTCGAG-TGCGCCGAACACTTTCCGC GGATCCGCTAGC-GCGCTGCTTTTTGTTCCCCCG CTCGAG-TTTCAAAATATATTTGCGGAGC GGATCCCATATG-GCTCAACTGCTTCGTACCCCG CTCGAG-AGCAGGCTTTGGCGCCGC GGATCCCATATG-CCGAAGGAAGTCGGAAACCCG CTCGAG-TTTCCGAGGTTTTCGGGGC GGATCCCATATG-GACACAAAAGAAATCCTCCCCG CTCGAG-TAATGGGAAACCTTGTTTT	BamHI-NheIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoINdeI-NcoIBamHIXhoIBamHI-NdeIXhoIBamHI-NheIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoI

ORF 11ORF 13ORF 15ORF 17ORF 18ORF 19ORF 20ORF 22ORF 23ORF 24

正向反向正向反向正向正向反向正向正向反向正向反向正向正向反向正向正向反向正向正向反向正向反向正向正向

GC GGATCCCATATG-GCGGTCAACCTCTACGCCCG CTCGAG-GGAAACGACTTCGCCCGC GGATCCCATATG-GCTCTGCTTTCCGCGCCCCG CTCGAG-AGGGTGTGTGATAATAAGGGAATTC CATATGG CCATGG-GCGGGACACTGACAGCG GGATCC-TGCGGGACACTGACAGGCCCG CTCGAG-AGGTTGGCCTTGTCTATGGGAATT CCATATGG CCATGG-TTGCCGGCCTGTTCGCG GGATCC-ATTGCCGGCCTGTTCGCCCG CTCGAG-AAGCAGGTTGTACAGCGC GGATCCCATATG-ATTTTGCTGCATTTGGATCCCG CTCGAG-TCTTCCAATTTCTGAAAGCGGAATTC CATATGG CCATGG-TCGCCAGTGTTTTTACCCG GGATCC-TTCGCCAGTGTTTTTACCGCCCG CTCGAG-GGTGTTTTTGAAGCTGCCGGAATTC CATATGG CCATGG-TCGGCGCGGGTATGCG GGATCC-TTCGGCGCGGGTATGCCCG CTCGAG-CGGCGAGCGAGAGCAGGAATTC CATATGG CCATGG-TGATTAAAATCAAAAAAGGTCTCG GGATCC-ATGATTAAAATCAAAAAAGGTCTAAACCCCCG CTCGAG-ATTATGATAGCGGCCCCGC GGATCCCATATG-GATGTTTCTGTTTCAGACCCCG CTCGAG-TTTAAACCGATAGGTAAACGGGAATTC CATATGG CCATGG-TGATGCCGGAAATGGTGCG GGATCC-ATGATGCCGGAAATGGTG

BamHI-NdeIXhoIBamHI-NdeIXhoINdeI-NcoIBamHIXhoINdeI-NcoIBamHIXhoIBamHI-NdeIXhoINdeI-NcoIBamHIXhoINdeI-NcoIBamHIXhoINdeI-NcoIBamHIXhoIBamHI-NdeIXhoINdeI-NcoIBamHI

ORF 25ORF 26ORF 27ORF 28ORF 29ORF 32ORF 33ORF 35ORF 37ORF 58

反向正向反向正向反向正向正向反向正向正向反向正向正向反向正向反向正向反向正向正向反向正向反向正向反向

CCCG CTCGAG-TGTCAGCGTGGCGCAGC GGATCCCATATG-TATCGCAAACTGATTGCCCCG CTCGAG-ATCGATGGAATAGCCGGC GGATCCCATATG-CAGCTGATCGACTATTCCCCG CTCGAG-GACATCGGCGCGTTTTGGAATTC CATATGG CCATGG-AGACCTATTCTGTTTACG GGATCC-CAGACCTATTCTGTTTATTTTAATCCCCG CTCGAG-GGGTTCGATTAAATAACCATGGAATTC CATATGG CCATGG-ACGGCTGTACGTTGATGTCG GGATCC-AACGGCTGTACGTTGATGCCCG CTCGAG-TTTGTCAGAGGAATTCGCGGC GGATCCCATATG-AACGGTTTGGATGCCCGCGC GGATCCGCTAGC-AACGGTTTGGATGCCCGCCCG CTCGAG-TTTGTCTAAGTTCCTGATATGCGC GGATCCCATATG-AATACTCCTCCTTTTGCCCG CTCGAG-GCGTATTTTTTGATGCTTTGGC GGATCCCATATG-ATTGATAGGGATCGTATGCCCG CTCGAG-TTGATCTTTCAAACGGCCGC GGATCCCATATG-TTCAGAGCTCAGCTTCGC GGATCCGCTAGC-TTCAGAGCTCAGCTTCCCG CTCGAG-AAACAGCCATTTGAGCGAGC GGATCCCATATG-GATGACGTATCGGATTTTCCCG CTCGAG-ATAGCCCGCTTTCAGGCGC GGATCCGCTAGC-TCCGAACGCGAGTGGATCCCG CTCGAG-AGCATTGTCCAAGGGGAC

XhoIBamHI-NdeIXhoIBamHI-NdeIXhoINdeI-NcoIBamHIXhoINdeI-NcoIBamHIXhoIBamHI-NdeIBamHI-NheIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIBamHI-NheIXhoIBamHI-NdeIXhoIBamHI-NheIXhoI

ORF 65ORF 66ORF 72ORF 73ORF 75ORF 76ORF 79ORF 83ORF 84ORF 85ORF 89

正向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向正向

GGAATTC CATATGG CCATGG-TGCTGTATCTGAATCAAGCG GGATCC-TTGCTGTATCTGAATCAAGGCCCG CTCGAG-CCGCATCGGCAGACAGC GGATCCCATATG-TACGCATTTACCGCCGCCCG CTCGAG-TGGATTTTGCAGAGATGGCGC GGATCCCATATG-AATGCAGTAAAAATATCTGACCCG CTCGAG-GCCTGAGACCTTTGCAAGC GGATCCCATATG-AGATTTTTCGGTATCGGCCCG CTCGAG-TTCATCTTTTTCATGTTCGGC GGATCCCATATG-TCTGTCTTTCAAACGGCCCCG CTCGAG-TTTGTTTTTGCAAGACAGGATCA GCTAGCCATATG-AAACAGAAAAAAACCGCCG GGATCC-TTACGGTTTGACACCGTTCGC GGATCCCATATG-GTTTCCGCCGCCGCCCG CTCGAG-GTGCTGATGCGCTTCGGC GGATCCCATATG-AAAACCCTGCTGCTGCCCCG CTCGAG-GCCGCCTTTGCGGCGC GGATCCCATATG-GCAGAGATCTGTTTGCCCG CTCGAG-GTTTGCCGATCCGACCACGC GGATCCCATATG-GCGGTTTGGGGCGGACCCG CTCGAG-TCGGCGCGGCGGGCGGAATTC CATATGG CCATGG-CCATACCTTCTTATCACG GGATCC-GCCATACCTTCTTATCAGAG

NdeI-NcoIBamHIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoINheI-NdeIBamHIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoINdeI-NcoIBamHI

ORF 97ORF 98ORF 100ORF 101ORF 102ORF 103ORF 104ORF 105ORF 106ORF 109ORF 110

反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向

CCCG CTCGAG-TTTTTTGCGATTAGAAAAAGCGC GGATCCCATATG-CATCCTGCCAGCGAACCCCG CTCGAG-TTCGCCTACGGTTTTTTGGC GGATCCCATATG-ACGGTAACTGCGGCCCG CTCGAG-TTGTTGTTCGGGCAAATCGCGGATCCCATATG-TCGGGCATTTACACCGCCCG CTCGAG-ACGGGTTTCGGCGGAAGC GGATCCCATATG-ATTTATCAAAGAAACCTCCCCG CTCGAG-TTTTCCGCCTTTCAATGTGC GGATCCCATATG-GCAGGGCTGTTTTACCCCCG CTCGAG-AAACGGTTTGAACACGACGC GGATCCCATATG-AACCACGACATCACCCCG CTCGAG-CAGCCACAGGACGGCGC GGATCCCATATG-ACGTGGGGAACGCCCCG CTCGAG-GCGGCGTTTGAACGGCGC GGATCCCATATG-ACCAAATTTCAAACCCCTCCCCG CTCGAG-TAAACGAATGCCGTCCAGGC GGATCCCATATG-AGGATAACCGACGGCGCCCG CTCGAG-TTTGTTCCCGATGATGTTGC GGATCCCATATG-GAAGATTTATATATAATACTCGCCCG CTCGAG-ATCAGCTTCGAACCGAAGAAA GAATTC-ATGAGTAAATCCCGTAGATCTCCCAAA CTGCAG-GGAAAACCACATCCGCACTCTGCC

XhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIEcoRIPstI

ORF 111ORF 113ORF 115ORF 119ORF 120ORF 121ORF 122ORF 125ORF 126ORF 127ORF 128ORF 129

正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向

AAA GAATTC-GCACCGCAAAAGGCAAAAACCGCAAAA CTGCAG-TCTGCGCGTTTTCGGGCAGGGTGGAAA GAATTC-ATGAACAAAACCCTCTATCGTGTGATTTTCAACCGAAA CTGCAG-TTACGAATGCCTGCTTGCTCGACCGTACTGAAA GAATTC-TTGCTTGTGCAAACAGAAAAAGACGGAAAAAA GTCGAC-CTATTTTTTAGGGGCTTTTGCTTGTTTGAAAAGCCTGCCAAA GAATTC-TACAACATGTATCAGGAAAACCAATACCGAAA CTGCAG-TTATGAAAACAGGCGCAGGGCGGTTTTGCCAAA GAATTC-GCAAGGCTACCCCAATCCGCCGTGAAA CTGCAG-CGGTTTGGCTGCCTGGCCGTTGATAAA GAATTC-GCCTTGGTCTGGCTGGTTTTCGCAAA CTGCAG-TCATCCGCCACCCCACCTCGGCCATCCATCAAAAAA GTCGAC-ATGTCTTACCG CGCAAGCAGTTCTCCAAA CTGCAG-TCAGGAACACAAACGATGACGAATATCCGTATCAAA GAATTC-GCGCTGTTTTTTGCGGCGGCGTATAAA CTGCAG-CGCCGTTTCAAGACGAAAAAGTCGAAA GAATTC-GCGGAAACGGTCGAAGAAA CTGCAG-TTAATCTTGTCTTCCGATATACAAA GAATTC-ATGACTGATAATCGGGGGTTTACGAAAAAA GTCGAC-CTTAAGTAACTTGCAGTCCTTATCAAA GAATTC-ATGCAAGCTGTCCGCTACAGGCCAAA CTGCAG-CTATTGCAATGCGCCGCCGCGGGAATGAATGAGCAGGCGAAA GAATTC-ATGGATTTTCGTTTTGACATTATTTACGAATACCGAAA CTGCAG-TTATTTTTTGATGAAATTTTGGGGCGG

EcoRIPstIEcoRIPstIEcoRISalIEcoRIPstIEcoRIPstIEcoRIPstISalIPstIEcoRIPstIEcoRIPstIEcoRISatIEcoRIPstIEcoRIPstI

ORF 130ORF 131ORF 132ORF 133ORF 134ORF 135ORF 136ORF 137ORF 138ORF 139ORF 140ORF 141

正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向反向正向

AAA GAATTC-GCAGTACTTGCCAT TCTCGGTGCGAAA CTGCAG-CTCCGGATCGTCTGTAAACGCATTGC GGATCCCATATG-GAAATTCGGGCAATAAAATCCCG CTCGAG-CCAGCGGACGCGTTCGC GGATCCCATATG-AAAGAAGCGGGGTTTGCCCG CTCGAG-CCAATCTGCCAGCCGTCGCGGATCCCATATG-GAAGATGCAGGGCGCGCCCG CTCGAG-AAACTTGTAGCTCATCGTGC GGATCCCATATG-TCTGTGCAAGCAGTATTGCCCG CTCGAG-ATCCTGTGCCAATGCGGC GGATCCCATATG-CCGTCTGAAAAAGCTTTCCCG CTCGAG-AAATACCGCTGAGGATGCGC GGATCCGCTAGC-ATGAAGCGGCGTATAGCCCCCG CTCGAG-TTCCGAATATTTGGAACTTTTCGC GGATCCCATATG-GGCACGGCGGGAAATACCCG CTCGAG-ATAACGGTATGCCGCCGC GGATCCCATATG-TTTCGTTTACAATTCAGGCCCCG CTCGAG-CGGCGTTTTATAGCGGGC GGATCCCATATG-GCTTTTTTGGCGGTAATGCCCG CTCGAG-TAACGTTTCCGTGCGTTTGC GGATCCCATATG-TTGCCCACAGGCAGCCCCG CTCGAG-GACGATGGCAAACAGCGC GGATCCCATATG-CCGTCTGAAGCAGTCT

EcoRIPstIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NheIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeI

ORF 142ORF 143ORF 144ORF 147

反向正向反向正向反向正向反向正向反向

CCCG CTCGAG-ATCTGTTGTTTTTAAAATATTGC GGATCCCATATG-GATAATTCTGGTAGTGAAGCCCG CTCGAG-AAACGTATAGCCTACCTGC GGATCCCATATG-GATACCGCTTTGAACCTCCCG CTCGAG-AATGGCTTCCGCAATATGGC GGATCCCATATG-ACCTTTTTACAACGTTTGCCCCG CTCGAG-AGATTGTTGTTGTTTTTTCGGC GGATCCCATATG-TCTGTCTTTCAAACGGCCCCG CTCGAG-TTTGTTTTTGCAAGACAG

XhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoIBamHI-NdeIXhoI

NB：

-限制性位点用下划线表示

-对于ORF110-130，当ORF本身携带EcoRI位点(例如ORF122)时，在正向引物中采用SalI位点。同样，当ORF携带了PstI位点(例如ORF115和127)，在反向引物中采用SalI位点。

表II-隆、表达和纯化的归纳

ORF	PCR/克隆	His-融合物表达	GST-融合物表达	纯化
ORF	PCR/克隆	His-融合物表达	GST-融合物表达	纯化	orf1	+	+	+	His-融合物
orf2	+	+	+	GST-融合物	orf1	+	+	+	His-融合物
orf2	+	+	+	GST-融合物	orf2.1	+	未测定	+	GST-融合物
orf4	+	+	+	His-融合物	orf2.1	+	未测定	+	GST-融合物
orf4	+	+	+	His-融合物	orf5	+	未测定	+	GST-融合物
orf6	+	+	+	GST-融合物	orf5	+	未测定	+	GST-融合物
orf6	+	+	+	GST-融合物	orf7	+	+	+	GST-融合物
orf8	+	未测定	未测定		orf7	+	+	+	GST-融合物
orf8	+	未测定	未测定		orf9	+	+	+	GST-融合物
orf10	+	未测定	未测定		orf9	+	+	+	GST-融合物
orf10	+	未测定	未测定		orf11	+	未测定	未测定
orf13	+	未测定	+	GST-融合物	orf11	+	未测定	未测定
orf13	+	未测定	+	GST-融合物	orf15	+	+	+	GST-融合物
orf17	+	未测定	未测定		orf15	+	+	+	GST-融合物
orf17	+	未测定	未测定		orf18	+	未测定	未测定
orf19	+	未测定	未测定		orf18	+	未测定	未测定
orf19	+	未测定	未测定		orf20	+	未测定	未测定
orf22	+	+	+	GST-融合物	orf20	+	未测定	未测定
orf22	+	+	+	GST-融合物	orf23	+	+	+	His-融合物
orf24	+	未测定	未测定		orf23	+	+	+	His-融合物
orf24	+	未测定	未测定		orf25	+	+	+	His-融合物
orf26	+	未测定	未测定		orf25	+	+	+	His-融合物
orf26	+	未测定	未测定		orf27	+	+	+	GST-融合物
orf28	+	+	+	GST-融合物	orf27	+	+	+	GST-融合物
orf28	+	+	+	GST-融合物	orf29	+	未测定	未测定
orf32	+	+	+	His-融合物	orf29	+	未测定	未测定
orf32	+	+	+	His-融合物	orf33	+	未测定	未测定
orf35	+	未测定	未测定		orf33	+	未测定	未测定

orf37	+-	+	+	GST-融合物
orf37	+-	+	+	GST-融合物	orf58	+	未测定	未测定
orf65	+	未测定	未测定		orf58	+	未测定	未测定
orf65	+	未测定	未测定		orf66	+	未测定	未测定
orf72	+	+	未测定	His-融合物	orf66	+	未测定	未测定
orf72	+	+	未测定	His-融合物	orf73	+	未测定	+	未测定
orf75	+	未测定	未测定		orf73	+	未测定	+	未测定
orf75	+	未测定	未测定		orf76	+	+	未测定	His-融合物
orf79	+	+	未测定	His-融合物	orf76	+	+	未测定	His-融合物
orf79	+	+	未测定	His-融合物	orf83	+	未测定	+	未测定
orf84	+	未测定	未测定		orf83	+	未测定	+	未测定
orf84	+	未测定	未测定		orf85	+	未测定	+	GST-融合物
orf89	+	未测定	+	GST-融合物	orf85	+	未测定	+	GST-融合物
orf89	+	未测定	+	GST-融合物	orf97	+	+	+	GST-融合物
orf98	+	未测定	未测定		orf97	+	+	+	GST-融合物
orf98	+	未测定	未测定		orf100	+	未测定	未测定
orf101	+	未测定	未测定		orf100	+	未测定	未测定
orf101	+	未测定	未测定		orf102	+	未测定	未测定
orf103	+	未测定	未测定		orf102	+	未测定	未测定
orf103	+	未测定	未测定		orf104	+	未测定	未测定
orf105	+	未测定	未测定		orf104	+	未测定	未测定
orf105	+	未测定	未测定		orf106	+	+	+	His-融合物
orf109	+	未测定	未测定		orf106	+	+	+	His-融合物
orf109	+	未测定	未测定		orf110	+	未测定	未测定
orf111	+	+	未测定	His-融合物	orf110	+	未测定	未测定
orf111	+	+	未测定	His-融合物	orf113	+	+	未测定	His-融合物
orf115	未测定	未测定	未测定		orf113	+	+	未测定	His-融合物
orf115	未测定	未测定	未测定		orf119	+	+	未测定	His-融合物
orf120	+	+	未测定	His-融合物	orf119	+	+	未测定	His-融合物
orf120	+	+	未测定	His-融合物	orf121	+	未测定	未测定
orf122	+	+	未测定	His-融合物	orf121	+	未测定	未测定

orf125	+	+	未测定	His-融合物
orf125	+	+	未测定	His-融合物	orf126	+	+	未测定	His-融合物
orf127	+	+	未测定	His-融合物	orf126	+	+	未测定	His-融合物
orf127	+	+	未测定	His-融合物	orf128	+	未测定	未测定
orf129	+	+	未测定	His-融合物	orf128	+	未测定	未测定
orf129	+	+	未测定	His-融合物	orf130	+	未测定	未测定
orf131	+	+	+	未测定	orf130	+	未测定	未测定
orf131	+	+	+	未测定	orf132	+	+	+	His-融合物
orf133	+	未测定	+	GST-融合物	orf132	+	+	+	His-融合物
orf133	+	未测定	+	GST-融合物	orf134	+	未测定	未测定
orf135	+	未测定	未测定		orf134	+	未测定	未测定
orf135	+	未测定	未测定		orf136	+	未测定	未测定
orf137	+	未测定	+	GST-融合物	orf136	+	未测定	未测定
orf137	+	未测定	+	GST-融合物	orf138	+	未测定	+	GST-融合物
orf139	+	未测定	未测定		orf138	+	未测定	+	GST-融合物
orf139	+	未测定	未测定		orf140	+	未测定	未测定
orf141	+	未测定	未测定		orf140	+	未测定	未测定
orf141	+	未测定	未测定		orf142	+	未测定	未测定
orf143	+	未测定	未测定		orf142	+	未测定	未测定
orf143	+	未测定	未测定		orf144	+	未测定	+	未测定
orf147	+	未测定	未测定		orf144	+	未测定	+	未测定

Claims

1.一种蛋白，它包含选自SEQ ID 2、4、6和8的氨基酸序列。

2.一种核酸分子，它编码权利要求1所述的蛋白。

3.根据权利要求2所述的核酸分子，它包含选自SEQ ID 1、3、5和7的核苷酸序列。

4.一种蛋白，它包含选自SEQ ID 2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，176，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，290，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362，364，366，368，370，372，374，376，378，380，382，384，386，388，390，392，394，396，398，400，402，404，406，408，410，412，414，416，418，420，422，424，426，428，430，432，434，436，438，440，442，444，446，448，450，452，454，456，458，460，462，464，466，468，470，472，474，476，478，480，482，484，486，488，490，492，494，496，498，500，502，504，506，508，510，512，514，516，518，520，522，524，526，528，530，532，534，536，538，540，542，544，546，548，550，552，554，556，558，560，562，564，566，568，570，572，574，576，578，580，582，584，586，588，590，592，594，596，598，600，602，604，606，608，610，612，614，616，618，620，622，624，626，628，630，632，634，636，638，640，642，644，646，648，650，652，654，656，658，660，662，664，666，668，670，672，674，676，678，680，682，684，686，688，690，692，694，696，698，700，702，704，706，708，710，712，714，716，718，720，722，724，726，728，730，732，734，736，738，740，742，744，746，748，750，752，754，756，758，760，762，764，766，768，770，772，774，776，778，780，782，784，786，788，790，792，794，796，798，800，802，804，806，808，810，812，814，816，818，820，822，824，826，828，830，832，834，836，838，840，842，844，846，848，850，852，854，856，858，860，862，864，866，868，870，872，874，876，878，880，882，884，886，888，890，和892的氨基酸序列。

5.一种蛋白质，它与权利要求4所述的蛋白质的序列相同性为50％或更高。

6.一种蛋白质，它包含选自SEQ ID 2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，176，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，290，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362，364，366，368，370，372，374，376，378，380，382，384，386，388，390，392，394，396，398，400，402，404，406，408，410，412，414，416，418，420，422，424，426，428，430，432，434，436，438，440，442，444，446，448，450，452，454，456，458，460，462，464，466，468，470，472，474，476，478，480，482，484，486，488，490，492，494，496，498，500，502，504，506，508，510，512，514，516，518，520，522，524，526，528，530，532，534，536，538，540，542，544，546，548，550，552，554，556，558，560，562，564，566，568，570，572，574，576，578，580，582，584，586，588，590，592，594，596，598，600，602，604，606，608，610，612，614，616，618，620，622，624，626，628，630，632，634，636，638，640，642，644，646，648，650，652，654，656，658，660，662，664，666，668，670，672，674，676，678，680，682，684，686，688，690，692，694，696，698，700，702，704，706，708，710，712，714，716，718，720，722，724，726，728，730，732，734，736，738，740，742，744，746，748，750，752，754，756，758，760，762，764，766，768，770，772，774，776，778，780，782，784，786，788，790，792，794，796，798，800，802，804，806，808，810，812，814，816，818，820，822，824，826，828，830，832，834，836，838，840，842，844，846，848，850，852，854，856，858，860，862，864，866，868，870，872，874，876，878，880，882，884，886，888，890和892的氨基酸序列的片段。

7.一种抗体，它结合权利要求4至6任一所述的蛋白质。

8.一种核酸分子，它编码权利要求4至6任一所述的蛋白质。

9.根据权利要求8所述的核酸分子，它包括选自SEQ ID 1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，175，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，289，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361，363，365，367，369，371，373，375，377，379，381，383，385，387，389，391，393，395，397，399，401，403，405，407，409，411，413，415，417，419，421，423，425，427，429，431，433，435，437，439，441，443，445，447，449，451，453，455，457，459，461，463，465，467，469，471，473，475，477，479，481，483，485，487，489，491，493，495，497，499，501，503，505，507，509，511，513，515，517，519，521，523，525，527，529，531，533，535，537，539，541，543，545，547，549，551，553，555，557，559，561，563，565，567，569，571，573，575，577，579，581，583，585，587，589，591，593，595，597，599，601，603，605，607，609，611，613，615，617，619，621，623，625，627，629，631，633，635，637，639，641，643，645，647，649，651，653，655，657，659，661，663，665，667，669，671，673，675，677，679，681，683，685，687，689，691，693，695，697，699，701，703，705，707，709，711，713，715，717，719，721，723，725，727，729，731，733，735，737，739，741，743，745，747，749，751，753，755，757，759，761，763，765，767，769，771，773，775，777，779，781，783，785，787，789，791，793，795，797，799，801，803，805，807，809，811，813，815，817，819，821，823，825，827，829，831，833，835，837，839，841，843，845，847，849，851，853，855，857，859，861，863，865，867，869，871，873，875，877，879，881，883，885，887，889和891的核苷酸序列。

10.一种核酸分子，它包含选自SEQ ID 1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，175，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，289，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361，363，365，367，369，371，373，375，377，379，381，383，385，387，389，391，393，395，397，399，401，403，405，407，409，411，413，415，417，419，421，423，425，427，429，431，433，435，437，439，441，443，445，447，449，451，453，455，457，459，461，463，465，467，469，471，473，475，477，479，481，483，485，487，489，491，493，495，497，499，501，503，505，507，509，511，513，515，517，519，521，523，525，527，529，531，533，535，537，539，541，543，545，547，549，551，553，555，557，559，561，563，565，567，569，571，573，575，577，579，581，583，585，587，589，591，593，595，597，599，601，603，605，607，609，611，613，615，617，619，621，623，625，627，629，631，633，635，637，639，641，643，645，647，649，651，653，655，657，659，661，663，665，667，669，671，673，675，677，679，681，683，685，687，689，691，693，695，697，699，701，703，705，707，709，711，713，715，717，719，721，723，725，727，729，731，733，735，737，739，741，743，745，747，749，751，753，755，757，759，761，763，765，767，769，771，773，775，777，779，781，783，785，787，789，791，793，795，797，799，801，803，805，807，809，811，813，815，817，819，821，823，825，827，829，831，833，835，837，839，841，843，845，847，849，851，853，855，857，859，861，863，865，867，869，871，873，875，877，879，881，883，885，887，889和891的核苷酸序列的片段。

11.一种核酸分子，它包含与权利要求8至10任一所述的核酸分子互补的核苷酸序列。

12.一种核酸分子，它包含的核苷酸序列与权利要求8至11任一所述的核酸分子的序列相同性为50％或更高。

13.一种核酸分子，它能在高度严谨的条件下与权利要求8至12任一所述的核酸分子杂交。

14.一种组合物，它包含前述任一权利要求所述的蛋白质、核酸分子或抗体。

15.根据权利要求14所述的组合物，它是疫苗组合物或诊断组合物。

16.权利要求14或15所述的组合物作为药剂的应用。

17.权利要求14所述的组合物在生产用于治疗或预防由于奈瑟球菌引起的感染的药剂中的应用。