CN1246799A - 关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物 - Google Patents

关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物 Download PDF

Info

Publication number
CN1246799A
CN1246799A CN97181630A CN97181630A CN1246799A CN 1246799 A CN1246799 A CN 1246799A CN 97181630 A CN97181630 A CN 97181630A CN 97181630 A CN97181630 A CN 97181630A CN 1246799 A CN1246799 A CN 1246799A
Authority
CN
China
Prior art keywords
seq
helicobacter pylori
polypeptide
nucleic acid
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN97181630A
Other languages
English (en)
Inventor
D·史密斯
R·A·阿尔姆
P·C·多伊格
Z·卡波克
L·M·卡斯特里奥塔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AstraZeneca AB
Original Assignee
Astra AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Astra AB filed Critical Astra AB
Publication of CN1246799A publication Critical patent/CN1246799A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/205Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Campylobacter (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K2039/106Vibrio; Campylobacter; Not used, see subgroups
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Communicable Diseases (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Genetics & Genomics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

描述了重组或大致纯的幽门螺杆菌多肽制剂。也描述了编码所述多肽的核酸。所述幽门螺杆菌多肽可用于诊断和疫苗组合物,其中该图描述了5种幽门螺杆菌蛋白的氨基酸序列对比。

Description

关于幽门螺杆菌的核酸序列和氨基酸序列 及其疫苗组合物
发明背景
幽门螺杆菌是从人类胃活检样本发现并培养的革兰氏阴性S型微需氧细菌。(Warren,J.R.和B.Marshall,(1983)Lancet  1:1273-1275;以及Marshall等,(1984)Microbios Lett. 25:83-88)。幽门螺杆菌与慢性胃炎和十二指肠溃疡密切相关。(Rathbone等,(1986)Gut  27:635-641)。此外,积累的证据表明,幽门螺杆菌在非溃疡型消化不良、胃溃疡和胃腺癌中起病因学作用。(Blaser M.J.,(1993)Trends Microbiol.1:255-260)。该细菌经口途径传播,并且随着年龄的增加感染风险增加。(Taylor,D.N.和M.J.Blaser,(1991)Epidemiol.Rev. 13:42-50)。幽门螺杆菌定居于人胃粘膜,形成的感染持续数十年。幽门螺杆菌的感染在世界范围内流行。发达国家成人人群的感染率超过50%,而发展中国家20岁以上成人的感染率达90%。(Hopkins R.J.和J.G.Morris(1994)Am.J.Med. 97:265-277)。
人们对在胃环境定居和该病原体毒力所需的细菌因子知之甚少。推定的毒力因子的实例包括以下因子:脲酶,一种可能在中和胃酸pH中起作用的酶(Eaton等,(1991)Infect.Immunol. 59:2470-2475;Ferrero,R.L.和A.Lee(1991)Microb.Ecol.Hlth.Dis. 4:121-134;Labigne等,(1991)J.Bacteriol. 173:1920-1931);负责跨粘膜层游动性的细菌鞭毛蛋白(Hazell等,(1986)J.Inf.Dis. 153:658-663;Leying等,(1992)Mol.Microbiol. 6:2863-2874;和Haas等,(1993)Mol.Microbiol.8:753-760);Vac A,一种诱导上皮细胞形成细胞内空泡的细菌毒素(Schmitt,W.和R.Haas,(1994)Molecular Microbiol. 12(2):307-319);和几种胃组织特异性粘附素(Boren等,(1993)Science  262:1892-1895;Evans等,(1993)J.Bacteriol. 175:674-683;和Falk等,(1993)Proc.Natl.Acad.Sci.USA  90:2035-203)。
目前可利用许多体外根除幽门螺杆菌感染的治疗剂。(Huesca等,(1993)Zbl.Bakt. 280:244-252;Hopkins,R.J.和J.G.Morris,参见上文)。然而,由于细菌抗性、改变的药物分布、病人不依从或药物利用度差,许多这些治疗的体内有效性是次优的。(Hopkins R.J.和J.G.Morris,参见上文)。用抗生素结合铋的治疗是用来治疗幽门螺杆菌感染的标准方法的一部分。(Malfertheiner,P.和J.E.Dominguez-Munoz(1993)Clinical Therapeutics  15增刊B:37-48)。最近,质子泵抑制剂和单一抗生素的组合已经显示减轻十二指肠溃疡(Malfertheiner,P.和J.E.Doninguez-Munoz参见上文)。然而,使用抗生素药剂的方法可能有出现抗这些药剂的细菌菌株的问题(Hopkins,R.J.和J.G.Morris,参见上文)。这些限制表明,需要新的更有效方法体内对抗幽门螺杆菌感染。特别是,非常需要设计可以预防该细菌感染的新疫苗。发明概述
本发明涉及新基因,例如编码诸如来自生物幽门螺杆菌(H.pylori)的细菌表面蛋白的多肽的基因和其它相关基因;其基因产物;以及它们的用途。本发明的核酸和肽具有诊断和治疗幽门螺杆菌和其它螺杆菌属种的用途。它们也可以用来检测样品中幽门螺杆菌和其它根瘤菌属种的存在;以及用来在干扰幽门螺杆菌生活周期或抑制幽门螺杆菌感染的能力方面筛选化合物。更具体地说,本发明描述了对应于幽门螺杆菌蛋白所有编码序列的核酸组合物的特征,所述蛋白包括其表面蛋白或分泌蛋白或其部分;描述了能够结合幽门螺杆菌蛋白的mRNA以阻断蛋白翻译的核酸的特征;描述了用肽合成和重组DNA技术生产幽门螺杆菌蛋白或其部分的方法的特征。本发明也描述了可用作检测幽门螺杆菌感染的探针的抗体和核酸的特征。另外,保护抵抗幽门螺杆菌感染或治疗幽门螺杆菌感染的疫苗组合物和方法也属于本发明范围。附图详述
图1描述了5种幽门螺杆菌蛋白的氨基酸序列对比(以单字母氨基酸密码描述,并以其氨基酸序列识别号标示;从左至右显示N末端至C末端)。
图2描述3种幽门螺杆菌蛋白的N末端部分(以单字母氨基酸密码描述,并以其氨基酸序列识别号标示;从左至右显示N末端至C末端)。发明详述
一方面,本发明描述了SEQ IN NO:98的幽门螺杆菌多肽的重组或大致纯制剂的特征。本发明也包括编码SEQ ID NO:98的幽门螺杆菌多肽的大致纯的核酸,这种核酸包含于SEQ ID NO:1中。本文描述的本发明的幽门螺杆菌多肽序列包含于序列表中,编码本发明幽门螺杆菌多肽的核酸包含于序列表中。
另一方面,本发明描述了编码具有SEQ ID NO:99氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:2核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:100氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:3核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:101氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:4核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:102氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:5核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:103氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:6核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:104氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:7核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:105氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:8核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:106氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:9核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:107氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:10核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:108氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:11核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:109氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:12核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:110氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:13核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:111氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:14核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:112氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:15核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:113氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:16核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:114氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:17核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:115氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:18核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:116氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:19核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:117氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:20核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:118氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:21核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:119氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:22核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:120氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:23核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:121氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:24核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:122氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:25核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:123氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:26核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:124氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:27核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:125氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:28核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:126氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:29核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:127氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:30核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:128氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:31核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:129氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:32核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:130氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:33核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:131氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:34核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:132氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:35核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:133氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:36核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:134氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:37核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:135氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:38核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:136氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:39核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:137氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:40核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:138氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:41核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:139氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:42核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:140氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:43核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:141氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:44核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:142氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:45核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:143氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:46核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:144氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:47核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:145氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:48核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:146氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:49核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:147氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:50核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:148氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:51核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:149氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:52核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:150氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:53核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:151氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:54核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:152氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:55核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:153氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:56核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:154氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:57核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:155氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:58核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:156氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:59核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:157氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:60核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:158氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:61核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:159氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:62核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:160氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:63核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:161氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:64核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:162氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:65核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:163氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:66核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:164氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:67核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:165氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:68核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:166氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:69核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:167氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:70核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:168氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:71核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:169氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:72核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:170氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:73核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:171氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:74核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:172氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:75核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:173氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:76核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:174氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:77核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:175氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:78核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:176氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:79核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:177氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:80核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:178氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:81核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:179氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:82核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:180氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:83核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:181氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:84核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:182氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:85核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:183氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:86核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:184氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:87核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:185氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:88核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:186氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:89核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:187氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:90核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:188氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:91核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:189氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:92核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:190氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:93核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:191氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:94核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:192氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:95核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:193氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:96核苷酸序列的核酸。
另一方面,本发明描述了编码具有SEQ ID NO:194氨基酸序列的幽门螺杆菌多肽的大致纯的核酸的特征,诸如包含SEQ ID NO:97核苷酸序列的核酸。
另一方面,本发明描述了其核苷酸序列编码的幽门螺杆菌多肽至少大约60%同源于选自SEQ ID NO:98-SEQ ID NO:194的氨基酸序列的分离的核酸的特征。在一个最佳实施方案中,所述分离的核酸包括选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列。
另一方面,本发明描述了其核苷酸序列编码选自SEQ ID NO:98-SEQ ID NO:194的幽门螺杆菌多肽的分离核酸的特征。
另一方面,本发明描述了编码幽门螺杆菌多肽的分离核酸的特征,所述分离核酸的核苷酸序列至少大约60%同源于选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列。
另一方面,本发明描述了编码幽门螺杆菌多肽、其核苷酸序列在严格杂交条件下与具有选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列的核酸分子或其互补序列杂交的分离的核酸分子的特征。
另一方面,本发明描述了其核苷酸序列至少长8个核苷酸的分离的核酸的特征,其中该序列在严格杂交条件下与具有选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列的核酸或其互补序列杂交。
特别优选的是其核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:63、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:61、SEQ IDNO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:65、SEQ ID NO:66、SEQ ID NO:48、SEQ ID NO:49、SEQID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:60、SEQ ID NO:69和SEQ ID NO:83或其互补序列。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由具有SEQ ID NO:63的核苷酸序列的核酸或其互补序列编码幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补序列编码的幽门螺杆菌内膜多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQID NO:38和SEQ ID NO:39。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸或其互补序列编码的参与转运的幽门螺杆菌多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:43和SEQ ID NO:44。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补序列编码的幽门螺杆菌外膜多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:65和SEQ ID NO:66。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补序列编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:50、SEQID NO:51、SEQ ID NO:52、SEQ ID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91和SEQ ID NO:94。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补序列编码的具有一个末端苯丙氨酸残基和C末端酷氨酸簇的幽门螺杆菌多肽或其片段:SEQ ID NO:11、SEQ IDNO:26、SEQ ID NO:36、SEQ ID NO:42和SEQ ID NO:52。
特别优选的是其核苷酸序列编码选自以下的一种幽门螺杆菌胞外被膜多肽或其片段的分离的核酸:SEQ ID NO:160、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQID NO:126、SEQ ID NO:127、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:98、SEQID NO:99、SEQ ID NO:103、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:157、SEQ ID NO:166和SEQ ID NO:180。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为具有SEQ ID NO:160的氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段:SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135和SEQID NO:136。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为选自以下的参与转运的一种幽门螺杆菌多肽或其片段:SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140和SEQ ID NO:141。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:162和SEQ ID NO:163。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQID NO:121、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:147、SEQID NO:148、SEQ ID NO:149、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQID NO:188和SEQ ID NO:191。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139和SEQ ID NO:149。
特别优选的是其核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离的核酸,其中所述核酸选自:SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ IDNO:89、SEQ ID NO:92和SEQ ID NO:93。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,其中所述核酸选自SEQ IDNO:57和SEQ ID NO:58或其互补序列。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,其中所述核酸选自SEQ ID NO:86、SEQ ID NO:87或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌胞质多肽或其片段的分离的核酸:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:189和SEQ ID NO:190。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:154和SEQ ID NO:155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:183和SEQ ID NO:184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
特别优选的是其核苷酸序列编码幽门螺杆菌分泌多肽或其片段的分离的核酸,其中所述核酸选自:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:20、SEQ ID NO:25、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:45、SEQ IDNO:46、SEQ ID NO:53、SEQ ID NO:64、SEQ ID NO:67、SEQID NO:70、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:90、SEQ ID NO:95和SEQ ID NO:97或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌分泌多肽或其片段的分离的核酸:SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:117、SEQ ID NO:122、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:142、SEQID NO:143、SEQ ID NO:150、SEQ ID NO:161、SEQ ID NO:164、SEQ ID NO:167、SEQ ID NO:174、SEQ ID NO:175、SEQID NO:178、SEQ ID NO:179、SEQ ID NO:187、SEQ ID NO:192和SEQ ID NO:194。
特别优选的是其核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离的核酸,其中所述核酸选自:SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:33、SEQ ID NO:37、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:47、SEQ ID NO:54、SEQID NO:55、SEQ ID NO:56、SEQ ID NO:59、SEQ ID NO:62、SEQ ID NO:68、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76和SEQ IDNO:96或其互补序列。
特别优选的是其核苷酸序列编码选自以下的幽门螺杆菌细胞多肽或其片段的分离的核酸:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:118、SEQ ID NO:130、SEQ ID NO:134、SEQ ID NO:137、SEQ ID NO:138、SEQ ID NO:144、SEQ ID NO:151、SEQID NO:152、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159、SEQ ID NO:165、SEQ ID NO:168、SEQ ID NO:169、SEQID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173和SEQ ID NO:193。
另一方面,本发明描述了一种探针的特征,该探针的核苷酸序列包含选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列的至少8个核苷酸。
另一方面,本发明描述了其氨基酸序列至少大约60%同源于选
自SEQ ID NO:98-SEQ ID NO:194的一种幽门螺杆菌多肽的分离的幽门蚴杆菌多肽的特征。
另一方面,本发明描述了由下述核酸编码的分离的幽门螺杆菌多肽的特征,所述核酸的核苷酸序列至少约60%同源于选自SEQ ID NO:1-SEQ ID NO:97的一种核苷酸序列。在一个实施方案中,所述分离的幽门螺杆菌多肽由选自SEQ ID NO:1-SEQ ID NO:97的一种核苷酸序列编码。
另一方面,本发明描述了由下述核酸编码的分离的幽门螺杆菌多肽的特征,所述核酸在严格杂交条件下与选自SEQ ID NO:1-SEQ IDNO:97的一种核酸或其互补序列杂交。
另一方面,本发明描述了其氨基酸序列选自SEQ ID NO:97-SEQID NO:194的分离的幽门螺杆菌多肽的特征。
特别优选的是一种分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽选自:SEQ ID NO:160、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQ ID NO:111、SEQID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQID NO:127、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:98、SEQ ID NO:99、SEQ IDNO:103、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:157、SEQ ID NO:166和SEQ ID NO:180。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为具有SEQ ID NO:160的氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的幽门螺杆菌内膜多肽或其片段:SEQ ID NO:145、SEQ IDNO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135和SEQ ID NO:136。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为选自以下的参与转运的幽门螺杆菌多肽或其片段:SEQ ID NO:145、SEQID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135和SEQID NO:136。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:162和SEQ ID NO:163。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQID NO:121、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:147、SEQID NO:148、SEQ ID NO:149、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQID NO:188和SEQ ID NO:191。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139和SEQ ID NO:149。
特别优选的是一种分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:63、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:65、SEQ ID NO:66、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:38、SEQ ID NO:39、SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:60和SEQ ID NO:69、SEQ ID NO:83。
在一个实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由具有SEQ ID NO:63的核苷酸序列的核酸编码的幽门螺杆菌鞭毛相关多肽或其片段。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌内膜多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:38和SEQID NO:39。
在另一实施方案中,所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸编码的参与转运的幽门螺杆菌多肽或其片段:SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQID NO:19、SEQ ID NO:43和SEQ ID NO:44。
在另一实施方案中,所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌外膜多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:61、SEQID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:65和SEQ ID NO:66。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:61、SEQ ID NO:79、SEQ IDNO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91和SEQID NO:94。
在另一实施方案中,所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段:SEQ ID NO:11、SEQ ID NO:26、SEQID NO:36、SEQ ID NO:42和SEQ ID NO:52。
特别优选的是一种分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽选自:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQIDNO:189和SEQ ID NO:190。
在另一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:154和SEQ ID NO:155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:183和SEQ ID NO:184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
特别优选的是一种分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:92和SEQ ID NO:93。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQID NO:57和SEQ ID NO:58的一种核酸编码。
在一个实施方案中,所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQ ID NO:86和SEQ ID NO:87的一种核酸编码。
特别优选的是一种分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽选自:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:118、SEQ ID NO:130、SEQ ID NO:134、SEQ ID NO:137、SEQID NO:138、SEQ ID NO:144、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159、SEQID NO:165、SEQ ID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173和SEQID NO:193。
特别优选的是一种分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽由选自以下的一种核酸编码:SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:33、SEQ ID NO:37、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:47、SEQ ID NO:54、SEQID NO:55、SEQ ID NO:56、SEQ ID NO:59、SEQ ID NO:62、SEQ ID NO:68、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76和SEQ IDNO:96。
特别优选的是一种分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽选自:SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:117、SEQ ID NO:122、SEQID NO:128、SEQ ID NO:129、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:150、SEQ ID NO:161、SEQ ID NO:164、SEQID NO:167、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:187、SEQ ID NO:192和SEQID NO:194。
特别优选的是一种分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:20、SEQ ID NO:25、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:45、SEQ IDNO:46、SEQ ID NO:53、SEQ ID NO:64、SEQ ID NO:67、SEQID NO:70、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:90、SEQ ID NO:95和SEQ ID NO:97。
另一方面,本发明描述了包含至少两种幽门螺杆菌多肽或其片段的一种嵌合幽门螺杆菌多肽的特征,其中所述多肽由选自SEQ ID NO:1-SEQ ID NO:97的核酸序列编码。
另一方面,本发明描述了包含至少两种幽门螺杆菌多肽或其片段的一种嵌合幽门螺杆菌多肽的特征,其中所述多肽选自SEQ ID NO:98-SEQ ID NO:194。
另一方面,本发明描述了包含操作性连接至一种非幽门螺杆菌多肽的一种幽门螺杆菌多肽的融合蛋白的特征,所述幽门螺杆菌多肽包含选自SEQ ID NO:98-SEQ ID NO:194的一种氨基酸序列。
另一方面,本发明描述了预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂的特征,该制剂包含有效量的至少一种本发明分离的核酸。
另一方面,本发明描述了预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂的特征,该制剂包含有效量的至少一种本发明的幽门螺杆菌多肽。
最好是,本发明的疫苗制剂还包含一种药用可接受的载体。在一种实施方案中,所述药用可接受的载体包括一种佐剂。在另一实施方案中,所述药用可接受的载体包括一个传递系统,例如活载体,例如细菌或病毒。在另一实施方案中,所述药用可接受的载体包括一种佐剂和一个传递系统。
另一方面,本发明描述了治疗或降低受治疗者的幽门螺杆菌感染或感染风险的方法的特征。该方法包括给予受治疗者一种本发明的疫苗制剂,使得治疗幽门螺杆菌感染或降低其风险。
另一方面,本发明描述了生产本发明疫苗制剂的方法的特征。该方法包括将至少一种分离的幽门螺杆菌多肽或其片段与药用可接受的载体混合,由此形成疫苗制剂,其中所述幽门螺杆菌多肽选自SEQID NO:98-SEQ ID NO:194。
另一方面,本发明描述了生产本发明疫苗制剂的方法的特征。该方法包括在允许幽门螺杆菌或其片段表达的条件下培养细胞,其中所述幽门螺杆菌多肽选自SEQ ID NO:98-SEQ ID NO:194;从所述细胞分离所述幽门螺杆菌多肽;将至少一种分离的幽门螺杆菌多肽或其片段与药用可接受的载体混合,由此形成疫苗制剂。
另一方面,本发明涉及各个幽门螺杆菌多肽成员或编码这一成员的核酸,所述成员为上述各组的幽门螺杆菌多肽。
另一方面,本发明描述了能够结合幽门螺杆菌mRNA的核酸的特征。这种核酸能够用作反义核酸,以控制幽门螺杆菌mRNA的翻译。再一方面,描述了能够特异性结合于幽门螺杆菌核酸的核酸的特征。这些核酸本文也称为互补序列,具有作为探针或和捕获试剂的用途。
另一方面,本发明描述了一种表达系统的特征,该系统包含对应于幽门螺杆菌核酸的可读框。所述核酸还包含与计划中的宿主相容的控制序列。该表达系统可用来制备对应于幽门螺杆菌核酸的多肽。
另一方面,本发明描述了用该表达系统转化以产生幽门螺杆菌多肽的细胞的特征。
另一方面,本发明描述了产生抗幽门螺杆菌多肽的抗体的特征,所述抗体能够特异性地结合于幽门螺杆菌多肽。这类抗体具有作为免疫测定的试剂的用途,以评价幽门螺杆菌特异性抗原的丰度和分布。
另一方面,本发明描述了产生用于免疫个体以抵抗幽门螺杆菌的疫苗的方法的特征。该疫苗接种的方法包括:用至少一种按照本发明的幽门螺杆菌多肽(例如一种表面多肽或分泌多肽或它们的活性部分)和药用可接受载体免疫受治疗者。这类疫苗具有治疗和/或预防的用途。
另一方面,本发明提供产生疫苗的方法,所述疫苗包含一种修饰的免疫原性幽门螺杆菌多肽(例如一种表面多肽或分泌多肽或它们的活性部分)和药理学可接受的载体。
另一方面,本发明描述了评价一种化合物(例如一种多肽,例如宿主细胞多肽的片段)结合幽门螺杆菌多肽的能力的方法的特征。该方法包括:使该候选化合物与一种幽门螺杆菌多肽接触,并确定该化合物是否结合幽门螺杆菌多肽或者与其相互作用。结合幽门螺杆菌的化合物为该细菌生活周期的激活剂或抑制剂的候选物。这些测定可以在体外或体内进行。
另一方面,本发明描述了评价一种化合物(例如一种多肽,例如宿主细胞多肽的片段)结合幽门螺杆菌核酸(例如DNA或RNA)的能力的方法的特征。该方法包括:使该候选化合物与一种幽门螺杆菌核酸接触,并确定该化合物是否结合幽门螺杆菌多肽或者与其相互作用。结合幽门螺杆菌的化合物为该细菌生活周期的激活剂或抑制剂的候选物。这些测定可以在体外或体内进行。
本发明描述了幽门螺杆菌多肽、最好是大致纯的幽门螺杆菌多肽制剂或重组幽门螺杆菌多肽的特征。在最佳实施方案中,该多肽具有生物学活性;该多肽的氨基酸序列至少60%、70%、80%、90%、95%、98%或99%相同于或同源于序列表中含有的本发明的氨基酸序列,优选的是它与序列表中含有的本发明的氨基酸序列具有大约65%序列同一性;最优选的是,它与序列表中含有的本发明的氨基酸序列具有大约92%至大约99%的序列同一性;该多肽的氨基酸序列与序列表中含有的本发明的氨基酸序列基本上相同;该多肽长度为至少5、10、20、50、100或150个氨基酸残基;该多肽包括至少5个、优选至少10个、更优选至少20个、更优选至少50、100或150个连续的序列表中含有的本发明的氨基酸残基。在再一实施方案中,本发明也包括与序列表中含有的本发明氨基酸序列的序列同一性的差异为约7%至约8%的氨基酸序列。
在最佳实施方案中,所述幽门螺杆菌多肽由序列表中含有的本发明的核酸编码,或由与序列表中含有的本发明的核酸的同源性至少为60%、70%、80%、90%、95%、98%或99%的核酸编码。
在一个最佳实施方案中,主题幽门螺杆菌多肽的氨基酸序列与序列表中含有的本发明序列于1、2、3、5、10或更多个残基不同。然而,所述差异使得该幽门螺杆菌多肽表现出一种幽门螺杆菌的生物学活性,例如该幽门螺杆菌多肽保留天然产生的幽门螺杆菌多肽的一种生物学活性。
在最佳实施方案中,该多肽包括序列表中含有的本发明的所有氨基酸序列或其片段;该序列或片段符合读框地融合于其它氨基酸残基,最好是融合于编码序列表中含有的本发明序列的基因组DNA 5’或3’的基因组DNA编码的残基。
在再一最佳实施方案中,该幽门螺杆菌多肽为重组融合蛋白,该蛋白具有第一种幽门螺杆菌多肽部分和第二种多肽部分(例如其氨基酸序列与幽门螺杆菌无关的第二种多肽部分)。该第二种多肽部分可以例如为谷胱苷肽-S-转移酶、DNA结合域或聚合酶激活域中的任何一种。在最佳实施方案中,该融合蛋白可以用于双杂交测定中。
本发明的多肽包括由于以下事件产生的那些多肽:替代的转录事件、替代的RNA剪接事件和替代的翻译和翻译后事件。
本发明也包括免疫原性组分,该组分包括免疫原性制剂中的至少一种幽门螺杆菌多肽;该免疫原性组分能够诱出对该幽门螺杆菌多肽特异性的免疫应答,例如体液应答、抗体应答或细胞应答。在最佳实施方案中,该免疫原性组分包括序列表中含有的本发明多肽的至少一种抗原决定簇。
另一方面,本发明提供大致纯的核酸,其核苷酸序列编码一种幽门螺杆菌多肽。在最佳实施方案中:该编码的多肽具有生物学活性;该编码的多肽的氨基酸序列至少60%、70%、80%、90%、95%、98%或99%同源于序列表中含有的本发明的氨基酸序列;该编码的多肽的氨基酸序列与序列表中含有的本发明的氨基酸序列基本相同;该编码的多肽至少为5、10、20、100或150个氨基酸的长度;该编码的多肽包括至少5个、优选至少10个、更优选至少20个、更优选至少50个、100个或150个连续的序列表中含有的本发明的氨基酸。
在最佳实施方案中,本发明的核酸为序列表中含有的核酸;该核酸至少60%、70%、80%、90%、95%、98%或99%同源于序列表中含有的本发明的核酸序列。
在一种最佳实施方案中,该编码的幽门螺杆菌多肽的氨基酸序列至少于1、2、3、5、10和更多个残基不同于(例如由于氨基酸取代、加入或缺失至少一个氨基酸残基)序列表中含有的本发明的序列。然而,所述差异使得:该幽门螺杆菌编码的多肽表现出一种幽门螺杆菌的生物学活性,例如该编码的幽门螺杆菌酶保留天然产生的幽门螺杆菌的一种生物学活性。
在最佳实施方案中,该编码的多肽包括序列表中含有的本发明的氨基酸序列的全部或其片段;该序列或其片段符合读框地融合于另外的氨基酸残基,最好是融合于编码序列表中含有的本发明序列的基因组DNA 5’或3’的基因组DNA编码的残基。
在最佳实施方案中,主题幽门螺杆菌核酸将包括转录调节序列(例如至少一种转录启动子或转录增强子序列),该序列操作性地连接于该幽门螺杆菌基因序列,例如以使得该幽门螺杆菌基因序列适于在重组宿主细胞中表达。
在又一最佳实施方案中,编码本发明幽门螺杆菌多肽的核酸在严格条件下与核酸探针杂交,其中所述探针对应于至少8个连续的序列表中含有的本发明的核苷酸;更优选至少对应于至少12个连续的序列表中含有的本发明的核苷酸;更优选对应于至少40个连续的序列表中含有的本发明的核苷酸。
在一个最佳实施方案中,该核酸编码一种多肽,该多肽因至少一个氨基酸残基不同于序列表中含有的本发明的序列。
在一个最佳实施方案中,该核酸至少有一个核苷酸不同于序列表中含有的本发明的核苷酸序列,而所述本发明的核苷酸序列编码序列表中含有的本发明的氨基酸序列。
另一方面,本发明包括:包含本文描述的一种幽门螺杆菌多肽或一种幽门螺杆菌多肽变异体的编码核酸的载体;用该载体转化的宿主细胞;生产重组幽门螺杆菌多肽或幽门螺杆菌多肽变异体的方法;包括例如在细胞培养基中培养所述细胞,并例如从所述细胞或所述细胞培养基中分离该幽门螺杆菌多肽或幽门螺杆菌多肽变异体。
另一方面,本发明描述了纯化的重组核酸的特征,所述核酸与序列表中含有的本发明核酸至少有50%、60%、70%、80%、90%、95%、98%或99%的同源性。
本发明也提供包括大致纯的寡核苷酸的探针或引物。所述寡核苷酸包括一个核苷酸序列区,该区在严格条件下与序列表中含有的本发明的有义序列或反义序列或其天然产生的突变体的至少8个连续核苷酸杂交。在最佳实施方案中,所述探针或引物还包括与其连接的标记基团。所述标记基团可以是例如放射性同位素、荧光化合物、酶和/或酶的辅因子。最好是,所述寡核苷酸至少长8个寡核苷酸并少于10、20、30、50、100或150个核苷酸。
本发明也提供一种分离的幽门螺杆菌多肽,所述多肽由在严格条件下与序列表中含有的核酸杂交的核酸编码。
本发明还提供编码本发明多肽的核酸,例如RNA或DNA。这包括双链核酸以及反义单链核酸。
其基因组序列已经测序的幽门螺杆菌菌株已经以菌株HP-J99保藏于美国典型培养物保藏中心(ATCC # 55679;由GenomeTherapeutics Corporation进行了保藏,100 Beaver Street,Walthan,MA02154)。
本发明包括:等位基因变异;天然突变体;诱导的突变体;有下述DNA编码的蛋白,所述DNA在高或低的严格条件下与编码序列表中含有的本发明多肽的核酸杂交(关于高严格性和低严格性,参见Current Protocols in Molecular Biology,John Wiley & Sons,New York,1989,6.3.1-6.3.6和6.4.1-6.4.10,在此通过引用结合到本文中);以及抗幽门螺杆菌多肽的抗血清特异性结合的多肽。本发明也包括片段,最好是生物活性片段。这些多肽和其它多肽本文也称为幽门螺杆菌类似物或变异体。
已经确定了几种本发明幽门螺杆菌多肽的推测功能,如表1所示。
因此,基于这些鉴定功能的要求保护的幽门螺杆菌多肽的用途以及本文所述的其它功能也属于本发明范围。
另外,本发明包括特征如以下表1所示的幽门螺杆菌多肽,包括:幽门螺杆菌胞外被膜蛋白、幽门螺杆菌分泌蛋白、幽门螺杆菌胞质蛋白和幽门螺杆菌细胞蛋白。这些组的成员通过BLAST同源性检索和检索分泌信号或跨膜蛋白基元而鉴定。与表1多肽具显著同源性的相关多肽也被认为以表1所示的同源性方式分类。
                                   表   1
    ntSeqID[PCT]   aaSeqID[PCT]
A.胞外被膜
  A.1鞭毛相关的
hp1p13939_24322162_f3_17     63   160
  A.2外膜
    A.2.1末端phe残基
02ge10116_23462_f2_43     7   104
02ge10116_804550_f2_44     8   105
02ge41622_14875000_c2_65     9   106
01cp20708_214843_c2_49     13   110
01cp20708_4960952_c1_43     14   111
06ae11016_4729625_c3_68     23   120
06ep10615_49068_c2_87     24   121
06gp71906_35158328_f3_85     27   124
06gp71906_3941642_f2_70     28   125
13ae10610_156411_c3_33     50   147
13ae10610_6522827_c3_37     51   148
hp4e53394_11798952_c2_101     61   158
06ge20501_4298568_c3_53     79   176
11ae12004_3367666_c2_41     80   177
hp7e10433_5345837_c3_13     84   181
14ce61516_24609816_f2_9     85   182
11ap20714_2077_c3_103     91   188
02cp10615_21908138_f1_4     94   191
    A.2.2无末端phe残基
07gp11909_26460892_f2_6     5   102
    A.2.3具Phe和C端的Tyr簇
02ge41622_34176513_c1_50     11   108
06gp71906_20486556_f2_65     26   123
hp7e10520_14728137_f1_1     36   133
02ae31010_417818_f3_29     42   139
13ae10610_26855313_f3_15     52   149
    A.2.4通过同源性
hp5p15212_13729635_c3_35     22     119
07ee11402_1046877_c3_100     29     126
14ee41924_1046877_c3_104     30     127
hp1p13939_21641016_f1_1     65     162
hp4p62853_476669_1_f3_23     66     163
  A.3内膜
    A.3.1参与转运的蛋白
06cp30603_664083_c1_94     48     145
09cp10712_36359687_c1_119     49     146
04ep41903_16667055_c1_37     17     114
04ep41903_19689182_c1_43     18     115
14ce31519_24650009_c1_17     19     116
09ce10413_26734687_f3_23     43     140
hp6p10904_6726062_fe_13     44     141
    A.3.2其它内膜蛋白
02ae3_1010_16679640_f2_21     38     135
07ee50709_16679640_f3_60     39     136
  A.4其它胞外被膜蛋白
01ce61016_1056562_c3_123     1     98
09cp61003_16619192_c2_83     2     99
02ge10116_15632000_c2_114     6     103
04ae61517_12345837_f2_4     34     131
04ae61517_21744091_f3_5     35     132
hp4e13394_26750068_c3_113     60     157
hp5p15575_1053590_c1_35     69     166
hp7e10433_5345837_c2_8     83     180
B.胞质蛋白
  B.1.参与mRNA翻译的蛋白
hp3e10946_32609412_f3_4     57     154
hp3e10946_34175837_f3_3     58     155
  B.2参与基因组复制翻译、重组和修复的蛋白
14ce61516_12600937_f2_11     86     183
14cp11908_25402267_c3_104     87     184
   B.3其它胞质蛋白
05ce10910_23712780_c1_4     88     185
hp7e10192_23712780_f2_5     89     186
11ap20714_34663910_f3_29     92     189
hp8e10065_4962812_f2_18     93     190
C.分泌蛋白
01ce61016_23593955_c3_140     3     100
09cp61003_23593955_c1_79     4     101
02ge41622_20730462_f1_19     10     107
01cp20708_10628177_c2_50     12     109
05ae30220_24415693_c3_175     20     117
06gp10409_4015687_f2_11     25     122
hp2e10911_10213593_c1_73     31     128
hp2e10911_35567005_c2_88     32     129
09ze10333_1457137_f3_11     45     142
06cp30603-10744075_c3_136     46     143
12ae10622_30273255_f1_13     53     150
05ce10208_4707035_c2_17     64     161
06ep30223_176437_c2_134     67     164
hp5p15575_26016387_f2_16     70     167
hp6p12244_4881375_c3_97     77     174
06ce20610_34647187_c2_33     78     175
hp7e10433_36339535_f3_3     81     178
hp7e10433_36339535_f3_3     82     179
hp7e10420_24391078_f1_3     90     187
02ce71018_35720091_c3_4     95     192
hp6e10363_30517031_f3_3     97     194
D.其它组胞蛋白
01ae11010_26437877_c2_52     15     112
hp4p33322_5891077_c2_45     16     113
hp3p21118_54628_c3_3     21     118
02ae31010_1064125_f1_11     33     130
hp2e10911_15680337_c3_105     37     134
hp2e10911_24804577_c3_104     40     137
hp2e10911_32234750_c1_68     41     138
06cp30603_26070252_c3_140     47     144
03ae10804_235286_f3_19     54     151
09ge11604_4804692_c1_8     55     152
hp2p10610_21987687_c2_5     56     153
hp4e13394_26182793_f2_45     59     156
hp4e53394_2082126_c2_102     62     159
06ep30223_25402187_c1_112     68     165
hp6e10491_12712706_f3_12     71     168
hp6p12129_12542880_c3_29     72     169
hp6p12129_17067265_c3_29     73     170
hp6p12129_214055_f1_2     74     171
hp6p12129_214055_f3_17     75     172
hp6p12244_33492712_c3_88     76     173
hp1e13054_22360653_f2_4     96     193
[在表1中,“nt”表示核苷酸Seq.ID号,而“aa”表示氨基酸Seq.ID号]定义
本文所用的术语“纯化的多肽”和“分离的多肽”以及“大致纯的多肽制剂”在本文中可互换使用,是指已经大致、最好是完全同与其天然存在的其它蛋白、脂质和核酸分离的多肽。最好是该多肽也与用来纯化其的例如抗体或凝胶基质(例如聚丙烯酰胺)的物质分离。最好是该多肽构成所述纯化制剂干重的至少10、20、50、70、80或95%。最好是,所述制剂含有:足以允许蛋白测序的多肽;至少1、10或100μg该多肽;至少1、10或100mg该多肽。此外,本文所用的术语“纯化的多肽”和“分离的多肽”以及“大致纯的多肽制剂”既是指得自天然的多肽,也是指通过本文所述的重组DNA技术产生的多肽。
例如,一种“分离的”或“纯化的”蛋白或其生物活性部分大致不含衍生该幽门螺杆菌蛋白的细胞或组织来源的细胞物质或其它污染蛋白,或当化学合成时大致不含化学前体或其它化学物质。术语“大致不含细胞物质”包括幽门螺杆菌蛋白的制剂,其中该蛋白与从中分离或重组产生该蛋白的细胞的细胞组分分离。在一个实施方案中,术语“大致不含细胞物质”包括这样的幽门螺杆菌蛋白制剂,所述制剂含有少于大约30%(干重)的非幽门螺杆菌蛋白(本文也称为“污染蛋白”),更优选少于大约20%非幽门螺杆菌蛋白,再更优选少于大约10%的非幽门螺杆菌蛋白,最优选少于5%非幽门螺杆菌蛋白。当重组生产幽门螺杆菌蛋白或其生物活性部分时,它也最好是大致不含培养基,即培养基占该蛋白制剂体积的不到大约20%,更优选少于大约10%,最优选少于大约5%
术语“大致不含化学前体或其它化学物质”包括幽门螺杆菌蛋白制剂,其中该蛋白与参与合成该蛋白的化学前体或其它化学药品分离。在一个实施方案中,术语“大致不含化学前体或其它化学物质”包括这样的幽门螺杆菌蛋白制剂,它具有少于大约30%(干重)的化学前体或非幽门螺杆菌化学物质,更优选少于大约20%的化学前体或非幽门螺杆菌化学物质,再更优选少于大约10%的化学前体或非幽门螺杆菌化学物质,最优选少于大约5%的化学前体或非幽门螺杆菌化学物质。
在植物或动物细胞的情况下,纯化的细胞制剂是指一种体外细胞制剂,而不是整个完整的植物或动物。在培养细胞或微生物细胞的情况下,它包括至少10%、更优选50%主题细胞的制剂。
纯化或分离或大致纯的核酸,例如大致纯的DNA(是在本文中可互换的术语),为一种或两种下述的核酸:与衍生该核酸的生物体的天然存在的基因组中紧密相邻(即,一个位于5’端及一个位于3’端)的两个编码序列非紧密相邻;或它大致不含在衍生该核酸的生物体中存在的核酸。该术语包括例如加入载体(例如自主复制型质粒或病毒)、或加入原核细胞和真核细胞基因组DNA中、或作为独立于其它DNA序列的分离分子存在(例如通过PCR或限制性内切核酸酶处理产生的cDNA或基因组DNA片段)的重组DNA。大致纯的DNA也包括为编码另一幽门螺杆菌DNA序列的杂种基因部分的重组DNA。
本文所用的“重叠群”是代表一段连续的生物体的基因组序列的核酸。
“可读框”也称为ORF,为编码多肽的核酸区。该区可以代表编码序列或总序列的一部分,可以从终止密码子至终止密码子或从起始密码子至终止密码子确定。
本文所用的“编码序列”为置于合适的调节序列控制之下时,转录为信使RMA和/或翻译为多肽的核酸。由5个引物末端的翻译起始密码子和三个引物末端的翻译终止密码子确定编码序列的边界。编码序列可以包括但不限于信使RNA序列、合成DNA序列和重组核酸序列。
本文所用的核酸的“互补序列”是指参与于原始序列Watson-Crick碱基配对的反向平行或反义序列。
“基因产物”是由基因特异性编码的蛋白和结构RNA。
本文所用的术语“探针”是指特异性结合于目的分子的核酸、肽或其它化学实体。探针常常与标记结合,或能够结合标记。标记为能够检测的化学部分。通常,标记包括染料、放射性同位素、发光部分和化学发光部分、荧光团、酶、沉淀剂、扩增序列等。同样,特异性结合于目的分子并将这种分子固定化的核酸、肽或其它化学实体本文称为“捕获配体”。捕获配体通常与支持物结合或能够结合支持物,所述支持物诸如硝酸纤维素、玻璃、尼龙膜、珠粒、颗粒等。杂交的特异性取决于诸如所述核苷酸的碱基对组成以及反应温度和盐浓度的条件。本领域技术人员采用常规实验,可容易地辨别这些条件。
同源的是指两种多肽之间或两种核酸分子之间的序列相似性或序列同一性。当同一碱基或氨基酸单体亚基占据两个相比序列中的一个位置时,例如如果两个DNA分子中的每一个中的一个位置均被腺苷酸占据,则所述分子在该位置是同源的。两个序列之间的同源性百分比为这两个序列共享的匹配或同源位置数除以所比较位置数×100的函数。例如,如果两个序列中10个位置中的6个匹配或同源,则这两个序列的同源性为60%。例如,DNA序列ATTGCC和TATGGC具有50%的同源性。一般而言,当两个序列序列对齐时进行比较,以得出最大同源性。
当至少核酸的一条链在限定的严格条件下可以退火至另一核酸时,核酸相互之间可杂交。如下确定杂交的严格性:(a)进行杂交和/或洗涤的温度;以及(b)杂交溶液和洗涤溶液的离子强度和极性。杂交需要这两种核酸具有互补序列;然而,根据杂交的严格性,可以容忍错配。通常,两种序列在高严格性下(诸如于65℃、在0.5X SSC溶液中)的杂交需要所述序列基本上完全同源。中等严格性(诸如于65℃、2X SSC)和低严格性(诸如于55℃、2X SSC)的条件需要所述杂交序列之间相应较低的整体互补性。(1X SSC为0.15M NaCl、0.015M柠檬酸钠)。严格杂交条件的一个优选的非限制性实例为于大约45℃、在6X氯化钠/柠檬酸钠(SSC)中杂交,然后于50-65℃、0.2XSSC、0.1%SDS中洗涤一次或多次。
术语肽、蛋白和多肽在本文中可互换使用。
本文所用的术语“表面蛋白”是指所有表面可及的蛋白,例如内膜蛋白和外膜蛋白、粘附于细胞壁的蛋白以及分泌蛋白。
如果一个多肽具有以下性质中的一个、两个以及最好是多个,则该多肽具有幽门螺杆菌的生物活性:(1)如果在幽门螺杆菌感染过程中表达时,它可以促进或介导幽门螺杆菌粘附于细胞;(2)它具有幽门螺杆菌蛋白特征性酶活性、结构功能或调节功能;(3)其编码基因可以拯救一种幽门螺杆菌基因中的致死突变;(4)或它在受治疗者中具有免疫原性。如果一种多肽是具有上述性质之一的多肽的拮抗剂、激动剂或超级激动剂,则该多肽具有生物活性。
生物活性片段或类似物是这样的片段或类似物,它具有序列表中含有的本发明幽门螺杆菌多肽或天然存在的幽门螺杆菌多肽特征性的一种体内或体外活性,例如本文所述一种或多种生物活性。尤其优选的是体内存在的片段,例如由转录后加工产生的片段或由另一种剪接的RNA的翻译产生的片段。片段包括在天然或内源细胞中表达的片段以及在表达系统(例如在CHO细胞中)产生的片段。因为诸如幽门螺杆菌多肽的肽常常表现出一定范围的生理性质,并且因为这类性质可能由该分子的不同的部分产生,所以有用的幽门螺杆菌片段或幽门螺杆菌类似物为在任何幽门螺杆菌活性的测定中表现出一种生物活性的片段或类似物。最优选的是,该片段或类似物在任何体内或体外测定中具有10%、优选40%、更优选60%、70%、80%或90%或更高的幽门螺杆菌的活性。
类似物可以在氨基酸序列上或在不涉及序列的方式上或在这两个方面不同于天然存在的幽门螺杆菌多肽。非序列修饰包括乙酰化、甲基化、磷酸化、羧化或糖基化的改变。优选的类似物包括其序列因一个或多个保守氨基酸取代或基本上不消除该幽门螺杆菌多肽生物活性的一个或多个非保守的氨基酸取代、缺失或插入而不同于野生型序列的幽门螺杆菌多肽(或其生物活性片段)。保守的取代通常包括一个氨基酸取代另一个具有相似特征的氨基酸,例如以下组内的取代:缬氨酸、甘氨酸;甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。其它保守取代可以根据下表产生。
                            表  2
                      保守性氨基酸取代
对于氨基酸 密码 用以下任何一个取代
丙氨酸 A D-Ala,Gly,β-Ala,L-Cys,D-Cys
精氨酸 R D-Arg,Lys,D-Lys,homo-Arg,D-homo-Arg,Met,Ile,D-Met,D-Ile,Orn,D-Orn
天冬酰胺 N D-Asn,Asp,D-Asp,Glu,D-Glu,Gln,D-Gln
天冬氨酸 D D-Arp,D-Asn,Glu,D-Glu,Gln,D-Gln
半胱氨酸 C D-Cys,S-Me-Cys,Met,D-Met,Thr,D-Thr
谷氨酰胺 Q D-Gln,Asn,D-Asn,Glu,D-Glu,Asp,D-Asp
谷氨酸 E D-Glu,D-Asp,Asp,Asn,D-Asn,Gln,D-Gln
甘氨酸 G Ala,D-Ala,Pro,D-Pro,β-Ala,Acp
异亮氨酸 I D-Ile,Val,D-Val,Leu,D-Leu,Met,D-Met
亮氨酸 L D-Leu,Val,D-Val,Leu,D-Leu,Met,D-Met
赖氨酸 K D-Lys,Arg,D-Arg homo-Arg,D-homo-Arg,Met,D-Met,Ile,D-Ile,Orn,D-Orn
甲硫氨酸 M D-Met,S-Me-Cys,Ile,D-Ile,Leu,D-Leu,Val,D-Val
苯丙氨酸 F D-Phe,Tyr,D-Thr,L-Dopa,His,D-His,Trp,D-Trp,反式-3,4,或5-苯基脯氨酸,顺式-3,4,或5-苯基脯氨酸
脯氨酸 P D-Pro,L-I-噻唑烷(thioazolidine)-4-甲酸,D-或L-2-噁唑烷-4-甲酸
丝氨酸 S D-Ser,Thr,D-Thr,allo-Thr,Met,D-Met,Met(O),D-Met(O),L-Cys,D-Cys
苏氨酸 T D-Thr,Ser,D-Ser,allo-Thr,Met,D-Met,Met(O),D-Met(O),Val,D-Val
酪氨酸 Y D-Tyr,Phe,D-Phe,L-Dopa,His,D-His
缬氨酸 V D-Val,Leu,D-Leu,Ile,D-Ile,Met,D-Met
本发明内的其它类似物是具有提高肽稳定性的修饰的类似物;这类类似物可以在该肽序列中含有例如一个或多个非肽键(取代所述肽键)。也包括:含有不是天然产生的L-氨基酸(例如D-氨基酸)或非天然产生或合成的氨基酸(例如β或γ氨基酸)的残基的类似物;以及环状类似物。
本文所用的用于幽门螺杆菌类似物的术语“片段”一般为长至少大约20个残基、更常见为至少大约40个残基、最好至少大约60个残基。幽门螺杆菌多肽的片段可以用本领域技术人员已知的方法产生。候选片段表现出幽门螺杆菌多肽生物活性的能力可以用如上所述的本领域技术人员已知的方法评价。也包括含有该肽生物活性不需要的残基的幽门螺杆菌多肽或由另一种mRNA剪接或另一种蛋白加工事件产生的多肽。
本文所用的“免疫原性组分”是诸如幽门螺杆菌多肽、或其类似物或片段的一部分,它能够在宿主动物中单独或结合佐剂诱出体液免疫应答和/或细胞免疫应答。
本文所用的“抗原组分”是诸如幽门螺杆菌多肽、或其类似物或其片段,它能够以足够高的亲和力结合于特异性抗体,以形成可检测的抗原-抗体复合物。
本文所用的术语“转基因”是指部分或完全异源(即外源)于其引入的转基因动物或细胞的核酸、或同源于其引入的转基因动物或细胞的内源基因、但设计插入或插入该细胞基因组中,其插入方式使得改变其插入的细胞基因组(例如,将其于不同于天然基因的位置插入或其插入导致失效)。转基因可以包括一种或多种转录调节序列和所选定核酸最佳表达可能所必需的任何其它核酸,诸如内含子,所有这些序列均操作性地连接至所选定的核酸,转基因也可以包括一个增强子序列。
本文所用的术语“转基因细胞”是指含有转基因的细胞。
本文所用的“转基因动物”是指该动物的一种或多种、最好是基本上所有的细胞含有转基因的任何动物。利用有意的基因操作(诸如通过感受态细胞的转化或通过微注射或用重组病毒感染),可以将该转基因直接引入该细胞,或通过引入该细胞的前体间接地引入该细胞。该分子可以整合入染色体中,或它可以是染色体外复制型DNA。
本文所用的术语“抗体”将包括与幽门螺杆菌多肽特异性反应的抗体的片段。
本文所用的术语“细胞特异性启动子”是指用作启动子(它即调节操作性连接于该启动子的选定DNA序列的表达)并影响该选定的DNA在一种组织的特定细胞中表达的DNA序列。该术语也包括所谓的“渗漏”启动子,它调节选定的DNA主要在一种组织中的表达,但也引起在其它组织中表达。
本文所用的错表达是指非野生型方式的基因表达。它包括非野生型水平的表达,即过量表达或表达不足;该基因表达的时间或阶段不同于野生型的一种表达方式,例如在一个预定的发育时期或阶段表达增加或减少(与野生型相比);在一种预定细胞类型或组织类型中表达减少(与野生型相比)而不同于野生型的一种表达方式;在剪接大小、氨基酸序列、翻译后修饰(post-transitional modification)或所表达多肽的生物活性方面不同于野生型的表达方式;在环境刺激物或胞外刺激物对该基因表达的效应方面不同于野生型的表达方式,例如在增加或降低该刺激强度情况下表达增加或降低(与野生型相比)的方式。
本文所用的指微生物或作为单细胞实体培养的高等真核生物细胞系的“宿主细胞”和其它这类术语,是指可以成为或已经用作重组载体或其它转移DNA的受体的细胞,包括已经转染的原始细胞的子代。本领域技术人员理解,由于偶然或有意的突变,单个亲代细胞的子代的基因组DNA或总DNA compliment可以不必完全与原始亲代相同。
本文所用的术语“控制序列”是指其碱基序列由宿主生物体识别以影响与其连接的所编码序列表达的核酸。根据宿主生物体,这类控制序列的性质是不同的;在原核生物中,这类控制序列一般包括启动子、核糖体结合位点、终止子,在某些情况下包括操纵子;在真核生物中,这类控制序列一般包括启动子、终止子,在某些情况下包括增强子。术语控制序列是指最低限度包括其存在是表达所必需的所有组分,也可以包括其存在是有利的另外的组分,例如前导序列。
本文所用的术语“操作性连接”是指连接序列使其以预定方式发挥作用。例如,将控制序列操作性连接于编码序列,其连接方式使得在与该控制序列和宿主细胞相适应的条件下达到该编码序列表达。
本文所用的物质的新陈代谢是指该物质的表达、功能、作用或调节的任何方面。物质的新陈代谢包括该物质的修饰,例如共价修饰或非共价修饰。物质的新陈代谢包括该物质诱导的其它物质的修饰,例如共价修饰或非共价修饰。物质的新陈代谢也包括该物质分布的变化。物质的新陈代谢包括该物质诱导的其它物质分布的变化。
本文所用的“样品”是指生物样品,诸如从个体分离的组织或流体(包括但不限于血浆、血清、脑脊髓液、淋巴、泪、唾液和组织切片)或来自体外细胞培养物组分的样品以及来自环境的样品。
本发明的实施除非另有说明,将使用化学、分子生物学、微生物学、重组DNA和免疫学的常规技术,这些均在本领域技术范围内。这类技术在文献中进行了全面的解释。参见例如Sambrook,Fritsch和Maniatis,Molecular Cloning:Laboratory Manual第2版(1989);DNACloning第I和II卷(D.N Glover编辑,1985);Oligonucleotide Synthesis(M.J.Gait编辑,1984);Nucleic acid Hybridization(B.D.Hames和S.J.Higgins编辑,1984);Methods in Enzymology系列(Academic Press,Inc.),特别是第154卷和第155卷(Wu和Grossman编辑)以及PCR-A PracticalApproach(McPherson,Quirke和Taylor编辑,1991)。I.幽门螺杆菌核酸的分离及其用途 幽门螺杆菌基因组序列
本发明提供幽门螺杆菌基因组的核苷酸序列,由此包括幽门螺杆菌基因组DNA的DNA序列文库。下面的详细描述提供幽门螺杆菌的核苷酸序列,也描述如何获得所述序列以及如何鉴别ORF和蛋白编码序列。也描述了在包括诊断和治疗应用的方法中使用公开的幽门螺杆菌序列的方法。此外,该文库可以用作鉴定和比较该幽门螺杆菌菌株和其它菌株中医学上重要的序列的数据库。
为了测定幽门螺杆菌的基因组序列,从一个幽门螺杆菌菌株(ATCC # 556679;由Genome Therapeutics Coporation保藏,100 BeaverStreet,Waltham,MA 02154)分离DNA,并通过喷雾机械剪切为2kb的中等大小。在通过凝胶电泳进行大小分级分离后,将所述片段平端化,连接于连接寡核苷酸,并克隆入20个不同的pMPX载体(Rice等,基因组作图和测序会议摘要,冷泉港,NY,5/11-5/15,1994,第225页)中的每一个,以构建一系列“鸟枪法”亚克隆文库。
用基本上如Church等,1988,Science  240:185;美国专利第4,942,124和5,149,624公开的多步测序步骤,完成DNA测序。从合并的培养物中提取DNA,进行化学或酶促测序。测序反应物通过电泳分离,将产物转移并共价连接于尼龙膜。最后,将所述膜与一系列标记的与不同鸟枪法克隆载体中存在的“标记”序列互补的寡核苷酸顺序杂交。以该方式,可以从单组测序反应物获得许多序列。该克隆和测序方法在范例中更详细地描述。
以该方式获得的单个序列的解读采用FLACONTM程序(Church等,1994,Automated DNA Sequencing amd Analysis,J.C.Venter编辑,Academic Press)和PHRAP(P.Green,DOE Human Genome ProgramContractor-Grantee Workshop V摘要,1996年1月,第157页)汇编。平均重叠群的长度大约为3-4kb。
种种方法可以用来确定所述重叠群的顺序,以获得完整幽门螺杆菌基因组的连续序列。设计合成的与每个重叠群末端序列互补的寡核苷酸。这些寡核苷酸可以与例如λ噬菌体载体或质粒载体中的幽门螺杆菌基因组DNA的文库杂交,以鉴定含有对应于各个重叠群之间连接区的序列的克隆。然后用这类克隆分离模板DNA,相同的寡核苷酸在聚合酶链式反应(PCR)中用作引物,以扩增连接片段,然后确定其核苷酸序列。
分析幽门螺杆菌序列包含至少180个核苷酸的可读框(ORF)的存在。作为基于终止密码子-终止密码子阅读的ORF分析的结果,应该理解,这些ORF可能不对应于天然存在的幽门螺杆菌多肽的ORF。这些ORF可能含有指示天然存在的幽门螺杆菌多肽蛋白合成起始的起始密码子。本文提供的ORF中的这类起始密码子可以由相关领域的技术人员进行鉴定,产生的ORF和所编码的幽门螺杆菌多肽属于本发明的范围。例如,在所述ORF中,可以鉴别诸如AUG或GUG(编码甲硫氨酸或缬氨酸)的密码子,它作为蛋白合成的起始信号的部分,将该ORF修饰为对应于天然存在的幽门螺杆菌多肽。通过用程序GENEMARKTM(Borodovsky and McIninch,1993,Comp.Chem. 17:123)评价这类序列的编码潜力,定义预测的编码区。其它幽门螺杆菌核酸
可以通过用聚合酶链式反应(PCR),从上述参考幽门螺杆菌菌株的DNA直接获得本发明的核酸。关于PCR的细节,参见“PCR,APractical Approach”(McPherson,Quirke和Taylor编辑,IRL Press,Oxford,UK,1991)。在表达之前,用高保真PCR确保真实的DNA拷贝。另外,扩增产物的真实性可以通过常规测序方法检查。也可以通过利用PCR筛选所述文库或通过本领域已知的合成寡核苷酸探针与所述文库克隆或噬斑的滤膜影印物(参见例如Sambrook等,MolecularCloning,A Laboratory Manual第2版,1989,Cold Spring Habor Press,NY)杂交,获得携带本发明中所述的所需序列的克隆。
也可能按照本文所述的方案,从cDNA文库获得编码幽门螺杆菌多肽的核酸。可以通过从合适菌株中分离总mRNA,获得编码幽门螺杆菌多肽的cDNA。然后从总mRNA可以制备双链cDNA。随后,可以采用任何一种已知技术,将所述cDNA插入合适的质粒或病毒(例如噬菌体)载体中。也可以采用建立的聚合酶链式反应技术,依据本发明提供的核苷酸序列信息,克隆编码幽门螺杆菌多肽的基因。本发明的核酸可以是DNA或RNA。序列表中含有优选的本发明核酸。
本发明的核酸也可以采用标准技术化学合成。各种化学合成多聚脱氧核苷酸的方法是已知的,包括已经在市售DNA合成仪中自动合成的固相合成(象肽合成一样)(参见例如Itakura等,美国专利第4,598,049号;Caruthers等,美国专利第4,458,066号;和Itakura的美国专利第4,401,796号和第4,373,071号,它们通过引用结合到本文中)。
根据本发明的特征分离或合成的核酸例如但不限于,可用作探针、引物、捕获配体、反义基因和开发合成对应于这类序列的蛋白和肽的表达系统。作为探针、引物、捕获配体和反义基因,该核酸通常包括所有或部分(大约20个或更多的核苷酸,具有形成稳定杂交产物的特异性和能力)的序列表中含有的本发明核酸。以下进一步详细描述这些用途。
探针
根据序列表中含有的本发明序列分离或合成的核酸,可以用作探针,以特异性地检测幽门螺杆菌。用本申请中提出的序列信息,鉴定20个或更多的核苷酸的序列,这提供对于幽门螺杆菌和杂交条件下可能遇到的外来核酸所需的包含性(inclusivity)和排他性。更优选的是,该序列将包含至少20-30个核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。
长度大于1000个核苷酸的序列难以合成,但可以通过重组DNA技术产生。本领域技术人员容易认识到,可以为用作探针的核酸提供标记,以有助于杂交产物的检测。
根据序列表中含有的本发明序列分离和合成的核酸,也可以用作探针,用本文所述的合适的严格杂交条件检测其它螺杆菌菌种的同源区(尤其是同源基因)。
捕获配体
对于用作捕获配体,以上述关于探针所述方式选择的核酸可以容易地与支持体结合。核酸与支持体结合的方式是众所周知的。具有序列表中含有的本发明序列中的20个或更多核苷酸的核酸,具有从每种其它和其它生物体的核酸分离幽门螺杆菌核酸的用途。具有序列表中含有的本发明序列中的20个或更多核苷酸的核酸,也可以具有将其它螺杆菌菌种与每种其它或其它生物体分离的用途。最好是,该序列将包含至少20个核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。长度大于1000个核苷酸的序列难以合成,但可以通过重组DNA技术产生。
引物
根据本文所述序列分离或合成的核酸,具有作为引物以扩增幽门螺杆菌核酸的用途。这些核酸也可以具有作为引物以扩增其它螺杆菌菌种的核酸的用途。关于聚合酶链式反应(PCR)技术,具有序列表中含有的本发明的≥10-15个核苷酸的核酸序列,结合合适的酶和试剂,具有产生幽门螺杆菌核酸拷贝的用途。更优选的是,该序列将包含20个或更多的核苷酸,以赋予该探针和计划的靶分子之间形成的杂交产物以稳定性。大于100个核苷酸的引物为获得特异性的结合条件更难以控制。在表达之前,高保真PCR可以用来确保真实的DNA拷贝。另外,可以用常规测序方法检查扩增产物。
所述拷贝可以用于诊断测定,以检测特定的序列,包括来自幽门螺杆菌和/或其它螺杆菌菌种的基因。所述拷贝也可以加入克隆载体和表达载体中,以产生对应于PCR合成的核酸的多肽,如本文更详细的描述。
反义
根据本文所述序列分离或合成的核酸或核酸杂交衍生物,具有防止幽门螺杆菌基因表达的反义因子(antisense agent)的用途。这些序列也具有作为防止其它螺杆菌菌种的基因表达的反义因子的用途。
在一个实施方案中,将对应于幽门螺杆菌核酸的核酸或衍生物加载入合适的载体(诸如脂质体或噬菌体)中,以引入细菌细胞。例如具有20个或更多核苷酸的核酸能够结合于细菌核酸或细菌信使RNA。最好是,该反义核酸包含20个或更多的核苷酸,以提供非天然存在核酸和细菌核酸和/或细菌信使RNA的杂交产物必需的稳定性。其序列长度大于1000个核苷酸的核酸难以合成,但可以采用重组DNA技术产生。将反义核酸加载入脂质体的方法是本领域已知的,如1980年12月23日授予Papahadjopoulos等的美国专利4,241,046所例举的。II.幽门螺杆菌核酸的表达
根据本文所述序列分离或合成的核酸具有产生多肽的用途。序列表中例举的本发明的核酸或编码幽门螺杆菌多肽活性部分的核酸片段,可以克隆入合适的载体中,或用来分离核酸。该分离的核酸与合适的DNA接头结合,并克隆入合适的载体中。
可以通过在可以特异性地测定所述基因或操纵子特定的基因产物的活性的条件下在细菌菌株中表达,确定特定基因或操纵子的功能。获得,可以在表达菌株中大量产生基因产物,以用作抗原、工业试剂、用于结构研究等。可以在缺失待测试基因活性的突变菌株中、或在不产生相同基因产物的菌株中完成该表达。这包括但不限于其它螺杆菌菌株、或诸如大肠杆菌、诺卡氏菌属(Norcardia)、棒杆菌属(Corynebacterium)、弯曲杆菌属(Campylobacter)和链霉菌属(Streptonmyces)菌种的其它细菌菌株。在某些情况下,表达宿主利用天然的螺杆菌启动子,而其它情况下,它对于用来自表达生物体的启动子序列驱动该基因是必需的(例如大肠杆菌β-半乳糖苷酶启动子对于在大肠杆菌中表达)。
为了用天然幽门螺杆菌启动子表达基因产物,可以使用诸如以下的方法。将含有目的基因的限制性片段与其结合的天然启动子元件和调节序列(用DNA序列数据鉴定),一起克隆入合适的重组质粒,该重组质粒含有在宿主生物体中有功能的复制起点和一个合适的选择标记。这可以通过本领域技术人员已知的多种方法完成。最优选的是,这可以通过以下方法进行,即通过用相同的限制性酶切割该质粒和待克隆的片段,以产生可以将两个片段连接在一起的相匹配的末端。通过例如电穿孔,将该重组质粒引入该宿主生物体,并通过选择该质粒上的标记,鉴别含有该重组质粒的细胞。采用针对该基因产物特异的测定,检测所需基因产物的表达。
在需要不同启动子的基因的情况下,特异性切割该基因体(编码序列),将其克隆入合适的表达质粒中。可以采用几种方法进行该亚克隆,但最容易用以下方法完成,即通过PCR扩增特定片段、并在用限制性酶或外切核酸酶处理以产生合适的用于克隆的末端后连接入表达质粒中。
用于表达基因的合适的宿主细胞可以是原核细胞或真核细胞。例如,可以在诸如大肠杆菌的细菌细胞、昆虫细胞(杆状病毒)、酵母或诸如中国仓鼠卵巢细胞(CHO)的哺乳动物细胞中表达幽门螺杆菌多肽。其它合适的宿主细胞是本领域技术人员已知的。
在诸如哺乳动物、酵母或昆虫细胞的真核细胞中的表达,可能导致重组肽产物的部分或完全糖基化和/或形成相关链间或链内二硫键。在酵母酿酒酵母(S.cerivisae)中表达的载体实例包括pYepSecl(Baldari等,(1987)Embo J. 6:229-234)、pMFa(Kurjan和Herskowitz,(1982)Cell  30:933-943)、pJRY88(Schultz等,(1987)Gene  54:113-123)和pYES2(Unvitrogen Corporation,San Diego,CA)。可用来在培养的昆虫细胞(SF 9细胞)中表达蛋白的杆状病毒载体包括pAc系列(Smith等,(1983)Mol.Cell Biol. 3:2156-2165)和pVL系列(Lucklow,V.A.和Summers,M.D.,(1989)Virology  170:31-39)。一般而言,COS细胞(Gluzman,Y.,(1981)Cell  23:175-182)与诸如pCDM 8(Aruffo,A.和Seed,B.,(1987)Proc.Natl.Acad.Sci.USA  84:8573-8577)的载体结合使用,以在哺乳动物细胞中进行瞬时扩增/表达,而CHO(dhfr  Chinese  HamsterOvary)细胞与诸如pMT2PC(Kaufman等(1987),EMBO J. 6:187-195)一起使用,用于在哺乳动物细胞中进行稳定扩增/表达。可以通过常规技术,诸如磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染或电穿孔,将载体DNA引入哺乳动物细胞中。合适的转化宿主细胞的方法可以参见Sambrook等( Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press(1989))和其它实验教科书。
在原核生物中的表达最常在大肠杆菌中用或者融合或者非融合诱导型表达载体进行。融合载体通常将大量NH2末端氨基酸加入表达的靶基因。这些NH2末端氨基酸通常称为报道基团。这类报道基团通常用于两个目的:1)为了提高靶重组蛋白的溶解性;和2)有助于通过用作亲和纯化中的配体而纯化靶重组蛋白。通常,在融合表达载体中,在该报道基团和靶重组蛋白的接点引入蛋白水解切割位点,以能够在纯化融合蛋白后从该报道基团分离靶重组蛋白。这类酶及其相关识别序列包括因子Xa、凝血酶和肠激酶。典型的融合表达载体包括pGEX(Amrad Corp.,Melbourne,澳大利亚)、pMAL(New EnglandBiolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),它们分别将谷胱甘肽S-转移酶、麦芽糖E结合蛋白或蛋白A融合于靶重组蛋白。优选的报道基团是poly(His),它可以融合于该蛋白的氨基末端或羧基末端,并使得重组融合蛋白容易通过金属螯合层析纯化。
诱导型非融合表达载体包括pTrc(Amann等,(1988)Gene  69:301-315)和pET11d(Studier等, Gene Expression Technology:Methods in Enzymology  185,Academic Press,San Diego,California(1990)60-89)。靶基因表达依赖于宿主RNA聚合酶从pTrc中的杂种trp-lac融合启动子转录,而插入pET11d中的靶基因的表达依赖于共表达的病毒RNA聚合酶(T7 gn1)介导的从T7 gn 10-lac 0融合启动子的转录。该病毒聚合酶由宿主菌株BL21(DE3)或HMS174(DE3),从带有在lacUV 5启动子转录控制下的T7 gn1的停留(resident)λ前噬菌体供应。
例如,用指导编码幽门螺杆菌多肽的核苷酸序列表达的核酸载体转染的宿主细胞,可以在合适的条件下培养,以使得发生该多肽的表达。可以分泌该多肽,并从细胞和含该肽的培养基的混合物中分离该多肽。或者,该多肽可以保留在胞质中,收获细胞、将其裂解并分离蛋白。细胞培养物包括宿主细胞、培养基和其它副产物。适用于细胞培养的培养基是本领域熟知的。可以用纯化蛋白领域已知的技术,包括离子交换层析、凝胶过滤层析、超滤、电泳和用这类多肽特异性抗体的免疫亲和纯化,从细胞培养基、宿主细胞或在这两者中分离本发明的多肽。另外,在许多情况下,可以通过化学切割天然蛋白(例如胰蛋白酶消化)产生多肽,然后可以通过标准技术纯化切割产物。
在膜结合蛋白的情况下,这些蛋白可以如下从宿主细胞分离,即通过使膜结合蛋白部分与形成溶解的复合物的去垢剂接触,这时所述膜结合蛋白不再完全包埋在膜部分中,至少在某些程度上溶解,这使得它可以从该膜部分中进行层析分离。用几种不同的标准选择适于溶解这些复合物的去垢剂。例如,一个考虑的性质是在该膜结合蛋白最少变性、使得该膜结合蛋白在该蛋白重建时恢复活性或功能性的情况下,该去垢剂溶解该幽门螺杆菌蛋白的能力。选择去垢剂时考虑的另一性质是该去垢剂的关键的微团浓度,因为选择的去垢剂最好具有高CMC值,以使得在重建后易于除去。选择去垢剂时考虑的第三个性质是该去垢剂的疏水性。通常,膜结合蛋白的疏水性非常强,因此也是疏水性的去垢剂(例如triton系列)对于溶解疏水性蛋白是有用的。对于去垢剂重要的另一性质可能是该去垢剂以最小蛋白-蛋白相互作用除去该幽门螺杆菌蛋白的能力,以便于进一步纯化。应该考虑的该去垢剂的第五个性质是该去垢剂的电荷。例如,如果在纯化过程中需要使用离子交换树脂,则去垢剂最好为不带电荷的去垢剂。可以用于最后纯化步骤的层析技术是本领域已知的,包括疏水性相互作用层析、凝集素亲和层析、离子交换层析、染料亲和层析和免疫亲和层析。
使重组幽门螺杆菌肽在大肠杆菌中的表达最大化的一个策略,是在蛋白水解切割该重组蛋白的能力受损的宿主细菌中表达该蛋白(Gottesman,S., Gene Expression Technology:Methods in Enzymeology 185,Academic Press,San Diego,California(1990)119-128)。另一策略是改变待插入表达载体、编码幽门螺杆菌多肽的核酸,使得每个氨基酸的各个密码子是在高度表达的大肠杆菌蛋白中优先使用的密码子(Wada等,(1992)Nuc.Acids Res. 20:2111-2118)。本发明核酸的这类改变可以用标准DNA合成技术进行。
本发明核酸也可以采用标准技术化学合成。化学合成多聚脱氧核苷酸的各个方法是已知的,包括固相合成,它同肽合成一样,已经在市售DNA合成仪中完全自动进行(参见例如Itakura等,美国专利第4,598,049号;Caruthers等的美国专利第4,458,066号;和Itakura的美国专利第4,401,796号和第4,373,071号,它们通过引用结合到本文中)。III.幽门螺杆菌多肽
本发明包括由公开的幽门螺杆菌基因组序列编码的分离的幽门螺杆菌多肽,包括序列表中含有的本发明多肽。本发明多肽最好长至少5个氨基酸残基。采用本文提供的DNA序列信息,可以采用本领域熟知的方法,推导出本发明包括的多肽的氨基酸序列。应该理解,可以分离编码幽门螺杆菌多肽的完整核酸序列,并根据仅编码相关蛋白编码区的片段的ORF进行鉴定。这可以例如通过采用分离的编码该ORF的核酸或其片段完成,以引发用幽门螺杆菌基因组DNA作为模板的聚合酶链式反应;然后序列分析扩增的产物。
可以从野生型或突变型幽门螺杆菌细胞或从已经引入并表达幽门螺杆菌核酸的异源生物或细胞(包括但不限于细菌、酵母、昆虫、植物和哺乳动物细胞)分离本发明的多肽。此外,该多肽可以是部分重组融合蛋白。
可以采用诸如本文参考的工业自动方法,化学合成本发明的幽门螺杆菌多肽。
本发明的幽门螺杆菌多肽也将包括本文所述的嵌合蛋白和截短的蛋白。嵌合幽门螺杆菌蛋白
幽门螺杆菌嵌合多肽包含一种或多种融合在一起的幽门螺杆菌多肽。可以通过将两种或多种基因、或两种或多种多肽编码序列、或至少一种基因和至少一种多肽编码序列串联组合,制备这些组合的序列,随后通过常规分子生物学技术表达这些编码的蛋白。所述组合的核苷酸序列可以包含或者全长幽门螺杆菌核苷酸或这类序列的片段(例如含有所编码的幽门螺杆菌蛋白的免疫学相关部分的片段)的组合。则这些嵌合幽门螺杆菌蛋白具有每个单独的幽门螺杆菌蛋白序列的联合疫苗或协同疫苗的潜力,并且可以用于本发明的疫苗制剂中。截短的基因表达和蛋白产生
由给定核苷酸序列编码的幽门螺杆菌蛋白也可以以生物活性截短的形式使用。可以例如通过消除编码核苷酸序列的或者5’和/或3’区,产生这类截短物。这类截短物可能影响所述编码蛋白的重组表达和/或该蛋白随后的纯化。例如,截短编码特定蛋白的预测输出序列的核苷酸序列,可以改变该蛋白的表达。或者,通过消除核酸编码区的3’端截短幽门螺杆菌多肽的C末端,也可以提高蛋白表达和随后的纯化和使用,这些在以下实施例VIII中概述。编码内部幽门螺杆菌蛋白区的核酸区的缺失,也可以导致增加的蛋白表达、纯化和/或作为疫苗候选物的效力。IV.编码疫苗组分的核酸和有效抗幽门螺杆菌的因子的靶的鉴定
公开的幽门螺杆菌基因组序列包括指导核糖核酸和多肽合成的区段以及复制起点、启动子、其它类型的调节序列和基因间核酸。本发明包括编码疫苗的免疫原性组分的核酸和有效抗幽门螺杆菌的因子的靶。用种种方法可以完成参与确定公开序列功能的免疫原性组分的鉴定。以下简述这些方法的非限制性实施例。
与已知序列的同源性:公开的幽门螺杆菌序列与公众可利用的数据库中存在的先前报道的序列的计算机辅助比较,可用来鉴定功能性幽门螺杆菌核酸序列和多肽序列。应该理解,蛋白编码序列例如可以作为整体进行比较,两种蛋白之间在氨基酸水平的高度同源性(诸如>80-90%),表明这两种蛋白也具有某些程度的功能同源性,诸如在参与新陈代谢、DNA合成或细胞壁合成中的酶和参与转运、细胞分裂等的蛋白中。另外,已经鉴定了特定蛋白类别的许多结构特征,并将其与特定的共有序列相联系,所述共有序列诸如核苷酸、DNA、金属离子和其它小分子的结合域;诸如磷酸化、酰化等的共价修饰位点;蛋白:蛋白相互作用位点等。这些共有序列可以相当短,因此可以仅代表完整蛋白编码序列的一部分。因此,在一种幽门螺杆菌多肽中这一特征的鉴定可用来确定所编码蛋白的功能,并鉴定有用的抗菌药的靶。
与本发明特别相关的是分泌蛋白、跨膜蛋白和表面蛋白所共有的结构特征,包括分泌信号肽和疏水性跨膜域。鉴定为含有推定信号序列和/或跨膜域的幽门螺杆菌蛋白可用作疫苗的免疫原性组分。
必需基因的鉴定:编码幽门螺杆菌生长和生存所必需的蛋白的核酸是优选的药物靶。可以采用相关领域技术人员已知的技术,通过检查缺失和/或中断基因(即通过所谓的基因“失效(knockout)”)的效应,测试幽门螺杆菌基因与该生物的生物相关性。可以以这种方式鉴定必需基因。
菌株特异性序列:由于不同幽门螺杆菌菌株之间的进化关系,相信本文公开的幽门螺杆菌序列可用来鉴定和/或分辨先前已知的和新的幽门螺杆菌菌株。相信其它幽门螺杆菌菌株与本文公开的序列将表现出至少70%的序列同源性。得自含幽门螺杆菌菌株样品的DNA序列的系统分析和常规分析、以及与本发明序列的比较,使得可以鉴定可以用来鉴别菌株的序列以及所有幽门螺杆菌菌株所共有的序列。在一个实施方案中,本发明提供鉴别不同幽门螺杆菌菌株的核酸(包括探针)和肽和多肽序列。菌株特异性组分也可以通过它们诱出或与选择性识别一种或多种幽门螺杆菌菌株的抗体反应的能力而进行功能鉴定。
在另一实施方案中,本发明提供所有幽门螺杆菌菌株所共有、但在其它细菌菌种中未发现的核酸(包括探针)以及肽和多肽序列。具体实施例:测定用于抗体和疫苗开发的候选蛋白抗原
用于疫苗开发的候选蛋白抗原的选择可以来自编码幽门螺杆菌多肽的核酸。首先,可以分析该ORF与其它已知输出蛋白或跨膜蛋白的同源性,采用Klein等(Klein,P.,Kanehsia,M.和DeLisi,C.(1985)Biochimica et Biophysica Acta 815,468-476)所述的判别分析进行分析,以预测输出蛋白和跨膜蛋白。
可以采用Wisconsin序列分析软件包(Genetics Computer Group,University Research Park,575 Science Drive,Madison,WI 53711)中含有BLAST算法,将每个预测的ORF的氨基酸序列与当前GenBank、SWISS-PROT和PIR数据库中发现的所有序列比较,进行同源性检索。BLAST检索该ORF和数据库序列之间的局部序列对比,并报告一个可能性得分,表明在该数据库中偶然发现该序列的可能性。与膜蛋白或输出蛋白具有显著同源性(例如同源性仅由于随机机遇的可能性低于1×10-6)的ORF代表用于疫苗开发的蛋白抗原。根据与其它生物中克隆的基因的序列同源性,可以将可能的功能提供给幽门螺杆菌基因。
判别分析(Klein等,见上文)可以用来检查所述ORF的氨基酸序列。该算法使用ORF氨基酸序列中含有的特有信息,并将其与得自已知膜蛋白和输出蛋白的性质的信息进行比较。这种比较预测哪些蛋白将为输出蛋白、膜相关蛋白或胞质蛋白。由该算法鉴别为输出的或膜相关的OFR氨基酸序列可能是用于疫苗开发的蛋白抗原。
表面暴露的外膜蛋白可能代表提供对幽门螺杆菌的保护性免疫应答的最佳抗原。在可以用来协助预测这些外膜蛋白的算法中,包括在其C末端存在两亲性β-折叠区。已经在革兰氏阴性菌的大量外膜蛋白中检测的该区,通常特征为大约于C末端的1、3、5、7和9位的疏水性残基(Phe或Tyr)。重要的是,这些序列尚未在周质蛋白的C末端检测到,因此提供基于一级序列数据的这些蛋白类别之间的初步区别。Struyve等(J.Mol.Bio.218:141-148,1991)先前已经报道了该现象。
图1也描述了在幽门螺杆菌的许多外膜蛋白中发现的另外的氨基酸序列基元。图1中的氨基酸序列对比描述了有其氨基酸序列识别号标记的5种幽门螺杆菌蛋白序列的部分,从左至右显示N末端至C末端。发现6个区别框(标记A-F)的相似氨基酸残基,包括常常发现于外膜蛋白C末端附近位置的特殊疏水性残基(Phe或Tyr;根据氨基酸残基的单字母密码为F或Y)。几种共享基元的存在清楚地确立了该组蛋白成员之间的相似性。
另外,从幽门螺杆菌分离的外膜蛋白常常共享成熟N末端(即加工除去分泌信号后)附近的一个基元,如在图2的框注氨基酸残基中描述的。图2描述了3种幽门螺杆菌蛋白的N末端部分(由其氨基酸序列识别号标示,并从左至右显示N末端至C末端)。
本领域技术人员已知,这些共享的序列基元是非常重要的,并确立了该组蛋白中的相似性。
很少不可能辨别该核酸序列中给定位置的多个可能的核苷酸。在那些情况下,如下通过扩增的字母表示这些不确定性(ambiguity):
这些是法定的IUPAC-IUB单字母碱基密码密码                 碱基描述G                    鸟嘌呤A                    腺嘌呤T                    胸腺嘧啶C                    胞嘧啶R                    嘌呤          (A或G)Y                    嘧啶          (C或T或U)M                    氨基          (A或C)K                    酮            (G或T)S                    强相互作用    (C或G)W                    弱相互作用    (A或T)H                    非G           (A或C或T)B                    非A           (C或G或T)V                    非T(非U)      (A或C或G)D                    非C           (A或G或T)N                    任一种        (A或C或G或T)
本发明的氨基酸翻译通过将多义密码子翻译为字母“X”,说明核酸序列中的不确定性。在所有情况下,根据基于标准遗传密码子的核酸序列的检查,在一位置上的允许氨基酸残基是清楚的。V.幽门螺杆菌核酸和多肽的片段和类似物的产生
根据序列表中提供的本发明的幽门螺杆菌基因产物的发现,本领域技术人员可以例如通过产生片段或类似物,改变公开的结构(幽门螺杆菌基因的结构),并测试所述新产生的结构的活性。下面讨论相关领域技术人员已知允许产生并测试片段和类似物的技术的实施例。这些方法或类似方法可以用来制备多肽文库,例如随机肽文库或细胞蛋白的片段或类似物文库,并根据其结合幽门螺杆菌多肽的能力进行筛选。这类筛选用来鉴定幽门螺杆菌的抑制剂。片段的产生
可以以几种方式,例如重组、蛋白水解消化或化学合成,产生蛋白的片段。可以通过除去编码该多肽的核酸一端(用于末端片段)或两端(用于内部片段),产生多肽的内部片段或末端片段。诱变的DNA的表达产生多肽片段。用“末端一点一点地切下”的内切核酸酶消化由此可以产生编码一系列片段的DNA。编码蛋白片段的DNA也可以通过随机剪切、限制性消化或上述方法的组合而产生。
也可以采用本领域已知的技术,诸如常规Merrifield固相F-Moc或t-Boc化学法,化学合成片段。例如,可以将本发明的肽任意分为没有片段重叠的所需长度的片段,或分为所需长度的重叠片段。核酸和多肽的改变:随机方法
可以通过随机诱变编码蛋白或蛋白特定域或特定区的DNA,制备蛋白的氨基酸序列变异体。有用的方法包括PCR诱变和饱和诱变(saturation mutagenesis)。也可以通过合成一组简并寡核苷酸序列,产生随机氨基酸序列变异体文库。(筛选变异体文库中的蛋白的方法在本文其它地方)。
(A)PCR诱变
在PCR诱变中,可以用减低的Taq聚合酶保真度将随机突变引入DNA的克隆片段中(Leung等,1989,Technique 1:11-15)。采用聚合酶链式反应(PCR),在降低Taq DNA聚合酶DNA合成的保真度的条件下,例如通过采用dGTP/dATP之比为5并将Mn2+加入PCR反应中,扩增待诱变的DNA区。将扩增的DNA片段库插入合适的克隆载体中,以提供随机突变体文库。
(B)饱和诱变
饱和诱变允许将大量的单碱基置换快速引入克隆的DNA片段中(Mayers等,1985,Science 229:242)。该技术包括例如通过体外化学处理或辐射单链DNA产生突变,并合成互补DNA链。可以通过调节处理强度调节突变频率,可以获得基本上所有可能的碱基置换。因为该方法不涉及突变体片段的遗传选择,所以获得中性置换以及改变功能的置换。点突变的分布不偏向保守序列基元。
(C)简并寡核苷酸
也可以由一组简并寡核苷酸序列产生同源物(homolog)文库。可以在自动DNA合成仪中进行简并序列的化学合成,然后将合成的基因连接入合适的表达载体。简并寡核苷酸的合成是本领域已知的(参见例如Narang,SA(1983)Tetrahedron 39:3;Itakura等(1981)Recombinant DNA,Proc 3rd Cleveland Sympos.Macromolecules,编辑AG Walton,Amsterdan:Elsevier第273-289页;Itakura等(1984)Annu.Rev.Biochem.53:323;Itakura等(1984)Science 198:1056;Ike等(1983)Nucleic acidRes.11:477)。这类技术已经用于其它蛋白的定向进化(参见例如Scott等(1990)Science 249:386-390;Roberts等(1992)PNAS 89:2429-2433;Devlin等(1990)Science 249:404-406;Cwirla等(1990)PNAS 87:6378-6382;以及美国专利第5,223,409号、第5,198,346号和第5,096,815号)。核酸和多肽的改变:定向诱变的方法
非随机诱变或定向诱变的技术可以用来提供特定的序列或特定区中的突变。这些技术可以用来产生变异体,包括例如蛋白的已知氨基酸序列残基的缺失、插入或取代。可以通过以下步骤单独或系列修饰突变位置:(1)用保守氨基酸取代第一个氨基酸,然后根据所得到的结果用多种基团选择进行取代,(2)缺失靶残基,或(3)将同一类或不同类的残基插入邻近定位位置,或选择1-3的组合。
(A)丙氨酸扫描诱变
丙氨酸扫描诱变是一种有用的方法,用来鉴别所需蛋白诱变的优选位置或域的某些残基或某些区,Cummingham和Wells(Science 244:1081-1085,1989)。在丙氨酸扫描中,鉴别一个残基或一组靶残基(例如带电荷残基,诸如Arg、Asp、His、Lys和Glu),并用一种中性或带负电氨基酸(最优选丙氨酸或多丙氨酸)取代。氨基酸的取代可以影响所述氨基酸与细胞内或外的周围水性环境的相互作用。然后,通过将另外的或其它变异体引入取代位点,精制表现出对取代的功能敏感性的那些域。困此,当预定引入氨基酸序列突变的位点时,不必预定突变本身的性质。例如,为了优化给定位点的突变表现,可以于靶密码子或靶区进行丙氨酸扫描或随机诱变,根据所需活性的最佳组合,筛选表达所需蛋白亚基的变异体。
(B)寡核苷酸介导的诱变
寡核苷酸介导的诱变是一种有用的方法,用来制备DNA的置换、缺失和插入变异体,参见例如Adelman等,(DNA 2:183,1983)。简而言之,通过将编码一种突变的寡核苷酸与DNA模板杂交,从而改变所需DNA,在此模板为单链形式含有所需蛋白的未改变或天然DNA序列的质粒或噬菌体。杂交后,用DNA聚合酶合成完整的模板第二条互补链,这将由此掺入寡核苷酸引物,并将编码所需蛋白的DNA中选定的改变。通常使用至少长25个核苷酸的寡核苷酸。最适寡核苷酸具有12-15个核苷酸,该寡核苷酸与模板编码该突变的任一端完全互补。这确保该寡核苷酸将正确地与单链DNA模板分子杂交。采用本领域已知的技术,诸如Crea等所述技术(Proc.Natl.Acad.Sci.USA,75:5765[1978]),容易合成所述寡核苷酸。
(C)盒式诱变
制备变异体的另一方法盒式诱变基于Wells等所述的技术(Gene,34:315[1985])。原材料为包括待突变蛋白亚基DNA的质粒(或其它载体)。鉴定待突变的蛋白亚基DNA中的密码子。在鉴定的突变位点的每一端必须有独特的限制性内切核酸酶位点。如果不存在这类限制性位点,则可以采用上述寡核苷酸介导的诱变方法产生这类限制性位点,以将这些限制性位点引入所需蛋白亚基DNA中的合适位置。将限制性位点引入质粒后,在这些位点切割该质粒,以使其线性化。采用标准方法,合成编码限制性位点之间的DNA序列、但不含有所需突变的双链寡核苷酸。独立合成两条链,然后用标准技术将其杂交在一起。该双链寡核苷酸称为盒。设计该盒,使其具有与该线性化质粒末端相匹配的3’和5’末端,使得它可以直接与该质粒连接。该质粒现在含有突变的所需蛋白亚基的DNA序列。
(D)联合诱变(combinatorial mutagenesis)
也可以用联合诱变产生突变体(Ladner等,Wo 88/06630)。在该方法中,对比一组同源物或其它相关蛋白的氨基酸序列,最好以有利于可能的最高同源性。可以选择出现在对比序列给定位置的所有氨基酸,以产生一套简并组合序列。通过核酸水平的联合诱变,产生变异体的花斑文库(Variegated library),并由花斑基因文库编码。例如,可以将合成寡核苷酸的混合物酶促连接入基因序列,使得该套简并潜在序列可以作为单个肽表达,或者作为一套更大的含有该套简并序列的融合蛋白表达。幽门螺杆菌核酸和多肽的其它修饰
对于诸如提高溶解度、增强稳定性(例如体外储存期限和对体内蛋白水解降解的抗性)的目的,修饰幽门螺杆菌多肽的结构是合理的。可以产生修饰的幽门螺杆菌蛋白或肽,在这些蛋白或肽中,其氨基酸序列已经例如通过上述的氨基酸取代、缺失或插入而改变。
也可以通过用丙氨酸、丝氨酸、苏氨酸、亮氨酸或谷氨酸残基取代半胱氨酸残基,修饰幽门螺杆菌肽,以便通过二硫键的二聚化最小化。另外,可以化学修饰本发明蛋白片段的氨基酸侧链。另一修饰是肽的环化。
为了增强稳定性和/或反应性,可以修饰幽门螺杆菌多肽,以在该蛋白的氨基酸序列中加入导致中性等位基因突变的一种或多种多态性。另外,可以置换或加入D-氨基酸、非天然氨基酸或非氨基酸类似物,以产生本发明范围内的修饰蛋白。此外,可以按照A.Sehon及其同事(Wie等,见上文)的方法,采用聚乙二醇(PEG)修饰幽门螺杆菌多肽,以产生与PEG缀合的蛋白。另外,PEG可以在该蛋白化学合成中加入。幽门螺杆菌蛋白的其它修饰包括还原/烷基化(Tarr,Mehtods ofProtein Microcharacterization,J.E.Silver编辑,Humana Press,Clifton NJ155-194(1986));酰化(Tarr,见上述);与合适载体化学偶联(Mishell和Shiigi编辑,Selected Methods in Cellular Immunology,WH Freeman,SanFrancisco,CA(1980),美国专利4,939,239;或温和福尔马林处理(Marsh,(1971)Int.Arch.of Allergy and Appl.Immunol., 41:199-215)。
为了有利于纯化和潜在性地提高幽门螺杆菌蛋白或肽的溶解性,将氨基酸融合部分加入肽骨架是合理的。例如,可以将六组氨酸加入蛋白中,以通过固定化金属离子亲和层析进行纯化(Hochuli,E.等,(1988)Bio/Technology, 6:1321-1325)。另外,为了有利于分离不含非相关序列的肽,可以在融合部分和该肽序列之间引入特定的内切蛋白酶切割位点。
为了潜在性地有助于幽门螺杆菌多肽中正确的表位抗原加工,可以通过重组方法或合成方法,工程改造包含至少一个表位的各区之间规范的蛋白酶敏感位点。例如,在蛋白或片段的重组构建期间,可以将诸如KK或RR的带电荷的氨基酸对引入蛋白或片段内各区之间。可以赋予产生的肽对组织蛋白酶和/或其它胰蛋白酶样酶(这些酶将产生含有一个或多个表位的蛋白部分)切割的敏感性。另外,这类带电荷的氨基酸残基可以导致该肽的溶解性提高。筛选多肽和类似物的基本方法
本领域已知筛选产生的突变基因产物的各种技术。筛选大基因文库的技术通常包括将基因文库克隆入复制型表达载体、用产生的载体文库转化合适的细胞和在检测所需活性的条件下(例如,在该情况下,为结合幽门螺杆菌多肽或相互作用蛋白)表达所述基因,促进相对容易的编码检测其产物的基因的载体的分离。下述的每种技术均适于筛选大量例如通过随机诱变技术产生的序列的高通量分析。
(A)双杂交系统
诸如上述系统的双杂交测定(正如本文所述的其它筛选方法一样)可以用来鉴定多肽,例如天然产生的幽门螺杆菌多肽(例如细胞蛋白)或随机产生的结合幽门螺杆菌蛋白的多肽的片段或类似物。(幽门螺杆菌域用作饵蛋白,变异体文库作为鱼融合蛋白表达)。在类似的方式中,双杂交测定(整正如本文所述的其它筛选方法一样)可以用来发现结合幽门螺杆菌多肽的多肽。
(B)呈现文库
在筛选测定的一种方法中,候选肽呈现于细胞或病毒颗粒表面,在“淘选测定”中,测定特定细胞或病毒颗粒通过呈现的产物结合合适受体蛋白的能力。例如,该基因文库可以克隆入细菌细胞表面膜蛋白的基因中,通过淘选测定产生的融合蛋白(Ladner等,WO 88/06630;Fuchs等(1991)Bio/Technology 9:1370-1371;和Goward等(1992)TIBS18:136-140)。可以以相似的方式使用可检测标记的配体,为潜在功能肽同源物评分。荧光标记的配体(例如受体)可以用来检测配体保留结合活性的同源物。使用荧光标记配体,使得可在荧光显微镜下肉眼检查并分离细胞,或者在细胞形态允许的情况下通过荧光激活细胞分选仪分离细胞。
基因文库可以作为病毒颗粒表面上的融合蛋白表达。例如,在丝状噬菌体系统中,外源肽序列可以在感染性噬菌体表面上表达,由此提供两个显著的益处。第一,由于这些噬菌体可以以大大超过1013噬菌体/ml的浓度用于亲和基质,因此可以一次筛选大量的噬菌体。第二,由于每个感染性噬菌体在其表面呈现一种基因产物,因此如果从亲合基质以低收率回收特定噬菌体,则可以通过另一轮感染扩增该噬菌体。一组几乎相同的大肠杆菌丝状噬菌体M13、fd.和f1最常用于噬菌体呈现文库。噬菌体gIII或gVIII被膜蛋白中的任一个可以用来产生融合蛋白,而不破坏最终的病毒颗粒的包装。外源表位可以在pIII的NH2末端表达,并从大量过量的缺乏该表位的噬菌体中回收带有该种类表位的噬菌体(Ladner等PCT公布WO 90/02909;Garrard等,PCR公布WO 92/09690;Marks等(1992)J.Biol.Chem.267:16007-16010;Griffiths等(1993)EMBO J 12:725-734;Clackson等(1991)Nature352:624-628;和Barbas等(1992)PNAS 89:4457-4461)。
一种常用方法使用大肠杆菌的麦芽糖受体(外膜蛋白LamB)作为肽融合伴侣(Charbit等(1986)EMBO 5,3029-3037)。已经将寡核苷酸插入编码LamB基因的质粒中,以产生融合入该蛋白一种胞外回环(loop)中的肽。可利用这些肽结合配体,例如结合抗体,并且当将所述给予动物时可以诱出免疫应答。其它细胞表面蛋白,例如OmpA(Schorr等(1991)Vaccines 91,第387-392页)、PhoE(Agterberg等(1990)Gene 88,37-45)和PAL(Fuchs等(1991)Bio/Tech 9,1369-1372),以及大的细菌表面结构已经用作肽呈现的载体。可以将肽融合于菌毛蛋白,这是一种聚合形成细菌间交换遗传信息的管道-菌毛的蛋白(Thiry等(1989)Appl.Environ.Microbiol.55,984-993)。由于菌毛在与其它细胞相互作用中的作用,它为将肽提呈给胞外环境提供有用的支持。用于肽呈现的另一大表面结构是细菌的运动器官鞭毛。肽与亚基蛋白鞭毛的融合,提供在宿主细胞上许多肽拷贝的致密排列(Kuwajima等(1988)Bio/Tech.6,1080-1083)。其它细菌菌种的表面蛋白也已经用作肽融合伴侣。实例包括葡萄球菌属(Staphylococcus)蛋白A和奈瑟氏球菌属(Neisseria)的外膜IgA蛋白酶(Hansson等(1992)J.Bacteriol.174,4239-4245和Klauser等(1990)EMBO J.9,1991-1999)。
在上述丝状噬菌体系统和LamB系统中,由于其表面携带该肽的颗粒(细胞或噬菌体)内含有编码该肽的DNA,使该肽与该DNA之间发生物理上的联系。捕获该肽即捕获所述颗粒和其中的DNA。另一方案使用DNA结合蛋白LacI,以形成肽和DNA之间的连接(Cull等(1992)PNAS USA 89:1865-1869)。该系统使用一种质粒,该质粒含有其3’端具有一个寡核苷酸克隆位点的LacI基因。在控制的阿拉伯糖诱导下,产生LacI肽融合蛋白。该融合体保留LacI结合短DNA序列(已知为LacO操纵子(LacO))的能力。通过在表达载体上安装两个拷贝的LacO,LacI-肽融合体紧密地结合于其编码质粒。因为每个细胞中的质粒仅含一个单个的寡核苷酸序列,并且每个细胞仅表达一个单个的肽序列,所以,所述肽变为特异性地并且稳定地与指导其合成的DNA序列结合。温和地裂解该文库的细胞,并将肽-DNA复合物暴露于固定化受体基质,以回收含有活性肽的复合物。结合的质粒DNA然后再引入细胞中,以进行扩增并进行DNA测序,以确定所述肽配体的身份。作为该方法实际用途的证明,制备大的十二肽的随机文库,并在产生的抗阿片样肽强啡肽B的单克隆抗体上进行选择。回收一组(cohort)肽,即所有因对应于强啡肽B的六残基部分的共有序列而相关的肽。(Cull等(1992)Proc.Natl.Acad.Sci.U.S.A.89-1869)。
该方案有时称为质粒的肽,在两个重要的方面不同于噬菌体呈现方法。第一,所述肽连接于该融合蛋白的C末端,导致该文库成员作为具有游离羧基末端的肽呈现。两种丝状噬菌体被膜蛋白pIII和pVIII均通过其C末端锚定于该噬菌体,并且所述客肽(guest peptide)置入向外延伸的N末端域中。在某些设计中,噬菌体呈现的肽呈现在融合蛋白氨基末端的右边。(Cwirla等(1990)Proc.Natl.Acad.Sci.U.S.A.87,6378-6382)。第二个差异是影响文库中实际存在的肽群体的一组生物学偏差(biological bias)。LacI融合分子限制在宿主细胞的胞质中。在翻译期间,所述噬菌体被膜融合体短暂地暴露于细胞,但迅速地通过内膜分泌到周质区室内,通过其C末端疏水域保持锚定于质膜内,而含有所述肽的N末端突出到周质中,同时等待装配为噬菌体颗粒。LacI和噬菌体文库中的肽由于它们暴露于不同的蛋白水解活性,因此可能显著不同。噬菌体被膜蛋白需要跨内膜转运和作为加入噬菌体序曲的信号肽酶加工。某些肽对这些加工施加有害的影响,并在文库中代表性不足(Gallop等(1994)J.Med.Chem.37(9):1233-1251)。这些特定的倾向性不是LacI呈现系统中的因子。
重组随机文库中可利用的小肽数目是庞大的。通常制备107-109个独立克隆的文库。已经产生了大至1011个重组体的文库,但这种大小接近克隆文库的实际极限。文库大小的这种限制在含有随机化区段的DNA转化入宿主细菌细胞的步骤时发生。为了避开这种限制,最近已经开发出一种基于多核糖体复合物中新生肽呈现的体外系统。该呈现文库方法具有产生比目前可获得的噬菌体/噬菌粒文库或质粒文库高3-6个数量级的文库。此外,所述文库的构建、肽的表达和筛选以完全无细胞形式进行。
在该方法的一个应用中(Gallop等(1994)J.Med.Chem.37(9):1233-1251),构建了编码1012种十肽的分子DNA文库,该文库在大肠杆菌S30体外偶联转录/翻译系统中表达。选择条件,以将核糖体安装在mRNA上,使得大比例的RNA在多核糖体中积累,并产生含仍连接于其编码RNA的新生肽的复合物。所述多核糖体强壮得足以以同筛选更常规的重组肽呈现文库几乎相同方式,在固定化受体上进行亲和纯化。结合复合物的RNA可以回、转化成cDNA、用PCR扩增产生下一轮合成和筛选的模板。多核糖体呈现方法可以与噬菌体呈现系统偶联。在几轮筛选后,将来自富含多核糖体库的cDNA克隆入噬菌粒载体。该载体既用作肽表达载体呈现融合至被膜蛋白的肽,又用作肽鉴定的DNA测序载体。通过在噬菌体表达多核糖体衍生肽,可以继续该形式的亲和选择步骤,或在各个克隆上分析所述肽在噬菌体ELISA中的结合活性、或分析其在完全噬菌体ELISA(Barret等(1992)Anal.Biochem 204,357-364)中的结合特异性。为了鉴定所述活性肽的序列,人们可以对噬菌粒宿主产生的DNA进行测序。多肽和类似物的第二次筛选
在上述高通量测定后,可以进行第二次筛选,以便进一步鉴别生物活性,这使得本领域技术人员能够区别激动剂和拮抗剂。所用的第二次筛选的类型将取决于需要测试的所需活性。例如,可以开发一种测定,其中抑制目的蛋白及其各自配体之间相互作用的能力,可以用来从一组通过上述第一次筛选分离的肽片段鉴别拮抗剂。
因此,产生片段和类似物并测试它们的活性的方法是本领域已知的。一旦鉴别出目的核心序列,则获得类似物和片段对于本领域技术人员而言是常规技术。幽门螺杆菌多肽的肽模拟物
本发明也提供主题幽门螺杆菌多肽的蛋白结合域的还原,以产生模拟物,例如肽因子或非肽因子。所述肽模拟物例如在幽门螺杆菌多肽结合天然产生的配体的情况下,能够破坏多肽与其反配体的结合。可以确定主题幽门螺杆菌多肽参与多肽分子识别的关键残基,并将其用来产生幽门螺杆菌衍生的竞争性或非竞争性抑制该幽门螺杆菌多肽与互作多肽结合的肽模拟物(参见例如欧洲专利申请EP-412,762A和EP-B31,080A)。
例如,扫描诱变可以用来将特定幽门螺杆菌多肽参与结合互作多肽的氨基酸残基进行作图,可以产生肽模拟物(例如二氮杂或异喹啉衍生物),它们模拟与互作多肽结合中的那些残基,并且因此它们可以抑制幽门螺杆菌多肽与互作多肽的结合,并因此干扰幽门螺杆菌多肽的功能。例如,可以用苯并二氮杂产生这类残基的非可水解肽类似物(例如参见Freidinger等,Peptides:Chemistry and Biology,G.R.Marshall编辑,ESCOM Publisher:Leiden,Netherlands,1988)、氮杂(例如参见Huffamn等,Peptides:chemistry and Biology,G.R.Marshall编辑,ESCOM Publisher:Leiden,Netherlands,1988)、取代的γ内酰胺环(Garvey等,Peptides:chemistry and Biology,G.R.Marshall编辑,ESCOMPublisher:Leiden,Netherlands,1988)、酮-亚甲基假肽(Ewenson等(1986)J Med Chem 29:295;和Ewenson等,Peptides:Structure and Function(Proceedings of the 9th American Peptide Symposium)Pierce Chemical Co.Rockland,IL,1985)、β-转折二肽核心(Nagai等(1985)Tetrahedron Lett26:647;和Sato等(1986)J Chem Soc Perkin Trans 1:1231)、以及β-氨基醇(Gordon等(1985)Biochem Biophys Res Commun 126:419;以及Dann等(1986)Biochem Biophys Res Commun 134:71)。VI.幽门螺杆菌核酸和多肽的疫苗制剂
本发明也描述了针对幽门螺杆菌感染进行保护或治疗幽门螺杆菌感染的疫苗组合物或制剂(本文中可互换使用)的特征。本文所用的术语“治疗幽门螺杆菌感染”是指现有的或确立的幽门螺杆菌感染的治疗性治疗。术语“针对幽门螺杆菌感染的保护”或“预防性治疗”是指使用幽门螺杆菌疫苗制剂降低有幽门螺杆菌感染风险的受治疗者的幽门螺杆菌感染的风险或预防幽门螺杆菌感染。在一个实施方案中,所述疫苗组合物含有一种或多种来自幽门螺杆菌的免疫原性组分(诸如表面蛋白)或其片段以及药学上可接受的载体。例如,在一个实施方案中,本发明的疫苗制剂含有至少一种幽门螺杆菌多肽或其片段的或来自相同或不同幽门螺杆菌抗原的幽门螺杆菌多肽或其片段的组合物。用于本发明疫苗制剂中的核酸和幽门螺杆菌多肽,包括序列表中陈述的核酸和多肽,最好是编码表面蛋白的幽门螺杆菌核酸以及表面蛋白或其片段。例如优选用于本发明疫苗组合物中的核酸和幽门螺杆菌多肽选自表1中提出的编码胞外被膜蛋白的核酸和幽门螺杆菌胞外被膜蛋白。然而,编码免疫原性幽门螺杆菌蛋白的任何核酸以及幽门螺杆菌多肽及其部分,均可以用于本发明中。这些疫苗具有治疗和/或预防用途。
本发明的一个方面提供保护抵抗幽门螺杆菌感染的疫苗组合物,包含至少一种幽门螺杆菌蛋白的免疫原性片段和一种药学上可接受的载体。优选的片段包括至少长大约10个氨基酸残基、优选长大约10-20个氨基酸残基、更优选长大约12-16个氨基酸残基的肽。
例如通过筛选由编码全长幽门螺杆菌蛋白的核酸的相应片段重组产生的多肽,可以获得本发明的免疫原性组分。另外,可以采用本领域已知的技术,诸如常规Merrifield固相f-Moc或t-Boc化学,化学合成片段。
在一个实施方案中,根据该肽刺激T细胞的能力鉴定免疫原性组分。通过例如T细胞增殖或细胞因子分泌测定的刺激T细胞的肽,在本文中定义为包含至少一种T细胞表位。相信T细胞表位参与引起变态反应临床症状的蛋白变应原免疫应答的起始和永续性。认为这些T细胞表位在T辅助细胞水平上通过与抗原提呈细胞表面上的合适HLA分子结合,触发早期事件,由此刺激具有该表位的相关T细胞受体的T细胞亚群。这些事件导致T细胞增殖、淋巴因子分泌、局部炎性反应、将其它免疫细胞募集至抗原/T细胞相互作用位点以及导致抗体产生的B细胞级联的激活。T细胞表位是一种基本元件或T细胞受体识别的最小单位,在此所述表位包含受体识别所必需的氨基酸(例如大约6或7个氨基酸残基)。模拟T细胞表位氨基酸序列的氨基酸序列属于本发明范围。
在另一实施方案中,本发明的免疫原性组分通过基因组疫苗接种鉴定。该基本方案基于下述的想法:包含所有或部分病原体基因组(例如幽门螺杆菌基因组)的表达文库当用来遗传免疫宿主时,可以提供保护。该表达文库的免疫(ELI)与表达克隆类似,包括在可以用作基因疫苗的质粒中还原病原体(例如幽门螺杆菌)的基因组表达文库。所述质粒也可以设计为编码可以显著刺激体液应答的遗传佐剂。这些遗传佐剂可以在较远位点引入,并且在胞外以及在胞内起作用。
这是一种疫苗生产的新方法,它有活/减毒病原体的许多优点,但没有感染的风险。可以用病原体DNA的表达文库免疫宿主,由此产生活疫苗抗原提呈的效应,而没有风险。例如在本发明中,幽门螺杆菌基因组或粘粒或质粒克隆的随机片段、以及通过基因组测序鉴定的基因的PCR产物,可以用来免疫宿主。该方法的可行性已经用肺支原体(Mycoplasma pulmonis)证明(Brry等,Nature 377:632-536,1995),甚至一种啮齿动物的天然病原体肺支原体的部分表达文库提供针对该病原体攻击的保护作用。
ELI是一种技术,它甚至当几乎不了解病原体的生物学时,也允许生产非感染性多分体疫苗,因为ELI使用免疫系统筛选候选基因。一旦分离出这些基因,则它们可以用作基因疫苗,或用于开发重组蛋白疫苗。因此,ELI允许以系统的、主要为机械化方式生产疫苗。
可以采用几种不同测定中的一种或多种,完成筛选免疫原性组分。例如,在体外,通过将已知或怀疑为免疫原性的肽与T细胞培养物中提呈合适MHC分子的抗原提呈细胞接触,测定肽的T细胞刺激活性。结合必需的共同刺激,将结合合适的MHC分子的免疫原性幽门螺杆菌肽提呈给T细胞,具有将信号传送至T细胞的效应,这诱导产生提高水平的细胞因子,特别是白介素-2和白介素-4。可以获得该培养上清液,并测定白介素-2或其它已知的细胞因子。例如,可以使用几种白介素-2常规测定中的任何一种,诸如Proc.Natl.Acad.Sci.USA,86:1333(1989)中描述的测定方法,该文献的相关部分通过引用结合到本文中。也可用Genzyme Corporation(Cambrige,MA)的干扰素产生测定的试剂盒。
或者,常用的T细胞增殖测定需要测定氚标记的胸苷掺入。可以通过测定掺入培养细胞的复制DNA中的3H标记胸苷的量,体外测定T细胞的增殖。因此,可以定量测定DNA合成速率,再定量测定细胞分裂速率。
含有一种或多种免疫原性组分(例如幽门螺杆菌多肽或其片段或编码幽门螺杆菌多肽的核酸或其片段)的本发明的疫苗组合物或制剂,最好包括一种药学上可接受的载体。术语“药学上可接受的载体”将包括与药物给予相适应的任何一种和所有的溶剂、分散介质、涂料、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。合适的药学上可接受的载体包括例如水、盐水、磷酸缓冲盐溶液、葡萄糖、甘油、乙醇等的一种或多种以及它们的组合物。药学上可接受的载体还可以包括少量的辅助物质,诸如润湿剂或乳化剂、防腐剂或缓冲剂,它们增加幽门螺杆菌核酸和多肽的储存期或效力。对于含有幽门螺杆菌多肽的本发明的疫苗制剂,所述多肽最好与本文所述的合适佐剂和/或传递系统一起给予。
对于本领域技术人员显而易见的是,本发明DNA或蛋白的治疗有效量将特别取决于给药方案、给予的幽门螺杆菌核酸或多肽的单位剂量、该蛋白或核酸是否结合其它治疗剂给予、患者的免疫状况和健康状况以及特定蛋白或核酸的治疗活性。
疫苗制剂通常胃肠外给予,例如通过皮下或肌内注射给予。Wolff等(1990)Science  247:1465-1468和Sedegah等(1994)Immunology  91:9866-9870描述了肌内免疫的方法。其它给药模式包括口服制剂和肺制剂、栓剂和经皮给药。相对于胃肠外方法,口服免疫是诱导抵抗幽门螺杆菌感染的保护作用的优选方法。Czinn等(1993)Vaccine  11:637-642。口服制剂包括这类通常使用的赋形剂,诸如药用级甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁等等。
在一个实施方案中,该疫苗制剂包括作为药学上可接受载体的佐剂。用于本发明疫苗制剂中的合适佐剂的实例包括但不限于,氢氧化铝;N-乙酰-胞壁酰-L-苏氨酰基-D-异谷氨酰胺(thr-MDP);N-乙酰-nor-胞壁酰-L-丙氨酰基-D-异谷氨酰胺(CGP 11637,称为nor-MDP);N-乙酰胞壁酰-L-丙氨酰基-D-异谷氨酰基-L-丙氨酸-2-(1’-2’-二棕榈酰-sn-甘油基-3-羟基磷酰氧基)-乙胺(CGP 19835A,称为MTP-PE);RIBI,含有三种来自细菌的组分;单磷酰脂质A;海藻糖二霉菌酸酯;细胞壁骨架(MPL+TDM+CWS)的2%角鲨烯/Tween 80乳液;以及霍乱毒素。可以使用的其它佐剂是霍乱毒素的无毒衍生物(包括其B亚基)和/或幽门螺杆菌多肽与霍乱毒素或其B亚基、霍乱类菌素原、真菌多糖(包括裂裥菌素)、胞壁酰二肽、胞壁酰二肽的衍生物、佛波醇酯、大肠杆菌的不稳定毒素、非幽门螺杆菌细菌裂解液、嵌段聚合物或皂苷的缀合物或遗传改造的融合体。
在一个实施方案中,该疫苗制剂包括作为药学上可接受载体的传递系统。用于本发明疫苗制剂的合适传递系统包括可生物降解的微囊或免疫刺激复合物(ISCOM)、蜗形物(cochleate)或脂质体、遗传改造的减毒活载体(诸如病毒或细菌)和重组(嵌合)病毒样颗粒(例如蓝舌病毒)。在本发明的另一实施方案中,该疫苗制剂包括一个传递系统和一种佐剂。
人类中的传递系统可以包括保护该抗原免受胃酸性环境损害的肠溶释放胶囊,包含作为融合蛋白的不溶性形式的幽门螺杆菌多肽。本发明疫苗的合适载体为肠溶包衣胶囊和聚交酯-聚乙交酯微球体。合适稀释剂为0.2N NaHCO3和/或盐水。
本发明的疫苗在成人和儿童中可以作为初次预防剂给予,在成功地根除受感染宿主中的幽门螺杆菌后,作为第二次预防给予,或作为治疗剂给予,目的是诱导易感宿主的免疫应答以预防幽门螺杆菌感染。本发明疫苗给予的量可由本领域技术人员容易地确定。因此,关于成人,合适的剂量范围为10μg-10g,最好为10μg-100mg,例如50μg-50mg。成人合适的剂量范围也为5μg-500mg。相似的剂量范围可以用于儿童。
佐剂的用量将取决于所用的佐剂类型。例如,当粘膜佐剂为霍乱毒素时,其合适的用量为5μg-50μg,例如为10μg-35μg。当以微囊形式使用时,该用量将取决于该微囊基质中达到所需剂量的用量。该量的确定在本领域技术人员的技术范围内。
本领域技术人员会认识到,最适剂量或多或少地取决于该患者的体重、疾病、给药途径和其它因素。本领域技术人员也会认识到,根据已知的口服疫苗(诸如基于大肠杆菌裂解液的疫苗)的结果(日剂量为6mg,直至总剂量为540mg)和产肠毒素大肠杆菌纯化抗原的结果(4个剂量的1mg)(Schulman等,J.Urol. 150:917-921(1993));Boedecker等,American Gastroenterological Assoc. 999:A-222(1993)),可以获得合适的剂量水平。给药次数取决于疾病、制剂和来自临床试验的效力数据。对治疗过程不设计任何限制,对于1个月的初次免疫时间表,该治疗可以给予3-8次(Boedeker,American Gastroenterological Assoc.888:A-222(1993))。
在一个最佳实施方案中,本发明的疫苗组合物可以基于杀伤的全大肠杆菌制剂(具有大肠杆菌表面上表达本发明的幽门螺杆菌蛋白的免疫原性片段),或它可以基于大肠杆菌裂解液,其中杀伤的大肠杆菌用作载体或佐剂。
对本领域技术人员显而易见的是,某些本发明的疫苗组合物可仅用来预防幽门螺杆菌感染,某些疫苗组合物可以仅用来治疗幽门螺杆菌感染,某些疫苗组合物可用来既预防又治疗幽门螺杆菌感染。在一个最佳实施方案中,本发明的疫苗组合物通过刺激针对幽门螺杆菌的体液和/或细胞介导的免疫,提供抵抗幽门螺杆菌感染的保护作用。应该理解,减轻幽门螺杆菌感染的任何症状是所需的临床目标,包括减少用来治疗幽门螺杆菌引起的疾病的药物剂量,或增加患者血清或粘膜中抗体的产生。VII.与幽门螺杆菌多肽反应的抗体
本发明也包括与主题幽门螺杆菌多肽特异性反应的抗体。可以采用标准方案(参见例如Harlow和Lane编辑的Antibodies:A LaboratoryManual(Cold Spring Harbor Press,1988))生产抗蛋白/抗肽抗血清或单克隆抗体。诸如小鼠、仓鼠或兔子的哺乳动物可以用免疫原性形式的该肽免疫。赋予蛋白或肽免疫原性的技术包括与载体缀合或其它本领域已知的技术。主题幽门螺杆菌多肽的免疫原性部分可以在佐剂存在下给予。可以通过检测血浆或血清中的抗体效价,监测免疫进程。可以用标准ELISA或其它免疫测定与作为抗原的免疫原,评价抗体水平。
在一个最佳实施方案中,主题抗体对于本发明的幽门螺杆菌抗原决定簇为免疫特异性的,所述抗原决定簇例如为序列表中含有的本发明多肽的抗原决定簇、或密切相关的人类或非人类哺乳动物同源物(例如90%同源,更优选至少95%)。在再一本发明的最佳实施方案中,抗幽门螺杆菌抗体与例如与序列表中含有的本发明序列的同源性低于80%的蛋白基本上不交叉反应(即,特异性反应)。“基本上不交叉反应”是指该抗体对非同源性蛋白的结合亲和力低于对序列表中含有的本发明蛋白的结合亲和力的10%,更优选低于5%,甚至更优选低于1%。在一个最优选的实施方案中,在细菌和哺乳动物抗原之间没有交叉反应性。
本文所用的术语抗体计划包括也与幽门螺杆菌多肽特异性反应的抗体的片段。可以采用常规技术将抗体片段化,并如用于全抗体所述的相同方式,根据其用途筛选片段。例如,F(ab’)2片段可以用胃蛋白酶处理抗体而产生。可以处理产生的F(ab’)2片段,以还原二硫键,产生Fab’片段。本发明的抗体还计划包括具有抗幽门螺杆菌部分的双特异性嵌合分子。
针对幽门螺杆菌多肽或幽门螺杆菌多肽变异体的单克隆抗体和多克隆抗体(Ab)以及诸如Fab’和F(ab’)2的抗体片段,可以通过微注射本发明的抗幽门螺杆菌多肽抗体,用来阻断幽门螺杆菌多肽的作用,并且使得可以研究特定的本发明幽门螺杆菌多肽在异常或不想要的胞内信号发送、以及幽门螺杆菌正常细胞功能中的作用。
特异性结合幽门螺杆菌表位的抗体也可以用来对组织样品进行免疫组织化学染色,以便评价幽门螺杆菌抗原的丰度和表达型式。抗幽门螺杆菌多肽抗体可以在诊断上用于免疫沉淀和免疫印迹分析,以作为临床测试方法一部分检测和评价组织或体液中的幽门螺杆菌水平。同样,监测个体中幽门螺杆菌多肽水平的能力可以允许检测给定治疗方案对于惠有这种疾病的个体的效力。可以在体液(诸如尿样)中发现的细胞中测定幽门螺杆菌多肽的水平,或可以在诸如胃活检产生的组织中测定。采用抗幽门螺杆菌抗体的诊断测定可以包括例如设计有助于早期诊断幽门螺杆菌感染的免疫测定。本发明也可以用作使用特异性幽门螺杆菌抗原检测样品中含有的抗体的方法,其中所述样品来自该细菌感染的个体。
本发明的抗幽门螺杆菌多肽抗体的另一应用,是免疫筛选在诸如λgt11、λgt18-23、λZAP和λORF8的表达载体中构建的cDNA文库。该类型的信使文库具有插入正确读框和以正确方向插入的编码序列,可以产生融合蛋白。例如λgt11将产生其氨基末端包含β-半乳糖苷酶氨基酸序列、其羧基末端包含外源多肽的融合蛋白。然后,例如当使由受感染平板影印的硝酸纤维素滤膜与抗幽门螺杆菌多肽抗体反应时,可以用抗体检测主题幽门螺杆菌多肽的抗原表位。然后,可以从受感染平板分离用该测定评分的噬菌体。因此,可以检测幽门螺杆菌基因同源物的存在,并将其由其它物种中克隆,可以检测并克隆其它的同种型(包括剪接变异体)。VIII.含有本发明核酸、多肽或抗体的试剂盒
本发明的核酸、多肽和抗体可以与其它试剂和物品组合,形成试剂盒。用于诊断目的的试剂盒通常包括小瓶或其它合适容器中的所述核酸、多肽或抗体。试剂盒通常包括其它试剂,以进行杂交反应、聚合酶链式反应(PCR)或用于重建冻干组分,诸如水性介质、盐、缓冲液等。试剂盒也可以包括用于样品加工的试剂,诸如去垢剂、离液盐等。试剂盒也可以包括固定化试剂,诸如颗粒、支持体、孔、浸棒(dipstick)等。试剂盒也可以包括标记工具,诸如染料、显色试剂、放射性同位素、荧光剂、发光或化学发光剂、酶、嵌入剂等。用本文提供的核酸序列和氨基酸序列信息,本领域技术人员可以容易地装配试剂盒,以用于其特定目的。试剂盒还可以包括使用说明。IX.采用幽门螺杆菌多肽的药物筛选测定
通过制备可用的纯化和重组的幽门螺杆菌多肽,本发明提供可以用来筛选药物的测定,其中所述药物或者为正常细胞功能(在该情况下,为主题幽门螺杆菌多肽)或其在细胞信号发送中作用的激动剂或拮抗剂。这类抑制剂或增效剂可以用作新的抵抗人类幽门螺杆菌感染的治疗剂。种类繁多的测定形式会满足需要,并且根据本发明,技术人员会充分了解这些测定形式。
在测试化合物和天然提取物文库的许多药物筛选中,需要高通量测定,以便使在给定的时间内研究的化合物数目最大化。在诸如可以得自纯化或半纯化蛋白的无细胞系统中进行的测定,常常优选作为“初次”筛选,因为可以产生它们以使得可以快速开发,并相对容易地检测分子靶中由受试化合物介导的改变。此外,受试化合物的细胞毒性和/或生物利用度在体外系统中一般可以忽略,而该测定主要集中在该药物对分子靶的效应,如可能表现在与其它蛋白的结合亲和力的改变或分子靶酶性质的改变。因此,在一个本发明例举的筛选测定中,使该目的化合物与分离和纯化的幽门螺杆菌多肽接触。
可以用纯化的幽门螺杆菌多肽及其片段,诸如具有酶活性的幽门螺杆菌多肽,在体外构建筛选测定,使得该多肽的活性产生可检测的反应产物。可以通过从采用受试化合物的各种浓度获得的数据产生剂量反应曲线,评价该化合物的效力。此外,可以进行对照测定,以提供比较基线。合适的产物包括例如具有特殊吸收、荧光或化学发光性质的那些产物,因为检测可以容易地自动进行。在该测定中可以测试种种合成或天然存在的化合物,以鉴别那些抑制或增强该幽门螺杆菌多肽的活性。这些活性化合物中的某些可以直接地、或通过化学改变促进膜通透性或溶解性,也在活的全幽门螺杆菌细胞中抑制或增强相同的活性(例如酶活性)。
通过以下实施例进一步说明本发明,这些实施例不应解释为限制性的。该申请中引用的所有参考文献和公开的专利申请内容均通过引用结合到本文中。
                          范例 I.幽门螺杆菌DNA的克隆和测序
按照Schleif R.F.和Wensink P.C.,Practical Methods in MolecularBiology,第98页,Springer-Verlag,NY.,1981概述的基本DNA方案,进行一点修改,分离幽门螺杆菌染色体DNA。简而言之,将细胞沉淀,重悬浮于TE(10mM Tris,1mM EDTA,ph 7.6),加入GES裂解缓冲液(5.1M硫氰酸胍,0.1M EDTA,pH 8.0,0.5%N-月桂基肌氨酸)。冷却悬浮液,加入乙酸胺,终浓度为0.2M。DNA首先用氯仿抽提,然后用苯酚-氯仿抽提,再用氯仿抽提。用异丙醇沉淀DNA,用70%EtOH洗涤2次,干燥并重悬浮于TE中。
分离后,将完整的基因组幽门螺杆菌DNA雾化(Bodenteich等,Automated DNA Sequencing and Analysis(J.C.Venter编辑),AcademicPress,1994)为2000bp的平均大小。雾化后,将所述DNA浓缩,并在标准1%琼脂糖凝胶上分离。从凝胶上切下对应于大小大约为900-1300bp、1300-1700bp、1700-2200bp、2200-2700bp的几个部分,通过GeneClean方法(Bio101,Inc.)纯化。
然后用T4 DNA聚合酶将纯化的DNA片段平端化。然后将愈合的DNA与以100-1000倍过量的独特BstXI接头连接物连接。这些接头与BstXI切割的pMPX载体互补,而突出端不是自身互补的。因此,所述接头不会连环化,切割的载体自身也不容易重连接。在1%琼脂糖凝胶上将接头连接的插入片段与未掺入的接头分离,并用GeneClean纯化。然后将接头连接的插入片段连接于20种pMPX载体中的每一种,以构建一系列“鸟枪”亚克隆文库。所述载体在克隆位点含有框架外的LacZ基因,在克隆连接物-二聚体的事件中变为符合读框,使得这些载体避免其蓝色。
所有随后的步骤均基于Church G.M.和Kieffier-Higgins S.,Science240:185-188,1988概述的多重DNA测序方案。仅突出了对所述方案的主要修改。简而言之,将20种载体中的每一种转化入DH5α感受态细胞(Gibco/BRL,DH5α转化方案)。通过平板接种于含有氨苄青霉素、二甲氧基苯青霉素和IPTG/Xgal的抗生素平板,评估文库。所述平板于37℃培养过夜。然后使用成功的转化体将克隆铺平板,并合并为多重库。挑出所述克隆,合并于40ml生长培养基中。培养物于37℃生长过夜。采用Qiagen Midi-prep试剂盒和Tip-100柱(Qiagen,Inc.)纯化DNA。以该方式,每个库获得100μg DNA。产生15个96孔板DNA,获得5-10倍的序列丰余,假定平均读码长度(read-lenght)为250-300个碱基。
然后,采用基于化学降解法的多重DNA测序(Church G.M.和Kieffer-Higgins S.,Sicence 240:185-188,1988),或用Sequithrem(Epicenter Technologies)的双脱氧测序方案,对这些纯化的DNA样品测序。将测序反应物电泳分离,通过从40cm凝胶上的直接转移电泳(Richterich P.和Church G.M.,Methods in Enzymology 218:187-222,1993),或通过电印迹(church,见上述),转移到尼龙膜上。每块凝胶电泳24个样品。通过化学测序,获得45个成功的膜,通过双脱氧测序,产生8个成功的膜。通过暴露于紫外光,将所述DNA共价结合于所述膜上,并与同所述载体上的标记序列互补的标记寡核苷酸杂交(Church,见上述)。洗涤所述膜,以清洗去非特异性结合的探针,对X胶片曝光,以显现各个序列梯。放射自显影后,通过于65℃温育,除去杂交的探针,用另一标记序列重复杂交循环,直至对于化学测序膜,该膜已经用探针探测38次,而对于双脱氧测序膜,该膜已经探测10次。因此,每块凝胶产生大量的膜,每个膜含有新的测序信息。无论何时加工新的印迹,均是对加入每个库种的内标序列进行初次的探测。
用激光扫描光密度计(Molecular Dynamics,Sunnyvale,CA)产生所述薄膜的数字图象。在计算机工作站(VaxStation 4000’s),采用程序REPLICATM(Church等,Automated DNA Sequencing and Analysis(J.C.Venter编辑),Academic Press,1994),加工所述数字化图象。图象加工包括使泳道直化、调整对比度以平滑掉亮度差以及通过叠代高斯去卷积提高分辨率。然后在REPLICATM中自动挑出序列,在储存于项目数据库之前显示用于交互校读。通过快速可见扫描薄膜图象,然后用鼠标在显示的图象条带上单击以修饰碱基调入,完成校读。因为包括基因组DNA同一部分的多重序列读码提供用于编辑的足够的序列丰余性,所以可以检测到并校正许多序列错误。每个序列自动接受一个识别编号(对应于微量滴定板、探针信息和泳道组号)。该编号用作该序列的永久识别号,因此,它通常可以鉴别任何特定序列的来源,而不用求助于特定的数据库。
采用程序FALCON(Church,Church等,Automated DNA Sequencingand Analysis(J.C.Venter编辑),Academic Press,1994)进行幽门螺杆菌序列的常规装配。该程序已证明对于大多数序列是快速而可靠的。用Genetics Computer Group(GCG)开发的、与REPLICATM交互的修改版本的GelAssemble(Deverux等,Nucleic Acid Res.12:387-95,1984),显示装配的重叠群。这供给集成编辑器,允许从REPLICATM数据库种瞬时调出多重序列凝胶图像,并显示以允许快速扫描重叠群,并校读在装配中在不同序列读码之间发生偏差的凝胶痕迹。II.重组幽门螺杆菌DNA序列的鉴定、克隆和表达
为了便于幽门螺杆菌膜蛋白和分泌蛋白的克隆、表达和纯化,选择一个强有力的基因表达系统pET系统(Novagen),用于在大肠杆菌种克隆和表达重组蛋白。此外,还将编码肽标记His标记的一个DNA序列融合于目的DNA序列的3’端,以便有助于纯化所述重组蛋白产物。选择3’端进行融合,以便避免任何5’末端信号序列的改变。上述的例外是ppiB,这是一个在表达研究中用作对照而克隆的基因。在该项研究中,幽门螺杆菌ppiB的序列含有一个融合于所述全长基因5’端、编码His标记的DNA序列,因为该基因的蛋白产物不含有信号序列,并作为胞质蛋白表达。含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白的ORF的DNA序列的PCR扩增和克隆
制备选择用于从幽门螺杆菌J99菌株克隆的序列(来自本发明的DNA序列表),用于通过聚合酶链式反应(PCR)扩增克隆。设计和购买对于可读框(ORF)5’和3’端特异的合成寡核苷酸引物(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA)(表3)。设计所有正向引物(对该序列5’端特异的),以在5’末端尽头包含一个 NcoI克隆位点,除了HpSeq.4821082,它使用 NdeI。设计这些引物,以允许在后接缬氨酸残基和天然幽门螺杆菌DNA序列其余部分编码序列的甲硫氨酸残基起始蛋白翻译。一个例外是幽门螺杆菌序列4821082,其起始甲硫氨酸后紧接天然幽门螺杆菌DNA序列的其余部分。所有的反向引物(对幽门螺杆菌ORF 3’端特异的)均在5’末端尽头包括一个 EcoRI位点,以允许将每个幽门螺杆菌序列克隆入pET-29b的读框中。pET-28b载体提供编码另外20个羧基末端氨基酸(在HpSeq.26380318和HpSeq.14640637中仅有19个氨基酸)的序列(包含6个组氨酸残基(于C末端尽头)),包含His标记。如前所述,上述的一个例外是ppiB基因的载体构建。对ppiB基因的5’端特异的合成寡核苷酸引物于其5’末端尽头编码一个 BamHI位点,ppiB基因3’端的引物于其5’末端尽头编码一个 XhoI位点。
                        表3
用于PCR扩增幽门螺杆菌DNA序列的寡核苷酸引物
外膜蛋白 正向引物5’至3’ 反向引物5’至3’
蛋白16225006 5'-TATACCATGGTGGGCGCTAA-3'(SEQ IDNO:195) 5'-ATGAATTCGAGTAAGGATTTTTG-3'(SEQID NO:196)
蛋白26054702 5'-TTAACCATGGTGAAAAGCGATA-3'(SEQ IDNO:197) 5'-TAGAATTCGCATAACGATCAATC-3'(SEQID NO:198)
蛋白7116626 5'-ATATCCATGGTGAGTTTGATGA-3'(SEQ IDNO:199) 5'-ATGAATTCAATTTTTTATTTTGCCA-3'(SEQ ID NO:200)
蛋白29479681 5'-AATTCCATGGTGGGGGCTATG-3'(SEQ IDNO:201) 5'-ATGAATTCTCGATAGCCAAAATC-3'(SEQID NO:202)
蛋白14640637 5'-AATTCCATGGTGCATAACTTCCATT-3'(SEQ ID NO:203) 5'-AAGAATTCTCTAGCATCCAAATGGA-3'(SEQ ID NO:204)
周质/分泌蛋白
蛋白30100332 5'-ATTTCCATGGTCATGTCTCATATT-3'(SEQ IDNO:205) 5'-ATGAATTCCATCTTTTATTCCAC-3'(SEQ ID NO:206)
蛋白4721061 5'-AACCATGGTGATTTTAAGCATTGAAAG-3'(SEQ ID NO:207) 5'-AAGAATTCCACTCAAAATTTTTTAACAG-3'(SEQ ID NO:208)
其它表面蛋白
蛋白4821082 5'-GATCATCCATATGTTATCTTCTAAT-3'(SEQID NO:209) 5'-TGAATTCAACCATTTTAACCCTG-3'(SEQ ID NO:210)
蛋白978477 5'-TATACCATGGTGAAATTTTTTCTTTTA-3'(SEQ ID NO:211) 5'-AGAATTCAATTGCGTCTTGTAAAAG-3'(SEQ ID NO:212)
内膜蛋白
蛋白26380318 5'-TATACCATGGTGATGGACAAACTC-3'(SEQID NO:213) 5'-ATGAATTCCCACTTGGGGCGATA-3'(SEQID NO:214)
胞质蛋白
ppi 5'-TTATGGATCCAAACCAATTAAAACT-3'(SEQID NO:215) 5'-TATCTCGAGTTATAGAGAAGGGC-3'(SEQID NO:216)
由幽门螺杆菌J99菌株(ATCC #55679,由Genome TherapeuticsCorporation,100 Beaver Street,Walthman,MA 02154保藏)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有幽门螺杆菌ORF的DNA序列,将基因组DNA(60纳克)引入含有终体积为100μl的以下物质的反应小瓶中:2mM MgCl2、1μM互补并邻接于限定幽门螺杆菌ORF的合成寡核苷酸引物(正向引物和反向引物)、各种三磷酸脱氧核苷酸各0.2mM;dATP、dGTP、dCTP、dTTP和2.5单位热稳定的DNA聚合酶(Amplitaq,RocheMolecular Systems,Inc.,Branchburg,NJ,USA)。采用Perkin ElmerCetus/GeneAmp PCR系统9600热循环仪,使用以下热循环条件获得每种ORF的扩增DNA产物:蛋白26054702、蛋白7116626、蛋白29479681、蛋白30100332和蛋白4821082:
于94℃变性2分钟,
2个循环:94℃15秒,30℃15秒和72℃1.5分钟
23个循环:94℃15秒,55℃15秒和72℃1.5分钟
反应于72℃6分钟结束。蛋白16225006:
于94℃变性2分钟,
25个循环:95℃15秒,55℃15秒和72℃1.5分钟
反应于72℃6分钟结束。蛋白4721061:
于94℃变性2分钟,
2个循环:94℃15秒,36℃15秒和72℃1.5分钟
23个循环:94℃15秒,60℃15秒和72℃1.5分钟
反应于72℃6分钟结束。蛋白26380318:
于94℃变性2分钟,
2个循环:94℃15秒,38℃15秒和72℃1.5分钟
23个循环:94℃15秒,62℃15秒和72℃1.5分钟
反应于72℃6分钟结束。蛋白14640637:
于94℃变性2分钟,
2个循环:94℃15秒,33℃15秒和72℃1.5分钟
30个循环:94℃15秒,55℃15秒和72℃1.5分钟
反应于72℃6分钟结束。扩增幽门螺杆菌ppiB的条件:
于94℃变性2分钟,
2个循环:94℃15秒,32℃15秒和72℃1.5分钟
25个循环:94℃15秒,56℃15秒和72℃1.5分钟
反应于72℃6分钟结束。
完成热循环反应时,洗涤每个扩增DNA样品,并采用QiaquickSpin PCR纯化试剂盒(Qiagen,Gaithersburg,MD,USA)纯化。所有扩增的DNA样品经过用限制性内切核酸酶 NcoIEcoRI(New EnglandBioLabs,Beverly,MA,USA)消化,或在HpSeq.48210182(SEQ ID NO:1309)的情况下,用 NdeIEcoRI消化(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后,DNA样品在1.0%NuSeive(FMC BioProducts,Rockland,ME USA)琼脂糖凝胶上电泳。通过暴露于溴化乙锭和长波UV辐射,使DNA显现。从琼脂糖凝胶分离的胶片中含有的DNA,用Bio 101 GeneClean试剂盒方案(Bio 101 Vista,CA,USA)纯化。将幽门螺杆菌DNA序列克隆入pET-28b原核表达载体中
制备pET-28b载体用于通过用 NcoIEcoRI消化克隆,或在幽门螺杆菌蛋白4821082的情况下,用 NdeIEcoRI消化(CurrentProtocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。在克隆ppiB时,使用pET-28a载体并制备克隆位点,以用于ppiB基因通过用 BamHIXhoI限制性内切核酸酶消化进行克隆,其中pET-28a载体编码一个His标记,该标记融合于插入基因的5’端。
消化后,将DNA插入片段克隆入(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)预先消化的pET-28b表达载体中,除去扩增的ppiB插入片段,将其克隆入pET-28a表达载体中。然后如上所述用连接反应产物转化大肠杆菌BL21菌株(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。用重组质粒转化感受态细菌
按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),用携带克隆幽门螺杆菌序列的重组pET表达质粒转化大肠杆菌菌株BL21或大肠杆菌菌株BL21(DE3)的感受态菌。简而言之,将1微升连接反应物与50微升电感受态(electrocompetent)细胞混合,经过高压脉冲处理,此后,样品于0.45毫升SOC培养基(0.5%酵母提取物、2.0%胰蛋白胨、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)、37℃振荡培养1小时。然后将样品涂布在含有25微克/ml硫酸卡那霉素的LB琼脂平板上生长过夜。如上所述挑出并分析BL21的转化菌落,以评价克隆插入片段。携带幽门螺杆菌序列的重组pET表达质粒的鉴定
采用用于初始PCR扩增克隆反应中对各个幽门螺杆菌序列特异的相同正向和反向引物,通过克隆的插入片段的PCR扩增,分析用重组pET-28b-幽门螺杆菌ORF转化的各个BL21克隆。成功的扩增证实,幽门螺杆菌序列加入该表达载体中(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。由BL21转化体分离和制备质粒DNA
挑出携带正确克隆的幽门螺杆菌ORF的重组pET-28b载体的各个克隆,于加有25微克/ml硫酸卡那霉素的5ml LB液体培养基中培养过夜。第二天,分离质粒DNA,并采用Qiagen质粒纯化方法(Qiagen Inc.,Chatsworth,CA,USA)纯化。重组幽门螺杆菌序列在大肠杆菌中的表达
可以在任何大肠杆菌K-12菌株(例如HMS174、HB101、JM109、DH5等)中繁殖pET载体,用于克隆或质粒制备。用于表达的宿主包括含有一个T7 RNA聚合酶基因的染色体拷贝的大肠杆菌菌株。这些宿主是携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因的噬菌体DE3、λ衍生物的溶原体。通过加入异丙基-B-D-硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶,T7 RNA聚合酶转录携带一个T7启动子和目的基因的任何靶质粒,诸如pET-28b。所用的菌株包括:BL21(DE3)(Studier,F.W.,Rosenberg,A.H.,Dunn,J.J.和Dubendorff,J.W.(1990)Meth.Enzymol.185,60-89)。
为了表达重组幽门螺杆菌序列,用50纳克按上述分离的质粒,如上所述DNA转化感受态BL21(DE3)细菌(由Novagen作为pET表达系统试剂盒的一部分提供)。LacZ基因(β-半乳糖苷酶)在所述幽门螺杆菌重组构建物的pET系统中表达。转化细胞于SOC培养基中培养1小时,然后将培养物在含有25微克/ml硫酸卡那霉素的LB平板上铺平板。第二天,合并细菌菌落,于含有硫酸卡那霉素(25微克/ml)的LB培养基中生长至于600nM的光密度为0.5-1.0 O.D.单位,此时,将1mMIPTG加入培养物中3小时,以诱导幽门螺杆菌重组DNA构建物的基因表达。
用IPTG诱导基因表达后,通过在Sorvall RC-3B离心机中以3500×g于4℃离心15分钟,沉淀细菌。将沉淀重悬浮于50毫升冷10mMTris-HCl pH 8.0、0.1M NaCl和0.1mM EDTA(STE缓冲液)中。然后于2000×g、4℃离心20分钟。将湿沉淀称重,并冷冻于-80℃,直至准备用于蛋白纯化。III.从大肠杆菌纯化重组蛋白分析方法
采用由氨基酸含量计算的吸光度系数,通过分光光度计定量测定纯化蛋白制剂的浓度(Perkins,S.J.1986 Eur.J.Biochem.157,169-180)。也通过Bradford,M.M.(1976)Anal.Biochem.72,248-254和Lowry,O.H.,Rosebrough,N.,Farr,A.L.和Randall,R.J.(1951)J.Biol.Chem.193,第265-275页的方法,采用牛血清白蛋白作为标准,测量蛋白浓度。
SDS-聚丙烯酰胺凝胶(12%或4.0-25%丙烯酰胺梯度凝胶)购自BioRad(Hercules,CA,USA),并用考马斯亮蓝染色。分子量标记包括兔骨骼肌肌球蛋白(200kDa)、大肠杆菌β-半乳糖苷酶(116kDa)、兔肌磷酸化酶B(97.4kDa)、牛血清白蛋白(66.2kDa)、卵清蛋白(45kDa)、牛碳酸酐酶(31kDa)、大豆胰蛋白酶抑制剂(21.5kDa)、卵清溶菌酶(14.4kDa)和牛抑酶肽(6.5kDa)。1.可溶性蛋白的纯化
所有步骤均在4℃进行。将冷冻细胞解冻,重悬浮于5倍体积裂解缓冲液(20mM Tris pH 7.9、0.5M NaCl、具有10%甘油的5mM咪唑、0.1%2-巯基乙醇、200μg/ml溶菌酶、1mM苯甲基磺酰氟(PMSF)和亮抑酶肽、抑酶肽、胃酶抑制剂、L-1-氯-3-[4-甲苯磺酰氨基]-7-氨基-2-庚酮(TLCK)、L-1-氯-3-[4-甲苯磺酰氨基]-4-苯基-2-丁酮(TPCK)和大豆胰蛋白酶抑制剂各10ug/ml)中,并数次通过小体积微量流化装置(M-110S型,Microfluidics International Corporation,Newton,MA)将细胞破碎。用0.1%Brii 35制备匀浆,于100,000×g离心1小时,以产生清澈的上清液(粗提取物)。
通过0.8μm Supor滤器(Gelman Sciences,FRG)过滤后,将粗提取物直接上样于Ni2+次氮基三乙酸酯-琼脂糖(NTA)(Hochuli,E.,Dbeli,H.和Schacheer,A.(1987)J.Chromatography 411,177-184),该柱床体积为5毫升,已在含有10%甘油、0.1%Brij 35和1mM PMSF的裂解缓冲液中预平衡。该柱用含10%甘油和0.1%Brij 35的250ml(50倍床体积)裂解缓冲液洗涤,连续用含有10%甘油、0.05%Brij 35、1mM PMSF和20、100、200和500mM咪唑的裂解缓冲液的顺序步骤洗脱。通过于OD280nM的吸光度监测流分,通过SDS-PAGE分析峰流分。含有该重组蛋白的流分于100mM咪唑洗脱。重组蛋白14640637和蛋白β-半乳糖苷酶(lacZ)和肽基-脯氨酰顺反异构酶(ppiB)
合并来自Ni2+-NTA-琼脂糖柱的含有该重组蛋白的流分,然后通过离心过滤(Centriprep-10,Amicon,MA)浓缩为大约5ml,直接上样于180ml Sephacryl S-100 HR凝胶过滤介质柱(1.6×91cm),该柱已于A缓冲液(10mM Hepes,pH 7.5,100mM NaCl,0.1mM EGTA)中平衡,然后在A缓冲液中以18ml/h展开。通过280nm的吸光度鉴定含有该重组蛋白的流分,并通过SDS-PAGE分析。合并流分,并通过离心过滤浓缩。重组蛋白7116626
合并来自Ni2+-NTA-琼脂糖柱的含有该重组蛋白的流分,然后对1升透析缓冲液(10mM MOPS pH 6.5、50mM NaCl、0.1mM EGTA、0.02%Brij 35和1mM PMSF)透析过夜。在早上,通过离心除去细小的白色沉淀,将产生的上清液上样于8ml(8×75mm)MonoS高效液相层析柱(Pharmacia Biotechnology,Inc.,Piscataway,NJ,USA),该柱已于含有50mM NaCl的B缓冲液(10mM MOSF,pH 6.5,0.1mM EGTA)中平衡。该柱用10倍床体积的含50mM NaCl的B缓冲液洗涤,用50mlNaCl增加(50-500mM)的线性梯度展开。重组蛋白7116626作为尖峰于300mM NaCl处洗脱。2.从内含体纯化不溶性蛋白
以下步骤于4℃进行。将细胞沉淀重悬浮于裂解缓冲液中,所述裂解缓冲液含有10%甘油、200μg/ml溶菌酶、5mM EDTA、1mMPMSF和0.1%巯基乙醇。通过细胞破碎器后,制备产生的含有0.2%脱氧胆酸盐的匀浆,搅拌10分钟,然后以20,000×g离心30分钟。沉淀用含有10%甘油、10mM EDTA、1%Triton X-100、1mM PMSF和0.1%巯基乙醇的裂解缓冲液洗涤,然后用含有1M尿素、1mMPMSF和0.1%2-巯基乙醇的裂解缓冲液洗涤数次。产生的白色沉淀主要由内含体组成,不含破碎的细胞和膜物质。重组蛋白26054702、16225006、30100332、4721061
以下步骤于室温下进行。将纯化的内含体溶于20ml 8.0M尿素的裂解缓冲液中,所述裂解缓冲液具有1mM PMSF和1%2-巯基乙醇,于室温温育1小时。离心除去不溶解的物质。将透明的上清液过滤,上样于在8.0M尿素的裂解缓冲液中预平衡的Ni2+-NTA-琼脂糖柱。该柱用250ml(50倍床体积)的含8M尿素、1mM PMSF、0.1%2-巯基乙醇的裂解缓冲液洗涤,并连续用含8M尿素、1mM PMSF、0.1%2-巯基乙醇和20、100、200及500mM咪唑的裂解缓冲液的随后步骤展开。通过OD280nm的吸光度监测流分,并通过SDS-PAGE分析峰流分。含有该重组蛋白的流分于100mM咪唑洗脱。重组蛋白29479681、26380318
将含有内含体的沉淀溶解于含有8.0M尿素、1mM PMSF和0.1%2-巯基乙醇的B缓冲液中,于室温温育1小时。通过以20,000×g离心30分钟除去不溶解的物质,将透明的上清液上样于在6M尿素、1mM PMSF、0.1%2-巯基乙醇的B缓冲液中预平衡的15ml(1.6×7.5cm)SP-Sepharose柱。该柱连续用10倍床体积缓冲液洗涤后,用0-500mM NaCl的线性梯度展开。蛋白样品的透析和浓缩
通过对含0.5%脱氧胆酸盐(DOC)的Tris缓冲液盐水(TBS;10mMTris pH 8.0,150mM NaCl)透析,如下连续降低尿素浓度:6M、4M、3M、2M、1M、0.5M,最后为没有尿素的TBS,从所述蛋白样品中慢慢除去尿素。每个透析步骤于室温至少进行4小时。
透析后,通过用Amicon搅拌槽,加压过滤浓缩样品。用Perkins(1986 Eur.J.Biochem.157,169-180)、Bradford((1976)Anal.Biochem.72,248-254)和Lowry((1951)J.Biol.Chem. 193,第265-275页)的方法,测定蛋白浓度。
采用上述方法纯化的重组蛋白概述于以下表4。
                                          表4
    J99序列鉴定者   Blast鉴定的同源物   同源物的基因符号 用于纯化重组蛋白的细菌细胞部分   纯化方法 在SDS-PAGE凝胶上的相对MW 纯化蛋白的终浓度  缓冲液组成
外膜蛋白
16225006  P28635  YEAC    内含体 His标记   18kDa   5mg/ml   B
26054702  P15929  flgH    内含体 His标记   37kDa   1.18mg/ml   B
  ----  为干沉淀
7116626  P26093  e(P4)  可溶性部分 His标记   29kDa   0.8mg/ml   A
  1.85mg/ml   C
29479681  P13036  fecA    内含体 SP-Sepharose   23kDa   2.36mg/ml   B
 0.5mg/ml   B
    ----  为干沉淀
14640637  P16665   TPF1 可溶性部分 His标记 17kDa  2.4mg/ml   A
  凝胶过滤S100HR
周质/分泌蛋白
  2010032  P23847   dppA   内含体 His标记   11kDa    2.88mg/ml   B
  4721061  P36175   GCP   内含体 His标记   38kDa    2.8mg/ml   B
其它表面蛋白
  4821082  P08089  M蛋白   内含体 His标记  20kDa  1.16mg/ml   B
  978477  L28919  FBP54   内含体 SP-Sepharose  44kDa  2.56mg/ml   B
 0.3mg/ml   B
内膜蛋白
  26380318   P15933  fliG   内含体 SP-Sepharose   11kDa   22mg/ml   B
具有His标记的对照蛋白
P00722   lacZ 可溶性部分 His标记 116kDa  10mg/ml   A
凝胶过滤S200 HR
  ppiB 可溶性部分 His标记 21kDa  4.4mg/ml   A
凝胶过滤S100 HR
缓冲液组成:
A=10mM Hepes pH 7.5,150mM NaCl,0.1mM EGTA
B=10mM Tris pH 8.0,150mM NaCl,0.5%DOC
C=10mM MOPS pH 6.5,300mM NaCl,0.1 EGTA
IV.幽门螺杆菌蛋白作为疫苗候选物的分析
为了分析幽门螺杆菌蛋白以用于本发明的疫苗制剂,将几种幽门螺杆菌蛋白进行表达、免疫学特征鉴定,并在以下概述的动物效力研究中进行测试。具体地说,在模拟人类中人幽门螺杆菌感染的小鼠/幽门螺杆菌模型中研究幽门螺杆菌蛋白免疫调节效应。在这些研究中,测定口服免疫选定幽门螺杆菌多肽在幽门螺杆菌感染小鼠中的效应。重组幽门螺杆菌序列的鉴定、克隆和表达
为了便于克隆、表达和纯化幽门螺杆菌的膜蛋白和/或分泌蛋白,选择用于在大肠杆菌中克隆和表达重组蛋白的pET基因表达系统。此外,对于其氨基末端具有信号序列的蛋白,将编码肽标记(His标记)的DNA序列融合于目的幽门螺杆菌DNA序列5’端,以便于纯化所述重组蛋白产物。PCR扩增和克隆含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白ORF的DNA序列
制备选定用于从幽门螺杆菌J99菌株克隆的序列,用于通过聚合酶链式反应(PCR)扩增克隆。所有选定的序列编码的幽门螺杆菌外膜蛋白与vac9(SEQ ID NO:125)、vac10(SEQ ID NO:147)、vac22(SEQID NO:121)和vac41(SEQ ID NO:176)序列均共享末端苯丙氨酸残基。同样,vac32(SEQ ID NO:108)、vac36(SEQ ID NO:149)和vac37(SEQ ID NO:139)序列均共享一个末端苯丙氨酸残基和C末端的一个酪氨酸簇。设计和购得(BibcoBRL Life Technologies,Gaithersburg,MD,USA)对所述ORF预测成熟5’端和该预测的翻译终止密码子下游(3’)特异的每个目的ORF(表5)的合成寡核苷酸引物。设计所有的正向引物(对目的ORF区5’末端特异的),以包括后接一个NdeI限制性位点的一个BamIII限制性位点。设计这些引物,以允许于该NdeI限制性位点序列内编码的甲硫氨酸残基(在产生非His标记的重组蛋白的情况下)起始蛋白翻译,或允许符合读框地与编码His标记的DNA序列融合(对于产生His标记的重组蛋白),然后接所述天然幽门螺杆菌DNA其余部分的编码序列。设计所有反向寡核苷酸引物(对该ORF的预测翻译终止密码子下游(3’端)特异的),以于5’端包含一个EcoRI限制性位点。这种引物组合使得能够将每个目的ORF克隆入pET28b(以产生His标记的重组蛋白)或pET30a(以产生非His标记的或天然的重组蛋白)中。pET28b载体提供编码另外20个氨基末端氨基酸(加上NdeI限制性位点内的甲硫氨酸)的序列,所述末端氨基酸包括一段构成His标记的6个组氨酸残基。
由幽门螺杆菌菌株J99 (ATCC 55679)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有特定幽门螺杆菌ORF的DNA序列,将基因组DNA(50纳克)加入反应管中,所述反应管含有对目的ORF特异的正向和反向合成寡核苷酸引物各200纳克和45微升购买的PCR SuperMix(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA),总共50微升。PCR SuperMix以1.1X浓度供应,含有22mM Tris-HCl(pH 8.4)、5.5mM KCl、1.65mM MgCl2、dATP、dCTP、dGTP、dTTP各220μM、22单位重组Taq聚合酶/ml以及稳定剂。采用Perkins Elmer Cetus/Gene Amp PCR系统热循环仪,使用以下热循环条件获得每个ORF的扩增DNA产物。
表5:寡核苷酸引物
基因       正向引物        反向引物
vac9(nt SEQ IDNO:28)(aa SEQ IDNO:125) CGCGGATCCATATGGCTGAAAAAACGCCTTTTTTTAAAACTAAAAACCAC(SEQ ID NO:257) CCGGAATTCATCAGTATTCAATGGGAATAAAGCC(SEQ IDNO:258)
vac10(nt SEQ IDNO:50)(aa SEQ IDNO:147) CGCGGATCCATATGAAAGAAGAAGAAAAAGAAGAAAAAAAGACAGAAAGG(SEQ ID NO:259) CCGGAATTCGCTTAAAAGAAAATAGTCCCCCAAACGC(SEQID NO:260)
vac22(nt SEQ IDNO:24)(aa SEQ IDNO:121) CGCCGGATCCATATGAAAGAGGTCATTCCACCCCTTCAACCCC(SEQ ID NO:261) CCGGAATTCATATAAATATCATATAGGCAGAAAAAC(SEQ IDNO:262)
vac32(nt SEQ IDNO:11)(aa SEQ IDNO:108) CGCGGATCCATATGGAGGCAGAGCTTGATGAAAAATC(SEQ IDNO:263) CCGGAATTCGATTGATTTTGTCAAATCTAAAATCCC(SEQ IDNO:264)
vac36(hopB)(nt SEQ IDNO:52)(aa SEQ IDNO:149) TATTATACATATGGAAGAAGATGGG(SEQ ID NO:265) TAATCTCGAGTTTAGAAGGCGTA(SEQ ID NO:266)
vac37(i-hop)(nt SEQ IDNO:42)(aa SEQ IDNO:139) TTATATTCATATGGAAGACGATGGC(SEQ IDNO:267) AATTCTCGAGCCTCTTTATAAGCC(SEQ ID NO:268)
vac41(nt SEQ IDNO:79)(aa SEQ IDNO:176) CGCGGATCCATATGGTAGAAGCCTITCAAAAACACCAAAAAGACGG(SEQ ID NO:269) CCGGAATTCGGAGCCAATAGGGAGCTAAAGCC(SEQ ID NO:270)
Vac32、Vac9和Vac22的序列于94℃变性30秒35个循环:94℃15秒,55℃15秒和72℃1.5分钟反应于72℃8分钟结束Vac10和Vac41的序列于94℃变性30秒35个循环:94℃15秒,55℃15秒和72℃2.5分钟反应于72℃8分钟结束Vac36和Vac37的序列变性2个循环:94℃15秒,30℃15秒和72℃1.5分钟23个循环:94℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束
完成热循环反应时,每种扩增DNA样品在1.O%琼脂糖凝胶上电泳。该DNA通过暴露于溴化乙锭和长波UV辐射显现,并在凝胶胶条中切出。用Wizard PCR Preps试剂盒(Promega Corp.,Madison,WI,USA)纯化DNA,然后用BamHI和EcoRI消化(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后,消化的PCR扩增子再如上电泳和纯化。将幽门螺杆菌DNA序列连接入克隆载体
在Vac9、10、22、31和32的情况下,制备pOK12载体(J.Vieira和J.Messing,Gene 100:189-194,1991),用于用BamHI和EcoRI消化克隆,而在Vac 41的情况下,制备pSU21载体(B.Bartolome等,Gene102:75-78,1991),用于用BamHI和EcoRI消化克隆(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。将所述载体在1.0%琼脂糖凝胶上电泳,并采用Wizard PCR Preps试剂盒(Promega Corp.,Madison,WI,USA)纯化。连接纯化、消化的载体和纯化、消化的扩增幽门螺杆菌ORF后,按照标准方法(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)将连接反应的产物转化入大肠杆菌JM109感受态细胞。通过在LB液体培养基(对于基于pOK12的质粒加上25ug/ml硫酸卡那霉素,或对于基于pSU21的质粒加25ug/ml氯霉素)中过夜培养,筛选含有正确重组质粒的各个细菌菌落,然后用Magic Minipreps系统(Promega Corp.,Madison,WI,USA)制备质粒DNA,然后通过限制性消化进行分析(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。将幽门螺杆菌DNA序列克隆入pET28b和pET30a原核表达载体
制备pET28b和pET30a表达载体,以通过用NdeI和EcoRI消化克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过用NdeI和EcoRI消化,从pOK12(Vac9、10、23、31和32)或pSU21(Vac41)质粒骨架取出幽门螺杆菌DNA序列(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。pET28b、pET30a和幽门螺杆菌DNA序列均在1%琼脂糖凝胶上电泳,并用Wizard PCR Preps试剂盒(Promega Corp.,Madison WI,USA)纯化。连接纯化、消化的表达载体和纯化、消化的幽门螺杆菌DNA序列后,将连接反应的产物转化入大肠杆菌JM109感受态细胞(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过如上所述制备质粒DNA,然后通过限制性消化分布型分析和DNA测序,筛选含有正确重组质粒的各个细菌菌落(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后用这些重组质粒转化特定的大肠杆菌菌株。用重组表达质粒转化感受态细菌
按照标准方法制备感受态细菌菌株(BL21(DE3)、BL21(DE3)pLysS、HMS174(DE3)和HMS174(DE3)pLysS,并用携带克隆幽门螺杆菌序列的重组pET28b表达质粒转化(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。这些表达宿主菌株含有一个染色体拷贝的T7 RNA聚合酶基因。这些宿主为一种λ衍生物噬菌体DE3的溶原体,该噬菌体携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因。通过加入异丙基-β-D硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶表达,然后T7 RNA聚合酶转录携带T7启动子序列和目的基因的任何靶质粒,诸如pET28b。重组幽门螺杆菌序列在大肠杆菌中的表达
从含有25ug/ml硫酸卡那霉素(确保保持基于pET28b的重组质粒)的LB琼脂平板收集转化体,并用来接种含有25ug/ml硫酸卡那霉素的LB液体培养基,并生长至600nm的光密度为0.5-1.0 OD单位,此时,将1mM IPTG加入培养基中1-3小时,以诱导幽门螺杆菌重组DNA构成物的基因表达。用IPTG诱导基因表达后,离心沉淀细菌,将其重悬浮于SDS-PAGE溶解缓冲液后,进行SDS-PAGE(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。采用标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),通过用考马斯亮蓝染色显现蛋白质,或通过用特异性抗His标记的单克隆抗体(Clontech,Palo Alto,CA,USA)进行蛋白质免疫印迹测定蛋白质。然后选择提供最高水平重组蛋白生产的宿主菌株,用于大规模诱导,以便纯化重组蛋白。重组表达所有下列蛋白,以下列出最高水平表达的菌株:BL21(DE3)(vac31,vac26,vac37);BL21(DE3)pLysS(vac 9,32);HMS174(DE3)(vac10,11)。重组蛋白的纯化和特异性抗血清的产生
如上接种大规模培养物,并使其生长,并用1mM IPTG诱导3小时。诱导后,在Sorvall离心机中以3500×g于4℃离心15分钟,沉淀细菌。所有表达的重组蛋白均存在于不溶性内含体部分中。按照标准方案(Antibodies,Cold Spring Harbor Laboratory Press,E.Harlow和D.Lane编辑,1988)纯化内含体。由vac32产生的重组蛋白溶于8M尿素中,通过镍层析(这里为REF)进行部分纯化。变性的重组蛋白通过在SDS-PAGE凝胶上电泳纯化,在用考马斯亮蓝显现后,从凝胶切下该蛋白,匀浆所述胶条。该材料用来按照标准方案(Antibodies,Cold SpringHarbor Laboratory Press,E.Harlow和D.Lane编辑,1988)在小鼠或兔子产生特异性多克隆抗体。重组蛋白的免疫学特征鉴定
在试图产生抗体的所有情况下,产生高效价抗血清,证实重组蛋白的免疫原性。此外,这些特异性抗血清用来分析由该克隆基因编码的蛋白是否在幽门螺杆菌中表达。采用标准方案进行蛋白质免疫印迹分析(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)证实,幽门螺杆菌菌株J99的确表达与vac10、vac32、vac31、vac36抗血清反应的预期分子量的蛋白。该特异性抗血清也用来测定大量幽门螺杆菌分离物之间抗原保守水平,所述幽门螺杆菌分离物得自世界的不同地理位点,并来自所有临床表现类型,包括胃炎、十二指肠溃疡、胃溃疡和胃癌。发现每种菌株产生与每种抗血清特异性反应的蛋白。
此外,将来自菌株J99、17874、AH244和SS1的幽门螺杆菌细胞分级分离为不同的细胞区室(Doig和Trust 1994 Infect.Immun.62:4526-4533:O’Toole等1995 J.Bacteriol.177:6049-6057)。用特异性抗血清通过蛋白质免疫印迹探测这些部分,以鉴定该蛋白定位的部分。在所有情况下,通过本文所述的序列特征和基元检索预测,该免疫反应性蛋白存在于外膜中。证明蛋白作为疫苗的效力纯化vac36用于效力研究
所有以下步骤均于4℃进行。将细胞沉淀重悬浮于每克细胞5倍体积的裂解缓冲液(50mM磷酸钠pH 8.0,0.5M NaCl,5mM咪唑)中,所述裂解缓冲液含10mM EDTA、1mM苯甲基磺酰氟(PMSF)和0.1%β-巯基乙醇,数次通过小体积的微量流化装置(M-110S型,Microfluidics International Corporation,Newton,MA)破碎细胞。将产生的匀浆制为含0.2%脱氧胆酸钠(DOC)的匀浆,搅拌20分钟,然后离心(10,000g×30min)。沉淀用含有10mM EDTA、1%Triton X-100、1mM PMSF和0.1%β-巯基乙醇的裂解缓冲液洗涤2次,然后用含有1M尿素、1mM PMSF和0.1%β-巯基乙醇的裂解缓冲液洗涤。产生的白色沉淀主要由内含体组成,不含破碎的细胞和膜物质。
将内含体溶于20ml 6M盐酸胍的裂解缓冲液中,所述裂解缓冲液具有1mM PMSF和0.1%β-巯基乙醇,于冰上孵育1小时。离心(100,000g×30min)除去不溶解的物质。将透明的上清液通过0.8μmSupor滤器(Gelman Sciences,FRG)过滤,然后直接上样于在6M盐酸胍的裂解缓冲液(含有1mM PMSF和0.1%β-巯基乙醇)中预平衡的10ml Ni2+-NTA-琼脂糖柱(Hochuli等,1987)。该柱用20ml(2倍床体积)的含6M盐酸胍、1mM PMSF、0.1%β-巯基乙醇的裂解缓冲液洗涤,然后用含有0.5%Brij 35、1mM PMSF、0.1%β-巯基乙醇的100ml线性梯度(6M-0M盐酸胍)的裂解缓冲液,慢慢除去盐酸胍。接着,该柱用25ml咪唑增加的线性梯度(5-500mM)的裂解缓冲液展开,所述裂解缓冲液含有0.5%Brij 35、1mM PMSF、0.1%β-巯基乙醇。重组蛋白作为集中于100mM咪唑的一个峰洗脱出。
合并含有所述重组蛋白的流分,然后通过离心过滤(Centriprep-10,Amicon,MA)浓缩为大约8ml,直接上样于350ml Sephacyl S-100 HR凝胶过滤介质柱(2.2×91cm),该柱已于A缓冲液(50mM磷酸钠,pH8.0,500mM NaCl,0.1mM EGTA,1mM PMSF,0.1%β-巯基乙醇,0.5%Brij 35)中平衡,然后在A缓冲液中以30ml/h展开。通过280nm的吸光度鉴定含有该重组蛋白的流分,并通过SDS-PAGE分析。合并流分,浓缩为1.5-2mg/ml,然后对10 mM磷酸钾pH 7.5、150mM NaCl、0.1mM EGTA和0.5%Brij 35透析过夜。定量测定透析物中蛋白的浓度并分装,然后冷冻于-20℃。幽门螺杆菌感染的小鼠模型
通过用幽门螺杆菌Sydey菌株SS1感染C57BL/6小鼠,产生幽门螺杆菌感染小鼠模型,用来评估重组幽门螺杆菌vac36的效力。该适应小鼠(mouse-adapted)幽门螺杆菌菌株为cagA+vacA+,显示在C57BL/6小鼠中的定居水平相当于在人类中观察到的水平,形成附着基架,定居至少8个月,并诱出慢性-活动型胃炎和粘膜萎缩(Lee等,Gastroenterology,112:1386-1397,1997)。剂量反应研究已表明,用单次接种106生物体攻击后8周的近交C57BL/6和Balb/C小鼠,其感染率为100%。胃幽门螺杆菌感染的评估
通过培养胃组织和定量脲酶测定,检测胃组织中幽门螺杆菌生物体的存在。在后一方法中,将占总窦区大约1/4的纵向窦节段置于1ml尿素液体培养基中。4小时后,通过分光光度测量A550,定量测定因尿素水解和pH升高产生的变色程度(Fox等,Ummunol.88:400-406,1996)。测定敏感度为~103幽门螺杆菌生物体。阳性(幽门螺杆菌感染的)胃组织定义为显示高于平均A550值2个标准差的样品,其中平均A550得自一组未受攻击、未感染的、年龄相当的对照小鼠。对胃组织中免疫的局部免疫应答的评估
将来自食管至十二指肠接点的胃组织纵向切片包埋于OCT包埋化合物中,于液氮中冷冻,冷冻切片用识别CD4+或CD8+T细胞的单克隆抗体、或抗小鼠IgA的抗血清免疫染色,以鉴定含IgA(IgACC)的血浆细胞(Pappo等,Infect.Immun.63:1246-1252,1995)。局部胃免疫应答的程度定量表示为CD4+、CD8+或IgACC细胞/mm2所检查的胃区。纯化的重组幽门螺杆菌vac36抗原的保护活性
在小鼠中检查得自幽门螺杆菌的纯化重组vac36抗原干扰幽门螺杆菌感染建立的能力。多组(n=10)6-8周龄雌性C57BL/6小鼠以每周次的间隔如下口服免疫4次:1)100μg重组vac36抗原和10μg霍乱毒素(CT)佐剂,2)1mg幽门螺杆菌裂解液抗原和10μg CT,以及3)0.2M碳酸氢盐缓冲液和10μg CT佐剂。2周后,通过口服108幽门螺杆菌生物体,连续3天攻击小鼠。该实验在攻击后2周终止,通过细菌菌落计数和定量脲酶测定,评估幽门螺杆菌感染水平。
用活幽门螺杆菌生物体攻击时,用vac36抗原口服免疫干扰幽门螺杆菌感染的确立。通过胃脲酶活性和细菌计数测定进行评价,用纯化重组vac36抗原免疫的小鼠,表现出幽门螺杆菌定居水平显著较低(表6)。口服vac36抗原免疫也导致产生局部保护性胃免疫应答。与未免疫的幽门螺杆菌感染小鼠相比,在vac36免疫小鼠的胃组织中募集较大数目的CD4+T细胞和IgACC(表7)。表6重组vac36抗原保护小鼠免受幽门螺杆菌的攻击
    疫苗处理组 脲酶活性a pb      幽门螺杆菌负载     pb
vac36 0.199±0.080 0.0022 55,800±12,599 0.0125
幽门螺杆菌裂解液 0.057±0.007 0.0002 2,360±955 0.0002
缓冲液 1.655±0.420 - 131,000±18,391 -
a  脲酶活性表示为来自n=10只小鼠/组双份窦样品的乎均A550±SEM。b  通过Wilcoxon秩和检定与用单独的CT佐剂免疫的小鼠相比c  胃组织中幽门螺杆菌水平通过细菌计数评价,表示为平均菌落形成单位±SEM表7vac36免疫小鼠用幽门螺杆菌攻击时产生局部胃免疫应答
疫苗处理组             CD4+           CD8+            IgACC
vac36 贲门a 胃体 贲门a  胃体    窦  贲门a   胃体    窦
33±9a 54±8* 31±8 3±2   0   1±1  24±12  79±16  67±13
幽门螺杆菌裂解液 31±13 36±19 24±8 4±2  2±1   2±1  31±9  73±13*  79±15
缓冲液 12±2 27±8 18±4 1±1   0    0  4±2  30±13  46±14
a  胃区平均细胞数/mm2±SEM*  与未免疫的幽门螺杆菌感染小鼠相比时,Wilcoxon秩和检定的p<0.05V.幽门螺杆菌菌株中基因的序列变异分析
从几个幽门螺杆菌菌株克隆并序列分析了4个基因,以比较DNA序列和推定的氨基酸序列。该信息用来确定幽门螺杆菌J99和从人类患者中分离的其它幽门螺杆菌菌株之间的序列变异。染色体DNA的制备
幽门螺杆菌菌株的培养物(列于表10)于BLBB(1%胰蛋白胨、1%Peptamin、0.1%葡萄糖、0.2%酵母提取物、0.5%氯化钠、5%胎牛血清)生长至OD600为0.2。细胞在Sorvall RC-3B中以3500×g于4℃离心15分钟,将细胞沉淀重悬浮于0.95ml 10mM Tris-HCl、0.1mMEDTA(TE)中。加入终浓度为1mg/ml的溶菌酶以及SDS(至1%)和RNA酶A+T1(分别至0.5mg/ml和5单位/ml),于37℃温育1小时。然后加入蛋白酶K至终浓度为0.4mg/ml,将样品于55℃温育1小时以上。将NaCl加入样品中,浓度为0.65M,小心混合,加入0.15ml10%CTAB的0.7M NaCl(最终为1%CTAB/70mM NaCl),然后于65℃温育20分钟。此时,用氯仿:异戊醇抽提样品,然后用苯酚抽提,再用氯仿∶异戊醇抽提。用EtOH(1.5倍体积)或异丙醇(0.6倍体积)于-70℃沉淀DNA 10分钟,在70%EtOH中洗涤,并重悬浮于TE。PCR扩增和克隆
由12个幽门螺杆菌菌株制备的基因组DNA用作PCR扩增反应的DNA模板源(Current Protocols in Molecular Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有幽门螺杆菌ORF的DNA序列,将基因组DNA(10纳克)加入双份反应的反应小瓶中,该反应小瓶含有2mM MgCl2、1μM与限定的幽门螺杆菌ORF互补并邻接的合成寡核苷酸引物(正向和反向引物,参见表8)、每种环磷酸脱氧核苷酸各0.2mM;dATP,dGTP,dCTP,dTTP和0.5单位热稳定DNA聚合酶(Amplitaq,Roche Molecular Systems Inc.,Branchburg,NJ,USA),终体积为20微升。表 8 用于PCR扩增幽门螺杆菌DNA序列的寡核苷酸引物
外膜蛋白  正向引物5’至3’  反向引物5’至3’
蛋白26054702(对于菌株AH4,AH15,AH61,5294,5640,AH18和AH244)  5'-TTAACCATGGTGAAAAGCGATA-3'(SEQ IDNO:217)  5'-TAGAATTCGCCTCTAAAACTTTAG-3'(SEQ IDNO:218)
蛋白26054702(对于菌株AH5,5155,7958,AH24和J99)  5'-TTAACCATGGTGAAAAGCGATA-3'(SEQ IDNO:219)  5'-TAGAATTCGCATAACGATCAATC-3'(SEQ IDNO:220)
蛋白7116626  5'-ATATCCATGGTGAGTTTGATGA-3'(SEQ IDNO:221)  5'-ATGAATTCAATTTTTTATTTTGCCA-3'(SEQ IDNO:222)
蛋白28479681  5'-AATTCCATGGCTATCCAAATCCG-3'(SEQ IDNO:223)  5'-ATGAATTCGCCAAAATCGTAGTATT-3'(SEQ IDNO:224)
蛋白346  5'-GATACCATGGAATTTATGAAAAAG-3'(SEQ IDNO:225)  5'-TGAATTCGAAAAAGTGTAGTTATAC-3'(SEQ IDNO:226)
采用Perkin Elmer Cetus/GeneAmp PCR系统9600热循环仪,使用以下热循环条件获得每种ORF的扩增DNA产物:蛋白7116626和蛋白346:
于94℃变性2分钟,
2个循环:94℃15秒,30℃15秒和72℃1.5分钟
23个循环:94℃15秒,55℃15秒和72℃1.5分钟
反应于72℃6分钟结束。菌株AH55、5155、7958、AH24和J99的蛋白:
于94℃变性2分钟,
2个循环:94℃15秒,30℃15秒和72℃1.5分钟
25个循环:95℃15秒,55℃15秒和72℃1.5分钟反应于72℃6分钟结束。菌株AH4、AH15、AH61、5294、5640、AH18和Hp244的蛋白26054702和蛋白294796813:
于94℃变性2分钟,
2个循环:94℃15秒、30℃20秒和72℃2分钟
23个循环:94℃15秒,55℃20秒和72℃2分钟
反应于72℃8分钟结束。
热循环反应结束时,混合每对样品,如下所述直接用来克隆入pCR克隆载体。将幽门螺杆菌DNA序列克隆入pCR TA克隆载体
采用Original TA克隆试剂盒(Invitrogen,San Diego,CA)中描述的方法,将所有扩增的插入片段克隆入pCR 2.1载体。然后如下所述用连接反应的产物转化大肠杆菌菌株TOP10F’(在幽门螺杆菌序列350的情况下为INVaF’)。用重组质粒转化受态细菌
按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),用携带克隆的幽门螺杆菌序列的重组pCR表达质粒转化感受态细菌大肠杆菌TOP10F’或大肠杆菌菌株INVaF’。简而言之,将2微升0.5μM BEM加入每个50微升感受态细胞的小瓶中。随后,将2微升连接反应物与感受态细胞混合,于冰上孵育30分钟。然后细胞和连接反应物于42℃进行“热休克”30秒,随后再置于冰上2分钟,此后,样品于0.45毫升SOC培养基(0.5%酵母提取物、2.0%胰蛋白胨、10mM NaCl、2.5mM KCl、10mMMgCl2、10mM MgSO4和20mM葡萄糖)中于37℃振荡培养1小时。然后将样品涂布于含25微克/ml硫酸卡那霉素或100微克/ml氨苄青霉素的LB琼脂平板上生长过夜。然后挑出并分析转化的TOP10F’或INVaF’菌落,以如下评价克隆的插入片段。携带幽门螺杆菌序列的重组PCR质粒的鉴定
采用原始PCR扩增克隆反应、对每种幽门螺杆菌序列特异的正向和反向引物,通过PCR扩增克隆的插入片段,分析用重组pCR-幽门螺杆菌ORF转化的各个TOP10F’或INVaF’克隆。成功的扩增证实,所述幽门螺杆菌序列加入该克隆载体(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)中。
挑出携带正确克隆的幽门螺杆菌ORF的重组pCR载体的各个克隆,用于序列分析。采用标准方案(Perkin Elmer),用载体特异性引物(如在PCRII或pCR2.1中发现的,Invitrogen,San Diego,CA)和对以下表9所列ORF特异的测序引物,在ABI测序仪上进行序列分析。表9 用于序列分析幽门螺杆菌DNA序列的寡核苷酸引物
外膜蛋白 正向引物5’至3’ 反向引物5’至3’
蛋白26054702 5'CCCTTCATTTTAGAAATCG-3'(SEQ ID NO:227)5'ATTTCAACCAATTCAATGCG-3'(SEQ ID NO:228)5'GCCCCTTTTGATTTGAAGCT-3'(SEQ ID NO:229)5′TCCGCTCCAAGATACCAAGAAGT-3'(SEQ ID NO:230)5'CTTGAATTAGGGGCAAAGATCG-3'(SEQ ID NO:231)5'ATGCGTTTTTACCCAAAGAAGT-3'(SEQ ID NO:232)5'ATAACGCCACTTCCTTATTGGT-3'(SEQ ID NO:233) 5'CTTTGGGTAAAAACGCATC-3'(SEQ ID NO:234)5'CGATCTTGATCCTAATTCA-3'(SEQ ID NO:235)5'ATCAAGTTGCCTATGCTGA-3'(SEQ ID NO:236)
蛋白7116626 5'TTGAACACTTTTGATTATGCGG-3'(SEQ ID NO:237)5'GGATTATGCGATTGTTTTACAAG-3'(SEQ ID NO:238) 5'GTCTTTAGCAAAAATGGCGTC-3'(SEQ ID NO:239)5'AATGAGCGTAAGAGAGCCTTC-3'(SEQ ID NO:240)
蛋白29479681 5'CTTATGGGGGTATTGTCA-3'(SEQ ID NO:241)5'AGCATGTGGGTATCCAGC-3'(SEQ ID NO:242) 5'AGGTTGTTGCCTAAAGACT-3'(SEQ ID NO:243)5'-CTGCCTCCACCTTTGATC-3'(SEQ ID NO:244)
蛋白346 5'ACCAATATCAATTGGCACT-3'(SEQ ID NO:245)5'ACTTGGAAAAGCTCTGCA-3'(SEQ ID NO:246) 5'CTTGCTTGTCATATCTAGC-3'(SEQ ID NO:247)5'-GTTGAAGTGTTGGTGCTA-3'(SEQ ID NO:248)
5'CAAGCAAGTGGTTTGGTTTTAG-3'(SEQ ID NO:249)5'TGGAAAGAGCAAATCATTGAAG-3'(SEQ ID NO:250) 5'GCCCATMTCAAAAAGCCCAT-3'(SEQ ID NO:25 1)5'CTAAAACCAAACCACTTGCTTGTC-3'(SEQ ID NO:252)
载体引物 5'-GTAAAACGACGGCCAG-3'(SEQ ID NO:253) 5'-CAGGAAACAGCTATGAC-3'(SEQ ID NO:254)
结果
为了确立这些实验中的PCR错误率,对由幽门螺杆菌菌株J99的5个独立的PCR反应混合物制备的5个独立的蛋白26054702克隆,在该DNA序列累积总共为4485个碱基、总长度为897个核苷酸的长度内测序。将5个克隆的DNA序列与先前通过不同方法(即随机鸟枪法克隆和测序)获得的DNA序列进行比较。本文所述实验的PCR错误率测定为4485个碱基中2个碱基改变,这相当于估计的不高于0.04%的错误率。
在鉴定为基因并通过PCR方法由12个不同的幽门螺杆菌菌株扩增4个不同可读框上,进行DNA测序分析。选择用于该项研究的4个可读框中的3个,其推定的氨基酸序列与其它细菌菌种中存在的特定蛋白显示统计学上显著的BLAST同源性。那些ORF包括:蛋白26054702,同源于编码F.nonicida中ABC转运蛋白的val A和B基因;蛋白7116626,同源于流感嗜血杆菌(H.influenzae)外膜中存在的脂蛋白e(P4);蛋白29479681,同源于fecA-一种大肠杆菌二柠檬酸铁(III)转运中的外膜受体。蛋白346鉴定为未知的可读框,因为它与公用数据库中的序列显示低同源性。
为了评价不同幽门螺杆菌菌株的ORF中的保守或变异程度,将DNA序列和推导的蛋白序列中的改变与幽门螺杆菌J99菌株中发现的DNA序列和推导的蛋白序列比较(参见以下表10)。结果以通过随机鸟枪法克隆测序的同幽门螺杆菌J99菌株的同一性百分比表示。为了控制J99序列中的任何变异,再从J99细菌菌株将4个可读框信息中的每个进行克隆并测序,将该序列信息与已经通过对J99菌株随机鸟枪法测序克隆的插入片段收集的序列信息进行比较。该数据证明,该DNA序列中有小至0.12%差异(蛋白346,J99菌株)至大约7%改变(蛋白26054702,菌株AH5)的变异。推导的蛋白序列或者未显示变异(蛋白346,菌株AH18和AH24),或显示最高达7.66%氨基酸改变(蛋白26054702,菌株AH5)。表10幽门螺杆菌疫苗候选者的多菌株DNA序列分析J99蛋白编号:26054702  26054702  7116626 7116626   29479681 29477968   346      346
                                                            1区域长度测序的:      248 a.a.   746 nt.  232 a.a. 96nt.    182 a.a. 548 nt.  273 a.a.  819 nt.测试的 菌株
          氨基酸     核苷酸   氨基酸   核苷酸   氨基酸   核苷酸   氨基酸    核苷酸
          同一性     同一性   同一性   同一性   同一性   同一性   同一性    同一性J99           100.0%    100.00% 100.00% 100.00% 100.00% 100.00% 99.63%   99.88%AH244         95.16%    95.04%  n.d.     n.d.     99.09%  96.71%  98.90%   96.45%AH4           95.97%    95.98%  97.84%  95.83%  n.d.     n.d.     97.80%   95.73%AH5           92.34%    93.03%  98.28%  96.12%  98.91%  96.90%  98.53%   95.73%AH15          95.16%    94.91%  97.41%  95.98%  99.82%  97.99%  99.63%   96.09%AH61          n.d.       n.d.     97.84%  95.98%  99.27%  97.44%  n.d.      n.d.5155          n.d.       n.d.     n.d      n.d.     99.45%  97.08%  98.53%   95.60%5294          94.35%    94.37%  98.28%  95.40%  99.64%  97.26%  97.07%   95.48%7958          94.35%    94.10%  97.84%  95.40%  n.d.     n.d.     99.63%   96.46%5640          95.16%    94.37%  97.41%  95.69%  99.09%  97.63%  98.53%   95.48%AH18          n.d.       n.d.     98.71%  95.69%  99.64%  97.44%  100.00%  95.97%AH24          94.75%    95.04%  97.84%  95.40%  99.27%  96.71%  100.00%  96.46%n.d.=未进行VI.测定作为潜在治疗靶的幽门螺杆菌必需基因的实验型失效方案
从其蛋白产物似乎在诸如胞外被膜合成、DNA合成、转录、翻译、调节和定居/毒性的必需细胞途径中起关键作用的基因,选择治疗靶。
缺失幽门螺杆菌基因/ORF部分和插入诱变卡那霉素抗性盒,以便鉴定细胞必需基因,其方案由先前发表的方法(Labigne-Roussel等,1988,J.Bacteriology 170,第1704-1708页;Cover等,1994,J.BiologicalChemistry 269,第10566-10573页;Reyrat等,1995,Proc.Natl.Acad.Sci.92,第8768-8772页)进行修改。结果是基因“失效”。幽门螺杆菌基因序列的鉴定和克隆
从幽门螺杆菌基因组序列中鉴定选择作为失效靶的基因或ORF(可读框)的序列,并用来设计引物以特异性地扩增所述基因/ORF。在OLIGO程序(National Biosciences,Inc.,Plymouth,MN 55447,USA)的帮助下设计所有合成寡核苷酸引物,也可以购自Gibco/BRL LifeTechnologies(Gaithersburg,MD,USA)。如果该ORF小于800-1000个碱基对,则选择该可读框外的侧翼引物。
由幽门螺杆菌HpJ99菌株(ATCC  55679;由Geneome TherapeuticsCorporation,100 Beaver Street,Waltham,MA 02154保藏)制备的基因组DNA,用作通过PCR(聚合酶链式反应)(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)扩增所述ORF的模板DNA源。对于从幽门螺杆菌制备基因组DNA,参见实施例I。通过将10纳克基因组HpJ99 DNA加入反应小瓶中进行PCR扩增,其中所述反应小瓶含有10mM Tris pH 8.3、50mM KCl、2mMMgCl2、2μM合成寡核苷酸引物(正向=F1,而反向=R1)、0.2mM每种三磷酸脱氧核苷酸(dATP,dGTP,dCTP,dTTP)和1.25单位热稳定DNA聚合酶(Amplitaq,Roche Molecular Systems,Inc.,Branchburg,NJ,USA),终体积为40微升。用Perkins Elmer Cetus/GeneAmp PCR系统9600热循环仪进行PCR。
在热循反应结束时,每个扩增DNA的样品在2%TAE琼脂糖凝胶上用溴乙锭染色呈现(Current Protocols in Molecular Biology,JohnWiley和Sons,Inc.,F.Ausubel等编辑,1994),以确定由该反应产生的预期大小的单个产物。然后洗涤扩增的DNA,并用Qiaquick Spin PCR纯化试剂盒(Qiagen,Gaithersburg,MD,USA)纯化。
采用TA克隆策略(Current Protocols in Molecular Biology,JohnWiley and Sons,Inc.,F.Ausubel等编辑,1994),将PCR产物克隆入pT7Blue T载体(分类号为69820-1,Novagen,Inc.,Madison,WI,USA)。通过将过量6倍摩尔浓度的所述PCR产物、10ng pT7Blue-T载体(Novagen)、1微升T4 DNA连接酶缓冲液(New England Biolabs,Beverly,MA,USA)和200单位的T4 DNA连接酶(New England Biolabs)混合为10微升的终反应体积,完成将所述PCR产物连接入该载体中。让连接反应于16℃进行16小时。
将连接产物电穿孔入电穿孔感受态XL-1 Blue或DH5-a大肠杆菌细胞(Clontech Lab.,Inc.Palo Alto,CA,USA)中(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。简而言之,将1微升连接反应物与40微升电感受态细胞混合,经过高压脉冲(25微法拉,2.5kV,200ohms),此后,样品于0.45ml SOC培养基(0.5%酵母提取物、2%胰蛋白胨、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)、37℃振荡培养1小时。然后将样品涂布在含有100微克/ml氨苄青霉素、0.3%X-gal和100微克/ml IPTG的LB(10g/l细菌培养用胰蛋白胨、5g/l细菌培养用酵母提取物、10g/l氯化钠)平板上。这些平板于37℃培养过夜。选择白色的氨苄青霉素抗性菌落,使其生长于含有100微克/ml氨苄青霉素的5ml液体LB中,用Qiagen小量制备方案(Qiagen,Gaithsburg,MD,USA)分离质粒DNA。
为了证实已经克隆了正确的幽门螺杆菌DNA插入片段,使用用于J99幽门螺杆菌序列最初扩增的相同正向和反向引物,将这些pT7Blue质粒DNA用作PCR扩增所述克隆的插入片段的模板。识别2%TAE(溴化乙锭染色的琼脂糖凝胶)上显现的引物和正确大小的PCR产物,证实已经克隆了正确的插入片段。每个失效靶获得2-6个这种证实的克隆,将其于-70℃冷冻贮存。为了最大限度地减小由PCR产生的错误,合并分子这些证实的克隆的质粒DNA,用于随后的克隆步骤。
再用所述基因/ORF序列设计第二对引物,所述引物邻接所述ORF内或者待破坏或者待缺失的幽门螺杆菌DNA区(多至250个碱基对),但方向相反。先前分离克隆的环状质粒DNA库用作该轮PCR的模板。由于该对缺失引物扩增方向相反,因此引物之间ORF部分不包括在产生的PCR产物中。该PCR产物为每端具有幽门螺杆菌DNA的线性DNA片段和它们之间的pT7Blue载体骨架,这本质上导致所述ORF一部分的缺失。在1%TAE(溴化乙锭染色的琼脂糖凝胶)上显现该PCR产物,以证实仅扩增了正确大小的单一产物。
通过先前所用的TA克隆方法(Current Protocols in MolecularBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994),将卡那霉素抗性盒(labigne-Roussel等,1988,J.Bacteriology,170,1704-1708)连接于该PCR产物。通过用EcoRI消化重组质粒pCTB8:kan(Cover等,1994,J.Biological Chemistry 269,第10566-10573页),获得含Campylobacter卡那霉素抗性基因的卡那霉素盒。在1%TAE凝胶上分离合适的片段(1.4kb),用QIAquick凝胶提取试剂盒(Qiagen,Gaithersburg,MD,USA)分离。采用Klenow填平方案进行该片段的末端修复,这涉及将4ug该DNA片段、1微升0.5mM dATP、dGTP、dCTP、dTTP、2微升Klenow缓冲液(New England Biolabs)和5单位Klenow DNA聚合酶I大(Klenow)片段(New England Biolabs)混合为20微升反应物,于30℃温育15分钟,通过加热至75℃10分钟失活该酶。然后通过Qiaquick柱(Qiagen,Gaithersburg,MD,USA)纯化该平端化的卡那霉素盒,以去除核苷酸。然后,通过在100微升反应物中混合5微克平端卡那霉素盒、10mM Tris pH 8.3、50mM KCl、2mM MgCl2、5单位DNA聚合酶(Amplitaq,Roche Molecular Systems,Inc.,Branchburg,NJ,USA)、20微升5mM dTTP,于37℃温育反应物2小时。采用QIAquick柱(Qiagen,Gaithersburg,MD,USA)纯化“Kan-T”盒。通过在10微升反应物中混合10-25ng缺失引物PCR产物、50-75ng Kan-T盒DNA、1微升10x T4 DNA连接酶反应混合物、0.5微升T4 DNA连接酶(NewEngland Biolabs,Beverly,MA,USA),将所述缺失引物(F2和R2)的PCR产物连接于Kan-T盒,于16℃温育16小时。
通过如前述的电穿孔,将连接产物转化入XL-1 Blue或DH5-a大肠杆菌。在SOC中回收后,将细胞平板接种于含100微克/ml氨苄青霉素的平板,于37℃生长过夜。然后,将这些平板复制平板接种于含有25微克/ml卡那霉素的平板上,让其生长过夜。产生的菌落具有pT7Blue载体中存在的氨苄青霉素抗性基因,也具有新引入的卡那霉素抗性基因。将菌落挑到含有25微克/ml卡那霉素的LB中,采用Qiagen小量制备方案(Qiagen,Gaithersburg,MD,USA)从培养的细胞分离质粒DNA。
通过PCR扩增的几个实验在这些质粒上进行,以证实卡那霉素插入幽门螺杆菌基因/ORF中,以测定卡那霉素抗性基因相对于幽门螺杆菌基因/ORF插入的方向。为证实将卡那霉素盒插入幽门螺杆菌序列,用所述质粒DNA作为使用原始用来克隆幽门螺杆菌基因/ORF的该组引物的PCR扩增的模板。正确的PCR产物为缺失的基因/ORF的大小,但是通过加入1.4kb卡那霉素盒使其大小增大。为了避免卡那霉素抗性盒对幽门螺杆菌基因表达的潜在极性影响,测定卡那霉素抗性基因相对于失效基因/ORF的方向,两个方向最终均用于幽门螺杆菌转化中(参见下文)。为了确定卡那霉素抗性基因插入的方向,由卡那霉素基因的末端设计引物(“Kan-1”5’-ATCTTACCTATCACCTCAAAT-3’(SEQ ID NO:255))和“Kan-2”5’AGACAGCAACATCTTTGTGAA-3’(SEQ ID NO:256))。通过使用每种克隆引物结合每种Kan引物(4个引物组合),确定卡那霉素盒相对于幽门螺杆菌序列的方向。将阳性克隆分类为“A”方向(幽门螺杆菌基因和卡那霉素抗性基因存在相同的转录方向)或“B”方向(幽门螺杆菌基因的转录方向与卡那霉素抗性基因的方向相反)。合并相同方向(A或B)的克隆,用于随后的实验并独立转化入幽门螺杆菌。将质粒DNA转化入幽门螺杆菌细胞
用2个幽门螺杆菌菌株进行转化:ATCC  55679,提供获得幽门螺杆菌序列数据库的DNA的临床分离物;和AH244,已经传代并具有定居小鼠胃能力的分离物。用于转化的细胞于37℃、10%CO2、100%湿度生长于或者羊血琼脂平板或生长于Brucella肉汤液体中。细胞生长至对数期,进行显微镜检查,以确定细胞是“健康”(活跃运动的细胞)的,不是污染的。如果生长于乎板上,通过用无菌接种环从该平板上刮下细胞,收获细胞,悬浮于1ml Brucella肉汤中,离心下来(1分钟,在eppendorf微量离心机中的最高速),并重悬浮于200微升Brucella肉汤中。如果生长于Brucella肉汤液体中,离心细胞(在Beckman TJ6离心机中,3000rpm 15分钟),将细胞沉淀重悬浮于200微升Brucella肉汤中。取等份细胞测定600nm的光密度,以便计算细胞浓度。将1等份(1-5 OD600单位/25微升)重悬浮细胞平板接种于预温热的羊血琼脂平板上,将该平板再于37℃、6%CO2、100%湿度温育4小时。该温育后,将10微升质粒DNA(100微克/微升)点到这些细胞上。平行进行阳性对照(具有由卡那霉素抗性基因中断的核糖核酸酶H基因的质粒DNA)和阴性对照(无质粒DNA)。将平板返回37℃、6%CO2再温育4小时。然后,用于Brucella肉汤中湿润的药签将细胞涂布到该平板,于37℃、6%CO2生长20小时。然后,将细胞转移至含25微克/ml卡那霉素的羊血琼脂平板,让其于37℃、6%CO2、100%湿度生长3-5天。如果出现菌落,挑出这些菌落,作为含有25微克/ml卡那霉素的新鲜羊血琼脂平板上的斑片再生长。
进行3组PCR实验,以证实已经由合适的染色体位置上的同源重组产生转化体菌落。如下通过快速煮沸DNA制剂方法,获得PCR模板(来自菌落的DNA)。将1等份菌落(用牙签刺该菌落)引入100微升的1%Triton X-100、20mM Tris,pH 8.5,并煮沸6分钟。加入等体积苯酚∶氯仿(1∶1),并涡旋混合。将该混合物微量离心5分钟,将上清液用作使用以下引物组合的PCR的模板,以证实于合适染色体位置的同源重组。
实验1.用最初用来扩增该基因/ORF的克隆引物的PCR。于正确染色体位置的同源重组的阳性结果应该显示单一的PCR产物,预期该产物大小为该缺失基因/ORF的大小,但加上1.4kb卡那霉素盒使其大小增大。恰好该基因/ORF大小的PCR产物证明该基因尚未失效,并且转化体不是正确染色体位置上的同源重组的结果。
实验2.根据所用的质粒DNA是“A”方向还是“B”方向,用F3(由该基因/ORF上游序列设计的、但不存在于该质粒上的引物)和或者引物Kan-1或者Kan-2(由卡那霉素抗性基因末端设计的引物)进行的PCR。于正确染色体位置上的同源重组将产生预期大小的单一PCR产物(即从F3的位置至卡那霉素抗性基因的插入位点)。没有不正确大小的一种或多种PCR产物将证明,该质粒尚未整合于正确的位点,并且该基因尚未失效。
实验3.根据所用的质粒DNA是“A”方向还是“B”方向,用R3(由该基因/ORF下游序列设计的、但不存在于该质粒上的引物)和或者引物Kan-1或者Kan-2进行的PCR。于正确染色体位置上的同源重组将产生预期大小的单一PCR产物(即从卡那霉素抗性基因的插入位点至R3的下游位置)。此外,没有不正确大小的一种或多种PCR产物会证明,该质粒尚未整合于正确的位点,并且该基因尚未失效。
所有以上三个实验均显示阳性结果的转化体表明,该基因对于体外生存不是必需的。
对于每个转化体,在任何一个上述三个实验中的阴性结果,表明该基因尚未破坏,并且该基因对于体外生存是必需的。
在由两个独立转化未产生菌落的事件中,尽管核糖核酸酶H质粒DNA破坏的阳性对照产生转化体,但在铺平板用于菌落形成之前,对来自转化体群体的DNA通过PCR进一步分析该质粒DNA。这将证实,该质粒可能进入所述细胞,并于正确位点经历同源重组。简而言之,按照上述转化方案温育质粒DNA。在与质粒DNA温育后,立即从幽门螺杆菌细胞提取DNA,将该DNA用作以上实验2和实验3的模板。实验2和实验3中的阳性结果将证明,该质粒DNA可能进入所述细胞,并于正确的染色体位置经历同源重组。如果实验2和实验3为阳性,则不能获得有生命力的转化体表明,该基因是必需的,该基因破坏的细胞不能形成菌落。VII.高通量的药物筛选测定克隆、表达和蛋白纯化
待用于高通量药物筛选测定的幽门螺杆菌靶基因及其蛋白产物(例如幽门螺杆菌酶)的克隆、转化、表达和纯化,基本上按照以上实施例II和实施例III中所述进行。以下作为一个具体实施例描述特定幽门螺杆菌基因产物肽基-脯氨酰顺反异构酶的筛选测定的开发和应用。酶测定
基本上按Fisher(Fisher,G.等(1984)Biomed.Biochim.Acta43:1101-1111)所述进行该测定。该测定测量测试肽N-琥珀酰-Ala-Ala-Pro-Phe-对硝基酰基苯胺(nitroailide)(Sigma # S-7388,批号84H5805)中Ala-Pro键的顺反异构。该测定与α-胰凝乳蛋白酶偶联,其中该蛋白酶切割该测试肽的能力仅在所述Ala-Pro键为反式时发生。在BeckmanDU-650型分光光度计上于390nm跟踪该测定中该测试肽向反式异构体的转化。以0.5秒的平均扫描时间,每秒收集数据。在终体积为400ul的35mM Hepes,pH 8.0与10μM α-胰凝乳蛋白酶(来自牛胰的1-5型,Sigma # C-7762,批号23H7020)和10nM PPI酶中进行该测定。为了起始反应,于室温将10μl底物(2 mM N-琥珀酰-Ala-Ala-Pro-Phe-对硝基酰基苯胺的DMSO)加入390μl反应混合物中。粗细菌提取物中的酶测定
于对数中期(OD600nm~1)收获Brucella肉汤中的50ml幽门螺杆菌(菌株J99)培养物,将其重悬浮于具有以下蛋白酶抑制剂的裂解缓冲液中:1mM PMSF以及抑酶肽、亮抑酶肽、胃酶抑制剂、TLCK、TPCK和大豆胰蛋白酶抑制剂各10μg/ml。将该悬浮液进行3个循环的冻融(于-70℃15分钟,然后于室温30分钟),然后进行超声处理(3个20秒的脉冲串)。将裂解液离心(12,000g×30分钟),如上分析上清液的酶活性。
在大肠杆菌中许多幽门螺杆菌酶可以以高水平的活性形式表达。这种纯化蛋白的高产量供设计各种高通量药物筛选测定之用。VIII.截短的基因表达和蛋白生产重组幽门螺杆菌序列的鉴定、克隆和表达
为了便于克隆、表达和纯化幽门螺杆菌的膜蛋白,选择用于在大肠杆菌中克隆和表达重组蛋白的pET基因表达系统(Novagen)。此外,对于其氨基末端具有信号序列的蛋白,将编码肽标记(His标记)的DNA序列融合于目的幽门螺杆菌DNA序列5’端,以便于纯化所述重组蛋白产物。在某些情况下,将该DNA序列符合读框地与谷胱苷肽-S-转移酶蛋白一起克隆,以产生GST融合蛋白。用于这种情况的载体为Pharmacia LKB(Uppsala,瑞典)的pGEX系列。PCR扩增和克隆含有幽门螺杆菌J99菌株膜蛋白和分泌蛋白ORF的DNA序列
制备选定(选自本发明的DNA序列表)用于从幽门螺杆菌菌株J99克隆的序列,用于通过聚合酶链式反应(PCR)扩增克隆。设计和购得(GibcoBRL Life Technologies,Gaithersburg,MD,USA)用于目的ORF(表1)、对该ORF预测成熟5’端、以及或者该预测的翻译终止密码子下游(3’)或者该编码区内特定点特异的合成寡核苷酸引物。设计所有的正向引物(对目的ORF区5’末端特异的),以包括或者一个BamHI或者一个NdeI限制性位点。设计NdeI限制性位点序列内的这些引物,以允许于甲硫氨酸残基(在产生非His标记的重组蛋白的情况下,在NdeI限制性位点内编码的)起始蛋白翻译,或以符合读框地与编码His标记的DNA序列融合(对于产生His标记的重组蛋白),然后接所述天然幽门螺杆菌DNA其余部分的编码序列。产生具有该BamHI限制性位点的引物,以符合读框地与pGEX载体(Pharmacia LKB,Uppsala,瑞典)中的谷胱苷肽-S-转移酶基因的C末端融合。设计所有反向引物,以于5’端包含一个EcoRI限制性位点。选择几种能引起该多肽截短的反向寡核苷酸引物,以除去C末端的某些部分,在这些情况下,5’末端的EcoRI限制性位点后接一个翻译终止密码子。这类引物组合使得能够将目的ORF(或目的ORF的部分)克隆入pET28b(以产生His标记的重组蛋白)、pET30a(以产生非His标记的或天然的重组蛋白)或pGEX-4T或pGEX-5X系列(以产生GST融合蛋白)中。pET28b载体提供编码另外20个氨基末端氨基酸(加上NdeI限制性位点内的甲硫氨酸)的序列,所述氨基末端氨基酸包括一段构成His标记的6个组氨酸残基,而pGEX载体将幽门螺杆菌蛋白融合于26,000Da的谷胱苷肽-S-转移酶蛋白。
由幽门螺杆菌菌株J99(ATCC 55679)制备的基因组DNA用作PCR扩增反应的模板DNA源(Current Protocols in Moleculare Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。为了扩增含有特定幽门螺杆菌ORF的DNA序列,将基因组DNA(50纳克)加入反应管中,所述反应管含有对目的ORF特异的正向和反向合成寡核苷酸引物各200纳克和45微升购买的PCR SuperMix(GibcoBRL LifeTechnologies,Gaithersburg,MD,USA),总共50微升。PCR SuperMix以1.1X浓度供应,含有22mM Tris-HCl(pH 8.4)、55mM KCl、1.65mM MgCl2、dATP、dCTP、dGTP、dTTP各220μM、22单位重组Taq聚合酶/ml以及稳定剂。采用Perkins Elmer Cetus/GeneAmp PCR系统热循环仪,使用以下热循环条件获得每个ORF的扩增DNA产物。表11:寡核苷酸引物
基因和位置 序列
Vac38-BamHI后信号序列 CGGGATCCGAAGGTGATGGTGTTTATATAGG(SEQ ID NO:271)
Vac38-NdeI后信号序列 CGCATATGGAAGGTGATGGTGTTTATATAGGG(SEQ ID NO:272)
Vac38-EcoRI/终止密码子(除去C末端三分之一的蛋白) GCGAATTCTCACTCTTTCCAATAGTTTGCTGCAGAGC(SEQ ID NO:273)
Vac38-EcoRI/终止密码子(除去C末端11个氨基酸) CCGGAATTCTTAATCCCGTTTCAAATGGTAATAAAGG(SEQ ID NO:274)
天然终止密码子下游的Vac3 8-EcoRI GCGAATTCCCTTTTATTTAAAAAGTGTAGTTATACC(SEQ ID NO:275)
Vac38的序列(全长或截短的)
于94℃变性30秒
35个循环:94℃15秒,55℃15秒和72℃1.5分钟
反应于72℃8分钟结束
热循环反应结束时,在1.0%琼脂糖凝胶上电泳每种扩增DNA样品。通过暴露于溴化乙锭和长波UV辐射,显现该DNA,并以胶条切出。用Wizard PCR Prep试剂盒(Promega Corp.,Madison WI,USA)纯化DNA,然后经过BamHI和EcoRI消化(Current Protocols in MoleculareBiology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。然后重电泳消化的PCR扩增子并如前纯化。将幽门螺杆菌DNA序列连接入克隆载体
制备pOK12载体(J.Vieira和J.Messing,Gene 100:189-194,1991),用于用BamHI和EcoRI或在Vac41的情况下用NdeI和EcoRI消化的克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。该载体在1.0%琼脂糖凝胶上电泳并采用Wizard PCK Prep试剂盒(Promega Corp.,Madison WI,USA)进行纯化。将纯化的消化载体和纯化、消化的扩增幽门螺杆菌ORF连接后,按照标准方法(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)将连接反应物转化入大肠杆菌JM109感受态细胞。通过在LB肉汤中培养过夜(加上25ug/ml硫酸卡那霉素),然后用Magic小量制备系统(Promega Corp.,Madison WI,USA)制备质粒DNA,筛选含有正确重组质粒的各个细菌菌落,然后通过限制性消化分析(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。将幽门螺杆菌DNA序列克隆入pET28b、pET30a和pGEX4T-3原核表达载体
制备pET28b和pET30a表达载体,用于通过以NdeI和EcoRI消化进行克隆,以及制备pGEX4T-3载体,用于以BamHI和EcoRI消化进行克隆(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。通过用NdeI和EcoRI消化或BamHI和EcoRI消化,从pOK12质粒骨架取出幽门螺杆菌DNA序列(CurrentProtocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。在1%琼脂糖凝胶上电泳pET28b、pET30a、pGEX4T-3和幽门螺杆菌DNA序列,并用Wizard PCR Prep试剂盒(PromegaCorp.,Madison WI,USA)纯化。将纯化的消化表达载体和纯化、消化的幽门螺杆菌DNA序列连接后,将连接反应物转化入大肠杆菌JM109感受态细胞(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。通过如上所述制备质粒DNA,随后通过限制性消化分布型分析和DNA测序,筛选含有正确重组质粒的各个细菌菌落(Current Protocols in Moleculare Biology,John Wiley andSons,Inc.,F.Ausubel等编辑,1994)。然后用这些重组质粒转化特定的大肠杆菌表达菌株。用重组表达质粒转化受态细菌
按照标准方法,制备感受态细菌菌株BL21(DE3)、BL21(DE3)pLysS、HMS174(DE3)和HMS173(DE3)pLysS,并用携带克隆的幽门螺杆菌序列的重组pET28b表达质粒转化(Current Protocolsin Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。这些表达宿主菌株含有一个染色体拷贝的T7 RNA聚合酶基因。这些宿主为一种λ衍生物噬菌体DE3的溶原体,该噬菌体携带lacI基因、lacUV5启动子和T7 RNA聚合酶基因。通过加入异丙基-β-D-硫代半乳糖苷(IPTG)诱导T7 RNA聚合酶表达,然后T7 RNA聚合酶转录携带T7启动子序列和目的基因的任何靶质粒,诸如pET28b。
按照标准方法(Current Protocols in Molecular Biology,John Wileyand Sons,Inc.,F.Ausubel等编辑,1994),制备感受态细菌菌株JM109和DH5α,并用携带克隆的幽门螺杆菌序列的重组pGEX4T-3表达质粒转化。重组幽门螺杆菌序列在大肠杆菌中的表达
从含有25ug/ml硫酸卡那霉素(确保保持基于pET28b的重组质粒)或100ug/ml氨苄青霉素(确保保持基于pGEX4T-3的重组质粒)的LB琼脂平板收集转化体,并用来接种含有25ug/ml硫酸卡那霉素或100ug/ml氨苄青霉素的LB液体培养基,并生长至600nm的光密度为0.5-1.0 OD单位,此时,将1mM IPTG加入培养基中1-3小时,以诱导所述幽门螺杆菌重组DNA构成物的基因表达。用IPTG诱导基因表达后,离心沉淀细菌,将其重悬浮于SDS-PAGE溶解缓冲液后,进行SDS-PAGE(Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994)。采用标准方法(Current Protocols inMolecular Biology,John Wiley and Sons,Inc.,F.Ausubel等编辑,1994),通过用考马斯亮蓝染色显现蛋白质,或通过用特异性抗His标记的单克隆抗体(Clontech,Palo Alto,CA,USA或)抗GST标记抗体(PharmaciaLKB)进行蛋白质免疫印迹检测蛋白质。然后选择提供最高水平重组蛋白生产的宿主菌株,用于大规模诱导,以便纯化该重组蛋白。所用的菌株为HMS174(DE3)(基于pET29b的构成物)和DH5α(基于pGEX4T-3的构成物)。
除去C末端区似乎在两个系统中均提高表达水平,尽管这种增加在GST融合系统中显著得多。产生的所有重组蛋白均具有根据DNA序列(如果需要)加上所述融合标记的大小预测的分子量。该幽门螺杆菌蛋白的截短部分含有某些疏水性极强的序列,除去这些序列可能是表达增加的原因。相当的实施方案
本领域技术人员会认识到,或能够确定,仅仅使用常规实验,许多实施方案相当于本文所述的具体实施方案和方法。这类相当的实施方案将包括在以下权利要求书的范围内。
                     序列表1)一般信息:
(i)申请人:
    (A)姓名:Astra Aktiebolag
    (B)街道:S-151 85
    (C)城市:Sodertalje
    (D)州:
    (E)国家:瑞典
    (F)邮政编码
(ii)发明名称:关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物
(iii)序列数:275
(iv)计算机可读形式:
    (A)媒体类型:CD/ROM ISO9660
    (B)计算机:
    (C)操作系统:
    (D)软件:
(v)当前申请数据:
        (A)申请号
    (B)申请日:
(vi)在先申请数据:
    (A)申请号:US 08/759,625
    (B)申请日:19996年12月5日
(vii)在先申请数据:
    (A)申请号:US 08/823,745
    (B)申请日:1997年3月25日(viii)在先申请数据:
    (A)申请号:US 08/891,928
    (B)申请日:1997年7月14日(ix)通信地址:
    (A)收信人:LAHIVE & COCKFIELD
    (B)街道:28 State Street
    (C)城市:波士顿
    (D)州:Massachusetts
(E)国家:美国
(F)邮政编码:02109-1875(x)代理律师/代理人资料:
(A)姓名:Mandragouras,Amy E.
(B)注册号:36,207
(C)参考/档案号:GTN-011CP2PC(xi)电信资料:
(A)电话:(617)227-7400
(B)传真:(617)227-5941(2)INFORMATION FOR SEQ ID NO:1:(i)序列特征:
(A)长度:687个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:环状(ii)分子类型:DNA(基因组)(iii)假说:蛋白质(iv)反义:蛋白质(vi)原始来源:
(A)生物:幽门螺杆菌(ix)特征:
(A)名称/关键词:misc_特征
 (B)位置1...687(xi)序列描述:SEQ ID NO:1:ATGAGATTTA AGGGTTCAAG AGTGGAAGCG TTTTTAGGAG CGTTAGAATT TCAAGAGAAT   60GAATATGAAG AGTTTAAAGA GCTTTATGAG AGCTTAAAAA CCAAGCAAAA GCCCCACACT  120TTGTTCATTT CTTGCGTGGA TTCACGAGTC GTGCCTAATT TAATCACAGG CACCCAACCG  180GGCGAATTGT ATGTGATCCG CAACATGGGC AATGTGATCC CCCCTAAAAC AAGCTATAAA  240GAATCCCTTT CTACCATTGC GAGCGTTGAA TACGCTATCG CGCATGTGGG CGTTCAAAAC  300TTAATCATTT GCGGGCATAG CGATTGTGGG GCTTGCGGGA GCATTCATTT AATCCATGAT  360GAAACCACCA AAGCTAAAAC CCCTTACATT GCAAACTGGA TACAATTTTT AGAGCCTATT  420AAAGAAGAAT TAAAAAACCA CCCGCAATTC AGCAACCATT TCGCCAAGCG TTCATGGCTT  480ACAGAGCGTT TGAATGCGCG CTTGCAACTC AACAACCTCT TAAGCTATGA TTTCATTCAA  540GAAAGAGTAA TAAATAACGA ATTAAAAATT TTTGGTTGGC ACTATATCAT AGAAACAGGC  600AGGATTTATA ATTATAATTT TGAAAGCCAT TTTTTTGAGC CGATTGAAGA AACCATTAAA  660CAAAGGATAA GTCATGAAAA CTTCTAA                                      687(2)INFORMATION FOR SEQ ID NO:2:
(i)序列特征:
    (A)长度:666个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...666
(xi)序列描述:SEQ ID NO:2:GTGGAAGCGT TTTTAGGAGC GTTAGAATTT CAAGAGAATG AATATGAAGA GTTTAAAGAG   60CTTTATGAGA GCTTAAAAAC CAAGCAAAAG CCCCACACTT TGTTCATTTC TTGCGTGGAT  120TCACGAGTCG TGCCTAATTT AATCACAGGC ACCCAACCGG GCGAATTGTA TGTGATCCGC  180AACATGGGCA ATGTGATCCC CCCTAAAACA AGCTATAAAG AATCCCTTTC TACCATTGCG  240AGCGTTGAAT ACGCTATCGC GCATGTGGGC GTTCAAAACT TAATCATTTG CGGGCATAGC  300GATTGTGGGG CTTGCGGGAG CATTCATTTA ATCCATGATG AAACCACCAA AGCTAAAACC  360CCTTACATTG CAAACTGGAT ACAATTTTTA GAGCCTATTA AAGAAGAATT AAAAAACCAC  420CCGCAATTCA GCAACCATTT CGCCAAGCGT TCATGGCTTA CAGAGCGTTT GAATGCGCGC  480TTGCAACTCA ACAACCTCTT AAGCTATGAT TTCATTCAAG AAAGAGTAAT AAATAACGAA  540TTAAAAATTT TTGGTTGGCA CTATATCATA GAAACAGGCA GGATTTATAA TTATAATTTT  600GAAAGCCATT TTTTTGAGCC GATTGAAGAA ACCATTAAAC AAAGGATAAG TCATGAAAAC  660TTCTAA                                                             666(2)INFORMATION FOR SEQ ID NO:3:
(i)序列特征:
    (A)长度:1008个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1008
(xi)序列描述:SEQ ID NO:3:ATGTTAGTTA CTCGTTTTAA AAAAGCCTTC ATTTCTTATT CTTTAGGCGT GCTTGTTGTT   60TCATTATTAT TGAATGTGTG CAACGCTTCA GCACAAGAAG TCAAAGTCAA GGATTATTTT  120GGGGAGCAAA CCATAAAGCT TCCTGTTTCC AAAATAGCCT ATATAGGGAG TTATGTAGAA  180GTGCCTGCCA TGCTTAATGT TTGGGATAGG GTTGTAGGCG TTTCTGATTA TGCCTTTAAG  240GATGACATTG TCAAAGCCAC TCTCAAAGGC GAGGATCTTA AACGAGTCAA ACACATGAGC  300ACCGATCATA CAGCCGCGTT GAATGTGGAA TTATTAAAAA AGCTTAGCCC TGATCTTGTG  360GTAACCTTTG TGGGTAACCC TAAAGCGGTA GAGCATGCGA AAAAATTTGG GATTTCATTC  420CTTTCTTTCC AAGAGACAAC GATTGCAGAG GCCATGCAAG CTATGCAAGC TCAAGCCACG  480GTCTTAGAAA TTGACGCTTC CAAAAAATTC GCCAAAATGC AAGAAACTTT GGACTTTATT  540GCTGAGCGTT TGAAGGGCGT TAAAAAGAAA AAGGGGGTGG AGCTTTTCCA TAAAGCCAAT  600AAAATCAGCG GCCATCAAGC CATTAGCTCA GACATTTTAG AAAAAGGGGG TATAGATAAT  660TTTGGCTTGA AATACGTTAA GTTTGGACGC GCTGACATTA GTGTGGAAAA AATCGTTAAA  720GAAAACCCTG AAATCATTTT CATTTGGTGG GTAAGCCCAC TCACTCCTGA AGACGTGTTG  780AACAACCCTA AATTTTCCAC TATCAAAGCC ATTAAAAATA AGCAAGTCTA TAAGCTCCCC  840ACGATGGATA TTGGCGGTCC TAGAGCCCCA CTCATTAGTC TTTTTATCGC TTTAAAAGCC  900CACCCTGAAG CCTTTAAAGG CGTGGATATT AATGCGATAG TCAAAGATTA TTATAAAGTG  960GTCTTTGATT TGAATGATGC GGAAATTGAG CCATTCTTAT GGCACTGA              1008(2)INFORMATION FOR SEQ ID NO:4:
(i)序列特征:
    (A)长度:825个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...825
(xi)序列描述:SEQ ID NO:4:ATGTTAGTTA CTCGTTTTAA AAAAGCCTTC ATTTCTTATT CTTTAGGCGT GCTTGTTGTT   60TCATTATTAT TGAATGTGTG CAACGCTTCA GCACAAGAAG TCAAAGTCAA GGATTATTTT  120GGGGAGCAAA CCATAAAGCT TCCTGTTTCC AAAATAGCCT ATATAGGGAG TTATGTAGAA  180GTGCCTGCCA TGCTTAATGT TTGGGATAGG GTTGTAGGCG TTTCTGATTA TGCCTTTAAG  240GATGACATTG TCAAAGCCAC TCTCAAAGGC GAGGATCTTA AACGAGTCAA ACACATGAGC  300ACCGATCATA CAGCCGCGTT GAATGTGGAA TTATTAAAAA AGCTTAGCCC TGATCTTGTG  360GTAACCTTTG TGGGTAACCC TAAAGCGGTA GAGCATGCGA AAAAATTTGG GATTTCATTC  420CTTTCTTTCC AAGAGACAAC GATTGCAGAG GCCATGCAAG CTATGCAAGC TCAAGCCACG  480GTCTTAGAAA TTGACGCTTC CAAAAAATTC GCCAAAATGC AAGAAACTTT GGACTTTATT  540GCTGATCGTT TGAAGGGCGT TAAAAAGAAA AAGGGGGTGG AGCTTTTCCA TAAAGCCAAT  600AAAATCAGCG GCCATCAAGC CATTAACTCA GACATTTTAC AACAAGGGGG TATTGATAAT  660TTTGGCTTGA AATACGTCAA GTTTGGACGC GCTGACATTA GTGTGGAAAA AATCGTTAAA  720GAAAACCCTG AAATCATTTT CATTAGGTGG GTAACCCCAC TCACTCCTGA TTACGTGTTG  780AACAACCCAA AATTTTCTAC TATCAATGCC ATTAAAAACA TATAA                  825(2)INFORMATION FOR SEQ ID NO:5:
(i)序列特征:
    (A)长度:1287个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1287
(xi)序列描述:SEQ ID NO:5:ATGAAGAAAA AATTTCTGTC ATTAACCTTA GGTTCGCTTT TAGTTTCCGC TTTAAGCGCT   60GAAGACAACG GCTTTTTTGT GAGCGCCGGC TATCAAATCG GTGAATCCGC TCAAATGGTG  120AAAAACACCA AAGGCATTCA AGATCTTTCA GACAGCTATG AAAGATTGAA CAACCTTTTA  180ACGAATTATA GCGTCCTAAA CGCTCTCATC AGGCAGTCCG CCGACCCCAA CGCCATCAAT  240AACGCAAGGG GCAATTTGAA CGCGAGCGCG AAGAATTTGA TCAATGATAA AAAGAATTCC  300CCGGCGTATC AAGCCGTGCT TTTAGCCTTG AATGCGGCAG CGGGGTTGTG GCAAGTCATG  360AGCTATGCGA TCAGCCCTTG TGGTCCCGGT AAAGACACAA GCAAAAATGG GGGCGTTCAA  420ACTTTCCACA ACACGCCTTC AAATCAATGG GGAGGCACTA CCATTACTTG TGGCACTACT  480GGTTATGAAC CAGGACCATA CAGCATTTTA TCCACTGAAA ATTACGCGAA AATCAATAAA  540GCTTATCAAA TCATCCAAAA GGCTTTTGGG AGCAGCGGAA AAGATATTCC TGCCTTAAGC  600GACACCAACA CAGAACTCAA ATTCACAATC AATAAAAATA ATGGAAACAC GAATACGAAT  660AATAATGGAG AAGAAATTGT TACAAAAAAT AACGCTCAAG TTCTTTTAGA ACAGGCTAGC  720ACCATTATAA CTACCCTTAA TAGCGCATGC CCATGGATCA ACAATGGTGG TGCAGGTGGT  780GCGAGTAGTG GTAGTTTATG GGAAGGAATA TATTTGAAAG GCGATGGGAG CGCTTGCGGG  840ATTTTTAAAA ATGAAATCAG CGCGATTCAA GACATGATCA AAAACGCTGC AATAGCCGTA  900GAGCAATCCA AGATCGTTGC TGCAAACGCG CAAAACCAGC GCAACCTAGA CACCGGGAAG  960ACATTCAACC CCTATAAAGA CGCCAACTTC GCCCAAAGCA TGTTCGCTAA CGCCAAAGCG 1020CAAGCGGAGA TTTTAAACCG CGCCCAAGCA GTGGTGAAAG ACTTTGAAAG AATCCCTGCA 1080GAGTTCGTAA AAGACTCTTT AGGGGTGTGC CATGAAGTGC AAAACGGCCA TCTCCGTGGC 1140ACGCCATCCG GCACGGTAAC TGATAACACT TGGGGAGCCG GTTGCGCGTA TGTGGGAGAG 1200ACCGTAACGA ATCTAAAAGA CAGCATCGCT CATTTTGGCG ACCAAGCCGA GCGAATCCAT 1260AACGCGCGCA ACCTCGCTAC ACTTTAG                                     1287(2)INFORMATION FOR SEQ ID NO:6:
(i)序列特征:
    (A)长度:537个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...537
(xi)序列描述:SEQ ID NO:6:ATGAACCCCT TATTGCAAGA TTATGCGCGC ATCCTTTTAG AATGGAATCA AACGCACAAC   60TTGAGCGGCG CGAGAAATTT AAGCGAATTA GAACCCCAGA TCACAGACGC TCTAAAGCCC  120TTAGAATTTG TCAAAGATTT TAAAAGCTGC TTGGATATTG GGAGCGGGGC GGGACTTCCT  180GCTATCCCTT TAGCCCTTGA AAAACCTGAA GCGCAATTCA TTCTTTTAGA GCCAAGGGTA  240AAAAGAGCGG CTTTTTTAAA CTACCTTAAA AGCGTTTTGC CTTTAAACAA CATTGAAATC  300ATTAAAAAGC GTTTAGAAGA TTATCAAAAT CTTTTACAAG TGGATTTAAT CACTTCTAGA  360GCGGTCGCTA GCTCTTCTTT TTTGATAGAA AAAAGCCAAC GCTTCCTAAA AGATAAGGGG  420TATTTTTTAT TCTATAAAGG CGAGCAGTTA AAGAATGAAA TCGCTTATAA AACCACTGAA  480TGCTTTATGC ATCAAAAGCG CGTTTATTTT TACAAATCAA AGGAAAGTTT ATGTTAA     537(2)INFORMATION FOR SEQ ID NO:7:
(i)序列特征:
    (A)长度:723个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...723
(xi)序列描述:SEQ ID NO:7:TTGGGTCTTA AAAAACGAGC TATTTTATGG TCTTTAATGG GATTTTGTGC AGGATTGAGC   60GCGCTTGATT ATGACACCCT AGACCCAAAA TATTACAAAT ATATCAAGTA TTATAAGGCT  120TATGAAGATA AAGAAGTTGA AGAATTGATC AGAGACTTGA AAAGGGCGAA CGCTAAAAGC  180GGGCTTATTT TAGGGATCAA TACCGGTTTT TTTTATAACC ATGAAATCAT GGTCAAAACC  240AATAGCTCCA GTATCACCGG GAATATTTTA AATTATTTGT TCGCCTATGG CTTGCGTTTT  300GGCTATCAAA CTTTCAGGCC GTCGTTTTTT GCGCGCTTGG TTAAGCCCAA TATCATTGGC  360AGGCGCATCT ATATTCAATA TTATGGAGGA GCTCCTAAGA AAGCGGGCTT TGGGAGCGTG  420GGGTTTCAAT CGGTCATGTT GAATGGGGAT TTTTTATTAG ACTTTCCTTT GCCCTTTGTG  480GGGAAATACC TTTATATGGG GGGGTATATG GGTTTAGGCT TGGGGGTTGT GGCGCATGGG  540GTGAATTATA CGGCGGAATG GGGGATGTCT TTTAACGCAG GATTGGCTCT AACGGTATTA  600GAAAAAAACC GCATTGAATT TGAATTTAAA ATTTTGAATA ATTTCCCTTT TTTGCAATCT  660AATTCTTCAA AAGAGACTTG GTGGGGAGCT ATAGCAAGCA TTGGGTATCA ATATGTGTTC  720TAA                                                                723(2)INFORMAION FOR SEQ ID NO:8:
(i)序列特征:
    (A)长度:942个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...942
(xi)序列描述:SEQ ID NO:8:TTGAAACTCA AATACTGGTT AGTTTATCTG GCGTTCATTA TAGGACTTCA AGCGACAGAT   60TATGACAATT TAGAAGAAGA AAACCAACAA TTAGACGAAA AAATAAACAA TTTAAAGCGA  120CAGCTCACCG AAAAAGGGGT TTCACCCAAA GAGATGGATA AGGATAAGTT TGAAGAAGAA  180TATTTAGAGC GAACTTACCC AAAGATTTCT TCAAAGAAAA GAAAAAAATT GCTCAAATCT  240TTTTCCATAG CCGATGATAA GAGTGGGGTG TTTTTAGGGG GCGGGTATGC TTATGGGGAA  300CTTAACTTGT CTTATCAAGG GGAGATGTTA GACAGGTATG GCGCAAATGC CCCTAGCGCG  360TTTAAAAACA ATATCAATAT TAACGCTCCT GTTTCTATGA TTAGCGTTAA ATTTGGGTAT  420CAAAAATACT TCGTGCCTTA TTTTGGGACA CGATTTTATG GGGATTTGTT GCTTGGGGGA  480GGGGCGTTAA AAGAGAACGC GCTCAAGCAG CCTGTAGGCT CGTTTTTTTA TGTTTTAGGG  540GCTATGAATA CCGATTTATT GTTTGACATG CCTTTAGATT TTAAGACTAA AAAGCATTTT  600TTAGGCGTTT ATGCGGGTTT TGGGATAGGG CTTATGCTTT ATCAAGACAA GCCTAATCAA  660AACGGGAGGA ATTTGATAGT AGGGGGTTAT TCAAGCCCTA ATTTTTTATG GAAATCTTTG  720ATTGAAGTGG ATTACACTTT TAATGTGGGC GTGAGTTTAA CGCTTTATAG GAAACACCGC  780TTAGAGATTG GCACAAAATT ACCGATTAGC TATTTGAGGA TGGGAGTAGA AGAGGGAGCG  840ATTTATCACA ATAAAGAAAA TGATGAACGA TTGTTGATTT CGGCTAACAA CCAGTTCAAA  900CGATCCAGTT TTTTATTAGT GAATTATGCG TTCATTTTTT GA                     942(2)INFORMATION FOR SEQ ID NO:9:
(i)序列特征:
    (A)长度:1182个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1182
(xi)序列描述:SEQ ID NO:9:ATGACTTCAG CTTCAAGCCA TTCTTTTAAA GAACAAGATT TTCATATTCC TATCGCTTTC   60GCTTTTGATA AGAATTATCT CATTCCTGCG GGCGCATGCA TTTATTCCTT GCTAGAAAGC  120ATCGCTAAAG CCAATAAAAA AATCCGTTAC ACCTTACACG CTTTAGTGGT AGGCTTGAAT  180GAAGAAGATA AAACAAAACT TAACCAAATC ACAGAGCCTT TTAAAGAATT TGCTGTTTTA  240GAAGTAAAAG ATATTGAACC TTTTTTAGAC ACTATCCCTA ACCCTTTTGA TGAGGATTTC  300ACCAAGCGTT TTTCTAAAAT GGTGTTAGTG AAGTATTTTC TAGCGGATTT ATTCCCCAAA  360TATTCTAAAA TGGTGTGGAG CGATGTGGAT GTTATCTTTT GTAATGAATT TAGCGCTGAT  420TTCTTAAACA TTAAAGAAGA TGATGAGAAT TATTTTTATG GGGTTTATGA CAAAATATAC  480CCGTATGAAG GCTTTTTTTA TTGCAACTTA ACTTACCAGC GAAAAAATCA ATTTTGTAAA  540AAAATATTAG AAATCATACG CGCACAAAAA ATAGATAAAG AACCGCAATT GACAGAATTT  600TGTCGTTCAA AGATCGCGCC ATTAAAAATA GAGTATTGTA TTTTCCCACA CTATTATAGC  660CTTTCTGAAG AGCATTTAAA GGGCGTGGCC AATGCAATTT ATCATAACAC CATTAAACAA  720GCCCTAAGAG AACCTATCGT TATACAATAT GACTCTCATC CTTATTTTCA AATCAAGCCT  780TGGACATATC CTTTTGGTTT GAAAGCGGAT TTATGGCTGA ACGCTTTGGC TAAAACCCCA  840TTTATGAGCG ATTGGTCTTA TTTGATCACA GGGGGTGGGG GGATAGGTGG AGAAAAATGG  900CATTACTACC ATGGCATTGC CGCTTATCAT TACTACTTTC CTTTATGGAA AGCAGAAGAA  960CAGATTGCCC ATGACGCTCT TAAGACATTT TTAAAACATT ATTTTTTGCA CATTCATGAG 1020ATTCCCCAAA ACGCAAGGCG AAGACTATTC AAATACTGCA TTTCAATACC GCTTAAGAGC 1080TTTATTAGTA AAACCCTTAA ATTTCTAAAA CTCCATGCAT TGGTGAAAAA AATCCTAATC 1140CAACTCAAGC TCTTAAAAAA GAACCAGAGC CAAAACTTTT AA                    1182(2)INFORMATION FOR SEQ ID NO:10:
(i)序列特征:
    (A)长度:1308个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1308
(xi)序列描述:SEQ ID NO:10:TTGATTTTCT TAAAAAAATC TCTTTGCGCG TTGTTAATTT CAGGTTTTTT CATACCACCC  60TTAATGAAAG CGGCTAGTTT TGTCTATGAC TTGAAGTTTA TGAGCTTTAA TTTCAATCTG  120GCTTCCCCTC CAAATAACCC CTATTGGAAT AGCCTAACCA AAATGCAAGG TCGTCTCATG  180CCTCAAATTG GCGTCCAATT AGACAAAAGA CAGGCCTTGA TGTTTGGGGC GTGGTTCATT  240CAAAATTTGC ACACGCATTA TAGCTATTTC CCTTATTCGT GGGGGGTTAC CATGTATTAC  300CAATACATAG GGAAAAATTT GAGATTTTTT TTAGGCATTG TGCCACGAAG CTATCAAATA  360GGGCATTACC CTTTAAGCGC TTTTAAAAAA CTTTTCTGGT TTATAGACCC TACTTTTAGG  420GGAGGAGCGT TCCAATTCAA ACCGGCTTAT GATCCCAATC GTTGGTGGAA TGGGTGGTTT  480GAGGGCGTTG TGGATTGGTA TGGGGGGCGT AATTGGAACA ACCAGCCCAA AAAGAAAAAT  540TACGATTTTG ATCAATTCTT GTATTTTGTT TCTTCAGAAT TTCAGTTTCT TAAAGGGTAT  600TTAGGTTTGG GGGGACAGCT TGTCATTTTT CATAACGCCA ACTCTCATAG TATGGGGGAT  660AACTACCCTT ATGGCGGGAA TTCCTACTTA AAACCAGGCG ATGCAACCCC ACAATGGCCT  720AATGGCTACC CTTATTTCAG CCAAAAAGAT AACCCACAAG GCGGAGAAAT AGGGAAATAC  780TCTAACCCTA CCATTTTAGA CAGGGTTTAT TACCATGCTT ATTTAAAAGC AGATTTTAAA  840AATCTCATGC CTTATATGGA CAATATTTTC ATGACCTTTG GCACGCAGTC GTCTCAAACC  900CATTATTGCG TGCGTTATGC TAGCGAGTGT AAAAACGCCC GATTTTATAA CAGCTTTGGG  960GGGGAATTTT ACGCTCAAGC GCAATACAAA GGCTTTGGGA TCTTTAACAG ATACTATTTT 1020TCCAACAAAC CCCAAATGCA TTTTTATGCC ACTTATGGCC AATCCCTTTA TACCGGATTG 1080CCATGGTATA GAGCCCCTAA TTTTGACATG ATAGGGCTTT ATTATCTTTA TAAAAACAAA 1140TGGTTAAGCG TGCGAGCGGA TGCGTTTTTT AGCTTTGTGG GTGGGGGCGA TGGGTACCAT 1200TTGTATGGCA AGGGGGGTAA GTGGTTTGTG ATGTATCAGC AATTTTTAAC CCTAACCATA 1260GACACAAGAG AGTTGATTGA TTTTGTCAAA TCTAAAATCC CTAAATAA              1308(2)INFORMATION FOR SEQ ID NO:11:
(i)序列特征:
    (A)长度:663个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...663
(xi)序列描述:SEQ ID NO:11:ATGAATAAAA CAACAATTAA AATATTAATG GGCATGGCGT TATTATCATC GCTTCAAGCC   60GCAGAGGCAG AGCTTGATGA AAAATCAAAA AAACCTAAAT TTGCGGATAG GAATACGTTT  120TATTTAGGGG TTGGGTATCA GCTTAGCGCG ATCAACACGT CTTTTAGCAC CAGTTCTATA  180GATAAATCGT ATTTCATGAC CGGCAATGGT TTTGGCGTGG TGTTGGGGGG GAAATTTGTG  240GCTAAAACGC AAGCTGTAGA GCATGTGGGT TTTCGTTACG GGTTGTTTTA TGATCAGACC  300TTTTCTTCTC ACAAATCCTA TATTTCTACC TATGGTTTAG AATTTAGCGG TTTGTGGGAC  360GCTTTCAATT CGCCAAAGAT GTTTTTGGGG TTGGAGTTTG GCTTAGGCAT CGCTGGGGCG  420ACTTACATGC CAGGAGGGGC CATGCATGGG ATTATCGCTC AATATTTAGG CAAAGAAAAT  480TCGCTTTTCC AATTGCTTGT GAAAGTGGGT TTTCGTTTTG GCTTTTTCCA CAATGAAATC  540ACCTTTGGGT TGAAATTCCC TGTCATTCCT AACAAAAAAA CGGAAATCGT TGATGGCTTG  600AGCGCGACCA CTTTATGGCA ACGCTTGCCG GTAGCCTATT TCAATTATAT CTATAATTTT  660TAG                                                                663(2)INFORMATION FOR SEQ ID NO:12:
(i)序列特征:
    (A)长度:351个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...351
(xi)序列描述:SEQ ID NO:12:TTGAATCTCC ATTTTATGAA AGGATTTGTT ATGAGTGGAT TAAGAACATT TAGTTGTGTA   60GTGGTTTTAT GCGGTGCAAT GGTTAATGTA GCTGTAGCTG GTCCTAAAAT AGAGGCAAGG  120GGTGAATTAG GCAAATTTGT AGGGGGAGCT GTTGGAAATT TTGTTGGTGA TAAAATGGGC  180GGATTTGTTG GTGGTGCAAT AGGAGGATAT ATTGGGTCTG AAGTAGGCGA TAGGGTAGAA  240GATTATATCC GTGGCGTTGA TAGAGAGCCA CAAAACAAAG AACCACAAAC CCCAAGAGAA  300CCTATCCGTG ATTTTTATGA TTACGGCTAT AGTTTTGGGC ATGCTTGGTG A            351(2)INFORMATION FOR SEQ ID NO:13:
(i)序列特征:
    (A)长度:1311个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1311
(xi)序列描述:SEQ ID NO:13:ATGTCAAGGG ATTTTAAATT TGATTCTAAC TATTTAAATG TCAATACCAA TCCTAAATTA   60GGCCCCGTTT ATACCAATCA AAATTATCCA GGATTTTTTA TCTTTGATCA TTTAAGGCGT  120TATGTGATGA ACGCTTTTGA GCCTAATTTG AACTTAGTTG TCAATACCAA TAAAGTTAAG  180CAAACTTTTA ATGTGGGCAT GCGTTTTATG ACAATGGATA TGTTCATTAG ATCCGATCAA  240AGCACATGCG AAAAAACAGA TATTATCAAT GGGGTGTGCC ACATGCCTCC TTATGTCCTT  300TCTAAAACGC CTAACAATAA TCAAGAAATG TTTAATAACT ATACAGCGGT ATGGTTGAGC  360GATAAAATAG AGTTTTTTGA TTCTAAATTG GTGATAACTC CAGGGCTTAG ATACACTTTT  420TTGAACTATA ACAACAAAGA GCCAGAAAAG CATGATTTTT CCGTATGGAC CAGTAAAAAA  480CAGCGTCAAA ACGAATGGAG TCCTGCCCTT AATATTGGCT ATAAACCTAT GGAAAATTGG  540ATATGGTATG CGAACTACCG CCGCAGTTTT ATCCCCCCAC AACACACAAT GGTAGGCATT  600ACTAGGACTA ATTACAACCA AATTTTTAAT GAAATTGAAG TGGGGCAGCG CTATAGTTAT  660AAAAATCTAT TGAGTTTTAA CACCAATTAT TTTGTGATTT TTGCCAAGCG TTACTATGCG  720GGAGGCTATA GCCCACAGCC TGTGGATGCC AGAAGTCAAG GGGTGGAATT GGAATTGTAT  780TACGCGCCGA TTAGGGGTTT GCAATTCCAT GTGGCTTACA CTTATATTGA TGCGCGCATC  840ACTTCTAACG CTGATGATAT TGCTTATTAT TTTACAGGCA TTGTCAATAA ACCCTTTGAC  900ATTAAAGGGA AGCGCTTGCC CTATGTGAGT CCTAACCAAT TCATATTTGA CATGATGTAT  960ACTTACAAGC ACACGACTTT TGGTATCAGC AGCTATTTTT ATAGCCGCGC TTATAGTTCC 1020ATGCTCAATC AAGCCAAAGA TCAAACCGTA TGCCTGCCCT TAAACCCAGA ATACACAGGG 1080GGGTTAAAGT ATGGTTGTAA TTCAGTGGGG TTATTGCCCT TGTATTTTGT GTTGAATGTC  1140CAAGTAAGCT CAATCTTATG GCAAAGCGGT AGGCATAAAA TCACAGGGAG TTTGCAAATC  1200AATAACCTTT TTAACATGAA GTATTATTTT AGGGGGATTG GCACAAGCCC TACAGGGAGA  1260GAACCCGCGC CAGGGAGATC CATTACAGCG TATTTGAATT ATGAGTTTTA A           1311(2)INFORMATION FOR SEQ ID NO:14:
(i)序列特征:
    (A)长度:2304个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...2304
(xi)序列描述:SEQ ID NO:14:ATGAAAAGAA TTTTAGTTTC TTTGGCTGTT TTGAGTCATA GCGCGCATGC TGTCAAAACT   60CATAATTTGG AAAGGGTGGA AGCTTCAGGG GTGGCTAACG ATAAAGAAGC GCCTTTAAGC  120TGGAGGAGCA AGGAAGTTAG AAATTATATG GGTTCTCGCA CGGTGATTTC TAACAAGCAA  180CTCACTAAAA GCGCCAATCA AAGCATTGAA GAAGCTTTGC AAAATGTGCC AGGCGTGCAT  240ATTAGAAACT CTACCGGTAT TGGAGCTGTG CCTAGCATTT CCATTAGGGG GTTTGGTGCT  300GGAGGCCCAG GGCATTCTAA TACGGGAATG ATTCTAGTCA ATGGGATTCC TATTTATGTC  360GCGCCCTATG TTGAAATTGG CACGGTTATT TTTCCTGTAA CCTTTCAGTC TGTGGATAGA  420ATCAGCGTAA CTAAGGGTGG GGAGAGCGTG CGTTATGGCC CTAACGCTTT TGGCGGTGTG  480ATCAACATCA TCACCAAAGG CATTCCTACC AATTGGGAAA GTCAGGTGAG CGAGAGGACC  540ACTTTTTGGG GCAAGTCTGA AAACGGGGGC TTTTTCAATC AAAATTCTAA AAACATTGAT  600AAAAGCTTAG TTAATAACAT GCTTTTTAAC ACCTATTTAA GAACGGGGGG TATGATGAAT  660AAGCATTTTG GAATCCAAGC TCAAGTCAAT TGGCTCAAAG GGCAAGGGTT TAGATACAAC  720AGCCCTACGG ATATTCAAAA TTACATGTTA GATTCATTGT ATCAAATCAA TGATAGCAAT  780AAAATCACCG CTTTTTTTCA ATATTATAGT TATTTCTTGA CAGACCCTGG ATCTTTAGGC  840ATAGCCGCTT ACAATCAAAA TCGTTTTCAA AACAACCGCC CCAATAACGA TAAAAGCGGG  900AGAGCGAAGC GATGGGGAGC TGTGTATCAA AACTTTTTTG GGGACACGGA TAGGGTAGGG   960GGGGATTTCA CTTTTAGCTA CTATGGGCAT GACATGTCAA GGGATTTTAA ATTTGATTCT  1020AACTATTTAA ATGTCAATAC CAATCCTAAA TTAGGCCCCG TTTATACCAA TCAAAATTAT  1080CCAGGATTTT TTATCTTTGA TCATTTAAGG CGTTATGTGA TGAACGCTTT TGAGCCTAAT  1140TTGAACTTAG TTGTCAATAC CAATAAAGTT AAGCAAACTT TTAATGTGGG CATGCGTTTT  1200ATGACAATGG ATATGTTCAT TAGATCCGAT CAAAGCACAT GCGAAAAAAC AGATATTATC  1260AATGGGGTGT GCCACATGCC TCCTTATGTC CTTTCTAAAA CGCCTAACAA TAATCAAGAA  1320ATGTTTAATA ACTATACAGC GGTATGGTTG AGCGATAAAA TAGAGTTTTT TGATTCTAAA  1380TTGGTGATAA GTCCAGGGCT TAGATACACT TTTTTGAACT ATAACAACAA AGAGCCAGAA  1440AAGCATGATT TTTCCGTATG GACCAGTAAA AAACAGCGTC AAAACGAATG GAGTCCTGCC  1500CTTAATATTG GCTATAAACC TATGGAAAAT TGGATATGGT ATGCGAACTA CCGCCGCAGT  1560TTTATCCCCC CACAACACAC AATGGTAGGC ATTACTAGGA CTAATTACAA CCAAATTTTT  1620AATGAAATTG AAGTGGGGCA GCGCTATAGT TATAAAAATC TATTGAGTTT TAACACCAAT  1680TATTTTGTGA TTTTTGCCAA GCGTTACTAT GCGGGAGGCT ATAGCCCACA GCCTGTGGAT  1740GCCAGAAGTC AAGGGGTGGA ATTGGAATTG TATTACGCGC CGATTAGGGG TTTGCAATTC  1800CATGTGGCTT ACACTTATAT TGATGCGCGC ATCACTTCTA ACGCTGATGA TATTGCTTAT  1860TATTTTACAG GCATTGTCAA TAAACCCTTT GACATTAAAG GGAAGCGCTT GCCCTATGTG  1920AGTCCTAACC AATTCATATT TGACATGATG TATACTTACA AGCACACGAC TTTTGGTATC  1980AGCAGCTATT TTTATAGCCG CGCTTATAGT TCCATGCTCA ATCAAGCCAA AGATCAAACC  2040GTATGCCTGC CCTTAAACCC AGAATACACA GGGGGGTTAA AGTATGGTTG TAATTCAGTG  2100GGGTTATTGC CCTTGTATTT TGTGTTGAAT GTCCAAGTAA GCTCAATCTT ATGGCAAAGC  2160GGTAGGCATA AAATCACAGG GAGTTTGCAA ATCAATAACC TTTTTAACAT GAAGTATTAT  2220TTTAGGGGGA TTGGCACAAG CCCTACAGGG AGAGAACCCG CGCCAGGGAG ATCCATTACA  2280GCGTATTTGA ATTATGAGTT TTAA                                         2304(2)INFORMATION FOR SEQ ID NO:15:
(i)序列特征:
    (A)长度:348个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...348
(xi)序列描述:SEQ ID NO:15:TTGCACCCTC TATGCGCACA CGGCCAATGT GGAAGCGAAG CGATTGCGTG TTTAGAAGCC   60ATTAGCGTGG GGATTGTGCC TGTTATCGCT AATAGCCCTT TAAGCGCGAC CAGGCAATTC  120GCGCTAGATG AACGATCGTT ATTTGAGCCT AATAACGCTA AAGATTTGAG CGCTAAAATA  180GACTGGTGGT TAGAAAACAA ACTTGAAAGA GAAAGAATGC AAAACGAATA CGCTAAAAGC  240GCTTTAAACT ACACTTTAGA AAATTCAGTC ATTCAAATTG AAAAAGTTTA TGAAGAAGCG  300ATCAAAGATT TTAAAAACAA CCCCAACCTC TTTAAAACCT TATCGTAA               348(2)INFORMATION FOR SEQ ID NO:16:
(i)序列特征:
    (A)长度:1170个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1170
(xi)序列描述:SEQ ID NO:16:ATGGTTATTG TTTTAGTCGT GGATAGCTTT AAAGACACCA GTAATGGCAC TTCTATGACA   60GCGTTTCGTT TTTTTGAAGC GCTGAAAAAA AGAGGGCATG CGATGAGAGT GGTCGCCCCT  120CATGTGGATA ATTTAGGGAG TGAAGAAGAG GGGTATTACA ACCTTAAAGA GCGCTATATC  180CCCCTAGTTA CAGAAATTTC ACACAAGCAA CACATTCTTT TTGCCAAACC GGATGAAAAA  240ATTCTACGAA AGGCTTTTAA GGGAGCGGAT ATGATCCATA CTTACTTGCC TTTTTTGCTA  300GAAAAAACAG CCGTAAAAAT CGCGCGAGAA ATGCGAGTGC CTTATATTGG CTCTTTCCAT  360TTACAGCCAG AGCATATTTC TTATAACATG AAATTGGGGC AATTTTCTTG GCTAAATACC  420ATGCTTTTTT CATGGTTTAA ATCTTCGCAT TACCGCTATA TCCACCATAT CCATTGCCCA  480TCAAAATTCA TTGTAGAAGA ATTGGAAAAA TACAACTATG GAGGAAAAAA ATACGCTATC  540TCTAACGGCT TTGATCCCAT GTTTAAGTTT GAGCACCCGC AAAAAAGCCT TTTTGACACC  600ACGCCCTTTA AAATCGCTAT GGTAGGGCGC TATTCTAATG AAAAAAATCA AAGCGTTCTC  660ATTAAAGCGG TTGCTTTAAG CCGATACAAA CAAGACATTG TATTATTACT CAAAGGCAAG  720GGGCCTGATG AGAAAAAAAT CAAACTTCTA GCCCAAAAAC TAGGCGTAAA AACGGAGTTT  780GGGTTTGTCA ATTCCCATGA ATTGTTAGAG ATTTTAAAAA CTTGCACCCT CTATGCGCAC  840ACGGCCAATG TGGAAAGCGA AGCGATTGCG TGTTTAGAAG CCATTAGCGT GGGGATTGTG  900CCTGTTATCG CTAATAGCCC TTTAAGCGCG ACCAGGCAAT TCGCGCTAGA TGAACGATCG  960TTATTTGAGC CTAATAACGC TAAAGATTTG AGCGCTAAAA TAGACTGGTG GTTAGAAAAC 1020AAACTTGAAA GAGAAAGAAT GCAAAACGAA TACGCTAAAA GCGCTTTAAA CTACACTTTA 1080GAAAATTCAG TCATTCAAAT TGAAAAAGTT TATGAAGAAG CGATCAAAGA TTTTAAAAAC 1140AACCCCAACC TCTTTAAAAC CTTATCGTAA                                  1170(2)INFORMATION FOR SEQ ID NO:17:
(i)序列特征:
    (A)长度:939个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...939
(xi)序列描述:SEQ ID NO:17:TTGGCTTCTT ACGGGTTTTT TTTAGGAGCG TTGTTTATTT TAGCGAGCGG GATCGTGTGC   60TTACAGACTG CCGGTAATCC CTTTGTAACC TTGCTTTCTA AAGGTAAAGA AGCCAGAAAC  120TTGGTTTTAG TCCAGGCGTT CAATTCGCTT GGCACGACTT TAGGGCCTAT TTTTGGGAGC  180TTGTTGATTT TTAGCGCGAC CAAAACGAGC GATAATTTAA GCCTGATAGA CAAGTTAGCG  240GACGCTAAAA GCGTTCAAAT GCCTTATTTG GGTTTAGCGG TGTTTTCGCT TCTTTTAGCG  300CTTGTGATGT ATCTTTTAAA ATTGCCTGAT GTGGAAAAAG AAATGCCCAA AGAAACGACG  360CAAAAAAGCC TGTTTTCGCA CAAACACTTT GTTTTTGGGG CTTTAGGGAT CTTTTTCTAT  420GTGGGGGGAG AAGTGGCGAT TGGATCATTC TTGGTGCTAA GCTTTGAAAA GCTTTTGAAT  480TTAGACGCTC AATCAAGCGC GCATTACTTG GTGTATTATT GGGGCGGCGC GATGGTAGGG  540CGTTTCTTAG GCAGCGCTTT GATGAATAAA ATCGCTCCTA ATAAATACCT GGCTTTCAAC  600GCCTTAAGCT CTATCATTCT TATCGCTTTG GCTATTCTTA TTGGAGGCAA GATCGCTTTA  660TTCGCTCTGA CTTTTGTGGG CTTTTTCAAC TCTATCATGT TCCCTACAAT CTTTTCTTTG  720GCTACGCTCA ATTTAGGGCA TCTCACTTCT AAGGCTTCTG GAGTGATTAG CATGGCGATT  780GTGGGAGGGG CGTTAATCCC CCCCATTCAA GGCGTGGTTA CAGACATGCT CACAGCAACC  840GAATCGAATC TGCTCTACGC TTATAGCGTG CCGTTGTTGT GCTATTTTTA TATCCTCTTC  900TTTGCACTTA AGGGGTATAA ACAAGAAGAA AACTCCTAA                         939(2)INFORMATION FOR SEQ ID NO:18:
(i)序列特征:
    (A)长度:1224个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1224
(xi)序列描述:SEQ ID NO:18:ATGCAAAAAA CTTCTAACAC TTTAGCGCTG GGGAGTTTGA CGGCGCTATT CTTTCTAATG   60GGTTTTATCA CGGTTTTAAA CGACATTTTG ATCCCGCATT TAAAGCCCAT TTTTGACTTG  120ACCTATTTTG AAGCTTCGCT CATTCAATTT TGCTTTTTTG GGGCGTATTT CATCATGGGG  180GGAGTCTTTG GGAACGTGAT CAGTAAAATC GGCTACCCTT TTGGCGTGGT GCTTGGTTTT  240GTGATCACAG CGAGCGGGTG CGCGTTGTTT TATCCGGCGG CGCATTTTGG CTCTTACGGG  300TTTTTTTTAG GAGCGTTGTT TATTTTAGCG AGCGGGATCG TGTGCTTACA GACTGCCGGT  360AATCCCTTTG TAACCTTGCT TTCTAAAGGT AAAGAAGCCA GAAACTTGGT TTTAGTCCAG  420GCGTTCAATT CGCTTGGCAC GACTTTAGGG CCTATTTTTG GGAGCTTGTT GATTTTTAGC  480GCGACCAAAA CGAGCGATAA TTTAAGCCTG ATAGACAAGT TAGCGGACGC TAAAAGCGTT  540CAAATGCCTT ATTTGGGTTT AGCGGTGTTT TCGCTTCTTT TAGCGCTTGT GATGTATCTT  600TTAAAATTGC CTGATGTGGA AAAAGAAATG CCCAAAGAAA CGACGCAAAA AAGCCTGTTT  660TCGCACAAAC ACTTTGTTTT TGGGGCTTTA GGGATCTTTT TCTATGTGGG GGGAGAAGTG  720GCGATTGGAT CATTCTTGGT GCTAAGCTTT GAAAAGCTTT TGAATTTAGA CGCTCAATCA  780AGCGCGCATT ACTTGGTGTA TTATTGGGGC GGCGCGATGG TAGGGCGTTT CTTAGGCAGC  840GCTTTGATGA ATAAAATCGC TCCTAATAAA TACCTGGCTT TCAACGCCTT AAGCTCTATC  900ATTCTTATCG CTTTGGCTAT TCTTATTGGA GGCAAGATCG CTTTATTCGC TCTGACTTTT  960GTGGGCTTTT TCAACTCTAT CATGTTCCCT ACAATCTTTT CTTTGGCTAC GCTCAATTTA 1020GGGCATCTCA CTTCTAAGGC TTCTGGAGTG ATTAGCATGG CGATTGTGGG AGGGGCGTTA 1080ATCCCCCCCA TTCAAGGCGT GGTTACAGAC ATGCTCACAG CAACCGAATC GAATCTGCTC 1140TACGCTTATA GCGTGCCGTT GTTGTGCTAT TTTTATATCC TCTTCTTTGC ACTTAAGGGG 1200TATAAACAAG AAGAAAACTC CTAA                                        1224(2)INFORMATION FOR SEQ ID NO:19:
(i)序列特征:
    (A)长度:378个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...378
(xi)序列描述:SEQ ID NO:19:ATGAATAAAA TCGCTCCTAA TAAATACCTG GCTTTCGGCG CCTTAAGCTC TATCATTCTT   60ATCGCTTTGG CTATTCTTAT TGGAGGCAAG ATCGCTTTAT TCGCTCTGAC TTTTGTGGGC  120TTTTTCAACT CTATCATGTT CCCTACAATC TTTTCTTTGG CTACGCTCAA TTTAGGCATC  180TCACTTCTAA TGGCTTCTGG AGTGATTAGC ATGGCGATTG TGGGAGGGGC GTTAATCCCC  240CCCATTCAAG GCGTGGTTAC AGACATGCTC ACAGCAACCG AATCGAATCT GCTCTACGCT  300TATAGCGTGC CGTTGTTGTG CTATTTTTAT ATCCTCTTCT TTGCACTTAA GGGGTATAAA  360CAAGAAGAAA ACTCCTAA                                                378(2)INFORMATION FOR SEQ ID NO:20:
(i)序列特征:
    (A)长度:993个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...993
(xi)序列描述:SEQ ID NO:20:TTGAAAAAAA TATTACCGGC TTTGTTAATG GGGTTTGTGG GATTGAATGC TAGTGATCGT   60TTGTTAGAAA TCATGCGCCT TTATCAAAAA CAAGGCTTGG AAGTGGTGGG TCAAAAATTG  120GATTCTTATT TAGCGGATAA GTCTTTTTGG GCAGAAGAGC TTCAAAACAA GGACACGGAT  180TTTGGCTATT ATCAAAACAA GCAGTTTTTA TTTGTGGCGG ATAAATCCAA GCCCAGTTTG  240GAGTTTTATG AAATAGAAAA TAACATGCTT AAAAAAATCA ACAGCTCTAA AGCCCTTGTA  300GGCTCTAAAA AGGGCGATAA AACTTTAGAG GGCGATTTGG CCACGCCTAT TGGAGTGTAT  360CGTATCACGC AGAAATTAGA GCGTTTGGAT CAATATTATG GCGTTTTGGC TTTTGTAACG  420AATTACCCTA ATTTGTATGA CACTTTGAAA AAACGCACCG GGCATGGCAT TTGGGTGCAT  480GGAATGCCTT TAAATGGCGA TAGGAATGAA TTGAACACTA AGGGTTGCAT TGCGATTGAA  540AACCCTATTC TAAGCTCTTA TGACAAAGTG TTAAAAGGCG AAAAAGCGTT CCTTATCACT  600TATGAAGACA AGTTTTCCCC TAGCACTAAA GAAGAATTGA GCATGATTTT AAGCTCCCTT  660TTCCAATGGA AAGAAGCTTG GGCTAGGGGC GATTTTGAAC GCTACATGCG TTTTTATAAC  720CCCAATTTCA CTCGCTATGA CGGCATGAGT TTTAACGCTT TTAAAGAGTA TAAAAAAAGG  780GTGTTTGCAA AAAATGAAAA AAAGAATATC GCTTTTTCCT CTATCAATGT GATCCCTTAC  840CCCAACTCTC AAAACAAACG CTTGTTTTAT GTGGTATTTG ACCAAGATTA CAAAGCCTAC  900CAGCAAAACA AGCTCTCTTA TAGCTCCAAT TCTCAAAAAG AACTCTATGT AGAGATTGAA  960AACAATCAAG CGTCTATTAT AATGGAAAAA TAA                               993(2)INFORMATION FOR SEQ ID NO:21:
(i)序列特征:
    (A)长度:510个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...510
(xi)序列描述:SEQ ID NO:21:TTGTTTGAGA AATGGATTGG TCTGACCTTA CTCCTTAGTT CCTTAGGCTA TCCATGCCAA   60AAGGTAAGTA TTAGTTTCAA GCAATACGAA AATCTTATCC ATATCCATCA AAAAGGTTGC  120AACAATGAAG TGGTGTGCAG AACGCTCATC TCTATCGCTT TACTAGAAAG CTCTCTAGGG  180TTGAACAACA AGCGAGAAAA ATCCCTTAAA GACACTTCTT ACTCCATGTT CCATATCACC  240TTAAACACCG CTAAAAAGTT CTACCCTACC TATTCTAAAA CGCTCCTCAA AACCAAATTG  300TTAAATGATG TGGGTTTTGC GATCCAATTA GCCAAACAAA TTTTAAAAGA AAATTTTGAT  360TATTACCACC AAAAACACCC CAACAAAAGC GTGTATCAAT TAGTACAAAT GGCCATAGGC  420GCTTACAATG GGGGAATGAA ACACAACCCT AATGGCGCTT ACATGAAGAA GTTTCGTTGC  480ATTTATTCTC AAGTGCGATA CAACGAATAA                                   510(2)INFORMATION FOR SEQ ID NO:22:
(i)序列特征:
    (A)长度:648个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...648
(xi)序列描述:SEQ ID NO:22:ATGAAAAAAC CCTACAGAAA GATTTCTGAT TATGCGATCG TGGGTGGTTT GAGCGCGTTA   60GTGATGGTAA GCATTGTGGG GTGTAAGAGC AATGCCGATG ACAAACCAAA AGAGCAAAGC  120TCTTTAAGTC AAAGCGTTCA AAAAGGCGCG TTTGTGATTT TAGAAGAGCA AAAGGATAAA  180TCTTACAAGG TTGTTGAAGA ATACCCCAGC TCAAGAACCC ACATTGTAGT GCGCGATTTG  240CAAGGCAATG AACGCGTGTT GAGCAATGAA GAGATTCAAA AGCTCATCAA AGAAGAAGAA  300GCCAAAATTG ATAACGGCAC GAGCAAGCTT GTCCAGCCTA ATAATGGAGG GAGTAATGAA  360GGATCAGGCT TTGGCTTGGG AAGCGCGATT TTAGGGAGCG CGGCGGGGGC GATTTTAGGG  420AGTTATATTG GCAATAAGCT TTTTAATAAC CCTAATTATC AGCAAAACGC CCAACGGACC  480TACAAATCCC CACAAGCTTA CCAACGCTCT CAAAATTCTT TTTCTAAAAG CGCACCCAGC  540GCTTCAAGCA TGGGCACAGC GAGTAAGGGA CAGAGCGGGT TTTTTGGCTC TAGTAGGCCT  600ACTAGTTCGC CTGCAATAAG CTCTGGGACA AGGGGCTTTA ACGCATAA               648(2)INFORMATION FOR SEQ ID NO:23:
(i)序列特征:
    (A)长度:762个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...762
(xi)序列描述:SEQ ID NO:23:TTGAAAACTC TATTTAGTGT TTATCTCTTT TTGTCGTTGA ATCCACTCTT TTTAGAAGCT   60AAAGAAATCA CTTGGTCTCA ATTCTTGGAA AATTTTAAAA ACAAGAATGA AGACGACAAA  120CCTAAACCCC TAACCATTGA CAAAAACAAT GAAAAACAGC AAATCCTAGA CAAAAACCAG  180CAAATCTTAA AAAGGGCTTT AGAAAAAAGC CTTAAATTTT TCTTTATTTT TGGATACAAC  240TATTCGCAAG CCGCTTATTC AACCACTAAT CAAAACTTGA CTCTTACGGC GAATAGCATA  300GGGTTTAACA CCGCTACAGG CTTGGAGCAT TTTTTAAGAA ACCACCCTAA AGTCGGTTTT  360AGAATCTTTA GCGTCTATAA CTATTTCCAT TCCGTTTCGC TCTCCCAGCC TCAAATCCTA  420ATGGTGCAAA ATTACGGAGG CGCGTTAGAT TTTTCTTGGA TTTTTGTGGA TAAAAAAACC  480TATCGCTTTA GGAGTTATTT AGGAATCGCT TTAGAGCAAG GGGTGTTGTT AGTGGATACG  540ATTAAAACCG GCTCTTTCAC AACCATCATC CCAAGAACCA AGAAAACCTT TTTTCAAGCC  600CCTTTGCGTT TTGGTTTTAT CGTGGATTTT ATCGGCTATT TGTCTTTGCA ATTAGGGATT  660GAAATGCCCT TAGTGAGGAA TGTTTTTTAC ACCTACAATA ACCATCAAGA AAGATTCAAA  720CCACGATTTA ACGCTAATCT TTCTTTAATC GTTTCGTTTT AG                     762(2)INFORMATION FOR SEQ ID NO:24:
(i)序列特征:
    (A)长度:1011个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1011
(xi)序列描述:SEQ ID NO:24:TTGTTTTTCA AATTTATTTT ATGTTTATCA TTAGGAATAT TTGCATGGGC AAAAGAGGTC   60ATTCCCACCC CTTCAACCCC ATTAACGCCC TCTAAACGCT ATTCTATCAA TTTGATGACT  120GAAAATGATG GTTATATCAA TCCTTACATT GATGAGTATT ACACGGCAGG CAATCAAATA  180GGCTTTTCTA CTAAAGAGTT TGATTTTTCT AAAAATAAAG CGATGAAATG GTCTTCGTAT  240TTAGGGTTTT TCAATAAAAG CCCTAGGGTT ACTCGTTTTG GCATTTCTCT CGCCCAAGAC  300ATGTATACCC CCTCACTTGC AAACAGAAAA CTGGTGCATT TGCATGACAA CCACCCTTAT  360GGGGGGTATT TGAGGGTGAA TTTGAACGTG TATAACCGCC ATCAAACTTT CATGGAGTTA  420TTCACGATTT CTTTAGGCAC GACAGGCCAA GATTCTTTGG CCGCTCAAAC GCAGCGTCTC  480ATTCATAAAT GGGGTCATGA TCCCCAATTT TATGGCTGGA ACACGCAGCT CAAAAACGAA  540TTTATCTTTG AACTGCACTA CCAATTGCTT AAAAAAGTCC CCCTTTTAAA GACTCGTTTT  600TTTTCTATGG AGTTGATGCC TGGGTTTAAT GTGGAACTGG GTAATGCGAG GGATTATTTC  660CAACTCGGCT CGCTCTTTAG GGCTGGGTAT AACTTGGACG CTGATTATGG GGTCAATAAG  720GTCAATACCG CTTTTGATGG GGGCATGCCT TATAGCGATA AGTTTTCCAT CTATTTTTTT  780GCAGGGGCTT TTGGGCGCTT CCAACCCCTT AACATCTTCA TTCAAGGCAA TAGCCCTGAA  840ACTAGGGGCA TTGCCAATTT GGAATACTTT GTTTATGCCA GTGAAATAGG AGCGGCTATG  900ATGTGGCGTA GCCTCAGGGT GGCTTTTACA ATCACTGATA TTAGTAAAAC CTTTCAGTCC  960CAGCCTAAGC ACCATCAGAT CGGCACCTTA GAATTGAATT TCGCCTTTTG A          1011(2)INFORMATION FOR SEQ ID NO:25:
(i)序列特征:
    (A)长度:327个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关链词:misc_特征
    (B)位置1...327
(xi)序列描述:SEQ ID NO:25:ATGAAACCAA TCTTTAGCCT CTTTTTCCTC CTTATTGTTT TAAAAGCGCA CCCCATAAAC   60CCCTTATTAG AGCCGTTATA TTTCCCCAGT TACACGCAAT TTTTAGATTT AGAACCTCAT  120TTTGTCATTA AAAAAAAGCG CGCTTACAGG CCTTTTCAAT GGGGGAACAC TATTATTATC  180AAACGCCATG ATTTAGAAGA GCGCCAGAGC AACCAACCAA GCGATATTTT CCGCCAGAAC  240GCTGAAATCA ATGTGTCTTC TCAAACTTTT TTAAGAGGAA TCAGCAGCGC TTCTTCACGC  300ATAGTGATCG ATTCGGTCGC TCAGTAA                                327(2)INFORMATION FOR SEQ ID NO:26:
(i)序列特征:
    (A)长度:588个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...588
(xi)序列描述:SEQ ID NO:26:ATGAGCAATA ACCCCTTTAA AAAAGTGGGC ATGATCAGCT CTCAAAACAA TAACGGCGCT   60TTGAACGGGC TTGGCGTGCA AGTGGGTTAT AAACAATTCT TTGGCGAAAG CAAAAGATGG  120GGGTTAAGGT ATTATGGTTT CTTTGATTAC AACCACGGCT ATATCAAATC CAGCTTTTTT  180AATTCTTCTT CTGATATATG GACTTATGGC GGTGGGAGCG ATTTGTTAGT GAATTTTATC  240AACGATAGCA TCACAAGAAA GAACAACAAG CTTTCTGTGG GTCTTTTTGG TGGTATCCAA  300CTAGCAGGGA CTACATGGCT TAATTCTCAA TACATGAATT TAACAGCGTT CAATAACCCT  360TACAGCGCGA AAGTCAATGC TTCCAATTTC CAATTTTTGT TCAATCTCGG CTTGAGGACG  420AATCTCGCTA CAGCTAAGAA AAAAGACAGC GAACGTTCCG CGCAACATGG CGTTGAACTG  480GGCATTAAAA TCCCTACCAT TAACACCAAT TATTATTCTT TTCTAGGCAC TAAGCTAGAA  540TACAGAAGGC TTTATAGCGT GTATCTCAAT TATGTGTTTG CTTATTAA               588(2)INFORMATION FOR SEQ ID NO:27:
(i)序列特征:
    (A)长度:684个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...684
(xi)序列描述:SEQ ID NO:27:GTGCGTTTTG GTAAAATTGA TTATTTGAAC ATGCTCCCTT TTGATGTGTT TATCAAATCC   60TACCCCACCC CTTGTTATTT CAAACAATTC TTACGGCTTA AAAAAACCTA CCCCTCCAAA  120CTCAATGAGA GTTTTTTATT CAGGCGCATT GATGCGGGGT TTATTTCTTC TATCGCTGGC  180TATCCATTCG CTCTTTGTTC TTATTCTCTA GGCATTGTCG CTTATAAGGA AGTTTTAAGC  240GTGTTGGTTG TAAATAGAGA AAACGCTTTT GACAAAGAAA GCGCTTCTTC AAACGCCCTC  300TCTAAAGTGT TAGGGTTAAA AGGCGAGGTC TTAATCGGCA ATAAAGCGCT GCAATTTTAT  360TATTCCAACC CTAAAAAAGA TTTTATAGAT TTAGCCGCTC TGTGGTATGA AAAAAAACGC  420TTGCCGTTTG TTTTTGGGCG TCTGTGCTAT TATCAAAACA AGGATTTTTA CAAACGCTTG  480TCTTTAGCCT TCAAACATCA AAAAACAAAA ATCCCTCACT ACATCCTTAA AGAAGCCGCT  540TTGAAAACCA ACTTGAAACG CCAAGATATT CTAAACTACT TGCAAAAAAT TTACTACACT  600TTAGGCAAAA AGGAACAATC AGGCCTTAAA GCGTTCTATC GTGAATTGTT GTTCAAACGC  660ATCCAAAAAC CCAAGCGGTT TTAG                                         684(2)INFORMATION FOR SEQ ID NO:28:
(i)序列特征:
    (A)长度:918个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...918
(xi)序列描述:SEQ ID NO:28:ATGGGTAGAA TTGAATCAAA AAAGCGTTTG AAAGCACTCA TTTTTTTAGC GAGTTTGGGG   60GTGTTGTGGG GCAATGCGGC TGAAAAAACG CCTTTTTTTA AAACTAAAAA CCACATTTAT  120TTGGGTTTTA GGCTAGGCAC AGGGGCTACT ACGCGCACAA GCATGTGGCA ACAAGCCTAT  180AAAGACAACC CCACTTGCCC TAGCAGCGTG TGTTATGGCG AGAAATTAGA AGCCCATTAT  240AAGGGGGGTA AAAACTTATC TTATACCGGG CAAATAGGCG ATGAAATAGC TTTTGATAAA  300TACCATATTT TAGGCTTAAG GGTGTGGGGG GATGTAGAAT ACGCTAAGGC TCAATTAGGT  360CAAAAAGTGG GGGGTAACAC CCTTTTATCC CAAGCGAATT ATAACCCAAG CGCGATTAAA  420ACCTACGATC CTACTTCAAA CGCTCAAGGC TCTTTAGTTT TGCAAAAAAC CCCAAGCCCC  480CAAGATTTCC TTTTCAATAA CGGGCATTTC ATGGCGTTTG GTTTGAACGT GAACATGTTT  540GTCAATCTCC CTATAGACAC CCTTTTAAAA CTCGCTTTAA AAACGGAAAA AATGCTGTTT  600TTTAAAATAG GCGTGTTTGG TGGGGGTGGG GTGGAATACG CAATCTTGTG GAGTCCTCAA  660TATAAAAATC AAAATACCCA TCAAGACGAT AAATTTTTTG CCGCAGGTGG GGGGTTTTTT  720GTGAATTTTG GAGGCTCTTT GTATATAGGC AAGCGCAACC GCTTCAATGT GGGGCTAAAA  780ATCCCTTATT ATAGCTTGAG CGCGCAAAGT TGGAAAAATT TTGGCTCTAG CAATGTGTGG  840CAGCAACAAA CGATCCGACA AAACTTCAGC GTTTTTAGGA ATAAUGAAGT TTTTGTCAGC  900TACGCGTTCT TGTTTTAG                                                918(2)INFORMATION FOR SEQ ID NO:29:
(i)序列特征:
    (A)长度:777个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...777
(xi)序列描述:SEQ ID NO:29:ATGTTTTTAA GATCATACCC AAAGCTTAGA TACGCTTTAT GTTTACCCCT ACTCACTGAG   60ACTTGCTATA GCGAGGAGCG CACTTTAAAT AAGGTTACCA CCCAAGCTAA AAGGATTTTC  120ACTTACAATA ATGAGTTTAA GGTTACTTCT AAAGAATTGG ATCAACGCCA AAGCAATGAA  180GTCAAAGACC TGTTTAGGAC TAACCCTGAT GTGAATGTGG GCGGAGGGAG CGTGATGGGG  240CAGAAAATCT ACGTGAGAGG CATTGAAGAC AGGCTTTTAA GGGTTACGGT GGATGGGGCT  300GCGCAAAATG GCAACATCTA CCACCACCAA GGCAACACCG TGATTGACCC TGGCATGCTC  360AAAAGCGTGG AAGTTACTAA AGGCGCGGCG AATGCGAGCG CGGGGCCAGG AGCGATCGCG  420GGAGTGATTA AAATGGAGAC TAAAGGAGCG GCTGATTTTA TCCCTAGGGG GAAAAATTAT  480GCAGCGAGTG GGGCGGTGAG TTTTTATACC AATTTTGGGG ACAGAGAGAC TTTTAGATCG  540GCCTATCAAA GCGCGCATTT TGATATTATC GCTTACTACA CGCACCAAAA TATTTTCTAT  600TATAGGAGCG GCGCCACAGT GATGAAAAAC CTTTTCAAAC CCACACAAGC CGATAAAGAG  660CCAGGAACTC CCACCGAGCA AAACAACGCT TTGATTAAAA TGAATGGCTA TTTGAGCGAC  720AGAGACACGC TCACTTTCAG CTGGAACATG ACACGAGATA ACGCCACACG CCTTTAA     777(2)INFORMATION FOR SEQ ID NO:30:
(i)序列特征:
    (A)长度:579个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...579
(xi)序列描述:SEQ ID NO:30:ATGTTTTTAA GATCATACCC AAAGCTTAGA TACGCTTTAT GTTTACCCCT ACTCACTGAG   60ACTTGCTATA GCGAGGAGCG CACTTTAAAT AAGGTTACCA CCCAAGCTAA AAGGATTTTC  120ACTTACAATA ATGAGTTTAA GGTTACTTCT AAAGAATTGG ATCAACGCCA AAGCAATGAA  180GTCAAAGACC TGTTTAGGAC TAACCCTGAT GTGAATGTGG GCGGAGGGAG CGTGATGGGG  240CAGAAAATCT ACGTGAGAGG CATTGAAGAC AGGCTTTTAA GGGTTACGGT GGATGGGGCT  300GCGCAAAATG GCAACATTTA CCACCACCAA GGCAACACCG TGATTGACCC TGGCATGCTC  360AAAAGCGTGG AAGTTACTAA AGGCGCGGCG AATGCGAGCG CGGGGCCAGG AGCGATCGCG  420GGAGTGATTA AAATGGAGAC TAAAGGAGCG GCTGATTTTA TCCCTAGGGG GAAAAATTAT  480GCAGCGAGTG GGGCGGTGAG TTTTTATACC AATTTTGGGG ACAGAGAGAC TTTTAGATCG  540GCCTATCAAA GCGCGCATTT TGATATTATC GCTTACTAG                         579(2)INFORMATION FOR SEQ ID NO:31:
(i)序列特征:
    (A)长度:381个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...381
(xi)序列描述:SEQ ID NO:31:GTGCCCTTGA GTTTGGGAGG CAACCTCTTA AACCCTAACA ACAGTAGCGT GCTGAATTTA  60AAAAACAGCC AGCTTGTTTT TAGCGATCAA GGGAGCTTGA ATATCGCTAA CATTGATTTA  120CTAAGCGATC TGAATGGTAA TAAAAATCGT GTGTATAACA TCATTCAAGC GGACATGAAT  180GGTAATTGGT ATGAGCGTAT CAACTTCTTT GGCATGCGCA TTAATGATGG GATTTATGAC  240GCTAAAAACC AAACTTATAG TTTCACTAAC CCTCTCAATA ACGCCGTAAA ATTCACCGAG  300AGCTTTTTCA TACACCGCCT GTGCGGTTCG CTCTCTCAAA TACAAAAAAA AAAAAACACA  360ATAGTCTCAC CTCGGCTCTG A                                            381(2)INFORMATION FOR SEQ ID NO:32:
(i)序列特征:
    (A)长度:1698个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1698
(xi)序列描述:SEQ ID NO:32:GTGTATTCTT ATAGCGATGA CGCACAAGGC GTGTTTTATC TCACGAGCAG CGTGAAAGGC   60TATTACAACC CCAACCAATC CTATCAAGCC AGCGGCAGCA ATAACACCAC GAAAAATAAC  120AATCTAACCT CTGAATCTTC TGTCATTTCG CAAACCTATA ACGCGCAAGG CAACCCTATC  180AGCGCGTTAC ACGTCTATAA CAAGGGCTAT AATTTCAGTA ATATCAAAGC GTTAGGGCAA  240ATGGCGCTCA AACTCTACCC TGAAATCAAA AAGATATTAG GGAATGATTT TTCGCTTTCA  300AGTTTGAGCA ATTTAAAAGG CGATGCGCTA AACCAGCTTA CCAAGCTCAT CACGCCTAGC  360GATTGGAAAA ACATTAACGA GTTGATTGAT AACGCAAACA ATTCGGTCGT GCAAAATTTC  420AATAACGGCA CTTTGATTAT AGGAGCGACT AAAATAGGGC AAACAGACAC CAATAGTGCG  480GTGGTTTTTG GGGGCTTGGG CTATCAAAAG CCTTGCGATT ACACTGATAT TGTGTGCCAA  540AAATTTAGAG GCACTTATTT GGGGCAGCTT TTGGAGTCCA ACTCCGCTGA TTTGGGCTAT  600ATTGACACGA CTTTTAACGC TAAAGAAATT TATCTTACCG GCACTTTAGG GAGCGGGAAC  660GCATGGGGGA CTGGGGGGAG TGCGAGCGTA ACTTTTAACA GCCAAACTTC GCTCATTCTC  720AACCAAGCGA ATATCGTAAG CTCGCAAACC GATGGGATTT TTAGCATGCT GGGTCAAGAG  780GGCATCAATA AGGTTTTCAA TCAAGCCGGG CTCGCTAATA TTTTGGGCGA AGTGGCAATG  840CAATCCATTA ACAAAGCCGG GGGATTAGGG AATTTGATAG TAAATACGCT AGGGAGTGAT  900AGCGTGATTG GGGGGTATTT AACGCCTGAG CAAAAAAATC AAACCCTAAG CCAGCTTTTG  960GGGCAGAATA ATTTTGATAA CCTCATGAAC GATAGCGGTT TGAACACGGC GATTAAGGAT 1020TTGATCAGAC AAAAATTAGG CTTTTGGACC GGGCTAGTGG GGGGATTAGC CGGACTGGGG 1080GGCATTGATT TGCAAAACCC TGAAAAGCTT ATAGGCAGCA TGTCCATCAA TGATTTATTG 1140AGTAAAAAGG GGTTGTTCAA TCAGATCACC GGCTTTATTT CCGCTAACGA TATAGGGCAA 1200GTCATAAGCG TGATGCTGCA AGATATTGTC AAGCCGAGCG ACGCTTTAAA AAACGATGTA 1260GCCGCTTTGG GCAAGCAAAT GATTGGCGAA TTTTTAGGCC AAGACACGCT CAATTCTTTA 1320GAAAGCTTGC TGCAAAACCA GCAGATTAAA AGCGTTTTAG ACAAAGTCTT AGCGGCTAAA 1380GGATTAGGGT CTATTTATGA ACAAGGTTTG GGGGATTTGA TCCCTAATCT TGGTAAAAAG 1440GGGATTTTCG CTCCCTATGG CTTGAGTCAA GTGTGGCAAA AAGGGGATTT TAGTTTCAAC 1500GCGCAAGGCA ATGTTTTTGT GCAAAATTCC ACTTTCTCTA ACGCTAATGG AGGCACGCTC 1560AGTTTTAACG CAGGAAATTC GCTCATTTTT GCCGGAAACA ACCACATCGC TTTCACTAAC 1620CATTCTGGAA CGCTCAATTT GTTGTCTAAT CAAGTTTCTA ACATTAACGT CACCATGCTT 1680AACGCAGCAA CGGCCTAA                                               1698(2)INFORMATION FOR SEQ ID NO:33:
(i)序列特征:
    (A)长度:519个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...519
(xi)序列描述:SEQ ID NO:33:GTGTTTGGAT TGAGTTTGGC GGATATGATT TTAGAGCGTT TTAAAGATTT TATGAGAGAA   60TACCCTGAGC CTTACAAGTT TTTACAGGTT TTTTACGCGC AAGAAAAAGA ACGCTTCTTA  120AATCATAAAA TGAACGATTA TATCAAGCAA AATAAGAGCA AGGAAGAGGC TAGTATTTTG  180GCCAGACAAG GCTTTGTCAG CGTAATTGGA AGAGCGTTAG AAAAAATCAT AGAACTTTTA  240TTAAAAGATT TTTGTATTAA AAACAATGTA AAAATGACGA ACGATAAAAC CTTAAGGGCT  300AAGCGCATTA ATGGCGAATT AGATAAGGTC AAACGGGCTT TATTGGTGCA TTTTGGAGGA  360TATAGCGTTT TACCCGATAT TATTCTTTAT CAAACCAACA AAGATAATAT CAAAATCCTA  420GCGATTTTAT CGGTAAAAAA TTCGTTTAGA GAGCGTTTCA CAAAAGACGC CTTATTGGAA  480ATTAAAACTT TTGCAATCGC CTGTAACTTC TCACATTAA                         519(2)INFORMATION FOR SEQ ID NO:34:
(i)序列特征:
    (A)长度:996个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...996
(xi)序列描述:SEQ ID NO:34:ATGAAAAGAT TTGTTTTATT CTTGTTATTC ATATGTGTTT GCGTTTGCGT TCAAGCTTAC   60GCTGAGCAAG ATTACTTTTT TAGGGATTTT AAATCTATAG ATTTGCCCCA AAAACTCCAC  120CTTGATAAAA AGCTCTCCCA AACAATACAG CCATGCGCGC AACTTAACGC ATCAAAACAC  180TACACTGCTA CTGGGGTTAG AGAGCCTGAT GCCTGCACCA AGAGTTTTAA AAAATCCGCT  240ATGGTTTCCT ATGATTTAGC GCTAGGCTAT TTAGTGAGCC AAAACAAACC ATACGGCTTA  300AAAGCTATAG AGATTTTAAA CGCTTGGGCT AATGAGCTTC AAAGCGTGGA TACTTATCAA  360AGCGAGGACA ATATCAATTT TTACATGCCT TATATGAACA TGGCTTATTG GTTTGTCAAA  420AAAGAATTTC CTAGCCCAGA ATATGAAGAT TTCATTAGGC GGATGCGTCA GTATTCTCAA  480TCAGCTCTTA ACACTAACCA TGGGGCGTGG GGGATTCTCT TTGATGTGAG CTCTGCACTA  540GCGCTAGATG ATCATGCCCT TTTGCAAAGT AGCGCTAATC GGTGGCAGGA GTGGGTGTTT  600AAAGCCATAG ATGAGAACGG GGTTATTGCT AGCGCGATCA CTAGGAGCGA TACGAGCGAT  660TATCATGGCG GCCCTACAAA GGGCATTAAG GGGATAGCTT ATACCAATTT TGCGCTTCTT  720GCGATAACTA TATCAGGCGA ATTGCTTTTT GAGAACGGGT ATGATTTGTG GGGTAGTGGA  780GCCGGGCAAA GGCTCTCTGT GGCGTATAAC AAAGCCGCAA CATGGATTCT AAACCCTGAA  840ACTTTCCCCT ATTTTCAGCC TAACCTCATT GGGGTGCATA ACAACGCCTA TTTCATTATT  900TTAGCCAAAC ATTATTCTAG CCCTAGCGCG GATGAGCTTT TAGAGCAAGG CGATTTGCAT  960GAAGATGGCT TCAGGCTGAA ACTCCGATCG CCATGA                            996(2)INFORMATION FOR SEQ ID NO:35:
(i)序列特征:
    (A)长度:384个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...384
(xi)序列描述:SEQ ID NO:35:ATGCGTCAGT ATTCTCAATC AGCTCTTAAC ACTAACCATG GGGCGTGGGG GATTCTCTTT   60GATGTGAGCT CTGCACTAGC GCTAGATGAT CATGCCCTTT TGCAAAGTAG CGCTAATCGG  120TGGCAGGAGT GGGTGTTTAA AGCCATAGAT GAGAACGGGG TTATTGCTAG CGCGATCACT  180AGGAGCGATA CGAGCGATTA TCATGGCGGC CCTACAAAGG GCATTAAGGG GATAGCTTAT  240ACCAATTTTG CGCTTCTTGC GATAACTATA TCAGGCGAAT TGCTTTTTGA GAACGGGTAT  300GATTTGTGGG GTAGTGGAGC CGGGCAAAGG CTCTCTGTGG CGTATAACAA AGCCGCAACA  360TGGATTCTAA ACCCTGAAAC TTTC                                         384(2)INFORMATION FOR SEQ ID NO:36:
(i)序列特征:
    (A)长度:738个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...738
(xi)序列描述:SEQ ID NO:36:TTGAGAACCT TGTTAAAAAT GTTGGTTGGT GTGAGCTTAC TAACACACGC TTTAATGGCT   60ACAGAAGAAA GCGCTGCCCC TTCTTGGACA AAAAATTTGT ATATGGGATT CAATTACCAA  120ACAGGTTCTA TCAATTTAAT GACTAATATT CATGAAGTTA GAGAAGTTAC TAGCTATCAA  180ACCGGTTACA CCAATGTAAT GACTAGCATT AATAGCGTTA AAAAACTCAC TAACATGGGT  240TCTAATGGGA TTGGCTTAGT CATGGGCTAT AACCACTTTT TCCATCCGGA TAAAGTCTTG  300GGTTTGCGCT ATTTTGCTTT TTTAGATTGG CAAGGCTATG GCATGAGATA CCCTAAAGGC  360TATTATGGGG GCAATAACAT GATCACTTAT GGCGTGGGCG TGGATGCGAT ATGGAATTTC  420TTCCAAGGGA GTTTTTATCA AGATGATATT GGCGTGGATA TTGGCGTTTT TGGGGGGATT  480GCGATTGCTG GGAATAGCTG GTATATTGGC AATAAAGGGC AGGAATTATT AGGCATCACC  540AATAGTAGTG CGGTTGATAA CACCTCTTTT CAATTCCTCT TTAACTTTGG TTTCAAAGCT  600TTATTTGTAG ATGAACATGA ATTTGAAATT GGGTTTAAAT TCCCCACTCT TAACAACAAA  660TACTACACCA CCGACGCGCT CAAGGTTCAA ATGCGTAGGG TCTTTGCCTT TTATGTGGGG  720TATAATTACC ACTTCTAA                                                738(2)INFORMATION FORSEQ ID NO:37:
(i)序列特征:
    (A)长度:873个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...873
(xi)序列描述:SEQ ID NO:37:ATGTTTGAAG AAATTACCCT AGCGCATAAG GACTTGTTTT CAAGGTTTTT ACAAACTCAA   60AAAATCGTTT TATCGGATGT GAGTTTTACC AATTGCTTTT TATGGCAGCA CGCAAGGCTC  120ATTCAAGTGG CTGTGATTAG GGATTGTTTG GTGATTCAAA CCACTTATGA AAACCAAAAA  180CCCTTTTATT TCTATCCTAT CGGTAAGAGG CCGCATGAAT GCGTGAAAGA GCTTTTGGAA  240TTAGAAAAAA ATTTAAGATT CCACTCCCTG ACTTTAGAGC AAAAAGACGA TTTGAAAGAC  300AATTTTGTAG GGGTGTTTGA TTTCACTTAC AACCGAGACA GGAGCGATTA TGTTTATTCT  360ATTGAAGAAC TAATCGCGCT CAAAGGGAAA AAATACCATA AGAAAAAAAA CCACTTAAAC  420CAGTTTTTAA CCAATCATGC GAATTTTGTT TATGAAAAAA TTTCTCCTCA AAACAGAAAG  480GAAGTTTTAG AAGCCTCTAA AGCGTGGTTT TTAGAAAGCC AGACCGATGA TATAGGGTTA  540ATCAACGAAA ATAAGGGCAT TCAAAGCGTT TTAGAAAATT ATGAAAGCTT GGATTTAAAG  600GGGGGGCTTA TTAGGGTTAA TGGGGAAATA GTCTCGTTTA GTTTTGGGGA AGTTTTAAAC  660GAAGAGAGCG CGCTCATCCA CATTGAAAAA GCCCGCACAG ATATTGCAGG CGCGTATCAA  720ATCATCAACC AACAATTGCT TTTGAATGAA TTTAGCCATT TAACTTACGC TAACAGAGAA  780GAAGATCTAG GATTAGAGGG CTTAAGAAGG TCTAAAATGA GCTATAACCC GGTGTTTTTG  840ATAGACAAAT ACGAAGCGGT TGCTAGAAAT TAA                               873(2)INFORMATION FOR SEQ ID NO:38:
(i)序列特征:
    (A)长度:333个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...333
(xi)序列描述:SEQ ID NO:38:ATGATGTTCA TTGTAGCGGT TTTGATGCTG GCGTTTTTGA TCTTTGTCCA TGAGTTAGGG   60CATTTCATTA TCGCTAGGAT TTGTGGGGTG AAAGTGGAAG TGTTTAGCAT TGGTTTTGGT  120AAAAAACTCT GGTTTTTCAA GCTTTTTGGC ACGCAATTCG CTCTGTCTTT GATCCCGCTT  180GGGGGCTATG TGAAATTAAA GGGCATGGAT AAAGAAGAAA ATGAAGAAAA TAAAATTAAT  240CAAGCGAATG ATAGCTACGC CAAAAAAGCC CTTTCCAAAA GCTATGGATA TTGTTTGGTG  300GGGCGTTTTT TAATTTTCTT TTTGCGGTTT TAG                               333(2)INFORMATION FOR SEQ ID NO:39:
(i)序列特征:
    (A)长度:1056个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1056
(xi)序列描述:SEQ ID NO:39:ATGATGTTCA TTGTAGCGGT TTTGATGCTG GCGTTTTTGA TCTTTGTCCA TGAGTTAGGG   60CATTTCATTA TCGCTAGGAT TTGTGGGGTG AAAGTGGAAG TGTTTAGCAT TGGTTTTGGT  120AAAAAACTCT GGTTTTTCAA GCTTTTTGGC ACGCAATTCG CTCTGTCTTT GATCCCGCTT  180GGGGGCTATG TGAAATTAAA GGGCATGGAT AAAGAAGAAA ATGAAGAAAA TAAAATTAAT  240CAAGCGAATG ATAGCTACGC GCAAAAAAGC CCTTTCCAAA AGCTATGGAT ATTGTTTGGT  300GGGGCGTTTT TTAATTTTCT TTTTGCGGTT TTAGTGTATT TTTTTCTGGC ATTGAGCGGG  360GAAAAAGTCT TACTGCCCGT CATTGGCGGT TTAGAAAAAA ACGCGCTAGA AGCCGGGCTG  420TTAAAGGGGG ATAGAATCCT TTCTATCAAC CATCAAAAAA TAGCGAGTTT TAGAGAGATT  480AGAGAGATAG TGGCGCGTTC TCAAGGCGAG TTAATTTTAG AAATAGAGCG AAACAATCAG  540ATTTTAGAAA AACGACTGAC CCCCAAAATC GTGGCGGTGA TAAGCGAGTC TAATGATCCT  600AATGAAATCA TCAAGTATAA AATAATAGGC ATTAAACCGG ACATGCAAAA AATGGGCGTT  660GTCTCTTATT CCGTGTTTCA AGCGTTTGAA AAGGCTTTGA GTCGGTTTAA AGAGGGCGTT  720GTTTTGATTG TGGATTCTTT AAGGCGTTTG ATTATGGGGA GCGCTTCAGT TAAAGAATTG  780AGTGGGGTAA TAGGCATTGT GGGGGCGTTA AGCCATGCCA ATAGCGTGAG CATGCTTTTG  840TTGTTTGGGG CGTTTTTATC TATCAATCTA GGGATTTTAA ATTTATTACC CATTCCAGCC  900TTAGATGGGG CGCAAATGCT AGGGGTCGTT TTTAAAAATA TTTTTCATAT CGCTTTGCCA  960ACGCCCATAC AAAATGCGTT GTGGCTAGTG GGGGTGGGGT TTTTGGTTTT TGTCATGTTT 1020TTAGGGCTTT TTAATGACAT TACTCGTTTG CTATAA                           1056(2)INFORMATION FOR SEQ ID NO:40:
(i)序列特征:
    (A)长度:303个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...303
(xi)序列描述:SEQ ID NO:40:ATGCAAAAGA ATTTGGATAG TCTTTTAGAA AATTTAAGGG CTGAAATTGA TGCGTTGGAT   60AATGAATTGA GCGATCTTTT AGACAAACGC TTAGGAATCG CTTTAAAAAT CGCTCTCATC  120AAACAAGAAA GCCCCCAAGA AAACCCCATT TATTGCCCTA AAAGAGAGCA AGAGATTTTA  180AAACGACTCA GCCAAAGGGG TTTCAAGCAT TTGAATGGAG AAATCCTTGC AAGTTTTTAT  240GCAGAGGTTT TTAAGATTTC TAGAAATTTT CAAGAAAACG CCCTAAAAGA GTTAAAAAAA  300TAA                                                                303(2)INFORMATION FOR SEQ ID NO:41:
(i)序列特征:
    (A)长度:525个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...525
(xi)序列描述:SEQ ID NO:41:GTGAAAATGC GTTTTTTTAG TGGTTTTGGG TTTGTTAATG AAAGCGTTTT GTTTGAAGAG   60TGGCTTTTAA AAGGGGCTTA TGATGTGTCA GGCTTTTCTA TGGGGGCGAT TAAGGCGATA  120GAATACGCCT ATAATGAAGT CTTGCAACAA CGGCGCATCC ATTCCTTATT GTTGTTTTCG  180CCTTGCATGC TAGCGCATAA GAGTTTGGCG TTCAAACGCT TGCAACTTTT CTTGTTTCAA  240AAAGATCCGC AAAGCTACAT GGATAACTTT TATAAGGAAG TGGGATTGGA CGCTCAATTG  300GAGCGTTTTA AAAAAGAGGG TTCTTTAGAA GAATTGGAAT TTTTATTGGA TTACAAGTAT  360AGTGATTCTA TAATTAGATT TTTATTGGAA AAGGGCGTGA AGATTGAAGT GTTTATCGGT  420TTAAAAGATA GAATCACTGA CATTCAAGCC CTTTTAGAAT TTTTTATGCC CTTAGTTCAA  480GTGTGGCAGT TTAAGGATTG TAACCATTTG TTGCAAAAAT CTTAA                  525(2)INFORMATION FOR SEQ ID NO:42:
(i)序列特征:
    (A)长度:1416个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
(B)位置1...1416
(xi)序列描述:SEQ ID NO:42:ATGAAAAATA CCAATACAAA AGAGATAAAG AATACAAGGA TGAAAAAAGG TTATAGTCAA   60TACCACACGC TCAAAAAAGG GCTTTTAAAA ACCGCTCTGC TTTTTAGCCT TCCTTTAAGC  120GTGGCGTTAG CTGAAGACGA TGGCTTTTAT ATGGGAGTGG GCTATCAAAT CGGCGGCGCG  180CAACAAAACA TCAACAACAA AGGCAGCACC CTAAGGAATA ATGTCATTGA TGATTTCCGC  240CAAGTGGGCG TGGGTATGGC AGGGGGTAAT GGGCTTTTAG CTTTAGCGAC AAACACGACC  300ATGGACGGTC TTTTAGGGAT AGGCAACCAA ATTGTCAATA CTAATACAAC TGTTGGCAAC  360AACAACGCAG AGTTAACCCA GTTTAAAAAA ATACTCCCCC AAATTGAACA ACGCTTTGAG  420ACGAATAAAA ACGCTTATAG CGTTCAAGCC TTGCAAGTGT ATTTGAGTAA TGTGCTTTAT  480AACTTGGTTA ATAATAGTAA TAATGGTAGG AATAATGGAG TCGTTCCTGA ATATGTAGGG  540ATTATAAAAG TTCTCTATGG TTCTCAAAAT GAATTCAGTC TCTTAGCCAC GGAGAGTGTG  600GCGCTTTTAA ACGCGGTCAC GAGAGTGAAT CTGGATAGTA ATTCGGTGTT TTTAAAAGGG  660CTATTAGCCC AAATGGAGCT TTTTAATGAC ACTTCTTCAG CAAAGCTAGG TCAGATCGCA  720GAAAACTTGA AGAACGGTGG TGCAGGGGCC ATGCTTCAAA AGGATGTGAA AACCATCTCG  780GATCGAATCG CTACTTACCA AGAGAATCTA AAACAGCTAG GAGGGATGTT AAAGAATTAC  840GATGAGCCAT ACCTACCCCA ATTTGGGCCA GGCACAAGCT CTCAGCATGG GGTTATTAAT  900GGCTTTGGCA TTCAAGTGGG CTATAAGCAA TTTTTTGGGA GCAAGAAGAA TATAGGCTTA  960CGATATTACG CTTTCTTTGA TTATGGCTTT ACGCAATTGG GCAGTCTTAA CAGTGCTGTT 1020AAAGCGAACA TCTTTACTTA TGGTGCTGGC ACGGACTTTT TATGGAATAT CTTTAGAAGG 1080GTTTTTAGCG ATCAGTCCTT GAATGTGGGG GTGTTTGGGG GCATTCAAAT AGCGGGTAAC 1140ACTTGGGATA GCTCTTTAAG AGGTCAAATT GAAAACTCGT TTAAAGAATA CCCCACTCCC 1200ACGAATTTCC AATTTTTGTT TAATTTGGGC TTAAGGGCTC ATTTTGCCAG CACCATGCAC 1260CGCCGGTTTT TGAGCGCGTC TCAAAGCATT CAGCATGGTA TGGAATTTGG CGTGAAAATC 1320CCAGCTATCA ATCAAAGGTA TTTGAAAGCG AATGGGGCTG ATGTGGATTA CAGGCGTTTG 1380TATGCGTTCT ATATCAATTA CACGATAGGT TTTTAA                           1416(2)INFORMATION FOR SEQ ID NO:43:
(i)序列特征:
    (A)长度:390个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...390
(xi)序列描述:SEQ ID NO:43:ATGAAAAGCA TCAGAAGAGG CGATGGGCTG AATGTTGTCC CTTTCATTGA TATTATGCTC   60GTCTTACTAG CGATTGTGTT GAGTATTTCT ACTTTTATCG CGCAAGGTAA GATTAAAGTC  120AGTCTCCCTA ACGCTAAAAA TGCGGAAAAA TCCCAGCCAA ACGATCAAAA AGTGGTGGTC  180ATCTCTGTGG ATGAGCATGA CAATATTTTC GTAGATGACA AACCGACGAA TTTAGAAGCT  240TTGAGCGCTG TAGTCAAGCA AACAGACCCT AAAACCCTTA TAGATTTAAA AAGCGACAAG  300AGCTCTCGTT TTGAAACTTT TATCAGCATT ATGGATATTT TAAAAGAGCA TAATCATGAA  360AATTTCTCCA TCTCCACGCA AGCTCAGTAA                                   390(2)INFORMATION FOR SEQ ID NO:44:
(i)序列特征:
    (A)长度:225个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...225
(xi)序列描述:SEQ ID NO:44:ATGCTCGTCT TACTAGCGAT TGTGTTGAGT ATTTCTACTT TTATCGCGCA AGGTAAGATT   60AAAGTCAGTC TCCCTAACGC TAAAAATGCG GAAAAATCCC GACCAAACGA TCAAAAAGTG  120GTGGTCATCT CTGTGGATGA GCATGACAAT ATTTTCGTAG ATGACAAACC GACGAATTTA  180GAAGCTTTGA GCGCTGTAGT CAAGCAAACA GACCCTAAAA CCCTT                  225(2)INFORMATION FOR SEQ ID NO:45:
(i)序列特征:
    (A)长度:672个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...672
(xi)序列描述:SEQ ID NO:45:ATGTTTTCAC TTTCTTATGT TTCCAAGAAA TTTTTAAGCG TGTTGCTATT GATTTCGCTG   60TTTTTAAGCG CTTGCAAATC CAACAATAAA GACAAATTGG ATGAAAATCT TTTAAGCTCC  120GGCACTCAAA GCTCCAAAGA ATTAAACGAC AAGCGAGACA ATATAGACAA AAAGAGCTAC  180GCTGGTTTAG AAGATGTTTT TTTAGACAAC AAGTCCATTA GCCCTAATGA TAAATACATG  240CTTTTAGTTT TTGGCCGTAA TGGTTGCTCC TATTGTGAAA GGCTTAAAAA AGATCTCAAA  300AATGTCAAAG AATTGCGCAA CTATATTAAA GAGCATTTTA GTGCTTACTA TGTCAATATC  360AGCTATTCTA AAGAGCATAA TTTTAAAGTC GGCGATAAGG ATAAAAATGA TGAAAAAGAA  420ATCAAAATGT CCACAGAAGA ATTAGCGCAA ATTTATGCCG TCCAATCCAC CCCTACGATT  480GTTTTATCCG ATAAAACCGG CAAAACCATC TATGAATTGC CGGGCTATAT GCCTTCTGTG  540CAATTTTTAG CCGTGTTAGA ATTTATCGGC GATGGGAAGT ATCAAGACAC GAAAAACGAT  600GAGGATCTCA CTAAAAAATT AAAGGCTTAC ATCAAGTATA AAACCAACCT TTCTAAGAGC  650AAGTCCAGCT AG                                                      672(2)INFORMATION FOR SEQ ID NO:46:
(i)序列特征:
    (A)长度:351个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...351
(xi)序列描述:SEQ ID NO:46:TTGATGAAAT CTAAAATCAC TCATTTTATC GTTATCTCTT TTGTTTTAAG CGTGTTGAGC   60GCCTGCAAAG ATGAGCCTAA AAAATCGTCC CAATCGCACC AAAACAACAC TAAAACCACT  120CAAAACAATC AAATCAATCA ACCTAATAAG GATATAAAAA AGATTGAGCA TGAAGAAGAA  180GATGAAAAAG TCACCAAAGA AGTGAATGAT CTGATCAATA ACGAAAATAA AATTGATGAA  240ATCAATAATG AAGAAAACGC TGATCCTTCG CAAAAAAGAA CGAACAATGT TTTGCAACGA  300GCCACTAACC ACCAAGACAA TCTCAGTTCC CCACTCAACA GGAAGTATTA A           351(2)INFORMATION FOR SEQ ID NO:47:
(i)序列特征:
    (A)长度:240个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...240
(xi)序列描述:SEQ ID NO:47:ATGTTTGAAA AAATACGCAA GATTTTAGCG GATATTGAAG ATTCGCAAAA TGAAATTGAA   60ATGCTTTTAA AATTAGCGAA TTTGAGTTTG GGGGATTTTA TTGAGATTAA AAGAGGGAGC  120ATGGACATGC CAAAGGGCGT GAATGAAGCG TTTTTTACGC AATTAAGCGA AGAAGTGGAG  180CGCCTAAAGG AGCTTATCAA CGCTTTGAAT AAAATCAAAA AAGGGTTATT GGTGTTTTAA  240(2)INFORMATION FOR SEQ ID NO:48:
(i)序列特征:
    (A)长度:156个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...156
(xi)序列描述:SEQ ID NO:48:ATGTCTATGT TCATTTCTAA TCTGGCTTTC ACGAGCGAAC ATAAGGACGC TATGGAAGTG   60GCAAAAATTG CGATTTTACT CGGATCTTTG ATTTCTGGGA TCATAGGGGC TTTATATTTA  120TTCGCACTAG ATAAAAGAGC GGCTTTAAAG AAATAG                            156(2)INFORMATION FOR SEQ ID NO:49:
(i)序列特征:
    (A)长度:1350个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1350
(xi)序列描述:SEQ ID NO:49:ATGGGTTTGA AAATAAAAAT TTTAAGGTTG TCTATGAATC TCAAAAAAAC AGAAAACGCG   60CTCAGTTTGA CGCTTAAAAA CTTCATTAAA AGCGAGTCTT TTGGAGGGAT TTTCCTCTTT  120TTGAACGCCG TTTTAGCGAT GGTGGTGGCT AATTCGTTTT TAAAAGAAAG TTATTTTGCG  180CTATGGCACA CCCCTTTTGG GTTTCAAGTA GGGGATTTTT TTATCGGCTT TAGTTTGCAC  240AACTGGATTG ATGATGTCTT AATGGCGTTA TTCTTTTTAA TGATAGGCTT AGAGATCAAG  300CGAGAATTGT TGTTTGGGGA ATTATCCAGT TTTAAAAAAG CTTCTTTCCC TGTGATCGCA  360GCCATAGGGG GCATGATAGC TCCAGGATTG ATTTATTTTT TTCTTAACGC CAACACGCCC  420TCTCAGCATG GTTTTGGGAT CCCTATGGCA ACGGATATTG CGTTCGCTTT AGGCGTGATC  480ATGCTTTTAG GCAAGAGGGT GCCAACCGCC TTAAAGGTTT TTTTAATCAC TCTAGCGGTG  540GCTGATGACT TAGGGGCTAT TGTGGTGATC GCGCTCTTTT ATACCACGAA TTTAAAATTC  600GCATGGCTTT TAGGGGCTTT AGGGGTGGTT CTTGTTTTAG CCATATTGAA CCGCCTGAAT  660ATCCGATCGC TCATCCCTTA CTTGCTTTTA GGGGTGTTGC TTTGGTTTTG CGTGCATCAA  720AGCGGTATCC ATGCGACGAT CGCTGCGGTG GTTCTAGCTT TTATGATACC GGTGAAAATC  780CCTAAAGATT CTAAAAATGT AGAGCTTTTG GAATTAGGCA AACGATACGC AGAGACGAGT  840TCAGGAGTGC TTTTAACCAA AGAGCAGCAA GAAATCTTGC ATTCTATTGA AGAAAAAGCG  900AGTGCTTTAC AAAGCCCCTT AGAAAGATTG GAGCATTTTC TAGCCCCCAT CAGCGGGTAT  960TTCATCATGC CCTTATTCGC GTTTGCAAAC GCTGGGGTGA GCGTTGATTC TAGCATCAAT 1020TTAGAAGTGG ATAAGGTGCT TTTAGGGGTT ATTTTAGGGC TTTGTTTGGG CAAGCCTTTA 1080GGGATTTTCT TAATCACTTT CATAAGCGAA AAGCTTAAAA TCACTGCGCG CCCTAAAGGC 1140ATCGGCTGGT GGCATATTTT AGGGGCTGGG CTTTTAGCAG GGATTGGCTT TACCATGTCT 1200ATGTTCATTT CTAATCTGGC TTTCACGAGC GAACATAAGG ACGCTATGGA AGTGGCAAAA 1260ATTGCGATTT TACTCGGATC TTTGATTTCT GGGATCATAG GGGCTTTATA TTTATTCGCA 1320CTAGATAAAA GAGCGGCTTT AAAGAAATAG                                  1350(2)INFORMATION FOR SEQ ID NO:50:
(i)序列特征:
    (A)长度:2448个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...2448
(xi)序列描述:SEQ ID NO:50:ATGAATGACA AGCGTTTTAG AAAATATTGT AGTTTTTCTA TTTTTTTGTC CTTATTAGGA   60ACGTTTGAAT TAGAGGCTAA AGAAGAAGAA AAAGAAGAAA AAAAGACAGA AAGGAACAAA  120GATAAAGAAA AGAACGCCCA ACACACTTTG GGTAAAGTTA CCACTCAAGC GGCTAAAATC  180TTTAATTACA ACAACCAGAC AACCATTTCA AGTAAAGAAT TAGAAAGAAG GCAAGCCAAC  240CAAATCAGCG ACATGTTTAG AAGAAACCCC AATATCAATG TGGGCGGTGG TGCGGTGATA  300GCGCAAAAAA TTTACGTGCG CGGTATTGAA GACAGATTGG CTAGGGTTAC GGTGGATGGC  360GTGGCGCAAA TGGGCGCAAG CTATGGGCAT CAAGGCAATA CAATCATTGA CCCTGGAATG  420CTCAAAAGCG TGGTGGTTAC CAAGGGGGCG GCTCAAGCGA GCGCGGGGCC TATGGCTTTA  480ATTGGCGCGA TCAAAATGGA GACTAGGAGC GCGAGCGATT TTATCCCTAA AGGCAAAGAC  540TACGCCATAA GTGGGGCTGC CACTTTTTTA ACCAACTTTG GGGATAGGGA AACCATTATG  600GGCGCTTATC GTAACCATCA TTTTGATGCG CTTTTGTATT ACACGCACCA AAATATTTTT  660TATTATCGTG ATGGGGATAA CGCGATGAAA AATCTTTTTG ACCCTAAAGC GGATAATAAA  720GTTACAGCAA GCCCTAGCGA ACAAAACAAT GTGATGGCTA AGATCAATGG TTATTTGAGC  780GAAAGGGATA CCTTAACGCT CAGTTATAAC ATGACTAGAG ATAACGCCAA TCGCCCTTTA  840AGAGCGAATT TTACCGGCAC TTTTTTACCC TATTCTTGTG GTGATTTCAA CGCTTTCCCT  900AACGAGAAAA ACCCTAGCGA TTGTTTGTTT GAAAATGACG CCAGTTTGTT TAAAACTTAT  960AGCGTCAATT TAGTGCATAA CGTGAGCTTG AATTATGAAA GGGAAGGGGG GAGTCGCTTT 1020GGCGATCCTA AATTAAAAAT CAATGGCTAC ACGAGCATTA GGAATGTCCA AATTGATCCG 1080CTTTTCAGAC CTAGCGATAT AGCGACTACC ATTCCTTTCA CCCCAAACCC GCAGCTCTCT 1140CAAGGCGAAG AAAATCAATG CGTGGCGCAA GGGGGCATTT ATGACGCTCT TAAACAAACT 1200TGCTCCATCA CTTTTAAAAG CCTTGGAGGG GGTTCTGTTG TCGCTAATAA AAATTTATTC 1260ATCATCAATT CTGGGTTTAA TGCGAACGTG ATCCACACCA TAGACCACAA GAATGACAAT 1320CTTTTGGAAT ACGGGTTGAA TTACCAGAAT TTAACCACTT TTGATAAAGC GATCCCTGAT  1380AGCGAATTAG TCAAGCCCGG CGATGCCCCT GATGCGTGCT TAAGAGTTAC AGGACCTGAT  1440GATCCTAACA TGAACGGGCG CTGCCAACGG AATGGCGCTA CGGCGAATGT GGTTGGGGTG  1500TATGCGCAAG CGAATTACAC CTTGCACCCT ATGGTAACTT TAGGGGCAGG GACTCGTTAT  1560GACGTTTATA CTTTAGTGGA TAAAGACTGG CAATTGCACG TAACTCAAGG GTTTAGCCCT  1620AGCGCGGCTT TAAACGTCTC GCCTTTAGAA AATTTGAATT TCAGGCTTTC TTACGCGTAT  1680GTAACTAGAG GCCCTATGCC TGGAGGTTTG GTGTGGATGC GTCAAGACAA TTTGCGCTAT  1740AACCGCAATT TAAAGCCAGA AATTGGGCAA AATGCGGAAT TTAACACCGA ATACAGCAGT  1800CAGTATTTTG ATTTCAGAGC CGCCGGTTTT GTCCAATTGA TTTCTAATTA CATCAATCAA  1860TTTTCTTCAA CGCTTTTTGT CACCAACTTG CCCGCACAAG ATATTATTTA TGTGCCTGGC  1920TATGAAGTTT CAGGGACGGC TAAATACAAG GGTTTTTCTT TAGGCTTGAG CGTGGCGCGA  1980TCATGGCCTT CTTTAAAAGG GCGTTTGATC GCTGACGTGT ATGAATTGGC GGCTACGACA  2040GGCAATGTGT TTATTTTAAC GGCAAGCTAT ACAATCCCAC GCACCGGCCT TAGCATCACT  2100TGGCTTTCAC GCTTTGTTAC TAATTTGAGT TATTGCTCTT ATAGCCCTTA TCGTAACGGC  2160CCTACGGATA TTGACAGAAG GCCTAGTAAT TGCCCTAAAA CGCCCGGGAT TTTTCATGTG  2220CATAAACCCG GCTATGGGGT GAGCAGTTTC TTTATCACTT ACAAGCCTAC TTATAAGAAA  2280CTCAAAGGGT TGAGCCTGAA CGCGGTGTTT AATAATGTTT TTAACCAACA ATATATTGAT  2340CAAGCAAGCC CGGTGATGAG CCCTGATGAA CCCAATCAAG ACAAATACGC AAGGGGCATG  2400GCAGAGCCTG GCTTTAACGC TAGGTTTGAA ATTTCTTATA AGTTTTAA               2448(2)INFORMATION FOR SEQ ID NO:51:
(i)序列特征:
    (A)长度:2445个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...2445
(xi)序列描述:SEQ ID NO:51:ATGACAAGCG TTTTAGAAAA ATATTGTAGT TTTTCTATTT TTTTGTCCTT ATTAGGAACG    60TTTGAATTAG AGGCTAAAGA AGAAGAAAAA GAAGAAAAAA AGACAGAAAG GAACAAAGAT   120AAAGAAAAGA ACGCCCAACA CACTTTGGGT AAAGTTACCA CTCAAGCGGC TAAAATCTTT   180AATTACAACA ACCAGACAAC CATTTCAAGT AAAGAATTAG AAAGAAGGCA AGCCAACCAA   240ATCAGCGACA TGTTTAGAAG AAACCCCAAT ATCAATGTGG GCGGTGGTGC GGTGATAGCG   300CAAAAAATTT ACGTGCGCGG TATTGAAGAC AGATTGGCTA GGGTTACGGT GGATGGCGTG   360GCGCAAATGG GCGCAAGCTA TGGGCATCAA GGCAATACAA TCATTGACCC TGGAATGCTC   420AAAAGCGTGG TGGTTACCAA GGGGGCGGCT CAAGCGAGCG CGGGGCCTAT GGCTTTAATT   480GGCGCGATCA AAATGGAGAC TAGGAGCGCG AGCGATTTTA TCCCTAAAGG CAAAGACTAC   540GCCATAAGTG GGGCTGCCAC TTTTTTAACC AACTTTGGGG ATAGGGAAAC CATTATGGGC   600GCTTATCGTA ACCATCATTT TGATGCGCTT TTGTATTACA CGCACCAAAA TATTTTTTAT   660TATCGTGATG GGGATAACGC GATGAAAAAT CTTTTTGACC CTAAAGCGGA TAATAAAGTT   720ACAGCAAGCC CTAGCGAACA AAACAATGTG ATGGCTAAGA TCAATGGTTA TTTGAGCGAA   780AGGGATACCT TAACGCTCAG TTATAACATG ACTAGAGATA ACGCCAATCG CCCTTTAAGA   840GCGAATTTTA CCGGCACTTT TTTACCCTAT TCTTGTGGTG ATTTCAACGC TTTCCCTAAC   900GAGAAAAACC CTAGCGATTG TTTGTTTGAA AATGACGCCA GTTTGTTTAA AACTTATAGC   960GTCAATTTAG TGCATAACGT GAGCTTGAAT TATGAAAGGG AAGGGGGGAG TCGCTTTGGC  1020GATCCTAAAT TAAAAATCAA TGGCTACACG AGCATTAGGA ATGTCCAAAT TGATCCGCTT  1080TTCAGACCTA GCGATATAGC GACTACCATT CCTTTCACCC CAAACCCGCA GCTCTCTCAA  1140GGCGAAGAAA ATCAATGCGT GGCGCAAGGG GGCATTTATG ACGCTCTTAA ACAAACTTGC  1200TCCATCACTT TTAAAAGCCT TGGAGGGGGT TCTGTTGTCG CTAATAAAAA TTTATTCATC  1260ATCAATTCTG GGTTTAATGC GAACGTGATC CACACCATAG ACCACAAGAA TGACAATCTT  1320TTGGAATACG GGTTGAATTA CCAGAATTTA ACCACTTTTG ATAAAGCGAT CCCTGATAGC  1380GAATTAGTCA AGCCCGGCGA TGCCCCTGAT GCGTGCTTAA GAGTTACAGG ACCTGATGAT  1440CCTAACATGA ACGGGCGCTG CCAACGGAAT GGCGCTACGG CGAATGTGGT TGGGGTGTAT  1500GCGCAAGCGA ATTACACCTT GCACCCTATG GTAACTTTAG GGGCAGGGAC TCGTTATGAC  1560GTTTATACTT TAGTGGATAA AGACTGGCAA TTGCACGTAA CTCAAGGGTT TAGCCCTAGC  1620GCGGCTTTAA ACGTCTCGCC TTTAGAAAAT TTGAATTTCA GGCTTTCTTA CGCGTATGTA  1680ACTAGAGGCC CTATGCCTGG AGGTTTGGTG TGGATGCGTC AAGACAATTT GCGCTATAAC  1740CGCAATTTAA AGCCAGAAAT TGGGCAAAAT GCGGAATTTA ACACCGAATA CAGCAGTCAG  1800TATTTTGATT TCAGAGCCGC CGGTTTTGTC CAATTGATTT CTAATTACAT CAATCAATTT  1860TCTTCAACGC TTTTTGTCAC CAACTTGCCC GCACAAGATA TTATTTATGT GCCTGGCTAT  1920GAAGTTTCAG GGACGGCTAA ATACAAGGGT TTTTCTTTAG GCTTGAGCGT GGCGCGATCA  1980TGGCCTTCTT TAAAAGGGCG TTTGATCGCT GACGTGTATG AATTGGCGGC TACGACAGGC  2040AATGTGTTTA TTTTAACGGC AAGCTATACA ATCCCACGCA CCGGCCTTAG CATCACTTGG  2100CTTTCACGCT TTGTTACTAA TTTGAGTTAT TGCTCTTATA GCCCTTATCG TAACGGCCCT  2160ACGGATATTG ACAGAAGGCC TAGTAATTGC CCTAAAACGC CCGGGATTTT TCATGTGCAT  2220AAACCCGGCT ATGGGGTGAG CAGTTTCTTT ATCACTTACA AGCCTACTTA TAAGAAACTC  2280AAAGGGTTGA GCCTGAACGC GGTGTTTAAT AATGTTTTTA ACCAACAATA TATTGATCAA  2340GCAAGCCCGG TGATGAGCCC TGATGAACCC AATCAAGACA AATACGCAAG GGGCATGGCA  2400GAGCCTGGCT TTAACGCTAG GTTTGAAATT TCTTATAAGT TTTAA                  2445(2)INFORMATION FOR SEQ ID NO:52:
(i)序列特征:
    (A)长度:1584个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1584
(xi)序列描述:SEQ ID NO:52:ATGAAACAAA ATTTAAAGCC ATTCAAAATG ATTAAGGAAA ATTTAATGAC ACAATCTCAA   60AAAGTAAGAT TCTTAGCCCC TTTGAGCCTA GCGTTAAGCT TGAGCTTCAA TCCAGTGGGC  120GCTGAAGAAG ATGGGGGCTT TATGACCTTT GGGTATGAAT TAGGTCAGGT GGTCCAGCAA  180GTGAAAAACC CGGGTAAAAT CAAAGCCGAA GAATTAGCGG GCCTGTTAAA CTCTACCACG  240ACAAACAACA CCAATATCAA TATTGCAGGC ACAGGAGGGA ATGTCGCCGG GACTTTGGGC  300AACCTTTTTA TGAACCAATT GGGCAATTTG ATTGATTTGT ATCCTACTTT GAAAACTAAT  360AATCTTCACC AATGCGGTAG CACTAATAGC GGTAATGGCG CTACTGCTGC CGCTGCTACT  420AACAATAGCC CTTGTTTCCA AGGTAACCTG GCTCTTTATA ACGAAATGGT TGACTCTATC  480AAAACTTTGA GTCAAAACAT CAGCAAGAAC ATCTTTCAAG GCGACAACAA CACCACGAGC  540GCTAATCTCT CCAACCAGCT CAGTGAGTTG AACACCGCTA GCGTTTATTT GACTTACATG  600AACTCGTTCT TAAACGCCAA CAACCAAGCG GGTGGGATTT TTCAAAACAA CACCAATCAA  660GCTTACGAGA ATGGTGTTAC CGCTCAACAA ATCGCTTATG TCCTAAAGCA AGCTTCAATC  720ACTATGGGGC CAAGCGGTGA TAGTGGGGCT GCGGGAGCGT TTTTAGACGC CGCTTTAGCC  780CAACATGTTT TCAACTCGGC TAACGCTGGG AACGATTTGA GCGCTAAGGA ATTCACTAGC  840TTGGTGCAAA ACATCGTCAA TAATTCTCAA AACGCTTTAA CGCTAGCCAA CAACGCTAAC  900ATCAGCAATT CAACAGGCTA TCAAGTGAGC TATGGTGGGA ATATTGATCA AGCGCGCTCT  960ACCCAACTGT TAAACAACAC CACAAACACT TTGGCTAAAG TTACCGCTCT AAACAACGAG 1020CTTAAAGCTA ACCCATGGCT TGGGAATTTC GCTGCTGGTA ACAGCTCTCA AGTGAATGCG 1080TTTAACGGGT TTATCACTAA AATCGGTTAT AAGCAATTCT TCGGGGAAAA CAAGAATGTG 1140GGCTTACGCT ACTACGGGTT CTTCAGCTAT AACGGCGCGG GCGTGGGTAA TGGCCCCACT 1200TACAATCAAG TCAATCTGCT CACTTATGGG GTGGGGACTG ATGTGCTTTA CAATGTGTTT 1260AGCCGCTCTT TTGGCAGTAG GAGTCTTAAT GCGGGCTTCT TTGGGGGGAT CCAACTCGCA  1320GGGGACACTT ACATCAGCAC GCTAAGAAAC AGCCCTCAGC TTGCGAGCAG ACCTACAGCG  1380ACAAAATTCC AATTCTTGTT TGATGTGGGC TTACGCATGA ACTTTGGTAT CTTGAAAAAA  1440GACCTAAAAA GCCATAACCA GCATTCTATA GAAATCGGTG TGCAAATCCC TACGATTTAC  1500AACACTTACT ATAAAGCTGG TGGCGCTGAA GTGAAATACT TCCGCCCTTA TAGCGTGTAT  1560TGGGTCTATG GCTACGCCTT CTAA                                         1584(2)INFORMATION FOR SEQ ID NO:53:
(i)序列特征:
    (A)长度:1380个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1380
(xi)序列描述:SEQ ID NO:53:GTGGTGTTAT TAACAATGAC AAAACGACTT TTTAAAGGGT TGTTAGCGAT TTCTCTTGCG   60GTGAGTTTGC ATGGTGGTGA AGTTAAGGAA AAAAAGCCGG TCAAGCCGGT CAAAGAAGAT  120CCGCAAGAAT TAGCGGCTAA AAGGGTGGAA GCGTTCAGTC GTTTCTCTAA TGTGGTTACA  180GAAATTGAAA AAAAGTATGT GGATAAGATC AGTATTTCTG AGATCATGAC TAAAGCGATT  240GAAGGCTTAC TCTCTAATTT GGACGCGCAT TCAGCGTATT TGAATGAAAA GAAGTTTAAG  300GAATTTCAGG CCCAAACCGA GGGCGAATTT GGGGGGCTTG GGATCACGGT GGGCATGCGC  360GATGGCGTTT TGACCGTTAT TGCACCTTTA GAGGGCACTC CAGCTTACAA GGCTGGGGTT  420AAATCAGGCG ATAGCATTTT AAAAATCAAT AACGAAAGCA CGCTGAGCAT GAGCATTGAT  480GATGCGGTTA ATCTCATGCG CGGCAAGCCA AAAACCTCTA TTCAGATCAC TGTTGTTAGG  540AAAAATGAGC CAAAACCCTT GGTATTTAAT ATCGTTAGGG ATATTATCAA GATCCCCTCT  600GTCTATGTGA AAAAGATTAA AGACACACCT TATTTGTACG TGAGAGTCAA TTCTTTTGAT  660AAAAATGTTA CCAAATCGGT TTTAGACGGC TTGAAGGCTA ACCCTAACAT TAAGGGCGTT  720GTGTTGGATT TGAGGGGGAA TCCTGGAGGG CTATTAAACC AGGCGGTAGG CTTGTCTAAC  780CTTTTCATTA AAGAGGGGGT TTTAGTCTCT CAAAGAGGCA AAAATAAGGA GGAAAACTTA   840GAATACAAGG CTAATGGCAG AGCCCCTTAT ACCAATTTAC CTGTTGTGGT GTTAGTCAAT   900GGCGGTTCAG CGAGCGCGAG CGAGATCGTC GCAGGGGCAC TGCAAGATCA CAAGCGAGCC   960ATCATTATCG GTGAAAAAAC CTTTGGTAAG GGAAGCGTGC AAGTGTTGCT CCCTGTCAAT  1020AAAGACGAAG CCATTAAAAT CACGACCGCG CGCTATTATT TGCCGAGCGG GCGCACCATT  1080CAAGCTAAGG GGATCACGCC TGATATTGTG ATTTATCCGG GTAAAGTGCC AGAAAATGAA  1140AATAAATTCA GTTTGAAAGA AGCGGATTTA AAACACCATT TAGAGCAAGA GCTTAAAAAA  1200CTTGATGATA AAACCCCTAT TTCCAAAGAG GCGGATAAAG ACAAGAAAAG CGAAGAGGAA  1260AAAGAGGTTA CTCCTAAAAT GATCAATGAT GATATTCAGC TAAAAACCGC TATTGACAGC  1320TTGAAAACCT GGTCTATCGT AGATGAGAAA ATGGATGAAA AAGTGCCTAA GAAGAAATAA  1380(2)INFORMATION FOR SEQ ID NO:54:
(i)序列特征:
    (A)长度:315个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...315
(xi)序列描述:SEQ ID NO:54:TTGCTTTTGC ACCCCTTGCA TGCTCATGCA CAAGTGCTTG GCTTCACAAA CCACGATCAC   60GCCCCTTGGC TCTATGATTT CATCAAAAGT TTCTGCAATT TGAGTGGTCA GCCTTTCTTG  120GATTTGCAGG CGTTTGCTAT AAATTTCAAT GAGTTTAGCG ATCGCGCTAA TGCCTACAAT  180CTTTTCCTTA GGGATATATC CCACGCTAAT ATTCCCAAAA AAAGGGAGCA AATGGTGCTC  240GCAAGTGGAG TAAAATTCAA TGTTTTGAGC CACTATCATT TCATCGCAAA CGCCTTGAAA  300ATACGCGCTT TTTAA                                                   315(2)INFORMATION FOR SEQ ID NO:55:
(i)序列特征:
    (A)长度:498个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...498
(xi)序列描述:SEQ ID NO:55:ATGATTGAAC TAATCTTACA CAATAAGTCC ATACAAATTG ATGAAACATT GCTGAATGTA   60AAAGAGCATT TAGAAAAGTT TTATTCAAAC AAAGAACAAG AGACAATCGC AAAAACCTTA  120GAGAGCCAAA CAGAGCTTAC TTGCAGTTAT TTATTGGATA AAGATTTTTC ATTGCTAGAA  180AAGCATTTAG AAAATAGCTT AGGGCATTTT ACTTTTGAGA GTGAGTTTGC CCTACTAAAA  240GACAAAGAGC CTTTGAATTT AGCTCAAATC AAACAAATCG GTGTTTTAAA GGTTATTACC  300TATGAAATGA CACAAGCCTT AAAAAATCAA ATCATTCATT TAACGCAAAT TGTCAATGAA  360GAAAATTTAG AGTTTGATGA AGAACTTGTT ATTTATCACT TAAATTTTAA GCTCAATCAA  420AATACTTACA AAGTGTTAGC GAAATTTTGC GTATTAAAAA AGAAAGGAAC ATTGCATGAA  480AAATTTAAGG CATTTTAG                                                498(2)INFORMATION FOR SEQ ID NO:56:
(i)序列特征:
    (A)长度:642个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...642
(xi)序列描述:SEQ ID NO:56:ATGGATACCG AAACACAAGA AAAGTTTTTA GCGTATTTGT TTGAAAAAGC TTTACAAAAA   60AATCTACAAG CTTATTGGAT AACAACAACT GAAACTAAGA ATGAATTAAC AAGAGAAGAG  120TTTTCAAATT TAATAAGAAA AACAATGATT GAACTAATCT TACACAATAA GTCCATACAA  180ATTGATGAAA CATTGCTGAA TGTAAAAGAG CATTTAGAAA AGTTTTATTC AAACAAAGAA  240CAAGAGACAA TCGCAAAAAC CTTAGAGAGC CAAACAGAGC TTACTTGCAG TTATTTATTG  300GATAAAGATT TTTCATTGCT AGAAAAGCAT TTAGAAAATA GCTTAGGGCA TTTTACTTTT  360GAGAGTGAGT TTGCCCTACT AAAAGACAAA GAGCCTTTGA ATTTAGCTCA AATCAAACAA  420ATCGGTGTTT TAAAGGTTAT TACCTATGAA ATGACACAAG CCTTAAAAAA TCAAATCATT  480CATTTAACGC AAATTGTCAA TGAAGAAAAT TTAGAGTTTG ATGAAGAACT TGTTATTTAT  540CACTTAAATT TTAAGCTCAA TCAAAATACT TACAAAGTGT TAGCGAAATT TTGCGTATTA  600AAAAAGAAAG GAACATTGCA TGAAAAATTT AAGGCATTTT AG                     642(2)INFORMATION FOR SEQ ID NO:57:
(i)序列特征:
    (A)长度:762个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...762
(xi)序列描述:SEQ ID NO:57:ATGGCGATCT CTATTAAAAG CCCAAAAGAA ATCAAAGCCC TAAGAAAAGC CGGGGAATTA   60ACCGCTCAAG CGTTAGCCCT TTTAGAGCGA GAAGTAAGGC CTGGGGTTTC ACTTTTAGAG  120CTGGATAAAA TGGCTGAAGA TTTTATCAAA TCCTCGCATG CTAGGCCTGC TTTTAAGGGG  180CTCTATGGTT TCCCTAACTC TGTGTGCATG TCCTTAAATG AGGTGGTTAT TCATGGTATT  240CCTACGGATT ATGTTTTACA AGAAGGGGAT ATTATAGGCT TGGATTTGGG GGTGGAGGTG  300GATGGCTATT ATGGCGATTC AGCCCTCACG CTTCCCATAG GCGCGATAAG CCCGCAAGAT  360GAAAAATTGC TCGCTTGCTC TAAAGAGAGC TTGATGCATG CCATTAGCTC AATTAGAGTG  420GGCATGCATT TTAAAGAGTT GAGTCAGATT TTAGAGGGCG CTATTACAGA AAGGGGCTTT  480GTGCCTTTGA AGGGATTTTG CGGGCATGGC ATTGGTAAAA AGCCCCATGA AGAGCCAGAA  540ATCCCCAACT ACCTAGAAAA AGGCGTCAAA GCTAATAGCG GCCCTAAAAT CAAAGAGGGC  600ATGGTGTTTT GTTTAGAGCC TATGGTGTGT CAAAAACAAG GCGAGCCTAA AATACTAGCG  660GATAAGTGGA GCGTGGTTTC AGTGGATGGA CTTAACACAA GCCACCATGA GCATACTATC  720GCCATAGTTG GCAATAAAGC AGTGATTCTT ACGGAGCGTT AA                     762(2)INFORMATION FOR SEQ ID NO:58:
(i)序列特征:
    (A)长度:744个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...744
(xi)序列描述:SEQ ID NO:58:AAGCCCAAAA GAAATCAAAG CCCTAAGAAA AGCCGGGAAT TAACCGCTCA AGCGTTAGCC   60CTTTTAGAGC GAGAAGTAAG GCCTGGGGTT TCACTTTTAG AGCTGGATAA AATGGCTGAA  120GATTTTATCA AATCCTCGCA TGCTAGGCCT GCTTTTAAGG GGCTCTATGG TTTCCCTAAC  180TCTGTGTGCA TGTCCTTAAA TGAGGTGGTT ATTCATGGTA TTCCTACGGA TTATGTTTTA  240CAAGAAGGGG ATATTATAGG CTTGGATTTG GGGGTGGAGG TGGATGGCTA TTATGGCGAT  300TCAGCCCTCA CGCTTCCCAT AGGCGCGATA AGCCCGCAAG ATGAAAAATT GCTCGCTTGC  360TCTAAAGAGA GCTTGATGCA TGCCATTAGC TCAATTAGAG TGGGCATGCA TTTTAAAGAG  420TTGAGTCAGA TTTTAGAGGG CGCTATTACA GAAAGGGGCT TTGTGCCTTT GAAGGGATTT  480TGCGGGCATG GCATTGGTAA AAAGCCCCAT GAAGAGCCAG AAATCCCCAA CTACCTAGAA  540AAAGGCGTCA AAGCTAATAG CGGCCCTAAA ATCAAAGAGG GCATGGTGTT TTGTTTAGAG  600CCTATGGTGT GTCAAAAACA AGGCGAGCCT AAAATACTAG CGGATAAGTG GAGCGTGGTT  660TCAGTGGATG GACTTAACAC AAGCCACCAT GAGCATACTA TCGCCATAGT TGGCAATAAA  720GCAGTGATTC TTACGGAGCG TTAA                                         744(2)INFORMATION FOR SEQ ID NO:59:
(i)序列特征:
    (A)长度:1023个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1023
(xi)序列描述:SEQ ID NO:59:ATGTATCGTA AAGATTTGGA TAATTACTTA AAACAGCGCC TCCCTAAAGC GGTGTTTTTG   60TATGGGGAGT TTGATTTTTT CATCCATTAT TATATTCAAA CGATTAGCGC GCTTTTTAAA  120GGCAATAACC CTGACACAGA AACTTCGCTT TTTTATGCGA GCGATTATGA AAAAAGCCAG  180ATTGCGACCC TTTTAGAGCA GGATTCTTTA TTTGGAGGGA GCAGTTTAGT TATTTTAAAA  240CTGGATTTTG CATTGCATAA GAAATTTAAG GAAAATGATA TCAATCCTTT TTTAAAAGCT  300TTAGAGCGGC CTAGCCATAA TAGGCTTATC ATAGGGCTTT ATAATGCTAA AAGCGACACC  360ACAAAATACA AATACACTAG CGAAATTATC GTTAAATTTT TCCAAAAAAG CCCCTTGAAA  420GATGAAGCCA TTTGCGTGCG CTTTTTTACC CCTAAAGCGT GGGAGAGTTT GAAATTCTTG  480CAAGAAAGGG CTAATTTTTT GCATTTAGAC ATCAGCGGCC ATCTTTTAAA CGCTCTTTTT  540GAAATTAATA ACGAAGATTT AAGCGTTTCG TTTAACGATT TAGACAAGCT AGCGGTTTTA  600AACGCGCCCA TCACTTTAGA AGACATTCAA GAATTAAGCT CCAATGCGGG GGATATGGAT  660TTGCAAAAGC TCATTTTAGG GCTTTTTTTG AAAAAAAGCG TCCTTGATAT TTATGATTAT  720TTGTTAAAAG AGGGCAAAAA GGATGCGGAT ATTTTAAGGG GGTTAGAGCG CTATTTTTAC  780CAGCTTTTTT TATTTTTCGC CCACATTAAA ACGACCGGTT TAATGGACGC TAAAGAGGTC  840TTAGGCTACG CTCCTCCTAA AGAGATTGTA GAAAATTACG CTAAAAACGC CCTGCGTTTG  900AAAGAAGCCG GCTATAAGAG GGTTTTTGAA ATTTTTAGGT TATGGCACCT TCAAAGCATG  960CAAGGGCAAA AGGAATTGGG CTTTTTGTAT TTGACCCCCA TTCAAAAAAT CATTAACCCT 1020TGA                                                               1023(2)INFORMATION FOR SEQ ID NO:60:
(i)序列特征:
    (A)长度:603个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...603
(xi)序列描述:SEQ ID NO:60:GTGTTTATGA CAAGCGCTCT GTTAGGCTTA CAAATTGTTT TAGCGGTATT GATTGTGGTG   60GTGGTTTTGT TGCAAAAAAG TTCTAGCATC GGCTTAGGGG CTTATAGCGG AAGCAACGAT  120TCTTTATTTG GCGCTAAAGG GCCCGCAAGC TTTATGGCGA AATTGACCAT GTTTTTAGGT  180TTATTGTTTG TCATCAACAC CATCGCTTTG GGCTATTTTT ACAACAAAGA ATACGGCAAG  240AGCGTTTTAG ATGAAACTAA AACCAATAAA GAGCTTTCGC CCTTAGTCCC TGCCACCGGC  300ACGCTCAACC CTACGCTTAA TCCCACATTA AACCCAACGC TCAACCCTTT AGAGCAAGCC  360CCCACTAATC CTTTAATGCC TACACAAACG CCTAAAGAGC TTCCTAAAGA GCCAGCCAAA  420ACGCCTTTTG TTGAAAGCCC CAAACAGAAT GAAAAGAATG AAAAGAATGA TGCCAAAGAA  480AATGGTATAA AGGGTGTTGA AAAAAACAAA GAGAACGCCA AAACGCCCCC AACCACCCAC  540CAAAAGCCTA AAACGCATGC GACAACCAAC GCCCATACCA ACCAAAAAAA GGATGAAAAA  600TAA                                                         603(2)INFORMATION FOR SEQ ID NO:61:
(i)序列特征:
    (A)长度:480个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...480
(xi)序列描述:SEQ ID NO:61:ATGCGTTCTC CAAATTTAGA AAAAGAAGAA ACTGAAATCA TAGAAACGCT TCTTGTGCGT   60GAAAAAATGC GTTTATGCCC CTTGTATTGG CGCATCTTAG CGTTTTTAAT CGATAGTTTA  120TTGGTGGCGT TTTTATTGAG CGATCTTTTA AGGGCATGCG CTTTTTTACA TTCTTTATAT  180TGGCTGACTA ACCCCATTTA TTACAGCGCG TTTGTTGTGA TGGGTTTTAT CATCTTGTAT  240GGCGTTTATG AAATCTTTTT TGTGTGTTTG TGCAAGATGA GTTTGGCTAA ACTGGTTTTT  300AGGATTAAGA TCATTGATAT TTATTTAGCG GATTGCCCCA GTAGGGCTAT TTTATTGAAG  360CGTTTAGGGT TAAAAATCGT GGTTTTTCTA TGCCCCTTTT TATGGTTTGT GGTGTTTAAA  420AACCCCTATC ATAGGGCATG GCATGAAGAA AAAAGCAAAA GTCTTTTGGT GTTGTTTTAA  480(2)INFORMATION FOR SEQ ID NO:62:
(i)序列特征:
    (A)长度:705个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...705
(xi)序列描述:SEQ ID NO:62:TTGAATACGG ACTTTAGCCA TATCACCGAT ATTGAGGGCA TGCGTTTTGT TAATGAAGAA   60GACGCTTTAA ACAAATTGAT TAATGAAATC CACACGCGCC ACATTGATTT AAAAGATTCC  120ATCATGCTCG CTTTGAGTTT TAACGCCTTG TATTTAGCTA ACGCTTTAGC GCAAAAATTT  180GGGGCGACTT ATGATATACT TTTTTTAGAA CCTATCTTAG CCCCTTTAAA CTCAAAGTGT  240GAAATCGCTT TAGTGAGTGA AAGCATGGAT ATAGTGATGA ATGAAAGTTT AATCAATTCC  300TTTGACATCG CTTTAGACTA TGTTTATGGG GAAGCCAAGC GGGCTTATGA AGAAGACATT  360CTGTCTCACA TCTATCAGTA TCGCAAAGGC AATGCGATCA AAAGCCTAAA AGATAAAAAT  420ATTTTTATCG TAGATAGGGG GATTGAGACC GGGTTTAGAG CAGGGTTAGG CGTGCAAACT  480TGTTTGAAAA AAGAATGCCA AGACATTTAT ATTTTAACCC CCATTCTCGC GCAAAATGTC  540GCTCAAGGCT TAGAAAGCTT GTGCGATGGG GTGATTAGCG TGTATCGCCC TGAATGTTTT  600GTCTCTGTGG AACACCATTA TAAAGAACTC AAGCGATTAA GCAATGAAGA AATTGAAAAA  660TACTTGGGCG CTAACAACGC GCCCAATCTC AAAAAGGAAC ATTAA                  705(2)INFORMATION FOR SEQ ID NO:63:
(i)序列特征:
    (A)长度:864个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...864
(xi)序列描述:SEQ ID NO:63:TTGAAACAAA GCGAAATGGC CATGGAATTT AATGATCCTA GGATGCGTTT TTTTATTGGC   60GATGTCAGGG ATTTAGAACG CTTGAATTAC GCTTTAGAGG GCGTGGATAT TTGTATCCAT  120GCGGCCGCGC TCAAGCATGT GCCTATCGCT GAATACAACC CCCTAGAATG CATTAAAACT  180AACATCATGG GAGCGAGCAA TGTGATTAAC GCATGCTTAA AAAATGAAAT CAGCCAGGTT  240ATTGCCCTAA GCACCGATAA AGCCGCTAAC CCCATTAACC TCTACGGCGC AACCAAATTG  300TGCAGCGACA AGCTCTTTGT GAGCGCGAAC AACTTTAAAG GCCCTTCTCA AACGCAATTT  360GGCGTGGTGC GTTATGGTAA TGTGGTGGGG AGTCGTGGGA GCGTGGTGCC GTTTTTTAAA  420AAATTAGTCC AAAACAAAGC GAGTGAAATC CCCATTACCG ATATTCGCAT GACACGATTT  480TGGATCACCT TAGATGAGGG GGTTTCTTTT GTGCTTAAAA GCTTGAAAAG AATGCATGGG  540GGGGAAATTT TTGTGCCTAA AATCCCCAGC ATGAAAATGA TTGATCTCGC CAAAGCCCTA  600GCCCCCAATA TCCCTACTAA AATCATAGGG ATTCGCCCGG GCGAAAAACT CCATGAAGTG  660ATGATCCCTA AAGATGAAAG CCATTTAGCC CTAGAATTTG AAGACTTTTT TATTATTCAG  720CCCACTATAA GCTTCCAAAC GCCTAAAGAT TACACGCTCA CCAAACTCCA TGAAAAAGGC  780CAAAAAGTCG CCCCTGATTT TGAATACAGC AGCCATACTA ATAACCAATG GCTAGAGCCT  840GATGATTTGT TAAAATTATT ATGA                                         864(2)INFORMATION FOR SEQ ID NO:64:
(i)序列特征:
    (A)长度:606个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...606
(xi)序列描述:SEQ ID NO:64:ATGCGTTTGC ACACTGCCTT TTTTGGTATT AATTCGTTGC TTGTCGCCAC TCTTTTGATA   60AGCGGTTGCA GTCTCTTTAA AAAGCGTAAC ACTAACGCTC AGCTAATCCC CCCTTCAGCT  120AACGGGTTGC AAGCCCCCAT TTATCCCCCA ACCAATTTCA CCCCCAGAAA GAGCATTCAG  180CCTCTCCCAA GCCCTCGCCT TGAGAATAAC GATCAGCCCA TCATTAGCTC TAATCCCACT  240AACGCTATCC CTAACACCCC CATTCTCACG CCCAATAATG TCATTGAGTT GAATGCGGTG  300GGCATGGGTG TGGCTCCAGA ATCCACCATT TCGCCCTCTC AAGCTCTAGC TTTAGCTAAG  360CGAGCGGCTA TTGTTGATGG CTACCGCCAG TTGGGTGAAA AAATGTATGG CATCAGAGTG  420AACGCTCAAG ACACCGTCAA AGACATGGTT TTACAAAATT CCGTGATTAA AACGAGAGTG  480AATGCCCTCA TTCGTAACGC TGAAATCACT GAGACTATCT ATAAAGACGG CTTGTGCCAG  540GTAAGCATGG AGCTTAAATT AGACGGCAGG ATTTGGTATC GTATTTTGAG CGGATCGAGA  600GGATAA                                                             606(2)INFORMATION FOR SEQ ID NO:65:
(i)序列特征:
    (A)长度:1068个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1068
(xi)序列描述:SEQ ID NO:65:ATGAGTTATA CTATTAATAA ACGCTTTTCT GTGGGTGTGG GTTTAAGGGG GCTTTATGCG   60ACCGGGAGCT TTAATAACAC CGTTTATGTG CCTTTAGAGG GCGCTTCAGT TTTGAGCGCG  120GAGCAAATCT TAAACTTACC CAACAATGTT TTTGCCGATC AAGTGCCAAG TAACATGATG  180ACTTTATTAG GCAATATTGG CTACCAACCA GCGCTTAATT GCCAAAAAGC CGGTGGGGAC  240ATGAGTGATC AGAGCTGTCA AGAGTTTTAC AACGGCTTGA AAAAAATCAT GGGTTATAGC  300GGTTTAATCA AAGCGAGCGC GAATCTTTAT GGCACGACTC AAGTCGTGCA AAAATCTAAC  360GGACAAGGCG TATCGGGGGG GTATAGAGTG GGTTCGAGTT TGCGTGTGTT TGATCATGGC  420ATGTTTTCTG TGGTGTATAA TTCTTCAGTT ACCTTTAACA TGAAAGGCGG TTTGGTGGCT  480ATCACAGAGC TTGGCCCTTC TTTAGGGAGC GTTTTGACTA AAGGCAGCTT GAATATCAAT  540GTTTCACTCC CCCAAACTTT AAGCTTAGCC TACGCCCACC AATTTTTTAA AGATCGCCTA  600AGGGTTGAAG GGGTGTTTGA GCGCACTTTT TGGAGTCAAG GGAATAAATT TTTAGTCACC  660CCTGATTTTG CGAACGCCAC TTACAAGGGC TTGAGCGGGA CGGTGGCTTC CTTGGACTCT  720GAAACGCTTA AAAAAATGGT AGGCCTAGCG AATTTTAAAA GCGTGATGAA CATGGGGGCT  780GGCTGGAGGG ACACCAACAC CTTTAGATTA GGGGTAACTT ACATGGGTAA AAGCTTGCGT  840TTAATGGGCG CTATTGATTA TGATCAAGCC CCAAGCCCCC AAGACGCGAT AGGCATTCCG  900GACTCTAATG GCTATACCGT GGCTTTTGGG ACTAAATACA ATTTTAGGGG CTTTGATTTG  960GGCGTAGCGG GGAGTTTCAC TTTTAAGAGC AACCGCTCCA GTTTGTATCA ATCCCCAACT 1020ATTGGGCAAT TGAGAATCTT TAGCGCCTCT TTAGGCTATC GCTGGTAA              1068(2)INFORMATION FOR SEQ ID NO:66:
(i)序列特征:
    (A)长度:1764个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1764
(xi)序列描述:SEQ ID NO:66:ATGAAAAACT TTTCCCCACT CTATTGTCTT AAAAAGCTCA AAAAACGCCA TTTAATCGCT   60CTGAGTCTGC CCTTGCTTTC TTATGCGAAT GGCTTTAAAA TCCAAGAGCA AAGCTTGAAT  120GGCACGGCTT TAGGCTCGGC GTATGTCGCT GGGGCTAGGG GTGCTGACGC TTCTTTTTAC  180AACCCGGCTA ACATGGGCTT TACTAACGAT TGGGGCGAAA ACAGAAGCGA ATTTGAAATG  240ACCACCACCG TGATCAATAT CCCGGCCTTT AGCTTTAAAG TCCCTACGAC CAATCAAGGC  300TTATATTCGG TAACAAGTTT AGAAATTGAT AAAAGCCAAC AAAATATTTT AGGCATCATC  360AACACTATAG GGTTAGGCAA TATCCTTAAA GCGCTTGGCA ATACGGCCGC TACCAATGGC   420TTATCACAAG CTATCAATCG TGTTCAAGGG CTTATGAACT TAACCAATCA AAAAGTCGTA   480ACCCTCGCTT CAAAACCTGA CACTCAAATC GTGAATGGCT GGACAGGCAC GACTAATTTT   540GTTTTACCTA AATTCTTTTA TAAAACGCGC ACGCATAACG GCTTCACTTT TGGGGGGAGT   600TTTACCGCTC CTAGTGGGTT GGGTATGAAA TGGAATGGTA AGGGGGGGGA ATTTTTGCAT   660GACGTGTTTA TCATGATGGT AGAGCTTGCC CCTAGCATGA GTTATACTAT TAATAAACGC   720TTTTCTGTGG GTGTGGGTTT AAGGGGGCTT TATGCGACCG GGAGCTTTAA TAACACCGTT   780TATGTGCCTT TAGAGGGCGC TTCAGTTTTG AGCGCGGAGC AAATCTTAAA CTTACCCAAC   840AATGTTTTTG CCGATCAAGT GCCAAGTAAC ATGATGACTT TATTAGGCAA TATTGGCTAC   900CAACCAGCGC TTAATTGCCA AAAAGCCGGT GGGGACATGA GTGATCAGAG CTGTCAAGAG   960TTTTACAACG GCTTGAAAAA AATCATGGGT TATAGCGGTT TAATCAAAGC GAGCGCGAAT  1020CTTTATGGCA CGACTCAAGT CGTGCAAAAA TCTAACGGAC AAGGCGTATC GGGGGGGTAT  1080AGAGTGGGTT CGAGTTTGCG TGTGTTTGAT CATGGCATGT TTTCTGTGGT GTATAATTCT  1140TCAGTTACCT TTAACATGAA AGGCGGTTTG GTGGCTATCA CAGAGCTTGG CCCTTCTTTA  1200GGGAGCGTTT TGACTAAAGG CAGCTTGAAT ATCAATGTTT CACTCCCCCA AACTTTAAGC  1260TTAGCCTACG CCCACCAATT TTTTAAAGAT CGCCTAAGGG TTGAAGGGGT GTTTGAGCGC  1320ACTTTTTGGA GTCAAGGGAA TAAATTTTTA GTCACCCCTG ATTTTGCGAA CGCCACTTAC  1380AAGGGCTTGA GCGGGACGGT GGCTTCCTTG GACTCTGAAA CGCTTAAAAA AATGGTAGGC  1440CTAGCGAATT TTAAAAGCGT GATGAACATG GGGGCTGGCT GGAGGGACAC CAACACCTTT  1500AGATTAGGGG TAACTTACAT GGGTAAAAGC TTGCGTTTAA TGGGCGCTAT TGATTATGAT  1560CAAGCCCCAA GCCCCCAAGA CGCGATAGGC ATTCCGGACT CTAATGGCTA TACCGTGGCT  1620TTTGGGACTA AATACAATTT TAGGGGCTTT GATTTGGGCG TAGCGGGGAG TTTCACTTTT  1680AAGAGCAACC GCTCCAGTTT GTATCAATCC CCAACTATTG GGCAATTGAG AATCTTTAGC  1740GCCTCTTTAG GCTATCGCTG GTAA                                         1764(2)INFORMATION FOR SEQ ID NO:67:
(i)序列特征:
    (A)长度:618个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...618
(xi)序列描述:SEQ ID NO:67:TTGATTTTTA GATTTTTCTT AATCTTAAGC CTTTTAAAAG GGGTTTTACT GGCCAAAAAG   60GATTGGAATT TTTTCAAACC TTTAGAGCCT ACTAAAAAAT ATTTTGGCTC TTTTAAAATC  120GGCTATCTTT ACCAACATGC AGAAACGACT AAAAGATTCC CCATCCGCCC TAAAAACCGC  180CCGCCTATTT TAATGGATAA AATTTACCAT GACGCTTCTT TGGGTTTTGA CGCAGGGTAT  240GTTTTGAAAA AGAAAGCTTT ATTGGGGGGG TATTTGGATG CAGGAATGGG CGATTCGTAT  300TTCATGAGCG CTGGGCTAGT CGCTGGGGTG AGGCTTTTTA AGGGGTGGGT TATCCCTAAA  360ATCGCCTTAG GCTATCAGCT TCAAATTTTA GGGGCTAAGA TTGATAAGTA TCAATTCAAT  420ATCCAATCAG CGGTGGGGAG TGTGGGCTTG TTTTTCAATG CGGCTAAAAA TTTTGGCTTG  480AGTATAGAAG CAAGGGGCGG TATCCCTTTT TATTTCATTC AGAGCAGGTT TTCTAAGGCT  540TTCGGCACGC CACGATTGAA TATCTATTCT GTTGGTATCA CATTCACTTT TTATGACTTT  600ACGAGATTTT TAGGGTAA                                                618(2)INFORMATION FOR SEQ ID NO:68:
(i)序列特征:
    (A)长度:762个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...762
(xi)序列描述:SEQ ID NO:68:TTGTGGCATG CTGCCTTTAG CGTTGGCGAG TGGGGATGGA ACGGCGATGA AATCCCCTAT   60AGGGATTGCG ATGAGTGGGG GCTTGATGAT TTCTATGGTG TTAAGCCTAC TGATTGTGCC  120GGTGTTTTAT CGTTTGCTCG CTCCCATAGA CGACAAAATC AAGCGGTTTT ATCAAAACCA  180AAAAGCTTTA GAATGAAAAA AATTGCTTTC ATTTTGGCTT TATGGGTGGG CTTGTTAGGG  240GCGTTTGAGC CTAAAAAAAG TCATATTTAT TTTGGGGCTA TGGTGGGTTT AGCCCCTGTT  300AAAATAACCC CAAAACCGGC TAGTGATTCT TCTTATACGG CTTTTTTATG GGGGGCTAAA  360GGGGGGTATC AATTCGCTTT TTTTAAAGCT CTAGCGTTAA GGGGTGAATT TTCCTACCTT  420ATGGCGATCA AACCCACCGC ACTGCACACG ATTAACACTT CTTTATTGAG TTTAAATATG  480GATGTGTTGA GCGATTTTTA CACTTATAAA AAATACAGCT TTGGGGTGTA TGGGGGGCTT  540GGGATAGGGT ATTTTTATCA AAGCAACCAT TTAGGCATGA AAAATAGTTC GTTTATGGGT  600TATAACGGCT TGTTTAATGT GGGGCTTGGC AGCACGATCG ATCGCCACCA CCGCGTAGAG  660CTTGGGGCTA AGATCCCTTT TTCAAAGACT AGAAATTCTT TTAAAAATTC TTATTTTTTA  720GAGAGCGTTT TTATCCATGC GGCTTATAGT TATATGTTTT AA                     762(2)INFORMATION FOR SEQ ID NO:69:
(i)序列特征:
    (A)长度:1239个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
    (A)生物:幽门螺杆菌
(ix)特征:
    (A)名称/关键词:misc_特征
    (B)位置1...1239
(xi)序列描述:SEQ ID NO:69:ATGGAATCAG TAAAAACAGT AAAAACAAAT AAAGTTGGCA AAAACACAGA GACAGCTAAC   60ACAGAGGCAA GTAAAGAGAC TCATTTTAAA CAAGCGAGTG CCATTACAAA TACGCTCCGA  120TCAATTGGTG GGATTTTTAC AAAAATTGCA AAGAAAGTTA GAGAACTTGT GAAAAAACAT  180CCCAAGAAAA GCAGTGTGGC ATTAGTAGTA TTGACCCATA TTGCGTGCAA GAGGGCAAAA  240GAATTGGACG ATAAAGTCCA AGATAAATCC AAACAAGCTG AAAAAGAAAA TCAAATCAAT  300TGGTGGAAAT ATTCAGGATT AACAATAGCG GCAAGTTTAT TATTAGCCGC TTGTAGCACT  360GGTGATATTG ATAAACAAAT AGAACTAGAA CAAGAAAAAA AGGAAGCAAATAAGAGTGGG   420ATAAAGTTAG AACAAGAAAG ACAGAAAACA GAACAAGAAA GACAGAAGAC AAATAAGAGT  480GAGATAGAGT TAGAACAAGA AAGACAAAAA ACAAACAAGA GTGGGATAGA ACTCGCTAAT  540AGTCAAATAA AAGCAGAACA AGAAAGACAA AAGACAGAAC AAGAAAAACA AAAAGCAAAT   600AAGAGTGAGA TAGAGTTAGA ACAGCAAAAA CAAAAGACAA TTAATACACA AAGAGATTTG   660ATTAAAGAAC AGAAAGATTT CATTAAAGAA ACAGAACAAA ATTGCCAAGA AAAACATGGC   720CAATTGTTTA TTAAAAAAGC AAGAATTAAG ACCGGTATTA CTACTGGTAT TGCCATAGAA   780ATAGAAGCTG AATGCAAAAC CCCTAAACCT GCAAAAACCA ATCAAACCCC TATCCAGCCA   840AAACACCTCC CAAACTCTAA ACAACCCCGC TCTCAAAGAG GATCAAAAGC GCAAGAGCTT   900ATCGCTTATT TGCAAAAAGA GCTAGAATCT CTGCCCTATT CGCAAAAAGC TATCGCTAAA   960CAAGTGGATT TTTATAAACC AAGTTCTATC GCTTATTTAG AACTAGACCC TAGAGATTTT  1020AAGGTTACAG AAGAATGGCA AAAAGAAAAT TTAAAAATAC GCTCTAAAGC TCAAGCTAAA  1080ATGCTTGAAA TGAGAAACCC ACAAGCCCAC CTTCCAACCT CTCAAAGCCT TTTGTTCGTT  1140CAAAAAATAT TTGCTGATAT TAATAAAGAA ATAGAAGCAG TTGCTAATAC TGAAAAGAAA  1200ACAGAAAAAG CGGGTTATGG TTATAGTAAA AGGATGTAG                         1239(2)INFORMATION FOR SEQ ID NO:70:
(i)序列特征:
  (A)长度:450个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...450
(xi)序列描述:SEQ ID NO:70:TTGAATTGGG AGCATTTGAT GAAAAAATTA GCGTTTTCTT TATTATTTAC AGGGACTTTT    60TTGGGGCTTT TTTTGAATGC GAGTGATTTT AAGAGCATGG ATAACAAGCA ACTATTAGAG   120CAAGCAGGGA AAGTCGCTCC TAGCGAAGTT CCAGAGTTTC GCACAGAAGT CAATAAACGA   180TTAGAAGCGA TGAAAGAAGA AGAGCGTCAA AAATATAAAG CGGATTTTAA GAAAGCGATG   240GATAAGAATT TGGCTTCTTT AAGCCAAGAA GATCGCAACA AGCGTAAAAA AGAAATCCTT   300GAAGTCATTG CTAACAAAAA GAAAACAATG ACCATGAAAG AGTATCGTGA AGAGGGGTTG   360GATTTGCATG ATTGCGCATG CGAAGGCCCT TTTCATGATC ATGAAAAAAA GGGGCAAAAA   420GGGAAAAAAC CAAGCCATCA TAAGCATTAG                              450(2)INFORMATION FOR SEQ ID NO:71:
(i)序列特征:
  (A)长度:615个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...615
(xi)序列描述:SEQ ID NO:71:ATGCAAGCAG TGATTTTAGC GAATGGGGAG TTTCCTAAAT CTAAAAAATG CTTAGACATT        60TTACAAAACG CTCCCTTTTT AATCGCATGC GATGGGGCTG TTATATCATT GCATGCGCTT       120CAATTCAAAC CCAGCGTTGT TATAGGCGAT TTGGATAGCA TTGATTCGCA TTTGAAAGCC       180TTGTATAACC CTATACGCGT GAGCGAACAA GACAGCAACG ATTTGTCCAA AGCCTTTTTT       240TATGCTTTGA ATAGGGGTTG TGATGATTTT ATTTTTTTAG GGTTGAATGG CAAGCGAGAA       300GACCACGCTT TAGCGAACAC TTTTTTATTG TTGGAGTATT TTAAATTTTG CAAAAAAATC       360CAATCCGTAA GCGATTATGG CCTTTTTAGG GTGTTAGAAA CCCCTTTTAC TTTGCCCAGT       420TTTAAGGGGG AGCAAATCTC GCTTTTTAGC TTGGATCTTA AAGCCCGATT CACTTCTAAA       480AACCTCAAAT ACCCCTTAAA AGACTTGCGT CTAAAAACGC TCTTTTCCGG CTCGCTCAAT       540GAAGCCACTA ATCATTGTTT TAGCCTTAGC TCTGAACCTA AATCGGTGGT GCTAGTGTAT       600CAAAAATTCT CATGA                                                        615(2)INFORMATION FOR SEQ ID NO:72:
(i)序列特征:
  (A)长度:843个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...843
(xi)序列描述:SEQ ID NO:72:GTGTTTGACT CATTGGGCGG ATTTTTGGGG TATAAAACTT TTAAGCCGAT AGTGGATAAG    60GTTAAAAATA TAAACGCTTG GATAAAAAAT TACGATAATA AAAAAGCTCA AGAGATTATG   120GGTTTTATAG AAAATCCTAC GCCTGATTTC CAAAATAATA AGTTTTTGTG TGTTTTAAAC   180CGACAAGGAA CAAGGCACAA CAATTATCTT GGTTTAACCT CTACAAACCT TCTAATCGGC   240GCGATCTATT TCTCCATCCG CCATTGCATC AAAGCCACAT GGCAAAACGA TAGGGATCAA   300TTCTACGCCC CTTATGATGA CGCTTTCCAA GACGACAGCG AGTTTAAAAA CAATTGTTTG   360GCGTTCATGC TTTTTCACAC CCAAAACCGC ATCACTGCCA CTCAAGGGAC TAACCATTTT   420ATCCCCTTTA GCGAAGATGA AGTTGATTCT AAAGAAAGGT ATTTGAGCCA TGCTTTATTA   480GACTTTTTAA AAGGCGAAAT CAAAGAACCT AAAAAGAGCG ATAGCCTCTT TTTAAACGCC   540AAAAAAGAAA ACAAGCCCCT AAAATTCAGC TCGAGCGCTT CAAAGGTGTT TGACGCTGGC   600AGAGAGATTT ATCGCTATTA CCACACACAA GATTTCATCC ACACCCCCTA TAACGCTAAC   660GCAAGCCTTT ATGACATCAA AGAATTTTTT CAAGGCCGTA ACAAGCAAGG CAGATTAAAC   720TCACCCACCA AAGCCAAAGA TGAATATTAC AAACAGCTTT ACGCTAACTT GCAATACGCC   780CTAAAAGATC TCGCCAAAGA AATACAGCCT AAAGTCTATG AATACGGATT TTTAAGGGAG   840TAG                                                                 843(2)INFORMATION FOR SEQ ID NO:73:
(i)序列特征:
  (A)长度:930个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...930
(xi)序列描述:SEQ ID NO:73:TGTGACAGGG CAATTCCCCA TTGGCTTTTT AGTCTGGGAT ACCGCTACCC CCCCCCCTTA        60AAACCAACCA ACGCGTTCAA TTTAGAAGTG TTTGACTCAT TGGGCGGATT TTTGGGGTAT       120AAAACTTTTA AGCCGATAGT GGATAAGGTT AAAAATATAA ACGCTTGGAT AAAAAATTAC       180GATAATAAAA AAGCTCAAGA GATTATGGGT TTTATAGAAA ATCCTACGCC TGATTTCCAA       240AATAATAAGT TTTTGTGTGT TTTAAACCGA CAAGGAACAA GGCACAACAA TTATCTTGGT       300TTAACCTCTA CAAACCTTCT AATCGGCGCG ATCTATTTCT CCATCCGCCA TTGCATCAAA       360GCCACATGGC AAAACGATAG GGATCAATTC TACGCCCCTT ATGATGACGC TTTCCAAGAC       420GACAGCGAGT TTAAAAACAA TTGTTTGGCG TTCATGCTTT TTCACACCCA AAACCGCATC       480ACTGCCACTC AAGGGACTAA CCATTTTATC CCCTTTAGCG AAGATGAAGT TGATTCTAAA       540GAAAGGTATT TGAGCCATGC TTTATTAGAC TTTTTAAAAG GCGAAATCAA AGAACCTAAA       600AAGAGCGATA GCCTCTTTTT AAACGCCAAA AAAGAAAACA AGCCCCTAAA ATTCAGCTCG       660AGCGCTTCAA AGGTGTTTGA CGCTGGCAGA GAGATTTATC GCTATTACCA CACACAAGAT       720TTCATCCACA CCCCCTATAA CGCTAACGCA AGCCTTTATG ACATCAAAGA ATTTTTTCAA       780GGCCGTAACA AGCAAGGCAG ATTAAACTCA CCCACCAAAG CCAAAGATGA ATATTACAAA       840CAGCTTTACG CTAACTTGCA ATACGCCCTA AAAGATCTCG CCAAAGAAAT ACAGCCTAAA       900GTCTATGAAT ACGGATTTTT AAGGGAGTAG                                        930(2)INFORMATION FOR SEQ ID NO:74:
(i)序列特征:
  (A)长度:564个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...564
(xi)序列描述:SEQ ID NO:74:TTGGAAACTT ATATCATTGA TGCAGATAAT ATAGATGGGG ATTTATTTTT CTATAATCTT        60ACTAGAAACA GCAATGATTT TTCCATGTTG CCCGTTTTTG AACTCGATCG CATTGCCCAA       120AAAATTAGAA ATATTCTTAA AAAACATGGC AGTAGAAAAG ACATTATTTT AAAACACAAT       180GAAATTAAAG AAGCCTTTTT TAGCCCGTTC AAACCGCAGC TAAAAACCGT TCAAGTGTTC       240CTCTCGCACT CGCATGCGGA TAAAAATAAG GCTTTAGGGG TTAAGGACTA TTTGGAAAGC       300AAAACAAAAC GCAAAGTGTT TATCGATTCG CTTTTTTGGG ATTATAAAGA CGATGTTTTA       360AACAAATTGG CAAAACACGA TGATATAAGC AAGATTGAAG ACGCTTTCAC GCTCATTCTC       420AGAAAATCTT TACAAGATAT GATTGAAAAA TGCCCTTATT TTGTGTTTTT ACAAAGCAAG       480AACAGCGTTT CTAATCAAGG GCTATCACGC ATCACTTATT CCGCATGGAT TTATGAAGAA       540TTAAAAATCG CTTCATTCTA TTAG                                              564(2)INFORMATION FOR SEQ ID NO:75:
(i)序列特征:
  (A)长度:597个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...597
(xi)序列描述:SEQ ID NO:75:TTGGAAACTT ATATCATTGA TGCAGATAAT ATAGATGGGG ATTTATTTTT CTATAATCTT       60ACTAGAAACA GCAATGATTT TTCCATGTTG CCCGTTTTTG AACTCGATCG CATTGCCCAA      120AAAATTAGAA ATATTCTTAA AAAACATGGC AGTAGAAAAG ACATTATTTT AAAACACAAT      180GAAATTAAAG AAGCCTTTTT TAGCCCGTTC AAACCGCAGC TAAAAACCGT TCAAGTGTTC      240CTCTCGCACT CGCATGCGGA TAAAAATAAG GCTTTAGGGG TTAAGGACTA TTTGGAAAGC      300AAAACAAAAC GCAAAGTGTT TATCGATTCG CTTTTTTGGG ATTATAAAGA CGATGTTTTA      360AACAAATTGG CAAAACACGA TGATATAAGC AAGATTGAAG ACGCTTTCAC GCTCATTCTC      420AGAAAATCTT TACAAGATAT GATTGAAAAA TGCCCTTATT TTGTGTTTTT ACAAAGCAAG      480AACAGCGTTT CTAATCAAGG GCTATCACGC ATCACTTATT CCGCATGGAT TTATGAAGAA      540TTAAAAATCG CTTCATTTCT ATTAGCGCTA TTAACGAGAG TCGCCCAATT CCAATGA         597(2)INFORMATION FOR SEQ ID NO:76:
(i)序列特征:
  (A)长度:570个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...570
(xi)序列描述:SEQ ID NO:76:ATGATGACTA AGAACGCTTA TGCGTTTGTC GTGATTGAAA AAAGTATTAT GGTGTTTAAA        60TGCGCCAAAG ACAAGGGGCT AATCCCTATC ACTGAAGGCT TTGTGCCGTT AAAAGAGGGC       120TTTTTGAGAA GTTTTAAAGA GCGTTGCAAT CTGGATTTTT TAGAAAATTT AGACCTTTTG       180TTTTTGTATG ACTACCAATT TCCAAGCGAG GTTTTTTCAT TGTGTAAGGA TTTGAAAAAT       240TCCATTTGGG ACAGAAAGCT TGTGGTAGTG CTAGTGGAGG CTTTGGAGGG TTTTAAGGGT       300TTGAATTTGT CTCTTAAGAT AGAAGATAGG CATTCTAATA GCTTGGGTAA TGGCGTTCAA       360AAATTGCTCA CCAACGCTGA TTTGGGGAGC AACCACAAAC CAATCGTAAT AGACAGCATG       420AAAACATACC ACCAAAGCCA GCAAGAAAAA TACAAAAGAG AAAGAGGCGA AACGCTAGAG       480GTTCGCCCCA CAACACCCCC TAGCTATGGG GGTGGGAGCA TTAGAATCAG CGGCGATAAA   540AAGCCTGATT CCAATGAAGA AAATTTTTAA                                    570(2)INFORMATION FOR SEQ ID NO:77:
(i)序列特征:
  (A)长度:1773个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...1773
(xi)序列描述:SEQ ID NO:77:ATGAAAGCGA TAAAAATACT TCTTATAATG ACACTCAGTT TAAACGCTAT CAGCGTGAAT       60AGGGCGTTGT TTGATTTAAA AGATTCGCAA TTAAAAGGGG AATTAACGCC AAAAATAGTG      120GATTTTGGGG GTTATAAAAG CAACACCACA GAGTGGGGAG CTACGGCTTT AAACTATATC      180AATGCGGCTA ATGGCGATGC GAAAAAATTC AGCGCGTTAG TGGAAAAAAT GCGTTTTAAC      240TCTGGTATCT TGGGGAATTT TAGAGCGCAT GCACATTTGA GGCAAGCCCT AAAATTGCAA      300AAGAATTTGA AATATTGCCT TAAAATCATC GCTAGGGATT CTTTTTATAG TTACCGCACC      360GGTATTTATA TCCCCTTAGG CATTTCTTTA AAAGATCAAA AAACGGCTCA AAAAATGCTC      420GCTGATTTGA GCGTGGTAGG GGCGTATCTT AAAAAGCAAC AGGAGAATGA AAAGGCTCAA      480AGCCCTTATT ACAGGAGCAA CAACTATTAC AACTCCTACT ATAGCCCTTA TTATGGCATG      540TATGGCATGT ATGGAATGGG CATGTATGGA ATGTATGGCA TGGGCATGTA TGATTTTTAT      600GACTTTTATG ATGGCATGTA TGGGTTCTAC CCTAACATGT TTTTCATGAT GCAAGTTCAA      660GACTACTTGA TGTTAGAAAA TTACATGTAT GCACTCGATC AAGAAGAGAT TTTAGACCAT      720GACGCTTCCA TCAACCAACT TGATACGCCT ACTGATGATG ACAGAGACGA TAAAGACGAT      780AAATCTTCGC AACCAGCGAA TCTCATGAGC TTTTATCGTG ATCCCAAATT CAGCAAAGAC      840ATTCAAACCA ACCGCTTGAA TAGCGCCTTA GTCAATTTAG ACAACAGCCA CATGCTCAAA      900GACAATTCGC TCTTCCACAC TAAAGCCATG CCCACTAAAA GCGTGGATGC GATCACTTCT      960CAAGCTAAAG AGCTTAACCA TTTGGTGGGG CAAATCAAAG AGATGAAGCA AGACGGGGCG     1020AGTCCTAATA AGATTGATTC AGTGGTCAAT AAAGCTATGG AGGTTAGGGA CAAATTAGAC    1080AACAACCTCA ACCAACTAGA CAATGACTTA AAAGATCAAA AAGGGCTTTC AAGCGAGCAG    1140CAAGCCCAAG TGGATAAAGC CTTAGACAGC GTGCAACAAT TAAGCCATAG CAGCGATGTG    1200GTAGGGAATT ATTTAGACGG GAGTTTGAAA ATTGATGGCG ATGACAGAGA CGATTTGAAT    1260GATGCGATCA ATAACCCTAT GCAACAACCT GCGCAACAAA CGCCTATTAA CAACATGGAC    1320AACACCCATG CAAATGACAG CAAAGATCAA GGGGGTAACG CGCTCATAAA CCCTAACAAC    1380GCCACCAACG ATGATCACAA CGATGATCAC ATGGACACTA ACACCACTGA CACTAGCAAC    1440GCAAACGACA CCCCCACTGA TGATAAAGAT GCTAGCGGCA ACAATACCGG CGATATGAAT    1500AACACCGACA CCGGCAATAC GGACACTGGC AACACCGACA CCGGTAACAC TGATGATATG    1560AGCAACATGA ACAACGGCAA CGATGATACG GGTAACACTA ACGACGACAT GGGTAATAGC    1620AACGACATGG GCGATGACAT GAATAACGCG AACGACATGA ACGACGACAT GGGTAACAGC    1680AACGATGACA TGGGCGATAT GGGGGACATG AACGATGACA TGGGTGGCGA TATGGGAGAC    1740ATGGGGGATA TGGGTGGCGA TATGGGGAAT TGA                                 1773(2)INFORMATION FOR SEQ ID NO:78:
(i)序列特征:
  (A)长度:588个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...588
(xi)序列描述:SEQ ID NO:78:TTGAATTTAC GATTGGCTGG AGCAAGCGTT TTAACGGCTT GTGTCTTTTC GGGGTGTTTT    60TTTTTAAAAA TGTTTGACAA AAAACTTTCT AGCAACGATT GGCATATCCA AAAAGTAGAA   120ATGAACCATC AAGTGTATGA CATTGAAACC ATGCTCGCTG ATAGCGCTTT TAGAGAGCAT   180GAAGAAGAGC AAGACTCCTC TTTAAATACC GCTTTGCCTG AAGATAAAAC AGCGATTGAA   240GCCAAAGAGC AAGAGCAAAA AGAAAAAAGG AAACACTGGT ATGAGCTTTT TAAAAAGAAG   300CCAAAGCCCA AAAGCTCTAT GGGAGAGTTT GTGTTTGATC AAAAAGAAAA TCGTATTTAT   360GGGAAAGGCT ATTGCAACCG GTATTTTGCT AGCTACACAT GGCAGGGCGA TAGGCACATC   420GCAATTGAAG ATAGCGGGAT TTCAAGAAAA GTGTGTAGAG ATGAGCATTT GATGGCGTTT   480GAATTGGAAT TTATGGAGAA TTTTAAGGGT AATTTTGCGG TAACTAAGGG CAAGGACACG   540CTCATTTTAG ACAACCAAAA AATGAAAATT TATTTGAAAA CGCCATGA                588(2)INFORMATION FOR SEQ ID NO:79:
(i)序列特征:
  (A)长度:2235个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...2235
(xi)序列描述:SEQ ID NO:79:ATGTTAAAAC TCGCCAGTAA AACGATTTGT TTGTCCCTAA TCAGCTCATT CACGGCTGTA      60GAAGCCTTTC AAAAACACCA AAAAGACGGC TTTTTCATAG AAGCCGGCTT TGAAACCGGG     120CTATTACAAG GCACACAAAC CCAAGAACAA ACCATAGCCA CCACTCAAGA AAAACCCAAA     180CCCAAACCCA AACCAAAACC CATTACCCCT CAAAGCACCT ATGGGAAATA CTACATCTCC     240CAAAGCACCA TTTTAAAGAA TGCGACTGAG TTGTTTGCAG AGGATAATAT CACCAACTTA     300ACCTTTTACT CTCAAAACCC TGTGTATGTA ACCGCTTATA ACCAAGAAAG CGCTGAAGAA     360GCTGGCTATG GTAATAACAG CTTGATTATG ATACAAAACT TCTTGCCTTA TAACTTGAAC     420AACATTGAGC TGAGTTACAC GGACGATCAA GGCAATGTGG TCAGTTTGGG CGTGATAGAG     480ACTATCCCTA AACAATCTCA AATCATTCTG CCCGCAAGCT TGTTTAACGA CCCACAGCTT     540AACGCCGATG GCTTCCAACA ACTCCAAACC AACACCACAC GATTTTCTGA TGCCAGCACG     600CAGAATCTGT TTAACAAGCT CAGCAAGGTT ACAACCAATC TTCAAATGAC TTATATCAAT     660TACAACCAAT TTTCTAGCGG TAACGGCAGT GGCTCTAAAC CCCCATGCCC CCCATACGAA     720AACCAAGCAA ATTGTGTGGC TAAAGTGCCG CCTTTCACCT CTCAAGACGC TAAAAATTTG     780ACCAATTTAA TGCTGAACAT GATGGCGGTG TTTGATTCTA AATCTTGGGA AGACGCCGTC     840TTAAACGCTC CTTTCCAATT CAGCGACAAC AACCTGTCAG CGCCATGTTA TTCTGATTAC     900CTTACATGCG TGAATCCTTA CAACGATGGG CTTGTTGATC CTAAATTGAT CGCCAAAAAT     960AAAGGAGATG AATACAATAT AGAAAACGGG CAAACAGGCT CAGTGATATT AACGCCGCAA    1020GATGTTATCT ATAGCTATAG AGTCGCTAAT AATATTTATG TGAATCTCTT GCCCACAAGA    1080GGAGGGGATT TAGGGTTAGG GTCTCAATAT GGTGGCCCGA ATGGCCCAGG CGATGATGGC    1140ACCAATTTTG GCGCTTTAGG GATATTGTCC CCTTTCTTAG ACCCTGAAAT ATTGTTTGGC    1200AAAGAATTGA ATAAAGTCGC CATCATGCAA TTAAGAGACA TCATCCATGA ATACGGCCAT    1260ACTTTAGGCT ATACGCATAA CGGGAACATG ACTTATCAAA GAGTGCGCAT GTGCGAAGAA    1320AACAATGGGC CAGAAGAGCG CTGTCAGGGC GGAAGGATAG AGCAAGTGGA TGGGAAAGAA    1380GTGCAAGTGT TTGACAACGG GCATGAAGTG CGAGACACCG ATGGCTCTAC CTATGATGTG    1440TGTTCTCGTT TTAAAGATAA GCCCTATACA GCGGGCAGCT ATCCTAATTC CATCTATACC    1500GATTGCTCTC AAGTCCCCGC TGGGCTTATA GGCGTTACCA GCGCTGTTTG GCAACAACTC    1560ATTGATCAAA ACGCCCTACC GGTGGATTTT ACTAATTTGA GCAGCCAAAC CAACTATTTG    1620AACGCCAGCT TGAACACGCA AGACTTTGCG ACCACCATGC TTAGCGCGAT CAGTCAAAGC    1680CTTTCATCTT CTAAATCTAG CGCCACTACT TATCGCACTT CAAAAACCTC ACGGCCCTTT    1740GGAGCCCCCC TATTAGGCGT TAATCTTAAA ATGGGCTATC AAAAATATTT TAATGATTAT    1800CTAGGGTTGT CTTCTTATGG CATTATCAAA TACAACTACG CTCAAGCCAA CAACGAAAAA    1860ATCCAGCAAT TAAGCTATGG CGTGGGAATG GATGTGCTGT TTGATTTCAT CACCAATTAC    1920ACTAACGAAA AGAACCCCAA AAGCAATCTA ACCAAGAAAG TTTTCACTTC CTCTCTTGGG    1980GTGTTTGGGG GGTTAAGGGG CTTATACAAC AGCTATTATT TGTTGAACCA ATACAAAGGG    2040AGCGGTAATT TAAATGTGAC CGGTGGGTTG AATTACCGCT ACAAGCATTC CAAATATTCT    2100ATAGGCATTA GCGTTCCTTT GGTCCAGTTG AAATCTAGGA TCGTTTCTAG CGATGGTGCT    2160TATACCAATT CTATCACCCT CAATGAAGGG GGCAGTCATT TTAAAGTGTT TTTTAATTAC    2220GGGTGGATTT TCTAA                                                     2235(2)INFORMATION FOR SEQ ID NO:80:
(i)序列特征:
  (A)长度:1590个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...1590
(xi)序列描述:SEQ ID NO:80:ATGACTTATA TCAATTACAA CCAATTTTCT AGCGGTAACG GCAGTGGCTC TAAACCCCCA       60TGCCCCCCAT ACGAAAACCA AGCAAATTGT GTGGCTAAAG TGCCGCCTTT CACCTCTCAA      120GACGCTAAAA ATTTGACCAA TTTAATGCTG AACATGATGG CGGTGTTTGA TTCTAAATCT      180TGGGAAGACG CCGTCTTAAA CGCTCCTTTC CAATTCAGCG ACAACAACCT GTCAGCGCCA      240TGTTATTCTG ATTACCTTAC ATGCGTGAAT CCTTACAACG ATGGGCTTGT TGATCCTAAA      300TTGATCGCCA AAAATAAAGG AGATGAATAC AATATAGAAA ACGGGCAAAC AGGCTCAGTG      360ATATTAACGC CGCAAGATGT TATCTATAGC TATAGAGTCG CTAATAATAT TTATGTGAAT      420CTCTTGCCCA CAAGAGGAGG GGATTTAGGG TTAGGGTCTC AATATGGTGG CCCGAATGGC      480CCAGGCGATG ATGGCACCAA TTTTGGCGCT TTAGGGATAT TGTCCCCTTT CTTAGACCCT      540GAAATATTGT TTGGCAAAGA ATTGAATAAA GTCGCCATCA TGCAATTAAG AGACATCATC      600CATGAATACG GCCATACTTT AGGCTATACG CATAACGGGA ACATGACTTA TCAAAGAGTG      660CGCATGTGCG AAGAAAACAA TGGGCCAGAA GAGCGCTGTC AGGGCGGAAG GATAGAGCAA      720GTGGATGGGA AAGAAGTGCA AGTGTTTGAC AACGGGCATG AAGTGCGAGA CACCGATGGC      780TCTACCTATG ATGTGTGTTC TCGTTTTAAA GATAAGCCCT ATACAGCGGG CAGCTATCCT      840AATTCCATCT ATACCGATTG CTCTCAAGTC CCCGCTGGGC TTATAGGCGT TACCAGCGCT      900GTTTGGCAAC AACTCATTGA TCAAAACGCC CTACCGGTGG ATTTTACTAA TTTGAGCAGC      960CAAACCAACT ATTTGAACGC CAGCTTGAAC ACGCAAGACT TTGCGACCAC CATGCTTAGC     1020GCGATCAGTC AAAGCCTTTC ATCTTCTAAA TCTAGCGCCA CTACTTATCG CACTTCAAAA     1080ACCTCACGGC CCTTTGGAGC CCCCCTATTA GGCGTTAATC TTAAAATGGG CTATCAAAAA     1140TATTTTAATG ATTATCTAGG GTTGTCTTCT TATGGCATTA TCAAATACAA CTACGCTCAA     1200GCCAACAACG AAAAAATCCA GCAATTAAGC TATGGCGTGG GAATGGATGT GCTGTTTGAT     1260TTCATCACCA ATTACACTAA CGAAAAGAAC CCCAAAAGCA ATCTAACCAA GAAAGTTTTC     1320ACTTCCTCTC TTGGGGTGTT TGGGGGGTTA AGGGGCTTAT ACAACAGCTA TTATTTGTTG     1380AACCAATACA AAGGGAGCGG TAATTTAAAT GTGACCGGTG GGTTGAATTA CCGCTACAAG     1440CATTCCAAAT ATTCTATAGG CATTAGCGTT CCTTTGGTCC AGTTGAAATC TAGGATCGTT     1500TCTAGCGATG GTGCTTATAC CAATTCTATC ACCCTCAATG AAGGGGGCAG TCATTTTAAA     1560GTGTTTTTTA ATTACGGGTG GATTTTCTAA                                      1590(2)INFORMATION FOR SEQ ID NO:81:
(i)序列特征:
  (A)长度:564个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...564
(xi)序列描述:SEQ ID NO:81:TTGGGTTGCG TATCAATGAC TCTAGGTATT GATGAAGCGG GGAGGGGGTG TTTGGCCGGT        60TCGCTTTTTG TGGCGGGGGT GGTGTGTAAT GAAAAAATAG CCTTAGAATT TCTAAAAATG       120GGTCTTAAGG ATAGCAAGAA GCTCAGCCCC AAAAAGCGCT TTTTCTTAGA AGATAAAATC       180AAAACGCATG GTGAGGTGGG GTTTTTCGTG GTTAAAAAAA GCGCGAATGA AATTGATCAT       240TTGGGCTTAG GGGCGTGTTT GAAACTCGCT ATTGAAGAAA TTGTAGAAAA TGGTTGCTCT       300TTAGCCAATG AAATAAAAAT AGATGGCAAC ACGGCGTTTG GCTTGAACAA ACGCTACCCC       360AACATACAAA CCATCATCAA GGGCGATGAA ACAATCGCTC AAATCGCTAT GGCGTCTGTT       420TTGGCGAAAG CTTCTAAGGA TAGGGAAATG TTAGAACTGC ACGCTTTGTT TAAGGAATAC       480GGCTGGGATA AGAATTGCGG GTATGGGACT AAACAACATA TAGAAGCGAT CAATAAGCTA       540GGGGCTACGC TTTCATCGGC ATAG                                              564(2)INFORMATION FOR SEQ ID NO:82:
(i)序列特征:
  (A)长度:615个碱基对
  (B)类型:核酸
  (C)链型:双链
 (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...615
(xi)序列描述:SEQ ID NO:82:ATGACTCTAG GTATTGATGA AGCGGGGAGG GGGTGTTTGG CCGGTTCGCT TTTTGTGGCG       60GGGGTGGTGT GTAATGAAAA AATAGCCTTA GAATTTCTAA AAATGGGTCT TAAGGATAGC      120AAGAAGCTCA GCCCCAAAAA GCGCTTTTTC TTAGAAGATA AAATCAAAAC GCATGGTGAG      180GTGGGGTTTT TCGTGGTTAA AAAAAGCGCG AATGAAATTG ATCATTTGGG CTTAGGGGCG      240TGTTTGAAAC TCGCTATTGA AGAAATTGTA GAAAATGGTT GCTCTTTAGC CAATGAAATA      300AAAATAGATG GCAACACGGC GTTTGGCTTG AACAAACGCT ACCCCAACAT ACAAACCATC      360ATCAAGGGCG ATGAAACAAT CGCTCAAATC GCTATGGCGT CTGTTTTGGC GAAAGCTTCT      420AAGGATAGGG AAATGTTAGA ACTGCACGCT TTGTTTAAGG AATACGGCTG GGATAAGAAT      480TGCGGGTATG GGACTAAACA ACATATAGAA GCGATCAATA AGCTAGGGGC TACGCCTTTT      540CATCGGCATA GCTTCACGCT TAAAAACCGC ATCTTAAATC CCAAACTCTT AGAGGTGGAA      600CAACGCCTTG TTTAA                                                       615(2)INFORMATION FOR SEQ ID NO:83:
(i)序列特征:
  (A)长度:579个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...579
(xi)序列描述:SEQ ID NO:83:ATGAATGCAT TGAAAAAATT AAGTTTTTGC GCCTTGTTAT CCCTAGGCCT CTTCGCTCAA       60ACAGTGCATG CTCAGCATTT AAAGGACACG ATTAACTATC CTGATTGGCT TAAAATCAAT      120CTTTTTGATA AAAAGAACCC GCCCAATCAA TATGTCGGAT CGGCTTCAAT TTCTGGTAAA      180AGGAACGATT TTTATTCCAA TTACATCCCC TATGATGACA AATTGCCCCC TGAAAAGAAC      240GCTGAAGAAA TCGCTCTTTT AAGGGCCAGA ATGAACGCTT ACAGCACTTT AGAAAGCGCT      300TTACTCACTA AAATGTGCAA TCGCATTGTT AAAGCGCTTC AAGTTAAAAA TAATGTTATC   360AGCCATTTAT TCGGGTTTGT TGATTTTTTA ACGTCTAAAT CCATTTTGGC TAAAAGGTTC   420GTGGATACCA CCAACCATCG TGTGTATGTC ATGGTGCAAT TCCCTTTCAT TCAGCCTGAA   480GACTTAATCG CTTACTTTAA AGCCAAACGC ATCGACCTTT CTTTAGCGAG CGCTACCAAT   540CTCAGCGCCA TTTTAAACAA GGCGTTGTTC CACCTCTAA                          579(2)INFORMATION FOR SEQ ID NO:84:
(i)序列特征:
  (A)长度:261个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...261
(xi)序列描述:SEQ ID NO:84:ATGAATGCAT TGAAAAAATT AAGTTTTTGC GCCTTGTTAT CCCTAGGCCT CTTCGCTCAA        60ACAGTGCATG CTCAGCATTT AAAGGACACG ATTAACTATC CTGATTGGCT TAAAATCAAT       120CTTTTTGATA AAAAGAACCC GCCCAATCAA TATGTCGGAT CGGCTTCAAT TTCTGGTAAA       180AGGAACGATT TTTATTCCAA TTACATCCCC TATGATGACA AATTGCCCCC TGAAAGACG        240CTGAAGAAAT CGCTCTTTTA A                                                 261(2)INFORMATION FOR SEQ ID NO:85:
(i)序列特征:
  (A)长度:228个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...228
(xi)序列描述:SEQ ID NO:85:TTGAAAATTT TAACCCTTTT TTTGATAGGT TTAAACGCAT TGTTCGCCCT AGATTTGAAC      60GCGCTTAAAA CAGAAATCAA AGAAACCTAT CTCAAAGAAT ACAAAGACTT AAAATTGGAA     120ATTGAAACAA TTAATTTAGA AATCCCAGAG CGTTTTTCTC ACGCTTCCAT TTTAAGCTAT     180GAATTGAACG CTTCTAACAA GCTTAAAAAA GATGGGTCGT GTTTTTAA                  228(2)INFORMATION FOR SEQ ID NO:86:
(i)序列特征:
  (A)长度:636个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...636
(xi)序列描述:SEQ ID NO:86:ATGTTTTCAA TAATTCTGGG GGGGGGGGGG GGTAATACCC CATGCGGCTT GACATGGCAA       60CACTTCAAAT TAGGGGATTT GTTTGAAATT GAAAAAACCT TAAGCTTTAA TAAAGACGCT      120TTAACGCAAG GACAAGATTA CGATTATATT ACAAGAACTT CGCAAAATCA AGGCGTTTTG      180CAAACTACAG GATTTGTCAA TGCAGAAAAT TTAAACCCAC CATTTACTTG GAGTTTAGGG      240CTTTTGCAAA TGGATTTTTT CTATCGTAAA AAGTCATGGT ATGCGGGACA ATTCATGCGA      300AAAATCACAC CAAAAACTGA AATTAAAAAT AAAATTAATT CACGCATAGC CCACTATTTC      360ACAACGCTTT TAAACGCCTT AAAACGCCCT TTATTGAGTG TATTAGTTAG GGATATTGAT      420AAAACTTTTA GGGAGCAAAA AATCCAACTA CCCCTAAAAC CCACCGCTAA AACTCAAAGC      480CTTGATGGTA TTGATTTTGA TTTCATGCAC ACCCTAATCA ACGCCCTGAT GAAGCAAACC      540ATTCAAGGCG TGGTTCAATA CTGCGACGCT AAAATACAGG CTACAAAAGA AGTTATCAGC      600CAAGAAACGC CTATTCAAAA AGACTCGTTA TTTTGA                                636(2)INFORMATION FOR SEQ ID NO:87:
(i)序列特征:
  (A)长度:1221个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...1221
(xi)序列描述:SEQ ID NO:87:GTGATTGGCC CCCTTAGCAG CCAACTCAAC GCTATTAAGT GGGGCGAGTT CAAATTAGGG       60GATTTGTTTG AAGCGAGTAA CGGCGATTTT GACATTCAAA AACGCCACAT CAATCATAAG      120GGCGAATTTG TCATCACCGC AGGGCTTAGC AATAATGGCG TTTTAGGGCA AAGCGATATA      180AAAGCAAAAG TTTTTGAAAG CCATACCATT ACTATTGACA TGTTTGGTTG CGCGTTTTAT      240CGCAGTTTTG CTTATAAAAT GGTAACACAT GCTAGGGTAT TTTCTCTCAA ACCTAAATTT      300GAAATCAACC ATAAAATCGG CTTGTTTTTA TCCACGCTAT TTTTTGGTTA CCATAAAAAA      360TTCGGCTATG AAAACATGTG TTCATGGGCA AAAATTAAAA ACGATAAAGT CATTCTACCC      420CTAAAACCCA CCGCTAACAC TCAAACCCTT GAGGGTATTG ATTTTGATTT CATGGAAAAA      480TTCATAGCCG AACTTGAGCA GTGTCGGCTC GCCGAACTTC AGGCTTATTT AAAAGCTACA      540GGGCTAGAAA ACACCACCCT TTCTAACGAT GAAGAAAATG CCCTTAATGT TTTCAATAAT      600TCTGGGGGGG GGGGGGGTAA TACCCCATGC GGCTTGACAT GGCAACACTT CAAATTAGGG      660GATTTGTTTG AAATTGAAAA AACCTTAAGC TTTAATAAAG ACGCTTTAAC GCAAGGACAA      720GATTACGATT ATATTACAAG AACTTCGCAA AATCAAGGCG TTTTGCAAAC TACAGGATTT      780GTCAATGCAG AAAATTTAAA CCCACCATTT ACTTGGAGTT TAGGGCTTTT GCAAATGGAT      840TTTTTCTATC GTAAAAAGTC ATGGTATGCG GGACAATTCA TGCGAAAAAT CACACCAAAA      900ACTGAAATTA AAAATAAAAT TAATTCACGC ATAGCCCACT ATTTCACAAC GCTTTTAAAC      960GCCTTAAAAC GCCCTTTATT GAGTGTATTA GTTAGGGATA TTGATAAAAC TTTTAGGGAG     1020CAAAAAATCC AACTACCCCT AAAACCCACC GCTAAAACTC AAAGCCTTGA TGGTATTGAT     1080TTTGATTTCA TGCACACCCT AATCAACGCC CTGATGAAGC AAACCATTCA AGGCGTGGTT     1140CAATACTGCG ACGCTAAAAT ACAGGCTACA AAAGAAGTTA TCAGCCAAGA AACGCCTATT     1200CAAAAAGACT CGTTATTTTG A                                               1221(2)INFORMATION FOR SEQ ID NO:88:
(i)序列特征:
  (A)长度:828个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...828
(xi)序列描述:SEQ ID NO:88:ATGAGTAAGA GTTTATACCA AACTTTAAAC GTGAGCGAAA ACGCCAGCCA AGATGAAATC      60AAAAAATCCT ACCGCCGTTT AGCCAGGCAA TACCACCCGG ATTTGAATAA AACCAAAGAA     120GCCGAAGAGA AATTCAAAGA AATCAACGCC GCTTATGAAA TTTTGAGCGA TGAAGAAAAA     180CGCCGCCAAT ACGATCAATT TGGCGACAAC ATGTTTGGCG GGCAGAATTT CAGCGATTTT     240GCCAGAAGCC GTGGTCCTAG TGAAGATTTA GATGATATTT TAAGCTCTAT TTTTGGGAAA     300GGAGGCTTTT CGCAAAGATT TTCTCAAAAT TCGCAAGGCT TTTCTGGCTT TAATTTTTCC     360AATTTCGCCC CTGAAAATTT AGATGTAACC GCTATTTTAA ATGTCTCTGT TTTAGACACC      420CTTTTAGGCA ATAAAAAACA AGTGAGCGTC AATAATGAGA CTTTTAGCCT TAAAATCCCT      480ATCGGCGTGG AAGAGGGCGA AAAGATTAGG GTTCGCAACA AAGGGAAAAT GGGGCGAACG      540GGTAGGGGCG ATTTGCTCTT ACAGATCCAT ATTGAAGAAG ATGAAATGTA TAGGCGCGAA      600AAAGACGATA TTATCCAAAT CTTTGATTTA CCCTTAAAAA CGGCTCTTTT TGGAGGGAAA      660ATTGAAATCG CTACTTGGCA TAAAACCTTA ACCCTAACCA TTCCCCCTAA CACCAAAGCC      720ATGCAAAAAT TCCGCATCAA AGACAAAGGG ATCAAAAGCA GAAAAACTTC GCATGTGGGG      780GATTGTATTG CAAGCTCGTT TGATCTGCTA AAATTGAAAC GCTTCTAA                   828(2)INFORMATION FOR SEQ ID NO:89:
(i)序列特征:
  (A)长度:837个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...837
(xi)序列描述:SEQ ID NO:89:ATGAGTAAGA GTTTATACCA AACTTTAAAC GTGAGCGAAA ACGCCAGCCA AGATGAAATC        60AAAAAATCCT ACCGCCGTTT AGCCAGGCAA TACCACCCGG ATTTGAATAA AACCAAAGAA       120GCCGAAGAGA AATTCAAAGA AATCAACGCC GCTTATGAAA TTTTGAGCGA TGAAGAAAAA       180CGCCGCCAAT ACGATCAATT TGGCGACAAC ATGTTTGGCG GGCAGAATTT CAGCGATTTT       240GCCAGAAGCC GTGGTCCTAG TGAAGATTTA GATGATATTT TAAGCTCTAT TTTTGGGAAA       300GGAGGCTTTT CGCAAAGATT TTCTCAAAAT TCGCAAGGCT TTTCTGGCTT TAATTTTTCC       360AATTTCGCCC CTGAAAATTT AGATGTAACC GCTATTTTAA ATGTCTCTGT TTTAGACACC       420CTTTTAGGCA ATAAAAAACA AGTGAGCGTC AATAATGAGA CTTTTAGCCT TAAAATCCCT       480ATCGGCGTGG AAGAGGGCGA AAAGATTAGG GTTCGCAACA AAGGGAAAAT GGGGCGAACG       540GGTAGGGGCG ATTTGCTCTT ACAGATCCAT ATTGAAGAAG ATGAAATGTA TAGGCGCGAA       600AAAGACGATA TTATCCAAAT CTTTGATTTA CCCTTAAAAA CGGCTCTTTT TGGAGGGAAA       660ATTGAAATCG CTACTTGGCA TAAAACCTTA ACCCTAACCA TTCCCCCTAA CACCAAAGCC  720ATGCAAAAAT TCCGCATCAA AGACAAAGGG ATCAAAAGCA GAAAAACTTC GCATGTGGGG  780GATTGTATTG CAAGCTCGTT TGATCTGCCT AAAATTGAAA CGCTTCTAAT GAGTTGA     837(2)INFORMATION FOR SEQ ID NO:90:
(i)序列特征:
  (A)长度:699个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...699
(xi)序列描述:SEQ ID NO:90:GTGGTTCAAA AATTTAATTT TTATAAGACA GGTGGCATGC GTTTAAAACA TTTTAAGACA    60TTCCTTTTTA TCACAATGGC GGTGATTGTG ATAGGCACTG GTTGTGCGAA TAAAAAGAAA   120AAAAAAGATG AATACAACAA ACCGGCGATC TTTTGGTATC AAGGGATTTT GAGAGAAATT   180CTTTTTGCTA ATTTAGAAAC AGCGGACAAT TACTATTCTT CCTTACAGAG CGAACACATC   240AATTCCCCCC TTGTCCCAGA AGCTATGCTA GCTTTAGGGC AAGCGCACAT GAAAAAGAAA   300GAGTATGTTT TAGCGTCTTT TTACTTTGAT GAATACATCA AGCGCTTTGG GACGAAGGAC   360AATGTGGATT ATTTGACCTT TTTGAAACTG CAATCGCATT ATTACGCTTT CAAAAACCAT   420TCTAAAGACC AGGAATTTAT CTCTAATTCT ATTGTGAGTT TAGGCGAATT TATAGAAAAA   480TACCCTAACA GCCGTTACCG CCCCTATGTA GAATACATGC AAATCAAATT CATTTTAGGG   540CAAAATGAGC TCAATCGCGC GATCGCGAAT GTCTATAAAA AACGCCACAA GCCCGAGGGC   600GTGAAACGCT ATTTAGAAAG GATAGATGAG ACTTTAGAAA AAGAGACTAA AGCCAAACCA   660TCGCACATGC CTTGGTATGT GTTAATTTTT GATTGGTAG                          699(2)INFORMATION FOR SEQ ID NO:91:
(i)序列特征:
  (A)长度:345个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...345
(xi)序列描述:SEQ ID NO:91:ATGCGTTTTT TGAATAACAA ACATAGAGAA AAGGGCTTAA AGGCTGAAGA AGAAGCTTGC      60GGGTTTTTAA AAACGCTGGG TTTTGAAATG ATAGAGAGGA ACTTTTTTTC ACAATTTGGT     120GAAATTGATA TTATCGCTTT GAAAAAAGGG GTTTTGCATT TCATTGAAGT CAAAAGCGGG     180GAAAATTTTG ATCCCATTTA TGCGATCACG CCGAGCAAAT TAAAAAAGAT GATTAAAACG     240ATCCGCTGTT ATTTGTCTCA AAAAGATCCC AATAGCGATT TTTGCATTGA CGCTCTTATT     300GTGAAAAATG GTAAATTTGA GCTTTTAGAA AATATCACTT TTTAG                     345(2)INFORMATION FOR SEQ ID NO:92:
(i)序列特征:
  (A)长度:306个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...306
(xi)序列描述:SEQ ID NO:92:ATGGGCAGCA TTGGGGCTAT GACTAAAGGG AGCTCTGATA GGTATTTTCA AGAGGGCGTG       60GCGAGTGAAA AATTAGTCCC AGAAGGCATT GAGGGGCGTG TGCCTTATCG TGGTAAGGTT      120TCGGATATGA TTTTCCAATT AGTAGGGGGC GTGCGTTCTT CTATGGGGTA TCAGGGGGCG      180AAGAATATTT TGGAATTGTA TCAAAACGCT GAATTTGTAG AAATCACTAG CGCGGGGTTA      240AAAAAAAGCC ATGTGCATGG CGTGGATATT ACTAAAGAAG CCCCTAATAT TATGGGTGAA      300TTTTAA                                                                 306(2)INFORMATION FOR SEQ ID NO:93:
(i)序列特征:
  (A)长度:1446个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...1446
(xi)序列描述:SEQ ID NO:93:ATGAGAATTT TACAAAGGGC TTTGACTTTT GAAGACGTGT TGATGGTGCC TAGAAAATCC        60AGCGTTTTAC CTAAAGATGT GAGCTTAAAG TCTCGCCTAA CCAAAAACAT TGGTTTGAAT       120ATCCCTTTTA TTAGTGCGGC TATGGATACG GTTACAGAGC ATAAAACCGC TATCGCTATG       180GCGCGCCTTG GGGGTATTGG CATCGTGCAT AAAAACATGG ATATTCAAAC GCAAGTCAAA       240GAAATCACTA AAGTTAAAAA AAGCGAGAGC GGGGTGATTA ATGATCCTAT TTTTATCCAT       300GCGCACAGGA CGCTAGCGGA CGCTAAAGTC ATAACGGATA ATTATAAGAT TTCAGGCGTG       360CCTGTGGTAG ATGATAAGGG GTTGTTGATT GGGATTTTAA CCAACAGAGA CGTGCGTTTT   420GAAACCGATT TGAGTAAAAA AGTGGGCGAT GTGATGACTA AAATGCCTTT AGTTACCGCT   480CATGTGGGCA TTAGCTTAGA TGAAGCGAGC GATTTGATGC ACAAGCATAA GATTGAAAAA   540TTGCCCATTG TGGATAAAGA TAATGTTTTA AAAGGCTTGA TCACGATCAA AGACATTCAA   600AAACGCATTG AATACCCTGA GGCCAATAAA GATGATTTTG GGAGGTTGAG AGTGGGGGCG   660GCTATTGGAG TGGGGCAGTT GGATAGGGCT GAAATGTTAG TTAAAGCGGG GGTGGATGCG   720TTGGTGTTAG ACAGCGCGCA TGGGCATTCA GCCAATATTT TACACACTTT AGAAGAGATT   780AAAAAAAGCT TGGTAGTGGA TGTGATTGTG GGGAATGTGG TTACTAAAGA AGCCACAAGC   840GATTTGATTA GCGCGGGAGC GGACGCTGTT AAAGTGGGTA TTGGGCCAGG AAGCATTTGC   900ACCACTAGGA TTGTGGCCGG GGTGGGAATG CCCCAAGTGA GCGCAATTGA TAATTGCGTG   960GAAGTGGCGT CTAAATTTGA TATTCCTGTG ATTGCCGATG GAGGGATCCG CTATTCAGGC  1020GATGTGGCTA AGGCTCTAGC TTTAGGAGCA TCAAGCGTGA TGATAGGCTC TTTACTCGCT  1080GGCACAGAAG AATCTCCAGG GGATTTTATG ATTTACCAAG GGAGGCAATA TAAAAGCTAT  1140AGGGGCATGG GCAGCATTGG GGCTATGACT AAAGGGAGCT CTGATAGGTA TTTTCAAGAG  1200GGCGTGGCGA GTGAAAAATT AGTCCCAGAA GGCATTGAGG GGCGTGTGCC TTATCGTGGT  1260AAGGTTTCGG ATATGATTTT CCAATTAGTA GGGGGCGTGC GTTCTTCTAT GGGGTATCAG  1320GGGGCGAAGA ATATTTTGGA ATTGTATCAA AACGCTGAAT TTGTAGAAAT CACTAGCGCG  1380GGGTTAAAAG AAAGCCATGT GCATGGCGTG GATATTACTA AAGAAGCCCC TAATTATTAT  1440GGGTGA                                                             1446(2)INFORMATION FOR SEQ ID NO:94:
(i)序列特征:
  (A)长度:615个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...615
(xi)序列描述:SEQ ID NO:94:ATGCAAGGGT TTCTTTTACA AACACAAAGC ATAAGAGATG AAGATTTGAT CGTGCACGTT       60TTAACCAAAA ACCAGCTCAA AACCCTCTAT CGTTTCTATG GCAAACGCCA CAGCGTGCTG      120AATGTGGGTC GTAAAATTGA TTTTGAAGAA GAAAACGATG ATAAATTTTT ACCCAAGTTA      180AGGAATATTT TGCATTTAGG CTATATTTGG GAAAGAGAAA TGGAGCGCTT GTTTTTTTGG      240CAACGCTTTT GCGCTCTTTT GTTCAAGCAT TTAGAGGGCG TGCATTCTTT AGATAGCATC      300TATTTTGACA CTTTAGATGA TGGGGCTAGC AAACTCTCCA AACAGCACCC CTTAAGAGTG      360ATTTTAGAAA TGTATGCAGT CCTTTTGAAT TTTGAAGGGC GCTTGCAAAG TTACAATTCT      420TGTTTTTTAT GCGATGCAAA ATTAGAGCGT TCTGTCGCTT TAGCGCAAGG GTTTATTTTA      480GCGCACCCCT CTTGCTTGAA AGCTAAAAGC TTGGATTTAG AAAAAATCCA AGCTTTTTTC      540CGCACTCAAA GCACGATTGA TCTAGAAACA GAAGAAGTGG AAGAATTATG GCGCACGCTG      600AATTTAGGGT TTTGA                                                       615(2)INFORMATION FOR SEQ ID NO:95:
(i)序列特征:
  (A)长度:249个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...249
(xi)序列描述:SEQ ID NO:95:ATGGGCGTCG GACGGGTCGG CAATATGGCA CTGTTGGCGT GTGCAGGTCC GATGGGCATC       60GGCGCTATTG CTATCGCCAT TAACGGCGGC AGACAACGGT CGCGGATGTT GGTGGTCGAT      120ATAGACGACA AACGTCTGGA GCAGGTACAG AAGATGCTGC CGGGGAATTG GCGGCCAGTA      180ACGGCATTGA GCTGGTGTCT GTGCATACCA AAGCGAGGAG CGATCCGTGC CAGATGCTGC      240GAGCGCTGA                                                              249(2)INFORMATION FOR SEQ ID NO:96:
(i)序列特征:
  (A)长度:204个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...204
(xi)序列描述:SEQ ID NO:96:TTGTCCGGTA CAGCCGTGAG TTGCCGGTGC ACATGCCGCA TACAGTTGGT ATTGGTGCGC       60ACCAGCATCC CGGTTGTTAT CGGGTGCTCA TGCCCATTCC TTTCCAGTAT TGGGTTCACA      120ACGGGAACCC ACCAATCACC CGTTAAACGC TGCGGGGTTA ACGCCGGAAA AACACCGTCA      180AAAAAACATT TGCATTTAAA CTAA                                             204(2)INFORMATION FOR SEQ ID NO:97:
(i)序列特征:
  (A)长度:345个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...345
(xi)序列描述:SEQ ID NO:97:GTGTGGCTGG CGGCGCTGGG CTTCCTGATC ACCGCGGTGG GGCTGCCGGT GATCACCGTG    60ATCGCCCTGG CCAAGGTCGG CGGTTCGTCG ACGCCCTCAG CCATCCGATC GGCAGGTATG   120CCGGCGGCCT GCTGGCGGCG GTCTGCTACC TGGCGGTCGG CCCGCTGTTC GCCATTCCGC   180GCACCGCCAC GGTGTCCTTC GAAGGTCAGC GTGGTGCCGC TGCTCGGCGA AGAAGCGGCA   240CGGCGCTGTT CGTCTACAGC CTGGCGTACT TCCTCCTCGC CCTGGCCATC TCCCTCTACC   300CCGGTCGCCT GCTGGACACC GTCGGACGCT TCCTCGCCCC GCTGA                   345(2)INFORMATION FOR SEQ ID NO:98:
(i)序列特征:
  (A)长度:228个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc特征
  (B)位置1...228
(xi)序列描述:SEQ ID NO:98:Met Arg Phe Lys Gly Ser Arg Val Glu Ala Phe Leu Gly Ala Leu Glu1               5                   10                  15Phe Gln Glu Asn Glu Tyr Glu Glu Phe Lys Glu Leu Tyr Glu Ser Leu
        20                  25                  30Lys Thr Lys Gln Lys Pro His Thr Leu Phe Ile Ser Cys Val Asp Ser
    35                  40                  45Arg Val Val Pro Asn Leu Ile Thr Gly Thr Gln Pro Gly Glu Leu Tyr
50                  55                  60Val Ile Arg Asn Met Gly Asn Val Ile Pro Pro Lys Thr Ser Tyr Lys65                  70                  75                  80Glu Ser Leu Ser Thr Ile Ala Ser Val Glu Tyr Ala Ile Ala His Val
            85                  90                  95Gly Val Gln Asn Leu Ile Ile Cys Gly His Ser Asp Cys Gly Ala Cys
        100                 105                 110Gly Ser Ile His Leu Ile His Asp Glu Thr Thr Lys Ala Lys Thr Pro
    115                 120                 125Tyr Ile Ala Asn Trp Ile Gln Phe Leu Glu Pro Ile Lys Glu Glu Leu
130                 135                 140Lys Asn His Pro Gln Phe Ser Asn His Phe Ala Lys Arg Ser Trp Leu145                 150                 155                 160Thr Glu Arg Leu Asn Ala Arg Leu Gln Leu Asn Asn Leu Leu Ser Tyr
            165                 170                 175Asp Phe Ile Gln Glu Arg Val Ile Asn Asn Glu Leu Lys Ile Phe Gly
        180                 185                 190Trp His Tyr Ile Ile Glu Thr Gly Arg Ile Tyr Asn Tyr Asn Phe Glu
    195                 200                 205Ser His Phe Phe Glu Pro Ile Glu Glu Thr Ile Lys Gln Arg Ile Ser
210                 215                 220His Glu Asn Phe225(2)INFORMATION FOR SEQ ID NO:99:
(i)序列特征:
  (A)长度:221个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...221
(xi)序列描述:SEQ ID NO:99:Val Glu Ala Phe Leu Gly Ala Leu Glu Phe Gln Glu Asn Glu Tyr Glu1               5                   10                  15Glu Phe Lys Glu Leu Tyr Glu Ser Leu Lys Thr Lys Gln Lys Pro His
        20                  25                  30Thr Leu Phe Ile Ser Cys Val Asp Ser Arg Val Val Pro Asn Leu Ile
    35                  40                  45Thr Gly Thr Gln Pro Gly Glu Leu Tyr Val Ile Arg Asn Met Gly Asn
50                  55                  60Val Ile Pro Pro Lys Thr Ser Tyr Lys Glu Ser Leu Ser Thr Ile Ala65                  70                  75                  80Ser Val Glu Tyr Ala Ile Ala His Val Gly Val Gln Asn Leu Ile Ile
            85                  90                  95Cys Gly His Ser Asp Cys Gly Ala Cys Gly Ser Ile His Leu Ile His
        100                 105                 110Asp Glu Thr Thr Lys Ala Lys Thr Pro Tyr Ile Ala Asn Trp Ile Gln
    115                 120                 125Phe Leu Glu Pro Ile Lys Glu Glu Leu Lys Asn His Pro Gln Phe Ser
130                 135                 140Asn His Phe Ala Lys Arg Ser Trp Leu Thr Glu Arg Leu Asn Ala Arg145                 150                 155                 160Leu Gln Leu Asn Asn Leu Leu Ser Tyr Asp Phe Ile Gln Glu Arg Val
            165                 170                 175Ile Asn Asn Glu Leu Lys Ile Phe Gly Trp His Tyr Ile Ile Glu Thr
        180                 185                 190Gly Arg Ile Tyr Asn Tyr Asn Phe Glu Ser His Phe Phe Glu Pro Ile
    195                 200                 205Glu Glu Thr Ile Lys Gln Arg Ile Ser His Glu Asn Phe
210                 215                 220(2)INFORMATION FOR SEQ ID NO:100:
(i)序列特征:
  (A)长度:335个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...335
(xi)序列描述:SEQ ID NO:100:Met Leu Val Thr Arg Phe Lys Lys Ala Phe Ile Ser Tyr Ser Leu Gly1               5                   10                  15Val Leu Val Val Ser Leu Leu Leu Asn Val Cys Asn Ala Ser Ala Gln
        20                  25                  30Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gln Thr Ile Lys Leu Pro
    35                  40                  45Val Ser Lys Ile Ala Tyr Ile Gly Ser Tyr Val Glu Val Pro Ala Met
50                  55                  60Leu Asn Val Trp Asp Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys65                  70                  75                  80Asp Asp Ile Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val
            85                  90                  95Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu
        100                 105                 110Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys
    115                 120                 125Ala                                                         Val
Figure A9718163002291
195                 200                 205Ser Ser Asp Ile Leu Glu Lys Gly Gly Ile Asp Asn Phe Gly Leu Lys
210                 215                 220Tyr Val Lys Phe Gly Arg Ala Asp Ile Ser Val Glu Lys Ile Val Lys225                 230                 235                 240Glu Asn Pro Glu Ile Ile Phe Ile Trp Trp Val Ser Pro Leu Thr Pro
            245                 250                 255Glu Asp Val Leu Asn Asn Pro Lys Phe Ser Thr Ile Lys Ala Ile Lys
        260                 265                 270Asn Lys Gln Val Tyr Lys Leu Pro Thr Met Asp Ile Gly Gly Pro Arg
    275                 280                 285Ala Pro Leu Ile Ser Leu Phe Ile Ala Leu Lys Ala His Pro Glu Ala
290                 295                 300Phe Lys Gly Val Asp Ile Asn Ala Ile Val Lys Asp Tyr Tyr Lys Val305                 310                 315                 320Val Phe Asp Leu Asn Asp Ala Glu Ile Glu Pro Phe Leu Trp His
            325                 330                 335(2)INFORMATION FOR SEQ ID NO:101:
(i)序列特征:
  (A)长度:274个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...274
(xi)序列描述:SEQ ID NO:101:Met Leu Val Thr Arg Phe Lys Lys Ala Phe Ile Ser Tyr Ser Leu Gly1               5                   10                  15Val Leu Val Val Ser Leu Leu Leu Asn Val Cys Asn Ala Ser Ala Gln
        20                  25                  30Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gln Thr Ile Lys Leu Pro
    35                  40                  45Val Ser Lys Ile Ala Tyr Ile Gly Ser Tyr Val Glu Val Pro Ala Met
50                  55                  60Leu Asn Val Trp Asp Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys65                  70                  75                  80Asp Asp Ile Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val
            85                  90                  95Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu
        100                 105                 110Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys
    115                 120                 125Ala Val Glu His Ala Lys Lys Phe Gly Ile Ser Phe Leu Ser Phe Gln
130                 135                 140Glu Thr Thr Ile Ala Glu Ala Met Gln Ala Met Gln Ala Gln Ala Thr145                 150                 155                 160Val Leu Glu Ile Asp Ala Ser Lys Lys Phe Ala Lys Met Gln Glu Thr
            165                 170                 175Leu Asp Phe Ile Ala Asp Arg Leu Lys Gly Val Lys Lys Lys Lys Gly
        180                 185                 190Val Glu Leu Phe His Lys Ala Asn Lys Ile Ser Gly His Gln Ala Ile
    195                 200                 205Asn Ser Asp Ile Leu Gln Gln Gly Gly Ile Asp Asn Phe Gly Leu Lys
210                 215                 220Tyr Val Lys Phe Gly Arg Ala Asp Ile Ser Val Glu Lys Ile Val Lys225                 230                 235                 240Glu Asn Pro Glu Ile Ile Phe Ile Arg Trp Val Thr Pro Leu Thr Pro
            245                 250                 255Asp Tyr Val Leu Asn Asn Pro Lys Phe Ser Thr Ile Asn Ala Ile Lys
        260                 265                 270Asn Ile(2)INFORMATION FOR SEQ ID NO:102:
(i)序列特征:
  (A)长度:428个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...428
(xi)序列描述:SEQ ID NO:102:Met Lys Lys Lys Phe Leu Ser Leu Thr Leu Gly Ser Leu Leu Val Ser1               5                   10                  15Ala Leu Ser Ala Glu Asp Asn Gly Phe Phe Val Ser Ala Gly Tyr Gln
        20                  25                  30Ile Gly Glu Ser Ala Gln Met Val Lys Asn Thr Lys Gly Ile Gln Asp
    35                  40                  45Leu Ser Asp Ser Tyr Glu Arg Leu Asn Asn Leu Leu Thr Asn Tyr Ser
50                  55                  60Val Leu Asn Ala Leu Ile Arg Gln Ser Ala Asp Pro Asn Ala Ile Asn65                  70                  75                  80Asn Ala Arg Gly Asn Leu Asn Ala Ser Ala Lys Asn Leu Ile Asn Asp
            85                  90                  95Lys Lys Asn Ser Pro Ala Tyr Gln Ala Val Leu Leu Ala Leu Asn Ala
        100                 105                 110Ala Ala Gly Leu Trp Gln Val Met Ser Tyr Ala Ile Ser Pro Cys Gly
    115                 120                 125Pro Gly Lys Asp Thr Ser Lys Asn Gly Gly Val Gln Thr Phe His Asn
130                 135                 140Thr Pro Ser Asn Gln Trp Gly Gly Thr Thr Ile Thr Cys Gly Thr Thr145                 150                 155                 160Gly Tyr Glu Pro Gly Pro Tyr Ser Ile Leu Ser Thr Glu Asn Tyr Ala
            165                 170                 175Lys Ile Asn Lys Ala Tyr Gln Ile Ile Gln Lys Ala Phe Gly Ser Ser
        180                 185                 190Gly Lys Asp Ile Pro Ala Leu Ser Asp Thr Asn Thr Glu Leu Lys Phe
    195                 200                 205Thr Ile Asn Lys Asn Asn Gly Asn Thr Asn Thr Asn Asn Asn Gly Glu
210                 215                 220Glu Ile Val Thr Lys Asn Asn Ala Gln Val Leu Leu Glu Gln Ala Ser225                 230                 235                 240Thr Ile Ile Thr Thr Leu Asn Ser Ala Cys Pro Trp Ile Asn Asn Gly
            245                 250                 255Gly Ala Gly Gly Ala Ser Ser Gly Ser Leu Trp Glu Gly Ile Tyr Leu
        260                 265                 270Lys Gly Asp Gly Ser Ala Cys Gly Ile Phe Lys Asn Glu Ile Ser Ala
    275                 280                 285Ile Gln Asp Met Ile Lys Asn Ala Ala Ile Ala Val Glu Gln Ser Lys
290                 295                 300Ile Val Ala Ala Asn Ala Gln Asn Gln Arg Asn Leu Asp Thr Gly Lys305                 310                 315                 320Thr Phe Asn Pro Tyr Lys Asp Ala Asn Phe Ala Gln Ser Met Phe Ala
            325                 330                 335Asn Ala Lys Ala Gln Ala Glu Ile Leu Asn Arg Ala Gln Ala Val Val
        340                 345                 350Lys Asp Phe Glu Arg Ile Pro Ala Glu Phe Val Lys Asp Ser Leu Gly
    355                 360                 365Val Cys His Glu Val Gln Asn Gly His Leu Arg Gly Thr Pro Ser Gly
370                 375                 380Thr Val Thr Asp Asn Thr Trp Gly Ala Gly Cys Ala Tyr Val Gly Glu385                 390                 395                 400Thr Val Thr Asn Leu Lys Asp Ser Ile Ala His Phe Gly Asp Gln Ala
            405                 410                 415Glu Arg Ile His Asn Ala Arg Asn Leu Ala Thr Leu
        420                 425(2)INFORMATION FOR SEQ ID NO:103:
(i)序列特征:
  (A)长度:178个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...178
(xi)序列描述:SEQ ID NO:103:Met Asn Pro Leu Leu Gln Asp Tyr Ala Arg Ile Leu Leu Glu Trp Asn1               5                   10                  15Gln Thr His Asn Leu Ser Gly Ala Arg Asn Leu Ser Glu Leu Glu Pro
        20                  25                  30Gln Ile Thr Asp Ala Leu Lys Pro Leu Glu Phe Val Lys Asp Phe Lys
    35                  40                  45Ser Cys Leu Asp Ile Gly Ser Gly Ala Gly Leu Pro Ala Ile Pro Leu
50                  55                  60Ala Leu Glu Lys Pro Glu Ala Gln Phe Ile Leu Leu Glu Pro Arg Val65                  70                  75                  80Lys Arg Ala Ala Phe Leu Asn Tyr Leu Lys Ser Val Leu Pro Leu Asn
            85                  90                  95Asn Ile Glu Ile Ile Lys Lys Arg Leu Glu Asp Tyr Gln Asn Leu Leu
        100                 105                 110Gln Val Asp Leu Ile Thr Ser Arg Ala Val Ala Ser Ser Ser Phe Leu
    115                 120                 125Ile Glu Lys Ser Gln Arg Phe Leu Lys Asp Lys Gly Tyr Phe Leu Phe
130                 135                 140Tyr Lys Gly Glu Gln Leu Lys Asn Glu Ile Ala Tyr Lys Thr Thr Glu145                 150                 155                 160Cys Phe Met His Gln Lys Arg Val Tyr Phe Tyr Lys Ser Lys Glu Ser
            165                 170                 175Leu Cys(2)INFORMATION FOR SEQ ID NO:104:
(i)序列特征:
  (A)长度:240个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...240
(xi)序列描述:SEQ ID NO:104:Leu Gly Leu Lys Lys Arg Ala Ile Leu Trp Ser Leu Met Gly Phe Cys1               5                   10                  15Ala Gly Leu Ser Ala Leu Asp Tyr Asp Thr Leu Asp Pro Lys Tyr Tyr
        20                  25                  30Lys Tyr Ile Lys Tyr Tyr Lys Ala Tyr Glu Asp Lys Glu Val Glu Glu
    35                  40                  45Leu Ile Arg Asp Leu Lys Arg Ala Asn Ala Lys Ser Gly Leu Ile Leu
50                  55                  60Gly Ile Asn Thr Gly Phe Phe Tyr Asn His Glu Ile Met Val Lys Thr65                  70                  75                  80Asn Ser Ser Ser Ile Thr Gly Asn Ile Leu Asn Tyr Leu Phe Ala Tyr
            85                  90                  95Gly Leu Arg Phe Gly Tyr Gln Thr Phe Arg Pro Ser Phe Phe Ala Arg
        100                 105                 110Leu Val Lys Pro Asn Ile Ile Gly Arg Arg Ile Tyr Ile Gln Tyr Tyr
    115                 120                 125Gly Gly Ala Pro Lys Lys Ala Gly Phe Gly Ser Val Gly Phe Gln Ser
130                 135                 140Val Met Leu Asn Gly Asp Phe Leu Leu Asp Phe Pro Leu Pro Phe Val145                 150                 155                 160Gly Lys Tyr Leu Tyr Met Gly Gly Tyr Met Gly Leu Gly Leu Gly Val
            165                 170                 175Val Ala His Gly Val Asn Tyr Thr Ala Glu Trp Gly Met Ser Phe Asn
        180                 185                 190Ala Gly Leu Ala Leu Thr Val Leu Glu Lys Asn Arg Ile Glu Phe Glu
    195                 200                 205Phe Lys Ile Leu Asn Asn Phe Pro Phe Leu Gln Ser Asn Ser Ser Lys
210                 215                 220Glu Thr Trp Trp Gly Ala Ile Ala Ser Ile Gly Tyr Gln Tyr Val Phe225                 230                 235                 24C(2)INFORMLTION FOR SEQ ID NO:105:
(i)序列特征:
  (A)长度:313个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...313
(xi)序列描述:SEQ ID NO:105:Leu Lys Leu Lys Tyr Trp Leu Val Tyr Leu Ala Phe Ile Ile Gly Leu1               5                   10                  15Gln Ala Thr Asp Tyr Asp Asn Leu Glu Glu Glu Asn Gln Gln Leu Asp
        20                  25                  30Glu Lys Ile Asn Asn Leu Lys Arg Gln Leu Thr Glu Lys Gly Val Ser
    35                  40                  45Pro Lys Glu Met Asp Lys Asp Lys Phe Glu Glu Glu Tyr Leu Glu Arg
50                  55                  60Thr Tyr Pro Lys Ile Ser Ser Lys Lys Arg Lys Lys Leu Leu Lys Ser65                  70                  75                  80Phe Ser Ile Ala Asp Asp Lys Ser Gly Val Phe Leu Gly Gly Gly Tyr
            85                  90                  95Ala Tyr Gly Glu Leu Asn Leu Ser Tyr Gln Gly Glu Met Leu Asp Arg
        100                 105                 110Tyr Gly Ala Asn Ala Pro Ser Ala Phe Lys Asn Asn Ile Asn Ile Asn
    115                 120                 125Ala Pro Val Ser Met Ile Ser Val Lys Phe Gly Tyr Gln Lys Tyr Phe
130                 135                 140Val Pro Tyr Phe Gly Thr Arg Phe Tyr Gly Asp Leu Leu Leu Gly Gly145                 150                 155                 160Gly Ala Leu Lys Glu Asn Ala Leu Lys Gln Pro Val Gly Ser Phe Phe
            165                 170                 175Tyr Val Leu Gly Ala Met Asn Thr Asp Leu Leu Phe Asp Met Pro Leu
        180                 185                 190Asp Phe Lys Thr Lys Lys His Phe Leu Gly Val Tyr Ala Gly Phe Gly
    195                 200                 205Ile Gly Leu Met Leu Tyr Gln Asp Lys Pro Asn Gln Asn Gly Arg Asn
210                 215                 220Leu Ile Val Gly Gly Tyr Ser Ser Pro Asn Phe Leu Trp Lys Ser Leu225                 230                 235                 240Ile Glu Val Asp Tyr Thr Phe Asn Val Gly Val Ser Leu Thr Leu Tyr
            245                 250                 255Arg Lys His Arg Leu Glu Ile Gly Thr Lys Leu Pro Ile Ser Tyr Leu
        260                 265                 270Arg Met Gly Val Glu Glu Gly Ala Ile Tyr His Asn Lys Glu Asn Asp
    275                 280                 285Glu Arg Leu Leu Ile Ser Ala Asn Asn Gln Phe Lys Arg Ser Ser Phe
290                 295                 300Leu Leu Val Asn Tyr Ala Phe Ile Phe305                 310(2)INFORMATION FOR SEQ ID NO:106:
(i)序列特征:
  (A)长度:393个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...393
(xi)序列描述:SEQ ID NO:106:Met Thr Ser Ala Ser Ser His Ser Phe Lys Glu Gln Asp Phe His Ile1               5                   10                  15Pro Ile Ala Phe Ala Phe Asp Lys Asn Tyr Leu Ile Pro Ala Gly Ala
        20                  25                  30Cys Ile Tyr Ser Leu Leu Glu Ser Ile Ala Lys Ala Asn Lys Lys Ile
    35                  40                  45Arg Tyr Thr Leu His Ala Leu Val Val Gly Leu Asn Glu Glu Asp Lys
50                  55                  60Thr Lys Leu Asn Gln Ile Thr Glu Pro Phe Lys Glu Phe Ala Val Leu65                  70                  75                  80Glu Val Lys Asp Ile Glu Pro Phe Leu Asp Thr Ile Pro Asn Pro Phe
            85                  90                  95Asp Glu Asp Phe Thr Lys Arg Phe Ser Lys Met Val Leu Val Lys Tyr
        100                 105                 110Phe Leu Ala Asp Leu Phe Pro Lys Tyr Ser Lys Met Val Trp Ser Asp
    115                 120                 125Val Asp Val Ile Phe Cys Asn Glu Phe Ser Ala Asp Phe Leu Asn Ile
130                 135                 140Lys Glu Asp Asp Glu Asn Tyr Phe Tyr Gly Val Tyr Asp Lys Ile Tyr145                 150                 155                 160Pro Tyr Glu Gly Phe Phe Tyr Cys Asn Leu Thr Tyr Gln Arg Lys Asn
            165                 170                 175Gln Phe Cys Lys Lys Ile Leu Glu Ile Ile Arg Ala Gln Lys Ile Asp
        180                 185                 190Lys Glu Pro Gln Leu Thr Glu Phe Cys Arg Ser Lys Ile Ala Pro Leu
    195                 200                 205Lys Ile Glu Tyr Cys Ile Phe Pro His Tyr Tyr Ser Leu Ser Glu Glu
210                 215                 220His Leu Lys Gly Val Ala Asn Ala Ile Tyr His Asn Thr Ile Lys Gln225                 230                 235                 240Ala Leu Arg Glu Pro Ile Val Ile Gln Tyr Asp Ser His Pro Tyr Phe
            245                 250                 255Gln Ile Lys Pro Trp Thr Tyr Pro Phe Gly Leu Lys Ala Asp Leu Trp
        260                 265                 270Leu Asn Ala Leu Ala Lys Thr Pro Phe Met Ser Asp Trp Ser Tyr Leu
    275                 280                 285Ile Thr Gly Gly Gly Gly Ile Gly Gly Glu Lys Trp His Tyr Tyr His
290                 295                 300Gly Ile Ala Ala Tyr His Tyr Tyr Phe Pro Leu Trp Lys Ala Glu Glu305                 310                 315                 320Gln Ile Ala His Asp Ala Leu Lys Thr Phe Leu Lys His Tyr Phe Leu
            325                 330                 335His Ile His Glu Ile Pro Gln Asn Ala Arg Arg Arg Leu Phe Lys Tyr
        340                 345                 350Cys Ile Ser Ile Pro Leu Lys Ser Phe Ile Ser Lys Thr Leu Lys Phe
    355                 360                 365Leu Lys Leu His Ala Leu Val Lys Lys Ile Leu Ile Gln Leu Lys Leu
370                 375                 380Leu Lys Lys Asn Gln Ser Gln Asn Phe385                 390(2)INFORMATION FOR SEQ ID NO:107:
(i)序列特征:
  (A)长度:435个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...435
(xi)序列描述:SEQ ID NO:107:Leu Ile Phe Leu Lys Lys Ser Leu Cys Ala Leu Leu Ile Ser Gly Phe1               5                   10                  15Phe Ile Pro Pro Leu Met Lys Ala Ala Ser Phe Val Tyr Asp Leu Lys
        20                  25                  30Phe Met Ser Phe Asn Phe Asn Leu Ala Ser Pro Pro Asn Asn Pro Tyr
    35                  40                  45Trp Asn Ser Leu Thr Lys Met Gln Gly Arg Leu Met Pro Gln Ile Gly
50                  55                  60Val Gln Leu Asp Lys Arg Gln Ala Leu Met Phe Gly Ala Trp Phe Ile65                  70                  75                  80Gln Asn Leu His Thr His Tyr Ser Tyr Phe Pro Tyr Ser Trp Gly Val
            85                  90                  95Thr Met Tyr Tyr Gln Tyr Ile Gly Lys Asn Leu Arg Phe Phe Leu Gly
        100                 105                 110Ile Val Pro Arg Ser Tyr Gln Ile Gly His Tyr Pro Leu Ser Ala Phe
    115                 120                 125Lys Lys Leu Phe Trp Phe Ile Asp Pro Thr Phe Arg Gly Gly Ala Phe
130                 135                 140Gln Phe Lys Pro Ala Tyr Asp Pro Asn Arg Trp Trp Asn Gly Trp Phe145                 150                 155                 160Glu Gly Val Val Asp Trp Tyr Gly Gly Arg Asn Trp Asn Asn Gln Pro
            165                 170                 175Lys Lys Lys Asn Tyr Asp Phe Asp Gln Phe Leu Tyr Phe Val Ser Ser
        180                 185                 190Glu Phe Gln Phe Leu Lys Gly Tyr Leu Gly Leu Gly Gly Gln Leu Val
    195                 200                 205Ile Phe His Asn Ala Asn Ser His Ser Met Gly Asp Asn Tyr Pro Tyr
210                 215                 220Gly Gly Asn Ser Tyr Leu Lys Pro Gly Asp Ala Thr Pro Gln Trp Pro225                 230                 235                 240Asn Gly Tyr Pro Tyr Phe Ser Gln Lys Asp Asn Pro Gln Gly Gly Glu
            245                 250                 255Ile Gly Lys Tyr Ser Asn Pro Thr Ile Leu Asp Arg Val Tyr Tyr His
        260                 265                 270Ala Tyr Leu Lys Ala Asp Phe Lys Asn Leu Met Pro Tyr Met Asp Asn
    275                 280                 285Ile Phe Met Thr Phe Gly Thr Gln Ser Ser Gln Thr His Tyr Cys Val
290                 295                 300Arg Tyr Ala Ser Glu Cys Lys Asn Ala Arg Phe Tyr Asn Ser Phe Gly305                 310                 315                 320Gly Glu Phe Tyr Ala Gln Ala Gln Tyr Lys Gly Phe Gly Ile Phe Asn
            325                 330                 335Arg Tyr Tyr Phe Ser Asn Lys Pro Gln Met His Phe Tyr Ala Thr Tyr
        340                 345                 350Gly Gln Ser Leu Tyr Thr Gly Leu Pro Trp Tyr Arg Ala Pro Asn Phe
    355                 360                 365Asp Met Ile Gly Leu Tyr Tyr Leu Tyr Lys Asn Lys Trp Leu Ser Val
370                 375                 380Arg Ala Asp Ala Phe Phe Ser Phe Val Gly Gly Gly Asp Gly Tyr His385                 390                 395                 400Leu Tyr Gly Lys Gly Gly Lys Trp Phe Val Met Tyr Gln Gln Phe Leu
            405                 410                 415Thr Leu Thr Ile Asp Thr Arg Glu Leu Ile Asp Phe Val Lys Ser Lys
        420                 425                 430Ile Pro Lys
    435(2)INFORMATION FOR SEQ ID NO:108:
(i)序列特征:
  (A)长度:220个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...220
(xi)序列描述:SEQ ID NO:108:Met Asn Lys Thr Thr Ile Lys Ile Leu Met Gly Met Ala Leu Leu Ser1               5                   10                  15Ser Leu Gln Ala Ala Glu Ala Glu Leu Asp Glu Lys Ser Lys Lys Pro
        20                  25                  30Lys Phe Ala Asp Arg Asn Thr Phe Tyr Leu Gly Val Gly Tyr Gln Leu
    35                  40                  45Ser Ala Ile Asn Thr Ser Phe Ser Thr Ser Ser Ile Asp Lys Ser Tyr
50                  55                  60Phe Met Thr Gly Asn Gly Phe Gly Val Val Leu Gly Gly Lys Phe Val65                  70                  75                  80Ala Lys Thr Gln Ala Val Glu His Val Gly Phe Arg Tyr Gly Leu Phe
            85                  90                  95Tyr Asp Gln Thr Phe Ser Ser His Lys Ser Tyr Ile Ser Thr Tyr Gly
        100                 105                 110Leu Glu Phe Ser Gly Leu Trp Asp Ala Phe Asn Ser Pro Lys Met Phe
    115                 120                 125Leu Gly Leu Glu Phe Gly Leu Gly Ile Ala Gly Ala Thr Tyr Met Pro
130                 135                 140Gly Gly Ala Met His Gly Ile Ile Ala Gln Tyr Leu Gly Lys Glu Asn145                 150                 155                 160Ser Leu Phe Gln Leu Leu Val Lys Val Gly Phe Arg Phe Gly Phe Phe
            165                 170                 175His Asn Glu Ile Thr Phe Gly Leu Lys Phe Pro Val Ile Pro Asn Lys
        180                 185                 190Lys Thr Glu Ile Val Asp Gly Leu Ser Ala Thr Thr Leu Trp Gln Arg
    195                 200                 205Leu Pro Val Ala Tyr Phe Asn Tyr Ile Tyr Asn Phe
210                 215                 220(2)INFORMATION FOR SEQ ID NO:109:
(i)序列特征:
  (A)长度:116个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...116
(xi)序列描述:SEQ ID NO:109:Leu Asn Leu His Phe Met Lys Gly Phe Val Met Ser Gly Leu Arg Thr1               5                   10                  15Phe Ser Cys Val Val Val Leu Cys Gly Ala Met Val Asn Val Ala Val
        20                  25                  30Ala Gly Pro Lys Ile Glu Ala Arg Gly Glu Leu Gly Lys Phe Val Gly
    35                  40                  45Gly Ala Val Gly Asn Phe Val Gly Asp Lys Met Gly Gly Phe Val Gly
50                  55                  60Gly Ala Ile Gly Gly Tyr Ile Gly Ser Glu Val Gly Asp Arg Val Glu65                  70                  75                  80Asp Tyr Ile Arg Gly Val Asp Arg Glu Pro Gln Asn Lys Glu Pro Gln
            85                  90                  95Thr Pro Arg Glu Pro Ile Arg Asp Phe Tyr Asp Tyr Gly Tyr Ser Phe
        100                 105                 110Gly His Ala Trp
    115(2)INPORMATION FOR SEQ ID NO:110:
(i)序列特征:
  (A)长度:436个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...436
(xi)序列描述:SEQ ID NO:110:Met Ser Arg Asp Phe Lys Phe Asp Ser Asn Tyr Leu Asn Val Asn Thr1               5                   10                  15Asn Pro Lys Leu Gly Pro Val Tyr Thr Asn Gln Asn Tyr Pro Gly Phe
        20                  25                  30Phe Ile Phe Asp His Leu Arg Arg Tyr Val Met Asn Ala Phe Glu Pro
    35                  40                  45Asn Leu Asn Leu Val Val Asn Thr Asn Lys Val Lys Gln Thr Phe Asn
50                  55                  60Val Gly Met Arg Phe Met Thr Met Asp Met Phe Ile Arg Ser Asp Gln65                  70                  75                  80Ser Thr Cys Glu Lys Thr Asp Ile Ile Asn Gly Val Cys His Met Pro
            85                  90                  95Pro Tyr Val Leu Ser Lys Thr Pro Asn Asn Asn Gln Glu Met Phe Asn
        100                 105                 110Asn Tyr Thr Ala Val Trp Leu Ser Asp Lys Ile Glu Phe Phe Asp Ser
    115                 120                 125Lys Leu Val Ile Thr Pro Gly Leu Arg Tyr Thr Phe Leu Asn Tyr Asn
130                 135                 140Asn Lys Glu Pro Glu Lys His Asp Phe Ser Val Trp Thr Ser Lys Lys145                 150                 155                 160Gln Arg Gln Asn Glu Trp Ser Pro Ala Leu Asn Ile Gly Tyr Lys Pro
            165                 170                 175Met Glu Asn Trp Ile Trp Tyr Ala Asn Tyr Arg Arg Ser Phe Ile Pro
        180                 185                 190Pro Gln His Thr Met Val Gly Ile Thr Arg Thr Asn Tyr Asn Gln Ile
    195                 200                 205Phe Asn Glu Ile Glu Val Gly Gln Arg Tyr Ser Tyr Lys Asn Leu Leu
210                 215                 220Ser Phe Asn Thr Asn Tyr Phe Val Ile Phe Ala Lys Arg Tyr Tyr Ala225                 230                 235                 240Gly Gly Tyr Ser Pro Gln Pro Val Asp Ala Arg Ser Gln Gly Val Glu
            245                 250                 255Leu Glu Leu Tyr Tyr Ala Pro Ile Arg Gly Leu Gln Phe His Val Ala
        260                 265                 270Tyr Thr Tyr Ile Asp Ala Arg Ile Thr Ser Asn Ala Asp Asp Ile Ala
    275                 280                 285Tyr Tyr Phe Thr Gly Ile Val Asn Lys Pro Phe Asp Ile Lys Gly Lys
290                 295                 300Arg Leu Pro Tyr Val Ser Pro Asn Gln Phe Ile Phe Asp Met Met Tyr305                 310                 315                 320Thr Tyr Lys His Thr Thr Phe Gly Ile Ser Ser Tyr Phe Tyr Ser Arg
            325                 330                 335Ala Tyr Ser Ser Met Leu Asn Gln Ala Lys Asp Gln Thr Val Cys Leu
        340                 345                 350Pro Leu Asn Pro Glu Tyr Thr Gly Gly Leu Lys Tyr Gly Cys Asn Ser
    355                 360                 365Val Gly Leu Leu Pro Leu Tyr Phe Val Leu Asn Val Gln Val Ser Ser
370                 375                 380Ile Leu Trp Gln Ser Gly Arg His Lys Ile Thr Gly Ser Leu Gln Ile385                 390                 395                 400Asn Asn Leu Phe Asn Met Lys Tyr Tyr Phe Arg Gly Ile Gly Thr Ser
            405                 410                 415Pro Thr Gly Arg Glu Pro Ala Pro Gly Arg Ser Ile Thr Ala Tyr Leu
        420                 425                 430Asn Tyr Glu Phe
    435(2)INFORMATION FOR SEQ ID NO:111:
(i)序列特征:
  (A)长度:767个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...767
(xi)序列描述:SEQ ID NO:111:Met Lys Arg Ile Leu Val Ser Leu Ala Val Leu Ser His Ser Ala His1               5                   10                  15Ala Val Lys Thr His Asn Leu Glu Arg Val Glu Ala Ser Gly Val Ala
        20                  25                  30Asn Asp Lys Glu Ala Pro Leu Ser Trp Arg Ser Lys Glu Val Arg Asn
    35                  40                  45Tyr Met Gly Ser Arg Thr Val Ile Ser Asn Lys Gln Leu Thr Lys Ser
50                  55                  60Ala Asn Gln Ser Ile Glu Glu Ala Leu Gln Asn Val Pro Gly Val His65                  70                  75                  80Ile Arg Asn Ser Thr Gly Ile Gly Ala Val Pro Ser Ile Ser Ile Arg
            85                  90                  95Gly Phe Gly Ala Gly Gly Pro Gly His Ser Asn Thr Gly Met Ile Leu
        100                 105                 110Val Asn Gly Ile Pro Ile Tyr Val Ala Pro Tyr Val Glu Ile Gly Thr
    115                 120                 125Val Ile Phe Pro Val Thr Phe Gln Ser Val Asp Arg Ile Ser Val Thr
130                 135                 140Lys Gly Gly Glu Ser Val Arg Tyr Gly Pro Asn Ala Phe Gly Gly Val145                 150                 155                 160Ile Asn Ile Ile Thr Lys Gly Ile Pro Thr Asn Trp Glu Ser Gln Val
            165                 170                 175Ser Glu Arg Thr Thr Phe Trp Gly Lys Ser Glu Asn Gly Gly Phe Phe
        180                 185                 190Asn Gln Asn Ser Lys Asn Ile Asp Lys Ser Leu Val Asn Asn Met Leu
    195                 200                 205Phe Asn Thr Tyr Leu Arg Thr Gly Gly Met Met Asn Lys His Phe Gly
210                 215                 220Ile Gln Ala Gln Val Asn Trp Leu Lys Gly Gln Gly Phe Arg Tyr Asn225                 230                 235                 240Ser Pro Thr Asp Ile Gln Asn Tyr Met Leu Asp Ser Leu Tyr Gln Ile
            245                 250                 255Asn Asp Ser Asn Lys Ile Thr Ala Phe Phe Gln Tyr Tyr Ser Tyr Phe
        260                 265                 270Leu Thr Asp Pro Gly Ser Leu Gly Ile Ala Ala Tyr Asn Gln Asn Arg
    275                 280                 285Phe Gln Asn Asn Arg Pro Asn Asn Asp Lys Ser Gly Arg Ala Lys Arg
290                 295                 300Trp Gly Ala Val Tyr Gln Asn Phe Phe Gly Asp Thr Asp Arg Val Gly305                 310                 315                 320Gly Asp Phe Thr Phe Ser Tyr Tyr Gly His Asp Met Ser Arg Asp Phe
            325                 330                 335Lys Phe Asp Ser Asn Tyr Leu Asn Val Asn Thr Asn Pro Lys Leu Gly
        340                 345                 350Pro Val Tyr Thr Asn Gln Asn Tyr Pro Gly Phe Phe Ile Phe Asp His
    355                 360                 365Leu Arg Arg Tyr Val Met Asn Ala Phe Glu Pro Asn Leu Asn Leu Val
370                 375                 380Val Asn Thr Asn Lys Val Lys Gln Thr Phe Asn Val Gly Met Arg Phe385                 390                 395                 400Met Thr Met Asp Met Phe Ile Arg Ser Asp Gln Ser Thr Cys Glu Lys
            405                 410                 415Thr Asp Ile Ile Asn Gly Val Cys His Met Pro Pro Tyr Val Leu Ser
        420                 425                 430Lys Thr Pro Asn Asn Asn Gln Glu Met Phe Asn Asn Tyr Thr Ala Val
    435                 440                 445Trp Leu Ser Asp Lys Ile Glu Phe Phe Asp Ser Lys Leu Val Ile Thr
450                 455                 460Pro Gly Leu Arg Tyr Thr Phe Leu Asn Tyr Asn Asn Lys Glu Pro Glu465                 470                 475                 480Lys His Asp Phe Ser Val Trp Thr Ser Lys Lys Gln Arg Gln Asn Glu
            485                 490                 495Trp Ser Pro Ala Leu Asn Ile Gly Tyr Lys Pro Met Glu Asn Trp Ile
        500                 505                 510Trp Tyr Ala Asn Tyr Arg Arg Ser Phe Ile Pro Pro Gln His Thr Met
    515                 520                 525Val Gly Ile Thr Arg Thr Asn Tyr Asn Gln Ile Phe Asn Glu Ile Glu
530                 535                 540Val Gly Gln Arg Tyr Ser Tyr Lys Asn Leu Leu Ser Phe Asn Thr Asn545                 550                 555                 560Tyr Phe Val Ile Phe Ala Lys Arg Tyr Tyr Ala Gly Gly Tyr Ser Pro
            565                 570                 575Gln Pro Val Asp Ala Arg Ser Gln Gly Val Glu Leu Glu Leu Tyr Tyr
        580                 585                 590Ala Pro Ile Arg Gly Leu Gln Phe His Val Ala Tyr Thr Tyr Ile Asp
    595                 600                 605Ala Arg Ile Thr Ser Asn Ala Asp Asp Ile Ala Tyr Tyr Phe Thr Gly
610                 615                 620Ile Val Asn Lys Pro Phe Asp Ile Lys Gly Lys Arg Leu Pro Tyr Val625                 630                 635                 640Ser Pro Asn Gln Phe Ile Phe Asp Met Met Tyr Thr Tyr Lys His Thr
            645                 650                 655Thr Phe Gly Ile Ser Ser Tyr Phe Tyr Ser Arg Ala Tyr Ser Ser Met
        660                 665                 670Leu Asn Gln Ala Lys Asp Gln Thr Val Cys Leu Pro Leu Asn Pro Glu
    675                 680                 685Tyr Thr Gly Gly Leu Lys Tyr Gly Cys Asn Ser Val Gly Leu Leu Pro
690                 695                 700Leu Tyr Phe Val Leu Asn Val Gln Val Ser Ser Ile Leu Trp Gln Ser705                 710                 715                 720Gly Arg His Lys Ile Thr Gly Ser Leu Gln Ile Asn Asn Leu Phe Asn
            725                 730                 735Met Lys Tyr Tyr Phe Arg Gly Ile Gly Thr Ser Pro Thr Gly Arg Glu
        740                 745                 750Pro Ala Pro Gly Arg Ser Ile Thr Ala Tyr Leu Asn Tyr Glu Phe
    755                 760                 765(2)INFORMATION FOR SEQ ID NO:112:
(i)序列特征:
  (A)长度:115个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...115
(xi)序列描述:SEQ ID NO:112:Leu His Pro Leu Cys Ala His Gly Gln Cys Gly Ser Glu Ala Ile Ala1               5                   10                  15Cys Leu Glu Ala Ile Ser Val Gly Ile Val Pro Val Ile Ala Asn Ser
        20                  25                  30Pro Leu Ser Ala Thr Arg Gln Phe Ala Leu Asp Glu Arg Ser Leu Phe
    35                  40                  45Glu Pro Asn Asn Ala Lys Asp Leu Ser Ala Lys Ile Asp Trp Trp Leu
50                  55                  60Glu Asn Lys Leu Glu Arg Glu Arg Met Gln Asn Glu Tyr Ala Lys Ser65                  70                  75                  80Ala Leu Asn Tyr Thr Leu Glu Asn Ser Val Ile Gln Ile Glu Lys Val
            85                  90                  95Tyr Glu Glu Ala Ile Lys Asp Phe Lys Asn Asn Pro Asn Leu Phe Lys
        100                 105                 110Thr Leu Ser
    115(2)INFORMATION FOR SEQ ID NO:113:
(i)序列特征:
  (A)长度:389个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...389
(xi)序列描述:SEQ ID NO:113:Met Val Ile Val Leu Val Val Asp Ser Phe Lys Asp Thr Ser Asn Gly1               5                   10                  15Thr Ser Met Thr Ala Phe Arg Phe Phe Glu Ala Leu Lys Lys Arg Gly
        20                  25                  30His Ala Met Arg Val Val Ala Pro His Val Asp Asn Leu Gly Ser Glu
    35                  40                  45Glu Glu Gly Tyr Tyr Asn Leu Lys Glu Arg Tyr Ile Pro Leu Val Thr
50                  55                  60Glu Ile Ser His Lys Gln His Ile Leu Phe Ala Lys Pro Asp Glu Lys65                  70                  75                  80Ile Leu Arg Lys Ala Phe Lys Gly Ala Asp Met Ile His Thr Tyr Leu
            85                  90                  95Pro Phe Leu Leu Glu Lys Thr Ala Val Lys Ile Ala Arg Glu Met Arg
        100                 105                 110Val Pro Tyr Ile Gly Ser Phe His Leu Gln Pro Glu His Ile Ser Tyr
    115                 120                 125Asn Met Lys Leu Gly Gln Phe Ser Trp Leu Asn Thr Met Leu Phe Ser
130                 135                 140Trp Phe Lys Ser Ser His Tyr Arg Tyr Ile His His Ile His Cys Pro145                 150                 155                 160Ser Lys Phe Ile Val Glu Glu Leu Glu Lys Tyr Asn Tyr Gly Gly Lys
            165                 170                 175Lys Tyr Ala Ile Ser Asn Gly Phe Asp Pro Met Phe Lys Phe Glu His
        180                 185                 190Pro Gln Lys Ser Leu Phe Asp Thr Thr Pro Phe Lys Ile Ala Met Val
    195                 200                 205Gly Arg Tyr Ser Asn Glu Lys Asn Gln Ser Val Leu Ile Lys Ala Val
210                 215                 220Ala Leu Ser Arg Tyr Lys Gln Asp Ile Val Leu Leu Leu Lys Gly Lys225                 230                 235                 240Gly Pro Asp Glu Lys Lys Ile Lys Leu Leu Ala Gln Lys Leu Gly Val
            245                 250                 255Lys Thr Glu Phe Gly Phe Val Asn Ser His Glu Leu Leu Glu Ile Leu
        260                 265                 270Lys Thr Cys Thr Leu Tyr Ala His Thr Ala Asn Val Glu Ser Glu Ala
    275                 280                 285Ile Ala Cys Leu Glu Ala Ile Ser Val Gly Ile Val Pro Val Ile Ala
290                 295                 300Asn Ser Pro Leu Ser Ala Thr Arg Gln Phe Ala Leu Asp Glu Arg Ser305                 310                 315                 320Leu Phe Glu Pro Asn Asn Ala Lys Asp Leu Ser Ala Lys Ile Asp Trp
            325                 330                 335Trp Leu Glu Asn Lys Leu Glu Arg Glu Arg Met Gln Asn Glu Tyr Ala
        340                 345                 350Lys Ser Ala Leu Asn Tyr Thr Leu Glu Asn Ser Val Ile Gln Ile Glu
    355                 360                 365Lys Val Tyr Glu Glu Ala Ile Lys Asp Phe Lys Asn Asn Pro Asn Leu
370                 375                 380Phe Lys Thr Leu Ser385(2)INFORMATION FOR SEQ ID NO:114:
(i)序列特征:
  (A)长度:312个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...312
(xi)序列描述:SEQ ID NO:114:Leu Ala Ser Tyr Gly Phe Phe Leu Gly Ala Leu Phe Ile Leu Ala Ser1               5                   10                  15Gly Ile Val Cys Leu Gln Thr Ala Gly Asn Pro Phe Val Thr Leu Leu
        20                  25                  30Ser Lys Gly Lys Glu Ala Arg Asn Leu Val Leu Val Gln Ala Phe Asn
    35                  40                  45Ser Leu Gly Thr Thr Leu Gly Pro Ile Phe Gly Ser Leu Leu Ile Phe
50                  55                  60Ser Ala Thr Lys Thr Ser Asp Asn Leu Ser Leu Ile Asp Lys Leu Ala65                  70                  75                  80Asp Ala Lys Ser Val Gln Met Pro Tyr Leu Gly Leu Ala Val Phe Ser
            85                  90                  95Leu Leu Leu Ala Leu Val Met Tyr Leu Leu Lys Leu Pro Asp Val Glu
        100                 105                 110Lys Glu Met Pro Lys Glu Thr Thr Gln Lys Ser Leu Phe Ser His Lys
    115                 120                 125His Phe Val Phe Gly Ala Leu Gly Ile Phe Phe Tyr Val Gly Gly Glu
130                 135                 140Val Ala Ile Gly Ser Phe Leu Val Leu Ser Phe Glu Lys Leu Leu Asn145                 150                 155                 160Leu Asp Ala Gln Ser Ser Ala His Tyr Leu Val Tyr Tyr Trp Gly Gly
            165                 170                 175Ala Met Val Gly Arg Phe Leu Gly Ser Ala Leu Met Asn Lys Ile Ala
        180                 185                 190Pro Asn Lys Tyr Leu Ala Phe AsN Ala Leu Ser Ser Ile Ile Leu Ile
    195                 200                 205Ala Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala Leu Phe Ala Leu Thr
210                 215                 220Phe Val Gly Phe Phe Asn Ser Ile Met Phe Pro Thr Ile Phe Ser Leu225                 230                 235                 240Ala Thr Leu Asn Leu Gly His Leu Thr Ser Lys Ala Ser Gly Val Ile
            245                 250                 255Ser Met Ala Ile Val Gly Gly Ala Leu Ile Pro Pro Ile Gln Gly Val
        260                 265                 270Val Thr Asp Met Leu Thr Ala Thr Glu Ser Asn Leu Leu Tyr Ala Tyr
    275                 280                 285Ser Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu Phe Phe Ala Leu Lys
290                 295                 300Gly Tyr Lys Gln Glu Glu Asn Ser305                 310(2)INFORMATION FOR SEQ ID NO:115:
(i)序列特征:
  (A)长度:407个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...407
(xi)序列描述:SEQ ID NO:115:Met Gln Lys Thr Ser Asn Thr Leu Ala Leu Gly Ser Leu Thr Ala Leu1               5                   10                  15Phe Phe Leu Met Gly Phe Ile Thr Val Leu Asn Asp Ile Leu Ile Pro
        20                  25                  30His Leu Lys Pro Ile Phe Asp Leu Thr Tyr Phe Glu Ala Ser Leu Ile
    35                  40                  45Gln Phe Cys Phe Phe Gly Ala Tyr Phe Ile Met Gly Gly Val Phe Gly
50                  55                  60Asn Val Ile Ser Lys Ile Gly Tyr Pro Phe Gly Val Val Leu Gly Phe65                  70                  75                  80Val Ile Thr Ala Ser Gly Cys Ala Leu Phe Tyr Pro Ala Ala His Phe
            85                  90                  95Gly Ser Tyr Gly Phe Phe Leu Gly Ala Leu Phe Ile Leu Ala Ser Gly
        100                 105                 110Ile Val Cys Leu Gln Thr Ala Gly Asn Pro Phe Val Thr Leu Leu Ser
    115                 120                 125Lys Gly Lys Glu Ala Arg Asn Leu Val Leu Val Gln Ala Phe Asn Ser
130                 135                 140Leu Gly Thr Thr Leu Gly Pro Ile Phe Gly Ser Leu Leu Ile Phe Ser145                 150                 155                 160Ala Thr Lys Thr Ser Asp Asn Leu Ser Leu Ile Asp Lys Leu Ala Asp
            165                 170                 175Ala Lys Ser Val Gln Met Pro Tyr Leu Gly Leu Ala Val Phe Ser Leu
        180                 185                 190Leu Leu Ala Leu Val Met Tyr Leu Leu Lys Leu Pro Asp Val Glu Lys
    195                 200                 205Glu Met Pro Lys Glu Thr Thr Gln Lys Ser Leu Phe Ser His Lys His
210                 215                 220Phe Val Phe Gly Ala Leu Gly Ile Phe Phe Tyr Val Gly Gly Glu Val225                 230                 235                 240Ala Ile Gly Ser Phe Leu Val Leu Ser Phe Glu Lys Leu Leu Asn Leu
            245                 250                 255Asp Ala Gln Ser Ser Ala His Tyr Leu Val Tyr Tyr Trp Gly Gly Ala
        260                 265                 270Met Val Gly Arg Phe Leu Gly Ser Ala Leu Met Asn Lys Ile Ala Pro
    275                 280                 285Asn Lys Tyr Leu Ala Phe Asn Ala Leu Ser Ser Ile Ile Leu Ile Ala
290                 295                 300Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala Leu Phe Ala Leu Thr Phe305                 310                 315                 320Val Gly Phe Phe Asn Ser Ile Met Phe Pro Thr Ile Phe Ser Leu Ala
            325                 330                 335Thr Leu Asn Leu Gly His Leu Thr Ser Lys Ala Ser Gly Val Ile Ser
        340                 345                 350Met Ala Ile Val Gly Gly Ala Leu Ile Pro Pro Ile Gln Gly Val Val
    355                 360                 365Thr Asp Met Leu Thr Ala Thr Glu Ser Asn Leu Leu Tyr Ala Tyr Ser
370                 375                 380Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu Phe Phe Ala Leu Lys Gly385                 390                 395                 400Tyr Lys Gln Glu Glu Asn Ser
            405(2)INFORMATION FOR SEQ ID NO:116:
(i)序列特征:
  (A)长度:125个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...125
(xi)序列描述:SEQ ID NO:116:Met Asn Lys Ile Ala Pro Asn Lys Tyr Leu Ala Phe Gly Ala Leu Ser1               5                   10                  15Ser Ile Ile Leu Ile Ala Leu Ala Ile Leu Ile Gly Gly Lys Ile Ala
        20                  25                  30Leu Phe Ala Leu Thr Phe Val Gly Phe Phe Asn Ser Ile Met Phe Pro
    35                  40                  45Thr Ile Phe Ser Leu Ala Thr Leu Asn Leu Gly Ile Ser Leu Leu Met
50                  55                  60Ala Ser Gly Val Ile Ser Met Ala Ile Val Gly Gly Ala Leu Ile Pro65                  70                  75                  80Pro Ile Gln Gly Val Val Thr Asp Met Leu Thr Ala Thr Glu Ser Asn
            85                  90                  95Leu Leu Tyr Ala Tyr Ser Val Pro Leu Leu Cys Tyr Phe Tyr Ile Leu
        100                 105                 110Phe Phe Ala Leu Lys Gly Tyr Lys Gln Glu Glu Asn Ser
    115                 120                 125(2)INFORMATION FOR SEQ ID NO:117:
(i)序列特征:
  (A)长度:330个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...330
(xi)序列描述:SEQ ID NO:117:Leu Lys Lys Ile Leu Pro Ala Leu Leu Met Gly Phe Val Gly Leu Asn1               5                   10                  15Ala Ser Asp Arg Leu Leu Glu Ile Met Arg Leu Tyr Gln Lys Gln Gly
        20                  25                  30Leu Glu Val Val Gly Gln Lys Leu Asp Ser Tyr Leu Ala Asp Lys Ser
    35                  40                  45Phe Trp Ala Glu Glu Leu Gln Asn Lys Asp Thr Asp Phe Gly Tyr Tyr
50                  55                  60Gln Asn Lys Gln Phe Leu Phe Val Ala Asp Lys Ser Lys Pro Ser Leu65                  70                  75                  80Glu Phe Tyr Glu Ile Glu Asn Asn Met Leu Lys Lys Ile Asn Ser Ser
            85                  90                  95Lys Ala Leu Val Gly Ser Lys Lys Gly Asp Lys Thr Leu Glu Gly Asp
        100                 105                 110Leu Ala Thr Pro Ile Gly Val Tyr Arg Ile Thr Gln Lys Leu Glu Arg
    115                 120                 125Leu Asp Gln Tyr Tyr Gly Val Leu Ala Phe Val Thr Asn Tyr Pro Asn
130                 135                 140Leu Tyr Asp Thr Leu Lys Lys Arg Thr Gly His Gly Ile Trp Val His145                 150                 155                 160Gly Met Pro Leu Asn Gly Asp Arg Asn Glu Leu Asn Thr Lys Gly Cys
            165                 170                 175Ile Ala Ile Glu Asn Pro Ile Leu Ser Ser Tyr Asp Lys Val Leu Lys
        180                 185                 190Gly Glu Lys Ala Phe Leu Ile Thr Tyr Glu Asp Lys Phe Ser Pro Ser
    195                 200                 205Thr Lys Glu Glu Leu Ser Met Ile Leu Ser Ser Leu Phe Gln Trp Lys
210                 215                 220Glu Ala Trp Ala Arg Gly Asp Phe Glu Arg Tyr Met Arg Phe Tyr Asn225                 230                 235                 240Pro Asn Phe Thr Arg Tyr Asp Gly Met Ser Phe Asn Ala Phe Lys Glu
            245                 250                 255Tyr Lys Lys Arg Val Phe Ala Lys Asn Glu Lys Lys Asn Ile Ala Phe
        260                 265                 270Ser Ser Ile Asn Val Ile Pro Tyr Pro Asn Ser Gln Asn Lys Arg Leu
    275                 280                 285Phe Tyr Val Val Phe Asp Gln Asp Tyr Lys Ala Tyr Gln Gln Asn Lys
290                 295                 300Leu Ser Tyr Ser Ser Asn Ser Gln Lys Glu Leu Tyr Val Glu Ile Glu305                 310                 315                 320Asn Asn Gln Ala Ser Ile Ile Met Glu Lys
            325                 330(2)INFORMATION FOR SEQ ID NO:118:
(i)序列特征:
  (A)长度:169个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...169
(xi)序列描述:SEQ ID NO:118:Leu Phe Glu Lys Trp Ile Gly Leu Thr Leu Leu Leu Ser Ser Leu Gly1               5                   10                  15Tyr Pro Cys Gln Lys Val Ser Ile Ser Phe Lys Gln Tyr Glu Asn Leu
        20                  25                  30Ile His Ile His Gln Lys Gly Cys Asn Asn Glu Val Val Cys Arg Thr
    35                  40                  45Leu Ile Ser Ile Ala Leu Leu Glu Ser Ser Leu Gly Leu Asn Asn Lys
50                  55                  60Arg Glu Lys Ser Leu Lys Asp Thr Ser Tyr Ser Met Phe His Ile Thr65                  70                  75                  80Leu Asn Thr Ala Lys Lys Phe Tyr Pro Thr Tyr Ser Lys Thr Leu Leu
            85                  90                  95Lys Thr Lys Leu Leu Asn Asp Val Gly Phe Ala Ile Gln Leu Ala Lys
        100                 105                 110Gln Ile Leu Lys Glu Asn Phe Asp Tyr Tyr His Gln Lys His Pro Asn
    115                 120                 125Lys Ser Val Tyr Gln Leu Val Gln Met Ala Ile Gly Ala Tyr Asn Gly
130                 135                 140Gly Met Lys His Asn Pro Asn Gly Ala Tyr Met Lys Lys Phe Arg Cys145                 150                 155                 160Ile Tyr Ser Gln Val Arg Tyr Asn Glu
            165(2)INFORMATION FOR SEQ ID NO:119:
(i)序列特征:
  (A)长度:215个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...215
(xi)序列描述:SEQ ID NO:119:Met Lys Lys Pro Tyr Arg Lys Ile Ser Asp Tyr Ala Ile Val Gly Gly1               5                   10                  15Leu Ser Ala Leu Val Met Val Ser Ile Val Gly Cys Lys Ser Asn Ala
        20                  25                  30Asp Asp Lys Pro Lys Glu Gln Ser Ser Leu Ser Gln Ser Val Gln Lys
    35                  40                  45Gly Ala Phe Val Ile Leu Glu Glu Gln Lys Asp Lys Ser Tyr Lys Val
50                  55                  60Val Glu Glu Tyr Pro Ser Ser Arg Thr His Ile Val Val Arg Asp Leu65                  70                  75                  80Gln Gly Asn Glu Arg Val Leu Ser Asn Glu Glu Ile Gln Lys Leu Ile
            85                  90                  95Lys Glu Glu Glu Ala Lys Ile Asp Asn Gly Thr Ser Lys Leu Val Gln
        100                 105                 110Pro Asn Asn Gly Gly Ser Asn Glu Gly Ser Gly Phe Gly Leu Gly Ser
    115                 120                 125Ala Ile Leu Gly Ser Ala Ala Gly Ala Ile Leu Gly Ser Tyr Ile Gly
130                 135                 140Asn Lys Leu Phe Asn Asn Pro Asn Tyr Gln Gln Asn Ala Gln Arg Thr145                 150                 155                 160Tyr Lys Ser Pro Gln Ala Tyr Gln Arg Ser Gln Asn Ser Phe Ser Lys
            165                 170                 175Ser Ala Pro Ser Ala Ser Ser Met Gly Thr Ala Ser Lys Gly Gln Ser
        180                 185                 190Gly Phe Phe Gly Ser Ser Arg Pro Thr Ser Ser Pro Ala Ile Ser Ser
    195                 200                 205Gly Thr Arg Gly Phe Asn Ala
210                 215(2)INFORMATION FOR SEQ ID NO:120:
(i)序列特征:
  (A)长度:253个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...253
(xi)序列描述:SEQ ID NO:120:Leu Lys Thr Leu Phe Ser Val Tyr Leu Phe Leu Ser Leu Asn Pro Leu1               5                   10                  15Phe Leu Glu Ala Lys Glu Ile Thr Trp Ser Gln Phe Leu Glu Asn Phe
        20                  25                  30Lys Asn Lys Asn Glu Asp Asp Lys Pro Lys Pro Leu Thr Ile Asp Lys
    35                  40                  45Asn Asn Glu Lys Gln Gln Ile Leu Asp Lys Asn Gln Gln Ile Leu Lys
50                  55                  60Arg Ala Leu Glu Lys Ser Leu Lys Phe Phe Phe Ile Phe Gly Tyr Asn65                  70                  75                  80Tyr Ser Gln Ala Ala Tyr Ser Thr Thr Asn Gln Asn Leu Thr Leu Thr
            85                  90                  95Ala Asn Ser Ile Gly Phe Asn Thr Ala Thr Gly Leu Glu His Phe Leu
        100                 105                 110Arg Asn His Pro Lys Val Gly Phe Arg Ile Phe Ser Val Tyr Asn Tyr
    115                 120                 125Phe His Ser Val Ser Leu Ser Gln Pro Gln Ile Leu Met Val Gln Asn
130                 135                 140Tyr Gly Gly Ala Leu Asp Phe Ser Trp Ile Phe Val Asp Lys Lys Thr145                 150                 155                 160Tyr Arg Phe Arg Ser Tyr Leu Gly Ile Ala Leu Glu Gln Gly Val Leu
            165                 170                 175Leu Val Asp Thr Ile Lys Thr Gly Ser Phe Thr Thr Ile Ile Pro Arg
        180                 185                 190Thr Lys Lys Thr Phe Phe Gln Ala Pro Leu Arg Phe Gly Phe Ile Val
    195                 200                 205Asp Phe Ile Gly Tyr Leu Ser Leu Gln Leu Gly Ile Glu Met Pro Leu
210                 215                 220Val Arg Asn Val Phe Tyr Thr Tyr Asn Asn His Gln Glu Arg Phe Lys225                 230                 235                 240Pro Arg Phe Asn Ala Asn Leu Ser Leu Ile Val Ser Phe
            245                 250(2)INFORMATION FOR SEQ ID NO:121:
(i)序列特征:
  (A)长度:336个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...336
(xi)序列描述:SEQ ID NO:121:Leu Phe Phe Lys Phe Ile Leu Cys Leu Ser Leu Gly Ile Phe Ala Trp1               5                   10                  15Ala Lys Glu Val Ile Pro Thr Pro Ser Thr Pro Leu Thr Pro Ser Lys
        20                  25                  30Arg Tyr Ser Ile Asn Leu Met Thr Glu Asn Asp Gly Tyr Ile Asn Pro
    35                  40                  45Tyr Ile Asp Glu Tyr Tyr Thr Ala Gly Asn Gln Ile Gly Phe Ser Thr
50                  55                  60Lys Glu Phe Asp Phe Ser Lys Asn Lys Ala Met Lys Trp Ser Ser Tyr65                  70                  75                  80Leu Gly Phe Phe Asn Lys Ser Pro Arg Val Thr Arg Phe Gly Ile Ser
            85                  90                  95Leu Ala Gln Asp Met Tyr Thr Pro Ser Leu Ala Asn Arg Lys Leu Val
        100                 105                 110His Leu His Asp Asn His Pro Tyr Gly Gly Tyr Leu Arg Val Asn Leu
    115                 120                 125Asn Val Tyr Asn Arg His Gln Thr Phe Met Glu Leu Phe Thr Ile Ser
130                 135                 140Leu Gly Thr Thr Gly Gln Asp Ser Leu Ala Ala Gln Thr Gln Arg Leu145                 150                 155                 160Ile His Lys Trp Gly His Asp Pro Gln Phe Tyr Gly Trp Asn Thr Gln
            165                 170                 175Leu Lys Asn Glu Phe Ile Phe Glu Leu His Tyr Gln Leu Leu Lys Lys
        180                 185                 190Val Pro Leu Leu Lys Thr Arg Phe Phe Ser Met Glu Leu Met Pro Gly
    195                 200                 205Phe Asn Val Glu Leu Gly Asn Ala Arg Asp Tyr Phe Gln Leu Gly Ser
210                 215                 220Leu Phe Arg Ala Gly Tyr Asn Leu Asp Ala Asp Tyr Gly Val Asn Lys225                 230                 235                 240Val Asn Thr Ala Phe Asp Gly Gly Met Pro Tyr Ser Asp Lys Phe Ser
            245                 250                 255Ile Tyr Phe Phe Ala Gly Ala Phe Gly Arg Phe Gln Pro Leu Asn Ile
        260                 265                 270Phe Ile Gln Gly Asn Ser Pro Glu Thr Arg Gly Ile Ala Asn Leu Glu
    275                 280                 285Tyr Phe Val Tyr Ala Ser Glu Ile Gly Ala Ala Met Met Trp Arg Ser
290                 295                 300Leu Arg Val Ala Phe Thr Ile Thr Asp Ile Ser Lys Thr Phe Gln Ser305                 310                 315                 320Gln Pro Lys His His Gln Ile Gly Thr Leu Glu Leu Asn Phe Ala Phe
            325                 330                 335(2)INFORMATION FOR SEQ ID NO:122:
(i)序列特征:
  (A)长度:108个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...108
(xi)序列描述:SEQ ID NO:122:Met Lys Pro Ile Phe Ser Leu Phe Phe Leu Leu Ile Val Leu Lys Ala1               5                   10                  15His Pro Ile Asn Pro Leu Leu Glu Pro Leu Tyr Phe Pro Ser Tyr Thr
        20                  25                  30Gln Phe Leu Asp Leu Glu Pro His Phe Val Ile Lys Lys Lys Arg Ala
    35                  40                  45Tyr Arg Pro Phe Gln Trp Gly Asn Thr Ile Ile Ile Lys Arg His Asp
50                  55                  60Leu Glu Glu Arg Gln Ser Asn Gln Pro Ser Asp Ile Phe Arg Gln Asn65                  70                  75                  80Ala Glu Ile Asn Val Ser Ser Gln Thr Phe Leu Arg Gly Ile Ser Ser
            85                  90                  95Ala Ser Ser Arg Ile Val Ile Asp Ser Val Ala Gln
        100                 105(2)INFORMATION FOR SEQ ID NO:123:
(i)序列特征:
  (A)长度:195个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...195
(xi)序列描述:SEQ ID NO:123:Met Ser Asn Asn Pro Phe Lys Lys Val Gly Met Ile Ser Ser Gln Asn1               5                   10                  15Asn Asn Gly Ala Leu Asn Gly Leu Gly Val Gln Val Gly Tyr Lys Gln
        20                  25                  30Phe Phe Gly Glu Ser Lys Arg Trp Gly Leu Arg Tyr Tyr Gly Phe Phe
    35                  40                  45Asp Tyr Asn His Gly Tyr Ile Lys Ser Ser Phe Phe Asn Ser Ser Ser
50                  55                  60Asp Ile Trp Thr Tyr Gly Gly Gly Ser Asp Leu Leu Val Asn Phe Ile65                  70                  75                  80Asn Asp Ser Ile Thr Arg Lys Asn Asn Lys Leu Ser Val Gly Leu Phe
            85                  90                  95Gly Gly Ile Gln Leu Ala Gly Thr Thr Trp Leu Asn Ser Gln Tyr Met
        100                 105                 110Asn Leu Thr Ala Phe Asn Asn Pro Tyr Ser Ala Lys Val Asn Ala Ser
    115                 120                 125Asn Phe Gln Phe Leu Phe Asn Leu Gly Leu Arg Thr Asn Leu Ala Thr
130                 135                 140Ala Lys Lys Lys Asp Ser Glu Arg Ser Ala Gln His Gly Val Glu Leu145                 150                 155                 160Gly Ile Lys Ile Pro Thr Ile Asn Thr Asn Tyr Tyr Ser Phe Leu Gly
            165                 170                 175Thr Lys Leu Glu Tyr Arg Arg Leu Tyr Ser Val Tyr Leu Asn Tyr Val
        180                 185                 190Phe Ala Tyr
    195(2)INFORMATION FOR SEQ ID NO:124:
(i)序列特征:
  (A)长度:227个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...227
(xi)序列描述:SEQ ID NO:124:Val Arg Phe Gly Lys Ile Asp Tyr Leu Asn Met Leu Pro Phe Asp Val1               5                   10                  15Phe Ile Lys Ser Tyr Pro Thr Pro Cys Tyr Phe Lys Gln Phe Leu Arg
        20                  25                  30Leu Lys Lys Thr Tyr Pro Ser Lys Leu Asn Glu Ser Phe Leu Phe Arg
    35                  40                  45Arg Ile Asp Ala Gly Phe Ile Ser Ser Ile Ala Gly Tyr Pro Phe Ala
50                  55                  60Leu Cys Ser Tyr Ser Leu Gly Ile Val Ala Tyr Lys Glu Val Leu Ser65                  70                  75                  80Val Leu Val Val Asn Arg Glu Asn Ala Phe Asp Lys Glu Ser Ala Ser
            85                  90                  95Ser Asn Ala Leu Ser Lys Val Leu Gly Leu Lys Gly Glu Val Leu Ile
        100                 105                 110Gly Asn Lys Ala Leu Gln Phe Tyr Tyr Ser Asn Pro Lys Lys Asp Phe
    115                 120                 125Ile Asp Leu Ala Ala Leu Trp Tyr Glu Lys Lys Arg Leu Pro Phe Val
130                 135                 140Phe Gly Arg Leu Cys Tyr Tyr Gln Asn Lys Asp Phe Tyr Lys Arg Leu145                 150                 155                 160Ser Leu Ala Phe Lys His Gln Lys Thr Lys Ile Pro His Tyr Ile Leu
            165                 170                 175Lys Glu Ala Ala Leu Lys Thr Asn Leu Lys Arg Gln Asp Ile Leu Asn
        180                 185                 190Tyr Leu Gln Lys Ile Tyr Tyr Thr Leu Gly Lys Lys Glu Gln Ser Gly
    195                 200                 205Leu Lys Ala Phe Tyr Arg Glu Leu Leu Phe Lys Arg Ile Gln Lys Pro
210                 215                 220Lys Arg Phe225(2)INFORMATION FOR SEQ ID NO:125:
(i)序列特征:
  (A)长度:305个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...305
(xi)序列描述:SEQ ID NO:125:Met Gly Arg Ile Glu Ser Lys Lys Arg Leu Lys Ala Leu Ile Phe Leu1               5                   10                  15Ala Ser Leu Gly Val Leu Trp Gly Asn Ala Ala Glu Lys Thr Pro Phe
        20                  25                  30Phe Lys Thr Lys Asn His Ile Tyr Leu Gly Phe Arg Leu Gly Thr Gly
    35                  40                  45Ala Thr Thr Arg Thr Ser Met Trp Gln Gln Ala Tyr Lys Asp Asn Pro
50                  55                  60Thr Cys Pro Ser Ser Val Cys Tyr Gly Glu Lys Leu Glu Ala His Tyr65                  70                  75                  80Lys Gly Gly Lys Asn Leu Ser Tyr Thr Gly Gln Ile Gly Asp Glu Ile
            85                  90                  95Ala Phe Asp Lys Tyr His Ile Leu Gly Leu Arg Val Trp Gly Asp Val
        100                 105                 110Glu Tyr Ala Lys Ala Gln Leu Gly Gln Lys Val Gly Gly Asn Thr Leu
    115                 120                 125Leu Ser Gln Ala Asn Tyr Asn Pro Ser Ala Ile Lys Thr Tyr Asp Pro
130                 135                 140Thr Ser Asn Ala Gln Gly Ser Leu Val Leu Gln Lys Thr Pro Ser Pro145                 150                 155                 160Gln Asp Phe Leu Phe Asn Asn Gly His Phe Met Ala Phe Gly Leu Asn
            165                 170                 175Val Asn Met Phe Val Asn Leu Pro Ile Asp Thr Leu Leu Lys Leu Ala
        180                 185                 190Leu Lys Thr Glu Lys Met Leu Phe Phe Lys Ile Gly Val Phe Gly Gly
    195                 200                 205Gly Gly Val Glu Tyr Ala Ile Leu Trp Ser Pro Gln Tyr Lys Asn Gln
210                 215                 220Asn Thr His Gln Asp Asp Lys Phe Phe Ala Ala Gly Gly Gly Phe Phe225                 230                 235                 240Val Asn Phe Gly Gly Ser Leu Tyr Ile Gly Lys Arg Asn Arg Phe Asn
            245                 250                 255Val Gly Leu Lys Ile Pro Tyr Tyr Ser Leu Ser Ala Gln Ser Trp Lys
        260                 265                 270Asn Phe Gly Ser Ser Asn Val Trp Gln Gln Gln Thr Ile Arg Gln Asn
    275                 280                 285Phe Ser Val Phe Arg Asn Lys Glu Val Phe Val Ser Tyr Ala Phe Leu
290                 295                 300Phe305(2)INFORMATION FOR SEQ ID NO:126:
(i)序列特征:
  (A)长度:258个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...258
(xi)序列描述:SEQ ID NO:126:Met Phe Leu Arg Ser Tyr Pro Lys Leu Arg Tyr Ala Leu Cys Leu Pro1               5                   10                  15Leu Leu Thr Glu Thr Cys Tyr Ser Glu Glu Arg Thr Leu Asn Lys Val
        20                  25                  30Thr Thr Gln Ala Lys Arg Ile Phe Thr Tyr Asn Asn Glu Phe Lys Val
    35                  40                  45Thr Ser Lys Glu Leu Asp Gln Arg Gln Ser Asn Glu Val Lys Asp Leu
50                  55                  60Phe Arg Thr Asn Pro Asp Val Asn Val Gly Gly Gly Ser Val Met Gly65                  70                  75                  80Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu Leu Arg Val Thr
            85                  90                  95Val Asp Gly Ala Ala Gln Asn Gly Asn Ile Tyr His His Gln Gly Asn
        100                 105                 110Thr Val Ile Asp Pro Gly Met Leu Lys Ser Val Glu Val Thr Lys Gly
    115                 120                 125Ala Ala Asn Ala Ser Ala Gly Pro Gly Ala Ile Ala Gly Val Ile Lys
130                 135                 140Met Glu Thr Lys Gly Ala Ala Asp Phe Ile Pro Arg Gly Lys Asn Tyr145                 150                 155                 160Ala Ala Ser Gly Ala Val Ser Phe Tyr Thr Asn Phe Gly Asp Arg Glu
            165                 170                 175Thr Phe Arg Ser Ala Tyr Gln Ser Ala His Phe Asp Ile Ile Ala Tyr
        180                 185                 190Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Ser Gly Ala Thr Val Met
    195                 200                 205Lys Asn Leu Phe Lys Pro Thr Gln Ala Asp Lys Glu Pro Gly Thr Pro
210                 215                 220Ser Glu Gln Asn Asn Ala Leu Ile Lys Met Asn Gly Tyr Leu Ser Asp225                 230                 235                 240Arg Asp Thr Leu Thr Phe Ser Trp Asn Met Thr Arg Asp Asn Ala Thr
            245                 250                 255Arg Leu(2)INFORMATION FOR SEQ ID NO:127:
(i)序列特征:
  (A)长度:192个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...192
(xi)序列描述:SEQ ID NO:127:Met Phe Leu Arg Ser Tyr Pro Lys Leu Arg Tyr Ala Leu Cys Leu Pro1               5                   10                  15Leu Leu Thr Glu Thr Cys Tyr Ser Glu Glu Arg Thr Leu Asn Lys Val
        20                  25                  30Thr Thr Gln Ala Lys Arg Ile Phe Thr Tyr Asn Asn Glu Phe Lys Val
    35                  40                  45Thr Ser Lys Glu Leu Asp Gln Arg Gln Ser Asn Glu Val Lys Asp Leu
50                  55                  60Phe Arg Thr Asn Pro Asp Val Asn Val Gly Gly Gly Ser Val Met Gly65                  70                  75                  80Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu Leu Arg Val Thr
            85                  90                  95Val Asp Gly Ala Ala Gln Asn Gly Asn Ile Tyr His His Gln Gly Asn
        100                 105                 110Thr Val Ile Asp Pro Gly Met Leu Lys Ser Val Glu Val Thr Lys Gly
    115                 120                 125Ala Ala Asn Ala Ser Ala Gly Pro Gly Ala Ile Ala Gly Val Ile Lys
130                 135                 140Met Glu Thr Lys Gly Ala Ala Asp Phe Ile Pro Arg Gly Lys Asn Tyr145                 150                 155                 160Ala Ala Ser Gly Ala Val Ser Phe Tyr Thr Asn Phe Gly Asp Arg Glu
            165                 170                 175Thr Phe Arg Ser Ala Tyr Gln Ser Ala His Phe Asp Ile Ile Ala Tyr
        180                 185                 190(2)INFORMATION FOR SEQ ID NO:128:
(i)序列特征:
  (A)长度:126个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...126
(xi)序列描述:SEQ ID NO:128:Val Pro Leu Ser Leu Gly Gly Asn Leu Leu Asn Pro Asn Asn Ser Ser1               5                   10                  15Val Leu Asn Leu Lys Asn Ser Gln Leu Val Phe Ser Asp Gln Gly Ser
        20                  25                  30Leu Asn Ile Ala Asn Ile Asp Leu Leu Ser Asp Leu Asn Gly Asn Lys
    35                  40                  45Asn Arg Val Tyr Asn Ile Ile Gln Ala Asp Met Asn Gly Asn Trp Tyr
50                  55                  60Glu Arg Ile Asn Phe Phe Gly Met Arg Ile Asn Asp Gly Ile Tyr Asp65                  70                  75                  80Ala Lys Asn Gln Thr Tyr Ser Phe Thr Asn Pro Leu Asn Asn Ala Val
            85                  90                  95Lys Phe Thr Glu Ser Phe Phe Ile His Arg Leu Cys Gly Ser Leu Ser
        100                 105                 110Gln Ile Gln Lys Lys Lys Asn Thr Ile Val Ser Pro Arg Leu
    115                 120                 125(2)INFORMATION FOR SEQ ID NO:129:
(i)序列特征:
  (A)长度:565个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...565
(xi)序列描述:SEQ ID NO:129:Val Tyr Ser Tyr Ser Asp Asp Ala Gln Gly Val Phe Tyr Leu Thr Ser1               5                   10                  15Ser Val Lys Gly Tyr Tyr Asn Pro Asn Gln Ser Tyr Gln Ala Ser Gly
        20                  25                  30Ser Asn Asn Thr Thr Lys Asn Asn Asn Leu Thr Ser Glu Ser Ser Val
    35                  40                  45Ile Ser Gln Thr Tyr Asn Ala Gln Gly Asn Pro Ile Ser Ala Leu His
50                  55                  60Val Tyr Asn Lys Gly Tyr Asn Phe Ser Asn Ile Lys Ala Leu Gly Gln65                  70                  75                  80Met Ala Leu Lys Leu Tyr Pro Glu Ile Lys Lys Ile Leu Gly Asn Asp
            85                  90                  95Phe Ser Leu Ser Ser Leu Ser Asn Leu Lys Gly Asp Ala Leu Asn Gln
        100                 105                 110Leu Thr Lys Leu Ile Thr Pro Ser Asp Trp Lys Asn Ile Asn Glu Leu
    115                 120                 125Ile Asp Asn Ala Asn Asn Ser Val Val Gln Asn Phe Asn Asn Gly Thr
130                 135                 140Leu Ile Ile Gly Ala Thr Lys Ile Gly Gln Thr Asp Thr Asn Ser Ala145                 150                 155                 160Val Val Phe Gly Gly Leu Gly Tyr Gln Lys Pro Cys Asp Tyr Thr Asp
            165                 170                 175Ile Val Cys Gln Lys Phe Arg Gly Thr Tyr Leu Gly Gln Leu Leu Glu
        180                 185                 190Ser Asn Ser Ala Asp Leu Gly Tyr Ile Asp Thr Thr Phe Asn Ala Lys
    195                 200                 205Glu Ile Tyr Leu Thr Gly Thr Leu Gly Ser Gly Asn Ala Trp Gly Thr
210                 215                 220Gly Gly Ser Ala Ser Val Thr Phe Asn Ser Gln Thr Ser Leu Ile Leu225                 230                 235                 240Asn Gln Ala Asn Ile Val Ser Ser Gln Thr Asp Gly Ile Phe Ser Met
            245                 250                 255Leu Gly Gln Glu Gly Ile Asn Lys Val Phe Asn Gln Ala Gly Leu Ala
        260                 265                 270Asn Ile Leu Gly Glu Val Ala Met Gln Ser Ile Asn Lys Ala Gly Gly
    275                 280                 285Leu Gly Asn Leu Ile Val Asn Thr Leu Gly Ser Asp Ser Val Ile Gly
290                 295                 300Gly Tyr Leu Thr Pro Glu Gln Lys Asn Gln Thr Leu Ser Gln Leu Leu305                 310                 315                 320Gly Gln Asn Asn Phe Asp Asn Leu Met Asn Asp Ser Gly Leu Asn Thr
            325                 330                 335Ala Ile Lys Asp Leu Ile Arg Gln Lys Leu Gly Phe Trp Thr Gly Leu
        340                 345                 350Val Gly Gly Leu Ala Gly Leu Gly Gly Ile Asp Leu Gln Asn Pro Glu
    355                 360                 365Lys Leu Ile Gly Ser Met Ser Ile Asn Asp Leu Leu Ser Lys Lys Gly
370                 375                 380Leu Phe Asn Gln Ile Thr Gly Phe Ile Ser Ala Asn Asp Ile Gly Gln385                 390                 395                 400Val Ile Ser Val Met Leu Gln Asp Ile Val Lys Pro Ser Asp Ala Leu
            405                 410                 415Lys Asn Asp Val Ala Ala Leu Gly Lys Gln Met Ile Gly Glu Phe Leu
        420                 425                 430Gly Gln Asp Thr Leu Asn Ser Leu Glu Ser Leu Leu Gln Asn Gln Gln
    435                 440                 445Ile Lys Ser Val Leu Asp Lys Val Leu Ala Ala Lys Gly Leu Gly Ser
450                 455                 460Ile Tyr Glu Gln Gly Leu Gly Asp Leu Ile Pro Asn Leu Gly Lys Lys465                 470                 475                 480Gly Ile Phe Ala Pro Tyr Gly Leu Ser Gln Val Trp Gln Lys Gly Asp
            485                 490                 495Phe Ser Phe Asn Ala Gln Gly Asn Val Phe Val Gln Asn Ser Thr Phe
        500                 505                 510Ser Asn Ala Asn Gly Gly Thr Leu Ser Phe Asn Ala Gly Asn Ser Leu
    515                 520                 525Ile Phe Ala Gly Asn Asn His Ile Ala Phe Thr Asn His Ser Gly Thr
530                 535                 540Leu Asn Leu Leu Ser Asn Gln Val Ser Asn Ile Asn Val Thr Met Leu545                 550                 555                 560Asn Ala Ala Thr Ala
            565(2)INFORMATION FOR SEQ ID NO:130:
(i)序列特征:
  (A)长度:172个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...172
(xi)序列描述:SEQ ID NO:130:Val Phe Gly Leu Ser Leu Ala Asp Met Ile Leu Glu Arg Phe Lys Asp1               5                   10                  15Phe Met Arg Glu Tyr Pro Glu Pro Tyr Lys Phe Leu Gln Val Phe Tyr
        20                  25                  30Ala Gln Glu Lys Glu Arg Phe Leu Asn His Lys Met Asn Asp Tyr Ile
    35                  40                  45Lys Gln Asn Lys Ser Lys Glu Glu Ala Ser Ile Leu Ala Arg Gln Gly
50                  55                  60Phe Val Ser Val Ile Gly Arg Ala Leu Glu Lys Ile Ile Glu Leu Leu65                  70                  75                  80Leu Lys Asp Phe Cys Ile Lys Asn Asn Val Lys Met Thr Asn Asp Lys
            85                  90                  95Thr Leu Arg Ala Lys Arg Ile Asn Gly Glu Leu Asp Lys Val Lys Arg
        100                 105                 110Ala Leu Leu Val His Phe Gly Gly Tyr Ser Val Leu Pro Asp Ile Ile
    115                 120                 125Leu Tyr Gln Thr Asn Lys Asp Asn Ile Lys Ile Leu Ala Ile Leu Ser
130                 135                 140Val Lys Asn Ser Phe Arg Glu Arg Phe Thr Lys Asp Ala Leu Leu Glu145                 150                 155                 160Ile Lys Thr Phe Ala Ile Ala Cys Asn Phe Ser His
            165                 170(2)INFORMATION FOR SEQ ID NO:131:
(i)序列特征:
  (A)长度:331个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...331
(xi)序列描述:SEQ ID NO:131:Met Lys Arg Phe Val Leu Phe Leu Leu Phe Ile Cys Val Cys Val Cys1                5                  10                  15Val Gln Ala Tyr Ala Glu Gln Asp Tyr Phe Phe Arg Asp Phe Lys Ser
        20                  25                  30Ile Asp Leu Pro Gln Lys Leu His Leu Asp Lys Lys Leu Ser Gln Thr
    35                  40                  45Ile Gln Pro Cys Ala Gln Leu Asn Ala Ser Lys His Tyr Thr Ala Thr
50                  55                  60Gly Val Arg Glu Pro Asp Ala Cys Thr Lys Ser Phe Lys Lys Ser Ala65                  70                  75                  80Met Val Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Gln Asn Lys
            85                  90                  95Pro Tyr Gly Leu Lys Ala Ile Glu Ile Leu Asn Ala Trp Ala Asn Glu
        100                 105                 110Leu Gln Ser Val Asp Thr Tyr Gln Ser Glu Asp Asn Ile Asn Phe Tyr
    115                 120                 125Met Pro Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Glu Phe Pro
130                 135                 140Ser Pro Glu Tyr Glu Asp Phe Ile Arg Arg Met Arg Gln Tyr Ser Gln145                 150                 155                 160Ser Ala Leu Asn Thr Asn His Gly Ala Trp Gly Ile Leu Phe Asp Val
            165                 170                 175Ser Ser Ala Leu Ala Leu Asp Asp His Ala Leu Leu Gln Ser Ser Ala
        180                 185                 190Asn Arg Trp Gln Glu Trp Val Phe Lys Ala Ile Asp Glu Asn Gly Val
    195                 200                 205Ile Ala Ser Ala Ile Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly
210                 215                 220Pro Thr Lys Gly Ile Lys Gly Ile Ala Tyr Thr Asn Phe Ala Leu Leu225                 230                 235                 240Ala Ile Thr Ile Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu
            245                 250                 255Trp Gly Ser Gly Ala Gly Gln Arg Leu Ser Val Ala Tyr Asn Lys Ala
        260                 265                 270Ala Thr Trp Ile Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gln Pro Asn
    275                 280                 285Leu Ile Gly Val His Asn Asn Ala Tyr Phe Ile Ile Leu Ala Lys His
290                 295                 300Tyr Ser Ser Pro Ser Ala Asp Glu Leu Leu Glu Gln Gly Asp Leu His305                 310                 315                 320Glu Asp Gly Phe Arg Leu Lys Leu Arg Ser Pro
            325                 330(2)INFORMATION FOR SEQ ID NO:132:
(i)序列特征:
  (A)长度:128个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...128
(xi)序列描述:SEQ ID NO:132:Met Arg Gln Tyr Ser Gln Ser Ala Leu Asn Thr Asn His Gly Ala Trp1               5                   10                  15Gly Ile Leu Phe Asp Val Ser Ser Ala Leu Ala Leu Asp Asp His Ala
        20                  25                  30Leu Leu Gln Ser Ser Ala Asn Arg Trp Gln Glu Trp Val Phe Lys Ala
    35                  40                  45Ile Asp Glu Asn Gly Val Ile Ala Ser Ala Ile Thr Arg Ser Asp Thr
50                  55                  60Ser Asp Tyr His Gly Gly Pro Thr Lys Gly Ile Lys Gly Ile Ala Tyr65                  70                  75                  80Thr Asn Phe Ala Leu Leu Ala Ile Thr Ile Ser Gly Glu Leu Leu Phe
            85                  90                  95Glu Asn Gly Tyr Asp Leu Trp Gly Ser Gly Ala Gly Gln Arg Leu Ser
        100                 105                 110Val Ala Tyr Asn Lys Ala Ala Thr Trp Ile Leu Asn Pro Glu Thr Phe
    115                 120                 125(2)INFORMATION FOR SEQ ID NO:133:
(i)序列特征:
  (A)长度:245个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...245
(xi)序列描述:SEQ ID NO:133:Leu Arg Thr Leu Leu Lys Met Leu Val Gly Val Ser Leu Leu Thr His1               5                   10                  15Ala Leu Met Ala Thr Glu Glu Ser Ala Ala Pro Ser Trp Thr Lys Asn
        20                  25                  30Leu Tyr Met Gly Phe Asn Tyr Gln Thr Gly Ser Ile Asn Leu Met Thr
    35                  40                  45Asn Ile His Glu Val Arg Glu Val Thr Ser Tyr Gln Thr Gly Tyr Thr
50                  55                  60Asn Val Met Thr Ser Ile Asn Ser Val Lys Lys Leu Thr Asn Met Gly65                  70                  75                  80Ser Asn Gly Ile Gly Leu Val Met Gly Tyr Asn His Phe Phe His Pro
            85                  90                  95Asp Lys Val Leu Gly Leu Arg Tyr Phe Ala Phe Leu Asp Trp Gln Gly
        100                 105                 110Tyr Gly Met Arg Tyr Pro Lys Gly Tyr Tyr Gly Gly Asn Asn Met Ile
    115                 120                 125Thr Tyr Gly Val Gly Val Asp Ala Ile Trp Asn Phe Phe Gln Gly Ser
130                 135                 140Phe Tyr Gln Asp Asp Ile Gly Val Asp Ile Gly Val Phe Gly Gly Ile145                 150                 155                 160Ala Ile Ala Gly Asn Ser Trp Tyr Ile Gly Asn Lys Gly Gln Glu Leu
            165                 170                 175Leu Gly Ile Thr Asn Ser Ser Ala Val Asp Asn Thr Ser Phe Gln Phe
        180                 185                 190Leu Phe Asn Phe Gly Phe Lys Ala Leu Phe Val Asp Glu His Glu Phe
    195                 200                 205Glu Ile Gly Phe Lys Phe Pro Thr Leu Asn Asn Lys Tyr Tyr Thr Thr
210                 215                 220Asp Ala Leu Lys Val Gln Met Arg Arg Val Phe Ala Phe Tyr Val Gly225                 230                 235                 240Tyr Asn Tyr His Phe
            245(2)INFORMATION FOR SEQ ID NO:134:
(i)序列特征:
  (A)长度:290个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...290
(xi)序列描述:SEQ ID NO:134:Met Phe Glu Glu Ile Thr Leu Ala His Lys Asp Leu Phe Ser Arg Phe1               5                   10                  15Leu Gln Thr Gln Lys Ile Val Leu Ser Asp Val Ser Phe Thr Asn Cys
        20                  25                  30Phe Leu Trp Gln His Ala Arg Leu Ile Gln Val Ala Val Ile Arg Asp
    35                  40                  45Cys Leu Val Ile Gln Thr Thr Tyr Glu Asn Gln Lys Pro Phe Tyr Phe
50                  55                  50Tyr Pro Ile Gly Lys Arg Pro His Glu Cys Val Lys Glu Leu Leu Glu65                  70                  75                  80Leu Glu Lys Asn Leu Arg Phe His Ser Leu Thr Leu Glu Gln Lys Asp
            85                  90                  95Asp Leu Lys Asp Asn Phe Val Gly Val Phe Asp Phe Thr Tyr Asn Arg
        100                 105                 110Asp Arg Ser Asp Tyr Val Tyr Ser Ile Glu Glu Leu Ile Ala Leu Lys
    115                 120                 125Gly Lys Lys Tyr His Lys Lys Lys Asn His Leu Asn Gln Phe Leu Thr
130                 135                 140Asn His Ala Asn Phe Val Tyr Glu Lys Ile Ser Pro Gln Asn Arg Lys145                 150                 155                 160Glu Val Leu Glu Ala Ser Lys Ala Trp Phe Leu Glu Ser Gln Thr Asp
            165                 170                 175Asp Ile Gly Leu Ile Asn Glu Asn Lys Gly Ile Gln Ser Val Leu Glu
        180                 185                 190Asn Tyr Glu Ser Leu Asp Leu Lys Gly Gly Leu Ile Arg Val Asn Gly
    195                 200                 205Glu Ile Val Ser Phe Ser Phe Gly Glu Val Leu Asn Glu Glu Ser Ala
210                 215                 220Leu Ile His Ile Glu Lys Ala Arg Thr Asp Ile Ala Gly Ala Tyr Gln225                 230                 235                 240Ile Ile Asn Gln Gln Leu Leu Leu Asn Glu Phe Ser His Leu Thr Tyr
            245                 250                 255Ala Asn Arg Glu Glu Asp Leu Gly Leu Glu Gly Leu Arg Arg Ser Lys
       260                  265                 270Met Ser Tyr Asn Pro Val Phe Leu Ile Asp Lys Tyr Glu Ala Val Ala
    275                 280                 285Arg Asn
290(2)INFORMATION FOR SEQ ID NO:135:
(i)序列特征:
  (A)长度:110个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...110
(xi)序列描述:SEQ ID NO:135:Met Met Phe Ile Val Ala Val Leu Met Leu Ala Phe Leu Ile Phe Val1               5                   10                  15His Glu Leu Gly His Phe Ile Ile Ala Arg Ile Cys Gly Val Lys Val
        20                   25                 30Glu Val Phe Ser Ile Gly Phe Gly Lys Lys Leu Trp Phe Phe Lys Leu
    35                  40                  45Phe Gly Thr Gln Phe Ala Leu Ser Leu Ile Pro Leu Gly Gly Tyr Val
50                  55                  60Lys Leu Lys Gly Met Asp Lys Glu Glu Asn Glu Glu Asn Lys Ile Asn65                  70                  75                  80Gln Ala Asn Asp Ser Tyr Ala Lys Lys Ala Leu Ser Lys Ser Tyr Gly
            85                  90                  95Tyr Cys Leu Val Gly Arg Phe Leu Ile Phe Phe Leu Arg Phe
        100                 105                 110(2)INFORMATION FOR SEQ ID NO:136:
(i)序列特征:
  (A)长度:351个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...351
(xi)序列描述:SEQ ID NO:136:Met Met Phe Ile Val Ala Val Leu Met Leu Ala Phe Leu Ile Phe Val1               5                   10                  15His Glu Leu Gly His Phe Ile Ile Ala Arg Ile Cys Gly Val Lys Val
        20                  25                  30Glu Val Phe Ser Ile Gly Phe Gly Lys Lys Leu Trp Phe Phe Lys Leu
    35                  40                  45Phe Gly Thr Gln Phe Ala Leu Ser Leu Ile Pro Leu Gly Gly Tyr Val
50                  55                  60Lys Leu Lys Gly Met Asp Lys Glu Glu Asn Glu Glu Asn Lys Ile Asn65                  70                  75                  80Gln Ala Asn Asp Ser Tyr Ala Gln Lys Ser Pro Phe Gln Lys Leu Trp
            85                  90                  95Ile Leu Phe Gly Gly Ala Phe Phe Asn Phe Leu Phe Ala Val Leu Val
        100                 105                 110Tyr Phe Phe Leu Ala Leu Ser Gly Glu Lys Val Leu Leu Pro Val Ile
    115                 120                 125Gly Gly Leu Glu Lys Asn Ala Leu Glu Ala Gly Leu Leu Lys Gly Asp
130                 135                 140Arg Ile Leu Ser Ile Asn His Gln Lys Ile Ala Ser Phe Arg Glu Ile145                 150                 155                 160Arg Glu Ile Val Ala Arg Ser Gln Gly Glu Leu Ile Leu Glu Ile Glu
            165                 170                 175Arg Asn Asn Gln Ile Leu Glu Lys Arg Leu Thr Pro Lys Ile Val Ala
        180                 185                 190Val Ile Ser Glu Ser Asn Asp Pro Asn Glu Ile Ile Lys Tyr Lys Ile
    195                 200                 205Ile Gly Ile Lys Pro Asp Met Gln Lys Met Gly Val Val Ser Tyr Ser
210                 215                 220Val Phe Gln Ala Phe Glu Lys Ala Leu Ser Arg Phe Lys Glu Gly Val225                 230                 235                 240Val Leu Ile Val Asp Ser Leu Arg Arg Leu Ile Met Gly Ser Ala Ser
            245                 250                 255Val Lys Glu Leu Ser Gly Val Ile Gly Ile Val Gly Ala Leu Ser His
        260                 265                 270Ala Asn Ser Val Ser Met Leu Leu Leu Phe Gly Ala Phe Leu Ser Ile
    275                 280                 285Asn Leu Gly Ile Leu Asn Leu Leu Pro Ile Pro Ala Leu Asp Gly Ala
290                 295                 300Gln Met Leu Gly Val Val Phe Lys Asn Ile Phe His Ile Ala Leu Pro305                 310                 315                 320Thr Pro Ile Gln Asn Ala Leu Trp Leu Val Gly Val Gly Phe Leu Val
            325                 330                 335Phe Val Met Phe Leu Gly Leu Phe Asn Asp Ile Thr Arg Leu Leu
        340                 345                 350(2)INFORMATION FOR SEQ ID NO:137:
(i)序列特征:
  (A)长度:100个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...100
(xi)序列描述:SEQ ID NO:137:Met Gln Lys Asn Leu Asp Ser Leu Leu Glu Asn Leu Arg Ala Glu Ile1               5                   10                  15Asp Ala Leu Asp Asn Glu Leu Ser Asp Leu Leu Asp Lys Arg Leu Gly
        20                  25                  30Ile Ala Leu Lys Ile Ala Leu Ile Lys Gln Glu Ser Pro Gln Glu Asn
    35                  40                  45Pro Ile Tyr Cys Pro Lys Arg Glu Gln Glu Ile Leu Lys Arg Leu Ser
50                  55                  60Gln Arg Gly Phe Lys His Leu Asn Gly Glu Ile Leu Ala Ser Phe Tyr65                  70                  75                  80Ala Glu Val Phe Lys Ile Ser Arg Asn Phe Gln Glu Asn Ala Leu Lys
            85                  90                  95Glu Leu Lys Lys
        100(2)INFORMATION FOR SEQ ID NO:138:
(i)序列特征:
  (A)长度:174个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...174
(xi)序列描述:SEQ ID NO:138:Val Lys Met Arg Phe Phe Ser Gly Phe Gly Phe Val Asn Glu Ser Val1               5                   10                  15Leu Phe Glu Glu Trp Leu Leu Lys Gly Ala Tyr Asp Val Ser Gly Phe
        20                  25                  30Ser Met Gly Ala Ile Lys Ala Ile Glu Tyr Ala Tyr Asn Glu Val Leu
    35                  40                  45Gln Gln Arg Arg Ile His Ser Leu Leu Leu Phe Ser Pro Cys Met Leu
50                  55                  60Ala His Lys Ser Leu Ala Phe Lys Arg Leu Gln Leu Phe Leu Phe Gln65                  70                  75                  80Lys Asp Pro Gln Ser Tyr Met Asp Asn Phe Tyr Lys Glu Val Gly Leu
            85                  90                  95Asp Ala Gln Leu Glu Arg Phe Lys Lys Glu Gly Ser Leu Glu Glu Leu
        100                 105                 110Glu Phe Leu Leu Asp Tyr Lys Tyr Ser Asp Ser Ile Ile Arg Phe Leu
    115                 120                 125Leu Glu Lys Gly Val Lys Ile Glu Val Phe Ile Gly Leu Lys Asp Arg
130                 135                 140Ile Thr Asp Ile Gln Ala Leu Leu Glu Phe Phe Met Pro Leu Val Gln145                 150                 155                 160Val Trp Gln Phe Lys Asp Cys Asn His Leu Leu Gln Lys Ser
            165                 170(2)INFORMATION FOR SEQ ID NO:139:
(i)序列特征:
  (A)长度:471个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...471
(xi)序列描述:SEQ ID NO:139:Met Lys Asn Thr Asn Thr Lys Glu Ile Lys Asn Thr Arg Met Lys Lys1               5                   10                  15Gly Tyr Ser Gln Tyr His Thr Leu Lys Lys Gly Leu Leu Lys Thr Ala
        20                  25                  30Leu Leu Phe Ser Leu Pro Leu Ser Val Ala Leu Ala Glu Asp Asp Gly
    35                  40                  45Phe Tyr Met Gly Val Gly Tyr Gln Ile Gly Gly Ala Gln Gln Asn Ile
50                  55                  60Asn Asn Lys Gly Ser Thr Leu Arg Asn Asn Val Ile Asp Asp Phe Arg65                  70                  75                  80Gln Val Gly Val Gly Met Ala Gly Gly Asn Gly Leu Leu Ala Leu Ala
            85                  90                  95Thr Asn Thr Thr Met Asp Ala Leu Leu Gly Ile Gly Asn Gln Ile Val
        100                 105                 110Asn Thr Asn Thr Thr Val Gly Asn Asn Asn Ala Glu Leu Thr Gln Phe
    115                 120                 125Lys Lys Ile Leu Pro Gln Ile Glu Gln Arg Phe Glu Thr Asn Lys Asn
130                 135                 140Ala Tyr Ser Val Gln Ala Leu Gln Val Tyr Leu Ser Asn Val Leu Tyr145                 150                 155                 160Asn Leu Val Asn Asn Ser Asn Asn Gly Ser Asn Asn Gly Val Val Pro
            165                 170                 175Glu Tyr Val Gly Ile Ile Lys Val Leu Tyr Gly Ser Gln Asn Glu Phe
        180                 185                 190Ser Leu Leu Ala Thr Glu Ser Val Ala Leu Leu Asn Ala Leu Thr Arg
    195                 200                 205Val Asn Leu Asp Ser Asn Ser Val Phe Leu Lys Gly Leu Leu Ala Gln
210                 215                 220Met Gln Leu Phe Asn Asp Thr Ser Ser Ala Lys Leu Gly Gln Ile Ala225                 230                 235                 240Glu Asn Leu Lys Asn Gly Gly Ala Gly Ala Met Leu Gln Lys Asp Val
            245                 250                 255Lys Thr Ile Ser Asp Arg Ile Ala Thr Tyr Gln Glu Asn Leu Lys Gln
        260                 265                 270Leu Gly Gly Met Leu Lys Asn Tyr Asp Glu Pro Tyr Leu Pro Gln Phe
    275                 280                 285Gly Pro Gly Thr Ser Ser Gln His Gly Val Ile Asn Gly Phe Gly Ile
290                 295                 300Gln Val Gly Tyr Lys Gln Phe Phe Gly Ser Lys Lys Asn Ile Gly Leu305                 310                 315                 320Arg Tyr Tyr Ala Phe Phe Asp Tyr Gly Phe Thr Gln Leu Gly Ser Leu
            325                 330                 335Asn Ser Ala Val Lys Ala Asn Ile Phe Thr Tyr Gly Ala Gly Thr Asp
        340                 345                 350Phe Leu Trp Asn Ile Phe Arg Arg Val Phe Ser Asp Gln Ser Leu Asn
    355                 360                 365Val Gly Val Phe Gly Gly Ile Gln Ile Ala Gly Asn Thr Trp Asp Ser
370                 375                 380Ser Leu Arg Gly Gln Ile Glu Asn Ser Phe Lys Glu Tyr Pro Thr Pro385                 390                 395                 400Thr Asn Phe Gln Phe Leu Phe Asn Leu Gly Leu Arg Ala His Phe Ala
            405                 410                 415Ser Thr Met His Arg Arg Phe Leu Ser Ala Ser Gln Ser Ile Gln His
        420                 425                 430Gly Met Glu Phe Gly Val Lys Ile Pro Ala Ile Asn Gln Arg Tyr Leu
    435                 440                 445Lys Ala Asn Gly Ala Asp Val Asp Tyr Arg Arg Leu Tyr Ala Phe Tyr
450                 455                 460Ile Asn Tyr Thr Ile Gly Phe465                 470(2)INFORMATION FOR SEQ ID NO:140:
(i)序列特征:
  (A)长度:129个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...129
(xi)序列描述:SEQ ID NO:140:Met Lys Ser Ile Arg Arg Gly Asp Gly Leu Asn Val Val Pro Phe Ile1               5                   10                  15Asp Ile Met Leu Val Leu Leu Ala Ile Val Leu Ser Ile Ser Thr Phe
        20                  25                  30Ile Ala Gln Gly Lys Ile Lys Val Ser Leu Pro Asn Ala Lys Asn Ala
    35                  40                  45Glu Lys Ser Gln Pro Asn Asp Gln Lys Val Val Val Ile Ser Val Asp
50                  55                  60Glu His Asp Asn Ile Phe Val Asp Asp Lys Pro Thr Asn Leu Glu Ala65                  70                  75                  80Leu Ser Ala Val Val Lys Gln Thr Asp Pro Lys Thr Leu Ile Asp Leu
            85                  90                  95Lys Ser Asp Lys Ser Ser Arg Phe Glu Thr Phe Ile Ser Ile Met Asp
        100                 105                 110Ile Leu Lys Glu His Asn His Glu Asn Phe Ser Ile Ser Thr Gln Ala
    115                 120                 125Gln(2)INFORMATION FOR SEQ ID NO:141:
(i)序列特征:
  (A)长度:75个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...75
(xi)序列描述:SEQ ID NO:141:Met Leu Val Leu Leu Ala Ile Val Leu Ser Ile Ser Thr Phe Ile Ala1               5                   10                  15Gln Gly Lys Ile Lys Val Ser Leu Pro Asn Ala Lys Asn Ala Glu Lys
        20                  25                  30Ser Arg Pro Asn Asp Gln Lys Val Val Val Ile Ser Val Asp Glu His
    35                  40                  45Asp Asn Ile Phe Val Asp Asp Lys Pro Thr Asn Leu Glu Ala Leu Ser
50                  55                  60Ala Val Val Lys Gln Thr Asp Pro Lys Thr Leu65                  70                  75(2)INFORMATION FOR SEQ ID NO:142:
(i)序列特征:
  (A)长度:223个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...223
(xi)序列描述:SEQ ID NO:142:Met Phe Ser Leu Ser Tyr Val Ser Lys Lys Phe Leu Ser Val Leu Leu1               5                   10                  15Leu Ile Ser Leu Phe Leu Ser Ala Cys Lys Ser Asn Asn Lys Asp Lys
        20                  25                  30Leu Asp Glu Asn Leu Leu Ser Ser Gly Thr Gln Ser Ser Lys Glu Leu
    35                  40                  45Asn Asp Lys Arg Asp Asn Ile Asp Lys Lys Ser Tyr Ala Gly Leu Glu
50                  55                  60Asp Val Phe Leu Asp Asn Lys Ser Ile Ser Pro Asn Asp Lys Tyr Met65                  70                  75                  80Leu Leu Val Phe Gly Arg Asn Gly Cys Ser Tyr Cys Glu Arg Leu Lys
            85                  90                  95Lys Asp Leu Lys Asn Val Lys Glu Leu Arg Asn Tyr Ile Lys Glu His
        100                 105                 110Phe Ser Ala Tyr Tyr Val Asn Ile Ser Tyr Ser Lys Glu His Asn Phe
    115                 120                 125Lys Val Gly Asp Lys Asp Lys Asn Asp Glu Lys Glu Ile Lys Met Ser
130                 135                 140Thr Glu Glu Leu Ala Gln Ile Tyr Ala Val Gln Ser Thr Pro Thr Ile145                 150                 155                 160Val Leu Ser Asp Lys Thr Gly Lys Thr Ile Tyr Glu Leu Pro Gly Tyr
            165                 170                 175Met Pro Ser Val Gln Phe Leu Ala Val Leu Glu Phe Ile Gly Asp Gly
        180                 185                 190Lys Tyr Gln Asp Thr Lys Asn Asp Glu Asp Leu Thr Lys Lys Leu Lys
    195                 200                 205Ala Tyr Ile Lys Tyr Lys Thr Asn Leu Ser Lys Ser Lys Ser Ser
210                 215                 220(2)INFORMATION FOR SEQ ID NO:143:
(i)序列特征:
  (A)长度:116个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...116
(xi)序列描述:SEQ ID NO:143:Leu Met Lys Ser Lys Ile Thr His Phe Ile Val Ile Ser Phe Val Leu1               5                   10                  15Ser Val Leu Ser Ala Cys Lys Asp Glu Pro Lys Lys Ser Ser Gln Ser
        20                  25                  30His Gln Asn Asn Thr Lys Thr Thr Gln Asn Asn Gln Ile Asn Gln Pro
    35                  40                  45Asn Lys Asp Ile Lys Lys Ile Glu His Glu Glu Glu Asp Glu Lys Val
50                  55                  60Thr Lys Glu Val Asn Asp Leu Ile Asn Asn Glu Asn Lys Ile Asp Glu65                  70                  75                  80Ile Asn Asn Glu Glu Asn Ala Asp Pro Ser Gln Lys Arg Thr Asn Asn
            85                  90                   95Val Leu Gln Arg Ala Thr Asn His Gln Asp AsnLeu Ser Ser Pro Leu
        100                 105                    110Asn Arg Lys Tyr
    115(2)INFORMATION FOR SEQ ID NO:144:
(i)序列特征:
  (A)长度:79个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置l...79
(xi)序列描述:SEQ ID NO:144:Met Phe Glu Lys Ile Arg Lys Ile Leu Ala Asp Ile Glu Asp Ser Gln1               5                   10                  15Asn Glu Ile Glu Met Leu Leu Lys Leu Ala Asn Leu Ser Leu Gly Asp
        20                  25                  30Phe Ile Glu Ile Lys Arg Gly Ser Met Asp Met Pro Lys Gly Val Asn
    35                  40                  45Glu Ala Phe Phe Thr Gln Leu Ser Glu Glu Val Glu Arg Leu Lys Glu
50                  55                  60Leu Ile Asn Ala Leu Asn Lys Ile Lys Lys Gly Leu Leu Val Phe65                  70                  75(2)INFORMATION FOR SEQ ID NO:145:
(i)序列特征:
  (A)长度:51个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...5l
(xi)序列描述:SEQ ID NO:145:Met Ser Met Phe Ile Ser Asn Leu Ala Phe Thr Ser Glu His Lys Asp1               5                   10                  15Ala Met Glu Val Ala Lys Ile Ala Ile Leu Leu Gly Ser Leu Ile Ser
        20                  25                  30Gly Ile Ile Gly Ala Leu Tyr Leu Phe Ala Leu Asp Lys Arg Ala Ala
    35                  40                  45Leu Lys Lys
50(2)INFORMATION FOR SEQ ID NO:146:
(i)序列特征:
  (A)长度:449个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...449
(xi)序列描述:SEQ ID NO:146:Met Gly Leu Lys Ile Lys Ile Leu Arg Leu Ser Met Asn Leu Lys Lys1               5                   10                  15Thr Glu Asn Ala Leu Ser Leu Thr Leu Lys Asn Phe Ile Lys Ser Glu
        20                  25                  30Ser Phe Gly Gly Ile Phe Leu Phe Leu Asn Ala Val Leu Ala Met Val
    35                  40                  45Val Ala Asn Ser Phe Leu Lys Glu Ser Tyr Phe Ala Leu Trp His Thr
50                  55                  60Pro Phe Gly Phe Gln Val Gly Asp Phe Phe Ile Gly Phe Ser Leu His65                  70                  75                  80Asn Trp Ile Asp Asp Val Leu Met Ala Leu Phe Phe Leu Met Ile Gly
            85                  90                  95Leu Glu Ile Lys Arg Glu Leu Leu Phe Gly Glu Leu Ser Ser Phe Lys
        100                 105                 110Lys Ala Ser Phe Pro Val Ile Ala Ala Ile Gly Gly Met Ile Ala Pro
    115                 120                 125Gly Leu Ile Tyr Phe Phe Leu Asn Ala Asn Thr Pro Ser Gln His Gly
130                 135                 140Phe Gly Ile Pro Met Ala Thr Asp Ile Ala Phe Ala Leu Gly Val Ile145                 150                 155                 160Met Leu Leu Gly Lys Arg Val Pro Thr Ala Leu Lys Val Phe Leu Ile
            165                 170                 175Thr Leu Ala Val Ala Asp Asp Leu Gly Ala Ile Val Val Ile Ala Leu
        180                 185                 190Phe Tyr Thr Thr Asn Leu Lys Phe Ala Trp Leu Leu Gly Ala Leu Gly
    195                 200                 205Val Val Leu Val Leu Ala Ile Leu Asn Arg Leu Asn Ile Arg Ser Leu
210                 215                 220Ile Pro Tyr Leu Leu Leu Gly Val Leu Leu Trp Phe Cys Val His Gln225                 230                 235                 240Ser Gly Ile His Ala Thr Ile Ala Ala Val Val Leu Ala Phe Met Ile
            245                 250                 255Pro Val Lys Ile Pro Lys Asp Ser Lys Asn Val Glu Leu Leu Glu Leu
        260                 265                 270Gly Lys Arg Tyr Ala Glu Thr Ser Ser Gly Val Leu Leu Thr Lys Glu
    275                 280                 285Gln Gln Glu Ile Leu His Ser Ile Glu Glu Lys Ala Ser Ala Leu Gln
290                 295                 300Ser Pro Leu Glu Arg Leu Glu His Phe Leu Ala Pro Ile Ser Gly Tyr305                 310                 315                 320Phe Ile Met Pro Leu Phe Ala Phe Ala Asn Ala Gly Val Ser Val Asp
            325                 330                 335Ser Ser Ile Asn Leu Glu Val Asp Lys Val Leu Leu Gly Val Ile Leu
        340                 345                 350Gly Leu Cys Leu Gly Lys Pro Leu Gly Ile Phe Leu Ile Thr Phe Ile
    355                 360                 365Ser Glu Lys Leu Lys Ile Thr Ala Arg Pro Lys Gly Ile Gly Trp Trp
370                 375                 380His Ile Leu Gly Ala Gly Leu Leu Ala Gly Ile Gly Phe Thr Met Ser385                 390                 395                 400Met Phe Ile Ser Asn Leu Ala Phe Thr Ser Glu His Lys Asp Ala Met
            405                 410                 415Glu Val Ala Lys Ile Ala Ile Leu Leu Gly Ser Leu Ile Ser Gly Ile
        420                 425                 430Ile Gly Ala Leu Tyr Leu Phe Ala Leu Asp Lys Arg Ala Ala Leu Lys
    435                 440                 445Lys(2)INFORMATION FOR SEQ ID NO:147:
(i)序列特征:
  (A)长度:815个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...815
(xi)序列描述:SEQ ID NO:147:Met Asn Asp Lys Arg Phe Arg Lys Tyr Cys Ser Phe Ser Ile Phe Leu1               5                   10                  15Ser Leu Leu Gly Thr Phe Glu Leu Glu Ala Lys Glu Glu Glu Lys Glu
        20                  25                  30Glu Lys Lys Thr Glu Arg Asn Lys Asp Lys Glu Lys Asn Ala Gln His
    35                  40                  45Thr Leu Gly Lys Val Thr Thr Gln Ala Ala Lys Ile Phe Asn Tyr Asn
50                  55                  60Asn Gln Thr Thr Ile Ser Ser Lys Glu Leu Glu Arg Arg Gln Ala Asn65                  70                  75                  80Gln Ile Ser Asp Met Phe Arg Arg Asn Pro Asn Ile Asn Val Gly Gly
            85                  90                  95Gly Ala Val Ile Ala Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg
        100                 105                 110Leu Ala Arg Val Thr Val Asp Gly Val Ala Gln Met Gly Ala Ser Tyr
    115                 120                 125Gly His Gln Gly Asn Thr Ile Ile Asp Pro Gly Met Leu Lys Ser Val
130                 135                 140Val Val Thr Lys Gly Ala Ala Gln Ala Ser Ala Gly Pro Met Ala Leu145                 150                 155                 160Ile Gly Ala Ile Lys Met Glu Thr Arg Ser Ala Ser Asp Phe Ile Pro
            165                 170                 175Lys Gly Lys Asp Tyr Ala Ile Ser Gly Ala Ala Thr Phe Leu Thr Asn
        180                 185                 190Phe Gly Asp Arg Glu Thr Ile Met Gly Ala Tyr Arg Asn His His Phe
    195                 200                 205Asp Ala Leu Leu Tyr Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Asp
210                 215                 220Gly Asp Asn Ala Met Lys Asn Leu Phe Asp Pro Lys Ala Asp Asn Lys225                 230                 235                 240Val Thr Ala Ser Pro Ser Glu Gln Asn Asn Val Met Ala Lys Ile Asn
            245                 250                 255Gly Tyr Leu Ser Glu Arg Asp Thr Leu Thr Leu Ser Tyr Asn Met Thr
        260                 265                 270Arg Asp Asn Ala Asn Arg Pro Leu Arg Ala Asn Phe Thr Gly Thr Phe
    275                 280                 285Leu Pro Tyr Ser Cys Gly Asp Phe Asn Ala Phe Pro Asn Glu Lys Asn
290                 295                 300Pro Ser Asp Cys Leu Phe Glu Asn Asp Ala Ser Leu Phe Lys Thr Tyr305                 310                 315                 320Ser Val Asn Leu Val His Asn Val Ser Leu Asn Tyr Glu Arg Glu Gly
            325                 330                 335Gly Ser Arg Phe Gly Asp Pro Lys Leu Lys Ile Asn Gly Tyr Thr Ser
        340                 345                 350Ile Arg Asn Val Gln Ile Asp Pro Leu Phe Arg Pro Ser Asp Ile Ala
    355                 360                 365Thr Thr Ile Pro Phe Thr Pro Asn Pro Gln Leu Ser Gln Gly Glu Glu
370                 375                 380Asn Gln Cys Val Ala Gln Gly Gly Ile Tyr Asp Ala Leu Lys Gln Thr385                 390                 395                 400Cys Ser Ile Thr Phe Lys Ser Leu Gly Gly Gly Ser Val Val Ala Asn
            405                 410                 415Lys Asn Leu Phe Ile Ile Asn Ser Gly Phe Asn Ala Asn Val Ile His
        420                 425                 430Thr Ile Asp His Lys Asn Asp Asn Leu Leu Glu Tyr Gly Leu Asn Tyr
    435                 440                 445Gln Asn Leu Thr Thr Phe Asp Lys Ala Ile Pro Asp Ser Glu Leu Val
450                 455                 460Lys Pro Gly Asp Ala Pro Asp Ala Cys Leu Arg Val Thr Gly Pro Asp465                 470                 475                 480Asp Pro Asn Met Asn Gly Arg Cys Gln Arg Asn Gly Ala Thr Ala Asn
            485                 490                 495Val Val Gly Val Tyr Ala Gln Ala Asn Tyr Thr Leu His Pro Met Val
        500                 505                 510Thr Leu Gly Ala Gly Thr Arg Tyr Asp Val Tyr Thr Leu Val Asp Lys
    515                 520                 525Asp Trp Gln Leu His Val Thr Gln Gly Phe Ser Pro Ser Ala Ala Leu
530                 535                 540Asn Val Ser Pro Leu Glu Asn Leu Asn Phe Arg Leu Ser Tyr Ala Tyr545                 550                 555                 560Val Thr Arg Gly Pro Met Pro Gly Gly Leu Val Trp Met Arg Gln Asp
            565                 570                 575Asn Leu Arg Tyr Asn Arg Asn Leu Lys Pro Glu Ile Gly Gln Asn Ala
        580                 585                 590Glu Phe Asn Thr Glu Tyr Ser Ser Gln Tyr Phe Asp Phe Arg Ala Ala
    595                 600                 605Gly Phe Val Gln Leu Ile Ser Asn Tyr Ile Asn Gln Phe Ser Ser Thr
610                 615                 620Leu Phe Val Thr Asn Leu Pro Ala Gln Asp Ile Ile Tyr Val Pro Gly625                 630                 635                 640Tyr Glu Val Ser Gly Thr Ala Lys Tyr Lys Gly Phe Ser Leu Gly Leu
            645                 650                 655Ser Val Ala Arg Ser Trp Pro Ser Leu Lys Gly Arg Leu Ile Ala Asp
        660                 665                 670Val Tyr Glu Leu Ala Ala Thr Thr Gly Asn Val Phe Ile Leu Thr Ala
    675                 680                 685Ser Tyr Thr Ile Pro Arg Thr Gly Leu Ser Ile Thr Trp Leu Ser Arg
690                 695                 700Phe Val Thr Asn Leu Ser Tyr Cys Ser Tyr Ser Pro Tyr Arg Asn Gly705                 710                 715                 720Pro Thr Asp Ile Asp Arg Arg Pro Ser Asn Cys Pro Lys Thr Pro Gly
            725                 730                 735Ile Phe His Val His Lys Pro Gly Tyr Gly Val Ser Ser Phe Phe Ile
        740                 745                 750Thr Tyr Lys Pro Thr Tyr Lys Lys Leu Lys Gly Leu Ser Leu Asn Ala
    755                 760                 765Val Phe Asn Asn Val Phe Asn Gln Gln Tyr Ile Asp Gln Ala Ser Pro
770                 775                 780Val Met Ser Pro Asp Glu Pro Asn Gln Asp Lys Tyr Ala Arg Gly Met785                 790                 795                 800Ala Glu Pro Gly Phe Asn Ala Arg Phe Glu Ile Ser Tyr Lys Phe
            805                  810                815(2)INFORMATION FOR SEQ ID NO:148:
(i)序列特征:
  (A)长度:814个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...814
(xi)序列描述:SEQ ID NO:148:Met Thr Ser Val Leu Glu Lys Tyr Cys Ser Phe Ser Ile Phe Leu Ser1               5                   10                  15Leu Leu Gly Thr Phe Glu Leu Glu Ala Lys Glu Glu Glu Lys Glu Glu
        20                  25                  30Lys Lys Thr Glu Arg Asn Lys Asp Lys Glu Lys Asn Ala Gln His Thr
    35                  40                  45Leu Gly Lys Val Thr Thr Gln Ala Ala Lys Ile Phe Asn Tyr Asn Asn
50                  55                  60Gln Thr Thr Ile Ser Ser Lys Glu Leu Glu Arg Arg Gln Ala Asn Gln65                  70                  75                  80Ile Ser Asp Met Phe Arg Arg Asn Pro Asn Ile Asn Val Gly Gly Gly
            85                  90                  95Ala Val Ile Ala Gln Lys Ile Tyr Val Arg Gly Ile Glu Asp Arg Leu
        100                 105                 110Ala Arg Val Thr Val Asp Gly Val Ala Gln Met Gly Ala Ser Tyr Gly
    115                 120                 125His Gln Gly Asn Thr Ile Ile Asp Pro Gly Met Leu Lys Ser Val Val
130                 135                 140Val Thr Lys Gly Ala Ala Gln Ala Ser Ala Gly Pro Met Ala Leu Ile145                 150                 155                 160Gly Ala Ile Lys Met Glu Thr Arg Ser Ala Ser Asp Phe Ile Pro Lys
            165                 170                 175Gly Lys Asp Tyr Ala Ile Ser Gly Ala Ala Thr Phe Leu Thr Asn Phe
        180                 185                 190Gly Asp Arg Glu Thr Ile Met Gly Ala Tyr Arg Asn His His Phe Asp
    195                 200                 205Ala Leu Leu Tyr Tyr Thr His Gln Asn Ile Phe Tyr Tyr Arg Asp Gly
210                 215                 220Asp Asn Ala Met Lys Asn Leu Phe Asp Pro Lys Ala Asp Asn Lys Val225                 230                 235                 240Thr Ala Ser Pro Ser Glu Gln Asn Asn Val Met Ala Lys Ile Asn Gly
            245                 250                 255Tyr Leu Ser Glu Arg Asp Thr Leu Thr Leu Ser Tyr Asn Met Thr Arg
        260                 265                 270Asp Asn Ala Asn Arg Pro Leu Arg Ala Asn Phe Thr Gly Thr Phe Leu
    275                 280                 285Pro Tyr Ser Cys Gly Asp Phe Asn Ala Phe Pro Asn Glu Lys Asn Pro
290                 295                 300Ser Asp Cys Leu Phe Glu Asn Asp Ala Ser Leu Phe Lys Thr Tyr Ser305                 310                 315                 320Val Asn Leu Val His Asn Val Ser Leu Asn Tyr Glu Arg Glu Gly Gly
            325                 330                 335Ser Arg Phe Gly Asp Pro Lys Leu Lys Ile Asn Gly Tyr Thr Ser Ile
        340                 345                 350Arg Asn Val Gln Ile Asp Pro Leu Phe Arg Pro Ser Asp Ile Ala Thr
    355                 360                 365Thr Ile Pro Phe Thr Pro Asn Pro Gln Leu Ser Gln Gly Glu Glu Asn
370                 375                 380Gln Cys Val Ala Gln Gly Gly Ile Tyr Asp Ala Leu Lys Gln Thr Cys385                 390                 395                 400Ser Ile Thr Phe Lys Ser Leu Gly Gly Gly Ser Val Val Ala Asn Lys
            405                 410                 415Asn Leu Phe Ile Ile Asn Ser Gly Phe Asn Ala Asn Val Ile His Thr
        420                 425                 430Ile Asp His Lys Asn Asp Asn Leu Leu Glu Tyr Gly Leu Asn Tyr Gln
    435                  440                 445Asn Leu Thr Thr Phe Asp Lys Ala Ile Pro Asp Ser Glu Leu Val Lys
450                 455                 460Pro Gly Asp Ala Pro Asp Ala Cys Leu Arg Val Thr Gly Pro Asp Asp465                 470                 475                 480Pro Asn Met Asn Gly Arg Cys Gln Arg Asn Gly Ala Thr Ala Asn Val
            485                 490                 495Val Gly Val Tyr Ala Gln Ala Asn Tyr Thr Leu His Pro Met Val Thr
        500                 505                 510Leu Gly Ala Gly Thr Arg Tyr Asp Val Tyr Thr Leu Val Asp Lys Asp
    515                 520                 525Trp Gln Leu His Val Thr Gln Gly Phe Ser Pro Ser Ala Ala Leu Asn
530                 535                 540Val Ser Pro Leu Glu Asn Leu Asn Phe Arg Leu Ser Tyr Ala Tyr Val545                 550                 555                 560Thr Arg Gly Pro Met Pro Gly Gly Leu Val Trp Met Arg Gln Asp Asn
            565                 570                 575Leu Arg Tyr Asn Arg Asn Leu Lys Pro Glu Ile Gly Gln Asn Ala Glu
        580                 585                 590Phe Asn Thr Glu Tyr Ser Ser Gln Tyr Phe Asp Phe Arg Ala Ala Gly
    595                 600                 605Phe Val Gln Leu Ile Ser Asn Tyr Ile Asn Gln Phe Ser Ser Thr Leu
610                 615                 620Phe Val Thr Asn Leu Pro Ala Gln Asp Ile Ile Tyr Val Pro Gly Tyr625                 630                 635                 640Glu Val Ser Gly Thr Ala Lys Tyr Lys Gly Phe Ser Leu Gly Leu Ser
            645                 650                 655Val Ala Arg Ser Trp Pro Ser Leu Lys Gly Arg Leu Ile Ala Asp Val
        660                 665                 670Tyr Glu Leu Ala Ala Thr Thr Gly Asn Val Phe Ile Leu Thr Ala Ser
    675                 680                 685Tyr Thr Ile Pro Arg Thr Gly Leu Ser Ile Thr Trp Leu Ser Arg Phe
690                 695                 700Val Thr Asn Leu Ser Tyr Cys Ser Tyr Ser Pro Tyr Arg Asn Gly Pro705                 710                 715                 720Thr Asp Ile Asp Arg Arg Pro Ser Asn Cys Pro Lys Thr Pro Gly Ile
            725                 730                 735Phe His Val His Lys Pro Gly Tyr Gly Val Ser Ser Phe Phe Ile Thr
        740                 745                 750Tyr Lys Pro Thr Tyr Lys Lys Leu Lys Gly Leu Ser Leu Asn Ala Val
    755                 760                 765Phe Asn Asn Val Phe Asn Gln Gln Tyr Ile Asp Gln Ala Ser Pro Val
770                 775                 780Met Ser Pro Asp Glu Pro Asn Gln Asp Lys Tyr Ala Arg Gly Met Ala785                 790                 795                 800Glu Pro Gly Phe Asn Ala Arg Phe Glu Ile Ser Tyr Lys Phe
            805                 810(2)INFORMATION FOR SEQ ID NO:149:
(i)序列特征:
  (A)长度:527个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...527
(xi)序列描述:SEQ ID NO:149:Met Lys Gln Asn Leu Lys Pro Phe Lys Met Ile Lys Glu Asn Leu Met1               5                   10                  15Thr Gln Ser Gln Lys Val Arg Phe Leu Ala Pro Leu Ser Leu Ala Leu
        20                  25                  30Ser Leu Ser Phe Asn Pro Val Gly Ala Glu Glu Asp Gly Gly Phe Met
    35                  40                  45Thr Phe Gly Tyr Glu Leu Gly Gln Val Val Gln Gln Val Lys Asn Pro
50                  55                  60Gly Lys Ile Lys Ala Glu Glu Leu Ala Gly Leu Leu Asn Ser Thr Thr65                  70                  75                  80Thr Asn Asn Thr Asn Ile Asn Ile Ala Gly Thr Gly Gly Asn Val Ala
            85                  90                  95Gly Thr Leu Gly Asn Leu Phe Met Asn Gln Leu Gly Asn Leu Ile Asp
        100                 105                 110Leu Tyr Pro Thr Leu Lys Thr Asn Asn Leu His Gln Cys Gly Ser Thr
    115                 120                 125Asn Ser Gly Asn Gly Ala Thr Ala Ala Ala Ala Thr Asn Asn Ser Pro
130                 135                 140Cys Phe Gln Gly Asn Leu Ala Leu Tyr Asn Glu Met Val Asp Ser Ile145                 150                 155                 160Lys Thr Leu Ser Gln Asn Ile Ser Lys Asn Ile Phe Gln Gly Asp Asn
            165                 170                 175Asn Thr Thr Ser Ala Asn Leu Ser Asn Gln Leu Ser Glu Leu Asn Thr
        180                 185                 190Ala Ser Val Tyr Leu Thr Tyr Met Asn Ser Phe Leu Asn Ala Asn Asn
    195                 200                 205Gln Ala Gly Gly Ile Phe Gln Asn Asn Thr Asn Gln Ala Tyr Glu Asn
210                 215                 220Gly Val Thr Ala Gln Gln Ile Ala Tyr Val Leu Lys Gln Ala Ser Ile225                 230                 235                 240Thr Met Gly Pro Ser Gly Asp Ser Gly Ala Ala Gly Ala Phe Leu Asp
            245                 250                 255Ala Ala Leu Ala Gln His Val Phe Asn Ser Ala Asn Ala Gly Asn Asp
        260                 265                 270Leu Ser Ala Lys Glu Phe Thr Ser Leu Val Gln Asn Ile Val Asn Asn
    275                 280                 285Ser Gln Asn Ala Leu Thr Leu Ala Asn Asn Ala Asn Ile Ser Asn Ser
290                 295                 300Thr Gly Tyr Gln Val Ser Tyr Gly Gly Asn Ile Asp Gln Ala Arg Ser305                 310                 315                 320Thr Gln Leu Leu Asn Asn Thr Thr Asn Thr Leu Ala Lys Val Thr Ala
            325                 330                 335Leu Asn Asn Glu Leu Lys Ala Asn Pro Trp Leu Gly Asn Phe Ala Ala
        340                 345                 350Gly Asn Ser Ser Gln Val Asn Ala Phe Asn Gly Phe Ile Thr Lys Ile
    355                 360                 365Gly Tyr Lys Gln Phe Phe Gly Glu Asn Lys Asn Val Gly Leu Arg Tyr
370                 375                 380Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Gly Val Gly Asn Gly Pro Thr385                 390                 395                 400Tyr Asn Gln Val Asn Leu Leu Thr Tyr Gly Val Gly Thr Asp Val Leu
            405                 410                 415Tyr Asn Val Phe Ser Arg Ser Phe Gly Ser Arg Ser Leu Asn Ala Gly
        420                 425                 430Phe Phe Gly Gly Ile Gln Leu Ala Gly Asp Thr Tyr Ile Ser Thr Leu
    435                 440                 445Arg Asn Ser Pro Gln Leu Ala Ser Arg Pro Thr Ala Thr Lys Phe Gln
450                 455                 460Phe Leu Phe Asp Val Gly Leu Arg Met Asn Phe Gly Ile Leu Lys Lys465                 470                 475                 480Asp Leu Lys Ser His Asn Gln His Ser Ile Glu Ile Gly Val Gln Ile
            485                 490                 495Pro Thr Ile Tyr Asn Thr Tyr Tyr Lys Ala Gly Gly Ala Glu Val Lys
        500                 505                 510Tyr Phe Arg Pro Tyr Ser Val Tyr Trp Val Tyr Gly Tyr Ala Phe
    515                 520                 525(2)INFORMATION FOR SEQ ID NO:150:
(i)序列特征:
  (A)长度:459个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...459
(xi)序列描述:SEQ ID NO:150:Val Val Leu Leu Thr Met Thr Lys Arg Leu Phe Lys Gly Leu Leu Ala1               5                   10                  15Ile Ser Leu Ala Val Ser Leu His Gly Gly Glu Val Lys Glu Lys Lys
        20                  25                  30Pro Val Lys Pro Val Lys Glu Asp Pro Gln Glu Leu Ala Ala Lys Arg
    35                  40                  45Val Glu Ala Phe Ser Arg Phe Ser Asn Val Val Thr Glu Ile Glu Lys
50                  55                  60Lys Tyr Val Asp Lys Ile Ser Ile Ser Glu Ile Met Thr Lys Ala Ile65                  70                  75                  80Glu Gly Leu Leu Ser Asn Leu Asp Ala His Ser Ala Tyr Leu Asn Glu
            85                  90                  95Lys Lys Phe Lys Glu Phe Gln Ala Gln Thr Glu Gly Glu Phe Gly Gly
        100                 105                 110Leu Gly Ile Thr Val Gly Met Arg Asp Gly Val Leu Thr Val Ile Ala
    115                 120                 125Pro Leu Glu Gly Thr Pro Ala Tyr Lys Ala Gly Val Lys Ser Gly Asp
130                 135                 140Ser Ile Leu Lys Ile Asn Asn Glu Ser Thr Leu Ser Met Ser Ile Asp145                 150                 155                 160Asp Ala Val Asn Leu Met Arg Gly Lys Pro Lys Thr Ser Ile Gln Ile
            165                 170                 175Thr Val Val Arg Lys Asn Glu Pro Lys Pro Leu Val Phe Asn Ile Val
        180                 185                 190Arg Asp Ile Ile Lys Ile Pro Ser Val Tyr Val Lys Lys Ile Lys Asp
    195                 200                 205Thr Pro Tyr Leu Tyr Val Arg Val Asn Ser Phe Asp Lys Asn Val Thr
210                 215                 220Lys Ser Val Leu Asp Gly Leu Lys Ala Asn Pro Asn Ile Lys Gly Val225                 230                 235                 240Val Leu Asp Leu Arg Gly Asn Pro Gly Gly Leu Leu Asn Gln Ala Val
            245                 250                 255Gly Leu Ser Asn Leu Phe Ile Lys Glu Gly Val Leu Val Ser Gln Arg
        260                 265                 270Gly Lys Asn Lys Glu Glu Asn Leu Glu Tyr Lys Ala Asn Gly Arg Ala
    275                 280                 285Pro Tyr Thr Asn Leu Pro Val Val Val Leu Val Asn Gly Gly Ser Ala
290                 295                 300Ser Ala Ser Glu Ile Val Ala Gly Ala Leu Gln Asp His Lys Arg Ala305                 310                 315                 320Ile Ile Ile Gly Glu Lys Thr Phe Gly Lys Gly Ser Val Gln Val Leu
            325                 330                 335Leu Pro Val Asn Lys Asp Glu Ala Ile Lys Ile Thr Thr Ala Arg Tyr
        340                 345                 350Tyr Leu Pro Ser Gly Arg Thr Ile Gln Ala Lys Gly Ile Thr Pro Asp
    355                 360                 365Ile Val Ile Tyr Pro Gly Lys Val Pro Glu Asn Glu Asn Lys Phe Ser
370                 375                 380Leu Lys Glu Ala Asp Leu Lys His His Leu Glu Gln Glu Leu Lys Lys385                 390                 395                 400Leu Asp Asp Lys Thr Pro Ile Ser Lys Glu Ala Asp Lys Asp Lys Lys
            405                 410                 415Ser Glu Glu Glu Lys Glu Val Thr Pro Lys Met Ile Asn Asp Asp Ile
        420                 425                 430Gln Leu Lys Thr Ala Ile Asp Ser Leu Lys Thr Trp Ser Ile Val Asp
    435                 440                 445Glu Lys Met Asp Glu Lys Val Pro Lys Lys Lys
450                 455(2)INFORMATION FOR SEQ ID NO:151:
(i)序列特征:
  (A)长度:104个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...104
(xi)序列描述:SEQ ID NO:151:Leu Leu Leu His Pro Leu His Ala His Ala Gln Val Leu Gly Phe Thr1               5                   10                  15Asn His Asp His Ala Pro Trp Leu Tyr Asp Phe Ile Lys Ser Phe Cys
        20                  25                  30Asn Leu Ser Gly Gln Pro Phe Leu Asp Leu Gln Ala Phe Ala Ile Asn
    35                  40                  45Phe Asn Glu Phe Ser Asp Arg Ala Asn Ala Tyr Asn Leu Phe Leu Arg
50                  55                  60Asp Ile Ser His Ala Asn Ile Pro Lys Lys Arg Glu Gln Met Val Leu65                  70                  75                  80Ala Ser Gly Val Lys Phe Asn Val Leu Ser His Tyr His Phe Ile Ala
            85                  90                  95Asn Ala Leu Lys Ile Arg Ala Phe
        100(2)INFORMATION FOR SEQ ID NO:152:
(i)序列特征:
  (A)长度:165个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...165
(xi)序列描述:SEQ ID NO:152:Met Ile Glu Leu Ile Leu His Asn Lys Ser Ile Gln Ile Asp Glu Thr1               5                   10                  15Leu Leu Asn Val Lys Glu His Leu Glu Lys Phe Tyr Ser Asn Lys Glu
        20                  25                  30Gln Glu Thr Ile Ala Lys Thr Leu Glu Ser Gln Thr Glu Leu Thr Cys
    35                  40                  45Ser Tyr Leu Leu Asp Lys Asp Phe Ser Leu Leu Glu Lys His Leu Glu
50                  55                  60Asn Ser Leu Gly His Phe Thr Phe Glu Ser Glu Phe Ala Leu Leu Lys65                  70                  75                  80Asp Lys Glu Pro Leu Asn Leu Ala Gln Ile Lys Gln Ile Gly Val Leu
            85                  90                  95Lys Val Ile Thr Tyr Glu Met Thr Gln Ala Leu Lys Asn Gln Ile Ile
        100                 105                 110His Leu Thr Gln Ile Val Asn Glu Glu Asn Leu Glu Phe Asp Glu Glu
    115                 120                 125Leu Val Ile Tyr His Leu Asn Phe Lys Leu Asn Gln Asn Thr Tyr Lys
130                 135                 140Val Leu Ala Lys Phe Cys Val Leu Lys Lys Lys Gly Thr Leu His Glu145                 150                 155                 160Lys Phe Lys Ala Phe
            165(2)INFORMATION FOR SEQ ID NO:153:
(i)序列特征:
  (A)长度:213个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...213
(xi)序列描述:SEQ ID NO:153:Met Asp Thr Glu Thr Gln Glu Lys Phe Leu Ala Tyr Leu Phe Glu Lys1               5                   10                  15Ala Leu Gln Lys Asn Leu Gln Ala Tyr Trp Ile Thr Thr Thr Glu Thr
        20                  25                  30Lys Asn Glu Leu Thr Arg Glu Glu Phe Ser Asn Leu Ile Arg Lys Thr
    35                  40                  45Met Ile Glu Leu Ile Leu His Asn Lys Ser Ile Gln Ile Asp Glu Thr
50                  55                  60Leu Leu Asn Val Lys Glu His Leu Glu Lys Phe Tyr Ser Asn Lys Glu65                  70                  75                  80Gln Glu Thr Ile Ala Lys Thr Leu Glu Ser Gln Thr Glu Leu Thr Cys
            85                  90                  95Ser Tyr Leu Leu Asp Lys Asp Phe Ser Leu Leu Glu Lys His Leu Glu
        100                 105                 110Asn Ser Leu Gly His Phe Thr Phe Glu Ser Glu Phe Ala Leu Leu Lys
    115                 120                 125Asp Lys Glu Pro Leu Asn Leu Ala Gln Ile Lys Gln Ile Gly Val Leu
130                 135                 140Lys Val Ile Thr Tyr Glu Met Thr Gln Ala Leu Lys Asn Gln Ile Ile145                 150                 155                 160His Leu Thr Gln Ile Val Asn Glu Glu Asn Leu Glu Phe Asp Glu Glu
            165                 170                 175Leu Val Ile Tyr His Leu Asn Phe Lys Leu Asn Gln Asn Thr Tyr Lys
        180                 185                 190Val Leu Ala Lys Phe Cys Val Leu Lys Lys Lys Gly Thr Leu His Glu
    195                 200                 205Lys Phe Lys Ala Phe
210(2)INFORMATION FOR SEQ ID NO:154:
(i)序列特征:
  (A)长度:253个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...253
(xi)序列描述:SEQ ID NO:154:Met Ala Ile Ser Ile Lys Ser Pro Lys Glu Ile Lys Ala Leu Arg Lys1               5                   10                  15Ala Gly Glu Leu Thr Ala Gln Ala Leu Ala Leu Leu Glu Arg Glu Val
        20                  25                   30Arg Pro Gly Val Ser Leu Leu Glu Leu Asp Lys Met Ala Glu Asp Phe
    35                  40                  45Ile Lys Ser Ser His Ala Arg Pro Ala Phe Lys Gly Leu Tyr Gly Phe
50                  55                  60Pro Asn Ser Val Cys Met Ser Leu Asn Glu Val Val Ile His Gly Ile65                  70                  75                  80Pro Thr Asp Tyr Val Leu Gln Glu Gly Asp Ile Ile Gly Leu Asp Leu
            85                  90                  95Gly Val Glu Val Asp Gly Tyr Tyr Gly Asp Ser Ala Leu Thr Leu Pro
        100                 105                 110Ile Gly Ala Ile Ser Pro Gln Asp Glu Lys Leu Leu Ala Cys Ser Lys
    115                 120                 125Glu Ser Leu Met His Ala Ile Ser Ser Ile Arg Val Gly Met His Phe
130                 135                 140Lys Glu Leu Ser Gln Ile Leu Glu Gly Ala Ile Thr Glu Arg Gly Phe145                 150                 155                 160Val Pro Leu Lys Gly Phe Cys Gly His Gly Ile Gly Lys Lys Pro His
            165                 170                 175Glu Glu Pro Glu Ile Pro Asn Tyr Leu Glu Lys Gly Val Lys Ala Asn
        180                 185                 190Ser Gly Pro Lys Ile Lys Glu Gly Met Val Phe Cys Leu Glu Pro Met
    195                 200                 205Val Cys Gln Lys Gln Gly Glu Pro Lys Ile Leu Ala Asp Lys Trp Ser
210                 215                 220Val Val Ser Val Asp Gly Leu Asn Thr Ser His His Glu His Thr Ile225                 230                 235                 240Ala Ile Val Gly Asn Lys Ala Val Ile Leu Thr Glu Arg
            245                 250(2)INFORMATION FOR SEQ ID NO:155:
(i)序列特征:
  (A)长度:247个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...247
(xi)序列描述:SEQ ID NO:155:Lys Pro Lys Arg Asn Gln Ser Pro Lys Lys Ser Arg Glu Leu Thr Ala1               5                   10                  15Gln Ala Leu Ala Leu Leu Glu Arg Glu Val Arg Pro Gly Val Ser Leu
        20                   25                 30Leu Glu Leu Asp Lys Met Ala Glu Asp Phe Ile Lys Ser Ser His Ala
    35                  40                  45Arg Pro Ala Phe Lys Gly Leu Tyr Gly Phe Pro Asn Ser Val Cys Met
50                  55                  60Ser Leu Asn Glu Val Val Ile His Gly Ile Pro Thr Asp Tyr Val Leu65                  70                  75                  80Gln Glu Gly Asp Ile Ile Gly Leu Asp Leu Gly Val Glu Val Asp Gly
            85                  90                  95Tyr Tyr Gly Asp Ser Ala Leu Thr Leu Pro Ile Gly Ala Ile Ser Pro
        100                 105                 110Gln Asp Glu Lys Leu Leu Ala Cys Ser Lys Glu Ser Leu Met His Ala
    115                 120                 125Ile Ser Ser Ile Arg Val Gly Met His Phe Lys Glu Leu Ser Gln Ile
130                 135                 140Leu Glu Gly Ala Ile Thr Glu Arg Gly Phe Val Pro Leu Lys Gly Phe145                 150                 155                 160Cys Gly His Gly Ile Gly Lys Lys Pro His Glu Glu Pro Glu Ile Pro
            165                 170                 175Asn Tyr Leu Glu Lys Gly Val Lys Ala Asn Ser Gly Pro Lys Ile Lys
        180                 185                 190Glu Gly Met Val Phe Cys Leu Glu Pro Met Val Cys Gln Lys Gln Gly
    195                 200                 205Glu Pro Lys Ile Leu Ala Asp Lys Trp Ser Val Val Ser Val Asp Gly
210                 215                 220Leu Asn Thr Ser His His Glu His Thr Ile Ala Ile Val Gly Asn Lys225                 230                 235                 240Ala Val Ile Leu Thr Glu Arg
            245(2)INFORMATION FOR SEQ ID NO:156:
(i)序列特征:
  (A)长度:340个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...340
(xi)序列描述:SEQ ID NO:156:Met Tyr Arg Lys Asp Leu Asp Asn Tyr Leu Lys Gln Arg Leu Pro Lys1               5                   10                  15Ala Val Phe Leu Tyr Gly Glu Phe Asp Phe Phe Ile His Tyr Tyr Ile
        20                  25                  30Gln Thr Ile Ser Ala Leu Phe Lys Gly Asn Asn Pro Asp Thr Glu Thr
    35                  40                  45Ser Leu Phe Tyr Ala Ser Asp Tyr Glu Lys Ser Gln Ile Ala Thr Leu
50                  55                  60Leu Glu Gln Asp Ser Leu Phe Gly Gly Ser Ser Leu Val Ile Leu Lys65                  70                  75                  80Leu Asp Phe Ala Leu His Lys Lys Phe Lys Glu Asn Asp Ile Asn Pro
            85                  90                  95Phe Leu Lys Ala Leu Glu Arg Pro Ser His Asn Arg Leu Ile Ile Gly
        100                 105                 110Leu Tyr Asn Ala Lys Ser Asp Thr Thr Lys Tyr Lys Tyr Thr Ser Glu
    115                 120                 125Ile Ile Val Lys Phe Phe Gln Lys Ser Pro Leu Lys Asp Glu Ala Ile
130                 135                 140Cys Val Arg Phe Phe Thr Pro Lys Ala Trp Glu Ser Leu Lys Phe Leu145                 150                 155                 160Gln Glu Arg Ala Asn Phe Leu His Leu Asp Ile Ser Gly His Leu Leu
            165                 170                 175Asn Ala Leu Phe Glu Ile Asn Asn Glu Asp Leu Ser Val Ser Phe Asn
        180                 185                 190Asp Leu Asp Lys Leu Ala Val Leu Asn Ala Pro Ile Thr Leu Glu Asp
    195                 200                 205Ile Gln Glu Leu Ser Ser Asn Ala Gly Asp Met Asp Leu Gln Lys Leu
210                 215                 220Ile Leu Gly Leu Phe Leu Lys Lys Ser Val Leu Asp Ile Tyr Asp Tyr225                 230                 235                 240Leu Leu Lys Glu Gly Lys Lys Asp Ala Asp Ile Leu Arg Gly Leu Glu
            245                 250                 255Arg Tyr Phe Tyr Gln Leu Phe Leu Phe Phe Ala His Ile Lys Thr Thr
        260                 265                 270Gly Leu Met Asp Ala Lys Glu Val Leu Gly Tyr Ala Pro Pro Lys Glu
    275                 280                 285Ile Val Glu Asn Tyr Ala Lys Asn Ala Leu Arg Leu Lys Glu Ala Gly
290                 295                 300Tyr Lys Arg Val Phe Glu Ile Phe Arg Leu Trp His Leu Gln Ser Met305                 310                 315                 320Gln Gly Gln Lys Glu Leu Gly Phe Leu Tyr Leu Thr Pro Ile Gln Lys
            325                 330                 335Ile Ile Asn Pro
        340(2)INFORMATION FOR SEQ ID NO:157:
(i)序列特征:
  (A)长度:200个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...200
(xi)序列描述:SEQ ID NO:157:Val Phe Met Thr Ser Ala Leu Leu Gly Leu Gln Ile Val Leu Ala Val1               5                   10                  15Leu Ile Val Val Val Val Leu Leu Gln Lys Ser Ser Ser Ile Gly Leu
        20                  25                  30Gly Ala Tyr Ser Gly Ser Asn Asp Ser Leu Phe Gly Ala Lys Gly Pro
    35                  40                  45Ala Ser Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val
50                  55                  60Ile Asn Thr Ile Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys65                  70                  75                  80Ser Val Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val
            85                  90                  95Pro Ala Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro
        100                 105                 110Thr Leu Asn Pro Leu Glu Gln Ala Pro Thr Asn Pro Leu Met Pro Thr
    115                 120                 125Gln Thr Pro Lys Glu Leu Pro Lys Glu Pro Ala Lys Thr Pro Phe Val
130                 135                 140Glu Ser Pro Lys Gln Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu145                 150                 155                 160Asn Gly Ile Lys Gly Val Glu Lys Asn Lys Glu Asn Ala Lys Thr Pro
            165                 170                 175Pro Thr Thr His Gln Lys Pro Lys Thr His Ala Thr Thr Asn Ala His
        180                 185                 190Thr Asn Gln Lys Lys Asp Glu Lys
    195                 200(2)INFORMATION FOR SEQ ID NO:158:
(i)序列特征:
  (A)长度:159个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...159
(xi)序列描述:SEQ ID NO:158:Met Arg Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu Ile Ile Glu Thr1               5                   10                  15Leu Leu Val Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg Ile
        20                  25                  30Leu Ala Phe Leu Ile Asp Ser Leu Leu Val Ala Phe Leu Leu Ser Asp
    35                  40                  45Leu Leu Arg Ala Cys Ala Phe Leu His Ser Leu Tyr Trp Leu Thr Asn
50                  55                  60Pro Ile Tyr Tyr Ser Ala Phe Val Val Met Gly Phe Ile Ile Leu Tyr65                  70                  75                  80Gly Val Tyr Glu Ile Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala
            85                  90                  95Lys Leu Val Phe Arg Ile Lys Ile Ile Asp Ile Tyr Leu Ala Asp Cys
        100                 105                 110Pro Ser Arg Ala Ile Leu Leu Lys Arg Leu Gly Leu Lys Ile Val Val
    115                 120                 125Phe Leu Cys Pro Phe Leu Trp Phe Val Val Phe Lys Asn Pro Tyr His
130                 135                 140Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe145                 150                155(2)INFORMATION FOR SEQ ID NO:159:
(i)序列特征:
  (A)长度:234个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...234
(xi)序列描述:SEQ ID NO:159:Leu Asn Thr Asp Phe Ser His Ile Thr Asp Ile Glu Gly Met Arg Phe1               5                   10                  15Val Asn Glu Glu Asp Ala Leu Asn Lys Leu Ile Asn Glu Ile His Thr
        20                  25                  30Arg His Ile Asp Leu Lys Asp Ser Ile Met Leu Ala Leu Ser Phe Asn
    35                  40                  45Ala Leu Tyr Leu Ala Asn Ala Leu Ala Gln Lys Phe Gly Ala Thr Tyr
50                  55                  60Asp Ile Leu Phe Leu Glu Pro Ile Leu Ala Pro Leu Asn Ser Lys Cys65                  70                  75                  80Glu Ile Ala Leu Val Ser Glu Ser Met Asp Ile Val Met Asn Glu Ser
            85                  90                  95Leu Ile Asn Ser Phe Asp Ile Ala Leu Asp Tyr Val Tyr Gly Glu Ala
        100                 105                 110Lys Arg Ala Tyr Glu Glu Asp Ile Leu Ser His Ile Tyr Gln Tyr Arg
    115                 120                 125Lys Gly Asn Ala Ile Lys Ser Leu Lys Asp Lys Asn Ile Phe Ile Val
130                 135                 140Asp Arg Gly Ile Glu Thr Gly Phe Arg Ala Gly Leu Gly Val Gln Thr145                 150                 155                 160Cys Leu Lys Lys Glu Cys Gln Asp Ile Tyr Ile Leu Thr Pro Ile Leu
            165                 170                 175Ala Gln Asn Val Ala Gln Gly Leu Glu Ser Leu Cys Asp Gly Val Ile
        180                 185                 190Ser Val Tyr Arg Pro Glu Cys Phe Val Ser Val Glu His His Tyr Lys
    195                 200                 205Glu Leu Lys Arg Leu Ser Asn Glu Glu Ile Glu Lys Tyr Leu Gly Ala
210                 215                 220Asn Asn Ala Pro Asn Leu Lys Lys Glu His225                 230(2)INFORMATION FOR SEQ ID NO:160:
(i)序列特征:
  (A)长度:287个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...287
(xi)序列描述:SEQ ID NO:160:Leu Lys Gln Ser Glu Met Ala Met Glu Phe Asn Asp Pro Arg Met Arg1               5                   10                  15Phe Phe Ile Gly Asp Val Arg Asp Leu Glu Arg Leu Asn Tyr Ala Leu
        20                  25                  30Glu Gly Val Asp Ile Cys Ile His Ala Ala Ala Leu Lys His Val Pro
    35                  40                  45Ile Ala Glu Tyr Asn Pro Leu Glu Cys Ile Lys Thr Asn Ile Met Gly
50                  55                  60Ala Ser Asn Val Ile Asn Ala Cys Leu Lys Asn Glu Ile Ser Gln Val65                  70                  75                  80Ile Ala Leu Ser Thr Asp Lys Ala Ala Asn Pro Ile Asn Leu Tyr Gly
            85                  90                  95Ala Thr Lys Leu Cys Ser Asp Lys Leu Phe Val Ser Ala Asn Asn Phe
        100                 105                 110Lys Gly Pro Ser Gln Thr Gln Phe Gly Val Val Arg Tyr Gly Asn Val
    115                 120                 125Val Gly Ser Arg Gly Ser Val Val Pro Phe Phe Lys Lys Leu Val Gln
130                 135                 140Asn Lys Ala Ser Glu Ile Pro Ile Thr Asp Ile Arg Met Thr Arg Phe145                 150                 155                 160Trp Ile Thr Leu Asp Glu Gly Val Ser Phe Val Leu Lys Ser Leu Lys
            165                 170                 175Arg Met His Gly Gly Glu Ile Phe Val Pro Lys Ile Pro Ser Met Lys
        180                 185                 190Met Ile Asp Leu Ala Lys Ala Leu Ala Pro Asn Ile Pro Thr Lys Ile
    195                 200                 205Ile Gly Ile Arg Pro Gly Glu Lys Leu His Glu Val Met Ile Pro Lys
210                 215                 220Asp Glu Ser His Leu Ala Leu Glu Phe Glu Asp Phe Phe Ile Ile Gln225                 230                 235                 240Pro Thr Ile Ser Phe Gln Thr Pro Lys Asp Tyr Thr Leu Thr Lys Leu
            245                 250                 255His Glu Lys Gly Gln Lys Val Ala Pro Asp Phe Glu Tyr Ser Ser His
        260                 265                 270Thr Asn Asn Gln Trp Leu Glu Pro Asp Asp Leu Leu Lys Leu Leu
    275                 280                 285(2)INFORMATION FOR SEQ ID NO:161:
(i)序列特征:
  (A)长度:201个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...201
(xi)序列描述:SEQ ID NO:161:Met Arg Leu His Thr Ala Phe Phe Gly Ile Asn Ser Leu Leu Val Ala1               5                   10                  15Thr Leu Leu Ile Ser Gly Cys Ser Leu Phe Lys Lys Arg Asn Thr Asn
        20                  25                  30Ala Gln Leu Ile Pro Pro Ser Ala Asn Gly Leu Gln Ala Pro Ile Tyr
    35                  40                  45Pro Pro Thr Asn Phe Thr Pro Arg Lys Ser Ile Gln Pro Leu Pro Ser
50                  55                  60Pro Arg Leu Glu Asn Asn Asp Gln Pro Ile Ile Ser Ser Asn Pro Thr65                  70                  75                  80Asn Ala Ile Pro Asn Thr Pro Ile Leu Thr Pro Asn Asn Val Ile Glu
            85                  90                  95Leu Asn Ala Val Gly Met Gly Val Ala Pro Glu Ser Thr Ile Ser Pro
        100                 105                 110Ser Gln Ala Leu Ala Leu Ala Lys Arg Ala Ala Ile Val Asp Gly Tyr
    115                 120                 125Arg Gln Leu Gly Glu Lys Met Tyr Gly Ile Arg Val Asn Ala Gln Asp
130                 135                 140Thr Val Lys Asp Met Val Leu Gln Asn Ser Val Ile Lys Thr Arg Val145                 150                 155                 160Asn Ala Leu Ile Arg Asn Ala Glu Ile Thr Glu Thr Ile Tyr Lys Asp
            165                 170                 175Gly Leu Cys Gln Val Ser Met Glu Leu Lys Leu Asp Gly Arg Ile Trp
        180                 185                 190Tyr Arg Ile Leu Ser Gly Ser Arg Gly
    195                 200(2)INFORMATION FOR SEQ ID NO:162:
(i)序列特征:
  (A)长度:355个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...355
(xi)序列描述:SEQ ID NO:162:Met Ser Tyr Thr Ile Asn Lys Arg Phe Ser Val Gly Val Gly Leu Arg1               5                   10                  15Gly Leu Tyr Ala Thr Gly Ser Phe Asn Asn Thr Val Tyr Val Pro Leu
        20                  25                  30Glu Gly Ala Ser Val Leu Ser Ala Glu Gln Ile Leu Asn Leu Pro Asn
    35                  40                  45Asn Val Phe Ala Asp Gln Val Pro Ser Asn Met Met Thr Leu Leu Gly
50                  55                  60Asn Ile Gly Tyr Gln Pro Ala Leu Asn Cys Gln Lys Ala Gly Gly Asp65                  70                  75                  80Met Ser Asp Gln Ser Cys Gln Glu Phe Tyr Asn Gly Leu Lys Lys Ile
            85                  90                  95Met Gly Tyr Ser Gly Leu Ile Lys Ala Ser Ala Asn Leu Tyr Gly Thr
        100                 105                 110Thr Gln Val Val Gln Lys Ser Asn Gly Gln Gly Val Ser Gly Gly Tyr
    115                 120                 125Arg Val Gly Ser Ser Leu Arg Val Phe Asp His Gly Met Phe Ser Val
130                 135                 140Val Tyr Asn Ser Ser Val Thr Phe Asn Met Lys Gly Gly Leu Val Ala145                 150                 155                 160Ile Thr Glu Leu Gly Pro Ser Leu Gly Ser Val Leu Thr Lys Gly Ser
            165                 170                 175Leu Asn Ile Asn Val Ser Leu Pro Gln Thr Leu Ser Leu Ala Tyr Ala
        180                 185                 190His Gln Phe Phe Lys Asp Arg Leu Arg Val Glu Gly Val Phe Glu Arg
    195                 200                 205Thr Phe Trp Ser Gln Gly Asn Lys Phe Leu Val Thr Pro Asp Phe Ala
210                 215                 220Asn Ala Thr Tyr Lys Gly Leu Ser Gly Thr Val Ala Ser Leu Asp Ser225                 230                 235                 240Glu Thr Leu Lys Lys Met Val Gly Leu Ala Asn Phe Lys Ser Val Met
            245                 250                 255Asn Met Gly Ala Gly Trp Arg Asp Thr Asn Thr Phe Arg Leu Gly Val
        260                 265                 270Thr Tyr Met Gly Lys Ser Leu Arg Leu Met Gly Ala Ile Asp Tyr Asp
    275                 280                 285Gln Ala Pro Ser Pro Gln Asp Ala Ile Gly Ile Pro Asp Ser Asn Gly
290                 295                 300Tyr Thr Val Ala Phe Gly Thr Lys Tyr Asn Phe Arg Gly Phe Asp Leu305                 310                 315                 320Gly Val Ala Gly Ser Phe Thr Phe Lys Ser Asn Arg Ser Ser Leu Tyr
            325                 330                 335Gln Ser Pro Thr Ile Gly Gln Leu Arg Ile Phe Ser Ala Ser Leu Gly
        340                 345                 350Tyr Arg Trp
    355(2)INFORMATION FOR SEQ ID NO:163:
(i)序列特征:
  (A)长度:587个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...587
(xi)序列描述:SEQ ID NO:163:Met Lys Asn Phe Ser Pro Leu Tyr Cys Leu Lys Lys Leu Lys Lys Arg1               5                   10                  15His Leu Ile Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe
        20                  25                  30Lys Ile Gln Glu Gln Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr
    35                  40                  45Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn
50                  55                  60Met Gly Phe Thr Asn Asp Trp Gly Glu Asn Arg Ser Glu Phe Glu Met65                  70                  75                  80Thr Thr Thr Val Ile Asn Ile Pro Ala Phe Ser Phe Lys Val Pro Thr
            85                  90                  95Thr Asn Gln Gly Leu Tyr Ser Val Thr Ser Leu Glu Ile Asp Lys Ser
        100                 105                 110Gln Gln Asn Ile Leu Gly Ile Ile Asn Thr Ile Gly Leu Gly Asn Ile
    115                 120                 125Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gln Ala
130                 135                 140Ile Asn Arg Val Gln Gly Leu Met Asn Leu Thr Asn Gln Lys Val Val145                 150                 155                 160Thr Leu Ala Ser Lys Pro Asp Thr Gln Ile Val Asn Gly Trp Thr Gly
            165                 170                 175Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His
        180                 185                 190Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly
    195                 200                 205Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe Ile
210                 215                 220Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Ile Asn Lys Arg225                 230                 235                 240Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe
            245                 250                 255Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala
        260                 265                 270Glu Gln Ile Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gln Val Pro
    275                 280                 285Ser Asn Met Met Thr Leu Leu Gly Asn Ile Gly Tyr Gln Pro Ala Leu
290                 295                 300Asn Cys Gln Lys Ala Gly Gly Asp Met Ser Asp Gln Ser Cys Gln Glu305                 310                 315                 320Phe Tyr Asn Gly Leu Lys Lys Ile Met Gly Tyr Ser Gly Leu Ile Lys
            325                 330                 335Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gln Val Val Gln Lys Ser Asn
        340                 345                 350Gly Gln Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val
    355                 360                 365Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe
370                 375                 380Asn Met Lys Gly Gly Leu Val Ala Ile Thr Glu Leu Gly Pro Ser Leu385                 390                 395                 400Gly Ser Val Leu Thr Lys Gly Ser Leu Asn Ile Asn Val Ser Leu Pro
            405                 410                 415Gln Thr Leu Ser Leu Ala Tyr Ala His Gln Phe Phe Lys Asp Arg Leu
        420                 425                 430Arg Val Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gln Gly Asn Lys
    435                 440                 445Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser
450                 455                 460Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly465                 470                 475                 480Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp
            485                 490                 495Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg
        500                 505                 510Leu Met Gly Ala Ile Asp Tyr Asp Gln Ala Pro Ser Pro Gln Asp Ala
    515                 520                 525Ile Gly Ile Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys
530                 535                 540Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe545                 550                 555                 560Lys Ser Asn Arg Ser Ser Leu Tyr Gln Ser Pro Thr Ile Gly Gln Leu
            565                 570                 575Arg Ile Phe Ser Ala Ser Leu Gly Tyr Arg Trp
        580                 585(2)INFORMATION FOR SEQ ID NO:164:
(i)序列特征:
  (A)长度:205个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...205
(xi)序列描述:SEQ ID NO:164:Leu Ile Phe Arg Phe Phe Leu Ile Leu Ser Leu Leu Lys Gly Val Leu1               5                   10                  15Leu Ala Lys Lys Asp Trp Asn Phe Phe Lys Pro Leu Glu Pro Thr Lys
        20                  25                  30Lys Tyr Phe Gly Ser Phe Lys Ile Gly Tyr Leu Tyr Gln His Ala Glu
    35                  40                  45Thr Thr Lys Arg Phe Pro Ile Arg Pro Lys Asn Arg Pro Pro Ile Leu
50                  55                  60Met Asp Lys Ile Tyr His Asp Ala Ser Leu Gly Phe Asp Ala Gly Tyr65                  70                  75                  80Val Leu Lys Lys Lys Ala Leu Leu Gly Gly Tyr Leu Asp Ala Gly Met
            85                  90                  95Gly Asp Ser Tyr Phe Met Ser Ala Gly Leu Val Ala Gly Val Arg Leu
        100                 105                 110Phe Lys Gly Trp Val Ile Pro Lys Ile Ala Leu Gly Tyr Gln Leu Gln
    115                 120                 125Ile Leu Gly Ala Lys Ile Asp Lys Tyr Gln Phe Asn Ile Gln Ser Ala
130                 135                 140Val Gly Ser Val Gly Leu Phe Phe Asn Ala Ala Lys Asn Phe Gly Leu145                 150                 155                 160Ser Ile Glu Ala Arg Gly Gly Ile Pro Phe Tyr Phe Ile Gln Ser Arg
            165                 170                 175Phe Ser Lys Ala Phe Gly Thr Pro Arg Leu Asn Ile Tyr Ser Val Gly
        180                 185                 190Ile Thr Phe Thr Phe Tyr Asp Phe Thr Arg Phe Leu Gly
    195                 200                 205(2)INFORMATION FOR SEQ ID NO:165:
(i)序列特征:
  (A)长度:253个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...253
(xi)序列描述:SEQ ID NO:165:Leu Trp His Ala Ala Phe Ser Val Gly Glu Trp Gly Trp Asn Gly Asp1               5                   10                  15Glu Ile Pro Tyr Arg Asp Cys Asp Glu Trp Gly Leu Asp Asp Phe Tyr
        20                  25                  30Gly Val Lys Pro Thr Asp Cys Ala Gly Val Leu Ser Phe Ala Arg Ser
    35                  40                  45His Arg Arg Gln Asn Gln Ala Val Leu Ser Lys Pro Lys Ser Phe Arg
50                  55                  60Met Lys Lys Ile Ala Phe Ile Leu Ala Leu Trp Val Gly Leu Leu Gly65                  70                  75                  80Ala Phe Glu Pro Lys Lys Ser His Ile Tyr Phe Gly Ala Met Val Gly
            85                  90                  95Leu Ala Pro Val Lys Ile Thr Pro Lys Pro Ala Ser Asp Ser Ser Tyr
        100                 105                 110Thr Ala Phe Leu Trp Gly Ala Lys Gly Gly Tyr Gln Phe Ala Phe Phe
    115                 120                 125Lys Ala Leu Ala Leu Arg Gly Glu Phe Ser Tyr Leu Met Ala Ile Lys
130                 135                 140Pro Thr Ala Leu His Thr Ile Asn Thr Ser Leu Leu Ser Leu Asn Met145                 150                 155                 160Asp Val Leu Ser Asp Phe Tyr Thr Tyr Lys Lys Tyr Ser Phe Gly Val
           165                  170                 175Tyr Gly Gly Leu Gly Ile Gly Tyr Phe Tyr Gln Ser Asn His Leu Gly
        180                 185                 190Met Lys Asn Ser Ser Phe Met Gly Tyr Asn Gly Leu Phe Asn Val Gly
    195                 200                 205Leu Gly Ser Thr Ile Asp Arg His His Arg Val Glu Leu Gly Ala Lys
210                 215                 220Ile Pro Phe Ser Lys Thr Arg Asn Ser Phe Lys Asn Ser Tyr Phe Leu225                 230                 235                 240Glu Ser Val Phe Ile His Ala Ala Tyr Ser Tyr Met Phe
            245                 250(2)INFORMATION FOR SEQ ID NO:166:
(i)序列特征:
  (A)长度:412个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...412
(xi)序列描述:SEQ ID NO:166:Met Glu Ser Val Lys Thr Val Lys Thr Asn Lys Val Gly Lys Asn Thr1               5                   10                  15Glu Thr Ala Asn Thr Glu Ala Ser Lys Glu Thr His Phe Lys Gln Ala
        20                  25                  30Ser Ala Ile Thr Asn Thr Leu Arg Ser Ile Gly Gly Ile Phe Thr Lys
    35                  40                  45Ile Ala Lys Lys Val Arg Glu Leu Val Lys Lys His Pro Lys Lys Ser
50                  55                  60Ser Val Ala Leu Val Val Leu Thr His Ile Ala Cys Lys Arg Ala Lys65                  70                  75                  80Glu Leu Asp Asp Lys Val Gln Asp Lys Ser Lys Gln Ala Glu Lys Glu
            85                  90                  95Asn Gln Ile Asn Trp Trp Lys Tyr Ser Gly Leu Thr Ile Ala Ala Ser
        100                 105                 110Leu Leu Leu Ala Ala Cys Ser Thr Gly Asp Ile Asp Lys Gln Ile Glu
    115                 120                 125Leu Glu Gln Glu Lys Lys Glu Ala Asn Lys Ser Gly Ile Lys Leu Glu
130                 135                 140Gln Glu Arg Gln Lys Thr Glu Gln Glu Arg Gln Lys Thr Asn Lys Ser145                 150                 155                 160Glu Ile Glu Leu Glu Gln Glu Arg Gln Lys Thr Asn Lys Ser Gly Ile
            165                 170                 175Glu Leu Ala Asn Ser Gln Ile Lys Ala Glu Gln Glu Arg Gln Lys Thr
        180                 185                 190Glu Gln Glu Lys Gln Lys Ala Asn Lys Ser Glu Ile Glu Leu Glu Gln
    195                 200                 205Gln Lys Gln Lys Thr Ile Asn Thr Gln Arg Asp Leu Ile Lys Glu Gln
210                 215                 220Lys Asp Phe Ile Lys Glu Thr Glu Gln Asn Cys Gln Glu Lys His Gly225                 230                 235                 240Gln Leu Phe Ile Lys Lys Ala Arg Ile Lys Thr Gly Ile Thr Thr Gly
            245                 250                 255Ile Ala Ile Glu Ile Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys
        260                 265                 270Thr Asn Gln Thr Pro Ile Gln Pro Lys His Leu Pro Asn Ser Lys Gln
    275                 280                 285Pro Arg Ser Gln Arg Gly Ser Lys Ala Gln Glu Leu Ile Ala Tyr Leu
290                 295                 300Gln Lys Glu Leu Glu Ser Leu Pro Tyr Ser Gln Lys Ala Ile Ala Lys305                 310                 315                 320Gln Val Asp Phe Tyr Lys Pro Ser Ser Ile Ala Tyr Leu Glu Leu Asp
            325                 330                 335Pro Arg Asp Phe Lys Val Thr Glu Glu Trp Gln Lys Glu Asn Leu Lys
        340                 345                 350Ile Arg Ser Lys Ala Gln Ala Lys Met Leu Glu Met Arg Asn Pro Gln
    355                 360                 365Ala His Leu Pro Thr Ser Gln Ser Leu Leu Phe Val Gln Lys Ile Phe
370                 375                 380Ala Asp Ile Asn Lys Glu Ile Glu Ala Val Ala Asn Thr Glu Lys Lys385                 390                 395                 400Thr Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met
            405                  410(2)INFORMATION FOR SEQ ID NO:167:
(i)序列特征:
  (A)长度:149个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...149
(xi)序列描述:SEQ ID NO:167:Leu Asn Trp Glu His Leu Met Lys Lys Leu Ala Phe Ser Leu Leu Phe1               5                   10                  15Thr Gly Thr Phe Leu Gly Leu Phe Leu Asn Ala Ser Asp Phe Lys Ser
        20                  25                  30Met Asp Asn Lys Gln Leu Leu Glu Gln Ala Gly Lys Val Ala Pro Ser
    35                  40                  45Glu Val Pro Glu Phe Arg Thr Glu Val Asn Lys Arg Leu Glu Ala Met
50                  55                  60Lys Glu Glu Glu Arg Gln Lys Tyr Lys Ala Asp Phe Lys Lys Ala Met65                  70                  75                  80Asp Lys Asn Leu Ala Ser Leu Ser Gln Glu Asp Arg Asn Lys Arg Lys
            85                  90                  95Lys Glu Ile Leu Glu Val Ile Ala Asn Lys Lys Lys Thr Met Thr Met
        100                 105                 110Lys Glu Tyr Arg Glu Glu Gly Leu Asp Leu His Asp Cys Ala Cys Glu
    115                 120                 125Gly Pro Phe His Asp His Glu Lys Lys Gly Gln Lys Gly Lys Lys Pro
130                 135                 140Ser His His Lys His145(2)INFORMATION FOR SEQ ID NO:168:
(i)序列特征:
  (A)长度:204个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...204
(xi)序列描述:SEQ ID NO:168:Met Gln Ala Val Ile Leu Ala Asn Gly Glu Phe Pro Lys Ser Lys Lys1               5                   10                  15Cys Leu Asp Ile Leu Gln Asn Ala Pro Phe Leu Ile Ala Cys Asp Gly
        20                  25                  30Ala Val Ile Ser Leu His Ala Leu Gln Phe Lys Pro Ser Val Val Ile
    35                  40                  45Gly Asp Leu Asp Ser Ile Asp Ser His Leu Lys Ala Leu Tyr Asn Pro
50                  55                  60Ile Arg Val Ser Glu Gln Asp Ser Asn Asp Leu Ser Lys Ala Phe Phe65                  70                  75                  80Tyr Ala Leu Asn Arg Gly Cys Asp Asp Phe Ile Phe Leu Gly Leu Asn
            85                  90                  95Gly Lys Arg Glu Asp His Ala Leu Ala Asn Thr Phe Leu Leu Leu Glu
        100                 105                 110Tyr Phe Lys Phe Cys Lys Lys Ile Gln Ser Val Ser Asp Tyr Gly Leu
    115                 120                 125Phe Arg Val Leu Glu Thr Pro Phe Thr Leu Pro Ser Phe Lys Gly Glu
130                 135                 140Gln Ile Ser Leu Phe Ser Leu Asp Leu Lys Ala Arg Phe Thr Ser Lys145                 150                 155                 160Asn Leu Lys Tyr Pro Leu Lys Asp Leu Arg Leu Lys Thr Leu Phe Ser
            165                 170                 175Gly Ser Leu Asn Glu Ala Thr Asn His Cys Phe Ser Leu Ser Ser Glu
        180                 185                 190Pro Lys Ser Val Val Leu Val Tyr Gln Lys Phe Ser
    195                 200(2)INFORMATION FOR SEQ ID NO:169:
(i)序列特征:
  (A)长度:280个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...280
(xi)序列描述:SEQ ID NO:169:Val Phe Asp Ser Leu Gly Gly Phe Leu Gly Tyr Lys Thr Phe Lys Pro1               5                   10                  15Ile Val Asp Lys Val Lys Asn Ile Asn Ala Trp Ile Lys Asn Tyr Asp
        20                  25                  30Asn Lys Lys Ala Gln Glu Ile Met Gly Phe Ile Glu Asn Pro Thr Pro
    35                  40                  45Asp Phe Gln Asn Asn Lys Phe Leu Cys Val Leu Asn Arg Gln Gly Thr
50                  55                  60Arg His Asn Asn Tyr Leu Gly Leu Thr Ser Thr Asn Leu Leu Ile Gly65                  70                  75                  80Ala Ile Tyr Phe Ser Ile Arg His Cys Ile Lys Ala Thr Trp Gln Asn
            85                  90                  95Asp Arg Asp Gln Phe Tyr Ala Pro Tyr Asp Asp Ala Phe Gln Asp Asp
        100                 105                 110Ser Glu Phe Lys Asn Asn Cys Leu Ala Phe Met Leu Phe His Thr Gln
    115                 120                 125Asn Arg Ile Thr Ala Thr Gln Gly Thr Asn His Phe Ile Pro Phe Ser
130                 135                 140Glu Asp Glu Val Asp Ser Lys Glu Arg Tyr Leu Ser His Ala Leu Leu145                 150                 155                 160Asp Phe Leu Lys Gly Glu Ile Lys Glu Pro Lys Lys Ser Asp Ser Leu
            165                 170                 175Phe Leu Asn Ala Lys Lys Glu Asn Lys Pro Leu Lys Phe Ser Ser Ser
        180                 185                 190Ala Ser Lys Val Phe Asp Ala Gly Arg Glu Ile Tyr Arg Tyr Tyr His
    195                 200                 205Thr Gln Asp Phe Ile His Thr Pro Tyr Asn Ala Asn Ala Ser Leu Tyr
210                 215                 220Asp Ile Lys Glu Phe Phe Gln Gly Arg Asn Lys Gln Gly Arg Leu Asn225                 230                 235                 240Ser Pro Thr Lys Ala Lys Asp Glu Tyr Tyr Lys Gln Leu Tyr Ala Asn
            245                 250                 255Leu Gln Tyr Ala Leu Lys Asp Leu Ala Lys Glu Ile Gln Pro Lys Val
        260                 265                 270Tyr Glu Tyr Gly Phe Leu Arg Glu
    275                 280(2)INFORMATION FOR SEQ ID NO:170:
(i)序列特征:
  (A)长度:309个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...309
(xi)序列描述:SEQ ID NO:170:Cys Asp Arg Ala Ile Pro His Trp Leu Phe Ser Leu Gly Tyr Arg Tyr1               5                   10                  15Pro Pro Pro Leu Lys Pro Thr Asn Ala Phe Asn Leu Glu Val Phe Asp
        20                  25                  30Ser Leu Gly Gly Phe Leu Gly Tyr Lys Thr Phe Lys Pro Ile Val Asp
    35                  40                  45Lys Val Lys Asn Ile Asn Ala Trp Ile Lys Asn Tyr Asp Asn Lys Lys
50                  55                  60Ala Gln Glu Ile Met Gly Phe Ile Glu Asn Pro Thr Pro Asp Phe Gln65                  70                  75                  80Asn Asn Lys Phe Leu Cys Val Leu Asn Arg Gln Gly Thr Arg His Asn
            85                  90                  95Asn Tyr Leu Gly Leu Thr Ser Thr Asn Leu Leu Ile Gly Ala Ile Tyr
        100                 105                 110Phe Ser Ile Arg His Cys Ile Lys Ala Thr Trp Gln Asn Asp Arg Asp
    115                 120                 125Gln Phe Tyr Ala Pro Tyr Asp Asp Ala Phe Gln Asp Asp Ser Glu Phe
130                 135                 140Lys Asn Asn Cys Leu Ala Phe Met Leu Phe His Thr Gln Asn Arg Ile145                 150                 155                 160Thr Ala Thr Gln Gly Thr Asn His Phe Ile Pro Phe Ser Glu Asp Glu
            165                 170                 175Val Asp Ser Lys Glu Arg Tyr Leu Ser His Ala Leu Leu Asp Phe Leu
        180                 185                 190Lys Gly Glu Ile Lys Glu Pro Lys Lys Ser Asp Ser Leu Phe Leu Asn
    195                 200                 205Ala Lys Lys Glu Asn Lys Pro Leu Lys Phe Ser Ser Ser Ala Ser Lys
210                 215                 220Val Phe Asp Ala Gly Arg Glu Ile Tyr Arg Tyr Tyr His Thr Gln Asp225                 230                 235                 240Phe Ile His Thr Pro Tyr Asn Ala Asn Ala Ser Leu Tyr Asp Ile Lys
            245                 250                 255Glu Phe Phe Gln Gly Arg Asn Lys Gln Gly Arg Leu Asn Ser Pro Thr
        260                 265                 270Lys Ala Lys Asp Glu Tyr Tyr Lys Gln Leu Tyr Ala Asn Leu Gln Tyr
    275                 280                 285Ala Leu Lys Asp Leu Ala Lys Glu Ile Gln Pro Lys Val Tyr Glu Tyr
290                 295                 300Gly Phe Leu Arg Glu305(2)INFORMATION FOR SEQ ID NO:171:
(i)序列特征:
  (A)长度:187个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...187
(xi)序列描述:SEQ ID NO:171:Leu Glu Thr Tyr Ile Ile Asp Ala Asp Asn Ile Asp Gly Asp Leu Phe1               5                   10                  15Phe Tyr Asn Leu Thr Arg Asn Ser Asn Asp Phe Ser Met Leu Pro Val
        20                  25                  30Phe Glu Leu Asp Arg Ile Ala Gln Lys Ile Arg Asn Ile Leu Lys Lys
    35                  40                  45His Gly Ser Arg Lys Asp Ile Ile Leu Lys His Asn Glu Ile Lys Glu
50                  55                  60Ala Phe Phe Ser Pro Phe Lys Pro Gln Leu Lys Thr Val Gln Val Phe65                  70                  75                  80Leu Ser His Ser His Ala Asp Lys Asn Lys Ala Leu Gly Val Lys Asp
            85                  90                  95Tyr Leu Glu Ser Lys Thr Lys Arg Lys Val Phe Ile Asp Ser Leu Phe
        100                 105                 110Trp Asp Tyr Lys Asp Asp Val Leu Asn Lys Leu Ala Lys His Asp Asp
    115                 120                 125Ile Ser Lys Ile Glu Asp Ala Phe Thr Leu Ile Leu Arg Lys Ser Leu
130                 135                 140Gln Asp Met Ile Glu Lys Cys Pro Tyr Phe Val Phe Leu Gln Ser Lys145                 150                 155                 160Asn Ser Val Ser Asn Gln Gly Leu Ser Arg Ile Thr Tyr Ser Ala Trp
            165                 170                 175Ile Tyr Glu Glu Leu Lys Ile Ala Ser Phe Tyr
        180                 185(2)INFORMATION FOR SEQ ID NO:172:
(i)序列特征:
  (A)长度:198个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...198
(xi)序列描述:SEQ ID NO:172:Leu Glu Thr Tyr Ile Ile Asp Ala Asp Asn Ile Asp Gly Asp Leu Phe1               5                   10                  15Phe Tyr Asn Leu Thr Arg Asn Ser Asn Asp Phe Ser Met Leu Pro Val
        20                  25                  30Phe Glu Leu Asp Arg Ile Ala Gln Lys Ile Arg Asn Ile Leu Lys Lys
    35                  40                  45His Gly Ser Arg Lys Asp Ile Ile Leu Lys His Asn Glu Ile Lys Glu
50                  55                  60Ala Phe Phe Ser Pro Phe Lys Pro Gln Leu Lys Thr Val Gln Val Phe65                  70                  75                  80Leu Ser His Ser His Ala Asp Lys Asn Lys Ala Leu Gly Val Lys Asp
            85                  90                  95Tyr Leu Glu Ser Lys Thr Lys Arg Lys Val Phe Ile Asp Ser Leu Phe
        100                 105                 110Trp Asp Tyr Lys Asp Asp Val Leu Asn Lys Leu Ala Lys His Asp Asp
    115                 120                 125Ile Ser Lys Ile Glu Asp Ala Phe Thr Leu Ile Leu Arg Lys Ser Leu
130                 135                 140Gln Asp Met Ile Glu Lys Cys Pro Tyr Phe Val Phe Leu Gln Ser Lys145                 150                 155                 160Asn Ser Val Ser Asn Gln Gly Leu Ser Arg Ile Thr Tyr Ser Ala Trp
            165                 170                 175Ile Tyr Glu Glu Leu Lys Ile Ala Ser Phe Leu Leu Ala Leu Leu Thr
        180                  185                 190Arg Val Ala Gln Phe Gln
    195(2)INFORMATION FOR SEQ ID NO:173:
(i)序列特征:
  (A)长度:189个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...189
(xi)序列描述:SEQ ID NO:173:Met Met Thr Lys Asn Ala Tyr Ala Phe Val Val Ile Glu Lys Ser Ile1               5                   10                  15Met Val Phe Lys Cys Ala Lys Asp Lys Gly Leu Ile Pro Ile Thr Glu
        20                  25                  30Gly Phe Val Pro Leu Lys Glu Gly Phe Leu Arg Ser Phe Lys Glu Arg
    35                  40                  45Cys Asn Leu Asp Phe Leu Glu Asn Leu Asp Leu Leu Phe Leu Tyr Asp
50                  55                  60Tyr Gln Phe Pro Ser Glu Val Phe Ser Leu Cys Lys Asp Leu Lys Asn65                  70                  75                  80Ser Ile Trp Asp Arg Lys Leu Val Val Val Leu Val Glu Ala Leu Glu
            85                  90                  95Gly Phe Lys Gly Leu Asn Leu Ser Leu Lys Ile Glu Asp Arg His Ser
        100                 105                 110Asn Ser Leu Gly Asn Gly Val Gln Lys Leu Leu Thr Asn Ala Asp Leu
    115                 120                 125Gly Ser Asn His Lys Pro Ile Val Ile Asp Ser Met Lys Thr Tyr His
130                 135                 140Gln Ser Gln Gln Glu Lys Tyr Lys Arg Glu Arg Gly Glu Thr Leu Glu145                 150                 155                 160Val Arg Pro Thr Thr Pro Pro Ser Tyr Gly Gly Gly Ser Ile Arg Ile
            165                 170                 175Ser Gly Asp Lys Lys Pro Asp Ser Asn Glu Glu Asn Phe
        180                 185(2)INFORMATION FOR SEQ ID NO:174:
(i)序列特征:
  (A)长度:590个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...590
(xi)序列描述:SEQ ID NO:174:Met Lys Ala Ile Lys Ile Leu Leu Ile Met Thr Leu Ser Leu Asn Ala1               5                   10                  15Ile Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gln Leu Lys
        20                  25                  30Gly Glu Leu Thr Pro Lys Ile Val Asp Phe Gly Gly Tyr Lys Ser Asn
    35                  40                  45Thr Thr Glu Trp Gly Ala Thr Ala Leu Asn Tyr Ile Asn Ala Ala Asn
50                  55                  60Gly Asp Ala Lys Lys Phe Ser Ala Leu Val Glu Lys Met Arg Phe Asn65                  70                  75                  80Ser Gly Ile Leu Gly Asn Phe Arg Ala His Ala His Leu Arg Gln Ala
            85                  90                  95Leu Lys Leu Gln Lys Asn Leu Lys Tyr Cys Leu Lys Ile Ile Ala Arg
        100                 105                 110Asp Ser Phe Tyr Ser Tyr Arg Thr Gly Ile Tyr Ile Pro Leu Gly Ile
    115                 120                 125Ser Leu Lys Asp Gln Lys Thr Ala Gln Lys Met Leu Ala Asp Leu Ser
130                 135                 140Val Val Gly Ala Tyr Leu Lys Lys Gln Gln Glu Asn Glu Lys Ala Gln145                 150                 155                 160Ser Pro Tyr Tyr Arg Ser Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro
            165                 170                 175Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr
        180                 185                 190Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly
    195                 200                 205Phe Tyr Pro Asn Met Phe Phe Met Met Gln Val Gln Asp Tyr Leu Met
210                 215                 220Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gln Glu Glu Ile Leu Asp His225                 230                 235                 240Asp Ala Ser Ile Asn Gln Leu Asp Thr Pro Thr Asp Asp Asp Arg Asp
            245                 250                 255Asp Lys Asp Asp Lys Ser Ser Gln Pro Ala Asn Leu Met Ser Phe Tyr
        260                 265                 270Arg Asp Pro Lys Phe Ser Lys Asp Ile Gln Thr Asn Arg Leu Asn Ser
    275                 280                 285Ala Leu Val Asn Leu Asp Asn Ser His Met Leu Lys Asp Asn Ser Leu
290                 295                 300Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala Ile Thr Ser305                 310                 315                 320Gln Ala Lys Glu Leu Asn His Leu Val Gly Gln Ile Lys Glu Met Lys
            325                 330                 335Gln Asp Gly Ala Ser Pro Asn Lys Ile Asp Ser Val Val Asn Lys Ala
        340                 345                 350Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gln Leu Asp Asn
    355                 360                 365Asp Leu Lys Asp Gln Lys Gly Leu Ser Ser Glu Gln Gln Ala Gln Val
370                 375                 380Asp Lys Ala Leu Asp Ser Val Gln Gln Leu Ser His Ser Ser Asp Val385                 390                 395                 400Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys Ile Asp Gly Asp Asp Arg
            405                 410                 415Asp Asp Leu Asn Asp Ala Ile Asn Asn Pro Met Gln Gln Pro Ala Gln
        420                 425                 430Gln Thr Pro Ile Asn Asn Met Asp Asn Thr His Ala Asn Asp Ser Lys
    435                 440                 445Asp Gln Gly Gly Asn Ala Leu Ile Asn Pro Asn Asn Ala Thr Asn Asp
450                 455                 460Asp His Asn Asp Asp His Met Asp Thr Asn Thr Thr Asp Thr Ser Asn465                 470                 475                 480Ala Asn Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly Asn Asn Thr
            485                 490                 495Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp Thr Gly Asn Thr
        500                 505                 510Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn Asn Gly Asn Asp
    515                 520                 525Asp Thr Gly Asn Thr Asn Asp Asp Met Gly Asn Ser Asn Asp Met Gly
530                 535                 540Asp Asp Met Asn Asn Ala Asn Asp Met Asn Asp Asp Met Gly Asn Ser545                 550                 555                 560Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp Asp Met Gly Gly
            565                 570                 575Asp Met Gly Asp Met Gly Asp Met Gly Gly Asp Met Gly Asn
        580                 585                 590(2)INFORMATION FOR SEQ ID NO:175:
(i)序列特征:
  (A)长度:195个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...195
(xi)序列描述:SEQ ID NO:175:Leu Asn Leu Arg Leu Ala Gly Ala Ser Val Leu Thr Ala Cys Val Phe1               5                   10                  15Ser Gly Cys Phe Phe Leu Lys Met Phe Asp Lys Lys Leu Ser Ser Asn
        20                  25                  30Asp Trp His Ile Gln Lys Val Glu Met Asn His Gln Val Tyr Asp Ile
    35                  40                  45Glu Thr Met Leu Ala Asp Ser Ala Phe Arg Glu His Glu Glu Glu Gln
50                  55                  60Asp Ser Ser Leu Asn Thr Ala Leu Pro Glu Asp Lys Thr Ala Ile Glu65                  70                  75                  80Ala Lys Glu Gln Glu Gln Lys Glu Lys Arg Lys His Trp Tyr Glu Leu
            85                  90                  95Phe Lys Lys Lys Pro Lys Pro Lys Ser Ser Met Gly Glu Phe Val Phe
        100                 105                 110Asp Gln Lys Glu Asn Arg Ile Tyr Gly Lys Gly Tyr Cys Asn Arg Tyr
    115                 120                 125Phe Ala Ser Tyr Thr Trp Gln Gly Asp Arg His Ile Ala Ile Glu Asp
130                 135                 140Ser Gly Ile Ser Arg Lys Val Cys Arg Asp Glu His Leu Met Ala Phe145                 150                 155                 160Glu Leu Glu Phe Met Glu Asn Phe Lys Gly Asn Phe Ala Val Thr Lys
            165                 170                 175Gly Lys Asp Thr Leu Ile Leu Asp Asn Gln Lys Met Lys Ile Tyr Leu
        180                 185                 190Lys Thr Pro
    195(2)INFORMATION FOR SEQ ID NO:176:
(i)序列特征:
  (A)长度:744个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...744
(xi)序列描述:SEQ ID NO:176:Met Leu Lys Leu Ala Ser Lys Thr Ile Cys Leu Ser Leu Ile Ser Ser1               5                   10                  15Phe Thr Ala Val Glu Ala Phe Gln Lys His Gln Lys Asp Gly Phe Phe
        20                  25                  30Ile Glu Ala Gly Phe Glu Thr Gly Leu Leu Gln Gly Thr Gln Thr Gln
    35                  40                  45Glu Gln Thr Ile Ala Thr Thr Gln Glu Lys Pro Lys Pro Lys Pro Lys
50                  55                  60Pro Lys Pro Ile Thr Pro Gln Ser Thr Tyr Gly Lys Tyr Tyr Ile Ser65                  70                  75                  80Gln Ser Thr Ile Leu Lys Asn Ala Thr Glu Leu Phe Ala Glu Asp Asn
            85                  90                  95Ile Thr Asn Leu Thr Phe Tyr Ser Gln Asn Pro Val Tyr Val Thr Ala
        100                 105                 110Tyr Asn Gln Glu Ser Ala Glu Glu Ala Gly Tyr Gly Asn Asn Ser Leu
    115                 120                 125Ile Met Ile Gln Asn Phe Leu Pro Tyr Asn Leu Asn Asn Ile Glu Leu
130                 135                 140Ser Tyr Thr Asp Asp Gln Gly Asn Val Val Ser Leu Gly Val Ile Glu145                 150                 155                 160Thr Ile Pro Lys Gln Ser Gln Ile Ile Leu Pro Ala Ser Leu Phe Asn
            165                 170                 175Asp Pro Gln Leu Asn Ala Asp Gly Phe Gln Gln Leu Gln Thr Asn Thr
        180                 185                 190Thr Arg Phe Ser Asp Ala Ser Thr Gln Asn Leu Phe Asn Lys Leu Ser
    195                 200                 205Lys Val Thr Thr Asn Leu Gln Met Thr Tyr Ile Asn Tyr Asn Gln Phe
210                 215                 220Ser Ser Gly Asn Gly Ser Gly Ser Lys Pro Pro Cys Pro Pro Tyr Glu225                 230                 235                 240Asn Gln Ala Asn Cys Val Ala Lys Val Pro Pro Phe Thr Ser Gln Asp
            245                 250                 255Ala Lys Asn Leu Thr Asn Leu Met Leu Asn Met Met Ala Val Phe Asp
        260                 265                 270Ser Lys Ser Trp Glu Asp Ala Val Leu Asn Ala Pro Phe Gln Phe Ser
    275                 280                 285Asp Asn Asn Leu Ser Ala Pro Cys Tyr Ser Asp Tyr Leu Thr Cys Val
290                 295                 300Asn Pro Tyr Asn Asp Gly Leu Val Asp Pro Lys Leu Ile Ala Lys Asn305                 310                 315                 320Lys Gly Asp Glu Tyr Asn Ile Glu Asn Gly Gln Thr Gly Ser Val Ile
            325                 330                 335Leu Thr Pro Gln Asp Val Ile Tyr Ser Tyr Arg Val Ala Asn Asn Ile
        340                 345                 350Tyr Val Asn Leu Leu Pro Thr Arg Gly Gly Asp Leu Gly Leu Gly Ser
    355                 360                 365Gln Tyr Gly Gly Pro Asn Gly Pro Gly Asp Asp Gly Thr Asn Phe Gly
370                 375                 380Ala Leu Gly Ile Leu Ser Pro Phe Leu Asp Pro Glu Ile Leu Phe Gly385                 390                 395                 400Lys Glu Leu Asn Lys Val Ala Ile Met Gln Leu Arg Asp Ile Ile His
            405                 410                 415Glu Tyr Gly His Thr Leu Gly Tyr Thr His Asn Gly Asn Met Thr Tyr
        420                 425                 430Gln Arg Val Arg Met Cys Glu Glu Asn Asn Gly Pro Glu Glu Arg Cys
    435                 440                 445Gln Gly Gly Arg Ile Glu Gln Val Asp Gly Lys Glu Val Gln Val Phe
450                 455                 460Asp Asn Gly His Glu Val Arg Asp Thr Asp Gly Ser Thr Tyr Asp Val465                 470                 475                 480Cys Ser Arg Phe Lys Asp Lys Pro Tyr Thr Ala Gly Ser Tyr Pro Asn
            485                 490                 495Ser Ile Tyr Thr Asp Cys Ser Gln Val Pro Ala Gly Leu Ile Gly Val
        500                 505                 510Thr Ser Ala Val Trp Gln Gln Leu Ile Asp Gln Asn Ala Leu Pro Val
    515                 520                 525Asp Phe Thr Asn Leu Ser Ser Gln Thr Asn Tyr Leu Asn Ala Ser Leu
530                 535                 540Asn Thr Gln Asp Phe Ala Thr Thr Met Leu Ser Ala Ile Ser Gln Ser545                 550                 555                 560Leu Ser Ser Ser Lys Ser Ser Ala Thr Thr Tyr Arg Thr Ser Lys Thr
            565                 570                 575Ser Arg Pro Phe Gly Ala Pro Leu Leu Gly Val Asn Leu Lys Met Gly
        580                 585                 590Tyr Gln Lys Tyr Phe Asn Asp Tyr Leu Gly Leu Ser Ser Tyr Gly Ile
    595                 600                 605Ile Lys Tyr Asn Tyr Ala Gln Ala Asn Asn Glu Lys Ile Gln Gln Leu
610                 615                 620Ser Tyr Gly Val Gly Met Asp Val Leu Phe Asp Phe Ile Thr Asn Tyr625                 630                 635                 640Thr Asn Glu Lys Asn Pro Lys Ser Asn Leu Thr Lys Lys Val Phe Thr
            645                 650                 655Ser Ser Leu Gly Val Phe Gly Gly Leu Arg Gly Leu Tyr Asn Ser Tyr
        660                 665                 670Tyr Leu Leu Asn Gln Tyr Lys Gly Ser Gly Asn Leu Asn Val Thr Gly
    675                 680                 685Gly Leu Asn Tyr Arg Tyr Lys His Ser Lys Tyr Ser Ile Gly Ile Ser
690                 695                 700Val Pro Leu Val Gln Leu Lys Ser Arg Ile Val Ser Ser Asp Gly Ala705                 710                 715                 720Tyr Thr Asn Ser Ile Thr Leu Asn Glu Gly Gly Ser His Phe Lys Val
            725                 730                 735Phe Phe Asn Tyr Gly Trp Ile Phe
        740(2)INFORMATION FOR SEQ ID NO:177:
(i)序列特征:
  (A)长度:529个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...529
(xi)序列描述:SEQ ID NO:177:Met Thr Tyr Ile Asn Tyr Asn Gln Phe Ser Ser Gly Asn Gly Ser Gly1               5                   10                  15Ser Lys Pro Pro Cys Pro Pro Tyr Glu Asn Gln Ala Asn Cys Val Ala
        20                  25                  30Lys Val Pro Pro Phe Thr Ser Gln Asp Ala Lys Asn Leu Thr Asn Leu
    35                  40                  45Met Leu Asn Met Met Ala Val Phe Asp Ser Lys Ser Trp Glu Asp Ala
50                  55                  60Val Leu Asn Ala Pro Phe Gln Phe Ser Asp Asn Asn Leu Ser Ala Pro65                  70                  75                  80Cys Tyr Ser Asp Tyr Leu Thr Cys Val Asn Pro Tyr Asn Asp Gly Leu
            85                  90                  95Val Asp Pro Lys Leu Ile Ala Lys Asn Lys Gly Asp Glu Tyr Asn Ile
        100                 105                 110Glu Asn Gly Gln Thr Gly Ser Val Ile Leu Thr Pro Gln Asp Val Ile
    115                 120                 125Tyr Ser Tyr Arg Val Ala Asn Asn Ile Tyr Val Asn Leu Leu Pro Thr
130                 135                 140Arg Gly Gly Asp Leu Gly Leu Gly Ser Gln Tyr Gly Gly Pro Asn Gly145                 150                 155                 160Pro Gly Asp Asp Gly Thr Asn Phe Gly Ala Leu Gly Ile Leu Ser Pro
            165                 170                 175Phe Leu Asp Pro Glu Ile Leu Phe Gly Lys Glu Leu Asn Lys Val Ala
        180                 185                 190Ile Met Gln Leu Arg Asp Ile Ile His Glu Tyr Gly His Thr Leu Gly
    195                 200                 205Tyr Thr His Asn Gly Asn Met Thr Tyr Gln Arg Val Arg Met Cys Glu
210                 215                 220Glu Asn Asn Gly Pro Glu Glu Arg Cys Gln Gly Gly Arg Ile Glu Gln225                 230                 235                 240Val Asp Gly Lys Glu Val Gln Val Phe Asp Asn Gly His Glu Val Arg
            245                 250                 255Asp Thr Asp Gly Ser Thr Tyr Asp Val Cys Ser Arg Phe Lys Asp Lys
        260                 265                 270Pro Tyr Thr Ala Gly Ser Tyr Pro Asn Ser Ile Tyr Thr Asp Cys Ser
    275                 280                 285Gln Val Pro Ala Gly Leu Ile Gly Val Thr Ser Ala Val Trp Gln Gln
290                 295                 300Leu Ile Asp Gln Asn Ala Leu Pro Val Asp Phe Thr Asn Leu Ser Ser305                 310                 315                 320Gln Thr Asn Tyr Leu Asn Ala Ser Leu Asn Thr Gln Asp Phe Ala Thr
            325                 330                 335Thr Met Leu Ser Ala Ile Ser Gln Ser Leu Ser Ser Ser Lys Ser Ser
        340                 345                 350Ala Thr Thr Tyr Arg Thr Ser Lys Thr Ser Arg Pro Phe Gly Ala Pro
    355                 360                 365Leu Leu Gly Val Asn Leu Lys Met Gly Tyr Gln Lys Tyr Phe Asn Asp
370                 375                 380Tyr Leu Gly Leu Ser Ser Tyr Gly Ile Ile Lys Tyr Asn Tyr Ala Gln385                 390                 395                 400Ala Asn Asn Glu Lys Ile Gln Gln Leu Ser Tyr Gly Val Gly Met Asp
            405                 410                 415Val Leu Phe Asp Phe Ile Thr Asn Tyr Thr Asn Glu Lys Asn Pro Lys
        420                 425                 430Ser Asn Leu Thr Lys Lys Val Phe Thr Ser Ser Leu Gly Val Phe Gly
    435                 440                 445Gly Leu Arg Gly Leu Tyr Asn Ser Tyr Tyr Leu Leu Asn Gln Tyr Lys
 450                455                 460Gly Ser Gly Asn Leu Asn Val Thr Gly Gly Leu Asn Tyr Arg Tyr Lys465                 470                 475                 480His Ser Lys Tyr Ser Ile Gly Ile Ser Val Pro Leu Val Gln Leu Lys
            485                 490                 495Ser Arg Ile Val Ser Ser Asp Gly Ala Tyr Thr Asn Ser Ile Thr Leu
        500                 505                 510Asn Glu Gly Gly Ser His Phe Lys Val Phe Phe Asn Tyr Gly Trp Ile
    515                 520                 525Phe(2)INFORMATION FOR SEQ ID NO:178:
(i)序列特征:
  (A)长度:187个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...187
(xi)序列描述:SEQ ID NO:178:Leu Gly Cys Val Ser Met Thr Leu Gly Ile Asp Glu Ala Gly Arg Gly1               5                   10                  15Cys Leu Ala Gly Ser Leu Phe Val Ala Gly Val Val Cys Asn Glu Lys
        20                  25                  30Ile Ala Leu Glu Phe Leu Lys Met Gly Leu Lys Asp Ser Lys Lys Leu
    35                  40                  45Ser Pro Lys Lys Arg Phe Phe Leu Glu Asp Lys Ile Lys Thr His Gly
50                  55                  60Glu Val Gly Phe Phe Val Val Lys Lys Ser Ala Asn Glu Ile Asp His65                  70                  75                  80Leu Gly Leu Gly Ala Cys Leu Lys Leu Ala Ile Glu Glu Ile Val Glu
            85                  90                  95Asn Gly Cys Ser Leu Ala Asn Glu Ile Lys Ile Asp Gly Asn Thr Ala
        100                 105                 110Phe Gly Leu Asn Lys Arg Tyr Pro Asn Ile Gln Thr Ile Ile Lys Gly
    115                 120                 125Asp Glu Thr Ile Ala Gln Ile Ala Met Ala Ser Val Leu Ala Lys Ala
130                 135                 140Ser Lys Asp Arg Glu Met Leu Glu Leu His Ala Leu Phe Lys Glu Tyr145                 150                 155                 160Gly Trp Asp Lys Asn Cys Gly Tyr Gly Thr Lys Gln His Ile Glu Ala
            165                 170                 175Ile Asn Lys Leu Gly Ala Thr Leu Ser Ser Ala
        180                 185(2)INFORMATION FOR SEQ ID NO:179:
(i)序列特征:
  (A)长度:204个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...204
(xi)序列描述:SEQ ID NO:179:Met Thr Leu Gly Ile Asp Glu Ala Gly Arg Gly Cys Leu Ala Gly Ser1               5                   10                  15Leu Phe Val Ala Gly Val Val Cys Asn Glu Lys Ile Ala Leu Glu Phe
        20                  25                  30Leu Lys Met Gly Leu Lys Asp Ser Lys Lys Leu Ser Pro Lys Lys Arg
    35                  40                  45Phe Phe Leu Glu Asp Lys Ile Lys Thr His Gly Glu Val Gly Phe Phe
50                  55                  60Val Val Lys Lys Ser Ala Asn Glu Ile Asp His Leu Gly Leu Gly Ala65                  70                  75                  80Cys Leu Lys Leu Ala Ile Glu Glu Ile Val Glu Asn Gly Cys Ser Leu
            85                  90                  95Ala Asn Glu Ile Lys Ile Asp Gly Asn Thr Ala Phe Gly Leu Asn Lys
        100                 105                 110Arg Tyr Pro Asn Ile Gln Thr Ile Ile Lys Gly Asp Glu Thr Ile Ala
    115                 120                 125Gln Ile Ala Met Ala Ser Val Leu Ala Lys Ala Ser Lys Asp Arg Glu
130                 135                 140Met Leu Glu Leu His Ala Leu Phe Lys Glu Tyr Gly Trp Asp Lys Asn145                 150                 155                 160Cys Gly Tyr Gly Thr Lys Gln His Ile Glu Ala Ile Asn Lys Leu Gly
            165                 170                 175Ala Thr Pro Phe His Arg His Ser Phe Thr Leu Lys Asn Arg Ile Leu
        180                 185                 190Asn Pro Lys Leu Leu Glu Val Glu Gln Arg Leu Val
    195                 200(2)INFORMATION FOR SEQ ID NO:180:
(i)序列特征:
  (A)长度:192个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...192
(xi)序列描述:SEQ ID NO:180:Met Asn Ala Leu Lys Lys Leu Ser Phe Cys Ala Leu Leu Ser Leu Gly1               5                   10                  15Leu Phe Ala Gln Thr Val His Ala Gln His Leu Lys Asp Thr Ile Asn
        20                  25                  30Tyr Pro Asp Trp Leu Lys Ile Asn Leu Phe Asp Lys Lys Asn Pro Pro
    35                  40                  45Asn Gln Tyr Val Gly Ser Ala Ser Ile Ser Gly Lys Arg Asn Asp Phe
50                  55                  60Tyr Ser Asn Tyr Ile Pro Tyr Asp Asp Lys Leu Pro Pro Glu Lys Asn65                  70                  75                  80Ala Glu Glu Ile Ala Leu Leu Arg Ala Arg Met Asn Ala Tyr Ser Thr
            85                  90                  95Leu Glu Ser Ala Leu Leu Thr Lys Met Cys Asn Arg Ile Val Lys Ala
        100                 105                 110Leu Gln Val Lys Asn Asn Val Ile Ser His Leu Phe Gly Phe Val Asp
    115                 120                 125Phe Leu Thr Ser Lys Ser Ile Leu Ala Lys Arg Phe Val Asp Thr Thr
130                 135                 140Asn His Arg Val Tyr Val Met Val Gln Phe Pro Phe Ile Gln Pro Glu145                 150                 155                 160Asp Leu Ile Ala Tyr Phe Lys Ala Lys Arg Ile Asp Leu Ser Leu Ala
            165                 170                 175Ser Ala Thr Asn Leu Ser Ala Ile Leu Asn Lys Ala Leu Phe His Leu
        180                 185                 190(2)INFORMATION FOR SEQ ID NO:181:
(i)序列特征:
  (A)长度:86个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...86
(xi)序列描述:SEQ ID NO:181:Met Asn Ala Leu Lys Lys Leu Ser Phe Cys Ala Leu Leu Ser Leu Gly1               5                   10                  15Leu Phe Ala Gln Thr Val His Ala Gln His Leu Lys Asp Thr Ile Asn
        20                  25                  30Tyr Pro Asp Trp Leu Lys Ile Asn Leu Phe Asp Lys Lys Asn Pro Pro
    35                  40                  45Asn Gln Tyr Val Gly Ser Ala Ser Ile Ser Gly Lys Arg Asn Asp Phe
50                  55                  60Tyr Ser Asn Tyr Ile Pro Tyr Asp Asp Lys Leu Pro Pro Glu Arg Thr65                  70                  75                  80Leu Lys Lys Ser Leu Phe
            85(2)INFORMATION FOR SEQ ID NO:182:
(i)序列特征:
  (A)长度:75个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...75
(xi)序列描述:SEQ ID NO:182:Leu Lys Ile Leu Thr Leu Phe Leu Ile Gly Leu Asn Ala Leu Phe Ala1               5                   10                  15Leu Asp Leu Asn Ala Leu Lys Thr Glu Ile Lys Glu Thr Tyr Leu Lys
        20                  25                  30Glu Tyr Lys Asp Leu Lys Leu Glu Ile Glu Thr Ile Asn Leu Glu Ile
    35                  40                  45Pro Glu Arg Phe Ser His Ala Ser Ile Leu Ser Tyr Glu Leu Asn Ala
50                  55                  60Ser Asn Lys Leu Lys Lys Asp Gly Ser Cys Phe65                  70                  75(2)INFORMATION FOR SEQ ID NO:183:
(i)序列特征:
  (A)长度:211个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...211
(xi)序列描述:SEQ ID NO:183:Met Phe Ser Ile Ile Leu Gly Gly Gly Gly Gly Asn Thr Pro Cys Gly1               5                   10                  15Leu Thr Trp Gln His Phe Lys Leu Gly Asp Leu Phe Glu Ile Glu Lys
        20                  25                  30Thr Leu Ser Phe Asn Lys Asp Ala Leu Thr Gln Gly Gln Asp Tyr Asp
    35                  40                  45Tyr Ile Thr Arg Thr Ser Gln Asn Gln Gly Val Leu Gln Thr Thr Gly
50                  55                  60Phe Val Asn Ala Glu Asn Leu Asn Pro Pro Phe Thr Trp Ser Leu Gly65                  70                  75                  80Leu Leu Gln Met Asp Phe Phe Tyr Arg Lys Lys Ser Trp Tyr Ala Gly
            85                  90                  95Gln Phe Met Arg Lys Ile Thr Pro Lys Thr Glu Ile Lys Asn Lys Ile
        100                 105                 110Asn Ser Arg Ile Ala His Tyr Phe Thr Thr Leu Leu Asn Ala Leu Lys
    115                 120                 125Arg Pro Leu Leu Ser Val Leu Val Arg Asp Ile Asp Lys Thr Phe Arg
130                 135                 140Glu Gln Lys Ile Gln Leu Pro Leu Lys Pro Thr Ala Lys Thr Gln Ser145                 150                 155                 160Leu Asp Gly Ile Asp Phe Asp Phe Met His Thr Leu Ile Asn Ala Leu
            165                 170                 175Met Lys Gln Thr Ile Gln Gly Val Val Gln Tyr Cys Asp Ala Lys Ile
        180                 185                 190Gln Ala Thr Lys Glu Val Ile Ser Gln Glu Thr Pro Ile Gln Lys Asp
    195                 200                 205Ser Leu Phe
210(2)INFORMATION FOR SEQ ID NO:184:
(i)序列特征:
  (A)长度:406个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...406
(xi)序列描述:SEQ ID NO:184:Val Ile Gly Pro Leu Ser Ser Gln Leu Asn Ala Ile Lys Trp Gly Glu1               5                   10                  15Phe Lys Leu Gly Asp Leu Phe Glu Ala Ser Asn Gly Asp Phe Asp Ile
        20                  25                  30Gln Lys Arg His Ile Asn His Lys Gly Glu Phe Val Ile Thr Ala Gly
    35                  40                  45Leu Ser Asn Asn Gly Val Leu Gly Gln Ser Asp Ile Lys Ala Lys Val
50                  55                  60Phe Glu Ser His Thr Ile Thr Ile Asp Met Phe Gly Cys Ala Phe Tyr65                  70                  75                  80Arg Ser Phe Ala Tyr Lys Met Val Thr His Ala Arg Val Phe Ser Leu
            85                  90                  95Lys Pro Lys Phe Glu Ile Asn His Lys Ile Gly Leu Phe Leu Ser Thr
        100                 105                 110Leu Phe Phe Gly Tyr His Lys Lys Phe Gly Tyr Glu Asn Met Cys Ser
    115                 120                 125Trp Ala Lys Ile Lys Asn Asp Lys Val Ile Leu Pro Leu Lys Pro Thr
130                 135                 140Ala Asn Thr Gln Thr Leu Glu Gly Ile Asp Phe Asp Phe Met Glu Lys145                 150                 155                 160Phe Ile Ala Glu Leu Glu Gln Cys Arg Leu Ala Glu Leu Gln Ala Tyr
            165                 170                 175Leu Lys Ala Thr Gly Leu Glu Asn Thr Thr Leu Ser Asn Asp Glu Glu
        180                 185                 190Asn Ala Leu Asn Val Phe Asn Asn Ser Gly Gly Gly Gly Gly Asn Thr
    195                 200                 205Pro Cys Gly Leu Thr Trp Gln His Phe Lys Leu Gly Asp Leu Phe Glu
210                 215                 220Ile Glu Lys Thr Leu Ser Phe Asn Lys Asp Ala Leu Thr Gln Gly Gln225                 230                 235                 240Asp Tyr Asp Tyr Ile Thr Arg Thr Ser Gln Asn Gln Gly Val Leu Gln
            245                 250                 255Thr Thr Gly Phe Val Asn Ala Glu Asn Leu Asn Pro Pro Phe Thr Trp
        260                 265                 270Ser Leu Gly Leu Leu Gln Met Asp Phe Phe Tyr Arg Lys Lys Ser Trp
    275                 280                 285Tyr Ala Gly Gln Phe Met Arg Lys Ile Thr Pro Lys Thr Glu Ile Lys
290                 295                 300Asn Lys Ile Asn Ser Arg Ile Ala His Tyr Phe Thr Thr Leu Leu Asn305                 310                 315                 320Ala Leu Lys Arg Pro Leu Leu Ser Val Leu Val Arg Asp Ile Asp Lys
            325                 330                 335Thr Phe Arg Glu Gln Lys Ile Gln Leu Pro Leu Lys Pro Thr Ala Lys
        340                 345                 350Thr Gln Ser Leu Asp Gly Ile Asp Phe Asp Phe Met His Thr Leu Ile
    355                 360                 365Asn Ala Leu Met Lys Gln Thr Ile Gln Gly Val Val Gln Tyr Cys Asp
370                 375                 380Ala Lys Ile Gln Ala Thr Lys Glu Val Ile Ser Gln Glu Thr Pro Ile385                 390                 395                 400Gln Lys Asp Ser Leu Phe
            405(2)INFORMATION FOR SEQ ID NO:185:
(i)序列特征:
  (A)长度:275个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...275
(xi)序列描述:SEQ ID NO:185:Met Ser Lys Ser Leu Tyr Gln Thr Leu Asn Val Ser Glu Asn Ala Ser1               5                   10                  15Gln Asp Glu Ile Lys Lys Ser Tyr Arg Arg Leu Ala Arg Gln Tyr His
        20                  25                   30Pro Asp Leu Asn Lys Thr Lys Glu Ala Glu Glu Lys Phe Lys Glu Ile
    35                  40                  45Asn Ala Ala Tyr Glu Ile Leu Ser Asp Glu Glu Lys Arg Arg Gln Tyr
50                  55                  60Asp Gln Phe Gly Asp Asn Met Phe Gly Gly Gln Asn Phe Ser Asp Phe65                  70                  75                  80Ala Arg Ser Arg Gly Pro Ser Glu Asp Leu Asp Asp Ile Leu Ser Ser
            85                  90                  95Ile Phe Gly Lys Gly Gly Phe Ser Gln Arg Phe Ser Gln Asn Ser Gln
        100                 105                 110Gly Phe Ser Gly Phe Asn Phe Ser Asn Phe Ala Pro Glu Asn Leu Asp
    115                 120                 125Val Thr Ala Ile Leu Asn Val Ser Val Leu Asp Thr Leu Leu Gly Asn
130                 135                 140Lys Lys Gln Val Ser Val Asn Asn Glu Thr Phe Ser Leu Lys Ile Pro145                 150                 155                 160Ile Gly Val Glu Glu Gly Glu Lys Ile Arg Val Arg Asn Lys Gly Lys
            165                 170                 175Met Gly Arg Thr Gly Arg Gly Asp Leu Leu Leu Gln Ile His Ile Glu
        180                 185                 190Glu Asp Glu Met Tyr Arg Arg Glu Lys Asp Asp Ile Ile Gln Ile Phe
    195                 200                 205Asp Leu Pro Leu Lys Thr Ala Leu Phe Gly Gly Lys Ile Glu Ile Ala
210                 215                 220Thr Trp His Lys Thr Leu Thr Leu Thr Ile Pro Pro Asn Thr Lys Ala225                 230                 235                 240Met Gln Lys Phe Arg Ile Lys Asp Lys Gly Ile Lys Ser Arg Lys Thr
            245                 250                 255Ser His Val Gly Asp Cys Ile Ala Ser Ser Phe Asp Leu Leu Lys Leu
        260                 265                 270Lys Arg Phe
    275(2)INFORMATION FOR SEQ ID NO:186:
(i)序列特征:
  (A)长度:278个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...278
(xi)序列描述:SEQ ID NO:186:Met Ser Lys Ser Leu Tyr Gln Thr Leu Asn Val Ser Glu Asn Ala Ser1               5                   10                  15Gln Asp Glu Ile Lys Lys Ser Tyr Arg Arg Leu Ala Arg Gln Tyr His
        20                  25                  30Pro Asp Leu Asn Lys Thr Lys Glu Ala Glu Glu Lys Phe Lys Glu Ile
    35                  40                  45Asn Ala Ala Tyr Glu Ile Leu Ser Asp Glu Glu Lys Arg Arg Gln Tyr
50                  55                  60Asp Gln Phe Gly Asp Asn Met Phe Gly Gly Gln Asn Phe Ser Asp Phe65                  70                  75                  80Ala Arg Ser Arg Gly Pro Ser Glu Asp Leu Asp Asp Ile Leu Ser Ser
            85                  90                  95Ile Phe Gly Lys Gly Gly Phe Ser Gln Arg Phe Ser Gln Asn Ser Gln
        100                 105                 110Gly Phe Ser Gly Phe Asn Phe Ser Asn Phe Ala Pro Glu Asn Leu Asp
    115                 120                 125Val Thr Ala Ile Leu Asn Val Ser Val Leu Asp Thr Leu Leu Gly Asn
130                 135                 140Lys Lys Gln Val Ser Val Asn Asn Glu Thr Phe Ser Leu Lys Ile Pro145                 150                 155                 160Ile Gly Val Glu Glu Gly Glu Lys Ile Arg Val Arg Asn Lys Gly Lys
            165                 170                 175Met Gly Arg Thr Gly Arg Gly Asp Leu Leu Leu Gln Ile His Ile Glu
        180                 185                 190Glu Asp Glu Met Tyr Arg Arg Glu Lys Asp Asp Ile Ile Gln Ile Phe
    195                 200                 205Asp Leu Pro Leu Lys Thr Ala Leu Phe Gly Gly Lys Ile Glu Ile Ala
210                 215                 220Thr Trp His Lys Thr Leu Thr Leu Thr Ile Pro Pro Asn Thr Lys Ala225                 230                 235                 240Met Gln Lys Phe Arg Ile Lys Asp Lys Gly Ile Lys Ser Arg Lys Thr
            245                 250                 255Ser His Val Gly Asp Cys Ile Ala Ser Ser Phe Asp Leu Pro Lys Ile
        260                 265                 270Glu Thr Leu Leu Met Ser
    275(2)INFORMATION FOR SEQ ID NO:187:
(i)序列特征:
  (A)长度:232个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...232
(xi)序列描述:SEQ ID NO:187:Val Val Gln Lys Phe Asn Phe Tyr Lys Thr Gly Gly Met Arg Leu Lys1               5                   10                  15His Phe Lys Thr Phe Leu Phe Ile Thr Met Ala Val Ile Val Ile Gly
        20                  25                  30Thr Gly Cys Ala Asn Lys Lys Lys Lys Lys Asp Glu Tyr Asn Lys Pro
    35                  40                  45Ala Ile Phe Trp Tyr Gln Gly Ile Leu Arg Glu Ile Leu Phe Ala Asn
50                  55                  60Leu Glu Thr Ala Asp Asn Tyr Tyr Ser Ser Leu Gln Ser Glu His Ile65                  70                  75                  80Asn Ser Pro Leu Val Pro Glu Ala Met Leu Ala Leu Gly Gln Ala His
            85                  90                  95Met Lys Lys Lys Glu Tyr Val Leu Ala Ser Phe Tyr Phe Asp Glu Tyr
        100                 105                 110Ile Lys Arg Phe Gly Thr Lys Asp Asn Val Asp Tyr Leu Thr Phe Leu
    115                 120                 125Lys Leu Gln Ser His Tyr Tyr Ala Phe Lys Asn His Ser Lys Asp Gln
130                 135                 140Glu Phe Ile Ser Asn Ser Ile Val Ser Leu Gly Glu Phe Ile Glu Lys145                 150                 155                 160Tyr Pro Asn Ser Arg Tyr Arg Pro Tyr Val Glu Tyr Met Gln Ile Lys
            165                 170                 175Phe Ile Leu Gly Gln Asn Glu Leu Asn Arg Ala Ile Ala Asn Val Tyr
        180                 185                 190Lys Lys Arg His Lys Pro Glu Gly Val Lys Arg Tyr Leu Glu Arg Ile
    195                 200                 205Asp Glu Thr Leu Glu Lys Glu Thr Lys Pro Lys Pro Ser His Met Pro
210                 215                 220Trp Tyr Val Leu Ile Phe Asp Trp225                 230(2)INFORMATION FOR SEQ ID NO:188:
(i)序列特征:
  (A)长度:114个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...114
(xi)序列描述:SEQ ID NO:188:Met Arg Phe Leu Asn Asn Lys His Arg Glu Lys Gly Leu Lys Ala Glu1               5                   10                  15Glu Glu Ala Cys Gly Phe Leu Lys Thr Leu Gly Phe Glu Met Ile Glu
        20                  25                   30Arg Asn Phe Phe Ser Gln Phe Gly Glu Ile Asp Ile Ile Ala Leu Lys
    35                  40                  45Lys Gly Val Leu His Phe Ile Glu Val Lys Ser Gly Glu Asn Phe Asp
50                  55                  60Pro Ile Tyr Ala Ile Thr Pro Ser Lys Leu Lys Lys Met Ile Lys Thr65                   70                 75                  80Ile Arg Cys Tyr Leu Ser Gln Lys Asp Pro Asn Ser Asp Phe Cys Ile
            85                  90                  95Asp Ala Leu Ile Val Lys Asn Gly Lys Phe Glu Leu Leu Glu Asn Ile
        100                 105                 110Thr Phe(2)INFORMATION FOR SEQ ID NO:189:
(i)序列特征:
  (A)长度:101个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...101
(xi)序列描述:SEQ ID NO:189:Met Gly Ser Ile Gly Ala Met Thr Lys Gly Ser Ser Asp Arg Tyr Phe1               5                   10                  15Gln Glu Gly Val Ala Ser Glu Lys Leu Val Pro Glu Gly Ile Glu Gly
        20                  25                  30Arg Val Pro Tyr Arg Gly Lys Val Ser Asp Met Ile Phe Gln Leu Val
    35                  40                  45Gly Gly Val Arg Ser Ser Met Gly Tyr Gln Gly Ala Lys Asn Ile Leu
50                  55                  60Glu Leu Tyr Gln Asn Ala Glu Phe Val Glu Ile Thr Ser Ala Gly Leu65                  70                  75                  80Lys Lys Ser His Val His Gly Val Asp Ile Thr Lys Glu Ala Pro Asn
            85                  90                  95Ile Met Gly Glu Phe
        100(2)INFORMATION FOR SEQ ID NO:190:
(i)序列特征:
  (A)长度:481个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...481
(xi)序列描述:SEQ ID NO:190:Met Arg Ile Leu Gln Arg Ala Leu Thr Phe Glu Asp Val Leu Met Val1               5                   10                  15Pro Arg Lys Ser Ser Val Leu Pro Lys Asp Val Ser Leu Lys Ser Arg
        20                  25                  30Leu Thr Lys Asn Ile Gly Leu Asn Ile Pro Phe Ile Ser Ala Ala Met
    35                  40                  45Asp Thr Val Thr Glu His Lys Thr Ala Ile Ala Met Ala Arg Leu Gly
50                  55                  60Gly Ile Gly Ile Val His Lys Asn Met Asp Ile Gln Thr Gln Val Lys65                  70                  75                  80Glu Ile Thr Lys Val Lys Lys Ser Glu Ser Gly Val Ile Asn Asp Pro
            85                  90                  95Ile Phe Ile His Ala His Arg Thr Leu Ala Asp Ala Lys Val Ile Thr
        100                 105                 110Asp Asn Tyr Lys Ile Ser Gly Val Pro Val Val Asp Asp Lys Gly Leu
    115                 120                 125Leu Ile Gly Ile Leu Thr Asn Arg Asp Val Arg Phe Glu Thr Asp Leu
130                 135                 140Ser Lys Lys Val Gly Asp Val Met Thr Lys Met Pro Leu Val Thr Ala145                 150                 155                 160His Val Gly Ile Ser Leu Asp Glu Ala Ser Asp Leu Met His Lys His
            165                 170                 175Lys Ile Glu Lys Leu Pro Ile Val Asp Lys Asp Asn Val Leu Lys Gly
        180                 185                 190Leu Ile Thr Ile Lys Asp Ile Gln Lys Arg Ile Glu Tyr Pro Glu Ala
    195                 200                 205Asn Lys Asp Asp Phe Gly Arg Leu Arg Val Gly Ala Ala Ile Gly Val
210                 215                 220Gly Gln Leu Asp Arg Ala Glu Met Leu Val Lys Ala Gly Val Asp Ala225                 230                 235                 240Leu Val Leu Asp Ser Ala His Gly His Ser Ala Asn Ile Leu His Thr
            245                 250                 255Leu Glu Glu Ile Lys Lys Ser Leu Val Val Asp Val Ile Val Gly Asn
        260                 265                 270Val Val Thr Lys Glu Ala Thr Ser Asp Leu Ile Ser Ala Gly Ala Asp
    275                 280                 285Ala Val Lys Val Gly Ile Gly Pro Gly Ser Ile Cys Thr Thr Arg Ile
290                 295                 300Val Ala Gly Val Gly Met Pro Gln Val Ser Ala Ile Asp Asn Cys Val305                 310                 315                 320Glu Val Ala Ser Lys Phe Asp Ile Pro Val Ile Ala Asp Gly Gly Ile
            325                 330                 335Arg Tyr Ser Gly Asp Val Ala Lys Ala Leu Ala Leu Gly Ala Ser Ser
        340                 345                 350Val Met Ile Gly Ser Leu Leu Ala Gly Thr Glu Glu Ser Pro Gly Asp
    355                 360                 365Phe Met Ile Tyr Gln Gly Arg Gln Tyr Lys Ser Tyr Arg Gly Met Gly
370                 375                 380Ser Ile Gly Ala Met Thr Lys Gly Ser Ser Asp Arg Tyr Phe Gln Glu385                 390                 395                 400Gly Val Ala Ser Glu Lys Leu Val Pro Glu Gly Ile Glu Gly Arg Val
            405                 410                 415Pro Tyr Arg Gly Lys Val Ser Asp Met Ile Phe Gln Leu Val Gly Gly
        420                 425                 430Val Arg Ser Ser Met Gly Tyr Gln Gly Ala Lys Asn Ile Leu Glu Leu
    435                 440                 445Tyr Gln Asn Ala Glu Phe Val Glu Ile Thr Ser Ala Gly Leu Lys Glu
450                 455                 460Ser His Val His Gly Val Asp Ile Thr Lys Glu Ala Pro Asn Tyr Tyr465                 470                 475                 480Gly(2)INFORMATION FOR SEQ ID NO:191:
(i)序列特征:
  (A)长度:204个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...204
(xi)序列描述:SEQ ID NO:191:Met Gln Gly Phe Leu Leu Gln Thr Gln Ser Ile Arg Asp Glu Asp Leu1               5                   10                  15Ile Val His Val Leu Thr Lys Asn Gln Leu Lys Thr Leu Tyr Arg Phe
        20                  25                  30Tyr Gly Lys Arg His Ser Val Leu Asn Val Gly Arg Lys Ile Asp Phe
    35                  40                  45Glu Glu Glu Asn Asp Asp Lys Phe Leu Pro Lys Leu Arg Asn Ile Leu
50                  55                  60His Leu Gly Tyr Ile Trp Glu Arg Glu Met Glu Arg Leu Phe Phe Trp65                  70                  75                  80Gln Arg Phe Cys Ala Leu Leu Phe Lys His Leu Glu Gly Val His Ser
            85                  90                  95Leu Asp Ser Ile Tyr Phe Asp Thr Leu Asp Asp Gly Ala Ser Lys Leu
        100                 105                 110Ser Lys Gln His Pro Leu Arg Val Ile Leu Glu Met Tyr Ala Val Leu
    115                 120                 125Leu Asn Phe Glu Gly Arg Leu Gln Ser Tyr Asn Ser Cys Phe Leu Cys
130                 135                 140Asp Ala Lys Leu Glu Arg Ser Val Ala Leu Ala Gln Gly Phe Ile Leu145                 150                 155                 160Ala His Pro Ser Cys Leu Lys Ala Lys Ser Leu Asp Leu Glu Lys Ile
            165                 170                 175Gln Ala Phe Phe Arg Thr Gln Ser Thr Ile Asp Leu Glu Thr Glu Glu
        180                 185                 190Val Glu Glu Leu Trp Arg Thr Leu Asn Leu Gly Phe
    195                 200(2)INFORMATION FOR SEQ ID NO:192:
(i)序列特征:
  (A)长度:82个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...82
(xi)序列描述:SEQ ID NO:192:Met Gly Val Gly Arg Val Gly Asn Met Ala Leu Leu Ala Cys Ala Gly1               5                   10                  15Pro Met Gly Ile Gly Ala Ile Ala Ile Ala Ile Asn Gly Gly Arg Gln
        20                  25                  30Arg Ser Arg Met Leu Val Val Asp Ile Asp Asp Lys Arg Leu Glu Gln
    35                  40                  45Val Gln Lys Met Leu Pro Gly Asn Trp Arg Pro Val Thr Ala Leu Ser
50                  55                  60Trp Cys Leu Cys Ile Pro Lys Arg Gly Ala Ile Arg Ala Arg Cys Cys65                  70                  75                  80Glu Arg(2)INFORMATION FOR SEQ ID NO:193:
(i)序列特征:
  (A)长度:67个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...67
(xi)序列描述:SEQ ID NO:193:Leu Ser Gly Thr Ala Val Ser Cys Arg Cys Thr Cys Arg Ile Gln Leul               5                   10                  15Val Leu Val Arg Thr Ser Ile Pro Val Val Ile Gly Cys Ser Cys Pro
        20                   25                 30Phe Leu Ser Ser Ile Gly Phe Thr Thr Gly Thr His Gln Ser Pro Val
    35                  40                  45Lys Arg Cys Gly Val Asn Ala Gly Lys Thr Pro Ser Lys Lys His Leu
50                  55                  60His Leu Asn65(2)INFORMATION FOR SEQ ID NO:194:
(i)序列特征:
  (A)长度:114个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:蛋白质
(iii)假说:是
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...114
(xi)序列描述:SEQ ID NO:194:Val Trp Leu Ala Ala Leu Gly Phe Leu Ile Thr Ala Val Gly Leu Pro1               5                   10                  15Val Ile Thr Val Ile Ala Leu Ala Lys Val Gly Gly Ser Ser Thr Pro
        20                  25                  30Ser Ala Ile Arg Ser Ala Gly Met Pro Ala Ala Cys Trp Arg Arg Ser
    35                  40                  45Ala Thr Trp Arg Ser Ala Arg Cys Ser Pro Phe Arg Ala Pro Pro Arg
50                  55                  60Cys Pro Ser Lys Val Ser Val Val Pro Leu Leu Gly Glu Glu Ala Ala65                  70                  75                  80Arg Arg Cys Ser Ser Thr Ala Trp Arg Thr Ser Ser Ser Pro Trp Pro
            85                  90                  95Ser Pro Ser Thr Pro Val Ala Cys Trp Thr Pro Ser Asp Ala Ser Ser
        100                 105                 110Pro Arg(2)INFORMATION FOR SEQ ID NO:195:
(i)序列特征:
  (A)长度:20个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...20
(xi)序列描述:SEQ ID NO:195:TATACCATGG TGGGCGCTAA                           20(2)INFORMATION FOR SEQ ID NO:196:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:196:ATGAATTCGA GTAAGGATTT TTG                       23(2)INFORMATION FOR SEQ ID NO:197:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:197:TTAACCATGG TGAAAAGCGA TA                      22(2)INFORMATION FOR SEQ ID NO:198:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:198:TAGAATTCGC ATAACGATCA ATC                      23(2)INFORMATION FOR SEQ ID NO:199:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:199:ATATCCATGG TGAGTTTGAT GA                        22(2)INFORMATION FOR SEQ ID NO:200:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:200:ATGAATTCAA TTTTTTATTT TGCCA                      25(2)INFORMATION FOR SEQ ID NO:201:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(ii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:201:AATTCCATGG TGGGGGCTAT G                         21(2)INFORMATION FOR SEQ ID NO:202:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:202:ATGAATTCTC GATAGCCAAA ATC                       23(2)INFORMATION FOR SEQ ID NO:203:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
 (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:203:AATTCCATGG TGCATAACTT CCATT                    25(2)INFORMATION FOR SEQ ID NO:204:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:204:AAGAATTCTC TAGCATCCAA ATGGA                     25(2)INFORMATION FOR SEQ ID NO:205:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:205:ATTTCCATGG TCATGTCTCA TATT                    24(2)INFORMATION FOR SEQ ID NO:206:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:206:ATGAATTCCA TCTTTTATTC CAC                        23(2)INFORMATION FOR SEQ ID NO:207:
(i)序列特征:
  (A)长度:27个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...27
(xi)序列描述:SEQ ID NO:207:AACCATGGTG ATTTTAAGCA TTGAAAG                   27(2)INFORMATION FOR SEQ ID NO:208:
(i)序列特征:
  (A)长度:28个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...28
(xi)序列描述:SEQ ID NO:208:AAGAATTCCA CTCAAAATTT TTTAACAG                  28(2)INFORMATION FOR SEQ ID NO:209:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:209:GATCATCCAT ATGTTATCTT CTAAT                 25(2)INFORMATION FOR SEQ ID NO:210:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:210:TGAATTCAAC CATTTTAACC CTG                  23(2)INFORMATION FOR SEQ ID NO:211:
(i)序列特征:
  (A)长度:27个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...27
(xi)序列描述:SEQ ID NO:211:TATACCATGG TGAAATTTTT TCTTTTA                   27(2)INFORMATION FOR SEQ ID NO:212:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:212:AGAATTCAAT TGCGTCTTGT AAAAG                           25(2)INFORMATION FOR SEQ ID NO:213:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:213:TATACCATGG TGATGGACAA ACTC                            24(2)INFORMATION FOR SEQ ID NO:214:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:214:ATGAATTCCC ACTTGGGGCG ATA                  23(2)INFORMATION FOR SEQ ID NO:215:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:215:TTATGGATCC AAACCAATTA AAACT                25(2)INFORMATION FOR SEQ ID NO:216:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:216:TATCTCGAGT TATAGAGAAG GGC                 23(2)INFORMATION FOR SEQ ID NO:217:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:217:TTAACCATGG TGAAAAGCGA TA                  22(2)INFORMATION FOR SEQ ID NO:218:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:218:TAGAATTCGC CTCTAAAACT TTAG                    24(2)INFORMATION FOR SEQ ID NO:219:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:219:TTAACCATGG TGAAAAGCGA TA                 22(2)INFORMATION FOR SEQ ID NO:220:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
 (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:220:TAGAATTCGC ATAACGATCA ATC                23(2)INFORMATION FOR SEQ ID NO:221:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:221:ATATCCATGG TGAGTTTGAT GA                      22(2)INFORMATION FOR SEQ ID NO:222:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:222:ATGAATTCAA TTTTTTATTT TGCCA                   25(2)INFORMATION FOR SEQ ID NO:223:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:223:AATTCCATGG CTATCCAAAT CCG                      23(2)INFORMATION FOR SEQ ID NO:224:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:224:ATGAATTCGC CAAAATCGTA GTATT                    25(2)INFORMATION FOR SEQ ID NO:225:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
 (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:225:GATACCATGG AATTTATGAA AAAG                     24(2)INFORMATION FOR SEQ ID NO:226:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:226:TGAATTCGAA AAAGTGTAGT TATAC                        25(2)INFORMATION FOR SEQ ID NO:227:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:227:CCCTTCATTT TAGAAATCG                              19(2)INFORMATION FOR SEQ ID NO:228:
(i)序列特征:
  (A)长度:20个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...20
(xi)序列描述:SEQ ID NO:228:ATTTCAACCA ATTCAATGCG                         20(2)INFORMATION FOR SEQ ID NO:229:
(i)序列特征:
  (A)长度:20个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...20
(xi)序列描述:SEQ ID NO:229:GCCCCTTTTG ATTTGAAGCT                         20(2)INFORMATION FOR SEQ ID NO:230:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:230:TCGCTCCAAG ATACCAAGAA GT                        22(2)INFORMATION FOR SEQ ID NO:231:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:231:CTTGAATTAG GGGCAAAGAT CG                     22(2)INFORMATION FOR SEQ ID NO:232:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:232:ATGCGTTTTT ACCCAAAGAA GT                    22(2)INFORMATION FOR SEQ ID NO:233:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:233:ATAACGCCAC TTCCTTATTG GT                        22(2)INFORMATION FOR SEQ ID NO:234:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:234:CTTTGGGTAA AAACGCATC                            19(2)INFORMATION FOR SEQ ID NO:235:
(i)序列特征:
  (A)长度:20个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...20
(xi)序列描述:SEQ ID NO:235:CGATCTTTGA TCCTAATTCA                           20(2)INFORMATION FOR SEQ ID NO:236:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:236:ATCAAGTTGC CTATGCTGA                            19(2)INFORMATION FOR SEQ ID NO:237:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:237:TTGAACACTT TTGATTATGC GG                          22(2)INFORMATION FOR SEQ ID NO:238:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:238:GGATTATGCG ATTGTTTTAC AAG                   23(2)INFORMATION FOR SEQ ID NO:239:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:239:GTCTTTAGCA AAAATGGCGT C                     21(2)INFORMATION FOR SEQ ID NO:240:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:240:AATGAGCGTA AGAGAGCCTT C                         21(2)INFORMATION FOR SEQ ID NO:241:
(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...18
(xi)序列描述:SEQ ID NO:241:CTTATGGGGG TATTGTCA                            18(2)INFORMATION FOR SEQ ID NO:242:
(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...18
(xi)序列描述:SEQ ID NO:242:AGCATGTGGG TATCCAGC                           18(2)INFORMATION FOR SEQ ID NO:243:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:243:AGGTTGTTGC CTAAAGACT                            19(2)INFORMATION FOR SEQ ID NO:244:
(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...18
(xi)序列描述:SEQ ID NO:244:CTGCCTCCAC CTTTGATC                             18(2)INFORMATION FOR SEQ ID NO:245:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:245:ACCAATATCA ATTGGCACT                             19(2)INFORMATION FOR SEQ ID NO:246:
(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...18
(xi)序列描述:SEQ ID NO:246:ACTTGGAAAA GCTCTGCA                               18(2)INFORMATION FOR SEQ ID NO:247:
(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...19
(xi)序列描述:SEQ ID NO:247:CTTGCTTGTC ATATCTAGC                             19(2)INFORMATION FOR SEQ ID NO:248:
(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...18
(xi)序列描述:SEQ ID NO:248:GTTGAAGTGT TGGTGCTA                              18(2)INFORMATION FOR SEQ ID NO:249:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:249:CAAGCAAGTG GTTTGGTTTT AG                         22(2)INFORMATION FOR SEQ ID NO:250:
(i)序列特征:
  (A)长度:22个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...22
(xi)序列描述:SEQ ID NO:250:TGGAAAGAGC AAATCATTGA AG                            22(2)INFORMATION FOR SEQ ID NO:251:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:251:GCCCATAATC AAAAAGCCCA T                             21(2)INFORMATION FOR SEQ ID NO:252:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:252:CTAAAACCAA ACCACTTGCT TGTC                                 24(2)INFORMATION FOR SEQ ID NO:253:
(i)序列特征:
  (A)长度:16个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...16
(xi)序列描述:SEQ ID NO:253:GTAAAACGAC GGCCAG                                         16(2)INFORMATION FOR SEQ ID NO:254:
(i)序列特征:
  (A)长度:17个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...17
(xi)序列描述:SEQ ID NO:254:CAGGAAACAG CTATGAC                                  17(2)INFORMATION FOR SEQ ID NO:255:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:255:ATCTTACCTA TCACCTCAAA T                                21(2)INFORMATION FOR SEQ ID NO:256:
(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...21
(xi)序列描述:SEQ ID NO:256:AGACAGCAAC ATCTTTGTGA A                                21(2)INFORMATION FOR SEQ ID NO:257:
(i)序列特征:
  (A)长度:50个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...50
(xi)序列描述:SEQ ID NO:257:CGCGGATCCA TATGGCTGAA AAAACGCCTT TTTTTAAAAC TAAAAACCAC    50(2)INFORMATION FOR SEQ ID NO:258:
(i)序列特征:
  (A)长度:34个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...34
(xi)序列描述:SEQ ID NO:258:CCGGAATTCA TCAGTATTCA ATGGGAATAA AGCC                     34(2)INFORMATION FOR SEQ ID NO:259:
(i)序列特征:
  (A)长度:50个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...50
(xi)序列描述:SEQ ID NO:259:CGCGGATCCA TATGAAAGAA GAAGAAAAAG AAGAAAAAAA GACAGAAAGG    50(2)INFORMATION FOR SEQ ID NO:260:
(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...37
(xi)序列描述:SEQ ID NO:260:CCGGAATTCG CTTAAAAGAA AATAGTCCCC CAAACGC                  37(2)INFORMATION FOR SEQ ID NO:261:
(i)序列特征:
  (A)长度:43个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...43
(xi)序列描述:SEQ ID NO:261:CGCGGATCCA TATGAAAGAG GTCATTCCCA CCCCTTCAAC CCC            43(2)INFORMATION FOR SEQ ID NO:262:
(i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...36
(xi)序列描述:SEQ ID NO:262:CCGGAATTCA TATAAATATC ATATAGGCAG AAAAAC                    36(2)INFORMATION FOR SEQ ID NO:263:
(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...37
(xi)序列描述:SEQ ID NO:263:CGCGGATCCA TATGGAGGCA GAGCTTGATG AAAAATC                    37(2)INFORMATION FOR SEQ ID NO:264:
(i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...36
(xi)序列描述:SEQ ID NO:264:CCGGAATTCG ATTGATTTTG TCAAATCTAA AATCCC                    36(2)INFORMATION FOR SEQ ID NO:265:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:265:TATTATACAT ATGGAAGAAG ATGGG                               25(2)INFORMATION FOR SEQ ID NO:266:
(i)序列特征:
  (A)长度:23个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...23
(xi)序列描述:SEQ ID NO:266:TAATCTCGAG TTTAGAAGGC GTA                                        23(2)INFORMATION FOR SEQ ID NO:267:
(i)序列特征:
  (A)长度:25个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...25
(xi)序列描述:SEQ ID NO:267:TTATATTCAT ATGGAAGACG ATGGC                                      25(2)INFORMATION FOR SEQ ID NO:268:
(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...24
(xi)序列描述:SEQ ID NO:268:AATTCTCGAG CCTCTTTATA AGCC                             24(2)INFORMATION FOR SEQ ID NO:269:
(i)序列特征:
  (A)长度:46个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...46
(xi)序列描述:SEQ ID NO:269:CGCGGATCCA TATGGTAGAA GCCTTTCAAA AACACCAAAA AGACGG         46(2)INFORMATION FOR SEQ ID NO:270:
(i)序列特征:
  (A)长度:32个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...32
(xi)序列描述:SEQ ID NO:270:CCGGAATTCG GAGCCAATAG GGAGCTAAAG CC                         32(2)INFORMATION FOR SEQ ID NO:271:
(i)序列特征:
  (A)长度:31个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...31
(xi)序列描述:SEQ ID NO:271:CGGGATCCGA AGGTGATGGT GTTTATATAG G                                  31(2)INFORMATION FOR SEQ ID NO:272:
(i)序列特征:
  (A)长度:32个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...32
(xi)序列描述:SEQ ID NO:272:CGCATATGGA AGGTGATGGT GTTTATATAG GG                                32(2)INFORMATION FOR SEQ ID NO:273:
(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...37
(xi)序列描述:SEQ ID NO:273:GCGAATTCTC ACTCTTTCCA ATAGTTTGCT GCAGAGC                        37(2)INFORMATION FOR SEQ ID NO:274:
(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...37
(xi)序列描述:SEQ ID NO:274:CCGGAATTCT TAATCCCGTT TCAAATGGTA ATAAAGG                         37(2)INFORMATION FOR SEQ ID NO:275:
(i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:环状
(ii)分子类型:DNA(基因组)
(iii)假说:蛋白质
(iv)反义:蛋白质
(vi)原始来源:
  (A)生物:幽门螺杆菌
(ix)特征:
  (A)名称/关键词:misc_特征
  (B)位置1...36
(xi)序列描述:SEQ ID NO:275:GCGAATTCCC TTTTATTTAA AAAGTGTAGT TATACC                         36

Claims (99)

1.其包含的核苷酸序列编码幽门螺杆菌多肽的分离的核酸,其中所述幽门螺杆菌多肽与选自SEQ ID NO:98-SEQ ID NO:194的氨基酸序列至少约60%同源。
2.分离的核酸,包含编码选自SEQ ID NO:98-SEQ ID NO:194的幽门螺杆菌多肽的核苷酸序列。
3.编码幽门螺杆菌多肽的分离的核酸,包含与选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列的同源性至少为约60%的核苷酸序列。
4.权利要求1的分离的核酸,包含选自SEQ ID NO:1-SEQ IDNO:97的核苷酸序列或其互补序列的核苷酸序列。
5.编码幽门螺杆菌多肽的分离核酸分子,包含一种核苷酸序列,该序列在严格杂交条件下与包含选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列的核酸分子杂交。
6.分离的核酸,包含长度至少为8个核苷酸的核苷酸序列,其中所述序列在严格杂交条件下与其核苷酸序列选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列的核酸杂交。
7.其包含的核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:63、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ IDNO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43、SEQID NO:44、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:60、SEQ ID NO:69和SEQ ID NO:83或其互补物。
8.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由包含SEQ ID NO:63的核苷酸序列或其互补物的幽门螺杆菌鞭毛相关多肽或其片段。
9.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补物编码的幽门螺杆菌内膜多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:38和SEQ ID NO:39。
10.权利要求9的分离核酸,其中所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸或其互补物编码的参与转运的幽门螺杆菌多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43和SEQ IDNO:44。
11.权利要求7的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸或其互补物编码的幽门螺杆菌外膜多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:65和SEQ ID NO:66。
12.权利要求11的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补物编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:42、SEQ ID NO:50、SEQID NO:51、SEQ ID NO:52、SEQ ID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91和SEQ ID NO:94。
13.权利要求12的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸或其互补物编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段:SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42和SEQ IDNO:52。
14.其包含的核苷酸序列编码幽门螺杆菌胞外被膜多肽或其片段的分离核酸,其中所述多肽选自:SEQ ID NO:160、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQID NO:126、SEQ ID NO:127、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:98、SEQID NO:99、SEQ ID NO:103、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:157、SEQ ID NO:166和SEQ ID NO:180。
15.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为包含SEQ ID NO:160氨基酸序列的幽门螺杆菌鞭毛相关多肽或其片段。
16.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段:SEQID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQID NO:135和SEQ ID NO:136。
17.权利要求16的分离核酸,其中所述幽门螺杆菌内膜多肽或其片段为选自以下的、参与转运的一种幽门螺杆菌多肽或其片段:SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140和SEQ ID NO:141。
18.权利要求14的分离核酸,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段:SEQID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:162和SEQID NO:163。
19.权利要求18的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:111、SEQID NO:120、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:133、SEQ ID NO:139、SEQID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQID NO:182、SEQ ID NO:188和SEQ ID NO:191。
20.权利要求19的分离核酸,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139和SEQ ID NO:149。
21.其包含的核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:57、SEQ ID NO:58、SEQID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:92、SEQ IDNO:93或其互补序列。
22.权利要求21的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,所述核酸选自SEQ ID NO:57和SEQ ID NO:58或其互补序列。
23.权利要求21的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,所述核酸选自SEQ ID NO:86和SEQ ID NO:87或其互补序列。
24.其包含的核苷酸序列编码幽门螺杆菌胞质多肽或其片段的分离核酸,其中所述多肽选自:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQID NO:186、SEQ ID NO:189和SEQ ID NO:190。
25.权利要求24的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:154和SEQ ID NO:155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
26.权利要求24的分离核酸,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:183和SEQ ID NO:184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
27.其包含的核苷酸序列编码幽门螺杆菌分泌多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:20、SEQ ID NO:25、SEQID NO:31、SEQ ID NO:32、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:53、SEQ ID NO:64、SEQ ID NO:67、SEQ ID NO:70、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:90、SEQ ID NO:95和SEQ ID NO:97或其互补序列。
28.分离的核酸,其包含的核苷酸序列编码选自以下的幽门螺杆菌分泌多肽或其片段:SEQ ID NO:100、SEQ ID NO:101、SEQ IDNO:107、SEQ ID NO:109、SEQ ID NO:117、SEQ ID NO:122、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:150、SEQ ID NO:161、SEQ ID NO:164、SEQID NO:167、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:187、SEQ ID NO:192和SEQID NO:194。
29.其包含的核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:15、SEQ ID NO:16、SEQID NO:21、SEQ ID NO:33、SEQ ID NO:37、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:47、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:59、SEQ ID NO:62、SEQ IDNO:68、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76和SEQ ID NO:96或其互补序列。
30.其包含的核苷酸序列编码幽门螺杆菌细胞多肽或其片段的分离核酸,其中所述多肽选自:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:118、SEQ ID NO:130、SEQ ID NO:134、SEQID NO:137、SEQ ID NO:138、SEQ ID NO:144、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:156、SEQID NO:159、SEQ ID NO:165、SEQ ID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQID NO:173和SEQ ID NO:193。
31.探针,包含由选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列或其互补序列的至少8个核苷酸组成的核苷酸序列。
32.重组表达载体,包含操作性连接于转录调节序列的权利要求1、2、3、4、5、6、7、14、21、24、27、28、29或30中任一项的核酸。
33.包含权利要求32的重组表达载体的细胞。
34.生产幽门螺杆菌多肽的方法,包括在允许表达所述多肽的条件下培养权利要求33的细胞。
35.权利要求34的方法,还包括从所述细胞纯化所述多肽。
36.检测样品中螺杆菌属核酸存在的方法,包括:
(a)使样品与权利要求6或31中任一项的核酸接触,使得在所述探针和样品中螺杆菌属核酸之间形成杂交物;以及
(b)检测步骤(a)中形成的杂交物,其中检测到杂交物表明所述样品中存在螺杆菌属核酸。
37.分离的幽门螺杆菌多肽,其包含的氨基酸序列与选自SEQID NO:98-SEQ ID NO:194的幽门螺杆菌多肽的同源性至少为60%。
38.分离的幽门螺杆菌多肽,所述多肽由其包含的核苷酸序列与选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列至少约60%同源的核酸编码。
39.权利要求28的分离的幽门螺杆菌多肽,其中所述多肽由选自SEQ ID NO:1-SEQ ID NO:97的核苷酸序列编码。
40.分离的幽门螺杆菌多肽,所述多肽由在严格条件下与选自SEQ ID NO:1-SEQ ID NO:97的核酸或其互补序列杂交的核酸编码。
41.分离的幽门螺杆菌多肽,包含选自SEQ ID NO:97-SEQ IDNO:194的氨基酸序列。
42.分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽选自:SEQ ID NO:160、SEQ ID NO:104、SEQ ID NO:105、SEQ IDNO:106、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQ ID NO:176、SEQID NO:177、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQ ID NO:108、SEQID NO:123、SEQ ID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQ ID NO:127、SEQID NO:162、SEQ ID NO:163、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQID NO:140、SEQ ID NO:141、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:103、SEQ IDNO:131、SEQ ID NO:132、SEQ ID NO:157、SEQ ID NO:166和SEQ ID NO:180。
43.权利要求42的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为包含SEQ ID NO:160氨基酸序列的一种幽门螺杆菌鞭毛相关多肽或其片段。
44.权利要求43的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌内膜多肽或其片段:SEQID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140、SEQ ID NO:141、SEQID NO:135、SEQ ID NO:136。
45.权利要求44的分离多肽,其中所述幽门螺杆菌内膜多肽或其片段为参与转运、选自以下的一种幽门螺杆菌多肽或其片段:SEQID NO:145、SEQ ID NO:146、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:140和SEQ ID NO:141。
46.权利要求43的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为选自以下的一种幽门螺杆菌外膜多肽或其片段:SEQID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:120、SEQ ID NO:121、SEQID NO:124、SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQID NO:181、SEQ ID NO:182、SEQ ID NO:188、SEQ ID NO:191、SEQ ID NO:102、SEQ ID NO:108、SEQ ID NO:123、SEQID NO:133、SEQ ID NO:139、SEQ ID NO:149、SEQ ID NO:119、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:162和SEQID NO:163。
47.权利要求46的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:111、SEQID NO:120、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:133、SEQ ID NO:139、SEQID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:158、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:181、SEQID NO:182、SEQ ID NO:188和SEQ ID NO:191。
48.权利要求47的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为具有一个末端苯丙氨酸残基和C末端酪氨酸簇、选自以下的一种幽门螺杆菌多肽或其片段:SEQ ID NO:108、SEQ ID NO:123、SEQ ID NO:133、SEQ ID NO:139和SEQ ID NO:149。
49.分离的幽门螺杆菌胞外被膜多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:63、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:61、SEQ ID NO:79、SEQID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ IDNO:22、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:65、SEQID NO:66、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:60、SEQ ID NO:69和SEQ ID NO:83。
50.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由包含SEQ ID NO:63的核苷酸序列的核酸编码的幽门螺杆菌鞭毛相关多肽或其片段。
51.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌内膜多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:43、SEQ ID NO:44、SEQID NO:38和SEQ ID NO:39。
52.权利要求51的分离多肽,其中所述幽门螺杆菌内膜多肽或其片段为由选自以下的核酸编码的参与转运的幽门螺杆菌多肽或其片段:SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:43和SEQ ID NO:44。
53.权利要求49的分离多肽,其中所述幽门螺杆菌胞外被膜多肽或其片段为由选自以下的核酸编码的幽门螺杆菌外膜多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:61、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:91、SEQ ID NO:94、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:26、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:52、SEQ ID NO:22、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:65和SEQ ID NO:66。
54.权利要求53的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基的幽门螺杆菌多肽或其片段:SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:23、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:61、SEQ IDNO:79、SEQ ID NO:80、SEQ ID NO:84、SEQ ID NO:85、SEQID NO:91和SEQ ID NO:94。
55.权利要求54的分离多肽,其中所述幽门螺杆菌外膜多肽或其片段为由选自以下的核酸编码的具有一个末端苯丙氨酸残基和C末端酪氨酸簇的幽门螺杆菌多肽或其片段:SEQ ID NO:11、SEQID NO:26、SEQ ID NO:36、SEQ ID NO:42和SEQ ID NO:52。
56.分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽选自:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:189和SEQID NO:190。
57.权利要求56的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为选自SEQ ID NO:154和SEQ ID NO:155、参与mRNA翻译的幽门螺杆菌多肽或其片段。
58.权利要求56的分离多肽,其中所述幽门螺杆菌胞质多肽或
其片段为选自SEQ ID NO:183和SEQ ID NO:184、参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段。
59.分离的幽门螺杆菌胞质多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:92和SEQ ID NO:93。
60.权利要求59的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为参与mRNA翻译的幽门螺杆菌多肽或其片段,所述多肽由选自SEQ ID NO:57和SEQ ID NO:58的一种核酸编码。
61.权利要求59的分离多肽,其中所述幽门螺杆菌胞质多肽或其片段为参与基因组复制、转录、重组和修复的幽门螺杆菌多肽或其片段,所述多肽由选自SEQ ID NO:86和SEQ ID NO:87的一种核酸编码。
62.分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽选自:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:118、SEQ ID NO:130、SEQ ID NO:134、SEQ ID NO:137、SEQ ID NO:138、SEQID NO:144、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:156、SEQ ID NO:159、SEQ ID NO:165、SEQID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173和SEQ ID NO:193。
63.分离的幽门螺杆菌细胞多肽或其片段,其中所述多肽由选自以下的一种核酸编码:SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:21、SEQ ID NO:33、SEQ ID NO:37、SEQ ID NO:40、SEQID NO:41、SEQ ID NO:47、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:59、SEQ ID NO:62、SEQ ID NO:68、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76和SEQ ID NO:96。
64.分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽选自:SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:117、SEQ ID NO:122、SEQ ID NO:128、SEQID NO:129、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:150、SEQ ID NO:161、SEQ ID NO:164、SEQ ID NO:167、SEQID NO:174、SEQ ID NO:175、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:187、SEQ ID NO:192和SEQ ID NO:194 。
65.分离的幽门螺杆菌分泌多肽或其片段,其中所述多肽由选自以下的核酸编码:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:20、SEQ ID NO:25、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:45、SEQ ID NO:46、SEQID NO:53、SEQ ID NO:64、SEQ ID NO:67、SEQ ID NO:70、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:90、SEQ ID NO:95和SEQ ID NO:97。
66.包含一种幽门螺杆菌多肽的融合蛋白,所述融合蛋白包含操作性连接至一种非幽门螺杆菌多肽、选自SEQ ID NO:98-SEQ ID NO:194的一种氨基酸序列。
67.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种权利要求1、2、3、4、5、6、7、14、21、24、27、28、29或30中任何权利要求的分离核酸。
68.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种权利要求37、38、40、41、42、49、56、59、62、63、64或65中任何权利要求的幽门螺杆菌多肽或其片段。
69.权利要求67的疫苗制剂,还包含一种药学上可接受的载体。
70.权利要求68的疫苗制剂,还包含一种药学上可接受的载体。
71.权利要求69的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
72.权利要求70的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
73.权利要求69的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
74.权利要求70的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
75.权利要求73的疫苗制剂,其中所述传递系统包含一种活载体。
76.权利要求74的疫苗制剂,其中所述传递系统包含一种活载体。
77.权利要求75的疫苗制剂,其中所述活载体为细菌或病毒。
78.权利要求76的疫苗制剂,其中所述活载体为细菌或病毒。
79.权利要求73的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
80.权利要求74的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
81.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种编码幽门螺杆菌外膜多肽或其片段的分离核酸,所述核酸选自:SEQ ID NO:28、SEQ ID NO:50、SEQ ID NO:24、SEQ ID NO:11、SEQ ID NO:52、SEQ ID NO:42和SEQ ID NO:79。
82.权利要求81的疫苗制剂,其中所述核酸包含SEQ ID NO:52的核苷酸序列。
83.用于预防性或治疗性治疗幽门螺杆菌感染的疫苗制剂,包含有效量的至少一种幽门螺杆菌外膜多肽或其片段,所述多肽选自:SEQ ID NO:125、SEQ ID NO:147、SEQ ID NO:121、SEQ ID NO:108、SEQ ID NO:149、SEQ ID NO:139和SEQ ID NO:176。
84.权利要求81的疫苗制剂,其中所述多肽包含SEQ ID NO:149的氨基酸序列。
85.权利要求81或83的疫苗制剂,还包含一种药学上可接受的载体。
86.权利要求85的疫苗制剂,其中所述药学上可接受的载体包含一种佐剂。
87.权利要求85的疫苗制剂,其中所述药学上可接受的载体包含一种传递系统。
88.权利要求87的疫苗制剂,其中所述传递系统包含一种活载体。
89.权利要求88的疫苗制剂,其中所述活载体为细菌或病毒。
90.权利要求86的疫苗制剂,其中所述药学上可接受的载体还包含一种佐剂。
91.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求67的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
92.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求68的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
93.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求81的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
94.治疗受治疗者中幽门螺杆菌感染或降低其风险的方法,包括给予受治疗者权利要求83的疫苗制剂,使得治疗发生的幽门螺杆菌感染或降低其发生的风险。
95.生产疫苗制剂的方法,包括:将选自SEQ ID NO:98-SEQ IDNO:194的至少一种分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
96.生产疫苗制剂的方法,包括:
(a)提供选自SEQ ID NO:98-SEQ ID NO:194的至少一种分离的幽门螺杆菌多肽或其片段;以及
(b)将至少一种所述分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
97.生产疫苗制剂的方法,包括:
(a)在允许选自SEQ ID NO:98-SEQ ID NO:194的一种幽门螺杆菌多肽或其片段表达的条件下培养细胞;
(b)从所述细胞分离所述幽门螺杆菌多肽或其片段;以及
(c)将至少一种所述分离的幽门螺杆菌多肽或其片段与药学上可接受的载体混合,以由此形成疫苗制剂。
98.嵌合幽门螺杆菌多肽,包含至少两种幽门螺杆菌多肽或其片段,其中所述多肽由选自SEQ ID NO:1-SEQ ID NO:97的核酸序列编码。
99.嵌合幽门螺杆菌多肽,包含至少两种幽门螺杆菌多肽或其片段,其中所述多肽选自SEQ ID NO:98-SEQ ID NO:194。
CN97181630A 1996-12-05 1997-12-05 关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物 Pending CN1246799A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US75962596A 1996-12-05 1996-12-05
US08/759,625 1996-12-05
US82374597A 1997-03-25 1997-03-25
US08/823,745 1997-03-25
US89192897A 1997-07-14 1997-07-14
US08/891,928 1997-07-14

Publications (1)

Publication Number Publication Date
CN1246799A true CN1246799A (zh) 2000-03-08

Family

ID=27419527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97181630A Pending CN1246799A (zh) 1996-12-05 1997-12-05 关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物

Country Status (18)

Country Link
EP (1) EP0964699A4 (zh)
JP (1) JP2001510992A (zh)
KR (1) KR20000069297A (zh)
CN (1) CN1246799A (zh)
AR (1) AR010337A1 (zh)
AU (1) AU739641B2 (zh)
BR (1) BR9714133A (zh)
CA (1) CA2273199A1 (zh)
EE (1) EE9900226A (zh)
ID (1) ID21946A (zh)
IL (1) IL129746A0 (zh)
IS (1) IS5047A (zh)
NO (1) NO992158L (zh)
NZ (1) NZ335633A (zh)
PL (1) PL333943A1 (zh)
SK (1) SK57999A3 (zh)
TR (1) TR199901262T2 (zh)
WO (1) WO1998024475A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108495650A (zh) * 2015-12-14 2018-09-04 慕尼黑工业大学 幽门螺杆菌疫苗
CN110343697A (zh) * 2019-08-05 2019-10-18 湖州三零科技股份有限公司 一种植物病害菌总dna提取方法
CN113435168A (zh) * 2021-06-10 2021-09-24 上海美吉生物医药科技有限公司 胶图自动编辑方法、系统、终端及介质
CN114057854A (zh) * 2021-09-30 2022-02-18 河北医科大学第四医院 一种幽门螺杆菌cd4+t细胞耐受多肽融合抗原及其应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE332968T1 (de) * 1998-10-26 2006-08-15 Novozymes As Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
US7034132B2 (en) 2001-06-04 2006-04-25 Anderson David W Therapeutic polypeptides, nucleic acids encoding same, and methods of use
AUPQ347199A0 (en) * 1999-10-15 1999-11-11 Csl Limited Novel polypeptide fragments
US6951729B1 (en) 1999-10-27 2005-10-04 Affinium Pharmaceuticals, Inc. High throughput screening method for biological agents affecting fatty acid biosynthesis
EP1330515A4 (en) * 2000-10-06 2005-12-07 Affinium Pharm Inc METHOD FOR AGONIZATION AND ANTAGONIZATION OF FABK
US7048926B2 (en) 2000-10-06 2006-05-23 Affinium Pharmaceuticals, Inc. Methods of agonizing and antagonizing FabK
WO2002066502A1 (en) * 2001-02-21 2002-08-29 Boren Thomas Helicobacter pylori sialic acid binding adhesin, saba and saba - gene
CA2737684A1 (en) * 2008-10-08 2010-04-15 Immune Solutions Limited Oral vaccines for producing mucosal immunity

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9300139L (sv) * 1993-01-19 1994-07-20 Medicarb Ab Framställning av ett nytt läkemedel

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108495650A (zh) * 2015-12-14 2018-09-04 慕尼黑工业大学 幽门螺杆菌疫苗
CN110343697A (zh) * 2019-08-05 2019-10-18 湖州三零科技股份有限公司 一种植物病害菌总dna提取方法
CN113435168A (zh) * 2021-06-10 2021-09-24 上海美吉生物医药科技有限公司 胶图自动编辑方法、系统、终端及介质
CN113435168B (zh) * 2021-06-10 2024-03-22 上海美吉生物医药科技有限公司 胶图自动编辑方法、系统、终端及介质
CN114057854A (zh) * 2021-09-30 2022-02-18 河北医科大学第四医院 一种幽门螺杆菌cd4+t细胞耐受多肽融合抗原及其应用
CN114057854B (zh) * 2021-09-30 2022-07-15 河北医科大学第四医院 一种幽门螺杆菌cd4+t细胞耐受多肽融合抗原及其应用

Also Published As

Publication number Publication date
WO1998024475A1 (en) 1998-06-11
TR199901262T2 (xx) 1999-08-23
KR20000069297A (ko) 2000-11-25
EP0964699A4 (en) 2005-04-06
NO992158L (no) 1999-07-05
IS5047A (is) 1999-05-10
AR010337A1 (es) 2000-06-07
EE9900226A (et) 1999-12-15
BR9714133A (pt) 2000-02-29
SK57999A3 (en) 2000-05-16
PL333943A1 (en) 2000-01-31
ID21946A (id) 1999-08-12
JP2001510992A (ja) 2001-08-07
IL129746A0 (en) 2000-02-29
NO992158D0 (no) 1999-05-04
AU5895498A (en) 1998-06-29
AU739641B2 (en) 2001-10-18
EP0964699A1 (en) 1999-12-22
NZ335633A (en) 2000-10-27
CA2273199A1 (en) 1998-06-11

Similar Documents

Publication Publication Date Title
CN1224708C (zh) 脑膜炎奈瑟氏球菌抗原
CN1117149C (zh) 用于免疫治疗和诊断结核病的化合物和方法
CN1280619A (zh) 沙眼衣原体的基因组序列和多肽,其片段以及其用途,特别是用于诊断、预防和治疗感染
CN1451046A (zh) 保守的奈瑟球菌抗原
CN1416352A (zh) 含有脑膜炎奈瑟球菌b血清群外膜蛋白质的外膜囊(omv)疫苗
CN1617740A (zh) 抗沙眼衣原体的免疫
CN1251611A (zh) 粘膜炎莫拉菌的uspa1和uspa2抗原
CN1318105A (zh) 负调节Osteoprotegerin配体活性的方法
CN1433471A (zh) 85kgDa奈瑟球菌的抗原
CN1246799A (zh) 关于幽门螺杆菌的核酸序列和氨基酸序列及其疫苗组合物
CN1263436A (zh) 在螺杆菌属基因组中鉴定编码新型螺杆菌属多肽的多核苷酸
KR20210132002A (ko) 변형된 오르토폭스 바이러스 벡터
CN1235513A (zh) 与幽门螺杆菌及其疫苗组合物有关的核酸和氨基酸序列
CN1134173A (zh) 间日疟原虫和镰状疟原虫红细胞结合蛋白的结合区
CN1351653A (zh) 抗细菌疫苗组合物
CN1294632A (zh) 得自母牛分枝杆菌的组合物及其使用方法
CN1220703A (zh) 与幽门螺杆菌及其疫备组合物有关的核酸和氨基酸序列
CN1204253C (zh) 奈瑟氏球菌乳铁蛋白结合蛋白
CN1331699A (zh) 鉴定抗原基因序列的方法
CN1342088A (zh) 包含胆碱结合蛋白an-末端截取物的氨基酸的多肽、由该多肽衍生的疫苗及其应用
CN1210401C (zh) 源自粘膜炎莫拉氏菌的化合物
CN1653084A (zh) 酶活性减少的非典型流感嗜血杆菌的p4蛋白突变体
CN1326509A (zh) 粘膜炎莫拉氏菌basb034多肽及应用
CN1311820A (zh) 得自粘膜炎莫拉氏菌的basb027蛋白和basb027基因、抗原、抗体及应用
CN1136917C (zh) 一种卡介苗热休克蛋白65和多表位her-2抗原融合蛋白重组蛋白疫苗

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication