CN1554664A - 用于结核病诊断的化合物和方法 - Google Patents

用于结核病诊断的化合物和方法 Download PDF

Info

Publication number
CN1554664A
CN1554664A CNA2004100351841A CN200410035184A CN1554664A CN 1554664 A CN1554664 A CN 1554664A CN A2004100351841 A CNA2004100351841 A CN A2004100351841A CN 200410035184 A CN200410035184 A CN 200410035184A CN 1554664 A CN1554664 A CN 1554664A
Authority
CN
China
Prior art keywords
ala
gly
pro
val
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100351841A
Other languages
English (en)
Inventor
Sg
S·G·里德
W
Y·A·W·斯克凯
¡
D·C·笛勒隆
-
A·卡穆普斯-尼托
R·胡格藤
ά
T·H·威德维克
���ߵ´Ŀ�
D·R·特瓦德茨克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corixa Corp
Original Assignee
Corixa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27541833&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1554664(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Corixa Corp filed Critical Corixa Corp
Publication of CN1554664A publication Critical patent/CN1554664A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/35Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • G01N33/5695Mycobacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Hematology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Communicable Diseases (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Virology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)

Abstract

本发明公开了用于诊断结核病的化合物和方法。所提供的化合物包括多肽以及编码这些多肽的DNA,所说的多肽含有一种或多种结核分枝杆菌分泌或非分泌蛋白质的至少一种抗原性部分。含有这些多肽或DNA序列和合适的检测试剂的诊断试剂盒可以用于在患者和生物样品中检测结核分枝杆菌感染。本发明也提供了抗这些多肽的抗体。

Description

用于结核病诊断的化合物和方法
技术领域
本发明总的来说涉及结核分枝杆菌感染的检测。更具体地说本发明涉及包含结核分枝杆菌抗原,或其部分或其它变体的多肽,以及这些多肽在结核分枝杆菌感染的血清学诊断上的用途。
发明背景
结核病是一种慢性传染病,一般由结核分枝杆菌感染引起。它在发展中国家是一种主要的疾病,在世界上发达地区也是一个日益严重的问题,每年有约8百万新病例和3百万人死亡。虽然感染可以在相当长一段时间内无症状,但是该疾病最常见地表现为急性肺炎,导致发热和非排痰性咳嗽。如果不进行治疗,则常常会出现严重的并发症并导致死亡。
虽然一般地可以采用多种抗生素控制结核病,但这样的治疗不足以阻止该疾病的传播。传染的个体可以是无症状的,但有时是传染性的。此外,虽然符合治疗方案是关键性的,但患者的行为难以监测。某些患者不完成治疗过程,这可以导致无效的治疗并产生药物抗性。
抑制结核病的传播需要有效的免疫接种和准确地早期诊断该疾病。当前,用活细菌接种是诱导保护性免疫最有效的方法。用于这一目的的最普通的分枝杆菌属是卡介苗(BCG)和牛型分枝杆菌的无毒菌株。然而,BCG的安全性和有效性上存在争议,并且一些国家(如,美国)不接种一般公众。诊断一般利用皮试进行,这牵涉到真皮内接触结核菌素PPD(纯化的蛋白质衍生物)。在注射之后48-72小时,抗原特异性T细胞反应在注射部位导致可测量的潜伏(incubation),这表明接触到分枝杆菌抗原。然而,这一实验的灵敏度和特异性一直存在问题,用BCG接种的个体与感染的个体不能区别。
虽然巨噬细胞已显示出作为结核分枝杆菌免疫性的主要的效应细胞,但T细胞是这种免疫性的主要的诱导物。T细胞在针对结核分枝杆菌感染的保护中的十分重要的作用由在爱滋病患者中结核分枝杆菌频繁发生说明,因为CD4 T细胞的耗竭与人免疫缺损病毒(HIV)感染相关。分枝杆菌属反应性CD4 T细胞已显示出是γ-干扰素(IFN-γ)的有力的生产者,后者依次已显示出在小鼠中触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人类中的作用还不太清楚,但研究已表明1,25-二羟基-维生素D3单独或与IFN-γ或肿瘤坏死因子-α一道激活人巨噬细胞以阻止结核分枝杆菌感染。此外,已知IFN-γ刺激人巨噬细胞产生1,25-二羟基-维生素D3。同样地,IL-12已显示出在刺激对结核分枝杆菌感染的抗性中起作用。有关结核分枝杆菌感染的免疫学参见Chan和Kaufmann,结核病:病理,预防和治疗,Boom(编者),ASM出版社,华盛顿,DC,1994。
因此,本领域需要用于检测结核病的改进的诊断方法。本发明满足了这一需要并进一步提供了其它相关优点。
发明概要
简言之,本发明提供了用于诊断结核病的组合物和方法。在一个方面,本发明提供了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分。在这一方面的一个实施方案中,所说的可溶性抗原具有一种以下N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-
   Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser
   (SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-
   Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro
   (SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
   (SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro
   (SEQ ID No.120);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-
   Pro(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
   Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-
   Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn
   (SEQ ID No.123);和
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;
   (SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;
   (SEQ ID No.130)或
(l)Ala-Pro-GIu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;
   (SEQ ID No.131)
其中Xaa可以是任何氨基酸。
在一个相关的方面,本发明提供了一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,所说的抗原具有一种以下的N端序列:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
   Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或
(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Tbr-Lys-Gly-Tyr-Tyr-
   Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),
其中Xaa可以是任何氨基酸。
在另一个实施方案中,所说的抗原包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,所说的多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,本发明提供了编码上述多肽的DNA序列,包含这些DNA序列的重组表达载体和用这样的表达载体转化或转染的宿主细胞。
另一方面,本发明提供了包含第一与第二发明多肽或者是发明多肽与已知的结核分枝杆菌抗原的融合蛋白。
主题发明的另一方面提供了用于在病人中检测结核病的方法和诊断试剂盒,所说的方法包括:(a)使生物样品与至少一种上述多肽接触;和(b)在样品中检测结合到所说多肽上的抗体的存在,由此在生物样品中检测结核分枝杆菌感染。合适的生物样品包括全血,痰、血清、血浆、唾液、脑脊液和尿。所说的诊断试剂盒包含一种或多种上述多肽以及检测试剂。
本发明也提供了用于检测结核分枝杆菌感染的方法,该方法包括:(a)从患者中获得生物样品;(b)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含编码上述多肽的DNA序列的至少约10个邻接的核苷酸;和(c)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列。
在另一方面,本发明提供了用于在病人中检测结核分枝杆菌感染的方法,该方法包括:(a)从患者中获得生物样品;(b)使样品与寡核苷酸探针接触,所说探针包含编码上述多肽的DNA序列的至少约15个邻接核苷酸;和(c)在样品中检测杂交到所说寡核苷酸探针上的DNA序列。
另一方面,本发明提供了结合到以上所述的多肽上的多克隆和单克隆抗体两者以及将它们用于检测结核分枝杆菌感染的方法。
参照下列详细描述和附图,本发明的这些和其他方面会很清楚。本文所公开的所有参考文献与它们单个并入作为参考一样,以它们的整体由本文一并参考。
附图和序列识别号的简要描述
图1A-1B和图1C-1D说明实施例1中描述的14Kd、20Kd和26Kd抗原对分别来源于第一和第二结核分枝杆菌免疫供体的T细胞的增殖和干扰素-γ产生的刺激作用。
图2说明与细菌溶解产物的反应性比较,两种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图3显示与38kD抗原的反应性比较,四种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图4显示重组38kD和TbRall抗原与结核分枝杆菌患者、PPD阳性供体和正常供体的血清的反应性。
图5显示抗原TbRa2A与38kD阴性血清的反应性。
图6显示SEQ ID No.60的抗原与结核分枝杆菌患者和正常供体的血清的反应性。
SEQ ID No.1是TbRal的DNA序列。
SEQ ID No.2是TbRal0的DNA序列。
SEQ ID No.3是TbRal1的DNA序列。
SEQ ID No.4是TbRal2的DNA序列。
SEQ ID No.5是TbRal3的DNA序列。
SEQ ID NO.6是TbRal6的DNA序列。
SEQ ID NO.7是TbRal7的DNA序列。
SEQ ID NO.8是TbRal8的DNA序列。
SEQ ID NO.9是TbRal9的DNA序列。
SEQ ID NO.10是TbRa24的DNA序列。
SEQ ID NO.11是TbRa26的DNA序列。
SEQ ID NO.12是TbRa28的DNA序列。
SEQ ID NO.13是TbRa29的DNA序列。
SEQ ID NO.14是TbRa2A的DNA序列。
SEQ ID NO.15是TbRa3的DNA序列。
SEQ ID NO.16是TbRa32的DNA序列。
SEQ ID NO.17是TbRa35的DNA序列。
SEQ ID NO.18是TbRa36的DNA序列。
SEQ ID NO.19是TbRa4的DNA序列。
SEQ ID NO.20是TbRa9的DNA序列。
SEQ ID NO.21是TbRaB的DNA序列。
SEQ ID NO.22是TbRaC的DNA序列。
SEQ ID NO.23是TbRaD的DNA序列。
SEQ ID NO.24是YYWCPG的DNA序列。
SEQ ID NO.25是AAMK的DNA序列。
SEQ ID NO.26是TbL-23的DNA序列。
SEQ ID NO.27是TbL-24的DNA序列。
SEQ ID NO.28是TbL-25的DNA序列。
SEQ ID NO.29是TbL-28的DNA序列。
SEQ ID NO.30是TbL-29的DNA序列。
SEQ ID NO.31是TbH-5的DNA序列。
SEQ ID NO.32是TbH-8的DNA序列。
SEQ ID NO.33是TbH-9的DNA序列。
SEQ ID NO.34是TbM-1的DNA序列。
SEQ ID NO.35是TbM-3的DNA序列。
SEQ ID NO.36是TbM-6的DNA序列。
SEQ ID NO.37是TbM-7的DNA序列。
SEQ nD No.38是TbM-9的DNA序列。
SEQ ID NO.39是TbM-12的DNA序列。
SEQ ID NO.40是TbM-13的DNA序列。
SEQ ID NO.41是TbM-14的DNA序列。
SEQ ID NO.42是TbM-15的DNA序列。
SEQ ID NO.43是TbH-4的DNA序列。
SEQ ID NO.44是TbH4-FWD的DNA序列。
SEQ ID NO.45是TbH-12的DNA序列。
SEQ ID NO.46是Tb38-1的DNA序列。
SEQ ID NO.47是Tb38-4的DNA序列。
SEQ ID NO.48是TbL-17的DNA序列。
SEQ ID NO.49是TbL-20的DNA序列。
SEQ ID NO.50是TbL-21的DNA序列。
SEQ ID NO.51是TbH-16的DNA序列。
SEQ ID NO.52是DPEP的DNA序列。
SEQ ID NO.53是DPEP的推定的氨基酸序列。
SEQ ID NO.54是DPV N-端抗原的蛋白质序列。
SEQ ID NO.55是AVGS N-端抗原的蛋白质序列。
SEQ ID NO.56是AAMK N-端抗原的蛋白质序列。
SEQ ID NO.57是YYWC N-端抗原的蛋白质序列。
SEQ ID NO.58是DIGS N-端抗原的蛋白质序列。
SEQ ID NO.59是AEES N-端抗原的蛋白质序列。
SEQ ID NO.60是DPEP N-端抗原的蛋白质序列。
SEQ ID NO.61是APKT N-端抗原的蛋白质序列。
SEQ ID NO.62是DPAS N-端抗原的蛋白质序列。
SEQ ID NO.63是TbM-1肽的推定的氨基酸序列。
SEQ ID NO.64是TbRal的推定的氨基酸序列。
SEQ ID NO.65是TbRal0的推定的氨基酸序列。
SEQ ID NO.66是TbRal1的推定的氨基酸序列。
SEQ ID NO.67是TbRal2的推定的氨基酸序列。
SEQ ID NO.68是TbRal3的推定的氨基酸序列。
SEQ iD NO.69是TbRal6的推定的氨基酸序列。
SEQ ID NO.70是TbRal7的推定的氨基酸序列。
SEQ ID NO.71是TbRal8的推定的氨基酸序列。
SEQ ID NO.72是TbRal9的推定的氨基酸序列。
SEQ ID NO.73是TbRa24的推定的氨基酸序列。
SEQ ID NO.74是TbRa26的推定的氨基酸序列。
SEQ ID NO.75是TbRa28的推定的氨基酸序列。
SEQ ID NO.76是TbRa29的推定的氨基酸序列。
SEQ ID NO.77是TbRa2A的推定的氨基酸序列。
SEQ ID NO.78是TbRa3的推定的氨基酸序列。
SEQ ID NO.79是TbRa32的推定的氨基酸序列。
SEQ ID NO.80是TbRa35的推定的氨基酸序列。
SEQ ID NO.81是TbRa36的推定的氨基酸序列。
SEQ ID NO.82是TbRa4的推定的氨基酸序列。
SEQ ID NO.83是TbRa9的推定的氨基酸序列。
SEQ ID NO.84是TbRaB的推定的氨基酸序列。
SEQ ID NO.85是TbRaC的推定的氨基酸序列。
SEQ ID NO.86是TbRaD的推定的氨基酸序列。
SEQ ID NO.87是YYWCPG的推定的氨基酸序列。
SEQ ID NO.88是TbAAMK的推定的氨基酸序列。
SEQ ID NO.89是Tb38-1的推定的氨基酸序列。
SEQ ID NO.90是TbH-4的推定的氨基酸序列。
SEQ ID NO.91是TbH-8的推定的氨基酸序列。
SEQ ID NO.92是TbH-9的推定的氨基酸序列。
SEQ ID NO.93是TbH-12的推定的氨基酸序列。
SEQ ID NO.94是DPAS的DNA序列。
SEQ ID NO.95是DPAS的推定的氨基酸序列。
SEQ ID NO.96是DPV的DNA序列。
SEQ ID NO.97是DPV的推定的氨基酸序列。
SEQ ID NO.98是ESAT-6的DNA序列。
SEQ ID NO.99是ESAT-6的推定的氨基酸序列。
SEQ ID NO.100是TbH-8-2的DNA序列。
SEQ ID NO.101是TbH-9FL的DNA序列。
SEQ ID NO.102是TbH-9FL的推定的氨基酸序列。
SEQ ID NO.103是TbH-9-1的DNA序列。
SEQ ID NO.104是TbH-9-l的推定的氨基酸序列。
SEQ ID NO.105是TbH-9-4的DNA序列。
SEQ ID NO.106是TbH-9-4的推定的氨基酸序列。
SEQ ID NO.107是Tb38-1F2 IN的DNA序列。
SEQ ID NO.108是Tb38-1F2 RP的DNA序列。
SEQ ID NO.109是Tb37-FL的推定的氨基酸序列。
SEQ ID NO.110是Tb38-IN的推定的氨基酸序列。
SEQ ID NO.111是Tb38-1F3的DNA序列。
SEQ ID NO.112是Tb38-1F3的推定的氨基酸序列。
SEQ ID NO.113是Tb38-1F5的DNA序列。
SEQ ID NO.114是Tb38-1F6的DNA序列。
SEQ ID NO.115是DPV的推定的N-端氨基酸序列。
SEQ ID NO.116是AVGS的推定的N-端氨基酸序列。
SEQ ID NO.117是AAMK的推定的N-端氨基酸序列。
SEQ ID NO.118是YYWC的推定的N-端氨基酸序列。
SEQ ID NO.119是DIGS的推定的N-端氨基酸序列。
SEQ ID NO.120是AAES的推定的N-端氨基酸序列。
SEQ ID NO.121是DPEP的推定的N-端氨基酸序列。
SEQ ID NO.122是APKT的推定的N-端氨基酸序列。
SEQ ID NO.123是DPAS的推定的N-端氨基酸序列。
SEQ ID NO.124是DPPD N-端抗原的蛋白质序列。
SEQ ID NO.125-128是四种DPPD溴化氰片段的蛋白质序列。
SEQ ID NO.129是XDS抗原的N-端蛋白质序列。
SEQ ID NO.130是AGD抗原的N-端蛋白质序列。
SEQ ID NO.131是APE抗原的N-端蛋白质序列。
SEQ ID NO.132是XYI抗原的N-端蛋白质序列。
发明详述
如上所述,本发明总的来说涉及诊断结核病的组合物和方法。本发明的组合物包含一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种抗原性部分。在本发明的范围内的多肽包括,但不限于,可溶性结核分枝杆菌抗原。″可溶性结核分枝杆菌抗原″是存在于结核分枝杆菌培养物滤液中的结核分枝杆菌源的蛋白质。如本文所使用的,术语″多肽″包括任何长度的氨基酸链,包括全长蛋白质(即,抗原),其中的氨基酸残基由共价肽键连接。这样,包含上述一种抗原的抗原性部分的多肽可以是完全由抗原性部分组成的,或者可以含有附加序列。所说的附加序列可以是来源于天然结核分枝杆菌抗原或者可以是异源的,这样的序列可以是(但不需要是)抗原性的。
抗原的″抗原性部分″(可以是也可以不是可溶性的)是能够与从结核分枝杆菌感染个体获得的血清反应的部分(即,在本文描述的代表性ELISA测定中,用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上)。″结核分枝杆菌感染个体″是已由结核分枝杆菌感染的人(例如,具有直径至少0.5cm的对PPD的真皮内皮试反应)。感染个体可以显示出结核病的症状,或可以是无疾病症状的。通常可以单独或组合使用包含本文描述的一种或多种结核分枝杆菌抗原的至少一种抗原性部分的多肽,以在患者中检测结核病。
本发明的组合物与方法也包括上述多肽的变体。如本文所使用的″变体″是仅在保守取代和/或修饰上不同于天然抗原(以便所述多肽的抗原性特性得到保留)的多肽。通过采用本文描述的代表性方法修饰一种上述多肽序列并评价修饰的多肽的抗原性特性可以一般性地鉴别这样的变体。
″保守取代″是这样一种取代,其中一种氨基酸取代具有类似性质的另一种氨基酸,以便肽化学领域的技术人员可以期望多肽的二级结构与亲水性质实质上不变。一般来说,下组氨基酸代表保守取代:(1)ala、pro、gly、glu、asp、gln、asn、ser、thr;(2)cys、ser、tyr、thr;(3)val、ile、leu、met、ala、phe;(4)lys、arg、his;和(5)phe、tyr、trp、his。
变体也可以(或选择性地)是由例如氨基酸缺失或者添加(对多肽抗原性特性,二级结构和亲水性质具有最小限度的影响)修饰的。例如,多肽可以连结到蛋白质N端的信号(或前导)序列上,后者共翻译或翻译后指导蛋白质的转移。所述多肽也可以连结到使多肽容易合成,纯化以及鉴定或增强多肽结合到固相支持物上的接头和其他序列(例如poly-His)上。例如,多肽可以连结到免疫球蛋白Fc区上。
在一个相关的方面,本文公开了组合多肽。″组合多肽″是包含至少一种上述抗原性部分和一种或多种附加抗原性结核分枝杆菌序列(其经由肽键连接到单一的氨基酸链上)的多肽。所述的序列可以直接连接(即没有间插氨基酸)或通过不明显降低组成多肽的抗原性特性的接头序列(例如,Gly-Cys-Gly)连接。
一般来说,结核分枝杆菌抗原,编码这种抗原的DNA序列,可以多种方法的任何一种制备。例如,可溶性抗原可以用本领域技术人员已知的方法,包括阴离子交换、反相层析从结核分枝杆菌培养物滤液分离。纯化的抗原可以就所需的性质进行评价,所述性质例如与从结核分枝杆菌感染个体获得的血清的反应能力。这样的筛选可以用本文描述的代表性方法完成。可以利用例如传统的Edman化学对抗原进行部分测序。参见Edman和Berg,欧洲生物化学杂志,80:116-132,1967。
也可以用编码抗原的DNA序列(已插入到表达载体中并在合适的宿主中表达)重组产生抗原。可以通过用特异性抗可溶性结核分枝杆菌抗原产生的抗血清(例如兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。可以用从感染了结核分枝杆菌的病人获得的血清筛选合适的结核分枝杆菌基因组或者cDNA表达文库鉴别编码抗原(抗原可以是或者可以不是可溶性的)的DNA序列。这样的筛选一般可以利用本领域已知的技术完成,例如在Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中所描述的那些。
编码可溶性抗原的DNA序列也可以通过就与简并寡核苷酸(该寡核苷酸来源于分离的可溶性抗原的部分氨基酸序列)杂交的DNA序列筛选适当的结核分枝杆菌cDNA或基因组DNA文库来获得。可以如(例如)Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY(和该文引用的参考文献)中的描述设计和合成用于这种筛选的简并寡核苷酸序列,并且完成筛选。也可以使用聚合酶链反应(PCR),用本领域已知的方法用上述寡核苷酸,以从cDNA或基因组文库分离核酸探针。然后可以使用所分离的探针完成文库的筛选。
不论是什么制备方法,本文所描述的抗原是″抗原性的″,更具体地说,所说的抗原具有与从结核分枝杆菌感染个体获得的血清反应的能力。可以采用例如本文描述的代表性的ELISA测定评价反应性,其中用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上被认为是阳性的。
也可以采用本领域已知的技术(例如在Paul,基础免疫学,第三版,Raven出版社,1993,pp.243-247和该文引用的参考文献中描述的那些技术)制备和鉴别结核分枝杆菌抗原的抗原性部分。这样的技术包括就抗原性特性筛选天然抗原的多肽部分。一般可以将本文所描述的代表性ELISA用于这些筛选。多肽的抗原性部分是这样的部分,其在这样的代表性测定中产生实质上类似由全长抗原产生的信号的这种测定中的信号。换句话说,在本文描述的模式ELISA中,结核分枝杆菌抗原的抗原性部分产生至少约20%,优选地约100%的由全长抗原所产生的信号。
结核分枝杆菌抗原的部分和其它变体可以用合成或者重组方法产生。利用本领域已知的技术,可以产生具有少于约100个氨基酸,一般少于约50个氨基酸的合成多肽。例如,这些多肽可以用任何通过商业途径可获得的固相技术合成,如Merrifield固相合成法,其中氨基酸依次添加到增长的氨基酸链上。参见Merrifield,美国化学会杂志,8:2149-2146,1963。用于多肽的自动合成的设备是可通过商业途径从供应商(如应用生物系统公司,Foster City,CA)获得的,并且可以按照制造厂商的说明操作。一般可以用标准的诱变技术(如寡核苷酸定点特异性诱变)制备天然抗原的变体。也可以用标准的技术除去DNA序列的片段,以便可以制备截短的多肽。
采用本领域技术人员熟知的各种技术,可以容易地从编码多肽的DNA序列制备包含天然抗原部分和/或变体的重组多肽。例如,将重组蛋白质分泌到培养基中的合适的宿主/载体系统的上清液可以首先采用市售的滤器浓缩。在浓缩之后,可以将浓缩液用于合适的纯化基质(如亲和性基质或离子交换树脂)上。最后,可以使用一个或多个反相HPLC步骤,以进一步纯化重组蛋白质。
本领域普通技术人员已知的各种表达载体的任何一种都可以用于表达本文所描述的重组多肽。表达可以在任何合适的宿主细胞中进行,所述的宿主细胞已用含有编码重组多肽的DNA分子的表达载体转化或转染过。合适的宿主细胞包括原核生物,酵母和高级真核细胞。优选地,使用的宿主细胞是大肠杆菌,酵母或哺乳动物细胞系,如COS或CHO。以这一方式表达的DNA序列可以编码天然存在的抗原,天然存在的抗原的部分,或者其其它变体。
一般来说,不论采用哪一种制备方法,本文所公开的多肽实质上以纯化的形式得以制备。优选地,所述多肽的纯度为至少大约80%,更优选地至少大约90%,最优选地至少大约99%。然而,就用于本文所公开的方法而言,这些实质上纯化的多肽可以是组合的。
在某些特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所说的抗原具有一种以下的N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-
   Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser
   (SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-
   Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro
   (SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
   (SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro
   (SEQ ID No.120);
(g)AspPro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-
   Pro(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
   Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-
   Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn
   (SEQ ID No.123);和
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;
   (SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;
   (SEQ ID No.130)或
(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;
   (SEQ ID No.131)其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基。编码以上标记有(g)的抗原的DNA序列在SEQ ID No.52中给出,其推定的氨基酸序列在SEQID No.53中给出。编码以上标记有(a)的抗原的DNA序列在SEQ ID No.96中给出,其推定的氨基酸序列在SEQ ID No.97中给出。相应于以上抗原(d)的DNA序列在SEQ ID No.24中给出,相应于以上抗原(c)的DNA序列在SEQ ID No.25中给出,相应于以上抗原(I)的DNA序列在SEQ ID No.94中给出,其推定的氨基酸序列在SEQ ID No.95中给出。
在另一个特定的实施方案中,主题发明公开了一些多肽,这些多肽包含具有一种以下的N端序列的结核分枝杆菌抗原,或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
   Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或
(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-
   Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),
其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基
在其它特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性的结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)包含由以下序列编码的一种或多种氨基酸序列:(a)SEQID No.1,2,4-10,13-25,52,94和96的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在其他特定的实施方案中,主题发明公开了一些多肽,这些多肽包含结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)可以是也可以不是可溶性的,其包含由以下序列编码的一种或多种氨基酸序列:(a)SEQ ID No.26-51的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在以上讨论的特定的实施方案中,结核分枝杆菌抗原包括由实质上同源于本文特别提出的一种或多种DNA序列的DNA序列编码的变体。本文使用的“实质上的同源性”指在中等严格条件下能够杂交的DNA序列。合适的中等严格条件包括在5X SSC,0.5%SDS,1.0mM EDTA(pH8.0)溶液中预洗涤;在50℃-65℃,5X SSC下杂交一夜,或者在杂交物种同源的情况下在45℃,5X SSC下杂交;接着在65℃下洗涤两次,每次以包含0.1%SDS的2X,0.5X和0.2X SSC洗涤20分钟。这样的杂交DNA序列也在本发明的范围内,由于密码简并,编码由杂交DNA序列编码的免疫原性多肽的核苷酸序列也是如此。
在一个相关的方面,本发明提供了一些融合蛋白以及这些融合蛋白的变体,所说的融合蛋白包含第一与第二发明多肽或者是本发明多肽与已知的结核分枝杆菌抗原的融合蛋白,所述抗原如以上描述的38kD抗原或ESAT-6(SEQ ID No.98和99)。本发明的融合蛋白也可以包含在所说的第一和第二多肽之间的接头肽。
利用已知的DNA重组技术将分离的编码第一和第二多肽的DNA序列装配到适当的表达载体中,由此来构建编码本发明的融合蛋白的DNA序列。将具有或不具有肽接头的编码第一多肽的DNA序列的3’末端连接到编码第二多肽的DNA序列的5’末端,以便这些序列的读框处于可以使两种DNA序列的mRNA翻译成保持第一和第二多肽两者的生物学活性的单一融合蛋白的状态。
肽接头序列可以用于通过足以保证各多肽折叠成其二级和四级结构的距离分离第一和第二多肽。采用本领域熟知的标准技术将这样一种肽接头序列掺入到融合蛋白中。可以基于下列因素选择合适的肽接头序列:(1)它们采取柔性延伸构象的能力;(2)它们不采取二级结构(其可以与第一和第二多肽上的功能性表位相互作用)的能力;和(3)可以与多肽的功能性表位进行反应的疏水或带电残基的缺乏。优选的肽接头序列包括Gly、Asn和Ser残基。其它接近中性的氨基酸,如Thr和Ala也可以用于接头序列。可以有利地用作接头序列的氨基酸序列包括在Maratea等,基因,40:39-46,1985;Murphy等,美国科学院学报,83:8258-8562,1986;美国专利4,935,233和美国专利4,751,180中公开的那些。所说的接头序列长度可以从1到约50个氨基酸。当第一和第二多肽具有可以用来分离功能域和阻止空间位阻的非必需N端氨基酸区时,肽接头序列是不需要的。
另一方面,本发明提供了用于利用以上所描述的多肽来诊断结核病的方法。在这一方面,提供了通过单独或组合使用一种或多种以上多肽检测生物样品中结核分枝杆菌感染的方法。在采用多种多肽的实施方案中,可以包括本文特定描述的那些多肽之外的多肽,例如在Andersen和Hansen,感染免疫学,57:2481-2488,1989中描述的38kD抗原。本文所使用的″生物样品″是任何从患者所获得的含有抗体的样品。优选地样品是全血,痰,血清,血浆,唾液,脑脊液或者尿。更优选地样品是从患者或血液供体所获得的血清或者血浆样品。如以下的描述将所述多肽用于测定中,以确定样品中抗体的存在或不存在(相对于预定的切断(cut-off)值)。这样的抗体的存在表明对可以指示结核病的分枝杆菌抗原的早期致敏作用。
在使用多于一种多肽的实施方案中,所使用的多肽优选地是互补的(即一种组分多肽倾向于检测样品中不能由另一种组分多肽检测的感染)。一般可以采用各种多肽鉴别互补多肽,以分别评价从已知由结核分枝杆菌感染的一系列病人获得的血清样品。在用各多肽确定哪些样品为试验阳性(如下所述)后,可以制备能够检测大多数或所有待试样品中的感染的两种或多种多肽的组合体。这些多肽是互补性的。例如,肺结核-感染个体血清的约25-30%就针对任意单一蛋白质(如以上所论及的38kD抗原)的抗体而言是阴性的。因此,互补多肽可以与38kD抗原结合起来使用,以改进诊断试验的灵敏度。
有本领域技术人员已知的用一种或多种多肽检测样品中抗体的多种方式。参见,例如,Harlow和Lane,抗体:实验室手册,冷泉港实验室,1988,该文献本文一并参考。在一个优选的实施方案中,所说的测定包括利用固定在固相支持物上的多肽结合和除去样品中的抗体。然后,结合的抗体可以用含有报道基团的检测试剂检测。合适的检测试剂包括结合到抗体/多肽复合物和游离多肽上的抗体,其是由报道基团标记的(例如,在半竞争性测定中)。此外,可以使用竞争性测定,其中结合到多肽上的抗体以报道基团标记,并且使得可以在将抗原与样品温育后结合到固定化的抗原上。样品组分抑制标记抗体对多肽结合的程度是样品与固定化多肽反应性的指示。
固相支持物可以是任何本领域普通技术人员已知的抗原可以连接于其上的固体物质。例如,固相支持物可以是微量滴定板中的试验孔或者硝化纤维素或者其它合适的膜。此外,支持物可以是小珠或圆盘,如玻璃,玻璃纤维,乳胶或者塑料材料,如聚苯乙烯或聚氯乙烯。支持物也可以是磁性颗粒或纤维光学传感器,例如,在美国专利5,359,681中公开的那些。
所述多肽可以用任何本领域普通技术人员已知的多种技术结合到固相支持物上,这些技术在专利和科学文献中有详细的描述。在本发明的上下文中,术语″结合″指非共价缔合(如吸附)和共价连接(可以是抗原和在支持物上的官能团的直接键合,或者可以是利用交联剂连接)。通过吸附到微量滴定板中的孔上或者膜上的结合是优选的。在这样的情况下,吸附可以通过将在合适的缓冲液中的多肽与固相支持物接触一段合适的时间完成。接触时间随着温度变化,但是一般在大约1小时和1天之间。一般来说,使塑料微量滴定板(如聚苯乙烯或聚氯乙烯)的孔与范围从约10ng到约1μg,优选地约100ng量的多肽接触足以结合充分量的抗原。
通过首先将支持物与双功能试剂反应一般可以完成多肽与固相支持物的共价连接,所述的双功能试剂与支持物和多肽上的官能团(如羟基或氨基基团)两者反应。例如,所述多肽可以结合到具有合适的聚合物的支持物上(采用苯醌涂布或经将醛基团与多肽上胺或活性氢缩合)(参见,例如,Pierce免疫技术目录和手册,1991,A12-A13)。
在某些实施方案中,所述的测定是酶联免疫吸附测定(ELISA)。这一测定可以通过首先使已固定化到固相支持物(一般是微量滴定板的孔)上的多肽抗原与样品接触,以便样品中的多肽的抗体可以结合到固定化的多肽上。然后从固定化的多肽上除去未结合的样品,并加入能够结合固定化的抗体-多肽复合物的检测试剂。然后,采用适合于特定检测试剂的方法测定保持结合到固相支持物上的检测试剂的量。
更具体地说,一旦多肽如上所述固定化在支持物上,则剩下的在支持物上的蛋白质结合部位就通常被阻断。任何本领域普通技术人员已知的合适的阻断剂,如牛血清白蛋白或吐温20TM(Sigma化学公司,St.Louis,MO),都可以使用。然后将固定化的多肽与样品一起温育,使抗体结合到抗原上。在温育之前,样品可以以合适的稀释剂稀释,所述稀释剂如磷酸盐缓冲盐水(PBS)。一般来说,适当的接触时间(即,温育时间)是对检测结核分枝杆菌感染样品中抗体存在的足够的那段时间。优选地,所说的接触时间足以完成至少95%的结合水平(结合的和未结合的抗体之间达到平衡)。本领域普通技术人员会认识到达到平衡所需的时间可以通过测定整个期限内出现结合水平容易地确定。在室温下,约30分钟的温育时间一般是足够的。
然后,可以通过用适当的缓冲液(如包含0.1%吐温20TM的PBS)洗涤固相支持物除去未结合的样品。接着检测试剂可以加入到固相支持物上。适当的检测试剂是结合到固定化的抗体-多肽复合物上并且可以用本领域已知的各种方法之任何一种检测的任何化合物。优选地,所述的检测试剂含有结合到报道基团上的结合剂(例如,蛋白质A、蛋白质G、免疫球蛋白、凝集素或者游离抗原)。优选的报道基团包括酶(如辣根过氧化物酶)、底物、辅因子、抑制剂、染料、放射性核素、发光基团、荧光基团和生物素。可以用本领域普通技术人员已知的标准的方法完成报道基团与结合剂的结合。结合到各种报道基团上的普通的结合剂也可以从多种商业来源(例如,Zymed Laboratories,旧金山,CA,和Pierce,Rockford,IL)购得。
然后,将检测试剂与固定化的抗体-多肽复合物一起温育足以检测结合抗体的一段时间。合适的一段时间一般从制造厂商的说明确定或通过测定在整个时间内出现的结合水平确定。接着除去未结合的检测试剂,并采用报道基团检测结合的检测试剂。用于检测报道基团的方法取决于报道基团的性质。对于放射性基团,闪烁计数或放射自显影法一般是适当的。光谱学方法可以用于检测染料,发光基团和荧光基团。连接到不同报道基团(一般是放射性或者荧光基团或酶)上的生物素可以利用抗生物素蛋白检测。酶报道基团一般可以通过添加底物(一般是一段特定的时间),然后进行反应产物的光谱或其它分析来检测。
为了确定样品中结核分枝杆菌抗体的存在或不存在,一般将从保持结合到固相支持物上的报道基团检测到的信号与相应于预定截止值的信号比较。在一个优选的实施方案中,当固定化的抗原与未感染的病人的样品一起温育时,所说的截止值是所获得的平均信号。一般来说,产生的信号在预定的截止值三个标准偏差之上的样品被认为是结核病阳性的。在另一个优选的实施方案中,按照Sackett等,临床流行病学:一种临床医学的基础科学,Little Brown and Co.,1985,pp.106-107的方法采用接受体-操纵物(Receiver Operator)曲线确定截止值。简言之,在这一实施方案中,截止值可以从真阳性大鼠(即敏感性)和假阳性大鼠(100%-特异性)对的图(其相应于诊断试验结果的各种可能的截止值)确定。在最靠近左上角图上的截止值(即圈在最大区域内的值)是最精确的截止值,产生的信号高于由这一方法确定的截止值的样品被认为是阳性的。另外,所说的截止值可以沿图移向左边(以最小化假阳性率),或者右边(以最小化假阴性率)。一般来说,产生的信号高于由这一方法确定的截止值的样品被认为是结核病阳性的。
在相关的实施方案中,所说的测定以迅速过流或布条断裂强度试验方式完成,其中抗原固定化在膜(如硝化纤维素膜)上。在过流试验中,在样品通过膜时,样品内的抗体结合到固定化的多肽上。然后,当含有检测试剂的溶液流过膜时,检测试剂(例如,蛋白质A-胶态金)结合到抗体-多肽复合物上。然后可以按照以上的描述完成对结合的检测试剂的检测。在布条断裂强度试验方式中,将多肽结合于其上的膜的一端浸没在包含样品的溶液中。样品沿着膜迁移,穿过包含检测试剂的区域,到达固定化的多肽的区。在多肽上的检测试剂的浓度表明样品中抗结核分枝杆菌抗体的存在。典型地,在这一部位的检测试剂的浓度产生可以容易被观察的模式,如线状。缺乏这样一种模式表明阴性结果。一般来说,选择在膜上固定化的多肽的量,以便当生物样品含有足以在ELISA中产生阳性信号的抗体水平时(如以上所讨论的),产生清楚可见的模式。优选地,固定化在膜上的多肽的量的范围从约25ng到约1μg,更优选地从约50ng到约500ng。这样的试验典型地以十分小的量(例如1滴)的病人血清或血液进行。
当然,存在适合采用本发明的多肽的许多其它测定方案。以上描述仅仅是为了例举。
在另一方面,本发明提供了针对发明多肽的抗体。可以通过各种本领域普通技术人员已知的技术的任意一种制备抗体。参见,例如,Harlow和Lane,抗体:实验室手册,冷泉港实验室,1988。在一种这样的技术中,包含抗原性多肽的免疫原起初注射进任何哺乳动物的各种品种(例如,小鼠,大鼠,兔,绵羊以及山羊)。在这一步骤中,本发明的多肽可以不经修饰作为免疫原。此外,特别是对相对比较短的多肽而言,如果多肽连接到载体蛋白(如牛血清白蛋白或匙孔血蓝蛋白)上,则可以激发高级免疫应答。将免疫原注射进动物宿主,优选地是按照掺入一种或多种加强免疫的预定方案注射,并且周期性地使动物放血。然后,对多肽特异性的多克隆抗体可以通过,例如使用连接到合适的固相支持物上的多肽的亲和层析从这样的抗血清纯化。
可以采用例如Kohler和Milstein,欧洲免疫学杂志,6:511-519,1976的技术和其改进的技术制备兴趣抗原性多肽特异性的单克隆抗体。简言之,这些方法包括制备能够产生具有所需特异性(例如,与兴趣多肽的反应性)的抗体的无限增殖细胞系。这样的细胞系可以从例如脾细胞(由按照以上的描述免疫的动物获得的)产生。然后,通过例如与骨髓瘤细胞融合配偶体(优选地是与免疫的动物同系的一种)融合使脾细胞无限增殖化。可以使用各种融合技术。例如,可以将脾细胞和骨髓瘤细胞与非离子去污剂组合在一起几分钟,然后在选择培养基上低密度平板接种,所说的选择培养基支持杂交细胞生长,但不支持骨髓瘤细胞生长。一种优选的选择技术利用HAT(次黄嘌呤,氨基蝶呤,胸苷)选择。在足够的时间(通常约1至2周)之后,观察到杂交体集落。选择单一集落,并试验针对多肽的结合活性。具有高反应性和特异性的杂交瘤是优选的。
单克隆抗体可以从生长的杂交瘤集落上清液分离。此外,各种技术可以用来提高产率,如将杂交瘤细胞系注射进合适的脊椎动物宿主(如小鼠)的腹膜腔。然后可以从腹水液或血液收获单克隆抗体。可以用常规技术从抗体除去污染物,所述技术如层析,凝胶过滤,沉淀和抽提。本发明的多肽可以用于例如,亲和性层析步骤的纯化过程中。
采用类似于以上详细描述的测定法和本领域技术人员已知的其它技术,可以将抗体用于检测结核分枝杆菌抗原存在的诊断试验中,从而提供在病人中检测结核分枝杆菌感染的方法。
本发明的诊断试剂也可以包含编码一种或多种上述多肽的DNA序列,或一种或多种其部分。例如,包含主题DNA序列的至少10个邻接寡核苷酸的引物可以用于以聚合酶链反应(PCR)为基础的试验中。同样地,包含主题DNA序列的至少15个邻接寡核苷酸的探针可以用于与特定序列杂交。基于PCR试验和杂交试验的技术是本领域已知的。这样,引物或者探针可以用于检测生物样品中的结核分枝杆菌感染,所述样品优选地是痰,血液,血清,唾液,脑脊液或者尿。包含以上描述的寡核苷酸序列的DNA探针或引物可以单独使用,相互结合使用,或者与以前鉴别的序列(例如以上讨论的38kD抗原)结合使用。
以说明性的方式但不以限制性的方式给出下列实施例。
实施例
                      实施例1
来源于结核分枝杆菌培养物滤液的多肽的纯化和特征确定
这一例子说明从培养物滤液制备结核分枝杆菌可溶性多肽的方法。除非有其它方式注明,下列例子的所有百分比都是重量/体积百分比。
于37℃在无菌GAS培养基中培养结核分枝杆菌(H37Ra,ATCCNo.25177或H37Rv,ATCC No.25618)14天。然后经0.45μ滤器将培养基真空过滤(留下大批细胞)到无菌的2.5L瓶中。接着经0.2μ滤器将培养基过滤到无菌的4L瓶中。向培养物滤液中加入NaN3,使其浓度达0.04%。然后将瓶置于4℃的冷室中。
通过将滤液置于已高压灭菌的12L贮器中,并将滤液供入400mlAmicon搅拌池中浓缩培养物滤液,该搅拌池已以乙醇冲洗过,并且包含10,000kDa MWCO膜。使用氮气使压力保持在60psi。这一过程使12L体积减少到约50ml。
然后,采用8,000kDa MWCO纤维素酯膜将培养物滤液对0.1%碳酸氢铵透析,两次更换碳酸氢铵溶液。接着由通过商业途径可获得的BCA测定法(Pierce,Rockford,IL)测定蛋白质浓度。
然后将透析培养物滤液进行冻干,把多肽重悬于蒸馏水中。然后,将多肽对0.01mM 1,3双[三(羟甲基)-甲氨基]丙烷,pH7.5(Bis-Tris丙烷缓冲液)(阴离子交换层析的起始条件)透析。利用在POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems,Framingham,MA)上的凝胶预熔融(profusion)层析完成分级分离,所述交换柱已在0.01mMBis-Tris丙烷缓冲液(pH7.5)中平衡过。用在上述缓冲液系统中的0-0.5MNaCl梯度洗脱多肽。在220nm波长下监测柱洗脱液。
将从离子交换柱洗脱的多肽收集物对蒸馏水透析并冻干。将所形成的物质溶解到在水中的0.1%三氟乙酸(TFA)(pH1.9)中,并且在Delta-PakC18柱(Waters,Milford,MA,300埃孔径大小,5微米颗粒大小(3.9×150mm))上纯化该多肽。用从0到60%稀释缓冲液(在乙腈中的0.1%TFA)线性梯度液从柱中洗脱多肽。流速是0.75ml/分钟,在214nm监测HPLC洗脱液。收集包含洗脱的多肽的组分,使单个样品纯度最大。获得约200个纯化的多肽。
然后,就在PBMC制剂中诱导T细胞增殖的能力筛选纯化的多肽。将PBMC(来源于称为PPD皮试阳性的供体,并且其T细胞表现出应答PPD和粗的MTB可溶性蛋白质的增殖)在包含RPMI 1640(补充有10%收集的人血清和50μg/mL庆大霉素)的培养基中培养。双份以0.5至10μg/mL的浓度添加纯化的多肽。96-孔园底平板中以200μl体积培养6天后,从各孔除去50μl培养基,以测定IFN-γ水平,如以下所述。接着用1μCi/孔含氚胸苷脉冲平板另外的18小时,收获,并用气体闪烁计数器测定氚摄取。在两个重复中产生的增殖高于在单独的培养基中培养的细胞上观察到的增殖的3倍的组分被认为是阳性的。
用酶联免疫吸附测定(ELISA)测定IFN-γ。在室温下用在PBS中的针对人类IFN-γ(Chemicon)的小鼠单克隆抗体涂布ELISA平板4小时。然后在室温下用包含5%(WN)脱脂干奶的PBS阻断各孔。接着用PBS/0.2%TWEEN-20洗涤平板6次,将在ELISA平板上的以培养基1∶2稀释的样品在室温下过夜温育。再次洗涤平板,向各孔中添加以PBS/10%正常山羊血清1∶3000稀释的多克隆兔抗-人IFN-γ血清。然后在室温下温育平板两小时,洗涤,加入以PBS/5%脱脂干奶1∶2000稀释的辣根过氧化物酶-偶联的抗-兔IgG(Jackson Labs.)。在室温下进一步温育2小时后,洗涤平板,并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm为参照波长,在450nm测定光密度。在两个重复中导致给出的OD高于在单独的培养基中培养的细胞的平均OD加3个标准偏差的组分被认为是阳性的。
为了测序,将多肽单个地干燥到BiobreneTM(Perkin Elmer/AppliedBioSystems Division,Foster City,CA)处理过的玻璃纤维滤器上。将具有多肽的滤器装到Perkin Elmer/Applied BioSystems Division Procise 492蛋白质测序仪上。从氨基端测序多肽,并且用传统的Edman化学法。通过把PTH氨基酸衍生物的保留时间与适当的PTH衍生物标准比较,确定各多肽的氨基酸序列。
利用以上描述的方法,分离到具有下列N端序列的抗原:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-
   Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.54);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-
   Ser(SEQ ID No.55);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-LeB-Gln-Ala-
   Ala-Lys-Glu-Gly-Arg(SEQ ID No.56);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-
   Pro(SEQ ID No.57);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
   (SEQ ID No.58);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID
   No.59);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-
   Pro-Pro-Ala(SEQ ID No.60);和
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
   Gly(SEQ ID No.61);
其中Xaa可以是任何氨基酸。
除以上所描述的方法之外,通过使用微内径柱HPLC纯化步骤分离到另外的抗原。具体地说,在Aquapore C18柱(Perkin Elmer/AppliedBiosystems Division,Foster City,CA)上纯化包含以上描述的层析纯化步骤的抗原混合物的20μl组分,所说的柱具有7微米孔径大小,柱规格为1mm×100mm,在Perkin Elmer/Applied Biosystems Division 172 HPLC型中。以80μl/分钟的流速,用在水(0.05%TFA)中的乙腈(含0.05%TFA)的1%/分钟的线性梯度液从柱上洗脱各组分。在250nm下监测洗脱液。原组分被分离成4个主要的峰加其他小的组分,并且获得显示出具有12.054Kd分子量(由质谱测得)和具有以下N端序列的多肽:
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-
Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-
Phe-Ala-Asp(SEQ ID No.62)。采用以上所述的测定法,这一多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。
按照以下所述从结核分枝杆菌培养物滤液分离另外的可溶性抗原。结核分枝杆菌培养物滤液按照以上描述的方法制备。在pH 5.5下对Bis-Tris丙烷缓冲液透析后,用在Poros QE柱4.6×100mm(PerseptiveBiosystems)上的阴离子交换层析完成分级分离,所述柱在Bis-Tris丙烷缓冲液(pH 5.5)中平衡过。以10ml/分钟的流速,用在上述缓冲系统中的线性0-1.5M NaCl梯度液洗脱多肽。在214nm下检测柱洗脱液。
收集从离子交换柱洗脱的组分,并采用Poros R2柱4.6×100mm(Perseptive Biosystems)进行反相层析。以5ml/分钟的流速,用0-100%乙腈(0.1%TFA)的线性梯度液从柱上洗脱多肽,在214nm监测洗脱液。
将包含洗脱的多肽的组分冷干,并重悬于80μl 0.1%TFA水溶液中,并再在Vydac C4柱4.6×150mm(Western Analytical,Temecula,CA)上,以2ml/分钟的流速,用0-100%乙腈(0.1%TFA)线性梯度液进行反相层析。在214nm监测洗脱液。
具有生物活性的组分被分离成一个主要的峰加其它小组分。这一峰的PVDF膜上的Western印迹揭示分子量为14Kd,20Kd和26Kd的三个主要带。确定了这些多肽分别具有下列N端序列:
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-
   Ala-Ser;(SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-
   Ala-Asp;(SEQ ID No.130)和
(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-
   Ala-Gly;(SEQ ID No.131),其中Xaa可以是任何氨基酸。采用以上所述的测定法,这些多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。图1A-1B和图1C-1D分别显示了使用第一和第二供体的PBMC制剂进行的这种测定的结果。
通过采用32P末端标记的简并寡核苷酸(相应于N端序列并含有结核分枝杆菌密码子偏倚)筛选结核分枝杆菌基因组文库获得编码以上指定为(a),(c),(d)和(g)的抗原的DNA序列。采用相应于以上抗原(a)的探针进行的筛选鉴别具有SEQ ID No.96所示的序列的克隆。由SEQ ID No.96编码的多肽在SEQ ID No.97中给出。采用相应于以上抗原(g)的探针进行的筛选鉴别具有SEQ ID No.52所示的序列的克隆。由SEQ ID No.52编码的多肽在SEQ ID No.53中给出。采用相应于以上抗原(d)的探针进行的筛选鉴别具有SEQ ID No.24所示的序列的克隆。采用相应于以上抗原(c)的探针进行的筛选鉴别具有SEQ ID No.25所示的序列的克隆。
采用DNA STAR系统,将以上氨基酸序列与基因库中的已知氨基酸序列比较。所检索的数据库含有大约173,000种蛋白质,并且是Swiss,PIR数据库以及翻译的蛋白质序列(版本87)的组合。对抗原(a)-(h)和(l),没有检测到与所说的氨基酸序列的明显的同源性。
发现抗原(i)的氨基酸序列同源于麻风分枝杆菌的序列。利用从GENBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后,将这一序列用于筛选结核分枝杆菌文库,获得全长拷贝的结核分枝杆菌的同系物(SEQ ID No.94)。
发现抗原(j)的氨基酸序列同源于从DNA序列翻译的已知结核分枝杆菌蛋白质。就发明者所知,这一蛋白质以前还没有显示出具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的序列相关。
在以上描述的增殖与IFN-γ测定中,利用三个PPD阳性供体,以上所提供的代表性抗原的结果在表1中给出:
              表    1
    PBMC增殖和IFN-γ测定的结果
    序列     增殖     IFN-γ
    (a)     +     -
    (c)     +++     +++
    (d)     ++     ++
    (g)     +++     +++
    (h)     +++     +++
在表1中,给出2和4之间的刺激指数(SI)的反应(与在单独的培养基培养的细胞比较)记录为+,在1μg或更低的浓度下的4-8或2-4的SI记录为++,大于8的SI记录为+++。发现序列(i)的抗原在增殖和IFN-γ测序两者中,对一种供体具有高的SI(+++),对两种其它供体具有较低的SI(++和+)。这些结果表明这些抗原有能力诱导增殖和/或干扰素-γ产生。
                        实施例2
            使用病人血清分离结核分枝杆菌抗原
这一例子说明通过用结核分枝杆菌感染个体的血清筛选从结核分枝杆菌溶解产物分离抗原的方法。
将干燥的结核分枝杆菌H37Ra(Difco实验室)添加至2%NP40溶液中,此外,匀浆和超声处理三次。在13,000rpm下在微量离心管中离心所形成的悬浮液,将上清液通过0.2微米注射滤器。将滤液结合到Macro PrepDEAE小珠(BioRad,Hercules,CA)上。用20mM Tris(pH7.5)充分洗涤小珠,结合的蛋白质以1M NaCl洗脱。将NaCl洗脱液对10mMTris(pH7.5)透析一夜。在室温下用0.05mg/ml的DNase和RNase处理透析溶液30分钟,然后于室温在pH4.5下用0.5U/mgα-D-甘露糖苷酶处理。在返回到pH7.5后,在Bio Scale-Q-20柱(BioRad)上经FPLC分级分离该物质。将组分合并到九个池中,在Centriprep 10(Amicon,Beverley,MA)中浓缩,并且采用结核分枝杆菌感染病人的血清(其与本发明的其它抗原不发生免疫反应)就血清学活性经Western印迹筛选。
将反应性最强的组分在SDS-PAGE上进行分析,并转移到PVDF上。切下约85Kd的带,产生以下序列:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
   Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),
其中Xaa可以是任何氨基酸。
这些序列与以上描述的基因库中的那些序列的比较揭示出与已知的序列没有明显的同源性。
                         实施例3
          制备编码结核分枝杆菌抗原的DNA序列
这一例子说明通过用从结核分枝杆菌感染病人获得的血清或者用抗结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库,制备编码结核分枝杆菌抗原的DNA序列的方法。
A.用兔抗血清制备结核分枝杆菌可溶性抗原
从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切该DNA,并用于用Lambda ZAP表达系统(Stratagene,La Jolla,CA)构建表达文库。通过用结核分枝杆菌培养物的浓缩上清液免疫兔产生抗结核分枝杆菌菌株H37Ra,H37Rv和Erdman的分泌蛋白质的兔抗血清。具体地说,首先用200μg在含有100μg胞壁酰二肽的2ml总体积中的蛋白质抗原(Calbiochem,La Jolla,CA)和1ml弗氏不完全佐剂皮下免疫兔。四周后,用在弗氏不完全佐剂中的100μg抗原皮下加强免疫兔。最后,在四周后用50μg蛋白质抗原静脉内免疫兔。如Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中的描述将抗血清用于筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,25个代表在结核分枝杆菌中以前没有鉴别过的序列。如Skeiky等,实验医学杂志,181:1527-1537,1995中所述用IPTG诱导蛋白质,并经凝胶洗脱纯化。在这一筛选中鉴别的DNA分子的代表性部分序列在SEQ ID No.1-25中给出。相应的预言的氨基酸序列在SEQ ID No.64-88中给出。
基于采用以上所述的数据库将这些序列与基因库中的已知序列比较,发现下文中称为TbRA2A、TbRA16、TbRA18和TbRA29(SEQ ID No.77、69、71、76)的克隆显示出与以前在麻风分枝杆菌中而不是在结核分枝杆菌中鉴别的序列的某些同源性。TbRA11、TbRA26、TbRA28和TbDPEP(SEQ ID No.66、74、75、53)以前在结核分枝杆菌中已鉴定过。对TbRA1、TbRA3、TbRA4、TbRA9、TbRA10、TbRA13、TbRA17、TbRA19、TbRA29、TbRA32、TbRA36和重叠克隆TbRA35和TbRA12(分别为SEQ ID No.64、78、82、83、65、68、76、72、76、79、81、80、67)没有发现明显的同源性。克隆TbRa24与克隆TbRa29重叠。
B.使用病人血清鉴别编码结核分枝杆菌抗原的DNA序列
采用从患活动性结核病的患者获得的血清库筛选以上描述的基因组DNA文库和另外的H37Rv文库。为了制备H37Rv文库,分离结核分枝杆菌菌株H37Rv基因组的DNA,进行部分Sau3A消化,并用于采用LambdaZap表达系统(Stratagene,La JolIa,Ca)构建表达文库。将三种不同库的血清(各含有从患有活动性肺部或胸膜疾病的个体获得的血清)用于表达筛选。有关在ELISA和免疫印迹方式两者中与H37Ra溶解产物的相对反应性,这些库被指定为TbL、TbM和TbH(即,TbL=低反应性,TbM=中等反应性和TbH=高反应性)。也使用了来自活动性肺结核病的七个患者血清的四个库。所有血清缺乏与重组38kD结核分枝杆菌H37Ra磷酸盐-结合蛋白的增加的反应性。
所有库用大肠杆菌溶解产物预吸附,并用于如Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中所述筛选H37Ra和H37Rv表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,31个代表在人类结核分枝杆菌中以前没有鉴别过的序列。所鉴别的DNA分子的代表性序列在SEQ ID NO.26-51和100中给出。在这些克隆中,TbH-8和TbH-8-2(SEQ ID No.100)是相同克隆的非邻接DNA序列,TbH-4(SEQ ID No.43)和TbH-4-FWD(SEQ ID No.44)是相同克隆的非邻接序列。此后鉴别为Tb38-1、TbH-4、TbH-8、TbH-9、和TbH-12的抗原的氨基酸序列在SEQ ID NO.89-93中显示。利用以上确定的数据库将这些序列与基因库中的已知序列的比较揭示出,对TbH-4、TbH-8、TbH-9和TbM-3没有明显的同源性,虽然对TbH-9发现了弱的同源性。发现TbH-12同源于以前在副结核分枝杆菌(Acc.No.S28515)中鉴定的34kD抗原蛋白质。发现Tb38-1位于以前在牛型分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴别的抗原ESAT-6开放读框上游34个碱基对(Sorensen等,感染免疫学,63:1710-1717,1995)。
将来源于Tb38-1和TbH-9(两者都是从H37Ra文库分离的)的探针用于鉴别H37Rv文库中的克隆。Tb38-1杂交到Tb38-1F2、Tb38-1F3、Tb38-1F5和Tb38-1F6(SEQ ID No.107、108、111、113和114)。SEQID No.107和108是来源于克隆Tb38-1F2的非邻接序列,推定了Tb38-IF2中的两个开放读框;一个相应于Tb37FL(SEQ ID No.109),第二个(部分序列)可以是Tb38-1的同系物,并称为Tb38-IN(SEQ ID No.110)。Tb38-1F3的推定的氨基酸序列在SEQ ID No.112中给出。TbH-9探针鉴别了H37Rv文库中的三个克隆:TDH-9-FL(SEQ ID No.101),其可以是TbH-9(R37Ra)的同系物;TbH-9-1(SEQ ID No.103)和TbH-9-4(SEQID No.105),所有这些都是TbH-9的高度相关序列。这三个克隆的推定的氨基酸序列在SEQ ID No.102、104和106中给出。
                        实施例4
  来源于结核菌素纯化蛋白质衍生物的多肽的纯化和特征确定
按照以下所述从结核菌素纯化蛋白质衍生物(PPD)分离结核分枝杆菌多肽。
按进行某些修改的出版的方法(Seibert,F等,结核菌素纯化蛋白质衍生物。大量制备和分析标准。美国结核病评论44:9-25,1941)制备PPD。
于37℃下在摇瓶中用合成培养基培养结核分枝杆菌Rv菌株6周。然后将含有细菌生长物的瓶子用水蒸汽加热到100℃3小时。用0.22μ滤器无菌过滤培养物,采用3kD截止膜浓缩20倍。用50%硫酸铵溶液沉淀蛋白质一次,用25%硫酸铵溶液沉淀8次。通过反相液相层析(RP-HPLC)分级分离所形成的蛋白质(PPD),所说的层析采用在Biocad HPLC系统(Perseptive Biosystems,Framingham,MA)中的C18柱(7.8×300mM;Waters,Milford,MA)。用0-100%线性梯度缓冲液(在乙腈中的0.1%TFA)从柱中洗脱组分。流速是10ml/分钟,在214nm和280nm下监测洗脱液。
收集六个组分,干燥,悬浮在PBS中,并在结核分枝杆菌感染豚鼠中就诱导迟发型超敏(DTH)反应分别进行试验。发现一个组分诱导强的DTH反应,接着在微内径Vydac C18柱(Cat.No.218TP5115)上进一步经RP-HPLC分级分离,所说的柱在Perkin Elmer/Applied Biosystems Division172 HPLC型中。以5-100%线性梯度缓冲液(在乙腈中的0.05%TFA)洗脱各组分,流速为80μl/分钟。在215nm监测洗脱液。收集八个组分,在结核分枝杆菌感染豚鼠中试验对DTH的诱导。发现一个组分诱导约16mm硬结的强DTH。其它组分不诱导可检测的DTH。将阳性组分进行SDS-PAGE凝胶电泳,发现其含有12kD分子量的一单一蛋白质带。
如以上的描述,用Perkin Elmer/Applied Biosystems Division Procise492蛋白质测序仪从氨基末端对这一多肽(此后称作DPPD)进行测序,发现其具有SEQ ID NO.124中显示的N端序列。这一序列与以上描述的基因库中的已知序列的比较揭示没有已知的同系物。分离到DPPD的四个溴化氰片段,发现其具有SEQ ID NO.125-128中显示的序列。
                           实施例5
                        合成多肽的合成
可以采用由HPTU(O-苯并三唑-N,N,N’,N’-四甲基脲鎓六氟磷酸盐)活化的FMOC化学在Millipore 9050肽合成仪上合成多肽。Gly-Cys-Gly序列可以连接到肽的氨基末端,以提供所述肽的缀合或标记方法。可以采用下列切割混合物从固相支持物上切割肽:三氟乙酸∶乙烷二硫酚∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。在切割两小时后,可以在冷的甲基-叔丁基醚中沉淀所说的肽。然后,肽沉淀可以溶解在含0.1%三氟乙酸(TFA)的水中,并且在经C18反相HPLC纯化之前冷干。在水(含0.1%TFA)中的0-60%乙腈(含0.1%TFA)梯度液可以用于洗脱肽。在纯组分的冷干后,可以采用电喷射质谱测定法和氨基酸分析确定肽的特征。
这一方法用来合成TbM-1肽,该肽含有一个半TbM-1序列的重复单位。TbM-1肽具有序列GCGDRSGGNLDQIRLRRDRSGGNL(SEQ IDNo.63)。
                         实施例6
           代表性抗原在结核病血清学诊断上的用途
这一例子说明几个代表性抗原的诊断学特性。图1和2表示与细菌溶解产物和38kD抗原的反应性比较,代表性抗原与结核分枝杆菌感染和未感染个体血清的反应性。
测定在96-孔平板中完成,所述平板涂布有用碳酸盐涂布缓冲液(pH9.6)稀释成50LL的200ng抗原。在4℃将这些孔涂布过夜(或者在37℃2小时)。然后,除去平板内含物,用200μL PBS/1%BSA封阻各孔2小时。在封阻步骤后,以PBS/0.1%吐温20TM洗涤五次。向各孔中添加以PBS/0.1%吐温20TM/0.1%BSA 1∶100稀释的50μL血清并在室温下温育30分钟。然后用PBS/0.1%吐温20TM再洗涤平板五次。
接着用PBS/0.1%吐温20TM/0.1%BSA 1∶10000稀释酶缀合物(辣根过氧化物酶-蛋白质A,Zymed,San Francisco,CA),将50μL稀释的缀合物添加到各孔中,并在室温下温育30分钟。温育之后,用PBS/0.1%吐温20TM洗涤各孔五次。加入100μL四甲基联苯胺过氧化物酶(TMB)底物(Kirkegaard和Perry实验室,Gaithersburg,MD),不稀释,温育约15分钟。由添加100μL 1N硫酸到各孔中终止反应,用平板在450nm下读数。
图2显示了用实施例3的方法A以来源于结核分枝杆菌阳性和阴性患者的血清分离的两种重组抗原(TbRa3和TbRa9)的ELISA反应性。将这些抗原的反应性与从结核分枝杆菌菌株H37Ra(Difco,底特律,MI)分离的细菌溶解产物的反应性比较。在两种情况下,重组抗原区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbRa3检测87个阳性血清中的56个,TbRa9检测165个阳性血清中的111个。
图3说明采用实施例3的方法B分离的代表性抗原的ELISA反应性。将重组抗原TbH4,TbH12,Tb38-1和肽TbM-1(如在实施例4中所描述的)的反应性与Andersen和Hansen,感染免疫学,57:2481-2488,1989所描述的38kD抗原的反应性比较。使用试验的所有多肽再次区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbH4检测126个阳性血清中的67个,TbH12检测125个阳性血清中的50个,38-1检测101个阳性血清中的61个,TbM-1肽检测30个阳性血清中的25个。
也测定了四种抗原(TbRa3,TbRa9,TbH4和TbH12)与来源于结核分枝杆菌感染患者(在痰的酸快速染色((Smithwick和David,结核,52:226,1971))中具有不同的反应性)组的血清的反应性,并与结核分枝杆菌溶解产物和38kD抗原的反应性比较。结果示于表2中。
                      表2
                   抗原与结核分枝杆菌患者血清的反应性
    患者 痰的酸快速染色                             ELISA值
溶解产物     38kD         TbRa9         TbH12         TbH4          TbRa3
 Tb01B93I-2 ++++ 1.853  0.634   0.998   1.022   1.030   1.314
 Tb01B93I19 ++++ 2.657  2.322   0.608   0.837   1.857   2.335
 Tb01B93I8 +++ 2.703  0.527   0.492   0.281   0.501   2.002
 Tb01B93I-10 +++ 1.665  1.301   0.685   0.216   0.448   0.458
 Tb01B93I-11 +++ 2.817  0.697   0.509   0.301   0.173   2.608
 Tb01B93I-15 +++ 1.28  0.283   0.808   0.218   1.537   0.811
 Tb01B93I-16 +++ 2.908  >3   0.899   0.441   0.593   1.080
 Tb01B93I-25 +++ 0.395  0.131   0.335   0.211   0.107   0.948
 Tb01B93I-87 +++ 2.653  2.432   2.282   0.977   1.221   0.857
 Tb01B93I-89 +++ 1.912  2.370   2.436   0.876   0.520   0.952
 Tb01B94I-108 +++ 1.639  0.341   0.797   0.368   0.654   0.798
 Tb01B94I-201 +++ 1.721  0.419   0.661   0.137   0.064   0.692
 Tb01B93I-88 ++ 1.939  1.269   2.519   1.381   0.214   0.530
 Tb01B93I-92 ++ 2.355  2.329   2.78   0.685   0.997   2.527
 Tb01B94I-109 ++ 0.993  0.620   0.574   0.441   0.5   2.558
 Tb01B94I-210 ++ 2.777  >3   0.393   0.367   1.004   1.315
 Tb01B94I-224 ++ 2.913  0.476   0.251   1.297   1.990   0.256
 Tb01893I-9 + 2.649  0.278   0.210   0.140   0.181   1.586
 Tb01B93I-14 + >3  1.538   0.282   0.291   0.549   2.880
 Tb01B93I-21 + 2.645  0.739   2.499   0.783   0.536   1.770
 Tb01B93I-22 + 0.714  0.451   2.082   0.285   0.269   1.159
 T01B93I-31 + 0.956  0.490   1.019   0.812   0.176   1.293
 Tb01B93I-32 - 2.261  0.786   0.668   0.273   0.535   0.405
    患者  痰的酸快速染色                                  ELISA值
溶解产物      38kD       TbRa9       TbH12       TbH4        TbRa3
 Tb01B93I-52   -  0.658   0.114  0.434  0.330  0.273  1.140
 Tb01B93I-99   -  2.118   0.584  1.62  0.119  0.977  0.729
 Tb01B94I-130   -  1.349   0.224  0.86  0.282  0.383  2.146
 Tb01B94I-131   -  0.685   0.324  1.173  0.059  0.118  1.431
 AT4-0070   正常  0.072   0.043  0.092  0.071  0.040  0.039
 AT4-0105   正常  0.397   0.121  0.118  0.103  0.078  0.390
 3/15/94-1   正常  0.227   0.064  0.098  0.026  0.001  0.228
 4/15/93-2   正常  0.114   0.240  0.071  0.034  0.041  0.264
 5/26/94-4   正常  0.089   0.259  0.096  0.046  0.008  0.053
 5/26/94-3   正常  0.139   0.093  0.085  0.019  0.067  0.01
基于从接受体-操纵物曲线获得的截止值,TbRa3检测27个阳性血清中的23个,TbRa9检测27个中的22个,TbH4检测27个中的18个,TbH12检测27个中的15个。如果组合使用,这四种抗原将具有27中的27个理论敏感性,表明这些抗原在结核分枝杆菌感染的血清学检测中相互补充。此外,几种重组抗原检测采用38kD抗原未被检测到的阳性血清,表明这些抗原可以与38kD抗原互补。
通过如以上描述的ELISA测定了重组抗原TbRall与结核分枝杆菌病人血清(显示出对38kD抗原阴性)以及与PPD阳性和正常供体血清的反应性。结果在图4中显示,这些结果表明,TbRal1(尽管用PPD阳性和正常供体血清为阴性)检测用38kD抗原为阴性的血清。在所试验的13个38kD阴性的血清中,9个用TbRal1为阳性,表明这一抗原可以与38kD抗原阴性血清亚组反应。相反,在38kD阳性血清组(此时TbRall是反应性的)中,TbRall的平均OD 450低于38kD抗原的。数据表明TbRall活性的存在和38kD阳性之间的反向关系。
在间接ELISA中试验抗原TbRa2A,其中首先在室温下使用1∶100稀释的50μL血清30分钟,接着用PBS吐温洗涤,并与1∶10,000稀释的生物素酰化的蛋白质A(Zymed,San Francisco,CA)一起温育30分钟。洗涤后,加入1∶10,000稀释的50μL抗生蛋白链菌素-辣根过氧化物酶(Zymed),将混合物温育30分钟。在洗涤之后,如以上描述用TMB底物进行测定。TbRa2A与来源于结核分枝杆菌患者和正常供体的血清的反应性示于表3中。TbRa2A与结核分枝杆菌患者之血清的反应性的平均值是0.444(具有0.309的标准偏差)。与正常供体之血清的反应性的平均值是0.109(具有0.029的标准偏差)。38kD阴性血清的试验(图5)也表明TbRa2A抗原能够检测这一类别的血清。
                 表    3TbRa2A与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性
    血清ID   Status     OD450
    Tb85   TB     0.680
    Tb86   TB     0.450
    Tb87   TB     0.263
    Tb88   TB     0.275
    Tb89   TB     0.403
    Tb91   TB     0.393
    Tb92   TB     0.401
    Tb93   TB     0.232
    Tb94   TB     0.333
    Tb95   TB     0.435
    Tb96   TB     0.284
    Tb97   TB     0.320
    Tb99   TB     0.328
    Tb100   TB     0.817
    Tb101   TB     0.607
    Tb102   TB     0.191
    Tb103   TB     0.228
    Tb107   TB     0.324
    Tb109   TB     1.572
    Tb112   TB     0.338
 DL4-0176   正常     0.036
 AT4-0043   正常     0.126
 AT4-0044   正常     0.130
 AT4-0052   正常     0.135
 AT4-0053   正常     0.133
 AT4-0062   正常     0.128
 AT4-0070   正常     0.088
  AT4-0091   正常     0.108
  AT4-0100   正常     0.106
  AT4-0105   正常     0.108
  AT4-0109   正常     0.105
通过如以上描述的ELISA测定重组抗原(g)(SEQ ID No.60)与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性。图6显示了抗原(g)以四种结核分枝杆菌阳性血清(均是与38kD抗原反应性的)和与四种供体血清的滴定结果。所有四种阳性血清均是与抗原(g)反应性的。
从以上所述可以清楚看到,虽然为说明的目的,本文描述了本发明的特定的实施方案,但是可以进行各种修改而不背离本发明的精神和范围。
                        序列表
(1)一般信息:
  (i)申请人:Corixa公司
  (ii)发明名称:用于结核病诊断的化合物和方法
  (ii)序列数:132个
  (iv)通讯地址:
    (A)收信人:SEED和BERRY LLP
    (B)街道:6300哥伦比亚中心,第五大街701号
    (C)城市:Seattle
    (D)州:华盛顿
    (E)国家:美国
    (F)ZIP:98104-7092
  (v)计算机可读形式:
    (A)介质类型:软盘
    (B)计算机:IBM PC兼容机
    (C)操作系统:PC-DOS/MS-DOS
    (D)软件:PatentIn Release#1.0,版本#1.30
  (vi)当前申请的数据:
    (A)申请号:
    (B)申请日:1996-8-27
    (C)分类号:
  (viii)律师/代理人信息:
    (A)姓名:Maki,David J.
    (B)登记号:31.392
    (C)证书号:210121.417PC
  (ix)电讯信息:
    (A)电话:(206)622-4900
    (B)传真:(206)682-6031
(2)SEQ ID NO:1的信息:
  (i)序列特征:
    (A)长度:766个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:1:
CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA           60
ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC          120
GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG          180
GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC          240
GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG          300
GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG          360
AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG          420
GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG          480
GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG          540
ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA          600
GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG          660
GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC          720
GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA                         766
(2)SEQ ID NO:2的信息:
  (i)序列特征:
    (A)长度:752个碱基对
    (B)类型:核酸
  (C)链型:单链
  (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:2:
ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA           60
GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG          120
GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG          180
TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA          240
TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA          300
TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT          360
TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG          420
ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA          480
GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT          540
CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC          600
CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN          660
TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA          720
TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT                                        752
(2)SEQ ID NO:3的信息:
  (i)序列特征:
    (A)长度:813个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:3:
CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA          60
CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG         120
CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT         180
GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC         240
ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG         300
ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC         360
GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG         420
GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA         480
CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG         540
CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG         600
ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG         660
CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT         720
GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG         780
TGAAATTATC ACAACTTCGC AGTCACNAAA NAA                                      813
(2)SEQ ID NO:4的信息:
  (i)序列特征:
    (A)长度:447个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:4:
CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC          60
CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC         120
CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA         180
CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC         240
CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA         300
CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG         360
CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG         420
ATACCACCCG CCGGCCGGCC AATTGGA                                             447
(2)SEQ ID NO:5的信息:
  (i)序列特征:
    (A)长度:604个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:5:
GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT          60
CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT         120
AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC         180
CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG         240
ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA         300
TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG         360
NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG         420
NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA         480
NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT         540
NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT         600
NAAT                                                                      604
(2)SEQ ID NO:6的信息:
  (i)序列特征:
    (A)长度:633个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:6:
TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC          60
CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC         120
TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA         180
CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA         240
CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC         300
ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG         360
GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG         420
CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT         480
GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC         540
CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG         600
CCTGACCGGC GACTACCTGT CCGTGACCGA CGC                                      633
(2)SEQ ID NO:7的信息:
  (i)序列特征:
    (A)长度:1362个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:7:
CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT          60
CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG         120
CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC         180
CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG         240
GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC         300
GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG         360
CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC         420
GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA         480
CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC         540
CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG         600
CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG         660
GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG         720
GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG         780
GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG         840
TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG         900
CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG        960
GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT       1020
GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC       1080
GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG       1140
TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT       1200
GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT       1260
GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA       1320
GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA                          1362
(2)SEQ ID NO:8的信息:
  (i)序列特征:
    (A)长度:1458个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:8:
GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG          60
GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC         120
TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG         180
CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC         240
TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC         300
TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT         360
CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT         420
CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC         480
CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC         540
GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG         600
CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG         660
CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT         720
CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC         780
ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC         840
TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC         900
TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG         960
ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT        1020
GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC        1080
GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG        1140
TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG        1200
CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG        1260
CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC        1320
GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC        1380
CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT        1440
CCGTCGCTCC GACGGGCA                                                      1458
(2)SEQ ID NO:9的信息:
  (i)序列特征:
    (A)长度:862个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:9:
ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC          60
GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG         120
TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT         180
CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG         240
AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG         300
CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG         360
TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG         480
CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT         540
CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT         600
GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA         660
CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA         720
ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC         780
CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT         840
GACAACCCCT CGCCTCGTGC CG                                                  862
(2)SEQ ID NO:10的信息:
  (i)序列特征:
    (A)长度:622个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:10:
TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA          60
GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA         120
GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG         180
TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT         240
CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG         300
TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT         360
TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG         420
ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG         480
TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG         540
GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC         600
CGGAAGCCAC CCGNGACATT CT                                                  622
(2)SEQ ID NO:11的信息:
  (i)序列特征:
    (A)长度:1200个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:11:
GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC           60
ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG          120
AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT          180
GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC          240
GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT         300
CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG         360
CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT         420
CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA         480
CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC         540
CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC         600
GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC         660
GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG         720
TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG         780
GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG         840
GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC         900
TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG         960
ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG        1020
GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG        1080
AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA        1140
GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG        1200
(2)SEQ ID NO:12的信息:
  (i)序列特征:
    (A)长度:1155个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:12:
GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA         60
AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC        120
CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG        180
GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG        240
CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG        300
ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA        360
CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC        420
TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG        480
GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG        540
GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG        600
AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC        660
GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC        720
GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG        780
CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG        840
TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG        900
AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA        960
AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA       1020
GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT       1080
TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT       1140
CGAGTAGCCT CGTCA                                                         1155
(2)SEQ ID NO:13的信息:
  (i)序列特征:
    (A)长度:1771个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:13:
GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT          60
TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC         120
ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC         180
GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC         240
ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA         300
ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT         360
GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG         420
GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC         480
GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA         540
CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC         600
GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT         660
CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT         720
CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC         780
AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT         840
GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT         900
CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA         960
GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC        1020
ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG        1080
CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC        1140
GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG        1200
CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA        1260
CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT        1320
GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA        1380
TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT        1440
CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC        1500
CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC        1560
GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG        1620
CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC        1680
CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA        1740
GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C                                       1771
(2)SEQ ID NO:14的信息:
  (i)序列特征:
    (A)长度:1058个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:14:
CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC          60
ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT         120
AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC         180
CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG         240
ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA         300
TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG         360
CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG         420
TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA         480
CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC         540
TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT         600
GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA         660
AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC         720
TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG         780
GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT         840
CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC         900
AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC         960
TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC        1020
GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC                                1058
(2)SEQ ID NO:15的信息:
  (i)序列特征:
    (A)长度:542个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:15:
GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC          60
GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT         120
CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA         180
AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA         240
AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG         300
GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG         360
CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA         420
CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA         480
AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC         540
GG                                                                        542
(2)SEQ ID NO:16的信息:
  (i)序列特征:
    (A)长度:913个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:16:
CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC         60
CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC        120
TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC         180
GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC         240
CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG         300
CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC         360
GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC         420
GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG         480
CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT         540
TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG         600
CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC         660
CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT         720
TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC         780
CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT         840
TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC         900
CGCCGGCGGC CGC                                                            913
(2)SEQ ID NO:17的信息:
  (i)序列特征:
    (A)长度:1872个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:17:
GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA       60
TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG         120
GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA         180
GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA         240
CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG         300
CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT         360
GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG         420
CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA         480
GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA         540
GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG         600
CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA         660
GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC         720
CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA         780
GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG         840
CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG         900
CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC         960
TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC        1020
GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT        1080
CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA        1140
GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC        1200
CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA        1260
GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA        1320
GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC        1380
GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC        1440
GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG        1500
TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC        1560
GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC        1620
GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG        1680
AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG        1740
TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC        1800
TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG        1860
GCACCGATTC TT                                                            1872
(2)SEQ ID NO:18的信息:
  (i)序列特征:
    (A)长度:1482个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:18:
CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC          60
CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC         120
ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG         180
TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG         240
GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA         300
ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA         360
CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA         420
TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG         480
GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG         540
TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG         600
AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG         660
AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA         720
GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG         780
CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG         840
CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG         900
AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG         960
AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG        1020
AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG        1080
GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC        1140
GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA       1200
CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG       1260
TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG       1320
GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG       1380
GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG       1440
GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT                          1482
(2)SEQ ID NO:19的信息:
  (i)序列特征:
    (A)长度:876个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:19:
GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT          60
CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA         120
CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT         180
CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC         240
GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC         300
GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA         360
GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG         420
GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG         480
TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA         540
TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT         600
CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC         660
ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG         720
TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG         780
TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG         840
ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT                                   876
(2)SEQ ID NO:20的信息:
  (i)序列特征:
    (A)长度:1021个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:20:
ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA          60
CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC         120
AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC         180
CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC         240
GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT         300
CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC         360
GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC         420
TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG         480
AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC         540
GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT         600
TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC         660
CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA         720
GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG         780
GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC         840
AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA         900
CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG         960
GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG        1020
T                                                                        1021
(2)SEQ ID NO:21的信息:
  (i)序列特征:
    (A)长度:321个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:21:
CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG          60
ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN         120
CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA         180
TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT         240
CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG         300
GGNGNGNATC GNCGANCACA A                                                   321
(2)SEQ ID NO:22的信息:
  (i)序列特征:
    (A)长度:373个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:22:
TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC          60
CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC         120
CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG         180
ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG         240
GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC         300
GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA         360
CTTACCATCG CCG                                                            373
(2)SEQ ID NO:23的信息:
  (i)序列特征:
    (A)长度:352个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:23:
GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC          60
TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT         120
TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC         180
TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG         240
GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT         300
TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA                 352
(2)SEQ ID NO:24的信息:
  (i)序列特征:
    (A)长度:726个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:24:
GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC          60
GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC         120
CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT         180
GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG         240
GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC         300
CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC         360
GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG         420
TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT         480
CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA         540
CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG         600
AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC         660
GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG         720
ATCGTG                                             726
(2)SEQ ID NO:25的信息:
  (i)序列特征:
    (A)长度:580个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:25:
CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT          60
GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG         120
CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA         180
ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT         240
GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG         300
AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG         360
AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC         420
TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC         480
AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC         540
TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT                               580
(2)SEQ ID NO:26的信息:
  (i)序列特征:
    (A)长度:160个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:26:
AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC     60
GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC    120
GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG                          160
(2)SEQ ID NO:27的信息:
  (i)序列特征:
    (A)长度:272个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:27:
GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC     60
CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC    120
AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT    180
GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC    240
GCCTACGAGC GCAACGTACA GACCAACGCC CG                                  272
(2)SEQ ID NO:28的信息:
  (i)序列特征:
    (A)长度:317个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:28:
GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA          60
AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG         120
CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC         180
GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC         240
GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG         300
CGGCCTGGTT GCGCGGG                                                        317
(2)SEQ ID NO:29的信息:
  (i)序列特征:
    (A)长度:182个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:29:
GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA           60
GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC          120
CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT          180
GG                                                                         182
(2)SEQ ID NO:30的信息:
  (i)序列特征:
    (A)长度:308个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:30:
GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT          60
CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA         120
GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT         180
GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT         240
CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC         300
ACGTTTGG                                                                  308
(2)SEQ ID NO:31的信息:
  (i)序列特征:
    (A)长度:267个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:31:
CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC           60
CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT          120
GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG          180
ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG          240
TCGACGCGGC AATCCAGGGC GGTCTGG                                              267
(2)SEQ ID NO:32的信息:
  (i)序列特征:
    (A)长度:189个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:32:
CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA           60
TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG          120
CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG          180
ACGGAGCGG                                                                  189
(2)SEQ ID NO:33的信息:
  (i)序列特征:
    (A)长度:851个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:33:
CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT           60
CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT          120
CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC          180
CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC          240
GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA          300
GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC          360
CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT          420
GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT          480
CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT          540
GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC          600
GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC         660
GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG         720
GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG         780
GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG         840
GAAACAGTTA C                                                              851
(2)SEQ ID NO:34的信息:
  (i)序列特征:
    (A)长度:254个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:34:
GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC           60
CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG          120
CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC          180
CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC          240
GCTTGGTCAA GATC                                                            254
(2)SEQ ID NO:35的信息:
  (i)序列特征:
    (A)长度:408个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:35:
CGGCACGAGG ATCCTGACCG AAGCGGCCGC CGCCAAGGCG AAGTCGCTGT TGGACCAGGA           60
GGGACGGGAC GATCTGGCGC TGCGGATCGC GGTTCAGCCG GGGGGGTGCG CTGGATTGCG          120
CTATAACCTT TTCTTCGACG ACCGGACGCT GGATGGTGAC CAAACCGCGG AGTTCGGTGG          180
TGTCAGGTTG ATCGTGGACC GGATGAGCGC GCCGTATGTG GAAGGCGCGT CGATCGATTT          240
CGTCGACACT ATTGAGAAGC AAGGNTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG          300
CGCGTGCGGG GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG          360
TACGAGCACA CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATG                       408
(2)SEQ ID NO:36的信息:
  (i)序列特征:
    (A)长度:181个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:36:
GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG           60
GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG          120
GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG          180
G                                                                          181
(2)SEQ ID NO:37的信息:
  (i)序列特征:
    (A)长度:290个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:37:
GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG          60
GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG         120
GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG         180
CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG         240
GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC                    290
(2)SEQ ID NO:38的信息:
  (i)序列特征:
    (A)长度:34个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:38:
GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT                                      34
(2)SEQ ID NO:39的信息:
  (i)序列特征:
    (A)长度:155个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:39:
GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC    60
TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG   120
TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG                                   155
(2)SEQ ID NO:40的信息:
  (i)序列特征:
    (A)长度:53个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:40:
ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG              53
(2)SEQ ID NO:41的信息:
  (i)序列特征:
    (A)长度:132个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:41:
GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG     60
GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA    120
AGGGCGGCAA CG                                                        132
(2)SEQ ID NO:42的信息:
  (i)序列特征:
    (A)长度:132个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:42:
GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA     60
CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG    120
GCANCGGCGG CA                                                        132
(2)SEQ ID NO:43的信息:
  (i)序列特征:
    (A)长度:702个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:43:
CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC          60
CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC         120
ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT         180
AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG         240
AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC         300
CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG         360
CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT         420
CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG         480
ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT         540
CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC         600
TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG         660
GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG                            702
(2)SEQ ID NO:44的信息:
  (i)序列特征:
    (A)长度:298个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:44:
GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA          60
GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG         120
CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG         180
CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC         240
AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG           298
(2)SEQ ID NO:45的信息:
  (i)序列特征:
    (A)长度:1058个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:45:
CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG          60
CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG         120
GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC         180
TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT         240
TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC         300
CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA         360
AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG         420
CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT         480
TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA         540
CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT         600
ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG         660
CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT         720
ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG         780
CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA         840
CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG         900
GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG         960
GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA        1020
GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC                                1058
(2)SEQ ID NO:46的信息:
  (i)序列特征:
    (A)长度:327个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:46:
CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT       60
CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC      120
AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG         180
CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC         240
AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC         300
CCGCTAATAC GAAAAGAAAC GGAGCAA                                             327
(2)SEQ ID NO:47的信息:
  (i)序列特征:
    (A)长度:170个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:47:
CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA         60
CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT        120
TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG                   170
(2)SEQ ID NO:48的信息:
  (i)序列特征:
    (A)长度:127个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:48:
GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG          60
CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG         120
GGGCCGT                                                                   127
(2)SEQ ID NO:49的信息:
  (i)序列特征:
    (A)长度:81个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:49:
CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA    60
CGGCGGCTCC GGCCTCAACG G                                              81
(2)SEQ ID NO:50的信息:
  (i)序列特征:
    (A)长度:149个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:50:
GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG          60
GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG         120
GAAACGGTGG TGCCGGTGGG CTGATCTGG                                           149
(2)SEQ ID NO:51的信息:
  (i)序列特征:
    (A)长度:355个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:51:
CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG       60
ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT         120
TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA         180
CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA         240
GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG         300
ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG              255
(2)SEQ ID NO:52的信息:
  (i)序列特征:
    (A)长度:999个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:52:
ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA          60
CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG         120
CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG         180
CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG         240
GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC         300
GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC         360
GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC         420
GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC         480
GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG         540
CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG         600
GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC         660
GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG         720
CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC         780
GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG         840
GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG         900
GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC         960
CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA                                999
(2)SEQ ID NO:53的信息:
  (i)序列特征:
    (A)长度:332个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:53:
Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr
1               5                   10                  15
Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser
            20                  25                  30
Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro
        35                  40                  45
Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr
    50                  55                  60
Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro
65                  70                  75                  80
Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala
                85                  90                  95
Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro
            100                 105                 110
Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser
        115                 120                 125
Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp
    130                 135                 140
Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro
145                 150                 155                 160
Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg
                165                 170                 175
Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala
            180                 185                 190
Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro
        195                 200                 205
Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val
    210                 215                 220
Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys
225                 230                 235                 240
Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn
                245                 250                 255
Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly
            260                 265                 270
Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu
        275                 280                 285
Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro
    290                 295                 300
Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr
305                 310                 315                 320
Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala
                325                 330
(2)SEQ ID NO:54的信息:
  (i)序列特征:
    (A)长度:20个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:54:
Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val
1               5                   10                  15
Val Ala Ala Leu
            20
(2)SEQ ID NO:55的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:55:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser
1               5                   10                  15
(2)SEQ ID NO:56的信息:
  (i)序列特征:
    (A)长度:19个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:56:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys
1               5                   10                  15
Glu Gly Arg
(2)SEQ ID NO:57的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:57:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro
1               5                   10                  15
(2)SEQ ID NO:58的信息:
  (i)序列特征:
    (A)长度:14个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:58:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val
1               5                   10
(2)SEQ ID NO:59的信息:
  (i)序列特征:
    (A)长度:13个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:59:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro
1               5                   10
(2)SEQ ID NO:60的信息:
  (i)序列特征:
    (A)长度:17个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:60:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro
1               5                   10                  15
Ala
(2)SEQ ID NO:61的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:61:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly
1               5                   10                  15
(2)SEQ ID NO:62的信息:
  (i)序列特征:
    (A)长度:30个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:62:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser
1               5                   10                  15
Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp
            20                  25                  30
(2)SEQ ID NO:63的信息:
  (i)序列特征:
    (A)长度:24个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:63:
Gly Cys Gly Asp Arg Ser Gly Gly Asn Leu Asp Gln Ile Arg Leu Arg
1               5                   10                  15
Arg Asp Arg Ser Gly Gly Asn Leu
            20
(2)SEQ ID NO:64的信息:
  (i)序列特征:
    (A)长度:187个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:64:
Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys
1               5                   10                  15
Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala
            20                  25                  30
Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala
        35                  40                  45
Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro
    50                  55                  60
Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln
65                  70                  75                  80
Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala
                85                  90                  95
Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg
            100                 105                 110
Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro
        115                 120                 125
Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala
    130                 135                 140
Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr
145                 150                 155                 160
Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala
                165                 170                 175
Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa
            180                 185
(2)SEQ ID NO:65的信息:
  (i)序列特征:
    (A)长度:148个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:65:
Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu
1               5                   10                  15
Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser
            20                  25                  30
Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg
        35                  40                  45
Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser
    50                  55                  60
Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val
65                  70                  75                  80
Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val
                85                  90                  95
Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val
            100                 105                 110
Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu
        115                 120                 125
Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser
    130                 135                 140
Thr Gly Gly Pro
145
(2)SEQ ID NO:66的信息:
  (i)序列特征:
    (A)长度:230个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:66:
Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr
1               5                   10                  15
Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln
            20                  25                  30
Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser
        35                  40                  45
Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn
    50                  55                  60
Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu
65                  70                  75                  80
Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu
                85                  90                  95
Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser
            100                 105                 110
Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp
        115                 120                 125
Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu
    130                 135                 140
Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn
145                 150                 155                 160
Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln
                165                 170                 175
Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr
            180                 185                 190
Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile
        195                 200                 205
Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val
    210                 215                 220
Phe Pro Ile Val Ala Arg
225                 230
(2)SEQ ID NO:67的信息:
  (i)序列特征:
    (A)长度:132个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:67:
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1               5                   10                  15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser
            20                  25                  30
Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly
        35                  40                  45
Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val
    50                  55                  60
Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val
65                  70                  75                  80
Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala
                85                  90                  95
Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp
            100                 105                 110
Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu
        115                 120                 125
Gly Pro Pro Ala
    130
(2)SEQ ID NO:68的信息:
  (i)序列特征:
    (A)长度:100个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:68:
Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala
1               5                   10                  15
Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro
            20                  25                  30
Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly
        35                  40                  45
Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa
    50                  55                  60
Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val
65                  70                  75                  80
Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly
                85                  90                  95
Ser Glu Arg Lys
            100
(2)SEQ ID NO:69的信息:
  (i)序列特征:
    (A)长度:163个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:69:
Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr
1               5                   10                  15
Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu
            20                  25                  30
Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp
        35                  40                  45
Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly
    50                  55                  60
Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu
65                  70                  75                  80
Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg
                85                  90                  95
Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro
            100                 105                 110
Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly
        115                 120                 125
Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg
    130                 135                 140
His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg
145                 150                 155                 160
Asp Arg Arg
(2)SEQ ID NO:70的信息:
  (i)序列特征:
    (A)长度:344个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:70:
Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly
1               5                   10                  15
Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg
            20                  25                  30
Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr
        35                  40                  45
Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro
    50                  55                  60
Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg
65                  70                  75                  80
Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly
                85                  90                  95
Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala
            100                 105                 110
Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr
        115                 120                 125
Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr
    130                 135                 140
Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val
145                 150                 155                 160
Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu
                165                 170                 175
Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu
            180                 185                 190
His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro
        195                 200                 205
Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe
    210                 215                 220
Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro
225                 230                 235                 240
Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro
                245                 250                 255
Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro
            260                 265                 270
Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala
        275                 280                 285
Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu
    290                 295                 300
Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr
305                 310                 315                 320
Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln
                325                 330                 335
Val Ser Arg Gln Asn Pro Thr Gly
            340
(2)SEQ ID NO:71的信息:
  (i)序列特征:
    (A)长度:485个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:71:
Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala
1               5                   10                  15
Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu
            20                  25                  30
Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile
        35                  40                  45
Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu
    50                  55                  60
Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu
65                  70                  75                  80
Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser
                85                  90                  95
Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu
            100                 105                 110
Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala
        115                 120                 125
Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met
    130                 135                 140
Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro
145                 150                 155                 160
Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala
                165                 170                 175
Glu Leu Gly Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu
            180                 185                 190
Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly
        195                 200                 205
Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser
    210                 215                 220
Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser
225                 230                 235                 240
His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser
                245                 250                 255
Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu
            260                 265                 270
Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr
        275                 280                 285
Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile
    290                 295                 300
Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp
305                 310                 315                 320
Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala
                325                 330                 335
Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn
            340                 345                 350
Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp
        355                 360                 365
Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp
    370                 375                 380
Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala
385                 390                 395                 400
Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu
                405                 410                 415
Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg
            420                 425                 430
Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala
        435                 440                 445
Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp
    450                 455                 460
Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser
465                 470                 475                 480
Val Ala Pro Thr Gly
                485
(2)SEQ ID NO:72的信息:
  (i)序列特征:
    (A)长度:267个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:72:
Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu
1               5                   10                  15
Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val
            20                  25                  30
Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala
        35                  40                  45
Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His
    50                  55                  60
Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu
65                  70                  75                  80
Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro
                85                  90                  95
Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp
            100                 105                 110
Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro
        115                 120                 125
Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn
    130                 135                 140
Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala
145                 150                 155                 160
Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp
                165                 170                 175
Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu
            180                 185                 190
Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg
        195                 200                 205
Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val
    210                 215                 220
Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn
225                 230                 235                 240
Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln
                245                 250                 255
Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly
            260                 265
(2)SEQ ID NO:73的信息:
  (i)序列特征:
    (A)长度:97个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:73:
Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val
1               5                   10                  15
Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala
            20                  25                  30
Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr
        35                  40                  45
Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala
    50                  55                  60
Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp
65                  70                  75                  80
Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu
                85                  90                  95
Gln
(2)SEQ ID NO:74的信息:
  (i)序列特征:
    (A)长度:364个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:74:
Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala
1               5                   10                  15
Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser
            20                  25                  30
Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser
        35                  40                  45
Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg
    50                  55                  60
Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala
65                  70                  75                  80
Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp
                85                  90                  95
Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg
            100                 105                 110
Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala
        115                 120                 125
Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro
    130                 135                 140
Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro
145                 150                 155                 160
Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile
                165                 170                 175
Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln
            180                 185                 190
Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser
        195                 200                 205
Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly
    210                 215                 220
Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu
225                 230                 235                 240
Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr
                245                 250                 255
Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys
            260                 265                 270
Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu
        275                 280                 285
Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile
    290                 295                 300
Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr
305                 310                 315                 320
Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly
                325                 330                 335
Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe
            340                 345                 350
Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser
        355                 360
(2)SEQ ID NO:75的信息:
  (i)序列特征:
    (A)长度:309个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:75:
Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp
1               5                   10                  15
Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val
            20                  25                  30
Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro
        35                  40                  45
Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser
    50                  55                  60
Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg
65                  70                  75                  80
Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro
                85                  90                  95
Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg
            100                 105                 110
Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp
        115                 120                 125
Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val
    130                 135                 140
Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg
145                 150                 155                 160
Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly
                165                 170                 175
Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala
            180                 185                 190
Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val
        195                 200                 205
Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg
    210                 215                 220
Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro
225                 230                 235                 240
Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg
                245                 250                 255
Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His
            260                 265                 270
His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr
        275                 280                 285
Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg
    290                 295                 300
Asn Arg Pro Arg Arg
305
(2)SEQ ID NO:76的信息:
  (i)序列特征:
    (A)长度:580个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:76:
Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly
1               5                   10                  15
Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys
            20                  25                  20
Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala
        35                  40                  45
Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys
    50                  55                  60
Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr
65                  70                  75                  80
Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser
                85                  90                  95
Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His
            100                 105                 110
Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln
        115                 120                 125
Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro
    130                 135                 140
Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr
145                 150                 155                 160
Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln
                165                 170                 175
Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro
            180                 185                 190
Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met
        195                 200                 205
Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr
    210                 215                 220
Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val
225                 230                 235                 240
Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala
                245                 250                 255
Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val
            260                 265                 270
Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr
        275                 280                 285
Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala
    290                 295                 300
Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys
305                 310                 315                 320
Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp
                325                 330                 335
Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp
            340                 345                 350
Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser
        355                 360                 365
Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile
    370                 375                 380
Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser
385                 390                 395                 400
Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn
                405                 410                 415
Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn
            420                 425                 430
Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn
        435                 440                 445
Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly
    450                 455                 460
Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile
465                 470                 475                 480
Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly
                485                 490                 495
Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu
            500                 505                 510
Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val
        515                 520                 525
Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu
    530                 535                 540
Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr
545                 550                 555                 560
Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly
                565                 570                 575
Lys Ala Glu Gln
            580
(2)SEQ ID NO:77的信息:
  (i)序列特征:
    (A)长度:233个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:77:
Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu
1               5                   10                  15
Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro
            20                  25                  30
Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro
        35                  40                  45
Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu
    50                  55                  60
Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu
65                  70                  75                  80
Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala
                85                  90                  95
Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg
            100                 105                 110
Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn
        115                 120                 125
Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala
    130                 135                 140
Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln
145                 150                 155                 160
Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr
                165                 170                 175
Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala
            180                 185                 190
Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val
        195                 200                 205
Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser
    210                 215                 220
Lys Trp Asn Glu Pro Val Asn Val Asp
225                 230
(2)SEQ ID NO:78的信息:
  (i)序列特征:
    (A)长度:66个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:78:
Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala
1               5                   10                  15
Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val
            20                  25                  30
Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile
        35                  40                  45
Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln
    50                  55                  60
Pro Arg
65
(2)SEQ ID NO:79的信息:
  (i)序列特征:
    (A)长度:69个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:79:
Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser
1               5                   10                  15
Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala
            20                  25                  30
Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro
        35                  40                  45
Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro
    50                  55                  60
Ser Pro Pro Leu Pro
65
(2)SEQ ID NO:80的信息:
  (i)序列特征:
    (A)长度:355个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:80:
Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser
1               5                   10                  15
Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala
            20                  25                  30
Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu
        35                  40                  45
Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val
    50                  55                  60
Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr
65                  70                  75                  80
Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val
                85                  90                  95
Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln
            100                 105                 110
Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala
        115                 120                 125
Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly
    130                 135                 140
Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly
145                 150                 155                 160
Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu
                165                 170                 175
Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr
            180                 185                 190
Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser
        195                 200                 205
Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr
    210                 215                 220
Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala
225                 230                 235                 240
Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly
                245                 250                 255
Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu
            260                 265                 270
Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val
        275                 280                 285
Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile
    290                 295                 300
Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp
305                 310                 315                 320
Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln
                325                 330                 335
Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly
            340                 345                 350
Pro Pro Ala
        355
(2)SEQ ID NO:81的信息:
  (i)序列特征:
    (A)长度:205个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:81:
Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr
1               5                   10                  15
Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala
            20                  25                  30
Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys
        35                  40                  45
Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala
    50                  55                  60
Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly
65                  70                  75                  80
Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp
                85                  90                  95
Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val
            100                 105                 110
Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn
        115                 120                 125
Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys
    130                 135                 140
Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly
145                 150                 155                 160
Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser
                165                 170                 175
His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln
            180                 185                 190
Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp
        195                 200                 205
(2)SEQ ID NO:82的信息:
  (i)序列特征:
    (A)长度:286个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:82:
Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val
1               5                   10                  15
Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln
            20                  25                  30
His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val
        35                  40                  45
Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu
    50                  55                  60
Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe
65                  70                  75                  80
Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu
                85                  90                  95
Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala
            100                 105                 110
Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val
        115                 120                 125
Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp
    130                 135                 140
Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn
145                 150                 155                 160
Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg
                165                 170                 175
Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly
            180                 185                 190
Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile
        195                 200                 205
Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe
    210                 215                 220
Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp
225                 230                 235                 240
Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg
                245                 250                 255
Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln
            260                 265                 270
Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys
        275                 280                 285
(2)SEQ ID NO:83的信息:
  (i)序列特征:
    (A)长度:173个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:83:
Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr
1               5                   10                  15
Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp
            20                  25                  30
Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg
        35                  40                  45
Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg
    50                  55                  60
Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro
65                  70                  75                  80
Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp
                85                  90                  95
Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu
            100                 105                 110
Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val
        115                 120                 125
Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn
    130                 135                 140
Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro
145                 150                 155                 160
Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu
                165                 170
(2)SEQ ID NO:84的信息:
  (i)序列特征:
    (A)长度:107个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:84:
Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile
1               5                   10                  15
Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly
            20                  25                  30
Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro
        35                  40                  45
Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa
    50                  55                  60
Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp
65                  70                  75                  80
Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile
                85                  90                  95
Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln
            100                 105
(2)SEQ ID NO:85的信息:
  (i)序列特征:
    (A)长度:125个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:85:
Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn
1               5                   10                  15
Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr
            20                  25                  30
Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly
        35                  40                  45
Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr
    50                  55                  60
Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr
65                  70                  75                  80
Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu
                85                  90                  95
Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr
            100                 105                 110
Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg
        115                 120                 125
(2)SEQ ID NO:86的信息:
  (i)序列特征:
    (A)长度:117个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:86:
Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val
1               5                   10                  15
Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala
            20                  25                  30
Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu
        35                  40                  45
Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala
    50                  55                  60
Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp
65                  70                  75                  80
Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu
                85                  90                  95
Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa
            100                 105                 110
Arg Ser Ser Xaa Gly
        115
(2)SEQ ID NO:87的信息:
  (i)序列特征:
    (A)长度:103个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:87:
Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu
1               5                   10                  15
Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln
            20                  25                  30
Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp
        35                  40                  45
Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe
    50                  55                  60
His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro
65                  70                  75                  80
Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro
                85                  90                  95
Pro Ala Ala Gly Gly Gly Ala
            100
(2)SEQ ID NO:88的信息:
  (i)序列特征:
    (A)长度:88个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:88:
Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly
1               5                   10                  15
Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His
            20                  25                  30
Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala
        35                  40                  45
Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly
    50                  55                  60
Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly
65                  70                  75                  80
Asp Glu Leu Lys Gly Val Thr Ser
                85
(2)SEQ ID NO:89的信息:
  (i)序列特征:
    (A)长度:95个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:89:
Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile
1               5                   10                  15
Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly
            20                  25                  30
Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala
        35                  40                  45
Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu
    50                  55                  60
Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg
65                  70                  75                  80
Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe
                85                  90                  95
(2)SEQ ID NO:90的信息:
  (i)序列特征:
    (A)长度:166个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:90:
Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn
1               5                   10                  15
Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val
            20                  25                  30
Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln
        35                  40                  45
Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala
    50                  55                  60
Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa
65                  70                  75                  80
Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly
                85                  90                  95
Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser
            100                 105                 110
Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro
        115                 120                 125
Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp
    130                 135                 140
Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr
145                 150                 155                 160
Leu Thr Leu Gln Gly Asp
                165
(2)SEQ ID NO:91的信息:
  (i)序列特征:
    (A)长度:5个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:91:
Arg Ala Glu Arg Met
1               5
(2)SEQ ID NO:92的信息:
  (i)序列特征:
    (A)长度:263个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:92:
Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala
1               5                   10                  15
Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr
            20                  25                  30
Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu
        35                  40                  45
Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn
    50                  55                  60
Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe
65                  70                  75                  80
Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe
                85                  90                  95
Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala
            100                 105                 110
Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met
        115                 120                 125
Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly
   130                  135                 140
Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro
145                 150                 155                 160
His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met
                165                 170                 175
Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met
            180                 185                 190
Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala
        195                 200                 205
Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly
    210                 215                 220
Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala
225                 230                 235                 240
Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly
                245                 250                 255
Arg Arg Asn Gly Gly Pro Ala
            260
(2)SEQ ID NO:93的信息:
  (i)序列特征:
    (A)长度:303个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:93:
Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala
1               5                   10                  15
Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly
            20                  25                  30
Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly
        35                  40                  45
Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr
    50                  55                  60
Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro
65                  70                  75                  80
Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val
                85                  90                  95
Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu
            100                 105                 110
Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr
        115                 120                 125
Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln
    130                 135                 140
Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr
145                 150                 155                 160
Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg
                165                 170                 175
Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly
            180                 185                 190
Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln
        195                 200                 205
Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser
    210                 215                 220
Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala
225                 230                 235                 240
Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser
                245                 250                 255
Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser
            260                 265                 270
Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn
        275                 280                 285
Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val
    290                 295                 300
(2)SEQ ID NO:94的信息:
  (i)序列特征:
    (A)长度:168个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:94:
Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala
1               5                   10                  15
Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro
            20                  25                  30
Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu
        35                  40                  45
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser
    50                  55                  60
Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly
65                  70                  75                  80
Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp
                85                  90                  95
His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe
            100                 105                 110
Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp
        115                 120                 125
Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val
    130                 135                 140
Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met
145                 150                 155                 160
Glu Leu Leu Gln Ala Ala Gly Asn
                165
(2)SEQ ID NO:95的信息:
  (i)序列特征:
    (A)长度:332个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:95:
Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr
1               5                   10                  15
Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser
            20                  25                  30
Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro
        35                  40                  45
Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr
    50                  55                  60
Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro
65                  70                  75                  80
Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala
                85                  90                  95
Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro
            100                 105                 110
Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser
        115                 120                 125
Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp
    130                 135                 140
Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro
145                 150                 155                 160
Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg
                165                 170                 175
Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala
            180                 185                 190
Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro
        195                 200                 205
Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val
    210                 215                 220
Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys
225                 230                 235                 240
Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn
                245                 250                 255
Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly
            260                 265                 270
Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu
        275                 280                 285
Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro
    290                 295                 300
Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr
305                 310                 315                 320
Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala
                325                 330
(2)SEQ ID NO:96的信息:
  (i)序列特征:
    (A)长度:500个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:96:
CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT          60
CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG         120
GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC         180
CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC         240
ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC         300
GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA         360
ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT         420
CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG         480
GCCGCCACCG CGGTGGAGCT                                                     500
(2)SEQ ID NO:97的信息:
  (i)序列特征:
    (A)长度:96个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:97:
Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro
1               5                   10                  15
Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala
            20                  25                  30
Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser
        35                  40                  45
Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro
    50                  55                  60
Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala
65                  70                  75                  80
Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr
                85                  90                  95
(2)SEQ ID NO:98的信息:
  (i)序列特征:
    (A)长度:154个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:98:
ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA          60
AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA         120
GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC                                     154
(2)SEQ ID NO:99的信息:
  (i)序列特征:
    (A)长度:51个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:99:
Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser
1               5                   10                  15
Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly
            20                  25                  30
Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser
        35                  40                  45
Glu Ala Tyr
    50
(2)SEQ ID NO:100的信息:
  (i)序列特征:
    (A)长度:282个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:100:
CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT           60
TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC          120
GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA          180
GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG          240
ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG                             282
(2)SEQ ID NO:101的信息:
  (i)序列特征:
    (A)长度:1565个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:101:
GTATGCGGCC ACTGAAGTCG CCAATGCGGC GGCGGCCAGC TAAGCCAGGA ACAGTCGGCA         60
CGAGAAACCA CGAGAAATAG GGACACGTAA TGGTGGATTT CGGGGCGTTA CCACCGGAGA        120
TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC GCTGGTGGCC GCGGCTCAGA        180
TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC GGCGTTTCAG TCGGTGGTCT        240
GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG TCTGATGGTG GCGGCGGCCT        300
CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC CGAGCTGACC GCCGCCCAGG        360
TCCGGGTTGC TGCGGCGGCC TACGAGACGG CGTATGGGCT GACGGTGCCC CCGCCGGTGA        420
TCGCCGAGAA CCGTGCTGAA CTGATGATTC TGATAGCGAC CAACCTCTTG GGGCAAAACA        480
CCCCGGCGAT CGCGGTCAAC GAGGCCGAAT ACGGCGAGAT GTGGGCCCAA GACGCCGCCG        540
CGATGTTTGG CTACGCCGCG GCGACGGCGA CGGCGACGGC GACGTTGCTG CCGTTCGAGG        600
AGGCGCCGGA GATGACCAGC GCGGGTGGGC TCCTCGAGCA GGCCGCCGCG GTCGAGGAGG        660
CCTCCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT GCCCCAGGCG CTGCAACAGC        720
TGGCCCAGCC CACGCAGGGC ACCACGCCTT CTTCCAAGCT GGGTGGCCTG TGGAAGACGG        780
TCTCGCCGCA TCGGTCGCCG ATCAGCAACA TGGTGTCAAT GGCCAACAAC CACATGTCAA        840
TGACCAACTC GGGTGTGTCA ATGACCAACA CCTTGAGCTC GATGTTGAAG GGCTTTGCTC        900
CGGCGGCGGC CGCCCAGGCC GTGCAAACCG CGGCGCAAAA CGGGGTCCGG GCGATGAGCT        960
CGCTGGGCAG CTCGCTGGGT TCTTCGGGTC TGGGCGGTGG GGTGGCCGCC AACTTGGGTC       1020
GGGCGGCCTC GGTCGGTTCG TTGTCGGTGC CGCAGGCCTG GGCCGCGGCC AACCAGGCAG       1080
TCACCCCGGC GGCGCGGGCG CTGCCGCTGA CCAGCCTGAC CAGCGCCGCG GAAAGAGGGC       1140
CCGGGCAGAT GCTGGGCGGG CTGCCGGTGG GGCAGATGGG CGCCAGGGCC GGTGGTGGGC       1200
TCAGTGGTGT GCTGCGTGTT CCGCCGCGAC CCTATGTGAT GCCGCATTCT CCGGCGGCCG       1260
GCTAGGAGAG GGGGCGCAGA CTGTCGTTAT TTGACCAGTG ATCGGCGGTC TCGGTGTTTC       1320
CGCGGCCGGC TATGACAACA GTCAATGTGC ATGACAAGTT ACAGGTATTA GGTCCAGGTT       1380
CAACAAGGAG ACAGGCAACA TGGCCTCACG TTTTATGACG GATCCGCACG CGATGCGGGA       1440
CATGGCGGGC CGTTTTGAAG TGCACGCCCA GACGGTGGAG GACGAGGCTC GCCGGATGTG       1500
GGCGTCCGCG CAAAACATTT CCGGTGCGGG CTGGAGTGGC ATGGCCGAGG CGACCTCGCT       1560
AGACA                                                                   1565
(2)SEQ ID NO:102的信息:
  (i)序列特征:
    (A)长度:391个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:102:
Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1               5                   10                  15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp
            20                  25                  30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
        35                  40                  45
Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly
    50                  55                  60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65                  70                  75                  80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
                85                  90                  95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
            100                 105                 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
        115                 120                 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
    130                 135                 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala
145                 150                 155                 160
Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr
                165                 170                 175
Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser
            180                 185                 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
        195                 200                 205
Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu
    210                 215                 220
Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn
225                 230                 235                 240
Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val
                245                 250                 255
Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala
            260                 265                 270
Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala
        275                 280                 285
Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly
    290                 295                 300
Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val
305                 310                 315                 320
Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg
                325                 330                 335
Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly
            340                 345                 350
Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly
        355                 360                 365
Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met
    370                 375                 380
Pro His Ser Pro Ala Ala Gly
385                 390
(2)SEQ ID NO:103的信息:
  (i)序列特征:
    (A)长度:259个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:103:
ACCAACACCT TGCACTCNAT GTTGAAGGGC TTAGCTCCGG CGGCGGCTCA GGCCGTGGAA          60
ACCGCGGCGG AAAACGGGGT CTGGGCAATG AGCTCGCTGG GCAGCCAGCT GGGTTCGTCG         120
CTGGGTTCTT CGGGTCTGGG CGCTGGGGTG GCCGCCAACT TGGGTCGGGC GGCCTCGGTC         180
GGTTCGTTGT CGGTGCCGCC AGCATGGGCC GCGGCCAACC AGGCGGTCAC CCCGGCGGCG         240
CGGGCGCTGC CGCTGACCA                                                      259
(2)SEQ ID NO:104的信息:
  (i)序列特征:
    (A)长度:86个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:104:
Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala Ala Ala
1               5                   10                  15
Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met Ser Ser
            20                  25                  30
Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Ala
        35                  40                  45
Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser
    50                  55                  60
Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala
65                  70                  75                  80
Arg Ala Leu Pro Leu Thr
                85
(2)SEQ ID NO:105的信息:
  (i)序列特征:
    (A)长度:1109个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:105:
TACTTGAGAG AATTTGACCT GTTGCCGACG TTGTTTGCTG TCCATCATTG GTGCTAGTTA           60
TGGCCGAGCG GAAGGATTAT CGAAGTGGTG GACTTCGGGG CGTTACCACC GGAGATCAAC          120
TCCGCGAGGA TGTACGCCGG CCCGGGTTCG GCCTCGCTGG TGGCCGCCGC GAAGATGTGG        180
GACAGCGTGG CGAGTGACCT GTTTTCGGCC GCGTCGGCGT TTCAGTCGGT GGTCTGGGGT        240
CTGACGACGG GATCGTGGAT AGGTTCGTCG GCGGGTCTGA TGGTGGCGGC GGCCTCGCCG        300
TATGTGGCGT GGATGAGCGT CACCGCGGGG CAGGCCGAGC TGACCGCCGC CCAGGTCCGG        360
GTTGCTGCGG CGGCCTACGA GACGGCGTAT GGGCTGACGG TGCCCCCGCC GGTGATCGCC        420
GAGAACCGTG CTGAACTGAT GATTCTGATA GCGACCAACC TCTTGGGGCA AAACACCCCG        480
GCGATCGCGG TCAACGAGGC CGAATACGGG GAGATGTGGG CCCAAGACGC CGCCGCGATG        540
TTTGGCTACG CCGCCACGGC GGCGACGGCG ACCGAGGCGT TGCTGCCGTT CGAGGACGCC        600
CCACTGATCA CCAACCCCGG CGGGCTCCTT GAGCAGGCCG TCGCGGTCGA GGAGGCCATC        660
GACACCGCCG CGGCGAACCA GTTGATGAAC AATGTGCCCC AAGCGCTGCA ACAACTGGCC        720
CAGCCCACGA AAAGCATCTG GCCGTTCGAC CAACTGAGTG AACTCTGGAA AGCCATCTCG        780
CCGCATCTGT CGCCGCTCAG CAACATCGTG TCGATGCTCA ACAACCACGT GTCGATGACC        840
AACTCGGGTG TGTCAATGGC CAGCACCTTG CACTCAATGT TGAAGGGCTT TGCTCCGGCG        900
GCGGCTCAGG CCGTGGAAAC CGCGGCGCAA AACGGGGTCC AGGCGATGAG CTCGCTGGGC        960
AGCCAGCTGG GTTCGTCGCT GGGTTCTTCG GGTCTGGGCG CTGGGGTGGC CGCCAACTTG       1020
GGTCGGGCGG CCTCGGTCGG TTCGTTGTCG GTGCCGCAGG CCTGGGCCGC GGCCAACCAG       1080
GCGGTCACCC CGGCGGCGCG GGCGCTGCC                                         1109
(2)SEQ ID NO:106的信息:
  (i)序列特征:
    (A)长度:341个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:106:
Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1               5                   10                  15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp
            20                  25                  30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
        35                  40                  45
Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly
    50                  55                  60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65                  70                  75                  80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
                85                  90                  95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
            100                 105                 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
        115                 120                 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
    130                 135                 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala
145                 150                 155                 160
Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr
                165                 170                 175
Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile
            180                 185                 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
        195                 200                 205
Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu
    210                 215                 220
Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn
225                 230                 235                 240
Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val
                245                 250                 255
Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala
            260                 265                 270
Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met
        275                 280                 285
Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu
    290                 295                 300
Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser
305                 310                 315                 320
Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro
                325                 330                 335
Ala Ala Arg Ala Leu
            340
(2)SEQ ID NO:107的信息:
  (i)序列特征:
    (A)长度:1256个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:107:
CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGNTA AATACCGCAC           60
GGCTGATGGC CGGCGCGGGT CCGGCTCCAA TGCTTGCGGC GGCCGCGGGA TGGCAGACGC          120
TTTCGGCGGC TCTGGACGCT CAGGCCGTCG AGTTGACCGC GCGCCTGAAC TCTCTGGGAG          180
AAGCCTGGAC TGGAGGTGGC AGCGACAAGG CGCTTGCGGC TGCAACGCCG ATGGTGGTCT          240
GGCTACAAAC CGCGTCAACA CAGGCCAAGA CCCGTGCGAT GCAGGCGACG GCGCAAGCCG          300
CGGCATACAC CCAGGCCATG GCCACGACGC CGTCGCTGCC GGAGATCGCC GCCAACCACA          360
TCACCCAGGC CGTCCTTACG GCCACCAACT TCTTCGGTAT CAACACGATC CCGATCGCGT          420
TGACCGAGAT GGATTATTTC ATCCGTATGT GGAACCAGGC AGCCCTGGCA ATGGAGGTCT          480
ACCAGGCCGA GACCGCGGTT AACACGCTTT TCGAGAAGCT CGAGCCGATG GCGTCGATCC          540
TTGATCCCGG CGCGAGCCAG AGCACGACGA ACCCGATCTT CGGAATGCCC TCCCCTGGCA          600
GCTCAACACC GGTTGGCCAG TTGCCGCCGG CGGCTACCCA GACCCTCGGC CAACTGGGTG          660
AGATGAGCGG CCCGATGCAG CAGCTGACCC AGCCGCTGCA GCAGGTGACG TCGTTGTTCA          720
GCCAGGTGGG CGGCACCGGC GGCGGCAACC CAGCCGACGA GGAAGCCGCG CAGATGGGCC          780
TGCTCGGCAC CAGTCCGCTG TCGAACCATC CGCTGGCTGG TGGATCAGGC CCCAGCGCGG          840
GCGCGGGCCT GCTGCGCGCG GAGTCGCTAC CTGGCGCAGG TGGGTCGTTG ACCCGCACGC          900
CGCTGATGTC TCAGCTGATC GAAAAGCCGG TTGCCCCCTC GGTGATGCCG GCGGCTGCTG          960
CCGGATCGTC GGCGACGGGT GGCGCCGCTC CGGTGGGTGC GGGAGCGATG GGCCAGGGTG         1020
CGCAATCCGG CGGCTCCACC AGGCCGGGTC TGGTCGCGCC GGCACCGCTC GCGCAGGAGC         1080
GTGAAGAAGA CGACGAGGAC GACTGGGACG AAGAGGACGA CTGGTGAGCT CCCGTAATGA         1140
CAACAGACTT CCCGGCCACC CGGGCCGGAA GACTTGCCAA CATTTTGGCG AGGAAGGTAA       1200
AGAGAGAAAG TAGTCCAGCA TGGCAGAGAT GAAGACCGAT GCCGCTACCC TCGCGC           1256
(2)SEQ ID NO:108的信息:
  (i)序列特征:
    (A)长度:432个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:108:
CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG          60
GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG         120
AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC         180
TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC         240
GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA         300
GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG         360
TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG         420
TACGCCTCCG AA                                                             432
(2)SEQ ID NO:109的信息:
  (i)序列特征:
    (A)长度:368个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:109:
Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met
1               5                   10                  15
Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln
            20                  25                  30
Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg
        35                  40                  45
Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala
    50                  55                  60
Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr
65                  70                  75                  80
Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr
                85                  90                  95
Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn
            100                 105                 110
His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn
        115                 120                 125
Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp
    130                 135                 140
Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val
145                 150                 155                 160
Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro
                165                 170                 175
Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro
            180                 185                 190
Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr
        195                 200                 205
Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln
    210                 215                 220
Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly
225                 230                 235                 240
Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly
                245                 250                 255
Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser
            260                 265                 270
Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly
        275                 280                 285
Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val
    290                 295                 300
Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly
305                 310                 315                 320
Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser
                325                 330                 335
Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln
            340                 345                 350
Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp
        355                 360                 365
(2)SEQ ID NO:110的信息:
  (i)序列特征:
    (A)长度:12个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:110:
Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala
1               5                   10
(2)SEQ ID NO:111的信息:
  (i)序列特征:
    (A)长度:396个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:111:
GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA          60
GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA         120
AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG         180
CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT         240
CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC         300
GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC         360
CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA                                   396
(2)SEQ ID NO:112的信息:
  (i)序列特征:
    (A)长度:80个氨基酸
    (B)类型:氨基酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:112:
Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala
1               5                   10                  15
Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln
            20                  25                  30
Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu
        35                  40                  45
Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser
    50                  55                  60
Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe
65                  70                  75                  80
(2)SEQ ID NO:113的信息:
  (i)序列特征:
    (A)长度:387个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:113:
GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA          60
TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG         120
CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC         180
CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT         240
TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG         300
CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT         360
ATTAGCGGGT CAGAAGCCCA TTTGCGA                                             387
(2)SEQ ID NO:114的信息:
  (i)序列特征:
    (A)长度:272个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:114:
CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC           60
TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC          120
TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG          180
TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG          240
GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA                                        272
(2)SEQ ID NO:115的信息:
  (i)序列特征:
    (A)长度:20个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:115:
Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val
1               5                   10                  15
Val Ala Ala Leu
            20
(2)SEQ ID NO:116的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:116:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser
1               5                   10                  15
(2)SEQ ID NO:117的信息:
  (i)序列特征:
    (A)长度:19个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:117:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys
1               5                   10                  15
Glu Gly Arg
(2)SEQ ID NO:118的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:118:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro
1               5                   10                  15
(2)SEQ ID NO:119的信息:
  (i)序列特征:
    (A)长度:14个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:119:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val
1               5                   10
(2)SEQ ID NO:120的信息:
  (i)序列特征:
    (A)长度:13个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:120:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro
1               5                   10
(2)SEQ ID NO:121的信息:
  (i)序列特征:
    (A)长度:17个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:121:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro
1               5                   10                  15
Ser
(2)SEQ ID NO:122的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:122:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly
1               5                   10                  15
(2)SEQ ID NO:123的信息:
  (i)序列特征:
    (A)长度:30个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:123:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser
1               5                   10                  15
Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn
            20                  25                  30
(2)SEQ ID NO:124的信息:
  (i)序列特征:
    (A)长度:22个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:124:
Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro
1               5                   10                  15
Gly Gly Arg Arg Xaa Phe
            20
(2)SEQ ID NO:125的信息:
  (i)序列特征:
    (A)长度:7个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:125:
Asp Pro Gly Tyr Thr Pro Gly
1               5
(2)SEQ ID NO:126的信息:
  (i)序列特征:
    (A)长度:10个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (ix)特征:
    (D)其它信息:/注=“第二残基可以是Pro或者Thr”
  (xi)序列描述:SEQ ID NO:126:
Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr
1               5                   10
(2)SEQ ID NO:127的信息:
  (i)序列特征:
    (A)长度:9个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (ix)特征:
    (D)其它信息:/注=“第三残基可以是Gln或者Leu”
(xi)序列描述:SEQ ID NO:127:
Xaa Pro Xaa Val Thr Ala Tyr Ala Gly
1               5
(2)SEQ ID NO:128的信息:
  (i)序列特征:
    (A)长度:9个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:128:
Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg
1               5
(2)SEQ ID NO:129的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:129:
Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser
1               5                   10                  15
(2)SEQ ID NO:130的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:130:
Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp
1               5                   10                  15
(2)SEQ ID NO:131的信息:
  (i)序列特征:
    (A)长度:15个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:131:
Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly
1               5                   10                  15
(2)SEQ ID NO:132的信息:
  (i)序列特征:
    (A)长度:21个氨基酸
    (B)类型:氨基酸
    (C)链型:
    (D)拓扑结构:线型
  (xi)序列描述:SEQ ID NO:132:
Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile
1               5                   10                  15
Asn Val His Leu Val
            20

Claims (44)

1.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原具有选自下组的N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID No.120);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Ser(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123);和
(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID No.131)
其中Xaa可以是任何氨基酸。
2.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,其中所说的抗原具有选自下组的N端序列:
(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124)和
(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),
其中Xaa可以是任何氨基酸。
3.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
4.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
5.一种DNA分子,该分子包含编码按照权利要求1-4之任一的多肽的核苷酸序列。
6.一种重组表达载体,该载体包含按照权利要求5的DNA分子。
7.一种宿主细胞,该宿主细胞由按照权利要求6的表达载体转化过。
8.权利要求7的宿主细胞,其中所说的宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。
9.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与按照权利要求1-4之任一的一种或多种多肽接触;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
10.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽接触;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
11.一种用于在生物样品中检测结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与由选自下组的DNA序列编码的一种或多种多肽接触:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
12.权利要求9-11之任一的方法,其中步骤(a)还包括使生物样品与38kD结核分枝杆菌抗原接触,并且步骤(b)还包括在样品中检测结合到38kD结核分枝杆菌抗原上的抗体的存在。
13.权利要求9-11之任一的方法,其中所说的多肽是结合到固相支持物上的。
14.权利要求13的方法,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
15.权利要求9-11之任一的方法,其中所说的生物样品选自全血、血清、血浆、唾液、脑脊液和尿。
16.权利要求15的方法,其中所说的生物样品是全血或血清。
17.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸;和
(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
18.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸;和
(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
19.权利要求17或18的方法,其中所说的生物样品选自全血、痰、血清、血浆、唾液、脑脊液和尿。
20.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸;和
(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
21.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含选自SEQID No.3,11和12的DNA序列的至少约15个邻接核苷酸;和
(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
22.权利要求20或21的方法,其中所说的生物样品选自全血,痰、血清、血浆、唾液、脑脊液和尿。
23.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到按照权利要求1-4之任一的多肽上的结合剂接触;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
24.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽具有由SEQ ID No.129和130给出的序列的N端序列;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
25.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽由选自下组的DNA序列编码:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
26.权利要求23-25之任一的方法,其中所说的结合剂是单克隆抗体。
27.权利要求23-25之任一的方法,其中所说的结合剂是多克隆抗体。
28.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种按照权利要求1-4之任一的多肽;和
(b)一种检测试剂。
29.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽;和
(b)一种检测试剂。
30.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种由选自下组的DNA序列:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列编码的多肽;和
(b)一种检测试剂。
31.权利要求28-30之任一的试剂盒,其中所说的多肽是固定化在固相支持物上的。
32.权利要求31的试剂盒,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
33.权利要求28-30之任一的试剂盒,其中所说的检测试剂包含结合到结合剂上的报道基团。
34.权利要求33的试剂盒,其中所说的结合剂选自抗-免疫球蛋白、蛋白质G,蛋白质A和凝集素。
35.权利要求33的试剂盒,其中所说的报道基团选自放射性同位素、荧光基团、发光基团、酶、生物素以及染料颗粒。
36.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸。
37.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸。
38.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸。
39.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含选自SEQ ID No.3,11和12的DNA序列的至少约15个邻接核苷酸。
40.一种单克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
41.一种多克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
42.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的两种或多种多肽。
43.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的一种或多种多肽以及ESAT-6(SEQ ID No.99)。
44.一种融合蛋白,该融合蛋白包含具有由SEQ ID No.129和130给出的序列的N端序列的多肽。
CNA2004100351841A 1995-09-01 1996-08-30 用于结核病诊断的化合物和方法 Pending CN1554664A (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US52343595A 1995-09-01 1995-09-01
US08/523,435 1995-09-01
US53213695A 1995-09-22 1995-09-22
US08/532,136 1995-09-22
US62028096A 1996-03-22 1996-03-22
US08/620,280 1996-03-22
US65880096A 1996-06-05 1996-06-05
US08/658,800 1996-06-05
US68057396A 1996-07-12 1996-07-12
US08/680,573 1996-07-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB961974672A Division CN1154730C (zh) 1995-09-01 1996-08-30 用于结核病诊断的化合物和方法

Publications (1)

Publication Number Publication Date
CN1554664A true CN1554664A (zh) 2004-12-15

Family

ID=27541833

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2004100351841A Pending CN1554664A (zh) 1995-09-01 1996-08-30 用于结核病诊断的化合物和方法
CNB961974672A Expired - Lifetime CN1154730C (zh) 1995-09-01 1996-08-30 用于结核病诊断的化合物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB961974672A Expired - Lifetime CN1154730C (zh) 1995-09-01 1996-08-30 用于结核病诊断的化合物和方法

Country Status (13)

Country Link
EP (2) EP0850305B1 (zh)
JP (1) JPH11514217A (zh)
CN (2) CN1554664A (zh)
AT (2) ATE324445T1 (zh)
AU (1) AU7158796A (zh)
CA (1) CA2230927A1 (zh)
CY (1) CY2618B2 (zh)
DE (1) DE69636075D1 (zh)
DK (1) DK2154248T3 (zh)
ES (1) ES2378051T3 (zh)
MX (1) MX9801687A (zh)
PT (1) PT2154248E (zh)
WO (1) WO1997009429A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111269856A (zh) * 2020-02-19 2020-06-12 首都医科大学附属北京胸科医院 一种分离和/或富集结核分枝杆菌的方法

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6991797B2 (en) 1993-07-02 2006-01-31 Statens Serum Institut M. tuberculosis antigens
US6641814B1 (en) 1997-04-02 2003-11-04 Statens Serum Institut Nucleic acids fragments and polypeptide fragments derived from M. tuberculosis
US6290969B1 (en) 1995-09-01 2001-09-18 Corixa Corporation Compounds and methods for immunotherapy and diagnosis of tuberculosis
US6458366B1 (en) 1995-09-01 2002-10-01 Corixa Corporation Compounds and methods for diagnosis of tuberculosis
US6592877B1 (en) 1995-09-01 2003-07-15 Corixa Corporation Compounds and methods for immunotherapy and diagnosis of tuberculosis
IL129389A0 (en) * 1996-10-11 2000-02-17 Corixa Corp Compounds and methods for diagnsosis of tuberculosis
US6544522B1 (en) 1998-12-30 2003-04-08 Corixa Corporation Fusion proteins of mycobacterium tuberculosis antigens and their uses
US6350456B1 (en) 1997-03-13 2002-02-26 Corixa Corporation Compositions and methods for the prevention and treatment of M. tuberculosis infection
US6627198B2 (en) 1997-03-13 2003-09-30 Corixa Corporation Fusion proteins of Mycobacterium tuberculosis antigens and their uses
ES2291810T3 (es) * 1997-04-02 2008-03-01 Statens Serum Institut Fragmentos de acido nucleico y fragmentos de polpeptidos derivados de m. tuberculosis.
US6982085B2 (en) 1997-04-02 2006-01-03 Statens Serum Institut TB diagnostic based on antigens from M. tuberculosis
US7037510B2 (en) 1997-04-18 2006-05-02 Statens Serum Institut Hybrids of M. tuberculosis antigens
US6613881B1 (en) * 1997-05-20 2003-09-02 Corixa Corporation Compounds for immunotherapy and diagnosis of tuberculosis and methods of their use
US6555653B2 (en) * 1997-05-20 2003-04-29 Corixa Corporation Compounds for diagnosis of tuberculosis and methods for their use
CA2296419A1 (en) * 1997-07-16 1999-01-28 Institut Pasteur A polynucleotide functionally coding for the lhp protein from mycobacterium tuberculosis, its biologically active derivative fragments, as well as methods using the same
NZ504951A (en) * 1997-11-10 2001-06-29 Statens Seruminstitut Nucleic acid fragments and polypeptide fragments derived from M. tuberculosis
EP1484405A1 (en) * 1997-11-10 2004-12-08 Statens Serum Institut Nucleic acid fragments and polypeptide fragments derived from M. Tuberculosis
EP0921397A1 (en) * 1997-12-08 1999-06-09 Kreatech Biotechnology B.V. A method for identifying a mycobacterium species
CN1629185B (zh) 1998-04-07 2011-11-02 科里克萨公司 结核杆菌抗原融合蛋白及其应用
US6183957B1 (en) * 1998-04-16 2001-02-06 Institut Pasteur Method for isolating a polynucleotide of interest from the genome of a mycobacterium using a BAC-based DNA library application to the detection of mycobacteria
GB9808720D0 (en) * 1998-04-23 1998-06-24 Smithkline Beecham Biolog Novel compounds
EP1104456A1 (en) * 1998-08-10 2001-06-06 Chiron Corporation Engineered antigen-presenting cells expressing an array of antigens and uses thereof
US6465633B1 (en) 1998-12-24 2002-10-15 Corixa Corporation Compositions and methods of their use in the treatment, prevention and diagnosis of tuberculosis
US7932373B1 (en) 1999-05-04 2011-04-26 University Of Medicine And Dentistry Of New Jersey Proteins expressed by mycobacterium tuberculosis and not by BCG and their use as diagnostic reagents and vaccines
US7009042B1 (en) 1999-10-07 2006-03-07 Corixa Corporation Methods of using a Mycobacterium tuberculosis coding sequence to facilitate stable and high yield expression of the heterologous proteins
JP2003527830A (ja) * 1999-10-07 2003-09-24 コリクサ コーポレイション 異種タンパク質の安定かつ高収量の発現を容易にするための、Mycobacteriumtuberculosisをコードする配列を使用する方法
US6316205B1 (en) 2000-01-28 2001-11-13 Genelabs Diagnostics Pte Ltd. Assay devices and methods of analyte detection
AU2001241738A1 (en) 2000-02-25 2001-09-03 Corixa Corporation Compounds and methods for diagnosis and immunotherapy of tuberculosis
PT2133100E (pt) 2000-06-20 2012-01-11 Corixa Corp Antigénio mtb32a de mycobacterium tuberculosis com um local activo inactivado e suas proteínas de fusão
WO2003070187A2 (en) 2002-02-15 2003-08-28 Corixa Corporation Fusion proteins of mycobacterium tuberculosis
US20040072262A1 (en) 2002-10-11 2004-04-15 Montero-Julian Felix A. Methods and systems for detecting MHC class I binding peptides
US8715679B2 (en) 2004-02-09 2014-05-06 The Arizona Board Of Regents On Behalf Of The University Of Arizona Pili from Mycobacterium tuberculosis
WO2006009838A2 (en) * 2004-06-17 2006-01-26 Beckman Coulter, Inc. Mycobacterium tuberculosis epitopes and methods of use thereof
SG159554A1 (en) 2004-11-16 2010-03-30 Crucell Holland Bv Multivalent vaccines comprising recombinant viral vectors
CA2607715C (en) 2005-04-29 2015-11-24 Glaxosmithkline Biologicals S.A. Novel method for preventing or treating m tuberculosis infection
JP4943515B2 (ja) * 2007-12-28 2012-05-30 株式会社ビーエル 結核菌群の免疫検出法
KR20120129927A (ko) 2010-01-27 2012-11-28 글락소 그룹 리미티드 변형된 투베르쿨로시스 항원
PT3023106T (pt) 2010-12-14 2019-11-04 Glaxosmithkline Biologicals Sa Composição antigénica de micobactéria
WO2013119763A1 (en) * 2012-02-07 2013-08-15 Intuitive Biosciences, Inc. Mycobacterium tuberculosis specific peptides for detection of infection or immunization in non-human primates
KR20240045370A (ko) 2014-10-23 2024-04-05 퀴아젠 사이언시스, 엘엘씨 펩티드 조성물 및 그의 용도
CN106008685A (zh) * 2016-05-18 2016-10-12 首都医科大学附属北京胸科医院 Trxc抗体识别的抗原多肽及其用途
MX2019003288A (es) * 2016-09-22 2019-11-05 Pace Diagnostics Inc Proteínas de mycobacterium tuberculosis en pruebas diagnósticas y dispositivos para la detección y diagnóstico de la tuberculosis.
ES2933132T3 (es) 2017-05-05 2023-02-01 Biomerieux Sa Procedimiento para detectar una respuesta celular inmune
EP3399312A1 (fr) 2017-05-05 2018-11-07 Biomérieux Procédé de détection d'une réponse cellulaire immune
KR20220052937A (ko) * 2019-07-30 2022-04-28 디엔에이 스크립트 폴리(a) 및 폴리(u) 중합효소를 사용한 폴리뉴클레오타이드의 주형-부재 효소적 합성

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
EP0419355B1 (en) * 1989-09-19 2000-02-09 N.V. Innogenetics S.A. Recombinant polypeptides and peptides, nucleic acids coding for the same and use of these polypeptides and peptides in the diagnostic of tuberculosis
FR2677365B1 (fr) * 1991-06-07 1995-08-04 Pasteur Institut Proteines de mycobacterium et applications.
US5330754A (en) * 1992-06-29 1994-07-19 Archana Kapoor Membrane-associated immunogens of mycobacteria
US5359681A (en) 1993-01-11 1994-10-25 University Of Washington Fiber optic sensor and methods and apparatus relating thereto
DK79793D0 (da) * 1993-07-02 1993-07-02 Statens Seruminstitut Diagnostic test
DK79893D0 (da) * 1993-07-02 1993-07-02 Statens Seruminstitut New vaccine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111269856A (zh) * 2020-02-19 2020-06-12 首都医科大学附属北京胸科医院 一种分离和/或富集结核分枝杆菌的方法

Also Published As

Publication number Publication date
CA2230927A1 (en) 1997-03-13
ATE530671T1 (de) 2011-11-15
PT2154248E (pt) 2012-01-16
WO1997009429A3 (en) 1997-07-17
CY2618B2 (zh) 2012-10-24
AU7158796A (en) 1997-03-27
CN1200146A (zh) 1998-11-25
JPH11514217A (ja) 1999-12-07
EP0850305A2 (en) 1998-07-01
MX9801687A (es) 1998-11-29
DK2154248T3 (da) 2012-01-30
EP2154248A1 (en) 2010-02-17
EP0850305B1 (en) 2006-04-26
DE69636075D1 (de) 2006-06-01
ATE324445T1 (de) 2006-05-15
WO1997009429A2 (en) 1997-03-13
ES2378051T3 (es) 2012-04-04
CN1154730C (zh) 2004-06-23
EP2154248B1 (en) 2011-10-26

Similar Documents

Publication Publication Date Title
CN1154730C (zh) 用于结核病诊断的化合物和方法
CN1117149C (zh) 用于免疫治疗和诊断结核病的化合物和方法
CN1312723A (zh) 诊断结核病的化合物和方法
CN1268745C (zh) B组链球菌抗原
CZ126599A3 (cs) Polypeptid pro imunoterapii a diagnosu tuberkulosy
KR20010012813A (ko) 결핵 확인용 화합물 및 이의 사용 방법
EP0934415A2 (en) Compounds and methods for diagnosis of tuberculosis
CN1599751A (zh) 分枝杆菌比较基因组学作为鉴定分枝杆菌病的诊断、预防或治疗靶的工具
SA99200488B1 (ar) تركيبات وطرق لاج والوقاية من الاصابة بعدوي بكتيريا العصيات الفطرية للدرنM.tuberculosis
CN1203180C (zh) 来自脑膜炎奈瑟氏球菌的basb006多核苷酸和多肽
CN1166858A (zh) tagA基因以及检测消化性溃疡和胃癌易感性的方法
CN1642983A (zh) 抗C5aR抗体及其应用
CN1249233C (zh) 肺炎衣原体表面蛋白
CN1256147C (zh) Cd8作为细胞免疫系统的抑制剂
CN1798761A (zh) 肠球菌抗原
CN101066447A (zh) 基因和蛋白质,及它们的用途
CN1133594A (zh) 单纯性疱疹病毒-2ul26基因,衣壳蛋白,免疫测定和蛋白酶抑制剂
CN1289519C (zh) 肠道细菌的检测和识别
CN1198931C (zh) 粘膜炎莫拉氏菌basb034多肽及应用
CN1241212A (zh) 免疫治疗和诊断结核病的化合物和方法
CN1653173A (zh) 蜡状芽孢杆菌产生的呕吐毒素的合成酶、编码该酶的基因以及呕吐毒素的检测方法
CN1639570A (zh) 钩端螺旋体内存在的具有重复性细菌ig样(big)结构域的蛋白质
CN1242047A (zh) 诊断结核病的化合物和方法
CN1592751A (zh) 编码重组的来源于巨型艾美球虫子孢子/裂殖子的250kDa抗原的核酸,和它们的应用
CN1898385A (zh) 多毛结肠短螺旋体72kDa外膜蛋白及其诊断和治疗用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1072061

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1072061

Country of ref document: HK