CN1125877C - 庚型肝炎病毒及其分子克隆 - Google Patents

庚型肝炎病毒及其分子克隆 Download PDF

Info

Publication number
CN1125877C
CN1125877C CN95194249A CN95194249A CN1125877C CN 1125877 C CN1125877 C CN 1125877C CN 95194249 A CN95194249 A CN 95194249A CN 95194249 A CN95194249 A CN 95194249A CN 1125877 C CN1125877 C CN 1125877C
Authority
CN
China
Prior art keywords
hgv
sequence
virus
polypeptide
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN95194249A
Other languages
English (en)
Other versions
CN1153529A (zh
Inventor
J·P·金
K·E·弗莱
L·M·杨格
J·M·林伦
J·韦杰斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genelabs Technologies Inc
Original Assignee
Genelabs Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genelabs Technologies Inc filed Critical Genelabs Technologies Inc
Publication of CN1153529A publication Critical patent/CN1153529A/zh
Application granted granted Critical
Publication of CN1125877C publication Critical patent/CN1125877C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/29Hepatitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/576Immunoassay; Biospecific binding assay; Materials therefor for hepatitis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Communicable Diseases (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Urology & Nephrology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Analytical Chemistry (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Food Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

本发明公开了一类多肽抗原,其可与患有非甲非乙非丙非丁非戊型肝炎个体的血清发生免疫反应,这里称之为庚型肝炎病毒(HGV)。公开了包含抗原多肽的多核苷酸编码的开放阅读框序列的相应的基因组片段的克隆。该抗原用于检测试验个体是否有HGV的诊断方法。该抗原也有用于疫苗和抗原的制备。此外,揭示了两个HGV分离株的完整编码序列。提出了以核酸为基础的样品中HGV的检测方法,以及HGV有关的其它基因组序列的分离方法。

Description

庚型肝炎病毒及其分子克隆
发明领域
本发明涉及与非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒性致病原(HGV)相关的核酸、多肽、抗原、表位、疫苗和抗体组合物。本发明还涉及诊断和治疗方法。参考文献:
1992年圣地亚哥会议摘要:基因识别,临床化学。 39(4):705(1993)。
Alexander,W.A.等《病毒学杂志》 66:2934-2942(1992)。
Alter,H.J.等《新英格兰医学杂志》 321:1494-1500(1989a)。
Alter,M.J.等《新英格兰医学杂志》 327:1899(1989b)。
Alter,H.J.,病毒性肝炎和肝疾病国际会议摘要,第47页(1993)。
Altschul,S.等,《分子生物学杂志》,215:403-10(1990)。
Ascadi,G.等,《自然》 352:815(1991)。
Ausubel,F.M.等, 当今分子生物学备忘录,John Wiley和Sons,包括医学PA。
Barany,F.,《聚合酶链反应方法的应用》, 1:5(1991)。
Barham,W.B.等《药学病毒学杂志》,42:129-132(1994)。
Baron,S.等,JAMA 266:1375(1991)。
Bazan,J.F.等,《病毒学》 171:637-639(1989)。
Beames等,《生物技术》 11:378(1991)。
Belyavsky,A.等,《核酸研究》 17:2929-2932(1989)。
Blackburn,G.F.等《临床化学》37:1534-1539(1991)。
Bradley,D.W.等,《感染性疾病杂志》,148:2(1983)。
Bradley,D.W.等,《普通病毒杂志》,69:1(1988)。
Bradley,D.W.等《美国国家科学院院刊》,84:6277(1987)。
Briand,J.-P.等,《免疫学方法杂志》,156:255(1992)。
Cahill,P.等,《临床化学》 37:1482(1991)。
Carter,J.M.等,《分子生物学方法》 36:207-223(1994)。
Chamber,T.J.等,《微生物研究年鉴》 44:649(1990a)。
Chamber,T.J.等,PNAS 87:8898(1990b)。
Chomczynski等,《生物化学年刊》162:159(1987)。
Christian,R.B.等,《分子生物学杂志》, 227:771(1992)。
Commandaeur等,《病毒学杂志》 198:282-287(1994)。
Crea,R.等,1989年12月19日出版的号为4,888,286的美国专利。
DeGraaf,M.E.等,《基因》 128:13(1993)。
DiBisceglie,A.M.等,《肝脏学》 16:649(1992)。
DiBisceglie,A.M.等,NEJM 321:1506(1989)。
Dicesare,J.等,《生物技术》15:152-157(1993)。
Dienstag,J.L等,《肝脏疾病的扫描电子显微镜研究》 6:67(1986)。
Earl.P.L等,当代分子生物学备忘录“使用疫苗的哺乳动物细胞中的蛋白质表达”(F.M.Ausubel等编),Greene出版协会和Wiley交叉科学,纽约(1991)。
Eaton,M.A.W.等,1988年1月12日出版的号为4,719,180的美国专利。
Egholm等,《自然》 356:566(1993)。
Elroy-Stein,O.等,《美国国家科学院院刊》 86:6126-6130(1989)。
88年11月18日申请的申请号为88310922.5的欧洲专利申请。
Falkner,F.G.等,《病毒学杂志》 62:1849-1854(1988)。
Farci,P.等,NEJM  330:88(1994)。
Felgner和Rhodes,《自然》 349:257(1991)。
Fickett,J.W.《核酸研究》 10:5303-53l8(1982)。
Fling,S.P.等,《分析生物化学》 155:83-88(1986)。
Folgori,A.等,《EMBO杂志》 13:2236(1994)。
Francki,R.I.B.等,《古病毒学》 增刊  12:223(1991)。
Frank,R.和Doring,R.《四面体》 44:603-6040(1988)。
Frohman,M.A.等,《美国国家科学院院刊》 85:8998-9002(1988)。
Fuerst,T.R.等,《美国国家科学院院刊》 83:8122-8126(1986)。
Gellissen,G.等,Antonie Van Leeuwenhoek, 62(12):79-93(1992)。
Geysen,M.等,《美国国家科学院院刊》 81:3998-4002(1984)。
Gingeras,T.R.等,《临床生物学年鉴》 48:498(1990)。
Gingeras,T.R.等《感染性疾病杂志》 164:1066(1991)。
Goeddel,D.V.《酶学方法》 185(1990)。
Grakoui,A.等,《病毒学杂志》 67:2832(1993)。
Grakoui.A.等,《病毒学杂志》 67:1385-1395(1993)。
Guatelli,J.C.等,《美国国家科学院院刊》 87:1874(1990)。
Gubler,U.等,《基因》,25:263(1983)。
Guthrie,C.和G.R.Fink,《酶学方法》 194(1991)。
Gutterman,J.U.PNAS 91:1198(1994)。
Harlow,E.等, 抗体:实验室手册,冷泉港实验室出版(1988)。
Haynes,J.等,《核酸研究》 11:687-706(1983)。
Hieter,P.A.等,《细胞》22:197-207(1980)。
Hijikata,M.等,PNAS 88:5547(1991)。
Hochuli,Z,在 基因工程原理和实验操作第12卷中(J.stelow编)Plenum,NY,第87-98页(1990)。
Holodniy,M.等,《生物技术》 12:36(1992)。
Hopp,T.P.等,《美国国家科学院院刊》 78:3824-3828(1981)。
Horn,T.和Urdea,M.S.《核酸研究》 17:6959(1989)。
Houghten,R.A.,《美国国家科学院院刊》 82:5131(1985)。
Hudson,D.《有机化学杂志》 53:617(1988)。
Irwin,M.J.等,《病毒学杂志》 58:5036(1994)。
Jacob,J.R.等,在 HCV的分子生物学中的第4部分,第387-392页中(1991)。
Jacob,J.R.等,《肝脏学》 10:921-927(1989)。
Jacob,J.R.等,《感染性疾病杂志》 161:1121-1127(1990)。
Janknecht,R.等,《美国国家科学院院刊》 88:8972-8976(1991)。
Kaufman,R.J.在《酶学方法》第185卷,第537-566页中的“哺乳动物细胞中的异种基因的选择和扩增”,学院出版股份有限公司,圣地亚哥CA(1991)。
Kakumu,S.等,《胃肠学》 105:507(1993)。
Katz,E.D.和Dong,M.《生物技术》 8:546(1990)。
Kawasaki,E.S.等,在 PCR技术:DNA扩增的原理和应用(H.A.Zrlich编)Stockton出版。
King,L A.等,《杆状病毒表达系统》,实验室指南,Chapman和Hall,伦敦,纽约,东京,墨尔本,马德拉斯,1992。
Kyte,J.和Doolittle,R.F.《分子生物学杂志》 157:105-132(1982)。
Koonin,E.V.和Dolja,V.V.《生物化学和分子生物学关键性综述》28:375-430(1993)。
Krausslich,H.G.等, 作为化学疗法目标的病毒蛋白酶(冷泉港出版,PLainville,纽约)(1989)。
Kumar,R.等,《艾滋病研究人反转录病毒》 5(3):345-354(1989)。
Landford,R.E.等, 体外细胞发育生物学 25:174-182(1989)。
Larder,B.A.和Kemp,S.D.《科学》 246:1155(1989)。
Lau,Y.F.等,《分子细胞生物学》 4:1469-1475(1984)。
Lomell,H.等,《临床化学》 48:492(1990)。
Maniatis,T.等, 分子克隆:实验手册,冷泉港实验室(1982)。
Marshall,W.S.和Caruthers,M.H.《科学》 259:1564(1993)。
Messing,J.,《酶学方法》 101:20(1983)。
Michelle等,病毒性肝炎国际会议。
Miller,J.H. 分子遗传学实验,冷泉港实验室,冷泉港,纽约(1972)。
Morrissey,D.V.等,《分析生物化学》 181:345(1989)。
Moss,B.等, 分子生物学通讯(第四部分,第16单元)1991)。
Moss,B.等,1992年8月4日出版的号为5,135,855的美国专利。
Mullis,K.B.,1987年7月28出版的号为4,683,202的美国专利。
Mullis,K.B.等,1987年7月28日出版的号为4,683,195的美国专利。
Obeid,O.E.等,《病毒研究》 32:69-84(1994)。
Osikowicz,G.等,《临床化学》 36:1586(1990)。
Patterson,J.L和Fernandez-Larsson,R.《感染性疾病综述》 12:1139(1990)。
Pearson,W.R.和Lipman,D.J.PNAS 85:2444-2448(1988)。
Pearson,W.R.《酶学方法》 183:63-98(1990)。
Pitha,《生物化学生物物理Acta》, 204:39(1970a)。
Pitha,《生物多聚体》, 9:965(1970b)。
Porath,J.,《蛋白质实验和纯化》 3:263(1992)。
Pritchard,C.G.和Stefano,J.E.,《生物化学年鉴》 48:492(1990)。
Reichard,O.等,《柳叶刀》 337:1058(1991)。
Reilly,P.R.等, 杆状病毒表达载体,实验室手册(1992)。
Reyes,G.等,《科学》,247:1335(1990)。
Reyes,G.等,《分子和细胞探针》 5:473-481(1991)。
Rice,C.M.等,《新生物》 1:285-296(1989)。
Roberts,N.A.等,《科学》 248:358(1990)。
Romanos,M.A.等,《酵母》 8 167:423-488(1992)。
Sanger等,《美国国家科学院院刊》74:5463(1977)。
Sambrook,J.等,在 分子克隆:实验室手册中,冷泉港实验室出版,第2卷(1989)。
Saiki,R.K.等,《科学》 239:487-491(1988)。
Schagger,H.等,《生物化学年鉴》 166:368-379(1987)。
Scharf,S.J.等,《科学》 233:1076(1986)。
Schuler,G.D.等,《蛋白质:结构,功能和基因》 9:180(1989)。
Scott,J.K.等,《美国国家科学院院刊》 89:5398(1972)。
Smith,D.B.等,《基因》 67:31(1988)。
Smith,J.P.《目前鉴定用的生物技术》 2:668(1991)。
Sreenivasan,M.A.等,《普通病毒学杂志》 65:1005(1984)。
Sumiyoshi,H.等,《病毒学杂志》 66:5425-5431(1992)。
Summerton,J.等,92年8月25日出版的号为5,142,047的美国专利。
Summerton,J.等,93年2月9日出版的号为5,185,444的美国专利。
Tam,A.等,《病毒学》 185:120(1991)。
Tam,J.P.,《美国国家科学院院刊》 85:5409(1988)。
Tessier,D.C.《基因》 98:177-183(1991)。
Tonkinson,J.L和Stein,C.A.《抗病毒化学和化学疗法》 4(4):193-200(1993)。
Ulmet等,《科学》 259:1745(1993)。
Urdea,M.《临床化学》 39:725(1993)。
Urdea,M.等,《艾滋病》 7:S11(1993)。
Wages,J.M.等,《扩增》10:1-6(1993)。
Walker,G.T.《PCR方法的应用》 3:1-6(1993)。
Wang,A.M等,在PCR记录,方法和应用指南中(M.A.Innis等编)学院出版社(1990)。
Wang,B.等,《美国国家科学院院刊》 90:4156(1993)。
Whetsell,A.J.等,《临床显微学杂志》 30:845(1992)。
Wolf,J.A.等,《自然》 247:1465(1990)。
Vacca,J.P.等,PNAS 91:4096(1994)。
VanGemen,B.等,《病毒学方法杂志》 43:177(1993)。
Valenzuela,P.等,《自然》 298:344(1982)。
Valenzuela,P.等,在《 乙型肝炎》中,I.Millman等编,Plenum出版,第225-236页(1984)。
Yarbrough等,《病毒学杂志》65:5790(1991)。
Yoo,B.J.等,《病毒学杂志》 69:32-38(1995)。
Yoshio.T.等,1989年7月18日出版的号为4,849,350的美国专利。
Zhang,Y.等,《病毒学杂志》 65:6101-6110(1991)。发明背景
由一种不是甲型和乙型肝炎病毒引进的病毒性肝炎被称为非甲非乙型肝炎(HANAH)。根据某一个体类型的传播方式,例如,肠道的和非肠胃的,可将NANBH进一步分类。
第一种形式的NANBH,称为肠道传播的NANBH或ET-NANBH,主要是在环境卫生条件较差的地区发病,那里的食物和饮水被粪便物污染了。最近,阐述了称为戊型肝炎病毒(HEV)的致病原体的分子克隆(Reyes等,1990;Tam等)。
第二种形式的NANBH,称为非肠胃传播的NANBH或PT-NANBH,通过非肠胃途径传播,典型的是接触血液或血液制品。这种肝炎的发病率随下列三方面变化:(1)场所,(2)对血库是否做了丙氨酸转氨酶(ALT)检查,(3)消除高危病人患获得性免疫缺损综合症(AIDS)。大约有10%的输血引起PT-NANBH感染,并且其中的一半人转为慢性状态(Dienstag)。在完成抗HCV检查后,心脏手术病人(Alter)每单位输入血液的HCV血清转化率降到不足1%。
被证明已在人类受血者中产生输血后NANBH的人血浆样品,已成功地用于在黑猩猩(Bradely)中产生PT-NANBH感染。从感染黑猩猩血浆中分离的RNA,已用于在一个表达载体上构建cDNA文库,以免疫筛选慢性PT-NANBH感染人类个体的血清。此方法确定了一个PT-NANBH特异性的cDNA克隆,然后此病毒序列被用作探针去鉴定一组由PT-NANBH病毒体的7,300个连续碱基对组成的重叠片段。该已测序的病毒体被命名为丙型肝炎病毒(HCV)(例如,1988年11月18日申请的EPO专利申请88310922.5中所列的HCV序列)。现已能得到HCV的完整序列(约为9,500核苷酸)。
疾病控制中心(CDC;Phoenix,AZ,1973-1975;1978-17983)对灵长类动物的传染研究,最先提供了大量证据,证明多种非甲非乙型肝炎(NANBH)病原体的存在:与大多数NANBH病例有关的主要病原体现在已确认为HCV和HEV(参见上面),分别对应于PT-NANBH和ET-NANBH。疾病控制中心(CDC;Atlanta,GA,1989-现今)利用模型研究和商业检测对抗HGV抗体进行的最近流行病学研究表明所有后天获得的NANBH群体中约有20%也是非丙型肝炎。对这些样品是否有HEV的进一步检查(Reyes,等,WOA9115603(Genelabs Ins.)1990年10月17日)已经表明,这些后天获得非甲非乙非丙型肝炎病例也是非戊型的。
Sentinel县的病人肝脏活体组织样品、血清和血浆(Drs.MiriamAlter和Kris Krawczynski的研究),也表明许多真正的NANBH病例也是非丙型肝炎(所有HCV感染标记的血清学上和逆转录酶-聚合酶链式反应(RT-RCR;Kawasaki,等;Wang,等,1990)呈阴性),后来,这些肝炎病例发展为慢性肝炎,并表现为与病毒感染相同的迁延性肝炎(CPH)和慢性活动性肝炎(CAH)两种状态。发明概述
本发明是关于一种新发现的非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒病原体的鉴定分离,这里称之为庚型肝炎病毒(HGV)。本文揭示了部分HGV基因组的一族cDNA复制物。同时也公开了HGV序列和HGV变异体序列的分离和鉴定方法。
本发明包括HGV基因组多核苷酸、cDNA及其互补链。谈到多核苷酸,发明包括下面几方面:纯化的庚型肝炎病毒基因组多核苷酸;由HGV衍生的RNA和DNA多核苷酸;重组HGV多核苷酸;由从HGV或HGV变异体cDNA或它们的互补序列来源的序列组成的重组多核苷酸;编码HGV表位的重组多核苷酸;包括上述任一重组多核苷酸的一个重组载体,以及这些载体之一转化的宿主细胞。本发明的另一个方面是HGV和/或其变异体的多核苷酸探针。
当前利用序列信息把HGV与其它病毒序列比较,对HGV基因组特性进行研究,表明HGV是病毒种黄热病毒科(flavivirididae)的成员。
部分HGV衍生的cDNA序列的部分序列能被作为探针用于分离自然发生的病毒变异体,或确定样品中是否有病毒。这些cDNA序列也产生有用的HGV编码的多肽序列,包括HGV特异的多肽抗原。这些编码序列允许在诊断试验中作为试剂和/或作为疫苗成分,或作为标准物的多肽的产生。另外,利用这些cDNA序列来源的探针,可以对该HGV基因组其它部分进行分离和测序,因此得到有用于预防、治疗和诊断应用中的另外的探针和多肽。
本发明的其它几方面包括:掺入从HGV的cDNA或其互补链来源的一个开放阅读框(ORF)的一个重组表达系统,其中ORF与所需宿主相容的一段控制序列可操作地连接;用重组表达系统转化的细胞;以及由该转化细胞产生的多肽。
本发明的再一方面是:纯化的HGV颗粒;来自纯化的HGV的多肽制剂;纯化的HGV多肽;纯化的HGV肽;以及由一个表位组成的纯化多肽,该表位在免疫学上可识别HGV或HGV变异体带有的一个表位。
本发明包括的方面是:HGV多肽;由来自HGV基因组、HGV的cDNA或其互补链的序列构成的重组多肽;有一个HGV表位组成的重组多肽;以及由一个HGV多肽组成的融合多肽。
抗多肽序列中含有的HGV表位的单克隆和多克隆抗体,也用作治疗剂用于诊断试验,将cDNA来源的HGV病原体的分离,并且用于抗病毒试剂的筛选。
本发明还包括:抗一个HGV表位的多克隆抗体的制剂和抗多个HGV表位的单克隆抗体。
本发明涉及试剂盒的几方面是:在适宜容器中,调查样品中是否有HGV来源的多核苷酸,该多核苷酸包含一个多核苷酸探针,该探针包括大约8个或更多个核苷酸的HGV的一段核苷酸序列;分析样品中是否有抗HGV抗原的抗体,该HGV抗原由一段多肽组成,该多肽含有HGV抗原中存在的一个HGV表位;在适宜容器中分析样品中是否有HGV抗原,该HGV抗原由一个抗HGV的抗体组成。
本发明的其它方面还包括:吸附于一固体底物上的由一个HGV表位组成的一段多肽;吸附于一固体底物上的抗一个HGV表位的一种抗体。
本发明的其它方面是:产生一个HGV多肽的方法,包括在允许上面提及的多肽表达的条件下由一个表达载体转化的宿主细胞的培育,该表达载体含有编码一种HGV多肽的一段序列的;以及已由该方法产生的多肽(例如,含有一个HGV表位)。
本发明还包括:检测样品中HGV核酸的方法,包括使样品中的核酸与HGV多核苷酸探针在允许探针和样品的HGV核酸两者间形成多核苷酸双链体的条件下反应;以及检测含有该探针的多核苷酸双链体。本发明包括以下面杂交为基础的检测方法:报告分子标记;聚合酶链式反应;自我维持序列扩增;连接酶链式反应和链置换扩增。另外,检测方法包括信号放大(例如,支链DNA探针和Q-β复制酶方法)。
本发明还包括免疫检验法,有检测HGV的免疫检验法,包括在允许形成抗原-抗体复合物的条件下,将一个样品(怀疑其为HGV所感染)与抗HGV抗原/表位的探针抗体一起培育;以及检测含有该探针抗体的抗原-抗体复合物。检测抗HGV抗原的抗体的免疫检验法,包括将怀疑含有HGV的样品和含HGV表位的探针多肽在允许形成抗原-抗体复合物的条件下进行培育;并识别含探针抗原的抗体-抗原复合物。
本发明的另一方面是HGV疫苗,用于治疗和/或防制HGV感染,包括含有一个HGV表位的一个免疫原性多肽,或一个灭活的HGV制剂,或一个减毒的HGV制剂。
在另一个方面,本发明包括一个由HGV感染的组织培养细胞。在一个实施方案中,该组织培养细胞是灵长类动物肝脏细胞。
本发明的另一方面是产生HGV抗体的方法,包括将一个含有HGV表位的免疫原性多肽以适当的量投药给一个试验个体,促使产生免疫反应。
本发明还包括一个HGV嵌合多肽,该嵌合多肽含有至少两个HGV表位,并且该多肽基本上缺乏在天然HGV编码序列的表位间正常插入的氨基酸。这种嵌合多肽有用于上面讨论中的应用和方法。
本发明进一步包括表位递呈过程中模拟天然HGV抗原表位的一个随机肽表位(模拟表位)。这种模拟表位有用于上面讨论中的应用和方法。本发明还包括鉴定随机肽HGV表位的方法。在该方法中,产生或选择一个随机肽表位的文库。该文库与一个抗HGV抗体有关。模拟表位被鉴定为与抗体发生特异性免疫反应。可以使用由本发明的方法所产生的含抗HGV抗体的血清(含抗HGV抗体)或抗体。例如,随机肽文库能在噬菌体上表现或产生组合文库。
在另一方面,本发明包括治疗用化合物以及预防和治疗HGV感染的方法。
结合附图阅读下面对本发明的详尽描述,可更完整地理解本发明的这些和其它的目的和特征。附图简述
图1:SEQ ID NO:14的开放阅读框和470-20-1克隆的关系。
图2:显示谷胱甘肽亲和柱洗脱的梯度级分的典型的蛋白质简图。
图3:显示图2级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。
图4:显示阴离子交换柱洗脱的梯度级分的典型的蛋白质简图。
图4B和4C:显示对图4A级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。
图5A和5B:HGV和黄热病毒科其它两个成员-----猪霍乱病毒和丙型肝炎病毒的氨基酸顺序的比较。
图6:显示pGEX-Hisb-GE3-2载体的一部分,带有HGV表位的细菌表达质粒的图谱。
图7A-7D:显示纯化HGV的GE3-2蛋白的Western印迹分析结果。
图8A-8D:显示纯化HGV的Y5-10抗原的Western印迹分析结果。
图9A-9D:显示Y5-5、GE3-2和Y5-10抗原的Western印迹分析结果。
图10A-10F:显示GE-NS2b和GE-NS5a抗原的Western印迹分析结果。
图11:显示HGV编码序列的Kyte-Doolittle疏水性图解。
图12:显示HGV pET克隆用抗-T7.Tag单克隆抗体进行的Western印迹分析结果。
图13A-13D:显示HGV pET克隆GE-NS5b的Western印迹分析结果。图13E显示相关的考马斯染色凝胶。
图14A-14C:显示HGV pET克隆GE-E2的Western印迹分析结果。图14D显示相关的考马斯染色凝胶。
图15A-15C:显示HGV pET克隆GE-NS5b的Western印迹分析结果。图15D表明了相关的考马斯染色凝胶。
图16:显示HGV编码区的图解。发明详述
I.定义
下面定义的术语在本文有如下意义:
1.“非甲非乙非丙非丁非戊型肝炎病毒病原体{N-(ABCDE)}”:本文暂时称为HGV,意思是一种病毒、病毒型或病毒种类,(i)在某些灵长类动物是可传染的,包括口鬃(Mystax)、黑猩猩和人类,(ii)在血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV)(虽然HGV可能与上述病毒协同感染个体);(iii)属于黄热病毒科的成员。
2.“HGV变异体”被定义为病毒分离株,它们具有至少有约40%、优选55%或65%,较优选80%的完整序列同源性,也就是,整个长度的病毒基因组多核苷酸序列,与较公开的HGV多核苷酸序列(如SEQID NO:14)相同。
“序列同源性”本质上如下确定。相似长度(优选地,整个病毒基因组)的两个多核苷酸可认为是相互同源的,如果当利用ALIGN程序作序列比较,在最高记录的比较中40%以上,优选为55%或65%,较优选80%的核酸,被使用ktup为1、默认参数和默认PAM阵列比较为相同。
该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson,等,1988;Pearson,1990;程序来源于William R.Pearson,Department of Biological Chemistry,Box440,Jordan Hall,Charlottesville,VA)。
在确定两个病毒是否是互相“高度地同源的”,使用ktup为1,默认参数和默认PAM阵列的上述一套ALIGM程序,将一种病毒的所有病毒蛋白(或多蛋白)的完整序列与其它病毒的病毒蛋白或多蛋白进行最佳地、全部地序列比较。分析中没有排除不相似或相似区域。两个序列长度上的差异被认为是错配的。另外,通常将病毒结构蛋白质区域用于确定病毒分离株间的相关性。高度同源的病毒具有40%以上、优选好地55%或65%、或较优选80%的全部多肽序列相同。
3.如果两个核酸片段能同HGV或其变异体(如和HGV核酸但不是黄热病毒科其它病毒的多核苷酸杂交的探针)特异性杂交,或者特异性引导聚合酶链式反应,则两个核酸片段被认为是“选择地可杂交的”,(i)在典型的杂交和漂洗条件下,例如Maniatis等(第320-328,382-389页)所描述的;(ii)利用降低要求的严格漂洗条件,使得最高有约25-30%的碱基错配,例如:2×SSC,0.1%SDS,室温下重复两次,每次30分钟;然后,2×SSC,0.1%SDS,37℃,一次,30分钟;最后,2×SSC,室温下重复两次,每次10分钟,或(iii)在标准条件下(如Saiki,R.K.,等)选择用于典型聚合酶链式反应(PCR)的引物,使得HGV或其变异体序列的特异性扩增。
如本领域所熟知的,优选地,高度同源的核酸链含少于20-30%的碱基错配,甚至较优选碱基错配少于5-20%。利用适当严格洗涤条件,可选择上述程度同源性来鉴定基因文库(或其它来源的遗传物质)的克隆。
4.本文所用的“HGV多核苷酸”定义如下。对大于100个核苷酸的多核苷酸,HGV多核苷酸包括上述“2”条所定义的由HGV变异体及同源序列所编码的多核苷酸序列。对长度小于100个核苷酸的多核苷酸,HGV多核苷酸包括那些与HGV或其变异体序列可选择杂交的序列。另外,HGV多核苷酸包括编码HGV多肽的多核苷酸(见下文)。
本文所用的术语“多核苷酸”是指有骨架的聚合分子,骨架支持碱基能以氢键与典型核酸连接,其中聚合物骨架以某种方式提供碱基以允许这种氢键以序列特异方式存在于聚合分子和一段典型核酸之间(例如,单链DNA)。这类碱基典型地为次黄嘌呤核苷、腺嘌呤核苷、鸟嘌呤核苷、胞嘧啶、尿嘧啶、胸腺嘧啶。在本领域中已知许多多核苷酸修饰方法,例如标记、甲基化、以某种类似物替换天然存在的一种或多种核苷酸。
聚合分子包括双链或单链RNA和DNA,以及其骨架修饰物,例如,甲基膦酸脂连锁物。另外,这类聚合分子包括可替换的聚合物骨架,例如,但不仅限于,聚乙烯骨架(Pitha,1970a/b)、吗啉骨架(Summerton等,1992,1993)。已报道了各种其它带电或不带电的多核苷酸类似物。本领域已知许多骨架修饰方法,例如,但不仅限于,不带电连锁(如甲基膦酸酯,磷酸三酯、磷酸酰胺化物和氨基甲酸酯)和带电连锁(硫代磷酸酯、二硫代磷酸酯)。此外,连锁可能包括下列一般修饰:侧基部分,例如蛋白质(如包括核酸酶、毒素、抗体、信号肽和聚-L-赖氨酸);嵌合剂(如吖啶和补骨脂素)、螯合物(如金属、放射性金属,硼和氧化金属)、烷化剂和其它修饰类似物(如α-端基异构核酸)。
5.“HGV多肽”在本文被定义为任何同HGV多肽同源的多肽。本文所用“同源性”定义如下:在一实施方案中,如果多肽是由同HGV或其变异体序列选择杂交的核酸所编码的,则称该多肽和HGV多肽同源。
在另一个实施方案中,如上述所定义的如果某一多肽是由HGV或其变异体所编码的,则称该多肽和HGV同源,该组的多肽一般是大于15、优选为25、较优选为35个连续氨基酸。另外,对大于60个氨基酸的多肽,运用局部序列比较程序LALIGN进行确定“多肽同源性”的序列比较。如上所述,利用LALIGN程序将多肽序列与HGV或其任何变异体的氨基酸序列进行比较,所用Ktup为1、默认参数和默认PAM。
任一多肽(典型的是和HGV抗体不发生特异免疫反应的多肽),最佳序列长度是大于60个氨基酸,完全相同的排列的氨基酸大于65%,或优选为70%,或较优选为80%,被认为是一个“同源多肽”。该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson,等,1988;Pearson,1990;程序来源于William R.Pearson,Department ofBiological  Chemistry,Box440,Jordan Hall,Charlottesville,VA)。
6.如果一个多肽和HGV基因组、HGV的cDNA或其互补链有相同或大体相同的碱基对序列,或者表现上面“2”、“3”或“4”中所解释的那种同源性,则称该多肽“来源于”HGV。
如果一个多肽或多肽“片段”满足下列条件之一,也被称为“来源于”HGV:(i)由HGV多核苷酸的开放阅读框编码;或(ii)表现上面“2”或“5”所解释的同HGV多肽的同源性;或(iii)同HGV阳性血清有特异免疫反应的。
7.在多处上下文中,使用了“基本上分离的”和“纯化的”,主要是指HGV病毒颗粒、组分(如多核苷酸或多肽)、或从不相关或未污染成分(如血清细胞、蛋白质、非HGV多核苷酸和非抗HGV抗体)中分离的相关化合物(如抗HGV抗体)等的部分纯化。下面描述了分离或纯化感兴趣化合物或成分的方法和步骤(例如融合蛋白质和HGV多肽重组产物的亲和纯化法)。
8.本发明的上下文中,“核酸序列”当指编码蛋白、多肽或肽的序列时,包括编码同源的蛋白、多肽或肽序列以及本发明公开的序列的变性核酸序列。
9.“表位”是抗原决定簇,被定义为和抗体特定部位相互作用的抗原的特定部位。
10.抗原或表位和HGV阳性血清反应是“特异性免疫反应的”,此时,表位/抗原和HGV感染血清的抗体结合,但并不与没有或从来没有感染HGV的个体血清的绝大部分(一般高于90%,较高的为95%)抗体结合。“特异性免疫反应”的抗原或表位也能同抗特异HGV表位或抗原的单克隆或多克隆抗体发生免疫反应。
当抗体或抗体组合物(如多克隆抗体)和HGV抗原,而不是HAV、HBV、HCV、HDV或HEV抗原发生免疫反应时,称抗体或抗体组合物和HGV的反应是“特异性免疫反应的”。另外,“特异性免疫反应的抗体”并不同未感染或未接触HGV、HAV、HBV、HCV、HDV或HEV的个体正常血清中出现的主要抗原发生免疫反应。
II.N-(ABCDE)血清
抗HGV血清学检验的有效性和HCV-RNA的RT-PCR分析的研究(Kawasaki,等;Wang,等;1990)允许鉴定多种情况的输血后和群体获得性非HCV型肝炎。由疾病控制和防止中心负责通过Sentinel县获得性肝炎群体的研究,将人的肝炎病例,PNF2161最先鉴定为NANB肝炎(NANBH)(Alter,等,1989b)。PNF2161是从一个高龄高加索男性患者采集的样品,该患者输血后约8周发展为急性肝炎,高峰血清ALT水平达到1141IU(正常人≤45IU)。后来分辨出该急性肝炎的阵发性,在接下去的七年里,该病人的ALT水平呈现波动、且持续升高、符合慢性肝炎的情况,但是没有获得这种诊断的组织病理学证实。
用于克隆HGV(此处所描述的)的血浆样品是在1989年6月采集的,大约是在该阵发急性肝炎的4年后,并冷冻保存。根据第一代免疫试验检验(Ortho HGV ELISA Test System;Ortho Diagnostics,Raritan,NJ)一致的阴性结果,首先认为病人的PNF2161不是由HCV感染的。然而,利用第二代免疫试验(Ortho)和以HCV5’端非编码区的引物PCR的后来的试验证明该病人被HCV感染。
III.HGV相关序列的分离
作为一种鉴定含有HGV序列的方法,在λgt11表达载体上,从感染HGV的血清制备cDNA文库(实施例1)。然后选择多核苷酸序列用于与PNF2161血清发生免疫反应多肽的表达。第一轮筛选主要利用PNF2161血清(用于产生噬菌体文库)进行。还可以用其它可疑的N-(ABCDE)血清筛选。
由这种方法鉴定的重组蛋白为诊断试验提供了作为底物的候选肽。另外,由该方法鉴定的核酸编码序列作为有用的杂交探针,用于鉴定其它的HGV编码序列。
在λ-gt11上用上面描述的血清产生cDNA文库(实施例1)。在实施例1中图示的方法,将感染血清在没有稀释的8%PEG中沉淀,从所得的沉淀病毒产生文库。用同样的方法处理感染人群的血清。
超速离心法作为PEG沉淀法的有利替换方法,可用于从感染血清或其它生物制剂的样品中分离颗粒病原体。为从可被抽提出来的核酸中分离病毒颗粒,将2ml左右的血清,用PBS稀释到约10ml,3K离心10分钟,上清液在Ti70.1转子(Beckman Instruments,Fullerton,CA)中4℃以40,000rpm(大约110,000×g)超速离心2小时以上。吸出上清液,用标准核酸抽提技术抽提沉淀。
在以从沉淀血清抽提出的RNA为起始物质的逆转录反应中,利用随机引物产生cDNA文库。将所得的分子连接到不依赖序列的单引物扩增反应(SISPA;Reyes,等,1991)连接引物上,而后以非选择方法扩大,再克隆到合适的载体上,如λ-gt11,表达并筛选肽抗原。作为选择方法,也可用λ-gt10载体。
λ-gt11载体是尤其有效的表达载体,含有位于β-半乳糖苷酶基因翻译终止子上游53个碱基对的单一的EcoRI插入位点。因此,插入序列表达为β-半乳糖苷酶融合蛋白,融合蛋白含有β-半乳糖苷酶基因产物的N-端部分,杂合肽或者β-半乳糖苷酶肽的C-端区域(当杂合肽编码序列不含有翻译终止密码子时,C-端表达。)。
该载体产生的温度敏感性阻遏物(cI857),在允许温度(如32℃)下,此物导致病毒溶源现象的发生,并在提高温度(如42℃)时,导致病毒裂解。载体的优点包括以下几点:(1)高效率的重组克隆世代;(2)在允许,但不在非允许的温度下,根据宿主细胞的生长,能选择溶源的宿主细胞;和(3)能产生重组融合蛋白。此外,因为含有杂合插入序列的噬菌体产生失活的β-半乳糖苷酶,所以,利用β-半乳糖苷酶的比色底物转化反应,来鉴定带插入序列的噬菌体。
实施例1描述了N-(ABCDE)肝炎血清PNF2161的cDNA文库的制备。利用PNF2161对文库进行免疫筛选(实施例3)。鉴定了大量具有免疫反应活性的λ-gt11克隆。免疫阳性的克隆用噬菌斑纯化,并重新检验它们的免疫反应活性。此外,还检验了这些克隆与正常人血清的免疫反应活性。
这些克隆还用于检测克隆插入序列的“外源性”。这种基本试验确认所克隆的片段并不代表人或其它潜在污染核酸的一部分(如大肠杆菌、酿酒酵母和线粒体)。这类克隆插入序列的分离是通过EcoRI消化后的聚合酶链式反应扩增实现。插入序列纯化后,用放射性标记,作为针对膜上结合的正常人DNA、正常口鬃DNA和细胞DNA(对照DNA)的杂交探针(实施例4A)。
克隆470-20-1(PNF2161cDNA的来源)是用PNF2161的血清免疫筛选分离出的克隆之一。该克隆不与正常人血清反应。具有较大的开放阅读框(203bp;SEQ ID NO:3),与λ-gt11载体的β-半乳糖苷酶基因同在框内。利用人、酵母和大肠杆菌基因组DNA,通过基因组DNA杂交分析和基因组PCR分析,表明该克隆是外源的(实施例4B)。
RT-PCR确定了存在于PNF2161血清中的序列(实施例4C)。序列稀释PNF2161RNA的RT-PCR表明每ml溶液中至少有105的470-20-1特异序列的拷贝。在蔗糖密度梯度分级分离中,也可检测到该序列与类病毒颗粒的相关序列有相同的密度(实施例5)。
大肠杆菌表达的第二种克隆,克隆470-expl(SEQ ID NO:37)的细菌裂解物,也显示出以可与克隆470-20-1相比的水平与PNF2161血清发生特异性免疫反应。470-expl的编码序列在终止密码子的两侧(根据和SEQ ID NO:14的序列比较,见图1),并且内含甲硫氨酸。
利用克隆470-20-1的引物的锚式聚合酶链式反应(AnchorPCR),获得在SEQ ID NO:14中与克隆470-20-1近邻的其它序列。这种情况下,PNF21612-cDNA源文库被用作模板,其中cDNA/互补双链DNA产物被连接至λ臂,但该混合物是不包装的。
470-20-1特异引物用于以SISPA扩增的PNF2161cDNA作为模板的扩增反应(实施例4)。扩增的DNA片段的鉴定根据:(i)大小和(ii)同一个470-20-1特异寡核苷酸探针(SEQ ID NO:16)杂交。从SISPA扩增的PNF2161检测了到由PCR扩增的cDNA中的470-20-1特异信号,证明源材料中存在470-20-1序列。
该470-20-1特异引物还用于以下列RNA源为底物的扩增反应:正常口鬃肝脏RNA、正常狨猴(Sanguins Laboriatis)肝脏RNA和MY131肝脏RNA(实施例4)。这些试验的结果证明470-20-1序列存在亲本血清样品(PNF2161)和从受PNF2161样品(MY131)攻击的动物中取得的RNA肝脏组织样品中。对是否有470-20-1序列,两个正常对照RNA是阴性的。
另外,通过利用引物从选择的克隆序列的PCR直接检测了PNF2161血清和其它克隆源或相关的源材料。特定扩增产物的检测通过其与特定寡核苷酸探针470-20-1-152F(SEQ ID NO:16)杂交来检测。通过470-20-1特异引物来重现检测在多个PNF2161抽提物中的特异信号。
示于实施例4F的数据进一步支持了HGV和肝脏疾病间的疾病相关性。肝炎患者和肝功能不正常的血液提供者的血清被使用HGV特异引物,通过RT-PCR筛选法评估其HGV的存在。在152份这类血清样品中,检测到6份存在HGV特异序列。对照组样品(n=11)没有检测到HGV阳性。
上述结果表明,与肝脏N-(ABCDE)病毒感染(即为肝炎)相关的、和/或感染、以及发病的病毒病原体的分离,或其它组织和细胞类型的分离。
IV.HGV重组抗原的进一步鉴定
A.筛选重组文库
利用上述描述的筛选方法,可从本发明的文库中获得另外的候选HGV抗原。上述提及的cDNA文库已保藏在美国典型培养物保藏中心(12301 Patklawn Dr.,Rockville,MD,20852),并且已经分配给下列保藏登记号:PNF2161cDNA信息源,ATCC75268。
第二种PNF2161cDNA文库本质上如上述第一种PNF2161cDNA文库产生,除开第二种PNF2161cDNA源文库与λ-gt11臂相连,但是没有被包装。这种未包装的文库用于获得下述的延伸克隆。此第二种文库(PNF21612-cDNA源文库)的包装类型已保藏在美国典型培养物保藏中心(12301Parklawn Dr.,Rockville,MD,20852),并且已经分配给下列保藏登记号:PNF21612-cDNA信息源,ATCC75837。
除了上述产生的重组文库外,N-(ABCDE)肝炎血清中的其它重组文库也能如本文所述的类似地产生和筛选出来。
B.表位作图、基因组序列的交叉杂交和分离
抗原编码DNA片段的可根据下面鉴定:(i)如上所述的免疫筛选法,或(ii)利用一种算法(如“ANTIGEN”,Intelligenetics,MountainView,CA)对编码序列(如SEQ ID NO:14)进行计算机分析,来确定潜在的抗原区域。抗原编码DNA片段可以被亚克隆。亚克隆的插入片段被DNA酶I部分消化产生随机片段,或被特异性限制内切酶消化产生特异性亚片段。所得的DNA片段可插入λ-gt11载体中,并进行免疫筛选,以提供克隆的插入片段的表位图谱。
此外,在鉴定重叠HGV序列的杂交试验中可用DNA片段作探针,反过来,这些序列作为探针进一步用于鉴定一系列的连续克隆。这多套连续克隆的产生允许HGV基因组序列的阐明。
上述描述的任何一种克隆序列(如从SEQ ID NO:14或克隆470-20-1中获得的)都能用作cDNA和DNA文库的探针,如在λ-gt11或“λ-ZAP II”(Strategent,San Diego,CA)的载体上产生的文库。已知序列的特异亚片段可由聚合酶链式反应分离,或者用限制性内切酶酶切带有这些序列的载体。所得的DNA片段均能用作针对任何选择文库的放射性标记探针。特别地,克隆插入序列中的5’和3’端序列常用于鉴定其它克隆的探针。
另外,克隆插入序列的5’末端常作为序列特异引物用在首链cDNA或DNA链的合成反应中(Maniatis等,Scharf等)。例如,以PNF2161核酸为模板,利用从SEQ ID NO:14获得的特异引物,可制备特定可作引物的PNF2161cDNA和DNA文库。利用RNA酶H和DNA聚合酶I合成新的cDNA第二链。上述过程鉴定或产生与一5’紧邻已知克隆序列的核酸区域对应的DNA/cDNA分子。这些新分离的序列反过来用于进一步鉴定侧翼序列等等,以及鉴定组成HGV完整基因组的序列。如上所述,分离新的HGV序列后,克隆和免疫筛选多核苷酸,鉴定编码HGV抗原的特异序列。
利用实施例6中所述的“锚PCR”方法克隆PNF470-20-1(SEQID NO:3),获得含有感兴趣的其它序列的延伸克隆序列(SEQ IDNO:14)。简单地说,该策略是将PNF2161SISPAcDNA和λ-gt11臂连接,然后以一种gt11特异引物和两种470-20-1之一的特异引物进行扩增连接反应。
将扩增产物进行电泳分离,转移到滤纸上,用470-20-1特异探针去探测结合到滤纸上的DNA。对信号杂交阳性带的相对应的带,用凝胶纯化、克隆并测序。
C.抗原多肽和抗体的制备
以标准的蛋白纯化方法来纯化本发明的重组肽,这些方法包括差示沉淀、分子筛层析、离子交换层析、等电聚焦、凝胶电泳和亲和层析。
在本发明的一种实施方案中,本发明的抗原的多核苷酸序列已在质粒pGEX(实施例7A)或其各种衍生物(pGEX-GLI)上克隆。质粒pGEX(Smith等,1988)和其衍生物表达了克隆插入序列的多肽序列,该插入序列在框内融合到蛋白谷胱甘肽-S-转移酶(Sj26)上。在一个载体结构中,质粒pGEX-hisB,在该融合蛋白的羧基端导入了6个组氨酸的氨基酸序列。
如实施例7A所述,各种重组pGEX质粒可被转化到合适的大肠杆菌菌株中,并且加入IPTG(异丙基-硫代-半乳糖苷)可诱导产生融合蛋白产物,接着使用谷胱甘肽琼脂亲和层析法可将溶解的重组融合蛋白质从被诱导的培养物的细胞溶胞产物中纯化(实施例7A)。
在含6M尿素或6M异硫氰酸胍的缓冲液(这两种物质有利于蛋白质的溶解)中,通过固化金属离子亲和层析(Porath),可纯化的质粒pGEX-hisB表达的不可溶融合蛋白。其它的由pGEX-GLI或其衍生物表达的不可溶性蛋白的纯化,利用离心沉淀的组合,去除可溶性蛋白,接着再溶解不可溶性蛋白。并用标准层析方法,例如离子交换或大小排阻层析,以及其它这类本领域中已知的方法。
在为β-半乳糖苷酶的融合蛋白时(如λ-gt11克隆产生的),通过亲和层析,使细胞溶胞产物通过表面结合抗β-半乳糖苷酶抗体的固相支持物等可容易地将融合蛋白质分离。例如,实施例7B中描述了通过亲和层析纯化由470-20-1编码序列获得的β-半乳糖苷酶/融合蛋白。
本发明还包括了表达载体,如上述的λ-gt11和pGEX载体,它们含有HGV编码序列和使得编码区在合适的宿主上表达的表达调控元件。调控元件一般包括启动子、翻译起始密码子、翻译和转录终止序列以及将插入序列导入载体的插入位点。
编码所需抗原多肽的DNA可克隆到任何数量的商业上可获得的载体上以在合适的宿主系统中表达产生多肽。这类宿主系统包括,但不仅限于:杆状病毒(Reilly,等;Beams,等;Pharmingen;Clontech,PaloAlto,CA)、痘苗病毒(Earl,1991;Moss,等)、细菌(Ausubel,等;Clotech)、酵母(Gellissen,1992;Romanos,1992;Goeddel;Guthrie and Fink)、哺乳动物细胞(Clontech;Gibco-BRL,Ground Island,NY)、如中国仓鼠巢(CHO)细胞系(Haynes,1983,Lau,1984,Kaufman,1990)。这些重组多肽抗原都可直接表达或做为融合蛋白表达。许多特征可改造到表达载体中去,例如提高表达序列在培养介质中的分泌的引导序列。
实施例16中描述了利用这些系统中的几种表达的大量HGV多肽。
在酵母系统中的表达具有商业产品的优势。痘苗病毒和CHO细胞系的重组蛋白产品具有哺乳动物表达系统的优点。此外,痘苗病毒表达系统有如下优点:(i)宽的宿主范围;(ii)忠实的转录后修饰、加工、折叠、转运、分泌和重组蛋白的装配;(iii)相对可溶的重组蛋白的高水平表达;和(iv)很大的容纳外源DNA的容量。
重组表达多肽产生的HGV多肽抗原主要是从裂解的细胞或培养基中分离得。纯化可通过本领域已知的方法来进行,包括分级盐析、离子交换层析和亲和层析。使用根据本发明的方法鉴定的HGV抗原产生的抗体的免疫亲和层析可被采用。
还可从HGV颗粒中分离HGV多肽抗原(参见下文)。
多肽的连续抗原决定簇一般相对较小,典型的长度是6-10个氨基酸。较小的片段已被鉴定为如在构象表位中的抗原区。如上所述鉴定HGV多肽抗原。任一链的所得DNA的编码区可被重组表达融合蛋白或分离多肽。另外,利用商业上可获得的合成器(Applied Biosystems,fosterCity,CA)或“PIN”技术(Applied Biosystems),可方便地化学合成氨基酸序列。
在另一个实施方案中,本发明包括由多个表位组成的嵌合蛋白。一个典型的HGV嵌合多肽至少含有两个HGV表位,该多肽基本上缺乏正常插入在天然HGV编码序列中的两个表位间的氨基酸。利用上述的多肽表达载体/宿主系统,运用标准重组DNA技术可构建产生嵌合蛋白的编码多个串联表位的合成基因(Crea;Yoshio等;Faton等)。
此外,通过前面描述的方法可化学合成多抗原肽(Tam,J.P.,1988;Briand等)。例如,带α-和e-氨基基因的赖氨酸残基的一小段免疫学惰性的核心基质可被用于锚定代表感兴趣表位相同或不同合成多肽(典型的长度为6-15个残基)的多拷贝。嵌合蛋白或多抗原肽抗原,由于多表位分布导致的信号放大,在免疫检测中有较高的敏感性和特异性。
这些方法之一获得的抗原都可用于抗体产生、诊断试验和疫苗开发。
另一方面,本发明包括抗本发明多肽抗原的特异抗体。由任何这类方法之一获得的抗原可直接用于抗体产生,或者可被偶联至合适的载体分子中。在本领域中业已知许多这类载体,并可从商业购得(如Pierce,Rockford IL)。为制备抗体,一般用纯化抗原或融合蛋白抗原免疫宿主动物(如兔子)。用各种从其它蛋白,如谷胱甘肽-S-转移酶或β-半乳糖苷酶获得的编码序列产生杂交的或融合的蛋白。按照适宜的时间间隔,收集宿主的血清或血浆,检测这类血清中抗该抗原的特异性抗体。实施例8叙述了特异性抗Sj26/470-20-1杂合蛋白中的470-20-1抗原的免子血清抗体的产生。这些技术同样适用于从HGV获得的所有致免疫的序列,包括,但不仅限于,那些从编码序列,如SEQ ID NO:14中获得的。
如通过使用饱和硫酸氨沉淀或DEAE Sephadex层析、亲和层析、或其它本领域技术人员已知的产生多克隆抗体的方法,可获得免疫动物的γ-球蛋白质片段或IgG抗体。
另外,纯化的抗原或融合的抗原蛋白可用于产生单克隆抗体。这里从免疫动物分离脾脏或淋巴细胞,用本领域技术人员熟知的方法,使它们获得不死性或用于制备杂交瘤。要产生人来源杂交瘤,选择人的淋巴细胞供体。已知感染HGV的供体可作为合适的淋巴细胞供体。可从外周血液样品中分离出淋巴细胞。利用Epstein-Barr病毒(EBV)使人源淋巴细胞无限增殖,或可用一个适当的融合伴侣产生人源杂交瘤。也能用病毒的初级体外致敏的特异多肽产生人源单克隆抗体。
筛选由无限增殖细胞分泌的抗体,例如利用ELISA或Western印迹方法,确定分泌需要的特异性抗体的克隆(实施例10;Ausubel等)。
运用HGV阳性血清或血浆,或本发明的抗体,可以分离其它的抗原肽和表位。例如,已开发大量不同技术来同时合成许多肽(Geysen,等;Houghten;Frank and Doring;Hudson)。特别有用的方法是Geysen等开发的,因为它可相对简单地产生大量不同肽序列并被检测抗原性。在Geysen方法中(亦可称为MULTI-PIN肽合成法),肽的合成是在与微量滴定板相连的聚丙烯酰胺酸性嫁接聚乙烯棒上进行的。MULTI-PIN的方法允许利用本发明的单克隆或多克隆抗体,商业可购得试剂和设置免疫筛选大量合成物(每板96肽),鉴定和表征免疫反应的肽。
已报道,可在两星期的时间内合成多达6,000个寡肽,因此通过合成某一特定抗原所有可能重叠的氨基酸顺序,可以筛选出针对单氨基酸分辨力的表位的病毒抗原顺序(Geysen,等)。
筛选免疫显性肽的另一种方法,是利用常规自动肽合成法合成对应于HGV编码序列的较长肽(Garter,等,1994;Obeid,等,1994;Commandaeur,等,1994)。该方法的优点是较长肽能折叠成模拟构象表位的形状。
HGV抗体,特别是单克隆抗体,也能用于鉴定模拟病毒编码的靶多肽的随机多肽(Scott and Smith,1990;Smith,1991)。例如,在噬菌体上表现的随机肽文库(RPL)(Scott and Smith,1990)可作为抗体产生或疫苗开发的肽配体来源。RPL法允许含有噬菌体表面的融合蛋白的配体表达,以及抗体亲和筛选的配体编码噬菌体的富集(Smith,J.P.,1991;Christian,等;Scott,等,1992;Folgori,等)。通过在表位呈递期间特异抗体模拟天然抗原表位(模拟表位)来检测这些随机肽表位。可从RPL、六至十肽噬菌体表位(噬菌体表现的模拟表位)分离HGV抗原模拟物(模拟表位),可通过公开的方法(Scott andSmith;Smith,J.P,1991,Christian,等,Scott,等,DeGraaf,等,Folgori,等)表达RPL,并且通过与HGV相关的人血清或本发明的抗体来筛选。
下面是用RPL分离470-20-1模拟表位的一个实施例。根据前面描述的方法构建随机十肽-pIII融合噬菌体显示文库(DeGraaf等,1993)。简而言之,一条化学合成的单链变性插入序列被退火成较短小的产生SfilI限制性悬突。退火DNA连接到SfilI酶切的USE-5载体DNA。
将大肠杆菌MC1061用连接的DNA转化。在含20mg/ml四环素的LB培养基中,通过约群体倍增10倍扩增文库。利用一种或多种470-20-1免疫反应的血清(或本发明的抗体)亲和性选择该文库。在50mMNaHCO3,pH9.6,4℃过夜,用硫酸铵分级分离的阳性血清(如PNF2161)包装聚苯乙烯玻璃珠。抗体包被的玻璃珠全部用PBS漂洗,并用BSA封闭。
这些血清包被、封闭的玻璃珠用过量M13K07-UV杀死的噬菌体4℃温育4小时。接着将文库噬菌体加入上面的预保温混合物中,并在4℃下,温育12小时。除去未结合的噬菌体,并且用TTB缓冲液(50mMTris,pH7.5,150mM NaCl,0.5%“TWEEN20”(V/V),1mg/mlBSA)广泛地漂洗玻珠。用洗脱缓冲液(0.1M HCl,用2MTris-HCl,pH9.0将pH调至2.2)洗脱结合的噬菌体。利用噬菌体免疫筛选法,用二级阳性血清(Mys136血清)筛选洗脱的、富集的噬菌体。
进一步筛选选择的噬菌体表位,可用大组的阳性和阴性血清或特异HGV单克隆抗体来进行。选择所得的噬菌体表位可直接用于ELISA检测或抗体产生。另一方面,噬菌体表位编码核苷酸序列可在常规载体/宿主系统中确定、表达、并用作抗原。
上述鉴定的模拟多肽,反过来又可作为检测试验的抗原或用于产生抗原特异抗体。
D.ELISA和Western印迹筛选
当通过上述的噬菌斑免疫筛选鉴定了HGV抗原时,可将该抗原表达和纯化。利用另一些免疫检验法,如采用分离抗原肽的ELISA或Western印迹分析,可快速筛选抗大量可疑感染HGV肝炎的血清的抗原。该抗原多肽融合物可按如上所述分离,通常用对融合伴侣,如β-半乳糖苷酶或谷胱甘肽-S-转移酶的亲和层析。另一方面,利用抗原自身产生的抗体来纯化抗原(参见下面)。
实施例10提供了一般ELISA检验形式。Harlow等描述了许多用于免疫分析和抗体/抗原筛选的技术。
含有感兴趣的抗原的纯化的抗原多肽或融合多肽,被连接到一个固相支持物上,例如多孔聚苯乙烯平板。稀释待检测血清,加到各孔中。经过抗体和结合抗原充分结合的一段时间,将血清从孔中清洗掉。在每个孔中加入标记的报告抗体和适当的底物,含有与纯化的抗原多肽或含有抗原的融合多肽结合的抗体的孔通过阳性信号来检测。
实施例10提供了利用本发明多肽抗原进行Western印迹分析的一般形式。Ausubel等描述了一般的Western印迹方法。在实施例10中,利用470-20-1/Sj26融合蛋白筛选大量的血清样品。实施例10提供的结果证明多种不同来源的N-(BACDE)肝炎血清与多肽抗原的免疫反应。
上面提供的结果证明本发明的多肽抗原能通过这些方法依靠被怀疑为HGV感染的血清样品的组(panel)被快速筛选来检测HGV。
E.细胞培养系统,动物模型和HGV的分离
已在黑猩猩、恒河猴和四种口鬃父体中进行了HGV传染性的研究。这些研究产生了在这些动物模型上有关HGV传染性的进一步的信息。本文说明书描述的HGV具有能感染恒河猴和黑猩猩的优点。
另外,从感染动物(黑猩猩、狒狒、猴和人类)获得的原代肝脏细胞可在体外培养。公开了可以使分化的灵长类动物肝细胞长期保持分化的补充了生长因子和激素的无血清培养基(Lanford,等;Jacob,等;1989,1990,1991)。除了原代肝细胞的培养物,也能产生感染细胞的无限增殖培养物。例如,可将原代肝脏培养物融合到各种细胞(如HepG2)中来提供适宜的无限增殖的细胞系。通过导入癌基因或引起转化的表型基因,也可使原代肝细胞培养物无限增殖。这些癌基因或基因可从本领域已知的来源中获得,包括SV40、人类细胞的癌基因和EpsteinBarr病毒。
另外,未感染的肝细胞(如原代或连续肝癌细胞系)可通过将培养物中的细胞与HGV接触而被感染,该HGV为部分纯化的颗粒制剂(例如,从感染血清中通过差速离心和/或分子筛制备),或存在于感染血清中。然后可增殖这些感染细胞,而且通过本领域已知方法的传代病毒。此外,其它细胞类型,例如淋巴样细胞系,也可用于HGV的增殖。
通过HGV蛋白相似性研究,检测了和黄热病毒科其它病毒相似的氨基酸区域。众所周知,该病毒科的成员可在各种组织培养系统中增殖(ATCC-病毒目录,1990)。通过类推有可能HGV也可以在下列一个或多个组织培养系统中繁殖:Hela细胞、原代仓鼠肾细胞、猴肾细胞、Vero细胞、LLC-MK2(恒河猴的肾细胞)、KB细胞(人类口腔表皮样癌细胞)、鸭胚胎细胞、原代绵羊柔脑膜(leptomeningeal)细胞、原代绵羊脉络丛细胞、猪肾细胞、牛胚胎肾细胞、牛陀螺状细胞、鸡胚胎细胞、原代免肾细胞、BHD-21细胞或PK-13细胞。
除了表达HGV,HGV多核苷酸序列、cDNA或体外转录的RNA的区域均可通过重组方法导入组织培养细胞中。这种重组操作允许HGV各部分的独立表达。
可从感染组织,特别是感染细胞培养物中制备RNA样品,RNA样品可在凝胶中分级分离,并转移到膜上用于利用从克隆HGV序列衍生的探针所进行的杂交分析。
HGV颗粒可按本领域已知的方法从感染血清、感染组织、上述的细胞培养介质、或培养的感染细胞等中分离出来。这些方法包括按大小的分级分离技术(即超滤法、沉淀法和沉降法),利用阴离子和/或阳离子交换材料的方法,根据密度、疏水性和亲和层析的分离方法。在分离过程中鉴定HGV可:(i)利用本发明的抗HGV肝炎相关病原体的抗体;(ii)通过利用已鉴定的HGV核酸序列的杂交探针(如实施例5);(iii)通过RT-PCR。
通过免疫亲和层析,抗HGV抗体可被用于HGV颗粒的纯化(Harlow等;Pierce)。在方法中抗HGV多肽或融合多肽(如470-20-1)的抗体被以使抗体保持其免疫选择性的方式固定到固相支持物上。为实现抗体和固相支持物的这种附着作用,含有间隔基的双功能偶联剂常用于保持抗体的抗原结合位点的可通性。
用标准方法可进一步对HGV颗粒进行鉴定,这些方法包括,但不仅限于,免疫荧光的显微镜检查、电子显微镜检查、组成颗粒蛋白质的Western印迹分析、利用部分纯化颗粒在动物或细胞系统上的传染性研究以及沉降鉴定方法。实施例5中所示的结果表明,本发明的病毒颗粒更接近于包被型病毒颗粒,而不是无包被的病毒颗粒。
可将HGV颗粒破裂获得HGV基因组。破裂颗粒可通过如在螯合剂存在下用去污剂进行处理而获得。然后就可以进一步鉴定基因组核酸。鉴定包括DNA酶和RNA酶敏感性的分析。基因组的链型(strandedness)(实施例4I)和构型(如环状的)可通过本领域已知的方法而被确定,包括电子显微镜目测方法和沉降鉴定。
所分离的基因组还使对整个基因组序列分析成为可能,无论基因组是否是片段的,是RNA还是DNA基因组(例如利用RT-PCR、染色体步移方法或利用来自紧邻克隆序列的引物的PCR)。确定完整的HGV序列允许基因组结构研究和HGV序列与已知病毒原体的编码和调控序列的比较。
F.筛选具有抗HGV肝炎活性的试剂
使用繁殖HGV的细胞培养基和动物模型系统为筛选抑制感染HGV的产生的抗肝炎试剂提供了可能:特别是筛选抑制HGV复制的药物。细胞培养物和动物模型允许评价这种抗肝炎药物对正常细胞功能和生存能力的效果。可能的抗病毒试剂(包括天然产品或合成化合物;如小分子例如真菌抽提物的混合物和反义寡核苷酸等),被典型地用于筛选一定浓度范围的抗病毒活性。然后评价其对HGV复制或抗原产生的作用,主要通过监控病毒大分子的合成或大分子的积累(如DNA,RNA或蛋白质)。这种评估常以抗病毒试剂对正常细胞功能的作用为标准(如DNA复制、RNA转录、一般的蛋白质翻译等)来作出。
可通过包括本发明中描述的那些的许多方法来进行。例如,可产生抗本发明抗原的抗体,并且这些抗体被用于以抗体为基础的分析中(Harlow,等),以鉴定和定量细胞培养基中的HGV抗原。利用竞争性分析定量培养基中的HGV抗原:在这个分析中可使用克隆HGV序列编码的多肽。通常,重组产生HGV抗原多肽,并用于生产单克隆或多克隆抗体。利用一个报告分子标记重组HGV多肽。然后评估含有HGV抗原样品(如细胞培养基或血清)中出现的这种标记多肽和其相关抗体结合的抑制作用。通过抑制水平和使用已知浓度的未标记重组蛋白产生的标准曲线的比较,确定样品中的HGV抗原水平。
本发明的HGV序列尤其有用于产生多核苷酸探针/引物,该探针/引物可被用于定量细胞培养系统中产生的HGV核酸序列的量。这种测定可由多种方法实现。例如,可将用报告分子标记的探针用于标准斑点印迹杂交,或用于感染细胞核酸标记的探针的竞争性分析。另外,存在许多使用聚合酶链反应来定量样品中目标核酸的水平的方法(Osikowicz,等)。
利用上述的细胞培养基和动物模型系统亦可鉴定保护性抗体。例如,产生本发明抗原的多克隆或单克隆抗体。然后,在感染细胞培养物或动物前,用这些抗体预处理含HGV传染性接种物(如血清)。评估单抗体或多抗体混合物保护细胞培养物或动物免受感染的能力。例如,在细胞培养物和动物中,缺乏病毒抗原或核酸产物的被作为筛选物。另外在动物中,没有HGV肝炎病症状的(如提高的ALT值),也是保护性抗体存在的指示。
另外地,康复病人的血清可被用于筛选保护性抗体的存在,然后,这些血清可被用于鉴定和抗体结合的HGV肝炎相关病原体抗原。而后重组或合成产生所鉴定的HGV抗原。如上所述检测抗原产生保护性抗体的能力。
经初次筛选后,抗原或鉴定具有产生保护性抗体能力的抗原,其单用或结合使用,都可作为接种试验动物的疫苗。然后用传染性HGV感染动物。免受感染表明该动物具有产生保护它们自身免受感染的抗体的能力。另外,应用动物模型允许鉴定激活细胞免疫的抗原。
在动物模型研究中,应答受病毒制剂(如感染血清)挑战的保护性免疫反应:(i)保护动物免受感染;(ii)防止疾病发生。
G.疫苗及保护性免疫的产生
由本发明的方法所鉴定的一种或多种免疫原性多肽可制备疫苗。在HGV分离序列和其它已知病毒蛋白之间的基因组结构相似性,可提供有关可以作为有效疫苗的候选多肽的信息。此外,许多计算机程序可用于鉴定编码蛋白抗原决定簇区域的分离序列相似区域(例如,Hopp等;“ANTIGEN”Intelligenetics,Mountain View CA)。
含有免疫原性多肽作为活性成分的疫苗,一般被制成可注射的溶剂或悬浊剂。另外,免疫原性多肽可被制成固体或冷冻状态,这些状态适合于注射前重悬浮成水溶液形式。该免疫原性多肽也可被乳化或被脂质体包被。多肽常常和与之相容的药学上可接受的赋形剂混合在一起。这类赋形剂包括,但不仅限于,下列物质或下列物质的结合:盐水、水、糖(如葡萄糖和山梨醇糖)、甘油、酒精(如乙醇[EtOH])和本领域已知的其它物质。此外,疫苗制剂可能含有少量其它辅助物质,如润湿剂、乳化剂(如洗涤剂)和pH缓冲液。另外,可增加疫苗制剂有效性的许多佐剂也是适合的。这类佐剂包括,但不限于下列:一类相关化合物包括N-乙酰基-胞壁酰基(muranyl)-L-苏氨酰基-D-异谷氨酰胺和N-乙酰基-去甲-胞壁酰基(muranyl)-L-丙氨酰基-D-异谷氨酰胺的基团,以及氢氧化铝。
本发明的疫苗中所用的免疫原性多肽可以是重组、合成或从减毒HGV颗粒分离的。多肽通常被配制成中性或盐形式的疫苗。本领域熟知的药学上可接受的有机或无机盐。
HGV肝炎相关病原体疫苗,典型地通过皮下或肌肉内注射非肠胃方式使用。其它合理的制剂包括口服剂和栓剂。口服剂通常使用赋形剂(如药物级糖、糖精、纤维素或类似物),常含有10-98%的免疫原性多肽。口服组合物以丸剂、胶囊、片剂、溶液剂、悬浊剂、粉剂等形式存在。并被制成允许持久的和长期的释放。栓剂利用常规的粘合剂和载体,一般含有0.1-10%的免疫原性多肽。
鉴于上述信息,可生产抗HGV肽相关病原体的多价疫苗,它由一种或多种结构性或非结构性的病毒病原体多肽组成。这些疫苗含有例如,重组表达的HGV多肽、从HGV病毒颗粒分离的多肽、合成多肽或嵌合多肽形式的装配表位。另外,还可制备保护性疫苗,它通过使用灭活的HGV授予抗HGV肝炎感染的保护。这种失活可通过制备病毒裂解液,接着用适宜有机溶剂,洗涤剂或福尔马林处理裂解液来完成。
从减毒HGV病毒株也可制备疫苗。利用上述细胞培养物和/或动物模型系统可获得这种减毒HGV。一般在体外或体内多次传代后分离减毒菌株,通过本领域已知方法进行减毒菌株的检测。检测减毒株的一种方法是用抗HGV抗原的抗体探针、序列特异的杂交探针,或使用被感染动物的序列特异性引物的扩增,或体外培养物中的HGV感染分析。
另外,除了上面的方法,可根据从本说明书所示信息中获得的基因组信息,构建该减毒HGV株。典型地可删除感染病原体基因组的一个区域,该区域编码例如与病毒病理有关的多肽。这种删除不含干扰病毒复制。另外,重组的减毒HGV构建物允许一个或多个能引起抗HGV的保护性免疫反应的表位的表达。这种所需的免疫反应可包括体液和细胞免疫。然后,将减毒HGV的基因组用于转化细胞,并让这些细胞在允许病毒复制的条件下生长。该减毒株不仅可用作疫苗,而且可作为病毒抗原和/或HGV颗粒的生产来源。
还能产生含HGV表位的杂交颗粒免疫原。HGV表位的免疫原性可通过在真核系统中(如哺乳动物或酵母系统)表位的表达而增强,其中表位与已知的颗粒形成蛋白质融合或装配。一种这样的蛋白是乙型肝炎的表面抗原。其中HGV表位直接和颗粒形成蛋白编码序列连接的重组构建物将产生杂交蛋白,该蛋白对相关的HGV表位和颗粒形成蛋白是有免疫原性的。另外,不包含在颗粒形成中的颗粒形式蛋白编码序列的选择部分,可被与HGV表位对应的编码序列替换。例如,与颗粒形成蛋白发生特异免疫反应的区域可被HGV表位序列替换。
在酿酒酵母(saccharomyces cerevisiea)和哺乳动物细胞中,已表明乙型肝炎表面抗原可被表达并被装配到颗粒中(Valenzuela,等,1982和1984;Michelle,等)。这些颗粒显示出具有被增强了的免疫反应性。以前已公开了使用杂交蛋白,即带有杂合病毒序列的重组构建物来形成这些颗粒(EPO175,261,1986年3月26日公布)。这种含HGV表位的杂交颗粒在疫苗应用中也是有用的。
本发明疫苗以与制剂方法相容的剂量和对预防和治疗处理为药理学有效的量使用,以这样的剂量免疫,对预防或治疗处理是药理学有效的。使用的免疫原的量依赖接受治疗的个体,治疗个体免疫系统产生保护性免疫反应的能力和所需的保护水平。
本发明的HGV疫苗可以单剂量或多剂量使用。还根据治疗个体的需要和耐受力确定剂量范围。除HGV免疫原性多肽外,疫苗制剂可与其它免疫调节剂结合而被使用。
在另一种HGV接种方法中,在合适的调控子控制下,编码HGV蛋白的DNA构建物可被直接导入哺乳动物体内组织。导入这种构建物产生“基因免疫”。细胞摄取相似DNA构建物,并表达编码的蛋白(Wolf,等;Ascadi,等)。注射的DNA并未表现出整合到宿主染色质上或复制。这种表达引起了实质性的体液和细胞免疫反应,包括在动物系统中免受体内病毒的攻击(Wang,等,1993;Ulmer,等)。在一个实施方案中,用局部麻醉剂如盐酸布比卡因和尼泊金甲酯的等渗盐水进行预处理以利于细胞DNA吸收,而后将该DNA构建物注射到骨骼肌肉中。注射的DNA构建物被肌肉细胞吸收,并表达所编码的蛋白。
同用可溶性病毒亚基蛋白接种比较,基因免疫接种具有在体内真实表达病毒蛋白的优点。这些病毒蛋白的表达和宿主细胞主要组织相容性抗原和其它蛋白有关,正如用天然病毒感染发生的情况。同许多可溶性亚单位蛋白疫苗相比,这种类型的免疫接种能够诱导体液和细胞免疫反应。相应地,该类型的免疫接种保留了许多活的减毒疫苗的有利特征,而没有用传染性病原体的接种和护理安全性问题。
直接将编码所需疫苗抗原的质粒或其它DNA构建物注射到体内组织是一种传送方式。也可使用其它传送DNA构建物的方式。这包括各种以脂质为基础的方法,其中DNA被用脂质体,阳离子脂试剂或细胞转染剂(Cytofectin)(如脂质转染剂(Lipofectin))进行包装。如Felgner和Rhodes(1991)所归纳的,这些方法便于体内吸收和表达。对这些基本方法的各种修改如下:掺入这些多肽或其它的部分,以便于(i)靶向特殊细胞;(ii)DNA构建物吸收后的细胞内处理;(iii)便于表达。另外,编码需要的疫苗抗原序列可被插入到合适的反转录病毒载体。将所得的重组反转病毒载体接种个体以在体内表达疫苗抗原。接着抗原诱导免疫应答。如上面所提及的,这种方法已显示出能针对病毒抗原诱导体液和细胞免疫(Irwin,等)。
另外,本发明的HGV疫苗可与其它疫苗,如其它的肝炎疫苗结合使用。
H.合成肽
利用HGV多肽的编码序列,即可产生与这些多肽相应的合成肽。使用本领域标准方法和设备(Applied Biosystems,Foster City CA),可商业合成或制备合成肽。
另外地,通过寡核苷酸合成的标准方法可直接合成编码肽的寡核苷酸序列,或若是长的编码序列,则由一系列克隆步骤合成,这些步骤包括多个相应于编码序列的寡核苷酸片段的串联排列(Crea;Yoshio等;Eaton等)。用标准重组方法能够表达寡核苷酸的编码序列(Maniatis等;Ausubel等)。
V.该病毒基因组的鉴定
如实施例4所示,HGV基因组看起来象RNA分子,并与黄热病毒科的病毒所列出的病毒序列有最接近的序列相似性。该科包括黄病毒、瘟疫病毒和由一种丙型肝炎病毒组成的未分类的属。HGV病毒没有明显的与其它可辨别的黄病毒成员相同的全(即整个病毒长度)序列----除了下面讨论的蛋白结构域单元。
黄热病毒科的一般成员是包被型病毒,该病毒在蔗糖梯度中的密度介于1.1和1.23g/ml,并对热、有机溶剂和洗涤剂敏感。如实施例5所示,HGV具有与一种包被型黄热病毒科病毒(HCV)相似的密度特征。HGV病毒颗粒整体也显示对有机溶剂是敏感的(实施例5)。
黄热病毒科的病毒颗粒含有一个线性单链(ss)RNA的单分子,它也是编码病毒蛋白的唯一的mRNA。此ssRNA分子长度一般为9-12Kb大小。
病毒蛋白来源于一个多蛋白前体,此前体后来加工成为成熟病毒蛋白。黄热病毒科的大部分成员在3’末端没有poly(A)尾部。病毒颗粒具有约15-20%重量的脂。
黄热病毒科的成员具有一个核心蛋白和2或3个与膜相关的蛋白。黄热病毒科中三个属中成员的类似结构蛋白在序列水平上相互间显示出极少的相似性。非结构性蛋白含有RNA依赖的RNA聚合酶(RDRP)、解旋酶和丝氨酸蛋白水解酶的保守结构域单元。利用本领域已知的计算机算法,如“MACAW”(Schuler,等)能够检测保守氨基酸的结构域单元的短的模块。这些结构域单元可能与被这些蛋白加工的底物的限制物有关(Koonin and Dolja)。这些结构域的顺序在黄热病毒科的所有成员中是保守的。HGV基因组含有在黄热病毒科成员中发现的蛋白结构域单元,例如:(i)解旋酶基因;(ii)类丝氨酸蛋白水解酶结构域;(iii)RNA依赖的RNA聚合酶(RDRP)(见图5,“GDD”序列)。
本文公开了多个不同HGV毒株/分离株的序列信息。该信息能被本领域技术人员使用,利用杂交技术、引物延伸和本文所述的RT-PCR分离新的毒株/分离株(例如,以公开的HGV变异体序列为基础的变性引物)。
在现在的情况下,HGV是一种新的分离株,被认为是黄热病毒科的成员。在该病毒科里,鉴定由一种病毒编码的结构蛋白,允许最明确地确定一种病毒分离株是否是一种病毒种类的成员。非结构性蛋白在一族病毒种内的不同病毒种间是最为保守的。这点被认为是维持酶功能必需的结果,例如下列:病毒多蛋白的水解酶切,以及通过病毒解旋酶和病毒RNA依赖的RNA聚合酶的RNA基因组的复制。
对黄热病毒科的任一属内的几个种类的鉴定,例如黄病毒属,证明在种类间这些保守功能的基因比结构蛋白的基因更为保守。相应地,与一种已知种类的“变异分离株”相比,一种病毒分离株是否代表新的种类的主要决定因子之一,是确定已知病毒种和该新病毒分离株间结构蛋白的总体同源性。
在非结构性蛋白中发现大约200个或少于200个氨基酸的区域内找到局部同源性,是决定分离株是变异体还是新种的非决定性标志。典型地,具有少于或约为40%总体结构蛋白同源性的病毒分离株被分类为不同种类(病毒)或为不同属。同描述在“GENBANK”中的任一病毒相比(根据本领域标准方法比较),HGV的每个结构区域的同源性都较低于40%。因此,HGV被认为是一新种类,而且可能是正链RNA病毒的一个新属。
在确定病毒分离株的系统发育位置中检测到的另一个重要区域是5’和3’末端的非翻译区(UTR)。在病毒分离株之间比较了这些区域。例如,所有的HCV成员,黄热病毒科的一个未分类的属,具有大于该属所有其它成员在该区具有的90%的保守性的5’末端非翻译区。另外,HCV的成员享有大约24~50个核苷酸长度的3’端非翻译区。
当5’端非翻译区作为BLASTN中的具有FASTA的一个疑问序列时,在“GENBANK”(Ver.86)中没有发现任何病毒的有意义的序列。另外,HGV含有一个长度至少约250个核苷酸,并与任何其它已知病毒具有很少同源性的3’端非翻译区。
已知黄热病毒科的成员在很多种动物中复制,范围从(I)吸血节肢动物载体(蜱和蚊),在那里它们不引起疾病;到(ii)较大范围的脊椎动物宿主(人、灵长类动物、其它哺乳动物、袋形动物和鸟类)。30多种黄热病毒科的病毒引起人的疾病,范围从热病、或疹,到潜在的致死疾病,如出血热、脑炎、或肝炎。黄热病毒科至少10种成员在家畜中导致严重的具有经济重要性的疾病。
VI.应用
A.本发明
一方面,本发明涉及基本分离的,从一种庚型肝炎病毒(HGV)多核苷酸来源的多核苷酸。在一种实施方案中,根据下面几点来鉴定HGV多核苷酸:(i)灵长类动物中的传染;(ii)血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV);和(iii)是黄热病毒科的成员。本发明的多核苷酸可以包括DNA或RNA(或其类似物或变异体),并可按照本领域已知的方法通过重组、分离或合成产生。
一般地说,本发明的HGV多核苷酸长度为至少10个核苷酸。在另一个实施方案中,HGV多核苷酸长度为至少15个核苷酸。在另一个进一步的实施方案中,HGV多核苷酸长度为至少20个核苷酸。
在一个具体的实施方案中,本发明的多核苷酸包括了HGV基因组的cDNA或cDNA互补链。在一个较特定的实施方案中,这样的cDNA或cDNA互补链与选自SEQ ID NO:14、SEQ ID NO:37、SEQID NO:19或其互补链的一段多核苷酸具有至少40%的序列同源性。在另一个实施方案中,这种cDNA与选自SEQ ID NO:14、SEQ IDNO:37、SEQ ID NO:19或其互补链的一段多核苷酸具有至少55%的序列同源性。在一个具体的实施方案中,本发明cDNA或cDNA互补的多核苷酸将具有从选自SEQ ID NO:14、SEQ ID NO:37、SEQ ID NO:19或其互补序列的序列而产生的序列。
在另外一般的实施方案中,本发明的多核苷酸为与HGV进行特异性杂交的多核苷酸探针。在其它一般的实施方案中,本发明的多核苷酸编码HGV表位。更具体地说,编码多核苷酸的这种表位可能包括从SEQID NO:14、SEQ ID NO:37或SEQ ID NO:19的序列产生。
在另外一般的实施方案中,本发明的多核苷酸包括一段连续的多核苷酸序列,其具有同HGV多核苷酸进行选择性杂交的能力。在这一方面,HGV被鉴定为包含开放阅读框(ORF)的基因组,该ORF编码,同下列氨基酸序列之一具有至少40%的序列同源性的氨基酸序列:SEQ ID NO:15的2873个氨基酸序列,SEQ ID NO:38的190个氨基酸序列,或SEQ ID NO:20的67个氨基酸序列。更特别地,该多核苷酸探针与HGV进行特异性杂交。这种多核苷酸探针带有检测标记或其它修饰,或被固定到一固相支持物上。
如上所述的DNA多核苷酸还可编码HGV特异性免疫反应的抗原决定簇。在这一方面,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组、cDNA或其互补链。该氨基酸序列同下列氨基酸序列之一具有至少40%的序列同源性:SEQ ID NO:15的2873个氨基酸序列、SEQ ID NO:38的190个氨基酸序列或SEQ IDNO:20的67个氨基酸序列。
根据本发明,在另一个特定实施方案中,同HGV抗原决定簇进行特异反应的HGV编码的DNA多核苷酸包括同下列氨基酸序列之一具有至少55%的序列同源性的氨基酸序列:SEQ  ID NO:15的2873个氨基酸序列或SEQ ID NO:38的190个氨基酸序列或SEQ ID NO:20的67个氨基酸序列。
在其它特定实施方案中,该DNA多核苷酸可能表现为与从SEQ IDNO:14、SEQ ID NO:37、SEQ ID NO:19或其互补链中选出的一段多核苷酸具有约40%的序列同源性。
在另外进一步的实施方案中,本发明包括编码HGV来源的多肽的一段DNA多核苷酸。特别地,由该多核苷酸编码的多肽包括一段具有至少15-60个氨基酸的连续序列,它同由一个HGV基因组、cDNA或其互补链编码的至少15-60氨基酸的一段连续序列具有55%的序列同源性。
在一个特定实施方案中,多核苷酸编码的HGV多肽可在PNF2161cDNA信息源λ-gt11文库内编码。在其它特定实施方案中,该DNA多核苷酸可编码一个HGV表位。在进一步的实施方案中,该多核苷酸可作为与HGV特异性杂交的探针。
在一个相关方面,本发明包括一种重组载体,该载体含有编码一段HGV多肽的DNA多核苷酸。在另一个相关的方面,本发明包括用这种载体转化的细胞。
在另一个相关方面,本发明包括一段多核苷酸探针,该探针与一个HGV肝炎病毒基因组、cDNA或其互补链进行特异性杂交。在一个较特定的实施方案中,该多核苷酸探针序列同一段从SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:14或其互补链来源的序列具有至少40%的同源性。在另一个特定的实施方案中,该多核苷酸探针是从SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:14或其互补链来源的。
在另一相关方面,本发明包括检测试验个体中HGV肝炎病毒核酸的方法。根据本方法,从个体中获取包含核酸的样品。然后该样品同至少一种多核苷酸探针结合,该探针能同HGV肝炎病毒基因组特异性杂交。然后检测由HGV核酸与探针杂交形成的HGV核酸/探针复合物。这种检测可通过含有至少一个报告分子部分的探针与HGV核苷酸杂交实现。
在一个较特定的实施方案中,上述方法包括HGV核酸特异探针的使用,其中两个探针(引物)定义该HGV核酸中一个内部区域。在这个实施方案中,每一探针含有一条3’端内含于HGV核酸内部区的链。然后将该核酸/探针杂交复合物通过引物延伸反应转换成含有多片段的双链探针。通过不断重复下列步骤来扩增包含探针的片段:(i)使双链片段变性,产生单链片段;(ii)单链与探针杂交,形成链/探针复合物;(iii)在有DNA聚合酶和所有四种脱氧核糖核苷酸存在的情况下,由链/探针复合物产生双链片段;(iv)重复步骤(i)~(iii),直至达到所需的扩增程度。然后根据已建立的方法鉴定扩增产物。本发明的方法可还包括第三种多核苷酸探针,它能与上面描述的内部区进行选择性杂交,但不能和扩增所用的特异性探针/引物序列杂交。
在另一个特定实施方案中,利用靶扩增方法,例如自身维持序列扩增、连接酶链式反应、或链置换扩增检测HGV核酸/探针复合物。在进一步特定的实施方案中,采用信号放大技术,例如支链DNA探针或Q-β复制酶方法来完成检测。
在另一相关方面,本发明包括一种试剂盒,用于分析样品中是否存在HGV肝炎病毒来源的多核苷酸。在一般实施方案中,该试剂盒包括至少含一种核苷酸序列的多核苷酸探针,该探针可与HGV多核苷酸进行特异性杂交,以及合适的容器。在一个特定的实施方案中,该试剂盒包括定义HGV多核苷酸内部区的两个多核苷酸探针,其中每一探针具有3’端内含于该区的一条链。在进一步的实施方案中,该探针可用作聚合酶链式反应扩增的引物。
在更进一步相关的方面,本发明包括基本分离的HGV肝炎病毒颗粒。
本发明还包括来自基本分离的HGV肝炎病毒的多肽或多肽制剂。在这一方面,HGV病毒被鉴定如下:(i)在灵长类动物中可传播;(ii)血清学上明显不同于甲型肝炎(HAV)、乙型肝炎(HBV)、丙型肝炎(HCV)、丁型肝炎(HDV)和戊型肝炎(HEV);和(iii)为黄热病毒科的一个成员。正如上面所说明的,可通过常规方法制备HGV多肽,包括化学合成和重组DNA表达。也可将该多肽固定于一个固相支持物上。
在一个特定实施方案中该多肽与至少一种抗HGV抗体发生特异性免疫反应。在更进一步的特定实施方案中,该多肽包含与HGV特异性免疫反应的抗原决定簇。在本文中,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框的基因组,该ORF编码的氨基酸序列同下列序列之一具有约40%的序列同源性:SEQ ID NO:15的2873个氨基酸序列或SEQ ID NO:38的190个氨基酸序列和SEQ ID NO:20的67个氨基酸序列。在一个较特定的实施方案中,该ORF编码同上面提及的氨基酸序列之一具有至少55%的序列同源性的氨基酸序列。在再进一步的实施方案中,该多肽序列来源于SEQ ID NO:15的2873个氨基酸序列或其片段、SEQ ID NO:38的190个氨基酸序列或其片段或者SEQ ID NO:20的67个氨基酸序列或其片段。
在另外特定的实施方案中,来自HGV肝炎病毒的多肽包括一段至少约60个氨基酸的连续序列,该序列是由HGV基因组、cDNA或其互补链编码的。更具体地说,这些肽序列是由PNF2161cDNA来源的λ-gt11文库编码的。
在一个较特定的实施方案中,重组表达的HGV多肽可包括从SEQID NO:20、SEQ ID NO:38或SEQ ID NO:15来源的一段多肽序列。在另一个的实施方案中,这种多肽可由来源于SEQ IDNO:14或者其互补序列的序列编码。
在进一步相关的实施方案中,根据本发明,HGV肝炎病毒多肽可为包含HGV多肽和次级多肽的一种融合多肽。更具体地说,这种融合多肽可包括β-半乳糖苷酶或谷胱甘肽-S-转移酶蛋白序列作为次级多肽的信号序列。另外,这种次级多肽可包含一种颗粒形成蛋白。
上面所述的多肽可来源于结构性或非结构性病毒蛋白。
在更进一步相关的方面,本发明包括一种克隆载体,该载体在适当条件下,具有表达cDNA开放阅读框(ORF)的能力,此ORF是从HGV肝炎病毒基因组、cDNA或其互补链来源的。在本发明的这一方面,ORF被可操作性地连接至与所需宿主相容的控制序列上。在一个相关方面,本发明包括用这样一个载体转化的细胞。在一个较特定的载体实施方案中,ORF可来源于SEQ ID NO:14或其互补链。在更进一步的特定实施方案中,该ORF可来源于SEQ ID NO:37或SEQ IDNO:19。
在一相关方面,本发明包括产生HGV肝炎病毒多肽的方法。该方法包括在适宜于开放阅读框(ORF)序列表达的条件下,培养含有上述载体的细胞。在一个较特定的实施方案中,该ORF序列编码一多肽序列,该多肽序列选自SEQ ID NO:15,SEQ ID NO:38或SEQ IDNO:20或其片段。另外,该ORF序列可来源于HGV cDNA或其互补链。在另外特定实施方案中,载体是在大肠杆菌细胞中表达的λ-gt11噬菌体。
在进一步相关的方面,本发明包括一种诊断试剂盒,该试剂盒用于筛选含有特定抗HGV肝炎病毒感染的抗体的血清。该试剂盒可包括基本分离的HGV多肽抗原,该抗原包含与至少一种抗HGV抗体特异性免疫反应的表位。这种试剂盒还包括检测上述抗体抗原结合的方法。根据这一试剂盒,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组,cDNA或其互补链。这种氨基酸序列同SEQ IDNO:15的2873个氨基酸序列、SEQ ID NO:38的190个氨基酸序列和SEQ ID NO:20的67个氨基酸序列相比,典型地具有至少40%的序列同源性。在特定的实施方案中,该试剂盒可包括重组产生的或化学合成的多肽抗原。该试剂盒的多肽抗原也可被吸附在固相支持物上。
在一个更具体实施方案中,上述试剂盒的检测手段包括与所述多肽抗原相连的固相支持物。该试剂盒还包括未吸附的报告分子标记的抗人抗体。在这个实施方案中,该抗体与HGV多肽抗原结合可通过报告分子标记抗体和该抗体结合来检测。
在相关方面,本发明包括检测试验个体中HGV肝炎病毒感染的方法。这一检测方法包括将从HGV试验个体取得的血清同基本分离的HGV多肽抗原反应,并检测该抗原中结合的抗体存在。在一个具体实施方案中,该方法包括吸附在固相支持物的多肽抗原,并且将血清和载体反应。结果,该载体和报告分子标记的抗人抗体反应。然后检测固相支持物中是否有报告分子标记的抗体存在。
在进一步的方面,本发明包括HGV肝炎病毒疫苗组合物。这些组合物包括基本分离的HGV多肽抗原,其中抗原包括与至少一种抗HGV抗体有特异性免疫反应的表位。可根据本领域已知的方法产生肽抗原包括重组表达或化学合成。该肽抗原优选在药学上可接受载体中以药理学有效剂量存在。
在更进一步的相关方面,本发明包括同HGV肝炎病毒表位特异性免疫反应的单克隆抗体。在另一个相关方面,本发明包括同HGV特异性免疫反应的多克隆抗体的制备。在一个更具体的实施方案中,由亲和层析制备这种多克隆抗体。
在一个相关方面,本发明包括生产HGV抗体的方法。这一方法包括用基本分离的HGV多肽抗原施用于试验个体,其中抗原包括与至少一种抗HGV抗体特异性免疫反应的表位。该抗原以使个体足以产生免疫反应的剂量使用。
而在另一个相关方面,本发明包括用于筛选含HGV抗原血清的诊断试剂盒。该诊断试剂盒包括同HGV多肽抗原特异性免疫反应的基本分离抗体,以及检测该多肽抗原和抗体结合的方法。在一个实施方案中,该抗体与固相支持物相连。在一具体实施方案中,该抗体可以是单克隆抗体。该试剂盒的检测方法包括二次、标记的单克隆抗体。选择性地,或另外该检测方法可包括一个标记的、竞争抗原。
在另一个相关方面,本发明包括检测试验个体中的HGV感染的方法。根据本发明的这一方面,将从试验个体获得的血清同上述试剂盒的基本分离HGV特异性抗体进行反应。然后检测HGV特异抗体是否有结合抗原的存在。
在更进一步的方面,本发明包括HGV感染的体内成熟细胞。在一个具体实施方案中,该细胞是在组织培养基中培养的肝细胞。更具体地说,该组织培养细胞是无限增殖的肝细胞,或是由HGV感染的灵长类动物肝脏中获得的一个细胞系。
在一个相关方面,本发明包括繁殖HGV的方法。该方法包括在如上所述的利于提高HGV繁殖的条件下,体外培养成熟的、HGV感染的细胞。在另一相关的方面,本发明包括由这一繁殖方法产生的HGV颗粒。
在另外的相关方面,本发明包括嵌合多肽。该多肽可包括至少两种HGV表位,其中多肽基本上缺乏在天然HGV编码序列中正常插入两表位间的氨基酸。在更具体的实施方案中,这种嵌合多肽与一固相支持物相连。更进一步相关的方面,本发明包括编码上述嵌合多肽的核酸。
在另一个相关方面,本发明包括检测试验个体中的HGV感染的方法,该方法包括将从个体获得的含抗体的样品与一嵌合多肽接触,如上所述,并检查抗原中结合抗体的存在。
在更进一步相关的方面,该发明包括HGV疫苗组合物。该疫苗组合物包括含有多于一个的HGV表位嵌合多肽。该嵌合多肽在药学上可接受载体中以药理学有效剂量存在。
B.HGV的免疫检测
由本发明方法获得的抗原的一种用途,是用作诊断试剂,检测HGV肝炎病毒感染的试验个体中是否有抗体,从而表明个体的感染与否;例如,470-20-1抗原、SEQ ID NO:14或其互补链编码的抗原以及完整病毒序列任一链的部分编码的抗原。本发明的抗原在检测HGV时,可以单独使用,或相互结合使用。本发明的抗原也可与对其它肝炎病原体如HAV、HBV、HCV、和HEV的诊断试验一起使用。
在一种诊断构型中,将检验血清与固相试剂反应,该试剂具有通过本发明获得的表面结合抗原,如470-20-1抗原。在抗HGV抗体与该试剂结合,并洗去未结合的血清成分后,将该试剂与报告分子标记的抗人抗体反应,使得报告分子按固相支持物上结合的抗HGV量的比例与试剂结合。再次洗涤试剂以除去未标记的抗体,并确定与试剂相连的报告分子的量。一般地该报告分子为一种酶,这种酶可以通过将固体相在有合适荧光或比色底物存在时培育固体相而检测(Sigma,St.Louis,Mo)。
上面检测中的固体表面试剂通过已知的技术将蛋白质材料连接到固体支持材料,如聚合玻璃珠、浸润棒(dip sticks)、96孔平板或滤纸材料上而制备。这些连接方法常常包括蛋白质非特异性吸附到载体上或蛋白质的共价吸附,典型地通过将减毒游离胺基连至固相支持物上的化学活跃基团上,例如激活的羧基、羟基或醛基。另一方面,链霉抗生物素蛋白包被的平板可与生物素标记的抗原结合使用。
还参与形成本发明的一部分是检测系统或试剂盒,该试剂盒通常包括具有表面结合重组HGV抗原的载体(例如上述的470-20-1抗原)和检测表面结合抗HGV抗原抗体的报告分子标记的抗人抗体。
在第二种称为同源检测的诊断形式中,结合到固相支持物上的抗体在反应介质中发生一些变化,这些变化可在介质中直接检测到。直到现在为止提出的同源检测的已知一般类型包括:(a)自旋标记报告分子,其中结合抗原的抗体的检测是根据报告的流动性的变化(自旋断裂峰增宽)来完成的,(b)荧光报告分子,其中结合物的检测是根据荧光效率或极化的变化来完成的,(c)酶报告分子,其中抗体结合引起酶/底物相互作用,及(d)脂质体结合的报告分子,其中结合导致脂质体裂解并释放被包被的报告分子。对本发明蛋白抗原的修改方法遵循制备均相检测试剂的常规方法。
在上述的每一种检测法中,检测方法包括将试验个体的血清与蛋白抗原反应,并且检测抗原中结合抗体的存在。该检验包括将标记抗人抗体连接到被检抗体上(如取于急性的、慢性的或恢复期),并且测定结合到固相支持物上的报告分子的数量,如第一种方法,或可包括观察结合到同源检测试剂上的抗体的效果,如第二种方法。
第三种诊断形式包括能检测HGV特异性抗原的HGV抗体的使用。例如,利用抗原捕获试验检测读HGV抗原,其中候选血清样中的HGV抗原与HGV特异性单克隆或多克隆抗体反应。将抗体连接到一固相底物上,然后用第二不同标记的抗HGV抗体检测抗原。利用本发明的肽,可用标准方法制备抗体。另外,可产生基本分离的抗体(基本上是没有可能影响反应的血清蛋白),(如亲和纯化(Harlow等))。
C.HGV的杂交试验
由本发明的方法获得的核酸序列的一种用途是用作存在于血清中的HGV顺序的诊断试剂,由此表明该个体中的感染。从本发明编码序列,特别是克隆470-20-1和SEQ ID NO:14获得的引物和/或探针,可以单独或相互结合的方式用于HGV的检测。
在一种诊断形式中,在PCR或RT-PCR条件下试验血清反应,例如使用来自470-20-1序列的引物。由引物靶向的序列的特异性扩增可检测扩增反应中所用的血清中的HGV的存在。实施例4描述了运用本发明克隆来源的引物,使用聚合酶链式扩增反奕,来筛选不同来源的材料。这些扩增反应的结果证明从本发明克隆所得的引物(如,实施例4)能够通过利用各种不同来源模板的扩增反应检测同源序列。实施例4中的扩增反应包括使用从血清直接获得的核酸作为模板材料。
另一方面,探针可以从本发明的HGV序列获得,然后可标记这些探针,并将其用作针对从试验血清或组织样品获得的核酸的杂交探针。可以用各种报告分子标记探针,并对其作相应检测:如放射性同位素标记和化学发光检测报告分子系统(Tropix,Bedford,Mass)。
靶扩增方法,具体体现为聚合酶链式反应,自我维持序列扩增技术[“3SR”,(Guatelli,等,Gingerse,等,1990),也称为“NASBA”(VamGemen,等)]。连接酶链式反应(Barany),链置换扩增[“SDA”,(Walker)],和其它技术,增加靶序列的拷贝数。信号扩增技术,例如支链DNA探针(Horn and Urdea;Urdea;Urdea;等)和Q-β复制酶法(Cahill,等;Lomell;等),首先结合特异分子探针,然后复制该探针的全部或部分或以其它方式扩增探针信号。
对于本发明公开的特异核酸序列或在相同或相似(相关)病毒基因组中的连续序列的检测,可使用扩增和检测方法,作为对PCR扩增的替代方法。在核酸诊断领域中已知大量的这类方法(The 1992 SanDiego Conference:Genetic Recognition,Clin.Chem. 39(4):705(1993))。
1.自我维持序列扩增
自我维持序列扩增(3SR)技术产生与PCR相似体积,而且是等温的扩增。不同于温度循环驱动的PCR,3SR操作如一种协同的三种酶反应:a)由逆转录酶合成cDNA,b)由RNA酶H降解RNA链,和c)由T7RNA聚合酶转录RNA。
由于整个反应顺序是等温发生(典型地为42℃),不需要昂贵的温度循环设备。没有通过加热、有机溶剂、或其它机制使双螺旋变性,扩增的只是单链模板(主要为RNA)。
在3SR扩增中合适的引物可以由本领域普通技术人员从本发明的病毒序列中选择。例如,对于用3SR技术等温扩增病毒序列,通过加入T7启动子序列和优选的寡核苷酸的5’末端的T7转录起始位点将引物470-20-1-77F(SEQ ID NO:9)修饰。这种修饰产生了适宜的3SR引物T7-470-20-1-77F(SEQ ID NO:9)。在没有修饰或T7启动子时,引物470-20-1-211R(SEQ ID NO:10)可被用于这些反应中。
用AMV逆转录酶(30U),RNA酶H(3U),T7RNA聚合酶(100U),在100μl的反应物中培育从PNF2161抽提的RNA,该反应物中含有20mM Tris-HCl,pH 8.1(室温),15mM MgCl2,10mMKCl,2mM亚精胺盐酸,5mM二硫苏糖醇(DTT),1mM的dATP,dCTP,dGTP和dTTP7mM的ATP,CTP,GTP和UTP,以及0.15μM每种引物在42℃下,在1-2小时的保温期间发生扩增。
起初,引物T7-470-20-1-77F与靶RNA退火,并由AMV逆转录酶延伸以形成起始RNA链的cDNA互补链。由RNase H降解RNA链后,逆转录酶催化第二条DNA链的合成,获得含有(双链)T7启动序列的双链模板。RNA转录导致单链RNA产生。然后该RNA重新进入下一轮扩增的循环,最后获得高浓度的产物RNA池(pool)。产物主要是与包含T7启动子(T7-470-20-1-77F)的引物相同的单链RNA,并具有相当少量的cDNA。
另一方面,另一种引物(470-20-1-211R)可能含有T7启动子,或两种引物都含有该启动子,这导致RNA两条链的产生为反应的产物。3SR反应产物可通过RNA分析的标准技术(如Northen印迹、RNA狭缝印迹或斑点印迹用RNA染色染料直接凝胶电泳)来检测。另外,产物可通过利用生物素-亲和素亲和相互作用或核酸探针的特异性杂交来检测。
在3SR产物的快速和特异分析技术中,产物与放射性标记的寡核苷酸470-20-1-152R(SEQ ID NO:21)在溶液杂交后,接着进行非变性的聚丙烯酰胺凝胶电泳。这种试验(凝胶迁移漂移类试验)使得可检测比未杂交的寡核苷酸对应的带移动得慢的特异性探针产物杂交。
2.连接酶链反应(LCR)
作为检测系统的另一实例,该HGV序列可构成连接酶链式反应(LCR)引物的设计基础。LCR利用了DNA连接酶的缺刻封闭活性,使得具有近邻5’-磷酸(“供体”寡核苷酸)和3’-羟基(“受体”寡核苷酸)末端的两个直接近邻的寡核苷酸连接。DNA连接酶的以模板依赖方式仅连接完全互补末端的特性,导致了很高程度的特异性,这样,除非要连接的末端与靶链序列完全吻合,否则连接不会发生。
作为对PCR的另一个替代方法,具有在引物和靶分型核酸之间判别单个碱基错配的特异性方面的某些优点,LCR可用于检测或“分型”具有与HGV序列同源的病毒株。这些技术适合于评估特异性突变的存在,当已知这样的碱基变化具有抗药性时(如Larder and Kemp;Gingeras,等,1991)。
在模板互补供体和受体寡核苷酸以及同供体和受体互补的寡核苷酸存在时,LCR的指数级扩增是可能的。在这个实施方案中,在一个循环反应中,每一轮产生连接反应后面几轮反应的另外模板。
例如,可用引物470-20-1-211R(SEQ ID NO:10),一个邻接寡核苷酸(B,SEQ ID NO:22)和同类寡核苷酸(211R’,SEQ ID NO:23和B’,SEQ ID NO:24)来对本发明的序列作LCR扩增。首先通过标准方法进行逆转录,产生cDNA,然后在25μl反应体系中扩增,反应体系包括4种LCR引物(每种0.1~1μM),20mM Tris-HCl,pH8.3(室温),25mM KCl,10mM MgCl2,10mM二硫苏糖醇(DTT),0.5mM NAD+,0.01%Triton X-100和5单位DNA连接酶(威斯康星州Madison市Epicentre Techmologies公司生产的Ampligase,.或其它商业公司提供的热稳定型DNA连接酶)。
进行下列温度循环:94℃1分30秒;94℃1分钟;65℃2分钟,重复25~40次。产物合成的特异性取决于引物与模板在3’端位置的匹配。产物可用聚丙烯酰胺凝胶电泳后作溴化乙啶染色来进行检测。另一种方法是把某一种受体寡核苷酸(211R’或B)作5’-放射标记,在电泳后作放射自显影观测。
此外,也可用特异性可结合部分(如生物素)在3’端标记上供体寡核苷酸,而用特异性可检测基团(如荧光染料)在5’端标记受体,作固相捕获和检测。
3.扩增DNA的分析方法
关于扩增DNA的分析,已有多种方法介绍。其中一些方法有利于高产率的应用,而凝胶电泳则是不现实的,例如快讯高分辨HPLC技术(Katz和Dong)。但在一般情况下,用核酸探针筛选传染性病原的方法包括有一个单独的扩增后杂交步骤,以确保达到检测病原所需的特异性。
这种检测方法之一是以亲和力为基础的杂交捕获技术(Holodniy等)。在这种方法中,用一种生物素标记引物作PCR。在扩增之后,双链产物经变性,然后与过氧化酶标记探针(与掺入有生物素标记引物的单链互补)杂交。然后将杂交产物放在缓冲液中培养,缓冲液盛于包裹有亲和素(或链霉亲和素)的表面中(如膜滤器、微孔、胶乳或顺磁珠)。
包裹固态物与拟分析的PCR产物相接触,必须含有足够多的生物素结合位点,以便捕获到所有的自由的生物素标记引物,以及极低浓度的生物素标记PCR产物。对固态物冲洗3~4次以后,在含有过氧化氢的柠檬酸缓冲液与邻苯二胺共同培养,以检测结合杂交产物。
另一种方法是通过探针包裹的表面来介导捕获,然后通过生物素标记引物和亲和素报告物酶结合物来进行基于亲和性的检测(Whetsell等)。
4.其它方法
本发明的病毒序列也可使用支链DNA探针,形成信号扩增检测方法的基础。支链探针(Horn和Urdea;Urdea)已被用来检测和定量稀有的RNA和DNA序列(Urdea等)。在这一方法中,用与目标RNA或DNA互补的序列来合成寡核苷酸探针(RNA、DNA或核酸类似物)。探针还含有一个或多个与目标RNA或DNA不能互补的独特支链序列。
这一独特序列构成了供分支二级检测探针作杂交的目标,在二级检测探针中含有一个或多个其它的独特序列,作为三级探针的目标。在信号扩增的路径中的第一个分支点,不同的独特序列指引二级、三级等检测探针的杂交。在这一序列中的最后一个探针通常与一个用于检测的酶相连接(如碱性磷酸酶)。引物的顺序杂交最终形成一个高度分支的结构,其臂最终止于与酶连接的探针。
酶促转化是最后一次扩增,选择高灵敏度的化学发光底物(如密执安州底特律市Lumigen公司的LumiPhes,作为一种碱性磷酸酶标记底物)可以达到所需的灵敏度,即每一测定初始目标序列在一万个分子或一万个以下。在这种检测方法中,扩增仅取决于分子杂交,而不是酶促反应,因而比PCR等方法更不易受临床样本中的抑制物的影响。因此,这种检测允许用较粗放的技术,在测试样品中有核酸释放,而不必在测定前作严格的提纯。
本发明对病毒序列灵敏检测的扩增也可通过Q-β复制酶技术来完成(Cahill等;Lomell等;Pritchard等)。这一方法要设计一个与目标序列互补的特异性探针。然后通过标准的分子克隆技术将这一探针插入Q-β噬菌体的可复制RNA序列中。在复制子的特定区域插入并不能阻止Q-β复制酶的复制。
作分子杂交及多次冲洗之后,加入复制酶,探针的扩增开始。“可逆目标捕获”是一种能减少因未杂交探针的复制而产生的背景的技术(Morrissey等)。扩增后的复制子可以用DNA、RNA或核酸类似物探针,通过常规分子杂交技术来检测到。
其它用于扩增和检测稀有DNA和RNA的方法见于文献中。在分子诊断领域的一些应用中,这些方法要优于PCR方法。这些替代技术构成了对本发明揭示出的序列进行检测、定性(例如:本文描述的序列的多个相关菌株和序列多样性,抗药性的基因型变化)或定量分析的基础。
本发明的另一构成部分是测试体系或试剂盒,用于进行上述扩增/杂交实验。这种试验盒一般包括用于扩增反应的特异性引物或杂交探针。
D.治疗用途
以上所述,本发明的HGV抗原可用于制备疫苗。
更进一步,针对本发明的多肽抗原所产生的抗体可用于被动免疫治疗或被动免疫预防。这类抗体可以与其它治疗注射用抗体相似的剂量进行注射。例如,在其它病毒性疾病,如狂犬病、麻疹和乙型肝炎的潜伏初期,可按每磅体重0.02~0.1ml的量注射γ蛋白,以干扰感染症状的形成。因此,与HGV抗原相反应的抗体可以单独或与其它抗病毒剂一起,被动注射到感染了HGV的宿主体内,以增强宿主对付感染的能力。
本文公开的HGV序列将HGV确认为黄热病毒科的成员(见上)。黄热病毒科分为3个属:黄病毒,鼠疫病毒(Petstiviruses)和丙型肝炎病毒属(Francki等)。所有的黄病毒属均含有一个正链RNA基因组,其长度为9.0~12kb,编码一条由3000~4000个氨基酸构成的单一长多肽。这一多肽经蛋白水解,分割成大约10个蛋白质,包括一个病毒衣壳蛋白、病毒被膜蛋白和至少5个非结构蛋白(NS)。非结构蛋白包括一个似胰凝乳酶丝氨酸蛋白酶、RNA解螺旋酶(NS3)以及一个依赖于RNA的RNA聚合酶(NS5)。黄病毒属的NS3蛋白是对病毒多肽进行蛋白水解所必需的。N5蛋白则是病毒基因组复制所必需的(Chambers等,1990)。
此外,一些细胞蛋白也被确认参与到黄热病毒科的复制之中。例如,细胞信号肽酶是在几个酶切位点对病毒多肽进行酶切以及允许病毒蛋白酶进行表达所必需的(Hijkata等)。
那些能够阻止这些蛋白在黄病毒复制中执行各自功能的抑制剂也可能对于治疗HGV感染有治疗价值。此外,细胞因子或其它已知有抗病毒活性和/或调节人体免疫系统作用的多肽对于治疗HGV感染也可能具有功效。
有一种核苷酸类似物,1-B-D-呋喃核糖-1-2,4-三唑,3-羰酰胺(也称为三氨唑核苷,Patterson等),能够抑制黄热病毒科中依赖于RNA的RNA聚合酶,同时可望抑制HGV中NS5蛋白的活性。三氨唑核苷的作用方法被认为是参与排除细胞间鸟嘌呤池,并干扰病毒RNA的加帽反应(Patterson等)。
在感染HCV的个体中,注射三氨唑核苷后可观测病毒滴度和血清中的丙氨酸转移酶(ALT,作为肝功失调的指示酶)水平均显著下降(Reichard等;Di Bisceglie等,1992)。三氨唑核苷看起来对治疗黄热病毒科感染有广泛的功效,因此,对因HGV而造成肝部疾病的人注射三氨唑核苷,可望得到良好的结果。
另一类已知对治疗黄热病毒科感染有效的化合物包括有,细胞因子干扰素α、干扰素β和干扰素γ(Baron等,Gutterman)。干扰素被认为通过下列起到抗病毒剂的作用,(i)诱导干扰病毒RNAs的复制和翻译的细胞蛋白的表达,和(ii)通过激活人细胞免疫体系的成员(Baron等)。干扰素对于治疗病毒性感染,包括HBV、HDV和HCV感染,有广泛的适用性(Gutterman,Farci等)。尤其是有许多研究已表明,干扰素在单独使用或与其它抗病毒治疗方法结合使用时,均对治疗丙型肝炎病毒感染有效(Di Bisceglie等,1989;Kakumu等)。由于HGV具有明显的亲肝性质,而且属于黄热病毒科的成员,HGV感染可望对类似的干扰素治疗作出反应。
另一类具有显著抗病毒活性的化合物是病毒蛋白酶抑制剂(Krausslich等)。所有的黄热病毒科均编码一个似胰凝乳酶丝氨酸蛋白酶,这一酶是对基因组多肽的非结构区进行多位点切割所需的。构成这一蛋白酶切位点的氨基酸残基已被清楚描述,包括一个组氨酸,一个天冬氨酸和一个丝氨酸残基(Grakoui等)。对黄病毒和黄热病毒的进一步研究表明,这一活性位点中丝氨酸的突变可阻止病毒复制(Chambers等,1990b)。
HGV NS3抑制剂可以设计为模仿酶切割的转换状态。也可以从已有的合成化合物中广泛筛选出这种抑制剂。选出的HGV NS3蛋白酶抑制剂的活性可以通过体外转录/转译体系来确定,这一体系已广泛用于黄热病毒科的研究中(Hijikata等;Grakoui等)。
另外,可以将HGV基因组克隆到适合于真核蛋白表达的载体中去,如杆状病毒或痘苗病毒,在组织培养体系中确定化合物的功效(Grakoui等)。采用这种方法,已成功地获得了HIV蛋白酶的有效抑制剂(Vacca等;Roberts等)。
另一种治疗因HGV感染造成疾病的方法依靠合成编码本发明提出的HGV序列片段的反义核苷酸(Tonkinson and Stein)或寡核苷酸类似物。与黄热病毒科内所有病毒相同,HGV基因组是一条正链RNA分子,大小为9~12kb。病毒基因组为一条单链,因此,HGV对反义寡核苷酸极为敏感。可用来抑制病毒复制的可能的目标序列包括HGV5’端未转译区,HGV核糖结合位点或其它可能干扰HGV转译的序列。
反义寡核苷酸可以通过商用合成仪来合成。优选采用二硫代磷酸酯骨架来合成寡核苷酸,这样更有利于抵抗核酸酶切(Marshall &Caruthers)。此外,也可采用其它的寡核苷酸类似物,如那些未荷电或酰胺型骨架(Egholm等)。这些寡核苷酸有商业供应(Biosearch,Millipore,Bedford,MA),由于它们不带电荷,故能很好地与生物膜杂交,而生物膜一般会阻止带电荷大分子的通过。
寡核苷酸(或其类似物)在反义应用时,一般长度大于8个核苷酸,以便于与HGV基因组内的目标序列杂交。例如,当DNA寡聚体与病毒RNA目标序列杂交时,杂交复合物能被RNAse H这样的细胞酶所分解。然后,HGV模板的减少将减轻HGV导致的疾病的严重性。
上述治疗方法的实用性和功效可以通过在体外使用上述细胞体系和在体内使用上述动物模型体系而作出评价。
下面的实施例将说明本发明,但绝不是限制本发明。
                      材料和方法
利用商品上可购得自动寡核苷酸合成仪制备合成的寡核苷酸接头和引物。也可以从商业公司购买用户设计的合成寡核苷酸。
标准的分子生物学及克隆技术基本上按Ausubel等,Sambrook等和Maniatis等描述的方法进行。
与采用抗血清和/或抗体来筛选和检测免疫反应蛋白抗原相关的常规操作基本上按所述的进行(Harlow等)。同样,在检测抗病毒抗体时用的ELISA和Western印迹。按其生产厂商(北芝加哥Abbott公司或新加坡Genelabs Diagnostics公司)提供的方法或采用本领域已知的常规技术进行(Harlow,等)。
                       实施例
                       实施例1
                构建PNF2161cDNA文库
A.从血清中分离RNA
在1毫升未稀释PNF2161血清中添加PEG(分子量为6000)至8%,在4℃条件下以12K离心15分钟,产生沉淀。按Chomczynski描述的基本方法,从获得的血清沉淀物中提取RNA。
沉淀物用含4M异硫氰酸胍,0.18%2-巯基乙醇和0.5%十二烷基肌氨酸钠的溶液处理。处理后的沉淀物再用酸性苯酚氯仿抽提数次,用乙醇来沉淀RNA。这一溶液在-70℃静置约10分钟,然后用微量离心管在4℃离心10分钟。获得的沉淀物再用100μlDEPC(焦碳酸二乙酯)处理水和10μl3M NaOAc(pH5.2)作混悬,然后在溶液中加入2份100%乙醇和1份100%异丙醇。将溶液在-70℃下静置至少10分钟。在5℃下以12000×g离心15分钟,得到RNA沉淀物。沉淀物用70%乙醇冲洗,然后真空干燥。
B.合成cDNA
(1)第一链的合成
cDNA分子的合成按下述方法完成。按Gubler等的方法,用随机核苷酸六聚体引物(cDNA合成试剂盒,BMB,Indianapolis,IN或GIBCO/BRL)将上述RNA制备物转录为cDNA。
在第二链cDNA合成之后,将T4DNA聚合酶添加到混合物中,使cDNA分子的平端数达到最大。反应混合物在室温下培育10分钟。反应混合物用苯酚/氯仿和氯仿异戊醇抽提。
添加2份100%乙醇,在-70℃下冷却15分钟,使cDNA沉淀出。通过离心收集cDNA,沉淀物用70%乙醇冲洗后,真空干燥。
C.双链cDNA分子的扩增
cDNA沉淀物用12μl蒸馏水再悬浮。在cDNA悬浮液中加入:5μl磷酸化接头(接头AB,这是一条由SEQ ID NO:1和SEQ IDNO:2组成的双链接头,其中SEQ ID NO:2相对于SEQ IDNO:1处于3’至5’方向,是与SEQ ID NO:1部分互补的序列),2μl 10×连接缓冲液(0.66M Tris-HCl,pH7.6,50mM MgCl2,50mM DTT,10mM ATP)和1μl T4 DNA连接酶(0.3到0.6 Weiss单位)。通常,cDNA和接头按1∶100的比例混合。反应在14℃下温育过夜。次日早晨将反应液在70℃下温育3分钟,使连接酶失活。
在100μl含1.5mM MgCl2和500mM KCl(缓冲液A)的10mMTris-Cl缓冲液(pH8.3)中,加入约1μ1接头连接cDNA制备物,2μM带有如SEQ ID NO:1所示序列的引物,dATP、dCTP、dGTP和dTTP各200μM,2.5单位栖热水生菌(thermus aquaticus)DNA聚合酶(Taq聚合酶)。反应混合物加热至94℃,经30秒变性,降温至50℃,持续30秒,使引物退火,然后加热至72℃,经0.5~3分钟,通过Taq聚合酶使引物延伸。由连续加热、降温和聚合酶反应构成的扩增反应借助于Perkin-Elmer Centus DNA热循环仪,重复进行25-40次(Mullis;Mullis等;Reyes等,1991;Perkin-Elmer Cetus,Noralk,CT)。
在扩增反应之后,用苯酚/氯仿,氯仿/异戊醇对溶液作抽提,然后用2份乙醇沉淀。获得的扩增cDNA沉淀物再悬浮于20μlTE(pH7.5)中。
D.将cDNA克隆到λ载体中
用于构建cDNA的接头含有一个EcoRI位点,可将扩增cDNA直接插入λ-gt11载体(Promega,Madison WI或Stratagene,La Jolla,CA)。λ载体可以从厂商(Promega)处采购,它已经用EcoRI消化过,并用碱性磷酸酶处理,以去掉5’磷酸,防止载体的自身连接。
将EcoRI消化过的cDNA制备物连接到λ-gt11(Promega)上。连接反应的条件如下:1μl载体DNA(Promega,0.5mg/ml);0.5或3μl PCR扩增的插入cDNA;0.5μl 10×连接缓冲液(0.5MTris-HCl,pH7.8;0.1M MgCl2;0.2M DTT;10mM ATP;0.5mg/ml牛血清白蛋白(BSA);0.5μl T4 DNA连接酶(0.3至0.6 Weiss单位))。最后,添加蒸馏水,使最终反应液容量达到5μl。
连接反应液在14℃下培育过夜(12-18小时)。用λDNA包装体系(“GIGAPAK”,Stratagene,IaJolla,CA),通过常规方法对连接上的cDNA作包装,然后分装成不同的浓度,以确定滴度。采用标准的X-gal蓝/白试验来确定文库的重组频率(Miller;Maniatis等)。
每一文库的重组率也可按下列方法来确定。选择一些随机克隆,分离出相应的噬菌体DNA。然后,以分离的噬菌体DNA作模板,从cDNA分子的EcoRI插入位点处的侧翼λ序列中得到的λDNA序列作引物,进行聚合酶链式反应(Mullis;Mullis等)。对PCR产物作电泳分析,即可判断是否存在插入片段。
从血清样品PNF2161产生的插入cDNA的噬菌体文库已保藏在美国典型培养物保藏中心,12301Parklawn Dr.,Rockville,MD20852,并且保藏登记号为ATCC75268(PNF2161cDNA信息库)。
                    实施例2
              重组文库的免疫筛选
对实施例1中产生的λ-gt11文库进行免疫筛选,确定是否有可由PNF2161血清识别的抗原的产生。这些文库由PNF2161血清产生的。使用埃希氏大肠杆菌接种株E.coli KM392,对噬菌体作平板培养,以形成噬菌斑。也可以使用E.coli Y1090R(Promega,Madison WI)。
按Ausubel等描述的基本方法,用血清抗体对λ-gt11克隆表达的融合蛋白进行筛选。
按每150mm平板约2×104个噬菌体对每一个文库进行平板培养。平板上覆盖硝化纤维素滤膜,过夜。滤膜用TBS(10mM,Tris pH7.5;150mM NaCl)清洗,用AIB(TBS缓冲液,含1%明胶)封闭固定,然后在AIB中稀释100倍的初级抗体作培养。
用TBS中洗后,滤膜用次级抗体和结合了碱性磷酸酶的羊抗人IgG(Promega)进行培养。用一个底物(如BCIP,5-溴-4-氯-3-吲哚-磷酸盐),用NBF(氮蓝四唑盐(Sigma))形成反应噬菌斑。初级筛选所得的阳性区再被涂板和免疫筛选,直到获得纯噬菌斑为止。
                        实施例3
                    筛选PNF2161文库
λ-gt11中PNF2161的cDNA文库按实施例2的方法,用PNF2161血清作筛选。筛选的结果列于表1中。
                         表1
                       PNF2161文库
  文库1  重组率2(%)    抗体3       筛选数  纯化噬菌斑克隆数
 PNF/RNA     85     PNF      5.5×105       4
 PNF/RNA     90     PNF      8×104       7
 总数:       11
1.由所示人源构建的cDNA文库;
2.在所示λ-gt11文库中重组克隆的比例,通过蓝/白噬菌斑试验
确定,并经过对随机抽样克隆作PCR扩增进行确认;
3.对每一所示文库作免疫筛选时用的抗血清来源。
通过上述筛选分离出的克隆之一(PNF2161克隆470-20-1,SEQ ID NO:3;β-半乳糖苷酶码框内融合转译序列,SEQ IDNO:4)被用来产生延伸克隆,如实施例6所示。克隆470-20-1核酸序列被列为SEQ ID NO:3(蛋白质序列SEQ ID NO:4)。不用SISPA克隆接头分离出的核酸序列被列为SEQ ID NO:19(蛋白质SEQ ID NO:20)。
                       实施例4
            免疫反应470-20-1克隆的鉴定
A.免疫反应克隆的Southern印迹
对免疫反应克隆的插入片段作筛选,测定其与下列对照DNA杂交的能力:人外周血正常淋巴细胞(购自斯坦福大学血库,Stanford,CA)DNA和大肠杆菌KM392基因组DNA(Ausubel等;Maniatis等;Sombrook等)。用EcoRI和HindIII对10μg人淋巴细胞DNA和2μg E.coli基因组DNA进行消化。限制性消化产物在琼脂糖凝胶上作电泳分离(Ausubel等),并按产品说明,转移到尼龙膜或硝酸纤维素膜(Schleicherand Schuell,Keene,NH)上。
按下述方法从免疫反应克隆中制备探针。使用对应于λ-gt11序列(处于gt11载体EcoRI克隆位点的侧翼)的引物,对每一个克隆进行扩增。以每一个免疫反应克隆作为模板,通过聚合酶链式反应进行扩增。所获扩增产物用EcoRI进行消化,扩增片段作凝胶纯化,并从凝胶上提取出来(Ausubel等)。然后,所获扩增片段(来自免疫反应克隆)用商品化试剂盒(BMB),通过32P-dNTPs作随机引物标记。
然后,将随机引物标记的探针杂交到上述制备的尼龙膜上,以检测插入序列是否杂交到对照DNA上。470-20-1插入片段不会与任一个对照DNA杂交。
作为阳性杂交对照物,从人的C-κ基因片段(Hieter)中得到的一个探针被用作人类DNA的单基因拷贝对照物,而同样将一个大肠杆菌聚合酶基因片断用作大肠杆菌DNA的对照物。
B.基因组PCR
PCR检测首先是用作鉴定一些基因组DNA的外源性,这些基因组DNA在构建文库时可能因疏忽大意而发生克隆错误,其后,PCR又被用来检验在克隆来源和其它有关样品中是否存在克隆序列。一些不同类型的样品可被作检验,如SISPA扩增的核酸,从主要样本来源中提取的核酸,以及从有关来源材料(如从动物传代研究中)中提取的核酸。
“基因PCR”这一术语是指检测在有关生物体的基因组中是否存在特定的序列。例如,对口鬃来源克隆的基因PCR包括的基因组DNA如下:
1.人DNA(1μg/rxn.)
2.口鬃DNA(0.1-1μg/rxn.)
3.大肠杆菌(10-100ng/rxn.)
4.酵母(10-100ng/rxn.)
人和口鬃DNA作为直接的和最终的病原体来源进行检验。对大肠杆菌基因组DNA,作为商业酶制剂的一种经常污染物,进行了检测。也对酵母进行检测,作为无所不在的生物,即DNA能污染试剂,因此而被克隆。
此外,也扩增一个阴性对照(即仅有缓冲液或水)和包括大约105/rnx.的阳性对照。
扩增反应条件的变化,根据特定序列来确定,但是严密地遵循下列标准的PCR规则:PCR是在反应液中进行的,每100μl的此反应液含有10mM Tris,pH8.3,50mM KCl,1.75mM MgCl2,每一种引物1.0μM,dATP、dCTP和dGTP各为200μM,dUTP为300μM,2.5单位Taq DNA聚合酶,和0.2单位尿嘧啶-N-糖苷酶。循环是在94℃至少1分钟,而后30-40次重复变性(92-94℃,15秒钟)、退火(55-56℃,30秒钟)和延伸(72℃,30秒钟)。PCR试剂的配制,以及扩增反应的建立都是在保证没有扩增DNA的一个特别设计的实验室中进行的。
为了进一步阻止扩增序列的污染造成的试验的“假阳性”结果,该PCR是用dUTP代替TTP进行,使得扩增序列从生化上区别于天然DNA。为了酶促提供不可扩增的任何污染的PCR产物,在所有的PCR反应中包括了尿嘧啶-N-糖苷酶。一旦热循环结束,反应保持在72℃,防止尿嘧啶-N-糖苷酶的复性和扩增的含U序列的可能降解。
利用标准技术(“AMPLIWAX”,Perkin-Elmer Biotechnology;或者使用手工技术),进行“HOT START PCR”,以使上述一般规则对种类不同的序列扩增更有活力,这是理想地要求不同的扩增条件有最大的敏感性和特异性。
对扩增DNA的检测,是通过它和特异寡核苷酸探针杂交,该探针定位在两个PCR引物序列的内部,并和两引物没有或有很小的重叠。在有些情况下,利用溴化乙锭荧光,直接可看到电泳的PCR产物,但每次都要进行探针杂交,以确定特异和非特异扩增产物间的区别。在溶液中和放射性探针杂交后在8-15%的聚丙烯酰胺凝胶(根据扩增序列的大小调整浓度)中电泳,接着放射自显影。
利用基因组PCR,抗人、大肠杆菌和酵母的DNA,检测克隆470-20-1。在阴性对照反应中没有检测到特异序列,也没有在任何检测的基因组DNA中,和有105拷贝的DNA(导致易检测的信号)的反应中检测到。这种敏感性(105/反应)对含有1μg总DNA的反应中检测人的单拷贝序列是合适的,代表大约1.5×105个细胞中的DNA。
C.直接对血清进行聚合酶链式反应(PCR)
利用经过选择的克隆序列作引物进行聚合酶链式反应(PCR),对血清以及其它的克隆来源或相关来源的物质直接进行测验。在这些实验中,用聚乙二醇(PEG)直接从血清中沉淀HGV病毒颗粒,或者利用超速离心法从PNF和其它确定的血清中沉淀病毒颗粒。为了纯化RNA,将沉淀物溶解于硫氰酸胍中,再用酸性胍苯酚进行提取(Chomczynski等)。
另一种选择是将上述方法作以改动,利用一些商品试剂(如:“TRIREAGENT”(Molecular Research Center,Cincinnati,OH)或“TRIZOL”(Life Technologies,Gaithersburg,MD)和相关流程分离RNA。此外,通过利用“PURESCRIPT”试剂及流程(GentraSystems,Minneapolis,MN)在事先不进行病毒颗粒的沉淀和浓缩的情况下,直接从血清或其它含病毒的液体中分离出适于作PCR分析的RNA。
分离出的DNA被直接用作PCR的模板。对RNA利用反转录酶(Gibco/BRL)进行反转录,其cDNA产物便可作为随后PCR扩增的模板。
在为470-20-1时,把从等量的PNF血清中(每份约20~50μl)提取的核酸作为输入模板加入到每一个逆转录-聚合酶链式反应(RT-PCR)或聚合酶链式反应(PCR)中。引物设计是基于470-20-1序列基础上的,具体如下:470-20-1-77F(SEQ ID NO:9)和470-20-1-211R(SEQ ID NO:10)。利用MMLV-RT(Gibco/BRL)和随机六聚体(Promega)进行逆转录反应,需要在室温下温浴约10分钟,42℃下15分钟,99℃下温浴5分钟,然后迅速冷却到4℃。合成的cDNA可以不经纯化直接进行PCR扩增,每100μl反应液中含有1.75mM MgCl2,每种引物0.2~1μM,每种dATP、dCTP、dGTP和dTTP均为200μM以及2.5-5.0单位的Taq DNA聚合酶(“AMPLITAQ”,Perkin-Elmer)。利用“GENEAMP SYSTEM9600”热循环仪(Perkin-Elmer)或在相当的循环条件下利用其它的热循环仪(Perkin-Elmer;MJ Research,Watertown,MA),将循环反应在94℃下至少进行一分钟,循环过程重复40~50次,变性(94℃下15秒钟循环10次;92℃或94℃下后续的循环需要15秒钟)、退火(55℃30秒钟)和延伸(72℃30秒钟)。
阳性对照由以下组成:(i)预先扩增的PCR产物,已利用Hoechst33258荧光分析法对其浓度进行了估计,(ii)纯化了的包含目标DNA序列的质粒DNA,(iii)纯化了的RNA转录物[来自质粒克隆,这种质粒已将目标DNA置于噬菌体RNA启动子的控制之下(如:T7,T3,或SP6)和利用商用体外转录试剂盒得到的RNA。此外,可将对应于约10~100拷贝/rxn.的一等份阳性对照DNA掺加到有从源样品的克隆物中提取出的核酸参加的反应中,来控制DNA扩增反应抑制剂的产生。每一份分离提取物的测定至少要使用一个阳性对照。
通过与特异性寡核苷酸探针470-20-1-152F(SEQ IDNO:16)的杂交来确定产物的特异性。用20μl包括约1×106cpm 32P标记的470-20-1-152F的反应液与10μlPCR产物进行杂交。利用聚丙烯酰胺凝胶电泳分离特异的杂交片段与未杂交的寡核苷酸,然后进行放射自显影。
除了PNF之外,从正常血清中提取的核酸也可利用“血清PCR”流程序列进行逆转录和扩增。在正常人的血清中未探测到任何信号。应用470-20-1特异引物,在PNF血清的多份提取物中都能重复探测到特异信号。
D.对不依赖于序列的单引物扩增(SISPA)未克隆的核酸进行扩增
用SISPA扩增的cDNA作模板(实施例1)。利用经选择的克隆序列来设计序列特异的引物,被用于扩增模板中的目标DNA片段。典型地,在克隆操纵中,用SISPA扩增的样品作模板。例如,扩增引物470-20-1-77F(SEQ ID NO:9)和470-20-1-211R(SEQID NO:10)是从克隆470-20-1序列(SEQ ID NO:3)中选出的。这些引物用于以SISPA扩增的PNF2161cDNA为模板的扩增反应中。
可通过以下手段对扩增的DNA片段进行识别:(i)用特异性的寡核苷酸探针470-20-1-152F(SEQ ID NO:16)作杂交探测,这种探针是基于470-20-1序列(SEQ ID NO:3)设计的。和/或(ii)根据片段的大小识别。应用于DNA印迹探测的探针应根据厂商的推荐(BMB)利用末端转移酶作地高辛标记。然后,可用Southern印迹或液体杂交分析法(Kumer等)对扩增的DNA作杂交分析。
用于扩增反应的阳性对照DNA是预先扩增的CPR产物,其浓度可用Hoechst33258荧光分析法或用纯化的含有目标插入序列的质粒的方法进行测定。
对SISPA扩增的PNF2161进行PCR扩增,所得cDNA中可探测到470-20-1特异性信号。同时,还可探测到阳性对照DNA模板,而阴性对照反应并未发生。
E.对肝的RNA样品进行扩增
采用Cathal等的方法从肝的活组织检查材料中制备RNA,其中组织的提取是在5M的硫氰酸胍溶液中用4M的LiCl直接沉淀进行的。用2M的LiCl溶液洗涤RNA沉淀,再用苯酚:氯仿萃取以除去蛋白杂质,最后用乙醇再回收RNA。
470-20-1特异性引物也可用于以下述RNA来源作底物的扩增反应:正常的口鬃肝RNA,正常的tamarin(Sanguinus Labiatus)肝RNA和MY131肝RNA。MY131是一种用静脉注射接种1ml PNF2161血浆的口鬃。肝酶(SCID)含量明显上升,病毒感染已引起明显的组织学变化。组织学相关在MY131的肝中表现得最明显,MY131的肝取自SCID活性最高或接近最高时。用HCV的非编码引物(SEQ ID NO:7和SEQ ID NO:8),MY131的肝RNA不能产生扩增产物。
进行两个试验,重复每个试验的扩增反应,扩增反应结果见表2。
                         表2
                    用470-20-1引物作PCR
       实验1         实验2
   A     B     A     B
正常口鬃肝细胞    -     -     -     -
正常Tamarin肝细胞    -     -     -     -
My131肝细胞    +     +     +     +
PNF2161    ++     ++     ++     ++
这些结果表明470-20-1序列存在于亲本血清样(PNF2161)和来自PNF2161样品的传代动物(MY131)的肝RNA样品中。可是,两种对照RNA都呈现470-20-1序列阴性。
F.用RNA作模板通过PCR从一系列血清中筛选HGV序列
1.高丙氨酸转氨酶(HIGH-ALT)供体
利用HGV特异性引物,通过PCR对来自肝炎病人和肝功不正常的献血者血液的血清进行筛选来评估HGV和肝病的疾病相关性。后者由来自捐献血液的血清组成,这些捐献血液的每毫升血清中ALT水平都高于45国际单位(IU)。
选择一个由152种全血清组成的血清序列。下面血清选自血清系列:104个高丙氨酸转氨酶(High-ALT)血清[从斯坦福大学血库(SUBB)中筛选出];34个N-(ABCDE)肝炎血清(来自北加利福尼亚,埃及和秘鲁);14个来自怀疑患有肝病或肝炎病毒感染者的血样。本系列血清的阴性对照如下:9个经过高度筛选不含病毒感染危险因子的献血者的血清(SUBB)(“极正常”血清,如:O-阴性;RH-阴性;对HIV,已知的肝炎病原体和CMV都呈阴性;以前经过多次输血都未引起疾病的捐献血液);和2个随机献血者的血清。这些血清通过利用470-20-1引物77F(SEQ ID NO:9)和211R(SEQID NO:10)进行RT-PCR来分析是否存在HGV特异性序列。
如实施例4C所述,必须进行RNA提取和RT-PCR反应,除非引物470-20-1-211R被5’-生物素化以促进对扩增产物进行快速筛选,这种筛选方法涉及溶液杂交和利用链霉亲和素包裹的顺磁玻璃珠进行亲和性捕获。用特异性的标记探针和杂交序列通过亲和互作所得的捕获物进行杂交来分析核酸的方法在核酸分析领域中是众所周知的。
用于每个RT/PCR反应的RNA可来自30-50μl的血清中,这取决于所能得到的用于血清测验的血清数量。对每份血清都设置重复实验,每个反应的阳性对照分别对应于RNA转录物的10、100或1000个拷贝,还有适当的阴性对照(缓冲液)。阴性对照都没有活性,并且在每个PCR过程中每个反应至少可探测到10个拷贝。当特异性的杂交信号只出现在两个重复反应的某一个之中时,所得到的结果是不确定的。
使用专门为应用电化学发光的寡核苷酸探针(QPCR系统5000TM,Perkin-Elmer)进行亲和性杂交捕获设计的仪器,可对这一系列血清的扩增产品进行有效的、高敏性的分析。对利用QPCR-5000TM的方法早已被描述(Dicesare等)。
通过与探针470-20-1-152F(5’端用电化学放光的钌螯合物标记)杂交并应用“QPCR5000”仪器对每个反应的产物进行分析。在一个给定的扩增过程中,若截断点(cutoff)确定在阴性对照的平均数加三个标准差处,那么确证实验要选择34个可能的阳性对照。
采用溶液杂交和电泳(实施例4C)对34个样品进行分析。这34个样品中,有6种血清(即6/152)在重复反应中都发现有特异性的杂交序列。在这6个样品中,有三个与阳性对照相比具有强烈活性:一种是来自SUBB含高丙氨酸转氨酶的血清,另两种是采自埃及的N-(ABCDE)血清。
在采集了第一个样品之后一年,又从高阳性的SUBB血清供给处采得第二个血样,通过上述的PCR方法确定第二个血清样品呈HGV阳性。这一结果证实在某一人体中HGV感染仍在继续。把这种血清被称为“JC”。进一步确定,血清供给者呈HCV阴性(通过血清学反应测验和PCR确定)和HAV、HBV抗体阴性。
此外,用这种方法测定:一个来自埃及的第三个N-(ABCDE)血清样、一个北加利福尼亚患N-(ABCDE)肝炎的献血者的血清样和一个N-(ABCDE)肝炎血清样,结果也都表现出微弱阳性。其它的两份血清结果不确定,因为在两个扩增反应中只有一个发现有特异性序列存在。
随后再从这些HGV阳性和结果不确定的血清中取等份血清作PCR分析,结果8份被测定的血清中6份呈HGV阳性,另两份不确定。
用另一套引物对HGV阳性样品继续确证。用作诊断扩增的这套引物(GV57-4512MF,SEQ ID NO:121和GV57-4657MR,SEQID NO:122)是从一个HGV保守区中选择出的,该保守区存在于假定的NS5编码区内。对5种HGV分离物都扩增出约2.2kb的片段。用于扩增反应的引物是470EXT4-2189R(SEQ ID NO:119)和470EXT4-29F(SEQ ID NO:120)。对扩增的DNA片段进行测序和序列对比。通过对比找到了高度保守区,同时,也设计出了在5个序列的共有变异区可掺入混合碱基合成的最适引物序列。得到的NS5引物如下:GV57-4512MF,SEQ ID NO:121和GV57-4657MR,SEQ ID NO:122。这些引物可用于从试验样品中扩增出165bp的诊断片段。
从另一个高度保守区中又衍生出一个内部探针序列:GV22dc-89MF(SEQ ID NO:123),此探针可用来探测特异性的扩增的产物。要在不严格的条件下探测最小的HGV变异序列,则要求探针必须足够长。
象在应用470-20-1引物(实施例4C)时一样,对样品进行诊断性的NS5序列分析,也要在相同的条件下进行样品的制备、扩增和溶液杂交。对血清样品应用470-20-1引物对和NS5引物对进行PCR分析所得结果的一致性见表3。
                      表3
NS5区引物对(GV57)              470-20-1引物对
   +    -   不确定
   +    71    0     1
   -    6    13     2
 不确定    2    1     0
从上面所述的8个HGV阳性血清中再取额外等份用470-20-1引物系列(SEQ ID NO:9和SEQ ID NO:10)和NS5引物系列作进一步的PCR分析。在这些分析中,8个血清样中有5个呈现一致性的HGV阳性。结果见表4。
相对地,两个随机献血者或9个经高度筛选的“极正常”血清在每一种PCR分析中都呈HGV阴性。
这些结果进一步说明了肝病产生和HGV病毒间存在着联系。
              表4
     样品组   测定数目   阳性数
高ALT献血者     104     1
N-ABCDE,其它     48     4
正常献血者     2     0
“极正常”     9     0
总计     163     5
对高丙氨酸转氨酶献血者的血清作进一步测定。除了上述最初的血清系列中所包括的104种血清之外,总共又测定了495个血清样品,其结果如下:在这495个样品中,利用470-20-1-77F(SEQ IDNO:9)和470-20-1-211R(SEQ ID NO:10)引物对进行测定发现其中6个呈HGV阳性。这6种血清有如下的HCV分布:R25342,HCV阴性;R17749,HCV阳性;J53171,HCV阳性,HBV阳性;J54406,HCV阴性;R08074,HCV阴性;和X31049,HCV阴性。阳性结论都是在至少两个独立反应中都出现阳性重复的基础上作出的。应用NS5引物对通过PCR确证R25342呈阳性。因此,检出率约为1.2%(599个测定样品中有7个阳性)。
从高丙氨酸转氨酶献血者身上获得的新血浆样品也来自SUBB,Peninsula血库(Burlingame,CA)和纽约血液中心(New York,NY),对这些样品也将通过PCR(470-20-1引物对)检测HGV RNA。总共测定了214个样品,有5个(约2.3%)呈HGV RNA阳性。这5种血清的HCV分布如下:T55806,HCV阳性;T55875,HCV阴性;T56633,HCV阴性;R38730,HCV阴性;3831781,HCV阴性。随后又从这些献血者中的两个人身上采得的样品T55806和T55875也呈HGV阳性。利用NS5引物对通过PCR确认T55806、T55875和T56633呈阳性。
2.对所接受的捐献血样进行筛选
为了评估HGV在正常献血人群中的流行情况,在SUBB从筛选出的为输血献血的人中收集血清。总共有968个样品,代表769个独立的献血者,用于HGV RNA检测。应用470-20-1引物对通过PCR对所获样品进行筛选。
总共有16个血清样被鉴定为具有可检测的HGV RNA。其中,有6个是来自3个献血者的含重复样品,这样通过RNA PCR在769个献血者中检测出13个呈HGV阳性。对所有的阳性样品再利用NS5引物对进行PCR检测确认也呈阳性。这些献血者血液中ALT水平正常,其它的血清学指标也正常。因此,在正常的献血人群中,被测血清的阳性检出率为1.7%。所以,在接纳的和被排除的献血者中都探测到了HGV的存在。
3.从在不同地域居住的人群中采样
通过PCR评估HGV在地区来源广泛的肝炎患者中的感染情况。本质上如实施例4C中所描述,应用470-20-1PCR引物进行PCR反应。对来自埃及、希腊、澳大利亚(见实施例4F-4)、秘鲁、英格兰、意大利、德国、南韩、美国和日本的血清样品进行测定,在所有的被测群中都探测到有HGV RNA的存在。
4.输血后HGV感染和非肠道性传播
在几个输血后的肝炎病例(来自日本和欧洲的病人包括在实施例4F-3)中都检测出HGV RNA。在总共4个病例中,一个来自日本,两个来自美国,另一个来自澳大利亚。对他们进行多个时间点的HGVRNA存在性分析,其中3例(i)可获得病人输血前血样以确定病人以前的HGV状况。(ii)可获得为三位病人献血的人的血样,用于确定供血者的HGV状况。
第一例是一个日本病人,在1980年12月2日输血。输血后患了非乙、非丙型肝炎。从此病人身上采5份血清样,应用470-20-1引物对通过PCR检测HGV RNA。在其输血后两周到8个月期间都能在其血清中探测到HGV RNA存在。一个在输血超过一年后采的样品检测结果是不确定的(即只在一个重复反应中呈现阳性)。由于没有获得该病人输血前的血样,故未能进行输血前的HGV RNA检测。
BIZ和STO病例(分别见表5、表6)来自一个在NIH进行的预料中的心脏外科研究(Alter等,1989)。对于每一个病人,可得到输血前的血清,并被运用470-20-1引物对通过PCR确定为HGV RNA阴性。从输血后第一天至输血后第198周,BIZ被测试为HGV RNA阳性,在总共9个BIZ的血液捐献者中,8个中的2个受试者被发现为HGV阳性。从输血后第5周至输血后第92周,STO被测试为HGV RNA阳性。
                        表5
             与输血相关的HGV传染:病例BIZ
    抽取时间     时间   IU/L中的ALT   470PCR结果
    10/30/78     -4天        23       -
    11/01/78     -1天        31       -
    11/03/78     +1天        29       +
    11/17/78     +2天        51       +
    03/22/79     +20周        135       +
    06/28/79     +34周        133       +
    04/06/81     +127周        141       +
    08/20/82     +198周        39       +
                           表6
                与输血相关的HGV结果:病例STO
   抽取时间     时间  IU/L中的ALT  470PCR结果
    06/15/83     -1天       23      -
    07/18/83     -5周       80      +
    10/31/83     +20周       75      +
    12/31/83     +28周       30      +
    01/02/85     +81周       90      -
    03/20/85     +92周       23      +
第四种情况也被预期地限定,是一个参加在澳大利亚悉尼进行的输血后肝炎研究的心脏外科手术的病人,该病人(PA-124)没有其它可识别的危险因素,在外科手术期间接受了14个单位的血液(4个单位浓集(packed)的红细胞,10个单位的血小板)。在这14个单位中,一个为HGV阳性;其它13个为HGV阴性。除开活性的HCV EIA(第一个产生试验),14个血液捐献者的HBV和HCV血清学为阴性。没有其它的HCV试验证实阳性结果。
在病人PA-124(表7),首先用手术后两周得到的样品增加血清ALT,在14周期间,至少十次观察到为手术前的水平。对来自PA-124的输血前,4周和8周的血清进行的HCV的CPR结果均为阴性。使用470-20-1PCR引物试验该病人血清的HGV RNA。输血前的样品为HGV RNA阴性。阳性的结果被证实在输血后,与ALT增加同时以及接着发生。在输血后一年检测出了HGV RNA的存在。这些数据支持了HGV可以经胃肠外传染的结论。
                      表7
          与输血相关的HGV传染病例PA-124
  手术后的周数   IU/L中的ALT   470 PCR结果
     输血前       7       -
       2       74       +
       4       86       +
       8       135       +
       12       179       +
       14       78       +
       18       9       +
       24       6       +
       36       11       +
       52       11       +
       64       23       -
       84       10       -
除开预先限定的输血后传染的情况外,HGV感染的另外的情形被鉴定在限于多次输血和静脉内药物使用(IVDU)的危险人群。(表8)。
                        表8
            被编码的血清的HGV RT-PCR检测:
              选择的肝炎和胃肠外危险组
            组   检测数目   阳性数目
自身免疫肝炎      10      0
原发性胆肝硬变      20      0
被怀疑为急性非A-E型肝炎      24      2
慢性肝炎(非A-C)(由肝活检证实)      34      3
肝细胞癌      20      2
慢性HBV      20      2
慢性HCV      50      6
血友病      49      9
IVDU      54      15
多发性输血的贫血症      100      19
在100个多发性输血的镰状细胞性贫血和地中海贫血的病人中,19个(19%)被发现具有可测的血清HGV RNA。同样,49个中的9个血友病病人(18%)为470-20-1和NR5引物HGV阳性。值得注意地,54个中的15个(28%)IVDU被发现为对HGV RNA呈PCR阳性。这些胃肠外危险人群的感染比率(18-28%)看来比带有增加的ALT的血液捐献者的比率(1-2%)要高。这些结果增强了HGV传染的胃肠外途径的显著性。
5.被选择的肝炎病人群的PCR筛选
用聚合酶链反应测试来自急性和慢性肝炎、肝细胞性癌、HBV感染或HCV感染的病人的血清中的HGV的存在(数据示于表8中)。在每一组来自患肝病的病人的样品中,证实了HGV阳性样品(除开来自具有自身免疫性肝炎和初级胆汁肝硬变病人的样品,这两种情况不被认为仅仅与感染原有关)。
如来自输血后肝炎病人的血清收集品所示(实施例4F-4),HGV感染建立于急性肝炎期间,但循环病毒RNA在慢性感染估计为数月至数年的期间中仍旧被检测到。
在带有HBV和HCV感染的病人中观察到约10-20%的共感染比例。因此HGV感染被表明与被或不被其它肝炎病毒共感染的肝炎有关。共感染可能反映了这些肝炎病毒的类似危险因素和传染途径。如上面所提到的,在胃肠外危险人群中,具有较高的HGV流行,例如血友病,IVDU和多发性输血的贫血病人(与其它肝炎危险人群相比)。
6.人的持久性HGV感染
输血后肝炎病例BIZ、STO和PA-124被表明在输血和急性感染后的分别长达3.8,1.8和1.0年的时间仍具有PCR可检测的病毒RNA。在原始阳性样品(实施例4F-1)之后1年和1.5年,从献血者JC得到另外的血清样品。这些跟踪血清样品也为HGV阳性。来自其它高ALT献血者(T55806,T55875,R25342),在最初检测到HGV感染的血清样品之后几个月所获得的其它血清也为阳性。类似地,当HGV感染建立在实验灵长类动物(CH1356,实施例4H)时,在接种后长于1.5年时,检测到HGV RNA。这些数据证实了人和实验灵长类动物中的持久的HGV病毒血症(viremia)。
G.用于序列测定的来自病人RNA的长片断的扩增
为了获得不同的HGV分离株的序列信息,用PCR引物来扩增HGV基因组的一些信息区域。引物470EXT4-2189R(SEQ ID NO:119)和470EXT4-29F(SEQ ID NO:120)用来扩增含有原始470-20-1序列的2.2kb片断。使用“SUPERSCRIPT II”逆转录酶(Gibco/BRL,Gaithersburg,MD)逆转录来自于样品的RNA。使用有效大范围PCR试剂(“XL PCR BUFFERS”和“rTth-XL”,PerkinElmer/Applied Biosystem Din.,Foster City,CA)扩增产生的cDNA。
如果在琼脂糖凝胶电泳中检测到正确大小的带,扩增反应被认为阳性。通过扩增产物的初步DNA序列测定,样品被证实为阳性。通过这个扩增方法,下面血清样品被检测为HGV RNA阳性:PNF2161;R10291(JC);和每一个来自北美,埃及,和日本人群的样品。然而没有阳性样品从来自秘鲁人血清的样品中检测出来。
多种HGV阳性样品的成功扩增证实了通过使用上面讨论470-20-1引物对的PCR扩增所得到的结果。然而未能获得扩增可能反映出不良的RNA性质或低的拷贝数或分离株之间的局部序列差异,致使选择的引物组不能普遍地发挥作用。
为了获得HGV基因组的推断的5’-非翻译区的序列信息,用引物扩增来自5’-非翻译区(基于HGV PNF2161-变异体)的片段。两片段通过下面引物组确定:FV94-22F(SEQ ID NO:124)和FV94-724R(SEQ ID NO:125),提供728个碱基对片段,以及FV94-94F(SEQ ID NO:126)和FV94-912R(SEQ ID NO:127),提供847个碱基对片段。
使用刚才描述的启动有效的大范围PCR的条件。只要另外证实样品中HGV RNA的存在,可从大多数测试样品中获得产物。
H.HGV对灵长类动物的感染性
用PNF1261接种两个黑猩猩(称为CH1323和CH1356),六个恒河猴(cynomolgus)(CY143, CY8904,CY8908,CY8912,CY8917和CH8918)和六个口鬃(Mystax)(MY29,MY131,MY98,MY187,MY229,MY254)。用接种前和接种后的血清监测ALT和HGV RNA序列的存在(通过PCR筛选确定,如上所述)
1个恒河猴(cynomologous)(CY8904)显示出阳性RNA PCR结果(接种后39天)和总共17个分离血液提取物显示不确定结果。在1个称为CH1356的黑猩猩中,通过RT-PCR观察到持久性的病毒血症。如表9所示,没有观察到明显的ALT增加,循环病毒仅在接种后的很长时间才被检测出。在接种118天以及之后,观察到病毒血症。在第一次接种后的时间点(8天)还可观察到可作参考的反应性。
                     表9
   来自用PNF2161接种的CH1356的ALT和PCR结果
  接种后的天数      ALT*  HGV PCR
       0        59     -
       8        65     ±
       15        85     -
       22        89     -
       29        89     -
       36        86     -
       39        31     -
       47        74     -
       54        40     -
       61        57     -
       84        65     ±
       89        63     +
       98        64
       118        84     +
       125        73     +
       134        74     +
       159        80     +
       610  (未能获得ALT)     +
*接种前的平均ALT基线为50。
上面显示的数据表明在实验灵长类动物中,HGV感染一直持续到1.7年。
I.病毒基因组的鉴定
从cDNA文库分离的470-20-1(实施例1)意味着在PNF2161检测到的病毒基因组为RNA。证明HGV病毒基因组为RNA的其它实验包括下面这些。
原始克隆来源中的RNA或DNA的选择性降解(如通过无脱氧核糖核酸酶的核糖核酸酶或无核糖核酸酶的脱氧核糖核酸酶),接着用HGV特定形引物扩增,检测扩增产物用来从DNA模板中识别RNA。
另一方法是利用扩增反应(来自作为模板的原始克隆来源的核酸和HGV特异性引物),在反应中(i)在不存在任何依赖于RNA的DNA聚合酶(即逆转录酶)的情况下,采用依赖于DNA的RNA聚合酶,和(ii)依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。在该方法,如果HGV基因组为DNA或具有DNA中间产物,那么扩增产物用两种类型的扩增反应检测。如果HGV基因组仅为RNA,扩增产物仅用含有逆转录酶的反应。
如实施例4C中所描述,使用蛋白酶K和SDS,接着用酚提取将全部核酸(即DNA或RNA)从PNF2161中提取出来。接着用聚合酶链反应(PCR)扩增纯化的核酸,其中(i)在PCR之前进行逆转录步骤,或(iii)省略逆转录步骤。仅当在PCR反应之前进行逆转录时可重复地获得扩增。作为对照,在单独反应中,DNA模板被成功地扩增,这些结果证实HGV病毒基因组的性质为RNA。
最初出现在PNF2161中的克隆双链DNA序列的链可通过包括下面的各种方式推出。可对来自感染原血清的未扩增基因RNA进行RNA印迹法或斑点印迹法,接着通过将重复印迹杂交至对应于克隆序列的每条链的探针上。另一方面,从M13载体(Messing)分离的单链cDNA探针或多链特异性的寡核苷酸探针被用于增加的敏感性。如果源血清含有单链RNA,那么在杂交严谨的适宜条件下仅用一个探针(即来自470-20-1克隆的一条链的序列)产生信号。如果源血清含有双链DNA,那么两条链探针都将产生信号。
由使用一个或另一个特异性引物的逆转录开始的聚合酶链反应是RNA印迹法的一个更高敏感的替代方法。从存在于PNF2161血清中的纯化病毒体提取的基因组RNA被用作每一个RT/PCR的输入模板。不是用任意的六聚体进行cDNA合成,而是用HGV序列特定性的引物。一种cDNA合成反应是用互补于克隆序列的一条链的引物(例如470-20-1-77F)来进行的,第二种cDNA合成反应也是运用从反义链(例如470-20-1-211R)衍生的引物来进行。
使用两个HGV特异性引物扩增得到的首链cDNA,为了PCR的成功扩增,对照(例如DNA对照)被包括在内。还为了控制当使用描述的特异性引物时获得的逆转录效率,也使用来自克隆序列每条链的RNA转录物。
通过琼脂糖凝胶电泳,用溴化乙锭染色检测特异性产物。与用于逆转染的引物无关,DNA对照(即PCR扩增的双链DNA对照)被成功地扩增。仅在反义链引物被用于cDNA合成时,单链RNA转录物(即逆转录效率和链特异性的对照)被扩增。
仅在引物470-20-1-211R被用于逆转录时,PNF衍生的HGV多核苷酸产生特异性的扩增产物,这表明存在于血清中的原始HGV多核苷酸序列与470-20-1-211R互补,可能为单链RNA。
                  实施例5
          PNF2161的蔗糖密度梯度分离
A.PNF-2161致病原(agent)的分带
使用来自Hoefer Scientific(San Francisco,CA)的梯度制备仪(maker)制备10-60%蔗糖(“ULTRAPURE”,Gibco/BRL)在TNF(50mM Tris-HCl,pH7.5,100mM CaCl2,1mM EDTA)中的连续梯度。将约12.5ml的梯度在-70℃保存,在37℃迅速融化,接着以TNE稀释的0.4ml PNF血清覆盖。
在4℃,用SW40转子(Beckman Instruments)以40,000rpm(rav约200,000×g)的转速梯度离心约18小时。从管的底部收集体积约为0.6ml的级分,将0.5ml直接称重至超速离心管中用于密度的计算。
                    表10
     PNF级分测定的密度和470-20-1的出现
   级分      密度  检测的470-20-1*
    1     1.274         -
    2     1.274         -
    3     1.266         -
    4     1.266         -
    5     1.260         -
    6     1.254         -
    7     1.248         +
    8     1.206         +
    9     1.146         +
    10     1.126         +++
    11     1.098         ++++
    12     1.068         +++
    13     1.050         +
    14     1.034         +
    15     1.036         +
    16     1.018         -
    17     1.008         +
    18     1.020         +
*“+”和“-”记分最初以40次PCR为基础。为了
区别“+”,“++”,“+++”和“++++”,将产生最
初正记分(7-18)的级分用30次PCR进行扩增。
通过在4℃,用Ti70.1转子(约110,000×g)以40,000rpm转速离心2小时使推断的病毒颗粒成为片状沉淀物,使用酸性苯酚胍方法(“TRI REAGENT”,Molecular Research Center,Cincinnati,OH)和使用糖原作为载体以提高回收的乙醇沉淀提取RNA。将纯化的核酸溶解于含有2mM DTT和1U/μl重组RNA酶抑制剂的无RNA酶的缓冲液中。
梯度级分的RNA PCR分析(实施例4C)显示在密度范围为1.126-1.068g/ml(表10)的级分,在470-20-1特异性信号中有一个明显的峰。在这种情况下,470-20-1信号被显示出形成了分离的带,与病毒颗粒在蔗糖梯度中的预期行为一致。
B.病毒颗粒相对密度
PNF2161已被证实被HCV共感染(见上面)。为了将470-20-1病毒颗粒的性质与其它已知肝炎病毒颗粒相比较,将血清PNE2161和纯化的肝炎A病毒的样品铺在蔗糖梯度上(如上所述)。收集0.6ml的级分,使之沉淀,提取RNA。使用HAVC(SEQ ID NO:5;SEQID NO:6);HCV(SEQ ID NO:7,SEQ ID NO:8)和470-20-1(SEQ ID NO:9,SEQ ID NO:10)特异性引物将从各级分分离的RNA进行扩增反应(PCR)。
通过在琼脂糖凝胶上将扩增反应进行电泳分离,然后溴化乙锭染色来识别产物的带。分析的结果列于表11中。
                         表11
    平均密度   HAV     HCA     470-20-1
     1.269    -     -        -
     1.263    +     -        -
     1.260    +     -        -
     1.246    ++     -        -
     1.238    ++     -        -
     1.240    +     -        -
     1.270    +     -        -
     1.193    +     -        -
     1.172    +     ±        -
     1.150    +     ±        ±
     1.134    +     +        ±
     1.118    +     +        +
     1.103    +     +        +
     1.118    +     +        +
     1.103    +     +        +
     1.088    ±     +        +
     1.084     -     +        +
     1.080     -     +        +
     1.070     -     +        +
     1.057     -     +        ±
     1.035     -     ±        -
     1.017     -     -        -
     1.009     -     -        -
这些结果表明470-20-1颗粒与类似于HAV相比,更类似于HCV颗粒。
另外,在蔗糖梯度离心之前,用氯仿处理血清PNF2161和HAV颗粒。实验结果表明470-20-1病原体可能为一被膜病毒,因为它比无被膜病毒(HAV)具有更类似于被膜黄热病毒科(Flaviviridae)成员的性质。
                     实施例6
             470-20-1延伸克隆的产生
A.锚式PCR
如实施例1所描述,直接从PNF2161提取RNA。将RNA通过“CHROMA SPIN”100凝胶过滤柱(Clontech)以除去小分子量杂质。用BMB cDNA合成试剂盒合成cDNA。cDNA合成后,将PNF cDNA连接到超过KL-1/KL-2SISPA或JML-A/JML-B50100倍的接头上(分别为SEQ ID NO:11/SEQ ID NO:12,和SEQ IDNO:17/SEQ ID NO:18),使用引物KL-1或引物JML-A将其扩增35次。
通过来自10μl含有EcoRI酶解(脱磷酸化)的λgt11臂(1μg)和EcoRI酶解的PNF cDNA(0.2μg)珠连接反应物的1μl等分试样的锚式PCR,产生470个延伸克隆。使用λgt11反向引物(SEQ ID NO:13)结合470-20-77F(SEQ ID NO:9)或470-20-1-211R(SEQ ID NO:10)进行连接反应物的PCR扩增(40次)。PCR的所有引物浓度为0.2μM。
将扩增产物(9μl/100μl)在1.5%琼脂糖上进行分离,印迹至“NYTRAN”(Schleicher and Schuell,Keene,NH),从470-20-1特异性的用地高辛标记的寡核苷酸探针检测。按照制造商的推荐使用末端转移酶(BMB)进行地高辛标记。杂交的带用凝胶纯化,克隆至“TA克隆载体pCR II”(Invitrogen),并测序。
鉴定了许多5’和3’延伸至470-20-1的克隆。所有序列以来自自至少两个独立分离群的序列测定的共有序列为基础。以类似方式重复该锚式PCR方法以获得另外的5’和3’延伸序列。使用λgt11反向引物(SEQ ID NO:13)结合前面伸展克隆获得的序列衍生而来的HGV特异性引物进行PCR扩增反应。这些反应的底物是未包被的PNF21612-cDNA来源的DNA。
按照制造商的建议(Applied Biosystems,Foster City,CA)使用Applied Biosystems model373A DNA序列测定系统中的“DYEDEOXY TERMINATOR CYCLE SEQUENCING”(Sanger等方法的改进)进行序列测定。序列数据示于序列表中。在核酸和氨基酸水平将序列与“GENBANK”,EMBL数据库和dbSET(全国医学文库)序列进行比较。检索程序FASTA,BLASTP,BLASTN和BLASTX表明这些序列的核酸和氨基酸序列都是新的。
校准使用选择性引物对获得的各个克隆以产生共有序列。一系列用于构建HGV-PNF2161变异体序列的共有序列如下:4E3,SEQ IDNO:26;3E3,SEQ ID NO:27;2E5,SEQ ID NO:28;1E5,SEQ ID NO:29;4E5,SEQ ID NO:30;3E5,SEQID NO:31;2E3,SEQ ID NO:32;1E3,SEQ ID NO:33;4E5-20,SEQ ID NO:34;5E3,SEQ ID NO:39;6E3,SEQ ID NO:40;7E3,SEQ ID NO:42;5E5,SEQID NO:43;6E5(44F),SEQ ID NO:44;8E3,SEQ IDNO:98;9E3,SEQ ID NO:109;10E3,SEQ ID NO:110;11E3,SEQ ID NO:116;12E3,SEQ ID NO:118;5’-末端,SEQ ID NO:175和3’-末端,SEQ ID NO:167。
排序各个共有序列,鉴定重叠序列,确定HGV-PNF2161变异体的共有序列。将这个共有序列从其它四个HGV变异体中获得的序列进行比较:JC(SEQ ID NO:182),BG34(SEQ ID NO:176),T55806(SEQ ID NO:178)和EB20-2(SEQ ID NO:180)。
HGV-PNF2161变异体的共有序列由表示为SEQ ID NO:14的9391个碱基对组成。此序列代表一连续可读框(SEQ ID NO:15)。多蛋白质的Kyet-Doolittle疏水性方图如图11所示。
原始470-20-1克隆与延伸获得的序列的关系被图解示于图1中。从图中可以看出,具有与470-20-1蛋白质编码序列相反极性的DNA链包括一长的连续的可读框。
将HGV的氨基酸序列与蛋白质序列的PIR数据库(IntelliGenetics,Inc.,Mountain View,CA)中的所有病毒序列进行比较。运用“FASTA”程序的1.7版本程序的“SSEARCH”程序(Pearson,等)进行比较。在HGV序列和黄热病毒科的两种病毒之间找到了局部序列相似的区。相似的序列在图5A和5B中。
存在于这些顺序中的是这些病毒的依赖于RNA的RNA聚合酶(RDRP)的结构域单元。保守的RDRP氨基酸结构域单元在图5A和5B中用冒号和大写字母,黑体字(Koonin and Dolja)表示。这些顺序证明HGV编码序列的这一部分相当于RDRP。这个顺序的数据与关于HGV的RNA基因组的数据结合起来支持了HGV是黄热病毒科中的一员的位置。
HGV多蛋白质(SEQ ID NO:15)与HoCV(猪霍乱病毒)和HCV的全部氨基酸序列的一致性分别为17.1%和25.5%。如此水平的全部氨基酸序列一致性证明HGV是从HoCV和HCV分离的分离的病毒体。为了证实它,在病毒BVDV(牛病毒性腹泻病毒)的黄热病毒科的两个成员和HCV中,16.2%的氨基酸可全部与HGV对准。
一个属的成员在全部校准时,通常显示出高的同源性,例如,BVDV与HoCV比较显示出71.2%的同一性。当被全部排序时,HCV为其中一员的未命名属的各个成员(变异体)的一致性为65%至100%。
B.cDNA末端快速扩增(RACE)PCR:5’末端克隆
通过用RACE(cDNA末端快速扩增)技术改进的锚式PCR方法获得相当于HGV基因组的5’-末端的克隆。该RACE方法最早由Frohman等(1988)和Belyausky等(1989)描述。简单地说,按如下方法获得HGV的5’-末端克隆。
使用任意六聚体引发首链cDNA合成,用“SUPERSCRIPT II”或“rTth”逆转录酶(GIBCO/BRL)进行合成。首链合成后,通过碱水解(NaOH)将RNA模板降解。通过加入乙酸中和cDNA样品,并通过吸收至玻璃基质载体(“GENOBIND”,Clontech,Palo Alto,CA)而被纯化。纯化后,通过乙醇沉淀浓缩cDNA,用80%乙醇洗涤两次。
起初描述的RACE方法改进如下。在氯化钴存在下,使用T4 RNA连接酶将单链寡核苷酸锚(SEQ ID NO:174)(Clontech)连接到首链cDNA的3’末端。从制造商获得带有两处修饰的寡核苷酸锚:(i)将锚的3’-末端用一个防止多连体形成的氨基酸修饰,(ii)5’-末端含有一个允许连接到首链cDNA上的磷酸基团。
连接了锚后,cDNA被用作模板,用于使用一些特异性引物结合与锚序列互补的引物(AP引物,SEQ ID NO:134)进行的CPR扩增。将得到的扩增产物通过琼脂糖凝胶电泳进行分离,转移至滤膜上,与巢居的HGV特异性寡核苷酸探针杂交。分离与HGV杂交探针的带,将其克隆至“pCR-II”(Invitrogen,San Diego,CA)并测序。
C.HGV3’末端克隆
通过改进的锚式RT-PCR方法,获得相当于HGV基因组3’-末端的克隆,简单地说,在cDNA合成之前,多聚腺苷酸聚合酶(GIBCO/BRL,Gaithersburg,MD)被用于催化将聚腺苷酸尾部加成到PNF2161RNA上。按照制造商的推荐完成聚腺苷酸的加成。在纯化聚腺苷酸修饰的RNA后,使用引物GV-5446IRT(SEQ ID NO:184)进行利用“ SUPERSCRIPT II”(GIBCO/BRL)完成的逆转录。通过使用下面引物系列的PCR扩增得到的cDNA:GV59-5446F(SEQ IDNO:171)和GV-5446IR(SEQ ID NO:172)。
扩增后,将产物通过琼脂糖凝胶电泳进行分离,转移至滤膜中,并与地高辛标记的寡核苷酸探针杂交(E5-7-PRB,SEQ ID NO:173)。分离和纯化与寡核苷酸杂交的产物,将共克隆至“pCR-II”并测序。通过这种方法分离的两个克隆为MP3-3(SEQ ID NO:168)和MP3-7(SEQ ID NO:169)。
                      实施例7
             分离470-20-1融合蛋白质
A.表达和纯化470-20-1/谷胱甘肽-S-转移酶融合蛋白质
如下完成含有470-20-1肽的谷胱甘肽-S-转移酶(Sj26)融合蛋白质的表达。通过使用引物gt11F(SEQ ID NO:25)和gt11R(SEQ ID NO:13)的聚合酶链反应,接着通过EcoRI酶解,从λgt11470-20-1克隆分离相当于原始λgt11470-20-1克隆的237个碱基对插入片段(在两侧都含有SISPA接的17个核苷酸)。
将插入片段克隆至修饰的pGEX载体pGEX MOV中。pGEXMOV编码在羧基末端融合了六个组氨酸的sj26蛋白质(sj26his)。将470-20-1多肽编码序列在位于载体sj26his编码序列下游的克隆位点引入载体。因此,470-20-1多肽被表达为sj26his/470-20-1融合蛋白质。融合蛋白质中sj26蛋白质和6个组氨酸区使得融合蛋白质可以通过采用谷胱甘肽偶联的珠(Smith,D.B.,等)和固定的金属离子珠(Hochula;Porath)的双重色谱方法而进行亲和纯化。
将大肠杆菌菌株W3110(ATCC目录号为27352)用pGEX MOV和含有470-20-1插入片段的pGEX MOV转化。通过加入2mM异丙基-β-硫代半乳糖苷(IPTG)诱导sj26his和470-20-1融合蛋白质。通过谷胱甘肽亲和层析或通过根据公开的方法(Smith,D.B.,等,Porath)结合常规的离子交换层析的固定金属离子层析(IMAC)纯化融合蛋白质。
纯化的470-20-1融合蛋白质与PNF2161发生免疫反应。然而,纯化的sj26his蛋白质不与PNF2161发生免疫反就,这表明470-20-1肽和PNF2161之间存在特异性的免疫反应。
B.分离470-20-1/β-半乳糖苷酶融合蛋白质
在32℃,将用λ噬菌体gy11或gt/470-20-1侵染的KM392溶原菌保温直至培养物达到O.D.为0.4。接着在43℃,在水浴中将培养物保温15分钟以诱导gt11肽的合成,在37℃,再保温1小时。将细菌细胞沉淀,并溶于溶菌缓冲液中(10mM Tris,pH7.4,2%“TRITON X-100”和1%抑蛋白酶肽)。通过离心(10K,10分钟,Sorvall JA20转子)澄清细菌溶菌产物,将澄清的溶菌产物与偶联了抗-β-半乳糖苷酶(Promega)的琼脂糖4B珠一起保温。
按照制造商的说明进行β-半乳糖苷酶融合蛋白质的结合和洗脱,用溶菌缓冲液进行一般的蛋白质的结合和柱的洗涤。将结合蛋白质用0.1M碳酸盐/碳酸氢盐缓冲液(pH10)洗脱。纯化的470-20-1/b-半乳糖苷酶蛋白质与PNF2161和抗-b-半乳糖苷酶抗体均发生免疫反应。然而,通过gt11溶原菌表达的纯化的β-半乳糖苷酶不与PNF2161发生免疫反应,但与抗-β-半乳糖苷酶抗体发生免疫反应。
                    实施例8
纯化470-20-1融合蛋白质以及制备抗-470-20-1抗体
A.谷胱甘肽亲和纯化
材料包括50ml还原形式谷胱甘肽亲和基质(Sigma),XK26/30Pharmacia柱,2.5×10cm Bio-Rad“ECONO-COLUMN”(Richmond,CA),Gilson(Middleton,WI)HPLC,DTT(Sigma),还原形式的谷胱甘肽(Sigma),尿素和磷酸氢二钠。
下面溶液用于融合蛋白质的纯化。
缓冲液A:磷酸缓冲盐溶液,pH7.4
缓冲液B:50mM Tris pH8.5,8mM谷胱甘肽(还原形式的谷胱甘肽)
洗涤缓冲液:8M尿素,100mM Tris pH8.8,10mM谷胱甘肽,1.5M NaCl。
让带有含470-20-1插入片段的质粒的大肠杆菌生长于发酵罐中(20升)。收集细菌,使用微流动仪(micro-fludizer)将其溶菌于含有2mM苯甲基磺酰氟(PMSF)的磷酸缓冲盐溶液(PBS)中。除非另有说明,下面所有过程均在4℃进行。
通过将溶菌的细菌放入“OAKRIDGE”管中,并用Beckman型号JA-20转子,以20K rpms(40K×g)的转速旋转制备用于装填的粗溶菌产物。将上清液通过0.4μm滤器以及接着通过0.2μm滤器过滤。
将2.5×10cm“ECONO-柱”用在室温下在PBS中膨胀2小时的谷胱甘肽亲和基质填充。通过用4床体积的PBS洗涤平衡该柱。
在8ml/分钟的流速将柱用粗溶菌产物装填。随后以同样流速将该柱以5倍体积的PBS洗涤。
通过将流速调至0.75-1ml/分钟并加入缓冲液B洗脱该柱。将5倍柱体积的缓冲液B泵入通过该柱,收集2分钟的级分。典型的洗脱分布图被示于图2中。存在于这级分的蛋白质的含量和纯度通过标准的SDSPAGE评价(图3)。基于其预测分子量和它与PNF 2161血清的免疫反应性,识别470-20-1/sj26his融合蛋白质。为了下一步操作,可从含有融合蛋白质的级分或通过分离含有融合蛋白质的凝胶部分从凝胶中分离该蛋白质。
B.通过阴离子交换纯化克隆470-20-1融合蛋白质
溶液包括下列:
缓冲液A(10mM磷酸钠,pH8.0,4M尿素,10mM DTT),
缓冲液B(10mM磷酸钠,pH8.0,4M尿素,10mM DTT,2.0MNaCl);和
洗涤溶液(8M尿素,100mM Tris pH8.8,10mM谷胱甘肽,1.5NaCl)。
以4.0ml/分钟的流速将粗溶菌产物(或其它蛋白质源,如来自上面的被收集级分)装填至“HIGH-Q-50”(Biorad,Richmond,CA)柱上。接着以4.0ml/分钟的流速用5柱体积的缓冲液A洗涤该柱。
洗涤后,开始产生梯度,并以15柱容积由缓冲A至缓冲液B过柱。接着梯度升级至100%缓冲液B,使用一柱体积。典型的梯度示于图4A中。每10分钟收集一级分。通过标准的SDS-PAGE(图4B和4C)评价470-20-1/sj26his融合蛋白质的纯度,并收集相关级分(大约级分34-37,图4C)。
C.制备抗-470-20-1抗体
将在佛氏佐剂中的纯化的470-20-1/sj26his融合蛋白质皮下注射至兔中。在第0天和第21天,注射约1mg的融合蛋白质。在6周和8周有代表性地收集兔血清。
用纯化的sj26his蛋白质类似地免疫第二只兔。
从表达470-20-1/sj26his融合蛋白质,sj26his蛋白质和β-半乳糖苷酶/470-20-1融合蛋白质的细菌中制备小溶菌产物。将溶菌产物在凝胶上分级分离。并转移至膜上。将来自两只兔子的血清进行各自Western印迹。
用470-20-1融合蛋白质免疫的动物血清与用pGEX MOV或含有470-20-1插入片段的pGEX MOV转化的IPTG诱导的大肠杆菌W3110的微量溶菌产物中的所有sj26his融合蛋白发生免疫反应,该血清还与来自470-20-1λgt11构建物的小溶菌产物中的融合蛋白质发生免疫反应。
第二只兔与微量溶菌产物中的sj26his和470-20-1/sj26his融合蛋白质都发生免疫反应。该血清没有被预计与来自470-20-1λgt11构建物的小溶菌产物中的470-20-1/β-半乳糖苷酶融合蛋白质发生免疫反应。没有血清被预期与β-半乳糖苷酶发生免疫反应。
将用融合蛋白质免疫的动物的血清中存在的抗-470-20-1抗体通过亲和层析纯化(使用470-20-1配体)。
另外,可将融合蛋白质酶解以提供没有sj-26蛋白质序列的470-20-1抗原。接着如上所述单独使用470-20-1抗原产生抗体。
                       实施例9
                     兔抗肽血清
将肽设计成包括整个HGV序列,尤其是包括非结构和结构基因中的每一个功能基团。肽是通过常规方法商业合成的。代表性的肽示于表12中。
                       表12
      名称  肽的大小(aa) 相对于SEQ ID NO:的位点
   PEP1/NS2a       30        2674/2763
   PEP2/E1       16        733/780
   PEP3/E2       18        1219/1272
   PEP4/NS2B       18        3061/3114
   PEP5/NS3       21        3571/3633
   PEP6/NS3**       18        4909/4959
   PEP7/NS4A       18        5272/5328
   PEP8/NS4B       16        6097/6144
   PEP9/NS5A       16        7033/7080
   PEP10/NS5B       18        7783/7836
**NS3肽在C末端具有外来的半胱氨酸,它在HGV-PNF2161变
异体多肽序列中不存在;实际序列为Q。
将肽偶联至KLH上。使用兔作为宿主在多个位点皮下注射偶联的肽,通过商业手段制备抗肽兔血清。将两周的免疫记录与隔周采血一起使用。
兔抗肽血清显示为肽特异性并具有高的效价。兔抗肽血清还可识别大肠杆菌和杆状病毒中表达的相应的重组蛋白质。抗体终点效价为1∶50,000-1∶625,000稀释度。兔抗肽7(NS4a)具有仅为1∶1,000的低的终点效价。相应地,抗在例如杆状病毒系统中表达的NS4a蛋白质的兔血清可能是更为有利的试剂。
兔抗肽血清可用于相应的在例如在杆状病毒和痘病毒中表达的HGV蛋白质的免疫沉淀。兔抗肽血清还可用作EIA中的俘获抗体来检测HGV抗原.兔抗肽血清还可进一步用于识别HGV蛋白质。
                  实施例10
                   血清学
A.一批血清的Western印迹法
470-20-1融合抗原(上面描述的)被用于筛选一批血清,这一批血清中的许多是从患有肝炎以及未感染的对照个体中来的人血清。
亲和纯化的470-20-1融合抗原(实施例8)被以2μg/cm上样至12%SDS-PAGE中。在200V下,将凝胶电泳2小时,将抗原从凝胶转移至硝酸纤维素滤膜上。
将该膜用含1%牛血清白蛋白,3%正常羊血清,0.25%明胶,100mM NaPO4,100mM NaCl和1%脱脂干奶粉的溶液封闭2小时。将膜干燥,并切成1-2mm的条;每条均含有470-20-1融合抗原。将条一般性地用TBS(150mM NaCl;20mM Tris HCl,pH7.5)重新水合,在室温下将其在血清中(1∶100)中摇动保温过夜。
将条每次在TBS加上“TWEEN20”(0.05%)中洗涤,一共洗涤两次每次5分钟,接着在TBS中洗涤,一共洗涤两次每次5分钟。在室温下,再将条在二抗(Promega碱性磷酸酶结合的抗人IgG,1∶7500)中摇摆保温1小时。再将该条在TBS+“TWEEN20”中洗涤两次,每次5分钟,在TBS中洗涤两次,每次5分钟。
通过将条在含有BCIP(实施例2)和NBT(实施例2)的底物溶液的pH9.5缓冲液(100mM Tris,100mM NaCl,5mM MgCl2)中保温检测结合抗体。让显色反应持续约15分钟,到时通过在蒸馏水中洗涤3次停止显色反应。
从下面组的个体中获得试验血清:(i)献血者,HBV Ab,表面Ag阴性,HCV,HIV,HTLV-1Abs阴性;(ii)HBV,血清来自被乙型肝炎病毒感染的人;(iii)HCV,血清来自被在第二代HCVELISA分析中有活性的丙型肝炎病毒感染的人;和(iv)HXV,个体血清学为HAV,HBV,HCV或HEV阴性。
筛选的结果示于表13中。
                      表13
              470-20-1血清分段结果一览表
    样品  被检测的人血清的数目*       +      IND*       -
    献血者 30 1(3.3%) 2(6.7%) 27(90.0%)
    HBV 40 7(17.5%) 4(10.0%) 29(72.5%)
    HCV 38 11(28.95%) 11(28.95%) 16(42.1%)
    HXV 122 20(16.4%) 12(9.8%) 90(73.8%)
*不确定,弱反应性
这些结果意味着470-20-1抗原存在于大量不同的血清样品中。该抗原与正常人血清不发生免疫反应。
B.抗体检测的全面ELISA记录
将聚苯乙烯96孔平板(“IMMULON II”(PGC))用5μg/ml(100μl/孔)抗原的0.1M碳酸氢钠缓冲液,pH9.5覆盖。将平板用“PARAFILM”密封,4℃保存过夜。
将平板抽气,用300μl10%正常羊血清封闭,37℃下保温1小时。
用PBS0.5%“TWEEN-20”将平板洗涤5次。
将抗血清稀释在1×PBS,pH7.2中。将所需稀释度的抗血清(0.1ml)加到每个孔中,在37℃下,将平板保温1小时。接着用PBS0.5%“TWEEN-20”将平板洗涤5次。
结合了辣根过氧化物酶(HRP)的羊抗人抗血清(Capple)被以1/5,000稀释在PBS中。将0.1ml的这种溶液加至各孔中。在37℃下,将平板保温30分钟,再用PBS洗涤5次。
Sigma ABTS(底物)仅在被加入到平板前才制备。
该试剂由50ml 0.05M柠檬酸,pH4.2,0.078ml 30%氢氧化钠溶液和15mg ABTS组成。将0.1ml底物加入到每个孔中,在室温下保温30分钟。加入0.05ml 5%SDS(w/v)使反应停止。在410nm处测定相对吸光度。
                     实施例11
              所选择的HGV抗原的表达
将HGV全部编码序列亚克隆至多于50个的分离的重叠cDNA片段中。大多数cDNA片段的长度的范围为约200bp~约500bp。将cDNA片段分别克隆至表达载体pGEX-HisB中。该载体类似于上面所述的pGEX-MOV。
pGEX-hisB为pGEX-2T(Genbank登记号A01438;商业上可购得的表达载体)的修饰。通过在凝血酶酶切位点的正下游插入NcoI位点而将载体pGEX-2T修饰。这个位点后面接着的是BamHI位点,再接着是聚组氨酸(6个组氨酸)编码序列,再接着是在pGEX-2T中发现的EcoRI位点。感兴趣的编码序列一般被插在NcoI位点和BamHI位点之间。在图6(SEQ ID NO:115)中,插入序列编码GE3-2抗原。载体序列的其它部分与pGEX-2T相同。融合蛋白质的表达基本如上所述用其它pGEX衍生的表达载体来完成。
全部50个片段的克隆基本上如下所述完成,其中为50个编码区中的每一个选择了特异性引物。每个HGV插入DNA从使用如实施例4C中描述的一组特异性引物从PNF2161或其它HGV(+)血清提取的RNA通过PCR扩增而来。一般地,5’引物含有NcoI限制性位点,3’引物含有BamHI限制性位点。扩增片段中的NcoI引物使扩增的编码序列可以在框内融合至表达载体pGEX-Hisb或pGEX MOV中的GST-sj26编码序列中。
将扩增的HGV插入DNA用限制性内切酶NcoI和BamHI酶解。凝胶纯化酶解的插入DNA,并用NcoI和BamHI酶解的pGEX hisB或pGEX MOV连接。将大肠杆菌菌株W3110(ATCC#27325,美国典型培养物保藏中心,Rockville,MD)用连接产物转化。选择抗氨苄青霉素克隆。通过使用与插入分子(引物GLIF(SEQ ID NO:235)和GLIR(SEQ ID NO:236)旁侧的pGEX载体序列同源的引物,对来自抗氨苄青霉素的克隆进行PCR扩增证实了插入片段的存在。
PCR扩增产物的大小为插入片段的大小加上从载体衍生而来的约160bp。选择带有适宜插入片段的转化体,并使其进行如实施例7所描述的由IPTG进行的蛋白质诱导。通过Western印迹法分析表达的重组蛋白质对推断的HGV感染的人血清的特异的免疫反应性。
称为GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE-57的8个片段编码当与推断的HGV感染的人血清反应时产生清晰的免疫应答的抗原。
A.克隆GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE57
使用各片段特异性的PCR引物,从SISPA扩增的双链cDNA或从PNF2161或T55806获得的RNA通过聚合酶链式反应制备克隆GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE57的编码序列插入片段。下表14列出了每个克隆与SEQ ID NO:14的相同部分,以及用于产生每个克隆插入片段的引物系列。
                                      表14
   克隆   血清来源   SEQ ID NO:14上的对等部分        F引物(SEQ ID NO:)        R引物(SEQ ID NO:)
   GE3 PNF2161 6615-6977 GE-3F(SEQ ID NO:46) GE-3R(SEQ ID NO:49)
   GE9 PNF2161 8154-8441 GE-9F(SEQ ID NO:48) GE-9R(SEQ ID NO:49)
   GE15 PNF2161 3615-3935 GE-15F(SEQ ID NO:111) GE-15R(SEQ ID NO:112)
   GE17 PNF2161 3168-3305 GE-17F(SEQ ID NO:113) GE-17R(SEQ ID NO:114)
   GE4 PNF2161 6825-7226 GE4F(SEQ ID NO:149) GE4R(SEQ ID NO:150)
   EXP3 PNF2161 6648-7658 470EXP3F(SEQ ID NO:151) 470EXP3R(SEQ ID NO:152)
   GE1-N PNF2161 5850-6239 GE1-NF(SEQ ID NO:237) GE1-NR(SEQ ID NO:238)
   GE57 T55806 271*-456* GE57F(SEQ ID NO:239) GE57R(SEQ ID NO:240)
*这些序列相对于SEQ ID NO:178而给出。
GE 57的氨基酸序列被表示为SEQ ID NO:241。
在GE-35’引物(GE-3F,SEQ ID NO:46)一无义点突变被引入以修饰本来的NcoI限制性位点。使用上述引物产生PCR扩增产物。将扩增产物用凝胶纯化,用NcoI和BamHI酶解,再用凝胶纯化。将纯化的NcoI/BamHI GE3,GE9,GE15,GE17,GE4,GE1-N和GE57片段独立地连接到脱磷酸化的NcoI/BamHI切口的pGEX-HisB载体上。将纯化的NcoI/BamHI EXP3片段连接到脱磷酸化的NcoI/BamHI切口的pGEX-MOV载体上。
将每个连接混合物转化至大肠杆菌W3110菌株,筛选抗氨苄青霉素克隆。将抗氨苄青霉素克隆重新悬浮于Tris/EDTA缓冲液中,使用引物GLI F(SEQ ID NO:235)和GLI R(SEQ ID NO:236)通过PCR分析以证实插入序列的存在。8个代表性克隆分别称为GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57。
B.表达GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57融合蛋白质
将带有包含GE3-2,GE9-2,GE15-1和GE17-2,GE4-8,EXP3-7,GE1-N和GE57载体的抗氨苄青霉素细菌的菌落分别接种到含有氨苄青霉素的LB培养基中。让培养物生长至OD为0.8-0.9,到时加入IPTG(异丙基硫代-β-半乳糖苷;Gibco-BRL)使最终浓度为0.3-1mM以诱导蛋白质表达。在存在IPTG时,继续保温3-4小时。
通过离心收集细菌细胞,并将其重新悬浮于SDS样品缓冲液(0.0625M Tris,pH6.8,10%甘油,5%巯基乙醇,2.3%SDS)中。将重新悬浮的沉淀物煮沸5分钟,通过离心除去不溶的细胞碎片。通过聚丙烯酰胺凝胶电泳(PAGE)以及未诱导的溶菌产物分析GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57的IPTG诱导的培养物中获得的上清液。接着将来自凝胶的蛋白质转移至硝酸纤维素滤膜上(即通过Westem印迹法)。
首先将滤膜与针对GST蛋白质的兔多克隆抗体或鼠多克隆单克隆抗体(来自Sierra Biosource,CA)一起保温以检测适宜大小的GST融合蛋白质的表达。上面克隆的期望蛋白质大小分别为40,38,39,32,42,64,42和33KDa。RM001与适宜分子量的融合蛋白质的带的免疫反应性证明了上面克隆的融合蛋白质通过细菌细胞的成功表达。克隆蛋白质的表达还通过在考马斯亮蓝染色的凝胶上的由IPTG诱导的适宜大小的过表达蛋白质的出现而被监测。
C.HGV蛋白质的Western印迹分析
一旦HGV克隆蛋白质的表达通过使用抗GST抗体Western印迹被证实,接着将如上制备的一组滤膜接触一些HGV(+)和HGV(-)人血清。将用于所有细胞溶菌产物的Western印迹分析的人的血清用λ-gt11-硝酸纤维素滤膜预吸收。λ-gt11-硝酸纤维素滤膜制备如下。简而言之,在LB中制备KM392培养物的过夜培养物。用含有0.2%麦芽糖的新鲜LB将培养物稀释10倍,在37℃下,摇荡保温1小时。
1小时后,将培养物与等量的MgCa溶液(0.01M MgCl2和0.01MCaCl2)混合。将λgt11加入该混合物中至效价为2×104PFU/ml,不断摇荡保温30分钟。30分钟后(1ml噬菌体/大肠杆菌混合物),加入15ml熔化(55℃)的LB上层琼脂(具有0.8%琼脂的LB):将8ml混合物涂布至每个15cm的LB琼脂平板上。在上层琼脂凝固后,在37℃下将平板保温3-5小时。
产生噬菌斑后,将硝酸纤维素滤膜放置在平板上,在37℃下,再将平板保温过夜。取下硝酸纤维素膜,并用TBS(50mM Tris-HCl,pH7.5,150mM NaC1)加上0.05%“TWEEN20”充分洗涤。再用0.05%明胶的TBS将洗涤过的滤膜封闭。将滤膜用TBS洗涤三次(每次洗涤5分钟)。
为了人血清的预吸收,将每血清在封闭溶液(描述在实施例10中)稀释100倍。接着将10ml稀释血清与上面制备的2个λgt11滤膜一起保温过夜。除开硝酸纤维素滤膜,将预吸收的血清用于Westem印迹分析。
Western印迹分析证明GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57对HGV(+)血清显示出特异性的免疫反应性。GE-4-8与J21689血清发生免疫反应。J21689通过HGV PCR(实施例4)被确定为HGV(+)血清,HCV(+)被通过HCV PCR和血清学分析确定。EXP3-7蛋白质与JC和T55806发生免疫反应。JC在实施例4F中被鉴定为HGV阳性血清,这种血清由于其高的ALT而被血库拒收。起始血清样品一年之后获取的第二个JC样品,通过PCR分析仍为HGV阳性。T55806在实施例4F中也被鉴定为HGV阳性血清,这种血清由于其高的ALT而被血库拒收。这种血清与HCV共阳性(co-positive)。
另外,GE15-1和GE-17对PNF2161和T55806显示出弱但为特异性的免疫反应性。GE1-N与PNF2161,JC,T55806,T56633,T27034和R0001发生免疫反应。T56633,T27034和R0001在实施例4F中被鉴定为HGV(+)血清。GE57与E57963和R0001发生免疫反应。E57963为HGV和HCV共阳性血清。GE3-2和GE9-2也特异性地与HGV血清发生免疫反应。然而8种抗原中没有一种与HGV阴性血清T43608和R05072发生免疫反应。
使用采用结合了谷胱甘肽的珠(Smith,D.B.,等)和固定的金属离子珠(Hochuli;Porath)的双重层析方法。基本上如实施例7从细菌细胞溶菌产物纯化GE3-2和GE9-2融合蛋白质。如下将纯化的蛋白质进行Western印迹分析。
将各种量的纯化HGV蛋白质(例如GE3-2和GE9-2蛋白质)上样于12%丙烯酰胺凝胶上。PAGE之后,通过标准方法将蛋白质从凝胶转移至硝酸纤维素膜上。将各膜与大量人或小鼠血清中的每一份一起保温。通过洗涤膜,除去过量血清。
依据被筛选的血清,将这些膜与结合了碱性磷酸酶的山羊抗人抗体(Promega)或结合了碱性磷酸酶的山羊抗小鼠抗体(Sigma)。再次洗涤膜以除去过量的山羊抗人IgG抗体。并暴露于NBT/BCIP中。具有GE3融合蛋白质的普通染色的膜的照相示于7A-7D中。
这些图显示了使用下面血清的纯化GE3-2蛋白质的Western印迹分析的结果,N-(ABCDE)人(JC)血清(图7A),N-(ABDE)人(PNF2161)血清(图7B),极正常(SN2)血清(图7C)以及针对GST-sj26蛋白质的小鼠单克隆抗体(RM001)(图7D)。
在各个图中,泳道1含有事先染色的分子量标准(Bio-Rad),泳道2-5分别含有下列量的GE3-2融合蛋白质4μg,2μg,1μg和0.5μg。数字代表1μg/0.6cm凝胶(孔的大小)的上样量。人JC,PNF2161和极正常2血清的稀释度为1∶100。抗sj 26的稀释度为1∶1000。JC印迹中在大约97K见到的带与GE3.2融合蛋白质制备中的少量污染物发生反应。蛋白质标准的大小为142.9,97.2,50,35.1,29.7和21.9KD。
如图7A-7D所示,GE3-2对JC血清显示出特异的免疫反应性。GE3-2微弱地与PNF2161血清反应,被评为不明确的或阴性。
在平行实验中,GE9-2对PNF2161血清显示出微弱但为特异的免疫反应性。
                        实施例12
                    构建典型表位文库
A.Y5文库
聚合酶链反应被用来扩增来自PNF2161SISPA扩增的cDNA的3个重叠DNA片段。使用JMJ-A/B接头(SEQ ID NO: 54和SEQID NO:55)制备PNF2161SISPA扩增的cDNA。使用1μM JML-A引物将1微升的该材料再扩增30次(94℃下,1分钟,55℃下,1.5分钟和72℃下,2分钟)。整个反应体积为100μl。将3个扩增的产物混合,并将其按照制造商的指示通过一次流过“WIZARD PCR柱”(Promega)而与过量的PCR引物分离,该“WIZARD PCR柱”为一种在高离子强度的缓冲液中结合DNA,在低离子强度的缓冲液中释放DNA的硅基树脂。用100μl蒸馏水将扩增的DNA从柱上洗脱下来。
将洗脱的DNA在1.5%琼脂糖TBE凝胶中(Maniatis等)分级分离,溴化乙锭染色后,在紫外线下目测观察到150-1000bp的DNA片段的一个强的斑点。1μl再扩增的cDNA被用作使用表15所示每一引物对的PCR反应中的模板。
                         表15
      引物      SEQ ID NO:  扩增片段的大小
    470ep-F1470ep-R1     SEQ ID NO:56SEQ ID NO:57       810
    470ep-F2470ep-R3     SEQ ID NO:58SEQ ID NO:59       750
    470ep-F4470ep-R4     SEQ ID NO:60SEQ ID NO:61       669
将引物用未扩增表15所示大小的HGV特异性的DNA片段的扩增。在扩增反应中,引物对以1μM的浓度使用。在100μl的整个反应体积中,在94℃下,1分钟,54℃下,1.5分钟,72℃下,3分钟,使扩增进行30次。三个不同引物对的PCR反应中的每一个都导致了具有期望大小的产物的特异性扩增。对于每一引物对的反应,将来自3个独立的PCR反应的扩增产物混合,并如上所述用“WIEARD PCR柱”纯化,将纯化产物稀释于50μl蒸馏水中。
将来自每一纯化产物的样品(14μl,含有约1-2μg每一引物对扩增的DNA片段)混合。将所有三种不同的扩增片段的混合样品加入5μl 10×DNA酶酶解缓冲液(500mM Tris pH7.5,100mMMnCl2)和2μl蒸馏水中。从该酶解混合物中吸取10μl样品,置于含有5μl终止溶液(100mM EDTA,pH8.0)的试管中。该样品为0“酶解分钟”的时间点。将酶解反应的其余部分放置于25℃下。将1μl以1/25稀释的无RNA酶的DNA酶I(Stratagene)加入到该酶解混合物中。在各个时间点,将10μl等分样品取出,与5μl终止溶液混合,将DNA酶I酶解的DNA产物在1.5%琼脂糖TBE凝胶上进行分析。
一些酶解实验的结果表明40分钟的酶解提供了DNA片段在100-300bp大小范围中的良好分布。在室温下使剩下的全部酶解混合物重复进行DNA酶I的酶解过程。加入18μl终止缓冲液终止酶解,使用“WIZARD PCR柱”纯化酶解的DNA产物。用50μl蒸馏水洗脱“WIZARD-PCR柱”,将洗脱的DNA加入下面反应混合物中:7μl限制性内切酶缓冲液C(Promega,10mM MgCl2,1mM DTT,50mM NaCl,10mM Tris,pH7.9,1×浓度);11μl 1.25mMdNTPs;和2μl T4 DNA聚合酶(Boehringer-Mannhiem)。在37℃下,将反应混合物放置30分钟,到时加入70μl pH8.0的苯酚/氯仿并混合。除去苯酚/氯仿,再提取一次以产生总共150μl含DNA样品的水溶液。用2体积的无水乙醇和0.5体积的7.5M乙酸铵将DNA进行乙醇沉淀。在“ZPPENORF MICROFUGE”中,以14,000rpm转速离心,将DNA形成片状沉淀物,在42℃下干燥,并重新悬浮于25μl蒸馏水中。
将DNA连接至5’脱磷酸的SISPA接头KL1(SEQ ID NO:62)和KL2(SEQ ID NO:63)上。一些不同浓度的SISPA接头和DNA被用于试验。在下面连接反应条件,发生高水平的连接(如下所评价的):6μl DNA,2μl 5.0×10-12M KL1/KL2接头,1μl 10×连接酶缓冲液(新英格兰生物实验室)和1μl 400单位/μl T4 DNA连接酶(新英格兰生物实验室),总反应体积为10μl。在16℃下,将连接反应过夜。
如下平行地进行两个反应。在100μl的总反应体积中,将被连接材料的2μl样品用KL1 SISPA引物扩增(在94℃下,1分钟,55℃下,1.5分钟以及72℃下2分钟,共进行25次循环)。通过1.5%琼脂糖TBE凝胶电泳分离1/5 PCR反应扩增的产物来分析连接的程度。将凝胶用溴化乙锭染色,在紫外线下观察这些带。
用“ WIZARD PCR柱”纯化来自重复反应的扩增产物,以50μl蒸馏水将纯化的DNA洗脱。在30μl的总体积中,将25μl PCR KL1/KL2扩增的DNA的等分试样用36单位EcoRI(Promega)酶解。在37℃下,将反应过夜。使用“SEPADEX G25”旋转柱纯化酶解的DNA。
在过夜反应中,将EcoRI酶解的DNA连接到事先用EcoRI酶解的λgt11臂上,并用小牛肠碱性磷酸酶处理(Stratagene,La Jo1la,CA)。按照制造商的指示使用“GIGAPACK GOID PACKAGINGEXTRACT”(Stratagene)将连接混合物分装。获得的重组噬菌体的量的滴定通过将1/10稀释度的包装噬菌体涂敷到KM-392的菌苔上来进行,其中平板含有20μl 100mg/ml的X-gal溶液(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;Sigma)和20μl 0.1M IPTG溶液(异丙基-1-硫代-β-D-半乳糖苷,Sigma)。获得了含有大于75%重组噬菌体的1.2×106噬菌体/ml的效价。
使用引物11F(SEQ ID NO:25)和11R(SEQ ID NO:13)通过任意挑选的噬菌体的PCR分析确定重组噬菌体百分数。含有DNA片段的包装文库从扩增的DNA F1/R1,F2/R3和F4/R4的酶解衍生而来,称为Y5文库。
B.ENV文库
如下制备称为ENV文库的表达文库。1μl PNF2161 SISPA扩增DNA被用作使用下面引物对的聚合酶链反应中的模板GEP-F15(SEQID NO:128)和GEP-R15(SEQ ID NO:129),它们产生525个核苷酸HGV片段;以及GEP-F17(SEQ ID NO:130)和GEP-R16(SEQ ID NO:131),它们产生765个核苷酸HGV片段。
在94℃下,1分钟,52℃下,1.5分钟和72℃下3分钟将PCR扩增进行35次。纯化扩增产物并用DNA酶酶解。基本上如实施例12A中的描述,在λgt 11中将KL1和KL2接头连接至cDNA上,扩增DNA片段,构建文库。文库的重组频率大于70%。通过使用由λgt11旁侧区衍生的衍生物的聚合酶链反应对插入片段的分析证实了重组频率,并表明插入片段的大小范围为150-500个核苷酸。
C.NS3文库
如下构建称为NS3的表达文库。通过使用引物470ep-F9(SEQID NO:132)和470ep-R9(SEQ ID NO:133)以及模板PNF2161SISPA扩增核酸的聚合酶链反应将第一个片段扩增。预期的扩增反应的产物为77个碱基对。通过在TAE凝胶上的分离将扩增片段用凝胶纯化。用“GENE-CLEAN”(Bio101,La Jolla,CA)进一步纯化片段。
使用伸展克隆GE3L-11(SEQ ID NO:41)作为源物质还将片段F9/R9扩增。在扩增反应中约25ng的GE3L-11被用作带有F9和R9引物的模板。
使用“TAQ START”(Clonetech,Palo Alto,CA)在94℃下,1分钟,52℃下,2分钟,72℃下3分钟让F9/R9扩增进行30次。混合两个反应的扩增产物。将产物用DNA酶I酶解(10μl GE3L产物和25μl PNF SISPA产物)。基于GE3L的扩增产物代表了大多数扩增产物起始物质。基本上如实施例12A中的描述,在λgt11中将KL1和KL2接头连接至cDNA上。扩增DNA片段,构建文库。
获得的效价为2.5×106噬菌体/ml,重组噬菌体的百分数被确定为大于99%,对插入片段大小的聚合酶链反应分析证实了该重组频率。并表明插入片段的大小为150-550核苷酸。
另外,还使用GEP-F10/GEP-R10引物(分别为SEQ ID NO:135和SEQ ID NO:136)将第二个片段进行扩增。1μl PNF2161SISPA扩增的核酸被用作模板。获得了大小为57个核苷酸预期片段。得到的扩增产物被用于刚才描述的F9/R9扩增。当这个片段被插入λgt11时所获得的效价为1.47×106噬菌体/ml,重组频率为90%。
D.NS2文库
使用描述在实施例12A中的方法构建NS2表位文库。从1μl PNF2161SISPA DNA(基本上如实施例12A描述的制备)扩增4种含有全部或部分HGV蛋白质NS2,NS3和NS5b的DNA片段。使用表16所出的引物以及SISPA扩增的PNF2161DNA作为模板制备该文库。
                      表16
           片段    nt
9E3-REV(SEQ ID NO:264)E394-R(SEQ ID NO:265)   592 E2的aa358(of389)至NS-2的aa166
GEP-F12(SEQ ID NO:266)GEP-R12(SEQ ID NO:267)   663 NS-2的aa144(of313)至NS-3的aa51
GEP-F14(SEQ ID NO:268)GEP-R13(SEQ ID NO:269)   715 NS-3的aa357-594
470epF8(SEQ ID NO:270)GEP-R14(SEQ ID NO:271)   648 NS-5的aa716-847(716至结尾)
在94℃/1分钟,48℃/2分钟,73℃/3分钟,将所有扩增进行35次。所有扩增产生了至少一种预期大小的片段。以约1∶1∶1∶1比例混合扩增产物,用DNA酶I部分酶解。如上面,将酶解产物连接到KL1SISPA接头,将其扩增并用EcoRI酶解。将酶解片段连接到λgt11上。分装连接反应物。
接种分装的连接产物。得到的文库被确定含有一70%带有观察到的大小为150-500个核苷酸的插入片段重组噬菌体。
E.VNS5A文库
用引物470EXT4-2189R(SEQ ID NO:119)和470EXT4-29F(SEQ ID NO:120)分离含有HGV蛋白质NS4b和NS5a以及NS4a的3’末端和NS5b的5’末端的全部编码序列的2.1kbp DNA片段。如实施例4G中所描述的,进行使用这些引物的PCR扩增。在包括下面的多次HGV感染的血清中观察到了成功的扩增:T56633来自由于其所捐献的血液的ALT值高于临界值而被拒收的血液捐献者;样品E21-A和E20从患有肝炎的埃及人获得;以及样品AH0591从形成急性肝炎的澳大利亚人获得。
基本上如实施例6中所描述,将E21-A和E20的扩增产物克隆至载体T/A(获自于InVitrogen,San Diego,CA)的T伸出位点。接着通过用约150单位限制性内切酶EcoRI酶解约20μg质粒DNA,分离来自这2个质粒的2.1kb HGV插入片段。在37℃下保温过夜后,将酶解产物用TAE琼脂糖凝胶电泳分解。将产物从含有感兴趣片段的琼脂糖凝胶部分切割下来。将琼脂糖熔化,按照制造商的指示使用“GENECLEAN II”试剂盒(Bio101,La Jolla,CA)提取释放的DNA。
如实施例12A中所描述,将从E21-A和E20样品产生的纯化的2.1kb片段以及从样品T56633和AH0591的PCR扩增获得的DNA片段分别用DNA酶I酶解。对于所有4个样品,确定导致大小为100-1000nts的片段被分离的酶解条件。纯化和修整后(实施例12A),将从4个HGV感染的样品分别连接到不同组的SISPA接头。连接后,将DNA进行SISPA扩增。
在37℃下,将扩增的DNA分别用约100单位的EcoRI酶解过夜。接着将酶解的DNA通过使用G25树脂的旋转柱层析(5’3’Inc,Boulder,CO)纯化。以1∶1∶1的比例将来自样品T56633,AH0591和E21-A的酶解DNA混合,并如实施例12A所描述,将DNA的混合物连接到λgt11的EcoRI位点。分装后,使用“GIGAPACK III XL”提取物(Stratagene,LaJolla,CA)在IPTG和XGAL存在下,接种得到的文库,测定其具有约1.0×106噬菌体/ml的效价,重组频率为约70%。
                       实施例13
                   免疫筛选表位文库
A.分离具免疫活性的Y5克隆
基本上如实施例2中所描述,将两个HGV阳性血清,PNF2161和JC用于免疫筛选Y5文库。以约15,000噬菌体/平板的量将Y5噬菌体文库涂敷在20个平板上。将平板温育约5小时,用硝酸纤维素滤膜(Schleicher and Schuell)覆盖过夜。通过在AIB(1%明胶加上0.02%叠氮化钠)中保温约6小时将滤膜封闭。将封闭的滤膜再用TBS洗涤一次。
将10个Y5文库滤膜与PNF2161血清和10个带有JC血清的滤膜一起搅拌保温过夜。两血清以1∶10稀释在AIB中。为了减少非特异性抗体结合,稀释血清已通过与吸收了野生类型的λgt11的硝酸纤维素滤膜一起保温过夜而被事先处理。
将滤膜从血清中移去,用TBS洗涤三次,与结合了碱性磷酸酶的山羊抗人二抗(Promega,以1/7500稀释在AIB中)一起保温1小时。将滤膜用TBS洗涤4次。通过将滤膜在含有NBT和BCIP的AP缓冲液(100mM NaCl,5mM MgCl2,100mM Tris,pH9.5)中保温来检测结合的二抗。
挑取在最初筛选中测试为阳性的噬菌体,并用500μl PDB中(100mM NaCl,8.1mM MgSO4,50mM Tris pH7.5,0.02%明胶)洗脱。通过以总密度为100-500噬菌体/100mm平板,重新涂敷洗脱的噬菌体来纯化具有免疫反应性的噬菌体。基本上如上所述,将平板用适宜HGV阳性血清重新进行免疫筛选。显色反应后,挑取一些分离的阳性噬菌体,放入500μl PDB中。保温1小时后,将2μl重新纯化的噬菌体PDB溶液用作含有11F(SEQ ID NO:25)和11R(SEQ IDNO:13)PCR引物的PCR反应的模板。这些引物与位于λgt11的EcoRI位点的5’端70个核苷酸和3’端90个核苷酸的序列同源。在94℃/1分钟,55℃/1.5分钟,和72℃/分钟将PCR反应扩增30个循环。
将PCR扩增反应物在琼脂糖凝胶上进行大小的分级分离。纯化噬菌体的PCR扩增产生了用于每一单个噬菌体扩增反应的单链,其中纯化的片段含有DNA插入片段加上噬菌体5’和3’旁侧序列的约140个碱基对。按照制造商的教导,使用“S-300HR”旋转柱(Pharmacia)纯化来自产生单条带的PCR反应的扩增产物。采用Applied Biosystems自动测序仪377A和适当记录测定DNA的量和DNA序列。
如上面所述的用JC血清筛选Y5文库导致了示于表17中的阳性链克隆的纯化和DNA序列测定。阳性链克隆相当于存在在SEQ ID NO:14的HGV序列一多蛋白质阅读框的5’-3’翻译。
                                   表17
   克隆  筛选血清  插入片段大小(碱基对)  插入片段大小(氨基酸)   核酸SEQID NO. 被编码的蛋白质SEQ ID NO.
  Y5-10   JC     210     62     64       65
  Y5-12   JC     333     94     66       67
  Y5-26   JC     303     93     68       69
  Y5-5   JC     153     36     70       71
  Y5-3   JC     162     44     72       73
  Y5-27   JC     288     86     74       75
  Y5-25   JC     165     36     76       77
  Y5-20   JC     165     191     78       79
  Y5-16   JC     234     56     80       81
1.该克隆含有双链(double)插入片段,克隆插入片段的核苷酸69至126相当于HGV序列
这些克隆描述了在HGV的推断NS5蛋白质中的2个免疫原性区。这两个区与示为SEQ ID NO:14的序列相对应,为位置6636-6821和7278-7385。
另外,用PNF2161血清筛选Y5文库导致了示于表18的下面的阴性链克隆的纯化和DNA序列测定。阴性链克隆相当于互补于示于SEQ IDNO:14中的HGV序列的序列的5’-3’的翻译。
                                       表18
  克隆    筛选血清    插入片段的大小(碱基对)   插入片段的大小(氨基酸)   核酸SEQID NO.  被编码的蛋白质SEQID NO.
 Y5-50     PNF2161       349      104     82     83
 Y5-52     PNF2161       119      201     84     85
 Y5-53     PNF2161       250      332     86     87
 Y5-55     PNF2161       143      203     88     89
 Y5-56     PNF2161       366      110     90     91
 Y5-57     PNF2161       231      65     92     93
 Y5-60     PNF2161       151      38     94     95
 Y5-63     PNF2161       1254      25     96     97
1.该克隆含有双插入片段,克隆插入片段的核苷酸46-105相当于
HGV序列
2.该克隆含有双插入片段,克隆插入片段的核苷酸19-118相当于
HGV序列
3.该克隆含有双插入片段,克隆插入片段的核苷酸70-126相当于
HGV序列
4.插入片段在核苷酸19和35之间含有外部非HGV序列
所有这些序列含有使用PNF2161血清分离的原始HGV克隆470-20-1的部分。
如下分离来自Y5文库的另外的表位克隆。用实施例13描述的方法将Y5文库用HGV感染的血清J21689和T56633筛选,获得多于400个的阳性噬菌体,这表明被两种HGV感染的血清识别的强免疫原性的序列的存在。将10个阳性噬菌体纯化并进行DNA序列测定。DNA序列测定获得的结果描述在表19中。
                           表19
      克隆    HGV VAR      血清    起始*   终止
   Y5-114-1A     PNF     J21689    6636   6827
   Y5-114-2B     PNF     J21689    6678   6935
   Y5-121-19A     PNF     T56633    6678   7063
   Y5-121-11A     PNF     T56633    6636   6917
   Y5-121-12A     PNF     T56633    6636   6959
   Y5-121-15A     PNF     T56633    6636   6917
   Y5-121-16A     PNF     T56633    6636   6989
   Y5-121-17A     PNF     T56633    6636   7082
   Y5-121-20A     PNF     T56633    6636   6929
   Y5-121-18A     PNF     T56633    6636   6896
*开始/结束的位置相对于SEQ ID NO:14而给出。
将这些序列与前面筛选文库获得的比较,表明这些克隆均含有包含在前面分离的表位克隆Y5-10中的相同表位。两个克隆,Y5-114-2B和Y5-121-19A通过它们的5’末端比前面观察的克隆Y5-10,Y5-12和Y5-26的起始端更靠近NS5a羧基端14个氨基酸的事实而被识别。没有一个上述克隆具有位于在克隆Y5-10中所观察到3’末端的内部3’末端。因此这个表位的最小序列包含在氨基酸序列中(SEQ ID NO:272)。
B.来自ENV文库的抗原克隆
用HGV血清J21094筛选ENV文库。基于首次产生(C-100)HCV试验,该血清(J21094)被鉴定为HCV阳性。通过PCR和其它HCV抗原,对原始J21094血清样品,以及后来获得的J21094样品的后续试验证实初始个体的血清为被HCV感染。借助使用470-20-1和NS5引物对的PCR分析,获得了HGV核酸存在的证据。
大量噬菌体克隆被鉴定为与J21094血清发生免疫反应。噬菌体通过噬菌斑纯化和顺序。7个克隆(Q7-12-1,Q7-16-2-2,Q7-15-2,Q7-17-2-1,Q7-19-1和Q7-19-2-1)含有相同的插入片段。Q7-12-1的核苷酸序列被列为SEQ IDNO:143(多肽序列,SEQ ID NO:144)。
通过刚才描述的方法获得的另一个克隆,Q7-16-1与Q7-12-1具有相同的5’末端,但在3’末端短26个氨基酸。
C.来自NS3文库的抗原克隆
使用下面血清筛选F9/R9噬菌体和F10/R10噬菌体的混合物(1∶1):PNF2161,J21689和E57963。J21689和E57963为通过PCR(使用多个引物)测试为HCV和HGV共阳性(co-positive)的血清。每次免疫筛选是用10个平板或约150,000噬菌体。一些在筛选中被鉴定为免疫阳性的克隆如下。
免疫Y12-10-3(多核苷酸序列,SEQ ID NO:145;多肽序列,SEQ ID NO:146)通过其与J21689血清的免疫反应性而被识别。该克隆表达来自HGV NS3的88个氨基酸插入片段。
克隆Y12-15-1(多核苷酸序列,SEQ ID NO:147;多肽序列,SEQ ID NO:148)通过其与E57963血清的免疫反应性而被识别。该克隆表达来自HGV的NS3蛋白质的64个氨基酸插入片段。这个序列位于克隆Y12-10-35’端约70个氨基酸处。
D.来自NS2文库的抗原克隆
通过用HGV阳性血清T56633筛选NS2文库分离多个阳性噬菌斑,随后纯化11个噬菌斑,并进行DNA序列测定。包含在噬菌斑中的插入片段的位置(以SEQ ID NO:14为标准)描述在表20中。
                          表20
    克隆  HGV VAR   血清   起始*   终止
  Q9-18-5     PNF   T56633    3071    2778
  Q9-18-3     PNF   T56633    2951    2745
  Q9-20-4     PNF   T56633    3002    2745
  Q9-18-2     PNF   T56633    2990    2745
  Q9-20-8     PNF   T56633    3062    2745
  Q9-20-5     PNF   T56633    2972    2787
  Q9-17-1     PNF   T56633    2990    2745
  Q9-19-3     PNF   T56633    2982    2745
  Q9-19-1     PNF   T56633    2982    2745
  Q9-19-5     PNF   T56633    2984    2745
  Q9-20-2     PNF   T56633    3027    2745
*在此表中,位置根据SEQ ID NO:14而给出。克隆
的实际序列为所指片段的互补链。
所有免疫克隆表达相同可读框(ORF)部分。互补于编码多蛋白质的序列的HGV多核苷酸链编码可读框。该可读框为互补于SEQ IDNO:14的序列中的核苷酸322至6865。在互补链核苷酸6388处,存在一个可作为翻译起始位点的甲硫氨酸,它可以供产生159个氨基酸的蛋白质之用。
所有11个被测序的克隆的共同的最小氨基酸序列位于核苷酸6342至6606(相应于SEQ ID NO:14的互补链)。由HGV-PNF2161的负链的这个区编码的氨基酸序列被示为SEQ ID NO:273。
具免疫活性的负链区的亚克隆和随后的Western印迹分析描述如下。
E.来自VNS5A文库的抗原克隆
将约1.5×105来自VNS5a文库的噬菌体涂敷,接着用实施例13中描述的方法用HGV阳性血清J29374筛选。用J29374对VNS5a文库的免疫筛选导致了多个阳性噬菌斑的分离。将6个噬菌斑纯化并随后进行DNA序列测定。获得的DNA序列的原始链可通过其SISPA接头序列存在于克隆5’和3’末端的那些来确定。获得的克隆(以SEQ ID NO:14为标准)的起始和终止位置以及它们的来源总结在表21中。
                          表21
     克隆  HGV变异体来源    血清   起始*     终止
   Q11-14-2     AH0591   J29374    6525     6749
   Q11-16-1     E21-A   J29374    6432     6935
   Q11-10-2     T56633   J29374    6579     671O
   Q11-18-2     T56633   J29374    6579     6758
   Q11-22-1     T56633   J29374    6576     6680
   Q11-9-1     T56633   J29374    6531     6851
所有这些克隆共同含有Q11-22-1克隆的序列(SEQ IDNO:274)。这个氨基酸序列紧接着Y5-10表位的最小序列的5’端。因此它定义了HGV NS5a中另外一个独特的表位。观察到的3种HGV变异体的氨基酸序列与PNF-2161和JC分离株的序列的比较表明有极少数氨基酸取代基。
                       实施例14
           具有免疫反应性的克隆的进一步鉴定
A.亚克隆
1.Y5克隆
克隆Y5-10,Y5-16和Y5-5被选择用于亚克隆至表达载体pGEX-HisB中。设计除去位于这些克隆末端的外部接头序列的PCR引物。这些引物还被引入(i)位于各个插处片段5’末端的NcoI位点,和(ii)位于各插入片段3’末端的BamHI位点。使用这些引物(见表22),从2μl噬菌斑纯的贮藏物扩增DNA片段。
                     表22
   克隆               引物系列
   Y5-10      Y5-10-F1    SEQ ID NO:99Y5-10-R1    SEQ ID NO:100
   Y5-16      Y5-16F1     SEQ ID NO:101470ep-R3    SEQ ID NO:102
   Y5-5      Y5-5-F1     SEQ ID NO:103470ep-R3    SEQ ID NO:102
如下进行扩增:94℃/1分钟,50℃/1.5分钟,72℃/2分钟将扩增进行30个循环。扩增后,使用“WIZARD PCR”旋转柱纯化得到的DNA,其中样品稀释成50μl,并用NcoI和BamHI酶解过夜。将最小量的30单位的各种酶用于限制性核酸内切酶酶解中(NcoI,BoehringerMonnhiem;BamHI,Promega)。
将酶解的PCR片段过夜连接到已用NcoI和BamHI酶解的表达载体pGEX-HisB中。使用热休克方案(Ausubel,等,Maniatis,等)将各组连接质粒独立地用于转化大肠杆菌菌株W3110。在含有100μg/ml氨苄青霉菌的LB平板选择转化体,抗体克隆被用于接种2ml含有100μg/ml氨苄青霉素的LB。还制备表达非重组sj26/his蛋白质的培养物。
在37℃保温过夜后,将培养物以1/10稀释至2ml含有氨苄青霉素的新鲜LB中,在37℃下再保温1小时。加入IPTG使最终浓度为0.2mM,在37℃下,将培养物再培养3小时。通过离心使细菌成沉淀,并将细菌沉淀重新悬浮于100μl PBS中。将100μl 2×SDS样品缓冲液(0.125M Tris,pH6.8,10%甘氨酸,5%β-巯基乙醇,2.3%SDS)加入到沉淀物中。旋涡振荡得到的溶菌产物,加热至100℃,并保持5分钟。将每种溶菌产物的等分试样上样至12%丙烯酰胺SDS-PAGE凝胶中。
通过电泳对表达蛋白质按大小进行分级分离。使用标准方法(Harlow,等)将分离蛋白质从凝胶转移至硝酸纤维素滤膜上。用考马斯亮兰蛋白质染色含有表达蛋白质的另一凝胶。
带有质粒Y5-10,Y5-5和Y5-16的转化体表达了显著量的正确大小的重组融合蛋白质。通过将Western印迹(上面制备的)和与sj2发生特异性免疫反应的小鼠单克隆抗体(Sierra BioSourle,Gilroy,CA)一起保温证实了重组融合的一致性。
如下获得被挑选的克隆含有适宜插入片段的另外的证明。通过用含有少量能表达已接种的重组克隆的细菌的牙签接种40μl TE溶液来制备各个克隆的噬菌体溶液。从各溶液吸取5μl样品,分别进行PCR扩增。
扩增采用适宜的正向引物(例如可能表达Y5-10的克隆的Y5-10)和与位于3’至质粒pGEX-HisB克隆位点的序列同源的反向引物(SEQ ID NO:104)。PCR扩增如下进行25次:94℃/1分钟,50℃/1.5分钟,72℃/2分钟。在这些条件下,选择用于进一步分析的所有克隆产生不具其它明显的带的正确大小的DNA带。
从Y5-10,Y5-16和Y5-5插入片段(表达为sj26-his融合蛋白质)表达的抗原的免疫反应性如下确定。将上面制备的粗溶菌产物的等分试样(15μl)通过使用12%丙烯酰胺凝胶的SDS-PAGE按大小进行分级分离。将蛋白质电印迹(“NOVEX MINICELLMINIBLOT II”,San Diego,CA)至硝酸纤维素滤膜上。接着将滤膜分别与下面血清中的一种进行保温:JC,PNF2161,极正常血清4(SN4)(R05072)作为阴性对照。另外,将一滤膜与抗sj26单克隆抗体(RM001;Sierra Biosource)进行保温。
如所预料的,表达由Y5-10,Y5-5和Y5-16插入片段的编码的抗原的细菌产生的重组蛋白质全都与JC血清反应。没有观察到与PNF2161或SN4血清反应。所有蛋白质看来被以与通过它们与抗sj26单克隆抗体的反应性而确定的类似的水平表达。Y5-5和Y5-10编码的蛋白质被选择用于进一步的纯化。
培养带有含有pGEX-HisB载体的Y5-5-和Y5-10-的大肠杆菌,如上所述诱导融合蛋白质的表达。在1500psi下,使用French Press将细胞溶解在含有2mM PMSF的PBS中。离心粗溶菌产物以除去细胞碎片。以高流速将上清液上样至甘胱谷肽亲和柱上,将柱用10柱体积的PBS洗涤。将Y5-5和Y5-10融合蛋白质用10mM含有10mM谷胱甘肽的Tris pH8.8洗脱。
用缓冲液A(10mM含有8M尿素的Tris,pH8.8)以1/10将各融合蛋白质样品稀释,并将其上样至镍电荷螯合(nickel charged-chelating“SEPHAROSE”快速流动柱上。将各柱用缓冲液A重复洗涤直至没有其它污染物被洗脱下来。用一个梯度的咪唑缓冲液A洗脱融合蛋白质。在20柱体积中使一个咪唑梯度从0度至0.5M。收集各级份。
通过使用12%聚丙烯酰胺凝胶的标准SDS-PAGE分析每组级分。分别制备含有Y5-5和Y5-10融合蛋白质级分的库。
图8A-8D显示了下面样品(μg/道)的Western印迹分析的结果:泳道1,Y5-10抗原1.6μg;泳道2,Y5-10抗原0.8μg;泳道3,Y5-10抗原0.4μg;和泳道4,Y5-10抗原0.2μg。将人血清JC(图8A)和极正常2血清(图8B)以1∶100稀释。将抗GST小鼠单克隆抗体RM001(图8C)以1∶1000稀释。图8D显示通过SDS-PAGE分析,被转移至硝酸纤维素膜上和用Ponceau S蛋白质染色(Kodak,Rochester,NY;Sigma)的Y5-10抗原。箭头指示Y5-10抗原的位置。这些结果证明Y5-10与N-(ABCDE)人血清JC特异性地发生免疫反应。
图9A-9D显示下面样品的Western印迹分析结果。泳道1,Y5-5抗原3.2μg;泳道2,Y5-5抗原1.6μg;泳道3,Y5-5抗原0.8μg;泳道4,Y5-5抗原0.4μg;泳道5,Y5-5抗原0.2μg;泳道6,GE3-2抗原0.4μg;和泳道7,Y5-10抗原0.4μg。将人血清JC(图9A),T55806(图9B)和极正常2血清(图9C)以1∶100稀释。将RM001,抗GST小鼠单克隆抗体(图9D)以1∶1000稀释。箭头指示抗原Y5.5,GE3.2和Y5.10的位置。这些结果表明Y5-5抗原与JC血清的特异的免疫反应性。另外,抗原GE3-2和Y5-10与T55806发生反应。然而,Y5-5抗原不与HGV阳性血清T55806发生反应。
Y5-10抗原还被通过SDS-聚丙烯酰胺凝胶电泳被按大小分级分离。将凝胶用考马斯兰染色。用激光光密度计扫描凝胶纯度。Y5-10融合蛋白质的纯度为约95%。
2.ENV克隆
最初通过用HGV阳性血清J21094筛选ENV表位文库将免疫克隆Q7-12-1分离。采用序列特异性引物分离包含在Q7-12-1λgt11克隆中的HGV插入片段。将Q7-12-1插入片段切割下来,并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQID NO:275)。
3.NS3克隆
最初通过用HGV阳性血清E57963筛选NS3表位文库将免疫克隆Y12-15-1分离。采用序列特异性引物分离包含在Y12-15-1λgt11克隆中的HGV插入片段。将Y12-15-1插入片段切割下来并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQID NO:276)。
最初通过用HGV阳性血清J21689筛选NS3表位文库将免疫克隆Y12-10-3分离。采用序列特异性引物分离包含在Y12-10-3λgt11克隆中的HGV插入片段。将Y12-10-3插入片段切割下来并克隆至pGEX-Nde中。选择性克隆产生的融合蛋白质通过Western印迹分析来评价,插入片段的序列通过DNA序列测定来证实(SEQ IDNO:277)。
4.NS2克隆
分离由SEQ ID NO:14的NS2区序列的互补序列产生的多个负链免疫克隆。存在至少2个由HGV负链编码的重要的ORFs位于SEQ IDNO:14的互补链的核苷酸6723-7259之间,并还在核苷酸6774处具有5’甲硫氨酸。第二个ORF编码162个氨基酸的蛋白质。
将两个负链ORFs序列的选择部分克隆至表达载体pGEX-Nde中。使用适宜的寡核苷酸引物通过PNF2161SISPA物质的PCR扩增获得所有的亚克隆。因此它们包含HGV-PNF2161变异体的序列。表23显示ORF的名称,大小以及相对于SEQ ID NO:14互补链的位置。
                            表23
     名称/ORF    ORF  从NT(ATG)开始    至NT
    5’NEG ORF    159AA     6388    6865
    3’NEG ORF    162AA     6722    7258
    NORF-F1/R1    3’     7107    7259
    NORF-F4/R1    3’     6900    7259
    NORF-F4/KR2    3’     6901    7172
    NORF-F2/R1    3’     6744    7259
    NORF-KF2/R4    5’     6684    6865
    NORF-KF1/R2    5’     6881    6742
    NORF-F3/R2    5’     6389    6742
    NORF-F2/R3    3’     6744    6899
   K3P-KF2/KR1    5’3’     66846744    67726791
表的开始2列确定了以SEQ ID NO:14互补链为标准的NS2区5’和3’负链ORF的位置。其余的列示由所有9个克隆表达的特异性核苷酸序列。注意到一些克隆表达的特异性核苷酸序列。注意到一些克隆表达位于5’至PRF假设的HGV起始甲硫氨酸的氨基酸。还注意到所列的最后克隆K3P-KF2/KR1为表达ORF5’的所指部分以及接着的ORF3’的所指部分的嵌合体。
接着将所有DNA片段克隆至pGEX-Nde中。还鉴定和证实了所含的插入片段克隆。
5.NS5A克隆
表24列出了大量NS5a克隆以及它们对应于SEQ ID NO:14的区。
                       表24
      名称   HGV来源     起始     终止
    EXY10-F2     PNF     6416     6827
    EXY10-F3     PNF     6537     6827
    Q11-F1-R1     T56633     6537     6680
    Q11-F1-R2     T56633     6537     6827
    Q11-F2-R1     T56633     6576     6680
    Q11-F2-R2     T56633     6576     6827
    Y5-12     PNF     6633     6917
    EXY12     PNF     6918     6977
    EXY10F14     PNF     6822     6977
将这些序列克隆至用于被编码的蛋白质抗原的表达的载体pGEX-Nde。
B.被选择的HGV亚克隆的Western印迹分析
为了确定上面描述的负链和正链结构的活性,基本上如实施例13B中所描述,从表达各种HGV亚克隆的细菌制备全部细胞溶胞产物。接着通过SDS-PAGE将表达蛋白质等分试样分级分离,将蛋白质转移至硝酸纤维素滤膜上,用HGV阳性或对照血清(如抗sj 26MAB RM01)检测滤膜。将印迹与适宜的报告抗体一起保温。
根据被试验的HGV蛋白质,用HGV血清J21689和T56633检测与蛋白质NORF-F3/R2清晰的免疫反应性。NORF-F3/R2亚克隆表达还由负链表位克隆的Q9序列编码的氨基酸序列。观察到的与HGV血清T56633强的反应性证实了HGV负链的这个区的免疫反应性。没有观察到NORF-F3/R2蛋白质与HGV阴性个体R04316的血清或被测试的任何其它5种HGV阴性极正常血清的反应。
另外的印迹表明表达5’负链ORF的一半所在的羧基末端的氨基酸的其它主要的5’ORF克隆NORF KF2-R4不与HGV阳性血清T56633反应。
这个观察结果与上述Q9表位克隆的位置结合表明负链这部分的免疫原性表位被包含在上面描述的55个氨基酸中(SEQ ID NO:273)。这序列被包括J21689的其它HGV抗血清识别的事实表明在HGV感染的个体中对这个序列的免疫反应性是比较普遍的。
另外,在具有Y12-10-3蛋白质时,观察到了清晰的与HGV感染血清J21689,J29374和E57963的免疫反应性。这种反应的特异性还被在不存在通过IPTG诱导的Y12-10-3蛋白质表达的情况下,没有观察到与HGV抗血清J29374或E57963的免疫反应性而得到支持。用7种试验的极正常血清,没有观察到与Y12-10-3发生反应。
                        实施例15
                   多抗原HGV诊断分析
虽然上述表位克隆看起来不与所有的HGV PCR阳性血清反应,但许多克隆与大部分被再检测的HGV感染血清反应。这些蛋白质不另外显示与HGV阴性血清的真正交叉反应性。因此可以设计一种诊断分析法,将其中几个这种蛋白质混合,这样将各自的蛋白质反应性加起来。这种分析被期望对检测HGV阳性血清具有相对高的灵敏性,对HGV阴性血清具有相对低的背景反应性。
用于这种分析中的一般表位/抗原包括,但不局限于:NORF-F3/R2(NS2-Neg链),Y12-10-3(NS3),Q11-F2-R1(NS5a),Y5-10(NS5a),Y5-5(NS5a),Q11-F2-R2(结合2个NS5a表位)。
对于这种分析,一般选择含有识别HGV阳性血清不同亚组(Subset)的不同唯一的表位的各个抗原。另外,该抗原一般不与HGV阳性血清明显反应。按照本发明的指示,可分离另外有用的免疫原性克隆。
多抗原诊断分析可采取多种形式。在一个实施方案中,分析可能需要固定化的各种例如5个HGV蛋白质和位于硝酸纤维素条或其它常规固相形式各分离位置上的对照蛋白质。另外,例如HGV融合蛋白质的非病毒部分可通过插入或缺失被修饰,这样它们将自然地迁移至SDS PAGE和随后的Western印迹分析中容易辨认的位置。接着将条保温在试验血清中。检验结合的抗体后,血清可根据(i)与之发生免疫发生的抗原的编号和(ii)免疫反应的强度来计分。与非HGV蛋白质的反应性将提供不典型的血清。与非HGV蛋白质的反应性将血清分为HGV阴性。
可通过混合单一反应区带的纯化抗原蛋白质或通过形成表达2或多个作为简单蛋白质(如HGV镶嵌型多肽)的反应表位的蛋白质构建物而形成基于ELISA的分析。本文描述了构建镶嵌型多肽的方法。上述的Q11-F2-R2构建物实际上代表编码单多肽链上的2个独立表位的“基质蛋白质”(“matrix protein”)。Western印迹分析可作为该ELISA筛选试验的证明。
备选或另外的,可将全长HGV蛋白质,如E2,NS5a和NS3置于单一反应区带中。与这些蛋白质反应的血清也可通过Western印迹分析被证实为HGV阳性。
                      实施例16
                 大的HGV多肽的表达
A.大肠杆菌中较大HGV多肽的表达
1.克隆和表达
为了识别形成的HGV表位(没有被小的重叠HGV构建物或噬菌体文库筛选包括),在基于推判的酶切位点(Bazan等,1989;Chamber,等,1990b;Grakoui等,1993;Kyte and Doolittle,1982)的pET-21a(+)载体(Novagen,WI)中产生较大的HGV蛋白质构建物。各HGV蛋白质构建物以与克隆至pGEX载体中的HGV序列类似的形式产生。
简而言之,选择的HGV序列为从HGV(+)人血清来源使用HGV序列特异性引物扩增的RT-PCR。引物被设计成含有用于pET载体中克隆操作的适宜的限制性位点。感兴趣的编码序列一般被插入到载体的EcoRI位点和HindIII位点之间以产生与T7.Tag前导序物的5’框内融合和与六聚体组氨酸序列的3’框内融合。T7.Tag(11个氨基酸序列)使融合蛋白质的检测可使用抗-T7.Tag单克隆抗体(Novagen,WI)。在融合蛋白质羧基端的组氨酸六聚体使得蛋白质的纯化可使用固定化的金属离子亲和层析。将HGV片段适当地连接至酶解的pET-21a(+)载体中。将连接产物转化至感受态大肠杆菌中(HMS174;Novagen,WI)。来自转化HMS174的质粒DNA通过使用与插入分子旁侧的pET-21a(+)载体序列同源的引物T7F(SEQ ID NO:157)和T7R(SEQ ID NO:158)的PCR被用来分析HGV序列的存在。PCR产物的大小为插入片段大小加上从载体产生的约260bp。
对于每一构建物,PCR结果证实了插入序列的存在。选择带有适宜插入片段的转化体,制备带有HGV插入片段的质粒DNA,并引入用于HGV蛋白质表达的HMS174(DE3)感受态大肠杆菌中。
用1mM IPTG诱导HGV蛋白质的表达。通过在考马斯兰染色的凝胶上的推判大小的蛋白质的出现监测T7.Tag融合蛋白质的表达。通过使用抗T7.Tag抗体的Western印迹分析(Novagen,WI)来证明融合蛋白质的表达。pET-21a(+)载体表达的HGV蛋白质示表25中。表达蛋白质的起始点和终止点以SEQ ID NO:14为标准给出。GE-Cap的氨基酸序列示于SEQ ID NO:185中。
                                  表25
   名称   结构域  血清来源   起始   终止   HGV aa  大小(KDa)
  GE-Cap    壳体   T55806   271*   480*     70     11
  GE-E1a    E1   PNF   594   1148     185     24
  GE-E2    E2/NS1   PNF   1149   2183     345     41
  GE-NS2b    NS2b   PNF   2904   3254     117     16
  GE-NS3    NS3   PNF   3255   5081     609     70
  GE-NS4a    NS4a   PNF   5082   6083     334     40
  GE-NS4b    NS4b   PNF   6084   6536     151     20
  GE-NS4    NS4   PNF   5082   6536     485     57
  GE-NS5a    NS5a   PNF   6537   7529     311     39
  GE-NS5b    NS5b   PNF   7530   9044     505     59
*这些序列以SEQ ID NO:178为标准给出。
图12显示通过使用T7.Tag单克隆抗体的Western印迹分析证实的各个HGV蛋白质的表达。图12中的泳道如下:泳道1,事先染色的分子量标准(Bio-Rad);泳道2,未诱导的GE-Cap溶菌产物;泳道3-11,分别为IPTG诱导的GE-Cap,Ela,E2,NS2b,NS3,NS4a,NS4b,NS4和NS5b的溶菌产物。泳道12含有1μg纯化的NS5a。每个抗原的位置用箭头标记,如图12所示,HGV蛋白质在大肠杆菌中表达。
2.pET载体中表达的HGV蛋白质的Western印迹分析
如实施例11C所述,使用大肠杆菌全细胞溶菌产物和被预吸收的血清进行在pET载体表达的HGV蛋白质的Western印迹。分析结果表明,一些pET HGV蛋白质特异性地与HGV阳性血清发生免疫反应,但不与HGV阴性血清发生免疫反应,GE-NS2b-1蛋白质与J21689血清发生免疫反应。在Western印迹分析中,GE-NS5a-3蛋白质与一些HGV(+)血清发生免疫反应,包括JC,T55806,T56633,J21689,E57963和R0001。在这些血清中T55806,J21689和E57963为HCV共阳性(通过PCR分析)。GE-NS2b-1和GE-NS5a-3都不与一些试验的HGV阴性血清发生免疫反应。
图10A-10F显示考查抗原GE-NS2b和GE-NS5a3的反应性的Western印迹实验的一系列典型结果。图10A-10F的每一印迹中的泳道如下:泳道1,未诱导的GE-NS2b溶菌产物;泳道2,IPTG诱导的GE-NS2b溶菌产物;泳道3,未诱导的GE-NS5a溶菌产物;和泳道4,IPTG诱导的GE-NS5a溶菌产物。将每个印迹与人血清或鼠单克隆抗体一起保温:图10A,J29374;图10B,J21689;图10C,T56633;图10D,T43608(极正常血清);图10E,抗T7.Tag;和图10F,考马斯染色凝胶。所用的血清或单克隆抗体在每个印迹上指明。人血清以1∶100稀释,抗T7.Tag鼠单克隆抗体以1∶1000稀释。
除开上面所列的血清,用GE-NS5a筛选另外的HGV PCR阳性血清。这些分析结果证实了GE-NS5a抗原与多HGV感染的血清的反应性。GE-NS5b与HGV(+)血清JC发生免疫反应,但T55806不与试验的HGV(+)阴性血清发生免疫反应。图13A-13E显示一系列考查抗原GE-NS5b的反应性的Western印迹实验的结果。每个印迹图中的泳道如下:泳道1,预染色的分子量标准(Bio-Rad);泳道2,未诱导的GE-NS5b溶菌产物;泳道3,IPTG诱导的GE-NS5b溶菌产物。
将各印迹与人血清或小鼠单克隆抗体一起保温:图13A,抗T7.Tqg单克隆抗体;图13B,JC;图13C,T55806;和图13D,T43608(极正常血清)。图13E为考马斯兰染色。
图14A到14D显示一系列考查抗原GE-E2反应性的Western印迹实验的结果。图14A-14D中的每一个中的泳道如下:泳道1,预染色的分子量标记(Bio-Rad);泳道2,未诱导的GE-E2溶菌产物;泳道3,IPTG诱导的GE-E2溶菌产物。将各印迹与人血清或小鼠单克隆抗体一起保温:图14A,抗T7.Tqg单克隆抗体;图14B,3831781;和图14C,T43608(极正常血清)。图14D为考马斯兰染色。使用的血清或单克隆抗体在各印迹上指明。GE-E2蛋白质与HGV阳性血清3831781,但不与极正常血清T43608发生免疫反应(分别为图14B和14C)。
抗原GE-Cap和GE-NS4a也与HGV(+)血清J21689特异性地发生免疫反应。
B. 在昆虫细胞中较大HGV抗原的表达
使用重组杆状病毒的蛋白质表达提供了以下优点(i)高水平的重组蛋白质表达,和(ii)高等真核体系的好处,包括有效的蛋白质移位和修饰。这个体系尤其有利用于移位蛋白质的表达,如HGV E1,E2和NS2a。
1. 克隆和表达
草地贪夜蛾(Spodoptera frugiperada)昆虫细胞培养物sf21和苜蓿银纹夜蛾(Aufografa californica)核多角体病毒“BACULOGOLD”(Pharmingen,San Diego,CA)的衍生物被用于HGV多肽的表达。已有的方案被用于昆虫细胞培养和通过用线性化的杆状病毒DNA(King,1992)共转染杆状病毒质粒转化载体产生重组杆状病毒。用常规技术构建杆状病毒质粒转移载体(Maniatis,等,Sambrook,等)。
杆状病毒转化载体pAcYM1(King,等,1992)被通过将编码组氨酸六聚体的双链寡核苷酸连接到载体的BamHI编码位点(载体称为pAcYMIH)而修饰。终止密码子(TAA)被放在组氨酸六聚体序列之后。这样在表达蛋白质的羧基末端提供了一个组氨酸六聚体。在pAcYMIH中,pAcYMI亲代载体的BamHI克隆位点仍保持完整,并可被用于克隆框内具有组氨酸六聚体的各种基因。组氨酸六聚体提供了一快速有效的纯化表达蛋白质的方法(Janknecht,等,1991)。
第二个杆状病毒转化载体pVT-Bac也用类似方式修饰以提供一个位于表达蛋白质羧基端的组氨酸六聚体。pVT-Bac象pAcYMI一样含有一个强的后期多角体蛋白启动子。另外,pVT-Bac还提供了一个强的昆虫移位信号序列以保证表达蛋白质的有效移位(Tessier,等,1991)。pVT-Bac载体通过将编码一个组氨酸六聚体的双链寡核苷酸连接到载体的BamHI克隆位点(产生pVT-BacH载体)而被修饰。在得到的pVT-BacH载体中pVT-Bac亲代载体的BamHI克隆位点保持完整,可被用于克隆框内具有昆虫前导序列和组氨酸六聚体序列的基因。
通过逆转录PCR获得编码各种HGV基因的DNA片段。根据推判的酶切位点(Bazan,等,1989;Chambers,等,1990b;Grakoui,等,1993;Kyte and Doolittle,1982)选择HGV基因组的区。下面引物对被用在使用PNF2161来源的核酸的RT-PCR扩增反应。E1,SEQ ID NO:242,SEQ ID NO:243;E2B(HGV信号序列),SEQ ID NO:244,SEQ ID NO:245;E2C(昆虫信号序列),SEQ ID NO:246,SEQ ID NO:247;NS2a,SEQID NO:248,SEQ ID NO:249;NS2b,SEQ ID NO:250,SEQ ID NO:251;NS3,SEQ ID NO:252,SEQ IDNO:253;NS4a,SEQ ID NO:254,SEQ ID NO:255;NS4b,SEQ ID NO:256,SEQ ID NO:257;NS5a,SEQID NO:258,SEQ ID NO:259;NS5b,SEQ ID NO:260,SEQ ID NO:261;和E1-E2-NS2a,SEQ ID NO:262,SEQ ID NO:262。
将扩增的DNA片段用BamHI或BglII核酸内切酶酶解,并克隆至BamHI切口的pAcYMI,pAcYMIH,pVT-Bac或pVT-BacH载体中。将编码E1和E2羧基末端的锚式(anchor)序列以及NS5b羧基末端水性序列缺失以便于后面的蛋白质纯化。
将含有HGV序列的重组杆状病毒质粒转移载体用线性化的杆状病毒DNA共转染,在X-gal(King,等,1992)存在下,选择为白色中心点的重组病毒。将重组病毒两次用噬菌斑纯化和并让其繁殖。在重复性(multiplicity)为5p.f.u/细胞时将单层sf21细胞用重组杆状病毒感染,在27℃下保温60小时。将细胞用PBS洗涤,用TNN缓冲液(50mM Tris-HCl,pH8.0,150mM NaCl,0.5%“NONIDET-P40”)溶解。通过以14K将细胞样品离心5分钟分离包涵体。将包涵体重新悬浮在蛋白质解离缓冲液中(10%2-巯基乙醇),10%SDS,25%甘油,10mM Tris-HCl pH6.8,0.02%溴酚兰),在100℃下保温10分钟。
通过SDS-PAGE分析蛋白质表达类型。将蛋白质用0.1%SDS-18%PAGE分离,用考马斯兰染色。大多数HGV蛋白质以高水平表达,可容易地在考马斯兰染色凝胶上检测。NS5a和NS2a多肽用35S甲硫氨酸蛋白质标记而被检测(King等,1992)。
如下考查HGV E2蛋白质糖基化作用。将sf21细胞用重组杆状病毒感染,并按如上所述处理。通过0.1%SDS-12%PAGT分离蛋白质,将其电印迹至“IMMOBILON-P”膜上(Millipore,Bedford,MA)上,并与甘露糖残基特异性的雪花莲凝集素反应(Galanthus nivalisagglutinin)反应(Boehringer Mannheim DIG Glucan分化试剂盒)。用自身信息序列表达的HGV E2蛋白质被大范围地糖基化,这说明推断的E2信号序列可起如此的作用。
2. 免疫荧光测定分析
用如上所述的杆状病毒构建物感染SF21昆虫细胞。收集细胞,以1.5K rpm的转速离心3分钟,以1×PBS洗涤,再离心。
为了免疫荧光分析(IFA)(King,等,1992),将细胞重新悬浮于PBS中,铺至载玻片的孔中,使细胞在载玻片的孔中形成亚汇合层。空气干燥载片。将细胞用预冷却至-70℃的丙酮固定10分钟,用PBS再水合5分钟。吸过过量的PBS。将固定的细胞用下面“封闭”缓冲液处理1小时:40mM Tris-HCl pH7.5,3%山羊血清,1%BSA,1%脱脂奶粉和0.1%明胶。
接着将一抗加入到固定的细胞中。一抗包括一系列人HGV阳性血清和阳性对照单克隆抗体。在使用前,用昆虫细胞溶胞产物预吸收血清以除去非特异性蛋白质。在4℃下,将预吸收过夜。未感染的SF21被用作阴性对照。在加入选择性的一抗(血清)后,将载片保温2小时,接着用PBS洗涤几次,除去过量缓冲液。接着将结合了荧光素的二抗(0.5μg/ml浓度)加入至载片上的样品中。二抗的保温时间和温度与一抗的相同。保温后,将载片用PBS洗涤,盖上盖玻片,接着使用荧光显微镜确定细胞的荧光。
分析结果如下。表达HGV抗原E1-E2-NS2a的细胞与4/10HGV阳性血清发生免疫反应,与另外的2/10血清发生轻微的免疫反应。表达E1的细胞与1/10血清发生轻微的免疫反应。表达E2的细胞与3/10血清发生免疫反应,与1/10血清发生轻微免疫反应。带有HGV抗原的细胞不与极正常的对照血清发生免疫反应。
3. 杆状载体中表达的HGV蛋白质的Western印迹分析
还对在被重组杆状病毒感染的sf21昆虫细胞中表达的HGV蛋白质进行Western印迹分析。如上所述制备包涵体,将其进行Western印迹分析。用预吸收血清进行Western印迹分析。分析结果证明E2蛋白质(具有内源HGV信号序列的一个变异体E2B,带有昆虫信号序列的第二个变异体E2C)特异性地与HGV(+)血清383178发生免疫反应。
图15A-15D显示考查杆状抗原E2B和E2C的反应性的一系列Western印迹实验的结果。图15A-15D的各个印迹中的泳道如下:泳道1,预先染色的分子量标准(Bio-Rad);泳道2,E2B溶菌产物;泳道3,E2C溶菌产物;泳道4,β-半乳糖苷酶溶菌产物。各印迹与人或兔血清保温:图15A,兔抗E2抗体;图15B,3831781(HGV PCR-阳性血清);图15C,3838857(HGV阴性血清)。图15D考马斯兰染色。使用的血清或兔抗体在各印迹上指明。人血清以1∶100稀释,兔血清以1∶1000稀释。
另外,在昆虫细胞中表达的HGV抗原NS2b蛋白质与J21689发生免疫反应。这些结果与用pET表达的HGV蛋白质所获得的结果一致。
C. 较大抗原在痘苗中的表达
1. 克隆和表达
将HGV基因组的各区整合到用于表达的痘苗病毒基因组中。一般性的HGV多肽表达策略在图16中所出。通过表明推断蛋白质区的开放框画出全部长度的多蛋白(没有按比例):C=强碱性的蛋白质,4A=NS4A,4B=NS4B,5a=NS5A,5b=NS5B。带有核苷酸定位(在多蛋白质下)的各个框代表用于痘苗病毒表达的典型HGV区。框中的数字代表重组病毒的名称。病毒#1由HGV Stain T55806的强碱性蛋白质区产生(SEQ ID NO:185)。
产生两组重组病毒。第一组含有相当于HGV cDNA序列分析基础上的各个蛋白质结构域的HGV序列(图16,片段#1-#9)。第二组含有横跨多个蛋白质结构域长达HGV基因组全长的HGV序列(图16,#10,#11,#14)。
将HGV基因组的各区克隆至痘苗表达载体的多克隆位点。将包括细菌噬菌体T7体系和大肠杆菌乳糖酵解基因阻遏物的重组痘苗病毒表达系统用于高水平的诱导表达(Fuerst,1986;Zlrog-Stein,1989;Alexander,1992;Moss等)。因此重组蛋白质仅在存在诱导物如异丙基β-D-硫代半乳糖苷(IPTG)时表达。直接克隆和PCR被用于质粒构建。在后者,适于克隆至痘苗病毒中的限制性内切酶位点被掺入用来扩增各DNA片段的引物中。
多组氨酸标记也被掺入每一个覆盖HGV各结构域的克隆中,以用于表达蛋白质的纯化。将HGV-PCR扩增产物用适当的限制性内切酶酶解,并连接至痘苗载体上。通过同源重组和药物选择(霉酚酸),将靶HGV cDNA片段整合到疫苗病毒基因组中(Falkner,1988,Earl,1991)。在产生病毒储液之前,将重组病毒用噬菌斑纯化4次。
每一克隆的核苷酸长度表示在图16中。较小的克隆组(#1-#9)可用于HGV表位酶谱分析(mapping)。较大克隆(如#10,#11和#14)也可用于实验酶谱分析HGV多蛋白质酶切位点。除图16所示的克隆外,可构建覆盖从NS3-NS5b的多个结构域的另外的重组病毒。
将表达质粒转染至用亲代痘苗病毒感染的哺乳动物细胞中。CV-1和BS-C-1细胞存活于补加了10%胎牛血清的基本必需培养基(MZM)。将细胞用于转染(CV-1),重组病毒的选择以及繁殖中(BS-C-1)。
2. 评价重组蛋白质表达
在存在或不存在IPTG的情况下,将BS-C-1细胞用重组病毒感染7小时,以后将细胞用35S-甲硫氨酸标记1小时(Zhang,1991)。简单地说,将1×106BS-C-1细胞用感染复度(multiplicity ofinfection)(MOL)为10个噬菌斑形成单位(PFU)/细胞的重组病毒感染1小时,在存在或不存在5mM IPTG的情况下,补加培养基继续感染6小时。在存在或不存在5mM IPTG的情况下,将细胞用600μl没有甲硫氨酸,补加了2.5%透析过的胎牛血清,加上60μci 35S-甲硫氨酸(“TRAN35S-标记”ICN,Costa Mesa,CA)的培养基脉冲标记6小时。在存在100mM Tris pH8.0,150mM NaCl和1%“TRITON X-100”的情况下,在冰中将被标记的细胞溶解10分钟。将核离心沉淀,收集上清液用于分析。
通过SDS-聚丙烯酰胺凝胶电泳分析细胞溶胞产物(Fling,1986;Schagger,1987)。将凝胶用荧光自显影溶液“AMPLIFY”(Amersham,Arlington Heights,IL)处理之前,将其用50%甲醇和10%乙酸固定,干燥凝胶,将其暴露于X-射线胶片中。
运用这种方法已证实了由含有插入片段#4-#11以及#14(图16)的病毒进行的HGV多肽的表达。以类似方式证实了对应于其它区域的多肽的表达。例如,在NS5a构建物中,由IPTG诱导下,产生了迁移至46KDa蛋白质标准之下的独特的多肽。这种蛋白质在不存在IPTG的感染中没有见到,这证实了该蛋白质与NS5a重组蛋白质的一致性。
另外,使用抗来自于各病毒感染体的35S-甲硫氨酸标记的细胞溶胞产物的HGV区域特异性的抗血清(例如用来抗来自感兴趣区的分离HGV多肽的兔抗血清)进行限制性免疫沉淀来评价重组病毒的蛋白质表达。例如,已证实NS2,NS3,NS4B,NS5A和NS5B的表达。另一种评价重组蛋白质表达的方法是用HGV-区域特异性抗血清进行Western印迹分析。
当全长HGV多蛋白质在#14病毒中表达时(图16),使用HGV区域特异性抗血清进行免疫沉淀检测NS2,NS3和NS5的加工产物,证明了全长HGV克隆在评价多蛋白质加工中的有用性。
使用类似于图16所示的表达策略,选择性的HGV蛋白质/抗原可在酵母或CHO细胞中表达。酵母提供了高水平的表达,经济的操作并易于扩大至商业生产。CHO细胞系可使重组蛋白质分泌到用于大规模蛋白质生产和有用分离,例如用于疫苗生产的生长培养基中。
                     实施例17
          HGV编码的高度碱性(Basic)蛋白质
A.用于来自PNF和T55806的HGV转译起始的甲硫氨酸的确定。
位于HGV-PVF2161变异体的核苷酸(nt)459(以SEQ IDNO:14为标准)的甲硫氨酸在多蛋白质的框中。“壳体”区为32个氨基酸长度。在其它HGV分离株中,如T55806,这个区更长(例如约83个氨基酸)位于HGV-PNF2161变异体的核苷酸349(以SEQ IDNO:14为标准)的甲硫氨酸不在多蛋白质序列的框中,但在HGV-T55806变异体的相同位置的甲硫氨酸在多蛋白质的框中。为了检查是否在HGV-PNF2161的这个位置存在连续(read-through)或核苷体框移位,现进行下面实验。
制备构建物含有(i)具有HGV E1区上游的所有MET密码子的HGV基因组序列(如在HGV-PNF2161中,存在6个这种METs,在T55806中存在5个),(ii)对于每个构建物,两个不同的3’末端,使得可以确定是否发生了连续的核糖体移位。对于给定的基因组DNA,如两个转译产物大小相同,这意味着在终止密码子处被超前终止。另一方面,如果发生连续或框移位,预计得到两个有55个氨基酸不同的产物。
在pGEX载体中,总共21个含有来自变异体HGV-PNF2161和HGV-T55806的序列的构建物被亚克隆,在大肠杆菌中相应的蛋白质被表达。得到的转译产物的大小通过考马斯兰染色的凝胶和用单克隆抗GST抗体印迹的Western印迹法确定。诱导和未诱导的样品被制备用于每一个构建物。
结果证明蛋白质产物的大小与通过在多蛋白质框中的第一个甲硫氨酸起始的转译所预想的一致。没有框移位或连续的证据。
B.另外编码的强碱性蛋白质
Fickett(1992)的方法被用来筛选基因组序列HGV-PNF2161和HGV-JC以得到可能编码蛋白质的序列(i)前面描述的多蛋白质的替代,(ii)在HGV-PNF2161和HGV-JC之间显示出保守性,以及(iii)在pH大于10时,具有预计的等电点。识别了两种这样的可能蛋白质。
第一个蛋白质在HGV PNF2161中由残基628-882(以SEQ IDNO:14为标准)编码,在HGV-JC中由残基556-810(以SEQ IDNO:182为标准)编码。该蛋白质为85个氨基酸长度,大于HFC94-1与JC9B之间的75%的同源性,预计pI为11.6-12.3。
第二个蛋白质在HGV-PNF2161(以SEQ ID NO:14为标准)由残基6844-7125编码,在HGV-JC中由6772-7053编码。该蛋白质为94个氨基酸长度,大于HGV-PNF2161和HGV-JC之间的88%的同源性,预计pI为12.4-12.7。
这两个典型的蛋白质代表可能表达的强碱性的HGV蛋白质。
                    实施例18
        克隆另外的HGV分离株和设计诊断引物
A.构建HGV-PNF2161的cDNA克隆
通过将三个重叠PCR产物克隆至质粒载体pGEM3Z中构建来自PNF2161的几乎为全长的HGV基因组的cDNA克隆(Promega,Madison,WI)。用于构建的PCR产物通过使用“SUPERSCRIPT II”(Gibco/BRL,Gaithersburg,MD)的逆转录,接着使用长靶序列扩增允许的反应条件进行PCR(“rTth-XL”聚合酶和“XL PCR BUFFERS”,Applied Biosystems,Foster City,CA)而获得。用于“大范围”PCR反应的rTth酶具有校正错误掺入的核苷酸的校读活性(即3’-5’外切核酸酶的活性),因此提供了高可靠性的PCR。
用于构建HGV基因组的三个产物包括(i)使用引物GV75-36FE(SEQ ID NO:228)和GV75-7064 RLE(SEQ ID NO:229)扩增的内在6.7kbp产物(SEQ ID NO:14的核苷酸2101-8834);(ii)使用28F(SEQ ID NO:230)和FV94-2864R(SEQ IDNO:231)扩增的2.8kb5’-末端产物(SEQ ID NO:14的核苷酸38-2899);和(iii)使用FV94-6439F(SEQ ID NO:232)和FV94-9331R(SEQ ID NO:233)扩增的2.9kb3’-末端产物(SEQ ID NO:14的核苷酸6449-9366)。
首先,将6.7kb内在片段克隆至“TA-载体”pCRII中以产生克隆HGV7。接着,从HGV7中取出6.1kb KpnI/EcoRI片段,将其与用KpnI/XbaI酶解的2.8kb5’-末端产物混合(引物28F含有人工XbaI位点),并克隆至XbaI/EcoRI酶解的pGEM3Z中。该8.8kb克隆,缺乏HGV基因组的3’部分的约0.6kb,被称为HGV-KEX-2。为了构建几乎为全长的HGV基因组,将3’-末端HGV产物用NheI和EcoRI酶解(引物FV94-9331R含有人工EcoRI位点),并克隆至NheI/EcoRI酶解的HGV-KEX-2质粒中,产生一个为9329个核苷酸的克隆HGV-PNF2161序列(SEQ ID NO:14的核苷酸38-9366),该克隆被称为3Z-HGV94-6,3Z-HGV94-6的互补序列列为SEQ ID NO:234。
克隆3Z-HGV94-6可被用于产生体外转录全长HGV RNA或它的一部分(例如使用SP6聚合酶)。该RNA分子可被用于转染人细胞系。这个方法可被用于对病毒基因组各区的酶谱分析,研究它的复制,了解人细胞HGV致病性的机理(Rice等,1989;Sumiyoshi,等,1992;Yoo,,增995)。
B.克隆JC变异体
在40,000rpm下将1ml JC血清离心2小时(Beckman,SpincoRotor70.1Ti)。用“TRI-REAGENT”(MRC,Cincinnati,OH)提取得到的沉淀物,产生3个相。上面的相仅含RNA。获取该相,通过乙醇沉淀回收RNA。
通过两种方法从JC样品中产生HGV cDNA分子。第一种方法是通过特异性的巢居引物的JC核酸样品的扩增(RT-PCR)。引物序列以从PNF2161血清获得的HGV序列为基础。选择引物的标准为(i)具有高G/C含量的区,和(ii)没有重复序列。
用于产生HGV cDNA分子的第二个方法是使用HGV(PNF2161)特异性引物扩增,接着用32P-标记的寡核苷酸探针对HGV特异性序列进行识别。基本上如Sambrook等,(1988)所描述进行DNA杂交。PCR产生的克隆被(i)克隆至“TA”载体上(Invitrogen,SanDiggo,CA),并用载体引物(TAP和TAF)测序,或(ii)PCR扩增后直接测序。探针和引物的序列以从PNF2161血清获得的HGV变异体为基础。
这两种方法产生了来自于JC血清的多重叠HGV片段。每一片段均被克隆和测序。序列以获得列为SEQ ID NO:182(多肽序列,SEQID NO:183)的HGV(JC-变异体)的共有序列。HGV(JC-变异体)病毒的各区的序列以来自至少三个不同的重叠独立的克隆的共有序列为基础。
C.其它HGV变异体
除开HGV PNF2161-变异体和JC-变异体序列,通过类似上面所述的方法,已从血清BG34,T55806和EB20中获得三个独立的HGV分离株。这些分离株的部分序列被列为SEQ ID NO:176(BG34核酸),SEQ ID NO:177(BG34多肽),SEQ ID NO:178(T55806核酸),SEQ ID NO:179(T55806多肽),SEQ IDNO:180(EB20-2核酸)和SEQ ID NO:181(EB20-23多肽)。
D.诊断性PCR用的选择性引物
PCR引物和相应分析方法的设计可一般以对保守区的分析为基础从HGV组的区产生。根据HGV-JC变异体与HGV-PNF-2161变异体的比较,HGV的5’非转译区被选择作为这样的区,用于设计其它检测HGV分离株的基于PCR的诊断试验。两个典型的引物为FV-94-22F(SEQ ID NO:124)和FV94-724R(SEQ ID NO:125)。这些引物扩增HGV基因约为728bp的片段。
对来自采用两个用于36个HGV分离株的引物的反应的扩增产物进行序列分析(包括PNF2161和JC,见表26)。
约728个碱基对的扩增产物的约400个碱基对的区域(SEQ IDNO:14的核苷酸69-469)被用于多次序列校准(表26)以及保守区的进一步确定(见下表)。
                         表26
  SEQ ID NO:  血清编号    国家     %ID PNF2161
     186    S59    英国         96.8
     187    S368    英国         98.8
     188    S309    英国         95.5
     189    FZ  澳大利亚         96
     190    G21    希腊         97.8
     191    G23    希腊         94.3
     192    G59    希腊         93.6
     193    E36    埃及         94
     194    R38730    美国         94.8
     195    G281    希腊         97.8
     196    G157    希腊         94.3
     197    G154    希腊         96
     198    G213    希腊         94.8
     199    G204    希腊         98.3
 SEQ ID NO:   血清编号    国家     %ID PNF2161
    200     G191    希腊          94.8
    201     G299    希腊          94.8
    202     T56957    美国          95.3
    203     C01698    美国          98.8
    204     T27034    美国          93.5
    205     E57963    美国          98.5
    206     R37166    美国          97.5
    207     B5    德国          95.5
    208     B33    德国          95.5
    209     FH010  澳大利亚          95
    210     PNF2161    美国          100
    211     JC    美国          96.3
    212     7155    秘鲁          89.8
    213     7244    秘鲁          89
    214     K27    朝鲜          89.5
    215     K30    朝鲜          89.5
    216     T55875    美国          97.3
    217     T56633    美国          93.5
    218     EB20    埃及          94.1
    219     T55806    美国          95.6
    220     BG34    希腊          94.8
    221     BE12    埃及          95
用于样品中HGV分离体的检测的基于扩增(例如PCR)或基于探针的方法/分析法包括适宜引物/探针序列的选择。这种分析法的两个标准为对HGV序列低的模板敏感性和特异性。序列的校准(例如刚才所述的)可有助于引物/探针的选择和设计。
选择引物的一些标准如下:(i)在序列中引物对的正向和反向引物不能显著地互补;以及(ii)引物不应具有显著的自身互补性或可能形成二级结构。这些预防措施减少了引物二聚体和寡聚体产生的可能性。
引物可能最适宜于从在不同分离株中没有显示出变异的序列区来设计,但也可从较小同源性的区,通过在用于计算已知分离株趋异性的位置上掺入混合碱基或中性碱基例如肌苷的合成方法来设计。下面两组引物为可被用于设计检测HGV基因组的基于PCR的分析方法的引物的实例:正向引物SEQ ID NO:222,SEQ ID NO:223和SEQ IDNO:244;和反向引物SEQ ID NO:225,SEQ ID NO:226和SEQ ID NO:227。
在HGV诊断分析的设计中,可以采用引物的各种组合。引物的最佳的组合由实验确定,一般建议考虑分析方法的敏感性和特异性。这些考虑包括下面:(I)为了有效扩增和易于产物检测的长度为100-300bp的PCR产物;(ii)能重复检测至少10个拷贝的靶HGV的能力;和(iii)能重复检测大多数HGV变异体的能力。
另外,探针序列可用混合碱基和中性碱基合成法类似地设计和/或可以降低的严谨性被使用以检测大多数HGV变异体。
虽然已参考具体方法和实施方案描述了本发明,但应该理解在不背离本发明的情况下,可以作各种修改和变化。
                          序列表(1)一般的信息:(i)申请人:
(A)名称:Genelabs Technologies,Inc.
(B)街道:505Penobscot Drive
(C)城市:Redwood City
(D)州:CA
(E)国家:USA
(F)邮政编码:94063(ii)发明名称:庚型肝炎病毒和它的分子克隆(iii)序列数目:277(iv)通信地址:
(A)地址:Dehlinger & Associates
(B)街道:350Cambridge Ave.,Suite250
(C)城市:Palo Alto
(D)州:CA
(E)国家:USA
(F)邮编:94306(v)计算机可读形式:
(A)媒介类型:软磁盘
(B)计算机:IBM PC兼容
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.25(vi)本申请数据:
(A)申请号:
(B)申请日:
(C)分类:(vii)优先申请数据:
(A)申请号:US08/389,886
(B)申请日:15-FEB-1995
(C)记录号:4600-0201.35  (vii)优先申请数据:
  (A)申请号:US08/357,509
  (B)申请日:16-DEC-1994
  (C)记录号:4600-0201.34(vii)优先申请数据:
  (A)申请号:US08/329,729
  (B)申请日:26-OCT-1994
  (C)记录号:4600-0201.33(vii)优先申请数据:
  (A)申请号:US08/344,271
  (B)申请日:23-NOV-1994
  (C)记录号:4600-0202(vii)优先申请数据:
  (A)申请号:US08/285,558
  (B)申请日:03-AUG-1994
  (C)记录号:4600-0201.30(vii)优先申请数据:
  (A)申请号:US08/285,543
  (B)申请日:03-AUG-1994
  (C)记录号:4600-0201.32(vii)优先申请数据:
  (A)申请号:US08/246,985
  (B)申请日:20-MAY-1994
  (C)记录号:4600-0201(viii)代理人的信息:
  (A)姓名:Fabian,GaryR.
  (B)登记号:33,875
  (C)参考/记录号:4600-0201.41/G100PCT(ix)通讯的信息:
  (A)电话:(415)324-0880
  (B)传真:(415)324-0960(2)SEQ ID NO:1的信息:(i)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:SISPA引物,拓扑链接头AB(xi)序列描述:SEQ ID NO:1:GGAATTCGCG GCCGCTCG                                              18(2)SEQ ID NO:2的信息:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:接头AB,底链(xi)序列描述:SEQ ID NO:2:CGAGCGGCCG CGAATTCCTT                                            20(2)SEQ ID NO:3的信息:(i)序列特征:
(A)长度:237个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:PNF2161克隆470-20-1(ix)特性:
(A)名称/关键词:
(B)位置:1..237(xi)序列描述:SEQ ID NO:3:GAA TTC GCG GCC GCT CGG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT    48Glu Phe Ala Ala Ala Arg Ala Val Ser Asp Ser Trp Met Thr Ser Asn1               5                  l0                  15GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC GGC GGG GTC    96Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val
         20                  25                  30TTC TCA TCT GAG CTG CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA    144Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly
     35                  40                  45GTA CGG GGG ATG TCT TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA    192Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro
 50                  55                  60CAA AGA GAG GGT GTA CTG CAG TCC TCC ACG AGC GGC CGC GAA TTC        237Gln Arg Glu Gly Val Leu Gln Ser Ser Thr Ser Gly Arg Glu Phe65                  70                  75(2)SEQ ID NO:4的信息:(i)序列特征:
(A)长度:79个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:4:Glu Phe Ala Ala Ala Arg Ala Val Ser Asp Ser Trp Met Thr Ser Asn1               5                  10                  15Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val
         20                  25                  30Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly
     35                  40                  45Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro
 50                  55                  60Gln Arg Glu Gly Val Leu Gln Ser Ser Thr Ser Gly Arg Glu Phe65                  70                  75(2)SEQ ID NO:5的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:HNV-R1(xi)序列描述:SEQ ID NO:5:GTTGACCAAC TGAGTCTGAA GC                                          22(2)SEQ ID NO:6的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无  (vi)原始来源:
(C)各分离株:HAV-F1(xi)序列描述:SEQ ID NO:6:GATTGGAAAT CTGATCCGTC CC                                        22(2)SEQ ID NO:7的信息:(i)序列特征:
(A)长度:19个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:HCV-LANR个体(xi)序列描述:SEQ ID NO:7:TCGCGACCCA ACACTACTC                                             19(2)SEQ ID NO:8的信息:(i)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:HCV1532个体(xi)序列描述:SEQ ID NO:8:GGGGGCGACA CTCCACCA                                              18(2)SEQ ID NO:9的信息:(i)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470-20-1-77F(xi)序列描述:SEQ ID NO:9:CTCTTTGTGG TAGTAGCCGA GAGAT                                     25(2)SEQ ID NO:10的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470-20-1-211R(xi)序列描述:SEQ ID NO:10:CGAATGAGTC AGAGGACGGG GTAT                                      24(2)SEQ ID NO:11的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物KL-1(xi)序列描述:SEQ ID NO:11:GCAGGATCCG AATTCGCATC TAGAGAT                                   27(2)SEQ ID NO:12的信息:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物KL-2(xi)序列描述:SEQ ID NO:12:ATCTCTAGAT GCGAATTCGG ATCCTGCGA                                 29(2)SEQ ID NO:13的信息:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性  (ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:λgt11,反向引物(xi)序列描述:SEQ ID NO:13:GGCAGACATG GCCTGCCCGG                                           20(2)SEQ ID NO:14的信息:(i)序列特征:
(A)长度:9392个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:未知(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:HGV-PNF2161变异体(ix)特性:
(A)名称/关键词:CDS
(B)位置:459..9077(xi)序列描述:SEQ ID NO:14:ACGTGGGGGA GTTGATCCCC CCCCCCCGGC ACTGGGTGCA AGCCCCAGAA ACCGACGCCT    60ATCTAAGTAG ACGCAATGAC TCGGCGCCGA CTCGGCGACC GGCCAAAAGG TGGTGGATGG    120GTGATGACAG GGTTGGTAGG TCGTAAATCC CGGTCACCTT GGTAGCCACT ATAGGTGGGT    180CTTAAGAGAA GGTTAAGATT CCTCTTGTGC CTGCGGCGAG ACCGCGCACG GTCCACAGGT    240GTTGGCCCTA CCGGTGGGAA TAAGGGCCCG ACGTCAGGCT CGTCGTTAAA CCGAGCCCGT    300TACCCACCTG GGCAAACGAC GCCCACGTAC GGTCCACGTC GCCCTTCAAT GTCTCTCTTG    360ACCAATAGGC GTAGCCGGCG AGTTGACAAG GACCAGTGGG GGCCGGGGGC TTGGAGAGGG    420ACTCCAAGTC CCGCCCTTCC CGGTGGGCCG GGAAATGC ATG GGG CCA CCC AGC      473
                                      Met Gly Pro Pro Ser
                                        1               5TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC CTT CGG GTG AGG    521Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile Leu Arg Val Arg
             10                  15                 20GCG GGT GGC ATT TCC TTT TTC TAT ACC ATC ATG GCA GTC CTT CTG CTC    569Ala Gly Gly Ile Ser Phe Phe Tyr Thr Ile Met Ala Val Leu Leu Leu
         25                  30                  35CTT CTC GTG GTT GAG GCC GGG GCC ATT CTG GCC CCG GCC ACC CAC GCT    617Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala Thr His Ala
     40                  45                  50TGT CGA GCG AAT GGG CAA TAT TTC CTC ACA AAT TGT TGT GCC CCG GAG    665Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu
 55                  60                  65GAC ATC GGG TTC TGC CTG GAG GGT GGA TGC CTG GTG GCC CTG GGG TGC    713Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala Leu Gly Cys70                  75                  80                  85ACG ATT TGC ACT GAC CAA TGC TGG CCA CTG TAT CAG GCG GGT TTG GCT    761Thr Ile Cys Thr Asp Gln Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala
             90                  95                 100GTG CGG CCT GGC AAG TCC GCG GCC CAA CTG GTG GGG GAG CTG GGT AGC    809Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val Gly Glu Leu Gly Ser
        105                 110                 115CTA TAC GGG CCC CTG TCG GTC TCG GCC TAT GTG GCT GGG ATC CTG GGC    857Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val Ala Gly Ile Leu Gly
    120                 125                 130CTG GGT GAG GTG TAC TCG GGT GTC CTA ACG GTG GGA GTC GCG TTG ACG    905Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val Gly Val Ala Leu Thr
135                 140                 145CGC CGG GTC TAC CCG GTG CCT AAC CTG ACG TGT GCA GTC GCG TGT GAG    953Arg Arg Val Tyr Pro Val Pro Asn Leu Thr Cys Ala Val Ala Cys Glu150                 155                 160                 165CTA AAG TGG GAA AGT GAG TTT TGG AGA TGG ACT GAA CAG CTG GCC TCC    1001Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser
            170                 175                 180AAC TAC TGG ATT CTG GAA TAC CTC TGG AAG GTC CCA TTT GAT TTC TGG    1049Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val Pro Phe Asp Phe Trp
        185                 190                 195AGA GGC GTG ATA AGC CTG ACC CCC TTG TTG GTT TGC GTG GCC GCA TTG    1097Arg Gly Val Ile Ser Leu Thr Pro Leu Leu Val Cys Val Ala Ala Leu
    200                 205                 210CTG CTG CTT GAG CAA CGG ATT GTC ATG GTC TTC CTG TTG GTG ACG ATG    1145Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe Leu Leu Val Thr Met
215                 220                 225GCC GGG ATG TCG CAA GGC GCC CCT GCC TCC GTT TTG GGG TCA CGC CCC    1193Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val Leu Gly Ser Arg Pro230                 235                 240                 245TTT GAC TAC GGG TTG ACT TGG CAG ACC TGC TCT TGC AGG GCC AAC GGT    1241Phe Asp Tyr Gly Leu Thr Trp Gln Thr Cys Ser Cys Arg Ala Asn Gly
            250                 255                 260TCG CGT TTT TCG ACT GGG GAG AAG GTG TGG GAC CGT GGG AAC GTT ACG    1289Ser Arg Phe Ser Thr Gly Glu Lys Val Trp Asp Arg Gly Asn Val Thr
        265                 270                 275CTT CAG TGT GAC TGC CCT AAC GGC CCC TGG GTG TGG TTG CCA GCC TTT    1337Leu Gln Cys Asp Cys Pro Asn Gly Pro Trp Val Trp Leu Pro Ala Phe
    280                 285                 290TGC CAA GCA ATC GGC TGG GGT GAC CCC ATC ACT TAT TGG AGC CAC GGG    1385Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr Tyr Trp Ser His Gly
295                 300                 305CAA AAT CAG TGG CCC CTT TCA TGC CCC CAG TAT GTC TAT GGG TCT GCT    1433Gln Asn Gln Trp Pro Leu Ser Cys Pro Gln Tyr Val Tyr Gly Ser Ala3l0                 315                 320                 325ACA GTC ACT TGC GTG TGG GGT TCC GCT TCT TGG TTT GCC TCC ACC AGT    1481Thr Val Thr Cys Val Trp Gly Ser Ala Ser Trp Phe Ala Ser Thr Ser
            330                 335                 340GGT CGC GAC TCG AAG ATA GAT GTG TGG AGT TTA GTG CCA GTT GGC TCT    1529Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu Val Pro Val Gly Ser
        345                 350                 355GCC ACC TGC ACC ATA GCC GCA CTT GGA TCA TCG GAT CGC GAC ACG GTG    1577Ala Thr Cys Thr Ile Ala Ala Leu Gly Ser Ser Asp Arg Asp Thr Val
    360                 365                 370CCT GGG CTC TCC GAG TGG GGA ATC CCG TGC GTG ACG TGT GTT CTG GAC    1625Pro Gly Leu Ser Glu Trp Gly Ile Pro Cys Val Thr Cys Val Leu Asp
375                 380                 385CGT CGG CCT GCC TCC TGC GGC ACC TGT GTG AGG GAC TGC TGG CCC GAG    1673Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg Asp Cys Trp Pro Glu390                 395                 400                 405ACC GGG TCG GTT AGG TTC CCA TTC CAT CGG TGC GGC GTG GGG CCT CGG    1721Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys Gly Val Gly Pro Arg
            410                 415                 420CTG ACA AAG GAC TTG GAA GCT GTG CCC TTC GTC AAC AGG ACA ACT CCC    1769Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val Asn Arg Thr Thr Pro
        425                 430                 435TTC ACC ATT AGG GGG CCC CTG GGC AAC CAG GGC CGA GGC AAC CCG GTG    1817Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly Arg Gly Asn Pro Val
    440                 445                 450CGG TCG CCC TTG GGT TTT GGG TCC TAC GCC ATG ACC AGG ATC CGA GAT    1865Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met Thr Arg Ile Arg Asp
455                 460                 465ACC CTA CAT CTG GTG GAG TGT CCC ACA CCA GCC ATT GAG CCT CCC ACC    1913Thr Leu His Leu Val Glu Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr470                 475                 480                 485GGG ACG TTT GGG TTC TTC CCC GGG ACG CCG CCT CTC AAC AAC TGC ATG    1961Gly Thr Phe Gly Phe Phe Pro Gly Thr Pro Pro Leu Asn Asn Cys Met
            490                 495                 500CTC TTG GGC ACG GAA GTG TCC GAG GCA CTT GGG GGG GCT GGC CTC ACG    2009Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr
        505                 510                 515GGG GGG TTC TAT GAA CCC CTG GTG CGC AGG TGT TCG AAG CTG ATG GGA    2057Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Cys Ser Lys Leu Met Gly
    520                 525                 530AGC CGA AAT CCG GTT TGT CCG GGG TTT GCA TGG CTC TCT TCG GGC AGG    2105Ser Arg Asn Pro Val Cys Pro Gly Phe Ala Trp Leu Ser Ser Gly Arg
535                 540                 545CCT GAT GGG TTT ATA CAT GTC CAG GGT CAC TTG CAG GAG GTG GAT GCA    2153Pro Asp Gly Phe Ile His Val Gln Gly His Leu Gln Glu Val Asp Ala550                 555                 560                 565GGC AAC TTC ATC CCG CCC CCG CGC TGG TTG CTC TTG GAC TTT GTA TTT    220lGly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu Leu Asp Phe Val Phe
            570                 575                 580GTC CTG TTA TAC CTG ATG AAG CTG GCT GAG GCA CGG TTG GTC CCG CTG    2249Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala Arg Leu Val Pro Leu
        585                 590                 595ATC TTG CTG CTG CTA TGG TGG TGG GTG AAC CAG CTG GCA GTC CTA GGG    2297Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln Leu Ala Val Leu Gly
    600                 605                 610CTG CCG GCT GTG GAA GCC GCC GTG GCA GGT GAG GTC TTC GCG GGC CCT    2345Leu Pro Ala Val Glu Ala Ala Val Ala Gly Glu Val Phe Ala Gly Pro
615                 620                 625GCC CTG TCC TGG TGT CTG GGA CTC CCG GTC GTC AGT ATG ATA TTG GGT    2393Ala Leu Ser Trp Cys Leu Gly Leu Pro Val Val Ser Met Ile Leu Gly630                 635                 640                 645TTG GCA AAC CTG GTG CTG TAC TTT AGA TGG TTG GGA CCC CAA CGC CTG    244lLeu Ala Asn Leu Val Leu Tyr Phe Arg Trp Leu Gly Pro Gln Arg Leu
            650                 655                 660ATG TTC CTC GTG TTG TGG AAG CTT GCT CGG GGA GCT TTC CCG CTG GCC    2489Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly Ala Phe Pro Leu Ala
        665                 670                 675CTC TTG ATG GGG ATT TCG GCG ACC CGC GGG CGC ACC TCA GTG CTC GGG    2537Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg Thr Ser Val Leu Gly
    680                 685                 690GCC GAG TTC TGC TTC GAT GCT ACA TTC GAG GTG GAC ACT TCG GTG TTG    2585Ala Glu Phe Cys Phe Asp Ala Thr Phe Glu Val Asp Thr Ser Val Leu
695                  700                 705GGC TGG GTG GTG GCC AGT GTG GTA GCT TGG GCC ATT GCG CTC CTG AGC    2633Gly Trp Val Val Ala Ser Val Val Ala Trp Ala Ile Ala Leu Leu Ser710                 715                 720                 725TCG ATG AGC GCA GGG GGG TGG AGG CAC AAA GCC GTG ATC TAT AGG ACG    2681Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala Val Ile Tyr Arg Thr
            730                 735                 740TGG TGT AAG GGG TAC CAG GCA ATC CGT CAA AGG GTG GTG AGG AGC CCC    2729Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg Val Val Arg Ser Pro
        745                 750                 755CTC GGG GAG GGG CGG CCT GCC AAA CCC CTG ACC TTT GCC TGG TGC TTG    2777Leu Gly Glu Gly Arg Pro Ala Lys Pro Leu Thr Phe Ala Trp Cys Leu
    760                 765                 770GCC TCG TAC ATC TGG CCA GAT GCT GTG ATG ATG GTG GTG GTT GCC TTG    2825Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met Val Val Val Ala Leu
775                 780                 785GTC CTT CTC TTT GGC CTG TTC GAC GCG TTG GAT TGG GCC TTG GAG GAG    2873Val Leu Leu Phe Gly Lsu Phe Asp Ala Leu Asp Trp Ala Leu Glu Glu790                 795                 800                 805ATC TTG GTG TCC CGG CCC TCG TTG CGG CGT TTG GCT CGG GTG GTT GAG    292lIle Leu Val Ser Arg Pro Ser Leu Arg Arg Leu Ala Arg Val Val Glu
            810                 815                 820TGC TGT GTG ATG GCG GGT GAG AAG GCC ACA ACC GTC CGG CTG GTC TCC    2969Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr Val Arg Leu Val Ser
        825                 830                 835AAG ATG TGT GCG AGA GGA GCT TAT TTG TTC GAT CAT ATG GGC TCT TTT    3017Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp His Met Gly Ser Phe
    840                 845                 850TCG CGT GCT GTC AAG GAG CGC CTG TTG GAA TGG GAC GCA GCT CTT GAA    3065Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp Asp Ala Ala Leu Glu
855                 860                 865CCT CTG TCA TTC ACT AGG ACG GAC TGT CGC ATC ATA CGG GAT GCC GCG    3113Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile Ile Arg Asp Ala Ala870                 875                 880                 885AGG ACT TTG TCC TGC GGG CAG TGC GTC ATG GGT TTA CCC GTG GTT GCG    3161Arg Thr Leu Ser Cys Gly Gln Cys Val Met Gly Leu Pro Val Val Ala
            890                 895                 900CGC CGT GGT GAT GAG GTT CTC ATC GGC GTC TTC CAG GAT GTG AAT CAT    3209Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His
        905                 910                 915TTG CCT CCC GGG TTT GTT CCG ACC GCG CCT GTT GTC ATC CGA CGG TGC    3257Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val Val Ile Arg Arg Cys
    920                 925                 930GGA AAG GGC TTC TTG GGG GTC ACA AAG GCT GCC TTG ACA GGT CGG GAT    3305Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp
935                 940                 945CCT GAC TTA CAT CCA GGG AAC GTC ATG GTG TTG GGG ACG GCT ACG TCG    3353Pro Asp Leu His Pro Gly Asn Val Met Val Leu Gly Thr Ala Thr Ser950                 955                 960                 965CGA AGC ATG GGA ACA TGC TTG AAC GGC CTG CTG TTC ACG ACC TTC CAT    3401Arg Ser Met Gly Thr Cys Leu Asn Gly Leu Leu Phe Thr Thr Phe His
            970                 975                 980GGG GCT TCA TCC CGA ACC ATC GCC ACA CCC GTG GGG GCC CTT AAT CCC    3449Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val Gly Ala Leu Asn Pro
        985                 990                 995AGA TGG TGG TCA GCC AGT GAT GAT GTC ACG GTG TAT CCA CTC CCG GAT    3497Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val Tyr Pro Leu Pro Asp
1000                1005                1010GGG GCT ACT TCG TTA ACA CCT TGT ACT TGC CAG GCT GAG TCC TGT TGG    3545Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln Ala Glu Ser Cys Trp
1015                1020                1025GTC ATC AGA TCC GAC GGG GCC CTA TGC CAT GGC TTG AGC AAG GGG GAC    3593Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly Leu Ser Lys Gly Asp1030                1035                1040                1045AAG GTG GAG CTG GAT GTG GCC ATG GAG GTC TCT GAC TTC CGT GGC TCG    3641Lys Val Glu Leu Asp Val Ala Met Glu Val Ser Asp Phe Arg Gly Ser
            1050                1055                1060TCT GGC TCA CCG GTC CTA TGT GAC GAA GGG CAC GCA GTA GGA ATG CTC    3689Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His Ala Val Gly Met Leu
        1065                1070                1075GTG TCT GTG CTT CAC TCC GGT GGT AGG GTC ACC GCG GCA CGG TTC ACT    3737Val Ser Val Leu His Ser Gly Gly Arg Val Thr Ala Ala Arg Pne Thr
    1080                1085                1090AGG CCG TGG ACC CAA GTG CCA ACA GAT GCC AAA ACC ACT ACT GAA CCC    3785Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro
1095                1100                1105CCT CCG GTG CCG GCC AAA GGA GTT TTC AAA GAG GCC CCG TTG TTT ATG    3833Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu Ala Pro Leu Phe Met1110                1115                1120                1125CCT ACG GGA GCG GGA AAG AGC ACT CGC GTC CCG TTG GAG TAC GAT AAC    3881Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro Leu Glu Tyr Asp Asn
            1130                1135                1140ATG GGG CAC AAG GTC TTA ATC TTG AAC CCC TCA GTG GCC ACT GTG CGG    3929Met Gly His Lys Val Leu Ile Leu Asn Pro Ser Val Ala Thr Val Arg
        1145                1150                1155GCC ATG GGC CCG TAC ATG GAG CGG CTG GCG GGT AAA CAT CCA AGT ATA    3977Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly Lys His Pro Ser Ile
    1160                1165                1170TAC TGT GGG CAT GAT ACA ACT GCT TTC ACA AGG ATC ACT GAC TCC CCC    4025Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg Ile Thr Asp Ser Pro
1175                1180                1185CTG ACG TAT TCA ACC TAT GGG AGG TTT TTG GCC AAC CCT AGG CAG ATG    4073Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala Asn Pro Arg Gln Met1190                1195                1200                1205CTA CGG GGC GTT TCG GTG GTC ATT TGT GAT GAG TGC CAC AGT CAT GAC    4121Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu Cys His Ser His Asp
            1210                1215                1220TCA ACC GTG CTG TTA GGC ATT GGG AGA GTC CGG GAG CTG GCG CGT GGG    4169Ser Thr Val Leu Leu Gly Ile Gly Arg Val Arg Glu Leu Ala Arg Gly
        1225                1230                1235TGC GGG GTG CAA CTA GTG CTC TAC GCC ACC GCT ACA CCT CCC GGA TCC    4217Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala Thr Pro Pro Gly Ser
    1240                1245                1250CCT ATG ACG CAG CAC CCT TCC ATA ATT GAG ACA AAA TTG GAC GTG GGC    4265Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr Lys Leu Asp Val Gly
1255                1260                1265GAG ATT CCC TTT TAT GGG CAT GGA ATA CCC CTC GAG CGG ATG CGA ACC    4313Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu Glu Arg Met Arg Thr1270                1275                1280                1285GGA AGG CAC CTC GTG TTC TGC CAT TCT AAG GCT GAG TGC GAG CGC CTT    4361Gly Arg His Leu Val Phe Cys His Ser Lys Ala Glu Cys Glu Arg Leu
            1290                1295                1300GCT GGC CAG TTC TCC GCT AGG GGG GTC AAT GCC ATT GCC TAT TAT AGG    4409Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala Ile Ala Tyr Tyr Arg
        1305                1310                1315GGT AAA GAC AGT TCT ATC ATC AAG GAT GGG GAC CTG GTG GTC TGT GCT    4457Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp Leu Val Val Cys Ala
    1320                1325                1330ACA GAC GCG CTT TCC ACT GGG TAC ACT GGA AAT TTC GAC TCC GTC ACC    4505Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn Phe Asp Ser Val Thr
1335                1340                1345GAC TGT GGA TTA GTG GTG GAG GAG GTC GTT GAG GTG ACC CTT GAT CCC    4553Asp Cys Gly Leu Val Val Glu Glu Val Val Glu Val Thr Leu Asp Pro1350                1355                1360                1365ACC ATT ACC ATC TCC CTG CGG ACA GTG CCT GCG TCG GCT GAA CTG TCG    4601Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala Ser Ala Glu Leu Ser
           1370                1375                1380ATG CAA AGA CGA GGA CGC ACG GGT AGG GGC AGG TCT GGA CGC TAC TAC    4649Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Ser Gly Arg Tyr Tyr
        1385                1390                1395TAC GCG GGG GTG GGC AAA GCC CCT GCG GGT GTG GTG CGC TCA GGT CCT    4697Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val Val Arg Ser Gly Pro
    1400                1405                1410GTC TGG TCG GCG GTG GAA GCT GGA GTG ACC TGG TAC GGA ATG GAA CCT    4745Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp Tyr Gly Met Glu Pro
1415                1420                1425GAC TTG ACA GCT AAC CTA CTG AGA CTT TAC GAC GAC TGC CCT TAC ACC    4793Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp Asp Cys Pro Tyr Thr1430                1435                1440                1445GCA GCC GTC GCG GCT GAT ATC GGA GAA GCC GCG GTG TTC TTC TCT GGG    4841Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala Val Phe Phe Ser Gly
            1450                1455                1460CTC GCC CCA TTG AGG ATG CAC CCT GAT GTC AGC TGG GCA AAA GTT CGC    4889Leu Ala Pro Leu Arg Met His Pro Asp Val Ser Trp Ala Lys Val Arg
        1465                1470                1475GGC GTC AAC TGG CCC CTC TTG GTG GGT GTT CAG CGG ACC ATG TGT CGG    4937Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln Arg Thr Met Cys Arg
    1480                1485                1490GAA ACA CTG TCT CCC GGC CCA TCG GAT GAC CCC CAA TGG GCA GGT CTG    4985Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro Gln Trp Ala Gly Leu
1495                1500                1505AAG GGC CCA AAT CCT GTC CCA CTC CTG CTG AGG TGG GGC AAT GAT TTA    5033Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg Trp Gly Asn Asp Leu1510                1515                1520                1525CCA TCT AAA GTG GCC GGC CAC CAC ATA GTG GAC GAC CTG GTC CGG AGA    5081Pro Ser Lys Val Ala Gly His His Ile Val Asp Asp Leu Val Arg Arg
            1530                1535                1540CTC GGT GTG GCG GAG GGT TAC GTC CGC TGC GAC GCT GGG CCG ATC TTG    5129Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp Ala Gly Pro Ile Leu
        1545                1550                1555ATG ATC GGT CTA GCT ATC GCG GGG GGA ATG ATC TAC GCG TCA TAC ACC    5177Met Ile Gly Leu Ala Ile Ala Gly Gly Met Ile Tyr Ala Ser Tyr Thr
    1560                1565                1570GGG TCG CTA GTG GTG GTG ACA GAC TGG GAT GTG AAG GGG GGT GGC GCC    5225Gly Ser Leu Val Val Val Thr Asp Trp Asp Val Lys Gly Gly Gly Ala
1575                1580                1585CCC CTT TAT CGG CAT GGA GAC CAG GCC ACG CCT CAG CCG GTG GTG CAG    5273Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro Gln Pro Val Val Gln1590                1595                1600                1605GTT CCT CCG GTA GAC CAT CGG CCG GGG GGT GAA TCA GCA CCA TCG GAT    5321Val Pro Pro Val Asp His Arg Pro Gly Gly Glu Ser Ala Pro Ser Asp
            1610                1615                1620GCC AAG ACA GTG ACA GAT GCG GTG GCA GCC ATC CAG GTG GAC TGC GAT    5369Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile Gln Val Asp Cys Asp
        1625                1630                1635TGG ACT ATC ATG ACT CTG TCG ATC GGA GAA GTG TTG TCC TTG GCT CAG    5417Trp Thr Ile Met Thr Leu Ser Ile Gly Glu Val Leu Ser Leu Ala Gln
    1640                1645                1650GCT AAG ACG GCC GAG GCC TAC ACA GCA ACC GCC AAG TGG CTC GCT GGC    5465Ala Lys Thr Ala Glu Ala Tyr Thr Ala Thr Ala Lys Trp Leu Ala Gly
1655                1660                1665TGC TAT ACG GGG ACG CGG GCC GTT CCC ACT GTA TCC ATT GTT GAC AAG    5513Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val Ser Ile Val Asp Lys1670                1675                1680                1685CTC TTC GCC GGA GGG TGG GCG GCT GTG GTG GGC CAT TGC CAC AGC GTG    5561Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly His Cys His Ser Val
            1690                1695                1700ATT GCT GCG GCG GTG GCG GCC TAC GGG GCT TCA AGG AGC CCG CCG TTG    5609Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser Arg Ser Pro Pro Leu
        1705                1710                1715GCA GCC GCG GCT TCC TAC CTG ATG GGG TTG GGC GTT GGA GGC AAC GCT    5657Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly Val Gly Gly Asn Ala
    1720                1725                1730CAG ACG CGC CTG GCG TCT GCC CTC CTA TTG GGG GCT GCT GGA ACC GCC    5705Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly Ala Ala Gly Thr Ala
1735                1740                1745TTG GGC ACT CCT GTC GTG GGC TTG ACC ATG GCA GGT GCG TTC ATG GGG    5753Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala Gly Ala Phe Met Gly1750                1755                1760                1765GGG GCC AGT GTC TCC CCC TCC TTG GTC ACC ATT TTA TTG GGG GCC GTC    5801Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile Leu Leu Gly Ala Val
            1770                1775                1780GGA GGT TGG GAG GGT GTT GTC AAC GCG GCG AGC CTA GTC TTT GAC TTC    5849Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser Leu Val Phe Asp Phe
        1785                1790                1795ATG GCG GGG AAA CTT TCA TCA GAA GAT CTG TGG TAT GCC ATC CCG GTA    5897Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp Tyr Ala Ile Pro Val
    1800                1805                1810CTG ACC AGC CCG GGG GCG GGC CTT GCG GGG ATC GCT CTC GGG TTG GTT    5945Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile Ala Leu Gly Leu Val
1815                1820                1825TTG TAT TCA GCT AAC AAC TCT GGC ACT ACC ACT TGG TTG AAC CGT CTG    5993Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr Trp Leu Asn Arg Leu1830                1835                1840                1845CTG ACT ACG TTA CCA AGG TCT TCA TGT ATC CCG GAC AGT TAC TTT CAG    6041Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro Asp Ser Tyr Phe Gln
            1850                1855                1860CAA GTT GAC TAT TGC GAC AAG GTC TCA GCC GTG CTC CGG CGC CTG AGC    6089Gln Val Asp Tyr Cys Asp Lys Val Ser Ala Val Leu Arg Arg Leu Ser
        1865                1870                1875CTC ACC CGC ACA GTG GTT GCC CTG GTC AAC AGG GAG CCT AAG GTG GAT    6137Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg Glu Pro Lys Val Asp
    1880                1885                1890GAG GTA CAG GTG GGG TAT GTC TGG GAC CTG TGG GAG TGG ATC ATG CGC    6185Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp Glu Trp Ile Met Arg
1895                1900                1905CAA GTG CGC GTG GTC ATG GCC AGA CTC AGG GCC CTC TGC CCC GTG GTG    6233Gln Val Arg Val Val Met Ala Arg Leu Arg Ala Leu Cys Pro Val Val1910                1915                1920                1925TCA CTA CCC TTG TGG CAT TGC GGG GAG GGG TGG TCC GGG GAA TGG TTG    6281Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp Ser Gly Glu Trp Leu
            1930                1935                1940CTT GAC GGT CAT GTT GAG AGT CGC TGC CTC TGT GGC TGC GTG ATC ACT    6329Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys Gly Cys Val Ile Thr
        1945                1950                1955GGT GAC GTT CTG AAT GGG CAA CTC AAA GAA CCA GTT TAC TCT ACC AAG    6377Gly Asp Val Leu Asn Gly Gln Leu Lys Glu Pro Val Tyr Ser Thr Lys
    1960                1965                1970CTG TGC CGG CAC TAT TGG ATG GGG ACT GTC CCT GTG AAC ATG CTG GGT    6425Leu Cys Arg His Tyr Trp Met Gly Thr Val Pro Val Asn Met Leu Gly
1975                1980                1985TAC GGT GAA ACG TCG CCT CTC CTG GCC TCC GAC ACC CCG AAG GTT GTG    6473Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp Thr Pro Lys Val Val1990                1995                2000                2005CCC TTC GGG ACG TCT GGC TGG GCT GAG GTG GTG GTG ACC ACT ACC CAC    6521Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val Val Thr Thr Thr His
            2010                2015                2020GTG GTA ATC AGG AGG ACC TCC GCC TAT AAG CTG CTG CGC CAG CAA ATC    6569Val Val Ile Arg Arg Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile
        2025                2030                2035CTA TCG GCT GCT GTA GCT GAG CCC TAC TAC GTC GAC GGC ATT CCG GTC    6617Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val
    2040                2045                2050TCA TGG GAC GCG GAC GCT CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG    6665Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly
2055                2060                2065CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG    6713Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu2070                2075                2080                2085AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT    6761Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile
            2090                2095                2100GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG    6809Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu
        2105                2110                2115CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT    6857Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile
    2120                2125                2130CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT    6905Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser
2135                2140                2145CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC    6953Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro2150                2155                2160                2165CGT ACT CCA TCG CCA GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT    7001Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp
            2170                2175                2180GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT    7049Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser
        2185                2190                2195GAC TCA TTC GAG GTC ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA    7097Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu
    2200                2205                2210AGT GTC TTC AAC GTG GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG    7145Ser Val Phe Asn Val Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln
2215                2220                2225AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA    7193Ser Asp Ala Thr Arg Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu2230                2235                2240                2245AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG TTG ACG GTG GCT GAT GTT    7241Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val
            2250                2255                2260GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC    7289Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp
        2265               2270                2275CAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT    7337Gln Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn
    2280                2285                2290GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG    7385Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Lau
2295                2300                2305GCC TCC TTC TCT TAC ATT TGG TCT GGA GTG CCG CTG ACT AGG GCC ACG    7433Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr2310                2315                2320                2325CCG GCC AAG CCT CCC GTG GTG AGG CCG GTT GGC TCT TTG TTA GTG GCC    7481Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly Ser Leu Leu Val Ala
            2330                2335                2340GAC ACT ACT AAG GTG TAT GTT ACC AAT CCA GAC AAT GTG GGA CGG AGG    7529Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg
        2345                2350v               2355GTG GAC AAG GTG ACC TTC TGG CGT GCT CCT AGG GTT CAT GAT AAG TAC    7577Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg Val His Asp Lys Tyr
    2360                2365                2370CTC GTG GAC TCT ATT GAG CGC GCT AAG AGG GCC GCT CAA GCC TGC CTA    7625Leu Val Asp Ser Ile Glu Arg Ala Lys Arg Ala Ala Gln Ala Cys Leu
2375                2380                2385AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA AGG ACT GTA AGG CCA CAT    7673Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg Thr Val Arg pro His2390                2395                2400                2405GCT GCC ATG GGC TGG GGA TCT AAG GTG TCG GTT AAG GAC TTA GCC ACC    7721Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val Lys Asp Leu Ala Thr
            2410                2415                2420CCC GCG GGG AAG ATG GCC GTC CAT GAC CGG CTT CAG GAG ATA CTT GAA    7769Pro Ala Gly Lys Met Ala Val His Asp Arg Leu Gln Glu Ile Leu Glu
        2425                2430                2435GGG ACT CCG GTC CCC TTT ACT CTT ACT GTG AAA AAG GAG GTG TTC TTC    7817Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys Lys Glu Val Phe Phe
    2440                2445                2450AAA GAC CGG AAG GAG GAG AAG GCC CCC CGC CTC ATT GTG TTC CCC CCC    7865Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu Ile Val Phe Pro Pro
2455                2460                2465CTG GAC TTC CGG ATA GCT GAA AAG CTC ATC TTG GGA GAC CCA GGC CGG    7913Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu Gly Asp Pro Gly Arg2470                2475                2480                2485GTA GCC AAG GCG GTG TTG GGG GGG GCC TAC GCC TTC CAG TAC ACC CCA    7961Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala Phe Gln Tyr Thr Pro
            2490                2495                2500AAT CAG CGA GTT AAG GAG ATG CTC AAG CTA TGG GAG TCT AAG AAG ACC    8009Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp Glu Ser Lys Lys Thr
        2505                2510                2515CCT TGC GCC ATC TGT GTG GAC GCC ACC TGC TTC GAC AGT AGC ATA ACT    8057Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe Asp Ser Ser Ile Thr
    2520                2525                2530GAA GAG GAC GTG GCT TTG GAG ACA GAG CTA TAC GCT CTG GCC TCT GAC    8105Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr Ala Leu Ala Ser Asp
2535                2540                2545CAT CCA GAA TGG GTG CGG GCA CTT GGG AAA TAC TAT GCC TCA GGC ACC    8153His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr Tyr Ala Ser Gly Thr2550                2555                2560                2565ATG GTC ACC CCG GAA GGG GTG CCC GTC GGT GAG AGG TAT TGC AGA TCC    8201Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg Ser
            2570                2575                2580TCG GGT GTC CTA ACA ACT AGC GCG AGC AAC TGC TTG ACC TGC TAC ATC    8249Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile
        2585                2590                2595AAG GTG AAA GCT GCC TGT GAG AGA GTG GGG CTG AAA AAT GTC TCT CTT    8297Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser Leu
    2600                2605                2610CTC ATA GCC GGC GAT GAC TGC TTG ATC ATA TGT GAG CGG CCA GTG TGC    8345Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val Cys
2615                2620                2625GAC CCA AGC GAC GCT TTG GGC AGA GCC CTA GCG AGC TAT GGG TAC GCG    8393Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala2630                2635                2640                2645TGC GAG CCC TCA TAT CAT GCA TCA TTG GAC ACG GCC CCC TTC TGC TCC    8441Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr Ala Pro Phe Cys Ser
            2650                2655                2660ACT TGG CTT GCT GAG TGC AAT GCA GAT GGG AAG CGC CAT TTC TTC CTG    8489Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys Arg His Phe Phe Leu
        2665                2670                2675ACC ACG GAC TTC CGG AGG CCG CTC GCT CGC ATG TCG AGT GAG TAT AGT    8537Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met Ser Ser Glu Tyr Ser
    2680                2685                2690GAC CCG ATG GCT TCG GCG ATC GGT TAC ATC CTC CTT TAT CCT TGG CAC    8585Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu Leu Tyr Pro Trp His
2695                2700                    2705CCC ATC ACA CGG TGG GTC ATC ATC CCT CAT GTG CTA ACG TGC GCA TTC    8633Pro Ile Thr Arg Trp Val Ile Ile Pro His Val Leu Thr Cys Ala Phe2710                2715                2720                2725AGG GGT GGA GGC ACA CCG TCT GAT CCG GTT TGG TGC CAG GTG CAT GGT    8681Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp Cys Gln Val His Gly
            2730                2735                2740AAC TAC TAC AAG TTT CCA CTG GAC AAA CTG CCT AAC ATC ATC GTG GCC    8729Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro Asn Ile Ile Val Ala
        2745                2750                2755CTC CAC GGA CCA GCA GCG TTG AGG GTT ACC GCA GAC ACA ACT AAA ACA    8777Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala Asp Thr Thr Lys Thr
    2760                2765                2770AAG ATG GAG GCT GGT AAG GTT CTG AGC GAC CTC AAG CTC CCT GGC TTA    8825Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu Lys Leu Pro Gly Leu
2775                2780                2785GCA GTC CAC CGA AAG AAG GCC GGG GCG TTG CGA ACA CGC ATG CTC CGC    8873Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg Thr Arg Met Leu Arg2790                2795                2800                2805TCG CGC GGT TGG GCT GAG TTG GCT AGG GGC TTG TTG TGG CAT CCA GGC    8921Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu Leu Trp His Pro Gly
            2810                2815                2820CTA CGG CTT CCT CCC CCT GAG ATT GCT GGT ATC CCG GGG GGT TTC CCT    8969Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile Pro Gly Gly Phe Pro
        2825                2830                2835
CTC TCC CCC CCC TAT ATG GGG GTG GTA CAT CAA TTG GAT TTC ACA AGC    9017
Leu Ser Pro Pro Tyr Met Gly Val Val His Gln Leu Asp Phe Thr Ser
        2840                2845                2850
CAG AGG AGT CGC TGG CGG TGG TTG GGG TTC TTA GCC CTG CTC ATC GTA    9065
Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu Ala Leu Leu Ile Val
    2855                2860                2865
GCC CTC TTC GGG TGAACTAAAT TCATCTGTTG CGGCAAGGTC TGGTGACTGA        9117
Ala Leu Phe Gly
2870
TCATCACCGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG TCTCCCCGCT GGGTAAAAAG  9177
GGCCCGGCCT TGGGAGGCAT GGTGGTTACT AACCCCCTGG CAGGGTCAAA GCCTGATGGT  9237
GCTAATGCAC TGCCACTTCG GTGGCGGGTC GCTACCTTAT AGCGTAATCC GTGACTACGG  9297
GCTGCTCGCA GAGCCCTCCC CGGATGGGGC ACAGTGCACT GTGATCTGAA GGGGTGCACC  9357
CCGGGAAGAG CTCGGCCCGA AGGCCGGSTT CTACT                             9392(2)SEQ ID NO:15的信息:(i)序列特征:
(A)长度:2873个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:15:Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg1               5                  10                  15Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Phe Phe Tyr Thr Ile Met
         20                  25                  30Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala
     35                  40                  45Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn
 50                  55                  60Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu65                 70                  75                  80Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Gln Cys Trp Pro Leu Tyr
             85                  90                  95Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val
        100                 105                 110Gly Glu Leu Gly Ser Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val
    115                 120                 125Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val
130                 135                 140Gly Val Ala Leu Thr Arg Arg Val Tyr Pro Val Pro Asn Leu Thr Cys145                 150                 155                 160Ala Val Ala Cys Glu Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr
            165                 170                 175Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val
        180                 185                 190Pro Phe Asp Phe Trp Arg Gly Val Ile Ser Leu Thr Pro Leu Leu Val
    195                 200                 205Cys Val Ala Ala Leu Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe
210                 215                 220Leu Leu Val Thr Met Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val225                 230                 235                 240Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr Trp Gln Thr Cys Ser
            245                 250                 255Cys Arg Ala Asn Gly Ser Arg Phe Ser Thr Gly Glu Lys Val Trp Asp
        260                 265                 270Arg Gly Asn Val Thr Leu Gln Cys Asp Cys Pro Asn Gly Pro Trp Val
    275                 280                 285Trp Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr
290                 295                 300Tyr Trp Ser His Gly Gln Asn Gln Trp Pro Leu Ser Cys Pro Gln Tyr305                 310                 315                 320Val Tyr Gly Ser Ala Thr Val Thr Cys Val Trp Gly Ser Ala Ser Trp
            325                 330                 335Phe Ala Ser Thr Ser Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu
        340                 345                 350Val Pro Val Gly Ser Ala Thr Cys Thr Ile Ala Ala Leu Gly Ser Ser
    355                 360                 365Asp Arg Asp Thr Val Pro Gly Leu Ser Glu Trp Gly Ile Pro Cys Val
370                 375                 380Thr Cys Val Leu Asp Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg385                 390                 395                 400Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys
            405                 410                 415Gly Val  Gly Pro Arg Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val
         420                 425                 430Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly
    435                 440                 445Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met
450                 455                 460Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys Pro Thr Pro Ala465                 470                 475                 480Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe Pro Gly Thr Pro Pro
            485                 490                 495Leu Asn Asn Cys Met Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly
        500                 505                 5l0Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Cys
    515                 520                 525Ser Lys Leu Met Gly Ser Arg Asn Pro Val Cys Pro Gly Phe Ala Trp
530                 535                 540Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His Val Gln Gly His Leu545                 550                 555                 560Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu
            565                 570                 575Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala
        580                 585                 590Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln
    595                 600                 605Leu Ala Val Leu Gly Leu Pro Ala Val Glu Ala Ala Val Ala Gly Glu
610                 615                 620Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu Gly Leu Pro Val Val625                 630                 635                 640Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu Tyr Phe Arg Trp Leu
            645                 650                 655Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly
        660                 665                 670Ala Phe Pro Leu Ala Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg
    675                 680                 685Thr Ser Val Leu Gly Ala Glu Phe Cys Phe Asp Ala Thr Phe Glu Val
690                 695                 700Asp Thr Ser Val Leu Gly Trp Val Val Ala Ser Val Val Ala Trp Ala705                 710                 715                 720Ile Ala Leu Leu Ser Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala
            725                 730                 735Val Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg
        740                 745                 750Val Val Arg Ser Pro Leu Gly Glu Gly Arg Pro Ala Lys Pro Leu Thr
    755                 760                 765Phe Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met
770                 775                 780Val Val Val Ala Leu Val Leu Leu Phe Gly Leu Phe Asp Ala Leu Asp785                 790                 795                 800Trp Ala Leu Glu Glu Ile Leu Val Ser Arg Pro Ser Leu Arg Arg Leu
            805                 8l0                 815Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr
        820                 825                 830Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp
    835                 840                 845His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp
850                 855                 860Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile865                 870                 875                 880Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met Gly
            885                 890                 895Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe
        900                 905                 910Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val
    915                 920                 925Val Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala
930                 935                 940Leu Thr Gly Arg Asp Pro Asp Leu His Pro Gly Asn Val Met Val Leu945                 950                 955                 960Gly Thr Ala Thr Ser Arg Ser Met Gly Thr Cys Leu Asr Gly Leu Leu
            965                 970                 975Phe Thr Thr Phe His Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val
        980                 985                 990Gly Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val
    995                 1000                1005Tyr Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln
1010                1015                1020Ala Glu Ser Cys Trp Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly1025                1030                1035                1040Leu Ser Lys Gly Asp Lys Val Glu Leu Asp Val Ala Met Glu Val Ser
            1045                1050                1055Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His
        1060                1065                1070Ala Val Gly Met Leu Val Ser Val Leu His Ser Gly Gly Arg Val Thr
    1075                1080                1085Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys
1090                1095                1100Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu1105                1110                1115                1120Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro
            1125                1130                 1135Leu Glu Tyr Asp Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser
        1140                1145                1150Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly
    1155                1160                1165Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg
1170                1175                1180Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala1185                1190                1195                1200Asn Pro Arg Gln Met Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu
            1205                1210                1215Cys His Ser His Asp Ser Thr Val Lau Leu Gly Ile Gly Arg Val Arg
        1220                1225                1230Glu Leu Ala Arg Gly Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala
    1235                1240                1245Thr Pro Pro Gly Ser Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr
1250                1255                1260Lys Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu1265                1270                1275                1280Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser Lys Ala
            1285                1290                1295Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala
        1300                1305                1310Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp
    1315               1320                 1325Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn
1330                1335                1340Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val Val Glu1345                1350                1355                1360Val Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala
            1365                1370                1375Ser Ala Glu Leu Ser Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg
       1380                1385                1390Ser Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val
    1395                1400                1405Val Arg Ser Gly Pro Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp
1410                1415                1420Tyr Gly Met Glu Pro Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp1425                1430                1435                1440Asp Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala
            1445                1450                1455Val Phe Phe Ser Gly Leu Ala Pro Leu Arg Met His Pro Asp Val Ser
        1460                1465                1470Trp Ala Lys Val Arg Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln
    1475                1480                1485Arg Thr Met Cys Arg Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro
1490                1495                1500Gln Trp Ala Gly Leu Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg1505                1510                1515                1520Trp Gly Asn Asp Leu Pro Ser Lys Val Ala Gly His His Ile Val Asp
            1525                1530                1535Asp Leu Val Arg Arg Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp
        1540                1545                1550Ala Gly Pro Ile Leu Met Ile Gly Leu Ala Ile Ala Gly Gly Met Ile
    1555                1560                1565Tyr Ala Ser Tyr Thr Gly Ser Leu Val Val Val Thr Asp Trp Asp Val
1570                1575                1580Lys Gly Gly Gly Ala Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro1585                1590                1595                1600Gln Pro Val Val Gln Val Pro Pro Val Asp His Arg Pro Gly Gly Glu
            1605                1610                1615Ser Ala Pro Ser Asp Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile
        1620                1625                1630Gln Val Asp Cys Asp Trp Thr Ile Met Thr Leu Ser Ile Gly Glu Val
    1635                1640                1645Leu Ser Leu Ala Gln Ala Lys Thr Ala Glu Ala Tyr Thr Ala Thr Ala
1650                1655                1660Lys Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val1665                1670                1675                1680Ser Ile Val Asp Lys Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly
            1685                1690                1695His Cys His Ser Val Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser
        1700                1705                1710Arg Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly
    1715                1720                1725Val Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly
1730                1735                1740Ala Ala Gly Thr Ala Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala1745                1750                1755                1760Gly Ala Phe Met Gly Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile
            1765                1770                1775Leu Leu Gly Ala Val Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser
        1780                1785                1790Leu Val Phe Asp Phe Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp
    1795                1800                1805Tyr Ala Ile Pro Val Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile
1810                1815                1820Ala Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr1825                1830                1835                1840Trp Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro
            1845                1850                1855Asp Ser Tyr Phe Gln Gln Val Asp Tyr Cys Asp Lys Val Ser Ala Val
        1860                1865                1870Leu Arg Arg Leu Ser Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg
    1875                1880                1885Glu Pro Lys Val Asp Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp
1890                1895                1900Glu Trp Ile Met Arg Gln Val Arg Val Val Met Ala Arg Leu Arg Ala1905                1910                1915                1920Leu Cys Pro Val Val Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp
            1925                1930                1935Ser Gly Glu Trp Leu Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys
        1940                1945                1950Gly Cys Val Ile Thr Gly Asp Val Leu Asn Gly Gln Leu Lys Glu Pro
    1955                1960                1965Val Tyr Ser Thr Lys Ieu Cys Arg His Tyr Trp Met Gly Thr Val Pro
1970                1975                1980Val Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp1985                1990                1995                2000Thr Pro Lys Val Val Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val
            2005                2010                2015Val Thr Thr Thr His Val Val Ile Arg Arg Thr Ser Ala Tyr Lys Leu
        2020                2025                2030Leu Arg Gln Gln Ile Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val
    2035                2040                2045Asp Gly Ile Pro Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met
2050                2055                2060Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr2065                2070                2075                2080Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser
            2085                2090                2095Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu
        2100                2105                2110Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu
    2115                2120                2125Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp
2130                2135                2140Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp2145                2150                2155                2160Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr
            2165                2170                2175Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu
        2180                2185                2190Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr
    2195                2200                2205Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu Lys
2210                2215                2220Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys Met2225                2230                2235                2240Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu
            2245                2250                2255Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His
        2260                2265                2270Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val Gly
    2275                2280                2285Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala
2290                2295                2300Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro2305                2310                2315                2320Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly
            2325                2330                2335Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp
        2340                2345                2350Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg
    2355                2360                2365Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg Ala
2370                2375                2380Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg2385                2390                2395                2400Thr Val Arg Pro His Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val
            2405                2410                2415Lys Asp Leu Ala Thr Pro Ala Gly Lys Met Ala Val His Asp Arg Leu
        2420                2425                2430Gln Glu Ile Leu Glu Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys
    2435                2440                2445Lys Glu Val Phe Phe Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu
2450                2455                2460Ile Val Phe Pro Pro Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu2465                2470                2475                2480Gly Asp Pro Gly Arg Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala
            2485                2490                2495Phe Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp
        2500                2505                2510Glu Ser Lys Lys Thr Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe
    2515                2520                2525Asp Ser Ser Ile Thr Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr
2530                2535                2540Ala Leu Ala Ser Asp His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr2545                2550                2555                2560Tyr Ala Ser Gly Thr Met Val Thr Pro Glu Gly Val Pro Val Gly Glu
            2565                2570                2575Arg Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys
        2580                2585                2590Leu Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu
    2595                2600                2605Lys Asn Val Ser Leu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys
2610                2615                2620Glu Arg Pro Val Cys Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala2625                2630                2535                2640Ser Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr
            2645                2650                2655Ala Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys
        2660                2665                2670Arg His Phe Phe Leu Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met
    2675                2680                2685Ser Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu
2690                2695                2700
Leu Tyr Pro Trp His Pro Ile Thr Arg Trp Val Ile Ile Pro His Val
2705                2710                2715                2720
Leu Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp
                2725                2730                2735
Cys Gin Val His Gly Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro
            2740                2745                2750
Asn Ile Ile Val Ala Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala
        2755                2760                2765
Asp Thr Thr Lys Thr Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu
    2770                2775                2780
Lys Leu Pro Gly Leu Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg
2785                2790                2795                2800
Thr Arg Met Leu Arg Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu
                2805                2810                2815
Leu Trp His Pro Gly Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile
           2820                 2825                2830
Pro Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met Gly Val Val His Gln
        2835                2840                2845
Leu Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu
    2850                2855                2860
Ala Leu Leu Ile Val Ala Leu Phe Gly
2865                2870(2)SEQ ID NO:16的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:探针470-20-1-152F(xi)序列描述:SEQ ID NO:16:TCGGTTACTG AGAGCAGCTC AGATGAG                                   27(2)SEQ ID NO:17的信息:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:JML-A,引物(xi)序列描述:SEQ ID NO:17:AGGAATTCAG CGGCCGCGAG                                           20(2)SEQ ID NO:18的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(vi)原始来源:
(C)各分离株:JML-B,引物(xi)序列描述:SEQ ID NO:18:CTCGCGGCCG CTGAATTCCT TT                                         22(2)SEQ ID NO:19的信息:(i)序列特征:
(A)长度:203个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性(ii)分子类型:  cDNA(iii)假设:无(vi)原始来源:
(C)各分离株:470-20-1克隆,WITHOUT SISPA
接头(ix)特性:
(A)名称/关键词:CDS
(B)位置:2..203(xi)序列描述:SEQ ID NO:19:G GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG        46Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly
1               5                  10                  15GTA TCC TCC TGC GAG GAG GAC ACC GGC GGG GTC TTC TCA TCT GAG CTG    94Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val Pne Ser Ser Glu Leu
               20                  25                  30CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG TCT    142Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser
           35                 40                  45TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA CAA AGA GAG GGT GTA    190Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val
       50                  55                  60CTG CAG TCC TCC A                                                  203Leu Gln Ser Ser
  65(2)SEQ ID NO:20的信息:(i)序列特征:
(A)长度:67个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:20:Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val1                5                  10                  15Ser Ser Cys Glu Glu Asp Thr Gly Gly Val Phe Ser Ser Glu Leu Leu
         20                  25                  30Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser Ser
     35                  40                  45Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val Leu
 50                  55                  60Gln Ser Ser65(2)SEQ ID NO:21的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470-20-1-152R(xi)序列描述:SEQ ID NO:21:CTCATCTGAG CTGCTCTCAG TAACCGA                                 27(2)SEQ ID NO:22的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:寡核苷酸B(xi)序列描述:SEQ ID NO:22:CTGTCTCGGA CTCTTGGATG ACCT                                          24(2)SEQ ID NO:23的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:同源寡核苷酸211R’(xi)序列描述:SEQ ID NO:23:ATACCCCGTC CTCTGACTCA TTCG                                        24(2)SEQ ID NO:24的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:  DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:同源寡核苷酸B’(xi)序列描述:SEQ ID NO:24:AGGTCATCCA AGAGTCCGAG ACAG                                         24(2)SEQ ID NO:25的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:λGT11正向引物,20mer(xi)序列描述:SEQ ID NO:25:CACATGGCTG AATATCGACG                                              20(2)SEQ ID NO:26的信息:(i)序列特征:
(A)长度:180个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性  (ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列4E3(xi)序列描述:SEQ ID NO:26:GCGAGCCTAG TCTTTGACTT CATGGCGGGG AAACTTTCAT CAGAAGATCT GTGGTATGCC    60ATCCCGGTAC TGACCAGCCC GGGGGCGGGC CTTGCGGGGA TCGCTCTCGG GTTGGTTTTG    120TATTCAGCTA ACAACTCTGG CACTACCACT TGGTTGAACC GTCTGCTGAC TACGTTACCA    180(2)SEQ ID NO:27的信息:(i)序列特征:
(A)长度:430个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列3E3(xi)序列描述:SEQ ID NO:27:GGCACTACCA CTTGGTTGAA CCGTCTGCTG ACTACGTTAC CAAGGTCTTC ATGTATCCCG    60GACAGTTACT TTCAGCAAGT TGACTATTGC GACAAGGTCT CAGCCGTGCT CCGGCGCCTG    120AGCCTCACCC CCACAGTGGT TGCCCTGGTC AACAGGGAGC CTAAGGTGGA TGAGGTACAG    180GTGGGGTATG TCTGGGACCT GTGGGAGTGG ATCATGCGCC AAGTGCGCGT GGTCATGGCC    240AGACTCAGGG CCCTCTGCCC CGTGGTGTCA CTACCCTTGT GGCATTGCGG GGAGGGGTGG    300TCCGGGGAAT GGTTGCTTGA CGGTCATGTT GAGAGTCGCT GCCTCTGTGG CTGCGTGATC    360ACTGGTGACG TTCTGAATGG GCAACTCAAA GAACCAGTTT ACTCTACCAA GCTGTGCCGG    420CACTATTGGA                                                           430(2)SEQ ID NO:28的信息:(i)序列特征:
(A)长度:180个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列2E5(xi)序列描述:SEQ ID NO:28:CTTACCGTCA AGATGTCGTG CTGCGTTGAA AAGAGCGTCA CGCGCTTTTT CTCATTGGGG    60TTGACGGTGG CTGATGTTGC TAGCCTGTGT GAGATGGAAA TCCAGAACCA TACAGCCTAT    120TGTGACCAGG TGCGCACTCC GCTTGAATTG CAGGTTGGGT GCTTGGTGGG CAATGAACTT    180(2)SEQ ID NO:29的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列1E5  (xi)序列描述:SEQ ID NO:29:CTTCTCTTTG TGGTAGTAGC CGAGAGATGC CTGTATGGGG AGAAGACATC CCCCGTACTC    60CATCGCCAGC ACTTATCTCG GTTACTGAGA GCAGCTCAGA TGAGAAGACC CCGTCGGTGT    120CCTCCTCGCA GGAGGATACC CCGTCCTCTG ACTCATTCGA GGTCATCCAA GAGTCCGAGA    180CAGCCGAAGG GGAGGAAAGT GTCTTCAACG TGGCTCTTTC CGTATTAAAA GCCTTATTTC    240CACAGAGCGA CGCGACCAGG AAGCTTACCG TCAAGATGTC GTGCTGCGTT GAAAAGAGCG    30CTCACGCGCTT TTTCTCATTG GGGTTGACGG TGGCTGATGT TGCT                     344(2)SEQ ID NO:30的信息:(i)序列特征:
(A)长度:423个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列4E5(xi)序列描述:SEQ ID NO:30:GTAAGGCCAC ATGCTGCCAT GGGCTGGGGA TCTAAGGTGT CGGTTAAGGA CTTAGCCACC    60CCCGCGGGGA AGATGGCCGT CCATGACCGG CTTCAGGAGA TACTTGAAGG GACTCCGGTC    120CCCTTTACTC TTACTGTGAA AAAGGAGGTG TTCTTCAAAG ACCGGAAGGA GGAGAAGGCC    180CCCCGCCTCA TTGTGTTCCC CCCCCTGGAC TTCCGGATAG CTGAAAAGCT CATCTTGGGA    240GACCCAGGCCA GGTAGCCAA GGCGGTGTTG GGGGGGGCCT ACGCCTTCCA GTACACCCCA    300AATCAGCGAG TTAAiGGAGAT GCTCAAGCTA TGGGAGTCTA AGAAGACCCC TTGCGCCATC   360TGTGTGGACG CCACCTGCTT CGACAGTAGC ATAACTGAAG AGGACGTGGC TTTGGAGACA    420GAG                                                                  423(2)SEQ ID NO:31的信息:(i)序列特征:
 (A)长度:516个碱基对
 (B)类型:核酸
 (C)链型:两种
 (D)拓扑学:线性(ii)分子类型:  cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
  (C)各分离株:共有序列3E5(xi)序列描述:SEQ ID NO:31:TACAGCCTAT TGTGACCAGG TGCGCACTCC GCTTGAATTG CAGGTTGGGT GCTTGGTGGG     60CAATGAACTT ACCTTTGAAT GTGACAAGTG TGAGGCTAGG CAAGAAACCT TGGCCTCCTT     120CTCTTACATT TGGTCTGGAG TGCCGCTGAC TAGGGCCACG CCGGCCAAGC CTCCCGTGGT     180GAGGCCGGTT GGCTCTTTGT TAGTGGCCGA CACTACTAAG GTGTATGTTA CCAATCCAGA     240CAATGTGGGA CGGAGGGTGG ACAAGGTGAC CTTCTGGCGT GCTCCTAGGG TTCATGATAA     300GTACCTCGTG GACTCTATTG AGCGCGCTAA GAGGGCCGCT CAAGCCTGCC TAAGCATGGG     360TTACACTTAT GAGGAAGCAA TAAGGACTGT AAGGCCACAT GCTGCCATGG GCTGGGGATC     420TAAGGTGTCG GTTAAGGACT TAGCCACCCC CGCGGGGAAG ATGGCCGTCC ATGACCGGCT     480TCAGGAGATA CTTGAAGGGA CTCCGGTCCC CTTTAC                               516(2)SEQ ID NO:32的信息:(i)序列特征:
(A)长度:518个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA  (iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列2E3(xi)序列描述:SEQ ID NO:32:GAATGGGCAA CTCAAAGAAC CAGTTTACTC TACCAAGCTG TGCCGGCACT ATTGGATGGG    60GACTGTCCCT GTGAACATGC TGGGTTACGG TGAAACGTCG CCTCTCCTGG CCTCCGACAC    120CCCGAAGGTT GTGCCCTTCG GGACGTCTGG CTGGGCTGAG GTGGTGGTGA CCACTACCCA    180CGTGGTAATC AGGAGGACCT CCGCCTATAA GCTGCTGCGC CAGCAAATCC TATCGGCTGC    240TGTAGCTGAG CCCTACTACG TCGACGGCAT TCCGGTCTCA TGGGACGCGG ACGCTCGTGC    300GCCCGCCATG GTCTATGGCC CTGGGCAAAG TGTTACCATT GACGGGGAGC GCTACACCTT    360GCCTCATCAA CTGAGGCTCA GGAATGTGGC ACCCTCTGAG GTTTCATCCG AGGTGTCCAT    420TGACATTGGG ACGGAGACTG AAGACTCAGA ACTGACTGAG GCCGATCTGC CGCCGGCGGC    480TGCTG CTCTC CAAGCGATCG AGAATGCTGC GAGGATTC                           518(2)SEQ ID NO:33的信息:(i)序列特征:
 (A)长度:268个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
 (C)各分离株:共有序列1E3(xi)序列描述:SEQ ID NO:33:CTTACTGAGG CCGATCTGCC GCCGGCGGCT GCTGCTCTCC AAGCGATCGA GAATGCTGCG    60AGGATTCTTG AACCGCACAT TGATGTCATC ATGGAGGACT GCAGTACACC CTCTCTTTGT    120GGTAGTAGCC GAGAGATGCC TGTATGGGGA GAAGACATCC CCCGTACTCC ATCGCCAGCA    180CTTATCTCGG TTACTGAGAG CAGCTCAGAT GAGAAGACCC CGTCGGTGTC CTCCTCGCAG    240GAGGATACCC  CGTCCTCTGA  CTCATTCG                                     268(2)SEQ ID NO:34的信息:(i)序列特征:
 (A)长度:781个碱基对
 (B)类型:核苷酸
 (C)链型:两种
 (D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
 (C)各分离株:单个克隆4E5-20(xi)序列描述:SEQ ID NO:34:GTAAGGCCAC ATGCTGCCAT GGGCTGGGGA TCTAAGGTGT CGGTTAAGGA CTTAGCCACC    60CCCGCGGGGA AGATGGCCGT CCATGACCGG CTTCAGGAGA TACTTGAAGG GACTCCGGTC    120CCCTTTACTC TTACTGTGAA AAAGGAGGTG TTCTTCAAAG ACCGGAAGGA GGAGAAGGCC    l80CCCCGCCTCA TTGTGTTCCC CCCCCTGGAC TTCCGGATAG CTGAAAAGCT CATCTTGGGA    240GACCCAGGCC GGGTAGCCAA GGCGGTGTTG GGGGGGGCCT ACGCCTTCCA GTACACCCCA    300AATCAGCGAG TTAAGGAGAT GCTCAAGCTA TGGGAGTCTA AGAAGACCCC TTGCGCCATC    360TGTGTGGACG CCACCTGCTT CGACAGTAGC ATAACTGAAG AGGACGTGGC TTTGGAGACA    420GAGTTATACG CTCTGGCCTC TGACCATCCA GAATGGGTGC GGGCACCTGG GAAATACTAT    480GCCTCAGGCA CCATGGTCAC CCCGGAAGGG GTGCCCGTCG GTGAGAGGTA TTGCAGATCC    540TCGGGTGTCC TAACAACTAG CGCGAGCAAC TGCCTGACCT GCTACATCAA GGTGAAAGCT    600GCCTGTGAGA GAGTGGGGCT GAAAAATGTC TCTCTTCTCA TAGCCGGCGA TGACTGCTTG    660ATCATATGTG AGCGGCCAGT GTGCGACCCA AGCGACGCTT TGGGCAGAGC CCTAGCGAGC    720TATGGGTACG CGTGCGAGCC CTCATATCAT GCATCATTGG ACACGGCCCC CTTCTGCTCC    780A                                                                    781(2)SEQ ID NO:35的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:探针470-201-1-142R(xi)序列描述:SEQ ID NO:35:TCGGTTACTG AGAGCAGCTC AGATGAG                                         27(2)SEQ ID NO:36的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:探针470-20-1-152F(xi)序列描述:SEQ ID NO:36:TCGGTTACTG AGAGCAGCTC AGATGAG                                          27(2)SEQ ID NO:37的信息:(i)序列特征:
(A)长度:570个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆470EXP1(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..570(xi)序列描述:SEQ ID NO:37:GCT GTA TGG TTC TGG ATT TCC ATC TCA CAC AGG CTA GCA ACA TCA GCC    48Ala Val Trp Phe Trp Ile Ser Ile Ser His Arg Leu Ala Thr Ser Ala1               5                  10                  15ACC GTC AAC CCC AAT GAG AAA AAG CGC GTG ACG CTC TTT TCA ACG CAG    96Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr Gln
         20                  25                  30CAC GAC ATC TTG ACG GTA AGC TTC CTG GTC GCG TCG CTC TGT GGA AAT    144His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly Asn
     35                  40                  45AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC CCT    192Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro
50                   55                  60TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG    240Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly65                  70                  75                  80GTA TCC TCC TGC GAG GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG CTG    288Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu
             85                  90                  95CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG TCT    336Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser
        100                 105                 110TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA CAA AGA GAG GGT GTA    384Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val
    115                 120                 125CTG CAG TCC TCC ATG ATG ACA TCA ATG TGC GGT TCA AGA ATC CTC GCA    432Leu Gln Ser Ser Met Met Thr Ser Met Cys Gly Ser Arg Ile Leu Ala
130                 135                 140GCA TTC TCG ATC GCT TGG AGA GCA GCA GCC GCC GGC GGC AGA TCG GCC    480Ala Phe Ser Ile Ala Trp Arg Ala Ala Ala Ala Gly Gly Arg Ser Alal45                 150                 155                 160TCA GTC AGT TCT GAG TCT TCA GTC TCC GTC CCA ATG TCA ATG GAC ACC    528Ser Val Ser Ser Glu Ser Ser Val Ser Val Pro Met Ser Met Asp Thr
            165                 170                 175TCG GAT GAA ACC TCA GAG GGT GCC ACA TTC CTG AGC CTC AGT            570Ser Asp Glu Thr Ser Glu Gly Ala Thr Phe Leu Ser Leu Ser
        180                 185                 190(2)SEQ ID NO:38的信息:(i)序列特征:
(A)长度:190个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:38:Ala Val Trp Phe Trp Ile Ser Ile Ser His Arg Leu Ala Thr Ser Ala1               5                  10                  15Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr Gln
         20                  25                  30His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly Asn
     35                  40                  45Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro
 50                  55                  60Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly65                  70                  75                  80Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu
             85                  90                  95Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser
        100                 105                 110Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val
    115                  120                  125Leu Gln Ser Ser Met Met Thr Ser Met Cys Gly Ser Arg Ile Leu Ala
130                  135                  140Ala Phe Ser Ile Ala Trp Arg Ala Ala Ala Ala Gly Gly Arg Ser Ala145                 150                 155                 160Ser Val Ser Ser Glu Ser Ser Val Ser Val Pro Met Ser Met Asp Thr
            165                 170                 175Ser Asp Glu Thr Ser Glu Gly Ala Thr Phe Leu Ser Leu Ser
        180                 185                 190(2)SEQ ID NO:39的信息:(i)序列特征:
(A)长度:1288个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列5E3
(xi)序列描述:SEQ ID NO:39:ACGGGTAGGG GCAGGTCTGG ACGCTACTAC TACGCGGGGG TGGGCAAAGC CCCTGCGGGT    60GTGGTGCGCT CAGGTCCTGT CTGGTCGGCG GTGGAAGCTG GAGTGACCTG GTACGGAATG    120GAACCTGACT TGACAGCTAA CCTACTGAGA CTTTACGACG ACTGCCCTTA CACCGCAGCC    180GTCGCGGCTG ATATCGGAGA AGCCGCGGTG TTCTTCTCTG GGCTCGCCCC ATTGAGGATG    240CACCCTGATG TCAGCTGGGC AAAAGTTCGC GGCGTCAACT GGCCCCTCTT GGTGGGTGTT    300CAGCGGACCA TGTGTCGGGA AACACTGTCT CCCGGCCCAT CGGATGACCC CCAATGGGCA    360GGTCTGAAGG GCCCAAATCC TGTCCCACTC CTGCTGAGGT GGGGCAATGA TTTACCATCT    420AAAGTGGCCG GCCACCACAT AGTGGACGAC CTGGTCCGGA GACTCGGTGT GGCGGAGGGT    480TACGTCCGCT GCGACGCTGG GCCGATCTTG ATGATCGGTC TAGCTATCGC GGGGGGAATG    540ATCTACGCGT CATACACCGG GTCGCTAGTG GTGGTGACAG ACTGGGATGT GAAGGGGGGT    600GGCGCCCCCC TTTATCGGCA TGGAGACCAG GCCACGCCTC AGCCGGTGGT GCAGGTTCCT    660CCGGTAGACC ATCGGCCGGG GGGTGAATCA GCACCATCGG ATGCCAAGAC AGTGACAGAT    720GCGGTGGCAG CCATCCAGGT GGACTGCGAT TGGACTATCA TGACTCTGTC GATCGGAGAA    780GTGTTGTCCT TGGCTCAGGC TAAGACGGCC GAGGCCTACA CAGCAACCGC CAAGTGGCTC    840GCTGGCTGCT ATACGGGGAC GCGGGCCGTT CCCACTGTAT CCATTGTTGA CAAGCTCTTC    900GCCGGAGGGT GGGCGGCTGT GGTGGGCCAT TGCCACAGCG TGATTGCTGC GGCGGTGGCG    960GCCTACGGGG CTTCAAGGAG CCCGCCGTTG GCAGCCGCGG CTTCCTACCT GATGGGGTTG    1020GGCGTTGGAG GCAACGCTCA GACGCGCCTG GCGTCTGCCC TCCTATTGGG GGCTGCTGGA    1080ACCGCCTTGG GCACTCCTGT CGTGGGCTTG ACCATGGCAG GTGCGTTCAT GGGGGGGGCC    1140AGTGTCTCCC CCTCCTTGGT CACCATTTTA TTGGGGGCCG TCGGAGGTTG GGAGGGTGTT    1200GTCAACGCGG CGAGCCTAGT CTTTGACTTC ATGGCGGGGA AACTTTCATC AGAAGATCTG    1260TGGTATGCCA TCCCGGTACT GACCAGCC                                       1288(2)SEQ ID NO:40的信息:(i)序列特征:
(A)长度:862个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列6E3(xi)序列描述:SEQ ID NO:40:ACGGCAACAT GGGGCACAAG GTCTTAATCT TGAACCCCTC AGTGGCCACT GTGCGGGCCA    60TGGGCCCGTA CATGGAGCGG CTGGCGGGTA AACATCCAAG TATATACTGT GGGCATGATA    120CAACTGCTTT CACAAGGATC ACTGACTCCC CCCTGACGTA TTCAACCTAT GGGAGGTTTT    180TGGCCAACCC TAGGCAGATG CTACGGGGCG TTTCGGTGGT CATTTGTGAT GAGTGCCACA    240GTCATGACTC AACCGTGCTG TTAGGCATTG GGAGAGTTCG GGAGCTGGCG CGTGGGTGCG    300GAGTGCAACT AGTGCTCTAC GCCACCGCTA CACCTCCCGG ATCCCCTATG ACGCAGCACC    360CTTCCATAAT TGAGACAAAA TTGGACGTGG GCGAGATTCC CTTTTATGGG CATGGAATAC    420CCCTCGAGCG GATGCGAACC GGAAGGCACC TCGTGTTCTG CCATTCTAAG GCTGAGTGCG    480AGCGCCTTGC TGGCCAGTTC TCCGCTAGGG GGGTCAATGC CATTGCCTAT TATAGGGGTA    540AAGACAGTTC TATCATCAAG GATGGGGACC TGGTGGTCTG TGCTACAGAC GCGCTTTCCA    600CTGGGTACAC TGGAAATTTC GACTCCGTCA CCGACTGTGG ATTAGTGGTG GAGGAGGTCG    660TTGAGGTGAC CCTTGATCCC ACCATTACCA TCTCCCTGCG GACAGTGCCT GCGTCGGCTG    720AACTGTCGAT GCAAAGACGA GGACGCACGG GTAGGGGCAG GTCTGGACGC TACTACTACG    780CGGGGGTGGG CAAAGCCCCT GCGGGTGTGG TGCGCTCAGG TCCTGTCTGG TCGGCGGTGG    840AAGCTGGAGT GACCTCGTAC GG                                             862(2)SEQ ID NO:41的信息:(i)序列特征:
(A)长度:865个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:单个克隆GE3L-11(xi)序列描述:SEQ ID NO:41:AGTACGGCAA CATGGGGCAC AAGGTCTTAA TCTTGAACCC CTCAGTGGCC ACTGTGCGGG    60CCATGGGCCC GTACATGGAG CGGCTGGCGG GTAAACATCC AAGTATATAC TGTGGGCATG    120ATACAACTGC TTTCACAAGG ATCACTGACT CCCCCCTGAC GTATTCAACC TATGGGAGGT    180TTTTGGCCAA CCCTAGGCAG ATGCTACGGG GCGTTTCGGT GGTCATTTGT GATGAGTGCC    240ACAGTCATGA CTCAACCGTG CTGTTAGGCA TTGGGAGAGT CCGGGAGCTG GCGCGTGGGT    300GCGGGGTGCA ACTAGTGCTC TACGCCACCG CTACACCTCC CGGATCCCCT ATGACGCAGC    360ACCCTTCCAT AATTGAGACA AAATTGGACG TGGGCGAGAT TCCCTTTTAT GGACATGGAA    420TACCCCTCGA GCGGATGCGA ACCGGAAGGC ACCTCGTGTT CTGCCATTCT AAGGCTGAGT    480GCGAGCGCCT TGCTGGCCAG TTCTCCGCTA GGGGGGTCAA TGCCATTGCC TATTATAGGG    540GTAAAGACAG TTCTATCATC AAGGATGGGG ACCTGGTGGT CTGTGCTACA GACGCGCTTT    600CCACTGGGTA CACTGGAAAT TTCGACTCCG TCACCGACTG TGGATTAGTG GTGGAGGAGG    660TCGTTGAGGT GACCCTTGAT CCCACCATTA CCATCTCCCT GCGGACAGTG CCTGCGTCGG    720CTGAACTGTC GATGCAAAGA CGAGGACGCA CGGGTAGGGG CAGGTCTGGA CGCTACTACT    780ACGCGGGGGT GGGCAAAGCC CCTGCGGGTG TGGTGCGCTC AGGTCCTGTC TGGTCGGCGG    840TGGAAGCTGG AGTGACCTCG TACGG                                          865(2)SEQ ID NO:42的信息:(i)序列特征:
(A)长度:596个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列7E3(xi)序列描述:SEQ ID NO:42:AGCATGGGAA CATGCTTGAA CGGCCTGCTG TTCACGACCT TCCATGGGGC TTCATCCCGA    60ACCATCGCCA CACCCGTGGG GGCCCTTAAT CCCAGATGGT GGTCAGCCAG TGATGATGTC    120ACGGTGTATC CACTCCCGGA TGGGGCTACT TCGTTAACAC CTTGTACTTG CCAGGCTGAG    180TCCTGTTGGG TCATCAGATC CGACGGGGCC CTATGCCATG GCTTGAGCAA GGGGGACAAG    240GTGGAGCTGG ATGTGGCCAT GGAGGTCTCT GACTTCCGTG GCTCGTCTGG CTCACCGGTC    300CTATGTGACG AAGGGCACGC AGTAGGAATG CTCGTGTCTG TGCTTCACTC CGGTGGTAGG    360GTCACCGCGG CACGGTTCAC TAGGCCGTGG ACCCAAGTGC CAACAGATGC CAAAACCACT    420ACTGAACCCC CTCCGGTGCC GGCCAAAGGA GTTTTCAAAG AGGCCCCGTT GTTTATGCCT    480ACGGGAGCGG GAAAGAGCAC TCGCGTCCCG TTGGAGTACG ATAACATGGG GCACAAGGTC    540TTAATCTTGA ACCCCTCAGT GGCCACTGTG CGGGCCATGG GCCCGTACAT GGAGCG        596(2)SEQ ID NO:43的信息:(i)序列特征:
(A)长度:586个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:  cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列5E5(xi)序列描述:SEQ ID NO:43:GAGCTATGGG TACGCGTGCG AGCCCTCATA TCATGCATCA TTGGACACGG CCCCCTTCTG    60CTCCACTTGG CTTGCTGAGT GCAATGCAGA TGGGAAGCGC CATTTCTTCC TGACCACGGA    120CTTCCGGAGG CCGCTCGCTC GCATGTCGAG TGAGTATAGT GACCCGATGG CTTCGGCGAT    180CGGTTACATC CTCCTTTATC CTTGGCACCC CATCACACGG TGGGTCATCA TCCCTCATGT    240GCTAACGTGC GCATTCAGGG GTGGAGGCAC ACCGTCTGAT CCGGTTTGGT GCCAGGTGCA    300TGGTAACTAC TACAAGTTTC CACTGGACAA ACTGCCTAAC ATCATCGTGG CCCTCCACGG    360ACCAGCAGCG TTGAGGGTTA CCGCAGACAC AACTAAAACA AAGATGGAGG CTGGTAAGGT    420TCTGAGCGAC CTCAAGCTCC CTGGCTTAGC AGTCCACCGA AAGAAGGCCG GGGCGTTGCG    480AACACGCATG CTCCGCTCGC GCGGTTGGGC TGAGTTGGCT AGGGGCTTGT TGTGGCATCC    540AGGCCTACGG CTTCCTCCCC CTGAGATTGC TGGTATCCCG GGGGGT                   586(2)SEQ ID NO:44的信息:(i)序列特征:
(A)长度:242个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列6E5(44F)  (xi)序列描述:SEQ ID NO:44:CGAACGCGCA TGCTCCGCTC GCGCGGTTGG GCTGAGTTGG CTAGGGGCTT GTTGTGGCAT    60CCAGGCCTAC GGCTTCCTCC CCCTGAGATT GCTGGTATCC CGGGGGGTTT CCCTCTCTCC    120CCCCCCTATA TGGGGGTGGT ACACCAATTG GATTTCACAA GCCAGAGGAG TCGCTGGCGG    180TGGTTGGGGT TCTTAGCCCT GCTCATCGTA GCCCTCTTCG GGTGAACTAA ATTCATCTGT    240TG                                                                   242(2)SEQ ID NO:45的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物gt11反-JL(xi)序列描述:SEQ ID NO:45:TGGTAATGGT AGCGACCGGC GCTCAGC                                            27(2)SEQ ID NO:46的信息:(i)序列特征:
(A)长度:45个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:引物GE-3F(xi)序列描述:SEQ ID NO:46:GCCGCCATGG TCTCATGGGA CGCGGACGCT CGTGCGCCCG CGATG                         45(2)SEQ ID NO:47的信息:(i)序列特征:
(A)长度:34个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE-3R(xi)序列描述:SEQ ID NO:47:GCGCGGATCC GATAAGTGCT GGCGATGGAG TACG                                     34(2)SEQ ID NO:48的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE-9F  (xi)序列描述:SEQ ID NO:48:GGCACCATGG TCACCCCGGA AG                                                 22(2)SEQ ID NO:49的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE-9R(xi)序列描述:SEQ ID NO:49:GCTCGGATCC GGAGCAGAAG GGGGCCGT                                28(2)SEQ ID NO:50的信息:(i)序列特征:
(A)长度:364个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:GE3-2(ix)特性
(A)名称/关键词:CDS
(B)位置:2..364  (xi)序列描述:SEQ ID NO:50:G GTC TCA TGG GAC GCG GAC GCT CGT GCG CCC GCG ATG GTC TAT GGC        46Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly
1               5                  10                  15CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC TTG CCT CAT    94Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His
               20                  25                  30CAA CTG AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT TCA TCC GAG GTG    142Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val
           35                  40                  45TCC ATT GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT GAG GCC    190Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala
       50                  55                  60GAT CTG CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC GAG AAT GCT GCG    238Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala
   65                  70                  75AGG ATT CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG GAC TGC AGT ACA    286Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr80                  85                  90                  95CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA TGG GGA GAA GAC    334Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp
              100                 105                 110ATC CCC CGT ACT CCA TCG CCA GCA CTT ATC                            364Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile
          115                 120(2)SEQ ID NO:51的信息:(i)序列特征:
(A)长度:121个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:51:Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro1               5                  10                  15Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln
         20                  25                  30Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser
     35                  40                  45Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp
 50                  55                  60Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg65                  70                  75                  80Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr Pro
             85                  90                  95Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp Ile
        100                 105                 110Pro Arg Thr Pro Ser Pro Ala Leu Ile
    115                 120(2)SEQ ID NO:52的信息:(i)序列特征:
(A)长度:290个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆GE9-2(ix)特性
(A)名称/关键词:CDS
(B)位置:3..290(xi)序列描述:SEQ ID NO:52:CC ATG GTC ACC CCG GAA GGG GTG CCC GTT GGT GAG AGG TAT TGC AGA    47Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg
1                5                  10                  15TCC TCG GGT GTC CTA ACA ACT AGC GCG AGC AAC TGC TTG ACC TGC TAC    95Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr
             20                  25                  30ATC AAG GTG AAA GCC GCC TGT GAG AGG GTG GGG CTG AAA AAT GTC TCT    143Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser
         35                  40                  45CTT CTC ATA GCC GGC GAT GAC TGC TTG ATC ATA TGT GAG CGG CCA GTG    19lLeu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val
     50                  55                  60TGC GAC CCA AGC GAC GCT TTG GGC AGA GCC CTA GCG AGC TAT GGG TAC    239Cys Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr
 65                  70                  75GCG TGC GAG CCC TCA TAT TAT GCA TGC TCG GAC ACG GCC CCC TTC TGC    287Ala Cys Glu Pro Ser Tyr Tyr Ala Cys Ser Asp Thr Ala Pro Phe Cys80                  85                  90                  95TCC                                                                290Ser(2)SEQ ID NO:53的信息:(i)序列特征:
(A)长度:96个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:53:Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg Ser1               5                  10                  15Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile
         20                  25                  30Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser Leu
     35                  40                  45Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val Cys
 50                  55                  60Asp Pro ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala65                  70                  75                  80Cys Glu Pro Ser Tyr Tyr Ala Cys Ser Asp Thr Ala Pro Phe Cys Ser
             85                  90                  95(2)SEQ ID NO:54的信息:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:JML-A SISPA引物(xi)序列描述:SEQ ID NO:54:AGGAATTCAG CGGCCGCGAG                                              20(2)SEQ ID NO:55的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:JML-B SISPA引物(xi)序列描述:SEQ ID NO:55:CTCGCGGCCG CTGAATTCCT TT                                           22(2)SEQ ID NO:56的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-F1引物(xi)序列描述:SEQ ID NO:56:GCGAATTCGC CATGGCGGGG AGACTTTCAT CA                               32(2)SEQ ID NO:57的信息:(i)序列特征:
(A)长度:35个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-R1引物(xi)序列描述:SEQ ID NO:57:GCGAATTCGG ATCCAGGGCC ATAGACCATC GCGGG                            35(2)SEQ ID NO:58的信息:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-f2引物(xi)序列描述:SEQ ID NO:58:GCGAATTCCG TGCGCCCGCC ATGGTC                                     26(2)SEQ ID NO:59的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-R3引物(xi)序列描述:SEQ ID NO:59:GCGAATTCGG ATCCCAAGGT TTCTTGCCTA GC                              32(2)SEQ ID NO:60的信息:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性  (ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-f4引物(xi)序列描述:SEQ ID NO:60:GCGAATTCAA GTGTGAGGCT AGGCAA                                      26(2)SEQ ID NO:61的信息:(i)序列特征:
(A)长度:35个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:470ep-R4引物(xi)序列描述:SEQ ID NO:61:GCGAATTCGG ATCCCCACAC AGATGGCGCA AGGGG                            35(2)SEQ ID NO:62的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:KL-1 SISPA引物(xi)序列描述:SEQ ID NO:62:GCAGGATCCG AATTCGCATC TAGAGAT                                     27(2)SEQ ID NO:63的信息:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:KL-2SISPA引物(xi)序列描述:SEQ ID NO:63:ATCTCTAGAT GCGAATTCGG ATCCTGCGA                                    29(2)SEQ ID NO:64的信息:(i)序列特征:
(A)长度:186个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-10(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..186(xi)序列描述:SEQ ID NO:64:CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT GCC ATT GAC    48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ala Ile Asp1               5                  10                  15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA    96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG GCT    144Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Ala
     35                  40                  45GAA AAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT            186Glu Asn Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala
 50                  55                  60(2)SEQ ID NO:65的信息:(i)序列特征:
(A)长度:62个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:65:Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ala Ile Aspl               5                  10                  15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Ala
     35                  40                  45Glu Asn Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala
 50                  55                  60(2)SEQ ID NO:66的信息:(i)序列特征:
(A)长度:282个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-12(ix)特性
(A)名称/关键词:CDS
(B)位置:1..282(xi)序列描述:SEQ ID NO:66:CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC    48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp1               5                  10                 15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA    96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG ACT    144Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr
     35                  40                  45GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT GCT    192Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala
 50                  55                  60CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT GAT    240Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65                  70                  75                  80GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT            282Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser
             85                  90(2)SEQ ID NO:67的信息:(i)序列特征:
(A)长度:94个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:67:Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile AspI               5                  10                  15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr
     35                  40                  45Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala
50                   55                  60Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65                  70                  75                  80Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser
             85                  90(2)SEQ ID NO:68的信息:(i)序列特征:
(A)长度:279个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-26(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..279(xi)序列描述:SEQ ID NO68:CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT TCC ATT GAC    48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ser Ile Asp1               5                  10                  15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA    96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG ACT    144Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr
     35                  40                  45GAA GAC TCA GAA CTG ACT GAG GCC GAC CTG CCG CCG GCG GCT GCT GCT    192Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala
 50                  55                  60CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATC GAT    240Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65                  70                  75                  60GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT                279Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly
             85                  90(2)SEQ ID NO:69的信息:(i)序列特征:
(A)长度:93个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO 69:Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ser Ile Asp1               5                  10                  15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
         20                  25                  30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr
     35                  40                  45Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala
 50                  55                  60Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65                  70                  75                  80Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly
            85                   90(2)SEQ ID NO:70的信息:(i)序列特征:
(A)长度:108个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-5(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..108(xi)序列描述:SEQ ID NO:70:GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC    48Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1               5                  10                  15TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG    96Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg
         20                  25                  30CAA GAA ACC TTG                                                    108Gln Glu Thr Leu
     35(2)SEQ ID NO:71的信息:(i)序列特征:
(A)长度:36个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:71:Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1               5                  10                  15Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg
         20                  25                  30Gln Glu Thr Leu
     35(2)SEQ ID NO:72的信息:(i)序列特征:
(A)长度:132个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-3(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..132(xi)序列描述:SEQ ID NO:72:GAG ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC AAG GTG CGC ACT    48Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr1               5                  10                 15CCG CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT    96Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe
         20                  25                  30GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG                    132Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu
     35                  40(2)SEQ ID NO:73的信息:(i)序列特征:
(A)长度:44个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:73:Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr1               5                  l0                  15Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe
         20                  25                  30Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu
     35                  40(2)SEQ ID NO:74的信息:(i)序列特征:
(A)长度:258个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-27  (ix)特性:
(A)名称/关键词:CDS
(B)位置:1..258(xi)序列描述:SEQ ID NO:74:AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG    48Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys1              5                  10                  15ATG TCA TGC TGC GTT GAA AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG    96Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly
         20                  25                  30TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC    144Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn
     35                  40                  45CAT ATA GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT    192His Ile Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val
 50                  55                  60GGG TGC TTG GTG GGC AAT GAA CTC ACC TTT GAA TGT GAC AAG TGT GAG    240Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu65                  70                  75                  80GCT AGG CAA GAA ACC TTG                                             258Ala Arg Gln Glu Thr Leu
             85(2)SEQ ID NO:75的信息:(i)序列特征:
(A)长度:86个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:75:Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys1               5                  10                  15Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly
         20                  25                  30Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn
     35                  40                  45His Ile Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val
 50                  55                  60Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu65                  70                  75                  80Ala Arg Gln Glu Thr Leu
             85(2)SEQ ID NO:76的信息:(i)序列特征:
(A)长度:108个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-25(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..108(xi)序列描述:SEQ ID NO:76:ACC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC    48Thr Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1               5                  10                  15TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG    96Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg
         20                  25                  30CAA GAA ACC TTG                                                    108Gln Glu Thr Leu
     35(2)SEQ ID NO:77的信息:(i)序列特征:
(A)长度:36个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:77:Thr Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1               5                  10                  15Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg
         20                  25                  30Gln Glu Thr Leu
     35(2)SEQ ID NO:78的信息:(i)序列特征:
(A)长度:108个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-20(ix)特性:
(A)名称/关键词:CDS
(B)位置:52..108(xi)序列描述:SEQ ID NO:78:GCCGACACTA CTAAGGTGTA TGTTACCAAT CCAGACAATG TGGGACGAAG G GTG GGC    57
                                                     Val Gly
                                                      1AAT GAA GTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC    105Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr
      5                  10                  15TTG                                                                108Leu(2)SEQ ID NO:79的信息:(i)序列特征:
(A)长度:19个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:79:Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln1               5                  10                  15Glu Thr Leu(2)SEQ ID NO:80的信息:(i)序列特征:
(A)长度:168个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-16(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..168(xi)序列描述:SEQ ID NO:80:TTG GGG TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC    48Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile1               5                  10                  15CAG AAC CAT ACA GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG    96Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu
         20                  25                  30CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG    144Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys
     35                  40                  45TGT GAG GCT AGG CAA GAA ACC TTG                                    168Cys Glu Ala Arg Gln Glu Thr Leu
 50                  55(2)SEQ ID NO:81的信息:(i)序列特征:
(A)长度:56个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:81:Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile1               5                  10                  15Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu
         20                  25                  30Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys
     35                  40                  45Cys Glu Ala Arg Gln Glu Thr Leu
 50                  55(2)SEQ ID NO:82的信息:(i)序列特征:
(A)长度:313个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:Y5-50(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..313(xi)序列描述:SEQ ID NO:82:ATC ACC GTC AAC CCC AAT GAG AAA AAG CGC GTG ACG CTC TTT TCA ACG    48Ile Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr1               5                  10                  15CAG CAC GAC ATC TTG ACG GTA AGC TTC CTG GTC GCG TCG CTC TGT GGA    96Gln His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly
         20                  25                  30AAT AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC    144Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser
     35                  40                  45CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC    192Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp
 50                  55                  60GGG GTA TCC TCC TGC GAG GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG    240Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu65                  70                  75                  80CTG CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG    288Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met
             85                  90                  95TCT TCT CCC CAT ACA GGC ATC TCT C                                  313Ser Ser Pro His Thr Gly Ile Ser
        100(2)SEQ ID NO:83的信息:(i)序列特征:
(A)长度:104个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:83:Ile Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr1               5                  10                  15Gln His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly
         20                  25                  30Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser
     35                  40                  45Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp
 50                  55                  60Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu65                  70                  75                  80Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met
             85                  90                  95Ser Ser Pro His Thr Gly Ile Ser
        100(2)SEQ ID NO:84的信息:(i)序列特征:
(A)长度:89个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-52(ix)特性:
(A)名称/关键词:CDS
(B)位置:28..87(xi)序列描述:SEQ ID NO:84:ACTGAGAGCA GCTCAGATGA GAAGACC CCT TCG GCT GTC TCG GAC TCT TGG    51
                          Pro Ser Ala Val Ser Asp Ser Trp
                            1               5ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCG CA               89Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser
 10                  15                  20(2)SEQ ID NO:85的信息:(i)序列特征:
(A)长度:20个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:85:Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp1               5                  10                      15Gly Val Ser Ser
         20(2)SEQ ID NO:86的信息:(i)序列特征:
(A)长度:214个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:克隆Y5-53
(ix)特性
(A)名称/关键词:CDS
(B)位置:1..100(xi)序列描述:SEQ ID NO:86:AAT AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC    48Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser1               5                  10                  15CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC    96Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp
         20                  25                  30GGG G ATCTCTAGAT GCGAATTCAA GTGTGAGGCT AGGCAAGAAA CCTTGGCCTC       150GlyCTTCTCTTAC ATTTGGTCTG GAGTGCCGCT GACTAGGGCC ACGCCGGCCA AGCCTCCCGT   210GGTG                                                                214(2)SEQ ID NO:87的信息:(i)序列特征:
(A)长度:33个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:87:Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser1               5                  10                   15Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp
         20                  25                  30Gly(2)SEQ ID NO:88的信息:(i)序列特征:
(A)长度:113个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-55(ix)特性:
(A)名称/关键词:CDS
(B)位置:52..113(xi)序列描述:SEQ ID NO:88:CCATCGCCAG CACTTATCTC GGTTACTGAG AGCAGCTCAG ATCAGAAGAC C CCT TCG    57
                                                     Pro Ser
                                                       1GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA    105Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val
      5                  10                  15TCC TCG CA                                                          113Ser Ser
 20(2)SEQ ID NO:89的信息:(i)序列特征:
(A)长度:20个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:89:Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp1               5                  10                  15Gly Val Ser Ser
         20(2)SEQ ID NO:90的信息:(i)序列特征:
(A)长度:330个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-56(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..330(xi)序列描述:SEQ ID NO:90:ACG TTG AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC TCT TGG ATG    48Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met1               5                  10                  15ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC    96Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr
         20                  25                  30GAC GGG GTC TTC TCA TCT GAG CTG CTC TCA GTA ACC GAG ATA AGT GCT    144Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala
     35                  40                  45GGC GAT GGA GTA CGG GGG ATG TCT TCT CCC CAT ACA GGC ATC TCT CGG    192Gly Asp Gly Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg
 50                  55                  60CTA CTA CCA CAA AGA GAG GGT GTA CTG CAG TCC TCC ATG ATG ACA TCA    240Leu Leu Pro Gln Arg Glu Gly Val Leu Gln Ser Ser Met Met Thr Ser65                  70                  75                  80ATG TGC GGT TCA AGA ATC CTC GCA GCA TTC TCG ATC GCT TGG AGA GCA    288Met Cys Gly Ser Arg Ile Leu Ala Ala Phe Ser Ile Ala Trp Arg Ala
             85                  90                  95GCA GCC GCC GGC GGC AGA TCG GCC TCA GTC AGT TCT GAG TCT            330Ala Ala Ala Gly Gly Arg Ser Ala Ser Val Ser Ser Glu Ser
        100                 105                 110(2)SEQ ID NO:91的信息:(i)序列特征:
(A)长度:110个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:91:Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met1               5                  10                  15Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr
         20                  25                  30Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala
     35                  40                  45Gly Asp Gly Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg
 50                  55                  60Leu Leu Pro Gln Arg Glu Gly Val Leu Gln Ser Ser Met Met Thr Ser65                  70                  75                  80Met Cys Gly Ser Arg Ile Leu Ala Ala Phe Ser Ile Ala Trp Arg Ala
             85                  90                  95Ala Ala Ala Gly Gly Arg Ser Ala Ser Val Ser Ser Glu Ser
        100                 105                 110(2)SEQ ID NO:92的信息:(i)序列特征:
(A)长度:195个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-57(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..195(xi)序列描述:SEQ ID NO:92:ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC CCT TCG GCT GCC TCG    48Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Ala Ser1               5                  10                  15GAC TCT TGG ATG ACC TCG AAT GAG TCG GAG GAC GGG GTA TCC TCC TGC    96Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys
         20                  25                      30GAA GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG CTG CTC TCA GTA ACC    144Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr
     35                  40                  45GAG ATA AGT GCT GGC GGT GGA GTA CGG GGG ATG TCT TCT CCC CAT ACG    192Glu Ile Ser Ala Gly Gly Gly Val Arg Gly Met Ser Ser Pro His Thr
 50                  55                  60GGC                                                                195Gly65(2)SEQ ID NO:93的信息:(i)序列特征:
(A)长度:65个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:93:Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Ala Ser1               5                  10                  15Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys
         20                  25                  30Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr
     35                  40                  45Glu Ile Ser Ala Gly Gly Gly Val Arg Gly Met Ser Ser Pro His Thr
 50                  55                  60Gly65(2)SEQ ID NO:94的信息:(i)序列特征:
(A)长度:115个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆Y5-60(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..115  (xi)序列描述:SEQ ID NO:94:AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG    48Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser1               5                  10                  15AAT GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC GAC TGG    96Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Trp
         20                  25                 30GTC TTC TCA TCT GAG CTG C                                          115Val Phe Ser Ser Glu Leu
     35(2)SEQ ID NO:95的信息:(i)序列特征:
(A)长度:38个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:95:Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Serl               5                  10                  15Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Trp
         20                  25                  30Val Phe Ser Ser Glu Leu
     35(2)SEQ ID NO:96的信息:(i)序列特征:
(A)长度:93个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:克隆Y5-63(ix)特性:
(A)名称/关键词:CDS
(B)位置:19..93(xi)序列描述:SEQ ID NO:96:GAGAGCAGCT CAGATGAG AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC    51
                Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp
                  1               5                  10TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCG            93Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser
         15                  20                  25(2)SEQ ID NO:97的信息:(i)序列特征:
(A)长度:25个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:97:Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser1               5                  10                  15Asn Glu Ser Glu Asp Gly Val Ser Ser
         20                  25(2)SEQ ID NO:98的信息:(i)序列特征:
(A)长度:1181个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA  (iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列8E3(xi)序列描述:SEQ ID NO:98:GCTGGCTGAG GCACGGTTGG TCCCGCTGAT CTTGCTGCTG CTATGGTGGT GGGTGAACCA    60GCTGGCAGTC CTAGGGCTGC CGGCTGTGGA AGCCGCCGTG GCAGGTGAGG TCTTCGCGGG    120CCCTGCCCTG TCCTGGTGTC TGGGACTCCC GGTCGTCAGT ATGATATTGG GTTTGGCAAA    180CCTGGTGCTG TACTTTAGAT GGTTGGGACC CCAACGCCTG ATGTTCCTCG TGTTGTGGAA    240GCTTGCTCGG GGAGCTTTCC CGCTGGCCCT CTTGATGGGG ATTTCGGCGA CCCGCGGGCG    300CACCTCAGTG CTCGGGGCCG AGTTCTGCTT CGATGCTACA TTCGAGGTGG ACACTTCGGT    360GTTGGGCTGG GTGGTGGCCA GTGTGGTAGC TTGGGCCATT GCGCTCCTGA GCTCGATGAG    420CGCAGGGGGG TGGAGGCACA AAGCCGTGAT CTATAGGACG TGGTGTAAGG GGTACCAGGC    480AATCCGTCAA AGGGTGGTGA GGAGCCCCCT CGGGGAGGGG CGGCCTGCCA AACCCCTGAC    540CTTTGCCTGG TGCTTGGCCT CGTACATCTG GCCAGATGCT GTGATGATGG TGGTGGTTGC    600CTTGGTCCTT CTCTTTGGCC TGTTCGACGC GTTGGATTGG GCCTTGGAGG AGATCTTGGT    660GTCCCGGCCC TCGTTGCGGC GTTTGGCTCG GGTGGTTGAG TGCTGTGTGA TGGCGGGTGA    720GAAGGCCACA ACCGTCCGGC TGGTCTCCAA GATGTGTGCG AGAGGAGCTT ATTTGTTCGA    780TCATATGGGC TCTTTTTCGC GTGCTGTCAA GGAGCGCCTG TTGGAATGGG ACGCAGCTCT    840TGAACCTCTG TCATTCACTA GGACGGACTG TCGCATCATA CGGGATGCCG CGAGGACTTT    900GTCCTGCGGG CAGTGCGTCA TGGGTTTACC CGTGGTTGCG CGCCGTGGTG ATGAGGTTCT    960CATCGGCGTC TTCCAGGATG TGAATCATTT GCCTCCCGGG TTTGTTCCGA CCGCGCCTGT    1020TGTCATCCGA CGGTGCGGAA AGGGCTTCTT GGGGGTCACA AAGGCTGCCT TGACAGGTCG    1080GGATCCTGAC TTACATCCAG GGAACGTCAT GGTGTTGGGG ACGGCTACGT CGCGAAGCAT    1140GGGAACATGC TTGAACGGCC TGCTGTTCAC GACCTTCCAT G                        1181(2)SEQ ID NO:99的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物Y5-10-F1(xi)序列描述:SEQ ID NO:99:TCAGCCATGG CTCGTGCGCC CGCGATGGTC                                30(2)SEQ ID NO:100的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物Y5-10-R1(xi)序列描述:SEQ ID NO:100:CGAGGATCCA GCCGCCGGCG GCAGATC                                    27(2)SEQ ID NO:101的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物Y5-16F1(xi)序列描述:SEQ ID NO:101:GATTCCATGG GTTTGGGGTT GACGGTGGCT GA                                32(2)SEQ ID NO:102的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470EP-R3(xi)序列描述:SEQ ID NO:102:GCGAATTCGG ATCCCAAGGT TTCTTGCCTA GC                                32(2)SEQ ID NO:103的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性  (ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物Y5-5-F1(xi)序列描述:SEQ ID NO:103:GAGGCCATGG CCTATTGTGA CAAGGTG                                      27(2)SEQ ID NO:104的信息:(i)序列特征:
(A)长度:17个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物PGEX-R(xi)序列描述:SEQ ID NO:104:GACCGTCTCC GGGAGCT                                                 17(2)SEQ ID NO:105的信息:(i)序列特征:
(A)长度:326个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:克隆GE15(ix)特性:
(A)名称/关键词:CDS
(B)位置:3..326(xi)序列描述:SEQ ID NO:105:CC ATG GAG GTC TCT GAC TTC CGT GGC TCG TCT GGC TCA CCG GTC CTA     47Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu
 1               5                  10                  15TGT GAC GAA GGG CAC GCA GTA GGA ATG CTC GTG TCT GTG CTT CAC TCC    95Cys Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser
             20                  25                  30GGT GGT AGG GTC ACC GCG GCA CGG TTC ACT AGG CCG TGG ACC CAA GTG    143Gly Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val
         35                  40                  45CCA ACA GAT GCC AAA ACC ACC ACT GAA CCC CCT CCG GTG CCG GCC AAA    191Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys
     50                  55                  60GGA GTT TTC AAA GAG GCC CCG TTG TTT ATG CCT ACG GGA GCG GGA AAG    239Gly Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys
 65                  70                  75AGC ACT CGC GTC CCG TTG GAG TAC GGC AAC ATG GGG CAC AAG GTC TTA    287Ser Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu80                  85                  90                  95ATC TTG AAC CCC TCA GTG GCC ACT GTG CGG GCG ATG GGC                326Ile Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly
            100                 105(2)SEQ ID NO:106的信息:(i)序列特征:
(A)长度:108个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性  (ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:106:Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys1               5                  10                  15Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser Gly
         20                  25                  30Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro
     35                  40                  45Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly
 50                  55                  60Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser65                  70                  75                  80Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu Ile
             85                  90                  95Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly
        100                 105(2)SEQ ID NO:107的信息:(i)序列特征:
(A)长度:138个碱基对
  (B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:克隆GE17(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..138(xi)序列描述:SEQ ID NO:107:GGT GAT GAG GTT CTC ATC GGC GTC TTC CAG GAT GTG AAT CAT TTG CCT    48Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro1                5                  10                  15CCC GGG TTT GTT CCG ACC GCG CCT GTT GTC ATC CGA CGG TGC GGA AAG    96Pro Gly Phe Val pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys
         20                  25                  30GGC TTC TTG GGG GTC ACA AAG GCT GCC TTG ACA GGT CGG GAT            138Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp
     35                  40                  45(2)SEQ ID NO:108的信息:(i)序列特征:
(A)长度:46个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:108:Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro1               5                  10                  15Pro Gly Phe Val Pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys
         20                  25                  30Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp
     35                  40                  45(2)SEQ ID NO:109的信息:(i)序列特征:
(A)长度:395个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列9E3(xi)序列描述:SEQ ID NO:109:TGTATTTGTC CTGTTATACC TGATGAAGCT GGCTGAGGCA CGGTTGGTCC CGCTGATCTT    60GCTGCTGCTA TGGTGGTGGG TGAACCAGCT GGCAGTCCTA GGGCTGCCGG CTGTGGAAGC    120CGCCGTGGCA GGTGAGGTCT TCGCGGGCCC TGCCCTGTCC TGGTGTCTGG GACTCCCGGT    180CGTCAGTATG ATATTGGGTT TGGCAAACCT AGTGCTGTAC TTTAGATGGT TGGGACCCCA    240ACGCCTGATG TTCCTCGTGT TGTGGAAGCT TGCTCGGGGA GCTTTCCCGC TGGCCCTCTT    300GATGGGGATT TCGGCGACCC GCGGGCGCAC CTCAGTGCTC GGGGCCGAGT TCTGCTTCGA    360TGCTACATTC GAGGTGGACA CTTCGGTGTT GGGCT                               395(2)SEQ ID NO:110的信息:(i)序列特征:
(A)长度:460个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列10E3(xi)序列描述:SEQ ID NO:110:GCCCCTGGGC AACCAGGGCC GAGGCAACCC GGTGCGGTCG CCCTTGGGTT TTGGGTCCTA    60CGCCATGACC AGGATCCGAG ATACCCTACA TCTGGTGGAG TGTCCCACAC CAGCCATTGA    120GCCTCCCACC GGGACGTTTG GGTTCTTCCC CGGGACGCCG CCTCTCAACA ACTGCATGCT    180CTTGGGCACG GAAGTGTCCG AGGCACTTGG GGGGGCTGGC CTCACGGGGG GGTTCTATGA    240ACCCCTGGTG CGCAGGTGTT CGAAGCTGAT GGGAAGCCGA AATCCGGTTT GTCCGGGGTT    300TGCATGGCTC TCTTCGGGCA GGCCTGATGG GTTTATACAT GTCCAGGGTC ACTTGCAGGA    360GGTGGATGCA GGCAACTTCA TCCCGCCCCC GCGCTGGTTG CTCTTGGACT TTGTATTTGT    420CCTGTTATAC CTGATGAAGC TGGCTGAGGC ACGGTTGGTC                          460(2)SEQ ID NO:111的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE15F(xi)序列描述:SEQ ID NO:111:GCCGCCATGG AGGTCTCTGA CTTCCGTG                                  28(2)SEQ ID NO:112的信息:(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE15R(xi)序列描述:SEQ ID NO:112:GCGCGGATCC GCCCATCGCC CGCACAGTGG C                              31(2)SEQ ID NO:113的信息:(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE17F(xi)序列描述:SEQ ID NO:113:CGCTCCATGG GTGATGAGGT TCTCATCGGC G                                     31(2)SEQ ID NO:114的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE17R(xi)序列描述:SEO ID NO:114:GTAAGTCAGG ATCCCGACCT GTCAAGGC                                 28(2)SEQ ID NO:115的信息:(i)序列特征:
(A)长度:452个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:pGEX-HISb-GE3-s HGV质粒的含
      含有NCoI/ECoRI的片段(xi)序列描述:SEQ ID NO:115:CAAAATCGGA TCTGGTTCCG CGTGGTTCCA TGGTCTCATG GGACGCGGAC GCTCGTGCGC    60CCGCGATGGT CTATGGCCCT GGGCAAAGTG TTACCATTGA CGGGGAGCGC TACACCTTGC    120CTCATCAACT GAGGCTCAGG AATGTGGCAC CCTCTGAGGT TTCATCCGAG GTGTCCATTG    180ACATTGGGAC GGAGACTGAA GACTCAGAAC TGACTGAGGC CGATCTGCCG CCGGCGGCTG    240CTGCTCTCCA AGCGATCGAG AATGCTGCGA GGATTCTTGA ACCGCACATT GATGTCATCA    300TGGAGGACTG CAGTACACCC TCTCTTTGTG GTAGTAGCCG AGAGATGCCT GTATGGGGAG    360AAGACATCCC CCGTACTCCA TCGCCAGCAC TTATCGGATC CCACCATCAC CATCACCATT    420AGAATTCATC GTGACTGACT GACGATCTAC CT                                  452(2)SEQ ID NO:116的信息:(i)序列特征:
(A)长度:590个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列11E3(xi)序列描述:SEQ ID NO:116:AGCAATCGGC TGGGGTGACC CCATCACTTA TTGGAGCCAC GGGCAAAATC AGTGGCCCCT    60TTCATGCCCC CAGTATGTCT ATGGGTCTGC TACAGTCACT TGCGTGTGGG GTTCCGCTTC    120TTGGTTTGCC TCCACCAGTG GTCGCGACTC GAAGATAGAT GTGTGGAGTT TAGTGCCAGT    180TGGCTCTGCC ACCTGCACCA TAGCCGCACT TGGATCATCG GATCGCGACA CGGTGCCTGG    240GCTCTCCGAG TGGGGAATCC CGTGCGTGAC GTGTGTTCTG GACCGTCGGC CTGCCTCCTG    300CGGCACCTGT GTGAGGGACT GCTGGCCCGA GACCGGGTCG GTTAGGTTCC CATTCCATCG    360GTGCGGCGTG GGGCCTCGGC TGACAAAGGA CTTGGAAGCT GTGCCCTTCG TCAACAGGAC    420AACTCCCTTC ACCATTAGGG GGCCCCTGGG CAACCAGGGC CGAGGCAACC CGGTGCGGTC    480GCCCTTGGGT TTTGGGTCCT ACGCCATGAC CAGGATCCGA GATACCCTAC ATCTGGTGGA    540GTGTCCCACA CCAGCCATCG AGCCTCCCAC CGGGACGTTT GGGTTCTTCC               590(2)SEQ ID NO:117的信息:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:探针E3-111PROB(xi)序列描述:SEQ ID NO:117:TGGTGAAGGG AGTTGTCCTA TTGACGAAG                                   29(2)SEQ ID NO:118的信息:(i)序列特征:
(A)长度:735个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:共有序列12E3(xi)序列描述:SEQ ID NO:118:ATTGTTGTGC CCCGGAGGAC ATCGGGTTCT GCCTGGAGGG TGGATGCCTG GTGGCCCTGG    60GGTGCACGAT TTGCACTGAC CAATGCTGGC CACTGTATCA GGCGGGTTTG GCTGTGCGGC    120CTGGCAAGTC CGCGGCCCAA CTGGTGGGGG AGCTGGGTAG CCTATACGGG CCCCTGTCGG    180TCTCGGCCTA TGTGGCTGGG ATCCTGGGCC TGGGTGAGGT GTACTCGGGT GTCCTAACGG    240TGGGAGTCGC GTTGACGCGC CGGGTCTACC CGGTGCCTAA CCTGACGTGT GCAGTCGCGT    300GTGAGCTAAA GTGGGAAAGT GAGTTTTGGA GATGGACTGA ACAGCTGGCC TCCAACTACT    360GGATTCTGGA ATACCTCTGG AAGGTCCCAT TTGATTTCTG GAGAGGCGTG ATAAGCCTGA    420CCCCCTTGTT GGTTTGCGTG GCCGCATTGC TGCTGCTTGA GCAACGGATT GTCATGGTCT    480TCCTGTTGGT GACGATGGCC GGGATGTCGC AAGGCGCCCC TGCCTCCGTT TTGGGGTCAC    540GCCCCTTTGA CTACGGGTTG ACTTGGCAGA CCTGCTCTTG CAGGGCCAAC GGTTCGCGTT    600TTTCGACTGG GGAGAAGGTG TGGGACCGTG GGAACGTTAC GCTTCAGTGT GACTGCCCTA    660ACGGCCCCTG GGTGTGGTTG CCAGCCTTTT GCCAAGCAAT CGGCTGGGGT GACCCCATCA    720CTTATTGGAG CCACG                                                     735(2)SEQ ID NO:119的信息:(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470EXT4-2189R(xi)序列描述:SEQ ID NO:119:ATCTGTGGTA TGCCATCCCG GT                                          22(2)SEQ ID NO:120的信息:(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470EXT4-29F(xi)序列描述:SEQ ID NO:120:GTTATGCTAC TGTCGAAGCA GGT                                         23(2)SEQ ID NO:121的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GV57-4512MF(xi)序列描述:SEQ ID NO:121:GGACTTCCGG ATAGCTGARA AGCT                                     24(2)SEQ ID NO:122的信息:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型: DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GV57-4657MR(xi)序列描述:SEQ ID NO:122:GCRTCCACAC AGATGGCGCA                                          20(2)SEQ ID NO:123的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性  (ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:探针GV22dc-89MF(xi)序列描述:SEQ ID NO:123:CYCGCTGRTT TGGGGTGTAC TGGAAGGC                                    28(2)SEQ ID NO:124的信息:(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:5’UTR引物FV94-22F(xi)序列描述:SEQ ID NO:124:GAAAGCCCCA GAAACCGACG CCTATCTAAG T                               31(2)SEQ ID NO:125的信息:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无  (vi)原始来源:(C)各分离株:5’UTR引物FV94-724R(xi)序列描述:SEQ ID NO:125:GCACAGCCAA ACCCGCCTGA TACAGT                                       26(2)SEQ ID NO:126的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:5’-UTR引物FV94-94F(xi)序列描述:SEQ ID NO:126:GTGGTGGATG GGTGATGACA GGGTTGGT                                    28(2)SEQ ID NO:127的信息:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:5’-UTR引物FV94-912R  (xi)序列描述:SEQ ID NO:127:TAACTCACAC GCGACTGCAC ACGTCAGGT                                  29(2)SEQ ID NO:128的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:ENV文库引物GEP-F15(xi)序列描述:SEQ ID NO:128:GCGGCCATGG TGCCCTTCGT CAATAGGACA                                  30(2)SEQ ID NO:129的信息:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:ENV文库引物GEP-R15(xi)序列描述:SEQ ID NO:129:CTTGCCATGG CCAGCTGGTT CACCCACCA                                    29(2)SEQ ID NO:130的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GEP-F17(xi)序列描述:SEQ ID NO:130:GCAGGATCCC CTCTGGAAGG TCCCATTTGA                                 30(2)SEQ ID NO:131的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GEP-R16(xi)序列描述:SEQ ID NO:131:TGCGAATCCT CGGCCCTGGT TGCCCAG                                     27(2)SEQ ID NO:132的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470ep-F9(xi)序列描述:SEQ ID NO:132:GCTAGATCTG GCAACATGGG GCACAAGGTC                                  30(2)SEQ ID NO:133的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470ep-R9(xi)序列描述:SEQ ID NO:133:CACAGATCTC GCGTAGTAGT AGCGTCCAGA                                  30(2)SEQ ID NO:134的信息:(i)序列特征:
(A)长度:38个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性  (ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:种族(Race)PCR的AP引物(xi)序列描述:SEQ ID NO:134:CTGGTTCGGC CCACCTCTGA AGGTTCCAGA ATCGATAG                         38(2)SEQ ID NO:135的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GEP-F10(xi)序列描述:SEQ ID NO:135:GCTGGATCCA GCATGGGAAC ATGCTTGAAC                                  30(2)SEQ ID NO:136的信息:(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无  (vi)原始来源:
(C)各分离株:引物GEP-R10(xi)序列描述:SEQ ID NO:136:CGCGGATCCC ACAGTGGCCA CTGAGGGGTT                                  30(2)SEQ ID NO:137的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物EXY10-F1(xi)序列描述:SEQ ID NO:137:GCCCATATGG TGATCACTGG TGACGTT                                     27(2)SEQ ID NO:138的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物EXY10-F2  (xi)序列描述:SEQ ID NO:138:GCCCATATGC TGGGTTACGG TGAA                                       24(2)SEQ ID NO:139的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物EXY10-F3(xi)序列描述:SEQ ID NO:139:GCCCATATGA CCTCCGCCTA TAAGCTG                                     27(2)SEQ ID NO:140的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物EXY10-R1(xi)序列描述:SEQ ID NO:140:GCCCATATGA GCCGCCGGCG GCAGATC                                     27(2)SEQ ID NO:141的信息:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物EXY5-R1(xi)序列描述:SEQ ID NO:141:TGCGGATCCC ACATTGTCTG GATT                                       24(2)SEQ ID NO:142的信息:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物Y5-5-F1(xi)序列描述:SEQ ID NO:142:TCGGCCATGG CCTATTGTGA CAAGGTG                                     27(2)SEQ ID NO:143的信息:(i)序列特征:
(A)长度:219个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:抗原克隆Q7-12-1(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..219(xi)序列描述:SEQ ID NO:143:GTG CCC TTC GTC AAT AGG ACA ACT CTC TTC ACC ATT AGG GGG CCC CTG    48Val Pro Phe Val Asn Arg Thr Thr Leu Phe Thr Ile Arg Gly Pro Leu1               5                  10                  15GGC AAC CAG GGC CGA GGC AAC CCG GTG CGG TCG CCC TTG GGT TTT GGG    96Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly
         20                  25                  30TCC TAC GCC ATG ACC AGG ATC CGA GAT ACC CTA CAT CTG GTG GAG TGT    144Ser Tyr Ala Met Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys
     35                  40                  45CCC ACA CCA GCC ATC GAG CCT CCC ACC GGG ACG TCT GGG TTC TTC CCC    192Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Ser Gly Phe Phe Pro
 50                  55                  60GGG ACG CCG CCT CTC AAC AGC TGC ATG                                 219Gly Thr Pro Pro Leu Asn Ser Cys Met65                  70(2)SEQ ID NO:144的信息:(i)序列特征:
(A)长度:73个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性  (ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:144:Val Pro Phe Val Asn Arg Thr Thr Leu Phe Thr Ile Arg Gly Pro Leu1               5                  10                  15Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly
         20                  25                  30Ser Tyr Ala Met Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys
     35                  40                  45Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Ser Gly Phe Phe Pro
 50                  55                  60Gly Thr Pro Pro Leu Asn Ser Cys Met65                  70(2)SEQ ID NO:145的信息:(i)序列特征:
(A)长度:264个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:抗原克隆Y12-10-3(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..264(xi)序列描述:SEQ ID NO:145:CCC CTC GAG CGG ATG CGA ACC GGA AGG CAC CTC GTG TTC TGC CAT TCT    48Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser1                5                 10                  15AAG GCT GAG TGC GAG CGC CTT GCT GGC CAG TTC TCC GCT AGG GGG GTC    96Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val
         20                  25                  30AAT GCC ATT GCC TAT TAT AGG GGT AAA GAC AGC TCT ATC ATC AAG GAT    144Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp
     35                  40                  45GGG GAC CTG GTG GTC TGT GCT ACA GAC GCG CTT TCC ACT GGG TAC ACT    192Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr
 50                  55                  60GGA AAT TTC GAC TCC GTC ACC GAC TGT GGA TTA GTG GTG GAG GAG GTC    240Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val65                  70                  75                  80GTT GAG GTG ACC CTT GAT CCC ACC                                    264Val Glu Val Thr Leu Asp Pro Thr
             85(2)SEQ ID NO:146的信息:(i)序列特征:
(A)长度:88个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:146:Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser1               5                  10                  15Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val
         20                  25                      30Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp
     35                  40                  45Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr
 50                  55                  60Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val65                  70                  75                  80Val Glu Val Thr Leu Asp Pro Thr
             85(2)SEQ ID NO:147的信息:(i)序列特征:
(A)长度:205个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:cDNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:抗原克隆Y12-15-1(ix)特性:
(A)名称/关键词:CDS
(B)位置:1..205(xi)序列描述:SEQ ID NO:147:GCT AGA TCT GGC AAC ATG GGG CAC AAG GTC TTA ATC TTG AAC CCC TCA    48Ala Arg Ser Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser1               5                  10                  1SGTG GCC ACT GTG CGG GCC ATG GGC CCG TAC ATG GAG CGG CTG GCG GGT    96Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly
         20                  25                  30AAA CAT CCA AGT ATA TAC TGT GGG CAT GAT ACA ACT GCT TTC ACA AGG    144Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg
     35                  40                  45ATC ACT GAC TCC CCC CTG ACG TAT TCA ACC TAT GGG AGG TTT TTG GCC    192Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala
 50                  55                  60AAC CCT AGG CAG A                                                  205Asn Pro Arg Gln65(2)SEQ ID NO:148的信息:(i)序列特征:
(A)长度:68个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:148:Ala Arg Ser Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser1               5                  10                  15Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly
         20                  25                  30Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg
     35                  40                   45Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala
50                  55                  60Asn Pro Arg Gln65(2)SEQ ID NO:149的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE4F(xi)序列描述:SEQ ID NO:149:GCCGCCATGG CTCTCCAAGC GATCGAGAAT GC                               32(2)SEQ ID NO:150的信息:(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物GE4R(xi)序列描述:SEQ ID NO:150:GCGCGGATCC CAACCCCAAT GAGAAAAAGC G                                31(2)SEQ ID NO:151的信息:(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470EXP3F(xi)序列描述:SEQ ID NO:151:CCGCCATGGG ACGCGGACGC TCG                                         23(2)SEQ ID NO:152的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物470EXP3R(xi)序列描述:SEQ ID NO:152:CGCGGATCCT TACTGTCTTA TTGCTTCC                                    28(2)SEQ ID NO:153的信息:(i)序列特征:
(A)长度:34个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物FV94-2888F(xi)序列描述:SEQ ID NO:153:GCGGAATTCT TGGCTCGGGT GGTTGAGTGC TGTG                             34(2)SEQ ID NO:154的信息:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无  (iv)反义:无(vi)原始来源:
(C)各分离株:引物FV94-3216R(xi)序列描述:SEQ ID NO:154:GCGAAGCTTC CGTCGGATGA CAACAGGCGC CG                               32(2)SEQ ID NO:155的信息:(i)序列特征:
(A)长度:36个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物FV94-6521F(xi)序列描述:SEQ ID NO:155:GCGGAATTCA CCTCCGCCTA TAAGCTGCTG CGCCAG                            36(2)SEQ ID NO:156的信息:(i)序列特征:
(A)长度:42个碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:线性
(ii)分子类型:DNA(iii)假设:无(iv)反义:无(vi)原始来源:
(C)各分离株:引物FV94-7483R
(xi)序列描述:SEQ ID NO:156:GCTGCGGCCG CCCTCCGTCC CACATTGTCT GGATTGGTAA CA                             42(2)SEQ ID NO:157的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物T7F
(xi)序列描述:SEQ ID NO:157:ATTAATACGA CTCACTATAG GG                                                   22(2)SEQ ID NO:158的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:引物T7R
(xi)序列描述:SEQ ID NO:158:CAAGGGGTTA TGCTAGTTAT TG                                                   22(2)SEQ ID NO:159的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:抗原克隆GE4-8
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:1..402
(xi)序列描述:SEQ ID NO:159:GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT       48Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile1               5                  10                  15GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC       96Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser
         20                  25                  30CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA      144Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro
     35                  40                  45GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG      192Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser
 50                  55                  60GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC      240Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val65                  70                  75                  80ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG      288Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val
             85                  90                  95GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG         336Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg
        100                 105                 110AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC         384Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg
    115                 120                 125TTT TTC TCA TTG GGG TTG                                                 402Phe Phe Ser Leu Gly Leu
130(2)SEQ ID NO:160的信息:
(i)序列特征:
   (A)长度:134个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:160:Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile1               5                  10                  15Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser
         20                 25                   30Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro
     35                  40                  45Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser
 50                  55                  60Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val65                  70                  75                  80Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val
             85                  90                  95Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg
        100                 105                 110Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg
    115                 120                 125Phe Phe Ser Leu Gly Leu
130(2)SEQ ID NO:161的信息:
(i)序列特征:
   (A)长度:1011个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:抗原克隆EXP3-7
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:1..1011
(xi)序列描述:SEQ ID NO:161:ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC        48Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr1               5                  10                  15ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT        96Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val
         20                  25                  30TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA       144Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu
     35                  40                  45CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC       192Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile
 50                  55                  60GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG        240Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu65                  70                  75                  80GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA        288Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val
             85                  90                  95TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA GCA CTT ATC TCG GTT        336Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val
        100                 105                 110ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG        384Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln
    115                 120                 125GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC ATC CAA GAG TCC GAG        432Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu
130                 135                 140ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG GCT CTT TCC GTA TTA        480Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu145                 150                 155                 160AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG        528Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys
            165                 170                 175ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG        576Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly
        180                 185                 190TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC        624Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn
    195                 200                 205CAT ACA GCC TAT TGT GAC CAG GTG CGC ACT CCG CTT GAA TTG CAG GTT        672His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val
210                 215                 220GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG        720Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu225                 230                 235                 240GCT AGG CAA GAA ACC TTG GCC TCC TTC TCT TAC ATT TGG TCT GGA GTG        768Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val
            245                 250                 255CCG CTG ACT AGG GCC ACG CCG GCC AAG CCT CCC GTG GTG AGG CCG GTT        816Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val
        260                 265                 270GGC TCT TTG TTA GTG GCC GAC ACT ACT AAG GTG TAT GTT ACC AAT CCA        864Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro
    275                 280                 285GAC AAT GTG GGA CGG AGG GTG GAC AAG GTG ACC TTC TGG CGT GCT CCT        912Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro
290                 295                 300AGG GTT CAT GAT AAG TAC CTC GTG GAC TCT ATT GAG CGC GCT AAG AGG        960Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg305                 310                 315                 320GCC GCT CAA GCC TGC CTA AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA       1008Ala Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile
            325                 330                 335AGG                                                                   1011Arg(2)SEQ ID NO:162的信息:
(i)序列特征:
   (A)长度:337个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:162:Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr1               5                  10                  15Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val
         20                  25                  30Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu
     35                  40                  45Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile
  50                 55                  60Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu65                  70                  75                  80Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val
             85                  90                  95Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val
        100                 105                 110Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln
    115                 120                 125Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu
130                 135                 140Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu145                 150                 155                 160Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys
            165                 170                 175Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly
        180                 185                 190Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn
    195                 200                 205His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val
210                 215                 220Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu225                 230                 235                 240Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val
            245                 250                 255Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val
        260                 265                 270Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro
    275                 280                 285Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro
290                 295                 300Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg305                 310                 315                 320Ala Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile
            325                 330                  335Arg(2)SEQ ID NO:163的信息:
(i)序列特征:
   (A)长度:351个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:抗原克隆GENS2b-1
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:1..351
(xi)序列描述:SEQ ID NO:163:TTG GCT CGG GTG GTT GAG TGC TGT GTG ATG GCG GGT GAG AAG GCC ACA        48Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr1               5                  10                  15ACC GTC CGG CTG GTC TCC AAG ATG TGT GCG AGA GGA GCT TAT TTG TTC        96Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe
         20                  25                  30GAT CAT ATG GGC TCT TTT TCG CGT GCT GTC AAG GAG CGC CTG TTG GAA       144Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu
     35                  40                  45TGG GAC GCA GCT CTT GAA CCT CTG TCA TTC ACT AGG ACG GAC TGT CGC       192Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg
 50                  55                  60ATC ATA CGG GAT GCC GCG AGG ACT TTG TCC TGC GGG CAG TGC GTC ATG       240Ile Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met65                  70                  75                  80GGT TTA CCC GTG GTT GCG CGC CGT GGT GAT GAG GTT CTC ATC GGC GTC       288Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val
             85                  90                  95TTC CAG GAT GTG AAT CAT TTG CCT CCC GGG TTT GTT CCG ACC GCG CCT       336Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro
        100                 105                 110GTT GTC ATC CGA CGG                                                   351Val Val Ile Arg Arg
    115(2)SEQ ID NO:164的信息:
(i)序列特征:
   (A)长度:117个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:164:Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr1               5                  10                  15Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe
         20                  25                  30Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu
     35                  40                  45Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg
 50                  55                  60Ile Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met65                  70                  75                  80Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val
             85                  90                  95Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro
        100                 105                 110Val Val Ile Arg Arg
    115(2)SEQ ID NO:165的信息:
(i)序列特征:
   (A)长度:993个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:抗原克隆GENS5a-3
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:1..993
(xi)序列描述:SEQ ID NO:165:ACC TCC GCC TAT AAG CTG CTG CGC CAG CAA ATC CTA TCG GCT GCT GTA        48Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val1               5                  10                  15GCT GAG CCC TAC TAC GTC GAC GGC ATT CCG GTC TCA TGG GAC GCG GAC        96Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp
         20                  25                  30GCT CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT       144Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile
     35                  40                  45GAC GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG       192Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val
 50                  55                  60GCA CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG       240Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu65                  70                  75                  80ACT GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT       288Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala
             85                  90                  95GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT       336Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile
        100                 105                 110GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC       384Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser
    115                 120                 125CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA       432Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro
130                 135                 140GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG       480Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser145                 150                 155                 160GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC       528Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val
            165                 170                 175ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG       576Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val
        180                 185                 190GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG       624Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg
    195                 200                 205AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC       672Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg
210                 215                 220TTT TTC TCA TTG GGG TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG       720Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu225                 230                 235                 240ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC CAG GTG CGC ACT CCG       768Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro
            245                 250                 255CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA       816Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu
        260                 265                 270TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG GCC TCC TTC TCT TAC       864Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr
    275                 280                 285ATT TGG TCT GGA GTG CCG CTG ACT AGG GCC ACG CCG GCC AAG CCT CCC       912Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro
290                 295                 300GTG GTG AGG CCG GTT GGC TCT TTG TTA GTG GCC GAC ACT ACT AAG GTG       960Val Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val305                 310                 315                 320TAT GTT ACC AAT CCA GAC AAT GTG GGA CGG AGG                           993Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg
            325                 330(2)SEQ ID NO:166的信息:
(i)序列特征:
   (A)长度:331个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:166:Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val1               5                  10                  15Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp
         20                  25                  30Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile
     35                  40                  45Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val
50                   55                  60Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu65                  70                  75                  80Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala
             85                  90                  95Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile
        100                 105                 110Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser
    115                 120                 125Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro
130                 135                 140Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser145                 150                 155                 160Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val
            165                 170                 175Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val
        180                 185                 190Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg
    195                 200                 205Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg
210                 215                 220Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu225                 230                 235                 240Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro
            245                 250                 255Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu
        260                 265                 270Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr
    275                 280                 285Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro
290                 295                 300Val Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val305                 310                 315                 320Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg
            325                 330(2)SEQ ID NO:167的信息:
(i)序列特征:
   (A)长度:536个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:共有序列3’-末端
(xi)序列描述:SEQ ID NO:167:CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA       60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA      120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTATCCCGG GGGGTTTCCC TCTCTCCCCC      180CCCTATATGG GGGTGGTACA TCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG      240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC      300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT      360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC      420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA      480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGC          536(2)SEQ ID NO:168的信息:
(i)序列特征:
   (A)长度:594个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:单个克隆MP3-3
(xi)序列描述:SEQ ID NO:168:CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA      60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA     120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTATCCCGG GGGGTTTCCC TCTCTCCCCC     180CCCTATATGG GGGTGGTACA CCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG     240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC     300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT     360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC     420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA     480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGCACTG     540TGATCTGAAG GGGTGCACCC CGGGAAGAGC TCGGCCCGAA GGCCGGCTTC TACT           594(2)SEQ ID NO:169的信息:
(i)序列特征:
   (A)长度:594个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:单个克隆MP3-7(xi)序列描述:SEQ ID NO:169:CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA      60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA     120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTGTCCCGG GGGGTTTCCC TCTCTCCCCC     180CCCTATATGG GGGTGGTACA CCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG     240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC     300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT     360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC     420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA     480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGCACTG     540TGATCTGAAG GGGTGCACCC CGGTAAGAGC TCGGCCCGAA GGCCGGGTTC TACT           594(2)SEQ ID NO:170的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV5446IRT
(xi)序列描述:SEQ ID NO:170:CGGTCCCTCG AACTCCAGCG AGTCTTTTTT TTTTTTTTT                             39(2)SEQ ID NO:171的信息:
(i)序列特征:
   (A)长度:24个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV59-5446F
(xi)序列描述:SEQ ID NO:171:CTGAGCGACC TCAAGCTCCC TGGC                                             24(2)SEQ ID NO:172的信息:
(i)序列特征:
   (A)长度:24个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV-5446IR
(xi)序列描述:SEQ ID NO:172:CGGTCCCTCG AACTCCAGCG AGTC                                             24(2)SEQ ID NO:173的信息:
(i)序列特征:
   (A)长度:23个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:探针E5-7-PRB
(xi)序列描述:SEQ ID NO:173:CGTAGCCCTC GGGTGAACTA AAT                                              23(2)SEQ ID NO:174的信息:
(i)序列特征:
   (A)长度:35个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:种族锚序列
(xi)序列描述:SEQ ID NO:174:CACGAATTCA CTATCGATTC TGGAACCTTC AGAGG                                 35(2)SEQ ID NO:175的信息:
(i)序列特征:
   (A)长度:736个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:共有序列5’-末端
(xi)序列描述:SEQ ID NO:175:ACGTGGGGGA GTTGATCCCC CCCCCCCGGC ACTGGGTGCA AGCCCCAGAA ACCGACGCCT      60ATCTAAGTAG ACGCAATGAC TCGGCGCCGA CTCGGCGACC GGCCAAAAGG TGGTGGATGG     120GTGATGACAG GGTTGGTAGG TCGTAAATCC CGGTCACCTT GGTAGCCACT ATAGGTGGGT     180CTTAAGAGAA GGTTAAGATT CCTCTTGTGC CTGCGGCGAG ACCGCGCACG GTCCACAGGT     240GTTGGCCCTA CCGGTGGGAA TAAGGGCCCG ACGTCAGGCT CGTCGTTAAA CCGAGCCCGT     300TACCCACCTG GGCAAACGAC GCCCACGTAC GGTCCACGTC GCCCTTCAAT GTCTCTCTTG     360ACCAATAGGC GTAGCCGGCG AGTTGACAAG GACCAGTGGG GGCCGGGGGC TTGGAGAGGG     420ACTCCAAGTC CCGCCCTTCC CGGTGGGCCG GGAAATGCAT GGGGCCACCC AGCTCCGCGG     480CGGCCTGCAG CCGGGGTAGC CCAAGAATCC TTCGGGTGAG GGCGGGTGGC ATTTCCTTTT     540TCTATACCAT CATGGCAGTC CTTCTGCTCC TTCTCGTGGT TGAGGCCGGG GCCATTCTGG     600CCCCGGCCAC CCACGCTTGT CGAGCGAATG GGCAATATTT CCTCACAAAT TGTTGTGCCC     660CGGAGGACAT CGGGTTCTGC CTGGAGGGTG GATGCCTGGT GGCCCTGGGG TGCACGATTT     720GCACTGACCA ATGCTG                                                     736(2)SEQ ID NO:176的信息:
(i)序列特征:
   (A)长度:688个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iV)反义:无
(Vi)原始来源:
   (C)各分离株:HGV变异体BG34
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:272..688
(xi)序列描述:SEQ ID NO:176:GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGA CAGGGTTGGT      60AGGTCGTAAA TCCCGGTCAC CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG     120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGT     180GAATAAGGGC CCGACGTCAG GCTCGTCGTT AAACCGAGCC CGTCACCCAC CTGGGCAAAC     240GACGCCCACG TACGGTCCAC GTCGCCCTTC A ATG CCT CTC TTG GCC AAT AGG        292
                               Met Pro Leu Leu Ala Asn Arg
                                 1               5AGT ATC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGA GTC ACG GGG       340Ser Ile Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Val Thr Gly
     10                  15                  20ATG GAC CCC GGG CTC TGC CCT TCC CGG TGG AAC GGG AAA CGC ATG GGG       388Met Asp Pro Gly Leu Cys Pro Ser Arg Trp Asn Gly Lys Arg Met Gly
 25                  30                  35CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ACC CTT       436Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Thr Leu40                  45                  50                  55CGG GTG AGG GCG GGT GGC ATT TCT CTT TTC TGT ATC ATC ATG GCA GTC       484Arg Val Arg Ala Gly Gly Ile Ser Leu Phe Cys Ile Ile Met Ala Val
             60                  65                  70CTC CTG CTC CTT CTC GTG GTT GAG GCC GGG GCC ATT CTG GCC CCG GCC       532Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala
         75                  80                  85ACC CAC GCT TGT CGA GCG AAT GGA CAA TAT TTC CTC ACA AAC TGT TGC       580Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys
     90                  95                 100GCC CTC GAG GAC ATC GGG TTC TGC CTG GAA GGC GGG TGC CTG GTG GCC       628Ala Leu Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala
105                 110                 115TTA GGG TGC ACC ATT TGC ACT GAC CGT TGC TGG CCA CTG TAT CAG GCG       676Leu Gly Cys Thr Ile Cys Thr Asp Arg Cys Trp Pro Leu Tyr Gln Ala120                 125                 130                 135GGT TTG GCT GTG                                                       688Gly Leu Ala Val(2)SEQ ID NO:177的信息:
(i)序列特征:
   (A)长度:139个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:177:Met Pro Leu Leu Ala Asn Arg Ser Ile Arg Arg Val Asp Lys Asp Gln1               5                  10                  15Trp Gly Pro Gly Val Thr Gly Met Asp Pro Gly Leu Cys Pro Ser Arg
         20                  25                  30Trp Asn Gly Lys Arg Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
     35                  40                  45Arg Gly Ser Pro Arg Thr Leu Arg Val Arg Ala Gly Gly Ile Ser Leu
 50                  55                  60Phe Cys Ile Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala65                  70                  75                  80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln
             85                  90                  95Tyr Phe Leu Thr Asn Cys Cys Ala Leu Glu Asp Ile Gly Phe Cys Leu
        100                 105                 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Arg
    115                 120                 125Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val
130                 135(2)SEQ ID NO:178的信息:
(i)序列特征:
   (A)长度:663个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV变异体T55806
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:271..663
(xi)序列描述:SEQ ID NO:178:GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGC CAGGGTTGGT     60AGGTCGTAAA TCCCGGTCAT CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG    120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGG    180AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC TGGGCAAACG    240ACGCTCACGT ACGGTCCACG TCGCCCTTCA ATG TCT CTC TTG ACC AAT AGG TTT     294
                             Met Ser Leu Leu Thr Asn Arg Phe
                               1               5ATC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGG GTT ACG GGG ACG      342Ile Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Val Thr Gly Thr
 10                  15                  20GAC CCC GAA CCC TGC CCT TCC CGG TGG GCC GGG AAA TGC ATG GGG CCA      390Asp Pro Glu Pro Cys Pro Ser Arg Trp Ala Gly Lys Cys Met Gly Pro25                  30                  35                  40CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC CTT CGG       438Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile Leu Arg
             45                  50                  55GTG AGG GCG GGT GGC ATT TCT CTT TTC TAT ACC ATC ATG GCA GTC CTT       486Val Arg Ala Gly Gly Ile Ser Leu Phe Tyr Thr Ile Met Ala Val Leu
         60                  65                  70CTG CTC TTC TTC GTG GTT GAG GCC GGG GCG ATT CTC GCC CCG GCC ACC       534Leu Leu Phe Phe Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala Thr
     75                  80                  85CAC GCT TGT CGG GCG AAT GGG CAA TAT TTC CTC ACA AAT TGT TGC GCC       582His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys Ala
 90                  95                 100CCA GAG GAT GTT GGG TTC TGC CTG GAG GGC GGA TGC CTG GTG GCT CTG       630Pro Glu Asp Val Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala Leu105                 110                 115                 120GGG TGT ACG ATT TGC ACT GAC CGT TGC TGG CCA                           663Gly Cys Thr Ile Cys Thr Asp Arg Cys Trp Pro
            125                 130(2)SEQ ID NO:179的信息:
(i)序列特征:
   (A)长度:131个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:179:Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1               5                  l0                  15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg
         20                  25                  30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
     35                  40                  45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu
 50                  55                  60Phe Tyr Thr Ile Met Ala Val Leu Leu Leu Phe Phe Val Val Glu Ala65                  70                  75                  80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln
             85                  90                  95Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Val Gly Phe Cys Leu
        100                 105                 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Arg
    115                 120                 125Cys Trp Pro
130(2)SEQ ID NO:180的信息:
(i)序列特征:
   (A)长度:632个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV变异体EB20-2
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:271..632
(xi)序列描述:SEQ ID NO:180:GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGC CAGGGTTGGT      60AGGTCGTAAA TCCCGGTCAT CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG     120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGT     180AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC TGGGCAAACG     240ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATG CCT CTC TTG GCC AAT AGG AGT      294
                             Met Pro Leu Leu Ala Asn Arg Ser
                               l               5TAT CTC CGG CGA GTT GGC AAG GAC CAG TGG GGG CCG GGG GTT ACG GGG       342Tyr Leu Arg Arg Val Gly Lys Asp Gln Trp Gly Pro Gly Val Thr Gly
 10                  15                  20AAG GAC CCC GAA CCC TGC CCT TCC CGG TGG GCC GGG AAA TGC ATG GGG       390Lys Asp Pro Glu Pro Cys Pro Ser Arg Trp Ala Gly Lys Cys Met Gly25                  30                  35                  40CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AAA AAC CTT       438Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Lys Asn Leu
             45                  50                  55CGG GTG AGG GCG GGT GGC ATT TTC TTT TCC TAT ACC ATC ATG GCA GTC       486Arg Val Arg Ala Gly Gly Ile Phe Phe Ser Tyr Thr Ile Met Ala Val
         60                  65                  70CTT CTG CTC CTT CTC GTG GTT GAG GCC GGG GCC ATT TTG GCC CCG GCC       534Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala
     75                  80                  85ACC CAC GCT TGC AGA GCT AAT GGG CAA TAT TTC CTC ACA AAC TGT TGT       582Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys
 90                  95                 100GCC TTG GAG GAC ATC GGG TTC TGC CTG GAA GGC GGA TGC TTG GTG GCG CT    632Ala Leu Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala105                 110                 115                 120(2)SEQ ID NO:181的信息:
(i)序列特征:
   (A)长度:120个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:181:Met Pro Leu Leu Ala Asn Arg Ser Tyr Leu Arg Arg Val Gly Lys Asp1               5                  10                  15Gln Trp Gly Pro Gly Val Thr Gly Lys Asp Pro Glu Pro Cys Pro Ser
         20                  25                  30Arg Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys
     35                  40                  45Ser Arg Gly Ser Pro Lys Asn Leu Arg Val Arg Ala Gly Gly Ile Phe
 50                  55                  60Phe Ser Tyr Thr Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu65                  70                  75                  80Ala Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly
             85                  90                  95Gln Tyr Phe Leu Thr Asn Cys Cys Ala Leu Glu Asp Ile Gly Phe Cys
        100                 105                 110Leu Glu Gly Gly Cys Leu Val Ala
    ll5                 120(2)SEQ ID NO:182的信息:
(i)序列特征:
   (A)长度:9103个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-JC变异体
(ix)特性:
   (A)名称/关键词:CDS
   (B)位置:276..9005
(xi)序列描述:SEQ ID NO:182:CAATGACTCG GCGCCGACTC GGCGACCGGC CAAAAGGTGG TGGATGGGTG ATGACAGGGT      60TGGTAGGTCG TAAATCCCGG TCACCTTGGT AGCCACTATA GGTGGGTCTT AAGAGAAGGT     120TAAGATTCCT CTTGTGCCTG CGGCGAGACC GCGCACGGTC CACAGGTGTT GGCCCTACCG     180GTGGGAATAA GGGCCCGACG TCAGGCTCGT CGTTAAACCG AGCCCGTAAC CCGCCTGGGC     240AAACGACGCC CACGTACGGT CCACGTCGCC CTTCA ATG TCG CTC TTG ACC AAT        293
                                   Met Ser Leu Leu Thr Asn
                                     1               5AGG CTT AGC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGG TTT ATG       341Arg Leu Ser Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Phe Met
         10                  15                  20GGG AAG GAC CCC AAA CCC TGC CCT TCC CGG CGG ACC GGG AAA TGC ATG       389Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg Arg Thr Gly Lys Cys Met
     25                  30                  35GGG CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC       437Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile
 40                  45                  50CTT CGG GTG AGG GCG GGT GGC ATT TCT CTT CCT TAT ACC ATC ATG GAA       485Leu Arg Val Arg Ala Gly Gly Ile Ser Leu Pro Tyr Thr Ile Met Glu55                  60                  65                  70GCC CTC CTG TTC CTC CTC GGG GTG GAG GCC GGG GCC ATT CTG GCC CCG       533Ala Leu Leu Phe Leu Leu Gly Val Glu Ala Gly Ala Ile Leu Ala Pro
             75                  80                  85GCC ACC CAC GCT TGT CGA GCG AAT GGG CAA TAT TTC CTC ACA AAC TGT       581Ala Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys
         90                  95                 100TGT GCT CCA GAG GAC ATT GGG TTC TGC CTC GAA GGC GGT TGC CTT GTG       629Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val
    105                 110                 115GCC CTG GGG TGC ACA GTT TGC ACT GAC CGA TGC TGG CCG CTG TAT CAG       677Ala Leu Gly Cys Thr Val Cys Thr Asp Arg Cys Trp Pro Leu Tyr Gln
120                 125                 130GCG GGC TTG GCT GTG CGG CCT GGC AAG TCC GCA GCC CAG CTG GTG GGG       725Ala Gly Leu Ala Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val Gly135                 140                 145                 150CAA CTG GGT GGC CTC TAC GGG CCC TTG TCG GTG TCG GCC TAC GTG GCC       773Gln Leu Gly Gly Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val Ala
            155                 160                 165GGC ATC CTG GGC CTG GGT GAG GTG TAC TCG GGT GTC CTA ACA GTT GGT       821Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val Gly
        170                 175                 180GTT GCG TTG ACG CGC CGG GTC TAC CCG ATG CCC AAC CTG ACG TGT GCA       869Val Ala Leu Thr Arg Arg Val Tyr Pro Met Pro Asn Leu Thr Cys Ala
    185                 190                 195GTA GAG TGT GAG CTT AAG TGG GAA AGT GAG TTT TGG AGA TGG ACT GAG       917Val Glu Cys Glu Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr Glu
200                 205                 210CAG CTG GCC TCC AAT TAC TGG ATT CTG GAA TAC CTT TGG AAG GTC CCG       965Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val Pro215                 220                 225                 230TTT GAC TTC TGG AGA GGC GTG CTA AGC CTG ACT CCC TTG CTG GTT TGC      1013Phe Asp Phe Trp Arg Gly Val Leu Ser Leu Thr Pro Leu Leu Val Cys
            235                 240                 245GTG GCC GCG TTG CTG CTG CTG GAG CAA CGG ATT GTC ATG GTC TTC CTG      1061Val Ala Ala Leu Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe Leu
        250                 255                 260TTG GTG ACG ATG GCC GGG ATG TCG CAA GGC GCT CCG GCC TCC GTT TTG      1109Leu Val Thr Met Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val Leu
    265                 270                  275GGG TCT CGC CCC TTT GAC TAC GGG TTG ACA TGG CAG TCT TGT TCC TGC      1157Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr Trp Gln Ser Cys Ser Cys
280                 285                 290AGG GCT AAT GGG TCG CGC TAT ACT ACT GGG GAG AAG GTG TGG GAC CGT      1205Arg Ala Asn Gly Ser Arg Tyr Thr Thr Gly Glu Lys Val Trp Asp Arg295                 300                 305                 310GGG AAC GTC ACG CTC CTG TGT GAC TGC CCC AAC GGC CCC TGG GTG TGG      1253Gly Asn Val Thr Leu Leu Cys Asp Cys Pro Asn Gly Pro Trp Val Trp
            315                 320                 325TTG CCG GCC TTT TGC CAA GCA ATC GGC TGG GGC GAT CCC ATC ACT CAT      1301Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr His
        330                 335                 340TGG AGC CAC GGC CAA AAT CGG TGG CCC CTC TCA TGC CCC CAG TAT GTC      1349Trp Ser His Gly Gln Asn Arg Trp Pro Leu Ser Cys Pro Gln Tyr Val
    345                 350                 355TAT GGG TCT GTT TCA GTC ACT TGC GTG TGG GGT TCC GTC TCT TGG TTT      1397Tyr Gly Ser Val Ser Val Thr Cys Val Trp Gly Ser Val Ser Trp Phe
360                 365                 370GCC TCG ACT GGC GGT CGC GAC TCG AAG ATC GAT GTG TGG AGT CTG GTG      1445Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu Val375                 380                 385                 390CCG GTT GGT TCC GCC AGC TGC ACC ATA GCC GCT CTT GGA TCG TCG GAT      1493Pro Val Gly Ser Ala Ser Cys Thr Ile Ala Ala Leu Gly Ser Ser Asp
            395                 400                 405CGG GAC ACG GTA GTT GAG CTC TCC GAG TGG GGA GTC CCG TGC GCA ACG      1541Arg Asp Thr Val Val Glu Leu Ser Glu Trp Gly Val Pro Cys Ala Thr
        410                 415                 420TGC ATT CTG GAT CGT CGG CCG GCC TCG TGC GGC ACC TGT GTG AGA GAC      1589Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg Asp
    425                 430                 435TGC TGG CCC GAA ACC GGG TCG GTT AGG TTT CCA TTC CAT CGG TGC GGC      1637Cys Trp Pro Glu Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys Gly
440                 445                 450GCG GGG CCT AAG CTG ACA AAG GAC TTG GAA GCT GTG CCC TTC GTC AAT      1685Ala Gly Pro Lys Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val Asn455                 460                 465                 470AGG ACA ACT CCC TTC ACC ATA AGG GGC CCC CTG GGC AAC CAG GGG AGA      1733Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly Arg
            475                 480                 485GGC AAC CCG GTG CGG TCG CCC TTG GGT TTT GGG TCC TAC GCC ATG ACC      1781Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met Thr
        490                 495                 500AAG ATC CGA GAC TCC TTA CAT TTG GTG AAA TGT CCC ACA CCA GCC ATT      1829Lys Ile Arg Asp Ser Leu His Leu Val Lys Cys Pro Thr Pro Ala Ile
    505                 510                 515GAG CCT CCC ACC GGG ACG TTT GGG TTC TTC CCC GGA GTG CCG CCT CTT      1877Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe Pro Gly Val Pro Pro Leu
520                 525                 530AAC AAC TGC CTG CTG TTG GGC ACG GAA GTG TCC GAA GCG CTG GGC GGG      1925Asn Asn Cys Leu Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly Gly535                 540                 545                 550GCC GGC CTC ACG GGG GGG TTC TAT GAA CCC CTG GTG CGC AGG CGT TCG      1973Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Arg Ser
            555                 560                 565GAG CTG ATG GGG CGC CGA AAT CCG GTT TGC CCG GGG TTT GCA TGG CTG      2021Glu Leu Met Gly Arg Arg Asn Pro Val Cys Pro Gly Phe Ala Trp Leu
        570                 575                 580TCC TCG GGT CGA CCT GAC GGG TTT ATA CAC GTC CAG GGC CAC TTG CAG      2069Ser Ser Gly Arg Pro Asp Gly Phe Ile His Val Gln Gly His Leu Gln
    585                 590                 595GAG GTC GAT GCT GGC AAC TTC ATC CCT CCA CCT CGC TGG TTG CTC TTG      2117Glu Val Asp Ala Gly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu Leu
600                 605                 610GAC TTT GTG TTT GTC CTG TTA TAC CTG ATG AAG CTG GCT GAG GCA CGG      2165Asp Phe Val Phe Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala Arg615                 620                 625                 630CTG GTC CCG TTG ATC TTG CTT CTG CTG TGG TGG TGG GTG AAC CAG TTG      2213Leu Val Pro Leu Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln Leu
            635                 640                 645GCA GTC CTT GGA CTG CCG GCT GTG GAC GCC GCC GTG GCT GGT GAG GTC      2261Ala Val Leu Gly Leu Pro Ala Val Asp Ala Ala Val Ala Gly Glu Val
        650                 655                 660TTC GCG GGC CCG GCC CTG TCG TGG TGT CTG GGC CTC CCC ACC GTT AGT      2309Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu Gly Leu Pro Thr Val Ser
    665                 670                 675ATG ATC CTG GGC TTA GCA AAC CTG GTG TTG TAT TTC CGG TGG ATG GGT      2357Met Ile Leu Gly Leu Ala Asn Leu Val Leu Tyr Phe Arg Trp Met Gly
680                 685                 690CCC CAA CGC CTC ATG TTC CTC GTG TTG TGG AAG CTC GCT CGG GGA GCC      2405Pro Gln Arg Leu Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly Ala695                 700                 705                 710TTC CCG CTG GCA CTT CTG ATG GGG ATC TCG GCA ACC CGC GGG CGC ACC      2453Phe Pro Leu Ala Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg Thr
            715                 720                 725TCG GTG CTC GGG GCC GAG TTC TGC TTC GAT GTC ACA TTC GAG GTG GAC      2501Ser Val Leu Gly Ala Glu Phe Cys Phe Asp Val Thr Phe Glu Val Asp
        730                 735                 740ACG TCG GTT TTG GGC TGG GTG GTG GCC AGT GTG GTA GCC TGG GCC ATT      2549Thr Ser Val Leu Gly Trp Val Val Ala Ser Val Val Ala Trp Ala Ile
    745                 750                 755GCG CTC CTG AGC TCG ATG AGC GCG GGA GGG TGG AGG CAC AAG GCC GTG      2597Ala Leu Leu Ser Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala Val
760                 765                 770ATC TAT AGG ACG TGG TGT AAG GGG TAC CAG GCA ATA CGC CAA CGG GTG      2645Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg Val775                 780                 785                 790GTG CGG AGC CCC CTC GGG GAG GGG CGG CCC ACC AAA CCC TTG ACG TTT      2693Val Arg Ser Pro Leu Gly Glu Gly Arg Pro Thr Lys Pro Leu Thr Phe
            795                 800                  805GCT TGG TGC TTG GCC TCA TAC ATC TGG CCG GAT GCT GTG ATG ATG GTG      2741Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met Val
        810                 815                 820GTG GTA GCC TTG GTG CTC CTC TTT GGC CTG TTC GAC GCG TTG GAC TGG      2789Val Val Ala Leu Val Leu Leu Phe Gly Leu Phe Asp Ala Leu Asp Trp
    825                 830                 835GCT TTG GAG GAG CTC TTG GTG TCC CGG CCC TCG TTA CGG CGT CTG GCC      2837Ala Leu Glu Glu Leu Leu Val Ser Arg Pro Ser Leu Arg Arg Leu Ala
840                 845                 850CGG GTG GTT GAG TGC TGT GTG ATG GCG GGA GAG AAG GCC ACA ACC GTC      2885Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr Val855                 860                 865                 870CGG CTG GTC TCC AAG ATG TGC GCG AGA GGG GCC TAT TTG TTT GAC CAT      2933Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp His
            875                 880                 885ATG GGC TCT TTT TCG CGC GCT GTC AAG GAG CGC CTG CTG GAG TGG GAC      2981Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp Asp
        890                 895                 900GCG GCT TTG GAA CCC CTG TCA TTC ACT AGG ACG GAC TGT CGC ATC ATT      3029Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile Ile
    905                 910                 915AGA GAT GCT GCG AGG ACC TTG GCC TGC GGG CAG TGC GTC ATG GGC TTG      3077Arg Asp Ala Ala Arg Thr Leu Ala Cys Gly Gln Cys Val Met Gly Leu
920                 925                 930CCT GTG GTA GCG CGC CGT GGT GAC GAG GTT CTT ATC GGT GTC TTT CAG      3125Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe Gln935                 940                 945                 950GAT GTG AAC CAT TTG CCT CCC GGA TTC GTC CCG ACC GCA CCC GTT GTC      3173Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val Val
            955                 960                 965ATC CGG CGG TGC GGG AAG GGG TTT CTG GGG GTC ACT AAG GCT GCC TTG      3221Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala Leu
        970                 975                 980ACT GGT CGG GAT CCT GAC TTA CAT CCA GGG AAC GTC ATG GTG TTG GGG      3269Thr Gly Arg Asp Pro Asp Leu His Pro Gly Asn Val Met Val Leu Gly
    985                 990                 995ACG GCT ACG TCG CGA AGC ATG GGG ACA TGC CTG AAC GGC CTG CTG TTC      3317Thr Ala Thr Ser Arg Ser Met Gly Thr Cys Leu Asn Gly Leu Leu Phe
1000                1005                1010ACG ACT TTC CAT GGG GCT TCA TCC CGA ACC ATC GCC ACG CCC GTG GGG      3365Thr Thr Phe His Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val Gly1015                1020                1025                1030GCC CTT AAT CCC AGG TGG TGG TCC GCC AGT GAT GAC GTC ACG GTG TAC      3413Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val Tyr
            1035                1040                1045CCG CTC CCG GAT GGG GCA ACC TCG TTG ACG CCC TGC ACT TGC CAG GCT      3461Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln Ala
        1050                1055                1060GAG TCC TGT TGG GTC ATA CGG TCC GAC GGG GCT TTG TGC CAT GGC TTG      3509Glu Ser Cys Trp Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly Leu
    1065                1070                1075AGT AAG GGA GAC AAG GTG GAG CTA GAT GTG GCC ATG GAG GTC TCA GAT      3557Ser Lys Gly Asp Lys Val Glu Leu Asp Val A1a Met Glu Val Ser Asp
1080                1085                1090TTC CGT GGC TCG TCC GGC TCA CCT GTC CTG TGC GAC GAG GGG CAC GCA      3605Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His Ala1095                1100                1105                1110GTA GGA ATG CTC GTG TCG GTG CTC CAC TCG GGT GGT CGG GTC ACC GCG      3653Val Gly Met Leu Val Ser Val Leu His Ser Gly Gly Arg Val Thr Ala
            1115                1120                1125GCT CGA TTC ACC AGG CCG TGG ACC CAG GTC CCA ACA GAT GCT AAG ACC      3701Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys Thr
        1130                1135                1140ACC ACT GAA CCC CCT CCG GTG CCG GCA AAG GGA GTT TTC AAG GAA GCC      3749Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu Ala
    1145                1150                1155CCA CTG TTT ATG CCC ACG GGC GCA GGA AAG AGC ACG CGC GTC CCG TTG      3797Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro Leu
1160                1165                1170GAG TAT GGC AAC ATG GGG CAC AAG GTC CTG ATT TTG AAC CCC TCG GTG      3845Glu Tyr Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser Val1175                1180                1185                1190GCG ACA GTG AGG GCC ATG GGC CCT TAC ATG GAG CGA CTG GCG GGA AAA      3893Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly Lys
            1195                1200                1205CAT CCA AGT ATC TAC TGT GGC CAT GAC ACC ACT GCC TTC ACA AGG ATC      3941His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg Ile
        1210                1215                1220ACT GAT TCC CCC TTA ACG TAC TCT ACC TAT GGG AGG TTT CTG GCC AAC      3989Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala Asn
    1225                1230                1235CCT AGG CAG ATG CTG CGA GGT GTG TCG GTG GTC ATT TGC GAT GAA TGC      4037Pro Arg Gln Met Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu Cys
1240                1245                1250CAC AGT CAT GAT TCC ACT GTG TTG TTG GGG ATT GGA CGG GTC CGG GAG      4085His Ser His Asp Ser Thr Val Leu Leu Gly Ile Gly Arg Val Arg Glu1255                1260                1265               1270CTG GCA CGA GAG TGT GGG GTG CAG CTT GTG CTC TAC GCC ACT GCC ACG      4133Leu Ala Arg Glu Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala Thr
            1275                1280                1285CCT CCT GGG TCC CCC ATG ACT CAG CAT CCG TCA ATC ATT GAG ACC AAA      4181Pro Pro Gly Ser Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr Lys
        1290                1295                1300TTG GAT GTG GGT GAG ATT CCC TTC TAT GGG CAT GGC ATA CCC CTC GAG      4229Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu Glu
    1305                1310                1315CGG ATG CGG ACC GGT AGG CAC CTC GTA TTC TGC TAC TCT AAG GCA GAG      4277Arg Met Arg Thr Gly Arg His Leu Val Phe Cys Tyr Ser Lys Ala Glu
1320                1325                1330TGT GAG CGG CTA GCC GGT CAG TTT TCT GCT AGG GGA GTT AAC GCC ATA      4325Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala Ile1335                1340                1345                1350GCC TAT TAC AGG GGA AAA GAC AGT TCT ATC ATC AAG GAC GGA GAT CTG      4373Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp Leu
            1355                1360                1365GTG GTG TGC GCG ACC GAC GCG CTA TCC ACT GGA TAC ACT GGG AAC TTC      4421Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn Phe
        1370                1375                1380GAT TCT GTC ACC GAC TGT GGG TTA GTG GTG GAG GAG GTC GTC GAG GTG      4469Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val Val Glu Val
    1385                1390                1395ACC CTT GAT CCC ACC ATT ACC ATC TCC CTG CGG ACA GTG CCC GCG TCG      4517Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala Ser
1400                1405                1410GCA GAA CTG TCG ATG CAG AGA CGA GGA CGC ACG GGT AGA GGC AGG TCT      4565Ala Glu Leu Ser Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Ser1415                1420                1425                1430GGG CGC TAC TAC TAC GCC GGG GTC GGA AAG GCC CCC GCG GGT GTG GTG      4613Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val Val
            1435                1440                1445CGC TCG GGT CCT GTC TGG TCG GCG GTG GAG GCC GGA GTG ACC TGG TAT      4661Arg Ser Gly Pro Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp Tyr
        1450                1455                1460GGA ATG GAA CCT GAC TTG ACA GCT AAC CTA TTG AGA CTT TAC GAC GAC      4709Gly Met Glu Pro Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp Asp
    1465                1470                1475TGC CCT TAC ACC GCA GCC GTC GCA GCT GAC ATC GGT GAA GCC GCG GTG      4757Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala Val
1480                1485                1490TTT TTC TCC GGG CTA GCC CCG TTG AGG ATG CAT CCC GAT GTT AGC TGG      4805Phe Phe Ser Gly Leu Ala Pro Leu Arg Met His Pro Asp Val Ser Trp1495                1500                1505                1510GCA AAA GTG CGC GGC GTC AAC TGG CCC CTC TTG GTG GGT GTT CAG CGG      4853Ala Lys Val Arg Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln Arg
            1515                1520                1525ACC ATG TGC CGG GAA ACA CTG TCT CCC GGA CCA TCG GAC GAC CCC CAA      4901Thr Met Cys Arg Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro Gln
        1530                1535                1540TGG GCA GGT CTG AAG GGC CCG AAT CCT GTT CCA CTA CTG CTG AGG TGG      4949Trp Ala Gly Leu Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg Trp
    1545                1550                1555GGC AAT GAT TTA CCA TCA AAA GTG GCC GGC CAC CAC ATT GTT GAC GAC      4997Gly Asn Asp Leu Pro Ser Lys Val Ala Gly His His Ile Val Asp Asp
1560                1565                1570CTG GTT CGT AGG CTT GGT GTG GCG GAG GGT TAT GTC CGC TGC GAT GCG      5045Leu Val Arg Arg Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp Ala1575                1580                1585                1590GGG CCG ATC TTA ATG GTC GGC CTC GCT ATC GCG GGG GGG ATG ATC TAC      5093Gly Pro Ile Leu Met Val Gly Leu Ala Ile Ala Gly Gly Met Ile Tyr
            1595                1600                1605GCA TCT TAC ACC GGG TCT TTA GTG GTG GTG ACA GAC TGG GAT GTA AAG      5141Ala Ser Tyr Thr Gly Ser Leu Val Val Val Thr Asp Trp Asp Val Lys
        1610                1615                1620GGG GGT GGC AGC CCT CTT TAT CGG CAT GGA GAC CAG GCC ACG CCA CAG      5189Gly Gly Gly Ser Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro Gln
    1625                1630                1635CCG GTT GTG CAG GTC CCC CCG GTA GAC CAT CGG CCG GGG GGG GAG TCT      5237Pro Val Val Gln Val Pro Pro Val Asp His Arg Pro Gly Gly Glu Ser
1640                1645                1650GCG CCT TCG GAT GCC AAG ACA GTG ACA GAT GCG GTG GCG GCC ATC CAG      5285Ala Pro Ser Asp Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile Gln1655                1660                1665                1670GTG GAT TGC GAT TGG TCA GTC ATG ACC CTG TCG ATC GGG GAA GTG CTG      5333Val Asp Cys Asp Trp Ser Val Met Thr Leu Ser Ile Gly Glu Val Leu
            1675                1680                1685TCC TTG GCT CAG GCT AAA ACA GCT GAG GCC TAC ACG GCA ACC GCC AAG      5381Ser Leu Ala Gln Ala Lys Thr Ala Glu A1a Tyr Thr Ala Thr Ala Lys
        1690                1695                1700TGG CTC GCT GGC TGC TAC ACG GGG ACG CGG GCC GTT CCC ACT GTT TCA      5429Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val Ser
    1705                1710                1715ATT GTT GAC AAG CTC TTT GCC GGA GGG TGG GCG GCT GTG GTT GGC CAC      5477Ile Val Asp Lys Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly His
1720                1725                1730TGT CAC AGC GTC ATA GCT GCG GCG GTG GCT GCC TAC GGG GCT TCC AGG      5525Cys His Ser Val Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser Arg1735                1740                1745                1750AGT CCG CCG TTG GCA GCC GCG GCT TCC TAC CTG ATG GGA CTG GGC GTC      5573Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly Val
            1755                1760                1765GGA GGC AAC GCT CAG ACG CGT TTG GCG TCT GCC CTC CTG TTG GGG GCC      5621Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly Ala
        1770                1775                1780GCT GGC ACC GCC CTG GGC ACT CCC GTC GTG GGT TTA ACC ATG GCG GGG      5669Ala Gly Thr Ala Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala Gly
    1785                1790                1795GCG TTC ATG GGG GGT GCT AGC GTC TCT CCC TCC TTG GTC ACC ATC TTG      5717Ala Phe Met Gly Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile Leu
1800                1805                1810TTG GGG GCC GTG GGA GGC TGG GAG GGC GTC GTC AAC GCT GCT AGC CTT      5765Leu Gly Ala Val Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser Leu1815                1820                1825                1830GTC TTT GAC TTC ATG GCG GGG AAA CTA TCG TCA GAA GAT CTG TGG TAC      5813Val Phe Asp Phe Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp Tyr
            1835                1840                1845GCC ATC CCA GTG CTC ACC AGC CCG GGG GCG GGC CTT GCG GGG ATC GCC      5861Ala Ile Pro Val Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile Ala
        1850                1855                1860CTT GGG TTG GTG CTG TAC TCA GCT AAC AAC TCT GGT ACT ACC ACT TGG      5909Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr Trp
    1865                1870                1875TTG AAC CGT CTG CTG ACT ACG TTA CCT AGG TCT TCT TGC ATC CCT GAC      5957Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro Asp
1880                1885                1890AGC TAT TTC CAA CAG GCC GAT TAC TGT GAC AAG GTC TCG GCC GTG CTT      6005Ser Tyr Phe Gln Gln Ala Asp Tyr Cys Asp Lys Val Ser Ala Val Leu1895                1900                1905                1910CGC CGA CTG AGC CTC ACC CGC ACT GTG GTG GCC CTA GTC AAT AGG GAA      6053Arg Arg Leu Ser Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg Glu
            1915                1920                1925CCC AAG GTG GAC GAG GTA CAG GTG GGG TAC GTC TGG GAT CTC TGG GAG      6101Pro Lys Val Asp Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp Glu
        1930                1935                1940TGG ATC ATG CGT CAA GTG CGC ATG GTC ATG GCC AGG CTC CGG GCT CTC      6149Trp Ile Met Arg Gln Val Arg Met Val Met Ala Arg Leu Arg Ala Leu
    1945                1950                1955TGC CCC GTG GTG TCA CTG CCT TTG TGG CAC TGC GGG GAG GGG TGG TCC      6197Cys Pro Val Val Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp Ser
1960                1965                1970GGA GAG TGG TTG TTG GAC GGC CAT GTG GAG AGT CGC TGT CTT TGC GGG      6245Gly Glu Trp Leu Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys Gly1975                1980                1985                1990TGC GTG ATC ACC GGC GAT GTT TTC AAT GGG CAA CTC AAA GAG CCA GTT      6293Cys Val Ile Thr Gly Asp Val Phe Asn Gly Gln Leu Lys Glu Pro Val
            1995                2000                2005TAC TCT ACA AAG TTG TGC CGG CAC TAT TGG ATG GGG ACC GTT CCT GTG      6341Tyr Ser Thr Lys Leu Cys Arg His Tyr Trp Met Gly Thr Val Pro Val
        2010                2015                2020AAC ATG CTG GGT TAC GGC GAA ACA TCA CCC CTC TTG GCC TCT GAC ACC      6389Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp Thr
    2025                2030                2035CCG AAG GTG GTG CCT TTT GGG ACG TCG GGC TGG GCT GAG GTG GTG GTG      6437Pro Lys Val Val Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val Val
2040                2045                2050ACC CCT ACC CAC GTG GTG ATC AGG AGA ACC TCT CCC TAC GAG TTG CTG      6485Thr Pro Thr His Val Val Ile Arg Arg Thr Ser Pro Tyr Glu Leu Leu2055                2060                2065                2070CGC CAA CAA ATC CTA TCA GCT GCA GTT GCT GAG CCC TAT TAT GTC GAC      6533Arg Gln Gln Ile Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp
            2075                2080                2085GGC ATA CCG GTC TCA TGG GAC GCG GAC GCT CGT GCG CCT GCT ATG GTT      6581Gly Ile Pro Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val
        2090                2095                2100TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC CTG      6629Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu
    2105                2110                2115CCG CAT CAA CTG CGG CTC AGG AAT GTA GCG CCC TCT GAG GTT TCA TCC      6677Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser
2120                2125                2130GAG GTG TCC ATA GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT      6725Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr2135                2140                2145                2150GAG GCC GAC CTG CCG CCG GCA GCT GCA GCC CTC CAG GCT ATC GAG AAT      6773Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn
            2155                2160                2165GCT GCG AGG ATT CTT GAG CCT CAT ATT GAT GTC ATC ATG GAG GAT TGC      6821Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys
        2170                2175                2180AGT ACA CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTG TGG GGA      6869Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly
    2185                2190                2195GAA GAC ATC CCC CGC ACT CCA TCG CCA GCA CTT ATC TCG GTT ACC GAG      6917Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr Glu
2200                2205                2210AGC AGC TCA GAT GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG GAG GAT      6965Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu Asp2215                2220                2225                2230ACC CCG TCC TCT GAC TCA TTC GAA GTC ATC CAA GAG TCT GAG ACA GCT      7013Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr Ala
            2235                2240                2245GAA GGA GAG GAA AGT GTC TTC AAC GTG GCT CTT TCC GTA CTA GAA GCC      7061Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu Glu Ala
        2250                2255                2260TTG TTT CCA CAG AGT GAT GCC ACT AGA AAG CTT ACC GTC AGG ATG AAT      7109Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Arg Met Asn
    2265                2270                2275TGC TGC GTT GAG AAG AGC GTC ACG CGC TTC TTT TCT TTG GGG CTG ACG      7157Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu Thr
2280                2285                2290GTG GCT GAT GTG GCC AGT CTG TGT GAG ATG GAG ATC CAG AAC CAT ACA      7205Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His Thr2295                2300                2305                2310GCC TAT TGT GAC AAG GTG CGC ACT CCG CTC GAA TTG CAA GTT GGG TGC      7253Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys
            2315                2320                2325TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAT AAG TGT GAG GCT AGG      7301Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg
        2330                2335                2340CAA GAG ACT TTG GCC TCC TTC TCC TAT ATT TGG TCT GGG GTG CCA TTG      7349Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro Leu
    2345                2350                2355ACT AGG GCC ACA CCG GCT AAA CCA CCT GTG GTG AGG CCG GTG GGG TCC      7397Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly Ser
2360                2365                2370TTG TTG GTG GCT GAC ACC ACG AAA GTG TAT GTC ACA AAC CCG GAC AAT      7445Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp Asn2375                2380                2385                2390GTT GGG AGA AGA GTG GAC AAG GTG ACC TTC TGG CGC GCC CCC AGG GTC      7493Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg Val
            2395                2400                2405CAT GAC AAA TAT CTC GTG GAC TCC ATC GAG CGT GCC AGG AGG GCG GCT      754lHis Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Arg Arg Ala Ala
        2410                2415                2420CAA GCC TGC CAA AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA AGG ACT      7589Gln Ala Cys Gln Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg Thr
    2425                2430                2435GTT AGG CCA CAT GCT GCC ATG GGC TGG GGA TCT AAG GTG TCG GTC AAG      7637Val Arg Pro His Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val Lys
2440                2445                2450GAC TTG GCC ACC CCT GCG GGG AAG ATG GCC GTC CAC GAC CGA CTT CAG      7685Aso Leu Ala Thr Pro Ala Gly Lys Met Ala Val His Asp Arg Leu Gln2455                2460                2465                2470GAG ATA CTT GAG GGG ACT CCG GTC CCT TTT ACT CTT ACT GTG AAA AAG      7733Glu Ile Leu Glu Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys Lys
            2475                2480                2485GAG GTG TTC TTC AAA GAC CGT AAG GAG GAG AAG GCC CCC CGC CTC ATT      7781Glu Val Phe Phe Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu Ile
        2490                2495                2500GTG TTC CCC CCC CTG GAC TTC CGG ATA GCT GAG AAG CTT ATC CTG GGA      7829Val Phe Pro Pro Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu Gly
    2505                2510                2515GAC CCG GGG CGG GTG GCC AAG GCG GTG TTG GGG GGG GCT TAC GCC TTC      7877Asp Pro Gly Arg Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala Phe
2520                2525                2530CAG TAC ACC CCA AAT CAG CGA GTT AAG GAG ATG CTC AAA CTG TGG GAG      7925Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp Glu2535                2540                2545                2550TCA AAG AAA ACA CCT TGC GCC ATC TGT GTG GAC GCC ACT TGC TTC GAC      7973Ser Lys Lys Thr Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe Asp
            2555                2560                2565AGT AGC ATT ACT GAA GAG GAC GTG GCG CTG GAG ACA GAG CTG TAC GCT      8021Ser Ser Ile Thr Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr Ala
        2570                2575                2580CTG GCC TCT GAC CAT CCA GAG TGG GTG CGA GCT TTG GGG AAG TAC TAT      8069Leu Ala Ser Asp His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr Tyr
    2585                2590                2595GCC TCA GGA ACC ATG GTC ACC CCT GAG GGG GTT CCC GTA GGT GAG AGG      8117Ala Ser Gly Thr Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg
2600                2605                2610TAT TGT AGA TCC TCA GGC GTT TTG ACT ACC AGC GCG AGT AAC TGC CTG      8165Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu2615                2620                2625                2630ACC TGC TAC ATC AAG GTG AAA GCC GCT TGT GAG AGA GTG GGG CTG AAA      8213Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys
            2635                2640                2645AAT GTC TCG CTT CTC ATA GCC GGC GAT GAC TGT TTG ATC ATA TGC GAA      8261Asn Val Ser Leu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu
        2650                2655                2660CGG CCA GTG TGC GAC CCT TGT GAC GCC TTG GGC AGA GCC CTG GCG AGC      8309Arg Pro Val Cys Asp Pro Cys Asp Ala Leu Gly Arg Ala Leu Ala Ser
    2665                2670                2675TAT GGG TAT GCT TGC GAG CCT TCG TAT CAT GCA TCA CTG GAC ACG GCC      8357Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr Ala
2680                2685                2690CCC TTC TGC TCC ACT TGG CTC GCT GAG TGC AAC GCA GAT GGG AAA CGC      8405Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys Arg2695                2700                2705                2710CAT TTC TTC CTG ACC ACG GAC TTT CGG AGG CCG CTT GCT CGC ATG TCG      8453His Phe Phe Leu Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met Ser
            2715                2720                2725AGC GAG TAT AGT GAC CCA ATG GCT TCG GCC ATA GGT TAC ATC CTC CTG      8501Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu Leu
        2730                2735                2740TAT CCC TGG CAT CCC ATC ACA CGG TGG GTC ATC ATC CCT CAT GTG CTA      8549Tyr Pro Trp His Pro Ile Thr Arg Trp Val Ile Ile Pro His Val Leu
    2745                2750                2755ACG TGC GCA TTC AGG GGT GGT GGT ACA CCG TCT GAT CCG GTT TGG TGT      8597Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp Cys
2760                2765                2770CAG GTG CAT GGT AAC TAC TAC AAG TTT CCA CTG GAC AAA CTG CCT AAC      8645Gln Val His Gly Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro Asn2775                2780                2785                2790ATC ATC GTG GCC CTC CAC GGA CCA GCA GCG TTG AGG GTT ACC GCA GAC      8693Ile Ile Val Ala Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala Asp
            2795                2800                2805ACA ACT AAG ACA AAA ATG GAA GCT GGG AAG GTG CTG AGT GAC CTC AAG      8741Thr Thr Lys Thr Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu Lys
        2810                2815                2820CTC CCT GGC CTA GCG GTC CAC CGA AAG AAG GCC GGA GCA CTG CGA ACA      8789Leu Pro Gly Leu Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg Thr
    2825                2830                2835CGC ATG CTT CGG TCG CGC GGT TGG GCC GAG TTG GCG AGG GGC CTG TTG      8837Arg Met Leu Arg Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu Leu
2840                2845                2850TGG CAT CCA GGC CTC CGG CTC CCT CCC CCT GAG ATT GCT GGT ATC CCG      8885Trp His Pro Gly Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile Pro2855                2860                2865                2870GGG GGT TTC CCC CTC TCC CCC CCC TAC ATG GGG GTG GTG CAT CAA TTG      8933Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met Gly Val Val His Gln Leu
            2875                2880                2885GAT TTT ACA AGC CAG AGG AGT CGC TGG CGG TGG CTG GGG TTC TTA GCC      8981Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu Ala
        2890                2895                2900CTG CTC ATC GTA GCC CTC TTC GGG TGAACTAAAT TCATCTGTTG CGGCAAGGTC     9035Leu Leu Ile Val Ala Leu Phe Gly
    2905                2910CAGTGACTGA TCATCACTGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG TCTCCCCGCT    9095GGGTAAAA                                                             9103(2)SEQ ID NO:183的信息:
(i)序列特征:
   (A)长度:2910个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:183:Met Ser Leu Leu Thr Asn Arg Leu Ser Arg Arg Val Asp Lys Asp Gln1               5                  10                  15Trp Gly Pro Gly Phe Met Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg
         20                  25                  30Arg Thr Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
     35                  40                  45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu
 50                  55                  60Pro Tyr Thr Ile Met Glu Ala Leu Leu Phe Leu Leu Gly Val Glu Ala65                  70                  75                  80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln
             85                  90                  95Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu
        100                 105                 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Val Cys Thr Asp Arg
    115                 120                 125Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser
130                 135                 140Ala Ala Gln Leu Val Gly Gln Leu Gly Gly Leu Tyr Gly Pro Leu Ser145                 150                 155                 160Val Ser Ala Tyr Val Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser
            165                 170                 175Gly Val Leu Thr Val Gly Val Ala Leu Thr Arg Arg Val Tyr Pro Met
        180                 185                 190Pro Asn Leu Thr Cys Ala Val Glu Cys Glu Leu Lys Trp Glu Ser Glu
    195                 200                 205Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu
210                 215                 220Tyr Leu Trp Lys Val Pro Phe Asp Phe Trp Arg Gly Val Leu Ser Leu225                 230                 235                 240Thr Pro Leu Leu Val Cys Val Ala Ala Leu Leu Leu Leu Glu Gln Arg
            245                 250                 255Ile Val Met Val Phe Leu Leu Val Thr Met Ala Gly Met Ser Gln Gly
        260                 265                 270Ala Pro Ala Ser Val Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr
    275                 280                 285Trp Gln Ser Cys Ser Cys Arg Ala Asn Gly Ser Arg Tyr Thr Thr Gly
290                 295                 300Glu Lys Val Trp Asp Arg Gly Asn Val Thr Leu Leu Cys Asp Cys Pro305                 310                 315                 320Asn Gly Pro Trp Val Trp Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp
            325                 330                 335Gly Asp Pro Ile Thr His Trp Ser His Gly Gln Asn Arg Trp Pro Leu
        340                 345                 350Ser Cys Pro Gln Tyr Val Tyr Gly Ser Val Ser Val Thr Cys Val Trp
    355                 360                 365Gly Ser Val Ser Trp Phe Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile
370                 375                 380Asp Val Trp Ser Leu Val Pro Val Gly Ser Ala Ser Cys Thr Ile Ala385                 390                 395                 400Ala Leu Gly Ser Ser Asp Arg Asp Thr Val Val Glu Leu Ser Glu Trp
            405                 410                 415Gly Val Pro Cys Ala Thr Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys
        420                 425                 430Gly Thr Cys Val Arg Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe
    435                 440                 445Pro Phe His Arg Cys Gly Ala Gly Pro Lys Leu Thr Lys Asp Leu Glu
450                 455                 460Ala Val Pro Phe Val Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro465                 470                 475                 480Leu Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe
            485                 490                 495Gly Ser Tyr Ala Met Thr Lys Ile Arg Asp Ser Leu His Leu Val Lys
        500                 505                 510Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe
    515                 520                 525Pro Gly Val Pro Pro Leu Asn Asn Cys Leu Leu Leu Gly Thr Glu Val
530                 535                 540Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro545                 550                 555                 560Leu Val Arg Arg Arg Ser Glu Leu Met Gly Arg Arg Asn Pro Val Cys
            565                 570                 575Pro Gly Phe Ala Trp Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His
        580                 585                 590Val Gln Gly His Leu Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro
    595                 600                 605Pro Arg Trp Leu Leu Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met
610                 615                 620Lys Leu Ala Glu Ala Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp625                 630                 635                 640Trp Trp Val Asn Gln Leu Ala Val Leu Gly Leu Pro Ala Val Asp Ala
            645                 650                 655Ala Val Ala Gly Glu Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu
        660                 665                 670Gly Leu Pro Thr Val Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu
    675                 680                 685Tyr Phe Arg Trp Met Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp
690                 695                 700Lys Leu Ala Arg Gly Ala Phe Pro Leu Ala Leu Leu Met Gly Ile Ser705                 710                 715                 720Ala Thr Arg Gly Arg Thr Ser Val Leu Gly Ala Glu Phe Cys Phe Asp
            725                 730                 735Val Thr Phe Glu Val Asp Thr Ser Val Leu Gly Trp Val Val Ala Ser
        740                 745                 750Val Val Ala Trp Ala Ile Ala Leu Leu Ser Ser Met Ser Ala Gly Gly
    755                 760                 765Trp Arg His Lys Ala Val Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln
770                 775                 780Ala Ile Arg Gln Arg Val Val Arg Ser Pro Leu Gly Glu Gly Arg Pro785                 790                 795                 800Thr Lys Pro Leu Thr Phe Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro
            805                 810                 815Asp Ala Val Met Met Val Val Val Ala Leu Val Leu Leu Phe Gly Leu
        820                 825                 830Phe Asp Ala Leu Asp Trp Ala Leu Glu Glu Leu Leu Val Ser Arg Pro
    835                 840                 845Ser Leu Arg Arg Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly
850                 855                 860Glu Lys Ala Thr Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly865                 870                 875                 880Ala Tyr Leu Phe Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu
            885                 890                 895Arg Leu Leu Glu Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg
        900                 905                 910Thr Asp Cys Arg Ile Ile Arg Asp Ala Ala Arg Thr Leu Ala Cys Gly
    915                 920                 925Gln Cys Val Met Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val
930                 935                 940Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val945                 950                 955                 960Pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly
            965                 970                 975Val Thr Lys Ala Ala Leu Thr Gly Arg Asp Pro Asp Leu His Pro Gly
        980                 985                 990Asn Val Met Val Leu Gly Thr Ala Thr Ser Arg Ser Met Gly Thr Cys
    995                 1000                1005Leu Asn Gly Leu Leu Phe Thr Thr Phe His Gly Ala Ser Ser Arg Thr
1010                1015                1020Ile Ala Thr Pro Val Gly Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser1025                1030                1035                1040Asp Asp Val Thr Val Tyr Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr
            1045                1050                1055Pro Cys Thr Cys Gln Ala Glu Ser Cys Trp Val Ile Arg Ser Asp Gly
        1060                1065                1070Ala Leu Cys His Gly Leu Ser Lys Gly Asp Lys Val Glu Leu Asp Val
    1075                1080                1085Ala Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu
1090                1095                1100Cys Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser1105                1110                1115                1120Gly Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val
            1125                1130                1135Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys
        1140                1145                1150Gly Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys
    1155                1160                1165Ser Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu
1170                1175                1180Ile Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met1185                1190                1195                1200Glu Arg Leu Ala Gly Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr
            1205                1210                1215Thr Ala Phe Thr Arg Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr
        1220                1225                1230Gly Arg Phe Leu Ala Asn Pro Arg Gln Met Leu Arg Gly Val Ser Val
    1235                1240                1245Val Ile Cys Asp Glu Cys His Ser His Asp Ser Thr Val Leu Leu Gly
1250                1255                1260Ile Gly Arg Val Arg Glu Leu Ala Arg Glu Cys Gly Val Gln Leu Val1265                1270                1275                1280Leu Tyr Ala Thr Ala Thr Pro Pro Gly Ser Pro Met Thr Gln His Pro
            1285                1290                1295Ser Ile Ile Glu Thr Lys Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly
        1300                1305                1310His Gly Ile Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe
    1315                1320                1325Cys Tyr Ser Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala
1330                1335                1340Arg Gly Val Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile1345                1350                1355                1360Ile Lys Asp Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr
            1365                1370                1375Gly Tyr Thr Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val
        1380                1385                1390Glu Glu Val Val Glu Val Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu
    1395                1400                1405Arg Thr Val Pro Ala Ser Ala Glu Leu Ser Met Gln Arg Arg Gly Arg
1410                1415                1420Thr Gly Arg Gly Arg Ser Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys1425                1430                1435                1440Ala Pro Ala Gly Val Val Arg Ser Gly Pro Val Trp Ser Ala Val Glu
            1445                1450                1455Ala Gly Val Thr Trp Tyr Gly Met Glu Pro Asp Leu Thr Ala Asn Leu
        1460                1465                1470Leu Arg Leu Tyr Asp Asp Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp
    1475                1480                1485Ile Gly Glu Ala Ala Val Phe Phe Ser Gly Leu Ala Pro Leu Arg Met
1490                1495                1500His Pro Asp Val Ser Trp Ala Lys Val Arg Gly Val Asn Trp Pro Leu1505                1510                1515                1520Leu Val Gly Val Gln Arg Thr Met Cys Arg Glu Thr Leu Ser Pro Gly
            1525                1530                1535Pro Ser Asp Asp Pro Gln Trp Ala Gly Leu Lys Gly Pro Asn Pro Val
        1540                1545                1550Pro Leu Leu Leu Arg Trp Gly Asn Asp Leu Pro Ser Lys Val Ala Gly
    1555                1560                1565His His Ile Val Asp Asp Leu Val Arg Arg Leu Gly Val Ala Glu Gly
1570                1575                1580Tyr Val Arg Cys Asp Ala Gly Pro Ile Leu Met Val Gly Leu Ala Ile1585                1590                1595                1600Ala Gly Gly Met Ile Tyr Ala Ser Tyr Thr Gly Ser Leu Val Val Val
            1605                1610                1615Thr Asp Trp Asp Val Lys Gly Gly Gly Ser Pro Leu Tyr Arg His Gly
        1620                1625                1630Asp Gln Ala Thr Pro Gln Pro Val Val Gln Val Pro Pro Val Asp His
    1635                1640                1645Arg Pro Gly Gly Glu Ser Ala Pro Ser Asp Ala Lys Thr Val Thr Asp
1650                1655                1660Ala Val Ala Ala Ile Gln Val Asp Cys Asp Trp Ser Val Met Thr Leu1665                1670                1675                1680Ser Ile Gly Glu Val Leu Ser Leu Ala Gln Ala Lys Thr Ala Glu Ala
            1685                1690                1695Tyr Thr Ala Thr Ala Lys Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg
        1700                1705                1710Ala Val Pro Thr Val Ser Ile Val Asp Lys Leu Phe Ala Gly Gly Trp
    17l5                1720                1725Ala Ala Val Val Gly His Cys His Ser Val Ile Ala Ala Ala Val Ala
1730                1735                1740Ala Tyr Gly Ala Ser Arg Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr1745                1750                1755                1760Leu Met Gly Leu Gly Val Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser
            1765                1770                1775Ala Leu Leu Leu Gly Ala Ala Gly Thr Ala Leu Gly Thr Pro Val Val
        1780                1785                1790Gly Leu Thr Met Ala Gly Ala Phe Met Gly Gly Ala Ser Val Ser Pro
    1795                1800                1805Ser Leu Val Thr Ile Leu Leu Gly Ala Val Gly Gly Trp Glu Gly Val
1810                1815                1820Val Asn Ala Ala Ser Leu Val Phe Asp Phe Met Ala Gly Lys Leu Ser1825                1830                1835                1840Ser Glu Asp Leu Trp Tyr Ala Ile Pro Val Leu Thr 5er Pro Gly Ala
            1845                1850                1855Gly Leu Ala Gly Ile Ala Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn
        1860                1865                1870Ser Gly Thr Thr Thr Trp Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg
    1875                1880                1885Ser Ser Cys Ile Pro Asp Ser Tyr Phe Gln Gln Ala Asp Tyr Cys Asp
1890                1895                1900Lys Val Ser Ala Val Leu Arg Arg Leu Ser Leu Thr Arg Thr Val Val1905                1910                1915                1920Ala Leu Val Asn Arg Glu Pro Lys Val Asp Glu Val Gln Val Gly Tyr
            1925                1930                1935Val Trp Asp Leu Trp Glu Trp Ile Met Arg Gln Val Arg Met Val Met
        1940                1945                1950Ala Arg Leu Arg Ala Leu Cys Pro Val Val Ser Leu Pro Leu Trp His
    1955                1960                1965Cys Gly Glu Gly Trp Ser Gly Glu Trp Leu Leu Asp Gly His Val Glu
1970                1975                1980Ser Arg Cys Leu Cys Gly Cys Val Ile Thr Gly Asp Val Phe Asn Gly1985                1990                1995                2000Gln Leu Lys Glu Pro Val Tyr Ser Thr Lys Leu Cys Arg His Tyr Trp
            2005                2010                2015Met Gly Thr Val Pro Val Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro
        2020                2025                2030Leu Leu Ala Ser Asp Thr Pro Lys Val Val Pro Phe Gly Thr Ser Gly
    2035                2040                2045Trp Ala Glu Val Val Val Thr Pro Thr His Val Val Ile Arg Arg Thr
2050                2055                2060Ser Pro Tyr Glu Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val Ala2065                2070                2075                2080Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp Ala
            2085                2090                2095Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp
        2100                2105                2110Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala
    2115                2120                2125Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr
2130                2135                2140Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala2145                2150                2155                2160Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp
            2165                2170                2175Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg
        2180                2185                2190Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala
    2195                2200                2205Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val
2210                2215                2220Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile2225                2230                2235                2240Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala
            2245                2250                2255Leu Ser Val Leu Glu Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys
        2260                2265                2270Leu Thr Val Arg Met Asn Cys Cys Val Glu Lys Ser Val Thr Arg Phe
    2275                2280                2285Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met
2290                2295                2300Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu2305                2310                2315                2320Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys
            2325                2330                2335Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile
        2340                2345                2350Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val
    2355                2360                2365Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr
2370                2375                2380Val Thr Asn Pro Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe2385                2390                2395                2400Trp Arg Ala Pro Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu
            2405                2410                2415Arg Ala Arg Arg Ala Ala Gln Ala Cys Gln Ser Met Gly Tyr Thr Tyr
        2420                2425                2430Glu Glu Ala Ile Arg Thr Val Arg Pro His Ala Ala Met Gly Trp Gly
    2435                2440                2445Ser Lys Val Ser Val Lys Asp Leu Ala Thr Pro Ala Gly Lys Met Ala
2450                2455                2460Val His Asp Arg Leu Gln Glu Ile Leu Glu Gly Thr Pro Val Pro Phe2465                2470                2475                2480Thr Leu Thr Val Lys Lys Glu Val Phe Phe Lys Asp Arg Lys Glu Glu
            2485                2490                2495Lys Ala Pro Arg Leu Ile Val Phe Pro Pro Leu Asp Phe Arg Ile Ala
        2500                2505                2510Glu Lys Leu Ile Leu Gly Asp Pro Gly Arg Val Ala Lys Ala Val Leu
    2515                2520                2525Gly Gly Ala Tyr Ala Phe Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu
2530                2535                2540Met Leu Lys Leu Trp Glu Ser Lys Lys Thr Pro Cys Ala Ile Cys Val2545                2550                2555                2560Asp Ala Thr Cys Phe Asp Ser Ser Ile Thr Glu Glu Asp Val Ala Leu
            2565                2570                2575Glu Thr Glu Leu Tyr Ala Leu Ala Ser Asp His Pro Glu Trp Val Arg
        2580                2585                2590Ala Leu Gly Lys Tyr Tyr Ala Ser Gly Thr Met Val Thr Pro Glu Gly
    2595                2600                2605Val Pro Val Gly Glu Arg Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr
2610                2615                2620Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys2625                2630                2635                2640Glu Arg Val Gly Leu Lys Asn Val Ser Leu Leu Ile Ala Gly Asp Asp
            2645                2650                2655Cys Leu Ile Ile Cys Glu Arg Pro Val Cys Asp Pro Cys Asp Ala Leu
        2660                2665                2670Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His
    2675                2680                2685Ala Ser Leu Asp Thr Ala Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys
2690                2695                2700Asn Ala Asp Gly Lys Arg His Phe Phe Leu Thr Thr Asp Pne Arg Arg2705                2710                2715                2720Pro Leu Ala Arg Met Ser Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala
            2725                2730                2735Ile Gly Tyr Ile Leu Leu Tyr Pro Trp His Pro Ile Thr Arg Trp Val
        2740                2745                2750Ile Ile Pro His Val Leu Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro
    2755                2760                2765Ser Asp Pro Val Trp Cys Gln Val His Gly Asn Tyr Tyr Lys Phe Pro
2770                2775                2780Leu Asp Lys Leu Pro Asn Ile Ile Val Ala Leu His Gly Pro Ala Ala2785                2790                2795                2800Leu Arg Val Thr Ala Asp Thr Thr Lys Thr Lys Met Glu Ala Gly Lys
            2805                2810                2815Val Leu Ser Asp Leu Lys Leu Pro Gly Leu Ala Val His Arg Lye Lys
        2820                2825                2830Ala Gly Ala Leu Arg Thr Arg Met Leu Arg Ser Arg Gly Trp Ala Glu
    2835                2840                2845Leu Ala Arg Gly Leu Leu Trp His Pro Gly Leu Arg Leu Pro Pro Pro
2850                2855                2860Glu Ile Ala Gly Ile Pro Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met2865                2870                2875                2880Gly Val Val His Gln Leu Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg
            2885                2890                2895Trp Leu Gly Phe Leu Ala Leu Leu Ile Val Ala Leu Phe Gly
        2900                2905                2910(2)SEQ ID NO:184的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:两种
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV5446IRT
(xi)序列描述:SEQ ID NO:184:CGGTCCCTCG AACTCCAGCG AGTCTTTTTT TTTTTTTTT                             39(2)SEQ ID NO:185的信息:
(i)序列特征:
   (A)长度:70个氨基酸
   (B)类型:氨基酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:来自T55806的GE帽
(xi)序列描述:SEQ ID NO:185:Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1               5                   10                  15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg
        20                  25                  30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
    35                  40                  45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu
50                  55                  60Phe Tyr Thr Ile Met Ala65                  70(2)SEQ ID NO:186的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-S59变异体
(xi)序列描述:SEQ ID NO:186:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCTCAAG    360CCCTGCCCTT CCCGGTGGGG CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:187的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-S368变异体
(xi)序列描述:SEQ ID NO:187:AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240CGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:188的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-S309变异体
(xi)序列描述:SEQ ID NO:188:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCGGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCATGCGGCG AGAACGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTCACGGGGA AGGACCCCGG    360ATGCTGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:189的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:  DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-FZ变异体(xi)序列描述:SEQ ID NO:189:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GCTACCCACC    240TGGGCAAACG ACGCCCATGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GATTCGTCCG GCGAGTTGAC AAGGACCAGT GGGGGCCGGG GGCCTGGGGA AGGACCCCAG    360ACCCTGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:190的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G21变异体
(xi)序列描述:SEQ ID NO:190:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC    180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCCCAAG    360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:191的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G23变异体
(xi)序列描述:SEQ ID NO:191:AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACATCAGG CATGTCGTTA AACCGAGCCC GTTACCCGCC    240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTACGGGGA AGGACCCCGA    360ACCCTGCCCT TCCCGGCGGA CCGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:192的信息:
(i)序列特征:
   (A)长度:405个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G59变异体
(xi)序列描述:SEQ ID NO:192:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACTGAGCCC GTAACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GGATTATTCC CGGCGAGTTG GCAAGGACCA GTGGGGGCCG GGAGCTACAG AGAAGGACTC    360TGAGCTCTGC CCTTCCCGGT GGAACGGGAA ATGCATGGGG CCACC                    405(2)SEQ ID NO:193的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-E36变异体
(xi)序列描述:SEQ ID NO:193:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGCCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ACTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCTACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTAAGCCGG CGAGTTGACA AAGACCAGTG GGGGCCGGGG GTCACAGGGA TGGACCCTGG    360ACCCTGCCCT TCCCGGTGGA GTGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:194的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-R38730变异体
(xi)序列描述:SEQ ID NO:194:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGACAGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAGAAGGTTAAGG ATCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCCTACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTATCCCACCTGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAGGTTCGTCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTGCGGGGA AGGACCCCGAACTCTGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC(2)SEQ ID NO:195的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G281变异体
(xi)序列描述:SEQ ID NO:195:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC    180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCCCAAG    360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:196的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G157变异体
(xi)序列描述:SEQ ID NO:196:AGACGCAATG ACTCGGCGCC GACCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120AAGGTTAAGA TTCCTCTTGT GCCTGTGGCG AGACAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGACC GACACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GCTGGGGGAA GGACCCCCTT    360GCACCGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:197的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G154变异体
(xi)序列描述:SEQ ID NO:197:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTAC GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGCTGGCCT    180TACCGGTGTG AATAAAGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAGTAG    300GTTTAACCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG CCTTGGAGAT GGACTCCAAG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:198的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G213变异体
(xi)序列描述:SEQ ID NO:198:AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC    180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ATGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTCGGGGAA GGACCCCGTA    360CCCTGCCCTT CCCGGTGGAA CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:199的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G204变异体
(xi)序列描述:SEQ ID NO:199:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTT AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCCTGGAGAG GGACTCCAGG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:200的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-G191变异体
(xi)序列描述:SEQ ID NO:200:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     6CAGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGG ATCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGCTA AACCGAGCCC GTATCCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGAG GTTACGGGGA AGGACCCCGA    360GCCTCGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:201的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
(C)各分离株:HGV-G299变异体
(xi)序列描述:SEQ ID NO:201:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGC ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GAGTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACGGGGA TGGACCCCGG    360GCTCTGCCCT TCCCGGTGGA ACGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:202的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-T56957变异体
(xi)序列描述:SEQ ID NO:202:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTACA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTCACAGGGA TGGACCCTGG    360GCCCTGCCCT TCCCGGTGGG GTGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:203的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-C01698变异体
(xi)序列描述:SEQ ID NO:203:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAT GGACTCCAAG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:204的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-T27034变异体
(xi)序列描述:SEQ ID NO:204:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTTCCCGCC    240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACTGGGA TGGACCCAGG    360GCTCTGCCCT TCCCGGCGGG GTGGGAAAAG CATGGGGCCA CC                       402(2)SEQ ID NO:205的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
(C)各分离株:HGV-E57963变异体
(xi)序列描述:SEQ ID NO:205:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCCCTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAA GGACTCCAAG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:206的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-R37166变异体
(xi)序列描述:SEQ ID NO:206:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTAACCCGCC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTAACCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG CCTTGGAGAT GGACTCCAAG    360TCCTGCCCTT CCCGGCGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:207的信息:
(i)序列特征:
   (A)长度:404个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-B5变异体
(xi)序列描述:SEQ ID NO:207:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTTTGCC GGCGAGTTGA CAAGGACCAG TGGGGGCCGG GGGTTATGGG GAAGGACCCC    360AAACCCTGCC CTTCCCGGTG GGCCGGGAAA TGCATGGGGC CACC                     404(2)SEQ ID NO:208的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-B33变异体
(xi)序列描述:SEQ ID NO:208:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTCCCCGCC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG ATCATGGGGA AGGACCCCAG    360ATCCTGCCCT TCCCGGCGGG CCGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:209的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-FH010变异体
(xi)序列描述:SEQ ID NO:209:AGACGCAATG ACTCGGCGCC GACCCGGCCA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120AAGGTTAAGA TTCCTCTTGT GCCTGTGGCG AGACAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACTGAGACC GACACCCACC    240TGGGCAAAGG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTGGGGGAA GGACCCCCAG    360TCCTGCCCTT CCCGGTGGGA CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:210的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-PNF2161变异体
(xi)序列描述:SEQ ID NO:210:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCGTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG    360TCCCGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:211的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-JC变异体
(xi)序列描述:SEQ ID NO:211:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTAACCCGCC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCGCTCT TGACCAATAC    300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG TTTATGGGGA AGGACCCCAA    360ACCCTGCCCT TCCCGGCGGA CCGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:212的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-7155变异体
(xi)序列描述:SEQ ID NO:212:AGACGTTATG AACCGGCGCC GCCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120GTGGTCAAGG TCCCTCTAGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTATCCTCC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GCCGGGGGAA GGACCCCCGG    360TACTGCCCCT CCCGGAGGAG TGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:213的信息:
(i)序列特征:
  (A)长度:401个碱基对
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-7244变异体
(xi)序列描述:SEQ ID NO:213:AGACGTTAAG AACCGGCGCC GCCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120GTGGTCAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCTCC    240TGGGCAAACG ACGCCCATGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GGCGGGGGAA GGACCCCCGT    360CACTGCCCTT CCCGGAGGGG TGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:214的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-K27变异体
(xi)序列描述:SEQ ID NO:214:AGACGTTAAG TACCGGCGCC GACCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG    120TTGGTCAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCACC    240TGGGCAAACA ACGCCCACGT ACGGTCCACG TCGCCCTACA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCTGGGC GGCGAGGGAA GGACCCTCGT    360CGCTGCCCTT CCCGGCGGGG TGGGGAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:215的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-K30变异体
(xi)序列描述:SEQ ID NO:215:AGACGTTAAG AACCGGCGCC TTCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAGT CCCGGTCATCTTGGTAGCCA  CTATAGGTGG GTCTTAAGGG    120AGGGTTAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCACC    240TGGGCAAACA ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCTGGGC GGTAGGGGAA GGACCCTTGC    360CGCTGCCCTT CCCGGTGGGG TGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:216的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-T55875变异体
(xi)序列描述:SEQ ID NO:216:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGACG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GTTTAACCGG CGAGTTGGCA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG    360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:217的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-T56633变异体
(xi)序列描述:SEQ ID NO:217:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ACTACCCACC    240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG    300GCTAGTCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGAG GTCACAGGGA TGGACCCTGG    360GCCTTGCCCT TCCCGGTGGA GTGGGAAAAG CATGGGGCCA CC                       402(2)SEQ ID NO:218的信息:
(i)序列特征:
   (A)长度:404个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-EB20变异体
(xi)序列描述:SEQ ID NO:218:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTA ATAAGGGCCC GACGTCAGGC TCGTCGTTAA ACCGAGCCCG TCACCCACCT    240GGGCAAACGA CGCCCACGTA CGGTCCACGT CGCCCTTCAA TGCCTCTCTT GGCCAATAGG    300AGTTATCTCC GGCGAGTTGG CAAGGACCAG TGGGGGCCGG GGGTTACGGG GAAGGACCCC    360GAACCCTGCC CTTCCCGGTG GGCCGGGAAA TGCATGGGGC CACC                     404(2)SEQ ID NO:219的信息:
(i)序列特征:
   (A)长度:401个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-T55806变异体
(xi)序列描述:SEQ ID NO:219:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGGA ATAAGGGCCC GACGTCAGGC TCGTCGTTAA ACCGAGCCCG TCACCCACCT    240GGGCAAACGA CGCTCACGTA CGGTCCACGT CGCCCTTCAA TGTCTCTCTT GACCAATAGG    300TTTATCCGGC GAGTTGACAA GGACCAGTGG GGGCCGGGGG TTACGGGGAC GGACCCCGAA    360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C                        401(2)SEQ ID NO:220的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-BG34变异体
(xi)序列描述:SEQ ID NO:220:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC    180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GAGTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACGGGGA TGGACCCCGG    360GCTCTGCCCT TCCCGGTGGA ACGGGAAACG CATGGGGCCA CC                       402(2)SEQ ID NO:221的信息:
(i)序列特征:
   (A)长度:402个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV-BE12变异体
(xi)序列描述:SEQ ID NO:221:AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC     60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG    120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGTCC    180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GCCACCCACC    240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG    300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTCCGGGGA AGAACCCCGA    360GCCCCGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC                       402(2)SEQ ID NO:222的信息:
(i)序列特征:
   (A)长度:24个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV正向引物
(xi)序列描述:SEQ ID NO:222:CCAAAAGGTG GTGGATGGGT GATG                                            24(2)SEQ ID NO:223的信息:
(i)序列特征:
   (A)长度:24个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV正向引物
(xi)序列描述:SEQ ID NO:223:GTGATGMCAG GGTTGGTAGG TCGT                                            24(2)SEQ ID NO:224的信息:
(i)序列特征:
   (A)长度:26个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV正向引物
(xi)序列描述:SEQ ID NO:224:GGTAGCCACT ATAGGTGGGT CTTAAG                                          26(2)SEQ ID NO:225的信息:
(i)序列特征:
   (A)长度:25个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV反向引物
(xi)序列描述:SEQ ID NO:225:GAGMGRCATT GWAGGGCGAC GTRGA                                           25(2)SEQ ID NO:226的信息:
(i)序列特征:
   (A)长度:21个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV反向引物
(xi)序列描述:SEQ ID NO:226:GRCATTGWAG GGCGACGTRG A                                               21(2)SEQ ID NO:227的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:HGV反向引物
(xi)序列描述:SEQ ID NO:227:CCCCACTGGT CYTTGYCAAC TC                                             22(2)SEQ ID NO:228的信息:
(i)序列特征:
   (A)长度:29个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV75-36FE
(xi)序列描述:SEQ ID NO:228:GCGAGATCTA AAATGCAGGC CTGATGGGT                                      29(2)SEQ ID NO:229的信息:
(i)序列特征:
   (A)长度:29个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:未知
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GV75-7064RLE
(xi)序列描述:SEQ ID NO:229:GCGAGATCTA AAATGTGGAC TGCTAAGCC                                      29(2)SEQ ID NO:230的信息:
(i)序列特征:
   (A)长度:46个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物FV94-28F
(xi)序列描述:SEQ ID NO:230:GCGAGATCTA AAATGGCAAG CCCCAGAAAC CGACGCCTAT CTAAGT                    46(2)SEQ ID NO:231的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物FV94-2864R
(xi)序列描述:SEQ ID NO:231:GGCATGATGA ATTCGCAACG AGGGCCGGGA CACCAAGAT                           39(2)SEQ ID NO:232的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物FV94-6439F
(xi)序列描述:SEQ ID NO:232:GCGAGATCTA AAATGGGCCT CCGACACCCC GAAGGTTGT                            39(2)SEQ ID NO:233的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物FV94-9331R
(xi)序列描述:SEQ ID NO:233:GCGAGATCTG AATTCTTCCC GGGGTGCACC CCTTCAGAT                           39(2)SEQ ID NO:234的信息:
(i)序列特征:
   (A)长度:9327个碱基对
   (B)类型:核酸
   (C)链型:双链
   (D)拓扑学:线性
(ii)分子类型:cDNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:3ZHGV-6,来自PNF2161的HGV
(xi)序列描述:SEQ ID NO:234:GCAAGCCCCA GAAACCGACG CCTATCTAAG TAGACGCAAT GACTCGGCGC CGACTCGGCG     60ACCGGCCAAA AGGTGGTGGA TGGGTGATGA CAGGGTTGGT AGGTCGTAAA TCCCGGTCAC    120CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG ATTCCTCTTG TGCCTGCGGC    180GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGG GAATAAGGGC CCGACGTCAG    240GCTCGTCGTT AAACCGAGCC CGTTACCCAC CTGGGCAAAC GACGCCCACG TACGGTCCAC    300GTCGCCCTTC AATGTCTCTC TTGACCAATA GGCGTAGCCG GCGAGTTGAC AAGGACCAGT    360GGGGGCCGGG GGCTTGGAGA GGGACTCCAA GTCCCGCCCT TCCCGGTGGG CCGGGAAATG    420CATGGGGCCA CCCAGCTCCG CGGCGGCCTG CAGCCGGGGT AGCCCAAGAA TCCTTCGGGT    480GAGGGCGGGT GGCATTTCCT TTTTCTATAC CATCATGGCA GTCCTTCTGC TCCTTCTCGT    540GGTTGAGGCC GGGGCCATTC TGGCCCCGGC CACCCACGCT TGTCGAGCGA ATGGGCAATA     600TTTCCTCACA AATTGTTGTG CCCCGGAGGA CATCGGGTTC TGCCTGGAGG GTGGATGCCT     660GGTGGCCCTG GGGTGCACGA TTTGCACTGA CCAATGCTGG CCACTGTATC AGGCGGGTTT     720GGCTGTGCGG CCTGGCAAGT CCGCGGCCCA ACTGGTGGGG GAGCTGGGTA GCCTATACGG     780GCCCCTGTCG GTCTCGGCCT ATGTGGCTGG GATCCTGGGC CTGGGTGAGG TGTACTCGGG     840TGTCCTAACG GTGGGAGTCG CGTTGACGCG CCGGATCTAC CCGGTGCCTA ACCTGACGTG     900TGCAGTCGCG TGTGAGTTAA AGTGGGAAAG TGAGTTTTGG AGATGGACTG AACAGCTGGC     960CTCCAACTAC TGGATTCTGG AATACCTCTG GAAGGTCCCA TTTGATTTCT GGAGAGGCGT    1020GATAAGCCTG ACCCCCTTGT TGGTTTGCGT GGCCGCATTG CTGCTGCTTG AGCAACGGGT    1080TGTCATGGTC TTCCTGTTGG TGACGATGGC CGGGATGTCG CAAGGCGCCC CTGCCTCCGT    1140TTTGGGGTCA CGCCCCTTTG ACTACGGGTT GACTTGGCAG ACCTGCTCTT GCAGGGCCAA    1200CGGTTCGCGT TTTTCGACTG GGGAGAAGGT GTGGGACCGT GGGAACGTTA CGCTTCAGTG    1260TGACTGCCCT AACGGCCCCT GGGTGTGGTT GCCAGCCTTT TGCCAAGCAA TCGGCTGGGG    1320TGACCCCATC ACTTATTGGA GCCACGGGCA AAATCAGTGG CCCCTTTCAT GCCCCCAGTA    1380TGTCTATGGG TCTGCTACAG TCACTTGCGT GTGGGGTTCC GCTTCTTGGT ATGCCTCCAC    1440CAGTGGTCGC GACTCGAAGA TAGATGTGTG GAGTTTAGTG CCAGTTGGCT CTGCCACCTG    1500CACCATAGCC GCACTTGGAT CATCGGATCG CGACACGGTG CCTGGGCTCT CCGAGTGGGG    1560AATCCCGTGC GTGACGTGTG TTCTGGACCG TCGGCCTGCT TCATGCGGCA CCTGTGTGAG    1620GGACTGCTGG CCCGAGACCG GGTCGGTTAG GTTCCCATTC CATCGGTGCG GCGTGGGGCC    1680TCGGCTGACA AAGGACTTGG AAGCTGTGCC CTTCGTCAAT AGGACAACTC CCTTCACCAT    1740TAGGGGGCCC CTGGGCAACC AGGGCCGAGG CAACCCGGTG CGGTCGCCCT TGGGTTTTGG    1800GTCCTACGCC ATGACCAGGA TCCGAGATAC CCTACATCTG GTGGAGTGTC CCACACCAGC    1860CATCGAGCCT CCCACCGGGA CGTTTGGGTT CTTCCCCGGG ACGCCGCCTC TCAACAACTG    1920CATGCTCTTG GGCACGGAAG TGTCCGAGGC ACTTGGGGGG GCTGGCCTCA CGGGGGGGTT    1980CTATGAACCC CTGGTGCGCA GGTGTTCGGA GCTGATGGGA AGCCGAAATC CGGTTTGTCC    2040GGGGTTTGCA TGGCTCTCTT CGGGCAGGCC TGATGGGTTT ATACATGTCC AGGGTCACTT    2100GCAGGAGGTG GATGCAGGCA ACTTCATCCC GCCCCCGCGC TGGTTGCTCT TGGACTTTGT    2160ATTTGTCCTG TTATACCTGA TGAAGCTGGC TGAGGCACGG TTGGTCCCGC TGATCTTGCT    2220GCTGCTATGG TGGTGGGTGA ACCAGCTGGC AGTCCTAGGG CTGCCGGCTG TGGAAGCCGC    2280CGTGGCAGGT GAGGTCTTCG CGGGCCCTGC CCTGTCCTGG TGTCTGGGAC TCCCGGTCGT    2340CAGTATGATA TTGGGTTTGG CAAACCTGGT GCTGTACTTT AGATGGTTGG GACCCCAACG    2400CCTGATGTTC CTCGTGTTGT GGAAGCTTGC TCGGGGAGCT TTCCCGCTGG CCCTCTTGAT    2460GGGGATTTCG GCGACCCGCG GGCGCACCTC AGTGCTCGGG GCCGAGTTCT GCTTCGATGC    2520TACATTCGAG GTGGACACTT CGGTGTTGGG CTGGGTGGTG GCCAATGTGG TAGCTTGGGC    2580CATTGCGCTC CTGAGCTCGA TGAGCGCAGG GGGGTGGAGG CACAAAGCCG TGATCTATAG    2640GACGTGGTGT AAGGGGTACC AGGCAATCCG TCAAAGGGTG GTGAGGAGCC CCCTCGGGGA    2700GGGGCGGCCT GCCAAACCCC TGACCTTTGC CTGGTGCTTG GCCTCGTACA TCTGGCCAGA    2760TGCTGTGATG ATGGTGGTGG TTGCCTTGGT TCTTCTCTTT GGCCTGTTCG ACGCGTTGGA    2820TTGGGCCTTG GAGGAGATCT TGGTGTCCCG GCCCTCGCTG CGGCGTTTGG CTCGGGTGGT    2880TGAGTGCTGT GTGATGGCGG GTGAGAAGGC CACAACCGTC CGGCTGGTCT CCAAGATGTG    2940TGCGAGAGGA GCTTATTTGT TCGATCATAT GGGCTCATTT TCGCGTGCTG TCAAGGAGCG    3000CCTGTTGGAA TGGGACGCGG CTCTTGAACC TCTGTCATTC ACTAGGACGG ACTGTCGCAT    3060CATACGGGAT GCCGCGAGGA CTTTGTCCTG CGGGCAATGC GTCATGGGTT TACCCGTGGT    3120TGCGCGCCGT GGTGATGAGG TTCTCATCGG CGTCTTCCAG GATGTGAATC ATTTGCCTCC    3180CGGGTTTGTT CCGACCGCGC CTGTTGTCAT CCGACGGTGC GGAAAGGGCT TCTTGGGGGT    3240CACAAAGGCT GCCTTGACAG GTCGGGATCC TGACTTACAT CCAGGGAACG TCATGGTGTT    3300GGGGACGGCT ACGTCGCGAA GCATGGGAAC ATGCTTGAAC GGCCTGCTGT TCACGACCTT    3360CCATGGGGCT TCATCCCGAA CCATCGCCAC ACCCGTGGGG GCCCTTAATC CCAGATGGTG    3420GTCAGCCAGT GATGATGTCA CGGTGTATCC ACTCCCGGAT GGGGCTACTT CGTTAACGCC    3480TTGTACTTGC CAGGCTGAGT CCTGTTGGGT CATCAGATCC GACGGGGCCC TATGCCATGG    3540CTTGAGCAAG GGGGACAAGG TGGAGCTGGA TGTGGCCATG GAGGTCCCTG ATTTCCGTGG    3600CTCGTCTGGC TCACCGGTCC TATGTGACGA GGGGCACGCA GTAGGAATGC TCGTGTCTGT    3660GCTTCACTCC GGTGGTAGGG TCACCGCGGC ACGGTTCACT AGGCCGTGGA CCCAAGTGCC    3720AACAGATGCC AAAACCACCA CTGAACCCCC TCCGGTGCCG GCCAAAGGAG TTTTCAAAGA    3780GGCCCCGTTG TTTATGCCTA CGGGAGCGGG AAAGAGCACT CGCGTCCCGT TGGAGTACGG    3840CAACATGGGG CACAAGGTCT TAGTCTTGAA CCCCTCAGTG GCCACTGTGC GGGCCATGGG    3900CCCGTACATG GAGCGGCTGG CGGGTAAACA TCCAAGTATA TACTGTGGGC ATGATACAAC    3960TGCTTTCACA AGGATCACTG ACTCCCCCCT GACGTATTCA ACCTATGGGA GGTTTTTGGC    4020CAACCCTAGG CAGATGCTAC GGGGCGTTTC GGTGGTCATT TGTGATGAGT GCCACAGTTA    4080TGACTCAACC GTGCTGTTAG GCATTGGGAG GGTTCGGGAG CTGGCGCGTG GGTGCGGAGT    4140GCAACTAGTG CTCTACGCCA CCGCTACGCC TCCCGGATCC CCTATGACGC AGCACCCTTC    4200CATAATTGAG ACAAAATTGG ACGTGGGCGA GATTCCCTTT TATGGGCACG GAATACCCCT    4260CGAGCGGATG CGAACCGGAA GGCACCTCGT GTTCTGCCAT TCTAAGGCTG AGTGCGAGCG    4320CCTTGCTGGC CAGTTCTCCG CTAGGGGGGT CAATGCCATT GCCTATTATA GGGGTAAAGA    4380CAGTTCTATC ATCAAGGATG GGGACCTGGT GGTCTGTGCC ACAGACGCGC TTTCCACTGG    4440GTACACTGGA AATTTCGACT CCGTCACCGA CTGTGGATTA GTGGTGGAGG AGGTCGTTGA    4500GGTGACCCTT GATCCTACCA TTACCATCTC CCTGCGGACA GTGCCTGCGT CGGCTGAACT    4560GTCGATGCAA AGACGAGGAC GCACGGGTAG GGGCAGGTCT GGACGCTACT ACTACGCGGG    4620GGTGGGCAAA GCCCCTGCGG GTGTGGTGCG CTCAGGTCCT GTCTGGTCGG CGGTGGAAGC    4680TGGAGTGACC TGGTACGGAA TGGAACCTGA CTTGACAGCT AACCTACTGA GACTTTACGA    4740CGACTGCCCT TACACCGCAG CCGTCGCGGC TGATATCGGA GAAGCCGCGG TGTTCTTCTC    4800TGGGCTCGCC CCATTGAGGA TGCACCCTGA TGTCAGCTGG GCAAAAGTTC GCGGCGTCAA    4860CTGGCCCCTC TTGGTGGGTG TTCAGCGGAC CATGTGTCGG GAAACACTGT CTCCCGGCCC    4920ATCGGATGAC CCCCAATGGG CAGGTCTGAA GGGCCCAAAT CCTGTCCCAC TCCTGCTGAG    4980GTGGGGCAAT GATTTACCAT CTAAAGTGGC CGGCCACCAC ATAGTGGACG ACCTGGTCCG    5040GAGACTCGGT GTGGCGGAGG GTTACGCCCG CTGCGACGCT GGGCCGATCT TGATGATCGG    5100TCTAGCTATC GCGGGGGGAA TGATCTACGC GTCGTACACC GGGTCGCTAG TGGTGGTGAC    5160AGACTGGGAT GTGAAGGGGG GTGGCGCCCC CCTTTATCGG CATGGAGACC AGGCCACGCC    5220TCAGCCGGTG GTGCAGGTTC CTCCGGTAGA CCATCGGCCG GGGGGTGAAT CAGCACCATC    5280GGATGCCAAG ACAGTGACAG ATGCGGTGGC AGCGATCCAG GTGGACTGCG ATTGGACTAT    5340CATGACTCTG TCGATCGGAG AAGTGTTGTC CTTGGCTCAG GCTAAGACGG CCGAGGCCTA    5400CACAGCAGCC ACCAAGTGGC TCGCTGGCTG CTATACGGGG ACGCGGGCCG TTCCCACTGT    5460ATCCATTGTT GACAAGCTCT TCGCCGGAGG GTGGGCGGCT GTGGTGGGCC ATTGCCACAA    5520CGTGATTGCT GCGGCGGTGG CGGCCTACGG GGCTTCAAAG AGCCCGCCGT TGGCAGCCGC    5580GGCTTCCTAC CTGATGGGGT TGGGCGTTGG AGGCAACGCT CAGACGCGTC TGGCATCTGC    5640CCTCCTATTG GGGGCTGCTG GAACCGCCTT GGGCACTCCT GTCGTGGGCT TGACCATGGC    5700AGGTGCGTTC ATGGGGGGCG CCAGTGTCTC CCCCTCCTTG GTCACCATTT TATTGGGGGC    5760CGTCGGAGGT TGGGAGGGTG TTGTCAACGC GGCGAGCCTA GTCTTTGACT TCATGGCGGG    5820GAAACTTTCA TCAGAAGATC TGTGGTATGC CATCCCGGTA CTGACCAGCC CGGGGGCGGG    5880CCTTGCGGGG ATCGCTCTCG GGTTGGTTTT GTATTCAGCT AACAACTCTG GCACTACCAC    5940TTGGTTGAAC CGTCTGCTGA CTACGTTACC AAGGTCTTCA TGTATCCCGG ACAGTTACTT    6000TCAGCAAGTT GACTATTGCG ACAAGGTCTC AGCCGTGCTC CGGCGCCTGA GCCTCACCCG    6060CACAGTGGTT GCCCTGGTCA ACAGGGAGCC TAAGGTGGAT GAGGTACAGG TGGGGTATGT    6120CTGGGACCTG TGGGAGTGGA TCATGCGCCA AGTGCGCGTG GTCATGGCCA GACTCAGGGC    6180CCTCTGCCCC GTGGTGTCAT TACCCTTGTG GCACTGCGGG GAGGGGTGGT CCGGGGAATG    6240GTTGCTTGAC GGTCATGTTG AGAGTCGCTG CCTCTGTGGC TGCGCGATCA CTGGTGACGT    6300TCTGAATGGG CAACTCAAAG AACCAGTTTA CTCTACCAAG CTGTGCCGGC ACTATTGGAT    6360GGGGACTGTC CCTGTGAACA TGCTGGGTTA CGGTGAAACG TCGCCTCTCC TGGCCTCCGA    6420CACCCCGAAG GTTGTGCCCT TCGGGACGTC TGGCTGGGCT GAGGTGGTGG TGACCACTAC    6480CCACGTGGTA ATCAGGAGAA CCTCCGCCTA TAAGCTGCTG CGCCAGCAAA TCCTATCGGC    6540TGCTGTAGCT GAGCCCTACT ACGTCGACGG CATTCCGGTC TCATGGGACG CGGACGCTCG    6600TGCGCCCGCC ATGGTCTATG GCCCTGGGCA AAGTGTTACC ATTGACGGGG AGCGCTACAC    6660CCTGCCTCAT CAACTGAGGC TCAGGAATGT GGCGCCCTCT GAGGTTTCAT CCGAGGTGTC    6720CATTGACATT GGGACGGAGA CTGGAGACTC AGAACTGACT GAGGCCGATC TGCCGCCGGC    6780GGCTGCTGCT CTCCAAGCGA TCGAGAATGC TGCGAGGATT CTTGAACCGC ACATTGATGC    6840CATCATGGAG GACTGCAGTA CACCCTCTCT TTGTGGTAGT AGCCGAGAGA TGCCTGTATG    6900GGGAGAAGAC ATCCCCCGTA CTCCATCGCC AGCACTTATC TCGGTTACTG AGAGCAGCTC    6960AGATGAGAAG ACCCCGTCGG TGTCCTCCTC GCAGGAGGAT ACCCCGTCCT CTGACTCATT    7020CGAGGTCATC CAAGAGTCCG AGACAGCCGA AGGGGAGGAA AGCGTCTTCA ACGTGGCTCT    7080TTCCGTATTA GAAGCCTCAT TTCCACAGAG CGACGCGACC AGGAAGCTTA CCGTCAAGAT    7140GTCGTGCTGC GTTGAAAAGA GCGTCACGCG CTTTTTCTCA TTGGGGTTGA CGGTGGCTGA    7200TGTTGCTAGC CTGTGTGAGA TGGAAATCCA GAACCATACA GCCTATTGTG ACAAGGTGCG    7260CACTCCGCTT GAATTGCAGG TTGGGTGCTT GGTGGGCAAT GAACTTACCT TTGAATGTGA    7320CAAGTGTGAG GCTAGGCAAG AAACCTTGGC CTCCTTCTCT TACATTTGGT CTGGAGTGCC    7380GCTGACTAGG GCCACGCCGG CCAAGCCTCC CGTGGTGAGG CCGGTTGGCT CTTTATTAGT    7440GGCCGACACT ACTAAGGTGT ATGTTACCAA TCCAGACAAT GTGGGACGGA GGGTGGACAA    7500GGTGACCTTC TGGCGTGCTC CTAGGGTTCA TGATAAGTAC CTCGTGGACT CTATTGAGCG    7560CGCTAAGAGG GCCGCTCAAG CCTGCCTAAG CATGGGTTAC ACTTATGAGG AAGCAATAAG    7620GACTGTAAGG CCACATGCTG CCATGGGCTG GGGATCTAAG GTGTCGGTTA AGGACTTAGC    7680CACCCCCGCG GGGAAGATGG CCGTCCATGA CCGGCTCCAG GAGATACTTG AAGGGACTCC    7740GGTCCCCTTT ACTCTTACTG TGAAAAAGGA GGTGTTCTTC AAAGACCGGA AGGAGGAGGA    7800GGCCCCCCGC CTCATTGTGT TCCCCCCCCT GGACTTCCGG ATAGCTGAAA AGCTCATCTT    7860GGGAGACCCA GACCGGGTAG CCAAGGCGGT GTTGGGGGGG GCCTACGCCT TCCAGTACAC    7920CCCAAATCAG CGAGTTAAGG AGATGCTCAA GCTATGGGAG TCTAAGAAGA CCCCTTGCGC    7980CATCTGTGTG GACGCCACCT GCTTCGACAG TAGCATAACT GAAGAGGACG TGGCTTTGGA    8040GACAGAGCTG TACGCTCTGG CCTCTGACCA TCCAGAATGG GTGCGGGCAC TTGGGAAATA    8100CTATGCCTCA GGCACCATGG TCACCCCGGA AGGGGTGCCC GTCGGTGAGA GGTATTGCAG    8160ATCCTCGGGT GTCCTAACAA CTAGCGCGAG CAACTGCTTG ACCTGCTACA TCAAGGTGAA    8220AGCCGCCTGT GAGAGGGTGG GGCTGAAGAA TGTCTCTCTT CTCATAGCCG GCGATGACTG    8280CTTGATCATA TGTGAGCGGC CAGTGTGCGA CCCAAGCGAC GCTTTGGGCA GAGCCCTAGC    8340GAGCTATGGG TACGCGTGCG AGCCCTCATA TCATGCATCC TTGGACACGG CCCCCTTCTG    8400CTCCACTTGG CTTGCTGAGT GCAATGCAGA TGGGAAGCGC CATTTCTTCC TGACCACGGA    8460CTTCCGGAGG CCGCTCGCTC GCATGTCGAG TGAGTATAGT GACCCGATGG CTTCGGCGAT    8520CGGTTACATC CTCCTTTATC CTTGGCACCC CATCACACGG TGGGTCATCA TCCCTCATGT    8580GCTAACGTGC GCATTCAGGG GTGGAGGCAC ACCGTCTGAT CCGGTTTGGT GCCAGGTACA    8640TGGTAACTAC TACAAGTTTC CACTGGACAA ACTGCCTAAC ATCATCGTGG CCCTCCACGG    8700ACCAGCAGCG TTGAGGGTTA CCGCAGACAC AACTAAAACA AAGATGGAGG CTGGTAAGGT    8760TCTGAGCGAC CTCAAGCTCC CTGGCTTAGC AGTCCACCGA AAGAAGGCCG GGGCGTTGCG    8820AACACGCATG CTCCGCTCGC GCGGTTGGGC TGAGTTGGCT AGGGGCTTGT TGTGGCATCC    8880AGGCCTACGG CTTCCTCCCC CTGAGATTGC TGGTATCCCG GGGGGTTTCC CTCTCTCCCC    8940CCCCTATATG GGGGTGGTAC ACCAATTGGA TTTTACAAGC CAGAGGAGTC GCTGGCGGTG    9000GTTGGGGTTC TTAGCCCTGC TCATCGTAGC CCTCTTCGGG TGAACTAAAT TCATCTGTTG    9060CGGCGAGGTC TGGTGACTGA TCGTCACCGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG    9120TCTCCCCGCT GGGTAAAAAG GGCCCGGCCT TGGGAGGCAT GGTGGTTACT AACCCCCTGG    9180CAGGGTTAAA GCCTGATGGT GCTAATGCAC TGCCACTTCG GTGGCGGGTC GCTACCTTAT    9240AGCGTAATCC GTGACTACGG GCTGCTCGCA GAGCCCTCCC CGGATGGGGC ACAGTGCACT    9300GAGATCTGAA GGGGTGCACC CCGGGAA                                        9327(2)SEQ ID NO:235的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GLI-F
(xi)序列描述:SEQ ID NO:235:TAGCATGGCC TTTGCAGGGC TG                                               22(2)SEQ ID NO:236的信息:
(i)序列特征:
   (A)长度:18个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GLI-R
(xi)序列描述:SEQ ID NO:236:AAGCTGTGAC CGTCTCCG                                                    18(2)SEQ ID NO:237的信息:
(i)序列特征:
   (A)长度:31个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GE1-NF
(xi)序列描述:SEQ ID NO:237:GCCGCCATGG CGGGGAAACT TTCATCAGAA G                                     31(2)SEQ ID NO:238的信息:
(i)序列特征:
   (A)长度:32个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GE1-NR
(xi)序列描述:SEQ ID NO:238:GCGCGGATCC TAGTGACACC ACGGGGCAGA GG                                    32(2)SEQ ID NO:239的信息:
(i)序列特征:
   (A)长度:33个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GE57F
(xi)序列描述:SEQ ID NO:239:GCCGCCATGG CTCTCTTGAC CAATAGGTTT ATC                                  33(2)SEQ ID NO:240的信息:
(i)序列特征:
   (A)长度:31个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GE57R
(xi)序列描述:SEQ ID NO:240:GCGCGGATCC AGAAATGCCA CCCGCCCTCA C                            31(2)SEQ ID NO:241的信息:
(i)序列特征:
   (A)长度:61个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:GE57氨基酸序列
(xi)序列描述:SEQ ID NO:241:Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1               5                   10                  15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg
        20                  25                  30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
    35                  40                  45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly
50                  55                  60(2)SEQ ID NO:242的信息:
(i)序列特征:
   (A)长度:52个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:E1的正向引物
(xi)序列描述:SEQ ID NO:242:GCGCAGATCT AAAATGAGCC GTGGTGGCAT TTCCTTTTTC TATACCATCA TG             52(2)SEQ ID NO:243的信息:
(i)序列特征:
   (A)长度:38个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:E1的反向引物
(xi)序列描述:SEQ ID NO:243:GCGCAGATCT CCAGAAATCA AATGGGACCT TCCAGAGG                             38(2)SEQ ID NO:244的信息:
(i)序列特征:
   (A)长度:26个碱基对
   (B)类型:核酸
   (C)链型:单链
  (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:带有昆虫信号序列的E2的正向引物
(xi)序列描述:SEQ ID NO:244:CGCGAGATCT GTCGCAAGGC GCCCCT                                          26(2)SEQ ID NO:245的信息:
(i)序列特征:
   (A)长度:28个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:带有昆虫信号序列的E2的反向引物
(xi)序列描述:SEQ ID NO:245:GCGCAGATCT AGTTGCCTGC ATCCACCT                                        28(2)SEQ ID NO:246的信息:
(i)序列特征:
   (A)长度:42个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:带有HGV信号序列的E2的正向引物
(xi)序列描述:SEQ ID NO:246:CGCGAGATCT AAAATGAAAC TGCTTGTCAT GGTCTTCCTG TT                          42(2)SEQ ID NO:247的信息:
(i)序列特征:
   (A)长度:28个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:带有HGV信号序列的反向引物
(xi)序列描述:SEQ ID NO:247:GCGCAGATCT AGTTGCCTGC ATCCACCT                                        28(2)SEQ ID NO:248的信息:
(i)序列特征:
   (A)长度:34个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:NS2a的正向引物
(xi)序列描述:SEQ ID NO:248:GCGCAGATCT GGCCGTGGCA GGTGAGGTCT TCGC                                 34(2)SEQ ID NO:249的信息:
(i)序列特征:
   (A)长度:31个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:NS2a的反向引物
(xi)序列描述:SEQ ID NO:249:GCGCAGATCT TAACGCCGCA ACGAGGGCCG G                                     31(2)SEQ ID NO:250的信息:
(i)序列特征:
   (A)长度:46个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:NS2b的正向引物
(xi)序列描述:SEQ ID NO:250:GCGCGGATCC AAAATGATCG CTCGGGTGGT TGAGTGCTGT GTGATG                    46(2)SEQ ID NO:251的信息:
(i)序列特征:
   (A)长度:32个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:NS2b的反向引物
(xi)序列描述:SEQ ID NO:251:GCGCGGATCC AGGCGCGGTC GGAACAAACC CG                                   32(2)SEQ ID NO:252的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物NS3
(xi)序列描述:SEQ ID NO:252:GCGAGATCTA AAATGTGCGG AAAGGGCTTC TTGGGGGTC                            39(2)SEQ ID NO:253的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:反向引物NS3
(xi)序列描述:SEQ ID NO:253:GCGAGATCTC ATCTCCGGAC CAGGTCGTCC ACTATGTGG                            39(2)SEQ ID NO:254的信息:
(i)序列特征:
   (A)长度:31个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物NS4a
(xi)序列描述:SEQ ID NO:254:GGCGGATCCA AAATGATCGG TGTGGCGGAG G                                    31(2)SEQ ID NO:255的信息:
(i)序列特征:
   (A)长度:26个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:反向引物NS4a
(xi)序列描述:SEQ ID NO:255:GGCGGGATCC ATGCGCCGGA GCACGG                                          26(2)SEQ ID NO:256的信息:
(i)序列特征:
   (A)长度:34个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物NS4b
(xi)序列描述:SEQ ID NO:256:GCGGGATCCA AAATGATCAG CCTCACCCGC ACAG                                 34(2)SEQ ID NO:257的信息:
(i)序列特征:
   (A)长度:29个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:反向引物NS5a
(xi)序列描述:SEQ ID NO:257:GGCGGGATCC TACCTCCTGA TTACCACGT                                       29(2)SEQ ID NO:258的信息:
(i)序列特征:
   (A)长度:42个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物NS5a
(xi)序列描述:SEQ ID NO:258:GCGAGATCTA AAATGACCTC CGCCTATAAG CTGCTGCGCC AG                        42(2)SEQ ID NO:259的信息:
(i)序列特征:
   (A)长度:40个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:反向引物NS5a
(xi)序列描述:SEQ ID NO:259:GGCAGATCTA CCTCCGTCCC ACATTGTCTG GATTGCTAAC                           40(2)SEQ ID NO:260的信息:
(i)序列特征:
   (A)长度:43个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物NS5b
(xi)序列描述:SEQ ID NO:260:GCGAGATCTA AAATGGTGGA CAAGGTGACC TTCTGGCGTG CTC                        43(2)SEQ ID NO:261的信息:
(i)序列特征:
   (A)长度:36个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:反向引物NS5b
(xi)序列描述:SEQ ID NO:261:GCGAGATCTC ACCCGAAGAG GGCTACGATG AGCAGG                               36(2)SEQ ID NO:262的信息:
(i)序列特征:
   (A)长度:52个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:正向引物E1-E2-NS2a
(xi)序列描述:SEQ ID NO:262:GCGCAGATCT AAAATGAGCC GTGGTGGCAT TTCCTTTTTC TATACCATCA TG              52(2)SEQ ID NO:263的信息:
(i)序列特征:
   (A)长度:31个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:反向引物E1-E2-NS2a
(xi)序列描述:SEQ ID NO:263:GCGCAGATCT TAACGCCGCA ACGAGGGCCG G                                    31(2)SEQ ID NO:264的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物9E3-REV
(xi)序列描述:SEQ ID NO:264:GCTGGCTGAG GCACGGTTGG TC                                              22(2)SEQ ID NO:265的信息:
(i)序列特征:
   (A)长度:22个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物E39-94PR
(xi)序列描述:SEQ ID NO:265:CACCATCATC ACAGCATCTG GC                                              22(2)SEQ ID NO:266的信息:
(i)序列特征:
   (A)长度:32个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GEP-F12
(xi)序列描述:SEQ ID NO:266:GCAACCATGG AACCTGCCAA ACCCCTGACC TT                                   32(2)SEQ ID NO:267的信息:
(i)序列特征:
   (A)长度:21个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GEP-R12
(xi)序列描述:SEQ ID NO:267:AGCCCCATGG AAGGTCGTGA A                                               21(2)SEQ ID NO:268的信息:
(i)序列特征:
   (A)长度:30个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GEP-F14
(xi)序列描述:SEQ ID NO:268:TTGGGATCCC TCGTGTTCCG CCATTCTAAG                                     30(2)SEQ ID NO:269的信息:
(i)序列特征:
   (A)长度:30个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GEP-R13
(xi)序列描述:SEQ ID NO:269:TATGGATCCT GGTAAATCAT TGCCCCACCT                                      30(2)SEQ ID NO:270的信息:
(i)序列特征:
   (A)长度:39个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:引物470ep-F8
(xi)序列描述:SEQ ID NO:270:GCTGAATTCG CCATGGCGAC GTGCGCATTC AGGGGTGGA                            39(2)SEQ ID NO:271的信息:
(i)序列特征:
   (A)长度:27个碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:引物GEP-R14
(xi)序列描述:SEQ ID NO:271:GGAGGATCCG CGACCCGCCA CCGAAGT                                         27(2)SEQ ID NO:272的信息:
(i)序列特征:
   (A)长度:48个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:Y5表位
(xi)序列描述:SEQ ID NO:272:Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn1               5                   10                  15Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr
        20                  25                  30Glu Ala Glu Asn Ser Glu Leu Thr Glu Ala AsP Leu Pro Pro Ala Ala
    35                  40                  45(2)SEQ ID NO:273的信息:
(i)序列特征:
   (A)长度:55个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(iii)假设:无
(iv)反义:无
(vi)原始来源:
   (C)各分离株:Q9表位
(xi)序列描述:SEQ ID NO:273:Cys Gly Leu Leu Thr Arg His His Thr Ala Leu Asn His Pro Ser Gln1               5                   10                  15Thr Pro Gln Arg Gly Pro Gly His Gln Asp Leu Leu Gln Gly Pro Ile
        20                  25                  30Gln Arg Val Glu Gln Ala Lys Glu Lys Asp Gln Gly Asn His His His
    35                  40                  45His His Ser Ile Trp Pro Asp
50                  55(2)SEQ ID NO:274的信息:
(i)序列特征:
    (A)长度:35个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:Q11表位
(xi)序列描述:SEQ ID NO:274:Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp1               5                   10                  15Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser
        20                  25                  30Val Thr Ile
    35(2)SEQ ID NO:275的信息:
(i)序列特征:
    (A)长度:225个碱基对
    (B)类型:核酸
    (C)链型:两种
    (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:Q7-12-1env克隆
(xi)序列描述:SEQ ID NO:275:GTGCCCTTCG TCAACAGGAC AACTCTCTTC ACCATTAGGG GGCCCCTGGG CAACCAGGGC     60CGAGGCAACC CGGTGCGGTC GCCCTTGGGT TTTGGGTCCT ACGCCATGAC CAGGATCCGA    120GATACCCTAC ATCTGGTGGA GTGTCCCACA CCAGCCATCG AGCCTCCCAC CGGGACGTCT    180GGGTTCTTCC CCGGGACGCC GCCTCTCAAC AACTGCATGC ATATG                    225(2)SEQ ID NO:276的信息:
(i)序列特征:
    (A)长度:192个碱基对
    (B)类型:核酸
    (C)链型:两种
    (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:Y12-15-1NS3克隆DNA
(xi)序列描述:SEQ ID NO:276:AACATGGGGC ACAAGGTCTT AATCTTGAAC CCCTCAGTGG CCACTGTGCG GGCCATGGGC     60CCGTACATGG AGCGGCTGGC GGGTAAACAT CCAAGTATAT ACTGTGGGCA TGATACAACT    120GCTTTCACAA GGATCACTGA CTCCCCCCTG ACGTATTCAA CCTATGGGAG GTTTTTGGCC    180AACCCTAGGC AA                                                        192(2)SEQ ID NO:277的信息:
(i)序列特征:
    (A)长度:264个碱基对
    (B)类型:核酸
    (C)链型:两种
    (D)拓扑学:线性
(ii)分子类型:DNA
(iii)假设:无
(iv)反义:无
(vi)原始来源:
    (C)各分离株:Y12-10-2NS3克隆
(xi)序列描述:SEQ ID NO:277:CCCCTCGAGC GGATGCGAAC CGGAAGGCAC CTCGTGTTCT GCCATTCTAA GGCTGAGTGC     60GAGCGCCTTG CTGGCCAGTT CTCCGCTAGG GGGGTCAATG CCATTGCCTA TTATAGGGGT    120AAAGACAGCT CTATCATCAA GGATGGGGAC CTGGTGGTCT GTGCTACAGA CGCGCTTTCC    180ACTGGGTACA CTGGAAATTT CGACTCCGTC ACCGACTGTG GATTAGTGGT GGAGGAGGTC    240GTTGAGGTGA CCCTTGATCC CACC                                           264

Claims (25)

1.基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV),其中所述HGV的特征如下:(i)可在灵长目动物中传染,(ii)在血清学上与甲肝病毒(HAV)、乙肝病毒(HBV)、丙肝病毒(HCV)、丁肝病毒和戊肝病毒(HEV)不同,(iii)为黄热病毒(Flaviviridae)科病毒中的一种,和(iv)包含具有至少55%的序列与选自SEQ ID NO:14,SEQ ID NO:37和SEQ ID NO:19的多核苷酸同源的多核苷酸,或其互补链。
2.基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽,其中所述HGV:(i)具有权利要求1的HGV病毒的特征,和(ii)其特征进一步在于多肽的氨基酸序列具有至少40%的序列与选自SEQID NO:15的2873个氨基酸序列,SEQ ID NO:38的190个氨基酸序列以及SEQ ID NO:20的67个氨基酸序列的氨基酸序列同源性。
3.权利要求2的多肽,包含一种与至少一种抗HGV抗体特异性发生免疫反应的抗原,它被抗原可特异性地与来自HGV阳性个体的体液或组织样品发生免疫反应而得以证实。
4.通过重组DNA的表达而制备的权利要求2的多肽,包含被SEQID NO:14编码或被SEQ ID NO:14的互补链编码的多肽序列。
5.权利要求2的多肽,为由HGV多肽和第二种多肽组成的重组融合多肽,其中所述第二个多肽选自β-半乳糖苷酶蛋白质,谷胱甘肽-S-转移酶蛋白质和形成颗粒的蛋白质。
6.权利要求2的多肽,包含由HGV基团组,cDNA或它的互补链编码的至少15个连续氨基酸的序列,其中所述氨基酸序列选自(i)SEQ ID NO:15的2873个氨基酸序列或它的片段,(ii)SEQ ID NO:38的190个氨基酸序列或它的片段,(iii)SEQ ID NO:20的67个氨基酸序列或它的片段,和(iv)编码在PNF2161cDNA来源的λgt11文库的氨基酸序列。
7.一种诊断试剂盒,包含
权利要求3的多肽抗原,和
用于检测通过所述抗原与所述样品中的抗体的特异性免疫反应形成的免疫复合物的工具。
8.权利要求7的诊断试剂盒用于筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的体液或组织样品的用途。
9.权利要求7的诊断试剂盒用于筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的血清的用途。
10.一种诊断试剂盒,用于筛选含有非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原的体液或组织样品,包含
基本上分离的特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽抗原发生免疫反应的抗体,和
用于检测所述多肽抗原与所述抗体结合的试剂。
11.检测试验个体中非甲非乙非丙非丁非戊肝炎病毒(HGV)的感染的方法,包括
将来自试验个体的体液或组织样品与权利要求9的试剂盒的基本上分离的HGV特异性抗体反应,和
检验抗体中是否有结合的抗原.
12.特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原发生免疫反应的单克隆抗体。
13.特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原发生免疫反应的基本上分离的多克隆抗体的制剂。
14.一种筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的体液或组织样品的方法,包括
将样品与权利要求3的多肽抗原接触,
检测通过所述抗原与所述样品中的抗体发生的特异性免疫反应形成的免疫复合物。
15.一种产生权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的方法,包括
将足够量的基本上分离的权利要求2的HGV多肽施给试验个体以产生免疫应答,该HGV多肽包含含有特异性地与至少一种抗HGV抗体发生免疫反应的表位的抗原。
16.一种镶嵌型多肽,包含
至少两种权利要求3的不同抗原,其中所述镶嵌型多肽缺乏正常间插在天然HGV多肽中的所述抗原之间的氨基酸。
17.一种非甲非乙非丙非丁非戊肝炎病毒(HGV)疫苗组合物,包括
以药理学有效剂量存在于药学上可接受的载体中的权利要求3的基本上分离的HGV多肽。
18.一种基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多核苷酸,其中所述HGV具有权利要求1的HGV病毒的特征。
19.权利要求18的多核苷酸,它具有至少55%序列同源于选自SEQ ID NO:14,SEQ ID NO:37和SEQ ID NO:19的多核苷酸,或其互补链。
20.权利要求18的可用于非甲非乙非丙非丁非戊肝炎病毒(HGV)的PCR检测的多核苷酸。
21.一种检测试验个体中的非甲非乙非丙非丁非戊肝炎病毒(HGV)核酸的方法,包括
从受试个体中获得含有核酸的样品,
在适宜的杂交条件下,将含有核酸的样品和权利要求18的多核苷酸或其片段组成的探针结合,并且
检测通过HGV核酸与所述探针杂交形成的HGV核酸/探针复合物的存在。
22.权利要求21的方法,其中所述检测包括使用HGV核酸特异性探针,其中两个探针确定HGV核酸的内在区域,每个探针具有含有位于该区内的3’末端的一条链,通过引物伸展反应,将核酸/探针杂交复合物转化为含有探针的双链片段,
通过下面连续重复的步骤扩增含有探针的片段的数目,(i)变性双链片段,产生单链片段,(ii)将单链与探针杂交,形成链/探针复合物,(iii)在酶和四种脱氧核糖核苷酸存在下从链/探针复合物产生双链片段,和(iv)重复步骤(i)-(iii)直至达到所需水平的扩增,
鉴定扩增产物。
23.一种分析样品中来自权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的多核苷酸是否存在的试剂盒,包含
至少一种含有特异性地与权利要求18的HGV多核苷酸杂交的核苷酸序列的多核苷酸探针,以及一种适宜容器。
24.一种能在适宜条件下表达来自非甲非乙非丙非丁非戊肝炎病毒(HGV)基因组的cDNA的可读框(ORF)或其互补链的克隆载体,其中所述病毒具有权利要求1的特征,ORF被可操作地连接至与所需宿主相容的控制序列上。
25.一种产生非甲非乙非丙非丁非戊肝炎病毒(HGV)的多肽的方法,包括
在导致可读框(ORF)表达的条件下,培养用权利要求24的载体转化的细胞。
CN95194249A 1994-05-20 1995-05-19 庚型肝炎病毒及其分子克隆 Expired - Fee Related CN1125877C (zh)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US24698594A 1994-05-20 1994-05-20
US08/246,985 1994-05-20
US28555894A 1994-08-03 1994-08-03
US28554394A 1994-08-03 1994-08-03
US08/285,543 1994-08-03
US08/285,558 1994-08-03
US32972994A 1994-10-26 1994-10-26
US08/329,729 1994-10-26
US34427194A 1994-11-23 1994-11-23
US08/344,271 1994-11-23
US35750994A 1994-12-16 1994-12-16
US08/357,509 1994-12-16
US38988695A 1995-02-15 1995-02-15
US08/389,886 1995-02-15

Publications (2)

Publication Number Publication Date
CN1153529A CN1153529A (zh) 1997-07-02
CN1125877C true CN1125877C (zh) 2003-10-29

Family

ID=27569460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95194249A Expired - Fee Related CN1125877C (zh) 1994-05-20 1995-05-19 庚型肝炎病毒及其分子克隆

Country Status (16)

Country Link
EP (1) EP0763114B1 (zh)
JP (2) JPH10503642A (zh)
KR (1) KR100394693B1 (zh)
CN (1) CN1125877C (zh)
AT (1) ATE210185T1 (zh)
CA (1) CA2190860A1 (zh)
DE (1) DE69524407T2 (zh)
DK (1) DK0763114T3 (zh)
ES (1) ES2170152T3 (zh)
FI (1) FI112249B (zh)
HK (1) HK1012412A1 (zh)
MX (1) MX9605666A (zh)
NO (1) NO323849B1 (zh)
NZ (1) NZ288000A (zh)
PT (1) PT763114E (zh)
WO (1) WO1995032291A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9594163B2 (en) 2013-04-15 2017-03-14 Electronics And Telecommunications Research Institute Security and surveillance system and method

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6720166B2 (en) 1994-02-14 2004-04-13 Abbott Laboratories Non-a, non-b, non-c, non-c, non-d, non-e hepatitis reagents and methods for their use
US6156495A (en) * 1994-02-14 2000-12-05 Abbott Laboratories Hepatitis GB virus recombinant proteins and uses thereof
US6451578B1 (en) 1994-02-14 2002-09-17 Abbott Laboratories Non-A, non-B, non-C, non-D, non-E hepatitis reagents and methods for their use
US5981172A (en) * 1994-02-14 1999-11-09 Abbott Laboratories Non-A, non-B, non-C, non-D, non-E Hepatitis reagents and methods for their use
US5843450A (en) * 1994-02-14 1998-12-01 Abbott Laboratories Hepatitis GB Virus synthetic peptides and uses thereof
US6558898B1 (en) 1994-02-14 2003-05-06 Abbott Laboratories Non-A, non-B, non-C, non-D, non-E hepatitis reagents and methods for their use
US6586568B1 (en) 1994-02-14 2003-07-01 Abbott Laboratories Non-A, non-B, non-C, non-D, non-E hepatitis reagents and methods for their use
US6051374A (en) * 1994-02-14 2000-04-18 Abbott Laboratories Non-A, non-B, non-C, non-D, non-E hepatitis reagents and methods for their use
US5955318A (en) * 1995-08-14 1999-09-21 Abbott Laboratories Reagents and methods useful for controlling the translation of hepatitis GBV proteins
US5807670A (en) * 1995-08-14 1998-09-15 Abbott Laboratories Detection of hepatitis GB virus genotypes
US5709997A (en) * 1995-08-14 1998-01-20 Abbott Laboratories Nucleic acid detection of hepatitis GB virus
JPH10511003A (ja) * 1995-11-21 1998-10-27 ベーリンガー マンハイム ゲーエムベーハー 核酸の増幅及び新規な非a/非b/非c/非d/非e型肝炎ウイルスの検出
IT1283893B1 (it) * 1996-01-24 1998-05-07 Sorin Biomedica Diagnostics Sp Metodo per rilevare sequenze nucleotidiche di virus associati a epatiti nona-none, peptidi e composizioni
DE19613406A1 (de) * 1996-04-03 1997-10-09 Boehringer Mannheim Gmbh Expression von HGV-Antigenen und deren Verwendung
IT1284630B1 (it) * 1996-04-17 1998-05-21 Sorin Biomedica Diagnostics Sp Epitopi specifici di virus associati a epatiti non"a"-non"e", composizioni e metodo per rivelare anticorpi di detti epitopi.
US5766916A (en) * 1996-04-24 1998-06-16 Genelabs Technologies, Inc. Hepatitis G virus protease
EP0832901A1 (de) * 1996-09-18 1998-04-01 Roche Diagnostics GmbH Antikörper gegen Hepatitis G-Virus und deren Verwendung zum diagnostischen Nachweis von HGV sowie als Therapeutikum
WO1999024466A2 (en) 1997-11-06 1999-05-20 Innogenetics N.V. Multi-mer peptides derived from hepatitis c virus envelope proteins for diagnostic use and vaccination purposes
GB0009756D0 (en) * 2000-04-19 2000-06-07 Glaxo Group Ltd Test method
JPWO2014097762A1 (ja) * 2012-12-20 2017-01-12 国立大学法人 熊本大学 高病原性トリインフルエンザに対する抗体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990000597A1 (en) * 1988-07-06 1990-01-25 Genelabs Incorporated Post-transfusion, non-a, non-b hepatitis virus and antigens
WO1994018217A1 (en) * 1993-02-03 1994-08-18 Abbott Laboratories Non-a, non-b, non-c, non-d, non-e hepatitis reagents and methods for their use

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995021922A2 (en) * 1994-02-14 1995-08-17 Abbott Laboratories Non-a, non-b, non-c, non-d, non-e hepatitis reagents and methods for their use

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990000597A1 (en) * 1988-07-06 1990-01-25 Genelabs Incorporated Post-transfusion, non-a, non-b hepatitis virus and antigens
WO1994018217A1 (en) * 1993-02-03 1994-08-18 Abbott Laboratories Non-a, non-b, non-c, non-d, non-e hepatitis reagents and methods for their use

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THEAMERICANJOURNALOFGASTROENTEROLOGY,VOL.89,NO.1 1994-01-01 S.K.KUWADAET,AL,"NON-A,NON-B,FULMINANT,HEPATITIS,IS,ALSO,NON-E,AND,NON-C *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9594163B2 (en) 2013-04-15 2017-03-14 Electronics And Telecommunications Research Institute Security and surveillance system and method

Also Published As

Publication number Publication date
AU2689595A (en) 1995-12-18
ES2170152T3 (es) 2002-08-01
JP4296174B2 (ja) 2009-07-15
JPH10503642A (ja) 1998-04-07
EP0763114B1 (en) 2001-12-05
MX9605666A (es) 1998-05-31
FI964605A (fi) 1997-01-15
WO1995032291A2 (en) 1995-11-30
EP0763114A2 (en) 1997-03-19
JP2006115845A (ja) 2006-05-11
KR970703425A (ko) 1997-07-03
HK1012412A1 (en) 1999-07-30
CA2190860A1 (en) 1995-11-30
NO964721D0 (no) 1996-11-07
DE69524407D1 (de) 2002-01-17
NO323849B1 (no) 2007-07-09
AU684177B2 (en) 1997-12-04
PT763114E (pt) 2002-05-31
FI112249B (fi) 2003-11-14
FI964605A0 (fi) 1996-11-18
CN1153529A (zh) 1997-07-02
WO1995032291A3 (en) 1996-03-07
DE69524407T2 (de) 2002-08-01
NO964721L (no) 1997-01-17
DK0763114T3 (da) 2002-04-02
NZ288000A (en) 1998-09-24
KR100394693B1 (ko) 2003-12-31
ATE210185T1 (de) 2001-12-15

Similar Documents

Publication Publication Date Title
CN1125877C (zh) 庚型肝炎病毒及其分子克隆
CN1159584C (zh) 检测抗丙型肝炎病毒抗体的方法和药盒
EP0651807B1 (en) New sequences of hepatitis c virus genotypes and their use as therapeutic and diagnostic agents
CN100339395C (zh) 戊型肝炎病毒单克隆抗体及其用途
US5824507A (en) Hepatitis G virus and molecular cloning thereof
CN1268980A (zh) 用于鉴定选择性抑制丙型肝炎病毒复制的试剂的新筛选方法
CN1451014A (zh) 模拟肽蛋白酶抑制剂
JPH06508026A (ja) 診断と治療に用いるhcvゲノム配列
CN1833022A (zh) 包含HCV的多蛋白NS3/NS4和多肽NS5b的组合物,包括相应核酸序列的表达载体及它们的治疗应用
CN1059758A (zh) 非a非b型肝炎病毒颗粒
CN1622828A (zh) 用于诊断和治疗用途的纯化的丙型肝炎病毒外被蛋白
CN1741817A (zh) 丙型肝炎病毒密码子优化的非结构ns3/4a融合基因
CN1469755A (zh) 包含病毒唑的疫苗及其使用方法
CN1678630A (zh) 具有修饰的ns3结构域的hcv融合蛋白
CN1195774C (zh) 新的hev抗原肽及方法
CN1053196C (zh) 用于丙型肝炎病毒分类的抗原肽, 含有所述肽的药盒及用所述肽进行分类的方法
US5874563A (en) Hepatitis G virus and molecular cloning thereof
CN1547588A (zh) 用于诊断和治疗用途的纯化的丙型肝炎病毒外被蛋白
AU684177C (en) Hepatitis G virus and molecular cloning thereof
CN1075147A (zh) 非甲、非乙型肝炎病毒的中国分离种群、组合物和方法
Birkett Expression, Purification and Characterization of Hepatitis C Virus Core Protein from E. Coli Using a Chemically Synthesized Gene (1), and Cloning, Expression, Purification and Characterization of the Major Core Protein (P26) from Equine Infectious Anaemia Virus
KR20090085268A (ko) 항 ns5b 항체를 포함하는 c형 간염 바이러스 매개간질환 예방 및 치료제

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031029

Termination date: 20100519