CN1125877C

CN1125877C - 庚型肝炎病毒及其分子克隆

Info

Publication number: CN1125877C
Application number: CN95194249A
Authority: CN
Inventors: J·P·金; K·E·弗莱; L·M·杨格; J·M·林伦; J·韦杰斯
Original assignee: Genelabs Technologies Inc
Current assignee: Genelabs Technologies Inc
Priority date: 1994-05-20
Filing date: 1995-05-19
Publication date: 2003-10-29
Anticipated expiration: 2015-05-19
Also published as: AU2689595A; ES2170152T3; JP4296174B2; JPH10503642A; EP0763114B1; MX9605666A; FI964605A; WO1995032291A2; EP0763114A2; JP2006115845A; KR970703425A; HK1012412A1; CA2190860A1; NO964721D0; DE69524407D1; NO323849B1; AU684177B2; PT763114E; FI112249B; FI964605A0

Abstract

本发明公开了一类多肽抗原，其可与患有非甲非乙非丙非丁非戊型肝炎个体的血清发生免疫反应，这里称之为庚型肝炎病毒(HGV)。公开了包含抗原多肽的多核苷酸编码的开放阅读框序列的相应的基因组片段的克隆。该抗原用于检测试验个体是否有HGV的诊断方法。该抗原也有用于疫苗和抗原的制备。此外，揭示了两个HGV分离株的完整编码序列。提出了以核酸为基础的样品中HGV的检测方法，以及HGV有关的其它基因组序列的分离方法。

Description

庚型肝炎病毒及其分子克隆

发明领域

本发明涉及与非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒性致病原(HGV)相关的核酸、多肽、抗原、表位、疫苗和抗体组合物。本发明还涉及诊断和治疗方法。参考文献：

1992年圣地亚哥会议摘要：基因识别，临床化学。 39(4)：705(1993)。

Alexander，W.A.等《病毒学杂志》 66：2934-2942(1992)。

Alter，H.J.等《新英格兰医学杂志》 321：1494-1500(1989a)。

Alter，M.J.等《新英格兰医学杂志》 327：1899(1989b)。

Alter，H.J.，病毒性肝炎和肝疾病国际会议摘要，第47页(1993)。

Altschul，S.等，《分子生物学杂志》，215：403-10(1990)。

Ascadi，G.等，《自然》 352：815(1991)。

Ausubel，F.M.等，当今分子生物学备忘录，John Wiley和Sons，包括医学PA。

Barany，F.，《聚合酶链反应方法的应用》， 1：5(1991)。

Barham，W.B.等《药学病毒学杂志》，42：129-132(1994)。

Baron，S.等，JAMA 266：1375(1991)。

Bazan，J.F.等，《病毒学》 171：637-639(1989)。

Beames等，《生物技术》 11：378(1991)。

Belyavsky，A.等，《核酸研究》 17：2929-2932(1989)。

Blackburn，G.F.等《临床化学》37：1534-1539(1991)。

Bradley，D.W.等，《感染性疾病杂志》，148：2(1983)。

Bradley，D.W.等，《普通病毒杂志》，69：1(1988)。

Bradley，D.W.等《美国国家科学院院刊》，84：6277(1987)。

Briand，J.-P.等，《免疫学方法杂志》，156：255(1992)。

Cahill，P.等，《临床化学》 37：1482(1991)。

Carter，J.M.等，《分子生物学方法》 36：207-223(1994)。

Chamber，T.J.等，《微生物研究年鉴》 44：649(1990a)。

Chamber，T.J.等，PNAS 87：8898(1990b)。

Chomczynski等，《生物化学年刊》162：159(1987)。

Christian，R.B.等，《分子生物学杂志》， 227：771(1992)。

Commandaeur等，《病毒学杂志》 198：282-287(1994)。

Crea，R.等，1989年12月19日出版的号为4,888,286的美国专利。

DeGraaf，M.E.等，《基因》 128：13(1993)。

DiBisceglie，A.M.等，《肝脏学》 16：649(1992)。

DiBisceglie，A.M.等，NEJM 321：1506(1989)。

Dicesare，J.等，《生物技术》15：152-157(1993)。

Dienstag，J.L等，《肝脏疾病的扫描电子显微镜研究》 6：67(1986)。

Earl.P.L等，当代分子生物学备忘录“使用疫苗的哺乳动物细胞中的蛋白质表达”(F.M.Ausubel等编)，Greene出版协会和Wiley交叉科学，纽约(1991)。

Eaton，M.A.W.等，1988年1月12日出版的号为4,719,180的美国专利。

Egholm等，《自然》 356：566(1993)。

Elroy-Stein，O.等，《美国国家科学院院刊》 86：6126-6130(1989)。

88年11月18日申请的申请号为88310922.5的欧洲专利申请。

Falkner，F.G.等，《病毒学杂志》 62：1849-1854(1988)。

Farci，P.等，NEJM 330：88(1994)。

Felgner和Rhodes，《自然》 349：257(1991)。

Fickett，J.W.《核酸研究》 10：5303-53l8(1982)。

Fling，S.P.等，《分析生物化学》 155：83-88(1986)。

Folgori，A.等，《EMBO杂志》 13：2236(1994)。

Francki，R.I.B.等，《古病毒学》增刊 12：223(1991)。

Frank，R.和Doring，R.《四面体》 44：603-6040(1988)。

Frohman，M.A.等，《美国国家科学院院刊》 85：8998-9002(1988)。

Fuerst，T.R.等，《美国国家科学院院刊》 83：8122-8126(1986)。

Gellissen，G.等，Antonie Van Leeuwenhoek， 62(12)：79-93(1992)。

Geysen，M.等，《美国国家科学院院刊》 81：3998-4002(1984)。

Gingeras，T.R.等，《临床生物学年鉴》 48：498(1990)。

Gingeras，T.R.等《感染性疾病杂志》 164：1066(1991)。

Goeddel，D.V.《酶学方法》 185(1990)。

Grakoui，A.等，《病毒学杂志》 67：2832(1993)。

Grakoui.A.等，《病毒学杂志》 67：1385-1395(1993)。

Guatelli，J.C.等，《美国国家科学院院刊》 87：1874(1990)。

Gubler，U.等，《基因》，25：263(1983)。

Guthrie，C.和G.R.Fink，《酶学方法》 194(1991)。

Gutterman，J.U.PNAS 91：1198(1994)。

Harlow，E.等，抗体：实验室手册，冷泉港实验室出版(1988)。

Haynes，J.等，《核酸研究》 11：687-706(1983)。

Hieter，P.A.等，《细胞》22：197-207(1980)。

Hijikata，M.等，PNAS 88：5547(1991)。

Hochuli，Z，在基因工程原理和实验操作第12卷中(J.stelow编)Plenum，NY，第87-98页(1990)。

Holodniy，M.等，《生物技术》 12：36(1992)。

Hopp，T.P.等，《美国国家科学院院刊》 78：3824-3828(1981)。

Horn，T.和Urdea，M.S.《核酸研究》 17：6959(1989)。

Houghten，R.A.，《美国国家科学院院刊》 82：5131(1985)。

Hudson，D.《有机化学杂志》 53：617(1988)。

Irwin，M.J.等，《病毒学杂志》 58：5036(1994)。

Jacob，J.R.等，在 HCV的分子生物学中的第4部分，第387-392页中(1991)。

Jacob，J.R.等，《肝脏学》 10：921-927(1989)。

Jacob，J.R.等，《感染性疾病杂志》 161：1121-1127(1990)。

Janknecht，R.等，《美国国家科学院院刊》 88：8972-8976(1991)。

Kaufman，R.J.在《酶学方法》第185卷，第537-566页中的“哺乳动物细胞中的异种基因的选择和扩增”，学院出版股份有限公司，圣地亚哥CA(1991)。

Kakumu，S.等，《胃肠学》 105：507(1993)。

Katz，E.D.和Dong，M.《生物技术》 8：546(1990)。

Kawasaki，E.S.等，在 PCR技术：DNA扩增的原理和应用(H.A.Zrlich编)Stockton出版。

King，L A.等，《杆状病毒表达系统》，实验室指南，Chapman和Hall，伦敦，纽约，东京，墨尔本，马德拉斯，1992。

Kyte，J.和Doolittle，R.F.《分子生物学杂志》 157：105-132(1982)。

Koonin，E.V.和Dolja，V.V.《生物化学和分子生物学关键性综述》28：375-430(1993)。

Krausslich，H.G.等，作为化学疗法目标的病毒蛋白酶(冷泉港出版，PLainville，纽约)(1989)。

Kumar，R.等，《艾滋病研究人反转录病毒》 5(3)：345-354(1989)。

Landford，R.E.等，体外细胞发育生物学 25：174-182(1989)。

Larder，B.A.和Kemp，S.D.《科学》 246：1155(1989)。

Lau，Y.F.等，《分子细胞生物学》 4：1469-1475(1984)。

Lomell，H.等，《临床化学》 48：492(1990)。

Maniatis，T.等，分子克隆：实验手册，冷泉港实验室(1982)。

Marshall，W.S.和Caruthers，M.H.《科学》 259：1564(1993)。

Messing，J.，《酶学方法》 101：20(1983)。

Michelle等，病毒性肝炎国际会议。

Miller，J.H. 分子遗传学实验，冷泉港实验室，冷泉港，纽约(1972)。

Morrissey，D.V.等，《分析生物化学》 181：345(1989)。

Moss，B.等，分子生物学通讯(第四部分，第16单元)1991)。

Moss，B.等，1992年8月4日出版的号为5,135,855的美国专利。

Mullis，K.B.，1987年7月28出版的号为4,683,202的美国专利。

Mullis，K.B.等，1987年7月28日出版的号为4,683,195的美国专利。

Obeid，O.E.等，《病毒研究》 32：69-84(1994)。

Osikowicz，G.等，《临床化学》 36：1586(1990)。

Patterson，J.L和Fernandez-Larsson，R.《感染性疾病综述》 12：1139(1990)。

Pearson，W.R.和Lipman，D.J.PNAS 85：2444-2448(1988)。

Pearson，W.R.《酶学方法》 183：63-98(1990)。

Pitha，《生物化学生物物理Acta》， 204：39(1970a)。

Pitha，《生物多聚体》， 9：965(1970b)。

Porath，J.，《蛋白质实验和纯化》 3：263(1992)。

Pritchard，C.G.和Stefano，J.E.，《生物化学年鉴》 48：492(1990)。

Reichard，O.等，《柳叶刀》 337：1058(1991)。

Reilly，P.R.等，杆状病毒表达载体，实验室手册(1992)。

Reyes，G.等，《科学》，247：1335(1990)。

Reyes，G.等，《分子和细胞探针》 5：473-481(1991)。

Rice，C.M.等，《新生物》 1：285-296(1989)。

Roberts，N.A.等，《科学》 248：358(1990)。

Romanos，M.A.等，《酵母》 8 167：423-488(1992)。

Sanger等，《美国国家科学院院刊》74：5463(1977)。

Sambrook，J.等，在分子克隆：实验室手册中，冷泉港实验室出版，第2卷(1989)。

Saiki，R.K.等，《科学》 239：487-491(1988)。

Schagger，H.等，《生物化学年鉴》 166：368-379(1987)。

Scharf，S.J.等，《科学》 233：1076(1986)。

Schuler，G.D.等，《蛋白质：结构，功能和基因》 9：180(1989)。

Scott，J.K.等，《美国国家科学院院刊》 89：5398(1972)。

Smith，D.B.等，《基因》 67：31(1988)。

Smith，J.P.《目前鉴定用的生物技术》 2：668(1991)。

Sreenivasan，M.A.等，《普通病毒学杂志》 65：1005(1984)。

Sumiyoshi，H.等，《病毒学杂志》 66：5425-5431(1992)。

Summerton，J.等，92年8月25日出版的号为5,142,047的美国专利。

Summerton，J.等，93年2月9日出版的号为5,185,444的美国专利。

Tam，A.等，《病毒学》 185：120(1991)。

Tam，J.P.，《美国国家科学院院刊》 85：5409(1988)。

Tessier，D.C.《基因》 98：177-183(1991)。

Tonkinson，J.L和Stein，C.A.《抗病毒化学和化学疗法》 4(4)：193-200(1993)。

Ulmet等，《科学》 259：1745(1993)。

Urdea，M.《临床化学》 39：725(1993)。

Urdea，M.等，《艾滋病》 7：S11(1993)。

Wages，J.M.等，《扩增》10：1-6(1993)。

Walker，G.T.《PCR方法的应用》 3：1-6(1993)。

Wang，A.M等，在PCR记录，方法和应用指南中(M.A.Innis等编)学院出版社(1990)。

Wang，B.等，《美国国家科学院院刊》 90：4156(1993)。

Whetsell，A.J.等，《临床显微学杂志》 30：845(1992)。

Wolf，J.A.等，《自然》 247：1465(1990)。

Vacca，J.P.等，PNAS 91：4096(1994)。

VanGemen，B.等，《病毒学方法杂志》 43：177(1993)。

Valenzuela，P.等，《自然》 298：344(1982)。

Valenzuela，P.等，在《乙型肝炎》中，I.Millman等编，Plenum出版，第225-236页(1984)。

Yarbrough等，《病毒学杂志》65：5790(1991)。

Yoo，B.J.等，《病毒学杂志》 69：32-38(1995)。

Yoshio.T.等，1989年7月18日出版的号为4,849,350的美国专利。

Zhang，Y.等，《病毒学杂志》 65：6101-6110(1991)。发明背景

由一种不是甲型和乙型肝炎病毒引进的病毒性肝炎被称为非甲非乙型肝炎(HANAH)。根据某一个体类型的传播方式，例如，肠道的和非肠胃的，可将NANBH进一步分类。

第一种形式的NANBH，称为肠道传播的NANBH或ET-NANBH，主要是在环境卫生条件较差的地区发病，那里的食物和饮水被粪便物污染了。最近，阐述了称为戊型肝炎病毒(HEV)的致病原体的分子克隆(Reyes等，1990；Tam等)。

第二种形式的NANBH，称为非肠胃传播的NANBH或PT-NANBH，通过非肠胃途径传播，典型的是接触血液或血液制品。这种肝炎的发病率随下列三方面变化：(1)场所，(2)对血库是否做了丙氨酸转氨酶(ALT)检查，(3)消除高危病人患获得性免疫缺损综合症(AIDS)。大约有10％的输血引起PT-NANBH感染，并且其中的一半人转为慢性状态(Dienstag)。在完成抗HCV检查后，心脏手术病人(Alter)每单位输入血液的HCV血清转化率降到不足1％。

被证明已在人类受血者中产生输血后NANBH的人血浆样品，已成功地用于在黑猩猩(Bradely)中产生PT-NANBH感染。从感染黑猩猩血浆中分离的RNA，已用于在一个表达载体上构建cDNA文库，以免疫筛选慢性PT-NANBH感染人类个体的血清。此方法确定了一个PT-NANBH特异性的cDNA克隆，然后此病毒序列被用作探针去鉴定一组由PT-NANBH病毒体的7,300个连续碱基对组成的重叠片段。该已测序的病毒体被命名为丙型肝炎病毒(HCV)(例如，1988年11月18日申请的EPO专利申请88310922.5中所列的HCV序列)。现已能得到HCV的完整序列(约为9,500核苷酸)。

疾病控制中心(CDC；Phoenix，AZ，1973-1975；1978-17983)对灵长类动物的传染研究，最先提供了大量证据，证明多种非甲非乙型肝炎(NANBH)病原体的存在：与大多数NANBH病例有关的主要病原体现在已确认为HCV和HEV(参见上面)，分别对应于PT-NANBH和ET-NANBH。疾病控制中心(CDC；Atlanta，GA，1989-现今)利用模型研究和商业检测对抗HGV抗体进行的最近流行病学研究表明所有后天获得的NANBH群体中约有20％也是非丙型肝炎。对这些样品是否有HEV的进一步检查(Reyes，等，WOA9115603(Genelabs Ins.)1990年10月17日)已经表明，这些后天获得非甲非乙非丙型肝炎病例也是非戊型的。

Sentinel县的病人肝脏活体组织样品、血清和血浆(Drs.MiriamAlter和Kris Krawczynski的研究)，也表明许多真正的NANBH病例也是非丙型肝炎(所有HCV感染标记的血清学上和逆转录酶-聚合酶链式反应(RT-RCR；Kawasaki，等；Wang，等，1990)呈阴性)，后来，这些肝炎病例发展为慢性肝炎，并表现为与病毒感染相同的迁延性肝炎(CPH)和慢性活动性肝炎(CAH)两种状态。发明概述

本发明是关于一种新发现的非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒病原体的鉴定分离，这里称之为庚型肝炎病毒(HGV)。本文揭示了部分HGV基因组的一族cDNA复制物。同时也公开了HGV序列和HGV变异体序列的分离和鉴定方法。

本发明包括HGV基因组多核苷酸、cDNA及其互补链。谈到多核苷酸，发明包括下面几方面：纯化的庚型肝炎病毒基因组多核苷酸；由HGV衍生的RNA和DNA多核苷酸；重组HGV多核苷酸；由从HGV或HGV变异体cDNA或它们的互补序列来源的序列组成的重组多核苷酸；编码HGV表位的重组多核苷酸；包括上述任一重组多核苷酸的一个重组载体，以及这些载体之一转化的宿主细胞。本发明的另一个方面是HGV和/或其变异体的多核苷酸探针。

当前利用序列信息把HGV与其它病毒序列比较，对HGV基因组特性进行研究，表明HGV是病毒种黄热病毒科(flavivirididae)的成员。

部分HGV衍生的cDNA序列的部分序列能被作为探针用于分离自然发生的病毒变异体，或确定样品中是否有病毒。这些cDNA序列也产生有用的HGV编码的多肽序列，包括HGV特异的多肽抗原。这些编码序列允许在诊断试验中作为试剂和/或作为疫苗成分，或作为标准物的多肽的产生。另外，利用这些cDNA序列来源的探针，可以对该HGV基因组其它部分进行分离和测序，因此得到有用于预防、治疗和诊断应用中的另外的探针和多肽。

本发明的其它几方面包括：掺入从HGV的cDNA或其互补链来源的一个开放阅读框(ORF)的一个重组表达系统，其中ORF与所需宿主相容的一段控制序列可操作地连接；用重组表达系统转化的细胞；以及由该转化细胞产生的多肽。

本发明的再一方面是：纯化的HGV颗粒；来自纯化的HGV的多肽制剂；纯化的HGV多肽；纯化的HGV肽；以及由一个表位组成的纯化多肽，该表位在免疫学上可识别HGV或HGV变异体带有的一个表位。

本发明包括的方面是：HGV多肽；由来自HGV基因组、HGV的cDNA或其互补链的序列构成的重组多肽；有一个HGV表位组成的重组多肽；以及由一个HGV多肽组成的融合多肽。

抗多肽序列中含有的HGV表位的单克隆和多克隆抗体，也用作治疗剂用于诊断试验，将cDNA来源的HGV病原体的分离，并且用于抗病毒试剂的筛选。

本发明还包括：抗一个HGV表位的多克隆抗体的制剂和抗多个HGV表位的单克隆抗体。

本发明涉及试剂盒的几方面是：在适宜容器中，调查样品中是否有HGV来源的多核苷酸，该多核苷酸包含一个多核苷酸探针，该探针包括大约8个或更多个核苷酸的HGV的一段核苷酸序列；分析样品中是否有抗HGV抗原的抗体，该HGV抗原由一段多肽组成，该多肽含有HGV抗原中存在的一个HGV表位；在适宜容器中分析样品中是否有HGV抗原，该HGV抗原由一个抗HGV的抗体组成。

本发明的其它方面还包括：吸附于一固体底物上的由一个HGV表位组成的一段多肽；吸附于一固体底物上的抗一个HGV表位的一种抗体。

本发明的其它方面是：产生一个HGV多肽的方法，包括在允许上面提及的多肽表达的条件下由一个表达载体转化的宿主细胞的培育，该表达载体含有编码一种HGV多肽的一段序列的；以及已由该方法产生的多肽(例如，含有一个HGV表位)。

本发明还包括：检测样品中HGV核酸的方法，包括使样品中的核酸与HGV多核苷酸探针在允许探针和样品的HGV核酸两者间形成多核苷酸双链体的条件下反应；以及检测含有该探针的多核苷酸双链体。本发明包括以下面杂交为基础的检测方法：报告分子标记；聚合酶链式反应；自我维持序列扩增；连接酶链式反应和链置换扩增。另外，检测方法包括信号放大(例如，支链DNA探针和Q-β复制酶方法)。

本发明还包括免疫检验法，有检测HGV的免疫检验法，包括在允许形成抗原-抗体复合物的条件下，将一个样品(怀疑其为HGV所感染)与抗HGV抗原/表位的探针抗体一起培育；以及检测含有该探针抗体的抗原-抗体复合物。检测抗HGV抗原的抗体的免疫检验法，包括将怀疑含有HGV的样品和含HGV表位的探针多肽在允许形成抗原-抗体复合物的条件下进行培育；并识别含探针抗原的抗体-抗原复合物。

本发明的另一方面是HGV疫苗，用于治疗和/或防制HGV感染，包括含有一个HGV表位的一个免疫原性多肽，或一个灭活的HGV制剂，或一个减毒的HGV制剂。

在另一个方面，本发明包括一个由HGV感染的组织培养细胞。在一个实施方案中，该组织培养细胞是灵长类动物肝脏细胞。

本发明的另一方面是产生HGV抗体的方法，包括将一个含有HGV表位的免疫原性多肽以适当的量投药给一个试验个体，促使产生免疫反应。

本发明还包括一个HGV嵌合多肽，该嵌合多肽含有至少两个HGV表位，并且该多肽基本上缺乏在天然HGV编码序列的表位间正常插入的氨基酸。这种嵌合多肽有用于上面讨论中的应用和方法。

本发明进一步包括表位递呈过程中模拟天然HGV抗原表位的一个随机肽表位(模拟表位)。这种模拟表位有用于上面讨论中的应用和方法。本发明还包括鉴定随机肽HGV表位的方法。在该方法中，产生或选择一个随机肽表位的文库。该文库与一个抗HGV抗体有关。模拟表位被鉴定为与抗体发生特异性免疫反应。可以使用由本发明的方法所产生的含抗HGV抗体的血清(含抗HGV抗体)或抗体。例如，随机肽文库能在噬菌体上表现或产生组合文库。

在另一方面，本发明包括治疗用化合物以及预防和治疗HGV感染的方法。

结合附图阅读下面对本发明的详尽描述，可更完整地理解本发明的这些和其它的目的和特征。附图简述

图1：SEQ ID NO：14的开放阅读框和470-20-1克隆的关系。

图2：显示谷胱甘肽亲和柱洗脱的梯度级分的典型的蛋白质简图。

图3：显示图2级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。

图4：显示阴离子交换柱洗脱的梯度级分的典型的蛋白质简图。

图4B和4C：显示对图4A级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。

图5A和5B：HGV和黄热病毒科其它两个成员-----猪霍乱病毒和丙型肝炎病毒的氨基酸顺序的比较。

图6：显示pGEX-Hisb-GE3-2载体的一部分，带有HGV表位的细菌表达质粒的图谱。

图7A-7D：显示纯化HGV的GE3-2蛋白的Western印迹分析结果。

图8A-8D：显示纯化HGV的Y5-10抗原的Western印迹分析结果。

图9A-9D：显示Y5-5、GE3-2和Y5-10抗原的Western印迹分析结果。

图10A-10F：显示GE-NS2b和GE-NS5a抗原的Western印迹分析结果。

图11：显示HGV编码序列的Kyte-Doolittle疏水性图解。

图12：显示HGV pET克隆用抗-T7.Tag单克隆抗体进行的Western印迹分析结果。

图13A-13D：显示HGV pET克隆GE-NS5b的Western印迹分析结果。图13E显示相关的考马斯染色凝胶。

图14A-14C：显示HGV pET克隆GE-E2的Western印迹分析结果。图14D显示相关的考马斯染色凝胶。

图15A-15C：显示HGV pET克隆GE-NS5b的Western印迹分析结果。图15D表明了相关的考马斯染色凝胶。

图16：显示HGV编码区的图解。发明详述

I.定义

下面定义的术语在本文有如下意义：

1.“非甲非乙非丙非丁非戊型肝炎病毒病原体{N-(ABCDE)}”：本文暂时称为HGV，意思是一种病毒、病毒型或病毒种类，(i)在某些灵长类动物是可传染的，包括口鬃(Mystax)、黑猩猩和人类，(ii)在血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV)(虽然HGV可能与上述病毒协同感染个体)；(iii)属于黄热病毒科的成员。

2.“HGV变异体”被定义为病毒分离株，它们具有至少有约40％、优选55％或65％，较优选80％的完整序列同源性，也就是，整个长度的病毒基因组多核苷酸序列，与较公开的HGV多核苷酸序列(如SEQID NO：14)相同。

“序列同源性”本质上如下确定。相似长度(优选地，整个病毒基因组)的两个多核苷酸可认为是相互同源的，如果当利用ALIGN程序作序列比较，在最高记录的比较中40％以上，优选为55％或65％，较优选80％的核酸，被使用ktup为1、默认参数和默认PAM阵列比较为相同。

该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson，等，1988；Pearson，1990；程序来源于William R.Pearson，Department of Biological Chemistry，Box440，Jordan Hall，Charlottesville，VA)。

在确定两个病毒是否是互相“高度地同源的”，使用ktup为1，默认参数和默认PAM阵列的上述一套ALIGM程序，将一种病毒的所有病毒蛋白(或多蛋白)的完整序列与其它病毒的病毒蛋白或多蛋白进行最佳地、全部地序列比较。分析中没有排除不相似或相似区域。两个序列长度上的差异被认为是错配的。另外，通常将病毒结构蛋白质区域用于确定病毒分离株间的相关性。高度同源的病毒具有40％以上、优选好地55％或65％、或较优选80％的全部多肽序列相同。

3.如果两个核酸片段能同HGV或其变异体(如和HGV核酸但不是黄热病毒科其它病毒的多核苷酸杂交的探针)特异性杂交，或者特异性引导聚合酶链式反应，则两个核酸片段被认为是“选择地可杂交的”，(i)在典型的杂交和漂洗条件下，例如Maniatis等(第320-328，382-389页)所描述的；(ii)利用降低要求的严格漂洗条件，使得最高有约25-30％的碱基错配，例如：2×SSC，0.1％SDS，室温下重复两次，每次30分钟；然后，2×SSC，0.1％SDS，37℃，一次，30分钟；最后，2×SSC，室温下重复两次，每次10分钟，或(iii)在标准条件下(如Saiki，R.K.，等)选择用于典型聚合酶链式反应(PCR)的引物，使得HGV或其变异体序列的特异性扩增。

如本领域所熟知的，优选地，高度同源的核酸链含少于20-30％的碱基错配，甚至较优选碱基错配少于5-20％。利用适当严格洗涤条件，可选择上述程度同源性来鉴定基因文库(或其它来源的遗传物质)的克隆。

4.本文所用的“HGV多核苷酸”定义如下。对大于100个核苷酸的多核苷酸，HGV多核苷酸包括上述“2”条所定义的由HGV变异体及同源序列所编码的多核苷酸序列。对长度小于100个核苷酸的多核苷酸，HGV多核苷酸包括那些与HGV或其变异体序列可选择杂交的序列。另外，HGV多核苷酸包括编码HGV多肽的多核苷酸(见下文)。

本文所用的术语“多核苷酸”是指有骨架的聚合分子，骨架支持碱基能以氢键与典型核酸连接，其中聚合物骨架以某种方式提供碱基以允许这种氢键以序列特异方式存在于聚合分子和一段典型核酸之间(例如，单链DNA)。这类碱基典型地为次黄嘌呤核苷、腺嘌呤核苷、鸟嘌呤核苷、胞嘧啶、尿嘧啶、胸腺嘧啶。在本领域中已知许多多核苷酸修饰方法，例如标记、甲基化、以某种类似物替换天然存在的一种或多种核苷酸。

聚合分子包括双链或单链RNA和DNA，以及其骨架修饰物，例如，甲基膦酸脂连锁物。另外，这类聚合分子包括可替换的聚合物骨架，例如，但不仅限于，聚乙烯骨架(Pitha，1970a/b)、吗啉骨架(Summerton等，1992，1993)。已报道了各种其它带电或不带电的多核苷酸类似物。本领域已知许多骨架修饰方法，例如，但不仅限于，不带电连锁(如甲基膦酸酯，磷酸三酯、磷酸酰胺化物和氨基甲酸酯)和带电连锁(硫代磷酸酯、二硫代磷酸酯)。此外，连锁可能包括下列一般修饰：侧基部分，例如蛋白质(如包括核酸酶、毒素、抗体、信号肽和聚-L-赖氨酸)；嵌合剂(如吖啶和补骨脂素)、螯合物(如金属、放射性金属，硼和氧化金属)、烷化剂和其它修饰类似物(如α-端基异构核酸)。

5.“HGV多肽”在本文被定义为任何同HGV多肽同源的多肽。本文所用“同源性”定义如下：在一实施方案中，如果多肽是由同HGV或其变异体序列选择杂交的核酸所编码的，则称该多肽和HGV多肽同源。

在另一个实施方案中，如上述所定义的如果某一多肽是由HGV或其变异体所编码的，则称该多肽和HGV同源，该组的多肽一般是大于15、优选为25、较优选为35个连续氨基酸。另外，对大于60个氨基酸的多肽，运用局部序列比较程序LALIGN进行确定“多肽同源性”的序列比较。如上所述，利用LALIGN程序将多肽序列与HGV或其任何变异体的氨基酸序列进行比较，所用Ktup为1、默认参数和默认PAM。

任一多肽(典型的是和HGV抗体不发生特异免疫反应的多肽)，最佳序列长度是大于60个氨基酸，完全相同的排列的氨基酸大于65％，或优选为70％，或较优选为80％，被认为是一个“同源多肽”。该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson，等，1988；Pearson，1990；程序来源于William R.Pearson，Department ofBiological Chemistry，Box440，Jordan Hall，Charlottesville，VA)。

6.如果一个多肽和HGV基因组、HGV的cDNA或其互补链有相同或大体相同的碱基对序列，或者表现上面“2”、“3”或“4”中所解释的那种同源性，则称该多肽“来源于”HGV。

如果一个多肽或多肽“片段”满足下列条件之一，也被称为“来源于”HGV：(i)由HGV多核苷酸的开放阅读框编码；或(ii)表现上面“2”或“5”所解释的同HGV多肽的同源性；或(iii)同HGV阳性血清有特异免疫反应的。

7.在多处上下文中，使用了“基本上分离的”和“纯化的”，主要是指HGV病毒颗粒、组分(如多核苷酸或多肽)、或从不相关或未污染成分(如血清细胞、蛋白质、非HGV多核苷酸和非抗HGV抗体)中分离的相关化合物(如抗HGV抗体)等的部分纯化。下面描述了分离或纯化感兴趣化合物或成分的方法和步骤(例如融合蛋白质和HGV多肽重组产物的亲和纯化法)。

8.本发明的上下文中，“核酸序列”当指编码蛋白、多肽或肽的序列时，包括编码同源的蛋白、多肽或肽序列以及本发明公开的序列的变性核酸序列。

9.“表位”是抗原决定簇，被定义为和抗体特定部位相互作用的抗原的特定部位。

10.抗原或表位和HGV阳性血清反应是“特异性免疫反应的”，此时，表位/抗原和HGV感染血清的抗体结合，但并不与没有或从来没有感染HGV的个体血清的绝大部分(一般高于90％，较高的为95％)抗体结合。“特异性免疫反应”的抗原或表位也能同抗特异HGV表位或抗原的单克隆或多克隆抗体发生免疫反应。

当抗体或抗体组合物(如多克隆抗体)和HGV抗原，而不是HAV、HBV、HCV、HDV或HEV抗原发生免疫反应时，称抗体或抗体组合物和HGV的反应是“特异性免疫反应的”。另外，“特异性免疫反应的抗体”并不同未感染或未接触HGV、HAV、HBV、HCV、HDV或HEV的个体正常血清中出现的主要抗原发生免疫反应。

II.N-(ABCDE)血清

抗HGV血清学检验的有效性和HCV-RNA的RT-PCR分析的研究(Kawasaki，等；Wang，等；1990)允许鉴定多种情况的输血后和群体获得性非HCV型肝炎。由疾病控制和防止中心负责通过Sentinel县获得性肝炎群体的研究，将人的肝炎病例，PNF2161最先鉴定为NANB肝炎(NANBH)(Alter，等，1989b)。PNF2161是从一个高龄高加索男性患者采集的样品，该患者输血后约8周发展为急性肝炎，高峰血清ALT水平达到1141IU(正常人≤45IU)。后来分辨出该急性肝炎的阵发性，在接下去的七年里，该病人的ALT水平呈现波动、且持续升高、符合慢性肝炎的情况，但是没有获得这种诊断的组织病理学证实。

用于克隆HGV(此处所描述的)的血浆样品是在1989年6月采集的，大约是在该阵发急性肝炎的4年后，并冷冻保存。根据第一代免疫试验检验(Ortho HGV ELISA Test System；Ortho Diagnostics，Raritan，NJ)一致的阴性结果，首先认为病人的PNF2161不是由HCV感染的。然而，利用第二代免疫试验(Ortho)和以HCV5’端非编码区的引物PCR的后来的试验证明该病人被HCV感染。

III.HGV相关序列的分离

作为一种鉴定含有HGV序列的方法，在λgt11表达载体上，从感染HGV的血清制备cDNA文库(实施例1)。然后选择多核苷酸序列用于与PNF2161血清发生免疫反应多肽的表达。第一轮筛选主要利用PNF2161血清(用于产生噬菌体文库)进行。还可以用其它可疑的N-(ABCDE)血清筛选。

由这种方法鉴定的重组蛋白为诊断试验提供了作为底物的候选肽。另外，由该方法鉴定的核酸编码序列作为有用的杂交探针，用于鉴定其它的HGV编码序列。

在λ-gt11上用上面描述的血清产生cDNA文库(实施例1)。在实施例1中图示的方法，将感染血清在没有稀释的8％PEG中沉淀，从所得的沉淀病毒产生文库。用同样的方法处理感染人群的血清。

超速离心法作为PEG沉淀法的有利替换方法，可用于从感染血清或其它生物制剂的样品中分离颗粒病原体。为从可被抽提出来的核酸中分离病毒颗粒，将2ml左右的血清，用PBS稀释到约10ml，3K离心10分钟，上清液在Ti70.1转子(Beckman Instruments，Fullerton，CA)中4℃以40,000rpm(大约110,000×g)超速离心2小时以上。吸出上清液，用标准核酸抽提技术抽提沉淀。

在以从沉淀血清抽提出的RNA为起始物质的逆转录反应中，利用随机引物产生cDNA文库。将所得的分子连接到不依赖序列的单引物扩增反应(SISPA；Reyes，等，1991)连接引物上，而后以非选择方法扩大，再克隆到合适的载体上，如λ-gt11，表达并筛选肽抗原。作为选择方法，也可用λ-gt10载体。

λ-gt11载体是尤其有效的表达载体，含有位于β-半乳糖苷酶基因翻译终止子上游53个碱基对的单一的EcoRI插入位点。因此，插入序列表达为β-半乳糖苷酶融合蛋白，融合蛋白含有β-半乳糖苷酶基因产物的N-端部分，杂合肽或者β-半乳糖苷酶肽的C-端区域(当杂合肽编码序列不含有翻译终止密码子时，C-端表达。)。

该载体产生的温度敏感性阻遏物(cI857)，在允许温度(如32℃)下，此物导致病毒溶源现象的发生，并在提高温度(如42℃)时，导致病毒裂解。载体的优点包括以下几点：(1)高效率的重组克隆世代；(2)在允许，但不在非允许的温度下，根据宿主细胞的生长，能选择溶源的宿主细胞；和(3)能产生重组融合蛋白。此外，因为含有杂合插入序列的噬菌体产生失活的β-半乳糖苷酶，所以，利用β-半乳糖苷酶的比色底物转化反应，来鉴定带插入序列的噬菌体。

实施例1描述了N-(ABCDE)肝炎血清PNF2161的cDNA文库的制备。利用PNF2161对文库进行免疫筛选(实施例3)。鉴定了大量具有免疫反应活性的λ-gt11克隆。免疫阳性的克隆用噬菌斑纯化，并重新检验它们的免疫反应活性。此外，还检验了这些克隆与正常人血清的免疫反应活性。

这些克隆还用于检测克隆插入序列的“外源性”。这种基本试验确认所克隆的片段并不代表人或其它潜在污染核酸的一部分(如大肠杆菌、酿酒酵母和线粒体)。这类克隆插入序列的分离是通过EcoRI消化后的聚合酶链式反应扩增实现。插入序列纯化后，用放射性标记，作为针对膜上结合的正常人DNA、正常口鬃DNA和细胞DNA(对照DNA)的杂交探针(实施例4A)。

克隆470-20-1(PNF2161cDNA的来源)是用PNF2161的血清免疫筛选分离出的克隆之一。该克隆不与正常人血清反应。具有较大的开放阅读框(203bp；SEQ ID NO：3)，与λ-gt11载体的β-半乳糖苷酶基因同在框内。利用人、酵母和大肠杆菌基因组DNA，通过基因组DNA杂交分析和基因组PCR分析，表明该克隆是外源的(实施例4B)。

RT-PCR确定了存在于PNF2161血清中的序列(实施例4C)。序列稀释PNF2161RNA的RT-PCR表明每ml溶液中至少有10⁵的470-20-1特异序列的拷贝。在蔗糖密度梯度分级分离中，也可检测到该序列与类病毒颗粒的相关序列有相同的密度(实施例5)。

大肠杆菌表达的第二种克隆，克隆470-expl(SEQ ID NO：37)的细菌裂解物，也显示出以可与克隆470-20-1相比的水平与PNF2161血清发生特异性免疫反应。470-expl的编码序列在终止密码子的两侧(根据和SEQ ID NO：14的序列比较，见图1)，并且内含甲硫氨酸。

利用克隆470-20-1的引物的锚式聚合酶链式反应(AnchorPCR)，获得在SEQ ID NO：14中与克隆470-20-1近邻的其它序列。这种情况下，PNF21612-cDNA源文库被用作模板，其中cDNA/互补双链DNA产物被连接至λ臂，但该混合物是不包装的。

470-20-1特异引物用于以SISPA扩增的PNF2161cDNA作为模板的扩增反应(实施例4)。扩增的DNA片段的鉴定根据：(i)大小和(ii)同一个470-20-1特异寡核苷酸探针(SEQ ID NO：16)杂交。从SISPA扩增的PNF2161检测了到由PCR扩增的cDNA中的470-20-1特异信号，证明源材料中存在470-20-1序列。

该470-20-1特异引物还用于以下列RNA源为底物的扩增反应：正常口鬃肝脏RNA、正常狨猴(Sanguins Laboriatis)肝脏RNA和MY131肝脏RNA(实施例4)。这些试验的结果证明470-20-1序列存在亲本血清样品(PNF2161)和从受PNF2161样品(MY131)攻击的动物中取得的RNA肝脏组织样品中。对是否有470-20-1序列，两个正常对照RNA是阴性的。

另外，通过利用引物从选择的克隆序列的PCR直接检测了PNF2161血清和其它克隆源或相关的源材料。特定扩增产物的检测通过其与特定寡核苷酸探针470-20-1-152F(SEQ ID NO：16)杂交来检测。通过470-20-1特异引物来重现检测在多个PNF2161抽提物中的特异信号。

示于实施例4F的数据进一步支持了HGV和肝脏疾病间的疾病相关性。肝炎患者和肝功能不正常的血液提供者的血清被使用HGV特异引物，通过RT-PCR筛选法评估其HGV的存在。在152份这类血清样品中，检测到6份存在HGV特异序列。对照组样品(n＝11)没有检测到HGV阳性。

上述结果表明，与肝脏N-(ABCDE)病毒感染(即为肝炎)相关的、和/或感染、以及发病的病毒病原体的分离，或其它组织和细胞类型的分离。

IV.HGV重组抗原的进一步鉴定

A.筛选重组文库

利用上述描述的筛选方法，可从本发明的文库中获得另外的候选HGV抗原。上述提及的cDNA文库已保藏在美国典型培养物保藏中心(12301 Patklawn Dr.，Rockville，MD，20852)，并且已经分配给下列保藏登记号：PNF2161cDNA信息源，ATCC75268。

第二种PNF2161cDNA文库本质上如上述第一种PNF2161cDNA文库产生，除开第二种PNF2161cDNA源文库与λ-gt11臂相连，但是没有被包装。这种未包装的文库用于获得下述的延伸克隆。此第二种文库(PNF21612-cDNA源文库)的包装类型已保藏在美国典型培养物保藏中心(12301Parklawn Dr.，Rockville，MD，20852)，并且已经分配给下列保藏登记号：PNF21612-cDNA信息源，ATCC75837。

除了上述产生的重组文库外，N-(ABCDE)肝炎血清中的其它重组文库也能如本文所述的类似地产生和筛选出来。

B.表位作图、基因组序列的交叉杂交和分离

抗原编码DNA片段的可根据下面鉴定：(i)如上所述的免疫筛选法，或(ii)利用一种算法(如“ANTIGEN”，Intelligenetics，MountainView，CA)对编码序列(如SEQ ID NO：14)进行计算机分析，来确定潜在的抗原区域。抗原编码DNA片段可以被亚克隆。亚克隆的插入片段被DNA酶I部分消化产生随机片段，或被特异性限制内切酶消化产生特异性亚片段。所得的DNA片段可插入λ-gt11载体中，并进行免疫筛选，以提供克隆的插入片段的表位图谱。

此外，在鉴定重叠HGV序列的杂交试验中可用DNA片段作探针，反过来，这些序列作为探针进一步用于鉴定一系列的连续克隆。这多套连续克隆的产生允许HGV基因组序列的阐明。

上述描述的任何一种克隆序列(如从SEQ ID NO：14或克隆470-20-1中获得的)都能用作cDNA和DNA文库的探针，如在λ-gt11或“λ-ZAP II”(Strategent，San Diego，CA)的载体上产生的文库。已知序列的特异亚片段可由聚合酶链式反应分离，或者用限制性内切酶酶切带有这些序列的载体。所得的DNA片段均能用作针对任何选择文库的放射性标记探针。特别地，克隆插入序列中的5’和3’端序列常用于鉴定其它克隆的探针。

另外，克隆插入序列的5’末端常作为序列特异引物用在首链cDNA或DNA链的合成反应中(Maniatis等，Scharf等)。例如，以PNF2161核酸为模板，利用从SEQ ID NO：14获得的特异引物，可制备特定可作引物的PNF2161cDNA和DNA文库。利用RNA酶H和DNA聚合酶I合成新的cDNA第二链。上述过程鉴定或产生与一5’紧邻已知克隆序列的核酸区域对应的DNA/cDNA分子。这些新分离的序列反过来用于进一步鉴定侧翼序列等等，以及鉴定组成HGV完整基因组的序列。如上所述，分离新的HGV序列后，克隆和免疫筛选多核苷酸，鉴定编码HGV抗原的特异序列。

利用实施例6中所述的“锚PCR”方法克隆PNF470-20-1(SEQID NO：3)，获得含有感兴趣的其它序列的延伸克隆序列(SEQ IDNO：14)。简单地说，该策略是将PNF2161SISPAcDNA和λ-gt11臂连接，然后以一种gt11特异引物和两种470-20-1之一的特异引物进行扩增连接反应。

将扩增产物进行电泳分离，转移到滤纸上，用470-20-1特异探针去探测结合到滤纸上的DNA。对信号杂交阳性带的相对应的带，用凝胶纯化、克隆并测序。

C.抗原多肽和抗体的制备

以标准的蛋白纯化方法来纯化本发明的重组肽，这些方法包括差示沉淀、分子筛层析、离子交换层析、等电聚焦、凝胶电泳和亲和层析。

在本发明的一种实施方案中，本发明的抗原的多核苷酸序列已在质粒pGEX(实施例7A)或其各种衍生物(pGEX-GLI)上克隆。质粒pGEX(Smith等，1988)和其衍生物表达了克隆插入序列的多肽序列，该插入序列在框内融合到蛋白谷胱甘肽-S-转移酶(Sj26)上。在一个载体结构中，质粒pGEX-hisB，在该融合蛋白的羧基端导入了6个组氨酸的氨基酸序列。

如实施例7A所述，各种重组pGEX质粒可被转化到合适的大肠杆菌菌株中，并且加入IPTG(异丙基-硫代-半乳糖苷)可诱导产生融合蛋白产物，接着使用谷胱甘肽琼脂亲和层析法可将溶解的重组融合蛋白质从被诱导的培养物的细胞溶胞产物中纯化(实施例7A)。

在含6M尿素或6M异硫氰酸胍的缓冲液(这两种物质有利于蛋白质的溶解)中，通过固化金属离子亲和层析(Porath)，可纯化的质粒pGEX-hisB表达的不可溶融合蛋白。其它的由pGEX-GLI或其衍生物表达的不可溶性蛋白的纯化，利用离心沉淀的组合，去除可溶性蛋白，接着再溶解不可溶性蛋白。并用标准层析方法，例如离子交换或大小排阻层析，以及其它这类本领域中已知的方法。

在为β-半乳糖苷酶的融合蛋白时(如λ-gt11克隆产生的)，通过亲和层析，使细胞溶胞产物通过表面结合抗β-半乳糖苷酶抗体的固相支持物等可容易地将融合蛋白质分离。例如，实施例7B中描述了通过亲和层析纯化由470-20-1编码序列获得的β-半乳糖苷酶/融合蛋白。

本发明还包括了表达载体，如上述的λ-gt11和pGEX载体，它们含有HGV编码序列和使得编码区在合适的宿主上表达的表达调控元件。调控元件一般包括启动子、翻译起始密码子、翻译和转录终止序列以及将插入序列导入载体的插入位点。

编码所需抗原多肽的DNA可克隆到任何数量的商业上可获得的载体上以在合适的宿主系统中表达产生多肽。这类宿主系统包括，但不仅限于：杆状病毒(Reilly，等；Beams，等；Pharmingen；Clontech，PaloAlto，CA)、痘苗病毒(Earl，1991；Moss，等)、细菌(Ausubel，等；Clotech)、酵母(Gellissen，1992；Romanos，1992；Goeddel；Guthrie and Fink)、哺乳动物细胞(Clontech；Gibco-BRL，Ground Island，NY)、如中国仓鼠巢(CHO)细胞系(Haynes，1983，Lau，1984，Kaufman，1990)。这些重组多肽抗原都可直接表达或做为融合蛋白表达。许多特征可改造到表达载体中去，例如提高表达序列在培养介质中的分泌的引导序列。

实施例16中描述了利用这些系统中的几种表达的大量HGV多肽。

在酵母系统中的表达具有商业产品的优势。痘苗病毒和CHO细胞系的重组蛋白产品具有哺乳动物表达系统的优点。此外，痘苗病毒表达系统有如下优点：(i)宽的宿主范围；(ii)忠实的转录后修饰、加工、折叠、转运、分泌和重组蛋白的装配；(iii)相对可溶的重组蛋白的高水平表达；和(iv)很大的容纳外源DNA的容量。

重组表达多肽产生的HGV多肽抗原主要是从裂解的细胞或培养基中分离得。纯化可通过本领域已知的方法来进行，包括分级盐析、离子交换层析和亲和层析。使用根据本发明的方法鉴定的HGV抗原产生的抗体的免疫亲和层析可被采用。

还可从HGV颗粒中分离HGV多肽抗原(参见下文)。

多肽的连续抗原决定簇一般相对较小，典型的长度是6-10个氨基酸。较小的片段已被鉴定为如在构象表位中的抗原区。如上所述鉴定HGV多肽抗原。任一链的所得DNA的编码区可被重组表达融合蛋白或分离多肽。另外，利用商业上可获得的合成器(Applied Biosystems，fosterCity，CA)或“PIN”技术(Applied Biosystems)，可方便地化学合成氨基酸序列。

在另一个实施方案中，本发明包括由多个表位组成的嵌合蛋白。一个典型的HGV嵌合多肽至少含有两个HGV表位，该多肽基本上缺乏正常插入在天然HGV编码序列中的两个表位间的氨基酸。利用上述的多肽表达载体/宿主系统，运用标准重组DNA技术可构建产生嵌合蛋白的编码多个串联表位的合成基因(Crea；Yoshio等；Faton等)。

此外，通过前面描述的方法可化学合成多抗原肽(Tam，J.P.，1988；Briand等)。例如，带α-和e-氨基基因的赖氨酸残基的一小段免疫学惰性的核心基质可被用于锚定代表感兴趣表位相同或不同合成多肽(典型的长度为6-15个残基)的多拷贝。嵌合蛋白或多抗原肽抗原，由于多表位分布导致的信号放大，在免疫检测中有较高的敏感性和特异性。

这些方法之一获得的抗原都可用于抗体产生、诊断试验和疫苗开发。

另一方面，本发明包括抗本发明多肽抗原的特异抗体。由任何这类方法之一获得的抗原可直接用于抗体产生，或者可被偶联至合适的载体分子中。在本领域中业已知许多这类载体，并可从商业购得(如Pierce，Rockford IL)。为制备抗体，一般用纯化抗原或融合蛋白抗原免疫宿主动物(如兔子)。用各种从其它蛋白，如谷胱甘肽-S-转移酶或β-半乳糖苷酶获得的编码序列产生杂交的或融合的蛋白。按照适宜的时间间隔，收集宿主的血清或血浆，检测这类血清中抗该抗原的特异性抗体。实施例8叙述了特异性抗Sj26/470-20-1杂合蛋白中的470-20-1抗原的免子血清抗体的产生。这些技术同样适用于从HGV获得的所有致免疫的序列，包括，但不仅限于，那些从编码序列，如SEQ ID NO：14中获得的。

如通过使用饱和硫酸氨沉淀或DEAE Sephadex层析、亲和层析、或其它本领域技术人员已知的产生多克隆抗体的方法，可获得免疫动物的γ-球蛋白质片段或IgG抗体。

另外，纯化的抗原或融合的抗原蛋白可用于产生单克隆抗体。这里从免疫动物分离脾脏或淋巴细胞，用本领域技术人员熟知的方法，使它们获得不死性或用于制备杂交瘤。要产生人来源杂交瘤，选择人的淋巴细胞供体。已知感染HGV的供体可作为合适的淋巴细胞供体。可从外周血液样品中分离出淋巴细胞。利用Epstein-Barr病毒(EBV)使人源淋巴细胞无限增殖，或可用一个适当的融合伴侣产生人源杂交瘤。也能用病毒的初级体外致敏的特异多肽产生人源单克隆抗体。

筛选由无限增殖细胞分泌的抗体，例如利用ELISA或Western印迹方法，确定分泌需要的特异性抗体的克隆(实施例10；Ausubel等)。

运用HGV阳性血清或血浆，或本发明的抗体，可以分离其它的抗原肽和表位。例如，已开发大量不同技术来同时合成许多肽(Geysen，等；Houghten；Frank and Doring；Hudson)。特别有用的方法是Geysen等开发的，因为它可相对简单地产生大量不同肽序列并被检测抗原性。在Geysen方法中(亦可称为MULTI-PIN肽合成法)，肽的合成是在与微量滴定板相连的聚丙烯酰胺酸性嫁接聚乙烯棒上进行的。MULTI-PIN的方法允许利用本发明的单克隆或多克隆抗体，商业可购得试剂和设置免疫筛选大量合成物(每板96肽)，鉴定和表征免疫反应的肽。

已报道，可在两星期的时间内合成多达6,000个寡肽，因此通过合成某一特定抗原所有可能重叠的氨基酸顺序，可以筛选出针对单氨基酸分辨力的表位的病毒抗原顺序(Geysen，等)。

筛选免疫显性肽的另一种方法，是利用常规自动肽合成法合成对应于HGV编码序列的较长肽(Garter，等，1994；Obeid，等，1994；Commandaeur，等，1994)。该方法的优点是较长肽能折叠成模拟构象表位的形状。

HGV抗体，特别是单克隆抗体，也能用于鉴定模拟病毒编码的靶多肽的随机多肽(Scott and Smith，1990；Smith，1991)。例如，在噬菌体上表现的随机肽文库(RPL)(Scott and Smith，1990)可作为抗体产生或疫苗开发的肽配体来源。RPL法允许含有噬菌体表面的融合蛋白的配体表达，以及抗体亲和筛选的配体编码噬菌体的富集(Smith，J.P.，1991；Christian，等；Scott，等，1992；Folgori，等)。通过在表位呈递期间特异抗体模拟天然抗原表位(模拟表位)来检测这些随机肽表位。可从RPL、六至十肽噬菌体表位(噬菌体表现的模拟表位)分离HGV抗原模拟物(模拟表位)，可通过公开的方法(Scott andSmith；Smith，J.P，1991，Christian，等，Scott，等，DeGraaf，等，Folgori，等)表达RPL，并且通过与HGV相关的人血清或本发明的抗体来筛选。

下面是用RPL分离470-20-1模拟表位的一个实施例。根据前面描述的方法构建随机十肽-pIII融合噬菌体显示文库(DeGraaf等，1993)。简而言之，一条化学合成的单链变性插入序列被退火成较短小的产生SfilI限制性悬突。退火DNA连接到SfilI酶切的USE-5载体DNA。

将大肠杆菌MC1061用连接的DNA转化。在含20mg/ml四环素的LB培养基中，通过约群体倍增10倍扩增文库。利用一种或多种470-20-1免疫反应的血清(或本发明的抗体)亲和性选择该文库。在50mMNaHCO₃，pH9.6，4℃过夜，用硫酸铵分级分离的阳性血清(如PNF2161)包装聚苯乙烯玻璃珠。抗体包被的玻璃珠全部用PBS漂洗，并用BSA封闭。

这些血清包被、封闭的玻璃珠用过量M13K07-UV杀死的噬菌体4℃温育4小时。接着将文库噬菌体加入上面的预保温混合物中，并在4℃下，温育12小时。除去未结合的噬菌体，并且用TTB缓冲液(50mMTris，pH7.5，150mM NaCl，0.5％“TWEEN20”(V/V)，1mg/mlBSA)广泛地漂洗玻珠。用洗脱缓冲液(0.1M HCl，用2MTris-HCl，pH9.0将pH调至2.2)洗脱结合的噬菌体。利用噬菌体免疫筛选法，用二级阳性血清(Mys136血清)筛选洗脱的、富集的噬菌体。

进一步筛选选择的噬菌体表位，可用大组的阳性和阴性血清或特异HGV单克隆抗体来进行。选择所得的噬菌体表位可直接用于ELISA检测或抗体产生。另一方面，噬菌体表位编码核苷酸序列可在常规载体/宿主系统中确定、表达、并用作抗原。

上述鉴定的模拟多肽，反过来又可作为检测试验的抗原或用于产生抗原特异抗体。

D.ELISA和Western印迹筛选

当通过上述的噬菌斑免疫筛选鉴定了HGV抗原时，可将该抗原表达和纯化。利用另一些免疫检验法，如采用分离抗原肽的ELISA或Western印迹分析，可快速筛选抗大量可疑感染HGV肝炎的血清的抗原。该抗原多肽融合物可按如上所述分离，通常用对融合伴侣，如β-半乳糖苷酶或谷胱甘肽-S-转移酶的亲和层析。另一方面，利用抗原自身产生的抗体来纯化抗原(参见下面)。

实施例10提供了一般ELISA检验形式。Harlow等描述了许多用于免疫分析和抗体/抗原筛选的技术。

含有感兴趣的抗原的纯化的抗原多肽或融合多肽，被连接到一个固相支持物上，例如多孔聚苯乙烯平板。稀释待检测血清，加到各孔中。经过抗体和结合抗原充分结合的一段时间，将血清从孔中清洗掉。在每个孔中加入标记的报告抗体和适当的底物，含有与纯化的抗原多肽或含有抗原的融合多肽结合的抗体的孔通过阳性信号来检测。

实施例10提供了利用本发明多肽抗原进行Western印迹分析的一般形式。Ausubel等描述了一般的Western印迹方法。在实施例10中，利用470-20-1/Sj26融合蛋白筛选大量的血清样品。实施例10提供的结果证明多种不同来源的N-(BACDE)肝炎血清与多肽抗原的免疫反应。

上面提供的结果证明本发明的多肽抗原能通过这些方法依靠被怀疑为HGV感染的血清样品的组(panel)被快速筛选来检测HGV。

E.细胞培养系统，动物模型和HGV的分离

已在黑猩猩、恒河猴和四种口鬃父体中进行了HGV传染性的研究。这些研究产生了在这些动物模型上有关HGV传染性的进一步的信息。本文说明书描述的HGV具有能感染恒河猴和黑猩猩的优点。

另外，从感染动物(黑猩猩、狒狒、猴和人类)获得的原代肝脏细胞可在体外培养。公开了可以使分化的灵长类动物肝细胞长期保持分化的补充了生长因子和激素的无血清培养基(Lanford，等；Jacob，等；1989，1990，1991)。除了原代肝细胞的培养物，也能产生感染细胞的无限增殖培养物。例如，可将原代肝脏培养物融合到各种细胞(如HepG2)中来提供适宜的无限增殖的细胞系。通过导入癌基因或引起转化的表型基因，也可使原代肝细胞培养物无限增殖。这些癌基因或基因可从本领域已知的来源中获得，包括SV40、人类细胞的癌基因和EpsteinBarr病毒。

另外，未感染的肝细胞(如原代或连续肝癌细胞系)可通过将培养物中的细胞与HGV接触而被感染，该HGV为部分纯化的颗粒制剂(例如，从感染血清中通过差速离心和/或分子筛制备)，或存在于感染血清中。然后可增殖这些感染细胞，而且通过本领域已知方法的传代病毒。此外，其它细胞类型，例如淋巴样细胞系，也可用于HGV的增殖。

通过HGV蛋白相似性研究，检测了和黄热病毒科其它病毒相似的氨基酸区域。众所周知，该病毒科的成员可在各种组织培养系统中增殖(ATCC-病毒目录，1990)。通过类推有可能HGV也可以在下列一个或多个组织培养系统中繁殖：Hela细胞、原代仓鼠肾细胞、猴肾细胞、Vero细胞、LLC-MK2(恒河猴的肾细胞)、KB细胞(人类口腔表皮样癌细胞)、鸭胚胎细胞、原代绵羊柔脑膜(leptomeningeal)细胞、原代绵羊脉络丛细胞、猪肾细胞、牛胚胎肾细胞、牛陀螺状细胞、鸡胚胎细胞、原代免肾细胞、BHD-21细胞或PK-13细胞。

除了表达HGV，HGV多核苷酸序列、cDNA或体外转录的RNA的区域均可通过重组方法导入组织培养细胞中。这种重组操作允许HGV各部分的独立表达。

可从感染组织，特别是感染细胞培养物中制备RNA样品，RNA样品可在凝胶中分级分离，并转移到膜上用于利用从克隆HGV序列衍生的探针所进行的杂交分析。

HGV颗粒可按本领域已知的方法从感染血清、感染组织、上述的细胞培养介质、或培养的感染细胞等中分离出来。这些方法包括按大小的分级分离技术(即超滤法、沉淀法和沉降法)，利用阴离子和/或阳离子交换材料的方法，根据密度、疏水性和亲和层析的分离方法。在分离过程中鉴定HGV可：(i)利用本发明的抗HGV肝炎相关病原体的抗体；(ii)通过利用已鉴定的HGV核酸序列的杂交探针(如实施例5)；(iii)通过RT-PCR。

通过免疫亲和层析，抗HGV抗体可被用于HGV颗粒的纯化(Harlow等；Pierce)。在方法中抗HGV多肽或融合多肽(如470-20-1)的抗体被以使抗体保持其免疫选择性的方式固定到固相支持物上。为实现抗体和固相支持物的这种附着作用，含有间隔基的双功能偶联剂常用于保持抗体的抗原结合位点的可通性。

用标准方法可进一步对HGV颗粒进行鉴定，这些方法包括，但不仅限于，免疫荧光的显微镜检查、电子显微镜检查、组成颗粒蛋白质的Western印迹分析、利用部分纯化颗粒在动物或细胞系统上的传染性研究以及沉降鉴定方法。实施例5中所示的结果表明，本发明的病毒颗粒更接近于包被型病毒颗粒，而不是无包被的病毒颗粒。

可将HGV颗粒破裂获得HGV基因组。破裂颗粒可通过如在螯合剂存在下用去污剂进行处理而获得。然后就可以进一步鉴定基因组核酸。鉴定包括DNA酶和RNA酶敏感性的分析。基因组的链型(strandedness)(实施例4I)和构型(如环状的)可通过本领域已知的方法而被确定，包括电子显微镜目测方法和沉降鉴定。

所分离的基因组还使对整个基因组序列分析成为可能，无论基因组是否是片段的，是RNA还是DNA基因组(例如利用RT-PCR、染色体步移方法或利用来自紧邻克隆序列的引物的PCR)。确定完整的HGV序列允许基因组结构研究和HGV序列与已知病毒原体的编码和调控序列的比较。

F.筛选具有抗HGV肝炎活性的试剂

使用繁殖HGV的细胞培养基和动物模型系统为筛选抑制感染HGV的产生的抗肝炎试剂提供了可能：特别是筛选抑制HGV复制的药物。细胞培养物和动物模型允许评价这种抗肝炎药物对正常细胞功能和生存能力的效果。可能的抗病毒试剂(包括天然产品或合成化合物；如小分子例如真菌抽提物的混合物和反义寡核苷酸等)，被典型地用于筛选一定浓度范围的抗病毒活性。然后评价其对HGV复制或抗原产生的作用，主要通过监控病毒大分子的合成或大分子的积累(如DNA，RNA或蛋白质)。这种评估常以抗病毒试剂对正常细胞功能的作用为标准(如DNA复制、RNA转录、一般的蛋白质翻译等)来作出。

可通过包括本发明中描述的那些的许多方法来进行。例如，可产生抗本发明抗原的抗体，并且这些抗体被用于以抗体为基础的分析中(Harlow，等)，以鉴定和定量细胞培养基中的HGV抗原。利用竞争性分析定量培养基中的HGV抗原：在这个分析中可使用克隆HGV序列编码的多肽。通常，重组产生HGV抗原多肽，并用于生产单克隆或多克隆抗体。利用一个报告分子标记重组HGV多肽。然后评估含有HGV抗原样品(如细胞培养基或血清)中出现的这种标记多肽和其相关抗体结合的抑制作用。通过抑制水平和使用已知浓度的未标记重组蛋白产生的标准曲线的比较，确定样品中的HGV抗原水平。

本发明的HGV序列尤其有用于产生多核苷酸探针/引物，该探针/引物可被用于定量细胞培养系统中产生的HGV核酸序列的量。这种测定可由多种方法实现。例如，可将用报告分子标记的探针用于标准斑点印迹杂交，或用于感染细胞核酸标记的探针的竞争性分析。另外，存在许多使用聚合酶链反应来定量样品中目标核酸的水平的方法(Osikowicz，等)。

利用上述的细胞培养基和动物模型系统亦可鉴定保护性抗体。例如，产生本发明抗原的多克隆或单克隆抗体。然后，在感染细胞培养物或动物前，用这些抗体预处理含HGV传染性接种物(如血清)。评估单抗体或多抗体混合物保护细胞培养物或动物免受感染的能力。例如，在细胞培养物和动物中，缺乏病毒抗原或核酸产物的被作为筛选物。另外在动物中，没有HGV肝炎病症状的(如提高的ALT值)，也是保护性抗体存在的指示。

另外地，康复病人的血清可被用于筛选保护性抗体的存在，然后，这些血清可被用于鉴定和抗体结合的HGV肝炎相关病原体抗原。而后重组或合成产生所鉴定的HGV抗原。如上所述检测抗原产生保护性抗体的能力。

经初次筛选后，抗原或鉴定具有产生保护性抗体能力的抗原，其单用或结合使用，都可作为接种试验动物的疫苗。然后用传染性HGV感染动物。免受感染表明该动物具有产生保护它们自身免受感染的抗体的能力。另外，应用动物模型允许鉴定激活细胞免疫的抗原。

在动物模型研究中，应答受病毒制剂(如感染血清)挑战的保护性免疫反应：(i)保护动物免受感染；(ii)防止疾病发生。

G.疫苗及保护性免疫的产生

由本发明的方法所鉴定的一种或多种免疫原性多肽可制备疫苗。在HGV分离序列和其它已知病毒蛋白之间的基因组结构相似性，可提供有关可以作为有效疫苗的候选多肽的信息。此外，许多计算机程序可用于鉴定编码蛋白抗原决定簇区域的分离序列相似区域(例如，Hopp等；“ANTIGEN”Intelligenetics，Mountain View CA)。

含有免疫原性多肽作为活性成分的疫苗，一般被制成可注射的溶剂或悬浊剂。另外，免疫原性多肽可被制成固体或冷冻状态，这些状态适合于注射前重悬浮成水溶液形式。该免疫原性多肽也可被乳化或被脂质体包被。多肽常常和与之相容的药学上可接受的赋形剂混合在一起。这类赋形剂包括，但不仅限于，下列物质或下列物质的结合：盐水、水、糖(如葡萄糖和山梨醇糖)、甘油、酒精(如乙醇[EtOH])和本领域已知的其它物质。此外，疫苗制剂可能含有少量其它辅助物质，如润湿剂、乳化剂(如洗涤剂)和pH缓冲液。另外，可增加疫苗制剂有效性的许多佐剂也是适合的。这类佐剂包括，但不限于下列：一类相关化合物包括N-乙酰基-胞壁酰基(muranyl)-L-苏氨酰基-D-异谷氨酰胺和N-乙酰基-去甲-胞壁酰基(muranyl)-L-丙氨酰基-D-异谷氨酰胺的基团，以及氢氧化铝。

本发明的疫苗中所用的免疫原性多肽可以是重组、合成或从减毒HGV颗粒分离的。多肽通常被配制成中性或盐形式的疫苗。本领域熟知的药学上可接受的有机或无机盐。

HGV肝炎相关病原体疫苗，典型地通过皮下或肌肉内注射非肠胃方式使用。其它合理的制剂包括口服剂和栓剂。口服剂通常使用赋形剂(如药物级糖、糖精、纤维素或类似物)，常含有10-98％的免疫原性多肽。口服组合物以丸剂、胶囊、片剂、溶液剂、悬浊剂、粉剂等形式存在。并被制成允许持久的和长期的释放。栓剂利用常规的粘合剂和载体，一般含有0.1-10％的免疫原性多肽。

鉴于上述信息，可生产抗HGV肽相关病原体的多价疫苗，它由一种或多种结构性或非结构性的病毒病原体多肽组成。这些疫苗含有例如，重组表达的HGV多肽、从HGV病毒颗粒分离的多肽、合成多肽或嵌合多肽形式的装配表位。另外，还可制备保护性疫苗，它通过使用灭活的HGV授予抗HGV肝炎感染的保护。这种失活可通过制备病毒裂解液，接着用适宜有机溶剂，洗涤剂或福尔马林处理裂解液来完成。

从减毒HGV病毒株也可制备疫苗。利用上述细胞培养物和/或动物模型系统可获得这种减毒HGV。一般在体外或体内多次传代后分离减毒菌株，通过本领域已知方法进行减毒菌株的检测。检测减毒株的一种方法是用抗HGV抗原的抗体探针、序列特异的杂交探针，或使用被感染动物的序列特异性引物的扩增，或体外培养物中的HGV感染分析。

另外，除了上面的方法，可根据从本说明书所示信息中获得的基因组信息，构建该减毒HGV株。典型地可删除感染病原体基因组的一个区域，该区域编码例如与病毒病理有关的多肽。这种删除不含干扰病毒复制。另外，重组的减毒HGV构建物允许一个或多个能引起抗HGV的保护性免疫反应的表位的表达。这种所需的免疫反应可包括体液和细胞免疫。然后，将减毒HGV的基因组用于转化细胞，并让这些细胞在允许病毒复制的条件下生长。该减毒株不仅可用作疫苗，而且可作为病毒抗原和/或HGV颗粒的生产来源。

还能产生含HGV表位的杂交颗粒免疫原。HGV表位的免疫原性可通过在真核系统中(如哺乳动物或酵母系统)表位的表达而增强，其中表位与已知的颗粒形成蛋白质融合或装配。一种这样的蛋白是乙型肝炎的表面抗原。其中HGV表位直接和颗粒形成蛋白编码序列连接的重组构建物将产生杂交蛋白，该蛋白对相关的HGV表位和颗粒形成蛋白是有免疫原性的。另外，不包含在颗粒形成中的颗粒形式蛋白编码序列的选择部分，可被与HGV表位对应的编码序列替换。例如，与颗粒形成蛋白发生特异免疫反应的区域可被HGV表位序列替换。

在酿酒酵母(saccharomyces cerevisiea)和哺乳动物细胞中，已表明乙型肝炎表面抗原可被表达并被装配到颗粒中(Valenzuela，等，1982和1984；Michelle，等)。这些颗粒显示出具有被增强了的免疫反应性。以前已公开了使用杂交蛋白，即带有杂合病毒序列的重组构建物来形成这些颗粒(EPO175，261，1986年3月26日公布)。这种含HGV表位的杂交颗粒在疫苗应用中也是有用的。

本发明疫苗以与制剂方法相容的剂量和对预防和治疗处理为药理学有效的量使用，以这样的剂量免疫，对预防或治疗处理是药理学有效的。使用的免疫原的量依赖接受治疗的个体，治疗个体免疫系统产生保护性免疫反应的能力和所需的保护水平。

本发明的HGV疫苗可以单剂量或多剂量使用。还根据治疗个体的需要和耐受力确定剂量范围。除HGV免疫原性多肽外，疫苗制剂可与其它免疫调节剂结合而被使用。

在另一种HGV接种方法中，在合适的调控子控制下，编码HGV蛋白的DNA构建物可被直接导入哺乳动物体内组织。导入这种构建物产生“基因免疫”。细胞摄取相似DNA构建物，并表达编码的蛋白(Wolf，等；Ascadi，等)。注射的DNA并未表现出整合到宿主染色质上或复制。这种表达引起了实质性的体液和细胞免疫反应，包括在动物系统中免受体内病毒的攻击(Wang，等，1993；Ulmer，等)。在一个实施方案中，用局部麻醉剂如盐酸布比卡因和尼泊金甲酯的等渗盐水进行预处理以利于细胞DNA吸收，而后将该DNA构建物注射到骨骼肌肉中。注射的DNA构建物被肌肉细胞吸收，并表达所编码的蛋白。

同用可溶性病毒亚基蛋白接种比较，基因免疫接种具有在体内真实表达病毒蛋白的优点。这些病毒蛋白的表达和宿主细胞主要组织相容性抗原和其它蛋白有关，正如用天然病毒感染发生的情况。同许多可溶性亚单位蛋白疫苗相比，这种类型的免疫接种能够诱导体液和细胞免疫反应。相应地，该类型的免疫接种保留了许多活的减毒疫苗的有利特征，而没有用传染性病原体的接种和护理安全性问题。

直接将编码所需疫苗抗原的质粒或其它DNA构建物注射到体内组织是一种传送方式。也可使用其它传送DNA构建物的方式。这包括各种以脂质为基础的方法，其中DNA被用脂质体，阳离子脂试剂或细胞转染剂(Cytofectin)(如脂质转染剂(Lipofectin))进行包装。如Felgner和Rhodes(1991)所归纳的，这些方法便于体内吸收和表达。对这些基本方法的各种修改如下：掺入这些多肽或其它的部分，以便于(i)靶向特殊细胞；(ii)DNA构建物吸收后的细胞内处理；(iii)便于表达。另外，编码需要的疫苗抗原序列可被插入到合适的反转录病毒载体。将所得的重组反转病毒载体接种个体以在体内表达疫苗抗原。接着抗原诱导免疫应答。如上面所提及的，这种方法已显示出能针对病毒抗原诱导体液和细胞免疫(Irwin，等)。

另外，本发明的HGV疫苗可与其它疫苗，如其它的肝炎疫苗结合使用。

H.合成肽

利用HGV多肽的编码序列，即可产生与这些多肽相应的合成肽。使用本领域标准方法和设备(Applied Biosystems，Foster City CA)，可商业合成或制备合成肽。

另外地，通过寡核苷酸合成的标准方法可直接合成编码肽的寡核苷酸序列，或若是长的编码序列，则由一系列克隆步骤合成，这些步骤包括多个相应于编码序列的寡核苷酸片段的串联排列(Crea；Yoshio等；Eaton等)。用标准重组方法能够表达寡核苷酸的编码序列(Maniatis等；Ausubel等)。

V.该病毒基因组的鉴定

如实施例4所示，HGV基因组看起来象RNA分子，并与黄热病毒科的病毒所列出的病毒序列有最接近的序列相似性。该科包括黄病毒、瘟疫病毒和由一种丙型肝炎病毒组成的未分类的属。HGV病毒没有明显的与其它可辨别的黄病毒成员相同的全(即整个病毒长度)序列----除了下面讨论的蛋白结构域单元。

黄热病毒科的一般成员是包被型病毒，该病毒在蔗糖梯度中的密度介于1.1和1.23g/ml，并对热、有机溶剂和洗涤剂敏感。如实施例5所示，HGV具有与一种包被型黄热病毒科病毒(HCV)相似的密度特征。HGV病毒颗粒整体也显示对有机溶剂是敏感的(实施例5)。

黄热病毒科的病毒颗粒含有一个线性单链(ss)RNA的单分子，它也是编码病毒蛋白的唯一的mRNA。此ssRNA分子长度一般为9-12Kb大小。

病毒蛋白来源于一个多蛋白前体，此前体后来加工成为成熟病毒蛋白。黄热病毒科的大部分成员在3’末端没有poly(A)尾部。病毒颗粒具有约15-20％重量的脂。

黄热病毒科的成员具有一个核心蛋白和2或3个与膜相关的蛋白。黄热病毒科中三个属中成员的类似结构蛋白在序列水平上相互间显示出极少的相似性。非结构性蛋白含有RNA依赖的RNA聚合酶(RDRP)、解旋酶和丝氨酸蛋白水解酶的保守结构域单元。利用本领域已知的计算机算法，如“MACAW”(Schuler，等)能够检测保守氨基酸的结构域单元的短的模块。这些结构域单元可能与被这些蛋白加工的底物的限制物有关(Koonin and Dolja)。这些结构域的顺序在黄热病毒科的所有成员中是保守的。HGV基因组含有在黄热病毒科成员中发现的蛋白结构域单元，例如：(i)解旋酶基因；(ii)类丝氨酸蛋白水解酶结构域；(iii)RNA依赖的RNA聚合酶(RDRP)(见图5，“GDD”序列)。

本文公开了多个不同HGV毒株/分离株的序列信息。该信息能被本领域技术人员使用，利用杂交技术、引物延伸和本文所述的RT-PCR分离新的毒株/分离株(例如，以公开的HGV变异体序列为基础的变性引物)。

在现在的情况下，HGV是一种新的分离株，被认为是黄热病毒科的成员。在该病毒科里，鉴定由一种病毒编码的结构蛋白，允许最明确地确定一种病毒分离株是否是一种病毒种类的成员。非结构性蛋白在一族病毒种内的不同病毒种间是最为保守的。这点被认为是维持酶功能必需的结果，例如下列：病毒多蛋白的水解酶切，以及通过病毒解旋酶和病毒RNA依赖的RNA聚合酶的RNA基因组的复制。

对黄热病毒科的任一属内的几个种类的鉴定，例如黄病毒属，证明在种类间这些保守功能的基因比结构蛋白的基因更为保守。相应地，与一种已知种类的“变异分离株”相比，一种病毒分离株是否代表新的种类的主要决定因子之一，是确定已知病毒种和该新病毒分离株间结构蛋白的总体同源性。

在非结构性蛋白中发现大约200个或少于200个氨基酸的区域内找到局部同源性，是决定分离株是变异体还是新种的非决定性标志。典型地，具有少于或约为40％总体结构蛋白同源性的病毒分离株被分类为不同种类(病毒)或为不同属。同描述在“GENBANK”中的任一病毒相比(根据本领域标准方法比较)，HGV的每个结构区域的同源性都较低于40％。因此，HGV被认为是一新种类，而且可能是正链RNA病毒的一个新属。

在确定病毒分离株的系统发育位置中检测到的另一个重要区域是5’和3’末端的非翻译区(UTR)。在病毒分离株之间比较了这些区域。例如，所有的HCV成员，黄热病毒科的一个未分类的属，具有大于该属所有其它成员在该区具有的90％的保守性的5’末端非翻译区。另外，HCV的成员享有大约24～50个核苷酸长度的3’端非翻译区。

当5’端非翻译区作为BLASTN中的具有FASTA的一个疑问序列时，在“GENBANK”(Ver.86)中没有发现任何病毒的有意义的序列。另外，HGV含有一个长度至少约250个核苷酸，并与任何其它已知病毒具有很少同源性的3’端非翻译区。

已知黄热病毒科的成员在很多种动物中复制，范围从(I)吸血节肢动物载体(蜱和蚊)，在那里它们不引起疾病；到(ii)较大范围的脊椎动物宿主(人、灵长类动物、其它哺乳动物、袋形动物和鸟类)。30多种黄热病毒科的病毒引起人的疾病，范围从热病、或疹，到潜在的致死疾病，如出血热、脑炎、或肝炎。黄热病毒科至少10种成员在家畜中导致严重的具有经济重要性的疾病。

VI.应用

A.本发明

一方面，本发明涉及基本分离的，从一种庚型肝炎病毒(HGV)多核苷酸来源的多核苷酸。在一种实施方案中，根据下面几点来鉴定HGV多核苷酸：(i)灵长类动物中的传染；(ii)血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV)；和(iii)是黄热病毒科的成员。本发明的多核苷酸可以包括DNA或RNA(或其类似物或变异体)，并可按照本领域已知的方法通过重组、分离或合成产生。

一般地说，本发明的HGV多核苷酸长度为至少10个核苷酸。在另一个实施方案中，HGV多核苷酸长度为至少15个核苷酸。在另一个进一步的实施方案中，HGV多核苷酸长度为至少20个核苷酸。

在一个具体的实施方案中，本发明的多核苷酸包括了HGV基因组的cDNA或cDNA互补链。在一个较特定的实施方案中，这样的cDNA或cDNA互补链与选自SEQ ID NO：14、SEQ ID NO：37、SEQID NO：19或其互补链的一段多核苷酸具有至少40％的序列同源性。在另一个实施方案中，这种cDNA与选自SEQ ID NO：14、SEQ IDNO：37、SEQ ID NO：19或其互补链的一段多核苷酸具有至少55％的序列同源性。在一个具体的实施方案中，本发明cDNA或cDNA互补的多核苷酸将具有从选自SEQ ID NO：14、SEQ ID NO：37、SEQ ID NO：19或其互补序列的序列而产生的序列。

在另外一般的实施方案中，本发明的多核苷酸为与HGV进行特异性杂交的多核苷酸探针。在其它一般的实施方案中，本发明的多核苷酸编码HGV表位。更具体地说，编码多核苷酸的这种表位可能包括从SEQID NO：14、SEQ ID NO：37或SEQ ID NO：19的序列产生。

在另外一般的实施方案中，本发明的多核苷酸包括一段连续的多核苷酸序列，其具有同HGV多核苷酸进行选择性杂交的能力。在这一方面，HGV被鉴定为包含开放阅读框(ORF)的基因组，该ORF编码，同下列氨基酸序列之一具有至少40％的序列同源性的氨基酸序列：SEQ ID NO：15的2873个氨基酸序列，SEQ ID NO：38的190个氨基酸序列，或SEQ ID NO：20的67个氨基酸序列。更特别地，该多核苷酸探针与HGV进行特异性杂交。这种多核苷酸探针带有检测标记或其它修饰，或被固定到一固相支持物上。

如上所述的DNA多核苷酸还可编码HGV特异性免疫反应的抗原决定簇。在这一方面，HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组、cDNA或其互补链。该氨基酸序列同下列氨基酸序列之一具有至少40％的序列同源性：SEQ ID NO：15的2873个氨基酸序列、SEQ ID NO：38的190个氨基酸序列或SEQ IDNO：20的67个氨基酸序列。

根据本发明，在另一个特定实施方案中，同HGV抗原决定簇进行特异反应的HGV编码的DNA多核苷酸包括同下列氨基酸序列之一具有至少55％的序列同源性的氨基酸序列：SEQ ID NO：15的2873个氨基酸序列或SEQ ID NO：38的190个氨基酸序列或SEQ ID NO：20的67个氨基酸序列。

在其它特定实施方案中，该DNA多核苷酸可能表现为与从SEQ IDNO：14、SEQ ID NO：37、SEQ ID NO：19或其互补链中选出的一段多核苷酸具有约40％的序列同源性。

在另外进一步的实施方案中，本发明包括编码HGV来源的多肽的一段DNA多核苷酸。特别地，由该多核苷酸编码的多肽包括一段具有至少15-60个氨基酸的连续序列，它同由一个HGV基因组、cDNA或其互补链编码的至少15-60氨基酸的一段连续序列具有55％的序列同源性。

在一个特定实施方案中，多核苷酸编码的HGV多肽可在PNF2161cDNA信息源λ-gt11文库内编码。在其它特定实施方案中，该DNA多核苷酸可编码一个HGV表位。在进一步的实施方案中，该多核苷酸可作为与HGV特异性杂交的探针。

在一个相关方面，本发明包括一种重组载体，该载体含有编码一段HGV多肽的DNA多核苷酸。在另一个相关的方面，本发明包括用这种载体转化的细胞。

在另一个相关方面，本发明包括一段多核苷酸探针，该探针与一个HGV肝炎病毒基因组、cDNA或其互补链进行特异性杂交。在一个较特定的实施方案中，该多核苷酸探针序列同一段从SEQ ID NO：19、SEQ ID NO：37、SEQ ID NO：14或其互补链来源的序列具有至少40％的同源性。在另一个特定的实施方案中，该多核苷酸探针是从SEQ ID NO：19、SEQ ID NO：37、SEQ ID NO：14或其互补链来源的。

在另一相关方面，本发明包括检测试验个体中HGV肝炎病毒核酸的方法。根据本方法，从个体中获取包含核酸的样品。然后该样品同至少一种多核苷酸探针结合，该探针能同HGV肝炎病毒基因组特异性杂交。然后检测由HGV核酸与探针杂交形成的HGV核酸/探针复合物。这种检测可通过含有至少一个报告分子部分的探针与HGV核苷酸杂交实现。

在一个较特定的实施方案中，上述方法包括HGV核酸特异探针的使用，其中两个探针(引物)定义该HGV核酸中一个内部区域。在这个实施方案中，每一探针含有一条3’端内含于HGV核酸内部区的链。然后将该核酸/探针杂交复合物通过引物延伸反应转换成含有多片段的双链探针。通过不断重复下列步骤来扩增包含探针的片段：(i)使双链片段变性，产生单链片段；(ii)单链与探针杂交，形成链/探针复合物；(iii)在有DNA聚合酶和所有四种脱氧核糖核苷酸存在的情况下，由链/探针复合物产生双链片段；(iv)重复步骤(i)～(iii)，直至达到所需的扩增程度。然后根据已建立的方法鉴定扩增产物。本发明的方法可还包括第三种多核苷酸探针，它能与上面描述的内部区进行选择性杂交，但不能和扩增所用的特异性探针/引物序列杂交。

在另一个特定实施方案中，利用靶扩增方法，例如自身维持序列扩增、连接酶链式反应、或链置换扩增检测HGV核酸/探针复合物。在进一步特定的实施方案中，采用信号放大技术，例如支链DNA探针或Q-β复制酶方法来完成检测。

在另一相关方面，本发明包括一种试剂盒，用于分析样品中是否存在HGV肝炎病毒来源的多核苷酸。在一般实施方案中，该试剂盒包括至少含一种核苷酸序列的多核苷酸探针，该探针可与HGV多核苷酸进行特异性杂交，以及合适的容器。在一个特定的实施方案中，该试剂盒包括定义HGV多核苷酸内部区的两个多核苷酸探针，其中每一探针具有3’端内含于该区的一条链。在进一步的实施方案中，该探针可用作聚合酶链式反应扩增的引物。

在更进一步相关的方面，本发明包括基本分离的HGV肝炎病毒颗粒。

本发明还包括来自基本分离的HGV肝炎病毒的多肽或多肽制剂。在这一方面，HGV病毒被鉴定如下：(i)在灵长类动物中可传播；(ii)血清学上明显不同于甲型肝炎(HAV)、乙型肝炎(HBV)、丙型肝炎(HCV)、丁型肝炎(HDV)和戊型肝炎(HEV)；和(iii)为黄热病毒科的一个成员。正如上面所说明的，可通过常规方法制备HGV多肽，包括化学合成和重组DNA表达。也可将该多肽固定于一个固相支持物上。

在一个特定实施方案中该多肽与至少一种抗HGV抗体发生特异性免疫反应。在更进一步的特定实施方案中，该多肽包含与HGV特异性免疫反应的抗原决定簇。在本文中，HGV被鉴定为具有包含编码氨基酸序列的开放阅读框的基因组，该ORF编码的氨基酸序列同下列序列之一具有约40％的序列同源性：SEQ ID NO：15的2873个氨基酸序列或SEQ ID NO：38的190个氨基酸序列和SEQ ID NO：20的67个氨基酸序列。在一个较特定的实施方案中，该ORF编码同上面提及的氨基酸序列之一具有至少55％的序列同源性的氨基酸序列。在再进一步的实施方案中，该多肽序列来源于SEQ ID NO：15的2873个氨基酸序列或其片段、SEQ ID NO：38的190个氨基酸序列或其片段或者SEQ ID NO：20的67个氨基酸序列或其片段。

在另外特定的实施方案中，来自HGV肝炎病毒的多肽包括一段至少约60个氨基酸的连续序列，该序列是由HGV基因组、cDNA或其互补链编码的。更具体地说，这些肽序列是由PNF2161cDNA来源的λ-gt11文库编码的。

在一个较特定的实施方案中，重组表达的HGV多肽可包括从SEQID NO：20、SEQ ID NO：38或SEQ ID NO：15来源的一段多肽序列。在另一个的实施方案中，这种多肽可由来源于SEQ IDNO：14或者其互补序列的序列编码。

在进一步相关的实施方案中，根据本发明，HGV肝炎病毒多肽可为包含HGV多肽和次级多肽的一种融合多肽。更具体地说，这种融合多肽可包括β-半乳糖苷酶或谷胱甘肽-S-转移酶蛋白序列作为次级多肽的信号序列。另外，这种次级多肽可包含一种颗粒形成蛋白。

上面所述的多肽可来源于结构性或非结构性病毒蛋白。

在更进一步相关的方面，本发明包括一种克隆载体，该载体在适当条件下，具有表达cDNA开放阅读框(ORF)的能力，此ORF是从HGV肝炎病毒基因组、cDNA或其互补链来源的。在本发明的这一方面，ORF被可操作性地连接至与所需宿主相容的控制序列上。在一个相关方面，本发明包括用这样一个载体转化的细胞。在一个较特定的载体实施方案中，ORF可来源于SEQ ID NO：14或其互补链。在更进一步的特定实施方案中，该ORF可来源于SEQ ID NO：37或SEQ IDNO：19。

在一相关方面，本发明包括产生HGV肝炎病毒多肽的方法。该方法包括在适宜于开放阅读框(ORF)序列表达的条件下，培养含有上述载体的细胞。在一个较特定的实施方案中，该ORF序列编码一多肽序列，该多肽序列选自SEQ ID NO：15，SEQ ID NO：38或SEQ IDNO：20或其片段。另外，该ORF序列可来源于HGV cDNA或其互补链。在另外特定实施方案中，载体是在大肠杆菌细胞中表达的λ-gt11噬菌体。

在进一步相关的方面，本发明包括一种诊断试剂盒，该试剂盒用于筛选含有特定抗HGV肝炎病毒感染的抗体的血清。该试剂盒可包括基本分离的HGV多肽抗原，该抗原包含与至少一种抗HGV抗体特异性免疫反应的表位。这种试剂盒还包括检测上述抗体抗原结合的方法。根据这一试剂盒，HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组，cDNA或其互补链。这种氨基酸序列同SEQ IDNO：15的2873个氨基酸序列、SEQ ID NO：38的190个氨基酸序列和SEQ ID NO：20的67个氨基酸序列相比，典型地具有至少40％的序列同源性。在特定的实施方案中，该试剂盒可包括重组产生的或化学合成的多肽抗原。该试剂盒的多肽抗原也可被吸附在固相支持物上。

在一个更具体实施方案中，上述试剂盒的检测手段包括与所述多肽抗原相连的固相支持物。该试剂盒还包括未吸附的报告分子标记的抗人抗体。在这个实施方案中，该抗体与HGV多肽抗原结合可通过报告分子标记抗体和该抗体结合来检测。

在相关方面，本发明包括检测试验个体中HGV肝炎病毒感染的方法。这一检测方法包括将从HGV试验个体取得的血清同基本分离的HGV多肽抗原反应，并检测该抗原中结合的抗体存在。在一个具体实施方案中，该方法包括吸附在固相支持物的多肽抗原，并且将血清和载体反应。结果，该载体和报告分子标记的抗人抗体反应。然后检测固相支持物中是否有报告分子标记的抗体存在。

在进一步的方面，本发明包括HGV肝炎病毒疫苗组合物。这些组合物包括基本分离的HGV多肽抗原，其中抗原包括与至少一种抗HGV抗体有特异性免疫反应的表位。可根据本领域已知的方法产生肽抗原包括重组表达或化学合成。该肽抗原优选在药学上可接受载体中以药理学有效剂量存在。

在更进一步的相关方面，本发明包括同HGV肝炎病毒表位特异性免疫反应的单克隆抗体。在另一个相关方面，本发明包括同HGV特异性免疫反应的多克隆抗体的制备。在一个更具体的实施方案中，由亲和层析制备这种多克隆抗体。

在一个相关方面，本发明包括生产HGV抗体的方法。这一方法包括用基本分离的HGV多肽抗原施用于试验个体，其中抗原包括与至少一种抗HGV抗体特异性免疫反应的表位。该抗原以使个体足以产生免疫反应的剂量使用。

而在另一个相关方面，本发明包括用于筛选含HGV抗原血清的诊断试剂盒。该诊断试剂盒包括同HGV多肽抗原特异性免疫反应的基本分离抗体，以及检测该多肽抗原和抗体结合的方法。在一个实施方案中，该抗体与固相支持物相连。在一具体实施方案中，该抗体可以是单克隆抗体。该试剂盒的检测方法包括二次、标记的单克隆抗体。选择性地，或另外该检测方法可包括一个标记的、竞争抗原。

在另一个相关方面，本发明包括检测试验个体中的HGV感染的方法。根据本发明的这一方面，将从试验个体获得的血清同上述试剂盒的基本分离HGV特异性抗体进行反应。然后检测HGV特异抗体是否有结合抗原的存在。

在更进一步的方面，本发明包括HGV感染的体内成熟细胞。在一个具体实施方案中，该细胞是在组织培养基中培养的肝细胞。更具体地说，该组织培养细胞是无限增殖的肝细胞，或是由HGV感染的灵长类动物肝脏中获得的一个细胞系。

在一个相关方面，本发明包括繁殖HGV的方法。该方法包括在如上所述的利于提高HGV繁殖的条件下，体外培养成熟的、HGV感染的细胞。在另一相关的方面，本发明包括由这一繁殖方法产生的HGV颗粒。

在另外的相关方面，本发明包括嵌合多肽。该多肽可包括至少两种HGV表位，其中多肽基本上缺乏在天然HGV编码序列中正常插入两表位间的氨基酸。在更具体的实施方案中，这种嵌合多肽与一固相支持物相连。更进一步相关的方面，本发明包括编码上述嵌合多肽的核酸。

在另一个相关方面，本发明包括检测试验个体中的HGV感染的方法，该方法包括将从个体获得的含抗体的样品与一嵌合多肽接触，如上所述，并检查抗原中结合抗体的存在。

在更进一步相关的方面，该发明包括HGV疫苗组合物。该疫苗组合物包括含有多于一个的HGV表位嵌合多肽。该嵌合多肽在药学上可接受载体中以药理学有效剂量存在。

B.HGV的免疫检测

由本发明方法获得的抗原的一种用途，是用作诊断试剂，检测HGV肝炎病毒感染的试验个体中是否有抗体，从而表明个体的感染与否；例如，470-20-1抗原、SEQ ID NO：14或其互补链编码的抗原以及完整病毒序列任一链的部分编码的抗原。本发明的抗原在检测HGV时，可以单独使用，或相互结合使用。本发明的抗原也可与对其它肝炎病原体如HAV、HBV、HCV、和HEV的诊断试验一起使用。

在一种诊断构型中，将检验血清与固相试剂反应，该试剂具有通过本发明获得的表面结合抗原，如470-20-1抗原。在抗HGV抗体与该试剂结合，并洗去未结合的血清成分后，将该试剂与报告分子标记的抗人抗体反应，使得报告分子按固相支持物上结合的抗HGV量的比例与试剂结合。再次洗涤试剂以除去未标记的抗体，并确定与试剂相连的报告分子的量。一般地该报告分子为一种酶，这种酶可以通过将固体相在有合适荧光或比色底物存在时培育固体相而检测(Sigma，St.Louis，Mo)。

上面检测中的固体表面试剂通过已知的技术将蛋白质材料连接到固体支持材料，如聚合玻璃珠、浸润棒(dip sticks)、96孔平板或滤纸材料上而制备。这些连接方法常常包括蛋白质非特异性吸附到载体上或蛋白质的共价吸附，典型地通过将减毒游离胺基连至固相支持物上的化学活跃基团上，例如激活的羧基、羟基或醛基。另一方面，链霉抗生物素蛋白包被的平板可与生物素标记的抗原结合使用。

还参与形成本发明的一部分是检测系统或试剂盒，该试剂盒通常包括具有表面结合重组HGV抗原的载体(例如上述的470-20-1抗原)和检测表面结合抗HGV抗原抗体的报告分子标记的抗人抗体。

在第二种称为同源检测的诊断形式中，结合到固相支持物上的抗体在反应介质中发生一些变化，这些变化可在介质中直接检测到。直到现在为止提出的同源检测的已知一般类型包括：(a)自旋标记报告分子，其中结合抗原的抗体的检测是根据报告的流动性的变化(自旋断裂峰增宽)来完成的，(b)荧光报告分子，其中结合物的检测是根据荧光效率或极化的变化来完成的，(c)酶报告分子，其中抗体结合引起酶/底物相互作用，及(d)脂质体结合的报告分子，其中结合导致脂质体裂解并释放被包被的报告分子。对本发明蛋白抗原的修改方法遵循制备均相检测试剂的常规方法。

在上述的每一种检测法中，检测方法包括将试验个体的血清与蛋白抗原反应，并且检测抗原中结合抗体的存在。该检验包括将标记抗人抗体连接到被检抗体上(如取于急性的、慢性的或恢复期)，并且测定结合到固相支持物上的报告分子的数量，如第一种方法，或可包括观察结合到同源检测试剂上的抗体的效果，如第二种方法。

第三种诊断形式包括能检测HGV特异性抗原的HGV抗体的使用。例如，利用抗原捕获试验检测读HGV抗原，其中候选血清样中的HGV抗原与HGV特异性单克隆或多克隆抗体反应。将抗体连接到一固相底物上，然后用第二不同标记的抗HGV抗体检测抗原。利用本发明的肽，可用标准方法制备抗体。另外，可产生基本分离的抗体(基本上是没有可能影响反应的血清蛋白)，(如亲和纯化(Harlow等))。

C.HGV的杂交试验

由本发明的方法获得的核酸序列的一种用途是用作存在于血清中的HGV顺序的诊断试剂，由此表明该个体中的感染。从本发明编码序列，特别是克隆470-20-1和SEQ ID NO：14获得的引物和/或探针，可以单独或相互结合的方式用于HGV的检测。

在一种诊断形式中，在PCR或RT-PCR条件下试验血清反应，例如使用来自470-20-1序列的引物。由引物靶向的序列的特异性扩增可检测扩增反应中所用的血清中的HGV的存在。实施例4描述了运用本发明克隆来源的引物，使用聚合酶链式扩增反奕，来筛选不同来源的材料。这些扩增反应的结果证明从本发明克隆所得的引物(如，实施例4)能够通过利用各种不同来源模板的扩增反应检测同源序列。实施例4中的扩增反应包括使用从血清直接获得的核酸作为模板材料。

另一方面，探针可以从本发明的HGV序列获得，然后可标记这些探针，并将其用作针对从试验血清或组织样品获得的核酸的杂交探针。可以用各种报告分子标记探针，并对其作相应检测：如放射性同位素标记和化学发光检测报告分子系统(Tropix，Bedford，Mass)。

靶扩增方法，具体体现为聚合酶链式反应，自我维持序列扩增技术[“3SR”，(Guatelli，等，Gingerse，等，1990)，也称为“NASBA”(VamGemen，等)]。连接酶链式反应(Barany)，链置换扩增[“SDA”，(Walker)]，和其它技术，增加靶序列的拷贝数。信号扩增技术，例如支链DNA探针(Horn and Urdea；Urdea；Urdea；等)和Q-β复制酶法(Cahill，等；Lomell；等)，首先结合特异分子探针，然后复制该探针的全部或部分或以其它方式扩增探针信号。

对于本发明公开的特异核酸序列或在相同或相似(相关)病毒基因组中的连续序列的检测，可使用扩增和检测方法，作为对PCR扩增的替代方法。在核酸诊断领域中已知大量的这类方法(The 1992 SanDiego Conference：Genetic Recognition，Clin.Chem. 39(4)：705(1993))。

1.自我维持序列扩增

自我维持序列扩增(3SR)技术产生与PCR相似体积，而且是等温的扩增。不同于温度循环驱动的PCR，3SR操作如一种协同的三种酶反应：a)由逆转录酶合成cDNA，b)由RNA酶H降解RNA链，和c)由T7RNA聚合酶转录RNA。

由于整个反应顺序是等温发生(典型地为42℃)，不需要昂贵的温度循环设备。没有通过加热、有机溶剂、或其它机制使双螺旋变性，扩增的只是单链模板(主要为RNA)。

在3SR扩增中合适的引物可以由本领域普通技术人员从本发明的病毒序列中选择。例如，对于用3SR技术等温扩增病毒序列，通过加入T7启动子序列和优选的寡核苷酸的5’末端的T7转录起始位点将引物470-20-1-77F(SEQ ID NO：9)修饰。这种修饰产生了适宜的3SR引物T7-470-20-1-77F(SEQ ID NO：9)。在没有修饰或T7启动子时，引物470-20-1-211R(SEQ ID NO：10)可被用于这些反应中。

用AMV逆转录酶(30U)，RNA酶H(3U)，T7RNA聚合酶(100U)，在100μl的反应物中培育从PNF2161抽提的RNA，该反应物中含有20mM Tris-HCl，pH 8.1(室温)，15mM MgCl₂，10mMKCl，2mM亚精胺盐酸，5mM二硫苏糖醇(DTT)，1mM的dATP，dCTP，dGTP和dTTP7mM的ATP，CTP，GTP和UTP，以及0.15μM每种引物在42℃下，在1-2小时的保温期间发生扩增。

起初，引物T7-470-20-1-77F与靶RNA退火，并由AMV逆转录酶延伸以形成起始RNA链的cDNA互补链。由RNase H降解RNA链后，逆转录酶催化第二条DNA链的合成，获得含有(双链)T7启动序列的双链模板。RNA转录导致单链RNA产生。然后该RNA重新进入下一轮扩增的循环，最后获得高浓度的产物RNA池(pool)。产物主要是与包含T7启动子(T7-470-20-1-77F)的引物相同的单链RNA，并具有相当少量的cDNA。

另一方面，另一种引物(470-20-1-211R)可能含有T7启动子，或两种引物都含有该启动子，这导致RNA两条链的产生为反应的产物。3SR反应产物可通过RNA分析的标准技术(如Northen印迹、RNA狭缝印迹或斑点印迹用RNA染色染料直接凝胶电泳)来检测。另外，产物可通过利用生物素-亲和素亲和相互作用或核酸探针的特异性杂交来检测。

在3SR产物的快速和特异分析技术中，产物与放射性标记的寡核苷酸470-20-1-152R(SEQ ID NO：21)在溶液杂交后，接着进行非变性的聚丙烯酰胺凝胶电泳。这种试验(凝胶迁移漂移类试验)使得可检测比未杂交的寡核苷酸对应的带移动得慢的特异性探针产物杂交。

2.连接酶链反应(LCR)

作为检测系统的另一实例，该HGV序列可构成连接酶链式反应(LCR)引物的设计基础。LCR利用了DNA连接酶的缺刻封闭活性，使得具有近邻5’-磷酸(“供体”寡核苷酸)和3’-羟基(“受体”寡核苷酸)末端的两个直接近邻的寡核苷酸连接。DNA连接酶的以模板依赖方式仅连接完全互补末端的特性，导致了很高程度的特异性，这样，除非要连接的末端与靶链序列完全吻合，否则连接不会发生。

作为对PCR的另一个替代方法，具有在引物和靶分型核酸之间判别单个碱基错配的特异性方面的某些优点，LCR可用于检测或“分型”具有与HGV序列同源的病毒株。这些技术适合于评估特异性突变的存在，当已知这样的碱基变化具有抗药性时(如Larder and Kemp；Gingeras，等，1991)。

在模板互补供体和受体寡核苷酸以及同供体和受体互补的寡核苷酸存在时，LCR的指数级扩增是可能的。在这个实施方案中，在一个循环反应中，每一轮产生连接反应后面几轮反应的另外模板。

例如，可用引物470-20-1-211R(SEQ ID NO：10)，一个邻接寡核苷酸(B，SEQ ID NO：22)和同类寡核苷酸(211R’，SEQ ID NO：23和B’，SEQ ID NO：24)来对本发明的序列作LCR扩增。首先通过标准方法进行逆转录，产生cDNA，然后在25μl反应体系中扩增，反应体系包括4种LCR引物(每种0.1～1μM)，20mM Tris-HCl，pH8.3(室温)，25mM KCl，10mM MgCl₂，10mM二硫苏糖醇(DTT)，0.5mM NAD⁺，0.01％Triton X-100和5单位DNA连接酶(威斯康星州Madison市Epicentre Techmologies公司生产的Ampligase，.或其它商业公司提供的热稳定型DNA连接酶)。

进行下列温度循环：94℃1分30秒；94℃1分钟；65℃2分钟，重复25～40次。产物合成的特异性取决于引物与模板在3’端位置的匹配。产物可用聚丙烯酰胺凝胶电泳后作溴化乙啶染色来进行检测。另一种方法是把某一种受体寡核苷酸(211R’或B)作5’-放射标记，在电泳后作放射自显影观测。

此外，也可用特异性可结合部分(如生物素)在3’端标记上供体寡核苷酸，而用特异性可检测基团(如荧光染料)在5’端标记受体，作固相捕获和检测。

3.扩增DNA的分析方法

关于扩增DNA的分析，已有多种方法介绍。其中一些方法有利于高产率的应用，而凝胶电泳则是不现实的，例如快讯高分辨HPLC技术(Katz和Dong)。但在一般情况下，用核酸探针筛选传染性病原的方法包括有一个单独的扩增后杂交步骤，以确保达到检测病原所需的特异性。

这种检测方法之一是以亲和力为基础的杂交捕获技术(Holodniy等)。在这种方法中，用一种生物素标记引物作PCR。在扩增之后，双链产物经变性，然后与过氧化酶标记探针(与掺入有生物素标记引物的单链互补)杂交。然后将杂交产物放在缓冲液中培养，缓冲液盛于包裹有亲和素(或链霉亲和素)的表面中(如膜滤器、微孔、胶乳或顺磁珠)。

包裹固态物与拟分析的PCR产物相接触，必须含有足够多的生物素结合位点，以便捕获到所有的自由的生物素标记引物，以及极低浓度的生物素标记PCR产物。对固态物冲洗3～4次以后，在含有过氧化氢的柠檬酸缓冲液与邻苯二胺共同培养，以检测结合杂交产物。

另一种方法是通过探针包裹的表面来介导捕获，然后通过生物素标记引物和亲和素报告物酶结合物来进行基于亲和性的检测(Whetsell等)。

4.其它方法

本发明的病毒序列也可使用支链DNA探针，形成信号扩增检测方法的基础。支链探针(Horn和Urdea；Urdea)已被用来检测和定量稀有的RNA和DNA序列(Urdea等)。在这一方法中，用与目标RNA或DNA互补的序列来合成寡核苷酸探针(RNA、DNA或核酸类似物)。探针还含有一个或多个与目标RNA或DNA不能互补的独特支链序列。

这一独特序列构成了供分支二级检测探针作杂交的目标，在二级检测探针中含有一个或多个其它的独特序列，作为三级探针的目标。在信号扩增的路径中的第一个分支点，不同的独特序列指引二级、三级等检测探针的杂交。在这一序列中的最后一个探针通常与一个用于检测的酶相连接(如碱性磷酸酶)。引物的顺序杂交最终形成一个高度分支的结构，其臂最终止于与酶连接的探针。

酶促转化是最后一次扩增，选择高灵敏度的化学发光底物(如密执安州底特律市Lumigen公司的LumiPhes，作为一种碱性磷酸酶标记底物)可以达到所需的灵敏度，即每一测定初始目标序列在一万个分子或一万个以下。在这种检测方法中，扩增仅取决于分子杂交，而不是酶促反应，因而比PCR等方法更不易受临床样本中的抑制物的影响。因此，这种检测允许用较粗放的技术，在测试样品中有核酸释放，而不必在测定前作严格的提纯。

本发明对病毒序列灵敏检测的扩增也可通过Q-β复制酶技术来完成(Cahill等；Lomell等；Pritchard等)。这一方法要设计一个与目标序列互补的特异性探针。然后通过标准的分子克隆技术将这一探针插入Q-β噬菌体的可复制RNA序列中。在复制子的特定区域插入并不能阻止Q-β复制酶的复制。

作分子杂交及多次冲洗之后，加入复制酶，探针的扩增开始。“可逆目标捕获”是一种能减少因未杂交探针的复制而产生的背景的技术(Morrissey等)。扩增后的复制子可以用DNA、RNA或核酸类似物探针，通过常规分子杂交技术来检测到。

其它用于扩增和检测稀有DNA和RNA的方法见于文献中。在分子诊断领域的一些应用中，这些方法要优于PCR方法。这些替代技术构成了对本发明揭示出的序列进行检测、定性(例如：本文描述的序列的多个相关菌株和序列多样性，抗药性的基因型变化)或定量分析的基础。

本发明的另一构成部分是测试体系或试剂盒，用于进行上述扩增/杂交实验。这种试验盒一般包括用于扩增反应的特异性引物或杂交探针。

D.治疗用途

以上所述，本发明的HGV抗原可用于制备疫苗。

更进一步，针对本发明的多肽抗原所产生的抗体可用于被动免疫治疗或被动免疫预防。这类抗体可以与其它治疗注射用抗体相似的剂量进行注射。例如，在其它病毒性疾病，如狂犬病、麻疹和乙型肝炎的潜伏初期，可按每磅体重0.02～0.1ml的量注射γ蛋白，以干扰感染症状的形成。因此，与HGV抗原相反应的抗体可以单独或与其它抗病毒剂一起，被动注射到感染了HGV的宿主体内，以增强宿主对付感染的能力。

本文公开的HGV序列将HGV确认为黄热病毒科的成员(见上)。黄热病毒科分为3个属：黄病毒，鼠疫病毒(Petstiviruses)和丙型肝炎病毒属(Francki等)。所有的黄病毒属均含有一个正链RNA基因组，其长度为9.0～12kb，编码一条由3000～4000个氨基酸构成的单一长多肽。这一多肽经蛋白水解，分割成大约10个蛋白质，包括一个病毒衣壳蛋白、病毒被膜蛋白和至少5个非结构蛋白(NS)。非结构蛋白包括一个似胰凝乳酶丝氨酸蛋白酶、RNA解螺旋酶(NS3)以及一个依赖于RNA的RNA聚合酶(NS5)。黄病毒属的NS3蛋白是对病毒多肽进行蛋白水解所必需的。N5蛋白则是病毒基因组复制所必需的(Chambers等，1990)。

此外，一些细胞蛋白也被确认参与到黄热病毒科的复制之中。例如，细胞信号肽酶是在几个酶切位点对病毒多肽进行酶切以及允许病毒蛋白酶进行表达所必需的(Hijkata等)。

那些能够阻止这些蛋白在黄病毒复制中执行各自功能的抑制剂也可能对于治疗HGV感染有治疗价值。此外，细胞因子或其它已知有抗病毒活性和/或调节人体免疫系统作用的多肽对于治疗HGV感染也可能具有功效。

有一种核苷酸类似物，1-B-D-呋喃核糖-1-2，4-三唑，3-羰酰胺(也称为三氨唑核苷，Patterson等)，能够抑制黄热病毒科中依赖于RNA的RNA聚合酶，同时可望抑制HGV中NS5蛋白的活性。三氨唑核苷的作用方法被认为是参与排除细胞间鸟嘌呤池，并干扰病毒RNA的加帽反应(Patterson等)。

在感染HCV的个体中，注射三氨唑核苷后可观测病毒滴度和血清中的丙氨酸转移酶(ALT，作为肝功失调的指示酶)水平均显著下降(Reichard等；Di Bisceglie等，1992)。三氨唑核苷看起来对治疗黄热病毒科感染有广泛的功效，因此，对因HGV而造成肝部疾病的人注射三氨唑核苷，可望得到良好的结果。

另一类已知对治疗黄热病毒科感染有效的化合物包括有，细胞因子干扰素α、干扰素β和干扰素γ(Baron等，Gutterman)。干扰素被认为通过下列起到抗病毒剂的作用，(i)诱导干扰病毒RNAs的复制和翻译的细胞蛋白的表达，和(ii)通过激活人细胞免疫体系的成员(Baron等)。干扰素对于治疗病毒性感染，包括HBV、HDV和HCV感染，有广泛的适用性(Gutterman，Farci等)。尤其是有许多研究已表明，干扰素在单独使用或与其它抗病毒治疗方法结合使用时，均对治疗丙型肝炎病毒感染有效(Di Bisceglie等，1989；Kakumu等)。由于HGV具有明显的亲肝性质，而且属于黄热病毒科的成员，HGV感染可望对类似的干扰素治疗作出反应。

另一类具有显著抗病毒活性的化合物是病毒蛋白酶抑制剂(Krausslich等)。所有的黄热病毒科均编码一个似胰凝乳酶丝氨酸蛋白酶，这一酶是对基因组多肽的非结构区进行多位点切割所需的。构成这一蛋白酶切位点的氨基酸残基已被清楚描述，包括一个组氨酸，一个天冬氨酸和一个丝氨酸残基(Grakoui等)。对黄病毒和黄热病毒的进一步研究表明，这一活性位点中丝氨酸的突变可阻止病毒复制(Chambers等，1990b)。

HGV NS3抑制剂可以设计为模仿酶切割的转换状态。也可以从已有的合成化合物中广泛筛选出这种抑制剂。选出的HGV NS3蛋白酶抑制剂的活性可以通过体外转录/转译体系来确定，这一体系已广泛用于黄热病毒科的研究中(Hijikata等；Grakoui等)。

另外，可以将HGV基因组克隆到适合于真核蛋白表达的载体中去，如杆状病毒或痘苗病毒，在组织培养体系中确定化合物的功效(Grakoui等)。采用这种方法，已成功地获得了HIV蛋白酶的有效抑制剂(Vacca等；Roberts等)。

另一种治疗因HGV感染造成疾病的方法依靠合成编码本发明提出的HGV序列片段的反义核苷酸(Tonkinson and Stein)或寡核苷酸类似物。与黄热病毒科内所有病毒相同，HGV基因组是一条正链RNA分子，大小为9～12kb。病毒基因组为一条单链，因此，HGV对反义寡核苷酸极为敏感。可用来抑制病毒复制的可能的目标序列包括HGV5’端未转译区，HGV核糖结合位点或其它可能干扰HGV转译的序列。

反义寡核苷酸可以通过商用合成仪来合成。优选采用二硫代磷酸酯骨架来合成寡核苷酸，这样更有利于抵抗核酸酶切(Marshall &Caruthers)。此外，也可采用其它的寡核苷酸类似物，如那些未荷电或酰胺型骨架(Egholm等)。这些寡核苷酸有商业供应(Biosearch，Millipore，Bedford，MA)，由于它们不带电荷，故能很好地与生物膜杂交，而生物膜一般会阻止带电荷大分子的通过。

寡核苷酸(或其类似物)在反义应用时，一般长度大于8个核苷酸，以便于与HGV基因组内的目标序列杂交。例如，当DNA寡聚体与病毒RNA目标序列杂交时，杂交复合物能被RNAse H这样的细胞酶所分解。然后，HGV模板的减少将减轻HGV导致的疾病的严重性。

上述治疗方法的实用性和功效可以通过在体外使用上述细胞体系和在体内使用上述动物模型体系而作出评价。

下面的实施例将说明本发明，但绝不是限制本发明。

材料和方法

利用商品上可购得自动寡核苷酸合成仪制备合成的寡核苷酸接头和引物。也可以从商业公司购买用户设计的合成寡核苷酸。

标准的分子生物学及克隆技术基本上按Ausubel等，Sambrook等和Maniatis等描述的方法进行。

与采用抗血清和/或抗体来筛选和检测免疫反应蛋白抗原相关的常规操作基本上按所述的进行(Harlow等)。同样，在检测抗病毒抗体时用的ELISA和Western印迹。按其生产厂商(北芝加哥Abbott公司或新加坡Genelabs Diagnostics公司)提供的方法或采用本领域已知的常规技术进行(Harlow，等)。

实施例

实施例1

构建PNF2161cDNA文库

A.从血清中分离RNA

在1毫升未稀释PNF2161血清中添加PEG(分子量为6000)至8％，在4℃条件下以12K离心15分钟，产生沉淀。按Chomczynski描述的基本方法，从获得的血清沉淀物中提取RNA。

沉淀物用含4M异硫氰酸胍，0.18％2-巯基乙醇和0.5％十二烷基肌氨酸钠的溶液处理。处理后的沉淀物再用酸性苯酚氯仿抽提数次，用乙醇来沉淀RNA。这一溶液在-70℃静置约10分钟，然后用微量离心管在4℃离心10分钟。获得的沉淀物再用100μlDEPC(焦碳酸二乙酯)处理水和10μl3M NaOAc(pH5.2)作混悬，然后在溶液中加入2份100％乙醇和1份100％异丙醇。将溶液在-70℃下静置至少10分钟。在5℃下以12000×g离心15分钟，得到RNA沉淀物。沉淀物用70％乙醇冲洗，然后真空干燥。

B.合成cDNA

(1)第一链的合成

cDNA分子的合成按下述方法完成。按Gubler等的方法，用随机核苷酸六聚体引物(cDNA合成试剂盒，BMB，Indianapolis，IN或GIBCO/BRL)将上述RNA制备物转录为cDNA。

在第二链cDNA合成之后，将T4DNA聚合酶添加到混合物中，使cDNA分子的平端数达到最大。反应混合物在室温下培育10分钟。反应混合物用苯酚/氯仿和氯仿异戊醇抽提。

添加2份100％乙醇，在-70℃下冷却15分钟，使cDNA沉淀出。通过离心收集cDNA，沉淀物用70％乙醇冲洗后，真空干燥。

C.双链cDNA分子的扩增

cDNA沉淀物用12μl蒸馏水再悬浮。在cDNA悬浮液中加入：5μl磷酸化接头(接头AB，这是一条由SEQ ID NO：1和SEQ IDNO：2组成的双链接头，其中SEQ ID NO：2相对于SEQ IDNO：1处于3’至5’方向，是与SEQ ID NO：1部分互补的序列)，2μl 10×连接缓冲液(0.66M Tris-HCl，pH7.6，50mM MgCl₂，50mM DTT，10mM ATP)和1μl T4 DNA连接酶(0.3到0.6 Weiss单位)。通常，cDNA和接头按1∶100的比例混合。反应在14℃下温育过夜。次日早晨将反应液在70℃下温育3分钟，使连接酶失活。

在100μl含1.5mM MgCl₂和500mM KCl(缓冲液A)的10mMTris-Cl缓冲液(pH8.3)中，加入约1μ1接头连接cDNA制备物，2μM带有如SEQ ID NO：1所示序列的引物，dATP、dCTP、dGTP和dTTP各200μM，2.5单位栖热水生菌(thermus aquaticus)DNA聚合酶(Taq聚合酶)。反应混合物加热至94℃，经30秒变性，降温至50℃，持续30秒，使引物退火，然后加热至72℃，经0.5～3分钟，通过Taq聚合酶使引物延伸。由连续加热、降温和聚合酶反应构成的扩增反应借助于Perkin-Elmer Centus DNA热循环仪，重复进行25-40次(Mullis；Mullis等；Reyes等，1991；Perkin-Elmer Cetus，Noralk，CT)。

在扩增反应之后，用苯酚/氯仿，氯仿/异戊醇对溶液作抽提，然后用2份乙醇沉淀。获得的扩增cDNA沉淀物再悬浮于20μlTE(pH7.5)中。

D.将cDNA克隆到λ载体中

用于构建cDNA的接头含有一个EcoRI位点，可将扩增cDNA直接插入λ-gt11载体(Promega，Madison WI或Stratagene，La Jolla，CA)。λ载体可以从厂商(Promega)处采购，它已经用EcoRI消化过，并用碱性磷酸酶处理，以去掉5’磷酸，防止载体的自身连接。

将EcoRI消化过的cDNA制备物连接到λ-gt11(Promega)上。连接反应的条件如下：1μl载体DNA(Promega，0.5mg/ml)；0.5或3μl PCR扩增的插入cDNA；0.5μl 10×连接缓冲液(0.5MTris-HCl，pH7.8；0.1M MgCl₂；0.2M DTT；10mM ATP；0.5mg/ml牛血清白蛋白(BSA)；0.5μl T4 DNA连接酶(0.3至0.6 Weiss单位))。最后，添加蒸馏水，使最终反应液容量达到5μl。

连接反应液在14℃下培育过夜(12-18小时)。用λDNA包装体系(“GIGAPAK”，Stratagene，IaJolla，CA)，通过常规方法对连接上的cDNA作包装，然后分装成不同的浓度，以确定滴度。采用标准的X-gal蓝/白试验来确定文库的重组频率(Miller；Maniatis等)。

每一文库的重组率也可按下列方法来确定。选择一些随机克隆，分离出相应的噬菌体DNA。然后，以分离的噬菌体DNA作模板，从cDNA分子的EcoRI插入位点处的侧翼λ序列中得到的λDNA序列作引物，进行聚合酶链式反应(Mullis；Mullis等)。对PCR产物作电泳分析，即可判断是否存在插入片段。

从血清样品PNF2161产生的插入cDNA的噬菌体文库已保藏在美国典型培养物保藏中心，12301Parklawn Dr.，Rockville，MD20852，并且保藏登记号为ATCC75268(PNF2161cDNA信息库)。

实施例2

重组文库的免疫筛选

对实施例1中产生的λ-gt11文库进行免疫筛选，确定是否有可由PNF2161血清识别的抗原的产生。这些文库由PNF2161血清产生的。使用埃希氏大肠杆菌接种株E.coli KM392，对噬菌体作平板培养，以形成噬菌斑。也可以使用E.coli Y1090R(Promega，Madison WI)。

按Ausubel等描述的基本方法，用血清抗体对λ-gt11克隆表达的融合蛋白进行筛选。

按每150mm平板约2×10⁴个噬菌体对每一个文库进行平板培养。平板上覆盖硝化纤维素滤膜，过夜。滤膜用TBS(10mM，Tris pH7.5；150mM NaCl)清洗，用AIB(TBS缓冲液，含1％明胶)封闭固定，然后在AIB中稀释100倍的初级抗体作培养。

用TBS中洗后，滤膜用次级抗体和结合了碱性磷酸酶的羊抗人IgG(Promega)进行培养。用一个底物(如BCIP，5-溴-4-氯-3-吲哚-磷酸盐)，用NBF(氮蓝四唑盐(Sigma))形成反应噬菌斑。初级筛选所得的阳性区再被涂板和免疫筛选，直到获得纯噬菌斑为止。

实施例3

筛选PNF2161文库

λ-gt11中PNF2161的cDNA文库按实施例2的方法，用PNF2161血清作筛选。筛选的结果列于表1中。

表1

PNF2161文库

文库¹	重组率²(％)	抗体³	筛选数	纯化噬菌斑克隆数
文库¹	重组率²(％)	抗体³	筛选数	纯化噬菌斑克隆数	PNF/RNA	85	PNF	5.5×10⁵	4
PNF/RNA	90	PNF	8×10⁴	7	PNF/RNA	85	PNF	5.5×10⁵	4
PNF/RNA	90	PNF	8×10⁴	7	总数：				11

1.由所示人源构建的cDNA文库；

2.在所示λ-gt11文库中重组克隆的比例，通过蓝/白噬菌斑试验

确定，并经过对随机抽样克隆作PCR扩增进行确认；

3.对每一所示文库作免疫筛选时用的抗血清来源。

通过上述筛选分离出的克隆之一(PNF2161克隆470-20-1，SEQ ID NO：3；β-半乳糖苷酶码框内融合转译序列，SEQ IDNO：4)被用来产生延伸克隆，如实施例6所示。克隆470-20-1核酸序列被列为SEQ ID NO：3(蛋白质序列SEQ ID NO：4)。不用SISPA克隆接头分离出的核酸序列被列为SEQ ID NO：19(蛋白质SEQ ID NO：20)。

实施例4

免疫反应470-20-1克隆的鉴定

A.免疫反应克隆的Southern印迹

对免疫反应克隆的插入片段作筛选，测定其与下列对照DNA杂交的能力：人外周血正常淋巴细胞(购自斯坦福大学血库，Stanford，CA)DNA和大肠杆菌KM392基因组DNA(Ausubel等；Maniatis等；Sombrook等)。用EcoRI和HindIII对10μg人淋巴细胞DNA和2μg E.coli基因组DNA进行消化。限制性消化产物在琼脂糖凝胶上作电泳分离(Ausubel等)，并按产品说明，转移到尼龙膜或硝酸纤维素膜(Schleicherand Schuell，Keene，NH)上。

按下述方法从免疫反应克隆中制备探针。使用对应于λ-gt11序列(处于gt11载体EcoRI克隆位点的侧翼)的引物，对每一个克隆进行扩增。以每一个免疫反应克隆作为模板，通过聚合酶链式反应进行扩增。所获扩增产物用EcoRI进行消化，扩增片段作凝胶纯化，并从凝胶上提取出来(Ausubel等)。然后，所获扩增片段(来自免疫反应克隆)用商品化试剂盒(BMB)，通过³²P-dNTPs作随机引物标记。

然后，将随机引物标记的探针杂交到上述制备的尼龙膜上，以检测插入序列是否杂交到对照DNA上。470-20-1插入片段不会与任一个对照DNA杂交。

作为阳性杂交对照物，从人的C-κ基因片段(Hieter)中得到的一个探针被用作人类DNA的单基因拷贝对照物，而同样将一个大肠杆菌聚合酶基因片断用作大肠杆菌DNA的对照物。

B.基因组PCR

PCR检测首先是用作鉴定一些基因组DNA的外源性，这些基因组DNA在构建文库时可能因疏忽大意而发生克隆错误，其后，PCR又被用来检验在克隆来源和其它有关样品中是否存在克隆序列。一些不同类型的样品可被作检验，如SISPA扩增的核酸，从主要样本来源中提取的核酸，以及从有关来源材料(如从动物传代研究中)中提取的核酸。

“基因PCR”这一术语是指检测在有关生物体的基因组中是否存在特定的序列。例如，对口鬃来源克隆的基因PCR包括的基因组DNA如下：

1.人DNA(1μg/rxn.)

2.口鬃DNA(0.1-1μg/rxn.)

3.大肠杆菌(10-100ng/rxn.)

4.酵母(10-100ng/rxn.)

人和口鬃DNA作为直接的和最终的病原体来源进行检验。对大肠杆菌基因组DNA，作为商业酶制剂的一种经常污染物，进行了检测。也对酵母进行检测，作为无所不在的生物，即DNA能污染试剂，因此而被克隆。

此外，也扩增一个阴性对照(即仅有缓冲液或水)和包括大约10⁵/rnx.的阳性对照。

扩增反应条件的变化，根据特定序列来确定，但是严密地遵循下列标准的PCR规则：PCR是在反应液中进行的，每100μl的此反应液含有10mM Tris，pH8.3，50mM KCl，1.75mM MgCl₂，每一种引物1.0μM，dATP、dCTP和dGTP各为200μM，dUTP为300μM，2.5单位Taq DNA聚合酶，和0.2单位尿嘧啶-N-糖苷酶。循环是在94℃至少1分钟，而后30-40次重复变性(92-94℃，15秒钟)、退火(55-56℃，30秒钟)和延伸(72℃，30秒钟)。PCR试剂的配制，以及扩增反应的建立都是在保证没有扩增DNA的一个特别设计的实验室中进行的。

为了进一步阻止扩增序列的污染造成的试验的“假阳性”结果，该PCR是用dUTP代替TTP进行，使得扩增序列从生化上区别于天然DNA。为了酶促提供不可扩增的任何污染的PCR产物，在所有的PCR反应中包括了尿嘧啶-N-糖苷酶。一旦热循环结束，反应保持在72℃，防止尿嘧啶-N-糖苷酶的复性和扩增的含U序列的可能降解。

利用标准技术(“AMPLIWAX”，Perkin-Elmer Biotechnology；或者使用手工技术)，进行“HOT START PCR”，以使上述一般规则对种类不同的序列扩增更有活力，这是理想地要求不同的扩增条件有最大的敏感性和特异性。

对扩增DNA的检测，是通过它和特异寡核苷酸探针杂交，该探针定位在两个PCR引物序列的内部，并和两引物没有或有很小的重叠。在有些情况下，利用溴化乙锭荧光，直接可看到电泳的PCR产物，但每次都要进行探针杂交，以确定特异和非特异扩增产物间的区别。在溶液中和放射性探针杂交后在8-15％的聚丙烯酰胺凝胶(根据扩增序列的大小调整浓度)中电泳，接着放射自显影。

利用基因组PCR，抗人、大肠杆菌和酵母的DNA，检测克隆470-20-1。在阴性对照反应中没有检测到特异序列，也没有在任何检测的基因组DNA中，和有10⁵拷贝的DNA(导致易检测的信号)的反应中检测到。这种敏感性(10⁵/反应)对含有1μg总DNA的反应中检测人的单拷贝序列是合适的，代表大约1.5×10⁵个细胞中的DNA。

C.直接对血清进行聚合酶链式反应(PCR)

利用经过选择的克隆序列作引物进行聚合酶链式反应(PCR)，对血清以及其它的克隆来源或相关来源的物质直接进行测验。在这些实验中，用聚乙二醇(PEG)直接从血清中沉淀HGV病毒颗粒，或者利用超速离心法从PNF和其它确定的血清中沉淀病毒颗粒。为了纯化RNA，将沉淀物溶解于硫氰酸胍中，再用酸性胍苯酚进行提取(Chomczynski等)。

另一种选择是将上述方法作以改动，利用一些商品试剂(如：“TRIREAGENT”(Molecular Research Center，Cincinnati，OH)或“TRIZOL”(Life Technologies，Gaithersburg，MD)和相关流程分离RNA。此外，通过利用“PURESCRIPT”试剂及流程(GentraSystems，Minneapolis，MN)在事先不进行病毒颗粒的沉淀和浓缩的情况下，直接从血清或其它含病毒的液体中分离出适于作PCR分析的RNA。

分离出的DNA被直接用作PCR的模板。对RNA利用反转录酶(Gibco/BRL)进行反转录，其cDNA产物便可作为随后PCR扩增的模板。

在为470-20-1时，把从等量的PNF血清中(每份约20～50μl)提取的核酸作为输入模板加入到每一个逆转录-聚合酶链式反应(RT-PCR)或聚合酶链式反应(PCR)中。引物设计是基于470-20-1序列基础上的，具体如下：470-20-1-77F(SEQ ID NO：9)和470-20-1-211R(SEQ ID NO：10)。利用MMLV-RT(Gibco/BRL)和随机六聚体(Promega)进行逆转录反应，需要在室温下温浴约10分钟，42℃下15分钟，99℃下温浴5分钟，然后迅速冷却到4℃。合成的cDNA可以不经纯化直接进行PCR扩增，每100μl反应液中含有1.75mM MgCl₂，每种引物0.2～1μM，每种dATP、dCTP、dGTP和dTTP均为200μM以及2.5-5.0单位的Taq DNA聚合酶(“AMPLITAQ”，Perkin-Elmer)。利用“GENEAMP SYSTEM9600”热循环仪(Perkin-Elmer)或在相当的循环条件下利用其它的热循环仪(Perkin-Elmer；MJ Research，Watertown，MA)，将循环反应在94℃下至少进行一分钟，循环过程重复40～50次，变性(94℃下15秒钟循环10次；92℃或94℃下后续的循环需要15秒钟)、退火(55℃30秒钟)和延伸(72℃30秒钟)。

阳性对照由以下组成：(i)预先扩增的PCR产物，已利用Hoechst33258荧光分析法对其浓度进行了估计，(ii)纯化了的包含目标DNA序列的质粒DNA，(iii)纯化了的RNA转录物[来自质粒克隆，这种质粒已将目标DNA置于噬菌体RNA启动子的控制之下(如：T7，T3，或SP6)和利用商用体外转录试剂盒得到的RNA。此外，可将对应于约10～100拷贝/rxn.的一等份阳性对照DNA掺加到有从源样品的克隆物中提取出的核酸参加的反应中，来控制DNA扩增反应抑制剂的产生。每一份分离提取物的测定至少要使用一个阳性对照。

通过与特异性寡核苷酸探针470-20-1-152F(SEQ IDNO：16)的杂交来确定产物的特异性。用20μl包括约1×10⁶cpm ³²P标记的470-20-1-152F的反应液与10μlPCR产物进行杂交。利用聚丙烯酰胺凝胶电泳分离特异的杂交片段与未杂交的寡核苷酸，然后进行放射自显影。

除了PNF之外，从正常血清中提取的核酸也可利用“血清PCR”流程序列进行逆转录和扩增。在正常人的血清中未探测到任何信号。应用470-20-1特异引物，在PNF血清的多份提取物中都能重复探测到特异信号。

D.对不依赖于序列的单引物扩增(SISPA)未克隆的核酸进行扩增

用SISPA扩增的cDNA作模板(实施例1)。利用经选择的克隆序列来设计序列特异的引物，被用于扩增模板中的目标DNA片段。典型地，在克隆操纵中，用SISPA扩增的样品作模板。例如，扩增引物470-20-1-77F(SEQ ID NO：9)和470-20-1-211R(SEQID NO：10)是从克隆470-20-1序列(SEQ ID NO：3)中选出的。这些引物用于以SISPA扩增的PNF2161cDNA为模板的扩增反应中。

可通过以下手段对扩增的DNA片段进行识别：(i)用特异性的寡核苷酸探针470-20-1-152F(SEQ ID NO：16)作杂交探测，这种探针是基于470-20-1序列(SEQ ID NO：3)设计的。和/或(ii)根据片段的大小识别。应用于DNA印迹探测的探针应根据厂商的推荐(BMB)利用末端转移酶作地高辛标记。然后，可用Southern印迹或液体杂交分析法(Kumer等)对扩增的DNA作杂交分析。

用于扩增反应的阳性对照DNA是预先扩增的CPR产物，其浓度可用Hoechst33258荧光分析法或用纯化的含有目标插入序列的质粒的方法进行测定。

对SISPA扩增的PNF2161进行PCR扩增，所得cDNA中可探测到470-20-1特异性信号。同时，还可探测到阳性对照DNA模板，而阴性对照反应并未发生。

E.对肝的RNA样品进行扩增

采用Cathal等的方法从肝的活组织检查材料中制备RNA，其中组织的提取是在5M的硫氰酸胍溶液中用4M的LiCl直接沉淀进行的。用2M的LiCl溶液洗涤RNA沉淀，再用苯酚：氯仿萃取以除去蛋白杂质，最后用乙醇再回收RNA。

470-20-1特异性引物也可用于以下述RNA来源作底物的扩增反应：正常的口鬃肝RNA，正常的tamarin(Sanguinus Labiatus)肝RNA和MY131肝RNA。MY131是一种用静脉注射接种1ml PNF2161血浆的口鬃。肝酶(SCID)含量明显上升，病毒感染已引起明显的组织学变化。组织学相关在MY131的肝中表现得最明显，MY131的肝取自SCID活性最高或接近最高时。用HCV的非编码引物(SEQ ID NO：7和SEQ ID NO：8)，MY131的肝RNA不能产生扩增产物。

进行两个试验，重复每个试验的扩增反应，扩增反应结果见表2。

表2

用470-20-1引物作PCR

	实验1		实验2
	实验1		实验2			A	B	A	B
正常口鬃肝细胞	-	-	-	-		A	B	A	B
正常口鬃肝细胞	-	-	-	-	正常Tamarin肝细胞	-	-	-	-
My131肝细胞	+	+	+	+	正常Tamarin肝细胞	-	-	-	-
My131肝细胞	+	+	+	+	PNF2161	++	++	++	++

这些结果表明470-20-1序列存在于亲本血清样(PNF2161)和来自PNF2161样品的传代动物(MY131)的肝RNA样品中。可是，两种对照RNA都呈现470-20-1序列阴性。

F.用RNA作模板通过PCR从一系列血清中筛选HGV序列

1.高丙氨酸转氨酶(HIGH-ALT)供体

利用HGV特异性引物，通过PCR对来自肝炎病人和肝功不正常的献血者血液的血清进行筛选来评估HGV和肝病的疾病相关性。后者由来自捐献血液的血清组成，这些捐献血液的每毫升血清中ALT水平都高于45国际单位(IU)。

选择一个由152种全血清组成的血清序列。下面血清选自血清系列：104个高丙氨酸转氨酶(High-ALT)血清[从斯坦福大学血库(SUBB)中筛选出]；34个N-(ABCDE)肝炎血清(来自北加利福尼亚，埃及和秘鲁)；14个来自怀疑患有肝病或肝炎病毒感染者的血样。本系列血清的阴性对照如下：9个经过高度筛选不含病毒感染危险因子的献血者的血清(SUBB)(“极正常”血清，如：O-阴性；RH-阴性；对HIV，已知的肝炎病原体和CMV都呈阴性；以前经过多次输血都未引起疾病的捐献血液)；和2个随机献血者的血清。这些血清通过利用470-20-1引物77F(SEQ ID NO：9)和211R(SEQID NO：10)进行RT-PCR来分析是否存在HGV特异性序列。

如实施例4C所述，必须进行RNA提取和RT-PCR反应，除非引物470-20-1-211R被5’-生物素化以促进对扩增产物进行快速筛选，这种筛选方法涉及溶液杂交和利用链霉亲和素包裹的顺磁玻璃珠进行亲和性捕获。用特异性的标记探针和杂交序列通过亲和互作所得的捕获物进行杂交来分析核酸的方法在核酸分析领域中是众所周知的。

用于每个RT/PCR反应的RNA可来自30-50μl的血清中，这取决于所能得到的用于血清测验的血清数量。对每份血清都设置重复实验，每个反应的阳性对照分别对应于RNA转录物的10、100或1000个拷贝，还有适当的阴性对照(缓冲液)。阴性对照都没有活性，并且在每个PCR过程中每个反应至少可探测到10个拷贝。当特异性的杂交信号只出现在两个重复反应的某一个之中时，所得到的结果是不确定的。

使用专门为应用电化学发光的寡核苷酸探针(QPCR系统5000^TM，Perkin-Elmer)进行亲和性杂交捕获设计的仪器，可对这一系列血清的扩增产品进行有效的、高敏性的分析。对利用QPCR-5000^TM的方法早已被描述(Dicesare等)。

通过与探针470-20-1-152F(5’端用电化学放光的钌螯合物标记)杂交并应用“QPCR5000”仪器对每个反应的产物进行分析。在一个给定的扩增过程中，若截断点(cutoff)确定在阴性对照的平均数加三个标准差处，那么确证实验要选择34个可能的阳性对照。

采用溶液杂交和电泳(实施例4C)对34个样品进行分析。这34个样品中，有6种血清(即6/152)在重复反应中都发现有特异性的杂交序列。在这6个样品中，有三个与阳性对照相比具有强烈活性：一种是来自SUBB含高丙氨酸转氨酶的血清，另两种是采自埃及的N-(ABCDE)血清。

在采集了第一个样品之后一年，又从高阳性的SUBB血清供给处采得第二个血样，通过上述的PCR方法确定第二个血清样品呈HGV阳性。这一结果证实在某一人体中HGV感染仍在继续。把这种血清被称为“JC”。进一步确定，血清供给者呈HCV阴性(通过血清学反应测验和PCR确定)和HAV、HBV抗体阴性。

此外，用这种方法测定：一个来自埃及的第三个N-(ABCDE)血清样、一个北加利福尼亚患N-(ABCDE)肝炎的献血者的血清样和一个N-(ABCDE)肝炎血清样，结果也都表现出微弱阳性。其它的两份血清结果不确定，因为在两个扩增反应中只有一个发现有特异性序列存在。

随后再从这些HGV阳性和结果不确定的血清中取等份血清作PCR分析，结果8份被测定的血清中6份呈HGV阳性，另两份不确定。

用另一套引物对HGV阳性样品继续确证。用作诊断扩增的这套引物(GV57-4512MF，SEQ ID NO：121和GV57-4657MR，SEQID NO：122)是从一个HGV保守区中选择出的，该保守区存在于假定的NS5编码区内。对5种HGV分离物都扩增出约2.2kb的片段。用于扩增反应的引物是470EXT4-2189R(SEQ ID NO：119)和470EXT4-29F(SEQ ID NO：120)。对扩增的DNA片段进行测序和序列对比。通过对比找到了高度保守区，同时，也设计出了在5个序列的共有变异区可掺入混合碱基合成的最适引物序列。得到的NS5引物如下：GV57-4512MF，SEQ ID NO：121和GV57-4657MR，SEQ ID NO：122。这些引物可用于从试验样品中扩增出165bp的诊断片段。

从另一个高度保守区中又衍生出一个内部探针序列：GV22dc-89MF(SEQ ID NO：123)，此探针可用来探测特异性的扩增的产物。要在不严格的条件下探测最小的HGV变异序列，则要求探针必须足够长。

象在应用470-20-1引物(实施例4C)时一样，对样品进行诊断性的NS5序列分析，也要在相同的条件下进行样品的制备、扩增和溶液杂交。对血清样品应用470-20-1引物对和NS5引物对进行PCR分析所得结果的一致性见表3。

表3

NS5区引物对(GV57)	470-20-1引物对
	470-20-1引物对					+	-	不确定
	+	71	0	1		+	-	不确定
	+	71	0	1	-	6	13	2
	不确定	2	1	0	-	6	13	2

从上面所述的8个HGV阳性血清中再取额外等份用470-20-1引物系列(SEQ ID NO：9和SEQ ID NO：10)和NS5引物系列作进一步的PCR分析。在这些分析中，8个血清样中有5个呈现一致性的HGV阳性。结果见表4。

相对地，两个随机献血者或9个经高度筛选的“极正常”血清在每一种PCR分析中都呈HGV阴性。

这些结果进一步说明了肝病产生和HGV病毒间存在着联系。

表4

样品组	测定数目	阳性数
样品组	测定数目	阳性数	高ALT献血者	104	1
N-ABCDE，其它	48	4	高ALT献血者	104	1
N-ABCDE，其它	48	4	正常献血者	2	0
“极正常”	9	0	正常献血者	2	0
“极正常”	9	0	总计	163	5

对高丙氨酸转氨酶献血者的血清作进一步测定。除了上述最初的血清系列中所包括的104种血清之外，总共又测定了495个血清样品，其结果如下：在这495个样品中，利用470-20-1-77F(SEQ IDNO：9)和470-20-1-211R(SEQ ID NO：10)引物对进行测定发现其中6个呈HGV阳性。这6种血清有如下的HCV分布：R25342，HCV阴性；R17749，HCV阳性；J53171，HCV阳性，HBV阳性；J54406，HCV阴性；R08074，HCV阴性；和X31049，HCV阴性。阳性结论都是在至少两个独立反应中都出现阳性重复的基础上作出的。应用NS5引物对通过PCR确证R25342呈阳性。因此，检出率约为1.2％(599个测定样品中有7个阳性)。

从高丙氨酸转氨酶献血者身上获得的新血浆样品也来自SUBB，Peninsula血库(Burlingame，CA)和纽约血液中心(New York，NY)，对这些样品也将通过PCR(470-20-1引物对)检测HGV RNA。总共测定了214个样品，有5个(约2.3％)呈HGV RNA阳性。这5种血清的HCV分布如下：T55806，HCV阳性；T55875，HCV阴性；T56633，HCV阴性；R38730，HCV阴性；3831781，HCV阴性。随后又从这些献血者中的两个人身上采得的样品T55806和T55875也呈HGV阳性。利用NS5引物对通过PCR确认T55806、T55875和T56633呈阳性。

2.对所接受的捐献血样进行筛选

为了评估HGV在正常献血人群中的流行情况，在SUBB从筛选出的为输血献血的人中收集血清。总共有968个样品，代表769个独立的献血者，用于HGV RNA检测。应用470-20-1引物对通过PCR对所获样品进行筛选。

总共有16个血清样被鉴定为具有可检测的HGV RNA。其中，有6个是来自3个献血者的含重复样品，这样通过RNA PCR在769个献血者中检测出13个呈HGV阳性。对所有的阳性样品再利用NS5引物对进行PCR检测确认也呈阳性。这些献血者血液中ALT水平正常，其它的血清学指标也正常。因此，在正常的献血人群中，被测血清的阳性检出率为1.7％。所以，在接纳的和被排除的献血者中都探测到了HGV的存在。

3.从在不同地域居住的人群中采样

通过PCR评估HGV在地区来源广泛的肝炎患者中的感染情况。本质上如实施例4C中所描述，应用470-20-1PCR引物进行PCR反应。对来自埃及、希腊、澳大利亚(见实施例4F-4)、秘鲁、英格兰、意大利、德国、南韩、美国和日本的血清样品进行测定，在所有的被测群中都探测到有HGV RNA的存在。

4.输血后HGV感染和非肠道性传播

在几个输血后的肝炎病例(来自日本和欧洲的病人包括在实施例4F-3)中都检测出HGV RNA。在总共4个病例中，一个来自日本，两个来自美国，另一个来自澳大利亚。对他们进行多个时间点的HGVRNA存在性分析，其中3例(i)可获得病人输血前血样以确定病人以前的HGV状况。(ii)可获得为三位病人献血的人的血样，用于确定供血者的HGV状况。

第一例是一个日本病人，在1980年12月2日输血。输血后患了非乙、非丙型肝炎。从此病人身上采5份血清样，应用470-20-1引物对通过PCR检测HGV RNA。在其输血后两周到8个月期间都能在其血清中探测到HGV RNA存在。一个在输血超过一年后采的样品检测结果是不确定的(即只在一个重复反应中呈现阳性)。由于没有获得该病人输血前的血样，故未能进行输血前的HGV RNA检测。

BIZ和STO病例(分别见表5、表6)来自一个在NIH进行的预料中的心脏外科研究(Alter等，1989)。对于每一个病人，可得到输血前的血清，并被运用470-20-1引物对通过PCR确定为HGV RNA阴性。从输血后第一天至输血后第198周，BIZ被测试为HGV RNA阳性，在总共9个BIZ的血液捐献者中，8个中的2个受试者被发现为HGV阳性。从输血后第5周至输血后第92周，STO被测试为HGV RNA阳性。

表5

与输血相关的HGV传染：病例BIZ

抽取时间	时间	IU/L中的ALT	470PCR结果
抽取时间	时间	IU/L中的ALT	470PCR结果	10/30/78	-4天	23	-
11/01/78	-1天	31	-	10/30/78	-4天	23	-
11/01/78	-1天	31	-	11/03/78	+1天	29	+
11/17/78	+2天	51	+	11/03/78	+1天	29	+
11/17/78	+2天	51	+	03/22/79	+20周	135	+
06/28/79	+34周	133	+	03/22/79	+20周	135	+
06/28/79	+34周	133	+	04/06/81	+127周	141	+
08/20/82	+198周	39	+	04/06/81	+127周	141	+

表6

与输血相关的HGV结果：病例STO

抽取时间	时间	IU/L中的ALT	470PCR结果
抽取时间	时间	IU/L中的ALT	470PCR结果	06/15/83	-1天	23	-
07/18/83	-5周	80	+	06/15/83	-1天	23	-
07/18/83	-5周	80	+	10/31/83	+20周	75	+
12/31/83	+28周	30	+	10/31/83	+20周	75	+
12/31/83	+28周	30	+	01/02/85	+81周	90	-
03/20/85	+92周	23	+	01/02/85	+81周	90	-

第四种情况也被预期地限定，是一个参加在澳大利亚悉尼进行的输血后肝炎研究的心脏外科手术的病人，该病人(PA-124)没有其它可识别的危险因素，在外科手术期间接受了14个单位的血液(4个单位浓集(packed)的红细胞，10个单位的血小板)。在这14个单位中，一个为HGV阳性；其它13个为HGV阴性。除开活性的HCV EIA(第一个产生试验)，14个血液捐献者的HBV和HCV血清学为阴性。没有其它的HCV试验证实阳性结果。

在病人PA-124(表7)，首先用手术后两周得到的样品增加血清ALT，在14周期间，至少十次观察到为手术前的水平。对来自PA-124的输血前，4周和8周的血清进行的HCV的CPR结果均为阴性。使用470-20-1PCR引物试验该病人血清的HGV RNA。输血前的样品为HGV RNA阴性。阳性的结果被证实在输血后，与ALT增加同时以及接着发生。在输血后一年检测出了HGV RNA的存在。这些数据支持了HGV可以经胃肠外传染的结论。

表7

与输血相关的HGV传染病例PA-124

手术后的周数	IU/L中的ALT	470 PCR结果
手术后的周数	IU/L中的ALT	470 PCR结果	输血前	7	-
2	74	+	输血前	7	-
2	74	+	4	86	+
8	135	+	4	86	+
8	135	+	12	179	+
14	78	+	12	179	+
14	78	+	18	9	+
24	6	+	18	9	+
24	6	+	36	11	+
52	11	+	36	11	+
52	11	+	64	23	-
84	10	-	64	23	-

除开预先限定的输血后传染的情况外，HGV感染的另外的情形被鉴定在限于多次输血和静脉内药物使用(IVDU)的危险人群。(表8)。

表8

被编码的血清的HGV RT-PCR检测：

选择的肝炎和胃肠外危险组

组	检测数目	阳性数目
组	检测数目	阳性数目	自身免疫肝炎	10	0
原发性胆肝硬变	20	0	自身免疫肝炎	10	0
原发性胆肝硬变	20	0	被怀疑为急性非A-E型肝炎	24	2
慢性肝炎(非A-C)(由肝活检证实)	34	3	被怀疑为急性非A-E型肝炎	24	2
慢性肝炎(非A-C)(由肝活检证实)	34	3	肝细胞癌	20	2
慢性HBV	20	2	肝细胞癌	20	2
慢性HBV	20	2	慢性HCV	50	6
血友病	49	9	慢性HCV	50	6
血友病	49	9	IVDU	54	15
多发性输血的贫血症	100	19	IVDU	54	15

在100个多发性输血的镰状细胞性贫血和地中海贫血的病人中，19个(19％)被发现具有可测的血清HGV RNA。同样，49个中的9个血友病病人(18％)为470-20-1和NR5引物HGV阳性。值得注意地，54个中的15个(28％)IVDU被发现为对HGV RNA呈PCR阳性。这些胃肠外危险人群的感染比率(18-28％)看来比带有增加的ALT的血液捐献者的比率(1-2％)要高。这些结果增强了HGV传染的胃肠外途径的显著性。

5.被选择的肝炎病人群的PCR筛选

用聚合酶链反应测试来自急性和慢性肝炎、肝细胞性癌、HBV感染或HCV感染的病人的血清中的HGV的存在(数据示于表8中)。在每一组来自患肝病的病人的样品中，证实了HGV阳性样品(除开来自具有自身免疫性肝炎和初级胆汁肝硬变病人的样品，这两种情况不被认为仅仅与感染原有关)。

如来自输血后肝炎病人的血清收集品所示(实施例4F-4)，HGV感染建立于急性肝炎期间，但循环病毒RNA在慢性感染估计为数月至数年的期间中仍旧被检测到。

在带有HBV和HCV感染的病人中观察到约10-20％的共感染比例。因此HGV感染被表明与被或不被其它肝炎病毒共感染的肝炎有关。共感染可能反映了这些肝炎病毒的类似危险因素和传染途径。如上面所提到的，在胃肠外危险人群中，具有较高的HGV流行，例如血友病，IVDU和多发性输血的贫血病人(与其它肝炎危险人群相比)。

6.人的持久性HGV感染

输血后肝炎病例BIZ、STO和PA-124被表明在输血和急性感染后的分别长达3.8，1.8和1.0年的时间仍具有PCR可检测的病毒RNA。在原始阳性样品(实施例4F-1)之后1年和1.5年，从献血者JC得到另外的血清样品。这些跟踪血清样品也为HGV阳性。来自其它高ALT献血者(T55806，T55875，R25342)，在最初检测到HGV感染的血清样品之后几个月所获得的其它血清也为阳性。类似地，当HGV感染建立在实验灵长类动物(CH1356，实施例4H)时，在接种后长于1.5年时，检测到HGV RNA。这些数据证实了人和实验灵长类动物中的持久的HGV病毒血症(viremia)。

G.用于序列测定的来自病人RNA的长片断的扩增

为了获得不同的HGV分离株的序列信息，用PCR引物来扩增HGV基因组的一些信息区域。引物470EXT4-2189R(SEQ ID NO：119)和470EXT4-29F(SEQ ID NO：120)用来扩增含有原始470-20-1序列的2.2kb片断。使用“SUPERSCRIPT II”逆转录酶(Gibco/BRL，Gaithersburg，MD)逆转录来自于样品的RNA。使用有效大范围PCR试剂(“XL PCR BUFFERS”和“rTth-XL”，PerkinElmer/Applied Biosystem Din.，Foster City，CA)扩增产生的cDNA。

如果在琼脂糖凝胶电泳中检测到正确大小的带，扩增反应被认为阳性。通过扩增产物的初步DNA序列测定，样品被证实为阳性。通过这个扩增方法，下面血清样品被检测为HGV RNA阳性：PNF2161；R10291(JC)；和每一个来自北美，埃及，和日本人群的样品。然而没有阳性样品从来自秘鲁人血清的样品中检测出来。

多种HGV阳性样品的成功扩增证实了通过使用上面讨论470-20-1引物对的PCR扩增所得到的结果。然而未能获得扩增可能反映出不良的RNA性质或低的拷贝数或分离株之间的局部序列差异，致使选择的引物组不能普遍地发挥作用。

为了获得HGV基因组的推断的5’-非翻译区的序列信息，用引物扩增来自5’-非翻译区(基于HGV PNF2161-变异体)的片段。两片段通过下面引物组确定：FV94-22F(SEQ ID NO：124)和FV94-724R(SEQ ID NO：125)，提供728个碱基对片段，以及FV94-94F(SEQ ID NO：126)和FV94-912R(SEQ ID NO：127)，提供847个碱基对片段。

使用刚才描述的启动有效的大范围PCR的条件。只要另外证实样品中HGV RNA的存在，可从大多数测试样品中获得产物。

H.HGV对灵长类动物的感染性

用PNF1261接种两个黑猩猩(称为CH1323和CH1356)，六个恒河猴(cynomolgus)(CY143， CY8904，CY8908，CY8912，CY8917和CH8918)和六个口鬃(Mystax)(MY29，MY131，MY98，MY187，MY229，MY254)。用接种前和接种后的血清监测ALT和HGV RNA序列的存在(通过PCR筛选确定，如上所述)

1个恒河猴(cynomologous)(CY8904)显示出阳性RNA PCR结果(接种后39天)和总共17个分离血液提取物显示不确定结果。在1个称为CH1356的黑猩猩中，通过RT-PCR观察到持久性的病毒血症。如表9所示，没有观察到明显的ALT增加，循环病毒仅在接种后的很长时间才被检测出。在接种118天以及之后，观察到病毒血症。在第一次接种后的时间点(8天)还可观察到可作参考的反应性。

表9

来自用PNF2161接种的CH1356的ALT和PCR结果

接种后的天数	ALT^*	HGV PCR
接种后的天数	ALT^*	HGV PCR	0	59	-
8	65	±	0	59	-
8	65	±	15	85	-
22	89	-	15	85	-
22	89	-	29	89	-
36	86	-	29	89	-
36	86	-	39	31	-
47	74	-	39	31	-
47	74	-	54	40	-
61	57	-	54	40	-
61	57	-	84	65	±
89	63	+	84	65	±
89	63	+	98	64
118	84	+	98	64
118	84	+	125	73	+
134	74	+	125	73	+
134	74	+	159	80	+
610	(未能获得ALT)	+	159	80	+

^*接种前的平均ALT基线为50。

上面显示的数据表明在实验灵长类动物中，HGV感染一直持续到1.7年。

I.病毒基因组的鉴定

从cDNA文库分离的470-20-1(实施例1)意味着在PNF2161检测到的病毒基因组为RNA。证明HGV病毒基因组为RNA的其它实验包括下面这些。

原始克隆来源中的RNA或DNA的选择性降解(如通过无脱氧核糖核酸酶的核糖核酸酶或无核糖核酸酶的脱氧核糖核酸酶)，接着用HGV特定形引物扩增，检测扩增产物用来从DNA模板中识别RNA。

另一方法是利用扩增反应(来自作为模板的原始克隆来源的核酸和HGV特异性引物)，在反应中(i)在不存在任何依赖于RNA的DNA聚合酶(即逆转录酶)的情况下，采用依赖于DNA的RNA聚合酶，和(ii)依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。在该方法，如果HGV基因组为DNA或具有DNA中间产物，那么扩增产物用两种类型的扩增反应检测。如果HGV基因组仅为RNA，扩增产物仅用含有逆转录酶的反应。

如实施例4C中所描述，使用蛋白酶K和SDS，接着用酚提取将全部核酸(即DNA或RNA)从PNF2161中提取出来。接着用聚合酶链反应(PCR)扩增纯化的核酸，其中(i)在PCR之前进行逆转录步骤，或(iii)省略逆转录步骤。仅当在PCR反应之前进行逆转录时可重复地获得扩增。作为对照，在单独反应中，DNA模板被成功地扩增，这些结果证实HGV病毒基因组的性质为RNA。

最初出现在PNF2161中的克隆双链DNA序列的链可通过包括下面的各种方式推出。可对来自感染原血清的未扩增基因RNA进行RNA印迹法或斑点印迹法，接着通过将重复印迹杂交至对应于克隆序列的每条链的探针上。另一方面，从M13载体(Messing)分离的单链cDNA探针或多链特异性的寡核苷酸探针被用于增加的敏感性。如果源血清含有单链RNA，那么在杂交严谨的适宜条件下仅用一个探针(即来自470-20-1克隆的一条链的序列)产生信号。如果源血清含有双链DNA，那么两条链探针都将产生信号。

由使用一个或另一个特异性引物的逆转录开始的聚合酶链反应是RNA印迹法的一个更高敏感的替代方法。从存在于PNF2161血清中的纯化病毒体提取的基因组RNA被用作每一个RT/PCR的输入模板。不是用任意的六聚体进行cDNA合成，而是用HGV序列特定性的引物。一种cDNA合成反应是用互补于克隆序列的一条链的引物(例如470-20-1-77F)来进行的，第二种cDNA合成反应也是运用从反义链(例如470-20-1-211R)衍生的引物来进行。

使用两个HGV特异性引物扩增得到的首链cDNA，为了PCR的成功扩增，对照(例如DNA对照)被包括在内。还为了控制当使用描述的特异性引物时获得的逆转录效率，也使用来自克隆序列每条链的RNA转录物。

通过琼脂糖凝胶电泳，用溴化乙锭染色检测特异性产物。与用于逆转染的引物无关，DNA对照(即PCR扩增的双链DNA对照)被成功地扩增。仅在反义链引物被用于cDNA合成时，单链RNA转录物(即逆转录效率和链特异性的对照)被扩增。

仅在引物470-20-1-211R被用于逆转录时，PNF衍生的HGV多核苷酸产生特异性的扩增产物，这表明存在于血清中的原始HGV多核苷酸序列与470-20-1-211R互补，可能为单链RNA。

实施例5

PNF2161的蔗糖密度梯度分离

A.PNF-2161致病原(agent)的分带

使用来自Hoefer Scientific(San Francisco，CA)的梯度制备仪(maker)制备10-60％蔗糖(“ULTRAPURE”，Gibco/BRL)在TNF(50mM Tris-HCl，pH7.5，100mM CaCl₂，1mM EDTA)中的连续梯度。将约12.5ml的梯度在-70℃保存，在37℃迅速融化，接着以TNE稀释的0.4ml PNF血清覆盖。

在4℃，用SW40转子(Beckman Instruments)以40,000rpm(r_av约200,000×g)的转速梯度离心约18小时。从管的底部收集体积约为0.6ml的级分，将0.5ml直接称重至超速离心管中用于密度的计算。

表10

PNF级分测定的密度和470-20-1的出现

级分	密度	检测的470-20-1^*
级分	密度	检测的470-20-1^*	1	1.274	-
2	1.274	-	1	1.274	-
2	1.274	-	3	1.266	-
4	1.266	-	3	1.266	-
4	1.266	-	5	1.260	-
6	1.254	-	5	1.260	-
6	1.254	-	7	1.248	+
8	1.206	+	7	1.248	+
8	1.206	+	9	1.146	+
10	1.126	+++	9	1.146	+
10	1.126	+++	11	1.098	++++
12	1.068	+++	11	1.098	++++
12	1.068	+++	13	1.050	+
14	1.034	+	13	1.050	+
14	1.034	+	15	1.036	+
16	1.018	-	15	1.036	+
16	1.018	-	17	1.008	+
18	1.020	+	17	1.008	+

^*“+”和“-”记分最初以40次PCR为基础。为了

区别“+”，“++”，“+++”和“++++”，将产生最

初正记分(7-18)的级分用30次PCR进行扩增。

通过在4℃，用Ti70.1转子(约110,000×g)以40,000rpm转速离心2小时使推断的病毒颗粒成为片状沉淀物，使用酸性苯酚胍方法(“TRI REAGENT”，Molecular Research Center，Cincinnati，OH)和使用糖原作为载体以提高回收的乙醇沉淀提取RNA。将纯化的核酸溶解于含有2mM DTT和1U/μl重组RNA酶抑制剂的无RNA酶的缓冲液中。

梯度级分的RNA PCR分析(实施例4C)显示在密度范围为1.126-1.068g/ml(表10)的级分，在470-20-1特异性信号中有一个明显的峰。在这种情况下，470-20-1信号被显示出形成了分离的带，与病毒颗粒在蔗糖梯度中的预期行为一致。

B.病毒颗粒相对密度

PNF2161已被证实被HCV共感染(见上面)。为了将470-20-1病毒颗粒的性质与其它已知肝炎病毒颗粒相比较，将血清PNE2161和纯化的肝炎A病毒的样品铺在蔗糖梯度上(如上所述)。收集0.6ml的级分，使之沉淀，提取RNA。使用HAVC(SEQ ID NO：5；SEQID NO：6)；HCV(SEQ ID NO：7，SEQ ID NO：8)和470-20-1(SEQ ID NO：9，SEQ ID NO：10)特异性引物将从各级分分离的RNA进行扩增反应(PCR)。

通过在琼脂糖凝胶上将扩增反应进行电泳分离，然后溴化乙锭染色来识别产物的带。分析的结果列于表11中。

表11

平均密度	HAV	HCA	470-20-1
平均密度	HAV	HCA	470-20-1	1.269	-	-	-
1.263	+	-	-	1.269	-	-	-
1.263	+	-	-	1.260	+	-	-
1.246	++	-	-	1.260	+	-	-
1.246	++	-	-	1.238	++	-	-
1.240	+	-	-	1.238	++	-	-
1.240	+	-	-	1.270	+	-	-
1.193	+	-	-	1.270	+	-	-
1.193	+	-	-	1.172	+	±	-
1.150	+	±	±	1.172	+	±	-
1.150	+	±	±	1.134	+	+	±
1.118	+	+	+	1.134	+	+	±
1.118	+	+	+	1.103	+	+	+
1.118	+	+	+	1.103	+	+	+
1.118	+	+	+	1.103	+	+	+
1.088	±	+	+	1.103	+	+	+
1.088	±	+	+	1.084	-	+	+
1.080	-	+	+	1.084	-	+	+
1.080	-	+	+	1.070	-	+	+
1.057	-	+	±	1.070	-	+	+
1.057	-	+	±	1.035	-	±	-
1.017	-	-	-	1.035	-	±	-
1.017	-	-	-	1.009	-	-	-

这些结果表明470-20-1颗粒与类似于HAV相比，更类似于HCV颗粒。

另外，在蔗糖梯度离心之前，用氯仿处理血清PNF2161和HAV颗粒。实验结果表明470-20-1病原体可能为一被膜病毒，因为它比无被膜病毒(HAV)具有更类似于被膜黄热病毒科(Flaviviridae)成员的性质。

实施例6

470-20-1延伸克隆的产生

A.锚式PCR

如实施例1所描述，直接从PNF2161提取RNA。将RNA通过“CHROMA SPIN”100凝胶过滤柱(Clontech)以除去小分子量杂质。用BMB cDNA合成试剂盒合成cDNA。cDNA合成后，将PNF cDNA连接到超过KL-1/KL-2SISPA或JML-A/JML-B50100倍的接头上(分别为SEQ ID NO：11/SEQ ID NO：12，和SEQ IDNO：17/SEQ ID NO：18)，使用引物KL-1或引物JML-A将其扩增35次。

通过来自10μl含有EcoRI酶解(脱磷酸化)的λgt11臂(1μg)和EcoRI酶解的PNF cDNA(0.2μg)珠连接反应物的1μl等分试样的锚式PCR，产生470个延伸克隆。使用λgt11反向引物(SEQ ID NO：13)结合470-20-77F(SEQ ID NO：9)或470-20-1-211R(SEQ ID NO：10)进行连接反应物的PCR扩增(40次)。PCR的所有引物浓度为0.2μM。

将扩增产物(9μl/100μl)在1.5％琼脂糖上进行分离，印迹至“NYTRAN”(Schleicher and Schuell，Keene，NH)，从470-20-1特异性的用地高辛标记的寡核苷酸探针检测。按照制造商的推荐使用末端转移酶(BMB)进行地高辛标记。杂交的带用凝胶纯化，克隆至“TA克隆载体pCR II”(Invitrogen)，并测序。

鉴定了许多5’和3’延伸至470-20-1的克隆。所有序列以来自自至少两个独立分离群的序列测定的共有序列为基础。以类似方式重复该锚式PCR方法以获得另外的5’和3’延伸序列。使用λgt11反向引物(SEQ ID NO：13)结合前面伸展克隆获得的序列衍生而来的HGV特异性引物进行PCR扩增反应。这些反应的底物是未包被的PNF21612-cDNA来源的DNA。

按照制造商的建议(Applied Biosystems，Foster City，CA)使用Applied Biosystems model373A DNA序列测定系统中的“DYEDEOXY TERMINATOR CYCLE SEQUENCING”(Sanger等方法的改进)进行序列测定。序列数据示于序列表中。在核酸和氨基酸水平将序列与“GENBANK”，EMBL数据库和dbSET(全国医学文库)序列进行比较。检索程序FASTA，BLASTP，BLASTN和BLASTX表明这些序列的核酸和氨基酸序列都是新的。

校准使用选择性引物对获得的各个克隆以产生共有序列。一系列用于构建HGV-PNF2161变异体序列的共有序列如下：4E3，SEQ IDNO：26；3E3，SEQ ID NO：27；2E5，SEQ ID NO：28；1E5，SEQ ID NO：29；4E5，SEQ ID NO：30；3E5，SEQID NO：31；2E3，SEQ ID NO：32；1E3，SEQ ID NO：33；4E5-20，SEQ ID NO：34；5E3，SEQ ID NO：39；6E3，SEQ ID NO：40；7E3，SEQ ID NO：42；5E5，SEQID NO：43；6E5(44F)，SEQ ID NO：44；8E3，SEQ IDNO：98；9E3，SEQ ID NO：109；10E3，SEQ ID NO：110；11E3，SEQ ID NO：116；12E3，SEQ ID NO：118；5’-末端，SEQ ID NO：175和3’-末端，SEQ ID NO：167。

排序各个共有序列，鉴定重叠序列，确定HGV-PNF2161变异体的共有序列。将这个共有序列从其它四个HGV变异体中获得的序列进行比较：JC(SEQ ID NO：182)，BG34(SEQ ID NO：176)，T55806(SEQ ID NO：178)和EB20-2(SEQ ID NO：180)。

HGV-PNF2161变异体的共有序列由表示为SEQ ID NO：14的9391个碱基对组成。此序列代表一连续可读框(SEQ ID NO：15)。多蛋白质的Kyet-Doolittle疏水性方图如图11所示。

原始470-20-1克隆与延伸获得的序列的关系被图解示于图1中。从图中可以看出，具有与470-20-1蛋白质编码序列相反极性的DNA链包括一长的连续的可读框。

将HGV的氨基酸序列与蛋白质序列的PIR数据库(IntelliGenetics，Inc.，Mountain View，CA)中的所有病毒序列进行比较。运用“FASTA”程序的1.7版本程序的“SSEARCH”程序(Pearson，等)进行比较。在HGV序列和黄热病毒科的两种病毒之间找到了局部序列相似的区。相似的序列在图5A和5B中。

存在于这些顺序中的是这些病毒的依赖于RNA的RNA聚合酶(RDRP)的结构域单元。保守的RDRP氨基酸结构域单元在图5A和5B中用冒号和大写字母，黑体字(Koonin and Dolja)表示。这些顺序证明HGV编码序列的这一部分相当于RDRP。这个顺序的数据与关于HGV的RNA基因组的数据结合起来支持了HGV是黄热病毒科中的一员的位置。

HGV多蛋白质(SEQ ID NO：15)与HoCV(猪霍乱病毒)和HCV的全部氨基酸序列的一致性分别为17.1％和25.5％。如此水平的全部氨基酸序列一致性证明HGV是从HoCV和HCV分离的分离的病毒体。为了证实它，在病毒BVDV(牛病毒性腹泻病毒)的黄热病毒科的两个成员和HCV中，16.2％的氨基酸可全部与HGV对准。

一个属的成员在全部校准时，通常显示出高的同源性，例如，BVDV与HoCV比较显示出71.2％的同一性。当被全部排序时，HCV为其中一员的未命名属的各个成员(变异体)的一致性为65％至100％。

B.cDNA末端快速扩增(RACE)PCR：5’末端克隆

通过用RACE(cDNA末端快速扩增)技术改进的锚式PCR方法获得相当于HGV基因组的5’-末端的克隆。该RACE方法最早由Frohman等(1988)和Belyausky等(1989)描述。简单地说，按如下方法获得HGV的5’-末端克隆。

使用任意六聚体引发首链cDNA合成，用“SUPERSCRIPT II”或“rTth”逆转录酶(GIBCO/BRL)进行合成。首链合成后，通过碱水解(NaOH)将RNA模板降解。通过加入乙酸中和cDNA样品，并通过吸收至玻璃基质载体(“GENOBIND”，Clontech，Palo Alto，CA)而被纯化。纯化后，通过乙醇沉淀浓缩cDNA，用80％乙醇洗涤两次。

起初描述的RACE方法改进如下。在氯化钴存在下，使用T4 RNA连接酶将单链寡核苷酸锚(SEQ ID NO：174)(Clontech)连接到首链cDNA的3’末端。从制造商获得带有两处修饰的寡核苷酸锚：(i)将锚的3’-末端用一个防止多连体形成的氨基酸修饰，(ii)5’-末端含有一个允许连接到首链cDNA上的磷酸基团。

连接了锚后，cDNA被用作模板，用于使用一些特异性引物结合与锚序列互补的引物(AP引物，SEQ ID NO：134)进行的CPR扩增。将得到的扩增产物通过琼脂糖凝胶电泳进行分离，转移至滤膜上，与巢居的HGV特异性寡核苷酸探针杂交。分离与HGV杂交探针的带，将其克隆至“pCR-II”(Invitrogen，San Diego，CA)并测序。

C.HGV3’末端克隆

通过改进的锚式RT-PCR方法，获得相当于HGV基因组3’-末端的克隆，简单地说，在cDNA合成之前，多聚腺苷酸聚合酶(GIBCO/BRL，Gaithersburg，MD)被用于催化将聚腺苷酸尾部加成到PNF2161RNA上。按照制造商的推荐完成聚腺苷酸的加成。在纯化聚腺苷酸修饰的RNA后，使用引物GV-5446IRT(SEQ ID NO：184)进行利用“ SUPERSCRIPT II”(GIBCO/BRL)完成的逆转录。通过使用下面引物系列的PCR扩增得到的cDNA：GV59-5446F(SEQ IDNO：171)和GV-5446IR(SEQ ID NO：172)。

扩增后，将产物通过琼脂糖凝胶电泳进行分离，转移至滤膜中，并与地高辛标记的寡核苷酸探针杂交(E5-7-PRB，SEQ ID NO：173)。分离和纯化与寡核苷酸杂交的产物，将共克隆至“pCR-II”并测序。通过这种方法分离的两个克隆为MP3-3(SEQ ID NO：168)和MP3-7(SEQ ID NO：169)。

实施例7

分离470-20-1融合蛋白质

A.表达和纯化470-20-1/谷胱甘肽-S-转移酶融合蛋白质

如下完成含有470-20-1肽的谷胱甘肽-S-转移酶(Sj26)融合蛋白质的表达。通过使用引物gt11F(SEQ ID NO：25)和gt11R(SEQ ID NO：13)的聚合酶链反应，接着通过EcoRI酶解，从λgt11470-20-1克隆分离相当于原始λgt11470-20-1克隆的237个碱基对插入片段(在两侧都含有SISPA接的17个核苷酸)。

将插入片段克隆至修饰的pGEX载体pGEX MOV中。pGEXMOV编码在羧基末端融合了六个组氨酸的sj26蛋白质(sj26his)。将470-20-1多肽编码序列在位于载体sj26his编码序列下游的克隆位点引入载体。因此，470-20-1多肽被表达为sj26his/470-20-1融合蛋白质。融合蛋白质中sj26蛋白质和6个组氨酸区使得融合蛋白质可以通过采用谷胱甘肽偶联的珠(Smith，D.B.，等)和固定的金属离子珠(Hochula；Porath)的双重色谱方法而进行亲和纯化。

将大肠杆菌菌株W3110(ATCC目录号为27352)用pGEX MOV和含有470-20-1插入片段的pGEX MOV转化。通过加入2mM异丙基-β-硫代半乳糖苷(IPTG)诱导sj26his和470-20-1融合蛋白质。通过谷胱甘肽亲和层析或通过根据公开的方法(Smith，D.B.，等，Porath)结合常规的离子交换层析的固定金属离子层析(IMAC)纯化融合蛋白质。

纯化的470-20-1融合蛋白质与PNF2161发生免疫反应。然而，纯化的sj26his蛋白质不与PNF2161发生免疫反就，这表明470-20-1肽和PNF2161之间存在特异性的免疫反应。

B.分离470-20-1/β-半乳糖苷酶融合蛋白质

在32℃，将用λ噬菌体gy11或gt/470-20-1侵染的KM392溶原菌保温直至培养物达到O.D.为0.4。接着在43℃，在水浴中将培养物保温15分钟以诱导gt11肽的合成，在37℃，再保温1小时。将细菌细胞沉淀，并溶于溶菌缓冲液中(10mM Tris，pH7.4，2％“TRITON X-100”和1％抑蛋白酶肽)。通过离心(10K，10分钟，Sorvall JA20转子)澄清细菌溶菌产物，将澄清的溶菌产物与偶联了抗-β-半乳糖苷酶(Promega)的琼脂糖4B珠一起保温。

按照制造商的说明进行β-半乳糖苷酶融合蛋白质的结合和洗脱，用溶菌缓冲液进行一般的蛋白质的结合和柱的洗涤。将结合蛋白质用0.1M碳酸盐/碳酸氢盐缓冲液(pH10)洗脱。纯化的470-20-1/b-半乳糖苷酶蛋白质与PNF2161和抗-b-半乳糖苷酶抗体均发生免疫反应。然而，通过gt11溶原菌表达的纯化的β-半乳糖苷酶不与PNF2161发生免疫反应，但与抗-β-半乳糖苷酶抗体发生免疫反应。

实施例8

纯化470-20-1融合蛋白质以及制备抗-470-20-1抗体

A.谷胱甘肽亲和纯化

材料包括50ml还原形式谷胱甘肽亲和基质(Sigma)，XK26/30Pharmacia柱，2.5×10cm Bio-Rad“ECONO-COLUMN”(Richmond，CA)，Gilson(Middleton，WI)HPLC，DTT(Sigma)，还原形式的谷胱甘肽(Sigma)，尿素和磷酸氢二钠。

下面溶液用于融合蛋白质的纯化。

缓冲液A：磷酸缓冲盐溶液，pH7.4

缓冲液B：50mM Tris pH8.5，8mM谷胱甘肽(还原形式的谷胱甘肽)

洗涤缓冲液：8M尿素，100mM Tris pH8.8，10mM谷胱甘肽，1.5M NaCl。

让带有含470-20-1插入片段的质粒的大肠杆菌生长于发酵罐中(20升)。收集细菌，使用微流动仪(micro-fludizer)将其溶菌于含有2mM苯甲基磺酰氟(PMSF)的磷酸缓冲盐溶液(PBS)中。除非另有说明，下面所有过程均在4℃进行。

通过将溶菌的细菌放入“OAKRIDGE”管中，并用Beckman型号JA-20转子，以20K rpms(40K×g)的转速旋转制备用于装填的粗溶菌产物。将上清液通过0.4μm滤器以及接着通过0.2μm滤器过滤。

将2.5×10cm“ECONO-柱”用在室温下在PBS中膨胀2小时的谷胱甘肽亲和基质填充。通过用4床体积的PBS洗涤平衡该柱。

在8ml/分钟的流速将柱用粗溶菌产物装填。随后以同样流速将该柱以5倍体积的PBS洗涤。

通过将流速调至0.75-1ml/分钟并加入缓冲液B洗脱该柱。将5倍柱体积的缓冲液B泵入通过该柱，收集2分钟的级分。典型的洗脱分布图被示于图2中。存在于这级分的蛋白质的含量和纯度通过标准的SDSPAGE评价(图3)。基于其预测分子量和它与PNF 2161血清的免疫反应性，识别470-20-1/sj26his融合蛋白质。为了下一步操作，可从含有融合蛋白质的级分或通过分离含有融合蛋白质的凝胶部分从凝胶中分离该蛋白质。

B.通过阴离子交换纯化克隆470-20-1融合蛋白质

溶液包括下列：

缓冲液A(10mM磷酸钠，pH8.0，4M尿素，10mM DTT)，

缓冲液B(10mM磷酸钠，pH8.0，4M尿素，10mM DTT，2.0MNaCl)；和

洗涤溶液(8M尿素，100mM Tris pH8.8，10mM谷胱甘肽，1.5NaCl)。

以4.0ml/分钟的流速将粗溶菌产物(或其它蛋白质源，如来自上面的被收集级分)装填至“HIGH-Q-50”(Biorad，Richmond，CA)柱上。接着以4.0ml/分钟的流速用5柱体积的缓冲液A洗涤该柱。

洗涤后，开始产生梯度，并以15柱容积由缓冲A至缓冲液B过柱。接着梯度升级至100％缓冲液B，使用一柱体积。典型的梯度示于图4A中。每10分钟收集一级分。通过标准的SDS-PAGE(图4B和4C)评价470-20-1/sj26his融合蛋白质的纯度，并收集相关级分(大约级分34-37，图4C)。

C.制备抗-470-20-1抗体

将在佛氏佐剂中的纯化的470-20-1/sj26his融合蛋白质皮下注射至兔中。在第0天和第21天，注射约1mg的融合蛋白质。在6周和8周有代表性地收集兔血清。

用纯化的sj26his蛋白质类似地免疫第二只兔。

从表达470-20-1/sj26his融合蛋白质，sj26his蛋白质和β-半乳糖苷酶/470-20-1融合蛋白质的细菌中制备小溶菌产物。将溶菌产物在凝胶上分级分离。并转移至膜上。将来自两只兔子的血清进行各自Western印迹。

用470-20-1融合蛋白质免疫的动物血清与用pGEX MOV或含有470-20-1插入片段的pGEX MOV转化的IPTG诱导的大肠杆菌W3110的微量溶菌产物中的所有sj26his融合蛋白发生免疫反应，该血清还与来自470-20-1λgt11构建物的小溶菌产物中的融合蛋白质发生免疫反应。

第二只兔与微量溶菌产物中的sj26his和470-20-1/sj26his融合蛋白质都发生免疫反应。该血清没有被预计与来自470-20-1λgt11构建物的小溶菌产物中的470-20-1/β-半乳糖苷酶融合蛋白质发生免疫反应。没有血清被预期与β-半乳糖苷酶发生免疫反应。

将用融合蛋白质免疫的动物的血清中存在的抗-470-20-1抗体通过亲和层析纯化(使用470-20-1配体)。

另外，可将融合蛋白质酶解以提供没有sj-26蛋白质序列的470-20-1抗原。接着如上所述单独使用470-20-1抗原产生抗体。

实施例9

兔抗肽血清

将肽设计成包括整个HGV序列，尤其是包括非结构和结构基因中的每一个功能基团。肽是通过常规方法商业合成的。代表性的肽示于表12中。

表12

名称	肽的大小(aa)	相对于SEQ ID NO：的位点
名称	肽的大小(aa)	相对于SEQ ID NO：的位点	PEP1/NS2a	30	2674/2763
PEP2/E1	16	733/780	PEP1/NS2a	30	2674/2763
PEP2/E1	16	733/780	PEP3/E2	18	1219/1272
PEP4/NS2B	18	3061/3114	PEP3/E2	18	1219/1272
PEP4/NS2B	18	3061/3114	PEP5/NS3	21	3571/3633
PEP6/NS3^**	18	4909/4959	PEP5/NS3	21	3571/3633
PEP6/NS3^**	18	4909/4959	PEP7/NS4A	18	5272/5328
PEP8/NS4B	16	6097/6144	PEP7/NS4A	18	5272/5328
PEP8/NS4B	16	6097/6144	PEP9/NS5A	16	7033/7080
PEP10/NS5B	18	7783/7836	PEP9/NS5A	16	7033/7080

^**NS3肽在C末端具有外来的半胱氨酸，它在HGV-PNF2161变

异体多肽序列中不存在；实际序列为Q。

将肽偶联至KLH上。使用兔作为宿主在多个位点皮下注射偶联的肽，通过商业手段制备抗肽兔血清。将两周的免疫记录与隔周采血一起使用。

兔抗肽血清显示为肽特异性并具有高的效价。兔抗肽血清还可识别大肠杆菌和杆状病毒中表达的相应的重组蛋白质。抗体终点效价为1∶50,000-1∶625,000稀释度。兔抗肽7(NS4a)具有仅为1∶1,000的低的终点效价。相应地，抗在例如杆状病毒系统中表达的NS4a蛋白质的兔血清可能是更为有利的试剂。

兔抗肽血清可用于相应的在例如在杆状病毒和痘病毒中表达的HGV蛋白质的免疫沉淀。兔抗肽血清还可用作EIA中的俘获抗体来检测HGV抗原.兔抗肽血清还可进一步用于识别HGV蛋白质。

实施例10

血清学

A.一批血清的Western印迹法

470-20-1融合抗原(上面描述的)被用于筛选一批血清，这一批血清中的许多是从患有肝炎以及未感染的对照个体中来的人血清。

亲和纯化的470-20-1融合抗原(实施例8)被以2μg/cm上样至12％SDS-PAGE中。在200V下，将凝胶电泳2小时，将抗原从凝胶转移至硝酸纤维素滤膜上。

将该膜用含1％牛血清白蛋白，3％正常羊血清，0.25％明胶，100mM NaPO₄，100mM NaCl和1％脱脂干奶粉的溶液封闭2小时。将膜干燥，并切成1-2mm的条；每条均含有470-20-1融合抗原。将条一般性地用TBS(150mM NaCl；20mM Tris HCl，pH7.5)重新水合，在室温下将其在血清中(1∶100)中摇动保温过夜。

将条每次在TBS加上“TWEEN20”(0.05％)中洗涤，一共洗涤两次每次5分钟，接着在TBS中洗涤，一共洗涤两次每次5分钟。在室温下，再将条在二抗(Promega碱性磷酸酶结合的抗人IgG，1∶7500)中摇摆保温1小时。再将该条在TBS+“TWEEN20”中洗涤两次，每次5分钟，在TBS中洗涤两次，每次5分钟。

通过将条在含有BCIP(实施例2)和NBT(实施例2)的底物溶液的pH9.5缓冲液(100mM Tris，100mM NaCl，5mM MgCl₂)中保温检测结合抗体。让显色反应持续约15分钟，到时通过在蒸馏水中洗涤3次停止显色反应。

从下面组的个体中获得试验血清：(i)献血者，HBV Ab，表面Ag阴性，HCV，HIV，HTLV-1Abs阴性；(ii)HBV，血清来自被乙型肝炎病毒感染的人；(iii)HCV，血清来自被在第二代HCVELISA分析中有活性的丙型肝炎病毒感染的人；和(iv)HXV，个体血清学为HAV，HBV，HCV或HEV阴性。

筛选的结果示于表13中。

表13

470-20-1血清分段结果一览表

样品	被检测的人血清的数目^*	+	IND^*	-
样品	被检测的人血清的数目^*	+	IND^*	-	献血者	30	1(3.3％)	2(6.7％)	27(90.0％)
HBV	40	7(17.5％)	4(10.0％)	29(72.5％)	献血者	30	1(3.3％)	2(6.7％)	27(90.0％)
HBV	40	7(17.5％)	4(10.0％)	29(72.5％)	HCV	38	11(28.95％)	11(28.95％)	16(42.1％)
HXV	122	20(16.4％)	12(9.8％)	90(73.8％)	HCV	38	11(28.95％)	11(28.95％)	16(42.1％)

^*不确定，弱反应性

这些结果意味着470-20-1抗原存在于大量不同的血清样品中。该抗原与正常人血清不发生免疫反应。

B.抗体检测的全面ELISA记录

将聚苯乙烯96孔平板(“IMMULON II”(PGC))用5μg/ml(100μl/孔)抗原的0.1M碳酸氢钠缓冲液，pH9.5覆盖。将平板用“PARAFILM”密封，4℃保存过夜。

将平板抽气，用300μl10％正常羊血清封闭，37℃下保温1小时。

用PBS0.5％“TWEEN-20”将平板洗涤5次。

将抗血清稀释在1×PBS，pH7.2中。将所需稀释度的抗血清(0.1ml)加到每个孔中，在37℃下，将平板保温1小时。接着用PBS0.5％“TWEEN-20”将平板洗涤5次。

结合了辣根过氧化物酶(HRP)的羊抗人抗血清(Capple)被以1/5,000稀释在PBS中。将0.1ml的这种溶液加至各孔中。在37℃下，将平板保温30分钟，再用PBS洗涤5次。

Sigma ABTS(底物)仅在被加入到平板前才制备。

该试剂由50ml 0.05M柠檬酸，pH4.2，0.078ml 30％氢氧化钠溶液和15mg ABTS组成。将0.1ml底物加入到每个孔中，在室温下保温30分钟。加入0.05ml 5％SDS(w/v)使反应停止。在410nm处测定相对吸光度。

实施例11

所选择的HGV抗原的表达

将HGV全部编码序列亚克隆至多于50个的分离的重叠cDNA片段中。大多数cDNA片段的长度的范围为约200bp～约500bp。将cDNA片段分别克隆至表达载体pGEX-HisB中。该载体类似于上面所述的pGEX-MOV。

pGEX-hisB为pGEX-2T(Genbank登记号A01438；商业上可购得的表达载体)的修饰。通过在凝血酶酶切位点的正下游插入NcoI位点而将载体pGEX-2T修饰。这个位点后面接着的是BamHI位点，再接着是聚组氨酸(6个组氨酸)编码序列，再接着是在pGEX-2T中发现的EcoRI位点。感兴趣的编码序列一般被插在NcoI位点和BamHI位点之间。在图6(SEQ ID NO：115)中，插入序列编码GE3-2抗原。载体序列的其它部分与pGEX-2T相同。融合蛋白质的表达基本如上所述用其它pGEX衍生的表达载体来完成。

全部50个片段的克隆基本上如下所述完成，其中为50个编码区中的每一个选择了特异性引物。每个HGV插入DNA从使用如实施例4C中描述的一组特异性引物从PNF2161或其它HGV(+)血清提取的RNA通过PCR扩增而来。一般地，5’引物含有NcoI限制性位点，3’引物含有BamHI限制性位点。扩增片段中的NcoI引物使扩增的编码序列可以在框内融合至表达载体pGEX-Hisb或pGEX MOV中的GST-sj26编码序列中。

将扩增的HGV插入DNA用限制性内切酶NcoI和BamHI酶解。凝胶纯化酶解的插入DNA，并用NcoI和BamHI酶解的pGEX hisB或pGEX MOV连接。将大肠杆菌菌株W3110(ATCC#27325，美国典型培养物保藏中心，Rockville，MD)用连接产物转化。选择抗氨苄青霉素克隆。通过使用与插入分子(引物GLIF(SEQ ID NO：235)和GLIR(SEQ ID NO：236)旁侧的pGEX载体序列同源的引物，对来自抗氨苄青霉素的克隆进行PCR扩增证实了插入片段的存在。

PCR扩增产物的大小为插入片段的大小加上从载体衍生而来的约160bp。选择带有适宜插入片段的转化体，并使其进行如实施例7所描述的由IPTG进行的蛋白质诱导。通过Western印迹法分析表达的重组蛋白质对推断的HGV感染的人血清的特异的免疫反应性。

称为GE3，GE9，GE15，GE17，GE4，EXP3，GE1-N和GE-57的8个片段编码当与推断的HGV感染的人血清反应时产生清晰的免疫应答的抗原。

A.克隆GE3，GE9，GE15，GE17，GE4，EXP3，GE1-N和GE57

使用各片段特异性的PCR引物，从SISPA扩增的双链cDNA或从PNF2161或T55806获得的RNA通过聚合酶链式反应制备克隆GE3，GE9，GE15，GE17，GE4，EXP3，GE1-N和GE57的编码序列插入片段。下表14列出了每个克隆与SEQ ID NO：14的相同部分，以及用于产生每个克隆插入片段的引物系列。

表14

克隆	血清来源	SEQ ID NO：14上的对等部分	F引物(SEQ ID NO：)	R引物(SEQ ID NO：)
克隆	血清来源	SEQ ID NO：14上的对等部分	F引物(SEQ ID NO：)	R引物(SEQ ID NO：)	GE3	PNF2161	6615-6977	GE-3F(SEQ ID NO：46)	GE-3R(SEQ ID NO：49)
GE9	PNF2161	8154-8441	GE-9F(SEQ ID NO：48)	GE-9R(SEQ ID NO：49)	GE3	PNF2161	6615-6977	GE-3F(SEQ ID NO：46)	GE-3R(SEQ ID NO：49)
GE9	PNF2161	8154-8441	GE-9F(SEQ ID NO：48)	GE-9R(SEQ ID NO：49)	GE15	PNF2161	3615-3935	GE-15F(SEQ ID NO：111)	GE-15R(SEQ ID NO：112)
GE17	PNF2161	3168-3305	GE-17F(SEQ ID NO：113)	GE-17R(SEQ ID NO：114)	GE15	PNF2161	3615-3935	GE-15F(SEQ ID NO：111)	GE-15R(SEQ ID NO：112)
GE17	PNF2161	3168-3305	GE-17F(SEQ ID NO：113)	GE-17R(SEQ ID NO：114)	GE4	PNF2161	6825-7226	GE4F(SEQ ID NO：149)	GE4R(SEQ ID NO：150)
EXP3	PNF2161	6648-7658	470EXP3F(SEQ ID NO：151)	470EXP3R(SEQ ID NO：152)	GE4	PNF2161	6825-7226	GE4F(SEQ ID NO：149)	GE4R(SEQ ID NO：150)
EXP3	PNF2161	6648-7658	470EXP3F(SEQ ID NO：151)	470EXP3R(SEQ ID NO：152)	GE1-N	PNF2161	5850-6239	GE1-NF(SEQ ID NO：237)	GE1-NR(SEQ ID NO：238)
GE57	T55806	271^-456^	GE57F(SEQ ID NO：239)	GE57R(SEQ ID NO：240)	GE1-N	PNF2161	5850-6239	GE1-NF(SEQ ID NO：237)	GE1-NR(SEQ ID NO：238)

^*这些序列相对于SEQ ID NO：178而给出。

GE 57的氨基酸序列被表示为SEQ ID NO：241。

在GE-35’引物(GE-3F，SEQ ID NO：46)一无义点突变被引入以修饰本来的NcoI限制性位点。使用上述引物产生PCR扩增产物。将扩增产物用凝胶纯化，用NcoI和BamHI酶解，再用凝胶纯化。将纯化的NcoI/BamHI GE3，GE9，GE15，GE17，GE4，GE1-N和GE57片段独立地连接到脱磷酸化的NcoI/BamHI切口的pGEX-HisB载体上。将纯化的NcoI/BamHI EXP3片段连接到脱磷酸化的NcoI/BamHI切口的pGEX-MOV载体上。

将每个连接混合物转化至大肠杆菌W3110菌株，筛选抗氨苄青霉素克隆。将抗氨苄青霉素克隆重新悬浮于Tris/EDTA缓冲液中，使用引物GLI F(SEQ ID NO：235)和GLI R(SEQ ID NO：236)通过PCR分析以证实插入序列的存在。8个代表性克隆分别称为GE3-2，GE9-2，GE15-1，GE17-2，GE4-8，EXP3-7，GE1-N和GE57。

B.表达GE3-2，GE9-2，GE15-1，GE17-2，GE4-8，EXP3-7，GE1-N和GE57融合蛋白质

将带有包含GE3-2，GE9-2，GE15-1和GE17-2，GE4-8，EXP3-7，GE1-N和GE57载体的抗氨苄青霉素细菌的菌落分别接种到含有氨苄青霉素的LB培养基中。让培养物生长至OD为0.8-0.9，到时加入IPTG(异丙基硫代-β-半乳糖苷；Gibco-BRL)使最终浓度为0.3-1mM以诱导蛋白质表达。在存在IPTG时，继续保温3-4小时。

通过离心收集细菌细胞，并将其重新悬浮于SDS样品缓冲液(0.0625M Tris，pH6.8，10％甘油，5％巯基乙醇，2.3％SDS)中。将重新悬浮的沉淀物煮沸5分钟，通过离心除去不溶的细胞碎片。通过聚丙烯酰胺凝胶电泳(PAGE)以及未诱导的溶菌产物分析GE3-2，GE9-2，GE15-1，GE17-2，GE4-8，EXP3-7，GE1-N和GE57的IPTG诱导的培养物中获得的上清液。接着将来自凝胶的蛋白质转移至硝酸纤维素滤膜上(即通过Westem印迹法)。

首先将滤膜与针对GST蛋白质的兔多克隆抗体或鼠多克隆单克隆抗体(来自Sierra Biosource，CA)一起保温以检测适宜大小的GST融合蛋白质的表达。上面克隆的期望蛋白质大小分别为40，38，39，32，42，64，42和33KDa。RM001与适宜分子量的融合蛋白质的带的免疫反应性证明了上面克隆的融合蛋白质通过细菌细胞的成功表达。克隆蛋白质的表达还通过在考马斯亮蓝染色的凝胶上的由IPTG诱导的适宜大小的过表达蛋白质的出现而被监测。

C.HGV蛋白质的Western印迹分析

一旦HGV克隆蛋白质的表达通过使用抗GST抗体Western印迹被证实，接着将如上制备的一组滤膜接触一些HGV(+)和HGV(-)人血清。将用于所有细胞溶菌产物的Western印迹分析的人的血清用λ-gt11-硝酸纤维素滤膜预吸收。λ-gt11-硝酸纤维素滤膜制备如下。简而言之，在LB中制备KM392培养物的过夜培养物。用含有0.2％麦芽糖的新鲜LB将培养物稀释10倍，在37℃下，摇荡保温1小时。

1小时后，将培养物与等量的MgCa溶液(0.01M MgCl₂和0.01MCaCl₂)混合。将λgt11加入该混合物中至效价为2×10⁴PFU/ml，不断摇荡保温30分钟。30分钟后(1ml噬菌体/大肠杆菌混合物)，加入15ml熔化(55℃)的LB上层琼脂(具有0.8％琼脂的LB)：将8ml混合物涂布至每个15cm的LB琼脂平板上。在上层琼脂凝固后，在37℃下将平板保温3-5小时。

产生噬菌斑后，将硝酸纤维素滤膜放置在平板上，在37℃下，再将平板保温过夜。取下硝酸纤维素膜，并用TBS(50mM Tris-HCl，pH7.5，150mM NaC1)加上0.05％“TWEEN20”充分洗涤。再用0.05％明胶的TBS将洗涤过的滤膜封闭。将滤膜用TBS洗涤三次(每次洗涤5分钟)。

为了人血清的预吸收，将每血清在封闭溶液(描述在实施例10中)稀释100倍。接着将10ml稀释血清与上面制备的2个λgt11滤膜一起保温过夜。除开硝酸纤维素滤膜，将预吸收的血清用于Westem印迹分析。

Western印迹分析证明GE3-2，GE9-2，GE15-1，GE17-2，GE4-8，EXP3-7，GE1-N和GE57对HGV(+)血清显示出特异性的免疫反应性。GE-4-8与J21689血清发生免疫反应。J21689通过HGV PCR(实施例4)被确定为HGV(+)血清，HCV(+)被通过HCV PCR和血清学分析确定。EXP3-7蛋白质与JC和T55806发生免疫反应。JC在实施例4F中被鉴定为HGV阳性血清，这种血清由于其高的ALT而被血库拒收。起始血清样品一年之后获取的第二个JC样品，通过PCR分析仍为HGV阳性。T55806在实施例4F中也被鉴定为HGV阳性血清，这种血清由于其高的ALT而被血库拒收。这种血清与HCV共阳性(co-positive)。

另外，GE15-1和GE-17对PNF2161和T55806显示出弱但为特异性的免疫反应性。GE1-N与PNF2161，JC，T55806，T56633，T27034和R0001发生免疫反应。T56633，T27034和R0001在实施例4F中被鉴定为HGV(+)血清。GE57与E57963和R0001发生免疫反应。E57963为HGV和HCV共阳性血清。GE3-2和GE9-2也特异性地与HGV血清发生免疫反应。然而8种抗原中没有一种与HGV阴性血清T43608和R05072发生免疫反应。

使用采用结合了谷胱甘肽的珠(Smith，D.B.，等)和固定的金属离子珠(Hochuli；Porath)的双重层析方法。基本上如实施例7从细菌细胞溶菌产物纯化GE3-2和GE9-2融合蛋白质。如下将纯化的蛋白质进行Western印迹分析。

将各种量的纯化HGV蛋白质(例如GE3-2和GE9-2蛋白质)上样于12％丙烯酰胺凝胶上。PAGE之后，通过标准方法将蛋白质从凝胶转移至硝酸纤维素膜上。将各膜与大量人或小鼠血清中的每一份一起保温。通过洗涤膜，除去过量血清。

依据被筛选的血清，将这些膜与结合了碱性磷酸酶的山羊抗人抗体(Promega)或结合了碱性磷酸酶的山羊抗小鼠抗体(Sigma)。再次洗涤膜以除去过量的山羊抗人IgG抗体。并暴露于NBT/BCIP中。具有GE3融合蛋白质的普通染色的膜的照相示于7A-7D中。

这些图显示了使用下面血清的纯化GE3-2蛋白质的Western印迹分析的结果，N-(ABCDE)人(JC)血清(图7A)，N-(ABDE)人(PNF2161)血清(图7B)，极正常(SN2)血清(图7C)以及针对GST-sj26蛋白质的小鼠单克隆抗体(RM001)(图7D)。

在各个图中，泳道1含有事先染色的分子量标准(Bio-Rad)，泳道2-5分别含有下列量的GE3-2融合蛋白质4μg，2μg，1μg和0.5μg。数字代表1μg/0.6cm凝胶(孔的大小)的上样量。人JC，PNF2161和极正常2血清的稀释度为1∶100。抗sj 26的稀释度为1∶1000。JC印迹中在大约97K见到的带与GE3.2融合蛋白质制备中的少量污染物发生反应。蛋白质标准的大小为142.9，97.2，50，35.1，29.7和21.9KD。

如图7A-7D所示，GE3-2对JC血清显示出特异的免疫反应性。GE3-2微弱地与PNF2161血清反应，被评为不明确的或阴性。

在平行实验中，GE9-2对PNF2161血清显示出微弱但为特异的免疫反应性。

实施例12

构建典型表位文库

A.Y5文库

聚合酶链反应被用来扩增来自PNF2161SISPA扩增的cDNA的3个重叠DNA片段。使用JMJ-A/B接头(SEQ ID NO： 54和SEQID NO：55)制备PNF2161SISPA扩增的cDNA。使用1μM JML-A引物将1微升的该材料再扩增30次(94℃下，1分钟，55℃下，1.5分钟和72℃下，2分钟)。整个反应体积为100μl。将3个扩增的产物混合，并将其按照制造商的指示通过一次流过“WIZARD PCR柱”(Promega)而与过量的PCR引物分离，该“WIZARD PCR柱”为一种在高离子强度的缓冲液中结合DNA，在低离子强度的缓冲液中释放DNA的硅基树脂。用100μl蒸馏水将扩增的DNA从柱上洗脱下来。

将洗脱的DNA在1.5％琼脂糖TBE凝胶中(Maniatis等)分级分离，溴化乙锭染色后，在紫外线下目测观察到150-1000bp的DNA片段的一个强的斑点。1μl再扩增的cDNA被用作使用表15所示每一引物对的PCR反应中的模板。

表15

引物	SEQ ID NO：	扩增片段的大小
引物	SEQ ID NO：	扩增片段的大小	470ep-F1470ep-R1	SEQ ID NO：56SEQ ID NO：57	810
470ep-F2470ep-R3	SEQ ID NO：58SEQ ID NO：59	750	470ep-F1470ep-R1	SEQ ID NO：56SEQ ID NO：57	810
470ep-F2470ep-R3	SEQ ID NO：58SEQ ID NO：59	750	470ep-F4470ep-R4	SEQ ID NO：60SEQ ID NO：61	669

将引物用未扩增表15所示大小的HGV特异性的DNA片段的扩增。在扩增反应中，引物对以1μM的浓度使用。在100μl的整个反应体积中，在94℃下，1分钟，54℃下，1.5分钟，72℃下，3分钟，使扩增进行30次。三个不同引物对的PCR反应中的每一个都导致了具有期望大小的产物的特异性扩增。对于每一引物对的反应，将来自3个独立的PCR反应的扩增产物混合，并如上所述用“WIEARD PCR柱”纯化，将纯化产物稀释于50μl蒸馏水中。

将来自每一纯化产物的样品(14μl，含有约1-2μg每一引物对扩增的DNA片段)混合。将所有三种不同的扩增片段的混合样品加入5μl 10×DNA酶酶解缓冲液(500mM Tris pH7.5，100mMMnCl₂)和2μl蒸馏水中。从该酶解混合物中吸取10μl样品，置于含有5μl终止溶液(100mM EDTA，pH8.0)的试管中。该样品为0“酶解分钟”的时间点。将酶解反应的其余部分放置于25℃下。将1μl以1/25稀释的无RNA酶的DNA酶I(Stratagene)加入到该酶解混合物中。在各个时间点，将10μl等分样品取出，与5μl终止溶液混合，将DNA酶I酶解的DNA产物在1.5％琼脂糖TBE凝胶上进行分析。

一些酶解实验的结果表明40分钟的酶解提供了DNA片段在100-300bp大小范围中的良好分布。在室温下使剩下的全部酶解混合物重复进行DNA酶I的酶解过程。加入18μl终止缓冲液终止酶解，使用“WIZARD PCR柱”纯化酶解的DNA产物。用50μl蒸馏水洗脱“WIZARD-PCR柱”，将洗脱的DNA加入下面反应混合物中：7μl限制性内切酶缓冲液C(Promega，10mM MgCl₂，1mM DTT，50mM NaCl，10mM Tris，pH7.9，1×浓度)；11μl 1.25mMdNTPs；和2μl T4 DNA聚合酶(Boehringer-Mannhiem)。在37℃下，将反应混合物放置30分钟，到时加入70μl pH8.0的苯酚/氯仿并混合。除去苯酚/氯仿，再提取一次以产生总共150μl含DNA样品的水溶液。用2体积的无水乙醇和0.5体积的7.5M乙酸铵将DNA进行乙醇沉淀。在“ZPPENORF MICROFUGE”中，以14,000rpm转速离心，将DNA形成片状沉淀物，在42℃下干燥，并重新悬浮于25μl蒸馏水中。

将DNA连接至5’脱磷酸的SISPA接头KL1(SEQ ID NO：62)和KL2(SEQ ID NO：63)上。一些不同浓度的SISPA接头和DNA被用于试验。在下面连接反应条件，发生高水平的连接(如下所评价的)：6μl DNA，2μl 5.0×10-12M KL1/KL2接头，1μl 10×连接酶缓冲液(新英格兰生物实验室)和1μl 400单位/μl T4 DNA连接酶(新英格兰生物实验室)，总反应体积为10μl。在16℃下，将连接反应过夜。

如下平行地进行两个反应。在100μl的总反应体积中，将被连接材料的2μl样品用KL1 SISPA引物扩增(在94℃下，1分钟，55℃下，1.5分钟以及72℃下2分钟，共进行25次循环)。通过1.5％琼脂糖TBE凝胶电泳分离1/5 PCR反应扩增的产物来分析连接的程度。将凝胶用溴化乙锭染色，在紫外线下观察这些带。

用“ WIZARD PCR柱”纯化来自重复反应的扩增产物，以50μl蒸馏水将纯化的DNA洗脱。在30μl的总体积中，将25μl PCR KL1/KL2扩增的DNA的等分试样用36单位EcoRI(Promega)酶解。在37℃下，将反应过夜。使用“SEPADEX G25”旋转柱纯化酶解的DNA。

在过夜反应中，将EcoRI酶解的DNA连接到事先用EcoRI酶解的λgt11臂上，并用小牛肠碱性磷酸酶处理(Stratagene，La Jo1la，CA)。按照制造商的指示使用“GIGAPACK GOID PACKAGINGEXTRACT”(Stratagene)将连接混合物分装。获得的重组噬菌体的量的滴定通过将1/10稀释度的包装噬菌体涂敷到KM-392的菌苔上来进行，其中平板含有20μl 100mg/ml的X-gal溶液(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷；Sigma)和20μl 0.1M IPTG溶液(异丙基-1-硫代-β-D-半乳糖苷，Sigma)。获得了含有大于75％重组噬菌体的1.2×10⁶噬菌体/ml的效价。

使用引物11F(SEQ ID NO：25)和11R(SEQ ID NO：13)通过任意挑选的噬菌体的PCR分析确定重组噬菌体百分数。含有DNA片段的包装文库从扩增的DNA F1/R1，F2/R3和F4/R4的酶解衍生而来，称为Y5文库。

B.ENV文库

如下制备称为ENV文库的表达文库。1μl PNF2161 SISPA扩增DNA被用作使用下面引物对的聚合酶链反应中的模板GEP-F15(SEQID NO：128)和GEP-R15(SEQ ID NO：129)，它们产生525个核苷酸HGV片段；以及GEP-F17(SEQ ID NO：130)和GEP-R16(SEQ ID NO：131)，它们产生765个核苷酸HGV片段。

在94℃下，1分钟，52℃下，1.5分钟和72℃下3分钟将PCR扩增进行35次。纯化扩增产物并用DNA酶酶解。基本上如实施例12A中的描述，在λgt 11中将KL1和KL2接头连接至cDNA上，扩增DNA片段，构建文库。文库的重组频率大于70％。通过使用由λgt11旁侧区衍生的衍生物的聚合酶链反应对插入片段的分析证实了重组频率，并表明插入片段的大小范围为150-500个核苷酸。

C.NS3文库

如下构建称为NS3的表达文库。通过使用引物470ep-F9(SEQID NO：132)和470ep-R9(SEQ ID NO：133)以及模板PNF2161SISPA扩增核酸的聚合酶链反应将第一个片段扩增。预期的扩增反应的产物为77个碱基对。通过在TAE凝胶上的分离将扩增片段用凝胶纯化。用“GENE-CLEAN”(Bio101，La Jolla，CA)进一步纯化片段。

使用伸展克隆GE3L-11(SEQ ID NO：41)作为源物质还将片段F9/R9扩增。在扩增反应中约25ng的GE3L-11被用作带有F9和R9引物的模板。

使用“TAQ START”(Clonetech，Palo Alto，CA)在94℃下，1分钟，52℃下，2分钟，72℃下3分钟让F9/R9扩增进行30次。混合两个反应的扩增产物。将产物用DNA酶I酶解(10μl GE3L产物和25μl PNF SISPA产物)。基于GE3L的扩增产物代表了大多数扩增产物起始物质。基本上如实施例12A中的描述，在λgt11中将KL1和KL2接头连接至cDNA上。扩增DNA片段，构建文库。

获得的效价为2.5×10⁶噬菌体/ml，重组噬菌体的百分数被确定为大于99％，对插入片段大小的聚合酶链反应分析证实了该重组频率。并表明插入片段的大小为150-550核苷酸。

另外，还使用GEP-F10/GEP-R10引物(分别为SEQ ID NO：135和SEQ ID NO：136)将第二个片段进行扩增。1μl PNF2161SISPA扩增的核酸被用作模板。获得了大小为57个核苷酸预期片段。得到的扩增产物被用于刚才描述的F9/R9扩增。当这个片段被插入λgt11时所获得的效价为1.47×10⁶噬菌体/ml，重组频率为90％。

D.NS2文库

使用描述在实施例12A中的方法构建NS2表位文库。从1μl PNF2161SISPA DNA(基本上如实施例12A描述的制备)扩增4种含有全部或部分HGV蛋白质NS2，NS3和NS5b的DNA片段。使用表16所出的引物以及SISPA扩增的PNF2161DNA作为模板制备该文库。

表16

片段	nt
片段	nt		9E3-REV(SEQ ID NO：264)E394-R(SEQ ID NO：265)	592	E2的aa358(of389)至NS-2的aa166
GEP-F12(SEQ ID NO：266)GEP-R12(SEQ ID NO：267)	663	NS-2的aa144(of313)至NS-3的aa51	9E3-REV(SEQ ID NO：264)E394-R(SEQ ID NO：265)	592	E2的aa358(of389)至NS-2的aa166
GEP-F12(SEQ ID NO：266)GEP-R12(SEQ ID NO：267)	663	NS-2的aa144(of313)至NS-3的aa51	GEP-F14(SEQ ID NO：268)GEP-R13(SEQ ID NO：269)	715	NS-3的aa357-594
470epF8(SEQ ID NO：270)GEP-R14(SEQ ID NO：271)	648	NS-5的aa716-847(716至结尾)	GEP-F14(SEQ ID NO：268)GEP-R13(SEQ ID NO：269)	715	NS-3的aa357-594

在94℃/1分钟，48℃/2分钟，73℃/3分钟，将所有扩增进行35次。所有扩增产生了至少一种预期大小的片段。以约1∶1∶1∶1比例混合扩增产物，用DNA酶I部分酶解。如上面，将酶解产物连接到KL1SISPA接头，将其扩增并用EcoRI酶解。将酶解片段连接到λgt11上。分装连接反应物。

接种分装的连接产物。得到的文库被确定含有一70％带有观察到的大小为150-500个核苷酸的插入片段重组噬菌体。

E.VNS5A文库

用引物470EXT4-2189R(SEQ ID NO：119)和470EXT4-29F(SEQ ID NO：120)分离含有HGV蛋白质NS4b和NS5a以及NS4a的3’末端和NS5b的5’末端的全部编码序列的2.1kbp DNA片段。如实施例4G中所描述的，进行使用这些引物的PCR扩增。在包括下面的多次HGV感染的血清中观察到了成功的扩增：T56633来自由于其所捐献的血液的ALT值高于临界值而被拒收的血液捐献者；样品E21-A和E20从患有肝炎的埃及人获得；以及样品AH0591从形成急性肝炎的澳大利亚人获得。

基本上如实施例6中所描述，将E21-A和E20的扩增产物克隆至载体T/A(获自于InVitrogen，San Diego，CA)的T伸出位点。接着通过用约150单位限制性内切酶EcoRI酶解约20μg质粒DNA，分离来自这2个质粒的2.1kb HGV插入片段。在37℃下保温过夜后，将酶解产物用TAE琼脂糖凝胶电泳分解。将产物从含有感兴趣片段的琼脂糖凝胶部分切割下来。将琼脂糖熔化，按照制造商的指示使用“GENECLEAN II”试剂盒(Bio101，La Jolla，CA)提取释放的DNA。

如实施例12A中所描述，将从E21-A和E20样品产生的纯化的2.1kb片段以及从样品T56633和AH0591的PCR扩增获得的DNA片段分别用DNA酶I酶解。对于所有4个样品，确定导致大小为100-1000nts的片段被分离的酶解条件。纯化和修整后(实施例12A)，将从4个HGV感染的样品分别连接到不同组的SISPA接头。连接后，将DNA进行SISPA扩增。

在37℃下，将扩增的DNA分别用约100单位的EcoRI酶解过夜。接着将酶解的DNA通过使用G25树脂的旋转柱层析(5’3’Inc，Boulder，CO)纯化。以1∶1∶1的比例将来自样品T56633，AH0591和E21-A的酶解DNA混合，并如实施例12A所描述，将DNA的混合物连接到λgt11的EcoRI位点。分装后，使用“GIGAPACK III XL”提取物(Stratagene，LaJolla，CA)在IPTG和XGAL存在下，接种得到的文库，测定其具有约1.0×10⁶噬菌体/ml的效价，重组频率为约70％。

实施例13

免疫筛选表位文库

A.分离具免疫活性的Y5克隆

基本上如实施例2中所描述，将两个HGV阳性血清，PNF2161和JC用于免疫筛选Y5文库。以约15,000噬菌体/平板的量将Y5噬菌体文库涂敷在20个平板上。将平板温育约5小时，用硝酸纤维素滤膜(Schleicher and Schuell)覆盖过夜。通过在AIB(1％明胶加上0.02％叠氮化钠)中保温约6小时将滤膜封闭。将封闭的滤膜再用TBS洗涤一次。

将10个Y5文库滤膜与PNF2161血清和10个带有JC血清的滤膜一起搅拌保温过夜。两血清以1∶10稀释在AIB中。为了减少非特异性抗体结合，稀释血清已通过与吸收了野生类型的λgt11的硝酸纤维素滤膜一起保温过夜而被事先处理。

将滤膜从血清中移去，用TBS洗涤三次，与结合了碱性磷酸酶的山羊抗人二抗(Promega，以1/7500稀释在AIB中)一起保温1小时。将滤膜用TBS洗涤4次。通过将滤膜在含有NBT和BCIP的AP缓冲液(100mM NaCl，5mM MgCl₂，100mM Tris，pH9.5)中保温来检测结合的二抗。

挑取在最初筛选中测试为阳性的噬菌体，并用500μl PDB中(100mM NaCl，8.1mM MgSO₄，50mM Tris pH7.5，0.02％明胶)洗脱。通过以总密度为100-500噬菌体/100mm平板，重新涂敷洗脱的噬菌体来纯化具有免疫反应性的噬菌体。基本上如上所述，将平板用适宜HGV阳性血清重新进行免疫筛选。显色反应后，挑取一些分离的阳性噬菌体，放入500μl PDB中。保温1小时后，将2μl重新纯化的噬菌体PDB溶液用作含有11F(SEQ ID NO：25)和11R(SEQ IDNO：13)PCR引物的PCR反应的模板。这些引物与位于λgt11的EcoRI位点的5’端70个核苷酸和3’端90个核苷酸的序列同源。在94℃/1分钟，55℃/1.5分钟，和72℃/分钟将PCR反应扩增30个循环。

将PCR扩增反应物在琼脂糖凝胶上进行大小的分级分离。纯化噬菌体的PCR扩增产生了用于每一单个噬菌体扩增反应的单链，其中纯化的片段含有DNA插入片段加上噬菌体5’和3’旁侧序列的约140个碱基对。按照制造商的教导，使用“S-300HR”旋转柱(Pharmacia)纯化来自产生单条带的PCR反应的扩增产物。采用Applied Biosystems自动测序仪377A和适当记录测定DNA的量和DNA序列。

如上面所述的用JC血清筛选Y5文库导致了示于表17中的阳性链克隆的纯化和DNA序列测定。阳性链克隆相当于存在在SEQ ID NO：14的HGV序列一多蛋白质阅读框的5’-3’翻译。

表17

克隆	筛选血清	插入片段大小(碱基对)	插入片段大小(氨基酸)	核酸SEQID NO.	被编码的蛋白质SEQ ID NO.
克隆	筛选血清	插入片段大小(碱基对)	插入片段大小(氨基酸)	核酸SEQID NO.	被编码的蛋白质SEQ ID NO.	Y5-10	JC	210	62	64	65
Y5-12	JC	333	94	66	67	Y5-10	JC	210	62	64	65
Y5-12	JC	333	94	66	67	Y5-26	JC	303	93	68	69
Y5-5	JC	153	36	70	71	Y5-26	JC	303	93	68	69
Y5-5	JC	153	36	70	71	Y5-3	JC	162	44	72	73
Y5-27	JC	288	86	74	75	Y5-3	JC	162	44	72	73
Y5-27	JC	288	86	74	75	Y5-25	JC	165	36	76	77
Y5-20	JC	165	19¹	78	79	Y5-25	JC	165	36	76	77
Y5-20	JC	165	19¹	78	79	Y5-16	JC	234	56	80	81

¹.该克隆含有双链(double)插入片段，克隆插入片段的核苷酸69至126相当于HGV序列

这些克隆描述了在HGV的推断NS5蛋白质中的2个免疫原性区。这两个区与示为SEQ ID NO：14的序列相对应，为位置6636-6821和7278-7385。

另外，用PNF2161血清筛选Y5文库导致了示于表18的下面的阴性链克隆的纯化和DNA序列测定。阴性链克隆相当于互补于示于SEQ IDNO：14中的HGV序列的序列的5’-3’的翻译。

表18

克隆	筛选血清	插入片段的大小(碱基对)	插入片段的大小(氨基酸)	核酸SEQID NO.	被编码的蛋白质SEQID NO.
克隆	筛选血清	插入片段的大小(碱基对)	插入片段的大小(氨基酸)	核酸SEQID NO.	被编码的蛋白质SEQID NO.	Y5-50	PNF2161	349	104	82	83
Y5-52	PNF2161	119	20¹	84	85	Y5-50	PNF2161	349	104	82	83
Y5-52	PNF2161	119	20¹	84	85	Y5-53	PNF2161	250	33²	86	87
Y5-55	PNF2161	143	20³	88	89	Y5-53	PNF2161	250	33²	86	87
Y5-55	PNF2161	143	20³	88	89	Y5-56	PNF2161	366	110	90	91
Y5-57	PNF2161	231	65	92	93	Y5-56	PNF2161	366	110	90	91
Y5-57	PNF2161	231	65	92	93	Y5-60	PNF2161	151	38	94	95
Y5-63	PNF2161	125⁴	25	96	97	Y5-60	PNF2161	151	38	94	95

¹.该克隆含有双插入片段，克隆插入片段的核苷酸46-105相当于

HGV序列

².该克隆含有双插入片段，克隆插入片段的核苷酸19-118相当于

HGV序列

³.该克隆含有双插入片段，克隆插入片段的核苷酸70-126相当于

HGV序列

⁴.插入片段在核苷酸19和35之间含有外部非HGV序列

所有这些序列含有使用PNF2161血清分离的原始HGV克隆470-20-1的部分。

如下分离来自Y5文库的另外的表位克隆。用实施例13描述的方法将Y5文库用HGV感染的血清J21689和T56633筛选，获得多于400个的阳性噬菌体，这表明被两种HGV感染的血清识别的强免疫原性的序列的存在。将10个阳性噬菌体纯化并进行DNA序列测定。DNA序列测定获得的结果描述在表19中。

表19

克隆	HGV VAR	血清	起始^*	终止
克隆	HGV VAR	血清	起始^*	终止	Y5-114-1A	PNF	J21689	6636	6827
Y5-114-2B	PNF	J21689	6678	6935	Y5-114-1A	PNF	J21689	6636	6827
Y5-114-2B	PNF	J21689	6678	6935	Y5-121-19A	PNF	T56633	6678	7063
Y5-121-11A	PNF	T56633	6636	6917	Y5-121-19A	PNF	T56633	6678	7063
Y5-121-11A	PNF	T56633	6636	6917	Y5-121-12A	PNF	T56633	6636	6959
Y5-121-15A	PNF	T56633	6636	6917	Y5-121-12A	PNF	T56633	6636	6959
Y5-121-15A	PNF	T56633	6636	6917	Y5-121-16A	PNF	T56633	6636	6989
Y5-121-17A	PNF	T56633	6636	7082	Y5-121-16A	PNF	T56633	6636	6989
Y5-121-17A	PNF	T56633	6636	7082	Y5-121-20A	PNF	T56633	6636	6929
Y5-121-18A	PNF	T56633	6636	6896	Y5-121-20A	PNF	T56633	6636	6929

^*开始/结束的位置相对于SEQ ID NO：14而给出。

将这些序列与前面筛选文库获得的比较，表明这些克隆均含有包含在前面分离的表位克隆Y5-10中的相同表位。两个克隆，Y5-114-2B和Y5-121-19A通过它们的5’末端比前面观察的克隆Y5-10，Y5-12和Y5-26的起始端更靠近NS5a羧基端14个氨基酸的事实而被识别。没有一个上述克隆具有位于在克隆Y5-10中所观察到3’末端的内部3’末端。因此这个表位的最小序列包含在氨基酸序列中(SEQ ID NO：272)。

B.来自ENV文库的抗原克隆

用HGV血清J21094筛选ENV文库。基于首次产生(C-100)HCV试验，该血清(J21094)被鉴定为HCV阳性。通过PCR和其它HCV抗原，对原始J21094血清样品，以及后来获得的J21094样品的后续试验证实初始个体的血清为被HCV感染。借助使用470-20-1和NS5引物对的PCR分析，获得了HGV核酸存在的证据。

大量噬菌体克隆被鉴定为与J21094血清发生免疫反应。噬菌体通过噬菌斑纯化和顺序。7个克隆(Q7-12-1，Q7-16-2-2，Q7-15-2，Q7-17-2-1，Q7-19-1和Q7-19-2-1)含有相同的插入片段。Q7-12-1的核苷酸序列被列为SEQ IDNO：143(多肽序列，SEQ ID NO：144)。

通过刚才描述的方法获得的另一个克隆，Q7-16-1与Q7-12-1具有相同的5’末端，但在3’末端短26个氨基酸。

C.来自NS3文库的抗原克隆

使用下面血清筛选F9/R9噬菌体和F10/R10噬菌体的混合物(1∶1)：PNF2161，J21689和E57963。J21689和E57963为通过PCR(使用多个引物)测试为HCV和HGV共阳性(co-positive)的血清。每次免疫筛选是用10个平板或约150,000噬菌体。一些在筛选中被鉴定为免疫阳性的克隆如下。

免疫Y12-10-3(多核苷酸序列，SEQ ID NO：145；多肽序列，SEQ ID NO：146)通过其与J21689血清的免疫反应性而被识别。该克隆表达来自HGV NS3的88个氨基酸插入片段。

克隆Y12-15-1(多核苷酸序列，SEQ ID NO：147；多肽序列，SEQ ID NO：148)通过其与E57963血清的免疫反应性而被识别。该克隆表达来自HGV的NS3蛋白质的64个氨基酸插入片段。这个序列位于克隆Y12-10-35’端约70个氨基酸处。

D.来自NS2文库的抗原克隆

通过用HGV阳性血清T56633筛选NS2文库分离多个阳性噬菌斑，随后纯化11个噬菌斑，并进行DNA序列测定。包含在噬菌斑中的插入片段的位置(以SEQ ID NO：14为标准)描述在表20中。

表20

克隆	HGV VAR	血清	起始^*	终止
克隆	HGV VAR	血清	起始^*	终止	Q9-18-5	PNF	T56633	3071	2778
Q9-18-3	PNF	T56633	2951	2745	Q9-18-5	PNF	T56633	3071	2778
Q9-18-3	PNF	T56633	2951	2745	Q9-20-4	PNF	T56633	3002	2745
Q9-18-2	PNF	T56633	2990	2745	Q9-20-4	PNF	T56633	3002	2745
Q9-18-2	PNF	T56633	2990	2745	Q9-20-8	PNF	T56633	3062	2745
Q9-20-5	PNF	T56633	2972	2787	Q9-20-8	PNF	T56633	3062	2745
Q9-20-5	PNF	T56633	2972	2787	Q9-17-1	PNF	T56633	2990	2745
Q9-19-3	PNF	T56633	2982	2745	Q9-17-1	PNF	T56633	2990	2745
Q9-19-3	PNF	T56633	2982	2745	Q9-19-1	PNF	T56633	2982	2745
Q9-19-5	PNF	T56633	2984	2745	Q9-19-1	PNF	T56633	2982	2745
Q9-19-5	PNF	T56633	2984	2745	Q9-20-2	PNF	T56633	3027	2745

^*在此表中，位置根据SEQ ID NO：14而给出。克隆

的实际序列为所指片段的互补链。

所有免疫克隆表达相同可读框(ORF)部分。互补于编码多蛋白质的序列的HGV多核苷酸链编码可读框。该可读框为互补于SEQ IDNO：14的序列中的核苷酸322至6865。在互补链核苷酸6388处，存在一个可作为翻译起始位点的甲硫氨酸，它可以供产生159个氨基酸的蛋白质之用。

所有11个被测序的克隆的共同的最小氨基酸序列位于核苷酸6342至6606(相应于SEQ ID NO：14的互补链)。由HGV-PNF2161的负链的这个区编码的氨基酸序列被示为SEQ ID NO：273。

具免疫活性的负链区的亚克隆和随后的Western印迹分析描述如下。

E.来自VNS5A文库的抗原克隆

将约1.5×10⁵来自VNS5a文库的噬菌体涂敷，接着用实施例13中描述的方法用HGV阳性血清J29374筛选。用J29374对VNS5a文库的免疫筛选导致了多个阳性噬菌斑的分离。将6个噬菌斑纯化并随后进行DNA序列测定。获得的DNA序列的原始链可通过其SISPA接头序列存在于克隆5’和3’末端的那些来确定。获得的克隆(以SEQ ID NO：14为标准)的起始和终止位置以及它们的来源总结在表21中。

表21

克隆	HGV变异体来源	血清	起始^*	终止
克隆	HGV变异体来源	血清	起始^*	终止	Q11-14-2	AH0591	J29374	6525	6749
Q11-16-1	E21-A	J29374	6432	6935	Q11-14-2	AH0591	J29374	6525	6749
Q11-16-1	E21-A	J29374	6432	6935	Q11-10-2	T56633	J29374	6579	671O
Q11-18-2	T56633	J29374	6579	6758	Q11-10-2	T56633	J29374	6579	671O
Q11-18-2	T56633	J29374	6579	6758	Q11-22-1	T56633	J29374	6576	6680
Q11-9-1	T56633	J29374	6531	6851	Q11-22-1	T56633	J29374	6576	6680

所有这些克隆共同含有Q11-22-1克隆的序列(SEQ IDNO：274)。这个氨基酸序列紧接着Y5-10表位的最小序列的5’端。因此它定义了HGV NS5a中另外一个独特的表位。观察到的3种HGV变异体的氨基酸序列与PNF-2161和JC分离株的序列的比较表明有极少数氨基酸取代基。

实施例14

具有免疫反应性的克隆的进一步鉴定

A.亚克隆

1.Y5克隆

克隆Y5-10，Y5-16和Y5-5被选择用于亚克隆至表达载体pGEX-HisB中。设计除去位于这些克隆末端的外部接头序列的PCR引物。这些引物还被引入(i)位于各个插处片段5’末端的NcoI位点，和(ii)位于各插入片段3’末端的BamHI位点。使用这些引物(见表22)，从2μl噬菌斑纯的贮藏物扩增DNA片段。

表22

克隆	引物系列
克隆	引物系列	Y5-10	Y5-10-F1 SEQ ID NO：99Y5-10-R1 SEQ ID NO：100
Y5-16	Y5-16F1 SEQ ID NO：101470ep-R3 SEQ ID NO：102	Y5-10	Y5-10-F1 SEQ ID NO：99Y5-10-R1 SEQ ID NO：100
Y5-16	Y5-16F1 SEQ ID NO：101470ep-R3 SEQ ID NO：102	Y5-5	Y5-5-F1 SEQ ID NO：103470ep-R3 SEQ ID NO：102

如下进行扩增：94℃/1分钟，50℃/1.5分钟，72℃/2分钟将扩增进行30个循环。扩增后，使用“WIZARD PCR”旋转柱纯化得到的DNA，其中样品稀释成50μl，并用NcoI和BamHI酶解过夜。将最小量的30单位的各种酶用于限制性核酸内切酶酶解中(NcoI，BoehringerMonnhiem；BamHI，Promega)。

将酶解的PCR片段过夜连接到已用NcoI和BamHI酶解的表达载体pGEX-HisB中。使用热休克方案(Ausubel，等，Maniatis，等)将各组连接质粒独立地用于转化大肠杆菌菌株W3110。在含有100μg/ml氨苄青霉菌的LB平板选择转化体，抗体克隆被用于接种2ml含有100μg/ml氨苄青霉素的LB。还制备表达非重组sj26/his蛋白质的培养物。

在37℃保温过夜后，将培养物以1/10稀释至2ml含有氨苄青霉素的新鲜LB中，在37℃下再保温1小时。加入IPTG使最终浓度为0.2mM，在37℃下，将培养物再培养3小时。通过离心使细菌成沉淀，并将细菌沉淀重新悬浮于100μl PBS中。将100μl 2×SDS样品缓冲液(0.125M Tris，pH6.8，10％甘氨酸，5％β-巯基乙醇，2.3％SDS)加入到沉淀物中。旋涡振荡得到的溶菌产物，加热至100℃，并保持5分钟。将每种溶菌产物的等分试样上样至12％丙烯酰胺SDS-PAGE凝胶中。

通过电泳对表达蛋白质按大小进行分级分离。使用标准方法(Harlow，等)将分离蛋白质从凝胶转移至硝酸纤维素滤膜上。用考马斯亮兰蛋白质染色含有表达蛋白质的另一凝胶。

带有质粒Y5-10，Y5-5和Y5-16的转化体表达了显著量的正确大小的重组融合蛋白质。通过将Western印迹(上面制备的)和与sj2发生特异性免疫反应的小鼠单克隆抗体(Sierra BioSourle，Gilroy，CA)一起保温证实了重组融合的一致性。

如下获得被挑选的克隆含有适宜插入片段的另外的证明。通过用含有少量能表达已接种的重组克隆的细菌的牙签接种40μl TE溶液来制备各个克隆的噬菌体溶液。从各溶液吸取5μl样品，分别进行PCR扩增。

扩增采用适宜的正向引物(例如可能表达Y5-10的克隆的Y5-10)和与位于3’至质粒pGEX-HisB克隆位点的序列同源的反向引物(SEQ ID NO：104)。PCR扩增如下进行25次：94℃/1分钟，50℃/1.5分钟，72℃/2分钟。在这些条件下，选择用于进一步分析的所有克隆产生不具其它明显的带的正确大小的DNA带。

从Y5-10，Y5-16和Y5-5插入片段(表达为sj26-his融合蛋白质)表达的抗原的免疫反应性如下确定。将上面制备的粗溶菌产物的等分试样(15μl)通过使用12％丙烯酰胺凝胶的SDS-PAGE按大小进行分级分离。将蛋白质电印迹(“NOVEX MINICELLMINIBLOT II”，San Diego，CA)至硝酸纤维素滤膜上。接着将滤膜分别与下面血清中的一种进行保温：JC，PNF2161，极正常血清4(SN4)(R05072)作为阴性对照。另外，将一滤膜与抗sj26单克隆抗体(RM001；Sierra Biosource)进行保温。

如所预料的，表达由Y5-10，Y5-5和Y5-16插入片段的编码的抗原的细菌产生的重组蛋白质全都与JC血清反应。没有观察到与PNF2161或SN4血清反应。所有蛋白质看来被以与通过它们与抗sj26单克隆抗体的反应性而确定的类似的水平表达。Y5-5和Y5-10编码的蛋白质被选择用于进一步的纯化。

培养带有含有pGEX-HisB载体的Y5-5-和Y5-10-的大肠杆菌，如上所述诱导融合蛋白质的表达。在1500psi下，使用French Press将细胞溶解在含有2mM PMSF的PBS中。离心粗溶菌产物以除去细胞碎片。以高流速将上清液上样至甘胱谷肽亲和柱上，将柱用10柱体积的PBS洗涤。将Y5-5和Y5-10融合蛋白质用10mM含有10mM谷胱甘肽的Tris pH8.8洗脱。

用缓冲液A(10mM含有8M尿素的Tris，pH8.8)以1/10将各融合蛋白质样品稀释，并将其上样至镍电荷螯合(nickel charged-chelating“SEPHAROSE”快速流动柱上。将各柱用缓冲液A重复洗涤直至没有其它污染物被洗脱下来。用一个梯度的咪唑缓冲液A洗脱融合蛋白质。在20柱体积中使一个咪唑梯度从0度至0.5M。收集各级份。

通过使用12％聚丙烯酰胺凝胶的标准SDS-PAGE分析每组级分。分别制备含有Y5-5和Y5-10融合蛋白质级分的库。

图8A-8D显示了下面样品(μg/道)的Western印迹分析的结果：泳道1，Y5-10抗原1.6μg；泳道2，Y5-10抗原0.8μg；泳道3，Y5-10抗原0.4μg；和泳道4，Y5-10抗原0.2μg。将人血清JC(图8A)和极正常2血清(图8B)以1∶100稀释。将抗GST小鼠单克隆抗体RM001(图8C)以1∶1000稀释。图8D显示通过SDS-PAGE分析，被转移至硝酸纤维素膜上和用Ponceau S蛋白质染色(Kodak，Rochester，NY；Sigma)的Y5-10抗原。箭头指示Y5-10抗原的位置。这些结果证明Y5-10与N-(ABCDE)人血清JC特异性地发生免疫反应。

图9A-9D显示下面样品的Western印迹分析结果。泳道1，Y5-5抗原3.2μg；泳道2，Y5-5抗原1.6μg；泳道3，Y5-5抗原0.8μg；泳道4，Y5-5抗原0.4μg；泳道5，Y5-5抗原0.2μg；泳道6，GE3-2抗原0.4μg；和泳道7，Y5-10抗原0.4μg。将人血清JC(图9A)，T55806(图9B)和极正常2血清(图9C)以1∶100稀释。将RM001，抗GST小鼠单克隆抗体(图9D)以1∶1000稀释。箭头指示抗原Y5.5，GE3.2和Y5.10的位置。这些结果表明Y5-5抗原与JC血清的特异的免疫反应性。另外，抗原GE3-2和Y5-10与T55806发生反应。然而，Y5-5抗原不与HGV阳性血清T55806发生反应。

Y5-10抗原还被通过SDS-聚丙烯酰胺凝胶电泳被按大小分级分离。将凝胶用考马斯兰染色。用激光光密度计扫描凝胶纯度。Y5-10融合蛋白质的纯度为约95％。

2.ENV克隆

最初通过用HGV阳性血清J21094筛选ENV表位文库将免疫克隆Q7-12-1分离。采用序列特异性引物分离包含在Q7-12-1λgt11克隆中的HGV插入片段。将Q7-12-1插入片段切割下来，并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQID NO：275)。

3.NS3克隆

最初通过用HGV阳性血清E57963筛选NS3表位文库将免疫克隆Y12-15-1分离。采用序列特异性引物分离包含在Y12-15-1λgt11克隆中的HGV插入片段。将Y12-15-1插入片段切割下来并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQID NO：276)。

最初通过用HGV阳性血清J21689筛选NS3表位文库将免疫克隆Y12-10-3分离。采用序列特异性引物分离包含在Y12-10-3λgt11克隆中的HGV插入片段。将Y12-10-3插入片段切割下来并克隆至pGEX-Nde中。选择性克隆产生的融合蛋白质通过Western印迹分析来评价，插入片段的序列通过DNA序列测定来证实(SEQ IDNO：277)。

4.NS2克隆

分离由SEQ ID NO：14的NS2区序列的互补序列产生的多个负链免疫克隆。存在至少2个由HGV负链编码的重要的ORFs位于SEQ IDNO：14的互补链的核苷酸6723-7259之间，并还在核苷酸6774处具有5’甲硫氨酸。第二个ORF编码162个氨基酸的蛋白质。

将两个负链ORFs序列的选择部分克隆至表达载体pGEX-Nde中。使用适宜的寡核苷酸引物通过PNF2161SISPA物质的PCR扩增获得所有的亚克隆。因此它们包含HGV-PNF2161变异体的序列。表23显示ORF的名称，大小以及相对于SEQ ID NO：14互补链的位置。

表23

名称/ORF	ORF	从NT(ATG)开始	至NT
名称/ORF	ORF	从NT(ATG)开始	至NT	5’NEG ORF	159AA	6388	6865
3’NEG ORF	162AA	6722	7258	5’NEG ORF	159AA	6388	6865
3’NEG ORF	162AA	6722	7258	NORF-F1/R1	3’	7107	7259
NORF-F4/R1	3’	6900	7259	NORF-F1/R1	3’	7107	7259
NORF-F4/R1	3’	6900	7259	NORF-F4/KR2	3’	6901	7172
NORF-F2/R1	3’	6744	7259	NORF-F4/KR2	3’	6901	7172
NORF-F2/R1	3’	6744	7259	NORF-KF2/R4	5’	6684	6865
NORF-KF1/R2	5’	6881	6742	NORF-KF2/R4	5’	6684	6865
NORF-KF1/R2	5’	6881	6742	NORF-F3/R2	5’	6389	6742
NORF-F2/R3	3’	6744	6899	NORF-F3/R2	5’	6389	6742
NORF-F2/R3	3’	6744	6899	K3P-KF2/KR1	5’3’	66846744	67726791

表的开始2列确定了以SEQ ID NO：14互补链为标准的NS2区5’和3’负链ORF的位置。其余的列示由所有9个克隆表达的特异性核苷酸序列。注意到一些克隆表达的特异性核苷酸序列。注意到一些克隆表达位于5’至PRF假设的HGV起始甲硫氨酸的氨基酸。还注意到所列的最后克隆K3P-KF2/KR1为表达ORF5’的所指部分以及接着的ORF3’的所指部分的嵌合体。

接着将所有DNA片段克隆至pGEX-Nde中。还鉴定和证实了所含的插入片段克隆。

5.NS5A克隆

表24列出了大量NS5a克隆以及它们对应于SEQ ID NO：14的区。

表24

名称	HGV来源	起始	终止
名称	HGV来源	起始	终止	EXY10-F2	PNF	6416	6827
EXY10-F3	PNF	6537	6827	EXY10-F2	PNF	6416	6827
EXY10-F3	PNF	6537	6827	Q11-F1-R1	T56633	6537	6680
Q11-F1-R2	T56633	6537	6827	Q11-F1-R1	T56633	6537	6680
Q11-F1-R2	T56633	6537	6827	Q11-F2-R1	T56633	6576	6680
Q11-F2-R2	T56633	6576	6827	Q11-F2-R1	T56633	6576	6680
Q11-F2-R2	T56633	6576	6827	Y5-12	PNF	6633	6917
EXY12	PNF	6918	6977	Y5-12	PNF	6633	6917
EXY12	PNF	6918	6977	EXY10F14	PNF	6822	6977

将这些序列克隆至用于被编码的蛋白质抗原的表达的载体pGEX-Nde。

B.被选择的HGV亚克隆的Western印迹分析

为了确定上面描述的负链和正链结构的活性，基本上如实施例13B中所描述，从表达各种HGV亚克隆的细菌制备全部细胞溶胞产物。接着通过SDS-PAGE将表达蛋白质等分试样分级分离，将蛋白质转移至硝酸纤维素滤膜上，用HGV阳性或对照血清(如抗sj 26MAB RM01)检测滤膜。将印迹与适宜的报告抗体一起保温。

根据被试验的HGV蛋白质，用HGV血清J21689和T56633检测与蛋白质NORF-F3/R2清晰的免疫反应性。NORF-F3/R2亚克隆表达还由负链表位克隆的Q9序列编码的氨基酸序列。观察到的与HGV血清T56633强的反应性证实了HGV负链的这个区的免疫反应性。没有观察到NORF-F3/R2蛋白质与HGV阴性个体R04316的血清或被测试的任何其它5种HGV阴性极正常血清的反应。

另外的印迹表明表达5’负链ORF的一半所在的羧基末端的氨基酸的其它主要的5’ORF克隆NORF KF2-R4不与HGV阳性血清T56633反应。

这个观察结果与上述Q9表位克隆的位置结合表明负链这部分的免疫原性表位被包含在上面描述的55个氨基酸中(SEQ ID NO：273)。这序列被包括J21689的其它HGV抗血清识别的事实表明在HGV感染的个体中对这个序列的免疫反应性是比较普遍的。

另外，在具有Y12-10-3蛋白质时，观察到了清晰的与HGV感染血清J21689，J29374和E57963的免疫反应性。这种反应的特异性还被在不存在通过IPTG诱导的Y12-10-3蛋白质表达的情况下，没有观察到与HGV抗血清J29374或E57963的免疫反应性而得到支持。用7种试验的极正常血清，没有观察到与Y12-10-3发生反应。

实施例15

多抗原HGV诊断分析

虽然上述表位克隆看起来不与所有的HGV PCR阳性血清反应，但许多克隆与大部分被再检测的HGV感染血清反应。这些蛋白质不另外显示与HGV阴性血清的真正交叉反应性。因此可以设计一种诊断分析法，将其中几个这种蛋白质混合，这样将各自的蛋白质反应性加起来。这种分析被期望对检测HGV阳性血清具有相对高的灵敏性，对HGV阴性血清具有相对低的背景反应性。

用于这种分析中的一般表位/抗原包括，但不局限于：NORF-F3/R2(NS2-Neg链)，Y12-10-3(NS3)，Q11-F2-R1(NS5a)，Y5-10(NS5a)，Y5-5(NS5a)，Q11-F2-R2(结合2个NS5a表位)。

对于这种分析，一般选择含有识别HGV阳性血清不同亚组(Subset)的不同唯一的表位的各个抗原。另外，该抗原一般不与HGV阳性血清明显反应。按照本发明的指示，可分离另外有用的免疫原性克隆。

多抗原诊断分析可采取多种形式。在一个实施方案中，分析可能需要固定化的各种例如5个HGV蛋白质和位于硝酸纤维素条或其它常规固相形式各分离位置上的对照蛋白质。另外，例如HGV融合蛋白质的非病毒部分可通过插入或缺失被修饰，这样它们将自然地迁移至SDS PAGE和随后的Western印迹分析中容易辨认的位置。接着将条保温在试验血清中。检验结合的抗体后，血清可根据(i)与之发生免疫发生的抗原的编号和(ii)免疫反应的强度来计分。与非HGV蛋白质的反应性将提供不典型的血清。与非HGV蛋白质的反应性将血清分为HGV阴性。

可通过混合单一反应区带的纯化抗原蛋白质或通过形成表达2或多个作为简单蛋白质(如HGV镶嵌型多肽)的反应表位的蛋白质构建物而形成基于ELISA的分析。本文描述了构建镶嵌型多肽的方法。上述的Q11-F2-R2构建物实际上代表编码单多肽链上的2个独立表位的“基质蛋白质”(“matrix protein”)。Western印迹分析可作为该ELISA筛选试验的证明。

备选或另外的，可将全长HGV蛋白质，如E2，NS5a和NS3置于单一反应区带中。与这些蛋白质反应的血清也可通过Western印迹分析被证实为HGV阳性。

实施例16

大的HGV多肽的表达

A.大肠杆菌中较大HGV多肽的表达

1.克隆和表达

为了识别形成的HGV表位(没有被小的重叠HGV构建物或噬菌体文库筛选包括)，在基于推判的酶切位点(Bazan等，1989；Chamber，等，1990b；Grakoui等，1993；Kyte and Doolittle，1982)的pET-21a(+)载体(Novagen，WI)中产生较大的HGV蛋白质构建物。各HGV蛋白质构建物以与克隆至pGEX载体中的HGV序列类似的形式产生。

简而言之，选择的HGV序列为从HGV(+)人血清来源使用HGV序列特异性引物扩增的RT-PCR。引物被设计成含有用于pET载体中克隆操作的适宜的限制性位点。感兴趣的编码序列一般被插入到载体的EcoRI位点和HindIII位点之间以产生与T7.Tag前导序物的5’框内融合和与六聚体组氨酸序列的3’框内融合。T7.Tag(11个氨基酸序列)使融合蛋白质的检测可使用抗-T7.Tag单克隆抗体(Novagen，WI)。在融合蛋白质羧基端的组氨酸六聚体使得蛋白质的纯化可使用固定化的金属离子亲和层析。将HGV片段适当地连接至酶解的pET-21a(+)载体中。将连接产物转化至感受态大肠杆菌中(HMS174；Novagen，WI)。来自转化HMS174的质粒DNA通过使用与插入分子旁侧的pET-21a(+)载体序列同源的引物T7F(SEQ ID NO：157)和T7R(SEQ ID NO：158)的PCR被用来分析HGV序列的存在。PCR产物的大小为插入片段大小加上从载体产生的约260bp。

对于每一构建物，PCR结果证实了插入序列的存在。选择带有适宜插入片段的转化体，制备带有HGV插入片段的质粒DNA，并引入用于HGV蛋白质表达的HMS174(DE3)感受态大肠杆菌中。

用1mM IPTG诱导HGV蛋白质的表达。通过在考马斯兰染色的凝胶上的推判大小的蛋白质的出现监测T7.Tag融合蛋白质的表达。通过使用抗T7.Tag抗体的Western印迹分析(Novagen，WI)来证明融合蛋白质的表达。pET-21a(+)载体表达的HGV蛋白质示表25中。表达蛋白质的起始点和终止点以SEQ ID NO：14为标准给出。GE-Cap的氨基酸序列示于SEQ ID NO：185中。

表25

名称	结构域	血清来源	起始	终止	HGV aa	大小(KDa)
名称	结构域	血清来源	起始	终止	HGV aa	大小(KDa)	GE-Cap	壳体	T55806	271^*	480^*	70	11
GE-E1a	E1	PNF	594	1148	185	24	GE-Cap	壳体	T55806	271^*	480^*	70	11
GE-E1a	E1	PNF	594	1148	185	24	GE-E2	E2/NS1	PNF	1149	2183	345	41
GE-NS2b	NS2b	PNF	2904	3254	117	16	GE-E2	E2/NS1	PNF	1149	2183	345	41
GE-NS2b	NS2b	PNF	2904	3254	117	16	GE-NS3	NS3	PNF	3255	5081	609	70
GE-NS4a	NS4a	PNF	5082	6083	334	40	GE-NS3	NS3	PNF	3255	5081	609	70
GE-NS4a	NS4a	PNF	5082	6083	334	40	GE-NS4b	NS4b	PNF	6084	6536	151	20
GE-NS4	NS4	PNF	5082	6536	485	57	GE-NS4b	NS4b	PNF	6084	6536	151	20
GE-NS4	NS4	PNF	5082	6536	485	57	GE-NS5a	NS5a	PNF	6537	7529	311	39
GE-NS5b	NS5b	PNF	7530	9044	505	59	GE-NS5a	NS5a	PNF	6537	7529	311	39

^*这些序列以SEQ ID NO：178为标准给出。

图12显示通过使用T7.Tag单克隆抗体的Western印迹分析证实的各个HGV蛋白质的表达。图12中的泳道如下：泳道1，事先染色的分子量标准(Bio-Rad)；泳道2，未诱导的GE-Cap溶菌产物；泳道3-11，分别为IPTG诱导的GE-Cap，Ela，E2，NS2b，NS3，NS4a，NS4b，NS4和NS5b的溶菌产物。泳道12含有1μg纯化的NS5a。每个抗原的位置用箭头标记，如图12所示，HGV蛋白质在大肠杆菌中表达。

2.pET载体中表达的HGV蛋白质的Western印迹分析

如实施例11C所述，使用大肠杆菌全细胞溶菌产物和被预吸收的血清进行在pET载体表达的HGV蛋白质的Western印迹。分析结果表明，一些pET HGV蛋白质特异性地与HGV阳性血清发生免疫反应，但不与HGV阴性血清发生免疫反应，GE-NS2b-1蛋白质与J21689血清发生免疫反应。在Western印迹分析中，GE-NS5a-3蛋白质与一些HGV(+)血清发生免疫反应，包括JC，T55806，T56633，J21689，E57963和R0001。在这些血清中T55806，J21689和E57963为HCV共阳性(通过PCR分析)。GE-NS2b-1和GE-NS5a-3都不与一些试验的HGV阴性血清发生免疫反应。

图10A-10F显示考查抗原GE-NS2b和GE-NS5a3的反应性的Western印迹实验的一系列典型结果。图10A-10F的每一印迹中的泳道如下：泳道1，未诱导的GE-NS2b溶菌产物；泳道2，IPTG诱导的GE-NS2b溶菌产物；泳道3，未诱导的GE-NS5a溶菌产物；和泳道4，IPTG诱导的GE-NS5a溶菌产物。将每个印迹与人血清或鼠单克隆抗体一起保温：图10A，J29374；图10B，J21689；图10C，T56633；图10D，T43608(极正常血清)；图10E，抗T7.Tag；和图10F，考马斯染色凝胶。所用的血清或单克隆抗体在每个印迹上指明。人血清以1∶100稀释，抗T7.Tag鼠单克隆抗体以1∶1000稀释。

除开上面所列的血清，用GE-NS5a筛选另外的HGV PCR阳性血清。这些分析结果证实了GE-NS5a抗原与多HGV感染的血清的反应性。GE-NS5b与HGV(+)血清JC发生免疫反应，但T55806不与试验的HGV(+)阴性血清发生免疫反应。图13A-13E显示一系列考查抗原GE-NS5b的反应性的Western印迹实验的结果。每个印迹图中的泳道如下：泳道1，预染色的分子量标准(Bio-Rad)；泳道2，未诱导的GE-NS5b溶菌产物；泳道3，IPTG诱导的GE-NS5b溶菌产物。

将各印迹与人血清或小鼠单克隆抗体一起保温：图13A，抗T7.Tqg单克隆抗体；图13B，JC；图13C，T55806；和图13D，T43608(极正常血清)。图13E为考马斯兰染色。

图14A到14D显示一系列考查抗原GE-E2反应性的Western印迹实验的结果。图14A-14D中的每一个中的泳道如下：泳道1，预染色的分子量标记(Bio-Rad)；泳道2，未诱导的GE-E2溶菌产物；泳道3，IPTG诱导的GE-E2溶菌产物。将各印迹与人血清或小鼠单克隆抗体一起保温：图14A，抗T7.Tqg单克隆抗体；图14B，3831781；和图14C，T43608(极正常血清)。图14D为考马斯兰染色。使用的血清或单克隆抗体在各印迹上指明。GE-E2蛋白质与HGV阳性血清3831781，但不与极正常血清T43608发生免疫反应(分别为图14B和14C)。

抗原GE-Cap和GE-NS4a也与HGV(+)血清J21689特异性地发生免疫反应。

B. 在昆虫细胞中较大HGV抗原的表达

使用重组杆状病毒的蛋白质表达提供了以下优点(i)高水平的重组蛋白质表达，和(ii)高等真核体系的好处，包括有效的蛋白质移位和修饰。这个体系尤其有利用于移位蛋白质的表达，如HGV E1，E2和NS2a。

1. 克隆和表达

草地贪夜蛾(Spodoptera frugiperada)昆虫细胞培养物sf21和苜蓿银纹夜蛾(Aufografa californica)核多角体病毒“BACULOGOLD”(Pharmingen，San Diego，CA)的衍生物被用于HGV多肽的表达。已有的方案被用于昆虫细胞培养和通过用线性化的杆状病毒DNA(King，1992)共转染杆状病毒质粒转化载体产生重组杆状病毒。用常规技术构建杆状病毒质粒转移载体(Maniatis，等，Sambrook，等)。

杆状病毒转化载体pAcYM1(King，等，1992)被通过将编码组氨酸六聚体的双链寡核苷酸连接到载体的BamHI编码位点(载体称为pAcYMIH)而修饰。终止密码子(TAA)被放在组氨酸六聚体序列之后。这样在表达蛋白质的羧基末端提供了一个组氨酸六聚体。在pAcYMIH中，pAcYMI亲代载体的BamHI克隆位点仍保持完整，并可被用于克隆框内具有组氨酸六聚体的各种基因。组氨酸六聚体提供了一快速有效的纯化表达蛋白质的方法(Janknecht，等，1991)。

第二个杆状病毒转化载体pVT-Bac也用类似方式修饰以提供一个位于表达蛋白质羧基端的组氨酸六聚体。pVT-Bac象pAcYMI一样含有一个强的后期多角体蛋白启动子。另外，pVT-Bac还提供了一个强的昆虫移位信号序列以保证表达蛋白质的有效移位(Tessier，等，1991)。pVT-Bac载体通过将编码一个组氨酸六聚体的双链寡核苷酸连接到载体的BamHI克隆位点(产生pVT-BacH载体)而被修饰。在得到的pVT-BacH载体中pVT-Bac亲代载体的BamHI克隆位点保持完整，可被用于克隆框内具有昆虫前导序列和组氨酸六聚体序列的基因。

通过逆转录PCR获得编码各种HGV基因的DNA片段。根据推判的酶切位点(Bazan，等，1989；Chambers，等，1990b；Grakoui，等，1993；Kyte and Doolittle，1982)选择HGV基因组的区。下面引物对被用在使用PNF2161来源的核酸的RT-PCR扩增反应。E1，SEQ ID NO：242，SEQ ID NO：243；E2B(HGV信号序列)，SEQ ID NO：244，SEQ ID NO：245；E2C(昆虫信号序列)，SEQ ID NO：246，SEQ ID NO：247；NS2a，SEQID NO：248，SEQ ID NO：249；NS2b，SEQ ID NO：250，SEQ ID NO：251；NS3，SEQ ID NO：252，SEQ IDNO：253；NS4a，SEQ ID NO：254，SEQ ID NO：255；NS4b，SEQ ID NO：256，SEQ ID NO：257；NS5a，SEQID NO：258，SEQ ID NO：259；NS5b，SEQ ID NO：260，SEQ ID NO：261；和E1-E2-NS2a，SEQ ID NO：262，SEQ ID NO：262。

将扩增的DNA片段用BamHI或BglII核酸内切酶酶解，并克隆至BamHI切口的pAcYMI，pAcYMIH，pVT-Bac或pVT-BacH载体中。将编码E1和E2羧基末端的锚式(anchor)序列以及NS5b羧基末端水性序列缺失以便于后面的蛋白质纯化。

将含有HGV序列的重组杆状病毒质粒转移载体用线性化的杆状病毒DNA共转染，在X-gal(King，等，1992)存在下，选择为白色中心点的重组病毒。将重组病毒两次用噬菌斑纯化和并让其繁殖。在重复性(multiplicity)为5p.f.u/细胞时将单层sf21细胞用重组杆状病毒感染，在27℃下保温60小时。将细胞用PBS洗涤，用TNN缓冲液(50mM Tris-HCl，pH8.0，150mM NaCl，0.5％“NONIDET-P40”)溶解。通过以14K将细胞样品离心5分钟分离包涵体。将包涵体重新悬浮在蛋白质解离缓冲液中(10％2-巯基乙醇)，10％SDS，25％甘油，10mM Tris-HCl pH6.8，0.02％溴酚兰)，在100℃下保温10分钟。

通过SDS-PAGE分析蛋白质表达类型。将蛋白质用0.1％SDS-18％PAGE分离，用考马斯兰染色。大多数HGV蛋白质以高水平表达，可容易地在考马斯兰染色凝胶上检测。NS5a和NS2a多肽用³⁵S甲硫氨酸蛋白质标记而被检测(King等，1992)。

如下考查HGV E2蛋白质糖基化作用。将sf21细胞用重组杆状病毒感染，并按如上所述处理。通过0.1％SDS-12％PAGT分离蛋白质，将其电印迹至“IMMOBILON-P”膜上(Millipore，Bedford，MA)上，并与甘露糖残基特异性的雪花莲凝集素反应(Galanthus nivalisagglutinin)反应(Boehringer Mannheim DIG Glucan分化试剂盒)。用自身信息序列表达的HGV E2蛋白质被大范围地糖基化，这说明推断的E2信号序列可起如此的作用。

2. 免疫荧光测定分析

用如上所述的杆状病毒构建物感染SF21昆虫细胞。收集细胞，以1.5K rpm的转速离心3分钟，以1×PBS洗涤，再离心。

为了免疫荧光分析(IFA)(King，等，1992)，将细胞重新悬浮于PBS中，铺至载玻片的孔中，使细胞在载玻片的孔中形成亚汇合层。空气干燥载片。将细胞用预冷却至-70℃的丙酮固定10分钟，用PBS再水合5分钟。吸过过量的PBS。将固定的细胞用下面“封闭”缓冲液处理1小时：40mM Tris-HCl pH7.5，3％山羊血清，1％BSA，1％脱脂奶粉和0.1％明胶。

接着将一抗加入到固定的细胞中。一抗包括一系列人HGV阳性血清和阳性对照单克隆抗体。在使用前，用昆虫细胞溶胞产物预吸收血清以除去非特异性蛋白质。在4℃下，将预吸收过夜。未感染的SF21被用作阴性对照。在加入选择性的一抗(血清)后，将载片保温2小时，接着用PBS洗涤几次，除去过量缓冲液。接着将结合了荧光素的二抗(0.5μg/ml浓度)加入至载片上的样品中。二抗的保温时间和温度与一抗的相同。保温后，将载片用PBS洗涤，盖上盖玻片，接着使用荧光显微镜确定细胞的荧光。

分析结果如下。表达HGV抗原E1-E2-NS2a的细胞与4/10HGV阳性血清发生免疫反应，与另外的2/10血清发生轻微的免疫反应。表达E1的细胞与1/10血清发生轻微的免疫反应。表达E2的细胞与3/10血清发生免疫反应，与1/10血清发生轻微免疫反应。带有HGV抗原的细胞不与极正常的对照血清发生免疫反应。

3. 杆状载体中表达的HGV蛋白质的Western印迹分析

还对在被重组杆状病毒感染的sf21昆虫细胞中表达的HGV蛋白质进行Western印迹分析。如上所述制备包涵体，将其进行Western印迹分析。用预吸收血清进行Western印迹分析。分析结果证明E2蛋白质(具有内源HGV信号序列的一个变异体E2B，带有昆虫信号序列的第二个变异体E2C)特异性地与HGV(+)血清383178发生免疫反应。

图15A-15D显示考查杆状抗原E2B和E2C的反应性的一系列Western印迹实验的结果。图15A-15D的各个印迹中的泳道如下：泳道1，预先染色的分子量标准(Bio-Rad)；泳道2，E2B溶菌产物；泳道3，E2C溶菌产物；泳道4，β-半乳糖苷酶溶菌产物。各印迹与人或兔血清保温：图15A，兔抗E2抗体；图15B，3831781(HGV PCR-阳性血清)；图15C，3838857(HGV阴性血清)。图15D考马斯兰染色。使用的血清或兔抗体在各印迹上指明。人血清以1∶100稀释，兔血清以1∶1000稀释。

另外，在昆虫细胞中表达的HGV抗原NS2b蛋白质与J21689发生免疫反应。这些结果与用pET表达的HGV蛋白质所获得的结果一致。

C. 较大抗原在痘苗中的表达

1. 克隆和表达

将HGV基因组的各区整合到用于表达的痘苗病毒基因组中。一般性的HGV多肽表达策略在图16中所出。通过表明推断蛋白质区的开放框画出全部长度的多蛋白(没有按比例)：C＝强碱性的蛋白质，4A＝NS4A，4B＝NS4B，5a＝NS5A，5b＝NS5B。带有核苷酸定位(在多蛋白质下)的各个框代表用于痘苗病毒表达的典型HGV区。框中的数字代表重组病毒的名称。病毒#1由HGV Stain T55806的强碱性蛋白质区产生(SEQ ID NO：185)。

产生两组重组病毒。第一组含有相当于HGV cDNA序列分析基础上的各个蛋白质结构域的HGV序列(图16，片段#1-#9)。第二组含有横跨多个蛋白质结构域长达HGV基因组全长的HGV序列(图16，#10，#11，#14)。

将HGV基因组的各区克隆至痘苗表达载体的多克隆位点。将包括细菌噬菌体T7体系和大肠杆菌乳糖酵解基因阻遏物的重组痘苗病毒表达系统用于高水平的诱导表达(Fuerst，1986；Zlrog-Stein，1989；Alexander，1992；Moss等)。因此重组蛋白质仅在存在诱导物如异丙基β-D-硫代半乳糖苷(IPTG)时表达。直接克隆和PCR被用于质粒构建。在后者，适于克隆至痘苗病毒中的限制性内切酶位点被掺入用来扩增各DNA片段的引物中。

多组氨酸标记也被掺入每一个覆盖HGV各结构域的克隆中，以用于表达蛋白质的纯化。将HGV-PCR扩增产物用适当的限制性内切酶酶解，并连接至痘苗载体上。通过同源重组和药物选择(霉酚酸)，将靶HGV cDNA片段整合到疫苗病毒基因组中(Falkner，1988，Earl，1991)。在产生病毒储液之前，将重组病毒用噬菌斑纯化4次。

每一克隆的核苷酸长度表示在图16中。较小的克隆组(#1-#9)可用于HGV表位酶谱分析(mapping)。较大克隆(如#10，#11和#14)也可用于实验酶谱分析HGV多蛋白质酶切位点。除图16所示的克隆外，可构建覆盖从NS3-NS5b的多个结构域的另外的重组病毒。

将表达质粒转染至用亲代痘苗病毒感染的哺乳动物细胞中。CV-1和BS-C-1细胞存活于补加了10％胎牛血清的基本必需培养基(MZM)。将细胞用于转染(CV-1)，重组病毒的选择以及繁殖中(BS-C-1)。

2. 评价重组蛋白质表达

在存在或不存在IPTG的情况下，将BS-C-1细胞用重组病毒感染7小时，以后将细胞用³⁵S-甲硫氨酸标记1小时(Zhang，1991)。简单地说，将1×10⁶BS-C-1细胞用感染复度(multiplicity ofinfection)(MOL)为10个噬菌斑形成单位(PFU)/细胞的重组病毒感染1小时，在存在或不存在5mM IPTG的情况下，补加培养基继续感染6小时。在存在或不存在5mM IPTG的情况下，将细胞用600μl没有甲硫氨酸，补加了2.5％透析过的胎牛血清，加上60μci ³⁵S-甲硫氨酸(“TRAN³⁵S-标记”ICN，Costa Mesa，CA)的培养基脉冲标记6小时。在存在100mM Tris pH8.0，150mM NaCl和1％“TRITON X-100”的情况下，在冰中将被标记的细胞溶解10分钟。将核离心沉淀，收集上清液用于分析。

通过SDS-聚丙烯酰胺凝胶电泳分析细胞溶胞产物(Fling，1986；Schagger，1987)。将凝胶用荧光自显影溶液“AMPLIFY”(Amersham，Arlington Heights，IL)处理之前，将其用50％甲醇和10％乙酸固定，干燥凝胶，将其暴露于X-射线胶片中。

运用这种方法已证实了由含有插入片段#4-#11以及#14(图16)的病毒进行的HGV多肽的表达。以类似方式证实了对应于其它区域的多肽的表达。例如，在NS5a构建物中，由IPTG诱导下，产生了迁移至46KDa蛋白质标准之下的独特的多肽。这种蛋白质在不存在IPTG的感染中没有见到，这证实了该蛋白质与NS5a重组蛋白质的一致性。

另外，使用抗来自于各病毒感染体的³⁵S-甲硫氨酸标记的细胞溶胞产物的HGV区域特异性的抗血清(例如用来抗来自感兴趣区的分离HGV多肽的兔抗血清)进行限制性免疫沉淀来评价重组病毒的蛋白质表达。例如，已证实NS2，NS3，NS4B，NS5A和NS5B的表达。另一种评价重组蛋白质表达的方法是用HGV-区域特异性抗血清进行Western印迹分析。

当全长HGV多蛋白质在#14病毒中表达时(图16)，使用HGV区域特异性抗血清进行免疫沉淀检测NS2，NS3和NS5的加工产物，证明了全长HGV克隆在评价多蛋白质加工中的有用性。

使用类似于图16所示的表达策略，选择性的HGV蛋白质/抗原可在酵母或CHO细胞中表达。酵母提供了高水平的表达，经济的操作并易于扩大至商业生产。CHO细胞系可使重组蛋白质分泌到用于大规模蛋白质生产和有用分离，例如用于疫苗生产的生长培养基中。

实施例17

HGV编码的高度碱性(Basic)蛋白质

A.用于来自PNF和T55806的HGV转译起始的甲硫氨酸的确定。

位于HGV-PVF2161变异体的核苷酸(nt)459(以SEQ IDNO：14为标准)的甲硫氨酸在多蛋白质的框中。“壳体”区为32个氨基酸长度。在其它HGV分离株中，如T55806，这个区更长(例如约83个氨基酸)位于HGV-PNF2161变异体的核苷酸349(以SEQ IDNO：14为标准)的甲硫氨酸不在多蛋白质序列的框中，但在HGV-T55806变异体的相同位置的甲硫氨酸在多蛋白质的框中。为了检查是否在HGV-PNF2161的这个位置存在连续(read-through)或核苷体框移位，现进行下面实验。

制备构建物含有(i)具有HGV E1区上游的所有MET密码子的HGV基因组序列(如在HGV-PNF2161中，存在6个这种METs，在T55806中存在5个)，(ii)对于每个构建物，两个不同的3’末端，使得可以确定是否发生了连续的核糖体移位。对于给定的基因组DNA，如两个转译产物大小相同，这意味着在终止密码子处被超前终止。另一方面，如果发生连续或框移位，预计得到两个有55个氨基酸不同的产物。

在pGEX载体中，总共21个含有来自变异体HGV-PNF2161和HGV-T55806的序列的构建物被亚克隆，在大肠杆菌中相应的蛋白质被表达。得到的转译产物的大小通过考马斯兰染色的凝胶和用单克隆抗GST抗体印迹的Western印迹法确定。诱导和未诱导的样品被制备用于每一个构建物。

结果证明蛋白质产物的大小与通过在多蛋白质框中的第一个甲硫氨酸起始的转译所预想的一致。没有框移位或连续的证据。

B.另外编码的强碱性蛋白质

Fickett(1992)的方法被用来筛选基因组序列HGV-PNF2161和HGV-JC以得到可能编码蛋白质的序列(i)前面描述的多蛋白质的替代，(ii)在HGV-PNF2161和HGV-JC之间显示出保守性，以及(iii)在pH大于10时，具有预计的等电点。识别了两种这样的可能蛋白质。

第一个蛋白质在HGV PNF2161中由残基628-882(以SEQ IDNO：14为标准)编码，在HGV-JC中由残基556-810(以SEQ IDNO：182为标准)编码。该蛋白质为85个氨基酸长度，大于HFC94-1与JC9B之间的75％的同源性，预计pI为11.6-12.3。

第二个蛋白质在HGV-PNF2161(以SEQ ID NO：14为标准)由残基6844-7125编码，在HGV-JC中由6772-7053编码。该蛋白质为94个氨基酸长度，大于HGV-PNF2161和HGV-JC之间的88％的同源性，预计pI为12.4-12.7。

这两个典型的蛋白质代表可能表达的强碱性的HGV蛋白质。

实施例18

克隆另外的HGV分离株和设计诊断引物

A.构建HGV-PNF2161的cDNA克隆

通过将三个重叠PCR产物克隆至质粒载体pGEM3Z中构建来自PNF2161的几乎为全长的HGV基因组的cDNA克隆(Promega，Madison，WI)。用于构建的PCR产物通过使用“SUPERSCRIPT II”(Gibco/BRL，Gaithersburg，MD)的逆转录，接着使用长靶序列扩增允许的反应条件进行PCR(“rTth-XL”聚合酶和“XL PCR BUFFERS”，Applied Biosystems，Foster City，CA)而获得。用于“大范围”PCR反应的rTth酶具有校正错误掺入的核苷酸的校读活性(即3’-5’外切核酸酶的活性)，因此提供了高可靠性的PCR。

用于构建HGV基因组的三个产物包括(i)使用引物GV75-36FE(SEQ ID NO：228)和GV75-7064 RLE(SEQ ID NO：229)扩增的内在6.7kbp产物(SEQ ID NO：14的核苷酸2101-8834)；(ii)使用28F(SEQ ID NO：230)和FV94-2864R(SEQ IDNO：231)扩增的2.8kb5’-末端产物(SEQ ID NO：14的核苷酸38-2899)；和(iii)使用FV94-6439F(SEQ ID NO：232)和FV94-9331R(SEQ ID NO：233)扩增的2.9kb3’-末端产物(SEQ ID NO：14的核苷酸6449-9366)。

首先，将6.7kb内在片段克隆至“TA-载体”pCRII中以产生克隆HGV7。接着，从HGV7中取出6.1kb KpnI/EcoRI片段，将其与用KpnI/XbaI酶解的2.8kb5’-末端产物混合(引物28F含有人工XbaI位点)，并克隆至XbaI/EcoRI酶解的pGEM3Z中。该8.8kb克隆，缺乏HGV基因组的3’部分的约0.6kb，被称为HGV-KEX-2。为了构建几乎为全长的HGV基因组，将3’-末端HGV产物用NheI和EcoRI酶解(引物FV94-9331R含有人工EcoRI位点)，并克隆至NheI/EcoRI酶解的HGV-KEX-2质粒中，产生一个为9329个核苷酸的克隆HGV-PNF2161序列(SEQ ID NO：14的核苷酸38-9366)，该克隆被称为3Z-HGV94-6，3Z-HGV94-6的互补序列列为SEQ ID NO：234。

克隆3Z-HGV94-6可被用于产生体外转录全长HGV RNA或它的一部分(例如使用SP6聚合酶)。该RNA分子可被用于转染人细胞系。这个方法可被用于对病毒基因组各区的酶谱分析，研究它的复制，了解人细胞HGV致病性的机理(Rice等，1989；Sumiyoshi，等，1992；Yoo，，增995)。

B.克隆JC变异体

在40,000rpm下将1ml JC血清离心2小时(Beckman，SpincoRotor70.1Ti)。用“TRI-REAGENT”(MRC，Cincinnati，OH)提取得到的沉淀物，产生3个相。上面的相仅含RNA。获取该相，通过乙醇沉淀回收RNA。

通过两种方法从JC样品中产生HGV cDNA分子。第一种方法是通过特异性的巢居引物的JC核酸样品的扩增(RT-PCR)。引物序列以从PNF2161血清获得的HGV序列为基础。选择引物的标准为(i)具有高G/C含量的区，和(ii)没有重复序列。

用于产生HGV cDNA分子的第二个方法是使用HGV(PNF2161)特异性引物扩增，接着用³²P-标记的寡核苷酸探针对HGV特异性序列进行识别。基本上如Sambrook等，(1988)所描述进行DNA杂交。PCR产生的克隆被(i)克隆至“TA”载体上(Invitrogen，SanDiggo，CA)，并用载体引物(TAP和TAF)测序，或(ii)PCR扩增后直接测序。探针和引物的序列以从PNF2161血清获得的HGV变异体为基础。

这两种方法产生了来自于JC血清的多重叠HGV片段。每一片段均被克隆和测序。序列以获得列为SEQ ID NO：182(多肽序列，SEQID NO：183)的HGV(JC-变异体)的共有序列。HGV(JC-变异体)病毒的各区的序列以来自至少三个不同的重叠独立的克隆的共有序列为基础。

C.其它HGV变异体

除开HGV PNF2161-变异体和JC-变异体序列，通过类似上面所述的方法，已从血清BG34，T55806和EB20中获得三个独立的HGV分离株。这些分离株的部分序列被列为SEQ ID NO：176(BG34核酸)，SEQ ID NO：177(BG34多肽)，SEQ ID NO：178(T55806核酸)，SEQ ID NO：179(T55806多肽)，SEQ IDNO：180(EB20-2核酸)和SEQ ID NO：181(EB20-23多肽)。

D.诊断性PCR用的选择性引物

PCR引物和相应分析方法的设计可一般以对保守区的分析为基础从HGV组的区产生。根据HGV-JC变异体与HGV-PNF-2161变异体的比较，HGV的5’非转译区被选择作为这样的区，用于设计其它检测HGV分离株的基于PCR的诊断试验。两个典型的引物为FV-94-22F(SEQ ID NO：124)和FV94-724R(SEQ ID NO：125)。这些引物扩增HGV基因约为728bp的片段。

对来自采用两个用于36个HGV分离株的引物的反应的扩增产物进行序列分析(包括PNF2161和JC，见表26)。

约728个碱基对的扩增产物的约400个碱基对的区域(SEQ IDNO：14的核苷酸69-469)被用于多次序列校准(表26)以及保守区的进一步确定(见下表)。

表26

SEQ ID NO：	血清编号	国家	％ID PNF2161
SEQ ID NO：	血清编号	国家	％ID PNF2161	186	S59	英国	96.8
187	S368	英国	98.8	186	S59	英国	96.8
187	S368	英国	98.8	188	S309	英国	95.5
189	FZ	澳大利亚	96	188	S309	英国	95.5
189	FZ	澳大利亚	96	190	G21	希腊	97.8
191	G23	希腊	94.3	190	G21	希腊	97.8
191	G23	希腊	94.3	192	G59	希腊	93.6
193	E36	埃及	94	192	G59	希腊	93.6
193	E36	埃及	94	194	R38730	美国	94.8
195	G281	希腊	97.8	194	R38730	美国	94.8
195	G281	希腊	97.8	196	G157	希腊	94.3
197	G154	希腊	96	196	G157	希腊	94.3
197	G154	希腊	96	198	G213	希腊	94.8
199	G204	希腊	98.3	198	G213	希腊	94.8

SEQ ID NO：	血清编号	国家	％ID PNF2161
SEQ ID NO：	血清编号	国家	％ID PNF2161	200	G191	希腊	94.8
201	G299	希腊	94.8	200	G191	希腊	94.8
201	G299	希腊	94.8	202	T56957	美国	95.3
203	C01698	美国	98.8	202	T56957	美国	95.3
203	C01698	美国	98.8	204	T27034	美国	93.5
205	E57963	美国	98.5	204	T27034	美国	93.5
205	E57963	美国	98.5	206	R37166	美国	97.5
207	B5	德国	95.5	206	R37166	美国	97.5
207	B5	德国	95.5	208	B33	德国	95.5
209	FH010	澳大利亚	95	208	B33	德国	95.5
209	FH010	澳大利亚	95	210	PNF2161	美国	100
211	JC	美国	96.3	210	PNF2161	美国	100
211	JC	美国	96.3	212	7155	秘鲁	89.8
213	7244	秘鲁	89	212	7155	秘鲁	89.8
213	7244	秘鲁	89	214	K27	朝鲜	89.5
215	K30	朝鲜	89.5	214	K27	朝鲜	89.5
215	K30	朝鲜	89.5	216	T55875	美国	97.3
217	T56633	美国	93.5	216	T55875	美国	97.3
217	T56633	美国	93.5	218	EB20	埃及	94.1
219	T55806	美国	95.6	218	EB20	埃及	94.1
219	T55806	美国	95.6	220	BG34	希腊	94.8
221	BE12	埃及	95	220	BG34	希腊	94.8

用于样品中HGV分离体的检测的基于扩增(例如PCR)或基于探针的方法/分析法包括适宜引物/探针序列的选择。这种分析法的两个标准为对HGV序列低的模板敏感性和特异性。序列的校准(例如刚才所述的)可有助于引物/探针的选择和设计。

选择引物的一些标准如下：(i)在序列中引物对的正向和反向引物不能显著地互补；以及(ii)引物不应具有显著的自身互补性或可能形成二级结构。这些预防措施减少了引物二聚体和寡聚体产生的可能性。

引物可能最适宜于从在不同分离株中没有显示出变异的序列区来设计，但也可从较小同源性的区，通过在用于计算已知分离株趋异性的位置上掺入混合碱基或中性碱基例如肌苷的合成方法来设计。下面两组引物为可被用于设计检测HGV基因组的基于PCR的分析方法的引物的实例：正向引物SEQ ID NO：222，SEQ ID NO：223和SEQ IDNO：244；和反向引物SEQ ID NO：225，SEQ ID NO：226和SEQ ID NO：227。

在HGV诊断分析的设计中，可以采用引物的各种组合。引物的最佳的组合由实验确定，一般建议考虑分析方法的敏感性和特异性。这些考虑包括下面：(I)为了有效扩增和易于产物检测的长度为100-300bp的PCR产物；(ii)能重复检测至少10个拷贝的靶HGV的能力；和(iii)能重复检测大多数HGV变异体的能力。

另外，探针序列可用混合碱基和中性碱基合成法类似地设计和/或可以降低的严谨性被使用以检测大多数HGV变异体。

虽然已参考具体方法和实施方案描述了本发明，但应该理解在不背离本发明的情况下，可以作各种修改和变化。

序列表(1)一般的信息：(i)申请人：

(A)名称：Genelabs Technologies，Inc.

(B)街道：505Penobscot Drive

(C)城市：Redwood City

(D)州：CA

(E)国家：USA

(F)邮政编码：94063(ii)发明名称：庚型肝炎病毒和它的分子克隆(iii)序列数目：277(iv)通信地址：

(A)地址：Dehlinger & Associates

(B)街道：350Cambridge Ave.，Suite250

(C)城市：Palo Alto

(D)州：CA

(E)国家：USA

(F)邮编：94306(v)计算机可读形式：

(A)媒介类型：软磁盘

(B)计算机：IBM PC兼容

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，Version#1.25(vi)本申请数据：

(A)申请号：

(B)申请日：

(C)分类：(vii)优先申请数据：

(A)申请号：US08/389,886

(B)申请日：15-FEB-1995

(C)记录号：4600-0201.35 (vii)优先申请数据：

(A)申请号：US08/357,509

(B)申请日：16-DEC-1994

(C)记录号：4600-0201.34(vii)优先申请数据：

(A)申请号：US08/329,729

(B)申请日：26-OCT-1994

(C)记录号：4600-0201.33(vii)优先申请数据：

(A)申请号：US08/344,271

(B)申请日：23-NOV-1994

(C)记录号：4600-0202(vii)优先申请数据：

(A)申请号：US08/285,558

(B)申请日：03-AUG-1994

(C)记录号：4600-0201.30(vii)优先申请数据：

(A)申请号：US08/285,543

(B)申请日：03-AUG-1994

(C)记录号：4600-0201.32(vii)优先申请数据：

(A)申请号：US08/246,985

(B)申请日：20-MAY-1994

(C)记录号：4600-0201(viii)代理人的信息：

(A)姓名：Fabian，GaryR.

(B)登记号：33,875

(C)参考/记录号：4600-0201.41/G100PCT(ix)通讯的信息：

(A)电话：(415)324-0880

(B)传真：(415)324-0960(2)SEQ ID NO：1的信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：SISPA引物，拓扑链接头AB(xi)序列描述：SEQ ID NO：1：GGAATTCGCG GCCGCTCG 18(2)SEQ ID NO：2的信息：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：接头AB，底链(xi)序列描述：SEQ ID NO：2：CGAGCGGCCG CGAATTCCTT 20(2)SEQ ID NO：3的信息：(i)序列特征：

(A)长度：237个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：PNF2161克隆470-20-1(ix)特性：

(A)名称/关键词：

(B)位置：1..237(xi)序列描述：SEQ ID NO：3：GAA TTC GCG GCC GCT CGG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT 48Glu Phe Ala Ala Ala Arg Ala Val Ser Asp Ser Trp Met Thr Ser Asn1 5 l0 15GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC GGC GGG GTC 96Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val

20 25 30TTC TCA TCT GAG CTG CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA 144Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly

35 40 45GTA CGG GGG ATG TCT TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA 192Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro

50 55 60CAA AGA GAG GGT GTA CTG CAG TCC TCC ACG AGC GGC CGC GAA TTC 237Gln Arg Glu Gly Val Leu Gln Ser Ser Thr Ser Gly Arg Glu Phe65 70 75(2)SEQ ID NO：4的信息：(i)序列特征：

(A)长度：79个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：4：Glu Phe Ala Ala Ala Arg Ala Val Ser Asp Ser Trp Met Thr Ser Asn1 5 10 15Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val

20 25 30Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly

35 40 45Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro

50 55 60Gln Arg Glu Gly Val Leu Gln Ser Ser Thr Ser Gly Arg Glu Phe65 70 75(2)SEQ ID NO：5的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：HNV-R1(xi)序列描述：SEQ ID NO：5：GTTGACCAAC TGAGTCTGAA GC 22(2)SEQ ID NO：6的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无 (vi)原始来源：

(C)各分离株：HAV-F1(xi)序列描述：SEQ ID NO：6：GATTGGAAAT CTGATCCGTC CC 22(2)SEQ ID NO：7的信息：(i)序列特征：

(A)长度：19个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：HCV-LANR个体(xi)序列描述：SEQ ID NO：7：TCGCGACCCA ACACTACTC 19(2)SEQ ID NO：8的信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：HCV1532个体(xi)序列描述：SEQ ID NO：8：GGGGGCGACA CTCCACCA 18(2)SEQ ID NO：9的信息：(i)序列特征：

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：引物470-20-1-77F(xi)序列描述：SEQ ID NO：9：CTCTTTGTGG TAGTAGCCGA GAGAT 25(2)SEQ ID NO：10的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：引物470-20-1-211R(xi)序列描述：SEQ ID NO：10：CGAATGAGTC AGAGGACGGG GTAT 24(2)SEQ ID NO：11的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：引物KL-1(xi)序列描述：SEQ ID NO：11：GCAGGATCCG AATTCGCATC TAGAGAT 27(2)SEQ ID NO：12的信息：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：引物KL-2(xi)序列描述：SEQ ID NO：12：ATCTCTAGAT GCGAATTCGG ATCCTGCGA 29(2)SEQ ID NO：13的信息：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性 (ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：λgt11，反向引物(xi)序列描述：SEQ ID NO：13：GGCAGACATG GCCTGCCCGG 20(2)SEQ ID NO：14的信息：(i)序列特征：

(A)长度：9392个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知(ii)分子类型：cDNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：HGV-PNF2161变异体(ix)特性：

(A)名称/关键词：CDS

(B)位置：459..9077(xi)序列描述：SEQ ID NO：14：ACGTGGGGGA GTTGATCCCC CCCCCCCGGC ACTGGGTGCA AGCCCCAGAA ACCGACGCCT 60ATCTAAGTAG ACGCAATGAC TCGGCGCCGA CTCGGCGACC GGCCAAAAGG TGGTGGATGG 120GTGATGACAG GGTTGGTAGG TCGTAAATCC CGGTCACCTT GGTAGCCACT ATAGGTGGGT 180CTTAAGAGAA GGTTAAGATT CCTCTTGTGC CTGCGGCGAG ACCGCGCACG GTCCACAGGT 240GTTGGCCCTA CCGGTGGGAA TAAGGGCCCG ACGTCAGGCT CGTCGTTAAA CCGAGCCCGT 300TACCCACCTG GGCAAACGAC GCCCACGTAC GGTCCACGTC GCCCTTCAAT GTCTCTCTTG 360ACCAATAGGC GTAGCCGGCG AGTTGACAAG GACCAGTGGG GGCCGGGGGC TTGGAGAGGG 420ACTCCAAGTC CCGCCCTTCC CGGTGGGCCG GGAAATGC ATG GGG CCA CCC AGC 473

Met Gly Pro Pro Ser

1 5TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC CTT CGG GTG AGG 521Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile Leu Arg Val Arg

10 15 20GCG GGT GGC ATT TCC TTT TTC TAT ACC ATC ATG GCA GTC CTT CTG CTC 569Ala Gly Gly Ile Ser Phe Phe Tyr Thr Ile Met Ala Val Leu Leu Leu

25 30 35CTT CTC GTG GTT GAG GCC GGG GCC ATT CTG GCC CCG GCC ACC CAC GCT 617Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala Thr His Ala

40 45 50TGT CGA GCG AAT GGG CAA TAT TTC CTC ACA AAT TGT TGT GCC CCG GAG 665Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu

55 60 65GAC ATC GGG TTC TGC CTG GAG GGT GGA TGC CTG GTG GCC CTG GGG TGC 713Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala Leu Gly Cys70 75 80 85ACG ATT TGC ACT GAC CAA TGC TGG CCA CTG TAT CAG GCG GGT TTG GCT 761Thr Ile Cys Thr Asp Gln Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala

90 95 100GTG CGG CCT GGC AAG TCC GCG GCC CAA CTG GTG GGG GAG CTG GGT AGC 809Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val Gly Glu Leu Gly Ser

105 110 115CTA TAC GGG CCC CTG TCG GTC TCG GCC TAT GTG GCT GGG ATC CTG GGC 857Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val Ala Gly Ile Leu Gly

120 125 130CTG GGT GAG GTG TAC TCG GGT GTC CTA ACG GTG GGA GTC GCG TTG ACG 905Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val Gly Val Ala Leu Thr

135 140 145CGC CGG GTC TAC CCG GTG CCT AAC CTG ACG TGT GCA GTC GCG TGT GAG 953Arg Arg Val Tyr Pro Val Pro Asn Leu Thr Cys Ala Val Ala Cys Glu150 155 160 165CTA AAG TGG GAA AGT GAG TTT TGG AGA TGG ACT GAA CAG CTG GCC TCC 1001Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser

170 175 180AAC TAC TGG ATT CTG GAA TAC CTC TGG AAG GTC CCA TTT GAT TTC TGG 1049Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val Pro Phe Asp Phe Trp

185 190 195AGA GGC GTG ATA AGC CTG ACC CCC TTG TTG GTT TGC GTG GCC GCA TTG 1097Arg Gly Val Ile Ser Leu Thr Pro Leu Leu Val Cys Val Ala Ala Leu

200 205 210CTG CTG CTT GAG CAA CGG ATT GTC ATG GTC TTC CTG TTG GTG ACG ATG 1145Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe Leu Leu Val Thr Met

215 220 225GCC GGG ATG TCG CAA GGC GCC CCT GCC TCC GTT TTG GGG TCA CGC CCC 1193Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val Leu Gly Ser Arg Pro230 235 240 245TTT GAC TAC GGG TTG ACT TGG CAG ACC TGC TCT TGC AGG GCC AAC GGT 1241Phe Asp Tyr Gly Leu Thr Trp Gln Thr Cys Ser Cys Arg Ala Asn Gly

250 255 260TCG CGT TTT TCG ACT GGG GAG AAG GTG TGG GAC CGT GGG AAC GTT ACG 1289Ser Arg Phe Ser Thr Gly Glu Lys Val Trp Asp Arg Gly Asn Val Thr

265 270 275CTT CAG TGT GAC TGC CCT AAC GGC CCC TGG GTG TGG TTG CCA GCC TTT 1337Leu Gln Cys Asp Cys Pro Asn Gly Pro Trp Val Trp Leu Pro Ala Phe

280 285 290TGC CAA GCA ATC GGC TGG GGT GAC CCC ATC ACT TAT TGG AGC CAC GGG 1385Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr Tyr Trp Ser His Gly

295 300 305CAA AAT CAG TGG CCC CTT TCA TGC CCC CAG TAT GTC TAT GGG TCT GCT 1433Gln Asn Gln Trp Pro Leu Ser Cys Pro Gln Tyr Val Tyr Gly Ser Ala3l0 315 320 325ACA GTC ACT TGC GTG TGG GGT TCC GCT TCT TGG TTT GCC TCC ACC AGT 1481Thr Val Thr Cys Val Trp Gly Ser Ala Ser Trp Phe Ala Ser Thr Ser

330 335 340GGT CGC GAC TCG AAG ATA GAT GTG TGG AGT TTA GTG CCA GTT GGC TCT 1529Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu Val Pro Val Gly Ser

345 350 355GCC ACC TGC ACC ATA GCC GCA CTT GGA TCA TCG GAT CGC GAC ACG GTG 1577Ala Thr Cys Thr Ile Ala Ala Leu Gly Ser Ser Asp Arg Asp Thr Val

360 365 370CCT GGG CTC TCC GAG TGG GGA ATC CCG TGC GTG ACG TGT GTT CTG GAC 1625Pro Gly Leu Ser Glu Trp Gly Ile Pro Cys Val Thr Cys Val Leu Asp

375 380 385CGT CGG CCT GCC TCC TGC GGC ACC TGT GTG AGG GAC TGC TGG CCC GAG 1673Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg Asp Cys Trp Pro Glu390 395 400 405ACC GGG TCG GTT AGG TTC CCA TTC CAT CGG TGC GGC GTG GGG CCT CGG 1721Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys Gly Val Gly Pro Arg

410 415 420CTG ACA AAG GAC TTG GAA GCT GTG CCC TTC GTC AAC AGG ACA ACT CCC 1769Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val Asn Arg Thr Thr Pro

425 430 435TTC ACC ATT AGG GGG CCC CTG GGC AAC CAG GGC CGA GGC AAC CCG GTG 1817Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly Arg Gly Asn Pro Val

440 445 450CGG TCG CCC TTG GGT TTT GGG TCC TAC GCC ATG ACC AGG ATC CGA GAT 1865Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met Thr Arg Ile Arg Asp

455 460 465ACC CTA CAT CTG GTG GAG TGT CCC ACA CCA GCC ATT GAG CCT CCC ACC 1913Thr Leu His Leu Val Glu Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr470 475 480 485GGG ACG TTT GGG TTC TTC CCC GGG ACG CCG CCT CTC AAC AAC TGC ATG 1961Gly Thr Phe Gly Phe Phe Pro Gly Thr Pro Pro Leu Asn Asn Cys Met

490 495 500CTC TTG GGC ACG GAA GTG TCC GAG GCA CTT GGG GGG GCT GGC CTC ACG 2009Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr

505 510 515GGG GGG TTC TAT GAA CCC CTG GTG CGC AGG TGT TCG AAG CTG ATG GGA 2057Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Cys Ser Lys Leu Met Gly

520 525 530AGC CGA AAT CCG GTT TGT CCG GGG TTT GCA TGG CTC TCT TCG GGC AGG 2105Ser Arg Asn Pro Val Cys Pro Gly Phe Ala Trp Leu Ser Ser Gly Arg

535 540 545CCT GAT GGG TTT ATA CAT GTC CAG GGT CAC TTG CAG GAG GTG GAT GCA 2153Pro Asp Gly Phe Ile His Val Gln Gly His Leu Gln Glu Val Asp Ala550 555 560 565GGC AAC TTC ATC CCG CCC CCG CGC TGG TTG CTC TTG GAC TTT GTA TTT 220lGly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu Leu Asp Phe Val Phe

570 575 580GTC CTG TTA TAC CTG ATG AAG CTG GCT GAG GCA CGG TTG GTC CCG CTG 2249Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala Arg Leu Val Pro Leu

585 590 595ATC TTG CTG CTG CTA TGG TGG TGG GTG AAC CAG CTG GCA GTC CTA GGG 2297Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln Leu Ala Val Leu Gly

600 605 610CTG CCG GCT GTG GAA GCC GCC GTG GCA GGT GAG GTC TTC GCG GGC CCT 2345Leu Pro Ala Val Glu Ala Ala Val Ala Gly Glu Val Phe Ala Gly Pro

615 620 625GCC CTG TCC TGG TGT CTG GGA CTC CCG GTC GTC AGT ATG ATA TTG GGT 2393Ala Leu Ser Trp Cys Leu Gly Leu Pro Val Val Ser Met Ile Leu Gly630 635 640 645TTG GCA AAC CTG GTG CTG TAC TTT AGA TGG TTG GGA CCC CAA CGC CTG 244lLeu Ala Asn Leu Val Leu Tyr Phe Arg Trp Leu Gly Pro Gln Arg Leu

650 655 660ATG TTC CTC GTG TTG TGG AAG CTT GCT CGG GGA GCT TTC CCG CTG GCC 2489Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly Ala Phe Pro Leu Ala

665 670 675CTC TTG ATG GGG ATT TCG GCG ACC CGC GGG CGC ACC TCA GTG CTC GGG 2537Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg Thr Ser Val Leu Gly

680 685 690GCC GAG TTC TGC TTC GAT GCT ACA TTC GAG GTG GAC ACT TCG GTG TTG 2585Ala Glu Phe Cys Phe Asp Ala Thr Phe Glu Val Asp Thr Ser Val Leu

695 700 705GGC TGG GTG GTG GCC AGT GTG GTA GCT TGG GCC ATT GCG CTC CTG AGC 2633Gly Trp Val Val Ala Ser Val Val Ala Trp Ala Ile Ala Leu Leu Ser710 715 720 725TCG ATG AGC GCA GGG GGG TGG AGG CAC AAA GCC GTG ATC TAT AGG ACG 2681Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala Val Ile Tyr Arg Thr

730 735 740TGG TGT AAG GGG TAC CAG GCA ATC CGT CAA AGG GTG GTG AGG AGC CCC 2729Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg Val Val Arg Ser Pro

745 750 755CTC GGG GAG GGG CGG CCT GCC AAA CCC CTG ACC TTT GCC TGG TGC TTG 2777Leu Gly Glu Gly Arg Pro Ala Lys Pro Leu Thr Phe Ala Trp Cys Leu

760 765 770GCC TCG TAC ATC TGG CCA GAT GCT GTG ATG ATG GTG GTG GTT GCC TTG 2825Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met Val Val Val Ala Leu

775 780 785GTC CTT CTC TTT GGC CTG TTC GAC GCG TTG GAT TGG GCC TTG GAG GAG 2873Val Leu Leu Phe Gly Lsu Phe Asp Ala Leu Asp Trp Ala Leu Glu Glu790 795 800 805ATC TTG GTG TCC CGG CCC TCG TTG CGG CGT TTG GCT CGG GTG GTT GAG 292lIle Leu Val Ser Arg Pro Ser Leu Arg Arg Leu Ala Arg Val Val Glu

810 815 820TGC TGT GTG ATG GCG GGT GAG AAG GCC ACA ACC GTC CGG CTG GTC TCC 2969Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr Val Arg Leu Val Ser

825 830 835AAG ATG TGT GCG AGA GGA GCT TAT TTG TTC GAT CAT ATG GGC TCT TTT 3017Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp His Met Gly Ser Phe

840 845 850TCG CGT GCT GTC AAG GAG CGC CTG TTG GAA TGG GAC GCA GCT CTT GAA 3065Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp Asp Ala Ala Leu Glu

855 860 865CCT CTG TCA TTC ACT AGG ACG GAC TGT CGC ATC ATA CGG GAT GCC GCG 3113Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile Ile Arg Asp Ala Ala870 875 880 885AGG ACT TTG TCC TGC GGG CAG TGC GTC ATG GGT TTA CCC GTG GTT GCG 3161Arg Thr Leu Ser Cys Gly Gln Cys Val Met Gly Leu Pro Val Val Ala

890 895 900CGC CGT GGT GAT GAG GTT CTC ATC GGC GTC TTC CAG GAT GTG AAT CAT 3209Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His

905 910 915TTG CCT CCC GGG TTT GTT CCG ACC GCG CCT GTT GTC ATC CGA CGG TGC 3257Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val Val Ile Arg Arg Cys

920 925 930GGA AAG GGC TTC TTG GGG GTC ACA AAG GCT GCC TTG ACA GGT CGG GAT 3305Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp

935 940 945CCT GAC TTA CAT CCA GGG AAC GTC ATG GTG TTG GGG ACG GCT ACG TCG 3353Pro Asp Leu His Pro Gly Asn Val Met Val Leu Gly Thr Ala Thr Ser950 955 960 965CGA AGC ATG GGA ACA TGC TTG AAC GGC CTG CTG TTC ACG ACC TTC CAT 3401Arg Ser Met Gly Thr Cys Leu Asn Gly Leu Leu Phe Thr Thr Phe His

970 975 980GGG GCT TCA TCC CGA ACC ATC GCC ACA CCC GTG GGG GCC CTT AAT CCC 3449Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val Gly Ala Leu Asn Pro

985 990 995AGA TGG TGG TCA GCC AGT GAT GAT GTC ACG GTG TAT CCA CTC CCG GAT 3497Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val Tyr Pro Leu Pro Asp

1000 1005 1010GGG GCT ACT TCG TTA ACA CCT TGT ACT TGC CAG GCT GAG TCC TGT TGG 3545Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln Ala Glu Ser Cys Trp

1015 1020 1025GTC ATC AGA TCC GAC GGG GCC CTA TGC CAT GGC TTG AGC AAG GGG GAC 3593Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly Leu Ser Lys Gly Asp1030 1035 1040 1045AAG GTG GAG CTG GAT GTG GCC ATG GAG GTC TCT GAC TTC CGT GGC TCG 3641Lys Val Glu Leu Asp Val Ala Met Glu Val Ser Asp Phe Arg Gly Ser

1050 1055 1060TCT GGC TCA CCG GTC CTA TGT GAC GAA GGG CAC GCA GTA GGA ATG CTC 3689Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His Ala Val Gly Met Leu

1065 1070 1075GTG TCT GTG CTT CAC TCC GGT GGT AGG GTC ACC GCG GCA CGG TTC ACT 3737Val Ser Val Leu His Ser Gly Gly Arg Val Thr Ala Ala Arg Pne Thr

1080 1085 1090AGG CCG TGG ACC CAA GTG CCA ACA GAT GCC AAA ACC ACT ACT GAA CCC 3785Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro

1095 1100 1105CCT CCG GTG CCG GCC AAA GGA GTT TTC AAA GAG GCC CCG TTG TTT ATG 3833Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu Ala Pro Leu Phe Met1110 1115 1120 1125CCT ACG GGA GCG GGA AAG AGC ACT CGC GTC CCG TTG GAG TAC GAT AAC 3881Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro Leu Glu Tyr Asp Asn

1130 1135 1140ATG GGG CAC AAG GTC TTA ATC TTG AAC CCC TCA GTG GCC ACT GTG CGG 3929Met Gly His Lys Val Leu Ile Leu Asn Pro Ser Val Ala Thr Val Arg

1145 1150 1155GCC ATG GGC CCG TAC ATG GAG CGG CTG GCG GGT AAA CAT CCA AGT ATA 3977Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly Lys His Pro Ser Ile

1160 1165 1170TAC TGT GGG CAT GAT ACA ACT GCT TTC ACA AGG ATC ACT GAC TCC CCC 4025Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg Ile Thr Asp Ser Pro

1175 1180 1185CTG ACG TAT TCA ACC TAT GGG AGG TTT TTG GCC AAC CCT AGG CAG ATG 4073Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala Asn Pro Arg Gln Met1190 1195 1200 1205CTA CGG GGC GTT TCG GTG GTC ATT TGT GAT GAG TGC CAC AGT CAT GAC 4121Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu Cys His Ser His Asp

1210 1215 1220TCA ACC GTG CTG TTA GGC ATT GGG AGA GTC CGG GAG CTG GCG CGT GGG 4169Ser Thr Val Leu Leu Gly Ile Gly Arg Val Arg Glu Leu Ala Arg Gly

1225 1230 1235TGC GGG GTG CAA CTA GTG CTC TAC GCC ACC GCT ACA CCT CCC GGA TCC 4217Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala Thr Pro Pro Gly Ser

1240 1245 1250CCT ATG ACG CAG CAC CCT TCC ATA ATT GAG ACA AAA TTG GAC GTG GGC 4265Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr Lys Leu Asp Val Gly

1255 1260 1265GAG ATT CCC TTT TAT GGG CAT GGA ATA CCC CTC GAG CGG ATG CGA ACC 4313Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu Glu Arg Met Arg Thr1270 1275 1280 1285GGA AGG CAC CTC GTG TTC TGC CAT TCT AAG GCT GAG TGC GAG CGC CTT 4361Gly Arg His Leu Val Phe Cys His Ser Lys Ala Glu Cys Glu Arg Leu

1290 1295 1300GCT GGC CAG TTC TCC GCT AGG GGG GTC AAT GCC ATT GCC TAT TAT AGG 4409Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala Ile Ala Tyr Tyr Arg

1305 1310 1315GGT AAA GAC AGT TCT ATC ATC AAG GAT GGG GAC CTG GTG GTC TGT GCT 4457Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp Leu Val Val Cys Ala

1320 1325 1330ACA GAC GCG CTT TCC ACT GGG TAC ACT GGA AAT TTC GAC TCC GTC ACC 4505Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn Phe Asp Ser Val Thr

1335 1340 1345GAC TGT GGA TTA GTG GTG GAG GAG GTC GTT GAG GTG ACC CTT GAT CCC 4553Asp Cys Gly Leu Val Val Glu Glu Val Val Glu Val Thr Leu Asp Pro1350 1355 1360 1365ACC ATT ACC ATC TCC CTG CGG ACA GTG CCT GCG TCG GCT GAA CTG TCG 4601Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala Ser Ala Glu Leu Ser

1370 1375 1380ATG CAA AGA CGA GGA CGC ACG GGT AGG GGC AGG TCT GGA CGC TAC TAC 4649Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Ser Gly Arg Tyr Tyr

1385 1390 1395TAC GCG GGG GTG GGC AAA GCC CCT GCG GGT GTG GTG CGC TCA GGT CCT 4697Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val Val Arg Ser Gly Pro

1400 1405 1410GTC TGG TCG GCG GTG GAA GCT GGA GTG ACC TGG TAC GGA ATG GAA CCT 4745Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp Tyr Gly Met Glu Pro

1415 1420 1425GAC TTG ACA GCT AAC CTA CTG AGA CTT TAC GAC GAC TGC CCT TAC ACC 4793Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp Asp Cys Pro Tyr Thr1430 1435 1440 1445GCA GCC GTC GCG GCT GAT ATC GGA GAA GCC GCG GTG TTC TTC TCT GGG 4841Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala Val Phe Phe Ser Gly

1450 1455 1460CTC GCC CCA TTG AGG ATG CAC CCT GAT GTC AGC TGG GCA AAA GTT CGC 4889Leu Ala Pro Leu Arg Met His Pro Asp Val Ser Trp Ala Lys Val Arg

1465 1470 1475GGC GTC AAC TGG CCC CTC TTG GTG GGT GTT CAG CGG ACC ATG TGT CGG 4937Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln Arg Thr Met Cys Arg

1480 1485 1490GAA ACA CTG TCT CCC GGC CCA TCG GAT GAC CCC CAA TGG GCA GGT CTG 4985Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro Gln Trp Ala Gly Leu

1495 1500 1505AAG GGC CCA AAT CCT GTC CCA CTC CTG CTG AGG TGG GGC AAT GAT TTA 5033Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg Trp Gly Asn Asp Leu1510 1515 1520 1525CCA TCT AAA GTG GCC GGC CAC CAC ATA GTG GAC GAC CTG GTC CGG AGA 5081Pro Ser Lys Val Ala Gly His His Ile Val Asp Asp Leu Val Arg Arg

1530 1535 1540CTC GGT GTG GCG GAG GGT TAC GTC CGC TGC GAC GCT GGG CCG ATC TTG 5129Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp Ala Gly Pro Ile Leu

1545 1550 1555ATG ATC GGT CTA GCT ATC GCG GGG GGA ATG ATC TAC GCG TCA TAC ACC 5177Met Ile Gly Leu Ala Ile Ala Gly Gly Met Ile Tyr Ala Ser Tyr Thr

1560 1565 1570GGG TCG CTA GTG GTG GTG ACA GAC TGG GAT GTG AAG GGG GGT GGC GCC 5225Gly Ser Leu Val Val Val Thr Asp Trp Asp Val Lys Gly Gly Gly Ala

1575 1580 1585CCC CTT TAT CGG CAT GGA GAC CAG GCC ACG CCT CAG CCG GTG GTG CAG 5273Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro Gln Pro Val Val Gln1590 1595 1600 1605GTT CCT CCG GTA GAC CAT CGG CCG GGG GGT GAA TCA GCA CCA TCG GAT 5321Val Pro Pro Val Asp His Arg Pro Gly Gly Glu Ser Ala Pro Ser Asp

1610 1615 1620GCC AAG ACA GTG ACA GAT GCG GTG GCA GCC ATC CAG GTG GAC TGC GAT 5369Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile Gln Val Asp Cys Asp

1625 1630 1635TGG ACT ATC ATG ACT CTG TCG ATC GGA GAA GTG TTG TCC TTG GCT CAG 5417Trp Thr Ile Met Thr Leu Ser Ile Gly Glu Val Leu Ser Leu Ala Gln

1640 1645 1650GCT AAG ACG GCC GAG GCC TAC ACA GCA ACC GCC AAG TGG CTC GCT GGC 5465Ala Lys Thr Ala Glu Ala Tyr Thr Ala Thr Ala Lys Trp Leu Ala Gly

1655 1660 1665TGC TAT ACG GGG ACG CGG GCC GTT CCC ACT GTA TCC ATT GTT GAC AAG 5513Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val Ser Ile Val Asp Lys1670 1675 1680 1685CTC TTC GCC GGA GGG TGG GCG GCT GTG GTG GGC CAT TGC CAC AGC GTG 5561Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly His Cys His Ser Val

1690 1695 1700ATT GCT GCG GCG GTG GCG GCC TAC GGG GCT TCA AGG AGC CCG CCG TTG 5609Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser Arg Ser Pro Pro Leu

1705 1710 1715GCA GCC GCG GCT TCC TAC CTG ATG GGG TTG GGC GTT GGA GGC AAC GCT 5657Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly Val Gly Gly Asn Ala

1720 1725 1730CAG ACG CGC CTG GCG TCT GCC CTC CTA TTG GGG GCT GCT GGA ACC GCC 5705Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly Ala Ala Gly Thr Ala

1735 1740 1745TTG GGC ACT CCT GTC GTG GGC TTG ACC ATG GCA GGT GCG TTC ATG GGG 5753Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala Gly Ala Phe Met Gly1750 1755 1760 1765GGG GCC AGT GTC TCC CCC TCC TTG GTC ACC ATT TTA TTG GGG GCC GTC 5801Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile Leu Leu Gly Ala Val

1770 1775 1780GGA GGT TGG GAG GGT GTT GTC AAC GCG GCG AGC CTA GTC TTT GAC TTC 5849Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser Leu Val Phe Asp Phe

1785 1790 1795ATG GCG GGG AAA CTT TCA TCA GAA GAT CTG TGG TAT GCC ATC CCG GTA 5897Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp Tyr Ala Ile Pro Val

1800 1805 1810CTG ACC AGC CCG GGG GCG GGC CTT GCG GGG ATC GCT CTC GGG TTG GTT 5945Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile Ala Leu Gly Leu Val

1815 1820 1825TTG TAT TCA GCT AAC AAC TCT GGC ACT ACC ACT TGG TTG AAC CGT CTG 5993Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr Trp Leu Asn Arg Leu1830 1835 1840 1845CTG ACT ACG TTA CCA AGG TCT TCA TGT ATC CCG GAC AGT TAC TTT CAG 6041Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro Asp Ser Tyr Phe Gln

1850 1855 1860CAA GTT GAC TAT TGC GAC AAG GTC TCA GCC GTG CTC CGG CGC CTG AGC 6089Gln Val Asp Tyr Cys Asp Lys Val Ser Ala Val Leu Arg Arg Leu Ser

1865 1870 1875CTC ACC CGC ACA GTG GTT GCC CTG GTC AAC AGG GAG CCT AAG GTG GAT 6137Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg Glu Pro Lys Val Asp

1880 1885 1890GAG GTA CAG GTG GGG TAT GTC TGG GAC CTG TGG GAG TGG ATC ATG CGC 6185Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp Glu Trp Ile Met Arg

1895 1900 1905CAA GTG CGC GTG GTC ATG GCC AGA CTC AGG GCC CTC TGC CCC GTG GTG 6233Gln Val Arg Val Val Met Ala Arg Leu Arg Ala Leu Cys Pro Val Val1910 1915 1920 1925TCA CTA CCC TTG TGG CAT TGC GGG GAG GGG TGG TCC GGG GAA TGG TTG 6281Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp Ser Gly Glu Trp Leu

1930 1935 1940CTT GAC GGT CAT GTT GAG AGT CGC TGC CTC TGT GGC TGC GTG ATC ACT 6329Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys Gly Cys Val Ile Thr

1945 1950 1955GGT GAC GTT CTG AAT GGG CAA CTC AAA GAA CCA GTT TAC TCT ACC AAG 6377Gly Asp Val Leu Asn Gly Gln Leu Lys Glu Pro Val Tyr Ser Thr Lys

1960 1965 1970CTG TGC CGG CAC TAT TGG ATG GGG ACT GTC CCT GTG AAC ATG CTG GGT 6425Leu Cys Arg His Tyr Trp Met Gly Thr Val Pro Val Asn Met Leu Gly

1975 1980 1985TAC GGT GAA ACG TCG CCT CTC CTG GCC TCC GAC ACC CCG AAG GTT GTG 6473Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp Thr Pro Lys Val Val1990 1995 2000 2005CCC TTC GGG ACG TCT GGC TGG GCT GAG GTG GTG GTG ACC ACT ACC CAC 6521Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val Val Thr Thr Thr His

2010 2015 2020GTG GTA ATC AGG AGG ACC TCC GCC TAT AAG CTG CTG CGC CAG CAA ATC 6569Val Val Ile Arg Arg Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile

2025 2030 2035CTA TCG GCT GCT GTA GCT GAG CCC TAC TAC GTC GAC GGC ATT CCG GTC 6617Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val

2040 2045 2050TCA TGG GAC GCG GAC GCT CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG 6665Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly

2055 2060 2065CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG 6713Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu2070 2075 2080 2085AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT 6761Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile

2090 2095 2100GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG 6809Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu

2105 2110 2115CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT 6857Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile

2120 2125 2130CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT 6905Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser

2135 2140 2145CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC 6953Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro2150 2155 2160 2165CGT ACT CCA TCG CCA GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT 7001Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp

2170 2175 2180GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT 7049Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser

2185 2190 2195GAC TCA TTC GAG GTC ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA 7097Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu

2200 2205 2210AGT GTC TTC AAC GTG GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG 7145Ser Val Phe Asn Val Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln

2215 2220 2225AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA 7193Ser Asp Ala Thr Arg Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu2230 2235 2240 2245AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG TTG ACG GTG GCT GAT GTT 7241Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val

2250 2255 2260GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC 7289Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp

2265 2270 2275CAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT 7337Gln Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn

2280 2285 2290GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG 7385Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Lau

2295 2300 2305GCC TCC TTC TCT TAC ATT TGG TCT GGA GTG CCG CTG ACT AGG GCC ACG 7433Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr2310 2315 2320 2325CCG GCC AAG CCT CCC GTG GTG AGG CCG GTT GGC TCT TTG TTA GTG GCC 7481Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly Ser Leu Leu Val Ala

2330 2335 2340GAC ACT ACT AAG GTG TAT GTT ACC AAT CCA GAC AAT GTG GGA CGG AGG 7529Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg

2345 2350v 2355GTG GAC AAG GTG ACC TTC TGG CGT GCT CCT AGG GTT CAT GAT AAG TAC 7577Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg Val His Asp Lys Tyr

2360 2365 2370CTC GTG GAC TCT ATT GAG CGC GCT AAG AGG GCC GCT CAA GCC TGC CTA 7625Leu Val Asp Ser Ile Glu Arg Ala Lys Arg Ala Ala Gln Ala Cys Leu

2375 2380 2385AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA AGG ACT GTA AGG CCA CAT 7673Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg Thr Val Arg pro His2390 2395 2400 2405GCT GCC ATG GGC TGG GGA TCT AAG GTG TCG GTT AAG GAC TTA GCC ACC 7721Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val Lys Asp Leu Ala Thr

2410 2415 2420CCC GCG GGG AAG ATG GCC GTC CAT GAC CGG CTT CAG GAG ATA CTT GAA 7769Pro Ala Gly Lys Met Ala Val His Asp Arg Leu Gln Glu Ile Leu Glu

2425 2430 2435GGG ACT CCG GTC CCC TTT ACT CTT ACT GTG AAA AAG GAG GTG TTC TTC 7817Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys Lys Glu Val Phe Phe

2440 2445 2450AAA GAC CGG AAG GAG GAG AAG GCC CCC CGC CTC ATT GTG TTC CCC CCC 7865Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu Ile Val Phe Pro Pro

2455 2460 2465CTG GAC TTC CGG ATA GCT GAA AAG CTC ATC TTG GGA GAC CCA GGC CGG 7913Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu Gly Asp Pro Gly Arg2470 2475 2480 2485GTA GCC AAG GCG GTG TTG GGG GGG GCC TAC GCC TTC CAG TAC ACC CCA 7961Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala Phe Gln Tyr Thr Pro

2490 2495 2500AAT CAG CGA GTT AAG GAG ATG CTC AAG CTA TGG GAG TCT AAG AAG ACC 8009Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp Glu Ser Lys Lys Thr

2505 2510 2515CCT TGC GCC ATC TGT GTG GAC GCC ACC TGC TTC GAC AGT AGC ATA ACT 8057Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe Asp Ser Ser Ile Thr

2520 2525 2530GAA GAG GAC GTG GCT TTG GAG ACA GAG CTA TAC GCT CTG GCC TCT GAC 8105Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr Ala Leu Ala Ser Asp

2535 2540 2545CAT CCA GAA TGG GTG CGG GCA CTT GGG AAA TAC TAT GCC TCA GGC ACC 8153His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr Tyr Ala Ser Gly Thr2550 2555 2560 2565ATG GTC ACC CCG GAA GGG GTG CCC GTC GGT GAG AGG TAT TGC AGA TCC 8201Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg Ser

2570 2575 2580TCG GGT GTC CTA ACA ACT AGC GCG AGC AAC TGC TTG ACC TGC TAC ATC 8249Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile

2585 2590 2595AAG GTG AAA GCT GCC TGT GAG AGA GTG GGG CTG AAA AAT GTC TCT CTT 8297Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser Leu

2600 2605 2610CTC ATA GCC GGC GAT GAC TGC TTG ATC ATA TGT GAG CGG CCA GTG TGC 8345Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val Cys

2615 2620 2625GAC CCA AGC GAC GCT TTG GGC AGA GCC CTA GCG AGC TAT GGG TAC GCG 8393Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala2630 2635 2640 2645TGC GAG CCC TCA TAT CAT GCA TCA TTG GAC ACG GCC CCC TTC TGC TCC 8441Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr Ala Pro Phe Cys Ser

2650 2655 2660ACT TGG CTT GCT GAG TGC AAT GCA GAT GGG AAG CGC CAT TTC TTC CTG 8489Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys Arg His Phe Phe Leu

2665 2670 2675ACC ACG GAC TTC CGG AGG CCG CTC GCT CGC ATG TCG AGT GAG TAT AGT 8537Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met Ser Ser Glu Tyr Ser

2680 2685 2690GAC CCG ATG GCT TCG GCG ATC GGT TAC ATC CTC CTT TAT CCT TGG CAC 8585Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu Leu Tyr Pro Trp His

2695 2700 2705CCC ATC ACA CGG TGG GTC ATC ATC CCT CAT GTG CTA ACG TGC GCA TTC 8633Pro Ile Thr Arg Trp Val Ile Ile Pro His Val Leu Thr Cys Ala Phe2710 2715 2720 2725AGG GGT GGA GGC ACA CCG TCT GAT CCG GTT TGG TGC CAG GTG CAT GGT 8681Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp Cys Gln Val His Gly

2730 2735 2740AAC TAC TAC AAG TTT CCA CTG GAC AAA CTG CCT AAC ATC ATC GTG GCC 8729Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro Asn Ile Ile Val Ala

2745 2750 2755CTC CAC GGA CCA GCA GCG TTG AGG GTT ACC GCA GAC ACA ACT AAA ACA 8777Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala Asp Thr Thr Lys Thr

2760 2765 2770AAG ATG GAG GCT GGT AAG GTT CTG AGC GAC CTC AAG CTC CCT GGC TTA 8825Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu Lys Leu Pro Gly Leu

2775 2780 2785GCA GTC CAC CGA AAG AAG GCC GGG GCG TTG CGA ACA CGC ATG CTC CGC 8873Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg Thr Arg Met Leu Arg2790 2795 2800 2805TCG CGC GGT TGG GCT GAG TTG GCT AGG GGC TTG TTG TGG CAT CCA GGC 8921Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu Leu Trp His Pro Gly

2810 2815 2820CTA CGG CTT CCT CCC CCT GAG ATT GCT GGT ATC CCG GGG GGT TTC CCT 8969Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile Pro Gly Gly Phe Pro

2825 2830 2835

CTC TCC CCC CCC TAT ATG GGG GTG GTA CAT CAA TTG GAT TTC ACA AGC 9017

Leu Ser Pro Pro Tyr Met Gly Val Val His Gln Leu Asp Phe Thr Ser

2840 2845 2850

CAG AGG AGT CGC TGG CGG TGG TTG GGG TTC TTA GCC CTG CTC ATC GTA 9065

Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu Ala Leu Leu Ile Val

2855 2860 2865

GCC CTC TTC GGG TGAACTAAAT TCATCTGTTG CGGCAAGGTC TGGTGACTGA 9117

Ala Leu Phe Gly

2870

TCATCACCGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG TCTCCCCGCT GGGTAAAAAG 9177

GGCCCGGCCT TGGGAGGCAT GGTGGTTACT AACCCCCTGG CAGGGTCAAA GCCTGATGGT 9237

GCTAATGCAC TGCCACTTCG GTGGCGGGTC GCTACCTTAT AGCGTAATCC GTGACTACGG 9297

GCTGCTCGCA GAGCCCTCCC CGGATGGGGC ACAGTGCACT GTGATCTGAA GGGGTGCACC 9357

CCGGGAAGAG CTCGGCCCGA AGGCCGGSTT CTACT 9392(2)SEQ ID NO：15的信息：(i)序列特征：

(A)长度：2873个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：15：Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg1 5 10 15Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Phe Phe Tyr Thr Ile Met

20 25 30Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala

35 40 45Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn

50 55 60Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu65 70 75 80Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Gln Cys Trp Pro Leu Tyr

85 90 95Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val

100 105 110Gly Glu Leu Gly Ser Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val

115 120 125Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val

130 135 140Gly Val Ala Leu Thr Arg Arg Val Tyr Pro Val Pro Asn Leu Thr Cys145 150 155 160Ala Val Ala Cys Glu Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr

165 170 175Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val

180 185 190Pro Phe Asp Phe Trp Arg Gly Val Ile Ser Leu Thr Pro Leu Leu Val

195 200 205Cys Val Ala Ala Leu Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe

210 215 220Leu Leu Val Thr Met Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val225 230 235 240Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr Trp Gln Thr Cys Ser

245 250 255Cys Arg Ala Asn Gly Ser Arg Phe Ser Thr Gly Glu Lys Val Trp Asp

260 265 270Arg Gly Asn Val Thr Leu Gln Cys Asp Cys Pro Asn Gly Pro Trp Val

275 280 285Trp Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr

290 295 300Tyr Trp Ser His Gly Gln Asn Gln Trp Pro Leu Ser Cys Pro Gln Tyr305 310 315 320Val Tyr Gly Ser Ala Thr Val Thr Cys Val Trp Gly Ser Ala Ser Trp

325 330 335Phe Ala Ser Thr Ser Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu

340 345 350Val Pro Val Gly Ser Ala Thr Cys Thr Ile Ala Ala Leu Gly Ser Ser

355 360 365Asp Arg Asp Thr Val Pro Gly Leu Ser Glu Trp Gly Ile Pro Cys Val

370 375 380Thr Cys Val Leu Asp Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg385 390 395 400Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys

405 410 415Gly Val Gly Pro Arg Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val

420 425 430Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly

435 440 445Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met

450 455 460Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys Pro Thr Pro Ala465 470 475 480Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe Pro Gly Thr Pro Pro

485 490 495Leu Asn Asn Cys Met Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly

500 505 5l0Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Cys

515 520 525Ser Lys Leu Met Gly Ser Arg Asn Pro Val Cys Pro Gly Phe Ala Trp

530 535 540Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His Val Gln Gly His Leu545 550 555 560Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu

565 570 575Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala

580 585 590Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln

595 600 605Leu Ala Val Leu Gly Leu Pro Ala Val Glu Ala Ala Val Ala Gly Glu

610 615 620Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu Gly Leu Pro Val Val625 630 635 640Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu Tyr Phe Arg Trp Leu

645 650 655Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly

660 665 670Ala Phe Pro Leu Ala Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg

675 680 685Thr Ser Val Leu Gly Ala Glu Phe Cys Phe Asp Ala Thr Phe Glu Val

690 695 700Asp Thr Ser Val Leu Gly Trp Val Val Ala Ser Val Val Ala Trp Ala705 710 715 720Ile Ala Leu Leu Ser Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala

725 730 735Val Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg

740 745 750Val Val Arg Ser Pro Leu Gly Glu Gly Arg Pro Ala Lys Pro Leu Thr

755 760 765Phe Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met

770 775 780Val Val Val Ala Leu Val Leu Leu Phe Gly Leu Phe Asp Ala Leu Asp785 790 795 800Trp Ala Leu Glu Glu Ile Leu Val Ser Arg Pro Ser Leu Arg Arg Leu

805 8l0 815Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr

820 825 830Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp

835 840 845His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp

850 855 860Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile865 870 875 880Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met Gly

885 890 895Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe

900 905 910Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val

915 920 925Val Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala

930 935 940Leu Thr Gly Arg Asp Pro Asp Leu His Pro Gly Asn Val Met Val Leu945 950 955 960Gly Thr Ala Thr Ser Arg Ser Met Gly Thr Cys Leu Asr Gly Leu Leu

965 970 975Phe Thr Thr Phe His Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val

980 985 990Gly Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val

995 1000 1005Tyr Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln

1010 1015 1020Ala Glu Ser Cys Trp Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly1025 1030 1035 1040Leu Ser Lys Gly Asp Lys Val Glu Leu Asp Val Ala Met Glu Val Ser

1045 1050 1055Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His

1060 1065 1070Ala Val Gly Met Leu Val Ser Val Leu His Ser Gly Gly Arg Val Thr

1075 1080 1085Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys

1090 1095 1100Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu1105 1110 1115 1120Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro

1125 1130 1135Leu Glu Tyr Asp Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser

1140 1145 1150Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly

1155 1160 1165Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg

1170 1175 1180Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala1185 1190 1195 1200Asn Pro Arg Gln Met Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu

1205 1210 1215Cys His Ser His Asp Ser Thr Val Lau Leu Gly Ile Gly Arg Val Arg

1220 1225 1230Glu Leu Ala Arg Gly Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala

1235 1240 1245Thr Pro Pro Gly Ser Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr

1250 1255 1260Lys Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu1265 1270 1275 1280Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser Lys Ala

1285 1290 1295Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala

1300 1305 1310Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp

1315 1320 1325Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn

1330 1335 1340Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val Val Glu1345 1350 1355 1360Val Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala

1365 1370 1375Ser Ala Glu Leu Ser Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg

1380 1385 1390Ser Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val

1395 1400 1405Val Arg Ser Gly Pro Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp

1410 1415 1420Tyr Gly Met Glu Pro Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp1425 1430 1435 1440Asp Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala

1445 1450 1455Val Phe Phe Ser Gly Leu Ala Pro Leu Arg Met His Pro Asp Val Ser

1460 1465 1470Trp Ala Lys Val Arg Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln

1475 1480 1485Arg Thr Met Cys Arg Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro

1490 1495 1500Gln Trp Ala Gly Leu Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg1505 1510 1515 1520Trp Gly Asn Asp Leu Pro Ser Lys Val Ala Gly His His Ile Val Asp

1525 1530 1535Asp Leu Val Arg Arg Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp

1540 1545 1550Ala Gly Pro Ile Leu Met Ile Gly Leu Ala Ile Ala Gly Gly Met Ile

1555 1560 1565Tyr Ala Ser Tyr Thr Gly Ser Leu Val Val Val Thr Asp Trp Asp Val

1570 1575 1580Lys Gly Gly Gly Ala Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro1585 1590 1595 1600Gln Pro Val Val Gln Val Pro Pro Val Asp His Arg Pro Gly Gly Glu

1605 1610 1615Ser Ala Pro Ser Asp Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile

1620 1625 1630Gln Val Asp Cys Asp Trp Thr Ile Met Thr Leu Ser Ile Gly Glu Val

1635 1640 1645Leu Ser Leu Ala Gln Ala Lys Thr Ala Glu Ala Tyr Thr Ala Thr Ala

1650 1655 1660Lys Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val1665 1670 1675 1680Ser Ile Val Asp Lys Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly

1685 1690 1695His Cys His Ser Val Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser

1700 1705 1710Arg Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly

1715 1720 1725Val Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly

1730 1735 1740Ala Ala Gly Thr Ala Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala1745 1750 1755 1760Gly Ala Phe Met Gly Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile

1765 1770 1775Leu Leu Gly Ala Val Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser

1780 1785 1790Leu Val Phe Asp Phe Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp

1795 1800 1805Tyr Ala Ile Pro Val Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile

1810 1815 1820Ala Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr1825 1830 1835 1840Trp Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro

1845 1850 1855Asp Ser Tyr Phe Gln Gln Val Asp Tyr Cys Asp Lys Val Ser Ala Val

1860 1865 1870Leu Arg Arg Leu Ser Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg

1875 1880 1885Glu Pro Lys Val Asp Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp

1890 1895 1900Glu Trp Ile Met Arg Gln Val Arg Val Val Met Ala Arg Leu Arg Ala1905 1910 1915 1920Leu Cys Pro Val Val Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp

1925 1930 1935Ser Gly Glu Trp Leu Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys

1940 1945 1950Gly Cys Val Ile Thr Gly Asp Val Leu Asn Gly Gln Leu Lys Glu Pro

1955 1960 1965Val Tyr Ser Thr Lys Ieu Cys Arg His Tyr Trp Met Gly Thr Val Pro

1970 1975 1980Val Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp1985 1990 1995 2000Thr Pro Lys Val Val Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val

2005 2010 2015Val Thr Thr Thr His Val Val Ile Arg Arg Thr Ser Ala Tyr Lys Leu

2020 2025 2030Leu Arg Gln Gln Ile Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val

2035 2040 2045Asp Gly Ile Pro Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met

2050 2055 2060Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr2065 2070 2075 2080Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser

2085 2090 2095Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu

2100 2105 2110Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu

2115 2120 2125Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp

2130 2135 2140Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp2145 2150 2155 2160Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr

2165 2170 2175Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu

2180 2185 2190Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr

2195 2200 2205Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu Lys

2210 2215 2220Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys Met2225 2230 2235 2240Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu

2245 2250 2255Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His

2260 2265 2270Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val Gly

2275 2280 2285Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala

2290 2295 2300Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro2305 2310 2315 2320Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly

2325 2330 2335Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp

2340 2345 2350Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg

2355 2360 2365Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg Ala

2370 2375 2380Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg2385 2390 2395 2400Thr Val Arg Pro His Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val

2405 2410 2415Lys Asp Leu Ala Thr Pro Ala Gly Lys Met Ala Val His Asp Arg Leu

2420 2425 2430Gln Glu Ile Leu Glu Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys

2435 2440 2445Lys Glu Val Phe Phe Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu

2450 2455 2460Ile Val Phe Pro Pro Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu2465 2470 2475 2480Gly Asp Pro Gly Arg Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala

2485 2490 2495Phe Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp

2500 2505 2510Glu Ser Lys Lys Thr Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe

2515 2520 2525Asp Ser Ser Ile Thr Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr

2530 2535 2540Ala Leu Ala Ser Asp His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr2545 2550 2555 2560Tyr Ala Ser Gly Thr Met Val Thr Pro Glu Gly Val Pro Val Gly Glu

2565 2570 2575Arg Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys

2580 2585 2590Leu Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu

2595 2600 2605Lys Asn Val Ser Leu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys

2610 2615 2620Glu Arg Pro Val Cys Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala2625 2630 2535 2640Ser Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr

2645 2650 2655Ala Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys

2660 2665 2670Arg His Phe Phe Leu Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met

2675 2680 2685Ser Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu

2690 2695 2700

Leu Tyr Pro Trp His Pro Ile Thr Arg Trp Val Ile Ile Pro His Val

2705 2710 2715 2720

Leu Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp

2725 2730 2735

Cys Gin Val His Gly Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro

2740 2745 2750

Asn Ile Ile Val Ala Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala

2755 2760 2765

Asp Thr Thr Lys Thr Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu

2770 2775 2780

Lys Leu Pro Gly Leu Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg

2785 2790 2795 2800

Thr Arg Met Leu Arg Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu

2805 2810 2815

Leu Trp His Pro Gly Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile

2820 2825 2830

Pro Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met Gly Val Val His Gln

2835 2840 2845

Leu Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu

2850 2855 2860

Ala Leu Leu Ile Val Ala Leu Phe Gly

2865 2870(2)SEQ ID NO：16的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(iv)反义：无 (vi)原始来源：

(C)各分离株：探针470-20-1-152F(xi)序列描述：SEQ ID NO：16：TCGGTTACTG AGAGCAGCTC AGATGAG 27(2)SEQ ID NO：17的信息：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：JML-A，引物(xi)序列描述：SEQ ID NO：17：AGGAATTCAG CGGCCGCGAG 20(2)SEQ ID NO：18的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(vi)原始来源：

(C)各分离株：JML-B，引物(xi)序列描述：SEQ ID NO：18：CTCGCGGCCG CTGAATTCCT TT 22(2)SEQ ID NO：19的信息：(i)序列特征：

(A)长度：203个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性(ii)分子类型： cDNA(iii)假设：无(vi)原始来源：

(C)各分离株：470-20-1克隆，WITHOUT SISPA

接头(ix)特性：

(A)名称/关键词：CDS

(B)位置：2..203(xi)序列描述：SEQ ID NO：19：G GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG 46Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly

1 5 10 15GTA TCC TCC TGC GAG GAG GAC ACC GGC GGG GTC TTC TCA TCT GAG CTG 94Val Ser Ser Cys Glu Glu Asp Thr Gly Gly Val Pne Ser Ser Glu Leu

20 25 30CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG TCT 142Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser

35 40 45TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA CAA AGA GAG GGT GTA 190Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val

50 55 60CTG CAG TCC TCC A 203Leu Gln Ser Ser

65(2)SEQ ID NO：20的信息：(i)序列特征：

(A)长度：67个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：20：Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val1 5 10 15Ser Ser Cys Glu Glu Asp Thr Gly Gly Val Phe Ser Ser Glu Leu Leu

20 25 30Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser Ser

35 40 45Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val Leu

50 55 60Gln Ser Ser65(2)SEQ ID NO：21的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：470-20-1-152R(xi)序列描述：SEQ ID NO：21：CTCATCTGAG CTGCTCTCAG TAACCGA 27(2)SEQ ID NO：22的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：寡核苷酸B(xi)序列描述：SEQ ID NO：22：CTGTCTCGGA CTCTTGGATG ACCT 24(2)SEQ ID NO：23的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：同源寡核苷酸211R’(xi)序列描述：SEQ ID NO：23：ATACCCCGTC CTCTGACTCA TTCG 24(2)SEQ ID NO：24的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型： DNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：同源寡核苷酸B’(xi)序列描述：SEQ ID NO：24：AGGTCATCCA AGAGTCCGAG ACAG 24(2)SEQ ID NO：25的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：λGT11正向引物，20mer(xi)序列描述：SEQ ID NO：25：CACATGGCTG AATATCGACG 20(2)SEQ ID NO：26的信息：(i)序列特征：

(A)长度：180个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性 (ii)分子类型：cDNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：共有序列4E3(xi)序列描述：SEQ ID NO：26：GCGAGCCTAG TCTTTGACTT CATGGCGGGG AAACTTTCAT CAGAAGATCT GTGGTATGCC 60ATCCCGGTAC TGACCAGCCC GGGGGCGGGC CTTGCGGGGA TCGCTCTCGG GTTGGTTTTG 120TATTCAGCTA ACAACTCTGG CACTACCACT TGGTTGAACC GTCTGCTGAC TACGTTACCA 180(2)SEQ ID NO：27的信息：(i)序列特征：

(A)长度：430个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型：cDNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：共有序列3E3(xi)序列描述：SEQ ID NO：27：GGCACTACCA CTTGGTTGAA CCGTCTGCTG ACTACGTTAC CAAGGTCTTC ATGTATCCCG 60GACAGTTACT TTCAGCAAGT TGACTATTGC GACAAGGTCT CAGCCGTGCT CCGGCGCCTG 120AGCCTCACCC CCACAGTGGT TGCCCTGGTC AACAGGGAGC CTAAGGTGGA TGAGGTACAG 180GTGGGGTATG TCTGGGACCT GTGGGAGTGG ATCATGCGCC AAGTGCGCGT GGTCATGGCC 240AGACTCAGGG CCCTCTGCCC CGTGGTGTCA CTACCCTTGT GGCATTGCGG GGAGGGGTGG 300TCCGGGGAAT GGTTGCTTGA CGGTCATGTT GAGAGTCGCT GCCTCTGTGG CTGCGTGATC 360ACTGGTGACG TTCTGAATGG GCAACTCAAA GAACCAGTTT ACTCTACCAA GCTGTGCCGG 420CACTATTGGA 430(2)SEQ ID NO：28的信息：(i)序列特征：

(A)长度：180个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列2E5(xi)序列描述：SEQ ID NO：28：CTTACCGTCA AGATGTCGTG CTGCGTTGAA AAGAGCGTCA CGCGCTTTTT CTCATTGGGG 60TTGACGGTGG CTGATGTTGC TAGCCTGTGT GAGATGGAAA TCCAGAACCA TACAGCCTAT 120TGTGACCAGG TGCGCACTCC GCTTGAATTG CAGGTTGGGT GCTTGGTGGG CAATGAACTT 180(2)SEQ ID NO：29的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列1E5 (xi)序列描述：SEQ ID NO：29：CTTCTCTTTG TGGTAGTAGC CGAGAGATGC CTGTATGGGG AGAAGACATC CCCCGTACTC 60CATCGCCAGC ACTTATCTCG GTTACTGAGA GCAGCTCAGA TGAGAAGACC CCGTCGGTGT 120CCTCCTCGCA GGAGGATACC CCGTCCTCTG ACTCATTCGA GGTCATCCAA GAGTCCGAGA 180CAGCCGAAGG GGAGGAAAGT GTCTTCAACG TGGCTCTTTC CGTATTAAAA GCCTTATTTC 240CACAGAGCGA CGCGACCAGG AAGCTTACCG TCAAGATGTC GTGCTGCGTT GAAAAGAGCG 30CTCACGCGCTT TTTCTCATTG GGGTTGACGG TGGCTGATGT TGCT 344(2)SEQ ID NO：30的信息：(i)序列特征：

(A)长度：423个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列4E5(xi)序列描述：SEQ ID NO：30：GTAAGGCCAC ATGCTGCCAT GGGCTGGGGA TCTAAGGTGT CGGTTAAGGA CTTAGCCACC 60CCCGCGGGGA AGATGGCCGT CCATGACCGG CTTCAGGAGA TACTTGAAGG GACTCCGGTC 120CCCTTTACTC TTACTGTGAA AAAGGAGGTG TTCTTCAAAG ACCGGAAGGA GGAGAAGGCC 180CCCCGCCTCA TTGTGTTCCC CCCCCTGGAC TTCCGGATAG CTGAAAAGCT CATCTTGGGA 240GACCCAGGCCA GGTAGCCAA GGCGGTGTTG GGGGGGGCCT ACGCCTTCCA GTACACCCCA 300AATCAGCGAG TTAAiGGAGAT GCTCAAGCTA TGGGAGTCTA AGAAGACCCC TTGCGCCATC 360TGTGTGGACG CCACCTGCTT CGACAGTAGC ATAACTGAAG AGGACGTGGC TTTGGAGACA 420GAG 423(2)SEQ ID NO：31的信息：(i)序列特征：

(A)长度：516个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型： cDNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：共有序列3E5(xi)序列描述：SEQ ID NO：31：TACAGCCTAT TGTGACCAGG TGCGCACTCC GCTTGAATTG CAGGTTGGGT GCTTGGTGGG 60CAATGAACTT ACCTTTGAAT GTGACAAGTG TGAGGCTAGG CAAGAAACCT TGGCCTCCTT 120CTCTTACATT TGGTCTGGAG TGCCGCTGAC TAGGGCCACG CCGGCCAAGC CTCCCGTGGT 180GAGGCCGGTT GGCTCTTTGT TAGTGGCCGA CACTACTAAG GTGTATGTTA CCAATCCAGA 240CAATGTGGGA CGGAGGGTGG ACAAGGTGAC CTTCTGGCGT GCTCCTAGGG TTCATGATAA 300GTACCTCGTG GACTCTATTG AGCGCGCTAA GAGGGCCGCT CAAGCCTGCC TAAGCATGGG 360TTACACTTAT GAGGAAGCAA TAAGGACTGT AAGGCCACAT GCTGCCATGG GCTGGGGATC 420TAAGGTGTCG GTTAAGGACT TAGCCACCCC CGCGGGGAAG ATGGCCGTCC ATGACCGGCT 480TCAGGAGATA CTTGAAGGGA CTCCGGTCCC CTTTAC 516(2)SEQ ID NO：32的信息：(i)序列特征：

(A)长度：518个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型：cDNA (iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：共有序列2E3(xi)序列描述：SEQ ID NO：32：GAATGGGCAA CTCAAAGAAC CAGTTTACTC TACCAAGCTG TGCCGGCACT ATTGGATGGG 60GACTGTCCCT GTGAACATGC TGGGTTACGG TGAAACGTCG CCTCTCCTGG CCTCCGACAC 120CCCGAAGGTT GTGCCCTTCG GGACGTCTGG CTGGGCTGAG GTGGTGGTGA CCACTACCCA 180CGTGGTAATC AGGAGGACCT CCGCCTATAA GCTGCTGCGC CAGCAAATCC TATCGGCTGC 240TGTAGCTGAG CCCTACTACG TCGACGGCAT TCCGGTCTCA TGGGACGCGG ACGCTCGTGC 300GCCCGCCATG GTCTATGGCC CTGGGCAAAG TGTTACCATT GACGGGGAGC GCTACACCTT 360GCCTCATCAA CTGAGGCTCA GGAATGTGGC ACCCTCTGAG GTTTCATCCG AGGTGTCCAT 420TGACATTGGG ACGGAGACTG AAGACTCAGA ACTGACTGAG GCCGATCTGC CGCCGGCGGC 480TGCTG CTCTC CAAGCGATCG AGAATGCTGC GAGGATTC 518(2)SEQ ID NO：33的信息：(i)序列特征：

(A)长度：268个碱基对

(B)类型：核酸

(C)链型：单链

(C)各分离株：共有序列1E3(xi)序列描述：SEQ ID NO：33：CTTACTGAGG CCGATCTGCC GCCGGCGGCT GCTGCTCTCC AAGCGATCGA GAATGCTGCG 60AGGATTCTTG AACCGCACAT TGATGTCATC ATGGAGGACT GCAGTACACC CTCTCTTTGT 120GGTAGTAGCC GAGAGATGCC TGTATGGGGA GAAGACATCC CCCGTACTCC ATCGCCAGCA 180CTTATCTCGG TTACTGAGAG CAGCTCAGAT GAGAAGACCC CGTCGGTGTC CTCCTCGCAG 240GAGGATACCC CGTCCTCTGA CTCATTCG 268(2)SEQ ID NO：34的信息：(i)序列特征：

(A)长度：781个碱基对

(B)类型：核苷酸

(C)链型：两种

(C)各分离株：单个克隆4E5-20(xi)序列描述：SEQ ID NO：34：GTAAGGCCAC ATGCTGCCAT GGGCTGGGGA TCTAAGGTGT CGGTTAAGGA CTTAGCCACC 60CCCGCGGGGA AGATGGCCGT CCATGACCGG CTTCAGGAGA TACTTGAAGG GACTCCGGTC 120CCCTTTACTC TTACTGTGAA AAAGGAGGTG TTCTTCAAAG ACCGGAAGGA GGAGAAGGCC l80CCCCGCCTCA TTGTGTTCCC CCCCCTGGAC TTCCGGATAG CTGAAAAGCT CATCTTGGGA 240GACCCAGGCC GGGTAGCCAA GGCGGTGTTG GGGGGGGCCT ACGCCTTCCA GTACACCCCA 300AATCAGCGAG TTAAGGAGAT GCTCAAGCTA TGGGAGTCTA AGAAGACCCC TTGCGCCATC 360TGTGTGGACG CCACCTGCTT CGACAGTAGC ATAACTGAAG AGGACGTGGC TTTGGAGACA 420GAGTTATACG CTCTGGCCTC TGACCATCCA GAATGGGTGC GGGCACCTGG GAAATACTAT 480GCCTCAGGCA CCATGGTCAC CCCGGAAGGG GTGCCCGTCG GTGAGAGGTA TTGCAGATCC 540TCGGGTGTCC TAACAACTAG CGCGAGCAAC TGCCTGACCT GCTACATCAA GGTGAAAGCT 600GCCTGTGAGA GAGTGGGGCT GAAAAATGTC TCTCTTCTCA TAGCCGGCGA TGACTGCTTG 660ATCATATGTG AGCGGCCAGT GTGCGACCCA AGCGACGCTT TGGGCAGAGC CCTAGCGAGC 720TATGGGTACG CGTGCGAGCC CTCATATCAT GCATCATTGG ACACGGCCCC CTTCTGCTCC 780A 781(2)SEQ ID NO：35的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：探针470-201-1-142R(xi)序列描述：SEQ ID NO：35：TCGGTTACTG AGAGCAGCTC AGATGAG 27(2)SEQ ID NO：36的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：探针470-20-1-152F(xi)序列描述：SEQ ID NO：36：TCGGTTACTG AGAGCAGCTC AGATGAG 27(2)SEQ ID NO：37的信息：(i)序列特征：

(A)长度：570个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆470EXP1(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..570(xi)序列描述：SEQ ID NO：37：GCT GTA TGG TTC TGG ATT TCC ATC TCA CAC AGG CTA GCA ACA TCA GCC 48Ala Val Trp Phe Trp Ile Ser Ile Ser His Arg Leu Ala Thr Ser Ala1 5 10 15ACC GTC AAC CCC AAT GAG AAA AAG CGC GTG ACG CTC TTT TCA ACG CAG 96Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr Gln

20 25 30CAC GAC ATC TTG ACG GTA AGC TTC CTG GTC GCG TCG CTC TGT GGA AAT 144His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly Asn

35 40 45AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC CCT 192Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro

50 55 60TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG 240Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly65 70 75 80GTA TCC TCC TGC GAG GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG CTG 288Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu

85 90 95CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG TCT 336Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser

100 105 110TCT CCC CAT ACA GGC ATC TCT CGG CTA CTA CCA CAA AGA GAG GGT GTA 384Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val

115 120 125CTG CAG TCC TCC ATG ATG ACA TCA ATG TGC GGT TCA AGA ATC CTC GCA 432Leu Gln Ser Ser Met Met Thr Ser Met Cys Gly Ser Arg Ile Leu Ala

130 135 140GCA TTC TCG ATC GCT TGG AGA GCA GCA GCC GCC GGC GGC AGA TCG GCC 480Ala Phe Ser Ile Ala Trp Arg Ala Ala Ala Ala Gly Gly Arg Ser Alal45 150 155 160TCA GTC AGT TCT GAG TCT TCA GTC TCC GTC CCA ATG TCA ATG GAC ACC 528Ser Val Ser Ser Glu Ser Ser Val Ser Val Pro Met Ser Met Asp Thr

165 170 175TCG GAT GAA ACC TCA GAG GGT GCC ACA TTC CTG AGC CTC AGT 570Ser Asp Glu Thr Ser Glu Gly Ala Thr Phe Leu Ser Leu Ser

180 185 190(2)SEQ ID NO：38的信息：(i)序列特征：

(A)长度：190个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：38：Ala Val Trp Phe Trp Ile Ser Ile Ser His Arg Leu Ala Thr Ser Ala1 5 10 15Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr Gln

20 25 30His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly Asn

35 40 45Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro

50 55 60Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly65 70 75 80Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu

85 90 95Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met Ser

100 105 110Ser Pro His Thr Gly Ile Ser Arg Leu Leu Pro Gln Arg Glu Gly Val

115 120 125Leu Gln Ser Ser Met Met Thr Ser Met Cys Gly Ser Arg Ile Leu Ala

130 135 140Ala Phe Ser Ile Ala Trp Arg Ala Ala Ala Ala Gly Gly Arg Ser Ala145 150 155 160Ser Val Ser Ser Glu Ser Ser Val Ser Val Pro Met Ser Met Asp Thr

165 170 175Ser Asp Glu Thr Ser Glu Gly Ala Thr Phe Leu Ser Leu Ser

180 185 190(2)SEQ ID NO：39的信息：(i)序列特征：

(A)长度：1288个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列5E3

(xi)序列描述：SEQ ID NO：39：ACGGGTAGGG GCAGGTCTGG ACGCTACTAC TACGCGGGGG TGGGCAAAGC CCCTGCGGGT 60GTGGTGCGCT CAGGTCCTGT CTGGTCGGCG GTGGAAGCTG GAGTGACCTG GTACGGAATG 120GAACCTGACT TGACAGCTAA CCTACTGAGA CTTTACGACG ACTGCCCTTA CACCGCAGCC 180GTCGCGGCTG ATATCGGAGA AGCCGCGGTG TTCTTCTCTG GGCTCGCCCC ATTGAGGATG 240CACCCTGATG TCAGCTGGGC AAAAGTTCGC GGCGTCAACT GGCCCCTCTT GGTGGGTGTT 300CAGCGGACCA TGTGTCGGGA AACACTGTCT CCCGGCCCAT CGGATGACCC CCAATGGGCA 360GGTCTGAAGG GCCCAAATCC TGTCCCACTC CTGCTGAGGT GGGGCAATGA TTTACCATCT 420AAAGTGGCCG GCCACCACAT AGTGGACGAC CTGGTCCGGA GACTCGGTGT GGCGGAGGGT 480TACGTCCGCT GCGACGCTGG GCCGATCTTG ATGATCGGTC TAGCTATCGC GGGGGGAATG 540ATCTACGCGT CATACACCGG GTCGCTAGTG GTGGTGACAG ACTGGGATGT GAAGGGGGGT 600GGCGCCCCCC TTTATCGGCA TGGAGACCAG GCCACGCCTC AGCCGGTGGT GCAGGTTCCT 660CCGGTAGACC ATCGGCCGGG GGGTGAATCA GCACCATCGG ATGCCAAGAC AGTGACAGAT 720GCGGTGGCAG CCATCCAGGT GGACTGCGAT TGGACTATCA TGACTCTGTC GATCGGAGAA 780GTGTTGTCCT TGGCTCAGGC TAAGACGGCC GAGGCCTACA CAGCAACCGC CAAGTGGCTC 840GCTGGCTGCT ATACGGGGAC GCGGGCCGTT CCCACTGTAT CCATTGTTGA CAAGCTCTTC 900GCCGGAGGGT GGGCGGCTGT GGTGGGCCAT TGCCACAGCG TGATTGCTGC GGCGGTGGCG 960GCCTACGGGG CTTCAAGGAG CCCGCCGTTG GCAGCCGCGG CTTCCTACCT GATGGGGTTG 1020GGCGTTGGAG GCAACGCTCA GACGCGCCTG GCGTCTGCCC TCCTATTGGG GGCTGCTGGA 1080ACCGCCTTGG GCACTCCTGT CGTGGGCTTG ACCATGGCAG GTGCGTTCAT GGGGGGGGCC 1140AGTGTCTCCC CCTCCTTGGT CACCATTTTA TTGGGGGCCG TCGGAGGTTG GGAGGGTGTT 1200GTCAACGCGG CGAGCCTAGT CTTTGACTTC ATGGCGGGGA AACTTTCATC AGAAGATCTG 1260TGGTATGCCA TCCCGGTACT GACCAGCC 1288(2)SEQ ID NO：40的信息：(i)序列特征：

(A)长度：862个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列6E3(xi)序列描述：SEQ ID NO：40：ACGGCAACAT GGGGCACAAG GTCTTAATCT TGAACCCCTC AGTGGCCACT GTGCGGGCCA 60TGGGCCCGTA CATGGAGCGG CTGGCGGGTA AACATCCAAG TATATACTGT GGGCATGATA 120CAACTGCTTT CACAAGGATC ACTGACTCCC CCCTGACGTA TTCAACCTAT GGGAGGTTTT 180TGGCCAACCC TAGGCAGATG CTACGGGGCG TTTCGGTGGT CATTTGTGAT GAGTGCCACA 240GTCATGACTC AACCGTGCTG TTAGGCATTG GGAGAGTTCG GGAGCTGGCG CGTGGGTGCG 300GAGTGCAACT AGTGCTCTAC GCCACCGCTA CACCTCCCGG ATCCCCTATG ACGCAGCACC 360CTTCCATAAT TGAGACAAAA TTGGACGTGG GCGAGATTCC CTTTTATGGG CATGGAATAC 420CCCTCGAGCG GATGCGAACC GGAAGGCACC TCGTGTTCTG CCATTCTAAG GCTGAGTGCG 480AGCGCCTTGC TGGCCAGTTC TCCGCTAGGG GGGTCAATGC CATTGCCTAT TATAGGGGTA 540AAGACAGTTC TATCATCAAG GATGGGGACC TGGTGGTCTG TGCTACAGAC GCGCTTTCCA 600CTGGGTACAC TGGAAATTTC GACTCCGTCA CCGACTGTGG ATTAGTGGTG GAGGAGGTCG 660TTGAGGTGAC CCTTGATCCC ACCATTACCA TCTCCCTGCG GACAGTGCCT GCGTCGGCTG 720AACTGTCGAT GCAAAGACGA GGACGCACGG GTAGGGGCAG GTCTGGACGC TACTACTACG 780CGGGGGTGGG CAAAGCCCCT GCGGGTGTGG TGCGCTCAGG TCCTGTCTGG TCGGCGGTGG 840AAGCTGGAGT GACCTCGTAC GG 862(2)SEQ ID NO：41的信息：(i)序列特征：

(A)长度：865个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：单个克隆GE3L-11(xi)序列描述：SEQ ID NO：41：AGTACGGCAA CATGGGGCAC AAGGTCTTAA TCTTGAACCC CTCAGTGGCC ACTGTGCGGG 60CCATGGGCCC GTACATGGAG CGGCTGGCGG GTAAACATCC AAGTATATAC TGTGGGCATG 120ATACAACTGC TTTCACAAGG ATCACTGACT CCCCCCTGAC GTATTCAACC TATGGGAGGT 180TTTTGGCCAA CCCTAGGCAG ATGCTACGGG GCGTTTCGGT GGTCATTTGT GATGAGTGCC 240ACAGTCATGA CTCAACCGTG CTGTTAGGCA TTGGGAGAGT CCGGGAGCTG GCGCGTGGGT 300GCGGGGTGCA ACTAGTGCTC TACGCCACCG CTACACCTCC CGGATCCCCT ATGACGCAGC 360ACCCTTCCAT AATTGAGACA AAATTGGACG TGGGCGAGAT TCCCTTTTAT GGACATGGAA 420TACCCCTCGA GCGGATGCGA ACCGGAAGGC ACCTCGTGTT CTGCCATTCT AAGGCTGAGT 480GCGAGCGCCT TGCTGGCCAG TTCTCCGCTA GGGGGGTCAA TGCCATTGCC TATTATAGGG 540GTAAAGACAG TTCTATCATC AAGGATGGGG ACCTGGTGGT CTGTGCTACA GACGCGCTTT 600CCACTGGGTA CACTGGAAAT TTCGACTCCG TCACCGACTG TGGATTAGTG GTGGAGGAGG 660TCGTTGAGGT GACCCTTGAT CCCACCATTA CCATCTCCCT GCGGACAGTG CCTGCGTCGG 720CTGAACTGTC GATGCAAAGA CGAGGACGCA CGGGTAGGGG CAGGTCTGGA CGCTACTACT 780ACGCGGGGGT GGGCAAAGCC CCTGCGGGTG TGGTGCGCTC AGGTCCTGTC TGGTCGGCGG 840TGGAAGCTGG AGTGACCTCG TACGG 865(2)SEQ ID NO：42的信息：(i)序列特征：

(A)长度：596个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列7E3(xi)序列描述：SEQ ID NO：42：AGCATGGGAA CATGCTTGAA CGGCCTGCTG TTCACGACCT TCCATGGGGC TTCATCCCGA 60ACCATCGCCA CACCCGTGGG GGCCCTTAAT CCCAGATGGT GGTCAGCCAG TGATGATGTC 120ACGGTGTATC CACTCCCGGA TGGGGCTACT TCGTTAACAC CTTGTACTTG CCAGGCTGAG 180TCCTGTTGGG TCATCAGATC CGACGGGGCC CTATGCCATG GCTTGAGCAA GGGGGACAAG 240GTGGAGCTGG ATGTGGCCAT GGAGGTCTCT GACTTCCGTG GCTCGTCTGG CTCACCGGTC 300CTATGTGACG AAGGGCACGC AGTAGGAATG CTCGTGTCTG TGCTTCACTC CGGTGGTAGG 360GTCACCGCGG CACGGTTCAC TAGGCCGTGG ACCCAAGTGC CAACAGATGC CAAAACCACT 420ACTGAACCCC CTCCGGTGCC GGCCAAAGGA GTTTTCAAAG AGGCCCCGTT GTTTATGCCT 480ACGGGAGCGG GAAAGAGCAC TCGCGTCCCG TTGGAGTACG ATAACATGGG GCACAAGGTC 540TTAATCTTGA ACCCCTCAGT GGCCACTGTG CGGGCCATGG GCCCGTACAT GGAGCG 596(2)SEQ ID NO：43的信息：(i)序列特征：

(A)长度：586个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列5E5(xi)序列描述：SEQ ID NO：43：GAGCTATGGG TACGCGTGCG AGCCCTCATA TCATGCATCA TTGGACACGG CCCCCTTCTG 60CTCCACTTGG CTTGCTGAGT GCAATGCAGA TGGGAAGCGC CATTTCTTCC TGACCACGGA 120CTTCCGGAGG CCGCTCGCTC GCATGTCGAG TGAGTATAGT GACCCGATGG CTTCGGCGAT 180CGGTTACATC CTCCTTTATC CTTGGCACCC CATCACACGG TGGGTCATCA TCCCTCATGT 240GCTAACGTGC GCATTCAGGG GTGGAGGCAC ACCGTCTGAT CCGGTTTGGT GCCAGGTGCA 300TGGTAACTAC TACAAGTTTC CACTGGACAA ACTGCCTAAC ATCATCGTGG CCCTCCACGG 360ACCAGCAGCG TTGAGGGTTA CCGCAGACAC AACTAAAACA AAGATGGAGG CTGGTAAGGT 420TCTGAGCGAC CTCAAGCTCC CTGGCTTAGC AGTCCACCGA AAGAAGGCCG GGGCGTTGCG 480AACACGCATG CTCCGCTCGC GCGGTTGGGC TGAGTTGGCT AGGGGCTTGT TGTGGCATCC 540AGGCCTACGG CTTCCTCCCC CTGAGATTGC TGGTATCCCG GGGGGT 586(2)SEQ ID NO：44的信息：(i)序列特征：

(A)长度：242个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列6E5(44F) (xi)序列描述：SEQ ID NO：44：CGAACGCGCA TGCTCCGCTC GCGCGGTTGG GCTGAGTTGG CTAGGGGCTT GTTGTGGCAT 60CCAGGCCTAC GGCTTCCTCC CCCTGAGATT GCTGGTATCC CGGGGGGTTT CCCTCTCTCC 120CCCCCCTATA TGGGGGTGGT ACACCAATTG GATTTCACAA GCCAGAGGAG TCGCTGGCGG 180TGGTTGGGGT TCTTAGCCCT GCTCATCGTA GCCCTCTTCG GGTGAACTAA ATTCATCTGT 240TG 242(2)SEQ ID NO：45的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物gt11反-JL(xi)序列描述：SEQ ID NO：45：TGGTAATGGT AGCGACCGGC GCTCAGC 27(2)SEQ ID NO：46的信息：(i)序列特征：

(A)长度：45个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE-3F(xi)序列描述：SEQ ID NO：46：GCCGCCATGG TCTCATGGGA CGCGGACGCT CGTGCGCCCG CGATG 45(2)SEQ ID NO：47的信息：(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE-3R(xi)序列描述：SEQ ID NO：47：GCGCGGATCC GATAAGTGCT GGCGATGGAG TACG 34(2)SEQ ID NO：48的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE-9F (xi)序列描述：SEQ ID NO：48：GGCACCATGG TCACCCCGGA AG 22(2)SEQ ID NO：49的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE-9R(xi)序列描述：SEQ ID NO：49：GCTCGGATCC GGAGCAGAAG GGGGCCGT 28(2)SEQ ID NO：50的信息：(i)序列特征：

(A)长度：364个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：GE3-2(ix)特性

(A)名称/关键词：CDS

(B)位置：2..364 (xi)序列描述：SEQ ID NO：50：G GTC TCA TGG GAC GCG GAC GCT CGT GCG CCC GCG ATG GTC TAT GGC 46Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly

1 5 10 15CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC TTG CCT CAT 94Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His

20 25 30CAA CTG AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT TCA TCC GAG GTG 142Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val

35 40 45TCC ATT GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT GAG GCC 190Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala

50 55 60GAT CTG CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC GAG AAT GCT GCG 238Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala

65 70 75AGG ATT CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG GAC TGC AGT ACA 286Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr80 85 90 95CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA TGG GGA GAA GAC 334Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp

100 105 110ATC CCC CGT ACT CCA TCG CCA GCA CTT ATC 364Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile

115 120(2)SEQ ID NO：51的信息：(i)序列特征：

(A)长度：121个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：51：Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro1 5 10 15Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln

20 25 30Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser

35 40 45Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp

50 55 60Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg65 70 75 80Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys Ser Thr Pro

85 90 95Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly Glu Asp Ile

100 105 110Pro Arg Thr Pro Ser Pro Ala Leu Ile

115 120(2)SEQ ID NO：52的信息：(i)序列特征：

(A)长度：290个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆GE9-2(ix)特性

(A)名称/关键词：CDS

(B)位置：3..290(xi)序列描述：SEQ ID NO：52：CC ATG GTC ACC CCG GAA GGG GTG CCC GTT GGT GAG AGG TAT TGC AGA 47Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg

1 5 10 15TCC TCG GGT GTC CTA ACA ACT AGC GCG AGC AAC TGC TTG ACC TGC TAC 95Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr

20 25 30ATC AAG GTG AAA GCC GCC TGT GAG AGG GTG GGG CTG AAA AAT GTC TCT 143Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser

35 40 45CTT CTC ATA GCC GGC GAT GAC TGC TTG ATC ATA TGT GAG CGG CCA GTG 19lLeu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val

50 55 60TGC GAC CCA AGC GAC GCT TTG GGC AGA GCC CTA GCG AGC TAT GGG TAC 239Cys Asp Pro Ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr

65 70 75GCG TGC GAG CCC TCA TAT TAT GCA TGC TCG GAC ACG GCC CCC TTC TGC 287Ala Cys Glu Pro Ser Tyr Tyr Ala Cys Ser Asp Thr Ala Pro Phe Cys80 85 90 95TCC 290Ser(2)SEQ ID NO：53的信息：(i)序列特征：

(A)长度：96个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：53：Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg Tyr Cys Arg Ser1 5 10 15Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile

20 25 30Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys Asn Val Ser Leu

35 40 45Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu Arg Pro Val Cys

50 55 60Asp Pro ser Asp Ala Leu Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala65 70 75 80Cys Glu Pro Ser Tyr Tyr Ala Cys Ser Asp Thr Ala Pro Phe Cys Ser

85 90 95(2)SEQ ID NO：54的信息：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：JML-A SISPA引物(xi)序列描述：SEQ ID NO：54：AGGAATTCAG CGGCCGCGAG 20(2)SEQ ID NO：55的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：JML-B SISPA引物(xi)序列描述：SEQ ID NO：55：CTCGCGGCCG CTGAATTCCT TT 22(2)SEQ ID NO：56的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：470ep-F1引物(xi)序列描述：SEQ ID NO：56：GCGAATTCGC CATGGCGGGG AGACTTTCAT CA 32(2)SEQ ID NO：57的信息：(i)序列特征：

(A)长度：35个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：470ep-R1引物(xi)序列描述：SEQ ID NO：57：GCGAATTCGG ATCCAGGGCC ATAGACCATC GCGGG 35(2)SEQ ID NO：58的信息：(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：470ep-f2引物(xi)序列描述：SEQ ID NO：58：GCGAATTCCG TGCGCCCGCC ATGGTC 26(2)SEQ ID NO：59的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：470ep-R3引物(xi)序列描述：SEQ ID NO：59：GCGAATTCGG ATCCCAAGGT TTCTTGCCTA GC 32(2)SEQ ID NO：60的信息：(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性 (ii)分子类型：DNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：470ep-f4引物(xi)序列描述：SEQ ID NO：60：GCGAATTCAA GTGTGAGGCT AGGCAA 26(2)SEQ ID NO：61的信息：(i)序列特征：

(A)长度：35个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：470ep-R4引物(xi)序列描述：SEQ ID NO：61：GCGAATTCGG ATCCCCACAC AGATGGCGCA AGGGG 35(2)SEQ ID NO：62的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：KL-1 SISPA引物(xi)序列描述：SEQ ID NO：62：GCAGGATCCG AATTCGCATC TAGAGAT 27(2)SEQ ID NO：63的信息：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：KL-2SISPA引物(xi)序列描述：SEQ ID NO：63：ATCTCTAGAT GCGAATTCGG ATCCTGCGA 29(2)SEQ ID NO：64的信息：(i)序列特征：

(A)长度：186个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-10(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..186(xi)序列描述：SEQ ID NO：64：CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT GCC ATT GAC 48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ala Ile Asp1 5 10 15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA 96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

20 25 30CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG GCT 144Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Ala

35 40 45GAA AAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT 186Glu Asn Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala

50 55 60(2)SEQ ID NO：65的信息：(i)序列特征：

(A)长度：62个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：65：Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ala Ile Aspl 5 10 15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

20 25 30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Ala

35 40 45Glu Asn Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala

50 55 60(2)SEQ ID NO：66的信息：(i)序列特征：

(A)长度：282个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-12(ix)特性

(A)名称/关键词：CDS

(B)位置：1..282(xi)序列描述：SEQ ID NO：66：CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC 48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp1 5 10 15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA 96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

20 25 30CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG ACT 144Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr

35 40 45GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT GCT 192Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala

50 55 60CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT GAT 240Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65 70 75 80GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT 282Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser

85 90(2)SEQ ID NO：67的信息：(i)序列特征：

(A)长度：94个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：67：Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile AspI 5 10 15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

20 25 30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr

35 40 45Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala

50 55 60Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65 70 75 80Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser

85 90(2)SEQ ID NO：68的信息：(i)序列特征：

(A)长度：279个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-26(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..279(xi)序列描述：SEQ ID NO68：CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT TCC ATT GAC 48Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ser Ile Asp1 5 10 15GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA 96Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

35 40 45GAA GAC TCA GAA CTG ACT GAG GCC GAC CTG CCG CCG GCG GCT GCT GCT 192Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala

50 55 60CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATC GAT 240Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65 70 75 60GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT 279Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly

85 90(2)SEQ ID NO：69的信息：(i)序列特征：

(A)长度：93个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO 69：Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Ser Ile Asp1 5 10 15Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

20 25 30Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr

35 40 45Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala

50 55 60Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp65 70 75 80Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly

85 90(2)SEQ ID NO：70的信息：(i)序列特征：

(A)长度：108个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-5(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..108(xi)序列描述：SEQ ID NO：70：GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC 48Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1 5 10 15TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG 96Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg

20 25 30CAA GAA ACC TTG 108Gln Glu Thr Leu

35(2)SEQ ID NO：71的信息：(i)序列特征：

(A)长度：36个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：71：Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1 5 10 15Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg

20 25 30Gln Glu Thr Leu

35(2)SEQ ID NO：72的信息：(i)序列特征：

(A)长度：132个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-3(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..132(xi)序列描述：SEQ ID NO：72：GAG ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC AAG GTG CGC ACT 48Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr1 5 10 15CCG CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT 96Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe

20 25 30GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG 132Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu

35 40(2)SEQ ID NO：73的信息：(i)序列特征：

(A)长度：44个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：73：Glu Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr1 5 l0 15Pro Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe

20 25 30Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu

35 40(2)SEQ ID NO：74的信息：(i)序列特征：

(A)长度：258个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-27 (ix)特性：

(A)名称/关键词：CDS

(B)位置：1..258(xi)序列描述：SEQ ID NO：74：AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG 48Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys1 5 10 15ATG TCA TGC TGC GTT GAA AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG 96Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly

20 25 30TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC 144Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn

35 40 45CAT ATA GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT 192His Ile Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val

50 55 60GGG TGC TTG GTG GGC AAT GAA CTC ACC TTT GAA TGT GAC AAG TGT GAG 240Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu65 70 75 80GCT AGG CAA GAA ACC TTG 258Ala Arg Gln Glu Thr Leu

85(2)SEQ ID NO：75的信息：(i)序列特征：

(A)长度：86个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：75：Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys1 5 10 15Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly

20 25 30Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn

35 40 45His Ile Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val

50 55 60Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu65 70 75 80Ala Arg Gln Glu Thr Leu

85(2)SEQ ID NO：76的信息：(i)序列特征：

(A)长度：108个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-25(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..108(xi)序列描述：SEQ ID NO：76：ACC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG CAG GTT GGG TGC 48Thr Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1 5 10 15TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG 96Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg

20 25 30CAA GAA ACC TTG 108Gln Glu Thr Leu

35(2)SEQ ID NO：77的信息：(i)序列特征：

(A)长度：36个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：77：Thr Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys1 5 10 15Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg

20 25 30Gln Glu Thr Leu

35(2)SEQ ID NO：78的信息：(i)序列特征：

(A)长度：108个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-20(ix)特性：

(A)名称/关键词：CDS

(B)位置：52..108(xi)序列描述：SEQ ID NO：78：GCCGACACTA CTAAGGTGTA TGTTACCAAT CCAGACAATG TGGGACGAAG G GTG GGC 57

Val Gly

1AAT GAA GTT ACC TTT GAA TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC 105Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr

5 10 15TTG 108Leu(2)SEQ ID NO：79的信息：(i)序列特征：

(A)长度：19个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：79：Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg Gln1 5 10 15Glu Thr Leu(2)SEQ ID NO：80的信息：(i)序列特征：

(A)长度：168个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-16(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..168(xi)序列描述：SEQ ID NO：80：TTG GGG TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC 48Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile1 5 10 15CAG AAC CAT ACA GCC TAT TGT GAC AAG GTG CGC ACT CCG CTT GAA TTG 96Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu

20 25 30CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG 144Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys

35 40 45TGT GAG GCT AGG CAA GAA ACC TTG 168Cys Glu Ala Arg Gln Glu Thr Leu

50 55(2)SEQ ID NO：81的信息：(i)序列特征：

(A)长度：56个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：81：Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile1 5 10 15Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu

20 25 30Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys

35 40 45Cys Glu Ala Arg Gln Glu Thr Leu

50 55(2)SEQ ID NO：82的信息：(i)序列特征：

(A)长度：313个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：Y5-50(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..313(xi)序列描述：SEQ ID NO：82：ATC ACC GTC AAC CCC AAT GAG AAA AAG CGC GTG ACG CTC TTT TCA ACG 48Ile Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr1 5 10 15CAG CAC GAC ATC TTG ACG GTA AGC TTC CTG GTC GCG TCG CTC TGT GGA 96Gln His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly

20 25 30AAT AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC 144Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser

35 40 45CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC 192Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp

50 55 60GGG GTA TCC TCC TGC GAG GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG 240Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu65 70 75 80CTG CTC TCA GTA ACC GAG ATA AGT GCT GGC GAT GGA GTA CGG GGG ATG 288Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met

85 90 95TCT TCT CCC CAT ACA GGC ATC TCT C 313Ser Ser Pro His Thr Gly Ile Ser

100(2)SEQ ID NO：83的信息：(i)序列特征：

(A)长度：104个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：83：Ile Thr Val Asn Pro Asn Glu Lys Lys Arg Val Thr Leu Phe Ser Thr1 5 10 15Gln His Asp Ile Leu Thr Val Ser Phe Leu Val Ala Ser Leu Cys Gly

20 25 30Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser

35 40 45Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp

50 55 60Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu65 70 75 80Leu Leu Ser Val Thr Glu Ile Ser Ala Gly Asp Gly Val Arg Gly Met

85 90 95Ser Ser Pro His Thr Gly Ile Ser

100(2)SEQ ID NO：84的信息：(i)序列特征：

(A)长度：89个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-52(ix)特性：

(A)名称/关键词：CDS

(B)位置：28..87(xi)序列描述：SEQ ID NO：84：ACTGAGAGCA GCTCAGATGA GAAGACC CCT TCG GCT GTC TCG GAC TCT TGG 51

Pro Ser Ala Val Ser Asp Ser Trp

1 5ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCG CA 89Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser

10 15 20(2)SEQ ID NO：85的信息：(i)序列特征：

(A)长度：20个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：85：Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp1 5 10 15Gly Val Ser Ser

20(2)SEQ ID NO：86的信息：(i)序列特征：

(A)长度：214个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型：cDNA(iii)假设：无(iv)反义：无 (vi)原始来源：

(C)各分离株：克隆Y5-53

(ix)特性

(A)名称/关键词：CDS

(B)位置：1..100(xi)序列描述：SEQ ID NO：86：AAT AAG GCT TTT AAT ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC 48Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser1 5 10 15CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC 96Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp

20 25 30GGG G ATCTCTAGAT GCGAATTCAA GTGTGAGGCT AGGCAAGAAA CCTTGGCCTC 150GlyCTTCTCTTAC ATTTGGTCTG GAGTGCCGCT GACTAGGGCC ACGCCGGCCA AGCCTCCCGT 210GGTG 214(2)SEQ ID NO：87的信息：(i)序列特征：

(A)长度：33个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：87：Asn Lys Ala Phe Asn Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser1 5 10 15Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp

20 25 30Gly(2)SEQ ID NO：88的信息：(i)序列特征：

(A)长度：113个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-55(ix)特性：

(A)名称/关键词：CDS

(B)位置：52..113(xi)序列描述：SEQ ID NO：88：CCATCGCCAG CACTTATCTC GGTTACTGAG AGCAGCTCAG ATCAGAAGAC C CCT TCG 57

Pro Ser

1GCT GTC TCG GAC TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA 105Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val

5 10 15TCC TCG CA 113Ser Ser

20(2)SEQ ID NO：89的信息：(i)序列特征：

(A)长度：20个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：89：Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp1 5 10 15Gly Val Ser Ser

20(2)SEQ ID NO：90的信息：(i)序列特征：

(A)长度：330个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-56(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..330(xi)序列描述：SEQ ID NO：90：ACG TTG AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC TCT TGG ATG 48Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met1 5 10 15ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC 96Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr

20 25 30GAC GGG GTC TTC TCA TCT GAG CTG CTC TCA GTA ACC GAG ATA AGT GCT 144Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala

35 40 45GGC GAT GGA GTA CGG GGG ATG TCT TCT CCC CAT ACA GGC ATC TCT CGG 192Gly Asp Gly Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg

50 55 60CTA CTA CCA CAA AGA GAG GGT GTA CTG CAG TCC TCC ATG ATG ACA TCA 240Leu Leu Pro Gln Arg Glu Gly Val Leu Gln Ser Ser Met Met Thr Ser65 70 75 80ATG TGC GGT TCA AGA ATC CTC GCA GCA TTC TCG ATC GCT TGG AGA GCA 288Met Cys Gly Ser Arg Ile Leu Ala Ala Phe Ser Ile Ala Trp Arg Ala

85 90 95GCA GCC GCC GGC GGC AGA TCG GCC TCA GTC AGT TCT GAG TCT 330Ala Ala Ala Gly Gly Arg Ser Ala Ser Val Ser Ser Glu Ser

100 105 110(2)SEQ ID NO：91的信息：(i)序列特征：

(A)长度：110个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：91：Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met1 5 10 15Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr

20 25 30Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr Glu Ile Ser Ala

35 40 45Gly Asp Gly Val Arg Gly Met Ser Ser Pro His Thr Gly Ile Ser Arg

50 55 60Leu Leu Pro Gln Arg Glu Gly Val Leu Gln Ser Ser Met Met Thr Ser65 70 75 80Met Cys Gly Ser Arg Ile Leu Ala Ala Phe Ser Ile Ala Trp Arg Ala

85 90 95Ala Ala Ala Gly Gly Arg Ser Ala Ser Val Ser Ser Glu Ser

100 105 110(2)SEQ ID NO：92的信息：(i)序列特征：

(A)长度：195个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-57(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..195(xi)序列描述：SEQ ID NO：92：ACG GAA AGA GCC ACG TTG AAG ACA CTT TCC TCC CCT TCG GCT GCC TCG 48Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Ala Ser1 5 10 15GAC TCT TGG ATG ACC TCG AAT GAG TCG GAG GAC GGG GTA TCC TCC TGC 96Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys

20 25 30GAA GAG GAC ACC GAC GGG GTC TTC TCA TCT GAG CTG CTC TCA GTA ACC 144Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr

35 40 45GAG ATA AGT GCT GGC GGT GGA GTA CGG GGG ATG TCT TCT CCC CAT ACG 192Glu Ile Ser Ala Gly Gly Gly Val Arg Gly Met Ser Ser Pro His Thr

50 55 60GGC 195Gly65(2)SEQ ID NO：93的信息：(i)序列特征：

(A)长度：65个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：93：Thr Glu Arg Ala Thr Leu Lys Thr Leu Ser Ser Pro Ser Ala Ala Ser1 5 10 15Asp Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser Cys

20 25 30Glu Glu Asp Thr Asp Gly Val Phe Ser Ser Glu Leu Leu Ser Val Thr

35 40 45Glu Ile Ser Ala Gly Gly Gly Val Arg Gly Met Ser Ser Pro His Thr

50 55 60Gly65(2)SEQ ID NO：94的信息：(i)序列特征：

(A)长度：115个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-60(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..115 (xi)序列描述：SEQ ID NO：94：AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC TCT TGG ATG ACC TCG 48Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser1 5 10 15AAT GAG TCA GAG GAC GGG GTA TCC TCC TGC GAG GAG GAC ACC GAC TGG 96Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Trp

20 25 30GTC TTC TCA TCT GAG CTG C 115Val Phe Ser Ser Glu Leu

35(2)SEQ ID NO：95的信息：(i)序列特征：

(A)长度：38个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：95：Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Serl 5 10 15Asn Glu Ser Glu Asp Gly Val Ser Ser Cys Glu Glu Asp Thr Asp Trp

20 25 30Val Phe Ser Ser Glu Leu

35(2)SEQ ID NO：96的信息：(i)序列特征：

(A)长度：93个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆Y5-63(ix)特性：

(A)名称/关键词：CDS

(B)位置：19..93(xi)序列描述：SEQ ID NO：96：GAGAGCAGCT CAGATGAG AAG ACA CTT TCC TCC CCT TCG GCT GTC TCG GAC 51

Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp

1 5 10TCT TGG ATG ACC TCG AAT GAG TCA GAG GAC GGG GTA TCC TCG 93Ser Trp Met Thr Ser Asn Glu Ser Glu Asp Gly Val Ser Ser

15 20 25(2)SEQ ID NO：97的信息：(i)序列特征：

(A)长度：25个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：97：Lys Thr Leu Ser Ser Pro Ser Ala Val Ser Asp Ser Trp Met Thr Ser1 5 10 15Asn Glu Ser Glu Asp Gly Val Ser Ser

20 25(2)SEQ ID NO：98的信息：(i)序列特征：

(A)长度：1181个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列8E3(xi)序列描述：SEQ ID NO：98：GCTGGCTGAG GCACGGTTGG TCCCGCTGAT CTTGCTGCTG CTATGGTGGT GGGTGAACCA 60GCTGGCAGTC CTAGGGCTGC CGGCTGTGGA AGCCGCCGTG GCAGGTGAGG TCTTCGCGGG 120CCCTGCCCTG TCCTGGTGTC TGGGACTCCC GGTCGTCAGT ATGATATTGG GTTTGGCAAA 180CCTGGTGCTG TACTTTAGAT GGTTGGGACC CCAACGCCTG ATGTTCCTCG TGTTGTGGAA 240GCTTGCTCGG GGAGCTTTCC CGCTGGCCCT CTTGATGGGG ATTTCGGCGA CCCGCGGGCG 300CACCTCAGTG CTCGGGGCCG AGTTCTGCTT CGATGCTACA TTCGAGGTGG ACACTTCGGT 360GTTGGGCTGG GTGGTGGCCA GTGTGGTAGC TTGGGCCATT GCGCTCCTGA GCTCGATGAG 420CGCAGGGGGG TGGAGGCACA AAGCCGTGAT CTATAGGACG TGGTGTAAGG GGTACCAGGC 480AATCCGTCAA AGGGTGGTGA GGAGCCCCCT CGGGGAGGGG CGGCCTGCCA AACCCCTGAC 540CTTTGCCTGG TGCTTGGCCT CGTACATCTG GCCAGATGCT GTGATGATGG TGGTGGTTGC 600CTTGGTCCTT CTCTTTGGCC TGTTCGACGC GTTGGATTGG GCCTTGGAGG AGATCTTGGT 660GTCCCGGCCC TCGTTGCGGC GTTTGGCTCG GGTGGTTGAG TGCTGTGTGA TGGCGGGTGA 720GAAGGCCACA ACCGTCCGGC TGGTCTCCAA GATGTGTGCG AGAGGAGCTT ATTTGTTCGA 780TCATATGGGC TCTTTTTCGC GTGCTGTCAA GGAGCGCCTG TTGGAATGGG ACGCAGCTCT 840TGAACCTCTG TCATTCACTA GGACGGACTG TCGCATCATA CGGGATGCCG CGAGGACTTT 900GTCCTGCGGG CAGTGCGTCA TGGGTTTACC CGTGGTTGCG CGCCGTGGTG ATGAGGTTCT 960CATCGGCGTC TTCCAGGATG TGAATCATTT GCCTCCCGGG TTTGTTCCGA CCGCGCCTGT 1020TGTCATCCGA CGGTGCGGAA AGGGCTTCTT GGGGGTCACA AAGGCTGCCT TGACAGGTCG 1080GGATCCTGAC TTACATCCAG GGAACGTCAT GGTGTTGGGG ACGGCTACGT CGCGAAGCAT 1140GGGAACATGC TTGAACGGCC TGCTGTTCAC GACCTTCCAT G 1181(2)SEQ ID NO：99的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物Y5-10-F1(xi)序列描述：SEQ ID NO：99：TCAGCCATGG CTCGTGCGCC CGCGATGGTC 30(2)SEQ ID NO：100的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物Y5-10-R1(xi)序列描述：SEQ ID NO：100：CGAGGATCCA GCCGCCGGCG GCAGATC 27(2)SEQ ID NO：101的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物Y5-16F1(xi)序列描述：SEQ ID NO：101：GATTCCATGG GTTTGGGGTT GACGGTGGCT GA 32(2)SEQ ID NO：102的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470EP-R3(xi)序列描述：SEQ ID NO：102：GCGAATTCGG ATCCCAAGGT TTCTTGCCTA GC 32(2)SEQ ID NO：103的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物Y5-5-F1(xi)序列描述：SEQ ID NO：103：GAGGCCATGG CCTATTGTGA CAAGGTG 27(2)SEQ ID NO：104的信息：(i)序列特征：

(A)长度：17个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物PGEX-R(xi)序列描述：SEQ ID NO：104：GACCGTCTCC GGGAGCT 17(2)SEQ ID NO：105的信息：(i)序列特征：

(A)长度：326个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆GE15(ix)特性：

(A)名称/关键词：CDS

(B)位置：3..326(xi)序列描述：SEQ ID NO：105：CC ATG GAG GTC TCT GAC TTC CGT GGC TCG TCT GGC TCA CCG GTC CTA 47Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu

1 5 10 15TGT GAC GAA GGG CAC GCA GTA GGA ATG CTC GTG TCT GTG CTT CAC TCC 95Cys Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser

20 25 30GGT GGT AGG GTC ACC GCG GCA CGG TTC ACT AGG CCG TGG ACC CAA GTG 143Gly Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val

35 40 45CCA ACA GAT GCC AAA ACC ACC ACT GAA CCC CCT CCG GTG CCG GCC AAA 191Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys

50 55 60GGA GTT TTC AAA GAG GCC CCG TTG TTT ATG CCT ACG GGA GCG GGA AAG 239Gly Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys

65 70 75AGC ACT CGC GTC CCG TTG GAG TAC GGC AAC ATG GGG CAC AAG GTC TTA 287Ser Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu80 85 90 95ATC TTG AAC CCC TCA GTG GCC ACT GTG CGG GCG ATG GGC 326Ile Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly

100 105(2)SEQ ID NO：106的信息：(i)序列特征：

(A)长度：108个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性 (ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：106：Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys1 5 10 15Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser Gly

20 25 30Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro

35 40 45Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly

50 55 60Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser65 70 75 80Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu Ile

85 90 95Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly

100 105(2)SEQ ID NO：107的信息：(i)序列特征：

(A)长度：138个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：克隆GE17(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..138(xi)序列描述：SEQ ID NO：107：GGT GAT GAG GTT CTC ATC GGC GTC TTC CAG GAT GTG AAT CAT TTG CCT 48Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro1 5 10 15CCC GGG TTT GTT CCG ACC GCG CCT GTT GTC ATC CGA CGG TGC GGA AAG 96Pro Gly Phe Val pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys

20 25 30GGC TTC TTG GGG GTC ACA AAG GCT GCC TTG ACA GGT CGG GAT 138Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp

35 40 45(2)SEQ ID NO：108的信息：(i)序列特征：

(A)长度：46个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：108：Gly Asp Glu Val Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro1 5 10 15Pro Gly Phe Val Pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys

20 25 30Gly Phe Leu Gly Val Thr Lys Ala Ala Leu Thr Gly Arg Asp

35 40 45(2)SEQ ID NO：109的信息：(i)序列特征：

(A)长度：395个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列9E3(xi)序列描述：SEQ ID NO：109：TGTATTTGTC CTGTTATACC TGATGAAGCT GGCTGAGGCA CGGTTGGTCC CGCTGATCTT 60GCTGCTGCTA TGGTGGTGGG TGAACCAGCT GGCAGTCCTA GGGCTGCCGG CTGTGGAAGC 120CGCCGTGGCA GGTGAGGTCT TCGCGGGCCC TGCCCTGTCC TGGTGTCTGG GACTCCCGGT 180CGTCAGTATG ATATTGGGTT TGGCAAACCT AGTGCTGTAC TTTAGATGGT TGGGACCCCA 240ACGCCTGATG TTCCTCGTGT TGTGGAAGCT TGCTCGGGGA GCTTTCCCGC TGGCCCTCTT 300GATGGGGATT TCGGCGACCC GCGGGCGCAC CTCAGTGCTC GGGGCCGAGT TCTGCTTCGA 360TGCTACATTC GAGGTGGACA CTTCGGTGTT GGGCT 395(2)SEQ ID NO：110的信息：(i)序列特征：

(A)长度：460个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列10E3(xi)序列描述：SEQ ID NO：110：GCCCCTGGGC AACCAGGGCC GAGGCAACCC GGTGCGGTCG CCCTTGGGTT TTGGGTCCTA 60CGCCATGACC AGGATCCGAG ATACCCTACA TCTGGTGGAG TGTCCCACAC CAGCCATTGA 120GCCTCCCACC GGGACGTTTG GGTTCTTCCC CGGGACGCCG CCTCTCAACA ACTGCATGCT 180CTTGGGCACG GAAGTGTCCG AGGCACTTGG GGGGGCTGGC CTCACGGGGG GGTTCTATGA 240ACCCCTGGTG CGCAGGTGTT CGAAGCTGAT GGGAAGCCGA AATCCGGTTT GTCCGGGGTT 300TGCATGGCTC TCTTCGGGCA GGCCTGATGG GTTTATACAT GTCCAGGGTC ACTTGCAGGA 360GGTGGATGCA GGCAACTTCA TCCCGCCCCC GCGCTGGTTG CTCTTGGACT TTGTATTTGT 420CCTGTTATAC CTGATGAAGC TGGCTGAGGC ACGGTTGGTC 460(2)SEQ ID NO：111的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE15F(xi)序列描述：SEQ ID NO：111：GCCGCCATGG AGGTCTCTGA CTTCCGTG 28(2)SEQ ID NO：112的信息：(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE15R(xi)序列描述：SEQ ID NO：112：GCGCGGATCC GCCCATCGCC CGCACAGTGG C 31(2)SEQ ID NO：113的信息：(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE17F(xi)序列描述：SEQ ID NO：113：CGCTCCATGG GTGATGAGGT TCTCATCGGC G 31(2)SEQ ID NO：114的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE17R(xi)序列描述：SEO ID NO：114：GTAAGTCAGG ATCCCGACCT GTCAAGGC 28(2)SEQ ID NO：115的信息：(i)序列特征：

(A)长度：452个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：pGEX-HISb-GE3-s HGV质粒的含

含有NCoI/ECoRI的片段(xi)序列描述：SEQ ID NO：115：CAAAATCGGA TCTGGTTCCG CGTGGTTCCA TGGTCTCATG GGACGCGGAC GCTCGTGCGC 60CCGCGATGGT CTATGGCCCT GGGCAAAGTG TTACCATTGA CGGGGAGCGC TACACCTTGC 120CTCATCAACT GAGGCTCAGG AATGTGGCAC CCTCTGAGGT TTCATCCGAG GTGTCCATTG 180ACATTGGGAC GGAGACTGAA GACTCAGAAC TGACTGAGGC CGATCTGCCG CCGGCGGCTG 240CTGCTCTCCA AGCGATCGAG AATGCTGCGA GGATTCTTGA ACCGCACATT GATGTCATCA 300TGGAGGACTG CAGTACACCC TCTCTTTGTG GTAGTAGCCG AGAGATGCCT GTATGGGGAG 360AAGACATCCC CCGTACTCCA TCGCCAGCAC TTATCGGATC CCACCATCAC CATCACCATT 420AGAATTCATC GTGACTGACT GACGATCTAC CT 452(2)SEQ ID NO：116的信息：(i)序列特征：

(A)长度：590个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列11E3(xi)序列描述：SEQ ID NO：116：AGCAATCGGC TGGGGTGACC CCATCACTTA TTGGAGCCAC GGGCAAAATC AGTGGCCCCT 60TTCATGCCCC CAGTATGTCT ATGGGTCTGC TACAGTCACT TGCGTGTGGG GTTCCGCTTC 120TTGGTTTGCC TCCACCAGTG GTCGCGACTC GAAGATAGAT GTGTGGAGTT TAGTGCCAGT 180TGGCTCTGCC ACCTGCACCA TAGCCGCACT TGGATCATCG GATCGCGACA CGGTGCCTGG 240GCTCTCCGAG TGGGGAATCC CGTGCGTGAC GTGTGTTCTG GACCGTCGGC CTGCCTCCTG 300CGGCACCTGT GTGAGGGACT GCTGGCCCGA GACCGGGTCG GTTAGGTTCC CATTCCATCG 360GTGCGGCGTG GGGCCTCGGC TGACAAAGGA CTTGGAAGCT GTGCCCTTCG TCAACAGGAC 420AACTCCCTTC ACCATTAGGG GGCCCCTGGG CAACCAGGGC CGAGGCAACC CGGTGCGGTC 480GCCCTTGGGT TTTGGGTCCT ACGCCATGAC CAGGATCCGA GATACCCTAC ATCTGGTGGA 540GTGTCCCACA CCAGCCATCG AGCCTCCCAC CGGGACGTTT GGGTTCTTCC 590(2)SEQ ID NO：117的信息：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：探针E3-111PROB(xi)序列描述：SEQ ID NO：117：TGGTGAAGGG AGTTGTCCTA TTGACGAAG 29(2)SEQ ID NO：118的信息：(i)序列特征：

(A)长度：735个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：共有序列12E3(xi)序列描述：SEQ ID NO：118：ATTGTTGTGC CCCGGAGGAC ATCGGGTTCT GCCTGGAGGG TGGATGCCTG GTGGCCCTGG 60GGTGCACGAT TTGCACTGAC CAATGCTGGC CACTGTATCA GGCGGGTTTG GCTGTGCGGC 120CTGGCAAGTC CGCGGCCCAA CTGGTGGGGG AGCTGGGTAG CCTATACGGG CCCCTGTCGG 180TCTCGGCCTA TGTGGCTGGG ATCCTGGGCC TGGGTGAGGT GTACTCGGGT GTCCTAACGG 240TGGGAGTCGC GTTGACGCGC CGGGTCTACC CGGTGCCTAA CCTGACGTGT GCAGTCGCGT 300GTGAGCTAAA GTGGGAAAGT GAGTTTTGGA GATGGACTGA ACAGCTGGCC TCCAACTACT 360GGATTCTGGA ATACCTCTGG AAGGTCCCAT TTGATTTCTG GAGAGGCGTG ATAAGCCTGA 420CCCCCTTGTT GGTTTGCGTG GCCGCATTGC TGCTGCTTGA GCAACGGATT GTCATGGTCT 480TCCTGTTGGT GACGATGGCC GGGATGTCGC AAGGCGCCCC TGCCTCCGTT TTGGGGTCAC 540GCCCCTTTGA CTACGGGTTG ACTTGGCAGA CCTGCTCTTG CAGGGCCAAC GGTTCGCGTT 600TTTCGACTGG GGAGAAGGTG TGGGACCGTG GGAACGTTAC GCTTCAGTGT GACTGCCCTA 660ACGGCCCCTG GGTGTGGTTG CCAGCCTTTT GCCAAGCAAT CGGCTGGGGT GACCCCATCA 720CTTATTGGAG CCACG 735(2)SEQ ID NO：119的信息：(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470EXT4-2189R(xi)序列描述：SEQ ID NO：119：ATCTGTGGTA TGCCATCCCG GT 22(2)SEQ ID NO：120的信息：(i)序列特征：

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470EXT4-29F(xi)序列描述：SEQ ID NO：120：GTTATGCTAC TGTCGAAGCA GGT 23(2)SEQ ID NO：121的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GV57-4512MF(xi)序列描述：SEQ ID NO：121：GGACTTCCGG ATAGCTGARA AGCT 24(2)SEQ ID NO：122的信息：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GV57-4657MR(xi)序列描述：SEQ ID NO：122：GCRTCCACAC AGATGGCGCA 20(2)SEQ ID NO：123的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：探针GV22dc-89MF(xi)序列描述：SEQ ID NO：123：CYCGCTGRTT TGGGGTGTAC TGGAAGGC 28(2)SEQ ID NO：124的信息：(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：5’UTR引物FV94-22F(xi)序列描述：SEQ ID NO：124：GAAAGCCCCA GAAACCGACG CCTATCTAAG T 31(2)SEQ ID NO：125的信息：(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无(iv)反义：无 (vi)原始来源：(C)各分离株：5’UTR引物FV94-724R(xi)序列描述：SEQ ID NO：125：GCACAGCCAA ACCCGCCTGA TACAGT 26(2)SEQ ID NO：126的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：5’-UTR引物FV94-94F(xi)序列描述：SEQ ID NO：126：GTGGTGGATG GGTGATGACA GGGTTGGT 28(2)SEQ ID NO：127的信息：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：5’-UTR引物FV94-912R (xi)序列描述：SEQ ID NO：127：TAACTCACAC GCGACTGCAC ACGTCAGGT 29(2)SEQ ID NO：128的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：ENV文库引物GEP-F15(xi)序列描述：SEQ ID NO：128：GCGGCCATGG TGCCCTTCGT CAATAGGACA 30(2)SEQ ID NO：129的信息：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：ENV文库引物GEP-R15(xi)序列描述：SEQ ID NO：129：CTTGCCATGG CCAGCTGGTT CACCCACCA 29(2)SEQ ID NO：130的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GEP-F17(xi)序列描述：SEQ ID NO：130：GCAGGATCCC CTCTGGAAGG TCCCATTTGA 30(2)SEQ ID NO：131的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GEP-R16(xi)序列描述：SEQ ID NO：131：TGCGAATCCT CGGCCCTGGT TGCCCAG 27(2)SEQ ID NO：132的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470ep-F9(xi)序列描述：SEQ ID NO：132：GCTAGATCTG GCAACATGGG GCACAAGGTC 30(2)SEQ ID NO：133的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470ep-R9(xi)序列描述：SEQ ID NO：133：CACAGATCTC GCGTAGTAGT AGCGTCCAGA 30(2)SEQ ID NO：134的信息：(i)序列特征：

(A)长度：38个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：种族(Race)PCR的AP引物(xi)序列描述：SEQ ID NO：134：CTGGTTCGGC CCACCTCTGA AGGTTCCAGA ATCGATAG 38(2)SEQ ID NO：135的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GEP-F10(xi)序列描述：SEQ ID NO：135：GCTGGATCCA GCATGGGAAC ATGCTTGAAC 30(2)SEQ ID NO：136的信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GEP-R10(xi)序列描述：SEQ ID NO：136：CGCGGATCCC ACAGTGGCCA CTGAGGGGTT 30(2)SEQ ID NO：137的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物EXY10-F1(xi)序列描述：SEQ ID NO：137：GCCCATATGG TGATCACTGG TGACGTT 27(2)SEQ ID NO：138的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物EXY10-F2 (xi)序列描述：SEQ ID NO：138：GCCCATATGC TGGGTTACGG TGAA 24(2)SEQ ID NO：139的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物EXY10-F3(xi)序列描述：SEQ ID NO：139：GCCCATATGA CCTCCGCCTA TAAGCTG 27(2)SEQ ID NO：140的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物EXY10-R1(xi)序列描述：SEQ ID NO：140：GCCCATATGA GCCGCCGGCG GCAGATC 27(2)SEQ ID NO：141的信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物EXY5-R1(xi)序列描述：SEQ ID NO：141：TGCGGATCCC ACATTGTCTG GATT 24(2)SEQ ID NO：142的信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物Y5-5-F1(xi)序列描述：SEQ ID NO：142：TCGGCCATGG CCTATTGTGA CAAGGTG 27(2)SEQ ID NO：143的信息：(i)序列特征：

(A)长度：219个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：抗原克隆Q7-12-1(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..219(xi)序列描述：SEQ ID NO：143：GTG CCC TTC GTC AAT AGG ACA ACT CTC TTC ACC ATT AGG GGG CCC CTG 48Val Pro Phe Val Asn Arg Thr Thr Leu Phe Thr Ile Arg Gly Pro Leu1 5 10 15GGC AAC CAG GGC CGA GGC AAC CCG GTG CGG TCG CCC TTG GGT TTT GGG 96Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly

20 25 30TCC TAC GCC ATG ACC AGG ATC CGA GAT ACC CTA CAT CTG GTG GAG TGT 144Ser Tyr Ala Met Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys

35 40 45CCC ACA CCA GCC ATC GAG CCT CCC ACC GGG ACG TCT GGG TTC TTC CCC 192Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Ser Gly Phe Phe Pro

50 55 60GGG ACG CCG CCT CTC AAC AGC TGC ATG 219Gly Thr Pro Pro Leu Asn Ser Cys Met65 70(2)SEQ ID NO：144的信息：(i)序列特征：

(A)长度：73个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性 (ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：144：Val Pro Phe Val Asn Arg Thr Thr Leu Phe Thr Ile Arg Gly Pro Leu1 5 10 15Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly

20 25 30Ser Tyr Ala Met Thr Arg Ile Arg Asp Thr Leu His Leu Val Glu Cys

35 40 45Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Ser Gly Phe Phe Pro

50 55 60Gly Thr Pro Pro Leu Asn Ser Cys Met65 70(2)SEQ ID NO：145的信息：(i)序列特征：

(A)长度：264个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：抗原克隆Y12-10-3(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..264(xi)序列描述：SEQ ID NO：145：CCC CTC GAG CGG ATG CGA ACC GGA AGG CAC CTC GTG TTC TGC CAT TCT 48Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser1 5 10 15AAG GCT GAG TGC GAG CGC CTT GCT GGC CAG TTC TCC GCT AGG GGG GTC 96Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val

20 25 30AAT GCC ATT GCC TAT TAT AGG GGT AAA GAC AGC TCT ATC ATC AAG GAT 144Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp

35 40 45GGG GAC CTG GTG GTC TGT GCT ACA GAC GCG CTT TCC ACT GGG TAC ACT 192Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr

50 55 60GGA AAT TTC GAC TCC GTC ACC GAC TGT GGA TTA GTG GTG GAG GAG GTC 240Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val65 70 75 80GTT GAG GTG ACC CTT GAT CCC ACC 264Val Glu Val Thr Leu Asp Pro Thr

85(2)SEQ ID NO：146的信息：(i)序列特征：

(A)长度：88个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：146：Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe Cys His Ser1 5 10 15Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val

20 25 30Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp

35 40 45Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr

50 55 60Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val65 70 75 80Val Glu Val Thr Leu Asp Pro Thr

85(2)SEQ ID NO：147的信息：(i)序列特征：

(A)长度：205个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：抗原克隆Y12-15-1(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..205(xi)序列描述：SEQ ID NO：147：GCT AGA TCT GGC AAC ATG GGG CAC AAG GTC TTA ATC TTG AAC CCC TCA 48Ala Arg Ser Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser1 5 10 1SGTG GCC ACT GTG CGG GCC ATG GGC CCG TAC ATG GAG CGG CTG GCG GGT 96Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly

20 25 30AAA CAT CCA AGT ATA TAC TGT GGG CAT GAT ACA ACT GCT TTC ACA AGG 144Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg

35 40 45ATC ACT GAC TCC CCC CTG ACG TAT TCA ACC TAT GGG AGG TTT TTG GCC 192Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala

50 55 60AAC CCT AGG CAG A 205Asn Pro Arg Gln65(2)SEQ ID NO：148的信息：(i)序列特征：

(A)长度：68个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：148：Ala Arg Ser Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser1 5 10 15Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly

20 25 30Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg

35 40 45Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala

50 55 60Asn Pro Arg Gln65(2)SEQ ID NO：149的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE4F(xi)序列描述：SEQ ID NO：149：GCCGCCATGG CTCTCCAAGC GATCGAGAAT GC 32(2)SEQ ID NO：150的信息：(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物GE4R(xi)序列描述：SEQ ID NO：150：GCGCGGATCC CAACCCCAAT GAGAAAAAGC G 31(2)SEQ ID NO：151的信息：(i)序列特征：

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470EXP3F(xi)序列描述：SEQ ID NO：151：CCGCCATGGG ACGCGGACGC TCG 23(2)SEQ ID NO：152的信息：(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物470EXP3R(xi)序列描述：SEQ ID NO：152：CGCGGATCCT TACTGTCTTA TTGCTTCC 28(2)SEQ ID NO：153的信息：(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物FV94-2888F(xi)序列描述：SEQ ID NO：153：GCGGAATTCT TGGCTCGGGT GGTTGAGTGC TGTG 34(2)SEQ ID NO：154的信息：(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性(ii)分子类型：DNA(iii)假设：无 (iv)反义：无(vi)原始来源：

(C)各分离株：引物FV94-3216R(xi)序列描述：SEQ ID NO：154：GCGAAGCTTC CGTCGGATGA CAACAGGCGC CG 32(2)SEQ ID NO：155的信息：(i)序列特征：

(A)长度：36个碱基对

(B)类型：核酸

(C)链型：两种

(C)各分离株：引物FV94-6521F(xi)序列描述：SEQ ID NO：155：GCGGAATTCA CCTCCGCCTA TAAGCTGCTG CGCCAG 36(2)SEQ ID NO：156的信息：(i)序列特征：

(A)长度：42个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA(iii)假设：无(iv)反义：无(vi)原始来源：

(C)各分离株：引物FV94-7483R

(xi)序列描述：SEQ ID NO：156：GCTGCGGCCG CCCTCCGTCC CACATTGTCT GGATTGGTAA CA 42(2)SEQ ID NO：157的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物T7F

(xi)序列描述：SEQ ID NO：157：ATTAATACGA CTCACTATAG GG 22(2)SEQ ID NO：158的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物T7R

(xi)序列描述：SEQ ID NO：158：CAAGGGGTTA TGCTAGTTAT TG 22(2)SEQ ID NO：159的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：抗原克隆GE4-8

(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..402

(xi)序列描述：SEQ ID NO：159：GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT 48Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile1 5 10 15GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC 96Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser

20 25 30CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA 144Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro

35 40 45GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG 192Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser

50 55 60GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC 240Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val65 70 75 80ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG 288Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val

85 90 95GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG 336Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg

100 105 110AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC 384Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg

115 120 125TTT TTC TCA TTG GGG TTG 402Phe Phe Ser Leu Gly Leu

130(2)SEQ ID NO：160的信息：

(i)序列特征：

(A)长度：134个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：160：Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile1 5 10 15Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser

20 25 30Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro

35 40 45Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser

50 55 60Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val65 70 75 80Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val

85 90 95Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg

100 105 110Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg

115 120 125Phe Phe Ser Leu Gly Leu

130(2)SEQ ID NO：161的信息：

(i)序列特征：

(A)长度：1011个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：抗原克隆EXP3-7

(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..1011

(xi)序列描述：SEQ ID NO：161：ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC 48Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr1 5 10 15ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG GCA CCC TCT GAG GTT 96Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val

20 25 30TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA 144Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu

35 40 45CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT GCT CTC CAA GCG ATC 192Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile

50 55 60GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT GAT GTC ATC ATG GAG 240Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu65 70 75 80GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTA 288Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val

85 90 95TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA GCA CTT ATC TCG GTT 336Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val

100 105 110ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG 384Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln

115 120 125GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC ATC CAA GAG TCC GAG 432Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu

130 135 140ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG GCT CTT TCC GTA TTA 480Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu145 150 155 160AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG AAG CTT ACC GTC AAG 528Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys

165 170 175ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC TTT TTC TCA TTG GGG 576Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly

180 185 190TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG ATG GAA ATC CAG AAC 624Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn

195 200 205CAT ACA GCC TAT TGT GAC CAG GTG CGC ACT CCG CTT GAA TTG CAG GTT 672His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val

210 215 220GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAC AAG TGT GAG 720Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu225 230 235 240GCT AGG CAA GAA ACC TTG GCC TCC TTC TCT TAC ATT TGG TCT GGA GTG 768Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val

245 250 255CCG CTG ACT AGG GCC ACG CCG GCC AAG CCT CCC GTG GTG AGG CCG GTT 816Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val

260 265 270GGC TCT TTG TTA GTG GCC GAC ACT ACT AAG GTG TAT GTT ACC AAT CCA 864Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro

275 280 285GAC AAT GTG GGA CGG AGG GTG GAC AAG GTG ACC TTC TGG CGT GCT CCT 912Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro

290 295 300AGG GTT CAT GAT AAG TAC CTC GTG GAC TCT ATT GAG CGC GCT AAG AGG 960Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg305 310 315 320GCC GCT CAA GCC TGC CTA AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA 1008Ala Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile

325 330 335AGG 1011Arg(2)SEQ ID NO：162的信息：

(i)序列特征：

(A)长度：337个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：162：Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr1 5 10 15Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val

20 25 30Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu

35 40 45Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile

50 55 60Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu65 70 75 80Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val

85 90 95Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val

100 105 110Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln

115 120 125Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu

130 135 140Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu145 150 155 160Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Lys

165 170 175Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly

180 185 190Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn

195 200 205His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro Leu Glu Leu Gln Val

210 215 220Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu225 230 235 240Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val

245 250 255Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val

260 265 270Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro

275 280 285Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro

290 295 300Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Lys Arg305 310 315 320Ala Ala Gln Ala Cys Leu Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile

325 330 335Arg(2)SEQ ID NO：163的信息：

(i)序列特征：

(A)长度：351个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：抗原克隆GENS2b-1

(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..351

(xi)序列描述：SEQ ID NO：163：TTG GCT CGG GTG GTT GAG TGC TGT GTG ATG GCG GGT GAG AAG GCC ACA 48Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr1 5 10 15ACC GTC CGG CTG GTC TCC AAG ATG TGT GCG AGA GGA GCT TAT TTG TTC 96Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe

20 25 30GAT CAT ATG GGC TCT TTT TCG CGT GCT GTC AAG GAG CGC CTG TTG GAA 144Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu

35 40 45TGG GAC GCA GCT CTT GAA CCT CTG TCA TTC ACT AGG ACG GAC TGT CGC 192Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg

50 55 60ATC ATA CGG GAT GCC GCG AGG ACT TTG TCC TGC GGG CAG TGC GTC ATG 240Ile Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met65 70 75 80GGT TTA CCC GTG GTT GCG CGC CGT GGT GAT GAG GTT CTC ATC GGC GTC 288Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val

85 90 95TTC CAG GAT GTG AAT CAT TTG CCT CCC GGG TTT GTT CCG ACC GCG CCT 336Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro

100 105 110GTT GTC ATC CGA CGG 351Val Val Ile Arg Arg

115(2)SEQ ID NO：164的信息：

(i)序列特征：

(A)长度：117个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：164：Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr1 5 10 15Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe

20 25 30Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu

35 40 45Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg

50 55 60Ile Ile Arg Asp Ala Ala Arg Thr Leu Ser Cys Gly Gln Cys Val Met65 70 75 80Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val

85 90 95Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro

100 105 110Val Val Ile Arg Arg

115(2)SEQ ID NO：165的信息：

(i)序列特征：

(A)长度：993个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：抗原克隆GENS5a-3

(ix)特性：

(A)名称/关键词：CDS

(B)位置：1..993

(xi)序列描述：SEQ ID NO：165：ACC TCC GCC TAT AAG CTG CTG CGC CAG CAA ATC CTA TCG GCT GCT GTA 48Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val1 5 10 15GCT GAG CCC TAC TAC GTC GAC GGC ATT CCG GTC TCA TGG GAC GCG GAC 96Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp

20 25 30GCT CGT GCG CCC GCC ATG GTC TAT GGC CCT GGG CAA AGT GTT ACC ATT 144Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile

35 40 45GAC GGG GAG CGC TAC ACC TTG CCT CAT CAA CTG AGG CTC AGG AAT GTG 192Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val

50 55 60GCA CCC TCT GAG GTT TCA TCC GAG GTG TCC ATT GAC ATT GGG ACG GAG 240Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu65 70 75 80ACT GAA GAC TCA GAA CTG ACT GAG GCC GAT CTG CCG CCG GCG GCT GCT 288Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala

85 90 95GCT CTC CAA GCG ATC GAG AAT GCT GCG AGG ATT CTT GAA CCG CAC ATT 336Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile

100 105 110GAT GTC ATC ATG GAG GAC TGC AGT ACA CCC TCT CTT TGT GGT AGT AGC 384Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser

115 120 125CGA GAG ATG CCT GTA TGG GGA GAA GAC ATC CCC CGT ACT CCA TCG CCA 432Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro

130 135 140GCA CTT ATC TCG GTT ACT GAG AGC AGC TCA GAT GAG AAG ACC CCG TCG 480Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser145 150 155 160GTG TCC TCC TCG CAG GAG GAT ACC CCG TCC TCT GAC TCA TTC GAG GTC 528Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val

165 170 175ATC CAA GAG TCC GAG ACA GCC GAA GGG GAG GAA AGT GTC TTC AAC GTG 576Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val

180 185 190GCT CTT TCC GTA TTA AAA GCC TTA TTT CCA CAG AGC GAC GCG ACC AGG 624Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg

195 200 205AAG CTT ACC GTC AAG ATG TCG TGC TGC GTT GAA AAG AGC GTC ACG CGC 672Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg

210 215 220TTT TTC TCA TTG GGG TTG ACG GTG GCT GAT GTT GCT AGC CTG TGT GAG 720Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu225 230 235 240ATG GAA ATC CAG AAC CAT ACA GCC TAT TGT GAC CAG GTG CGC ACT CCG 768Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro

245 250 255CTT GAA TTG CAG GTT GGG TGC TTG GTG GGC AAT GAA CTT ACC TTT GAA 816Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu

260 265 270TGT GAC AAG TGT GAG GCT AGG CAA GAA ACC TTG GCC TCC TTC TCT TAC 864Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr

275 280 285ATT TGG TCT GGA GTG CCG CTG ACT AGG GCC ACG CCG GCC AAG CCT CCC 912Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro

290 295 300GTG GTG AGG CCG GTT GGC TCT TTG TTA GTG GCC GAC ACT ACT AAG GTG 960Val Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val305 310 315 320TAT GTT ACC AAT CCA GAC AAT GTG GGA CGG AGG 993Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg

325 330(2)SEQ ID NO：166的信息：

(i)序列特征：

(A)长度：331个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：166：Thr Ser Ala Tyr Lys Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val1 5 10 15Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp

20 25 30Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile

35 40 45Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val

50 55 60Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu65 70 75 80Thr Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala

85 90 95Ala Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile

100 105 110Asp Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser

115 120 125Arg Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro

130 135 140Ala Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser145 150 155 160Val Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val

165 170 175Ile Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val

180 185 190Ala Leu Ser Val Leu Lys Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg

195 200 205Lys Leu Thr Val Lys Met Ser Cys Cys Val Glu Lys Ser Val Thr Arg

210 215 220Phe Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu225 230 235 240Met Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Gln Val Arg Thr Pro

245 250 255Leu Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu

260 265 270Cys Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr

275 280 285Ile Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro

290 295 300Val Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val305 310 315 320Tyr Val Thr Asn Pro Asp Asn Val Gly Arg Arg

325 330(2)SEQ ID NO：167的信息：

(i)序列特征：

(A)长度：536个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：共有序列3’-末端

(xi)序列描述：SEQ ID NO：167：CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA 60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA 120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTATCCCGG GGGGTTTCCC TCTCTCCCCC 180CCCTATATGG GGGTGGTACA TCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG 240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC 300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT 360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC 420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA 480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGC 536(2)SEQ ID NO：168的信息：

(i)序列特征：

(A)长度：594个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：单个克隆MP3-3

(xi)序列描述：SEQ ID NO：168：CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA 60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA 120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTATCCCGG GGGGTTTCCC TCTCTCCCCC 180CCCTATATGG GGGTGGTACA CCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG 240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC 300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT 360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC 420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA 480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGCACTG 540TGATCTGAAG GGGTGCACCC CGGGAAGAGC TCGGCCCGAA GGCCGGCTTC TACT 594(2)SEQ ID NO：169的信息：

(i)序列特征：

(A)长度：594个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：单个克隆MP3-7(xi)序列描述：SEQ ID NO：169：CTGAGCGACC TCAAGCTCCC TGGCTTAGCA GTCCACCGAA AGAAGGCCGG GGCGTTGCGA 60ACACGCATGC TCCGCTCGCG CGGTTGGGCT GAGTTGGCTA GGGGCTTGTT GTGGCATCCA 120GGCCTACGGC TTCCTCCCCC TGAGATTGCT GGTGTCCCGG GGGGTTTCCC TCTCTCCCCC 180CCCTATATGG GGGTGGTACA CCAATTGGAT TTCACAAGCC AGAGGAGTCG CTGGCGGTGG 240TTGGGGTTCT TAGCCCTGCT CATCGTAGCC CTCTTCGGGT GAACTAAATT CATCTGTTGC 300GGCAAGGTCT GGTGACTGAT CATCACCGGA GGAGGTTCCC GCCCTCCCCG CCCCAGGGGT 360CTCCCCGCTG GGTAAAAAGG GCCCGGCCTT GGGAGGCATG GTGGTTACTA ACCCCCTGGC 420AGGGTCAAAG CCTGATGGTG CTAATGCACT GCCACTTCGG TGGCGGGTCG CTACCTTATA 480GCGTAATCCG TGACTACGGG CTGCTCGCAG AGCCCTCCCC GGATGGGGCA CAGTGCACTG 540TGATCTGAAG GGGTGCACCC CGGTAAGAGC TCGGCCCGAA GGCCGGGTTC TACT 594(2)SEQ ID NO：170的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV5446IRT

(xi)序列描述：SEQ ID NO：170：CGGTCCCTCG AACTCCAGCG AGTCTTTTTT TTTTTTTTT 39(2)SEQ ID NO：171的信息：

(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV59-5446F

(xi)序列描述：SEQ ID NO：171：CTGAGCGACC TCAAGCTCCC TGGC 24(2)SEQ ID NO：172的信息：

(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV-5446IR

(xi)序列描述：SEQ ID NO：172：CGGTCCCTCG AACTCCAGCG AGTC 24(2)SEQ ID NO：173的信息：

(i)序列特征：

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：探针E5-7-PRB

(xi)序列描述：SEQ ID NO：173：CGTAGCCCTC GGGTGAACTA AAT 23(2)SEQ ID NO：174的信息：

(i)序列特征：

(A)长度：35个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：种族锚序列

(xi)序列描述：SEQ ID NO：174：CACGAATTCA CTATCGATTC TGGAACCTTC AGAGG 35(2)SEQ ID NO：175的信息：

(i)序列特征：

(A)长度：736个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：共有序列5’-末端

(xi)序列描述：SEQ ID NO：175：ACGTGGGGGA GTTGATCCCC CCCCCCCGGC ACTGGGTGCA AGCCCCAGAA ACCGACGCCT 60ATCTAAGTAG ACGCAATGAC TCGGCGCCGA CTCGGCGACC GGCCAAAAGG TGGTGGATGG 120GTGATGACAG GGTTGGTAGG TCGTAAATCC CGGTCACCTT GGTAGCCACT ATAGGTGGGT 180CTTAAGAGAA GGTTAAGATT CCTCTTGTGC CTGCGGCGAG ACCGCGCACG GTCCACAGGT 240GTTGGCCCTA CCGGTGGGAA TAAGGGCCCG ACGTCAGGCT CGTCGTTAAA CCGAGCCCGT 300TACCCACCTG GGCAAACGAC GCCCACGTAC GGTCCACGTC GCCCTTCAAT GTCTCTCTTG 360ACCAATAGGC GTAGCCGGCG AGTTGACAAG GACCAGTGGG GGCCGGGGGC TTGGAGAGGG 420ACTCCAAGTC CCGCCCTTCC CGGTGGGCCG GGAAATGCAT GGGGCCACCC AGCTCCGCGG 480CGGCCTGCAG CCGGGGTAGC CCAAGAATCC TTCGGGTGAG GGCGGGTGGC ATTTCCTTTT 540TCTATACCAT CATGGCAGTC CTTCTGCTCC TTCTCGTGGT TGAGGCCGGG GCCATTCTGG 600CCCCGGCCAC CCACGCTTGT CGAGCGAATG GGCAATATTT CCTCACAAAT TGTTGTGCCC 660CGGAGGACAT CGGGTTCTGC CTGGAGGGTG GATGCCTGGT GGCCCTGGGG TGCACGATTT 720GCACTGACCA ATGCTG 736(2)SEQ ID NO：176的信息：

(i)序列特征：

(A)长度：688个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iV)反义：无

(Vi)原始来源：

(C)各分离株：HGV变异体BG34

(ix)特性：

(A)名称/关键词：CDS

(B)位置：272..688

(xi)序列描述：SEQ ID NO：176：GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGA CAGGGTTGGT 60AGGTCGTAAA TCCCGGTCAC CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG 120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGT 180GAATAAGGGC CCGACGTCAG GCTCGTCGTT AAACCGAGCC CGTCACCCAC CTGGGCAAAC 240GACGCCCACG TACGGTCCAC GTCGCCCTTC A ATG CCT CTC TTG GCC AAT AGG 292

Met Pro Leu Leu Ala Asn Arg

1 5AGT ATC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGA GTC ACG GGG 340Ser Ile Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Val Thr Gly

10 15 20ATG GAC CCC GGG CTC TGC CCT TCC CGG TGG AAC GGG AAA CGC ATG GGG 388Met Asp Pro Gly Leu Cys Pro Ser Arg Trp Asn Gly Lys Arg Met Gly

25 30 35CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ACC CTT 436Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Thr Leu40 45 50 55CGG GTG AGG GCG GGT GGC ATT TCT CTT TTC TGT ATC ATC ATG GCA GTC 484Arg Val Arg Ala Gly Gly Ile Ser Leu Phe Cys Ile Ile Met Ala Val

60 65 70CTC CTG CTC CTT CTC GTG GTT GAG GCC GGG GCC ATT CTG GCC CCG GCC 532Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala

75 80 85ACC CAC GCT TGT CGA GCG AAT GGA CAA TAT TTC CTC ACA AAC TGT TGC 580Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys

90 95 100GCC CTC GAG GAC ATC GGG TTC TGC CTG GAA GGC GGG TGC CTG GTG GCC 628Ala Leu Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala

105 110 115TTA GGG TGC ACC ATT TGC ACT GAC CGT TGC TGG CCA CTG TAT CAG GCG 676Leu Gly Cys Thr Ile Cys Thr Asp Arg Cys Trp Pro Leu Tyr Gln Ala120 125 130 135GGT TTG GCT GTG 688Gly Leu Ala Val(2)SEQ ID NO：177的信息：

(i)序列特征：

(A)长度：139个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：177：Met Pro Leu Leu Ala Asn Arg Ser Ile Arg Arg Val Asp Lys Asp Gln1 5 10 15Trp Gly Pro Gly Val Thr Gly Met Asp Pro Gly Leu Cys Pro Ser Arg

20 25 30Trp Asn Gly Lys Arg Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser

35 40 45Arg Gly Ser Pro Arg Thr Leu Arg Val Arg Ala Gly Gly Ile Ser Leu

50 55 60Phe Cys Ile Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala65 70 75 80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln

85 90 95Tyr Phe Leu Thr Asn Cys Cys Ala Leu Glu Asp Ile Gly Phe Cys Leu

100 105 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Arg

115 120 125Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val

130 135(2)SEQ ID NO：178的信息：

(i)序列特征：

(A)长度：663个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV变异体T55806

(ix)特性：

(A)名称/关键词：CDS

(B)位置：271..663

(xi)序列描述：SEQ ID NO：178：GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGC CAGGGTTGGT 60AGGTCGTAAA TCCCGGTCAT CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG 120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGG 180AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC TGGGCAAACG 240ACGCTCACGT ACGGTCCACG TCGCCCTTCA ATG TCT CTC TTG ACC AAT AGG TTT 294

Met Ser Leu Leu Thr Asn Arg Phe

1 5ATC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGG GTT ACG GGG ACG 342Ile Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Val Thr Gly Thr

10 15 20GAC CCC GAA CCC TGC CCT TCC CGG TGG GCC GGG AAA TGC ATG GGG CCA 390Asp Pro Glu Pro Cys Pro Ser Arg Trp Ala Gly Lys Cys Met Gly Pro25 30 35 40CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC CTT CGG 438Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile Leu Arg

45 50 55GTG AGG GCG GGT GGC ATT TCT CTT TTC TAT ACC ATC ATG GCA GTC CTT 486Val Arg Ala Gly Gly Ile Ser Leu Phe Tyr Thr Ile Met Ala Val Leu

60 65 70CTG CTC TTC TTC GTG GTT GAG GCC GGG GCG ATT CTC GCC CCG GCC ACC 534Leu Leu Phe Phe Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala Thr

75 80 85CAC GCT TGT CGG GCG AAT GGG CAA TAT TTC CTC ACA AAT TGT TGC GCC 582His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys Ala

90 95 100CCA GAG GAT GTT GGG TTC TGC CTG GAG GGC GGA TGC CTG GTG GCT CTG 630Pro Glu Asp Val Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala Leu105 110 115 120GGG TGT ACG ATT TGC ACT GAC CGT TGC TGG CCA 663Gly Cys Thr Ile Cys Thr Asp Arg Cys Trp Pro

125 130(2)SEQ ID NO：179的信息：

(i)序列特征：

(A)长度：131个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：179：Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1 5 l0 15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg

20 25 30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser

35 40 45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu

50 55 60Phe Tyr Thr Ile Met Ala Val Leu Leu Leu Phe Phe Val Val Glu Ala65 70 75 80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln

85 90 95Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Val Gly Phe Cys Leu

100 105 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Ile Cys Thr Asp Arg

115 120 125Cys Trp Pro

130(2)SEQ ID NO：180的信息：

(i)序列特征：

(A)长度：632个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV变异体EB20-2

(ix)特性：

(A)名称/关键词：CDS

(B)位置：271..632

(xi)序列描述：SEQ ID NO：180：GACTCGGCGC CGACTCGGCG ACCGGCCAAA AGGTGGTGGA TGGGTGATGC CAGGGTTGGT 60AGGTCGTAAA TCCCGGTCAT CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG 120ATTCCTCTTG TGCCTGCGGC GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGT 180AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC TGGGCAAACG 240ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATG CCT CTC TTG GCC AAT AGG AGT 294

Met Pro Leu Leu Ala Asn Arg Ser

l 5TAT CTC CGG CGA GTT GGC AAG GAC CAG TGG GGG CCG GGG GTT ACG GGG 342Tyr Leu Arg Arg Val Gly Lys Asp Gln Trp Gly Pro Gly Val Thr Gly

10 15 20AAG GAC CCC GAA CCC TGC CCT TCC CGG TGG GCC GGG AAA TGC ATG GGG 390Lys Asp Pro Glu Pro Cys Pro Ser Arg Trp Ala Gly Lys Cys Met Gly25 30 35 40CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AAA AAC CTT 438Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Lys Asn Leu

45 50 55CGG GTG AGG GCG GGT GGC ATT TTC TTT TCC TAT ACC ATC ATG GCA GTC 486Arg Val Arg Ala Gly Gly Ile Phe Phe Ser Tyr Thr Ile Met Ala Val

60 65 70CTT CTG CTC CTT CTC GTG GTT GAG GCC GGG GCC ATT TTG GCC CCG GCC 534Leu Leu Leu Leu Leu Val Val Glu Ala Gly Ala Ile Leu Ala Pro Ala

75 80 85ACC CAC GCT TGC AGA GCT AAT GGG CAA TAT TTC CTC ACA AAC TGT TGT 582Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys Cys

90 95 100GCC TTG GAG GAC ATC GGG TTC TGC CTG GAA GGC GGA TGC TTG GTG GCG CT 632Ala Leu Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val Ala105 110 115 120(2)SEQ ID NO：181的信息：

(i)序列特征：

(A)长度：120个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：181：Met Pro Leu Leu Ala Asn Arg Ser Tyr Leu Arg Arg Val Gly Lys Asp1 5 10 15Gln Trp Gly Pro Gly Val Thr Gly Lys Asp Pro Glu Pro Cys Pro Ser

20 25 30Arg Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys

35 40 45Ser Arg Gly Ser Pro Lys Asn Leu Arg Val Arg Ala Gly Gly Ile Phe

50 55 60Phe Ser Tyr Thr Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu65 70 75 80Ala Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly

85 90 95Gln Tyr Phe Leu Thr Asn Cys Cys Ala Leu Glu Asp Ile Gly Phe Cys

100 105 110Leu Glu Gly Gly Cys Leu Val Ala

ll5 120(2)SEQ ID NO：182的信息：

(i)序列特征：

(A)长度：9103个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-JC变异体

(ix)特性：

(A)名称/关键词：CDS

(B)位置：276..9005

(xi)序列描述：SEQ ID NO：182：CAATGACTCG GCGCCGACTC GGCGACCGGC CAAAAGGTGG TGGATGGGTG ATGACAGGGT 60TGGTAGGTCG TAAATCCCGG TCACCTTGGT AGCCACTATA GGTGGGTCTT AAGAGAAGGT 120TAAGATTCCT CTTGTGCCTG CGGCGAGACC GCGCACGGTC CACAGGTGTT GGCCCTACCG 180GTGGGAATAA GGGCCCGACG TCAGGCTCGT CGTTAAACCG AGCCCGTAAC CCGCCTGGGC 240AAACGACGCC CACGTACGGT CCACGTCGCC CTTCA ATG TCG CTC TTG ACC AAT 293

Met Ser Leu Leu Thr Asn

1 5AGG CTT AGC CGG CGA GTT GAC AAG GAC CAG TGG GGG CCG GGG TTT ATG 341Arg Leu Ser Arg Arg Val Asp Lys Asp Gln Trp Gly Pro Gly Phe Met

10 15 20GGG AAG GAC CCC AAA CCC TGC CCT TCC CGG CGG ACC GGG AAA TGC ATG 389Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg Arg Thr Gly Lys Cys Met

25 30 35GGG CCA CCC AGC TCC GCG GCG GCC TGC AGC CGG GGT AGC CCA AGA ATC 437Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser Arg Gly Ser Pro Arg Ile

40 45 50CTT CGG GTG AGG GCG GGT GGC ATT TCT CTT CCT TAT ACC ATC ATG GAA 485Leu Arg Val Arg Ala Gly Gly Ile Ser Leu Pro Tyr Thr Ile Met Glu55 60 65 70GCC CTC CTG TTC CTC CTC GGG GTG GAG GCC GGG GCC ATT CTG GCC CCG 533Ala Leu Leu Phe Leu Leu Gly Val Glu Ala Gly Ala Ile Leu Ala Pro

75 80 85GCC ACC CAC GCT TGT CGA GCG AAT GGG CAA TAT TTC CTC ACA AAC TGT 581Ala Thr His Ala Cys Arg Ala Asn Gly Gln Tyr Phe Leu Thr Asn Cys

90 95 100TGT GCT CCA GAG GAC ATT GGG TTC TGC CTC GAA GGC GGT TGC CTT GTG 629Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu Glu Gly Gly Cys Leu Val

105 110 115GCC CTG GGG TGC ACA GTT TGC ACT GAC CGA TGC TGG CCG CTG TAT CAG 677Ala Leu Gly Cys Thr Val Cys Thr Asp Arg Cys Trp Pro Leu Tyr Gln

120 125 130GCG GGC TTG GCT GTG CGG CCT GGC AAG TCC GCA GCC CAG CTG GTG GGG 725Ala Gly Leu Ala Val Arg Pro Gly Lys Ser Ala Ala Gln Leu Val Gly135 140 145 150CAA CTG GGT GGC CTC TAC GGG CCC TTG TCG GTG TCG GCC TAC GTG GCC 773Gln Leu Gly Gly Leu Tyr Gly Pro Leu Ser Val Ser Ala Tyr Val Ala

155 160 165GGC ATC CTG GGC CTG GGT GAG GTG TAC TCG GGT GTC CTA ACA GTT GGT 821Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser Gly Val Leu Thr Val Gly

170 175 180GTT GCG TTG ACG CGC CGG GTC TAC CCG ATG CCC AAC CTG ACG TGT GCA 869Val Ala Leu Thr Arg Arg Val Tyr Pro Met Pro Asn Leu Thr Cys Ala

185 190 195GTA GAG TGT GAG CTT AAG TGG GAA AGT GAG TTT TGG AGA TGG ACT GAG 917Val Glu Cys Glu Leu Lys Trp Glu Ser Glu Phe Trp Arg Trp Thr Glu

200 205 210CAG CTG GCC TCC AAT TAC TGG ATT CTG GAA TAC CTT TGG AAG GTC CCG 965Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu Tyr Leu Trp Lys Val Pro215 220 225 230TTT GAC TTC TGG AGA GGC GTG CTA AGC CTG ACT CCC TTG CTG GTT TGC 1013Phe Asp Phe Trp Arg Gly Val Leu Ser Leu Thr Pro Leu Leu Val Cys

235 240 245GTG GCC GCG TTG CTG CTG CTG GAG CAA CGG ATT GTC ATG GTC TTC CTG 1061Val Ala Ala Leu Leu Leu Leu Glu Gln Arg Ile Val Met Val Phe Leu

250 255 260TTG GTG ACG ATG GCC GGG ATG TCG CAA GGC GCT CCG GCC TCC GTT TTG 1109Leu Val Thr Met Ala Gly Met Ser Gln Gly Ala Pro Ala Ser Val Leu

265 270 275GGG TCT CGC CCC TTT GAC TAC GGG TTG ACA TGG CAG TCT TGT TCC TGC 1157Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr Trp Gln Ser Cys Ser Cys

280 285 290AGG GCT AAT GGG TCG CGC TAT ACT ACT GGG GAG AAG GTG TGG GAC CGT 1205Arg Ala Asn Gly Ser Arg Tyr Thr Thr Gly Glu Lys Val Trp Asp Arg295 300 305 310GGG AAC GTC ACG CTC CTG TGT GAC TGC CCC AAC GGC CCC TGG GTG TGG 1253Gly Asn Val Thr Leu Leu Cys Asp Cys Pro Asn Gly Pro Trp Val Trp

315 320 325TTG CCG GCC TTT TGC CAA GCA ATC GGC TGG GGC GAT CCC ATC ACT CAT 1301Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp Gly Asp Pro Ile Thr His

330 335 340TGG AGC CAC GGC CAA AAT CGG TGG CCC CTC TCA TGC CCC CAG TAT GTC 1349Trp Ser His Gly Gln Asn Arg Trp Pro Leu Ser Cys Pro Gln Tyr Val

345 350 355TAT GGG TCT GTT TCA GTC ACT TGC GTG TGG GGT TCC GTC TCT TGG TTT 1397Tyr Gly Ser Val Ser Val Thr Cys Val Trp Gly Ser Val Ser Trp Phe

360 365 370GCC TCG ACT GGC GGT CGC GAC TCG AAG ATC GAT GTG TGG AGT CTG GTG 1445Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile Asp Val Trp Ser Leu Val375 380 385 390CCG GTT GGT TCC GCC AGC TGC ACC ATA GCC GCT CTT GGA TCG TCG GAT 1493Pro Val Gly Ser Ala Ser Cys Thr Ile Ala Ala Leu Gly Ser Ser Asp

395 400 405CGG GAC ACG GTA GTT GAG CTC TCC GAG TGG GGA GTC CCG TGC GCA ACG 1541Arg Asp Thr Val Val Glu Leu Ser Glu Trp Gly Val Pro Cys Ala Thr

410 415 420TGC ATT CTG GAT CGT CGG CCG GCC TCG TGC GGC ACC TGT GTG AGA GAC 1589Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys Gly Thr Cys Val Arg Asp

425 430 435TGC TGG CCC GAA ACC GGG TCG GTT AGG TTT CCA TTC CAT CGG TGC GGC 1637Cys Trp Pro Glu Thr Gly Ser Val Arg Phe Pro Phe His Arg Cys Gly

440 445 450GCG GGG CCT AAG CTG ACA AAG GAC TTG GAA GCT GTG CCC TTC GTC AAT 1685Ala Gly Pro Lys Leu Thr Lys Asp Leu Glu Ala Val Pro Phe Val Asn455 460 465 470AGG ACA ACT CCC TTC ACC ATA AGG GGC CCC CTG GGC AAC CAG GGG AGA 1733Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro Leu Gly Asn Gln Gly Arg

475 480 485GGC AAC CCG GTG CGG TCG CCC TTG GGT TTT GGG TCC TAC GCC ATG ACC 1781Gly Asn Pro Val Arg Ser Pro Leu Gly Phe Gly Ser Tyr Ala Met Thr

490 495 500AAG ATC CGA GAC TCC TTA CAT TTG GTG AAA TGT CCC ACA CCA GCC ATT 1829Lys Ile Arg Asp Ser Leu His Leu Val Lys Cys Pro Thr Pro Ala Ile

505 510 515GAG CCT CCC ACC GGG ACG TTT GGG TTC TTC CCC GGA GTG CCG CCT CTT 1877Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe Pro Gly Val Pro Pro Leu

520 525 530AAC AAC TGC CTG CTG TTG GGC ACG GAA GTG TCC GAA GCG CTG GGC GGG 1925Asn Asn Cys Leu Leu Leu Gly Thr Glu Val Ser Glu Ala Leu Gly Gly535 540 545 550GCC GGC CTC ACG GGG GGG TTC TAT GAA CCC CTG GTG CGC AGG CGT TCG 1973Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro Leu Val Arg Arg Arg Ser

555 560 565GAG CTG ATG GGG CGC CGA AAT CCG GTT TGC CCG GGG TTT GCA TGG CTG 2021Glu Leu Met Gly Arg Arg Asn Pro Val Cys Pro Gly Phe Ala Trp Leu

570 575 580TCC TCG GGT CGA CCT GAC GGG TTT ATA CAC GTC CAG GGC CAC TTG CAG 2069Ser Ser Gly Arg Pro Asp Gly Phe Ile His Val Gln Gly His Leu Gln

585 590 595GAG GTC GAT GCT GGC AAC TTC ATC CCT CCA CCT CGC TGG TTG CTC TTG 2117Glu Val Asp Ala Gly Asn Phe Ile Pro Pro Pro Arg Trp Leu Leu Leu

600 605 610GAC TTT GTG TTT GTC CTG TTA TAC CTG ATG AAG CTG GCT GAG GCA CGG 2165Asp Phe Val Phe Val Leu Leu Tyr Leu Met Lys Leu Ala Glu Ala Arg615 620 625 630CTG GTC CCG TTG ATC TTG CTT CTG CTG TGG TGG TGG GTG AAC CAG TTG 2213Leu Val Pro Leu Ile Leu Leu Leu Leu Trp Trp Trp Val Asn Gln Leu

635 640 645GCA GTC CTT GGA CTG CCG GCT GTG GAC GCC GCC GTG GCT GGT GAG GTC 2261Ala Val Leu Gly Leu Pro Ala Val Asp Ala Ala Val Ala Gly Glu Val

650 655 660TTC GCG GGC CCG GCC CTG TCG TGG TGT CTG GGC CTC CCC ACC GTT AGT 2309Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu Gly Leu Pro Thr Val Ser

665 670 675ATG ATC CTG GGC TTA GCA AAC CTG GTG TTG TAT TTC CGG TGG ATG GGT 2357Met Ile Leu Gly Leu Ala Asn Leu Val Leu Tyr Phe Arg Trp Met Gly

680 685 690CCC CAA CGC CTC ATG TTC CTC GTG TTG TGG AAG CTC GCT CGG GGA GCC 2405Pro Gln Arg Leu Met Phe Leu Val Leu Trp Lys Leu Ala Arg Gly Ala695 700 705 710TTC CCG CTG GCA CTT CTG ATG GGG ATC TCG GCA ACC CGC GGG CGC ACC 2453Phe Pro Leu Ala Leu Leu Met Gly Ile Ser Ala Thr Arg Gly Arg Thr

715 720 725TCG GTG CTC GGG GCC GAG TTC TGC TTC GAT GTC ACA TTC GAG GTG GAC 2501Ser Val Leu Gly Ala Glu Phe Cys Phe Asp Val Thr Phe Glu Val Asp

730 735 740ACG TCG GTT TTG GGC TGG GTG GTG GCC AGT GTG GTA GCC TGG GCC ATT 2549Thr Ser Val Leu Gly Trp Val Val Ala Ser Val Val Ala Trp Ala Ile

745 750 755GCG CTC CTG AGC TCG ATG AGC GCG GGA GGG TGG AGG CAC AAG GCC GTG 2597Ala Leu Leu Ser Ser Met Ser Ala Gly Gly Trp Arg His Lys Ala Val

760 765 770ATC TAT AGG ACG TGG TGT AAG GGG TAC CAG GCA ATA CGC CAA CGG GTG 2645Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln Ala Ile Arg Gln Arg Val775 780 785 790GTG CGG AGC CCC CTC GGG GAG GGG CGG CCC ACC AAA CCC TTG ACG TTT 2693Val Arg Ser Pro Leu Gly Glu Gly Arg Pro Thr Lys Pro Leu Thr Phe

795 800 805GCT TGG TGC TTG GCC TCA TAC ATC TGG CCG GAT GCT GTG ATG ATG GTG 2741Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro Asp Ala Val Met Met Val

810 815 820GTG GTA GCC TTG GTG CTC CTC TTT GGC CTG TTC GAC GCG TTG GAC TGG 2789Val Val Ala Leu Val Leu Leu Phe Gly Leu Phe Asp Ala Leu Asp Trp

825 830 835GCT TTG GAG GAG CTC TTG GTG TCC CGG CCC TCG TTA CGG CGT CTG GCC 2837Ala Leu Glu Glu Leu Leu Val Ser Arg Pro Ser Leu Arg Arg Leu Ala

840 845 850CGG GTG GTT GAG TGC TGT GTG ATG GCG GGA GAG AAG GCC ACA ACC GTC 2885Arg Val Val Glu Cys Cys Val Met Ala Gly Glu Lys Ala Thr Thr Val855 860 865 870CGG CTG GTC TCC AAG ATG TGC GCG AGA GGG GCC TAT TTG TTT GAC CAT 2933Arg Leu Val Ser Lys Met Cys Ala Arg Gly Ala Tyr Leu Phe Asp His

875 880 885ATG GGC TCT TTT TCG CGC GCT GTC AAG GAG CGC CTG CTG GAG TGG GAC 2981Met Gly Ser Phe Ser Arg Ala Val Lys Glu Arg Leu Leu Glu Trp Asp

890 895 900GCG GCT TTG GAA CCC CTG TCA TTC ACT AGG ACG GAC TGT CGC ATC ATT 3029Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg Thr Asp Cys Arg Ile Ile

905 910 915AGA GAT GCT GCG AGG ACC TTG GCC TGC GGG CAG TGC GTC ATG GGC TTG 3077Arg Asp Ala Ala Arg Thr Leu Ala Cys Gly Gln Cys Val Met Gly Leu

920 925 930CCT GTG GTA GCG CGC CGT GGT GAC GAG GTT CTT ATC GGT GTC TTT CAG 3125Pro Val Val Ala Arg Arg Gly Asp Glu Val Leu Ile Gly Val Phe Gln935 940 945 950GAT GTG AAC CAT TTG CCT CCC GGA TTC GTC CCG ACC GCA CCC GTT GTC 3173Asp Val Asn His Leu Pro Pro Gly Phe Val Pro Thr Ala Pro Val Val

955 960 965ATC CGG CGG TGC GGG AAG GGG TTT CTG GGG GTC ACT AAG GCT GCC TTG 3221Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly Val Thr Lys Ala Ala Leu

970 975 980ACT GGT CGG GAT CCT GAC TTA CAT CCA GGG AAC GTC ATG GTG TTG GGG 3269Thr Gly Arg Asp Pro Asp Leu His Pro Gly Asn Val Met Val Leu Gly

985 990 995ACG GCT ACG TCG CGA AGC ATG GGG ACA TGC CTG AAC GGC CTG CTG TTC 3317Thr Ala Thr Ser Arg Ser Met Gly Thr Cys Leu Asn Gly Leu Leu Phe

1000 1005 1010ACG ACT TTC CAT GGG GCT TCA TCC CGA ACC ATC GCC ACG CCC GTG GGG 3365Thr Thr Phe His Gly Ala Ser Ser Arg Thr Ile Ala Thr Pro Val Gly1015 1020 1025 1030GCC CTT AAT CCC AGG TGG TGG TCC GCC AGT GAT GAC GTC ACG GTG TAC 3413Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser Asp Asp Val Thr Val Tyr

1035 1040 1045CCG CTC CCG GAT GGG GCA ACC TCG TTG ACG CCC TGC ACT TGC CAG GCT 3461Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr Pro Cys Thr Cys Gln Ala

1050 1055 1060GAG TCC TGT TGG GTC ATA CGG TCC GAC GGG GCT TTG TGC CAT GGC TTG 3509Glu Ser Cys Trp Val Ile Arg Ser Asp Gly Ala Leu Cys His Gly Leu

1065 1070 1075AGT AAG GGA GAC AAG GTG GAG CTA GAT GTG GCC ATG GAG GTC TCA GAT 3557Ser Lys Gly Asp Lys Val Glu Leu Asp Val A1a Met Glu Val Ser Asp

1080 1085 1090TTC CGT GGC TCG TCC GGC TCA CCT GTC CTG TGC GAC GAG GGG CAC GCA 3605Phe Arg Gly Ser Ser Gly Ser Pro Val Leu Cys Asp Glu Gly His Ala1095 1100 1105 1110GTA GGA ATG CTC GTG TCG GTG CTC CAC TCG GGT GGT CGG GTC ACC GCG 3653Val Gly Met Leu Val Ser Val Leu His Ser Gly Gly Arg Val Thr Ala

1115 1120 1125GCT CGA TTC ACC AGG CCG TGG ACC CAG GTC CCA ACA GAT GCT AAG ACC 3701Ala Arg Phe Thr Arg Pro Trp Thr Gln Val Pro Thr Asp Ala Lys Thr

1130 1135 1140ACC ACT GAA CCC CCT CCG GTG CCG GCA AAG GGA GTT TTC AAG GAA GCC 3749Thr Thr Glu Pro Pro Pro Val Pro Ala Lys Gly Val Phe Lys Glu Ala

1145 1150 1155CCA CTG TTT ATG CCC ACG GGC GCA GGA AAG AGC ACG CGC GTC CCG TTG 3797Pro Leu Phe Met Pro Thr Gly Ala Gly Lys Ser Thr Arg Val Pro Leu

1160 1165 1170GAG TAT GGC AAC ATG GGG CAC AAG GTC CTG ATT TTG AAC CCC TCG GTG 3845Glu Tyr Gly Asn Met Gly His Lys Val Leu Ile Leu Asn Pro Ser Val1175 1180 1185 1190GCG ACA GTG AGG GCC ATG GGC CCT TAC ATG GAG CGA CTG GCG GGA AAA 3893Ala Thr Val Arg Ala Met Gly Pro Tyr Met Glu Arg Leu Ala Gly Lys

1195 1200 1205CAT CCA AGT ATC TAC TGT GGC CAT GAC ACC ACT GCC TTC ACA AGG ATC 3941His Pro Ser Ile Tyr Cys Gly His Asp Thr Thr Ala Phe Thr Arg Ile

1210 1215 1220ACT GAT TCC CCC TTA ACG TAC TCT ACC TAT GGG AGG TTT CTG GCC AAC 3989Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr Gly Arg Phe Leu Ala Asn

1225 1230 1235CCT AGG CAG ATG CTG CGA GGT GTG TCG GTG GTC ATT TGC GAT GAA TGC 4037Pro Arg Gln Met Leu Arg Gly Val Ser Val Val Ile Cys Asp Glu Cys

1240 1245 1250CAC AGT CAT GAT TCC ACT GTG TTG TTG GGG ATT GGA CGG GTC CGG GAG 4085His Ser His Asp Ser Thr Val Leu Leu Gly Ile Gly Arg Val Arg Glu1255 1260 1265 1270CTG GCA CGA GAG TGT GGG GTG CAG CTT GTG CTC TAC GCC ACT GCC ACG 4133Leu Ala Arg Glu Cys Gly Val Gln Leu Val Leu Tyr Ala Thr Ala Thr

1275 1280 1285CCT CCT GGG TCC CCC ATG ACT CAG CAT CCG TCA ATC ATT GAG ACC AAA 4181Pro Pro Gly Ser Pro Met Thr Gln His Pro Ser Ile Ile Glu Thr Lys

1290 1295 1300TTG GAT GTG GGT GAG ATT CCC TTC TAT GGG CAT GGC ATA CCC CTC GAG 4229Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly His Gly Ile Pro Leu Glu

1305 1310 1315CGG ATG CGG ACC GGT AGG CAC CTC GTA TTC TGC TAC TCT AAG GCA GAG 4277Arg Met Arg Thr Gly Arg His Leu Val Phe Cys Tyr Ser Lys Ala Glu

1320 1325 1330TGT GAG CGG CTA GCC GGT CAG TTT TCT GCT AGG GGA GTT AAC GCC ATA 4325Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala Arg Gly Val Asn Ala Ile1335 1340 1345 1350GCC TAT TAC AGG GGA AAA GAC AGT TCT ATC ATC AAG GAC GGA GAT CTG 4373Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile Ile Lys Asp Gly Asp Leu

1355 1360 1365GTG GTG TGC GCG ACC GAC GCG CTA TCC ACT GGA TAC ACT GGG AAC TTC 4421Val Val Cys Ala Thr Asp Ala Leu Ser Thr Gly Tyr Thr Gly Asn Phe

1370 1375 1380GAT TCT GTC ACC GAC TGT GGG TTA GTG GTG GAG GAG GTC GTC GAG GTG 4469Asp Ser Val Thr Asp Cys Gly Leu Val Val Glu Glu Val Val Glu Val

1385 1390 1395ACC CTT GAT CCC ACC ATT ACC ATC TCC CTG CGG ACA GTG CCC GCG TCG 4517Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu Arg Thr Val Pro Ala Ser

1400 1405 1410GCA GAA CTG TCG ATG CAG AGA CGA GGA CGC ACG GGT AGA GGC AGG TCT 4565Ala Glu Leu Ser Met Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Ser1415 1420 1425 1430GGG CGC TAC TAC TAC GCC GGG GTC GGA AAG GCC CCC GCG GGT GTG GTG 4613Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys Ala Pro Ala Gly Val Val

1435 1440 1445CGC TCG GGT CCT GTC TGG TCG GCG GTG GAG GCC GGA GTG ACC TGG TAT 4661Arg Ser Gly Pro Val Trp Ser Ala Val Glu Ala Gly Val Thr Trp Tyr

1450 1455 1460GGA ATG GAA CCT GAC TTG ACA GCT AAC CTA TTG AGA CTT TAC GAC GAC 4709Gly Met Glu Pro Asp Leu Thr Ala Asn Leu Leu Arg Leu Tyr Asp Asp

1465 1470 1475TGC CCT TAC ACC GCA GCC GTC GCA GCT GAC ATC GGT GAA GCC GCG GTG 4757Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp Ile Gly Glu Ala Ala Val

1480 1485 1490TTT TTC TCC GGG CTA GCC CCG TTG AGG ATG CAT CCC GAT GTT AGC TGG 4805Phe Phe Ser Gly Leu Ala Pro Leu Arg Met His Pro Asp Val Ser Trp1495 1500 1505 1510GCA AAA GTG CGC GGC GTC AAC TGG CCC CTC TTG GTG GGT GTT CAG CGG 4853Ala Lys Val Arg Gly Val Asn Trp Pro Leu Leu Val Gly Val Gln Arg

1515 1520 1525ACC ATG TGC CGG GAA ACA CTG TCT CCC GGA CCA TCG GAC GAC CCC CAA 4901Thr Met Cys Arg Glu Thr Leu Ser Pro Gly Pro Ser Asp Asp Pro Gln

1530 1535 1540TGG GCA GGT CTG AAG GGC CCG AAT CCT GTT CCA CTA CTG CTG AGG TGG 4949Trp Ala Gly Leu Lys Gly Pro Asn Pro Val Pro Leu Leu Leu Arg Trp

1545 1550 1555GGC AAT GAT TTA CCA TCA AAA GTG GCC GGC CAC CAC ATT GTT GAC GAC 4997Gly Asn Asp Leu Pro Ser Lys Val Ala Gly His His Ile Val Asp Asp

1560 1565 1570CTG GTT CGT AGG CTT GGT GTG GCG GAG GGT TAT GTC CGC TGC GAT GCG 5045Leu Val Arg Arg Leu Gly Val Ala Glu Gly Tyr Val Arg Cys Asp Ala1575 1580 1585 1590GGG CCG ATC TTA ATG GTC GGC CTC GCT ATC GCG GGG GGG ATG ATC TAC 5093Gly Pro Ile Leu Met Val Gly Leu Ala Ile Ala Gly Gly Met Ile Tyr

1595 1600 1605GCA TCT TAC ACC GGG TCT TTA GTG GTG GTG ACA GAC TGG GAT GTA AAG 5141Ala Ser Tyr Thr Gly Ser Leu Val Val Val Thr Asp Trp Asp Val Lys

1610 1615 1620GGG GGT GGC AGC CCT CTT TAT CGG CAT GGA GAC CAG GCC ACG CCA CAG 5189Gly Gly Gly Ser Pro Leu Tyr Arg His Gly Asp Gln Ala Thr Pro Gln

1625 1630 1635CCG GTT GTG CAG GTC CCC CCG GTA GAC CAT CGG CCG GGG GGG GAG TCT 5237Pro Val Val Gln Val Pro Pro Val Asp His Arg Pro Gly Gly Glu Ser

1640 1645 1650GCG CCT TCG GAT GCC AAG ACA GTG ACA GAT GCG GTG GCG GCC ATC CAG 5285Ala Pro Ser Asp Ala Lys Thr Val Thr Asp Ala Val Ala Ala Ile Gln1655 1660 1665 1670GTG GAT TGC GAT TGG TCA GTC ATG ACC CTG TCG ATC GGG GAA GTG CTG 5333Val Asp Cys Asp Trp Ser Val Met Thr Leu Ser Ile Gly Glu Val Leu

1675 1680 1685TCC TTG GCT CAG GCT AAA ACA GCT GAG GCC TAC ACG GCA ACC GCC AAG 5381Ser Leu Ala Gln Ala Lys Thr Ala Glu A1a Tyr Thr Ala Thr Ala Lys

1690 1695 1700TGG CTC GCT GGC TGC TAC ACG GGG ACG CGG GCC GTT CCC ACT GTT TCA 5429Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg Ala Val Pro Thr Val Ser

1705 1710 1715ATT GTT GAC AAG CTC TTT GCC GGA GGG TGG GCG GCT GTG GTT GGC CAC 5477Ile Val Asp Lys Leu Phe Ala Gly Gly Trp Ala Ala Val Val Gly His

1720 1725 1730TGT CAC AGC GTC ATA GCT GCG GCG GTG GCT GCC TAC GGG GCT TCC AGG 5525Cys His Ser Val Ile Ala Ala Ala Val Ala Ala Tyr Gly Ala Ser Arg1735 1740 1745 1750AGT CCG CCG TTG GCA GCC GCG GCT TCC TAC CTG ATG GGA CTG GGC GTC 5573Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr Leu Met Gly Leu Gly Val

1755 1760 1765GGA GGC AAC GCT CAG ACG CGT TTG GCG TCT GCC CTC CTG TTG GGG GCC 5621Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser Ala Leu Leu Leu Gly Ala

1770 1775 1780GCT GGC ACC GCC CTG GGC ACT CCC GTC GTG GGT TTA ACC ATG GCG GGG 5669Ala Gly Thr Ala Leu Gly Thr Pro Val Val Gly Leu Thr Met Ala Gly

1785 1790 1795GCG TTC ATG GGG GGT GCT AGC GTC TCT CCC TCC TTG GTC ACC ATC TTG 5717Ala Phe Met Gly Gly Ala Ser Val Ser Pro Ser Leu Val Thr Ile Leu

1800 1805 1810TTG GGG GCC GTG GGA GGC TGG GAG GGC GTC GTC AAC GCT GCT AGC CTT 5765Leu Gly Ala Val Gly Gly Trp Glu Gly Val Val Asn Ala Ala Ser Leu1815 1820 1825 1830GTC TTT GAC TTC ATG GCG GGG AAA CTA TCG TCA GAA GAT CTG TGG TAC 5813Val Phe Asp Phe Met Ala Gly Lys Leu Ser Ser Glu Asp Leu Trp Tyr

1835 1840 1845GCC ATC CCA GTG CTC ACC AGC CCG GGG GCG GGC CTT GCG GGG ATC GCC 5861Ala Ile Pro Val Leu Thr Ser Pro Gly Ala Gly Leu Ala Gly Ile Ala

1850 1855 1860CTT GGG TTG GTG CTG TAC TCA GCT AAC AAC TCT GGT ACT ACC ACT TGG 5909Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn Ser Gly Thr Thr Thr Trp

1865 1870 1875TTG AAC CGT CTG CTG ACT ACG TTA CCT AGG TCT TCT TGC ATC CCT GAC 5957Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg Ser Ser Cys Ile Pro Asp

1880 1885 1890AGC TAT TTC CAA CAG GCC GAT TAC TGT GAC AAG GTC TCG GCC GTG CTT 6005Ser Tyr Phe Gln Gln Ala Asp Tyr Cys Asp Lys Val Ser Ala Val Leu1895 1900 1905 1910CGC CGA CTG AGC CTC ACC CGC ACT GTG GTG GCC CTA GTC AAT AGG GAA 6053Arg Arg Leu Ser Leu Thr Arg Thr Val Val Ala Leu Val Asn Arg Glu

1915 1920 1925CCC AAG GTG GAC GAG GTA CAG GTG GGG TAC GTC TGG GAT CTC TGG GAG 6101Pro Lys Val Asp Glu Val Gln Val Gly Tyr Val Trp Asp Leu Trp Glu

1930 1935 1940TGG ATC ATG CGT CAA GTG CGC ATG GTC ATG GCC AGG CTC CGG GCT CTC 6149Trp Ile Met Arg Gln Val Arg Met Val Met Ala Arg Leu Arg Ala Leu

1945 1950 1955TGC CCC GTG GTG TCA CTG CCT TTG TGG CAC TGC GGG GAG GGG TGG TCC 6197Cys Pro Val Val Ser Leu Pro Leu Trp His Cys Gly Glu Gly Trp Ser

1960 1965 1970GGA GAG TGG TTG TTG GAC GGC CAT GTG GAG AGT CGC TGT CTT TGC GGG 6245Gly Glu Trp Leu Leu Asp Gly His Val Glu Ser Arg Cys Leu Cys Gly1975 1980 1985 1990TGC GTG ATC ACC GGC GAT GTT TTC AAT GGG CAA CTC AAA GAG CCA GTT 6293Cys Val Ile Thr Gly Asp Val Phe Asn Gly Gln Leu Lys Glu Pro Val

1995 2000 2005TAC TCT ACA AAG TTG TGC CGG CAC TAT TGG ATG GGG ACC GTT CCT GTG 6341Tyr Ser Thr Lys Leu Cys Arg His Tyr Trp Met Gly Thr Val Pro Val

2010 2015 2020AAC ATG CTG GGT TAC GGC GAA ACA TCA CCC CTC TTG GCC TCT GAC ACC 6389Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro Leu Leu Ala Ser Asp Thr

2025 2030 2035CCG AAG GTG GTG CCT TTT GGG ACG TCG GGC TGG GCT GAG GTG GTG GTG 6437Pro Lys Val Val Pro Phe Gly Thr Ser Gly Trp Ala Glu Val Val Val

2040 2045 2050ACC CCT ACC CAC GTG GTG ATC AGG AGA ACC TCT CCC TAC GAG TTG CTG 6485Thr Pro Thr His Val Val Ile Arg Arg Thr Ser Pro Tyr Glu Leu Leu2055 2060 2065 2070CGC CAA CAA ATC CTA TCA GCT GCA GTT GCT GAG CCC TAT TAT GTC GAC 6533Arg Gln Gln Ile Leu Ser Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp

2075 2080 2085GGC ATA CCG GTC TCA TGG GAC GCG GAC GCT CGT GCG CCT GCT ATG GTT 6581Gly Ile Pro Val Ser Trp Asp Ala Asp Ala Arg Ala Pro Ala Met Val

2090 2095 2100TAT GGC CCT GGG CAA AGT GTT ACC ATT GAC GGG GAG CGC TAC ACC CTG 6629Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp Gly Glu Arg Tyr Thr Leu

2105 2110 2115CCG CAT CAA CTG CGG CTC AGG AAT GTA GCG CCC TCT GAG GTT TCA TCC 6677Pro His Gln Leu Arg Leu Arg Asn Val Ala Pro Ser Glu Val Ser Ser

2120 2125 2130GAG GTG TCC ATA GAC ATT GGG ACG GAG ACT GAA GAC TCA GAA CTG ACT 6725Glu Val Ser Ile Asp Ile Gly Thr Glu Thr Glu Asp Ser Glu Leu Thr2135 2140 2145 2150GAG GCC GAC CTG CCG CCG GCA GCT GCA GCC CTC CAG GCT ATC GAG AAT 6773Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala Leu Gln Ala Ile Glu Asn

2155 2160 2165GCT GCG AGG ATT CTT GAG CCT CAT ATT GAT GTC ATC ATG GAG GAT TGC 6821Ala Ala Arg Ile Leu Glu Pro His Ile Asp Val Ile Met Glu Asp Cys

2170 2175 2180AGT ACA CCC TCT CTT TGT GGT AGT AGC CGA GAG ATG CCT GTG TGG GGA 6869Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg Glu Met Pro Val Trp Gly

2185 2190 2195GAA GAC ATC CCC CGC ACT CCA TCG CCA GCA CTT ATC TCG GTT ACC GAG 6917Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala Leu Ile Ser Val Thr Glu

2200 2205 2210AGC AGC TCA GAT GAG AAG ACC CCG TCG GTG TCC TCC TCG CAG GAG GAT 6965Ser Ser Ser Asp Glu Lys Thr Pro Ser Val Ser Ser Ser Gln Glu Asp2215 2220 2225 2230ACC CCG TCC TCT GAC TCA TTC GAA GTC ATC CAA GAG TCT GAG ACA GCT 7013Thr Pro Ser Ser Asp Ser Phe Glu Val Ile Gln Glu Ser Glu Thr Ala

2235 2240 2245GAA GGA GAG GAA AGT GTC TTC AAC GTG GCT CTT TCC GTA CTA GAA GCC 7061Glu Gly Glu Glu Ser Val Phe Asn Val Ala Leu Ser Val Leu Glu Ala

2250 2255 2260TTG TTT CCA CAG AGT GAT GCC ACT AGA AAG CTT ACC GTC AGG ATG AAT 7109Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys Leu Thr Val Arg Met Asn

2265 2270 2275TGC TGC GTT GAG AAG AGC GTC ACG CGC TTC TTT TCT TTG GGG CTG ACG 7157Cys Cys Val Glu Lys Ser Val Thr Arg Phe Phe Ser Leu Gly Leu Thr

2280 2285 2290GTG GCT GAT GTG GCC AGT CTG TGT GAG ATG GAG ATC CAG AAC CAT ACA 7205Val Ala Asp Val Ala Ser Leu Cys Glu Met Glu Ile Gln Asn His Thr2295 2300 2305 2310GCC TAT TGT GAC AAG GTG CGC ACT CCG CTC GAA TTG CAA GTT GGG TGC 7253Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu Glu Leu Gln Val Gly Cys

2315 2320 2325TTG GTG GGC AAT GAA CTT ACC TTT GAA TGT GAT AAG TGT GAG GCT AGG 7301Leu Val Gly Asn Glu Leu Thr Phe Glu Cys Asp Lys Cys Glu Ala Arg

2330 2335 2340CAA GAG ACT TTG GCC TCC TTC TCC TAT ATT TGG TCT GGG GTG CCA TTG 7349Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile Trp Ser Gly Val Pro Leu

2345 2350 2355ACT AGG GCC ACA CCG GCT AAA CCA CCT GTG GTG AGG CCG GTG GGG TCC 7397Thr Arg Ala Thr Pro Ala Lys Pro Pro Val Val Arg Pro Val Gly Ser

2360 2365 2370TTG TTG GTG GCT GAC ACC ACG AAA GTG TAT GTC ACA AAC CCG GAC AAT 7445Leu Leu Val Ala Asp Thr Thr Lys Val Tyr Val Thr Asn Pro Asp Asn2375 2380 2385 2390GTT GGG AGA AGA GTG GAC AAG GTG ACC TTC TGG CGC GCC CCC AGG GTC 7493Val Gly Arg Arg Val Asp Lys Val Thr Phe Trp Arg Ala Pro Arg Val

2395 2400 2405CAT GAC AAA TAT CTC GTG GAC TCC ATC GAG CGT GCC AGG AGG GCG GCT 754lHis Asp Lys Tyr Leu Val Asp Ser Ile Glu Arg Ala Arg Arg Ala Ala

2410 2415 2420CAA GCC TGC CAA AGC ATG GGT TAC ACT TAT GAG GAA GCA ATA AGG ACT 7589Gln Ala Cys Gln Ser Met Gly Tyr Thr Tyr Glu Glu Ala Ile Arg Thr

2425 2430 2435GTT AGG CCA CAT GCT GCC ATG GGC TGG GGA TCT AAG GTG TCG GTC AAG 7637Val Arg Pro His Ala Ala Met Gly Trp Gly Ser Lys Val Ser Val Lys

2440 2445 2450GAC TTG GCC ACC CCT GCG GGG AAG ATG GCC GTC CAC GAC CGA CTT CAG 7685Aso Leu Ala Thr Pro Ala Gly Lys Met Ala Val His Asp Arg Leu Gln2455 2460 2465 2470GAG ATA CTT GAG GGG ACT CCG GTC CCT TTT ACT CTT ACT GTG AAA AAG 7733Glu Ile Leu Glu Gly Thr Pro Val Pro Phe Thr Leu Thr Val Lys Lys

2475 2480 2485GAG GTG TTC TTC AAA GAC CGT AAG GAG GAG AAG GCC CCC CGC CTC ATT 7781Glu Val Phe Phe Lys Asp Arg Lys Glu Glu Lys Ala Pro Arg Leu Ile

2490 2495 2500GTG TTC CCC CCC CTG GAC TTC CGG ATA GCT GAG AAG CTT ATC CTG GGA 7829Val Phe Pro Pro Leu Asp Phe Arg Ile Ala Glu Lys Leu Ile Leu Gly

2505 2510 2515GAC CCG GGG CGG GTG GCC AAG GCG GTG TTG GGG GGG GCT TAC GCC TTC 7877Asp Pro Gly Arg Val Ala Lys Ala Val Leu Gly Gly Ala Tyr Ala Phe

2520 2525 2530CAG TAC ACC CCA AAT CAG CGA GTT AAG GAG ATG CTC AAA CTG TGG GAG 7925Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu Met Leu Lys Leu Trp Glu2535 2540 2545 2550TCA AAG AAA ACA CCT TGC GCC ATC TGT GTG GAC GCC ACT TGC TTC GAC 7973Ser Lys Lys Thr Pro Cys Ala Ile Cys Val Asp Ala Thr Cys Phe Asp

2555 2560 2565AGT AGC ATT ACT GAA GAG GAC GTG GCG CTG GAG ACA GAG CTG TAC GCT 8021Ser Ser Ile Thr Glu Glu Asp Val Ala Leu Glu Thr Glu Leu Tyr Ala

2570 2575 2580CTG GCC TCT GAC CAT CCA GAG TGG GTG CGA GCT TTG GGG AAG TAC TAT 8069Leu Ala Ser Asp His Pro Glu Trp Val Arg Ala Leu Gly Lys Tyr Tyr

2585 2590 2595GCC TCA GGA ACC ATG GTC ACC CCT GAG GGG GTT CCC GTA GGT GAG AGG 8117Ala Ser Gly Thr Met Val Thr Pro Glu Gly Val Pro Val Gly Glu Arg

2600 2605 2610TAT TGT AGA TCC TCA GGC GTT TTG ACT ACC AGC GCG AGT AAC TGC CTG 8165Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr Ser Ala Ser Asn Cys Leu2615 2620 2625 2630ACC TGC TAC ATC AAG GTG AAA GCC GCT TGT GAG AGA GTG GGG CTG AAA 8213Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys Glu Arg Val Gly Leu Lys

2635 2640 2645AAT GTC TCG CTT CTC ATA GCC GGC GAT GAC TGT TTG ATC ATA TGC GAA 8261Asn Val Ser Leu Leu Ile Ala Gly Asp Asp Cys Leu Ile Ile Cys Glu

2650 2655 2660CGG CCA GTG TGC GAC CCT TGT GAC GCC TTG GGC AGA GCC CTG GCG AGC 8309Arg Pro Val Cys Asp Pro Cys Asp Ala Leu Gly Arg Ala Leu Ala Ser

2665 2670 2675TAT GGG TAT GCT TGC GAG CCT TCG TAT CAT GCA TCA CTG GAC ACG GCC 8357Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His Ala Ser Leu Asp Thr Ala

2680 2685 2690CCC TTC TGC TCC ACT TGG CTC GCT GAG TGC AAC GCA GAT GGG AAA CGC 8405Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys Asn Ala Asp Gly Lys Arg2695 2700 2705 2710CAT TTC TTC CTG ACC ACG GAC TTT CGG AGG CCG CTT GCT CGC ATG TCG 8453His Phe Phe Leu Thr Thr Asp Phe Arg Arg Pro Leu Ala Arg Met Ser

2715 2720 2725AGC GAG TAT AGT GAC CCA ATG GCT TCG GCC ATA GGT TAC ATC CTC CTG 8501Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala Ile Gly Tyr Ile Leu Leu

2730 2735 2740TAT CCC TGG CAT CCC ATC ACA CGG TGG GTC ATC ATC CCT CAT GTG CTA 8549Tyr Pro Trp His Pro Ile Thr Arg Trp Val Ile Ile Pro His Val Leu

2745 2750 2755ACG TGC GCA TTC AGG GGT GGT GGT ACA CCG TCT GAT CCG GTT TGG TGT 8597Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro Ser Asp Pro Val Trp Cys

2760 2765 2770CAG GTG CAT GGT AAC TAC TAC AAG TTT CCA CTG GAC AAA CTG CCT AAC 8645Gln Val His Gly Asn Tyr Tyr Lys Phe Pro Leu Asp Lys Leu Pro Asn2775 2780 2785 2790ATC ATC GTG GCC CTC CAC GGA CCA GCA GCG TTG AGG GTT ACC GCA GAC 8693Ile Ile Val Ala Leu His Gly Pro Ala Ala Leu Arg Val Thr Ala Asp

2795 2800 2805ACA ACT AAG ACA AAA ATG GAA GCT GGG AAG GTG CTG AGT GAC CTC AAG 8741Thr Thr Lys Thr Lys Met Glu Ala Gly Lys Val Leu Ser Asp Leu Lys

2810 2815 2820CTC CCT GGC CTA GCG GTC CAC CGA AAG AAG GCC GGA GCA CTG CGA ACA 8789Leu Pro Gly Leu Ala Val His Arg Lys Lys Ala Gly Ala Leu Arg Thr

2825 2830 2835CGC ATG CTT CGG TCG CGC GGT TGG GCC GAG TTG GCG AGG GGC CTG TTG 8837Arg Met Leu Arg Ser Arg Gly Trp Ala Glu Leu Ala Arg Gly Leu Leu

2840 2845 2850TGG CAT CCA GGC CTC CGG CTC CCT CCC CCT GAG ATT GCT GGT ATC CCG 8885Trp His Pro Gly Leu Arg Leu Pro Pro Pro Glu Ile Ala Gly Ile Pro2855 2860 2865 2870GGG GGT TTC CCC CTC TCC CCC CCC TAC ATG GGG GTG GTG CAT CAA TTG 8933Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met Gly Val Val His Gln Leu

2875 2880 2885GAT TTT ACA AGC CAG AGG AGT CGC TGG CGG TGG CTG GGG TTC TTA GCC 8981Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg Trp Leu Gly Phe Leu Ala

2890 2895 2900CTG CTC ATC GTA GCC CTC TTC GGG TGAACTAAAT TCATCTGTTG CGGCAAGGTC 9035Leu Leu Ile Val Ala Leu Phe Gly

2905 2910CAGTGACTGA TCATCACTGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG TCTCCCCGCT 9095GGGTAAAA 9103(2)SEQ ID NO：183的信息：

(i)序列特征：

(A)长度：2910个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(xi)序列描述：SEQ ID NO：183：Met Ser Leu Leu Thr Asn Arg Leu Ser Arg Arg Val Asp Lys Asp Gln1 5 10 15Trp Gly Pro Gly Phe Met Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg

20 25 30Arg Thr Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser

35 40 45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu

50 55 60Pro Tyr Thr Ile Met Glu Ala Leu Leu Phe Leu Leu Gly Val Glu Ala65 70 75 80Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln

85 90 95Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu

100 105 110Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Val Cys Thr Asp Arg

115 120 125Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser

130 135 140Ala Ala Gln Leu Val Gly Gln Leu Gly Gly Leu Tyr Gly Pro Leu Ser145 150 155 160Val Ser Ala Tyr Val Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser

165 170 175Gly Val Leu Thr Val Gly Val Ala Leu Thr Arg Arg Val Tyr Pro Met

180 185 190Pro Asn Leu Thr Cys Ala Val Glu Cys Glu Leu Lys Trp Glu Ser Glu

195 200 205Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu

210 215 220Tyr Leu Trp Lys Val Pro Phe Asp Phe Trp Arg Gly Val Leu Ser Leu225 230 235 240Thr Pro Leu Leu Val Cys Val Ala Ala Leu Leu Leu Leu Glu Gln Arg

245 250 255Ile Val Met Val Phe Leu Leu Val Thr Met Ala Gly Met Ser Gln Gly

260 265 270Ala Pro Ala Ser Val Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Thr

275 280 285Trp Gln Ser Cys Ser Cys Arg Ala Asn Gly Ser Arg Tyr Thr Thr Gly

290 295 300Glu Lys Val Trp Asp Arg Gly Asn Val Thr Leu Leu Cys Asp Cys Pro305 310 315 320Asn Gly Pro Trp Val Trp Leu Pro Ala Phe Cys Gln Ala Ile Gly Trp

325 330 335Gly Asp Pro Ile Thr His Trp Ser His Gly Gln Asn Arg Trp Pro Leu

340 345 350Ser Cys Pro Gln Tyr Val Tyr Gly Ser Val Ser Val Thr Cys Val Trp

355 360 365Gly Ser Val Ser Trp Phe Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile

370 375 380Asp Val Trp Ser Leu Val Pro Val Gly Ser Ala Ser Cys Thr Ile Ala385 390 395 400Ala Leu Gly Ser Ser Asp Arg Asp Thr Val Val Glu Leu Ser Glu Trp

405 410 415Gly Val Pro Cys Ala Thr Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys

420 425 430Gly Thr Cys Val Arg Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe

435 440 445Pro Phe His Arg Cys Gly Ala Gly Pro Lys Leu Thr Lys Asp Leu Glu

450 455 460Ala Val Pro Phe Val Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro465 470 475 480Leu Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe

485 490 495Gly Ser Tyr Ala Met Thr Lys Ile Arg Asp Ser Leu His Leu Val Lys

500 505 510Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe

515 520 525Pro Gly Val Pro Pro Leu Asn Asn Cys Leu Leu Leu Gly Thr Glu Val

530 535 540Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro545 550 555 560Leu Val Arg Arg Arg Ser Glu Leu Met Gly Arg Arg Asn Pro Val Cys

565 570 575Pro Gly Phe Ala Trp Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His

580 585 590Val Gln Gly His Leu Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro

595 600 605Pro Arg Trp Leu Leu Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met

610 615 620Lys Leu Ala Glu Ala Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp625 630 635 640Trp Trp Val Asn Gln Leu Ala Val Leu Gly Leu Pro Ala Val Asp Ala

645 650 655Ala Val Ala Gly Glu Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu

660 665 670Gly Leu Pro Thr Val Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu

675 680 685Tyr Phe Arg Trp Met Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp

690 695 700Lys Leu Ala Arg Gly Ala Phe Pro Leu Ala Leu Leu Met Gly Ile Ser705 710 715 720Ala Thr Arg Gly Arg Thr Ser Val Leu Gly Ala Glu Phe Cys Phe Asp

725 730 735Val Thr Phe Glu Val Asp Thr Ser Val Leu Gly Trp Val Val Ala Ser

740 745 750Val Val Ala Trp Ala Ile Ala Leu Leu Ser Ser Met Ser Ala Gly Gly

755 760 765Trp Arg His Lys Ala Val Ile Tyr Arg Thr Trp Cys Lys Gly Tyr Gln

770 775 780Ala Ile Arg Gln Arg Val Val Arg Ser Pro Leu Gly Glu Gly Arg Pro785 790 795 800Thr Lys Pro Leu Thr Phe Ala Trp Cys Leu Ala Ser Tyr Ile Trp Pro

805 810 815Asp Ala Val Met Met Val Val Val Ala Leu Val Leu Leu Phe Gly Leu

820 825 830Phe Asp Ala Leu Asp Trp Ala Leu Glu Glu Leu Leu Val Ser Arg Pro

835 840 845Ser Leu Arg Arg Leu Ala Arg Val Val Glu Cys Cys Val Met Ala Gly

850 855 860Glu Lys Ala Thr Thr Val Arg Leu Val Ser Lys Met Cys Ala Arg Gly865 870 875 880Ala Tyr Leu Phe Asp His Met Gly Ser Phe Ser Arg Ala Val Lys Glu

885 890 895Arg Leu Leu Glu Trp Asp Ala Ala Leu Glu Pro Leu Ser Phe Thr Arg

900 905 910Thr Asp Cys Arg Ile Ile Arg Asp Ala Ala Arg Thr Leu Ala Cys Gly

915 920 925Gln Cys Val Met Gly Leu Pro Val Val Ala Arg Arg Gly Asp Glu Val

930 935 940Leu Ile Gly Val Phe Gln Asp Val Asn His Leu Pro Pro Gly Phe Val945 950 955 960Pro Thr Ala Pro Val Val Ile Arg Arg Cys Gly Lys Gly Phe Leu Gly

965 970 975Val Thr Lys Ala Ala Leu Thr Gly Arg Asp Pro Asp Leu His Pro Gly

980 985 990Asn Val Met Val Leu Gly Thr Ala Thr Ser Arg Ser Met Gly Thr Cys

995 1000 1005Leu Asn Gly Leu Leu Phe Thr Thr Phe His Gly Ala Ser Ser Arg Thr

1010 1015 1020Ile Ala Thr Pro Val Gly Ala Leu Asn Pro Arg Trp Trp Ser Ala Ser1025 1030 1035 1040Asp Asp Val Thr Val Tyr Pro Leu Pro Asp Gly Ala Thr Ser Leu Thr

1045 1050 1055Pro Cys Thr Cys Gln Ala Glu Ser Cys Trp Val Ile Arg Ser Asp Gly

1060 1065 1070Ala Leu Cys His Gly Leu Ser Lys Gly Asp Lys Val Glu Leu Asp Val

1075 1080 1085Ala Met Glu Val Ser Asp Phe Arg Gly Ser Ser Gly Ser Pro Val Leu

1090 1095 1100Cys Asp Glu Gly His Ala Val Gly Met Leu Val Ser Val Leu His Ser1105 1110 1115 1120Gly Gly Arg Val Thr Ala Ala Arg Phe Thr Arg Pro Trp Thr Gln Val

1125 1130 1135Pro Thr Asp Ala Lys Thr Thr Thr Glu Pro Pro Pro Val Pro Ala Lys

1140 1145 1150Gly Val Phe Lys Glu Ala Pro Leu Phe Met Pro Thr Gly Ala Gly Lys

1155 1160 1165Ser Thr Arg Val Pro Leu Glu Tyr Gly Asn Met Gly His Lys Val Leu

1170 1175 1180Ile Leu Asn Pro Ser Val Ala Thr Val Arg Ala Met Gly Pro Tyr Met1185 1190 1195 1200Glu Arg Leu Ala Gly Lys His Pro Ser Ile Tyr Cys Gly His Asp Thr

1205 1210 1215Thr Ala Phe Thr Arg Ile Thr Asp Ser Pro Leu Thr Tyr Ser Thr Tyr

1220 1225 1230Gly Arg Phe Leu Ala Asn Pro Arg Gln Met Leu Arg Gly Val Ser Val

1235 1240 1245Val Ile Cys Asp Glu Cys His Ser His Asp Ser Thr Val Leu Leu Gly

1250 1255 1260Ile Gly Arg Val Arg Glu Leu Ala Arg Glu Cys Gly Val Gln Leu Val1265 1270 1275 1280Leu Tyr Ala Thr Ala Thr Pro Pro Gly Ser Pro Met Thr Gln His Pro

1285 1290 1295Ser Ile Ile Glu Thr Lys Leu Asp Val Gly Glu Ile Pro Phe Tyr Gly

1300 1305 1310His Gly Ile Pro Leu Glu Arg Met Arg Thr Gly Arg His Leu Val Phe

1315 1320 1325Cys Tyr Ser Lys Ala Glu Cys Glu Arg Leu Ala Gly Gln Phe Ser Ala

1330 1335 1340Arg Gly Val Asn Ala Ile Ala Tyr Tyr Arg Gly Lys Asp Ser Ser Ile1345 1350 1355 1360Ile Lys Asp Gly Asp Leu Val Val Cys Ala Thr Asp Ala Leu Ser Thr

1365 1370 1375Gly Tyr Thr Gly Asn Phe Asp Ser Val Thr Asp Cys Gly Leu Val Val

1380 1385 1390Glu Glu Val Val Glu Val Thr Leu Asp Pro Thr Ile Thr Ile Ser Leu

1395 1400 1405Arg Thr Val Pro Ala Ser Ala Glu Leu Ser Met Gln Arg Arg Gly Arg

1410 1415 1420Thr Gly Arg Gly Arg Ser Gly Arg Tyr Tyr Tyr Ala Gly Val Gly Lys1425 1430 1435 1440Ala Pro Ala Gly Val Val Arg Ser Gly Pro Val Trp Ser Ala Val Glu

1445 1450 1455Ala Gly Val Thr Trp Tyr Gly Met Glu Pro Asp Leu Thr Ala Asn Leu

1460 1465 1470Leu Arg Leu Tyr Asp Asp Cys Pro Tyr Thr Ala Ala Val Ala Ala Asp

1475 1480 1485Ile Gly Glu Ala Ala Val Phe Phe Ser Gly Leu Ala Pro Leu Arg Met

1490 1495 1500His Pro Asp Val Ser Trp Ala Lys Val Arg Gly Val Asn Trp Pro Leu1505 1510 1515 1520Leu Val Gly Val Gln Arg Thr Met Cys Arg Glu Thr Leu Ser Pro Gly

1525 1530 1535Pro Ser Asp Asp Pro Gln Trp Ala Gly Leu Lys Gly Pro Asn Pro Val

1540 1545 1550Pro Leu Leu Leu Arg Trp Gly Asn Asp Leu Pro Ser Lys Val Ala Gly

1555 1560 1565His His Ile Val Asp Asp Leu Val Arg Arg Leu Gly Val Ala Glu Gly

1570 1575 1580Tyr Val Arg Cys Asp Ala Gly Pro Ile Leu Met Val Gly Leu Ala Ile1585 1590 1595 1600Ala Gly Gly Met Ile Tyr Ala Ser Tyr Thr Gly Ser Leu Val Val Val

1605 1610 1615Thr Asp Trp Asp Val Lys Gly Gly Gly Ser Pro Leu Tyr Arg His Gly

1620 1625 1630Asp Gln Ala Thr Pro Gln Pro Val Val Gln Val Pro Pro Val Asp His

1635 1640 1645Arg Pro Gly Gly Glu Ser Ala Pro Ser Asp Ala Lys Thr Val Thr Asp

1650 1655 1660Ala Val Ala Ala Ile Gln Val Asp Cys Asp Trp Ser Val Met Thr Leu1665 1670 1675 1680Ser Ile Gly Glu Val Leu Ser Leu Ala Gln Ala Lys Thr Ala Glu Ala

1685 1690 1695Tyr Thr Ala Thr Ala Lys Trp Leu Ala Gly Cys Tyr Thr Gly Thr Arg

1700 1705 1710Ala Val Pro Thr Val Ser Ile Val Asp Lys Leu Phe Ala Gly Gly Trp

17l5 1720 1725Ala Ala Val Val Gly His Cys His Ser Val Ile Ala Ala Ala Val Ala

1730 1735 1740Ala Tyr Gly Ala Ser Arg Ser Pro Pro Leu Ala Ala Ala Ala Ser Tyr1745 1750 1755 1760Leu Met Gly Leu Gly Val Gly Gly Asn Ala Gln Thr Arg Leu Ala Ser

1765 1770 1775Ala Leu Leu Leu Gly Ala Ala Gly Thr Ala Leu Gly Thr Pro Val Val

1780 1785 1790Gly Leu Thr Met Ala Gly Ala Phe Met Gly Gly Ala Ser Val Ser Pro

1795 1800 1805Ser Leu Val Thr Ile Leu Leu Gly Ala Val Gly Gly Trp Glu Gly Val

1810 1815 1820Val Asn Ala Ala Ser Leu Val Phe Asp Phe Met Ala Gly Lys Leu Ser1825 1830 1835 1840Ser Glu Asp Leu Trp Tyr Ala Ile Pro Val Leu Thr 5er Pro Gly Ala

1845 1850 1855Gly Leu Ala Gly Ile Ala Leu Gly Leu Val Leu Tyr Ser Ala Asn Asn

1860 1865 1870Ser Gly Thr Thr Thr Trp Leu Asn Arg Leu Leu Thr Thr Leu Pro Arg

1875 1880 1885Ser Ser Cys Ile Pro Asp Ser Tyr Phe Gln Gln Ala Asp Tyr Cys Asp

1890 1895 1900Lys Val Ser Ala Val Leu Arg Arg Leu Ser Leu Thr Arg Thr Val Val1905 1910 1915 1920Ala Leu Val Asn Arg Glu Pro Lys Val Asp Glu Val Gln Val Gly Tyr

1925 1930 1935Val Trp Asp Leu Trp Glu Trp Ile Met Arg Gln Val Arg Met Val Met

1940 1945 1950Ala Arg Leu Arg Ala Leu Cys Pro Val Val Ser Leu Pro Leu Trp His

1955 1960 1965Cys Gly Glu Gly Trp Ser Gly Glu Trp Leu Leu Asp Gly His Val Glu

1970 1975 1980Ser Arg Cys Leu Cys Gly Cys Val Ile Thr Gly Asp Val Phe Asn Gly1985 1990 1995 2000Gln Leu Lys Glu Pro Val Tyr Ser Thr Lys Leu Cys Arg His Tyr Trp

2005 2010 2015Met Gly Thr Val Pro Val Asn Met Leu Gly Tyr Gly Glu Thr Ser Pro

2020 2025 2030Leu Leu Ala Ser Asp Thr Pro Lys Val Val Pro Phe Gly Thr Ser Gly

2035 2040 2045Trp Ala Glu Val Val Val Thr Pro Thr His Val Val Ile Arg Arg Thr

2050 2055 2060Ser Pro Tyr Glu Leu Leu Arg Gln Gln Ile Leu Ser Ala Ala Val Ala2065 2070 2075 2080Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp Asp Ala Asp Ala

2085 2090 2095Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser Val Thr Ile Asp

2100 2105 2110Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn Val Ala

2115 2120 2125Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr Glu Thr

2130 2135 2140Glu Asp Ser Glu Leu Thr Glu Ala Asp Leu Pro Pro Ala Ala Ala Ala2145 2150 2155 2160Leu Gln Ala Ile Glu Asn Ala Ala Arg Ile Leu Glu Pro His Ile Asp

2165 2170 2175Val Ile Met Glu Asp Cys Ser Thr Pro Ser Leu Cys Gly Ser Ser Arg

2180 2185 2190Glu Met Pro Val Trp Gly Glu Asp Ile Pro Arg Thr Pro Ser Pro Ala

2195 2200 2205Leu Ile Ser Val Thr Glu Ser Ser Ser Asp Glu Lys Thr Pro Ser Val

2210 2215 2220Ser Ser Ser Gln Glu Asp Thr Pro Ser Ser Asp Ser Phe Glu Val Ile2225 2230 2235 2240Gln Glu Ser Glu Thr Ala Glu Gly Glu Glu Ser Val Phe Asn Val Ala

2245 2250 2255Leu Ser Val Leu Glu Ala Leu Phe Pro Gln Ser Asp Ala Thr Arg Lys

2260 2265 2270Leu Thr Val Arg Met Asn Cys Cys Val Glu Lys Ser Val Thr Arg Phe

2275 2280 2285Phe Ser Leu Gly Leu Thr Val Ala Asp Val Ala Ser Leu Cys Glu Met

2290 2295 2300Glu Ile Gln Asn His Thr Ala Tyr Cys Asp Lys Val Arg Thr Pro Leu2305 2310 2315 2320Glu Leu Gln Val Gly Cys Leu Val Gly Asn Glu Leu Thr Phe Glu Cys

2325 2330 2335Asp Lys Cys Glu Ala Arg Gln Glu Thr Leu Ala Ser Phe Ser Tyr Ile

2340 2345 2350Trp Ser Gly Val Pro Leu Thr Arg Ala Thr Pro Ala Lys Pro Pro Val

2355 2360 2365Val Arg Pro Val Gly Ser Leu Leu Val Ala Asp Thr Thr Lys Val Tyr

2370 2375 2380Val Thr Asn Pro Asp Asn Val Gly Arg Arg Val Asp Lys Val Thr Phe2385 2390 2395 2400Trp Arg Ala Pro Arg Val His Asp Lys Tyr Leu Val Asp Ser Ile Glu

2405 2410 2415Arg Ala Arg Arg Ala Ala Gln Ala Cys Gln Ser Met Gly Tyr Thr Tyr

2420 2425 2430Glu Glu Ala Ile Arg Thr Val Arg Pro His Ala Ala Met Gly Trp Gly

2435 2440 2445Ser Lys Val Ser Val Lys Asp Leu Ala Thr Pro Ala Gly Lys Met Ala

2450 2455 2460Val His Asp Arg Leu Gln Glu Ile Leu Glu Gly Thr Pro Val Pro Phe2465 2470 2475 2480Thr Leu Thr Val Lys Lys Glu Val Phe Phe Lys Asp Arg Lys Glu Glu

2485 2490 2495Lys Ala Pro Arg Leu Ile Val Phe Pro Pro Leu Asp Phe Arg Ile Ala

2500 2505 2510Glu Lys Leu Ile Leu Gly Asp Pro Gly Arg Val Ala Lys Ala Val Leu

2515 2520 2525Gly Gly Ala Tyr Ala Phe Gln Tyr Thr Pro Asn Gln Arg Val Lys Glu

2530 2535 2540Met Leu Lys Leu Trp Glu Ser Lys Lys Thr Pro Cys Ala Ile Cys Val2545 2550 2555 2560Asp Ala Thr Cys Phe Asp Ser Ser Ile Thr Glu Glu Asp Val Ala Leu

2565 2570 2575Glu Thr Glu Leu Tyr Ala Leu Ala Ser Asp His Pro Glu Trp Val Arg

2580 2585 2590Ala Leu Gly Lys Tyr Tyr Ala Ser Gly Thr Met Val Thr Pro Glu Gly

2595 2600 2605Val Pro Val Gly Glu Arg Tyr Cys Arg Ser Ser Gly Val Leu Thr Thr

2610 2615 2620Ser Ala Ser Asn Cys Leu Thr Cys Tyr Ile Lys Val Lys Ala Ala Cys2625 2630 2635 2640Glu Arg Val Gly Leu Lys Asn Val Ser Leu Leu Ile Ala Gly Asp Asp

2645 2650 2655Cys Leu Ile Ile Cys Glu Arg Pro Val Cys Asp Pro Cys Asp Ala Leu

2660 2665 2670Gly Arg Ala Leu Ala Ser Tyr Gly Tyr Ala Cys Glu Pro Ser Tyr His

2675 2680 2685Ala Ser Leu Asp Thr Ala Pro Phe Cys Ser Thr Trp Leu Ala Glu Cys

2690 2695 2700Asn Ala Asp Gly Lys Arg His Phe Phe Leu Thr Thr Asp Pne Arg Arg2705 2710 2715 2720Pro Leu Ala Arg Met Ser Ser Glu Tyr Ser Asp Pro Met Ala Ser Ala

2725 2730 2735Ile Gly Tyr Ile Leu Leu Tyr Pro Trp His Pro Ile Thr Arg Trp Val

2740 2745 2750Ile Ile Pro His Val Leu Thr Cys Ala Phe Arg Gly Gly Gly Thr Pro

2755 2760 2765Ser Asp Pro Val Trp Cys Gln Val His Gly Asn Tyr Tyr Lys Phe Pro

2770 2775 2780Leu Asp Lys Leu Pro Asn Ile Ile Val Ala Leu His Gly Pro Ala Ala2785 2790 2795 2800Leu Arg Val Thr Ala Asp Thr Thr Lys Thr Lys Met Glu Ala Gly Lys

2805 2810 2815Val Leu Ser Asp Leu Lys Leu Pro Gly Leu Ala Val His Arg Lye Lys

2820 2825 2830Ala Gly Ala Leu Arg Thr Arg Met Leu Arg Ser Arg Gly Trp Ala Glu

2835 2840 2845Leu Ala Arg Gly Leu Leu Trp His Pro Gly Leu Arg Leu Pro Pro Pro

2850 2855 2860Glu Ile Ala Gly Ile Pro Gly Gly Phe Pro Leu Ser Pro Pro Tyr Met2865 2870 2875 2880Gly Val Val His Gln Leu Asp Phe Thr Ser Gln Arg Ser Arg Trp Arg

2885 2890 2895Trp Leu Gly Phe Leu Ala Leu Leu Ile Val Ala Leu Phe Gly

2900 2905 2910(2)SEQ ID NO：184的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV5446IRT

(xi)序列描述：SEQ ID NO：184：CGGTCCCTCG AACTCCAGCG AGTCTTTTTT TTTTTTTTT 39(2)SEQ ID NO：185的信息：

(i)序列特征：

(A)长度：70个氨基酸

(B)类型：氨基酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：蛋白质

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：来自T55806的GE帽

(xi)序列描述：SEQ ID NO：185：Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1 5 10 15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg

20 25 30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser

35 40 45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu

50 55 60Phe Tyr Thr Ile Met Ala65 70(2)SEQ ID NO：186的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-S59变异体

(xi)序列描述：SEQ ID NO：186：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCTCAAG 360CCCTGCCCTT CCCGGTGGGG CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：187的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-S368变异体

(xi)序列描述：SEQ ID NO：187：AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240CGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：188的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-S309变异体

(xi)序列描述：SEQ ID NO：188：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCGGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCATGCGGCG AGAACGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTCACGGGGA AGGACCCCGG 360ATGCTGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：189的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型： DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-FZ变异体(xi)序列描述：SEQ ID NO：189：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GCTACCCACC 240TGGGCAAACG ACGCCCATGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GATTCGTCCG GCGAGTTGAC AAGGACCAGT GGGGGCCGGG GGCCTGGGGA AGGACCCCAG 360ACCCTGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：190的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G21变异体

(xi)序列描述：SEQ ID NO：190：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC 180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCCCAAG 360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：191的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G23变异体

(xi)序列描述：SEQ ID NO：191：AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACATCAGG CATGTCGTTA AACCGAGCCC GTTACCCGCC 240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTACGGGGA AGGACCCCGA 360ACCCTGCCCT TCCCGGCGGA CCGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：192的信息：

(i)序列特征：

(A)长度：405个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G59变异体

(xi)序列描述：SEQ ID NO：192：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACTGAGCCC GTAACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GGATTATTCC CGGCGAGTTG GCAAGGACCA GTGGGGGCCG GGAGCTACAG AGAAGGACTC 360TGAGCTCTGC CCTTCCCGGT GGAACGGGAA ATGCATGGGG CCACC 405(2)SEQ ID NO：193的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-E36变异体

(xi)序列描述：SEQ ID NO：193：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGCCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ACTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCTACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTAAGCCGG CGAGTTGACA AAGACCAGTG GGGGCCGGGG GTCACAGGGA TGGACCCTGG 360ACCCTGCCCT TCCCGGTGGA GTGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：194的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-R38730变异体

(xi)序列描述：SEQ ID NO：194：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGACAGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAGAAGGTTAAGG ATCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCCTACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTATCCCACCTGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAGGTTCGTCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTGCGGGGA AGGACCCCGAACTCTGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC(2)SEQ ID NO：195的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G281变异体

(xi)序列描述：SEQ ID NO：195：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC 180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGGGAA GGACCCCAAG 360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：196的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G157变异体

(xi)序列描述：SEQ ID NO：196：AGACGCAATG ACTCGGCGCC GACCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120AAGGTTAAGA TTCCTCTTGT GCCTGTGGCG AGACAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGACC GACACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GCTGGGGGAA GGACCCCCTT 360GCACCGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：197的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G154变异体

(xi)序列描述：SEQ ID NO：197：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTAC GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGCTGGCCT 180TACCGGTGTG AATAAAGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAGTAG 300GTTTAACCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG CCTTGGAGAT GGACTCCAAG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：198的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G213变异体

(xi)序列描述：SEQ ID NO：198：AGACGCAATG ACTCGGCGCC AACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGTCC 180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ATGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTTCGGGGAA GGACCCCGTA 360CCCTGCCCTT CCCGGTGGAA CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：199的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G204变异体

(xi)序列描述：SEQ ID NO：199：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTT AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCCTGGAGAG GGACTCCAGG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：200的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G191变异体

(xi)序列描述：SEQ ID NO：200：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 6CAGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGG ATCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGCTA AACCGAGCCC GTATCCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGAG GTTACGGGGA AGGACCCCGA 360GCCTCGCCCT TCCCGGTGGG CCGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：201的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-G299变异体

(xi)序列描述：SEQ ID NO：201：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGC ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GAGTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACGGGGA TGGACCCCGG 360GCTCTGCCCT TCCCGGTGGA ACGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：202的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-T56957变异体

(xi)序列描述：SEQ ID NO：202：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTACA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GTCACAGGGA TGGACCCTGG 360GCCCTGCCCT TCCCGGTGGG GTGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：203的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-C01698变异体

(xi)序列描述：SEQ ID NO：203：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAT GGACTCCAAG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：204的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-T27034变异体

(xi)序列描述：SEQ ID NO：204：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTTCCCGCC 240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACTGGGA TGGACCCAGG 360GCTCTGCCCT TCCCGGCGGG GTGGGAAAAG CATGGGGCCA CC 402(2)SEQ ID NO：205的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-E57963变异体

(xi)序列描述：SEQ ID NO：205：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCCCTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAA GGACTCCAAG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：206的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-R37166变异体

(xi)序列描述：SEQ ID NO：206：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTAACCCGCC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTAACCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG CCTTGGAGAT GGACTCCAAG 360TCCTGCCCTT CCCGGCGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：207的信息：

(i)序列特征：

(A)长度：404个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-B5变异体

(xi)序列描述：SEQ ID NO：207：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTTTGCC GGCGAGTTGA CAAGGACCAG TGGGGGCCGG GGGTTATGGG GAAGGACCCC 360AAACCCTGCC CTTCCCGGTG GGCCGGGAAA TGCATGGGGC CACC 404(2)SEQ ID NO：208的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-B33变异体

(xi)序列描述：SEQ ID NO：208：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC CTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTCCCCGCC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG ATCATGGGGA AGGACCCCAG 360ATCCTGCCCT TCCCGGCGGG CCGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：209的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-FH010变异体

(xi)序列描述：SEQ ID NO：209：AGACGCAATG ACTCGGCGCC GACCCGGCCA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120AAGGTTAAGA TTCCTCTTGT GCCTGTGGCG AGACAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACTGAGACC GACACCCACC 240TGGGCAAAGG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTGGGGGAA GGACCCCCAG 360TCCTGCCCTT CCCGGTGGGA CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：210的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-PNF2161变异体

(xi)序列描述：SEQ ID NO：210：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTTACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCGTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG 360TCCCGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：211的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-JC变异体

(xi)序列描述：SEQ ID NO：211：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGGG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTAACCCGCC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCGCTCT TGACCAATAC 300GCTTAGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG TTTATGGGGA AGGACCCCAA 360ACCCTGCCCT TCCCGGCGGA CCGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：212的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-7155变异体

(xi)序列描述：SEQ ID NO：212：AGACGTTATG AACCGGCGCC GCCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120GTGGTCAAGG TCCCTCTAGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTATCCTCC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GCCGGGGGAA GGACCCCCGG 360TACTGCCCCT CCCGGAGGAG TGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：213的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-7244变异体

(xi)序列描述：SEQ ID NO：213：AGACGTTAAG AACCGGCGCC GCCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120GTGGTCAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCTCC 240TGGGCAAACG ACGCCCATGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGT GGCGGGGGAA GGACCCCCGT 360CACTGCCCTT CCCGGAGGGG TGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：214的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-K27变异体

(xi)序列描述：SEQ ID NO：214：AGACGTTAAG TACCGGCGCC GACCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120TTGGTCAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCACC 240TGGGCAAACA ACGCCCACGT ACGGTCCACG TCGCCCTACA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCTGGGC GGCGAGGGAA GGACCCTCGT 360CGCTGCCCTT CCCGGCGGGG TGGGGAATGC ATGGGGCCAC C 401(2)SEQ ID NO：215的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-K30变异体

(xi)序列描述：SEQ ID NO：215：AGACGTTAAG AACCGGCGCC TTCCCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAGT CCCGGTCATCTTGGTAGCCA CTATAGGTGG GTCTTAAGGG 120AGGGTTAAGG TCCCTCTGGC GCTTGTGGCG AGAAAGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ATTACCCACC 240TGGGCAAACA ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTTTGCCGG CGAGTTGACA AGGACCAGTG GGGGCTGGGC GGTAGGGGAA GGACCCTTGC 360CGCTGCCCTT CCCGGTGGGG TGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：216的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-T55875变异体

(xi)序列描述：SEQ ID NO：216：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGACG AGACCGCGCA CGGTCCGCAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GTTTAACCGG CGAGTTGGCA AGGACCAGTG GGGGCCGGGG GCTTGGAGAG GGACTCCAAG 360TCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：217的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-T56633变异体

(xi)序列描述：SEQ ID NO：217：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC ACTACCCACC 240TGGGCTAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGTCTCTCT TGACCAATAG 300GCTAGTCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGAG GTCACAGGGA TGGACCCTGG 360GCCTTGCCCT TCCCGGTGGA GTGGGAAAAG CATGGGGCCA CC 402(2)SEQ ID NO：218的信息：

(i)序列特征：

(A)长度：404个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-EB20变异体

(xi)序列描述：SEQ ID NO：218：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTA ATAAGGGCCC GACGTCAGGC TCGTCGTTAA ACCGAGCCCG TCACCCACCT 240GGGCAAACGA CGCCCACGTA CGGTCCACGT CGCCCTTCAA TGCCTCTCTT GGCCAATAGG 300AGTTATCTCC GGCGAGTTGG CAAGGACCAG TGGGGGCCGG GGGTTACGGG GAAGGACCCC 360GAACCCTGCC CTTCCCGGTG GGCCGGGAAA TGCATGGGGC CACC 404(2)SEQ ID NO：219的信息：

(i)序列特征：

(A)长度：401个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-T55806变异体

(xi)序列描述：SEQ ID NO：219：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGCC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCATC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGGA ATAAGGGCCC GACGTCAGGC TCGTCGTTAA ACCGAGCCCG TCACCCACCT 240GGGCAAACGA CGCTCACGTA CGGTCCACGT CGCCCTTCAA TGTCTCTCTT GACCAATAGG 300TTTATCCGGC GAGTTGACAA GGACCAGTGG GGGCCGGGGG TTACGGGGAC GGACCCCGAA 360CCCTGCCCTT CCCGGTGGGC CGGGAAATGC ATGGGGCCAC C 401(2)SEQ ID NO：220的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-BG34变异体

(xi)序列描述：SEQ ID NO：220：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCACAG GTGTTGGCCC 180TACCGGTGTG AATAAGGGCC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GTCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GAGTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGA GTCACGGGGA TGGACCCCGG 360GCTCTGCCCT TCCCGGTGGA ACGGGAAACG CATGGGGCCA CC 402(2)SEQ ID NO：221的信息：

(i)序列特征：

(A)长度：402个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV-BE12变异体

(xi)序列描述：SEQ ID NO：221：AGACGCAATG ACTCGGCGCC GACTCGGCGA CCGGCCAAAA GGTGGTGGAT GGGTGATGAC 60AGGGTTGGTA GGTCGTAAAT CCCGGTCACC TTGGTAGCCA CTATAGGTGG GTCTTAAGAG 120AAGGTTAAGA TTCCTCTTGT GCCTGCGGCG AGACCGCGCA CGGTCCGCAG GTGTTGGTCC 180TACCGGTGTG AATAAGGACC CGACGTCAGG CTCGTCGTTA AACCGAGCCC GCCACCCACC 240TGGGCAAACG ACGCCCACGT ACGGTCCACG TCGCCCTTCA ATGCCTCTCT TGGCCAATAG 300GTTTATCCGG CGAGTTGACA AGGACCAGTG GGGGCCGGGG GCTCCGGGGA AGAACCCCGA 360GCCCCGCCCT TCCCGGTGGG ACGGGAAATG CATGGGGCCA CC 402(2)SEQ ID NO：222的信息：

(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV正向引物

(xi)序列描述：SEQ ID NO：222：CCAAAAGGTG GTGGATGGGT GATG 24(2)SEQ ID NO：223的信息：

(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV正向引物

(xi)序列描述：SEQ ID NO：223：GTGATGMCAG GGTTGGTAGG TCGT 24(2)SEQ ID NO：224的信息：

(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV正向引物

(xi)序列描述：SEQ ID NO：224：GGTAGCCACT ATAGGTGGGT CTTAAG 26(2)SEQ ID NO：225的信息：

(i)序列特征：

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV反向引物

(xi)序列描述：SEQ ID NO：225：GAGMGRCATT GWAGGGCGAC GTRGA 25(2)SEQ ID NO：226的信息：

(i)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV反向引物

(xi)序列描述：SEQ ID NO：226：GRCATTGWAG GGCGACGTRG A 21(2)SEQ ID NO：227的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：HGV反向引物

(xi)序列描述：SEQ ID NO：227：CCCCACTGGT CYTTGYCAAC TC 22(2)SEQ ID NO：228的信息：

(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV75-36FE

(xi)序列描述：SEQ ID NO：228：GCGAGATCTA AAATGCAGGC CTGATGGGT 29(2)SEQ ID NO：229的信息：

(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：未知

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GV75-7064RLE

(xi)序列描述：SEQ ID NO：229：GCGAGATCTA AAATGTGGAC TGCTAAGCC 29(2)SEQ ID NO：230的信息：

(i)序列特征：

(A)长度：46个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物FV94-28F

(xi)序列描述：SEQ ID NO：230：GCGAGATCTA AAATGGCAAG CCCCAGAAAC CGACGCCTAT CTAAGT 46(2)SEQ ID NO：231的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物FV94-2864R

(xi)序列描述：SEQ ID NO：231：GGCATGATGA ATTCGCAACG AGGGCCGGGA CACCAAGAT 39(2)SEQ ID NO：232的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物FV94-6439F

(xi)序列描述：SEQ ID NO：232：GCGAGATCTA AAATGGGCCT CCGACACCCC GAAGGTTGT 39(2)SEQ ID NO：233的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物FV94-9331R

(xi)序列描述：SEQ ID NO：233：GCGAGATCTG AATTCTTCCC GGGGTGCACC CCTTCAGAT 39(2)SEQ ID NO：234的信息：

(i)序列特征：

(A)长度：9327个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性

(ii)分子类型：cDNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：3ZHGV-6，来自PNF2161的HGV

(xi)序列描述：SEQ ID NO：234：GCAAGCCCCA GAAACCGACG CCTATCTAAG TAGACGCAAT GACTCGGCGC CGACTCGGCG 60ACCGGCCAAA AGGTGGTGGA TGGGTGATGA CAGGGTTGGT AGGTCGTAAA TCCCGGTCAC 120CTTGGTAGCC ACTATAGGTG GGTCTTAAGA GAAGGTTAAG ATTCCTCTTG TGCCTGCGGC 180GAGACCGCGC ACGGTCCACA GGTGTTGGCC CTACCGGTGG GAATAAGGGC CCGACGTCAG 240GCTCGTCGTT AAACCGAGCC CGTTACCCAC CTGGGCAAAC GACGCCCACG TACGGTCCAC 300GTCGCCCTTC AATGTCTCTC TTGACCAATA GGCGTAGCCG GCGAGTTGAC AAGGACCAGT 360GGGGGCCGGG GGCTTGGAGA GGGACTCCAA GTCCCGCCCT TCCCGGTGGG CCGGGAAATG 420CATGGGGCCA CCCAGCTCCG CGGCGGCCTG CAGCCGGGGT AGCCCAAGAA TCCTTCGGGT 480GAGGGCGGGT GGCATTTCCT TTTTCTATAC CATCATGGCA GTCCTTCTGC TCCTTCTCGT 540GGTTGAGGCC GGGGCCATTC TGGCCCCGGC CACCCACGCT TGTCGAGCGA ATGGGCAATA 600TTTCCTCACA AATTGTTGTG CCCCGGAGGA CATCGGGTTC TGCCTGGAGG GTGGATGCCT 660GGTGGCCCTG GGGTGCACGA TTTGCACTGA CCAATGCTGG CCACTGTATC AGGCGGGTTT 720GGCTGTGCGG CCTGGCAAGT CCGCGGCCCA ACTGGTGGGG GAGCTGGGTA GCCTATACGG 780GCCCCTGTCG GTCTCGGCCT ATGTGGCTGG GATCCTGGGC CTGGGTGAGG TGTACTCGGG 840TGTCCTAACG GTGGGAGTCG CGTTGACGCG CCGGATCTAC CCGGTGCCTA ACCTGACGTG 900TGCAGTCGCG TGTGAGTTAA AGTGGGAAAG TGAGTTTTGG AGATGGACTG AACAGCTGGC 960CTCCAACTAC TGGATTCTGG AATACCTCTG GAAGGTCCCA TTTGATTTCT GGAGAGGCGT 1020GATAAGCCTG ACCCCCTTGT TGGTTTGCGT GGCCGCATTG CTGCTGCTTG AGCAACGGGT 1080TGTCATGGTC TTCCTGTTGG TGACGATGGC CGGGATGTCG CAAGGCGCCC CTGCCTCCGT 1140TTTGGGGTCA CGCCCCTTTG ACTACGGGTT GACTTGGCAG ACCTGCTCTT GCAGGGCCAA 1200CGGTTCGCGT TTTTCGACTG GGGAGAAGGT GTGGGACCGT GGGAACGTTA CGCTTCAGTG 1260TGACTGCCCT AACGGCCCCT GGGTGTGGTT GCCAGCCTTT TGCCAAGCAA TCGGCTGGGG 1320TGACCCCATC ACTTATTGGA GCCACGGGCA AAATCAGTGG CCCCTTTCAT GCCCCCAGTA 1380TGTCTATGGG TCTGCTACAG TCACTTGCGT GTGGGGTTCC GCTTCTTGGT ATGCCTCCAC 1440CAGTGGTCGC GACTCGAAGA TAGATGTGTG GAGTTTAGTG CCAGTTGGCT CTGCCACCTG 1500CACCATAGCC GCACTTGGAT CATCGGATCG CGACACGGTG CCTGGGCTCT CCGAGTGGGG 1560AATCCCGTGC GTGACGTGTG TTCTGGACCG TCGGCCTGCT TCATGCGGCA CCTGTGTGAG 1620GGACTGCTGG CCCGAGACCG GGTCGGTTAG GTTCCCATTC CATCGGTGCG GCGTGGGGCC 1680TCGGCTGACA AAGGACTTGG AAGCTGTGCC CTTCGTCAAT AGGACAACTC CCTTCACCAT 1740TAGGGGGCCC CTGGGCAACC AGGGCCGAGG CAACCCGGTG CGGTCGCCCT TGGGTTTTGG 1800GTCCTACGCC ATGACCAGGA TCCGAGATAC CCTACATCTG GTGGAGTGTC CCACACCAGC 1860CATCGAGCCT CCCACCGGGA CGTTTGGGTT CTTCCCCGGG ACGCCGCCTC TCAACAACTG 1920CATGCTCTTG GGCACGGAAG TGTCCGAGGC ACTTGGGGGG GCTGGCCTCA CGGGGGGGTT 1980CTATGAACCC CTGGTGCGCA GGTGTTCGGA GCTGATGGGA AGCCGAAATC CGGTTTGTCC 2040GGGGTTTGCA TGGCTCTCTT CGGGCAGGCC TGATGGGTTT ATACATGTCC AGGGTCACTT 2100GCAGGAGGTG GATGCAGGCA ACTTCATCCC GCCCCCGCGC TGGTTGCTCT TGGACTTTGT 2160ATTTGTCCTG TTATACCTGA TGAAGCTGGC TGAGGCACGG TTGGTCCCGC TGATCTTGCT 2220GCTGCTATGG TGGTGGGTGA ACCAGCTGGC AGTCCTAGGG CTGCCGGCTG TGGAAGCCGC 2280CGTGGCAGGT GAGGTCTTCG CGGGCCCTGC CCTGTCCTGG TGTCTGGGAC TCCCGGTCGT 2340CAGTATGATA TTGGGTTTGG CAAACCTGGT GCTGTACTTT AGATGGTTGG GACCCCAACG 2400CCTGATGTTC CTCGTGTTGT GGAAGCTTGC TCGGGGAGCT TTCCCGCTGG CCCTCTTGAT 2460GGGGATTTCG GCGACCCGCG GGCGCACCTC AGTGCTCGGG GCCGAGTTCT GCTTCGATGC 2520TACATTCGAG GTGGACACTT CGGTGTTGGG CTGGGTGGTG GCCAATGTGG TAGCTTGGGC 2580CATTGCGCTC CTGAGCTCGA TGAGCGCAGG GGGGTGGAGG CACAAAGCCG TGATCTATAG 2640GACGTGGTGT AAGGGGTACC AGGCAATCCG TCAAAGGGTG GTGAGGAGCC CCCTCGGGGA 2700GGGGCGGCCT GCCAAACCCC TGACCTTTGC CTGGTGCTTG GCCTCGTACA TCTGGCCAGA 2760TGCTGTGATG ATGGTGGTGG TTGCCTTGGT TCTTCTCTTT GGCCTGTTCG ACGCGTTGGA 2820TTGGGCCTTG GAGGAGATCT TGGTGTCCCG GCCCTCGCTG CGGCGTTTGG CTCGGGTGGT 2880TGAGTGCTGT GTGATGGCGG GTGAGAAGGC CACAACCGTC CGGCTGGTCT CCAAGATGTG 2940TGCGAGAGGA GCTTATTTGT TCGATCATAT GGGCTCATTT TCGCGTGCTG TCAAGGAGCG 3000CCTGTTGGAA TGGGACGCGG CTCTTGAACC TCTGTCATTC ACTAGGACGG ACTGTCGCAT 3060CATACGGGAT GCCGCGAGGA CTTTGTCCTG CGGGCAATGC GTCATGGGTT TACCCGTGGT 3120TGCGCGCCGT GGTGATGAGG TTCTCATCGG CGTCTTCCAG GATGTGAATC ATTTGCCTCC 3180CGGGTTTGTT CCGACCGCGC CTGTTGTCAT CCGACGGTGC GGAAAGGGCT TCTTGGGGGT 3240CACAAAGGCT GCCTTGACAG GTCGGGATCC TGACTTACAT CCAGGGAACG TCATGGTGTT 3300GGGGACGGCT ACGTCGCGAA GCATGGGAAC ATGCTTGAAC GGCCTGCTGT TCACGACCTT 3360CCATGGGGCT TCATCCCGAA CCATCGCCAC ACCCGTGGGG GCCCTTAATC CCAGATGGTG 3420GTCAGCCAGT GATGATGTCA CGGTGTATCC ACTCCCGGAT GGGGCTACTT CGTTAACGCC 3480TTGTACTTGC CAGGCTGAGT CCTGTTGGGT CATCAGATCC GACGGGGCCC TATGCCATGG 3540CTTGAGCAAG GGGGACAAGG TGGAGCTGGA TGTGGCCATG GAGGTCCCTG ATTTCCGTGG 3600CTCGTCTGGC TCACCGGTCC TATGTGACGA GGGGCACGCA GTAGGAATGC TCGTGTCTGT 3660GCTTCACTCC GGTGGTAGGG TCACCGCGGC ACGGTTCACT AGGCCGTGGA CCCAAGTGCC 3720AACAGATGCC AAAACCACCA CTGAACCCCC TCCGGTGCCG GCCAAAGGAG TTTTCAAAGA 3780GGCCCCGTTG TTTATGCCTA CGGGAGCGGG AAAGAGCACT CGCGTCCCGT TGGAGTACGG 3840CAACATGGGG CACAAGGTCT TAGTCTTGAA CCCCTCAGTG GCCACTGTGC GGGCCATGGG 3900CCCGTACATG GAGCGGCTGG CGGGTAAACA TCCAAGTATA TACTGTGGGC ATGATACAAC 3960TGCTTTCACA AGGATCACTG ACTCCCCCCT GACGTATTCA ACCTATGGGA GGTTTTTGGC 4020CAACCCTAGG CAGATGCTAC GGGGCGTTTC GGTGGTCATT TGTGATGAGT GCCACAGTTA 4080TGACTCAACC GTGCTGTTAG GCATTGGGAG GGTTCGGGAG CTGGCGCGTG GGTGCGGAGT 4140GCAACTAGTG CTCTACGCCA CCGCTACGCC TCCCGGATCC CCTATGACGC AGCACCCTTC 4200CATAATTGAG ACAAAATTGG ACGTGGGCGA GATTCCCTTT TATGGGCACG GAATACCCCT 4260CGAGCGGATG CGAACCGGAA GGCACCTCGT GTTCTGCCAT TCTAAGGCTG AGTGCGAGCG 4320CCTTGCTGGC CAGTTCTCCG CTAGGGGGGT CAATGCCATT GCCTATTATA GGGGTAAAGA 4380CAGTTCTATC ATCAAGGATG GGGACCTGGT GGTCTGTGCC ACAGACGCGC TTTCCACTGG 4440GTACACTGGA AATTTCGACT CCGTCACCGA CTGTGGATTA GTGGTGGAGG AGGTCGTTGA 4500GGTGACCCTT GATCCTACCA TTACCATCTC CCTGCGGACA GTGCCTGCGT CGGCTGAACT 4560GTCGATGCAA AGACGAGGAC GCACGGGTAG GGGCAGGTCT GGACGCTACT ACTACGCGGG 4620GGTGGGCAAA GCCCCTGCGG GTGTGGTGCG CTCAGGTCCT GTCTGGTCGG CGGTGGAAGC 4680TGGAGTGACC TGGTACGGAA TGGAACCTGA CTTGACAGCT AACCTACTGA GACTTTACGA 4740CGACTGCCCT TACACCGCAG CCGTCGCGGC TGATATCGGA GAAGCCGCGG TGTTCTTCTC 4800TGGGCTCGCC CCATTGAGGA TGCACCCTGA TGTCAGCTGG GCAAAAGTTC GCGGCGTCAA 4860CTGGCCCCTC TTGGTGGGTG TTCAGCGGAC CATGTGTCGG GAAACACTGT CTCCCGGCCC 4920ATCGGATGAC CCCCAATGGG CAGGTCTGAA GGGCCCAAAT CCTGTCCCAC TCCTGCTGAG 4980GTGGGGCAAT GATTTACCAT CTAAAGTGGC CGGCCACCAC ATAGTGGACG ACCTGGTCCG 5040GAGACTCGGT GTGGCGGAGG GTTACGCCCG CTGCGACGCT GGGCCGATCT TGATGATCGG 5100TCTAGCTATC GCGGGGGGAA TGATCTACGC GTCGTACACC GGGTCGCTAG TGGTGGTGAC 5160AGACTGGGAT GTGAAGGGGG GTGGCGCCCC CCTTTATCGG CATGGAGACC AGGCCACGCC 5220TCAGCCGGTG GTGCAGGTTC CTCCGGTAGA CCATCGGCCG GGGGGTGAAT CAGCACCATC 5280GGATGCCAAG ACAGTGACAG ATGCGGTGGC AGCGATCCAG GTGGACTGCG ATTGGACTAT 5340CATGACTCTG TCGATCGGAG AAGTGTTGTC CTTGGCTCAG GCTAAGACGG CCGAGGCCTA 5400CACAGCAGCC ACCAAGTGGC TCGCTGGCTG CTATACGGGG ACGCGGGCCG TTCCCACTGT 5460ATCCATTGTT GACAAGCTCT TCGCCGGAGG GTGGGCGGCT GTGGTGGGCC ATTGCCACAA 5520CGTGATTGCT GCGGCGGTGG CGGCCTACGG GGCTTCAAAG AGCCCGCCGT TGGCAGCCGC 5580GGCTTCCTAC CTGATGGGGT TGGGCGTTGG AGGCAACGCT CAGACGCGTC TGGCATCTGC 5640CCTCCTATTG GGGGCTGCTG GAACCGCCTT GGGCACTCCT GTCGTGGGCT TGACCATGGC 5700AGGTGCGTTC ATGGGGGGCG CCAGTGTCTC CCCCTCCTTG GTCACCATTT TATTGGGGGC 5760CGTCGGAGGT TGGGAGGGTG TTGTCAACGC GGCGAGCCTA GTCTTTGACT TCATGGCGGG 5820GAAACTTTCA TCAGAAGATC TGTGGTATGC CATCCCGGTA CTGACCAGCC CGGGGGCGGG 5880CCTTGCGGGG ATCGCTCTCG GGTTGGTTTT GTATTCAGCT AACAACTCTG GCACTACCAC 5940TTGGTTGAAC CGTCTGCTGA CTACGTTACC AAGGTCTTCA TGTATCCCGG ACAGTTACTT 6000TCAGCAAGTT GACTATTGCG ACAAGGTCTC AGCCGTGCTC CGGCGCCTGA GCCTCACCCG 6060CACAGTGGTT GCCCTGGTCA ACAGGGAGCC TAAGGTGGAT GAGGTACAGG TGGGGTATGT 6120CTGGGACCTG TGGGAGTGGA TCATGCGCCA AGTGCGCGTG GTCATGGCCA GACTCAGGGC 6180CCTCTGCCCC GTGGTGTCAT TACCCTTGTG GCACTGCGGG GAGGGGTGGT CCGGGGAATG 6240GTTGCTTGAC GGTCATGTTG AGAGTCGCTG CCTCTGTGGC TGCGCGATCA CTGGTGACGT 6300TCTGAATGGG CAACTCAAAG AACCAGTTTA CTCTACCAAG CTGTGCCGGC ACTATTGGAT 6360GGGGACTGTC CCTGTGAACA TGCTGGGTTA CGGTGAAACG TCGCCTCTCC TGGCCTCCGA 6420CACCCCGAAG GTTGTGCCCT TCGGGACGTC TGGCTGGGCT GAGGTGGTGG TGACCACTAC 6480CCACGTGGTA ATCAGGAGAA CCTCCGCCTA TAAGCTGCTG CGCCAGCAAA TCCTATCGGC 6540TGCTGTAGCT GAGCCCTACT ACGTCGACGG CATTCCGGTC TCATGGGACG CGGACGCTCG 6600TGCGCCCGCC ATGGTCTATG GCCCTGGGCA AAGTGTTACC ATTGACGGGG AGCGCTACAC 6660CCTGCCTCAT CAACTGAGGC TCAGGAATGT GGCGCCCTCT GAGGTTTCAT CCGAGGTGTC 6720CATTGACATT GGGACGGAGA CTGGAGACTC AGAACTGACT GAGGCCGATC TGCCGCCGGC 6780GGCTGCTGCT CTCCAAGCGA TCGAGAATGC TGCGAGGATT CTTGAACCGC ACATTGATGC 6840CATCATGGAG GACTGCAGTA CACCCTCTCT TTGTGGTAGT AGCCGAGAGA TGCCTGTATG 6900GGGAGAAGAC ATCCCCCGTA CTCCATCGCC AGCACTTATC TCGGTTACTG AGAGCAGCTC 6960AGATGAGAAG ACCCCGTCGG TGTCCTCCTC GCAGGAGGAT ACCCCGTCCT CTGACTCATT 7020CGAGGTCATC CAAGAGTCCG AGACAGCCGA AGGGGAGGAA AGCGTCTTCA ACGTGGCTCT 7080TTCCGTATTA GAAGCCTCAT TTCCACAGAG CGACGCGACC AGGAAGCTTA CCGTCAAGAT 7140GTCGTGCTGC GTTGAAAAGA GCGTCACGCG CTTTTTCTCA TTGGGGTTGA CGGTGGCTGA 7200TGTTGCTAGC CTGTGTGAGA TGGAAATCCA GAACCATACA GCCTATTGTG ACAAGGTGCG 7260CACTCCGCTT GAATTGCAGG TTGGGTGCTT GGTGGGCAAT GAACTTACCT TTGAATGTGA 7320CAAGTGTGAG GCTAGGCAAG AAACCTTGGC CTCCTTCTCT TACATTTGGT CTGGAGTGCC 7380GCTGACTAGG GCCACGCCGG CCAAGCCTCC CGTGGTGAGG CCGGTTGGCT CTTTATTAGT 7440GGCCGACACT ACTAAGGTGT ATGTTACCAA TCCAGACAAT GTGGGACGGA GGGTGGACAA 7500GGTGACCTTC TGGCGTGCTC CTAGGGTTCA TGATAAGTAC CTCGTGGACT CTATTGAGCG 7560CGCTAAGAGG GCCGCTCAAG CCTGCCTAAG CATGGGTTAC ACTTATGAGG AAGCAATAAG 7620GACTGTAAGG CCACATGCTG CCATGGGCTG GGGATCTAAG GTGTCGGTTA AGGACTTAGC 7680CACCCCCGCG GGGAAGATGG CCGTCCATGA CCGGCTCCAG GAGATACTTG AAGGGACTCC 7740GGTCCCCTTT ACTCTTACTG TGAAAAAGGA GGTGTTCTTC AAAGACCGGA AGGAGGAGGA 7800GGCCCCCCGC CTCATTGTGT TCCCCCCCCT GGACTTCCGG ATAGCTGAAA AGCTCATCTT 7860GGGAGACCCA GACCGGGTAG CCAAGGCGGT GTTGGGGGGG GCCTACGCCT TCCAGTACAC 7920CCCAAATCAG CGAGTTAAGG AGATGCTCAA GCTATGGGAG TCTAAGAAGA CCCCTTGCGC 7980CATCTGTGTG GACGCCACCT GCTTCGACAG TAGCATAACT GAAGAGGACG TGGCTTTGGA 8040GACAGAGCTG TACGCTCTGG CCTCTGACCA TCCAGAATGG GTGCGGGCAC TTGGGAAATA 8100CTATGCCTCA GGCACCATGG TCACCCCGGA AGGGGTGCCC GTCGGTGAGA GGTATTGCAG 8160ATCCTCGGGT GTCCTAACAA CTAGCGCGAG CAACTGCTTG ACCTGCTACA TCAAGGTGAA 8220AGCCGCCTGT GAGAGGGTGG GGCTGAAGAA TGTCTCTCTT CTCATAGCCG GCGATGACTG 8280CTTGATCATA TGTGAGCGGC CAGTGTGCGA CCCAAGCGAC GCTTTGGGCA GAGCCCTAGC 8340GAGCTATGGG TACGCGTGCG AGCCCTCATA TCATGCATCC TTGGACACGG CCCCCTTCTG 8400CTCCACTTGG CTTGCTGAGT GCAATGCAGA TGGGAAGCGC CATTTCTTCC TGACCACGGA 8460CTTCCGGAGG CCGCTCGCTC GCATGTCGAG TGAGTATAGT GACCCGATGG CTTCGGCGAT 8520CGGTTACATC CTCCTTTATC CTTGGCACCC CATCACACGG TGGGTCATCA TCCCTCATGT 8580GCTAACGTGC GCATTCAGGG GTGGAGGCAC ACCGTCTGAT CCGGTTTGGT GCCAGGTACA 8640TGGTAACTAC TACAAGTTTC CACTGGACAA ACTGCCTAAC ATCATCGTGG CCCTCCACGG 8700ACCAGCAGCG TTGAGGGTTA CCGCAGACAC AACTAAAACA AAGATGGAGG CTGGTAAGGT 8760TCTGAGCGAC CTCAAGCTCC CTGGCTTAGC AGTCCACCGA AAGAAGGCCG GGGCGTTGCG 8820AACACGCATG CTCCGCTCGC GCGGTTGGGC TGAGTTGGCT AGGGGCTTGT TGTGGCATCC 8880AGGCCTACGG CTTCCTCCCC CTGAGATTGC TGGTATCCCG GGGGGTTTCC CTCTCTCCCC 8940CCCCTATATG GGGGTGGTAC ACCAATTGGA TTTTACAAGC CAGAGGAGTC GCTGGCGGTG 9000GTTGGGGTTC TTAGCCCTGC TCATCGTAGC CCTCTTCGGG TGAACTAAAT TCATCTGTTG 9060CGGCGAGGTC TGGTGACTGA TCGTCACCGG AGGAGGTTCC CGCCCTCCCC GCCCCAGGGG 9120TCTCCCCGCT GGGTAAAAAG GGCCCGGCCT TGGGAGGCAT GGTGGTTACT AACCCCCTGG 9180CAGGGTTAAA GCCTGATGGT GCTAATGCAC TGCCACTTCG GTGGCGGGTC GCTACCTTAT 9240AGCGTAATCC GTGACTACGG GCTGCTCGCA GAGCCCTCCC CGGATGGGGC ACAGTGCACT 9300GAGATCTGAA GGGGTGCACC CCGGGAA 9327(2)SEQ ID NO：235的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GLI-F

(xi)序列描述：SEQ ID NO：235：TAGCATGGCC TTTGCAGGGC TG 22(2)SEQ ID NO：236的信息：

(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GLI-R

(xi)序列描述：SEQ ID NO：236：AAGCTGTGAC CGTCTCCG 18(2)SEQ ID NO：237的信息：

(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GE1-NF

(xi)序列描述：SEQ ID NO：237：GCCGCCATGG CGGGGAAACT TTCATCAGAA G 31(2)SEQ ID NO：238的信息：

(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GE1-NR

(xi)序列描述：SEQ ID NO：238：GCGCGGATCC TAGTGACACC ACGGGGCAGA GG 32(2)SEQ ID NO：239的信息：

(i)序列特征：

(A)长度：33个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GE57F

(xi)序列描述：SEQ ID NO：239：GCCGCCATGG CTCTCTTGAC CAATAGGTTT ATC 33(2)SEQ ID NO：240的信息：

(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GE57R

(xi)序列描述：SEQ ID NO：240：GCGCGGATCC AGAAATGCCA CCCGCCCTCA C 31(2)SEQ ID NO：241的信息：

(i)序列特征：

(A)长度：61个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：GE57氨基酸序列

(xi)序列描述：SEQ ID NO：241：Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln1 5 10 15Trp Gly Pro Gly Val Thr Gly Thr Asp Pro Glu Pro Cys Pro Ser Arg

20 25 30Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser

35 40 45Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly

50 55 60(2)SEQ ID NO：242的信息：

(i)序列特征：

(A)长度：52个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：E1的正向引物

(xi)序列描述：SEQ ID NO：242：GCGCAGATCT AAAATGAGCC GTGGTGGCAT TTCCTTTTTC TATACCATCA TG 52(2)SEQ ID NO：243的信息：

(i)序列特征：

(A)长度：38个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：E1的反向引物

(xi)序列描述：SEQ ID NO：243：GCGCAGATCT CCAGAAATCA AATGGGACCT TCCAGAGG 38(2)SEQ ID NO：244的信息：

(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：带有昆虫信号序列的E2的正向引物

(xi)序列描述：SEQ ID NO：244：CGCGAGATCT GTCGCAAGGC GCCCCT 26(2)SEQ ID NO：245的信息：

(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：带有昆虫信号序列的E2的反向引物

(xi)序列描述：SEQ ID NO：245：GCGCAGATCT AGTTGCCTGC ATCCACCT 28(2)SEQ ID NO：246的信息：

(i)序列特征：

(A)长度：42个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：带有HGV信号序列的E2的正向引物

(xi)序列描述：SEQ ID NO：246：CGCGAGATCT AAAATGAAAC TGCTTGTCAT GGTCTTCCTG TT 42(2)SEQ ID NO：247的信息：

(i)序列特征：

(A)长度：28个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：带有HGV信号序列的反向引物

(xi)序列描述：SEQ ID NO：247：GCGCAGATCT AGTTGCCTGC ATCCACCT 28(2)SEQ ID NO：248的信息：

(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：NS2a的正向引物

(xi)序列描述：SEQ ID NO：248：GCGCAGATCT GGCCGTGGCA GGTGAGGTCT TCGC 34(2)SEQ ID NO：249的信息：

(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：NS2a的反向引物

(xi)序列描述：SEQ ID NO：249：GCGCAGATCT TAACGCCGCA ACGAGGGCCG G 31(2)SEQ ID NO：250的信息：

(i)序列特征：

(A)长度：46个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：NS2b的正向引物

(xi)序列描述：SEQ ID NO：250：GCGCGGATCC AAAATGATCG CTCGGGTGGT TGAGTGCTGT GTGATG 46(2)SEQ ID NO：251的信息：

(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：NS2b的反向引物

(xi)序列描述：SEQ ID NO：251：GCGCGGATCC AGGCGCGGTC GGAACAAACC CG 32(2)SEQ ID NO：252的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物NS3

(xi)序列描述：SEQ ID NO：252：GCGAGATCTA AAATGTGCGG AAAGGGCTTC TTGGGGGTC 39(2)SEQ ID NO：253的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物NS3

(xi)序列描述：SEQ ID NO：253：GCGAGATCTC ATCTCCGGAC CAGGTCGTCC ACTATGTGG 39(2)SEQ ID NO：254的信息：

(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物NS4a

(xi)序列描述：SEQ ID NO：254：GGCGGATCCA AAATGATCGG TGTGGCGGAG G 31(2)SEQ ID NO：255的信息：

(i)序列特征：

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物NS4a

(xi)序列描述：SEQ ID NO：255：GGCGGGATCC ATGCGCCGGA GCACGG 26(2)SEQ ID NO：256的信息：

(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物NS4b

(xi)序列描述：SEQ ID NO：256：GCGGGATCCA AAATGATCAG CCTCACCCGC ACAG 34(2)SEQ ID NO：257的信息：

(i)序列特征：

(A)长度：29个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物NS5a

(xi)序列描述：SEQ ID NO：257：GGCGGGATCC TACCTCCTGA TTACCACGT 29(2)SEQ ID NO：258的信息：

(i)序列特征：

(A)长度：42个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物NS5a

(xi)序列描述：SEQ ID NO：258：GCGAGATCTA AAATGACCTC CGCCTATAAG CTGCTGCGCC AG 42(2)SEQ ID NO：259的信息：

(i)序列特征：

(A)长度：40个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物NS5a

(xi)序列描述：SEQ ID NO：259：GGCAGATCTA CCTCCGTCCC ACATTGTCTG GATTGCTAAC 40(2)SEQ ID NO：260的信息：

(i)序列特征：

(A)长度：43个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物NS5b

(xi)序列描述：SEQ ID NO：260：GCGAGATCTA AAATGGTGGA CAAGGTGACC TTCTGGCGTG CTC 43(2)SEQ ID NO：261的信息：

(i)序列特征：

(A)长度：36个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物NS5b

(xi)序列描述：SEQ ID NO：261：GCGAGATCTC ACCCGAAGAG GGCTACGATG AGCAGG 36(2)SEQ ID NO：262的信息：

(i)序列特征：

(A)长度：52个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：正向引物E1-E2-NS2a

(xi)序列描述：SEQ ID NO：262：GCGCAGATCT AAAATGAGCC GTGGTGGCAT TTCCTTTTTC TATACCATCA TG 52(2)SEQ ID NO：263的信息：

(i)序列特征：

(A)长度：31个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：反向引物E1-E2-NS2a

(xi)序列描述：SEQ ID NO：263：GCGCAGATCT TAACGCCGCA ACGAGGGCCG G 31(2)SEQ ID NO：264的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物9E3-REV

(xi)序列描述：SEQ ID NO：264：GCTGGCTGAG GCACGGTTGG TC 22(2)SEQ ID NO：265的信息：

(i)序列特征：

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物E39-94PR

(xi)序列描述：SEQ ID NO：265：CACCATCATC ACAGCATCTG GC 22(2)SEQ ID NO：266的信息：

(i)序列特征：

(A)长度：32个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GEP-F12

(xi)序列描述：SEQ ID NO：266：GCAACCATGG AACCTGCCAA ACCCCTGACC TT 32(2)SEQ ID NO：267的信息：

(i)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GEP-R12

(xi)序列描述：SEQ ID NO：267：AGCCCCATGG AAGGTCGTGA A 21(2)SEQ ID NO：268的信息：

(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GEP-F14

(xi)序列描述：SEQ ID NO：268：TTGGGATCCC TCGTGTTCCG CCATTCTAAG 30(2)SEQ ID NO：269的信息：

(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GEP-R13

(xi)序列描述：SEQ ID NO：269：TATGGATCCT GGTAAATCAT TGCCCCACCT 30(2)SEQ ID NO：270的信息：

(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物470ep-F8

(xi)序列描述：SEQ ID NO：270：GCTGAATTCG CCATGGCGAC GTGCGCATTC AGGGGTGGA 39(2)SEQ ID NO：271的信息：

(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：引物GEP-R14

(xi)序列描述：SEQ ID NO：271：GGAGGATCCG CGACCCGCCA CCGAAGT 27(2)SEQ ID NO：272的信息：

(i)序列特征：

(A)长度：48个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Y5表位

(xi)序列描述：SEQ ID NO：272：Ile Asp Gly Glu Arg Tyr Thr Leu Pro His Gln Leu Arg Leu Arg Asn1 5 10 15Val Ala Pro Ser Glu Val Ser Ser Glu Val Ser Ile Asp Ile Gly Thr

20 25 30Glu Ala Glu Asn Ser Glu Leu Thr Glu Ala AsP Leu Pro Pro Ala Ala

35 40 45(2)SEQ ID NO：273的信息：

(i)序列特征：

(A)长度：55个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Q9表位

(xi)序列描述：SEQ ID NO：273：Cys Gly Leu Leu Thr Arg His His Thr Ala Leu Asn His Pro Ser Gln1 5 10 15Thr Pro Gln Arg Gly Pro Gly His Gln Asp Leu Leu Gln Gly Pro Ile

20 25 30Gln Arg Val Glu Gln Ala Lys Glu Lys Asp Gln Gly Asn His His His

35 40 45His His Ser Ile Trp Pro Asp

50 55(2)SEQ ID NO：274的信息：

(i)序列特征：

(A)长度：35个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性

(ii)分子类型：蛋白质

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Q11表位

(xi)序列描述：SEQ ID NO：274：Ala Ala Val Ala Glu Pro Tyr Tyr Val Asp Gly Ile Pro Val Ser Trp1 5 10 15Asp Ala Asp Ala Arg Ala Pro Ala Met Val Tyr Gly Pro Gly Gln Ser

20 25 30Val Thr Ile

35(2)SEQ ID NO：275的信息：

(i)序列特征：

(A)长度：225个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Q7-12-1env克隆

(xi)序列描述：SEQ ID NO：275：GTGCCCTTCG TCAACAGGAC AACTCTCTTC ACCATTAGGG GGCCCCTGGG CAACCAGGGC 60CGAGGCAACC CGGTGCGGTC GCCCTTGGGT TTTGGGTCCT ACGCCATGAC CAGGATCCGA 120GATACCCTAC ATCTGGTGGA GTGTCCCACA CCAGCCATCG AGCCTCCCAC CGGGACGTCT 180GGGTTCTTCC CCGGGACGCC GCCTCTCAAC AACTGCATGC ATATG 225(2)SEQ ID NO：276的信息：

(i)序列特征：

(A)长度：192个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Y12-15-1NS3克隆DNA

(xi)序列描述：SEQ ID NO：276：AACATGGGGC ACAAGGTCTT AATCTTGAAC CCCTCAGTGG CCACTGTGCG GGCCATGGGC 60CCGTACATGG AGCGGCTGGC GGGTAAACAT CCAAGTATAT ACTGTGGGCA TGATACAACT 120GCTTTCACAA GGATCACTGA CTCCCCCCTG ACGTATTCAA CCTATGGGAG GTTTTTGGCC 180AACCCTAGGC AA 192(2)SEQ ID NO：277的信息：

(i)序列特征：

(A)长度：264个碱基对

(B)类型：核酸

(C)链型：两种

(D)拓扑学：线性

(ii)分子类型：DNA

(iii)假设：无

(iv)反义：无

(vi)原始来源：

(C)各分离株：Y12-10-2NS3克隆

(xi)序列描述：SEQ ID NO：277：CCCCTCGAGC GGATGCGAAC CGGAAGGCAC CTCGTGTTCT GCCATTCTAA GGCTGAGTGC 60GAGCGCCTTG CTGGCCAGTT CTCCGCTAGG GGGGTCAATG CCATTGCCTA TTATAGGGGT 120AAAGACAGCT CTATCATCAA GGATGGGGAC CTGGTGGTCT GTGCTACAGA CGCGCTTTCC 180ACTGGGTACA CTGGAAATTT CGACTCCGTC ACCGACTGTG GATTAGTGGT GGAGGAGGTC 240GTTGAGGTGA CCCTTGATCC CACC 264

Claims

1.基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)，其中所述HGV的特征如下：(i)可在灵长目动物中传染，(ii)在血清学上与甲肝病毒(HAV)、乙肝病毒(HBV)、丙肝病毒(HCV)、丁肝病毒和戊肝病毒(HEV)不同，(iii)为黄热病毒(Flaviviridae)科病毒中的一种，和(iv)包含具有至少55％的序列与选自SEQ ID NO：14，SEQ ID NO：37和SEQ ID NO：19的多核苷酸同源的多核苷酸，或其互补链。

2.基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽，其中所述HGV：(i)具有权利要求1的HGV病毒的特征，和(ii)其特征进一步在于多肽的氨基酸序列具有至少40％的序列与选自SEQID NO：15的2873个氨基酸序列，SEQ ID NO：38的190个氨基酸序列以及SEQ ID NO：20的67个氨基酸序列的氨基酸序列同源性。

3.权利要求2的多肽，包含一种与至少一种抗HGV抗体特异性发生免疫反应的抗原，它被抗原可特异性地与来自HGV阳性个体的体液或组织样品发生免疫反应而得以证实。

4.通过重组DNA的表达而制备的权利要求2的多肽，包含被SEQID NO：14编码或被SEQ ID NO：14的互补链编码的多肽序列。

5.权利要求2的多肽，为由HGV多肽和第二种多肽组成的重组融合多肽，其中所述第二个多肽选自β-半乳糖苷酶蛋白质，谷胱甘肽-S-转移酶蛋白质和形成颗粒的蛋白质。

6.权利要求2的多肽，包含由HGV基团组，cDNA或它的互补链编码的至少15个连续氨基酸的序列，其中所述氨基酸序列选自(i)SEQ ID NO：15的2873个氨基酸序列或它的片段，(ii)SEQ ID NO：38的190个氨基酸序列或它的片段，(iii)SEQ ID NO：20的67个氨基酸序列或它的片段，和(iv)编码在PNF2161cDNA来源的λgt11文库的氨基酸序列。

7.一种诊断试剂盒，包含

权利要求3的多肽抗原，和

用于检测通过所述抗原与所述样品中的抗体的特异性免疫反应形成的免疫复合物的工具。

8.权利要求7的诊断试剂盒用于筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的体液或组织样品的用途。

9.权利要求7的诊断试剂盒用于筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的血清的用途。

10.一种诊断试剂盒，用于筛选含有非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原的体液或组织样品，包含

基本上分离的特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽抗原发生免疫反应的抗体，和

用于检测所述多肽抗原与所述抗体结合的试剂。

11.检测试验个体中非甲非乙非丙非丁非戊肝炎病毒(HGV)的感染的方法，包括

将来自试验个体的体液或组织样品与权利要求9的试剂盒的基本上分离的HGV特异性抗体反应，和

检验抗体中是否有结合的抗原.

12.特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原发生免疫反应的单克隆抗体。

13.特异性与权利要求3的非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原发生免疫反应的基本上分离的多克隆抗体的制剂。

14.一种筛选含有特异性抗权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的体液或组织样品的方法，包括

将样品与权利要求3的多肽抗原接触，

检测通过所述抗原与所述样品中的抗体发生的特异性免疫反应形成的免疫复合物。

15.一种产生权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的方法，包括

将足够量的基本上分离的权利要求2的HGV多肽施给试验个体以产生免疫应答，该HGV多肽包含含有特异性地与至少一种抗HGV抗体发生免疫反应的表位的抗原。

16.一种镶嵌型多肽，包含

至少两种权利要求3的不同抗原，其中所述镶嵌型多肽缺乏正常间插在天然HGV多肽中的所述抗原之间的氨基酸。

17.一种非甲非乙非丙非丁非戊肝炎病毒(HGV)疫苗组合物，包括

以药理学有效剂量存在于药学上可接受的载体中的权利要求3的基本上分离的HGV多肽。

18.一种基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多核苷酸，其中所述HGV具有权利要求1的HGV病毒的特征。

19.权利要求18的多核苷酸，它具有至少55％序列同源于选自SEQ ID NO：14，SEQ ID NO：37和SEQ ID NO：19的多核苷酸，或其互补链。

20.权利要求18的可用于非甲非乙非丙非丁非戊肝炎病毒(HGV)的PCR检测的多核苷酸。

21.一种检测试验个体中的非甲非乙非丙非丁非戊肝炎病毒(HGV)核酸的方法，包括

从受试个体中获得含有核酸的样品，

在适宜的杂交条件下，将含有核酸的样品和权利要求18的多核苷酸或其片段组成的探针结合，并且

检测通过HGV核酸与所述探针杂交形成的HGV核酸/探针复合物的存在。

22.权利要求21的方法，其中所述检测包括使用HGV核酸特异性探针，其中两个探针确定HGV核酸的内在区域，每个探针具有含有位于该区内的3’末端的一条链，通过引物伸展反应，将核酸/探针杂交复合物转化为含有探针的双链片段，

通过下面连续重复的步骤扩增含有探针的片段的数目，(i)变性双链片段，产生单链片段，(ii)将单链与探针杂交，形成链/探针复合物，(iii)在酶和四种脱氧核糖核苷酸存在下从链/探针复合物产生双链片段，和(iv)重复步骤(i)-(iii)直至达到所需水平的扩增，

鉴定扩增产物。

23.一种分析样品中来自权利要求1的非甲非乙非丙非丁非戊肝炎病毒(HGV)的多核苷酸是否存在的试剂盒，包含

至少一种含有特异性地与权利要求18的HGV多核苷酸杂交的核苷酸序列的多核苷酸探针，以及一种适宜容器。

24.一种能在适宜条件下表达来自非甲非乙非丙非丁非戊肝炎病毒(HGV)基因组的cDNA的可读框(ORF)或其互补链的克隆载体，其中所述病毒具有权利要求1的特征，ORF被可操作地连接至与所需宿主相容的控制序列上。

25.一种产生非甲非乙非丙非丁非戊肝炎病毒(HGV)的多肽的方法，包括

在导致可读框(ORF)表达的条件下，培养用权利要求24的载体转化的细胞。