CN101586106A - Hiv-1亚型间(c/b’)基因组和其用途 - Google Patents

Hiv-1亚型间(c/b’)基因组和其用途 Download PDF

Info

Publication number
CN101586106A
CN101586106A CNA2009101276677A CN200910127667A CN101586106A CN 101586106 A CN101586106 A CN 101586106A CN A2009101276677 A CNA2009101276677 A CN A2009101276677A CN 200910127667 A CN200910127667 A CN 200910127667A CN 101586106 A CN101586106 A CN 101586106A
Authority
CN
China
Prior art keywords
lys
gly
leu
arg
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009101276677A
Other languages
English (en)
Other versions
CN101586106B (zh
Inventor
邵一鸣
罗夫·伟格拿
汉思·渥夫
麻库司·葛拉夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thermo Fisher Scientific Geneart GmbH
Original Assignee
Geneart AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Geneart AG filed Critical Geneart AG
Publication of CN101586106A publication Critical patent/CN101586106A/zh
Application granted granted Critical
Publication of CN101586106B publication Critical patent/CN101586106B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16311Human Immunodeficiency Virus, HIV concerning HIV regulatory proteins
    • C12N2740/16322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • AIDS & HIV (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及HIV-1亚型间(C/B’)基因组和其用途。本发明涉及一种多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或与在SEQ ID NO:1,2或3中所示的核酸序列杂交的多核苷酸。本发明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所编码的多肽。该等多核苷酸和多肽可用为药品,疫苗或诊断用物质,较佳者是用于HIV感染的治疗,预防或诊断。

Description

HIV-1亚型间(C/B’)基因组和其用途
本申请是申请日为2000年11月16日、申请号为00818426.7、发明名称为“HIV-1亚型间(C/B’)基因组和其用途”的发明申请的分案申请。
发明说明
本发明涉及一种多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或与在SEQ ID NO:1,2或3中所示的核酸序列杂交的多核苷酸。本发明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所编码的多肽。该等多核苷酸和多肽可用为药品,疫苗或诊断用物质,较佳者是用于HIV感染的治疗,预防或诊断。
在考虑到至本世纪末全世界经估计有超过四千万受感染的人且其中有超过90%是生活在发展中国家中的人类免疫缺陷性病毒(HumanImmunodeficiency Virus)(HIV)的全球分布程度,HIV疫苗的开发据认为是现代工业化社会的重大挑战之一。不过,到目前为止,成功的HIV疫苗的开发仍然受限于此种病毒的复杂生物学及其与宿主所具免疫系统的复杂相互作用。到目前为止己经在发展中国家中对临床第三期用药中试验过的少数可选用疫苗主要是以第1型HIV之外部糖蛋白gp120或gp160为基础。不过,这些研究的结果十分令人失望,该等疫苗不仅不能诱导出宽广的交叉中和抗体与T细胞反应,而且甚至于不能防止已对某些接种疫苗的个体报导过的突破感染。这种结果的诸项原因之一确定是来自于所使用的衍生自经实验室适应的病毒株的抗原与在试验区例如泰国境内循环的遗传分歧性病毒之间的广泛序列变异。
对在全球流转的HIV病毒株所进行的分类学分析,除了O组病毒以外,己鉴定出在包膜蛋白质中存在着高达24%序列变异的10种不同的序列亚型(A-J)组成的一主要组(M)(Kostrikis et al.,1995;Leitner andAlbert,1995;Gaywee et al.,1996;World Health Organisation Network for HIVlsolation and Characterization,1994);该O组病毒与M组病毒在某些读框上有超过40%的差异(Loussert Ajaka et al.,1995;Myers et al.,1996;Sharpet al.,1995;Shary et al.,1999)。HIV是经由突变与亚型间重组的快速累积而进行演化。在地理区群中共同循环的诸不同亚型代表进化枝间镶嵌性病毒(interclade mosaic virus)的产生与分布的分子基础。虽然已经利用血清学和异型双螺旋体DNA分析对全球HIV-1变异体作过精深的研究,不过因为现有诸亚型和多种重组形式都缺乏经完整测序的基因组,所以大部份分类学研究都是以包膜序列为基础。
非亚型B病毒会引起极多种全球性新的HIV-1感染。其中,进化枝CHIV-1病毒株在有关受感染人的总数以及新感染例特别是在南美和亚洲中的高发生率两者扮有前导性角色。因此之故,进化枝C病毒的鉴定对于诊断、预防和治疗目的而言都是顶级优先者之一。除了泰国之外,有关在整个亚洲流传的HIV-1病毒株的分布与分子特性所能得到的资讯直到最近仍然有限。WHO估计南亚与东南亚具有最快速的HIV传播速率且很快就会变成全世界最大的HIV流行区。中国具有与这些区域非常类似的社会和经济状况与直接的伦理和经济关联。自从1995年早期之后,在中国许多省中即可清楚地看到HIV感染的快速增加。与1985年到1994年所侦检到的HIV和AIDS的累积1774病例相比,在1995年侦检到1421例,而单在1997年就侦检出超过4000病例。WHO估计到1997年底在中国境内会有超过400,000HIV感染例,且单在1997年内,估计有6400个累积的AIDS死亡例和4000个死亡途中者。于最近的全国HIV分子流行病学调查中,可以发现在云南省所存在的亚型原型B与B’-亚型(Graf et al.,1998)已被毒品使用者,污染的血液和tat浆收集服务传播到中国中部与东部。第二种流行病最可能是在1990年代早期由带有亚型C病毒株的印度IDUs输入到该等相同的地区(Luoet al.,1995;Shao et al.,1999)。在数年之内,亚型C病毒经由毒品运输在中国南部、中部及甚至于西北部快速地传播且在中国境内引起广泛传播的流行病。根据最近的全国HIV分子流行病学调查,几乎所有感染亚型C的个体都是IDUs且占有中国HIV感染IDUs的约40%,可以推测出亚型C病毒为在中国境内IDUs中所遍布的诸主要HIV-1亚型中之一(Shao et al,1998;Shao et al.,1994)。
由此点可以推测出在中国境内IDUs之间的HIV流行病于短短数年之间就从单一主要亚型(B)扩展到至少两种主要亚型,B-Thai和C,增加了亚型间重组的可能性。根据我们对于不同病毒株所具可变异性与抗原性的认知,应该对区域性病毒株调整诊断工具,治疗药剂与疫苗。不过,目前对于非-亚型B病毒所用的分子药剂的种类数目仍然极为有限。目前,对于B或C以外的病毒只有少数非重组分子克隆(molecular clone)和一些镶嵌性基因组(mosaic genomes)可以取用。有关进化枝CHIV-1病毒,到目前为止只有公开出非一重组型代表物与4A/C重组体,彼等全部都是源自非洲、南美或印度(Lao et al.1995;Gao et al,1998:Loke et al.1999)。再者,所有先前对于在中国境内的亚型C病毒的数据都局限在env基因的遗传亚型定型(genetic subtyping)(Luo et al.1995;Yu et al.1997;Salminen et al.1995)。
到目前为止己有数个使用疫苗实施针对HIV感染的临床实验。在该等临床实验中所观察到的令人失望的结果包括在接受疫苗的人中不断地报导出有突破防线性的感染。这种结果经归因于所施用的包膜蛋白质与感染性输入病毒之间的重大序列变异,此点于事实上主要是来自于对于在独特地理区域内流传的病毒群所作的鉴定不足所致。此点导致对和在试验场域中的病毒群不相关的病毒的病毒抗原产生体液免疫反应与(较少程度地)细胞介导的免疫反应。再者,已经报导的低亲和结合性,包膜特异性抗体不仅缺乏中和能力,而且甚至于会助成通过补体-或Fc-受体的感染的增强。另外,所选用的抗原和输送系统会转变成为极端微弱的细胞介导的免疫反应的诱导剂。
基于对跨进化枝保护性免疫反应的正确知识的缺乏以及有关在已知有多重HIV-1亚型共同流传的发展中国家境内的复杂情势,疫苗制剂应该包括多种代表性抗原的混合物。因此,有需要分离与鉴定进化枝C病毒,特别是克隆其编码区。
本发明的问题是由权利要求的主题内容予以解决。
本发明涉及:
1、一种多核苷酸,其包括如SEQ ID NO:1,2或3中所示核酸序列,或其片段或衍生物,或一种可与如SEQ ID NO:1,2或3中所示核酸序列杂交的多核苷酸。
2、如项1的多核苷酸或其片段或衍生物,其中该杂交多核苷酸是在严格条件与如SEQ ID NO:1,2或3中所示核酸序列杂交。
3、如项1或2的多核苷酸或其片段或衍生物,其包括至少一个具有至少9个核苷酸,优选至少15个核苷酸,更优选至少27个核苷酸,或更长的连续序列。
4、如项3的多核苷酸或其片段或衍生物,其具有一个以上的连续核苷酸序列,其中至少两个连续序列是由一核苷酸序列间隔段所分隔。
5、如项1到4项中任一项的多核苷酸或其片段或衍生物,其包括至少一个如SEQ ID NO:1,2或3中所示核酸序列所编码的多肽。
6、DNA构建体,其包括如项1到5项中任一项的多核苷酸或其片段或衍生物。
7.细菌或病毒载体,其包括如项1到5项中任一项的多核苷酸或其片段或衍生物。
8.如项1到5项中任一项的多核苷酸或其片段或衍生物,用作药物,疫苗或诊断物质。
9、如项1到5项中任一项的多核苷酸或其片段或衍生物用于制造治疗或预防HIV感染所用的药物或疫苗的用途。
10、一种多肽,其是由如SEO ID NO:1,2或3中所示核酸序列或其片段或衍生物所编码。
11、如项10的多肽,其包括一由如SEQ ID NO:1,2或3中所示核酸序列或其片段或衍生物所编码的含有至少8个氨基酸的连续序列。
12、如项10或11的多肽,其中该氨基酸序列对应于HIV包膜蛋白质或其片段。
13、如项10到12项中任一项的多肽,其还包括在一受感染对象体内天然地诱导免疫反应的抗原决定簇。
14、如项13的多肽,其中该抗原决定簇为一种构象表位或线性表位。
15、如项10到14项中任一项的多肽,用作药物,疫苗或诊断物质。
16、如项10到14项中任一项的多肽用于制造治疗或预防HIV感染所用的药物或疫苗的用途。
17、分离的多肽,其对如项10到14项中任一项所述多肽具有特异性。
18、如项17的分离的多肽,用作药物或诊断物质。
19、如项17的分离的多肽用于制造治疗或预防HIV感染所用的药物的用途。
20、如项17到19项中任一项的分离的多肽,其中该分离的多肽为一种抗体。
本发明用附图进一步阐明。
图1显示来自克隆97cn54的env C2V3编码区与主要HIV-1(M组)亚型的代表的分类学关系的图解说明。Cn-con-c代表在中国境内普遍流行的HIV-1亚型C病毒株的env共有序列(consensus sequence)。分类学树是使用邻域连接法(neighbour joining method)构成的。在结点的值指的是朝右的簇集受到支持的相生百分比(percent bootstrap)。其中只显示出70%和更高的相生率。右边括号表HIV-1M组的主要亚型序列。
图2显示出97cn54完整gagpol编码区的重组鉴定程序分析(theRecombinant Identification Program analysi)(RIP,version 1,1.3)的图解说明(窗尺寸:200,统计意义阈值:90%,Gap处置:STRIP)。gag和pol两开放读框的位置是在图的顶端用箭号指示出。Rip分析是以使用从所选代表最相关性HIV-1亚型的病毒株导出的参比序列进行背景对比(backgroundalignment)为基础的。标准代表物是使用如所示的不同颜色予以标记出。X轴指示出沿着该对比的核苷酸位置。Y轴指示出97cn54与所列出的参比亚型的类似率。
图3显示出在97cn54衍生的gagpol读框内的诸不同区相对于主要HIV-1(M组)亚型的标准代表物的分类关系的图解说明。分类学树是使用邻域连接法以下列序列连续段(stretch)为基础而构成者:(A)核苷酸1-478,(B)479-620,(C)621-1290,(D)1291-1830,(E)1831-2220,(F)2221-2520和(G)2521-2971。所给位置指的是gag开放读框的第一个核苷酸。灰色区突显出用进化枝C-(A,C,E,G)或B-(B,D,F)衍生的参比株分析的序列的簇集。在结点的值指的是朝右的簇集受到支持的相生百分比。其中只显示出70%和更高的相生率。
图4A-D显示出97cn54所含诸不同区的重组鉴定程序分析(RIP,version1.3)的图解说明(窗尺寸:200,统计意义阂值:90%,Gap处置:STRIP)。分析包括(A)一1500bp的序列连续段,从vif基因的起始密码子到env基因的5’端,内含vif,vpr,tat和rev的第一个外显子,vpu以及env基因的前面200bp与(B)从env的3’端有300bp重叠之一段约700bp的片段内含完整的nef基因与3’LTR的部份。vpr,tat,vpu,env,nef的起始密码子以及3’-LTR的5’端等的位置是在图的顶端分别以箭号指示出。Rip分析是以便用从所选代表最相关性HIV-1亚型的病毒株导出的参比序列进行背景对比(background alignment)为基础的。所示标准代表物是使用不同颜色予以标记出。X轴指示比沿着该对比的核苷酸位置。Y轴指示出97cn54与所列出的参比亚型的类似率。(C)和(D)得自中国境内的两种独立进化枝C-分离物(xj24和xj158)的序列的Rip分析,其中vpr与vpu基因重叠包括tat的第一个外显子。
图5显示出一分类学树分析。分类学树是使用邻域连接法以下列序列连续段(stretch)为基础而构成:(A)一380bp片段将vpr基因的3’150bp到vpu读框的末端重叠,(B)net编码区的前面290bp与(C)nef基因的3’320bp。在结点的值指的是朝右的簇集受到支承的相生百分比。其中只显示70%和更高的相生率。右边括号表HIV-1M组的主要亚型序列。
图6为97cn54的镶嵌性基因组组织的示意图。
图7为在已知且经实验证明过的原型B(HIV-1LAI)衍生CTL表位与在进化枝C病毒株97cn54的gag,pol和env多肽中的相应氨基酸序列之间的比较的图解说明。显示出下列功能结构区(functional domain):gag(p17基质,p24衣壳,p15核衣壳和连结蛋白质),POL(PR蛋白酶,RT反转录酶,IN整合酶(integrase))和ENV(gp120外部糖蛋白,gp41透膜蛋白)。在开放读框下方的数值分别指示出相对于多肽氨基端的氨基酸位置。己知HIV-1LAI衍生CTL表位的单倍型(haplotype)限制分别在左和右两边缘指示出。绿色条代表在己知的表位与对应的进化枝C序列之间的相同率,蓝色条指示出2或更少的保守性错配(conservative mismatch)。红色条表相对于相应的LAI衍生表位具有超过2个保守性错配或任何非保守性取代的进化枝C衍生序列连续段。
图8a-p显示出进化枝CHIV-197cn54的完整长度密码核苷酸序列(SEQ ID NO:1)与相应的以一字母码示出的氨基酸。所有三个读框都在此给出。星号表终止密码子。
图9显示出使用各DNA质粒进行肌肉内免疫之后细胞毒性T细胞在小鼠BALB/c脾细胞内的活性结果的图解说明。将在初次免疫3星期之后从每组各5只的小鼠分别取得的淋巴细胞与装载入具有氨基酸序列AMOMLKETI的gag多肽的同基因P815肥大细胞瘤细胞(用20,000rad照射过)共同培养。对照组包括从未免疫处理,用装载肽的P815细胞刺激过的小鼠所取得的脾细胞。在体外培养5天之后收获细胞毒性效应细胞群。在51C释放标准检定中针对用上面所提九肽装载过的A20细胞或针对未装载的A20细胞读取细胞毒性反应。所显示出的数据代表从分别实施三次该做法所得的平均值。所测定的标准偏差分别低于相对于该平均值的15%。
“表位”(epitope)或“抗原决定簇”(antigenic determinant)一词如本文中所用者指的是可为一抗体所特异地辨识的抗原所含免疫学决定基。一表位包括至少3个,较佳者至少5个氨基酸的呈空间或不连续构象的氨基酸。一表位也可以包括一包括着一连续氨基酸序列的单一节段多肽链。
“多核苷酸”一词如本文中所用者是指称具有任何长度,可为核糖核苷酸或脱氧核糖核苷酸的核苷酸单位的单链或双链异元聚合物。该术语也包括经修饰的核苷酸。
“衍生物”一词如本文中所用者指的是一核酸,其亦编码一或多种被另一核酸序列所编码的多肽,虽则该核酸的核酸序列不同于该另一核酸序列。于此种意义中,“衍生物”一词也指称因为遗传密码简并(degeneration)而存在的其他核酸序列的相等物(equivalent)。因此,“衍生物”一词包括例如编码相同多肽的核酸如根据SEQ ID NO:1,2或3的核酸但具有另一核酸序列者。再者,该术语包括编码相同多肽的核酸片段如具有根据SEQ ID NO:1,2或3的核酸序列的核酸片段。
“多肽’一词如本文中所用者是指称具有至少两个氨基酸残基由肽键所连接成的链。所以,该术语包括任何氨基酸链,例如寡肽(oligopeptides)或蛋白质。该术语也指称其中有一或更多个氨基酸是经修饰过,例如乙酰化、糖基化或磷酸化之氨基酸链。
“连续序列”或“片段”一词如本文中所用者是指称一衍生自一参比序列的线型核苷酸或氨基酸连续段,例如在序列表中所列的本发明各序列。
“选择性杂交”或“可选择性杂交”一词如本文中所用者是指称在严格杂交条件(stringent hybridization condition)之下两多核苷酸形成双螺旋核苷酸分子的杂交条件。此等条件为现有技术所知悉者且见于例如,Sambrook et al.,Molecular Cloning,Cold Spring Harbour Laboratory(1989),ISBN 0-87969-309-6之中。严格杂交条件的例子包括:(1)在4xSSC内于65℃之下或(2)在50%甲酰胺于4xSSC中42℃之下,两者都于其后接着进行在0.1xSSC内于65℃之下1小时的洗涤步骤。
“病毒载体”或“细菌载体”一词如本文中所用者指的是经遗传修饰的病毒或细菌,其可用来将SEQ ID NO:1,2或3的DNA序列或其衍生物,片段,或其编码表位或表位串的序列导到不同的细胞,较佳者抗原呈递细胞,例如树突状细胞(dendritic cell)之内。此外,细菌载体可以适当地用来直接表达由SEQ ID NO:1,2或3所编码的多肽或由其衍生的表位或表位串。
本发明的一方面涉及在SEQ ID NO:1,SEQ ID NO:2或SEQ ID NO:3中所示的核苷酸序列。为了收集所需的有关代表性和实质完全长度病毒基因组的资讯,首先对中国境内超过100个HIV-1亚型C血清阳性静脉内毒品使用者(IDUs)进行分子流行病学研究,对于在病毒包膜糖蛋白基因内的固定区2和可变区3(C2V3)进行的基因定型(genotyping)揭露出在整个中国境内最普遍流传的病毒株相对于印度来源的亚型C序列有最高的同源性(homology)。根据此等结果,从选出的经HIV感染IDU的周围血液单核细胞(PBMCs)扩增与亚克隆实质完整长度代表在整个中国境内最普遍流传的进化枝C病毒株的基因组。序列分析鉴定出一镶嵌性构造,其可推断出在该地理区域内普及性进化枝C与(B’)-亚型Thai病毒株的基因组之间有广泛的亚型间重组事件。RIP(重组检定程序)分析与分类学相生推断总共有10个断点:(i)在gagpol编码区内,(ii)在vpr内与在vpu基因的3’端以及(iii)在nef开放读框之内。Thai(B)-序列因而包括(i)在gagpo1编码区内的数个插入(核苷酸478-620,1290-1830,2221-2520,各分别相对于在gag起始密码子与gagpol读框内的第一个核苷酸),(ii)在3’vpr,完整的vpu,tat和rev的第一个外显子(从相对于Vpr读框的起始密码子的核苷酸138起算的约1000个核苷酸)以及(iii)nef基因的5’半部(核苷酸1-300)。在包括9078个核苷酸的序列(SEQ ID NO:1,表3)之内的其余诸部份显示出对已知亚型C分离物的最高同源性。位于97cn54中的vpr/vpu编码区内以及在nef基因内的诸断点经发现也出现于从往在中国境内不同地区的IDUs分离出的许多亚型C病毒株的类似位置上,由此可以推测C/B’重组株有一个共同的始祖。有超过50%在Gap和Pol内的明确亚型B-衍生CTL表位与10%在Env内的已知表位经发现可以与在此进化枝C/B’嵌合型参比株内的多个序列正确地匹配。这些结果可以经由对疫苗设计提供高度相关性模板(templates)与开发出为最恰当的免疫学/病毒学请出资料所用药剂而实质地帮助在中国境内的疫苗相关性努力。
上文所说明的代表最普及的中国C型病毒株的本发明HIV-1序列作为基础与来源的用途有利于预防性与治疗性疫苗的开发。对于成功的HIV候选疫苗的开发所需的结果为(i)对于个别流行病学情势的详细知识与(ii)代表在一地理区域内或独特的人群中最普及病毒株的克隆编码序列的可取得性。此等序列代表着作为下列的基础:(i)在预防上与治疗上可以应用的HIV候选疫苗的合理设计,(ii)特异性治疗医药品的开发,例如治疗有效的诱饵寡核苷酸和蛋白质,反义构建体(antisense constructs),核糖体和反式显性阴性效应突变体(transdominant negative effective mutants),(iii)基因疗法所用慢病毒载体之开发,与(iv)可以用来诊断或监测HIV感染及用于免疫学/病毒学监测疫苗处理过程的药剂的制造。
此点对于以HIV包膜蛋白质为基础的候选疫苗特别正确,该等HIV包膜蛋白质业经证实为在所有HIV蛋白质中最具可变异性者。除此之外,一种成功的疫苗必须诱发免疫系统的最可能两种分支:中和抗体,其理想上是针对包膜蛋白质中的构象表位,以及细胞介导的免疫反应(CD4阳性T-辅助细胞,CD8阳性细胞溶解性T-细胞,Th1型细胞因子,β-趋化因子(chemokines)),其是针对不同病毒蛋白质的表位而产生的。根据本发明的构象表位包括涉及抗体结合作用的至少3个氨基酸且可能为5或更多个氨基酸。构象表位也可以包括数个节段,其可能为单一蛋白质的节段或在低聚物复合物例如三聚物型糖蛋白包膜复合物的情况中为数个具有不同亚单位的节段。根据本发明一线型表位在长度上的变异通常为包括至少8个氨基酸到约15个氨基酸或更长者,较佳者包括9到11个氨基酸,特别是在MHC第I类限制CTL表位的情况中。
因此,本发明更有涉及SEQ ID NO:1,2或3的核酸序列或其片段或衍生物所编码的多肽。本发明更涉及SEQ ID NO:1,2或3的核酸序列或其片段或衍生物所编码的包括至少8个氨基酸的连续序列。较佳者本发明多肽包括一可自然地引起感染患者内免疫反应的抗原决定簇。更佳者为包括SEQ ID NO:2或3的核酸序列或其片段或衍生物所编码的氨基酸序列。最佳者为表位,其包括一相同于SEQ ID NO:1所编码的多肽与一HIV-1LAI参比分析物的具有9到11个氨基酸的连续区,或其为包括在该有9到11个氨基酸的序列内的2或更少个保守性氨基酸取代者。本发明多肽可以用为例如疫苗和治疗性物质或诊断用物质。
本发明的另一方面涉及SEQ ID NO:1,2或3的多核苷酸。本发明更涉及一种具有SEQ ID NO:1,2或3的核苷酸序列的多核苷酸片段或涉及一种包括至少一个能够选择性地杂交到如SEQ ID NO:1,2或3所示核苷酸序列的连续核苷酸序列。再者,本发明也涉及本发明多核苷酸的衍生物或多核苷酸片段。较佳者该多核苷酸或多核苷酸片段包括一有至少9个核苷酸,较佳者至少15个核苷酸,更佳者至少27个核苷酸或更长者的连续序列。该多核苷酸或多核苷酸片段也可以包括单一HIV基因的编码区,例如gag,pol,env。其例子为在SEQ ID NO:2和SEQ ID NO:3中所列出者。本发明的另一方面涉及一种多核苷酸,其包括至少两个本发明多核苷酸片段,其中该等多核苷酸片段可以重叠或可由一核苷酸序列间隔段所分隔。该等多核苷酸片段的序列可相同或相异。本发明多核苷酸或多核苷酸片段可以用为疫苗或治疗性物质或诊断用物质。
克隆的SEQ ID NO:1的进化枝C HIV-197cn54编码序列和其衍生物可以用为下列应用的基础:
供治疗与预防目的所用的进化枝-C特异性HIV-1疫苗之开发。此等进化枝特异性疫苗可以在全世界所有地理区中使用,于该等区域中该进化枝C病毒株在HIV流行病中扮有主要角色,例如在拉丁美洲,非洲以及亚洲境内。更特定言之,要针对东南亚和中国进行试验且开发出的HIV疫苗应该以上文所说明的97cn54编码序列为基础以期诱导出亚型特异性体液与细胞介导的免疫反应。再者,此等进化枝-C特异性HIV-1疫苗可以在考虑所有的或明确选定的全世界性相关HIV亚型之下用作混合疫苗的成分。
要输送到免疫系统的抗原或编码序列包括(i)从表3中所列出的诸开放读框中之一者衍生的有至少3个到约5个氨基酸的连续段或更长的连续段,(ii)具有较佳者9到11个氨基酸的连续段,(iii)以分开的方式或以多肽串形式(表位串)输送的此等连续段的组合,其中该表位串与彼等的氨基酸序列分别地可以重叠或可用氨基酸或其他间隔段予以分隔,且最佳者完整的蛋白质或对应的编码序列或其变异体,彼等也可以包括延伸的删除(deletion)以期在接受疫苗者体内诱导出恰当的体液与细胞介导的免疫反应。因此之故,本发明的另一个目的涉及SEQ ID NO:1,SEQ ID NO:2和SEQ ID NO:3中所示核苷酸序列或其片段所编码的多肽。较佳者,该多肽包括具有至少8个氨基酸,较佳者至少9到11氨基酸,更佳者至少15个氨基酸或更长序列的连续序列,或较佳者,包括单一多肽链的至少3个氨基酸的不连续表位或于低聚物蛋白质的情况中,包括具有不同多肽链的复合物。以91cn54编码序列为基础的疫苗构建体包括现有技术中已知的所有抗原形式且包括所有已知的输送系统。
由SEQ ID NO:1到3的核酸序列的片段所编码且于每一情况中包括3到5个氨基酸,较佳者9到11或更多个氨基酸的短表位可以较佳地以合成方式制成。此等肽包括B细胞表位,第II类MHC限制辅助T细胞表位,第I类MHC限制细胞毒性T细胞表位,或所提变异体的组合。具体表位可以重叠或由一间隔段所分隔,其优先地包括甘氨酸及/或丝氨酸部份。分支型肽可以根据现有技术于合成中产生或在具体肽的合成与纯化之后利用已知且为市面上可取得的同元或异元双官能化学交联剂予以产生。另外,可以将本身为小型的免疫原性肽经由交联反应缀合到所选定的载体蛋白质例如卵白蛋白,经基因工程方式嵌入到载体蛋白质之内或分别融合到彼等的N端和C端。较佳者,此等载体蛋白质都能够形成特别的构造,其中(i)于适当的细胞培养系统内进行表达的过程中(参看下文)或(ii)在经纯化变性的蛋白质的适当回折之后,将B细胞表位较佳地安置在该特别载体的表面上。同时,有倾向于形成特别构造的多肽的许多例子是已知的,例如B型肝炎病毒(HBV)核心抗原(HBcAg),HBV表面抗原(HBsAg),HIV组特异性抗原,多瘤病毒VP1蛋白,乳头状瘤病毒L1蛋白,或酵母IA蛋白。由于大部份到目前为止所提及的粒子形成性蛋白质都是从不同病毒的衣壳或结构蛋白质衍生的,因此彼等也称为似病毒粒子;可参看特别版的Vaccine.(1999),Vol.18,Advances in,Proteln and Nuddc Acid Vaccine Strategies.Edhed by Pof.P.T.P.Kauvama。
由SEQ ID NO:1到3的核酸序列的片段所编码且具有超过30,较佳者超过50个氨基酸的表位串和多肽,及具有形成粒状结构(VLP)的倾向的多肽可以使用现有技术中已知的手段在原核生物体内制造与纯化。该等质粒因而包括细菌复制源例如Co1E1,通用的选择标志例如对康那霉素(kanamycin)或氨苄青霉素(ampicillin)的抗性,组成型活性或可诱导性转录控制单元例如LacZ或Tac启动子,以及转译起始和终止信号。对于经简化的表达和亲和性纯化,可以视情况使用可分离的融合部份与纯化工具例如谷胱甘肽-S-转移酶或低聚组氨酸标签(tag)。
(i)在真核生物细胞培养物例如酵母细胞、真菌、昆虫细胞或哺乳动物细胞内制造该等表位串,完全蛋白质或似病毒粒子结构体,或(ii)为了免疫化目的直接输送DNA,等所使用的DNA或RNA可以依赖病毒本身所利用的密码子用法。另外,在技术上可行的任何情况中可以将该密码子用法调整成适用于在个别制造系统内高度表达的基因内最常或次最常使用的密码子。在为了保险措施经最佳化的多基因内使用的密码子最佳化的例子包括Gag,Pol和Nef等基因以及包膜基因都列于SEQ ID NO:2和3之中。该SEQ ID NO:2和3在实施例15中有更特别的说明。
建立细胞系以在所提细胞培养系统内生产表位串,多肽或似病毒粒子结构体可以使用现有技术的载体(vector)为基础。该等载体同样地可以包括细菌复制源点,阳性或阴性选择标志及主要的外来蛋白质的正常转录和转译所用的具体控制区。后面所说明的DNA疫苗构建体所含成分也代表出现在载体内用以在不同的哺乳动物细胞培养物内表达表位串,多肽或完全蛋白质的模组。
最简单的免疫化形式为纯DNA疫苗的直接应用。该疫苗基本上包括编码区的5’,一转录控制区也称为启动子/增强子(promoter/enhancer)区,视情况后面接着功能插入序列以增强基因表达,(ii)一Kozak共有序列包括一转译起始密码子以及一转译终止密码子后面接着一在该外来基因3’端的聚腺苷酸化信号。较佳者,该启动子/增强子区可以支持所欲基因产物的组成性表达且为衍生自巨细胞病毒立即早期基因(immediate early gene)(CMV-IE)或罗氏肉瘤病毒长末端重复体(RSV-LTV)。另外,可以使可诱导形式的转录控制区例如经由例如应用四环素或类似物来调节转录的Teton/Tet off启动子。再者,有利者为使用细胞类型特异性调节转录控制区例如肌肉肌酸激酶基因(MCK基因;肌肉特异性表达)或CD4受体基因的上游区,或在第II类MHC基因(在抗原呈递细胞中优先表达)配置的启动子/增强子区。于某些情况中,也使用来自(i)细胞类型特异性启动子与(ii)病毒增强子区的嵌合型组合间组织特异性表达与病毒增强子所具强转录活性等多项优点组合在一起。经由整合入通常配置在一开放读框5’端的功能性插入序列所达到的基因表达的增强是因为从经剪接转录本的核所得相对于未经剪接者较增强的输出速率且是经由嵌置在一经配置在β-球蛋白基因之内的插入序列而得到。
以SEQ ID NO:1,2或3为基础的较佳DNA疫苗也另外包括一源自α病毒类例如西门利克森林α病毒(SFV)或委内瑞拉脑炎病毒(VEE)的复制子(replicon)。此处,前面提及的核转录控制区与视情况考虑到的插入序列后面先接着该VEE或SFV非结构蛋白质(NS)的编码区。只有其3’端才接着实际的外来基因,该外来基因的细胞质内转录是由NS敏感性启动子所调节。相应地,产生一从核转录控制单元起始的跨过数个开放读框的长转录本,其接着转位到细胞质内。于此处合成的NS蛋白质随即经由结合到相应的控制区而活化该等外来基因的细胞质内转录。此种扩增处理通常会导致丰富的RNA合成且因而导致该外来蛋白质的高合成速率。与放弃上述细胞质内RNA扩增的效应的传统质粒直接相比,于至少可相比拟的免疫原性之下,后者通常可以促成要施用的质粒用量的明显减少。
前述肽、蛋白质、似病毒粒子和DNA构建体可以经由肌肉内、皮下、皮内、静脉内注射来施用,其中可以使用个别的先前技术来施用蛋白质抗原。对于DNA免疫,可以使用带有注射针头的传统注射针筒,或者使用没有注射针头者而通常为利用空气压力将DNA直接导到合意的组织之内。此举也特别包括利用喷雾工具将含有DNA的疫苗调配物经鼻内和经口施用者。另外,也可以将DNA拼合到固体支持物例如金珠粒上且通过空气压力施用到组织之内。
为了增强或调制免疫反应,可以将前述蛋白质抗原和DNA构建体与通常为免疫反应刺激剂的所谓佐剂组合施用或按顺序施用。传统佐剂例如氢氧化铝或羟基磷酸铝,可以导致体液免疫反应的刺激显示出IgGl亚型的高抗体滴定度。更现代的佐剂例如CpG寡核苷酸(共有核心序列:嘌呤-嘌呤-CpG-嘧啶-嘧啶)或其经化学修饰的衍生物(硫代磷酸寡核苷酸,具有肽主链的寡核苷酸)通常可增强细胞靶的免疫反应且主要支援Th1型的细胞介导的免疫性,其具有下列特征:高IgG2a亚型的抗体滴度及诱导Th1细胞因子例如γ-IFN,IL-2和IL-12。
前述肽、蛋白质、似病毒粒子和DNA构建体的施用和摄取可以经由结合到较高分子结构物上或掺加到较高分子结构物之内而获得特别地改良,该较高分子结构物的例子为生物可降解性粒子,多层状物(multilamellar),较佳者阳离子性微脂粒,免疫刺激性复合物(ISCOMS),病毒脂蛋白体(virosomes)或在体外(invitro)组装的病毒粒子。该等生物可降解性粒子有例如PLA-(L-乳酸),PGA-(聚乙醇酸)或PLGA-「聚(D,L-乳交酯-共聚-乙交酯)」微球体或其衍生物,阳离子性微粒子或衍生自细菌多糖荚膜的载体物质。集合名词ISCOMS是指称从石硷树(Quillajasaponaria)的树皮所得水溶性萃取物衍生出且经层析法醇化过的免疫刺激性复合物。有关各种佐剂与给药手段的先前技术详细摘要见于
http://www.niaid.gov/aidsvaccine/pdf/compendium/pdf[Vogel,F.R.,Powell, M.F.and Alving,C.R.,A Compendium of Vaccine Adjuvants and Excipients(2ndEdition)]。
再者,也可以使用病毒载体或细菌载体来适当地呈递表位串,多肽和似病毒粒子。
根据现有技术状态,例如经遗传修饰的沙门氏菌与李斯特氏菌(listeriae),因为彼等所具有的天然细胞向性(cell tropism)可以将DNA疫苗构建体导到抗原呈递细胞例如单核细胞,巨噬细胞和主要的树突状细胞之内而为可较佳地使用者。除了细胞类型特异性的效益之外,遗传修饰可以达成下述事实,亦即DNA可以无损坏地进入抗原呈递细胞的细胞质之内。于此种情况的中,DNA疫苗构建体可进入细胞核内而于该处读框可通过真核生物型、较佳者病毒型或细胞型特异性启动子使用细胞资源和蛋白质进行转录。在RNA输送到细胞质之内后即转译出相应的基因产物,且根据个别状况进行转译后的修饰并分配到相应的细胞区室之内。
也可以使用细菌载体(沙门氏菌、李斯特氏菌、耶尔森氏菌(yersiniae)等)来诱导出粘膜免疫性,较佳者是在口服之后。藉此经由细菌的转录和转译机制产生相应的抗原,因而不会发生通常存在于喃乳动物细胞内的转译后修饰(没有相应的糖基化;没有分泌途径)。
此外,到目前为止已经有众多经减毒的病毒载体,彼等可以成功地以高产率地帮助合意抗原的表达。此等病毒载体除了彼等所具有的唯一抗原产生能力之外,可以直接用于免疫化。该产生可先在体外(ex vivo)进行例如用于在给疫苗接受者服用之后将抗原呈递细胞感染的情况,或者直接在体内(invivo)使用重组病毒经由皮下、透皮、皮内、肌肉内或鼻内免疫化导致随着个别免疫化成功的有益抗原呈现。如此,可以经由使用重组疫苗病毒例如经由通过鸡细胞予以减毒的修饰安卡拉牛痘病毒(Modified VacciniaAncararirus)(MVA),经遗传减毒的纽约型牛痘(NYVAC)或鸟类地方性禽痘病毒类(禽痘病毒(Fow1pox),金丝雀痘病毒(Canarypox))。另外,有数种其他病毒也经鉴定过例如重组α病毒类例如西门利克森林α病毒或委内瑞拉脑炎病毒,重组腺病毒类,重组单纯庖疹病毒类,流感病毒类等。
最后,若根据先前技术经由克隆方法补充侧接在密码部份的调节性序列(LTR,长末端重复体)时,也可以根据SEQ ID NO:1,2或3产生经减毒的HIV病毒且用于免疫目的。随后也可以根据先前技术在例如nef基因中施以一或多个删除而得到充分的减毒。在SEQ ID NO:1和3中所显示出的核酸序列以及从其所衍生的肽、蛋白质和似病毒粒子也可以用为基因转移所用病毒载体所含的成分。
由GagPol基因(SEQ ID NO:1,核甘酸177一4458;表3)所编码的多肽可以对例如短病毒或反转录病毒提供例如包装和受体功能。也可以产生病毒粒子,其可以往例如使用可同时支援GagPol和VSV-G(水庖性口炎病毒包膜蛋白)基因的表达且确保治疗性转殖基因(transgene)的包装的适当质粒载体将哺乳动物细胞短暂转染之后,用来转导休眠期有丝分裂后的细胞或经最后分化的细胞。该用来产生专导胜任性病毒粒子所用的方法可以通过例如根据例如人类胚胎肾细胞(HEK293)建立可以组成,性地(constitutively)或在诱导性启动子的控制下表达GagPol多蛋白的稳定细胞是获得明显地帮助且可有效率地成形。另外,可以产生重组型腺病毒,其包括包装功,受体功能和转殖基因功能或彼等的组合且因而可作为一工具用来进行反转录病毒载体或短病毒载体的活体外,原位(in situ)和活体内输送。
由SEQ ID NO:3所编码的背末蛋白质或其衍生物可以经由掺加到脂质双层而提供受体功能给短病毒载体,泡沫病毒(spumavirus)载体或反转录病毒载体或以包被病毒(coated virus)为基础的其他载体。对于此种目的而言,可以产生例如包装细胞系,其可以组成性地,或在诱导性,或取代地,可调节性启动子的控制,表达来自反转录病毒,泡沫病毒和较佳者短病毒GagPol蛋白以及衍生处SEQ ID NO:3的包膜蛋白质。另外,可以产生以C型或D型反转录病毒或其他膜被覆病毒例如流感病毒或庖疹病毒的基因组为基础的嵌合型病毒,其在表面上载有针对天热发生的包膜蛋白质,加添地或取而代之地,一衍生自SEQ ID NO:1或3的包膜蛋白质。
针对SEQ ID NO:1至3衍生的肽、蛋白质或似病毒粒子,可以产生(i)多株抗体血清,(ii)单株抗体(鼠类,人类,骆驼),(iii)抗体行衍生物价例如单链抗体,人类化抗体,双-特异性抗体,抗体噬菌体库或(iv)其他高亲和性结合性多肽例如hPSTI(人类胰分泌胰蛋白醣抑制剂)。该等药剂可以用于治疗目的例如治疗HIV感染,或用于诊断目的例如用于检验套剂的制造。
类似地,SEQ ID NO:1,2或3衍生的类似肽、蛋白质或核酸序列可以应用核酸杂交技术,采用核酸扩增系统或彼等的组合用于诊断目的例如用于血清诊断。较佳者,根据本发明,依照SEQ ID NO:1核甘酸序列的多核苷酸片段可以用于聚合酶链型反应之中。特别较佳者为根据本发明,依照SEQID NO:1核甘酸序列的多核苷酸片段经由利用DNA晶片技术作为诊断剂的用途。
本发明要用下列实施例予以示范说明但非予以限制。
实施例
实施例1.血液样品。本研究中所使用的所有血液样品都是在1996-1997年期间于中国境内数个HIV流行地区进行全国分子流行病学调查中从HIV-1亚型C血清阳性的注射药物使用者(IDUs)收集到者。以发克梯度(ficoll gradient)分离出周围血液单核细胞(PBMC)。经由将得自血清阳性IDUs的PBMCs与经用植物血球凝集素(phytohemagglutinin)(PHA)刺激过的捐血者的PBMCs共同培养以分离出病毒。使用HIV-1p24Core ProfileELISA套剂(DuPont Inc.,Boston,MA)从细胞上澄液侦检出阳性病毒培养物。
实施例2.聚合醣链型反应和DNA定序。从超过100个来自中国西北省份预先选定的HIV-1阳性IDUs经有成果地感染过的PBMCs萃取出前病毒DNA(provirus DNA)(Qiagen Inc.,Valencia,CA)。使用套试PCR(nesiedPCR)来扩增包膜C2V3编码区。使用萤光染料-标记终止序列(terminators)(Applied Biosystems,373A-Fosier Ciiy,CA)按先前技术所述(Bai et al.1997;Yu et al.,1997)以Taq-循环定序法(Taq-cycle sequencing)将PCR产物直接定序。经由应用威斯康辛套装软体Genetics Computer Group加上Kimura的校正法(GCG,1997,第9版)进行多重序列排比。
实施例3.使用PHYLIP套装软体进行所有所得序列的分类学树分析。以最大节省法(maximum parsimony method)计算进化距离并用累积水平分校长度予以指示出。按先前技术所述(Graf et al.1998)以相生重取样方式(bootstrap resampling)试验邻域连接法的统计稳健性。
实施例4.从中国IDUs选择出代表性C-进化枝HIV-1分离物。经计算出的在C2V3编码区内的平均组内距离于DNA层次上低到2.26±1,43,显示比在此地区内的流行病仍然非常的早期。在中国进化枝C序列与来自印度,非洲和南美洲来源的序列之间的组间差异分别为9.67±2.31(印度),15.02±4.13非洲与8.78±3.41(南美)。此种结果证实在印度与中国进化枝C序列之间有密切的关系(Lole et al,1999)且对本身相当异源性的非洲进化枝CHIV-1病毒株有一实质的遗传距离。
实施例5.最代表在整个中国境内流传的遍性进化枝C病毒株的病毒分离物的检定。从分析周的检体看来,经称为97cn54的代表性分离物经鉴定为相对于一经计算出之共有序列(cn-conV3)展现出最高同源性(99.6%),此点是经由以经鉴定过的局部HIV序列为基础而确定者(表1)。包括从不同流行病区选巴的原C-进化枝代表物V3-环圈序列以及其他进化枝(A-,O,CPZ)之共有序列等在内的多重氨基酸序列排比强调出带有所选原分离物97cn54的亚型C特质的(表1)。与整个V3共有序列(共有)比较之下,97cn54以及cn-con-c显示出在位置13(H→R)和19(A→T)处有氨基酸变更,两者都是亚型分离物的特性(C_共有)。
表1:V3-环圈氨基酸序列排比位置
位置        1            11         21          31   38
共有        CTRPNNNTRK   SIHIGPGQAF YA---TGDII  GDIRQAHC
C_94IN11246 ----------   --r-----t- ----e-v     -n------
C_93IN905   ----------   --r-----t- ------m     --------
C_93IN999   -vr------e   --r-----t- ----e--     --------
C_consensus ----------   --r-----t- --...-----  --------
C_ind8      ----------   -tr-----t- --...-----  --------
97cn54-v3   ----g------  --r-----t- --...-----  --------
cn-con-v3   ----g-----   --r-----t- --...-----  --------
C_bro025  ---------- --r---------...--e-- --------
C_ind1024 ---------- --r-----t---...-----  ----r-y-
C_nof     ---------- r-rv----tv--...-na--  --------
C_zam20   -a--g----- --r-----t-f-...--a--  --------
C_sm145   ---ya----- -vr-----t--....-n---  --------
A_consensus  ---------- -vr------- --...----- --------
B_consensus  ---------- -------r-- -t...--e-- --------
D_consensus  ----y----q rt-------l -....-tr-- --------
E_consensus  ----s----t --t-----v- -r...----- ----k-y-
F_consensus  ---------- ---l------ --...----- ----k---
G_consensus  ---------- --t------- --...----- --------
H_consensus  ---------- --s------- --...----- ----k-y-
O_consensus  -e--gidiqe  .-r---.m-w-smglg-tng nss-a-y-
表1:得自不同HIV-1进化枝(A-0)之共有序列与所选来自不同国家的亚型C分离物的V3氨基酸排比。完整V3共有序列是经由将得自不同进化枝(A-O)之共有序列排比而构成者。Cn-con-V3代表在中国境内普及的HIV-1亚型C病毒株之共有序列。97cn54是经选择为在中国境内流传的最遍性进化枝CHIV-1病毒株的标准代表性分离物。“-”表相对于V3-共有序列没有改变,小写字母表氨基酸取代且“-”表间隙。多重排比所用的所有共有序列和分离物序列都得自Los Akamos数据库。
实施例6.97cn54包膜蛋白编码序列对于印度进化枝C病毒株有最密切的关联。以包膜蛋白的C2V3序列为起始基础的分类学树分析揭露出97cn54以及中国进化枝C分离物两者对群集到来自印度(ind8,d1024,c-95in025,c--93in999,c-93in11246),非洲(c-eth2220,c-ug286a2)和南美(92br025,nof,cam20,和sm145)的亚型C病毒株。此结果可推测印度C-进化枝病毒株可能为在中国境内流行的HIV-1亚型C的来源(第1图)。此种假说也与我们早期的流行病学参考文献相符合,其中确定在云南省内的HIV-1亚型C感染个体与在边界地区的印度珠宝生意人共用针头(Shao et al,1999)。
实施例7.几乎完整长度HIV-1基因组的克隆。几乎完整长度HIV-1基因组是按先前技术所述(Grafet al.1998;Salminen et al.,1995)经由使用the Expand Long Template PCR系统予以扩增(Boehringer-Mannheim,Mannheim,Germany)。引子(primers)是位于HIV-1长端重复体(LTR)内的保守区中:TBS-A1(5’一ATC TCT AGC AGT GGC GGC GGA A)和NP-6(5’-GCA CTC AAG GCA AGC TTT ATT G)。将经纯化的PCR-片段钝端连接到一经SrfI消化过的pCR-Script载体中(Stratagene,Heidelberg,Germany)并转形到大肠杆菌(E.coli)菌株DH5α之内。经由限制片段长度多形性(RFLP)分析及将V3-环圈编码序列定序分析而鉴定出数个含有几乎完整长度HIV-1基因组的重组殖株。根据RFLP分析,于使用不同的限制核酸内切酶的组合,接着将V3-环圈编码序列定序分析,得知有77%阳性完整长度构建体接近于相同。按照上述所述使用引子-走引法(primer-walking approach)对代表广多种阳性殖株的前病毒构建体进行选择与定序(引子是沿着两股基因组上每约300bp而设计)。
实施例8.使用Lasergene Software(DNASTAR,Inc.,Madison,WI)在Macintosh电脑上汇编DNA序列。所有在此研究中使用的参比亚型序列都得自Los Akamos HIV数据库。核苷酸序列类似率是经由Smiih和Waterman的局部同源性算法予以计算出。与可取得的其他亚型序列数据的多重序列排恍是使用威斯康辛套装软体Genetics Computer Group(GCG,1997,第9版)进行。
实施例9.97cn54编码序列的整体结构。衍生自分离物97cn54的9078bp基因组序列含有HIV-1基因组的所有已知的结构基因和调节基因。没有发现有重大的删除、嵌入或重排。经由将97cn54的所有编码序列(CDS)与不同基因型之共有序列和所选亚型分离物(表刀相比较而探讨出核苷酸序列类似率。gag、pol、env和vif请码相对于对应的进化枝-C共有序列的簸高同源性都在93.93%-95.06%的范围内。此种观察结果显着地扩展上述以C2V3为基础的序列比较与分类学树分析(参看表1和图1)且因而清楚地确定所选择巴的病毒分离物对于先前公开的C-进化枝病毒株的归属。不过,由此类分析对对tat、vpu、vpr和nef等基因所测定出的同源性仍不足以促成此等读框对于进化枝-B或C病毒株的清楚指定(表2)。对于vpu基因而言,相对于进化枝-B有最高同源性(94.24%),比较之下对于进化枝-C共有序列只有78.23%。对于tat基因也得到类似的观察结果,对B’-r142分离物有最高同源性(>91%),而对所选巴的元C-进化枝代表物为85.5%(C-eth2220)或对进化枝-C共有序列有89.01%。这些数据加上B、C和E基因型在整个云南省流行病地区内的巴现事实可以推测出所分析的病毒可能代表从B’/C进化枝间重组事件所得的镶嵌型病毒株。
表2.97cn54衍生的编码序列与参比病毒株的相应基因和进化枝特异性共有序列的比较
对97cn54的相同百分率
Figure A20091012766700221
表2:在97cn54与下列诸DNA序列之间的所有编码序列(CDS)的核苷酸比较:(1)诸独特HIV-1进化枝之共有序列(得自Las Alamos HIV数聚库)或(2)标准亚型C(92br025和eth2220)和B(mn和r142)分离物。该数据呈现出所给序列对97cn54的相同百分率。在诸共有序列内的不明确核苷酸位置经计为一匹配。其中将最高同源性以黑体突显出。/,表示无法从LasA lamos HIV数聚库取得共有序列。
实施例10.亚型间重组的测定。使用重组体鉴定程序(RIP,第3.1版;hiip://hiv-web.1an1.gov/tools)来鉴定在此殖株的至长度序列内所含的潜在镶嵌型结构(窗尺寸:200,统计意义阈值:90%,Gap处置:STRIP;Informativemode:OFF)。导入间隙以造成对齐。于此分析中的背景亚型序列为:u455(亚型A),RL42(中国亚型B-Thai(B)),eth2220(亚型C),z2d2(亚型D),93th2(亚型A/E)。
实施例11.在97cn54的Gag-pol编码区内的进化枝间重组。虽然在高度保守的gag和pol读框内观察到对C-进化枝病毒株的实质同质性,不过RIP分析鉴定出在gagpol内在gag起始密码子上游约在位置478-620,1290-1830和2221-2520处有引固进化枝间重组区。这些分散开的连续段是位于显示出对原型B有最高同贾率且特别是对源自云南省的亚型B(B’)分离物有最高同源性的gag和pol读框之内(位显示出数据)(图2)。这种观察结果清楚地强调RIP分析的重要性,是因为单纯的以完全基因为基础的同质性排比部能够鉴定出这些不同亚型的小分散开的片段之故。为了肯定RIP分析所得数据,我们使用侧接或跨展所提重组连续段的诸区造出数个分类学树(图3)。使用数种不同亚型的标准代表物与某些经选出的C-进化枝原分离物,可以经由97cn54与个别C-进化枝参比分离物(图3A,3C,3E,3G)或B-进化枝参比分离物(图3F,3D,3F)进行差式簇集(differentialclustering),可以确定出所有经提出的重组区。
实施例12.于97cn54的Env编码区内的进化枝间重组。如从表2中所摘列出的是列排比所预期者,RIP分析清楚地确定出在亚型(B’)-Thai与亚型C之间有亚型间重组(图4)。一段从vpr的3’150bp延伸经过tat和rev的第一个外显子到vpu的约1000bp的片段显示出与局部亚型(B’)代表物(r142)有最高同源性(图4A)。再者,一段重叠在nef基因5’-半部的长约300bp的序列连续段显示出对(B’)-Thai亚型有最高同源性而其余部份,包括延伸到3’-LTR之一300bp片段则与亚型C簇集(图4B)。
将RIP分析予以扩大之下,分类学树显示出vpr/vpu和ne基因的5’-部份对进化枝-b分离物有最密切的关系(图5A,图5b),而3’-nef片段则明确地与亚型C代表物簇集(图5C)。进一部分析确定出在此镶嵌段内的亚型B序列相对于非常最近时所述的分离自中国IDU的Thai-(B’)病毒株(r142)(Graf et al,1998)比相对于原型B分离物(mn和sf2)有更密切的关联(表2)。
实施例13.97cn54的代表性特质。在vpr/vpu编码区内以及在97cn54的nef基因内的断点经发现出现于从生活在中国西北诸省境内的IDUs所分离出的所有亚型C病毒株上的几乎相同位置上。对于8份独立地从Xinjiang自治区境内的不同HIV-1感染个体所分离出且分析过的HIV-1病毒株所做的两份RIP分析代表值经显示于图4C和D之中。有关97cn54(中国西南部)与xj24和xj25(中国西北地区))的来源,这些数据可以推测出对于流传在整个中国境内的C/B’重组病毒株有一个共同的始祖。总而言之,我们的结果证实97cn54表一在中国西北省份境内的IDUs最为普及的具有10个进化枝间重阻断点的C/(B’)进化枝间镶嵌型病毒。图6为分离物97cn54的(B’/C)择嵌型基因组的示意性呈现。
实施例14.对HIV特异性细胞溶解性T细胞的跨-进化枝特异性表位的预测。基因组序列可提供机会来评估可能对HIV-1候选疫苗的效率有影响的以的CTL表位的保守性。对于CTL表位的大部份药剂与数据都是导自进化枝B HIV-1Lai序列。为了提出对于跨进化枝CTL-表位保守性的评估,将经预测过的97cn54蛋白质序列相对于已知且经制造过与图的LAI特异性CTL表位进行比较。于194个报导过的HIV-1CTL表位中75,55,40和24是分别位于Gagp(g17,p24,p15),反转录酶(RT),gp120和gp41之中,而在Gag和RT中有几乎50%或更多的表位是完全相同者,而gp120和gp41HIV-1LAI衍生的CTL表位只的5%和17%与预测的97cn54氨基酸序列正确匹配。不过,在所给CTL表位中允许有多达2个保守性错配之下,则会有增加的48%(p17),33%(p24),40%(RT),57%(gp120)和33%(g41)部份之以之HIV-1LAI CTL缺的决定部位与对应的97cn54衍生多肽中的序列相关联。当然,后面所述的考虑必须加以某些地小心,因为会有甚至于非保守性改变可能废止一抗原性肽的HLA-结合或T-细胞受体辨识之故。无论如何,总而言之,此等观察结果清楚地预测出一显著的跨-进化枝CTL反应性,尤其是有关功能上与免疫学上保守的HIV-1蛋白质。此外,这些数据可推测,有显著部份的经合成且确立用来对进化枝B CTL表位进行与图绘制与示性的药剂(肽、疫苗病毒构建体)也可以用来以进化枝C HIV序列为基础而测定CTL反应性。
表3.97cn54编码序列的读框(reading frame)
  编阅架构   起始   终止   起始   终止
  gag   177   1654
  pol   1447   4458
  env   5589   8168
  vif   4403   4984
  vpr   4924   5214
  vpu   5426   5671
  tat   5195   5409   7730   7821
  rev   5334   5409   7730   7821
  nef   8170   8790
其编码是参照SEQ ID NO:1中所示DNA序列的5’端。
实施例15.(A)合成C54gp160编码区:C-gp160的描述。将C-gp120基因克隆到pCR-Sctipt cmp(+)克隆载体(Stratagene,GenbankAccession:U46017)的独特KpnI/SacI限制部位内。经密码子-最佳化以高表达哺乳动物基因的合成C54gp160编码区是列于SEQ ID NO:3之中者。合成信号序列包括一传输信号用以将所编码的多肽输入到内质网之内。
不同编码区的位置为如下所列者:
  CDS   起始   终止
  合成领导序列   28   87
  Gp160   88   2580
(B)合成C54gagpolnef序列:C-gpnef的描述。将C-gpnef基因克隆到pCR-Scriptamp(+)克隆载体(Stratagene)的独特KpnI/SacI限制部全内。经密码子优化以高表达哺乳动物基因的合成C54nagpolnef序列是列SEQ ID NO:2之中者。于本构建体之中,N端甘氨酸是经为丙氨酸(核苷酸序列GGC)以防止将多肽目标导引到细胞质膜及随后的将经装配好的似病毒粒子的通过出芽(budding)而分泌出。同时,将一(-1)移码(frame shift)导到天然移码序列之内以保证从Gag强制读经核醣体进入Pol编阅架构之内,且因而保证GagPolNef多蛋白的合成。
不同编码区的位置为如下所列者:
  CDS   起始   终止
  Gpg   13   1500
  5’pol(ΔRT)   1501   2460
  凑合(scrambled)nef   2461   3090
  3’pol(ΔIN)   3091   4155
  RT活性部位   4156   4266
实施例16.将SEQ ID NO:1所编码的GagPolNef多基因通过KpnI/XhoI部位嵌入到载体pcDNA3.1之中并转形到大肠杆菌菌株XL1blue之内。GagPolNef表达载体诱导Gag特异性抗体反应的是在雌性BALB/c小鼠体内分析(图9)。使两组各5只的小鼠接受每免疫化处理各100微克DNA的肌肉内(i.m.)第一次免疫化接着在3和6星期之后追加两次后续i.m.免疫化处理(第1组:pcDNA-GagPolNef;第2组:pcDNA)。对照组(第3组)只接受PBS免疫化处理。Gag特异性IgG的剖滴定度是以ELISA相对于经纯化的Gag蛋白质而测定。使用pcDNA-GagPolNef的免疫化处理导致快速诱导出高滴定度的Gag特异性抗体(1∶4,000),该抗体是由抗体亚型的典型Th1走势(IgG2a>>IgG1)予以示性。第2和第3两对照组都没有产生Gag特异性抗体的迹象。在第一次追加免疫化处理的1星期之后抗体滴定度增加到几乎百倍(1∶20,000)且在第二次加强的1星期之后导致1∶80,000的Gag特异性终端滴定度。于该两对照组中都没有可证实出有明显的Gag特异性抗体反应者。
实施例17.抗原特异性细胞介素分泌是用分别在第二次后续追加处理5解剖下脾细胞予以分析,其证据为T辅助细胞记忆反应的诱导。接受三次使用pcDNA-GagPolNef的肌肉内免疫化处理的彼等小鼠以明显的γIFN分泌表现出对Gag特异性抗原刺激的反应(表3)。在从根据上述相同时间表用pcDNA-GagPolNef进行三次皮下(s.c.)或皮内(i.d.)免疫化处理后的小鼠解剖下来的脾细胞观察到比较上有所减低的γIFN产生。于所有免疫化处理组中,从免疫化途径没有独立地测定出从经活体外特异性刺激过的脾细胞发生的明显IL4和IL5分泌。也没有观察到从未经刺激的脾细胞发生的细胞介素分泌。
根据此项结果,使用pcDNA-GagPolNef进行肌肉内疫化处理可诱导出强烈的Th1细胞因子走势,而皮下施用则诱导出更微弱的Th1反应。
表4.在使用所提的DNA利用粒子枪进行免疫化处理(使用注射针注射)或皮内或皮下免疫处理之后来自经活体外刺激的小鼠脾细胞的细胞介素走势。
  DNA疫苗   IL-4(微微克/毫升)   IL-5(微微克/毫升)   IFN-γ(微微克/毫升)
  PcDNA-GagPolNef(肌肉内)   <8   <16   3220±840
  pcDNA-GagPolNef(肌肉内)   <8   <16   80±32
  pcDNA-GagPolNef(肌肉内)   <8   <16   <32
每实验从5只小鼠解剖下的脾细胞所得平均值±标准偏差
实施例18.为了证实pcDNA-GagPolNef对于Gag对特异性CTLs的诱导能力,乃在第一次免疫化处理的3星期后用pcDNA-GagPolNEF(第一组),pcDNA(第2组)和PBS(第3组)在混合淋巴细胞肿瘤细胞培养物中进行活体外划地再刺激6天且于随后探讨彼等的细胞毒性活性。已知者,衍生自亚型B病毒(IIIB分离物)Gag蛋白质的毫微米AMQMLKETI肽(单字母代码)为在BALB/c小鼠体内的Dd限制CTL表位。使用该肽于实验中以再刺激活体外特异性细胞毒性活性以及测定该活性。在使用pcDNA-GagPolNef质粒单次肌肉内注之后可以测定出Gag特异性细胞毒性T细胞但在对照组2和3中则没有测定到。使用该质粒处理脾细胞时不会导致Gag特异性细胞毒性T细胞的活体外引动(in vitro priming)。这些结果可确定(i)pcDNA-GagPolNef诱发特异性细胞毒性T细胞的能力,及(ii)该能力为跨亚型活性者(图9)。
参考文献
Bai,X.,Su,L.,Zhang,Y,and et al(1997).Subtype and sequence analysis ofthe CZV3 region of gp 120gene among HIV-1strains in Xinjiang.Chin.JVirology 13.
Carr,J.K.,Salminen,M.O.,Koch,C.,Gotte,D.,Artenstein,A.W,Hegerich,P.A.,St Louis,D.,Burke,D.S.,and McCutchan,F.E.(1996).Full-length sequence and mosaic structure of a human immunodeficiency Virustype Iisolate from Thailand.J Virol.70,5935-5943.
Carr,J.K.,Salminen,M.O.,Albert,J.,Sanders Buell,E.,Gotte,D.,Birx,D.L.,and McCutchan,F.E.(1998).Full genome sequences of humanimmunodeficiency Virus type I subtypes G and A/G intersubtype recombinants.Virology 247,22-31.
Esparza,J.,Osmanov,S.,and Heyward,W L.(1995).HIV preventive.Progress to date.Drugs 50,792-804.
Expert group of joint United Nations programme on HIV/AIDS(1999).Implications of HIV variability for transmission scientific and policy issues.AIDS 11,UNAIDS I-UNAIDS 15.
Gao,F.,Robertson,D.L.,Morrison,S.G.,Hui,H.,Craig,S.,Decker,J.,Fultz,P N.,Girard,M.,Shaw,G.M.,Hahi],B.H.,and Sharp,P M.(1996),Theheterosexual human immunodeficiency viru type 1epidemic in Thailand iscaused by an intersubtype(A/E)recombinant of African origin.J.VlrOI.70.7013-7029.
Gao,F.,Robertson,D.L.,Carruthers,C.D.,Morrison,S.G.,Jian,B.,Chen,Y,Barre Sinoussi,F.,Girard,M.,Srinivasan,A.,Abimiku,A.G.,Shaw,G.M.,Sharp,P M.,and Hahii,B.H.(1998).A comprehensive panel of near-full-lengthclones and reference sequences for non-subtype B isolates of humanimmunodeficiency virus type I.j Virol.72,5680-5698.
Gaywee,J.,ArtenStein,A.W,VanCott,T.C.,Trichavaroj,R.,Sukchamnong,A.,Amlee,P,de Souza,M.,McCutchan,F.E.,Carr,J.K.,Markowitz,L.E.,Michael,R.,and Nittayaphan,S.(1996).Correlation of genetic and serologicapproaches to HIV-1subtyping in Thailand.J Acquir lmmune.
Graf,M.,Shao,Y,Zhao,Q.,Seidl,T.,Kostler,J.,Wolf,H.,and Wagner,R.(1998).Cloning and characterization of a virtually full-length HIV type 1genome from a subtybe B′-Thai strain representing the most prevalent B-cladeisolate in China.AIDS Res.Hum.Retroviruses I4,285-288.
Graham,B.S.and Wright,P.F.(1995).Candidate AIDS vaccines.N Engl.JMed.333,1331-1339.
Kostrikis,L.G.,Bagdades,E.,Cao,Y,Zhang,L.,Dimitriou,D.,and Ho,D.D.(1995).Genetic analysis of human immunodeficiency virus type 1strains frompatients in Cyprus:identification of a new subtype designated subtype i.J Virol.69,6122-6130.
Leitner,T.and Albert,J.(1995).Human Retroviruses and AIDS 199i..acompilation and analysis of nucleic acid and amino acid sequences.(Myers,G.,Korber,B.,Wain-Hobson,S.,Jeang,K.,Mellors J.,McCutchan,F.,Henderson,L.,and Paviakis,G.Eds.)Los Alamos National Laboratory,Los Alamos.N.Mex.111 147-111 150.
Lloe,K.S.,Bollinger,R.C.,Paranjape,R.S.,Gadkari,D.,Kulkarni,S.S.,Novfor,N.G.,Ingersoll,R.,Sheppard,H.W,and Ray,S.C.(1999).Full-lengthhuman immunodeficiency virus type  I genomes from subtype C-infectedseroconverters in india,with evidence of intersubtype recombination.J Firol.73-152-160.
Loussert Kjaka,I.,Chaix,M.L.,Korber,B.,Letourneur,F.,Gomas,E.,Allen,E.,Ly,T.D.,Brun Vezinet,F.,Simon,F.,and Saragosti,S.(1995).Variability of human immunodeficiency virus type 1group O strains isolatedfrom Cameroonian patients living in France..J Virol.69,5640-5649.
Luo,C.C.,Tian,C.,Hu,D.J.,Kai,M.,DOndero,T.,and Zheng,X.(1995).HIV-1subtype C in China[letter].Lancet 345,1051-1052.
Myers,G.,Korber,B.,Foley,B.,Jeang,K.T.,Mellors,J.W,and WainHobson,S.(1996).Human retroviruses and AIDS a compilation and analysisofnucleic acid and amino acid sequences.
(Anonymous Theoretical Biology and Biophysics Group,Los Alamos,N.Mex.
Salminen,M.O.,Koch,C.,Sanders Buell,E.,Ehrenberg,P K.,Michael,N.L.,Carr,J.K.,Burke,D.S.,and McCutchan,F.E.(1995).Recovery of virtuallyfull-length HIV-1provirus of diverse subtypes from primary virus cultures usingthe polymerase chain reaction.Virology 213.80-86.
Shao,Y,Zhao,Q.,Wang B.,and et al(1994).Sequence analysis ofHIV envgene among HIV infected IDUs in Yunnan epidemic area of China.Chin.JVirology 10,291-299.
Shao,Y,Su,L.,Sun,X.,and et al(1998).Molecular Epidemiology of HIVinfection in China.12th world AIDS conference,Geneva 13132,(Abstract)
Shao,Y,Guan,Y,Zhao,Q.,and et al(1999).Genetic variation andmolecular epidemiology of the Ruily HIV-1 strains of Yumian in 1995.Chin.JVirol.12,9.
Sharp,P.M.,Robertson,D.L.,and Hahn,B.H.(1995).Cross-speciestransmission and recombination of`AIDS′viruses.Philos.Trans.R.Soc.Lond B.Biol.Sci.349.41-47.
Sharp,P.M.,Bailes,E.,Robertson,D.L.,Gao,F.,and Hahn,B.H.(1999).Origins and evolution of AIDS Viruses.Biol.Bull.196.338-342.
World Health Organisation Network for HIV Isolation andCharacterization(1994).HIV-1variation in WHO-sponsored vaccine-evaluationsites genetic screening,sequence analysis and preliminary biologicalcharacterization of selected viral strains.AIDS Res.Hum.Retroviruses10.1327-1344.
Yu,H.,Su,L.,and Shao,Y(1997).Identification of the HIV-1 Subtypes byHMA and sequencing.Chin.J Epidemiol.18,201-204.
序列表
<110>真那特股份公司(GENEART GmbH)
<120>HIV-1亚型间(C/B’)基因组和其用途
<130>WAG-001 PCT
<140>PCT/DE01/04073
<141>2000-11-16
<150>DE 19955089.1
<151>1999-11-16
<160>379
<170>PatentIn Ver.2.1
<210>1
<211>9078
<212>DNA
<213>Human immunodeficiency virus
<400>1
aatctctagc agtggcgccc gaacagggac ttgaaagcga aagtaagacc agaggagatc 60
tctcgacgca ggactcggct tgctgaagtg cactcggcaa gaggcgagag cggcgactgg 120
tgagtacgcc aattatattt gactagcgga ggctagaagg agagagatgg gtgcgagagc 180
gtcaatatta agagggggaa aattagataa atgggaaaaa attaggttaa ggccaggggg 240
aaagaaacac tatatgctaa aacacctagt atgggcaagc agggagctgg aaagatttgc 300
acttaaccct ggccttttag agacatcaga aggctgtaaa caaataatga aacagctaca 360
atcagctctt cagacaggaa cagaggaact tagatcatta ttcaacacag tagcaactcc 420
ctattgtgta catacagaga tagatgtacg agacaccaga gaagccttag acaagataga 480
ggaagaacaa aacaaaattc agcaaaaaac acagcaggca aaggaggctg acgggaaggt 540
cagtcaaaat tatcctatag tacagaatct ccaagggcaa atggtacatc agcccatatc 600
acctagaact ttaaatgcat gggtaaaagt ggtagaagag aaggctttta gcccagaagt 660
aatacccatg ttttcagcgt tatcagaagg agccacccca caagatttaa acaccatgct 720
aaacacagtg gggggacatc aagcagctat gcaaatatta aaagatacca tcaatgaaga 780
ggctgcagaa tgggatagat tacatccagt acatgcaggg cctattgcac caggccaaat 840
gagagaacca aggggaagtg acatagcagg aactactagt aacctacagg aacaaatagc 900
atggatgacg agtaacccac ctgttccagt aggagacatc tataaaagat ggataattct 960
gggattaaat aaaatagtaa gaatgtatag ccctaccagc attctggaca taaaacaagg 1020
gccaaaggaa ccctttagag actatgtaga ccggttcttt aaaactttaa gagcggaaca 1080
agctacgcaa ggtgtaaaaa attggatgac agacaccttg ttggtccaaa atgcgaaccc 1140
agattgtaag accattttaa gagcattagg accaggggct tcaatagaag aaatgatgac 1200
agcatgtcag ggagtgggag gacctagcca taaagcaaaa gtgttggccg aggcaatgag 1260
ccaaacaaac agtgccatac tgatgcagag aagcaatttt aaaggctcta aaagaattgt 1320
taaatgtttc aactgtggca aggaagggca catagccaga aattgcaggg cccctaggaa 1380
aaagggctgt tggaaatgtg gaaaagaagg acaccaaatg aaagattgta ctgagagaca 1440
ggccaatttt ttagggaaaa tctggccctc ccacaaggga gggccaggga attttcttca 1500
gaacagacca gagccaacag ccccaccaga ggagagcttc aggtttgggg aagagacaac 1560
aactccatct cagaagcagg agccaataga caaggaacta tatcctttaa cttccctcaa 1620
atcactcttt ggcaacgacc cctcgtcaca ataaagatag gggggcaatt aaaggaagct 1680
ctattagata caggagcagg tgatacagta ttagaagacc tgaatttgcc agggaaatgg 1740
aaaccaaaaa tgataggggg aattggaggt tttatcaaag taagacagta tgaacagata 1800
cccatagaaa tttgcggaca caaagctata ggtacagtat tagtaggacc tacacctgtc 1860
aacataattg gaagaaatct gttgactcag cttggttgca ctttaaattt tccaatcagt 1920
cccattgaaa ctgtaccagt aaaattaaag ccaggaatgg atggcccaaa ggttaaacaa 1980
tggccattga cagaagagaa aataaaagca ttaacagcaa tttgtgatga aatggagaaa 2040
gaaggaaaaa ttacaaaaat tgggcctgaa aatccatata acactccaat atttgccata 2100
aaaaagaagg acagtactaa gtggagaaag ttagtagatt tcagggaact caataaaaga 2160
actcaagatt tttgggaagt tcaattagga ataccacacc cagcagggtt aaaaaagaaa 2220
aaatcagtga cagtactgga tgtgggggat gcatattttt caattccttt atatgaagac 2280
ttcaggaagt atactgcatt caccatacct agtagaaaca atgaaacacc agggattagg 2340
tatcagtaca atgtacttcc acagggatgg aaaggatcac tagcaatatt ccaaagtagc 2400
atgacaaaaa ccttagagcc ttttagaaaa caaaatccag gcatagttat ctatcaatac 2460
atggatgatt tgtatgtagg atctgactta gagatagggc agcatagaac aaaaatagag 2520
gaactgagac aacatttgtt gaggtgggga tttaccacac cagacaagaa acattagaaa 2580
gaacctccat ttctttggat ggggtatgaa ctccatcctg acaaatggac agtacagcct 2640
acacagctgc cagaaaaaga tagctggact gtcaatgata tacaaaagtt agtgggaaaa 2700
ttaaactggg caagtcagat ttatcctgga attaaagtaa ggcaactttg taaactcctt 2760
aggggggcca aagcactaac agacatagta ccactaactg aagaagcaga attagaattg 2820
gcagaaaaca gggaaattct aaaagaacca gtacatggag tatactatga cccatcaaaa 2880
gacttgatag ctgaaataca gaaacagggg caggaacaat ggacatatca aatttaccaa 2940
gaaccattca aaaatctaaa aacagggaag tatgcaaaaa tgaggactgc ccacactaat 3000
gatgtaaaac aattaacaga ggctgtgcag aaaatagcca tggaaggcat agtaatatgg 3060
ggaaaaactc ctaaatttag attacccatc caaaaagaaa catgggagac atggtggaca 3120
gactattggc aagccacctg gattcctgag tgggaatttg ttaatacccc tcccttagta 3180
aaattatggt accagctgga aaaagatccc atagtaggag tagaaacttt ctatgtagat 3240
ggagcagcta atagggagac taaaatagga aaagcagggt atgttactga cagaggaagg 3300
aagaaaattg tttctctaac tgaaacaaca aatcagaaga ctgaattgca agcaatttgt 3360
atagctttgc aagattcagg atcagaagta aacatagtaa cagattcaca gtatgcatta 3420
gggatcattc aagcacaacc agataagagt gaatcagagt tagttaacca aataatagaa 3480
caattaatga aaaaggaaag agtctacctg tcatgggtac cagcacataa aggaattgga 3540
ggaaatgaac aagtagataa attagtaagt agtggaatca ggaaagtgct atttctagat 3600
ggaatagata aagctcaaga agagcatgaa aagtatcaca gcaattggag agcaatggct 3660
agtgacttta atctgccacc catagtagca aaagaaatag tggctagctg tgatcaatgt 3720
cagctaaaag gagaagccat gcatggacaa gtagactgta gtccagggat atggcaatta 3780
gattgtacac atttagaagg aaaaatcatc ctggtagcag tccatgtagc cagtggctac 3840
atggaagcag aggttatccc agcagaaaca ggacaagaga cagcatactt tatactaaaa 3900
ttagcaggaa gatggccagt caaagtaata catacagata atggtagtaa tttcaccagt 3960
actgcagtta aggcagcctg ttggtgggca ggtatccaac aggaatttgg aattccctac 4020
agtccccaaa gtcagggagt agtagaagcc atgaataaag aattaaagaa aattataggg 4080
caggtaagag atcaagctga gcaccttaag acagcagtac taatggcagt attcattcac 4140
aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat aatagatata 4200
atagcaacag acatacaaac taaagaatta caaaaacaga ttacaaaaat tcaaaatttt 4260
cgggtttatt acagagacag cagagacccc agttggaaag gaccagccaa actactctgg 4320
aaaggtgaag gggcagtaat aatacaagat aatagtgaca taaaggtagt accaaggagg 4380
aaagcaaaaa tcattaagga ctatggaaaa cagatggcag gtgctgattg tgtggcaggt 4440
agacaggatg aagattagaa catggaatag tttagtaaaa caccatatgt atgtttcaag 4500
gagagctaat ggatggtttt acagacatca ttatgacagc agacatccaa aagtaagttc 4560
agaagtacac atcccattag gaaaggctaa attagtaata aaaacatatt gggggttgca 4620
gacaggagaa agagatcggc atttgggtca tggagtctcc atagaatgga gattgagaag 4680
atataccaca caaatagaac ctggcctggc agaccagcta attcatttgt attattttga 4740
ttgttttgca gactctgata taaggaaagc catattagga cacatagtta ttcctaggtg 4800
tgactatcaa gcaggacata ataataaggt aggatctcta caatacttgg cactgacagc 4860
attgataaaa ccaaaaaaga taaagccacc tctgcctagt atcaagaaat tagtagagga 4920
tagatggaac aatccccagg agatcagggg ccgcagaggg aaccacacaa tgaatggaca 4980
ctagagcttc tagaggagct caagcaggaa gctgttagac actttcctag accatggctt 5040
catagcttag gacaacatat ctatgaaaca tatggggata cttgggcagg agtggaagcc 5100
ataataagaa ttctgcaaca actgctgttt attcatttca gaattgggtg tcagcatagc 5160
agaataggca ttttgagaca gagaagaaca agaaatggag ccagtaaatc ataaattaga 5220
gccttgggag catccaggaa gtcagcctaa gactgcttgt aacagttgct attgtaaaaa 5280
gtgctgcttt cattgccaag tttgtttcac gaaaaaaggc ttaggcatct tctatggcag 5340
gaagaagcga agacagcgac gaagcgctca tcgaagcagt gaggatcatc aaaatcctat 5400
atcaaagcag taagtagtaa atgtaatgca agctttaacc attttagcaa tagtagcctt 5460
agtagtagca acaataatag caatagttgt gtggaccata gtattcatag aatataggaa 5520
aatattaaga cagaaaaaaa tagacaggtt aattgataga ataagagaaa gagcagaaga 5580
cagtggcaat gagggtgacg gggatcagga agaattatcg gcatttatgg agatggggca 5640
ccatgctcct tgggatgttg atgatcagta gtgctgtagg aaacttgtgg gtcacagtct 5700
attatggggt acctgtatgg aaaggggcaa ccaccacttt attttgtgca tcagatgcta 5760
aagcatatga tacagaggta cataatgttt gggctacaca tgcctgtgta cccgcagacc 5820
ccaacccaca agaaatggtt ttggaaaatg taacagaaaa ttttaacatg tggaaaaatg 5880
aaatggtaaa tcagatgcag gaagatgtaa tcagtttatg ggatcaaagc ctaaaaccat 5940
gtgtaaagtt gaccccactc tgtgtcactt tagaatgtag aaatgttagc agtaatagta 6000
atgataccta ccatgagacc taccatgaga gcatgaagga aatgaaaaat tgctctttca 6060
atgcaaccac agtagtaaga gataggaagc agacagtgta tgcacttttt tatagacttg 6120
atatagtacc acttactaag aagaactata gtgagaattc tagtgagtat tatagattaa 6180
taaattgtaa tacctcagcc ataacacaag cctgtccaaa ggtcactttt gatccaattc 6240
ctatacacta ttgcactcca gctggttatg caattctaaa gtgtaatgat aagatattca 6300
atgggacagg accatgccat aatgttagca cagtacaatg tacacatggg attaagccag 6360
tggtatcaac tcaactactg ttaaatggta gcctagcaga aggagaaata ataattagat 6420
ctgaaaatct gacaaacaat gtcaaaacaa taatagtaca tcttaatcaa tctgtagaaa 6480
ttgtatgtac aagacccggc aataatacaa gaaaaagtat aaggatagga ccaggacaaa 6540
cattctatgc aacaggagac ataataggag acataagaca agcacattgt aacattagtg 6600
aagataaatg gaatgaaact ttacaaaggg taagtaaaaa attagcagaa cacttccaga 6660
ataaaacaat aaaatttgca tcatcctcag gaggggacct agaagttaca acacatagct 6720
ttaattgtag aggagaattt ttctattgta atacatcagg cctgtttaat ggtgcataca 6780
cgcctaatgg tacaaaaagt aattcaagct caatcatcac aatcccatgc agaataaagc 6840
aaattataaa tatgtggcag gaggtaggac gagcaatgta tgcccctccc ataaaaggaa 6900
acataacatg taaatcaaat atcacaggac tactattggt acgtgatgga ggaacagagc 6960
caaatgatac agagacattc agacctggag gaggagatat gaggaacaat tggagaagtg 7020
aattatataa atataaagtg gtagaaatta agccattggg agtagcaccc actacaacaa 7080
aaaggagagt ggtggagaga gaaaaaagag cagtgggaat aggagctgtg ttccttgggt 7140
tcttaggagt agcaggaagc actatgggcg cggcgtcaat aacgctgacg gtacaggcca 7200
gacaattgct gtctggtata gtgcaacagc aaagcaattt gctgagggct atagaagcgc 7260
aacagcatct gttgcaactc acggtctggg gcattaagca gctccagaca agagtcctgg 7320
ctatagaaag atacctaaag gatcaacagc tcctagggat ttggggctgc tctggaaaac 7380
tcatctgcac tactgctgta ccttggaact ccagttggag taacaaatct caaaaagaga 7440
tttgggataa catgacctgg atgcaatggg ataaagaaat tagtaattac acaaacacag 7500
tatacaggtt gcttgaagaa tcgcaaaacc agcaggaaag gaatgaaaaa gatctattag 7560
cattggacag ttggaaaaat ctatggagtt ggtttgacat aacaaattgg ctgtggtata 7620
taaaaatatt cataataata gtaggaggct tgataggttt aagaataatt tttgctgtgc 7680
tctctatagt aaatagagtt aggcagggat actcaccttt gtcgtttcag acccttaccc 7740
cgaacccagg gggacccgac aggctcggaa gaatcgaaga agaaggtgga aagcaagaca 7800
gggacagatc cattcgatta gtgaacggat tcttagcgct tgcctgggac gacctgcgga 7860
acctgtgcct cttcagctac caccgattga gggacttcac attagtggca gcgagggtgg 7920
tggaacttct gggacgcaat agtctcaggg gactacagag agggtgggaa gcccttaaat 7980
atctgggaag tcttgtgcag tactggggtc aggagctaaa aaagagtact attagtctgg 8040
ttgataccat agcaatagca gtagctgaag gaacagatag gattatagaa ttagtacaag 8100
gactttgtag agctatctac agcataccta gaagaataag acagggcttt gaagcagctt 8160
tgcaataaaa tggggggcaa gtggtcgaaa agtagcatag ttggatggcc tgctataagg 8220
gagagaatga gaagaactga gccagcagca gatggggtgg gagcagtatc tcgagacctg  8280
gaaaaacatg gagcaatcac gagtagcaat acagcagcta ctaatgagga ttgtgcctgg  8340
ctggaagcac aagaggaggg ggaggtgggt tttccagtca gacctcaggt acctttaaga  8400
ccaatgactt acaagggagc tgtagatctt agcttctttt taaaagaaaa ggggggactg  8460
gaagggttaa tttactctaa gaaaaggcaa gagatccttg atttgtgggt ctatcacaca  8520
caaggctact tccctgattg gcacaactac acaccaggac caggggtcag attcccactg  8580
acttttgggt ggtgcttcaa gctagtacca gttgacccaa gggaagtaga agaggccaac  8640
gagggagaag acaactgctt gctacaccct gtgtgccagc atggaatgga ggatgatcac  8700
agagaagtat taaagtggaa gtttgacagt caactagcac acagacacag ggcccgcgaa  8760
ctacatccgg agttttacaa agactgctga cacagaaggg actttccgcg gggactttcc  8820
actggggcgt tctaggaggt gtggtctggc gggactggga gtggtcaacc ctcaaatgct  8880
gcatataagc agctgctttt cgcctgtact gggtctctct agtcagacca gatctgagcc  8940
tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag cttgccttga  9000
ggggctagag cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgagggtt  9060
aattgcgcgc tggcgatc                                                9078
<210>2
<211>4288
<212>DNA
<213>Human immunodeficiency virus
<400>2
gctaggtacc taatgggcgc cagggccagc atcctgaggg gcggcaagct ggacaagtgg  60
gagaagatca ggctgaggcc cggcggcaag aagcactaca tgctgaagca cctggtgtgg  120
gccagcaggg agctggagag gttcgccctg aaccccggcc tgctggagac cagcgagggc  180
tgcaagcaga tcatgaagca gctgcagagc gccctgcaga ccggcaccga ggagctgagg  240
agcctgttca acaccgtggc caccccctac tgcgtgcaca ccgagatcga cgtgagggac  300
accagggagg ccctggacaa gatcgaggag gagcagaaca agatccagca gaagacccag  360
caggccaagg aggccgacgg caaggtgagc cagaactacc ccatcgtgca gaacctgcag  420
ggccagatgg tgcaccagcc catcagcccc aggaccctga atgcatgggt gaaggtggtg  480
gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctgag cgagggcgcc  540
accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag  600
atcctgaagg acaccatcaa cgaggaggcc gccgagtggg acaggctgca ccccgtgcac  660
gccggcccca tcgcccccgg ccagatgagg gagcccaggg gcagcgacat cgccggcacc  720
accagcaacc tgcaggagca gatcgcctgg atgaccagca acccccccgt gcccgtgggc  780
gacatctaca agaggtggat catcctgggt ttaaacaaga tcgtgaggat gtacagcccc  840
accagcatcc tggacatcaa gcagggcccc aaggagccct tcagggacta cgtcgacagg  900
ttcttcaaga ccctgagggc ggagcaggcc acccagggcg tgaagaactg gatgaccgac  960
accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctgagggc cctgggcccc  1020
ggcgccagca tcgaggagat gatgaccgcc tgccagggcg tgggcggccc cagccacaag  1080
gccaaggtgc tggccgaggc catgagccag accaacagcg ccatcctgat gcagaggagc  1140
aacttcaagg gcagcaagag gatcgtgaag tgcttcaact gcggcaagga gggccacatc  1200
gccaggaact gcagggcccc caggaagaag ggctgctgga agtgcggcaa ggagggccac  1260
cagatgaagg actgcaccga gaggcaggcc aacttcctgg gcaagatctg gcccagccac  1320
aagggcggcc ccggcaactt cctgcagaac aggcccgagc ccaccgcccc ccccgaggag  1380
agcttcaggt tcgaggagga gaccaccacc cccagccaga agcaggagcc catcgacaag  1440
gagctgtacc ccctgaccag cctgaagagc ctgttcggca acgaccccag cagccaggaa  1500
ttcttcaggg agaacctggc cctgccccag ggcagggcca gggagttcag cagcgagcag  1560
accagggcca acagccccac caggggcgag ctgcaggtgt ggggcaggga caacaacagc  1620
atcagcgagg ccggcgccaa caggcagggc accatcagct tcaacttccc ccagatcacc  1680
ctgtggcaga ggcccctggt gaccatcaag atcggcggcc agctgaagga ggccctgctg  1740
aacaccggcg ccggcgacac cgtgctggag gacctgaacc tgcccggcaa gtggaagccc  1800
aagatgatcg gcggcatcgg cggcttcatc aaggtgaggc agtacgagca gatccccatc  1860
gagatctgcg gccacaaggc catcggcacc gtgctggtgg gccccacccc cgtgaacatc  1920
atcggcagga acctgctgac ccagctgggc tgcaccctga acttccccat cagccccatc  1980
gagaccgtgc ccgtgaagct gaagcccggc atggacggcc ccaaggtgaa gcagtggccc  2040
ctgaccgagg agaagatcaa ggccctgacc gccatctgcg acgagatgga gaaggagggc  2100
aagatcacca agatcggccc cgagaacccc tacaacaccc ccatcttcgc catcaagaag  2160
aaggacagca ccaagtggag gaagctggtg gacttcaggg agctgaacaa gaggacccag  2220
gacttctggg aggtgcagct gggcatcccc caccccgccg gcctgaagaa gaagaagagc  2280
gtgaccgtgc tggacgtggg cgacgcctac ttcagcatcc ccctgtacga ggacttcagg  2340
aagtacaccg ccttcaccat ccccagcagg aacaacgaga cccccggcat cagctaccag  2400
tacaacgtgc tgccccaggg ctggaagggc agcctggcca tcttccagag cagcatgacc  2460
atcgaggagc tgatctacag caagaagagg caggagatcc tggacctgtg ggtgtaccac  2520
acccagggct acttccccga ctggcacaac tacacccccg gccccggcgt gaggttcccc  2580
ctgaccttcg gctggtgctt caagctggtg cccgtggacc ccagggaggt ggaggaggcc  2640
aacgagggcg aggacaactg cctgctgcac cccgtgtgcc agcacggcat ggaggacgac  2700
cacagggagg tgctgaagtg gaagttcgac agccagctgg cccacaggca cagggccagg  2760
gagctgcacc ccgagttcta caaggactgc atgggcggca agtggagcaa gagcagcatc  2820
gtgggctggc ccgccatcag ggagaggatg aggaggaccg agcccgccgc cgacggcgtg  2880
ggcgccgtga gcagggacct ggagaagcac ggcgccatca ccagcagcaa caccgccgcc  2940
accaacgagg actgcgcctg gctggaggcc caggaggagg gcgaggtggg cttccccgtg  3000
aggccccagg tgcccctgag gcccatgacc tacaagggcg ccgtggacct gagcttcttc  3060
ctgaaggaga agggcggcct ggagggcctg aggcagcacc tgctgaggtg gggcttcacc  3120
acccccgaca agaagcacca gaaggagccc cccttcctgt ggatgggcta cgagctgcac  3180
cccgacaagt ggaccgtgca gcccacccag ctgcccgaga aggacagctg gaccgtgaac  3240
gacatccaga agctggtggg caagctgaac tgggccagcc agatctaccc cggcatcaag  3300
gtgaggcagc tgtgcaagct gctgaggggc gccaaggccc tgaccgacat cgtgcccctg  3360
accgaggagg ccgagctgga gctggccgag aacagggaga tcctgaagga gcccgtgcac  3420
ggcgtgtact acgaccccag caaggacctg atcgccgaga tccagaagca gggccaggag  3480
cagtggacct accagatcta ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc  3540
aagatgagga ccgcccacac caacgacgtg aagcagctga ccgaggccgt gcagaagatc  3600
gccatggagg gcatcgtgat ctggggcaag acccccaagt tcaggctgcc catccagaag  3660
gagacctggg agacctggtg gaccgactac tggcaggcca cctggatccc cgagtgggag  3720
ttcgtgaaca cccctcccct ggtgaagctg tggtatcagc tggagaagga ccccatcgtg  3780
ggcgtggaga ccttctacgt ggacggcgcc gccaacaggg agaccaagat cggcaaggcc  3840
ggctacgtga ccgacagggg caggaagaag atcgtgagcc tgaccgagac caccaaccag  3900
aagaccgagc tgcaggccat ctgcatcgcc ctgcaggaca gcggcagcga ggtgaacatc  3960
gtgaccgaca gccagtacgc cctgggcatc atccaggccc agcccgacaa gagcgagagc  4020
gagctggtga accagatcat cgagcagctg atgaagaagg agagggtgta cctgagctgg  4080
gtgcccgccc acaagggcat cggcggcaac gagcaggtgg acaagctggt gagcagcggc  4140
atcaggaagg tgctgaagac cctggagccc ttcaggaagc agaaccccgg catcgtgatc  4200
taccagtaca tggacgacct gtacgtgggc agcgacctgg agatcggcca gcacaggacc  4260
aagtaaagat ctctcgagga gctcaagc                                     4288
<210>3
<211>2605
<212>DNA
<213>Human immunodeficiency virus
<400>3
gcggcgggta ccgaattcgc cgccagcatg gacagggcca agctgctgct gctgctgctg  60
ctgctgctgc tgccccaggc ccaggccgtg ggcaacctgt gggtgaccgt gtactacggc  120
gtgcccgtgt ggaagggcgc caccaccacc ctgttctgcg ccagcgacgc caaggcctac  180
gacaccgagg tgcacaacgt gtgggccacc cacgcctgcg tgcccgccga ccccaacccc  240
caggagatgg tgctggagaa cgtgaccgag aacttcaaca tgtggaagaa cgagatggtg  300
aaccagatgc aggaggacgt catcagcctg tgggaccaga gcctgaagcc ctgcgtgaag  360
ctgacccccc tgtgcgtgac cctggagtgc aggaacgtga gcagcaacag caacgacacc  420
taccacgaga cctaccacga gagcatgaag gagatgaaga actgcagctt caacgccacc  480
accgtggtga gggacaggaa gcagaccgtg tacgccctgt tctacaggct ggacatcgtg  540
cccctgacca agaagaacta cagcgagaac agcagcgagt actacaggct gatcaactgc  600
aacaccagcg ccatcaccca ggcctgcccc aaggtgacct tcgaccccat ccccatccac  660
tactgcaccc ccgccggcta cgccatcctg aagtgcaacg acaagatctt caacggcacc  720
ggcccctgcc acaacgtgag caccgtgcag tgcacccacg gcatcaagcc cgtggtgagc  780
acccagctgc tgctgaacgg cagcctggcc gagggcgaga tcatcatcag gagcgagaac  840
ctgaccaaca acgtgaaaac catcatcgtg cacctgaacc agagcgtgga gatcgtgtgc  900
accaggcccg gcaacaacac caggaagagc atcaggatcg gccccggcca gaccttctac  960
gccaccggcg acatcatcgg cgacatcagg caggcccact gcaacatcag cgaggacaag  1020
tggaacgaga ccctgcagag ggtgagcaag aagcttgccg agcacttcca gaacaagacc  1080
atcaagttcg ccagcagcag cggcggcgac ctggaggtga ccacccacag cttcaactgc  1140
aggggcgagt tcttctactg caacaccagc ggcctgttca acggcgccta cacccccaac  1200
ggcaccaaga gcaacagcag cagcatcatc accatcccct gcaggatcaa gcagatcatc  1260
aacatgtggc aggaggtggg cagggccatg tacgcccctc ccatcaaggg caacatcacc  1320
tgcaagagca acatcaccgg cctgctgctg gtgagggacg gcggcaccga gcccaacgac  1380
accgagacct tcaggcccgg cggcggcgac atgaggaaca actggaggag cgagctgtac  1440
aagtacaagg tggtggagat caagcccctg ggcgtggccc ccaccaccac caagaggagg  1500
gtggtggaga gggagaagag ggccgtgggc atcggcgccg tgttcctggg cttcctgggc  1560
gtggccggca gcaccatggg cgccgccagc atcaccctga ccgtgcaggc caggcagctg  1620
ctgagcggca tcgtgcagca gcagagcaac ctgctgaggg ccatcgaggc ccagcagcac  1680
ctgctgcagc tgaccgtgtg gggcatcaag cagctgcaga ccagggtgct ggccatcgag  1740
aggtacctga aggaccagca gctgctgggc atctggggct gcagcggcaa gctgatctgc  1800
accaccgccg tgccctggaa cagcagctgg agcaacaaga gccagaagga gatctgggac  1860
aacatgacct ggatgcagtg ggacaaggag atcagcaact acaccaacac cgtgtacagg  1920
ctgctggagg agagccagaa ccagcaggag aggaacgaga aggacctgct ggccctggac  1980
agctggaaga acctgtggag ctggttcgac atcaccaact ggctgtggta catcaagatc  2040
ttcatcatca tcgtgggcgg cctgatcggc ctgaggatca tcttcgccgt gctgagcatc  2100
gtgaacaggg tgaggcaggg ctacagcccc ctgagcttcc agaccctgac ccccaacccc  2160
ggcggccccg acaggctggg caggatcgag gaggagggcg gcaagcagga cagggacagg  2220
agcatcaggc tggtgaacgg cttcctggcc ctggcctggg acgacctgag gaacctgtgc  2280
ctgttcagct accacaggct gagggacttc accctggtgg ccgccagggt ggtggagctg  2340
ctgggcagga acagcctgag gggcctgcag aggggctggg aggccctgaa gtacctgggc  2400
agcctggtgc agtactgggg ccaggagctg aagaagagca ccatcagcct ggtggacacc  2460
atcgccatcg ccgtggccga gggcaccgac aggatcatcg agctggtgca gggcctgtgc  2520
agggccatct acagcatccc caggaggatc aggcagggct tcgaggccgc cctgcagtga  2580
taaagatctc tcgaggagct caagc                                        2605
<210>4
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>4
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile His Ile Gly Pro
  1               5                  10                  15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
          35
<210>5
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>5
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Glu Ile Val Gly Asn Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>6
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>6
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Met Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>7
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>7
Cys Val Arg Pro Asn Asn Asn Thr Arg Glu Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>8
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>8
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>9
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>9
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Thr Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>10
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>10
Cys Thr Arg Pro Gly Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>11
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>11
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>12
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>12
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Arg
             20                  25                  30
Ala Tyr Cys
         35
<210>13
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>13
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Arg Ile Arg Val Gly Pro
  1               5                  10                  15
Gly Gln Thr Val Tyr Ala Thr Asn Ala Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>14
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>14
Cys Ala Arg Pro Gly Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Phe Ala Thr Gly Ala Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>15
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>15
Cys Thr Arg Tyr Ala Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Thr Phe Tyr Ala Thr Asn Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>16
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>16
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro
  1               5                  10                  15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>17
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>17
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile His Ile Gly Pro
  1               5                  10                  15
Gly Arg Ala Phe Tyr Thr Thr Gly Glu Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>18
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>18
Cys Thr Arg Pro Tyr Asn Asn Thr Arg Gln Arg Thr His Ile Gly Pro
  1               5                  10                  15
Gly Gln Ala Leu Tyr Ala Thr Thr Arg Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>19
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>19
Cys Thr Arg Pro Ser Asn Asn Thr Arg Thr Ser Ile Thr Ile Gly Pro
  1               5                  10                  15
Gly Gln Val Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Lys
             20                  25                  30
Ala Tyr Cys
         35
<210>20
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>20
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile His Leu Gly Pro
  1               5                  10                  15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Lys
             20                  25                  30
Ala His Cys
         35
<210>21
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>21
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Thr Ile Gly Pro
  1               5                  10                  15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
             20                  25                  30
Ala His Cys
         35
<210>22
<211>35
<212>PRT
<213>Human immunodeficiency virus
<400>22
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Ser Ile Gly Pro
  1               5                  10                  15
Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Lys
             20                  25                  30
Ala Tyr Cys
         35
<210>23
<211>36
<212>PRT
<213>Human immunodeficiency virus
<400>23
Cys Glu Arg Pro Gly Ile Asp Ile Gln Glu Ile Arg Ile Gly Pro Met
  1               5                  10                  15
Ala Trp Tyr Ser Met Gly Leu Gly Gly Thr Asn Gly Asn Ser Ser Arg
             20                  25                  30
Ala Ala Tyr Cys
             35
<210>24
<211>22
<212>DNA
<213>Human immunodeficiency virus
<400>24
atctctagca gtggcggccg aa                                                      22
<210>25
<211>22
<212>DNA
<213>Human immunodeficiency virus
<400>25
gcactcaagg caagctttat tg                                                      22
<210>26
<211>9078
<212>DNA
<213>Human immunodeficiency virus
<220>
<221>CDS
<222>(1)..(9078)
<400>26
aat ctc tag cag tgg cgc ccg aac agg gac ttg aaa gcg aaa gta aga    48
Asn Leu     Gln Trp Arg Pro Asn Arg Asp Leu Lys Ala Lys Val Arg
  1               5                  10                  15
cca gag gag atc tct cga cgc agg act cgg ctt gct gaa gtg cac tcg    96
Pro Glu Glu Ile Ser Arg Arg Arg Thr Arg Leu Ala Glu Val His Ser
             20                  25                  30
gca aga ggc gag agc ggc gac tgg tga gta cgc caa tta tat ttg act    144
Ala Arg Gly Glu Ser Gly Asp Trp      Val Arg Gln Leu Tyr Leu Thr
         35                  40                  45
agc gga ggc tag aag gag aga gat ggg tgc gag agc gtc aat att aag    192
Ser Gly Gly     Lys Glu Arg Asp Gly Cys Glu Ser Val Asn Ile Lys
     50                  55                  60
agg ggg aaa att aga taa atg gga aaa aat tag gtt aag gcc agg ggg    240
Arg Gly Lys Ile Arg     Met Gly Lys Asn     Val Lys Ala Arg Gly
 65                  70                  75                  80
aaa gaa aca cta tat gct aaa aca cct agt atg ggc aag cag gga gct    288
Lys Glu Thr Leu Tyr Ala Lys Thr Pro Ser Met Gly Lys Gln Gly Ala
                 85                  90                  95
gga aag att tgc act taa ccc tgg cct ttt aga gac atc aga agg ctg    336
Gly Lys Ile Cys Thr     Pro Trp Pro Phe Arg Asp Ile Arg Arg Leu
            100                 105                 110
taa aca aat aat gaa aca gct aca atc agc tct tca gac agg aac aga    384
Thr Asn Asn Glu Thr Ala Thr Ile Ser Ser Ser Asp Arg Asn Arg
    115                 120                 125
gga act tag atc att att caa cac agt agc aac tcc cta ttg tgt aca    432
Gly Thr     Ile Ile Ile Gln His Ser Ser Asn Ser Leu Leu Cys Thr
    130                 135                 140
tac aga gat aga tgt acg aga cac cag aga agc ctt aga caa gat aga    480
Tyr Arg Asp Arg Cys Thr Arg His Gln Arg Ser Leu Arg Gln Asp Arg
145                 150                 155                 160
gga aga aca aaa caa aat tca gca aaa aac aca gca ggc aaa gga ggc    528
Gly Arg Thr Lys Gln Asn Ser Ala Lys Asn Thr Ala Gly Lys Gly Gly
                165                 170                 175
tga cgg gaa ggt cag tca aaa tta tcc tat agt aca gaa tct cca agg    576
Arg Glu Gly Gln Ser Lys Leu Ser Tyr Ser Thr Glu Ser Pro Arg
        180                 185                 190
gca aat ggt aca tca gcc cat atc acc tag aac ttt aaa tgc atg ggt    624
Ala Asn Gly Thr Ser Ala His Ile Thr     Asn Phe Lys Cys Met Gly
        195                 200                 205
aaa agt ggt aga aga gaa ggc ttt tag ccc aga agt aat acc cat gtt    672
Lys Ser Gly Arg Arg Glu Gly Phe     Pro Arg Ser Asn Thr His Val
    210                 215                 220
ttc agc gtt atc aga agg agc cac ccc aca aga ttt aaa cac cat gct    720
Phe Ser Val Ile Arg Arg Ser His Pro Thr Arg Phe Lys His His Ala
225                 230                 235                 240
aaa cac agt ggg ggg aca tca agc agc tat gca aat att aaa aga tac    768
Lys His Ser Gly Gly Thr Ser Ser Ser Tyr Ala Asn Ile Lys Arg Tyr
                 245                 250                 255
cat caa tga aga ggc tgc aga atg gga tag att aca tcc agt aca tgc    816
His Gln     Arg Gly Cys Arg Met Gly     Ile Thr Ser Ser Thr Cys
            260                 265                 270
agg gcc tat tgc acc agg cca aat gag aga acc aag ggg aag tga cat    864
Arg Ala Tyr Cys Thr Arg Pro Asn Glu Arg Thr Lys Gly Lys     His
        275                 280                 285
agc agg aac tac tag taa cct aca gga aca aat agc atg gat gac gag    912
Ser Arg Asn Tyr         Pro Thr Gly Thr Asn Ser Met Asp Asp Glu
    290                 295                 300
taa ccc acc tgt tcc agt agg aga cat cta taa aag atg gat aat tct    960
    Pro Thr Cys Ser Ser Arg Arg His Leu     Lys Met Asp Asn Ser
305                 310                 315                 320
ggg att aaa taa aat agt aag aat gta tag ccc tac cag cat tct gga    1008
Gly Ile Lys     Asn Ser Lys Asn Val     Pro Tyr Gln His Ser Gly
                325                 330                 335
cat aaa aca agg gcc aaa gga acc ctt tag aga cta tgt aga ccg gtt    1056
His Lys Thr Arg Ala Lys Gly Thr Leu     Arg Leu Cys Arg Pro Val
            340                 345                 350
ctt taa aac ttt aag agc gga aca agc tac gca agg tgt aaa aaa ttg    1104
Leu     Asn Phe Lys Ser Gly Thr Ser Tyr Ala Arg Cys Lys Lys Leu
        355                 360                 365
gat gac aga cac ctt gtt ggt cca aaa tgc gaa ccc aga ttg taa gac    1152
Asp Asp Arg His Leu Val Gly Pro Lys Cys Glu Pro Arg Leu     Asp
    370                 375                 380
cat ttt aag agc att agg acc agg ggc ttc aat aga aga aat gat gac    1200
His Phe Lys Ser Ile Arg Thr Arg Gly Phe Asn Arg Arg Asn Asp Asp
385                 390                 395                 400
agc atg tca ggg agt ggg agg acc tag cca taa agc aaa agt gtt ggc    1248
Ser Met Ser Gly Ser Gly Arg Thr     Pro     Ser Lys Ser Val Gly
                405                 410                 415
cga ggc aat gag cca aac aaa cag tgc cat act gat gca gag aag caa    1296
Arg Gly Asn Glu Pro Asn Lys Gln Cys His Thr Asp Ala Glu Lys Gln
            420                 425                 430
ttt taa agg ctc taa aag aat tgt taa atg ttt caa ctg tgg caa gga    1344
Phe     Arg Leu     Lys Asn Cys     Met Phe Gln Leu Trp Gln Gly
        435                 440                 445
agg gca cat agc cag aaa ttg cag ggc ccc tag gaa aaa ggg ctg ttg    1392
Arg Ala His Ser Gln Lys Leu Gln Gly Pro     Glu Lys Gly Leu Leu
    450                 455                 460
gaa atg tgg aaa aga agg aca cca aat gaa aga ttg tac tga gag aca    1440
Glu Met Trp Lys Arg Arg Thr Pro Asn Glu Arg Leu Tyr     Glu Thr
465                 470                 475                 480
ggc caa ttt ttt agg gaa aat ctg gcc ctc cca caa ggg agg gcc agg    1488
Gly Gln Phe Phe Arg Glu Asn Leu Ala Leu Pro Gln Gly Arg Ala Arg
                485                 490                 495
gaa ttt tct tca gaa cag acc aga gcc aac agc ccc acc aga gga gag    1536
Glu Phe Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Gly Glu
            500                 505                 510
ctt cag gtt tgg gga aga gac aac aac tcc atc tca gaa gca gga gcc    1584
Leu Gln Val Trp Gly Arg Asp Asn Asn Ser Ile Ser Glu Ala Gly Ala
        515                 520                 525
aat aga caa gga act ata tcc ttt aac ttc cct caa atc act ctt tgg    1632
Asn Arg Gln Gly Thr Ile Ser Phe Asn Phe Pro Gln Ile Thr Leu Trp
    530                 535                 540
caa cga ccc ctc gtc aca ata aag ata ggg ggg caa tta aag gaa gct    1680
Gln Arg Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala
545                 550                 555                 560
cta tta gat aca gga gca ggt gat aca gta tta gaa gac ctg aat ttg    1728
Leu Leu Asp Thr Gly Ala Gly Asp Thr Val Leu Glu Asp Leu Asn Leu
                565                 570                 575
cca ggg aaa tgg aaa cca aaa atg ata ggg gga att gga ggt ttt atc    1776
Pro Gly Lys Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile
            580                 585                 590
aaa gta aga cag tat gaa cag ata ccc ata gaa att tgc gga cac aaa    1824
Lys Val Arg Gln Tyr Glu Gln Ile Pro Ile Glu Ile Cys Gly His Lys
        595                 600                 605
gct ata ggt aca gta tta gta gga cct aca cct gtc aac ata att gga    1872
Ala Ile Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly
    610                 615                 620
aga aat ctg ttg act cag ctt ggt tgc act tta aat ttt cca atc agt    1920
Arg Asn Leu Leu Thr Gln Leu Gly Cys Thr Leu Asn Phe Pro Ile Ser
625                 630                 635                 640
ccc att gaa act gta cca gta aaa tta aag cca gga atg gat ggc cca    1968
Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro
                645                 650                 655
aag gtt aaa caa tgg cca ttg aca gaa gag aaa ata aaa gca tta aca    2016
Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Thr
            660                 665                 670
gca att tgt gat gaa atg gag aaa gaa gga aaa att aca aaa att ggg    2064
Ala Ile Cys Asp Glu Met Glu Lys Glu Gly Lys Ile Thr Lys Ile Gly
        675                 680                 685
cct gaa aat cca tat aac act cca ata ttt gcc ata aaa aag aag gac    2112
Pro Glu Asn Pro Tyr Asn Thr Pro Ile Phe Ala Ile Lys Lys Lys Asp
    690                 695                 700
agt act aag tgg aga aag tta gta gat ttc agg gaa ctc aat aaa aga    2160
Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg
705                 710                 715                 720
act caa gat ttt tgg gaa gtt caa tta gga ata cca cac cca gca ggg    2208
Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly
                725                 730                 735
tta aaa aag aaa aaa tca gtg aca gta ctg gat gtg ggg gat gca tat    2256
Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr
            740                 745                 750
ttt tca att cct tta tat gaa gac ttc agg aag tat act gca ttc acc    2304
Phe Ser Ile Pro Leu Tyr Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr
        755                 760                 765
ata cct agt aga aac aat gaa aca cca ggg att agg tat cag tac aat    2352
Ile Pro Ser Arg Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn
    770                 775                 780
gta ctt cca cag gga tgg aaa gga tca cta gca ata ttc caa agt agc    2400
Val Leu Pro Gln Gly Trp Lys Gly Ser Leu Ala Ile Phe Gln Ser Ser
785                 790                 795                 800
atg aca aaa acc tta gag cct ttt aga aaa caa aat cca ggc ata gtt    2448
Met Thr Lys Thr Leu Glu Pro Phe Arg Lys Gln Asn Pro Gly Ile Val
                805                 810                 815
atc tat caa tac atg gat gat ttg tat gta gga tct gac tta gag ata    2496
Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile
            820                 825                 830
ggg cag cat aga aca aaa ata gag gaa ctg aga caa cat ttg ttg agg    2544
Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg
        835                 840                 845
tgg gga ttt acc aca cca gac aag aaa cat tag aaa gaa cct cca ttt    2592
Trp Gly Phe Thr Thr Pro Asp Lys Lys His     Lys Glu Pro Pro Phe
    850                 855                 860
ctt tgg atg ggg tat gaa ctc cat cct gac aaa tgg aca gta cag cct    2640
Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro
865                 870                 875                 880
aca cag ctg cca gaa aaa gat agc tgg act gtc aat gat ata caa aag    2688
Thr Gln Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys
                885                 890                 895
tta gtg gga aaa tta aac tgg gca agt cag att tat cct gga att aaa    2736
Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys
            900                 905                 910
gta agg caa ctt tgt aaa ctc ctt agg ggg gcc aaa gca cta aca gac    2784
Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Ala Lys Ala Leu Thr Asp
        915                 920                 925
ata gta cca cta act gaa gaa gca gaa tta gaa ttg gca gaa aac agg    2832
Ile Val Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg
    930                 935                 940
gaa att cta aaa gaa cca gta cat gga gta tac tat gac cca tca aaa    2880
Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys
945                 950                 955                 960
gac ttg ata gct gaa ata cag aaa cag ggg cag gaa caa tgg aca tat    2928
Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Glu Gln Trp Thr Tyr
                965                 970                 975
caa att tac caa gaa cca ttc aaa aat cta aaa aca ggg aag tat gca    2976
Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala
            980                 985                 990
aaa atg agg act gcc cac act aat gat gta aaa caa tta aca gag gct    3024
Lys Met Arg Thr Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala
        995                1000                1005
gtg cag aaa ata gcc atg gaa ggc ata gta ata tgg gga aaa act cct    3072
Val Gln Lys Ile Ala Met Glu Gly Ile Val Ile Trp Gly Lys Thr Pro
   1010                1015                1020
aaa ttt aga tta ccc atc caa aaa gaa aca tgg gag aca tgg tgg aca    3120
Lys Phe Arg Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr
1025               1030                1035                1040
gac tat tgg caa gcc acc tgg att cct gag tgg gaa ttt gtt aat acc    3168
Asp Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr
               1045                1050                1055
cct ccc tta gta aaa tta tgg tac cag ctg gaa aaa gat ccc ata gta    3216
Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Asp Pro Ile Val
           1060                1065                1070
gga gta gaa act ttc tat gta gat gga gca gct aat agg gag act aaa    3264
Gly Val Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys
       1075                1080                1085
ata gga aaa gca ggg tat gtt act gac aga gga agg aag aaa att gtt    3312
Ile Gly Lys Ala Gly Tyr Val Thr Asp Arg Gly Arg Lys Lys Ile Val
   1090                1095                1100
tct cta act gaa aca aca aat cag aag act gaa ttg caa gca att tgt    3360
Ser Leu Thr Glu Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile Cys
1105               1110                1115                1120
ata gct ttg caa gat tca gga tca gaa gta aac ata gta aca gat tca    3408
Ile Ala Leu Gln Asp Ser Gly Ser Glu Val Asn Ile Val Thr Asp Ser
               1125                1130                1135
cag tat gca tta ggg atc att caa gca caa cca gat aag agt gaa tca    3456
Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Lys Ser Glu Ser
           1140                1145                1150
gag tta gtt aac caa ata ata gaa caa tta atg aaa aag gaa aga gtc    3504
Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Met Lys Lys Glu Arg Val
       1155                1160                1165
tac ctg tca tgg gta cca gca cat aaa gga att gga gga aat gaa caa    3552
Tyr Leu Ser Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln
   1170                1175                1180
gta gat aaa tta gta agt agt gga atc agg aaa gtg cta ttt cta gat    3600
Val Asp Lys Leu Val Ser Ser Gly Ile Arg Lys Val Leu Phe Leu Asp
1185               1190                1195                1200
gga ata gat aaa gct caa gaa gag cat gaa aag tat cac agc aat tgg    3648
Gly Ile Asp Lys Ala Gln Glu Glu His Glu Lys Tyr His Ser Asn Trp
               1205                1210                1215
aga gca atg gct agt gac ttt aat ctg cca ccc ata gta gca aaa gaa    3696
Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Ile Val Ala Lys Glu
           1220                1225                1230
ata gtg gct agc tgt gat caa tgt cag cta aaa gga gaa gcc atg cat    3744
Ile Val Ala Ser Cys Asp Gln Cys Gln Leu Lys Gly Glu Ala Met His
       1235                1240                1245
gga caa gta gac tgt agt cca ggg ata tgg caa tta gat tgt aca cat    3792
Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His
   1250                1255                1260
tta gaa gga aaa atc atc ctg gta gca gtc cat gta gcc agt ggc tac    3840
Leu Glu Gly Lys Ile Ile Leu Val Ala Val His Val Ala Ser Gly Tyr
1265               1270                1275                1280
atg gaa gca gag gtt atc cca gca gaa aca gga caa gag aca gca tac    3888
Met Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr
               1285                1290                1295
ttt ata cta aaa tta gca gga aga tgg cca gtc aaa gta ata cat aca    3936
Phe Ile Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Val Ile His Thr
           1300                1305                1310
gat aat ggt agt aat ttc acc agt act gca gtt aag gca gcc tgt tgg    3984
Asp Asn Gly Ser Asn Phe Thr Ser Thr Ala Val Lys Ala Ala Cys Trp
       1315                1320                1325
tgg gca ggt atc caa cag gaa ttt gga att ccc tac agt ccc caa agt    4032
Trp Ala Gly Ile Gln Gln Glu Phe Gly Ile Pro Tyr Ser Pro Gln Ser
   1330                1335                1340
cag gga gta gta gaa gcc atg aat aaa gaa tta aag aaa att ata ggg    4080
Gln Gly Val Val Glu Ala Met Asn Lys Glu Leu Lys Lys Ile Ile Gly
1345               1350                1355                1360
cag gta aga gat caa gct gag cac ctt aag aca gca gta cta atg gca    4128
Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Leu Met Ala
           1365                1370                1375
gta ttc att cac aat ttt aaa aga aaa ggg ggg att ggg ggg tac agt    4176
Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser
           1380                1385                1390
gca ggg gaa aga ata ata gat ata ata gca aca gac ata caa act aaa    4224
Ala Gly Glu Arg Ile Ile Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys
       1395                1400                1405
gaa tta caa aaa cag att aca aaa att caa aat ttt cgg gtt tat tac    4272
Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr
   1410                1415                1420
aga gac agc aga gac ccc agt tgg aaa gga cca gcc aaa cta ctc tgg    4320
Arg Asp Ser Arg Asp Pro Ser Trp Lys Gly Pro Ala Lys Leu Leu Trp
1425               1430                1435                1440
aaa ggt gaa ggg gca gta ata ata caa gat aat agt gac ata aag gta    4368
Lys Gly Glu Gly Ala Val Ile Ile Gln Asp Asn Ser Asp Ile Lys Val
               1445                1450                1455
gta cca agg agg aaa gca aaa atc att aag gac tat gga aaa cag atg    4416
Val Pro Arg Arg Lys Ala Lys Ile Ile Lys Asp Tyr Gly Lys Gln Met
           1460                1465                1470
gca ggt gct gat tgt gtg gca ggt aga cag gat gaa gat tag aac atg    4464
Ala Gly Ala Asp Cys Val Ala Gly Arg Gln Asp Glu Asp     Asn Met
       1475                1480                1485
gaa tag ttt agt aaa aca cca tat gta tgt ttc aag gag agc taa tgg    4512
Glu     Phe Ser Lys Thr Pro Tyr Val Cys Phe Lys Glu Ser     Trp
   1490                1495                1500
atg gtt tta cag aca tca tta tga cag cag aca tcc aaa agt aag ttc    4560
Met Val Leu Gln Thr Ser Leu     Gln Gln Thr Ser Lys Ser Lys Phe
1505                1510                1515                1520
aga agt aca cat ccc att agg aaa ggc taa att agt aat aaa aac ata    4608
Arg Ser Thr His Pro Ile Arg Lys Gly     Ile Ser Asn Lys Asn Ile
               15251                530                1535
ttg ggg gtt gca gac agg aga aag aga tcg gca ttt ggg tca tgg agt    4656
Leu Gly Val Ala Asp Arg Arg Lys Arg Ser Ala Phe Gly Ser Trp Ser
           1540                1545                1550
ctc cat aga atg gag att gag aag ata tac cac aca aat aga acc tgg    4704
Leu His Arg Met Glu Ile Glu Lys Ile Tyr His Thr Asn Arg Thr Trp
       1555                1560                1565
cct ggc aga cca gct aat tca ttt gta tta ttt tga ttg ttt tgc aga    4752
Pro Gly Arg Pro Ala Asn Ser Phe Val Leu Phe     Leu Phe Cys Arg
   1570                1575                1580
ctc tga tat aag gaa agc cat att agg aca cat agt tat tcc tag gtg    4800
Leu     Tyr Lys Glu Ser His Ile Arg Thr His Ser Tyr Ser     Val
1585               1590                1595                1600
tga cta tca agc agg aca taa taa taa ggt agg atc tct aca ata ctt    4848
    Leu Ser Ser Arg Thr             Gly Arg Ile Ser Thr Ile Leu
               1605                1610                1615
ggc act gac agc att gat aaa acc aaa aaa gat aaa gcc acc tct gcc    4896
Gly Thr Asp Ser Ile Asp Lys Thr Lys Lys Asp Lys Ala Thr Ser Ala
           1620                1625                1630
tag tat caa gaa att agt aga gga tag atg gaa caa tcc cca gga gat    4944
    Tyr Gln Glu Ile Ser Arg Gly     Met Glu Gln Ser Pro Gly Asp
       1635                1640                1645
cag ggg ccg cag agg gaa cca cac aat gaa tgg aca cta gag ctt cta    4992
Gln Gly Pro Gln Arg Glu Pro His Asn Glu Trp Thr Leu Glu Leu Leu
   1650                1655                1660
gag gag ctc aag cag gaa gct gtt aga cac ttt cct aga cca tgg ctt    5040
Glu Glu Leu Lys Gln Glu Ala Val Arg His Phe Pro Arg Pro Trp Leu
1665               1670                1675                1680
cat agc tta gga caa cat atc tat gaa aca tat ggg gat act tgg gca    5088
His Ser Leu Gly Gln His Ile Tyr Glu Thr Tyr Gly Asp Thr Trp Ala
               1685                1690                1695
gga gtg gaa gcc ata ata aga att ctg caa caa ctg ctg ttt att cat    5136
Gly Val Glu Ala Ile Ile Arg Ile Leu Gln Gln Leu Leu Phe Ile His
           1700                1705                1710
ttc aga att ggg tgt cag cat agc aga ata ggc att ttg aga cag aga    5184
Phe Arg Ile Gly Cys Gln His Ser Arg Ile Gly Ile Leu Arg Gln Arg
       1715                1720                1725
aga aca aga aat gga gcc agt aaa tca taa att aga gcc ttg gga gca    5232
Arg Thr Arg Asn Gly Ala Ser Lys Ser     Ile Arg Ala Leu Gly Ala
   1730                1735                1740
tcc agg aag tca gcc taa gac tgc ttg taa cag ttg cta ttg taa aaa    5280
Ser Arg Lys Ser Ala     Asp Cys Leu     Gln Leu Leu Leu     Lys
1745               1750                1755                1760
gtg ctg ctt tca ttg cca agt ttg ttt cac gaa aaa agg ctt agg cat    5328
Val Leu Leu Ser Leu Pro Ser Leu Phe His Glu Lys Arg Leu Arg His
               1765                1770                1775
ctt cta tgg cag gaa gaa gcg aag aca gcg acg aag cgc tca tcg aag    5376
Leu Leu Trp Gln Glu Glu Ala Lys Thr Ala Thr Lys Arg Ser Ser Lys
           1780                1785                1790
cag tga gga tca tca aaa tcc tat atc aaa gca gta agt agt aaa tgt    5424
Gln     Gly Ser Ser Lys Ser Tyr Ile Lys Ala Val Ser Ser Lys Cys
       1795                1800                1805
aat gca agc ttt aac cat ttt agc aat agt agc ctt agt agt agc aac    5472
Asn Ala Ser Phe Asn His Phe Ser Asn Ser Ser Leu Ser Ser Ser Asn
   1810                1815                1820
aat aat agc aat agt tgt gtg gac cat agt att cat aga ata tag gaa    5520
Asn Asn Ser Asn Ser Cys Val Asp His Ser Ile His Arg Ile     Glu
1825               1830                1835                1840
aat att aag aca gaa aaa aat aga cag gtt aat tga tag aat aag aga    5568
Asn Ile Lys Thr Glu Lys Asn Arg Gln Val Asn         Asn Lys Arg
               1845                1850                1855
aag agc aga aga cag tgg caa tga ggg tga cgg gga tca gga aga att    5616
Lys Ser Arg Arg Gln Trp Gln     Gly     Arg Gly Ser Gly Arg Ile
           1860                1865                1870
atc ggc att tat gga gat ggg gca cca tgc tcc ttg gga tgt tga tga    5664
Ile Gly Ile Tyr Gly Asp Gly Ala Pro Cys Ser Leu Gly Cys
       1875                1880                1885
tca gta gtg ctg tag gaa act tgt ggg tca cag tct att atg ggg tac    5712
Ser Val Val Leu     Glu Thr Cys Gly Ser Gln Ser Ile Met Gly Tyr
   1890                1895                1900
ctg tat gga aag ggg caa cca cca ctt tat ttt gtg cat cag atg cta    5760
Leu Tyr Gly Lys Gly Gln Pro Pro Leu Tyr Phe Val His Gln Met Leu
1905               1910                1915                1920
aag cat atg ata cag agg tac ata atg ttt ggg cta cac atg cct gtg    5808
Lys His Met Ile Gln Arg Tyr Ile Met Phe Gly Leu His Met Pro Val
               1925                1930                1935
tac ccg cag acc cca acc cac aag aaa tgg ttt tgg aaa atg taa cag    5856
Tyr Pro Gln Thr Pro Thr His Lys Lys Trp Phe Trp Lys Met     Gln
           1940                1945                1950
aaa att tta aca tgt gga aaa atg aaa tgg taa atc aga tgc agg aag    5904
Lys Ile Leu Thr Cys Gly Lys Met Lys Trp     Ile Arg Cys Arg Lys
       1955                1960                1965
atg taa tca gtt tat ggg atc aaa gcc taa aac cat gtg taa agt tga    5952
Met     Ser Val Tyr Gly Ile Lys Ala     Asn His Val     Ser
   1970                1975                1980
ccc cac tct gtg tca ctt tag aat gta gaa atg tta gca gta ata gta    6000
Pro His Ser Val Ser Leu     Asn Val Glu Met Leu Ala Val Ile Val
1985               1990                1995                2000
atg ata cct acc atg aga cct acc atg aga gca tga agg aaa tga aaa    6048
Met Ile Pro Thr Met Arg Pro Thr Met Arg Ala     Arg Lys     Lys
               2005                2010                2015
att gct ctt tca atg caa cca cag tag taa gag ata gga agc aga cag    6096
Ile Ala Leu Ser Met Gln Pro Gln         Glu Ile Gly Ser Arg Gln
           2020                2025                2030
tgt atg cac ttt ttt ata gac ttg ata tag tac cac tta cta aga aga    6144
Cys Met His Phe Phe Ile Asp Leu Ile     Tyr His Leu Leu Arg Arg
       2035                2040                2045
act ata gtg aga att cta gtg agt att ata gat taa taa att gta ata    6192
Thr Ile Val Arg Ile Leu Val Ser Ile Ile Asp         Ile Val Ile
   2050                2055                2060
cct cag cca taa cac aag cct gtc caa agg tca ctt ttg atc caa ttc    6240
Pro Gln Pro     His Lys Pro Val Gln Arg Ser Leu Leu Ile Gln Phe
2065               2070                2075                2080
cta tac act att gca ctc cag ctg gtt atg caa ttc taa agt gta atg    6288
Leu Tyr Thr Ile Ala Leu Gln Leu Val Met Gln Phe     Ser Val Met
               2085                2090                2095
ata aga tat tca atg gga cag gac cat gcc ata atg tta gca cag tac    6336
Ile Arg Tyr Ser Met Gly Gln Asp His Ala Ile Met Leu Ala Gln Tyr
           2100                2105                2110
aat gta cac atg gga tta agc cag tgg tat caa ctc aac tac tgt taa    6384
Asn Val His Met Gly Leu Ser Gln Trp Tyr Gln Leu Asn Tyr Cys
       2115                2120                2125
atg gta gcc tag cag aag gag aaa taa taa tta gat ctg aaa atc tga    6432
Met Val Ala     Gln Lys Glu Lys         Leu Asp Leu Lys Ile
   2130                2135                2140
caa aca atg tca aaa caa taa tag tac atc tta atc aat ctg tag aaa    6480
Gln Thr Met Ser Lys Gln         Tyr Ile Leu Ile Asn Leu     Lys
2145               2150                2155                2160
ttg tat gta caa gac ccg gca ata ata caa gaa aaa gta taa gga tag    6528
Leu Tyr Val Gln Asp Pro Ala Ile Ile Gln Glu Lys Val     Gly
               2165                2170                2175
gac cag gac aaa cat tct atg caa cag gag aca taa tag gag aca taa    6576
Asp Gln Asp Lys His Ser Met Gln Gln Glu Thr         Glu Thr
           2180                2185                2190
gac aag cac att gta aca tta gtg aag ata aat gga atg aaa ctt tac    6624
Asp Lys His Ile Val Thr Leu Val Lys Ile Asn Gly Met Lys Leu Tyr
       2195                2200                2205
aaa ggg taa gta aaa aat tag cag aac act tcc aga ata aaa caa taa    6672
Lys Gly     Val Lys Asn     Gln Asn Thr Ser Arg Ile Lys Gln
   2210                2215                2220
aat ttg cat cat cct cag gag ggg acc tag aag tta caa cac ata gct    6720
Asn Leu His His Pro Gln Glu Gly Thr     Lys Leu Gln His Ile Ala
2225               2230                2235                2240
tta att gta gag gag aat ttt tct att gta ata cat cag gcc tgt tta    6768
Leu Ile Val Glu Glu Asn Phe Ser Ile Val Ile His Gln Ala Cys Leu
               2245                2250                2255
atg gtg cat aca cgc cta atg gta caa aaa gta att caa gct caa tca    6816
Met Val His Thr Arg Leu Met Val Gln Lys Val Ile Gln Ala Gln Ser
           2260                2265                2270
tca caa tcc cat gca gaa taa agc aaa tta taa ata tgt ggc agg agg    6864
Ser Gln Ser His Ala Glu     Ser Lys Leu     Ile Cys Gly Arg Arg
       2275                2280                2285
tag gac gag caa tgt atg ccc ctc cca taa aag gaa aca taa cat gta    6912
Asp Glu Gln Cys Met Pro Leu Pro     Lys Glu Thr     His Val
2290               2295                2300
aat caa ata tca cag gac tac tat tgg tac gtg atg gag gaa cag agc    6960
Asn Gln Ile Ser Gln Asp Tyr Tyr Trp Tyr Val Met Glu Glu Gln Ser
2305               2310                2315                2320
caa atg ata cag aga cat tca gac ctg gag gag gag ata tga gga aca    7008
Gln Met Ile Gln Arg His Ser Asp Leu Glu Glu Glu Ile     Gly Thr
               2325                2330                2335
att gga gaa gtg aat tat ata aat ata aag tgg tag aaa tta agc cat    7056
Ile Gly Glu Val Asn Tyr Ile Asn Ile Lys Trp     Lys Leu Ser His
           2340                2345                2350
tgg gag tag cac cca cta caa caa aaa gga gag tgg tgg aga gag aaa    7104
Trp Glu     His Pro Leu Gln Gln Lys Gly Glu Trp Trp Arg Glu Lys
       2355                2360                2365
aaa gag cag tgg gaa tag gag ctg tgt tcc ttg ggt tct tag gag tag    7152
Lys Glu Gln Trp Glu     Glu Leu Cys Ser Leu Gly Ser     Glu
   2370                2375                2380
cag gaa gca cta tgg gcg cgg cgt caa taa cgc tga cgg tac agg cca    7200
Gln Glu Ala Leu Trp Ala Arg Arg Gln     Arg     Arg Tyr Arg Pro
2385               2390                2395                2400
gac aat tgc tgt ctg gta tag tgc aac agc aaa gca att tgc tga ggg    7248
Asp Asn Cys Cys Leu Val     Cys Asn Ser Lys Ala Ile Cys     Gly
               2405                2410                2415
cta tag aag cgc aac agc atc tgt tgc aac tca cgg tct ggg gca tta    7296
Leu     Lys Arg Asn Ser Ile Cys Cys Asn Ser Arg Ser Gly Ala Leu
           2420                2425                2430
agc agc tcc aga caa gag tcc tgg cta tag aaa gat acc taa agg atc    7344
Ser Ser Ser Arg Gln Glu Ser Trp Leu     Lys Asp Thr     Arg Ile
       2435                2440                2445
aac agc tcc tag gga ttt ggg gct gct ctg gaa aac tca tct gca cta    7392
Asn Ser Ser     Gly Phe Gly Ala Ala Leu Glu Asn Ser Ser Ala Leu
   2450                2455                2460
ctg ctg tac ctt gga act cca gtt gga gta aca aat ctc aaa aag aga    7440
Leu Leu Tyr Leu Gly Thr Pro Val Gly Val Thr Asn Leu Lys Lys Arg
2465               2470                2475                2480
ttt ggg ata aca tga cct gga tgc aat ggg ata aag aaa tta gta att    7488
Phe Gly Ile Thr     Pro Gly Cys Asn Gly Ile Lys Lys Leu Val Ile
                2485                2490                2495
aca caa aca cag tat aca ggt tgc ttg aag aat cgc aaa acc agc agg    7536
Thr Gln Thr Gln Tyr Thr Gly Cys Leu Lys Asn Arg Lys Thr Ser Arg
           2500                2505                2510
aaa gga atg aaa aag atc tat tag cat tgg aca gtt gga aaa atc tat    7584
Lys Gly Met Lys Lys Ile Tyr     His Trp Thr Val Gly Lys Ile Tyr
        2515                2520                2525
gga gtt ggt ttg aca taa caa att ggc tgt ggt ata taa aaa tat tca    7632
Gly Val Gly Leu Thr     Gln Ile Gly Cys Gly Ile     Lys Tyr Ser
   2530                2535                2540
taa taa tag tag gag gct tga tag gtt taa gaa taa ttt ttg ctg tgc    7680
                Glu Ala            Val      Glu      Phe Leu Leu Cys
2545               2550                2555                2560
tct cta tag taa ata gag tta ggc agg gat act cac ctt tgt cgt ttc    7728
Ser Leu             Ile Glu Leu Gly Arg Asp Thr His Leu Cys Arg Phe
                   2565                2570                2575
aga ccc tta ccc cga acc cag ggg gac ccg aca ggc tcg gaa gaa tcg    7776
Arg Pro Leu Pro Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser
           2580                2585                2590
aag aag aag gtg gaa agc aag aca ggg aca gat cca ttc gat tag tga    7824
Lys Lys Lys Val Glu Ser Lys Thr Gly Thr Asp Pro Phe Asp
       2595                2600                2605
acg gat tct tag cgc ttg cct ggg acg acc tgc gga acc tgt gcc tct    7872
Thr Asp Ser     Arg Leu Pro Gly Thr Thr Cys Gly Thr Cys Ala Ser
   2610                2615                2620
tca gct acc acc gat tga ggg act tca cat tag tgg cag cga ggg tgg    7920
Ser Ala Thr Thr Asp     Gly Thr Ser His     Trp Gln Arg Gly Trp
2625                2630                2635                2640
tgg aac ttc tgg gac gca ata gtc tca ggg gac tac aga gag ggt ggg    7968
Trp Asn Phe Trp Asp Ala Ile Val Ser Gly Asp Tyr Arg Glu Gly Gly
               2645                2650                2655
aag ccc tta aat atc tgg gaa gtc ttg tgc agt act ggg gtc agg agc    8016
Lys Pro Leu Asn Ile Trp Glu Val Leu Cys Ser Thr Gly Val Arg Ser
           2660                2665                2670
taa aaa aga gta cta tta gtc tgg ttg ata cca tag caa tag cag tag    8064
    Lys Arg Val Leu Leu Val Trp Leu Ile Pro     Gln     Gln
       2675                2680                2685
ctg aag gaa cag ata gga tta tag aat tag tac aag gac ttt gta gag    8112
Leu Lys Glu Gln Ile Gly Leu     Asn     Tyr Lys Asp Phe Val Glu
   2690                2695                2700
cta tct aca gca tac cta gaa gaa taa gac agg gct ttg aag cag ctt    8160
Leu Ser Thr Ala Tyr Leu Glu Glu     Asp Arg Ala Leu Lys Gln Leu
2705                2710                2715                2720
tgc aat aaa atg ggg ggc aag tgg tcg aaa agt agc ata gtt gga tgg    8208
Cys Asn Lys Met Gly Gly Lys Trp Ser Lys Ser Ser Ile Val Gly Trp
               2725                2730                2735
cct gct ata agg gag aga atg aga aga act gag cca gca gca gat ggg    8256
Pro Ala Ile Arg Glu Arg Met Arg Arg Thr Glu Pro Ala Ala Asp Gly
           2740                2745                2750
gtg gga gca gta tct cga gac ctg gaa aaa cat gga gca atc acg agt    8304
Val Gly Ala Val Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser
       2755                2760                2765
agc aat aca gca gct act aat gag gat tgt gcc tgg ctg gaa gca caa    8352
Ser Asn Thr Ala Ala Thr Asn Glu Asp Cys Ala Trp Leu Glu Ala Gln
   2770                2775                2780
gag gag ggg gag gtg ggt ttt cca gtc aga cct cag gta cct tta aga    8400
Glu Glu Gly Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro Leu Arg
2785               2790                2795                2800
cca atg act tac aag gga gct gta gat ctt agc ttc ttt tta aaa gaa    8448
Pro Met Thr Tyr Lys Gly Ala Val Asp Leu Ser Phe Phe Leu Lys Glu
               2805                2810                2815
aag ggg gga ctg gaa ggg tta att tac tct aag aaa agg caa gag atc    8496
Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Lys Lys Arg Gln Glu Ile
           2820                2825                2830
ctt gat ttg tgg gtc tat cac aca caa ggc tac ttc cct gat tgg cac    8544
Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp His
       2835                2840                2845
aac tac aca cca gga cca ggg gtc aga ttc cca ctg act ttt ggg tgg    8592
Asn Tyr Thr Pro Gly Pro Gly Val Arg Phe Pro Leu Thr Phe Gly Trp
   2850                2855                2860
tgc ttc aag cta gta cca gtt gac cca agg gaa gta gaa gag gcc aac    8640
Cys Phe Lys Leu Val Pro Val Asp Pro Arg Glu Val Glu Glu Ala Asn
2865                2870                2875                2880
gag gga gaa gac aac tgc ttg cta cac cct gtg tgc cag cat gga atg    8688
Glu Gly Glu Asp Asn Cys Leu Leu His Pro Val Cys Gln His Gly Met
               2885                2890                2895
gag gat gat cac aga gaa gta tta aag tgg aag ttt gac agt caa cta    8736
Glu Asp Asp His Arg Glu Val Leu Lys Trp Lys Phe Asp Ser Gln Leu
           2900                2905                2910
gca cac aga cac agg gcc cgc gaa cta cat ccg gag ttt tac aaa gac    8784
Ala His Arg His Arg Ala Arg Glu Leu His Pro Glu Phe Tyr Lys Asp
        2915                2920                2925
tgc tga cac aga agg gac ttt ccg cgg gga ctt tcc act ggg gcg ttc    8832
Cys     His Arg Arg Asp Phe Pro Arg Gly Leu Ser Thr Gly Ala Phe
   2930                2935                2940
tag gag gtg tgg tct ggc ggg act ggg agt ggt caa ccc tca aat gct    8880
    Glu Val Trp Ser Gly Gly Thr Gly Ser Gly Gln Pro Ser Asn Ala
2945               2950                2955                2960
gca tat aag cag ctg ctt ttc gcc tgt act ggg tct ctc tag tca gac    8928
Ala Tyr Lys Gln Leu Leu Phe Ala Cys Thr Gly Ser Leu     Ser Asp
               2965                2970                2975
cag atc tga gcc tgg gag ctc tct ggc taa cta ggg aac cca ctg ctt    8976
Gln Ile     Ala Trp Glu Leu Ser Gly     Leu Gly Asn Pro Leu Leu
           2980                2985                2990
aag cct caa taa agc ttg cct tga ggg gct aga gcg gcc gcc acc gcg    9024
Lys Pro Gln     Ser Leu Pro     Gly Ala Arg Ala Ala Ala Thr Ala
       2995                3000                3005
gtg gag ctc cag ctt ttg ttc cct tta gtg agg gtt aat tgc gcg ctg    9072
Val Glu Leu Gln Leu Leu Phe Pro Leu Val Arg Val Asn Cys Ala Leu
   3010                3015                3020
gcg atc                                                            9078
Ala Ile
<210>27
<211>37
<212>PRT
<213>Human immunodeficiency virus
<400>27
Gln Trp Arg Pro Asn Arg Asp Leu Lys Ala Lys Val Arg Pro Glu Glu
  1              5                   10                  15
Ile Ser Arg Arg Arg Thr Arg Leu Ala Glu Val His Ser Ala Arg Gly
                     20                  25                  30
Glu Ser Gly Asp Trp
         35
<210>28
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>28
Val Arg Gln Leu Tyr Leu Thr Ser Gly Gly
  1              5                  10
<210>29
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>29
Lys Glu Arg Asp Gly Cys Glu Ser Val Asn Ile Lys Arg Gly Lys Ile
  1               5                  10                  15
Arg
<210>30
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>30
Met Gly Lys Asn
  1
<210>31
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>3l
Val  Lys Ala Arg Gly Lys Glu Thr Leu Tyr Ala Lys Thr Pro Ser Met
  1                5                  10                  15
Gly Lys Gln Gly Ala Gly Lys Ile Cys Thr
             20                  25
<210>32
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>32
Pro Trp Pro Phe Arg Asp Ile Arg Arg Leu
  1               5                  10
<210>33
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>33
Thr Asn Asn Glu Thr Ala Thr Ile Ser Ser Ser Asp Arg Asn Arg Gly
  1               5                  10                  15
Thr
<210>34
<211>45
<212>PRT
<213>Human immunodeficiency virus
<400>34
Ile Ile Ile Gln His Ser Ser Asn Ser Leu Leu Cys Thr Tyr Arg Asp
  1               5                  10                  15
Arg Cys Thr Arg His Gln Arg Ser Leu Arg Gln Asp Arg Gly Arg Thr
             20                  25                  30
Lys Gln Asn Ser Ala Lys Asn Thr Ala Gly Lys Gly Gly
         35                  40                  45
<210>35
<211>24
<212>PRT
<213>Human immunodeficiency virus
<400>35
Arg Glu Gly Gln Ser Lys  Leu Ser Tyr Ser Thr Glu Ser Pro Arg Ala
  1               5                  10                  15
Asn Gly Thr Ser Ala His Ile Thr
             20
<210>36
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>36
Asn Phe Lys Cys Met Gly Lys Ser Gly Arg Arg Glu Gly Phe
  1               5                  10
<210>37
<211>41
<212>PRT
<213>Human immunodeficiency virus
<400>37
Pro Arg Ser Asn Thr His Val Phe Ser Val Ile Arg Arg Ser His Pro
  1               5                  10                  15
Thr Arg Phe Lys His His Ala Lys His Ser Gly Gly Thr Ser Ser Ser
             20                  25                  30
Tyr Ala Asn Ile Lys Arg Tyr His Gln
         35                  40
<210>38
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>38
Arg Gly Cys Arg Met Gly
  1               5
<210>39
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>39
Ile Thr Ser Ser Thr Cys Arg Ala Tyr Cys Thr Arg Pro Asn Glu Arg
  1               5                  10                  15
Thr Lys Gly Lys
             20
<210>40
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>40
His Ser Arg Asn Tyr
  1               5
<210>41
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>41
Pro Thr Gly Thr Asn Ser Met Asp Asp Glu
  1               5                  10
<210>42
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>42
Pro Thr Cys Ser Ser Arg Arg His Leu
  1               5
<210>43
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>43
Lys Met Asp Asn Ser Gly Ile Lys
  1               5
<210>44
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>44
Asn Ser Lys Asn Val
  1               5
<210>45
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>45
Pro Tyr Gln His Ser Gly His Lys Thr Arg Ala Lys Gly Thr Leu
  1               5                  10                  15
<210>46
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>46
Arg Leu Cys Arg Pro Val Leu
  1               5
<210>47
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>47
Asn Phe Lys Ser Gly Thr Ser Tyr Ala Arg Cys Lys Lys Leu Asp Asp
  1               5                  10                  15
Arg His Leu Val Gly Pro Lys Cys Glu Pro Arg Leu
             20                  25
<210>48
<211>25
<212>PRT
<213>Human immunodeficiency virus
<400>48
Asp His Phe Lys Ser Ile Arg Thr Arg Gly Phe Asn Arg Arg Asn Asp
  1              5                   10                  15
Asp Ser Met Ser Gly Ser Gly Arg Thr
             20                  25
<210>49
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>49
Ser Lys Ser Val Gly Arg Gly Asn Glu Pro Asn Lys Gln Cys His Thr
  1               5                  10                  15
Asp Ala Glu Lys Gln Phe
             20
<210>50
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>50
Met Phe Gln Leu Trp Gln Gly Arg Ala His Ser Gln Lys Leu Gln Gly
  1               5                  10                  15
Pro
<210>51
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>51
Glu Lys Gly Leu Leu Glu Met Trp Lys Arg Arg Thr Pro Asn Glu Arg
  1               5                  10                  15
Leu Tyr
<210>52
<211>380
<212>PRT
<213>Human immunodeficiency virus
<400>52
Glu Thr Gly Gln Phe Phe Arg Glu Asn Leu Ala Leu Pro Gln Gly Arg
  1               5                  10                  15
Ala Arg Glu Phe Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg
             20                  25                  30
Gly Glu Leu Gln Val Trp Gly Arg Asp Asn Asn Ser Ile Ser Glu Ala
         35                  40                  45
Gly Ala Asn Arg Gln Gly Thr Ile Ser Phe Asn Phe Pro Gln Ile Thr
     50                  55                  60
Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys
 65                  70                  75                  80
Glu Ala Leu Leu Asp Thr Gly Ala Gly Asp Thr Val Leu Glu Asp Leu
                 85                  90                  95
Asn Leu Pro Gly Lys Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly
            100                 105                 110
Phe Ile Lys Val Arg Gln Tyr Glu Gln Ile Pro Ile Glu Ile Cys Gly
        115                 120                 125
His Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile
    130                 135                 140
Ile Gly Arg Asn Leu Leu Thr Gln Leu Gly Cys Thr Leu Asn Phe Pro
145                 150                 155                 160
Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp
                165                 170                 175
Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala
            180                 185                 190
Leu Thr Ala Ile Cys Asp Glu Met Glu Lys Glu Gly Lys Ile Thr Lys
        195                 200                 205
Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Ile Phe Ala Ile Lys Lys
    210                 215                 220
Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn
225                 230                 235                 240
Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro
                245                 250                 255
Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp
            260                 265                 270
Ala Tyr Phe Ser Ile Pro Leu Tyr Glu Asp Phe Arg Lys Tyr Thr Ala
        275                 280                 285
Phe Thr Ile Pro Ser Arg Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln
    290                 295                 300
Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Leu Ala Ile Phe Gln
305                 310                 315                 320
Ser Ser Met Thr Lys Thr Leu Glu Pro Phe Arg Lys Gln Asn Pro Gly
                325                 330                 335
Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu
            340                 345                 350
Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu
        355                 360                 365
Leu Arg Trp Gly Phe Thr Thr Pro Asp Lys Lys His
    370                 375                 380
<210>53
<211>626
<212>PRT
<213>Human immunodeficiency virus
<400>53
Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys
  1               5                  10                  15
Trp Thr Val Gln Pro Thr Gln Leu Pro Glu Lys Asp Ser Trp Thr Val
             20                  25                  30
Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile
         35                  40                  45
Tyr Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Ala
     50                  55                  60
Lys Ala Leu Thr Asp Ile Val Pro Leu Thr Glu Glu Ala Glu Leu Glu
 65                  70                  75                  80
Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr
                 85                  90                  95
Tyr Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln
            100                 105                 110
Glu Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys
        115                 120                 125
Thr Gly Lys Tyr Ala Lys Met Arg Thr Ala His Thr Asn Asp Val Lys
    130                 135                 140
Gln Leu Thr Glu Ala Val Gln Lys Ile Ala Met Glu Gly Ile Val Ile
145                 150                 155                 160
Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Ile Gln Lys Glu Thr Trp
                165                 170                 175
Glu Thr Trp Trp Thr Asp Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp
            180                 185                 190
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu
        195                 200                 205
Lys Asp Pro Ile Val Gly Val Glu Thr Phe Tyr Val Asp Gly Ala Ala
    210                 215                 220
Asn Arg Glu Thr Lys Ile Gly Lys Ala Gly Tyr Val Thr Asp Arg Gly
225                 230                 235                 240
Arg Lys Lys Ile Val Ser Leu Thr Glu Thr Thr Asn Gln Lys Thr Glu
                245                 250                 255
Leu Gln Ala Ile Cys Ile Ala Leu Gln Asp Ser Gly Ser Glu Val Asn
            260                 265                 270
Ile Val Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro
        275                 280                 285
Asp Lys Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Met
    290                 295                 300
Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly Ile
305                 310                 315                 320
Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly Ile Arg Lys
                325                 330                 335
Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln Glu Glu His Glu Lys
            340                 345                 350
Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro
        355                 360                 365
Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp Gln Cys Gln Leu Lys
    370                 375                 380
Gly Glu Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln
385                 390                 395                 400
Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile Leu Val Ala Val His
                405                 410                 415
Val Ala Ser Gly Tyr Met Glu Ala Glu Val Ile Pro Ala Glu Thr Gly
            420                 425                 430
Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly Arg Trp Pro Val
        435                 440                 445
Lys Val Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser Thr Ala Val
    450                 455                 460
Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln Glu Phe Gly Ile Pro
465                 470                 475                 480
Tyr Ser Pro Gln Ser Gln Gly Val Val Glu Ala Met Asn Lys Glu Leu
                485                 490                 495
Lys Lys Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr
            500                 505                 510
Ala Val Leu Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly
        515                 520                 525
Ile Gly Gly Tyr Ser Ala Gly Glu Arg Ile Ile Asp Ile Ile Ala Thr
    530                 535                 540
Asp Ile Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn
545                 550                 555                 560
Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro Ser Trp Lys Gly Pro
                565                 570                 575
Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Ile Ile Gln Asp Asn
            580                 585                 590
Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Lys Asp
        595                 600                 605
Tyr Gly Lys Gln Met Ala Gly Ala Asp Cys Val Ala Gly Arg Gln Asp
    610                 615                 620
Glu Asp
625
<210>54
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>54
Phe Ser Lys Thr Pro Tyr Val Cys Phe Lys Glu Ser
  1               5                  10
<210>55
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>55
Trp Met Val Leu Gln Thr Ser Leu
  1               5
<210>56
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>56
Gln Gln Thr Ser Lys Ser Lys Phe Arg Ser Thr His Pro Ile Arg Lys
  1               5                  10                  15
Gly
<210>57
<211>49
<212>PRT
<213>Human immunodeficiency virus
<400>57
Ile Ser Asn Lys Asn Ile Leu Gly Val Ala Asp Arg Arg Lys Arg Ser
  1               5                  10                  15
Ala Phe Gly Ser Trp Ser Leu His Arg Met Glu Ile Glu Lys Ile Tyr
             20                  25                  30
His Thr Asn Arg Thr Trp Pro Gly Arg Pro Ala Asn Ser Phe Val Leu
         35                  40                  45
Phe
<210>58
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>58
Leu Phe Cys Arg Leu
  1               5
<210>59
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>59
Tyr Lys Glu Ser His Ile Arg Thr His Ser Tyr Ser
  1               5                  10
<210>60
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>60
Leu Ser Ser Arg Thr
  1               5
<210>61
<211>23
<212>PRT
<213>Human immunodeficiency virus
<400>61
Gly Arg Ile Ser Thr Ile Leu Gly Thr Asp Ser Ile Asp Lys Thr Lys
  1               5                  10                  15
Lys Asp Lys Ala Thr Ser Ala
             20
<210>62
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>62
Tyr Gln Glu Ile Ser Arg Gly
  1               5
<210>63
<211>96
<212>PRT
<213>Human immunodeficiency virus
<400>63
Met Glu Gln Ser Pro Gly Asp Gln Gly Pro Gln Arg Glu Pro His Asn
  1               5                  10                  15
Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Gln Glu Ala Val Arg
             20                  25                  30
His Phe Pro Arg Pro Trp Leu His Ser Leu Gly Gln His Ile Tyr Glu
         35                  40                  45
Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu
     50                  55                  60
Gln Gln Leu Leu Phe Ile His Phe Arg Ile Gly Cys Gln His Ser Arg
 65                  70                  75                  80
Ile Gly Ile Leu Arg Gln Arg Arg Thr Arg Asn Gly Ala Ser Lys Ser
                 85                  90                  95
<210>64
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>64
Ile Arg Ala Leu Gly Ala Ser Arg Lys Ser Ala
  1               5                  10
<210>65
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>65
Gln Leu Leu Leu
  1
<210>66
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>66
Lys Val Leu Leu Ser Leu Pro Ser Leu Phe His Glu Lys Arg Leu Arg
  1               5                  10                  15
His Leu Leu Trp Gln Glu Glu Ala Lys Thr Ala Thr Lys Arg Ser Ser
             20                  25                  30
Lys Gln
<210>67
<211>44
<212>PRT
<213>Human immunodeficiency virus
<400>67
Gly Ser Ser Lys Ser Tyr Ile Lys Ala Val Ser Ser Lys Cys Asn Ala
  1               5                  10                  15
Ser Phe Asn His Phe Ser Asn Ser Ser Leu Ser Ser Ser Asn Asn Asn
             20                  25                  30
Ser Asn Ser Cys Val Asp His Ser Ile His Arg Ile
         35                  40
<210>68
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>68
Glu Asn Ile Lys Thr Glu Lys Asn Arg Gln Val Asn
  1               5                  10
<210>69
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>69
Asn Lys Arg Lys Ser Arg Arg Gln Trp Gln
  1               5                  10
<210>70
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>70
Arg Gly Ser Gly Arg Ile Ile Gly Ile Tyr Gly Asp Gly Ala Pro Cys
  1               5                  10                  15
Ser Leu Gly Cys
             20
<210>71
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>71
Ser Val Val Leu
  1
<210>72
<211>57
<212>PRT
<213>Human immunodeficiency virus
<400>72
Glu Thr Cys Gly Ser Gln Ser Ile Met Gly Tyr Leu Tyr Gly Lys Gly
  1               5                  10                  15
Gln Pro Pro Leu Tyr Phe Val His Gln Met Leu Lys His Met Ile Gln
             20                  25                  30
Arg Tyr Ile Met Phe Gly Leu His Met Pro Val Tyr Pro Gln Thr Pro
         35                  40                  45
Thr His Lys Lys Trp Phe Trp Lys Met
     50                  55
<210>73
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>73
Gln Lys Ile Leu Thr Cys Gly Lys Met Lys Trp
  1               5                  10
<210>74
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>74
Ile Arg Cys Arg Lys Met
  1               5
<210>75
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>75
Ser Val Tyr Gly Ile Lys Ala
  1               5
<210>76
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>76
Pro His Ser Val Ser Leu
  1               5
<210>77
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>77
Asn Val Glu Met Leu Ala Val Ile Val Met Ile Pro Thr Met Arg Pro
  1               5                  10                  15
Thr Met Arg Ala
             20
<210>78
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>78
Lys Ile Ala Leu Ser Met Gln Pro Gln
  1               5
<210>79
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>79
Glu Ile Gly Ser Arg Gln Cys Met His Phe Phe Ile Asp Leu Ile
  1               5                  10                  15
<210>80
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>80
Tyr His Leu Leu Arg Arg Thr Ile Val Arg Ile Leu Val Ser Ile Ile
  1               5                  10                  15
Asp
<210>81
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>81
Ile Val Ile Pro Gln Pro
  1               5
<210>82
<211>24
<212>PRT
<213>Human immunodeficiency virus
<400>82
His Lys Pro Val Gln Arg Ser Leu Leu Ile Gln Phe Leu Tyr Thr Ile
  1               5                  10                  15
Ala Leu Gln Leu Val Met Gln Phe
             20
<210>83
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>83
Ser Val Met Ile Arg Tyr Ser Met Gly Gln Asp His Ala Ile Met Leu
  1               5                  10                  15
Ala Gln Tyr Asn Val His Met Gly Leu Ser Gln Trp Tyr Gln Leu Asn
             20                  25                  30
Tyr Cys
<210>84
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>84
Gln Lys Glu Lys
  1
<210>85
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>85
Leu Asp Leu Lys Ile
  1               5
<210>86
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>86
Gln Thr Met Ser Lys Gln
  1               5
<210>87
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>87
Tyr Ile Leu Ile Asn Leu
  1               5
<210>88
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>88
Lys Leu Tyr Val Gln Asp Pro Ala Ile Ile Gln Glu Lys Val
  1               5                  10
<210>89
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>89
Asp Gln Asp Lys His Ser Met Gln Gln Glu Thr
  1               5                  10
<210>90
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>90
Asp Lys His Ile Val Thr Leu Val Lys Ile Asn Gly Met Lys Leu Tyr
  1               5                  10                  15
Lys Gly
<210>91
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>91
Gln Asn Thr Ser Arg Ile Lys Gln
  1               5
<210>92
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>92
Asn Leu His His Pro Gln Glu Gly Thr
  1               5
<210>93
<211>44
<212>PRT
<213>Human immunodeficiency virus
<400>93
Lys Leu Gln His Ile Ala Leu Ile Val Glu Glu Asn Phe Ser Ile Val
  1               5                  10                  15
Ile His Gln Ala Cys Leu Met Val His Thr Arg Leu Met Val Gln Lys
             20                  25                  30
Val Ile Gln Ala Gln Ser Ser Gln Ser His Ala Glu
         35                  40
<210>94
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>94
Ile Cys Gly Arg Arg
  1               5
<210>95
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>95
Asp Glu Gln Cys Met Pro Leu Pro
  1               5
<210>96
<211>31
<212>PRT
<213>Human immunodeficiency virus
<400>96
His Val Asn Gln Ile Ser Gln Asp Tyr Tyr Trp Tyr Val Met Glu Glu
  1               5                  10                  15
Gln Ser Gln Met Ile Gln Arg His Ser Asp Leu Glu Glu Glu Ile
             20                  25                  30
<210>97
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>97
Gly Thr Ile Gly Glu Val Asn Tyr Ile Asn Ile Lys Trp
  1               5                  10
<210>98
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>98
Lys Leu Ser His Trp Glu
  1               5
<210>99
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>99
His Pro Leu Gln Gln Lys Gly Glu Trp Trp Arg Glu Lys Lys Glu Gln
  1               5                  10                  15
Trp Glu
<210>100
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>100
Glu Leu Cys Ser Leu Gly Ser
  1               5
<210>101
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>101
Gln Glu Ala Leu Trp Ala Arg Arg Gln
  1               5
<210>102
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>102
Arg Tyr Arg Pro Asp Asn Cys Cys Leu Val
  1               5                  10
<210>103
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>103
Cys Asn Ser Lys Ala Ile Cys
  1               5
<210>104
<211>23
<212>PRT
<213>Human immunodeficiency virus
<400>104
Lys Arg Asn Ser Ile Cys Cys Asn Ser Arg Ser Gly Ala Leu Ser Ser
  1               5                  10                  15
Ser Arg Gln Glu Ser Trp Leu
             20
<210>105
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>105
Arg Ile Asn Ser Ser
  1               5
<210>106
<211>32
<212>PRT
<213>Human immunodeficiency virus
<400>106
Gly Phe Gly Ala Ala Leu Glu Asn Ser Ser Ala Leu Leu Leu Tyr Leu
  1               5                  10                  15
Gly Thr Pro Val Gly Val Thr Asn Leu Lys Lys Arg Phe Gly Ile Thr
             20                  25                  30
<210>107
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>107
Pro Gly Cys Asn Gly Ile Lys Lys Leu Val Ile Thr Gln Thr Gln Tyr
  1               5                  10                  15
Thr Gly Cys Leu Lys Asn Arg Lys Thr Ser Arg Lys Gly Met Lys Lys
             20                  25                  30
Ile Tyr
<210>108
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>108
His Trp Thr Val Gly Lys Ile Tyr Gly Val Gly Leu Thr
  1               5                  10
<210>109
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>109
Gln Ile Gly Cys Gly Ile
  1               5
<210>110
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>110
Phe Leu Leu Cys Ser Leu
  1               5
<210>111
<211>42
<212>PRT
<213>Human immunodeficiency virus
<400>111
Ile Glu Leu Gly Arg Asp Thr His Leu Cys Arg Phe Arg Pro Leu Pro
  1               5                  10                  15
Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser Lys Lys Lys Val
             20                  25                  30
Glu Ser Lys Thr Gly Thr Asp Pro Phe Asp
         35                  40
<210>112
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>112
Arg Leu Pro Gly Thr Thr Cys Gly Thr Cys Ala Ser Ser Ala Thr Thr
  1               5                  10                  15
Asp
<210>113
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>113
Gly Thr Ser His
  1
<210>114
<211>37
<212>PRT
<213>Human immunodeficiency virus
<400>114
Trp Gln Arg Gly Trp Trp Asn Phe Trp Asp Ala Ile Val Ser Gly Asp
  1               5                  10                  15
Tyr Arg Glu Gly Gly Lys Pro Leu Asn Ile Trp Glu Val Leu Cys Ser
             20                  25                  30
Thr Gly Val Arg Ser
         35
<210>115
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>115
Lys Arg Val Leu Leu Val Trp Leu Ile Pro
  1               5                  10
<210>116
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>116
Leu Lys Glu Gln Ile Gly Leu
  1               5
<210>117
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>117
Tyr Lys Asp Phe Val Glu Leu Ser Thr Ala Tyr Leu Glu Glu
  1               5                  10
<210>118
<211>216
<212>PRT
<213>Human immunodeficiency virus
<400>118
Asp Arg Ala Leu Lys Gln Leu Cys Asn Lys Met Gly Gly Lys Trp Ser
  1               5                  10                  15
Lys Ser Ser Ile Val Gly Trp Pro Ala Ile Arg Glu Arg Met Arg Arg
             20                  25                  30
Thr Glu Pro Ala Ala Asp Gly Val Gly Ala Val Ser Arg Asp Leu Glu
         35                  40                  45
Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Ala Thr Asn Glu Asp
     50                  55                  60
Cys Ala Trp Leu Glu Ala Gln Glu Glu Gly Glu Val Gly Phe Pro Val
65                  70                  75                  80
Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Val Asp
                 85                  90                  95
Leu Ser Phe Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr
            100                 105                 110
Ser Lys Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln
        115                 120                 125
Gly Tyr Phe Pro Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Val Arg
    130                 135                 140
Phe Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Asp Pro
145                 150                 155                 160
Arg Glu Val Glu Glu Ala Asn Glu Gly Glu Asp Asn Cys Leu Leu His
                165                 170                 175
Pro Val Cys Gln His Gly Met Glu Asp Asp His Arg Glu Val Leu Lys
            180                 185                 190
Trp Lys Phe Asp Ser Gln Leu Ala His Arg His Arg Ala Arg Glu Leu
        195                 200                 205
His Pro Glu Phe Tyr Lys Asp Cys
    210                 215
<210>119
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>119
His Arg Arg Asp Phe Pro Arg Gly Leu Ser Thr Gly Ala Phe
  1               5                  10
<210>120
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>120
Glu Val Trp Ser Gly Gly Thr Gly Ser Gly Gln Pro Ser Asn Ala Ala
  1               5                  10                  15
Tyr Lys Gln Leu Leu Phe Ala Cys Thr Gly Ser Leu
             20                  25
<210>121
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>121
Ser Asp Gln Ile
  1
<210>122
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>122
Ala Trp Glu Leu Ser Gly
  1               5
<210>123
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>123
Leu Gly Asn Pro Leu Leu Lys Pro Gln
  1               5
<210>124
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>124
Gly Ala Arg Ala Ala Ala Thr Ala Val Glu Leu Gln Leu Leu Phe Pro
  1               5                  10                  15
Leu Val Arg Val Asn Cys Ala Leu Ala Ile
             20                  25
<210>125
<211>9078
<212>DNA
<213>Human immunodeficiency virus
<220>
<221>CDS
<222>(2)..(9076)
<400>125
a atc tct agc agt ggc gcc cga aca ggg act tga aag cga aag taa gac  49
  Ile Ser Ser Ser Gly Ala Arg Thr Gly Thr     Lys Arg Lys     Asp
    1               5                  10                  15
cag agg aga tct ctc gac gca gga ctc ggc ttg ctg aag tgc act cgg    97
Gln Arg Arg Ser Leu Asp Ala Gly Leu Gly Leu Leu Lys Cys Thr Arg
             20                  25                  30
caa gag gcg aga gcg gcg act ggt gag tac gcc aat tat att tga cta    145
Gln Glu Ala Arg Ala Ala Thr Gly Glu Tyr Ala Asn Tyr Ile     Leu
         35                  40                  45
gcg gag gct aga agg aga gag atg ggt gcg aga gcg tca ata tta aga    193
Ala Glu Ala Arg Arg Arg Glu Met Gly Ala Arg Ala Ser Ile Leu Arg
     50                  55                  60
ggg gga aaa tta gat aaa tgg gaa aaa att agg tta agg cca ggg gga    241
Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly
 65                  70                  75                  80
aag aaa cac tat atg cta aaa cac cta gta tgg gca agc agg gag ctg    289
Lys Lys His Tyr Met Leu Lys His Leu Val Trp Ala Ser Arg Glu Leu
                 85                  90                  95
gaa aga ttt gca ctt aac cct ggc ctt tta gag aca tca gaa ggc tgt    337
Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys
            100                 105                 110
aaa caa ata atg aaa cag cta caa tca gct ctt cag aca gga aca gag    385
Lys Gln Ile Met Lys Gln Leu Gln Ser Ala Leu Gln Thr Gly Thr Glu
        115                 120                 125
gaa ctt aga tca tta ttc aac aca gta gca act ccc tat tgt gta cat    433
Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Pro Tyr Cys Val His
    130                 135                 140
aca gag ata gat gta cga gac acc aga gaa gcc tta gac aag ata gag    481
Thr Glu Ile Asp Val Arg Asp Thr Arg Glu Ala Leu Asp Lys Ile Glu
145                 150                 155                 160
gaa gaa caa aac aaa att cag caa aaa aca cag cag gca aag gag gct    529
Glu Glu Gln Asn Lys Ile Gln Gln Lys Thr Gln Gln Ala Lys Glu Ala
                165                 170                 175
gac ggg aag gtc agt caa aat tat cct ata gta cag aat ctc caa ggg    577
Asp Gly Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly
            180                 185                 190
caa atg gta cat cag ccc ata tca cct aga act tta aat gca tgg gta    625
Gln Met Val His Gln Pro Ile Ser Pro Arg Thr Leu Asn Ala Trp Val
        195                 200                 205
aaa gtg gta gaa gag aag gct ttt agc cca gaa gta ata ccc atg ttt    673
Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe
    210                 215                 220
tca gcg tta tca gaa gga gcc acc cca caa gat tta aac acc atg cta    721
Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu
225                 230                 235                 240
aac aca gtg ggg gga cat caa gca gct atg caa ata tta aaa gat acc    769
Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Ile Leu Lys Asp Thr
                245                 250                 255
atc aat gaa gag gct gca gaa tgg gat aga tta cat cca gta cat gca    817
Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala
            260                 265                 270
ggg cct att gca cca ggc caa atg aga gaa cca agg gga agt gac ata    865
Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile
        275                 280                 285
gca gga act act agt aac cta cag gaa caa ata gca tgg atg acg agt    913
Ala Gly Thr Thr Ser Asn Leu Gln Glu Gln Ile Ala Trp Met Thr Ser
    290                 295                 300
aac cca cct gtt cca gta gga gac atc tat aaa aga tgg ata att ctg    961
Asn Pro Pro Val Pro Val Gly Asp Ile Tyr Lys Arg Trp Ile Ile Leu
305                 310                 315                 320
gga tta aat aaa ata gta aga atg tat agc cct acc agc att ctg gac    1009
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp
                325                 330                 335
ata aaa caa ggg cca aag gaa ccc ttt aga gac tat gta gac cgg ttc    1057
Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe
            340                 345                 350
ttt aaa act tta aga gcg gaa caa gct acg caa ggt gta aaa aat tgg    1105
Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Gly Val Lys Asn Trp
        355                 360                 365
atg aca gac acc ttg ttg gtc caa aat gcg aac cca gat tgt aag acc    1153
Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr
    370                 375                 380
att tta aga gca tta gga cca ggg gct tca ata gaa gaa atg atg aca    1201
Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Ile Glu Glu Met Met Thr
385                 390                 395                 400
gca tgt cag gga gtg gga gga cct agc cat aaa gca aaa gtg ttg gcc    1249
Ala Cys Gln Gly Val Gly Gly Pro Ser His Lys Ala Lys Val Leu Ala
                405                 410                 415
gag gca atg agc caa aca aac agt gcc ata ctg atg cag aga agc aat    1297
Glu Ala Met Ser Gln Thr Asn Ser Ala Ile Leu Met Gln Arg Ser Asn
            420                 425                 430
ttt aaa ggc tct aaa aga att gtt aaa tgt ttc aac tgt ggc aag gaa    1345
Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys Glu
        435                 440                 445
ggg cac ata gcc aga aat tgc agg gcc cct agg aaa aag ggc tgt tgg    1393
Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp
    450                 455                 460
aaa tgt gga aaa gaa gga cac caa atg aaa gat tgt act gag aga cag    1441
Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln
465                 470                 475                 480
gcc aat ttt tta ggg aaa atc tgg ccc tcc cac aag gga ggg cca ggg    1489
Ala Asn Phe Leu Gly Lys Ile Trp Pro Ser His Lys Gly Gly Pro Gly
                485                 490                 495
aat ttt ctt cag aac aga cca gag cca aca gcc cca cca gag gag agc    1537
Asn Phe Leu Gln Asn Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser
            500                 505                 510
ttc agg ttt ggg gaa gag aca aca act cca tct cag aag cag gag cca    1585
Phe Arg Phe Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Glu Pro
        515                 520                 525
ata gac aag gaa cta tat cct tta act tcc ctc aaa tca ctc ttt ggc    1633
Ile Asp Lys Glu Leu Tyr Pro Leu Thr Ser Leu Lys Ser Leu Phe Gly
    530                 535                 540
aac gac ccc tcg tca caa taa aga tag ggg ggc aat taa agg aag ctc    1681
Asn Asp Pro Ser Ser Gln     Arg     Gly Gly Asn     Arg Lys Leu
545                 550                 555                 560
tat tag ata cag gag cag gtg ata cag tat tag aag acc tga att tgc    1729
Tyr     Ile Gln Glu Gln Val Ile Gln Tyr     Lys Thr     Ile Cys
                565                 570                 575
cag gga aat gga aac caa aaa tga tag ggg gaa ttg gag gtt tta tca    1777
Gln Gly Asn Gly Asn Gln Lys         Gly Glu Leu Glu Val Leu Ser
            580                 585                 590
aag taa gac agt atg aac aga tac cca tag aaa ttt gcg gac aca aag    1825
Lys     Asp Ser Met Asn Arg Tyr Pro     Lys Phe Ala Asp Thr Lys
        595                 600                 605
cta tag gta cag tat tag tag gac cta cac ctg tca aca taa ttg gaa    1873
Leu     Val Gln Tyr         Asp Leu His Leu Ser Thr     Leu Glu
    610                 615                 620
gaa atc tgt tga ctc agc ttg gtt gca ctt taa att ttc caa tca gtc    1921
Glu Ile Cys     Leu Ser Leu Val Ala Leu     Ile Phe Gln Ser Val
625                 630                 635                 640
cca ttg aaa ctg tac cag taa aat taa agc cag gaa tgg atg gcc caa    1969
Pro Leu Lys Leu Tyr Gln     Asn     Ser Gln Glu Trp Met Ala Gln
                645                 650                 655
agg tta aac aat ggc cat tga cag aag aga aaa taa aag cat taa cag    2017
Arg Leu Asn Asn Gly His     Gln Lys Arg Lys     Lys His     Gln
            660                 665                 670
caa ttt gtg atg aaa tgg aga aag aag gaa aaa tta caa aaa ttg ggc    2065
Gln Phe Val Met Lys Trp Arg Lys Lys Glu Lys Leu Gln Lys Leu Gly
        675                 680                 685
ctg aaa atc cat ata aca ctc caa tat ttg cca taa aaa aga agg aca    2113
Leu Lys Ile His Ile Thr Leu Gln Tyr Leu Pro     Lys Arg Arg Thr
    690                 695                 700
gta cta agt gga gaa agt tag tag att tca ggg aac tca ata aaa gaa    2161
Val Leu Ser Gly Glu Ser         Ile Ser Gly Asn Ser Ile Lys Glu
705                 710                 715                 720
ctc aag att ttt ggg aag ttc aat tag gaa tac cac acc cag cag ggt    2209
Leu Lys Ile Phe Gly Lys Phe Asn     Glu Tyr His Thr Gln Gln Gly
                725                 730                 735
taa aaa aga aaa aat cag tga cag tac tgg atg tgg ggg atg cat att    2257
    Lys Arg Lys Asn Gln     Gln Tyr Trp Met Trp Gly Met His Ile
            740                 745                 750
ttt caa ttc ctt tat atg aag act tca gga agt ata ctg cat tca cca    2305
Phe Gln Phe Leu Tyr Met Lys Thr Ser Gly Ser Ile Leu His Ser Pro
        755                 760                 765
tac cta gta gaa aca atg aaa cac cag gga tta ggt atc agt aca atg    2353
Tyr Leu Val Glu Thr Met Lys His Gln Gly Leu Gly Ile Ser Thr Met
    770                 775                 780
tacttc cac agg gat gga aag gat cac tag caa tat tcc aaa gta gca    2401
Tyr Phe His Arg Asp Gly Lys Asp His    Gln Tyr Ser Lys Val Ala
785                 790                 795                 800
tga caa aaa cct tag agc ctt tta gaa aac aaa atc cag gca tag tta    2449
    Gln Lys Pro     Ser Leu Leu Glu Asn Lys Ile Gln Ala     Leu
                805                 810                 815
tct atc aat aca tgg atg att tgt atg tag gat ctg act tag aga tag    2497
Ser Ile Asn Thr Trp Met Ile Cys Met     Asp Leu Thr     Arg
            820                 825                 830
ggc agc ata gaa caa aaa tag agg aac tga gac aac att tgt tga ggt    2545
Gly Ser Ile Glu Gln Lys     Arg Asn     Asp Asn Ile Cys     Gly
        835                 840                 845
ggg gat tta cca cac cag aca aga aac att aga aag aac ctc cat ttc    2593
Gly Asp Leu Pro His Gln Thr Arg Asn Ile Arg Lys Asn Leu His Phe
    850                 855                 860
ttt gga tgg ggt atg aac tcc atc ctg aca aat gga cag tac agc cta    2641
Phe Gly Trp Gly Met Asn Ser Ile Leu Thr Asn Gly Gln Tyr Ser Leu
865                 870                 875                 880
cac agc tgc cag aaa aag ata gct gga ctg tca atg ata tac aaa agt    2689
His Ser Cys Gln Lys Lys Ile Ala Gly Leu Ser Met Ile Tyr Lys Ser
                885                 890                 895
tag tgg gaa aat taa act ggg caa gtc aga ttt atc ctg gaa tta aag    2737
    Trp Glu Asn     Thr Gly Gln Val Arg Phe Ile Leu Glu Leu Lys
            900                 905                 910
taa ggc aac ttt gta aac tcc tta ggg ggg cca aag cac taa cag aca    2785
    Gly Asn Phe Val Asn Ser Leu Gly Gly Pro Lys His     Gln Thr
        915                 920                 925
tag tac cac taa ctg aag aag cag aat tag aat tgg cag aaa aca ggg    2833
    Tyr His     Leu Lys Lys Gln Asn     Asn Trp Gln Lys Thr Gly
    930                 935                 940
aaa ttc taa aag aac cag tac atg gag tat act atg acc cat caa aag    2881
Lys Phe     Lys Asn Gln Tyr Met Glu Tyr Thr Met Thr His Gln Lys
945                 950                 955                 960
act tga tag ctg aaa tac aga aac agg ggc agg aac aat gga cat atc    2929
Thr         Leu Lys Tyr Arg Asn Arg Gly Arg Asn Asn Gly His Ile
                965                 970                 975
aaa ttt acc aag aac cat tca aaa atc taa aaa cag gga agt atg caa    2977
Lys Phe Thr Lys Asn His Ser Lys Ile     Lys Gln Gly Ser Met Gln
            980                 985                 990
aaa tga gga ctg ccc aca cta atg atg taa aac aat taa cag agg ctg    3025
Lys     Gly Leu Pro Thr Leu Met Met     Asn Asn     Gln Arg Leu
        995                1000                 1005
tgc aga aaa tag cca tgg aag gca tag taa tat ggg gaa aaa ctc cta    3073
Cys Arg Lys     Pro Trp Lys Ala         Tyr Gly Glu Lys Leu Leu
   1010                 1015                 1020
aat tta gat tac cca tcc aaa aag aaa cat ggg aga cat ggt gga cag    3121
Asn Leu Asp Tyr Pro Ser Lys Lys Lys His Gly Arg His Gly Gly Gln
1025               1030                1035                1040
act att ggc aag cca cct gga ttc ctg agt ggg aat ttg tta ata ccc    3169
Thr Ile Gly Lys Pro Pro Gly Phe Leu Ser Gly Asn Leu Leu Ile Pro
               1045                1050                1055
ctc cct tag taa aat tat ggt acc agc tgg aaa aag atc cca tag tag    3217
Leu Pro         Asn Tyr Gly Thr Ser Trp Lys Lys Ile Pro
           1060                1065                1070
gag tag aaa ctt tct atg tag atg gag cag cta ata ggg aga cta aaa    3265
Glu     Lys Leu Ser Met     Met Glu Gln Leu Ile Gly Arg Leu Lys
       1075                1080                1085
tag gaa aag cag ggt atg tta ctg aca gag gaa gga aga aaa ttg ttt    3313
    Glu Lys Gln Gly Met Leu Leu Thr Glu Glu Gly Arg Lys Leu Phe
   1090                1095                1100
ctc taa ctg aaa caa caa atc aga aga ctg aat tgc aag caa ttt gta    3361
Leu     Leu Lys Gln Gln Ile Arg Arg Leu Asn Cys Lys Gln Phe Val
1105               1110                1115                1120
tag ctt tgc aag att cag gat cag aag taa aca tag taa cag att cac    3409
    Leu Cys Lys Ile Gln Asp Gln Lys     Thr         Gln Ile His
               1125                1130                1135
agt atg cat tag gga tca ttc aag cac aac cag ata aga gtg aat cag    3457
Ser Met His     Gly Ser Phe Lys His Asn Gln Ile Arg Val Asn Gln
           1140                1145                1150
agt tag tta acc aaa taa tag aac aat taa tga aaa agg aaa gag tct    3505
Ser     Leu Thr Lys         Asn Asn         Lys Arg Lys Glu Ser
       1155                1160                1165
acc tgt cat ggg tac cag cac ata aag gaa ttg gag gaa atg aac aag    3553
Thr Cys His Gly Tyr Gln His Ile Lys Glu Leu Glu Glu Met Asn Lys
   1170                1175                1180
tag ata aat tag taa gta gtg gaa tca gga aag tgc tat ttc tag atg    3601
    Ile Asn         Val Val Glu Ser Gly Lys Cys Tyr Phe     Met
1185               1190                1195                1200
gaa tag ata aag ctc aag aag agc atg aaa agt atc aca gca att gga    3649
Glu     Ile Lys Leu Lys Lys Ser Met Lys Ser Ile Thr Ala Ile Gly
               1205                1210                1215
gag caa tgg cta gtg act tta atc tgc cac cca tag tag caa aag aaa    3697
Glu Gln Trp Leu Val Thr Leu Ile Cys His Pro         Gln Lys Lys
           1220                1225                1230
tag tgg cta gct gtg atc aat gtc agc taa aag gag aag cca tgc atg    3745
    Trp Leu Ala Val Ile Asn Val Ser     Lys Glu Lys Pro Cys Met
       1235                1240                1245
gac aag tag act gta gtc cag gga tat ggc aat tag att gta cac att    3793
Asp Lys     Thr Val Val Gln Gly Tyr Gly Asn     Ile Val His Ile
   1250                1255                1260
tag aag gaa aaa tca tcc tgg tag cag tcc atg tag cca gtg gct aca    3841
    Lys Glu Lys Ser Ser Trp     Gln Ser Met     Pro Val Ala Thr
1265               1270                1275                1280
tgg aag cag agg tta tcc cag cag aaa cag gac aag aga cag cat act    3889
Trp Lys Gln Arg Leu Ser Gln Gln Lys Gln Asp Lys Arg Gln His Thr
               1285                1290                1295
tta tac taa aat tag cag gaa gat ggc cag tca aag taa tac ata cag    3937
Leu Tyr     Asn     Gln Glu Asp Gly Gln Ser Lys     Tyr Ile Gln
           1300                1305                1310
ata atg gta gta att tca cca gta ctg cag tta agg cag cct gtt ggt    3985
Ile Met Val Val Ile Ser Pro Val Leu Gln Leu Arg Gln Pro Val Gly
        1315                1320                1325
ggg cag gta tcc aac agg aat ttg gaa ttc cct aca gtc ccc aaa gtc    4033
Gly Gln Val Ser Asn Arg Asn Leu Glu Phe Pro Thr Val Pro Lys Val
   1330                1335                1340
agg gag tag tag aag cca tga ata aag aat taa aga aaa tta tag ggc    4081
Arg Glu         Lys Pro     Ile Lys Asn     Arg Lys Leu     Gly
1345               1350                1355                1360
agg taa gag atc aag ctg agc acc tta aga cag cag tac taa tgg cag    4129
Arg     Glu Ile Lys Leu Ser Thr Leu Arg Gln Gln Tyr     Trp Gln
               1365                1370                1375
tat tca ttc aca att tta aaa gaa aag ggg gga ttg ggg ggt aca gtg    4177
Tyr Ser Phe Thr Ile Leu Lys Glu Lys Gly Gly Leu Gly Gly Thr Val
           1380                1385                1390
cag ggg aaa gaa taa tag ata taa tag caa cag aca tac aaa cta aag    4225
Gln Gly Lys Glu         Ile         Gln Gln Thr Tyr Lys Leu Lys
       1395                1400                1405
aat tac aaa aac aga tta caa aaa ttc aaa att ttc ggg ttt att aca    4273
Asn Tyr Lys Asn Arg Leu Gln Lys Phe Lys Ile Phe Gly Phe Ile Thr
    1410                1415                1420
gag aca gca gag acc cca gtt gga aag gac cag cca aac tac tct gga    4321
Glu Thr Ala Glu Thr Pro Val Gly Lys Asp Gln Pro Asn Tyr Ser Gly
1425               1430                1435                1440
aag gtg aag ggg cag taa taa tac aag ata ata gtg aca taa agg tag    4369
Lys Val Lys Gly Gln         Tyr Lys Ile Ile Val Thr     Arg
               1445                1450                1455
tac caa gga gga aag caa aaa tca tta agg act atg gaa aac aga tgg    4417
Tyr Gln Gly Gly Lys Gln Lys Ser Leu Arg Thr Met Glu Asn Arg Trp
           1460                1465                1470
cag gtg ctg att gtg tgg cag gta gac agg atg aag att aga aca tgg    4465
Gln Val Leu Ile Val Trp Gln Val Asp Arg Met Lys Ile Arg Thr Trp
       1475                1480                1485
aat agt tta gta aaa cac cat atg tat gtt tca agg aga gct aat gga    4513
Asn Ser Leu Val Lys His His Met Tyr Val Ser Arg Arg Ala Asn Gly
   1490                1495                1500
tgg ttt tac aga cat cat tat gac agc aga cat cca aaa gta agt tca    4561
Trp Phe Tyr Arg His His Tyr Asp Ser Arg His Pro Lys Val Ser Ser
1505               1510                1515                1520
gaa gta cac atc cca tta gga aag gct aaa tta gta ata aaa aca tat    4609
Glu Val His Ile Pro Leu Gly Lys Ala Lys Leu Val Ile Lys Thr Tyr
               1525                1530                1535
tgg ggg ttg cag aca gga gaa aga gat cgg cat ttg ggt cat gga gtc    4657
Trp Gly Leu Gln Thr Gly Glu Arg Asp Arg His Leu Gly His Gly Val
           1540                1545                1550
tcc ata gaa tgg aga ttg aga aga tat acc aca caa ata gaa cct ggc    4705
Ser Ile Glu Trp Arg Leu Arg Arg Tyr Thr Thr Gln Ile Glu Pro Gly
       1555                1560                1565
ctg gca gac cag cta att cat ttg tat tat ttt gat tgt ttt gca gac    4753
Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe Asp Cys Phe Ala Asp
   1570                1575                1580
tct gat ata agg aaa gcc ata tta gga cac ata gtt att cct agg tgt    4801
Ser Asp Ile Arg Lys Ala Ile Leu Gly His Ile Val Ile Pro Arg Cys
1585               1590                1595                1600
gac tat caa gca gga cat aat aat aag gta gga tct cta caa tac ttg    4849
Asp Tyr Gln Ala Gly His Asn Asn Lys Val Gly Ser Leu Gln Tyr Leu
               1605                1610                1615
gca ctg aca gca ttg ata aaa cca aaa aag ata aag cca cct ctg cct    4897
Ala Leu Thr Ala Leu Ile Lys Pro Lys Lys Ile Lys Pro Pro Leu Pro
           1620                1625                1630
agt atc aag aaa tta gta gag gat aga tgg aac aat ccc cag gag atc    4945
Ser Ile Lys Lys Leu Val Glu Asp Arg Trp Asn Asn Pro Gln Glu Ile
       1635                1640                1645
agg ggc cgc aga ggg aac cac aca atg aat gga cac tag agc ttc tag    4993
Arg Gly Arg Arg Gly Asn His Thr Met Asn Gly His     Ser Phe
   1650                1655                1660
agg agc tca agc agg aag ctg tta gac act ttc cta gac cat ggc ttc    5041
Arg Ser Ser Ser Arg Lys Leu Leu Asp Thr Phe Leu Asp His Gly Phe
1665              1670                1675                1680
ata gct tag gac aac ata tct atg aaa cat atg ggg ata ctt ggg cag    5089
Ile Ala      Asp Asn Ile Ser Met Lys His Met Gly Ile Leu Gly Gln
                1685                1690                1695
gag tgg aag cca taa taa gaa ttc tgc aac aac tgc tgt tta ttc att    5137
Glu Trp Lys Pro         Glu Phe Cys Asn Asn Cys Cys Leu Phe Ile
           1700                1705                1710
tca gaa ttg ggt gtc agc ata gca gaa tag gca ttt tga gac aga gaa    5185
Ser Glu Leu Gly Val Ser Ile Ala Glu     Ala Phe     Asp Arg Glu
       1715                1720                1725
gaa caa gaa atg gag cca gta aat cat aaa tta gag cct tgg gag cat    5233
Glu Gln Glu Met Glu Pro Val Asn His Lys Leu Glu Pro Trp Glu His
   1730                1735                1740
cca gga agt cag cct aag act gct tgt aac agt tgc tat tgt aaa aag    5281
Pro Gly Ser Gln Pro Lys Thr Ala Cys Asn Ser Cys Tyr Cys Lys Lys
1745               1750                1755                1760
tgc tgc ttt cat tgc caa gtt tgt ttc acg aaa aaa ggc tta ggc atc    5329
Cys Cys Phe His Cys Gln Val Cys Phe Thr Lys Lys Gly Leu Gly Ile
               1765                1770                1775
ttc tat ggc agg aag aag cga aga cag cga cga agc gct cat cga agc    5377
Phe Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala His Arg Ser
           1780                1785                1790
agt gag gat cat caa aat cct ata tca aag cag taa gta gta aat gta    5425
Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln     Val Val Asn Val
       1795                1800                1805
atg caa gct tta acc att tta gca ata gta gcc tta gta gta gca aca    5473
Met Gln Ala Leu Thr Ile Leu Ala Ile Val Ala Leu Val Val Ala Thr
   1810                1815                1820
ata ata gca ata gtt gtg tgg acc ata gta ttc ata gaa tat agg aaa    5521
Ile Ile Ala Ile Val Val Trp Thr Ile Val Phe Ile Glu Tyr Arg Lys
1825               1830                1835                1840
ata tta aga cag aaa aaa ata gac agg tta att gat aga ata aga gaa    5569
Ile Leu Arg Gln Lys Lys Ile Asp Arg Leu Ile Asp Arg Ile Arg Glu
               1845                1850                1855
aga gca gaa gac agt ggc aat gag ggt gac ggg gat cag gaa gaa tta    5617
Arg Ala Glu Asp Ser Gly Asn Glu Gly Asp Gly Asp Gln Glu Glu Leu
           1860                1865                1870
tcg gca ttt atg gag atg ggg cac cat gct cct tgg gat gtt gat gat    5665
Ser Ala Phe Met Glu Met Gly His His Ala Pro Trp Asp Val Asp Asp
       1875                1880                1885
cag tag tgc tgt agg aaa ctt gtg ggt cac agt cta tta tgg ggt acc    5713
Gln     Cys Cys Arg Lys Leu Val Gly His Ser Leu Leu Trp Gly Thr
   1890                1895                1900
tgt atg gaa agg ggc aac cac cac ttt att ttg tgc atc aga tgc taa    5761
Cys Met Glu Arg Gly Asn His His Phe Ile Leu Cys Ile Arg Cys
1905               1910                1915                1920
agc ata tga tac aga ggt aca taa tgt ttg ggc tac aca tgc ctg tgt    5809
Ser Ile     Tyr Arg Gly Thr     Cys Leu Gly Tyr Thr Cys Leu Cys
               1925                1930                1935
acc cgc aga ccc caa ccc aca aga aat ggt ttt gga aaa tgt aac aga    5857
Thr Arg Arg Pro Gln Pro Thr Arg Asn Gly Phe Gly Lys Cys Asn Arg
           1940                1945                1950
aaa ttt taa cat gtg gaa aaa tga aat ggt aaa tca gat gca gga aga    5905
Lys Phe     His Val Glu Lys     Asn Gly Lys Ser Asp Ala Gly Arg
       1955                1960                1965
tgt aat cag ttt atg gga tca aag cct aaa acc atg tgt aaa gtt gac    5953
Cys Asn Gln Phe Met Gly Ser Lys Pro Lys Thr Met Cys Lys Val Asp
   1970                1975                1980
ccc act ctg tgt cac ttt aga atg tag aaa tgt tag cag taa tag taa    6001
Pro Thr Leu Cys His Phe Arg Met     Lys Cys     Gln
1985               1990                1995                2000
tga tac cta cca tga gac cta cca tga gag cat gaa gga aat gaa aaa    6049
    Tyr Leu Pro     Asp Leu Pro     Glu His Glu Gly Asn Glu Lys
                2005                2010                2015
ttg ctc ttt caa tgc aac cac agt agt aag aga tag gaa gca gac agt    6097
Leu Leu Phe Gln Cys Asn His Ser Ser Lys Arg     Glu Ala Asp Ser
           2020                2025                2030
gta tgc act ttt tta tag act tga tat agt acc act tac taa gaa gaa    6145
Val Cys Thr Phe Leu     Thr     Tyr Ser Thr Thr Tyr     Glu Glu
       2035                2040                2045
cta tag tga gaa ttc tag tga gta tta tag att aat aaa ttg taa tac    6193
Leu         Glu Phe         Val Leu     Ile Asn Lys Leu     Tyr
   2050                2055                2060
ctc agc cat aac aca agc ctg tcc aaa ggt cac ttt tga tcc aat tcc    6241
Leu Ser His Asn Thr Ser Leu Ser Lys Gly His Phe     Ser Asn Ser
2065               2070                2075                2080
tat aca cta ttg cac tcc agc tgg tta tgc aat tct aaa gtg taa tga    6289
Tyr Thr Leu Leu His Ser Ser Trp Leu Cys Asn Ser Lys Val
               2085                2090                2095
taa gat att caa tgg gac agg acc atg cca taa tgt tag cac agt aca    6337
    Asp Ile Gln Trp Asp Arg Thr Met Pro     Cys     His Ser Thr
           2100                2105                2110
atg tac aca tgg gat taa gcc agt ggt atc aac tca act act gtt aaa    6385
Met Tyr Thr Trp Asp     Ala Ser Gly Ile Asn Ser Thr Thr Val Lys
       2115                2120                2125
tgg tag cct agc aga agg aga aat aat aat tag atc tga aaa tct gac    6433
Trp     Pro Ser Arg Arg Arg Asn Asn Asn     Ile     Lys Ser Asp
   2130                2135                2140
aaa caa tgt caa aac aat aat agt aca tct taa tca atc tgt aga aat    6481
Lys Gln Cys Gln Asn Asn Asn Ser Thr Ser     Ser Ile Cys Arg Asn
2145               2150                2155                2160
tgt atg tac aag acc cgg caa taa tac aag aaa aag tat aag gat agg    6529
Cys Met Tyr Lys Thr Arg Gln     Tyr Lys Lys Lys Tyr Lys Asp Arg
                2165                2170                2175
acc agg aca aac att cta tgc aac agg aga cat aat agg aga cat aag    6577
Thr Arg Thr Asn Ile Leu Cys Asn Arg Arg His Asn Arg Arg His Lys
            2180                2185                2190
aca agc aca ttg taa cat tag tga aga taa atg gaa tga aac ttt aca    6625
Thr Ser Thr Leu     His         Arg     Met Glu     Asn Phe Thr
        2195                2200                2205
aag ggt aag taa aaa att agc aga aca ctt cca gaa taa aac aat aaa    6673
Lys Gly Lys     Lys Ile Ser Arg Thr Leu Pro Glu     Asn Asn Lys
   2210                2215                2220
att tgc atc atc ctc agg agg gga cct aga agt tac aac aca tag ctt    6721
Ile Cys Ile Ile Leu Arg Arg Gly Pro Arg Ser Tyr Asn Thr     Leu
2225               2230                2235                2240
taa ttg tag agg aga att ttt cta ttg taa tac atc agg cct gtt taa    6769
    Leu     Arg Arg Ile Phe Leu Leu     Tyr Ile Arg Pro Val
               2245                2250                2255
tgg tgc ata cac gcc taa tgg tac aaa aag taa ttc aag ctc aat cat    6817
Trp Cys Ile His Ala     Trp Tyr Lys Lys      Phe Lys Leu Asn His
           2260                2265                2270
cac aat ccc atg cag aat aaa gca aat tat aaa tat gtg gca gga ggt    6865
His Asn Pro Met Gln Asn Lys Ala Asn Tyr Lys Tyr Val Ala Gly Gly
       2275                2280                2285
agg acg agc aat gta tgc ccc tcc cat aaa agg aaa cat aac atg taa    6913
Arg Thr Ser Asn Val Cys Pro Ser His Lys Arg Lys His Asn Met
   2290                2295                2300
atc aaa tat cac agg act act att ggt acg tga tgg agg aac aga gcc    6961
Ile Lys Tyr His Arg Thr Thr Ile Gly Thr     Trp Arg Asn Arg Ala
2305               2310                2315                2320
aaa tga tac aga gac att cag acc tgg agg agg aga tat gag gaa caa    7009
Lys     Tyr Arg Asp Ile Gln Thr Trp Arg Arg Arg Tyr Glu Glu Gln
               2325                2330                2335
ttg gag aag tga att ata taa ata taa agt ggt aga aat taa gcc att    7057
Leu Glu Lys     Ile Ile     Ile     Ser Gly Arg Asn     Ala Ile
            2340                2345                2350
ggg agt agc acc cac tac aac aaa aag gag agt ggt gga gag aga aaa    7105
Gly Ser Ser Thr His Tyr Asn Lys Lys Glu Ser Gly Gly Glu Arg Lys
       2355                2360                2365
aag agc agt ggg aat agg agc tgt gtt cct tgg gtt ctt agg agt agc    7153
Lys Ser Ser Gly Asn Arg Ser Cys Val Pro Trp Val Leu Arg Ser Ser
   2370                2375                2380
agg aag cac tat ggg cgc ggc gtc aat aac gct gac ggt aca ggc cag    7201
Arg Lys His Tyr Gly Arg Gly Val Asn Asn Ala Asp Gly Thr Gly Gln
2385               2390                2395                2400
aca att gct gtc tgg tat agt gca aca gca aag caa ttt gct gag ggc    7249
Thr Ile Ala Val Trp Tyr Ser Ala Thr Ala Lys Gln Phe Ala Glu Gly
               2405                2410                2415
tat aga agc gca aca gca tct gtt gca act cac ggt ctg ggg cat taa    7297
Tyr Arg Ser Ala Thr Ala Ser Val Ala Thr His Gly Leu Gly His
           2420                2425                2430
gca gct cca gac aag agt cct ggc tat aga aag ata cct aaa gga tca    7345
Ala Ala Pro Asp Lys Ser Pro Gly Tyr Arg Lys Ile Pro Lys Gly Ser
       2435                2440                2445
aca gct cct agg gat ttg ggg ctg ctc tgg aaa act cat ctg cac tac    7393
Thr Ala Pro Arg Asp Leu Gly Leu Leu Trp Lys Thr His Leu His Tyr
   2450                2455                2460
tgc tgt acc ttg gaa ctc cag ttg gag taa caa atc tca aaa aga gat    7441
Cys Cys Thr Leu Glu Leu Gln Leu Glu     Gln Ile Ser Lys Arg Asp
2465               2470                2475                2480
ttg gga taa cat gac ctg gat gca atg gga taa aga aat tag taa tta    7489
Leu Gly     His Asp Leu Asp Ala Met Gly     Arg Asn         Leu
               2485                2490                2495
cac aaa cac agt ata cag gtt gct tga aga atc gca aaa cca gca gga    7537
His Lys His Ser Ile Gln Val Ala     Arg Ile Ala Lys Pro Ala Gly
           2500                2505                2510
aag gaa tga aaa aga tct att agc att gga cag ttg gaa aaa tct atg    7585
Lys Glu     Lys Arg Ser Ile Ser Ile Gly Gln Leu Glu Lys Ser Met
       2515                2520                2525
gag ttg gtt tga cat aac aaa ttg gct gtg gta tat aaa aat att cat    7633
Glu Leu Val     His Asn Lys Leu Ala Val Val Tyr Lys Asn Ile His
    2530                2535                2540
aat aat agt agg agg ctt gat agg ttt aag aat aat ttt tgc tgt gct    7681
Asn Asn Ser Arg Arg Leu Asp Arg Phe Lys Asn Asn Phe Cys Cys Ala
2545               2550                2555                2560
ctc tat agt aaa tag agt tag gca ggg ata ctc acc ttt gtc gtt tca    7729
Leu Tyr Ser Lys     Ser     Ala Gly Ile Leu Thr Phe Val Val Ser
               2565                2570                2575
gac cct tac ccc gaa ccc agg ggg acc cga cag gct cgg aag aat cga    7777
Asp Pro Tyr Pro Glu Pro Arg Gly Thr Arg Gln Ala Arg Lys Asn Arg
           2580                2585                2590
aga aga agg tgg aaa gca aga cag gga cag atc cat tcg att agt gaa    7825
Arg Arg Arg Trp Lys Ala Arg Gln Gly Gln Ile His Ser Ile Ser Glu
       2595                2600                2605
cgg att ctt agc gct tgc ctg gga cga cct gcg gaa cct gtg cct ctt    7873
Arg Ile Leu Ser Ala Cys Leu Gly Arg Pro Ala Glu Pro Val Pro Leu
   2610                2615                2620
cag cta cca ccg att gag gga ctt cac att agt ggc agc gag ggt ggt    7921
Gln Leu Pro Pro Ile Glu Gly Leu His Ile Ser Gly Ser Glu Gly Gly
2625               2630                2635                2640
gga act tct ggg acg caa tag tct cag ggg act aca gag agg gtg gga    7969
Gly Thr Ser Gly Thr Gln     Ser Gln Gly Thr Thr Glu Arg Val Gly
               2645                2650                2655
agc cct taa ata tct ggg aag tct tgt gca gta ctg ggg tca gga gct    8017
Ser Pro     Ile Ser Gly Lys Ser Cys Ala Val Leu Gly Ser Gly Ala
           2660                2665                2670
aaa aaa gag tac tat tag tct ggt tga tac cat agc aat agc agt agc    8065
Lys Lys Glu Tyr Tyr     Ser Gly     Tyr His Ser Asn Ser Ser Ser
       2675                2680                2685
tga agg aac aga tag gat tat aga att agt aca agg act ttg tag agc    8113
    Arg Asn Arg     Asp Tyr Arg Ile Ser Thr Arg Thr Leu     Ser
   2690                2695                2700
tat cta cag cat acc tag aag aat aag aca ggg ctt tga agc agc ttt    8161
Tyr Leu Gln His Thr     Lys Asn Lys Thr Gly Leu     Ser Ser Phe
2705                2710                2715                2720
gca ata aaa tgg ggg gca agt ggt cga aaa gta gca tag ttg gat ggc    8209
Ala Ile Lys Trp Gly Ala Ser Gly Arg Lys Val Ala     Leu Asp Gly
               2725                2730                2735
ctg cta taa ggg aga gaa tga gaa gaa ctg agc cag cag cag atg ggg    8257
Leu Leu     Gly Arg Glu     Glu Glu Leu Ser Gln Gln Gln Met Gly
           2740                2745                2750
tgg gag cag tat ctc gag acc tgg aaa aac atg gag caa tca cga gta    8305
Trp Glu Gln Tyr Leu Glu Thr Trp Lys Asn Met Glu Gln Ser Arg Val
       2755                2760                2765
gca ata cag cag cta cta atg agg att gtg cct ggc tgg aag cac aag    8353
Ala Ile Gln Gln Leu Leu Met Arg Ile Val Pro Gly Trp Lys His Lys
   2770                2775                2780
agg agg ggg agg tgg gtt ttc cag tca gac ctc agg tac ctt taa gac    8401
Arg Arg Gly Arg Trp Val Phe Gln Ser Asp Leu Arg Tyr Leu     Asp
2785               2790                2795                2800
caa tga ctt aca agg gag ctg tag atc tta gct tct ttt taa aag aaa    8449
Gln     Leu Thr Arg Glu Leu     Ile Leu Ala Ser Phe     Lys Lys
               2805                2810                2815
agg ggg gac tgg aag ggt taa ttt act cta aga aaa ggc aag aga tcc    8497
Arg Gly Asp Trp Lys Gly     Phe Thr Leu Arg Lys Gly Lys Arg Ser
           2820                2825                2830
ttg att tgt ggg tct atc aca cac aag gct act tcc ctg att ggc aca    8545
Leu Ile Cys Gly Ser Ile Thr His Lys Ala Thr Ser Leu Ile Gly Thr
       2835                2840                2845
act aca cac cag gac cag ggg tca gat tcc cac tga ctt ttg ggt ggt    8593
Thr Thr His Gln Asp Gln Gly Ser Asp Ser His     Leu Leu Gly Gly
   2850                2855                2860
gct tca agc tag tac cag ttg acc caa ggg aag tag aag agg cca acg    8641
Ala Ser Ser     Tyr Gln Leu Thr Gln Gly Lys     Lys Arg Pro Thr
2865               2870                2875                2880
agg gag aag aca act gct tgc tac acc ctg tgt gcc agc atg gaa tgg    8689
Arg Glu Lys Thr Thr Ala Cys Tyr Thr Leu Cys Ala Ser Met Glu Trp
               2885                2890                2895
agg atg atc aca gag aag tat taa agt gga agt ttg aca gtc aac tag    8737
Arg Met Ile Thr Glu Lys Tyr     Ser Gly Ser Leu Thr Val Asn
            2900                2905                2910
cac aca gac aca ggg ccc gcg aac tac atc cgg agt ttt aca aag act    8785
His Thr Asp Thr Gly Pro Ala Asn Tyr Ile Arg Ser Phe Thr Lys Thr
       2915                2920                2925
gct gac aca gaa ggg act ttc cgc ggg gac ttt cca ctg ggg cgt tct    8833
Ala Asp Thr Glu Gly Thr Phe Arg Gly Asp Phe Pro Leu Gly Arg Ser
   2930                2935                2940
agg agg tgt ggt ctg gcg gga ctg gga gtg gtc aac cct caa atg ctg    8881
Arg Arg Cys Gly Leu Ala Gly Leu Gly Val Val Asn Pro Gln Met Leu
2945               2950                2955                2960
cat ata agc agc tgc ttt tcg cct gta ctg ggt ctc tct agt cag acc    8929
His Ile Ser Ser Cys Phe Ser Pro Val Leu Gly Leu Ser Ser Gln Thr
               2965                2970                2975
aga tct gag cct ggg agc tct ctg gct aac tag gga acc cac tgc tta    8977
Arg Ser Glu Pro Gly Ser Ser Leu Ala Asn      Gly Thr His Cys Leu
           2980                2985                2990
agc ctc aat aaa gct tgc ctt gag ggg cta gag cgg ccg cca ccg cgg    9025
Ser Leu Asn Lys Ala Cys Leu Glu Gly Leu Glu Arg Pro Pro Pro Arg
       2995                3000                3005
tgg agc tcc agc ttt tgt tcc ctt tag tga ggg tta att gcg cgc tgg    9073
Trp Ser Ser Ser Phe Cys Ser Leu         Gly Leu Ile Ala Arg Trp
   3010                3015                3020
cga tc                                                             9078
Arg
3025
<210>126
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>126
Ile Ser Ser Ser Gly Ala Arg Thr Gly Thr
  1              5                   10
<210>127
<211>31
<212>PRT
<213>Human immunodeficiency virus
<400>127
Asp Gln Arg Arg Ser Leu Asp Ala Gly Leu Gly Leu Leu Lys Cys Thr
  1               5                  10                  15
Arg Gln Glu Ala Arg Ala Ala Thr Gly Glu Tyr Ala Asn Tyr Ile
             20                  25                  30
<210>128
<211>503
<212>PRT
<213>Human immunodeficiency virus
<400>128
Leu Ala Glu Ala Arg Arg Arg Glu Met Gly Ala Arg Ala Ser Ile Leu
  1               5                  10                  15
Arg Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly
             20                  25                  30
Gly Lys Lys His Tyr Met Leu Lys His Leu Val Trp Ala Ser Arg Glu
         35                  40                  45
Leu Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly
     50                  55                  60
Cys Lys Gln Ile Met Lys Gln Leu Gln Ser Ala Leu Gln Thr Gly Thr
 65                  70                  75                  80
Glu Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Pro Tyr Cys Val
                 85                  90                  95
His Thr Glu Ile Asp Val Arg Asp Thr Arg Glu Ala Leu Asp Lys Ile
            100                 105                 110
Glu Glu Glu Gln Asn Lys Ile Gln Gln Lys Thr Gln Gln Ala Lys Glu
        115                 120                 125
Ala Asp Gly Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln
    130                 135                 140
Gly Gln Met Val His Gln Pro Ile Ser Pro Arg Thr Leu Asn Ala Trp
145                 150                 155                 160
Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met
                165                 170                 175
Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met
            180                 185                 190
Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Ile Leu Lys Asp
        195                 200                 205
Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His
    210                 215                 220
Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp
225                 230                 235                 240
Ile Ala Gly Thr Thr Ser Asn Leu Gln Glu Gln Ile Ala Trp Met Thr
                245                 250                 255
Ser Asn Pro Pro Val Pro Val Gly Asp Ile Tyr Lys Arg Trp Ile Ile
            260                 265                 270
Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu
        275                 280                 285
Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg
    290                 295                 300
Phe Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Gly Val Lys Asn
305                 310                 315                 320
Trp Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys
                325                 330                 335
Thr Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Ile Glu Glu Met Met
            340                 345                 350
Thr Ala Cys Gln Gly Val Gly Gly Pro Ser His Lys Ala Lys Val Leu
        355                 360                 365
Ala Glu Ala Met Ser Gln Thr Asn Ser Ala Ile Leu Met Gln Arg Ser
    370                 375                 380
Asn Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys
385                 390                 395                 400
Glu Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys
                405                 410                 415
Trp Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg
            420                 425                 430
Gln Ala Asn Phe Leu Gly Lys Ile Trp Pro Ser His Lys Gly Gly Pro
        435                 440                 445
Gly Asn Phe Leu Gln Asn Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu
    450                 455                 460
Ser Phe Arg Phe Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Glu
465                 470                 475                 480
Pro Ile Asp Lys Glu Leu Tyr Pro Leu Thr Ser Leu Lys Ser Leu Phe
                485                 490                 495
Gly Asn Asp Pro Ser Ser Gln
            500
<210>129
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>129
Arg Lys Leu Tyr
  1
<210>130
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>130
Ile Gln Glu Gln Val Ile Gln Tyr
  1               5
<210>131
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>131
Ile Cys Gln Gly Asn Gly Asn Gln Lys
  1               5
<210>132
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>132
Gly Glu Leu Glu Val Leu Ser Lys
  1               5
<210>133
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>133
Asp Ser Met Asn Arg Tyr Pro
  1               5
<210>134
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>134
Lys Phe Ala Asp Thr Lys Leu
  1               5
<210>135
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>135
Asp Leu His Leu Ser Thr
  1               5
<210>136
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>136
Leu Glu Glu Ile Cys
  1               5
<210>137
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>137
Leu Ser Leu Val Ala Leu
  1               5
<210>138
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>138
Ile Phe Gln Ser Val Pro Leu Lys Leu Tyr Gln
  1               5                  10
<210>139
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>139
Ser Gln Glu Trp Met Ala Gln Arg Leu Asn Asn Gly His
  1               5                  10
<210>140
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>140
Gln Lys Arg Lys
  1
<210>141
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>141
Gln Gln Phe Val Met Lys Trp Arg Lys Lys Glu Lys Leu Gln Lys Leu
  1               5                  10                  15
Gly Leu Lys Ile His Ile Thr Leu Gln Tyr Leu Pro
             20                  25
<210>142
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>142
Lys Arg Arg Thr Val Leu Ser Gly Glu Ser
  1               5                  10
<210>143
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>143
Ile Ser Gly Asn Ser Ile Lys Glu Leu Lys Ile Phe Gly Lys Phe Asn
  1               5                  10                  15
<210>144
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>144
Glu Tyr His Thr Gln Gln Gly
  1               5
<210>145
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>145
Lys Arg Lys Asn Gln
  1               5
<210>146
<211>50
<212>PRT
<213>Human immunodeficiency virus
<400>146
Gln Tyr Trp Met Trp Gly Met His Ile Phe Gln Phe Leu Tyr Met Lys
  1               5                  10                  15
Thr Ser Gly Ser Ile Leu His Ser Pro Tyr Leu Val Glu Thr Met Lys
             20                  25                  30
His Gln Gly Leu Gly Ile Ser Thr Met Tyr Phe His Arg Asp Gly Lys
         35                  40                  45
Asp His
     50
<210>147
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>147
Gln Tyr Ser Lys Val Ala
  1               5
<210>148
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>148
Ser Leu Leu Glu Asn Lys Ile Gln Ala
  1               5
<210>149
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>149
Leu Ser Ile Asn Thr Trp Met Ile Cys Met
  1               5                  10
<210>150
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>150
Gly Ser Ile Glu Gln Lys
  1               5
<210>151
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>151
Asp Asn Ile Cys
  1
<210>152
<211>49
<212>PRT
<213>Human immunodeficiency virus
<400>152
Gly Gly Asp Leu Pro His Gln Thr Arg Asn Ile Arg Lys Asn Leu His
  1               5                  10                  15
Phe Phe Gly Trp Gly Met Asn Ser Ile Leu Thr Asn Gly Gln Tyr Ser
             20                  25                  30
Leu His Ser Cys Gln Lys Lys Ile Ala Gly Leu Ser Met Ile Tyr Lys
         35                  40                  45
Ser
<210>153
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>153
Thr Gly Gln Val Arg Phe Ile Leu Glu Leu Lys
  1               5                  10
<210>154
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>154
Gly Asn Phe Val Asn Ser Leu Gly Gly Pro Lys His
  1               5                  10
<210>155
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>155
Leu Lys Lys Gln Asn
  1               5
<210>156
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>156
Asn Trp Gln Lys Thr Gly Lys Phe
  1              5
<210>157
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>157
Lys Asn Gln Tyr Met Glu Tyr Thr Met Thr His Gln Lys Thr
  1               5                  10
<210>158
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>158
Leu Lys Tyr Arg Asn Arg Gly Arg Asn Asn Gly His Ile Lys Phe Thr
  1               5                  10                  15
Lys Asn His Ser Lys Ile
             20
<210>159
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>159
Lys Gln Gly Ser Met Gln Lys
  1               5
<210>160
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>160
Gly Leu Pro Thr Leu Met Met
  1               5
<210>161
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>161
Gln Arg Leu Cys Arg Lys
  1               5
<210>162
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>162
Pro Trp Lys Ala
  1
<210>163
<211>40
<212>PRT
<213>Human immunodeficiency virus
<400>163
Tyr Gly Glu Lys Leu Leu Asn Leu Asp Tyr Pro Ser Lys Lys Lys His
  1               5                  10                  15
Gly Arg His Gly Gly Gln Thr Ile Gly Lys Pro Pro Gly Phe Leu Ser
             20                  25                  30
Gly Asn Leu Leu Ile Pro Leu Pro
         35                  40
<210>164
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>164
Asn Tyr Gly Thr Ser Trp Lys Lys Ile Pro
 1                  5                  10
<210>165
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>165
Lys Leu Ser Met
  1
<210>166
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>166
Met Glu Gln Leu Ile Gly Arg Leu Lys
  1               5
<210>167
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>167
Glu Lys Gln Gly Met Leu Leu Thr Glu Glu Gly Arg Lys Leu Phe Leu
  1               5                  10                  15
<210>168
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>168
Leu Lys Gln Gln Ile Arg Arg Leu Asn Cys Lys Gln Phe Val
  1               5                  10
<210>169
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>169
Leu Cys Lys Ile Gln Asp Gln Lys
  1               5
<210>170
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>170
Gln Ile His Ser Met His
  1               5
<210>171
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>171
Gly Ser Phe Lys His Asn Gln Ile Arg Val Asn Gln Ser
  1               5                  10
<210>172
<211>21
<212>PRT
<213>Human immunodeficiency virus
<400>172
Lys Arg Lys Glu Ser Thr Cys His Gly Tyr Gln His Ile Lys Glu Leu
  1               5                  10                  15
Glu Glu Met Asn Lys
             20
<210>173
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>173
Val Val Glu Ser Gly Lys Cys Tyr Phe
  1               5
<210>174
<211>25
<212>PRT
<213>Human immunodeficiency virus
<400>174
Ile Lys Leu Lys Lys Ser Met Lys Ser Ile Thr Ala Ile Gly Glu Gln
  1               5                  10                  15
Trp Leu Val Thr Leu Ile Cys His Pro
             20                  25
<210>175
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>175
Trp Leu Ala Val Ile Asn Val Ser
  1               5
<210>176
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>176
Lys Glu Lys Pro Cys Met Asp Lys
  1               5
<210>177
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>177
Thr Val Val Gln Gly Tyr Gly Asn
  1               5
<210>178
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>178
Ile Val His Ile
  1
<210>179
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>179
Lys Glu Lys Ser Ser Trp
  1               5
<210>180
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>180
Pro Val Ala Thr Trp Lys Gln Arg Leu Ser Gln Gln Lys Gln Asp Lys
  1               5                  10                  15
Arg Gln His Thr Leu Tyr
             20
<210>181
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>181
Gln Glu Asp Gly Gln Ser Lys
  1               5
<210>182
<211>37
<212>PRT
<213>Human immunodeficiency virus
<400>182
Tyr Ile Gln Ile Met Val Val Ile Ser Pro Val Leu Gln Leu Arg Gln
  1               5                  10                  15
Pro Val Gly Gly Gln Val Ser Asn Arg Asn Leu Glu Phe Pro Thr Val
             20                  25                  30
Pro Lys Val Arg Glu
         35
<210>183
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>183
Glu Ile Lys Leu Ser Thr Leu Arg Gln Gln Tyr
  1               5                  10
<210>184
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>184
Trp Gln Tyr Ser Phe Thr Ile Leu Lys Glu Lys Gly Gly Leu Gly Gly
  1               5                  10                  15
Thr Val Gln Gly Lys Glu
             20
<210>185
<211>44
<212>PRT
<213>Human immunodeficiency virus
<400>185
Gln Gln Thr Tyr Lys Leu Lys Asn Tyr Lys Asn Arg Leu Gln Lys Phe
  1               5                  10                  15
Lys Ile Phe Gly Phe Ile Thr Glu Thr Ala Glu Thr Pro Val Gly Lys
             20                  25                  30
Asp Gln Pro Asn Tyr Ser Gly Lys Val Lys Gly Gln
         35                  40
<210>186
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>186
Tyr Lys Ile Ile Val Thr
  1               5
<210>187
<211>204
<212>PRT
<213>Human immunodeficiency virus
<400>187
Tyr Gln Gly Gly Lys Gln Lys Ser Leu Arg Thr Met Glu Asn Arg Trp
  1               5                  10                  15
Gln Val Leu Ile Val Trp Gln Val Asp Arg Met Lys Ile Arg Thr Trp
                     20                  25                  30
Asn Ser Leu Val Lys His His Met Tyr Val Ser Arg Arg Ala Asn Gly
              35                  40                  45
Trp Phe Tyr Arg His His Tyr Asp Ser Arg His Pro Lys Val Ser Ser
      50                  55                  60
Glu Val His Ile Pro Leu Gly Lys Ala Lys Leu Val Ile Lys Thr Tyr
65                  70                  75                  80
Trp Gly Leu Gln Thr Gly Glu Arg Asp Arg His Leu Gly His Gly Val
                 85                  90                  95
Ser Ile Glu Trp Arg Leu Arg Arg Tyr Thr Thr Gln Ile Glu Pro Gly
            100                 105                 110
Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe Asp Cys Phe Ala Asp
        115                 120                 125
Ser Asp Ile Arg Lys Ala Ile Leu Gly His Ile Val Ile Pro Arg Cys
    130                 135                 140
Asp Tyr Gln Ala Gly His Asn Asn Lys Val Gly Ser Leu Gln Tyr Leu
145                 150                 155                 160
Ala Leu Thr Ala Leu Ile Lys Pro Lys Lys Ile Lys Pro Pro Leu Pro
                165                 170                 175
Ser Ile Lys Lys Leu Val Glu Asp Arg Trp Asn Asn Pro Gln Glu Ile
            180                 185                 190
Arg Gly Arg Arg Gly Asn His Thr Met Asn Gly His
        195                 200
<210>188
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>188
Arg Ser Ser Ser Arg Lys Leu Leu Asp Thr Phe Leu Asp His Gly Phe
  1               5                  10                  15
Ile Ala
<210>189
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>189
Asp Asn Ile Ser Met Lys His Met Gly Ile Leu Gly Gln Glu Trp Lys
  1               5                  10                  15
Pro
<210>190
<211>19
<212>PRT
<213>Human immunodeficiency virus
<400>190
Glu Phe Cys Asn Asn Cys Cys Leu Phe Ile Ser Glu Leu Gly Val Ser
  1               5                  10                  15
Ile Ala Glu
<210>191
<211>78
<212>PRT
<213>Human immunodeficiency virus
<400>191
Asp Arg Glu Glu Gln Glu Met Glu Pro Val Asn His Lys Leu Glu Pro
  1               5                  10                  15
Trp Glu His Pro Gly Ser Gln Pro Lys Thr Ala Cys Asn Ser Cys Tyr
             20                  25                  30
Cys Lys Lys Cys Cys Phe His Cys Gln Val Cys Phe Thr Lys Lys Gly
         35                  40                  45
Leu Gly Ile Phe Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala
     50                  55                  60
His Arg Ser Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln
 65                  70                  75
<210>192
<211>85
<212>PRT
<213>Human immunodeficiency virus
<400>192
Val Val Asn Val Met Gln Ala Leu Thr Ile Leu Ala Ile Val Ala Leu
  1               5                  10                  15
Val Val Ala Thr Ile Ile Ala Ile Val Val Trp Thr Ile Val Phe Ile
             20                  25                  30
Glu Tyr Arg Lys Ile Leu Arg Gln Lys Lys Ile Asp Arg Leu Ile Asp
         35                  40                  45
Arg Ile Arg Glu Arg Ala Glu Asp Ser Gly Asn Glu Gly Asp Gly Asp
     50                  55                  60
Gln Glu Glu Leu Ser Ala Phe Met Glu Met Gly His His Ala Pro Trp
65                  70                  75                  80
Asp Val Asp Asp Gln
                 85
<210>193
<211>29
<212>PRT
<213>Human immunodeficiency virus
<400>193
Cys Cys Arg Lys Leu Val Gly His Ser Leu Leu Trp Gly Thr Cys Met
  1               5                  10                  15
Glu Arg Gly Asn His His Phe Ile Leu Cys Ile Arg Cys
             20                  25
<210>194
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>194
Tyr Arg Gly Thr
  1
<210>195
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>195
Cys Leu Gly Tyr Thr Cys Leu Cys Thr Arg Arg Pro Gln Pro Thr Arg
  1               5                  10                  15
Asn Gly Phe Gly Lys Cys Asn Arg Lys Phe
             20                  25
<210>196
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>196
His Val Glu Lys
  1
<210>197
<211>32
<212>PRT
<213>Human immunodeficiency virus
<400>197
Asn Gly Lys Ser Asp Ala Gly Arg Cys Asn Gln Phe Met Gly Ser Lys
  1               5                  10                  15
Pro Lys Thr Met Cys Lys Val Asp Pro Thr Leu Cys His Phe Arg Met
             20                  25                  30
<210>198
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>198
Glu His Glu Gly Asn Glu Lys Leu Leu Phe Gln Cys Asn His Ser Ser
  1               5                  10                  15
Lys Arg
<210>199
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>199
Glu Ala Asp Ser Val Cys Thr Phe Leu
  1               5
<210>200
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>200
Tyr Ser Thr Thr Tyr
  1               5
<210>201
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>201
Ile Asn Lys Leu
  1
<210>202
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>202
Tyr Leu Ser His Asn Thr Ser Leu Ser Lys Gly His Phe
  1               5                  10
<210>203
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>203
Ser Asn Ser Tyr Thr Leu Leu His Ser Ser Trp Leu Cys Asn Ser Lys
  1               5                  10                  15
Val
<210>204
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>204
Asp Ile Gln Trp Asp Arg Thr Met Pro
  1               5
<210>205
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>205
His Ser Thr Met Tyr Thr Trp Asp
  1               5
<210>206
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>206
Ala Ser Gly Ile Asn Ser Thr Thr Val Lys Trp
  1               5                  10
<210>207
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>207
Pro Ser Arg Arg Arg Asn Asn Asn
  1               5
<210>208
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>208
Lys Ser Asp Lys Gln Cys Gln Asn Asn Asn Ser Thr Ser
  1               5                  10
<210>209
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>209
Ser Ile Cys Arg Asn Cys Met Tyr Lys Thr Arg Gln
  1               5                  10
<210>210
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>210
Tyr Lys Lys Lys Tyr Lys Asp Arg Thr Arg Thr Asn Ile Leu Cys Asn
  1               5                  10                  15
Arg Arg His Asn Arg Arg His Lys Thr Ser Thr Leu
             20                  25
<210>211
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>211
Asn Phe Thr Lys Gly Lys
  1               5
<210>212
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>212
Lys Ile Ser Arg Thr Leu Pro Glu
  1               5
<210>213
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>213
Asn Asn Lys Ile Cys Ile Ile Leu Arg Arg Gly Pro Arg Ser Tyr Asn
  1               5                  10                  15
Thr
<210>214
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>214
Arg Arg Ile Phe Leu Leu
  1               5
<210>215
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>215
Tyr Ile Arg Pro Val
  1               5
<210>216
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>216
Trp Cys Ile His Ala
  1               5
<210>217
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>217
Trp Tyr Lys Lys
  1
<210>218
<211>36
<212>PRT
<213>Human immunodeficiency virus
<400>218
Phe Lys Leu Asn His His Asn Pro Met Gln Asn Lys Ala Asn Tyr Lys
  1               5                  10                  15
Tyr Val Ala Gly Gly Arg Thr Ser Asn Val Cys Pro Ser His Lys Arg
             20                  25                  30
Lys His Asn Met
         35
<210>219
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>219
Ile Lys Tyr His Arg Thr Thr Ile Gly Thr
  1               5                  10
<210>220
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>220
Trp Arg Asn Arg Ala Lys
  1               5
<210>221
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>221
Tyr Arg Asp Ile Gln Thr Trp Arg Arg Arg Tyr Glu Glu Gln Leu Glu
  1               5                  10                  15
Lys
<210>222
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>222
Ser Gly Arg Asn
  1
<210>223
<211>81
<212>PRT
<213>Human immunodeficiency virus
<400>223
Ala Ile Gly Ser Ser Thr His Tyr Asn Lys Lys Glu Ser Gly Gly Glu
  1               5                  10                  15
Arg Lys Lys Ser Ser Gly Asn Arg Ser Cys Val Pro Trp Val Leu Arg
             20                  25                  30
Ser Ser Arg Lys His Tyr Gly Arg Gly Val Asn Asn Ala Asp Gly Thr
         35                  40                  45
Gly Gln Thr Ile Ala Val Trp Tyr Ser Ala Thr Ala Lys Gln Phe Ala
     50                  55                  60
Glu Gly Tyr Arg Ser Ala Thr Ala Ser Val Ala Thr His Gly Leu Gly
 65                  70                  75                  80
His
<210>224
<211>41
<212>PRT
<213>Human immunodeficiency virus
<400>224
Ala Ala Pro Asp Lys Ser Pro Gly Tyr Arg Lys Ile Pro Lys Gly Ser
  1               5                  10                  15
Thr Ala Pro Arg Asp Leu Gly Leu Leu Trp Lys Thr His Leu His Tyr
             20                  25                  30
Cys Cys Thr Leu Glu Leu Gln Leu Glu
         35                  40
<210>225
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>225
Gln Ile Ser Lys Arg Asp Leu Gly
  1               5
<210>226
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>226
His Asp Leu Asp Ala Met Gly
  1               5
<210>227
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>227
Leu His Lys His Ser Ile Gln Val Ala
  1               5
<210>228
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>228
Arg Ile Ala Lys Pro Ala Gly Lys Glu
  1               5
<210>229
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>229
Lys Arg Ser Ile Ser Ile Gly Gln Leu Glu Lys Ser Met Glu Leu Val
  1               5                  10                  15
<210>230
<211>32
<212>PRT
<213>Human immunodeficiency virus
<400>230
His Asn Lys Leu Ala Val Val Tyr Lys Asn Ile His Asn Asn Ser Arg
  1               5                  10                  15
Arg Leu Asp Arg Phe Lys Asn Asn Phe Cys Cys Ala Leu Tyr Ser Lys
             20                  25                  30
<210>231
<211>79
<212>PRT
<213>Human immunodeficiency virus
<400>231
Ala Gly Ile Leu Thr Phe Val Val Ser Asp Pro Tyr Pro Glu Pro Arg
  1               5                  10                  15
Gly Thr Arg Gln Ala Arg Lys Asn Arg Arg Arg Arg Trp Lys Ala Arg
             20                  25                  30
Gln Gly Gln Ile His Ser Ile Ser Glu Arg Ile Leu Ser Ala Cys Leu
         35                  40                  45
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Ile Glu Gly
     50                  55                  60
Leu His Ile Ser Gly Ser Glu Gly Gly Gly Thr Ser Gly Thr Gln
 65                  70                  75
<210>232
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>232
Ser Gln Gly Thr Thr Glu Arg Val Gly Ser Pro
  1               5                  10
<210>233
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>233
Ile Ser Gly Lys Ser Cys Ala Val Leu Gly Ser Gly Ala Lys Lys Glu
  1               5                  10                  15
Tyr Tyr
<210>234
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>234
Tyr His Ser Asn Ser Ser Ser
  1               5
<210>235
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>235
Asp Tyr Arg Ile Ser Thr Arg Thr Leu
  1               5
<210>236
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>236
Ser Tyr Leu Gln His Thr
  1               5
<210>237
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>237
Lys Asn Lys Thr Gly Leu
  1               5
<210>238
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>238
Ser Ser Phe Ala Ile Lys Trp Gly Ala Ser Gly Arg Lys Val Ala
  1               5                  10                  15
<210>239
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>239
Leu Asp Gly Leu Leu
  1               5
<210>240
<211>55
<212>PRT
<213>Human immunodeficiency virus
<400>240
Glu Glu Leu Ser Gln Gln Gln Met Gly Trp Glu Gln Tyr Leu Glu Thr
  1              5                  10                  15
Trp Lys Asn Met Glu Gln Ser Arg Val Ala Ile Gln Gln Leu Leu Met
             20                  25                  30
Arg Ile Val Pro Gly Trp Lys His Lys Arg Arg Gly Arg Trp Val Phe
         35                  40                  45
Gln Ser Asp Leu Arg Tyr Leu
    50                  55
<210>241
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>241
Leu Thr Arg Glu Leu
  1               5
<210>242
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>242
Ile Leu Ala Ser Phe
  1               5
<210>243
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>243
Lys Lys Arg Gly Asp Trp Lys Gly
  1               5
<210>244
<211>36
<212>PRT
<213>Human immunodeficiency virus
<400>244
Phe Thr Leu Arg Lys Gly Lys Arg Ser Leu Ile Cys Gly Ser Ile Thr
  1               5                  10                  15
His Lys Ala Thr Ser Leu Ile Gly Thr Thr Thr His Gln Asp Gln Gly
             20                  25                  30
Ser Asp Ser His
         35
<210>245
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>245
Leu Leu Gly Gly Ala Ser Ser
  1               5
<210>246
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>246
Tyr Gln Leu Thr Gln Gly Lys
  1               5
<210>247
<211>27
<212>PRT
<213>Human immunodeficiency virus
<400>247
Lys Arg Pro Thr Arg Glu Lys Thr Thr Ala Cys Tyr Thr Leu Cys Ala
  1               5                  10                  15
Ser Met Glu Trp Arg Met Ile Thr Glu Lys Tyr
             20                  25
<210>248
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>248
Ser Gly Ser Leu Thr Val Asn
  1               5
<210>249
<211>74
<212>PRT
<213>Human immunodeficiency virus
<400>249
His Thr Asp Thr Gly Pro Ala Asn Tyr Ile Arg Ser Phe Thr Lys Thr
  1               5                  10                  15
Ala Asp Thr Glu Gly Thr Phe Arg Gly Asp Phe Pro Leu Gly Arg Ser
             20                  25                  30
Arg Arg Cys Gly Leu Ala Gly Leu Gly Val Val Asn Pro Gln Met Leu
         35                  40                  45
His Ile Ser Ser Cys Phe Ser Pro Val Leu Gly Leu Ser Ser Gln Thr
     50                  55                  60
Arg Ser Glu Pro Gly Ser Ser Leu Ala Asn
 65                  70
<210>250
<211>29
<212>PRT
<213>Human immunodeficiency virus
<400>250
Gly Thr His Cys Leu Ser Leu Asn Lys Ala Cys Leu Glu Gly Leu Glu
  1               5                  10                  15
Arg Pro Pro Pro Arg Trp Ser Ser Ser Phe Cys Ser Leu
             20                  25
<210>251
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>251
Gly Leu Ile Ala Arg Trp Arg
  1              5
<210>252
<211>9078
<212>DNA
<213>Human immunodeficiency virus
<220>
<221>CDS
<222>(3)..(9077)
<400>252
aa tct cta gca gtg gcg ccc gaa cag gga ctt gaa agc gaa agt aag     47
    Ser Leu Ala Val Ala Pro Glu Gln Gly Leu Glu Ser Glu Ser Lys
      1               5                  10                  15
acc aga gga gat ctc tcg acg cag gac tcg gct tgc tga agt gca ctc    95
Thr Arg Gly Asp Leu Ser Thr Gln Asp Ser Ala Cys     Ser Ala Leu
                 20                  25                  30
ggc aag agg cga gag cgg cga ctg gtg agt acg cca att ata ttt gac    143
Gly Lys Arg Arg Glu Arg Arg Leu Val Ser Thr Pro Ile Ile Phe Asp
             35                  40                  45
tag cgg agg cta gaa gga gag aga tgg gtg cga gag cgt caa tat taa    191
    Arg Arg Leu Glu Gly Glu Arg Trp Val Arg Glu Arg Gln Tyr
         50                  55                  60
gag ggg gaa aat tag ata aat ggg aaa aaa tta ggt taa ggc cag ggg    239
Glu Gly Glu Asn     Ile Asn Gly Lys Lys Leu Gly     Gly Gln Gly
     65                  70                  75
gaa aga aac act ata tgc taa aac acc tag tat ggg caa gca ggg agc    287
Glu Arg Asn Thr Ile Cys     Asn Thr     Tyr Gly Gln Ala Gly Ser
 80                  85                  90                  95
tgg aaa gat ttg cac tta acc ctg gcc ttt tag aga cat cag aag gct    335
Trp Lys Asp Leu His Leu Thr Leu Ala Phe     Arg His Gln Lys Ala
                100                 105                 110
gta aac aaa taa tga aac agc tac aat cag ctc ttc aga cag gaa cag    383
Val Asn Lys         Asn Ser Tyr Asn Gln Leu Phe Arg Gln Glu Gln
            115                 120                 125
agg aac tta gat cat tat tca aca cag tag caa ctc cct att gtg tac    431
Arg Asn Leu Asp His Tyr Ser Thr Gln     Gln Leu Pro Ile Val Tyr
        130                 135                 140
ata cag aga tag atg tac gag aca cca gag aag cct tag aca aga tag    479
Ile Gln Arg     Met Tyr Glu Thr Pro Glu Lys Pro     Thr Arg
    145                 150                 155
agg aag aac aaa aca aaa ttc agc aaa aaa cac agc agg caa agg agg    527
Arg Lys Asn Lys Thr Lys Phe Ser Lys Lys His Ser Arg Gln Arg Arg
160                 165                 170                 175
ctg acg gga agg tca gtc aaa att atc cta tag tac aga atc tcc aag    575
Leu Thr Gly Arg Ser Val Lys Ile Ile Leu     Tyr Arg Ile Ser Lys
                180                 185                 190
ggc aaa tgg tac atc agc cca tat cac cta gaa ctt taa atg cat ggg    623
Gly Lys Trp Tyr Ile Ser Pro Tyr His Leu Glu Leu     Met His Gly
            195                 200                 205
taa aag tgg tag aag aga agg ctt tta gcc cag aag taa tac cca tgt    671
    Lys Trp     Lys Arg Arg Leu Leu Ala Gln Lys     Tyr Pro Cys
        210                 215                 220
ttt cag cgt tat cag aag gag cca ccc cac aag att taa aca cca tgc    719
Phe Gln Arg Tyr Gln Lys Glu Pro Pro His Lys Ile     Thr Pro Cys
    225                 230                 235
taa aca cag tgg ggg gac atc aag cag cta tgc aaa tat taa aag ata    767
    Thr Gln Trp Gly Asp Ile Lys Gln Leu Cys Lys Tyr     Lys Ile
240                 245                 250                 255
cca tca atg aag agg ctg cag aat ggg ata gat tac atc cag tac atg    815
Pro Ser Met Lys Arg Leu Gln Asn Gly Ile Asp Tyr Ile Gln Tyr Met
                260                 265                 270
cag ggc cta ttg cac cag gcc aaa tga gag aac caa ggg gaa gtg aca    863
Gln Gly Leu Leu His Gln Ala Lys     Glu Asn Gln Gly Glu Val Thr
            275                 280                 285
tag cag gaa cta cta gta acc tac agg aac aaa tag cat gga tga cga    911
    Gln Glu Leu Leu Val Thr Tyr Arg Asn Lys     His Gly     Arg
        290                 295                 300
gta acc cac ctg ttc cag tag gag aca tct ata aaa gat gga taa ttc    959
Val Thr His Leu Phe Gln     Glu Thr Ser Ile Lys Asp Gly     Phe
    305                 310                 315
tgg gat taa ata aaa tag taa gaa tgt ata gcc cta cca gca ttc tgg    1007
Trp Asp      Ile Lys            Glu Cys Ile Ala Leu Pro Ala Phe Trp
320                 325                 330                 335
aca taa aac aag ggc caa agg aac cct tta gag act atg tag acc ggt    1055
Thr     Asn Lys Gly Gln Arg Asn Pro Leu Glu Thr Met     Thr Gly
                340                 345                 350
tct tta aaa ctt taa gag cgg aac aag cta cgc aag gtg taa aaa att    1103
Ser Leu Lys Leu     Glu Arg Asn Lys Leu Arg Lys Val      Lys Ile
            355                 360                 365
gga tga cag aca cct tgt tgg tcc aaa atg cga acc cag att gta aga    1151
Gly     Gln Thr Pro Cys Trp Ser Lys Met Arg Thr Gln Ile Val Arg
        370                 375                 380
cca ttt taa gag cat tag gac cag ggg ctt caa tag aag aaa tga tga    1199
Pro Phe     Glu His     Asp Gln Gly Leu Gln     Lys Lys
    385                 390                 395
cag cat gtc agg gag tgg gag gac cta gcc ata aag caa aag tgt tgg    1247
Gln His Val Arg Glu Trp Glu Asp Leu Ala Ile Lys Gln Lys Cys Trp
400                 405                 410                 415
ccg agg caa tga gcc aaa caa aca gtg cca tac tga tgc aga gaa gca    1295
Pro Arg Gln     Ala Lys Gln Thr Val Pro Tyr     Cys Arg Glu Ala
                420                 425                 430
att tta aag gct cta aaa gaa ttg tta aat gtt tca act gtg gca agg    1343
Ile Leu Lys Ala Leu Lys Glu Leu Leu Asn Val Ser Thr Val Ala Arg
            435                 440                 445
aag ggc aca tag cca gaa att gca ggg ccc cta gga aaa agg gct gtt    1391
Lys Gly Thr     Pro Glu Ile Ala Gly Pro Leu Gly Lys Arg Ala Val
        450                 455                 460
gga aat gtg gaa aag aag gac acc aaa tga aag att gta ctg aga gac    1439
Gly Asn Val Glu Lys Lys Asp Thr Lys     Lys Ile Val Leu Arg Asp
    465                 470                 475
agg cca att ttt tag gga aaa tct ggc cct ccc aca agg gag ggc cag    1487
Arg Pro Ile Phe     Gly Lys Ser Gly Pro Pro Thr Arg Glu Gly Gln
480                 485                 490                 495
gga att ttc ttc aga aca gac cag agc caa cag ccc cac cag agg aga    1535
Gly Ile Phe Phe Arg Thr Asp Gln Ser Gln Gln Pro His Gln Arg Arg
                500                 505                 510
gct tca ggt ttg ggg aag aga caa caa ctc cat ctc aga agc agg agc    1583
Ala Ser Gly Leu Gly Lys Arg Gln Gln Leu His Leu Arg Ser Arg Ser
            515                 520                 525
caa tag aca agg aac tat atc ctt taa ctt ccc tca aat cac tct ttg    1631
Gln     Thr Arg Asn Tyr Ile Leu     Leu Pro Ser Asn His Ser Leu
        530                 535                 540
gca acg acc cct cgt cac aat aaa gat agg ggg gca att aaa gga agc    1679
Ala Thr Thr Pro Arg His Asn Lys Asp Arg Gly Ala Ile Lys Gly Ser
    545                 550                 555
tct att aga tac agg agc agg tga tac agt att aga aga cct gaa ttt    1727
Ser Ile Arg Tyr Arg Ser Arg     Tyr Ser Ile Arg Arg Pro Glu Phe
560                 565                 570                 575
gcc agg gaa atg gaa acc aaa aat gat agg ggg aat tgg agg ttt tat    1775
Ala Arg Glu Met Glu Thr Lys Asn Asp Arg Gly Asn Trp Arg Phe Tyr
                580                 585                 590
caa agt aag aca gta tga aca gat acc cat aga aat ttg cgg aca caa    1823
Gln Ser Lys Thr Val     Thr Asp Thr His Arg Asn Leu Arg Thr Gln
            595                 600                 605
agc tat agg tac agt att agt agg acc tac acc tgt caa cat aat tgg    1871
Ser Tyr Arg Tyr Ser Ile Ser Arg Thr Tyr Thr Cys Gln His Asn Trp
        610                 615                 620
aag aaa tct gtt gac tca gct tgg ttg cac ttt aaa ttt tcc aat cag    1919
Lys Lys Ser Val Asp Ser Ala Trp Leu His Phe Lys Phe Ser Asn Gln
    625                 630                 635
tcc cat tga aac tgt acc agt aaa att aaa gcc agg aat gga tgg ccc    1967
Ser His     Asn Cys Thr Ser Lys Ile Lys Ala Arg Asn Gly Trp Pro
640                 645                 650                 655
aaa ggt taa aca atg gcc att gac aga aga gaa aat aaa agc att aac    2015
Lys Gly     Thr Met Ala Ile Asp Arg Arg Glu Asn Lys Ser Ile Asn
                660                 665                 670
agc aat ttg tga tga aat gga gaa aga agg aaa aat tac aaa aat tgg    2063
Ser Asn Leu         Asn Gly Glu Arg Arg Lys Asn Tyr Lys Asn Trp
            675                 680                 685
gcc tga aaa tcc ata taa cac tcc aat att tgc cat aaa aaa gaa gga    2111
Ala     Lys Ser Ile     His Ser Asn Ile Cys His Lys Lys Glu Gly
        690                 695                 700
cag tac taa gtg gag aaa gtt agt aga ttt cag gga act caa taa aag    2159
Gln Tyr     Val Glu Lys Val Ser Arg Phe Gln Gly Thr Gln     Lys
    705                 710                 715
aac tca aga ttt ttg gga agt tca att agg aat acc aca ccc agc agg    2207
Asn Ser Arg Phe Leu Gly Ser Ser Ile Arg Asn Thr Thr Pro Ser Arg
720                 725                 730                 735
gtt aaa aaa gaa aaa atc agt gac agt act gga tgt ggg gga tgc ata    2255
Val Lys Lys Glu Lys Ile Ser Asp Ser Thr Gly Cys Gly Gly Cys Ile
                740                 745                 750
ttt ttc aat tcc ttt ata tga aga ctt cag gaa gta tac tgc att cac    2303
Phe Phe Asn Ser Phe Ile     Arg Leu Gln Glu Val Tyr Cys Ile His
            755                 760                 765
cat acc tag tag aaa caa tga aac acc agg gat tag gta tca gta caa    2351
His Thr         Lys Gln     Asn Thr Arg Asp     Val Ser Val Gln
        770                 775                 780
tgt act tcc aca ggg atg gaa agg atc act agc aat att cca aag tag    2399
Cys Thr Ser Thr Gly Met Glu Arg Ile Thr Ser Asn Ile Pro Lys
    785                 790                 795
cat gac aaa aac ctt aga gcc ttt tag aaa aca aaa tcc agg cat agt    2447
His Asp Lys Asn Leu Arg Ala Phe     Lys Thr Lys Ser Arg His Ser
800                 805                 810                 815
tat cta tca ata cat gga tga ttt gta tgt agg atc tga ctt aga gat    2495
Tyr Leu Ser Ile His Gly     Phe Val Cys Arg Ile     Leu Arg Asp
                820                 825                 830
agg gca gca tag aac aaa aat aga gga act gag aca aca ttt gtt gag    2543
Arg Ala Ala     Asn Lys Asn Arg Gly Thr Glu Thr Thr Phe Val Glu
            835                 840                 845
gtg ggg att tac cac acc aga caa gaa aca tta gaa aga acc tcc att    2591
Val Gly Ile Tyr His Thr Arg Gln Glu Thr Leu Glu Arg Thr Ser Ile
        850                 855                 860
tct ttg gat ggg gta tga act cca tcc tga caa atg gac agt aca gcc    2639
Ser Leu Asp Gly Val     Thr Pro Ser     Gln Met Asp Ser Thr Ala
    865                 870                 875
tac aca gct gcc aga aaa aga tag ctg gac tgt caa tga tat aca aaa    2687
Tyr Thr Ala Ala Arg Lys Arg     Leu Asp Cys Gln     Tyr Thr Lys
880                 885                 890                 895
gtt agt ggg aaa att aaa ctg ggc aag tca gat tta tcc tgg aat taa    2735
Val Ser Gly Lys Ile Lys Leu Gly Lys Ser Asp Leu Ser Trp Asn
                900                 905                 910
agt aag gca act ttg taa act cct tag ggg ggc caa agc act aac aga    2783
Ser Lys Ala Thr Leu     Thr Pro     Gly Gly Gln Ser Thr Asn Arg
            915                 920                 925
cat agt acc act aac tga aga agc aga att aga att ggc aga aaa cag    2831
His Ser Thr Thr Asn     Arg Ser Arg Ile Arg Ile Gly Arg Lys Gln
        930                 935                 940
gga aat tct aaa aga acc agt aca tgg agt ata cta tga ccc atc aaa    2879
Gly Asn Ser Lys Arg Thr Ser Thr Trp Ser Ile Leu     Pro Ile Lys
    945                 950                 955
aga ctt gat agc tga aat aca gaa aca ggg gca gga aca atg gac ata    2927
Arg Leu Asp Ser     Asn Thr Glu Thr Gly Ala Gly Thr Met Asp Ile
960                 965                 970                 975
tca aat tta cca aga acc att caa aaa tct aaa aac agg gaa gta tgc    2975
Ser Asn Leu Pro Arg Thr Ile Gln Lys Ser Lys Asn Arg Glu Val Cys
                980                 985                 990
aaa aat gag gac tgc cca cac taa tga tgt aaa aca att aac aga ggc    3023
Lys Asn Glu Asp Cys Pro His         Cys Lys Thr Ile Asn Arg Gly
            995                1000                1005
tgt gca gaa aat agc cat gga agg cat agt aat atg ggg aaa aac tcc    3071
Cys Ala Glu Asn Ser His Gly Arg His Ser Asn Met Gly Lys Asn Ser
       1010                1015                1020
taa att tag att acc cat cca aaa aga aac atg gga gac atg gtg gac    3119
    Ile     Ile Thr His Pro Lys Arg Asn Met Gly Asp Met Val Asp
   1025                1030                1035
aga cta ttg gca agc cac ctg gat tcc tga gtg gga att tgt taa tac    3167
Arg Leu Leu Ala Ser His Leu Asp Ser     Val Gly Ile Cys     Tyr
1040                1045                1050                1055
ccc tcc ctt agt aaa att atg gta cca gct gga aaa aga tcc cat agt    3215
Pro Ser Leu Ser Lys Ile Met Val Pro Ala Gly Lys Arg Ser His Ser
               1060                1065                1070
agg agt aga aac ttt cta tgt aga tgg agc agc taa tag gga gac taa    3263
Arg Ser Arg Asn Phe Leu Cys Arg Trp Ser Ser         Gly Asp
           1075                1080                1085
aat agg aaa agc agg gta tgt tac tga cag agg aag gaa gaa aat tgt    3311
Asn Arg Lys Ser Arg Val Cys Tyr     Gln Arg Lys Glu Glu Asn Cys
       1090                1095                1100
ttc tct aac tga aac aac aaa tca gaa gac tga att gca agc aat ttg    3359
Phe Ser Asn     Asn Asn Lys Ser Glu Asp      Ile Ala Ser Asn Leu
   1105                1110                1115
tat agc ttt gca aga ttc agg atc aga agt aaa cat agt aac aga ttc    3407
Tyr Ser Phe Ala Arg Phe Arg Ile Arg Ser Lys His Ser Asn Arg Phe
1120                1125                1130                1135
aca gta tgc att agg gat cat tca agc aca acc aga taa gag tga atc    3455
Thr Val Cys Ile Arg Asp His Ser Ser Thr Thr Arg     Glu     Ile
               1140                1145                1150
aga gtt agt taa cca aat aat aga aca att aat gaa aaa gga aag agt    3503
Arg Val Ser      Pro Asn Asn Arg Thr Ile Asn Glu Lys Gly Lys Ser
           1155                1160                1165
cta cct gtc atg ggt acc agc aca taa agg aat tgg agg aaa tga aca    3551
Leu Pro Val Met Gly Thr Ser Thr     Arg Asn Trp Arg Lys     Thr
       1170                1175                1180
agt aga taa att agt aag tag tgg aat cag gaa agt gct att tct aga    3599
Ser Arg     Ile Ser Lys     Trp Asn Gln Glu Ser Ala Ile Ser Arg
   1185                1190                1195
tgg aat aga taa agc tca aga aga gca tga aaa gta tca cag caa ttg    3647
Trp Asn Arg     Ser Ser Arg Arg Ala     Lys Val Ser Gln Gln Leu
1200                1205                1210                1215
gag agc aat ggc tag tga ctt taa tct gcc acc cat agt agc aaa aga    3695
Glu Ser Asn Gly         Leu     Ser Ala Thr His Ser Ser Lys Arg
               1220                1225                1230
aat agt ggc tag ctg tga tca atg tca gct aaa agg aga agc cat gca    3743
Asn Ser Gly     Leu     Ser Met Ser Ala Lys Arg Arg Ser His Ala
           1235                1240                1245
tgg aca agt aga ctg tag tcc agg gat atg gca att aga ttg tac aca    3791
Trp Thr Ser Arg Leu     Ser Arg Asp Met Ala Ile Arg Leu Tyr Thr
       1250                1255                1260
ttt aga agg aaa aat cat cct ggt agc agt cca tgt agc cag tgg cta    3839
Phe Arg Arg Lys Asn His Pro Gly Ser Ser Pro Cys Ser Gln Trp Leu
  1265                1270                1275
cat gga agc aga ggt tat ccc agc aga aac agg aca aga gac agc ata    3887
His Gly Ser Arg Gly Tyr Pro Ser Arg Asn Arg Thr Arg Asp Ser Ile
1280               1285                1290                1295
ctt tat act aaa att agc agg aag atg gcc agt caa agt aat aca tac    3935
Leu Tyr Thr Lys Ile Ser Arg Lys Met Ala Ser Gln Ser Asn Thr Tyr
               1300                1305                1310
aga taa tgg tag taa ttt cac cag tac tgc agt taa ggc agc ctg ttg    3983
Arg     Trp         Phe His Gln Tyr Cys Ser     Gly Ser Leu Leu
           1315                1320                1325
gtg ggc agg tat cca aca gga att tgg aat tcc cta cag tcc cca aag    4031
Val Gly Arg Tyr Pro Thr Gly Ile Trp Asn Ser Leu Gln Ser Pro Lys
       1330                1335                1340
tca ggg agt agt aga agc cat gaa taa aga att aaa gaa aat tat agg    4079
Ser Gly Ser Ser Arg Ser His Glu     Arg Ile Lys Glu Asn Tyr Arg
  1345                1350                1355
gca ggt aag aga tca agc tga gca cct taa gac agc agt act aat ggc    4127
Ala Gly Lys Arg Ser Ser     Ala Pro     Asp Ser Ser Thr Asn Gly
1360               1365                1370                1375
agt att cat tca caa ttt taa aag aaa agg ggg gat tgg ggg gta cag    4175
Ser Ile His Ser Gln Phe     Lys Lys Arg Gly Asp Trp Gly Val Gln
               1380                1385                1390
tgc agg gga aag aat aat aga tat aat agc aac aga cat aca aac taa    4223
Cys Arg Gly Lys Asn Asn Arg Tyr Asn Ser Asn Arg His Thr Asn
          1395                1400                1405
aga att aca aaa aca gat tac aaa aat tca aaa ttt tcg ggt tta tta    4271
Arg Ile Thr Lys Thr Asp Tyr Lys Asn Ser Lys Phe Ser Gly Leu Leu
       1410                1415                1420
cag aga cag cag aga ccc cag ttg gaa agg acc agc caa act act ctg    4319
Gln Arg Gln Gln Arg Pro Gln Leu Glu Arg Thr Ser Gln Thr Thr Leu
   1425                1430                1435
gaa agg tga agg ggc agt aat aat aca aga taa tag tga cat aaa ggt    4367
Glu Arg     Arg Gly Ser Asn Asn Thr Arg             His Lys Gly
1440               1445                1450                1455
agt acc aag gag gaa agc aaa aat cat taa gga cta tgg aaa aca gat    4415
Ser Thr Lys Glu Glu Ser Lys Asn His     Gly Leu Trp Lys Thr Asp
               1460                1465                1470
ggc agg tgc tga ttg tgt ggc agg tag aca gga tga aga tta gaa cat    4463
Gly Arg Cys     Leu Cys Gly Arg     Thr Gly     Arg Leu Glu His
                 1475                1480                1485
gga ata gtt tag taa aac acc ata tgt atg ttt caa gga gag cta atg    4511
Gly Ile Val            Asn Thr Ile Cys Met Phe Gln Gly Glu Leu Met
       1490                1495                1500
gat ggt ttt aca gac atc att atg aca gca gac atc caa aag taa gtt    4559
Asp Gly Phe Thr Asp Ile Ile Met Thr Ala Asp Ile Gln Lys      Val
   1505                1510                1515
cag aag tac aca tcc cat tag gaa agg cta aat tag taa taa aaa cat    4607
Gln Lys Tyr Thr Ser His     Glu Arg Leu Asn              Lys His
1520               1525                1530                1535
att ggg ggt tgc aga cag gag aaa gag atc ggc att tgg gtc atg gag    4655
Ile Gly Gly Cys Arg Gln Glu Lys Glu Ile Gly Ile Trp Val Met Glu
               1540                1545                1550
tct cca tag aat gga gat tga gaa gat ata cca cac aaa tag aac ctg    4703
Ser Pro     Asn Gly Asp     Glu Asp Ile Pro His Lys     Asn Leu
           1555                1560                1565
gcc tgg cag acc agc taa ttc att tgt att att ttg att gtt ttg cag    4751
Ala Trp Gln Thr Ser     Phe Ile Cys Ile Ile Leu Ile Val Leu Gln
       1570                1575                1580
act ctg ata taa gga aag cca tat tag gac aca tag tta ttc cta ggt    4799
Thr Leu Ile     Gly Lys Pro Tyr     Asp Thr     Leu Phe Leu Gly
   1585                1590                1595
gtg act atc aag cag gac ata ata ata agg tag gat ctc tac aat act    4847
Val Thr Ile Lys Gln Asp Ile Ile Ile Arg     Asp Leu Tyr Asn Thr
1600               1605                1610                1615
tgg cac tga cag cat tga taa aac caa aaa aga taa agc cac ctc tgc    4895
Trp His      Gln His        Asn Gln Lys Arg     Ser His Leu Cys
                1620                1625                1630
cta gta tca aga aat tag tag agg ata gat gga aca atc ccc agg aga    4943
Leu Val Ser Arg Asn         Arg Ile Asp Gly Thr Ile Pro Arg Arg
           1635                1640                1645
tca ggg gcc gca gag gga acc aca caa tga atg gac act aga gct tct    4991
Ser Gly Ala Ala Glu Gly Thr Thr Gln     Met Asp Thr Arg Ala Ser
       1650                1655                1660
aga gga gct caa gca gga agc tgt tag aca ctt tcc tag acc atg gct    5039
Arg Gly Ala Gln Ala Gly Ser Cys     Thr Leu Ser     Thr Met Ala
   1665                1670                1675
tca tag ctt agg aca aca tat cta tga aac ata tgg gga tac ttg ggc    5087
Ser     Leu Arg Thr Thr Tyr Leu     Asn Ile Trp Gly Tyr Leu Gly
1680               1685                1690                1695
agg agt gga agc cat aat aag aat tct gca aca act gct gtt tat tca    5135
Arg Ser Gly Ser His Asn Lys Asn Ser Ala Thr Thr Ala Val Tyr Ser
               1700                1705                1710
ttt cag aat tgg gtg tca gca tag cag aat agg cat ttt gag aca gag    5183
Phe Gln Asn Trp Val Ser Ala     Gln Asn Arg His Phe Glu Thr Glu
           1715                1720                1725
aag aac aag aaa tgg agc cag taa atc ata aat tag agc ctt ggg agc    5231
Lys Asn Lys Lys Trp Ser Gln     Ile Ile Asn     Ser Leu Gly Ser
       1730                1735                1740
atc cag gaa gtc agc cta aga ctg ctt gta aca gtt gct att gta aaa    5279
Ile Gln Glu Val Ser Leu Arg Leu Leu Val Thr Val Ala Ile Val Lys
   1745                1750                1755
agt gct gct ttc att gcc aag ttt gtt tca cga aaa aag gct tag gca    5327
Ser Ala Ala Phe Ile Ala Lys Phe Val Ser Arg Lys Lys Ala     Ala
1760               1765                1770                1775
tct tct atg gca gga aga agc gaa gac agc gac gaa gcg ctc atc gaa    5375
Ser Ser Met Ala Gly Arg Ser Glu Asp Ser Asp Glu Ala Leu Ile Glu
               1780                1785                1790
gca gtg agg atc atc aaa atc cta tat caa agc agt aag tag taa atg    5423
Ala Val Arg Ile Ile Lys Ile Leu Tyr Gln Ser Ser Lys         Met
           1795                1800                1805
taa tgc aag ctt taa cca ttt tag caa tag tag cct tag tag tag caa    5471
    Cys Lys Leu     Pro Phe     Gln         Pro             Gln
       1810                1815                1820
caa taa tag caa tag ttg tgt gga cca tag tat tca tag aat ata gga    5519
Gln         Gln     Leu Cys Gly Pro     Tyr Ser     Asn Ile Gly
   1825                1830                1835
aaa tat taa gac aga aaa aaa tag aca ggt taa ttg ata gaa taa gag    5567
Lys Tyr     Asp Arg Lys Lys     Thr Gly     Leu Ile Glu     Glu
1840               1845                1850                1855
aaa gag cag aag aca gtg gca atg agg gtg acg ggg atc agg aag aat    5615
Lys Glu Gln Lys Thr Val Ala Met Arg Val Thr Gly Ile Arg Lys Asn
               1860                1865                1870
tat cgg cat tta tgg aga tgg ggc acc atg ctc ctt ggg atg ttg atg    5663
Tyr Arg His Leu Trp Arg Trp Gly Thr Met Leu Leu Gly Met Leu Met
           1875                1880                1885
atc agt agt gct gta gga aac ttg tgg gtc aca gtc tat tat ggg gta    5711
Ile Ser Ser Ala Val Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val
       1890                1895                1900
cct gta tgg aaa ggg gca acc acc act tta ttt tgt gca tca gat gct    5759
Pro Val Trp Lys Gly Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala
   1905                1910                1915
aaa gca tat gat aca gag gta cat aat gtt tgg gct aca cat gcc tgt    5807
Lys Ala Tyr Asp Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys
1920               1925                1930                1935
gta ccc gca gac ccc aac cca caa gaa atg gtt ttg gaa aat gta aca    5855
Val Pro Ala Asp Pro Asn Pro Gln Glu Met Val Leu Glu Asn Val Thr
               1940                1945                1950
gaa aat ttt aac atg tgg aaa aat gaa atg gta aat cag atg cag gaa    5903
Glu Asn Phe Asn Met Trp Lys Asn Glu Met Val Asn Gln Met Gln Glu
           1955                1960                1965
gat gta atc agt tta tgg gat caa agc cta aaa cca tgt gta aag ttg    5951
Asp Val Ile Ser Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu
       1970                1975                1980
acc cca ctc tgt gtc act tta gaa tgt aga aat gtt agc agt aat agt    5999
Thr Pro Leu Cys Val Thr Leu Glu Cys Arg Asn Val Ser Ser Asn Ser
   1985                1990                1995
aat gat acc tac cat gag acc tac cat gag agc atg aag gaa atg aaa    6047
Asn Asp Thr Tyr His Glu Thr Tyr His Glu Ser Met Lys Glu Met Lys
2000               2005                2010                2015
aat tgc tct ttc aat gca acc aca gta gta aga gat agg aag cag aca    6095
Asn Cys Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Thr
               2020                2025                2030
gtg tat gca ctt ttt tat aga ctt gat ata gta cca ctt act aag aag    6143
Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Thr Lys Lys
           2035                2040                2045
aac tat agt gag aat tct agt gag tat tat aga tta ata aat tgt aat    6191
Asn Tyr Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys Asn
       2050                2055                2060
acc tca gcc ata aca caa gcc tgt cca aag gtc act ttt gat cca att    6239
Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Thr Phe Asp Pro Ile
   2065                2070                2075
cct ata cac tat tgc act cca gct ggt tat gca att cta aag tgt aat    6287
Pro Ile His Tyr Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn
2080               2085                2090                2095
gat aag ata ttc aat ggg aca gga cca tgc cat aat gtt agc aca gta    6335
Asp Lys Ile Phe Asn Gly Thr Gly Pro Cys His Asn Val Ser Thr Val
               2100                2105                2110
caa tgt aca cat ggg att aag cca gtg gta tca act caa cta ctg tta    6383
Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu
           2115                2120                2125
aat ggt agc cta gca gaa gga gaa ata ata att aga tct gaa aat ctg    6431
Asn Gly Ser Leu Ala Glu Gly Glu Ile Ile Ile Arg Ser Glu Asn Leu
       2130                2135                2140
aca aac aat gtc aaa aca ata ata gta cat ctt aat caa tct gta gaa    6479
Thr Asn Asn Val Lys Thr Ile Ile Val His Leu Asn Gln Ser Val Glu
   2145                2150                2155
att gta tgt aca aga ccc ggc aat aat aca aga aaa agt ata agg ata    6527
Ile Val Cys Thr Arg Pro Gly Asn Asn Thr Arg Lys Ser Ile Arg Ile
2160               2165                2170                2175
gga cca gga caa aca ttc tat gca aca gga gac ata ata gga gac ata    6575
Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile
                2180                2185                2190
aga caa gca cat tgt aac att agt gaa gat aaa tgg aat gaa act tta    6623
Arg Gln Ala His Cys Asn Ile Ser Glu Asp Lys Trp Asn Glu Thr Leu
           2195                2200                2205
caa agg gta agt aaa aaa tta gca gaa cac ttc cag aat aaa aca ata    6671
Gln Arg Val Ser Lys Lys Leu Ala Glu His Phe Gln Asn Lys Thr Ile
       2210                2215                2220
aaa ttt gca tca tcc tca gga ggg gac cta gaa gtt aca aca cat agc    6719
Lys Phe Ala Ser Ser Ser Gly Gly Asp Leu Glu Val Thr Thr His Ser
   2225                2230                2235
ttt aat tgt aga gga gaa ttt ttc tat tgt aat aca tca ggc ctg ttt    6767
Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Gly Leu Phe
2240               2245                2250                2255
aat ggt gca tac acg cct aat ggt aca aaa agt aat tca agc tca atc    6815
Asn Gly Ala Tyr Thr Pro Asn Gly Thr Lys Ser Asn Ser Ser Ser Ile
                2260                2265                2270
atc aca atc cca tgc aga ata aag caa att ata aat atg tgg cag gag    6863
Ile Thr Ile Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu
           2275                2280                2285
gta gga cga gca atg tat gcc cct ccc ata aaa gga aac ata aca tgt    6911
Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Lys Gly Asn Ile Thr Cys
       2290                2295                2300
aaa tca aat atc aca gga cta cta ttg gta cgt gat gga gga aca gag    6959
Lys Ser Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Thr Glu
   2305                2310                2315
cca aat gat aca gag aca ttc aga cct gga gga gga gat atg agg aac    7007
Pro Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asn
2320               2325                2330                2335
aat tgg aga agt gaa tta tat aaa tat aaa gtg gta gaa att aag cca    7055
Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro
               2340                2345                2350
ttg gga gta gca ccc act aca aca aaa agg aga gtg gtg gag aga gaa    7103
Leu Gly Val Ala Pro Thr Thr Thr Lys Arg Arg Val Val Glu Arg Glu
           2355                2360                2365
aaa aga gca gtg gga ata gga gct gtg ttc ctt ggg ttc tta gga gta    7151
Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Val
       2370                2375                2380
gca gga agc act atg ggc gcg gcg tca ata acg ctg acg gta cag gcc    7199
Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala
   2385                2390                2395
aga caa ttg ctg tct ggt ata gtg caa cag caa agc aat ttg ctg agg    7247
Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg
2400               2405                2410                2415
gct ata gaa gcg caa cag cat ctg ttg caa ctc acg gtc tgg ggc att    7295
Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile
               2420                2425                2430
aag cag ctc cag aca aga gtc ctg gct ata gaa aga tac cta aag gat    7343
Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp
           2435                2440                2445
caa cag ctc cta ggg att tgg ggc tgc tct gga aaa ctc atc tgc act    7391
Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr
           2450                2455                2460
act gct gta cct tgg aac tcc agt tgg agt aac aaa tct caa aaa gag    7439
Thr Ala Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Lys Glu
   2465                2470                2475
att tgg gat aac atg acc tgg atg caa tgg gat aaa gaa att agt aat    7487
Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Ser Asn
2480               2485                2490                2495
tac aca aac aca gta tac agg ttg ctt gaa gaa tcg caa aac cag cag    7535
Tyr Thr Asn Thr Val Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln
               2500                2505                2510
gaa agg aat gaa aaa gat cta tta gca ttg gac agt tgg aaa aat cta    7583
Glu Arg Asn Glu Lys Asp Leu Leu Ala Leu Asp Ser Trp Lys Asn Leu
           2515                2520                2525
tgg agt tgg ttt gac ata aca aat tgg ctg tgg tat ata aaa ata ttc    7631
Trp Ser Trp Phe Asp Ile Thr Asn Trp Leu Trp Tyr Ile Lys Ile Phe
       2530                2535                2540
ata ata ata gta gga ggc ttg ata ggt tta aga ata att ttt gct gtg    7679
Ile Ile Ile Val Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe Ala Val
   2545               2550                2555
ctc tct ata gta aat aga gtt agg cag gga tac tca cct ttg tcg ttt    7727
Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe
2560              2565                2570                2575
cag acc ctt acc ccg aac cca ggg gga ccc gac agg ctc gga aga atc    7775
Gln Thr Leu Thr Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly Arg Ile
               2580                2585                2590
gaa gaa gaa ggt gga aag caa gac agg gac aga tcc att cga tta gtg    7823
Glu Glu Glu Gly Gly Lys Gln Asp Arg Asp Arg Ser Ile Arg Leu Val
           2595                2600                2605
aac gga ttc tta gcg ctt gcc tgg gac gac ctg cgg aac ctg tgc ctc    7871
Asn Gly Phe Leu Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu Cys Leu
       2610                2615                2620
ttc agc tac cac cga ttg agg gac ttc aca tta gtg gca gcg agg gtg    7919
Phe Ser Tyr His Arg Leu Arg Asp Phe Thr Leu Val Ala Ala Arg Val
   2625                2630                2635
gtg gaa ctt ctg gga cgc aat agt ctc agg gga cta cag aga ggg tgg    7967
Val Glu Leu Leu Gly Arg Asn Ser Leu Arg Gly Leu Gln Arg Gly Trp
2640               2645                2650                2655
gaa gcc ctt aaa tat ctg gga agt ctt gtg cag tac tgg ggt cag gag    8015
Glu Ala Leu Lys Tyr Leu Gly Ser Leu Val Gln Tyr Trp Gly Gln Glu
               2660                2665                2670
cta aaa aag agt act att agt ctg gtt gat acc ata gca ata gca gta    8063
Leu Lys Lys Ser Thr Ile Ser Leu Val Asp Thr Ile Ala Ile Ala Val
           2675                2680                2685
gct gaa gga aca gat agg att ata gaa tta gta caa gga ctt tgt aga    8111
Ala Glu Gly Thr Asp Arg Ile Ile Glu Leu Val Gln Gly Leu Cys Arg
       2690                2695                2700
gct atc tac agc ata cct aga aga ata aga cag ggc ttt gaa gca gct    8159
Ala Ile Tyr Ser Ile Pro Arg Arg Ile Arg Gln Gly Phe Glu Ala Ala
   2705                2710                2715
ttg caa taa aat ggg ggg caa gtg gtc gaa aag tag cat agt tgg atg    8207
Leu Gln     Asn Gly Gly Gln Val Val Glu Lys     His Ser Trp Met
2720               2725                2730                2735
gcc tgc tat aag gga gag aat gag aag aac tga gcc agc agc aga tgg    8255
Ala Cys Tyr Lys Gly Glu Asn Glu Lys Asn     Ala Ser Ser Arg Trp
               2740                2745                2750
ggt ggg agc agt atc tcg aga cct gga aaa aca tgg agc aat cac gag    8303
Gly Gly Ser Ser Ile Ser Arg Pro Gly Lys Thr Trp Ser Asn His Glu
           2755                2760                2765
tag caa tac agc agc tac taa tga gga ttg tgc ctg gct gga agc aca    8351
    Gln Tyr Ser Ser Tyr         Gly Leu Cys Leu Ala Gly Ser Thr
       2770                2775                2780
aga gga ggg gga ggt ggg ttt tcc agt cag acc tca ggt acc ttt aag    8399
Arg Gly Gly Gly Gly Gly Phe Ser Ser Gln Thr Ser Gly Thr Phe Lys
   2785                2790                2795
acc aat gac tta caa ggg agc tgt aga tct tag ctt ctt ttt aaa aga    8447
Thr Asn Asp Leu Gln Gly Ser Cys Arg Ser     Leu Leu Phe Lys Arg
2800               2805                2810                2815
aaa ggg ggg act gga agg gtt aat tta ctc taa gaa aag gca aga gat    8495
Lys Gly Gly Thr Gly Arg Val Asn Leu Leu     Glu Lys Ala Arg Asp
               2820                2825                2830
cct tga ttt gtg ggt cta tca cac aca agg cta ctt ccc tga ttg gca    8543
Pro     Phe Val Gly Leu Ser His Thr Arg Leu Leu Pro     Leu Ala
           2835                2840                2845
caa cta cac acc agg acc agg ggt cag att ccc act gac ttt tgg gtg    8591
Gln Leu His Thr Arg Thr Arg Gly Gln Ile Pro Thr Asp Phe Trp Val
       2850                2855                2860
gtg ctt caa gct agt acc agt tga ccc aag gga agt aga aga ggc caa    8639
Val Leu Gln Ala Ser Thr Ser     Pro Lys Gly Ser Arg Arg Gly Gln
   2865                2870                2875
cga ggg aga aga caa ctg ctt gct aca ccc tgt gtg cca gca tgg aat    8687
Arg Gly Arg Arg Gln Leu Leu Ala Thr Pro Cys Val Pro Ala Trp Asn
2880               2885                2890                2895
gga gga tga tca cag aga agt att aaa gtg gaa gtt tga cag tca act    8735
Gly Gly     Ser Gln Arg Ser Ile Lys Val Glu Val     Gln Ser Thr
               2900                2905                2910
agc aca cag aca cag ggc ccg cga act aca tcc gga gtt tta caa aga    8783
Ser Thr Gln Thr Gln Gly Pro Arg Thr Thr Ser Gly Val Leu Gln Arg
           2915                2920                2925
ctg ctg aca cag aag gga ctt tcc gcg ggg act ttc cac tgg ggc gtt    8831
Leu Leu Thr Gln Lys Gly Leu Ser Ala Gly Thr Phe His Trp Gly Val
       2930                2935                2940
cta gga ggt gtg gtc tgg cgg gac tgg gag tgg tca acc ctc aaa tgc    8879
Leu Gly Gly Val Val Trp Arg Asp Trp Glu Trp Ser Thr Leu Lys Cys
   2945                2950                2955
tgc ata taa gca gct gct ttt cgc ctg tac tgg gtc tct cta gtc aga    8927
Cys Ile     Ala Ala Ala Phe Arg Leu Tyr Trp Val Ser Leu Val Arg
2960               2965                2970                2975
cca gat ctg agc ctg gga gct ctc tgg cta act agg gaa ccc act gct    8975
Pro Asp Leu Ser Leu Gly Ala Leu Trp Leu Thr Arg Glu Pro Thr Ala
               2980                2985                2990
taa gcc tca ata aag ctt gcc ttg agg ggc tag agc ggc cgc cac cgc    9023
    Ala Ser Ile Lys Leu Ala Leu Arg Gly     Ser Gly Arg His Arg
           2995                3000                3005
ggt gga gct cca gct ttt gtt ccc ttt agt gag ggt taa ttg cgc gct    9071
Gly Gly Ala Pro Ala Phe Val Pro Phe Ser Glu Gly     Leu Arg Ala
       3010                3015                3020
ggc gat c                                                          9078
Gly Asp
   3025
<210>253
<211>27
<212>PRT
<213>Human immunodeficiency virus
<400>253
Ser Leu Ala Val Ala Pro Glu Gln Gly Leu Glu Ser Glu Ser Lys Thr
  1               5                  10                  15
Arg Gly Asp Leu Ser Thr Gln Asp Ser Ala Cys
             20                  25
<210>254
<211>19
<212>PRT
<213>Human immunodeficiency virus
<400>254
Ser Ala Leu Gly Lys Arg Arg Glu Arg Arg Leu Val Ser Thr Pro Ile
  1               5                  10                  15
Ile Phe Asp
<210>255
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>255
Arg Arg Leu Glu Gly Glu Arg Trp Val Arg Glu Arg Gln Tyr
  1               5                  10
<210>256
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>256
Glu Gly Glu Asn
  1
<210>257
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>257
Ile Asn Gly Lys Lys Leu Gly
  1               5
<210>258
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>258
Gly Gln Gly Glu Arg Asn Thr Ile Cys
  1               5
<210>259
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>259
Tyr Gly Gln Ala Gly Ser Trp Lys Asp Leu His Leu Thr Leu Ala Phe
  1               5                  10                  15
<210>260
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>260
Arg His Gln Lys Ala Val Asn Lys
  1               5
<210>261
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>261
Asn Ser Tyr Asn Gln Leu Phe Arg Gln Glu Gln Arg Asn Leu Asp His
  1               5                  10                  15
Tyr Ser Thr Gln
             20
<210>262
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>262
Gln Leu Pro Ile Val Tyr Ile Gln Arg
  1               5
<210>263
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>263
Met Tyr Glu Thr Pro Glu Lys Pro
  1               5
<210>264
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>264
Arg Lys Asn Lys Thr Lys Phe Ser Lys Lys His Ser Arg Gln Arg Arg
  1               5                  10                  15
Leu Thr Gly Arg Ser Val Lys Ile Ile Leu
             20                  25
<210>265
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>265
Tyr Arg Ile Ser Lys Gly Lys Trp Tyr Ile Ser Pro Tyr His Leu Glu
  1               5                  10                  15
Leu
<210>266
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>266
Lys Arg Arg Leu Leu Ala Gln Lys
  1               5
<210>267
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>267
Tyr Pro Cys Phe Gln Arg Tyr Gln Lys Glu Pro Pro His Lys Ile
  1               5                  10                  15
<210>268
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>268
Thr Gln Trp Gly Asp Ile Lys Gln Leu Cys Lys Tyr
  1               5                  10
<210>269
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>269
Lys Ile Pro Ser Met Lys Arg Leu Gln Asn Gly Ile Asp Tyr Ile Gln
  1               5                  10                  15
Tyr Met Gln Gly Leu Leu His Gln Ala Lys
             20                  25
<210>270
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>270
Glu Asn Gln Gly Glu Val Thr
  1               5
<210>271
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>271
Gln Glu Leu Leu Val Thr Tyr Arg Asn Lys
  1               5                  10
<210>272
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>272
Arg Val Thr His Leu Phe Gln
  1               5
<210>273
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>273
Glu Thr Ser Ile Lys Asp Gly
  1               5
<210>274
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>274
Glu Cys Ile Ala Leu Pro Ala Phe Trp Thr
  1               5                  10
<210>275
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>275
Asn Lys Gly Gln Arg Asn Pro Leu Glu Thr Met
  1               5                  10
<210>276
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>276
Thr Gly Ser Leu Lys Leu
  1               5
<210>277
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>277
Glu Arg Asn Lys Leu Arg Lys Val
  1             5
<210>278
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>278
Gln Thr Pro Cys Trp Ser Lys Met Arg Thr Gln Ile Val Arg Pro Phe
  1               5                  10                  15
<210>279
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>279
Asp Gln Gly Leu Gln
  1               5
<210>280
<211>19
<212>PRT
<213>Human immunodeficiency virus
<400>280
Gln His Val Arg Glu Trp Glu Asp Leu Ala Ile Lys Gln Lys Cys Trp
  1               5                  10                  15
Pro Arg Gln
<210>281
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>281
Ala Lys Gln Thr Val Pro Tyr
  1               5
<210>282
<211>23
<212>PRT
<213>Human immunodeficiency virus
<400>282
Cys Arg Glu Ala Ile Leu Lys Ala Leu Lys Glu Leu Leu Asn Val Ser
  1               5                  10                  15
Thr Val Ala Arg Lys Gly Thr
             20
<210>283
<211>21
<212>PRT
<213>Human immunodeficiency virus
<400>283
Pro Glu Ile Ala Gly Pro Leu Gly Lys Arg Ala Val Gly Asn Val Glu
  1               5                  10                  15
Lys Lys Asp Thr Lys
             20
<210>284
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>284
Lys Ile Val Leu Arg Asp Arg Pro Ile Phe
  1               5                  10
<210>285
<211>44
<212>PRT
<213>Human immunodeficiency virus
<400>285
Gly Lys Ser Gly Pro Pro Thr Arg Glu Gly Gln Gly Ile Phe Phe Arg
  1               5                  10                  15
Thr Asp Gln Ser Gln Gln Pro His Gln Arg Arg Ala Ser Gly Leu Gly
             20                  25                  30
Lys Arg Gln Gln Leu His Leu Arg Ser Arg Ser Gln
         35                  40
<210>286
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>286
Thr Arg Asn Tyr Ile Leu
  1               5
<210>287
<211>30
<212>PRT
<213>Human immunodeficiency virus
<400>287
Leu Pro Ser Asn His Ser Leu Ala Thr Thr Pro Arg His Asn Lys Asp
  1               5                  10                  15
Arg Gly Ala Ile Lys Gly Ser Ser Ile Arg Tyr Arg Ser Arg
             20                  25                  30
<210>288
<211>29
<212>PRT
<213>Human immunodeficiency virus
<400>288
Tyr Ser Ile Arg Arg Pro Glu Phe Ala Arg Glu Met Glu Thr Lys Asn
  1               5                  10                  15
Asp Arg Gly Asn Trp Arg Phe Tyr Gln Ser Lys Thr Val
             20                  25
<210>289
<211>44
<212>PRT
<213>Human immunodeficiency virus
<400>289
Thr Asp Thr His Arg Asn Leu Arg Thr Gln Ser Tyr Arg Tyr Ser Ile
  1               5                  10                  15
Ser Arg Thr Tyr Thr Cys Gln His Asn Trp Lys Lys Ser Val Asp Ser
             20                  25                  30
Ala Trp Leu His Phe Lys Phe Ser Asn Gln Ser His
         35                  40
<210>290
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>290
Asn Cys Thr Ser Lys Ile Lys Ala Arg Asn Gly Trp Pro Lys Gly
  1               5                  10                  15
<210>291
<211>16
<212>PRT
<213>Human immunodeficiency virus
<400>291
Thr Met Ala Ile Asp Arg Arg Glu Asn Lys Ser Ile Asn Ser Asn Leu
  1               5                  10                  15
<210>292
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>292
Asn Gly Glu Arg Arg Lys Asn Tyr Lys Asn Trp Ala
  1               5                  10
<210>293
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>293
His Ser Asn Ile Cys His Lys Lys Glu Gly Gln Tyr
  1               5                  10
<210>294
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>294
Val Glu Lys Val Ser Arg Phe Gln Gly Thr Gln
  1               5                  10
<210>295
<211>39
<212>PRT
<213>Human immunodeficiency virus
<400>295
Lys Asn Ser Arg Phe Leu Gly Ser Ser Ile Arg Asn Thr Thr Pro Ser
  1               5                  10                  15
Arg Val Lys Lys Glu Lys Ile Ser Asp Ser Thr Gly Cys Gly Gly Cys
             20                  25                  30
Ile Phe Phe Asn Ser Phe Ile
         35
<210>296
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>296
Arg Leu Gln Glu Val Tyr Cys Ile His His Thr
  1               5                  10
<210>297
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>297
Asn Thr Arg Asp
  1
<210>298
<211>19
<212>PRT
<213>Human immunodeficiency virus
<400>298
Val Ser Val Gln Cys Thr Ser Thr Gly Met Glu Arg Ile Thr Ser Asn
  1               5                  10                  15
Ile Pro Lys
<210>299
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>299
His Asp Lys Asn Leu Arg Ala Phe
  1               5
<210>300
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>300
Lys Thr Lys Ser Arg His Ser Tyr Leu Ser Ile His Gly
  1               5                  10
<210>301
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>301
Phe Val Cys Arg Ile
  1               5
<210>302
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>302
Leu Arg Asp Arg Ala Ala
  1               5
<210>303
<211>33
<212>PRT
<213>Human immunodeficiency virus
<400>303
Asn Lys Asn Arg Gly Thr Glu Thr Thr Phe Val Glu Val Gly Ile Tyr
  1               5                  10                  15
His Thr Arg Gln Glu Thr Leu Glu Arg Thr Ser Ile Ser Leu Asp Gly
             20                  25                  30
Val
<210>304
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>304
Gln Met Asp Ser Thr Ala Tyr Thr Ala Ala Arg Lys Arg
  1               5                  10
<210>305
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>305
Leu Asp Cys Gln
  1
<210>306
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>306
Tyr Thr Lys Val Ser Gly Lys Ile Lys Leu Gly Lys Ser Asp Leu Ser
  1               5                  10                  15
Trp Asn
<210>307
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>307
Ser Lys Ala Thr Leu
  1               5
<210>308
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>308
Gly Gly Gln Ser Thr Asn Arg His Ser Thr Thr Asn
  1               5                  10
<210>309
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>309
Arg Ser Arg Ile Arg Ile Gly Arg Lys Gln Gly Asn Ser Lys Arg Thr
  1               5                  10                  15
Ser Thr Trp Ser Ile Leu
             20
<210>310
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>310
Pro Ile Lys Arg Leu Asp Ser
  1               5
<210>311
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>311
Asn Thr Glu Thr Gly Ala Gly Thr Met Asp Ile Ser Asn Leu Pro Arg
  1               5                  10                  15
Thr Ile Gln Lys Ser Lys Asn Arg Glu Val Cys Lys Asn Glu Asp Cys
             20                  25                  30
Pro His
<210>312
<211>23
<212>PRT
<213>Human immunodeficiency virus
<400>312
Cys Lys Thr Ile Asn Arg Gly Cys Ala Glu Asn Ser His Gly Arg His
  1               5                  10                  15
Ser Asn Met Gly Lys Asn Ser
             20
<210>313
<211>22
<212>PRT
<213>Human immunodeficiency virus
<400>313
Ile Thr His Pro Lys Arg Asn Met Gly Asp Met Val Asp Arg Leu Leu
  1               5                  10                  15
Ala Ser His Leu Asp Ser
             20
<210>314
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>314
Val Gly Ile Cys
<210>315
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>315
Tyr Pro Ser Leu Ser Lys Ile Met Val Pro Ala Gly Lys Arg Ser His
  1               5                  10                  15
Ser Arg Ser Arg Asn Phe Leu Cys Arg Trp Ser Ser
             20                  25
<210>316
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>316
Asn Arg Lys Ser Arg Val Cys Tyr
  1               5
<210>317
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>317
Gln Arg Lys Glu Glu Asn Cys Phe Ser Asn
  1              5                   10
<210>318
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>318
Asn Asn Lys Ser Glu Asp
  1               5
<210>319
<211>33
<212>PRT
<213>Human immunodeficiency virus
<400>319
Ile Ala Ser Asn Leu Tyr Ser Phe Ala Arg Phe Arg Ile Arg Ser Lys
  1               5                  10                  15
His Ser Asn Arg Phe Thr Val Cys Ile Arg Asp His Ser Ser Thr Thr
             20                  25                  30
Arg
<210>320
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>320
Ile Arg Val Ser
  1
<210>321
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>321
Pro Asn Asn Arg Thr Ile Asn Glu Lys Gly Lys Ser Leu Pro Val Met
  1               5                  10                  15
Gly Thr Ser Thr
             20
<210>322
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>322
Arg Asn Trp Arg Lys
  1               5
<210>323
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>323
Trp Asn Gln Glu Ser Ala Ile Ser Arg Trp Asn Arg
  1               5                  10
<210>324
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>324
Ser Ser Arg Arg Ala
  1               5
<210>325
<211>10
<212>PRT
<213>Human immunodeficiency virus
<400>325
Lys Val Ser Gln Gln Leu Glu Ser Asn Gly
  1               5                  10
<210>326
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>326
Ser Ala Thr His Ser Ser Lys Arg Asn Ser Gly
  1               5                  10
<210>327
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>327
Ser Met Ser Ala Lys Arg Arg Ser His Ala Trp Thr Ser Arg Leu
  1               5                  10                  15
<210>328
<211>59
<212>PRT
<213>Human immunodeficiency virus
<400>328
Ser Arg Asp Met Ala Ile Arg Leu Tyr Thr Phe Arg Arg Lys Asn His
  1               5                  10                  15
Pro Gly Ser Ser Pro Cys Ser Gln Trp Leu His Gly Ser Arg Gly Tyr
             20                  25                  30
Pro Ser Arg Asn Arg Thr Arg Asp Ser Ile Leu Tyr Thr Lys Ile Ser
         35                  40                  45
Arg Lys Met Ala Ser Gln Ser Asn Thr Tyr Arg
     50                  55
<210>329
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>329
Phe His Gln Tyr Cys Ser
  1               5
<210>330
<211>28
<212>PRT
<213>Human immunodeficiency virus
<400>330
Gly Ser Leu Leu Val Gly Arg Tyr Pro Thr Gly Ile Trp Asn Ser Leu
  1               5                  10                  15
Gln Ser Pro Lys Ser Gly Ser Ser Arg Ser His Glu
             20                  25
<210>331
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>331
Arg Ile Lys Glu Asn Tyr Arg Ala Gly Lys Arg Ser Ser
  1               5                  10
<210>332
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>332
Asp Ser Ser Thr Asn Gly Ser Ile His Ser Gln Phe
  1               5                  10
<210>333
<211>24
<212>PRT
<213>Human immunodeficiency virus
<400>333
Lys Lys Arg Gly Asp Trp Gly Val Gln Cys Arg Gly Lys Asn Asn Arg
  1               5                  10                  15
Tyr Asn Ser Asn Arg His Thr Asn
             20
<210>334
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>334
Arg Ile Thr Lys Thr Asp Tyr Lys Asn Ser Lys Phe Ser Gly Leu Leu
  1               5                  10                  15
Gln Arg Gln Gln Arg Pro Gln Leu Glu Arg Thr Ser Gln Thr Thr Leu
             20                  25                  30
Glu Arg
<210>335
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>335
Arg Gly Ser Asn Asn Thr Arg
  1               5
<210>336
<211>12
<212>PRT
<213>Human immunodeficiency virus
<400>336
His Lys Gly Ser Thr Lys Glu Glu Ser Lys Asn His
  1               5                  10
<210>337
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>337
Gly Leu Trp Lys Thr Asp Gly Arg Cys
  1               5
<210>338
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>338
Leu Cys Gly Arg
  1
<210>339
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>339
Arg Leu Glu His Gly Ile Val
  1               5
<210>340
<211>25
<212>PRT
<213>Human immunodeficiency virus
<400>340
Asn Thr Ile Cys Met Phe Gln Gly Glu Leu Met Asp Gly Phe Thr Asp
  1               5                  10                  15
Ile Ile Met Thr Ala Asp Ile Gln Lys
             20                  25
<210>341
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>341
Val Gln Lys Tyr Thr Ser His
  1               5
<210>342
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>342
Glu Arg Leu Asn
  1
<210>343
<211>20
<212>PRT
<213>Human immunodeficiency virus
<400>343
Lys His Ile Gly Gly Cys Arg Gln Glu Lys Glu Ile Gly Ile Trp Val
  1               5                  10                  15
Met Glu Ser Pro
             20
<210>344
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>344
Glu Asp Ile Pro His Lys
  1             5
<210>345
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>345
Asn Leu Ala Trp Gln Thr Ser
  1               5
<210>346
<211>13
<212>PRT
<213>Human immunodeficiency virus
<400>346
Phe Ile Cys Ile Ile Leu Ile Val Leu Gln Thr Leu Ile
  1               5                  10
<210>347
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>347
Gly Lys Pro Tyr
  1
<210>348
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>348
Leu Phe Leu Gly Val Thr Ile Lys Gln Asp Ile Ile Ile Arg
  1               5                  10
<210>349
<211>7
<212>PRT
<213>Human immunodeficiency virus
<400>349
Asp Leu Tyr Asn Thr Trp His
  1               5
<210>350
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>350
Asn Gln Lys Arg
  1
<210>351
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>351
Ser His Leu Cys Leu Val Ser Arg Asn
  1               5
<210>352
<211>18
<212>PRT
<213>Human immunodeficiency virus
<400>352
Arg Ile Asp Gly Thr Ile Pro Arg Arg Ser Gly Ala Ala Glu Gly Thr
  1               5                  10                  15
Thr Gln
<210>353
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>353
Met Asp Thr Arg Ala Ser Arg Gly Ala Gln Ala Gly Ser Cys
  1               5                  10
<210>354
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>354
Thr Met Ala Ser
  1
<210>355
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>355
Leu Arg Thr Thr Tyr Leu
  1               5
<210>356
<211>30
<212>PRT
<213>Human immunodeficiency virus
<400>356
Asn Ile Trp Gly Tyr Leu Gly Arg Ser Gly Ser His Asn Lys Asn Ser
  1               5                  10                  15
Ala Thr Thr Ala Val Tyr Ser Phe Gln Asn Trp Val Ser Ala
             20                  25                  30
<210>357
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>357
Gln Asn Arg His Phe Glu Thr Glu Lys Asn Lys Lys Trp Ser Gln
  1               5                  10                  15
<210>358
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>358
Ser Leu Gly Ser Ile Gln Glu Val Ser Leu Arg Leu Leu Val Thr Val
  1               5                  10                  15
Ala Ile Val Lys Ser Ala Ala Phe Ile Ala Lys Phe Val Ser Arg Lys
             20                  25                  30
Lys Ala
<210>359
<211>30
<212>PRT
<213>Human immunodeficiency virus
<400>359
Ala Ser Ser Met Ala Gly Arg Ser Glu Asp Ser Asp Glu Ala Leu Ile
  1               5                  10                  15
Glu Ala Val Arg Ile Ile Lys Ile Leu Tyr Gln Ser Ser Lys
             20                  25                  30
<210>360
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>360
Leu Cys Gly Pro
  1
<210>361
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>361
Asn Ile Gly Lys Tyr
  1               5
<210>362
<211>4
<212>PRT
<213>Human immunodeficiency virus
<400>362
Asp Arg Lys Lys
  1
<210>363
<211>867
<212>PRT
<213>Human immunodeficiency virus
<400>363
Glu Lys Glu Gln Lys Thr Val Ala Met Arg Val Thr Gly Ile Arg Lys
  1               5                  10                  15
Asn Tyr Arg His Leu Trp Arg Trp Gly Thr Met Leu Leu Gly Met Leu
             20                  25                  30
Met Ile Ser Ser Ala Val Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly
             35                  40                  45
Val Pro Val Trp Lys Gly Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp
     50                  55                  60
Ala Lys Ala Tyr Asp Thr Glu Val His Asn Val Trp Ala Thr His Ala
 65                  70                  75                  80
Cys Val Pro Ala Asp Pro Asn Pro Gln Glu Met Val Leu Glu Asn Val
                 85                  90                  95
Thr Glu Asn Phe Asn Met Trp Lys Asn Glu Met Val Asn Gln Met Gln
            100                 105                 110
Glu Asp Val Ile Ser Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys
        115                 120                 125
Leu Thr Pro Leu Cys Val Thr Leu Glu Cys Arg Asn Val Ser Ser Asn
    130                 135                 140
Ser Asn Asp Thr Tyr His Glu Thr Tyr His Glu Ser Met Lys Glu Met
145                 150                 155                 160
Lys Asn Cys Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln
                165                 170                 175
Thr Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Thr Lys
            180                 185                 190
Lys Asn Tyr Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys
        195                 200                 205
Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Thr Phe Asp Pro
    210                 215                 220
Ile Pro Ile His Tyr Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys Cys
225                 230                 235                 240
Asn Asp Lys Ile Phe Asn Gly Thr Gly Pro Cys His Asn Val Ser Thr
                245                 250                 255
Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu
            260                 265                 270
Leu Asn Gly Ser Leu Ala Glu Gly Glu Ile Ile Ile Arg Ser Glu Asn
        275                 280                 285
Leu Thr Asn Asn Val Lys Thr Ile Ile Val His Leu Asn Gln Ser Val
    290                 295                 300
Glu Ile Val Cys Thr Arg Pro Gly Asn Asn Thr Arg Lys Ser Ile Arg
305                 310                 315                 320
Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp
                325                 330                 335
Ile Arg Gln Ala His Cys Asn Ile Ser Glu Asp Lys Trp Asn Glu Thr
            340                 345                 350
Leu Gln Arg Val Ser Lys Lys Leu Ala Glu His Phe Gln Asn Lys Thr
        355                 360                 365
Ile Lys Phe Ala Ser Ser Ser Gly Gly Asp Leu Glu Val Thr Thr His
    370                 375                 380
Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Gly Leu
385                 390                 395                 400
Phe Asn Gly Ala Tyr Thr Pro Asn Gly Thr Lys Ser Asn Ser Ser Ser
                405                 410                 415
Ile Ile Thr Ile Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln
            420                 425                 430
Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Lys Gly Asn Ile Thr
        435                 440                 445
Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Thr
    450                 455                 460
Glu Pro Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg
465                 470                 475                 480
Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys
                485                 490                 495
Pro Leu Gly Val Ala Pro Thr Thr Thr Lys Arg Arg Val Val Glu Arg
            500                 505                 510
Glu Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly
        515                 520                 525
Val Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln
    530                 535                 540
Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu
545                 550                 555                 560
Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly
                565                 570                 575
Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys
            580                 585                 590
Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys
        595                 600                 605
Thr Thr Ala Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Lys
    610                 615                 620
Glu Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Ser
625                 630                 635                 640
Asn Tyr Thr Asn Thr Val Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln
                645                 650                 655
Gln Glu Arg Asn Glu Lys Asp Leu Leu Ala Leu Asp Ser Trp Lys Asn
            660                 665                 670
Leu Trp Ser Trp Phe Asp Ile Thr Asn Trp Leu Trp Tyr Ile Lys Ile
        675                 680                 685
Phe Ile Ile Ile Val Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe Ala
    690                 695                 700
Val Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser
705                 710                 715                 720
Phe Gln Thr Leu Thr Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly Arg
                725                 730                 735
Ile Glu Glu Glu Gly Gly Lys Gln Asp Arg Asp Arg Ser Ile Arg Leu
            740                 745                 750
Val Asn Gly Phe Leu Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu Cys
        755                 760                 765
Leu Phe Ser Tyr His Arg Leu Arg Asp Phe Thr Leu Val Ala Ala Arg
    770                 775                 780
Val Val Glu Leu Leu Gly Arg Asn Ser Leu Arg Gly Leu Gln Arg Gly
785                 790                 795                 800
Trp Glu Ala Leu Lys Tyr Leu Gly Ser Leu Val Gln Tyr Trp Gly Gln
                805                 810                 815
Glu Leu Lys Lys Ser Thr Ile Ser Leu Val Asp Thr Ile Ala Ile Ala
            820                 825                 830
Val Ala Glu Gly Thr Asp Arg Ile Ile Glu Leu Val Gln Gly Leu Cys
        835                 840                 845
Arg Ala Ile Tyr Ser Ile Pro Arg Arg Ile Arg Gln Gly Phe Glu Ala
    850                 855                 860
Ala Leu Gln
865
<210>364
<211>8
<212>PRT
<213>Human immunodeficiency virus
<400>364
Asn Gly Gly Gln Val Val Glu Lys
  1               5
<210>365
<211>14
<212>PRT
<213>Human immunodeficiency virus
<400>365
His Ser Trp Met Ala Cys Tyr Lys Gly Glu Asn Glu Lys Asn
  1               5                  10
<210>366
<211>21
<212>PRT
<213>Human immunodeficiency virus
<400>366
Ala Ser Ser Arg Trp Gly Gly Ser Ser Ile Ser Arg Pro Gly Lys Thr
  1               5                 10                 15
Trp Ser Asn His Glu
             20
<210>367
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>367
Gln Tyr Ser Ser Tyr
  1               5
<210>368
<211>34
<212>PRT
<213>Human immunodeficiency virus
<400>368
Gly Leu Cys Leu Ala Gly Ser Thr Arg Gly Gly Gly Gly Gly Phe Ser
  1               5                  10                  15
Ser Gln Thr Ser Gly Thr Phe Lys Thr Asn Asp Leu Gln Gly Ser Cys
             20                  25                  30
Arg Ser
<210>369
<211>15
<212>PRT
<213>Human immunodeficiency virus
<400>369
Leu Leu Phe Lys Arg Lys Gly Gly Thr Gly Arg Val Asn Leu Leu
  1              5                   10                  15
<210>370
<211>6
<212>PRT
<213>Human immunodeficiency virus
<400>370
Glu Lys Ala Arg Asp Pro
  1               5
<210>371
<211>11
<212>PRT
<213>Human immunodeficiency virus
<400>371
Phe Val Gly Leu Ser His Thr Arg Leu Leu Pro
  1               5                  10
<210>372
<211>25
<212>PRT
<213>Human immunodeficiency virus
<400>372
Leu Ala Gln Leu His Thr Arg Thr Arg Gly Gln Ile Pro Thr Asp Phe
  1               5                  10                  15
Trp Val Val Leu Gln Ala Ser Thr Ser
             20                  25
<210>373
<211>26
<212>PRT
<213>Human immunodeficiency virus
<400>373
Pro Lys Gly Ser Arg Arg Gly Gln Arg Gly Arg Arg Gln Leu Leu Ala
  1               5                  10                  15
Thr Pro Cys Val Pro Ala Trp Asn Gly Gly
             20                  25
<210>374
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>374
Ser Gln Arg Ser Ile Lys Val Glu Val
  1               5
<210>375
<211>53
<212>PRT
<213>Human immunodeficiency virus
<400>375
Gln Ser Thr Ser Thr Gln Thr Gln Gly Pro Arg Thr Thr Ser Gly Val
  1               5                  10                  15
Leu Gln Arg Leu Leu Thr Gln Lys Gly Leu Ser Ala Gly Thr Phe His
             20                  25                  30
Trp Gly Val Leu Gly Gly Val Val Trp Arg Asp Trp Glu Trp Ser Thr
         35                  40                  45
Leu Lys Cys Cys Ile
     50
<210>376
<211>29
<212>PRT
<213>Human immunodeficiency virus
<400>376
Ala Ala Ala Phe Arg Leu Tyr Trp Val Ser Leu Val Arg Pro Asp Leu
  1               5                  10                  15
Ser Leu Gly Ala Leu Trp Leu Thr Arg Glu Pro Thr Ala
             20                  25
<210>377
<211>9
<212>PRT
<213>Human immunodeficiency virus
<400>377
Ala Ser Ile Lys Leu Ala Leu Arg Gly
  1               5
<210>378
<211>17
<212>PRT
<213>Human immunodeficiency virus
<400>378
Ser Gly Arg His Arg Gly Gly Ala Pro Ala Phe Val Pro Phe Ser Glu
  1               5                  10                  15
Gly
<210>379
<211>5
<212>PRT
<213>Human immunodeficiency virus
<400>379
Leu Arg Ala Gly Asp
  1               5

Claims (10)

1.一种多核苷酸,其包含SEQ ID NO:2中所示核酸序列,或其片段或衍生物,或由核苷酸编号13-1500的核酸序列编码的gag多肽,由核苷酸编号1501-2460的核酸序列编码的5’pol多肽,由核苷酸编号2461-3090的核酸序列编码的凑合nef多肽,由核苷酸编号3091-4155的核酸序列编码的3’pol多肽和/或由核苷酸编号4156-4266的核酸序列编码的RT活性部位多肽,其中每个核苷酸编号均参考SEQ ID NO:2。
2.一种密码子优化的多核苷酸,其编码由根据权利要求1的多核苷酸编码的多肽。
3.一种DNA构建体或细菌或病毒载体,其包含根据权利要求1或2的多核苷酸。
4.根据权利要求1或2的多核苷酸,或具有一个或多个根据权利要求1或2的长度为至少27个核苷酸的片段的多核苷酸,或具有由一个或多个多核苷酸的核苷酸序列间隔段所分隔的两个或更多个根据权利要求1或2的长度为至少27个核苷酸的片段的多核苷酸,在制造用于治疗或预防HIV感染的药物或疫苗、或用于诊断HIV感染的诊断物质中的用途。
5.一种多肽,其由根据权利要求1或2的多核苷酸编码,或包含由根据权利要求1或2的多核苷酸编码的至少9个氨基酸的连续序列。
6.根据权利要求5的多肽在制造用于诊断HIV感染的诊断物质中的用途。
7.一种分离的多肽,其特异性结合根据权利要求5的多肽。
8.权利要求7的分离的多肽,其是抗体,抗体衍生物,或人类胰分泌胰蛋白酶抑制剂(hPSTI)的衍生物。
9.根据权利要求7或8的分离的多肽在制造用于诊断HIV感染的诊断物质中的用途。
10.一种用根据权利要求1或2的多核苷酸转化的真核生物包装细胞系。
CN200910127667.7A 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途 Expired - Lifetime CN101586106B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19955089.1 1999-11-16
DE19955089 1999-11-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN00818426A Division CN1423698A (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Publications (2)

Publication Number Publication Date
CN101586106A true CN101586106A (zh) 2009-11-25
CN101586106B CN101586106B (zh) 2015-04-01

Family

ID=7929215

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200910127667.7A Expired - Lifetime CN101586106B (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途
CN00818426A Pending CN1423698A (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN00818426A Pending CN1423698A (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Country Status (14)

Country Link
US (2) US7332588B1 (zh)
EP (1) EP1240333B1 (zh)
CN (2) CN101586106B (zh)
AP (1) AP1674A (zh)
AT (1) ATE391785T1 (zh)
AU (1) AU784635B2 (zh)
BR (1) BR0015607A (zh)
CA (1) CA2391560A1 (zh)
DE (2) DE10056747A1 (zh)
ES (1) ES2303513T3 (zh)
HK (1) HK1046428A1 (zh)
OA (1) OA12156A (zh)
WO (1) WO2001036614A2 (zh)
ZA (1) ZA200204047B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107090019A (zh) * 2017-01-23 2017-08-25 张帅 人类免疫缺陷病毒重组蛋白
CN110627911A (zh) * 2019-10-14 2019-12-31 吉林大学 一种可诱导hiv-1广谱中和抗体的包膜蛋白三聚体免疫原及用途

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582920B2 (en) 2000-09-01 2003-06-24 Gen-Probe Incorporated Amplification of HIV-1 RT sequences for detection of sequences associated with drug-resistance mutations
PL207168B1 (pl) * 2001-09-20 2010-11-30 Glaxo Group Ltd Sekwencja nukleotydowa, wektor, białko, środek farmaceutyczny, urządzenie do podawania śródskórnego, zastosowanie sekwencji nukleotydowej i sposób wytwarzania nukleotydu
ES2281252B1 (es) * 2005-07-27 2009-02-16 Consejo Superior De Investigaciones Cientificas Vectores recombinantes basados en el virus modificado de ankara (mva) como vacunas preventivas y terapeuticas contra el sida.
BRPI0504117A (pt) 2005-09-05 2007-05-22 Fundacao De Amparo A Pesquisa epìtopos, combinação de epìtopos, usos de epìtopos ou sua combinação, composição, usos da composição, vacinas profiláticas anti-hiv-1, vacinas terapêuticas, método para a identificação de epìtopos e métodos para o tratamento ou prevenção
US20090060947A1 (en) * 2006-05-19 2009-03-05 Sanofi Pasteur, Inc. Immunological compositions
EP2424999A1 (en) 2009-04-30 2012-03-07 Centre Hospitalier Universitaire Vaudois Lausanne (CHUV) Modified immunization vectors
WO2011109511A2 (en) * 2010-03-02 2011-09-09 International Aids Vaccine Initiative Novel hiv-1 envelope glycoprotein
WO2013038185A1 (en) 2011-09-12 2013-03-21 Jonathan Norden Weber Methods and compositions for raising an immune response to hiv
KR20220061285A (ko) * 2013-11-14 2022-05-12 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 HIV-1 EnV DNA 백신과 단백질 부스터
CN105586319B (zh) * 2014-10-20 2021-01-08 中国疾病预防控制中心性病艾滋病预防控制中心 复制型痘苗病毒载体艾滋病疫苗

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5215913A (en) 1987-11-30 1993-06-01 Roger Williams General Hospital IgG-1 human monoclonal antibody reactive with an HIV-1 antigen and methods of use
ATE208813T1 (de) 1988-02-16 2001-11-15 Greatbatch Gen Aid Ltd Modifizierte zellen mit resistenz gegen retroviralinfektionen
US5580761A (en) 1988-02-16 1996-12-03 Greatbatch Gen-Aid Ltd. Method of conferring resistance to immunodeficiency viral infection
EP0657532B1 (en) 1988-06-09 2003-12-17 N.V. Innogenetics S.A. HIV-3 retrovirus strains and their use
EP0440749B1 (en) * 1988-08-31 1997-05-28 Aprogenex, Inc. Manual in situ hybridization assay
DE68918867T2 (de) 1988-09-13 1995-02-16 Chiron Corp Mutanten des hiv-1 Hüllproteins mit fehlenden hypervariabelen domänen.
AU647108B2 (en) 1990-04-03 1994-03-17 Genentech Inc. Methods and compositions for vaccination against HIV
CA2092546A1 (fr) 1990-09-27 1992-03-28 Luc Montagnier Peptides inducteurs d'anticorps inhibant des retrovirus du type hiv et anticorps diriges contre ces peptides
US5847096A (en) 1991-08-30 1998-12-08 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services DNA constructs encoding CD4 fusion proteins
EP0725838A4 (en) 1993-10-26 1997-02-26 United Biomedical Inc STRUCTURED SYNTHETIC ANTIGAN BANKS AS DIAGNOSTICS, VACCINE AND THERAPEUTIC AGENTS
WO1995016710A1 (en) 1993-12-13 1995-06-22 United Biomedical, Inc. Specific hyperimmune anti-hiv globulin for passive immunization
US5599662A (en) * 1995-02-17 1997-02-04 Hoffmann-La Roche Inc. Oliconucleotide primers and probes for the detection of HIV-1
DE19513152A1 (de) 1995-04-07 1996-10-10 Bundesrep Deutschland Verwendung eines "Immundefizienzvirus-supprimierenden Lymphokins (ISL)" zur Hemmung der Virusvermehrung, insbesondere von Retroviren
GB9510272D0 (en) 1995-05-22 1995-07-19 Isis Innovation Retroviral vectors
GB9621679D0 (en) 1996-10-17 1996-12-11 Oxford Biomedica Ltd Improved retroviral vectors
GB9803351D0 (en) * 1998-02-17 1998-04-15 Oxford Biomedica Ltd Anti-viral vectors
US6958226B1 (en) * 1998-09-11 2005-10-25 The Children's Medical Center Corp. Packaging cells comprising codon-optimized gagpol sequences and lacking lentiviral accessory proteins
CA2360347C (en) * 1998-12-31 2013-05-07 Chiron Corporation Improved expression of hiv polypeptides and production of virus-like particles
EP1141314A2 (en) * 1998-12-31 2001-10-10 Chiron Corporation Polynucleotides encoding antigenic hiv type c polypeptides, polypeptides and uses thereof
EP1165798A2 (en) * 1999-03-29 2002-01-02 Statens Serum Institut Nucleotide construct with optimised codons for an hiv genetic vaccine based on a primary, early hiv isolate and synthetic envelope

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. BROOKS JACKSON等: "Detection of Human Immunodeficiency Virus Type 1 (HIV-1) Antibody by Western Blotting and HIV-1 DNA by PCR in Patients with AIDS", 《JOURNAL OF CLINICAL MICROBIOLOGY》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107090019A (zh) * 2017-01-23 2017-08-25 张帅 人类免疫缺陷病毒重组蛋白
CN110627911A (zh) * 2019-10-14 2019-12-31 吉林大学 一种可诱导hiv-1广谱中和抗体的包膜蛋白三聚体免疫原及用途
CN110627911B (zh) * 2019-10-14 2022-11-22 吉林大学 一种可诱导hiv-1广谱中和抗体的包膜蛋白三聚体免疫原及用途

Also Published As

Publication number Publication date
AU784635B2 (en) 2006-05-18
AP2002002508A0 (en) 2002-06-30
AP1674A (en) 2006-10-30
EP1240333B1 (de) 2008-04-09
DE50015096D1 (de) 2008-05-21
ATE391785T1 (de) 2008-04-15
ZA200204047B (en) 2002-12-20
US7332588B1 (en) 2008-02-19
DE10056747A1 (de) 2001-05-31
HK1046428A1 (en) 2003-01-10
US7323557B2 (en) 2008-01-29
AU2350401A (en) 2001-05-30
CA2391560A1 (en) 2001-05-25
WO2001036614A3 (de) 2002-02-28
CN1423698A (zh) 2003-06-11
WO2001036614A2 (de) 2001-05-25
BR0015607A (pt) 2002-07-30
EP1240333A2 (de) 2002-09-18
US20070003572A1 (en) 2007-01-04
ES2303513T3 (es) 2008-08-16
OA12156A (en) 2006-05-08
CN101586106B (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
US5741492A (en) Preparation and use of viral vectors for mixed envelope protein vaccines against human immunodeficiency viruses
Deml et al. Multiple effects of codon usage optimization on expression and immunogenicity of DNA candidate vaccines encoding the human immunodeficiency virus type 1 Gag protein
US7323557B2 (en) Genome of the HIV-1 inter-subtype (C/B&#39;) and use thereof
EP1240186B1 (en) Improvements in or relating to immune responses to hiv
Ramakrishna et al. Codon optimization of the tat antigen of human immunodeficiency virus type 1 generates strong immune responses in mice following genetic immunization
CN110494159A (zh) 在接受抗逆转录病毒治疗的对象中诱导针对人类免疫缺陷病毒感染的免疫应答的方法
US20130078276A1 (en) Vectors expressing hiv antigens and gm-csf and related methods of generating an immune response
CN106999571A (zh) 诱导针对人免疫缺陷病毒感染的保护性免疫性的方法和组合物
JP2001512308A (ja) 合成hiv gag遺伝子
JP2009082136A (ja) 抗原性b型hivポリペプチドおよび/または抗原性c型hivポリペプチドをコードするポリヌクレオチド、それらのポリペプチドおよびそれらの使用
EP1992358A1 (en) Aids vaccine based on replicative vaccinia virus vector
CA2648086C (en) Methods and compositions for inducing an immune response to hiv and models for testing
WO2008118936A2 (en) Method of elicting immune response with a modified mva viral hiv-1 vector
US6521739B1 (en) Complete genome sequence of a simian immunodeficiency virus from a red-capped mangabey
WO2003062377A2 (en) COMPLETE GENOME SEQUENCE OF SIVcpzTAN1
US6723558B1 (en) Preparation and use of viral vectors for mixed envelope protein vaccines against human immunodeficiency viruses
Ayyavoo et al. Construction of attenuated HIV-1 accessory gene immunization cassettes
EP1729801A2 (en) Mutant viral nucleic acids and vaccine containing same
ZA200204260B (en) Improvements in or relating to immune responses to HIV.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20150401