重组表达人获得性免疫缺陷病毒I型的表面糖蛋白gp160
技术领域
本发明涉及生物工程领域,更具体地涉及在牛痘病毒系统中表达人获得性免疫缺陷病毒I型的表面糖蛋白gp160(简称为“gp160蛋白”)的方法,还涉及生产该表面糖蛋白的载体和所生产的表面糖蛋白gp160。
背景技术
人获得性免疫缺陷病毒I型(HIV-1)是引发爱滋病和爱滋病毒携带的病原体。爱滋病患者会被逐步摧毁机体免疫系统而至死亡。爱滋病毒携带者虽未发病,但对其工作生活造成巨大打击并对他人健康造成威胁。
HIV-1病毒的感染可由测定人体的抗HIV-1病毒的抗体而予以确定。HIV-1病毒有多种抗原。其中一表面糖蛋白因其分子量为160kd而被命名为gp160。gp160在细胞内合成后可在细胞内进一步被酶解为分子量120kd(称为gp120)和分子量41kd(称为gp41)的两个蛋白。抗HIV-1 gp160抗体测定被广泛应用于临床,血源和出入境检疫中。
广泛应用的抗HIV-1 gp160抗体的测定需要大量的HIV-1 gp160蛋白。在以往的工作中,HIV-1 gp160蛋白被不同的基因表达系统包括大肠杆菌进行表达。然而这样表达的gp160在抗原性的完整,表达量的高低,以及表达后gp160的快捷分离上都存在着不足。
因此,本领域迫切需要开发一个新的途径产生高保真抗原,高表达产量,易于分离纯化的gp160。
发明内容
本发明的目的就是提供一种具有高保真抗原性和易于纯化的突变型HIV-1表面糖蛋白gp160,以及通过牛痘病毒系统稳定高效地表达生产出该突变型gp160蛋白的方法。
在本发明的第一方面,提供了一种表达HIV-1表面糖蛋白gp160的重组牛痘病毒,该牛痘病毒的TK区位置插入了HIV-1表面糖蛋白gp160表达盒,该表达盒依次包括:启动子序列、HIV-1表面糖蛋白gp160编码序列、6His序列和终止密码子,并且所述表面糖蛋白gp160的第516位为丝氨酸或苏氨酸。
在另一优选例中,该牛痘病毒为牛痘病毒纽约株。
在另一优选例中,HIV-1表面糖蛋白gp160表达盒中所含的启动子序列选自:巨细胞病毒启动子、牛乳头瘤病毒启动子,而且HIV-1表面糖蛋白gp160表达盒中还含有gp160自身的信号肽序列。
在本发明第二方面,提供了本发明表达HIV-1表面糖蛋白gp160的重组牛痘病毒的用途,它被用于生产HIV-1表面糖蛋白gp160。
在本发明的第三方面,提供了一种分离的突变型HIV-1表面糖蛋白gp160,所述表面糖蛋白gp160的第516位由精氨酸变为丝氨酸或苏氨酸,并且在C末端具有6His。
在另一优选例中,所述的HIV-1表面糖蛋白gp160的氨基酸序列如SEQ IDNO:2所示。
在本发明的第四方面,提供了一种分离的DNA分子,它编码本发明上述的突变型HIV-1表面糖蛋白gp160。
在本发明的第五方面,提供了一种组合物,它包括有效量的本发明所述的分离的突变型HIV-1表面糖蛋白gp160和可接受的载体或赋形剂。
在本发明的第六方面,提供了一种制备HIV-1表面糖蛋白gp160的方法,该方法包括:
(a)用本发明所述的表达HIV-1表面糖蛋白gp160的重组牛痘病毒感染猴肾细胞,在37±3℃培养24-72小时;
(b)裂解猴肾细胞,从细胞裂解液中分离纯化获得HIV-1表面糖蛋白gp160。
在另一优选例中,在步骤(b)中分离纯化包括以下步骤:
(b1)4000-8000g离心获得上清液;
(b2)用Co固化柱或Ni固化柱亲和结合上清液中的HIV-1表面糖蛋白gp160;
(b3)将结合的HIV-1表面糖蛋白gp160从固化柱上洗脱下,获得纯化的HIV-1表面糖蛋白gp160。
附图说明
图1显示了对Vac-gp160mu,Vac-gp160wt感染细胞溶解液和未感染细胞溶解液用抗gp160抗体进行的Western印迹测定的结果。其中,gp160wt为野生型gp160蛋白,而gp160mu为突变型gp160蛋白。图中显示Vac-gp160mu为分子量160kd一条特异带,Vac-gp160wt为分子量160kd和120kd二条特异带。未感染细胞未显示特异带。
图2显示了Vac-gp160mu感染细胞裂解液经Talon凝胶珠分离前和后的SDS-PAGE电泳和Western印迹分析结果。图A,SDS-PAGE电泳后用考马斯亮兰染色的分离前和分离后的样品。B,SDS--PAGE电泳后,对分离收集的样品进行考马斯亮兰染色和Western印迹分析的结果。
图3显示了质粒pVAC的结构图。
具体实施方式
本发明人经过多年研究,对HIV-1表面糖蛋白gp160的结构、免疫原性和各种表达系统进行了广泛的尝试,结果发现,为了高效地表达高保真抗原性的gp160蛋白,可在牛痘病毒表达系统中将gp160蛋白中第516位的精氨酸突变为丝氨酸或苏氨酸,这样可以有效地防止gp160蛋白被蛋白酶水解,从而提高gp160蛋白产量并保留免疫原性。此外,在gp160蛋白的C端添加6his标签,不仅可极大地简化纯化工艺,而且添加在C末端的6His标签对gp160蛋白的免疫原性没有负面影响。另外,利用牛痘病毒表达系统感染猴肾细胞可以进一步提高gp160蛋白的表达量。在此基础上完成了本发明。
在本发明中,术语“HIV-1表面糖蛋白gp160”、“gp160”、“表面糖蛋白gp160”和“gp160蛋白”可互换使用,都指由HIV-1中分子量为160kd的表面糖蛋白。gp160蛋白的氨基酸序列是本领域中已知,例如Genbank登录号K02013。一种代表性的野生型gp160蛋白的氨基酸序列如SEQ ID NO:8所示,其DNA编码序列如SEQ ID NO:7所示,其中ORF位于1-2586位。
在本发明中,术语“突变型HIV-1表面糖蛋白gp160”、“突变型gp160”、“突变型表面糖蛋白gp160”和“突变型gp160蛋白”可互换使用,都指第516位的精氨酸突变为丝氨酸或苏氨酸、并且在C末端添加有6His标签的HIV-1表面糖蛋白gp160。一种优选的突变型gp160蛋白的氨基酸序列如SEQ ID NO:2所示,其编码序列如SEQ ID NO:1所示。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。较佳地,该宿主细胞是哺乳动物细胞,如肾细胞、CHO细胞等。更佳地,该宿主细胞是可被牛痘病毒感染的细胞,如猴肾细胞。
在本发明中,编码表面糖蛋白gp160的基因可以通过PCR法或直接人工合成等方法获得。例如,先通过PCR获得gp160蛋白编码序列并在其末端添加6his编码序列,然后通过本领域常规的定点诱变将对应于第516位精氨酸的密码子AGA突变为AGC(丝氨酸),从而形成编码突变型表面糖蛋白gp160的基因。
在获得了突变型表面糖蛋白gp160基因之后,可以将其插入到合适的载体中,以便进行转化和或鉴定。适用于本发明的载体包括本领域已知的各种载体,如市售的载体。例如选用市售的载体,然后将编码本发明多肽的核苷酸序列插入到合适的位点,形成能够与牛痘病毒系统基因组发生重组的整合型表达载体。整合型载体是指能够与宿主细胞的基因组发生DNA重组,从而将外源基因整合入牛痘病毒基因组中的载体。合适的整合型表达载体的例子包括(但并不限于):质粒pUC19等。
有众多已知的常规方法可将含有外源基因的整合入牛痘病毒的基因组组,其中包括(但并不限于):共转染法和同源重组法。
在将表达载体转入牛痘病毒后,可以根据相应的标记基因加以筛选,从而获得插入gp160蛋白表达盒的牛痘病毒。
可用于本发明的牛痘病毒没有特别限制,可以选用生物工程领域中已作为病毒载体使用的各种牛痘病毒株,例如包括(但并不限于):牛痘病毒纽约株等。
筛选出转化的且在基因组中整合有表面糖蛋白gp160基因的牛痘病毒,用去感染相应的哺乳动物细胞(如猴肾细胞),便可在适合表面糖蛋白gp160表达的条件下培养该哺乳动物细胞。本发明的表面糖蛋白gp160可以是分泌性的,此时表面糖蛋白gp160被分泌在培养液中;也可以是非分泌性的,此时通过裂解细胞获得含gp160蛋白的裂解液。
在获得了含有表面糖蛋白gp160的培养液或裂解液后,可以用本领域已知的常规方法进行分离纯化,从而获得纯化的表面糖蛋白gp160。合适的分离纯化方法包括:离心、离子交换层析、分子筛层析、蛋白沉淀法、亲和层析、HPLC等。由于本发明的突变型gp160蛋白的C末端带有6His标签,因此特别优选的纯化方法是用Co固化柱或Ni固化柱进行亲和层析纯化。
简而言之,本发明的突变型表面糖蛋白gp160不仅十分稳定(耐蛋白酶水解),而且纯化极其方便高效。
本发明还提供了含有本发明突变型表面糖蛋白gp160的组合物,它含有治疗有效量的突变型表面糖蛋白gp160以及(药学上)可接受的载体或赋形剂。合适载体包括(但并不限于):盐水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。
这些组合物可用作抗原,用于生产抗gp160蛋白的抗体。还可用作药物组合物(尤其是预防性的疫苗组合物)中的抗原成分之一。
本发明的主要优点在于:
1、在HIV-1表面蛋白gp160基因的羧基末端(C-端)上添加6个组氨酸编码。此6个组氨酸可用于亲和层析,从而极其高效方便地从众多细胞蛋白中快捷分离gp160。
2、将HIV-1表面蛋白gp160基因中第516位氨基酸精氨酸(编码AGA)突变成丝氨酸(编码AGC),此一突变可造成gp160不能被哺乳动物细胞中的蛋白酶切成gp120和gp41分子,从而使所有基因产物存在于gp160状态而提高原始产量。
3、将上述修饰后的HIV-1 gp160基因重组入牛痘病毒的基因组中,而生成一新的重组牛痘病毒。此重组牛痘病毒可感染多种哺乳类细胞株。使HIV-1gp160基因在哺乳类细胞中得到正确的表达和表达后修饰,以获得高保真抗原性的HIV-1 gp160蛋白。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
用PCR方法获得C-端带有6个组氨酸编码的HIV-1 gp160基因
将带有HIV-1 gp160基因的DNA质粒pN2gpt-gp160(美国专利5,445,953)作为模板,用下述一对引物,在聚合酶作用下进行常规的DNA聚合酶链反应(PCR)。
5’端引物:
5’GCT CTA GAG AGC AGA AGA CAG TGG CAA TG 3’(SEQ IDNO:3)
3’端引物:
5’CGA ATT CTA TTA
GTG GTG ATG GTG ATG GTG TAG CAAAAT CCT TTC CAA GCC CTG 3’(SEQ ID NO:4,下划线部分对应于6His)
所得的扩增产物用XbaI消化插入已经Xba I消化和HidIII位点平端化的工作质粒pUC19(购自New England Biolab公司)中。按常规方法酶连接,转化入大肠杆菌DH5α中,挑选阳性克隆,制备DNA质粒。用合适的内切酶对制备的DNA质粒进行消化,确认PCR产物已插入工作质粒PUC19中。
用DNA测序确认插入的HIV-1 gp160序列正确,并在3’未端添加6个组氨酸编码序列。此获得的质粒称为PAC-gp160。
实施例2
对HIV-1 gp160基因上编码的第516氨基酸精氨酸进行突变为丝氨酸
用质粒PAC-gp160作为模板,用下述两对引物分别进行PCR反应。
反应1:
引物1:实施例1中的5’端引物(SEQ ID NO:3)
引物2:5’GGA ACA AAG CTC CTA TTC CCA CTG C
GC TTT TTTCTC TCT GC 3’(SEQ ID NO:5)(注:带下划线的G在野生型序列中为T)
反应2:
引物3:5’GTG GGA ATA GGA GCT TTG TTC CTT GG 3’(SEQ IDNO:6)。
引物4:实施例1中的3’端引物(SEQ ID NO:4)。
将PCR反应1和反应2所得产物混合作为模板,用实施例1中的引物(SEQID NO:3和4)再行PCR反应。所得的PCR产物用XbaI消化,插入已经XbaI消化和HindIII位点平端化的质粒PUC19(购自New England Biolab公司)中。
按常规方法酶连接,转化入大肠杆菌DH5α,挑选阳性克隆,制备DNA质粒,酶消化确认已插入了PCR产物。
DNA测序证实了,DNA序列中对应于第516位精氨酸的密码子AGA已被突变为AGC(丝氨酸)。此质粒命名为PAC-gp160MU。在PAC-gp160基因中,原来DNA编码的氨基酸序列507-520为KRRVVQREK
RAVGI在PAC-gp160MU中已突变为KRRVVQREK
SAVGI。完整的突变型gp160蛋白的DNA序列和氨基酸序列如SEQ ID NO:1和2所示。
实施例3
制备带有gp-160基因的重组牛痘病毒
将PAC-gp160mu用内切酶EcoRI消化,分离gp-160mu DNA片段,插入已经EcoRI消化的常用表达质粒PVAC(质粒结构图谱见图3)中。将获得的带有gp-160mu基因的PVAC质粒命名为PVAC-gp160mu。
猴肾细胞株BSC(ATCC CCL-26)生长于完全DMEM培养液中至80%的密度。用0.1PFU浓度的牛痘病毒纽约株(购自美国典型培养物保藏中心,ATCCVR-1536)对BSC细胞进行感染。感染后的BSC细胞在37度二氧化碳培养箱中培育2小时。将PVAC-gp160mu质粒DNA转染于牛痘病毒感染后的BSC细胞中。DNA转染后的细胞置于37摄氏度的二氧化碳培养箱培养2天后将细胞冻融裂解,然后收集。
新鲜生长的BSC细胞培养至90%的密度。用上述冻融收集的细胞裂解液进行感染。感染后的细胞加选择培养液(完全DMEM培养液50ml+12.5ul菌酚酸(Mycophenolic acid),1.25ml黄嘌呤,75ul次黄嘌呤,后三者浓度皆为10mg/ml)在37度二氧化碳培养箱培养2天。然后冻融收集细胞裂解液。
新鲜生长的BSC细胞培养至90%的密度,用不同量的选择培养基生长后的细胞裂解液进行感染。吸走细胞裂解液后用含0.9%液化琼脂糖的选择培养基复盖于细胞。待琼脂在室温凝结后放入37度二氧化碳培养箱中培养。3天后开始观察有否病毒空斑形成。将观察到的病毒空斑挑出。
挑出的病毒空斑进一步在BSC细胞中用完全DMEM培养液进行扩增。此选择挑出的病毒空斑为含有HIV-gp160mu基因的重组牛痘病毒,命名为重组牛痘病毒gp-160mu(Vac-gp160mu)。
重复上述方法,不同点在于用PVAC-gp160质粒DNA替换PVAC-gp160mu质粒,从而获得含有HIV-gp160野生型基因的重组牛痘病毒,命名为重组牛痘病毒gp-160wt(Vac-gp160wt)。
实施例4
用Western印迹方法确认重组牛痘病毒Vac-gp160mu表达HIV-gp160。
BSC细胞生长至90%密度。用1PFU的Vac-gp160mu感染BSC细胞后去除病毒感染液。换入完全DMEM培养液后将感染后的细胞在37度二氧化碳培养箱中培养40小时。然后去除培养液,将细胞在1ml细胞溶解液对5×106细胞的比例下将细胞裂解。细胞裂解液用6,000g离心后收集上清。
取25微升的细胞裂解液上清于7.5%的SDS一聚丙酰胺凝胶进行电泳。电泳后转移至PVDF膜上。转移后的PVDF膜用羊抗HIV-1 gp160的抗体(购自USBiological公司)进行反应。然后用辣根过氧化物酶标记的特异二抗抗体(购自Santa Cruz Biotechnology公司)进行反应,用ECL反应系统进行条带显示。
对照为Vac-gp160wt感染的细胞和未感染细胞。
结果如图1所示。Vac-gp160mu感染的细胞裂解液中有一分子量为160kd的特异条带,这表明Vac-160mu特异表达gp160蛋白;Vac-gp160wt感染的细胞裂解液中有分子量为160kd和120kd的2个条带,这表明Vac-160wt表达的gp160蛋白被蛋白酶部分水解为140和41Kd的片段;未感染细胞未显示特异带。
实施例5
利用重组gp160 C一端的多组氨酸结构快捷分离纯化表达gp160蛋白
实施例4重组表达的gp160蛋白C一端有一多组氨酸结构。利用此结构可与金属离子Co或Ni特异结合的原理,用Co#固化柱或Ni#固化柱快速分离纯化重组gp160蛋白。本实施例用BD Bioscience公司提供的Talon金属离子亲和柱(含Co)并按照供应商建议的条件进行工作。其过程简述如下:
BSC细胞(ATCC CCL-26)生长至90%密度后,用1PFU的Vac-gp160mu感染BSC细胞并去除病毒感染液。感染后的细胞换入完全DMEM培养液后至于37摄氏度、5%二氧化碳培养箱培养40小时。去除培养液后,用细胞裂解液对细胞在1ml∶5×106细胞的比列进行裂解。细胞裂解液经6,000g离心后收集上清。
将Talon凝胶珠放入收集后的上清中。在室温条件下充分混是1小时后离心分离上清和Talon凝胶珠,去除上清后,对凝胶珠进行清洗2次。清洗后凝胶珠灌装层拆柱。然后用含150mm咪唑(Imidazole)的洗脱液对层拆柱进行洗脱。分管收集洗脱液。
收集的洗脱液用7.5%的SDS一聚丙酰胺凝胶电泳(SDS-PAGE)后,用考马斯亮兰染色后观察。收集的洗脱液亦用Western印迹及特异抗HIV-gp160抗体(购自US Biological公司)进行分析。
结果表明,Talon金属亲和层拆可将混杂于全细胞蛋白中的重组gp160进一步纯化至90%以上的纯度(图2A)。Western印迹分析表明此富集纯化的分子量160kd的蛋白为HIV-gp160(图2B),产量是500μg/106细胞。
实施例6
N端多组氨酸结构对gp160蛋白纯化的影响
重复实施例1-5的过程,不同点在于将6His序列添加在gp160蛋白的N端而不是添加在C端。
结果表明,将6His添加在N端时,由于gp160基因的5’端有一分泌信号肽序列,因此在蛋白的反义后加工过程中6His和信号肽会一起切除,从而导致最终形成的gp160蛋白中不含有6His,因而不利于纯化。这表明,将6His添加在N端对gp160蛋白的纯化将基本上起不到有利影响。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>楼,伟
楼,觉人
<120>重组表达人获得性免疫缺陷病毒I型的表面糖蛋白gp160
<130>041019
<160>8
<170>PatentIn version 3.1
<210>1
<211>2604
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>突变型gp160编码序列
<400>1
atgagagtga aggagaaata tcagcacttg tggagatggg ggtggaaatg gggcaccatg 60
ctccttggga tattgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120
ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180
tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240
ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300
gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360
aaattaaccc cactctgtgt tagtttaaag tgcactgatt tggggaatgc tactaatacc 420
aatagtagta ataccaatag tagtagcggg gaaatgatga tggagaaagg agagataaaa 480
aactgctctt tcaatatcag cacaagcata agaggtaagg tgcagaaaga atatgcattt 540
ttttataaac ttgatataat accaatagat aatgatacta ccagctatac gttgacaagt 600
tgtaacacct cagtcattac acaggcctgt ccaaaggtat cctttgagcc aattcccata 660
cattattgtg ccccggctgg ttttgcgatt ctaaaatgta ataataagac gttcaatgga 720
acaggaccat gtacaaatgt cagcacagta caatgtacac atggaattag gccagtagta 780
tcaactcaac tgctgttgaa tggcagtcta gcagaagaag aggtagtaat tagatctgcc 840
aatttcacag acaatgctaa aaccataata gtacagctga accaatctgt agaaattaat 900
tgtacaagac ccaacaacaa tacaagaaaa agtatccgta tccagagggg accagggaga 960
gcatttgtta caataggaaa aataggaaat atgagacaag cacattgtaa cattagtaga 1020
gcaaaatgga atgccacttt aaaacagata gctagcaaat taagagaaca atttggaaat 1080
aataaaacaa taatctttaa gcaatcctca ggaggggacc cagaaattgt aacgcacagt 1140
tttaattgtg gaggggaatt tttctactgt aattcaacac aactgtttaa tagtacttgg 1200
tttaatagta cttggagtac tgaagggtca aataacactg aaggaagtga cacaatcaca 1260
ctcccatgca gaataaaaca atttataaac atgtggcagg aagtaggaaa agcaatgtat 1320
gcccctccca tcagcggaca aattagatgt tcatcaaata ttacagggct gctattaaca 1380
agagatggtg gtaataacaa caatgggtcc gagatcttca gacctggagg aggagatatg 1440
agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga accattagga 1500
gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagcgc agtgggaata 1560
ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc acggtcaatg 1620
acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg 1680
ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag 1740
ctccaggcaa gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt 1800
tggggttgct ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt 1860
aataaatctc tggaacagat ttggaataac atgacctgga tggagtggga cagagaaatt 1920
aacaattaca caagcttaat acattcctta attgaagaat cgcaaaacca gcaagaaaag 1980
aatgaacaag aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata 2040
acaaattggc tgtggtatat aaaaatattc ataatgatag taggaggctt ggtaggttta 2100
agaatagttt ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta 2160
tcgtttcaga cccacctccc aaccccgagg ggacccgaca ggcccgaagg aatagaagaa 2220
gaaggtggag agagagacag agacagatcc attcgattag tgaacggatc cttagcactt 2280
atctgggacg atctgcggag cctgtgcctc ttcagctacc accgcttgag agacttactc 2340
ttgattgtaa cgaggattgt ggaacttctg ggacgcaggg ggtgggaagc cctcaaatat 2400
tggtggaatc tcctacagta ttggagtcag gaactaaaga atagtgctgt tagcttgctc 2460
aatgccacag ccatagcagt agctgagggg acagataggg ttatagaagt agtacaagga 2520
gcttgtagag ctattcgcca catacctaga agaataagac agggcttgga aaggattttg 2580
ctacaccatc accatcacca ctaa 2604
<210>2
<211>867
<212>PRT
<213>人工序列
<220>
<221>misc_feature
<223>突变型gp160蛋白
<400>2
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Lys
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Ile Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Gly Asn Ala Thr Asn Thr Asn Ser Ser Asn
130 135 140
Thr Asn Ser Ser Ser Gly Glu Met Met Met Glu Lys Gly Glu Ile Lys
145 150 155 160
Asn Cys Ser Phe Asn Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys
165 170 175
Glu Tyr Ala Phe Phe Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp
180 185 190
Thr Thr Ser Tyr Thr Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln
195 200 205
Ala Cys Pro Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala
210 215 220
Pro Ala Gly Phe Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly
225 230 235 240
Thr Gly Pro Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile
245 250 255
Arg Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu
260 265 270
Glu Glu Val Val Ile Arg Ser Ala Asn Phe Thr Asp Asn Ala Lys Thr
275 280 285
Ile Ile Val Gln Leu Asn Gln Ser Val Glu Ile Asn Cys Thr Arg Pro
290 295 300
Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gln Arg Gly Pro Gly Arg
305 310 315 320
Ala Phe Val Thr Ile Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys
325 330 335
Asn Ile Ser Arg Ala Lys Trp Asn Ala Thr Leu Lys Gln Ile Ala Ser
340 345 350
Lys Leu Arg Glu Gln Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln
355 360 365
Ser Ser Gly Gly Asp Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly
370 375 380
Gly Glu Phe Phe Tyr Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp
385 390 395 400
Phe Asn Ser Thr Trp Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser
405 410 415
Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys Gln Phe Ile Asn Met Trp
420 425 430
Gln Glu Val Gly Lys Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile
435 440 445
Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly
450 455 460
Asn Asn Asn Asn Gly Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met
465 470 475 480
Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile
485 490 495
Glu Pro Leu Gly Val Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln
500 505 510
Arg Glu Lys Ser Ala Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu
515 520 525
Gly Ala Ala Gly Ser Thr Met Gly Ala Arg Ser Met Thr Leu Thr Val
530 535 540
Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu
545 550 555 560
Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp
565 570 575
Gly Ile Lys Gln Leu Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu
580 585 590
Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile
595 600 605
Cys Thr Thr Ala Val Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu
610 615 620
Glu Gln Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile
625 630 635 640
Asn Asn Tyr Thr Ser Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn
645 650 655
Gln Gln Glu Lys Asn Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala
660 665 670
Ser Leu Trp Asn Trp Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys
675 680 685
Ile Phe Ile Met Ile Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe
690 695 700
Ala Val Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu
705 710 715 720
Ser Phe Gln Thr His Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu
725 730 735
Gly Ile Glu Glu Glu Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg
740 745 750
Leu Val Asn Gly Ser Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu
755 760 765
Cys Leu Phe Ser Tyr His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr
770 775 780
Arg Ile Val Glu Leu Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr
785 790 795 800
Trp Trp Asn Leu Leu Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala
805 810 815
Val Ser Leu Leu Asn Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp
820 825 830
Arg Val Ile Glu Val Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile
835 840 845
Pro Arg Arg Ile Arg Gln Gly Leu Glu Arg Ile Leu Leu His His His
850 855 860
His His His
865
<210>3
<211>29
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>3
gctctagaga gcagaagaca gtggcaatg 29
<210>4
<211>54
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>4
cgaattctat tagtggtgat ggtgatggtg tagcaaatc ctttccaagc cctg 54
<210>5
<211>41
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>5
ggaacaaagc tcctattccc actgcgcttt tttctctctg c 41
<210>6
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>6
gtgggaatag gagctttgtt ccttgg 26
<210>7
<211>2586
<212>DNA
<213>人免疫缺陷病毒I型(Human immunodeficiency virus type 1)
<400>7
atgagagtga aggagaaata tcagcacttg tggagatggg ggtggaaatg gggcaccatg 60
ctccttggga tattgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120
ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180
tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240
ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300
gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360
aaattaaccc cactctgtgt tagtttaaag tgcactgatt tggggaatgc tactaatacc 420
aatagtagta ataccaatag tagtagcggg gaaatgatga tggagaaagg agagataaaa 480
aactgctctt tcaatatcag cacaagcata agaggtaagg tgcagaaaga atatgcattt 540
ttttataaac ttgatataat accaatagat aatgatacta ccagctatac gttgacaagt 600
tgtaacacct cagtcattac acaggcctgt ccaaaggtat cctttgagcc aattcccata 660
cattattgtg ccccggctgg ttttgcgatt ctaaaatgta ataataagac gttcaatgga 720
acaggaccat gtacaaatgt cagcacagta caatgtacac atggaattag gccagtagta 780
tcaactcaac tgctgttgaa tggcagtcta gcagaagaag aggtagtaat tagatctgcc 840
aatttcacag acaatgctaa aaccataata gtacagctga accaatctgt agaaattaat 900
tgtacaagac ccaacaacaa tacaagaaaa agtatccgta tccagagggg accagggaga 960
gcatttgtta caataggaaa aataggaaat atgagacaag cacattgtaa cattagtaga 1020
gcaaaatgga atgccacttt aaaacagata gctagcaaat taagagaaca atttggaaat 1080
aataaaacaa taatctttaa gcaatcctca ggaggggacc cagaaattgt aacgcacagt 1140
tttaattgtg gaggggaatt tttctactgt aattcaacac aactgtttaa tagtacttgg 1200
tttaatagta cttggagtac tgaagggtca aataacactg aaggaagtga cacaatcaca 1260
ctcccatgca gaataaaaca atttataaac atgtggcagg aagtaggaaa agcaatgtat 1320
gcccctccca tcagcggaca aattagatgt tcatcaaata ttacagggct gctattaaca 1380
agagatggtg gtaataacaa caatgggtcc gagatcttca gacctggagg aggagatatg 1440
agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga accattagga 1500
gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata 1560
ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc acggtcaatg 1620
acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg 1680
ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag 1740
ctccaggcaa gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt 1800
tggggttgct ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt 1860
aataaatctc tggaacagat ttggaataac atgacctgga tggagtggga cagagaaatt 1920
aacaattaca caagcttaat acattcctta attgaagaat cgcaaaacca gcaagaaaag 1980
aatgaacaag aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata 2040
acaaattggc tgtggtatat aaaaatattc ataatgatag taggaggctt ggtaggttta 2100
agaatagttt ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta 2160
tcgtttcaga cccacctccc aaccccgagg ggacccgaca ggcccgaagg aatagaagaa 2220
gaaggtggag agagagacag agacagatcc attcgattag tgaacggatc cttagcactt 2280
atctgggacg atctgcggag cctgtgcctc ttcagctacc accgcttgag agacttactc 2340
ttgattgtaa cgaggattgt ggaacttctg ggacgcaggg ggtgggaagc cctcaaatat 2400
tggtggaatc tcctacagta ttggagtcag gaactaaaga atagtgctgt tagcttgctc 2460
aatgccacag ccatagcagt agctgagggg acagataggg ttatagaagt agtacaagga 2520
gcttgtagag ctattcgcca catacctaga agaataagac agggcttgga aaggattttg 2580
ctataa 2586
<210>8
<211>861
<212>PRT
<213>人免疫缺陷病毒I型(Human immunodeficiency virus type 1)
<400>8
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Lys
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Ile Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Gly Asn Ala Thr Asn Thr Asn Ser Ser Asn
130 135 140
Thr Asn Ser Ser Ser Gly Glu Met Met Met Glu Lys Gly Glu Ile Lys
145 150 155 160
Asn Cys Ser Phe Asn Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys
165 170 175
Glu Tyr Ala Phe Phe Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp
180 185 190
Thr Thr Ser Tyr Thr Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln
195 200 205
Ala Cys Pro Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala
210 215 220
Pro Ala Gly Phe Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly
225 230 235 240
Thr Gly Pro Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile
245 250 255
Arg Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu
260 265 270
Glu Glu Val Val Ile Arg Ser Ala Asn Phe Thr Asp Asn Ala Lys Thr
275 280 285
Ile Ile Val Gln Leu Asn Gln Ser Val Glu Ile Asn Cys Thr Arg Pro
290 295 300
Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gln Arg Gly Pro Gly Arg
305 310 315 320
Ala Phe Val Thr Ile Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys
325 330 335
Asn Ile Ser Arg Ala Lys Trp Asn Ala Thr Leu Lys Gln Ile Ala Ser
340 345 350
Lys Leu Arg Glu Gln Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln
355 360 365
Ser Ser Gly Gly Asp Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly
370 375 380
Gly Glu Phe Phe Tyr Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp
385 390 395 400
Phe Asn Ser Thr Trp Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser
405 410 415
Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys Gln Phe Ile Asn Met Trp
420 425 430
Gln Glu Val Gly Lys Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile
435 440 445
Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly
450 455 460
Asn Asn Asn Asn Gly Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met
465 470 475 480
Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile
485 490 495
Glu Pro Leu Gly Val Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln
500 505 510
Arg Glu Lys Arg Ala Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu
515 520 525
Gly Ala Ala Gly Ser Thr Met Gly Ala Arg Ser Met Thr Leu Thr Val
530 535 540
Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu
545 550 555 560
Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp
565 570 575
Gly Ile Lys Gln Leu Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu
580 585 590
Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile
595 600 605
Cys Thr Thr Ala Val Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu
610 615 620
Glu Gln Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile
625 630 635 640
Asn Asn Tyr Thr Ser Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn
645 650 655
Gln Gln Glu Lys Asn Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala
660 665 670
Ser Leu Trp Asn Trp Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys
675 680 685
Ile Phe Ile Met Ile Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe
690 695 700
Ala Val Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu
705 710 715 720
Ser Phe Gln Thr His Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu
725 730 735
Gly Ile Glu Glu Glu Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg
740 745 750
Leu Val Asn Gly Ser Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu
755 760 765
Cys Leu Phe Ser Tyr His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr
770 775 780
Arg Ile Val Glu Leu Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr
785 790 795 800
Trp Trp Asn Leu Leu Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala
805 810 815
Val Ser Leu Leu Asn Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp
820 825 830
Arg Val Ile Glu Val Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile
835 840 845
Pro Arg Arg Ile Arg Gln Gly Leu Glu Arg Ile Leu Leu
850 855 860