CN1423698A - Hiv-1亚型间(c/b’)基因组和其用途 - Google Patents

Hiv-1亚型间(c/b’)基因组和其用途 Download PDF

Info

Publication number
CN1423698A
CN1423698A CN00818426A CN00818426A CN1423698A CN 1423698 A CN1423698 A CN 1423698A CN 00818426 A CN00818426 A CN 00818426A CN 00818426 A CN00818426 A CN 00818426A CN 1423698 A CN1423698 A CN 1423698A
Authority
CN
China
Prior art keywords
fragment
hiv
polynucleotide
sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN00818426A
Other languages
English (en)
Inventor
邵一鸣
罗夫·伟格拿
汉思·渥夫
麻库司·葛拉夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shao Yiming
Thermo Fisher Scientific Geneart GmbH
Original Assignee
Geneart AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Geneart AG filed Critical Geneart AG
Publication of CN1423698A publication Critical patent/CN1423698A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16311Human Immunodeficiency Virus, HIV concerning HIV regulatory proteins
    • C12N2740/16322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • AIDS & HIV (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或与在SEQ ID NO:1,2或3中所示的核酸序列杂交的多核苷酸。本发明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所编码的多肽。该等多核苷酸和多肽可用为药品,疫苗或诊断用物质,较佳者是用于HIV感染的治疗,预防或诊断。

Description

HIV-1亚型间(C/B’)基因组和其用途
发明说明
本发明涉及一种多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或与在SEQ ID NO:1,2或3中所示的核酸序列杂交的多核苷酸。本发明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所编码的多肽。该等多核苷酸和多肽可用为药品,疫苗或诊断用物质,较佳者是用于HIV感染的治疗,预防或诊断。
在考虑到至本世纪末全世界经估计有超过四千万受感染的人且其中有超过90%是生活在发展中国家中的人类免疫缺陷性病毒(Human Immunodeficiency Virus)(HIV)的全球分布程度,HIV疫苗的开发据认为是现代工业化社会的重大挑战之一。不过,到目前为止,成功的HIV疫苗的开发仍然受限于此种病毒的复杂生物学及其与宿主所具免疫系统的复杂相互作用。到目前为止已经在发展中国家中对临床第三期用药中试验过的少数可选用疫苗主要是以第1型HIV之外部糖蛋白gp120或gp160为基础。不过,这些研究的结果十分令人失望,该等疫苗不仅不能诱导出宽广的交叉中和抗体与T细胞反应,而且甚至于不能防止已对某些接种疫苗的个体报导过的突破感染。这种结果的诸项原因之一确定是来自于所使用的衍生自经实验室适应的病毒株的抗原与在试验区例如泰国境内循环的遗传分歧性病毒之间的广泛序列变异。
对在全球流转的HIV病毒株所进行的分类学分析,除了O组病毒以外,已鉴定出在包膜蛋白质中存在着高达24%序列变异的10种不同的序列亚型(A-J)组成的一主要组(M)(Kostrikis et al.,1995;Leitner and Albert,1995;Gaywee et al.,1996:World HealthOrganisation Network for HIV lsolation and Characterization,1994):该O组病毒与M组病毒在某些读框上有超过40%的差异(LoussertAjaka et al.,1995;Myers et al.,1996;Sharp et al.,1995;Shary etal.,1999)。HIV是经由突变与亚型间重组的快速累积而进行演化。在地理区群中共同循环的诸不同亚型代表进化枝间镶嵌性病毒(interclade mosaic virus)的产生与分布的分子基础。虽然已经利用血清学和异型双螺旋体DNA分析对全球HIV-1变异体作过精深的研究,不过因为现有诸亚型和多种重组形式都缺乏经完整测序的基因组,所以大部份分类学研究都是以包膜序列为基础。
非亚型B病毒会引起极多种全球性新的HIV-1感染。其中,进化枝CHIV-1病毒株在有关受感染人的总数以及新感染例特别是在南美和亚洲中的高发生率两者扮有前导性角色。因此之故,进化枝C病毒的鉴定对于诊断、预防和治疗目的而言都是顶级优先者之一。除了泰国之外,有关在整个亚洲流传的HIV-1病毒株的分布与分子特性所能得到的资讯直到最近仍然有限。WHO估计南亚与东南亚具有最快速的HIV传播速率且很快就会变成全世界最大的HIV流行区。中国具有与这些区域非常类似的社会和经济状况与直接的伦理和经济关联。自从1995年早期之后,在中国许多省中即可清楚地看到HIV感染的快速增加。与1985年到1994年所侦检到的HIV和AIDS的累积1774病例相比,在1995年侦检到1421例,而单在1997年就侦检出超过4000病例。WHO估计到1997年底在中国境内会有超过400,000 HIV感染例,且单在1997年内,估计有6400个累积的AIDS死亡例和4000个死亡途中者。于最近的全国HIV分子流行病学调查中,可以发现在云南省所存在的亚型原型B与B’-亚型(Graf et al.,1998)已被毒品使用者,污染的血液和tat浆收集服务传播到中国中部与东部。第二种流行病最可能是在1990年代早期由带有亚型C病毒株的印度IDUs输入到该等相同的地区(Luoet al.,1995;Shao et al.,1999)。在数年之内,亚型C病毒经由毒品运输在中国南部、中部及甚至于西北部快速地传播且在中国境内引起广泛传播的流行病。根据最近的全国HIV分子流行病学调查,几乎所有感染亚型C的个体都是IDUs且占有中国HIV感染IDUs的约40%,可以推测出亚型C病毒为在中国境内IDUs中所遍布的诸主要HIV-1亚型中之一(Shao et al,1998;Shao et al.,1994)。
由此点可以推测出在中国境内IDUs之间的HIV流行病于短短数年之间就从单一主要亚型(B)扩展到至少两种主要亚型,B-Thai和C,增加了亚型间重组的可能性。根据我们对于不同病毒株所具可变异性与抗原性的认知,应该对区域性病毒株调整诊断工具,治疗药剂与疫苗。不过,目前对于非-亚型B病毒所用的分子药剂的种类数目仍然极为有限。目前,对于B或C以外的病毒只有少数非重组分子克隆(molecular clone)和一些镶嵌性基因组(mosaicgenomes)可以取用。有关进化枝CHIV-1病毒,到目前为止只有公开出非一重组型代表物与4A/C重组体,彼等全部都是源自非洲、南美或印度(Lao et al.1995;Gao et al,1998:Loke et al.1999)。再者,所有先前对于在中国境内的亚型C病毒的数据都局限在env基因的遗传亚型定型(genetic subtyping)(Luo et al.1995;Yu etal.1997;Salminen et al.1995)。
到目前为止已有数个使用疫苗实施针对HIV感染的临床实验。在该等临床实验中所观察到的令人失望的结果包括在接受疫苗的人中不断地报导出有突破防线性的感染。这种结果经归因于所施用的包膜蛋白质与感染性输入病毒之间的重大序列变异,此点于事实上主要是来自于对于在独特地理区域内流传的病毒群所作的鉴定不足所致。此点导致对和在试验场域中的病毒群不相关的病毒的病毒抗原产生体液免疫反应与(较少程度地)细胞介导的免疫反应。再者,已经报导的低亲和结合性,包膜特异性抗体不仅缺乏中和能力,而且甚至于会助成通过补体-或Fc-受体的感染的增强。另外,所选用的抗原和输送系统会转变成为极端微弱的细胞介导的免疫反应的诱导剂。
基于对跨进化枝保护性免疫反应的正确知识的缺乏以及有关在已知有多重HIV-1亚型共同流传的发展中国家境内的复杂情势,疫苗制剂应该包括多种代表性抗原的混合物。因此,有需要分离与鉴定进化枝C病毒,特别是克隆其编码区。
本发明的问题是由权利要求的主题内容予以解决。
本发明用附图进一步阐明。
图1显示来自克隆97cn54的env C2V3编码区与主要HIV-1(M组)亚型的代表的分类学关系的图解说明。Cn-con-c代表在中国境内普遍流行的HIV-1亚型C病毒株的env共有序列(consensussequence)。分类学树是使用邻域连接法(neighbour joining method)构成的。在结点的值指的是朝右的簇集受到支持的相生百分比(percent bootstrap)。其中只显示出70%和更高的相生率。右边括号表HIV-1M组的主要亚型序列。
图2显示出97cn54完整gagpol编码区的重组鉴定程序分析(theRecombinant Identification Program analysi)(RIP,versionl,1.3)的图解说明(窗尺寸:200,统计意义阈值:90%,Gap处置:STRIP)。gag和pol两开放读框的位置是在图的顶端用箭号指示出。Rip分析是以使用从所选代表最相关性HIV-1亚型的病毒株导出的参比序列进行背景对比(background alignment)为基础的。标准代表物是使用如所示的不同颜色予以标记出。X轴指示出沿着该对比的核苷酸位置。Y轴指示出97cn54与所列出的参比亚型的类似率。
图3显示出在97cn54衍生的gagpol读框内的诸不同区相对于主要HIV-1(M组)亚型的标准代表物的分类关系的图解说明。分类学树是使用邻域连接法以下列序列连续段(stretch)为基础而构成者:(A)核苷酸1-478,(B)479-620,(C)621-1290,(D)1291-1830,(E)1831-2220,(F)2221-2520和(G)2521-2971。所给位置指的是gag开放读框的第一个核苷酸。灰色区突显出用进化枝C-(A,C,E,G)或B-(B,D,F)衍生的参比株分析的序列的簇集。在结点的值指的是朝右的簇集受到支持的相生百分比。其中只显示出70%和更高的相生率。
图4显示出97cn54所含诸不同区的重组鉴定程序分析(RIP,version 1.3)的图解说明(窗尺寸:200,统计意义阂值:90%,Gap处置:STRIP)。分析包括(A)-1500bp的序列连续段,从vif基因的起始密码子到env基因的5’端,内含vif,vpr,tat和rev的第一个外显子,vpu以及env基因的前面200bp与(B)从env的3’端有300bp重叠之一段约700bp的片段内含完整的nef基因与3’LTR的部份。vpr,tat,vpu,env,nef的起始密码子以及3’-LTR的5’端等的位置是在图的顶端分别以箭号指示出。Rip分析是以便用从所选代表最相关性HIV-1亚型的病毒株导出的参比序列进行背景对比(background alignment)为基础的。所示标准代表物是使用不同颜色予以标记出。X轴指示比沿着该对比的核苷酸位置。Y轴指示出97cn54与所列出的参比亚型的类似率。(C)和(D)得自中国境内的两种独立进化枝C-分离物(xj24和xj158)的序列的Rip分析,其中vpr与vpu基因重叠包括tat的第一个外显子。
图5显示出一分类学树分析。分类学树是使用邻域连接法以下列序列连续段(stretch)为基础而构成:(A)-380bp片段将vpr基因的3’150bp到vpu读框的末端重叠,(B)net编码区的前面290bp与(C)nef基因的3’320bp。在结点的值指的是朝右的簇集受到支承的相生百分比。其中只显示70%和更高的相生率。右边括号表HIV-1M组的主要亚型序列。
图6为97cn54的镶嵌性基因组组织的示意图。
图7为在已知且经实验证明过的原型B(HIV-1LAI)衍生CTL表位与在进化枝C病毒株97cn54的gag,pol和env多肽中的相应氨基酸序列之间的比较的图解说明。显示出下列功能结构区(functional domain):gag(p17基质,p24衣壳,p15核衣壳和连结蛋白质),POL(PR蛋白酶,RT反转录酶,IN整合酶(integrase))和ENV(gp120外部糖蛋白,gp41透膜蛋白)。在开放读框下方的数值分别指示出相对于多肽氨基端的氨基酸位置。已知HIV-1LAI衍生CTL表位的单倍型(haplotype)限制分别在左和右两边缘指示出。绿色条代表在已知的表位与对应的进化枝C序列之间的相同率,蓝色条指示出2或更少的保守性错配(conservative mismatch)。红色条表相对于相应的LAI衍生表位具有超过2个保守性错配或任何非保守性取代的进化枝C衍生序列连续段。
图8显示出进化枝CHIV-1 97cn54的完整长度密码核苷酸序列(SEQ ID NO:1)与相应的以一字母码示出的氨基酸。所有三个读框都在此给出。星号表终止密码子。
图9显示出使用各DNA质粒进行肌肉内免疫之后细胞毒性T细胞在小鼠BALB/c脾细胞内的活性结果的图解说明。将在初次免疫3星期之后从每组各5只的小鼠分别取得的淋巴细胞与装载入具有氨基酸序列AMOMLKETI的gag多肽的同基因P815肥大细胞瘤细胞(用20,000rad照射过)共同培养。对照组包括从未免疫处理,用装载肽的P815细胞刺激过的小鼠所取得的脾细胞。在体外培养5天之后收获细胞毒性效应细胞群。在51C释放标准检定中针对用上面所提九肽装载过的A20细胞或针对未装载的A20细胞读取细胞毒性反应。所显示出的数据代表从分别实施三次该做法所得的平均值。所测定的标准偏差分别低于相对于该平均值的15%。
“表位”(epitope)或“抗原决定簇”(antigenic determinant)一词如本文中所用者指的是可为一抗体所特异地辨识的抗原所含免疫学决定基。一表位包括至少3个,较佳者至少5个氨基酸的呈空间或不连续构象的氨基酸。一表位也可以包括一包括着一连续氨基酸序列的单一节段多肽链。
“多核苷酸”一词如本文中所用者是指称具有任何长度,可为核糖核苷酸或脱氧核糖核苷酸的核苷酸单位的单链或双链异元聚合物。该术语也包括经修饰的核苷酸。
“衍生物”一词如本文中所用者指的是一核酸,其亦编码一或多种被另一核酸序列所编码的多肽,虽则该核酸的核酸序列不同于该另一核酸序列。于此种意义中,“衍生物”一词也指称因为遗传密码简并(degeneration)而存在的其他核酸序列的相等物(equivalent)。因此,“衍生物”一词包括例如编码相同多肽的核酸如根据SEQ IDNO:1,2或3的核酸但具有另一核酸序列者。再者,该术语包括编码相同多肽的核酸片段如具有根据SEQ ID NO:1,2或3的核酸序列的核酸片段。
“多肽’一词如本文中所用者是指称具有至少两个氨基酸残基由肽键所连接成的链。所以,该术语包括任何氨基酸链,例如寡肽(oligopeptides)或蛋白质。该术语也指称其中有一或更多个氨基酸是经修饰过,例如乙酰化、糖基化或磷酸化之氨基酸链。
“连续序列”或“片段”一词如本文中所用者是指称一衍生自一参比序列的线型核苷酸或氨基酸连续段,例如在序列表中所列的本发明各序列。
“选择性杂交”或“可选择性杂交”,一词如本文中所用者是指称在严格杂交条件(stringent hybridization condition)之下两多核苷酸形成双螺旋核苷酸分子的杂交条件。此等条件为现有技术所知悉者且见于例如,Sambrook et al.,Molecular Cloning,Cold SpringHarbour Laboratory(1989),ISBN 0-87969-309-6之中。严格杂交条件的例子包括:(1)在4×SSC内于65℃之下或(2)在50%甲酰胺于4×SSC中42℃之下,两者都于其后接着进行在0.1×SSC内于65℃之下1小时的洗涤步骤。
“病毒载体”或“细菌载体”一词如本文中所用者指的是经遗传修饰的病毒或细菌,其可用来将SEQ ID NO:1,2或3的DNA序列或其衍生物,片段,或其编码表位或表位串的序列导到不同的细胞,较佳者抗原呈递细胞,例如树突状细胞(dendritic cell)之内。此外,细菌载体可以适当地用来直接表达由SEQ ID NO:1,2或3所编码的多肽或由其衍生的表位或表位串。
本发明的一方面涉及在SEQ ID NO:1,SEQ ID NO:2或SEQ IDNO:3中所示的核苷酸序列。为了收集所需的有关代表性和实质完全长度病毒基因组的资讯,首先对中国境内超过100个HIV-1亚型C血清阳性静脉内毒品使用者(IDUs)进行分子流行病学研究,对于在病毒包膜糖蛋白基因内的固定区2和可变区3(C2V3)进行的基因定型(genotyping)揭露出在整个中国境内最普遍流传的病毒株相对于印度来源的亚型C序列有最高的同源性(homology)。根据此等结果,从选出的经HIV感染IDU的周围血液单核细胞(PBMCs)扩增与亚克隆实质完整长度代表在整个中国境内最普遍流传的进化枝C病毒株的基因组。序列分析鉴定出一镶嵌性构造,其可推断出在该地理区域内普及性进化枝C与(B’)-亚型Thai病毒株的基因组之间有广泛的亚型间重组事件。RIP(重组检定程序)分析与分类学相生推断总共有10个断点:(i)在gagpol编码区内,(ii)在vpr内与在vpu基因的3’端以及(iii)在nef开放读框之内。Thai(B)-序列因而包括(i)在gagpol编码区内的数个插入(核苷酸478-620,1290-1830,2221-2520,各分别相对于在gag起始密码子与gagpol读框内的第一个核苷酸),(ii)在3’-vpr,完整的vpu,tat和rev的第一个外显子(从相对于Vpr读框的起始密码子的核苷酸138起算的约1000个核苷酸)以及(iii)nef基因的5’半部(核苷酸1-300)。在包括9078个核苷酸的序列(SEQ IDNO:1,表3)之内的其余诸部份显示出对已知亚型C分离物的最高同源性。位于97cn54中的vpr/vpu编码区内以及在nef基因内的诸断点经发现也出现于从往在中国境内不同地区的IDUs分离出的许多亚型C病毒株的类似位置上,由此可以推测C/B’重组株有一个共同的始祖。有超过50%在Gap和Pol内的明确亚型B-衍生CTL表位与10%在Env内的已知表位经发现可以与在此进化枝C/B’嵌合型参比株内的多个序列正确地匹配。这些结果可以经由对疫苗设计提供高度相关性模板(templates)与开发出为最恰当的免疫学/病毒学请出资料所用药剂而实质地帮助在中国境内的疫苗相关性努力。
上文所说明的代表最普及的中国C型病毒株的本发明HIV-1序列作为基础与来源的用途有利于预防性与治疗性疫苗的开发。对于成功的HIV候选疫苗的开发所需的结果为(i)对于个别流行病学情势的详细知识与(ii)代表在一地理区域内或独特的人群中最普及病毒株的克隆编码序列的可取得性。此等序列代表着作为下列的基础:(i)在预防上与治疗上可以应用的HIV候选疫苗的合理设计,(ii)特异性治疗医药品的开发,例如治疗有效的诱饵寡核苷酸和蛋白质,反义构建体(antisense constructs),核糖体和反式显性阴性效应突变体(transdominant negative effective mutants),(iii)基因疗法所用慢病毒载体之开发,与(iv)可以用来诊断或监测HIV感染及用于免疫学/病毒学监测疫苗处理过程的药剂的制造。
此点对于以HIV包膜蛋白质为基础的候选疫苗特别正确,该等HIV包膜蛋白质业经证实为在所有HIV蛋白质中最具可变异性者。除此之外,一种成功的疫苗必须诱发免疫系统的最可能两种分支:中和抗体,其理想上是针对包膜蛋白质中的构象表位,以及细胞介导的免疫反应(CD4阳性T-辅助细胞,CD8阳性细胞溶解性T-细胞,Th1型细胞因子,β-趋化因子(chemokines)),其是针对不同病毒蛋白质的表位而产生的。根据本发明的构象表位包括涉及抗体结合作用的至少3个氨基酸且可能为5或更多个氨基酸。构象表位也可以包括数个节段,其可能为单一蛋白质的节段或在低聚物复合物例如三聚物型糖蛋白包膜复合物的情况中为数个具有不同亚单位的节段。根据本发明一线型表位在长度上的变异通常为包括至少8个氨基酸到约15个氨基酸或更长者,较佳者包括9到11个氨基酸,特别是在MHC第I类限制CTL表位的情况中。
因此,本发明更有涉及SEQ ID NO:1,2或3的核酸序列或其片段或衍生物所编码的多肽。本发明更涉及SEQ ID NO:1,2或3的核酸序列或其片段或衍生物所编码的包括至少8个氨基酸的连续序列。较佳者本发明多肽包括一可自然地引起感染患者内免疫反应的抗原决定簇。更佳者为包括SEQ ID NO:2或3的核酸序列或其片段或衍生物所编码的氨基酸序列。最佳者为表位,其包括一相同于SEQ ID NO:1所编码的多肽与-HIV-1LAI参比分析物的具有9到11个氨基酸的连续区,或其为包括在该有9到11个氨基酸的序列内的2或更少个保守性氨基酸取代者。本发明多肽可以用为例如疫苗和治疗性物质或诊断用物质。
本发明的另一方面涉及SEQ ID NO:1,2或3的多核苷酸。本发明更涉及一种具有SEQ ID NO:1,2或3的核苷酸序列的多核苷酸片段或涉及一种包括至少一个能够选择性地杂交到如SEQ IDNO:1,2或3所示核苷酸序列的连续核苷酸序列。再者,本发明也涉及本发明多核苷酸的衍生物或多核苷酸片段。较佳者该多核苷酸或多核苷酸片段包括一有至少9个核苷酸,较佳者至少15个核苷酸,更佳者至少27个核苷酸或更长者的连续序列。该多核苷酸或多核苷酸片段也可以包括单一HIV基因的编码区,例如gag,pol,env。其例子为在SEQ ID NO:2和SEQ ID NO:3中所列出者。本发明的另一方面涉及一种多核苷酸,其包括至少两个本发明多核苷酸片段,其中该等多核苷酸片段可以重叠或可由一核苷酸序列间隔段所分隔。该等多核苷酸片段的序列可相同或相异。本发明多核苷酸或多核苷酸片段可以用为疫苗或治疗性物质或诊断用物质。
克隆的SEQ ID NO:1的进化枝C HIV-1 97cn54编码序列和其衍生物可以用为下列应用的基础:
供治疗与预防目的所用的进化枝-C特异性HIV-1疫苗之开发。此等进化枝特异性疫苗可以在全世界所有地理区中使用,于该等区域中该进化枝C病毒株在HIV流行病中扮有主要角色,例如在拉丁美洲,非洲以及亚洲境内。更特定言之,要针对东南亚和中国进行试验且开发出的HIV疫苗应该以上文所说明的97cn54编码序列为基础以期诱导出亚型特异性体液与细胞介导的免疫反应。再者,此等进化枝-C特异性HIV-1疫苗可以在考虑所有的或明确选定的全世界性相关HIV亚型之下用作混合疫苗的成分。
要输送到免疫系统的抗原或编码序列包括(i)从表3中所列出的诸开放读框中之一者衍生的有至少3个到约5个氨基酸的连续段或更长的连续段,(ii)具有较佳者9到11个氨基酸的连续段,(iii)以分开的方式或以多肽串形式(表位串)输送的此等连续段的组合,其中该表位串与彼等的氨基酸序列分别地可以重叠或可用氨基酸或其他间隔段予以分隔,且最佳者完整的蛋白质或对应的编码序列或其变异体,彼等也可以包括延伸的删除(deletion)以期在接受疫苗者体内诱导出恰当的体液与细胞介导的免疫反应。因此之故,本发明的另一个目的涉及SEQ ID NO:1,SEQ ID NO:2和SEQ ID NO:3中所示核苷酸序列或其片段所编码的多肽。较佳者,该多肽包括具有至少8个氨基酸,较佳者至少9到11氨基酸,更佳者至少15个氨基酸或更长序列的连续序列,或较佳者,包括单一多肽链的至少3个氨基酸的不连续表位或于低聚物蛋白质的情况中,包括具有不同多肽链的复合物。以91cn54编码序列为基础的疫苗构建体包括现有技术中已知的所有抗原形式且包括所有已知的输送系统。
由SEQ ID NO:1到3的核酸序列的片段所编码且于每一情况中包括3到5个氨基酸,较佳者9到11或更多个氨基酸的短表位可以较佳地以合成方式制成。此等肽包括B细胞表位,第II类MHC限制辅助T细胞表位,第I类MHC限制细胞毒性T细胞表位,或所提变异体的组合。具体表位可以重叠或由一间隔段所分隔,其优先地包括甘氨酸及/或丝氨酸部份。分支型肽可以根据现有技术于合成中产生或在具体肽的合成与纯化之后利用已知且为市面上可取得的同元或异元双官能化学交联剂予以产生。另外,可以将本身为小型的免疫原性肽经由交联反应缀合到所选定的载体蛋白质例如卵白蛋白,经基因工程方式嵌入到载体蛋白质之内或分别融合到彼等的N端和C端。较佳者,此等载体蛋白质都能够形成特别的构造,其中(i)于适当的细胞培养系统内进行表达的过程中(参看下文)或(ii)在经纯化变性的蛋白质的适当回折之后,将B细胞表位较佳地安置在该特别载体的表面上。同时,有倾向于形成特别构造的多肽的许多例子是已知的,例如B型肝炎病毒(HBV)核心抗原(HBcAg),HBV表面抗原(HBsAg),HIV组特异性抗原,多瘤病毒VP1蛋白,乳头状瘤病毒L1蛋白,或酵母IA蛋白。由于大部份到目前为止所提及的粒子形成性蛋白质都是从不同病毒的衣壳或结构蛋白质衍生的,因此彼等也称为似病毒粒子;可参看特别版的Vaccine.(1999),Vol.18,Advances in,Proteln and Nuddc Acid VaccineStrategies.Edhed by Pof.P.T.P.Kauvama。
由SEQ ID NO:1到3的核酸序列的片段所编码且具有超过30,较佳者超过50个氨基酸的表位串和多肽,及具有形成粒状结构(VLP)的倾向的多肽可以使用现有技术中已知的手段在原核生物体内制造与纯化。该等质粒因而包括细菌复制源例如ColEl,通用的选择标志例如对康那霉素(kanamycin)或氨苄青霉素(ampicillin)的抗性,组成型活性或可诱导性转录控制单元例如LacZ或Tac启动子,以及转译起始和终止信号。对于经简化的表达和亲和性纯化,可以视情况使用可分离的融合部份与纯化工具例如谷胱甘肽-S-转移酶或低聚组氨酸标签(tag)。
(i)在真核生物细胞培养物例如酵母细胞、真菌、昆虫细胞或哺乳动物细胞内制造该等表位串,完全蛋白质或似病毒粒子结构体,或(ii)为了免疫化目的直接输送DNA,等所使用的DNA或RNA可以依赖病毒本身所利用的密码子用法。另外,在技术上可行的任何情况中可以将该密码子用法调整成适用于在个别制造系统内高度表达的基因内最常或次最常使用的密码子。在为了保险措施经最佳化的多基因内使用的密码子最佳化的例子包括Gag,Pol和Nef等基因以及包膜基因都列于SEQ ID NO:2和3之中。该SEQ ID NO:2和3在实施例15中有更特别的说明。
建立细胞系以在所提细胞培养系统内生产表位串,多肽或似病毒粒子结构体可以使用现有技术的载体(vector)为基础。该等载体同样地可以包括细菌复制源点,阳性或阴性选择标志及主要的外来蛋白质的正常转录和转译所用的具体控制区。后面所说明的DNA疫苗构建体所含成分也代表出现在载体内用以在不同的哺乳动物细胞培养物内表达表位串,多肽或完全蛋白质的模组。
最简单的免疫化形式为纯DNA疫苗的直接应用。该疫苗基本上包括编码区的5’,一转录控制区也称为启动子/增强子(promoter/enhancer)区,视情况后面接着功能插入序列以增强基因表达,(ii)一Kozak共有序列包括一转译起始密码子以及一转译终止密码子后面接着一在该外来基因3’端的聚腺苷酸化信号。较佳者,该启动子/增强子区可以支持所欲基因产物的组成性表达且为衍生自巨细胞病毒立即早期基因(immediate early gene)(CMV-IE)或罗氏肉瘤病毒长末端重复体(RSV-LTV)。另外,可以使可诱导形式的转录控制区例如经由例如应用四环素或类似物来调节转录的Teton/Tet off启动子。再者,有利者为使用细胞类型特异性调节转录控制区例如肌肉肌酸激酶基因(MCK基因;肌肉特异性表达)或CD4受体基因的上游区,或在第II类MHC基因(在抗原呈递细胞中优先表达)配置的启动子/增强子区。于某些情况中,也使用来自(i)细胞类型特异性启动子与(ii)病毒增强子区的嵌合型组合间组织特异性表达与病毒增强子所具强转录活性等多项优点组合在一起。经由整合入通常配置在一开放读框5’端的功能性插入序列所达到的基因表达的增强是因为从经剪接转录本的核所得相对于未经剪接者较增强的输出速率且是经由嵌置在一经配置在β-球蛋白基因之内的插入序列而得到。
以SEQ ID NO:1,2或3为基础的交佳DNA疫苗也另外包括一源自α病毒类例如西门利克森林α病毒(SFV)或委内瑞拉脑炎病毒(VEE)的复制子(replicon)。此处,前面提及的核转录控制区与视情况考虑到的插入序列后面先接着该VEE或SFV非结构蛋白质(NS)的编码区。只有其3’端才接着实际的外来基因,该外来基因的细胞质内转录是由NS敏感性启动子所调节。相应地,产生一从核转录控制单元起始的跨过数个开放读框的长转录本,其接着转位到细胞质内。于此处合成的NS蛋白质随即经由结合到相应的控制区而活化该等外来基因的细胞质内转录。此种扩增处理通常会导致丰富的RNA合成且因而导致该外来蛋白质的高合成速率。与放弃上述细胞质内RNA扩增的效应的传统质粒直接相比,于至少可相比拟的免疫原性之下,后者通常可以促成要施用的质粒用量的明显减少。
前述肽、蛋白质、似病毒粒子和DNA构建体可以经由肌肉内、皮下、皮内、静脉内注射来施用,其中可以使用个别的先前技术来施用蛋白质抗原。对于DNA免疫,可以使用带有注射针头的传统注射针筒,或者使用没有注射针头者而通常为利用空气压力将DNA直接导到合意的组织之内。此举也特别包括利用喷雾工具将含有DNA的疫苗调配物经鼻内和经口施用者。另外,也可以将DNA拼合到固体支持物例如金珠粒上且通过空气压力施用到组织之内。
为了增强或调制免疫反应,可以将前述蛋白质抗原和DNA构建体与通常为免疫反应刺激剂的所谓佐剂组合施用或按顺序施用。传统佐剂例如氢氧化铝或羟基磷酸铝,可以导致体液免疫反应的刺激显示出IgG1亚型的高抗体滴定度。更现代的佐剂例如CpG寡核苷酸(共有核心序列:嘌呤-嘌呤-CpG-嘧啶-嘧啶)或其经化学修饰的衍生物(硫代磷酸寡核苷酸,具有肽主链的寡核苷酸)通常可增强细胞靶的免疫反应且主要支援Thl型的细胞介导的免疫性,其具有下列特征:高IgG2a亚型的抗体滴度及诱导Thl细胞因子例如γ-IFN,IL-2和IL-12。
前述肽、蛋白质、似病毒粒子和DNA构建体的施用和摄取可以经由结合到较高分子结构物上或掺加到较高分子结构物之内而获得特别地改良,该较高分子结构物的例子为生物可降解性粒子,多层状物(multilamellar),较佳者阳离子性微脂粒,免疫刺激性复合物(ISCOMS),病毒脂蛋白体(virosomes)或在体外(invitro)组装的病毒粒子。该等生物可降解性粒子有例如PLA-(L-乳酸),PGA-(聚乙醇酸)或PLGA-[聚(D,L-乳交酯-共聚-乙交酯)]微球体或其衍生物,阳离子性微粒子或衍生自细菌多糖荚膜的载体物质。集合名词ISCOMS是指称从石硷树(Quillajia saponaria)的树皮所得水溶性萃取物衍生出且经层析法醇化过的免疫刺激性复合物。有关各种佐剂与给药手段的先前技术详细摘要见于http://www.niaid.gov/aidsvaccine/pdf/compendium/pdf[Vogel,F.R.,Powel l,M.F.and Alving,C.R.,A Compendium of Vaccine Adjuvants andExcipients(2nd Edition)]。
再者,也可以使用病毒载体或细菌载体来适当地呈递表位串,多肽和似病毒粒子。
根据现有技术状态,例如经遗传修饰的沙门氏菌与李斯特氏菌(listeriae),因为彼等所具有的天然细胞向性(cell tropism)可以将DNA疫苗构建体导到抗原呈递细胞例如单核细胞,巨噬细胞和主要的树突状细胞之内而为可较佳地使用者。除了细胞类型特异性的效益之外,遗传修饰可以达成下述事实,亦即DNA可以无损坏地进入抗原呈递细胞的细胞质之内。于此种情况的中,DNA疫苗构建体可进入细胞核内而于该处读框可通过真核生物型、较佳者病毒型或细胞型特异性启动子使用细胞资源和蛋白质进行转录。在RNA输送到细胞质之内后即转译出相应的基因产物,且根据个别状况进行转译后的修饰并分配到相应的细胞区室之内。
也可以使用细菌载体(沙门氏菌、李斯特氏菌、耶尔森氏菌(yersiniae)等)来诱导出粘膜免疫性,较佳者是在口服之后。藉此经由细菌的转录和转译机制产生相应的抗原,因而不会发生通常存在于喃乳动物细胞内的转译后修饰(没有相应的糖基化;没有分泌途径)。
此外,到目前为止已经有众多经减毒的病毒载体,彼等可以成功地以高产率地帮助合意抗原的表达。此等病毒载体除了彼等所具有的唯一抗原产生能力之外,可以直接用于免疫化。该产生可先在体外(ex vivo)进行例如用于在给疫苗接受者服用之后将抗原呈递细胞感染的情况,或者直接在体内(in vivo)使用重组病毒经由皮下、透皮、皮内、肌肉内或鼻内免疫化导致随着个别免疫化成功的有益抗原呈现。如此,可以经由使用重组疫苗病毒例如经由通过鸡细胞予以减毒的修饰安卡拉牛痘病毒(Modified VacciniaAncararirus)(MVA),经遗传减毒的纽约型牛痘(NYVAC)或鸟类地方性禽痘病毒类(禽痘病毒(Fowlpox),金丝雀痘病毒(Canarypox))。另外,有数种其他病毒也经鉴定过例如重组α病毒类例如西门利克森林α病毒或委内瑞拉脑炎病毒,重组腺病毒类,重组单纯庖疹病毒类,流感病毒类等。
最后,若根据先前技术经由克隆方法补充侧接在密码部份的调节性序列(LTR,长末端重复体)时,也可以根据SEQ ID NO:1,2或3产生经减毒的HIV病毒且用于免疫目的。随后也可以根据先前技术在例如nef基因中施以一或多个删除而得到充分的减毒。在SEQ ID NO:1和3中所显示出的核酸序列以及从其所衍生的肽、蛋白质和似病毒粒子也可以用为基因转移所用病毒载体所含的成分。
由GagPol基因(SEQ ID NO:1,核甘酸177-4458;表3)所编码的多肽可以对例如短病毒或反转录病毒提供例如包装和受体功能。也可以产生病毒粒子,其可以往例如使用可同时支援GagPol和VSV-G(水庖性口炎病毒包膜蛋白)基因的表达且确保治疗性转殖基因(transgene)的包装的适当质粒载体将哺乳动物细胞短暂转染之后,用来转导休眠期有丝分裂后的细胞或经最后分化的细胞。该用来产生专导胜任性病毒粒子所用的方法可以通过例如根据例如人类胚胎肾细胞(HEK293)建立可以组成,性地(constitutively)或在诱导性启动子的控制下表达GagPol多蛋白的稳定细胞是获得明显地帮助且可有效率地成形。另外,可以产生重组型腺病毒,其包括包装功,受体功能和转殖基因功能或彼等的组合且因而可作为一工具用来进行反转录病毒载体或短病毒载体的活体外,原位(in situ)和活体内输送。
由SEQ ID NO:3所编码的背末蛋白质或其衍生物可以经由掺加到脂质双层而提供受体功能给短病毒载体,泡沫病毒(spumavirus)载体或反转录病毒载体或以包被病毒(coated virus)为基础的其他载体。对于此种目的而言,可以产生例如包装细胞系,其可以组成性地,或在诱导性,或取代地,可调节性启动子的控制,表达来自反转录病毒,泡沫病毒和较佳者短病毒GagPol蛋白以及衍生处SEQID NO:3的包膜蛋白质。另外,可以产生以C型或D型反转录病毒或其他膜被覆病毒例如流感病毒或庖疹病毒的基因组为基础的嵌合型病毒,其在表面上载有针对天热发生的包膜蛋白质,加添地或取而代之地,一衍生自SEQ ID NO:1或3的包膜蛋白质。
针对SEQ ID NO:1至3衍生的肽、蛋白质或似病毒粒子,可以产生(i)多株抗体血清,(ii)单株抗体(鼠类,人类,骆驼),(iii)抗体行衍生物价例如单链抗体,人类化抗体,双-特异性抗体,抗体噬菌体库或(iv)其他高亲和性结合性多肽例如hPSTI(人类胰分泌胰蛋白醣抑制剂)。该等药剂可以用于治疗目的例如治疗HIV感染,或用于诊断目的例如用于检验套剂的制造。
类似地,SEQ ID NO:1,2或3衍生的类似肽、蛋白质或核酸序列可以应用核酸杂交技术,采用核酸扩增系统或彼等的组合用于诊断目的例如用于血清诊断。较佳者,根据本发明,依照SEQ ID NO:1核甘酸序列的多核苷酸片段可以用于聚合酶链型反应之中。特别较佳者为根据本发明,依照SEQ ID NO:1核甘酸序列的多核苷酸片段经由利用DNA晶片技术作为诊断剂的用途。
本发明要用下列实施例予以示范说明但非予以限制。
实施例
实施例1.血液样品。本研究中所使用的所有血液样品都是在1996-1997年期间于中国境内数个HIV流行地区进行全国分子流行病学调查中从HIV-1亚型C血清阳性的注射药物使用者(IDUs)收集到者。以发克梯度(ficoll gradient)分离出周围血液单核细胞(PBMC)。经由将得自血清阳性IDUs的PBMCs与经用植物血球凝集素(phytohemagglutinin)(PHA)刺激过的捐血者的PBMCs共同培养以分离出病毒。使用HIV-1 p24 Core Profile ELISA套剂(DuPontInc.,Boston,MA)从细胞上澄液侦检出阳性病毒培养物。
实施例2.聚合醣链型反应和DNA定序。从超过100个来自中国西北省份预先选定的HIV-1阳性IDUs经有成果地感染过的PBMCs萃取出前病毒DNA(provirus DNA)(Qiagen Inc.,Valencia,CA)。使用套试PCR(nesied PCR)来扩增包膜C2V3编码区。使用萤光染料—标记终止序列(terminators)(Applied Biosystems,373A-Fosier Ciiy,CA)按先前技术所述(Bai et al.1997;Yu et al.,1997)以Taq-循环定序法(Taq-cycle sequencing)将PCR产物直接定序。经由应用威斯康辛套装软体Genetics Computer Group加上Kimura的校正法(GCG,1997,第9版)进行多重序列排比。
实施例3.使用PHYLIP套装软体进行所有所得序列的分类学树分析。以最大节省法(maximum parsimony method)计算进化距离并用累积水平分校长度予以指示出。按先前技术所述(Graf etal.1998)以相生重取样方式(bootstrap resampling)试验邻域连接法的统计稳健性。
实施例4.从中国IDUs选择出代表性C-进化枝HIV-1分离物。经计算出的在C2V3编码区内的平均组内距离于DNA层次上低到2.26±1,43,显示比在此地区内的流行病仍然非常的早期。在中国进化枝C序列与来自印度,非洲和南美洲来源的序列之间的组间差异分别为9.67±2.31(印度),15.02±4.13非洲与8.78±3.41(南美)。此种结果证实在印度与中国进化枝C序列之间有密切的关系(Lole et al,1999)且对本身相当异源性的非洲进化枝CHIV-1病毒株有一实质的遗传距离。
实施例5.最代表在整个中国境内流传的遍性进化枝C病毒株的病毒分离物的检定。从分析周的检体看来,经称为97cn54的代表性分离物经鉴定为相对于一经计算出之共有序列(cn-conV3)展现出最高同源性(99.6%),此点是经由以经鉴定过的局部HIV序列为基础而确定者(表1)。包括从不同流行病区选巴的原C-进化枝代表物V3-环圈序列以及其他进化枝(A-,O,CPZ)之共有序列等在内的多重氨基酸序列排比强调出带有所选原分离物97cn54的亚型C特质的(表1)。与整个V3共有序列(共有)比较之下,97cn54以及cn-con-c显示出在位置13(H→R)和19(A→T)处有氨基酸变更,两者都是亚型分离物的特性(C共有)。
表1:V3-环圈氨基酸序列排比位置
位置         1            11          21         31    38
共有         CTRPNNNTRK   SIHIGPGQAF  YA---TGDII GDIRQAHC
C_94IN11246  ----------   --r-----t-  --   --e-v -n------
C_93IN905    ----------   --r-----t-  --   ----m --------
C_93IN999    -Vr------e   --r-----t-  --   --e-- --------
C_consensus  ----------   --r-----t-  --...----- --------
C_ind8       ----------   -tr-----t-  --...----- --------
97cn54-V3    ----g-----   --r-----t-  --...----- --------
cn-con-V3    ----g-----   --r-----t-  --...----- --------
C_bro025     ----------   --r-------  --...--e-- --------
C_ind1024    ----------   --r-----t-  --...----- ----r-y-
C_nof        ----------   r-rv----tv  --...-na-- --------
C_zam20      -a--g-----   --r-----t-  f-...--a-- --------
C_sm145      ---ya-----   -Vr-----t-  -....-n--- --------
A_consensus  ----------   -Vr-------  --...----- --------
B_consensus  ----------   -------r--  -t...--e-- --------
D_consensus  ----y----q   rt-------l  -....-tr-- --------
E_consensus  ----s----t   --t-----v-  -r...----- ----k-v-
F_consensus  ----------   ---l------  --...----- ----k---
G_consensus  ----------   --t-------  --...----- --------
H_consensus  ----------   --s-------  --...----- ----k-y-
O_consensus  -e--gidiqe   .-r---.m-w  -smglg-tng nss-a-y-
表1:得自不同HIV-1进化枝(A-O)之共有序列与所选来自不同国家的亚型C分离物的V3氨基酸排比。完整V3共有序列是经由将得自不同进化枝(A-O)之共有序列排比而构成者,Cn-con-V3代表在中国境内普及的HIV-1亚型C病毒株之共有序列。97cn54是经选择为在中国境内流传的最遍性进化枝CHIV-1病毒株的标准代表性分离物。“-”表相对于V3-共有序列没有改变,小写字母表氨基酸取代且“-”表间隙。多重排比所用的所有共有序列和分离物序列都得自Los Akamos数据库。
实施例6.97cn54包膜蛋白编码序列对于印度进化枝C病毒株有最密切的关联。以包膜蛋白的C2V3序列为起始基础的分类学树分析揭露出97cn54以及中国进化枝C分离物两者对群集到来自印度(ind8,d1024,c-95in025,c--93in999,c-93in11246),非洲(c-eth2220,c-ug286a2)和南美(92br025,nof,cam20,和sm145)的亚型C病毒株。此结果可推测印度C-进化枝病毒株可能为在中国境内流行的HIV-1亚型C的来源(第1图)。此种假说也与我们早期的流行病学参考文献相符合,其中确定在云南省内的HIV-1亚型C感染个体与在边界地区的印度珠责生意人共用针头(Shao etal,1999)。
实施例7.几乎完整长度HIV-1基因组的克隆。几乎完整长度HIV-1基因组是按先前技术所述(Grafet al.1998;Salminen et al.,1995)经由使用the Expand Long Template PCR系统予以扩增(Boehringer-Mannheim,Mannheim,Germany)。引子(primers)是位于HIV-1长端重复体(LTR)内的保守区中:TBS-A1(5’-ATC TCT AGC AGT GGC GGC GGA A)和NP-(5’-GCA CTCAAG GCA AGC TTT ATT G)。将经纯化的PCR-片段钝端连接到一经SrfI消化过的pCR-Script载体中(Stratagene,Heidelberg,Germany)并转形到大肠杆菌(E.coli)菌株DH5α之内。经由限制片段长度多形性(RFLP)分析及将V3-环圈编码序列定序分析而鉴定出数个含有几乎完整长度HIV-1基因组的重组殖株。根据RFLP分析,于使用不同的限制核酸内切酶的组合,接着将V3-环圈编码序列定序分析,得知有77%阳性完整长度构建体接近于相同。按照上述所述使用引子-走引法(primer-walking approach)对代表广多种阳性殖株的前病毒构建体进行选择与定序(引子是沿着两股基因组上每约300bp而设计)。
实施例8.使用Lasergene Software(DNASTAR,Inc.,Madison,WI)在Macintosh电脑上汇编DNA序列。所有在此研究中使用的参比亚型序列都得自Los Akamos HIV数据库。核苷酸序列类似率是经由Smiih和Waterman的局部同源性算法予以计算出。与可取得的其他亚型序列数据的多重序列排恍是使用威斯康辛套装软体GeneticsComputer Group(GCG,1997,第9版)进行。
实施例9.97cn54编码序列的整体结构。衍生自分离物97cn54的9078bp基因组序列含有HIV-1基因组的所有已知的结构基因和调节基因。没有发现有重大的删除、嵌入或重排。经由将97cn54的所有编码序列(CDS)与不同基因型之共有序列和所选亚型分离物(表刀相比较而探讨出核苷酸序列类似率。gag、pol、env和vif请码相对于对应的进化枝-C共有序列的簸高同源性都在93.93%-95.06%的范围内。此种观察结果显着地扩展上述以C2V3为基础的序列比较与分类学树分析(参看表1和图1)且因而清楚地确定所选择巴的病毒分离物对于先前公开的C-进化枝病毒株的归属。不过,由此类分析对对tat、vpu、vpr和nef等基因所测定出的同源性仍不足以促成此等读框对于进化枝-B或C病毒株的清楚指定(表2)。对于vpu基因而言,相对于进化枝-B有最高同源性(94.24%),比较之下对于进化枝-C共有序列只有78.23%。对于tat基因也得到类似的观察结果,对B,-r142分离物有最高同源性(>91%),而对所选巴的元C-进化枝代表物为85.5%(C-eth2220)或对进化枝-C共有序列有89.01%。这些数据加上B、C和E基因型在整个云南省流行病地区内的巴现事实可以推测出所分析的病毒可能代表从B’/C进化枝间重组事件所得的镶嵌型病毒株。
表2.97cn54衍生的编码序列与参比病毒株的相应基因和进化枝特异性共有序列的比较
                       对97cn54的相同百分率CDS       gag      pol     vif      vpr     tat      rev     vpu     env     nefA         87.68    91.80   86.81    83.66   84.90    83.97   79.82   85.75   84.19B         90.43    91.93   88.04    90.31   86.56    82.08   94.24   84.52   88.13B-mn      89.38    90.82   86.01    89.31   87.44    79.48   88.21   82.33   85.41B’-r142  91.53    90.76   86.01    88.97   91.163   80.23   96.74   82.70   85.99C         94.65    94.29   95.06    91.39   89.01    91.99   78.23   93.93   88.82C-        92.19    92.91   88.51    90.03   87.91    89.70   76.13   88.51   86.2092br025C-        91.4     92.06   87.15    90.77   85.57    88.08   80.09   87.15   87.08eth2220D         89.80    91.08   87.74    87.94   83.93    84.39   87.30   85.26   86.88E/A       86.324   89.07   86.59    83.39   81.44    81.74   77.31   82.09   84.18F         88.02    88.99   86.36    86.25   80.65    86.25   82.33   84.02   /G         88.08    /       /        /       /        /       /       84.55   /H         87.69    89.45   86.01    85.22   /        /       /       83.74   /O         73.42    78.02   72.12    76.604  72.31    76.60   59.54   67.01   80.35CPZ       74.14    78.80   93.75    75.44   76.00    75.44   64.41   72.42   /
表2:在97cn54与下列诸DNA序列之间的所有编码序列(CDS)的核苷酸比较:(1)诸独特HIV-1进化枝之共有序列(得自LasAlamos HIV数聚库)或(2)标准亚型C(92br025和eth2220)和B(mn和r142)分离物。该数据呈现出所给序列对97cn54的相同百分率。在诸共有序列内的不明确核苷酸位置经计为一匹配。其中将最高同源性以黑体突显出。/,表示无法从LasA lamos HIV数聚库取得共有序列。
实施例10.亚型间重组的测定。使用重组体鉴定程序(RIP,第3.1版;hiip://hiv-web.lanl.gov/tools)来鉴定在此殖株的至长度序列内所含的潜在镶嵌型结构(窗尺寸:200,统计意义阈值:90%,Gap处置:STRIP;Informative mode:OFF)。导入间隙以造成对齐。于此分析中的背景亚型序列为:u455(亚型A),RL42(中国亚型B-Thai(B)),eth2220(亚型C),z2d2(亚型D),93th2(亚型A/E)。
实施例11.在97cn54的Gag-pol编码区内的进化枝间重组。虽然在高度保守的gag和pol读框内观察到对C-进化枝病毒株的实质同质性,不过RIP分析鉴定出在gagpol内在gag起始密码子上游约在位置478-620,1290-1830和2221-2520处有引固进化枝间重组区。这些分散开的连续段是位于显示出对原型B有最高同贾率且特别是对源自云南省的亚型B(B’)分离物有最高同源性的gag和pol读框之内(位显示出数据)(图2)。这种观察结果清楚地强调RIP分析的重要性,是因为单纯的以完全基因为基础的同质性排比部能够鉴定出这些不同亚型的小分散开的片段之故。为了肯定RIP分析所得数据,我们使用侧接或跨展所提重组连续段的诸区造出数个分类学树(图3)。使用数种不同亚型的标准代表物与某些经选出的C-进化枝原分离物,可以经由97cn54与个别C-进化枝参比分离物(图3A,3C,3E,3G)或B-进化枝参比分离物(图3F,3D,3F)进行差式簇集(differential clustering),可以确定出所有经提出的重组区。
实施例12.于97cn54的Env编码区内的进化枝间重组。如从表2中所摘列出的是列排比所预期者,RIP分析清楚地确定出在亚型(B’)-Thai与亚型C之间有亚型间重组(图4)。一段从vpr的3’150bp延伸经过tat和rev的第一个外显子到vpu的约1000bp的片段显示出与局部亚型(B’)代表物(r142)有最高同源性(图4A)。再者,一段重叠在nef基因5’-半部的长约300bp的序列连续段显示出对(B,)-Thai亚型有最高同源性而其余部份,包括延伸到3’-LTR之一300bp片段则与亚型C簇集(图4B)。
将RIP分析予以扩大之下,分类学树显示出vpr/vpu和ne基因的5’-部份对进化枝-b分离物有最密切的关系(图5A,图5b),而3’-nef片段则明确地与亚型C代表物簇集(图5C)。进一部分析确定出在此镶嵌段内的亚型B序列相对于非常最近时所述的分离自中国IDU的Thai-(B,)病毒株(r142)(Graf et al,1998)比相对于原型B分离物(mn和sf2)有更密切的关联(表2)。
实施例13.97cn54的代表性特质。在vpr/vpu编码区内以及在97cn54的nef基因内的断点经发现出现于从生活在中国西北诸省境内的IDUs所分离出的所有亚型C病毒株上的几乎相同位置上。对于8份独立地从Xinjiang自治区境内的不同HIV-1感染个体所分离出且分析过的HIV-1病毒株所做的两份RIP分析代表值经显示于图4C和D之中。有关97cn54(中国西南部)与xj24和xj25(中国西北地区))的来源,这些数据可以推测出对于流传在整个中国境内的C/B’重组病毒株有一个共同的始祖。总而言之,我们的结果证实97cn54表一在中国西北省份境内的IDUs最为普及的具有10个进化枝间重阻断点的C/(B’)进化枝间镶嵌型病毒。图6为分离物97cn54的(B’/C)择嵌型基因组的示意性呈现。
实施例14.对HIV特异性细胞溶解性T细胞的跨—进化枝特异性表位的预测。基因组序列可提供机会来评估可能对HIV-1候选疫苗的效率有影响的以的CTL表位的保守性。对于CTL表位的大部份药剂与数据都是导自进化枝B HIV-1 Lai序列。为了提出对于跨进化枝CTL-表位保守性的评估,将经预测过的97cn54蛋白质序列相对于已知且经制造过与图的LAI特异性CTL表位进行比较。于194个报导过的HIV-1 CTL表位中75,55,40和24是分别位于Gagp(g17,p24,p15),反转录酶(RT),gp120和gp41之中,而在Gag和RT中有几乎50%或更多的表位是完全相同者,而gp12.0和gp41HIV-1LAI衍生的CTL表位只的5%和17%与预测的97cn54氨基酸序列正确匹配。不过,在所给CTL表位中允许有多达2个保守性错配之下,则会有增加的48%(p17),33%(p24),40%(RT),57%(gp120)和33%(g41)部份之以之HIV-1 LAI CTL缺的决定部位与对应的97cn54衍生多肽中的序列相关联。当然,后面所述的考虑必须加以某些地小心,因为会有甚至于非保守性改变可能废止一抗原性肽的HLA-结合或T-细胞受体辨识之故。无论如何,总而言之,此等观察结果清楚地预测出一显著的跨—进化枝CTL反应性,尤其是有关功能上与免疫学上保守的HIV-1蛋白质。此外,这些数据可推测,有显著部份的经合成且确立用来对进化枝B CTL表位进行与图绘制与示性的药剂(肽、疫苗病毒构建体)也可以用来以进化枝C HIV序列为基础而测定CTL反应性。
 表3.97cn54编码序列的读框(reading frame)
 编阅架构  起始  终止 起始   终止
 gag  177  1654
 pol  1447  4458
 env  5589  8168
 vif  4403  4984
 vpr  4924  5214
 vpu  5426  5671
 tat  5195  5409  7730  7821
 rev  5334  5409  7730  7821
 nef  8170  8790
其编码是参照SEQ ID NO:1中所示DNA序列的5’端。
实施例15.(A)合成C54gp160编码区:C-gp160的描述。将C-gp120基因克隆到pCR-Sctipt cmp(+)克隆载体(Stratagene,GenbankAccession:U46017)的独特KpnI/SacI限制部位内。经密码子-最佳化以高表达哺乳动物基因的合成C54gp160编码区是列于SEQ ID NO:3之中者。合成信号序列包括一传输信号用以将所编码的多肽输入到内质网之内。
不同编码区的位置为如下所列者:
CDS  起始  终止
合成领导序列  28  87
Gp160  88  2580
(B)合成C54gagpolnef序列:C-gpnef的描述。将C-gpnef基因克隆到pCR-Scriptamp(+)克隆载体(Stratagene)的独特KpnI/SacI限制部全内。经密码子优化以高表达哺乳动物基因的合成C54nagpolnef序列是列SEQ ID NO:2之中者。于本构建体之中,N端甘氨酸是经为丙氨酸(核苷酸序列GGC)以防止将多肽目标导引到细胞质膜及随后的将经装配好的似病毒粒子的通过出芽(budding)而分泌出。同时,将一(-1)移码(frame shift)导到天然移码序列之内以保证从Gag强制读经核醣体进入Pol编阅架构之内,且因而保证GagPolNef多蛋白的合成。
不同编码区的位置为如下所列者:
 CDS  起始  终止
 Gpg  13  1500
 5’pol(ΔRT)  1501  2460
 凑合(scrambled)nef  2461  3090
 3’pol(ΔIN)  3091  4155
 RT活性部位  4156  4266
实施例16.将SEQ ID NO:1所编码的GagPolNef多基因通过KpnI/XhoI部位嵌入到载体pcDNA3.1之中并转形到大肠杆菌菌株XL1blue之内。GagPolNef表达载体诱导Gag特异性抗体反应的是在雌性BALB/c小鼠体内分析(图9)。使两组各5只的小鼠接受每免疫化处理各100微克DNA的肌肉内(i.m.)第一次免疫化接着在3和6星期之后追加两次后续i.m.免疫化处理(第1组:pcDNA-GagPolNef;第2组:pcDNA)。对照组(第3组)只接受PBS免疫化处理。Gag特异性IgG的剖滴定度是以ELISA相对于经纯化的Gag蛋白质而测定。使用pcDNA-GagPolNef的免疫化处理导致快速诱导出高滴定度的Gag特异性抗体(1∶4,000),该抗体是由抗体亚型的典型Thl走势(IgG2a>>IgG1)予以示性。第2和第3两对照组都没有产生Gag特异性抗体的迹象。在第一次追加免疫化处理的1星期之后抗体滴定度增加到几乎百倍(1∶20,000)且在第次加强的1星期之后导致1∶80,000的Gag特异性终端滴定度。于该两对照组中都没有可证实出有明显的Gag特异性抗体反应者。对照组中都没有可证实出有明显的Gag特异性抗体反应者。
实施例17.抗原特异性细胞介素分泌是用分别在第二次后续追加处理5解剖下脾细胞予以分析,其证据为T辅助细胞记忆反应的诱导。接受三次使用pcDNA-GagPolNef的肌肉内免疫化处理的彼等小鼠以明显的γIFN分泌表现出对Gag特异性抗原刺激的反应(表3)。在从根据上述相同时间表用pcDNA-GagPolNef进行三次皮下(s.c.)或皮内(i.d.)免疫化处理后的小鼠解剖下来的脾细胞观察到比较上有所减低的γIFN产生。于所有免疫化处理组中,从免疫化途径没有独立地测定出从经活体外特异性刺激过的脾细胞发生的明显IL4和IL5分泌。也没有观察到从未经刺激的脾细胞发生的细胞介素分泌。
根据此项结果,使用pcDNA-GagPolNef进行肌肉内疫化处理可诱导出强烈的Thl细胞因子走势,而皮下施用则诱导出更微弱的Thl反应。
表4.在使用所提的DNA利用粒子枪进行免疫化处理(使用注射针注射)或皮内或皮下免疫处理之后来自经活体外刺激的小鼠脾细胞的细胞介素走势。
DNA疫苗 IL-4(微微克/毫升) IL-5(微微克/毫升) IFN-γ(微微克/毫升)
PcDNA-GagPolNef(肌肉内) <8 <16 3220+840
pcDNA-GagPolNef(肌肉内) <8 <16 80+32
pcDNA-GagPolNef(肌肉内) <8 <16 <32
每实验从5只小鼠解剖下的脾细胞所得平均值±标准偏差
实施例18.为了证实pcDNA-GagPolNef对于Gag对特异性CTLs的诱导能力,乃在第一次免疫化处理的3星期后用pcDNA-GagPolNEF(第一组),pcDNA(第2组)和PBS(第3组)在混合淋巴细胞肿瘤细胞培养物中进行活体外划地再刺激6天且于随后探讨彼等的细胞毒性活性。已知者,衍生自亚型B病毒(IIIB分离物)Gag蛋白质的毫微米AMQMLKETI肽(单字母代码)为在BALB/c小鼠体内的Dd限制CTL表位。使用该肽于实验中以再刺激活体外特异性细胞毒性活性以及测定该活性。在使用pcDNA-GagPolNef质粒单次肌肉内注之后可以测定出Gag特异性细胞毒性T细胞但在对照组2和3中则没有测定到。使用该质粒处理脾细胞时不会导致Gag特异性细胞毒性T细胞的活体外引动(in vitro priming)。这些结果可确定(i)pcDNA-GagPolNef诱发特异性细胞毒性T细胞的能力,及(ii)该能力为跨亚型活性者(图9)。
参考文献
Bai,X.,Su,L.,Zhang,Y,and et al(1997).Subtype and sequenceanalysis of the CZV3 region of gp 120 gene among HIV-1 strains inXinjiang.Chin.J Virology 13.
Carr,J.K.,Salminen,M.O.,Koch,C.,Gotte,D.,Artenstein,A.WHegerich,P.A.,St Louis,D.,Burke,D.S.,and McCutchan,F.E.(1996).Full-length sequence and mosaic stmcture of a human imnunodeficiencyVirus type I isolate from Thailand.J Virol.70,5935-5943.
Carr,J.K.,Salminen,M.O.,Albert,J.,Sanders Buell,E.,Gotte,D.,Birx,D.L.,and McCutchan,F.E.(1998).Full genome sequences ofhuman immunodeficiency Virus type I subtypes G and A/G intersubtyperecombinants.Virology 247,22-31.
Esparza,J.,Osmanov,S.,and Heyward,W L.(1995).HIVpreventive.Progress to date.Drugs 50,792-804.
Expert,group of joint United Nations programme on HIV/AIDS(1999).Implications of HIV variability for transmission scientific andpolicy issues.AIDS 11,UNAIDSI-UNAIDS 15.
Gao,F.,Robertson,D.L.,Morrison,S.G.,Hui,H.,Craig,S.,Decker,J.,Fultz,P N.,Girard,M.,Shaw,G.M.,Hahi],B.H.,and Sharp,P M.(1996),The heterosexual human immunodeficiency viru type 1 epidemic inThailand is caused by an intersubtype(A/E)recombinant of Africanorigin.J.VlrOI.70.7013-7029.
Gao,F.,Robertson,D.L.,Carruthers,C.D.,Morrison,S.G.,Jian,B.,Chen,Y,Barre Sinoussi,F.,Girard,M.,Srinivasan,A.,Abimiku,A.G.,Shaw,G.M.,Sharp,P M.,and Hahii,B.H.(1998).A comprehensivepanel of near-full-length clones and reference sequences for non-subtypeB isolates of human immunodeficiency virus type I.j Virol.72,5680-5698.
Gaywee,J.,ArtenStein,A.W,VanCott,T.C.,Trichavaroj,R.,Sukchamnong,A.,Amlee,P,de Souza,M.,McCutchan,F.E.,(Carr,J.K.,Markowitz,L.E.,Michael,R.,and Nittayaphan,S.(1996).Correlationof genetic and serologic approaches to HIV-1 subtyping in Thailand.JAcquir lmmune.
Graf,M.,Shao,Y,Zhao,Q.,Seidl,T.,Kostler,J.,Wolf,H.,andWagner,R.(1998).Cloning and characterization of a Virtually full-lengthHIV type 1 genome from a subtybe B′-Thai strain representing the mostprevalent B-clade isolate in China.AIDS Res.Hum.Retroviruses I4.285-288.
Graham,B.S.and Wright,P.F.(1995).Candidate AIDS vaccines.NEngl.J Med.333,1331-1339.
Kostrikis,L.G.,Bagdades,E.,Cao,Y,Zhang,L.,Dimitriou,D.,andHo,D.D.(1995).Genetic analysis of human immunodeficiency virustype 1 strains from patients in Cyprus;identification of a new subtypedesignated subtype i.J Virol.69,6122-6130.
Leitner,T.and Albert,J.(1995).Human Retroviruses and AIDS 199i..a compilation and analysis of nucleic acid and amino acid sequences.(Myers,G.,Korber,B.,Wain-Hobson,S.,Jeang,K.,Mellors J.,McCutchan,F.,Henderson,L.,and Paviakis,G.Eds.)Los AlamosNational Laboratory,Los Alamos.N.Mex.lll 147-lll 150.
Lloe,K.S.,Bollinger,R.C.,Paranjape,R.S.,Gadkari,D.,Kulkarni,S.S.,Novfor,N.G.,Ingersoll,R.,Sheppard,H.W,and Ray,S.(C.(1999).Full-length human immunodeficiency virus type I genomes from subtypeC-infected seroconverters in india,with evidence of intersubtyperecombination.J Firol.73-152-160.
Loussert Kjaka,I.,Chaix,M.L.,Korber,B.,Letoumeur,F.,Gomas,E.,Allen,E.,Ly,T-D.,Brun Vezinet,F.,Simon,F.,and Saragosti,S.(1995).Variability of human immunodeficiency virus type 1 group Ostrains isolated from Cameroonian patients living in France..J Virol.69.5640-5649.
Luo,C.C.,Tian,C.,Hu,D.J.,Kai,M.,DOndero,T.,and Zheng,X.(1995).HIV-1 subtype C in China[letter].Lancet 345,1051-1052.
Myers,G.,Korber,B.,Foley,B.,Jeang,K.T.,Mellors,J.W,andWain Hobson,S.(1996).Human retroviruses and AIDS a compilationand analysis ofnucleic acid and amino acid sequences.
(Anonymous Theoretical Biology and Biophysics Group,LosAlamos.N.Mex.
Salminen,M.O.,Koch,C.,Sanders Buell,E.,Ehrenberg,P K.,Michael,N.L.,Carr,J.K.,Burke,D.S.,and McCutchan,F.E.(1995).Recovery of Virtually full-length HIV-1 provirus of diverse subtypesfrom primary Virus cultures using the polymerase chain reaction.Virology 213.80-86.
Shao,Y,Zhao,Q.,Wang B.,and et al(1994).Sequence analysis ofHIV env gene among HIV infected IDUs in Yunnan epidemic area ofChina.Chin.J Virology 10,291-299.
Shao,Y,Su,L.,Sun,X.,and et al(1998).Molecular Epidemiologyof HIV infection in China.12th world AIDS conference,Geneva 13132,(Abstract)
Shao,Y,Guan,Y,Zhao,Q.,and et al(1999).Genetic variation andmolecular epidemiology of the Ruily HIV-1 strains of Yumian in 1995.Chin.J Virol.12,9.
Sharp,P.M.,Robertson,D.L.,and Hahn,B.H.(1995).Cross-species transmission and recombination of`AIDS'viruses.Philos.Trans.R.Soc.Lond B.Biol.Sci.349.41-47.
Sharp,P.M.,Bailes,E.,Robertson,D.L.,Gao,F.,and Hahn,B.H.(1999).Origins and evolution of AIDS viruses.Biol.Bull.196.338-342.
World Health Organisation Network for HIV Isolation andCharacterization(1994).HIV-1 variation in WHO-sponsored vaccine-evaluation sites genetic screening,sequence analysis and preliminarybiological characterization of selected viral strains.AIDS Res.Hum.Retroviruses 10,1327-1344.
Yu,H.,Su,L.,and Shao,Y(1997).Identification of the HIV-1subtypes by HMA and sequencing.Chin.J Epidemiol.18,201-204.
                              序  列  表
                                序列表<110>Geneart GmbH<120>Dae Genom des HIV-1 Intersubtype (C/B') und seine
 Anwendungen<130>WAG-001 PCT<140>xx<141>2000-11-16<150>DE 199 55 089.1<151>1999-11-16<160>3<170>PatentIn Ver.2.1<210>1<211>9078<212>DNA<213>Human immunodeficiency virus<400>1aatctctagc agtggcgccc gaacagggac ttgaaagcga aagtaagacc agaggagatc  60tctcgac9ca ggactcggct tgctgaagtg cactcggcaa gaggcgagag cggcgactgg  120tga9tacgcc aattatattt gactagcgga ggctagaagg agagagatgg gtgcgagagc  180gtcaatatta agagggggaa aattagataa atgggaaaaa attaggttaa ggccaggggg  240aaagaaacac tatatgctaa aacacctagt atgggcaagc agggagctgg aaagattcgc  300acttaaccct ggccttttag agacatcaga aggctgtaaa caaataacga aacagctaca  360atcagctctt cagacaggaa cagaggaact tagatcatta ttcaacacag tagcaactcc  420ctattgtgta catacagaga tagatgtacg agacaccaga gaagccttag acaagataga  480ggaagaacaa aacaaaattc agcaaaaaac acagcaggca aaggaggctg acgggaaggt  540cagtcaaaat tatcctatag tacagaatct ccaagggcaa atggtacatc agcccatatc  600acctagaact ttaaatgcat gggtaaaagt ggtagaagag aaggctttta gcccagaagt  660aatacccatg ttttcagcgt tatcagaagg agccacccca caagatttaa acaccatgct  720aaacacagtg gggggacatc aagcagctat gcaaatatta aaagatacca tcaatgaaga  780ggctgcagaa tgggatagat tacatccagt aaatgcaggg cctattgcac caggccaaat  840gagagaacca aggggaagtg acatagcagg aactactagt aacctacagg aacaaatagc  900atggatgacg agtaacccac ctgttccagt aggagacatc tataaaagat ggataattct  960gggattaaat aaaatagtaa gaatgtatag ccctaccagc attctggaca taaaacaagg 1020gccgaaggaa ccctttagag actatgtaga ccggtttctt aaaactttaa gagcggaaca 1080agctacgcaa ggtgttaaaa attggatgac agacaccttg ttggtccaaa atgcgaaccc 1140agattgtaag accattttaa gagcattagg accaggggct tcaatagaag aaatgatgac 1200agcatgtcag ggagtgggag gacctagcca taaagcaaaa gtgttggccg aggcaatgag 1260ccaaacaaac agtgccatac tgatgcagag aagcaatttt aaaggctcta aaagaattgt 1320taaatgtttc aactgtggca aggaagggca catagccaga aattgcaggg cccctaggaa 1380aaagggctgt tggaaatgtg gaaaagaagg acaccaaatg aaagattgta ctgagagaca 1440ggccaatttt ttagggaaaa tctggccctc ccacaaggga gggccaggga attttcttca 1500gaacagacca gagccaacag ccccaccaga ggagagcttc aggtttgggg aagagacaac 1560aactccatct cagaagcagg agccaataga caaggaacta tatcctttaa cttccctcaa 1620atcactcttt ggcaacgacc cctcgtcaca ataaagatag gggggcaatt aaaggaagct 1680ctattagata caggagcagg tgatacagta ttagaagacc tgaatttgcc agggaaatgg 1740aaaccaaaaa tgataggggg aattggaggt tttatcaaag taagacagta tgaacagata 1800cccatagaaa tttgcggaca caaagctata ggtacagtat tagtaggacc tacacctgtc 1860aacacaattg gaagaaatct gttgactcag cttggttgca ctttaaattt tccaatcagt 1920cccattgaaa ctgtaccagt aaaattaaag ccaggaatgg atggcccaaa ggttaaacaa 1980tggccattga cagaagagaa aataaaagca ttaacagcaa tttgtgatga aatggagaaa 2040gaaggaaaaa ttacaaaaat tgggcctgaa aatccatata acactccaat atttgccata 2100aaaaagaagg acagtactaa gtggagaaag ttagtagatt tcagggaact caataaaaga 2160actcaagatt tttgggaagt tcaattagga ataccacacc cagcagggtt aaaaaagaaa 2220aaatcagtga cagtactgga tgtgggggat gcatattttt caattccttt atatgaagac 2280ttcaggaagt atactgcatt caccatacct agtagaaaca atgaaacacc agggattagg 2340tatcagtaca atgtacttcc acagggatgg aaaggatcac tagcaatatt ccaaagtagc 2400atgacaaaaa ccttagagcc ttttagaaaa caaaatccag gcatagttat ctatcaatac 2460atggatgatt tgtatgtagg atctgactta gagatagggc agcatagaac aaaaatagag 2520gaactgagac aacatttgtt gaggtgggga tttaccacac cagacaagaa acattagaaa 2580gaacctccat ttctttggat ggggtatgaa ctccatcctg acaaatggac agtacagcct 2640acacagctgc cagaaaaaga tagctggact gtcaatgata tacaaaagtt agtgggaaaa 2700ttaaactggg caagtcagat ttatcctgga attaaagtaa ggcaactttg taaactcctt 2760aggggggcca aagcactaac agacatagta ccactaactg aagaagcaga attagaattg 2820gcagaaaaca gggaaattct aaaagaacca gtacatggag tatactatga cccatcaaaa 2880gacttgatag ctgaaataca gaaacagggg caggaacaat ggacatatca aatttaccaa 2940gaaccattca aaaatctaaa aacagggaag tatgcaaaaa tgaggactgc ccacactaat 3000gatgtaaaac aattaacaga ggctgtgcag aaaatagcca tggaaggcat agtaatatgg 3060ggaaaaactc ctaaatttag attacccatc caaaaagaaa catgggagac atggtggaca 3120gactattggc aagccacctg gattcctgag tgggaatttg ttaatacccc tcccttagta 3180aaattatggt accagctgga aaaagatccc atagtaggag tagaaacttc ctatgtagat 3240ggagcagcta atagggagac taaaatagga aaagcagggt atgttactga cagaggaagg 3300aagaaaattg tttctctaac tgaaacaaca aatcagaaga ctgaattgca agcaatttgt 3360atagctttgc aagattcagg atcagaagta aacatagtaa cagattcaca gtatgcatta 3420gggatcattc aagcacaacc agataagagt gaatcagagt tagttaacca aataatagaa 3480caattaatga aaaaggaaag agtctacctg tcatgggtac cagcacataa aggaattgga 3540ggaaatgaac aagtagataa attagtaagt agtggaatca ggaaagtgct atttctagat 3600ggaatagata aagctcaaga agagcatgaa aagtatcaca gcaattggag agcaatggct 3660agtgacttta atctgccacc catagtagca aaagaaatag tggctagctg tgatcaatgt 3720cagctaaaag gagaagccat gcatggacaa gtagactgta gtccagggat atggcaatta 3780gattgtacac atttagaagg aaaaatcatc ctggtagcag tccatgtagc cagtggctac 3840atggaagcag aggttatccc agcagaaaca agacaagaga cagcatactt tatactaaaa 3900ttagcaggaa gatggccagt caaagtaata aatacagata atggtagtaa tttcaccagt 3960actgcagtta aggcagcctg ttggtgggca ggtatccaac aggaatttgg aattccctac 4020agtccccaaa gtcagggagt agtagaagcc atgaataaag aattaaagaa aattataggg 4080caggtaagag atcaagctga gcaccttaag acagcagtac taatggcagt attcattcac 4140aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat aatagatata 4200atagcaacag acatacaaac taaagaatta caaaaacaga ttacaaaaat tcaaaatttt 4260cgggtttatt acagagacag cagagacccc agttggaaag gaccagccaa actactctgg 4320aaaggtgaag gggcagtaat aatacaagat aatagtgaca taaaggtagt accaaggagg 4380aaagcaaaaa tcattaagga ctatggaaaa cagatggcag gtgctgattg tgtggcaggt 4440agacaggatg aagattagaa catggaatag tttagtaaaa caccatatgt atgtttcaag 4500gagagctaat ggatggtttt acagacatca ttatgacagc agacatccaa aagtaagttc 4560agaagtacac atcccattag gaaaggctaa attagtaata aaaacatatt gggggttgca 4620gacaggagaa agagatcggc atttgggtca tggagtctcc atagaatgga gattgagaag 4680atataccaca caaatagaac ctggcctggc agaccagcta attcatttgt attattttga 4740ttgttttgca gactctgata taaggaaagc catattagga cacatagtta ttcctaggtg 4800tgactatcaa gcaggacata ataataaggt aggatctcta caatacttgg cactgacagc 4860attgataaaa ccaaaaaaga taaagccacc tctgcctagt atcaagaaat tagtagagga 4920tagatggaac aatccccagg agatcagggg ccgcagaggg aaccacacaa tgaatggaca 4980ctagagcttc tagaggagct caagcaggaa gctgttagac actttcctag accatggctt 5040catagcttag gacaacatat ctatgaaaca tatggggata cttgggcagg agtggaagcc 5100ataataagaa ttctgcaaca actgctgttt attcatttca gaattgggtg tcagcatagc 5160agaataggca ttttgagaca gagaagaaca agaaatggag ccagtaaatc ataaaggaga 5220gccttgggag catccaggaa gtcagcctaa gactgcttgt aacagttgct attgtaaaaa 5280gtgctgcttt cattgccaag tttgtttcac gaaaaaaggc ttaggcatct tctatggcag 5340gaagaagcga agacagcgac gaagcgctca tcgaagcagt gaggatcatc aaaatcctat 5400atcaaagcag taagtagtaa atgtaatgca agctttaacc attttagcaa tagtagcctt 5460agtagtagca acaataatag caatagttgt gtggaccata gtattcatag aatataggaa 5520aatattaaga cagaaaaaaa tagacaggtt aattgataga ataagagaaa gagcagaaga 5580cagtggcaat gagggtgacg gggatcagga agaattatcg gcatttatgg agatggggca 5640ccatgctcct tgggatgttg atgatcagta gtgctgtagg aaacttgtgg gtcacagtct 5700attatggggt acctgtatgg aaaggggcaa ccaccacttt attttgtgca tcagatgcta 5760aagcatatga tacagaggta cataatgttt gggctacaca tgcctgtgta cccgcagacc 5820ccaacccaca agaaatggtt ttggaaaatg taacagaaaa ttttaacatg tggaaaaatg 5880aaatggtaaa tcagatgcag gaagatgtaa tcagtttttg ggatcaaagc ctaaaaccac 5940gtgtaaagtt gaccccactc tgtgccacct tagaatgtag aaatgttagc agtaatagta 6000atgataccta ccatgagacc taccatgaga gcatgaagga aatgaaaaat tgctctttca 6060atgcaaccac agtagtaaga gataggaagc agacagtgta tgcacttttt tatagacttg 6120atatagcacc acttactaag aagaactata gtgagaattc tagtgagtat tatagattaa 6180taaattgtaa tacctcagcc ataacacaag cctgtccaaa ggtcactttt gatccaattc 6240ctatacacta ttgcactcca gctggttatg caattctaaa gtgtaatgat aagatattca 6300atgggacagg accatgccat aatgttagca cagtacaatg tacacatggg attaagccag 6360tggtatcaac ccaactactg ttaaatggta gcctagcaga aggagaaata ataattagat 6420ctgaaaatct gacaaacaat gtcaaaacaa taatagtaca tcttaatcaa tctgtagaaa 6480ttgtatgtac aagacccggc aataatacaa gaaaaagtat aaggatagga ccaggacaaa 6540cattctatgc aacaggagac ataataggag acataagaca agcacactgt aacattagtg 6600aagataaatg gaatgaaact ctacaaaggg taagtaaaaa attagcagaa cacttccaga 6660ataaaacaat aaaatttgca tcatcctcag gaggggacct agaagttaca acacatagct 6720ttaattgtag aggagaattt ttctattgta atacatcagg cctgtttaat ggtgcataca 6780cgcctaatgg tacaaaaagt aattcaagct caatcatcac aatcccatgc agaataaagc 6840aaattataaa tatgtggcag gaggtaggac gagcaatgta tgcccctccc ataaaaggaa 6900acataacatg taaatcaaat atcacaggac tactattggt acgtgatgga ggaacagagc 6960caaacgatac agagacattc agacctggag gaggagatat gaggaacaat tggagaagtg 7020aattatataa atataaagtg gtagaaacta agccattggg agtagcaccc actacaacaa 7080aaaggagagt ggtggagaga gaaaaaagag cagtgggaat aggagctgtg ttccttgggt 7140tcttaggagt agcaggaagc actatgggcg cggcgtcaat aacgctgacg gtacaggcca 7200gacaattgct gtctggtata gtgcaacagc aaagcaattt gctgagggct atagaagcgc 7260aacagcatct gttgcaactc acggtctggg gcattaagca gctccagaca agagtcctgg 7320ctatagaaag atacctaaag gatcaacagc tcctagggat ttggggctgc tctggaaaac 7380tcatctgcac tactgctgta ccttggaact ccagttggag taacaaatct caaaaagaga 7440tttgggataa catgacctgg atgcaatggg ataaagaaat tagtaattac acaaacacag 7500tatacaggtt gcttgaagaa tcgcaaaacc agcaggaaag gaatgaaaaa gatctattag 7560cattggacag ttggaaaaat ctatggagtt ggtttgacat aacaaattgg ctgtggtata 7620taaaaatatt cataataata gtaggaggct tgataggttt aagaataatt tttgctgtgc 7680tctctatagt aaatagagtt aggcagggat actcaccttt gtcgtttcag acccttaccc 7740cgaacccagg gggacccgac aggctcggaa gaatcgaaga agaaggtgga aagcaagaca 7800gggacagatc cattcgatta gtgaacggat tcttagcgct tgcctgggac gacctgcgga 7860acctgtgcct cttcagctac caccgattga gggacttcac attagtggca gcgagggtgg 7920tggaacttct gggacgcaat agtctcaggg gactacagag agggtgggaa gcccttaaat 7980atctgggaag tcttgtgcag tactggggtc aggagctaaa aaagagtact attagtccgg 8040ttgataccat agcaatagca gtagctgaag gaacagatag gattatagaa ttagtacaag 8100gactttgtag agctatctac agcataccta gaagaataag acagggcttt gaagcagctt 8160tgcaataaaa tggggggcaa gtggtcgaaa agtagcatag ttggatggcc tgctataagg 8220gagagaatga gaagaactga gccagcagca gatggggtgg gagcagtatc tcgagacctg 8280gaaaaacatg gagcaatcac gagtagcaat acagcagcta ctaatgagga ttgtgcctgg 8340ctggaagcac aagaggaggg ggaggtgggt tttccagtca gacctcaggt acctttaaga  8400ccaatgactt acaagggagc tgtagatctt agcttctttt taaaagaaaa ggggggactg  8460gaagggttaa tttactctaa gaaaaggcta gagatccttg atttgtgggt ctatcacaca  8520caaggctact tccctgattg gcacaactac acaccaggac caggggtcag attcccactg  8580acttttgggt ggtgcttcaa gctagtacca gttgacccaa gggaagtaga agaggccaac  8640gagggagaag acaactgctt gctacaccct gtgtgccagc atggaatgga ggatgatcac  8700agagaagtat taaagtggaa gtttgacagt caactagcac acagacacag ggcccgcgaa  8760ctacatccgg agttttacaa agactgctga cacagaaggg actttccgcg gggactttcc  8820actggggcgt tctaggaggt gtggtctggc gggactggga gtggtcaacc ctcaaatgct  8880gcatataagc agctgctttt cgcctgtact gggtctctct agtcagacca gatctgagcc  8940tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag cctgccttga  9000ggggctagag cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgag9gtt  9060aattgcgcgc tggcgatc                                                9078<210>2<211>4288<212>DNA<213>Human immunodeficiency virus<400>2gctaggtacc taatgggcgc cagggccagc atcctgaggg gcggcaagct ggacaagtgg  60gagaagacca ggctgaggcc cggcggcaag aagcactaca tgctgaagca cctggtgtgg  120gccagcaggg agctggagag gttcgccctg aaccccggcc tgctggagac cagcgagggc  180tgcaagcaga tcatgaagca gctgcagagc gccctgcaga ccggcaccga ggagctgagg  240agcctgttca acaccgtggc caccccctac tgcgtgcaca ccgagatcga cgtgagggac  300accagggagg ccctggacaa gatcgaggag gagcagaaca agatccagca gaagacccag  360caggccaagg aggccgacgg caaggtgagc cagaactacc ccatcgtgca gaacctgcag  420ggccagatgg tgcaccagcc catcagcccc aggaccctga atgcatgggt gaaggtggtg  480gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctgag cgagggcgcc  540accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag  600atcctgaagg acaccatcaa cgaggaggcc gccgagtggg acaggctgca ccccgtgcac  660gccggcccca tcgcccccgg ccagatgagg gagcccaggg gcagcgacat cgccggcacc  720accagcaacc tgcaggagca gatcgcctgg atgaccagca acccccccgt gcccgtgggc  780gacatctaca agaggtggat catcccgggt ttaaacaaga tcgtgaggat gcacagcccc  840accagcatcc tggacatcaa gcagggcccc aaggagccct tcagggacta cgtcgacagg  900ttcttcaaga ccctgagggc ggagcaggcc acccagggcg tgaagaactg gatgaccgac  960accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctgagggc cctgggcccc  1020ggcgccagca tcgaggagat gatgaccgcc tgccagggcg tgggcggccc cagccacaag  1080gccaaggtgc tggccgaggc catgagccag accaacagcg ccatcctgat gcagaggagc  1140aacttcaagg gcagcaagag gatcgtgaag tgcttcaact gcggcaagga gggccacatc  1200gccaggaact gcagggcccc caggaagaag ggctgctgga agtgcggcaa ggagggccac  1260cagatgaagg accgcaccga gaggcaggcc aacttcctgg gcaagatctg gcccagccac  1320aagggcggcc ccggcaacct cctgcagaac aggcccgagc ccaccgcccc ccccgaggag  1380agcttcaggt tcgaggagga gaccaccacc cccagccaga agcaggagcc catcgacaag  1440gagctgtacc ccctgaccag cctgaagagc ctgttcggca acgaccccag cagccaggaa  1500ttcttcaggg agaacctggc cctgccccag ggcagggcca gggagttcag cagcgagcag  1560accagggcca acagccccac caggggcgag ctgcaggtgt ggggcaggga caacaacagc  1620atcagcgagg ccggcgccaa caggcagggc accaccagct tcaacttccc ccagatcacc  1680ctgtggcaga ggcccctggt gaccatcagg atcggcggcc agctgaagga ggccctgctg  1740aacaccggcg ccggcgacac cgtgctggag gacctgaacc tgcccggcaa gtggaagccc  1800aagatgatcg gcggcatcgg cggcttcatc aaggtgaggc agtacgagca gatccccatc  1860gagatctgcg gccacaaggc catcggcacc gcgctggtgg gccccacccc cgtgaacatc  1920atcggcagga acctgctgac ccagctgggc tgcaccctga actcccccat cagccccatc  1980gagaccgtgc ccgtgaagct gaagcccggc acggacggcc ccaaggtgaa gcagtggccc  2040ctgaccgagg agaagatcaa ggccctgacc gccatctgcg acgagatgga gaaggagggc  2100aagatcacca agatcggccc cgagaacccc tacaacaccc ccatcttcgc catcaagaag  2160aaggacagca ccaagtggag gaagctggtg gacttcaggg agctgaacaa gaggacccag  2220gacttctggg aggtgcagct gggcatcccc caccccgccg gcctgaagaa gaagaagagc  2280gtgaccgtgc tggacgtggg cgacgcctac ttcagcatcc ccctgtacga ggacttcagg  2340aagtacaccg ccttcaccat ccccagcagg aacaacgaga cccccggcat cagctaccag  2400tacaacgtgc tgccccaggg ctggaagggc agcctggcca tcttccagag cagcatgacc  2460atcgaggagc tgatctacag caagaagagg caggagatcc tggacctgtg ggtgtaccac  2520acccagggct acttccccga ctggcacaac tacacccccg gccccggcgt gaggttcccc  2580ctgaccttcg gctggtgctt caagctggtg cccgtggacc ccagggaggt ggaggaggcc  2640aacgagggcg aggacaactg cctgctgcac cccgtgtgcc agcacggcat ggaggacgac  2700cacagggagg tgctgaagtg gaagttcgac agccagctgg cccacaggca cagggccagg  2760gagctgcacc ccgagttcta caaggactgc atgggcggca agtggagcaa gagcagcatc  2820gtgggctggc ccgccatcag ggagaggatg aggaggaccg agcccgccgc cgacggcgtg  2880ggcgccgt9a gcagggacct ggagaagcac ggcgccatca ccagcagcaa caccgccgcc  2940accaacgagg actgcgcctg gctggaggcc caggaggagg gcgaggtggg cttccccgtg  3000aggccccagg tgcccctgag gcccatgacc tacaagggcg ccgtggacct gagcttcttc  3060ctgaaggaga agggcggcct ggagggcctg aggcagcacc tgctgaggtg gggcttcacc  3120acccccgaca agaagcacca gaaggagccc cccttcctgt ggatgggcta cgagctgcac  3180cccgacaagt ggaccgtgca gcccacccag ctgcccgaga aggacagctg gaccgtgaac  3240gacatccaga agctggtggg caagctgaac tgggccagcc agatctaccc cggcatcaag  3300gtgaggcagc tgtgcaagct gctgaggggc gccaaggccc tgaccgacat cgtgcccctg  3360accgaggagg ccgagctgga gctggccgag aacagggaga tcctgaagga gcccgtgcac  3420ggcgtgtact acgaccccag caaggacctg atcgccgaga tccagaagca gggccaggag  3480cagtggacct accagatcta ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc  3540aagatgagga ccgcccacac caacgacgtg aagcagctga ccgaggccgt gcagaagatc  3600gccatggagg gcatcgtgat ctggggcaag acccccaagt tcaggctgcc catccagaag  3660gagacctggg agacctggcg gaccgactac tggcaggcca cctggatccc cgagtgggag  3720ttcgtgaaca cccctcccct ggtgaagctg tggtatcagc tggagaagga ccccatcgtg  3780ggcgtggaga ccttctacgt ggacggcgcc gccaacaggg agaccaagat cggcaaggcc  3840ggctacgtga ccgacagggg caggaagaag atcgtgagcc tgaccgagac caccaaccag  3900aagaccgagc tgcaggccat ctgcatcgcc ctgcaggaca gcggcagcga ggtgaacatc  3960gtgaccgaca gccagtacgc cctgggcatc atccaggccc agcccgacaa gagcgagagc  4020gagctggtga accagatcat cgagcagctg atgaagaagg agagggtgta cctgagctgg  4080gtgcccgccc acaagggcat cggcggcaac gagcaggtgg acaagctggt gagcagcggc  4140atcaggaagg tgctgaagac cctggagccc ttcaggaagc agaaccccgg catcgtgatc  4200taccagtaca tggacgacct gtacgtgggc agcgacctgg agatcggcca gcacaggacc  4260aagtaaagat ctctcgagga gctcaagc                                     4288<210>3<211>2605<212>DNA<213>Human immunodeficiency virus<400>3gcggcgggta ccgaactcgc cgccagcatg gacagggcca agctgctgct gctgctgctg  60ctgctgctgc tgccccaggc ccaggccgtg ggcaacctgt gggtgaccgt gtaccacggc  120gtgcccgtgt ggaagggcgc caccaccacc ctgttctgcg ccagcgacgc caaggcctac  180gacaccgagg tgcacaacgt gtgggccacc cacgcctgcg tgcccgccga ccccaacccc  240caggagatgg tgctggagaa cgtgaccgag aacttcaaca tgtggaagaa cgagatggtg  300aaccagatgc aggaggacgt catcagcctg tgggaccaga gcctgaagcc ctgcgtgaag  360ctgacccccc tgtgcgtgac cctggagtgc aggaacgtga gcagcaacag caacgacacc  420taccacgaga cctaccacga gagcatgaag gagatgaaga actgcagctt caacgccacc  480accgtggtga gggacaggaa gcagaccgtg tacgccctgt tctacaggct ggacatcgtg  540cccctgacca agaagaacta cagcgagaac agcagcgagt actacaggct gatcaactgc  600aacaccagcg ccatcaccca ggcctgcccc aaggtgacct tcgaccccat ccccatccac  660tactgcaccc ccgccggcta cgccatcctg aagtgcaacg acaagatctt caacggcacc  720ggcccctgcc acaacgtgag caccgtgcag tgcacccacg gcatcaagcc cgtggtgagc  780acccagctgc tgctgaacgg cagcctggcc gagggcgaga tcatcatcag gagcgagaac  840ctgaccaaca acgtgaaaac catcatcgtg cacctgaacc agagcgtgga gatcgtgtgc  900accaggcccg gcaacaacac caggaagagc atcaggatcg gccccggcca gaccttctac  960gccaccggcg acatcatcgg cgacatcagg caggcccact gcaacatcag cgaggacaag  1020tggaacgaga ccctgcagag ggtgagcaag aagcttgccg agcacttcca gaacaagacc  1080atcaagttcg ccagcagcag cggcggcgac ctggaggtga ccacccacag cttcaactgc  1140aggggcgagt tcttctactg caacaccagc ggcctgttca acggcgccta cacccccaac  1200ggcaccaaga gcaacagcag cagcatcatc accatcccct gcaggatcaa gcagatcatc  1260aacatgcggc aggaggtggg cagggccatg tacgcccctc ccatcaaggg caacatcacc  1320tgcaagagca acatcaccgg cctgctgatg gtgagggacg gcggcaccga gcccaacgac  1380accgagacct tcaggcccgg cggcggcgac atgaggaaca actggaggag cgagctgcac  1440aagtacaagg tggtggagat caagcccctg ggcgtggccc ccaccaccac caagaggagg  1500gtggtggaga gggagaagag ggccgtgggc atcggcgccg tgttcctggg cttcctgggc  1560gtggccggca gcaccatggg cgccgccagc atcaccctga ccgtgcaggc caggcagctg  1620ctgagcggca tcgtgcagca gcagagcaac ctgctgaggg ccatcgaggc ccagcagcac  1680ctgctgcagc tgaccgtgtg gggcatcaag cagctgcaga ccagggagct ggccatcgag  1740aggtacctga aggaccagca gctgctgggc atctggggct gcagcggcaa gctgatctgc  1800accaccgccg tgccctggaa cagcagctgg agcaacaaga gccagaagga gatctgggac  1860aacatgacct ggatgcagtg ggacaaggag atcagcaact acaccaacac cgtgtacagg  1920ctgctggagg agagccagaa ccagcaggag aggaacgaga aggacctgct ggccctggac  1980agctggaaga acctgtggag ctggttcgac atcaccaact ggctgtggta catcaagatc  2040ttcatcatca tcgtgggcgg cctgatcggc ctgaggatca tcttcgccgt gctgagcatc  2100gtgaacaggg tgaggcaggg ctacagcccc ctgagcttcc agaccctgac ccccaacccc  2160ggcggccccg acaggctggg caggatcgag gaggagggcg gcaagcagga cagggacagg  2220agcatcaggc tggtgaacgg cttcctggcc ctggcctggg acgacctgag gaacctgtgc  2280ctgttcagct accacaggct gagggacttc accctggtgg ccgccagggt ggtggagctg  2340ctgggcagga acagcctgag gggcctgcag aggggctggg aggccctgaa gtacctgggc  2400agcctggtgc agtactgggg ccaggagctg aagaagagca ccatcagcct ggtggacacc  2460atcgccatcg ccgtggccga gggcaccgac aggatcatcg agctggtgca gggcctgtgc  2520agggccatct acagcatccc caggaggatc aggcagggct tcgaggccgc cctgcagtga  2580taaagatctc tcgaggagct caagc                                        2605

Claims (20)

1、一种多核苷酸,其包括如SEQ ID NO:1,2或3中所示核酸序列,或其片段或衍生物,或一种可与如SEQ ID NO:1,2或3中所示核酸序列杂交的多核苷酸。
2、如权利要求1的多核苷酸或其片段或衍生物,其中该杂交多核苷酸是在严格条件与如SEQ ID NO:1,2或3中所示核酸序列杂交。
3、如权利要求1或2的多核苷酸或其片段或衍生物,其包括至少一个具有至少9个核苷酸,优选至少15个核苷酸,更优选至少27个核苷酸,或更长的连续序列。
4、如权利要求3的多核苷酸或其片段或衍生物,其具有一个以上的连续核苷酸序列,其中至少两个连续序列是由一核苷酸序列间隔段所分隔。
5、如权利要求1到4项中任一项的多核苷酸或其片段或衍生物,其包括至少一个如SEQ ID NO:1,2或3中所示核酸序列所编码的多肽。
6、DNA构建体,其包括如权利要求1到5项中任一项的多核苷酸或其片段或衍生物。
7.细菌或病毒载体,其包括如权利要求1到5项中任一项的多核苷酸或其片段或衍生物。
8.如权利要求1到5项中任一项的多核苷酸或其片段或衍生物,用作药物,疫苗或诊断物质。
9、如权利要求1到5项中任一项的多核苷酸或其片段或衍生物用于制造治疗或预防HIV感染所用的药物或疫苗的用途。
10、一种多肽,其是由如SEO ID NO:1,2或3中所示核酸序列或其片段或衍生物所编码。
11、如权利要求10的多肽,其包括一由如SEQ ID NO:1,2或3中所示核酸序列或其片段或衍生物所编码的含有至少8个氨基酸的连续序列。
12、如权利要求10或11的多肽,其中该氨基酸序列对应于HIV包膜蛋白质或其片段。
13、如权利要求10到12项中任一项的多肽,其还包括在一受感染对象体内天然地诱导免疫反应的抗原决定簇。
14、如权利要求13的多肽,其中该抗原决定簇为一种构象表位或线性表位。
15、如权利要求10到14项中任一项的多肽,用作药物,疫苗或诊断物质。
16、如权利要求10到14项中任一项的多肽用于制造治疗或预防HIV感染所用的药物或疫苗的用途。
17、分离的多肽,其对如权利要求10到14项中任一项所述多肽具有特异性。
18、如权利要求17的分离的多肽,用作药物或诊断物质。
19、如权利要求17的分离的多肽用于制造治疗或预防HIV感染所用的药物的用途。
20、如权利要求17到19项中任一项的分离的多肽,其中该分离的多肽为一种抗体。
CN00818426A 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途 Pending CN1423698A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19955089.1 1999-11-16
DE19955089 1999-11-16

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910127667.7A Division CN101586106B (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Publications (1)

Publication Number Publication Date
CN1423698A true CN1423698A (zh) 2003-06-11

Family

ID=7929215

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200910127667.7A Expired - Lifetime CN101586106B (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途
CN00818426A Pending CN1423698A (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200910127667.7A Expired - Lifetime CN101586106B (zh) 1999-11-16 2000-11-16 Hiv-1亚型间(c/b’)基因组和其用途

Country Status (14)

Country Link
US (2) US7332588B1 (zh)
EP (1) EP1240333B1 (zh)
CN (2) CN101586106B (zh)
AP (1) AP1674A (zh)
AT (1) ATE391785T1 (zh)
AU (1) AU784635B2 (zh)
BR (1) BR0015607A (zh)
CA (1) CA2391560A1 (zh)
DE (2) DE10056747A1 (zh)
ES (1) ES2303513T3 (zh)
HK (1) HK1046428A1 (zh)
OA (1) OA12156A (zh)
WO (1) WO2001036614A2 (zh)
ZA (1) ZA200204047B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582920B2 (en) 2000-09-01 2003-06-24 Gen-Probe Incorporated Amplification of HIV-1 RT sequences for detection of sequences associated with drug-resistance mutations
PL207168B1 (pl) * 2001-09-20 2010-11-30 Glaxo Group Ltd Sekwencja nukleotydowa, wektor, białko, środek farmaceutyczny, urządzenie do podawania śródskórnego, zastosowanie sekwencji nukleotydowej i sposób wytwarzania nukleotydu
ES2281252B1 (es) * 2005-07-27 2009-02-16 Consejo Superior De Investigaciones Cientificas Vectores recombinantes basados en el virus modificado de ankara (mva) como vacunas preventivas y terapeuticas contra el sida.
BRPI0504117A (pt) 2005-09-05 2007-05-22 Fundacao De Amparo A Pesquisa epìtopos, combinação de epìtopos, usos de epìtopos ou sua combinação, composição, usos da composição, vacinas profiláticas anti-hiv-1, vacinas terapêuticas, método para a identificação de epìtopos e métodos para o tratamento ou prevenção
US20090060947A1 (en) * 2006-05-19 2009-03-05 Sanofi Pasteur, Inc. Immunological compositions
EP2424999A1 (en) 2009-04-30 2012-03-07 Centre Hospitalier Universitaire Vaudois Lausanne (CHUV) Modified immunization vectors
WO2011109511A2 (en) * 2010-03-02 2011-09-09 International Aids Vaccine Initiative Novel hiv-1 envelope glycoprotein
WO2013038185A1 (en) 2011-09-12 2013-03-21 Jonathan Norden Weber Methods and compositions for raising an immune response to hiv
KR20220061285A (ko) * 2013-11-14 2022-05-12 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 HIV-1 EnV DNA 백신과 단백질 부스터
CN105586319B (zh) * 2014-10-20 2021-01-08 中国疾病预防控制中心性病艾滋病预防控制中心 复制型痘苗病毒载体艾滋病疫苗
CN107090019B (zh) * 2017-01-23 2018-11-23 张帅 人类免疫缺陷病毒重组蛋白
CN110627911B (zh) * 2019-10-14 2022-11-22 吉林大学 一种可诱导hiv-1广谱中和抗体的包膜蛋白三聚体免疫原及用途

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5215913A (en) 1987-11-30 1993-06-01 Roger Williams General Hospital IgG-1 human monoclonal antibody reactive with an HIV-1 antigen and methods of use
ATE208813T1 (de) 1988-02-16 2001-11-15 Greatbatch Gen Aid Ltd Modifizierte zellen mit resistenz gegen retroviralinfektionen
US5580761A (en) 1988-02-16 1996-12-03 Greatbatch Gen-Aid Ltd. Method of conferring resistance to immunodeficiency viral infection
EP0657532B1 (en) 1988-06-09 2003-12-17 N.V. Innogenetics S.A. HIV-3 retrovirus strains and their use
EP0440749B1 (en) * 1988-08-31 1997-05-28 Aprogenex, Inc. Manual in situ hybridization assay
DE68918867T2 (de) 1988-09-13 1995-02-16 Chiron Corp Mutanten des hiv-1 Hüllproteins mit fehlenden hypervariabelen domänen.
AU647108B2 (en) 1990-04-03 1994-03-17 Genentech Inc. Methods and compositions for vaccination against HIV
CA2092546A1 (fr) 1990-09-27 1992-03-28 Luc Montagnier Peptides inducteurs d'anticorps inhibant des retrovirus du type hiv et anticorps diriges contre ces peptides
US5847096A (en) 1991-08-30 1998-12-08 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services DNA constructs encoding CD4 fusion proteins
EP0725838A4 (en) 1993-10-26 1997-02-26 United Biomedical Inc STRUCTURED SYNTHETIC ANTIGAN BANKS AS DIAGNOSTICS, VACCINE AND THERAPEUTIC AGENTS
WO1995016710A1 (en) 1993-12-13 1995-06-22 United Biomedical, Inc. Specific hyperimmune anti-hiv globulin for passive immunization
US5599662A (en) * 1995-02-17 1997-02-04 Hoffmann-La Roche Inc. Oliconucleotide primers and probes for the detection of HIV-1
DE19513152A1 (de) 1995-04-07 1996-10-10 Bundesrep Deutschland Verwendung eines "Immundefizienzvirus-supprimierenden Lymphokins (ISL)" zur Hemmung der Virusvermehrung, insbesondere von Retroviren
GB9510272D0 (en) 1995-05-22 1995-07-19 Isis Innovation Retroviral vectors
GB9621679D0 (en) 1996-10-17 1996-12-11 Oxford Biomedica Ltd Improved retroviral vectors
GB9803351D0 (en) * 1998-02-17 1998-04-15 Oxford Biomedica Ltd Anti-viral vectors
US6958226B1 (en) * 1998-09-11 2005-10-25 The Children's Medical Center Corp. Packaging cells comprising codon-optimized gagpol sequences and lacking lentiviral accessory proteins
CA2360347C (en) * 1998-12-31 2013-05-07 Chiron Corporation Improved expression of hiv polypeptides and production of virus-like particles
EP1141314A2 (en) * 1998-12-31 2001-10-10 Chiron Corporation Polynucleotides encoding antigenic hiv type c polypeptides, polypeptides and uses thereof
EP1165798A2 (en) * 1999-03-29 2002-01-02 Statens Serum Institut Nucleotide construct with optimised codons for an hiv genetic vaccine based on a primary, early hiv isolate and synthetic envelope

Also Published As

Publication number Publication date
AU784635B2 (en) 2006-05-18
AP2002002508A0 (en) 2002-06-30
AP1674A (en) 2006-10-30
EP1240333B1 (de) 2008-04-09
CN101586106A (zh) 2009-11-25
DE50015096D1 (de) 2008-05-21
ATE391785T1 (de) 2008-04-15
ZA200204047B (en) 2002-12-20
US7332588B1 (en) 2008-02-19
DE10056747A1 (de) 2001-05-31
HK1046428A1 (en) 2003-01-10
US7323557B2 (en) 2008-01-29
AU2350401A (en) 2001-05-30
CA2391560A1 (en) 2001-05-25
WO2001036614A3 (de) 2002-02-28
WO2001036614A2 (de) 2001-05-25
BR0015607A (pt) 2002-07-30
EP1240333A2 (de) 2002-09-18
US20070003572A1 (en) 2007-01-04
ES2303513T3 (es) 2008-08-16
OA12156A (en) 2006-05-08
CN101586106B (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
US7323557B2 (en) Genome of the HIV-1 inter-subtype (C/B&#39;) and use thereof
US20130078276A1 (en) Vectors expressing hiv antigens and gm-csf and related methods of generating an immune response
JP2001512308A (ja) 合成hiv gag遺伝子
NO322261B1 (no) Polyenv-vaksiner mot HIV samt fremgangsmate for fremstilling av disse
JP2009082136A (ja) 抗原性b型hivポリペプチドおよび/または抗原性c型hivポリペプチドをコードするポリヌクレオチド、それらのポリペプチドおよびそれらの使用
JP2009039116A (ja) 抗原性c型hivポリペプチドをコードするポリヌクレオチド、ポリペプチドおよびそれらの使用
WO2006038908A2 (en) Ancestral and cot viral sequences, proteins and immunogenic compositions
JP2009254383A (ja) 抗原性b型hivポリペプチドをコードするポリヌクレオチド、そのポリペプチドおよびそれらの使用
US20090142373A1 (en) Immunizing Against HIV Infection
EP2021356B1 (en) Hiv vaccine
US20040115621A1 (en) Ancestral viruses and vaccines
CA2648086C (en) Methods and compositions for inducing an immune response to hiv and models for testing
WO2008118936A2 (en) Method of elicting immune response with a modified mva viral hiv-1 vector
EP0997529B1 (en) Feline immunodeficiency virus strain FIV-141 and uses thereof
US6521739B1 (en) Complete genome sequence of a simian immunodeficiency virus from a red-capped mangabey
US20040116684A1 (en) Ancestral viruses and vaccines
US20050220816A1 (en) Mutant viral nucleic acids and vaccine containing same
CZ276699A3 (cs) Syntetické GAG geny HIV

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: GENEART GMBH; APPLICANT

Free format text: FORMER OWNER: JEANATY APPLICATION BIOLOGICAL SCIENCE CO., LTD.; APPLICANT

Effective date: 20080328

Owner name: ZHEN NA TE STOCK COMPANY; APPLICANT

Free format text: FORMER OWNER: GENEART GMBH; APPLICANT

Effective date: 20080328

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20080328

Address after: Berg, Germany

Applicant after: GENEART AG

Co-applicant after: Shao Yiming

Address before: Berg, Germany

Applicant before: GENEART AG

Co-applicant before: Shao Yiming

Effective date of registration: 20080328

Address after: Berg, Germany

Applicant after: GENEART AG

Co-applicant after: Shao Yiming

Address before: Berg, Germany

Applicant before: GENEART GMBH GESSELLSCHAFT FUER ANGEWANDTE BIOTECHNOLOGIE

Co-applicant before: Shao Yiming

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication