CN1726285A - 用于抗hiv免疫的方法和组合物 - Google Patents

用于抗hiv免疫的方法和组合物 Download PDF

Info

Publication number
CN1726285A
CN1726285A CNA2003801060851A CN200380106085A CN1726285A CN 1726285 A CN1726285 A CN 1726285A CN A2003801060851 A CNA2003801060851 A CN A2003801060851A CN 200380106085 A CN200380106085 A CN 200380106085A CN 1726285 A CN1726285 A CN 1726285A
Authority
CN
China
Prior art keywords
hiv
nucleic acid
sequence
carrier
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003801060851A
Other languages
English (en)
Inventor
Y·黄
D·D·侯
Z·陈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aaron Diamond AIDS Research Center
Original Assignee
Aaron Diamond AIDS Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aaron Diamond AIDS Research Center filed Critical Aaron Diamond AIDS Research Center
Publication of CN1726285A publication Critical patent/CN1726285A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/21Retroviridae, e.g. equine infectious anemia virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/24011Poxviridae
    • C12N2710/24041Use of virus, viral particle or viral elements as a vector
    • C12N2710/24043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/24011Poxviridae
    • C12N2710/24111Orthopoxvirus, e.g. vaccinia virus, variola
    • C12N2710/24141Use of virus, viral particle or viral elements as a vector
    • C12N2710/24143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16311Human Immunodeficiency Virus, HIV concerning HIV regulatory proteins
    • C12N2740/16322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Communicable Diseases (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明涉及用于预防HIV感染的核酸和减毒痘苗病毒载体,以及在对HIV感染易感的受试者体内引发免疫应答的方法。本发明的预防性疫苗方案包括用包含两种新型DNA载体的接种物进行初次免疫,然后用表达相应HIV蛋白的修饰痘苗病毒Ankara(MVA)重组病毒载体进行加强免疫。

Description

用于抗HIV免疫的方法和组合物
相关申请的交叉引用
本申请要求于2002年10月18日申请的编号为60/419,465的美国临时申请的优先权。
所有前述申请,以及所有前述申请中引用的文件(“申请文件”)和申请文件中引用或参考的所有文件都通过引用结合到本文中。此外,本申请所引用的所有文件(“本文引用的文件”)和本文引用的文件中引用或参考的所有文件都通过引用结合到本文中。另外,在每个申请文件或本文引用的文件中所引用或提及的任何产品的制造商的说明书或产品目录都通过引用结合到本文中。通过引用结合到本文中的文件或其中任何描述都可用于本发明的实践。通过引用结合到本文中的文件并不承认是现有技术。
关于联邦资助研究下所作的本发明的权利声明
艾伦·戴蒙德爱滋病研究中心(Aaron Diamond AIDS ResearchCenter,ADARC)和国际爱滋病疫苗发起组织(International AIDSVaccine Initiative,IAVI)为本发明提供了研发基金,因此ADARC和IAVI在本发明中可享有一定的权利。
发明领域
本发明涉及用于治疗和预防人免疫缺陷病毒(HIV)感染的核酸和减毒痘苗病毒载体,以及在对HIV感染易感的受试者体内引发免疫应答的方法。本发明的治疗性和预防性疫苗方案包括用包含两种新型核酸载体的接种物进行初次免疫,然后用表达相应HIV蛋白的修饰痘苗病毒Ankara(MVA)重组病毒载体进行加强免疫。本发明的其它方面在以下发明内容中有描述或者是显而易见的,并且都包括本发明的范围之内。
发明背景
尽管经过20多年的努力抗争,但是全球HIV流行仍然持续不断地危害人类。面对这一前所未有的医学挑战,科学界在病毒学、免疫学和药学领域上已经取得了重大进展。尽管如此,已经异常艰难地证明了感染在全世界的扩散,以及在大多数感染者中预防疾病的发展。自流行开始,已有6500万人被感染。全球至今有超过4200万活着的HIV感染者,仅在2002年就有500万新增感染病例(AIDSepidemic update,December 2002.Joint UNAIDS/WHO)。自大流行开始,已有超过2500万人死于该病;仅在2002年就有300万人死于爱滋病(AIDS)。超过95%的新增HIV感染病例是发生在发展中国家,绝大多数感染是发生在撒哈拉非洲次大陆和东南亚。在接受抗逆转录病毒药物的感染者中,有5%的人因副作用而明显不耐受可用的药物,而另一部分人则携带抗药性病毒变异株。虽然公共卫生工作在某些地区有助于减缓HIV传播速率,但是对全球性难题来说,显而易见,保护性疫苗才是最令人满意的解决方案。
已鉴定出两种主要的HIV病毒,即HIV-1和HIV-2。HIV-1的3个亚型组已在全球扩散:M(主要亚型组,major)、O(外亚型组,outlying)和N(新亚型组,new)。其中M组占已报告HIV/AIDS病例的90%以上;在M组中,病毒包膜变化多样,使得该组被进一步划分成9个主要的基因亚型(包括A-D、F-H、J和K)以及多个循环重组型。病毒多样性看来是从撒哈拉非洲次大陆发散开来,在这里生活着的总共4000万人中超过2800万人被感染。另一类逆转录病毒即HIV-2,以前多在西非流行,但目前也已广泛流行。在非洲以外的地区已观察到散在病例,但该病毒看来致病性明显小于HIV-1。
HIV-1的一个特殊亚型看来已获得系统发生优势(phylogeneticdominance)。目前全球亚型C病毒占新增HIV-1感染的50%强。具体地讲,该基因亚型已在大部分撒哈拉非洲次大陆肆虐,并且目前已蔓延到印度支那(Beyrer,C.等,(2000)AIDS,14(1):75-83;Yu,X.F.,(2001)AIDS 15(4):523-5;Piyasirisilp,S.等,(2000)AIDS 74(23):11286-95)。通过印度和缅甸,亚型C在中华人民共和国找到立足点,据推测是在中国西南地区的静脉吸毒者(IVDU)之间进行传播。云南省的负担特别重,占全中国将近半数的HIV-1病例。根据云南省卫生厅,在该省的IVDU中HIV-1感染的感染率在2000年为29%,到2005年预期可达40.7%。云南5个县(文山、红河、德宏、临沧和大理)感染率最高,估计在50%至75%之间。HIV-1亚型C也波及邻省,例如四川和广西,并且也是遥远的新疆发生大量感染的原因。
DNA疫苗或基因免疫在疫苗学上是有希望的新策略。已知细胞介导免疫(CMI)是控制HIV-1复制的关键(Ogg等,(1998)Science 279:2103-6;Schmitz等,(1999)Science 283:857-60;Jin等,(1999)J.Exp.Med.189:991-8;McMichael等,(2001)Nature 410:980-7)。设计抗HIV-1疫苗的早期工作显示,蛋白/亚单位或灭活病毒等常规方法对逆转录病毒感染无效。也许作为从头表达的结果,DNA疫苗看来容许对产生CMI的更好的抗原呈递。在一项研究中,DNA疫苗对用病原性SHIV进行实验性攻击的恒河猴(rhesus macaque)产生至少部分保护性(Barouch等,(2000)Science 290:486-92)。然而,当在初次-加强方案中与重组载体联用时,证明DNA疫苗在刺激CMI和含有SHIV感染中甚至能更有效(Robinson等,(1999)Nat.Med.5:526-34;Hanke等,(1999)Vaccine 17:589-96;Hanke等,(1999)J.Virol.73:7524-32;Allen等,(2000)J.Immunol.164:4968-78;Amara等,(2001)Science 292:69-74;Barouch等,(2001)J.Virol.75:5151-8)。
普遍认为,按照HIV自身而设计的减毒活疫苗用于抗病毒,具有不可接受的风险。因此,在其它疫苗策略迄今未获成功的情况下,单用核酸或与减毒的非慢病毒加强联用的有效疫苗方案将提供显著的进步。
发明概述
迄今为止,安全而有效的治疗性和预防性抗HIV疫苗一直是一个重大挑战。传统疫苗方法已证明对HIV是无效或不安全的,然而,已经意想不到地显示,单独给予或者与减毒痘病毒联合用于加强给予抗HIV的核酸疫苗,在抗选定HIV抗原决定簇的免疫应答的刺激中是有效的。因此,本发明涉及用于治疗和预防HIV感染的核酸和减毒痘苗病毒载体,以及在对HIV感染易感的受试者体内引发免疫应答的组合物和方法。本发明的治疗性和预防性疫苗方案包括用含两种新型核酸载体的接种物进行初次免疫,然后用表达相应HIV蛋白的重组MVA进行加强免疫。
本发明的其它方面在以下发明内容中有描述或者是显而易见的,并且包括在本发明的范围之内。
本发明的第一方面提供核酸载体,所述载体包含至少一个有效连接启动子的HIV序列,并且该序列编码不能装配成病毒颗粒的蛋白。
另一方面,所述核酸载体包含至少两个HIV序列,其中所述HIV序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
本文所述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
启动子包含选自以下的异源启动子:原核启动子、真核启动子和病毒启动子。在一个实施方案中,所述真核启动子是人类真核起始因子-1α启动子,而所述核酸载体的病毒启动子是巨细胞病毒立即/早期启动子。
本发明也描述了位于HIV序列下游的转录终止序列在所述核酸载体中的用途。所述转录终止子可以是选自以下的聚腺苷酸化信号:牛生长激素聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。
本发明还描述了至少一个与异源前导序列有效连接的HIV序列。所述前导序列可以是组织纤溶酶原激活物(tPA)前导序列,但也可以包含酵母α-因子交配信息素前导序列、前胰岛素原前导序列和转化酶前导序列、免疫球蛋白A前导序列和卵白蛋白前导序列。
本发明的核酸载体包含与tPA前导序列有效连接的HIV Gag,使得病毒颗粒不能装配。在本发明的一个实施方案中,所述HIV序列选自SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13;SEQ ID NO:17;和SEQ ID NO:19。
本发明的核酸载体也包括在单细胞生物中指导核酸载体复制和扩增的复制起点。这些起点可以是但不限于colE1(pMB1)起点、2μ酵母起点、真核着丝粒区、真核自主复制序列、SV40起点和巨细胞病毒(CMV)起点。
本发明的核酸载体还包含选择性标记基因,所述基因可以是抗生素抗性基因。所述抗性基因可以是抗以下抗生素的基因:氨苄青霉素、四环素、卡那霉素、强力霉素、新霉素、潮霉素、博来霉素、零霉素(zeocin)、嘌呤霉素和氯霉素。
在本发明的另一方面,提供包含至少两个HIV序列的核酸载体,其中所述HIV序列分别与各自的启动子有效连接,并且编码不能装配成病毒颗粒的蛋白。此外,至少一个HIV序列与异源前导序列有效连接。所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。
本发明的核酸载体可以是病毒载体,例如修饰痘苗病毒Ankara(MVA)载体、ALVAC载体、NYVAC.1载体或NYVAC.2载体。所述病毒载体最好是MVA载体,所述MVA载体包含至少两个插入到MVA基因组缺失位点III的HIV序列,其中所述HIV序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
用于表达所述HIV序列的痘病毒启动子选自痘病毒7.5K启动子、疸病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中,所述启动子是不同的启动子。
另一方面使用核酸载体,所述载体是MVA载体,所述MVA载体包含至少两个插入到MVA基因组缺失位点III的HIV序列、至少一个插入到MVA基因组缺失位点II的HIV序列;并且其中所述HIV序列分别与各自的启动子有效连接。此外,这些HIV序列编码不能装配成病毒颗粒的蛋白。
本发明内容中描述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
本发明病毒载体中描述的启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、疸病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中,所述启动子是不同的启动子。
本发明的HIV序列还包含选自以下的异源前导序列:tPA前导序列、酵母α-因子交配信息素前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、β-珠蛋白前导序列和卵白蛋白前导序列。
在本发明的一个实施方案中,HIV序列SEQ ID NO:17和SEQ IDNO:19插入到MVA的缺失位点III,而SEQ ID NO:21插入到MVA的缺失位点II。
本发明也描述了一种核酸载体,所述载体包含选自以下的病毒载体:ALVAC、MVA、NYVAC.1和NYVAC.2。本发明的一个实施方案提供MVA载体,所述载体包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol,以及插入到MVA缺失位点II的tPA-nef-tat。
包含本文描述的核酸载体的组合物也包括在本发明内容中。在一个实施方案中,每个核酸载体包含不同的HIV序列。优选tPA-env和tPA-gag在第一核酸载体上,而tPA-nef-tat在第二核酸载体上。甚至更优选SEQ ID NO:7和SEQ ID NO:9在第一核酸载体上,而SEQ IDNO:11和SEQ ID NO:13在第二核酸载体上。
本发明的另一方面描述了一种组合物,其中tPA-env和tPA-gag在第一核酸载体上,而tPA-pol和tPA-nef-tat在第二核酸载体上。所述组合物还包含插入到MVA缺失位点III的tPA-δ V2 env和tPA-gag-pol以及插入到MVA缺失位点II的tPA-nef-tat。SEQ ID NO:7和SEQ ID NO:9最好是在第一核酸载体上,而SEQ ID NO:11和SEQ IDNO:13在第二核酸载体上。所述组合物还包含插入到MVA缺失位点II的SEQ ID NO:17和SEQ ID NO:19。
本发明还涉及药用组合物,所述组合物包含上述核酸载体,以及药学上可接受的载体、辅料或赋形剂。
此外,本发明涉及在对HIV相关疾病或病症易感的受试者体内引发免疫应答的方法。所述方法包括将本发明内容中描述的核酸载体、组合物和药用组合物给予所述受试者,从而引发抗HIV的免疫应答。
附图简述
以下详述仅作为实例,并不是将本发明限制在具体描述的实施方案中,可以结合附图来理解这些详述,所述详述通过引用结合到本文中。以非限制性实例的方式并参考以下附图来描述本发明的各种优选特征和实施方案,其中:
图1是pVAX1的示意图。
图2是pADVAX的示意图,所述载体是包括人延伸因子1α(hEF1α)作为第二启动子的修饰pVAX1载体。
图3柱状图,显示出当用市售的ELISA试剂盒定量测定HIV Gag(p24)时,在瞬时转染天然pVAX1、密码子最优化pADVAX和密码子最优化tPA pADVAX的293T细胞中gag基因表达。
图4是env在用以下DNA构建体转染的293T细胞中表达的蛋白质印迹:带有rev的天然gp160(A)、带有天然信号肽的最优化gp160(B)和带有tPA信号肽的最优化gp160。
图5是蛋白质印迹,显示由pADVAX双启动子-载体驱动的env和gag的表达。垂直箭头指示从ADVAXI的蛋白表达。
图6为ADVAX II制备的pol基因的修饰示意图,其中PR=蛋白酶,RT=逆转录酶,IN=整合酶。蛋白酶的缺失(DTGA)包含野生型基因的氨基酸25-28。逆转录酶的点突变(M→G)位于野生型基因的184位。对用pVAX1-tPA-突变型pol(A)和单独的pVAX1(B)转染的293T细胞的细胞裂解液进行蛋白质印迹。未切割的tPA-Pol为110kD。
图7是蛋白质印迹,显示用nef-tat转染的细胞培养上清液中表达的蛋白。
图8是蛋白质印迹,显示用tPA-nef-tat转染的细胞培养上清液中表达的蛋白。
图9显示用以下nef构建体转染的293T细胞表达I类MHC的流式细胞仪分析结果:单独的载体、nef、tPA-nef和tPA-nef-tat。
图10是ADVAXI和ADVAXII的示意图。
图11显示对来自Env和Gag的肽库的IFN-γ酶联免疫斑点测定的应答。肽是重叠10次的20-mers。每库含有12个肽,只是Gag A-I除外,后者代表先前在BALB/c小鼠中被鉴定为抗原特异性CD8+表位的特异性9-mer(AMGMLKDTI)(SEQ ID NO:2)。Env PI包含氨基酸24-144,Env P4包含氨基酸403-573,Gag P3包含氨基酸251-380,而Gag A-I包含氨基酸217-225。
图12显示用不同剂量的ADVAX I免疫的小鼠中Env-和Gag特异性IFN-γ酶联免疫斑点测定的应答。
图13显示,小鼠肌内接种不同的DNA疫苗后,在第0、3和6周,用血清抗Gag抗体进行ELISA分析。
图14显示针对来自Pol、Tat和Nef的肽库的IFN-γ酶联免疫斑点测定的应答。
图15显示用不同剂量的ADVAX II免疫的小鼠中Pol-和Nef-Tat特异性IFN-γ酶联免疫斑点测定的应答。
图16是蛋白质印迹,显示将nef基因引入MVA基因组的不同插入位点后HIV-1 nef的表达。
图17显示由293T细胞表达的DV2 Env介导与携带第一受体CD4和第二受体CCR5的HOS细胞的细胞融合。
图18是ADMVA的基因组图。
图19是示意图,显示从pLW7构建pZC1和pZC3。
图20显示,通过用抗Env抗体的免疫染色(左图)和蛋白质印迹分析(右图),重组env-gag-pol MVA的表达。
图21是示意图,显示从pLW22构建pZC22。
图22和图23显示,通过用抗Env抗体和抗Nef抗体的双重免疫染色,重组ADMVA表达Env和Nef。
图24是蛋白质印迹,显示所有5种插入在ADMVA中的基因。
图25显示用103-108ADMVA,HIV-1 Env的免疫染色。
图26显示用ADMVA感染人类细胞。
图27是柱状图,表示针对肽库中来自HIV-1 Env、Gag、Pol、Nef和Tat的肽的IFN-γ酶联免疫斑点测定的应答。
图28表示BALB/c小鼠中针对来自同源亚型C Env、Gag、Pol、Nef和Tat的肽或肽库的IFN-γ酶联免疫斑点测定的应答。
图29表示B6×B10小鼠中针对来自同源亚型C Env、Gag、Pol、Nef和Tat的肽或肽库的IFNγ酶联免疫斑点测定的应答。
图30显示用不同剂量ADMVA接种的BALB/c小鼠中Env特异性IFN-γ酶联免疫斑点测定的应答。
图31是柱状图,显示BALB/c小鼠中针对Gag和gp120蛋白的HIV-1特异性抗体反应。
图32显示BALB/c小鼠中针对gp120的HIV-1特异性抗体反应。
图33是柱状图,显示通过不同免疫途径接种ADMVA的BALB/c小鼠中Env特异性IFN-γ酶联免疫斑点测定的应答。
图34显示用不同剂量MVA接种的BALB/c小鼠中MVA特异性IFN-γ酶联免疫斑点测定的应答。
发明详述
本文所用的以下术语的含义如下。
术语“HIV感染相关疾病”或“HIV-1相关疾病”等,在本文中是指以HIV感染为特征的疾病状态。所述HIV感染相关疾病包括但不限于爱滋病、卡波西肉瘤(Kaposi′s sarcoma)、由卡氏肺囊虫(Pneumocystis carinii)和结核分枝杆菌(Mycobacterium tuberculosis)等引起的机会性感染;包括鹅口疮、毛状白斑和口疮性溃疡在内的口腔溃疡;全身淋巴结病;带状疱疹;血小板减少症;无菌性脑膜炎;神经病例如弓形虫病、隐球菌病、CMV感染、原发性CNS淋巴瘤和HIV相关性痴呆;周围神经病;癫痫;以及肌病。
“受试者”是脊椎动物,优选哺乳动物,更优选人类。哺乳动物包括但不限于人类、农场动物、运动动物和宠物。
对HIV感染或HIV相关病症或疾病“易感”的受试者是指在全部群体中对HIV感染风险更高的群体所属的受试者。
术语“免疫原性组合物”、“免疫组合物”和“疫苗”是指这样的免疫组合物:所述组合物含有引发局部或全身免疫应答的载体(或其表达产物)。所述应答可以具有、但并不一定具有保护性。同样,含有本发明重组体或载体(或其表达产物)的免疫原性组合物引发可以具有、但并不一定具有保护性的局部或全身免疫应答。疫苗组合物引发局部或全身保护性应答。因此,术语“免疫组合物”和“免疫原性组合物”包括“疫苗组合物”(因为前两个术语可以是保护性组合物)。本发明包括免疫组合物、免疫原性组合物或疫苗组合物。
术语“治疗有效剂量”是指能产生给药所需效果的剂量。准确剂量取决于治疗目的,可由本领域技术人员采用已知技术来确定(参见例如Lieberman(1992)Pharmaceutical Dosage Forms第1-3卷;Lloyd(1999)The Art,Science and Technology of PharmaceuticalCompounding;和Pickar(1999)Dosage Calculations)。就治疗有效量的本发明DNA疫苗而论,所述治疗有效量是在治疗个体HIV感染或AIDS中达到任何成功指标所需的剂量,包括任何客观或主观标准,例如HIV病毒抑制,HIV感染和AIDS相关症状的减少,或患者身体或精神上良好状态的改善。
“载体”是允许或促进一个实体从一个环境转移到另一个环境的工具(参见″The Development of Human Gene Therapy″T.Friedmann主编,1999,Cold Spring Harbor Press)。例如,一些用于重组DNA技术的载体允许实体(例如一段DNA(例如一个异源转基因))转移到靶细胞中。一旦在靶细胞中,所述载体任选起到将其转基因保留在胞内的作用,或者可作为DNA复制单位起作用。用于重组DNA技术的载体的实例包括质粒、染色体、人工染色体或病毒。本发明的载体可以通过非病毒载体(质粒)或病毒载体转移到靶位点。
当抗原和抗体特异性结合/反应时,本文所用的抗原或抗原决定簇(例如HIV的基因产物),对抗该抗原而产生的抗体来说是“有活性”的。
术语“宿主细胞”是指其中引入了重组DNA分子的一种或多种细胞。本发明的宿主细胞包括但不限于细菌细胞、酵母细胞、动物细胞、昆虫细胞和植物细胞。宿主细胞可以是单细胞,或者可以在液体培养基的组织培养物中生长的单层细胞等。宿主细胞也可以直接或间接来源于组织。
当核酸从胞外环境转移到细胞中时,该宿主细胞被所述核酸“转化”。任何将核酸转移到细胞中的方法均可采用;除非另有说明,该术语并不特指任何将核酸转移到细胞中的具体方法,也不特指任何待转移的具体细胞类型。本领域使用的另一术语是“转染”。非病毒传递系统包括但不限于DNA转染方法。在此,转染包括采用非病毒载体将基因传递给真核靶细胞(例如哺乳动物细胞)的方法。典型转染方法包括DNA直接注射、电穿孔、DNA生物射弹(biolistics)、脂质介导转染、紧密DNA介导转染、脂质体、免疫脂质体、脂转染、阳离子试剂介导转染、阳离子两亲性表面活性剂(CFA)(NatureBiotechnology 1996 14;556)和它们的组合。
“表达控制序列”是调节基因表达(即转录、RNA形成和/或翻译)的核酸序列。表达控制序列可以是不同的,取决于例如所选宿主细胞或生物体(例如原核细胞宿主和和真核宿主)、转录单位的类型(例如其中RNA聚合酶必须识别该序列)、该基因在其中能正常表达的细胞类型(换句话说,生物因子在该细胞类型中正常出现)。
“启动子”就是一个这样的表达控制序列,在本文中是指一组控制、调节和/或指导下游(3′)核酸序列转录的核酸序列。本文所用的启动子包括靠近转录起始位点的必需核酸序列,例如在聚合酶II类启动子的情况下,是TATA元件。
术语“有效连接”是指核酸表达控制序列(诸如启动子或一组转录因子结合位点)和第二核酸序列之间的功能性连接,其中所述表达控制序列指导对应于第二序列的核酸转录。
术语“重组体”当在本文中用于核酸或蛋白部分时,是指核酸包含2个或多个亚序列,而在自然界没有发现同样的相互关系。例如,重组产生的核酸通常具有来自不同基因或相同基因非邻近区的2个或多个序列,经人工排列而产生编码新蛋白的新核酸序列。本文所用的术语“重组”是指通过本领域技术人员已知的标准技术产生重组蛋白或重组核酸的方法,所述方法描述于例如Sambrook等,Molecular Cloning;A Laboratory Manual,第2版(1989)。
在本申请中的术语“异源”是指与其有效连接的核酸分子正常情况下两者并不相连的元件,例如质粒载体的组分(例如启动子、前导序列)。
在本发明公开内容中,“包含”、“含有”和“具有”等全都具备美国专利法中规定的含义,并且可以表示“包括”等;“基本上由......组成”或“基本组成为”同样具备美国专利法中规定的含义;该术语是开放式的,即允许存在未指出的含义,只要基本特性或者新的特性并不因所指出的含义而改变即可,但并不包括现有技术实施方案。
本发明的第一方面提供核酸载体,所述载体包含至少一个有效连接启动子的HIV序列,该序列编码不能装配成病毒颗粒的蛋白。
另一方面,所述核酸载体包含至少两个HIV序列,这些HIV序列分别与各自的启动子有效连接,并且这些序列编码不能装配成病毒颗粒的蛋白。
本文描述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
所述启动子包括选自以下的异源启动子:原核启动子、真核启动子和病毒启动子。在一个实施方案中,所述真核启动子是人类真核起始因子-1α启动子,而核酸载体的病毒启动子是巨细胞病毒立即/早期启动子。
本发明也描述了位于HIV序列下游的转录终止序列在所述核酸载体中的应用。所述转录终止子可以是选自以下的聚腺苷酸化信号:牛生长激素聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。
本发明还描述了至少一个有效连接异源前导序列的HIV序列。所述前导序列可以是组织纤溶酶原激活物(tPA)前导序列,此外也可包含酵母α-因子交配信息素前导序列、前胰岛素原前导序列和转化酶前导序列、免疫球蛋白A前导序列和卵白蛋白前导序列。
本发明的核酸载体包含有效连接tPA前导序列的HIV Gag,以使病毒颗粒不能装配。在本发明的一个实施方案中,所述HIV序列选自本文提供的以下序列:SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13;SEQ ID NO:17;和SEQ ID NO:19。
本发明的核酸载体也包括在单细胞生物中指导核酸载体复制和扩增的复制起点。这些起点可以是但不限于colE1(pMB1)起点、2μ酵母起点、真核着丝粒起点、真核自主复制序列、SV40起点和巨细胞病毒(CMV)起点。
本发明的核酸载体还包含选择性标记基因,所述基因可以是抗生素抗性基因。所述抗性基因可以是抗以下抗生素的基因:氨苄青霉素、四环素、卡那霉素、强力霉素、新霉素、潮霉素、博来霉素、零霉素、嘌呤霉素、氯霉素。
本发明的另一方面提供核酸载体,所述载体包含至少两个HIV序列,其中所述HIV序列分别与各自的启动子有效连接,并且编码不能装配成病毒颗粒的蛋白。此外,至少一个HIV序列与异源前导序列有效连接。所述载体任选还包含下游转录终止子、复制起点和选择性标记基因。
本发明的核酸载体可以是病毒载体,例如修饰痘苗病毒Ankara(MVA)载体、ALVAC载体、NYVAC.1载体或NYVAC.2载体。所述病毒载体最好是包含至少两个插入到MVA基因组缺失位点III的HIV序列的MVA载体,其中所述HIV序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
用于表达所述HIV序列的疸病毒启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中,所述启动子是不同的启动子。
另一方面利用核酸载体,所述载体是MVA载体,所述载体包含至少两个插入到MVA基因组缺失位点III的HIV序列,至少一个插入到MVA基因组缺失位点II的HIV序列,且其中所述HIV序列分别与各自的启动子有效连接。此外,这些HIV序列编码不能装配成病毒颗粒的蛋白。
本发明内容中描述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
本发明病毒载体中描述的启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中,所述启动子是不同的启动子。
本发明的HIV序列还包含选自以下的异源前导序列:tPA前导序列、酵母α-因子交配信息素前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、β-珠蛋白前导序列和卵白蛋白前导序列。
在本发明的一个实施方案中,HIV序列SEQ ID NO:17和SEQ IDNO:19插入到MVA的缺失位点III,而HIV序列SEQ ID NO:21插入到MVA的缺失位点II。
本发明还描述了一种核酸载体,所述载体包含选自以下的病毒载体:ALVAC、MVA、NYVAC.1和NYVAC.2。本发明的一个实施方案提供MVA载体,所述载体包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol,以及插入到MVA缺失位点II的tPA-nef-tat。
本发明内容中也包括组合物,所述组合物包含本文描述的任何核酸载体。在一个实施方案中,每个核酸载体包含不同的HIV序列。优选tPA-env和tPA-gag在第一核酸载体上,而tPA-nef-tat在第二核酸载体上。甚至更优选SEQ ID NO:7和SEQ ID NO:9在第一核酸载体上,而SEQ ID NO:11和SEQ ID NO:13在第二核酸载体上。
本发明的另一方面描述了一种组合物,其中tPA-env和tPA-gag在第一核酸载体上,而tPA-pol和tPA-nef-tat在第二核酸载体上。所述组合物还包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol,以及插入到MVA缺失位点II的tPA-nef-tat。优选SEQ IDNO:7和SEQ ID NO:9在第一核酸载体上,而SEQ ID NO:11和SEQ IDNO:13在第二核酸载体上。所述组合物还包含插入到MVA缺失位点II的SEQ ID NO:17和SEQ ID NO:19。
本发明还涉及药用组合物,所述组合物包含上述核酸载体,以及药学上可接受的载体、辅料或赋形剂。
此外,本发明涉及在对HIV相关疾病或病症易感的受试者体内引发免疫应答的方法。所述方法包括将本发明内容中描述的核酸载体、组合物和药用组合物给予所述受试者,从而引发抗HIV的免疫应答。
可以利用各种各样的核酸载体,以携带用于本发明组合物和疫苗的HIV核酸序列。对于本领域技术人员来说,显然,本发明的核酸载体必须具有高容量产生的能力,并且同时还必须在目标宿主中能够表达。因此,核酸载体可含有允许在单细胞宿主(例如细菌或酵母)中表达和扩增的序列。有用的表达载体包括但不限于pVAX1、pGEM、pSP72、pcDNA和其它市售的克隆载体。
设计作为疫苗组合物并可在细菌中扩增的核酸必须进行进一步纯化,以便去除可引起感染、炎症和疾病的细菌细胞壁组分。这些“内毒素”也称为“脂多糖”或“LPS”。可通过本领域已知的过滤方法去除内毒素。质粒载体扩增的替代方法是使用酵母,例如酿酒酵母(Saccharomyces cerevisiae)。
另外,在下文中也可与同义词“启动子”交替使用的各种表达控制序列,可用于核酸载体,以表达用于本发明组合物和方法的HIV序列。在选择表达控制序列时,也会考虑各种因素。这些因素包括例如启动子序列的相对强度、其控制能力及其与本发明所述肽的DNA序列的相容性,特别是与潜在二级结构的相容性。所述有用的表达控制序列包括异源表达控制序列,例如原核启动子、真核启动子和病毒启动子。
有用的病毒启动子的实例包括例如SV40早期和晚期启动子、巨细胞病毒启动子、牛乳头瘤病毒启动子、巨细胞病毒启动子、包括慢病毒在内的逆转录病毒启动子、腺伴随病毒启动子和腺病毒启动子、T3启动子和T7启动子、λ噬菌体主要操纵子(major operator)和启动子区、fd外壳蛋白的控制区。也可使用原核启动子,例如但不限于 lac系统、 trp系统、TAC系统或TRC系统。可有利地用于表达本发明核酸载体中的HIV序列的真核启动子包括但不限于人类真核起始因子1启动子、3-磷酸甘油酸激酶启动子、乙醇脱氢酶启动子、丙酮酸激酶启动子或其它糖酵解酶的启动子、酸性磷酸酶启动子例如Pho5、α-肌动蛋白启动子和β-肌动蛋白启动子、以及已知控制原核细胞或真核细胞或它们的病毒的基因表达的其它组成型和诱导型启动子序列,以及它们的各种组合。
人们知道,并不是所有载体和启动子在本文提到的核酸和组合物中都能同样好的起到表达所述HIV序列的作用。然而,本领域技术人员可以不需要进行过多实验、也不偏离本发明范围,在这些载体、启动子和宿主中进行选择。例如,在选择载体时,必须考虑其宿主,因为所述载体必须在其中进行复制。也应考虑该载体的拷贝数、控制拷贝数的能力、控制整合的能力、增强子序列的存在和使用(如果有的话),以及该载体所编码的其它蛋白(例如抗生素标记或其它选择标记)的表达。
HIV序列的最佳表达也得益于插入序列3’端所添加的转录终止序列。转录终止子在生物体中各不相同,可包含核酸序列,所述序列可在体内有利地形成二级结构,例如茎-环结构。在这种情况下,终止取决于RNA产物,而不单由转录过程中DNA序列来确定。众所周知的原核终止机制包括内部终止,其中在缺乏任何其它因子时,所述RNA聚合酶核心酶可在某位点终止。另一个已表征的终止机制取决于原核生物的Rho因子,即一种46kD的蛋白,该蛋白与RNA聚合酶从相关RNA链的脱离密切相关。其它转录终止子都是本领域众所周知的,包括聚腺苷酸化信号,例如牛生长激素聚腺苷酸化信号和病毒聚腺苷酸化信号,例如来自痘苗病毒和猿猴病毒40的病毒聚腺苷酸化信号。聚腺苷酸化后,在下游的相对位点上常发生转录终止,所述位点在大多数真核mRNA的3’端。聚腺苷酸化是无需模板的50-200nt的聚腺苷酸链(polyA)的插入。切割必须先于聚腺苷酸化。这些聚腺苷酸化信号常包含序列AAUAAA,所述序列当缺失或突变时,阻止聚腺苷酸化mRNA的产生。
前导序列定义为在核酸(DNA和RNA)或蛋白一端的序列,所述序列必须被切掉,以容许成熟分子的专一性功能。前导序列在特定细胞区室中指导蛋白的定位。前导序列的一个类似的术语是“信号序列”。对于ER中驻留的蛋白和欲进入溶酶体或过氧化物酶体的蛋白来说,信号序列指导它们返回它们各自的细胞区室中。膜蛋白和欲分泌的蛋白也需要信号序列,其中指导所述蛋白进入通向质膜、胞外空间或通过内体分选的特定的分泌途径。信号序列没有显示出序列保守性。信号序列通常在N-端的10个氨基酸内开始。它们的长度在20个和30个残基之间,特征是中心为约10-15(但不小于6)个残基的疏水核心,以亮氨酸或丙氨酸为优先选择。它们通过极性残基带正电荷序列段邻接N-端一侧,并通过中性的极性残基邻接C-端区。它们明显能耐受氨基酸取代,只要它们的中心疏水特征能保留。在本发明的一个实施方案中,组织纤溶酶原激活物有利地用于指导翻译的HIV序列进入分泌途径,这不同于天然HIV蛋白,使得病毒颗粒不能产生。前导序列的其它实例包括酵母α-因子交配信息素前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、β-珠蛋白前导序列和卵白蛋白前导序列。
选择性标记可用于分析目标宿主或宿主细胞中核酸载体的存在与否。常用的选择性标记包括当表达时导致宿主抗生素抗性的基因。所述基因赋予各种抗生素抗性,例如但不限于氨苄青霉素、四环素、强力霉素、卡那霉素、新霉素、博来霉素、嘌呤霉素、零霉素、潮霉素、氯霉素。也可使用报道基因,来监测载体的表达(例如lacZ基因产物),但是这并不推荐采用,因为本领域常用的报道基因编码外源蛋白,当给予受试者时,所述蛋白能刺激不需要的或无法预料的免疫应答。
同样,在其中不需要抗生素抗性的某些环境下(例如当目的是高收率地产生用于临床给药的纯的生物制品时),抗生素的使用会产生三大问题。首先,在高密度培养条件(例如高生物量或连续培养)下选择压力的丧失会导致抗生素降解或失活,结果导致产品收率下降。其次,产物不可避免地污染残留的抗生素,在某些情况下,这会增加免疫致敏的危险性,甚至在受试者体内产生过敏反应。最后,还存在着基因转移后抗药性传播到环境生物(具体来说是病原体)的风险。一个阻抑蛋白滴定系统,可有利地用于在原核宿主中扩增核酸产物,而无需存在抗生素抗性基因;所述系统的方法通过引用结合到本文中(Williams,S.G.等,(1998)Nucleic Acids Res.26(9):2120-2124;美国专利第5,972,708号)。
通过采用比染色体基因组过量的质粒分子,来竞争性结合来自宿主选择性基因的阻抑蛋白,可以选择含有所述质粒的细胞。换句话说,所述系统使用质粒分子本身来激活选择。这需要1)宿主菌株含有编码细胞存活或生长必需产物的染色体基因,2)基因被阻抑蛋白例如λ阻抑蛋白负调节,3)胞内阻抑蛋白浓度刚好足以达到阻抑所述基因,4)质粒合有该阻抑蛋白的结合位点,和5)每个细胞中质粒拷贝数足以达到阻抑蛋白滴定。
复制起点定义为在其中发现复制起始位点的DNA上的位置。在质粒产生的起始序列的情况下,起点是DNA序列,所述序列当加入到非复制的DNA中时能使之复制。起点也可以描述为DNA序列,所述序列在体外是酶复合物的结合靶位,已知所述酶复合物的功能是启动DNA复制。通常使用的起点是colE1(pMB1)起点、酵母2μ起点、真核自主复制序列(ARS)、真核着丝粒序列、SV40起点、CMV起点。
病毒传递系统包括但不限于腺病毒载体、腺伴随病毒(AAV)载体、疱疹病毒载体、逆转录病毒载体或慢病毒载体。载体的其它实例包括离体传递系统,其中包括但不限于DNA转染方法,例如电穿孔、DNA生物射弹、脂质介导的转染、紧密DNA介导的转染。在一个优选的实施方案中,痘病毒载体用于传递核酸。更优选所用的疸病毒载体是修饰痘苗病毒Ankara病毒载体,所述载体以下还将进一步讨论。
目前,痘苗病毒作为用于在哺乳动物细胞的细胞质内表达基因的唯一的活载体(Hu,S.L.等,(1986)Nature 320:537-40;Moss,B.等,(1996)Adv.Exp.Med.Biol.397:7-13;Sutter,G.和B.Moss.(1992)Proc.Natl.Acad.Sci.USA 89:10847-51)。痘苗病毒在本领域已有充分的描述,可参见美国专利号6,340,462;5,972,597;5,942,235;5,225,336;5,204,243;5,155,020;5,110,587;4,769,330;4,722,848;和4,603,112。作为科学工具,重组痘苗病毒已用于研究抗具体的感染性疾病(包括爱滋病)的保护所需的免疫应答类型(Girard,M.(1990)Cancer Detect.Prev.14:411-3;Haynes,B.F.(1996)Lancet 348:933-7;Moss,B.(1996)Proc.Natl.Acad.Sci.USA 93:11341-8)。因为痘苗病毒感染人类,所以使用活痘苗病毒载体的主要担心的是其安全性。常规痘苗病毒不能用于无免疫应答的患者,例如患有HIV、血液恶性肿瘤的患者,或者是经历化疗的患者(Mayr,A.和K.Danner,(1978)Dev Biol Stand41:225-34)。因此,已经开发出几株高度减毒的痘苗病毒株,用作天花疫苗(Paoletti(1996)Proc.Natl.Acad.Sci.USA 93:11349-53)(Moss,B.等,(1996)Adv.Exp.Med.Biol.397:7-13;Sutter,G.和B.Moss.(1992)Proc.Natl.Acad.Sci.USA 89:10847-51;Blanchard,T.J.等,(1998)JGen Virol 79:1159-67;Paoletti,E.(1996)Proc Natl Acad Sci USA 93:11349-53)。尽管这些减毒病毒不再需要用于抗天花的免疫,但是它们早就用于人类,提供了严格的安全信息,以指导对用于爱滋病疫苗开发的合适毒株的选择。
三种高度减毒而有效的基于痘病毒的载体,包括NYVAC(美国专利号6,596,279;5,762,938;5,494,807;5,453,364;5,378,457;364,773,金丝雀痘病毒(Canarypox)(ALVAC;美国专利号5,863,542;5,766,598;5,756,103)和修饰痘苗病毒Ankara(MVA),可用于人用和兽用重组疫苗的定向应用中(Moss等,(1996)Adv.Exp.Med.Biol.397:7-13)。MVA的应用描述于美国专利第5,185,146号。最好是使用宿主范围有局限性的、并且只能在幼仓鼠肾细胞(BHK)和鸡胚成纤维细胞(CEF)中复制的正痘病毒或禽痘病毒。美国专利第5,494,807号公开了ALVAC和NYVAC两者在特定宿主中复制能力的差异。具体地讲,MVA已用于超过12万人初次接种的大规模疫苗试验和临床实践。没有与其应用相关的副作用,甚至当高危患者接受初次接种时也是如此(Mayr等,(1978)ZBL Bakt Hyg.I Abt.Orig.B 167:375-90)。MVA是宿主范围局限性痘苗病毒株(Sutter,G.和B.Moss,(1995)Dev Biol Stand 84:195-200;Wyatt,L.S.等,(1998)Virology 251:334-42)。所述MVA株在鸡胚成纤维细胞(CEF)中已经传代超过570次,并且已经失去其在大多数哺乳动物细胞系中的复制能力,因为与WR痘苗病毒株相比,其基因组合有6个大缺失(Altenburger等,(1989)Arch.Virol.105:15-27;Meyer等,(1991)J.Gen.Virol,71-1031-8;Mayr,A.,(1978)Zentralbl Bakteriol[B]167:375-90;Meyer,H.等,(1991)J GenVirol 72:1031-8;Stickl,H.等,(1974)Dtsch Med Wochenschr 99:2386-92)。这些缺失位于病毒基因组两端附近。值得注意的是,一个缺失影响55K以及32K人类宿主范围基因。进一步分析表明,约三分之二的宿主范围基因的缺失部分造成病毒的减毒。MVA株在禽类细胞中生长良好,但是在人类和大多数所试验的其它哺乳动物细胞中不能繁殖。尽管如此,MVA DNA的复制看来是正常的,而且在人类细胞中合成了早期和晚期病毒蛋白(Sutter等,(1992)Proc.Natl.Acad.Sci.USA 89:10847-51;Sutter,G.和B.Moss.(1992)Proc Natl Acad SciUSA 89:10847-51;Sutter,G.等,(1994).Vaccine 12:1032-40)。因为重组基因表达在非容许人类细胞中未受破坏,所以MVA仍可作为高效且特别安全的载体(Moss,B.等,(1996)Adv Exp Med Biol 397:7-13)。重要的是,在对付天花的战役中,MVA株已用于对超过12万人进行初次接种的大规模疫苗试验和临床实践。没有与其应用相关的副作用,甚至当免疫抑制恒河猴(macaque)或患者接受初次接种时也是如此(Mayr,A.等,(1978)Zentralbl Bakteriol[B]167:375-90;Hochstein-Mintzel,V.等,(1972)Z Immunitatsforsch Exp Klin Immunol 144:104-56;Stittelaar,K.J.等,(2001)Vaccine 19:3700-9)。
已经证明,高度减毒和复制缺陷型重组MVA的免疫原性和保护功效比许多常规痘苗病毒(VV)强。采用感染复数(MOI)≥1,高度减毒株MVA是诱导显著量的IFN α/β的VV的唯一代表,IFN α/β起到抗病毒效应。来自5种众所周知的常规VV株以及中国VV天坛株(VVTT)用作重组疫苗的复制型病毒不能诱导白细胞的IFN(IFNα;Buttner,M.等,(1995)Vet.Immunol.46:237-50)。在小动物中,表达HA-NP基因的重组MVA株不仅诱导血清IgG抗体、粘膜IgA抗体和强烈的CTL应答,而且保护免疫小鼠免受流感病毒攻击而造成的肺部感染,甚至当口服免疫后(Bender,B.S.等,(1996)J.Virol.70:6418-24)。最重要的是,用SIV/SHIV重组MVA免疫的恒河猴比用SIV重组NYCBH-VV免疫的恒河猴来说更会成为长期无进展者(non-progressors)(Hirsch,V.M.等,(1996)70:3741-52;Amara,R.R.等,(2001)Science 292:69-74)。这些恒河猴,就象感染HIV的人类长期无进展者一样,最初具有低水平的血浆病毒血症,然后是病毒复制的持续性限制,这与正常淋巴细胞亚组和完整的淋巴样结构的维持有关。这些结果,与先前的MVA在人类的安全性数据一起,表明重组MVA用于人类爱滋病预防性接种的潜在用途。目前,尚没有构建HIV重组MVA或者用于人类HIV-1免疫接种。
多基因重组ADMVA是设计作为同源加强剂,对应于用于HIV-1亚型C初次免疫的质粒DNA。该构建体编码HIV-1结构基因(env、gag、pol)和调节基因(nef、tat)。在我们的疫苗中使用的基因来自基因亚型C株(循环重组型007或HIVCHN·AD,其也含有基因亚型B的片段),该株在云南省是优势亚型。其它HIV基因亚型也可在本发明的核酸和病毒载体中被有利地取代,无需进行过多实验。
当采用痘苗病毒作为基因转移或基因表达的载体时,痘苗病毒启动子是必要的,因为所述病毒在感染细胞的细胞质中复制。因为这一特征,所述病毒编码其自身的复制和转录机,所述机器特异性识别痘苗病毒启动子。与之相反,其它病毒利用宿主自身的机制来进行复制、转录和用于病毒繁殖的其它过程。在MVA载体中可有利地使用的启动子包括但不限于7.5K启动子、11K启动子、40K启动子、H5启动子、I3启动子、SYN(合成)启动子和合成早期/晚期启动子(sE/L)(Moss等,Biotechniques)。
MVA通过在鸡胚成纤维细胞中超过570次连续传代而实现减毒。对MVA基因组的分析表明,减毒可以归功于大片段的缺失,所述缺失大多是在被认为是非必需基因的区域。在MVA中,有6个大的自然发生的缺失,称之为缺失I-VI。推测这些缺失位点含有非必需基因,因此提供异源基因的插入位点。使用缺失位点I-VI的任何一个,可产生效果并增强目的基因表达。另外,非必需胸苷激酶基因也提供另一个位点,在该位点可以插入外源基因。优选的实施方案使用缺失位点III。缺失位点II也可单独使用,或者与缺失位点III一起使用。
同样,其它减毒痘病毒具有含工程化缺失的基因组区,所述缺失可以是或不是必需的。美国专利第5,766,882号描述了一种缺陷型痘病毒,使之缺乏其亲本痘病毒的必需区所赋予的功能。减毒NYVAC载体描述了基因组的类似区域,其中胸苷激酶基因、出血区、A型包涵体区、血凝素基因、宿主范围基因区和大亚基、核糖核苷酸还原酶已从中缺失(美国专利第5,364,773号)。此外,NYVAC载体可额外包含产生干扰素的基因的缺失,因此增加了在目标宿主中的安全性。
有2种用于制备重组MVA的基本方法,即同源重组和体外连接。同源重组是最早用于制备重组MVA的方法,并且仍然是最广泛使用的方法(参见美国专利第4,769,330号)。用转移质粒来转染细胞以及用病毒来感染细胞,所述质粒含有处于痘苗病毒启动子控制之下的重组基因,该启动子邻接来自痘苗病毒的几百个碱基对的DNA。重组发生在转移质粒和病毒基因组的同源序列之间。各种方法均可用于分离重组MVA,这些方法包括:根据溴脱氧尿苷或抗生素抗性进行选择、对表达显色标记的报道基因进行检测、宿主范围的补充或小噬斑表型(参见例如美国专利第5,155,020号),以及噬斑的直接抗体染色或DNA杂交。选择性标记的稳定整合阻碍其在第二基因选择上的应用;另外,在用于受试者的重组MVA中不希望存在额外的遗传物质。已经开发了如下方案:其中整合了抗生素抗性基因或颜色标记基因,并且其后通过重组而自发缺失;所述方案包括多轮噬斑纯化(Chakrabarti,S.等,(1985)Mol.Cell.Biol.5(12):3403-9)。
外源基因与MVA基因组的体外连接也为同源重组提供了替代方法(参见美国专利第6,265,183;5,866,383;5,445,953号)。因为MVADNA不具有感染性,所以用MVA DNA来转染细胞,以及用宿主限制性辅助病毒、条件致死病毒或其它缺陷病毒来感染细胞(美国专利第5,204,243号)。这些技术有效地容许相当大的DNA片段或者甚至将DNA片段文库直接插入到痘苗病毒基因组中。已经使用启动子和唯一限制位点来构建重组VV基因组,以便进行克隆和表达(Pfleiderer,M.等,(1995)J.Gen.Virol.76(Pt.12):2957-62;Merchlinsky,M.和B.Moss(1992)Virology 190(1):522-6)。
人免疫缺陷病毒是一种逆转录病毒,逆转录病毒有许多种类。逆转录病毒的一些实例包括但不限于:鼠白血病病毒(MLV)、人免疫缺陷病毒(HIV)、马传染性贫血病毒(EIAV)、小鼠乳腺瘤病毒(MMTV)、劳斯肉瘤病毒(RSV)、弗吉纳米肉瘤病毒(Fujinami sarcomavirus,FuSV)、莫洛尼鼠类白血病病毒(Mo-MLV)、FBR鼠类骨肉瘤病毒(FBR MSV)、莫洛尼鼠类肉瘤病毒(Mo-MSV)、艾贝尔逊鼠类白血病病毒(Abelson murine leukemia virus,A-MLV)、禽类成髓细胞瘤病毒-29(MC29)和禽类成红细胞增生病毒(AEV)以及包括慢病毒属在内的所有其它逆转录病毒科。逆转录病毒的详细一览表可在Coffin等(″Retrovirus″1997 Cold Spring Harbour Laboratory Press:JM Coffin,SM Hughes,HE Varmus主编,第758-763页)中找到。
逆转录病毒一般分为2大类,即“单纯型”和“复合型”。逆转录病毒还可再细分为7组。其中5组代表致癌的逆转录病毒。余下2组是慢病毒和泡沫病毒。有关这些逆转录病毒的综述可参见Coffin等,1997(同上)。慢病毒家族与其它类型逆转录病毒之间的区别在于:慢病毒具有既感染分裂细胞又感染非分裂细胞的能力(Lewis,P.等,(1992)EMBO J.11:3053-3058;Lewis,P、F、和M.Emerman(1994)J.Virol.68:510-516)。与之相反,其它逆转录病毒,例如MLV,不能感染已分化细胞等非分裂细胞,例如肌肉、脑、肺和肝组织。HIV属于“慢病毒”类。在本申请中,可有利地使用其它慢病毒序列,例如FIV、SIV、EIAV等。
本领域可以找到某些慢病毒的基因组结构详述。有关HIV基因组的详述在NCBI Genbank数据库(即Genome检索号AF033819;SEQD NO:23-41)中可以找到。HIV逆转录病毒基因组包含gag基因、pol基因和env基因,这些基因编码病毒体的蛋白和酶。这些基因的两端邻接被称为长末端重复序列(LTR)的区域。LTR负责原病毒的整合和转录。它们也起到增强子-启动子序列的作用。换句话说,LTR可以控制病毒基因的表达。逆转录病毒RNA的脱衣壳是通过位于病毒基因组5’端的ψ序列来进行。
LTR本身是相同的序列,可分为三个元件,称之为U3、R和U5。U3来自只有该RNA的3’端才有的独特序列。R来自该RNA两端的重复序列,而U5来自只有该RNA的5’端才有的独特序列。这三个元件的大小在不同的逆转录病毒中变化很大。对于病毒基因组,转录起始位点在左侧LTR的U3和R间的边界上,而聚腺苷酸附加序列位点(终止位点)在右侧LTR R和U5间的边界上。U3含有绝大多数原病毒转录控制元件,其中包括对细胞转录活化蛋白起反应的启动子和多个增强子序列,在某些情况下包括对病毒转录活化蛋白起反应的启动子和多个增强子序列。
对于结构基因gag、pol和env本身来说,gag编码病毒内部结构蛋白。Gag蛋白被蛋白酶水解而加工成成熟蛋白MA(基质)、CA(衣壳)和NC(核衣壳)。pol基因编码逆转录酶(RT),所述酶含有与RNA酶H和整合酶(IN)相关的DNA聚合酶,该酶介导基因组的复制。env基因编码病毒体的表面(SU)糖蛋白和跨膜(TM)蛋白,所述蛋白形成与细胞受体蛋白特异性相互作用的复合体。所述相互作用通过病毒膜与细胞膜的融合而最终导致感染。
gag、pol和env的共表达,结果形成感染性的病毒颗粒。对于制备免疫原性组合物和疫苗的目的来说,感染性病毒颗粒的形成将导致危险和不可接受的风险局面。尽管所述基因各自的突变(例如在pol特异区的突变)引起病毒感染性的失活,然而,仍然会发生病毒颗粒的形成。本发明提供HIV序列的表达,其中所述序列编码不能装配成感染性或非感染性病毒颗粒的蛋白。用于本文目的的蛋白表达,其作用是诱导免疫应答。对于在有需要的受试者体内引发免疫应答来说,所述蛋白的活性、或者甚至是全长蛋白的存在,通常并不是必需的。先前已经描述了包含HIV序列的质粒。美国专利第5,665,577号描述了HIV序列,所述序列可以在质粒载体中表达,但是该序列编码的蛋白形成的病毒体却没有足够的HIV RNA,以产生有复制能力的HIV病毒体。美国专利第6,451,304号描述了用于制备不能复制的逆转录病毒载体的方法,所述方法包括用第一原病毒质粒、第二原病毒质粒和第三构建体来转染细胞;所述第一原病毒质粒编码gag,但不编码pol或包膜蛋白;第二原病毒质粒编码pol,但不编码gag或包膜蛋白;而第三构建体编码单独的包膜蛋白。
HIV也含有除编码gag、pol和env蛋白之外的额外基因。HIV中的额外基因是vif、vpr、vpx、vpu、tat、rev和nef。额外基因编码的蛋白具有各种功能,其中的一些可以通过细胞蛋白提供复制功能。在HIV中,tat起到病毒LTR的转录活化物的作用。它与稳定的茎-环RNA二级结构结合,被称为TAR。Rev通过rev效应元件(RRE)来调节和辅助病毒基因的表达。
在发达西方国家中发现的优势亚型即基因亚型B,与非洲和亚洲(这里居住着绝大多数的HIV感染者)存在的其它亚型和重组株很不相同。因此,医生们在北美和欧洲遇到的亚型B逆转录病毒与那些在全球范围危害人类的病毒亚型之间存在着很大的差异(Spira,S.等,(2003)J.Antimicrob.Chemother.51(2):229-40)。在不同地理区域的病毒亚型的大的基因组多样性,是HIV逆转录酶(RT)惊人的高错配误差率、再加上缺乏核酸外切酶校正活性的结果。引起遗传多样性高度变化的其它因子包括每种病毒亚型的复制率、每次复制周期产生的突变数、基因组重组和病毒适合度的病毒倾向性。另外,基因组进化的高速率也可由宿主、环境和/或治疗性选择压力而引起。
3类HIV-1已经在全球扩散:M(主要亚型组)、O(外亚型组)和N(新亚型组)。其中M组占已报告HIV/AIDS病例的90%以上;在M组中,病毒包膜变化多样,使得该组被进一步划分成9个主要的基因亚型(包括A-D、F-H、J和K)以及多个循环重组型。病毒多样性看来是从撒哈拉非洲次大陆发散开来,在这里生活着的总共4000万人中超过2800万人被感染。
A和A/G重组变异株在西非和中非占优势。B在欧洲和美洲成为优势种。然而,随着移民和全球化的增加,在欧洲,>40%的新增感染呈现非B非洲变异株和亚洲变异株。C在南非和东非、印度和尼泊尔占优势。的确,基因亚型C因为在以下国家未受控制地扩散,而已成为近年来HIV大流行的中心:博茨瓦纳、津巴布韦、马拉维、赞比亚、纳米比亚、莱索托、南非、印度、尼泊尔和中国。D一般局限于东非和中非,并在南非和西非观察到散在病例。E从未单独出现,但泰国、菲律宾、中国和中非却检测到A/E嵌合状态。F已在中非、南美和东欧有报道。G和A/G重组病毒已在西非和东非以及中欧发现。H仅在中非被检测到。J仅在中美洲报道过。K目前已在刚果民主共和国和喀麦隆被鉴定。
该表并不详尽,因为还在不断发现更多亚型,而且移民群体正带来新的感染模式。需要特别关注的是HIV-1基因亚型C和A,以及A/G和A/E重组型,这些代表了非洲和亚洲的优势亚型,而非洲和亚洲又是HIV病最危险的失控地区。
与此形成鲜明对比的是,其它种类的逆转录病毒如HIV-2,除了在西非正在流行外,并未更多地扩散到西非以外的地区。仅在非洲观察到一些散在的病例,但是该病毒的致病性看来明显低于HIV-1。
根据包膜(env)核苷酸序列中20-50%的差异,可将HIV-1基因亚型按系统发生进行分类。M组和O组的Env蛋白可有多达30-50%的差异。但是,N亚型看来与M和O在系统发生上是等距的。在M组内,观察到基因亚型间env变异的不同达20-30%,而基因亚型内的变异为10-15%。
HIV-1的pol区的变异性比env小2-3倍,因为该区编码2种极其重要的酶,即RT和蛋白酶,所以该区如果过分突变则会导致该病毒不起作用。Gag序列甚至更不耐受突变,因为它们编码更严格的核心蛋白序列。
基因亚型间和基因亚型内pol序列的变异特别有关,因为该区编码许多抗病毒药物所针对的RT和蛋白酶蛋白。因此,在这些区域的变异可影响药物敏感性,并且发展抗药性。埃塞俄比亚基因亚型C分离株与基因亚型B有6.8-10%的差异(就RT而言),并且已经报道来自非洲、印度和南美毒株的基因亚型内差异达3.5-5.8%。
值得注意的是这一事实:核苷酸序列中一定的百分率变异翻译成较低的氨基酸序列变异,因为许多遗传突变是沉默型的。例如在基因亚型E和B中RT序列间有10%的核苷酸变异,仅产生7%的氨基酸残基的变异。
不仅基因亚型与基因亚型间的env基因基本上不同,而且长末端重复(LTR)序列也不同,所述序列含有HIV复制的转录启动子。每个基因亚型具有其自身的LTR拷贝数以及精确的增强子和启动子结构核苷酸序列,虽然在其它LTR均一性的特征在于,即Spl位点、TATA盒和TAT效应元件。此外,在各种转录启动子中都观察到多样性。这些包括NF-κB结合位点(C中有3-4个,B中有2个,而E中仅1个),以及在NF-κB位点上游序列(例如nef重叠USF基因,该基因仅存在于基因亚型B中),和AP-1转录因子结合位点(所述位点在亚型C、E和G中存在1个,在A和F中存在2个,而在B或D中不存在)。不仅在基因亚型A、C、D或O中具有含NF-IL6转录因子(C/EBP-B)特异性基序的U3的-170区,而且在B中也具有。该因子反式激活来自单核细胞的细胞中的HIV-1 LTR。此外,与基因亚型B的检测相比,在基因亚型C、D和E中观察到负调节元件(NRE)之间的亚型差异。
最近实验表明,在HIV-1基因亚型间,病毒调节蛋白序列Nef也不同,变异范围从14.4%到23.8%,其中B和D的Nef构型最接近。目前,Nef序列多样性的临床意义尚不明确,但是可能是意义重大,因为近期观察到,在基因亚型B的感染者中,Nef序列可随疾病进程而变化。
最后,有证据表明,其它的调节和辅助HIV-1基因在亚型多样性中发挥重要作用。这部分地涉及这一事实:基因亚型C含有独特的截短Rev蛋白和增加的Vpu产物,以及发现基因亚型D表达C端缺失的Tat蛋白。
在优选的实施方案中,本发明提供含有HIV-1基因亚型C以及循环重组型007(也称为HIVCHN.AD)的核酸和MVA载体,所述载体也含有基因亚型B的区段),所述亚型在云南省是优势亚型。此外,其它基因亚型也可任选用于替代实施方案。
先前在WO 99/41397中已经描述了密码子最优化。不同细胞对具体密码子的使用不同。这种“密码子偏倚”符合在该细胞类型中特定tRNA相对丰度的偏倚。通过改变序列中的密码子,使它们更加匹配相应的tRNA的相对丰度,可以增加表达。同样,可以通过为已知在特定细胞类型中稀有的相应tRNA来刻意选择密码子,以降低表达。因此,可以进行额外程度的翻译控制。
许多病毒,包括HIV和其它慢病毒在内,均大量使用稀有密码子;通过将其改变成相应的哺乳动物通用密码子,可以在哺乳动物生产细胞中达到增加所包装组分的表达。哺乳动物细胞和其它各种生物的密码子使用表是本领域已知的。
密码子最优化具有许多其它优点。由于改变其序列,在生产细胞/包装细胞中编码装配病毒颗粒所需的病毒颗粒包装组分的核苷酸序列具有从中消除的RNA不稳定序列(INS)。同时,保留了包装组分氨基酸序列的编码序列,使得所述序列所编码的病毒组分保持相同,或者至少十分相似,使得所述包装组分功能没有降低。密码子最优化也克服了输出、独立赋予最佳序列Rev所需的Rev/RRE。密码子最优化也可在载体系统中降低不同构建体之间的同源重组(例如在gag-pol和env可读框重叠区之间)。因此,密码子最优化的总体效果是显著增加病毒滴度并提高了安全性。
本发明涉及将编码病毒抗原的DNA直接注射到皮肤或肌肉的策略。然后局部细胞可吸收所述质粒并自己表达所述外源蛋白,原位产生疫苗免疫原。任选使用MVA初次免疫和加强免疫,以在具有HIV感染或HIV相关疾病危险的受试者中增强免疫应答。该方法既经济又灵活多变。然而,更重要的是体内潜在的功效。
本发明还包括使用所述核酸载体,在已经感染所述病毒的感染者体内刺激免疫应答。此外,本发明的载体可用于在感染者体内产生针对该载体提供的抗HIV序列的抗体,或者是抗预先存在的循环HIV序列的抗体。因此,本发明还预期在HIV或HIV相关疾病的诊断试剂盒中使用本文公开的载体而产生的抗体的用途。
药学上可接受的载体部分取决于在给予所述化合物时所使用的具体组合物以及具体方法。本发明包括给予包含核酸的药用组合物,并任选与MVA病毒加强剂联用。在一个替代实施方案中,可以单独给予MVA,而不给予核酸。因此,这些核酸的药用组合物有许多合适的制剂(参见例如Remington′s Pharmaceutical Sciences,第17版.1989)。可以采用任何常规方式给药,例如注射、口服给药、吸入、经皮给药,或者直肠给药。当采用粘膜给药时,可以采用口服、眼用或鼻腔途径。
适于胃肠外给药的制剂,例如通过肌内、皮内和皮下途径,包括含水和不含水的、等渗无菌注射液,其中可含有抗氧化剂、缓冲剂、抑菌剂以及赋予该制剂与预期给予的受体血液等渗的溶质;以及含水和不含水的、等渗无菌混悬液,其中可含有悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂。在本发明的实践中,可以给予组合物,例如通过静脉内输注、口服、局部、腹膜内、膀胱内或鞘内方式。胃肠外给药是优选给药方式。所述制剂可呈单位剂型或多剂量密封容器形式,例如安瓿和小瓶。
可以通过本领域已知方法制备纯化疫苗溶液,供给药用,所述方法可包括将溶液过滤除菌、稀释溶液、加入佐剂并稳定该溶液。疫苗可以是冻干疫苗,以生产易于运输和贮藏的干形式抗HIV疫苗。此外,可以制备供初次接种用的单独的ADVAX I和ADVAX II疫苗或联合疫苗,以及供加强免疫用的单独的ADMVA疫苗,或可含有至少一种其它抗原,只要所加抗原不干扰初次或加强免疫疫苗的有效性,并且不额外增加或协同增加副作用和不良反应。重组痘病毒或免疫原可以与合适的载体、稀释剂或赋形剂(如无菌水、生理盐水等)混合。组合物也可以冻干或冷冻。所述组合物可含有辅料,例如润湿剂或乳化剂、pH缓冲剂、佐剂、防腐剂等,这取决于给药途径和所需制剂。
药学上可接受的佐剂,例如完全或不完全弗氏佐剂、RIBI(胞壁酰二肽)、ISCOM(免疫刺激复合物)、霍乱毒素B、氢氧化铝等矿物凝胶剂,以及溶血卵磷脂、复合多元醇、聚阴离子等表面活性剂,肽类、含油乳剂、匙孔血蓝蛋白和二硝基苯酚。BCG(卡介苗)和小棒状杆菌(Corynebacterium parvum)是潜在有用的人用佐剂,它们可以通过将核酸和/或病毒载体螯合在局部贮库中以防止其快速分散,或者它们可含有某些物质,所述物质刺激宿主分泌巨噬细胞趋化因子和其它免疫系统组分。免疫程序可以涉及或不涉及两种或多种多肽的给药,时间可以跨越数周。
本发明包括在动物中诱导抗HIV的免疫性或保护性免疫应答的方法,所述方法包括将所述免疫原性组合物或疫苗组合物给予所述动物。
本发明还包括抗HIV的初次-加强免疫或接种,其中所述初次免疫是采用DNA疫苗或免疫组合物或免疫原性组合物,它们含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子;而所述加强免疫是采用疫苗或免疫组合物或免疫原性组合物,它们是HIV失活制剂或减毒制剂或亚单位(抗原、免疫原和/或表位)制剂,和/或重组或修饰病毒疫苗或免疫组合物或免疫原性组合物,所述疫苗和组合物含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子。因此,本发明提供抗HIV的初次-加强免疫或接种方法,例如包括以下的抗HIV的初次-加强免疫或接种:将含有在体内编码和表达HIV抗原、免疫原或表位的核酸分子的本发明DNA疫苗或免疫组合物或免疫原性组合物给予目标动物(作为初次接种),然后给予含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子的重组或修饰病毒疫苗或免疫组合物或免疫原性组合物,最好给予体内表达HIV免疫原、抗原或表位的重组疫苗或免疫组合物或免疫原性组合物(作为加强免疫)。加强免疫最好与初次免疫相匹配,例如加强免疫含有或表达至少一种被初次免疫表达的抗原、表位或免疫原。
给药方法可包括给予有效量的本发明的免疫原性组合物或疫苗。可以采用一次或多次给药,例如两次给药。本发明包括用于不同给药途径的组合物形式。按已知因素确定有效剂量和给药途径,例如年龄、性别、体重以及已知的其它筛选程序,而无需进行过多的实验。对于亚单位的免疫原性组合物、免疫组合物或疫苗组合物,每种活性剂的剂量可以是按照本文引用文件(或本文引用文件所参考或引用的文件)和/或其范围可以从一微克或几微克到几百微克或几千微克,例如1μg-1mg。
初次免疫和加强免疫的给药量和给药途径可以是如本文所讨论的,例如按照本发明和本领域的知识,可以实施初次-加强方案,而无需进行过多的实验。此外,按照本文公开内容和本领域的知识,技术人员可以对上面提到的目标物种使用所述方法、试剂盒等。
可以用无针的液体喷射注射器或粉末喷射注射器注射所述疫苗或免疫原性组合物。对于质粒,也可使用包埋质粒的金颗粒并采用所述方法喷射而穿透待免疫受试者的皮肤细胞(Tang等,Nature 1992,356,152-154)。本发明的疫苗或免疫原性组合物的给药方法和仪器可以参考引用并结合到本文的其它文件。无针注射器也可以是例如Biojector 2000(Bioject Inc.,Portland OR,USA)。
本发明的免疫原性组合物和疫苗最好包含有效量的引发免疫应答和/或保护性免疫应答的本文讨论的一种或多种表达载体和/或多肽;并且,有效量可以按照本发明内容(包括结合到本文中的文件)和本领域的知识来确定,而无需进行过多的实验。
在基于质粒载体的免疫原性组合物或疫苗的情况下,剂量通常可包含约10μg至约2000μg,最好约50μg至约1000μg。给药体积可以在约0.1ml和约2ml之间,最好在约0.2ml和约1ml之间。
可以按合适剂量给予重组载体,以达到本文和/或本文所引用文件所描述剂量的相应的体内表达。例如,可以凭经验来确定病毒悬液的合适范围。本发明的病毒载体或重组株可以按每剂至少103pfu的量给予受试者或感染或转染到细胞中;更优选约104pfu至约1010pfu,例如约105pfu至约109pfu,例如约106pfu至约108pfu,例如每剂2ml。如果不止一种重组株表达不止一种基因产物,每个重组株可以按这些量给予;或者,每个重组株可以与包含这些剂量的重组株联合、共同给予。在本发明使用的重组载体组合物中,剂量可以按照本文引用文件描述或按照本文描述或按照本文引用文件中的参考或引用文件来确定。例如,重组载体组合物中每种DNA的合适量可以是1μg至2mg,最好是50μg至1mg。技术人员可以参考本文引用文件(或本文引用文件中的引用或参考文件)中关于DNA载体的内容,来确定本发明重组DNA载体组合物的其它合适剂量,而无需进行过多的实验。
然而,引发合适的免疫应答的组合物剂量、其中的组分浓度和给予所述组合物的时间可以通过血清抗体滴定等方法来确定,例如通过受试者体内的ELISA和/或血清中和测定分析和/或通过接种攻击评估。所述确定方法可按照技术人员的知识、本发明内容和本文引用文件,而无需进行过多的实验。而且,序贯给药时间同样可以按照本发明内容和本领域的知识来确定,而无需进行过多的实验。
以下给出实施例,是为了给本领域普通技术人员提供完整发明内容和怎样进行和采用本发明的测定、筛选和治疗性方法的详述,并且不是用来限制本发明人所考虑的本发明的范围的。
实施例
实施例1:DNA疫苗ADVAX I和II的构建
本发明预防性疫苗方案包括两种新型DNA载体,以及用重组表达相应的HIV-1蛋白的修饰痘苗病毒Ankara(MVA)的加强免疫。本疫苗所采用的基因来自HIV-1基因亚型C株、循环重组型007或HIVCHN.AD,所述基因也含有在云南作为优势亚型的基因亚型B的小区段。nef基因产物和tat基因产物在病毒生命周期早期表达,并且代表HIV-1感染的免疫控制的关键靶。另外,也选择Gag、pol和env结构基因。因此,在本发明的DNA疫苗策略中包括结构基因和调控基因,是为最大量包括免疫原性表位而设计的。
本发明的DNA疫苗基于pVAX1,这是一种Invitrogen市售质粒(图1)。该载体是专为用于开发DNA疫苗而设计的,而且按照美国食品及药品管理局(FDA)规程的要求来构建(Center for BiologicsEvaluation和Research,FDA,1996年12月22日,卷号96N-0400)。但是,原来的载体通过插入额外的启动子而被修饰。采用PCR,从市售载体pBudCE4.1(Invitrogen)扩增人延伸因子1α(hEF1a)启动子。所述启动子克隆到pVAX1的EcoRI/NotI位点,该新构建体经测序证实。hEF1a启动子已经由他人表征(Najjar,S.M.等,(1999)Gene230:41-5;Nishimura,Y.等,(1999)Vaccine 18:675-80;Wallich,R.等,(2001)Infect.Immun.69:2130-6)。pVAX1的这一变化,产生pADVAX(图2),已发现后者容许独立的高水平表达第二基因插入序列。pADVAX的双顺反子容量比用内部核糖体进入位点或IRES更加有效(10-20倍)(Martinez-Salas,E.(1999)Curr.Opin.Biotechnol.10:458-64)。蛋白质印迹显示,处于pADVAX双启动子控制之下的每个基因的蛋白表达水平与pVAX1中单由CMV启动子驱动的表达水平相当。
构建pADVAX载体后,制备用于插入的HIV病毒基因。合成HIV-1 env基因和gag基因,使之包含对于哺乳动物表达最优化的密码子。密码子最优化代表Rev/RRE独立型核输出的促进作用(Schneider,R.等,(1997)J.Virol.71:4892-903;Kotsopoulou,E.等,(2000)J.Virol.74:4839-52),这与病毒基因表达增加是一致的。用重叠PCR,将寡核苷酸(80-mers至90-mers,重叠16-18次)与序列结合,反映理想的密码子选择。经ELISA或蛋白质印迹测定,这增加了基因表达100倍至1000倍。
通过掺入组织纤溶酶原激活物(tPA)前导序列(MDAMKRGLCCVLLLCGAVFVSAR)(SEQ ID NO:1)来替代天然env序列和补充gag基因,进一步修饰所述基因。认为该序列通过促进蛋白从内质网(ER)转运到高尔基体而部分增强表达(Haddad,D.等(1997)FEMS Immunol.Med.Microbiol.18:193-202;Li,Z.等,(1999)Infect.Immun.67:4780-6;Weiss,R.等,(1999)Vaccine 18:81524;Qiu,J.T.等,(2000)J.Virol 74:5997-6005)。有了这样的修饰,基因表达可进一步增加3-5倍。图3显示经定量测定HIV-1 Gag(p24)的ELISA(Abbott Laboratories)法检测,天然gag(NAT)、密码子最优化gag(OPT)和密码子最优化gag/tPA(tPA OPT)的表达。采用抗env基因产物的多克隆抗体,进行蛋白质印迹测定,得到因密码子最优化和添加tPA前导序列而得到的增加的env表达的类似结果(图4)。结果表明,Env功能保留了遗传修饰。在涉及携带CD4/CCR5(HIV-1受体/共同受体)的HeLa细胞的融合测定中,用tPA-最优化env载体转染的293T细胞能够融合而形成合胞体(结果未显示)。
有了合适位置的所需遗传修饰,两个HIV-1基因克隆到pADVAX中,产生第一疫苗即ADVAX I。经蛋白质印迹证实双顺反子表达(图5)。如上所述再构建第二疫苗即ADVAX II,用重叠PCR结合密码子最优化寡核苷酸,来合成pol、nef和tat。然而,采取额外措施,以保证体内应用的安全性。首先,pol基因包括蛋白酶(PR)活性位点的缺失,以阻止多肽加工(Loeb,D.D.等,(1989)Nature 340:307-400),结果用蛋白质印迹证实(图6)。采取额外的谨慎步骤,以在逆转录酶(RT)活性位点以及pol基因中掺入点突变(Wakefield,J.K.等,(1992)J.Virol66:6806-12;Chao,S.F.等,(1995)Nucleic Acids Res.23:803-10)。
为了将这三个基因全部掺入到一个基于pADVAX的载体中,重叠PCR产生nef-tat融合基因。这两个遗传序列都保持完整,因而在所得融合蛋白中保留所有的免疫原性表位。如上所述,将tPA前导序列加入到pol和nef-tat中。用蛋白质印迹分析用相关载体转染的293T细胞的两种裂解物和上清液,证实得到增加的表达和分泌效率(图7-8)。所用抗体是多克隆兔抗Nef抗体(由Cecilia Cheng-Mayer博士提供)。因为有了Pol,所以考虑了用于体内的nef-tat融合蛋白的安全性,并进行了如下分析。
已知Nef负调节CD4和I类MHC的表面表达(Collins,K.L.等,(1998)Nature 391:397-401;Aiken,C.等,(1994)Cell 76:853-64;Collins,K.L.等,(1999)Immunol.Rev.168:65-74),而tat具有免疫抑制效应,推测起到通用反式激活物的作用(Goldstein,G.(1996)Nat.Med.2:960-4;Garber,M.E.等,(1999)Curr.Opin.Immunol.11:460-5)。然而,采用流式细胞仪分析,我们证明Nef对I类MHC表达的影响被tPA前导序列抵消(图9)。同样,在nef-tat融合蛋白的情况下,tat丧失其反式激活能力。在“MAGI”测定中,可明确观察到该现象,所述测定包括使用HeLa细胞,该细胞经工程化以便在功能性HIV-1 Tat存在下表达β-半乳糖苷酶基因(Kimpton,J.等,(1992)J.Virol.66:2232-9)。随着X-gal(5-溴-4-氯-3-吲哚-β-D-吡喃半乳糖苷)底物的加入,该细胞变蓝,如果tat有活性的话(结果未显示)。因此,可以推导出,由该疫苗产生的Nef-Tat融合蛋白将不再具有体内免疫抑制效应。确实,甚至不顾通用反式激活的风险,已经知道,编码野生型HIV-1 tat的DNA在无免疫应答个体中用作疫苗是安全的(Calarota,S.A.等,(1999)J.Immunol.163:2330-8)。图10图示这些载体。
实施例2:ADVAX I和II-细胞介导应答的体内免疫原性评价
如上所述,用酶联免疫斑点测定来评价针对ADVAX I和II的细胞介导的免疫应答(另参见Hanke,T.等,(1998)J.Gen.Virol 79:83-90;Carvalho,L.H.等,(2001)J.Immunol.Methods 252:207-18;Tobery,T.W.等,(2001)J.Immunol.Methods 254:59-66;Novitsky,V.等,(2001)J.Virol.75:9210-28)。用ADVAX 1的GLP级贮液(Aldeveon,Fargo,ND)来免疫6-8周龄雌性BALB/c小鼠。分别在第0、3和6周肌内给予200μg所述疫苗。用以下构建体接种总共5组小鼠,每组6只:pVAX1-env、pVAX1gag、pVAX1-env+pVAX1-gag、pVAX1(对照)和ADVAX1。呈现特定表位的肽如下:Env 34(VPVWKEAKTTLFCASDAKAY)(SEQ ID NO:3)已知能引发CD4+细胞介导的应答,Env 43(RNVSSDGTYNETYNEIKNCS)(SEQ ID NO:4)引发CD8+细胞介导的应答,Gag 26(TSNPPIPVGDIYKRWIILGL)(SEQ ID NO:5)引发CD4+细胞介导的应答,以及Gag A-I(AMQMLKDTI)(SEQ ID NO:6或2)引发CD8+细胞介导的应答。
第3次注射后2周,处死小鼠。然后从每组收集脾细胞,并且在用Env和Gag抗原特异性肽库(NIH AIDS Research and ReferenceReagent Program)进行体外再次刺激期间,用酶联免疫斑点测定来检测它们分泌干扰素-γ(IFNγ)的能力。就在本文写成之时,仅来自异源株(HIV96zM65.8,产品目录号3993)的Gag肽可用。同样,在我们进行酶联免疫斑点测定时,我们尚不具备全套同源Env肽(HIVCHN.AD,产品目录号4974,80%完整性)。尽管如此,结果显示出对每种单启动子驱动的载体(pVAX1-env和pVAX1-gag)的强烈免疫应答,每种都产生约700斑点形成细胞(SFC)/106脾细胞。ADVAX I诱导的免疫应答比较显著,约600 SFC/106脾细胞对所检测的Env和Gag肽库具有特异性。预期针对pVAX1控制的应答是nil,而且在脾细胞合并液缺乏CD8+细胞时,没有检测到针对Gag A-I的酶联免疫斑点测定的应答(图11)。总的来讲,检测了抗至少9个不同表位的细胞介导免疫应答,所述表位包括对CD8+或CD4+T细胞具有特异性的表位(数据未显示)。没有检测到ADVAX I的两种基因产物间的免疫原性协同或干扰的证据。剂量提高实验揭示出清楚的剂量-反应效应(图12)。对于至少一个表位(Env 34),发现150μg的定量酶联免疫斑点测定的应答约为5μg的7倍。尽管如此,剂量-反应趋势对于所有检测的表位都适用,不管对CD4+或CD8+细胞介导的应答是否有特异性。
实施例3:体内临床前免疫原性评价
以下数据支持ADVAX I的体内体液免疫原性。在小鼠实验的最后一次(第3次)免疫后两周,收集血清样品,用ELISA检测抗Gag抗体。尽管在接种pVAXI-gag的小鼠中观察到最高滴度,但是,与接受pVAXI-env+pVAXI-gag的动物延迟的应答相比,在用ADVAX I免疫的一组动物中也有基础滴度(图13)。通过蛋白质印迹,证明从ADVAX I组收集的血清样品也有抗EnV抗体应答。用ADVAX II进行了相似的体内研究。具体地讲,用ADVAX II的GLP级贮液(Aldevron,Fargo,ND)来免疫6-8周龄雌性BALB/c小鼠。分别在第0、3和6周肌内注射给予200μg所述疫苗。用以下构建体共接种5组小鼠,每组5只:pVAX1-pol、pVAX1-nef-tat、pVAX1-pol+pVAX1-nef-tat、pVAX1(对照)和ADVAXII(唯一的双启动子载体)。
第3次注射后2周,处死小鼠。然后从每组收集脾细胞,并且在用来自肽库的pol、tat和nef进行体外再次刺激期间,用酶联免疫斑点测定来检测它们分泌干扰素-γ的能力。要注意的是,检测时,没有可用的基因亚型C肽。所述抗原特异性肽由基于基因亚型B共有序列的15-mers(NIH AIDS Research and Reference Reagent Program:Tat的产品目录号5138,Nef的产品目录号5189和Pol的产品目录号6208)组成。尽管如此,正如在ADVAX I实验中一样,我们比较性地观察了单基因载体和双启动子疫苗的良好应答。抗Pol库的应答,例如,对于pVAX1 pol单用是最好的(300-800 SFC/106脾细胞,取决于库)。对于pVAX1 pol+pVAX1 nef-tat,结果范围是180-500 SFC/106脾细胞,而对于ADVAX II,应答在180-600 SFC/106脾细胞之间。由于有了Tat库,对于pVAXI-nef tat来说应答为-180 SFC,而对于pVAX1 pol+pVAX1 nef-tat和ADVAX II来说为-100 SFC。使用Nef库,对于pVAX1 nef-tat来说应答为30-200 SFC,而对于pVAX1 pol+pVAX1 nef-tat和ADVAX II为20-150 SFC(图14)。
我们用ADVAX II还进行了剂量增加研究,证明了明确的剂量-反应效应(图15)。分别在第0、3和6周,经肌内注射给予小鼠5μg、10μg、50μg、100μg或150μg的DNA。在第8周处死小鼠后,收集脾细胞,用来自基因亚型B共有序列的肽进行体外再次刺激。Pol应答随剂量的增加而增加,从10μg时的250-500SFC增加到100μg时的500-700SFC。150μg时的应答与100μg时的相当。Nef应答范围从-20SFC到-200SFC,而Tat应答从-25SFC到-100SFC。
进行了ADVAX I+II联合接种的体内试验。分别在第0、3和6周,经肌内注射给予各组小鼠5μg、10μg、50μg、100μg或150μg的ADVAX I+II。对照组接受pVAX1 gag、pVAX1 env、pVAX1 pol和pVAX1-nef-tat各50μg的混合物。最后一次免疫后2周,处死小鼠,收集各组的脾细胞,用酶联免疫斑点法测定干扰素-γ的释放。用含有CD4+和CD8+T细胞表位的Env特异性肽、Gag特异性肽和Pol特异性肽进行体外再次刺激,如同自体亚型C Tat和Nef序列一样。正如在单用ADVAX I和ADVAX II的试验中所观察的,该联合接种试验的结果表明对这两种疫苗载体的比较好的应答。用ADVAX I+II接种的小鼠具有抗所有受试肽(肽库)的抗原特异性应答,而且所述应答是以剂量依赖性方式诱导的(表1)。
                             表1.针对联合接种和对照的抗原特异性干扰素-γ
                                         酶联免疫斑点测定的应答
    疫苗                                 IFN-γ斑点形成细胞(SFC)/106脾细胞
 剂量   Gag26     GagA-I     Env34     EnvT-I     Pol223     PolYLI     PolVGI     Tat库     Nef库1     Nef库2
 pVAX1-gag+pVAX1-env+pVAX1-pol+pVAX1-nef-tat(各50μg)   120     150     350     700     70   500   500     110     400     300
 ADVAXI+II(各150μg)   112     252     400     700     117   700   830     120     225     370
 ADVAXI+II(各100μg)   70     210     400     600     100   550   500     70     200     330
 ADVAXI+II(各50μg)   30     100     220     500     84   400   420     50     140     160
 ADVAXI+II(各10μg)   30     60     180     250     70   275   375     30     110     140
 ADVAXI+II(各5μg)   10     30     110     180     60   250   370     20     70     140
注意:根据两种细胞输入水平的双份重复孔,斑点数都标准化每106脾细胞,并且计算每种样品和抗原的平均数。Gag 26、Env 34和Pol 223含有CD4表位,而Gag A-I、Env T-I、Pol YLI和Pol VGI含有CD8表位。用于Tat和Nef的肽库来自自体亚型-C序列。
注意,在该试验中,在用来自亚型C的Nef和Tat肽库对脾细胞进行体外再次刺激时,观察到特别强烈的应答;相比之下,先前在ADVAX I试验中观察到较温和的应答。这一差异可能归结于异源蛋白和自体蛋白间的差异。因此,我们认为,事实上,在ADVAX II中的nef-tat融合基因能诱导非常有效的免疫应答。此外,联合接种试验证明,通过干扰素-γ酶联免疫斑点测定,在不同的抗原特异性应答中没有可检测的干扰。
实施例4:构建重组MVA病毒载体作为抗HIV-1疫苗
我们采用的MVA穿梭载体最先得自美国国立卫生研究院的Bernard Moss博士。该载体经进一步修饰,使之符合美国食品及药品管理局(FDA)的规范。我们先通过除去我们不希望引入人体的报道基因或抗药性基因,来修饰原载体。然后我们评价了用于表达HIV-1蛋白的3个MVA插入位点(del II、del III和HA)。通过蛋白质印迹,我们发现,对于基因表达来说,del II和del III优于HA位点(图16)。此外,我们注意到,痘苗病毒特异性启动子按以下顺序驱动外源基因表达:pSYN>pH5>p7.5。因此,我们选用del II和delIII位点,以及痘苗病毒启动子pSYN和pH5,用于构建我们的疫苗。采用该策略,以保证HIV-1蛋白的高水平表达。
评价了MVA系统中的HIV-1的基因表达。尽管序列“人源化”有助于提高DNA疫苗中的蛋白表达,但是,通过蛋白质印迹检测,与插入到del II位点的人源化和野生型nef基因相比,MVA的HIV-1的蛋白表达没有任何优势。因此,选用野生型HIV-1序列,来构建我们的疫苗。此外,MVA不能耐受全长HIV包膜蛋白,可能是因为它对痘苗病毒的毒性(Amara,R.R.等,(2001)Science 292:69-74;Barouch,D.H.等,(2001)J Virol 75:5151-8;Men,R.等,(2000)Vaccine18:3113-22;Ourmanov,I.等,(2000)J Virol 74:2740-51;Takahashi,H.等,(1988)Proc Natl Acad Sci USA 85:3105-9)。因此,通常将HIV-1gp41区的羧基端截短,以产生活的重组HIV-1-MVA。考虑到这些发现,通过在其可变(V)区引入缺失,来修饰病毒包膜序列。与野生型相比,gp120 V2区(DV2)的缺失,可使重组MVA达到更高滴度,即>108TCID50/ml。
该修饰保留了gp41内的所有免疫原性表位。DV2包膜可以作为更好的免疫原,诱导抗HIV-1的广泛的中和抗体,因为增加了对某些关键抗体表位的暴露(Barnett,S.W.等,(2001)J Virol 75:5526-40;Cherpelis,S.等,(2001)Immunol Lett 79:47-55;Cherpelis,S.等,(2001)JVirol 75:1547-50;Donnelly,J.J.等,(2002)Science 297:1277-8;discussion 1277-8;Ly,A.和L.Stamatatos.(2000)J Virol 74:6769-76;Stamatatos,L.等,(2000)AIDS Res Hum Retroviruses 16:981-94)。注意,DV2也消除了痘苗病毒转录终止信号,所述信号能影响全长包膜的表达(Moss,B.等,(1996)Adv Exp Med Biol.397:7-13;Moss,B.(1996)Proc Natl Acad Sci USA 93:11341-8)。重要的是,尽管进行了修饰,但保留了DV2包膜的功能性特征。在采用携带CD4/CCR5(HIV-1受体/共同受体)的HOS细胞的融合测定中,用修饰的DV2 env载体转染的293T细胞能够融合,形成合胞体(图17)。
既然理想的插入位点仅限于MVA,所以重叠PCR产生gag-pol和nef-tat融合基因。这样,就完整地保留了两个遗传序列,因而在所得融合蛋白中保留了所有的免疫原性表位。为了与在我们的质粒DNA疫苗中增加表达的方法相一致,通过掺入组织纤溶酶原激活物(tPA)前导序列(氨基酸:MDAMKRGLCCVLLLCGAVFVSAR),再加上gag-pol和nef-tat融合基因,对所述基因进行进一步修饰。
正如DNA疫苗所述,还进行了其它工作,以保证体内应用的安全性。在pol基因中,引入蛋白酶(PR)活性位点的缺失,使多肽加工受阻(Loeb DD等,(1989)Nature Aug 3;340(6232):397-400)。蛋白酶的缺失(DTGA)包括野生型基因的氨基酸25-28。在逆转录酶(RT)活性位点也引入了点突变,使得逆转录病毒反转录失活(Wakefield,J.K.等,(1992)J Virol.66(11):6806-12;Chao S.F.等,(1995)Nucleic acidsRes 23(5):803-10)。逆转录酶中的点突变(YMDD→YGDD)对应于野生型基因的184位。引入nef和tat基因,作为包含tPA前导序列的nef-tat融合基因。当在MAGI测定中进行评价时,该tPA nef-tat融合基因,在质粒DNA疫苗候选者的情况下,显示出不具有通常与天然tat表达相关的反式激活功能。将用表达tPA nef-tat的质粒转染的细胞与用仅表达天然nef的构建体转染的细胞相比较,通过对293T细胞进行流式细胞仪分析,证明nef对I类MHC表面表达的负调节效应,被tPA前导序列的引入所抵消。
为了将所有的5个基因掺入到一个重组MVA病毒中,构建了双启动子穿梭载体pZC1。采用这一新型载体,将env和gag-pol基因都通过同源重组插入到MVA缺失III中。
Moss和Wyatt博士(NIAID,the National Institutes of Health)提供的MVA穿梭质粒pLW7,含有SYN启动子并能指导重组到MVA缺失III中。从获得的数据来划分痘苗病毒特异性启动子的效率,pLW7质粒通过添加处于H5启动子控制之下的克隆位点的修饰,产生新型双启动子插入质粒。因为pZC1含有两个不同的启动子,所以不存在启动子竞争的潜在问题。采用插入双启动子的质粒ZC1,来构建穿梭质粒pZC4,所述质粒含有处于SYN启动子控制之下的DV2Env,以及处于H5启动子控制之下的tPA gag-pol。所构建的这一新型插入载体pZC1并不只将一个外源基因、而是将两个外源基因传递给MVA基因组的Del III区。因此,pZC1可以将位于同一插入盒中、但分别处于各自不同的痘苗病毒启动子控制之下的env和gag-pol,传递给MVA的Del III区(图1 9)。
因为包膜免疫染色已经证明是灵敏和可靠的方法,所以采用 env作为替代标记,以筛选gag-pol的存在,因为gag-pol本身是难以检测的。因此,包膜染色阳性细胞的基因组上也整合了gag-pol基因。经过多轮浓缩后,可以用蛋白质印迹法证实gag-pol表达,该方法比原位免疫染色法灵敏得多。
正如先前描述的,插入的HIV-1 env和gag-pol都分别处于各自的启动子控制之下,称为pZC4。env-gag-pol pZC4通过同源重组插入到野生型MVA的Del III区中。通过免疫染色并使用抗Env抗体,鉴定了该重组env-gag-pol MVA,然后通过蛋白质印迹分析检测gag-pol表达,进行进一步证实。因此,在双启动子构建体中表达了这两个基因(图20)。通过采用抗Env抗体的富集/选择,进一步繁殖重组env-gag-pol MVA株(“ADMVA”)。
感染亲株MVA P585的CEF细胞,用质粒pZC4(env/gag-pol)转染,通过同源重组,产生表达DV2env和tPA gag-pol的重组MVA。从转染培养物中收获的细胞的裂解物,经超声处理,稀释,然后接种在CEF细胞上。对所得单层进行免疫染色,挑出单个色点。通过灭活人抗Env血清(Km94)染色,对阳性色点进行鉴定。将色点转移到装有含2%FCS的DMEM的试管中。进行数次冻融循环,裂解细胞并释放结合的病毒。内容物经离心澄清。将上清液吸出,通过感染盛于150ml TC瓶的CEF细胞来进行病毒扩增。48小时后收获感染细胞,通过裂解细胞,释放结合的病毒。将病毒在36%蔗糖层中经超速离心而纯化,然后测定滴度。根据滴定结果,通过有限稀释来稀释病毒,然后再进行下一轮色点纯化。色点纯化步骤连续进行11次。所选分离株称为ZC4PCRE11/12。通过免疫染色证实插入DV2env基因的表达,同时通过蛋白质印迹分析证实gag-pol表达。
通过上述重组MVA克隆感染的CEF细胞以及穿梭质粒pZC22之间的同源重组,产生多基因重组,又称为ADMVA;其中穿梭质粒pZC22指导tPA修饰的nef-tat融合基因插入到MVA缺失II中,该MVA缺失II位于del III区上游的120kbp(图1 8)。从转染培养物中收获的细胞的裂解物,经超声处理,稀释,然后接种在CEF细胞上。对所得单层进行免疫染色,挑出单个色点。通过双重染色选择技术、采用兔抗nef血清和灭活人抗env血清,对阳性色点进行鉴定。如上所述,进行9轮连续色点纯化循环。在特征鉴定之前,最终分离株通过5次传代进一步随机扩增,得到ADMVA研究种子贮液,其滴度等于2.15×106 TCID50/ml。
MVA穿梭质粒pLW22含有SYN启动子,并指导重组到MVA缺失II中(图21)。del II区在del III区上游120kbp处。修饰pLW22质粒,得到含有处于SYN启动子控制之下的tPA nef-tat融合基因的穿梭质粒pZC22。通过限制酶分析证实穿梭质粒pZC4和pZC22的身份。进行PCR分析,证实所插入的转基因的身份。所述修饰消除了报道基因的存在。理论上讲,通过使用pZCI载体和pZC22载体,可将多个HIV-1基因重组到一个MVA基因组中。为了将5个HIV-1基因用于DNA疫苗,构建了第二个ADMVA变异体。通过同源重组,将HIV-1 nef-tat基因插入到pZC22中,再将这个nef-tat pZC22引入到空斑纯化的ADMVA的del II区。通过双重免疫染色、采用抗Env和抗Nef抗体,鉴定所述重组ADMVA(图22-23)。通过用抗Env抗体和抗Nef抗体的选择,对重组ADMVA株进行空斑纯化。
用富集ADMVA,评价了5个HIV-1基因产物在感染后的细胞中的表达。通过蛋白质印迹分析证实了所有5个基因的有效表达(图24)。此外,所有5个基因可以从ADMVA基因组DNA扩增。序列分析已经证实所插入的基因的身份。ADMVA的感染性可达到108-109TCID50/mL(图25),所述病毒可以按1∶10的比例容易地扩增。ADMVA在体外经6次传代后仍保持稳定。除了鸡胚成纤维细胞外,ADMVA还可感染人类细胞(图26)。
实施例5:ADMVA的临床前体内免疫原性评价
在完成ADMVA构建和体外表征后,我们试图确定该重组病毒的体内免疫原性。为了测定细胞介导的免疫(CMI)应答,具体地讲,我们首先选用了酶联免疫斑点测定法,该方法对于CD8+和CD4+T细胞活性的检测来说,快速、可重现而且灵敏。采用组合肽库矩阵和缺乏CD4+T细胞或CD8+T细胞的脾细胞,鉴定了存在于BALB/c小鼠上Env、Gag和Pol中的CD4和CD8表位。通过使用SYFPEITHI预测对于CD8(Env和Gag)的最小9mer表位,随后在IFN-γ酶联免疫斑点测定中得到证实;其中SYFPEITHI是用于MHC配体和肽基序的数据库(www.uni-tuebingen.de/uni.kxi),购自Sigma Genosys(Woodlands,TX)。
肽序列如下:Env特异性CD4+T细胞表位(Env 34:VPVWKEAKTTLFCASDAKAY-20mer)和CD8+T细胞表位(Env T-I:TYNETYNEI-9mer)。Gag特异性CD4+T细胞表位(Gag 26:TSNPPIPVGDIYKRWIILGL-20mer)和CD8+T细胞表位(Gag A-I:AMQMLKDTI-9mer)。Pol特异性CD4+T细胞表位(Pol 223:TAVQMAVFIHNFKRK-15mer)和CD8+T细胞表位(Pol 118:VHGVYYDPSKDLIAE-15mer)。Tat特异性CD4+T细胞表位(Tat12:ISYGRKKRRQRRRAP-15mer)。
除了用于初步酶联免疫斑点测定中的亚型B共有肽库以外,用于Nef和Tat的肽库来自自体序列。肽是重叠11次的15mer,得自IAVICore Laboratory,Imperial College,London,UK。有包含完整Nef区的51肽。这些51肽分为两个肽库。Nef肽库1(C.NefP1)含有肽1至肽24,而库2(C.NefP2)含有肽25至肽51。用于Tat的肽库(C.Tatp1)含有包含全长Tat的23肽。
采用ADMVA的研究种子贮液来免疫6-8周龄雌性BALB/c小鼠。具体地讲,分别在第0周和第3周肌内(IM)给予ADMVA疫苗。用以下疫苗接种总共3组小鼠,每组各6只:106TCID50的ADMVA、106TCID50的野生型MVA和盐水对照。第2次注射后2周,处死小鼠。然后从每组收集脾细胞,并且在用HIV-1抗原特异性肽进行体外再次刺激期间,用酶联免疫斑点测定来检测它们分泌干扰素-γ(IFNγ)的能力(NIH AIDS Research and Reference Reagent Program)。结果表明,疫苗诱导出对该5种免疫原(gag、pol、env、nef和tat)明显的免疫应答,对于最强烈的表位即Env TI,产生约750斑点形成细胞(SFC)/106脾细胞(图27)。野生型MVA所引起的非特异性基础免疫应答约为50 SFC/106脾细胞。预测对盐水对照的应答小于10。注意,对nef和tat的CMI应答并不是最佳的,因为该测定使用来自亚型B的肽。
当采用亚型C特异性同源肽进行刺激,来重复所述实验时,抗nef和tat的SFC数显著增加(图28)。总的来讲,这些CMI应答是针对至少9个不同的表位,包括对CD8+(Env TI、Gag AI、Pol 118)或CD4+(Env 34、Gag 26、Pol 223、Tat T12)T细胞具有特异性的表位。还应注意的是,尽管在ADMVA感染的细胞中,调节蛋白nef和tat是与结构蛋白env、gag和pol共表达的,但是对后者的CMI应答并未消除或受限制。
为了进一步确定在BALB/c小鼠中引发的CMI应答是否具有株特异性现象,用ADMVA来免疫6-8周龄雌性B6×B10小鼠。同样,在第0周和第3周肌内给予该疫苗。用106 TCID50的ADMVA接种总共6只小鼠。第2次注射后2周,处死小鼠。用同源亚型-C肽再次刺激,对脾细胞进行酶联免疫斑点测定(图29)。根据所得SFC计数,在该品系小鼠中也得到类似CMI应答。因此,ADMVA诱导广泛CMI应答的能力并不限于单一小鼠品系。
在小鼠中进行剂量增加实验时,我们发现了明确的剂量-反应效应(图30)。例如,针对Env TI CD8表位,对于106TCID50的剂量,观察到定量酶联免疫斑点测定的应答比103TCID50高约20倍。此外,对所有受试表位,剂量-反应趋势都适用,无论特异性是针对CD4+细胞介导的应答还是CD8+细胞介导的应答。另外,对于所有受试表位,在第二免疫后,都具有明显的MVA加强效应。对于每个剂量,所有免疫小鼠都能很好地耐受疫苗。在免疫小鼠中,ADMVA不引起任何疾病症状或致病效应。
除了CMI应答之外,我们也测定了ADMVA在小鼠中引发体液免疫应答的能力。通过直接(对于Gag)或间接(对于gp120)ELISA来监测抗体应答。为了定量测定抗体应答,用不同稀释度的免疫小鼠血清进行了ELISA。来自用106TCID50 ADMVA免疫小鼠的数据显示,在第二次免疫后2周,容易测定抗gp120和Gag的抗体(图31)。在第二次免疫后,抗gp120抗体滴度超过1∶20,000。
我们测定了Th1和Th2在诱导抗gp120抗体中的作用。在小鼠中,Th1往往促成IgG2a的产生,而Th2往往促成IgG1的产生。通过测定IgG1和IgG2a的稀释滴度,我们发现每个亚类的相似抗gp120抗体水平(图32)。因此,ADMVA引发相当平衡的抗gp120的Th1和Th2应答。目前,我们正在测定这些动物中中和抗体水平。采用ADVAX env/gag质粒DNA+ADVAX pol/hef-tat质粒DNA(ADVAX)和ADMVA的1∶1的混合物,在用不同方案免疫的BALB/c小鼠中,进行了初步的初次-加强实验。如下显示每组4只小鼠接受不同的免疫方案。在加强免疫后2周处死小鼠,用于免疫应答评价。免疫时间表如表2所示。初次-加强实验结果概括于表3.
         表2.初次-加强接种时间表
    组别     初次(第0周)     加强(第3周)
    1     ADVAX     ADVAX
    2     ADVAX     ADMVA
    3     ADMVA     ADVAX
    4     ADMVA     ADMVA
ADVAXDNA剂量:每次注射(IM)20μg总DNA
ADMVA剂量:每次注射(IM)106 TCID50
                                  表3.4种不同免疫方案诱导的CMI应答
                                     抗原特异性IFN-γSFC/106脾细胞
疫苗方案   Gag26   GagA-I   Env34   EnvT-I   Pol223   PolVGI   Tat64   Tat60   Nef库
ADVAX+ADVAX   20   50   280   380   70   550   22   20   60
ADVAX+ADMVA   90   285   260   670   135   600   200   100   245
ADMVA+ADVAX   40   54   310   585   70   410   40   40   125
ADMVA+ADMVA   35   40   105   220   42   155   70   55   125
根据两种细胞输入水平的双份重复孔,斑点数都标准化每106脾细胞,并且计算
每种样品和抗原的平均数。
Gag 26、Env 34、Pol 223和Tat 64含有CD4表位,而Gag A-I、Env T-1、Pol VGI和Tat 60含有CD8表位。
用于测定抗Nef应答的肽库基于自体亚型-C序列。
尽管通过所有4种方案、针对所有5种MVA-编码的HIV-1免疫原的表位,来诱导CD4+细胞介导应答和CD8+T细胞介导应答,但是ADVAX(DNA)初次+ADMVA加强免疫诱导最强的总体应答。
在用多价重组ADMVA株免疫的BALB/c小鼠中,诱导抗所有5种HIV免疫原的同源HIV-1亚型C肽特异性CTL应答。此外,ADMVA诱导CMI应答与用于小鼠的给药途径无关,这与临床运用中肌内途径所观察到的强烈应答是一致的(图33)。尽管在ADMVA单次免疫后产生强烈的MVA特异性T细胞应答,但是在初次应答后3周,第2次用ADMVA免疫后,小鼠证明产生加强的HIV特异性CMI应答。重组MVA疫苗在两个不同品系的小鼠中引发类似的CTL应答。当检测抗gp120抗体和抗gag抗体滴度时,也观察到了体液免疫应答。当比较所得抗gp 120抗体应答的IgG亚类时,ADMVA在BALB/c小鼠中引发平衡的Th1和Th2应答,正如类似的IgG1和IgG2a env特异性抗体滴度所示。
在中国,因为1980年前出生的人都接种了天花疫苗,所以他们可能已经具有抗我们的重组MVA载体的免疫性。因此,我们试图在接种病毒后,采用改良的酶联免疫斑点测定法,测定小鼠中针对ADMVA的CMI应答的数量级。在该测定中,在用野生型MVA进行感染(MOI为1)后,采用H-2d限制性A20细胞作为抗原呈递细胞。在用ADMVA以106TCID50和107TCID50的剂量进行初次免疫后2周,针对MVA本身的SFC数达到700~800(图34)。尽管如此,当第二次给予时,相同剂量的病毒能引发免疫应答约1.5倍(图29)。因为将使用ADMVA作为加强组分用于我们的人体试验,所以,我们的发现支持这一前提:ADMVA将用作有效的疫苗加强剂,甚至在预先已具有一定水平的针对该病毒载体的免疫性的情况下也是如此。
在采用ADVAX质粒DNA和ADMVA候选疫苗的几个初次-加强方案的评价中,所述DNA初次+MVA加强方案诱导抗由5个HIV-1转基因所表达的肽(代表表位)的最强烈的CMI应答。
实施例6:测定免疫动物中的抗HIV-1 Gag抗体
在4℃下,在0.1M NaHCO3,pH 9.6中,将一个板用100μl Gag蛋白(0.5μg/孔)包被过夜(Inanulon-2,Dynex Technologies,Chantilly,VA或Costar EIA/RIA强结合96孔板9018,Corning Inc.,Corning,NY)。该板用200μl磷酸缓冲盐溶液(PBS)洗涤1次,然后在室温下,用5%脱脂奶和0.5%BSA的PBS封闭1-2小时。加入用封闭缓冲液连续稀释的动物血清或对照,然后将该板在室温下孵育1小时。该板用含0.05%Tween-20的PBS洗涤4次。加入碱性磷酸酶标记的山羊抗小鼠IgG(Pharmingen BD);在10ml封闭缓冲液中制备每1μl缀合物的1∶10,000的稀释液,然后该板在室温下孵育30分钟。将该板用AmpliQ洗涤缓冲液洗涤4次。在AmpliQ说明书中包括下述步骤:在室温下,每孔加入100μl新制底物(50μl溶液A与50μl溶液B混合),为时15分钟。反应用AmpliQ终止液终止,然后在15分钟内用分光光度计在490nm对该板读数(AmpliQ;DAKO DiagnosticsLtd.)。
实施例7:针对HIV-1 gp120的体液免疫应答
用间接ELISA测定抗HIV-1 gp120的抗体。在4℃,将CostarEIA/RIA强结合96孔板(Corning Inc.,Corning,NY)用100μl的5μg/ml抗gp120 C端的绵羊抗gp120抗体(International Enzymes,Inc.,Fallbrook,CA)的0.1M NaHCO3(pH 9.6)包被过夜。然后用PBS洗涤,在室温下,通过加入5%脱脂奶、0.5%BSA的PBS而使其封闭2小时。在室温下,加入预滴定亚型C gp120上清液达1小时。然后,该板用PBST洗涤4次。加入免疫小鼠的连续稀释血清或合适的对照,并在室温下孵育1小时。该板如上所述进行洗涤,在室温下加入1∶10,000稀释的碱性磷酸酶标记的山羊抗小鼠IgG(Pharmingen BD)达30分钟。将该板用AmpliQ洗涤缓冲液(DAKO Diagnostics Ltd.)洗涤3次,用AmpliQ底物溶液显影,颜色反应用AmpliQ终止液终止,在15分钟内在490nm进行读数。
实施例8:小鼠IFNγ酶联免疫斑点测定
在第1天,加入1∶50稀释的捕获Ab(例如小鼠IFNγ)以及包被缓冲液(例如125μl的5ml包被缓冲液),预包被酶联免疫斑点测定滤板。用100μl捕获Ab/包被缓冲液包被各孔,然后覆盖并在4℃孵育过夜。在第2天,收获细胞,该板用PBS-Tween洗涤4次。在37℃,各孔用R10(200μl/孔)封闭2小时。根据具体接种计划加入细胞(例如0.5-1.0×106细胞/孔)。然后加入肽并在CO2培养箱中在37℃孵育过夜。在第3天,各板用PBS-T洗涤5次,然后加入100μl/孔的1∶60稀释于1%BSA中的检测Ab。各板在4℃孵育过夜。在第4天,各板用PBS-T洗涤4次,然后加入以1∶60稀释于1%BSA中的100μl/孔SAP。各板在室温下孵育2小时,用PBS-T洗涤4次,随后用双蒸水洗涤1次。每孔含有100μl底物,然后在室温下避光孵育约15分钟或直到完全显色。这些板用自来水洗涤,充分干燥,目测免疫反应斑点。
已经在本发明的详细优选实施方案进行了描述,可以理解,所附权利要求书定义的本发明并不限于以上描述中给出的具体细节,因为可以在不违背本发明的精神或范围下对其进行的许多明显改变。本文所述方法和设备的修改和改变,对于本领域技术人员来说是显而易见的,并且将包括在所附权利要求书中。
参考文献
AIDS Epidemic Update,December 2002,Joint UNAIDS/WHO。
Aiken,C.,Konner,J.,Landau,N.R.,Lenburg,M.E.,Trono,D.:″Nef induces CD4 endocytosis:requirement for a critical dileucine motifin the membrane-proximal CD4 cytoplasmic domain(Nef诱导CD4胞吞作用:对膜近侧CD4胞质结构域中关键性二亮氨酸基序的要求)″.(1994)Cell 76(5):853-64。
Allen,T.M.,Vogel,T.U.,Fuller,D.H.,Mothe,B.R.,Steffen,S.,Boyson,J.E.,Shipley,T.,Fuller,J.,Hanke,T.,Sette,A.,Altman,J.D.,Moss,B.,McMichael,A.J.和Watkins D.I.:″Induction of AIDS virus-specific CTL activity in fresh,unstimulated peripheral blood lymphocytesfrom rhesus macaques vaccinated with a DNA prime/modified vacciniavirus Ankara boost regimen(对来自用DNA初次/修饰痘苗病毒Ankara加强免疫方案免疫的恒河猴的新鲜、未受刺激的外周血淋巴细胞中爱滋病病毒特异性CTL活性的诱导)″.(2000)J.Immunol.164(9):4968-78。
Altenburger,W.,美国专利第5,185,146号。
Altenburger,W.,Suter,C.P.和Altenburger,J.:″Partial deletion ofthe human host range gene in the attenuated vaccinia virus MVA(在减毒痘苗病毒MVA中人类宿主范围基因的部分缺失)″.(1989)Arch Virol.105(1-2):15-27。
Amara,R.R.,Villinger,F.,Altman,J.D.,Lydy,S.L.,O′Neil,S.P.,Staprans,S.I.,Montefiori,D.C.,Xu,Y.,Hemdon,J.G.,Wyatt,L.S.,Candido,M.A.,Kozyr,N.L.,Earl,P.L.,Smith,J.M.,Ma,H.L.,Grimm,B.D.,Hulsey,M.L.,Miller,J.,McClure,H.M.,McNicholl,J.M.,Moss,B.,Robinson,H.L.:″Control of a mucosal challenge and prevention ofAIDS by a multiprotein DNA/MVA vaccine(用多蛋白DNA/MVA疫苗对粘膜攻击的控制和爱滋病的预防)″.(2001)Science 292(5514):69-74。
Barnett,S.W.,Lu,S.Srivastava,I.Cherpelis,S.Gettie,A.Blanchard,J.Wang,S.Mboudjeka,I.Leung,L.Lian,Y.Fong,A.Buckner,C.Lv,A.Hilt,S.Ulmer,J.Wild,C.T.Mascola,J.R.和Stamatatos,L.:″The ability of an oligomeric human immunodeficiencyvirus type 1(HIV-1)envelope antigen to elicit neutralizing antibodiesagainst primary HIV-1 isolates is improved following partial deletion ofthe second hypervariable region(第2超变区部分缺失后,提高寡聚人免疫缺陷病毒1型(HIV-1)包膜抗原引发抗原代HIV-1分离株的中和抗体的能力)″.(2001)J.Virol.75:5526-40。
Barouch,D.H.,Santra,S.,Schmitz,J.E.,Kuroda,M.J.,Fu,T.M.,Wagner,W.,Bilska,M.,Craiu,A.,Zheng,X.X.,Krivulka,G.R.,Beaudry,K.,Lifton,M.A.,Nickerson,C.E.,Trigona,W.L.,Punt,K.,Freed,D.C.,Guan,L.,Dubey,S.,Casimiro,D.,Simon,A.,Davies,M.E.,Chastain,M.,Strom,T.B.,Gelman,R.S.,Montefiori,D.C.,Lewis,M.G.,Emini,E.A.,Shiver,J.W.和Letvin,N.L.:″Control of viremia andprevention of clinical AIDS in rhesus monkeys by cytokine-augmentedDNA vaccination(用增大细胞因子的DNA接种对恒河猴病毒血症的控制和临床爱滋病的预防)″.(2000)Science 290(5491):486-92。
Barouch,D.H.,Santra,S.,Kuroda,M.J.,Schmitz,J.E.,Plishka,R.,Buckler-White,A.,Gaitan,A.E.,Zin,R.,Nam,J.H.,Wyatt,L.S.,Lifton,M.A.,Nickerson,C.E.,Moss,B.,Montefiori,D.C.,Hirsch,V.M.和Letvin,N.L.:″Reduction of simian-human immunodeficiency virus 89.6Pviremia in rhesus monkeys by recombinant modified vaccinia virusAnkara vaccination(用重组修饰痘苗病毒Ankara疫苗降低恒河猴的猿猴-人免疫缺陷病毒89.6P病毒血症)″.(2001)J Virol.75(11):5151-8。
Bender,B.S.,Rowe,C.A.,Taylor,S.F.,Wyatt,L.S.,Moss,B.,Small,P.A.Jr.:″Oral immunization with a replication-deficientrecombinant vaccinia virus protects mice against influenza(复制缺陷型重组痘苗病毒口服免疫保护小鼠免患流感)″.(1996)J virol.70(9):6418-24。
Beyrer,C.,Razak,M.H.,Lisam,K.,Chen,J.,Lui,W.和Yu,X.F.:″Overland heroin trafficking routes and HIV-1 spread in South andSoutheast Asia(陆路海洛因交易路线和HIV-1在南亚和东南亚的扩散)″.(2000)AIDS 14(1):75-83。
Blanchard,T.J.,Alcami,A.,Andrea,P.和Smith,G.L.:″Modifiedvaccinia virus Ankara undergoes limited replication in human cells andlacks several immunomodulatory proteins:implications for use as ahuman vaccine(修饰痘苗病毒Ankara在人类细胞中经历有限复制并缺乏一些免疫调节蛋白:用作人用疫苗的意义)″.(1998)J Gen Virol.79(Pt 5):1159-67。
Buttner,M.,Czerny,C.P.,Lehner,K.H.和Wertz,K.:″Interferoninduction in peripheral blood mononuclear leukocytes of man and farmanimals by poxvirus vector candidates and some poxvirus constructs(通过痘病毒载体候选者和一些痘病毒构建体在人和农场动物的外周血单核白细胞中的干扰素诱导)″.(1995)Vet Immunol Immunopathol.46(3-4):237-50。
Chakrabarti,S.,Brechling,K.和Moss,B.:″Vaccinia virusexpression vector:coexpression of beta-galactosidase provides visualscreening of recombinant virus plaques(痘苗病毒表达载体:β-半乳糖苷酶共表达使得可以目测筛选重组病毒空斑)″.(1985)Mol.Cell.Biol.5(12):3403-9。
Calarota,S.A.,Leandersson,A.C.,Bratt,G.,Hinkula,J.,Klinman,D.M.,Weinhold,K.J.,Sandstrom,E.和Wahren,B.:″Immune responsesin asymptomatic HIV-1-infected patients after HIV-DNA immunizationfollowed by highly active antiretroviral treatment(在HIV-DNA免疫后,用高活性抗逆转录病毒疗法,无症状HIV-1感染者中的免疫应答)″.(199)J Immunol.163(4):2330-8。
Carvalho,L.H.,Hafalla,J.C.和Zavala F.:″ELISPOT assay tomeasure antigen-specific murine CD8(+)T cell responses(用酶联免疫斑点测定法来测量抗原特异性鼠CD8(+)T细胞应答)″.(2001)J ImmunolMethods.252(1-2):207-18。
Chao,S.F.,Chan,V.L.,Juranka,P.,Kaplan,A.H.,Swanstrom,R.,Hutchison,C.A.3rd.:″Mutational sensitivity patterns define criticalresidues in the palm subdomain of the reverse transcriptase of humanimmunodeficiency virus type 1(突变敏感模式确定人免疫缺陷病毒1型逆转录酶的掌状亚结构域中的关键残基)″.(1995)Nucleic Acids Res.23(5):803-10。
Cherpelis,S.,Jin,X.Gettie,A.Ho,D.D.,Barnett,S.W.Shrivastava,I.和Stamatatos,L.;″DNA-immunization with a V2 deleted HIV-1envelope elicits protective antibodies in macaques(用缺失V2的HIV-1包膜的DNA免疫在恒河猴中引发保护性抗体)″.(2001)Immunol Lett79:47-55。
Cherpelis,S.,Shrivastava,I.Gettie,A.Jin,X.Ho,D.D.Barnett,S.W.和Stamatatos L.:″DNA vaccination with the humanimmunodeficiency virus type 1 SF162DeltaV2 envelope elicits immuneresponses that offer partial protection from simian/humanimmunodeficiency virus infection to CD8(+)T-cell-depleted rhesusmacaques(含有人免疫缺陷病毒1型SF162δV2包膜的DNA疫苗引发免疫应答,给CD8(+)T细胞耗竭的恒河猴提供抗猿猴/人免疫缺陷病毒感染的部分保护性)″.(2001)J Virol 75:1547-50。
Coffin,JM Hughes,SM Varmus,HE,″Retroviruses″.(1997)ColdSpring Harbor Laboratory Press,第758-763页。
Collins,K.L.,Chen,B.K.,Kalams,S.A.,Walker,B.D.和Baltimore,D.:″HIV-1 Nef protein protects infected primary cells againstkilling by cytotoxic T lymphocytes(HIV-1 Nef蛋白保护感染原代细胞免于细胞毒性T淋巴细胞的杀伤)″.(1998)Nature 391(6665):397-401。
Collins,K.L.和Baltimore,D.:″HIV′s evasion of the cellularimmune response(HIV逃避细胞免疫应答)″.(1999)Immunol Rev.168:65-74。
Donnelly,J.J.,Barnett,S.W.Dorenbaum,A.和Stamatatos,L.:″Envelope-based HIV vaccines(基于包膜的HIV疫苗)″.(2002)Science297:1277-8;discussion 1277-8。
Dorner,F.,美国专利第6,265,183号。
Dorner,F.,美国专利第5,445,953号。
Falkner,F.G.,美国专利第5,766,882号。
Friedmann,T.,美国专利第6,451,304号。
Friedmann,T.主编,The development of human gene therapy(1999)Cold Spring Harbor Press。
Garber,M.E.,Jones,K.A.:″HIV-1 Tat:coping with negativeelongation factors(HIV-1 Tat:用负延伸因子处理)″.(1999)Curr OpinImmunol.11(4):460-5。
Girard M.:″Prospects for an AIDS vaccine(爱滋病疫苗展望)″.(1990)Cancer Detect Prev.14(3):411-3。
Goldstein,G.:″HIV-1 Tat protein as a potential AIDS vaccine(HIV-1 Tat蛋白作为潜在的爱滋病疫苗)″.(1996)Nat Med.2(9):960-4。
Garber,M.E.和Jones,K.A.:′HIV-1 Tat:coping with negativeelongation factors(HIV-1 Tat:用负延伸因子处理)′.(1999)Curr OpinImmunol.11(4):460-5。
Haddad,D.,Liljeqvist,S.,Stahl,S.,Andersson,I.,Perlmann,P.,Berzins,K.和Ahlborg,N.:″Comparative study of DNA-basedimmunization vectors:effect of secretion signals on the antibodyresponses in mice(基于DNA的免疫载体的比较性研究:分泌信号对小鼠抗体应答的影响)″.(1997)FEMS Immunol Med Microbiol.18(3):193-202。
Hanke,T.,Blanchard,T.J.,Schneider,J.,Ogg,G.S.,Tan,R.,Becker,M.,Gilbert,S.C.,Hill,A.V.,Smith,G.L.和McMichael,A.:″Immunogenicities of intravenous and intramuscular administrations ofmodified vaccinia virus Ankara-based multi-CTL epitope vaccine forhuman immunodeficiency virus type 1 in mice(静脉内和肌内给予基于修饰痘苗病毒Ankara的多CTL表位疫苗在小鼠中对于人免疫缺陷病毒1型的免疫原性)″.(1998)J Gen Virol.79(Pt1):83-90。
Hanke,T.,Neumann,V.C.,Blanchard,T.J.,Sweeney,P.,Hill,A.V.,Smith,G.L.和McMichael,A.:″Effective induction of HIV-specificCTL by multi-epitope using gene gun in a combined vaccination regime(在联合疫苗方案中,使用基因枪,多表位有效诱导HIV特异性CTL)″.(1999)Vaccine.17(6):589-96。
Hanke,T.,Samuel,R.V.,Blanchard,T.J.,Neumann,V.C.,Allen,T.M.,Boyson,J.E.,Sharpe,S.A.,Cook,N.,Smith,G.L.,Watkins,D.I.,Cranage,M.P.和McMichael,A.J.:″Effective induction of simianimmunodeficiency virus-specific cytotoxic T lymphocytes in macaques byusing a multiepitope gene and DNA prime-modified vaccinia virus Ankaraboost vaccination regimen(通过使用多表位基因和DNA初次-修饰痘苗病毒Ankara加强免疫方案,在恒河猴中有效诱导猿猴免疫缺陷病毒特异性细胞毒性T淋巴细胞)″.(1999)J Virol.73(9):7524-32。
Haynes,B.F.:″HIV vaccines;where we are and where we are going(用V疫苗:目前的状况和未来的方向)″.(1996)Lancet.348(9032):933-7。
Hirsch,V.M.,Fuerst,T.R.,Sutter,G.,Carroll,M.W.,Yang,L.C.,Goldstein,S.,Piatak,M.Jr,Elkins,W.R.,Alvord,W.G.,Montefiori,D.C.,Moss,B.和Lifson,J.D.:″Patterns of viral replication correlate withoutcome in simian immunodeficiency virus(SIV)-infected macaques:efiect of prior immunization with a trivalent SIV vaccine in modifiedvaccinia virus Ankara(病毒复制模式与猿猴免疫缺陷病毒(SIV)感染恒河猴的关系:在修饰痘苗病毒Ankara中用三价SIV疫苗的预先免疫效应)″.(1996)J Virol.70(6):3741-52。
Hu,S.L.,Kosowski,S.G.和Dalrymple,J.M.:″Expression of AIDSvirus envelope gene in recombinant vaccinia viruses(爱滋病病毒包膜基因在重组痘苗病毒中的表达)″.(1986)Nature 320:537-40。
Jin,X.,Bauer,D.E.,Tuttleton,S.E.,Lewin,S.,Gettie,A.,Blanchard,J.,Irwin,C.E.,Safrit,J.T.,Mittler,J.,Weinberger,L.,Kostrikis,L.G.,Zhang,L.,Perelson,A.S.和Ho,D.D.:″Dramatic rise inplasma viremia after CD8(+)T cell depletion in simian immunodeficiencyvirus-infected macaques(在猿猴免疫缺陷病毒感染的恒河猴中,CD8(+)T细胞耗竭后,血浆病毒血症的显著升高)″.(1999)J Exp Med.189(6):991-8。
Kimpton,J.和Emerman,M.:′Detection of replication-competent andpseudotyped human immunodeficiency virus with a sensitive cell line onthe basis of activation of an integrated beta-galactosidase gene(在激活整合的β-半乳糖苷酶基因的基础上,用敏感细胞系检测复制型和假型人免疫缺陷病毒)″.(1992)J Virol.66(4):2232-9。
Kingsman,A.J.WO 99/41397。
Kotsopoulou,E.,Kim,V.N.,Kingsman,A.J.,Kingsman,S.M.和Mitrophanous,K.A.:″A Rev-independent human immunodeficiencyvirus type 1(HIV-1)-based vector that exploits a codon-optimized HIV-1gag-pol gene(利用密码子最优化HIV-1 gag-pol基因、基于Rev独立型人免疫缺陷病毒1型(HIV-1)的载体)″.(2000)J Virol.74(10):4839-52。
Lewis,P.,Hensel,M.,Emerman,M.:″Human immunodeficiencyvirus infection of cells arrested in the cell cycle(感染人免疫缺陷病毒的细胞停滞在细胞周期中)″.(1992)EMBO J.11(8):3053-8。
Lewis,P.F.和Emerman,M.:″Passage through mitosis is requiredfor oncoretroviruses but not for the human immunodeficiency virus(致癌逆转录病毒而不是人免疫缺陷病毒需要通过有丝分裂传代)″.(1994)JVirol.68(1):510-6。
Li,Z.,Howard,A.,Kelley,C.,Delogu,G.,Collins,F.和Morris,S.:″Immunogenicity of DNA vaccines expressing tuberculosis proteins fusedto tissue plasminogen activator signal sequences(表达与组织纤溶酶原激活物信号序列融合的结核病蛋白的DNA疫苗的免疫原性)″.(1999)Infect Immun.67(9):4780-6。
Lieberman,H.A.Pharmaceutical dosage forms(1991)MarcelDekker第1-3卷。
Allen,L.V.,Lachman,L.,Schwartz,J.B.,(1999)The Art,Science,and Technology of Pharmaceutical Compounding。
Loeb,D.D.,Swanstrom,R.,Everitt,L.,Manchester,M.,Stamper,S.E.和Hutchison,C.A.3rd.:″Complete mutagenesis of the HIV-1 protease(HIV-1蛋白酶的完全诱变)″.(1989)Nature 340(6232):397-400。
Ly,A.和Stamatatos,L.:″V2 loop glycosylation of the humanimmunodeficiency virus type 1 SF162 envelope facilitates interaction ofthis protein with CD4 and CCR5 receptors and protects the virus fromneutralization by anti-V3 loop and anti-CD4 binding site antibodies(人免疫缺陷病毒1型SF162包膜的V2环糖基化促进该蛋白与CD4和CCR5受体的相互作用,并保护病毒免于抗V3环和抗CD4结合位点抗体的中和作用)″.(2001)J Virol 74:6769-76。
Martinez-Salas,E.:″Internal ribosome entry site biology and its usein expression vectors(内部核糖体进入位点的生物学及其在表达载体中的应用)″.(1999)Curr Opin Biotechnol.10(5):458-64。
Mayr,A.和Danner,K.:″Vaccination against pox diseases underimmunosuppressive conditions(免疫抑制条件下的抗痘病疫苗)″.(1978)Dev Biol Stand 41:225-34。
Mayr,A.,Stickl,H.,Muller,H.K.,Danner,K.和Singer,H.:″Thesmallpox vaccination strain MVA:marker,genetic structure,experiencegained with the parenteral vaccination and behavior in organisms with adebilitated defence mechanism(天花疫苗株MVA:标记、遗传结构、胃肠外接种的经验以及在具有弱化防御机制的生物体中的行为)″.(1978)Zentralbl Bakteriol[B].167(5-6):375-90。
McMichael,A.J.和Rowland-Jones,S.L.:″Cellular immuneresponses to HIV(抗HIV的细胞免疫应答)″.(2001)Nature.410(6831):980-7。
Men,R.,Wyatt,L.Tokimatsu,I.Arakaki,S.Shameem,G.Elkins,R.Chanock,R.Moss,B.和Lai,C.J.:″Immunization of rhesus monkeys witha recombinant of modified vaccinia virus Ankara expressing a truncatedenvelope glycoprotein of dengue type 2 virus induced resistance to denguetype 2 virus challenge(用表达登革2型病毒的截短包膜糖蛋白的修饰痘苗病毒Ankara重组株免疫恒河猴,诱导对登革2型病毒攻击的抗性)″.(2000)Vaccine 18:3113-22。
Merchlinsky,M.和Moss,B.:″Introduction of foreign DNA into thevaccinia virus genome by in vitro ligation:recombination-independentselectable clonihg vectors(将外源DNA经体外连接引入痘苗病毒基因组:重组独立型选择性克隆载体)″.(1992)Virology 190(1):522-6.
Meyer,H.,Sutter,G.和Mayr,A.:″Mapping of deletions in thegenome of the highly attenuated vaccinia virus MVA and their influenceon virulence(高减毒痘苗病毒MVA的基因组缺失作图及其对毒力的影响)″.(1991)J Gen Virol.72(Pt 5):1031-8。
Moss,B.,美国专利第5,866,383号。
Moss,B.,Carroll,M.W.,Wyatt,L. S.,Bennink,J.R.,Hirsch,V.M.,Goldstein,S.,Elkins,W.R.,Fuerst,T.R.,Lifson,J.D.,Piatak,M.,Restifo,N.P.,Overwijk,W.,Chamberlain,R.,Rosenberg,S.A.和Sutter,G.:″Host range restricted,non-replicating vaccinia virus vectors as vaccinecandidates.(宿主范围受限的、非复制型痘苗病毒载体作为疫苗候选者)″.(1996)Adv Exp Med Biol.397:7-13。
Moss B.:″Genetically engineered poxviruses for recombinant geneexpression,vaccination,and safety(遗传工程化痘病毒用于重组基因表达、疫苗接种和安全性)″.(1996)Proc Natl Acad Sci USA.93(21):11341-8。
Najjar,S.M.和Lewis,R.E.:′Persistent expression of foreign genesin cultured hepatocytes: expression vectors.(外源基因在培养肝细胞中的持续表达:表达载体)″.(1999)Gene.230(1):41-5。
Nishimura,Y.,Kamei,A.,Uno-Furuta,S.,Tamaki,S.,Kim,G.,Adachi,Y.,Kuribayashi,K.,Matsuura,Y.,Miyamura,T.,Yasutomi,Y.:″A single immunization with a plasmid encoding hepatitis C virus(HCV)structural proteins under the elongation factor 1-alpha promoter elicitsHCV-specific cytotoxic T-lymphocytes(CTL)(用编码丙型肝炎病毒(HCV)结构蛋白且处于延伸因子1-α启动子控制之下的质粒,进行单次免疫接种,引发HCV特异性细胞毒性T淋巴细胞(CTL))″.(1999)Vaccine 18(7-8):675-80。
Novitsky,V.,Rybak,N.,McLane,M.F.,Gilbert,P.,Chigwedere,P.,Klein,I.,Gaolekwe,S.,Chang,S.Y.,Peter,T.,Thior,I.,Ndung′u,T.,Vannberg,F.,Foley,B.T.,Marlink,R.,Lee,T.H.和Essex,M.:″Identification of human immunodeficiency virus type 1 subtype C Gag-,Tat-,Rev-,and Nef-specific elispot-based cytotoxic T-lymphocyteresponses for AIDS vaccine design(基于人免疫缺陷病毒1型的亚型CGag-,Tat-,Rev-和Nef-特异性酶联免疫斑点测定的细胞毒性T淋巴细胞应答的鉴定,用于爱滋病疫苗设计)″.(2001)J Virol.75(19):9210-28。
Ogg,G.S.,Jin,X.,Bonhoeffer,S.,Dunbar,P.R.,Nowak,M.A.,Monard,S.,Segal,J.P.,Cao,Y.,Rowland-Jones,S.L.,Cerundolo,V.,Hurley,A.,Markowitz,M.,Ho,D.D.,Nixon,D.F.和McMichael,A.J.:″Quantitation of HIV-1-specific cytotoxic T lymphocytes and plasma loadof viral RNA(HIV-1特异性细胞毒性T淋巴细胞和血浆中病毒RNA载量的定量测定)″.(1998)Science 279(5359):2103-6。
Ourmanov,I.,Brown,C.R.Moss,B.Carroll,M.Wyatt,L.Pletneva,L.Goldstein,S.Venzon,D.和Hirsch,V.M.:″Comparative efficacy ofrecombinant modified vaccinia virus Ankara expressing simianimmunodeficiency virus(SIV)Gag-Pol and/or Env in macaqueschallenged with pathogenic SIV(表达猿猴免疫缺陷病毒(SIV)Gag-Pol和/或Env的重组修饰痘苗病毒Ankara在用致病性SIV攻击的恒河猴中的比较功效)″.(2000)J Virol 74:2740-51。
Paoletti,E.,美国专利第5,972,708号。
Paoletti,E.,美国专利第6,340,462号。
Paoletti,E.,美国专利第5,972,597号。
Paoletti,E.,美国专利第5,225,336号。
Paoletti,E.,美国专利第5,204,243号。
Paoletti,E.,美国专利第5,155,020号。
Paoletti,E.,美国专利第5,110,587号。
Paoletti,E.,美国专利第4,769,330号。
Paoletti,E.,美国专利第4,722,848号。
Paoletti,E.,美国专利第4,603,112号。
Paoletti,E.,美国专利第6,596,279号。
Paoletti,E.,美国专利第5,762,938号。
Paoletti,E.,美国专利第5,453,364号。
Paoletti,E.,美国专利第5,378,457号。
Paoletti,E.,美国专利第5,364,773号。
Paoletti,E.,美国专利第5,863,542号。
Paoletti,E.,美国专利第5,766,598号。
Paoletti,E.,美国专利第5,756,103号。
Paoletti,E.,美国专利第5,494,807号。
Paoletti,E.,美国专利第5,364,773号。
Paoletti,E.,美国专利第4,769,330号。
Paoletti,E.,美国专利第5,155,020号。
Paoletti,E.,美国专利第5,204,243号。
Paoletti E.:″Applications of poxvirus vectors to vaccination:anupdate(目前疸病毒载体在免疫接种中的应用)″.(1996)Proc Natl AcadSci USA.93(21):11349-53。
Pfleiderer,M.,Falkner,F.G.和Dorner,F.:″A novel vaccinia virusexpression system allowing construction of recombinants without the needfor selection markers,plasmids and bacterial hosts(一种容许构建重组体而无需选择性标记、质粒和细菌宿主的新型痘苗病毒表达系统)″.(1995)J Gen Virol.76(Pt 12):2957-62。
Pickar,G.D.Dosage Calculations(1999)Delmar Learning,第6版。
Piyasirisilp,S.,McCutchan,F.E.,Carr,J.K.,Sanders-Buell,E.,Liu,W.,Chen,J.,Wagner,R.,Wolf,H.,Shao,Y,Lai,S.,Beyrer,C.和Yu,X.F.:″A recent outbreak of human immunodeficiency virus type 1 infectionin southern China was initiated by two highly homogeneousgeographically separated strains,circulating recombinant form AE and anovel BC recombinant(中国南部地区近期爆发的人免疫缺陷病毒1型感染是由2种高度同源的地理分隔株即循环重组型AE和一种新型BC重组株引起)″.(2000)J.Virol.74(23):11286-95。
Qiu,J.T.,Liu,B.,Tian,C.,Pavlakis,G.N.和Yu,X.F.:″Enhancement of primary and secondary cellular immune responsesagainst human immunodeficiency virus type 1 gag by using DNAexpression vectors that target Gag antigen to the secretory pathway(通过使用使Gag抗原靶向分泌途径的DNA表达载体,增强抗人免疫缺陷病毒1型gag的初级和次级细胞免疫应答)″.(2000)J Virol.74(13):5997-6005。
Remington′s Pharmaceutical Sciences,第17版(1989)MackPublishing。
Robinson,H.L.,Montefiori,D.C.,Johnson,R.P.,Manson,K.H.,Kalish,M.L.,Lifson,J.D.,Rizvi,T.A.,Lu,S.,Hu,S.L.,Mazzara,G.P.,Panicali,D.L.,Herndon,J.G.,Glickman,R.,Candido,M.A.,Lydy,S.L.,Wyand,M.S.和McClure,H.M.:″Neutralizing antibody-independentcontainment of immunodeficiency virus challenges by DNA priming andrecombinant pox virus booster immunizations(DNA初次免疫和重组痘病毒加强免疫对免疫缺陷病毒攻击的中和抗体独立性保护)″.(1999)Nat Med.5(5):526-34。
Sambrook,V.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:ALaboratory Manual第2版(1989)Cold Spring Harbor LaboratoryPress。
Schmitz,J.E.,Kuroda,M.J.,Santra,S.,Sasseville,V.G.,Simon,M.A.,Lifton,M.A.,Racz,P.,Tenner-Racz,K.,Dalesandro,M.,Scallon,B.J.,Ghrayeb,J.,Forman,M.A.,Montefiori,D.C.,Rieber,E.P.,Letvin,N.L.和Reimann,K.A.:″Control of viremia in simian immunodeficiencyvirus infection by CD8+lymphocytes(在猿猴免疫缺陷病毒感染中CD8+淋巴细胞对病毒血症的控制)″.(1999)Science 283(5403):857-60。
Schneider,R.,Campbell,M.,Nasioulas,G.,Felber,B.K.和Pavlakis,G.N.:″Inactivation of the human immunodeficiency virus type 1inhibitory elements allows Rev-independent expression of Gag andGag/protease and particle formation(人免疫缺陷病毒1型抑制元件的失活允许Rev独立性表达Gag和Gag/蛋白酶和颗粒形成)″.(1997)JVirol.71(7):4892-903。
Sodroski,J.G.,美国专利第5,665,577号。
Spira,S.,Wainberg,M.A.,Loemba,H.,Turner,D.和Brenner,B.G.:″Impact of clade diversity on HIV-1 virulence,antiretroviral drugsensitivity and drug resistance(基因亚型多样性对HIV-1毒力、抗逆转录病毒药物敏感性和抗药性的影响)″.(2003)J Antimicrob Chemother.51(2):229-40。
Stamatatos,L.,Lim,M.和Cheng-Mayer,C.:″Generation andstructural analysis of soluble oligomeric gp140 envelope proteins derivedfrom neutralization-resistant and neutralization-susceptible primary HIVtype 1 isolates(来自中和作用抗性和中和作用敏感性的原代HIV-1型分离株的可溶性寡聚gp140包膜蛋白的产生和结构分析)″.(2000)AIDS Res Hum Retroviruses 16:981-94。
Stickl,H.,Hochstein-Mintzel,V.Mayr,A.Huber,H.C.Schafer,H.和Holzner,A.:″MVA vaccination against smallpox:clinical tests with anattenuated live vaccinia virus strain(MVA)(抗天花的MVA疫苗:用减毒活痘苗病毒株(MVA)的临床试验)(author′s transl)″.(1974)DtschMed Wochenschr 99:23 86-92。
Sutter,G.和Moss,B.:″Nonreplicating vaccinia vector efficientlyexpresses recombinant genes(非复制型痘苗病毒载体有效表达重组基因)″.(1992)Proc Natl Acad Sci USA.89(22):10847-51。
Sutter,G.,Wyatt,L.S.Foley,P.L.Bennink,J.R.和Moss,B.:″Arecombinant vector derived from the host range-restricted and highlyattenuated MVA strain of vaccinia virus stimulates protective immunity inmice to influenza virus(一种来自宿主范围局限性和高度减毒痘苗病毒MVA株的重组载体刺激小鼠产生抗流感病毒的保护性免疫)″.(1994)Vaccine 12:1032-40。
Takahashi,H.,Cohen,J.Hosmalin,A.Cease,K.B.Houghten,R.Cornette,J.L.DeLisi,C.Moss,B.Germain,R.N.和Berzofsky,J.A.:″An immunodominant epitope of the human immunodeficiency virusenvelope glycoprotein gp160 recognized by class I majorhistocompatibility complex molecule-restricted murine cytotoxic Tlymphocytes(一种人免疫缺陷病毒包膜糖蛋白gp160的优势免疫表位,被I类主要组织相容性复合物分子一限制性鼠细胞毒性T淋巴细胞所识别)″.(1988)Proc Natl Acad Sci USA 85:3105-9。
Tang,D.C.,Devit,M.,Johnston,S.A.:″Genetic Immunization is aSimple Method for Eliciting an Immune Response(遗传免疫是引发免疫应答的简单方法)″.(1992)Nature 356:152-154。
Tobery,T.W.,Wang,S.,Wang,X.M.,Neeper,M.P.,Jansen,K.U.,McClements,W.L.和Caulfield,M.J.:″A simple and efficient method torthe monitoring of antigen-specific T cell responses using peptide poolarrays in a modified ELISpot assay(一种简单而有效的监测抗原特异性T细胞应答的方法,在改良酶联免疫斑点测定法中采用肽库阵列)″.(2001)J Immunol Methods.254(1-2):59-66。
Wakefield,J.K.,Jablonski,S.A.和Morrow,C.D.:″In vitroenzymatic activity of human immunodeficiency virus type 1 reversetranscriptase mutants in the highly conserved YMDD amino acid motifcorrelates with the infectious potential of the proviral genome(在高度保守YMDD氨基酸基序中人免疫缺陷病毒1型逆转录酶突变体的体外酶活性与原病毒基因组感染潜力有关)″.(1992)J Virol.66(11):6806-12。
Walker,S.,Sofia,M.J.,Kakarla,R.,Kogan,N.A.,Wierichs,L.,Longley,C.B.,Bruker,K.,Axelrod,H.R.,Midha,S.,Babu,S.和Kahne,D.:″Cationic facial amphiphiles:a promising class of transfection agents(阳离子表面两亲性化合物:一类有希望的转染剂)″.(1996)Proc NatlAcad Sci USA.93(4):1 585-90。
Wallich,R.,Siebers,A.,Jahraus,O.,Brenner,C.,Stehle,T.和Simon,M.M.:″DNA vaccines expressing a fusion product of outer surfaceproteins A and C from Borrelia burgdofferi induce protective antibodiessuitable for prophylaxis but Not for resolution of Lyme disease(表达来自布氏疏螺旋体外表面蛋白A和C的融合产物的DNA疫苗诱导适用于预防但不能用于消除莱姆病的保护性抗体)″.(2001)Infect Immun.69(4):2130-6。
Weiss,R.,Durnberger,J.,Mostbock,S.,Scheiblhofer,S.,Hartl,A.,Breitenbach,M.,Strasser,P.,Dorner,F.,Livey,I.,Crowe,B.和Thalhamer,J.:″Improvement of the immune response against plasmidDNA encoding OspC of Borrelia by an ER-targeting leader sequence(用靶向ER的前导序列提高抗编码疏螺旋体的OspC的质粒DNA的免疫应答)″.(1999)Vaccine 18(9-10):815-24。
Williams,S.G.,Cranenburgh,R.M.,Weiss,A.M.,Wrighton,C.J.,Sherratt,D.J.和Hanak,J.A.:″Repressor titration:a novel system forselection and stable maintenance of recombinant plasmids(阻抑蛋白滴定:一个用于选择和稳定保持重组质粒的新系统)″.(1998)NucleicAcids Res.26(9):2120-4。
Yu,X.F.,Liu,W.,Chen,J.,Kong,W.,Liu,B.,Yang,J.,McCutchan,F.,Piyasirisilp,S.,Lai,S.:″Rapid dissemination of a novel B/Crecombinant HIV-1 among injection drug users in southern China(新型B/C重组HIV-1在中国南部地区注射吸毒者中的快速扩散)″.(2001)AIDS 15(4):523-5。
                            序列表
<110>艾伦·戴蒙德研究所(Aaron Diamond Institute)
<120>用于抗HIV-1免疫的方法和组合物
<130>678501-2001.WO
<160>41
<170>PatentIn version 3.2
<210>1
<211>23
<212>PRT
<213>人工序列
<220>
<223>片段
<400>1
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser Ala Arg
            20
<210>2
<211>9
<212>PRT
<213>人工序列
<220>
<223>片段
<400>2
Ala Met Gly Met Leu Lys Asp Thr Ile
1               5
<210>3
<211>20
<212>PRT
<213>人工序列
<220>
<223>片段
<400>3
Val Pro Val Trp Lys Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp
1               5               10                      15
Ala Lys Ala Tyr
            20
<210>4
<211>20
<212>PRT
<213>人工序列
<220>
<223>片段
<400>4
Arg Asn Val Ser Ser Asp Gly Thr Tyr Asn Glu Thr Tyr Asn Glu Ile
1               5                   10                  15
Lys Asn Cys Ser
        20
<210>5
<211>20
<212>PRT
<213>人工序列
<220>
<223>片段
<400>5
Thr Ser Asn Pro Pro Ile Pro Val Gly Asp Ile Tyr Lys Arg Trp Ile
1               5                   10                  15
Ile Leu Gly Leu
            20
<210>6
<211>9
<212>PRT
<213>人工序列
<220>
<223>片段
<400>6
Ala Met Gln Met Leu Lys Asp Thr Ile
1               5
<210>7
<211>2520
<212>DNA
<213>人(Homo sapiens)
<400>7
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt     60
agcgccgccg agaacttgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc    120
aagaccaccc tgttctgcgc ctccgacgcc aaggcctacg agaaggaggt gcacaacgtg     180
tgggccaccc acgcctgcgt gcccaccgac cccaaccccc aggagatggt gttggagaac     240
gtgaccgaga acttcaacat gtggaagaac gacatggtga accagatgca cgaggacgtc     300
atcagcttgt gggaccagag cctgaagccc tgcgtgaagt tgacccccct gtgcgtgacc     360
ttggagtgca ggaacgtgag cagcaacggc acctacaacg agacctacaa cgagatcaag     420
aactgctcct tcaacgccac caccgtgttg agggacagga agcagaccgt gtacgccctg     480
ttctacaggc tggacatcgt gcccctgaac aagaagaact ccagcgagaa ctccagcgag     540
tactacaggt tgatcaactg caacacctcc gccatcaccc aggcctgccc caaggtgacc     600
ttcgacccca tccccatcca ctactgcacc cccgccggct acgccatcct gaagtgcaac     660
gacaagacct tcaacggcac cggcccctgc cacaacgtga gcaccgtgca gtgcacccac     720
ggcatcaagc ccgtggtgtc cacccagctg ctgttgaacg gcagcctggc cgagagggag     780
atcatcatca ggtccgagaa cctgaccaac aacgtgaaga ccatcatcgt gcacctgaac     840
cagtccgtgg agatcgtgtg caccaggccc aacaacaaca ccaggaagag catcaggatc     900
ggccccggcc agaccttcta cgccaccggc gacatcatcg gcgacatcag gcaggcccac     960
tgcaacatca gcaaggacaa gtggaaggag accttgcaga gggtgggcaa gaagttggcc    1020
gagcacttcc ccaacaaagc catcgagttc gcctcctcct ccggcggcga cctggagatc    1080
accacccaca gcttcaactg caggggcgag ttcttctact gcaacacctc cagcctgttc    1140
aacggcacct acatgcccaa cggcaccgag ggcaactcca gctccatcat caccatcccc    1200
tgcaggatca agcagatcat caacatgtgg caggaggtgg gccgcgccat gtacgccccc    1260
cccatcgagg gcaacatcac ctgcaagtcc aacatcaccg gcctgctgtt ggtgcgcgac    1320
ggcggcaagg agaccaacga caccgagacc ttcaggcccg gcggcggcga catgagggac    1380
aactggagga gcgagttgta caagtacaag gtggtggaga tcaagccctt gggcatcgcc    1440
cccaccgccg ccaagaggag ggtggtggag agggagaaga gggccgtggg catcggcgcc    1500
gtgttcctgg gcttcctggg cgccgccggc agcaccatgg gcgccgccag catcaccctg    1560
accgtgcagg cccgccagct gctgagcggc atcgtgcagc agcagagcaa cctgctgcgc    1620
gccatcgagg cccagcagca cctgctgcag ctgaccgtgt ggggcatcaa gcagctgcag    1680
acccgcgtcc tggccatcga gcgctacctg aaggaccagc agctgctggg catctggggc    1740
tgcagcggca agctgatctg caccaccgcc gtgcactgga acagcagctg gagcaaccgc    1800
agccaggagg agatctggaa caacatgacc tggatgcagt gggaccgcga gatcagcaac    1860
tacaccaaca ccatctaccg cctgctggag gacagccaga accagcagga gcgcaacgag    1920
aaggacctgc tggccctgga caactggaag aacctgtgga gctggttcga catcaccaac    1980
tggctgtggt acatccgcat cttcatcatg atcgtgggcg gcctgatcgg cctgcgcatc    2040
atcttcgccg tgctgagcat cgtgaaccgc gtgcgccagg gctacagccc cctgagcttc    2100
cagaccctga cccccaaccc cggcggcccc gaccgcctgg gccgcatcga ggaggagggc    2160
ggcgagcagg acaagaaccg cagcatccgc ctggtgaacg gcttcctggc cctggcctgg    2220
gacgacctgc gcaacctgtg ccgcttcagc taccacctgc tgcgcgacct gctgctgatc    2280
gtggcccgca tcgtggagct gctgggccgc cgcggctggg aggccctgcg ctactggtgg    2340
aacctgctga agtactgggt gcaggagctg aagaacagcg ccgtgagcct gctgaacgcc  2400
accgccatcg ccgtggccga gggcaccgac cgcgtgatcg aggtggtgca gggcgcctac  2460
cgcgccatcc tgcacatccc ccgccgcatc cgccagggct tcgaggccgc cctgcagtaa  2520
<210>8
<211>839
<212>PRT
<213>人(Homo sapiens)
<400>8
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser Ala Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr
            20                  25                  30
Gly Val Pro Val Trp Lys Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser
        35                  40                  45
Asp Ala Lys Ala Tyr Glu Lys Glu Val His Asn Val Trp Ala Thr His
    50                  55                  60
Ala Cys Val Pro Thr Asp Pro Asn Pro Gln Glu Met Val Leu Glu Asn
65                 70                   75                  80
Val Thr Glu Asn Phe Asn Met Trp Lys Asn Asp Met Val Asn Gln Met
                85                  90                  95
His Glu Asp Val Ile Ser Leu Trp Asp Gln Ser Leu Lys Pro Cys Val
            100                 105                 110
Lys Leu Thr Pro Leu Cys Val Thr Leu Glu Cys Arg Asn Val Ser Ser
        115                 120                 125
Asn Gly Thr Tyr Asn Glu Thr Tyr Asn Glu Ile Lys Asn Cys Ser Phe
    130                 135                 140
Asn Ala Thr Thr Val Leu Arg Asp Arg Lys Gln Thr Val Tyr Ala Leu
145                  150                155                 160
Phe Tyr Arg Leu Asp Ile Val Pro Leu Asn Lys Lys Asn Ser Ser Glu
                165                170                  175
Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile
            180                 185                 190
Thr Gln Ala Cys Pro Lys Val Thr Phe Asp Pro Ile Pro Ile His Tyr
        195                 200                 205
Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asp Lys Thr Phe
    210                 215                 220
Asn Gly Thr Gly Pro Cys His Asn Val Ser Thr Val Gln Cys Thr His
225                 230                 235                 240
Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu
                245                 250                 255
Ala Glu Arg Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Val
            260                 265                 270
Lys Thr Ile Ile Val His Leu Asn Gln Ser Val Glu Ile Val Cys Thr
        275                 280                 285
Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln
    290                 295                 300
Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His
305                 310                 315                 320
Cys Asn Ile Ser Lys Asp Lys Trp Lys Glu Thr Leu Gln Arg Val Gly
                325                 330                 335
Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr Ile Glu Phe Ala Ser
            340                 345                 350
Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg
        355                 360                 365
Gly Glu Phe Phe Tyr Cys Asn Thr Ser Ser Leu Phe Asn Gly Thr Tyr
    370                 375                 380
Met Pro Asn Gly Thr Glu Gly Asn Ser Ser Ser Ile Ile Thr Ile Pro
385                 390                 395                 400
Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala
                405                 410                 415
Met Tyr Ala Pro Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile
            420                 425                 430
Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Lys Glu Thr Asn Asp Thr
        435                 440                 445
Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Asp Asp Asn Trp Arg Ser
    450                 455                 460
Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala
465                 470                 475                 480
Pro Thr Ala Ala Lys ArgArg Val Val Glu Arg Glu Lys Arg Ala Val
                485                490                 495
Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr
            500                 505                 510
Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu
        515                 520                 525
Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala
    530                 535                 540
Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln
545                 550                 555                 560
Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu
                565                 570                 575
Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val His
            580                 585                 590
Trp Asn Ser Ser Trp Ser Asn Arg Ser Gln Glu Glu Ile Trp Asn Asn
        595                 600                 605
Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr
    610                 615                 620
Ile Tyr Arg Leu Leu Glu Asp Ser Gln Asn Gln Gln Glu Arg Asn Glu
625                 630                 635                 640
Lys Asp Leu Leu Ala Leu Asp Asn Trp Lys Asn Leu Trp Ser Trp Phe
                645                 650                 655
Asp Ile Thr Asn Trp Leu Trp Tyr Ile Arg Ile Phe Ile Met Ile Val
            660                 665                 670
Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe Ala Val Leu Ser Ile Val
        675                 680                 685
Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr Leu Thr
    690                  695                700
Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly Arg Ile Glu Glu Glu Gly
705                 710                 715                 720
Gly Glu Gln Asp Lys Asn Arg Ser Ile Arg Leu Val Asn Gly Phe Leu
                725                 730                 735
Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu Cys Arg Phe Ser Tyr His
            740                 745                 750
Leu Leu Arg Asp Leu Leu Leu Ile Val Ala Arg Ile Val Glu Leu Leu
        755                 760                 765
Gly Arg Arg Gly Trp Glu Ala Leu Arg Tyr Trp Trp Asn Leu Leu Lys
    770                 775                 780
Tyr Trp Val Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn Ala
785                 790                 795                 800
Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val Val
                805                 810                 815
Gln Gly Ala Tyr Arg Ala Ile Leu His Ile Pro Arg Arg Ile Arg Gln
            820                 825                 830
Gly Phe Glu Ala Ala Leu Gln
        835
<210>9
<211>1545
<212>DNA
<213>人(Homo sapiens)
<400>9
atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg     60
agcgcccgca tgggcgcccg cgccagcatc ctgcgcggcg gcaagctgga caagtgggag    120
aagatccgcc tgcgccccgg cggcaagaag cactacatgc tgaagcacct ggtgtgggcc    180
agccgcgagc tggagcgctt cgccctgaac cccggcctgc tggagaccag cgagggctgc    240
aagcagatca tcaagcagct gcagcccgcc ctgcagaccg gcaccgagga gctgcgcagc    300
ctgttcaaca ccgtggccac cctgtactgc gtgcacgagg gcatcgagat ccgcgacacc    360
aaggaggccc tggacaagat cgaggaggag cagaacaaga tccagcagaa gacccagcag    420
gccaagaagg ccgacgagaa ggtgagccag aactacccca tcgtgcagaa cctgcagggc    480
cagatggtgc accaggccat ctcccccagg accttgaacg cctgggtgaa ggtgatcgag    540
gagaaggcct tcagccccga ggtgatcccc atgttcaccg ccttgtccga gggcgccacc   600
ccccaggact tgaacaccat gttgaacacc gtgggcggcc accaggccgc catgcagatg   660
ttgaaggaca ccatcaacga ggaggccgcc gagtgggaca gggtgcaccc cgtgcacgcc   720
ggccccatcg cccccggcca gatgagggag cccaggggca gcgacatcgc cggcaccacc   780
agcaccctgc agggccagat cgcctggatg accagcaacc cccccgtgcc cgtgggcgag   840
atctacaaga ggtggatcat cctgggcttg aacaagatcg tgaggatgta cagccccgtg   900
agcatcttgg acatcaagca gggccccaag gagcccttca gggactacgt ggaccgcttc   960
ttcaagacct tgagggccga gcaggccacc caggacgtga agaactggat gaccgacacc  1020
ttgttggtgc agaacgccaa ccccgactgc aagaccatct tgagggcctt gggccccggc  1080
gcctccttgg aggagatgat gaccgcctgc cagggcgtgg gcggccccag ccacaaggcc  1140
agggtgttgg ccgaggccat gagccaggcc aacggcacca tcctgatgca gaggagcaac  1200
ttcaagggct ccaagaggat cgtgaagtgc ttcaactgcg gcaaggaggg ccacatcgcc  1260
aggaactgca gggcccccag gaagaagggc tgctggaagt gcggcaagga gggccaccag  1320
atgaaggact gcaccgagag gcaggccaac ttcttgggca agatctggcc ctcccacaag  1380
ggcaggcccg gcaacttcct gcagagcagg cccgagccca ccgccccccc cgccgagagc  1440
ttcaggttcg aggagaccac ccccgccccc aagcaggagc ccaaggacag ggagcccttg  1500
acctccctga agtccctgtt cggcagcgac cccttgtccc agtaa                  1545
<210>10
<211>514
<212>PRT
<213>人(Homo sapiens)
<400>10
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser Ala Arg Met Gly Ala Arg Ala Ser Ile Leu Arg
            20                  25                 30
Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly
        35                  40                  45
Lys Lys His Tyr Met Leu Lys His Leu Val Trp Ala Ser Arg Glu Leu
    50                  55                  60
Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys
65                  70                  75                  80
Lys Gln Ile Ile Lys Gln Leu Gln Pro Ala Leu Gln Thr Gly Thr Glu
                85                  90                  95
Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Leu Tyr Cys Val His
            100                 105                 110
Glu Gly Ile Glu Ile Arg Asp Thr Lys Glu Ala Leu Asp Lys Ile Glu
        115                 120                 125
Glu Glu Gln Asn Lys Ile Gln Gln Lys Thr Gln Gln Ala Lys Lys Ala
    130                 135                140
Asp Glu Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly
145                 150                 155                 160
Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val
                165                 170                 175
Lys Val Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe
            180                 185                 190
Thr Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu
        195                 200                 205
Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Asp Thr
    210                 215                 220
Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala
225                 230                 235                 240
Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile
                245                 250                 255
Ala Gly Thr Thr Ser Thr Leu Gln Gly Gln Ile Ala Trp Met Thr Ser
            260                 265                 270
Asn Pro Pro Val Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu
        275                 280                 285
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Asp
    290                 295                 300
Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe
305                 310                 315                 320
Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Asp Val Lys Asn Trp
                325                 330                 335
Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr
            340                 345                 350
Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Leu Glu Glu Met Met Thr
        355                 360                 365
Ala Cys Gln Gly Val Gly Gly Pro Ser His Lys Ala Arg Val Leu Ala
    370                 375                 380
Glu Ala Met Ser Gln Ala Asn Gly Thr Ile Leu Met Gln Arg Ser Asn
385                 390                 395                 400
Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys Glu
                405                 410                 415
Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp
            420                 425                 430
Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln
        435                 440                 445
Ala Asn Phe Leu Gly Lys Ile Trp Pro Ser His Lys Gly Arg Pro Gly
    450                 455                 460
Asn Phe Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Ala Glu Ser
465                 470                 475                 480
Phe Arg Phe Glu Glu Thr Thr Pro Ala Pro Lys Gln Glu Pro Lys Asp
                485                 490                 495
Arg Glu Pro Leu Thr Ser Leu Lys Ser Leu Phe Gly Ser Asp Pro Leu
            500                 505                 510
Ser Gln
<210>11
<211>2901
<212>DNA
<213>人(Homo sapiens)
<400>11
atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg     60
agcgcccgcc cccagatcac cctgtggcag cgccccctgg tgtccatccg cgtgggcggc    120
cagatcaagg aggccctgct ggacgacacc gtgttggagg aggtgaactt gcccggcaag    180
tggaagccca agatgatcgg cggcatcggc ggcttcatca aggtgaggca gtacgaccag    240
atccccatcg agatctgcgg caagaaggcc atcggcaccg tgttggtggg ccccaccccc    300
gtgaacatca tcggcaggaa catgttgacc cagctgggct gcaccctgaa cttccccatc    360
agccccatcg agaccatccc cgtgaagctg aagcccggca tggacggccc ccgcgtgaag    420
cagtggcccc tgaccgagga gaagatcaag gccctgaccg ccatctgcga cgagatggag    480
aaggagggca agatcaccaa gatcggcccc gagaacccct acaacacccc cgtgttcgcc    540
atcaagaaga aggacagcac caagtggcgc aagctggtgg acttccgcga gctgaacaag    600
cgcacccagg acttctggga ggtgcagctg ggcatccccc accccgccgg cctgaagaag    660
aagaagtccg tgaccgtgct ggacgtgggc gacgcctact tctccgtgcc cctgtacgag    720
gacttccgca agtacaccgc cttcaccatc cccagcatca acaacgagac ccccggcatc    780
cgctaccagt accacgtgct gccccagggc tggaagggct cccccgccat cttccagtgc    840
agcatgacca agatcctgga gcccttccgg gcccagaacc ccgagatcgt gatctaccag    900
tacggcgacg acctgtacgt gggctccgac ctggagatcg gccagcaccg cgccaagatc    960
gaggagttgc gcgagcacct gctgaagtgg ggcttcacca cccccgacaa gaagcaccag   1020
aaggagcccc ccttcctgtg gatgggctac gagctgcacc ccgacaagtg gaccgtgcag   1080
cccatccagc tgcccgagaa ggacagctgg accgtgaacg acatccagaa gctggtgggc   1140
aagctgaact gggccagcca gatctacccc ggcatcaagg tgcgccagct gtgcaagctg  1200
ctgcgcggcg ccaaggccct gaccgacatc atccccctga ccgaggaggc cgagctggag  1260
ctggccgaga accgcgagat cctgaaggag cccgtgcacg gcgcctacta cgacccctcc  1320
aaggacctga tcgccgagat ccagaagcag ggccaggacc agtggaccta ccagatctac  1380
caggagccct tcaagaacct gaagaccggc aagtacgcca agatgcgcac cgcccacacc  1440
aacgacgtga agcagctgac cgaggccgtg cagaagatct ccatggagag catcgtgatc  1500
tggggcaaga tccccaagtt ccgcctgccc atccagaagg agacctggga gacccgctgg  1560
accgcctact ggcaggccac ctggatcccc gagtgggagt tcgtgaacac cccccccctg  1620
gtgaagctgt ggtaccagct ggagaaggac cccatcgccg gcgtggagac cttctacgtg  1680
gacggcgccg ccaaccgcga gaccaagatg ggcaaggccg gctacgtgac cgaccgcggc  1740
cgccagaaga tcgtgtccct gaccgagacc accaaccaga agaccgagct gcaggccatc  1800
tgcctggcct tgcaggactc cggctccgag gtgaacatcg tgaccgactc ccagtacgcc  1860
ctgggcatca tccaggccca gcccgacaag agcgagtccg agctggtgaa ccagatcatc  1920
gagcagctga tcaagaagga gcgcgtgtac ctgtcctggg tgcccgccca caagggcatc  1980
ggcggcaacg agcaggtgga caagctggtg agcaacggca tccgcaaggt gctgttcctg  2040
gacggcatcg acaaggccca ggaggagcac gagaagtacc acagcaactg gcgcgccatg  2100
gccagcgact tcaacctgcc ccccatcgtg gccaaggaga tcgtggccag ctgcgaccag  2160
tgccagctga agggcgaggc catgcacggc caggtggact gcagccccgg catctggcag  2220
ctggactgca cccacctgga gggcaagatc atcctggtgg ccgtgcacgt ggccagcggc  2280
tacatcgagg ccgaggtgat ccccgccgag accggccagg agaccgccta cttcatcctg  2340
aagctggccg gccgctggcc cgtgaagatc atccacaccg acaacggcag caacttcacc  2400
agcgccgccg tgaaggccgc ctgctggtgg gccggcatcc agcaggagtt cggcatcccc  2460
tacaaccccc agagccaggg cgtggtggag tccatgaaca aggagctgaa gaagatcatc  2520
ggccaggtgc gcgaccaggc cgagcacctg aagaccgccg tgcagatggc cgtgttcatc  2580
cacaacttca agcgcaaggg cggcatcggc ggctacagcg ccggcgagcg catcatcgac  2640
atcatcgcca ccgacatcca gaccaaggag ctgcagaagc agatcatcaa gatccagaac  2700
ttccgcgtgt actaccgcga cagccgcgac cccatctgga agggccccgc caagctgctg  2760
tggaagggcg agggcgccgt ggtgatccag gacaacagcg acatcaaggt ggtgccccgc  2820
cgcaaggcca agatcatcaa ggactacggc aagcagatgg ccggcgccga ctgcgtggcc  2880
agccgccagg acgaggacta g                                            2901
<210>12
<211>966
<212>PRT
<213>人(Homo sapiens)
<400>12
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser Ala Arg Pro Gln Ile Thr Leu Trp Gln Arg Pro
            20                  25                  30
Leu Val Ser Ile Arg Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp
        35                  40                  45
Asp Thr Val Leu Glu Glu Val Asn Leu Pro Gly Lys Trp Lys Pro Lys
    50                  55                  60
Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln
65                  70                  75                   80
Ile Pro Ile Glu Ile Cys Gly Lys Lys Ala Ile Gly Thr Val Leu Val
                85                  90                  95
Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn Met Leu Thr Gln Leu
            100                 105                 110
Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile Glu Thr Ile Pro Val
        115                 120                 125
Lys Leu Lys Pro Gly Met Asp Gly Pro Arg Val Lys Gln Trp Pro Leu
    130                 135                 140
Thr Glu Glu Lys Ile Lys Ala Leu Thr Ala Ile Cys Asp Glu Met Glu
145                 150                 155                 160
Lys Glu Gly Lys Ile Thr Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr
                165                 170                 175
Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu
            180                 185                 190
Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val
        195                 200                 205
Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val
    210                 215                 220
Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Tyr Glu
225                 230                 235                 240
Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu
                245                 250                 255
Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys
            260                 265                 270
Gly Ser Pro Ala Ile Phe Gln Cys Ser Met Thr Lys Ile Leu Glu Pro
        275                 280                 285
Phe Arg Ala Gln Asn Pro Glu Ile Val Ile Tyr Gln Tyr Gly Asp Asp
    290                 295                 300
Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Ala Lys Ile
305                 310                 315                 320
Glu Glu Leu Arg Glu His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp
                325                 330                 335
Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Thr Glu Leu
            340                 345                 350
His Pro Asp Lys Trp Thr Val Gln Pro Ile Gln Leu Pro Glu Lys Asp
       355                  360                 365
Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp
    370                 375                 380
Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu
385                 390                 395                 400
Leu Arg Gly Ala Lys Ala Leu Thr Asp Ile Ile Pro Leu Thr Glu Glu
                405                 410                 4l5
Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val
            420                 425                 430
His Gly Ala Tyr Tyr Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln
        435                 440                 445
Lys Gln Gly Gln Asp Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe
    450                 455                 460
Lys Asn Leu Lys Thr Gly Lys Tyr Ala Lys Met Arg Thr Ala His Thr
465                 470                 475                 480
Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln Lys Ile Ser Met Glu
                485                 490                 495
Ser Ile Val Ile Gln Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile Gln
            500                 505                 510
Lys Glu Thr Trp Glu Thr Arg Trp Thr Ala Tyr Trp Gln Ala Thr Trp
        515                 520                 525
Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp
    530                 535                 540
Trp Gln Leu Glu Lys Asp Pro Ile Ala Gly Val Glu Thr Phe Tyr Val
545                 550                 555                 560
Asp Gly Ala Ala Asn Arg Glu Thr Lys Met Gly Lys Ala Gly Tyr Val
                565                 570                 575
Thr Asp Arg Gly Arg Gln Lys Ile Val Ser Leu Thr Glu Thr Thr Asn
            580                 585                 590
Gln Lys Thr Glu Leu Gln Ala Ile Cys Leu Ala Leu Gln Asp Ser Gly
        595                 600                 605
Ser Glu Val Asn Ile Val Thr Asp Ser Gln Tyr AIa Leu Gly Ile Ile
    610                 615                 620
Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu Val Asn Gln Ile Ile
625                 630                 635                 640
Glu Gln Leu Ile Lys Lys Glu Arg Val Tyr Leu Ser Thr Val Pro Ala
                645                 650                 655
His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Asn
            660                 665                 670
Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln Glu
        675                 680                 685
Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp Phe
    690                 695                 700
Asn Leu Pro Pro Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp Gln
705                 710                 715                 720
Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys Ser Pro
                725                 730                 735
Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile Leu
            740                 745                 750
Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro
        755                 760                 765
Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly
    770                 775                 780
Arg Trp Pro Val Lys Ile Ile His Thr Asp Asn Gly Ser Asn Phe Thr
785                 790                 795                 800
Ser Ala Ala Val Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln Glu
                805                 810                 815
Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly Val Val Glu Ser Met
            820                 825                 830
Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val Arg Asp Gln Ala Glu
        835                 840                 845
His Leu Lys Thr Ala Val Gln Met Ala Val Phe Ile His Asn Phe Lys
    850                 855                 860
Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly Glu Arg Ile Ile Asp
865                 870                 875                 880
Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu Gln Lys Gln Ile Ile
                885                 890                 895
Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro Ile
            900                 905                 910
Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala ValVal
        915                 920                 925
Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys
    930                 935                 940
Ile Ile Lys Asp Tyr Gly Lys Gln Met Ala Gly Ala Asp Cys Val Ala
945                 950                  955                960
Ser Arg Gln Asp Glu Asp
                965
<210>13
<2ll>993
<212>DNA
<213>人(Homo sapiens)
<400>13
atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg     60
agcgcccgca tgggcggcaa gtggtccaag agcagcatcg tgggctggcc cgccatccgc    120
gagcgcattc gccgcaccga gcccgccgcc gacggcgtgg gcgccgtgtc tcgcgacctg    180
gagaagcatg gcgccatcac cagtaacaac accgccgaca ccaacgccga ctgcgcctgg    240
ctggagaccc aggaggagga ggaggtgggc ttccccgtcc gcccccaggt gcccttgcgc    300
cccatgacct tcaagggcgc cttggacctc agcttcttcc tgaaggagaa gggcggcctg    360
gaggggttga tctacagcaa gaagaggcag gagatcctgg acttgtgggt ctaccacacc    420
cagggctact tccccgactg gcacaactac acccccggcc ccggcgtccg cttccccctg    480
accttcggct ggtgcttcaa gctggtgccc gtggaccccg gcgaggtgga ggaggccaac    540
gagggcgaga acaactgctt gctgcacccc gtctgccagc acggcatgga cgacgagcac    600
cgcgaggtgc tgaagtggaa gttcgacagc cagctggccc accgccacag ggcccgcgag    660
ctgcacccgg agttctacaa ggactgcatg gagcccgtgg accccaacct ggagccctgg    720
aaccaccccg gcagccagcc cgagaccgcc tgcaacaact gctactgcaa gcgctgcagc    780
taccactgcc tggtgtgctt ccagaagaag ggcctgggca tcagctacgg ccgcaagaag    840
cgccgccagc gccgcagcgc cccccccagc agcgaggacc accagaaccc catcagcaag    900
cagcccctgc cccgcaccca gggcgacccc accggcagcg aggagagcaa gaagaaggtg    960
gagagcaaga ccaagaccga ccccttcgac tag                                 993
<210>14
<211>330
<212>PRT
<213>人(Homo sapiens)
<400>14
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                    10                 15
Ala Val Phe Val Ser Ala Arg Met Gly Gly Lys Trp Ser Lys Ser Ser
            20                  25                  30
Ile Val Gly Trp Pro Ala Ile Arg Glu Arg Ile Arg Arg Thr Glu Pro
        35                  40                  45
Ala Ala Asp Gly Val Gly Ala Val Ser Arg Asp Leu Glu Lys His Gly
    50                  55                  60
Ala Ile Thr Ser Asn Asn Thr Ala Asp Thr Asn Ala Asp Cys Ala Trp
65                  70                  75                  80
Leu Glu Thr Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln
                85                  90                  95
Val Pro Leu Arg Pro Met Thr Phe Lys Gly Ala Leu Asp Leu Ser Phe
           100                  105                 110
Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Lys Lys
        115                 120                 125
Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe
    130                 135                 140
Pro Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Val Arg Phe Pro Leu
145                 150                 155                 160
Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Asp Pro Gly Glu Val
                165                 170                 175
Glu Glu Ala Asn Glu Gly Glu Asn Asn Cys Leu Leu His Pro Val Cys
            180                 185                 190
Gln His Gly Met Asp Asp Glu His Arg Glu Val Leu Lys Trp Lys Phe
        195                 200                 205
Asp Ser Gln Leu Ala His Arg His Arg Ala Arg Glu Leu His Pro Glu
    210                 215                 220
Phe Tyr Lys Asp Cys Met Glu Pro Val Asp Pro Asn Leu Glu Pro Trp
225                 230                 235                  240
Asn His Pro Gly Ser Gln Pro Glu Thr Ala Cys Asn Asn Cys Tyr Cys
                245                 250                 255
Lys Arg Cys Ser Tyr His Cys Leu Val Cys Phe Gln Lys Lys Gly Leu
            260                 265                 270
Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala Pro
        275                 280                 285
Pro Ser Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln Pro Leu Pro
    290                 295                 300
Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser Lys Lys Lys Val
305                 310                 315                 320
Glu Ser Lys Thr Lys Thr Asp Pro Phe Asp
                325                 330
<210>15
<211>8186
<212>DNA
<213>人(Homo sapiens)
<400>15
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta   60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata  120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat  180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga  240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc  300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt  360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat  420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag  480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc  540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga  600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga  660
aattaatacg actcactata gggagaccca agctggctag ccgccaccat ggatgcaatg  720
aagagggggc tctgctgtgt gctgctgctg tgtggagcag tcttcgttag cgccgccgag     780
aacttgtggg tgaccgtgta ctacggcgtg cccgtgtgga aggaggccaa gaccaccctg     840
ttctgcgcct ccgacgccaa ggcctacgag aaggaggtgc acaacgtgtg ggccacccac     900
gcctgcgtgc ccaccgaccc caacccccag gagatggtgt tggagaacgt gaccgagaac     960
ttcaacatgt ggaagaacga catggtgaac cagatgcacg aggacgtcat cagcttgtgg    1020
gaccagagcc tgaagccctg cgtgaagttg acccccctgt gcgtgacctt ggagtgcagg    1080
aacgtgagca gcaacggcac ctacaacgag acctacaacg agatcaagaa ctgctccttc    1140
aacgccacca ccgtgttgag ggacaggaag cagaccgtgt acgccctgtt ctacaggctg    1200
gacatcgtgc ccctgaacaa gaagaactcc agcgagaact ccagcgagta ctacaggttg    1260
atcaactgca acacctccgc catcacccag gcctgcccca aggtgacctt cgaccccatc    1320
cccatccact actgcacccc cgccggctac gccatcctga agtgcaacga caagaccttc    1380
aacggcaccg gcccctgcca caacgtgagc accgtgcagt gcacccacgg catcaagccc    1440
gtggtgtcca cccagctgct gttgaacggc agcctggccg agagggagat catcatcagg    1500
tccgagaacc tgaccaacaa cgtgaagacc atcatcgtgc acctgaacca gtccgtggag    1560
atcgtgtgca ccaggcccaa caacaacacc aggaagagca tcaggatcgg ccccggccag    1620
accttctacg ccaccggcga catcatcggc gacatcaggc aggcccactg caacatcagc    1680
aaggacaagt ggaaggagac cttgcagagg gtgggcaaga agttggccga gcacttcccc    1740
aacaagacca tcgagttcgc ctcctcctcc ggcggcgacc tggagatcac cacccacagc    1800
ttcaactgca ggggcgagtt cttctactgc aacacctcca gcctgttcaa cggcacctac    1860
atgcccaacg gcaccgaggg caactccagc tccatcatca ccatcccctg caggatcaag    1920
cagatcatca acatgtggca ggaggtgggc cgcgccatgt acgccccccc catcgagggc    1980
aacatcacct gcaagtccaa catcaccggc ctgctgttgg tgcgcgacgg cggcaaggag    2040
accaacgaca ccgagacctt caggcccggc ggcggcgaca tgagggacaa ctggaggagc    2100
gagttgtaca agtacaaggt ggtggagatc aagcccttgg gcatcgcccc caccgccgcc    2160
aagaggaggg tggtggagag ggagaagagg gccgtgggca tcggcgccgt gttcctgggc    2220
ttcctgggcg ccgccggcag caccatgggc gccgccagca tcaccctgac cgtgcaggcc    2280
cgccagctgc tgagcggcat cgtgcagcag cagagcaacc tgctgcgcgc catcgaggcc    2340
cagcagcacc tgctgcagct gaccgtgtgg ggcatcaagc agctgcagac ccgcgttctg    2400
gccatcgagc gctacctgaa ggaccagcag ctgctgggca tctggggctg cagcggcaag    2460
ctgatctgca ccaccgccgt gcactggaac agcagctgga gcaaccgcag ccaggaggag    2520
atctggaaca acatgacctg gatgcagtgg gaccgcgaga tcagcaacta caccaacacc    2580
atctaccgcc tgctggagga cagccagaac cagcaggagc gcaacgagaa ggacctgctg    2640
gccctggaca actggaagaa cctgtggagc tggttcgaca tcaccaactg gctgtggtac    2700
atccgcatct tcatcatgat cgtgggcggc ctgatcggcc tgcgcatcat cttcgccgtg    2760
ctgagcatcg tgaaccgcgt gcgccagggc tacagccccc tgagcttcca gaccctgacc    2820
cccaaccccg gcggccccga ccgcctgggc cgcatcgagg aggagggcgg cgagcaggac    2880
aagaaccgca gcatccgcct ggtgaacggc ttcctggccc tggcctggga cgacctgcgc    2940
aacctgtgcc gcttcagcta ccacctgctg cgcgacctgc tgctgatcgt ggcccgcatc    3000
gtggagctgc tgggccgccg cggctgggag gccctgcgct actggtggaa cctgctgaag    3060
tactgggtgc aggagctgaa gaacagcgcc gtgagcctgc tgaacgccac cgccatcgcc    3120
gtggccgagg gcaccgaccg cgtgatcgag gtggtgcagg gcgcctaccg cgccatcctg    3180
cacatccccc gccgcatccg ccagggcttc gaggccgccc tgcagtaaga attccgtgag    3240
gctccggtgc ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg    3300
gaggggtcgg cgattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg    3360
atgtcgtgta ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag    3420
tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg    3480
tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta    3540
cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg    3600
agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc    3660
ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt    3720
tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc    3780
aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg    3840
cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag    3900
cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg    3960
gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag    4020
ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga    4080
cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt    4140
cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt    4200
agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg    4260
agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat    4320
tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag    4380
tggttcaaag tttttttctt ccatttcagg tgtcgtgaag cggccgccgc caccatggac    4440
gccatgaagc gcggcctgtg ctgcgtgctg ctgctgtgcg gcgccgtgtt cgtgagcgcc    4500
cgcatgggcg cccgcgccag catcctgcgc ggcggcaagc tgggcaagtg ggagaagatc    4560
cgcctgcgcc ccggcgacaa gaagcactac atgctgaagc acctggtgtg ggccagccgc    4620
gagctggagc gcttcgccct gaaccccggc ctgctggaga ccagcgaggg ctgcaagcag    4680
atcatcaagc agctgcagcc cgccctgcag accggcaccg aggagctgcg cagcctgttc    4740
aacaccgtgg ccaccctgta ctgcgtgcac gagggcatcg agatccgcga caccaaggag    4800
gccctggaca agatcgagga ggagcagaac aagatccagc agaagaccca gcaggccaag    4860
aaggccgacg agaaggtgag ccagaactac cccatcgtgc agaacctgca gggccagatg    4920
gtgcaccagg ccatctcccc caggaccttg aacgcctggg tgaaggtgat cgaggagaag    4980
gccttcagcc ccgaggtgat ccccatgttc accgccttgt ccgagggcgc caccccccag    5040
gacttgaaca ccatgttgaa caccgtgggc ggccaccagg ccgccatgca gatgttgaag    5100
gacaccatca acgaggaggc cgccgagtgg gacagggtgc accccgtgca cgccggcccc    5160
attgcccccg gccagatgag ggagcccagg ggcagcgaca tcgccggcac caccagcacc    5220
ctgcagggcc agatcgcctg gatgaccagc aacccccccg tgcccgtggg cgagatctac    5280
aagaggtgga tcatcctggg cttgaacaag atcgtgagga tgtacagccc cgtgagcatc    5340
ttggacatca agcagggccc caaggagccc ttcagggact acgtggaccg cttcttcaag    5400
accttgaggg ccgagcaggc cacccaggac gtgaagaact ggatgaccga caccttgttg    5460
gtgcagaacg ccaaccccga ctgcaagacc atcttgaggg ccttgggccc cggcgcctcc    5520
ttggaggaga tgatgaccgc ctgccagggc gtgggcggcc ccagccacaa ggccagggtg    5580
ttggccgagg ccatgagcca ggccaacggc accatcctga tgcagaggag caacttcaag    5640
ggctccaaga ggatcgtgaa gtgcttcaac tgcggcaagg agggccacat cgccaggaac    5700
tgcagggccc ccaggaagaa gggctgctgg aagtgcggca aggagggcca ccagatgaag    5760
gactgcaccg agaggcaggc caacttcttg ggcaagatct ggccctccca caagggcagg    5820
cccggcaact tcctgcagag caggcccgag cccaccgccc cccccgccga gagcttcagg    5880
ttcgaggaga ccacccccgc ccccaagcag gagcccaagg acagggagcc cttgacctcc    5940
ctgaagtccc tgttcggcag cgaccccttg tcccagtaat ctagagggcc cgtttaaacc    6000
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc    6060
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa    6120
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac    6180
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg    6240
gcttctactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct    6300
ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttcttgccg ccaaggatct    6360
gatggcgcag gggatcaagc tctgatcaag agacaggatg aggatcgttt cgcatgattg    6420
aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg    6480
actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg    6540
ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg    6600
aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg    6660
ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc    6720
tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc    6780
tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc    6840
gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc    6900
aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg    6960
atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct    7020
tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt    7080
tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc    7140
tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt    7200
tcttctgaat tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt    7260
gcggtatttc acaccgcatc aggtggcact tttcggggaa atgtgcgcgg aacccctatt    7320
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa    7380
atgcttcaat aatagcacgt gctaaaactt catttttaat ttaaaaggat ctaggtgaag  7440
atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg  7500
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc  7560
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag  7620
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt  7680
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac  7740
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc  7800
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt  7860
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt  7920
gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc  7980
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt  8040
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca  8100
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt  8160
tgctggcctt ttgctcacat gttctt                                       8186
<210>16
<211>8017
<212>DNA
<213>人(Homo sapiens)
<400>16
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta     60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata    120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat    180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga    240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc    300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt    360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat    420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag    480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc    540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga    600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga    660
aattaatacg actcactata gggagaccca agctggctag cgccgccacc atggacgcca    720
tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg agcgcccgcc    780
cccagatcac cctgtggcag cgccccctgg tgtccatccg cgtggggggc cagatcaagg    840
aggccctgct ggacgacacc gtgttggagg aggtgaactt gcccggcaag tggaagccca    900
agatgatcgg cggcatcggc ggcttcatca aggtgaggca gtacgaccag atccccatcg    960
agatctgcgg caagaaggcc atcggcaccg tgttggtggg ccccaccccc gtgaacatca    1020
tcggcaggaa catgttgacc cagctgggct gcaccctgaa cttccccatc agccccatcg    1080
agaccatccc cgtgaagctg aagcccggca tggacggccc ccgcgtgaag cagtggcccc    1140
tgaccgagga gaagatcaag gccctgaccg ccatctgcga cgagatggag aaggagggca    1200
agatcaccaa gatcggcccc gagaacccct acaacacccc cgtgttcgcc atcaagaaga    1260
aggacagcac caagtggcgc aagctggtgg acttccgcga gctgaacaag cgcacccagg    1320
acttctggga ggtgcagctg ggcatccccc accccgccgg cctgaagaag aagaagtccg    1380
tgaccgtgct ggacgtgggc gacgcctact tctccgtgcc cctgtacgag gacttccgca    1440
agtacaccgc cttcaccatc cccagcatca acaacgagac ccccggcatc cgctaccagt    1500
acaacgtgct gccccagggc tggaagggct cccccgccat cttccagtgc agcatgacca    1560
agatcctgga gcccttccgg gcccagaacc ccgagatcgt gatctaccag tacggcgacg    1620
acctgtacgt gggctccgac ctggagatcg gccagcaccg cgccaagatc gaggagttgc    1680
gcgagcacct gctgaagtgg ggcttcacca cccccgacaa gaagcaccag aaggagcccc    1740
ccttcctgtg gatgggctac gagctgcacc ccgacaagtg gaccgtgcag cccatccagc    1800
tgcccgagaa ggacagctgg accgtgaacg acatccagaa gctggtgggc aagctgaact    1860
gggccagcca gatctacccc ggcatcaagg tgcgccagct gtgcaagctg ctgcgcggcg    1920
ccaaggccct gaccgacatc atccccctga ccgaggaggc cgagctggag ctggccgaga    1980
accgcgagat cctgaaggag cccgtgcacg gcgcctacta cgacccctcc aaggacctga    2040
tcgccgagat ccagaagcag ggccaggacc agtggaccta ccagatctac caggagccct    2100
tcaagaacct gaagaccggc aagtacgcca agatgcgcac cgcccacacc aacgacgtga    2160
agcagctgac cgaggccgtg cagaagatct ccatggagag catcgtgatc tggggcaaga    2220
tccccaagtt ccgcctgccc atccagaagg agacctggga gacccgctgg accgcctact    2280
ggcaggccac ctggatcccc gagtgggagt tcgtgaacac cccccccctg gtgaagctgt    2340
ggtaccagct ggagaaggac cccatcgccg gcgtggagac cttctacgtg gacggcgccg    2400
ccaaccgcga gaccaagatg ggcaaggccg gctacgtgac cgaccgcggc cgccagaaga    2460
tcgtgtccct gaccgagacc accaaccaga agaccgagct gcaggccatc tgcctggcct    2520
tgcaggactc cggctccgag gtgaacatcg tgaccgactc ccagtacgcc ctgggcatca    2580
tccaggccca gcccgacaag agcgagtccg agctggtgaa ccagatcatc gagcagctga    2640
tcaagaagga gcgcgtgtac ctgtcctggg tgcccgccca caagggcatc ggcggcaacg    2700
agcaggtgga caagctggtg agcaacggca tccgcaaggt gctgttcctg gacggcatcg    2760
acaaggccca ggaggagcac gagaagtacc acagcaactg gcgcgccatg gccagcgact    2820
tcaacctgcc ccccatcgtg gccaaggaga tcgtggccag ctgcgaccag tgccagctga    2880
agggcgaggc catgcacggc caggtggact gcagccccgg catctggcag ctggactgca    2940
cccacctgga gggcaagatc atcctggtgg ccgtgcacgt ggccagcggc tacatcgagg    3000
ccgaggtgat ccccgccgag accggccagg agaccgccta cttcatcctg aagctggccg    3060
gccgctggcc cgtgaagatc atccacaccg acaacggcag caacttcacc agcgccgccg    3120
tgaaggccgc ctgctggtgg gccggcatcc agcaggagtt cggcatcccc tacaaccccc    3180
agagccaggg cgtggtggag tccatgaaca aggagctgaa gaagatcatc ggccaggtgc    3240
gcgaccaggc cgagcacctg aagaccgccg tgcagatggc cgtgttcatc cacaacttca    3300
agcgcaaggg cggcatcggc ggctacagcg ccggcgagcg catcatcgac atcatcgcca    3360
ccgacatcca gaccaaggag ctgcagaagc agatcatcaa gatccagaac ttccgcgtgt    3420
actaccgcga cagccgcgac cccatctgga agggccccgc caagctgctg tggaagggcg    3480
agggcgccgt ggtgatccag gacaacagcg acatcaaggt ggtgccccgc cgcaaggcca    3540
agatcatcaa ggactacggc aagcagatgg ccggcgccga ctgcgtggcc agccgccagg    3600
acgaggacta ggaattccgt gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc    3660
cacagtcccc gagaagttgg ggggaggggt cggcaattga accggtgcct agagaaggtg    3720
gcgcggggta aactgggaaa gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg    3780
gggagaaccg tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc    3840
cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct ttacgggtta    3900
tggcccttgc gtgccttgaa ttacttccac ctggctgcag tacgtgattc ttgatcccga    3960
gcttcgggtt ggaagtgggt gggagagttc gaggccttgc gcttaaggag ccccttcgcc    4020
tcgtgcttga gttgaggcct ggcctgggcg ctggggccgc cgcgtgcgaa tctggtggca    4080
ccttcgcgcc tgtctcgctg ctttcgataa gtctctagcc atttaaaatt tttgatgacc    4140
tgctgcgacg ctttttttct ggcaagatag tcttgtaaat gcgggccaag atctgcacac    4200
tggtatttcg gtttttgggg ccgcgggcgg cgacggggcc cgtgcgtccc agcgcacatg    4260
ttcggcgagg cggggcctgc gagcgcggcc accgagaatc ggacgggggt agtctcaagc    4320
tgcccggcct gctctggtgc ctggcctcgc gccgccgtgt atcgccccgc cctgggcggc    4380
aaggctggcc cggtcggcac cagttgcgtg agcggaaaga tggccgcttc ccggccctgc    4440
tgcagggagc tcaaaatgga ggacgcggcg ctcgggagag cgggcgggtg agtcacccac    4500
acaaaggaaa agggcctttc cgtcctcagc cgtcgcttca tgtgactcca cggagtaccg    4560
ggcgccgtcc aggcacctcg attagttctc gagcttttgg agtacgtcgt ctttaggttg    4620
gggggagggg ttttatgcga tggagtttcc ccacactgag tgggtggaga ctgaagttag    4680
gccagcttgg cacttgatgt aattctcctt ggaatttgcc ctttttgagt ttggatcttg    4740
gttcattctc aagcctcaga cagtggttca aagttttttt cttccatttc aggtgtcgtg    4800
aagcggccgc cgccaccatg gacgccatga agcgcggcct gtgctgcgtg ctgctgctgt    4860
gcggcgccgt gttcgtgagc gcccgcatgg gcggcaagtg gtccaagagc agcatcgtag    4920
gctggcccgc catccgcgag cgcatccgcc gcaccgagcc cgccgccgac ggcgtgggcg    4980
ccgtgtctcg cgacctggag aagcatggcg ccatcaccag taacaacacc gccgacacca    5040
acgccgactg cgcctggctg gagacccagg aggaggagga ggtgggcttc cccgtccgcc    5100
cccaggtgcc cttgcgcccc atgaccttca agggcgcctt ggacctcagc ttcttcctga    5160
aggagaaggg cggcctggag gggttgatct acagccagaa gaggcaggag atcctggact    5220
tgtgggtcta ccacacccag ggctacttcc ccgactggca caactacacc cccggccccg    5280
gcgtccgctt ccccctgacc ttcggctggt gcttcaagct ggtgcccgtg gaccccggcg    5340
aggtggagga ggccaacgag ggcgagaaca actgcttgct gcaccccgtc tgccagcacg    5400
gcatggacga cgagcaccgc gaggtgctga agtggaagtt cgacagccag ctggcccacc    5460
gccacagggc ccgcgagctg cacccggagt tctacaagga ctgcatggag cccgtggacc    5520
ccaacctgga gccctggaac caccccggca gccagcccga gaccgcctgc aacaactgct    5580
actacaagcg ctgcagctac cactgcctgg tgtgcttcca gaagaagggc ctgggcatca    5640
gctacggccg caagaagcgc cgccagcgcc gtagcgcccc ccccagcagc gaggaccacc    5700
agaaccccat cagcaagcag cccctgcccc gcacccaggg cgaccccacc ggcagcgagg    5760
agagcaagaa gaaggtggag agcaagacca agaccgaccc cttcgactag tctagagggc    5820
ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt    5880
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat    5940
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg    6000
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg    6060
tgggctctat ggcttctact gggcggtttt atggacagca agcgaaccgg aattgccagc    6120
tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg ctttcttgcc    6180
gccaaggatc tgatggc gca ggggatcaag ctctgatcaa gagacaggat gaggatcgtt   6240
tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct    6300
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct    6360
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga    6420
actgcaagac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc    6480
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg    6540
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc    6600
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca    6660
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga    6720
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgagcatgcc    6780
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga    6840
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca    6900
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg    6960
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct    7020
tcttgacgag ttcttctgaa ttattaacgc ttacaatttc ctgatgcggt attttctcct    7080
tacgcatctg tgcggtattt cacaccgcat caggtggcac ttttcgggga aatgtgcgcg    7140
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat    7200
aaccctgata aatgcttcaa taatagcacg tgctaaaact tcatttttaa tttaaaagga    7260
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt    7320
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc    7380
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc    7440
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac    7500
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac    7560
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt    7620
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct  7680
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat  7740
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt  7800
atccggtaag cggcagggtc ggaacaggag agcccacgag ggagcttcca gggggaaacg  7860
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt  7920
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt  7980
tcctggcctt ttgctggcct tttgctcaca tgttctt                           8017
<210>17
<211>2442
<212>DNA
<213>人(Homo sapiens)
<400>17
atgagagtga cggggatcag gaagaactat cagcatttat ggagatgggg caccatgctc     60
cttgggatgt tgatgatctg tagtgctgca gaaaacttgt gggtcacagt ctattatggg    120
gtacctgtgt ggaaagaagc caaaactact ctattctgtg cgtcagatgc taaagcatat    180
gagaaagaag tgcataatgt ctgggctaca catgcctgtg tacccacaga ccccaaccca    240
caagaaatgg ttttggaaaa tgtaacagaa aattttaaca tgtggaaaaa tgacatggtg    300
aatcagatgc atgaggatgt aatcagttta tgggatcaaa gcctaaagcc atgtgtaaag    360
ttgaccccac tctgtgtcac tttagaatgt agaaatgtta gcagtaatgg tacctacaat    420
gagacctaca atgagatcaa aaattgctct ttcggggccg ggtattatag attaataaat    480
tgtaatacct cagccataac acaagcctgt ccaaaggtca cttttgatcc aattcctata    540
cactattgca ctccagctgg ttatgcgatt ctaaagtgta atgataagac attcaatgga    600
acaggaccat gccataatgt tagtacagta caatgtacac atggaattaa gccagtggta    660
tcaactcaac tactgttaaa tggtagccta gcagaaagag agataataat tagatctgaa    720
aatctgacaa acaatgtcaa aacaataata gtacatctta atcaatctgt agaaattgta    780
tgtacaagac ccaacaataa tacaagaaaa agtataagga taggaccagg acaaacattc    840
tatgcaacag gagacataat aggagatata agacaagcac attgtaacat tagtaaagat    900
aaatggaatg aaactttaca aagggtaggt aaaaaattag cagaacactt ccctaataaa    960
acaatagaat ttgcatcatc ctcaggaggg gacctagaaa ttacaacaca tagctttaat   1020
tgtagaggag aatttttcta ttgtaataca tcaatcctgt ttaatggtac atacatgcct   1080
aatggtacag aaggtaattc aagctcaatc atcacaatcc catgcagaat aaagcaaatt   1140
ataaacatgt ggcaggaggt aggacgagca atgtatgccc ctcccattga gggaaacata   1200
acatgtaaat caaatatcac aggactacta ttggtacgtg atggaggaaa agagacaaat   1260
gatacagaga cattcagacc tggaggagga gatatgaggg acaattggag aagtgaatta   1320
tataaatata aagtggtaga aattaagcca ttgggaatag cacccactgc agcaaaaagg   1380
agagtggtgg agagagaaaa aagagcagtg ggaataggag ctgtgttcct tgggttcttg  1440
ggagcagcag gaagcactat gggcgcggcg tcaataacgc tgacggtaca gtccagacaa  1500
ttgttgtctg gtatagtgca acagcaaagc aatttgctga gggctataga ggcgcaacag  1560
catctgttgc aactcacggt ctggggcatt aagcagctcc agacaagagt cctggctata  1620
gaaagatacc taaaggatca acagctccta gggatttggg gctgctctgg aaaactcatc  1680
tgcactactg ctgtacattg gaactccagt tggagtaaca gatctcaaga agagatttgg  1740
aataacatga cttggatgca gtgggataga gaaattagta attacacaaa cacaatatac  1800
aggttgcttg aagactcgca aaaccagcag gaaagaaatg aaaaagattt actagcattg  1860
gacaattgga aaaatctatg gagttggttt gacataacaa attggctgtg gtatataaga  1920
atattcataa tgatagtagg aggcttgata ggtttaagaa taatttttgc tgtgctctct  1980
atagtgaata gagttaggca gggatactca cctttgtcgt ttcagaccct taccccgaac  2040
ccagggggac ccgacaggct cggaagaatc gaagaagaag gtggagagca agacaaaaac  2100
agatccattc gattagtgaa cggattctta gcacttgcct gggacgacct gcggaacctg  2160
tgccgcttca gctaccacct cttgagagac ttactcttga ttgtagcaag gattgtggaa  2220
cttctgggac gcagggggtg ggaagccctc agatattggt ggaatctcct gaagtattgg  2280
gttcaggaac taaagaatag tgctgttagt ttgctcaatg ccacagctat agcagtagct  2340
gaggggacag atagggttat agaagtagta caaggagctt atagagctat tctccacata  2400
cctagaagaa taagacaggg ctttgaagca gctttgcaat aa                     2442
<210>18
<211>813
<212>PRT
<213>人(Homo sapiens)
<400>18
Met Arg Val Thr Gly Ile Arg Lys Asn Tyr Gln His Leu Trp Arg Trp
1               5                   10                  15
Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Ala Glu Asn
            20                  25                  30
Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Lys
        35                  40                  45
Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu Val
    50                  55                  60
His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn Pro
65                  70                  75                  80
Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp Lys
                85                  90                  95
Asn Asp Met Val Asn Gln Met His Glu Asp Val Ile Ser Leu Trp Asp
            100                 105                 110
Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr Leu
        115                 120                 125
Glu Cys Arg Asn Val Ser Ser Asn Gly Thr Tyr Asn Glu Thr Tyr Asn
    130                 135                 140
Glu Ile Lys Asn Cys Ser Phe Gly Ala Gly Tyr Tyr Arg Leu Ile Asn
145                 150                 155                 160
Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Thr Phe Asp
                165                 170                 175
Pro Ile Pro Ile His Tyr Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys
            180                 185                 190
Cys Asn Asp Lys Thr Phe Asp Gly Thr Gly Pro Cys His Asn Val Ser
        195                 200                 205
Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu
    210                 215                 220
Leu Leu Asn Gly Ser Leu Ala Glu Arg Glu Ile Ile Ile Arg Ser Glu
225                 230                 235                 240
Asn Leu Thr Asn Asn Val Lys Thr Ile Ile Val His Leu Asn Gln Ser
                245                 250                 255
Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile
            260                 265                 270
Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly
        275                 280                 285
Asp Ile Arg Gln Ala His Cys Asn Ile Ser Lys Asp Lys Trp Asn Glu
    290                 295                 300
Thr Leu Gln Arg Val Gly Lys Lys Leu Ala Glu His Phe Pro Asn Lys
305                 310                 315                 320
Thr Ile Glu Phe Ala Ser Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr
                325                 330                 335
His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Ile
            340                 345                 350
Leu Phe Asn Gly Thr Tyr Met Pro Asn Gly Thr Glu Gly Asn Ser Ser
        355                 360                 365
Ser Ile Ile Thr Ile Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp
    370                 375                 380
Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Glu Gly Asn Ile
385                 390                 395                 400
Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly
                405                 410                 415
Lys Glu Thr Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met
            420                 425                 430
Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile
        435                 440                 445
Lys Pro Leu Gly Ile Ala Pro Thr Ala Ala Lys Arg Arg Val Val Glu
    450                 455                 460
Arg Glu Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu
465                 470                 475                 480
Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val
                485                 490                 495
Gln Ser Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu
            500                 505                 510
Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp
        515                 520                 525
Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu
    530                 535                 540
Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile
545                 550                 555                 560
Cys Thr Thr Ala Val His Trp Asn Ser Ser Trp Ser Asn Arg Ser Gln
                565                 570                 575
Glu Glu Ile Trp Asn Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile
            580                 585                 590
Ser Asn Tyr Thr Asn Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Asn
        595                 600                 605
Gln Gln Glu Arg Asn Glu Lys Asp Leu Leu Ala Leu Asp Asn Trp Lys
    610                 615                 620
Asn Leu Trp Ser Trp Phe Asp Ile Thr Asn Trp Leu Trp Tyr Ile Arg
625                 630                 635                 640
Ile Arg Ile Met Ile Val Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe
                645                 650                 655
Ala Val Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu
            660                 665                 670
Ser Phe Gln Thr Leu Thr Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly
        675                 680                 685
Arg Ile Gln Glu Glu Gly Gly Glu Gln Asp Lys Asn Arg Ser Ile Arg
    690                 695                 700
Leu Val Asn Gly Phe Leu Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu
705                 710                 715                 720
Cys Arg Phe Ser Tyr His Leu Leu Arg Asp Leu Leu Leu Ile Val Ala
                725                 730                 735
Arg Ile Val Glu Leu Leu Gly Arg Arg Gly Trp Glu Ala Leu Arg Tyr
            740                 745                 750
Trp Trp Asn Leu Leu Lys Tyr Trp Val Gln Glu Leu Lys Asn Ser Ala
        755                 760                 765
Val Ser Leu Leu Asn Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp
    770                 775                 780
Arg Val Ile Glu Val Val Gln Gly Ala Tyr Arg Ala Ile Leu His Ile
785                 790                 795                 800
Pro ArgArg Ile Arg Gln Gly Phe Glu Ala Ala Leu Gln
               805                 810
<210>19
<211>4404
<212>DNA
<213>人(Homo sapiens)
<400>19
gccgccacca tggacgccat gaagcgcggc ctgtgctgcg tgctgctgct gtgcggcgcc      60
gtgttcgtga gcgcccgcat gggtgcgaga gcgtcaatat taagaggggg aaaattagat     120
aaatgggaaa aaattaggtt aaggccaggg ggaaagaaac actatatgct aaaacacata     180
gtatgggcaa gcagagagct ggaaagattt gcacttaacc ctggcctttt agagacatca     240
gaaggctgta aacaaataat aaaacagcta caaccagctc ttcagacagg aacagaggaa     300
cttagatcat tattcaacac agtagcaact ctctattgtg tacatgcagg gatagaagta     360
cgagacacca aagaagcctt agacaagata gaggaagaac aaaacaaaat gcagcaaaaa     420
acacagcagg caaaagaggc tgacgggaag gtcagtcaaa attatcctat agtgcagaat     480
ctccaagggc aaatggtgca ccaggccata tcacctagaa ctttgaatgc atgggtaaaa     540
gtaatagagg aaaaggcttt tagcccagag gtaataccca tgtttacagc attatcagaa     600
ggagccaccc cacaagattt aaacaccatg ttaaatacag tagggggaca tcaggcagcc     660
atgcaaatgt taaaagatac tatcaatgaa gaggctgcag aatgggatag agtacatcca     720
gtacatgcag ggcctattgc accaggccaa atgagagaac caaggggaag t gacatagca    780
ggaactacta gtacccttca gggacaaata gcatggatga cgagtaaccc acctgttcca     840
gtgggagaaa tctataaaag atggataatt ctggggttaa ataaaatagt aagaatgtat     900
agccctgtga gcattttgga cataaaacaa gggccaaagg aaccctttag agactatgta     960
gaccggttct ttaaaacttt aagagctgaa caagctacac aagatgtaaa aaattggatg    1020
acagacacct tgttggtcca aaatgcgaac ccagattgta agaccatttt aagagcatta    1080
ggaccagggg cttcattaga agagatgatg acagcatgtc agggagtggg aggacctaac    1140
cacaaagcaa gagtgttggc tgaggcaatg agccaagcaa acggtaccat actgatgcag    1200
agaagcaatt ttaaaggctc taaaagaatt gttaaatgtt tcaactgtgg caaggaaggg    1260
cacatagcca gaaattgcag ggcccctagg aaaaaaggct gttggaaatg tggaaaggaa    1320
ggacaccaaa tgaaagactg cactgaaagg caggctaatt ttttagggaa aatttggcct    1380
ccccacaagg ggaggccagg gaatttcctc cagagcagac cagagccaac agccccacca    1440
gcagagagct tcgggttcga ggagacaacc ccagctccga agcaggagcc gaaagacagg    1500
gaacccttaa cttccctcaa atcactcttt ggcagcgacc ccttgtctca acctcaaatc    1560
actctttggc agcgacccct tgtctcaata agagtagggg gccagataaa agaggctctc    1620
ttagatgata cagtattaga agaagtaaat ttgccaggaa aatggaaacc aaaaatgata    1680
ggaggaattg gaggttttat caaagtaaga caatatgatc aaatacctat agaaatttgt    1740
ggaaaaaagg ctataggtac agtattagtg ggacccacac ctgtcaacat aattggaaga    1800
aatatgttga ctcaacttgg atgcacacta aattttccaa tcagtcccat tgaaactata    1860
ccagtaaaat taaagccagg aatggatggc ccaagggtta aacaatggcc attgacagaa    1920
gagaaaataa aagcattaac agcaatttgt gatgaaatgg agaaggaagg aaaaattaca    1980
aaaattgggc ctgaaaatcc atataacact ccagtatttg ccataaaaaa gaaggacagt    2040
actaagtgga gaaaattagt agatttcagg gaactcaata aaagaactca agatttttgg    2100
gaagttcaat taggaatacc acacccagca gggttaaaaa agaaaaaatc agtgacagta    2160
ctggatgtgg gggatgcata tttttcagtt cctttatatg aagacttcag aaaatatact    2220
gcattcacca tacctagtat aaacaatgaa acaccaggga tcaggtatca atataatgtg    2280
cttccacagg gatggaaggg atcaccagca atattccagt gtagcatggc aaaaatctta    2340
gagcccttta gggcacaaaa tccagaaata gtcatctatc aatatggcga tgacttgtat    2400
gtaggatctg acttagagat agggcaacat agagcaaaaa tagaggagtt aagagaacat    2460
ctgttaaagt ggggatttac cacaccagac aagaaacatc agaaagaacc tccatttctt    2520
tggatggggt atgaactcca tcctgacaaa tggacagtac agcctataca gctgccagaa    2580
aaggatagct ggactgtcaa tgatatacag aagttagtgg gaaaattaaa ctgggcaagt    2640
cagatttacc caggaattaa agtaaggcaa ctttgtaaac tccttagggg ggccaaagca    2700
ctaacagaca taataccact aactgaagaa gcagaattgg agttggcaga aaacagggaa    2760
attctaaaag aaccagtaca tggagcatat tatgacccat caaaagactt gatagctgaa    2820
atacagaaac aggggcagga ccaatggaca tatcaaattt accaagaacc attcaaaaat    2880
ctgaaaacag ggaaatatgc aaaaatgagg actgcccaca ctaatgatgt aaaacagtta    2940
acagaggctg tgcagaaaat atccatggaa agcatagtaa tatggggaaa aattcctaaa    3000
tttaggttac ccatcccaaa agaaacctgg gagacacggt ggacagccta ttggcaagcc    3060
acctggattc ctgagtggga atttgttaat acccctccct tagtaaaatt atggtaccag    3120
ctggagaaag atcccatagc aggagtagaa actttctatg tagatggagc agctaatagg    3180
gaaattaaaa tgggaaaagc agggtatgtt actgacagag gaaggcagaa aattgtgtct    3240
ctaactgaaa caacaaatca gaagactgaa ttgcaagcaa tttgtctagc tttgcaagat    3300
tcaggatcag aagtaaatat agtaacagat tcacagtatg cattaggaat cattcaagca    3360
caaccagata agagtgagtc agagttagtt aaccaaataa tagaacaatt aataaaaaag    3420
gaaagggtct acctgtcgtg ggtaccagca cataaaggaa ttggaggaaa tgaacaagta    3480
gataaattag taagtaatgg aatcaggaaa gtgctatttc tagatggaat agataaagct    3540
caagaagagc atgaaaagta tcacagcaat tggagagcaa tggctagtga ctttaatctg    3600
ccacccatag tagcaaaaga aatagtagct agctgtgatc aatgtcagct aaaaggggaa    3660
gccatgcatg gacaagtaga ctgtagtcca gggatatggc aattagattg tacacattta    3720
gaaggaaaaa tcatcctggt agcagtccat gtagccagtg gctacataga agcagaagtt    3780
atcccagcag aaacaggaca agaaacagca tactttatac taaaattagc aggaagatgg    3840
ccagtcaaaa taatacatac agacaatggt agcaatttca ccagtgctgc agttaaggca    3900
gcctgttggt gggcaggtat ccaacaggaa tttggaattc cctacaatcc ccaaagtcag    3960
ggagtagtag aatccatgaa taaagaatta aagaaaatta tagggcaggt aagagatcaa    4020
gctgagcacc ttaagacagc agtacaaatg gcagtattca ttcacaattt taaaagaaaa    4080
ggggggattg gggggtacag tgcaggggaa agaataatag acataatagc aacagacata    4140
caaactaaag aattacaaaa acaaattata aagattcaaa attttcgggt ttattacaga    4200
gacagcagag accccatttg gaaaggacca gccaaactac tctggaaagg tgaaggggca    4260
gtagtaatac aagataatag tgacataaag gtagtaccaa ggaggaaagc aaaaatcatt    4320
aagggctatg gaaaacagat ggcaggtgct gattgtgtgg caagtagaca ggatgaagat    4380
tagtaatttt ttatgcggcc gcta                                           4404
<210>20
<211>1457
<212>PRT
<213>人(Homo sapiens)
<400>20
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser AlaArg Met Gly Ala Arg Ala Ser Ile Leu Arg
            20                 25                  30
Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly
        35                  40                  45
Lys Lys His Tyr Met Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu
    50                  55                  60
Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys
65                  70                  75                   80
Lys Gln Ile Ile Lys Gln Leu Gln Pro Ala Leu Gln Thr Gly Thr Glu
                85                  90                  95
Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Leu Tyr Cys Val His
            100                 105                 110
Ala Gly Ile Glu Val Arg Asp Thr Lys Glu Ala Leu Asp Lys Ile Glu
        115                 120                 125
Glu Glu Gln Asn Lys Met Gln Gln Lys Thr Gln Gln Ala Lys Glu Ala
    130                 135                 140
Asp Gly Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly
145                 150                 155                 160
Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val
                165                 170                 175
Lys Val Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe
            180                 185                 190
Thr Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu
        195                 200                 205
Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Asp Thr
    210                 215                 220
Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala
225                 230                 235                 240
Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile
                245                 250                 255
Ala Gly Thr Thr Ser Thr Leu Gln Gly Gln Ile Ala Trp Met Thr Ser
            260                 265                 270
Asn Pro Pro Val Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu
        275                 280                 285
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Asp
    290                 295                 300
Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe
305                 310                 315                 320
Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Asp Val Lys Asn Trp
                325                 330                 335
Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr
            340                 345                 350
Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Leu Glu Glu Met Met Thr
        355                 360                 365
Ala Cys Gln Gly Val Gly Gly Pro Asn His Lys Ala Arg Val Leu Ala
    370                 375                 380
Glu Ala Met Ser Gln Ala Asn Gly Thr Ile Leu Met Gln Arg Ser Asn
385                 390                 395                 400
Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys Glu
                405                 410                 415
Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp
            420                 425                 430
Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln
        435                 440                 445
Ala Asn Phe Leu Gly Lys Ile Trp Pro Pro His Lys Gly Arg Pro Gly
    450                 455                 460
Asn Phe Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Ala Glu Ser
465                 470                 475                 480
Phe Gly Phe Glu Glu Thr Thr Pro Ala Pro Leu Gln Glu Pro Lys Asp
                485                 490                 495
Arg Glu Pro Leu Thr Ser Leu Lys Ser Leu Phe Gly Ser Asp Pro Leu
            500                 505                 510
Ser Gln Pro Gln Ile Thr Leu Trp Gln Arg Pro Leu Val Ser Ile Arg
        515                 520                 525
Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp Asp Thr Val Leu Glu
    530                 535                 540
Glu Val Asn Leu Pro Gly Lys Trp Lys Pro Lys Met Ile Gly Gly Ile
545                 550                 555                 560
Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Pro Ile Glu Ile
                565                 570                 575
Cys Gly Lys Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr Pro Val
            580                 585                 590
Asn Ile Ile Gly Arg Asn Met Leu Thr Gln Leu Gly Cys Thr Leu Asn
        595                 600                 605
Phe Pro Ile Ser Pro Ile Glu Thr Ile Pro Val Lys Leu Lys Pro Gly
    610                 615                 620
Met Asp Gly Pro Arg Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile
625                 630                 635                 640
Lys Ala Leu Thr Ala Ile Cys Asp Glu Met Glu Lys Glu Gly Lys Ile
                645                 650                 655
Thr Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile
            660                 665                 670
Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu
        675                 680                 685
Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro
    690                 695                 700
His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val
705                 710                 715                 720
Gly Asp Ala Tyr Phe Ser Val Pro Leu Tyr Glu Asp Phe Arg Lys Tyr
                725                 730                 735
Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg
            740                 745                 750
Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile
        755                 760                 765
Phe Gln Cys Ser Met Ala Lys Ile Leu Glu Pro Phe Arg Ala Gln Asn
    770                 775                 780
Pro Glu Ile Val Ile Tyr Gln Tyr Gly Asp Asp Leu Tyr Val Gly Ser
785                 790                 795                 800
Asp Leu Glu Ile Gly Gln His Arg Ala Lys Ile Glu Glu Leu Arg Glu
                805                 810                 815
His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln Lys
            820                 825                 830
Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp
        835                 840                 845
Thr Val Gln Pro Ile Gln Leu Pro Glu Lys Asp Ser Trp Thr Val Asn
    850                 855                 860
Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr
865                 870                 875                 880
Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Ala Lys
                885                 890                 895
Ala Leu Thr Asp Ile Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu
            900                 905                 910
Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Ala Tyr Tyr
        915                 920                 925
Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Asp
    930                 935                 940
Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr
945                 950                 955                 960
Gly Lys Tyr Ala Lys Met Arg Thr Ala His Thr Asn Asp Val Lys Gln
                965                 970                 975
Leu Thr Glu Ala Val Gln Lys Ile Ser Met Glu Ser Ile Val Ile Trp
            980                 985                 990
Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile Pro Lys Glu Thr Trp Glu
        995                 1000                1005
Thr Arg  Trp Thr Ala Tyr Trp  Gln Ala Thr Trp Ile  Pro Glu Trp
    1010                 1015                 1020
Glu Phe  Val Asn Thr Pro Pro  Leu Val Lys Leu Trp  Tyr Gln Leu
    1025                 1030                 1035
Glu Lys  Asp Pro Ile Ala Gly  Val Glu Thr Phe Tyr  Val Asp Gly
    1040                1045                  1050
Ala Ala  Asn Arg Glu Thr Lys  Met Gly Lys Ala Gly  Tyr Val Thr
    1055                1060                  1065
Asp Arg  Gly Arg Gln Lys Ile  Val Ser Leu Thr Glu  Thr Thr Asn
    1070                1075                  1080
Gln Lys  Thr Glu Leu Gln Ala  Ile Cys Leu Ala Leu  Gln Asp Ser
    1085                1090                  1095
Gly Ser  Glu Val Asn Ile Val  Thr Asp Ser Gln Tyr  Ala Leu Gly
    1100                1105                  1110
Ils Ile  Gln Ala Gln Pro Asp  Lys Ser Glu Ser Glu  Leu Val Asn
    1115                1120                  1125
Gln Ile  Ile Glu Gln Leu Ile  Lys Lys Glu Arg Val  Tyr Leu Ser
    1130                 1135                 1140
Trp Val  Pro Ala His Lys Gly  Ile Gly Gly Asn Glu  Gln Val Asp
    1145                 1150                 1155
Lys Leu  Val Ser Asn Gly Ile  Arg Lys Val Leu Phe  Leu Asp Gly
    1160                 1165                 1170
Ile Asp  Lys Ala Gln Glu Glu  His Glu Lys Tyr His  Ser Asn Trp
    1175                 1180                 1185
Arg Ala  Met Ala Ser Asp Phe  Asn Leu Pro Pro Ile  Val Ala Lys
    1190                 1195                 1200
Glu Ile  Val Ala Ser Cys Asp  Gln Cys Gln Leu Lys  Gly Glu Ala
    1205                 1210                 1215
Met His  Gly Gln Val Asp Cys  Ser Pro Gly Ile Trp  Gln Leu Asp
    1220                 1225                 1230
Cys Thr  His Leu Gln Gly Lys  Ile Ile Leu Val Ala  Val His Val
    1235                 1240                 1245
Ala Ser  Gly Tyr Ile Glu Ala  Glu Val Ile Pro Ala  Glu Thr Gly
    1250                 1255                 1260
Gln Glu  Thr Ala Tyr Phe Ile  Leu Lys Leu Ala Gly  Arg Trp Pro
    1265                 1270                 1275
Val Lys  Ile Ile His Thr Asp  Asn Gly Ser Asn Phe  Thr Ser Ala
    1280                 1285                 1290
Ala Val  Lys Ala Ala Cys Trp  Trp Ala Gly Ile Gln  Gln Glu Phe
    1295                 1300                 1305
Gly Ile  Pro Tyr Asn Pro Gln  Ser Gln Gly Val Val  Glu Ser Met
    1310                 1315                 1320
Asn Lys  Glu Leu Lys Lys Ile  Ile Gly Gln Val Arg  Asp Gln Ala
    1325                 1330                 1335
Glu His  Leu Lys Thr Ala Val  Gln Met Ala Val Phe  Ile His Asn
    1340                 1345                 1350
Phe Lys  Arg Lys Gly Gly Ile  Gly Gly Tyr Ser Ala  Gly Glu Arg
    1355                 1360                 1365
Ile Ile  Asp Ile Ile Ala Thr  Asp Ile Gln Thr Lys  Glu Leu Gln
    1370                 1375                 1380
Lys Gln  Ile Ile Lys Ile Gln  Asn Phe Arg Val Tyr  Tyr Arg Asp
    1385                 1390                 1395
Ser Arg  Asp Pro Ile Trp Lys  Gly Pro Ala Lys Leu  Leu Trp Lys
    1400                 1405                 1410
Gly Glu  Gly Ala Val Val Ile  Gln Asp Asn Ser Asp  Ile Lys Val
    1415                 1420                 1425
Val Phe  Arg Arg Lys Ala Lys  Ile Ile Lys Gly Tyr  Gly Lys Gln
    1430                 1435                 1440
Met Ala  Gly Ala Asp Cys Val  Ala Ser Arg Gln Asp  Glu Asp
    1445                 1450                 1455
<210>21
<211>1011
<212>DNA
<213>人(Homo sapiens)
<400>21
gccgccacca tggacgccat gaagcgcggc ctgtgctgcg tgctgctgct gtgcggcgcc    60
gtgttcgtga gcgcccgcat ggggggcaag tggtcaaaaa gtagcatagt tggatggcct   120
gctataagag aaagaataag acgaactgaa ccagcagcag atggggtggg agcagtatct   180
cgagacctgg aaaaacatgg agcaatcaca agtaacaaca cagcagatac taatgctgat    240
tgtgcctggc tagaaacaca agaggaggag gaggtgggtt ttccagtcag acctcaggta    300
cccttaagac caatgacttt taagggagca ttggatctca gcttcttttt aaaagaaaag    360
gggggactgg aagggttaat ttactctaag aaaaggcaag agatccttga tttgtgggtc    420
tatcacacac aaggctactt ccctgactgg cacaactaca caccaggacc aggggtcaga    480
ttcccactga cttttgggtg gtgcttcaag ctagtaccag ttgacccagg ggaagtggaa    540
gaggccaatg aaggagaaaa caactgtttg ctacaccctg tctgccagca tggaatggat    600
gatgaacaca gagaagtatt aaagtggaag tttgacagtc aactagcaca cagacacagg    660
gcccgcgagc tacatccgga gttttacaaa gactgcatgg agccagtaga tcctaaccta    720
gagccctgga accatccagg aagtcagcct gaaactgctt gcaataactg ttattgtaaa    780
cgctgtagct accattgtct agtttgcttt cagaaaaaag gcttaggcat ttcctatggc    840
aggaagaagc ggagacagcg acgaagcgct cctccaagca gtgaggatca tcaaaatcct    900
atatcaaagc agcccttacc ccgaacccag ggggacccga caggctcgga agaatcgaag    960
aagaaggtgg agagcaagac aaaaacagat ccattcgatt agtaattttt t            1011
<210>22
<211>330
<212>PRT
<213>人(Homo sapiens)
<400>22
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1               5                   10                  15
Ala Val Phe Val Ser Ala Arg Met Gly Gly Lys Trp Ser Lys Ser Ser
            20                  25                  30
Ile Val Gly Trp Pro Ala Ile Arg Glu Arg Ile Arg Arg Thr Glu Pro
        35                  40                  45
Ala Ala Asp Gly Val Gly Ala Val Ser Arg Asp Leu Glu Lys His Gly
    50                  55                  60
Ala Ile Thr Ser Asn Asn Thr Ala Asp Thr Asn Ala Asp Cys Ala Trp
65                  70                  75                  80
Leu Glu Thr Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln
                85                  90                  95
Val Pro Leu Arg Pro Met Thr Phe Lys Gly Ala Leu Asp Leu Ser Phe
            100                 105                 110
Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Lys Lys
        115                 120                 125
Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe
    130                 135                 140
Pro Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Val Arg Phe Pro Leu
145                 150                 155                 160
Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Asp Pro Gly Glu Val
                165                 170                 175
Glu Glu Ala Asn Glu Gly Glu Asn Asn Cys Leu Leu His Pro Val Cys
            180                 185                 190
Gln His Gly Met Asp Asp Glu His Arg Glu Val Leu Lys Trp Lys Phe
        195                 200                 205
Asp Ser Gln Leu Ala His Arg His Arg Ala Arg Glu Leu His Pro Glu
    210                 215                 220
Phe Tyr Lys Asp Cys Met Glu Pro Val Asp Pro Asn Leu Glu Pro Trp
225                 230                 235                 240
Asn His Pro Gly Ser Gln Pro Glu Thr Ala Cys Asn Asn Cys Tyr Cys
                245                 250                 255
Lys Arg Cys Ser Tyr His Cys Leu Val Cys Phe Gln Lys Lys Gly Leu
            260                 265                 270
Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala Pro
        275                 280                 285
Pro Ser Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln Pro Leu Pro
    290                 295                 300
Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser Lys Lys Lys Val
305                 310                 315                 320
Glu Ser Lys Thr Lys Thr Asp Pro Phe Asp
                325             330
<210>23
<211>9181
<212>DNA
<213>人免疫缺陷病毒1型
<400>23
ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac     60
tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt    120
gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca    180
gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag    240
gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc    300
aaaaattttg actagcggag gctagaagga gagagatggg tgcgagagcg tcagtattaa    360
gcgggggaga attagatcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat    420
ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg    480
gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc    540
agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc    600
atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa    660
acaaaagtaa gaaaaaagca cagcaagcag cagctgacac aggacacagc aatcaggtca    720
gccaaaatta ccctatagtg cagaacatcc aggggcaaat ggtacatcag gccatatcac    780
ctagaacttt aaatgcatgg gtaaaagtag tagaagagaa ggctttcagc ccagaagtga    840
tacccatgtt ttcagcatta tcagaaggag ccaccccaca agatttaaac accatgctaa    900
acacagtggg gggacatcaa gcagccatgc aaatgttaaa agagaccatc aatgaggaag    960
ctgcagaatg ggatagagtg catccagtgc atgcagggcc tattgcacca ggccagatga   1020
gagaaccaag gggaagtgac atagcaggaa ctactagtac ccttcaggaa caaataggat   1080
ggatgacaaa taatccacct atcccagtag gagaaattta taaaagatgg ataatcctgg   1140
gattaaataa aatagtaaga atgtatagcc ctaccagcat tctggacata agacaaggac   1200
caaaggaacc ctttagagac tatgtagacc ggttctataa aactctaaga gccgagcaag    1260
cttcacagga ggtaaaaaat tggatgacag aaaccttgtt ggtccaaaat gcgaacccag    1320
attgtaagac tattttaaaa gcattgggac cagcggctac actagaagaa atgatgacag    1380
catgtcaggg agtaggagga cccggccata aggcaagagt tttggctgaa gcaatgagcc    1440
aagtaacaaa ttcagctacc ataatgatgc agagaggcaa ttttaggaac caaagaaaga    1500
ttgttaagtg tttcaattgt ggcaaagaag ggcacacagc cagaaattgc agggccccta    1560
ggaaaaaggg ctgttggaaa tgtggaaagg aaggacacca aatgaaagat tgtactgaga    1620
gacaggctaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc    1680
ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga    1740
caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc    1800
tcaggtcact ctttggcaac gacccctcgt cacaataaag ataggggggc aactaaagga    1860
agctctatta gatacaggag cagatgatac agtattagaa gaaatgagtt tgccaggaag    1920
atggaaacca aaaatgatag ggggaattgg aggttttatc aaagtaagac agtatgatca    1980
gatactcata gaaatctgtg gacataaagc tataggtaca gtattagtag gacctacacc    2040
tgtcaacata attggaagaa atctgttgac tcagattggt tgcactttaa attttcccat    2100
tagccctatt gagactgtac cagtaaaatt aaagccagga atggatggcc caaaagttaa    2160
acaatggcca ttgacagaag aaaaaataaa agcattagta gaaatttgta cagagatgga    2220
aaaggaaggg aaaatttcaa aaattgggcc tgaaaatcca tacaatactc cagtatttgc    2280
cataaagaaa aaagacagta ctaaatggag aaaattagta gatttcagag aacttaataa    2340
gagaactcaa gacttctggg aagttcaatt aggaatacca catcccgcag ggttaaaaaa    2400
gaaaaaatca gtaacagtac tggatgtggg tgatgcatat ttttcagttc ccttagatga    2460
agacttcagg aagtatactg catttaccat acctagtata aacaatgaga caccagggat    2520
tagatatcag tacaatgtgc ttccacaggg atggaaagga tcaccagcaa tattccaaag    2580
tagcatgaca aaaatcttag agccttttag aaaacaaaat ccagacatag ttatctatca    2640
atacatggat gatttgtatg taggatctga cttagaaata gggcagcata gaacaaaaat    2700
agaggagctg agacaacatc tgttgaggtg gggacttacc acaccagaca aaaaacatca    2760
gaaagaacct ccattccttt ggatgggtta tgaactccat cctgataaat ggacagtaca    2820
gcctatagtg ctgccagaaa aagacagctg gactgtcaat gacatacaga agttagtggg    2880
gaaattgaat tgggcaagtc agatttaccc agggattaaa gtaaggcaat tatgtaaact    2940
ccttagagga accaaagcac taacagaagt aataccacta acagaagaag cagagctaga    3000
actggcagaa aacagagaga ttctaaaaga accagtacat ggagtgtatt atgacccatc    3060
aaaagactta atagcagaaa tacagaagca ggggcaaggc caatggacat atcaaattta    3120
tcaagagcca tttaaaaatc tgaaaacagg aaaatatgca agaatgaggg gtgcccacac    3180
taatgatgta aaacaattaa cagaggcagt gcaaaaaata accacagaaa gcatagtaat    3240
atggggaaag actcctaaat ttaaactgcc catacaaaag gaaacatggg aaacatggtg    3300
gacagagtat tggcaagcca cctggattcc tgagtgggag tttgttaata cccctccctt    3360
agtgaaatta tggtaccagt tagagaaaga acccatagta ggagcagaaa ccttctatgt    3420
agatggggca gctaacaggg agactaaatt aggaaaagca ggatatgtta ctaatagagg    3480
aagacaaaaa gttgtcaccc taactgacac aacaaatcag aagactgagt tacaagcaat    3540
ttatctagct ttgcaggatt cgggattaga agtaaacata gtaacagact cacaatatgc    3600
attaggaatc attcaagcac aaccagatca aagtgaatca gagttagtca atcaaataat    3660
agagcagtta ataaaaaagg aaaaggtcta tctggcatgg gtaccagcac acaaaggaat    3720
tggaggaaat gaacaagtag ataaattagt cagtgctgga atcaggaaag tactattttt    3780
agatggaata gataaggccc aagatgaaca tgagaaatat cacagtaatt ggagagcaat    3840
ggctagtgat tttaacctgc cacctgtagt agcaaaagaa atagtagcca gctgtgataa    3900
atgtcagcta aaaggagaag ccatgcatgg acaagtagac tgtagtccag gaatatggca    3960
actagattgt acacatttag aaggaaaagt tatcctggta gcagttcatg tagccagtgg    4020
atatatagaa gcagaagtta ttccagcaga aacagggcag gaaacagcat attttctttt    4080
aaaattagca ggaagatggc cagtaaaaac aatacatact gacaatggca gcaatttcac    4140
cggtgctacg gttagggccg cctgttggtg ggcgggaatc aagcaggaat ttggaattcc    4200
ctacaatccc caaagtcaag gagtagtaga atctatgaat aaagaattaa agaaaattat    4260
aggacaggta agagatcagg ctgaacatct taagacagca gtacaaatgg cagtattcat    4320
ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga    4380
cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa    4440
ttttcgggtt tattacaggg acagcagaaa tccactttgg aaaggaccag caaagctcct    4500
ctggaaaggt gaaggggcag tagtaataca agataatagt gacataaaag tagtgccaag    4560
aagaaaagca aagatcatta gggattatgg aaaacagatg gcaggtgatg attgtgtggc    4620
aagtagacag gatgaggatt agaacatgga aaagtttagt aaaacaccat atgtatgttt    4680
cagggaaagc taggggatgg ttttatagac atcactatga aagccctcat ccaagaataa    4740
gttcagaagt acacatccca ctaggggatg ctagattggt aataacaaca tattggggtc    4800
tgcatacagg agaaagagac tggcatttgg gtcagggagt ctccatagaa tggaggaaaa    4860
agagatatag cacacaagta gaccctgaac tagcagacca actaattcat ctgtattact    4920
ttgactgttt ttcagactct gctataagaa aggccttatt aggacacata gttagcccta    4980
ggtgtgaata tcaagcagga cataacaagg taggatctct acaatacttg gcactagcag    5040
cattaataac accaaaaaag ataaagccac ctttgcctag tgttacgaaa ctgacagagg    5100
atagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac    5160
actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct    5220
ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc    5280
cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata    5340
gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta    5400
gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa    5460
aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc    5520
aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct    5580
ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca    5640
ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg    5700
aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa    5760
gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg    5820
gggcaccatg ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac    5880
agtctattat ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga    5940
tgctaaagca tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac    6000
agaccccaac ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa    6060
aaatgacatg gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa    6120
gccatgtgta aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga    6180
tactaatacc aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg    6240
ctctttcaat atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta    6300
taaacttgat ataataccaa tagataatga tactaccagc tataagttga caagttgtaa    6360
cacctcagtc attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta    6420
ttgtgccccg gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg    6480
accatgtaca aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac    6540
tcaactgctg ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt    6600
cacggacaat gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac    6660
aagacccaac aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt    6720
tgttacaata ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa    6780
atggaataac actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa    6840
aacaataatc tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa    6900
ttgtggaggg gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa    6960
tagtacttgg agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc    7020
atgcagaata aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc    7080
tcccatcagt ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga    7140
tggtggtaat agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga    7200
caattggaga agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc    7260
acccaccaag gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc    7320
tttgttcctt gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct    7380
gacggtacag gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag    7440
ggctattgag gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca    7500
ggcaagaatc ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg    7560
ttgctctgga aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa    7620
atctctggaa cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa    7680
ttacacaagc ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga    7740
acaagaatta ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa    7800
ttggctgtgg tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat    7860
agtttttgct gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt  7920
tcagacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg  7980
tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg  8040
ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat  8100
tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg  8160
gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc  8220
cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg  8280
tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata  8340
agatgggtgg caagtggtca aaaagtagtg tgattggatg gcctactgta agggaaagaa  8400
tgagacgagc tgagccagca gcagataggg tgggagcagc atctcgagac ctggaaaaac  8460
atggagcaat cacaagtagc aatacagcag ctaccaatgc tgcttgtgcc tggctagaag  8520
cacaagagga ggaggaggtg ggttttccag tcacacctca ggtaccttta agaccaatga  8580
cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc  8640
taattcactc ccaaagaaga caagatatcc ttgatctgtg gatctaccac acacaaggct  8700
acttccctga ttagcagaac tacacaccag ggccaggggt cagatatcca ctgacctttg  8760
gatggtgcta caagctagta ccagttgagc cagataagat agaagaggcc aataaaggag  8820
agaacaccag cttgttacac cctgtgagcc tgcatgggat ggatgacccg gagagagaag  8880
tgttagagtg gaggtttgac agccgcctag catttcatca cgtggcccga gagctgcatc  8940
cggagtactt caagaactgc tgacatcgag cttgctacaa gggactttcc gctggggact  9000
ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat  9060
aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag  9120
ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt  9180
c                                                                  9181
<210>24
<211>1503
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(1503)
<223>SEQ ID NO:23的位置336-1838上的CDS。
<400>24
atg ggt gcg aga gcg tca gta tta agc ggg gga gaa tta gat cga tgg    48
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp
1               5                   10                      15
gaa aaa att cgg tta agg cca ggg gga aag aaa aaa tat aaa tta aaa       96
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
            20                  25                  30
cat ata gta tgg gca agc agg gag cta gaa cga ttc gca gtt aat cct      144
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
        35                  40                  45
ggc ctg tta gaa aca tca gaa ggc tgt aga caa ata ctg gga cag cta      192
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu
    50                  55                  60
caa cca tcc ctt cag aca gga tca gaa gaa ctt aga tca tta tat aat      240
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65                  70                  75                  80
aca gta gca acc ctc tat tgt gtg cat caa agg ata gag ata aaa gac      288
Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp
                85                  90                  95
acc aag gaa gct tta gac aag ata gag gaa gag caa aac aaa agt aag      336
Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys
            100                 105                 110
aaa aaa gca cag caa gca gca gct gac aca gga cac agc aat cag gtc      384
Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val
        115                 120                 125
agc caa aat tac cct ata gtg cag aac atc cag ggg caa atg gta cat      432
Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His
    130                 135                 140
cag gcc ata tca cct aga act tta aat gca tgg gta aaa gta gta gaa      480
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145                 150                 155                 160
gag aag gct ttc agc cca gaa gtg ata ccc atg ttt tca gca tta tca      528
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
                165                 170                 175
gaa gga gcc acc cca caa gat tta aac acc atg cta aac aca gtg ggg      576
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
            180                 185                 190
gga cat caa gca gcc atg caa atg tta aaa gag acc atc aat gag gaa      624
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
        195                 200                 205
gct gca gaa tgg gat aga gtg cat cca gtg cat gca ggg cct att gca      672
Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala
    210                 215                 220
cca ggc cag atg aga gaa cca agg gga agt gac ata gca gga act act      720
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225                 230                 235                 240
agt acc ctt cag gaa caa ata gga tgg atg aca aat aat cca cct atc      768
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
                245                 250                 255
cca gta gga gaa att tat aaa aga tgg ata atc ctg gga tta aat aaa      816
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
            260                 265                 270
ata gta aga atg tat agc cct acc agc att ctg gac ata aga caa gga      864
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly
        275                 280                 285
cca aag gaa ccc ttt aga gac tat gta gac cgg ttc tat aaa act cta      912
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
    290                 295                 300
aga gcc gag caa gct tca cag gag gta aaa aat tgg atg aca gaa acc      960
Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305                 310                 315                 320
ttg ttg gtc caa aat gcg aac cca gat tgt aag act att tta aaa gca     1008
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
                325                 330                 335
ttg gga cca gcg gct aca cta gaa gaa atg atg aca gca tgt cag gga     1056
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
            340                 345                 350
gta gga gga ccc ggc cat aag gca aga gtt ttg gct gaa gca atg agc     1104
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser
        355                 360                 365
caa gta aca aat tca gct acc ata atg atg cag aga ggc aat ttt agg     1152
Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg
    370                 375                 380
aac caa aga aag att gtt aag tgt ttc aat tgt ggc aaa gaa ggg cac     1200
Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His
385                 390                 395                 400
aca gcc aga aat tgc agg gcc cct agg aaa aag ggc tgt tgg aaa tgt     1248
Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys
                405                 410                 415
gga aag gaa gga cac caa atg aaa gat tgt act gag aga cag gct aat     1296
Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
            420                425                  430
ttt tta ggg aag atc tgg cct tcc tac aag gga agg cca ggg aat ttt     1344
Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe
        435                 440                 445
ctt cag agc aga cca gag cca aca gcc cca cca gaa gag agc ttc agg     1392
Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg
    450                 455                 460
tct ggg gta gag aca aca act ccc cct cag aag cag gag ccg ata gac    1440
Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp
465                 470                 475                 480
aag gaa ctg tat cct tta act tcc ctc agg tca ctc ttt ggc aac gac    1488
Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp
                485                 490                 495
ccc tcg tca caa taa                                                1503
Pro Ser Ser Gln
            500
<210>25
<211>500
<212>PRT
<213>人免疫缺陷病毒1型
<400>25
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp
1               5                   10                  15
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
            20                  25                  30
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
        35                  40                  45
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu
    50                  55                  60
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65                  70                  75                  80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp
                85                  90                  95
Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys
            100                 105                 110
Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val
        115                 120                 125
Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His
    130                 135                 140
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145                 150                 155                 160
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
               165                  170                 175
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
            180                 185                 190
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
        195                 200                 205
Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala
    210                 215                 220
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225                 230                 235                 240
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
                245                 250                 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
            260                 265                 270
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly
        275                 280                 285
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
     290                295                 300
Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305                 310                 315                 320
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
                325                 330                 335
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
            340                 345                 350
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser
        355                 360                 365
Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg
    370                 375                 380
Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His
385                 390                 395                 400
Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys
                405                 410                 415
Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
            420                 425                 430
Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe
        435                 440                 445
Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg
    450                 455                 460
Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp
465                 470                 475                  480
Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp
                485                 490                 495
Pro Ser Ser Gln
            500
<210>26
<211>3012
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(3012)
<223>SEQ ID NO:23的位置1631-4642上的CDS。
<400>26
ttt ttt agg gaa gat ctg gcc ttc cta caa ggg aag gcc agg gaa ttt       48
Phe Phe Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe
1               5                   10                  15
tct tca gag cag acc aga gcc aac agc ccc acc aga aga gag ctt cag       96
Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln
            20                  25                  30
gtc tgg ggt aga gac aac aac tcc ccc tca gaa gca gga gcc gat aga      144
Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg
        35                  40                  45
caa gga act gta tcc ttt aac ttc cct cag gtc act ctt tgg caa cga      192
Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg
    50                  55                  60
ccc ctc gtc aca ata aag ata ggg ggg caa cta aag gaa gct cta tta      240
Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu
65                  70                  75                  80
gat aca gga gca gat gat aca gta tta gaa gaa atg agt ttg cca gga      288
Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly
                85                  90                  95
aga tgg aaa cca aaa atg ata ggg gga att gga ggt ttt atc aaa gta      336
Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val
            100                 105                 110
aga cag tat gat cag ata ctc ata gaa atc tgt gga cat aaa gct ata      384
Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile
        115                 120                 125
ggt aca gta tta gta gga cct aca cct gtc aac ata att gga aga aat      432
Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn
    130                 135                 140
ctg ttg act cag att ggt tgc act tta aat ttt ccc att agc cct att      480
Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile
145                 150                 155                 160
gag act gta cca gta aaa tta aag cca gga atg gat ggc cca aaa gtt      528
Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val
                165                 170                 175
aaa caa tgg cca ttg aca gaa gaa aaa ata aaa gca tta gta gaa att      576
Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile
            180                 185                 190
tgt aca gag atg gaa aag gaa ggg aaa att tca aaa att ggg cct gaa      624
Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu
        195                 200                 205
aat cca tac aat act cca gta ttt gcc ata aag aaa aaa gac agt act      672
Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr
    210                 215                 220
aaa tgg aga aaa tta gta gat ttc aga gaa ctt aat aag aga act caa      720
Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln
225                 230                 235                 240
gac ttc tgg gaa gtt caa tta gga ata cca cat ccc gca ggg tta aaa      768
Asp Phc Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys
                245                 250                 255
aag aaa aaa tca gta aca gta ctg gat gtg ggt gat gca tat ttt tca      816
Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser
            260                 265                 270
gtt ccc tta gat gaa gac ttc agg aag tat act gca ttt acc ata cct      864
Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro
        275                 280                 285
agt ata aac aat gag aca cca ggg att aga tat cag tac aat gtg ctt      912
Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu
    290                 295                 300
cca cag gga tgg aaa gga tca cca gca ata ttc caa agt agc atg aca      960
Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr
305                 310                 315                 320
aaa atc tta gag cct ttt aga aaa caa aat cca gac ata gtt atc tat     1008
Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr
                325                 330                 335
caa tac atg gat gat ttg tat gta gga tct gac tta gaa ata ggg cag     1056
Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln
            340                 345                 350
cat aga aca aaa ata gag gag ctg aga caa cat ctg ttg agg tgg gga     1104
His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly
        355                 360                 365
ctt acc aca cca gac aaa aaa cat cag aaa gaa cct cca ttc ctt tgg     1152
Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp
    370                 375                 380
atg ggt tat gaa ctc cat cct gat aaa tgg aca gta cag cct ata gtg     1200
Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val
385                 390                 395                 400
ctg cca gaa aaa gac agc tgg act gtc aat gac ata cag aag tta gtg     1248
Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val
                405                 410                 415
ggg aaa ttg aat tgg gca agt cag att tac cca ggg att aaa gta agg     1296
Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg
            420                 425                 430
caa tta tgt aaa ctc ctt aga gga acc aaa gca cta aca gaa gta ata     1344
Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile
        435                 440                 445
cca cta aca gaa gaa gca gag cta gaa ctg gca gaa aac aga gag att     1392
Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile
    450                 455                 460
cta aaa gaa cca gta cat gga gtg tat tat gac cca tca aaa gac tta     1440
Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu
465                 470                 475                 480
ata gca gaa ata cag aag cag ggg caa ggc caa tgg aca tat caa att     1488
Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile
                485                 490                 495
tat caa gag cca ttt aaa aat ctg aaa aca gga aaa tat gca aga atg     1536
Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met
            500                 505                  510
agg ggt gcc cac act aat gat gta aaa caa tta aca gag gca gtg caa     1584
Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln
        515                 520                 525
aaa ata acc aca gaa agc ata gta ata tgg gga aag act cct aaa ttt     1632
Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe
    530                 535                 540
aaa ctg ccc ata caa aag gaa aca tgg gaa aca tgg tgg aca gag tat     1680
Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr
545                 550                 555                 560
tgg caa gcc acc tgg att cct gag tgg gag ttt gtt aat acc cct ccc     1728
Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro
                565                 570                 575
tta gtg aaa tta tgg tac cag tta gag aaa gaa ccc ata gta gga gca     1776
Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly Ala
            580                 585                 590
gaa acc ttc tat gta gat ggg gca gct aac agg gag act aaa tta gga     1824
Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Leu Gly
        595                 600                 605
aaa gca gga tat gtt act aat aga gga aga caa aaa gtt gtc acc cta     1872
Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val Val Thr Leu
    610                 615                 620
act gac aca aca aat cag aag act gag tta caa gca att tat cta gct     1920
Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Leu Ala
625                 630                 635                 640
ttg cag gat tcg gga tta gaa gta aac ata gta aca gac tca caa tat     1968
Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val Thr Asp Ser Gln Tyr
                645                 650                 655
gca tta gga atc att caa gca caa cca gat caa agt gaa tca gag tta     2016
Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln Ser Glu Ser Glu Leu
            660                 665                 670
gtc aat caa ata ata gag cag tta ata aaa aag gaa aag gtc tat ctg     2064
Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Lys Val Tyr Leu
        675                 680                 685
gca tgg gta cca gca cac aaa gga att gga ggaaat gaa caa gta gat      2112
Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp
    690                 695                 700
aaa tta gtc agt gct gga atc agg aaa gta cta ttt tta gat gga ata     2160
Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile
705                 710                 715                 720
gat aag gcc caa gat gaa cat gag aaa tat cac agt aat tgg aga gca     2208
Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala
                725                 730                 735
atg gct agt gat ttt aac ctg cca cct gta gta gca aaa gaa ata gta     2256
Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val
            740                 745                 750
gcc agc tgt gat aaa tgt cag cta aaa gga gaa gcc atg cat gga caa     2304
Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln
        755                 760                 765
gta gac tgt agt cca gga ata tgg caa cta gat tgt aca cat tta gaa     2352
Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu
    770                 775                 780
gga aaa gtt atc ctg gta gca gtt cat gta gcc agt gga tat ata gaa     2400
Gly Lys Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu
785                 790                 795                 800
gca gaa gtt att cca gca gaa aca ggg cag gaa aca gca tat ttt ctt     2448
Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu
                805                 810                 815
tta aaa tta gca gga aga tgg cca gta aaa aca ata cat act gac aat     2496
Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp Asn
            820                 825                 830
ggc agc aat ttc acc ggt gct acg gtt agg gcc gcc tgt tgg tgg gcg     2544
Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp Trp Ala
        835                 840                 845
gga atc aag cag gaa ttt gga att ccc tac aat ccc caa agt caa gga     2592
Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly
    850                 855                 860
gta gta gaa tct atg aat aaa gaa tta aag aaa att ata gga cag gta     2640
Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val
865                 870                 875                 880
aga gat cag gct gaa cat ctt aag aca gca gta caa atg gca gta ttc     2688
Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe
                885                 890                 895
atc cac aat ttt aaa aga aaa ggg ggg att ggg ggg tac agt gca ggg     2736
Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly
            900                 905                 910
gaa aga ata gta gac ata ata gca aca gac ata caa act aaa gaa tta     2784
Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu
        915                 920                 925
caa aaa caa att aca aaa att caa aat ttt cgg gtt tat tac agg gac     2832
Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp
    930                 935                 940
agc aga aat cca ctt tgg aaa gga cca gca aag ctc ctc tgg aaa ggt     2880
Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly
945                 950                 955                 960
gaa ggg gca gta gta ata caa gat aat agt gac ata aaa gta gtg cca     2928
Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro
                965                 970                     975
aga aga aaa gca aag atc att agg gat tat gga aaa cag atg gca ggt     2976
Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly
                980           985           990
gat gat tgt gtg gca agt aga cag gat gag gat tag                     3012
Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
            995             1000
<210>27
<211>1003
<212>PRT
<213>人免疫缺陷病毒1型
<400>27
Phe Phe Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe
1               5                   10                  15
Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln
            20                  25                  30
Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg
        35                  40                  45
Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg
    50                  55                  60
Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu
65                  70                  75                  80
Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly
                85                  90                  95
Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val
            100                 105                 110
Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile
        115                 120                 125
Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn
    130                 135                 140
Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile
145                 150                 155                 160
Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val
                165                 170                 175
Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile
            180                 185                 190
Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu
        195                 200                 205
Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr
    210                 215                 220
Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln
225                 230                 235                 240
Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys
                245                 250                 255
Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser
            260                 265                 270
Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro
        275                 280                 285
Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu
    290                 295                 300
Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr
305                 310                 315                 320
Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr
                325                 330                 335
Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln
            340                 345                 350
His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly
        355                 360                 365
Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp
     370                375                 380
Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val
385                 390                 395                 400
Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val
                405                 410                 415
Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg
            420                 425                 430
Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile
        435                 440                 445
Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile
    450                 455                 460
Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu
465                 470                 475                 480
Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile
                485                 490                 495
Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met
            500                 505                 510
Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln
        515                 520                 525
Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe
    530                 535                 540
Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr
545                 550                 555                 560
Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro
                565                 570                 575
Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly Ala
            580                 585                 590
Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Leu Gly
        595                 600                 605
Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val Val Thr Leu
    610                 615                 620
Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Leu Ala
625                 630                 635                 640
Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val Thr Asp Ser Gln Tyr
                645                 650                 655
Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln Ser Glu Ser Glu Leu
            660                 665                 670
Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Lys Val Tyr Leu
        675                 680                 685
Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp
    690                 695                 700
Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile
705                 710                 715                 720
Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala
                725                 730                 735
Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val
           740                  745                 750
Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln
        755                 760                 765
Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu
    770                 775                 780
Gly Lys Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu
785                 790                 795                 800
Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu
                805                 810                 815
Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp Asn
            820                 825                 830
Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp Trp Ala
        835                 840                 845
Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly
    850                 855                 860
Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val
865                 870                 875                 880
Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe
                885                 890                 895
Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly
            900                 905                 910
Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu
        915                 920                 925
Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp
    930                 935                 940
Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly
945                 950                 955                 960
Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro
                965                 970                 975
Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly
            980                 985                 990
Asp Asp Cys Val Ala Ser Arg Gln  Asp Glu Asp
        995                 1000
<210>28
<211>579
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(579)
<223>SEQ ID NO:23的位置4587-5165上的CDS。
<400>28
atg gaa aac aga tgg cag gtg atg att gtg tgg caa gta gac agg atg       48
Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met
1               5                   10                  15
agg att aga aca tgg aaa agt tta gta aaa cac cat atg tat gtt tca       96
Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser
            20                  25                  30
ggg aaa gct agg gga tgg ttt tat aga cat cac tat gaa agc cct cat      144
Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His
        35                  40                  45
cca aga ata agt tca gaa gta cac atc cca cta ggg gat gct aga ttg      192
Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu
    50                  55                  60
gta ata aca aca tat tgg ggt ctg cat aca gga gaa aga gac tgg cat      240
Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His
65                  70                  75                  80
ttg ggt cag gga gtc tcc ata gaa tgg agg aaa aag aga tat agc aca      288
Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr
                85                  90                  95
caa gta gac cct gaa cta gca gac caa cta att cat ctg tat tac ttt      336
Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe
            100                 105                 110
gac tgt ttt tca gac tct gct ata aga aag gcc tta tta gga cac ata      384
Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile
        115                 120                 125
gtt agc cct agg tgt gaa tat caa gca gga cat aac aag gta gga tct      432
Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser
    130                 135                 140
cta caa tac ttg gca cta gca gca tta ata aca cca aaa aag ata aag      480
Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys
145                 150                 155                 160
cca cct ttg cct agt gtt acg aaa ctg aca gag gat aga tgg aac aag       528
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys
                165                 170                 175
ccc cag aag acc aag ggc cac aga ggg agc cac aca atg aat gga cac      576
Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His
            180                 185                 190
tag                                                                  579
<210>29
<211>192
<212>PRT
<213>人免疫缺陷病毒1型
<400> 29
Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met
1               5                   10                  15
Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser
            20                  25                  30
Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His
        35                  40                  45
Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu
    50                  55                  60
Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His
65                  70                  75                  80
Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr
                85                  90                  95
Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe
            100                 105                 110
Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile
        115                 120                 125
Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser
    130                 135                 140
Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys
145                 150                 155                 160
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys
                165                 170                 175
Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His
            180                 185                 190
<210>30
<211>237
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(237)
<223>SEQ ID NO:23的位置5105-5341上的CDS。
<400>30
atg gaa caa gcc cca gaa gac caa ggg cca cag agg gag cca cac aat       48
Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn
1               5                   10                  15
gaa tgg aca cta gag ctt tta gag gag ctt aag aat gaa gct gtt aga       96
Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg
            20                  25                  30
cat ttt cct agg att tgg ctc cat ggc tta ggg caa cat atc tat gaa      144
His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu
        35                  40                  45
act tat ggg gat act tgg gca gga gtg gaa gcc ata ata aga att ctg      192
Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu
     50                 55                  60
caa caa ctg ctg ttt atc cat ttt cag aat tgg gtg tcg aca tag          237
Gln Gln Leu Leu Phe Ile His Phe Gln Asn Trp Val Ser Thr
65                  70                  75
<210>31
<211>78
<212>PRT
<213>人免疫缺陷病毒1型
<400> 31
Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn
1               5                   10                  15
Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg
            20                   25                   30
His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu
        35                  40                  45
Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu
    50                  55                  60
Gln Gln Leu Leu Phe Ile His Phe Gln Asn Trp Val Ser Thr
65                  70                  75
<210>32
<211>261
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<22l>CDS
<222>(1)..(261)
<223>SEQ ID NO:23的位置5377-5591和7925-7970上连接的CDS。
<400>32
atg gag cca gta gat cct aga cta gag ccc tgg aag cat cca gga agt    48
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
l               5                   l0                  15
cag cct aaa act gct tgt acc aat tgc tat tgt aaa aag tgt tgc ttt    96
Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe
            20                  25                  30
cat tgc caa gtt tgt ttc ata aca aaa gcc tta ggc atc tcc tat ggc    144
His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly
        35                  40                  45
agg aag aag cgg aga cag cga cga aga gct cat cag aac agt cag act    192
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr
    50                  55                  60
cat caa gct tct cta tca aag caa ccc acc tcc caa ccc cga ggg gac    240
His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp
65                  70                  75              80
ccg aca ggc ccg aag gaa tag                                        261
Pro Thr Gly Pro Lys Glu
                85
<210>33
<211>86
<212>PRT
<213>人免疫缺陷病毒1型
<400>33
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1               5                   10                  15
Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe
            20                  25                  30
His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly
        35                  40                  45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr
    50                  55                  60
His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp
65                  70                  75                   80
Pro Thr Gly Pro Lys Glu
                85
<210>34
<211>351
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(351)
<223>SEQ ID NO:23的位置5516-5591和7925-8199上连接的CDS。
<400>34
atg gca gga aga agc gga gac agc gac gaa gag ctc atc aga aca gtc       48
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val
1               5                   10                  15
aga ctc atc aag ctt ctc tat caa agc aac cca cct ccc aac ccc gag       96
Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu
            20                  25                  30
ggg acc cga cag gcc cga agg aat aga aga aga agg tgg aga gag aga       144
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
        35                  40                  45
cag aga cag atc cat tcg att agt gaa cgg atc ctt ggc act tat ctg      192
Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu
    50                  55                 60
gga cga tct gcg gag cct gtg cct ctt cag cta cca ccg ctt gag aga      240
Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65                  70                  75                  80
ctt act ctt gat tgt aac gag gat tgt gga act tct ggg acg cag ggg      288
Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly
                85                  90                  95
gtg gga agc cct caa ata ttg gtg gaa tct cct aca gta ttg gag tca      336
Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser
            100                 105                 110
gga act aaa gaa tag                                                  351
Gly Thr Lys Glu
        115
<210>35
<211>116
<212>PRT
<213>人免疫缺陷病毒1型
<400>35
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val
1               5                   10                  15
Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu
            20                  25                  30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Ark
        35                  40                  45
Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu
    50                  55                  60
Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65                  70                  75                   80
Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly
                85                  90                  95
Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser
            100                 105                 110
Gly Thr Lys Glu
        115
<210>36
<211>249
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(249)
<223>SEQ ID NO:23的位置5608-5856上的CDS。
<400>36
atg caa cct ata cca atagta gca ata gta gca tta gta gta gca ata        48
Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile
1               5                   10                  15
ata ata gca ata gtt gtg tgg tcc ata gta atc ata gaa tat agg aaa       96
Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys
            20                  25                  30
ata tta aga caa aga aaa ata gac agg tta att gat aga cta ata gaa      144
Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu
        35                  40                  45
aga gca gaa gac agt ggc aat gag agt gaa gga gaa ata tca gca ctt      192
Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu
    50                  55                  60
gtg gag atg ggg gtg gag atg ggg cac cat gct cct tgg gat gtt gat      240
Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp
65                  70                  75                  80
gat ctg tag                                                          249
Asp Leu
<210>37
<211>82
<212>PRT
<213>人免疫缺陷病毒1型
<400>37
Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile
1               5                   10                  15
Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys
            20                  25                  30
Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu
        35                  40                  45
Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu
    50                  55                  60
Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp
65                  70                  75                  80
Asp Leu
<210>38
<211>2571
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(2571)
<223>SEQ ID NO:23的位置5771-8341上的CDS。
<400>38
atg aga gtg aag gag aaa tat cag cac ttg tgg aga tgg ggg tgg aga       48
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
l               5                   10                  15
tgg ggc acc atg ctc ctt ggg atg ttg atg atc tgt agt gct aca gaa       96
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
            20                  25                  30
aaa ttg tgg gtc aca gtc tat tat ggg gta cct gtg tgg aag gaa gca      144
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
        35                  40                  45
acc acc act cta ttt tgt gca tca gat gct aaa gca tat gat aca gag      192
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
    50                  55                  60
gta cat aat gtt tgg gcc aca cat gcc tgt gta ccc aca gac ccc aac      240
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65                  70                  75                  80
cca caa gaa gta gta ttg gta aat gtg aca gaa aat ttt aac atg tgg      288
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
                85                  90                  95
aaa aat gac atg gta gaa cag atg cat gag gat ata atc agt tta tgg      336
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
            100                 105                 110
gat caa agc cta aag cca tgt gta aaa tta acc cca ctc tgt gtt agt      384
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
        115                 120                 125
tta aag tgc act gat ttg aag aat gat act aat acc aat agt agt agc      432
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
    130                 135                 140
ggg aga atg ata atg gag aaa gga gag ata aaa aac tgc tct ttc aat      480
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145                 150                 155                 160
atc agc aca agc ata aga ggt aag gtg cag aaa gaa tat gca ttt ttt      528
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
                165                 170                 175
tat aaa ctt gat ata ata cca ata gat aat gat act acc agc tat aag      576
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
            180                 185                 190
ttg aca agt tgt aac acc tca gtc att aca cag gcc tgt cca aag gta      624
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
        195                 200                 205
tcc ttt gag cca att ccc ata cat tat tgt gcc ccg gct ggt ttt gcg      672
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
    210                 215                 220
att cta aaa tgt aat aat aag acg ttc aat gga aca gga cca tgt aca      720
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225                 230                 235                 240
aat gtc agc aca gta caa tgt aca cat gga att agg cca gta gta tca      768
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
                245                 250                 255
act caa ctg ctg tta aat ggc agt cta gca gaa gaa gag gta gta att      816
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
            260                 265                 270
aga tct gtc aat ttc acg gac aat gct aaa acc ata ata gta cag ctg      864
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
        275                 280                 285
aac aca tct gta gaa att aat tgt aca aga ccc aac aac aat aca aga      912
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
    290                 295                 300
aaa aga atc cgt atc cag aga gga cca ggg aga gca ttt gtt aca ata      960
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305                 310                 315                 320
gga aaa ata gga aat atg aga caa gca cat tgt aac att agt aga gca     1008
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
                325                 330                 335
aaa tgg aat aac act tta aaa cag ata gct agc aaa tta aga gaa caa     1056
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
             340                345                 350
ttt gga aat aat aaa aca ata atc ttt aag caa tcc tca gga ggg gac     1104
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
        355                 360                 365
cca gaa att gta acg cac agt ttt aat tgt gga ggg gaa ttt ttc tac     1152
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
    370                 375                 380
tgt aat tca aca caa ctg ttt aat agt act tgg ttt aat agt act tgg     1200
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385                 390                 395                 400
agt act gaa ggg tca aat aac act gaa gga agt gac aca atc acc ctc     1248
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
                405                 410                 415
cca tgc aga ata aaa caa att ata aac atg tgg cag aaa gta gga aaa     1296
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
            420                 425                 430
gca atg tat gcc cct ccc atc agt gga caa att aga tgt tca tca aat     1344
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
        435                 440                 445
att aca ggg ctg cta tta aca aga gat ggt ggt aat agc aac aat gag     1392
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
    450                 455                 460
tcc gag atc ttc aga cct gga gga gga gat atg agg gac aat tgg aga     1440
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465                 470                 475                 480
agt gaa tta tat aaa tat aaa gta gta aaa att gaa cca tta gga gta     1488
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
                485                 490                 495
gca ccc acc aag gca aag aga aga gtg gtg cag aga gaa aaa aga gca     1536
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
            500                 505                 510
gtg gga ata gga gct ttg ttc ctt ggg ttc ttg gga gca gca gga agc     1584
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
        515                 520                 525
act atg ggc gca gcc tca atg acg ctg acg gta cag gcc aga caa tta     1632
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
    530                 535                 540
ttg tct ggt ata gtg cag cag cag aac aat ttg ctg agg gct att gag     1680
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545                 550                 555                 560
gcg caa cag cat ctg ttg caa ctc aca gtc tgg ggc atc aag cag ctc     1728
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
                565                 570                 575
cag gca aga atc ctg gct gtg gaa aga tac cta aag gat caa cag ctc     1776
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
            580                 585                 590
ctg ggg att tgg ggt tgc tct gga aaa ctc att tgc acc act gct gtg     1824
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
        595                 600                 605
cct tgg aat gct agt tgg agt aat aaa tct ctg gaa cag att tgg aat     1872
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
    610                 615                 620
cac acg acc tgg atg gag tgg gac aga gaa att aac aat tac aca agc     1920
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625                 630                 635                 640
tta ata cac tcc tta att gaa gaa tcg caa aac cag caa gaa aag aat     1968
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
                645                 650                 655
gaa caa gaa tta ttg gaa tta gat aaa tgg gca agt ttg tgg aat tgg     2016
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
            660                 665                 670
ttt aac ata aca aat tgg ctg tgg tat ata aaa tta ttc ata atg ata     2064
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
        675                 680                 685
gta gga ggc ttg gta ggt tta aga ata gtt ttt gct gta ctt tct ata     2112
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
    690                 695                 700
gtg aat aga gtt agg cag gga tat tca cca tta tcg ttt cag acc cac     2160
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705                 710                 715                 720
ctc cca acc ccg agg gga ccc gac agg ccc gaa gga ata gaa gaa gaa     2208
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
                725                 730                 735
ggt gga gag aga gac aga gac aga tcc att cga tta gtg aac gga tcc     2256
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
            740                 745                 750
ttg gca ctt atc tgg gac gat ctg cgg agc ctg tgc ctc ttc agc tac     2304
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
        755                 760                 765
cac cgc ttg aga gac tta ctc ttg att gta acg agg att gtg gaa ctt     2352
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
    770                 775                 780
ctg gga cgc agg ggg tgg gaa gcc ctc aaa tat tgg tgg aat ctc cta     2400
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785                 790                 795                 800
cag tat tgg agt cag gaa cta aag aat agt gct gtt agc ttg ctc aat     2448
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
                805                810                  815
gcc aca gcc ata gca gta gct gag ggg aca gat agg gtt ata gaa gta     2496
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
            820                 825                 830
gta caa gga gct tgt aga gct att cgc cac ata cct aga aga ata aga       2544
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
        835                 840                 845
cag ggc ttg gaa agg att ttg cta taa                                   2571
Gln Gly Leu Glu Arg Ile Leu Leu
    850                 855
<210>39
<211>856
<212>PRT
<213>人免疫缺陷病毒1型
<400>39
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
1               5                   10                  15
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
            20                  25                  30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
        35                  40                  45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
    50                  55                  60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65                  70                  75                  80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
                85                  90                  95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
            100                 105                 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
        115                 120                 125
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
    130                 135                 140
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145                 150                 155                 160
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
                165                 170                 175
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
           180                  185                 190
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
        195                 200                 205
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
    210                 215                 220
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225                 230                 235                 240
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
                245                 250                 255
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
            260                 265                 270
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
        275                 280                 285
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
    290                 295                 300
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305                 310                 315                 320
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
                325                 330                 335
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
            340                 345                 350
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
        355                 360                 365
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
    370                 375                 380
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385                 390                 395                 400
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
                405                 410                 415
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
            420                 425                 430
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
        435                 440                 445
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
    450                 455                 460
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465                 470                 475                 480
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
                485                 490                 495
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
            500                 505                 510
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
        515                 520                 525
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
    530                 535                 540
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545                 550                 555                 560
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
                565                 570                 575
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
            580                 585                 590
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
        595                 600                 605
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
    610                 615                 620
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625                 630                 635                 640
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
                645                 650                 655
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
            660                 665                 670
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
        675                 680                 685
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
    690                 695                 700
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705                 710                 715                 720
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
                725                 730                 735
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
            740                 745                 750
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
        755                 760                 765
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
    770                 775                 780
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785                 790                 795                 800
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
                805                 810                 815
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
            820                 825                 830
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
        835                 840                 845
Gln Gly Leu Glu Arg Ile Leu Leu
    850                 855
<210>40
<211>372
<212>DNA
<213>人免疫缺陷病毒1型
<220>
<221>CDS
<222>(1)..(372)
<223>SEQ ID NO:23的位置8343-8714上的CDS。
<400>40
atg ggt ggc aag tgg tca aaa agt agt gtg att gga tgg cct act gta    48
Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val
1               5                   10                  15
agg gaa aga atg aga cga gct gag cca gca gca gat agg gtg gga gca    96
Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala
            20                  25                   30
gca tct cga gac ctg gaa aaa cat gga gca atc aca agt agc aat aca    144
Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr
        35                  40                  45
gca gct acc aat gct gct tgt gcc tgg cta gaa gca caa gag gag gag    192
Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu
    50                  55                  60
gag gtg ggt ttt cca gtc aca cct cag gta cct tta aga cca atg act    240
Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr
65                  70                  75                  80
tac aag gca gct gta gat ctt agc cac ttt tta aaa gaa aag ggg gga    288
Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly
                85                  90                  95
ctg gaa ggg cta att cac tcc caa aga aga caa gat atc ctt gat ctg    336
Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu
            100                 105                 110
tgg atc tac cac aca caa ggc tac ttc cct gat tag                    372
Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp
        115                 120
<210>41
<211>123
<212>PRT
<213>人免疫缺陷病毒1型
<400>41
Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val
1               5                   10                  15
Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala
            20                  25                  30
Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr
        35                  40                  45
Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu
    50                  55                  60
Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr
65                  70                  75                  80
Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly
                85                  90                  95
Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu
            100                 105                 110
Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp
        115                 120

Claims (52)

1.一种核酸载体,所述载体包含至少一个与启动子有效连接的HIV序列,其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
2.一种包含至少两个HIV序列的核酸载体,其中所述HIV序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
3.权利要求1或2的核酸载体,其中所述HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
4.权利要求1或2的核酸载体,其中所述启动子是异源启动子。
5.权利要求4的核酸载体,其中所述异源启动子选自原核启动子、真核启动子和病毒启动子。
6.权利要求2的核酸载体,其中所述启动子是不同的启动子。
7.权利要求1或2的核酸载体,所述载体还包含所述HIV序列的下游转录终止子。
8.权利要求7的核酸载体,其中所述转录终止子是聚腺苷酸化信号。
9.权利要求8的核酸载体,其中所述转录终止子是选自以下的聚腺苷酸化信号:牛生长激素(bGH)聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。
10.权利要求1或2的核酸载体,其中至少一个HIV序列与异源前导序列有效连接。
11.权利要求10的核酸载体,其中所述前导序列选自组织纤溶酶原激活物(tPA)前导序列、α-因子前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、卵白蛋白前导序列和β-珠蛋白前导序列。
12.权利要求10的核酸载体,其中病毒颗粒因tPA-gag导致不能装配。
13.权利要求1或2的核酸载体,其中所述HIV序列选自SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:17和SEQ ID NO:19。
14.权利要求1或2的核酸载体,所述载体还包括复制起点。
15.权利要求1或2的核酸载体,所述载体还包括选择性标记基因。
16.一种包含至少两个HIV序列的核酸载体,其中所述HIV序列:
a)分别与各自的启动子有效连接,
b)编码不能装配成病毒颗粒的蛋白,
c)至少一个HIV序列与异源前导序列有效连接,所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。
17.权利要求16的核酸载体,其中所述HIV序列编码tPA-env和tPA-gag。
18.权利要求16的核酸载体,其中所述HIV序列是SEQ ID NO:7和SEQ ID NO:9。
19.权利要求16的核酸载体,其中所述HIV序列编码tPA-pol和tPA-nef-tat。
20.权利要求16的核酸载体,其中所述HIV序列是SEQ ID NO:11和SEQ ID NO:13。
21.前述权利要求中任一项的核酸载体,其中所述载体是病毒载体。
22.权利要求21的核酸载体,其中所述病毒载体选自修饰疫苗病毒Ankara(MVA)、ALVAC、NYVAC.1和NYVAC.2。
23.权利要求22的核酸载体,其中所述载体是修饰痘苗病毒Ankara(MVA)载体。
24.权利要求22的核酸载体,其中所述启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。
25.一种核酸载体,其中所述载体是修饰痘苗病毒Ankara(MVA)载体,所述载体包含:
a)至少两个插入到MVA基因组缺失位点III的HIV序列;和
b)至少一个插入到MVA基因组缺失位点II的HIV序列;其中所述HIV序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
26.权利要求25的核酸载体,其中所述HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。
27.权利要求25的核酸载体,其中所述启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。
28.权利要求25的核酸载体,其中所述HIV序列还包含异源前导序列。
29.权利要求25的核酸载体,其中所述异源前导序列选自组织纤溶酶原激活物(tPA)前导序列、α-因子前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、卵白蛋白前导序列和β-珠蛋白前导序列。
30.权利要求25的核酸载体,其中tPA-δV2 env和tPA-gag-pol插入到MVA的缺失位点III,而tPA-nef-tat插入到MVA的缺失位点II。
31.权利要求25的核酸载体,其中SEQ ID NO:17和SEQ IDNO:19插入到MVA的缺失位点III,而SEQ ID NO:21插入到MVA的缺失位点II。
32.一种组合物,所述组合物包含至少一种前述权利要求中任一项的核酸载体。
33.权利要求32的组合物,其中tPA-env和tPA-gag是在第一核酸载体上,而tPA-pol和tPA-nef-tat是在第二核酸载体上。
34.权利要求32的组合物,其中SEQ ID NO:7和SEQ ID NO:9是在第一核酸载体上,而SEQ ID NO:11和SEQ ID NO:13是在第二核酸载体上。
35.权利要求32的组合物,其中至少一种载体是病毒载体。
36.权利要求35的组合物,其中所述病毒载体选自修饰疫苗病毒Ankara(MVA)、ALVAC、NYVAC.1和NYVAC.2。
37.权利要求36的组合物,其中所述病毒载体是MVA载体。
38.权利要求37的组合物,其中:
a)tPA-env和tPA-gag是在第一核酸载体上,而tPA-pol和tPA-nef-tat是在第二核酸载体上;
b)tPA-δ V2 env和tPA-gag-pol插入到MVA的缺失位点III,而tPA-nef-tat插入到MVA的缺失位点II。
39.权利要求37的组合物,其中:
a)SEQ ID NO:7和SEQ ID NO:9是在第一核酸载体上,而SEQ IDNO:11和SEQ ID NO:13是在第二核酸载体上;
b)SEQ ID NO:17和SEQ ID NO:19插入到MVA的缺失位点III,而SEQ ID NO:21插入到MVA的缺失位点II。
40.一种药用组合物,所述组合物包含权利要求1-31中任一项的核酸载体,以及药学上可接受的载体、辅料或赋形剂。
41.一种药用组合物,所述组合物包含权利要求32-39中任一项的组合物,以及药学上可接受的载体、辅料或赋形剂。
42.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法,所述方法包括将权利要求1-31中任一项的核酸载体给予所述受试者,从而引发抗HIV的免疫应答。
43.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法,所述方法包括将权利要求32-39中任一项的组合物给予所述受试者,从而引发抗HIV的免疫应答。
44.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法,所述方法包括将权利要求40或41的组合物给予所述受试者,从而引发抗HIV的免疫应答。
45.一种核酸载体,所述载体包含至少一个有效连接启动子的慢病毒序列,其中所述慢病毒序列编码不能装配成病毒颗粒的蛋白。
46.权利要求45的核酸载体,其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。
47.一种包含至少两个慢病毒序列的核酸载体,其中所述慢病毒序列分别与各自的启动子有效连接,并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。
48.权利要求47的核酸载体,其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。
49.一种包含至少两个慢病毒序列的核酸载体,其中所述慢病毒序列:
a)分别与各自的启动子有效连接,
b)编码不能装配成病毒颗粒的蛋白,
c)至少一个慢病毒序列与异源前导序列有效连接,所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。
50.权利要求49的核酸载体,其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。
51.一种核酸载体,其中所述载体是修饰痘苗病毒Ankara(MVA)载体,所述载体包含:
a)至少两个插入到MVA基因组缺失位点III的慢病毒序列;和
b)至少一个插入到MVA基因组缺失位点II的慢病毒序列;其中所述慢病毒序列分别与各自的启动子有效连接,并且其中所述慢病毒序列编码不能装配成病毒颗粒的蛋白。
52.权利要求51的核酸载体,其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。
CNA2003801060851A 2002-10-18 2003-10-17 用于抗hiv免疫的方法和组合物 Pending CN1726285A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US41946502P 2002-10-18 2002-10-18
US60/419,465 2002-10-18

Publications (1)

Publication Number Publication Date
CN1726285A true CN1726285A (zh) 2006-01-25

Family

ID=32108091

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA021548919A Pending CN1490056A (zh) 2002-10-18 2002-12-03 针对hiv-1的免疫方法和组合物
CNA2003801060851A Pending CN1726285A (zh) 2002-10-18 2003-10-17 用于抗hiv免疫的方法和组合物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA021548919A Pending CN1490056A (zh) 2002-10-18 2002-12-03 针对hiv-1的免疫方法和组合物

Country Status (7)

Country Link
US (1) US20090227658A1 (zh)
EP (1) EP1570067A4 (zh)
CN (2) CN1490056A (zh)
AP (1) AP2005003316A0 (zh)
AU (1) AU2003286486A1 (zh)
WO (1) WO2004035006A2 (zh)
ZA (1) ZA200504021B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102961743A (zh) * 2012-12-20 2013-03-13 中国农业科学院哈尔滨兽医研究所 表达鸡毒支原体TM1蛋白的重组新城疫LaSota弱毒疫苗株

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200613554A (en) 2004-06-17 2006-05-01 Wyeth Corp Plasmid having three complete transcriptional units and immunogenic compositions for inducing an immune response to HIV
ES2539010T3 (es) 2004-08-27 2015-06-25 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Virus MVA recombinantes que expresan genes env, gag y pol modificados de VIH clado A/G, clado B, y clado C
TWI311152B (en) * 2004-09-17 2009-06-21 Boehringer Ingelheim Rcv Gmbh & Co K Host-vector system for antibiotic-free cole1 plasmid propagation
ES2281252B1 (es) 2005-07-27 2009-02-16 Consejo Superior De Investigaciones Cientificas Vectores recombinantes basados en el virus modificado de ankara (mva) como vacunas preventivas y terapeuticas contra el sida.
WO2007102326A1 (ja) * 2006-03-07 2007-09-13 Yokohama City University アデノウイルス5型/35型ベクターとワクシニアウイルスmvaベクターとの併用による強力な免疫誘導
WO2011156594A2 (en) 2010-06-09 2011-12-15 Vaccine Technologies, Incorporated Therapeutic immunization in hiv infected subjects receiving stable antiretroviral treatment
PT2694101T (pt) 2011-04-06 2016-12-19 Université Paris Descartes Composições farmacêutivas para prevenção e/ou tratamento de doença por vih em seres humanos
KR20220061285A (ko) * 2013-11-14 2022-05-12 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 HIV-1 EnV DNA 백신과 단백질 부스터
WO2016065252A2 (en) * 2014-10-24 2016-04-28 International Aids Vaccine Initiative Native trimeric env immunogen design
WO2016204983A1 (en) * 2015-06-19 2016-12-22 Seracare Life Sciences, Inc. Sindbis control virus
JP2019501961A (ja) * 2015-12-03 2019-01-24 ディーエヌエー エッセンス ゲーエムベーハーDna Essence Gmbh 食品、飲料、化粧料、及び医薬の組成物中のオリゴヌクレオチド
IL280989B1 (en) * 2018-08-23 2024-04-01 Code Pharma B V Pharmaceutical preparations that include integration-promoting peptides
JP2023527146A (ja) * 2020-05-19 2023-06-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 免疫応答を誘導するためのコンジュゲートポリペプチドおよびワクチン
CN113913393B (zh) * 2021-06-07 2023-05-09 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 新型冠状病毒肺炎的重组新城疫病毒疫苗

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5747324A (en) * 1988-06-10 1998-05-05 Therion Biologics Corporation Self-assembled, defective, non-self-propagating lentivirus particles
WO2002022080A2 (en) * 2000-09-15 2002-03-21 Merck & Co., Inc. Enhanced first generation adenovirus vaccines expressing codon optimized hiv1-gag, pol, nef and modifications
AU2002252199B2 (en) * 2001-03-08 2008-01-03 Emory University MVA expressing modified HIV envelope, GAG, and POL genes

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102961743A (zh) * 2012-12-20 2013-03-13 中国农业科学院哈尔滨兽医研究所 表达鸡毒支原体TM1蛋白的重组新城疫LaSota弱毒疫苗株

Also Published As

Publication number Publication date
WO2004035006A3 (en) 2005-06-16
ZA200504021B (en) 2006-09-27
AP2005003316A0 (en) 2005-06-30
CN1490056A (zh) 2004-04-21
WO2004035006A2 (en) 2004-04-29
US20090227658A1 (en) 2009-09-10
AU2003286486A1 (en) 2004-05-04
EP1570067A2 (en) 2005-09-07
AU2003286486A8 (en) 2004-05-04
EP1570067A4 (en) 2007-10-03

Similar Documents

Publication Publication Date Title
US20200071724A1 (en) Intergenic Sites Between Conserved Genes in the Genome of Modified Vaccinia Ankara (MVA) Vaccinia Virus
AU709174B2 (en) Mixture of recombinant vaccinia vectors as polyenv vaccines for HIV
AU784679B2 (en) Improvements in or relating to immune responses to HIV
CA2777744C (en) Recombinant modified vaccinia ankara (mva) vaccinia virus containing restructured insertion sites
WO1997027311A9 (en) Mixture of recombinant vaccinia vectors as polyenv vaccines for hiv
CN1726285A (zh) 用于抗hiv免疫的方法和组合物
JP2003530307A (ja) gag遺伝子保有アデノウイルスHIVワクチン
KR19990087126A (ko) 합성 사람 면역결핍 바이러스 유전자
US7122180B2 (en) DNA vectors containing mutated HIV proviruses
PT1921146E (pt) Vectores recombinantes baseados no vírus modificado de ankara (mva) como vacinas preventivas e terapêuticas contra a sida
Coupar et al. Fowlpox virus vaccines for HIV and SHIV clinical and pre-clinical trials
Young et al. Characterization of a DNA vaccine expressing a human immunodeficiency virus-like particle
CN116782928A (zh) 能够将抗原递送至mhc-ii途径并在宿主中诱导cd4+和cd8+t细胞应答的慢病毒载体
Ellenberger et al. Optimization of a multi-gene HIV-1 recombinant subtype CRF02_AG DNA vaccine for expression of multiple immunogenic forms
KR100542542B1 (ko) 한국인에서 분리된 hiv-1 아형 b의 게놈 dna의염기서열, 이를 포함하는 분자클론 및 그 제조방법
JP2007515386A (ja) Hiv感染個体の治療用免疫化
Edmonson Development of a simian immunodeficiency virus (SIV) pathogen
US20050220816A1 (en) Mutant viral nucleic acids and vaccine containing same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1085769

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20060125

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1085769

Country of ref document: HK